JP2019106170A - 3次元モデルの生成装置、生成方法及びプログラム - Google Patents

3次元モデルの生成装置、生成方法及びプログラム Download PDF

Info

Publication number
JP2019106170A
JP2019106170A JP2018170606A JP2018170606A JP2019106170A JP 2019106170 A JP2019106170 A JP 2019106170A JP 2018170606 A JP2018170606 A JP 2018170606A JP 2018170606 A JP2018170606 A JP 2018170606A JP 2019106170 A JP2019106170 A JP 2019106170A
Authority
JP
Japan
Prior art keywords
dimensional shape
data corresponding
shape data
area
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018170606A
Other languages
English (en)
Inventor
圭輔 森澤
Keisuke Morisawa
圭輔 森澤
究 小林
Kiwamu Kobayashi
究 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018170606A priority Critical patent/JP2019106170A/ja
Publication of JP2019106170A publication Critical patent/JP2019106170A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Generation (AREA)
  • Image Analysis (AREA)

Abstract

【課題】対象オブジェクトの一部を遮ってしまうような構造物等が撮影シーン内に存在していても、生成される3次元モデルにおいて欠損が生じないようにする。【解決手段】オブジェクトに対応する3次元形状データを生成する生成装置であって、複数の撮影方向からの撮影により得られた複数の撮影画像内の前記オブジェクトの領域、及び、前記複数の撮影方向の少なくとも一つの撮影方向からの撮影時に前記オブジェクトを遮る可能性のある構造物の領域を表す画像データを取得する第1取得手段と、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む画像の数を取得する第2取得手段と、前記第1取得手段により取得された画像データと、前記第2取得手段により取得された画像の数とに基づき、前記オブジェクトに対応する3次元形状データを生成する生成手段と、を有することを特徴とする。【選択図】図4

Description

本発明は、画像内オブジェクトの3次元モデルの生成に関する。
従来、複数台のカメラによって異なる視点から同期撮影された複数視点画像を用いて、オブジェクトの3次元形状を推定する手法として、「視体積交差法(Visual Hull)」と呼ばれる手法が知られている(特許文献1)。図1の(a)〜(c)は、視体積交差法の基本原理を示す図である。あるオブジェクトを撮影した画像からは、撮像面に当該オブジェクトの2次元シルエットを表すマスク画像が得られる(図1(a))。そして、カメラの投影中心からマスク画像の輪郭上の各点を通すように、3次元空間中に広がる錐体を考える(図1(b))。この錐体のことを該当するカメラによる対象の「視体積」と呼ぶ。さらに、複数の視体積の共通領域、すなわち視体積の交差を求めることによって、オブジェクトの3次元形状(3次元モデル)が求まる(図1(c))。このように視体積交差法による形状推定では、オブジェクトが存在する可能性のある空間中のサンプリング点をマスク画像に射影し、複数の視点で共通して射影した点がマスク画像に含まれるかを検証することにより、オブジェクトの3次元形状を推定する。
特開2014−10805号公報
上述の視体積交差法では、マスク画像が対象オブジェクトのシルエットを正しく表現できている必要があり、マスク画像上のシルエットが不正確な場合は生成される3次元形状も不正確なものになってしまう。例えば、対象オブジェクトである人物の一部が、当該人物の手前に存在する構造物等の静止物体によって遮られ、マスク画像が示す人物のシルエットの一部が欠けてしまうと、生成される3次元モデルに欠損が生じてしまう。また、シルエットの一部が欠けたマスク画像については使用しないこととすると、得られる3次元モデルの形状精度が落ちてしまう。特に、構造物によって遮られている部分が相対的に小さい場合は、たとえシルエットの一部が掛けたマスク画像であっても、使用することで高い形状精度の3次元モデルが得られるので極力利用することが望ましい。
本発明は、上記の課題に鑑みてなされたものであり、その目的は、対象オブジェクトの一部を遮ってしまうような構造物等が撮影シーン内に存在していても、生成される3次元モデルにおいて欠損が生じないようにすることである。
本発明に係る、オブジェクトに対応する3次元形状データを生成する生成装置は、複数の撮影方向からの撮影により得られた複数の撮影画像内の前記オブジェクトの領域、及び、前記複数の撮影方向の少なくとも一つの撮影方向からの撮影時に前記オブジェクトを遮る可能性のある構造物の領域を表す画像データを取得する第1取得手段と、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む画像の数を取得する第2取得手段と、前記第1取得手段により取得された画像データと、前記第2取得手段により取得された画像の数とに基づき、前記オブジェクトに対応する3次元形状データを生成する生成手段と、を有することを特徴とする。
本発明によれば、対象オブジェクトの一部を遮ってしまうような構造物等が撮影シーン内に存在していても、欠損のない、もしくは低減させた高品質な3次元モデルの生成が可能となる。
(a)〜(c)は、視体積交差法の基本原理を示す図 (a)は仮想視点画像生成システムの構成を示すブロック図、(b)はカメラアレイを構成する各カメラの配置例を示す図 3次元モデル生成装置の内部構成を示す機能ブロック図 実施形態1に係る、3次元モデル形成処理の流れを示すフローチャート (a)〜(h)は、各カメラで撮影された画像の一例を示す図 (a)〜(h)は、構造物マスクの一例を示す図 (a)〜(h)は、前景マスクの一例を示す図 (a)〜(h)は、統合マスクの一例を示す図 統合マスクを元に生成される統合3次元モデルの一例を示す図 従来手法による、前景マスクのみを用いて生成した3次元モデルの一例を示す図 実施形態2に係る、3次元モデル形成処理の流れを示すフローチャート (a)は統合マスクを元に生成した統合3次元モデルを示し、(b)は構造物マスクのみに基づいて生成した構造物の3次元モデルを示し、(c)は(a)の統合3次元モデルと(b)の構造物の3次元モデルとの差分により得られた前景のみの3次元モデルを示す図
以下、添付図面を参照して、本発明を実施形態に従って詳細に説明する。なお、以下の実施形態において示す構成は一例にすぎず、本発明は図示された構成に限定されるものではない。
実施形態1
本実施形態では、撮影シーンにおける前景の2次元シルエットに加え、その少なくとも一部を遮る構造物の2次元シルエットをも含むマスク画像を用いて、前景について欠損のない、もしくは低減させた3次元モデルを生成する態様について説明する。この態様では、前景の一部を遮る構造物等を含んだ3次元モデルが生成される。なお、本明細書において、「前景」とは、時系列で同じアングルから撮影を行った場合において動きのある(その絶対位置が変化し得る)、仮想的な視点から見ることが可能な、撮影画像内に存在する動的オブジェクト(動体)を指す。また、「構造物」とは、時系列で同じアングルから撮影を行った場合において動きのない(その絶対位置が変化しない、即ち静止している)、前景を遮ってしまう可能性のある、撮影画像内に存在する静的オブジェクトを指す。
以下の説明では、サッカーの試合を撮影シーンとして仮想視点画像を生成する場合において、選手やボールといった前景(動的オブジェクト)の一部が、サッカーゴール等の構造物(静的オブジェクト)によって遮られてしまうケースを想定している。なお、仮想視点画像とは、エンドユーザ及び/又は選任のオペレータ等が自由に仮想カメラの位置及び姿勢を操作することによって生成される映像であり、自由視点画像や任意視点画像などとも呼ばれる。また、生成される仮想視点画像やその元になる複数視点画像は、動画であっても、静止画であってもよい。以下に述べる各実施形態では、動画の複数視点画像を用いて動画の仮想視点画像を生成するための3次元モデルを生成する場合を例に説明するものとする。
本実施形態ではサッカーを撮影シーンとし、固定的に設置されたサッカーゴールを構造物として以下説明を行うものとするが、これに限定されない。例えば、さらにコーナーフラッグを構造物として扱ってもよいし、屋内スタジオなどを撮影シーンとする場合には家具や小道具を構造物として扱うこともできる。即ち、静止または静止に近い状態が継続する静止物体であればよい。
(システム構成)
図2(a)は、本実施形態に係る、3次元モデル生成装置を含む仮想視点画像生成システムの構成の一例を示すブロック図である。仮想視点画像生成システム100は、複数のカメラを含むカメラアレイ110、制御装置120、前景分離装置130、3次元モデル生成装置140、レンダリング装置150で構成される。制御装置120、前景分離装置130、3次元モデル生成装置140及びレンダリング装置150は、演算処理を行うCPU、演算処理の結果やプログラム等を記憶するメモリなどを備えた一般的なコンピュータ(情報処理装置)によって実現される。
図2(b)は、カメラアレイ110を構成する全8台のカメラ211〜218の配置を、フィールド200を真上から見た俯瞰図において示した図である。各カメラ211〜218は、地上からある一定の高さにフィールド200を囲むように設置されており、一方のゴール前を様々な角度から撮影して、視点の異なる複数視点画像データを取得する。芝生のフィールド200上には、サッカーコート201が(実際には白のラインで)描かれており、その左側にサッカーゴール202が置かれている。また、サッカーゴール202の前の×印203は、カメラ211〜218の共通の視線方向(注視点)を示し、破線の円204は注視点203を中心としてカメラ211〜218がそれぞれ撮影可能なエリアを示している。本実施形態では、フィールド200の1つの角を原点として、長手方向をx軸、短手方向をy軸、高さ方向をz軸とした座標系で表すこととする。カメラアレイ110
の各カメラで得られた複数視点画像のデータは、制御装置120及び前景分離装置130へ送られる。なお、図2(a)では、各カメラ211〜218と、制御装置120及び前景分離装置130とは、スター型のトポロジーで接続されているがデイジーチェーン接続によるリング型やバス型のトポロジーでもよい。また、図2において、カメラ8台の例を示したが、カメラの数は、8台未満または8台を超えてもよい。
制御装置120は、カメラパラメータや構造物マスクを生成し、3次元モデル生成装置140に供給する。カメラパラメータは、各カメラの位置や姿勢(視線方向)を表す外部パラメータと、各カメラが備えるレンズの焦点距離や画角(撮影領域)などを表す内部パラメータからなり、キャリブレーションによって得られる。キャリブレーションは、チェッカーボードのような特定パターンを撮影した複数の画像を用いて取得した3次元の世界座標系の点とそれに対応する2次元上の点との対応関係を求める処理である。構造物マスクは、各カメラ211〜218で取得される各撮影画像中に存在する構造物の2次元シルエットを示すマスク画像である。マスク画像は、撮影画像内の抽出対象の部分がどこであるかを特定する基準画像であり、0と1で表される2値画像である。本実施形態では、サッカーゴール202を構造物として扱い、各カメラそれぞれが所定位置から所定アングルで撮影した画像内のサッカーゴール202の領域(2次元シルエット)を示すシルエット画像が構造物マスクとなる。なお、構造物マスクの元になる撮影画像は、試合の前後やハーフタイム中など、前景となる選手等が存在していないタイミングで撮影したものを使用すればよい。ただし、例えば屋外では日照変動の影響を受けるなどにより、事前・事後に撮影した画像では不適切な場合がある。このような場合、例えば選手等が写っている動画のうち所定数のフレーム(例えば連続する10秒分のフレーム)を用いて、そこから選手等を消すことで得てもよい。この場合、各フレームにおける各画素値の中央値を採用した画像に基づいて構造物マスクを得ることができる。
前景分離装置130は、入力される複数視点の各撮影画像それぞれに対し、フィールド200上の選手やボールに対応する前景領域とそれ以外の背景領域を判別する処理を行なう。この前景領域の判別には、予め用意した背景画像(構造物マスクの元になる撮影画像と同じでよい)を用いる。具体的には、各撮影画像について背景画像との差分を求め、当該差分に対応する領域を前景領域として特定する。これにより、撮影画像毎の前景領域を示す前景マスクを生成する。本実施形態においては、撮影画像の中の、選手やボールを表す前景領域に属する画素を“0”、それ以外の背景領域に属する画素を“1”で表す2値画像が、前景マスクとして生成されることになる。
3次元モデル生成装置140は、カメラパラメータや複数視点画像に基づいて、オブジェクトの3次元モデルを生成する。3次元モデル生成装置140の詳細については後述する。生成した3次元モデルのデータは、レンダリング装置150に出力される。
レンダリング装置150は、3次元モデル生成装置140から受け取った3次元モデル、制御装置120から受け取ったカメラパラメータ、前景分離装置130から受け取った前景画像、予め用意した背景画像に基づいて、仮想視点画像を生成する。具体的には、カメラパラメータから前景画像と3次元モデルとの位置関係を求め、3次元モデルに対応する前景画像をマッピングして、任意のアングルから注目オブジェクトを見た場合の仮想視点画像が生成される。こうして例えば、選手が得点を決めたゴール前の決定的シーンの仮想視点画像を得ることができる。
なお、図2に示した仮想視点画像生成システムの構成は一例でありこれに限定されない。例えば、1台のコンピュータが複数の装置(例えば前景分離装置130と3次元モデル生成装置140など)の機能を兼ね備えてもよい。或いは、各カメラのモジュールに前景分離装置130の機能を持たせ、各カメラから撮影画像とその前景マスクのデータを供給するように構成してもよい。
(3次元モデル生成装置)
図3は、本実施形態に係る3次元モデル生成装置140の内部構成を示す機能ブロック図である。3次元モデル生成装置140は、データ受信部310、構造物マスク保存部320、マスク合成部330、座標変換部340、3次元モデル形成部350、データ出力部360で構成される。以下、各部について詳しく説明する。
データ受信部310は、カメラアレイ110を構成する各カメラのカメラパラメータ及び撮影シーン内に存在する構造物の2次元シルエットを表す構造物マスクを、制御装置120から受信する。また、カメラアレイ110の各カメラで得られた撮影画像(複数視点画像)及び各撮影画像内に存在する前景の2次元シルエットを表す前景マスクのデータを前景分離装置130から受信する。受信したデータのうち、構造物マスクは構造物マスク保存部320に、前景マスクはマスク合成部330に、複数視点画像は座標変換部340に、カメラパラメータは座標変換部340と3次元モデル形成部350に、それぞれ渡される。
構造物マスク保存部320は、構造物マスクをRAM等に格納・保持し、必要に応じてマスク合成部330へ供給する。
マスク合成部330は、構造物マスク保存部320から構造物マスクを読み出し、これをデータ受信部310から受け取った前景マスクと合成して、両者を1つに統合したマスク画像(以下、「統合マスク」と呼ぶ)を生成する。生成した統合マスクは、3次元モデル形成部350へ送られる。
座標変換部340は、データ受信部310から受け取った複数視点画像を、カメラパラメータに基づき、カメラ座標系から世界座標系に変換する。この座標変換により、視点の異なる各撮影画像が、それぞれ3次元空間上のどの領域を示しているのかを表す情報に変換される。
3次元モデル形成部350は、世界座標系に変換された複数視点画像、各カメラに対応する統合マスクを用いて、撮影シーン内の構造物を含むオブジェクトの3次元モデルを視体積交差法により生成する。生成したオブジェクトの3次元モデルのデータは、データ出力部360を介してレンダリング装置150へ出力される。
(3次元モデルの形成処理)
図4は、本実施形態に係る、3次元モデル形成処理の流れを示すフローチャートである。この一連の処理は、3次元モデル生成装置140が備えるCPUが、ROMやHDD等の記憶媒体にされた所定のプログラムをRAMに展開してこれを実行することで実現される。以下、図4のフローに沿って説明する。
まず、ステップ401では、データ受信部310が、各カメラ211〜218から見た場合の構造物(ここでは、サッカーゴール202)の2次元シルエットを表す構造物マスクと、各カメラのカメラパラメータを、制御装置120から受信する。図5(a)〜(h)は、カメラアレイ110を構成するカメラ211〜222でそれぞれ撮影される画像を示している。いま、サッカーコート201上に選手(ゴールキーパ)が一人、サッカーゴール202の前に存在している。そして、図5(a)、(b)、(h)の各撮像画像においては、カメラと選手との間にサッカーゴール202が位置するため、選手の一部がサッカーゴール202によって隠れてしまっている。図5(a)〜(h)の各撮影画像からは、サッカーゴール202の領域が1(白)、それ以外の領域が0(黒)の2値で表現された、構造物マスクがそれぞれ得られることになる。図6(a)〜(h)は、図5(a)〜(h)の各撮影画像に対応する構造物マスクを示している。
次に、ステップ402では、データ受信部310が、各カメラ211〜218で撮影された画像における前景(ここでは、選手やボール)の2次元シルエットを示す前景マスクを、その元になった複数視点画像と共に、前景分離装置130から受信する。図7(a)〜(h)は、図5(a)〜(h)の各撮影画像に対応する前景マスクをそれぞれ示している。前景分離装置130は、同じアングルから撮影された画像間で時間的に変化のある領域を前景として抽出するため、図7(a)、(b)、(h)の各図では、サッカーゴール202に隠れている選手の一部の領域は前景領域として抽出されない。受信した前景マスクのデータはマスク合成部330に送られる。
次に、ステップ403では、マスク合成部310が、構造物マスク保存部320から構造物マスクのデータを読み出し、読み出した構造物マスクと、データ受信部310から受け取った前景マスクとを合成する処理を実行する。この合成は、2値(白黒)で表される前景マスクと構造物マスクの各画素について論理和(OR)を求める演算処理である。図8(a)〜(h)は、図6(a)〜(h)に示した各構造物マスクと、図7(a)〜(h)で示した各前景マスクとをそれぞれ合成して得られた統合マスクを示している。出来上がった統合マスクにおいては、選手のシルエットに欠損は見られない。
そして、ステップ404において、3次元モデル形成部350が、ステップ403で得た統合マスクを元に視体積交差法を用いて3次元モデルを生成する。これにより、異なる視点から撮影された複数画像間の共通撮影領域に存在する前景と構造物の3次元形状を表すモデル(以下、「統合3次元モデル」と呼ぶ)が生成される。本実施形態の場合であれば、選手やボールに加え、サッカーゴール202を含んだ統合3次元モデルが生成されることになる。統合3次元モデルの生成は、具体的には以下のような手順で行う。まず、フィールド200上の3次元空間を一定の大きさを持つ立方体(ボクセル)で充填したボリュームデータを用意する。ボリュームデータを構成するボクセルの値は0と1で表現され、「1」は形状領域、「0」は非形状領域をそれぞれ示す。次に、各カメラ211〜218のカメラパラメータ(設置位置や視線方向など)を用いて、ボクセルの3次元座標を世界座標系からカメラ座標系に変換する。そして、統合マスクで示される構造物及び前景がそのカメラ座標系にある場合は、ボクセルによって当該構造物及び前景の3次元形状を表したモデルが生成される。なお、ボクセルそのものではなく、ボクセルの中心を示す点の集合(点群)によって、3次元形状を表現してもよい。図9は、図8で示した統合マスクを元に生成される統合3次元モデルを示しており、符号901は前景である選手の3次元形状、符号902は構造物であるサッカーゴール202の3次元形状に相当する。前述の通り、統合マスクには前景である選手のシルエットに欠損が無いため、出来上がった統合3次元モデルにおいても欠損は生じていない。図10は、従来手法による、前景マスクのみを用いて生成した3次元モデルを示している。前述の通り、図7の(a)、(b)、(h)で示す前景マスクでは、選手の一部が前景領域として表現されていないため、生成される3次元モデルにおいて当該一部が欠損してしまう。本実施形態の手法では、前景マスクと構造物マスクを合成したマスク画像を用いることで、前景の3次元モデルの一部に欠損が生じるのを回避することが可能となる。
以上が、本実施形態に係る、3次元モデル形成処理の内容である。動画の仮想視点画像を生成する場合には、上述の各ステップの処理をフレーム単位で繰り返し行い、フレーム毎の3次元モデルを生成する。ただし、構造物マスクの受信と保存(ステップ401)については、フローの開始直後にのみ行えば足り、2フレーム目以降については省略可能である。さらに、同じ撮影場所にて日時を変えて撮影を行うような場合は、構造物マスクの受信・保存を初回だけ行なってRAM等に保持しておき、次回以降は保持しておいたものを利用してもよい。
以上のとおり本実施形態によれば、前景となるオブジェクトを隠してしまう構造物が存在していても、前景に欠損のない、もしくは低減させた高精度な3次元モデルを生成することができる。
実施形態2
実施形態1では、撮影シーン内に存在する構造物を含む形で、欠損のない、もしくは低減させた前景の3次元モデルを生成した。次に、構造物を取り除いた、欠損のない、もしくは低減させた前景のみの3次元モデルを生成する態様を、実施形態2として説明する。なお、システム構成など実施形態1と共通する内容については説明を省略ないしは簡略化し、以下では差異点を中心に説明するものとする。
本実施形態の3次元モデル生成装置140の構成も、実施形態1と基本的には同じであるが(図3を参照)、以下の点で異なっている。
まず、構造部マスク保存部320に対する構造物マスクの読み出しが、マスク合成部330だけでなく、3次元モデル生成部350によってもなされる。図3における破線の矢印はこのことを表している。そして、3次元モデル生成部350では、統合マスクを用いた前景+構造物の統合3次元モデルの生成に加え、構造物マスクを用いた構造物のみの3次元モデルの生成も行う。そして、統合マスクを元に生成した統合3次元モデルと、構造物マスクを元に生成した構造物の3次元モデルとの差分を求めることで、欠損のない、もしくは低減させた前景のみの3次元モデルを抽出する。
(3次元モデルの形成処理)
図11は、本実施形態に係る、3次元モデル形成処理の流れを示すフローチャートである。この一連の処理は、3次元モデル生成装置140が備えるCPUが、ROMやHDD等の記憶媒体にされた所定のプログラムをRAMに展開してこれを実行することで実現される。以下、図11のフローに沿って説明する。
ステップ1101〜ステップ1104は、実施形態1の図4のフローにおけるステップ401〜ステップ404にそれぞれ対応し、異なるところはないので説明を省略する。
続くステップ1105において、3次元モデル形成部350は、構造部マスク保存部320から構造物マスクを読み出し、視体積交差法により構造物の3次元モデルを生成する。
次に、ステップ1106において、3次元モデル形成部350は、ステップ1104で生成した前景+構造物の合成3次元モデルとステップ1105で生成した構造物の3次元モデルとの差分を求め、前景のみの3次元モデルを抽出する。ここで、構造物の3次元モデルを3次元空間上で例えば10%程度膨張させてから統合3次元モデルとの差分を求めてもよい。これにより、統合3次元モデルから構造物に対応する部分を確実に除去することができる。このとき、構造物の3次元モデルの一部のみを膨張させるようにしてもよい。例えば、サッカーゴール202の場合であれば、サッカーコート201内には選手が存在する可能性が高いため、コート201側には膨張させないようにし、コート201と反対側のみ膨張させるといった具合に、領域に応じて膨張させる部分を決定してもよい。さらには、選手やボール等の前景となるオブジェクトが構造物からどれだけ離れているかによって膨張させる割合(膨張率)を変化させてもよい。例えば、前景となるオブジェクトが構造物から遠い位置にある場合は、膨張率を大きくすることで、確実に構造物の3次元モデルが除去されるようにする。また、前景となるオブジェクトが構造物に近い位置にあるほど膨張率を小さくすることで、前景の3次元モデルの部分までが誤って除去されないようにする。この際の膨張率は、前景からの距離に応じてリニアに変化させてもよいし、1又は複数の基準となる距離を設けて段階的に決定してもよい。
図12(a)は、前述の図9と同じ、統合マスクを元に生成した統合3次元モデルを示している。図12(b)は、構造物マスクのみに基づいて生成した構造物の3次元モデルを示している。そして、図12(c)は、図12(a)の統合3次元モデルと図12(b)の構造物の3次元モデルとの差分により得られた、前景のみの3次元モデルを示している。
以上が、本実施形態に係る、3次元モデルの形成処理の内容である。なお、動画の仮想視点画像を生成する場合は、上述の各ステップの処理をフレーム単位で繰り返し行い、フレーム毎の3次元モデルを生成する。ただし、構造物マスクの受信と保存(ステップ1101)及び構造物の3次元モデルの生成(ステップ1105)については、フローの開始直後にのみ行えば足り、2フレーム目以降については省略可能である。さらに、同じ撮影場所にて日時を変えて撮影を行うような場合は、構造物マスクの受信・保存及び構造物の3次元モデル生成を初回だけ行なってRAM等に保持しておき、次回以降は保持しておいたものを利用してもよい。
(変形例)
なお、本実施形態では、前景+構造物の統合3次元モデルから、構造物の3次元モデルを差し引くことで、前景のみの3次元モデルを生成したがこれに限定されない。例えば、前景+構造物の統合3次元モデルを構成するボクセル毎(或いは所定領域毎)にどのマスク画像に含まれるかをカウントし、カウント値が閾値以下の部分を統合3次元モデルから削除することで前景のみの3次元モデルを求めてもよい。この際の閾値は、全カメラ台数より少ない任意の値を、各カメラの設置位置や視線方向などを考慮して設定する。カメラ台数が全8台で図2(a)のようなカメラ配置の本実施形態の場合は、閾値として例えば“2”を設定することで、サッカーゴールのみを削除することができる。
以上のとおり本実施形態によれば、前景となるオブジェクトを隠してしまう構造物が存在していても、構造物を含まない高精度な前景のみの3次元モデルを生成することができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
140 3次元モデル生成装置
310 データ受信部
330 マスク合成部
350 3次元モデル形成部

Claims (29)

  1. オブジェクトに対応する3次元形状データを生成する生成装置であって、
    複数の撮影方向からの撮影により得られた複数の撮影画像内の前記オブジェクトの領域、及び、前記複数の撮影方向の少なくとも一つの撮影方向からの撮影時に前記オブジェクトを遮る可能性のある構造物の領域を表す画像データを取得する第1取得手段と、
    前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む画像の数を取得する第2取得手段と、
    前記第1取得手段により取得された画像データと、前記第2取得手段により取得された画像の数とに基づき、前記オブジェクトに対応する3次元形状データを生成する生成手段と、
    を有することを特徴とする生成装置。
  2. 前記オブジェクトに対応する3次元形状データは、前記構造物に対応する3次元形状データを含まない前記オブジェクトに対応する3次元形状データであり、
    前記生成手段は、
    前記第1取得手段により取得された画像データに基づいて、前記構造物に対応する3次元形状データを含む前記オブジェクトに対応する3次元形状データを生成し、
    前記構造物に対応する3次元形状データを含む前記オブジェクトに対応する3次元形状データと、前記第2取得手段により取得された画像の数とに基づいて、前記構造物に対応する3次元形状データを含まない前記オブジェクトに対応する3次元形状データを生成することを特徴とする請求項1に記載の生成装置。
  3. 前記構造物に対応する3次元形状データを含む前記オブジェクトに対応する3次元形状データから、前記第2取得手段により取得された画像の数が閾値以下の部分領域に対応するデータを除くことにより、前記構造物に対応する3次元形状データを含まない前記オブジェクトに対応する3次元形状データを生成することを特徴とする請求項2に記載の生成装置。
  4. 前記閾値は、前記複数の撮影方向に基づく値であることを特徴とする請求項3に記載の生成装置。
  5. 前記閾値は、前記複数の撮影方向からの撮影を行う撮影装置の設置位置に基づく値であることを特徴とする請求項3又は4に記載の生成装置。
  6. 前記閾値は、前記複数の撮影方向からの撮影を行う撮影装置の台数より少ない値であることを特徴とする請求項3乃至5の何れか1項に記載の生成装置。
  7. 前記画像データは、前記オブジェクトの領域を表す第1画像と前記構造物の領域を表す第2画像とが合成された画像データであり、
    前記第2取得手段は、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、前記所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む前記第1画像の数を取得することを特徴とする請求項1乃至6の何れか1項に記載の生成装置。
  8. 前記画像データは、前記オブジェクトの領域を表す第1画像の画像データと前記構造物の領域を表す第2画像の画像データを含み、
    前記第2取得手段は、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、前記所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む前記第1画像の数を取得することを特徴とする請求項1乃至6の何れか1項に記載の生成装置。
  9. オブジェクトに対応する3次元形状データを生成する生成装置であって、
    複数の撮影方向からの撮影により得られた複数の撮影画像内の前記オブジェクトの領域、及び、前記複数の撮影方向の少なくとも一つの撮影方向からの撮影時に前記オブジェクトを遮る可能性のある構造物の領域を表す画像データを取得する第1取得手段と、
    前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記構造物の領域に含む画像の数を取得する第2取得手段と、
    前記第1取得手段により取得された画像データと、前記第2取得手段により取得された画像の数とに基づき、前記オブジェクトに対応する3次元形状データを生成する生成手段と、
    を有することを特徴とする生成装置。
  10. 前記画像データは、前記オブジェクトの領域を表す第1画像と前記構造物の領域を表す第2画像とが合成された画像データであり、
    前記第2取得手段は、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記構造物の領域に含む前記第2画像の数を取得することを特徴とする請求項9に記載の生成装置。
  11. 前記画像データは、前記オブジェクトの領域を表す第1画像の画像データと前記構造物の領域を表す第2画像の画像データを含み、
    前記第2取得手段は、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記構造物の領域に含む前記第2画像の数を取得することを特徴とする請求項9に記載の生成装置。
  12. 前記オブジェクトは、動体であることを特徴とする請求項1乃至11の何れか1項に記載の生成装置。
  13. 人物とボールのうち少なくとも一方は、前記オブジェクトであることを特徴とする請求項1乃至12の何れか1項に記載の生成装置。
  14. 前記構造物は、静止状態が継続する物体であることを特徴とする請求項1乃至13の何れか1項に記載の生成装置。
  15. サッカーの試合に用いられるサッカーゴール又はコーナーフラッグの少なくとも一方は、前記構造物であることを特徴とする請求項1乃至14の何れか1項に記載の生成装置。
  16. 前記構造物は、所定の位置に設置された物体であることを特徴とする請求項1乃至15の何れか1項に記載の生成装置。
  17. 前記構造物の少なくとも一部は、オブジェクトである人物が競技を行うフィールド上に設置されていることを特徴とする請求項1乃至16の何れか1項に記載の生成装置。
  18. 前記構造物は、指定された物体であることを特徴とする請求項1乃至17の何れか1項に記載の生成装置。
  19. 前記第1画像と前記第2画像は、前記生成装置が有する受信手段を介して取得されることを特徴とする請求項7、8、10及び11の何れか1項に記載の生成装置。
  20. 前記要素は、前記3次元空間を構成する点又はボクセルであることを特徴とする請求項1乃至19の何れか1項に記載の生成装置。
  21. オブジェクトに対応する3次元形状データを生成する生成方法であって、
    複数の撮影方向からの撮影により得られた複数の撮影画像内の前記オブジェクトの領域、及び、前記複数の撮影方向の少なくとも一つの撮影方向からの撮影時に前記オブジェクトを遮る可能性のある構造物の領域を表す画像データを取得する第1取得工程と、
    前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む画像の数を取得する第2取得工程と、
    前記第1取得工程により取得された画像データと、前記第2取得工程により取得された画像の数とに基づき、前記オブジェクトに対応する3次元形状データを生成する生成工程と、
    を有することを特徴とする生成方法。
  22. 前記オブジェクトに対応する3次元形状データは、前記構造物に対応する3次元形状データを含まない前記オブジェクトに対応する3次元形状データであり、
    前記生成工程は、
    前記第1取得工程により取得された画像データに基づいて、前記構造物に対応する3次元形状データを含む前記オブジェクトに対応する3次元形状データを生成する第1生成工程と、
    前記第1生成工程により生成された前記構造物に対応する3次元形状データを含む前記オブジェクトに対応する3次元形状データと、前記第2取得工程により取得された画像の数とに基づいて、前記構造物に対応する3次元形状データを含まない前記オブジェクトに対応する3次元形状データを生成する前記第2生成工程と、
    を有することを特徴とする請求項21に記載の生成方法。
  23. 前記第2生成工程において、前記第1生成工程により生成された前記構造物に対応する3次元形状データを含む前記オブジェクトに対応する3次元形状データから、前記第2取得工程により取得された画像の数が閾値以下の部分領域に対応するデータを除くことにより、前記構造物に対応する3次元形状データを含まない前記オブジェクトに対応する3次元形状データを生成することを特徴とする請求項22に記載の生成方法。
  24. 前記画像データは、前記オブジェクトの領域を表す第1画像と前記構造物の領域を表す第2画像とが合成された画像データであり、
    前記第2取得工程において、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む前記第1画像の数を取得することを特徴とする請求項21乃至23の何れか1項に記載の生成方法。
  25. 前記画像データは、前記オブジェクトの領域を表す第1画像の画像データと前記構造物の領域を表す第2画像の画像データを含み、
    前記第2取得工程において、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記オブジェクトの領域に含む前記第1画像の数を取得することを特徴とする請求項21乃至23の何れか1項に記載の生成方法。
  26. オブジェクトに対応する3次元形状データを生成する生成方法であって、
    複数の撮影方向からの撮影により得られた複数の撮影画像内の前記オブジェクトの領域、及び、前記複数の撮影方向の少なくとも一つの撮影方向からの撮影時に前記オブジェクトを遮る可能性のある構造物の領域を表す画像データを取得する第1取得工程と、
    前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記構造物の領域に含む画像の数を取得する第2取得工程と、
    前記第1取得工程により取得された画像データと、前記第2取得工程により取得された画像の数とに基づき、前記オブジェクトに対応する3次元形状データを生成する生成工程と、
    を有することを特徴とする生成方法。
  27. 前記画像データは、前記オブジェクトの領域を表す第1画像と前記構造物の領域を表す第2画像とが合成された画像データであり、
    前記第2取得工程において、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記構造物の領域に含む前記第2画像の数を取得することを特徴とする請求項26に記載の生成方法。
  28. 前記画像データは、前記オブジェクトの領域を表す第1画像の画像データと前記構造物の領域を表す第2画像の画像データを含み、
    前記第2取得工程において、前記画像の数として、前記オブジェクトに対応する3次元形状データを生成するための3次元空間を構成する所定の要素ごとに、当該所定の要素に対応する画素又は領域を前記構造物の領域に含む前記第2画像の数を取得することを特徴とする請求項26に記載の生成方法。
  29. コンピュータを、請求項1乃至20に記載の生成装置として機能させるためのプログラム。
JP2018170606A 2018-09-12 2018-09-12 3次元モデルの生成装置、生成方法及びプログラム Pending JP2019106170A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018170606A JP2019106170A (ja) 2018-09-12 2018-09-12 3次元モデルの生成装置、生成方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018170606A JP2019106170A (ja) 2018-09-12 2018-09-12 3次元モデルの生成装置、生成方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017239891A Division JP6403862B1 (ja) 2017-12-14 2017-12-14 3次元モデルの生成装置、生成方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2019106170A true JP2019106170A (ja) 2019-06-27

Family

ID=67061452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018170606A Pending JP2019106170A (ja) 2018-09-12 2018-09-12 3次元モデルの生成装置、生成方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2019106170A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021157237A (ja) * 2020-03-25 2021-10-07 Kddi株式会社 自由視点映像生成方法、装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021157237A (ja) * 2020-03-25 2021-10-07 Kddi株式会社 自由視点映像生成方法、装置およびプログラム
JP7236403B2 (ja) 2020-03-25 2023-03-09 Kddi株式会社 自由視点映像生成方法、装置およびプログラム

Similar Documents

Publication Publication Date Title
US11151787B2 (en) Generation device, generation method and storage medium for three-dimensional model from object images and structure images
CN109561296B (zh) 图像处理装置、图像处理方法、图像处理系统和存储介质
KR102280587B1 (ko) 가상 시점 화상을 생성하는 시스템, 방법, 및 비일시적 컴퓨터 판독가능 기억 매체
US20220005276A1 (en) Generation device, generation method and storage medium for three-dimensional model
JP6403862B1 (ja) 3次元モデルの生成装置、生成方法及びプログラム
JP2016218905A (ja) 情報処理装置、情報処理方法、及びプログラム
US10742852B2 (en) Image processing apparatus, object shape estimation method, and storage medium
JP2008217593A (ja) 被写体領域抽出装置及び被写体領域抽出プログラム
US11468258B2 (en) Information processing apparatus, information processing method, and storage medium
JP2019106170A (ja) 3次元モデルの生成装置、生成方法及びプログラム
JP2020004219A (ja) 3次元形状データを生成する装置、方法、及びプログラム
CN113763545A (zh) 图像确定方法、装置、电子设备和计算机可读存储介质
JP7265825B2 (ja) 生成装置、生成方法およびプログラム
JP2022110751A (ja) 情報処理装置、情報処理方法及びプログラム
Louis et al. Rendering stereoscopic augmented reality scenes with occlusions using depth from stereo and texture mapping
JP2019114269A (ja) 仮想視点画像を生成するシステム、方法及びプログラム
JP7353527B2 (ja) 情報処理装置、情報処理装置の制御方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191223

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200428