JP2020126393A - 画像処理装置、画像処理方法、及びプログラム - Google Patents

画像処理装置、画像処理方法、及びプログラム Download PDF

Info

Publication number
JP2020126393A
JP2020126393A JP2019017808A JP2019017808A JP2020126393A JP 2020126393 A JP2020126393 A JP 2020126393A JP 2019017808 A JP2019017808 A JP 2019017808A JP 2019017808 A JP2019017808 A JP 2019017808A JP 2020126393 A JP2020126393 A JP 2020126393A
Authority
JP
Japan
Prior art keywords
image
dimensional shape
image processing
subject
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019017808A
Other languages
English (en)
Other versions
JP7321716B2 (ja
Inventor
和文 小沼
Kazufumi Konuma
和文 小沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019017808A priority Critical patent/JP7321716B2/ja
Publication of JP2020126393A publication Critical patent/JP2020126393A/ja
Application granted granted Critical
Publication of JP7321716B2 publication Critical patent/JP7321716B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

【課題】データ量の低減を適切に行うことができる画像処理装置、画像処理方法及びプログラムを提供する。【解決手段】画像処理装置は、被写体を複数の視点から撮像して取得された複数の撮像画像に基づく三次元形状データと、複数の撮像画像に基づく被写体を含む前景画像と、を取得する取得手段と、前景画像における被写体に対応する画素又は領域が、三次元形状データを構成する要素に対応する画素又は領域を含むか否かに基づいて、削除する画素又は領域を決定する削除手段と、を有する。【選択図】図3

Description

本発明は、画像処理技術に関する。
それぞれ異なる位置に配置された複数のカメラによって被写体を複数視点で同期撮影し、その撮影で得られた複数視点の画像を用いて自由視点コンテンツ(仮想視点コンテンツ)を生成する技術が注目されている。特許文献1には、複数視点の画像に基づいて自由視点コンテンツを生成して保存するシステムにおいて、画像受信装置が、生成した視点情報に基づく画像データを読み出すことによって、任意の自由視点コンテンツを取得する技術が記載されている。
仮想視点コンテンツの生成は、1つ以上の被写体の三次元形状を組み合わせて行うことができる。複数のカメラで撮影された被写体の三次元形状データを生成する方法は、非特許文献1に示される視体積交差法でありうる。視体積交差法は、複数のカメラで撮影される測定対象の空間が、小さな立方体又は直方体(以下では「ボクセル」と呼ぶ。)によって分割される。そして、各ボクセルが幾何学的に変換されてカメラ画像に投影され、カメラ画像において、三次元形状データ化対象物体のシルエット内に、そのボクセルが投影されたか否かが判定される。そして、すべてのカメラ画像でシルエット内に投影されたと判定されたボクセルは、対象物体を構成するボクセルとして登録され、その登録されたボクセルの集合体が三次元形状データとして出力される。この三次元形状に撮像画像を適切に投影し色付けを行うことで被写体の再現した色がついた三次元形状データが描画できる。
特開2015−204512号公報
「Virtual View generation for 3D Digital Video」(IEEE MULTIMEDIA Vol.4 No.1 pp.18−26、1997年)
視体積交差法を行う場合に、撮像画像から被写体のシルエット及び画像を抽出する方法として一般的に、背景差分方式が用いられる。この背景差分方式は、背景として登録した画像に対する差分を、被写体と判断する手法である。しかしながら、背景差分方式では、スタジアム競技などを撮影する際に、観客席やその他画像ノイズなども被写体として抽出してしまう。これら観客席やその他画像ノイズの画像は、三次元形状データ化されない場合には、実質的に使用されないデータとなってしまう。このような使用先がないデータを処理、伝送、蓄積することは無駄である。
そこで、本発明は、データ量の低減を適切に行うことを目的とする。
本発明の画像処理装置は、被写体を複数の視点から撮像して取得された複数の撮像画像に基づく三次元形状データと、前記複数の撮像画像に基づく被写体を含む前景画像と、を取得する取得手段と、前記三次元形状データに基づいて、前記前景画像から一部の被写体に対応する画素又は領域を削除できる削除手段と、を有することを特徴とする。
本発明によれば、データ量の低減を適切に行うことが可能となる。
仮想視点画像生成システムの概略構成例を示す図である。 撮像部の配置例を示す図である。 第1の実施形態の画像処理装置の構成例を示す図である。 第1の実施形態における処理画像を模式的に示す図である。 第1の実施形態の画像処理装置の別構成例を示す図である。 バンディングボックスの例を説明する図である。 第2の実施形態の画像処理装置の構成例を示す図である。 第2の実施形態における処理画像を模式的に示す図である。 画像処理装置に適用可能なコンピュータの構成例を示す図である。
以下、本発明の実施の形態のいくつかの例を、添付の図面に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例にすぎず、本発明は図示された構成に限定されるものではない。
<第1の実施形態>
(基本的なシステム構成と動作)
図1には、本実施形態に係る仮想視点コンテンツ生成システムの概略構成例を示している。本システムは、例えば、撮像部1、同期部2、抽出部3、受信部4、形状推定部5、保存部6、画像生成部7、出力部8、及び操作部9を含んで構成される。なお、本システムは、1つの電子機器によって構成されてもよいし、複数の電子機器によって構成されてもよい。
本システムでは、複数の撮像部1が、同期部2による同期信号に基づいて互いに高精度に同期して撮像を行う。なお、複数の撮像部1は、図2に示すように、スタジアムのグラウンド20(競技スペース)などを含む被写体を囲むように設置されているとする。複数の撮像部1により撮像された画像はそれぞれ対応した抽出部3に送られる。抽出部3は、それぞれ対応した撮像部1で撮像された画像と予め設定された背景画像との差分を求め、被写体を含む前景画像の領域を抽出した前景マスク画像と前景テクスチャ画像とを生成し、受信部4へと送信する。前景マスク画像は撮像画像に含まれる被写体の領域を含むシルエットを表す画像であり、前景テクスチャ画像は撮像画像から切り出された被写体を含むテクスチャを表す画像である。
受信部4は、各抽出部3から受信した同期のとれた複数視点の前景マスク画像を、形状推定部5に入力する。
形状推定部5は、入力された複数視点の前景マスク画像を用いて、例えば視体積交差法などを用いて前景被写体の三次元形状データ(以下、三次元形状と呼ぶ)を生成(推定)する。それら生成された前景被写体の三次元形状は、受信部4が各抽出部3から受信した前景テクスチャ画像とともに、素材データとして保存部6に保存される。
素材データは、前景被写体の三次元形状と前景テクスチャ画像の他に、被写体以外の背景を描画するための、背景構造を示すポリゴンデータである背景三次元形状と、背景三次元形状のポリゴンに貼り付ける背景テクスチャ画像とのいずれか又は両方を含みうる。なお、背景三次元形状及び背景テクスチャの生成方法に関しては、本実施形態によるところではないので説明を省略するが、予め生成しておいてもよいし、撮像画像を用いて逐次生成してもよい。なお、素材データの被写体三次元形状は、本実施形態では視体積交差法を用いて生成されうるが、これ以外の方法が用いられてもよく、他の任意の方法によって三次元形状が生成されてもよい。また、他の素材データについても、任意の方法によって生成されうる。
操作部9は、例えば、タッチパネル、ボタン・キーボード等とディスプレイとの組み合わせ等で構成され、ユーザからの入力を受け付け、ユーザへの情報の提示を行うための、ユーザインタフェースを提供する。操作部9は、例えばその機能として、仮想視点操作部、表示部、及び時間指示部等を含んで構成され、ユーザからの指示を受け付ける。表示部は、現在操作している仮想視点において生成された仮想視点画像を表示する。
また、操作部9に含まれる仮想視点操作部では、ユーザからの指示を基に、仮想視点画像を生成すべき仮想視点情報である仮想視点の位置・姿勢・画角を取得及び決定する。なお、仮想視点操作部としては、例えば3Dマウスなどを用いてもよいし、GUIを通じた操作や、専用の操作部による操作を受け付けることによって仮想視点情報を決定するものでもよい。そして、操作部9を介して決定された仮想視点情報及び指定された時間情報は、画像生成部7に伝えられる。
画像生成部7は、操作部9から指示された仮想視点情報と時間情報とに基づいて、保存部6から素材データを取得して、仮想視点画像を生成する。生成された仮想視点画像は、例えば、操作部9の表示部に表示されたり、出力部8から外部に送信されたりする。
(本実施形態の画像処理装置における特徴的な動作)
図3は、本実施形態の画像処理装置の概略構成例を示した図である。図3において、基本的な構成及び動作は前述の基本構成である図1と同様であるが、特徴的な構成として、削除部10が含まれている。なお、説明を簡略にするために、図3では画像生成部7以降の図示を省略している。
図4は、削除部10を含んだ本構成における処理の流れ及び各処理で使用または生成される画像を模式的に表した図である。またここでは、重複した説明を避けるために、複数の撮像部1のうち一つの撮像部1についてのみ例を示して説明する。
まず撮像部1は、図4に示すように、例えば選手が競技しているスタジアム等を撮影した撮像画像40を取得して抽出部3に送る。抽出部3は、撮像部1から受け取った撮像画像40と、予め人物等の被写体が存在していない時のスタジアムを撮影した背景画像41との差分を求めることで、前景マスク画像42及び前景テクスチャ画像43を抽出する。ただしこの場合、撮像画像40と背景画像41との差分として抽出される領域には、図4に示すように、スタジアムの競技スペース内に存在する選手等の領域だけではなく、観客やその他ノイズの領域も含まれることになる。
受信部4は、抽出部3で抽出された前景マスク画像42及び前景テクスチャ画像43のデータを受信し、前景マスク画像42を形状推定部5に送り、前景テクスチャ画像43を削除部10に送る。
形状推定部5は、受信部4から入力された前景マスク画像42を基に、前景の各被写体の三次元形状を推定する。このとき視体積交差法を用いて被写体の三次元形状の推定を行うと、一部の撮像画像にしか映っていない前景については、形状推定の結果としての被写体三次元形状が生成されない。このため、形状推定部5からは、図4の被写体三次元形状44に示すように、全ての撮像部1の撮像画像に映っている前景の各被写体だけに対応した被写体三次元形状が出力されることになる。
削除部10は、被写体を複数の視点から撮像した複数の撮像画像に基づきかつ仮想視点画像を生成するために用いられる三次元形状を用いて、前景テクスチャ画像43から一部の被写体のテクスチャ画像を削除する。
例えば、削除部10は、前景テクスチャ画像における被写体を示す画素又は領域が、三次元形状を構成する要素に対応する画素又は領域を含むか否かに基づいて、削除する被写体のテクスチャ画像を決定してもよい。
また例えば、削除部10は、前景マスク画像の三次元形状に対応する投影画像と、前景テクスチャ画像との比較結果に基づいて、削除する被写体を決定してもよい。この場合の削除部10は、前景マスク画像の三次元形状に対応する投影画像に含まれる被写体が、前景テクスチャ画像に含まれる被写体を含むか否かに基づいて、削除する被写体を決定する。
投影画像を用いる場合、削除部10は、形状推定部5にて推定された被写体三次元形状を、撮像部1の位置姿勢を示す外部パラメータと、画角などを示す内部パラメータとを用いて、撮像部1の撮影画角に透視投影変換する。これにより、図4の再投影前景マスク画像45が生成される。なお、撮像部1の位置姿勢を示す外部パラメータ、画角などを示す内部パラメータは、撮像部1から受信部4を介して取得されているとする。
そして削除部10は、この再投影前景マスク画像45を用いて、前景テクスチャ画像43をマスキングすることで、図4に示すような前景被写体の三次元形状として推定された領域のみを抽出した、再抽出前景テクスチャ画像46を生成する。
保存部6は、この再抽出前景テクスチャ画像46を保存する。なお再抽出前景テクスチャ画像46を保存する際には、再投影前景マスク画像45でマスキングされなかった画素がある部分だけを矩形領域として切り出したり、圧縮処理をかけたときの圧縮率を向上させたりすることで、保存部6に保存するデータ量を削減する。
前述のようにして生成した、再投影前景マスク画像45のシルエット外の前景テクスチャ画像は、前景としての被写体の三次元形状がない領域である。すなわち、その領域については、ボクセルに色付けを行う投影処理の際に使用されることがないため、後に仮想視点画像を生成した場合に画質に影響を与えることなく、また保存するデータ量も削減することができる。
(長期保存する際に前景削除処理を実施する例)
本実施形態では仮想視点画像を生成するための素材データを保存部6に保存する前に、削除部10で前景テクスチャ画像を削除する構成としたが、必ずしもこの構成に限定するものではない。例えば、リアルタイム性を重要視するシステムでは、削除部10における削除処理がボトルネックになってしまうことがある。一方で撮影後のデータを長期保存する際にはリアルタイム性は考慮する必要がなくデータ量を削減したい場合などもある。このような場合、図5に示すように、保存部6には前景削除処理していない素材データを保存するようにし、その保存部6に保存した素材データを長期保存部11に保存し直す際に、削除部10による前景削除処理を行ってデータ量を削減してもよい。なお、図5は、第1の実施形態の画像処理装置の別構成例を示した図である。図5の構成は、図3の構成とは異なり、削除部10では、保存部6から読み出したデータに対して前景削除処理を行い、その処理後のデータを長期保存部11に保存する構成となされている。図5の構成の他に、保存部6には前景削除処理前の素材データを保存し、後に長期保存することになった際に、保存部6から読み出したデータに対して削除部10による前景削除処理を行い、その処理後のデータで保存部6の素材データを上書きしてもよい。この例の場合も、保存部6の保存データ量を削減することができる。
(バウンディングボックスを用いた構成)
ここで、前景被写体の三次元形状をそのまま透視投影変換する場合に、例えば三次元形状のボクセル数が多いと、その分、透視投影変換に要する処理時間が増加してしまうことになる。
そこで削除部10では、図6に示すように、前景被写体の三次元形状61に外接して当該三次元形状61を内包する直方体62(バウンディングボックス)を求め、この直方体62を透視投影変換してカメラの撮影画角に投影してもよい。すなわち、被写体三次元形状それぞれについて直方体62を設定することで投影対象が単純形状となり、例えば直方体の頂点である8点のみを投影するだけで済み、透視投影の処理を軽くすることができるようになる。そしてこのときの再投影前景マスク画像は単純形状になり、これを用いてマスキングを行うようにする。なおこの場合、被写体の付近にも不要な画像が残ってしまうが、観客席などの明らかに不要な部分の画像を削除することは可能なため、処理時間とのトレードオフでこのような構成にしてもよい。
(距離画像)
本実施形態において、再投影前景マスク画像は、例えば二値のマスク画像であるが、これに限定されるものではない。
例えば、削除部10は、前景テクスチャ画像における被写体を示す画素又は領域に対応する三次元空間上の要素が、三次元形状を構成する要素に含まれるか否かに基づいて、削除する被写体を決定してもよい。例えば、前景被写体の三次元形状を、撮像部1の撮像画角に透視投影変換する際には、撮像部からの距離を表す距離情報が画素ごとに配列された距離画像として投影する。例えば撮像部1が画素ごとの距離情報を含んだ画像を撮像可能である場合、削除部10は、その距離画像の距離情報に基づき、所定の距離範囲外かどうかで各画素を残すか削除するかを判定して、前景テクスチャ画像の削除処理を行う。このような構成とすることで、全ての撮像画像に映っているが被写体としてとらえたい注目領域内か否かを判定することができ、より高い精度で前景テクスチャの削除処理を行うことができる。
<第2の実施形態>
図7は、第2の実施形態の構成図を示した図である。図7において、基本的な構成及び動作は、第1の実施形態で説明した基本構成を示した図1と同様であるので、以下、第1の実施形態とは異なる部分のみ説明する。
図7に示すように、第2の実施形態において、形状推定部5には、領域指定部12から形状推定領域の情報が供給される。
ここで、形状推定領域とは、形状推定を行う範囲を限定するための領域であり、本実施形態では、例えば図8の点線で示した直方体領域81のように、例えば競技スペースを包括するような領域とする。なお、図8の例において、図4と同様の画像等には図4と同じ参照符号を付してそれらの説明は省略する。図8の場合、観客席等に関しては形状推定領域外となるため、例えば全ての撮像画像に観客席が含まれていたとしても、観客は形状推定されない。
また領域指定部12は、削除部10に対しても、形状推定領域を入力する。削除部10は、その形状推定領域を、第1の実施形態と同様にして、各撮像部1の外部パラメータ及び内部パラメータに基づいて各撮像部1の撮像画角に投影し、図8に示すような再投影領域マスク画像82を生成する。そして、削除部10は、この再投影領域マスク画像82を用いて、抽出部3で抽出された前景マスク画像42及び前景テクスチャ画像43をマスキングする。これにより、マスキングされた再抽出前景テクスチャ画像83及び再抽出前景マスク画像84が生成されることになる。
そして、第2の実施形態では、再抽出前景テクスチャ画像83を圧縮して受信部4へ伝送することで、スタジアムの各所に設置された撮像部1から、受信部4への伝送量を削減することができる。
また第2の実施形態では、第1の実施形態とは異なり再投影領域マスク画像の生成は一度行えばよく、その後の処理は二次元画像のマスク処理のため、比較的軽い処理で実施することが可能となり、リアルタイム性を要するシステムにおいても導入しやすい。また、第2の実施形態では、形状推定部5へ入力される前景マスク画像が削除処理済みであるため、視体積交差法を行う際にシルエットの内外判定を行う回数が減り、形状推定処理の処理負荷も軽減する効果が得られる可能性がある。
一方、第2の実施形態では、最終的な前景テクスチャ画像は第1の実施形態に示す手法に比べ削減量が少ない場合がある。そのため最終的なデータの保存量を削減したい場合などは、第1の実施形態の構成と合わせた構成としてもよい。
前述した各実施形態の画像処理装置によれば、仮想視点コンテンツを生成するために用いられる素材データのうち、前景被写体の被写体三次元形状を再投影し、その再投影した三次元形状の範囲外の被写体画像を削除する。これにより、不要なデータを削減することが可能となり、コストを低減可能となる。なお前述した第1の実施形態に係る処理と第2の実施形態に係る処理は適宜組み合わされて用いられてもよい。
(その他の構成)
前述した各実施形態では、抽出部3が前景抽出を行った前景マスク画像及び前景テクスチャ画像に対して削除部10で再投影領域マスクを用いたマスク処理を行ったが、必ずしもこの順序に限定するものではない。例えば撮像画像及び背景画像に対して、削除部10において再投影領域マスクでマスク処理を行った画像を生成し、それらの画像を用いて抽出部3で前景の抽出処理を行う構成としてもよい。この構成とすることで、前景抽出の処理量も少なくすることが可能である。
また、前述した実施形態では、カメラ側で前景の抽出等の処理を行っているが、撮像部1と受信部4の伝送帯域などがボトルネックとならないシステムであれば、これらの処理を受信部4で受信した後に行ってもよい。
また、前述の実施形態では、各撮像部1での撮影を同期させているが、これに限定されない。例えば参考文献1のように、非同期で撮影した画像を基に、後から同期した画像を生成するようにして同期をとっても構わない。
また、前述の実施形態では、三次元モデルを保存し、仮想視点画像を生成する方法を用いたが、これに限定されない。例えば、三次元モデルは保存しないが、前景テクスチャ画像を削除して、参考文献2のようなビルボード方式で仮想視点画像を生成しても構わない。
参考文献1:Shishido, "Smoothly switching method of asynchronous multi-view videos using frame interpolation",
3DTV-Conference 2017.
参考文献2:T.Koyama, I.Kitahara and Y.Ohta, "Live Mixed-Reality 3D Video in Soccer Stadium," ISMAR2003, pp.167-178.
前述の図1、図3、図5、図7に示した各部はハードウェアにより構成されているものとして説明したが、これら各部で行う処理をコンピュータプログラムによるソフトウェア構成により実現してもよい。また、一部がハードウェア構成で、残りがソフトウェア構成となされてもよい。
図9は、前述した各実施形態の各部で行う処理をコンピュータプログラムの実行により実現可能なコンピュータのハードウェアの構成例を示したブロック図である。
図9において、CPU91は、RAM92やROM93に格納されているコンピュータプログラムやデータを用いてコンピュータ全体の制御を行うと共に、前述した各実施形態に係る画像処理装置が行う各処理を実行する。すなわち、CPU91は、図1、図3、図5、図7に示した各部のうち、撮像部1の制御、同期部2、抽出部3、受信部4、形状推定部5、削除部10、保存部6等の機能を担うことになる。なお、ハードウェア構成としてのカメラ側に同期部2や抽出部3が設けられている場合、CPU91は、受信部4、形状推定部5、削除部10、保存部6の各機能を担う。
RAM92は、外部記憶装置96からロードされたコンピュータプログラムやデータ、I/F(インターフェース)97を介して外部から取得したデータなどを一時的に記憶するためのエリアを有する。更に、RAM92は、CPU91が各種の処理を実行する際に用いるワークエリアを有する。すなわち、RAM92は、例えば、フレームメモリとして割り当てたり、その他の各種のエリアを適宜提供したりすることができる。
ROM93には、本コンピュータの設定データや、ブートプログラムなどが格納されている。操作部94は、キーボードやマウスなどにより構成されており、本コンピュータのユーザが操作することで、各種の指示をCPU91に対して入力することができる。出力部95は、CPU91による処理結果を表示する。また出力部95は例えば液晶ディスプレイで構成される。
外部記憶装置96は、ハードディスクドライブ装置に代表される、大容量情報記憶装置である。外部記憶装置96には、OS(オペレーティングシステム)や、前述した第1、第2の実施形態で説明した各部の機能をCPU91に実現させるためのコンピュータプログラムが保存されている。更には、外部記憶装置96には、処理対象としての各画像データが保存されていても良い。
外部記憶装置96に保存されているコンピュータプログラムやデータは、CPU91による制御に従って適宜、RAM92にロードされ、CPU91による処理対象となる。I/F97には、LANやインターネット等のネットワーク、投影装置や表示装置などの他の機器を接続することができ、本コンピュータはこのI/F97を介して様々な情報を取得したり、送出したりすることができる。バス98は上述した各部を繋ぐ。
上述の構成からなる作動は、前述の実施形態で説明した作動をCPU91が中心となってその制御を行う。
本発明に係る信号処理における1以上の機能を実現するプログラムは、ネットワーク又は記憶媒体を介してシステム又は装置に供給可能であり、そのシステム又は装置のコンピュータの1つ以上のプロセッサにより読また出し実行されることで実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
前述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
1:撮像部、2:同期部、3:抽出部、4:受信部、5:形状推定部、6:保存部、7:画像生成部、8:出力部、9:操作部、10:削除部、11:長期保存部、12:領域指定部

Claims (16)

  1. 被写体を複数の視点から撮像して取得された複数の撮像画像に基づく三次元形状データと、前記複数の撮像画像に基づく被写体を含む前景画像と、を取得する取得手段と、
    前記三次元形状データに基づいて、前記前景画像から一部の被写体に対応する画素又は領域を削除できる削除手段と、
    を有することを特徴とする画像処理装置。
  2. 前記削除手段は、前記前景画像における被写体に対応する画素又は領域に対応する三次元空間上の要素が、前記三次元形状データを構成する要素に含まれるか否かに基づいて、削除する画素又は領域を決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記削除手段は、前記前景画像における被写体に対応する画素又は領域が、前記三次元形状データを構成する要素に対応する画素又は領域を含むか否かに基づいて、削除する画素又は領域を決定することを特徴とする請求項1に記載の画像処理装置。
  4. 前記削除手段は、前記三次元形状データの前記前景画像に対応する投影画像と、前記前景画像との比較結果に基づいて、削除する画素又は領域を決定することを特徴とする請求項1に記載の画像処理装置。
  5. 前記削除手段は、前記三次元形状データの前記前景画像に対応する投影画像に含まれる被写体が、前記前景画像に含まれる被写体を含むか否かに基づいて、削除する画素又は領域を決定することを特徴とする請求項4に記載の画像処理装置。
  6. 前記三次元形状データは、複数の前記前景画像に基づいて生成されることを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。
  7. 前記削除手段は、前記三次元形状データに応じた三次元形状を内包する直方体に基づいて、前記削除を行うことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
  8. 前記削除手段は、予め指定された範囲を包括する領域に応じた三次元形状データに基づいて、前記削除を行うことを特徴とする請求項1から7のいずれか1項に記載の画像処理装置。
  9. 前記前景画像を保存した後に長期保存しなおす場合に、前記削除手段は、前記削除を行うことを特徴とする請求項1から8のいずれか1項に記載の画像処理装置。
  10. 前記三次元形状データと、前記削除手段により一部の被写体に対応する画素又は領域が削除された前景画像は、指定された視点に基づく画像の生成に用いられることを特徴とする請求項1から9のいずれか1項に記載の画像処理装置。
  11. 画像処理装置が実行する画像処理方法であって、
    被写体を複数の視点から撮像した複数の撮像画像に基づく三次元形状データと、前記複数の撮像画像に基づく被写体を含む前景画像と、を取得する取得工程と、
    前記三次元形状データに基づいて、前記前景画像から一部の被写体に対応する画素又は領域を削除する削除工程と、
    を有することを特徴とする画像処理方法。
  12. 前記削除工程において、前記前景画像における被写体に対応する画素又は領域に対応する三次元空間上の要素が、前記三次元形状データを構成する要素に含まれるか否かに基づいて、削除する画素又は領域が決定されることを特徴とする請求項11に記載の画像処理方法。
  13. 前記削除工程において、前記前景画像における被写体に対応する画素又は領域が、前記三次元形状データを構成する要素に対応する画素又は領域を含むか否かに基づいて、削除する画素又は領域が決定されることを特徴とする請求項11に記載の画像処理方法。
  14. 前記削除工程において、前記三次元形状データの前記前景画像に対応する投影画像と、前記前景画像との比較結果に基づいて、削除する画素又は領域が決定されることを特徴とする請求項11に記載の画像処理方法。
  15. 前記削除工程において、前記三次元形状データの前記前景画像に対応する投影画像に含まれる被写体が、前記前景画像に含まれる被写体を含むか否かに基づいて、削除する画素又は領域を決定することを特徴とする請求項11に記載の画像処理方法。
  16. コンピュータを、請求項1から10のいずれか1項に記載の画像処理装置が有する各手段として機能されるためのプログラム。
JP2019017808A 2019-02-04 2019-02-04 画像処理装置、画像処理方法、及びプログラム Active JP7321716B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019017808A JP7321716B2 (ja) 2019-02-04 2019-02-04 画像処理装置、画像処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019017808A JP7321716B2 (ja) 2019-02-04 2019-02-04 画像処理装置、画像処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2020126393A true JP2020126393A (ja) 2020-08-20
JP7321716B2 JP7321716B2 (ja) 2023-08-07

Family

ID=72084945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019017808A Active JP7321716B2 (ja) 2019-02-04 2019-02-04 画像処理装置、画像処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7321716B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022191010A1 (ja) * 2021-03-12 2022-09-15 ソニーグループ株式会社 情報処理装置および情報処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
三功 浩嗣, 内藤 整: "選手領域の抽出と追跡によるサッカーの自由視点映像生成", 映像情報メディア学会誌, vol. 2014年68巻3号, JPN6023000959, 2014, JP, pages 125 - 134, ISSN: 0004964625 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022191010A1 (ja) * 2021-03-12 2022-09-15 ソニーグループ株式会社 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
JP7321716B2 (ja) 2023-08-07

Similar Documents

Publication Publication Date Title
US11019259B2 (en) Real-time generation method for 360-degree VR panoramic graphic image and video
US20200404247A1 (en) System for and method of social interaction using user-selectable novel views
JP6425780B1 (ja) 画像処理システム、画像処理装置、画像処理方法及びプログラム
JP7051457B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7179515B2 (ja) 装置、制御方法、及びプログラム
JPWO2018047687A1 (ja) 三次元モデル生成装置及び三次元モデル生成方法
US10748265B2 (en) Arbitrary view generation
AU2017254859A1 (en) Method, system and apparatus for stabilising frames of a captured video sequence
JP6882868B2 (ja) 画像処理装置、画像処理方法、システム
US20210217225A1 (en) Arbitrary view generation
US11676332B2 (en) Arbitrary view generation
CN113132708B (zh) 利用鱼眼相机获取三维场景图像的方法和装置、设备和介质
Nonaka et al. Fast plane-based free-viewpoint synthesis for real-time live streaming
US20230394701A1 (en) Information processing apparatus, information processing method, and storage medium
JP2020126393A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2014164497A (ja) 画像処理装置、画像処理方法及びプログラム
JP7195791B2 (ja) 画像処理装置、情報処理方法及びプログラム
JP7265825B2 (ja) 生成装置、生成方法およびプログラム
JP2018063635A (ja) 画像処理装置、画像処理方法およびプログラム
US20230291865A1 (en) Image processing apparatus, image processing method, and storage medium
KR102561903B1 (ko) 클라우드 서버를 이용한 ai 기반의 xr 콘텐츠 서비스 방법
JP2022103836A (ja) 情報処理装置、情報処理方法及びプログラム
JP6759300B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP5106378B2 (ja) 画像処理装置、方法及びプログラム
JP2023080290A (ja) 情報処理装置、情報処理装置の制御方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230726

R151 Written notification of patent or utility model registration

Ref document number: 7321716

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151