JP4591955B2 - 自由視点映像の隠蔽領域補完装置 - Google Patents

自由視点映像の隠蔽領域補完装置 Download PDF

Info

Publication number
JP4591955B2
JP4591955B2 JP2004349703A JP2004349703A JP4591955B2 JP 4591955 B2 JP4591955 B2 JP 4591955B2 JP 2004349703 A JP2004349703 A JP 2004349703A JP 2004349703 A JP2004349703 A JP 2004349703A JP 4591955 B2 JP4591955 B2 JP 4591955B2
Authority
JP
Japan
Prior art keywords
image
background
depth value
free viewpoint
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004349703A
Other languages
English (en)
Other versions
JP2006146846A (ja
Inventor
彰夫 石川
篤志 松村
亮一 川田
淳 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004349703A priority Critical patent/JP4591955B2/ja
Publication of JP2006146846A publication Critical patent/JP2006146846A/ja
Application granted granted Critical
Publication of JP4591955B2 publication Critical patent/JP4591955B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Studio Circuits (AREA)
  • Studio Devices (AREA)

Description

本発明は、2次元画像とその奥行画像のみから任意の視点から見た映像を生成する自由視点映像の隠蔽領域補完装置に関する。
従来、2次元画像とそれに対応する奥行データとから、任意の仮想視点から見た画像を生成する自由視点映像生成装置に関しては、動的に更新される背景バッファを用いる下記の非特許文献1,2に開示されているものがある。
これらの文献1,2に開示されている方法は、2次元動画像と対応するフレーム毎の奥行データからフレーム毎に背景を切り出し、その背景をバッファに蓄えていく、つまり動画像であることを利用し、当該フレームだけでなく過去のフレームにある情報を全て使って背景の画像を動的に更新していくものである。
これにより、当該フレームでは新視点から見て前景の陰に隠れている背景部(隠蔽領域)であっても、その動的更新背景バッファから画像を持ってくることによって、隠蔽領域のより少ない任意視点映像が生成できることになる。
松村篤志,内藤整,川田亮一,小池淳,松本修一"任意視点動画像の高圧縮伝送を目的とした隠蔽領域補完方式の提案"電子情報通信学会技術報告 Vol. OIS2003-41, IE2003-66 Sep.2003. pp.63-68 松村篤志,内藤整,川田亮一,小池淳,松本修一"複数枚の背景バッファを用いた自由視点動画像に対する高精度な補完方式"映像情報メディア学会冬季大会 No.8-8, Dec. 2003.
しかしながら、前記の従来技術では、図1(a)に示すように、前記背景バッファ1に記録される背景の映像は、背景は平面であることを仮定している。そのため、背景バッファ1に記録される背景の映像と実際の奥行が連続的に変化している背景の画像2とにはずれが生じ、例えば人物の陰に隠れた地面などの奥行が連続的に変化している部分の隠蔽領域についてはうまく補完することができず、新視点映像にずれが生じてしまうという課題があった。
本発明の目的は、前記した従来技術の課題を解消し、奥行が連続的に変化している部分の隠蔽領域の画像についても高精度に生成できる自由視点映像の隠蔽領域補完装置を提供することにある。
また、他の目的は、背景が激しく動いた場合にも正確な奥行値を求めて、任意視点からの画像を高精度に生成できる自由視点映像の隠蔽領域補完装置を提供することにある。
前記の目的を達成するために、本発明は、参照画像とそれに対応する予め与えられている奥行値(基準面からの奥行の大きさ)を記録した奥行マップとから仮の自由視点画像を生成する自由視点画像生成部と、前記参照画像と前記奥行マップとから、該参照画像を奥行値に基づいて分割し、該分割した結果に従って該参照画像の背景領域を抽出する背景領域抽出部と、前記背景領域抽出部で抽出された背景領域で構成される背景画像とそれに対応する奥行を保存する曲面背景バッファと、前記自由視点画像生成部で生成された仮の自由視点画像を、前記曲面背景バッファに保存された背景画像と奥行とで補完することにより前記仮の自由視点画像の隠蔽領域を補完する補完部とを有し、視点の位置又は視線の向きが動いた自由視点画像を生成する場合には、前記曲面背景バッファに保存されている奥行、該自由視点画像の新たな基準面に射影変換して補正し該新たな基準面から測った奥行値に更新することを特徴とする自由視点画像の隠蔽領域補完装置を提供する点に特徴がある。
本発明によれば、背景バッファに格納された背景と実際の背景との間の位置のずれを減少または零にさせることができるので、奥行が連続的に変化している部分の隠蔽領域の画像についても高精度に生成できるようになる。
また、背景が激しく動いた場合でも、正確な奥行値を求めることができるようになる。
この結果、任意視点からの映像を高精度に生成することが可能になる。
以下に、図面を参照して、本発明を詳細に説明する。まず、本発明の原理を説明する。
本発明では、背景バッファに背景の映像のみならずその奥行値も記録するものであり、図1(b)に示されているように、背景バッファ3に格納された背景の形状を、奥行画像に基づく実際の形状と一致させることにより、背景バッファ3に格納された背景と実際の背景2との間の位置のずれを減少させるものである。なお、以降では、必要に応じて、この背景バッファ3を「曲面背景バッファ3」と呼ぶ。該曲面背景バッファ3は、従来の背景バッファ1が映像のみを記録する「平面背景バッファ」に対するものである。
次に、本発明の第1の実施形態を図2を参照して説明する。図2は、本発明の実施形態に係る自由視点画像の隠蔽領域補完方式における処理手順を示すフロー図である。この処理手順の各ステップはハードウエアあるいはソフトウエアで実現できる。
図2に示すように、本発明では、まず、参照画像と奥行マップから各フレームの仮の自由視点画像を生成する(S1)。同時に、参照画像と奥行マップから背景領域を抽出する(S2)。この背景領域の抽出では、曲面単層背景バッファおよび曲面多層背景バッファの両者に保存する背景画像とその奥行値とを背景領域として抽出する。
ここで、図3は前記参照画像の一例、図4は該参照画像の背景画像の奥行の概念図を示す。該奥行の概念図では、白黒の濃淡で奥行の大きさを示し、濃度が濃いほど奥行値が大きいことを示している。
次に、抽出された背景画像とその奥行値とを、曲面単層背景バッファおよび曲面多層背景バッファに保存する。ここに保存される背景画像とその奥行値は、後続のフレームごとに抽出した最新の背景画像とその奥行値で更新される。すなわち、背景画像とその奥行値は曲面単層背景バッファおよび曲面多層背景バッファに動的に生成・更新される(S3)。
ここで、図5は従来手法の平面背景バッファの概念図を示し、図6は本発明手法による曲面背景バッファの概念図を示す。図5には、奥行がない背景画像が示されているが、図6には奥行のある背景画像が示されている。
このように動的に生成・更新された背景画像とその奥行値を用いることにより、参照画像における前景領域で隠蔽されていた背景領域に対する画素をより完全に補完できる。なお、1フレーム分前の画像から抽出される背景画像とその奥行値あるいは数フレーム前以降の画像から抽出される背景画像とその奥行値により生成、更新される背景画像とその奥行値を用いてもある程度の画素補完は可能である。
再度、図2に戻ると、次に、前記S1で生成された仮の自由視点画像を曲面多層背景バッファに保存した背景画像とその奥行値で補完し(S4−1)、続いて、これにより補完されない画素を曲面単層背景バッファに保存した背景画像とその奥行値で補完する(S4−2)。以上の手順により曲面多層背景バッファを用いた補完方法および曲面単層背景バッファを用いた補完方法の各長所を取り入れた広範囲かつ高精度の補完を行うことができる。
以下に、上記処理手順の各ステップについて詳細に説明する。
1.仮の自由視点画像の生成(S1)
まず、参照画像Iを撮影した視点から自由視点への回転、および平行移動を3×3の行列R′、および1×3のベクトルt′として定義すると、参照画像Iにおける画素の位置(u,v,1)と自由視点画像Aにおけるその画素に対応する画素(以下、対応点と称す。)の位置(u″,v″、1)との関係は、式(1)によって表される。ここで、DI(u,v)は参照画像Iにおける画素の位置(u,v)の奥行値を表し、(u,v,1)や(u″,v″、1)は3次元上での画素の位置を表す。なお、奥行値の単位は奥行マップの定義に従うものとする。
(DI(u,v)(u,v,1)−t′)×R′(u″,v″,1)=0 (1)
式(1)を(u″,v″,1)について解くことにより、参照画像Iと自由視点画像Aとの間の対応点を求めることができる。この対応関係で式(2)により描画を行い、仮の自由視点画像Aを生成する。なお、式(2)において、A(u″,v″)は自由視点画像Aの位置(u″,v″)の画素値を表し、I(u,v)は参照画像Iの位置(u,v)の画素値を表す。
A(u″,v″)=I(u,v) (2)
2.背景領域の抽出(S2)
背景領域の抽出は、曲面多層背景バッファおよび単層背景バッファに保存する背景画像を抽出する処理であり、背景画像の生成・更新の前処理として行われる。ここでは、まず、式(3)を用いて参照画像Iの奥行分布の統計をとる。式(3)の右辺は、参照画像Iにおける奥行がnS以上、(n+1)S未満である画素の個数を意味し、Sは統計をとる際のステップ幅を表す。また、nは整数である。
次に、式(3)で求められたV(n)をガウスフィルタで平滑化し、V′(n)を算出する。ここで、V′(n)が極小値をとる際の奥行を分割指標(Sの整数倍数とする。)として定義し、値が小さい順に分割指標min,min,・・・,minを生成する。最後に、式(4)に従って参照画像Iを複数の画像I(m=0,1,・・・,M)に分割する。なお、式(4)において、nullは画素が存在しないことを表す。また、min=−∞、minM+1=∞とする。この複数の画像I(m=1,・・・,M)は、後述する多層背景バッファ内の背景画像の生成・更新のために使用される。
さらに、式(5)で生成される画像Iallを定義する。画像Iallは、曲面単層背景バッファ内の背景画像の生成・更新のために使用される。
3.曲面背景バッファの生成・更新(S3)
ここでは、背景領域の抽出(S2)で抽出された画像I(m=1,・・・,M,all)を曲面背景バッファ(曲面多層背景バッファおよび曲面単層背景バッファ)に保存し、それをフレームごとに更新する。画像I(m=1,・・・,M,all)のそれぞれに背景バッファU(m=1,・・・,M,all)が対応するとする。なお、画像Iは前景画像であるため、それに対応する背景バッファUは存在しない。
先頭フレームでは、画像Iを背景バッファUにそのまま保存する。続く他のフレームでは、画像Iと背景バッファUに保存された画像の合成を以下の手順で行う。
まず、画像Iと背景バッファUに保存された曲面背景画像から8点以上の対応点を探索し、それらの対応点を用いて式(6)を満たす射影変換行列Bを算出する。ただし、画像I内の座標(uIm ,vIm)と背景バッファUに保存されている画像内の座標(u′Um ,v′Um)は対応点であるとする。
(uIm ,vIm ,1)T×(u′Um ,v′Um ,1)=0 ・・・(6)
その後、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を式(7)に代入することにより、背景バッファU(m=1,・・・,M,all)に保存した曲面背景画像を更新する。
また、画像I内の座標(uIm ,vIm)における奥行値をDIm(uIm ,vIm)とおき、背景バッファU内の座標(u′Um ,v′Um)における奥行値をDUm(u′Um ,v′Um)とおくと、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を式(8)に代入することにより、背景バッファUにおける奥行値DUm(m=1,・・・,M,all)の値を更新する。
4.出力画像の生成(S4,S5)
仮の自由視点画像Aを背景バッファU(m=1,・・・,M,all)に保存された背景画像およびその奥行値を用いて補完することにより出力画像を生成する。補完は、対応点が存在しない画素に対して行う。
まず、曲面多層背景バッファを用いた補完を行うために、m=1,・・・,Mとして、曲面背景画像U内の座標(u′Um ,v′Um)の点に対応する仮の自由視点画像Aの座標(u″,v″)の点式(9)により算出する。
(DUm(u′Um ,v′Um ,1)(u′Um ,v′Um ,1)−t)×R(u ″,v″,1)=0 ・・・(9)
ただし、行列Rは視点の回転移動を定義し、ベクトルtは視点の平行移動を定義する。
次に、(9)式によって求められる(u″,v″)と(u′Um ,v′Um)の対応を式(10)に代入することにより、自由視点画像Aに対する補完を行う。
さらに、曲面単層背景バッファを用いた補完を行うために、m=allとして、上記と同様に、対応点を算出し、この対応点を用いて自由視点画像Aに対する補完を行う。なお、曲面単層背景バッファを用いた補完は、A(u″,v″)=nullの画素、すなわち、曲面多層背景バッファを用いた補完では補完されずに残っている画素に対して行われる。以上によって得られる画像を出力画像として出力する。
図7(a)、(b)および(c)の各々に、背景画像を補完しなかった場合(従来)、平面背景バッファで補完した場合(従来)および曲面背景バッファで補完した場合(本発明)の任意視点映像の具体例を示す。図7(a)では隠蔽領域が残り、同図(b)では背景画像の一部が下の方にずれているのに対して、同図(c)では該下方向にずれていた背景画像が他部の背景画像とほぼ整合していることが分かる。すなわち、本発明によれば、奥行が連続的に変化している部分の隠蔽領域についても高精度に任意の視点映像を生成することができる。
次に、本発明の第2の実施形態を以下に説明する。この実施形態は、例えばカメラの位置が急激に動いた場合、換言すれば背景が激しく動いた場合でも、正確な奥行値を求めることができるようにするものである。
この課題を達成するために、本実施形態では、前記第1の実施形態における奥行値を奥行画像に射影変換して補正することにより、正確な奥行値を求めるようにした。
具体的には、前記式(7)の後の文「また、画像I内の座標(uIm ,vIm)における奥行値をDIm(uIm ,vIm)とおき、背景バッファU内の座標(u′Um ,v′Um)における奥行値をDUm(u′Um ,v′Um)とおくと、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を式(8)に代入することにより、背景バッファUにおける奥行値DUm(m=1,・・・,M,all)の値を更新する。」を、次の文に置き換える処理をする。これ以外の処理は第1の実施形態における処理と同じであるので、説明を省略する。
すなわち、「また、画像I内の座標(uIm ,vIm)における奥行値をDIm(uIm ,vIm)、背景バッファU内の座標(u′Um ,v′Um)における奥行値をDUm(u′Um ,v′Um)とおき、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を求め、式(7)’を使って奥行値DIM(uIm ,vIm)を算出する。
IM(uIm ,vIm)(uIm ,vIm ,1)
=BUm(u′Um ,v′Um)(u′Um ,v′Um ,1)・・・(7)’
このDIM(uIm ,vIm)を式(8)に代入することにより、背景バッファUにおける奥行値DUm(m=1,・・・,M,all)の値を更新する。」。なお、これ以外の処理は第1の実施形態における処理と同じであるので、説明を省略する。
この第2実施形態は、カメラ位置を、図8の左側のカメラ位置から右側のカメラ位置に急激に移動すると、実際の奥行値(背景バッファの奥行値)と奥行き画像の奥行値とが一致しなくなるのを補正して、一致するようにするものである。すなわち、実際の奥行値が奥行き基準面に対する奥行値と等しくなるように、該実際の奥行値を補正する。
以上、実施形態を説明したが、本発明は種々の形態で実施できる。例えば、送信側から参照画像と奥行マップを送信し、送信された参照画像と奥行マップを用いて受信側で自由視点画像を生成することができ、本発明は、放送受信機、映像受信機としての携帯端末などに適用できる。
従来の背景バッファと本発明による曲面背景バッファの概念図である。 本発明の第1の実施形態の自由視点画像の隠蔽領域補完方式の処理手順を示すフロー図である。 参照画像の一具体例を示す図である。 図3に対応する奥行画像の概念図である。 従来手法による背景バッファの一具体例を示す図である。 本発明手法による曲面背景バッファの一具体例を示す図である。 背景画像を補完しなかった場合(a)、平面背景バッファで補完した場合(b)および曲面背景バッファで補完した場合(c)の任意視点映像の一具体例を示す図である。 本発明の第2の実施形態における奥行値の補正の説明図である。
符号の説明
S1・・・仮の自由視点画像の生成、S2・・・背景領域の抽出、S3・・・曲面背景バッファの生成・更新、S4−1・・・仮の自由視点画像の補完、S4−2・・・仮の出力画像の補完。

Claims (1)

  1. 参照画像とそれに対応する予め与えられている奥行値(基準面からの奥行の大きさ)を記録した奥行マップとから仮の自由視点画像を生成する自由視点画像生成部と、
    前記参照画像と前記奥行マップとから、該参照画像を奥行値に基づいて分割し、該分割した結果に従って該参照画像の背景領域を抽出する背景領域抽出部と、
    前記背景領域抽出部で抽出された背景領域で構成される背景画像とそれに対応する奥行を保存する曲面背景バッファと、
    前記自由視点画像生成部で生成された仮の自由視点画像を、前記曲面背景バッファに保存された背景画像と奥行とで補完することにより前記仮の自由視点画像の隠蔽領域を補完する補完部とを有し、
    視点の位置又は視線の向きが動いた自由視点画像を生成する場合には、前記曲面背景バッファに保存されている奥行、該自由視点画像の新たな基準面に射影変換して補正し該新たな基準面から測った奥行値に更新することを特徴とする自由視点画像の隠蔽領域補完装置。
JP2004349703A 2004-10-20 2004-12-02 自由視点映像の隠蔽領域補完装置 Expired - Fee Related JP4591955B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004349703A JP4591955B2 (ja) 2004-10-20 2004-12-02 自由視点映像の隠蔽領域補完装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004305656 2004-10-20
JP2004349703A JP4591955B2 (ja) 2004-10-20 2004-12-02 自由視点映像の隠蔽領域補完装置

Publications (2)

Publication Number Publication Date
JP2006146846A JP2006146846A (ja) 2006-06-08
JP4591955B2 true JP4591955B2 (ja) 2010-12-01

Family

ID=36626419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004349703A Expired - Fee Related JP4591955B2 (ja) 2004-10-20 2004-12-02 自由視点映像の隠蔽領域補完装置

Country Status (1)

Country Link
JP (1) JP4591955B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9253416B2 (en) * 2008-06-19 2016-02-02 Motorola Solutions, Inc. Modulation of background substitution based on camera attitude and motion
KR101648206B1 (ko) * 2008-09-25 2016-08-12 코닌클리케 필립스 엔.브이. 3차원 이미지 데이터 처리
US8565479B2 (en) 2009-08-13 2013-10-22 Primesense Ltd. Extraction of skeletons from 3D maps
US8594425B2 (en) 2010-05-31 2013-11-26 Primesense Ltd. Analysis of three-dimensional scenes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057350A (ja) * 1998-08-10 2000-02-25 Toshiba Corp 画像処理装置と方法及び画像送信装置と方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057350A (ja) * 1998-08-10 2000-02-25 Toshiba Corp 画像処理装置と方法及び画像送信装置と方法

Also Published As

Publication number Publication date
JP2006146846A (ja) 2006-06-08

Similar Documents

Publication Publication Date Title
CN107438866B (zh) 深度立体:学习从现实世界形象预测新视图
US10542249B2 (en) Stereoscopic video generation method based on 3D convolution neural network
EP2507768B1 (en) Method and system of generating a three-dimensional view of a real scene for military planning and operations
CN109308719B (zh) 一种基于三维卷积的双目视差估计方法
KR100813100B1 (ko) 실시간 확장 가능한 스테레오 매칭 시스템 및 방법
US8478024B2 (en) Depth map generation module for foreground object and method thereof
JP2005235211A (ja) 中間時点の画像合成方法及びそれを適用した3dディスプレイ装置
JP2013225740A (ja) 画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラム
US9865083B2 (en) Apparatus and method for inpainting three-dimensional stereoscopic image
KR101181199B1 (ko) 배경 지형 장면의 입체 이미지 생성 방법, 시스템 및 이를 위한 기록매체
US9661307B1 (en) Depth map generation using motion cues for conversion of monoscopic visual content to stereoscopic 3D
KR20080052363A (ko) 객체/배경 분리 및 영상분할을 이용한 양안/다시점스테레오 정합 장치 및 그 방법
KR100943635B1 (ko) 디지털카메라의 이미지를 이용한 디스패리티 맵 생성 장치 및 방법
JP4591955B2 (ja) 自由視点映像の隠蔽領域補完装置
JP2006041811A (ja) 自由視点画像ストリーミング方式
JP4707093B2 (ja) 自由視点映像生成システム
WO2023171336A1 (ja) 学習方法、情報処理装置、および記録媒体
CN111951310A (zh) 双目立体匹配方法、视差图获取装置和计算机存储介质
KR102122523B1 (ko) 3차원 입체 영상용 깊이지도 보정장치 및 보정방법
JP2019149112A (ja) 合成装置、方法及びプログラム
CN109379577B (zh) 一种虚拟视点的视频生成方法、装置及设备
US10078905B2 (en) Processing of digital motion images
CN109089100B (zh) 一种双目立体视频的合成方法
JP4208142B2 (ja) 自由視点画像の隠蔽領域補完方式
Atokari et al. Parallax-tolerant 360 live video stitcher

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100728

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100908

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100909

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees