JP4600993B2 - 自由視点映像生成システム - Google Patents

自由視点映像生成システム Download PDF

Info

Publication number
JP4600993B2
JP4600993B2 JP2005237427A JP2005237427A JP4600993B2 JP 4600993 B2 JP4600993 B2 JP 4600993B2 JP 2005237427 A JP2005237427 A JP 2005237427A JP 2005237427 A JP2005237427 A JP 2005237427A JP 4600993 B2 JP4600993 B2 JP 4600993B2
Authority
JP
Japan
Prior art keywords
image
background
depth
free viewpoint
generation system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005237427A
Other languages
English (en)
Other versions
JP2007052644A (ja
Inventor
彰夫 石川
亮一 川田
淳 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2005237427A priority Critical patent/JP4600993B2/ja
Publication of JP2007052644A publication Critical patent/JP2007052644A/ja
Application granted granted Critical
Publication of JP4600993B2 publication Critical patent/JP4600993B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)

Description

本発明は自由視点映像生成システムに関し、特に2次元映像とその奥行き映像を用いて任意の仮想視点から見た映像を生成する場合に好適な自由視点映像生成システムに関する。
2次元映像と対応する奥行き情報から、任意の仮想視点から見た画像を生成する、自由視点映像生成に関しては、従来、動的に更新される背景バッファを用いる下記のようなものがある(特許文献1,2)。
これらの方法は、動画像であることを利用し、仮想視点から見て物体の陰に隠れている背景部(隠蔽領域)であっても、過去のフレームにある背景情報を持ってくることによって、隠蔽領域のより少ない任意視点映像を生成する。
下記の非特許文献1のものでは、背景の抽出は、背景マスクを用いて行う。
特開2005−63300公報 特開2005−215848号公報 石川彰夫、川田亮一、小池淳、"自由視点VoD映像の高画質化のための奥行き情報の伝送方式"、信学技報IE2005−4,pp.19〜24、2005年4月、
しかしながら、上記特許文献1,2の発明では、2次元映像とその奥行き映像のデータ量が多く、携帯端末などの比較的狭帯域な通信では実時間の伝送が困難である。そこで、2次元映像と奥行き映像をH.264により圧縮し、背景マスクを一連の動画像とみなして1フレームを1個の動きベクトルで予測する簡易な動き補償とJBIGにより可逆圧縮して伝送することとした。
しかし、これらの圧縮率を高めると、奥行き映像内の輪郭部分(物体と背景の境界など)の周辺にモスキート雑音やブロック雑音などの誤差が多く生じるので、仮想視点が正面以外にある場合、針状の誤差が生じ、合成した自由視点映像の画質が著しく劣化するという課題があることが分かった。
本発明の目的は、前記した従来技術の課題に鑑み、奥行き情報の圧縮率を高めても、高精度に自由視点映像を生成できる自由視点映像生成装置を提供することにある。
前記目的を達成するために、本発明は、2次元映像と、その奥行き値を表す奥行き映像と、該2次元画像の背景領域を抽出する背景マスクとを用いて、任意の視点から見た映像を生成する自由視点映像生成システムにおいて、前記2次元画像および奥行き映像の各画素が、前景領域と背景領域のいずれに属しているかを2値で表した背景マスクと、前記背景マスクを適用して、前記奥行き映像の前記前景領域と背景領域の境界を把握し、該奥行き映像の前景領域又は背景領域の映像に該境界をまたがないように施される平滑化フィルタと、前記2次元画像と前記平滑化フィルタを施された奥行き映像とから、各画素の3次元的な位置情報を求める手段と、選ばれた任意の視点位置情報を基に、前記各画素の3次元的な位置情報から仮の自由視点画像を生成する手段と、前記背景マスクを参照して、前記2次元画像と前記平滑化フィルタを施された奥行き映像とから背景画像と奥行き値を抽出する手段と、該背景画像と奥行き値を用いて、前記2次元画像における前景領域で隠蔽されていた背景領域を補完し、自由視点映像を生成する手段とを具備した点に第1の特徴がある。
また、本発明は、前記平滑化フィルタとして、中央値フィルタまたは平均値フィルタを用いる点に第2の特徴がある。
本発明によれば、背景マスクを用いて過不足の無い正確な背景領域を抽出するので、奥行データを圧縮しても、自由視点映像を高精度に生成できるようになる。
また、物体と背景の境界をまたがずに平滑化フィルタを施すことにより、奥行き情報の圧縮率を高めても、該平滑化フィルタを施さない場合に比べて、自由視点映像の画質を良好にすることができる。
以下に、図面を参照して、本発明を詳細に説明する。この発明は、本発明者による特許出願、特願2005−123580号「自由視点映像生成システム」(以下、先願発明)の改良に係るものであるので、まずこの先願発明についてその概略を説明する。
先願発明は、背景マスクを用いて過不足の無い正確な背景領域を抽出することにより、2次元映像と奥行データを圧縮しても、自由視点映像を高精度に生成できるようにするものである。また、背景マスクを簡易な動き補償とJBIGで圧縮することにより、再構成した自由視点映像の精度を損なうことなく必要なデータ伝送量を低減し、ネットワークの負荷を軽減できるようにするものである。
背景マスクは、グレイスケール映像であり、2次元映像および奥行データの各画素が前景領域と背景領域とのどちらに属しているかという情報を示している。図6に背景マスクの例を示す。2次元映像および奥行データを背景マスクと照らし合わせて、背景マスク上の画素値が「背景」を示す領域を抽出すれば、それが背景領域となる。従って、閾値と奥行値を比較することで背景領域を抽出する従来技術とは異なり、過不足の無い正確な背景領域を抽出することが可能となる。そのため、ユーザが視点を移動した場合も、図11にあるような不自然な領域が、再構成された映像中に生じることが避けられる。
また、背景マスクのデータ圧縮によりデータ伝送量の増加を最小限に留める一方で、背景マスクのデータ圧縮手法にJBIGという可逆的な圧縮手法を用いることにより、前景と背景の境界に破綻を生じる可能性を無くし、奥行データを圧縮して必要なデータ伝送量を低減しても、再構成した自由視点映像の精度を損なわない。
次に、先願発明の実施形態を図5を参照して説明する。図5は、自由視点画像の隠蔽領域補完方式における処理手順を示すフロー図である。この処理手順の各ステップはハードウエアあるいはソフトウエアで実現できる。
図5に示すように、まず、1視点のみからの映像である2次元映像(参照画像)と、該2次元映像の各点の奥行き情報である奥行データ(奥行きマップ)とを圧縮し、また背景マスク映像を簡易な動き補償とJBIGにより圧縮する(S1A〜S1C)。次に、前記2次元映像の圧縮データと奥行データの圧縮データとから、各画素の3次元的な位置情報を把握する(S2)。続いて、ユーザが選んだ任意の視点位置情報(X)を基に、前記2次元映像と奥行データから各フレームの仮の自由視点画像を生成する(S3)。
同時に、前記背景マスクを参照して2次元映像と奥行データから背景領域を抽出する(S4)。この背景領域の抽出では、背景バッファに保存する背景画像とその奥行値とを背景領域として抽出する。
ここで、図7は前記2次元映像の一例、図8は該2次元映像の背景画像の奥行の概念図を示す。該奥行の概念図では、白黒の濃淡で奥行値の大きさを示し、濃度が濃いほど奥行値が大きいことを示している。
次に、抽出された背景画像とその奥行値とを、背景バッファに保存する。ここに保存される背景画像とその奥行値は、後続のフレームごとに抽出した最新の背景画像とその奥行値で更新される。すなわち、背景画像とその奥行値は背景バッファに動的に生成・更新される(S5)。
ここで、図9は背景バッファの概念図を示す。奥行のある背景画像が示されている。
このように動的に生成・更新された背景画像とその奥行値を用いることにより、2次元映像における前景領域で隠蔽されていた背景領域に対する画素をより完全に補完できる。なお、1フレーム分前の画像から抽出される背景画像とその奥行値あるいは数フレーム前以降の画像から抽出される背景画像とその奥行値により生成、更新される背景画像とその奥行値を用いてもある程度の画素補完は可能である。
ここで、サーバ上で背景マスクを生成する方法の一例を説明する。サーバには、未圧縮の2次元映像と奥行きデータがある。まず、式(1)を用いて2次元画像Iの奥行分布の統計をとる。式(1)の右辺は、2次元画像Iにおける奥行値がnS以上、(n+1)S未満である画素の個数を意味し、Sは統計をとる際のステップ幅を表す。また、nは整数である。
次に、式(1)で求められたV(n)をガウスフィルタで平滑化し、V’(n)を算出する。ここで、V’(n)が極小値をとる際の奥行きを分割指標(Sの整数倍数とする)として定義し、値が小さい順に分割指標min1,min2,・・・,minMを生成する。最後に、minm≦DI(u,v)≦min(m+1)を満たす場合は、背景マスクG上の(u,v)の点にmを代入する。すなわち、G(u,v)=0とする。なお、min0=−∞、min(M+1)=∞とする。
再度、図5に戻ると、次に、前記S3で生成された仮の自由視点画像を、前記S5の背景バッファに保存した背景画像とその奥行値で補完する(S6)。以上の手順により背景バッファを用いた広範囲かつ高精度の補完を行い、出力画像を得ることができる(S7)。
図10に、背景マスクを用いた場合(本先願発明)の任意視点画像(映像)の具体例を示す。また、図11に、該背景マスクを用いない従来の任意視点画像(映像)の具体例を示す。
なお、前記ステップS1A〜1C,S2〜S7の処理の詳細については、前記先願発明の明細書に記されているが、本明細書では説明を省略する。
以上のように、先願発明では、背景マスクを用いて背景領域を抽出するので、過不足のない背景領域を抽出することができるが、本発明者の研究により、奥行きデータの圧縮率を高めると、奥行き映像内の輪郭部分(物体と背景の境界など)の周辺にモスキート雑音やブロック雑音などの誤差が多く生じ、仮想視点が正面以外にある場合、針状の誤差が生じ、合成した自由視点映像の画質が著しく劣化するという課題があることが分かった。
以下に、本発明の一実施形態を説明する。図1は、本発明の一実施形態の構成を示すブロック図である。図1において、図5と同一の符号は、同一または同等の機能を示すので、説明を省略する。
ステップS1A〜S1Cで圧縮されたデータは伝送路を経て伝送され、受信側で、展開する処理(S11,S12,S13)を受ける。次いで、展開された奥行き情報は背景マスク映像を参照して平滑フィルタ(S14)を施される。該背景マスク映像を参照するのは、後述するように、物体と背景の境界Pを把握するためである。平滑化フィルタを施された奥行き情報は、ステップS2,S4へ送られる。
本発明の要点は、奥行き情報にこの平滑フィルタ(S14)を施すことにある。該平滑フィルタを施すにあたって、物体と背景の境界をまたいで平滑化フィルタを施すと、両者の奥行き値が連続に変化するようになって両領域が連結してしまい、かえって誤った映像が合成されてしまう可能性がある。そこで、本実施形態では、図2に示されているように、背景マスクに基づき物体と背景の境界Pを把握し、該境界Pにまたがって前記平滑フィルタを施さないようにする。
図2は、前記物体と背景の境界Pを含む画像の一部の拡大図であり、碁盤状の升目は画素Aを示す。図示の例では、左右方向の5個の画素の大きさからなる平滑化ウィンドウ1a、1b、・・・を定義し、該平滑化ウィンドウ1a、1b、・・・内の画素に平滑化フィルタを施して目標画素の値を決定する。この時、平滑化ウィンドウ1a、1b、・・・が、前記境界Pをまたがないように、前記物体の内部または背景の内部に設定する。なお、平滑化ウィンドウは上下方向にも定義することができる。平滑化ウィンドウを左右方向と上下方向とに定義し、それぞれに平滑化フィルタを施すことにより、斜めや左右方向の境界Pに対しても、平滑化処理ができる。また、平滑化ウィンドウの大きさは、前記5個の画素に限定されず、3個の画素の大きさ、あるいは7個の画素の大きさであっても良い。平滑化フィルタとしては、中央値フィルタ、平均値フィルタなどを用いることができる。
本発明者が、本発明を適用して、2種類のコンテンツ(図7の「ゴルフ2」画像および不図示の「フラメンコ2」画像)に対して行った実験結果を図3(a)、(b)、図4(a),(b)に示す。図3、図4は、具体的には、2次元映像と奥行き映像に施すH.264のQP値を変えて圧縮し、出力画像のPSNRを調べたものであり、横軸にQP値、縦軸にPSNRが取られている。
図3(a)、(b)は、同じタップ数3で、平滑化フィルタとして、中央値フィルタと平均値フィルタを用いた場合、および平滑化フィルタを用いない場合のPSNRを示したグラフである。図3(a)のグラフでは、QP値が15以上になると、平滑化フィルタを用いた方が用いない場合よりもPSNRが高くなり、図3(b)のグラフでは、QP値が30以上になると、平滑化フィルタを用いた方が用いない場合よりもPSNRが高くなることが分かる。また、平均値フィルタを用いるよりも、中央値フィルタを用いた方が高いPSNRを示すことが分かる。なお、タップ数は平滑化フィルタが施される画素数(前記平滑化ウィンドウの大きさ)を示し、タップ数3であれば3画素を示す。
図4(a)、(b)は、中央値フィルタのタップ数を変えた場合のPSNRを示す。図4(a)、(b)の両方において、タップ数が小さい方が高いPSNRを示した。また、最もPSNRが高いタップ数3の中央値フィルタを用いた場合で比較すると、QP値が15〜30以上で、フィルタを用いない場合に対してPSNRが約2〜3dB上回った。
以上のことから、奥行き情報の圧縮率を高めた場合でも、物体と背景の境界をまたがずに平滑化フィルタを施すと、該平滑化フィルタを施さない場合に比べて、自由視点映像の画質が良好になることが分かった。
以上、実施形態を説明したが、本発明は種々の形態で実施できる。例えば、送信側から2次元映像と奥行データを送信し、送信された2次元映像と奥行データを用いて受信側で自由視点画像を生成することができ、本発明は、放送受信機、映像受信機としての携帯端末などに適用できる。
本発明の一実施形態の自由視点映像生成システムの処理手順を示すフローチャートである。 本発明に使用する平滑化フィルタの説明図である。 タップ数3で、平滑化フィルタとして、中央値フィルタと平均値フィルタを用いた場合、および平滑化フィルタを用いない場合のPSNRを示したグラフである。 中央値フィルタのタップ数を変えた場合のPSNRを示すグラフである。 本発明の一実施形態の自由視点映像生成システムの処理手順を示すフローチャート図である。 背景マスクの一具体例を示す図である。 2次元映像の一具体例を示す図である。 図7に対応する奥行データの概念図である。 本発明手法による背景バッファの一具体例を示す図である。 背景マスクを用いた自由視点映像の一具体例を示す図である。 従来システムによる自由視点映像の一具体例を示す図である。
符号の説明
S1・・・圧縮、S3・・・仮の自由視点画像の生成、S4・・・背景領域の抽出、S5・・・背景バッファの生成と更新、S6・・・仮の自由視点画像の補完、S7・・・出力画像 S11、S12、S13・・・展開、S14・・・平滑化フィルタ。

Claims (5)

  1. 2次元映像と、その奥行き値を表す奥行き映像と、該2次元画像の背景領域を抽出する背景マスクとを用いて、任意の視点から見た映像を生成する自由視点映像生成システムにおいて、
    前記2次元画像および奥行き映像の各画素が、前景領域と背景領域のいずれに属しているかを2値で表した背景マスクと、
    前記背景マスクを適用して、前記奥行き映像の前記前景領域と背景領域の境界を把握し、該奥行き映像の前景領域又は背景領域の映像に該境界をまたがないように施される平滑化フィルタと、
    前記2次元画像と前記平滑化フィルタを施された奥行き映像とから、各画素の3次元的な位置情報を求める手段と、
    選ばれた任意の視点位置情報を基に、前記各画素の3次元的な位置情報から仮の自由視点画像を生成する手段と、
    前記背景マスクを参照して、前記2次元画像と前記平滑化フィルタを施された奥行き映像とから背景画像と奥行き値を抽出する手段と、
    該背景画像と奥行き値を用いて、前記2次元画像における前景領域で隠蔽されていた背景領域を補完し、自由視点映像を生成する手段と、
    を具備したことを特徴とする自由視点映像生成システム。
  2. 請求項1に記載の自由視点映像生成システムにおいて、
    前記平滑化フィルタは、中央値フィルタまたは平均値フィルタであることを特徴とする自由視点映像生成システム。
  3. 請求項2に記載の自由視点映像生成システムにおいて、
    前記平滑化フィルタは、前記奥行き映像に、左右方向または上下方向に平滑化フィルタを施すことを特徴とする自由視点映像生成システム。
  4. 請求項3に記載の自由視点映像生成システムにおいて、
    前記平滑化フィルタは、3,5または7画素に対して施すことを特徴とする自由視点映像生成システム。
  5. 請求項1ないし4のいずれかに記載の自由視点映像生成システムにおいて、
    前記奥行き映像は、非可逆圧縮されていることを特徴とする自由視点映像生成システム。
JP2005237427A 2005-08-18 2005-08-18 自由視点映像生成システム Expired - Fee Related JP4600993B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005237427A JP4600993B2 (ja) 2005-08-18 2005-08-18 自由視点映像生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005237427A JP4600993B2 (ja) 2005-08-18 2005-08-18 自由視点映像生成システム

Publications (2)

Publication Number Publication Date
JP2007052644A JP2007052644A (ja) 2007-03-01
JP4600993B2 true JP4600993B2 (ja) 2010-12-22

Family

ID=37917051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005237427A Expired - Fee Related JP4600993B2 (ja) 2005-08-18 2005-08-18 自由視点映像生成システム

Country Status (1)

Country Link
JP (1) JP4600993B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2375746A1 (en) 2010-03-31 2011-10-12 Deutsche Telekom AG Method for encoding texture data of free viewpoint television signals, corresponding method for decoding and texture encoder and decoder
US8594425B2 (en) * 2010-05-31 2013-11-26 Primesense Ltd. Analysis of three-dimensional scenes
JP6188005B2 (ja) * 2012-06-21 2017-08-30 大学共同利用機関法人情報・システム研究機構 濃淡画像符号化装置及び復号装置
JP6033625B2 (ja) * 2012-09-28 2016-11-30 シャープ株式会社 多視点画像生成装置、画像生成方法、表示装置、プログラム、及び、記録媒体
CN114189697B (zh) * 2021-12-03 2022-10-14 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置以及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002300373A (ja) * 2001-03-30 2002-10-11 Minolta Co Ltd 画像処理方法、画像処理装置、記録媒体及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002300373A (ja) * 2001-03-30 2002-10-11 Minolta Co Ltd 画像処理方法、画像処理装置、記録媒体及びプログラム

Also Published As

Publication number Publication date
JP2007052644A (ja) 2007-03-01

Similar Documents

Publication Publication Date Title
EP2230855B1 (en) Synthesizing virtual images from texture and depth images
Conze et al. Objective view synthesis quality assessment
US8384763B2 (en) Generating a depth map from a two-dimensional source image for stereoscopic and multiview imaging
US11902577B2 (en) Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
EP3922032B1 (en) Quantization step parameter for point cloud compression
KR100524077B1 (ko) 중간 영상 합성을 위한 시간적 평활화 장치 및 방법
US8355596B2 (en) Image generation method and apparatus, program therefor, and storage medium which stores the program
EP3375190B1 (en) High dynamic range color conversion correction
WO2011008239A1 (en) Contrast enhancement
Do et al. Quality improving techniques for free-viewpoint DIBR
JPH09275578A (ja) 多視点画像符号化装置および復号装置
JP4600993B2 (ja) 自由視点映像生成システム
JP2012249038A (ja) 画像信号処理装置、画像信号処理方法
JPH0993614A (ja) 3次元画像符号化装置
Smirnov et al. Methods for depth-map filtering in view-plus-depth 3D video representation
Lai et al. Improving view rendering quality and coding efficiency by suppressing compression artifacts in depth-image coding
Gao et al. Occlusion-aware depth map coding optimization using allowable depth map distortions
JP4707093B2 (ja) 自由視点映像生成システム
Kao Stereoscopic image generation with depth image based rendering
US20120170841A1 (en) Image processing apparatus and method
KR100914171B1 (ko) 휴대 방송에서의 3차원 서비스를 위한 깊이 영상 기반렌더링 장치 및 방법
Vosters et al. Evaluation of efficient high quality depth upsampling methods for 3DTV
KR101656160B1 (ko) 인식 표현을 사용한 인코딩 및 디코딩
KR101574418B1 (ko) 은닉 마코프 모델과 주성분 분석을 이용한 블록형 재깅 결함 제거 장치 및 방법
Gao et al. Disocclusion filling for depth-based view synthesis with adaptive utilization of temporal correlations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100922

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100924

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131008

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4600993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees