JP5706826B2 - 3d画像信号を符号化する方法及びシステム、符号された3d画像信号、3d画像信号を復号する方法及びシステム - Google Patents

3d画像信号を符号化する方法及びシステム、符号された3d画像信号、3d画像信号を復号する方法及びシステム Download PDF

Info

Publication number
JP5706826B2
JP5706826B2 JP2011533918A JP2011533918A JP5706826B2 JP 5706826 B2 JP5706826 B2 JP 5706826B2 JP 2011533918 A JP2011533918 A JP 2011533918A JP 2011533918 A JP2011533918 A JP 2011533918A JP 5706826 B2 JP5706826 B2 JP 5706826B2
Authority
JP
Japan
Prior art keywords
data
layer
foreground
display area
layers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011533918A
Other languages
English (en)
Other versions
JP2012507908A5 (ja
JP2012507908A (ja
Inventor
クリスティアン ベニエン
クリスティアン ベニエン
バルト ジー ビー バレンブルグ
バルト ジー ビー バレンブルグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2012507908A publication Critical patent/JP2012507908A/ja
Publication of JP2012507908A5 publication Critical patent/JP2012507908A5/ja
Application granted granted Critical
Publication of JP5706826B2 publication Critical patent/JP5706826B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、3D画像符号化及び復号の分野に関する。これは、3D画像信号を符号化する方法及びシステムを示す。本発明は、3D画像信号を復号する方法及びシステムにも関する。本発明は、符号化された3D画像信号にも関する。
近年、3D画像ディスプレイ上で3D画像を提供することに多くの関心がある。3Dイメージングは、カラーイメージングの後に、イメージングにおける次の大きなイノベーションであると信じられている。現在、消費者市場に対する3Dディスプレイの導入が到来するところである。
3D表示装置は、通常、画像が表示されるディスプレイスクリーンを持つ。基本的には、三次元印象は、ステレオ画像、すなわち観察者の2つの目に向けられた2つのわずかに異なる画像を使用することにより作成されることができる。このような装置の例は、オートステレオスコピックディスプレイである。他の装置において、画像は全ての方向に送られ、眼鏡が、3D知覚を与えるように特定の画像をブロックするのに使用される。
どのようなタイプの3Dディスプレイが使用されても、3D画像情報は、前記表示装置に与えられなくてはならない。これは、通常は、デジタルデータを有する3D画像信号の形式で行われる。
3D画像の生成は、従来は、深度マップを加えることにより行われ、前記深度マップは、前記画像内の画素の深度に関する情報を与え、したがって3D情報を与える。画像に対する深度マップを使用すると、左画像及び右画像は、"Real-time rendering with layered depth images"と題された米国特許第6466207号に開示されるように構成され、3D画像を提供する。代替的には、例えば、マルチビューオートステレオスコピックディスプレイを使用する場合、2より多いビューが、三次元シーンを視覚化する際に使用するために構成されることができる。
コンテンツがディスプレイ上に表示される場合、複数のビューが、レンダリングされなくてはならず、これらは、異なる方向に送られる。観察者は、両目に異なる画像を持ち、これらの画像は、前記観察者が深度を知覚するようにレンダリングされる。異なるビューは、異なる観察位置を表す。しかしながら、入力データにおいて、通常は、しばしば、1つの視角が見える。したがって、レンダリングされたビューは、例えば前景オブジェクトの後ろのエリアの情報又はオブジェクトの側部に関する情報を紛失している。異なる方法が、この紛失した情報に対処するために存在する。解決法は、前景オブジェクトの後ろに隠れている前記3D画像の部分を表す他のデータ層の形式でデータを前記信号に加えることである。この背景情報は、同じ視角から記憶される。3D画像において多くのオブジェクトが互いの後ろに配置される場合に、背景情報の1より多い層が存在しうる。
このような方法において、3Dディスプレイに対するコンテンツは、多層表現で記憶される。この多層表現は、単一のカメラの始点から前記シーンをキャプチャし、層の助けで第3の次元を表す。このような層は、透明性を含むことができる。しばしば、各層は、対応する深度マップを与えられる。前景層の後ろの層は、通常は、`遮蔽(occlusion)層'と称される。
発明者は、現在の方法において、3D画像の正確な構築に有用な遮蔽情報の一部が、遮蔽層に表されることができることを発見した。これは、紛失した情報が何らかの他の方法でレンダリングされなくてはならず、通常は前記紛失した情報のコンテンツを推定する何らかの方法を生じるので、3Dイメージングの品質を低減する。このような方法がどんなにインテリジェントであろうとも、前記紛失した情報は、一般に、単に実際のコンテンツの近似であり、画像エラー及び不完全な3D画像の可能性を生じる。
したがって、本発明の目的は、改良された3Dイメージングを可能にする3D画像データを符号化する方法を提供することである。
他の目的は、3D画像信号を符号化する改良されたシステム、3D画像信号を復号するシステム及び3D画像信号を提供することである。
このために、本発明による符号化方法は、3D画像信号が符号化され、前記符号化された3D画像信号が、基準ビューデータ層、及び前記基準ビューデータ層に対する1以上の他のデータ層を有し、前記基準ビュー及び1以上の他のデータ層により覆われる表示エリア(viewing area)が、サイズ及び/又は形状において異なり、前記基準ビュー表示エリアと前記1以上の他の層の表示エリアとの間の関係を表すスケーリングデータが、生成されることを特徴とする。
本発明による符号化システムにおいて、基準ビューデータ層及び1以上の他のデータ層を有する3D画像信号が符号化され、前記基準ビューデータ層及び前記1以上の他のデータ層により覆われる表示エリアのサイズ及び/又は形状が異なり、前記基準ビュー表示エリアと前記1以上の他の層の表示エリアとの間の関係を表すスケーリングデータが生成される。
本発明による3D画像信号は、3D画像信号を有し、前記3D画像信号は、基準ビューデータ層及び1以上の他のデータ層を有し、前記基準ビューデータ層及び前記1以上の他のデータ層により覆われる表示エリアが、サイズ及び/又は形状において異なり、前記3D画像信号が、前記基準ビュー表示エリアと前記1以上の他の層の表示エリアとの間の関係を表すスケーリングデータを有する。
本発明による復号システムは、基準ビューデータ層及び1以上の他のデータ層を有する3D画像に対する入力を有し、様々なデータ層により覆われる表示エリアのサイズ及び/又は形状は異なり、前記3D画像信号は、前記基準ビュー表示エリアと前記1以上の他の層の表示エリアとの間の関係を表すスケーリングデータを有し、前記復号システムは、前記スケーリングデータに依存して2以上のデータ層により覆われた表示エリアを制御する手段を有する。
現在の2Dプラス深度フォーマットにおいて、遮蔽層及び深度マップは、前景層と同じアスペクト比及び位置を持ち、すなわち前記基準ビューデータ層は、前記前景データ層である。前記他のデータ層は、背景データ層である。前記他のデータ層は、3D画像が構築されることを可能にするデータ層の形式の情報を有する。現在の方法において、前記様々な層は、同じ表示エリアを覆う。
3Dビューが、シーンの2Dプラス深度表現からレンダリングされる場合、前記スクリーンの後ろに現れるオブジェクトは、1つの方向にシフトされ、前記スクリーンの前に現れるオブジェクトは、反対方向にシフトされる。いずれの方向であるかは、中央のビューの左に対するビューがレンダリングされるか又は右に対するビューがレンダリングされるかに依存する。典型的には、必ずではないが、スクリーンの前又は近くに現れるオブジェクトは、前景層にあり、前記背景層が、前記前景オブジェクトの後ろの全てを含む。通常は、前記前景オブジェクトは、前記スクリーンに表れるべきなので、前記レンダリングによりシフトされない。前記背景全体は、この場合、1つの方向にシフトされ、一方の側において"ギャップ"又は紛失した情報を生じ、例えば、前記背景が左に16画素移動される場合、前記背景層の右側の16画素に関する情報が、紛失している。前記紛失した情報は、取り出されることができない。
本発明は、以下の方法で前記問題を解決する。
前記他の層及び前記基準ビュー層により覆われる表示エリアのサイズ及び/又は形状が、異なり、前記覆われる表示エリアの間の関係を表すスケーリングデータが生成される。
したがって、例えば、前記基準ビューの後ろの遮蔽層に対して、前景層の表示エリアより大きい表示エリアを持つ遮蔽層は、生成されることができ、前記2つのデータ層の表示エリアのサイズ及び/又は形状の間の関係が、例えば適切なメタデータで示される。ほとんどの現在のレンダリング方法に対して、水平画素シフトのみが存在するので、前記遮蔽層の幅を増大することが十分である。増大の量は、様々な遮蔽層に対して異なることができ、前記スケーリングデータは異なることができる。前記スケーリングデータは、どのように前記2つの層がマッチされることができるかを示す。好ましくは、前記スケーリングデータは、マッチされる前記2つの層をも示す。
好適な実施例において、通常は標準的な解像度に留まることが、互換性に対して最良であるので、前記他の層データは、前記基準ビューデータと同じ解像度及び形状を持つ。したがって、例えば前記基準ビュー層及び前記遮蔽層の両方が、1280×720であることができるが、前記基準ビュー表示エリアに対応する前記遮蔽層の一部は、例えば前記遮蔽層の左側及び右側の表示エリアの多くの境界を与えるように前記遮蔽層画像の中心の1200×720でありうる。前記遮蔽層の表示エリアは、この場合、前記基準ビュー層の表示エリアより大きく、この例において水平方向において係数1280/1200である。
より洗練されたレンダリング方法において、これは、より多くの自由度で非中央ビューをレンダリングするのに使用される仮想的なカメラを移動することができてもよい。このような方法において、垂直画素シフト、すなわち垂直方向のサイズ及び/又は形状の差は、有利になりうる。前記遮蔽層の表示エリアは、この場合、垂直方向において前記基準ビューの表示エリアと異なる。オプションとして水平方向及び垂直方向の異なる数の追加の画素を用いて、可能な限り水平方向及び垂直方向の両方においてより大きな表示エリアを符号化する組み合わせは、当業者に明らかである。
単純な実施例において、メタデータは、前記基準ビューデータ層に対応する前記遮蔽層内の長方形により実現される。これは、前記遮蔽層が、異なる解像度及びアスペクト比で自動的に記憶されることができるという利点を持つ。
本発明のこれら及び他の態様は、添付の図面を参照して例によって更に詳細に説明される。
図面は、正しいスケールで描かれていない。一般に、同一の構成要素は、図面において同じ参照番号により示される。
オートステレオスコピック表示装置の一例を示す。 遮蔽問題を示す。 遮蔽問題を示す。 本発明の第1の例を示す。 本発明の第2の例を示す。 前景層に対応する他の層内のエリアを表すのに非長方形形状が使用される実施例を示す。 前景層に対応する他の層内のエリアを表すのに非長方形形状が使用される実施例を示す。 前景層に対応する他の層内のエリアを表すのに非長方形形状が使用される実施例を示す。 前景層に対応する他の層内のエリアを表すのに非長方形形状が使用される実施例を示す。 前景層に対応する他の層内のエリアを表すのに非長方形形状が使用される実施例を示す。 前景層に対応する他の層内のエリアを表すのに非長方形形状が使用される実施例を示す。 本発明の他の例を示す。 本発明の他の例を示す。 本発明の他の例を示す。 本発明による符号化システム及び復号システムを示す。
以下の与えられる例において、画像が示され、画像データ層に示されるものが、深度マップに対して同等に適用可能であることが述べられる。
図1は、一種のオートステレオスコピック表示装置の基本原理を示す。前記表示装置は、2つのステレオ画像5及び6を形成するレンチキュラスクリーン分割部3を有する。2つのステレオ画像の垂直線は、例えば、バックライト1を持つ空間光変調器2(例えばLCD)上に(空間的に)交互に表示される。前記バックライト及び前記空間光変調器は、一緒に画素アレイを形成する。レンチキュラスクリーン3のレンズ構成は、観察者の適切な目に前記ステレオ画像を向ける。
図2及び3において、遮蔽問題が示される。この図において背景と示される線は、背景であり、前景と示される線は、前記背景の前に配置されるオブジェクトを表す。左及び右は、このシーンの2つのビューを表す。これら2つのビューは、例えば、ステレオセットアップに対する左及び右ビュー、又はマルチビューディスプレイの使用の場合に対する2つの最も外側のビューであることができる。L+Rで示される線は、両方のビューにより観察されることができ、L部分は、左ビューからのみ観察されることができ、R部分は、右ビューからのみ観察されることができる。したがって、前記R部分は、前記左ビューから観察されることができず、同様に前記L部分は、前記右ビューから観察されることができない。図3において、中央は、中央ビューを示す。この図から見られることができように、図3に示される前記背景のL及びR部分の一部(L1、R1)は、前記中央ビューから見られることができる。しかしながら、前記L及びR部分の一部は、前景オブジェクトの後ろに隠れるので、前記中央ビューから見えない。Ocで示されるこれらのエリアは、前記中央ビューに対して遮蔽されるが、他のビューから見えるエリアである。図から見られることができるように、遮蔽エリアは、典型的には、前景オブジェクトの縁において生じる。
中央ビュー及び深度マップのみから3Dデータを生成するのは、遮蔽されたエリアに対する問題を引き起こす。前景オブジェクトの後ろに隠れた前記画像の部分のデータは、未知である。
既知の方法において、これは、基準ビューデータ、この例では中央ビューとは別に、他のデータ層が生成される、層状構造で3D画像データを生成することにより解決される。データは、前景オブジェクトの後ろに隠れる前記3D画像の部分を表す他のデータ層の形式で前記3D画像信号に加えられる。この背景情報は、同じ視角から記憶される。3D画像において、多くのオブジェクトが互いの後ろに配置される場合に、背景情報の1より多い層が存在しうる。
当業者に明らかであるように、前記層状3D画像は、中央ビューに対して符号化されることができるが、必要ではなく、代わりに、例えば右画像のレンダリングを可能にするためにステレオ対の左画像及び関連した深度情報を符号化することもできる。
発明者は、現在の方法において、必要とされる情報の一部が、遮蔽層において表されることができないことを発見した。これは、失われた情報が他の方法でレンダリングされなくてはならず、通常は紛失した情報のコンテンツを予想する何らかの方法を生じるので、3Dイメージングの品質を低下する。このような方法がどれほどインテリジェントであろうとも、表されない情報は、決して実際に取り出されず、画像エラー及び不完全な3D画像の可能性を生じる。
現在の2Dプラス深度フォーマットにおいて、前記深度マップ及び前記遮蔽層の表示エリアは、同じアスペクト比及び位置、すなわち前記基準ビューとして見られることができる前記前景層と同じ表示エリアのサイズ及び形状を持つ。3Dビューが、シーンの2Dプラス深度表現からレンダリングされる場合、前記スクリーンの後ろに現れるオブジェクトは、一方向にシフトされ、前記スクリーンの前に現れるオブジェクトは、反対方向にシフトされる。いずれの方向であるかは、前記中央ビューの左に対するビューがレンダリングされるのか又は右に対するビューがレンダリングされるのかに依存する。典型的には、必ずではないが、スクリーン面の前に又は近くに現れるオブジェクトは、前景層内にあり、前記背景層は、前記前景オブジェクトの後ろの全てを含む。通常は、前記前景オブジェクトは、前記スクリーン面に現れるべきであるので、前記レンダリングによりシフトされない。前記背景全体は、この場合、一方向にシフトされ、一方の側における'ギャップ'又は表されない情報を生じ、例えば、前記背景が左に16画素移動される場合に、前記背景層の右側の16画素に関する情報は、前記遮蔽データ層において表されない。前記表されない情報は、取り出されることができない。
本発明の基本的な洞察は、他の層の表示エリアを、前記基準ビュー、例えば前景層の表示エリアとはサイズ及び/又は形状において異ならせ、これを適切なメタデータを用いて前記3D画像信号において示すことである。多くの場合、水平画素シフトのみを持つので、前記遮蔽層の表示エリアの幅を増大することで十分である。より複雑なレンダリング方法は、より高い自由度で非中央ビューをレンダリングするのに使用される前記仮想的なカメラを移動することができる。これらの場合、垂直画素シフトも必要とされうる。符号化中に、サイズ又は形状の差は、例えば、前記様々な層及び視角に関連付けられた様々な深度マップから計算されることができる。
図4は、本発明の第1の例を示す。
この単純な例において、送信システム、ビデオコンテナ又はビデオコーデックが、全ての層に対して固定の解像度のみを可能にすると仮定される。図4は、前景層F及び複数の遮蔽層OC1、OC2を概略的に示す。各遮蔽層OC1、OC2において、長方形は、前記遮蔽層の表示エリアのいずれのエリアが前景層Fに対する表示エリアに対応するかを示す。典型的には、他の遮蔽層OC1の後ろである遮蔽層OC2は、レンダリング中の画素シフトが大きいので、表示エリアにおいてより大きい必要がある。この場合、これは、前景層Fの表示エリアに対応する長方形が小さくなることを意味する。前記メタデータは、前記前景層に対応する前記遮蔽層内の長方形により実現されることができる。これは、前記遮蔽層が、異なる解像度及びアスペクト比で自動的に記憶されることができるという利点を持つ。
たとえ前記ビデオコーデックが、全ての層に対して固定の解像度を記憶することを強制するとしても、情報は、前記情報を所定の解像度に'スクイーズする'ことにより前記遮蔽層の左及び右に追加されることができる。前記背景の水平解像度は、左及び右縁に関する情報を得ると同時に失われる。スケーリングデータなしで、例えば、前記前景層と同じ解像度の背景層について、如何なる拡張も無い前記前景層と同じ解像度における背景層と、スケールダウンされたが、前記背景層全体を再び元のサイズに拡大する拡張を持つ背景層とを区別することは、不可能である。前記スケーリングデータは、メタデータとして記憶されることができる。
より大きな背景層は、前記紛失した情報を符号化するのに前記背景層を使用することができるので、前記前景自体が前記縁においてスクリーン深度以外の深度を持つ場合でさえ、役に立つ。コンテンツが元々"単一層"だけである(したがって、背景層が必要ではない)場合でさえ、前記背景層は、例えば、前記縁が手動で又は半自動的に満たされる又はコンテンツ作成プロセスから利用可能であるコンテンツ作成ソフトウェアにより、左及び右に対する拡張として使用されることができる。
図5は、本発明の第2の例を示す。
この例において、遮蔽層は、前記前景層とマッチするエリアが、前記前景層自体と同数の画素を持つように符号化される。これは、リスケーリング(及び結果として生じる精度の損失)がレンダリングに必要とされないので、ほとんどのアルゴリズムに対して有用である。
他の図は、本発明の他の例を示す。
A.非長方形形状、図6−11
図6−10は、前景層の表示エリアに対応するエリアを表すのに非長方形形状を使用することが有利である例を示す。水平線に消える道路のシーンを持つと仮定する(図6)。前景層は、この道路上を走る自動車、空を飛ぶ鳥等を含むことができる。図6は、このようなシーンに対する背景層のみを描いている。側面から見た場合(図7及び8)、暗いエリアは、元の画像の外側からの背景情報が必要とされるところを示す。この情報は、(例えばマルチビューデータ、図6−8から)入手可能である。前記背景層にこれらを加えることは、図9をもたらす。この情報を長方形ビデオエリアに記憶することができるために、画像の線は、水平方向に(底部より上部で大きく)スクイーズされなくてはならず、結果として図10をもたらす。図11は、前記前景層(例えば前景オブジェクトを持つ図6)に対応するエリアを太線で示す。
B.非線形スケーリング(図12及び13)
図12に描かれる背景層を持つと仮定する(太線において対応する前景画像エリア)。これは、前記画像の真ん中で、背景と前景との間の非常に正確な対応を持つことを望む場合でありうる。1つのオプションは、背景画像を3つのエリア、すなわち、前記前景と1:1対応を持つ真ん中エリア、及び例えば前記背景を最大前景幅及びそれを超える拡張まで広げるために(底部における矢印でシンボル化された)倍数2で拡張されなければならない(図13において灰色の)側部エリアに分割することである。このようにして、前記背景層を作成するためのデータの圧縮は、側部においてのみ行われるのに対し、真ん中部分は、手をつけられないままである。
この単純なアプローチは、背景拡大が1と2との間でジャンプする新しく導入された遷移においてアーチファクトを生じるかもしれず、したがって(例えばスプラインの使用による)スケーリング係数のより滑らかな遷移が使用されることもできると理解されうる。
一般に、前景と従属層との間の座標のマッピングは、任意の高次の補間を持つ制御点のグリッドであることができる。
C.他の層タイプ/サイズ、図14
図14は、より高度な例を示し、右上に前景透明データ層と、真ん中の行に前景合成色及び深度データ層と、底部の行において背景色及び深度データ層とを持つ。前記透明層は、フルサイズである必要はなく、ゴーストを持つエリアだけに減少されることができる。この場合、前記背景層(画像及び深度)についても同様である。代替例(描かれていない)は、全ての柱の後ろの背景情報を依然として持つことができ、(ほぼ)フルサイズの前景/合成画像を依然として持つために前記背景画像及び深度を必要とし、前記透明層は、上の例の減少したサイズを依然として持つことができる。この画像が取られるビデオにおいて、前記ゴーストは、右から左に移動し、したがって、透明性が必要とされるエリア、すなわち、前記透明データ層の表示エリアは、小さいままであるが、時間に対して、基準ビューデータ層、この例においては前景合成色データ層の表示エリアに対して移動する(すなわち、スケーリングメタデータは、時間に対して活動させられることができる)。
場合により、これは、多くの脱遮蔽(de-occlusions)に対して、前記深度に対する画素繰り返しが、十分な品質を提供することができ、(画素繰り返しが深度に対する受信器/レンダリング側で実行されることができるので)これらのエリアに対して、遮蔽画像データのみが記憶されることを必要としうる場合であることができる。これは、前記背景画像に対して記憶されることを必要とするエリアが、背景深度に対するエリアとは異なる場合を生じる。
D.基準ビュー層として異なる層
前記他の層に対して、対応する表示エリアがスケーリングデータに表される基準として前景/合成層とは異なる層を使用することが可能である。例えば、鍵穴を覗くシーンを持つ場合、小さなエリアのみが、背景層に対して必要とされる。対応する前景エリアを示すために実際の背景画像より大幅に大きい背景エリア内の長方形を示すことができる。しかしながら、代替的には、前景層において、前記背景画像が有効であるエリアを示すこともできる。
好ましくはメタデータの形式である、スケーリングデータを生成する複数の方法が存在する。下は幾つかの実施例である。
層を合成する場合、前記背景層は、単純に最終的な合成物より大きくてもよく、追加の情報及びその場所は、元の層情報、どのように前記層が互いに対して配置されているか、及びいずれの"クロップ選択(crop selection)"が最終(前景)ビューポートとして使用されるかから確定されることができる。
代替的には、図6−11は、どのようにして追加の情報及び表示エリア表現がマルチビュー情報から確定されることが得きるかを示す。
代替的には、(例えばPhilips 3D Solutionsの"WOWzone"製品のような)ビディウォール(vidi-wall)に示されるようにビデオを分割する場合、前記ビデオが分割されたタイルの背景層は、(前記タイルの背景層が重複することさえできる点に対して)前景層クロッピングとは異なる形で全体画像からクロップされることができる。
代替的には、異なる層を異なるレンダリングパスにおいてレンダリングする(3D Studio Max, Blendar, Mayaのような)コンピュータグラフィックスレンダリングシステムに対するプラグインにおいて、ビューポート及び/又は出力解像度は、レンダリングパスの間で変化されることができ、これらの変化は、層間の対応を示すように異なる層に沿ったメタデータとして記憶される。
代替的には、合成器は、入力層を分析することができ、例えば前述の鍵穴の例に対して、前記背景層の小さな部分のみが必要とされることを見て、当該部分及びいずれの部分が選択されたかを表すメタデータのみを記憶することができる。
代替的には、合成器は、元の背景情報が十分に大きくない場合に背景を埋めるのにテクスチャ修復方法を使用し、適切なメタデータを作成することができる。高品質なテクスチャ修復方法は、遅く、現在は、ディスプレイにおける実施に適しておらず、したがって、オフラインで使用することは当然である。
図15は、本発明の一実施例による符号化システム及び本発明の一実施例による復号システムを概略的に示す。エンコーダ入力EIは、前景データ画像FG及び様々なサイズの複数の背景画像BG1ないしBG3を有する。本発明による符号化システムは、前記エンコーダ入力をエンコーダ出力信号EOに符号化するように構成されたエンコーダ/符号化プロセッサを有する。前記エンコーダ出力信号は、前景データ画像FGに対応する前景データ層FG及びスケーリングされた背景層BG1'ないしBG3'を有し、前記スケーリングされた背景層の各々が、背景画像BG1ないしBG3のそれぞれ1つ及び関連したスケーリングデータに対応する。
エンコーダ出力EOは、前記復号システムに対する入力画像データ信号DIとして使用されることができる。入力データ信号DIは、この例では前景データ層FG及び複数の背景データ層BG1'ないしBG3'を有する、層状データ構造を有する。画像入力データ信号DIは、様々なデータ層の表示エリアの間のスケーリングを提供するスケーリングデータsをも有する。復号プロセッサ/デコーダDの出力は、前記前景層の表示エリアに対応する前記背景層のエリアを示す長方形を前記背景層に対して有する様々なデータ層を提供する。前記デコーダは、前記前景層の表示エリアに対応する前記背景層内のエリアが前記前景層と同じサイズであるように前記背景データ層をスケーリングする。
符号化プロセッサE及び符号化プロセッサDが、スケーリングデータが必要とされない実施例、すなわち符号化された出力信号/復号に対する入力信号が元々与えられたスケーリングされていない層FG、GB1、BG2及びBG3を含む実施例に対してエンコーダ出力信号EO/デコーダ入力信号DIを生成するにも構成されることができることは、当業者に明らかである。
上記記載が、明確性のために、単一の復号/符号化プロセッサを参照して本発明の実施例を記載していると理解される。しかしながら、異なる機能ユニット又はプロセッサ間の機能の適切な分散が本発明からそれることなしに使用されることができることは明らかである。したがって、前記復号/符号化プロセッサに対する参照は、厳密な論理的又は物理的構造又は組織を示すのではなく記載された機能を提供する適切な手段に対する参照と見なされるだけである。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせを含む如何なる適切な形式でも実施されることができる。本発明は、オプションとして、1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして少なくとも部分的に実施されることができる。本発明の一実施例の要素及び構成要素は、如何なる適切な形でも物理的に、機能的に及び論理的に実施されることができる。実際に、機能は、単一のユニットで、複数のユニットで又は他の機能ユニットの一部として実施されてもよい。このように、本発明は、単一のユニットで実施されてもよく又は異なるユニット及びプロセッサの間に物理的に及び機能的に分散されてもよい。
本発明は、ある実施例に関連して記載されているが、ここに記載された特定の形式に限定されることを意図されない。むしろ、本発明の範囲は、添付の請求項によってのみ限定される。加えて、特徴は、特定の実施例に関連して記載されているように見えるかもしれないが、当業者は、記載された実施例の様々な特徴が本発明によって組み合わされることができると認識している。請求項において、用語有するは、他の要素又はステップの存在を除外しない。
更に、個別にリストされているが、複数の手段、要素又は方法ステップが、例えば単一のユニット又はプロセッサにより実施されてもよい。加えて、個別の特徴が、異なる請求項に含まれているかもしれないが、これらは、場合により有利に組み合わせられることができ、異なる請求項における包含は、特徴の組み合わせが実行可能及び/又は有利ではないことを意味しない。また、請求項の1つのカテゴリにおける特徴の包含は、このカテゴリに対する限定を意味せず、むしろこの特徴は、適切に他の請求項カテゴリに同等に適用可能である。更に、請求項内の特徴の順序は、前記特徴が動作されなくてはならない特定の順序を意味せず、特に方法請求項内の個別のステップの順序は、前記ステップがこの順序で実行されなくてはならないことを意味しない。加えて、単数形は、複数を除外しない。したがって、"1つの"("a"、"an")、"第1の"、"第2の"等への言及は、複数を除外しない。請求項内の参照符号は、単に明確化する例として提供され、いかなる形にも請求項の範囲を限定すると解釈されるべきでない。

Claims (12)

  1. 2D画像及び深度情報を有する3D画像信号が符号化され、前記符号化された3D画像信号が、前景データ層及び前記前景データ層に対する1以上の背景データ層を有し、前記前景データ及び前記1以上の背景データ層により覆われる表示エリアが、サイズ及び/又は形状において異なり、前記1以上の背景データ層の表示エリアにおける前記前景データ層の表示エリアに対応するエリアが前記前景データ層の表示エリアと同じサイズ及び形状になるように前記1以上の背景データ層をスケーリングするためのスケーリングデータが生成される、符号化方法。
  2. 前記スケーリングデータが、メタデータとして生成される、請求項1に記載の符号化方法。
  3. 前記スケーリングデータは、前記前景データ層の表示エリアのサイズ及び前記1以上の背景データ層の表示エリアのサイズが、水平方向にのみ異なることを表す、請求項1に記載の符号化方法。
  4. 前記スケーリングデータが、非長方形形状を表す、請求項1に記載の符号化方法。
  5. 前記スケーリングデータが、非線形スケーリングを表す、請求項1に記載の符号化方法。
  6. 2D画像及び深度情報を有する3D画像信号を符号化するシステムにおいて、前記符号化された3D画像信号が、前景データ層及び前記前景データ層に対する1以上の背景データ層を有し、前記前景データ層及び前記1以上の背景データ層により覆われる表示エリアのサイズ及び/又は形状が異なり、前記1以上の背景データ層の表示エリアにおける前記前景データ層の表示エリアに対応するエリアが前記前景データ層の表示エリアと同じサイズ及び形状になるように前記1以上の背景データ層をスケーリングするためのスケーリングデータが生成される、システム。
  7. 前景データ層及び1以上の背景データ層を有する3D画像信号を復号する方法において、様々なデータ層の表示エリアが異なり、前記3D画像信号が、前記1以上の背景データ層の表示エリアにおける前記前景データ層の表示エリアに対応するエリアが前記前景データ層の表示エリアと同じサイズ及び形状になるように前記1以上の背景データ層をスケーリングするためのスケーリングデータを有し、前記復号する方法が、前記スケーリングデータに依存して2以上のデータ層のサイズ及び/又は形状をマッチングするステップを有する、方法。
  8. 前景データ層及び1以上の背景データ層を有する3D画像信号に対する入力を有する復号システムにおいて、様々なデータ層の表示エリアのサイズ及び/又は形状が異なり、前記3D画像信号が、前記1以上の背景データ層の表示エリアにおける前記前景データ層の表示エリアに対応するエリアが前記前景データ層の表示エリアと同じサイズ及び形状になるように前記1以上の背景データ層をスケーリングするためのスケーリングデータを有し、前記復号システムが、前記スケーリングデータに依存して前記2以上のデータ層により覆われる表示エリアをマッチングする手段を有する、復号システム。
  9. コンピュータ上で実行される場合に、請求項1ないしのいずれか一項に記載の符号化方法を実行するプログラムコード手段を有するコンピュータプログラム。
  10. コンピュータ上で実行される場合に、請求項に記載の方法を実行するプログラムコード手段を有するコンピュータプログラム。
  11. 2D画像及び深度情報を有する3D画像信号を符号化する手順であって、前記符号化された3D画像信号が、前景データ層及び前記前景データ層に対する1以上の背景データ層を有し、前記前景データ層及び前記1以上の背景データ層により覆われる表示エリアが、サイズ及び/又は形状において異なる、当該符号化する手順と、
    前記1以上の背景データ層の表示エリアにおける前記前景データ層の表示エリアに対応するエリアが前記前景データ層の表示エリアと同じサイズ及び形状になるように前記1以上の背景データ層をスケーリングするためのスケーリングデータを生成する手順と、
    をコンピュータに実行させるプログラムコード手段を有するコンピュータプログラム。
  12. 前景データ層及び1以上の背景データ層を有する3D画像信号を復号するコンピュータプログラムにおいて、様々なデータ層の表示エリアが異なり、前記3D画像信号が、前記1以上の背景データ層の表示エリアにおける前記前景データ層の表示エリアに対応するエリアが前記前景データ層の表示エリアと同じサイズ及び形状になるように前記1以上の背景データ層をスケーリングするためのスケーリングデータを有し、前記復号するコンピュータプログラムが、
    前記スケーリングデータに依存して2以上のデータ層のサイズ及び/又は形状をマッチングする手順、
    をコンピュータに実行させるプログラムコード手段を有するコンピュータプログラム。
JP2011533918A 2008-11-04 2009-11-03 3d画像信号を符号化する方法及びシステム、符号された3d画像信号、3d画像信号を復号する方法及びシステム Active JP5706826B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08168233 2008-11-04
EP08168233.8 2008-11-04
PCT/IB2009/054869 WO2010052637A1 (en) 2008-11-04 2009-11-03 Method and system for encoding a 3d image signal, encoded 3d image signal, method and system for decoding a 3d image signal

Publications (3)

Publication Number Publication Date
JP2012507908A JP2012507908A (ja) 2012-03-29
JP2012507908A5 JP2012507908A5 (ja) 2012-12-20
JP5706826B2 true JP5706826B2 (ja) 2015-04-22

Family

ID=41537728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011533918A Active JP5706826B2 (ja) 2008-11-04 2009-11-03 3d画像信号を符号化する方法及びシステム、符号された3d画像信号、3d画像信号を復号する方法及びシステム

Country Status (8)

Country Link
US (1) US9185432B2 (ja)
EP (1) EP2347597B1 (ja)
JP (1) JP5706826B2 (ja)
KR (1) KR101595993B1 (ja)
CN (1) CN102204264B (ja)
TR (1) TR201819481T4 (ja)
TW (1) TWI542190B (ja)
WO (1) WO2010052637A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101902657B (zh) * 2010-07-16 2011-12-21 浙江大学 一种基于深度图分层的虚拟多视点图像的生成方法
KR101676830B1 (ko) * 2010-08-16 2016-11-17 삼성전자주식회사 영상 처리 장치 및 방법
EP2458877A1 (en) * 2010-11-26 2012-05-30 Thomson Licensing Occlusion layer extension
KR102062765B1 (ko) * 2012-09-18 2020-02-11 삼성전자주식회사 이미지 변환 메커니즘을 갖춘 3d 이미지 캡쳐 시스템과 그 사용 방법
KR101901184B1 (ko) 2012-09-20 2018-09-21 삼성전자주식회사 깊이 영상을 사용한 컬러 영상 처리 장치 및 방법
EP2995082B1 (en) * 2013-05-10 2016-11-30 Koninklijke Philips N.V. Method of encoding a video data signal for use with a multi-view rendering device
US9418469B1 (en) 2013-07-19 2016-08-16 Outward, Inc. Generating video content
US20150235408A1 (en) * 2014-02-14 2015-08-20 Apple Inc. Parallax Depth Rendering
US20170280133A1 (en) * 2014-09-09 2017-09-28 Nokia Technologies Oy Stereo image recording and playback
WO2017020806A1 (en) * 2015-07-31 2017-02-09 Versitech Limited A multi-overlay variable support and order kernel-based representation for image deformation and view synthesis
CN108140259B (zh) 2015-08-18 2022-06-14 奇跃公司 虚拟和增强现实系统和方法
EP3310053A1 (en) * 2016-10-12 2018-04-18 Thomson Licensing Method and apparatus for coding transparency information of immersive video format
WO2018069215A1 (en) * 2016-10-12 2018-04-19 Thomson Licensing Method, apparatus and stream for coding transparency and shadow information of immersive video format
EP3310057A1 (en) * 2016-10-12 2018-04-18 Thomson Licensing Method, apparatus and stream for coding transparency and shadow information of immersive video format
US10778993B2 (en) * 2017-06-23 2020-09-15 Mediatek Inc. Methods and apparatus for deriving composite tracks with track grouping
US10735649B2 (en) 2018-02-22 2020-08-04 Magic Leap, Inc. Virtual and augmented reality systems and methods using display system control information embedded in image data
US10986326B2 (en) * 2019-02-22 2021-04-20 Avalon Holographics Inc. Layered scene decomposition CODEC with higher order lighting
EP3979644A1 (en) * 2020-10-02 2022-04-06 Koninklijke Philips N.V. A method and apparatus for encoding and decoding one or more views of a scene

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5706417A (en) * 1992-05-27 1998-01-06 Massachusetts Institute Of Technology Layered representation for image coding
US6466207B1 (en) 1998-03-18 2002-10-15 Microsoft Corporation Real-time image rendering with layered depth images
US6348918B1 (en) * 1998-03-20 2002-02-19 Microsoft Corporation Stereo reconstruction employing a layered approach
EP1418766A3 (en) * 1998-08-28 2010-03-24 Imax Corporation Method and apparatus for processing images
US6611268B1 (en) 2000-05-30 2003-08-26 Microsoft Corporation System and process for generating 3D video textures using video-based rendering techniques
FR2834178A1 (fr) 2001-12-20 2003-06-27 Koninkl Philips Electronics Nv Procede de decodage de signaux video codes
KR100714068B1 (ko) * 2004-10-16 2007-05-02 한국전자통신연구원 계층적 깊이 영상을 이용한 다시점 동영상 부호화/복호화방법 및 장치
JP2006191357A (ja) * 2005-01-06 2006-07-20 Victor Co Of Japan Ltd 再生装置および再生プログラム
JP4904692B2 (ja) * 2005-01-28 2012-03-28 株式会社ニコン 画像再生装置、及び画像再生プログラム
RU2431938C2 (ru) 2006-03-31 2011-10-20 Конинклейке Филипс Электроникс Н.В. Эффективное кодирование множества видов
TWI450264B (zh) 2006-07-19 2014-08-21 World Golf Tour Inc 用於模擬中之圖像對映的方法及電腦程式產品
US20080036763A1 (en) 2006-08-09 2008-02-14 Mediatek Inc. Method and system for computer graphics with out-of-band (oob) background
US20090316989A1 (en) 2006-09-11 2009-12-24 Koninklijke Philips Electronics N.V. Method and electronic device for creating an image collage
EP2064300A4 (en) 2006-09-20 2013-05-22 Pneumrx Inc ADHESIVE FABRIC COMPOSITIONS AND RELATED METHODS
CN101690249B (zh) * 2007-06-26 2012-06-20 皇家飞利浦电子股份有限公司 用于编码3d视频信号的方法和系统、用于3d视频信号解码器的方法和系统

Also Published As

Publication number Publication date
EP2347597B1 (en) 2018-10-17
CN102204264B (zh) 2014-07-23
US9185432B2 (en) 2015-11-10
TWI542190B (zh) 2016-07-11
EP2347597A1 (en) 2011-07-27
JP2012507908A (ja) 2012-03-29
KR20110093828A (ko) 2011-08-18
KR101595993B1 (ko) 2016-02-22
US20110211043A1 (en) 2011-09-01
TW201023619A (en) 2010-06-16
WO2010052637A8 (en) 2011-04-28
CN102204264A (zh) 2011-09-28
WO2010052637A1 (en) 2010-05-14
TR201819481T4 (tr) 2019-01-21

Similar Documents

Publication Publication Date Title
JP5706826B2 (ja) 3d画像信号を符号化する方法及びシステム、符号された3d画像信号、3d画像信号を復号する方法及びシステム
Muller et al. Reliability-based generation and view synthesis in layered depth video
US7689031B2 (en) Video filtering for stereo images
JP5011316B2 (ja) 出力画像のレンダリング
US9595128B2 (en) Depth dependent filtering of image signal
US9083963B2 (en) Method and device for the creation of pseudo-holographic images
ES2676055T5 (es) Receptor de imagen eficaz para múltiples vistas
CN1942902B (zh) 用于2.5维图像再现的重影虚像的削减
US8368690B1 (en) Calibrator for autostereoscopic image display
CN109643462B (zh) 基于渲染引擎的实时图像处理方法以及显示设备
JP2011523743A (ja) 深さ情報を有するビデオ信号
JP2005109568A (ja) 映像表示装置及びプログラム
WO2012140397A2 (en) Three-dimensional display system
CN106412562B (zh) 三维场景中显示立体内容的方法及其系统
US9866813B2 (en) Autostereo tapestry representation
JP2010213254A (ja) 多層構造を持つ3次元表示装置のための画像処理方法
WO2006136978A1 (en) Method and system for rendering image data on a 3d display
CN110809147A (zh) 图像处理方法及装置、计算机存储介质、电子设备
Jeng et al. New 3D image technologies developed in Taiwan
KR101634013B1 (ko) 마스크 패널이 사용된 집적영상에서 3차원 및 2차원 영상으로 전환가능한 디스플레이 시스템을 구현하는 방법
JP4956574B2 (ja) 立体画像描画装置および描画方法
WO2013006731A1 (en) Three-dimensional image display using a dynamically variable grid

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121101

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121101

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150227

R150 Certificate of patent or registration of utility model

Ref document number: 5706826

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250