JP2024514066A

JP2024514066A - 光効果をサポートする容積ビデオ

Info

Publication number: JP2024514066A
Application number: JP2023558965A
Authority: JP
Inventors: シュポー，ベルトラン; ドレ，ルノー; ジュリアンフルーロー，; スーダー，フランク
Original assignee: インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Priority date: 2021-04-07
Filing date: 2022-04-04
Publication date: 2024-03-28
Also published as: US20240249462A1; CN117121059A; WO2022214435A1; EP4320596A1; MX2023011296A

Abstract

３Ｄ容積ビデオを符号化、トランスポート、及び復号するための方法、デバイス、及びデータストリームが提案される。実施形態は、光線追跡ベースのレンダリングエンジンが光効果に関して視覚的に現実的な仮想ビューを合成することを可能にするように、非ランバートパッチのシグナリングをそれらの光反射特性と共に包含する。従来のレンダリングエンジンが、そのように説明された３Ｄシーンをレンダリングすることを可能にするが、高度な光効果を伴わない、レトロ互換性のあるソリューションも説明される。【選択図】図９

Description

本原理は、概して、三次元（three-dimensional、３Ｄ）シーン及び容積ビデオコンテンツのドメインに関する。本文書はまた、モバイルデバイス又はヘッドマウントディスプレイ（Head-Mounted Display、ＨＭＤ）などのエンドユーザデバイス上の容積コンテンツのレンダリングのための、テクスチャ及び３Ｄシーンの幾何学的形状を表すデータの符号化、フォーマット化及び復号の文脈において理解される。特に、本文書は、様々な視点からの鏡面反射及び他の複雑な光効果を扱うことができるレンダリングを可能にする方法での容積シーンの符号化に関する。

本節は、以下に説明及び／又は特許請求される本原理の様々な態様に関連し得る様々な技術の態様を読者に紹介することを意図している。この考察は、本原理の様々な態様のより良好な理解を容易にするための背景情報を読者に提供するのに役立つと考えられる。したがって、これらの記述は、この観点から読まれるべきであり、先行技術の承認として読まれるべきではないことを理解されたい。

近年、利用可能な大きな視野コンテンツ（最大３６０°）の成長があった。そのようなコンテンツは、ヘッドマウントディスプレイ、スマートグラス、ＰＣスクリーン、タブレット、スマートフォンなどの没入型表示デバイス上のコンテンツを視聴するユーザによって完全には見えない可能性がある。これは、所与の瞬間に、ユーザがコンテンツの一部のみを視認することができることを意味する。しかしながら、ユーザは、典型的には、頭部の動き、マウスの動き、タッチスクリーン、音声などの様々な手段によって、コンテンツ内をナビゲートすることができる。典型的には、このコンテンツを符号化及び復号することが望ましい。

３６０°フラットビデオとも呼ばれる没入型ビデオにより、ユーザは、静止点の周りの頭部の回転を通じて自身の周りの全てを視聴することができる。回転は、３自由度（3 Degrees of Freedom、３ＤｏＦ）体験のみを可能にする。例えば、３ＤｏＦビデオが、ヘッドマウントディスプレイデバイス（ＨＭＤ）を使用した第１の全方向性ビデオ体験に十分である場合であっても、例えば視差を体験することによって、より多くの自由度を期待する視聴者にとって、３ＤｏＦビデオは即座に苛立たしいものになる可能性がある。更に、３ＤｏＦはまた、ユーザが頭部を回転させるだけでなく、頭部を３方向に並進させるために、３ＤｏＦビデオ体験で再現されない並進のために、めまいを誘発し得る。

大きな視野コンテンツは、とりわけ、三次元コンピュータグラフィック画像シーン（three-dimension computer graphic imagery scene、３ＤＣＧＩシーン）、点群又は没入型ビデオであり得る。そのような没入型ビデオを設計するために多くの用語が使用され得る。例えば、仮想現実（Virtual Reality、ＶＲ）、３６０、パノラマ、４πステラジアン、没入型、全方向性又は大きな視野。

容積ビデオ（６自由度（6 Degrees of Freedom、６ＤｏＦ）ビデオとしても既知である）は、３ＤｏＦビデオの代替物である。６ＤｏＦビデオを視聴するとき、回転に加えて、ユーザはまた、視聴されたコンテンツ内で頭部を、更には自身の身体を並進させ、視差及び更には容積を体験することができる。そのようなビデオは、没入の感覚及びシーン深度の知覚を大幅に増加させ、頭部並進中に一貫した視覚的フィードバックを提供することによって、めまいを防止する。コンテンツは、目的のシーンの色及び深度の同時記録を可能にする専用センサの手段によって作成される。写真測量技術と組み合わせたカラーカメラのリグの使用は、技術的な困難が残っている場合でも、そのような記録を実行する方法である。

３ＤｏＦビデオは、テクスチャ画像（例えば、緯度／経度投影マッピング又は正距円筒図法マッピングに従って符号化された球形画像）のアンマッピングから生じる一連の画像を含むが、６ＤｏＦビデオフレームは、いくつかの視点から情報を埋め込む。それらは、三次元捕捉から生じる時間的一連の点群として視認することができる。視聴条件に応じて、２種類の容積ビデオを考慮することができる。第１のもの（すなわち、完全な６ＤｏＦ）は、ビデオコンテンツ内の完全な自由ナビゲーションを可能にするが、第２のもの（別名３ＤｏＦ＋）は、ユーザ視認空間を視認境界ボックスと呼ばれる限られた容積に制限し、頭部及び視差体験の制限された容積を可能にする。この第２の文脈は、着座したオーディエンスメンバーの自由ナビゲーションと受動的視聴条件との間の貴重なトレードオフである。

そのようなビデオでは、ユーザが見ているビューポート画像は、合成された視野、すなわち、カメラによって捕捉されていないシーン上の視野である。既存の３ＤｏＦ＋ビデオフォーマットは、鏡面反射及び他の複雑な光効果を扱うことができず、３Ｄシーンがランバート面（すなわち、拡散反射のみを伴う）から構成されると仮定する。しかしながら、鏡面反射が取得リグの１つのカメラによって捕捉されるとき、このカメラの視点から観察されるように、異なる仮想視点からの３Ｄシーンをレンダリングすることは、新しい視点に従って反射されたコンテンツの位置及び外観を修正することを必要とする。更に、レンダリングされた仮想ビューは、いくつかの入力ビューから生じるパッチを混合することによって生成されるので、各入力ビューは、フレーム内の異なる位置で所与の反射を捕捉している。反射されたオブジェクトの複製をレンダリング時に観察することができる。したがって、レンダリング時に複雑な光効果をサポートする３ＤｏＦ＋ビデオフォーマットが欠如している。

以下は、本原理のいくつかの態様の基本的な理解を提供するための本原理の簡略化された概要を提示する。この概要は、本原理の広範な概要ではない。本原理の重要な又は重大な要素を特定することは意図されていない。以下の概要は、以下に提供されるより詳細な説明の前置きとして簡略化された形態で、本原理のいくつかの態様を単に提示するに過ぎない。

本原理は、３Ｄシーンを符号化するための方法に関する。この方法は、
－３Ｄシーンの部分について、第１の色パッチ、反射率パッチ、及び第１の深度パッチを取得することと、
－３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分について、第２の色パッチ及び第２の深度パッチを取得することと、
－第１及び第２の深度パッチをパッキングすることによって、深度アトラスを生成することと、
－第２の色パッチと第１の色パッチのサブセットとをパッキングすることによって、色アトラスを生成することと、
－反射率パッチのサブセットをパッキングすることによって、反射率アトラスを生成することと、
－反射率アトラスにパッキングされた各反射率パッチについて、
反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報を生成すること、及び
反射率パッチに反射された色パッチのリストを示す第２の情報を生成することと、
－データストリーム中で、
・深度アトラス、色アトラス、反射率アトラス、並びに第１及び
データストリーム中の第２の情報を符号化することと、を含む。

第１の実施形態では、色アトラスにパッキングされた第１の色パッチのサブセットは空であり、反射率アトラスにパッキングされた反射率パッチのサブセットは全ての反射率パッチを含む。第２の実施形態では、色アトラスにパッキングされた第１の色パッチのサブセットは、３Ｄシーンのランバート部分に対応し、反射率アトラスにパッキングされた反射率パッチのサブセットは、３Ｄシーンの非拡散反射部分に対応する。第３の実施形態では、色アトラスにパッキングされた第１の色パッチのサブセットは、全ての第１の色パッチを含み、反射率アトラスにパッキングされた反射率パッチのサブセットは、３Ｄシーンの非拡散反射部分に対応する。変形例では、方法は、反射率アトラス内の反射率パッチのサブセットに対応する表面法線パッチをパッキングすることによって、表面法線アトラスを生成することを更に含む。

本原理はまた、メモリに関連付けられたプロセッサを備えるデバイスに関し、このプロセッサは、上記の方法を実行するように構成されている。

本原理はまた、３Ｄシーンを符号化するデータストリームであって、
－３Ｄシーンの部分に対応する第１の深度パッチと、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分に対応する第２の深度パッチとをパッキングする深度アトラスと、
－３Ｄシーンの部分に対応する第１の色パッチと、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分に対応する第２の色パッチとをパッキングする色アトラスと、
－３Ｄシーンの部分に対応する反射率パッチをパッキングする反射率アトラスと、
－反射率アトラスにパッキングされた各反射率パッチについて、
・反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報、及び
・反射率パッチに反射された色パッチのリストを示す第２の情報と、を含む、データストリーム。

本原理は、３Ｄシーンをレンダリングする方法にも関する。この方法は、
データストリームから、
－３Ｄシーンの部分に対応する第１の深度パッチと、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分に対応する第２の深度パッチとをパッキングする深度アトラスと、
－３Ｄシーンの部分に対応する第１の色パッチと、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分に対応する第２の色パッチとをパッキングする色アトラスと、
－３Ｄシーンの部分に対応する反射率パッチをパッキングする反射率アトラスと、
－第１の色パッチ及び反射率パッチに従って決定されたレンダリングモードをシグナリングする情報と、
－反射率アトラスにパッキングされた各反射率パッチについて、
・反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報、及び
・反射率パッチに反射された色パッチのリストを示す第２の情報とを復号することと、
第１及び第２の深度パッチに従って第１及び第２の色パッチを逆投影することによって、かつ第１及び第２の情報と関連する色パッチとに従って反射率パッチのための光線追跡を使用することによって、３Ｄシーンをレンダリングすることと、を含む。

本開示は、以下の説明を読むと、より良好に理解され、他の特定の特徴及び利点が明らかになり、本明細書は、添付の図面を参照する。
本原理の非限定的な実施形態による、オブジェクト及び３Ｄモデルに対応する点群の点の三次元（３Ｄ）モデルを示す。本原理の非限定的な実施形態による、３Ｄシーンのシーケンスを表すデータの符号化、送信及び復号の非限定的な例を示す。本原理の非限定的な実施形態による、図１３及び図１４に関連して説明される方法を実施するように構成され得るデバイスの例示的なアーキテクチャを示す。本原理の非限定的な実施形態による、データがパケットベースの送信プロトコルを介して送信されるときのストリームの構文の一実施形態の一例を示す。本原理の非限定的な実施形態による、４つの投影中心の例を有するパッチアトラスアプローチを示す。本原理の非限定的な実施形態による、３Ｄシーンの点のテクスチャ情報を含むアトラスの例を示す。本原理の非限定的な実施形態による、図６の３Ｄシーンの点の深度情報を含むアトラスの例を示す。カメラアレイによって捕捉された３Ｄシーンのビューのうちの２つを示す。捕捉される単純なシーンを示す。本原理の第１の実施形態による、深度アトラス、反射率アトラス、及び色アトラスにおける図９の３Ｄシーンを符号化する第１の例を示す。本原理の第２の実施形態による、深度アトラス、反射率アトラス、及び色アトラスにおける図９の３Ｄシーンを符号化する第２の例を示す。本原理の第３の実施形態による、深度アトラス、反射率アトラス、及び色アトラスにおける図９の３Ｄシーンを符号化する第３の例を示す。複雑な光効果を用いて３Ｄシーンを符号化するための方法を例示する。複雑な光効果を用いて３Ｄシーンをレンダリングするための方法を例示する。

本原理は、本原理の例が示される、添付の図面を参照して以下により完全に説明される。しかしながら、本原理は、多くの代替形態で具体化され得、本明細書に記載の実施例に限定されるものとして解釈されるべきではない。したがって、本原理は、様々な修正及び代替的な形態の余地があるが、その具体的な例は、図面の例として示され、本明細書において詳細に説明される。しかしながら、本原理を開示された特定の形態に限定する意図はないが、反対に、本開示は、特許請求の範囲によって定義される本原理の趣旨及び範囲内にある全ての修正、均等物及び代替物を網羅することであることを理解されたい。

本明細書で使用される用語は、特定の実施例のみを説明する目的のためであり、本原理を限定することを意図するものではない。本明細書で使用される場合、単数形「ａ」、「ａｎ」及び「ｔｈｅ」は、文脈が別途明確に示されない限り、複数形も含むことが意図される。本明細書で使用される場合、「含む（comprises）」、「含む（comprising）」、「含む（includes）」及び／又は「含む（including）」という用語は、記載された特徴、整数、ステップ、動作、要素、及び／又は構成要素の存在を指定するが、１つ以上の他の特徴、整数、ステップ、動作、要素、構成要素及び／又はそれらのグループの存在又は追加を排除しないことが更に理解されるであろう。更に、要素が別の要素に「応答する」又は「接続される」と称される場合、それは、他の要素に直接応答するか、又は他の要素に接続され得るか、又は介在要素が存在し得る。対照的に、要素が他の要素に「直接応答する」又は「直接接続される」と称される場合、介在要素は存在しない。本明細書で使用される場合、「及び／又は」という用語は、関連付けられた列挙された項目のうちの１つ以上の任意の及び全ての組み合わせを含み、「／」と略され得る。

本明細書では、第１、第２などの用語が様々な要素を説明するために使用され得るが、これらの要素はこれらの用語によって限定されるべきではないことが理解されよう。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。例えば、第１の要素は、第２の要素と呼ぶことができ、同様に、第２の要素は、本原理の教示から逸脱することなく、第１の要素と呼ぶことができる。

図の一部は、通信の主要な方向を示すために通信経路上に矢印を含むが、通信は、描かれた矢印と反対方向に発生し得ることを理解されたい。

いくつかの例は、各ブロックが、指定された論理機能を実装するための１つ以上の実行可能命令を含む、回路要素、モジュール又はコードの部分を表すブロック図及び動作フローチャートに関して説明される。他の実装形態では、ブロックに記載された機能は、記載された順序から起こり得ることにも留意されたい。例えば、連続して示されている２つのブロックは、実際には実質的に同時に実行され得るか、又は関与する機能に応じて、ブロックが逆の順序で実行され得る。

本明細書における「一例による」又は「一例における」は、本実施例に関連して説明される特定の特徴、構造又は特性が、本原理の少なくとも１つの実装形態に含まれ得ることを意味する。本明細書の様々な場所における「一例による」又は「一例における」の句の出現は、必ずしも全てが同じ例を指しているわけではなく、別個の又は代替的な実施例では、必ずしも他の実施例と相互に排他的ではない。

特許請求の範囲に現れる参照番号は、単に例示としてのものであり、特許請求の範囲の範囲に限定的な影響を及ぼさないものとする。明示的に記載されていないが、本実施例及び変形例は、任意の組み合わせ又は部分的な組み合わせで用いられ得る。

図１は、オブジェクト及び３Ｄモデル１０に対応する点群１１の点の三次元（３Ｄ）モデル１０を示す。３Ｄモデル１０及び点群１１は、例えば、他のオブジェクトを含む３Ｄシーンのオブジェクトの潜在的な３Ｄ表現に対応し得る。モデル１０は、３Ｄメッシュ表現であり得、点群１１の点は、メッシュの頂点であり得る。点群１１の点はまた、メッシュの面の表面上に広がった点であり得る。モデル１０はまた、点群１１のスプラッティングされたバージョンとして表すこともでき、モデル１０の表面は、点群１１の点をスプラッティングすることによって作成される。モデル１０は、ボクセル又はスプラインなどの多くの異なる表現によって表され得る。図１は、点群が３Ｄオブジェクトの表面表現と定義され得、３Ｄオブジェクトの表面表現がクラウドの点から生成され得るという事実を示す。本明細書で使用される場合、画像上の（３Ｄシーンの伸長点による）３Ｄオブジェクトの投影点は、この３Ｄオブジェクト、例えば、点群、メッシュ、スプラインモデル又はボクセルモデルの任意の表現を投影することと同等である。

点群は、例えば、ベクトルベースの構造としてメモリで表すことができ、各点は、視点の参照フレーム内の独自の座標（例えば、三次元座標ＸＹＺ、又は視点からの／視点への立体角及び距離（深度とも呼ばれる））及び成分とも呼ばれる１つ以上の属性を有する。成分の例は、様々な色空間、例えば、ＲＧＢ（赤、緑及び青）又はＹＵＶ（Ｙが輝度成分及びＵＶが２つの色差成分である）で発現され得る色成分である。点群は、オブジェクトを含む３Ｄシーンの表現である。３Ｄシーンは、所与の視点又は視点の範囲から見ることができる。点群は、多くの方法によって、例えば、
・任意選択的に深度アクティブセンシングデバイスによって補完された、カメラのリグによって撮影された実オブジェクトの捕捉から、
・モデリングツールにおける仮想カメラのリグによって撮影された仮想／合成オブジェクトの捕捉から、
・実オブジェクトと仮想オブジェクトの両方の混合物から、取得され得る。

３Ｄシーンは、実際の（又は仮想の）シーンの一部である捕捉されたシーンに対応する。第１に、捕捉されるべきいくつかの部分又はシーンは、全てのカメラから見えない（隠されているため）。これらの部分は、３Ｄシーン外にある。第２に、カメラのリグの視野は、３６０°よりも低い場合がある。その場合、実際のシーンの一部は、捕捉された３Ｄシーン外のままである。それにもかかわらず、３Ｄシーン外のいくつかの部分は、３Ｄシーンの部分に反射され得る。

図２は、３Ｄシーンのシーケンスを表すデータの符号化、送信及び復号の非限定的な例を示す。例えば、同時に、３ＤｏＦ、３ＤｏＦ＋及び６ＤｏＦ復号に適合することができる符号化形式。

３Ｄシーン２０のシーケンスが取得される。写真のシーケンスが２Ｄビデオであるとき、３Ｄシーンのシーケンスは３Ｄ（容積とも呼ばれる）ビデオである。３Ｄシーンのシーケンスは、３ＤｏＦ、３Ｄｏｆ＋又は６ＤｏＦレンダリング及び表示のための容積ビデオレンダリングデバイスに提供され得る。

３Ｄシーン２０のシーケンスは、エンコーダ２１に提供される。エンコーダ２１は、入力として１つの３Ｄシーン又は３Ｄシーンのシーケンスを取り、入力を表すビットストリームを提供する。ビットストリームは、メモリ２２内に、かつ／又は電子データ媒体上に記憶され得、ネットワーク２２を介して送信され得る。３Ｄシーンのシーケンスを表すビットストリームは、メモリ２２から読み取られ、かつ／又はデコーダ２３によってネットワーク２２から受信され得る。デコーダ２３は、当該ビットストリームによって入力され、例えば、点群形式で３Ｄシーンのシーケンスを提供する。

エンコーダ２１は、いくつかのステップを実装するいくつかの回路を備え得る。第１のステップでは、エンコーダ２１は、各３Ｄシーンを少なくとも１つの２Ｄ写真に投影する。３Ｄ投影は、三次元点を二次元平面にマッピングする任意の方法である。グラフィックデータを表示するための最新の方法は、平面（いくつかのビット平面からの画素情報）二次元媒体に基づいているため、このタイプの投影の使用は、特にコンピュータグラフィック、操作及びドラフト化において広範囲に及ぶ。投影回路２１１は、３Ｄシーン２０のシーケンスの３Ｄシーンのための少なくとも１つの二次元フレーム２１１１を提供する。フレーム２１１１は、フレーム２１１１上に投影された３Ｄシーンを表す深度情報を含む。変形例では、フレーム２１１１は、他の属性を含む。本原理によれば、投影された属性は、フレーム上に投影される３Ｄシーンのテクスチャ（すなわち、色属性）、熱、反射率、又は他の属性を表すことができる。変形例では、情報は、別々のフレーム、例えば２つの別々のフレーム２１１１及び２１１２において、又は属性ごとに１つのフレームにおいて符号化される。

メタデータ２１２は、投影回路２１１によって使用され、更新される。メタデータ２１２は、図５～図７に関連して説明したように、投影動作（例えば、投影パラメータ）並びに色及び深度情報がフレーム２１１１及び２１１２内で編成される方法に関する情報を含む。

ビデオ符号化回路２１３は、フレーム２１１１及び２１１２のシーケンスをビデオとして符号化する。３Ｄシーン２１１１及び２１１２の写真（又は３Ｄシーンの写真のシーケンス）は、ビデオエンコーダ２１３によってストリーム内で符号化される。次いで、ビデオデータ及びメタデータ２１２は、データカプセル化回路２１４によってデータストリーム内でカプセル化される。

エンコーダ２１３は、例えば、
－ＪＰＥＧ、仕様ＩＳＯ／ＣＥＩ１０９１８－１ＵＩＴ－Ｔ推奨Ｔ．８１、ｈｔｔｐｓ：／／ｗｗｗ．ｉｔｕ．ｉｎｔ／ｒｅｃ／Ｔ－ＲＥＣ－Ｔ．８１／ｅｎ；
－ＭＰＥＧ－４ＡＶＣ又はｈ２６４とも呼ばれるＡＶＣなどのエンコーダに準拠する。ＵＩＴ－ＴＨ．２６４及びＩＳＯ／ＣＥＩＭＰＥＧ－４－Ｐａｒｔ１０（ＩＳＯ／ＣＥＩ１４４９６－１０）、ｈｔｔｐ：／／ｗｗｗ．ｉｔｕ．ｉｎｔ／ｒｅｃ／Ｔ－ＲＥＣ－Ｈ．２６４／ｅｎ，ＨＥＶＣ（その仕様は、ＩＴＵウェブサイト、Ｔ推奨、Ｈ系列、ｈ２６５、ｈｔｔｐ：／／ｗｗｗ．ｉｔｕ．ｉｎｔ／ｒｅｃ／Ｔ－ＲＥＣ－Ｈ．２６５－２０１６１２－Ｉ／ｅｎで見出される）、
－３Ｄ－ＨＥＶＣ（仕様がＩＴＵウェブサイト、Ｔ推奨、Ｈ系列、ｈ２６５、ｈｔｔｐ：／／ｗｗｗ．ｉｔｕ．ｉｎｔ／ｒｅｃ／Ｔ－ＲＥＣ－Ｈ．２６５－２０１６１２－Ｉ／ｅｎａｎｎｅｘＧａｎｄＩで見出されるＨＥＶＣの拡張子）、
－Ｇｏｏｇｌｅによって開発されたＶＰ９、又は
－ＡｌｌｉａｎｃｅｆｏｒＯｐｅｎＭｅｄｉａによって開発されたＡＶ１（ＡＯ媒体ビデオ１）。

データストリームは、デコーダ２３によって、例えばネットワーク２２を介してアクセス可能なメモリに記憶される。デコーダ２３は、復号の異なるステップを実装する異なる回路を備える。デコーダ２３は、エンコーダ２１によって生成されたデータストリームを入力として取り、ヘッドマウントデバイス（ＨＭＤ）のような容積ビデオ表示デバイスによってレンダリングされ、かつ表示される３Ｄシーン２４のシーケンスを提供する。デコーダ２３は、ソース２２からストリームを取得する。例えば、ソース２２は、
－例えば、ビデオメモリ又はＲＡＭ（又はランダムアクセスメモリ）、フラッシュメモリ、ＲＯＭ（又は読み取り専用メモリ）、ハードディスクなどのローカルメモリと、
－例えば、質量ストレージ、ＲＡＭ、フラッシュメモリ、ＲＯＭ、光学ディスク又は磁気サポートとのインターフェースなどのストレージインターフェースと、
－例えば、有線インターフェース（例えば、バスインターフェース、広域ネットワークインターフェース、ローカルエリアネットワークインターフェース）又は無線インターフェース（ＩＥＥＥ８０２．１１インターフェース又はＢｌｕｅｔｏｏｔｈ（登録商標）インターフェースなど）などの通信インターフェースと、
－ユーザがデータを入力することを可能にするグラフィカルユーザインターフェースなどのユーザインターフェースと、を含むセットに属する。

デコーダ２３は、データストリームに符号化されたデータを抽出するための回路２３４を備える。回路２３４は、データストリームを入力として取り、ストリーム及び二次元ビデオにおいて符号化されたメタデータ２１２に対応するメタデータ２３２を提供する。ビデオは、フレームのシーケンスを提供するビデオデコーダ２３３によって復号される。復号されたフレームは、色及び深度情報を含む。変形例では、ビデオデコーダ２３３は、一方が色情報を含み、他方が深度情報を含む２つのフレームのシーケンスを提供する。回路２３１は、メタデータ２３２を使用して、復号されたフレームからの色及び深度情報を投影せず、３Ｄシーン２４のシーケンスを提供する。３Ｄシーン２４のシーケンスは、２Ｄビデオとしての符号化に関連する精度が潜在的に低下３Ｄシーン２０のシーケンス及びビデオ圧縮に対応する。

レンダリングにおいて、ユーザが見ているビューポート画像は、合成されたビュー、すなわち、カメラによって捕捉されていないシーン上のビューである。鏡面反射が、このカメラの視点から観察されるように、取得リグの１つのカメラによって捕捉される場合、異なる仮想視点からの３Ｄシーンをレンダリングすることは、新しい視点に従って反射されたコンテンツの位置及び外観を修正することを必要とする。本原理によれば、複雑な光効果のレンダリングのための情報は、データストリームにおいて運ばれる。

図３は、図１３及び図１４に関連して説明される方法を実施するように構成され得るデバイス３０の例示的なアーキテクチャを示す。図２のエンコーダ２１及び／又はデコーダ２３は、このアーキテクチャを実装し得る。代替的に、エンコーダ２１及び／又はデコーダ２３の各回路は、例えば、それらのバス３１を介して、かつ／又はＩ／Ｏインターフェース３６を介して一緒に連結された、図３のアーキテクチャによるデバイスであり得る。

デバイス３０は、データ及びアドレスバス３１によって一緒に連結された以下の要素：
－例えば、ＤＳＰ（Digital Signal Processor、又はデジタル信号プロセッサ）であるマイクロプロセッサ３２（又はＣＰＵ）と、
－ＲＯＭ（Read Only Memory、又は読み取り専用メモリ）３３と、
－ＲＡＭ（Random Access Memory、又はランダムアクセスメモリ）３４と、
－ストレージインターフェース３５と、
－アプリケーションから、送信するデータを受信するためのＩ／Ｏインターフェース３６と、
－電源、例えば、バッテリと、を備える。

一例によれば、電源はデバイスの外部にある。言及されたメモリの各々において、本明細書で使用される「レジスタ」という単語は、小さな容量の領域（いくつかのビット）又は非常に大きな領域（例えば、全体のプログラム又は大量の受信された、又は復号されたデータ）に対応し得る。ＲＯＭ３３は、少なくともプログラム及びパラメータを含む。ＲＯＭ３３は、本原理に従って技術を実行するためのアルゴリズム及び命令を記憶することができる。オンに切り替えられると、ＣＰＵ３２は、ＲＡＭ内のプログラムをアップロードし、対応する命令を実行する。

ＲＡＭ３４は、レジスタ内で、ＣＰＵ３２によって実行され、デバイス３０のスイッチオン後にアップロードされるプログラムと、レジスタ内の入力データと、レジスタ内の方法の異なる状態の中間データと、レジスタ内の方法の実行のために使用される他の変数と、を含む。

本明細書に記載の実装形態は、例えば、方法又はプロセス、装置、コンピュータプログラム製品、データストリーム、又は信号において実装され得る。実装形態の単一の形態の文脈でのみ考察された場合（例えば、方法又はデバイスとしてのみ考察された）であっても、考察された特徴の実装形態は、他の形態（例えば、プログラム）においても実装され得る。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。この方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサなどの装置において実装され得る。プロセッサには、例えば、エンドユーザ間の情報の通信を容易にする、コンピュータ、携帯電話、ポータブル／携帯情報端末（Personal Digital Assistant、「ＰＤＡ」）などのデバイスなどの通信デバイスも含まれる。

実施例によれば、デバイス３０は、図１３及び図１４に関連して説明された方法を実装するように構成されており、
－モバイルデバイスと、
－通信デバイスと、
－ゲームデバイスと、
－タブレット（又はタブレットコンピュータ）と、
－ラップトップと、
－静止画カメラと、
－ビデオカメラと、
－符号化チップと、
－サーバ（例えば、ブロードキャストサーバ、ビデオオンデマンドサーバ又はウェブサーバ）と、を含むセットに属する。

図４は、データがパケットベースの送信プロトコルを介して送信されるときのストリームの構文の実施形態の一例を示す。図４は、容積ビデオストリームの例示的な構造４を示す。構造は、構文の独立した要素においてストリームを編成する容器からなる。構造は、ストリームの全ての構文要素に共通のデータのセットであるヘッダ部分４１を含み得る。例えば、ヘッダ部分は、構文要素に関するメタデータのいくつかを含み、それらの各々の性質及び役割を説明する。ヘッダ部分はまた、図２のメタデータ２１２の一部、例えば、３Ｄシーンの点をフレーム２１１１及び２１１２上に投影するために使用される中心視点の座標を含み得る。構造は、構文４２の要素と、構文４３の少なくとも１つの要素を含むペイロードを含む。構文要素４２は、色及び深度フレームを表すデータを含む。画像は、ビデオ圧縮方法に従って圧縮されている場合がある。

構文４３の要素は、データストリームのペイロードの一部であり、構文４２の要素のフレームがどのように符号化されるかについてのメタデータ、例えば、３Ｄシーンの点をフレーム上に投影するか、パッキングするために使用されるパラメータを含み得る。そのようなメタデータは、ビデオの各フレーム又は（ビデオ圧縮標準において写真のグループ（Group of Pictures、ＧｏＰ）としても既知である）フレームのグループと関連付けられ得る。

図５は、４つの投影中心の例を有するパッチアトラスアプローチを示す。３Ｄシーン５０は、特徴を含む。例えば、投影中心５１は、遠近投影カメラであり、カメラ５３は、正投影カメラである。カメラはまた、例えば、球形マッピング（例えば、正距円筒図法マッピング）又は立方体マッピングを有する全方向カメラであり得る。３Ｄシーンの３Ｄ点は、メタデータの投影データに記載された投影動作に従って、投影中心に位置する仮想カメラに関連付けられた２Ｄ平面上に投影される。図５の例では、カメラ５１によって捕捉された点の投影は、遠近法マッピングに従ってパッチ５２上にマッピングされ、カメラ５３によって捕捉された点の投影は、直交マッピングに従ってパッチ５４上にマッピングされる。

投影ピクセルのクラスター化により、多数の２Ｄパッチが得られ、これは長方形のアトラス５５にパッキングされる。アトラス内のパッチの組織は、アトラスレイアウトを定義する。一実施形態では、同一のレイアウトを有する２つのアトラス：１つはテクスチャ（すなわち、色）情報のためのものであり、１つは奥行き情報のためのもの。同じカメラ又は２つの別個のカメラによって捕捉された２つのパッチは、例えば、パッチ５４及び５６のような３Ｄシーンの同じ部分を表す情報を含み得る。

パッキング動作は、生成されたパッチごとにパッチデータを生成する。パッチデータは、投影データの参照（例えば、投影データのテーブル内のインデックス又は投影データへのポインタ（メモリ又はデータストリーム内のアドレス））及びアトラス内のパッチの場所及びサイズを説明する情報（例えば、ピクセルの上部左角座標、サイズ、及び幅）を説明する情報を含む。パッチデータ項目は、１つ又は２つのアトラスの圧縮データと関連付けられてデータストリーム内でカプセル化されるメタデータに追加される。

図６は、本原理の非限定的な実施形態による、属性情報、例えば、３Ｄシーンの点のテクスチャ（色とも呼ばれる）情報（例えば、ＲＧＢデータ又はＹＵＶデータ）を含むアトラス６０の例を示す。図５に関連して説明したように、アトラスは、画像パッキングパッチであり、パッチは、３Ｄシーンの点の一部を投影することによって取得される写真である。

図６の例では、アトラス６０は、視点から見える３Ｄシーンの点のテクスチャ情報及び１つ以上の第２の部分６２を含む第１の部分６１を含む。第１の部分６１のテクスチャ情報は、例えば、正距円筒投影マッピングに従って取得され得、正距円筒図法マッピングは、球形投影マッピングの一例である。図６の例では、第２の部分６２は、第１の部分６１の左右の境界に配置されるが、第２の部分は、異なって配置され得る。第２の部分６２は、視点から見える部分に相補的である３Ｄシーンの部分のテクスチャ情報を含む。第２の部分は、第１の視点から見える点（第１の部分に記憶されているテクスチャ）３Ｄシーンから除去することによって、及び同じ視点に従って残りの点を投影することによって、取得することができる。後者のプロセスは、３Ｄシーンの隠れた部分が各々の時点で取得されるように反復的に繰り返され得る。変形例によれば、第２の部分は、視点、例えば、中心視点（第１の部分に記憶されているテクスチャ）から見える点を３Ｄシーンから除去することによって、及び、第１の視点とは異なる視点に従って、例えば、中心視点上に中心を置いたビューの空間（例えば、３ＤｏＦレンダリングの視認空間）の１つ以上の第２の視点から、残りの点を投影することによって、取得され得る。

第１の部分６１は、（３Ｄシーンの第１の部分に対応する）第１の大きなテクスチャパッチとして見ることができ、第２の部分６２は、（第１の部分に相補的である３Ｄシーンの第２の部分に対応する）より小さなテクスチャパッチを含む。そのようなアトラスは、（第１の部分６１のみをレンダリングするとき）３ＤｏＦレンダリング及び３ＤｏＦ＋／６ＤｏＦレンダリングと同時に互換性があるという利点を有する。

図７は、本原理の非限定的な実施形態による、図６の３Ｄシーンの点の奥行き情報を含むアトラス７０の例を示す。アトラス７０は、図６のテクスチャ画像６０に対応する奥行き画像として見ることができる。

アトラス７０は、中心視点から見える３Ｄシーンの点の奥行き情報を含む第１の部分７１及び１つ以上の第２の部分７２を含む。アトラス７０は、アトラス６０と同じ方法で取得され得るが、テクスチャ情報の代わりに３Ｄシーンの点に関連付けられた奥行き情報を含む。

３Ｄシーンの３ＤｏＦレンダリングの場合、１つの視点のみ、典型的には中心視点が考慮される。ユーザは、第１の視点の周りで３自由度で頭部を回転させて、３Ｄシーンの様々な部分を視聴することができるが、ユーザはこの固有の視点を移動させることができない。符号化されるシーンの点は、この固有のビューから見える点であり、３ＤｏＦレンダリングのために符号化／復号されるためにテクスチャ情報のみが必要である。ユーザがそれらにアクセスできないときに、３ＤｏＦレンダリングのためのこの固有の視点から見えないシーンの点を符号化する必要はない。

６ＤｏＦレンダリングに関して、ユーザは、シーン内の視点を全て移動させることができる。この場合、全ての点が自身の視点を移動させることができるユーザによって潜在的にアクセス可能であるため、ビットストリーム内のシーンの全ての点（奥行き及びテクスチャ）を符号化する必要がある。符号化段階では、どの視点からからユーザが３Ｄシーンを観察するかを先験的に知る手段はない。

３ＤｏＦ＋レンダリングに関して、ユーザは、中心視点の周りの限られた空間内で視点を移動させることができる。これにより、視差を体験することが可能になる。ビューの空間の任意の点から見えるシーンの一部を表すデータは、中心視点（すなわち、第１の部分６１及び７１）に従って見える３Ｄシーンを表すデータを含むストリームに符号化されるべきである。ビューの空間のサイズ及び形状は、例えば、符号化ステップで決められ、かつ決定され、ビットストリーム内で符号化され得る。デコーダは、ビットストリームからこの情報を取得することができ、レンダラは、ビューの空間を取得された情報によって決定された空間に制限する。別の例によれば、レンダラは、例えば、ユーザの動きを検出するセンサの能力に関連して、ハードウェア制約に従ってビューの空間を決定する。そのような場合、符号化段階で、レンダラのビューの空間内の点から見える点がビットストリーム内で符号化されていない場合、この点はレンダリングされない。更なる例によれば、３Ｄシーンの全ての点を表すデータ（例えば、テクスチャ及び／又は幾何学的形状）は、ビューのレンダリング空間を考慮せずにストリーム内で符号化される。ストリームのサイズを最適化するために、シーンの点のサブセットのみ、例えば、ビューのレンダリング空間に従って見ることができる点のサブセットを符号化することができる。

本原理によれば、容積ビデオ送信フォーマットが提案される。このフォーマットは、光線追跡ベースのレンダリングエンジンが光効果に関して視覚的に現実的な仮想ビューを合成することを可能にするために、非ランバートパッチのシグナリングをそれらの光反射特性と共に含む。

本原理によるフォーマットのシンタックスは、以下を含む。
－各非ランバートパッチについての：
パッチサンプルの反射率属性、
パッチ材料の光反射特性（双方向反射率分布関数）、及び
現在のパッチ内に反射された他のパッチのリスト。
－シーン視錐台から見出された反射されたパッチは、それらのジオメトリ及びテクスチャ成分と共に、光源として考慮される。
－他の定刻光源又は拡散光源のパラメータ。

既存のレンダリングエンジンがそのような説明された３Ｄシーンをレンダリングすることを可能にするが、高度な光効果を用いない、レトロ互換性のある実施形態も説明される。

図８は、カメラアレイによって捕捉された３Ｄシーンのビューのうちの２つを示す。ビュー８１１は、上から見たシーンのビューであり、ビュー８３５より左側にある。３Ｄシーンは、反射オブジェクト８１及び８２を含む（オーブンドアは、床に巨大な蜘蛛を反射する）。ビュー８１１及び８３５は、３Ｄシーンの同じ点に対応する情報を含む。しかしながら、シーンの照明及び異なる取得位置のために、これらの点に関連付けられた色情報は、ビューごとに異なり得る。ビュー８１１はまた、ビュー８３５の視点から見ることができない３Ｄシーンの点に関する情報を含み、その逆も含む。

レンダリングにおけるスティッチングを助けるために、冗長情報を取り除き、３Ｄ空間の取り除かれた領域間のいくらかの重複を保存することによって、捕捉されたマルチビュー＋深度（ＭＶＤ）画像から３Ｄシーンを符号化するために、少なくとも１つのアトラスが生成される。アトラスは、ユーザが移動し得る３ＤｏＦ＋ビューイング空間内の任意の視点から任意のビューポート画像を再構成／合成するのに十分であると想定される。そうするために、アトラスからの全てのパッチをスティッチして所望のビューポート画像を復元する合成プロセスが実行される。しかしながら、このスティッチングステップは、アトラスにおいて表されたシーンが図８に例示されるような鏡面／反射成分又は透過成分を含むとき、強いアーチファクトにさらされ得る。そのような光効果は、見る位置に依存し、したがって、関係する空間部分の知覚される色は、１つの視点から他の視点に変化し得る。

図９は、説明のために簡略化された、捕捉されるシーンを示す。このシーンは、拡散反射を有する２つの平面（「壁」及び「床」）と、鏡面反射特性及び拡散反射特性の両方を有する１つの非平面９１（「鏡」）とから構成される。カメラ９２の視錐台の外（すなわち、捕捉された３Ｄシーンの外）に位置する２つのオブジェクト９３は、ミラー９１に反射される。

図１０は、本原理の第１の実施形態による、深度アトラス１００ａ、反射率アトラス１００ｂ、及び色アトラス１００ｃにおける図９の３Ｄシーンを符号化する例を示す。３Ｄシーンの部分と、３Ｄシーンの少なくとも１つの部分の上に反射された３Ｄシーン外の部分とは、図５に関連して説明されるようにパッチの上に投影される。各パッチサンプルについて、深度値及び異なる属性値が取得される。本原理によれば、深度パッチ、色パッチ及び反射率パッチは、これらの部分の各々について取得される。

本原理の第１の実施形態では、深度アトラス１００ａは、全ての深度パッチ１０１ａ～１０７ａ（すなわち、図１に関連して説明したような捕捉された３Ｄシーンの部分を投影することによって取得されるパッチ１０１ａ～１０５ａ、並びに３Ｄシーンの少なくとも１つの部分に反射された捕捉された３Ｄシーン外の部分を投影することによって取得されるパッチ１０６ａ及び１０７ａ）をパッキングすることによって生成される。図９の例では、鏡及び鏡に映る２つのオブジェクトは平面ではない。次いで、対応する深度パッチ１０１ａ、１０６ａ及び１０７ａは、図１０においてグレーの勾配で表される異なる深度値を記憶する。

色アトラス１００ｃは、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分（図９の例では、非平面ミラーに反射された２つのオブジェクト）の色パッチ１０６ｃ、１０７ｃをパッキングすることによって生成される。

反射率アトラス１００ｂは、３Ｄシーンの部分の投影に対応する反射率パッチ１０１ｂ～１０５ｂをパッキングすることによって生成される。パッチサンプルのスペクトル反射率特性を記述する反射率属性は、例えば、アトラスフレームのＲ、Ｇ及びＢチャネルにおいて３次元で指定することができる。図９のミラーに対応する反射率パッチ１０１ｂは、ミラーに対応する点の投影の反射率属性のみを含む。したがって、反射されたオブジェクト９３は、このパッチでは見えない。本原理のあらゆる実施形態において、各反射率パッチは、双方向反射率分布関数（ＢＲＤＦ）としても知られる、光がその表面でどのように反射されるかを定義するパラメータ化モデルを表す情報に関連付けられる。いくつかのＢＲＤＦパラメトリックモデルが存在し、その中で、経験的フォンモデルが当技術分野で非常に使用されている。フォンモデルは、以下の４つのパラメータによって定義される。
・ｋｓ、入射光の鏡面項の反射率。
・ｋｄ、入射光の拡散項の反射率（ランバート反射率）。
・ｋａ、レンダリングされたシーン内の全ての点に存在する周囲項の反射率。
・α、この材料の光沢定数であり、より滑らかでより鏡面状の表面ではより大きい。

レンダリングにおいて、表面のＢＲＤＦからの光反射及び入射光を導出することは、各サンプルにおける表面法線の知識を必要とする。そのような法線値は、レンダリング側で深度マップから計算され得るか、又は本原理の全ての実施形態の変形例では、追加の法線属性パッチアトラスが、深度アトラス、反射率アトラス、及び色アトラスと共に送信される。この変形例は、レンダリング側における帯域幅とコンピューティングリソースとの間のトレードオフである。

本原理のあらゆる実施形態では、反射率アトラスの各パッチについて、現在のパッチに反射される色パッチのリストが、パッチパラメータ（すなわち、パッチに関連付けられたメタデータ）に追加される。図１０の例では、反射率パッチ１０１ａのパラメータは、色アトラス１００ｃ内の反射率パッチ１０６ｃ及び１０７ｃが反射率パッチ１０１ａに反射されることを示す。そのような情報がなければ、レンダラは、この情報を取り出すために３Ｄシーンジオメトリ全体を再構成及び分析しなければならない。

光線追跡技法に基づくレンダラは、伝送された表面特性を活用し、現実的な視点依存光効果を合成する。

図１１は、本原理の第２の実施形態による、深度アトラス１００ａ、反射率アトラス１１０ｂ、及び色アトラス１１０ｃにおける図９の３Ｄシーンの符号化の例を示す。３Ｄシーンの部分と、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分とについて、同じ深度、色及び反射率パッチが取得される。第２の実施形態では、深度アトラス１００ａは、深度パッチ１０１ａ～１０７ａごとにパッキングすることによって生成される。

色アトラス１１０ｃは、３Ｄシーンのランバート部分（すなわち、非反射部分）に対応する色パッチ１０２ｃ～１０５ｃと、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分に対応する色パッチ１０６ｃ及び１０７ｃとをパッキングすることによって生成される。

反射率アトラス１１０ｂは、３Ｄシーンの反射部分（すなわち、３Ｄシーンの非ランバート部分）に対応する反射率パッチ１０１ｂをパッキングすることによって生成される。パッチアトラス１１０ｂの各反射率パッチについて、ＢＲＤＦ情報及び現在のパッチに反射される色パッチのリストが、メタデータ内のパッチに関連付けられる。

変形例では、３Ｄシーンの反射部分に対応する法線パッチをパッキングする法線アトラスが、深度アトラス１００ａ、反射率アトラス１１０ｂ、及び色アトラス１１０ｃに関連付けられる。

図１２は、本原理の第３の実施形態による、深度アトラス１００ａ、反射率アトラス１１０ｂ、及び色アトラス１２０ｃにおける図９の３Ｄシーンを符号化する例を示す。３Ｄシーンの部分と、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分とについて、同じ深度、色及び反射率パッチが取得される。第２の実施形態では、深度アトラス１００ａは、深度パッチ１０１ａ～１０７ａごとにパッキングすることによって生成される。

色アトラス１２０ｃは、３Ｄシーンの部分（すなわち、ランバート部分及び反射部分）に対応する色パッチ１０１ｃ～１０５ｃと、３Ｄシーンの少なくとも１つの部分に反射された３Ｄシーン外の部分に対応する色パッチ１０６ｃ及び１０７ｃとをパッキングすることによって生成される。図１２において、カメラ視点から見られるような反射を運ぶテクスチャパッチ１０１ｃは、色アトラスにパッキングされ、レトロ互換性のあるレンダラにのみ有用である。そのようなレンダリングモードでは、深度パッチ１０１ａ～１０５ａ及び色パッチ１０１ｃ～１０５ｃのみが復号され、レンダラに供給される。

変形例では、３Ｄシーンの反射部分に対応する法線パッチをパッキングする法線アトラスが、深度アトラス１００ａ、反射率アトラス１１０ｂ、及び色アトラス１２０ｃに関連付けられる。

メタデータは、３Ｄシーンを符号化するアトラスに関連付けられる。本原理によれば、メタデータは、属性ごとに別々のパッキング（すなわち、アトラス内のパッチの位置及び向き）を可能にし、パッチが全ての属性アトラスフレーム内に常に存在するわけではない可能性も可能にする。メタデータのための可能なシンタックスは、以下のようなＭＩＶ規格のシンタックスに基づき得る。

アトラスシーケンスパラメータは、太字のシンタックス要素で拡張され得る。

パッチデータユニットは、太字の要素で拡張されてもよい。

ここで、
１に等しいｐｄｕ＿ｌｉｇｈｔ＿ｓｏｕｒｃｅ＿ｆｌａｇ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチが、シーンの視錐台の外部の光源であり、テクスチャアトラスフレーム内に存在し、反射率アトラスフレーム内に存在しないことを示す。

１に等しいｐｄｕ＿ｒｅｆｌｅｃｔｉｏｎ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチのためのシンタックス構造内に反射モデルパラメータが存在することを示し、これは、反射率アトラスフレーム内に存在するものとする。

ｐｄｕ＿ｒｅｆｌｅｃｔｉｏｎ＿ｍｏｄｅｌ＿ｉｄ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチのための反射モデルのＩＤを指定する。１に等しいｐｄｕ＿ｒｅｆｌｅｃｔｉｏｎ＿ｍｏｄｅｌ＿ｉｄ［ｔｉｌｅＩＤ］［ｐ］は、フォンモデルを示す。

ｐｄｕ＿ｓｐｅｃｕｌａｒ＿ｒｅｆｌｅｃｔｉｏｎ＿ｃｏｎｓｔａｎｔ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチのためのフォンモデルの鏡面反射定数を指定する。

ｐｄｕ＿ｄｉｆｆｕｓｅ＿ｒｅｆｌｅｃｔｉｏｎ＿ｃｏｎｓｔａｎｔ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチのためのフォンモデルの拡散反射定数を指定する。

ｐｄｕ＿ａｍｂｉｅｎｔ＿ｒｅｆｌｅｃｔｉｏｎ＿ｃｏｎｓｔａｎｔ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチのためのフォンモデルの周囲反射定数を指定する。

ｐｄｕ＿ｄｉｆｆｕｓｅ＿ｒｅｆｌｅｃｔｉｏｎ＿ｃｏｎｓｔａｎｔ［ｔｉｌｅＩＤ］［ｐ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチのためのフォンモデルの輝き定数を指定する。

ｐｄｕ＿ｎｕｍ＿ｒｅｆｌｅｃｔｅｄ＿ｐａｔｃｈｅｓ＿ｍｉｎｕｓ１［ｔｉｌｅＩＤ］［ｐ］＋１は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチに反射されるテクスチャパッチの数を指定する。

ｐｄｕ＿ｒｅｆｌｅｃｔｅｄ＿ｐａｔｃｈ＿ｉｄｘ［ｔｉｌｅＩＤ］［ｐ］］［ｉ］は、ＩＤｔｉｌｅＩＤを有するタイル内のインデックスｐを有するパッチ内に反射されたｉ番目のテクスチャパッチのテクスチャアトラスフレーム内のインデックスを指定する。

代替的に、パッチ反射特性は、「材料反射特性」（例えば、「金属」、「木」、「草」など）のセットに相互化され得、ｐｄｕ＿ｅｎｔｉｔｙ＿ｉｄ［ｔｉｌｅＩＤ］［ｐ］シンタックス要素は、各非ランバートパッチを１つの材料ＩＤに関連付けるために使用され得る。その場合、反射モデルパラメータに関連するシンタックス要素は、（登録された材料の各々について）外部手段を介してレンダラに提供され、反射されたパッチのリストのみがパッチデータユニットＭＩＶ拡張にシグナリングされる。

ＭＩＶの共通アトラスシーケンスパラメータセットは、以下のように拡張され得る。

ｃａｓｍｅ＿ｍｉｖ＿ｖ１＿ｒｅｎｄｅｒｉｎｇ＿ｃｏｍｐａｔｉｂｌｅ＿ｆｌａｇは、アトラスジオメトリ及びテクスチャフレームが、ＩＳＯ／ＩＥＣ２３０９０－１２（１Ｅ）の仮想レンダリングプロセスを用いたレンダリングに対して互換性があることを指定する。ｃａｓｍｅ＿ＭＩＶ＿ｖ１＿ｒｅｎｄｅｒｉｎｇ＿ｃｏｍｐａｔｉｂｌｅ＿ｆｌａｇが１に等しいとき、アトラスのジオメトリフレーム及びテクスチャフレーム中のパッチの少なくとも１つのサブセットが、ＩＳＯ／ＩＥＣ２３０９０－１２（１Ｅ）の仮想レンダリングプロセスを用いてレンダリングするために互換性があることが、ビットストリーム適合性の要件である。存在しない場合、ｃａｓｍｅ＿ＭＩＶ＿ｖ１＿ｒｅｎｄｅｒｉｎｇ＿ｃｏｍｐａｔｉｂｌｅ＿ｆｌａｇの値は０に等しいと推論される。

図１３は、複雑な光効果を用いて３Ｄシーンを符号化するための方法１３０を例示する。ステップ１３１において、捕捉された３Ｄシーンの部分を投影することによって、第１の深度パッチ、第１の色パッチ、及び反射率パッチが取得される。第２の深度パッチ及び第２の色パッチはまた、３Ｄシーンの少なくとも１つの部分に反射された捕捉された３Ｄシーン外の部分を投影することによって取得される。ステップ１３２において、深度アトラスは、第１及び第２の深度パッチをパッキングすることによって生成され、色アトラスは、第２の色パッチ及び第１の色パッチのサブセットをパッキングすることによって生成される。第１の実施形態によれば、色アトラスにパッキングされた第１の色パッチのサブセットは空である。第２の実施形態では、色アトラスにパッキングされた第１の色パッチのサブセットは、３Ｄシーンのランバート部分に対応する。第３の実施形態では、色アトラスにパッキングされた第１の色パッチのサブセットは、全ての第１の色パッチを含む。ステップ１３３において、反射率アトラスは、反射率パッチのサブセットをパッキングすることによって生成される。第１の実施形態では、反射率アトラスにパッキングされた反射率パッチのサブセットは、全ての反射率パッチを含む。第２の実施形態では、反射率アトラスにパッキングされた反射率パッチのサブセットは、３Ｄシーンの非拡散反射部分に対応する。第３の実施形態では、反射率アトラスにパッキングされた反射率パッチのサブセットは、３Ｄシーンの非拡散反射部分に対応する。全ての実施形態において、反射率アトラスは、反射率アトラスにパッキングされた各反射率パッチについて、反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報と、反射率パッチに反射された色パッチのリストを示す第２の情報とを含むメタデータに関連付けられる。任意選択のステップ１３４において、法線アトラスは、反射率アトラス内の反射率パッチのサブセットに対応する法線パッチをパッキングすることによって生成される。ステップ１３５では、生成されたアトラス及び関連付けられたメタデータは、データストリーム内で符号化される。

図１４は、複雑な光効果を用いて３Ｄシーンをレンダリングするための方法１４０を例示する。ステップ１４１では、３Ｄシーンを表すデータを保有するデータストリームが取得される。ステップ１４２では、深度パッチをパッキングする深度アトラス及び色パッチをパッキングする色アトラスが、データストリームから復号される。ステップ１４３では、反射率パッチをパッキングする反射率アトラスが、データストリームから復号される。反射率アトラスに関連付けられたメタデータも復号される。メタデータは、反射率アトラスにパッキングされた各反射率パッチについて、反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報と、反射率パッチに反射された色パッチのリストを示す第２の情報とを含む。任意選択のステップ１４４において、反射率アトラス内の反射率パッチのサブセットに対応する法線パッチをパッキングする法線アトラスが、データストリームから復号される。

ステップ１４５では、色パッチのピクセルは、３Ｄシーンのポイントを取り出すために、対応する深度パッチのピクセルに従って逆投影される。ステップ１４６では、光効果は、反射率パッチ及び関連するメタデータ、並びにメタデータに列挙された深度パッチ及び色パッチのピクセルに基づいて、光線追跡法を使用することによって取り出される。変形例では、法線パッチは、光線追跡を容易にするために使用されてもよい。

本明細書に記載の実装形態は、例えば、方法又はプロセス、装置、コンピュータプログラム製品、データストリーム、又は信号において実装され得る。実装形態の単一の形態の文脈でのみ考察された場合（例えば、方法又はデバイスとしてのみ考察された）であっても、考察された特徴の実装形態は、他の形態（例えば、プログラム）においても実装され得る。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。この方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサなどの装置において実装され得る。プロセッサはまた、例えば、スマートフォン、タブレット、コンピュータ、携帯電話、携帯型／パーソナルデジタルアシスタント（「personal digital assistant、ＰＤＡ」）及びエンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスを含む。

本明細書に記載の様々なプロセス及び特徴の実装形態は、様々な異なる機器又はアプリケーション、特に、例えば、データ符号化、データ復号、ビュー生成、テクスチャ処理並びに画像及び関連するテクスチャ情報及び／又は深度情報の他の処理と関連付けられた機器又はアプリケーションにおいて、具体化され得る。そのような機器の例としては、エンコーダ、デコーダ、デコーダからの出力を処理するポストプロセッサ、エンコーダに入力を提供するプリプロセッサ、ビデオコーダ、ビデオデコーダ、ビデオコーデック、ウェブサーバ、セットトップボックス、ラップトップ、パーソナルコンピュータ、携帯電話、ＰＤＡ、及び他の通信デバイスが挙げられる。明確であるはずであるように、機器は、モバイルであり得、モバイル車両に設置され得る。

加えて、方法は、プロセッサによって実行される命令によって実装され得、そのような命令（及び／又は実装形態によって生じたデータ値）は、例えば、集積回路、ソフトウェアキャリア又は他の記憶デバイス、例えば、ハードディスク、コンパクトディスケット（「compact diskette、ＣＤ」）、光学ディスク（例えば、デジタル多用途ディスク又はデジタルビデオディスクと称されることが多いＤＶＤなど）、ランダムアクセスメモリ（「ＲＡＭ」）又は読み取り専用メモリ（「ＲＯＭ」）などのプロセッサ可読媒体上に記憶され得る。命令は、プロセッサ可読媒体上で明白に具体化されたアプリケーションプログラムを形成し得る。命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、又は組み合わせであり得る。命令は、例えば、オペレーティングシステム、別個のアプリケーション、又は２つの組み合わせに見出され得る。したがって、プロセッサは、例えば、プロセスを実行するように構成されたデバイスと、プロセスを実行するための命令を有するプロセッサ可読媒体（記憶デバイスなど）を含むデバイスと、の両方として特徴付けられ得る。更に、プロセッサ可読媒体は、命令に加えて、又は命令の代わりに、実装形態によって生じたデータ値を記憶することができる。

当業者には明らかであるように、実装形態は、例えば、記憶又は送信され得る情報を担持するようにフォーマット化された様々な信号を生じ得る。情報は、例えば、方法を実行するための命令又は記載された実装形態のうちの１つによって生成されたデータを含み得る。例えば、信号は、記載された実施形態の構文を書き込むか、若しくは読み取るためのルールをデータとして担持するか、又は記載された実施形態によって書き込まれた実際の構文値をデータとして担持するようにフォーマット化され得る。かかる信号は、例えば、（例えば、スペクトルの無線周波数部分を使用して）電磁波として、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えば、データストリームを符号化し、符号化されたデータストリームで搬送波を変調することを含み得る。信号が搬送する信号は、例えば、アナログ情報又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンクによって送信され得る。信号は、プロセッサ可読媒体に記憶され得る。

多くの実装形態が説明されている。それにもかかわらず、様々な修正が行われ得ることが理解されるであろう。例えば、異なる実装形態の要素は、他の実装形態を作り出すために組み合わせ、補足、修正、又は削除することができる。加えて、当業者は、開示されたものに対して他の構造及びプロセスを置換することができ、結果として生じる実装形態は、少なくとも実質的に同じ機能を少なくとも実質的に同じ方式で実行して、開示された実装形態と少なくとも実質的に同じ結果を達成することを理解するであろう。したがって、これら及び他の実装形態は、本出願によって企図される。

Claims

方法であって、
－３Ｄシーンの部分について、第１の色パッチ、反射率パッチ、及び第１の深度パッチを取得することと、
－前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分について、第２の色パッチ及び第２の深度パッチを取得することと、
－第１及び第２の深度パッチをパッキングすることによって、深度アトラスを生成することと、
－前記第２の色パッチと前記第１の色パッチのサブセットとをパッキングすることによって、色アトラスを生成することと、
－前記反射率パッチのサブセットをパッキングすることによって、反射率アトラスを生成することと、
－前記反射率アトラスにパッキングされた各反射率パッチについて、
前記反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報を生成すること、及び
前記反射率パッチに反射された色パッチのリストを示す第２の情報を生成することと、
－データストリームに前記深度アトラスと、前記色アトラスと、前記反射率アトラスと、前記第１の情報及び前記第２の情報とを符号化することと、を含む、方法。
－前記色アトラスにパッキングされた前記第１の色パッチの前記サブセットは、空であり、
－前記反射率アトラスにパッキングされた前記反射率パッチの前記サブセットは、全ての反射率パッチを含む、請求項１に記載の方法。
－前記色アトラスにパッキングされた前記第１の色パッチの前記サブセットは、前記３Ｄシーンのランバート部分に対応し、
－前記反射率アトラスにパッキングされた前記反射率パッチの前記サブセットは、前記３Ｄシーンの非拡散反射部分に対応する、請求項１に記載の方法。
－前記色アトラスにパッキングされた前記第１の色パッチの前記サブセットは、全ての第１の色パッチを含み、
－前記反射率アトラスにパッキングされた前記反射率パッチの前記サブセットは、前記３Ｄシーンの非拡散反射部分に対応する、請求項１に記載の方法。
前記双方向反射率分布関数モデルは、フォンモデルである、請求項１から４のいずれか一項に記載の方法。
前記反射率アトラス内の前記反射率パッチの前記サブセットに対応する表面法線パッチをパッキングすることによって、表面法線アトラスを生成することを更に含む、請求項１から５のいずれか一項に記載の方法。
デバイスであって、
プロセッサと、
命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行されると、
－３Ｄシーンの部分について、第１の色パッチ、反射率パッチ、及び第１の深度パッチを取得し、
－前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分について、第２の色パッチ及び第２の深度パッチを取得し、
－第１及び第２の深度パッチをパッキングすることによって、深度アトラスを生成し、
－前記第２の色パッチと前記第１の色パッチのサブセットとをパッキングすることによって、色アトラスを生成し、
－前記反射率パッチのサブセットをパッキングすることによって、反射率アトラスを生成し、
－前記反射率アトラスにパッキングされた各反射率パッチについて、
前記反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報を生成し、かつ
前記反射率パッチに反射された色パッチのリストを示す第２の情報を生成し、並びに
－データストリームに前記深度アトラスと、前記色アトラスと、前記反射率アトラスと、前記第１の情報と、前記第２の情報とを符号化するように動作する、非一時的コンピュータ可読媒体と、を備える、デバイス。
－前記色アトラスにパッキングされた前記第１の色パッチの前記サブセットは、空であり、
－前記反射率アトラスにパッキングされた前記反射率パッチの前記サブセットは、全ての反射率パッチを含む、請求項７に記載のデバイス。
－前記色アトラスにパッキングされた前記第１の色パッチの前記サブセットは、前記３Ｄシーンのランバート部分に対応し、
－前記反射率アトラスにパッキングされた前記反射率パッチの前記サブセットは、前記３Ｄシーンの非拡散反射部分に対応する、請求項７に記載のデバイス。
－前記色アトラスにパッキングされた前記第１の色パッチの前記サブセットは、全ての第１の色パッチを含み、
－前記反射率アトラスにパッキングされた前記反射率パッチの前記サブセットは、前記３Ｄシーンの非拡散反射部分に対応する、請求項７に記載のデバイス。
前記双方向反射率分布関数モデルは、フォンモデルである、請求項７から１０のいずれか一項に記載のデバイス。
前記非一時的コンピュータ可読媒体は、前記反射率アトラス内の前記反射率パッチの前記サブセットに対応する表面法線パッチをパッキングすることによって、表面法線アトラスを生成するように動作する命令を更に記憶する、請求項７から１１のいずれか一項に記載のデバイス。
３Ｄシーンを符号化するデータストリームであって、
－前記３Ｄシーンの部分に対応する第１の深度パッチと、前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分に対応する第２の深度パッチとをパッキングする深度アトラスと、
－前記３Ｄシーンの部分に対応する第１の色パッチと、前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分に対応する第２の色パッチとをパッキングする色アトラスと、
－前記３Ｄシーンの部分に対応する反射率パッチをパッキングする反射率アトラスと、
－前記反射率アトラスにパッキングされた各反射率パッチについて、
・前記反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報、及び
・前記反射率パッチに反射された色パッチのリストを示す第２の情報と、を含む、データストリーム。
前記双方向反射率分布関数モデルは、フォンモデルである、請求項１３に記載のデータストリーム。
前記反射率アトラス内の前記反射率パッチのサブセットに対応する表面法線パッチをパッキングする表面法線アトラスを更に含む、請求項１３又は１４に記載のデータストリーム。
３Ｄシーンをレンダリングする方法であって、前記方法は、
データストリームから、
－前記３Ｄシーンの部分に対応する第１の深度パッチと、前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分に対応する第２の深度パッチとをパッキングする深度アトラスと、
－前記３Ｄシーンの部分に対応する第１の色パッチと、前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分に対応する第２の色パッチとをパッキングする色アトラスと、
－前記３Ｄシーンの部分に対応する反射率パッチをパッキングする反射率アトラスと、
－前記第１の色パッチ及び前記反射率パッチに従って決定されたレンダリングモードをシグナリングする情報と、
－前記反射率アトラスにパッキングされた各反射率パッチについて、
・前記反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報、及び
・前記反射率パッチに反射された色パッチのリストを示す第２の情報とを復号することと、
前記第１及び第２の深度パッチに従って前記第１及び第２の色パッチを逆投影することによって、かつ第１及び第２の情報と関連する色パッチとに従って反射率パッチのための光線追跡を使用することによって、前記３Ｄシーンをレンダリングすることと、を含む、方法。
前記双方向反射率分布関数モデルは、フォンモデルである、請求項１６に記載の方法。
前記データストリームから、前記反射率アトラス内の前記反射率パッチのサブセットに対応する表面法線パッチをパッキングする表面法線アトラスを復号し、かつ光線追跡のために表面法線パッチを使用することを更に含む、請求項１６又は１７に記載の方法。
デバイスであって、
プロセッサと、
命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行されると、
データストリームから、
－３Ｄシーンの部分に対応する第１の深度パッチと、前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分に対応する第２の深度パッチとをパッキングする深度アトラスと、
－前記３Ｄシーンの部分に対応する第１の色パッチと、前記３Ｄシーンの少なくとも１つの部分に反射された前記３Ｄシーン外の部分に対応する第２の色パッチとをパッキングする色アトラスと、
－前記３Ｄシーンの部分に対応する反射率パッチをパッキングする反射率アトラスと、
－前記第１の色パッチ及び前記反射率パッチに従って決定されたレンダリングモードをシグナリングする情報と、
－前記反射率アトラスにパッキングされた各反射率パッチについて、
・前記反射率パッチ上の光反射の双方向反射率分布関数モデルのパラメータを符号化する第１の情報、及び
・前記反射率パッチに反射された色パッチのリストを示す第２の情報とを復号し、
並びに
前記第１及び第２の深度パッチに従って前記第１及び第２の色パッチを逆投影することによって、かつ第１及び第２の情報と関連する色パッチとに従って反射率パッチのための光線追跡を使用することによって、前記３Ｄシーンをレンダリングするように動作する、非一時的コンピュータ可読媒体と、を備える、デバイス。
前記双方向反射率分布関数モデルは、フォンモデルである、請求項１９に記載のデバイス。
前記プロセッサは、前記データストリームから、前記反射率アトラス内の前記反射率パッチのサブセットに対応する表面法線パッチをパッキングする表面法線アトラスを復号し、かつ光線追跡のために表面法線パッチを使用するように更に構成されている、請求項１９又は２０に記載のデバイス。