JP2024521898A - 3次元シーン及びその深度平面データを表現する方法、エンコーダ、及び表示装置 - Google Patents
3次元シーン及びその深度平面データを表現する方法、エンコーダ、及び表示装置 Download PDFInfo
- Publication number
- JP2024521898A JP2024521898A JP2023574350A JP2023574350A JP2024521898A JP 2024521898 A JP2024521898 A JP 2024521898A JP 2023574350 A JP2023574350 A JP 2023574350A JP 2023574350 A JP2023574350 A JP 2023574350A JP 2024521898 A JP2024521898 A JP 2024521898A
- Authority
- JP
- Japan
- Prior art keywords
- depth
- proxy
- scene
- cross
- depth plane
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000015654 memory Effects 0.000 claims description 22
- 238000000926 separation method Methods 0.000 claims description 11
- 230000000007 visual effect Effects 0.000 claims description 8
- 238000012886 linear function Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 10
- 230000004304 visual acuity Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
- G06T15/20—Perspective computation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/388—Volumetric displays, i.e. systems where the image is built up from picture elements distributed through a volume
- H04N13/395—Volumetric displays, i.e. systems where the image is built up from picture elements distributed through a volume with depth sampling, i.e. the volume being constructed from a stack or sequence of 2D image planes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Processing Or Creating Images (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
3次元データセットとして格納された3次元シーンを表現するための方法は、視野方向に沿ったP個の深度平面深度のセットを決定するステップを含む。方法は、3次元データセットから、各深度平面深度について、(i)3次元データセットを構成し、(ii)各々が各々のシーン深度における3次元シーンの各々の横断面を表す、複数の横断面画像のうちの少なくとも1つの断面画像から、P個のプロキシ画像のうちのプロキシ画像を生成することにより、P個のプロキシ画像を含むプロキシ3次元データセットを生成するステップを含む。
Description
[関連出願]
本願は、参照により全体がここに組み込まれる、共に2021年6月2日に出願した米国仮出願番号第63/195898号及び欧州特許出願番号第21177381.7号の優先権を主張する。
本願は、参照により全体がここに組み込まれる、共に2021年6月2日に出願した米国仮出願番号第63/195898号及び欧州特許出願番号第21177381.7号の優先権を主張する。
一部の立体、拡張現実、及び仮想現実アプリケーションは、シーンのビューアに対して異なる距離(深度平面)における一連の画像として3次元シーンを表現する。所望の視点からそのようなシーンをレンダリングするために、各深度平面を順番に処理し、他の平面と合成して、所望のビューア位置での3次元シーンの2次元投影をシミュレートすることができる。この2次元投影は、次に、ヘッドマウント装置、携帯電話、又は他のフラットスクリーン上で表示することができる。ビューアの位置に基づいて2次元投影を動的に調整することで、3次元のシーンの中にいるような体験をシミュレートすることができる。
3次元シーンを正確に表現するために必要な深度平面の数を減少させることは、そのような減少が処理されるべきデータの量を減少させるので価値がある。本明細書に開示される実施形態では、深度を知覚する人間の視覚システムの能力に適合するか又は僅かに上回る正確なシミュレーションをレンダリングできることを保証しながら、深度平面の数を減らすことが達成される。本明細書に開示される実施形態は、深度の物理的距離(深度平面)を視力などの人間の視覚システムの能力に関連付ける「深度知覚量子化(Depth Perceptual Quantization)」機能又はDPQを含む。DPQによって計算される各深度平面は、隣接する平面からの一定の「最小可知差(just noticeable difference)」である。
第1態様において、3次元データセットとして記憶された3次元シーンを表現する方法が開示される。この方法は、第1視点に対する第1視野方向に沿ったP個の深度平面深度を決定することを含む。深度平面深度の各近位深度Dと隣接する遠位深度(D+ΔD)との間の分離ΔDは、(i)近位深度D、(ii)第1視野方向に垂直で、かつ第1視点と第2視点との間の横方向オフセットΔx、及び(iii)第2視点から見たときに分離ΔDだけ傾斜した視野角Δφによって決定される最小可知差である。方法はまた、3次元データセットから、P個のプロキシ画像Ikを含むプロキシ3次元データセットを生成することを含む。プロキシ3次元データセットを生成することは、P個の深度平面深度のうちの深度平面深度ごとに、(i)3次元データセットを構成し、(ii)各々が複数のシーン深度のうちの各々のシーン深度における3次元シーンの各々の横断面を表す、複数の横断面画像のうちの少なくとも1つの断面画像から、P個のプロキシ画像のうちのプロキシ画像を生成することにより、P個のプロキシ画像を含むプロキシ3次元データセットを生成することを含む。
第2態様において、エンコーダは、プロセッサ及びメモリを含む。メモリは、機械可読命令を記憶しており、
前記機械可読命令は、前記プロセッサによって実行されると、第1態様のいずれかに記載の方法を実行するように前記プロセッサを制御する。
前記機械可読命令は、前記プロセッサによって実行されると、第1態様のいずれかに記載の方法を実行するように前記プロセッサを制御する。
第3態様において、表示装置は、電子視覚ディスプレイ、プロセッサ、及びメモリを含む。メモリは、機械可読命令を格納しており、前記機械可読命令は、プロセッサによって実行されると、P個のプロキシ画像のうちの各プロキシ画像Ik、k=0、1、...、(P-1)、について、
(i)次式の線形関数として、プロキシ画像Ikの各シーン深度Dkを決定し:
ここで、m、n、c1、c2、及びc3が所定値であり、Pd =(P-1)であり、
(ii)電子視覚ディスプレイにシーン深度Dkでプロキシ画像Ikを表示する、
ようにプロセッサを制御する。
(i)次式の線形関数として、プロキシ画像Ikの各シーン深度Dkを決定し:
(ii)電子視覚ディスプレイにシーン深度Dkでプロキシ画像Ikを表示する、
ようにプロセッサを制御する。
本明細書に開示される装置及び方法は、空間視力(細部を知覚する能力)の限界に基づいて深度平面位置を決定する。このアプローチは、両眼視力(2つの眼で異なる画像を知覚する能力)に依存する方法とは異なる。空間視力を利用することにより、本明細書に開示される実施形態は、1つのオブジェクトがある観察位置から別のオブジェクトによって隠されているが別の観察位置からは見える場合に存在する、高周波数閉塞の正確な表現を保証する。
本明細書に開示される深度平面位置特定法は、運動視差を考慮する。運動視差は、観察者がシーンを観察する際に移動して別の視点からそれを観察することである。2つの異なる視点からの画像の変化は、強力な深度キューをもたらす。他の方法は、2つの目の間の視点の差(通常は6.5cm)のみを考慮する。本明細書の実施形態は、より多くの知覚深度平面をもたらす28cmの動きのような、はるかに長いベースラインに対応し、そのために設計されている。
図1は、装置100のディスプレイ110によってレンダリングされた3次元シーン112を見るビューア191の概略図である。装置100の例は、ヘッドマウントディスプレイ、モバイル装置、コンピュータモニタ、及びテレビ受信機を含む。装置100はまた、プロセッサ102と、それに通信可能に結合されたメモリ104と、を含む。メモリ104は、プロキシ3次元データセット170及びソフトウェア130を格納する。ソフトウェア130は、機械可読命令の形式でデコーダ132を含み、装置100の1つ以上の機能を実装する。本明細書で使用される用語「プロキシ画像データセット」は、元の画像データセットのためのメモリ効率の良い表現、又はプロキシを意味する。
図1はまた、符号化装置160を含み、符号化装置160は、プロセッサ162及びそれに通信可能に結合されたメモリ164を含む。メモリ164は、3次元データセット150、ソフトウェア166、及びプロキシ3次元データセット170を格納する。ソフトウェア166は、機械可読命令の形式でエンコーダ168を含み、符号化装置160の1つ以上の機能を実装する。実施形態では、エンコーダ168は、3次元データセット150からプロキシ3次元データセット170及びP個の深度平面深度174を生成する。装置100と符号化装置160は、通信ネットワーク101を介して通信可能に接続される。
メモリ104及び164の各々は、一時的及び/又は非一時的であり、揮発性メモリ(例えば、SRAM、DRAM、計算RAM、他の揮発性メモリ、又はそれらの任意の組み合わせ)及び不揮発性メモリ(例えば、FLASH、ROM、磁気媒体、光学媒体、その他の不揮発性メモリ、又はそれらの任意の組み合わせ)の一方又は両方を含むことができる。メモリ104及び164の一部又は全部は、各々プロセッサ102及び162に統合されてよい。
3次元データセット150は、S個の横断面画像(transverse cross-section)152を含む。各横断面画像152は、各々のシーン深度154(0、1、...、S-1)における3次元シーンの各々の横断面を表す。S個はP個より多い。プロキシ3次元データセット170は、P個のプロキシ画像172(0、1、...、P-1)を含む。各深度平面深度174(k)について、エンコーダ168は、少なくとも1つの横断面画像152からプロキシ画像172(k)を生成する。インデックスkは、P個の整数のうちの1つの、例えば、両端を含む0と(P-1)との間の整数である。少なくとも1つの横断面画像152の各々のシーン深度154のうちの1つは、深度平面深度174(k)に最も近い。
デコーダ132は、プロキシ3次元データセット170を復号し、復号されたデータをディスプレイ110に送信し、ディスプレイ110は3次元シーン112として表示する。3次元シーン112は、P個のプロキシ画像172(0、1、...、P-1)を含み、各プロキシ画像は、3次元デカルト座標系118のx-y面に平行な方向zの各々の深度平面深度174(0、1、...、P-1)にある。座標系118上では、深度平面深度174は、z軸に沿ってz0、z1、…、zP-1として示される。図1はまた、方向x'、y'、及びz'を定義する3次元デカルト座標系198を示す。ビューア191によって視聴されるとき、座標系118の方向x、y、及びzは、座標系198の各々の方向x'、y'、及びz'に平行である。
知覚深度の計算
図2は、視聴距離の関数として、最小可知差のための式の導出を示す概略図である。図2において、オブジェクト221は、ビューア191観察者から距離Dに位置し、オブジェクト222は距離ΔDだけその後方に位置する。観察位置211から、オブジェクト222はオブジェクト221によって隠される。ビューア191が距離Δxだけ新しい位置212に移動すると、ビューア191はオブジェクト222を観察することができる。幾何学は、式(1)に示されるように、図2に示される角度231及び232の差Δφの観点で記述することができ、ここでΔφは観察者の角度視力(angular visual acuity)である。テレビ及び映画制作のために、国際電気通信連合による勧告ITU-R BT.1845は、「通常の」20/20の視力、又は角度分解能Δφ=1/60度の観察者を規定している。
式(1)は三角関数で次のように記述できる:
式(2)をΔDについて解くと、式(3)が得られ、これは深度量子化関数の例である。
図2は、視聴距離の関数として、最小可知差のための式の導出を示す概略図である。図2において、オブジェクト221は、ビューア191観察者から距離Dに位置し、オブジェクト222は距離ΔDだけその後方に位置する。観察位置211から、オブジェクト222はオブジェクト221によって隠される。ビューア191が距離Δxだけ新しい位置212に移動すると、ビューア191はオブジェクト222を観察することができる。幾何学は、式(1)に示されるように、図2に示される角度231及び232の差Δφの観点で記述することができ、ここでΔφは観察者の角度視力(angular visual acuity)である。テレビ及び映画制作のために、国際電気通信連合による勧告ITU-R BT.1845は、「通常の」20/20の視力、又は角度分解能Δφ=1/60度の観察者を規定している。
式3を使用するには、深度平面の範囲を指定する必要がある。勧告ITU-R BT.1845は、人間の目が快適に焦点を合わせることができる最も近い距離をDmin =0.25mと規定している。Dmaxについては、分母が0に達し、ΔDが無限大になる値を選択するが、これは次式で発生し:
ベースライン距離Δxと視力Δφの両方の選択に依存する。
Δxの値も指定しなければならない。これは、観察者がオブジェクト221とオブジェクト222の間の深度の変化を知覚するために行わなければならない最小の動きである。これは、ディスプレイ上で見ることを意図した画像については、図3に示すように、各画素の幅Δwが視力Δφと一致する点としてITU-RB T.1845に規定された「理想視聴距離」から算出することができる。画面の水平解像度がNx=3840画素の場合、最小視聴距離Dminで見ると、画面の端から端までの距離は式4で与えられる:
最も近い視聴距離D= Dminに対してΔxを計算すると、Δx=0.28mとなり、従ってDmax =960mとなる。大きな動きは最小可知差(just-noticeable difference (JND))を超えることがあるが、1人の観察者が両方の位置から同時に見ることは不可能であるため、両方の視点からの見方を比較するにはワーキングメモリに頼る必要がある。
図4は、式(3)のΔDのメートル単位のプロット、Δφ=1/60度、Δx=0.28メートルの場合の視聴距離Dの関数としてのΔD/Dを示している。近距離では、非常に小さな深度の変化が見える(D=25cmで0.15mm)。深度JNDは、深度がDmaxに近づくまで、より大きな距離で増加する。
Dminで開始し、Dmaxに達するまでΔDだけ増加する式3を使用すると、各深度平面深度174が最後の深度から知覚量だけ異なるP個の深度平面深度174の表を作成することができる。最後の深度平面はD= Dmaxに設定される。従って、プロキシ3次元データセット170は、3次元データセット150のメモリ効率の良い表現、又はプロキシになる。ビューア191がx'軸に沿って移動するときに、装置100がビュー3次元シーン100を表示及びリフレッシュするために必要な計算リソースは、データセット170の方がデータセット150よりも少ない。
上記の条件下でのユニークな深度平面の数はP=2890である。観察者の移動Δx=0.28mを許容しながら、スクリーンの半分にまたがる滑らかな連続勾配(例えば、3次元シーン112に示されるように、スクリーンの下端から上端までの距離に消える鉄道)を示すためには、ほぼ3000のユニークな深度平面が必要である。
図5は、上述の2890個の深度平面の各々についての深度平面インデックスk=0からk=2889の、各々の深度平面深度Dkへのマッピング510を示すプロットであり、ここで、Dkはk番目の深度平面の深度である。
関数形式のフィッティング
複数の実際の深度Dを各々の深度平面深度DPQにマッピングするマッピング510への関数フィット(反転可能)を達成することが可能である。式(5)の関数形式は、そのようなマッピングの1つであり、ここで、深度平面深度DPQは、指数n及び係数c1、c2及びc3の適切に選択された値に対して、最適マッピング510である。式(5)の右辺は、本明細書の範囲から逸脱することなく、他の形式を有することができる。
式(5)において、D'は正規化深度D/Dmaxであり、DPQは対応する知覚深度平面の正規化深度である。DPQの範囲は0から1である。係数c1、c2及びc3は、c3= c1+c2-1、及びc2=-c1(Dmin/Dmax)nを満たす。実施形態では、c2及びc3の値は、DPQ(Dmin)=0及びDPQ(Dmax)=1のように決定される。実施形態では、Dmaxは960メートルに等しく、c1=2620000、及び指数nは3/4に等しい。
複数の実際の深度Dを各々の深度平面深度DPQにマッピングするマッピング510への関数フィット(反転可能)を達成することが可能である。式(5)の関数形式は、そのようなマッピングの1つであり、ここで、深度平面深度DPQは、指数n及び係数c1、c2及びc3の適切に選択された値に対して、最適マッピング510である。式(5)の右辺は、本明細書の範囲から逸脱することなく、他の形式を有することができる。
より正確な関数フィッティングは、式(5)の右辺に指数mを追加した式(6)に規定された関数形式を使用して得ることができる。つまり、式(5)は、mが1に等しい式(6)の特定のインスタンスである。実施形態では、指数n=1である。
式(5)におけるように、c2及びc3の値は、DPQ(Dmin)=0及びDPQ(Dmax)=1のように決定される。係数c1、c2及びc3間の関係は、式(5)で前述したものと同じである。実施形態では、Dmaxは960メートルに等しく、c1=2620000、及び指数nは3872/4096に等しく、及びm=5/4である。
式(6)の深度平面深度DPQは、深度平面深度174の例である。DPQの単位が明示的に言及されていない場合、各深度平面深度DPQは、0から1の範囲の正規化深度である。他の実施形態では、各深度平面深度DPQは長さの単位を有し、DminからDmaxの範囲である。
式(7)は式(6)の反転形式であり、したがって、正規化深度の明示的な式であるD'=D/Dmaxは、深度平面深度DPQ、係数c1、c2、及びc3、ならびに指数m及びnの関数である。
図6は、式(7)のプロット600である。プロット600は、以下の式(3):Dk+1=Dk+ΔDk、ここでΔDkは式(3)の左辺である、の反復的かつ再帰的な適用によって生成されたデータ610を含む。プロット600は、式(7)によって生成されたはフィット620も含む。実施形態において、指数n=1は、n≠1のとき、式(7)の近似をもたらす。
式(8)は、インデックス付きバージョンの式(7)であり、k/PdはDPQを置き換え、D'はD'を置き換え、インデックスkは0からPdまでの範囲であり、Pd =(P-1)である。式(8)は、係数μとオフセットβも含む。
D'kの単位が明示的に言及されていない場合、βは0に等しく、μは1に等しく、その結果、D'kは正規化深度Dk/Dmaxを表す。他の実施形態では、β及びμは長さの単位を有し、D'k(k=0)がDminに等しく、D'k(k=P-1)がDmaxに等しく、D'kがもはや正規化されないように選択される。
実施形態では、装置100のソフトウェア130は、プロセッサによって実行されるときに、(i)各プロキシ画像172(0-Pd)について、式(8)に従って各々の正規化されたシーン深度D'kを決定し、(ii)各プロキシ画像172(0-Pd)を正規化されたシーン深度D'kから決定されたシーン深度でディスプレイ110上で表示するように、プロセッサを制御する、機械可読命令を含む。
図7は、3次元データセットとして記憶された3次元シーンを表現する方法700を示すフローチャートである。実施形態では、方法700は、符号化装置160及び/又は装置100の1つ以上の態様の中で実施される。例えば、方法700は、(i)ソフトウェア166のコンピュータ可読命令を実行するプロセッサ162、及び(ii)ソフトウェア130のコンピュータ可読命令を実行するプロセッサ102、のうちの少なくとも1つによって実施され得る。方法700は、ステップ720及び730を含む。実施形態では、方法700は、ステップ710、740及び750の少なくとも1つも含む。
ステップ720は、第1視点に対する第1視野方向に沿ったP個の深度平面深度を決定することを含む。深度平面深度の各近位深度Dと隣接する遠位深度(D+ΔD)との間の分離ΔDは、(i)近位深度D、(ii)第1視野方向に垂直で、かつ第1視点と第2視点との間の横方向オフセットΔx、及び(iii)第2視点から見たときに分離ΔDだけ傾斜した視野角Δφによって決定される最小可知差である。ステップ720の例では、エンコーダ168は深度平面深度174を決定する。
実施形態では、視野角Δφは1アークミニット(arcminute)である。実施形態では、P個の深度平面深度の各々は、最小深度D0を超え、Dk、k=1、2、...、(P-1)で示され、P個の深度平面深度を決定するステップは、深度Dk+1=Dk+ΔDkを繰り返し決定するステップを含む。そのような実施形態では、分離ΔDkは、式(3)の例である次式に等しい:
実施形態では、方法700は、ステップ710を含み、視野角Δφからの横方向オフセットΔx、及びP個の深度平面深度のうちの所定の最小深度平面深度を決定することを含む。ステップ710の例では、ソフトウェア166は、式(4)を用いて横方向オフセットΔxを決定し、Dは深度平面深度174(0)と等しい。
ステップ730は、3次元データセットから、P個のプロキシ画像Ikを含むプロキシ3次元データセットを生成することを含む。プロキシ3次元データセットを生成することは、P個の深度平面深度のうちの深度平面深度ごとに、(i)3次元データセットを構成し、(ii)各々が複数のシーン深度のうちの各々のシーン深度における3次元シーンの各々の横断面を表す、複数の横断面画像のうちの少なくとも1つの断面画像から、P個のプロキシ画像のうちのプロキシ画像を生成することにより、P個のプロキシ画像を含むプロキシ3次元データセットを生成することを含む。実施形態では、少なくとも1つの横断面画像の各々のシーン深度のうちの1つは、深度平面深度に最も近い。ステップ730の例では、エンコーダ168は、3次元データセット150からプロキシ3次元データセット170を生成する。図1に示すように、データセット150及び170は、各々横断面画像152及びプロキシ画像172である。
ステップ730の少なくとも1つの断面画像が複数の断面画像を含む場合、ステップ730はステップ732を含むことができる。ステップ732は、複数の断面画像を平均化することを含むプロキシ画像を生成することを含む。最終的な深度平面は、Dmaxを超えるすべての深度の値を平均化することによって構築することができる。第1深度平面は、Dmin以下のすべての深度の値を平均化することによって構築することができる。ステップ732の例では、エンコーダ168は、2つ以上の横断面画像152の平均として各プロキシ画像172を生成する。
ステップ740は、Pプロキシ画像の各プロキシ画像Ik、k=0、1、2、...、(P-1)、について、プロキシ画像Ikの各シーン深度D'kを次式の線形関数として決定することを含み:
ここで、m、n、c1、c2、及びc3は所定の値であり、Pd =(P-1)である。実施形態では、各シーン深度D'kは次式に等しい:
ステップ740の例では、エンコーダ168又はデコーダ132のいずれかが、各プロキシ画像172(k)について、式(7)に従って、各々の深度平面深度174(k)を決定する。ここで、DPQはk/Pdに等しく、深度平面深度174(k)はシーン深度D'kに等しい。
実施形態では、ステップ740は、3次元データセットのメタデータから数量Dmin、Dmax及びPを読み取ることを含む。例えば、数量Dmin、Dmax及びPは、ソフトウェア166によって読み取られる3次元データセット150のメタデータとして格納することができる。実施形態では、Dmin及びDmaxの各々は10ビットの固定小数点値であり、固定小数点値が0の場合、各々の値は0.25メートル及び960メートルである。実施形態では、Pは12ビットの固定小数点値である。
ステップ750は、各々の深度平面深度でプロキシ画像Ikを表示することを含む。ステップ750の例では、装置100は、3次元シーン112内にzkとして示される、深度平面深度174(k)において少なくとも1つのプロキシ画像172(k)を表示する。方法700がステップ740を含む場合、ステップ750の各々の深度平面深度は、ステップ740の各々のシーンの深度D'kに等しく、例えば、深度平面深度174(k)はシーンの深度D'kに等しい。
実施形態では、ステップ720及び730は、図1の符号化装置160のような第1装置によって実行され、方法700はステップ740を含む。そのような実施形態では、ステップ750は、第1装置から第2装置にプロキシ3次元データを送信するステップ752を含み、第2装置は、各シーン深度Dkの決定を実行し、プロキシ画像を表示する。ステップ752の例では、符号化装置160は、プロキシ3次元データセット170を装置100に送信し、深度平面深度174を生成も保存もしない。この例では、装置100はステップ740を実行して深度平面深度174を決定する。
図8は、深度平面データを表現する方法800を示すフローチャートである。実施形態では、方法700は、装置100の1つ以上の態様の中で実施される。例えば、方法800は、ソフトウェア130のコンピュータ可読命令を実行するプロセッサ102によって実施することができる。
方法800は、ステップ810、820、830を含み、各ステップは、3次元シーン内の複数の深度Dの各々に対応する複数の2次元画像の各々に対して実行される。実施形態では、横断面画像152は複数の2次元画像を構成し、シーン深度154は複数のシーン深度Dを構成する。
ステップ810は、深度Dから正規化深度D'を決定することを含む。ステップ810の例では、ソフトウェア130は、各シーン深度154から各々の正規化深度を決定する。
ステップ820は、式(6)に従って正規化知覚深度DPQを計算することを含む。ステップ820の例では、ソフトウェア130は、各シーン深度154をDmaxで除算して、各々の深度平面深度174を決定する。この例では、深度平面深度は正規化深度である。
ステップ830は、正規化された知覚深度DPQをバイナリコード値DBとして表すことを含む。ステップ830の例では、ソフトウェア130は、各深度平面深度174を各々のバイナリコード値として表す。実施形態では、バイナリコード値DBのビット深度は、8、10、又は12のいずれかである。ステップ830はまた、メモリ104の一部であってもよい非一時的記憶媒体上に各バイナリコード値を記憶することを含むことができる。
特徴の組み合わせ
上述の特徴及び以下に請求される特徴は、本明細書の範囲から逸脱することなく、様々な方法で組み合わせることができる。以下の列挙された例は、幾つかの可能な非限定的な組み合わせを示している。
上述の特徴及び以下に請求される特徴は、本明細書の範囲から逸脱することなく、様々な方法で組み合わせることができる。以下の列挙された例は、幾つかの可能な非限定的な組み合わせを示している。
(A1)3次元データセットとして記憶された3次元シーンを表現する方法が開示される。方法は、第1視点に対する第1視野方向に沿ったP個の深度平面深度を決定することを含む。深度平面深度の各近位深度Dと隣接する遠位深度(D+ΔD)との間の分離ΔDは、(i)近位深度D、(ii)第1視野方向に垂直で、かつ第1視点と第2視点との間の横方向オフセットΔx、及び(iii)第2視点から見たときに分離ΔDだけ傾斜した視野角Δφによって決定される最小可知差である。方法はまた、3次元データセットから、P個のプロキシ画像Ikを含むプロキシ3次元データセットを生成することを含む。プロキシ3次元データセットを生成することは、P個の深度平面深度のうちの深度平面深度ごとに、(i)3次元データセットを構成し、(ii)各々が複数のシーン深度のうちの各々のシーン深度における3次元シーンの各々の横断面を表す、複数の横断面画像のうちの少なくとも1つの断面画像から、P個のプロキシ画像のうちのプロキシ画像を生成することにより、P個のプロキシ画像を含むプロキシ3次元データセットを生成することを含む。
(A2)方法A1の実施形態では、視野角Δφは1アークミニット(arcminute)である。
(A3)方法A1及びA2の実施形態は、視野角Δφからの横方向オフセットΔx、及びP個の深度平面深度のうちの所定の最小深度平面深度を決定することを含む。
(A4)方法A1~A3のいずれか一項の実施形態では、P個の深度平面深度の各々は、最小深度D0を超え、Dk、k=1、2、...、(P-1)で示され、P個の深度平面深度を決定するステップは、深度Dk+1=Dk+ΔDkを繰り返し決定するステップを含む。
(A6)方法A1~A5のいずれか一項の実施形態では、プロキシ画像を生成するとき、少なくとも1つの断面画像は、複数の横断面画像のうちの複数の断面画像を含み、プロキシ画像を生成することは、複数の断面画像を平均化することを含む。
(A7)方法A1~A6のいずれか一項の実施形態は、P個のプロキシ画像のうちの各プロキシ画像Ik、k=0、1、2、...、(P-1)、について、プロキシ画像Ikの各シーン深度D'kを次式の線形関数として決定することを含み:
ここで、m、n、c1、c2、及びc3は所定の値であり、Pd =(P-1)である、ことと、
シーン深度D'kにおけるプロキシ画像Ikを表示することと、
を含む。
シーン深度D'kにおけるプロキシ画像Ikを表示することと、
を含む。
(A8)P個の深度平面深度を決定することと、プロキシ3次元データセットを生成することは、第1装置によって実行され、
第1装置から第2装置にプロキシ3次元データを送信することであって、第2装置は、各々のシーン深度D'kの決定を実行し、プロキシ画像を表示する、ことを更に含む。
第1装置から第2装置にプロキシ3次元データを送信することであって、第2装置は、各々のシーン深度D'kの決定を実行し、プロキシ画像を表示する、ことを更に含む。
(A9)方法A7及びA8のいずれかの実施形態では、各シーン深度D'kは次式に等しく:
P個の等間隔の深度平面深度は0~1の範囲であり、c3= c1+c2-1及びc2=-c1(Dmin/Dmax)nであり、Dmin及びDmaxは、各々、前記3次元シーンの最小シーン深度及び最大シーン深度である。
(A10)A9の実施形態は、3次元データセットのメタデータから数量Dmin、Dmax及びPを読み取ることを含む。
(A11)方法A9及びA10のいずれかの実施形態において、Dmin及びDmaxは、各々0.25メートル及び960メートルに等しい。
(A12)方法A7~A11のいずれか一項の実施形態において、c1、m及びnは、各々2620000、5/4、及び3845/4096に等しい。
(A13)方法A1~A12のいずれか一項の実施形態では、プロキシ画像を生成するステップにおいて、少なくとも1つの断面画像の各々のシーン深度のうちの1つは、深度平面深度に最も近い。
(B1)プロセッサとメモリとを含むエンコーダ。メモリは、機械可読命令を記憶しており、
機械可読命令は、プロセッサによって実行されると、A1~A13のいずれか一項に記載の方法を実行するようにプロセッサを制御する。
機械可読命令は、プロセッサによって実行されると、A1~A13のいずれか一項に記載の方法を実行するようにプロセッサを制御する。
(C1)表示装置は、電子視覚ディスプレイ、プロセッサ、及びメモリを含む。メモリは、機械可読命令を格納しており、機械可読命令は、プロセッサによって実行されると、P個のプロキシ画像のうちの各プロキシ画像Ik、k=0、1、...、(P-1)、について、
(i)次式の線形関数として、プロキシ画像Ikの各シーン深度Dkを決定し:
ここで、m、n、c1、c2、及びc3が所定値であり、Pd =(P-1)であり、
(ii)電子視覚ディスプレイにシーン深度Dkでプロキシ画像Ikを表示する、
ようにプロセッサを制御する。
(i)次式の線形関数として、プロキシ画像Ikの各シーン深度Dkを決定し:
(ii)電子視覚ディスプレイにシーン深度Dkでプロキシ画像Ikを表示する、
ようにプロセッサを制御する。
(D1)深度平面データを表現する方法は、深度平面データを表現する方法は、3次元シーン内の複数の深度Dの各々に対応する複数の2次元画像の各々について、
(i)深度Dから正規化深度D'を決定することと、
(ii)次式に等しい正規化された知覚深度DPQを計算することと:
(iii)正規化された知覚深度DPQをバイナリコード値DBとして表現することであって、m、n、c1、c2、及びc3は所定の値である、ことと、
を含む。
(i)深度Dから正規化深度D'を決定することと、
(ii)次式に等しい正規化された知覚深度DPQを計算することと:
を含む。
(D2)方法D1の実施形態では、複数の深度Dは、DPQが0に等しい最小DminからDPQが1に等しい最大Dmaxまでの範囲であり、c2は-c1(Dmin/Dmax)nに等しく、c3は(c1+c2-1)に等しい。
(D3)方法D1~D2のいずれか一項の実施形態において、c1は2620000に等しく、nは3872/4096に等しく、mは5/4に等しい。
(D4)方法D1~D3のいずれか一項の実施形態において、バイナリコード値DBのビット深度は、8、10、又は12のいずれかである。
(D5)方法D1~D4のいずれか一項の実施形態において、バイナリコード値DBを非一時的記憶媒体に記憶するステップを更に含む。
(E1)機器は、非一時的記憶媒体と、非一時的記憶媒体に記憶されたビットストリームとを含む。ビットストリームは、深度距離データを含み、深度距離データは、次式:
の関数モデルに少なくとも部分的に基づく正規化深度距離値D'を表すバイナリコード値DBで符号化される。パラメータn、m、c1、c2、c3は所定値であり、DPQはバイナリコード値DBの正規化値であり、0≦DPQ≦1を満たす。
(F1)復号方法は、P個のプロキシ画像のうちの各プロキシ画像Ik、k=0、1、2、...、(P-1)、について、
(i)プロキシ画像Ikの各シーン深度D'kを次式の線形関数として決定することであって:
ここで、m、n、c1、c2、及びc3は所定の値であり、Pd =(P-1)である、ことと、
(ii)シーン深度D'kにおけるプロキシ画像Ikを表示することと、
を含む。
(i)プロキシ画像Ikの各シーン深度D'kを次式の線形関数として決定することであって:
(ii)シーン深度D'kにおけるプロキシ画像Ikを表示することと、
を含む。
(F2)方法F1の実施形態では、各シーン深度D'kは次式に等しく:
P個の等間隔の深度平面深度は0~1の範囲であり、c3=c1+c2-1及びc2=-c1(Dmin/Dmax)nであり、Dmin及びDmaxは、各々、前記3次元シーンの最小シーン深度及び最大シーン深度である。
(F3)F1及びF2のいずれかの実施形態は、3次元データセットのメタデータから数量Dmin、Dmax及びPを読み取ることを含む。
(F4)方法F1~F3のいずれかの実施形態において、Dmin及びDmaxは、各々0.25メートル及び960メートルに等しい。
(F5)方法F1~F4のいずれか一項の実施形態において、c1、m及びnは、各々2620000、5/4、及び3845/4096に等しい。
(G1)プロセッサとメモリとを含むエンコーダ。メモリは、機械可読命令を記憶しており、機械可読命令は、プロセッサによって実行されると、F1~F5のいずれか一項に記載の方法を実行するようにプロセッサを制御する。
本実施形態の範囲を逸脱することなく、上記の方法及びシステムを変更することができる。従って、上記の説明に含まれている事項又は添付図面に示されている事項は、限定的な意味ではなく、例示的なものとして解釈されるべきであることに留意されたい。本明細書において、特に指示がない限り、「実施形態において」という語句は、「特定の実施形態において」という語句と同等であり、すべての実施形態を指すものではない。以下の特許請求の範囲は、本明細書に記載されたすべての一般的及び特定の特徴、ならびに本方法及びシステムの範囲のすべての記述をカバーすることを意図しており、言語の問題として、それらを含むと言える。
Claims (15)
- 3次元データセットとして記憶された3次元シーンの深度面の数を削減する方法であって、
第1視野方向に垂直で、かつ、第1視点と第2視点との間の横方向オフセットΔxを受信するステップであって、前記横方向オフセットΔxは、観察者が、前記第1視野方向に沿った近位深度Dにおける第1オブジェクトと、前記第1視野方向に沿った隣接する遠位深度(D+ΔD)における第2オブジェクトとの間の深度の変化を知覚するためにとらなければならない最小距離である、ステップと、
前記観察者の角度視力を表す視野角Δφを受信するステップと、
S個の横断面画像を含む前記3次元データセットを受信するステップであって、各横断面画像は、深度平面深度に対応し、前記第1視点に対する前記第1視野方向に沿った各々のシーン深度における前記3次元シーンの各々の横断面を表す、ステップと、
前記第1視点に対する前記第1視野方向に沿ったP個の深度平面深度を決定するステップであって、前記P個の深度平面深度のうちの各近位深度Dと前記隣接する遠位深度(D+ΔD)との間の分離ΔDは、(i)前記近位深度D、(ii)前記横方向オフセットΔx、及び(iii)前記第2視点から見たときの分離ΔDだけ傾斜した前記視野角Δφ、によって決定される最小可知差であり、P個はS個より少ない、ステップと、
前記受信した3次元データセットから、P個のプロキシ画像を含むプロキシ3次元データセットを生成するステップであって、前記P個の深度平面深度の深度平面深度ごとに、前記S個の横断面画像の少なくとも1つの断面画像から、前記P個のプロキシ画像のうちのプロキシ画像を生成する、ステップと、
を含む方法。 - 前記横方向オフセットΔxを受信するステップは、Δx=Nx・Dmin・tan(Δφ)を計算することにより、横方向オフセットΔxを決定するステップを含み、Nxは、水平画面解像度であり、Dminは、前記P個の深度平面深度の所定の最小深度平面深度である、請求項1に記載の方法。
- 前記S個の横断面画像のうちの少なくとも1つの断面画像からプロキシ画像を生成するステップは、前記S個の横断面画像のうちの複数の断面画像から前記プロキシ画像を生成するステップを含み、前記プロキシ画像を生成するステップは、前記複数の断面画像を平均化するステップを含む、請求項1又は2に記載の方法。
- 前記S個の横断面画像のうちの少なくとも1つの断面画像からプロキシ画像を生成するステップは、各々の深度平面深度に最も近い少なくとも1つの断面画像から前記プロキシ画像を生成するステップを含む、請求項1~3のいずれかに記載の方法。
- 前記P個の深度平面深度の各々は、所定の最小深度平面深度Dmin以上であり、Dk、k=0、1、2、...、(P-1)で示され、前記P個の深度平面深度を決定するステップは、深度Dk+1=Dk+ΔDkを繰り返し決定するステップを含む、請求項1~4のいずれかに記載の方法。
- P個のプロキシ画像の各プロキシ画像Ikについて、k=0、1、2、...、(P-1)であり、
線形関数:
=(P-1)であり、k/Pdは、前記正規化された知覚深度DPQの離散表現を表すステップと、
前記近似された正規化深度平面深度D'kから決定された深度平面深度でのプロキシ画像Ikを表示するステップと、
を更に含む請求項1~4のいずれかに記載の方法。 - 前記P個の深度平面深度を決定するステップと、前記プロキシ3次元データセットを生成するステップは、第1装置によって実行され、
前記第1装置から第2装置に前記プロキシ3次元データを送信するステップであって、前記第2装置は、各々の近似された正規化深度平面深度D'kの決定を実行し、前記プロキシ画像を表示する、ステップを更に含む、請求項7に記載の方法。 - P個の等間隔の正規化深度平面深度は0~1の範囲であり、c3= c1+c2-1及びc2=-c1(Dmin/Dmax)nであり、Dmin及びDmaxは、各々、前記3次元シーンの最小シーン深度及び最大シーン深度である。請求項7又は8に記載の方法。
- 機器であって、
プロセッサと、
機械可読命令を記憶しているメモリと、
を有し、
前記機械可読命令は、前記プロセッサによって実行されると、請求項1~9のいずれかに記載の方法を実行するように前記プロセッサを制御する、機器。 - ディスプレイ装置であって、
電子視覚ディスプレイと、
プロセッサと、
機械可読命令を記憶しているメモリと、
を有し、
前記機械可読命令は、前記プロセッサによって実行されると、請求項1~9のいずれかに記載の方法を実行し、前記生成したプロキシ画像を前記電子視覚ディスプレイ上で表示するように前記プロセッサを制御する、ディスプレイ装置。 - 3次元シーンの深度平面データに関連する正規化知覚深度にシーン深度をマッピングする方法であって、前記方法は、
最小シーン深度Dminを受信するステップと、
最大シーン深度Dmaxを受信するステップと、
前記3次元シーン内の複数のシーン深度Dの各々に対応する複数の2次元画像の各々について、
D/Dmaxを算出して前記シーン深度Dから正規化深度D'を決定するステップと、
次式に等しい正規化知覚深度DPQ:
前記正規化知覚深度DPQをバイナリコード値DBとして表すステップであって、m、n、c1、c2、及びc3は、請求項9に記載の方法に従って決定される、ステップと、
を含む方法。 - 前記バイナリコード値DBを非一時的記憶媒体に記憶するステップ、を更に含む請求項12に記載の方法。
- 機器であって、
非一時的記憶媒体と、
前記非一時的記憶媒体に格納されたビットストリームと、
を含み、前記ビットストリームは、深度距離データを含み、前記深度距離データは、請求項14に記載の方法に従って決定された正規化深度距離値D'を表すバイナリコード値DBで符号化される、機器。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163195898P | 2021-06-02 | 2021-06-02 | |
EP21177381 | 2021-06-02 | ||
EP21177381.7 | 2021-06-02 | ||
US63/195,898 | 2021-06-02 | ||
PCT/US2022/031915 WO2022256497A1 (en) | 2021-06-02 | 2022-06-02 | Method, encoder, and display device for representing a three-dimensional scene and depth-plane data thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024521898A true JP2024521898A (ja) | 2024-06-04 |
Family
ID=82163280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023574350A Pending JP2024521898A (ja) | 2021-06-02 | 2022-06-02 | 3次元シーン及びその深度平面データを表現する方法、エンコーダ、及び表示装置 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4348587A1 (ja) |
JP (1) | JP2024521898A (ja) |
TW (1) | TW202304208A (ja) |
WO (1) | WO2022256497A1 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3741113B1 (en) * | 2018-01-19 | 2022-03-16 | PCMS Holdings, Inc. | Multi-focal planes with varying positions |
WO2020009922A1 (en) * | 2018-07-06 | 2020-01-09 | Pcms Holdings, Inc. | Method and system for forming extended focal planes for large viewpoint changes |
-
2022
- 2022-06-02 JP JP2023574350A patent/JP2024521898A/ja active Pending
- 2022-06-02 WO PCT/US2022/031915 patent/WO2022256497A1/en active Application Filing
- 2022-06-02 TW TW111120581A patent/TW202304208A/zh unknown
- 2022-06-02 EP EP22733262.4A patent/EP4348587A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022256497A1 (en) | 2022-12-08 |
TW202304208A (zh) | 2023-01-16 |
EP4348587A1 (en) | 2024-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI523488B (zh) | 處理包含在信號中的視差資訊之方法 | |
EP1704730B1 (en) | Method and apparatus for generating a stereoscopic image | |
KR102492971B1 (ko) | 3차원 이미지를 생성하기 위한 방법 및 장치 | |
CA2361341A1 (en) | Use of detail-in-context presentation on stereoscopically paired images | |
KR102066058B1 (ko) | 입체 디스플레이에서 조절 효과로 인한 왜곡 에러를 교정하기 위한 방법 및 장치 | |
KR20120075829A (ko) | 적응적 부화소 렌더링 장치 및 방법 | |
JP6128442B2 (ja) | 立体画像および画像シーケンスのステレオベース拡張のための方法および装置{method and device for stereo base extension of stereoscopic images and image sequences} | |
KR20160072165A (ko) | 3d 뷰잉을 위한 깊이 맵의 리매핑 | |
JP6585938B2 (ja) | 立体像奥行き変換装置およびそのプログラム | |
US9918066B2 (en) | Methods and systems for producing a magnified 3D image | |
US20130321409A1 (en) | Method and system for rendering a stereoscopic view | |
US9082210B2 (en) | Method and apparatus for adjusting image depth | |
Fachada et al. | Chapter View Synthesis Tool for VR Immersive Video | |
JP2024521898A (ja) | 3次元シーン及びその深度平面データを表現する方法、エンコーダ、及び表示装置 | |
CN117716390A (zh) | 用于表示三维场景及其深度平面数据的方法、编码器和显示设备 | |
US11039168B2 (en) | Stereoscopic image data compression | |
KR20060114708A (ko) | 3차원 모델을 스케일링하는 스케일링 유닛 및 방법 | |
JP2011176823A (ja) | 画像処理装置、立体表示装置及び画像処理方法 | |
CN114637391A (zh) | 基于光场的vr内容处理方法及设备 | |
Jeong et al. | Depth image‐based rendering for multiview generation | |
JP2015076776A (ja) | 立体視画像処理装置、立体視画像処理方法及びプログラム | |
CN111684517B (zh) | 观看者调节的立体图像显示 | |
JP6085943B2 (ja) | 視差制御装置及び視差制御プログラム | |
Trapp et al. | Enhancing interactive NonPlanar projections of 3D geovirtual environments with stereoscopic imaging | |
WO2018233387A1 (zh) | 裸眼3d显示方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231214 |