JP2024514505A - 自己回転センサヘッドでキャプチャされた点群ジオメトリデータを符号化/復号化する方法及び装置 - Google Patents

自己回転センサヘッドでキャプチャされた点群ジオメトリデータを符号化/復号化する方法及び装置 Download PDF

Info

Publication number
JP2024514505A
JP2024514505A JP2023560503A JP2023560503A JP2024514505A JP 2024514505 A JP2024514505 A JP 2024514505A JP 2023560503 A JP2023560503 A JP 2023560503A JP 2023560503 A JP2023560503 A JP 2023560503A JP 2024514505 A JP2024514505 A JP 2024514505A
Authority
JP
Japan
Prior art keywords
point cloud
azimuth
data
bitstream
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023560503A
Other languages
English (en)
Inventor
ラセール,セバスチャン
ガオ,シュオ
タケ,ジョナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Publication of JP2024514505A publication Critical patent/JP2024514505A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Length Measuring Devices With Unspecified Measuring Means (AREA)

Abstract

物理的オブジェクトを表す点群を符号化/復号化する方法及び装置を提供する。点は自己回転センサヘッドによってキャプチャされ、前記点をキャプチャしたセンサに関連するセンサインデックス、前記センサのキャプチャ角を表す方位角、及び前記点の球座標の半径値によって表される。方位角データ(Φcoded,n)は符号化/復号化される。前記方位角データ(Φcoded,n)は、前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角(Φ(Pn))を表す。前記方位角データ(Φcoded,n)を復号化することは、センサの特性に依存する境界値(B)に基づいており、前記方位角データ(Φcoded,n)の絶対値が前記境界値によって制限されるようにする。【選択図】図10

Description

関連出願の相互引用
本出願は、2021年4月8日に提出された欧州特許出願番号No.EP21305456.2の優先権を要求し、その内容は参照によって全体的に本開示に組み込まれる。
本出願は一般に点群圧縮に関し、具体的に自己回転センサヘッドでキャプチャされた点群ジオメトリデータを符号化/復号化する方法及び装置に関する。
このセクションは、読者に当分野の様々な態様を紹介することを目的とし、これらの態様は、以下に記載および/または特許請求される本出願の少なくとも1つの例示的な実施例の様々な態様に関連する。この議論は、本出願のあらゆる態様をよりよく理解するために、読者に背景情報を提供するのに役立つと考えられる。
点群は、3Dデータを表すフォーマットとして最近注目されている。これは、すべてのタイプの物理的オブジェクトまたはシナリオを表す能力が様々である。点群は文化遺産/建築物など、様々な目的で使用でき、ここで、物体を送信したりアクセスしたりすることなく物体の空間設定(configuration)を共有するために、彫刻や建物のような物体を3D方式でスキャンする。また、それは物体が破壊される可能性がある場合、その物体の知識を確実に保存する方式である。例えば、地震では破壊されたお寺。通常、このタイプの点群は静的でカラーで巨大である。
もう一つの使用例は地形学と製図学において、ここで3D表現を使用して地図が平面に限らず起伏を含むことができることを許可する。Googleマップは現在3Dマップの良い例であるが、点群ではなくメッシュを使用している。しかし、点群は3Dマップの適切なデータフォーマットであってもよく、通常、このタイプの点群は静的でカラーで巨大である。
バーチャルリアリティ(VR)、拡張現実(AR)、没入型の世界は最近話題となり、多くの人に2Dタブレットビデオの未来と予見されている。その基本思想は視聴者を周囲の環境に浸らせることであるが、標準テレビでは視聴者が彼/彼女自分の前の仮想世界を見ることしか許されていない。視聴者の環境における自由度により、没入感にはいくつかのレベルがある。点群はVR/AR世界を配布する良いフォーマット候補である。
自動車産業、特に予見可能な自動運転車の分野も、点群を大量に使用できる分野である。自動運転車は、検出された彼らの最も近い近傍の物体の存在や性質、及び道路配置に基づいて、良好な運転判断を行うために、彼らの環境を「検知」することができるはずである。
点群とは、三次元(3D)空間に位置する点の集合であり、選択的に各点に付加値を付加する。これらの付加値は、通常、属性と呼ばれる。属性は、例えば、3成分の色、材料特性(例えば反射率)、及び/又は点に関連する表面の2成分の法線ベクトルであってもよい。
したがって、点群はジオメトリ(3D空間における点の位置であり、通常、3Dデカルト座標x、y、zで表される)と属性との組み合わせである。
点群は、カメラのアレイ、深度センサ、レーザー(光検出と測距、レーザーライダーとも呼ばれる)、レーダーなど、様々なタイプの装置でキャプチャすることができ、または、コンピュータで生成することもできる(例えば、映画のポストプロダクションなど)。使用例に応じて、地図作成のために、点群には数千から数十億の点が含まれてもよい。点群の元の表現には、点ごとに非常に多くのビット数が必要であり、デカルト座標x、y、またはzごとに少なくとも十数ビットがあり、さらに選択的に(1つまたは複数)属性により多くのビット、例えば、色用の10ビットの3倍、を提供する。
多くのアプリケーションでは、許容できる(またはできれば好ましくは非常に優れた)体験品質を維持しながら、適切な数のビットレートまたはストレージスペースを消費するだけで、エンドユーザーに点群を配布したり、サーバーに保存したりできることが重要である。これらの点群の効率的な圧縮は、多くの没入型の世界の配布チェーンを実用化するための重要なポイントである。
エンドユーザによる配布と可視化に対して、例えばAR/VRグラスやその他の任意の3D対応デバイスでは、圧縮は非可逆圧縮(例えば、ビデオ圧縮の場合)であってもよい。しかし、医療アプリケーションや自律運転などの他の使用例は、圧縮されて伝送された点群の後続解析から取得される判断結果を変更しないようにするために、可逆圧縮を必要とする。
最近まで、マスマーケットは点群圧縮(別名PCC)の問題を解決せず、使用可能な標準化された点群デコーダーもない。2017年、標準化ワーキンググループISO/JCT1/SC29/WG11は、動画像専門家グループまたはMPEGとも呼ばれ、点群圧縮の作業プロジェクトを開始した。その結果、次の2つの規格が制定された。
・ MPEG-I パート5(ISO/IEC 23090-5)またはビデオベースの点群圧縮(V-PCC)
・ MPEG-I パート9(ISO/IEC 23090-9)またはジオメトリベースの点群圧縮(G-PCC)
V-PCC符号化方法は、3Dオブジェクトに複数回の投影を行って点群を圧縮して、画像(動的点群を処理する場合のビデオ)にパッケージ化された2Dパッチを取得する。既存の画像/ビデオコーデックで取得された画像やビデオを圧縮し、すでに配置された画像とビデオ解決案を最大限に活用可能になる。画像/ビデオコーデックが、レーザーライダーでキャプチャされた疎なジオメトリデータの投影から取得された非平滑なパッチのような非平滑なパッチを圧縮することができないため、V-PCCは、その本質上で、密集した点群と連続した点群のみで効率的である。
G-PCC符号化方法は、キャプチャされた疎なジオメトリデータを圧縮するための2つの方案がある。
第1の方案は、ローカルでは八分ツリー、四分ツリー、二分ツリーの任意のタイプのツリーである占有ツリーに基づいており、点群ジオメトリを表している。占有されたノードは一定のサイズに達するまで分割され、占有されたリーフノードによって点の3D位置が提供され、通常これらのノードの中心にある。占有情報は、占有フラグによって運ばれ、占有フラグがノードのサブノードのそれぞれの占有状態を通信するための信号を送信する。近傍ベースの予測技術を使用することにより、密な点群が占有するフラグの高いレベルの圧縮率を取得することができる。疎な点群は、ノード内の非最小サイズの点の位置を直接符号化することによっても解決でき、ノード内に孤立した点のみが存在する場合にツリー構築を停止する。このような技術は直接符号化モード(DCM)と呼ばれる。
第2の方案は、予測ツリーに基づいており、各ノードが1点の3D位置を表し、ノード間の親/子関係が親から子への空間予測を表す。この方法は疎な点群しか解決せず、占有ツリーよりも遅延が低く復号化が簡単であるという利点が提供される。しかし、占有ベースの第1の方法に対して、圧縮性能はわずかしか向上せず、エンコーダが予測ツリーを構築する際に(長い列の潜在予測器の中から)最適な予測器を集中的に探す必要があるため、符号化が複雑になる。
この2つの方案では、属性(復号化)符号化は、ジオメトリ(復号化)符号化が完了した後に行われるため、実質的に2つの符号化が発生する。
重要な使用例は、移動車両に搭載された自己回転センサヘッド(例えば、自己回転レーザレーダヘッド)でキャプチャされた疎なジオメトリデータの伝送である。これには通常、簡単で低い遅延の埋め込みエンコーダが必要である。簡単性が必要であり、エンコーダが他の処理(例えば、(半)自律運転)を並行して実行するコンピューティングユニットに配置される可能性があるため、点群エンコーダが使用可能な処理能力が制限される。自動車からクラウドへの高速伝送を実現するために、複数の車両の収集に基づいてローカル交通をリアルタイムで確認し、交通情報に基づいて十分急速決定を行うように、低い遅延も必要である。5Gの使用により、伝送遅延を十分に低くすることができるが、符号化のためにエンコーダ自体があまり多くの遅延を導入すべきではない。また、数百万台の自動車からクラウドへのデータストリームは膨大になると予測されるため、圧縮性能は極めて重要である。
自己回転センサヘッドでキャプチャされた疎なジオメトリデータに関連する特定のアプリオリは、非常に効率的な符号化/復号化方法を取得するために使用された。
まず、G-PCCでは、図1と図2に示すように、自己回転センサヘッドでキャプチャされた仰角(水平な地面に対する)を利用する。自己回転センサヘッド10は、センサ11(例えば、レーザー機器)の集合を含み、ここでは5つのセンサが示される。自己回転センサヘッド10は、鉛直軸z周りに自己回転して物理的オブジェクトのジオメトリデータ、すなわち点群の点の3D位置をキャプチャすることができる。その後、自己回転センサヘッドでキャプチャされたジオメトリデータは球面座標(r3D,Φ,θ)で表され、ここで、r3Dが点Pから自己回転センサヘッドの中心までの距離であり、Φが基準物の回転に対するセンサヘッドの自己回転の方位角であり、θが水平基準平面に対する自己回転センサヘッドのセンサkの仰角である。
図3に示すように、自己回転センサヘッドでキャプチャされたジオメトリデータで方位角に沿った規則的な分布が観察された。この規則性は、G-PCCにおいて点群の準1D表現を取得するために使用され、ここで、ノイズまで半径r3Dのみが連続した値の範囲に属し、角度Φとθとは離散的な数の値のみを取り、Φ∀i=0~I-1であり、ここで、Iは点をキャプチャするための複数の方位角であり、θ∀k=0~K-1であり、ここで、Kは自己回転センサヘッド10のセンサーの数である。基本的に、図3に示すように、G-PCCは2D離散角平面(Φ,θ)で自己回転センサヘッドでキャプチャされた疎なジオメトリデータ、及び各点に対する半径値r3Dを表す。
球面座標空間において、角度の離散的特性を用いることにより、すでに符号化された点に基づいて現在の点の位置を予測し、このような準1D特性はすでにG-PCCにおける占有ツリーと予測ツリーにおいて利用されている。
より正確には、占有ツリーはDCMを大量に使用し、コンテキスト適応エントロピーエンコーダを使用してノード内の点の直接位置をエントロピー符号化する。その後に、点の位置から角座標(Φ,θ)へのローカル変換、及び符号化された点から取得された離散的な角座標(Φi,θk)に対するこれらの角座標の位置からコンテキストを取得する。この座標空間の準1D性質(r2D,Φi,θk)を使用して、予測ツリーは角座標(r2D,Φ,θ)における点の位置の最初のバージョンを直接符号化し、ここで、図4に示すように、r2Dは水平xy平面上の投影半径である。その後、角座標(r2D,Φ,θ)を符号化する。これらも3Dデカルト座標(x,y,z)に変換され、座標変換の誤差、仰角および方位角の近似、および潜在的なノイズを解決するために、xyz残差を符号化する。
点群の点Pをキャプチャしたセンサのキャプチャ角に応答する方位角Φ(P)を符号化することは、図5に示される予測案からメリットを取得することができる。点群の点Pの予測角Φpred,nは、符号化された点Palの角度Φ(Pal)を基本方位角変位ΔΦの倍数だけ変位することにより、符号化された点Palの角度から計算される。
Φpred,n=Φ(Pal)+m*ΔΦ (1)
ここで、mは、Φpred,nが点Pの元の方位角Φ(P)に最も近くなるように選択された整数値である。
次に、残差方位角Φres,nを次式によって計算する(インデックスnは、残差方位角が点Pに対することを指示する)。
Φres,n=Φ(P)-Φpred,n=Φ(P)-Φ(Pal)-m*ΔΦ (2)
整数mと残差方位角Φres,nはいずれもビットストリームに符号化される。
復号化側では、ビットストリームから整数mと残差方位角Φres,nを復号化し、且つ復号化された方位角Φdec,nは次式によって取得される。
Φdec,n=Φres,n+Φpred,n=Φres,n+Φ(Pal)+m*ΔΦ (3)
その他の球面座標(r2D,θ)とxyz残差も復号される。そして、復号化されたxyz残差と、変換で復号化された球座標(r2D,Φ,θ)から取得された3Dデカルト座標とから、点群の点の3Dデカルト座標(x,y,z)を取得する。
欧州特許出願No.EP20306672.5は、自己回転センサヘッドでキャプチャされた疎なジオメトリに関連する特定のアプリオリを利用する別の符号化/復号化方法を記載している。
キャプチャされた点群の点の3D位置は、2D座標(Φ,λ)システム(図6に示すように)と、半径値r2Dまたはr3Dとで表される。この表現は、点が単一の点チェーンで表され、各点が単一の後続点を有するため、「シングルチェーン符号化」と呼ばれる。座標Φはセンサヘッドの自己回転の方位角であり、その離散値はΦ(∀i=0からI-1)として表される。座標λはセンサインデックスであり、その離散値はλk(∀k=0からK-1)として表される。半径r2Dまたはr3Dは連続した数値範囲に属する。
センサヘッドの規則的な自己回転(回転)と一定の時間間隔での連続的なキャプチャのため、同じセンサで探知された2点間の方位角距離は、図6に示すように、基本方位角変位ΔΦの倍数となる。そして、例えば、第1のキャプチャ時間t1において、図1の自己回転センサヘッド10の5つのセンサは方位角ΦでP1(t1),…,P(t1),…P(t1)の5つの点を探知し、ここで、第2のキャプチャ時間t2において、自己回転センサヘッド10のセンサが方位角Φ=Φ+ΔΦでP(t2),…,P(t2),…P(t2)の5つの点を探知するなど。したがって、この離散値Φは、点P (t1)、…、P(t1)、…P(t1)の方位角Φの量子化値と見なすことができ、量子化ステップで量子化ΔΦ(基本方位角変位とも呼ばれる)を取得する。同様に、離散値Φは、点P(t2)、…、P(t2)、…P(t2)の方位角Φの量子化値と見なすことができる。
符号化側では、点群の各点Pについて、キャプチャされた点Pの3D位置を表す3Dデカルト座標を変換することにより、点Pをキャプチャしたセンサに関連付けられたセンサインデックスλk(n)(センサインデックスλ(∀k=0からK-1)のセットで)、前記センサのキャプチャ角を表す方位角Φi(n)(離散角Φ(∀i=0からI-1のセットで)及び点Pの球座標の半径値rを取得する。これらの3Dデカルト座標はセンサヘッドの出力であってもよい。簡単のため、以下、λk(n)およびインデックスi(n)をそれぞれλおよびΦとして表す。従って、Φは角度ではなく、角度Φへ指すインデックスi(∀i=0からI-1)である。しかし、インデックスΦと標準関連の方位角Φi(n)=ΦΦnとの間には明確な関係があるため、この量Φは方位角とも呼ばれる。
次に、まず方位角に基づいてからセンサインデックスに基づく辞書順序に基づいて、方位角Φとセンサインデックスλに基づいて点群の点をソートする。戻して図6を参照すると、シーケンシャルキャプチャされた点はP(t1),…,P(t1),…,P(t1),P(t2),…,P(t2),…,P(t2),…,P(tn),…,P(tn),…P(tn)である。
点Pの順序インデックスo(P)は、次式によって取得される。
o(P)=Φ K+λ
代替的には、これらの点は、センサインデックスに基づいてから方位角に基づく辞書順序に基づいてソートされる。
点Pの順序インデックスo(P)は、次式によって取得される。
o(P)=λ*I+Φ
次に、それぞれ2つの連続点Pn-1とP(n=2からNについて)の順序インデックスの差を表す順序インデックス差Δoは以下の式によって取得される。
Δo=o(P)-o(Pn-1
最初の点P1の順序インデックスo(P)は、ビットストリームに直接符号化できる。これは、仮想的な第0の点の順序インデックスを任意にゼロに設定することに相当し、すなわち、o(P)=0であり、Δo=o(P)-o(P)=o(P)を符号化する。
最初の点の順序インデックスo(P)と順序差Δoを与えると、次式によって任意の点Pの順序インデックスo(P)を再帰的に再構築することができる。
o(P)=o(Pn-1)+Δo
そして、次式によってセンサインデックスλと方位角Φを検索する。
λ=o(P)モジュラK (4)
Φ=o(P)/K (5)
ここで、/Kという除算は整数除算(ユークリッド除算とも呼ばれる)である。したがって、o(P)とΔoはλとΦの代替表現である。
順序インデックスo(P)と(N-1)個の順序インデックス差Δo(∀n=2からN)を符号化することにより、順序点に関連付けられた順序インデックスo(P)をビットストリームに符号化し、ここでNは順序点の数である。各順序インデックス差Δoは、連続した2つの順序点に関連付けられた順序インデックス間の差を表す。図7では、5つの順序点(黒丸)を示す。時間t1において角度Φ(Φにおいて)でPとPn+1の2つの点がキャプチャされ、時間t2において角度Φ+ΔΦで3つの点がキャプチャされる。2D座標(Φ,λ)システムにおける第1の点Pの座標が予め知られていると仮定して、点Pn+1に関連する順序インディクスo(Pn+1)と点Pに関連する順序索引o(P)との差として1次インディクス差Δon+1を取得する。別の順序点Pn+2に関連する順序インディクスo(Pn+2)と点Pn+1に関連する順序インディクスo(P)との差として2次インディクス差Δon+2を取得し、これに従って類推する。
次に、点群の順序点に関連付けられた球座標の半径値r(本質的に点Pのr2Dまたはr3D表す)はビットストリームに符号化される。
順序点Pの3次元デカルト座標の残差(xres,n,yres,n,zres,n)はビットストリームに符号化される。これらは、それらの3次元デカルト座標、方位角Φから取得された復号化された方位角Φn,dec、半径値rから取得された復号化された半径値rn,dec、及びセンサインデックスλから取得される。
次に、順序点に関連付けられた残差方位角Φres,nもビットストリームに符号化される。
Φres,n=Φ(P)-Φpred,n=Φ(P)-Φ*ΔΦ (6)
変形例では、方位角Φは次式によって量子化される。
Φ=round(Φ(P)/ΔΦ)
この場合、離散角度Φの集合(0≦i<I)は、本質的にΦ=i*ΔΦによって定義され、Φi(n)=Φ*ΔΦが取得される。したがって、復号化された方位角Φn,decは次式によって取得される。
Φn,dec=Φres,n+Φpred,n=Φres,n+Φ*ΔΦ
この変形例は、ノイズがキャプチャされている可能性があるため、またはセンサがすべて完全に位置合わせされていないため、またはレーザレーダセンサヘッドの少なくとも1つのレーザビームが反射されていない可能性があるため、実際には、キャプチャ時間ごとにすべての点をキャプチャするわけではないので、利点を提供する。残差方位角Φres,nは、このようなノイズまたは位置合わせされていないことを符号化することを目的としている。キャプチャされた点は、図8に示されるように分布することができる。方位角Φ(P)の量子化は、図9に示されるように、2D座標(Φ,λ)システムにおける点の離散的表現をもたらし、これにより、点群の点のソートに明らかな経路を提供することを可能にする。
好ましくは、量子化及び/又はエントロピー符号化によって、残差方位角Φres,nがビットストリームBに符号化される。
これは、全範囲の値ではなく残差だけを符号化するため、ビットストリームに符号化される角度の動的性が低減される。高い圧縮性能を達成する。
ビットストリームから点群の点を復号化することは、点群におけるN個点の情報、2D座標(Φ,λ)システムにおける第1の点の順序インデックスo(P)、およびセンサ設定パラメータ、例えば基本方位角変位ΔΦまたは各センサkに関連する仰角θを必要とする。この情報は、ビットストリームBから復号化されてもよいし、他の任意の手段で受信されてもよいし、デコーダによって予め知られていてもよい。
点群のN個の点は再帰的に復号化することができる。
まず、ビットストリームから少なくとも1つの順序インデックス差Δo(n=2からN)を復号化する。現在の点Pに対して各順序インデックス差Δoを復号化する。
次に、現在の点Pの順序インデックスo(P)を次式によって取得する。
o(P)=o(Pn-1)+Δo
順序インデックス差Δoは、現在の点Pnに関連付けられた順序インデックスと、以前に複号化された点Pn-1に関連付けられた別の順序インデックスo(Pn-1)との差を表す。
次に、現在の点Pをキャプチャしたセンサに関連付けられたセンサインデックスλと、前記センサのキャプチャ角を表す方位角Φとを、式(4)及び(5)で順序インデックスo(P)から取得する。
次に、復号化された方位角Φdec,nは以下の式によって与えられる。
Φdec,n=Φres,n,dec+Φ*ΔΦ (7)
ここで、Φres,n,decはビットストリームから復号化された残差方位角である。
次に、現在の点Pの球座標の半径値r及び現在の点Pの3次元デカルト座標の残差をビットストリームから復号化する。
最後に、現在の点Pの3次元デカルト座標の復号化された残差、復号化された半径値r、復号化された方位角Φn,dec、およびセンサインデックスλに基づいて、現在の点Pの3次元デカルト座標(x,y,z)を復号化する。
従来技術から理解されるように、残差方位角Φres,n(式2または6)はビットストリームに符号化される。
これらの残差方位角の定義により、次の不等式は境界属性を表す。
|Φres,n|≦ΔΦ/2 (8)
この不等式は、残差方位角がセンサ特性(すなわち、自己回転センサヘッドの2回の探知間の基本方位角変位ΔΦ)に依存する値によって制限されることを示す。
解決すべき問題は、自己回転センサヘッドを使用して点群ジオメトリをキャプチャするフレームワーク中の境界属性(8)からメリットを取得して、このキャプチャされた点群ジオメトリデータの符号化効率を向上させることである。
次節では、本出願のいくつかの態様の基本的な理解を提供するために、少なくとも1つの例示的な実施例の簡素化された概要を提示する。この概要は、例示的な実施例の詳細な概要ではない。これは、実施例の肝心な要素または重要な要素を特定することを意図していない。以下の概要は、文書中の他の場所で提供されるより詳細な説明の前置きとして、例示的な実施形態の少なくとも1つの態様のいくつかの態様のみを簡略化された形で提示する。
本出願の第1の態様によれば、点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を提供し、点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データをビットストリームに符号化するステップを含む。前記符号化は、センサの特性に依存する境界値に基づいており、前記方位角データの絶対値が前記境界値によって制限されるようにする。
例示的な一実施例では、方位角と前記方位角の予測角との間の1次残差方位角を量子化することによって方位角データを取得する。
例示的な一実施例では、境界値に依存するオフセット値と中間方位角データとを加算することによって方位角データを取得し、この中間方位角データが1次残差方位角と前記1次残差方位角の予測との間の2次残差方位角に依存する。
例示的な一実施例では、オフセット値は整数値と2B+1との積であり、ここでBは境界値であり、前記整数値は方位角データの絶対値が境界値Bによって制限されることを保証する。
例示的な一実施例では、境界値は、基本方位角変位と、1次残差方位角を量子化するための量子化パラメータとに依存する。
例示的な一実施例では、方位角データを符号化することは、方位角データを一連のバイナリデータにバイナリ化することと、2つの可能な値がいずれも、データの絶対値が境界値Bによって制限されるという条件に違反しないバイナリデータのみを符号化することと、をさらに含む。
本出願の第2の態様によれば、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を提供し、点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データをビットストリームから復号化するステップであって、ここで、前記復号化は、センサの特性に依存する境界値に基づいており、前記方位角データの絶対値が前記境界値によって制限されるようにする。
例示的な一実施例では、方位角データを復号化することは、2つの可能な値がいずれも、方位角データの絶対値が境界値によって制限されるという条件に違反しない場合、ビットストリームからバイナリデータを復号化すること、またはバイナリデータの値を前記条件に違反しない唯一の値と推定することと、のいずれかにより、バイナリデータごとに、方位角データを表す一連のバイナリデータを取得することを含む。
例示的な一実施例において、方位角データは方位角と前記方位角の予測角との間の量子化された残差方位角である。
例示的な一実施例では、この方法は、方位角データと、この方位角と前記方位角の予測角との間の第1の残差方位角の予測とから中間残差方位角を取得するステップと、境界値に依存するオフセット値と中間残差方位角とを加算することによって1次残差方位角を取得するステップと、前記1次残差方位角を逆量子化するステップと、をさらに含む。
例示的な一実施例では、オフセット値は整数値と2B+1との積であり、ここで、Bは境界値であり、前記整数値は中間残差方位角の絶対値が境界値Bによって制限されることを保証する。
例示的な一実施例では、境界値は、基本方位角変位と残差を逆量子化するための量子化パラメータとに依存する。
本出願の第3の態様によれば、物理的オブジェクトを表す符号化された点群データのビットストリームを提供し、点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データと境界値(B)を表すデータとを含み、この境界値(B)は、センサの特性に依存し、前記方位角データの絶対値が前記境界値によって制限されるように前記方位角データを復号化するためのものである。
本出願の第4の態様によれば、点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する装置を提供する。この装置は、本出願の第1の態様に係る方法を実行するように構成される1つまたは複数のプロセッサを含む。
本出願の第5の態様によれば、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する装置を提供する。この装置は、本出願の第2の態様に係る方法を実行するように構成される1つまたは複数のプロセッサを含む。
本出願の第6の態様によれば、命令を含むコンピュータプログラム製品を提供し、このプログラムが1つまたは複数のプロセッサによって実行される場合、命令は1つまたは複数のプロセッサに本出願の第1の態様に係る方法を実行させる。
本出願の第7の態様によれば、本出願の第1の態様に係る方法を実行するためのプログラムコードの命令を運ぶ非一時的な記憶媒体を提供する。
本出願の第8の態様によれば、命令を含むコンピュータプログラム製品を提供し、このプログラムが1つまたは複数のプロセッサによって実行される場合、命令は1つまたは複数のプロセッサに本出願の第2の態様に係る方法を実行させる。
本出願の第9の態様によれば、本出願の第2の態様に係る方法を実行するためのプログラムコードの命令を運ぶ非一時的な記憶媒体を提供する。
例示的な実施例のうちの少なくとも1つの具体的な性質、および前記例示的な実施例のうちの少なくとも1つの他の目的、利点、特徴、および用途は、以下の図面と併せて例の説明から明らかになる。
ここで、本出願の例示的な実施例を示す図面が例示的に参照され、ここで、
従来技術に係るセンサヘッド及びそのいくつかのパラメータの側面図を示す。 従来技術に係るセンサヘッド及びそのいくつかのパラメータの平面図を示す。 従来技術に係る自己回転センサヘッドでキャプチャされたデータの規則的な分布を示す。 従来技術に係る3D空間における点の表現を示す。 従来技術に係る方位角の予測符号化を示す。 本出願の例示的な一実施例に係る2D空間で表されるキャプチャ点の例を示す。 本出願の例示的な一実施例に係る符号化された順序点の例を示す。 本出願の例示的な一実施例に係るキャプチャ点の例を示す。 本出願の例示的な一実施例に係るソートされ量子化されたキャプチャ点の例を示す。 少なくとも1つの例示的な実施例に係る、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を符号化する方法100のステップのブロック図を示す。 少なくとも1つの例示的な実施例に係る方法100の利点を示す。 少なくとも1つの例示的な実施例に係る方法100の利点を示す。 少なくとも1つの例示的な実施例に係る、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法200のステップのブロック図を示す。 様々な態様と例示的な実施例を実現するシステムの例の概略ブロック図を示す。異なる図において、使用された類似した符号で類似した構成要素を表すことができる。
以下、図面を参照しながら、例示的な実施例のうちの少なくとも1つの例を説明し、例示的な実施例のうちの少なくとも1つを図示する。しかし、例示的な実施形態は、多くの代替形態で実行されることができ、本明細書に記載された例に限定されるものとして解釈されるべきではない。したがって、例示的な実施例が開示された特定の形態に限定されることは意図されていないことが理解されたい。対照的に、本出願は、本出願の精神および範囲内に含まれるすべての修正、均等物および代替案をカバーすることを意図している。
図面がフローチャートの形態で提示されるとき、対応する装置のブロック図も提供することが理解されたい。同様に、図面がブロック図の形態で提示されるとき、対応する方法/プロセスのフローチャートも提供することが理解されたい。
これら態様のうちの少なくとも1つは、一般に、点群の符号化と復号化に関し、少なくとも1つの他の態様は、一般に、伝送して生成または符号化されたビットストリームに関する。
さらに、本態様は、点群圧縮などに関連するMPEG-Iパート5またはパート9のようなMPEG標準に限定されるものではなく、例えば、既存または将来開発されるものを問わず他の標準および推奨、およびそのような標準および推奨の拡張(MPEG-Iパート5およびパート9を含む)に適用されることができる。特に指示がない限り、又は技術的に除外されない限り、本出願に記載された態様は、単独で又は組み合わせて使用されることができる。
本発明は符号化と復号化技術の分野に関し、点群データを符号化/復号化する技術案を提供することを目的とする。点群は大量のデータの集合であるため、点群を保存するには大量のメモリを消費する可能性があり、点群を圧縮せずにネットワーク層内で点群を直接伝送することはできないため、点群を圧縮する必要がある。したがって、点群が自律ナビゲーション、リアルタイム巡回検査、地理情報サービス、文化遺産/建築物保護、3D没入型通信、及びインタラクションなどの分野でますます広く使用されるようになるにつれて、本発明は多くの応用シーンに使用することができる。
本発明は特にセンサの特性に基づいて方位角データを符号化/復号化することに関し、これはキャプチャされた点群ジオメトリデータのコーデックを向上させることができる。
本発明は、点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法100に関する。符号化方法100は、点群の点Pをキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角の方位角データΦcoded,nをビットストリームに符号化するステップを含む。前記符号化は、センサの特性に依存する境界値Bに基づいており、前記方位角データΦcoded,nの絶対値が前記境界値Bによって制限されるようにする。
実際に、方位角データΦcoded,nは境界値Bによって制限された整数値である。
|Φcoded,n|≦B (9)
図10は、少なくとも1つの例示的な実施例に係る方法100のステップのブロック図を示す。
方法100は、ステップ110と120を含む。
ステップ110において、自己回転センサヘッド10でキャプチャされた点群ジオメトリデータから、点群の点Pをキャプチャした自己回転センサヘッド10のセンサのキャプチャ角に応答する方位角Φ(P)を表す方位角データΦcoded,nを取得する。
ステップ110の第1の例示的な実施例では、方位角Φ(P)と前記方位角の予測角Φpred,nとの間の1次残差方位角Φres,nを量子化することによって方位角データΦcoded,nを取得する。
例えば、1次残差方位角は、式(2)または(6)、及び選択的に量子化演算子Q(.)による後続の量子化によって与えられる残差方位角Φres,nであってもよい。
境界値Bは次式によって与えられる。
B=Q(ΔΦ/2) (10)
任意の量子化演算子Q(.)を使用するために、均一または不均一なステップサイズおよび/またはデッドゾーンを使用することができる。
変形例では、量子化された1次残差方位角は次式によって与えられる。
Φcoded,n=Q(Φres,n)=Φres,n,Q=round(Φres,n/dΦ)(11)
ここで、Φは量子化ステップサイズである。
次に式(10)から境界値Bを導出する。
B=round(ΔΦ/(2dΦ)) (12)
そして、逆量子化後に再構成された角度の誤差はdΦ/2に達するため、デカルト座標空間における誤差eは2D半径r2D(すなわち、センサと点群の点Pとの距離)に比例する。
e≒r2D dΦ/2
したがって、圧縮効率の面では、点の2D半径に関係なく、統一誤差eをもたらす量子化ステップサイズdΦを選択することがやや最適である。基本的には、以下で用いることができる。
dΦ=dQ/22D
ここで、dQはユーザが選択した量子化パラメータである。通常、可逆符号化の場合、dQは1に等しい。これにより、式(12)が以下になる。
B=round(r2D ΔΦ/dQ) (13)
すると、小さな半径r2Dに対して、境界値Bを小さくすることができる。極端な場合、非常に小さな半径に対しては、最終的にはB=0になる可能性がある。この場合、方位角データΦcoded,nは、式(9)から、その値は必ずゼロであることが分かるためであるので、符号化される必要がない。
ステップ110の第2の例示的な一実施例では、境界値Bに依存するオフセット値と、1次残差方位角Φres,nと前記1次残差方位角の予測Φres,n,predとの間の2次残差方位角Φres,n,resに依存する中間方位角データΦ’coded,nとを加算することにより方位角データΦcoded,nを取得する。
Φres,n,res=Φres,n-Φres,n,pred (14)
変形例では、前記1次残差方位角の予測Φres,n,predは、点群の符号化された点Palに関連する1次残差方位角Φres,alを量子化することによって取得される。
Φres,pred,n=Q(Φres,al
シングルチェーン符号化方案では、既に存在する点Palは、点の順序リストにおける現在の点Pの前任者である。別の変形例では、この前任者は現在の点Pと同じレーザ指数λを有する前任者の中から選択される。
変形例では、中間方位角データΦ’coded,nは、2次残差方位角Φres,n,resを量子化することによって与えられる。
Φ’coded,n=Q(Φres,n,res)=Φres,n,res,Q=Q(Φres,n-Φres,n,pred
別の変形例では、中間方位角データΦ’coded,nは量子化された1次残差方位角Φres,nと前記1次残差方位角の予測Φres,n,predとの差によって与えられる。
Φ’coded,n=Φres,n,Q-Φres,n,pred (15)
ここで、Φres,n,predは量子化された1次残差方位角Φres,n,Qの予測または1次残差方位角Φres,nの予測の量子化バージョンである。
中間方位角データΦ’coded,nは本質的にBによって制限されない。
追加されたオフセット値は整数値nB,encと2B+1との積であり、Bが境界値である。整数値nB,encは、方位角データΦcoded,nの絶対値が境界値Bによって制限されることを保証する(式(9))。
Φcoded,n=Φ’coded,n+nB,enc (2B+1) (16)
ここで、Bは式(12)によって決定された境界値である。
変形例では、整数値nB,encは次式によって取得されることができる。
B,enc=-round(Φ’coded,n/(2B+1)) (17)
別の変形例では、整数値nB,encは、式(9)の有界関係を満たすまで2B+1のオフセットを反復的に適用(加算または減算)することによって取得されることができる。
ステップ110の第2の実施例は、図11のサポートで以下にシングルチェーンチェーン符号化のコンテキストで説明されるように、2次残差方位角Φres,n,resを使用することによって方位角データΦcoded,nの振幅が低減するため、利点を提供する。
方位角Φ(P)に関連する現在の点Pと、式(6)によって与えられる1次残差方位角Φres,nを考えてみよう。
Φres,n=Φ(P)-Φpred,n=Φ(P)-Φ
符号化対象の量子化された1次方位角残差(式11)は次式によって与えられる。
Φcoded,n=Q(Φres,n)=Φres,n,Q
現在、方位角Φ(Pal)に関連する符号化された点Palを考えてみよう、且つ1次残差方位角Φres,alは式(6)により与えられる。
Φres,al=Φ(Pal)-Φpred,al=Φ(Pal)-Φ-1
ステップ110の第2の実施例では、符号化して量子化された1次方位角残差Φres,n,Qの代わりに、1次残差方位角Φres,nと前記第1次残差方位角の予測Φres,n,predとの間の2次残差方位角Φres,n,resを取得し、式(15)によって与えられる中間方位角データΦ’coded,nを取得する。
Φ’coded,n=Q(Φres,n)-Φres,n,pred=Q(Φres,n)-Q(Φres,al
=Q(Φ(P)-Φ)-Q(Φ(Pal)-Φ-1
自己回転センサヘッド10の回転特性により、以下の近似値を取得することができる。
Φ(Pal)≒Φ(P)-ΔΦ
そこで
Φ(Pal)-Φ-1≒Φ(P)-ΔΦ-Φ-1=Φ(P)-Φ
したがって、符号化される中間方位角データΦ’coded,nは非常に小さく、且つ効率的な圧縮が得られる。
整数値nB,encを用いて中間方位角データΦ’coded,n(量子化された2次残差方位角Φres,n,res,Q)を制限することにより、以下に説明される利点を提供する。
図12に示されるように、点キャプチャは、センサノイズを受ける可能性がある。図11と比較すると、符号化された点Palは、いくつかのノイズεで少し左に移動する。したがって、関連する予測角はΦ-1からΦ-2に変化し、且つ1次残差方位角Φres,alは顕著な影響を受ける。現在、量子化された1次残差方位角Φres,alは1次残差方位角Φres,nの不良予測因子になる(式15)。
Φ’coded,n=Q(Φres,n)-Φres,n,pred=Q(Φres,n)-Q(Φres,al
=Q(Φ(P)-Φ)-Q(Φ(Pal)-Φ-2
B,encを用いて中間方位角データΦ’coded,nを制限することにより、実際には不良予測因子Q(Φres,al)の問題を解決し、方位角はΦ(Pal)で表すことができる。
Φ(Pal)≒Φ(P)-ΔΦ-ε
次に以下の式が取得される。
Φ(Pal)-Φ-2=Φ(Pal)-ΔΦ-ε-Φ-2=Φ(P)-Φ+ΔΦ-ε
量子化された演算子を適用した後、以下の近似値が取得される。
Q(Φ(Pal)-Φ-2)≒Q(Φ(P)-Φ)+Q(ΔΦ)+Q(-ε)≒Q(Φ(P)-Φ)+Q(ΔΦ)
無界中間方位角データΦ’coded,nは、次式によって近似することができる。
Φ’coded,n=Q(Φ(P)-Φ)-Q(Φ(Pal)-Φ-2)≒-Q(ΔΦ)≒-2B
この式は明らかに式(9)の制約条件を満たしていない。
従って、本発明によれば、(2B+1)の倍数のオフセット量を因子nB,enc=+1とともに(式16)を適用して以下の式が取得される。
Φcoded,n=Φ’coded,n+(2B+1)≒0
方位角データΦcoded,nは境界整数値Bによって制限される。方位角データΦcoded,nは振幅が小さく、境界値Bに基づくエントロピー符号化を用いて効率的に圧縮することができる。
ステップ120において、境界値Bを用いて有界方位角データΦcodedをビットストリームに符号化する。
ステップ120の例示的な一実施例では、方位角データΦcoded,n は、一連のバイナリデータfとしてバイナリ化され、ステップ122では、2つの可能な値がいずれも、データΦcoded,n の絶対値が境界値Bによって制限されるという条件に違反しないバイナリデータfのみを符号化する。
ステップ121と122の例示的な一実施例では、一連のバイナリデータfによって方位角データΦcoded,nをバイナリ化し符号化することは、以下のことを含む。
・ バイナリデータfがビットストリームに追加されて、Φcoded,n が0に等しい(f=0)か、またはΦcoded,n が0に等しくない(f=1)ことを信号で通知し、
・ Φcoded,nが0に等しくない場合、
・ シンボルフラグsがビットストリームに追加されて、Φcoded,nのシンボルを信号で通知し、
・ 一連のNフラグf~fNfがビットストリームに追加され、これらのフラグのうちの1つが正になるまで、各フラグfは、|Φcoded,n|がjに等しいか否かを信号で通知し、
・ すべてのフラグが負である場合、すなわち、Φcoded,nがNより大きい場合、|Φcoded,n|-Nf-1がexpGolombコードによってより多くのバイナリデータにバイナリ化されることをリマインダする。
境界値Bが0に等しい場合、フラグfを符号化する必要がない。同様に、データΦcoded,nが境界B≦Nに等しい場合、|Φcoded,n|がBに等しいか否かを信号で通知するフラグfは、デコーダによってそれが正(f=1)であると推定できるため、符号化される必要はない。そうでない場合、f=0は、|Φcoded,n|が少なくともB+1であることを意味し、式(9)の境界属性と矛盾するからである。
同様に、expGolombコードを構成するバイナリデータの潜在値(0または1)の1つが式(9)の境界属性と矛盾する場合、バイナリデータを符号化する必要がない可能性があり、その後、デコーダは、バイナリデータを逆の値と推定することができる。
符号化されたフラグまたはexpGolombコードは、コンテキスト適応バイナリ算術エンコーダ(CABAC)または他のエントロピーエンコーダなどの算術符号化に依存して、より良い圧縮を実現することができることを理解されたい。
いくつかの変形例では、不必要なデータを符号化しないと同じ原則に従って、境界値Bを考えると、Φcoded,nの他のバイナリ化方法または分解を使用することもできる。例えば、フラグf~fNfの系列を省略してもよく(すなわち、N=0を使用する)、および/またはexpGolombコードは、Golomb-RiceまたはHuffmanコードなどの別の可変長の符号化表現に置き換えられてもよい。
上記に例示したように、ステップ122において、2つの可能な値がいずれも、データΦcoded,nの絶対値が境界値Bによって制限されるという条件に違反しないバイナリデータfのみを符号化する。可能な値のうちの1つが制約条件(9)に違反するバイナリデータfは符号化されず、(デコーダによって)条件に違反していない一意の値と推定されるためである。このようなバイナリデータを符号化しないことにより、ビットストリームサイズを小さくし、点群をよりよく圧縮する。
本発明は、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法200にも関する。方法200は、点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データΦcoded,nをビットストリームから復号化するステップを含む。前記復号化は、センサの特性に依存する境界値Bに基づいており、前記方位角データΦcoded,nの絶対値が前記境界値Bによって制限されるようにする(式(9))。
図13は、少なくとも1つの例示的な実施例に係る方法200のステップのブロック図を示す。
方法200は、ステップ210、220、及び230を含む。
ステップ210において、エンコーダと同じ方法を用いて、式(10)、(12)、または(13)によって境界値Bを取得する。
ステップ220において、方位角データΦcoded,n を復号化する。方位角データΦcoded,n の復号化は、一連のバイナリデータfの値を取得することによって実行される。その後、方位角データΦcoded,n の復号化された値をバイナリデータfの値に基づいて算出する。各バイナリデータfの値はビットストリームから復号化または推定される。バイナリデータfの2つの可能な値のうちの1つが制約条件(9)に違反する場合、この値は条件に違反しない別の値と推定される。2つの可能な値がいずれも制約条件(9)に違反しない場合、ビットストリームからこの値を復号化する。
例えば、方位角データΦcoded,n が0に等しいか(f=1)、または等しくない(f=0)ことを指示する第1、2のバイナリデータfを考えてみよう。境界Bが0である場合、fが1と推定される。そうでない場合、fが復号化される。
ここでは、B>0であり、かつfがすでに0に復号化されたと仮定し、すなわち、方位角データΦcoded,nは0に等しくないと仮定する。そして信号で方位角データΦcoded,nを通知するシンボルのビットを復号化する。次に、絶対値|Φcoded,n|が1に等しいか(f=1)、または等しくない(f=0)ことを指示するバイナリデータfの値を取得する。B=1である場合、fは1と推定され、そうでない場合、B>1である場合、fを復号化する。同じプロセスは一連のバイナリデータfiに適用され、そのうちのそれぞれが絶対値|Φcoded,n|がiに等しい(f=1)か、またはiに等しくない(f=0)ことを信号で通知する。B=iである場合、fの値は1と推定される。
ステップ220は、一連のバイナリデータを介して方位角データΦcoded,nを符号化することに限定されない。代替的に、非バイナリワードであるWを用いて方位角データΦcoded,nを符号化することができる。制約条件(9)は、方位角データΦcoded,nが-B~Bの範囲内で2B+1個の異なる値をとることができることを意味する。したがって、方位角データΦcoded,nは長さがLのワードWで表すことができ、Lは以下のように定義される。
=ceil(log2(2B+1))
そこで、ワードWは、ビットストリームの一部であってもよく、任意の既知の手段(ビットを単純にプッシュまたはエントロピー符号化するなど)によって符号化する。境界Bの知識により、復号方法200は、ステップ220において、Bの長さLに依存するワードWを復号化することができる。そして、復号化されたワードWに基づいて方位角データΦcoded,nを回復する。
ステップ220の別の実施例では、一連のバイナリデータfと長さLが境界Bに依存する非バイナリワードWとの両方を用いて方位角データΦcoded,nを符号化することができる。例えば、方位角データΦcoded,nの第1の部分はバイナリデータfiを用いて符号化することができ、残りの部分は非バイナリワードWを用いて符号化することができる。
ステップ230において、点Pに関連する復号化された方位角Φdec,nを復号化する。
ステップ230の第1の実施形態では、方位角データΦcoded,nは方位角Φ(P)と前記方位角の予測角Φpred,nとの間の量子化された1次残差方位角Φres,n,Qである(式11)。
その後、式(3)または(7)に示すように、方位角データΦcoded,nと予測角Φpred,nに基づいて点群の点Pに関連する方位角(Φdec,n)を復号化する。
Φdec,n=Φcoded,n+Φpred,n
すると、小さな半径r2Dに対して、境界値Bを小さくすることができる。極端な場合、非常に小さな半径に対しては、最終的にはB=0になる可能性がある。この場合、方位角データΦcoded,nは、式(9)から、その値が必ずゼロであることが分かるので、符号化される必要がなく0に推定される。
ステップ230の第2の実施例では、境界値Bは式(10)によって与えられる。方位角データΦcoded,nと予測Φres,n,predから次式によって中間残差方位角Φres,n,Qを取得する。
Φres,n,Q=Φcoded,n+Φres,n,pred
ここで、Φres,n,predは方位角Φ(P)と前記方位角の予測角Φpred,nとの間の1次残差方位角Φres,nの予測である。
変形例では、前記1次残差方位角の予測Φres,n,predは点群の復号化された点Palに関連する1次残差方位角Φres,alを量子化することによって取得される。
Φres,n,pred=Q(Φres,al
ステップ232において、境界値Bに依存するオフセット値と中間残差方位角Φres,n,Qとを加算することにより、1次残差方位角Φres,n,Q,decを取得する。
Φres,n,Q,dec=Φres,n,Q+nB,dec (2B+1)
ここで、nB,decは整数値であり、1次残差方位角が境界値B(式(9))によって制限されることを保証する。
|Φres,n,Q,dec|≦B (18)
変形例では、整数値nB,decは、符号化中にnB、encと同様な方式で取得することができる。
B,dec=-round(Φres,n,Q/(2B+1))
別の変形例では、整数値nB,decは、式(18)の有界関係に満たすまで2B+1のオフセット量を反復的に適用(加算または減算)することによって取得することができる。
したがって、1次残差方位角Φres,n,Q,decは、以下に示されるエンコーダの1次残差方位角Φres,n,Qに正確に対応する。
-nB,dec (2B+1)=Φres,n,Q-Φres,n,Q,dec=Φcoded+Φres,n,pred-Φres,n,Q,dec
=Φ’coded+nB,enc (2B+1)+Φres,n,pred-Φres,n,Q,dec
=Φres,n,Q-Φres,n,pred+nB,enc (2B+1)+Φres,n,pred-Φres,n,Q,dec
=nB,enc (2B+1)+Φres,n,Q-Φres,n,Q,dec
そして(2B+1)で割って絶対値をとり、以下のことが取得される。
|nB,enc+nB,dec|=|Φres,n,Q,dec/(2B+1)-Φres,n,Q/(2B+1)|≦Φres,n,Q/(2B+1)|+|Φres,n,Q,dec/(2B+1)|≦B/(2B+1)+B/(2B+1)<1
現在、|nB,enc+nB,dec|は厳密には1未満である正の整数であるため、必然的にnB,dec=-nB,encが取得される。これは、Φres,n,Q=Φres,n,Q,decを証明し、Φres,n,Q-Φres,n,Q,dec=-nB,dec (2B+1)-nB,enc (2B+1)=-(nB,dec+nB,enc)*(2B+1)=0のためである。
したがって、デコーダの1次残差方位角Φres,n,Q,decは、エンコーダの1次残差方位角Φres,n,Qに正確に対応する。言い換えれば、復号方法中に2B+1の倍数を追加することは、デコーダが1次残差方位角の十分な値を回復する能力に影響しない。
ステップ233において、1次残差方位角Φres,n,decを繰り返して量子化することにより、復号化された1次残差方位角Φres,Q,decを取得する。
式(3)または(7)に示すように、点Pに関連する復号化された方位角Φdec,nは、復号化された1次残差方位角Φres,n,decと方位角Φ(Pn)の予測角Φpred,nによって取得されつ。
Φdec,n=Φres,n,dec+Φpred,n
本符号化/復号方法は、様々な目的で使用可能な点群を符号化/復号化するために使用することができ、特にセンサの特性に依存する境界値に基づいて方位角データを符号化/復号化するために使用され、これにより、コーデックの効率を向上させることができる。
図14は各態様及び例示的な実施例のシステムを実現する概略ブロック図を示す。
システム300は1つ又は複数のデバイスとして組み込まれてもよく、以下に説明される様々なコンポーネントを含む。様々な実施例では、システム300は、本出願で説明される1つ又は複数の態様を実現するように構成されてもよい。
システム300のすべて又は一部の装置を構成できる例は、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレット、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電製品、コネクテッドカーとその関連処理システム、ヘッドマウント ディスプレイ(HMD、透視メガネ)、プロジェクタ(投影機)、「洞窟」(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力を処理するポストプロセッサ 、ビデオエンコーダに入力を提供するプリプロセッサ、webサーバ、セットトップボックス、及び点群、ビデオ又は画像を処理するため他の任意のデバイス、又は他の通信デバイスを含む。システム300の素子は単一の集積回路(IC)、複数のIC及び/又はディスクリートコンポーネントに単独でまたは組み合わせて実装することができる。例えば、少なくとも1つの実施例では、システム300の処理及びエンコーダ/デコーダ素子は複数のIC及び/又はディスクリートコンポーネントにわたって分布することができる。様々な実施例では、システム300は例えば通信バス又は専用の入力及び/又は出力ポートを介して、他の類似するシステム又は他の電子機器に通信可能に結合することができる。
システム300は、少なくとも1つのプロセッサ310を含み、該少なくとも1つのプロセッサ310はそれにロードされる命令を実行することで、例えば本出願で説明される各態様を実現するように構成される。プロセッサ310は組み込みメモリ、入力出力インターフェース及び当分野で周知の他の様々な回路を含むことができる。システム300は少なくとも1つのメモリ320(例えば、揮発性メモリデバイス及び/又は非揮発性メモリデバイス)を含むことができる。システム300は、非揮発性メモリ及び/又は揮発性メモリを含むストレージデバイス340を含むことができ、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、読み取り専用メモリ(ROM)、プログラマブル読み取り専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、動的ランダムアクセスメモリ(DRAM)、静的ランダムアクセスメモリ(SRAM)、フラッシュメモリ、磁気ディスクドライブ及び/又は光ディスクドライブを含むが、これらに限らない。非限定的な例として、ストレージデバイス340は内部ストレージデバイス、追加ストレージデバイス及び/又はネットワークアクセス可能なストレージデバイスを含むことができる。
システム300は、例えばデータを処理することで符号化/復号化の点群ジオメトリ形状データを提供するように構成されるエンコーダ/デコーダモジュール330を含みことができ、そしてエンコーダ/デコーダモジュール330は自身のプロセッサとメモリを含むことができる。エンコーダ/デコーダモジュール330は、符号化及び/又は復号化機能を実行するようにデバイスに含まれる(1つ又は複数の)モジュールを表すことができる。周知のように、デバイスは符号化及び復号化モジュールのいずれか1つ又は両方を含むことができる。また、エンコーダ/デコーダモジュール330はシステム300の分離した素子として実現することができ、又は当業者に知られているハードウェアとソフトウェアの組み合せとしてプロセッサ310内に結合することができる。
本出願で説明される各態様を実行するようにプロセッサ310又はエンコーダ/デコーダ330にロードされるプログラムコードはストレージデバイス340に記憶することができ、そしてその後にメモリ320にロードされてプロセッサ310によって実行される。様々な実施例によると、本出願で説明されるプロセスを実行する間、プロセッサ310、メモリ320、ストレージデバイス340及びエンコーダ/デコーダモジュール330のうちの1つ又は複数は、各項目のうちの1つ又は複数を記憶することができる。このように記憶される項目は、点群フレーム、符号化/復号化されたジオメトリ形状/属性ビデオ/画像又は符号化/復号化されたジオメトリ形状/属性ビデオ/画像の一部、ビットストリーム、行列、変量、及び等式、公式、演算や演算の中間又は最終結果ロジックを含むが、これらに限らない。
いくつかの実施例では、プロセッサ310及び/又はエンコーダ/デコーダモジュール330内部のメモリは、命令を記憶し且つ符号化又は復号化の間に実行される処理のためにワーキングメモリを提供するために使用することができる。
しかし、他の実施例では、処理デバイス外部のメモリ(例えば、処理デバイスはプロセッサ310又はエンコーダ/デコーダモジュール330であってもよい)はこれらの機能のうちの1つ又は複数に用いられる。外部メモリはメモリ320及び/又はストレージデバイス340、例えば、動的揮発性メモリ及び/又は不揮発性フラッシュメモリであってもよい。いくつかの実施例では、外部不揮発性フラッシュメモリは、例えばテレビの操作システムを記憶するために使用される。少なくとも1つの実施例において、RAMのような快速外部動的揮発性メモリは、ビデオ符号化復号化及び復号化操作のワーキングメモリとして利用することができ、例えば、MPEG-2第2部分(ITU-TRecommendation H.262及びISO /IEC 13818-2とも呼ばれ、MPEG-2ビデオとも呼ばれる)、HEVC(高効率ビデオ符号化復号化)、VVC(汎用ビデオ符号化復号化)又はMPEG-I第5部分又は第9部分を対象とする。
ブロック390に示すように、様々な入力デバイスを介してシステム300の素子へ入力を提供することができる。このような入力デバイスは、(i)放送局などで無線送信されたRF信号を受信できるRF部、(ii)複合入力端子、(iii)USB入力端子、及び/又は(iv)HDMI入力端子を含むが、これらに限らない。
様々な実施例において、ブロック390の入力デバイスは、当分野で周知のように、関連し且つ対応する入力処理素子を有する。例えば、RF部分は以下の必要とされる素子を関連付けることができる。(i)所望の周波数(信号選択とも呼ばれ、又は信号を周波数帯域内に制限する)を選択すること、(ii)選択される信号をダウンコンバートすること、(iii)周波数帯域を再び狭い周波数帯域に制御することで、(例えば)いくつかの実施例でチャネルと呼ばれる信号周波数帯域を選択すること、(iv)ダウンコンバートされた信号と周波数帯域が制限された信号を復調すること、(v)誤り訂正を実行すること、及び(vi)逆多重化をして所望のデータパケットフローを選択すること。様々な実施例のRF部分はわざとこれらの機能を実行する素子、例えば、周波数セレクタ、信号セレクタ、周波数帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調装置、誤り訂正装置及びデマルチプレクサを含む。RF部分は、これらの各機能(例えば、受信した信号をより低い周波数(例えば、中間周波数又はベースバンド付近の周波数)又はベースバンドにダウンコンバートすることを含む)を実行するチューナーを含むことができる。
1つのセットトップボックスの実施例では、RF部分及びその関連する入力処理素子は有線(例えば、ケーブル)媒体において伝送されるRF信号を受信することができる。その後、RF部分はフィルタリング、ダウンコンバート及び再フィルタリングにより所望の周波数帯域を取得して周波数選択を実行することができる。
様々な実施例では、上記(及び他の)素子の順序を設定し、これらの素子のうちの一部を削除し、及び/又は類似又は異なる機能を実行する他の素子を追加する。
素子の追加は、既存の素子の間に、増幅器やアナログデジタルコンバータのような素子を挿入することを含むことができる。様々な実施例において、RF部分はアンテナを含む。
また、USB及び/又はHDMI端子は、対応するインターフェースプロセッサを含むことができ、USB及び/又はHDMI接続によりシステム300を他の電子機器に接続するために使用される。なお、必要な時に、入力処理の各態様(例えば、Reed-Solomon誤り訂正)は、例えば、分離した入力処理IC内又はプロセッサ310内で実現することができる。このように、必要な時に、分離したインターフェースIC内又はプロセッサ310内でUSB又はHDMIインターフェース処理の各態様を実現することができることを理解されたい。復調により、誤り訂正と逆多重化のストリームは、プロセッサ310、及びメモリと記憶素子に組み合わせて操作するエンコーダ/デコーダ330などを含む様々な処理素子に提供することができることにより、必要な時にデータストリームを処理して出力デバイスに表示する。
一体型ハウジング内でシステム300の様々な素子を提供することができる。一体型ハウジング内において、適切な接続レイアウト390、例えば、当分野で周知の内部バス(I2Cバスを含む)、配線及びプリント回路基板を用いて各素子を互いに接続しかつそれらの間でデータを伝送することができる。
システム300は通信インターフェース350を含むことができるので、通信チャネル700を介して他のデバイスと通信することができる。通信インターフェース350は、通信チャネル700においてデータを送受信するように構成される送受信機を含むが、これに限らない。通信インターフェース350は、モデム又はネットワークカードを含むが、これに限らず、通信チャネル700は例えば有線及び/又は無線媒体内で実現することができる。
様々な実施例において、IEEE 802.11のようなWi-Fiネットワークを用いてデータストリームをシステム300に伝送することができる。これらの実施例のWi-Fi信号は、Wi-Fi通信に適する通信チャネル700及び通信インターフェース350により受信可能である。これらの実施例の通信チャネル700は、一般に、ストリーミングアプリケーションおよび他のクラウド上(Over-the-top)通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続することができる。
他の実施例はセットトップボックスを用いてシステム300にストリーミングデータを提供することができ、該セットトップボックスは入力ブロック390のHDMI接続によりデータを搬送する。
入力ブロック390のRF接続を用いてストリーミングデータをシステム300に提供する実施例は他にもある。
ストリーミングデータは、システム300が用いるシグナリング情報の方式として使用することができる。シグナリング情報は、物理的オブジェクトを表す符号化された点群データのビットストリーム及び/又は点群の点数のような情報及び/又はセンサ設定パラメータ(例えば、基本方位角変位ΔΦ及び/又は境界値B及び/又は方位角データΦcoded,n)を含むことができる。
なお、様々な方式でシグナリングを実現できる。例えば、様々な実施例において、1つ又は複数の構文要素、フラグなどは、対応するデコーダに信号通知情報を送信するために使用することができる。
システム300は、ディスプレイ400、スピーカ500及び他の周辺機器600を含む様々な出力デバイスに出力信号を提供することができる。実施例の様々な例において、他の周辺機器600は独立したDVR、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム300の出力に基づいて機能を提供する他のデバイスのうちの1つ又は複数を含むことができる。
様々な実施例において、制御信号はAV.Link(オーディオ/ビデオリンク)、CEC(家電制御)又はデバイスからデバイスへの制御を有効にする他の通信プロトコルのシグナリングを用いてシステム300とディスプレイ400、スピーカ500又は他の周辺機器600との間で通信することができ、ユーザがあってもなくてもよい。
出力デバイスは、対応するインターフェース360、370及び380により、専用接続経由で通信可能にシステム300に接続することができる。
代替的に、通信インターフェース350経由で通信チャネル700を用いて出力デバイスをシステム300に接続することができる。ディスプレイ400とスピーカ500は電子機器(例えばテレビ)のシステム300の他のコンポーネントとともに単一ユニットに統合することができる。
様々な実施例において、表示インターフェース360は、タイミングコントローラ(T Con)チップのようなディスプレイドライバを含むことができる。
例えば、入力端390のRF部分が、分離したセットトップボックスの一部である場合、ディスプレイ400とスピーカ500は代替可能に他のコンポーネントのうちの1つ又は複数と分離する。ディスプレイ400とスピーカ500が外部コンポーネントであってもよい様々な実施例では、専用の出力接続(例えばHDMIポート、USBポート又はCOMP出力端子を含む)経由で出力信号を提供することができる。
図1-14では、様々な方法が説明され、各方法は、説明される方法を実現するように、1つ又は複数のステップ又は動作を含む。方法の正確な操作には特定のステップ又は動作順序が必要である場合でない限り、特定のステップ及び/又は動作の順序及び/又は使用を修正したり、組み合わせたりすることができる。
ブロック図及び/又は操作フローチャートについていくつかの例が説明されたが、各ブロックは、回路素子、モジュール、或いは(1つ又は複数の)指定ロジック機能を実現するための1つ又は複数の実行可能な命令のコードを含む部分を表す。なお、他の実施形態では、ブロックに示されている(1つ又は複数の)機能は、指示された順序に従って発生しなくてもよいことに留意されたい。例えば、関わる機能によると、次々と表示される2つのブロックは実際に、基本的に並列して実行されてもよいし、又は逆の順序でこれらのブロックを実行してもよい。
例えば方法又はプロセス、装置、コンピュータプログラム、データストリーム、ビットストリーム又は信号において本明細書で説明される実施形態と態様を実現することができる。単一形式の実施形態のコンテキストのみにおいて検討(例えば、方法のみとして検討する)しても、議論される特徴の実施形態は他の形式(例えば、装置又はコンピュータプログラム)で実現することができる。
方法は例えばプロセッサにおいて実現することができ、プロセッサは通常、例えばコンピュータ、マイクロプロセッサ、集積回路又はプログラム可能なロジックデバイスなどを含む処理デバイスを指す。プロセッサは通信デバイスをさらに含む。
また、方法は、プロセッサにより実行される命令で実現することができ、そして、このような命令(及び/又は実施形態により生成されたデータ値)はコンピュータ読み取り可能な記憶媒体に記憶することができる。コンピュータ読み取り可能な記憶媒体は、1つ又は複数のコンピュータ読み取り可能な媒体において実施され、かつそれにそれにおいて実施された、コンピュータにより実行可能なコンピュータ読み取り可能なプログラムコードを有するコンピュータ読み取り可能なプログラム製品の形式を用いることができる。それに情報を記憶する固有の能力及びそれにより提供される情報から検索する固有の能力を考慮すると、本明細書で使用されるコンピュータ読み取り可能な記憶媒体は、非一時的な記憶媒体として見なすことができる。コンピュータ読み取り可能な記憶媒体は、電子、磁気、光学、電磁、赤外線又は半導体システム、装置又はデバイス、又は前述したものの任意の適切な組み合せであってもよいが、これらに限らない。なお、以下は、本実施例を適用できるコンピュータ読み取り可能な記憶媒体のより更具的な例を提供したが、当業者dであれば容易に認識できるように、それらは網羅的なリストではなく例示的なものに過ぎないことを理解されたい。ポータブルコンピュータフロッピーディスク、ハードディスク、読み取り専用メモリ(ROM)、消去可能なプログラム可能な読み取り専用メモリ(EPROM 又はフラッシュメモリ)、コンパクトディスク読み取り専用メモリ(CD-ROM)、光学ストレージデバイス、磁気ストレージデバイス、又は前述したものの任意の適切な組み合せ。
命令は、プロセッサ読み取り可能な媒体に有形に実施されるアプリケーションを生成することができる。
例えば、命令はハードウェア、ファームウェア、ソフトウェア又はその組み合せに存在することができる。例えば、操作システム、独立したアプリケーション、又は両者の組み合せにおいて命令を見つけることができる。したがって、プロセッサは、例えばプロセスを実行するように構成されるデバイスやプロセスを実行するための命令を有するプロセッサ読み取り可能な媒体(例えばストレージデバイス)を含むデバイスとして特徴付けることができる。また、命令に加え又は命令の代わりに、プロセッサ読み取り可能な媒体可は、実施形態により生成したデータ値を記憶することができる。
装置は例えば適切なハードウェア、ソフトウェア及びファームウェアにおいて実現することができる。このような装置の例はパーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレット、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、コネクテッド家電製品、ヘッドマウント ディスプレイ(HMD、透視メガネ)、プロジェクタ(投影機)、「洞窟」(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力を処理するポストプロセッサ 、ビデオエンコーダに入力を提供するプリプロセッサ、web サーバ、セットトップボックス、及び処理点群、ビデオ又は画像を処理するための他の任意のデバイス、又は他の通信デバイスを含む。なお、装置は移動可能であり、移動中の車両に取り付けることもできる。
コンピュータソフトウェアは、プロセッサ310、ハードウェア、又はハードウェアとソフトウェアとの組み合せで実現することができる。非限定的な例として、1つ又は複数の集積回路で実施例を実現することができる。メモリ320は、技術環境に適応する任意のタイプであってもよく、任意の適切なデータ記憶技術(非限定的な例として、例えば光学メモリデバイス、磁気メモリデバイス、半導体に基づくメモリデバイス、固定メモリ及び移動可能なメモリ)で実現することができる。非限定的な例として、プロセッサ310は技術環境に適合する任意のタイプであってもよく、マイクロプロセッサ、汎用コンピュータ、専用のコンピュータ及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ又は複数をカバーすることができる。
当業者にとって明らかなように、実施形態は、例えば記憶可能又は伝送可能な情報を運搬するように定形化される様々な信号を生成することができる。情報は、例えば方法を実行するための命令又は説明される実施形態の1つにより生成されたデータを含むことができる。例えば、信号は、説明される実施例のビットストリームを搬送するように定形化されてもよい。この信号は、例えば電磁波(例えば、周波数スペクトルを用いる無線周波数部分)又はベースバンド信号に定形化されてもよい。定形化は、例えばデータストリームに対して符号化し、かつ符号化されたデータストリームを用いて搬送波を変調することを含むことができる。信号により搬送される情報は、例えばアナログ又はデジタル情報であってもよい。周知のように、信号は異なる有線又は無線リンクで伝送することができる。信号はプロセッサ読み取り可能な媒体に記憶することができる。
本明細書で使用される用語は、特定の実施例を説明することのみに使用され、限定するためのものではない。コンテキストに明確な指示がない限り、本明細書で使用される単数形の「1つ」、「1種」及び「該」は複数形をも含む。さらに、本明細書で使用される場合、「含む/包含(include/comprise)」及び/又は「含む/包含(including/comprising)」という用語は、説明される特徴、整数、ステップ、操作、要素及び/又はコンポーネントなどの存在を指示することができるが、1つ又は複数の他の特徴、整数、ステップ、操作、要素、コンポーネント及び/又はこれらの組み合せの存在又は追加を排除しない。また、1つの要素がもう1つの要素に「応答」又は「接続」すると呼ばれる時、もう1つの要素に直接応答又は接続してもよいし、中間要素が存在してもよい。逆に、1つの要素がもう1つの要素に「直接応答」又は「直接接続」すると呼ばれる時、中間要素が存在しない。
なお、例えば、「A/B」、「A及び/又は B」及び「AとBのうちの少なくとも1つ」の場合、「/」、「及び/又は」及び「少なくとも1つ」という符号/用語のうちのいずれか1つの使用は、一番目に挙げられた選択肢(A)の選択、又は二番目に挙げられた選択肢(B)の選択、又は2つの選択肢(AとB)の選択をカバーすることを意図している。更なる例として、「A、B及び/又はC」及び「A、B和Cのうちの少なくとも1つ」の場合、このような言葉遣いは、一番目に挙げられた選択肢(A)の選択のみ、又は二番目に挙げられた選択肢(B)の選択のみ、又は又は三番目に挙げられた選択肢(C)の選択のみ、又は一番目と二番目に挙げられた選択肢(AとB)の選択のみ、又は一番目と三番目に挙げられた選択肢(AとC)の選択、又は二番目と三番目に挙げられた選択肢(BとC)の選択のみ、又は3つの選択肢(AとBとC)のすべての選択をカバーすることを意図している。当分野及び当業者には明らかなように、このようにして、挙げられた項目の数に拡張することができる。
本出願では様々な数値を用いることができる。特定値は例示的なものであり、そして説明される各態様はこれらの特定値に限らない。
なお、第1、第2などの用語は本明細書において様々な要素を説明することに用いることができるが、これらの要素がこれらの用語に限らない。これらの用語は、1つの要素をもう1つの要素と区別することだけに用いられる。例えば、本出願の教示から逸脱しない限り、第1要素は第2要素と呼ぶことができ、同様に、第2要素は第1要素と呼ぶこともできる。第1要素と第2要素との間は順序付けが暗黙的に示されていない。
「1つの例示的な実施例」又は「例示的な実施例」又は「一実施形態」又は「実施形態」及びその他の変化の引用は、頻繁に、特定の特徴、構造、特点等(実施例/実施形態に合わせて説明されるもの)が少なくとも1つの実施例/実施形態に含まれることを伝えるために使用される。したがって、本出願の各箇所に現れる用語の「1つの例示的な実施例において」又は「例示的な実施例において」又は「一実施形態において」又は「実施形態において」およびその他の任意の変化の出現は、必ずしも同じ実施例を指すとは限らない。
同様に、本明細書の「例示的な実施例/例/実施形態によると」又は「例示的な実施例/例/実施形態において」およびその他の変化の引用は、頻繁に、特定の特徴、構造又は特点(実施例/実施形態に合わせて説明されるもの)が少なくとも1つの例示的な実施例/例/実施形態に含まれ得ることを伝えることに使用される。したがって、明細書の各箇所に現れる「例示的な実施例/例/実施形態によると」又は「例示的な実施例/例/実施形態において」という表現は、必ずしも同じ例示的な実施例/例/実施形態を指すとは限らず、独立又は代替的な例示的な実施例/例/実施形態が必ず他の例示的な実施例/例/実施形態とは相互排他的であるとも限らない。
請求項に現れる図面の符号は説明だけに用いられ、かつ請求項の範囲を限定しない。明確な説明がないにもかかわらず、任意の組み合せ又は一部の組み合せにより本実施例/例および変形例を用いることができる。
図がフローチャートとして示される時、対応する装置のブロック図も提供されることを理解されたい。同様に、図がブロック図として示される時、対応する方法/プロセスのフローチャートも提供されることを理解されたい。
一部の図には、通信路径において通信の主な方向を示す矢印が含まれるが、通信が、説明される矢印と逆の方向に発生することもできることを理解されたい。
様々な実施形態は復号化に関連する。本出願で使用されるように、「復号化」は、例えば受信した点群フレーム(1つ又は複数の点群フレームを符号化して受信したビットストリームを含む可能性がある)を実行することにより、表示又は再構築された点群領域内の更なる処理に適合する最終出力を生成するプロセスの全部又は一部をカバーすることができる。様々な実施例において、このようなプロセスは、通常デコーダにより実行されるプロセスのうちの1つ又は複数を含む。様々な実施例において、例えば、このようなプロセスは、本出願で説明される様々な実施形態のデコーダにより実行されるプロセスを代替的に含むこともできる。
更なる例として、一実施例では、「復号化」は逆量子化のみを指すことができ、一実施例では、「復号化」はエントロピー復号化を指すことができ、もう1つの実施例において、「復号化」は差分復号化を指すことができ、もう1つの実施例において、「復号化」は逆量子化、エントロピー復号化および差分復号化の組み合せを指すことができる。具体的に説明されるコンテキストに基づいて、「復号化プロセス」という用語は、具体的には、操作のサブセットを指すか、それともより一般的な復号化プロセスを指すかが自明なことであり、当業者にとって理解しやすいものでもある。
様々な実施形態は符号化に関連する。以上の「復号化」に係る検討と同様に、本出願において使用される「符号化」は、例えば、入力点群フレームを実行することにより符号化のビットストリームを生成するプロセスの全部又は一部をカバーすることができる。様々な実施例において、この種類のプロセスは、通常エンコーダにより実行されるプロセスのうちの1つ又は複数を含む。様々な実施例において、このようなプロセスは、本出願で説明される各実施形態のエンコーダにより実行されるプロセスを代替的に含むこともできる。
更なる例として、1つの実施例において、「符号化」は量子化のみを指すことができ、1つの実施例において、「符号化」はエントロピー符号化のみを指すことができ、もう1つの実施例において、「符号化」は差分符号化のみを指すことができ、もう1つの実施例において、「符号化」は量子化、差分符号化およびエントロピー符号化の組み合せを指すことができる。特定の説明がなされているコンテキストに基づいて、「符号化プロセス」という用語は、操作のサブセットを専門に指すか、それともより一般的な符号化プロセスを指すかが自明なことであり、当業者にとって理解しやすいものでもある。
また、本出願は、様々な情報の「決定」について言及した。情報の決定は、情報の推定、情報の計算、情報の予測又はメモリから情報を検査することのうちの1つ又は複数を含むことができる。
また、本出願は、様々な情報への「アクセス」について言及した。情報へのアクセスは情報の受信、(例えば、メモリから)情報を検索すること、情報の記憶、情報の移動、情報のコピー、情報の計算、情報の決定、情報の予測又は情報の推定のうちの1つ又は複数を含むことができる。
また、本出願は様々な情報の「受信」について言及した。「アクセス」と同様に、受信というのは広義的な用語である。情報の受信は、例えば、情報へのアクセス又は情報の検索(例えば、メモリから)のうちの1つ又は複数を含むことができる。また、もう1つの方式として、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の削除、情報の計算、情報の決定、情報の予測又は情報の推定などの操作期間は、通常、「受信」に関連する。
それに、本明細書で使用されるように、「信号」という用語は、特に対応するデコーダが特定のことを指示するなどを指示する。例えば、いくつかの実施例では、エンコーダは、点群の点数および/またはセンサ設定パラメータ(例えば、基本方位角変移ΔΦ及び/又は境界値B及び/又は方位角データΦcoded,n)など、特定の情報を信号を送信することで通知する。この様式により、実施例において、エンコーダ側とデコーダ側において同じパラメータを用いることができる。したがって、例えば、エンコーダはデコーダに(明確なシグナリング)特定パラメータを送信することができ、これにより、デコーダは同じ特定パラメータを用いることができる。逆に、デコーダが特定のパラメータおよび他のパラメータを有している場合、伝送を必要としないシグナリング(間接的なシグナリング)を用いて、デコーダに知らせかつ特定パラメータを選択させることを容易にする。如何なる実際の機能の伝送を回避するために、様々な実施例においてビット節約を実現している。なお、様々な方式でシグナリングを完成できることを認識されたい。例えば、様々な実施例において、1つ又は複数の文法要素、フラグなどは、情報を対応するデコーダに送信するために使用される。上記は「信号」という単語の動詞の形に関連するが、「信号」という単語は本明細書において名詞として使用されても良い。
すでに複数の実施形態を説明したが、様々な修正を行っても良いことを理解されたい。例えば、異なる実施形態の要素を組み合せ、補充、修正又は削除することによって他の実施形態を生成することができる。また、当業者であれば理解できるように、他の構造とプロセスは、開示された構造とプロセスを代替でき、これにより生成された実施形態は基本的に同じである(1つ又は複数の)方式で、基本的に同じ(1つ又は複数の)である機能を実行することによって、少なくとも開示された実施形態と基本的に同じである(1つ又は複数の)結果を実現する。したがって、本出願では、これらの内容及び他の実施形態が構想される。
本出願の第6の態様によれば、コンピュータプログラムを提供し、このプログラムが1つまたは複数のプロセッサによって実行される場合、1つまたは複数のプロセッサに本出願の第1の態様に係る方法を実行させる。
本出願の第8の態様によれば、コンピュータプログラムを提供し、このプログラムが1つまたは複数のプロセッサによって実行される場合、1つまたは複数のプロセッサに本出願の第2の態様に係る方法を実行させる。

Claims (16)

  1. 点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法であって、
    前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角(Φ(P))を表す方位角データ(Φcoded,n)をビットストリームに符号化するステップを含み、前記符号化は、センサの特性に依存する境界値(B)に基づいており、前記方位角データ(Φcoded)の絶対値が前記境界値によって制限されるようにする、
    ことを特徴とする点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
  2. 前記方位角データ(Φcoded)は、前記方位角(Φ(P))と前記方位角の予測角(Φpred,n)との間の1次残差方位角(Φres,n)を量子化することによって取得される、
    ことを特徴とする請求項1に記載の点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
  3. 前記方位角データ(Φcoded)は、前記境界値(B)に依存するオフセット値と、前記1次残差方位角(Φres,n)と前記1次残差方位角(Φres,n,pred)の予測(Φres,n,pred)との間の2次残差方位角(Φres,n,res)に依存する中間方位角データ(Φ’coded)とを加算することによって取得される、
    ことを特徴とする請求項1に記載の点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
  4. 前記オフセット値は整数値(nB,enc)と2B+1との積であり、Bは前記境界値であり、前記整数値(nB,enc)は前記方位角データ(Φcoded,n)の絶対値が前記境界値Bによって制限されることを保証する、
    ことを特徴とする請求項3に記載の点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
  5. 前記境界値(B)は、基本方位角変位と、前記1次残差方位角(Φres,n)を量子化するための量子化パラメータとに依存する、
    ことを特徴とする請求項1~4のいずれかに記載の点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
  6. 方位角データ(Φcoded)を符号化することは、さらに、
    前記方位角データ(Φcoded,n)を一連のバイナリデータ(f)にバイナリ化することと、
    2つの可能な値がいずれも、前記データ(Φcoded,n)の絶対値が前記境界値Bによって制限されるという条件に違反しないバイナリデータ(f)のみを符号化することと、を含む、
    ことを特徴とする請求項1~5のいずれかに記載の点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
  7. 物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法であって、
    前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角(Φ(P))を表す方位角データ(Φcoded,n)を前記ビットストリームから復号化するステップを含み、前記復号化は、センサの特性に依存する境界値(B)に基づいており、前記方位角データ(Φcoded,n)の絶対値が前記境界値(B)によって制限されるようにする、
    ことを特徴とする物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
  8. 前記方位角データ(Φcoded,n)を復号化することは、
    各バイナリデータ(f)に対して、
    2つの可能な値がいずれも前記方位角データ(Φcoded,n)の絶対値が前記境界値Bによって制限されるという条件に違反しない場合、前記ビットストリームから前記バイナリデータ(f)を復号化すること、
    または、前記バイナリデータ(f)の値を前記条件に違反しない一意の値と推定することのいずれか1つにより、
    前記方位角データ(Φcoded,n)を表す一連のバイナリデータ(f)を取得することを含む、
    ことを特徴とする請求項7に記載の物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
  9. 前記方位角データ(Φcoded,n)は、前記方位角(Φ(P))と前記方位角の予測角(Φpred,n)との間の量子化された残差方位角(Φres,n,Q)である、
    ことを特徴とする請求項7または8に記載の物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
  10. 前記方法は、
    前記方位角データ(Φcoded)と、前記方位角(Φ(P))と前記方位角の予測角(Φpred,n)との間の第1残差方位角の予測(Φres,n,pred)とから中間残差方位角(Φres,n,Q)を取得(231)するステップと、
    前記境界値(B)に依存するオフセット値と前記中間残差方位角(Φres,n,Q)とを加算することにより、1次残差方位角(Φres,n,Q,dec)を取得(232)するステップと、
    前記1次残差方位角(Φres,n,Q,dec)を逆量子化(233)するステップと、をさらに含む、
    ことを特徴とする請求項7に記載の物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
  11. 前記オフセット値は整数値(nB,dec)と2B+1との積であり、Bは前記境界値であり、前記整数値(nB,dec)は前記中間残差方位角(Φres,n,Q)の絶対値が前記境界値Bによって制限されることを保証する、
    ことを特徴とする請求項10に記載の物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
  12. 前記境界値(B)は、基本方位角変位と、前記残差を逆量子化するための量子化パラメータとに依存する、
    ことを特徴とする請求項7~11に記載の物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
  13. 物理的オブジェクトを表す符号化された点群データのビットストリームであって,
    前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角(Φ(P))を表す方位角データ(Φcoded,n)と、境界値(B)を表すデータとを含み、前記境界値(B)は、センサの特性に依存し、前記方位角データ(Φcoded,n)の絶対値が前記境界値(B)によって制限されるように前記方位角データ(Φcoded,n)を復号化するためのものである、
    ことを特徴とする物理的オブジェクトを表す符号化された点群データのビットストリーム。
  14. 点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する装置であって、
    1つまたは複数のプロセッサを含み、前記1つまたは複数のプロセッサは、前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データを前記ビットストリームに符号化するように構成され、前記符号化は、センサの特性に依存する境界値に基づいており、前記方位角データの絶対値が前記境界値によって制限されるようにする、
    ことを特徴する点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する装置。
  15. 物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する装置であって、
    1つまたは複数のプロセッサを含み、前記1つまたは複数のプロセッサは、前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データを前記ビットストリームから復号化するように構成され、前記復号化は、センサの特性に依存する境界値に基づいており、前記方位角データの絶対値が前記境界値によって制限されるようにする、
    ことを特徴とする物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する装置。
  16. 命令が含まれるコンピュータプログラム製品であって、前記プログラムが1つまたは複数のプロセッサによって実行される場合、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を前記1つまたは複数のプロセッサに実行させ、前記方法は、前記点群の点をキャプチャしたセンサのキャプチャ角に応答する方位角を表す方位角データを前記ビットストリームから復号化するステップを含み、前記復号化は、センサの特性に依存する境界値に基づいており、前記方位角データの絶対値が前記境界値によって制限されるようにする、
    ことを特徴とするコンピュータプログラム製品。
JP2023560503A 2021-04-08 2021-10-13 自己回転センサヘッドでキャプチャされた点群ジオメトリデータを符号化/復号化する方法及び装置 Pending JP2024514505A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21305456.2A EP4071717A1 (en) 2021-04-08 2021-04-08 Method of encoding point cloud geometry data captured by a spinning sensors head
EP21305456.2 2021-04-08
PCT/CN2021/123663 WO2022213570A1 (en) 2021-04-08 2021-10-13 Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head

Publications (1)

Publication Number Publication Date
JP2024514505A true JP2024514505A (ja) 2024-04-02

Family

ID=76325448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023560503A Pending JP2024514505A (ja) 2021-04-08 2021-10-13 自己回転センサヘッドでキャプチャされた点群ジオメトリデータを符号化/復号化する方法及び装置

Country Status (6)

Country Link
EP (1) EP4071717A1 (ja)
JP (1) JP2024514505A (ja)
KR (1) KR20230162722A (ja)
CN (1) CN117136543A (ja)
BR (1) BR112023020625A2 (ja)
WO (1) WO2022213570A1 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9930341B2 (en) * 2014-06-20 2018-03-27 Qualcomm Incorporated Block vector coding for intra block copying
US9854253B2 (en) * 2014-06-30 2017-12-26 Qualcomm Incorporated Method for motion vector difference (MVD) and intra block copy vector difference (BVD) coding of screen content video data
EP3429210A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing Methods, devices and stream for encoding and decoding volumetric video
EP3432581A1 (en) * 2017-07-21 2019-01-23 Thomson Licensing Methods, devices and stream for encoding and decoding volumetric video
EP4213096A1 (en) * 2018-01-18 2023-07-19 BlackBerry Limited Methods and devices for entropy coding point clouds
CN108632607B (zh) * 2018-05-09 2019-06-21 北京大学深圳研究生院 一种基于多角度自适应帧内预测的点云属性压缩方法
CN111327902B (zh) * 2018-12-13 2022-11-22 华为技术有限公司 点云的编解码方法及装置
CN111699683B (zh) * 2019-06-13 2022-05-17 深圳市大疆创新科技有限公司 一种点云编码方法、点云解码方法及相关设备

Also Published As

Publication number Publication date
BR112023020625A2 (pt) 2023-12-19
CN117136543A (zh) 2023-11-28
EP4071717A1 (en) 2022-10-12
WO2022213570A1 (en) 2022-10-13
KR20230162722A (ko) 2023-11-28

Similar Documents

Publication Publication Date Title
WO2022134752A1 (en) Method and apparatus of entropy encoding/decoding point cloud geometry data captured by a spinning sensors head
WO2022213568A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
JP2024514505A (ja) 自己回転センサヘッドでキャプチャされた点群ジオメトリデータを符号化/復号化する方法及び装置
US20240187631A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
US20240185472A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
RU2818834C2 (ru) Способ и устройство кодирования/декодирования геометрических данных облака точек с использованием режима азимутального кодирования
WO2023123261A1 (en) Method and apparatus of encoding/decoding point cloud geometry data
US20240185466A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
EP4220561A1 (en) Method and apparatus of encoding/decoding a slice of point cloud data
WO2022213569A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
US20240163480A1 (en) Method and apparatus of encoding/decoding point cloud captured by a spinning sensors head
WO2022134753A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
EP4142290A1 (en) Method and apparatus of encoding/decoding point cloud geometry data sensed by at least one sensor
WO2022213572A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
EP4141794A1 (en) Method and apparatus of encoding/decoding point cloud geometry data sensed by at least one sensor
WO2023029671A1 (en) Method and apparatus of encoding/decoding point cloud geometry data sensed by at least one sensor
US20240046528A1 (en) Method and apparatus of quantizing spherical coordinates used for encoding/decoding point cloud geometry data
CN118043849A (zh) 编码/解码由至少一个传感器感测的点云几何数据的方法和装置
JP2024515026A (ja) 方位コーディングモードを使用して点群ジオメトリデータを符号化/復号化する方法及び装置
CN117957572A (zh) 对由至少一个传感器感测到的点云几何数据进行编码/解码的方法和装置
CN118120237A (zh) 编码/解码由至少一个传感器感测的点云几何数据的方法和装置
CN117981321A (zh) 对由至少一个传感器感测到的点云几何数据进行编码/解码的方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231030