JP2024515026A

JP2024515026A - 方位コーディングモードを使用して点群ジオメトリデータを符号化／復号化する方法及び装置

Info

Publication number: JP2024515026A
Application number: JP2023559993A
Authority: JP
Inventors: ガオ，シュオ; ラセール，セバスチャン
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2021-04-08
Filing date: 2021-10-13
Publication date: 2024-04-04
Also published as: KR20230162719A; BR112023020667A2; EP4071716A1; US20240185475A1; CN117157981A; WO2022213571A1

Abstract

点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する／物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法及び装置を提供する。この方法は、点群の点の座標を符号化する／復号化するための一連のビットを提供する方位コーディングモードを含む。方位コーディングモードは、前のビットを符号化するための親区間に関連するオフセット量と継承角度とに基づいて角度補間を用いて左角φleft,dと右角φright,dとを決定する。本発明は、方位コーディングモードの反復毎に角度φleft,dに対するアークタンジェント関数と角度φright,dに対するアークタンジェント関数とを系統的に実行することを回避する。通常の方位コーディングモードに比べて圧縮効率が向上するとともに、合理的な複雑さが維持される。角度φleft,dとφright,dと選択の柔軟性も提供する。【選択図】図８

Description

関連出願の相互引用

本出願は、２０２１年４月８日に提出された欧州特許出願番号Ｎｏ．ＥＰ２１３０５４５５．４の優先権を要求し、その内容は参照によって全体的に本開示に組み込まれる。

本出願は、一般に点群圧縮に関し、具体的に、方位コーディングモードを使用して点群ジオメトリデータを符号化／復号化する方法及び装置に関する。

このセクションは、読者に当分野の様々な態様を紹介することを目的とし、これらの態様は、以下に記載および／または特許請求される本出願の少なくとも１つの例示的な実施例の様々な態様に関連する。この議論は、本出願のあらゆる態様をよりよく理解するために、読者に背景情報を提供するのに役立つと考えられる。

点群は、３Ｄデータを表すフォーマットとして最近注目されている。これは、すべてのタイプの物理的オブジェクトまたはシナリオを表す能力が様々である。点群は文化遺産／建築物など、様々な目的で使用でき、ここで、物体を送信したりアクセスしたりすることなく物体の空間設定（ｃｏｎｆｉｇｕｒａｔｉｏｎ）を共有するために、彫刻や建物のような物体を３Ｄ方式でスキャンする。また、それは物体が破壊される可能性がある場合、その物体の知識を確実に保存する方式である。例えば、地震では破壊されたお寺。通常、このタイプの点群は静的でカラーで巨大である。

もう一つの使用例は地形学と製図学において、ここで３Ｄ表現を使用して地図が平面に限らず起伏を含むことができることを許可する。Ｇｏｏｇｌｅマップは現在３Ｄマップの良い例であるが、点群ではなくメッシュを使用している。しかし、点群は３Ｄマップの適切なデータフォーマットであってもよく、通常、このタイプの点群は静的でカラーで巨大である。

バーチャルリアリティ、没入型の世界は最近話題となり、多くの人に２Ｄタブレットビデオの未来と予見されている。基本的な考え方は、視聴者が視聴者の周囲の環境に浸らせることであり、視聴者が視聴者の前の仮想世界しか見られない標準的なＴＶとは対照的である。視聴者の環境における自由度により、没入感はいくつかのレベルがある。点群は仮想現実（ＶＲ）世界を配布する良いフォーマット候補である。

自動車工業と自律型自動車も点群を使用できる分野である。自律型自動車は、近隣の現実的な状況に基づいて適切な運転決定を行うために、それらの環境を「探知」すべきである。

点群は、三次元（３Ｄ）空間に位置する点の集合であり、選択的に各点に付加値を付加する。これらの付加値は、通常、属性と呼ばれる。属性は、例えば、３成分の色、材料特性（例えば、反射率）、及び／又は点に関連する表面の２成分の法線ベクトルであってもよい。

したがって、点群はジオメトリ（３Ｄ空間における点の位置であり、３Ｄデカルト座標ｘ、ｙ、ｚで表される）と属性との組み合わせである。

点群は、カメラのアレイ、深さセンサー、レーザー（光検出と測距）など、様々なタイプのデバイスでキャプチャすることができ、または、コンピュータで生成することもできる（例えば、映画のポストプロダクションなど）。使用例に応じて、地図作成のために、点群には数千から数十億の点が含まれてもよい。点群の元の表現には、点ごとに非常に多くのビット数が必要であり、デカルト座標ｘ、ｙ、またはｚごとに少なくとも十数ビットがあり、さらに選択的に（１つまたは複数）属性により多くのビット、例えば、色用の１０ビットの３倍、を提供する。

多くのアプリケーションでは、許容できる（またはできれば好ましくは非常に優れた）体験品質を維持しながら、適切な数のビットレート（またはアプリケーションを格納するための記憶空間）を消費するだけで、エンドユーザーに動的点群を配布する（または、それらをサーバーに記憶する）ことができることが重要である。これらの動的点群の効率的な圧縮は、多くの没入型の世界の配布チェーンを実用化するための重要なポイントである。

エンドユーザーによる配布と可視化に対して、例えばＡＲ／ＶＲグラスやその他の任意の３Ｄ対応デバイスでは、圧縮は非可逆圧縮（例えば、ビデオ圧縮の場合）であってもよい。しかし、医療アプリケーションや自律運転などの他の使用例は、圧縮されて伝送された点群の解析から取得される判断結果を変更しないようにするために、可逆圧縮を必要とする。

最近まで、マスマーケットは点群圧縮（別名ＰＣＣ）の問題を解決せず、標準化された点群 HYPERLINK "https://cjjc.weblio.jp/content/%E3%82%B3%E3%83%BC%E3%83%87%E3%83%83%E3%82%AF" ＼o "コーデック" コーデックもない。２０１７年、標準化ワーキンググループＩＳＯ／ＪＣＴ１／ＳＣ２９／ＷＧ１１は、動画像専門家グループまたはＭＰＥＧとも呼ばれ、点群圧縮の作業プロジェクトを開始した。その結果、次の２つの規格が制定された。
ＭＰＥＧ－Ｉパート５（ＩＳＯ／ＩＥＣ２３０９０－５）またはビデオベースの点群圧縮（Ｖ－ＰＣＣ）
ＭＰＥＧ－Ｉパート９（ＩＳＯ／ＩＥＣ２３０９０－９）またはジオメトリベースの点群圧縮（Ｇ－ＰＣＣ）

Ｖ－ＰＣＣ符号化方法は、３Ｄオブジェクトに複数回の投影を行って点群を圧縮して、画像（移動した点群を処理する場合のビデオ）にパッケージ化された２Ｄパッチを取得する。既存の画像／ビデオコーデックで取得された画像やビデオを圧縮し、すでに配置された画像とビデオ解決案を最大限に活用可能になる。画像／ビデオコーデックは、例えば、レーザーライダーでキャプチャされた疎なジオメトリデータの投影から取得された非平滑なパッチを圧縮することができないため、Ｖ－ＰＣＣは、本質的には、密集した点群と連続した点群のみで効率的である。

Ｇ－ＰＣＣコーディング方法は、キャプチャされた疎なジオメトリデータを圧縮するための２つの方案を備える。

第１の方案は、点群ジオメトリ学的形状の占有ツリー（オクトリーツリー）表現に基づくものである。占有されたノードは一定のサイズに達するまで分割され、占有されたリーフノードによって点の３Ｄ位置が提供される。リーフノードは通常、体積で表され、通常、既知の３Ｄ位置に所定のサイズを有する立方体である。この体積の中心は、点の３Ｄ位置を定義することができる。代替的には、推定直接コーディングモード（ＩＤＣＭ）は、占有ツリーのリーフノード内の点に属する３Ｄ位置を直接コーディングすることができる。非最小サイズを有するノード内の１つまたは複数の点の３Ｄ位置を直接コーディングすることにより、ノードに孤立点のみが存在する場合にツリー構造を停止することにより、疎な点群は推定直接コーディングモード（ＩＤＣＭ）からメリットを取得することができる。

第２の方案は、各ノードが１点の３Ｄ位置を表し、ノード間の関係が親ノードから子ノードへの空間予測である予測ツリーに基づくものである。この方法は疎な点群しか解決せず、占有ツリーよりも遅延が低く簡単な復号化という利点が提供される。しかし、占有ベースの最初の方法に比べて、圧縮性能はわずかしか向上せ、且つ、符号化が複雑であり、予測ツリーを構築する際に（長い列の潜在予測器の中から）最適な予測器を集中して見つける。

第１の方案では、現在のリーフノードに適用されるＩＤＣＭを改善するために方位コーディングモードが導入される。基本的に、方位コーディングモードは、コーディングされた点（コーディングされたリーフノードに属する）の方位角を使用して、点群の点のｘまたはｙ座標を符号化するための一連のビットを提供する。これにより、現在のリーフノードの位置に対するこの点の圧縮が非常に改善される。まず、ｘ軸とｙ軸に対する点Ｐ（現在のノード内）のｘとｙ座標に基づいて、方位コーディング方向（水平面に沿ったｘ軸またはｙ軸）を選択し、この方位コーディング方向に対して、点Ｐの座標はコンテキスト自己適応バイナリエントロピー符号化される。例えば、ｘ_nodeとｙ_nodeが、現在のリーフノード位置を表すｘとｙ座標であり、｜ｘ_node｜≦｜ｙ_node｜である場合、方位コーディング方向はｘ軸に沿い、そうでなければ、ｙ軸に沿う。例えば、ｘ_nodeとｙ_nodeは現在のリーフノードの中心のｘとｙ座標であってもよい。（ｘ_P，ｙ_P，ｚ_P）で点Ｐの座標を表しよう。選択された方位コーディング方向がｘ（またはｙ）軸に沿う場合、以下の座標符号化を処理する：
・まず、ｙ_P（またはｘ_P）座標ビットをコーディングし、
・次に、ｘ_P（またはｙ_P）座標ビットをコンテキスト自己適応バイナリエントロピー符号化し、
・最後に、点Ｐのｚ_P座標をエントロピー符号化する。

第１の符号化ｙ_P（またはｘ_P）は、バイパスエントロピー符号化を使用して実行することができ、すなわち、ｙ_P（またはｘ_P）を表すビットは単純にビットストリームに押し込まれる。代替的には、コンテキスト自己適応バイナリエントロピー符号化を使用して第１の符号化ｙ_P（またはｘ_P）を実行することができる。

図面上では、角度はサポート区間の線分上の点として明確に示される。角度は線分上の一意の点に対応し、任意の点は一意の方位角に対応する。以下では、点に関連する方位角は、２Ｄ（ｘｙ）水平面の原点をこの点に結合する線と、他方のｘ軸との間で定義される。これは方位角φの典型的な定義に対応する。

本発明は、このような方位角の定義に限定されず、例えば、代替軸を角度の原点（φ＝０）として使用することができる。

図１は、従来技術による方位コーディング方向がｘ軸に沿う場合に方位コーディングモードを使用して点のｘ座標を符号化する方法１００のステップを示すブロック図である。

方位コーディング方向がｘ軸に沿う場合、方法１００を詳細に説明する。方位コーディング方向がｙ軸に沿う場合、ｘ座標とｘ軸をそれぞれｙ座標とｙ軸に置き換え、逆方向にすることにより、等価な方法を導出することができる。

ステップ１０１において、現在の（リーフ）ノードの中から（ｘ_P，ｙ_P，ｚ_P）座標を有する点Ｐをピックアップし、方位コーディング方向（ここでｘ軸に沿う）を選択し、この方位コーディング方向に沿う１つの点座標（ここではｘ_P）はビットストリームＢにおいてコンテキスト自己適応バイナリエントロピー符号化される。

ステップ１０２において、逆方向（ここではｙ軸）に沿う別の点座標（ここではｙ_P）はビットストリームＢにバイパスエントロピーコーディングされる。

ステップ１０３において、点Ｐに対して方位予測角φ_predを決定する。この方位角予測角φ_predは、（最も近い）コーディングされた点の方位角φ_alと、センサ回転サンプリングを表す基本方位シフトΔφの倍数ｎから取得される。整数ｎは、現在のノードの中心に関連する方位角からφ_pred＝φ_al＋ｎΔφが最も近い可能性のある角度として取得するために選択することができる（ｎのすべての可能な選択の中で）。

ステップ１０４において、方位コーディング方向（ここではｘ軸）に沿う親区間（ここではｘ区間）が初期化される。

図形上では、図２に示すように、２Ｄ_xy平面において、この区間は方位コーディング方向（ここではｘ軸）と平行な線に属し、コーディングされた逆座標（ここではｙ_P）を有する。（ここではｘ－）区間はこの線（ｙ＝ｙ_P）と現在のノードの２Ｄ_xy平面への投影との交点である。

ステップ１０５において、ｘ区間を左半区間と右半区間の２つの半区間に分割する。２つの角度φ_left,dとφ_right,dを決定する。角度φ_left,dは左半区間に関連する角度であり、角度φ_right,dは右半区間に関連する角度である。

ステップ１０６において、予測角度φ_predと２つの角度φ_left,d及びφ_right,dとに基づいてコンテキスト（ｃｏｎｔｅｘｔ）を選択する。

例えば、図３を考えてみよう、図３は、例示的な点を示し、この点はｘ軸（選択された方位コーディング方向）に沿う区間における位置が３つのビットｂ_d（ｄ＝１、２、３）で表され、８つの可能性におけるこの点の位置を表す。コーディング点が左側の４つの点の１つである場合、最初のビット（ｂ１）は０に等しく、コーディング点が右側の４つの点の１つである場合、最初のビット（ｂ１）は１に等しい。予測角度φ_predは、点位置に関するある種類の予測情報を提供し、予測角度φ_predは左半区間を指しているため、統計的に見ると、コーディング点が左半区間（すなわち、ｂ_d＝０）に属する可能性は、右半区間（すなわち、ｂ_d＝１）に属する可能性よりも大きい。角度差｜φ_pred－φ_left,d）｜と｜φ_pred－φ_right,d｜とを比較して、対応的にコンテキストを選択することにより、簡単に予測角度φ_predに運ばれる情報の中からメリットを取得することができる。例えば、
・｜φ_pred-φ_left,d｜＜｜φ_pred－φ_right,d｜である場合、第１のコンテキストを選択してｂ_dをエントロピーコーディングする。
・そうでない場合、第２のコンテキストを選択してｂ_dをエントロピーコーディングする。

ステップ１０７において、選択されたコンテキストを使用することにより、ｘ_Pの最上位残りのビットｂ_dをビットストリームＢにコンテキスト自己適応バイナリエントロピー符号化する。このビットｂ_dは、ｘ_Pが左半区間（ｂ_d＝０）または右半区間（ｂ_d＝１）に位置することを指示する。

ステップ１０８において、ｘ区間は、ｘ_Pが属する半区間（コーディングビットｂｄが示すように）に更新される。コーディングビットｂ_dが０に等しい場合、ｘ_Pが左半区間に位置することを指示し、ｘ区間を左半区間に更新する。コーディングビットｂ_dが１に等しい場合、ｘ_Pが右半区間に位置することを指示し、この区間を右半区間に更新する。

次に、この方法はｘＰ符号化が完了したか否かを確認する。例えば、この方法は、更新後の区間寸法が最小ｘ区間寸法以下であるか、またはすべてのビットｂ_dが符号化されたか否かを等価に確認する。

ｘ_Pのコーディングが完了した（すなわち、例えば、ｘ区間寸法が最小ｘ区間寸法以下である）場合、ステップ１０９において、残りの座標ｚ_PをコードストリームＢに符号化する。

ｘ_Pのコーディングが完了していない場合、ステップ１０５に繰り返して、ｘＰを表す次のビットｂ_d+1をコーディングする。

図４は、ビットｂ_dがｘ_Pが右半区間内にあることを指示する場合にｘ区間を更新することを示す。その後、ステップ１０５において、現在の反復（深さｄ－１）の右半区間は、次の反復（深さｄ）で２つの半区間に分割される。

Ｇ－ＰＣＣ規格の現在のテストモデルでは、ステップ１０５において、２つの半区間の中間を表す（とは限らないが）位置ｘ_left,dとｘ_right,dから２つの角度φ_left,dとφ_right,dを決定することができる。２つの角度を計算する直接的な方法の１つは、図５に示すように、アークタンジェント式を使用することである。

いくつかのプラットフォームでは、２つのアークタンジェント関数を計算する計算コストが課題になる可能性がある。

点座標の各ｂ_dの方位コーディング方向に沿うコーディングのために２つのアークタンジェントを計算することを避けるために、Ｇ＿ＰＣＣテストモデルの実施形態は、図６に示されるように、ｘ_left,dとｘ_right,dの特定の位置を使用する。すなわち、ｘ_left,dはｘ区間の最も左境界であり、ｘ_right,dはｘ区間の中間である。これにより、更新後の（半）区間は、その親区間の角度を継承して、更新後の角度φ_left,dを取得することができる。
・ｂ_d-1＝０である場合、角度φ_left，ｄ＝φ_left,d-1である。
・ｂ_d-1＝１である場合、角度φ_left，ｄ＝φ_right,d-1である。

このように、反復ごとに（深さｄごとに）アークタンジェント関数を１つだけ実行してφ_right,dを計算する。

図６に示される角度φ_left,dとφ_right,dで、Ｇ＿ＰＣＣテストモデル実施形態は、この２つの角度が半区間の中間をうまく表すことができず、計算の単純性に影響するため、圧縮効率を犠牲にする。

なぜ圧縮効率が最適でないのかを理解するために、図６の例を振り返ってみよう。コンテキスト自己適応バイナリエントロピーコーデック（例えば、ＣＡＢＡＣ）において選択されたコンテキストを使用してビットｂ_dをコーディングする場合、コーディング確率は自然に進化し、第１のコンテキストに対してｐ（ｂ_d＝１）＜０．５、第２コンテキストに対してｐ（ｂ_d＝１）＞０．５となる。一般的な規則として、ｐがビットｂ_dが１である確率であると仮定すると、１を符号化するコストは－ｌｏｇ２（ｐ）であり、０を符号化するコストは－ｌｏｇ２（１－ｐ）である。

図５から理解できるように、角度φ_left,dが左半区間の中間を指し、かつ角度φ_right,dが右半区間の中間を指している場合、コンテキスト選択はｂ_d＝０またはｂ_d＝１をよく予想することができるため、選択されたコンテキストに関連する確率はコーディングコストの減少に対応する。

図７は、同じ例示的な点を示すが、角度をφ_left,dとφ_right,dとを有し、図６に示された従来技術と同様に、Ｇ－ＰＣＣテストモデルで実現される。この例では、予測角度φ_predは依然として左半区間を指し、ｂ_d＝０の可能性がｂ_d＝１の可能性よりも大きいことを示す。ただし、このような特定の角度設定に対して｜φ_pred－φ_left,d｜≧｜φ_pred－φ_right,d｜を有するため、コンテキスト選択は、第２のコンテキストを選択する。

ｂ_d＝０が第２のコンテキストでコーディングされる可能性が高く、第２のコンテキストの確率がｐ（ｂ_d＝０）＝１－ｐ（ｂ_d＝１）＜０．５であり、コンテキストコスト－ｌｏｇ２（１－ｐ（ｂ_d＝１））が高いため、このような好ましくないコンテキスト選択は、ｂ_dをコーディングするコストに影響する。

したがって、現在のテストモデル（ＴＭＣ１３）におけるコンテキスト選択のための角度φ_left,dとφ_right,dとはわずかな次善であり、非最適な圧縮効率をもたらす。

したがって、圧縮効率を向上させるとともに、合理的な複雑さを維持するために最適な角度φ_left,dとφ_right,dとを取得することが非常に必要である。基本的に、合理的な複雑さを維持することは、主に複雑なアークタンジェント関数の計算を最小化することを意味する。

上記の内容を考慮して本出願の少なくとも１つの例示的な実施例は設計される。

次節では、本出願のいくつかの態様の基本的な理解を提供するために、少なくとも１つの例示的な実施例の簡素化された概要を提示する。この概要は、例示的な実施例の詳細な概要ではない。これは、実施例の肝心な要素または重要な要素を特定することを意図していない。以下の概要は、文書中の他の場所で提供されるより詳細な説明の前置きとして、例示的な実施形態の少なくとも１つの態様のいくつかの態様のみを簡略化された形で提示する。

簡単に言えば、本発明は方位コーディングモードに関し、このモードは角度補間を用いて、先行ビットを符号化するための親区間に関連するオフセット量と継承角度とに基づいて角度φ_left,dとφ_right,dとを決定する。

本発明は、方位コーディングモードの反復のたびに角度φ_left,dのアークタンジェント関数と角度φ_right,dのアークタンジェント関数を系統的に実行することを回避する。上記で説明した方位コーディングモードに比べて、圧縮効率を向上させるとともに、合理的な複雑さを維持する。角度φ_left,dとφ_right,dの選択の柔軟性も提供する。

本出願の第１の態様によれば、点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を提供し、この方法は、点群の点の座標を符号化するための一連のビットを提供する方位コーディングモードを含む。この方法は、
－点座標が属する親区間を左半区間と右半区間とに分割するステップと、
－親区間に関連する少なくとも１つの継承角度の中から、左半区間に関連する左角と右半区間に関連する右角とを補間するステップと、
－左角と右角とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、ビットをビットストリームにコンテキスト自己適応バイナリエントロピー符号化するステップであって、前記符号化されたビットが、点座標が２つの半区間のどちらに属するかを指示するステップと、を含む。

本出願の第２の態様によれば、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を提供し、この方法は点群の点の座標を復号化するための一連のビットを提供する方位コーディングモードを含む。この方法は、
－点座標が属する親区間を左半区間と右半区間とに分割するステップと、
－親区間に関連する少なくとも１つの継承角度の中から、左半区間に関連する左角と右半区間に関連する右角とを補間するステップと、
－左角と右角とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、ビットストリームからビットをコンテキスト自己適応バイナリエントロピー復号化するステップであって、前記復号化されたビットが、点座標が２つの半区間のどちらに属するかを指示するステップと、を含む。

例示的な実施例によれば、第１の角度と、第２の角度と第３の角度との重み付け差とを加算することにより、左角を補間し、第４の角度と、第５の角度と第６の角度との重み付け差とを加算することにより、右角を補間する。

例示的な実施例によれば、第１、第２、第３、第４、第５、及び第６の角度は、親区間に関連する継承角度である。

例示的な実施例によれば、第１、第３、第４の角度は、いずれも、親区間に関連する同じ継承角度に等しく、且つ、第２、第４、及び第５の角度は、いずれも、親区間の中点に関連する別の継承角度に等しく、且つ、アークタンジェント関数を実行することにより、左半区間または右半区間の中点に関連する角度を計算する。

例示的な実施例によれば、第１、第３及び第５の角度は、いずれも、同じ継承角度に等しく、且つ第２、第４及び第６の角度は、いずれも、親区間の上限に等しい別の継承角度に等しく、且つ、アークタンジェント関数を実行することにより、左半区間の上限に関連する角度または右半区間の下限に関連する角度を計算する。

例示的な実施例によれば、左半区間の上限に関連する角度または右半区間の下限に関連する角度は、親区間の中点に関連する継承角度に等しい。

例示的な実施例によれば、１番目のビットを符号化するために、アークタンジェント関数を実行することにより、左半区間の上限に関連する角度または右半区間の下限に関連する角度を計算し、且つ、後続のビットを符号化するために、左半区間の上限に関連する角度または右半区間の下限に関連する角度は、親区間の中点に関連する継承角度に等しい。

例示的な実施例によれば、親区間の中点に関連する継承角度は、親区間に関連する２つの継承角度から補間される。

例示的な実施例によれば、親区間の寸法が決定された閾値以上である場合、アークタンジェント関数を実行することにより親区間の中点に関連する継承角度を計算するか、または、そうでない場合に親区間に関連する２つの継承角度から補間する。

本出願の第３の態様によれば、点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する装置を提供する。この装置は、本出願の第１の態様に係る方法を実行するように構成される１つまたは複数のプロセッサを含む。

本出願の第４の態様によれば、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する装置を提供する。この装置は、本出願の第２の態様に係る方法を実行するように構成される１つまたは複数のプロセッサを含む。

本出願の第５の態様によれば、命令を含むコンピュータプログラム製品が提供され、プログラムが１つまたは複数のプロセッサによって実行される場合、１つまたは複数のプロセッサに、本出願の第１の態様に係る点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を実行させる。

本出願の第６の態様によれば、プログラムコードの命令を運ぶ非一時的な記憶媒体を提供し、この命令は、本出願の第１の態様に係る点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を実行するために使用される。

本出願の第７の態様によれば、命令を含むコンピュータプログラム製品を提供し、プログラムが１つまたは複数のプロセッサによって実行される場合、１つまたは複数のプロセッサに、本出願の第２の態様に係る物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を実行させる。

本出願の第８の態様によれば、プログラムコードの命令を運ぶ非一時的な記憶媒体を提供し、この命令は、本出願の第２の態様に係る物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を実行するために使用され、この方法は点群の点の座標を復号化するための一連のビットを提供する方位コーディングモードを含む。

例示的な実施例のうちの少なくとも１つの具体的な性質、及び前記例示的な実施例のうちの少なくとも１つの他の目的、利点、特徴、及び用途は、以下図面と併せた例の説明から明らかになる。

ここで、本出願の例示的な実施例を示す図面が例示的に参照され、ここで、
従来技術による方位コーディング方向がｘ軸に沿う場合に方位コーディングモードを使用して点のｘ座標を符号化する方法のステップを示すブロック図である。従来技術による方位コーディング方向に沿う区間の定義を示す図である。従来技術による１つの点座標が左半区間に属すると予測された場合に、図１の方位コーディングモードの区間を更新する概略図である。従来技術によるビットｂ_dがｘＰが右半区間内にあることを指示する場合にｘ区間を更新することを示す図である。従来技術による２つの角度φ_left,dとφ_right,dを決定するための例示的な実施例を示す図である。従来技術による２つの角度φ_left,dとφ_right,dを計算するための例示的な実施例を示す図である。従来技術による２つの角度φ_left,dとφ_right,dを計算するための図６の例示的な実施例の欠点を示す図である。少なくとも１つの例示的な実施例に係る方位コーディング方向がｘ軸に沿う場合に方位コーディングモードを使用して点のｘ座標を符号化する方法のステップを示すブロック図である。少なくとも１つの例示的な実施例に係る２つの角度φ_left,dとφ_right,dとを補間するための例示的な実施例を示す図である。少なくとも１つの例示的な実施例に係る２つの角度φ_left,dとφ_right,dとを補間するための例示的な実施例を示す図である。少なくとも１つの例示的な実施例に係る２つの角度φ_left,dとφ_right,dとを補間するための図１０の例示的な実施例の変形例を示す図である。区間の中間を計算するための例示的な実施例を示す図である。少なくとも１つの例示的な実施例に係る方位コーディング方向がｘ軸に沿う場合に方位コーディングモードを使用して点のｘ座標を復号化する方法３００のステップを示すブロック図である。様々な態様と例示的な実施例が実装されるシステムの一例の概略ブロック図である。異なる図において、使用された類似した符号で類似した構成要素を表すことができる。

以下、図面を参照しながら、例示的な実施例のうちの少なくとも１つの例を説明し、例示的な実施例のうちの少なくとも１つを図示する。しかし、例示的な実施形態は、多くの代替形態で実行されることができ、本明細書に記載された例に限定されるものとして解釈されるべきではない。したがって、例示的な実施例が開示された特定の形態に限定されることは意図されていないことが理解されたい。対照的に、本出願は、本出願の精神および範囲内に含まれるすべての修正、均等物および代替案をカバーすることを意図している。

図面がフローチャートの形態で提示されるとき、対応する装置のブロック図も提供することが理解されたい。同様に、図面がブロック図の形態で提示されるとき、対応する方法／プロセスのフローチャートも提供することが理解されたい。

これら態様のうちの少なくとも１つは、一般に、点群の符号化と復号化に関するものであり、少なくとも１つの他の態様は、一般に、生成または符号化されたビットストリームの伝送に関するものである。

さらに、本態様は、点群圧縮などに関連するＭＰＥＧ－Ｉパート５またはパート９のようなＭＰＥＧ標準に限定されるものではなく、例えば、既存または将来開発されるものを問わず他の標準および推奨、およびそのような標準および推奨の拡張（ＭＰＥＧ－Ｉパート５およびパート９を含む）に適用されることができる。特に指示がない限り、又は技術的に除外されない限り、本出願に記載された態様は、単独で又は組み合わせて使用されることができる。

本発明は符号化と復号化技術の分野に関し、点群データを符号化／復号化する技術案を提供することを目的とする。点群は大量のデータの集合であるため、大量のメモリは記憶点群によって消費され、点群を圧縮せずにネットワーク層内で点群を直接伝送することはできないため、点群を圧縮する必要がある。したがって、点群が自律ナビゲーション、リアルタイム巡回検査、地理情報サービス、文化遺産／建築物保護、３Ｄ没入型通信、及びインタラクションなどの分野でますます広く使用されるようになるにつれて、本発明は多くの応用シーンに使用することができる。

本発明は方位コーディングモードに関し、それは角度補間を用いて、先行ビットを符号化するための親区間に関連するオフセット量と継承角度とに基づいて角度φ_left,dとφ_right,dとを決定する。本開示に開示された方位コーディングモードは、圧縮効率を向上させるとともに合理的な複雑性を維持するために、点群を符号化／復号化する方法に使用することができる。

図８は少なくとも１つの例示的な実施例に係る方位コーディング方向がｘ軸に沿う場合に方位コーディングモードを使用して点のｘ座標を符号化する方法２００のステップを示すブロック図である。

方法２００は、図１の方法１００の改良である。占有ツリーの現在の（リーフ）ノードから例示的な点Ｐを選択する（ステップ１０１）。選択された方位コーディング方向に沿う点位置はビットｂ_dで表され、各ビットはｘ軸に沿うｘ区間におけるｘ_Pの位置を表す。以下では、選択された方位コーディング方向はｘ軸に沿うが、方位コーディング方向がｙ軸に沿う場合、ｘ座標、ｘ軸をそれぞれｙ座標、ｙ軸に置き換え、逆方向にすることで等価方法２００を導出することができる。別の点座標（ここではｙ_P）は、逆方向（ここではｙ軸）に沿ってコーディングされる（ステップ１０２）。点Ｐの方位予測角φ_predを決定する（ステップ１０３）。ｘ軸に沿うｘ区間は初期化される（ステップ１０４）。

ステップ２０１において、現在のノードの角度φ_nodeを取得する。この角度φ_nodeはすでに既知で、メモリから取得されるか、または次の式で計算されることができる：

ここで、ｎｏｄｅｐｏｓ＿ｘはＩＤＣＭの所定のパラメータである。例えば、パラメータｎｏｄｅｐｏｓ＿ｘは、現在のノードに関連する立方体に関連する最低ｘ座標値であってもよい。そしてφ_node角度を親区間の下限に関連付ける。

ステップ２０２において、親区間を左半区間と右半区間との２つの半区間に分割する。親区間はステップ１０４において初期化されたｘ区間であるか、または先行ビットｂｄ_-1を符号化するためのｘ区間である。

ステップ２０３において、親区間に関連する少なくとも１つの継承角度の中から、左半区間に関連する左角φ_left,dと右半区間に関連する右角φ_right,dとを補間する。

ステップ１０６において、予測角度φ_predと２つの角度φ_left,d及びφ_right,dとに基づいてコンテキストを選択する。

ステップ１０７において、選択されたコンテキストを使用することにより、ｘ_Pのための最上位残りのビットｂ_dをビットストリームＢにコンテキスト自己適応バイナリエントロピー符号化する。このビットはｘ_Pが左半区間（ｂ_d＝０）または右半区間（ｂ_d＝１）に位置することを指示する。

例示的な実施例によれば、コンテキスト自己適応バイナリエントロピー符号化はコンテキスト自己適応バイナリ算術コーディング（ＣＡＢＡＣ）である。

ステップ１０８において、親区間をｘ_Pが属する半区間（符号化ビットが示すように）に更新する。符号化ビットｂ_dが０に等しい場合、ｘ_Pが左半区間に位置することを指示し、親区間を左半区間に更新する。符号化ビットｂ_dが１に等しい場合、ｘ_Pが右半区間に位置することを指示し、親区間を右半区間に更新する。

次に、この方法はｘＰ符号化が完了したか否かを確認する。

ｘ_P符号化が完了すると、ステップ１０９において、残りの座標ｚ_PをビットストリームＢに符号化する。

ｘ_P符号化が完了していない場合、ステップ２０２に繰り返して、ｘ_Pを表す次のビットｂ_d+1を符号化する。

ステップ２０３の例示的な実施例によれば、第１の角度（φ_1,d）と、第２の角度（φ_2,d）と第３の角度（φ_3,d）との重み付け差とを加算することにより、左角φ_left,dを補間し、第４の角度（φ_4,d）と、第５の角度（φ_5,d）と第６の角度（φ_6,d）との重み付け差とを加算することにより、右角φ_right,dを補間する。

この補間は次式で与えられることができる：

ここで、ｓｉｚｅ_dは、角度φ_2,dとφ_3,d（φ_5,dとφ_6,d）によって定義される区間の寸法を指示し、Ｏｆｆ_leftとＯｆｆ_rightはこの方法のパラメータであり、角度φ_1,d、φ_2,d、φ_3,d、φ_4,d、φ_5,d、φ_6,dのうちの少なくとも１つは先行ビットｂ_d-1（先行反復、深さｄ－１で）を符号化するための親区間に関連する継承角度である。深さｄで使用されるビットｂ_dを符号化するためのｘ区間は親区間に含まれる。

角度φ_left,dとφ_right,dは、左半区間と右半区間の中間を系統的に指しない可能性がある。パラメータＯｆｆ_leftとＯｆｆ_rightの値を自由に設定することにより、角度φ_left,dとφ_right,dの選択に柔軟性を提供する。

図９に示されるステップ２０３の例示的な実施例によれば、式（２）の角度φ_1,d、φ_2,d、φ_3,d、φ_4,d、φ_5,d、φ_6,dはいずれも親区間に関連する継承角度であり、φ_1,d＝φ_3,d＝φ_6,d＝φ_1,d-1、φ_2,d=φ_4,d＝φ_5,d＝φ_middle,d-1である。その後に以下の式で角度φ_left,dとφ_right,dとを補間する。

ここで、角度φ_1,d-1とφ_middle,d-1は親区間に関連する継承角度である。

１番目のビットｂ_d=1を符号化する（１回目の反復）ために、継承角度φ_1,d-1はステップ２０１から取得された角度φ_nodeであり、且つ継承角度φ_middle,d-1は初期ｘ区間の中点に関連付けられる（ステップ１０４）。

後続のビットｂ_dを符号化する（後続の反復）ために、継承角度φ_1,d-1及びφ_middle,d-1は親区間に関連付けられる。図９の破線は継承チェーンを示す。

各深さに対して、アークタンジェント関数を実行することで角度φ_middle,dを計算することができる。

１番目のビットｂ_d=1を符号化する（１回目の反復）ために、親角度φ_middle,0は以下の式で計算される：

ここで、ｓ’₀＝ｓ₀／２であり、初期ｘ区間の寸法ｓ₀の半分の寸法であり（ステ
ップ１０４）、且つｘ_lbは初期ｘ区間の下限の値である（ステップ１０４）。

後続のビットｂ_dを符号化する（後続の反復）ために、アークタンジェント関数を実行することで親角度φ_middle,d-1を計算する：

ここで、ｓ’_d-1＝ｓ_d-1／２であり、親区間の寸法ｓ_d-1の半分であり、且つｘ
_lbは親区間の下限の値である。

この例示的な実施例は、各ビットｂ_dを符号化するために単一のアークタンジェント関数を実行することを要求する（式４または５）。したがって、従来技術と同じ数のアークタンジェント関数を実行しながら、高い符号化性能と角度φ_left,d及びφ_right,dの選択の柔軟性とを維持することができるため、利点を提供する。

図１０に示されるステップ２０３の別の例示的な実施例によれば、式（２）の角度φ_1,d、φ_2,d、φ_3,d、φ_4,d、φ_5,d、φ_6,dはいずれも親区間に関連する継承角度であり、φ_1,d＝φ_3,d＝φ_5,d＝φ_1,d-1、φ_2,d＝φ_4,d＝φ_6,d＝φ_top,d-1である。角度φ_left,dとφ_right,dは以下の式で補間される：

ここで、角度φ_1,d-1とφ_top,d-1は親区間に関連する継承角度である。

１番目のビットｂ_d=1を符号化する（１回目の反復）ために、継承角度φ_1,d-1はステップ２０１から取得された角度φ_nodeであり、継承角度φ_top,d-1は初期ｘ区間の上限に関連する角度である。

後続のビットｂｄを符号化する（後続の反復）ために、継承角度φ_1,d-1及びφ_top,d-1は親区間に関連付けられる。図１０の破線は継承チェーンを示す。

所与の深さｄにおいて、左半区間の上限に関連する角度φ_top,dまたは右半区間の下限に関連する角度φ_low,dは、アークタンジェント関数を実行することによって計算される。

１番目のビットｂ_d=1（１回目の反復））を符号化するために、角度φ_top,0は次式によって計算される：

ここでｓ₀は初期ｘ区間の寸法であり（ステップ１０４）、且つ、ｘ_lbは初期ｘ区間の下限の値である（ステップ１０４）。

ｂ_d-1＝０の場合、左半区間は次の深さｄ（次回の反復）のための親区間であり、角度φ_top,dはアークタンジェント関数を実行することによって計算される。

後続のビットｂ_dを符号化する（後続の反復）ために、アークタンジェント関数を実行することで角度φ_top,d-1を計算する：

ここで、ｓ_d-1は深さｄ－１におけるｘ区間の寸法であり、ｘ_lbは深さｄ－１におけるｘ区間の下限の値である。

ｂ_d-1＝１の場合、右半区間は次の深さｄのための親区間であり、アークタンジェント関数を実行することで角度φ_low,dを計算する。

後続のビットｂ_dを符号化する（後続の反復）ために、角度は次式φ_low,d-1によって計算される：

ここでは、ｓ_d-1は深さｄ－１におけるｘ区間の寸法であり、且つ、ｘ_lbは深さｄ－１におけるｘ区間の下限の値である。

この例示的な実施例は、各ビットｂ_dを符号化するために、単一のアークタンジェント関数を実行する必要がある（式７～１０）。したがって、従来技術と同じ数のアークタンジェント関数を実行しながら、高い符号化性能と、角度φ_left,d及びφ_right,dの選択の柔軟性とを維持することができるため、利点を提供する。

図１１に示される図１０の実施例の第１の変形例では、角度φ_top,dまたは角度φ_low,dは、親区間の中点に関連する継承角度φ_middle,d-1に等しい。

この第１の変形例は、アークタンジェント関数を呼び出さずにφ_middle,d-1が決定されたと仮定して、各ビットｂｄを符号化するためにアークタンジェント関数を実行する必要がないため、より低い複雑性を提供する。また、高い符号化性能と角度φ_left,dとφ_right,dの選択の柔軟性を維持する。

図１０の例示的な実施例の第２の変形例では、１番目のビットｂ_d=1を符号化するために、式７または９によって角度φ_top,dまたは角度φ_low,dを計算し、後続のビットｂｄを符号化するために、角度φ_top,dまたは角度φ_low,dは親区間の中点に関連する継承角度φ_middle,d-1に等しい。

この変形例は、一連のビットを符号化するために２回のアークタンジェント関数を実行する必要があり、これによって方法の複雑さが低減し、方位コーディングモードを実現するための計算リソースが低減しながら、高い符号化性能（高い補間精度）及び角度φ_left,dとφ_right,dの選択の柔軟性を維持する。

前記第１または第２の変形例の変形例では、継承角度φ_middle,d-1は、親区間に関連する２つの継承角度φ_1,d-1とφ_top,d-1を補間することによって取得される：

ここで、角度φ_1,d-1とφ_top,d-1は、図９、図１０及び図１１と併せて説明したように、親区間に関連する継承角度である。

この変形例は、アークタンジェント関数を再帰的に呼び出して一連のビットの符号化を実行する必要がなく、方法の複雑さが低減し、これによって方位コーディングモードを実現するための計算リソースが低減しながら、高い符号化性能及びφ_left,dとφ_right,dの選択の柔軟性を維持する。

前記第１または第２の変形例の別の変形例では、親区間の寸法が決定された閾値より大きい場合、アークタンジェント関数（式４または５）を実行することによって継承角度φ_middle,d-1を取得し、親区間の寸法が決定された値より低い場合、式（１１）によって２つの継承角度φ_1,d-1とφ_top,d-1から継承角度φ_middle,d-1を補間する。

この変形例は重要なサイズを有するノードに高精度を維持し、これらのノードに対して、式（１１）の補間はあまりにも不正確な結果を提供し、そのため圧縮性能を損なう。

代替的に、角度φ_1,d-1とφ_top,d-1との差の絶対値が決定された閾値より大きい場合、アークタンジェント関数（式４または５）を実行することによって継承角度φ_middle,d-1を取得し、そうでない場、式（１１）によって２つの継承角度φ_1,d-1とφ_top,d-1から継承角度φ_middle,d-1を補間する。

この変形例は、補間精度を維持するため、圧縮性能を維持し、区間寸法が十分に小さくなるとφ_middle,d-1の補間が行われるため、より低い複雑さを確保し、これによって有利である。

ステップ２０３の例示的な実施例によれば、パラメータＯｆｆ_leftは左半区間の中心の平均位置ｏｆｆｓｅｔ_left,midとオフセット量Ｏｆｆｓｅｔ２との差と定義され、パラメータＯｆｆ_rightは右半区間の中心の平均位置ｆｆｓｅｔ_right,midとオフセット量Ｏｆｆｓｅｔ２との和と定義される：

良好なコンテキスト選択を取得するための基本的な考え方は、それぞれの半区間の中心を指すことに近い角度φ_left,dとφ_right,dとを取得することである。しかし、角度φ_left,dとφ_right,dとがその半区間の中心を正確に指す場合、最適な圧縮性能が取得されることがすでに観察された。

例えば、左半区間における点の位置は離散的であるため、この左半区間の中間は簡単（φ_middle,d-1－φ_1,d-1）／２ではない。代わりに、左半区間の中間は、図１２に示されるように、左半区間に属するすべての潜在的な点の平均位置と定義される。

長さがｓ’_dである半区間を考えると、潜在的な点は左半区間の下限の位置０、１、
…、ｓ’_d－１に位置する。次に、左半区間の中心の平均位置ｏｆｆｓｅｔ_right、
_midは次式によって与えられる：

現在、算術級数式を用いて、以下の式が得られる：

より良い圧縮効率を実現するために、第２のオフセット量ｏｆｆｓｅｔ２が左半区間の中心の平均位置とされる細分化されたｏｆｆｓｅｔ_left,midを導入することは、コンテキストをより効果的に選択し、小さな追加の圧縮メリットを取得することをもたらすことがすでに観察された。第２のオフセット量ｏｆｆｓｅｔ２の基本的な効果は、左角φ_left,dを左半区間の下限に少しプッシュし、右角φ_right,dを右半区間の上限に少しプッシュすることである。

右半区間に関連するパラメータＯｆｆ_rightの推論は同様である。

ｏｆｆｓｅｔ２の例示的な値はｏｆｆｓｅｔ２＝２である。また、ｏｆｆｓｅｔ２は取决于深さｄに依存してもよく、最後の深さ（すなわち、最後のビットｂｄを符号化するために使用される）に対してｏｆｆｓｅｔ２は２に等しくてもよく、最後から２番目の深さに対してｏｆｆｓｅｔ２は１に等しくてもよく、他の深さに対してｏｆｆｓｅｔ２は０に等しくてもよい。

方法２００と３００において、いくつかの除算演算が実行される。例えば、

これらの除算は実際の実施形態では問題がある可能性があるが、実際には、特に現在のＧ＿ＰＣＣＴＭＣ１３ソフトウェアのフレームワークにおいて、それらをシフト＞＞演算で置き換えることができる。この置き換えは、ノードの寸法が２のべき乗であるため、区間の長さも２のべき乗であるため、実行可能である。

式（２）は以下になる：

ここで、Ｌｄは区間の長さｓ_dのｌｏｇ２であり、Ｌ_dは次式によって再帰的に取得されることができる：

値２Ｏｆｆ_leftは次の式によって計算される：

図１３は少なくとも１つの例示的な実施例に係る方位コーディング方向がｘ軸に沿う場合に方位コーディングモードを使用して点のｘ座標を復号化する方法３００のステップを示すブロック図である。

以下、選択された方位コーディング方向はｘ軸に沿っているが、方位コーディング方向がｙ軸に沿う場合、それぞれｙ座標とｙ軸とでｘ座標とｘ軸とを置き換え、逆方向にすることで等価な方法３００を導出することができる。

方位コーディング方向は、ＩＤＣＭが適用されている現在の（リーフ）ノードを表すｘとｙ座標（ｘ_node，ｙ_node）から決定される。代替的に、ビットストリームＢから方位コーディング方向を復号化することができる。

ステップ３０１において、逆方向（ここではｙ軸）に沿ってビットストリームＢから点座標（ここではｙ_P）を復号化する。

ステップ１０３において、点Ｐの方位予測角φ_predを決定する。ｘ軸に沿うｘ区間が初期化される（ステップ１０４）。（最も近い）復号化された点の方位角φ_alを用いて、デコーダによって基本方位角オフセットの倍数ｎを決定する。代替的に、ビットストリームＢから倍数ｎを復号化する。

ステップ２０１において、現在のノードの角度φ_nodeを式（１）によって取得する。座標ｙ_Pはすでにビットストリームから復号化され、ｎｏｄｅｐｏｓ＿ｘはＩＤＣＭの既知のパラメータである。

ステップ２０２において、親区間を左半区間と右半区間との２つの半区間に分割する。親区間は、ステップ１０４で初期化されたｘ区間、または先行ビットｂｄ_-1を復号化するためのｘ区間である。

ステップ２０３において、親区間に関連する少なくとも１つの継承角度から、左半区間に関連する左角φ_left,dと右半区間に関連する右角φ_right,dとを補間する。

テップ３０２において、選択されたコンテキストを用いてｘ_Pの最上位ビット残りのｂ_dをコンテキスト自己適応バイナリエントロピー復号化する。このビットは、ｘ_Pが左半区間（ｂ_d＝０）または右半区間（ｂ_d＝１）に位置することを指示する。

例示的な実施例によれば、コンテキスト自己適応バイナリエントロピー復号化はコンテキスト自己適応バイナリ算術コーディング（ＣＡＢＡＣ）である。

ステップ１０８において、親区間をｘ_Pが属する半区間（復号化ビットが指示するように）に更新する。

次に、この方法は座標ｘ_Pの復号化が完了したか否かを確認する。

ｘ_Pの復号化が完了すると、ステップ３０３において、ビットストリームＢから残りの座標ｚ_Pを復号化する。

ｘ_Pの復号化が完了していない場合、ステップ２０２に繰り返して、ｘ_Pの次のビットｂ_d+1を復号化する。

方法２００の例示的な実施例と変形例は、方法３００に適用される。

本符号化／復号方法は点群を符号化／復号化するために使用されることができ、特に、複数の目的のために使用され、特に点群の点の座標を符号化／復号化するために使用されることができ、これにより、合理的な複雑さを維持しながら圧縮効率を向上させる。

図１４は各態様及び例示的な実施例のシステムを実現する概略ブロック図を示す。

システム４００は１つ又は複数のデバイスとして組み込まれてもよく、以下に説明される様々なコンポーネントを含む。様々な実施例では、システム４００は、本出願で説明される１つ又は複数の態様を実現するように構成されてもよい。

システム４００のすべて又は一部の装置を構成できる例は、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレット、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電製品、コネクテッドカーとその関連処理システム、ヘッドマウントディスプレイ（ＨＭＤ、透視メガネ）、プロジェクタ（投影機）、「洞窟」（複数のディスプレイを含むシステム）、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力を処理するポストプロセッサ、ビデオエンコーダに入力を提供するプリプロセッサ、ｗｅｂサーバ、セットトップボックス、及び点群、ビデオ又は画像を処理するため他の任意のデバイス、又は他の通信デバイスを含む。システム４００の素子は単一の集積回路（ＩＣ）、複数のＩＣ及び／又はディスクリートコンポーネントに単独でまたは組み合わせて実装することができる。例えば、少なくとも１つの実施例では、システム４００の処理及びエンコーダ／デコーダ素子は複数のＩＣ及び／又はディスクリートコンポーネントにわたって分布することができる。様々な実施例では、システム４００は例えば通信バス又は専用の入力及び／又は出力ポートを介して、他の類似するシステム又は他の電子機器に通信可能に結合することができる。

システム４００は、少なくとも１つのプロセッサ４１０を含み、該少なくとも１つのプロセッサ４１０はそれにロードされる命令を実行することで、例えば本出願で説明される各態様を実現するように構成される。プロセッサ４１０は組み込みメモリ、入力出力インターフェース及び当分野で周知の他の様々な回路を含むことができる。システム４００は少なくとも１つのメモリ４２０（例えば、揮発性メモリデバイス及び／又は非揮発性メモリデバイス）を含むことができる。システム４００は、非揮発性メモリ及び／又は揮発性メモリを含むストレージデバイス４４０を含むことができ、電気的消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）、読み取り専用メモリ（ＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、動的ランダムアクセスメモリ（ＤＲＡＭ）、静的ランダムアクセスメモリ（ＳＲＡＭ）、フラッシュメモリ、磁気ディスクドライブ及び／又は光ディスクドライブを含むが、これらに限らない。非限定的な例として、ストレージデバイス４４０は内部ストレージデバイス、追加ストレージデバイス及び／又はネットワークアクセス可能なストレージデバイスを含むことができる。

システム４００は、例えばデータを処理することで符号化／復号化された点群ジオメトリ形状データを提供するように構成されるエンコーダ／デコーダモジュール４３０を含みことができ、そしてエンコーダ／デコーダモジュール４３０は自身のプロセッサとメモリを含むことができる。エンコーダ／デコーダモジュール４３０は、符号化及び／又は復号化機能を実行するようにデバイスに含まれる（１つ又は複数の）モジュールを表すことができる。周知のように、デバイスは符号化及び復号化モジュールのいずれか１つ又は両方を含むことができる。また、エンコーダ／デコーダモジュール４３０はシステム４００の分離した素子として実現することができ、又は当業者に知られているハードウェアとソフトウェアの組み合せとしてプロセッサ４１０内に結合することができる。

本出願で説明される各態様を実行するようにプロセッサ４１０又はエンコーダ／デコーダ４３０にロードされるプログラムコードはストレージデバイス４４０に記憶することができ、そしてその後にメモリ４２０にロードされてプロセッサ４１０によって実行される。様々な実施例によると、本出願で説明されるプロセスを実行する間、プロセッサ４１０、メモリ４２０、ストレージデバイス４４０及びエンコーダ／デコーダモジュール４３０のうちの１つ又は複数は、各項目のうちの１つ又は複数を記憶することができる。このように記憶される項目は、点群フレーム、符号化／復号化されたジオメトリ形状／属性ビデオ／画像又は符号化／復号化されたジオメトリ形状／属性ビデオ／画像の一部、ビットストリーム、行列、変量、及び式、公式、演算や演算の中間又は最終結果ロジックを含むが、これらに限らない。

いくつかの実施例では、プロセッサ４１０及び／又はエンコーダ／デコーダモジュール４３０内部のメモリは、命令を記憶し且つ符号化又は復号化の間に実行される処理のためにワーキングメモリを提供するために使用することができる。

しかし、他の実施例では、処理デバイス外部のメモリ（例えば、処理デバイスはプロセッサ４１０又はエンコーダ／デコーダモジュール４３０であってもよい）はこれらの機能のうちの１つ又は複数に用いられる。外部メモリはメモリ４２０及び／又はストレージデバイス４４０、例えば、動的揮発性メモリ及び／又は不揮発性フラッシュメモリであってもよい。いくつかの実施例では、外部不揮発性フラッシュメモリは、例えばテレビの操作システムを記憶するために使用される。少なくとも１つの実施例において、ＲＡＭのような快速外部動的揮発性メモリは、ビデオ符号化復号化及び復号化操作のワーキングメモリとして利用することができ、例えば、ＭＰＥＧ－２第２部分（ＩＴＵ－ＴＲｅｃｏｍｍｅｎｄａｔｉｏｎＨ．２６２及びＩＳＯ／ＩＥＣ１３８１８－２とも呼ばれ、ＭＰＥＧ－２ビデオとも呼ばれる）、ＨＥＶＣ（高効率ビデオ符号化復号化）、ＶＶＣ（汎用ビデオ符号化復号化）又はＭＰＥＧ－Ｉ第５部分又は第９部分を対象とする。

ブロック４９０に示すように、様々な入力デバイスを介してシステム４００の素子へ入力を提供することができる。このような入力デバイスは、（ｉ）放送局などで無線送信されたＲＦ信号を受信できるＲＦ部、（ｉｉ）複合入力端子、（ｉｉｉ）ＵＳＢ入力端子、及び／又は（ｉｖ）ＨＤＭＩ入力端子を含むが、これらに限らない。

様々な実施例において、ブロック４９０の入力デバイスは、当分野で周知のように、関連し且つ対応する入力処理素子を有する。例えば、ＲＦ部分は以下の必要とされる素子を関連付けることができる。（ｉ）所望の周波数（信号選択とも呼ばれ、又は信号を周波数帯域内に制限する）を選択すること、（ｉｉ）選択される信号をダウンコンバートすること、（ｉｉｉ）周波数帯域を再び狭い周波数帯域に制御することで、（例えば）いくつかの実施例でチャネルと呼ばれる信号周波数帯域を選択すること、（ｉｖ）ダウンコンバートされた信号と周波数帯域が制限された信号を復調すること、（ｖ）誤り訂正を実行すること、及び（ｖｉ）逆多重化をして所望のデータパケットフローを選択すること。様々な実施例のＲＦ部分はわざとこれらの機能を実行する素子、例えば、周波数セレクタ、信号セレクタ、周波数帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調装置、誤り訂正装置及びデマルチプレクサを含む。ＲＦ部分は、これらの各機能（例えば、受信した信号をより低い周波数（例えば、中間周波数又はベースバンド付近の周波数）又はベースバンドにダウンコンバートすることを含む）を実行するチューナーを含むことができる。

１つのセットトップボックスの実施例では、ＲＦ部分及びその関連する入力処理素子は有線（例えば、ケーブル）媒体において伝送されるＲＦ信号を受信することができる。その後、ＲＦ部分はフィルタリング、ダウンコンバート及び再フィルタリングにより所望の周波数帯域を得て周波数選択を実行することができる。

様々な実施例では、上記（及び他の）素子の順序を設定し、これらの素子のうちの一部を削除し、及び／又は類似又は異なる機能を実行する他の素子を追加する。

素子の追加は、既存の素子の間に、増幅器やアナログデジタルコンバータのような素子を挿入することを含むことができる。様々な実施例において、ＲＦ部分はアンテナを含む。

また、ＵＳＢ及び／又はＨＤＭＩ端子は、対応するインターフェースプロセッサを含むことができ、ＵＳＢ及び／又はＨＤＭＩ接続によりシステム４００を他の電子機器に接続するために使用される。なお、必要な時に、入力処理の各態様（例えば、Ｒｅｅｄ－Ｓｏｌｏｍｏｎ誤り訂正）は、例えば、分離した入力処理ＩＣ内又はプロセッサ４１０内で実現することができる。このように、必要な時に、分離したインターフェースＩＣ内又はプロセッサ４１０内でＵＳＢ又はＨＤＭＩインターフェース処理の各態様を実現することができることを理解されたい。復調により、誤り訂正と逆多重化のストリームは、プロセッサ４１０、及びメモリと記憶素子に組み合わせて操作するエンコーダ／デコーダ４３０などを含む様々な処理素子に提供することができることにより、必要な時にデータストリームを処理して出力デバイスに表示する。

一体型ハウジング内でシステム４００の様々な素子を提供することができる。一体型ハウジング内において、適切な接続レイアウト４９０、例えば、当分野で周知の内部バス（Ｉ２Ｃバスを含む）、配線及びプリント回路基板を用いて各素子を互いに接続しかつそれらの間でデータを伝送することができる。

システム４００は通信インターフェース４５０を含むことができるので、通信チャネル５００を介して他のデバイスと通信することができる。通信インターフェース４５０は、通信チャネル５００においてデータを送受信するように構成される送受信機を含むが、これに限らない。通信インターフェース４５０は、モデム又はネットワークカードを含むが、これに限らず、通信チャネル５００は例えば有線及び／又は無線媒体内で実現することができる。

様々な実施例において、ＩＥＥＥ８０２．１１のようなＷｉ－Ｆｉネットワークを用いてデータストリームをシステム４００に伝送することができる。これらの実施例のＷｉ－Ｆｉ信号は、Ｗｉ－Ｆｉ通信に適する通信チャネル５００及び通信インターフェース４５０により受信可能である。これらの実施例の通信チャネル５００は、一般に、ストリーミングアプリケーションおよび他のクラウド上（Ｏｖｅｒ－ｔｈｅ－ｔｏｐ）通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続することができる。

他の実施例はセットトップボックスを用いてシステム４００にストリーミングデータを提供することができ、該セットトップボックスは入力ブロック４９０のＨＤＭＩ接続によりデータを搬送する。

入力ブロック４９０のＲＦ接続を用いてストリーミングデータをシステム４００に提供する実施例は他にもある。

ストリーミングデータは、システム３００が用いるシグナリング情報の方式として使用することができる。シグナリング情報は、点群の点の数、点座標が２つの半区間のどちらに属するかを指示する符号化ビット（ｂ_d）、方位コーディング方向、点座標、基本方位シフト方位角の倍数ｎ、基本方位シフト方位角、パラメータｎｏｄｅｐｏｓ＿ｘなどのビットストリームＢおよび／または情報を含むことができる。

なお、様々な方式でシグナリングを実現できる。例えば、様々な実施例において、１つ又は複数の構文要素、フラグなどは、対応するデコーダに信号通知情報を送信するために使用することができる。

システム４００は、ディスプレイ６００、スピーカ７００及び他の周辺機器８００を含む様々な出力デバイスに出力信号を提供することができる。実施例の様々な例において、他の周辺機器８００は独立したＤＶＲ、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム４００の出力に基づいて機能を提供する他のデバイスのうちの１つ又は複数を含むことができる。

様々な実施例において、制御信号はＡＶ．Ｌｉｎｋ（オーディオ／ビデオリンク）、ＣＥＣ（家電制御）又はデバイスからデバイスへの制御を有効にする他の通信プロトコルのシグナリングを用いてシステム４００とディスプレイ６００、スピーカ７００又は他の周辺機器８００との間で通信することができ、ユーザがあってもなくてもよい。

出力デバイスは、対応するインターフェース４６０、４７０及び４８０により、専用接続経由で通信可能にシステム４００に接続することができる。

代替的に、通信インターフェース４５０経由で通信チャネル５００を用いて出力デバイスをシステム４００に接続することができる。ディスプレイ６００とスピーカ７００は電子機器（例えばテレビ）のシステム４００の他のコンポーネントとともに単一ユニットに統合することができる。

様々な実施例において、表示インターフェース４６０は、タイミングコントローラ（ＴＣｏｎ）チップのようなディスプレイドライバを含むことができる。

例えば、入力端４９０のＲＦ部分が、分離したセットトップボックスの一部である場合、ディスプレイ６００とスピーカ７００は代替可能に他のコンポーネントのうちの１つ又は複数と分離する。ディスプレイ４００とスピーカ７００が外部コンポーネントであってもよい様々な実施例では、専用の出力接続（例えばＨＤＭＩポート、ＵＳＢポート又はＣＯＭＰ出力端子を含む）経由で出力信号を提供することができる。

図１－１４では、様々な方法が説明され、各方法は、説明される方法を実現するように、１つ又は複数のステップ又は動作を含む。方法の正確な操作には特定のステップ又は動作順序が必要である場合でない限り、特定のステップ及び／又は動作の順序及び／又は使用を修正したり、組み合わせたりすることができる。

ブロック図及び／又は操作フローチャートについていくつかの例が説明されたが、各ブロックは、回路素子、モジュール、或いは（１つ又は複数の）指定ロジック機能を実現するための１つ又は複数の実行可能な命令のコードを含む部分を表す。なお、他の実施形態では、ブロックに示されている（１つ又は複数の）機能は、指示された順序に従って発生しなくてもよいことに留意されたい。例えば、関わる機能によると、次々と表示される２つのブロックは実際に、基本的に並列して実行されてもよいし、又は逆の順序でこれらのブロックを実行してもよい。

例えば方法又はプロセス、装置、コンピュータプログラム、データストリーム、ビットストリーム又は信号において本明細書で説明される実施形態と態様を実現することができる。単一形式の実施形態のコンテキストのみにおいて検討（例えば、方法のみとして検討する）しても、議論される特徴の実施形態は他の形式（例えば、装置又はコンピュータプログラム）で実現することができる。

方法は例えばプロセッサにおいて実現することができ、プロセッサは通常、例えばコンピュータ、マイクロプロセッサ、集積回路又はプログラム可能なロジックデバイスなどを含む処理デバイスを指す。プロセッサは通信デバイスをさらに含む。

また、方法は、プロセッサにより実行される命令で実現することができ、そして、このような命令（及び／又は実施形態により生成されたデータ値）はコンピュータ読み取り可能な記憶媒体に記憶することができる。コンピュータ読み取り可能な記憶媒体は、１つ又は複数のコンピュータ読み取り可能な媒体において実施され、かつそれにそれにおいて実施された、コンピュータにより実行可能なコンピュータ読み取り可能なプログラムコードを有するコンピュータ読み取り可能なプログラム製品の形式を用いることができる。それに情報を記憶する固有の能力及びそれにより提供される情報から検索する固有の能力を考慮すると、本明細書で使用されるコンピュータ読み取り可能な記憶媒体は、非一時的な記憶媒体として見なすことができる。コンピュータ読み取り可能な記憶媒体は、電子、磁気、光学、電磁、赤外線又は半導体システム、装置又はデバイス、又は前述したものの任意の適切な組み合せであってもよいが、これらに限らない。なお、以下は、本実施例を適用できるコンピュータ読み取り可能な記憶媒体のより更具的な例を提供したが、当業者ｄであれば容易に認識できるように、それらは網羅的なリストではなく例示的なものに過ぎないことを理解されたい：ポータブルコンピュータフロッピーディスク、ハードディスク、読み取り専用メモリ（ＲＯＭ）、消去可能なプログラム可能な読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、コンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光学ストレージデバイス、磁気ストレージデバイス、又は前述したものの任意の適切な組み合せ。

命令は、プロセッサ読み取り可能な媒体に有形に実施されるアプリケーションを生成することができる。

例えば、命令はハードウェア、ファームウェア、ソフトウェア又はその組み合せに存在することができる。例えば、操作システム、独立したアプリケーション、又は両者の組み合せにおいて命令を見つけることができる。したがって、プロセッサは、例えばプロセスを実行するように構成されるデバイスやプロセスを実行するための命令を有するプロセッサ読み取り可能な媒体（例えばストレージデバイス）を含むデバイスとして特徴付けることができる。また、命令に加え又は命令の代わりに、プロセッサ読み取り可能な媒体可は、実施形態により生成したデータ値を記憶することができる。

装置は例えば適切なハードウェア、ソフトウェア及びファームウェアにおいて実現することができる。このような装置の例はパーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレット、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、コネクテッド家電製品、ヘッドマウントディスプレイ（ＨＭＤ、透視メガネ）、プロジェクタ（投影機）、「洞窟」（複数のディスプレイを含むシステム）、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力を処理するポストプロセッサ、ビデオエンコーダに入力を提供するプリプロセッサ、ｗｅｂサーバ、セットトップボックス、及び処理点群、ビデオ又は画像を処理するための他の任意のデバイス、又は他の通信デバイスを含む。なお、装置は移動可能であり、移動中の車両に取り付けることもできる。

コンピュータソフトウェアは、プロセッサ４１０、ハードウェア、又はハードウェアとソフトウェアとの組み合せで実現することができる。非限定的な例として、１つ又は複数の集積回路で実施例を実現することができる。メモリ４２０は、技術環境に自己適応する任意のタイプであってもよく、任意の適切なデータ記憶技術（非限定的な例として、例えば光学メモリデバイス、磁気メモリデバイス、半導体に基づくメモリデバイス、固定メモリ及び移動可能なメモリ）で実現することができる。非限定的な例として、プロセッサ４１０は技術環境に適合する任意のタイプであってもよく、マイクロプロセッサ、汎用コンピュータ、専用のコンピュータ及びマルチコアアーキテクチャに基づくプロセッサのうちの１つ又は複数をカバーすることができる。

当業者にとって明らかなように、実施形態は、例えば記憶可能又は伝送可能な情報を運搬するように定形化される様々な信号を生成することができる。情報は、例えば方法を実行するための命令又は説明される実施形態の１つにより生成されたデータを含むことができる。例えば、信号は、説明される実施例のビットストリームを搬送するように定形化されてもよい。この信号は、例えば電磁波（例えば、周波数スペクトルを用いる無線周波数部分）又はベースバンド信号に定形化されてもよい。定形化は、例えばデータストリームに対して符号化し、かつ符号化されたデータストリームを用いて搬送波を変調することを含むことができる。信号により搬送される情報は、例えばアナログ又はデジタル情報であってもよい。周知のように、信号は異なる有線又は無線リンクで伝送することができる。信号はプロセッサ読み取り可能な媒体に記憶することができる。

本明細書で使用される用語は、特定の実施例を説明することのみに使用され、限定するためのものではない。コンテキストに明確な指示がない限り、本明細書で使用される単数形の「１つ」、「１種」及び「該」は複数形をも含む。さらに、本明細書で使用される場合、「含む／包含（ｉｎｃｌｕｄｅ／ｃｏｍｐｒｉｓｅ）」及び／又は「含む／包含（ｉｎｃｌｕｄｉｎｇ／ｃｏｍｐｒｉｓｉｎｇ）」という用語は、説明される特徴、整数、ステップ、操作、要素及び／又はコンポーネントなどの存在を指示することができるが、１つ又は複数の他の特徴、整数、ステップ、操作、要素、コンポーネント及び／又はこれらの組み合せの存在又は追加を排除しない。また、１つの要素がもう１つの要素に「応答」又は「接続」すると呼ばれる時、もう１つの要素に直接応答又は接続してもよいし、中間要素が存在してもよい。逆に、１つの要素がもう１つの要素に「直接応答」又は「直接接続」すると呼ばれる時、中間要素が存在しない。

なお、例えば、「Ａ／Ｂ」、「Ａ及び／又はＢ」及び「ＡとＢのうちの少なくとも１つ」の場合、「／」、「及び／又は」及び「少なくとも１つ」という符号／用語のうちのいずれか１つの使用は、一番目に挙げられた選択肢（Ａ）の選択、又は二番目に挙げられた選択肢（Ｂ）の選択、又は２つの選択肢（ＡとＢ）の選択をカバーすることを意図している。更なる例として、「Ａ、Ｂ及び／又はＣ」及び「Ａ、Ｂ及びＣのうちの少なくとも１つ」の場合、このような言葉遣いは、一番目に挙げられた選択肢（Ａ）の選択のみ、又は二番目に挙げられた選択肢（Ｂ）の選択のみ、又は又は三番目に挙げられた選択肢（Ｃ）の選択のみ、又は一番目と二番目に挙げられた選択肢（ＡとＢ）の選択のみ、又は一番目と三番目に挙げられた選択肢（ＡとＣ）の選択、又は二番目と三番目に挙げられた選択肢（ＢとＣ）の選択のみ、又は３つの選択肢（ＡとＢとＣ）のすべての選択をカバーすることを意図している。当分野及び当業者には明らかなように、このようにして、挙げられた項目の数に拡張することができる。

本出願では様々な数値を用いることができる。特定値は例示的なものであり、そして説明される各態様はこれらの特定値に限らない。

なお、第１、第２などの用語は本明細書において様々な要素を説明することに用いることができるが、これらの要素がこれらの用語に限らない。これらの用語は、１つの要素をもう１つの要素と区別することだけに用いられる。例えば、本出願の教示から逸脱しない限り、第１要素は第２要素と呼ぶことができ、同様に、第２要素は第１要素と呼ぶこともできる。第１要素と第２要素との間は順序付けが暗黙的に示されていない。

「１つの例示的な実施例」又は「例示的な実施例」又は「一実施形態」又は「実施形態」及びその他の変化の引用は、頻繁に、特定の特徴、構造、特点等（実施例／実施形態に合わせて説明されるもの）が少なくとも１つの実施例／実施形態に含まれることを伝えるために使用される。したがって、本出願の各箇所に現れる用語の「１つの例示的な実施例において」又は「例示的な実施例において」又は「一実施形態において」又は「実施形態において」およびその他の任意の変化の出現は、必ずしも同じ実施例を指すとは限らない。

同様に、本明細書の「例示的な実施例／例／実施形態によると」又は「例示的な実施例／例／実施形態において」およびその他の変化の引用は、頻繁に、特定の特徴、構造又は特点（実施例／実施形態に合わせて説明されるもの）が少なくとも１つの例示的な実施例／例／実施形態に含まれ得ることを伝えることに使用される。したがって、明細書の各箇所に現れる「例示的な実施例／例／実施形態によると」又は「例示的な実施例／例／実施形態において」という表現は、必ずしも同じ例示的な実施例／例／実施形態を指すとは限らず、独立又は代替的な例示的な実施例／例／実施形態が必ず他の例示的な実施例／例／実施形態とは相互排他的であるとも限らない。

請求項に現れる図面の符号は説明だけに用いられ、かつ請求項の範囲を限定しない。明確な説明がないにもかかわらず、任意の組み合せ又は一部の組み合せにより本実施例／例および変形例を用いることができる。

図がフローチャートとして示される時、対応する装置のブロック図も提供されることを理解されたい。同様に、図がブロック図として示される時、対応する方法／プロセスのフローチャートも提供されることを理解されたい。

一部の図には、通信路径において通信の主な方向を示す矢印が含まれるが、通信が、説明される矢印と逆の方向に発生することもできることを理解されたい。

様々な実施形態は復号化に関連する。本出願で使用されるように、「復号化」は、例えば受信した点群フレーム（１つ又は複数の点群フレームを符号化して受信したビットストリームを含む可能性がある）を実行することにより、表示又は再構築された点群領域内の更なる処理に適合する最終出力を生成するプロセスの全部又は一部をカバーすることができる。様々な実施例において、このようなプロセスは、通常デコーダにより実行されるプロセスのうちの１つ又は複数を含む。様々な実施例において、例えば、このようなプロセスは、本出願で説明される様々な実施形態のデコーダにより実行されるプロセスを代替的に含むこともできる。

更なる例として、一実施例では、「復号化」は逆量子化のみを指すことができ、一実施例では、「復号化」はエントロピー復号化を指すことができ、もう１つの実施例において、「復号化」は差分復号化を指すことができ、もう１つの実施例において、「復号化」は逆量子化、エントロピー復号化および差分復号化の組み合せを指すことができる。具体的に説明されるコンテキストに基づいて、「復号化プロセス」という用語は、具体的には、操作のサブセットを指すか、それともより一般的な復号化プロセスを指すかが自明なことであり、当業者にとって理解しやすいものでもある。

様々な実施形態は符号化に関連する。以上の「復号化」に係る検討と同様に、本出願において使用される「符号化」は、例えば、入力点群フレームを実行することにより符号化のビットストリームを生成するプロセスの全部又は一部をカバーすることができる。様々な実施例において、この種類のプロセスは、通常エンコーダにより実行されるプロセスのうちの１つ又は複数を含む。様々な実施例において、このようなプロセスは、本出願で説明される各実施形態のエンコーダにより実行されるプロセスを代替的に含むこともできる。

更なる例として、１つの実施例において、「符号化」は量子化のみを指すことができ、１つの実施例において、「符号化」はエントロピー符号化のみを指すことができ、もう１つの実施例において、「符号化」は差分符号化のみを指すことができ、もう１つの実施例において、「符号化」は量子化、差分符号化およびエントロピー符号化の組み合せを指すことができる。特定の説明がなされているコンテキストに基づいて、「符号化プロセス」という用語は、操作のサブセットを専門に指すか、それともより一般的な符号化プロセスを指すかが自明なことであり、当業者にとって理解しやすいものでもある。

また、本出願は、様々な情報の「決定」について言及した。情報の決定は、情報の推定、情報の計算、情報の予測又はメモリから情報を検査することのうちの１つ又は複数を含むことができる。

また、本出願は、様々な情報への「アクセス」について言及した。情報へのアクセスは情報の受信、（例えば、メモリから）情報を検索すること、情報の記憶、情報の移動、情報のコピー、情報の計算、情報の決定、情報の予測又は情報の推定のうちの１つ又は複数を含むことができる。

また、本出願は様々な情報の「受信」について言及した。「アクセス」と同様に、受信というのは広義的な用語である。情報の受信は、例えば、情報へのアクセス又は情報の検索（例えば、メモリから）のうちの１つ又は複数を含むことができる。また、もう１つの方式として、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の削除、情報の計算、情報の決定、情報の予測又は情報の推定などの操作期間は、通常、「受信」に関連する。

それに、本明細書で使用されるように、「信号」という用語は、特に対応するデコーダが特定のことを指示するなどを指示する。例えば、ある実施形態では、エンコーダは、点群の点の数、点座標が２つの半区間のどちらに属するかを指示する符号化ビット（ｂ_d）、方位コーディング方向、点座標、基本方位シフト方位角の倍数ｎ、基本方位シフト方位角、パラメータｎｏｄｅｐｏｓ＿ｘなどの特定の情報を信号を送信することで通知する。この様式により、実施例において、エンコーダ側とデコーダ側において同じパラメータを用いることができる。したがって、例えば、エンコーダはデコーダに（明確なシグナリング）特定パラメータを送信することができ、これにより、デコーダは同じ特定パラメータを用いることができる。逆に、デコーダが特定のパラメータおよび他のパラメータを有している場合、伝送を必要としないシグナリング（間接的なシグナリング）を用いて、デコーダに知らせかつ特定パラメータを選択させることを容易にする。如何なる実際の機能の伝送を回避するために、様々な実施例においてビット節約を実現している。なお、様々な方式でシグナリングを完成できることを認識されたい。例えば、様々な実施例において、１つ又は複数の文法要素、フラグなどは、情報を対応するデコーダに送信するために使用される。上記は「信号」という単語の動詞の形に関連するが、「信号」という単語は本明細書において名詞として使用されても良い。

すでに複数の実施形態を説明したが、様々な修正を行っても良いことを理解されたい。例えば、異なる実施形態の要素を組み合せ、補充、修正又は削除することによって他の実施形態を生成することができる。また、当業者であれば理解できるように、他の構造とプロセスは、開示された構造とプロセスを代替でき、これにより生成された実施形態は基本的に同じである（１つ又は複数の）方式で、基本的に同じ（１つ又は複数の）である機能を実行することによって、少なくとも開示された実施形態と基本的に同じである（１つ又は複数の）結果を実現する。したがって、本出願では、これらの内容及び他の実施形態が構想される。

本出願の第５の態様によれば、コンピュータプログラムが提供され、プログラムが１つまたは複数のプロセッサによって実行される場合、１つまたは複数のプロセッサに、本出願の第１の態様に係る点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を実行させる。

本出願の第７の態様によれば、コンピュータプログラムを提供し、プログラムが１つまたは複数のプロセッサによって実行される場合、１つまたは複数のプロセッサに、本出願の第２の態様に係る物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を実行させる。

Claims

点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法であって、前記方法は、前記点群の点の座標を符号化するための一連のビットを提供する方位コーディングモードを含み、前記方法は、
－前記点の座標が属する親区間を左半区間と右半区間とに分割する（２０２）ステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と右半区間に関連する右角（φ_right,d）とを補間する（２０３）ステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択する（１０６）ステップと、
－選択されたコンテキストに基づいて、ビット（ｂ_d）を前記ビットストリームにコンテキスト自己適応バイナリエントロピー符号化する（１０７）ステップであって、前記符号化されたビット（ｂ_d）は、前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法。
物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法であって、前記方法は、前記点群の点の座標を復号化するための一連のビットを提供する方位コーディングモードを含み、前記方法は、
－前記点の座標が属する親区間を左半区間と右半区間とに分割する（２０２）ステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間する（２０３）ステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択する（１０６）ステップと、
－選択されたコンテキストに基づいて、前記ビットストリームからビット（ｂ_d）をコンテキスト自己適応バイナリエントロピー復号化する（３０２）ステップであって、前記復号化されたビット（ｂ_d）は、前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法。
第１の角度（φ_1,d）と、第２の角度（φ_2,d）と第３の角度（φ_3,d）との重み付け差とを加算することにより、前記左角（φ_left,d）を補間し、第４の角度（φ_4,d）と、第５の角度（φ_5,d）と第６の角度（φ_6,d）との重み付け差とを加算することにより、前記右角（φ_right,d）を補間する、
請求項１または２に記載の方法。
前記第１の角度、第２の角度、第３の角度、第４の角度、第５の角度及び第６の角度は前記親区間に関連する継承角度である、
請求項３に記載の方法。
前記第１の角度、第３の角度及び第４の角度はいずれも前記親区間に関連する同じ継承角度（φ_1,d-1）に等しく、前記第２の角度、第４の角度及び第５の角度はいずれも前記親区間の中点に関連する別の継承角度（φ_middle,d-1）に等しく、アークタンジェント関数を実行することにより前記左半区間または右半区間の中点に関連する角度（φ_middle,d）を計算する、
請求項４に記載の方法。
前記第１の角度、第３の角度及び第５の角度はいずれも同じ継承角度（φ_1,d-1）に等しく、前記第２の角度、第４の角度及び第６の角度はいずれも前記親区間の上限に等しい別の継承角度（φ_top,d-1）に等しく、アークタンジェント関数を実行することにより前記左半区間の上限に関連する角度（φ_top,d）または前記右半区間の下限に関連する角度（φ_low,d）を計算する、
請求項４に記載の方法。
前記左半区間の前記上限に関連する前記角度（φ_top,d）または前記右半区間の前記下限に関連する前記角度（φ_low,d）は前記親区間の前記中点に関連する継承角度（φ_middle,d-1）に等しい、
請求項６に記載の方法。
１番目のビットを符号化するために、アークタンジェント関数を実行することにより前記左半区間の前記上限に関連する前記角度（φ_top,d）または前記右半区間の前記下限に関連する前記角度（φ_low,d）を計算し、後続のビットを符号化するために、前記左半区間の前記上限に関連する前記角度（φ_top,d）または前記右半区間の前記下限に関連する前記角度（φ_low,d）は前記親区間の前記中点に関連する継承角度（φ_middle,d-1）に等しい、
請求項６に記載の方法。
前記親区間の前記中点に関連する前記継承角度（φ_middle,d-1）は前記親区間に関連する２つの継承角度（φ_1,d-1）及び（φ_top,d-1）から補間される、
請求項７または８に記載の方法。
前記親区間の寸法が決定された閾値以上である場合、アークタンジェント関数を実行することにより前記親区間の前記中点に関連する前記継承角度（φ_middle,d-1）を計算し、または、前記親区間の寸法が決定された閾値より小さい場合、前記親区間に関連する２つの継承角度（φ_1,d-1）及び（φ_top,d-1）から補間する、
請求項７または８に記載の方法。
点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する装置であって、前記装置は、前記点群の点の座標を符号化するための一連のビットを提供する方位コーディングモードを実現するように構成される１つまたは複数のプロセッサを含み、前記方位コーディングモードは、
－前記点の座標が属する親区間を左半区間と右半区間とに分割するステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間するステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、ビット（ｂ_d）を前記ビットストリームにコンテキスト自己適応バイナリエントロピー符号化（１０７）するステップであって、前記符号化されたビット（ｂ_d）は前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する装置。
物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する装置であって、前記装置は、前記点群の点の座標を符号化するための一連のビットを提供する方位コーディングモードを実現するように構成される１つまたは複数のプロセッサを含み、前記方位コーディングモードは、
－前記点の座標が属する親区間を左半区間と右半区間とに分割するステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間するステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、前記ビットストリームからビット（ｂ_d）をコンテキスト自己適応的バイナリエントロピー復号化するステップであって、前記復号化されたビット（ｂ_d）は前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する装置。
命令を含むコンピュータプログラム製品であって、前記プログラムが１つまたは複数のプロセッサによって実行される場合、１つまたは複数のプロセッサに、点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を実行させ、前記方法は、前記点群の点の座標を符号化するための一連のビットを提供する方位コーディングモードを含み、前記方法は、
－前記点の座標が属する親区間を左半区間と右半区間とに分割するステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間するステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、ビット（ｂ_d）を前記ビットストリームにコンテキスト自己適応バイナリエントロピー符号化するステップであって、前記符号化されたビット（ｂ_d）は前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
コンピュータプログラム製品。
プログラムコードの命令を運ぶ非一時的な記憶媒体であって、前記命令は点群を物理的オブジェクトを表す符号化された点群データのビットストリームに符号化する方法を実行し、前記方法は、前記点群の点の座標を符号化するための一連のビットを提供する方位コーディングモードを含み、前記方法は、
－前記点の座標が属する親区間を左半区間と右半区間とに分割するステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間するステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、ビット（ｂ_d）を前記ビットストリームにコンテキスト自己適応バイナリエントロピー符号化するステップであって、前記符号化されたビット（ｂ_d）は前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
非一時的な記憶媒体。
命令を含むコンピュータプログラム製品であって、前記プログラムが１つまたは複数のプロセッサによって実行される場合、前記１つまたは複数のプロセッサに、物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を実行させ、前記方法は前記点群の点の座標を復号化するための一連のビットを提供する方位コーディングモードを含み、前記方法は、
－前記点の座標が属する親区間を左半区間と右半区間とに分割するステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間するステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、前記ビットストリームからビット（ｂ_d）をコンテキスト自己適応バイナリエントロピー復号化するステップであって、前記復号化されたビット（ｂ_d）は前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
コンピュータプログラム製品。
プログラムコードの命令を運ぶ非一時的な記憶媒体であって、前記命令は物理的オブジェクトを表す符号化された点群データのビットストリームから点群を復号化する方法を実行し、前記方法は前記点群の点の座標を復号化するための一連のビットを提供する方位コーディングモードを含み、前記方法は、
－前記点の座標が属する親区間を左半区間と右半区間とに分割するステップと、
－前記親区間に関連する少なくとも１つの継承角度から、前記左半区間に関連する左角（φ_left,d）と前記右半区間に関連する右角（φ_right,d）とを補間するステップと、
－前記左角（φ_left,d）と前記右角（φ_right,d）とに基づいてコンテキストを選択するステップと、
－選択されたコンテキストに基づいて、前記ビットストリームからビット（ｂ_d）をコンテキスト自己適応バイナリエントロピー復号化するステップであって、前記復号化されたビット（ｂ_d）は前記点の座標が前記２つの半区間のどちらに属するかを指示するステップと、を含む、
非一時的な記憶媒体。