JP2023533899A

JP2023533899A - ポイントクラウドコーディングのための距離ベースの加重平均を計算する方法および装置

Info

Publication number: JP2023533899A
Application number: JP2022567067A
Authority: JP
Inventors: ジャン，シアン; ガオ，ウエン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2021-06-08
Filing date: 2022-06-02
Publication date: 2023-08-07
Anticipated expiration: 2042-06-02
Also published as: EP4139899A2; US20220392114A1; WO2022261605A3; KR20230017301A; WO2022261605A2; CN117917078A; EP4139899A4; JP7470211B2

Abstract

本開示の態様は、ポイントクラウド圧縮および解凍のための方法および装置を提供する。幾つかの例では、ポイントクラウド圧縮／解凍のための装置が、処理回路構成を含む。処理回路構成は、ポイントクラウド内の現在のポイントと関連付けられる情報をコーディング（符号化／復号化）するために予測モードを使用することを決定する。予測モードにおいて、現在のポイントと関連付けられる情報は、現在のポイントの１つ以上の隣接ポイントに基づいて予測される。処理回路構成は、整数演算を使用して、現在のポイントまでの１つ以上の隣接ポイントの距離に基づいて距離ベースの加重平均値を計算し、距離ベースの加重平均値に基づいて現在のポイントと関連付けられる情報を決定する。

Description

（関連出願の参照）
本願は、２０２１年６月８日に出願された米国仮出願第６３／２０８，３４０号「Method and Apparatus for Calculating Distance based Weighed Average for Point Cloud Coding」に対する優先権の利益を主張する、２０２２年５月２３日に出願された米国特許出願第１７／７５１，４１３号「METHOD AND APPARATUS FOR CALCULATING DISTANCE BASED WEIGHED AVERAGE FOR POINT CLOUD CODING」に対する優先権の利益を主張する。先の出願の開示は、その全体が参照により本明細書に援用される。

（技術分野）
本開示は、ポイントクラウド(点群)コーディングに概ね関する実施形態を記載する。

本明細書で提供される背景記述は、本開示の文脈を一般的に提示するためのものである。その業績がこの背景セクションに記載されている範囲における、現在指名されている発明者の業績、並びに出願時に他の点では先行技術として適格でないことがある記述の側面は、本開示に対する先行技術として明示的にも暗示的にも認められていない。

世界中のオブジェクト(物体)、世界中の環境、３次元（３Ｄ）空間内の同等物のような、世界を取り込んで表現するために、様々な技術が開発されている。世界の３Ｄ表現は、より没入的な形態の対話(インタラクション)および通信(コミュニケーション)を可能にする。ポイントクラウド(point clouds)は、世界の３Ｄ表現として使用されることができる。ポイントクラウドは、３Ｄ空間内のポイント(点)のセットであり、各ポイントは、関連する属性、例えば、色、材料特性、テクスチャ情報、強度属性、反射率属性、運動関連属性、モダリティ属性、および様々な他の属性を持つ。そのようなポイントクラウドは、大量のデータを含むことがあり、格納および送信にコストおよび時間がかかることがある。

本開示の態様は、ポイントクラウド圧縮および解凍のための方法および装置を提供する。幾つかの例では、ポイントクラウド圧縮／解凍のための装置が、処理回路構成を含む。処理回路構成は、ポイントクラウド内の現在のポイントと関連付けられる情報をコーディングするために予測モードを使用することを決定する。予測モードにおいて、現在のポイントと関連付けられる情報は、現在のポイントの１つ以上の隣接ポイントに基づいて予測される。処理回路構成は、整数演算を使用して、現在のポイントまでの１つ以上の隣接ポイントの距離に基づいて距離ベースの加重平均値を計算し、距離ベースの加重平均値に基づいて現在のポイントと関連付けられる情報を決定する。

一例において、現在のポイントと関連付けられる情報は、現在のポイントの幾何学的形状情報である。別の例において、現在のポイントと関連付けられる情報は、現在のポイントの属性情報である。

距離ベースの加重平均値を計算するために、幾つかの例において、処理回路構成は、重み計算における浮動小数点データタイプの使用を除外する。幾つかの例において、処理回路構成は、被除数を除数で除算する整数除算演算に基づいて、第１の隣接ポイントの情報を重み付けるための第１の変換された重みを計算する。被除数は、１よりも大きい絶対値を持つ整数であり、除数は、第１の隣接ポイントと現在のポイントとの間の距離に基づく。幾つかの例において、処理回路構成は、ビット単位の左シフトに基づいて被除数を得る。幾つかの例において、処理回路構成は、除数のビット単位の左シフトによって得られる第１の整数と、ビット単位の右シフトによって得られる第２の整数との合計に基づいて、被除数を決定する。

幾つかの例において、処理回路構成は、１つ以上の隣接ポイントの加重属性の合計を計算する。加重属性中の第１の加重属性は、第１の隣接ポイントと関連付けられ、第１の隣接ポイントと関連付けられる第１の属性と第１の変換された重みとの乗算に基づいて計算される。処理回路構成は、１つ以上の隣接ポイントと関連付けられる変換された重みの合計を計算する。換算された重みは、第１の換算された重みを含む。処理回路構成は、変換された重みの合計による加重属性の合計の除算に基づいて、距離ベースの加重平均値を決定する。

幾つかの例において、処理回路構成は、第１の属性および第１の変換された重みに基づくルックアップ演算に応答してルックアップテーブルから出力される第１の加重属性を受信する。

幾つかの例において、処理回路構成は、変換された重みのうちの少なくとも１つが上限よりも大きいことに応答して、変換された重みをそれぞれダウンスケール(縮小)させる。

一例において、処理回路構成は、変換された重みの合計がゼロであることに応答して、１つ以上の隣接ポイント内の最も近い隣接ポイントに基づいて、現在のポイントと関連付けられる属性値を決定する。

別の例において、処理回路構成は、変換された重みの合計がゼロであることに応答して、１つ以上の隣接ポイントの属性値の平均に基づいて、現在のポイントと関連付けられる属性値を決定する。

幾つかの例において、処理回路構成は、変換モデルに従って、距離に基づいて重みを計算し、整数演算を使用して、距離ベースの加重平均値を計算する。変換モデルは、線形モデル、二次モデル、および非線形モデルのうちの１つであることができる。

本開示の態様は、ポイントクラウド符号化／復号化のためにコンピュータによって実行されるときに、コンピュータにポイントクラウド符号化／復号化のための方法のいずれか１つまたは組み合わせを実行させる命令を格納する、非一時的なコンピュータ読取可能媒体も提供する。

開示される主題のさらなる構成、性質、および様々な利点は、以下の詳細な記述および添付の図面からより明らかになるであろう

一実施形態による通信システムの単純化されたブロック図の概略的な例示である

一実施形態によるストリーミングシステムの単純化されたブロック図の概略的な例示である

幾つかの実施形態によるポイントクラウドフレームを符号化するためのエンコーダのブロック図を示している。

幾つかの実施形態によるポイントクラウドフレームに対応する圧縮されたビットストリームを復号化するためのデコーダのブロック図を示している。

一実施形態によるビデオデコーダの単純化されたブロック図の概略的な例示である。

一実施形態によるビデオエンコーダの単純化されたブロック図の概略的な例示である。

本開示の幾つかの実施形態による八分木パーティション技法に基づく立方体のパーティションを例示する図を示している。

本開示の幾つかの実施形態による八分木パーティションおよび八分木パーティションに対応する八分木構造の例を示している。

３つの四分木パーティションの例を示している。

３つの二分木パーティションの例を示している。

幅第１コーディング順序を示す八分木構造の図を示している。

深さ第１コーディング順序を示す八分木構造の図を示している。

予測ツリーの例を示している。

エンコーダ側でリフティングベースの属性コーディングにおいて直接／順変換アーキテクチャを使用する図を示している。

デコーダ側でリフティングベースの属性コーディングにおいて逆変換アーキテクチャの使用する図を示している。

領域適応階層変換（ＲＡＨＴ）順変換アーキテクチャの図およびＲＡＨＴ逆変換アーキテクチャの図を示している。

幾つかの実施形態によるプロセスの例を概説するフローチャートを示している。

一実施形態によるコンピュータシステムの概略的な例示である。

本開示の態様は、ポイントクラウドコーディング（ＰＣＣ：point cloud coding）技法を提供する。ＰＣＣは、Ｇ－ＰＣＣと呼ばれる幾何学的形状(ジオメトリ)ベースのスキーム、Ｖ－ＰＣＣと呼ばれるビデオコーディングベースのスキーム、および同等物のような、様々なスキーム(方式)に従って実行されることができる。本開示の幾つかの態様によれば、Ｇ－ＰＣＣは、３Ｄ幾何学的形状を直接的に符号化し、ビデオコーディングと共有するものがあまりない純粋に幾何学ベースのアプローチであり、Ｖ－ＰＣＣは、ビデオコーディングに重点的に基づいている。例えば、Ｖ－ＰＣＣは、３Ｄクラウドのポイント(点)を２Ｄグリッド（画像）のピクセル(画素)にマッピングすることができる。Ｖ‐ＰＣＣスキームは、ポイントクラウド圧縮のために汎用ビデオコーデックを利用することができる。ＭＰＥＧ（Moving Picture Experts Group）は、Ｇ‐ＰＣＣスキームおよびＶ‐ＰＣＣスキームをそれぞれ使用するＧ‐ＰＣＣ標準およびＶ‐ＰＣＣ標準に取り組んでいる。

ポイントクラウド(点群)は、多くのアプリケーションで広く使用されることができる。例えば、ポイントクラウドは、オブジェクト(物体)検出および場所特定(localization)のために自律運転車両において使用されることができ、ポイントクラウドは、地図作成(mapping)のために地理情報システム（ＧＩＳ：geographic information system）において使用されることができ、文化遺産オブジェクトおよびコレクションなどを視覚化し且つアーカイブ化するために文化遺産において使用されることができる。

以下、ポイントクラウドは、一般に、３Ｄ空間内のポイント(点)のセットを参照することがあり、各ポイントは、色、材料特性、テクスチャ情報、強度属性、反射率属性、運動関連属性、モダリティ属性、および様々な他の属性のような、関連する属性を有する。ポイントクラウドは、オブジェクトまたはシーンをそのようなポイントの合成(composition)として再構成するために使用されることができる。ポイントは、様々なセットアップで複数のカメラ、奥行きセンサまたはライダ(Lidar)を使用して取り込まれることができ、再構成されたシーンまたはオブジェクトを現実的に表現するために、数千から数十億のポイントで構成されることがある。パッチ(patch)が、一般に、ポイントクラウドによって記述される表面の連続したサブセットを指すことがある。一例では、パッチが、閾値量未満で互いに逸脱する表面法線ベクトルを有するポイントを含む。

圧縮技術は、より高速な送信またはストレージの削減のために、ポイントクラウドを表現するのに必要とされるデータ量を削減することができる。よって、リアルタイム通信および６自由度（６ＤｏＦ）仮想現実における使用のために、ポイントクラウドの損失(不可逆)圧縮のための技術が必要とされる。加えて、自律運転および文化遺産用途等のための動的マッピングの脈絡において、無損失(可逆)ポイントクラウド圧縮の技術が求められる。

本開示の一態様によれば、Ｖ－ＰＣＣの背後にある主な哲学は、既存のビデオコーデックを利用して、動的ポイントクラウドの幾何学的形状、占有、およびテクスチャを３つの別個のビデオシーケンスとして圧縮することである。３つのビデオシーケンスを解釈するために必要とされる余分なメタデータは、別々に圧縮される。ビットストリーム全体の僅かな部分がメタデータであり、それはソフトウェア実装を使用して効率的に符号化(エンコード)／復号化(デコード)されることができる。情報の大部分は、ビデオコーデックによって処理される。

図１は、本開示の一実施形態による通信システム（１００）の簡略化されたブロック図を示している。通信システム（１００）は、例えば、ネットワーク（１５０）を介して、互いに通信することができる、複数の端末デバイスを含む。例えば、通信システム（１００）は、ネットワーク（１５０）を介して相互接続される端末デバイス（１１０）および（１２０）のペアを含む。図１の例において、第１のペアの端末デバイス（１１０）および（１２０）は、ポイントクラウドデータの一方向送信を行うことがある。例えば、端末デバイス（１１０）は、端末デバイス（１１０）と接続されたセンサ（１０５）によって取り込まれるポイントクラウド（例えば、構造を表すポイント）を圧縮することある。圧縮されたポイントクラウドは、例えば、ビットストリームの形態で、ネットワーク（１５０）を介して他の端末デバイス（１２０）に送信されることができる。端末デバイス（１２０）は、ネットワーク（１５０）から圧縮されたポイントクラウドを受信し、ビットストリームを解凍してポイントクラウドを再構成し、再構成されたポイントクラウドを適切に表示することがある。一方向性データ送信は、媒体提供アプリケーション等において一般的なことがある。

図１の例において、端末デバイス（１１０）および（１２０）は、サーバおよびパーソナルコンピュータとして示されることがあるが、本開示の原理は、それらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、ゲーム端末、メディアプレーヤ、および／または専用の三次元（３Ｄ）機器との適用を見出す。ネットワーク（１５０）は、端末デバイス（１１０）および（１２０）の間で圧縮されたポイントクラウドを送信する任意の数のネットワークを表す。ネットワーク（１５０）は、例えば、ワイヤライン（有線）および／または無線通信ネットワークを含むことができる。ネットワーク（１５０）は、回線交換および／またはパケット交換チャネル内でデータを交換することがある。代表的なネットワークは、通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、および／またはインターネットを含む。本議論の目的のために、ネットワーク（１５０）のアーキテクチャおよびトポロジー(topology)は、以下に説明されない限り、本開示の動作に重要でない。

図２は、一実施形態によるストリーミングシステム（２００）の簡略化されたブロック図を示している。図２の例は、ポイントクラウドについて開示される主題のためのアプリケーションである。開示の主題は、３Ｄテレプレゼンスアプリケーション、仮想現実アプリケーション等のような、他のポイントクラウド対応アプリケーションに等しく適用可能であることができる。

ストリーミングシステム（２００）は、キャプチャサブシステム（２１３）を含むことがある。キャプチャサブシステム（２１３）は、ポイントクラウドソース（２０１）、例えば、光検出および測距（ＬＩＤＡＲ）システム、３Ｄカメラ、３Ｄスキャナ、ソフトウェアにおいて圧縮されていないポイントクラウドを生成するフラフィックス生成コンポーネント、および、例えば、圧縮されていないポイントクラウド（２０２）を生成する同等物を含むことができる。一例において、ポイントクラウド（２０２）は、３Ｄカメラによって取り込まれるポイントを含む。ポイントクラウド（２０２）は、圧縮されたポイントクラウド（２０４）（圧縮されたポイントクラウドのビットストリーム）と比較して高いデータボリュームを強調するために太線として描かれている。圧縮されたポイントクラウド（２０４）は、ポイントクラウドソース（２０１）に結合されたエンコーダ（２０３）を含む電子デバイス（２２０）によって生成されることができる。エンコーダ（２０３）は、以下により詳細に説明されるような開示される主題の態様を可能にするか或いは実装するように、ハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ポイントクラウド（２０２）のストリームと比較してより低いデータボリュームを強調するために細線として描かれている、圧縮されたポイントクラウド（２０４）（または圧縮されたポイントクラウド（２０４）のビットストリーム）は、将来の使用のためにストリーミングサーバ（２０５）に格納されることができる。図２のクライアントサブシステム（２０６）および（２０８）のような１つ以上のストリーミングクライアントサブシステムは、圧縮されたポイントクラウド（２０４）のコピー（２０７）および（２０９）を検索するためにストリーミングサーバ（２０５）にアクセスすることができる。クライアントサブシステム（２０６）が、例えば、電子デバイス（２３０）内にデコーダ（２１０）を含むことができる。デコーダ（２１０）は、圧縮されたポイントクラウドの入力コピー（２０７）を復号化(デコード)し、レンダリングデバイス（２１２）でレンダリングされることができる再構成ポイントクラウド（２１１）の出力ストリームを生成する。

電子デバイス（２２０）および（２３０）は、他のコンポーネント（図示せず）を含むことができることに留意されたい。例えば、電子デバイス（２２０）は、デコーダ（図示せず）を含むことができ、電子デバイス（２３０）は、エンコーダ（図示せず）を含むこともできる。

幾つかのストリーミングシステムにおいて、圧縮されたポイントクラウド（２０４）、（２０７）および（２０９）（例えば、圧縮されたポイントクラウドのビットストリーム）を、特定の標準に従って圧縮されることができる。幾つかの例では、ビデオコーディング標準が、ポイントクラウドの圧縮において使用される。それらの標準の例は、高効率ビデオコーディング（ＨＥＶＣ）、汎用ビデオコーディング（ＶＶＣ）等を含む。

図３は、幾つかの実施形態による、ポイントクラウドフレームを符号化するためのＶ－ＰＣＣエンコーダ（３００）のブロック図を示している。幾つかの実施形態において、Ｖ－ＰＣＣエンコーダ（３００）は、通信システム（１００）およびストリーミングシステム（２００）で使用されることができる。例えば、エンコーダ（２０３）は、Ｖ－ＰＣＣエンコーダ（３００）と同様の方法で構成されることができ、作動することができる。

Ｖ－ＰＣＣエンコーダ（３００）は、圧縮されていない入力としてポイントクラウドフレームを受信し、圧縮されたポイントクラウドフレームに対応するビットストリームを生成する。幾つかの実施形態において、Ｖ－ＰＣＣエンコーダ（３００）は、ポイントクラウドソース（２０１）等のような、ポイントクラウドソースからポイントクラウドフレームを受信してよい。

図３の例において、Ｖ－ＰＣＣエンコーダ（３００）は、パッチ生成モジュール（３０６）と、パッチパッキングモジュール（３０８）と、幾何学的形状画像生成モジュール（３１０）と、テクスチャ画像生成モジュール（３１２）と、パッチ情報モジュール（３０４）と、占有マップモジュール（３１４）と、平滑化モジュール（３３６）と、画像パディングモジュール（３１６）および（３１８）と、グループ拡張モジュール（３２０）と、ビデオ圧縮モジュール（３２２）、（３２３）および（３３２）と、補助パッチ情報圧縮モジュール（３３８）と、エントロピー圧縮モジュール（３２４）と、マルチプレクサ（３２４）とを含む。

本開示の一態様によれば、Ｖ－ＰＣＣエンコーダ（３００）は、３Ｄポイントクラウドフレームを、圧縮されたポイントクラウドを解凍されたポイントクラウドに戻すために使用される幾つかのメタデータ（例えば、占有マップおよびパッチ情報）と共に、画像ベースの表現に変換する。幾つかの例において、Ｖ－ＰＣＣエンコーダ（３００）は、３Ｄポイントクラウドフレームを、幾何学的形状画像、テクスチャ画像、および占有マップに変換し、次に、ビデオコーディング技術を使用して、幾何学的形状画像、テクスチャ画像、および占有マップを、ビットストリームに符号化することができる。一般に、幾何学的形状画像は、ピクセルに投影されるポイントと関連付けられた幾何学的形状値で満たされたピクセルを有する２Ｄ画像であり、幾何学的形状値で満たされたピクセルは、幾何学的形状サンプルと呼ばれることができる。テクスチャ画像は、ピクセルに投影されたポイントと関連付けられたテクスチャ値で満たされたピクセルを有する２Ｄ画像であり、テクスチャ値で満たされたピクセルは、テクスチャサンプルと呼ばれることができる。占有マップは、パッチによる占有または非占有を示す値で満たされたピクセルを有する２Ｄ画像である。

パッチ生成モジュール（３０６）は、ポイントクラウドをパッチのセットにセグメント化し（例えば、パッチは、ポイントクラウドによって記述される表面の連続したサブセットとして定義される）、パッチのセットは、各パッチが２Ｄ空間内の平面に関して深さ領域(depth field)によって記述されることがあるように、重なり合うことがあり、或いは重なり合わないことがある。幾つかの実施態様において、パッチ生成モジュール（３０６）は、再構成誤差を最小限に抑えながら、ポイントクラウドを平滑な境界を有する最小数のパッチに分解することを目的とする。

パッチ情報モジュール（３０４）は、パッチのサイズおよび形状を示すパッチ情報を収集することができる。幾つかの例において、パッチ情報は、画像フレームにパッキングされ、次に、補助パッチ情報圧縮モジュール（３３８）によって符号化されて、圧縮された補助パッチ情報が生成されることができる。

パッチパッキングモジュール（３０８）は、未使用スペースを最小限に抑え、グリッドのあらゆるＭ×Ｍ（例えば、１６×１６）ブロックがユニークなパッチと関連付けられることを保証しながら、抽出されたパッチを２次元（２Ｄ）グリッド上にマッピングするように構成される。効率的なパッチパッキングは、未使用スペースを最小限に抑えることまたは時間的一貫性を確保することのいずれかによって、圧縮効率に直接的に影響を与えることができる。

幾何学的形状画像生成モジュール（３１０）は、所与のパッチ場所でのポイントクラウドの幾何学的形状と関連付けられるＤ幾何学的形状画像を生成することができる。テクスチャ画像生成モジュール（３１２）は、所与のパッチ場所でのポイントクラウドのテクスチャと関連付けられる２Ｄテクスチャ画像を生成することができる。幾何学的形状画像生成モジュール（３１０）およびテクスチャ画像生成モジュール（３１２）は、パッキングプロセス中に計算された３Ｄ対２Ｄマッピングを利用して、ポイントクラウドの幾何学的形状およびテクスチャを画像として格納する。複数のポイントが同じサンプルに投影される場合をより良く処理するために、各パッチは、層と呼ばれる２つの画像の上に投影される。一例において、幾何学的形状画像は、ＹＵＶ４２０－８ビットフォーマットにおけるＷｘＨの単色フレームによって表現される。テクスチャ画像を生成するために、テクスチャ生成手順は、再サンプリングされたポイントと関連付けられる色を計算するために、再構成された／平滑化された幾何学的形状を利用する。

占有マップモジュール（３１４）は、各ユニットでパディング情報を記述する占有マップを生成することができる。例えば、占有画像は、グリッドの各セルについて、セルが空の空間に属するか或いはポイントクラウドに属するかを示す、バイナリマップを含む。一例において、占有マップは、各ピクセルについて、ピクセルがパディングされているかどうかを記述する、バイナリ情報を使用する。別の例において、占有マップは、ピクセルの各ブロックについて、ピクセルのブロックがパディングされているかどうかを記述する、バイナリ情報を使用する。

占有マップモジュール（３１４）によって生成される占有マップは、無損失コーディングまたは損失コーディングを使用して圧縮されることができる。無損失コーディングが使用されるとき、エントロピー圧縮モジュール（３３４）は、占有マップを圧縮するために使用される。損失コーディングが使用されるとき、ビデオ圧縮モジュール（３３２）は、占有マップを圧縮するために使用される。

パッチパッキングモジュール（３０８）は、画像フレーム内にパックされる２Ｄパッチの間に多少の空の空間を残すことがあることに留意されたい。画像パディングモジュール（３１６）および（３１８）は、２Ｄビデオおよび画像コーデックに適した画像フレームを生成するために、（パディングと呼ばれる）空の空間を満たすことができる。画像パディングは、バックグラウンド充填とも呼ばれ、バックグラウンド充填は、未使用の空間を冗長情報で満たすことができる。幾つかの例では、良好なバックグラウンド充填は、ビットレートを最小限に増加させる一方で、パッチ境界の周りに有意なコーディング歪みを導入しない。

ビデオ圧縮モジュール（３２２）、（３２３）、および（３３２）は、ＨＥＶＣ、ＶＶＣ等のような、適切なビデオコーディング標準に基づいて、パッディングされた幾何学的形状画像、パディングされたテクスチャ画像、および占有マップのような、２Ｄ画像を符号化することができる。一例において、ビデオ圧縮モジュール（３２２）、（３２３）、および（３３２）は、別々に作動する個々のコンポーネントである。ビデオ圧縮モジュール（３２２）、（３２３）、および（３３２）は、別の例において単一のコンポーネントとして実装され得ることに留意されたい。

幾つかの例において、平滑化モジュール（３３６）は、再構成された幾何学的形状画像の平滑化された画像を生成するように構成される。平滑化された画像は、テクスチャ画像生成（３１２）に提供されることができる。次に、テクスチャ画像生成（３１２）は、再構成された幾何学的形状画像に基づいてテクスチャ画像の生成を調整することがある。例えば、パッチ形状（例えば、幾何学的形状）が、符号化および復号化中にわずかに歪まされるとき、歪みは、パッチ形状の歪みを補正するためにテクスチャ画像を生成するときに考慮に入れられることがある。

幾つかの実施形態において、グループ拡張（３２０）は、再構成されたポイントクラウドのコーディング利得ならびに視覚的品質を改良するために、冗長な低周波数コンテンツを有するオブジェクト境界の周囲のピクセルをパディングするように構成される。

マルチプレクサ（３２４）は、圧縮された幾何学的形状画像、圧縮されたテクスチャ画像、圧縮された占有マップ、圧縮された補助パッチ情報を、圧縮されたビットストリームに多重化する(multiplex)ことができる。

図４は、幾つかの実施形態による、ポイントクラウドフレームに対応する圧縮されたビットストリームを復号化するＶ－ＰＣＣデコーダ（４００）のブロック図を示している。幾つかの実施形態において、Ｖ－ＰＣＣデコーダ（４００）は、通信システム（１００）およびストリーミングシステム（２００）で使用されることができる。例えば、デコーダ（２１０）は、Ｖ－ＰＣＣデコーダ（４００）と同様の方法で作動するように構成されることができる。Ｖ－ＰＣＣデコーダ（４００）は、圧縮されたビットストリームを受信し、圧縮されたビットストリームに基づいて再構成されたポイントクラウドを生成する。

図４の例において、Ｖ－ＰＣＣデコーダ（４００）は、デマルチプレクサ（４３２）、ビデオ解凍モジュール（４３４）および（４３６）、占有マップ解凍モジュール（４３８）、補助パッチ情報解凍モジュール（４４２）、幾何学的形状再構成モジュール（４４４）、平滑化モジュール（４４６）、テクスチャ再構成モジュール（４４８）、ならびに色円滑化モジュール（４５２）を含む。

デマルチプレクサ（４３２）は、圧縮されたビットストリームを受信し、圧縮されたテクスチャ画像、圧縮された幾何学的形状画像、圧縮された占有マップ、および圧縮された補助パッチ情報に分離することができる。

ビデオ解凍モジュール（４３４）および（４３６）は、適切な標準（例えば、ＨＥＶＣ、ＶＣＣ等）に従って圧縮された画像を復号化し、解凍された画像を出力することができる。例えば、ビデオ解凍モジュール（４３４）は、圧縮されたテクスチャ画像を復号化し、解凍されたテクスチャ画像を出力し、ビデオ解凍モジュール（４３６）は、圧縮された幾何学的形状画像を復号化し、解凍された幾何学的形状画像を出力する。

占有マップ解凍モジュール（４３８）は、適切な標準（例えば、ＨＥＶＣ、ＶＶＣ等）に従って圧縮された占有マップを復号化し、解凍された占有マップを出力することができる。

補助パッチ情報解凍モジュール（４４２）は、適切な標準（例えば、ＨＥＶＣ、ＶＶＣ等）に従って圧縮された補助パッチ情報を復号化し、解凍された補助パッチ情報を出力することができる。

幾何学的形状再構成モジュール（４４４）は、解凍された幾何学的形状画像を受信し、解凍された占有マップおよび解凍された補助パッチ情報に基づいて再構成されたポイントクラウド幾何学的形状を生成することができる。

平滑化モジュール（４４６）は、パッチのエッジでの不一致(incongruences)を平滑化することができる。平滑化手順は、圧縮アーチファクトに起因してパッチ境界で生じることがある潜在的な不連続性を緩和することを目的としている。幾つかの実施形態では、平滑化フィルタが、圧縮／解凍によって引き起こされることがある歪みを緩和するために、パッチ境界上に位置するピクセルに適用されることがある。

テクスチャ再構成モジュール（４４８）は、解凍されたテクスチャ画像および平滑化幾何学的形状に基づいてポイントクラウド内のポイントについてのテクスチャ情報を決定することができる。

色平滑化モジュール（４５２）は、色の不一致を平滑化することができる。３Ｄ空間内の隣接しないパッチは、しばしば、２Ｄビデオ内で互いに隣接してパックされる。幾つかの例において、隣接しないパッチからの画素値は、ブロックベースのビデオコーデックによって混合されることがある。色平滑化の目的は、パッチ境界に現れる可視的なアーチファクトを減らすことである。

図５は、本開示の一実施形態によるビデオデコーダ（５１０）のブロック図を示している。ビデオデコーダ（５１０）は、Ｖ－ＰＣＣデコーダ（４００）で使用されることができる。例えば、ビデオ解凍モジュール（４３４）および（４３６）、占有マップ解凍モジュール（４３８）は、同様に、ビデオデコーダ（５１０）と同様に構成されることができる。

ビデオデコーダ（５１０）は、コーディングされたビデオシーケンスのような、圧縮された画像からシンボル（５２１）を再構成するパーサ（５２０）を含むことがある。それらのシンボルのカテゴリは、ビデオデコーダ（５１０）の動作を管理するために使用される情報を含む。パーサ（５２０）は、受信されるコーディングされたビデオシーケンスを構文解析／エントロピー復号化することがある。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術または標準に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト感度を伴うまたは伴わない算術コーディング等を含む、様々な原理に従うことができる。パーサ（５２０）は、グループに対応する少なくとも１つのパラメータに基づいて、ビデオデコーダ内のピクセルのサブグループのうちの少なくとも１つについてのサブグループパラメータのセットを、コーディングされたビデオシーケンスから抽出することがある。サブグループは、ピクチャのグループ（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディング単位（ＣＵ）、ブロック、変換単位（ＴＵ）、予測単位（ＰＵ）等を含む。パーサ（５２０）は、変換係数、量子化パラメータ値、運動ベクトル等のような情報を、コーディングされたビデオシーケンスから抽出することもある。

パーサ（５２０）は、シンボル（５２１）を生成するように、バッファメモリから受信したビデオシーケンスに対してエントロピーデコーディング／構文解析動作を実行することがある。

シンボル（５２１）の再構成は、（インターピクチャおよびイントラピクチャ、インターブロックまたはイントラブロックのような）コーディングされたビデオピクチャまたはその部分のタイプ、および他の要因に依存して、複数の異なるユニットを含むことができる。どのユニットが含まれ、どのように含まれるかは、パーサ（５２０）によってコーディングされたビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ（５２０）と以下の複数ユニットとの間のそのようなサブグループ制御情報の流れは、明瞭性のために示されていない。

既に述べた機能ブロックの他に、ビデオデコーダ（５１０）は、以下に記載するような多数の機能ユニットに概念的に細分されることができる。商業的な制約の下で作動する実用的な実装において、これらのユニットの多くは、互いに密接に相互作用し、少なくとも部分的に互いに統合されることができる。しかしながら、開示の主題を記載する目的のためには、以下の機能ユニットに概念的に細分化することが適切である。

第１のユニットは、スケーラ／逆変換ユニット（５５１）である。スケーラ／逆変換ユニット（５５１）は、パーサ（５２０）からシンボル（５２１）として、どの変換を使用するか、ブロックサイズ、量子化係数、量子化スケーリング行列等を含む、制御情報ならびに量子化された変換係数を受信する。スケーラ／逆変換ユニット（５５１）は、アグリゲータ（５５５）に入力することができるサンプル値を含むブロックを出力することができる。

幾つかの場合において、スケーラ／逆変換（５５１）の出力サンプルは、イントラコーディングされたブロック、すなわち、以前に再構成されたピクチャからの予測情報を使用しないが、現在のピクチャの以前に再構成された部分からの予測情報を使用することができる、ブロックに関係することができる。そのような予測情報は、イントラピクチャ予測ユニット（５５２）によって提供されることができる。幾つかの場合において、イントラピクチャ予測ユニット（５５２）は、現在のピクチャバッファ（５５８）からフェッチされた(取り出された)周囲の既に再構成された情報を使用して、再構成の下のブロックの同じサイズおよび形状のブロックを生成する。現在のピクチャバッファ（５５８）は、例えば、部分的に再構成された現在のピクチャおよび／または完全に再構成された現在のピクチャをバッファする。アグリゲータ（５５５）は、幾つかの場合において、サンプル毎ベースで、イントラ予測ユニット（５５２）が生成した予測情報を、スケーラ／逆変換ユニット（５５１）によって提供されるような出力サンプル情報に追加する。

他の場合において、スケーラ／逆変換ユニット（５５１）の出力サンプルは、インターコーディングされた、潜在的に運動補償されたブロックに関係することができる。そのような場合には、運動補償予測ユニット５５３が、予測のために使用されるサンプルをフェッチするための参照ピクチャメモリ（５５７）にアクセスすることができる。ブロックに関連するシンボル（５２１）に従ってフェッチされたサンプルを補償する動作の後に、これらのサンプルは、出力サンプル情報を生成するために、アグリゲータ（５５５）によって、（この場合には剰余サンプル(residual samples)または剰余信号(residual signal)と呼ばれる）スケーラ／逆変換ユニット（５５１）の出力に追加されることができる。運動補償予測ユニットが予測サンプルをフェッチする参照ピクチャメモリ（５５７）内のアドレスは、例えば、Ｘ、Ｙ、および参照ピクチャコンポーネントを有することができるシンボル（５２１）の形態において、運動補償予測ユニット（５５３）に利用可能な運動ベクトルによって制御されることができる。運動補償は、サブサンプルの正確な運動ベクトルが使用されているときに参照ピクチャメモリ（５５７）からフェッチされるようなサンプル値の補間、運動ベクトル予測メカニズム等を含むこともできる。

アグリゲータ（５５５）の出力サンプルは、ループフィルタユニット（５５６）内の様々なループフィルタリング技法を受けることができる。ビデオ圧縮技術は、（コーディングされたビデオビットストリームとも呼ばれる）コーディングされたビデオシーケンスに含まれるパラメータによって制御され、パーサ（５２０）からのシンボル（５２１）としてループフィルタユニット（５５６）に利用可能にされるが、コーディングされたピクチャまたはコーディングされたビデオシーケンスの（復号化順において）以前の部分の復号化の間に得られるメタ情報に応答することもできる、ならびに以前に再構成され且つループフィルタリングされたサンプル値に応答することもできる、インループフィルタ(ループ内フィルタ)(in-loop filter)技術を含むことができる。

ループフィルタユニット（５５６）の出力は、レンダリングデバイスに出力されることができる、ならびに将来のインターピクチャ予測における使用のために参照ピクチャメモリ（５５７）に格納されることができる、サンプルストリームであることができる。

特定のコーディングされたピクチャは、ひとたび完全に再構成されると、将来の予測のための参照ピクチャとして使用されることができる。例えば、ひとたび現在のピクチャに対応するコーディングされたピクチャが完全に再構成され、コーディングされたピクチャが（例えば、パーサ（５２０）によって）参照ピクチャとして識別されると、現在のピクチャバッファ（５５８）は、参照ピクチャメモリ（５５７）の一部となることができ、新しい現在のピクチャバッファは、後続のコーディングされたピクチャの再構成を開始する前に再割当てされることができる。

ビデオデコーダ（５１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような、標準中の所定のビデオ圧縮技術に従って、復号化動作を行うことある。コーディングされたビデオシーケンスは、コーディングされたビデオシーケンスが、ビデオ圧縮技術または標準の構文およびビデオ圧縮技術または標準に文書化されるようなプロファイルの両方に従うという意味で、使用されているビデオ圧縮技術または標準によって指定される構文に適合することがある。具体的には、プロファイルは、特定のツールを、そのプロファイルの下での使用のために利用可能な唯一のツールとして、ビデオ圧縮技術または標準において使用可能な全てのツールから選択することができる。コンプライアンスのために同様に必要なことは、コーディングされたビデオシーケンスの複雑さが、ビデオ圧縮技術または標準のレベルによって定義されるような境界内にあることであり得る。幾つかの場合には、レベルが、最大ピクチャサイズ、最大フレームレート、（例えば、毎秒当たりメガサンプルで測定される）最大再構成サンプルレート、最大参照ピクチャサイズ等を制限する。レベルによって設定される制限値は、幾つ感お場合には、仮想参照デコーダ（ＨＲＤ：Hypothetical Reference Decoder）仕様およびコーディングされたビデオシーケンスで信号伝達されるＨＲＤバッファ管理のためのメタデータを通じてさらに制限されることができる。

図６は、本開示の一実施形態によるビデオエンコーダ（６０３）のブロック図を示している。ビデオエンコーダ（６０３）は、ポイントクラウドを圧縮するＶ－ＰＣＣエンコーダ（３００）で使用されることができる。一例において、ビデオ圧縮モジュール（３２２）および（３２３）、ならびにビデオ圧縮モジュール（３３２）は、エンコーダ（６０３）と同様に構成される。

ビデオエンコーダ（６０３）は、パディングされた幾何学的形状画像、パディングされたテクスチャ画像等のような画像を受信し、圧縮された画像を生成することがある。

一実施形態によれば、ビデオエンコーダ（６０３）は、ソースビデオシーケンスのピクチャ（画像）を、リアルタイムで、或いはアプリケーションによって要求されるような任意の他の時間制約下で、コーディングされたビデオシーケンス（圧縮された画像）に圧縮することができる。適切なコーディング速度を実現することは、コントローラ（６５０）の１つの機能である。幾つかの実施形態において、コントローラ（６５０）は、以下に記載されるような他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。カップリングは、明瞭性のために示されていない。コントローラ（６５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化器、レート－歪み最適化技術のラムダ値、．．．）、ピクチャサイズ、ピクチャのグループ（ＧＯＰ）レイアウト、最大運動ベクトル検索範囲等を含むことができる。コントローラ（６５０）は、特定のシステム設計のために最適化されたビデオエンコーダ（６０３）に関連する他の適切な機能を有するように構成されてよい。

幾つかの実施形態において、ビデオエンコーダ（６０３）は、コーディングループで作動するように構成される。過剰に単純化された記述として、一例において、コーディングループは、（例えば、コーディングされるべき入力ピクチャおよび参照ピクチャに基づいて、シンボルストリームのような、シンボルを生成することに関与する）ソースコーダ（６３０）と、ビデオエンコーダ（６０３）に埋め込まれる（ローカル）デコーダ（６３３）とを含むことができる。デコーダ（６３３）は、シンボルを再構成して、（リモート）デコーダも生成するのと同様の方法でサンプルデータを生成する（何故ならば、シンボルとコーディングされたビデオビットストリームとの間のあらゆる圧縮は、開示の主題において考慮されるビデオ圧縮技術において不損失であるからである）。再構成されたサンプルストリーム（サンプルデータ）は、参照ピクチャメモリ（６３４）に入力される。シンボルストリームの復号化は、デコーダ場所（ローカルまたはリモート）と無関係なビット正確な結果をもたらすので、参照ピクチャメモリ（６３４）中のコンテンツも、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分は、デコーダが復号化の間に予測を使用するときに「見る」のとまったく同じサンプル値を、参照ピクチャサンプルとして「見る」。参照ピクチャ同期性のこの基本原理（および、例えば、チャネルエラーの故に同期性を維持することができない場合に結果として生じるドリフト）は、幾つかの関連技術においても同様に使用される。

「ローカル」デコーダ（６３３）の動作は、図５に関連してすでに上述したビデオデコーダ（５１０）のような、「リモート」デコーダと同じであることができる。しかしながら、図５も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（６４５）およびパーサ（５２０）によるコーディングされたビデオシーケンスへのシンボルの符号化／復号化が不損失であることができるので、パーサ（５２０）を含むビデオデコーダ（５１０）のエントロピー復号化部分は、ローカルデコーダ（６３３）では完全に実装されないことがある。

この時点で行うことができる観察は、デコーダ内に存在する構文解析／エントロピー復号化を除く任意のデコーダ技術も、対応するエンコーダ内に実質的に同一の機能的形態で存在する必要があることである。この理由のために、開示の主題は、デコーダ動作に焦点を当てる。エンコーダ技術の記述は、省略されることができる。何故ならば、それらは、包括的に記述されるデコーダ技術の逆であるからである。特定のエリアにおいてのみ、より詳細な記述が必要とされ、以下に提供される。

動作中、幾つかの例において、ソースコーダ（６３０）は、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の以前にコーディングされたピクチャを参照して入力ピクチャを予測的にコーディングする運動補償された予測コーディングを行うことがある。このようにして、コーディングエンジン（６３２）は、入力ピクチャのピクセルブロックと、入力ピクチャに対する予測参照として選択されることがある参照ピクチャのピクセルブロックとの間の差を、コーディングする。

ローカルビデオデコーダ（６３３）は、ソースコーダ（６３０）によって生成されるシンボルに基づいて、参照ピクチャとして指定されることがあるピクチャのコーディングされたビデオデータを復号化することができる。コーディングエンジン（６３２）の動作は、有利には、損失プロセスであることがある。コーディングされたビデオデータが（図６に図示されていない）ビデオデコーダで復号化されることがあるとき、再構成されたビデオシーケンスは、典型的には、幾つかのエラーを伴うソースビデオシーケンスのレプリカであることがある。ローカルビデオデコーダ（６３３）は、参照ピクチャ上でビデオデコーダによって実行されることがあり、再構成された参照ピクチャを参照ピクチャキャッシュ（６３４）に格納させることがある、復号化処理を複製する。このようにして、ビデオエンコーダ（６０３）は、（送信エラーのない）遠端ビデオデコーダによって得られる再構成された参照ピクチャとして共通のコンテンツを有する再構成された参照ピクチャのコピーをローカルに格納することがある。

予測子(predictor)（６３５）は、コーディングエンジン（６３２）について予測検索を行うことがある。すなわち、コーディングされるべき新しいピクチャについて、予測子（６３５）は、新しいピクチャについての適切な予測参照として役立つことがある、（候補参照ピクセルブロックとしての）サンプルデータ、または参照ピクチャ運動ベクトル、ブロック形状等のような、特定のメタデータのために、参照ピクチャメモリ（６３４）を検索することがある。予測子（６３５）は、サンプルブロック対ピクセルブロックベースで作動して、適切な予測参照を見出すことがある。幾つかの場合には、予測子（６３５）によって得られる検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（６３４）に格納された複数の参照ピクチャから引き出された予測参照を有することがある。

コントローラ（６５０）は、例えば、ビデオデータをコーディングするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（６３０）のコーディング動作を管理することがある。

全ての前述の機能ユニットの出力は、エントロピーコーダ（６４５）においてエントロピーコーディングを受けることがある。エントロピーコーダ（６４５）は、ハフマンコーディング、可変長コーディング、算術コーディング等のような技術に従って、シンボルを不損失圧縮することによって、様々な機能ユニットによって生成されるシンボルをコーディングされたビデオシーケンスに変換する。

コントローラ（６５０）は、ビデオエンコーダ（６０３）の動作を管理することがある。コーディングの間に、コントローラ（６５０）は、各々のコーディングされたピクチャに、特定のコーディングされたピクチャタイプを割り当てることがあり、それは、それぞれのピクチャに適用されることがあるコーディング技術に影響を及ぼすことがある。例えば、ピクチャは、しばしば、以下のピクチャタイプのうちの１つとして割り当てられることがある。

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の如何なる他のピクチャも使用せずにコーディングされることがあり且つ復号化されることがあるものであってよい。幾つかのビデオコーデックは、例えば、独立デコーダリフレッシュ(Independent Decoder Refresh)（「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャのそれらの変形、ならびにそれらのそれぞれの用途および構成を知っている。

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために、最大で１つの運動ベクトルおよび参照インデックスを使用して、イントラ予測またはインター予測を使用してコーディングされることがあり且つ復号化されることがあるものであってよい。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために、最大で２つの運動ベクトルおよび参照インデックスを使用して、イントラ予測またはインター予測を使用してコーディングされることがあり且つ復号化されることがあるものであってよい。同様に、複数の予測ピクチャは、単一のブロックの再構成のために、２つよりも多くの参照ピクチャおよび関連するメタデータを使用することができる。

ソース画像は、一般に、複数のサンプルブロック（例えば、各々４×４、８×８、４×８、または１６×１６サンプルのブロック）に空間的に細分されることがあり、ブロック毎ベースでコーディングされることがある。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割当によって決定されるような他の（すでにコーディングされた）ブロックを参照して予測的にコーディングされてよい。例えば、Ｉピクチャのブロックは、非予測的にコーディングされてよく、或いは、それらは、同じピクチャのすでにコーディングされたブロック（空間予測またはイントラ予測）を参照して予測的にコーディングされてよい。Ｐピクチャのピクセルブロックは、１つの以前にコーディングされた参照ピクチャを参照して、空間的予測を介して或いは時間的予測を介して、予測的にコーディングされてよい。Ｂピクチャのブロックは、１つまたは２つの以前にコーディングされた参照ピクチャを参照して、空間的予測を介して或いは時間的予測を介して、予測的にコーディングされてよい。

ビデオエンコーダ（６０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような、所定のビデオコーディング技術または標準に従ってコーディング動作を行ってよい。その動作において、ビデオエンコーダ（６０３）は、入力ビデオシーケンスにおける時間的および空間的冗長性を利用する予測的コーディング動作を含む、様々な圧縮動作を行ってよい。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術または標準によって指定される構文に適合することがある。

ビデオは、時間シーケンスにおける複数のソースピクチャ（画像）の形態にあることがある。（しばしばイントラ予測と略される）イントラピクチャ予測は、所与のピクチャにおける空間的相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的なまたは他の）相関を利用する。一例では、現在のピクチャと呼ばれる、符号化／復号化の下にある特定のピクチャは、ブロックに区分される。現在のピクチャ内のブロックが、ビデオ内の以前にコーディングされ且つ依然としてバッファに入れられた参照ピクチャ内の参照ブロックに類似するとき、現在のピクチャ内のブロックは、運動ベクトルと呼ばれるベクトルによってコーディングされることができる。運動ベクトルは、参照ピクチャ内の参照ブロックを指し、複数の参照ピクチャが使用されている場合には、参照ピクチャを識別する第３の寸法を有することができる。

幾つかの実施形態において、双予測技術は、インターピクチャ予測において使用されることができる。双予測技術によれば、ビデオ内の現在のピクチャに対して復号化順序において両方とも先行する（しかしながら、表示順序においては、それぞれ過去および将来であることがある）第１の参照ピクチャおよび第２の参照ピクチャのような、２つの参照ピクチャが使用される。現在のピクチャ内のブロックは、第１の参照ピクチャ内の第１の参照ブロックを指す第１の運動ベクトルと、第２の参照ピクチャ内の第２の参照ブロックを指す第２の運動ベクトルとによって、コーディングされることができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせによって予測されることができる。

さらに、コーディング効率を向上させるために、インターピクチャ予測にマージモード技法を使用することができる。

本開示の幾つかの実施形態によれば、インターピクチャ予測およびイントラピクチャ予測のような予測は、ブロックの単位で行われる。例えば、ＨＥＶＣ標準によれば、ビデオピクチャのシーケンス中のピクチャは、圧縮のためにコーディングツリー単位（ＣＴＵ：coding tree units）に分割され、ピクチャ内のＣＴＵは、６４×６４ピクセル、３２×３２ピクセル、または１６×１６ピクセルのような、同じサイズを有する。一般に、ＣＴＵは、１つのルーマ(輝度)ＣＴＢおよび２つのクロマ(彩度)ＣＴＢである、３つのコーディングツリーブロック（ＣＴＢ：coding tree blocks）を含む。各ＣＴＵは、１つまたは複数のコーディング単位（ＣＵ：coding units）に再帰的に４分木分割されることができる。例えば、６４×６４ピクセルのＣＴＵは、６４×６４ピクセルの１つのＣＵ、３２×３２ピクセルの４つのＣＵ、または１６×１６ピクセルの１６個のＣＵに分割されることができる。一例において各ＣＵは、インター予測タイプまたはイントラ予測タイプのような、ＣＵのための予測タイプを決定するために分析される。ＣＵは、時間的および／または空間的な予測可能性に依存して、１つ以上の予測単位（ＰＵ：predication units）に分割される。一般に、各ＰＵは、１つのルーマ予測ブロック（ＰＢ：predication block）と、２つのクロマＰＢとを含む。一実施形態では、コーディング（符号化／復号化）における予測動作は、予測ブロックのユニットにおいて行われる。ルーマ予測ブロックを予測ブロックの一例として用いると、予測ブロックは、８×８ピクセル、１６×１６ピクセル、８×１６ピクセル、１６×８ピクセル等のような、ピクセルについての値（例えば、ルーマ値）の行列を含む。

図７は、幾つかの実施形態によるＧ－ＰＰＣエンコーダ（７００）のブロック図を示している。エンコーダ（７００）は、ポイントクラウドデータを受信し、ポイントクラウドデータを圧縮して、圧縮されたポイントクラウドデータを運ぶビットストリームを生成する、ように構成されることができる。一実施形態において、エンコーダ（７００）は、位置量子化モジュール（７１０）、重複ポイント除去モジュール（７１２）、八分木コーディングモジュール（７３０）、属性転送モジュール（７２０）、詳細レベル（ＬＯＤ：level of detail）生成モジュール（７４０）、属性予測モジュール（７５０）、剰余量子化モジュール（７６０）、算術コーディングモジュール（７７０）、逆剰余量子化モジュール（７８０）、加算モジュール（７８１）、および再構成された属性値を格納するメモリ（７９０）を含むことができる。

図示のように、入力ポイントクラウド（７０１）は、エンコーダ（７００）で受信されることができる。ポイントクラウド（７０１）の位置（例えば、３Ｄ座標）は、量子化モジュール（７１０）に提供される。量子化モジュール（７１０）は、座標を量子化して、量子化された位置を生成するように構成される。重複ポイント除去モジュール（７１２）は、量子化された位置を受信し、フィルタ処理を行って、重複ポイントを識別し且つ除去する、ように構成される。八分木コーディングモジュール（７３０）は、重複ポイント除去モジュール（７１２）からフィルタリングされた位置を受信し、八分木ベースの符号化プロセスを行って、３Ｄグリッドのボクセルを記述する占有コードのシーケンスを生成する、ように構成される。占有コードは、算術コーディングモジュール（７７０）に提供される。

属性転送モジュール（７２０）は、入力ポイントクラウドの属性を受信し、属性転送プロセスを行って、複数の属性値がそれぞれのボクセルと関連付けられるときに各ボクセルについての属性値を決定する、ように構成される。属性転送プロセスは、八分木コーディングモジュール（７３０）から出力された再順序付けポイントに対して行われることができる。転送動作後の属性は、属性予測モジュール（７５０）に提供される。ＬＯＤ生成モジュール（７４０）は、八分木コーディングモジュール（７３０）から出力された再順序付けポイントに対して作動し、ポイントを異なるＬＯＤに再編成する、ように構成される。ＬＯＤ情報は、属性予測モジュール（７５０）に供給される。

属性予測モジュール（７５０）は、ＬＯＤ生成モジュール（７４０）からのＬＯＤ情報によって示されるＬＯＤベースの順序に従ってポイントを処理する。属性予測モジュール（７５０）は、メモリ（７９０）に格納された現在のポイントの隣接するポイントのセットの再構成された属性に基づいて、現在のポイントのための属性予測を生成する。引き続き、予測剰余(predication residuals)が、属性転送モジュール（７２０）から受信した元の属性値とローカルに生成された属性予測とに基づいて得られることができる。候補インデックスがそれぞれの属性予測プロセスにおいて使用されるとき、選択された予測候補に対応するインデックスが、算術コーディングモジュール（７７０）に提供されてよい。

剰余量子化モジュール（７６０）は、属性予測モジュール（７５０）から予測剰余を受信し、量子化を行って量子化された剰余を生成する、ように構成される。量子化された剰余は、算術コーディングモジュール（７７０）に提供される。

逆剰余量子化モジュール（７８０）は、剰余量子化モジュール（７６０）から量子化された剰余を受信し、剰余量子化モジュール（７６０）で行われる量子化演算の逆(inverse)を行うことによって、再構成された予測剰余を生成する、ように構成される。加算モジュール（７８１）は、逆剰余量子化モジュール（７８０）から再構成された予測剰余を受信し、属性予測モジュール（７５０）からそれぞれの属性予測を受信する、ように構成される。再構成された予測剰余と属性予測とを組み合わせることによって、再構成された属性値が生成され、メモリ（７９０）に格納される。

算術コーディングモジュール（７７０）は、占有コード、（使用されるならば）候補インデックス、（生成されるならば）量子化された剰余、および他の情報を受信し、エントロピーコーディングを行って、受信した値または情報をさらに圧縮する、ように構成される。その結果、圧縮された情報を運ぶ圧縮されたビットストリーム（７０２）が生成されることができる。ビットストリーム（７０２）は、圧縮されたビットストリームを復号化するデコーダに送信されるか或いは他の方法で提供されてよく、或いは記憶デバイスに格納されてよい。

図８は、一実施形態によるＧ－ＰＣＣデコーダ（８００）のブロック図を示している。デコーダ（８００）は、圧縮されたビットストリームを受信し、ポイントクラウドデータ解凍を行って、復号化されたポイントクラウドデータを生成するためにビットストリームを解凍する、ように構成されることができる。一実施形態において、デコーダ（８００）は、算術復号化モジュール（８１０）、逆剰余量子化モジュール（８２０）、八分木復号化モジュール（８３０）、ＬＯＤ生成モジュール（８４０）、属性予測モジュール（８５０）、および再構成された属性値を格納するメモリ（８６０）を含むことができる。

図示のように、圧縮されたビットストリーム（８０１）が、算術復号化モジュール（８１０）で受信されることができる。算術復号化モジュール（８１０）は、圧縮されたビットストリーム（８０１）を復号化して、ポイントクラウドの（生成されるならば）量子化された剰余および占有コードを得るように構成される。八分木復号化モジュール（８３０）は、占有コードに従ってポイントクラウド内のポイントの再構成された位置を決定するように構成される。ＬＯＤ生成モジュール（８４０）は、再構成された位置に基づいてポイントを異なるＬＯＤに再編成し、ＬＯＤベースの順序を決定する、ように構成される。逆剰余量子化モジュール（８２０）は、算術復号化モジュール（８１０）から受信する量子化された剰余に基づいて再構成された剰余を生成するように構成される。

属性予測モジュール（８５０）は、属性予測プロセスを行って、ＬＯＤベースの順序に従ってポイントについての属性予測を決定するように構成される。例えば、現在のポイントの属性予測は、メモリ（８６０）に格納された現在のポイントの隣接するポイントの再構成された属性値に基づいて決定されることができる。幾つかの例において、属性予測は、現在のポイントについての再構成された属性を生成するために、それぞれの再構成された剰余と組み合わされることができる。

八分木復号化モジュール（８３０）から生成される再構成された位置と共に属性予測モジュール（８５０）から生成される再構成された属性のシーケンスが、一例ではデコーダ（８００）から出力される復号化されたポイントクラウド（８０２）に対応する。加えて、再構成された属性も、メモリ（８６０）に格納され、引き続き、後続のポイントについての属性予測を導出するために使用されることができる。

様々な実施形態において、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実装されることができる。例えば、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）は、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）等のような、ソフトウェアを用いて或いは用いないで作動する１つ以上の集積回路（ＩＣ）のような処理回路構成で実装されることができる。別の例において、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）は、不揮発性（または非一時的）コンピュータ読取可能記憶媒体に格納される命令を含むソフトウェアまたはファームウェアとして実装されることができる。命令は、１つ以上のプロセッサのような処理回路構成によって実行されるときに、処理回路構成に、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）の機能を実行させる。

本明細書に開示する属性予測技法を実装するように構成された属性予測モジュール（７５０）および（８５０）は、図７および図８に示すものと類似または異なる構造を有することがある他のデコーダまたはエンコーダに含まれ得ることに留意されたい。加えて、エンコーダ（７００）およびデコーダ（８００）は、様々な例において、同じデバイスまたは別個のデバイスに含まれることができる。

開示の態様は、Ｇ－ＰＣＣにおける使用のための技法を提供する。具体的には、Ｇ－ＰＣＣのノードベースの幾何学的形状および／または属性コーディング技法が、以下の記述に記載される。

本開示の幾つかの態様によれば、幾何学的形状情報、および色、反射率等のような、ポイントクラウドの関連する属性が、（例えば、ＭＰＥＧＧ－ＰＣＣＴｅｓｔＭｏｄｅｌ１３（ＴＭＣ１３）モデルにおいて）別個に圧縮されることができる。ポイントクラウド内のポイントの３Ｄ座標を含む、ポイントクラウドの幾何学的情報は、パーティションの占有情報を持つ八分木パーティション、四分木パーティション、およびバイナリパーティションのような、パーティションの占有情報を持つパーティションによってコーディングされることができる。幾何学的形状情報がコーディングされた後に、属性は、例えば、予測、リフティング(lifting)および領域適応階層変換(region adaptive hierarchical transform)技法を使用して、再構成された幾何学的形状に基づいて圧縮されることができる。

幾何学的形状コーディングのために、幾つかの技法を使用することができる。幾つかの技法は、木ベースの幾何学的形状コーディング、予測木ベースの幾何学的形状コーディング、およびトリスープ(trisoup)ベースの幾何学的形状コーディングを含むことができる。木ベースの幾何学的形状コーディング、予測木ベースの幾何学的形状コーディング、およびトリスープベースの幾何学的形状コーディングをそれぞれ記載する。

本開示の一態様によれば、三次元空間は、八分木パーティション、四分木パーティション、二分木パーティション等のような、木パーティションを使用して区切られることができる。八分木パーティションを例として使用すると、八分木は、二次元空間内の四分木の三次元アナログである。八分木パーティション技法は、三次元空間を８つの八分円(オクタント)に再帰的に細分するパーティション技法を指し、八分木構造は、パーティションを表すツリー構造(木構造)を指す。一例において、八分木構造内の各ノードは、三次元空間に対応し、ノードは、終端ノード（他のパーティションはなく、幾つかの例では、リーフノードとも呼ばれる）または更なるパーティションを持つノードであることができる。ノードでの八分木パーティションは、ノードによって表される三次元空間を８つの八分円に区切ることができる。幾つかの例において、特定のノードのパーティションに対応するノードは、特定のノードの子ノードと呼ばれることができる。

図９は、本開示の幾つかの実施形態による八分木パーティション技法に基づく（ノードに対応する）３Ｄキューブ（９００）のパーティションを図示する図を示している。パーティションは、図９に示すように、３Ｄキューブ（９００）を８つのより小さい等しいサイズのキューブ０～７に分割することができる。図９において、３Ｄキューブ（９００）のｘ次元、ｙ次元、およびｚ次元は、それぞれ半分に分割され、分割は、同じサイズを持つ８つのサブキューブをもたらすことができる。

（例えば、ＴＭＣ１３における）八分木パーティション技法は、元の３Ｄ空間をより小さなユニットに再帰的に分割することができ、あらゆるサブ空間の占有情報は、幾何学的形状位置を表すために符号化されることができる。

（例えば、ＴＭＣ１３における）幾つかの実施態様では、八分木幾何学的形状コーデックが使用される。八分木幾何学的形状コーデックは、幾何学的形状符号化を行うことができる。幾つかの例において、幾何学的形状符号化は、立方体ボックス(cubical box)上で行われる。例えば、立方体ボックスは、２つのポイント（０，０，０）および（２^Ｍ－１，２^Ｍ－１，２^Ｍ－１）によって定義される、軸整列させられた境界ボックス(バウンディングボックス)Ｂであることができ、ここで、２^Ｍ－１は、境界ボックスＢのサイズを定義し、Ｍは、ビットストリームにおいて指定されることができる。

次に、八分木構造が、立方体ボックスを再帰的に細分することによって構築される。例えば、２つのポイント（０，０，０）および（２^Ｍ－１，２^Ｍ－１，２^Ｍ－１）によって定義された立方体ボックスは、８つのサブ立方体ボックス(sub cubical boxes)に分割され、次に、占有コードと呼ばれる８ビットのコードが生成される。占有コードの各ビットは、サブ立方体ボックスと関連付けられ、ビットの値は、関連付けられたサブ立方体ボックスがポイントクラウドの任意のポイントを含むかどうかを示すために使用される。例えば、ビットの値１は、ビットと関連付けられるサブ立方体ボックスがポイントクラウドの１つ以上のポイントを含むことを示し、ビットの値０は、ビットと関連付けられたサブ立方体ボックスがポイントクラウドのポイントを含まないことを示す。

さらに、空のサブ立方体ボックス（例えば、サブ立方体ボックスと関連付けられるビットの値は０である）について、それ以上の分割は、サブ立方体ボックスに適用されない。サブ立方体ボックスがポイントクラウドの１つ以上のポイントを有するとき（例えば、サブ立方体ボックスと関連付けられるビットの値が１であるとき）、サブ立方体ボックスは、８つのより小さなサブ立方体ボックスに更に分割され、占有コードが、より小さなサブ立方体ボックスの占有を示すためにサブ立方体ボックスについて生成されることができる。幾つかの例において、細分動作は、サブ立方体ボックスのサイズが、１であるサイズのような所定の閾値に等しくなるまで、空でないサブ立方体ボックス上で繰り返し行われることができる。幾つかの例において、１のサイズを持つサブ立方体ボックスは、ボクセルと呼ばれ、ボクセルよりも大きいサイズを持つサブ立方体ボックスは、非ボクセルと呼ばれることができる。

図１０は、本開示の幾つかの実施形態による八分木パーティション（１０１０）および八分木パーティション（１０１０）に対応する八分木構造（１０２０）の一例を示している。図１０は、八分木パーティション（１０１０）における２つのレベルのパーティションを示している。八分木構造（１０２０）は、八分木パーティション（１０１０）についての立方体ボックスに対応するノード（Ｎ０）を含む。ノードＮ０は、八分木構造（１０２０）の深さ０にある。第１のレベルのパーティションで、立方体ボックスは、図９に示す番号付け技法に従って０～７の番号が付されている８つのサブ立方体ボックスに分割されている。ノードＮ０のパーティションについての占有コードは、二進数で「１００００００１」であり、それは、ノードＮ０－０によって表される第１のサブ立方体ボックスおよびノードＮ０－７によって表される第８のサブ立方体ボックスがポイントクラウド内のポイントを含み、他のサブ立方体ボックスが空であることを示す。ノードＮ０－０～Ｎ０－７は、八分木構造（１０２０）の深さ１にある。

次に、第２レベルのパーティションで、（ノードＮ０－０によって表される）第１のサブ立方体ボックスおよび（ノードＮ０－７によって表される）第８のサブ立方体ボックスは、それぞれ、８つの八分円に更に細分される。例えば、（ノードＮ０－０によって表される）第１のサブ立方体ボックスは、図９に示す番号付け技法に従って０－７の番号が付される８つのより小さなサブ立方体ボックスに分割される。ノードＮ０－０のパーティションについての占有コードは、二進数で「０００１１０００」であり、それは（ノードＮ０－０－３によって表される）第４のより小さいサブ立方体ボックスを示し、（ノードＮ０－０－４によって表される）第５のより小さいサブ立方体ボックスは、ポイントクラウド内のポイントを含み、他のより小さいサブ立方体ボックスは、空である。ノードＮ０－０－０～Ｎ０－０－７は、八分木構造（１０２０）の深さ２にある。第２のレベルでは、（ノードＮ０－７によって表される）第８のサブ立方体ボックスは、図１０に示すように、８つのより小さいサブ立方体ボックスに同様に区切られる。ノードＮ０－７－０～Ｎ０－７－７は、八分木構造（１０２０）の深さ２にある。

図１０の例において、空でない立方体空間（例えば、立方体ボックス、サブ立方体ボックス、より小さいサブ立方体ボックス等）に対応するノードは、灰色で色付けられ、陰影付きノードと呼ばれる。空の立方体空間（例えば、立方体ボックス、サブ立方体ボックス、より小さいサブ立方体ボックス等）に対応するノードは、白色で色付けられ、ブランクノードと呼ばれることができる。

八分木パーティションが上記記述において記載されているが、一般に、木ベースの幾何学的形状コーディング技法は、四分木パーティションまたは二分木パーティションのような、他のパーティションを使用して、ポイントクラウドを区切ることができる。

より一般的には、ポイントクラウドについて、ポイントクラウドの境界ボックスＢは、全ての方向において同じサイズを持つように制約されず、その代わりに、境界ボックスＢは、３Ｄシーンまたはオブジェクトの形状により良く適合するように任意のサイズの長方形の立方形であることができる。幾つかの例において、境界ボックスＢのサイズは、
（外０００１）

のような、２の冪乗として表されることができる。一例において、ｄ_ｘ，ｄ_ｙ，ｄ_ｚは、等しくない。

ポイントクラウドの境界ボックスＢを区切るためには、上記記述の八分木パーティションに加えて、以下の記述中の四分木パーティションと二分木パーティションを使用することができる。

図１１は、幾つかの例における３つの四分木パーティションを示している。四分木パーティションについて、境界ボックスＢの３次元（例えば、ｘ次元、ｙ次元、ｚ次元）のうちの２つの次元を半分に分割することができ、四分木パーティションは、同じサイズを持つ４つのサブボックスをもたらすことができる。

図１１の例では、境界ボックス（１１１０）が、ｘ次元およびｙ次元における四分木パーティションによって分割され、四分木パーティションの結果は、０、２、４、および６とラベル付けされる同じサイズを持つ４つのサブボックスによって示されている。

さらに、図１１の例では、境界ボックス（１１２０）が、ｘ次元およびｚ次元における四分木パーティションによって分割され、四分木パーティションの結果は、０、１、４、および５とラベル付けされる同じサイズを持つ４つのサブボックスによって示されている。

さらに、図１１の例では、境界ボックス（１１３０）が、ｙ次元およびｚ次元において四分木パーティションによって分割され、四分木パーティションの結果は、０、１、２、および３としてラベル付けされる同じサイズを持つ４つのサブボックスによって示されている。

図１２は、幾つかの例における３つの二分木パーティションを示している。二分木パーティションについて、境界ボックスＢの３次元（例えば、ｘ次元、ｙ次元、およびｚ次元）のうちの１つの次元を半分に分割することができ、二分木パーティションは、同じサイズを持つ２つのサブボックスをもたらすことができる。

図１２の例において、境界ボックス（１２１０）は、ｘ次元において二分木パーティションによって分割され、二分木パーティションの結果は、０および４とラベル付けされた同じサイズを持つ２つのサブボックスによって示されている。

さらに、図１２の例では、境界ボックス（１２２０）が、ｙ次元において二分木パーティションによって分割され、二分木パーティションの結果は、０および２とラベル付けされた同じサイズを持つ２つのサブボックスによって示されている。

さらに、図１２の例では、境界ボックス（１２３０）が、ｚ次元において二分木パーティションによって分割され、二分木パーティションの結果は、０および１とラベル付けされた同じサイズを持つ２つのサブボックスによって示されている。

従って、ポイントクラウドは、八分木パーティション、四分木パーティション、および二分木パーティションの適切な混合を有する一般的なツリー構造によって表されることができる。ツリー構造を横断するために、幾つかの例（例えば、ＴＭＣ１３モデルのバージョン）では、幅優先(breadth-first)アプローチが採用される。幾つかの他の例では、深さ優先(depth-first)アプローチを使用することもできる。

幾つかの関連した例（例えば、ＴＭＣ１３のバージョン）では、占有コードをコーディングするために、ツリー構造は、幅優先順序において横断される。幅優先順序によれば、あるレベルにあるツリーノード（例えば、ツリー構造のノード）は、上方レベルにあるツリーノードの全てが訪問された後に訪問されることができる。一実装例では、先入れ先出し（ＦＩＦＯ：first-in-first-out）データ構造を使用することができる。

図１３は、幅優先コーディング順序を図示する八分木構造（１３００）の図を示している。八分木構造（１３００）における陰影付きノードは、空でなく、ポイントクラウド内の１つ以上のポイントによって占められている、立方体空間に対応するノードである。陰影付きノードについての占有コードは、図１３に示す０～８までの幅優先コーディング順序でコーディングされることができる。幅優先コーディング順序において、八分木ノードは、レベル毎に訪問される。本開示の一態様によれば、幅優先コーディング順序自体は、並列処理に適さない。何故ならば、現在のレベルは、上方レベルがコーディングされるのを待たなければならないからである。

幾つかの例では、ハイブリッドコーディング順序が、幅優先コーディング順序の代わりに、深さ優先コーディング順序を使用してコーディングされる、少なくとも１つのレベルを含む。よって、幾つかの実施形態では、深さ優先コーディング順序を持つレベルのノードおよびそのノードの子孫ノード(descendant nodes)が、ツリー構造のサブツリー構造を形成することができる。深さ優先コーディング順序を持つレベルが、空でない立方体空間にそれぞれ対応する複数のノードをとき、複数のノードおよびそれらの子孫ノードは、複数のサブツリー構造を形成することができる。複数のサブツリー構造は、幾つかの実施形態では並列にコーディングされることができる。

図１４は、深さ優先コーディング順序を図示する八分木構造（１４００）の図を示している。八分木構造（１４００）における陰影付きノードは、空でない立方体空間に対応するノードである。八分木構造（１４００）は、八分木構造（１３００）と同じポイントクラウドの占有幾何学的形状に対応することができる。陰影付きノードについての占有コードは、図１４に示す０～８までの深さ優先コーディング順序でコーディングされることができる。

図１４の例において、ノード「０」は、ＰＤ０のような任意の適切なパーティション深さにあることができ、ノード「０」の子ノードは、パーティション深さＰＤ０＋１にあり、ノード「０」の孫ノードは、パーティション深さＰＤ０＋２にある。図１４の例において、パーティション深さＰＤ０＋１でのノードは、深さ優先コーディング順序でコーディングされることができる。パーティション深さＰＤ０＋１でのノードは、空でない空間に対応する２つのノードを含む。２つのノードおよびそれらのそれぞれの子孫ノードは、第１のサブ八分木構造（１４１０）および第２のサブ八分木構造（１４２０）を形成することができ、２つのノードは、２つの八分木構造のルートノードとそれぞれ呼ばれることができる。

図１４における深さ優先コーディング順序は、深さ優先コーディング順序の先行順序バージョン(preorder version)と呼ばれる。深さ優先コーディング順序の先行順序バージョンでは、各サブ八分木構造について、サブ八分木のルートノードは、サブ八分木構造の子ノードを訪問される前に最初に訪問される。さらに、最も深いノードが最初に訪問され、次に、親ノードの兄弟姉妹(siblings)に戻る。

図１４の例において、第１のサブ八分木構造（１４１０）および第２のサブ八分木構造（１４２０）は、幾つかの実装において並列処理でコーディングされることができる。例えば、ノード１およびノード５は、同時に訪問されることができる。幾つかの例では、再帰プログラミングまたはスタックデータ構造を使用して、深さ優先コーディング順序を実装することができる。

幾つかの実施形態において、ハイブリッドコーディング順序は、幅優先横断（コーディング）で始まり、幾つかのレベルの幅優先横断(traversing)の後に、深さ優先横断（コーディング）が可能にされることができる。

幾つかの例では、予測ツリーベースの幾何学的形状コーディングを使用することができる。予測ツリーベースの幾何学的形状コーディングは、スパニングツリー(spanning tree)のような予測ツリーがポイントクラウド内の全てのポイントに亘って構築されることができるときに使用されることができる。一例では、あるポイントの予測のために、全ての祖先を使用することができる。

図１５は、ウサギのポイントクラウド（１５００）に亘る(span)予測ツリー（１５１０）の一部分を示している。幾つかの例において、予測ツリー（１５１０）中のあるポイントの位置は、その親のポイントの位置から或いはその親およびその祖父母のポイントの位置から予測されることができる。

幾つかの例において、トリスープ(trisoup)ベースの幾何学的形状コーディングを使用することができる。トリスープベースの幾何学的形状コーディングアプローチは、オブジェクトの表面を一連の三角形メッシュとして表すことができる。一例において、トリスープベースの幾何学的形状コーディングアプローチは、高密度表面ポイントクラウドに適用される。トリスープベースの幾何学的形状コーディングを使用するデコーダが、再構成されたポイントクラウドの密度を保証するために、指定されたボクセル粒度でメッシュ表面からポイントクラウドを生成することができる。本開示の一態様によれば、トリスープベースの幾何学的形状コーディングは、元のポイントクラウドに歪みを導入し得るが、ビットストリームサイズの低減という利点を提供することがある。

属性コーディングのために、幾つかの技法を使用することができる。この技法は、予測ベースの属性コーディング、リフティングベースの属性コーディング、領域適応階層変換（ＲＡＨＴ）ベースの属性コーディング等を含む。予測ベースの属性コーディング、リフティングベースの属性コーディング、およびＲＡＨＴベースの属性コーディング等は、以下の記述においてそれぞれ記載される。

単純化のために、以下の説明では、１つのレベルの詳細（ＬｏＤ）を使用する。予測ベースの属性コーディングについて、(Ｐ_ｉ)_{ｉ＝１．．．Ｎ}が、ポイントクラウド内のポイントと関連付けられる位置のセットを示すとしよう。多次元データによって表される各位置について、１つの次元のモートンコード(Morton code)が、その位置と関連付けられると決定することができる。（Ｍ_ｉ）_{ｉ＝１．．．Ｎ}が、位置(Ｐ_ｉ)_{ｉ＝１．．．Ｎ}とそれぞれ関連付けられるモートンコードを示すとしよう。予測ベースの属性コーディングは、ソート(sorting)ステップを含み、コーディングステップが続く。ソートステップにおいて、ポイントクラウド内のポイントは、例えば、昇順において、関連付けられるモートンコードに従ってソートされる(sorted)。例えば、１が、ソートステップに従って順序付けられるポイントについてのインデックスのアレイを示すとしよう。

コーディングステップにおいて、エンコーダ／デコーダは、反復において１によって定義される順序に従ってポイントをそれぞれ圧縮／解凍することができる。各反復ｉで、ポイントＰ_ｉが、Ｉによって定義される順序に従って選択される。分析される順序における多数の以前のポイントまでの距離。例えば、ｓ（例えば、ｓ＝６４）は、分析される以前のポイントの数を示す。分析されるポイントに基づいて、Ｐｉのｋ個の（例えば、ｋ＝３）の最も近い隣接物(nearest neighbors)が、属性予測のために使用されるように選択される。具体的には、幾つかの例において、ポイントｉの属性
（外０００２）

は、ポイントｉに対する最も近い隣接物の距離に基づいて重み付けされる、ｋ個の最も近い隣接物
（外０００３）

の属性の線形補間プロセスを使用することによって予測されることができる。一例として、デコーダ側で、
（外０００４）

が、現在のポイントｉのｋ個の最も近い隣接物のセットを示し、
（外０００５）

が、近隣ポイントの復号化された／再構成された属性値を示し、
（外０００６）

が、現在のポイントｉまでの距離を示すとしよう。その場合、現在のポイントｉについての予測される属性値
（外０００７）

は、隣接物（隣接ポイント）の属性値と現在のポイントまでのそれらの距離とに基づいた距離ベースの加重平均(weighted average)計算に従って計算されることができる。例えば、現在のポイントｉについての予測される属性値
（外０００８）

は、式（１）に従って計算されることができる。

リフティングベースの属性コーディングのために、追加的なステップが予測ベースのコーディングに適用される。一例では、更新演算子の第１ステップおよび適応量子化の第２ステップと呼ばれる２つの追加的なステップが使用される。

図１６は、Ｇ－ＰＣＣのエンコーダ側でのリフティングベースの属性コーディングにおける直接／順変換アーキテクチャ（１６００）を使用する図を示している。幾つかの例では、予測(prediction)および更新(update)を容易にするために、直接／順変換アーキテクチャ（１６００）は、属性信号を分解するために、複数の予測／更新（Ｐ／Ｕ）分解ステージを含む。複数のＰ／Ｕ分解段階の各々では、以前の段階からの信号（近似信号）が、２つのセットの高相関(high-correlation)に分割される。一例として、Ｇ－ＰＣＣのリフティングベースの属性コーディングスキーム(方式)において、分割は、そのような高相関がレベル間で予期される詳細レベル（ＬｏＤ）構造を利用することによって行われ、各レベルは、不均一なポイントクラウドを構造化されたデータに組織化するために、最も近い隣接物検索によって構築される。段階（Ｎ）でのＰ／Ｕ分解段階は、詳細信号Ｄ（Ｎ）および近似信号Ｌ’（Ｎ）をもたらし、それは次の段階（例えば、段階（Ｎ－１））においてＤ（Ｎ－１）およびＬ’（Ｎ－１）にさらに分解される。分解は、ベース層近似信号Ｌ’（０）が一例において得られるまで、繰り返し適用される。結果的に、様々なレベルの細部からなる入力属性信号自体をコーディングする代わりに、詳細信号Ｄ（Ｎ），Ｄ（Ｎ－１），．．．，Ｄ（０）、およびベース層近似信号Ｌ’（０）が、リフティングベースの属性コーディングスキームにおいてコーディングされることができる。

Ｐ／Ｕ分解段階の適用は、Ｄ（Ｎ），．．．，Ｄ（０）の係数において疎なサブバンド(sparse sub-bands)をもたらすことができ、それによって、変換コーディング利得の利点を提供することができることに留意されたい。

図１７は、Ｇ－ＰＣＣのデコーダ側でのリフティングベースの属性コーディングにおける逆変換アーキテクチャ（１７００）を使用する図を示している。逆変換アーキテクチャ（１７００）は、属性信号を再構成するために、複数の予測／更新（Ｐ／Ｕ）マージ段階を含む。各Ｐ／Ｕマージ段階では、詳細信号がデコードされ、以前の段階からの近似信号とマージされて、次のＰ／Ｕマージ段階に提供するための新しい近似信号が生成される。

ＲＡＨＴベースの属性コーディングのために、適応階層変換を使用することができる。

図１８は、Ｇ－ＰＣＣのエンコーダ側において使用されることができるＲＡＨＴ順方向変換アーキテクチャ（１８１０）の図と、Ｇ－ＰＣＣのデコーダ側において使用されることができるＲＡＨＴ逆変換アーキテクチャ（１８２０）の図とを示している。図１８の例において、
（外０００９）

および
（外００１０）

であり、ｗ０は、入力係数Ｆ_{ｌ＋，２ｎ}の重みの表記である一方で、ｗ１は、Ｆ_{ｌ＋１，２ｎ＋１}と同じである。

本開示の一態様によれば、予測ベースの幾何学的形状コーディングおよび／または属性コーディング方法において、現在のポイントの幾何学的形状情報および／または属性情報の予測は、予測された隣接ポイントからの加重平均の計算に基づく。加重平均の計算における重み付け(weighting)は、通常、式（１）を使用するような、予測された隣接ポイントと現在のポイントとの間の距離に基づく。

本開示の一態様によれば、式（１）における計算は、浮動小数点演算(floating point operations)を含む。例えば、予測される隣接ポイントの属性値の重みは、予測される隣接ポイントから現在のポイントまでの距離の逆数(reciprocal)に基づいて計算される。近隣ポイントから現在のポイントまでの距離の逆数は、除算演算(division operation)を使用して計算されることができ、被除数(dividend)は、１であり、除数(divisor)は、予測される近隣ポイントと現在のポイントとの間の距離である。コンピュータ技術では、距離が１よりも大きいときに、整数除算演算は、０を出力することができる。一般に、浮動小数点除算演算は、比較的高い精度を得るために、予測される隣接ポイントと現在のポイントとの間の距離の逆数を計算するように使用される。

さらに、幾つかの例において、ポイントクラウド内のポイントの不規則な分布の故に、現在のポイントまでの隣接ポイントの距離の範囲は、有意に異なり得る。浮動小数点演算は、範囲と精度との間のトレードオフをサポートすることができ、式（１）によるような、距離ベースの加重平均計算を実装するために使用される。例えば、幾つかのコンピュータ技術における浮動小数点演算の実装において、（加算演算、減算演算、乗算演算、除算演算等のような）数学的演算における１つ以上のオペランド(operands)が、浮動小数点データタイプを宣言される。次に、浮動小数点演算を使用して数学的演算を行う。

一般に、浮動小数点演算は、ハードウェアのサポートを必要とすることがあり、ハードウェア実装には適さない。例えば、浮動小数点演算は、高速浮動小数点処理速度のために浮動小数点ユニット（ＦＰＵ：floating point units）によって実行される必要があることがある。しかしながら、埋め込みプロセッサのような、多くのプロセッサは、ＦＰＵのハードウェアサポートを持たないことがある。

本開示の態様は、距離ベースの加重平均を計算する際に浮動小数点演算の代わりに整数演算を使用する技法を提供する。幾つかの例において、距離ベースの加重平均法は、幾何学的形状コーディングにおいて使用される。幾つかの例において、距離ベースの加重平均方法は、属性コーディングにおいて使用される。

幾つかの例では、本開示において開示する技法を別々に使用することができることに留意されたい。幾つかの例では、２つ以上の技法を組み合わせて、幾つかの実装において使用することができる。

式（１）におけるδ_ｊおよびδ_ｔのような、距離ベースの加重平均方法において使用される距離は、デカルト座標系、球面座標系等のような、任意の座標系における任意の距離メトリック（例えば、Ｌ１ノルム距離、Ｌ２ノルム距離）であることができることに留意されたい。

幾つかの例では、現在のポイントｉについて、
（外００１１）

における最も近い隣接物は、現在のポイントｉの幾何学的形状情報および／または属性情報を予測する予測因子として決定される。

幾つかの例において、現在のポイントｉについて、現在のポイントｉの幾何学的情報および／または属性情報は、隣接ポイントについての等しい重みに基づいて、隣接ポイントの平均として予測されることができる。例えば、式（１）は、隣接ポイントについての等しい重みに基づいて式（２）に変換される。

ここで、
（外００１２）
は、現在のポイントｉのｋ個の最も近い隣接ポイントのセットを示し、ｋは、セット
（外００１３）
内の隣接ポイントの数を示す。現在のポイントｉについての予測属性値
（外００１４）

は、隣接ポイントの予測される属性の平均属性として計算されることができる。

式（２）は、現在のポイントまでの予測される隣接ポイント間の距離の逆数を計算しないことに留意されたい。式（２）による計算は、整数演算(integer operations)を使用して行われることができる。例えば、隣接ポイントの予測される属性値（
（外００１５）

）、隣接ポイント（ｋ）の数等のような、式（２）中のオペランドは、整数データタイプであると宣言される。予測される属性値の合計は、整数加算演算(integer add operation)によって行われることができる。一例において、丸め演算(rounding operation)は、端数切り捨て演算(rounding down operation)であり、式（２）は、式（３）に変換され、整数ｋによる予測される属性値の合計の除算演算は、整数除算演算によって行われることができる。
（外００１６）

は、整数に帰着する端数切り捨て演算を示す。

丸め演算が端数切り捨て演算ではないとき、式（２）は適宜調整されることができる。一例において、丸め演算は、最も近い整数演算への丸めであり、式（２）は、式（４）に変換されることができ、式（４）による計算は、整数演算によって行われることができる。

幾つかの実施形態において、重み計算は、浮動小数点演算の代わりに、整数乗算、整数除算等のような、整数演算を使用して行われることができるように、適切に変換されることができる。例えば、重み計算は、精度を高めるために、アップスケールされた(増大された)被除数で変換される。アップスケールされた被除数は、１よりも大きい絶対値を持つ整数である。幾つかの例において、δ_ｊに基づいて換算される重みＱ_ｊが、式（５）に従って計算されることができる。

ここで、ＭおよびＮは、正の整数である。一例において、Ｍ＝３２およびＮ＝δ_ｊ＞＞１である。アップスケールされた被除数は、式（５）の除算演算における精度を高めることができる。除算演算は、より精度の高い整数除算演算を使用して行われることができる。

幾つかの例において、Ｍは、所望の精度に基づいて適切に選択され、Ｎは、整数除算演算において最も近い整数に丸めるために使用される。式（５）における計算は、ビットシフト演算、整数加算演算、整数除算演算等のような、整数演算を使用して行われることができる。実装例において、Ｍ、Ｎ、δ_ｊ等のような、式（５）中のオペランドは、整数データタイプであると宣言され、変換された重みは、整数データタイプであると宣言される。

一例では、変換された重みに基づいて、現在のポイントの属性は、式（６）による計算に基づいて予測されることができる。

式（６）の演算は、整数乗算、整数加算、整数除算等のような、整数演算を使用して行われることができることに留意されたい。実装例において、Ｑｊ、（外００１７）

のような、式（６）中のオペランドは、整数データタイプであると宣言される。

端数切り捨て（フロア）、端数切り上げ（天井）、最も近い整数への丸め等のような、任意の適切な丸め演算を使用することができることに留意されたい。

一例として、端数切り捨て演算が使用されるときには、式（６）中の除算演算において整数除算をしようすることができ、式（７）を使用して式（６）を表すことができる。

別の例では、最も近い整数演算への丸めが使用されるときには、式（６）を式（８）に変換することができ、式（８）中の除算演算は、整数除算演算を使用して行われることができる。

幾つかの例において、式（６）～式（８）中の
（外００１８）

のような、除数(divisor)が計算される。除数がゼロに等しいならば、別の方法を使用して現在のポイントの属性
（外００１９）

を決定することができる。一例では、除数がゼロに等しいときには、最も近い隣接ポイントを予測子として使用して、現在のポイントの属性を予測することができる。別の例では、除数がゼロに等しいときに、現在のポイントの属性は、例えば、式（３）を使用して、隣接ポイントの属性の平均として計算される。

本開示の一態様によれば、Ｍのより大きな値は、変換された重みの精度を改良することができるが、オーバーフロー(overflow)、減速整数除算演算(slowing down integer division)等のような、問題を引き起こすこともある。幾つかの実施形態において、変換された重みの値は、問題を回避するために、適応的に調整されることができる。一部の例において、換算された重みの値は、換算された重みについての上限に基づいて調整される。一例において、上限は、パラメータＬに基づいて定義される。Ｌは、所定の整数である。例えば、上限は、２^Ｌに設定される。幾つかの例では、変換された重みが上限以上であるならば、変換された重みの全ては、変換された重みの全てが２^Ｌよりも小さくなる（例えば、最大の変換された重みが２^Ｌよりも小さくなる）まで、（例えば、ビット単位の右シフトによって）ダウンスケールされる(縮小される)。

本開示の一態様によれば、距離ベースの重み付けモデルにおいて適切な変換モデルを使用することができる。例えば、線形モデル、二次モデル、および／または他の非線形モデルを、距離ベースの重み付けモデルにおいて使用することができる。次に、距離ベースの重み付けモデルに従った重み計算は、整数演算によって行われることができるように、適切に変換されることができる。

一例では、距離ベースの重み付けモデルが、変換モデル
（外００２０）

を使用することができ、ここで、ＡおよびＢは、正の整数であり、δ_ｊは、隣接ポイントと現在のポイントの間の距離である。幾つかの実施形態において、重み計算は、浮動小数点演算の代わりに、整数乗算、整数除算等のような、整数演算を使用して行われることができるように、適切に変換されることができる。例えば、重み計算は、精度を高めるために、アップスケールされた被除数で変換される。アップスケールされた被除数は、１よりも大きい絶対値を持つ整数である。幾つかの例では、δ_ｊに基づく換算された重みは、式（９）に従って計算されることができ、

ここで、ＭおよびＮは、正の整数である。

本開示の一態様によれば、ルックアップテーブルを使用して整数乗算演算を高速化することができる。例えば、整数乗算演算は、予め計算されることができ、結果が、ルックアップテーブルに格納される。

一例では、Ｑｊの値が、第１の範囲内の整数であり、属性の値が、第２の範囲内の整数であり、次に、第１の範囲内の第１の値および第２の範囲内の第２の値の全ての可能な組み合わせの乗算結果を事前計算することができ、乗算結果が、ルックアップテーブルに格納される。ルックアップテーブルは、第１の入力値および第２の入力値に基づいて乗算結果を生成することができる。一例において、ルックアップテーブルの演算は、式（１０）によって表わされることができる。

換算された重みに基づいて、現在のポイントの予測される属性を式（１１）に従って計算することができる。

幾つかの例では、Ｍ、Ｎ、Ｌ、Ａ、Ｂ等のような、上記記述において使用される様々なパラメータが固定されており、エンコーダ側およびデコーダ側によって知られていることに留意されたい。幾つかの他の例において、エンコーダは、Ｍ、Ｎ、Ｌ、Ａ、Ｂ等のような、様々なパラメータを決定して、シーケンス適合のためにエンコーダ側からデコーダ側にビットストリームにおいてパラメータを信号伝達することができる。デコーダは、ビットストリームからのパラメータを復号化することができ、隣接ポイントおよび復号化されたパラメータに基づいて現在のポイントの情報を予測することができる。一例において、様々なパラメータは、シーケンスパラメータセット、属性パラメータセット、幾何学的形状パラメータセット、スライスヘッダ等のような、高レベル構文において信号伝達されることができる。

図１９は、本開示の一実施形態によるプロセス（１９００）の概説するフローチャートを示している。プロセス（１９００）は、ポイントクラウドのための符号化プロセスまたは復号化プロセスのような、コーディングプロセスの間に使用されることができる。様々な実施形態において、プロセス（１９００）は、端末デバイス（１１０）内の処理回路構成、エンコーダ（２０３）および／またはデコーダ（２１０）の機能を行う処理回路構成、エンコーダ（７００）、および／またはデコーダ（８００）等のような、処理回路構成によって実行される。幾つかの実施形態において、プロセス（１９００）は、ソフトウェア命令において実装され、よって、処理回路構成がソフトウェア命令を実行すると、処理回路構成は、プロセス（１９００）を実行する。プロセスは、（Ｓ１９０１）で開始し、（Ｓ１９１０）に進む。

（Ｓ１９１０）で、ポイントクラウド内の現在のポイントと関連付けられるコーディング（符号化／復号化）情報についての予測モードが決定される。予測モードにおいて、現在のポイントと関連付けられる情報は、現在のポイントの１つ以上の隣接ポイントに基づいて予測される。

幾つかの例において、現在のポイントと関連付けられる情報は、現在のポイントの幾何学的形状情報である。幾つかの例において、現在のポイントと関連付けられる情報は、現在のポイントの属性情報である。

（Ｓ１９２０）で、距離ベースの加重平均値が、現在のポイントまでの１つ以上の隣接ポイントの距離に基づいて計算される。計算中、少なくとも重み値は、整数演算を使用して計算され、浮動小数点演算は、少なくとも重み値の計算のために使用されない。

幾つかの例では、重み値を計算するために、重み計算における様々な演算のためのオペランドは、浮動小数点データタイプでない。幾つかの例において、様々な数学的演算（例えば、加算演算、減算演算、乗算演算、分割アプリケーション等）のオペランドは、整数データタイプであると宣言される。浮動小数点データタイプは、重み計算における数学的演算から除外される。

本開示の一態様によれば、幾つかのコンピュータ技術において、数学的演算におけるオペランドが浮動小数点データタイプであるとき、数学的演算は、浮動小数点ベースの演算を使用して行われる。全ての数学的演算のオペランドが浮動小数点データタイプでないときには、浮動小数点演算を避けることができる。たとえば、除数および被除数の両方が整数データタイプであるときには、整数除算演算が行われ、除数または被除数のいずれかが浮動小数点数であるときには、浮動小数点除算が実行される。

幾つかの例において、重み計算は、除算演算においてアップスケールされた被除数を使用するために変換される。例えば、隣接ポイントの重み情報についての（換算された重みと呼ばれる）重みは、アップスケールされた被除数を用いる除算演算を使用して計算される。アップスケールされた被除数は、１よりも大きい絶対値を持つ整数であり、除数は、隣接ポイントと現在のポイントとの間の距離に基づく。一例において、被除数は、ビット単位の左シフトに基づいてアップスケールされる。一例において、被除数は、除数のビット単位の左シフトによって計算される第1の整数と、ビット単位の右シフトによって計算される第２の整数との合計に基づく。

幾つかの例では、１つ以上の隣接ポイントの加重属性の合計が計算される。加重属性は、変換された重みを持つ隣接ポイントと関連付けられる複数の属性に基づいて計算される。一例において、加重属性は、属性および変換された重みに基づくルックアップ演算に従って、ルックアップテーブルから出力される。さらに、１つ以上の隣接ポイントと関連付けられる変換された重みの合計が計算される。次に、距離ベースの加重平均値は、変換された重みの合計によって加重属性の合計を除することに基づいて決定される。

幾つかの例において、変換された重みのうちの少なくとも１つが上限よりも大きいことに応答して、（例えば、ビット単位の右シフトを使用して）変換された重みをダウンスケールさせることができる。

一例において、距離ベースの加重平均値は、変換された重みの合計がゼロであることに応答して、１つ以上の隣接ポイントのうちの最も近い隣接ポイントに基づいて決定される。

別の例において、距離ベースの加重平均値は、変換された重みの合計がゼロであることに応答して、１つ以上の隣接ポイントの属性値の平均に基づいて決定される。

（Ｓ１９３０）で、現在のポイントと関連付けられる情報は、距離ベースの加重平均値に基づいて決定される。

次に、プロセスは、（Ｓ１９９９）に進み、終了する。

本開示において開示する技法は、別々に或いは任意の順序における組み合わせにおいて使用されてよい。さらに、技法（例えば、方法、実施形態）、エンコーダ、およびデコーダの各々は、処理回路構成（例えば、１つ以上のプロセッサまたは１つ以上の集積回路）によって実装されてよい。幾つかの例において、１つ以上のプロセッサは、非一時的コンピュータ読取可能媒体に格納されるプログラムを実行する。

上述の技法は、コンピュータ読取可能命令を使用するコンピュータソフトウェアとして実装されることができ、１つ以上のコンピュータ読取可能媒体に物理的に格納されることができる。例えば、図２０は、開示される主題の特定の実施形態を実装するのに適したコンピュータシステム（２０００）を示している。

コンピュータソフトウェアは、１つ以上のコンピュータ中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）等によって、直接的に或いは解釈、マイクロコード実行等を通じて実行されることができる命令を含むコードを作成するために、アセンブリ、コンパイル、リンク、または類似のメカニズムの対象となることがある任意の適切な機械コードまたはコンピュータ言語を使用してコーディングされることができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイス等を含む、様々なタイプのコンピュータまたはそれらのコンポーネント上で実行されることができる。

コンピュータシステム（２０００）のための図２０に示されるコンポーネントは、例示的な性質のものであり、本開示の実施形態を実装するコンピュータソフトウェアの使用範囲または機能性に関する如何なる制限も示唆することを意図しない。コンポーネントの構成は、コンピュータシステム（２０００）の例示的な実施形態において図示されるコンポーネントの任意の１つまたは組み合わせに関する如何なる従属性または要件も有するものとして解釈されてならない。

コンピュータシステム（２０００）は、特定のヒューマンインターフェース入力デバイスを含んでよい。そのようなヒューマンインターフェース入力デバイスは、例えば、（キーストローク、スワイプ、データグローブの動きのような）触覚入力、（音声、拍手のような）オーディオ入力、（ジェスチャのような）視覚入力、嗅覚入力（図示せず）を通じて、１人以上の人間ユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、（発話、音楽、周囲サウンドのような）オーディオ、（スキャンされた画像、静止画像カメラから得られる写真画像のような）画像、（二次元ビデオ、立体視ビデオを含む三次元ビデオのような）ビデオのような、人間による意識的入力に必ずしも直接的に関係しない特定の媒体を取り込むために使用されることもできる。

入力ヒューマンインターフェースデバイスは、キーボード（２００１）、マウス（２００２）、トラックパッド（２００３）、タッチスクリーン（２０１０）、データグローブ（図示せず）、ジョイスティック（２００５）、マイクロホン（２００６）、スキャナ（２００７）、およびカメラ（２００８）の１つ以上（各々の１つのみが描かれている）を含んでよい。

コンピュータシステム（２０００）は、特定のヒューマンインターフェース出力デバイスを含んでもよい。そのようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、サウンド、光、および嗅覚／味覚を通じて、１人以上の人間ユーザの感覚を刺激することがある。そのようなヒューマンインターフェース出力デバイスは、（例えば、タッチスクリーン（２０１０）、データグローブ（図示せず）、ジョイスティック（２００５）による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスもあることができる）触覚出力装置、（スピーカ（２００９）、ヘッドフォン（図示せず）のような）オーディオ出力デバイス、（各々がタッチスクリーン入力能力を持つか或いは持たない、各々が触覚フィードバック能力を持つか或いは持たない、それらの一部は、立体出力、仮想現実グラス（図示せず）、ホログラフィックディスプレイおよびスモークタンク（図示せず）、およびプリンタ（図示せず）のような手段を通じて、二次元視覚出力または三次元よりも多くの次元の出力を出力し得ることがある、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含む、スクリーン（２０１０）のような）視覚出力デバイスを含むことがある。

コンピュータシステム（２０００）は、人間がアクセス可能な記憶デバイスや、ＣＤ／ＤＶＤまたは同等の媒体（２０２１）を備えるＣＤ／ＤＶＤＲＯＭ／ＲＷ（２０２０）、サムドライブ（２０２２）、取り外し可能なハードドライブまたはソリッドステートドライブ（２０２３）、テープおよびフロッピーディスク（図示せず）のようなレガシー磁気媒体、セキュリティドングル（図示せず）のような特殊化されたＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス、および同等物を含む、光媒体のような、それらの関連する媒体も含むことができる。

当業者は、現在開示されている主題に関連して使用されるような「コンピュータ読取可能媒体」という用語が、送信媒体、搬送波、または他の過渡信号を包含しないことも理解するはずである。

コンピュータシステム（２０００）は、１つ以上の通信ネットワーク（２０５５）へのインターフェース（２０５４）を含むこともできる。ネットワークは、例えば、無線、有線、光であることができる。ネットワークは、更に、ローカル、ワイドエリア、メトロポリタン、車両および産業、リアルタイム、遅延耐性等であることができる。ネットワークの例は、イーサネット、無線ＬＡＮのようなローカルエリアネットワーク、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥおよび同等のものを含むセルラネットワーク、ケーブルＴＶ、衛星ＴＶ、および地上放送ＴＶを含むＴＶ有線または無線ワイドエリアデジタルネットワーク、ＣＡＮＢｕｓを含む車両および産業等を含む。特定のネットワークは、一般に、（例えば、コンピュータシステム（２０００）のＵＳＢポートのような）特定の汎用データポートまたは周辺バス（２０４９）に取り付けられる外部ネットワークインターフェースアダプタを必要とし、他のネットワークは、一般に、以下に記載するようなシステムバスへの取り付けによって、コンピュータシステム（２０００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラネットワークインターフェース）。これらのネットワークのいずれかを使用して、コンピュータシステム（２０００）は、他のエンティティと通信することができる。そのような通信は、単指向性、受信のみ（例えば、放送テレビ）、単指向性送信のみ（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、または、例えば、ローカルまたはワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの、双指向性であることができる。特定のプロトコルおよびプロトコルスタックは、上述のように、それらのネットワークおよびネットワークインターフェースの各々で使用されることができる。

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶デバイス、およびネットワークインターフェースは、コンピュータシステム（２０００）のコア（２０４０）に取り付けられることができる。

コア（２０４０）は、１つ以上の中央処理装置（ＣＰＵ）（２０４１）、グラフィックス処理装置（ＧＰＵ）（２０４２）、フィールドプログラマブルゲートエリア（ＦＰＧＡ）（２０４３）の形態の特殊化されたプログラマブル処理装置、特定のタスクのためのハードウェアアクセラレータ（２０４４）、グラフィックスアダプタ（２０５０）等を含むことができる。これらのデバイスは、読出し専用メモリ（ＲＯＭ）（２０４５）、ランダムアクセスメモリ（２０４６）、内部ユーザアクセス可能でないハードドライブのような内部大容量記憶装置、ＳＳＤ、および同等物（２０４７）と共に、システムバス（２０４８）を通じて接続されてよい。幾つかのコンピュータシステムにおいて、システムバス（２０４８）は、追加のＣＰＵ、ＧＰＵ、および同等物による拡張を可能にするために、１つ以上の物理プラグの形態でアクセス可能であることができる。周辺デバイスは、コアのシステムバス（２０４８）に直接的に取り付けられることができ、或いは周辺バス（２０４９）を通じて取り付けられることができる。一例において、スクリーン（２０１０）は、グラフィックスアダプタ（２０５０）に接続されることができる。周辺バスのためのアーキテクチャは、ＰＣＩ、ＵＳＢ、および同等物を含む。

ＣＰＵ（２０４１）、ＧＰＵ（２０４２）、ＦＰＧＡ（２０４３）、およびアクセラレータ（２０４４）は、組み合わせにおいて、上述のコンピュータコードを構成することができる、特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（２０４５）またはＲＡＭ（２０４６）に格納されることができる。移行データも、ＲＡＭ（２０４６）に格納されることができるのに対し、永久データは、例えば、内部大容量記憶装置（２０４７）に格納されることができる。１つ以上のＣＰＵ（２０４１）、ＧＰＵ（２０４２）、大容量記憶装置（２０４７）、ＲＯＭ（２０４５）、ＲＡＭ（２０４６）、および同等物と密接に関連付けられることができるキャッシュメモリの使用を通じて、メモリデバイスのいずれかへの高速格納および検索を可能にすることができる。

コンピュータ読取可能媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードをその上に有することができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであることができ、或いは、それらは、コンピュータソフトウェア技術の当業者によく知られており且つ利用可能である種類のものであることができる。

一例として、限定によってではなく、アーキテクチャ（２０００）、具体的には、コア（２０４０）を有する、コンピュータシステムは、１つ以上の有形のコンピュータ読取可能媒体において具現されるソフトウェアを実行する（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ、および同等物を含む）プロセッサの結果としての機能性を提供することができる。そのようなコンピュータ読取可能媒体は、上述のようなユーザアクセス可能な大容量記憶装置と関連付けられる媒体、並びにコア内部大容量記憶装置（２０４７）またはＲＯＭ（２０４５）のような非一時的な性質を有するコア（２０４０）の特定の記憶装置であってよい。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに格納されることができ、コア（２０４０）によって実行されることができる。コンピュータ読取可能媒体は、特定のニーズに従って、１つ以上のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（２０４０）、特にコア内の（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、および同等物を含む）プロセッサに、ＲＡＭ（２０４６）に格納されるデータ構造を定義ことと、ソフトウェアによって定義されるプロセスに従ってそのようなデータ構造を修正することとを含む、本明細書に記載する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。追加的にまたは代替的に、コンピュータシステムは、回路内に配線された或いは他の方法で具現されたロジック(論理）の結果として機能性（例えば、アクセラレータ（２０４４））を提供することができ、それは、本明細書に記載する特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりに或いはソフトウェアと共に作動することができる。ソフトウェアへの言及は、ロジックを含み、必要に応じて、その逆も同様である。コンピュータ読取可能媒体への言及は、実行のためのソフトウェアを格納する回路、実行のためのロジックを具現する（集積回路（ＩＣ）のような）回路、または適切な場合にはそれらの両方を含むことができる。本開示は、ハードウェアおよびソフトウェアの任意の適切な組み合わせを含む。

この開示は幾つかの例示的な実施形態を記載したが、本開示の範囲内にある変更、置換、および様々な代替的な均等物がある。よって、当業者は、本明細書に明示的に示されていないか或いは記載されていないが、本開示の原理を具現し、よって、本開示の精神および範囲内にある、数多くのシステムおよび方法を考案することができることが理解されるであろう。

Claims

ポイントクラウドコーディングのための方法であって、
ポイントクラウド内の現在のポイントと関連付けられる情報をコーディングするために予測モードを使用することを決定することであって、前記現在のポイントと関連付けられる前記情報は、前記現在のポイントの１つ以上の隣接ポイントに基づいて前記予測モードにおいて予測される、決定することと、
整数演算を使用して、前記現在のポイントまでの前記１つ以上の隣接ポイントの距離に基づいて、距離ベースの加重平均値を計算することと、
前記距離ベースの加重平均値に基づいて、前記現在のポイントと関連付けられる前記情報を決定することと、を含む、
方法。
前記現在のポイントと関連付けられる前記情報は、前記現在のポイントの幾何学的形状情報および前記現在のポイントの属性情報のうちの少なくとも１つを含む、請求項１に記載の方法。
前記距離ベースの加重平均値を計算することは、
重み計算において浮動小数点データタイプの使用を除外することを含む、
請求項１に記載の方法。
前記距離ベースの加重平均値を計算することは、
除数によって被除数を除算する整数除算演算に基づいて、第１の隣接ポイントの情報を重み付けるための第１の変換された重みを計算することを含み、
前記被除数は、１よりも大きい絶対値を持つ整数であり、前記除数は、前記第１の隣接ポイントと前記現在のポイントとの間の距離に基づく、
請求項１に記載の方法。
前記第１の変換された重みを計算することは、
ビット単位の左シフトに基づいて前記被除数を得ることを含む、
請求項４に記載の方法。
前記第１の変換された重みを計算することは、
前記除数の前記ビット単位の左シフトによって得られる第１の整数と、ビット単位の右シフトによって得られる第２の整数との合計に基づいて、前記被除数を決定することを含む、
請求項５に記載の方法。
前記距離ベースの加重平均値を計算することは、
前記１つ以上の隣接ポイントの加重属性の合計を計算することであって、前記加重属性中の第１の加重属性は、前記第１の隣接ポイントと関連付けられ、前記第１の隣接ポイントと関連付けられる第１の属性と前記第１の変換された重みとの乗算に基づいて計算される、計算することと、
前記１つ以上の隣接ポイントと関連付けられる変換された重みの合計を計算することであって、前記変換された重みは、前記第１の変換された重みを含む、計算することと、
前記変換された重みの前記合計による前記加重属性の前記合計の除算に基づいて前記距離ベースの加重平均値を決定することと、を含む、
請求項４に記載の方法。
前記第１の属性および前記第１の変換された重みに基づくルックアップ演算に応答してルックアップテーブルから出力される前記第１の加重属性を受信することを更に含む、請求項７に記載の方法。
前記変換された重みのうちの少なくとも１つが上限よりも大きいことに応答して、前記変換された重みをそれぞれダウンスケールすることを更に含む、請求項７に記載の方法。
前記変換された重みの前記合計がゼロであることに応答して、前記１つ以上の隣接ポイントのうちの最も近い隣接ポイントに基づいて、前記現在のポイントと関連付けられる属性値を決定すること、および、
前記変換された重みの前記合計がゼロであることに応答して、前記１つ以上の隣接ポイントの属性の平均に基づいて、前記現在のポイントと関連付けられる属性値を決定すること
のうちの少なくとも１つを更に含む、
請求項７に記載の方法。
変換モデルに従って、前記距離に基づいて重みを計算することと、
前記整数演算を使用して、前記重みに基づいて前記距離ベースの加重平均値を計算することと、を更に含み、
前記変換モデルは、線型モデル、二次モデル、および非線形モデルのうちの１つを含む、
請求項１に記載の方法。
処理回路構成を含む、ポイントクラウドコーディングのための装置であって、
前記処理回路構成は、
ポイントクラウド内の現在のポイントと関連付けられる情報をコーディングするために予測モードを使用することを決定するように構成され、前記現在のポイントと関連付けられる前記情報は、前記現在のポイントの１つ以上の隣接ポイントに基づいて前記予測モードにおいて予測され、
整数演算を使用して、前記現在のポイントまでの前記１つ以上の隣接ポイントの距離に基づいて距離ベースの加重平均値を計算するように構成され、且つ
前記距離ベースの加重平均値に基づいて、前記現在のポイントと関連付けられる前記情報を決定するように構成される、
装置。
前記現在のポイントと関連付けられる前記情報は、前記現在のポイントの幾何学的形状情報および前記現在のポイントの属性情報のうちの少なくとも１つを含む、請求項１２に記載の装置。
前記処理回路構成は、重み計算において浮動小数点データタイプの使用を除外するように構成される、請求項１２に記載の装置。
前記処理回路構成は、
除数によって被除数を除算する整数除算演算に基づいて第１の隣接ポイントの情報を重み付けるための第１の変換された重みを計算するように構成され、
前記被除数は、１よりも大きい絶対値を持つ整数であり、前記除数は、前記第１の隣接ポイントと前記現在のポイントとの間の距離に基づく、請求項１２に記載の装置。
前記処理回路構成は、ビット単位の左シフトに基づいて前記被除数を得るように構成される、請求項１５に記載の装置。
前記処理回路構成は、前記除数の前記ビット単位の左シフトによって得られる第１の整数と、ビット単位の右シフトによって得られる第２の整数との合計に基づいて、前記被除数を決定するように構成される、請求項１６に記載の装置。
前記処理回路構成は、
前記１つ以上の隣接ポイントの加重属性の合計を計算するように構成され、前記加重属性中の第１の加重属性は、前記第１の隣接ポイントと関連付けられ、前記第１の隣接ポイントと関連付けられる第１の属性と前記第１の変換された重みとの乗算に基づいて計算され、
前記１つ以上の隣接ポイントと関連付けられる変換された重みの合計を計算するように構成され、前記変換された重みは、前記第１の変換された重みを含み、
前記変換された重みの前記合計による前記加重属性の前記合計の除算に基づいて前記距離ベースの加重平均値を決定するように構成される、
請求項１５に記載の装置。
前記処理回路構成は、
前記第１の属性および前記第１の変換された重みに基づくルックアップ演算に応答してルックアップテーブルから出力される前記第１の加重属性を受信するように構成される、
請求項１８に記載の装置。
前記処理回路構成は、
前記変換された重みのうちの少なくとも１つが上限よりも大きいことに応答して、前記変換された重みをそれぞれダウンスケールするように構成される、
請求項１８に記載の装置。
命令を含むコンピュータプログラムであって、前記命令は、少なくとも１つのプロセッサによって実行されるときに、コンピュータに請求項１－１１に記載の方法を実行する、コンピュータプログラム。
命令を格納する非一時的なコンピュータ読取可能媒体であって、前記命令は、コンピュータによって実行されるときに、前記コンピュータに請求項１－１１に記載の方法を実行させる、非一時的なコンピュータ読取可能媒体。