JP2022535483A

JP2022535483A - 点群属性コーディング用のチャネル間予測と変換のための技術および装置

Info

Publication number: JP2022535483A
Application number: JP2021556273A
Authority: JP
Inventors: イエア，セフーン; ウェンジャー，ステファン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2019-10-06
Filing date: 2020-10-02
Publication date: 2022-08-09
Anticipated expiration: 2040-10-02
Also published as: US20210104072A1; WO2021071752A1; KR20210139381A; JP7329064B2; EP4038577A4; KR102625789B1; US11682144B2; EP4038577A1; CN113795868A; CN113795868B

Abstract

要約書点群の属性情報をコード化するための方法および装置は、３次元空間内の点のセットを含む点群を取得することを含み得る。点群の属性情報は、ＹＣｏＣｇ－Ｒ変換を使用してコード化される。

Description

（関連出願の相互参照）
本出願は、２０１９年１０月６日に出願された米国仮特許出願第６２／９１１，３２７号および２０２０年９月２４日に出願された米国特許出願第１７／０３０，７７９号からの優先権を主張し、その全ての内容は参照により本出願に組み込まれるものとする。

世界における高度な３次元（３Ｄ）表現により、より没入型の対話とコミュニケーションが可能になり、機械が私たちの世界を理解、解釈、ナビゲートできるようになる。３Ｄ点群は、そのような情報の表現を可能にするものとして登場した。点群データに関連する多くの使用例が特定されており、点群の表現と圧縮に対応する要件が開発されている。

点群は、3D空間内の点のセットであり、それぞれ色、材料特性などの属性が関連するものである。点群は、そのような点の合成としてオブジェクトまたはシーンを再構築するために使用できる。それらは、様々な設定で複数のカメラと深度センサを使用してキャプチャされることができ、再構築されたシーンをリアルに表現するために、数千から数十億の点で構成され得る。

点群を表すために必要なデータの量を低減するには、圧縮技術が必要である。そのため、リアルタイム通信と６自由度（６ＤｏＦ）の仮想現実で使用するための点群の非可逆圧縮には技術が必要である。さらに、自動運転および文化遺産の用途などの動的マッピングのコンテキストで、ロスレス点群圧縮の技術が求められる。ＭＰＥＧは、ジオメトリと色や反射率などの属性の圧縮、スケーラブル／プログレッションコーディング、時間の経過とともにキャプチャされた点群のシーケンスのコーディング、点群のサブセットへのランダムアクセスに対処するための標準に取り組み始めている。

本開示は、点群コーディング技術に関する。開示される主題は、ビデオのコーディングおよびデコーディング、ビデオのコーディングおよびデコーディングを実行するビデオエンコーディングおよびデコーディングに関し、より具体的には、点群サンプルの属性情報のコーディングに関する。

本開示の一態様によれば、点群の属性情報をコード化するための方法は、少なくとも１つのプロセッサによって実行され、３次元空間内の点のセットを含む点群を取得するステップと、ＹＣｏＣｇ－Ｒ変換を使用して点群の属性情報をコード化するステップを含み得る。

本開示の一態様によれば、点群の属性情報をコード化するための装置は、プログラムコードを記憶するように構成された少なくとも１つのメモリと、プログラムコードを読み取り、プログラムコードの指示に従って動作するように構成された少なくとも1つのプロセッサとを含み、プログラムコードは、少なくとも１つのプロセッサに、３次元空間内の点のセットを含む点群を取得させるように構成された取得コードと、少なくとも１つのプロセッサに、ＹＣｏＣｇ－Ｒ変換を使用して点群の属性情報をコード化させるように構成された符号化コードとを含む。

本開示の一態様によれば、非一時的なコンピュータ可読媒体は、命令を記憶し、命令は、点群の属性情報をコード化するための装置の１つ以上のプロセッサによって実行されると、１つ以上のプロセッサに、３次元空間内の点のセットを含む点群を取得するステップと、ＹＣｏＣＧ－Ｒ変換を使用して点群の属性情報をコード化するステップとを実行させる１つ以上の命令を含む。

点群の属性情報をコード化するための例示的なプロセスのフローチャートである。

本明細書で説明されるシステムおよび／または方法が実装され得る例示的な環境の図である。

図２の１つ以上の装置の例示的なコンポーネントの図である。

グラフベースの点群圧縮（Ｇ－ＰＣＣ）モデルは、ジオメトリ情報と、色または反射率などの関連する属性を個別に圧縮する。点群の３Ｄ座標であるジオメトリ情報は、その占有情報の八分木分解によってコード化される。一方、属性情報は、異なるレベル間の詳細レベル（ＬＯＤ）データの閉ループ予測を実行する差分パルス符号変調（ＤＰＣＭ）のような技法によってエンコードされる。ＬＯＤ情報は、デコードされたジオメトリ情報に基づいて、エンコーディングとデコーディングで同じ方法で作成される。基本的に、ＬＯＤは、より多くのＬＯＤが提供されるにつれて、指定された点群のより詳細な情報が連続的に取得されるように作成される。属性コーディングのためにサンプルベースの予測が実行されると、最近傍ベースのツリー探索を利用して、加重予測を行うための隣接サンプルを見つける。重みを、隣接サンプルのそれぞれの幾何学的距離の逆数として計算する。

Ｇ－ＰＣＣ属性コーディングでは、各３Ｄ点のＬＯＤは、各点の距離に基づいて生成され、次に各ＬＯＤの３Ｄ点の属性値は、ＬＯＤベースの順序で予測を適用することによってエンコードされる。

Ｇ－ＰＣＣのアンカー方法は次のように進行する。第１に、近傍のばらつきを算出し、その隣接値がどのように変化しているかを確認し、ばらつきが閾値より小さい場合には、距離ベースの加重平均予測を次のように実行する。属性値

を、点ｉの最近傍の距離に基づく線形補間プロセスを使用して予測する。

を現在点Ｉのｋ最近傍の集合とし、

をそれらのデコード／再構築属性値とし、

をそれらの現在点への距離とする。予測された属性値

は、

によって与えられる。

属性がコード化されると、全ての点群の幾何学的位置がすでに利用可能である。また、ＫＤツリー構造を使用して各点の最近傍探索を同じ方法で容易にするため、隣接点とそれらの再構築された属性値をエンコーディングとデコーディングの両方で使用できる。

次に、ばらつきが閾値より高い場合には、レート歪み最適化予測子の選択が実行される。ＬＯＤを生成する際の隣接点探索の結果に基づいて、複数の予測子候補が作成される。例えば、Ｐ２の属性値が予測を使用してエンコードされる場合、距離ベースの加重平均値Ｐ０、Ｐ５およびＰ４は、０に等しい予測子インデックスに設定される。次に、最近傍点Ｐ４の値が１に等しい予測子インデックスに設定される。さらに、次に最近傍点Ｐ５とＰ０の値は、それぞれ２と３に等しい予測子インデックスに設定される（表１）。予測子候補を作成した後、レート歪み最適化手順を適用して最適な予測子を選択し、次に、選択した予測子インデックスを算術的にエンコードする。

予測子候補の最大数（ＭａｘＮｕｍＣａｎｄ）が定義され、属性ヘッダにエンコードされる。現在の実装では、ＭａｘＮｕｍＣａｎｄは、ｎｕｍｂｅｒＯｆＮｅａｒｅｓｔＮｅｉｇｈｂｏｒｓＩｎＰｒｅｄｉｃｔｉｏｎ＋１に等しく設定され、切り捨てられた単項２値化を使用した予測子インデックスのエンコードとデコードに使用される。

リフティング変換は、前のセクションで説明した予測変換の上に構築される。予測スキームとリフティングスキームの主な違いは、更新演算子の導入である。

リフティングの予測と更新のステップを容易にするために、分解の各段階で信号を２セットの高相関に分割する必要がある。Ｇ－ＰＣＣのリフティングスキームでは、レベル間でこのような高相関が期待されるＬＯＤ構造を利用して分割を実行し、各レベルを最近傍探索によって構築して、不均一な点群を構造化データに編成する。レベルＮでの予測／更新（Ｐ／Ｕ）分解ステップでは、詳細信号Ｄ（Ｎ－１）と、近似信号Ａ（Ｎ－１）とが、さらにＤ（Ｎ－２）とＡ（Ｎ－２）に分解される。このステップを、ベース層近似信号Ａ（１）が取得されるまで繰り返し適用する。

したがって、ＬＯＤ（Ｎ）、…、ＬＯＤ（１）で構成される入力属性信号自体をコード化する代わりに、リフティングスキームでの１つの端部アップコーディングＤ（Ｎ－１）、Ｄ（Ｎ－２）、…、Ｄ（１）、Ａ（１）をコード化することになる。効率的なＰ／Ｕステップを適用すると、Ｄ（Ｎ－１）、…、Ｄ（１）でのサブバンド「係数」がまばらになり、それにより、変換コーディングゲインの利点を提供する。

予測変換のための上記距離ベースの加重平均予測は、Ｇ－ＰＣＣのアンカー方法として、リフティングの予測ステップに使用される。

色などの点群属性の場合、チャネル間には十分な冗長性がある。

コーディング効率を向上させるために、色空間変換を前処理/後処理ステップとして実行することが多い。前処理/後処理ステップとしての色空間変換の問題の1つは、正規直交性が不足していることが多く、変換された色空間でコーデックのパフォーマンスを最適化しても、必ずしも元の空間で高品質になるとは限らないことである。さらに、ロスレス色変換は、特に非整数カラー変換を高精度で近似しようとすると、ビット深度が拡張される傾向がある。これは、多くの実際のシステムの実装上の制約に応じた問題であり得る。

本開示では、圧縮効率のためにチャネル間の非相関を効率的に実行するための方法が提案される。

提案された方法は、別々に使用することも、任意の順序で組み合わせることができる。さらに、方法（または実施形態）、エンコーディングおよびデコーディングのそれぞれは、処理回路（例えば、１つ以上のプロセッサまたは１つ以上の集積回路）によって実装され得る。一例では、１つ以上のプロセッサは、非一時的なコンピュータ可読媒体に記憶されるプログラムを実行する。

本開示は、上記のＧ－ＰＣＣ予測子の設計に関する。これらの方法を、点群のために設計された同様のコーデックに適用できる。

本開示では、コーディング効率のための変換ツールとして色空間変換を使用するという前述の問題を回避することができる技法が開示される。

一実施形態によれば、技法は、Ｇ－ＰＣＣのＤＰＣＭ（ａｋａ予測変換）における予測残差のロスレスインループ変換としてＹＣｏＣｇ－Ｒを使用して、ほぼロスレスおよびロスレスの再構築を維持しながら、チャネル間の依存性を非相関化する。別の実施形態によれば、技法は、予測の別のステップを使用して、Ｇ－ＰＣＣのＤＰＣＭにおける他のチャネルの残差値を予測する。

ＹＣｏＣｇ変換は次のように与えられる。

ＹＣｏＣｇから得られたロスレス変換として、順方向ＹＣｏＣｇ－Ｒは次のように与えられる。
Co=R-B
t=B+(Co>>1)
Cg=G-t
Y=t+(Cg>>1)

逆方向ＹＣｏＣｇ－Ｒは、上記のプロセスを次のように逆にする。
t=Y-(Cg>>1)
G=Cg+t;
B=t-(Co>>1)
R=B+Co

これを残差変換として適用する場合、信号Ｒ、ＧおよびＢは、Ｇ－ＰＣＣにおけるチャネルごとの予測から得られる各チャネルの予測残差である。

マルチチャネル信号を非相関化する別の方法は、予測子を使用することである。本開示では、技法は、予測子を使用してチャネルの残差信号を予測することにより、元の残差の代わりに２次残差が量子化され、エントロピーコード化される。

Ｇ－ＰＣＣ予測設計の場合、最も単純なバージョンは、次のように説明である。太字の部分は、現在のＴＭＣ３仕様に加えて必要な変更である。この最も単純な予測を向上させるために、線形または非線形の予測子関数の一般的な形式を導入できる。

以下で使用するように、「X」は、チャネルＸ信号を表し、「X_pred」は、予測されたチャネルＸ信号（Ｇ－ＰＣＣで再構築された隣接サンプルから取得）を表し、「X_delta_index」は、チャネルＸの予測残差の量子化インデックスを表し、「X_delta_recon」は、チャネルＸの再構築された残差を表し、「X_recon」は、再構築されたチャネルＸ信号を表し、「X_delta_residual_index」は、残差予測からの残差の量子化インデックスを表す。

エンコーディングについて
G-Channel:
G_delta_index <- Quantize(G- G_pred)
G_delta_recon <- InverseQuantize(G_delta_index)
G_recon <- G_pred + G_delta_recon
EntopyEncode(G_delta_index)
C-Channels ('C' can be either R or B):
C_delta_index <- Quantize(C- C_pred)
C_delta_recon <- InverseQuantize(C_delta_index)
C_delta_residual_index <- Quantize (C_delta_recon - G_delta_recon)
C_delta_recon <- InverseQuantize(C_delta_residual_index) + G_delta_recon
C_recon <- C_pred + C_delta_recon
EntopyEncode(C_delta_residual_index)

デコーディングについて
G-Channel:
G_delta_index < - EntropyDecode()
G_delta_recon <- InverseQuantize(G_delta_index)
G_recon <- G_pred + G_delta_recon
// C-Channels ('C' can be either R or B)
C_delta_residual_index < - EntropyDecode()
C_delta_recon < - InverseQuantize(C_delta_residual_index) + G_delta_recon
C_recon <- C_pred + C_delta_recon

Ｇ－ＰＣＣおよび同様の点群コーデックのチャネル間の残差予測子の利点は次のとおりである。デコードプロセスでの変更はごくわずかである。複雑なマルチチャネル信号モデルを必要とせず、インループ残差変換を含むチャネル間の非相関のための他のロスレス色変換ベースのアプローチとは異なり、提案された方法は、ハウスドルフ距離の観点から、元のドメインの信号の忠実度を制御できる。これは、量子化が元の（ＲＧＢ色－）空間で実行されるためである。

以下は、Ｇ－ＰＣＣ作業草案仕様におけるチャネル間の残差予測子の実施例を提供する。

属性パラメータセットの構文では、提案されたチャネル間の残差予測子を適応的に有効/無効にするフラグを追加できる。

属性パラメータセットの構文

属性パラメータセットのセマンティクス

１に等しい「lifting_residual_prediction_enabled_flag」は、属性デコードプロセスが残差予測を実行することを指定する。

逆量子化プロセス
endIndex = pointCountPerLevelOfDetail[ 0 ];
for (i=0, d = 0; i< PointNum; i++) {
if ( i == endlndex ) {
endIndex = pointCountPerLevelOfDetail[ ++d ];
Q step Y = ( d < numlayer ) ？ SliceQstepY[ d ] :SliceQstepY[ num_layer - 1 ];
QstepC = ( d < num layer ) ？ SliceQstepC[ d ] :SliceQstepC[ num_layer - 1 ];
}
for (a=0; a< attrCnt; a++)
{
if (a==0 || lifting_residual_prediction_enabled_flag==0)
unquantAttributeCoefficients [ i ][ a ] = quantAttributeCoefficients[ i ][ a ] x(a == 0 ?QstepY :QstepC);
eise
unquant AttributeCoeffi ci ents [ i ][ a ] = quantAttributeCoefficients[ i ][ a ] x(a == 0 ?QstepY :QstepC) + unquantAttributeCoefficients[i][0];
}
}

この開示は、Ｇ－ＰＣＣにおけるＤＰＣＭ予測（ａｋａ予測変換）のコンテキスト下でのインループ色残差変換および色残差予測の両方に等しく適用される。これらの２つの手法は、チャネル間ツールと呼ばれる。

この開示では、条件付きチェックのいくつかの方法が、チャネル間ツールを現在点に適用するか否かを決定するために使用されることが提案される。

一実施形態では、３つのチャネルの再構築された残差値の最大差が、最近傍のそれぞれについて計算される。より具体的には、デコーディングは、チャネル間ツールを設定された閾値で適用した後に、残差の大きさ/分散の減少を経験した隣接の数を追跡できる。特に、再構築された３つの残差値が比較的均一である場合、非相関が成功しなかった可能性がある。これには、デコード時に各点ごとにそのようなテストの結果を示すために、1つのフラグの簿記が必要である。また、決定を下す場合に多数決を行うことができる。

別の実施形態では、隣接点からの３つのチャネルの最大絶対差値が比較される。色チャネル間で値のばらつきに大きなばらつきがある場合、相互に予測するのが難しい可能性がある。

隣接サンプルからチャネル間相関を識別できる任意の測定を組み込んで、チャネル間ツールの使用を決定することができる。

別の実施形態では、タイル／スライスレベル（例えば、タイル／スライスヘッダー内）またはビデオ／画像レベル（例えば、ＳＰＳ／ＰＰＳ内）フラグをシグナリングして、提案された残差変換または予測を有効／無効にすることができる。シグナリングは、コーディングユニットを構成する点群ピクセルの任意のグループに適用できる。

詳細なサブバンド係数はリフティングの予測ステップからの出力に他ならないため、これらは、本質的に予測残差信号であり、同じ予測戦略が与えられた場合、異なる色チャネル間で同様である可能性がある。

Ｇ－ＰＣＣリフティング設計の場合、最も単純なバージョンは、次のように説明できる。太字の部分は、現在のＴＭＣ３仕様に加えて必要な変更である。この最も単純な予測を向上させるために、線形または非線形の予測子関数の一般的な形式を導入できる。

以下で使用するように、「X」はチャネルX信号を表し、「X_coeff_index」は、チャネルXのリフティング係数の量子化インデックスを表し、「X_coeff_recon」は、チャネルXの再構築されたリフティング係数を表し、「X_recon」は、再構築されたチャネルＸ信号を表し、「X_coeff_residual_index」は、残差予測からの残差の量子化インデックスを表し、「quantWeight」は、エンコーディングでの量子化の前とデコーディングでの逆量子化の後にリフティング係数に適用される、Ｇ－ＰＣＣで使用される重み係数である。

エンコーディングについて
G-Channel
G_coeff_index <- Quantize(G)
G_coeff_recon <- InverseQuantize(G_coeff_index)
G_recon <- G_coeff_recon/quantWeight
EntopyEncode(G_coeff_index)

// C-Channels ('C' can be either R or B)
C_coeff_index <- Quantize(C)
C_coeff_recon <- InverseQuantize(C_coeff_index)
C_coeff_residual_index <- Quantize (C_coeff_recon - G_coeff_recon)
C_ceoff_recon <- InverseQuantize(C_coeff_residual_index) + G_coeff_recon
C_recon <- C_coeff_recon/quantWeight
EntopyEncode(C_coeff_residual_index)
デコーディングについて
/G-Channel
G_coeff_index < - EntropyDecode()
G_coeff_recon <- InverseQuantize(G_coeff_index)
Grecon <- G_coeff_recon/quantW eight

// C-Channels ('C' can be either R or B)
C_coeff_residual_index < - EntropyDecode()
C_coeff_recon < - InverseQuantize(C_coeff_residual_index) + G_coeff_recon
C_recon <- C_coeff_recon/quantWeight

図１は、点群の属性情報をコード化するための例示的なプロセス１００のフローチャートである。実施形態では、図１の１つ以上のプロセスブロックは、ユーザ装置２１０によって実行され得る。実施形態では、図１の１つ以上のプロセスブロックは、プラットフォーム２２０など、ユーザ装置２１０とは別の、またはユーザ装置２１０を含む別の装置または装置のグループによって実行され得る。

図１に示すように、プロセス１００は、３次元空間内の点のセットを含む点群を取得することを含み得る（ブロック１１０）。

点群は、３Ｄ空間内の点のセットであり得、それぞれは、色、材料特性などの属性が関連する。

図１にさらに示されるように、プロセス１００は、ＹＣｏＣｇ－Ｒ変換を使用して点群の属性情報をコード化することを含み得る（ブロック１２０）。

ＹＣｏＣｇ色モデルは、関連する赤、緑、青（ＲＧＢ）の色空間を輝度値（Ｙと表記）およびクロミナンスグリーン（Ｃｇ）とクロミナンスオレンジ（Ｃｏ）と呼ばれる２つの彩度値に単純に変換した色空間である。ＹＣｏＣｇ－Ｒは、ＹＣｏＣｇ色モデルの可逆的にスケーリングされたバージョンである。

ＹＣｏＣｇ－Ｒ変換は、グラフベースの点群圧縮（Ｇ－ＰＣＣ）に使用され得る。ＹＣｏＣｇ－Ｒでは、Ｃｏ＝Ｒ－Ｂである。さらに、ｔ＝Ｂ＋（Ｃｏ＞＞１）である。さらに、Ｃｇ＝Ｇ－１である。さらに、Ｙ＝ｔ＋（Ｃｇ＞＞１）である。

ＹＣｏＣｇ変換は次のように与えられる。

ＹＣｏＣｇから得られたロスレス変換として、順方向ＹＣｏＣｇ－Ｒは次のように与えられる。
Co = R - B
t = B + (Co >> 1)
Cg = G - t
Y = t + (Cg >> 1)

逆方向ＹＣｏＣｇ－Ｒは、上記のプロセスを次のように逆にする。
t = Y - (Cg >> 1)
G = Cg + t;
B = t - (Co >> 1)
R = B + Co

実装形態では、プロセスは、ＹＣｏＣｇ－Ｒ変換を使用して属性情報をコード化することに基づいて点群を送信することを含み得る。

図１は、プロセス１００の例示的なブロックを示すが、実施形態では、プロセス１００は、図１に示されるものと比べて、追加のブロック、より少ないブロック、異なるブロック、または別様に配置されたブロックを含み得る。さらに、または代わりに、プロセス１００の２つ以上のブロックを並行して実行することができる。

図２は、本明細書で説明されるシステムおよび／または方法が実装され得る例示的な通信システム２００の図である。図２に示されるように、通信システム２００は、ユーザ装置２１０、プラットフォーム２２０およびネットワーク２３０を含み得る。通信システム２００の装置は、有線接続、無線接続、または有線接続と無線接続の組み合わせを介して相互接続することができる。

通信システム２００は、データの単方向送信をサポートすることができる。例えば、第１のユーザ装置２１０は、ネットワーク２３０を介して第２のユーザ装置２１０に送信するために、ローカル位置でビデオデータをコード化することができる。第２のユーザ装置２１０は、ネットワーク２３０から第１のユーザ装置２１０のコード化されたビデオデータを受信し、コーディングデータをデコードし、復元されたビデオデータを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。

通信システム２００は、データの双方向送信をサポートすることができる。例えば、通信システム２００は、例えば、ビデオ会議中に発生し得るコーディングビデオの双方向送信をサポートすることができる。データの双方向送信の場合、各ユーザ装置２１０は、ネットワーク２３０を介して他のユーザ装置に送信するためにローカル位置でキャプチャされたビデオデータをコード化し得る。各ユーザ装置２１０はまた、他のユーザ装置によって送信されたコーディングビデオデータを受信することができ、コーディングデータをデコードすることができ、復元されたビデオデータをローカル表示装置に表示することができる。

ユーザ装置２１０は、プラットフォーム２２０に関連する情報を受信、生成、記憶、処理および／または提供することができる１つ以上の装置を含む。例えば、ユーザ装置２１０は、コンピューティング装置（デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ハンドヘルドコンピュータ、スマートスピーカ、サーバなど）、携帯電話（例えば、スマートフォン、無線電話など）、ウェアラブル装置（例えば、スマートグラスまたはスマートウォッチ）、または同様の装置を含み得る。実装形態では、ユーザ装置２１０は、プラットフォーム２２０から情報を受信し、および／またはプラットフォーム２２０に情報を送信することができる。

プラットフォーム２２０は、本明細書の他の場所で説明されるように、ユーザ装置２１０に情報を提供することができる１つ以上の装置を含む。実装形態では、プラットフォーム２２０は、クラウドサーバまたはクラウドサーバのグループを含み得る。実装形態では、プラットフォーム２２０は、特定の必要性に応じて特定のソフトウェアコンポーネントがスワップインまたはスワップアウトされ得るようにモジュール式に設計することができる。そのため、プラットフォーム２２０は、様々な用途に合わせて簡単および／または迅速に再構成できる。

実施形態では、示されるように、プラットフォーム２２０は、クラウドコンピューティング環境２２２でホストされ得る。特に、本願明細書に記載される実施形態は、プラットフォーム２２０がクラウドコンピューティング環境２２２でホストされるものとして記載するが、一部の実施形態では、プラットフォーム２２０は、クラウドベースでなく（すなわち、クラウドコンピューティング環境の外部で実装され得る）でなくてもよく、または部分的にクラウドベースであってもよい。

クラウドコンピューティング環境２２２は、プラットフォーム２２０をホストする環境を含む。クラウドコンピューティング環境２２２は、プラットフォーム２２０をホストするシステムおよび/または装置の物理的な位置および構成についてエンドユーザ（例えば、ユーザ装置２１０）の知識を要求しない演算、ソフトウェア、データアクセス、ストレージおよび／またはその他サービスを提供し得る。図のように、クラウドコンピューティング環境２２２は、コンピューティングリソース２２４（まとめて「コンピューティングリソース２２４」と呼ばれ、個別に「コンピューティングリソース２２４」と呼ばれる）を含み得る。

コンピューティングリソース２２４は、１つ以上のパーソナルコンピュータ、ワークステーションコンピュータ、サーバ装置または別のタイプの演算および／または通信装置を含む。実施形態において、コンピューティングリソース２２４は、プラットフォーム２２０をホストし得る。クラウドリソースは、コンピューティングリソース２２４において実行する演算インスタンス、コンピューティングリソース２２４内に設けられるストレージ装置、コンピューティングリソース２２４により提供されるデータ転送装置などを含み得る。実施形態において、コンピューティングリソース２２４は、有線接続、無線接続または有線接続と無線接続との組み合わせを介して他のコンピューティングリソース２２４と通信してもよい。

図２にさらに示されているように、コンピューティングリソース２２４は、１つ以上のアプリケーション（「ＡＰＰ」）２２４－１、１つ以上の仮想マシン（「ＶＭ」）２２４－２、仮想化ストレージ（「ＶＳ」）２２４－３、１つ以上のハイパーバイザ（「ＨＹＰ」）２２４－４または同様のものなどのクラウドリソースのグループを含み得る。

アプリケーション２２４－１は、ユーザ装置２１０に提供されても、またはユーザ装置２１０によりアクセスされてもよい１つ以上のソフトウェアアプリケーションを含む。アプリケーション２２４－１は、ユーザ装置２１０上でソフトウェアアプリケーションをインストールして実行する必要性をなくしてもよい。例えば、アプリケーション２２４－１は、プラットフォーム２２０に関連したソフトウェア、および／またはクラウドコンピューティング環境２２２を介して提供できる他の任意のソフトウェアを含み得る。実施形態において、１つのアプリケーション２２４－１は、仮想マシン２２４－２を介して他の１つ以上のアプリケーション２２４－１との間で情報を送受信し得る。

仮想マシン２２４－２は、物理マシンのようにプログラムを実行するマシン（例えば、コンピュータ）のソフトウェア実装を含む。仮想マシン２２４－２は、用途、および仮想マシン２２４－２の任意の実マシンとの類似の程度に応じて、システム仮想マシンまたはプロセス仮想マシンのいずれかであってもよい。システム仮想マシンは、完全なオペレーティングシステム（「ＯＳ」）の実行をサポートする完全なシステムプラットフォームを提供してもよい。プロセス仮想マシンは、単一のプログラムを実行してもよく、単一のプロセスをサポートしてもよい。実施形態において、仮想マシン２２４－２は、ユーザ（例えば、ユーザ装置２１０）の代わりに実行してもよく、さらにデータ管理、同期化または長期データ転送など、クラウドコンピューティング環境２２２のインフラストラクチャの管理をしてもよい。

仮想化ストレージ２２４－３は、コンピューティングリソース２２４のストレージシステムまたはデバイスの中で仮想化技法を使用する１つ以上のストレージシステムおよび／または１つ以上の装置を含む。実施形態において、ストレージシステムのコンテキストの中で、仮想化のタイプはブロック仮想化およびファイル仮想化を含み得る。ブロック仮想化は、物理ストレージからの論理ストレージの抽象化（または分離）を指してもよく、その結果、物理ストレージまたは異種構造と無関係にストレージシステムがアクセスされ得る。この分離は、ストレージシステムの管理者がエンドユーザに対しどのようにストレージを管理するかの点で、柔軟性を管理者に認めてもよい。ファイル仮想化は、ファイルレベルでアクセスされるデータと、ファイルが物理的に記憶される場所との間の依存関係をなくしてもよい。これは、ストレージ使用の最適化、サーバコンソリデーションおよび／または無停止ファイルマイグレーションの実行を可能にしてもよい。

ハイパーバイザ２２４－４は、複数のオペレーティングシステム（例えば「ゲストオペレーティングシステム」）がコンピューティングリソース２２４などのホストコンピュータ上で同時に実行できるようにするハードウェア仮想化技法を提供する。ハイパーバイザ２２４－４は、ゲストオペレーティングシステムに仮想オペレーティングプラットフォームを提示してもよく、ゲストオペレーティングシステムの実行を管理してもよい。様々なオペレーティングシステムの複数のインスタンスが、仮想化ハードウェアリソースを共有し得る。

ネットワーク２３０は、１つ以上の有線および／または無線ネットワークを含む。例えば、ネットワーク２３０は、セルラーネットワーク（例えば、第５世代（５Ｇ）ネットワーク、ロングタームエボリューション（ＬＴＥ）ネットワーク、第３世代（３Ｇ）ネットワーク、符号分割多元接続（ＣＤＭＡ）ネットワークなど）、公衆陸上移動体ネットワーク（ＰＬＭＮ）、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、メトロポリタンエリアネットワーク（ＭＡＮ）、電話網（例えば、公衆交換電話網（ＰＳＴＮ））、プライベートネットワーク、アドホックネットワーク、イントラネット、インターネット、光ファイバベースのネットワークなど、および／またはこれらまたは他のタイプのネットワークの組み合わせである。

図２に示される装置およびネットワークの数および配置は、例として提供される。実際には、図２に示されるものと比べて、追加の装置および/またはネットワーク、より少ない装置および/またはネットワーク、異なる装置および/またはネットワーク、または別様に配置された装置および/またはネットワークがあり得る。さらに、図２に示されている２つ以上の装置が単一の装置内に実装されてもよく、または、図２に示されている単一の装置が複数の分散型装置として実装されてもよい。さらに、または代わりに、環境２００の装置のセット（例えば、１つ以上の装置）が、環境２００の装置の別のセットにより実行されるものとして記載されている１つ以上の機能を実行し得る。

図３は、装置３００の例示的なコンポーネントの図である。装置３００は、ユーザ装置２１０および／またはプラットフォーム２２０に対応し得る。図３に示されているように、装置３００は、バス３１０、プロセッサ３２０、メモリ３３０、ストレージコンポーネント３４０、入力コンポーネント３５０、出力コンポーネント３６０および通信インタフェース３７０を含み得る。

バス３１０は、装置３００のコンポーネント間の通信を可能にするコンポーネントを含む。プロセッサ３２０は、ハードウェア、ファームウェアまたはハードウェアとソフトウェアとの組み合わせにおいて実装される。プロセッサ３２０は、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、アクセラレーテッド処理ユニット（ＡＰＵ）、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）または別のタイプの処理コンポーネントである。実施形態において、プロセッサ３２０は、機能を実行するようにプログラムできる１つ以上のプロセッサを含む。メモリ３３０は、プロセッサ３２０により使用される情報および／または命令を記憶するランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）および／または別のタイプの動的もしくは静的ストレージ装置（例えば、フラッシュメモリ、磁気メモリおよび／もしくは光学メモリ）を含む。

ストレージコンポーネント３４０は、装置３００の動作および使用に関係する情報および／またはソフトウェアを記憶する。例えば、ストレージコンポーネント３４０は、ハードディスク（例えば、磁気ディスク、光学ディスク、光磁気ディスクおよび／またはソリッドステートディスク）、コンパクトディスク（ＣＤ）、デジタル多用途ディスク（ＤＶＤ）、フロッピーディスク、カートリッジ、磁気テープおよび／または別のタイプの非一時的なコンピュータ可読媒体を、対応するドライブとともに含み得る。

入力コンポーネント３５０は、装置３００が、ユーザ入力（例えば、タッチスクリーンディスプレイ、キーボード、キーパッド、マウス、ボタン、スイッチおよび／またはマイクロフォン）などを介して情報を受信することを可能にするコンポーネントを含む。さらに、または代わりに、入力コンポーネント３５０は、情報を感知するセンサ（例えば、グローバルポジショニングシステム（ＧＰＳ）コンポーネント、加速度計、ジャイロスコープおよび／またはアクチュエータ）を含んでもよい。出力コンポーネント３６０は、装置３００からの出力情報を提供するコンポーネントを含む（例えば、ディスプレイ、スピーカおよび／または１つ以上の発光ダイオード（ＬＥＤ））。

通信インタフェース３７０は、装置３００が有線接続、無線接続または有線接続と無線接続との組み合わせなどを介して他の装置と通信することを可能にする、トランシーバのようなコンポーネント（例えば、トランシーバおよび／または別々の受信機および送信機）を含む。通信インタフェース３７０は、装置３００が、別の装置から情報を受信し、および／または別の装置に情報を提供することを可能にしてもよい。例えば、通信インタフェース３７０は、イーサネット（登録商標）インタフェース、光インタフェース、同軸インタフェース、赤外線インタフェース、無線周波数（ＲＦ）インタフェース、ユニバーサルシリアルバス（ＵＳＢ）インタフェース、Ｗｉ－Ｆｉインタフェース、セルラネットワークインタフェースまたは同様のものを含み得る。

装置３００は、本願明細書に記載された１つ以上のプロセスを実行してもよい。装置３００は、メモリ３３０および／またはストレージコンポーネント３４０などの非一時的なコンピュータ可読媒体により記憶されたソフトウェア命令をプロセッサ３２０が実行するのに基づいてこれらのプロセスを実行し得る。本願明細書において、コンピュータ可読媒体は非一時的なメモリ装置と定義される。メモリ装置は、単一の物理ストレージ装置内のメモリ空間または複数の物理ストレージ装置にまたがったメモリ空間を含む。

ソフトウェア命令は、メモリ３３０および／またはストレージコンポーネント３４０に別のコンピュータ可読媒体から、または通信インタフェース３７０を介して別の装置から読み込まれてもよい。メモリ３３０および／またはストレージコンポーネント３４０に記憶されたソフトウェア命令は、実行されると本願明細書に記載された１つ以上のプロセスをプロセッサ３２０に実行させてもよい。さらに、または代わりに、本願明細書に記載の１つ以上のプロセスを実行するために、配線による回路構成がソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて使用されてもよい。したがって、本願明細書に記載された実施形態は、ハードウェア回路とソフトウェアとのいかなる特定の組み合わせにも限定されない。

図３に示されたコンポーネントの数および配置は、例として示されている。実際には、装置３００は、図３に示されたものと比べて、追加のコンポーネント、より少ないコンポーネント、異なるコンポーネントまたは別様に配置されたコンポーネントを含み得る。さらに、または代わりに、装置３００のコンポーネントのセット（例えば、１つ以上のコンポーネント）が、装置３００のコンポーネントの別のセットにより実行されるものとして記載されている１つ以上の機能を実行し得る。

前述の開示は、例示および説明を提供するが、網羅的であることも、実装を開示された厳密な形態に限定することも意図していない。上記の開示を考慮して変更および変形を考え得るし、または実装の実践から変更および変形が習得されるかもしれない。

本願明細書で使用されるとき、コンポーネントという用語は、ハードウェア、ファームウェアおよび／またはハードウェアとソフトウェアとの組み合わせとして広く解釈されるよう意図される。

当然のことながら、本願明細書に記載されたシステムおよび／または方法は、異なる形態のハードウェア、ファームウェアまたはハードウェアとソフトウェアとの組み合わせに実装されてもよい。これらのシステムおよび／または方法を実装するために使用される実際の専用制御ハードウェアまたはソフトウェアコードは、実装を限定するものではない。したがって、システムおよび／または方法の動作および挙動は、特定のソフトウェアコードを参照することなく本願明細書に記載されたが、当然のことながら、ソフトウェアおよびハードウェアを、本願明細書の記載に基づきシステムおよび／または方法を実装するよう設計できる。

特徴の特定の組み合わせが特許請求の範囲に記載されおよび／または明細書で開示されるが、これらの組み合わせは可能な実装の開示を限定することを意図されたものではない。実際には、これらの特徴の多くが、具体的に特許請求の範囲に記載および／または明細書に開示されなかった形で組み合わされてもよい。下記に列挙される各従属請求項は、１つのみの請求項に直接従属するかもしれないが、可能な実装の開示は、請求項のセットの中の他のすべての請求項と組み合わせた各従属請求項を含む。

本願明細書で使用されるいずれの構成要素、動作または命令も、重要または必須とは、そのように明示的に記載されない限りは、解釈されてはならない。さらに、本願明細書で使用されるとき、冠詞「ａ」および「ａｎ」は、１つ以上の項目を含むよう意図され、「１つ以上」と交換可能なように使用され得る。さらに、本願明細書で使用されるとき、「セット」という用語は、１つ以上の項目（例えば、関係する項目、無関係の項目、関係する項目と無関係の項目との組み合わせなど）を含むよう意図され、「１つ以上」と交換可能なように使用され得る。１つのみの項目が意図される場合、「１つの」という用語または同様の文言が使用される。さらに、本願明細書で使用されるとき、「有する、有している」という用語または同様のものは、非限定的な用語であるものと意図される。さらに、「に基づき」という語句は、別段の記載が明示的にされない限り「少なくとも一部に基づき」を意味するよう意図される。

Claims

少なくとも１つのプロセッサによって実行される、点群の属性情報をコード化するための方法であって、
３次元空間内の点のセットを含む前記点群を取得するステップと、
ＹＣｏＣｇ－Ｒ変換を使用して前記点群の前記属性情報をコード化するステップと、を含む方法。
前記ＹＣｏＣｇ－Ｒ変換を使用して前記属性情報をコード化することに基づいて前記点群を送信することをさらに含む、請求項１に記載の方法。
前記ＹＣｏＣｇ－Ｒ変換は、グラフベースの点群圧縮（Ｇ－ＰＣＣ）に使用される、請求項１または２に記載の方法。
Ｃｏ＝Ｒ－Ｂである、請求項１乃至３のいずれか１項に記載の方法。
ｔ＝Ｂ＋（Ｃｏ＞＞１）である、請求項１乃至４のいずれか１項に記載の方法。
Ｃｇ＝Ｇ－ｔである、請求項１乃至５のいずれか１項に記載の方法。
Ｙ＝ｔ＋（Ｃｇ＞＞１）である、請求項１乃至６のいずれか１項に記載の方法。
点群の属性情報をコード化するための装置であって、
プログラムコードを記憶するように構成された少なくとも１つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードの指示に従って動作するように構成された少なくとも1つのプロセッサと、を含み、
前記プログラムコードは、
前記少なくとも１つのプロセッサに、請求項１乃至６のいずれか１項に記載の方法を実行させる、装置。
点群の属性情報をコード化するための装置の１つ以上のプロセッサによって実行されると、前記１つ以上のプロセッサに、請求項１乃至６のいずれか１項に記載の方法を実行させる１つ以上の命令を含む、プログラム。