JP2023520565A - 3dジオメトリを構築するための方法、装置およびプログラム - Google Patents

3dジオメトリを構築するための方法、装置およびプログラム Download PDF

Info

Publication number
JP2023520565A
JP2023520565A JP2022560507A JP2022560507A JP2023520565A JP 2023520565 A JP2023520565 A JP 2023520565A JP 2022560507 A JP2022560507 A JP 2022560507A JP 2022560507 A JP2022560507 A JP 2022560507A JP 2023520565 A JP2023520565 A JP 2023520565A
Authority
JP
Japan
Prior art keywords
hash table
size
current point
bounding boxes
checkpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022560507A
Other languages
English (en)
Inventor
シャン・ジャン
ウェン・ガオ
シャン・リュウ
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2023520565A publication Critical patent/JP2023520565A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/56Particle system, point based geometry or rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Discrete Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Revetment (AREA)

Abstract

本開示の態様は、点群圧縮のための方法、装置、および非一時的なコンピュータ可読記憶媒体を含む。装置は、点群の複数の点の現在点に関連する情報を符号化する処理回路を含む。複数の点は、複数のバウンディングボックスに分割される。処理回路は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であるかを判定する。処理回路は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であることに基づいて、複数のバウンディングボックス内の非境界点に関連する情報をハッシュテーブルから除去する。処理回路は、現在点に関する符号化された情報をハッシュテーブルに記憶する。

Description

参照による援用
本願は、2021年3月5日に出願された米国仮出願第63/157,519号「UPDATES ON HASH SHRINKING FOR POINT CLOUD CODING」に対する優先権の利益を主張する、2021年10月14日に出願された米国特許出願公開第17/501,779号「METHOD AND APPARATUS FOR CONSTRUCTING A 3D GEOMETRY」に対する優先権の利益を主張する。先行する出願の開示が完全な状態で本出願で参照により援用される。
本開示は、ハッシュ縮小方法を含む、点群コーディング(PCC)に概して関連する実施形態を説明する。
本明細書で提供される背景技術の説明は、本開示の文脈を一般的に提示することを目的としている。本発明者らの研究は、この研究がこの背景技術の項で説明されている限りにおいて、および出願時に従来技術と見なされ得ない説明の態様は、本開示に対する従来技術として明示的にも暗示的にも認められない。
点群は、近年広く利用されている。例えば、点群は、オブジェクト検出および位置特定を行うために自動運転車両で、マッピングを行うために地理情報システム(geographic information systems:GIS)で、また文化遺産のオブジェやコレクションを視覚化したり、保管したりするために、文化遺産で、等々使用され得る。
本開示の態様は、点群圧縮のための装置を提供する。装置は、点群の複数の点の現在点に関連する情報を符号化する処理回路を含む。複数の点は、複数のバウンディングボックスに分割される。処理回路は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であるかを判定する。処理回路は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であることに基づいて、複数のバウンディングボックス内の非境界点に関連する情報をハッシュテーブルから除去する。処理回路は、現在点に関する符号化された情報をハッシュテーブルに記憶する。
実施形態では、処理回路は、現在点のチェックポイントが、保存されたチェックポイントと等しいかどうかを判定する。現在点のチェックポイントは、複数のバウンディングボックスのそれぞれの境界サイズと現在点の位置とに基づいて生成される。処理回路は、現在点のチェックポイントが保存されたチェックポイントと等しくないことに基づいて、ハッシュテーブルから複数のバウンディングボックス内の非境界点に関連する情報を削除する。処理回路は、現在点のチェックポイントに基づいて保存されたチェックポイントを修正する。
実施形態では、処理回路は、第2のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であるかを判定する。処理回路は、第2のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であることに基づいて、複数のバウンディングボックス内の残りのすべての点に関連する情報をハッシュテーブルから除去する。
実施形態では、処理回路は、ハッシュテーブルから複数のバウンディングボックス内の残りのすべての点に関連する情報を削除する。
実施形態では、処理回路は、ハッシュテーブルの所定の最大サイズまたは複数のバウンディングボックスのそれぞれの境界サイズの少なくとも一方を、ビットストリームに符号化する。
実施形態では、処理回路は、モードインデックスをビットストリームに符号化し、モードインデックスは、複数のハッシュテーブル縮小モードのうちの1つを示す。
実施形態では、処理回路は、モードインデックスに基づいて、ハッシュテーブルの所定の最大サイズまたは複数のバウンディングボックスのそれぞれの境界サイズの少なくとも一方を符号化する。
実施形態では、現在点に関連する情報は、現在のブロックに関連するジオメトリ情報または属性情報のうちの1つを含む。
本開示の態様は、点群圧縮のための方法を提供する。方法は、点群圧縮のために装置によって実行される処理のいずれか1つまたは組み合わせを実行することができる。この方法では、点群の複数の点のうちの現在点に関する情報が符号化される。複数の点は、複数のバウンディングボックスに分割される。第1のハッシュテーブルのサイズが、ハッシュテーブルの所定の最大サイズ以上であるかが判定される。複数のバウンディングボックス内の非境界点に関連する情報は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であることに基づいて、ハッシュテーブルから除去される。現在点に関する符号化された情報は、ハッシュテーブルに記憶される。
本開示の態様はまた、少なくとも1つのプロセッサによって実行されるときに、少なくとも1つのプロセッサに、点群圧縮のための方法の任意の1つまたは組み合わせを実行させる命令を記憶する非一時的コンピュータ可読媒体を提供する。
本開示の主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明、および添付の図面でより明らかになるであろう。
本開示の実施形態によるリフティングベースの属性コーディングにおける例示的な順変換を示す。 本開示の実施形態によるリフティングベースの属性コーディングにおける例示的な逆変換を示す。 本開示の実施形態による、領域適合型階層変換ベースの属性コーディングにおける例示的な順変換を示す。 本開示の実施形態による、領域適合型階層変換ベースの属性コーディングにおける例示的な逆変換を示す。 本開示の実施形態によるバウンディングボックスの例示的な二次元図を示す。 本開示の実施形態による例示的なハッシュ縮小アルゴリズムを示す。 本開示の実施形態による別の例示的なハッシュ縮小アルゴリズムを示す。 本開示の実施形態による別の例示的なハッシュ縮小アルゴリズムを示す。 本開示の実施形態による別の例示的なハッシュ縮小アルゴリズムを示す。 本開示の実施形態による例示的なフローチャートを示す。 本開示の実施形態による別の例示的なフローチャートを示す。 本開示の実施形態によるコンピュータシステムの概略図である。
I.点群圧縮
点群は、3次元(3D)の点などの高次元の点のセットを含むことができる。各3D点は、3D位置情報と、色、反射率などの追加の属性とを含むことができる。情報は、様々な設定で、複数のカメラおよび深度センサ、またはLidarを使用して取り込むことができ、また元の情景をリアルに表すべく数千から数十億もの点で構成することができる。
より高速な送信、またはストレージの低減を目的として、点群を表すために要するデータ量を削減するために、圧縮技術が必要とされている。国際標準化機構/国際電気標準会議(ISO/IEC)動画専門家グループ(MPEG)は、静的または動的なクラウドのための圧縮技術を標準化するためのアドホックグループ(MPEG-PCC)を作成した。
MPEGにおけるテストモデル13(TMC13)などのいくつかの関連する例では、ジオメトリ情報と、色または反射率情報などの関連する属性とが別々に圧縮される。点群の3D座標の値であるジオメトリ情報は、関連する占有率情報を伴ったオクツリー分割を使用することで、コード化される。次いで、属性は、予測ベースの属性コーディング技術、リフティングベースの属性コーディング技術、または領域適応型階層変換(RAHT)ベースの属性コーディング技術などの別個の属性コーディング技術を使用して、再構築されたジオメトリに基づいて圧縮される。
以下の説明では、点群の表現の例として、1つの詳細レベル(LoD)のみが使用される。
予測ベース属性コーディングでは、(Pi=1...Nは点群内の点と関連付けられた位置の集合であり、(Mi=1...Nは(Pi=1...Nと関連付けられたモートンコードである。まず、関連付けられたモートンコードに従って点を昇順にソートする。Iを、このプロセスに従って順序付けられた点のインデックスの配列とする。エンコーダ(またはデコーダ)は、Iによって定められた順序に従って各点を圧縮(または解凍)する。各反復iにおいて、点Pが選択される。Pからs(例えば、s=64)個の前の点までの距離が解析され、Pのk(例えば、k=3である)個の最近傍が予測に使用されるように選択される。より正確には、属性値(ai∈0...k-1は、点iの最近傍の距離に基づく線形補間プロセスを使用することによって予測される。
Figure 2023520565000002
を現在点iのk最近傍集合とし、
Figure 2023520565000003
をそれらの復号(または再構築)された属性値とし、
Figure 2023520565000004
を現在点までのそれらの距離とする。予測属性値
Figure 2023520565000005
が以下によって得られる。
Figure 2023520565000006
リフティングベースの属性コーディングは、予測ベースの属性コーディングに基づく。予測ベースの属性コーディングと比較した主な違いは、リフティングベースの属性コーディングに2つの追加のステップが導入されていることである。第1のステップは更新演算子を導入することであり、第2のステップは適合する量子化戦略を使用することである。図1および図2は、本開示の実施形態によるリフティングベースの属性コーディングにおける例示的な順変換および例示的な逆変換をそれぞれ示す。
図3Aおよび図3Bは、本開示の実施形態によるRAHTベースの属性コーディングにおける例示的な順変換および例示的な逆変換をそれぞれ示す。図3A~図3Bの
Figure 2023520565000007
および
Figure 2023520565000008
において、wは入力係数Fl+1、2nの重みの表記であり、対してwはFl+1、2n+1の重みの表記である。
II.点群のハッシュベースの圧縮
本開示の態様によれば、ハッシュベースの隣接情報アクセス方法は、点群圧縮におけるジオメトリコーディングおよび属性コーディングに使用することができる。
コード化されたジオメトリ(または属性)情報は、ハッシュテーブルに保存され、後のコード化されたノードの予測子として取得され得る。ハッシュテーブルは、再構築されたジオメトリ(または属性)値を格納するために使用することができる。例えば、ハッシュテーブルHが維持され、ハッシュテーブルの鍵は、点の3D座標のMortonコード、すなわち、M=Morton(x,y,z)とすることができ、(x,y,z)は、i番目の点の3D座標である。モートンコードMをキーとして使用して、再構築されたジオメトリ(または属性)値をハッシュテーブルH内で直接アクセスすることができる。H(M)がNULLの場合、位置(x,y,z)は占有されておらず、位置(x,y,z)に関連付けられたジオメトリ(または属性)値が存在しないか、または、位置(x,y,z)に関連付けられたジオメトリ(または属性)値がまだコード化されていないことを示す。
現在点のジオメトリ(または属性)値をコーディング(またはデコーディング)するとき、現在点に隣接している点の以前コーディングされたジオメトリ(または属性)値をハッシュテーブルHから取得し、現在点の予測子として使用することができる。現在点のジオメトリ(または属性)値をコーディング(またはデコーディング)した後、現在点の再構築されたジオメトリ(または属性)値はハッシュテーブルHに格納される。
本開示の態様によれば、ハッシュテーブルのサイズは、ハッシュ縮小技術に基づいて低減され得る。ハッシュテーブルのサイズがハッシュテーブルの最大サイズを超える場合、ハッシュ縮小技術を使用することができる。点群の点は複数のバウンディングボックスに分割することができるため、コーディング効率を維持しながらハッシュテーブルのサイズを縮小するために、特定の点を除去することができる。1つの方法では、点群の複数のバウンディングボックスの境界にないすべての点を除去し、境界点を保持することができる。
いくつかの実施形態では、複数の境界点が、1つ以上の条件下で最大ハッシュテーブルサイズを超えることを許容し得る。例えば、点群がジオメトリにおいて密な分布を有する(例えば、点群内の点が密集して分布している)場合、境界の点の数は最大ハッシュテーブルサイズよりも大きくなり得る。この場合、ハッシュテーブルの実際のサイズは最大ハッシュテーブルサイズを超える可能性があるため、最大ハッシュテーブルサイズは、ハード閾値ではなくソフト閾値とすることができる。
本開示は、実際のハッシュテーブルサイズをさらに低減するためのハッシュ縮小戦略を含む。いくつかの縮小戦略は、コーディング効率の損失をもたらす可能性がある。ハッシュ縮小戦略は、PCCアプリケーションにおけるジオメトリコーディングおよび属性コーディングの一方または両方に適用できることに留意されたい。
ハッシュ縮小戦略は、MPEGにおけるTMC13ソフトウェアまたはPCC、またはオーディオビデオコーディング規格(AVS)におけるPCCに限定されないことに留意されたい。ハッシュ縮小戦略は、PCCシステムのための一般的な解決策であり得る。
いくつかの実施形態では、ハッシュ縮小方法に少なくとも1つのパラメータを導入することができる。第1のパラメータは最大ハッシュテーブルサイズとすることができ、第2のパラメータは点群の複数のバウンディングボックスの各々の境界サイズとすることができる。最大ハッシュテーブルサイズは、log2のスケールで定めることができる。例えば、パラメータKは、ハッシュテーブルの最大サイズを2と定める。境界サイズも、log2のスケールで定めることができる。例えば、Mは、3D空間における(2,2,2)のバウンディングボックスを定める。これらの2つのパラメータは、すべての場合に固定され得るか、または場合によって異なるように構成され、シーケンスパラメータセット、ジオメトリパラメータセット、スライスヘッダなどの高レベルのシンタックスの一部としてビットストリームで送信され得ることに留意されたい。ハッシュテーブルが最大容量に達すると、ハッシュテーブル内の一部または全部の要素を除去することによって、ハッシュテーブルを縮小することができる。どの要素が除去されるべきかに関する規則は、異なる状況において異なり得る。
本開示の態様によれば、ハッシュテーブルが最大容量に達したときに、点群内の非境界点の情報を記憶する要素をハッシュテーブルから除去することができる。
図4は、本開示の実施形態によるバウンディングボックス(401)~(404)の例示的な二次元の図を示し、バウンディングボックス(401)~(403)は符号化されているが、バウンディングボックス(404)はまだ符号化されていない。各バウンディングボックスにおいて、斜線の領域は境界点を表す。例えば、斜線領域(411)はバウンディングボックス(401)の境界点を表し、領域(412)はバウンディングボックス(401)の非境界点を表す。境界点は、バウンディングボックスの2次元表現の下側および/または右側に位置することに限定されないことに留意されたい。他の場合には、境界点は、バウンディングボックスの2次元表現の左側および/または上側など、サイドの1つまたは複数の他の組み合わせに配置することができる。
図5は、本開示の実施形態によるハッシュ縮小アルゴリズムを示す。このハッシュ縮小アルゴリズムでは、バウンディングボックスの非境界点の情報を記憶するハッシュテーブル内の要素が、ハッシュテーブルから除去される。例えば、各バウンディングボックスが3D空間において(2,2,2)のサイズを有する場合、境界点の少なくとも1つの位置座標は2i*M-1(i=1,2,3,...)に等しい。本実施形態では、境界点の情報を記憶するすべてのハッシュ要素を保持し、残りの要素をハッシュテーブルから削除することができる。
図6は、本開示の実施形態による別のハッシュ縮小アルゴリズムを示す。このハッシュ縮小アルゴリズムでは、コーディング効率損失を制限するために、現在点pが新しいバウンディングボックスに到達したときにのみ縮小動作を適用することができる。例えば、入力されている点群内の点がモートンオーダーなどの特定の順序でソートされていると仮定する。チェックポイントを使用して、現在点pが新しいバウンディングボックスに到達するかどうかを調べることができる。現在点pのチェックポイントの座標は、(p.x>>M,p.y>>M,p.z>>M)として定めることができ、ここで、2は境界サイズである。現在点pのチェックポイントが、保存されたチェックポイントと異なる場合、それは、現在点が、保存されたチェックポイントを含まない新しいバウンディングボックスに到達したということを示し、次に縮小動作を適用することができ、保存されたチェックポイントを現在点のチェックポイントとして更新することができる。例として図4を使用すると、初期チェックポイントは、バウンディングボックス(401)において(0,0,0)として設定することができ、M=4で、各バウンディングボックスの境界サイズが16になる。現在点pが(20,20,20)にある場合、現在点pのチェックポイントは(20>>4,20>>4,20>>4)=(1,1,1)であり、これは初期チェックポイント(0,0,0)とは異なる。これは、現在点pがバウンディングボックス(402)に到達することを意味し、したがって、ハッシュテーブルのサイズが最大ハッシュテーブルサイズを超える場合、縮小操作を適用することができる。
図7は、本開示の実施形態による別の縮小アルゴリズムを示す。この縮小アルゴリズムでは、図6に示すように非境界点を除去することによってハッシュテーブルを縮小した後、ハッシュテーブルサイズが依然として定義された閾値(例えば、最大ハッシュテーブルサイズ)より大きい場合、ハッシュテーブル内の追加の点を除去することができる。実施形態では、ハッシュテーブル内のすべての点を除去することができる。実施形態では、図6に示すように非境界点を除去することによってハッシュテーブルを縮小した後、ハッシュテーブルサイズが依然として定義された閾値より大きい場合、ハッシュテーブル内のすべての点を除去する代わりに、特定の規則に基づいて特定の点を除去することができる。例えば、特定の規則に基づいて、ハッシュテーブルに最初に追加された点を削除することができ、ハッシュテーブル内のより小さいモートンコードの点を削除することができる、などである。
図8は、本開示の実施形態による別の縮小アルゴリズムを示す。この縮小アルゴリズムでは、Kによって定められる最大ハッシュサイズは、ハード閾値である。すなわち、ハッシュテーブルサイズがハード閾値を超えると、ハッシュテーブルを空にすることができる。実施形態では、ハッシュテーブルは、すべての点を除去することによって空にされる。この場合、縮小条件はもはや境界サイズMに依存しないため、境界サイズMを省略することができる。
いくつかの実施形態では、K=maxHashSizeLog2やM=hashBoundarySizeLog2などのハッシュ縮小アルゴリズムにおける所定のパラメータをシグナリングすることができる。いくつかの実施形態では、所定のパラメータを高いレベルのシンタックスでシグナリングすることができる。さらに、縮小モードインデックスをシグナリングして、異なる縮小方針間で切り替えることができる。例えば、これらのパラメータは、ビットストリームのシーケンスヘッダ、スライスヘッダ、ジオメトリパラメータセット(GPS)、またはアトリビュートパラメータセット(APS)において指定され得る。これらの縮小戦略はジオメトリコーディングと属性コーディングの両方に使用できるため、パラメータはジオメトリコーディングと属性コーディングとで異なるように構成できる。したがって、2セットのパラメータを、それぞれGPSおよびAPSでシグナリングすることができる。
一実施形態では、表1に示すように、KおよびMは、GPSにおけるジオメトリコーディングのためにシグナリングされる。シンタックス要素gps_hash_max_size_log2は、ジオメトリコーディングのための最大ハッシュテーブルサイズをlog2、すなわちK=gps_hash_max_size_log2で定義する。シンタックス要素gps_hash_boundary_size_log2は、ジオメトリコーディングのため、境界サイズをlog2、すなわちM=gps_hash_boundary_size_log2で定義する。シンタックス要素gps_hash_shrink_modeは、ジオメトリコーディングのための異なるハッシュ縮小戦略を指定する。
Figure 2023520565000009
一実施形態では、表2に示すように、KおよびMは、APSにおける属性コーディングのためにシグナリングされる。シンタックス要素aps_hash_max_size_log2は、属性コーディングのため、log2における最大ハッシュテーブルサイズ、すなわちK=aps_hash_max_size_log2を定義する。シンタックス要素gps_hash_boundary_size_log2は、属性コーディングのための境界サイズをlog2、すなわちM=gps_hash_boundary_size_log2で定義する。シンタックス要素aps_hash_shrink_modeは、属性コーディングのための異なるハッシュ縮小戦略を指定する。
Figure 2023520565000010
いくつかの実施形態では、異なる縮小戦略は、異なるパラメータセットを有することができる。表3は、APSにおける異なるパラメータセットを示しているが、GPSにおいても同じシグナリング方法を適用することができる。シンタックス要素aps_hash_mode0_param0およびaps_hash_mode0_param1は、シンタックス要素aps_hash_shrink_modeが0に等しいときの例示的なパラメータである。例えば、シンタックス要素aps_hash_mode0_param0およびaps_hash_mode0_param1は、それぞれ第1の最大ハッシュテーブルサイズの値および第1の境界サイズの値とすることができる。シンタックス要素aps_hash_mode1_param0およびaps_hash_mode1_param1は、シンタックス要素aps_hash_shrink_modeが1に等しいときの例示的なパラメータである。例えば、シンタックス要素aps_hash_mode1_param0およびaps_hash_mode1_param1は、それぞれ第2の最大ハッシュテーブルサイズの値および第2の境界サイズの値とすることができる。
Figure 2023520565000011
III.フローチャート
図9は、本開示の一実施形態による例示的なプロセス(900)の概要を示すフローチャートを示す。様々な実施形態で、プロセス(900)は、図11に示す処理回路などの処理回路によって、実行される。いくつかの実施形態では、プロセス(900)はソフトウェア命令で実装され、したがって、処理回路がソフトウェア命令を実行すると、処理回路はプロセス(900)を実行する。
プロセス(900)は、一般に、ステップ(S910)で開始することができ、プロセス(900)は、点群の複数の点の現在点に関連する情報を符号化する。複数の点は、複数のバウンディングボックスに分割される。次いで、プロセス(900)は、ステップ(S920)に進む。
ステップ(S920)において、プロセス(900)は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であるかを判定する。次いで、プロセス(900)は、ステップ(S930)に進む。
ステップ(S930)において、プロセス(900)は、第1のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であることに基づいて、複数のバウンディングボックス内の非境界点に関連する情報をハッシュテーブルから除去する。次いで、プロセス(900)は、ステップ(S940)に進む。
ステップ(S940)において、プロセス(900)は、現在点に関する符号化された情報をハッシュテーブルに格納する。次に、プロセス(900)が終了する。
実施形態では、プロセス(900)は、現在点のチェックポイントが、保存されたチェックポイントと等しいかどうかを判定する。現在点のチェックポイントは、複数のバウンディングボックスの各々の境界サイズに基づいて判定される。プロセス(900)は、現在点のチェックポイントが保存されたチェックポイントと等しくないことに基づいて、ハッシュテーブルから複数のバウンディングボックス内の非境界点に関連する情報を削除する。プロセス(900)は、現在点のチェックポイントに基づいて保存されたチェックポイントを修正する。
実施形態では、プロセス(900)は、第2のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であるかを判定する。プロセス(900)は、第2のハッシュテーブルのサイズがハッシュテーブルの所定の最大サイズ以上であることに基づいて、複数のバウンディングボックス内の残りのすべての点に関連する情報をハッシュテーブルから除去する。
実施形態では、プロセス(900)は、ハッシュテーブルから複数のバウンディングボックス内の残りのすべての点に関連する情報を削除する。
実施形態では、プロセス(900)は、ハッシュテーブルの所定の最大サイズまたは複数のバウンディングボックスのそれぞれの境界サイズの少なくとも一方を、ビットストリームに符号化する。
実施形態では、プロセス(900)は、モードインデックスをビットストリームに符号化し、モードインデックスは、複数のハッシュテーブル縮小モードのうちの1つを示す。
実施形態では、プロセス(900)は、モードインデックスに基づいて、ハッシュテーブルの所定の最大サイズまたは複数のバウンディングボックスのそれぞれの境界サイズの少なくとも一方を符号化する。
実施形態では、現在点に関連する情報は、現在のブロックに関連するジオメトリ情報または属性情報のうちの1つを含む。
図10は、本開示の一実施形態による例示的なプロセス(1000)の概要を示す別のフローチャートを示す。様々な実施形態で、プロセス(1000)は、図11に示す処理回路などの処理回路によって、実行される。いくつかの実施形態では、プロセス(1000)はソフトウェア命令で実施され、したがって、処理回路がソフトウェア命令を実行すると、処理回路はプロセス(1000)を実行する。
プロセス(1000)は、一般に、ステップ(S1010)で開始することができ、プロセス(1000)は、点群の第1の点のサブセットに関連するコード化情報を記憶するハッシュテーブルを含むビットストリームを受信する。点群の第2の点のサブセットは、第1の点のサブセット内の点の数に基づいてハッシュテーブルから省かれるか、そうでなければ除去され、第2の点のサブセットは、所定の最大ハッシュテーブルサイズよりも大きい。点群の点は複数のバウンディングボックスに分割され、第2の点のサブセットは複数のバウンディングボックスの非境界点を含む。その後、プロセス(1000)はステップ(S1020)に進む。
ステップ(S1020)において、プロセス(1000)は、点群の第1の点のサブセットと関連付けられたコード化情報をデコードする。その後、プロセス(1000)はステップ(S1030)に進む。
ステップ(S1030)において、プロセス(1000)は、点群の第1の点のサブセットと関連付けられたデコード情報に基づいて、点群を再構築する。次に、プロセス(1000)は終了する。
IV.コンピュータシステム
上記で説明された技術は、1つ以上のコンピュータ可読媒体に物理的に記憶された、コンピュータ可読命令を使用するコンピュータソフトウェアとして実施され得る。例えば、図11は、開示されている主題の特定の実施形態を実施するのに適したコンピュータシステム(1100)を示す。
コンピュータソフトウェアは、1つ以上のコンピュータ中央処理装置(CPU:central processing unit)およびグラフィック処理装置(GPU:Graphics Processing Unit)などによって直接的に、または解釈およびマイクロコードの実行などを通して実行され得る命令を含むコードを作成するために、アセンブリ、コンパイル、リンキング、または同様のメカニズムを受け得る任意の適切な機械コードまたはコンピュータ言語を使用してコード化され得る。
命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーミングデバイス、およびモノのインターネットデバイスなどを含む様々なタイプのコンピュータまたはその構成要素上で実行され得る。
コンピュータシステム(1100)に関して図11に示されている構成要素は、本質的に例示であり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関する限定を示唆することを意図されていない。また、構成要素の構成は、コンピュータシステム(1100)の例示的な実施形態に示す構成要素のいずれか1つまたは組み合わせに関連する依存性または要件を有すると解釈されるべきではない。
コンピュータシステム(1100)は、特定のヒューマンインターフェース入力デバイスを含むことができる。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、音声入力(声、拍手など)、視覚入力(ジェスチャなど)、嗅覚入力(図示せず)を通して1人または複数の人間のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ(音声、音楽、環境音など)、画像(走査画像、写真画像は静止画像カメラから取得など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)などの、必ずしも人間による意識的な入力に直接関連しない特定の媒体を取り込むためにも使用され得る。
入力ヒューマンインターフェースデバイスは、キーボード(1101)、マウス(1102)、トラックパッド(1103)、タッチスクリーン(1110)、データグローブ(図示せず)、ジョイスティック(1105)、マイクロフォン(1106)、スキャナ(1107)、およびカメラ(1108)(それぞれの1つのみが示されている)のうちの1つ以上を含み得る。
コンピュータシステム(1100)はまた、特定のヒューマンインターフェース出力デバイスを含むことができる。そのようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、および嗅覚/味覚を通して、1人または複数の人間のユーザの感覚を刺激することができる。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン(1110)、データグローブ(図示せず)、またはジョイスティック(1105)による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る)、オーディオ出力デバイス(スピーカ(1109)、ヘッドホン(図示せず)など)、視覚出力デバイス(CRT画面、LCD画面、プラズマ画面、OLED画面を含むスクリーン(1110)などであって、それぞれタッチスクリーン入力機能の有無にかかわらず、触覚フィードバック機能の有無にかかわらず、その一部は、2次元の視覚出力または立体出力などの手段による3次元以上の出力を出力することが可能であり得る、仮想現実メガネ(図示せず)、ホログラフィックディスプレイ、スモークタンク(図示せず))、ならびにプリンタ(図示せず)を含むことができる。これらの視覚出力デバイス(スクリーン(1110)など)は、グラフィックアダプタ(1150)を介してシステムバス(1148)に接続され得る。
コンピュータシステム(1100)はまた、CD/DVDなどの媒体(1121)を備えたCD/DVD ROM/RW(1120)を含む光学媒体、サムドライブ(1122)、リムーバブルハードドライブまたはソリッドステートドライブ(1123)、テープおよびフロッピーディスクなどのレガシー磁気媒体(図示せず)、セキュリティドングル(図示せず)などの特殊なROM/ASIC/PLDベースのデバイスなどの、人間がアクセス可能な記憶装置およびその関連媒体を含むことができる。
当業者はまた、本開示の主題に関連して使用される「コンピュータ可読媒体」という用語が伝送媒体、搬送波、または他の一時的信号を包含しないことを理解すべきである。
コンピュータシステム(1100)はまた、1つ以上の通信ネットワーク(1155)へのネットワークインターフェース(1154)を含み得る。1つ以上の通信ネットワーク(1155)は、例えば、無線、有線、光であり得る。1つ以上の通信ネットワーク(1155)はさらに、ローカル、ワイドエリア、メトロポリタン、車両および産業、リアルタイム、ならびに遅延耐性などであり得る。1つ以上の通信ネットワーク(1155)の例は、イーサネット、無線LANなどのローカルエリアネットワーク、GSM、3G、4G、5G、およびLTEなどを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上放送TVを含む有線または無線TVワイドエリアデジタルネットワーク、ならびにCANBusを含む車両および産業用のものなどを含む。特定のネットワークは通常、特定の汎用データポートまたはペリフェラルバス(1149)(例えば、コンピュータシステム(1100)のUSBポート)に接続された外部ネットワークインターフェースアダプタを必要とし、他のものは、一般に、以下に説明するようにシステムバスに接続することによってコンピュータシステム(1100)のコアに統合される(例えば、PCコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース)。これらのネットワークのいずれかを使用して、コンピュータシステム(1100)は他のエンティティと通信することができる。このような通信は、単一方向、受信のみ(例えば、テレビ放送)、単一方向の送信のみ(例えば、CANbusから特定のCANbusデバイスへ)、または双方向、例えば、ローカルまたはワイドエリアデジタルネットワークを使用する他のコンピュータシステムに対して行うことができる。特定のプロトコルおよびプロトコルスタックは、上記で説明されたように、それらのネットワークおよびネットワークインターフェースの各々で使用され得る。
前述のヒューマンインターフェースデバイス、ヒューマンアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム(1100)のコア(1140)に取り付けることができる。
コア(1140)は、1つ以上の中央処理装置(CPU)(1141)、グラフィック処理装置(GPU)(1142)、フィールドプログラマブルゲート領域(FPGA:Field Programmable Gate Area)(1143)の形式の専用のプログラマブル処理装置、特定のタスク用のハードウェアアクセラレータ(1144)、およびグラフィックアダプタ(1150)などを含み得る。これらのデバイスは、読み出し専用メモリ(ROM:Read-only memory)(1145)、ランダムアクセスメモリ(1146)、ユーザアクセス不可能な内蔵ハードドライブおよびSSDなどの内部大容量記憶装置(1147)と共に、システムバス(1148)を介して接続され得る。一部のコンピュータシステムでは、システムバス(1148)に1つまたは複数の物理プラグの形態でアクセスして、追加のCPU、GPUなどによる拡張を可能にすることができる。周辺装置は、コアのシステムバス(1148)に直接接続することも、ペリフェラルバス(1149)を介して接続することもできる。一例では、スクリーン(1110)はグラフィックアダプタ(1150)に接続され得る。周辺バスのアーキテクチャは、PCIおよびUSBなどを含む。
CPU(1141)、GPU(1142)、FPGA(1143)、およびアクセラレータ(1144)は、組み合わせて前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ROM(1145)またはRAM(1146)に格納され得る。移行データはRAM(1146)に格納することもできるが、永続データは、例えば内部大容量記憶装置(1147)に格納することができる。メモリデバイスのいずれかへの高速な格納および読み出しは、1つまたは複数のCPU(1141)、GPU(1142)、大容量記憶装置(1147)、ROM(1145)、RAM(1146)などに密接に関連するキャッシュメモリを使用することで可能になり得る。
コンピュータ可読媒体は、様々なコンピュータ実施動作を実行するためのコンピュータコードを有し得る。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構成されたものであり得るし、またはそれらは、コンピュータソフトウェア技術の当業者に周知の利用可能な種類のものであり得る。
一例として、限定するものではないが、アーキテクチャを有するコンピュータシステム(1100)、具体的にはコア(1140)は、プロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)が、1つまたは複数の有形のコンピュータ可読媒体に具現化されたソフトウェアを実行する結果として、機能性を提供することができる。このようなコンピュータ可読媒体は、上記で紹介したユーザアクセス可能な大容量記憶装置、ならびにコア内部大容量記憶装置(1147)またはROM(1145)などの非一時的な性質のコア(1140)の特定の記憶装置に関連する媒体であり得る。本開示の様々な実施形態を実施するソフトウェアは、そのようなデバイスに格納され、コア(1140)によって実行され得る。コンピュータ可読媒体は、特定の必要性に応じて、1つまたは複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア(1140)および具体的にはその中のプロセッサ(CPU、GPU、FPGAなどを含む)に、RAM(1146)に格納されたデータ構造を定義すること、およびソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することを含む、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または代替として、コンピュータシステムは、回路(例えば、アクセラレータ(1144))にハードワイヤードまたはその他の方法で具現化されたロジックの結果として機能性を提供することができ、それは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するために、ソフトウェアの代わりに、またはソフトウェアと共に動作することができる。必要に応じて、ソフトウェアへの言及にはロジックを含めることができ、その逆も可能である。適切な場合には、コンピュータ可読媒体への言及は、実行のためのソフトウェアを記憶する回路(集積回路(IC:integrated circuit)など)、実行のための論理を具現化する回路、またはこれらの両方を包含し得る。本開示は、ハードウェアとソフトウェアとの任意の適切な組み合わせを包含する。
本開示はいくつかの例示的な実施形態を説明してきたが、本開示の範囲内にある修正例、置換例、および様々な代替均等例がある。したがって、当業者は、本明細書に明示的に示されていないまたは記載されていないが、本開示の原理を具体化し、したがってその趣旨および範囲内にある多数のシステムおよび方法を考案することができることが理解されよう。
401 バウンディングボックス
402 バウンディングボックス
403 バウンディングボックス
404 バウンディングボックス
411 斜線領域
412 領域
900 プロセス
1000 プロセス
1100 コンピュータシステム
1101 キーボード
1102 マウス
1103 トラックパッド
1105 ジョイスティック
1106 マイクロフォン
1107 スキャナ
1108 カメラ
1109 オーディオ出力デバイススピーカ
1110 タッチスクリーン、視覚出力デバイススクリーン
1120 CD/DVD ROM/RW
1121 媒体
1122 サムドライブ
1123 ソリッドステートドライブ
1140 コア
1141 中央処理装置(CPU)
1142 グラフィック処理装置(GPU)
1143 フィールドプログラマブルゲート領域(FPGA)
1144 ハードウェアアクセラレータ
1145 読み出し専用メモリ(ROM)
1146 ランダムアクセスメモリ
1147 内部大容量記憶装置
1148 システムバス
1149 ペリフェラルバス
1150 グラフィックアダプタ
1154 ネットワークインターフェース
1155 通信ネットワーク

Claims (20)

  1. 点群の複数の点のうちの現在点に関連する情報を符号化するステップであって、前記複数の点が複数のバウンディングボックスに分割される、ステップと、
    第1のハッシュテーブルのサイズが前記ハッシュテーブルの所定の最大サイズ以上であるかを判定するステップと、
    前記第1の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であることに基づいて、前記ハッシュテーブルから前記複数のバウンディングボックス内の非境界点に関連する情報を除去するステップと、
    前記現在点に関連する前記符号化された情報を前記ハッシュテーブルに記憶するステップと
    を含む、点群圧縮のための方法。
  2. 除去する前記ステップが、
    前記現在点のチェックポイントが保存されたチェックポイントと等しいかどうかを判定するステップであって、前記現在点の前記チェックポイントが、前記複数のバウンディングボックスの各々の境界サイズおよび前記現在点の位置に基づいて生成される、ステップと、
    前記保存されたチェックポイントとは異なる前記現在点の前記チェックポイントに基づいて、前記ハッシュテーブルから前記複数のバウンディングボックス内の前記非境界点に関連する前記情報を除去するステップと、
    前記現在点の前記チェックポイントに基づいて、前記保存されたチェックポイントを修正するステップと、
    を含む、請求項1に記載の方法。
  3. 第2の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であるかを判定するステップと、
    前記第2の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であることに基づいて、前記複数のバウンディングボックス内の残りのすべての点に関連する情報を前記ハッシュテーブルから除去するステップと
    をさらに含む、請求項2に記載の方法。
  4. 前記ハッシュテーブルから前記複数のバウンディングボックス内の残りのすべての点と関連する情報を除去するステップをさらに含む、
    請求項1に記載の方法。
  5. 前記ハッシュテーブルの前記所定の最大サイズ、または前記複数のバウンディングボックスの各々の境界サイズのうちの少なくとも1つをビットストリームに符号化するステップをさらに含む、
    請求項1に記載の方法。
  6. モードインデックスをビットストリームに符号化するステップであって、前記モードインデックスは、複数のハッシュテーブル縮小モードのうちの1つを示す、ステップをさらに含む、
    請求項1に記載の方法。
  7. 前記モードインデックスに基づいて、前記ハッシュテーブルの前記所定の最大サイズ、または前記複数のバウンディングボックスの各々の境界サイズのうちの少なくとも1つを符号化するステップをさらに含む、
    請求項6に記載の方法。
  8. 前記現在点に関連する前記情報は、前記現在のブロックに関連するジオメトリ情報または属性情報のうちの1つを含む、請求項1に記載の方法。
  9. 点群の複数の点のうちの現在点に関連する情報を符号化し、前記複数の点が複数のバウンディングボックスに分割され、
    第1のハッシュテーブルのサイズが前記ハッシュテーブルの所定の最大サイズ以上であるかを判定し、
    前記第1の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であることに基づいて、前記ハッシュテーブルから前記複数のバウンディングボックス内の非境界点に関連する情報を除去し、
    前記現在点に関連する前記符号化された情報を前記ハッシュテーブルに記憶する
    ように構成された、処理回路
    を備える、装置。
  10. 前記処理回路が、
    前記現在点のチェックポイントが保存されたチェックポイントと等しいかどうかを判定し、前記現在点の前記チェックポイントが、前記複数のバウンディングボックスの各々の境界サイズおよび前記現在点の位置に基づいて生成され、
    前記保存されたチェックポイントとは異なる前記現在点の前記チェックポイントに基づいて、前記ハッシュテーブルから前記複数のバウンディングボックス内の前記非境界点に関連する前記情報を除去し、
    前記現在点の前記チェックポイントに基づいて、前記保存されたチェックポイントを修正する
    ように構成される、請求項9に記載の装置。
  11. 前記処理回路が、
    第2の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であるかを判定し、
    前記第2の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であることに基づいて、前記複数のバウンディングボックス内の残りのすべての点に関連する情報を前記ハッシュテーブルから除去する
    ように構成される、請求項10に記載の装置。
  12. 前記処理回路は、
    前記ハッシュテーブルから前記複数のバウンディングボックス内の残りのすべての点と関連する情報を除去する
    ように構成される、請求項9に記載の装置。
  13. 前記処理回路は、
    前記ハッシュテーブルの前記所定の最大サイズまたは前記複数のバウンディングボックスの各々の境界サイズのうちの少なくとも1つをビットストリームに符号化する
    ように構成される、請求項9に記載の装置。
  14. 前記処理回路が、
    モードインデックスをビットストリームに符号化し、前記モードインデックスは、複数のハッシュテーブル縮小モードのうちの1つを示す
    ように構成される、請求項9に記載の装置。
  15. 前記処理回路は、
    前記モードインデックスに基づいて、前記ハッシュテーブルの前記所定の最大サイズまたは前記複数のバウンディングボックスの各々の境界サイズのうちの少なくとも1つを符号化する
    ように構成される、請求項14に記載の装置。
  16. 前記現在点に関連する前記情報は、前記現在のブロックに関連するジオメトリ情報または属性情報のうちの1つを含む、請求項9に記載の装置。
  17. 少なくとも1つのプロセッサにより実行されるときに、前記少なくとも1つのプロセッサに、
    点群の複数の点のうちの現在点に関連する情報を符号化することであって、前記複数の点が複数のバウンディングボックスに分割される、符号化することと、
    第1のハッシュテーブルのサイズが前記ハッシュテーブルの所定の最大サイズ以上であるかを判定することと、
    前記第1の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であることに基づいて、前記ハッシュテーブルから前記複数のバウンディングボックス内の非境界点に関連する情報を除去することと、
    前記現在点に関連する前記符号化された情報を前記ハッシュテーブルに記憶することと
    を実行させる命令を記憶する、非一時的なコンピュータ可読記憶媒体。
  18. 前記除去することが、
    前記現在点のチェックポイントが保存されたチェックポイントと等しいかどうかを判定することであって、前記現在点の前記チェックポイントが、前記複数のバウンディングボックスの各々の境界サイズおよび前記現在点の位置に基づいて生成される、判定することと、
    前記保存されたチェックポイントとは異なる前記現在点の前記チェックポイントに基づいて、前記ハッシュテーブルから前記複数のバウンディングボックス内の前記非境界点に関連する前記情報を除去することと、
    前記現在点の前記チェックポイントに基づいて、前記保存されたチェックポイントを修正することと、
    を含む、請求項17に記載の非一時的なコンピュータ可読記憶媒体。
  19. 前記記憶された命令は、前記少なくとも1つのプロセッサに、
    第2の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であるかを判定することと、
    前記第2の前記ハッシュテーブルのサイズが前記ハッシュテーブルの前記所定の最大サイズ以上であることに基づいて、前記複数のバウンディングボックス内の残りのすべての点に関連する情報を前記ハッシュテーブルから除去することと
    を実行させる、請求項2に記載の非一時的なコンピュータ可読記憶媒体。
  20. 前記記憶された命令は、前記少なくとも1つのプロセッサに、
    前記ハッシュテーブルから前記複数のバウンディングボックス内の残りのすべての点と関連する情報を除去することを実行させる、
    請求項1に記載の非一時的なコンピュータ可読記憶媒体。
JP2022560507A 2021-03-05 2021-10-18 3dジオメトリを構築するための方法、装置およびプログラム Pending JP2023520565A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163157519P 2021-03-05 2021-03-05
US63/157,519 2021-03-05
US17/501,779 US20220284633A1 (en) 2021-03-05 2021-10-14 Method and apparatus for constructing a 3d geometry
US17/501,779 2021-10-14
PCT/US2021/055406 WO2022186861A1 (en) 2021-03-05 2021-10-18 Method and apparatus for constructing a 3d geometry

Publications (1)

Publication Number Publication Date
JP2023520565A true JP2023520565A (ja) 2023-05-17

Family

ID=83116260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022560507A Pending JP2023520565A (ja) 2021-03-05 2021-10-18 3dジオメトリを構築するための方法、装置およびプログラム

Country Status (6)

Country Link
US (1) US20220284633A1 (ja)
EP (1) EP4097974A4 (ja)
JP (1) JP2023520565A (ja)
KR (1) KR20220125735A (ja)
CN (1) CN115486079A (ja)
WO (1) WO2022186861A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11580671B2 (en) 2020-08-17 2023-02-14 Tencent America LLC Hash-based attribute prediction for point cloud coding

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7281006B2 (en) * 2003-10-23 2007-10-09 International Business Machines Corporation System and method for dividing data into predominantly fixed-sized chunks so that duplicate data chunks may be identified
US8832674B2 (en) * 2011-02-24 2014-09-09 Software Ag Usa, Inc. Off-heap direct-memory data stores, methods of creating and/or managing off-heap direct-memory data stores, and/or systems including off-heap direct-memory data store
US10699444B2 (en) * 2017-11-22 2020-06-30 Apple Inc Point cloud occupancy map compression
US20190379912A1 (en) * 2018-06-07 2019-12-12 Google Llc Hash table for video and image transforms
US10706611B2 (en) * 2018-06-15 2020-07-07 Beijing Jingdong Shangke Information Technology Co., Ltd. Three-dimensional representation by multi-scale voxel hashing
KR20210107864A (ko) * 2019-06-26 2021-09-01 텐센트 아메리카 엘엘씨 포인트 클라우드 코딩을 위한 암시적 4진트리 또는 2진트리 지오메트리 파티션
US20230048381A1 (en) * 2020-01-07 2023-02-16 Blackberry Limited Context determination for planar mode in octree-based point cloud coding
US11438628B2 (en) * 2020-06-03 2022-09-06 Tencent America LLC Hash-based accessing of geometry occupancy information for point cloud coding
US11321878B2 (en) * 2020-06-26 2022-05-03 Sony Group Corporation Decoded tile hash SEI message for V3C/V-PCC
US11580671B2 (en) * 2020-08-17 2023-02-14 Tencent America LLC Hash-based attribute prediction for point cloud coding
US20220207780A1 (en) * 2020-12-29 2022-06-30 Qualcomm Incorporated Inter prediction coding for geometry point cloud compression

Also Published As

Publication number Publication date
EP4097974A4 (en) 2023-06-21
EP4097974A1 (en) 2022-12-07
CN115486079A (zh) 2022-12-16
WO2022186861A1 (en) 2022-09-09
US20220284633A1 (en) 2022-09-08
KR20220125735A (ko) 2022-09-14

Similar Documents

Publication Publication Date Title
CN113615181B (zh) 用于点云编解码的方法、装置
US11166048B2 (en) Method and apparatus for video coding
US11711545B2 (en) Arithmetic coding information for parallel octree coding
US20200105025A1 (en) Method and apparatus for video coding
JP7233561B2 (ja) 点群圧縮のための方法並びにその、装置およびコンピュータプログラム
CN113179411A (zh) 点云属性编解码方法、装置、计算机设备及存储介质
JP7383171B2 (ja) 点群コーディングのための方法および装置
JP2023520565A (ja) 3dジオメトリを構築するための方法、装置およびプログラム
JP2024515737A (ja) 動的メッシュアライメントへの並列アプローチ
KR102677403B1 (ko) 비디오 기반 포인트 클라우드 코딩을 위한 고속 패치 생성
US20240007670A1 (en) Dynamic mesh vertex displacements coding
US20240135593A1 (en) Method and apparatus for uv attributes coding for symmetry mesh
KR20240093923A (ko) 표면 반사 대칭을 이용하는 기본 메시 코딩
KR20240090790A (ko) 메시 압축을 위한 적응형 지오메트리 필터링
JP2024514979A (ja) 時間的に相関するuvアトラスを生成するための方法、デバイスおよびコンピュータプログラム
KR20240110835A (ko) 대칭 메시에 대한 적응적 양자화를 위한 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240430