JP7257547B2 - 点群圧縮のための方法及び装置、並びにコンピュータプログラム - Google Patents

点群圧縮のための方法及び装置、並びにコンピュータプログラム Download PDF

Info

Publication number
JP7257547B2
JP7257547B2 JP2021559633A JP2021559633A JP7257547B2 JP 7257547 B2 JP7257547 B2 JP 7257547B2 JP 2021559633 A JP2021559633 A JP 2021559633A JP 2021559633 A JP2021559633 A JP 2021559633A JP 7257547 B2 JP7257547 B2 JP 7257547B2
Authority
JP
Japan
Prior art keywords
octree
split
depth
occupied
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021559633A
Other languages
English (en)
Other versions
JP2022535487A (ja
Inventor
ジャン,シアン
ガオ,ウエン
リィウ,シャン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2022535487A publication Critical patent/JP2022535487A/ja
Application granted granted Critical
Publication of JP7257547B2 publication Critical patent/JP7257547B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Generation (AREA)

Description

本出願は、2020年9月2日に提出された米国特許出願第17/010,363号“METHOD AND APPARATUS FOR POINT CLOUD COMPRESSION”の優先権を主張し、当該米国特許出願は、2019年9月16日に提出された米国仮出願第62/901,047号“PARALLEL OCTREE CODING FOR POINT CLOUD CODING”、2020年1月7日に提出された米国仮特許出願第62/958,131号“ADDITIONAL INFORMATION ON ADAPTIVE GEOMETRY QUANTIZATION AND PARALLEL OCTREE CODING FOR POINT CLOUD CODING”、及び2020年1月15日に提出された米国仮特許出願第62/961,518号“BITSTREAM OFFSETS SIGNALING IN PARALLEL OCTREE CODING FOR POINT CLOUD CODING”の優先権を主張し、上記の各出願の全内容は本明細書に援用により組み込まれる。
本開示は、点群(point cloud:ポイントクラウド)圧縮に一般的に関連する実施形態を説明する。
本明細書に記載された背景技術は、本開示の背景を一般的に表すことを目的とする。該背景技術部分に記載の作業程度から見れば、現在署名の発明者の作業、及び提出の際に別に従来技術の記載として限定されていない態様について、明確且つ暗黙的に本開示の内容に対する従来技術として認められない。
様々な技術を開発して3次元(3-dimensional、3D)空間で、例えば世界のオブジェクトや世界の環境などの世界を捉えて表現する。世界の3D表現は、より没入型の相互作用とコミュニケーションを実現することができる。点群は、世界の3D表現として使用できる。点群は、3D空間内の1組の点であり、各点は関連付けられた属性、例えば、色、マテリアルプロパティ、テクスチャ情報、強度属性、反射率属性、動き関連属性、モダリティ属性、及びその他のさまざまな属性を有する。このような点群は大量のデータを含む可能性があり、保存と伝送にコストと時間がかかる可能性がある。
本開示の各態様は、点群圧縮のための方法及び解凍のための方法を提供する。方法では、符号化されたビットストリームに応じて点群のバウンディングボックス(bounding box)の構文情報を復号化する。構文情報は、点群のバウンディングボックスの八分木分割構造を示す。構文情報は、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定する。構文情報は、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すことに応答して、ノードの占有コードに対して並行した復号化を実行する。ノードの占有コードに基づいて、バウンディングボックスを再構成する。
実施形態では、信号通知されるフラグ、及び並行した復号化を実行する最小分割深度の1つに基づいて、構文情報が、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定する。
実施形態では、並行した復号化を実行する最大分割深度、及び最小分割深度に基づいて、ノードの占有コードに対して並行した復号化を実行する。当該最大分割深度は、八分木分割構造の最大分割深度以下である。
実施形態では、1つ又は複数の分割深度のそれぞれに対応するビットストリームオフセットに基づいて、1つ又は複数の分割深度のそれぞれのサブビットストリームを特定する。1つ又は複数の分割深度のサブビットストリームに対して並行した復号化を実行する。
実施形態では、1つ又は複数の分割深度のそれぞれに対応するビットストリームオフセットは、構文情報に含まれる。
実施形態では、占有コードのコンテキスト変数に基づいて、1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行する。
実施形態では、ノードの占有コードのコンテキスト変数の初期確率を、1つ又は複数の事前定義された値として特定する。
実施形態では、複数のノードの親ノードの占有コードのコンテキスト変数の確率に基づいて、ノードの占有コードのコンテキスト変数の初期確率を特定する。複数のノードは、並行した復号化を実行する最小分割深度にある。
実施形態では、ノードの親ノードのサブセットの占有コードのコンテキスト変数の確率に基づいて、ノードの占有コードのコンテキスト変数の初期確率を特定する。
本開示の各態様は、さらに、点群圧縮のための装置及び解凍のための装置を提供する。装置は、処理回路システムを含んでおり、当該処理回路システムは、符号化されたビットストリームに応じて点群のバウンディングボックスの構文情報を復号化する。構文情報は、前記点群の前記バウンディングボックスの八分木分割構造を示す。処理回路システムは、構文情報が、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定する。処理回路システムは、構文情報が、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すことに応答して、ノードの占有コードに対して並行した復号化を実行する。処理回路システムはノードの占有コードに基づいて、バウンディングボックスを再構成する。
本開示の各態様は、命令を記憶している非一時的なコンピュータ読み取り可能な媒体をさらに提供し、当該命令は、点群圧縮/解凍動のためにコンピュータによって実行される場合に、点群圧縮/解凍のための方法のいずれか1つ又は組み合わせをコンピュータに実行させる。
開示された主題のさらなる特徴、性質及び様々な利点は、以下の詳細な説明及び図面からより明確になる。図面において、
本開示の実施形態による通信システムの簡略化ブロック図の模式図を示す。
本開示の実施形態によるストリーミングシステム200簡略化ブロック図の模式図を示す。
本開示の実施形態による例示的なエンコーダを示す。
本開示の実施形態による例示的なデコーダを示す。
本開示の実施形態による3D立方体における例示的な八分木分割を示す。
本開示の実施形態による例示的な2レベルの八分木分割及び相応する占有コードを示す。
本開示の実施形態による例示的なジオメトリ八分木ビットストリームを示す。
本開示の実施形態による処理例を概説するフローチャートを示す。
本開示の実施形態によるコンピュータシステムの模式図である。
I.点群圧縮システム
図1は、本開示の実施形態による通信システム100の簡略化ブロック図である。通信システム100は、例えばネットワーク150を介して互いに通信できる複数の端末デバイスを含む。例えば、通信システム100はネットワーク150を介して互いに接続された1対の端末デバイス110、120を有する。図1の例において、第1対の端末デバイス110、120は点群データの単方向伝送を実行する。例えば、端末デバイス110は端末デバイス110に接続されたセンサー105によりキャプチャされた点群(例えば、構造を示す点)を圧縮することができる。圧縮された点群は、例えばビットストリームの形式で、ネットワーク150を介して他の端末デバイス120に伝送される。
端末デバイス120は、ネットワーク150から圧縮された点群を受信し、ビットストリームを解凍して点群を再構成し、再構成された点群に応じて適切に表示することができる。単方向データ伝送は、メディアサービングアプリケーションなどでよく見られるものである。
図1の例において、端末装置110及び120は、サーバ、及びパーソナルコンピュータとして示され得るが、本開示の原理は、それに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、ゲーム端末、メディアプレーヤー及び/又は専用の3次元(3D)機器に適用する。ネットワーク150は、端末デバイス110と120との間で圧縮された点群を伝送する任意の数のネットワークを表す。ネットワーク150は、例えば、有線(ケーブル)及び/又は無線通信ネットワークを含んでもよい。ネットワーク150は、回線交換及び/又はパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、及び/又はインターネットを含む。本議論の目的のために、ネットワーク150のアーキテクチャ及びトポロジーは、本明細書で以下に説明されない限り、本開示の操作において制限しない。
図2は、3Dテレプレゼンスアプリケーションプログラム及び仮想現実アプリケーションプログラムを含む様々な点群対応アプリケーションに適用することができるストリーミングシステム200を示している。ストリーミングシステム200は、キャプチャサブシステム213を含み得る。キャプチャサブシステム213は、点群ソース201、例えば、光検出及び測距(LIDAR)システム、3Dカメラ、3Dスキャナー、ソフトウェアで非圧縮点群を生成するグラフィックス生成コンポーネント、例えば圧縮されていない点群202を生成する類似グラフィックス生成コンポーネントを含んでもよい。一例において、点群202は、3Dカメラによってキャプチャされた点を含む。圧縮された点群204(圧縮された点群のビットストリーム)と比較して、点群202は、大量のデータを強調するために太線で描画される。圧縮された点群204は、点群ソース201に結合されたエンコーダ203を含む電子機器220によって生成されてもよい。エンコーダ203は、以下でより詳細に説明されるように、開示された主題の各態様を実現又は実施するために、ハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができる。点群のストリーム202と比較してデータ量が少ないことを強調するために細い線で描画される圧縮点群204(又は圧縮された点群204のビットストリーム204)は、将来の使用のために、ストリーミングサーバ205に記憶されてもよい。1つ又は複数のストリーミングクライアントサブシステム、例えば、図2のクライアントサブシステム206及び208は、ストリーミングサーバ205にアクセスして、圧縮された点群204のコピー207及び209を検索/取得(retrieve)することができる。 クライアントサブシステム206は、例えば、電子機器230内のデコーダ210を含んでもよい。デコーダ210は、圧縮された点群の着信コピー207を復号化し、レンダリングデバイス212上でレンダリングできる再構成された点群211の発信ストリームを作成する。一部のストリーミングシステムでは、特定の規格に従って、圧縮された点群204、207、及び209(例えば、圧縮された点群のビットストリーム)を圧縮することができる。いくつかの例において、動画符号化規格は点群の圧縮に使用される。それらの規格の例は、高効率動画符号化(HEVC)、多用途動画符号化(VVC)などを含む。
電子機器220及び230は、他の構成要素(図示せず)を含んでもよいことに留意されたい。例えば、電子機器220は、デコーダ(図示せず)を含んでもよく、電子機器230は、エンコーダ(図示せず)を含んでもよい。
図3に、実施形態による例示的なエンコーダ300を示す。当該エンコーダは、点群データを受信し、点群データを圧縮して、圧縮された点群データを含むビットストリームを生成するように配置される。実施形態では、エンコーダ300は、位置量子化モジュール310、重複点除去モジュール312、八分木符号化モジュール330、属性転送モジュール320、LOD生成モジュール340、属性予測モジュール350、残差量子化モジュール360、算術符号化モジュール370、逆残差量子化モジュール380、加算モジュール381、及び再構成された属性値を記憶するメモリ390を含むことができる。
図に示すように、エンコーダ300で入力点群301を受信し得る。点群301の位置(3D座標)は、位置量子化モジュール310に提供される。位置量子化モジュール310は、座標を量子化して量子化位置を生成するように配置される。オプションの重複点除去モジュール312は、量子化位置を受け取り、フィルタプロセスを実行して重複点を識別して除去するように配置される。八分木符号化モジュール330は、重複点除去モジュール312からフィルタリングされた位置を受信し、八分木に基づく符号化プロセスを実行して、ボクセルの3Dグリッドを記述する一連の占有コードを生成するように配置される。占有コードは、算術符号化モジュール370に提供される。
属性転送モジュール320は、入力点群の属性を受信し、複数の属性値が相応するボクセルに関連付けられている場合に、属性転送プロセスを実行して、各ボクセルの属性値を特定するように配置される。属性転送プロセスは、八分木符号化モジュール330から出力され、並べ替えられた点に対して実行されることができる。転送操作後の属性は、属性予測モジュール350に提供される。LOD生成モジュール340は、八分木符号化モジュール330から出力され、並べ替えられた点を操作し、これらの点を、異なるLODに再編成する。LOD情報は、属性予測モジュール350に提供される。
属性予測モジュール350は、LOD生成モジュール340からのLOD情報によって示されるLODに基づく順序に従って点を処理する。属性予測モジュール350は、メモリ390に格納された現在の点の隣接する点のセットの再構成属性に基づいて、現在の点の属性予測を生成する。その後、属性転送モジュール320から受信した元の属性値及びローカルで生成された属性予測に基づいて予測残差を取得することができる。相応する属性予測プロセスで候補インデックスを使用する場合、選択された予測候補に対応するインデックスを算術符号化モジュール370に提供し得る。
残差量子化モジュール360は、属性予測モジュール350から予測残差を受信し、量子化を実行して量子化残差を生成するように配置される。量子化された残差は算術符号化モジュール370に提供される。
逆残差量子化モジュール380は、残差量子化モジュール360から量子化された残差を受信し、残差量子化モジュール360で実行される量子化操作の逆を実行することによって再構成された予測残差を生成するように配置される。加算モジュール381は、逆残差量子化モジュール380から再構成された予測残差を受信し、属性予測モジュール350から相応する属性予測を受信するように配置される。再構成された予測残差と属性予測を組み合わせることにより、再構成された属性値が生成され、メモリ390に格納される。
算術符号化モジュール370は、占有コード、候補インデックス(使用される場合)、量子化された残差(生成される場合)、及び他の情報を受信し、受信した値又は情報をさらに圧縮するためにエントロピー符号化を実行するように配置される。従って、圧縮された情報を含む圧縮されたビットストリーム302を生成することができる。ビットストリーム302は、圧縮されたビットストリームを復号化するデコーダに送信されるか、他の方法で提供され得るか、又は記憶装置に記憶され得る。
図4に、実施形態による例示的なデコーダ400を示す。デコーダ400は、圧縮されたビットストリームを受信し、点群データ解凍を実行してビットストリームを解凍して復号化された点群データを生成するように配置される。実施形態では、デコーダ400は、算術復号化モジュール410、逆残差量子化モジュール420、八分木復号化モジュール430、LOD生成モジュール440、属性予測モジュール450、及び再構成された属性値を記憶するメモリ460を含むことができる。
図に示すように、圧縮されたビットストリーム401が算術復号化モジュール410で受信し得る。算術復号化モジュール410は、圧縮されたビットストリーム401を復号化して、量子化された残差(生成される場合)及び点群の占有コードを取得するように配置される。八分木復号化モジュール430は、占有コードに従って点群内の点の再構成された位置を特定するように配置される。LOD生成モジュール440は、再構成された位置に基づいて点を異なるLODに再編成し、LODに基づく順序を特定するように配置される。逆残差量子化モジュール420は、算術復号化モジュール410から受信した量子化された残差に基づいて、再構成された残差を生成するように配置される。
属性予測モジュール450は、属性予測プロセスを実行して、LODに基づく順序に従って点の属性予測を特定するように配置される。例えば、メモリ460に格納された現在の点の隣接する点の再構成された属性値に基づいて現在の点の属性予測を特定することができる。属性予測モジュール450は、属性予測と、相応する再構成された残差とを組み合わせて、現在の点の再構成された属性を生成することができる。
一例において、属性予測モジュール450から生成された再構成された属性のシーケンス、及び八分木復号化モジュール430から生成された再構成された位置のシーケンスは、デコーダ400から出力される復号化された点群402に対応する。さらに、再構成された属性もメモリ460に格納され、その後、後続の点の属性予測を導出するために使用することができる。
様々な実施形態では、エンコーダ300及びデコーダ400は、ハードウェア、ソフトウェア、又はそれらの組み合わせで実現されることができる。例えば、エンコーダ300及びデコーダ400は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)などのソフトウェアの有無にかかわらず動作する1つ又は複数の集積回路(IC)などの処理回路で実現されることができる。別の例では、エンコーダ300及びデコーダ400は、不揮発性(又は非一時的)のコンピュータ読み取り可能な記憶媒体に記憶された命令を含むソフトウェア又はファームウェアとして実現されることができる。命令は、1つ又は複数のプロセッサなどの処理回路によって実行されると、処理回路にエンコーダ300及びデコーダ400の機能を実行させる。
本明細書に開示される属性予測技術を実現するように構成された属性予測モジュール350又は450は、図3及び図4に示されるものと同様又は異なる構造を有し得る他のデコーダ又はエンコーダに含まれ得ることに留意されたい。また、様々な例において、エンコーダ300及びデコーダ400は、同じデバイスに含まれ得るか、又は個別のデバイスに含まれ得る。
II.MPEGテストモデル13(TMC13)における点群圧縮
1.点群データ
近年、点群が広く利用されている。例えば、点群データは、自動運転車でオブジェクトの検出と位置決めに使用される。点群データは、地理情報システム(GIS)でマッピングに使用したり、文化遺産に使用して、文化遺産のオブジェクトやコレクションなどを視覚化及びアーカイブしたりすることもできる。
点群には、高次元の点のセットが含まれる。通常は3次元(3D)であり、それぞれの点に3Dの位置情報と、色、反射率などの他の属性とを含む。これらは、複数のカメラと深度センサー、又はLidarを使用してキャプチャされることができ、数千から数十億の点で構成して元のシーンをリアルに表現することができる。
したがって、点群を表すために必要なデータの量を減らして、より高速な送信又はストレージの削減を実現するには、圧縮技術が必要である。
2.八分木分割によるジオメトリ符号化
ジオメトリ情報と、色や反射率などの関連属性は、それぞれに圧縮されることができる(例えばTMC13において)。点群の3D座標を含むジオメトリ情報は、八分木分割により占有情報を使用しれ符号化されることができる。属性は、例えば、予測、リフティング、及び/又は領域適応階層変換技術を使用して、再構成されたジオメトリに基づいて圧縮されることができる。
八分木分割の入力は、変換された位置の集合である。つまり、P,i = 1、2、…、N。図5は、本開示の実施形態による、3D立方体における例示的な八分木分割を示している。実線で示される3D立方体は、破線で示される8つの小さい同じサイズの立方体に分割されている。八分木分割を(例えば、TMC13において)再帰的に実行して、元の3D空間をより小さいユニットに分割し、すべてのサブ空間の占有情報をエントロピーコーダーで符号化して、ジオメトリの位置を効率的に表現することができる。
八分木符号化は、ロスレス(lossless:可逆)であり得る。つまり、すべての入力位置は、符号化されるがさらに量子化されることはない。例えば、TMC13では、八分木ジオメトリコーデックを使用する場合に、ジオメトリエン符号化(encoding)は次のように行われる。
まず、2つの点(0,0,0)と(2、2、2)によって立方の軸揃えバウンディングボックスを定義する。ここで、2はバウンディングボックスのサイズを定義し、dはビットストリームに符号化される。すべての点Pがバウンディングボックス内にあることを仮定する。
次に、バウンディングボックスを再帰的に細分割することにより、八分木分割構造を構築する。各段階で、バウンディングボックスの立方体は8つのサブ立方体に分割される。次に、1ビット値を各サブ立方体に関連付けることによって、占有コードと呼ばれる8ビットコードを生成し、相応するサブ立方体に点を含む(例えば、完全なサブ立方体の場合、対応するビットの値は1である)か、含まない(例えば、空のサブ立方体の場合、対応するビットの値は0である)かを示す。サイズが値、例えば1よりも大きい(つまり、非ボクセル)の完全なサブ立方体のみがさらに細分化される。次に、バウンディングボックスの各立方体の占有コードは、算術エンコーダによって圧縮される。バウンディングボックスの各立方体は、八分木分割構造のノードに対応する。したがって、各立方体の占有コードは、相応する立方体のノードに対応する。
3.占有コードの符号化
八分木分割構造の現在のノードの占有コードは、算術エンコーダによって圧縮されることができる。占有コードは、8ビット整数であるSとして表すことができ、Sの各ビットは、現在のノードの各子ノードの占有ステータスを示す。占有コードの2つの例示的な符号化方法(例えば、TMC13において)は、ビット単位の符号化及びバイト単位の符号化である。TMC13では、ビット単位の符号化がデフォルトで有効になっている。二つの方法は、コンテキストモデリングを使用して算術符号化を実行し、占有コードを符号化する。コンテキストステータスは、符号化プロセス全体の開始時に初期化され、符号化プロセス中に更新される。
ビット単位の符号化の場合、Sの8つのビンは一定の順序で符号化され、隣接ノードと隣接ノードの子ノードの占有ステータスを参照して各ビンを符号化する。隣接ノードは現在のノードと同じレベルにある。
バイト単位の符号化の場合、(1)N個(例えば32個)の最も頻繁な占有コードを追跡する適応ルックアップテーブル(A-LUT)、(2)最後に観察された異なるM個(例えば、16個)の占有コードを追跡するキャッシュを参照してSを符号化する。
SがA-LUTにあるかどうかを示すバイナリフラグを符号化する。SがA-LUTにある場合、バイナリ算術エンコーダを使用してA-LUTのインデックスを符号化する。SがA-LUTにない場合、Sがキャッシュにあるかどうかを示すバイナリフラグを符号化する。Sがキャッシュ内にある場合、バイナリ算術エンコーダを使用してキャッシュ内のインデックスのバイナリ表現を符号化する。そうでなければ、即ち、Sがキャッシュにない場合、バイナリ算術エンコーダを使用してSのバイナリ表現を符号化する。
復号化プロセスは、ビットストリームからバウンディングボックスの次元を解析することにより開始されることができる。次に、復号化された占有コードに従ってバウンディングボックスを細分割することにより、同じ八分木構造を構築する。2レベルの八分木分割の例及び対応する占有コードの例は図6に示され、影付きの立方体とノードは、それらが点で占有されていることを示す。
III.並行した八分木符号化(並行八分木符号化)
いくつかの関連するケース(例えば、TMC13)では、八分木符号化及び復号化プロセスは、事前定義された順序で実行される必要があり、現在のノードの符号化は、現在のノードの符号化された隣接ノード(及びその子ノード)のステータスに依存するからである。さらに、算術符号化エンジンのコンテキスト変数は動的に更新される。したがって、前の深度での符号化が終了するまでに、各分割の深度での八分木符号化を開始できない。
本開示は、1つ又は複数の八分木分割の深度に対して、順次符号化の代わりに並行した符号化を実行できる八分木符号化(符号化及び復号化)スキームを提案する。この開示は、TMC13ソフトウェア又はMPEG-PCC標準に限定されるものではなく、PCCシステムの一般的なソリューションであることに留意されたい。
本開示の各態様によれば、並行八分木符号化が有効にされている場合、幾つかの八分木分割深度の符号化(符号化及び復号化)プロセスを並行して実行することができる。したがって、符号化(符号化及び復号化)時間を大幅に短縮できる。構文は信号で送られて、並行八分木符号化を適用する八分木分割の深度を指定する。例えば、八分木分割の深度をd
= 0、1、…、M-1とし、ここで、Mは八分木分割の深度の総数である。並行八分木符号化は、dminからdmaxまでの深度の範囲に適用できる。ここで、0<dmin≦dmax≦M-1は、これらの深度の八分木符号化を並行して実行できることを示す。
例えば、並行して符号化された八分木分割の深度d(dmin<d≦dmax)の場合、深度d-1での八分木ノードの親ノードを符号化又は復号化すると、深度dでの八分木ノードを符号化又は復号化できる。同様に、深度dでの八分木ノードを符号化又は復号化すると、深度d+1での八分木ノードの占有子ノードを符号化又は復号化できる。こうして、並行する八分木符号化を実現できる。
1.制御フラグ及び深度制約を信号で送る
本開示の態様によれば、並行八分木符号化の制御パラメータは、高レベルの構文を使用して信号で送られる(signaled:信号通知される)ことができる。本開示は所与の例に限定されないことに留意されたい。他のパラメータも信号で送られることができる。ビットストリームのシーケンスパラメータセット又はスライスヘッダー又はジオメトリパラメータセットで制御パラメータを指定できる。
実施形態では、並行八分木符号化が有効であるか無効であるかを示すフラグは信号で送られることができる。表1に示すように、ジオメトリパラメータセットでフラグを指定できる。例えば、gps_parallel_octree_coding_flagが1に等しい場合、シーケンス又はスライスに対して並行八分木符号化が有効になる。gps_parallel_octree_coding_flagが0に等しい場合、シーケンス又はスライスに対して並行八分木符号化は無効になる。
Figure 0007257547000001
幾つかの実施形態では、例えば、ジオメトリパラメータセットで並行八分木符号化が有効になる最小八分木深度を指定することができる。実施形態では、並列八分木符号化が有効になる最小八分木深度、すなわちdminは、表2に示すように、ジオメトリパラメータセットのgps_parallel_octree_coding_min_depth_minus_oneによって指定される。例えば、gps_parallel_octree_coding_flagが1に等しい場合、dmin=gps_parallel_octree_coding_min_depth_minus_one+1となる。
Figure 0007257547000002
実施形態では、並列八分木符号化が有効になる最小八分木深度、すなわちdminは、表3に示されるように、ジオメトリパラメータセットのgps_paralar_octree_codging_min_degheによって指定される。ここで、gps_paralal_octree_conding_min_degheは、dminをdmin
= gps_paralar_octree_codging_min_degheとして指定する。この場合、gps_parallel_octree_coding_flagは信号で送られないが、gps_parallel_octree_coding_min_depthの値から推定できる。例えば、gps_parallel_octree_coding_min_depthが0に等しい場合、gps_parallel_octree_coding_flaggpsは0であると推定される。それ以外の場合、gps_parallel_octree_coding_flagは1であると推定される。
Figure 0007257547000003
実施形態では、並行八分木符号化の最小八分木深度、即ちdminは、ジオメトリパラメータセットのgps_parallel_octree_coding_max_nodesize_log2によって指定され、表4に示すように、gps_parallel_octree_coding_max_nodesize_log2は、dminをdmin=M-gps_parallel_octree_coding_max_nodesize_log2として指定する。この場合にgps_parallel_octree_coding_flagは、信号で送られないが、gps_parallel_octree_coding_max_nodesize_log2の値から推定できる。例えば、gps_parallel_octree_coding_max_nodesize_log2が0に等しい場合、gps_parallel_octree_coding_flagは、0であると推定される。それ以外の場合、gps_parallel_octree_coding_flag1であると推定される。
Figure 0007257547000004
実施形態では、並行八分木符号化が有効になる最小及び最大八分木深度、即ちdmin及びdmaxは、ジオメトリパラメータセットの構文によって指定され、表5に示すようである。例えば、gps_parallel_octree_coding_min_depth_minus_oneはdminをdmin=gps_parallel_octree_coding_min_depth_minus_one+1として指定し、gps_parallel_octree_coding_max_depth_minus_min_depth_minus1はdmaxをdmax=gps_parallel_octree_coding_max_depth_minus_min_depth_minus1+dmin+1として指定する。
Figure 0007257547000005
実施形態では、並行八分木符号化が有効になる最小八分木深度、即ち、dminは固定されており、信号で送られない。表6に示すように、ジオメトリパラメータセットで並行八分木符号化が有効になる最大八分木深度、即ちdmaxのみを信号で送る。例えば、gps_parallel_octree_coding_max_depth_mimus_min_depth_minus1はdmaxをdmax=gps_parallel_octree_coding_max_depth_minus_min_depth_minus1+dmin+1として指定する。
Figure 0007257547000006
実施形態では、並行八分木符号化が有効になる最小八分木深度、即ちdminは、ジオメトリパラメータセットのgps_parallel_octree_coding_max_nodesize_log2_minus1によって指定され、表7に示すように、ここで、gps_parallel_octree_coding_max_nodesize_log2は、dminをdmin=M-gps_parallel_octree_coding_max_nodesize_log2_minus1-1として指定する。この場合に、gps_parallel_octree_coding_flagは、信号で送られないが、gps_parallel_octree_coding_max_nodesize_log2_minus1の値から推定できる。例えば、gps_parallel_octree_coding_max_nodesize_log2_minus1が0に等しい場合、gps_parallel_octree_coding_flagは、0であると推定される。それ以外の場合、gps_parallel_octree_coding_flagは、1であると推定される。
Figure 0007257547000007
2.ビットストリームオフセットを信号で送る(信号通知する)。
図7は、本開示の実施形態によるいくつかの部分を含むジオメトリ八分木ビットストリームを示している。第1の部分は、ジオメトリ符号化に使用される高レベルの構文を含むジオメトリスライスヘッダー(GSH)などのヘッダーである。残りの部分は、各分割の深度の八分木符号化サブビットストリームを含む。いくつかの実施形態では、残りの部分は、さらに2つの部分、すなわち、それぞれ、非並列及び並列八分木符号化に分類することができる。
並列デコーダの解析を有効にするには、各並列八分木分割の深度のサブビットストリームをバイト位置に揃える必要がある。各サブビットストリームは、バイト単位の整数長を持つことができる。さらに、Oで表される各並列八分木分割深度のビットストリームオフセットは、オフセット差、即ち、R=Od+1-Oで指定できる。dmaxがM-1に等しい場合、Rdmaxは信号で送られないが、デコーダにより推定できることに留意されたい。dmin-1は、八分木分割の深度dmin-1が終了するビットストリームから明示的に信号で送られるか又は推定されることができる。したがって、デコーダは、指定されたビットストリームセグメントからの複数の八分木の深度の並行した解析を開始することができる。具体的には、深度dの解析は、ビットストリーム位置OからOd+1-1までで、長さはRである。
実施形態では、ビットストリームオフセットは、表8に示すように、ジオメトリスライスヘッダーに信号で送られる。例えば、gps_parallel_octree_coding_flagが1に等しい場合、gsh_parallel_octree_coding_bitstream_start_posは、八分木分割深度dminのビットストリームオフセットをOdmin=gsh_parallel_octree_coding_bitstream_start_posとして指定する。さらに、gsh_parallel_octree_coding_bitstream_range [d]は、八分木の深度dのビットストリーム長さをR=gsh_parallel_octree_coding_bitstream_range [d]として指定する。
したがって、八分木深度dのビットストリームオフセットは、O
Figure 0007257547000008
として計算できる。
Figure 0007257547000009
実施形態では、ビットストリームオフセットは、表9に示すように、ジオメトリスライスヘッダーに信号で送られる。例えば,当gps_parallel_octree_coding_flagが1に等しい場合、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、Rd=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000010

として計算される。
八分木分割深度dmin-1が終了するビットストリームから推定される。
Figure 0007257547000011
実施形態では、ビットストリームオフセットは、表10に示すように、ジオメトリスライスヘッダーに信号で送られる。この実施形態では、gps_parallel_octree_coding_flagは、信号で送られないが、gps_parallel_octree_coding_min_depthの値から推定できる。例えば、gps_parallel_octree_coding_min_depthが0よりも大きい場合、gps_parallel_octree_coding_flagは1であると推定される。また、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、Rd=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000012
として計算される。
八分木分割深度dmin-1が終了するビットストリームから推定される。
Figure 0007257547000013
実施形態では、ビットストリームオフセットは、表11に示すように、ジオメトリスライスヘッダーに信号で送られる。この実施形態では、gps_parallel_octree_coding_flagは、信号で送られないが、gps_parallel_octree_coding_max_nodesize_log2の値から推定できる。例えば、gps_parallel_octree_coding_max_nodesize_log2が0よりも大きい場合、gps_parallel_octree_coding_flag1であると推定される。また、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、Rd=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000014
として計算される。
八分木分割深度dmin-1が終了するビットストリームから推定される。
Figure 0007257547000015
実施形態では、ビットストリームオフセットは、表12に示すように、ジオメトリスライスヘッダーに信号で送られる。この場合、dmaxはM-1に設定され、最後の八分木分割深度のビットストリーム長さは、信号で送られないが、デコーダから推定できる。例えば、gps_parallel_octree_coding_flagが1に等しい場合、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、Rd=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000016
として計算される。
八分木分割深度dmin-1が終了するビットストリームから推定される。最後の八分木深度M-1のビットストリーム長さ、即ちRM-1は、信号で送られないが、位置OM-1からビットストリームの終わりまでであるとして推定される。
Figure 0007257547000017
本開示の各態様よれば、ビットストリームオフセットは、二値化され、Exp-Golom符号化、固定長符号化、単項符号化などを含む任意の形式で、信号で送られ得る。
実施形態では、表13に示すように、Exp-Golomb符号化によりジオメトリスライスヘッダーでビットストリームオフセットを指定する。gsh_parallel_octree_coding_max_nodesize_log2_minus1は、並行八分木符号化が有効になる最小八分木深度、即ち、dminをdmin=M-gps_parallel_octree_coding_max_nodesize_log2_minus1-1として指定し、Mは八分木分割深度の総数である。例えば、当gsh_parallel_octree_coding_max_nodesize_log2_minus1が0に等しい場合、並行八分木符号化を無効にする。gsh_parallel_octree_coding_bitstream_start_posは、八分木深度dminのビットストリームオフセット、即ち
Figure 0007257547000018


Figure 0007257547000019

=gsh_parallel_octree_coding_bitstream_start_posとして指定する。また、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、R=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000020
として計算される。
ここで、Oは、各並行八分木分割深度のビットストリームオフセットを示す。実施形態では、
Figure 0007257547000021

は、信号で送られないが、八分木深度dmin-1が終了するビットストリームから推定される。
Figure 0007257547000022
実施形態では、表14に示すように、固定長符号化によりジオメトリスライスヘッダーでビットストリームオフセットを指示することができる。gsh_parallel_octree_coding_max_nodesize_log2_minus1は、並行八分木符号化が有効になる最小八分木深度、即ち、dminを、dmin=M-gps_parallel_octree_coding_max_nodesize_log2_minus1-1として指定し、Mは八分木分割深度の総数である。例えば、当gsh_parallel_octree_coding_max_nodesize_log2_minus1が0に等しい場合、並行八分木符号化を無効にする。gsh_parallel_octree_coding_bitstream_start_posは、八分木深度dminのビットストリームオフセット、即ち、
Figure 0007257547000023

を、
Figure 0007257547000024

=gsh_parallel_octree_coding_bitstream_start_posとして指定する。また、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、Rd=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000025
として計算される。
ここで、Oは、各並行八分木分割深度のビットストリームオフセットを示す。この実施形態では、ビット長が事前定義されていることに留意されたい。ビットストリームオフセットは、この実施形態では64ビットによって符号化され、他の実施形態では、32ビット又は16ビットなどの他の固定長によって符号化されることができる。さらに、実施形態では、
Figure 0007257547000026

は信号で送られず、八分木深度dmin-1が終了するビットストリームから推測することができる。
Figure 0007257547000027
実施形態では、表15に示すように、固定長さ符号化によりジオメトリスライスヘッダーでビットストリームオフセットを指定する。gsh_parallel_octree_coding_max_nodesize_log2_minus1は、並行八分木符号化が有効になる最小八分木深度、即ち、dminをdmin=M-gps_parallel_octree_coding_max_nodesize_log2_minus1-1として指定し、Mは八分木分割深度の総数である。例えば、gsh_parallel_octree_coding_max_nodesize_log2_minus1が0に等しい場合、並行八分木符号化を無効にする。gsh_parallel_octree_coding_bitstream_start_posは、八分木深度dminのビットストリームオフセット、即ち、
Figure 0007257547000028

を、
Figure 0007257547000029

=gsh_parallel_octree_coding_bitstream_start_posとして指定する。また、gsh_parallel_octree_coding_bitstream_range [d]は、八分木深度dのビットストリーム長さを、R=gsh_parallel_octree_coding_bitstream_range [d] として指定する。八分木深度dのビットストリームオフセットは、
Figure 0007257547000030
として計算される。
ここで、Oは各並行八分木分割深度のビットストリームオフセットを示す。事前定義されたビット長を使用する前の実施形態と比較して、この実施形態では、gsh_parallel_octree_coding_offset_lenによりgsh_parallel_octree_coding_bitstream_range[d]、及びgsh_parallel_octree_coding_bitstream_start_posのビット長さを指定し、即ち、u(n)において、n=gsh_parallel_octree_coding_offset_lenである。また、実施形態では、
Figure 0007257547000031

は、信号で送られないが、八分木深度dmin-1が終了するビットストリームから推定できる。
Figure 0007257547000032
3.コンテキスト変数の再初期化
本開示の各態様によれば、並行して符号化される各八分木分割深度(d)について、八分木符号化に関連するコンテキスト変数、場合によってすべてのコンテキスト変数の確率を再初期化する必要がある。確率は、事前定義された確率のセット、又は並列符号化が開始されていない確率状態として再初期化できる。P及びP'は、それぞれ八分木分割の深度dを符号化する前後の関連するコンテキスト変数の確率状態を表すものとする。
実施形態では、深度d(dmin≦d≦dmax)でのコンテキスト変数の確率は、所定の値、例えば0.5として再初期化され、即ち、P=0.5である。
実施形態では、深度d(dmin≦d≦dmax)でのコンテキスト変数の確率は、予めトレーニングされた確率のセットとして再初期化される。トレーニングプロセスはオフラインで実行でき、トレーニングされた確率はエンコーダとデコーダの両方で利用できる。
実施形態では、深度d(dmin≦d≦dmax)でのコンテキスト変数の確率は、深度dmin-1を符号化する確率と同じように再初期化され、即ち、
Figure 0007257547000033
Figure 0007257547000034
である。この場合、八分木分割深度の残りについて、
Figure 0007257547000035
の確率状態に予めキャッシュする必要がある。
実施形態では、深度d(dmin≦d≦dmax)でのコンテキスト変数の初期確率は深度d-1に応じて導出するか、又は再初期化される。しかし、深度d-1でのすべてのノードを符号化する代わりに、ノードの(例えば、深度d-1の前のK個のノードであり、ここで、Kはビットストリームで事前定義するか、信号で送られることができる)のサブセットを(例えば、シーケンスパラメータセット、ジオメトリパラメータセット、又はジオメトリスライスヘッダーにおいて)を符号化した後に、深度dでの確率を初期化するための確率を導出することができる。最後の1つ又は複数の八分木深度d(dmax+1≦d≦M-1)の符号化は、深度dmaxの符号化と並行して実行してもよいし、深度dmaxの符号化後に実行してもよい。最後の1つ又は複数の八分木深度の符号化が並行して実行される場合、前述の再初期化プロセスを深度dmax+ 1にも適用できる。
実施形態では、八分木分割が指定された深度dminに達すると、ビット単位の符号化のためのコンテキスト変数の確率をメモリに格納することができる。並行して処理される残りの八分木分割の深度については、コンテキスト変数の確率を、格納されている確率と同じように再初期化することができる。例えば、このプロセスは、表16に示すように、各八分木の深度の符号化の開始時に呼び出されることができる。ここで、NumCtxはコンテキストの総数を示す。
Figure 0007257547000036
実施形態では、八分木分割が指定された深度dminに達成すると、バイト単位の符号化のルックアップテーブルの値をメモリに格納することができる。
並行して処理される残りの八分木分割の深度については、ルックアップテーブルの値を、格納されている値と同じように再初期化することができる。例えば、格納及び回復される関連変数には次のものがある。(1)最も頻度の高いシンボルを格納する値のアレイlut0 [k]であり、ここで、kは0から31までの範囲内にある(0及び31を含む)。(2)シンボルの出現を格納する値のアレイlut0Histogram [k]であり、ここで、kは0から255までである(0及び255を含む)。(3)二つの変数lut0UpdatePeriod及びlut0SymbolsUntilUpdateであり、lut0の更新期間と次の更新まで残っているシンボルの数をそれぞれ格納する。(4)次のlut0更新時にlut0をリセットする必要があるかどうかを指定する変数lut0Resetである。(5)異なる値を持つ最後の16個の復号化されたシンボルを格納するアレイlutl [k]であり、kは0から15までの範囲内にある(0及び15を含む)。(6)最後復号化されたシンボルのインデックスを格納する変数lutllndexLastSymbolである。(7)適応型バイナリ算術コンテキストctxLut0Hit、ctxLut1Hit及びctxSymbolBitのセットである。(8)適応型バイナリ算術コンテキストアレイctxLut0Indexであり、limitedContextModeが1に等しい場合、サイズは5であり、それ以外の場合、サイズは31であり、ここで、変数limitedContextModeは、限られた数のコンテキストを使用するかどうかを指定する。例えば、表17に示すように、各八分木深度の符号化の開始時に再初期化プロセスを呼び出す。
Figure 0007257547000037
実施形態では、八分木分割が指定された深度dminに達成すると、平面符号化モードの履歴値をメモリに格納することができる。並行して処理される残りの八分木分割の深度については、履歴値を、格納されている値と同じように再初期化することができる。表18に示すように、各八分木深度の符号化の開始時にこの再初期化プロセスを呼び出す。
Figure 0007257547000038
4.ジオメトリ量子化
適応ジオメトリ量子化は、異なるジオメトリ八分木ノードの異なる量子化ステップサイズを許可する。約束をジオメトリ量子化スキームに導入してプロセスを単純化する。
実施形態では、適応ジオメトリ量子化は、1つ又は複数の特定の分割深度でのノードに対してのみ許可される。例えば、適応ジオメトリ量子化は、1つの特定の分割深度でのノードに対してのみ許可される。
実施形態では、量子化ステップサイズは2の累乗のみであり得る。この場合、log2の形式で量子化ステップのデルタを信号で送り得、ビットシフトによって量子化/非量子化の実現を単純化することができる。
実施形態では、いくつかのジオメトリ関連符号化ツールは、適応ジオメトリ量子化とのインタラクションを有することができる。これらの問題を回避するために、追加の制約を利用することができる。例えば、平面符号化モードを無効にすることができる。適応型ジオメトリ量子化が特定の区画深度でのみ許可されている場合の実施形態では、平面符号化モードは、指定された深度よりも高い1つの深度で無効にすることができる。
IV.フローチャート
図8は、本開示の実施形態によるプロセス900を概説するフローチャートを示す。PCCについて符号化又は復号化中に符号化処理中にプロセス800を使用することができる。様々な実施形態において、プロセス800は、端末デバイス110における処理回路システム、エンコーダ203の機能を実行する処理回路203、エンコーダ300の機能を実行する処理回路などによって実行される。いくつかの実施形態では、プロセス800はソフトウェア命令で実現されているので、処理回路がソフトウェア命令を実行すると、処理回路は処理800を実行し、S810から開示されてもよい。
ステップS810において、ロセス800は、符号化されたビットストリームに応じて点群のバウンディングボックスの構文情報を復号化する。構文情報は、点群のバウンディングボックスの八分木分割構造を示す。そして、プロセス800はステップS820に進む。
ステップS820において、プロセス800は、構文情報が、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定する。そして、プロセス800はステップS830に進む。
ステップS830において、プロセス800は、構文情報が、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すことに応答して、ノードの占有コードに対して並行した復号化を実行する。そして、プロセス800はステップS840に進む。
ステップS840において、プロセス800は、ノードの占有コードに基づいてバウンディングボックスを再構成する。そして、プロセス800は終了する。
実施形態では、プロセス800は、信号通知されるフラグ、及び並行した復号化を実行する最小分割深度の1つに基づいて、構文情報が、八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定する。
実施形態では、プロセス800は、並行した復号化を実行する最大分割深度、及び最小分割深度に基づいて、ノードの占有コードに対して並行した復号化を実行する。最大分割深度は、八分木分割構造の最大分割深度以下である。
実施形態では、プロセス800は、符号化されたビットストリームにおいて、1つ又は複数の分割深度のそれぞれに対応するビットストリームオフセットに基づいて、1つ又は複数の分割深度のそれぞれのサブビットストリームを特定する。プロセス800は、1つ又は複数の分割深度のサブビットストリームに対して並行した復号化を実行する。
実施形態では、1つ又は複数の分割深度のそれぞれに対応するビットストリームオフセットは、構文情報に含まれる。
実施形態では、プロセス800は、占有コードのコンテキスト変数に基づいて、1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行する。
実施形態では、プロセス800は、ノードの占有コードのコンテキスト変数の初期確率を、1つ又は複数の事前定義された値として特定する。
実施形態では、プロセス800は、複数のノードの親ノードの占有コードのコンテキスト変数の確率に基づいて、ノードの占有コードのコンテキスト変数の初期確率を特定する。複数のノードは、並行した復号化を実行する最小分割深度にある。
実施形態では、プロセス800は、ノードの親ノードのサブセットの占有コードのコンテキスト変数の確率に基づいて、ノードの占有コードのコンテキスト変数の初期確率を特定する。
VIII.コンピュータシステム
上記の技術は、コンピュータ読み取り可能な命令によってコンピュータソフトウェアとして実現され、1つ又は複数のコンピュータ読み取り可能な媒体に物理的に記憶される。例えば、図9は開示された主題のいくつかの実施形態を実現するのに適したコンピュータシステム900を示す。
コンピュータソフトウェアは任意の適切なマシンコード又はコンピュータ言語を使用して符号化することができ、機械コード又はコンピュータ言語がアセンブル、コンパイル、リンクなどのメカニズムを介して命令を含むコードを作成することができ、当該命令は、1つ又は複数のコンピュータ中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)などによって直接に実行されるか、又は解釈、マイクロコード実行などによって実行されることができる。
命令は各種のタイプのコンピュータ又はそのコンポーネントで実行でき、例えばパーソナルコンピュータ、タブレット、サーバ、スマートフォン、ゲーム機器、モノのインターネット機器などを含む。
図9に示すコンピュータシステム900に関するコンポーネントは本質的に例示であり、本開示の実施形態を実現するためのコンピュータソフトウェアの使用範囲又は機能に制限を加えることを意図するものではない。コンポーネントの配置はコンピュータシステム900の例示的な実施例に示されるコンポーネントのいずれか又はそれらの組み合わせに関する依存性(依存関係)又は要件を有するものとして解釈されるべきではない。
コンピュータシステム900は、いくつかのヒューマンマシンインタフェース入力デバイスを含み得る。このようなヒューマンマシンインタフェース入力デバイスは、例えば、触覚入力(例えば、キーストローク、スワイプ、データグローブの移動)、オーディオ入力(例えば、音声、拍手)、視覚入力(例えば、姿勢)、嗅覚入力(図示せず)による1つ又は複数の人間のユーザの入力に応答してもよい。ヒューマンマシンインタフェースデバイスは、例えば、オーディオ(例えば、音声、音楽、環境音)、画像(例えば、スキャンした画像、静的画像撮影装置から取得された写真画像)、動画(例えば、2次元動画、ステレオ動画を含む3次元動画)などの、人間の意識的な入力に必ずしも直接関連するのではない特定のメディアをキャプチャするために使用されてもよい。
ヒューマンマシンインタフェース入力デバイスには、キーボード901、マウス902、トラックパッド903、タッチスクリーン910、データグローブ(図示せず)、ジョイスティック905、マイク906、スキャナー907、カメラ908のうちの1つ又は複数(それぞれが1つのみ図示される)を含んでもよい。
コンピュータシステム900はさらに、いくつかのヒューマンマシンインタフェース出力デバイスを含んでもよい。そのようなヒューマンインタフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン910、データグローブ(図示せず)、又はジョイスティック905による触覚フィードバックを含み得るが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る)、オーディオ出力デバイス(スピーカー909、ヘッドホン(図示せず)など)、視覚出力デバイス(CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含むスクリーン910など)を含んでもよく、タッチスクリーン入力機能あり又はなし、触覚フィードバック機能あり又はなし幾つかのスクリーンは、ステレオグラフィック出力、仮想現実ガラス(図示せず)、ホログラフィックディスプレイとスモークタンク(図示せず))などの手段を介して、2次元視覚出力又は3次元以上の出力、及びプリンター(図示せず)を出力できる場合がある。これらの視覚出力デバイス(例えば、スクリーン910)は、グラフィックアダプタ950を介してシステムバス948に接続することができる。
コンピュータシステム900はさらに、人間がアクセス可能な記憶装置及びそれらの関連する媒体を含んでもよく、例えば、CD/DVDを有する又は媒体921に類似するCD/DVD
ROM/RW920の光学媒体、サムドライブ922、リムーバブルハードドライブ又はソリッドステートドライブ923、レガシー磁気媒体(例えば、磁気テープやフロッピーディスク(図示せず))、専用ROM/ASIC/PLDに基づくデバイス(例えば、セキュリティドングル(図示せず))などを含んでもよい。
当業者は、現在開示のテーマを結合して、使用される用語「コンピュータ読み取り可能な媒体」には伝送媒体、搬送波又は他の瞬間信号が含まれないことを理解できる。
コンピュータシステム900は1つ又は複数の通信ネットワーク955へのネットワークインタフェース954をさらに含むことができる。1つ又は複数の通信ネットワーク955は、例えば、無線、有線、光であり得る。1つ又は複数の通信ネットワーク955は、さらに、ローカルエリアネットワーク、広域ネットワーク、メトロポリタンネットワーク、車両及び工業ネットワーク、リアルタイムネットワーク、遅延耐性ネットワークなどであり得る。1つ又は複数の通信ネットワーク955の例には、例えば、ローカルエリアネットワーク(例えば、イーサネット、無線LAN)、GSM、3G、4G、5G、LTEなどを含むセルラーネットワーク、ケーブルテレビ、衛星TV、及び地上放送TVを含む有線又は無線広域デジタルネットワーク、CANBusを含む車両及び工業ネットワークなどであってもよい。特定のネットワークは、通常、特定の汎用データポート又は周辺バス949(例えば、コンピュータシステムのUSBポート)の外部ネットワークインタフェースアダプタに接続された必要がある。他のネットワークは、通常、以下に説明するように(例えば、PCコンピュータシステムへのイーサネットインタフェース又はスマートフォンコンピュータシステムへのセルラーネットワークインタフェース)システムバスに接続することによってコンピュータシステム900のコアに統合される。コンピュータシステム900はこれらのネットワークのいずれかを使用して、他のエンティティと通信できる。このような通信は、単方向受信のみ(例えば、テレビ放送)、単方向の送信のみ(例えば、幾つかのCANバス装置のCANバスへ)、又は双方向(例えば、ローカル又はワイドエリアデジタルネットワークを使用して他のコンピュータシステムへ)であってもよい。上記のようにこれらのネットワークとネットワークインタフェースのそれぞれで特定のプロトコルとプロトコルスタックを使用できる。
以上で言及されたヒューマンマシンインタフェースデバイス、ヒューマンアクセス可能なストレージデバイス、及びネットワークインタフェースは、コンピュータシステム900のコア940に取り付けることができる。
コア940には、1つ又は複数の中央処理装置(CPU)941、グラフィックス処理ユニット(GPU)942、フィールドプログラマブルゲートアレイ(FPGA)943の形の専用なプログラマブル処理ユニット、特定のタスクに使用されるハードウェアアクセラレータ944などを含んでもよい。これらのデバイス、読み取り専用メモリ(ROM)945、ランダムアクセスメモリ(RAM)946、例えばユーザがアクセスできない内部ハードドライブ、SSDなどの内部大容量ストレージ947はシステムバス948を介して接続されてもよい。一部のコンピュータシステムにおいて、システムバス948に1つ又は複数の物理プラグの形でアクセスして、追加のCPU、GPUなどにより拡張を実現することができる。周辺機器は、コアのシステムバス948に直接、又は周辺バス949を介して接続することができる。周辺バスのアーキテクチャは、PCI、USBなどを含む。
CPU941、GPU942、FPGA943、及びアクセラレータ944は、組み合わせて上記のコンピュータコードを構成することができる特定の命令を実行してもよい。当該コンピュータコードは、ROM945又はRAM946に記憶されてもよい。一時的なデータもRAM946に記憶されてもよく、永続的なデータは、例えば内部大容量記憶装置947に記憶されてもよい。バッファメモリにより、記憶装置のうちのいずれかへの高速ストレージと検索を実現することができ、当該バッファメモリは、1つ又は複数のCPU941、GPU942、大容量記憶装置947、ROM945、RAM946などと密接に関連することができる。
コンピュータ読み取り可能な媒体は、コンピュータが実現する各種操作を実行するためのコンピュータコードを有してもよい。媒体とコンピュータコードとは、本開示の目的のために、専門に設計され及び構成された媒体とコンピュータコードであってもよいし、又はコンピュータソフトウェアの当業者にとって、公知且つ利用可能なタイプであってもよい。
例として限定ではなく、アーキテクチャを有するコンピュータシステム900、特にコア940は、プロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)が1つ又は複数の有形コンピュータ読み取り可能な媒体に実施されるソフトウェアを実行する結果として提供される機能を提供することができる。このようなコンピュータ読み取り可能な媒体は、以上に前記したユーザがアクセス可能な大容量記憶装置、及びコア940のいくつかの非一時的な性質を有するストレージ例えばコア内部大容量記憶装置947又はROM945に関連する媒体であってもよい。本開示の様々な実施形態を実現するソフトウェアはこのようなデバイスに記憶され、コア940によって実行されてもよい。特定のニーズに応じて、コンピュータ読み取り可能な媒体には1つ又は複数のメモリ又はチップが含まれてもよい。ソフトウェアは、コア940、特にそのうちのプロセッサ(CPU、GPU、FPGAなどを含む)に、本明細書で説明される特定のプロセス又は特定のプロセスの特定の部分を実行させ、ソフトウェアによって定義されたプロセスによりRAM(1146)に記憶されるデータ構造を定義し、このようなデータ構造を修正することを含む。さらに又は代わりとして、コンピュータシステムは、ロジックハードワイヤードによって提供される、又は、他の方式で回路(例えば、アクセラレータ944に具現化される機能を提供することができ、当該回路は、ソフトウェアの代わりとして、又はソフトウェアとともに運用することで、本明細書で説明される特定のプロセス又は特定のプロセスの特定部分を実行できる。適切な場合、ソフトウェアに対する言及にはロジックが含まれ、逆に、ロジックに対する言及にはソフトウェアが含まれてもよい。コンピュータ読み取り可能な媒体への言及は、必要に応じて、実行用ソフトウェアを格納する回路(例えば、集積回路(IC)など)、実行用論理を実施する回路、又はその両方を包含することができる。本開示は、ハードウェアとソフトウェアとの任意の適切な組み合わせを包含する。
本開示はいくつかの例示的な実施形態を説明しているが、本開示の範囲内にある変更、順列、及び様々な代替同等物が存在する。したがって、当業者は、本明細書に明示的に示されていないか又は記載されていないが、開示の原理を具体化し、したがってその精神及び範囲内にある多数のシステム及び方法を考案することができることが理解されたい。

Claims (19)

  1. デコーダが実行する点群符号化のための方法であって、
    符号化されたビットストリームに応じて点群のバウンディングボックスの構文情報を復号化するステップであって、前記構文情報は、前記点群の前記バウンディングボックスの八分木分割構造を示すステップと、
    前記構文情報が前記八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定するステップと、
    前記構文情報が前記八分木分割構造における1つ又は複数の分割深度の範囲内の少なくとも隣接する複数のノードの占有コードの全てに対して並行した復号化を実行することを示すことに応答して、前記ノードの前記占有コードに対して前記並行した復号化を実行するステップと、
    前記ノードの前記占有コードに基づいて、前記バウンディングボックスを再構成するステップと、を含む方法。
  2. 前記特定するステップは、
    信号通知されるフラグ、及び前記並行した復号化を実行する最小分割深度の1つに基づいて、前記構文情報が前記八分木分割構造における前記1つ又は複数の分割深度の範囲内の前記ノードの前記占有コードに対して並行した復号化を実行することを示すかどうかを特定するステップをさらに含む、請求項1に記載の方法。
  3. 前記実行するステップは、
    前記並行した復号化を実行する最大分割深度、及び前記最小分割深度に基づいて、前記ノードの前記占有コードに対して前記並行した復号化を実行するステップをさらに含み、前記最大分割深度は、前記八分木分割構造の最大分割深度以下である、請求項2に記載の方法。
  4. 前記実行するステップは、
    前記符号化されたビットストリームにおいて、前記1つ又は複数の分割深度のそれぞれに対応するビットストリームオフセットに基づいて、前記1つ又は複数の分割深度のそれぞれのサブビットストリームを特定するステップと、
    前記1つ又は複数の分割深度の前記サブビットストリームに対して前記並行した復号化を実行するステップと、をさらに含む、請求項1~3のいずれか1項に記載の方法。
  5. 前記1つ又は複数の分割深度のそれぞれに対応する前記ビットストリームオフセットは、前記構文情報に含まれる、請求項4に記載の方法。
  6. 前記実行するステップは、
    前記占有コードのコンテキスト変数に基づいて、前記1つ又は複数の分割深度の範囲内の前記ノードの前記占有コードに対して前記並行した復号化を実行するステップをさらに含む、請求項1~5のいずれか1項に記載の方法。
  7. 前記ノードの前記占有コードの前記コンテキスト変数の初期化に関する確率を、1つ又は複数の事前定義された値として特定することをさらに含む、請求項6に記載の方法。
  8. 複数のノードの親ノードの占有コードのコンテキスト変数の確率に基づいて、前記ノードの前記占有コードの前記コンテキスト変数の初期化に関する確率を特定するステップをさらに含み、前記複数のノードは、前記並行した復号化を実行する最小分割深度にある、請求項6に記載の方法。
  9. 前記ノードの親ノードのサブセットの占有コードのコンテキスト変数の確率に基づいて、前記ノードの前記占有コードの前記コンテキスト変数の初期化に関する確率を特定するステップをさらに含む、請求項6に記載の方法。
  10. 処理回路システムを含む点群符号化のための装置であって、
    前記処理回路システムは、
    符号化されたビットストリームに応じて点群のバウンディングボックスの構文情報を復号化することであって、前記構文情報は、前記点群の前記バウンディングボックスの八分木分割構造を示す、復号化すること、
    前記構文情報が前記八分木分割構造における1つ又は複数の分割深度の範囲内のノードの占有コードに対して並行した復号化を実行することを示すかどうかを特定すること、
    前記構文情報が前記八分木分割構造における1つ又は複数の分割深度の範囲内の少なくとも隣接する複数のノードの占有コードの全てに対して並行した復号化を実行することを示すことに応答して、前記ノードの前記占有コードに対して前記並行した復号化を実行すること、及び
    前記ノードの前記占有コードに基づいて、前記バウンディングボックスを再構成すること、を実行する、装置。
  11. 前記処理回路システムは、さらに、
    信号通知されるフラグ、及び前記並行した復号化を実行する最小分割深度の1つに基づいて、前記構文情報が前記八分木分割構造における前記1つ又は複数の分割深度の範囲内の前記ノードの前記占有コードに対して並行した復号化を実行することを示すかどうかを特定する、ように配置される、請求項10に記載の装置。
  12. 前記処理回路システムは、さらに、
    前記並行した復号化を実行する最大分割深度、及び前記最小分割深度に基づいて、前記ノードの前記占有コードに対して前記並行した復号化を実行するように配置されており、前記最大分割深度は、前記八分木分割構造の最大分割深度以下である、請求項11に記載の装置。
  13. 前記処理回路システムは、さらに、
    前記符号化されたビットストリームにおいて、前記1つ又は複数の分割深度のそれぞれに対応するビットストリームオフセットに基づいて、前記1つ又は複数の分割深度のそれぞれのサブビットストリームを特定し、
    前記1つ又は複数の分割深度の前記サブビットストリームに対して前記並行した復号化を実行する、ように配置される、請求項10~12のいずれか1項に記載の装置。
  14. 前記1つ又は複数の分割深度のそれぞれに対応する前記ビットストリームオフセットは、前記構文情報に含まれる、請求項13に記載の装置。
  15. 前記処理回路システムは、さらに、
    前記占有コードのコンテキスト変数に基づいて、前記1つ又は複数の分割深度の範囲内の前記ノードの前記占有コードに対して前記並行した復号化を実行するように配置される、請求項10~14のいずれか1項に記載の装置。
  16. 前記処理回路システムは、さらに、
    前記ノードの前記占有コードの前記コンテキスト変数の初期化に関する確率を、1つ又は複数の事前定義された値として特定するように配置される、請求項15に記載の装置。
  17. 前記処理回路システムは、さらに、
    複数のノードの親ノードの占有コードのコンテキスト変数の確率に基づいて、前記ノードの前記占有コードの前記コンテキスト変数の初期化に関する確率を特定するように配置されており、前記複数のノードは、前記並行した復号化を実行する最小分割深度にある、請求項15に記載の装置。
  18. 前記処理回路システムは、さらに、
    前記ノードの親ノードのサブセットの占有コードのコンテキスト変数の確率に基づいて、前記ノードの前記占有コードの前記コンテキスト変数の初期化に関する確率を特定するように配置される、請求項15に記載の装置。
  19. コンピュータプログラムであって、
    コンピュータで実行されると、請求項1~9のいずれか1項に記載の点群符号化のための方法をコンピュータに実現させる、コンピュータプログラム。
JP2021559633A 2019-09-16 2020-09-10 点群圧縮のための方法及び装置、並びにコンピュータプログラム Active JP7257547B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962901047P 2019-09-16 2019-09-16
US62/901,047 2019-09-16
US202062958131P 2020-01-07 2020-01-07
US62/958,131 2020-01-07
US202062961518P 2020-01-15 2020-01-15
US62/961,518 2020-01-15
US17/010,363 US11368717B2 (en) 2019-09-16 2020-09-02 Method and apparatus for point cloud compression
US17/010,363 2020-09-02
PCT/US2020/050140 WO2021055225A1 (en) 2019-09-16 2020-09-10 Method and apparatus for point cloud compression

Publications (2)

Publication Number Publication Date
JP2022535487A JP2022535487A (ja) 2022-08-09
JP7257547B2 true JP7257547B2 (ja) 2023-04-13

Family

ID=74868136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021559633A Active JP7257547B2 (ja) 2019-09-16 2020-09-10 点群圧縮のための方法及び装置、並びにコンピュータプログラム

Country Status (6)

Country Link
US (5) US11368717B2 (ja)
EP (1) EP4032019A4 (ja)
JP (1) JP7257547B2 (ja)
KR (1) KR20210114508A (ja)
CN (1) CN113574540B (ja)
WO (1) WO2021055225A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10897269B2 (en) 2017-09-14 2021-01-19 Apple Inc. Hierarchical point cloud compression
US10861196B2 (en) 2017-09-14 2020-12-08 Apple Inc. Point cloud compression
US11818401B2 (en) 2017-09-14 2023-11-14 Apple Inc. Point cloud geometry compression using octrees and binary arithmetic encoding with adaptive look-up tables
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US10607373B2 (en) 2017-11-22 2020-03-31 Apple Inc. Point cloud compression with closed-loop color conversion
US10909726B2 (en) 2018-04-10 2021-02-02 Apple Inc. Point cloud compression
US10939129B2 (en) 2018-04-10 2021-03-02 Apple Inc. Point cloud compression
US10909727B2 (en) 2018-04-10 2021-02-02 Apple Inc. Hierarchical point cloud compression with smoothing
US11010928B2 (en) 2018-04-10 2021-05-18 Apple Inc. Adaptive distance based point cloud compression
US11017566B1 (en) 2018-07-02 2021-05-25 Apple Inc. Point cloud compression with adaptive filtering
US11202098B2 (en) 2018-07-05 2021-12-14 Apple Inc. Point cloud compression with multi-resolution video encoding
US11012713B2 (en) 2018-07-12 2021-05-18 Apple Inc. Bit stream structure for compressed point cloud data
US11367224B2 (en) 2018-10-02 2022-06-21 Apple Inc. Occupancy map block-to-patch information compression
US11057564B2 (en) 2019-03-28 2021-07-06 Apple Inc. Multiple layer flexure for supporting a moving image sensor
US20220327742A1 (en) * 2019-06-26 2022-10-13 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device and point cloud data reception method
US11711544B2 (en) 2019-07-02 2023-07-25 Apple Inc. Point cloud compression with supplemental information messages
US11368717B2 (en) * 2019-09-16 2022-06-21 Tencent America LLC Method and apparatus for point cloud compression
US11627314B2 (en) 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11562507B2 (en) 2019-09-27 2023-01-24 Apple Inc. Point cloud compression using video encoding with time consistent patches
US11538196B2 (en) 2019-10-02 2022-12-27 Apple Inc. Predictive coding for point cloud compression
US11895307B2 (en) 2019-10-04 2024-02-06 Apple Inc. Block-based predictive coding for point cloud compression
US11798196B2 (en) 2020-01-08 2023-10-24 Apple Inc. Video-based point cloud compression with predicted patches
US11475605B2 (en) * 2020-01-09 2022-10-18 Apple Inc. Geometry encoding of duplicate points
US11615557B2 (en) 2020-06-24 2023-03-28 Apple Inc. Point cloud compression using octrees with slicing
US11620768B2 (en) 2020-06-24 2023-04-04 Apple Inc. Point cloud geometry compression using octrees with multiple scan orders
US11816868B2 (en) * 2020-08-14 2023-11-14 Tencent America LLC Coding of multiple-component attributes for point cloud coding
KR102447796B1 (ko) * 2020-11-27 2022-09-27 한국전자기술연구원 V-pcc 부호화기를 위한 패치 세그먼트 고속 정제 장치 및 그 방법
US11948338B1 (en) 2021-03-29 2024-04-02 Apple Inc. 3D volumetric content encoding using 2D videos and simplified 3D meshes
US20230018907A1 (en) * 2021-07-01 2023-01-19 Qualcomm Incorporated Occupancy coding using inter prediction in geometry point cloud compression
CN113487691B (zh) * 2021-09-08 2022-01-28 北京医百科技有限公司 一种点云编码方法、系统及存储介质
CN114972551A (zh) * 2022-02-11 2022-08-30 北京大学深圳研究生院 一种点云的压缩和解压缩方法
WO2023172703A1 (en) * 2022-03-09 2023-09-14 Innopeak Technology, Inc. Geometry point cloud coding
WO2023197337A1 (zh) * 2022-04-16 2023-10-19 Oppo广东移动通信有限公司 索引确定方法、装置、解码器以及编码器

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019082837A1 (ja) 2017-10-24 2019-05-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7952583B2 (en) * 2000-06-19 2011-05-31 Mental Images Gmbh Quasi-monte carlo light transport simulation by efficient ray tracing
KR100446635B1 (ko) * 2001-11-27 2004-09-04 삼성전자주식회사 깊이 이미지 기반 3차원 객체 표현 장치 및 방법
CA2514655C (en) * 2001-11-27 2010-05-11 Samsung Electronics Co., Ltd. Apparatus and method for depth image-based representation of 3-dimensional object
CN103858433B (zh) 2011-08-25 2017-08-15 汤姆逊许可公司 分层熵编码及解码
US9332283B2 (en) 2011-09-27 2016-05-03 Broadcom Corporation Signaling of prediction size unit in accordance with video coding
US9736488B2 (en) 2013-11-27 2017-08-15 Nxp Usa, Inc. Decoding for high efficiency video transcoding
US9734595B2 (en) 2014-09-24 2017-08-15 University of Maribor Method and apparatus for near-lossless compression and decompression of 3D meshes and point clouds
US20170214943A1 (en) 2016-01-22 2017-07-27 Mitsubishi Electric Research Laboratories, Inc. Point Cloud Compression using Prediction and Shape-Adaptive Transforms
US10223810B2 (en) 2016-05-28 2019-03-05 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
US11297346B2 (en) 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds
WO2017217191A1 (ja) 2016-06-14 2017-12-21 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置及び三次元データ復号装置
EP3429207A1 (en) 2017-07-13 2019-01-16 Thomson Licensing A method and apparatus for encoding/decoding a colored point cloud representing the geometry and colors of a 3d object
EP3467778A1 (en) * 2017-10-06 2019-04-10 Thomson Licensing A method and apparatus for encoding/decoding the geometry of a point cloud representing a 3d object
US20190116372A1 (en) * 2017-10-16 2019-04-18 Mitsubishi Electric Research Laboratories, Inc. Systems and Methods for Compressing, Representing and Processing Point Clouds
CN110662087B (zh) * 2018-06-30 2021-05-11 华为技术有限公司 点云编解码方法和编解码器
WO2020053477A2 (en) * 2018-09-12 2020-03-19 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US11348284B2 (en) * 2019-01-08 2022-05-31 Apple Inc. Auxiliary information signaling and reference management for projection-based point cloud compression
US11109071B2 (en) * 2019-01-09 2021-08-31 Tencent America LLC Method and apparatus for dynamic point cloud partition packing
US11381840B2 (en) 2019-06-26 2022-07-05 Tencent America LLC Implicit quadtree or binary-tree geometry partition for point cloud coding
CN113632142A (zh) * 2019-07-02 2021-11-09 腾讯美国有限责任公司 点云压缩的方法和装置
US11803986B2 (en) * 2019-08-08 2023-10-31 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US11172224B2 (en) * 2019-09-03 2021-11-09 Tencent America LLC Techniques and apparatus for generalized Trisoup geometry coding
US11368717B2 (en) * 2019-09-16 2022-06-21 Tencent America LLC Method and apparatus for point cloud compression
JP2022531541A (ja) * 2019-12-23 2022-07-07 テンセント・アメリカ・エルエルシー ビデオ符号化/復号のための方法および装置
EP4075797A4 (en) * 2020-01-08 2023-05-31 LG Electronics Inc. POINT CLOUD DATA TRANSMITTING DEVICE, POINT CLOUD DATA TRANSMITTING METHOD, POINT CLOUD DATA RECEIVING DEVICE AND POINT CLOUD DATA RECEIVING METHOD

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019082837A1 (ja) 2017-10-24 2019-05-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Also Published As

Publication number Publication date
JP2022535487A (ja) 2022-08-09
EP4032019A1 (en) 2022-07-27
EP4032019A4 (en) 2022-11-23
US11368717B2 (en) 2022-06-21
CN113574540A (zh) 2021-10-29
KR20210114508A (ko) 2021-09-23
US20220248053A1 (en) 2022-08-04
US20220038743A1 (en) 2022-02-03
US11750839B2 (en) 2023-09-05
US20220248054A1 (en) 2022-08-04
US11711545B2 (en) 2023-07-25
US20210084333A1 (en) 2021-03-18
US11683524B2 (en) 2023-06-20
CN113574540B (zh) 2023-10-31
US20220272381A1 (en) 2022-08-25
US11736726B2 (en) 2023-08-22
WO2021055225A1 (en) 2021-03-25

Similar Documents

Publication Publication Date Title
JP7257547B2 (ja) 点群圧縮のための方法及び装置、並びにコンピュータプログラム
JP7252372B2 (ja) 点群コーディングのための方法及び装置
JP7261300B2 (ja) 適応ポイントクラウド属性コーディングのための方法、装置、及びコンピュータプログラム
JP7233561B2 (ja) 点群圧縮のための方法並びにその、装置およびコンピュータプログラム
US11140395B2 (en) Method and apparatus for adaptive point cloud attribute coding
KR102584519B1 (ko) 포인트 클라우드 압축을 위한 변환 계수들의 알파벳-파티션 코딩을 위한 기술들 및 장치들
JP7213368B2 (ja) 点群属性コーディングのためのチャネル間予測および変換の技術並びに装置
CN115176279A (zh) 用于点云译码的方法和装置
US11606561B2 (en) Method and apparatus for adaptive point cloud attribute coding
CN113115019B (zh) 视频编解码方法、装置、计算机设备及存储介质
JP2022551184A (ja) ブロック分割を伴うニューラルネットワークを復号する方法、装置及びプログラム
JP2024515208A (ja) メッシュ圧縮のための境界uv2xyzインデックスの予測コーディング
JP2023533423A (ja) ビデオベースの点群コーディングのための非バイナリ占有マップ
WO2024081393A1 (en) Adaptive geometry filtering for mesh compression
JP2024518765A (ja) メッシュ圧縮のための境界uv情報の予測コーディング
WO2023200599A1 (en) Improvements on coding of boundary uv2xyz index for mesh compression
CN112188216A (zh) 视频数据的编码方法、装置、计算机设备及存储介质
CN117396923A (zh) 利用用于动态网格压缩的边界信息的三角形化方法
CN115152225A (zh) 用于点云译码的方法和设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230403

R150 Certificate of patent or registration of utility model

Ref document number: 7257547

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150