JP7213368B2 - 点群属性コーディングのためのチャネル間予測および変換の技術並びに装置 - Google Patents

点群属性コーディングのためのチャネル間予測および変換の技術並びに装置 Download PDF

Info

Publication number
JP7213368B2
JP7213368B2 JP2021556274A JP2021556274A JP7213368B2 JP 7213368 B2 JP7213368 B2 JP 7213368B2 JP 2021556274 A JP2021556274 A JP 2021556274A JP 2021556274 A JP2021556274 A JP 2021556274A JP 7213368 B2 JP7213368 B2 JP 7213368B2
Authority
JP
Japan
Prior art keywords
channel
inter
color
point cloud
reconstructed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021556274A
Other languages
English (en)
Other versions
JP2022535484A (ja
Inventor
イエア,セフーン
ウェンジャー,ステファン
リィウ,シャン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2022535484A publication Critical patent/JP2022535484A/ja
Application granted granted Critical
Publication of JP7213368B2 publication Critical patent/JP7213368B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

(関連出願の相互参照)
本出願は、2019年10月10日に出願された米国仮特許出願第62/913,495号および2020年9月28日に出願された米国特許出願第17/034,896号に基づく優先権を主張し、その内容を全て本明細書に組み込むものとする。
(技術分野)
実施形態に従う方法および装置は、グラフベースの点群圧縮(G-PCC)を使用したビデオコーディングおよび復号、それを実行するビデオエンコーダおよびデコーダに関し、より具体的には、チャネル間予測および変換を使用することを含む、点群サンプルの属性情報のコーディングに関するものである。
世界の高度な3次元(3D)表現は、より没入的な形態のインタラクションおよびコミュニケーションを可能にし、機械が我々の世界を理解し、解釈し、ナビゲートすることをも可能にする。3D点群は、このような情報の表現を可能にするものとして登場した。点群データに関連する多くのユースケースが特定され、点群表現および圧縮についての対応する要件が開発されている。
点群は、それぞれが、例えば、色、材料特性などの関連する属性を持つ、3D空間内の点のセットである。点群は、オブジェクトまたはシーンをそのような点の合成として再構築するために使用されることができる。点群は、複数のカメラ及び深度センサを用いて種々の設定でキャプチャされることができ、再構築されたシーンをリアルに表現するために、数千から数十億の点で構成されることがある。
点群を表現するためのデータ量を減らすために、圧縮技術が必要である。そのため、リアルタイム通信および6自由度(6DoF)バーチャルリアリティで使用するための点群を非可逆圧縮する技術が要る。さらに、自動運転や文化遺産への適用などのための動的マッピングの文脈において、可逆点群圧縮の技術が求められている。動画専門家集団(Moving Picture Experts Group、MPEG)は、ジオメトリおよび色、反射率などの属性の圧縮、スケーラブル/プログレッシブなコーディング、時間の経過とともにキャプチャされた点群のシーケンスのコーディング、および点群のサブセットへのランダムアクセスに対処する規格に取り組み始めた。
実施形態によれば、点群属性コーディングの方法は、少なくとも1つのプロセッサによって実行され、点群に対応するエンコードされたビットストリームを取得するステップと、エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定するステップと、エンコードされたビットストリームがチャネル間ツールを使用してエンコードされたと判定されたことに基づき、点群に対応する属性信号を再構築するために、チャネル間ツールを使用してエンコードされたビットストリームをデコードするステップと、再構築された属性信号を使用して点群を再構築するステップと、を含む。
実施形態によれば、点群属性コーディングのための装置は、コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、少なくとも1つのメモリにアクセスし、コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサであって、コンピュータプログラムコードは、少なくとも1つのプロセッサに、点群に対応するエンコードされたビットストリームを取得させるように構成される第1の取得コードと、少なくとも1つのプロセッサに、エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定させるように構成される判定コードと、少なくとも1つのプロセッサに、エンコードされたビットストリームがチャネル間ツールを使用してエンコードされたと判定されたことに基づき、点群に対応する属性信号を再構築するために、チャネル間ツールを使用してエンコードされたビットストリームをデコードさせるように構成されるデコーディングコードと、少なくとも1つのプロセッサに、再構築された属性信号を使用して点群を再構築させるように構成される再構築コードと、を含む少なくとも1つのプロセッサと、を備える。
実施形態によれば、非一時的なコンピュータ読取可能な媒体は、命令を記憶し、命令は、点群属性コーディングのための装置の一つ以上のプロセッサによって実行されると、一つ以上のプロセッサに、点群に対応するエンコードされたビットストリームを取得するステップと、エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定するステップと、エンコードされたビットストリームがチャネル間ツールを使用してエンコードされたと判定されたことに基づき、点群に対応する属性信号を再構築するために、チャネル間ツールを使用してエンコードされたビットストリームをデコードするステップと、再構築された属性信号を使用して点群を再構築するステップと、を実行させるように構成される一つ以上の命令を含む。
実施形態による通信システムのブロック図である。
実施形態による、ある環境におけるG-PCC圧縮器およびG-PCC解凍器の配置の図である。
実施形態によるG-PCC圧縮器の機能ブロック図である。
実施形態によるG-PCC解凍器の機能ブロック図である。
実施形態による、G-PCCにおいて詳細レベル(LoD)を生成する方法を示す図である。
G-PCCにおけるP/Uリフティングのアーキテクチャの図である。
実施形態による、点群属性コーディングのための方法を示すフローチャートである。
実施形態による、点群属性コーディングのための装置のブロック図である。
実施形態の実装に適したコンピュータシステムの図である。
実施形態は、現在のグラフベースの点群圧縮(G-PCC)リフティング設計、および、リフティング係数のロスレスコーディングを可能にするためにそれを拡張または修正する方法に関する。さらに、実施形態は、現在のG-PCCリフティング設計の下での属性のスケーラブルコーディングに関する。これらの実施形態は、点群用に設計された同様のコーデックに適用されることができる。
図1は、実施形態による通信システム100のブロック図である。通信システム100は、ネットワーク150を介して相互接続された少なくとも2つの端末110および120を含み得る。データの単方向送信の場合、第1の端末110は、ネットワーク150を介して第2の端末120へ送信するために、点群データをローカルロケーションでコード化してもよい。第2の端末120は、第1の端末110のコード化された点群データをネットワーク150から受信し、コード化された点群データをデコードし、デコードされた点群データを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。
図1は、例えばビデオ会議中に発生し得るコード化された点群データの双方向送信をサポートするために提供される第2の対の端末130および140をさらに示している。データの双方向送信の場合、各端末130または140は、ネットワーク150を介して他の端末へ送信するために、ローカルロケーションでキャプチャされた点群データをコード化してもよい。また、各端末130または140は、他の端末で送信されたコード化された点群データを受信し、コード化された点群データをデコードし、デコードされた点群データをローカルの表示装置に表示することができる。
図1において、端末110~140は、サーバ、パーソナルコンピュータ、およびスマートフォンとして示され得るが、実施形態の原理は、これに制限されることはない。実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤーおよび/または専用のビデオ会議機器における用途を見出す。ネットワーク150は、例えば有線および/または無線通信ネットワークを含む、端末110~140間でコード化された点群データを伝達する任意の数のネットワークを表す。通信ネットワーク150は、回線交換および/またはパケット交換チャネルでデータを交換することができる。代表的なネットワークとしては、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび/またはインターネットが挙げられる。本議論の目的のために、ネットワーク150のアーキテクチャおよびトポロジーは、以下で説明されない限り、実施形態の動作にとって重要ではないことがある。
図2は、実施形態による、ある環境におけるG-PCC圧縮器203およびG-PCC解凍器210の配置の図である。開示された主題は、例えば、ビデオ会議、デジタルTV、および、CD、DVD、メモリスティックなどを含むデジタルメディアへの圧縮された点群データの記憶など、を含む、他の点群対応アプリケーションに等しく適用可能である。
ストリーミングシステム200は、例えば非圧縮の点群データ202を作成するデジタルカメラなどの点群ソース201を含むことができるキャプチャサブシステム213を含んでもよい。より高いデータ量を有する点群データ202は、点群ソース201に結合されたG-PCC圧縮器203によって処理され得る。G-PCC圧縮器203は、以下でより詳細に説明するように、開示された主題の態様を可能にするかまたは実施するために、ハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。より低いデータ量を有するエンコードされた点群データ204は、将来使うためにストリーミングサーバ205に記憶されることができる。一つ以上のストリーミングクライアント206および208は、ストリーミングサーバ205にアクセスして、エンコードされた点群データ204のコピー207および209を検索することができる。クライアント206は、エンコードされた点群データの入り方向コピー207をデコードし、ディスプレイ212または他のレンダリングデバイス(示されていない)でレンダリングできる出方向点群データ211を作成するG-PCC解凍器210を含むことができる。一部のストリーミングシステムにおいて、エンコードされた点群データ204、207、209は、ビデオコーディング/圧縮規格に従ってエンコードされることができる。これらの規格の例には、G-PCCのためにMPEGによって開発されているものが含まれる。
図3は、実施形態によるG-PCC圧縮器203の機能ブロック図である。
図3に示すように、G-PCC圧縮器203は、量子化器305と、点除去モジュール310と、八分木エンコーダ315と、属性転送モジュール320と、LoD生成器325と、予測モジュール330と、量子化器335と、算術符号化器340とを備える。
量子化器305は、入力点群内の点の位置を受信する。位置は、(x,y,z)座標であってもよい。量子化器305は、さらに、例えばスケーリングアルゴリズムおよび/またはシフトアルゴリズムを用いて、受信された位置を量子化する。
点除去モジュール310は、量子化された位置を量子化器305から受信し、受信された量子化された位置から重複位置を除去またはフィルタリングする。
八分木エンコーダ315は、フィルタリングされた位置を点除去モジュール310から受信し、受信されたフィルタリングされた位置を、八分木エンコーディングアルゴリズムを用いて、入力点群を表す八分木の占有シンボルにエンコードする。八分木に対応する入力点群のバウンディングボックスは、任意の3D形状、例えば、立方体であってもよい。
八分木エンコーダ315は、さらに、フィルタリングされた位置のエンコーディングに基づいて、受信されたフィルタリングされた位置を並べ替える。
属性転送モジュール320は、入力点群内の点の属性を受信する。属性は、例えば、各点の色またはRGB値および/または反射率を含んでもよい。属性転送モジュール320は、さらに、八分木エンコーダ315から並べ替えられた位置を受信する。
属性転送モジュール320は、さらに、受信された並べ替えられた位置に基づいて、受信された属性を更新する。例えば、属性転送モジュール320は、受信された属性に対して、例えば、受信された属性の重み付け及び平均化、並びに受信された属性からの追加の属性の補間を含む前処理アルゴリズムのうちの1つ又は複数を実行してもよい。属性転送モジュール320は、さらに、更新された属性を予測モジュール330に転送する。
LoD生成器325は、八分木エンコーダ315から並び替えられた位置を受信し、受信された並び替えられた位置に対応する点のそれぞれのLoDを取得する。各LoDは、点のグループと見なすことができ、点のそれぞれの距離に基づいて取得されることができる。
予測モジュール330は、転送された属性を属性転送モジュール320から受信し、点のそれぞれの取得されたLoDをLoD生成器325から受信する。予測モジュール330は、点のそれぞれの受信されたLoDに基づく順序で、受信された属性に予測アルゴリズムを適用することによって、受信された属性の予測残差(値)をそれぞれ取得する。予測アルゴリズムは、例えば、補間、加重平均の計算、最近傍法、およびRDOなどの様々な予測アルゴリズムのうちのいずれかを含んでもよい。
量子化器335は、予測モジュール330から、取得された予測残差を受信し、例えばスケーリングアルゴリズムおよび/またはシフトアルゴリズムを用いて、受信された予測された残差を量子化する。
算術符号化器340は、八分木エンコーダ315から占有シンボルを受信し、量子化された予測残差を量子化器335から受信する。算術符号化器340は、受信された占有シンボルおよび量子化された予測残差に対して算術コーディングを実行して、圧縮ビットストリームを取得する。算術コーディングは、例えば文脈適応型二値算術コーディングのような様々なエントロピーエンコードアルゴリズムのうちのいずれかを含んでもよい。
図4は、実施形態によるG-PCC解凍器210の機能ブロック図である。
図4に示すように、G-PCC解凍器210は、算術デコーダ405と、八分木デコーダ410と、逆量子化器415と、LoD生成器420と、逆量子化器425と、逆予測モジュール430とを備える。
算術デコーダ405は、G-PCC圧縮器203から圧縮ビットストリームを受信し、受信された圧縮ビットストリームに対して算術デコードを実行して、占有シンボルおよび量子化された予測残差を取得する。算術デコードは、例えば文脈適応型二値算術デコードなどの様々なエントロピーデコードアルゴリズムのうちのいずれかを含んでもよい。
八分木デコーダ410は、算術デコーダ405から、取得された占有シンボルを受信し、八分木デコードアルゴリズムを用いて、受信された占有シンボルを量子化された位置にデコードする。
逆量子化器415は、量子化された位置を八分木デコーダ410から受信し、例えばスケーリングアルゴリズムおよび/またはシフトアルゴリズムを用いて、受信された量子化された位置を逆量子化して、入力点群内の点の再構築された位置を取得する。
LoD生成器420は、量子化された位置を八分木デコーダ410から受信し、受信された量子化された位置に対応する点のそれぞれのLoDを取得する。
逆量子化器425は、取得された量子化された予測残差を受信し、例えばスケーリングアルゴリズムおよび/またはシフトアルゴリズムを用いて、受信された量子化された予測残差を逆量子化して、再構築された予測残差を取得する。
逆予測モジュール430は、取得された再構築された予測残差を逆量子化器425から受信し、点のそれぞれの取得されたLoDをLoD生成器420から受信する。逆予測モジュール430は、点のそれぞれの受信されたLoDに基づく順序で、受信された再構築された予測残差に予測アルゴリズムを適用することにより、受信された再構築された予測残差の再構築された属性をそれぞれ取得する。予測アルゴリズムは、例えば、補間、加重平均の計算、最近傍法、およびRDOなどの様々な予測アルゴリズムのうちのいずれかを含んでもよい。再構築された属性は、入力点群内の点のものである。
次に、点群属性コーディングのためのチャネル間予測および変換のための方法および装置について詳細に説明する。このような方法および装置は、上述のG-PCC圧縮器203、すなわち、予測モジュール430で実施されることができる。このような方法および装置は、G-PCC解凍器210、すなわち、逆予測モジュール430で実施されてもよい。
図5は、G-PCCにおいて詳細レベル(level of detail、LoD)を生成する方法を示す図である。
図5を参照すると、現在のG-PCC属性コーディングでは、各3D点の距離に基づいて各3D点(例えば、P0~P9)のLoD(すなわち、グループ)を生成し、その後、各LoD内の3D点の属性値を、3D点の元の順序505の代わりにLoDベースの順序510で予測を適用することによってエンコードする。例えば、3D点P2の属性値は、3D点P2の前にエンコードまたはデコードされた3D点P0、P5、P4の距離ベースの加重平均値を算出することによって予測される。
G-PCCにおける現在のアンカー方法は、以下のように進行する。
まず、3D点の近傍の変動率を計算して、近傍値がどの程度異なるかを確認し、変動率が閾値よりも低い場合、現在の点iの最近傍の距離に基づく線形補間処理を用いて、属性値
Figure 0007213368000001
を予測することにより、距離ベースの加重平均予測の算出を行う。
Figure 0007213368000002
を現在の点iのk-最近傍のセットとし、
Figure 0007213368000003
をそれらのデコード/再構築された属性値とし、
Figure 0007213368000004
を現在の点iまでの距離とする。予測された属性値

Figure 0007213368000005
は次の式で与えられる。
Figure 0007213368000006
属性がコード化されるとき、すべての点群の幾何学的位置はすでに利用可能であることに留意されたい。加えて、隣接する点とそれらの再構築された属性値は、エンコーダとデコーダの両方で、同一の方法で各点の最近傍探索を容易にするために使用されるk次元の木構造として利用可能である。
第2に、変動率が閾値よりも高い場合、レート歪み最適化(RDO)予測子選択を実行する。LoDを生成する際の近傍点探索の結果に基づいて、複数の予測子候補または候補予測値を作成する。例えば、3D点P2の属性値を、予測を用いてエンコードする場合、3D点P2から3D点P0、P5、P4のそれぞれまでの距離の加重平均値を、0に等しい予測子インデックスに設定する。そして、3D点P2から最近傍点P4までの距離を1に等しい予測子インデックスに設定する。さらに、下の表1に示すように、3D点P2から次の最近傍点P5およびP0のそれぞれまでの距離を2および3に等しい予測子インデックスに設定する。
Figure 0007213368000007
予測子候補を作成した後、レート歪み最適化手順を適用することによって最良の予測子を選択し、その後、選択された予測子インデックスを、ビンが算術コード化されていく切り捨てられた単項(Truncated Unary、TU)コードにマッピングする。なお、表1では、より短いTUコードがより小さい予測子インデックスに割り当てられる。
予測子候補の最大数MaxNumCandが定義され、属性ヘッダにエンコードされる。現在の実装では、予測子候補の最大数MaxNumCandは、numberOfNearestNeighborsInPrediction+1に等しく設定され、切り捨てられた単項二値化を使用した予測子インデックスのエンコードおよびデコードに使用される。
図6は、G-PCCにおけるP/U(Prediction/Update)リフティングのアーキテクチャの図である。リフティングにおける予測と更新のステップを容易にするには、分解の各段階で、信号を二つの高相関セットに分割する必要がある。G-PCCのリフティング方式では、レベル間でこのような高相関が期待でき、各レベルを最近傍探索によって構築することで、不均一な点群を構造化されたデータに編成するLoD構造を利用して分割を実行する。レベルNでのP/U分解ステップでは、詳細信号D(N-1)および近似信号A(N-1)が得られ、さらにD(N-2)およびA(N-2)に分解される。このステップは、ベースレイヤーの近似信号A(1)が得られるまで繰り返し適用される。
その結果、リフティング方式では、LOD(N)、・・・LOD(1)からなる入力属性信号そのものをコード化するのではなく、D(N-1)、D(N-2)、・・・D(1)、A(1)をコード化することになる。なお、効率的なP/Uステップを適用すると、D(N-1)、・・・、D(1)のサブバンド「係数」が疎になることが多く、それによって、変換コーディングの利得が得られる。
現在、G-PCCのアンカー方法としてのリフティングにおける予測ステップには、予測変換についての上述した距離ベースの加重平均予測が用いられている。
色などの点群属性の場合、チャネル間にかなりの冗長性がある可能性がある。
コーディング効率を向上させるために、色空間変換が前処理/後処理ステップとして行われることが多い。前処理/後処理ステップとしての色空間変換の問題点の1つは、正規直交性を欠いていることが多く、変換された色空間でコーデックの性能を最適化しても、必ずしも元の空間で高品質になるとは限らないことである。また、ロスレス色変換は、特に非整数の色変換を高精度で近似しようとすると、ビット深度が拡張される傾向がある。これは、多くの実用的なシステムにおける実装上の制約に応じて問題となる可能性がある。
実施形態は、圧縮効率のためにチャネル間無相関化を効率的に行うことができる。
本明細書で論じられる実施形態は、別々に使用してもよいし、任意の順序で組み合わせてもよい。さらに、方法(または実施形態)、エンコーダ、およびデコーダのそれぞれは、処理回路(例えば、一つ以上のプロセッサ若しくは一つ以上の集積回路)によって実装されてもよい。一例では、一つ以上のプロセッサは、非一時的なコンピュータ読取可能な媒体に記憶されているプログラムを実行する。
実施形態は、上述した現在のG-PCC予測子設計に直接関係し得る。これらの方法は、点群用に設計された同様のコーデックに適用されることができる。
実施形態では、コーディング効率のための変換ツールとして色空間変換を使用する際の前述の問題を回避するために、2つの方法を使用することができる。
1つは、G-PCCのDPCM(別名:予測変換)における予測残差のロスレスループ内変換としてYCoCg-Rを使用して、ニアロスレスおよびロスレス再構築を維持しながら、チャネル間依存性を無相関化することである。もう一つは、G-PCCのDPCMにおける他のチャネルの残差値を予測するために予測の別のステップを導入することである。
実施形態によるYCoCg変換は、以下に式1および式2として示される。
Figure 0007213368000008
YCoCgから導出されるロスレス変換として、フォワードYCoCg-Rの例は、以下に式3~6として示される。
Co=R-B (式3)
t=B+(Co>>1) (式4)
Cg=G-t (式5)
Y=t+(Cg>>1) (式6)
上記の過程を逆にしたバックワードYCoCg-Rの例は、以下に式7~10として示される。
t=Y-(Cg>>1) (式7)
G=Cg+t; (式8)
B=t-(Co>>1) (式9)
R=B+Co (式10)
さて、実施形態で提案された残差変換として適用される場合、信号R、G、Bは、G-PCCにおけるチャネルごとの予測の結果として得られた各チャネルの予測残差であり得る。
実施形態では、マルチチャネル信号を無相関化する別の方法は、予測子を使用することである。例えば、予測子は、2次残差が元の残差の代わりに量子化されエントロピーコード化されるように、チャネルの残差信号を予測するために使用され得る。
G-PCC予測設計について、実施形態による一例が以下に示され、太字部分は、実施形態による現在のTMC3仕様への変更を示している。この予測の可能な改善のために、任意の一般的な形式の線形または非線形予測関数を導入することができる。
「X」がチャネルX信号を示す以下の例では、「X_pred」は、予測されたチャネルX信号(G-PCCにおける再構築された近傍サンプルから得られる)を示してもよく、「X_delta_index」は、チャネルXの予測残差の量子化インデックスを示してもよく、「X_delta_recon」は、チャネルXの再構築された残差を示してもよく、「X_recon」は、再構築されたチャネルX信号を示してもよく、「X_delta_residual_index」は、残差予測からの残差の量子化インデックスを示してもよい。
チャネル間残差予測を含むエンコードプロセスの一例は、以下のように進行し得る。
Gチャネル

G_delta_index <- Quantize(G- G_pred)

G_delta_recon <- InverseQuantize(G_delta_index)

G_recon <- G_pred + G_delta_recon

EntopyEncode(G_delta_index)


Cチャネル(「C」はRまたはBのいずれかである)

C_delta_index <- Quantize(C- C_pred)

C_delta_recon <- InverseQuantize(C_delta_index)

C_delta_residual_index <- Quantize (C_delta_recon - G_delta_recon)

C_delta_recon <- InverseQuantize(C_delta_residual_index) + G_delta_recon

C_recon <- C_pred + C_delta_recon

EntopyEncode(C_delta_residual_index)
チャネル間残差予測を含むデコードプロセスの一例は、以下のように進行し得る。
Gチャネル

G_delta_index < - EntropyDecode()

G_delta_recon <- InverseQuantize(G_delta_index)

G_recon <- G_pred + G_delta_recon


Cチャネル(「C」はRまたはBのいずれかである)

C_delta_residual_index < - EntropyDecode()

C_delta_recon < - InverseQuantize(C_delta_residual_index) + G_delta_recon

C_recon <- C_pred + C_delta_recon
G-PCCおよび同様の点群コーデックのチャネル間残差予測子と一致する実施形態には、いくつかの利点があり得る。例えば、デコードプロセス中の変更はごくわずかである。そのうえ、精巧なマルチチャネル信号モデルを必要としない。さらに、上述したループ内残差変換を含むチャネル間無相関化のための他のロスレス色変換ベースのアプローチとは異なり、実施形態は、ハウズドルフメトリックに関しては元のドメインにおける信号の忠実度を制御することができる。これは、量子化が元の(RGB色)空間で実行されてもよいためであることがある。
実施形態では、チャネル間残差予測子は、現在のG-PCCワーキングドラフト仕様とともに使用されてもよい。
属性パラメータセット構文では、提案されたチャネル間残差予測子を適応的に有効/無効にするフラグを追加することができる。属性パラメータセット構文の一例を以下の表2および表3に示す。
Figure 0007213368000009
Figure 0007213368000010
実施形態では、属性パラメータセットセマンティクスによれば、1に等しいlifting_residual_prediction_enabled_flagは、属性デコードプロセスが残差予測を実行することを指定することができる。
実施形態による、予測的リフティングデコードプロセスの一例を以下に示す。

Figure 0007213368000011

Figure 0007213368000012
上記の例では、j==0はGチャネルに対応する可能性がある。
以下の実施形態は、G-PCCにおいて、予測変換とも呼ばれ得るDPCM予測の文脈でのループ内色残差変換と色残差予測の両方に等しく適用され得る。実施形態では、これらの2つの技術は、チャネル間ツールと呼ばれ得る。
実施形態では、チャネル間ツールを現在点に適用するか否かを決定するために、条件付き検査のいくつかの方法が使用されてもよい。
実施形態では、3つのチャネルの再構築された残差値の最大差は、最近傍のそれぞれについて計算されてもよい。より具体的には、デコーダは、設定された閾値によって、チャネル間ツールを適用した後に残差振幅/分散の減少を経験した近傍の数を追跡することができる。特に、再構築された3つの残差値が比較的均一である場合、無相関化が成功しなかった可能性がある。このようなテストの結果をデコード時に各点ごとに示すために、1つのフラグのブックキーピングを使用することができる。また、決定を下す際に多数決を行うこともできる。
実施形態では、近傍点からの3つのチャネルの最大絶対差値を比較してもよい。色チャネル間で値の変動に大きな差がある場合、1つのチャネルを別のチャネルから予測することは困難である可能性がある。
近傍サンプルからチャネル間相関を識別できる任意の尺度を、チャネル間ツールの使用を決定するために組み込むことができる。
実施形態では、タイル/スライスレベル(例えば、タイル/スライスヘッダ内)またはビデオ/ピクチャレベル(例えば、SPS/PPS内)のフラグをシグナリングして、提案された残差変換または予測を有効/無効にすることができる。シグナリングは、コーディングユニットを構成する点群画素の任意のグループ分けに適用されることができる。
上述した実施形態は、G-PCCにおけるリフティングスキームにも適用できる。詳細サブバンド係数はリフティングの予測ステップからの出力である可能性があるため、これらは予測残差信号である可能性があり、同一の予測戦略を与えられた異なる色チャネル間で類似している可能性がある。
G-PCCリフティング設計について、実施形態による一例が以下に示され、太字部分は、実施形態による現在のTMC3仕様への変更を示している。この予測の可能な改善のために、任意の一般的な形式の線形または非線形予測関数を導入することができる。
「X」がチャネルX信号を示す以下の例では、「X_coeff_index」は、チャネルXのリフティング係数の量子化インデックスを示してもよく、「X_coeff_recon」は、チャネルXの再構築されたリフティング係数を示してもよく、「X_recon」は、再構築されたチャネルX信号を示してもよく、「X_coeff_residual_index」は、残差予測からの残差の量子化インデックスを示してもよく、「quantWeight」は、エンコーダでの量子化前およびデコーダでの非量子化後のリフティング係数に適用される、G-PCCで使用される重み付け係数を示してもよい。
リフティングスキームへのこのような拡張を含むエンコードプロセスの一例は、以下のように進行し得る。
Gチャネル

G_coeff_index <- Quantize(G)

G_coeff_recon <- InverseQuantize(G_coeff_index)

G_recon <- G_coeff_recon/quantWeight

EntopyEncode(G_coeff_index)


Cチャネル(「C」はRまたはBのいずれかである)

C_coeff_index <- Quantize(C)

C_coeff_recon <- InverseQuantize(C_coeff_index)

C_coeff_residual_index <- Quantize (C_coeff_recon - G_coeff_recon)

C_ceoff_recon <- InverseQuantize(C_coeff_residual_index) + G_coeff_recon

C_recon <- C_coeff_recon/quantWeight

EntopyEncode(C_coeff_residual_index)
リフティングスキームへのこのような拡張を含むデコードプロセスの一例は、以下のように進行し得る。
Gチャネル

G_coeff_index < - EntropyDecode()

G_coeff_recon <- InverseQuantize(G_coeff_index)

G_recon <- G_coeff_recon/quantWeight


Cチャネル(「C」はRまたはBのいずれかである)

C_coeff_residual_index < - EntropyDecode()

C_coeff_recon < - InverseQuantize(C_coeff_residual_index) + G_coeff_recon

C_recon <- C_coeff_recon/quantWeight
本明細書で論じられる実施形態は、点群圧縮/解凍に適応したビデオエンコーダまたはデコーダに実装されることができる。実施形態では、エンコーダ/デコーダは、ハードウェア、ソフトウェア、またはそれらの任意の組み合わせで実装されることができ、ソフトウェアは、もしあれば、1つまたは複数の非一時的なコンピュータ読取可能な媒体に記憶されることができる。例えば、方法(または実施形態)、エンコーダ、およびデコーダのそれぞれは、処理回路(例えば、一つ以上のプロセッサ若しくは一つ以上の集積回路)によって実装されてもよい。一例では、一つ以上のプロセッサは、非一時的なコンピュータ読取可能な媒体に記憶されているプログラムを実行する。
図7は、実施形態による、点群属性コーディングの方法700を示すフローチャートである。いくつかの実施では、図7の一つ以上の処理ブロックは、G-PCC解凍器210によって実行されてもよい。いくつかの実施では、図7の一つ以上の処理ブロックは、G-PCC圧縮器203など、G-PCC解凍器210とは別の、またはG-PCC解凍器210を含む他のデバイスまたはデバイス群によって実行されてもよい。
図7を参照すると、第1のブロック710において、方法700は、点群に対応するエンコードされたビットストリームを取得するステップを含む。
第2のブロック720において、方法700は、エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定するステップを含む。
エンコードされたビットストリームがチャネル間ツールを使用してエンコードされたと判定されたことに基づき(ブロック720でYES)、方法700は第3のブロック730に続く。第3のブロック730において、方法700は、点群に対応する属性信号を再構築するために、エンコードされたビットストリームをチャネル間ツールを使用してデコードするステップを含み、その後、ブロック750に進む。
エンコードされたビットストリームがチャネル間ツールを使用してエンコードされなかったと判定されたことに基づき(ブロック720でNO)、方法700は、第4のブロック740に続く。第4のブロック740において、方法700は、点群に対応する属性信号を再構築するために、エンコードされたビットストリームをチャネル間ツールを使用せずにデコードするステップを含み、その後、ブロック750に進む。
第5のブロック750において、方法700は、再構築された属性信号を使用して点群を再構築するステップを含む。
実施形態では、チャネル間ツールは、ループ内色残差変換を含んでもよい。
実施形態では、ループ内色残差変換は、YCoCg-R変換を含んでもよい。
実施形態では、チャネル間ツールは、チャネル間色残差予測子を含んでもよい。
実施形態では、エンコードされたビットストリームをチャネル間ツールを使用してデコードするステップは、第1の色チャネルについての再構築された残差を取得するステップと、第1の色チャネルについての再構築された残差に基づいて、第2の色チャネルについての再構築された残差を取得するステップと、を含んでもよい。
実施形態では、エンコードされたビットストリームは、エンコードされたビットストリームにおいてシグナリングされたフラグに基づいて、チャネル間ツールを使用してエンコードされるべきと判定されてもよい。
実施形態では、フラグは、近傍点の色チャネルの値の間の差、または近傍点の色チャネルの再構築された残差値の間の差のうちの少なくとも1つに基づいて、エンコードされたビットストリームに設定されてもよい。
実施形態では、方法700は、第1の色チャネルについての再構築されたリフティング係数を取得するステップと、第1の色チャネルについての再構築されたリフティング係数に基づいて、第2の色チャネルについての再構築されたリフティング係数を取得するステップとをさらに含んでもよい。
図7は、方法700の例示的なブロックを示しているが、いくつかの実装では、方法700は、図7に描かれているものよりも追加のブロック、少ないブロック、異なるブロック、または異なる配置のブロックを含んでもよい。さらに、または代わりに、方法700のブロックのうちの2つまたはそれより多くのブロックを並行して実行してもよい。
さらに、提案された方法は、処理回路(例えば、一つ以上のプロセッサ若しくは一つ以上の集積回路)によって実装されてもよい。一例では、一つ以上のプロセッサは、非一時的なコンピュータ読取可能な媒体に記憶されているプログラムを実行して、提案された方法のうちの一つ以上を実行する。
図8は、実施形態による、点群属性コーディングのための装置800のブロック図である。
図8を参照すると、装置800は、第1の取得コード810と、判定コード820と、デコーディングコード830と、再構築コード840と、を含む。
第1の取得コード810は、少なくとも1つのプロセッサに、点群に対応するエンコードされたビットストリームを取得させるように構成される。
判定コード820は、少なくとも1つのプロセッサに、エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定させるように構成される。
デコーディングコード830は、少なくとも1つのプロセッサに、エンコードされたビットストリームがチャネル間ツールを使用してエンコードされたと判定されたことに基づき、点群に対応する属性信号を再構築するために、エンコードされたビットストリームをチャネル間ツールを使用してデコードさせるように構成される。
再構築コード840は、少なくとも1つのプロセッサに、再構築された属性信号を使用して点群を再構築させるように構成される。
実施形態では、チャネル間ツールは、ループ内色残差変換を含んでもよい。
実施形態では、ループ内色残差変換は、YCoCg-R変換を含んでもよい。
実施形態では、チャネル間ツールは、チャネル間色残差予測子を含んでもよい。
実施形態では、デコーディングコードは、少なくとも1つのプロセッサに、第1の色チャネルについての再構築された残差を取得させるように構成される第2の取得コードと、少なくとも1つのプロセッサに、第1の色チャネルについての再構築された残差に基づいて、第2の色チャネルについての再構築された残差を取得させるように構成される第3の取得コードとを含んでもよい。
実施形態では、エンコードされたビットストリームは、エンコードされたビットストリームにおいてシグナリングされたフラグに基づいて、チャネル間ツールを使用してエンコードされるべきと判定されてもよい。
実施形態では、フラグは、近傍点の色チャネルの値の間の差、または近傍点の色チャネルの再構築された残差値の間の差のうちの少なくとも1つに基づいて、エンコードされたビットストリームに設定されてもよい。
実施形態では、装置800は、少なくとも1つのプロセッサに、第1の色チャネルについての再構築されたリフティング係数を取得させるように構成される第4の取得コードと、少なくとも1つのプロセッサに、第1の色チャネルについての再構築されたリフティング係数に基づいて、第2の色チャネルについての再構築されたリフティング係数を取得させるように構成される第5の取得コードと、をさらに含んでもよい。
図9は、実施形態の実装に適したコンピュータシステム900の図である。
コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、コンピュータ中央処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いてコード化されることができる。
命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。
コンピュータシステム900について、図9に示されるコンポーネントは、本質的に例示的なものであり、実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム900の実施形態で示されるコンポーネントのうちのいずれか1つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。
コンピュータシステム900は、いくつかのヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、オーディオ入力(音声、拍手など)、視覚入力(ジェスチャーなど)、嗅覚入力(示されていない)によって、1人または複数のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ(音声、音楽、環境音など)、画像(走査画像、静止画像カメラから取得される写真画像など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)など、人間による意識的な入力に必ずしも直接関係しない特定のメディアをキャプチャすることにも使用できる。
入力ヒューマンインターフェースデバイスは、キーボード901、マウス902、トラックパッド903、タッチスクリーン910、ジョイスティック905、マイクフォン906、スキャナ907、カメラ908(それぞれ1つのみ示されている)のうちの一つ以上を含み得る。
コンピュータシステム900は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚/味覚を介して1人または複数のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン910またはジョイスティック905による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい)、オーディオ出力デバイス(スピーカ909、ヘッドホン(示されていない)など)、視覚出力デバイス(陰極線管(CRT)スクリーン、液晶ディスプレイ(LCD)スクリーン、プラズマスクリーン、有機発光ダイオード(OLED)スクリーンを含むスクリーン910(それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、2次元の視覚出力または3次元以上の出力を出力することができる)、仮想現実眼鏡(示されていない)、ホログラフィックディスプレおよびスモークタンク(示されていない)など)、およびプリンタ(示されていない)を含み得る。グラフィックアダプタ950は、画像を生成してタッチスクリーン910に出力する。
コンピュータシステム900は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、CD/DVDなどの媒体921付きのCD/DVD ROM/RWドライブ920を含む光学媒体、サムドライブ922、リムーバブルハードドライブまたはソリッドステートドライブ923、テープやフロッピーディスクなどの従来の磁気媒体(示されていない)、セキュリティドングルなどの専用のROM/ASIC/PLDベースのデバイス(示されていない)などをも含むことができる。
ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するであろう。
コンピュータシステム900は、一つ以上の通信ネットワーク955へのインターフェースをさらに含むことができる。通信ネットワーク955は、例えば、無線、有線、光学的であり得る。ネットワーク955は、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワーク955の例は、イーサネット、無線LANなどのローカルエリアネットワーク、グローバル・システム・フォー・モバイル・コミュニケーションズ(GSM)、第3世代(3G)、第4世代(4G)、第5世代(5G)、長期進化(LTE)などを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上放送TVを含むTV有線または無線広域デジタルネットワーク、CANBusを含む車両用や産業用などを含む。ネットワーク955は、一般に、特定の汎用データポートまたは周辺バス949(例えば、コンピュータシステム900のユニバーサル・シリアル・バス(USB)ポートなど)に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは、一般に、以下で説明するようにシステムバスに接続することにより、コンピュータシステム900のコアに統合される。例えば、PCコンピュータシステムへのイーサネットインターフェースおよび/またはスマートフォンコンピュータシステムへのセルラーネットワークインターフェースを含むネットワークインターフェース954が挙げられる。これらのネットワーク955のいずれかを用いて、コンピュータシステム900は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ(例えば、放送TV)、単方向の送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワーク955およびネットワークインターフェース954のそれぞれで使用することができる。
前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェース954は、コンピュータシステム900のコア940に接続されることができる。
コア940は、一つ以上の中央処理装置(CPU)941、グラフィックスプロセッシングユニット(GPU)942、フィールドプログラマブルゲートエリア(FPGA)943の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ944などを含むことができる。これらのデバイスは、リードオンリーメモリ(ROM)945、ランダムアクセスメモリ(RAM)946、非ユーザアクセス可能な内部ハードドライブ、ソリッドステートドライブ(SSD)などの内部大容量記憶装置947とともに、システムバス948を介して接続されてもよい。一部のコンピュータシステムでは、システムバス948は、一つ以上の物理プラグの形態でアクセスでき、追加のCPU、GPUなどによる拡張を可能にする。周辺機器は、コアのシステムバス948に直接、または周辺バス949を介して接続されることができる。周辺バスのアーキテクチャは、ペリフェラルコンポーネントインターコネクト(PCI)、USBなどを含む。
CPU941、GPU942、FPGA943、およびハードウェアアクセラレータ944は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ROM945またはRAM946に記憶されることができる。推移データはRAM946にも記憶できるが、永続データは、例えば、内部大容量ストレージ947に記憶されることができる。CPU941、GPU942、大容量ストレージ947、ROM945、RAM946などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。
コンピュータ読取可能な媒体は、様々なコンピュータ実装された動作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、実施形態の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。
限定ではなく、一例として、アーキテクチャを有するコンピュータシステム900、特にコア940は、一つ以上の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ947またはROM945などの非一時的な性質を持つコア940の特定のストレージに関連付けられた媒体であり得る。様々な実施形態を実施するソフトウェアは、このようなデバイスに記憶され、コア940によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、一つ以上のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア940、具体的にはその中のプロセッサ(CPU、GPU、FPGAなどを含む)に、RAM946に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更することを含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路(例えば、ハードウェアアクセラレータ944)に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路(集積回路(IC)など)、実行のためのロジックを具現化する回路、またはその両方を含むことができる。実施形態は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。
本開示は一部の実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されよう。

Claims (20)

  1. 少なくとも1つのプロセッサによって実行される点群属性コーディングの方法であって、
    点群に対応するエンコードされたビットストリームを取得するステップと、
    前記エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定するステップと、
    前記エンコードされたビットストリームが前記チャネル間ツールを使用してエンコードされたと判定されたことに基づき、前記点群に対応する属性信号を再構築するために、前記チャネル間ツールを使用して前記エンコードされたビットストリームをデコードするステップと、
    再構築された属性信号を使用して前記点群を再構築するステップと、を含む、
    方法。
  2. 前記チャネル間ツールは、ループ内色残差変換を含む、請求項1に記載の方法。
  3. 前記ループ内色残差変換は、YCoCg-R変換を含む、請求項2に記載の方法。
  4. 前記チャネル間ツールは、チャネル間色残差予測子を含む、請求項1に記載の方法。
  5. 前記チャネル間ツールを使用して前記エンコードされたビットストリームをデコードするステップは、
    第1の色チャネルについての再構築された残差を取得するステップと、
    前記第1の色チャネルについての前記再構築された残差に基づいて、第2の色チャネルについての再構築された残差を取得するステップと、を含む、
    請求項4に記載の方法。
  6. 前記エンコードされたビットストリームは、前記エンコードされたビットストリームにおいてシグナリングされたフラグに基づいて、前記チャネル間ツールを使用してエンコードされると判定される、請求項1~5のうちのいずれか1項に記載の方法。
  7. 前記フラグは、近傍点の色チャネルの値の間の差、または前記近傍点の前記色チャネルの再構築された残差値の間の差のうちの少なくとも1つに基づいて、前記エンコードされたビットストリームに設定される、請求項6に記載の方法。
  8. 第1の色チャネルについての再構築されたリフティング係数を取得するステップと、
    前記第1の色チャネルについての前記再構築されたリフティング係数に基づいて、第2の色チャネルについての再構築されたリフティング係数を取得するステップと、
    をさらに含む、
    請求項1~7のうちのいずれか1項に記載の方法。
  9. コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、
    前記少なくとも1つのメモリにアクセスし、前記コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサであって、前記コンピュータプログラムコードは、
    前記少なくとも1つのプロセッサに、点群に対応するエンコードされたビットストリームを取得させるように構成される第1の取得コードと、
    前記少なくとも1つのプロセッサに、前記エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定させるように構成される判定コードと、
    前記少なくとも1つのプロセッサに、前記エンコードされたビットストリームが前記チャネル間ツールを使用してエンコードされたと判定されたことに基づき、前記点群に対応する属性信号を再構築するために、前記チャネル間ツールを使用して前記エンコードされたビットストリームをデコードさせるように構成されるデコーディングコードと、
    前記少なくとも1つのプロセッサに、再構築された属性信号を使用して前記点群を再構築させるように構成される再構築コードと、
    を含む、
    少なくとも1つのプロセッサと、を備える
    点群属性コーディングのための装置。
  10. 前記チャネル間ツールは、ループ内色残差変換を含む、請求項9に記載の装置。
  11. 前記ループ内色残差変換は、YCoCg-R変換を含む、請求項10に記載の装置。
  12. 前記チャネル間ツールは、チャネル間色残差予測子を含む、請求項9に記載の装置。
  13. 前記デコーディングコードは、
    前記少なくとも1つのプロセッサに、第1の色チャネルについての再構築された残差を取得させるように構成される、第2の取得コードと、
    前記少なくとも1つのプロセッサに、前記第1の色チャネルについての前記再構築された残差に基づいて、第2の色チャネルについての再構築された残差を取得させるように構成される、第3の取得コードと、を含む、
    請求項12に記載の装置。
  14. 前記エンコードされたビットストリームは、前記エンコードされたビットストリームにおいてシグナリングされたフラグに基づいて、前記チャネル間ツールを使用してエンコードされると判定される、請求項9~13のうちのいずれか1項に記載の装置。
  15. 前記フラグは、近傍点の色チャネルの値の間の差、または前記近傍点の前記色チャネルの再構築された残差値の間の差のうちの少なくとも1つに基づいて、前記エンコードされたビットストリームに設定される、請求項14に記載の装置。
  16. 前記コンピュータプログラムコードは、
    前記少なくとも1つのプロセッサに、第1の色チャネルの再構築されたリフティング係数を取得させるように構成される、第4の取得コードと、
    前記少なくとも1つのプロセッサに、前記第1の色チャネルについての前記再構築されたリフティング係数に基づいて、第2の色チャネルについての再構築されたリフティング係数を取得させるように構成される、第5の取得コードと、をさらに含む、
    請求項9~15のうちのいずれか1項に記載の装置。
  17. 点群属性コーディングのための装置の一つ以上のプロセッサによって実行される場合、前記一つ以上のプロセッサに、
    点群に対応するエンコードされたビットストリームを取得するステップと、
    前記エンコードされたビットストリームがチャネル間無相関化のためのチャネル間ツールを使用してエンコードされたか否かを判定するステップと、
    前記エンコードされたビットストリームが前記チャネル間ツールを使用してエンコードされたと判定されたことに基づき、前記点群に対応する属性信号を再構築するために、前記チャネル間ツールを使用して前記エンコードされたビットストリームをデコードするステップと、
    再構築された属性信号を使用して前記点群を再構築するステップと、
    を実行させるように構成される一つ以上の命令を含む、
    プログラム。
  18. 前記チャネル間ツールは、ループ内色残差変換を含む、請求項17に記載のプログラム。
  19. 前記チャネル間ツールは、チャネル間色残差予測子を含む、請求項17に記載のプログラム。
  20. 前記一つ以上の命令は、さらに、前記一つ以上のプロセッサに、
    第1の色チャネルについての再構築された残差を取得するステップと、
    前記第1の色チャネルについての前記再構築された残差に基づいて、第2の色チャネルについての再構築された残差を取得するステップと、を実行させるように構成される、
    請求項17~19のうちのいずれか1項に記載のプログラム。
JP2021556274A 2019-10-10 2020-10-02 点群属性コーディングのためのチャネル間予測および変換の技術並びに装置 Active JP7213368B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962913495P 2019-10-10 2019-10-10
US62/913,495 2019-10-10
US17/034,896 2020-09-28
US17/034,896 US11284111B2 (en) 2019-10-10 2020-09-28 Techniques and apparatus for inter-channel prediction and transform for point-cloud attribute coding
PCT/US2020/053979 WO2021071753A1 (en) 2019-10-10 2020-10-02 Techniques and apparatus for inter-channel prediction and transform for point-cloud attribute coding

Publications (2)

Publication Number Publication Date
JP2022535484A JP2022535484A (ja) 2022-08-09
JP7213368B2 true JP7213368B2 (ja) 2023-01-26

Family

ID=75382298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021556274A Active JP7213368B2 (ja) 2019-10-10 2020-10-02 点群属性コーディングのためのチャネル間予測および変換の技術並びに装置

Country Status (6)

Country Link
US (1) US11284111B2 (ja)
EP (1) EP4042376A4 (ja)
JP (1) JP7213368B2 (ja)
KR (1) KR20210136082A (ja)
CN (1) CN113795870B (ja)
WO (1) WO2021071753A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11551334B2 (en) * 2020-01-09 2023-01-10 Tencent America LLC Techniques and apparatus for coarse granularity scalable lifting for point-cloud attribute coding
CN118435598A (zh) * 2021-12-30 2024-08-02 Oppo广东移动通信有限公司 一种解码方法、编码方法、解码器、编码器及存储介质
WO2023131132A1 (en) * 2022-01-04 2023-07-13 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for point cloud coding
WO2024014205A1 (ja) * 2022-07-13 2024-01-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 復号方法、符号化方法、復号装置及び符号化装置
WO2024043659A1 (ko) * 2022-08-22 2024-02-29 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018534881A (ja) 2016-01-22 2018-11-22 三菱電機株式会社 点群を圧縮する方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050259730A1 (en) * 2004-05-18 2005-11-24 Sharp Laboratories Of America, Inc. Video coding with residual color conversion using reversible YCoCg
CN113259683B (zh) * 2013-04-08 2024-08-23 Ge视频压缩有限责任公司 分量间预测
US20150373327A1 (en) 2014-06-20 2015-12-24 Qualcomm Incorporated Block adaptive color-space conversion coding
US9734595B2 (en) 2014-09-24 2017-08-15 University of Maribor Method and apparatus for near-lossless compression and decompression of 3D meshes and point clouds
WO2016119746A1 (zh) * 2015-01-29 2016-08-04 同济大学 图像编码方法及装置、图像解码方法及装置
WO2018070914A1 (en) * 2016-10-12 2018-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Residual refinement of color components
US11514613B2 (en) 2017-03-16 2022-11-29 Samsung Electronics Co., Ltd. Point cloud and mesh compression using image/video codecs
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
CN109788290A (zh) * 2017-11-13 2019-05-21 慧荣科技股份有限公司 影像处理装置及利用帧内预测的无损影像压缩方法
WO2019098758A1 (ko) * 2017-11-16 2019-05-23 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2019143602A1 (en) * 2018-01-16 2019-07-25 Vid Scale, Inc. Motion compensated bi-prediction based on local illumination compensation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018534881A (ja) 2016-01-22 2018-11-22 三菱電機株式会社 点群を圧縮する方法

Also Published As

Publication number Publication date
US11284111B2 (en) 2022-03-22
WO2021071753A1 (en) 2021-04-15
CN113795870B (zh) 2023-12-22
KR20210136082A (ko) 2021-11-16
EP4042376A4 (en) 2024-04-03
JP2022535484A (ja) 2022-08-09
US20210112276A1 (en) 2021-04-15
EP4042376A1 (en) 2022-08-17
CN113795870A (zh) 2021-12-14

Similar Documents

Publication Publication Date Title
JP7263521B2 (ja) インターフレーム点群属性符号化のための方法並びにその、装置およびコンピュータプログラム
JP7384520B2 (ja) フレーム間点群属性コーディングのための方法、装置及びコンピュータ・プログラム
JP7234375B2 (ja) 点群属性コーディングの加重中央値を予測するための手法及びデバイス並びにコンピュータプログラム
CN112771583B (zh) 处理点云数据的方法、装置和存储介质
JP7261300B2 (ja) 適応ポイントクラウド属性コーディングのための方法、装置、及びコンピュータプログラム
JP7213368B2 (ja) 点群属性コーディングのためのチャネル間予測および変換の技術並びに装置
CN112188197B (zh) 通道间点云属性解码方法、装置以及可读存储介质
RU2769460C1 (ru) Способ и устройство для кодирования коэффициентов трансформации с алфавитным разделением для сжатия облака точек
CN112218077B (zh) 通道间点云属性编码方法、装置以及可读存储介质
US11551334B2 (en) Techniques and apparatus for coarse granularity scalable lifting for point-cloud attribute coding
CN113115019B (zh) 视频编解码方法、装置、计算机设备及存储介质
CN112616058B (zh) 视频编码或解码方法、装置、计算机设备和存储介质
CN112188216B (zh) 视频数据的编码方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230116

R150 Certificate of patent or registration of utility model

Ref document number: 7213368

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150