JP7466849B2 - スライス毎のtrisoupノードサイズ - Google Patents

スライス毎のtrisoupノードサイズ Download PDF

Info

Publication number
JP7466849B2
JP7466849B2 JP2022563466A JP2022563466A JP7466849B2 JP 7466849 B2 JP7466849 B2 JP 7466849B2 JP 2022563466 A JP2022563466 A JP 2022563466A JP 2022563466 A JP2022563466 A JP 2022563466A JP 7466849 B2 JP7466849 B2 JP 7466849B2
Authority
JP
Japan
Prior art keywords
node
sizes
slices
size
slice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022563466A
Other languages
English (en)
Other versions
JP2023522702A (ja
Inventor
アレクサンドレ ザゲットー
ダニーロ グラジオッシ
アリ タバタバイ
央二 中神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JP2023522702A publication Critical patent/JP2023522702A/ja
Application granted granted Critical
Publication of JP7466849B2 publication Critical patent/JP7466849B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Medicines Containing Plant Substances (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Description

〔関連出願との相互参照〕
本出願は、2020年6月23日に出願された「スライス毎のTRISOUPノードサイズ(TRISOUP NODE SIZE PER SLICE)」という名称の米国仮特許出願シリアル番号第63/043,116号の米国特許法第119条に基づく優先権を主張するものであり、この文献は全体が全ての目的で引用により本明細書に組み入れられる。
本発明は、3次元グラフィックスに関する。具体的には、本発明は3次元グラフィックスの符号化に関する。
点群は、3D空間内の一群の点で構成され、各点は、(x,y,z)幾何学的位置及び属性情報(色及び反射率など)に関連する。点群は、仮想/拡張現実、没入型テレプレゼンス、自律運転、文化遺産記録、3D自由視点、地理情報システムなどの複数の用途で利用することができる。点群は、数千個~数十億個の点で構成することができる。これらを実行可能にするには圧縮が必要である。
MPEGは、2017年に公募要領(Call for Proposal:CfP)で点群圧縮(PCC)標準化を開始した。静的点群のためのカテゴリー1、動的点群のためのカテゴリー2、及びLiDARシーケンス(動的に取得された点群)のためのカテゴリー3という3つの点群カテゴリーが認定された。最終的に、カテゴリー1及びカテゴリー3のためのG-PCC(ジオメトリベースのPCC)、並びにカテゴリー2のためのV-PCC(ビデオベースのPCC)という2つの技術が定義された。最初のテストモデルは2017年10月に開発され、1つはG-PCC用(TMC13)であり、もう1つはV-PCC用(TMC2)であった。それ以後、2つのテストモデルは技術貢献及び技術協力を通じて進化し、PCC標準仕様の初版は2020年に出来上がる見込みである。
V-PCCは、最初に点群を3Dパッチと呼ばれる3D接続領域に分割する。次に、各3Dパッチを2Dパッチ上に投影する。この投影は、仮想正投影カメラ(virtual orthographic camera)のように機能して、点群の特定の部分を取り込むことができる。これらのカメラ画像を組み合わせることで、一群の投影された2Dパッチを含むモザイクが生成される。このプロセスの結果、一群のメタデータ情報と、(1)占有マップ(occupancy map)、(2)ジオメトリ画像、及び(3)複数の属性画像という最大3つの関連画像とが得られる。その後、2Dビデオコーダを使用して、結果として得られた点群の2D表現を符号化する。
G-PCCでは、ジオメトリ及び属性が別々に符号化される。通常、圧縮されたジオメトリは、ルートから個々のボクセルのリーフレベルまでの八分木として表される。或いは、表現をボクセルよりも大きなブロックのレベルに留め、三角形スープ(triangle soup)を使用して各リーフ内の表面を近似することもできる。予測的ジオメトリコーディング(predictive geometry coding)スキームも利用可能である。属性コーディングについては、G-PCCでは、領域適応階層変換(Region Adaptive Hierarchical Transform:RAHT)、予測変換(Predicting Transform)、リフティング変換(Lifting Transform)という3つの方法が存在する。
点群を符号化する際に、スライス毎のTrisoupノードサイズが柔軟性を可能にする。各ブロック/ノードが同じサイズである代わりに、ユーザ又は機械が点群スライス毎のブロック/ノードサイズを示すことができる。この特徴は、例えば小さなノードサイズの方が領域内の特異性(specificity)を高める関心領域コーディングを可能にする。
1つの態様では、装置の非一時的メモリにプログラムされた方法が、点群情報を受け取るステップと、点群情報を複数のスライスにセグメント化するステップと、複数のノードサイズを決定するステップと、複数のスライスの各々について複数のノードサイズのうちの1つのノードサイズを使用して点群を符号化するステップとを含む。ノードサイズは、関心領域基準に従って決定することができる。ノードサイズは、関心領域では縮小される。複数のノードサイズは、関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む。複数のスライスの量は、複数のノードサイズの量に等しい必要はない。複数のノードサイズは、ユーザが構成ファイル内でノードサイズを指定することによってプログラムされる。複数のノードサイズは機械学習を使用して決定される。複数のノードサイズは、関心領域以外の任意の基準に従って決定される。
別の態様では、装置が、点群情報を受け取り、点群情報を複数のスライスにセグメント化し、複数のノードサイズを決定し、複数のスライスの各々について複数のノードサイズのうちの1つのノードサイズを使用して点群を符号化するためのアプリケーションを記憶する非一時的メモリと、メモリに結合されて、アプリケーションを処理するように構成されたプロセッサとを含む。ノードサイズは、関心領域基準に従って決定することができる。ノードサイズは、関心領域では縮小される。複数のノードサイズは、関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む。複数のスライスの量は、複数のノードサイズの量に等しい必要はない。複数のノードサイズは、ユーザが構成ファイル内でノードサイズを指定することによってプログラムされる。複数のノードサイズは機械学習を使用して決定される。複数のノードサイズは、関心領域以外の任意の基準に従って決定される。
別の態様では、システムが、点群情報を受け取り、点群情報を複数のスライスにセグメント化し、複数のノードサイズを決定し、複数のスライスの各々について複数のノードサイズのうちの1つのノードサイズを使用して点群を符号化するように構成されたエンコーダと、符号化された点群情報を復号するように構成されたデコーダとを含む。ノードサイズは、関心領域基準に従って決定することができる。ノードサイズは、関心領域では縮小される。複数のノードサイズは、関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む。複数のスライスの量は、複数のノードサイズの量に等しい必要はない。複数のノードサイズは、ユーザが構成ファイル内でノードサイズを指定することによってプログラムされる。複数のノードサイズは機械学習を使用して決定される。複数のノードサイズは、関心領域以外の任意の基準に従って決定される。
いくつかの実施形態による、TMC13としても知られているG-PCC基準エンコーダを示すブロック図である。 いくつかの実施形態による、D/2×D/2×D/2の寸法のボクセルを有する8つのサブキューブに体積が縦方向及び横方向にセグメント化される様子を示す図である。 いくつかの実施形態による、制御できるボクセルグリッド距離dによって決定されるデコーダ内の導出点の数を示す図である。 いくつかの実施形態による、各ノードに適用されてx、y及びz方向にそれぞれ1回ずつの3ステップで実行される領域適応階層変換(RAHT)を示す図である。 いくつかの実施形態によるRAHT変換領域予測を示す図である。 いくつかの実施形態による、元々の順序で編成されたサンプル点群、並びに3つの精緻化度(refinement levels)及び対応する詳細度(Levels of Details)(LoD0、LoD1及びLoD2)に再編成されたサンプル点群の例を示す図である。 いくつかの実施形態による、フラグを1に設定することによって同じ精緻化度内の予測を実行できることを示す図である。 いくつかの実施形態による予測変換を示す図である。 いくつかの実施形態による、予測変換の上に成り立つリフティング変換を示す図である。 いくつかの実施形態による、スライス毎のtrisoupノードサイズを利用して点群を符号化する方法のフローチャートを示す図である。 いくつかの実施形態による、スライス毎のtrisoupノードサイズ法の図である。 いくつかの実施形態による、スライス毎のtrisoupノードサイズ法を実装するように構成された例示的なコンピュータ装置のブロック図である。 ノードサイズが一定である実験結果を示す図である。 いくつかの実施形態による、異なるノードサイズでの実験結果を示す図である。 いくつかの実施形態による、一定のノードサイズ及び異なるノードサイズでの実験結果の比較を示す図である。 いくつかの実施形態によるPSNRプロットを示す図である。
ジオメトリベースの点群圧縮(G-PCC)は、他の手法を上回る圧縮能力を有する点群符号化技術のための標準である。G-PCCは、八分木スキーム、trisoupスキーム又は予測的ジオメトリスキームを使用してジオメトリコーディングを実行する。trisoupでは、ルートから任意のレベルまで構築された刈り込み八分木(pruned octree)によってジオメトリが表され、リーフはボクセルよりも大きな占有ノード(occupied nodes)を表す。オブジェクト表面は一連の三角形で近似され、複数の三角形を関連付ける接続情報が存在しないため、この方法は「三角形スープ」又は(trisoup)と呼ばれる。
G-PCCは、3D空間内で直接コンテンツを符号化する。これを達成するために、G-PCCは、3D空間内の点位置を記述する八分木などのデータ構造を利用する。さらに、G-PCCは、入力点群座標表現に関する仮定を行わない。点群は、浮動小数点値表現から変換された内部整数ベースの値(internal integer-based value)を有する。この変換は、概念的には入力点群のボクセル化と同様であり、スケーリング、変換(translation)及び端数処理(rounding)によって達成することができる。
G-PCCの別の重要な概念は、並列コーディング機能(parallel coding functionality)を可能にするタイル及びスライスの定義である。G-PCCでは、スライスが、単独で符号化及び復号できる点(形状及び属性)集合として定義される。タイルは、境界ボックス情報を有する一群のスライスである。タイルは別のタイルと重なり合うことができ、デコーダは、特定のスライスにアクセスすることによって点群の部分領域を復号することができる。
現在のG-PCC標準の1つの限界は、イントラ予測のみについて定められる点、すなわち現在のところ時間予測ツールを使用していない点である。しかしながら、次期標準では、点群動き推定及び相互予測に基づく技術が検討されている。
図1は、いくつかの実施形態による、TMC13としても知られているG-PCC基準エンコーダを示すブロック図である。この図は、TMC13の機能一式を表すものではなく、そのコアモジュールの一部のみを表すものである。最初に、ジオメトリ及び属性が別々に符号化されることが分かる。しかしながら、属性コーディングは、復号されたジオメトリに依存する。結果として、点群位置が最初に符号化される。
ソースジオメトリの点は、ワールド座標系内で浮動小数点数によって表すことができる。従って、ジオメトリコーディングの第一段階は、座標変換の後にボクセル化を実行することである。第2段階は、八分木スキーム、trisoupスキーム又は予測的ジオメトリスキームを使用したジオメトリ分析を含む。最後に、結果として得られた構造を算術的に符号化する。TMC13は、属性コーディングに関して任意のRGBからYCbCrへの変換をサポートしている。その後に、3つの利用可能な変換ツール、すなわち領域適応階層変換(RAHT)、予測変換及びリフティング変換のうちの1つを使用する。変換後には、係数が量子化されて算術的に符号化される。
八分木コーディング
ボクセル化された点群は、八分木構造を使用して可逆的に表される。量子化されたD×D×Dの体積のボクセルに点群が含まれると仮定する。最初に、図2に例示するように、D/2×D/2×D/2の寸法のボクセルを含む8つのサブキューブに体積を縦方向及び横方向にセグメント化する。このプロセスは、Dが1に等しくなるまで各サブキューブについて再帰的に繰り返される。一般に、ボクセル位置は1つしか占有されず、このため八分木は点群のジオメトリを表すのに非常に便利なものになっている。各分解ステップでは、どのブロックが占有されていてどのブロックが占有されていないかが検証される。占有されたブロックは1としてマークされ、占有されていないブロックは0としてマークされる。このプロセス中に生成されたオクテットは、八分木ノード占有状態を1バイトワードで表し、隣接するオクテットとの相関関係を考慮するエントロピーコーダによって圧縮される。孤立点の符号化については、体積内に他の相関する点が存在しないため、オクテットをエントロピー符号化する別の方法、すなわち直接符号化モード(Direct Coding Mode:DCM)が利用される。DCMでは、圧縮を実行することなく点の座標が直接符号化される。DCMモードは、ツリーの全てのノードについてDCMの使用をシグナリングするのを避けるために、隣接ノードから推測される。
trisoupを介した表面近似
或いは、ジオメトリは、ボクセルよりも大きな占有サブブロックがリーフによって表される、ルートから任意のレベルまで構築された刈り込み八分木によって表すこともできる。オブジェクト表面は一連の三角形で近似され、複数の三角形を関連付ける接続情報が存在しないため、この方法は「三角形スープ」(又はtrisoup)と呼ばれる。この方法は、量子化が大まかなレート適応をもたらすという理由で、低ビットレートでの主観的品質を高める任意の符号化ツールである。trisoupが有効である場合、ジオメトリビットストリームは、八分木、セグメントインジケータ及び頂点位置情報の組み合わせになる。復号プロセスでは、デコーダがtrisoupメッシュ平面とボクセル化グリッドとの間の交点を計算する。デコーダにおける導出点の数は、図3に示すように制御できるボクセルグリッド距離dによって決定される。
属性符号化
G-PCCでは、RAHT、予測変換及びリフティング変換という3つの属性符号化法が存在する。RAHTの裏の本旨は、下位八分木レベルの属性値を使用して次のレベルの属性値を予測することである。予測変換は、補間ベースの階層的最近傍予測スキーム(interpolation-based hierarchical nearest-neighbor prediction scheme)を実装する。リフティング変換は予測変換の上に成り立つが、追加の更新/リフティングステップを有する。従って、これ以降は、これらを合わせて予測/リフティング変換と呼ぶ。ユーザは、上述した変換のどちらかを自由に選択することができる。しかしながら、特定の状況を考慮すると、一方の方法の方が他方より適切な場合もある。どちらの方法を使用すべきであるかを決定する共通基準は、レート-歪み性能と計算的複雑性との組み合わせである。
RAHT変換
RAHTは、点群の八分木表現を考慮することによって実行される。RAHTは、その正準定式化では、八分木のリーフ(最高レベル)から開始してそのルート(最低レベル)に到達するまで逆向きに進む。図4に示すように、この変換は各ノードに適用され、x、y及びz方向にそれぞれ1回ずつの3ステップで実行される。各ステップでは、ローパスgn係数及びハイパスhn係数が生成される。RAHTは、Haarに影響を受けた階層変換である。従って、RAHTは、1D Haar変換を最初の例とした場合により良く理解することができる。N個の要素を有する信号vについて考察する。vをHaar分解すると、元々の信号のローパス成分及びハイパス成分であるg及びhが生成され、これらはそれぞれN/2個の要素を有する。g及びhのn番目の係数は以下の方程式を使用して計算される。
Figure 0007466849000001
(1)
この変換は、現在のgを新たな入力信号vとして採用して再帰的に実行することができ、再帰毎にローパス係数の数は1/2になる。g成分は、等しい重みの連続するvのペアのスケーリング和(scaled sum)として解釈することができ、h成分は、これらのスケーリング差(scaled difference)として解釈することができる。しかしながら、Haar変換を使用して点群を符号化することを選択した場合には、入力点群のスパース性(sparsity)を考慮するように変換が修正される。この修正は、点の分布に従う重みの適合を可能にすることによって達成することができる。従って、RAHTの再帰的実行は以下のように定義することができ、
Figure 0007466849000002
(2)
Figure 0007466849000003
(3)
Figure 0007466849000004
(4)
ここで、lは分解レベルであり、w1及びw2は、レベルl+1のローパス係数
Figure 0007466849000005
及び
Figure 0007466849000006
に関連する重みであり、
Figure 0007466849000007
はレベルlのローパス係数
Figure 0007466849000008
の重みである。この結果、高密度領域点に高い重みが適用されるようになり、従ってRAHTは、変換領域において非適応変換よりも信号のバランスをとることができる。
RAHTの固定小数点定式化が開発された。この定式化は、行列分解及び量子化ステップのスケーリングに基づく。シミュレーションでは、固定小数点の実装を浮動小数点の実装と同等とみなせることが示された。
ごく直近では、RAHTにおける変換領域予測が開発されており、現在のテストモデルTMC13において利用可能である。その本旨は、各ブロックについて、d-1における復号された属性の和から計算されたレベルdにおける変換されアップコンバートされた属性の和をレベルdにおける変換された属性の和の予測として使用し、さらに量子化してエントロピー的に符号化できる高パス残差(high-pass residuals)を生成することである。このアップコンバートプロセスは、隣接ノードの加重平均を使用して行われる。図5は、RAHT変換領域予測の簡略図である。予測を使用しないRAHT定式化に対する報告された利得は、レート歪みの意味において著しい改善(色について最大約30%の、反射率について16%の全体的平均利得)を示す。
予測/リフティング変換
予測変換は、属性コーディングのための距離ベースの予測スキームである。予測変換は、決定論的ユークリッド距離基準(deterministic Euclidean distance criterion)を使用して入力点を精緻化度(R)の組に分配する詳細度(LoD)表現を使用する。図6に、元々の順序で編成されたサンプル点群、並びに3つの精緻化度及び対応する詳細度(LoD0、LoD1及びLoD2)に再編成されたサンプル点群の例を示す。詳細度lは、0~lの精緻化度の和集合をとることによって取得されることが分かる。
各点の属性は、LoD順によって決定される予測を使用して符号化される。図6を実例として使用してLoD0のみについて考察する。この具体例では、P2の属性を、その最近傍P4、P5又はP0の再構築版、或いはこれらの点の距離ベースの加重平均によって予測することができる。予測候補の最大数は指定することができ、最近傍の数は点毎にエンコーダによって決定される。また、近傍変動解析(neighborhood variability analysis)も実行される。所与の点Pの近傍のいずれか2つの属性間の最大差が閾値よりも大きい場合には、レート歪み最適化手順を使用して最良の予測子を制御する。デフォルトでは、以前のLoD、すなわちLoD(j-1)におけるk近傍の属性値を使用して精緻化度R(j)の属性値が予測される。しかしながら、図7に示すようにフラグを1に設定することによって同じ精緻化度内の予測を実行することもできる。
予測変換は、LoD構造に基づいて、分割(split)演算子及びマージ(merge)演算子という2つの演算子を使用して実行される。LoD(j)及びR(j)に関連する属性の集合をそれぞれL(j)及びH(j)とする。分割演算子は、L(j+1)を入力として取り、低解像度サンプルL(j)及び高解像度サンプルH(j)を戻す。マージ演算子は、L(j)及びH(j)を入力として取り、L(j+1)を戻す。図8に予測変換を示す。最初に、点群全体を表す属性信号L(N+1)をH(N)及びL(N)に分割する。次に、L(N)を使用してH(N)を予測して残差D(N)を計算する。その後、プロセスは再帰的に継続する。再構築された属性は、マージ演算の連鎖を通じて取得される。
図9の図に示すリフティング変換は予測変換の上に成り立つ。リフティング変換では、更新(update)演算子及び適応的量子化戦略が導入される。LoD予測スキームでは、各点に影響値が関連付けられる。低LoD内の点はより頻繁に利用され、従って符号化プロセスに与える影響が大きい。更新演算子は、図9に示すように、残差D(j)に基づいてU(j)を決定した後にU(j)を使用してL(j)の値を更新する。更新信号U(j)は、残差D(j)、予測点とその近傍との間の距離、及びこれらに対応する重みの関数である。最後に、量子化プロセスを導くために、各点に関連する変換された係数にそれぞれの重みの平方根を乗じる。
八分木では、点群が位置する点群の体積を決定し、立方体境界ボックス/ブロックを取得し、ブロックをサブブロックに分割し、反復毎にサブブロックがボクセルを含むかどうかを判定し、サブブロックが複数のボクセルを含む場合にはサブブロックが単一のボクセルで構成されるまでサブブロックをさらに分割(例えば、分解)する。
以前のG-PCCの実装では、全てのスライスにわたって単一のtrisoupノードサイズが利用される。従って、スライス0のノードサイズはスライス1のノードサイズと同じになり、スライス1のノードサイズはスライスN-1と同じノードサイズになる。
しかしながら、本明細書で説明したように、スライス毎のtrisoupノードサイズの実装では、1又は2以上のスライスのノードサイズが異なることができる。例えば、スライス番号が増加又は減少するにつれてノードサイズも増加又は減少することができる。さらに、スライス0のノードサイズを非常に小さくし、スライス1のノードサイズをわずかに大きくし、スライスN-1のノードサイズが最大になるまでこれを繰り返すことができる。別の例では、スライス0のノードサイズが第1のサイズであり、他のスライスのノードサイズが第2のサイズである。ノードサイズは、毎回(スライス毎に)2倍、2乗、又はその他のサイズに変更することができる。例えば、ユーザが各スライスのノードサイズを指定することができる。
ブロック/ノードサイズは、スライスの概念と共にスライス毎に使用される。スライスは、そのスライスに入る点の数を決定する。点群は、同じ大きさのブロック又は関心領域など、望む通りにスライスに分割することができる。例えば、ユーザ/装置が特定の関心領域を指定することができる。さらに、機械学習を利用して、顔検出又は他のいずれかの形状/物体を検出してグループ/スライスとして分離することができる。この結果、エンコーダがスライス毎に特定のブロック/ノードサイズを有することができるようになる。異なるノードサイズを有することにより、表面を近似する三角形の量が多い重要な領域と、三角形が少ないそれほど重要でない領域という異なる領域を有することができる。このため、エンコーダ/デコーダがより柔軟かつ効率的になることができる。
いくつかの実施形態では、セグメント化及びノードサイズ決定が人間によって(例えば、構成ファイル内で)実行され、いくつかの実施形態では、これらのステップが人間の介入を伴わずに機械学習を使用して実行される。例えば、ユーザが構成ファイル内で10個のスライス及び10個又はそれ未満のノードサイズを定義した後に、エンコーダが最初のスライスに最初のノードサイズを使用することができ、以下同様である。別の例では、ユーザが定義したノードサイズがスライスよりも少ない場合、最後のノードサイズが残りのスライスに適用される(例えば、5つのスライスが存在して2つのノードサイズが定義された場合には、第1のスライスに第1のノードサイズが使用され、第2~第5のスライスに第2のノードサイズが使用される)。機械学習では、装置/システムを、関心領域を決定するように訓練(例えば、顔、人間、特定の物体(例えば、車両)、動物及び/又はいずれかの指定された物体を検出するテンプレートマッチング又は他のいずれかの画像処理)することができる。装置/システムは、各スライスにどのようなノードサイズを使用するかを決定するように訓練することもできる。例えば、スライスが関心領域を含む場合、装置/システムは、スライスが関心領域を含まない場合よりも小さなノードサイズをスライスが使用すべきであると学習する。さらに、異なるレベルの関心領域を開発/学習することもできる。例えば、顔を最高レベルの関心領域として指定し、他の身体部分を2番目に高いレベルの関心領域として指定し、背景情報などの最低レベルの関心領域まで以下同様に指定することができる。
G-PCCでは、trisoupノードサイズがジオメトリパラメータセット(Geometry Parameter Set:GPS)内に示される。また、ジオメトリヘッダ(Geometry Header)では、GPS内に定められたtrisoupノードサイズパラメータを使用して、サンプリング値及び一意的セグメント数(number of unique segments)などの、trisoupコーディングの残りのパラメータを示すこともできる。trisoupノードサイズパラメータが0とは異なる値を有する場合には、GPSに定められたツリーレベルと共にtrisoupが使用されることを示す。スライスをtrisoupと共に使用したいと望む場合、現在の表記法ではスライス毎にノードサイズを変更することができない。本明細書では、trisoupコーディング内のノードサイズのスライス単位での制御を可能にする大まかな構文修正について説明する。イネーブルフラグGPS(enable flag GPS)を送信し、GDUヘッダ内でノードサイズ値を送信することができる。以下、大まかな構文修正を示す。
以下は、本明細書で説明するtrisoupのシグナリングのための例示的なコードである。
Figure 0007466849000009

Figure 0007466849000010

Figure 0007466849000011
この解決策では、1に等しいtrisoup_enabled_flagは、ジオメトリデータユニットヘッダがlog2_trisoup_node_sizeを含むtrisoup符号化構文を含むことができることを指定し、0に等しいtrisoup_enabled_flagは、ジオメトリデータユニットヘッダが八分木符号化構文のみを含むことを指定する。trisoup_enabled_flagが1である場合には、ビットストリーム適合要件(requirement of bitstream conformance)として、a)inferred_direct_coding_mode_enabled_flagが0に等しくなければならず、b)unique_geometry_points_flagが1に等しくなければならない。log2_trisoup_node_size要素は、三角形ノードのサイズとしての変数であるTrisoupNodeSizeを、TrisoupNodeSize=(1<<log2_trisoup_node_size-1)のように指定する。
別の可能性は、デルタオフセットを有効にするフラグであるベースノードサイズをGPSにおいて送信した後に、GDUヘッダにおいてデルタを送信することである。
ジオメトリパラメータセット構文
Figure 0007466849000012

Figure 0007466849000013

Figure 0007466849000014
この解決策では、1に等しいlog2_trisoup_node_size_offset_present_flagは、log2_trisoup_node_size_offsetによって示されるtrisoupノードサイズオフセットがジオメトリデータユニットヘッダ内に存在することを指定し、0に等しいlog2_trisoup_node_size_offset_present_flagは、このようなオフセットが存在しないことを指定する。log2_trisoup_node_size_offset要素は、trisoup符号化構文において使用されるlog2_trisoup_node_sizeに対するオフセットを指定する。
図10に、いくつかの実施形態による、スライス毎のtrisoupノードサイズを利用して点群を符号化する方法のフローチャートを示す。ステップ1000において、装置が点群情報を受け取る。例えば、点群情報は、カメラ装置から直接受け取られ、及び/又はダウンロードされる。
ステップ1002において、点群情報をスライスにセグメント化/分割する。セグメント化は、人間によって又は機械学習を介して実行することができる。例えば、ユーザがスライスを指示/選択する。別の例では、装置/システムが機械学習を利用して、関心領域を決定してこれらの領域を特定のスライスとして選択することなどによってスライスを指示/選択する。関心領域は、機械が顔認識、身体認識及び/又はその他の物体検出/認識などのいずれかの画像処理技術を使用することによって決定することができる。
ステップ1004において、スライスのノード/ブロックサイズを決定する。ノードサイズは、人間によって又は機械学習を介して決定することができる。例えば、ユーザが構成ファイルを編集して、スライスに基づいて各ノードのサイズを示すことができる。この情報は、スライス0が第1の指定ノードサイズであり、スライス1が第2の指定ノードサイズであることなどの詳細、或いはスライス番号が増えるにつれてノードサイズが増加又は減少することなどのさらに一般的な情報を含むことができる。別の例では、(例えば、決定された領域に基づく)特定のスライスのノードサイズが関心領域を含まないスライスと比べて小さいことを装置/システムが学習するような機械学習によってノードサイズが決定される。例えば、装置/システムは、分類を使用して、顔を含むスライスに最小ノードサイズを利用し、(顔ではない)身体を含むスライスに2番目に小さなノードサイズを利用し、その他のスライスに最大ノードサイズを利用する。ノードサイズは、ボクセル又は他のいずれかの単位(例えば、最小ノードサイズは1ボクセル、2番目に小さなノードサイズは2ボクセル、最大ノードサイズは4ボクセル)に基づくことができる。
ステップ1006において、エンコーダがスライス及びノードサイズに基づいて点群情報を符号化する。この符号化についてはG-PCC標準に記載されており、本明細書で説明したようにスライス及びノードサイズ情報に基づいて修正される。
いくつかの実施形態では、これよりも少ない又はさらなるステップを実装することができる。例えば、デコーダは、様々なノードサイズ及びスライスに基づいて点群情報を復号する。いくつかの実施形態では、ステップの順序が変更される。例えば、スライスを選択するステップとノードサイズを決定するステップの順序を入れ替えることができる。
図11に、いくつかの実施形態によるスライス毎のtrisoupノードサイズの図を示す。図示のように、G-PCCは、スライス毎に異なるtrisoupノードサイズで動作できることによって、そのジオメトリコーディングの柔軟性を高めることができる。従来のG-PCC実装1110は、全てのスライスにわたって単一のtrisoupノードサイズを使用する。スライス毎のtrisoupノードサイズ法では、スライス0のノードサイズ1100の方がスライス1のノードサイズ1102よりも小さく、以下スライスN-1の最大ノードサイズ1104まで同様である。
図12は、いくつかの実施形態による、スライス毎のtrisoupノードサイズ法を実装するように構成された例示的なコンピュータ装置のブロック図である。コンピュータ装置1200は、3Dコンテンツを含む画像及びビデオなどの情報の取得、記憶、計算、処理、通信及び/又は表示のために使用することができる。コンピュータ装置1200は、G-PCC、点群コーディング、及び/又はスライス毎のtrisoupノードサイズ法の態様のいずれかを実装することができる。一般に、コンピュータ装置1200を実装するのに適したハードウェア構造は、ネットワークインターフェイス1202、メモリ1204、プロセッサ1206、I/O装置1208、バス1210及び記憶装置1212を含む。プロセッサの選択は、十分な速度の好適なプロセッサが選択される限り重要ではない。メモリ1204は、当業で周知のいずれかの従来のコンピュータメモリとすることができる。記憶装置1212は、ハードドライブ、CDROM、CDRW、DVD、DVDRW、高精細ディスク/ドライブ、ウルトラHDドライブ、フラッシュメモリカード、又はその他のいずれかの記憶装置を含むことができる。コンピュータ装置1200は、1又は2以上のネットワークインターフェイス1202を含むことができる。ネットワークインターフェイスの例としては、イーサネット又は他のタイプのLANに接続されたネットワークカードが挙げられる。(単複の)I/O装置1208は、キーボード、マウス、モニタ、画面、プリンタ、モデム、タッチ画面、ボタンインターフェイス及びその他の装置のうちの1つ又は2つ以上を含むことができる。記憶装置1212及びメモリ1204には、スライス毎のtrisoupノードサイズ法を実行するために使用される(単複の)スライス毎のtrisoupノードサイズアプリケーション1230が記憶されて、アプリケーションが通常処理されるように処理される可能性が高い。コンピュータ装置1200には、図12に示すものよりも多くの又は少ないコンポーネントを含めることもできる。いくつかの実施形態では、スライス毎のtrisoupノードサイズハードウェア1220が含まれる。図12のコンピュータ装置1200は、スライス毎のtrisoupノードサイズ法のためのアプリケーション1230及びハードウェア1220を含むが、スライス毎のtrisoupノードサイズ法は、ハードウェア、ファームウェア、ソフトウェア、又はこれらのいずれかの組み合わせでコンピュータ装置上に実装することもできる。例えば、いくつかの実施形態では、スライス毎のtrisoupノードサイズアプリケーション1230がメモリにプログラムされ、プロセッサを使用して実行される。別の例として、いくつかの実施形態では、スライス毎のtrisoupノードサイズハードウェア1220が、スライス毎のtrisoupノードサイズ法を実装するように特別に設計されたゲートを含むプログラムされたハードウェアロジックである。
いくつかの実施形態では、(単複の)スライス毎のtrisoupノードサイズアプリケーション1230が、複数のアプリケーション及び/又はモジュールを含む。いくつかの実施形態では、モジュールが1又は2以上のサブモジュールも含む。いくつかの実施形態では、これよりも少ない又はさらなるモジュールを含めることもできる。
いくつかの実施形態では、スライス毎のtrisoupノードサイズハードウェア1220が、レンズ、イメージセンサ及び/又は他のいずれかのカメラコンポーネントなどのカメラコンポーネントを含む。
好適なコンピュータ装置の例としては、パーソナルコンピュータ、ラップトップコンピュータ、コンピュータワークステーション、サーバ、メインフレームコンピュータ、ハンドヘルドコンピュータ、携帯情報端末、セルラ/携帯電話機、スマート家電、ゲーム機、デジタルカメラ、デジタルカムコーダ、カメラ付き電話機、スマートホン、ポータブル音楽プレーヤ、タブレットコンピュータ、モバイル装置、ビデオプレーヤ、ビデオディスクライタ/プレーヤ(DVDライタ/プレーヤ、高精細ディスクライタ/プレーヤ、超高精細ディスクライタ/プレーヤなど)、テレビ、家庭用エンターテイメントシステム、拡張現実装置、仮想現実装置、スマートジュエリ(例えば、スマートウォッチ)、車両(例えば、自動走行車両)、又はその他のいずれかの好適なコンピュータ装置が挙げられる。
図13に、ノードサイズが一定である場合の実験結果を示す。具体的には、この実験では全てのノードについてtrisoup_node_size_log2が4に等しい。
図14に、いくつかの実施形態による、異なるノードサイズでの実験結果を示す。具体的には、この実験では、パーティション(例えば、スライス)1、2及び3についてはtrisoup_node_size_log2が4に等しく、パーティション0についてはtrisoup_node_size_log2が1に等しい。この結果では、ノードサイズが小さいほど髪(パーティション0)の品質が向上する。
図15に、いくつかの実施形態による、一定のノードサイズ及び異なるノードサイズでの実験結果の比較を示す。具体的には、左の画像ではtrisoup_node_size_log2が3に等しく、全てのパーティションで一定である。右の画像では、パーティション1、2、3についてはtrisoup_node_size_log2が3に等しく、パーティション0についてはtrisoup_node_size_log2が1に等しい。この結果では、右画像のパーティション0(分割線の上方)の画質が、左画像のパーティション0及び両画像の他のパーティションと比べてノードサイズが小さいほど向上していることが分かる。
図16に、いくつかの実施形態によるPSNRプロットを示す。ノードサイズが一定である場合と異なるノードサイズを利用した場合とのピーク信号対雑音比(PSNR)の比較を示す。
本明細書で説明したスライス毎のtrisoupノードサイズ法を利用するために、装置は、3Dコンテンツを取得又は受信して、3Dコンテンツの正しい効率的な表示を可能にするように最適化された形でコンテンツを処理及び/又は送信する。スライス毎のtrisoupノードサイズ法は、ユーザ支援を伴って、又はユーザ関与を伴わずに自動的に実装することができる。
動作中、スライス毎のtrisoupノードサイズ法は、3Dコンテンツをより効率的に符号化することができる。スライス毎のtrisoupノードサイズ法は、点群を符号化する際の柔軟性を可能にすることができる。各ブロック/ノードが同じサイズである代わりに、ユーザ又は機械は、関心領域がその領域内の特異性を高める小さなノードサイズを有することができるようにブロック/ノードサイズを示すことができる。
スライス毎のtrisoupノードサイズのいくつかの実施形態
1.装置の非一時的メモリにプログラムされた方法であって、
点群情報を受け取るステップと、
点群情報を複数のスライスにセグメント化するステップと、
複数のノードサイズを決定するステップと、
複数のスライスの各々について複数のノードサイズのうちの1つのノードサイズを使用して点群を符号化するステップと、を含む方法。
2.ノードサイズは、関心領域基準に従って決定される、条項1に記載の方法。
3.ノードサイズは、関心領域では縮小される、条項2に記載の方法。
4.複数のノードサイズは、関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む、条項3に記載の方法。
5.複数のスライスの量は、複数のノードサイズの量に等しい必要はない、条項1に記載の方法。
6.複数のノードサイズは、ユーザが構成ファイル内でノードサイズを指定することによってプログラムされる、条項1に記載の方法。
7.複数のノードサイズは、機械学習を使用して決定される、条項1に記載の方法。
8.複数のノードサイズは、関心領域以外の任意の基準に従って決定される、条項1に記載の方法。
9.
点群情報を受け取り、
点群情報を複数のスライスにセグメント化し、
複数のノードサイズを決定し、
複数のスライスの各々について複数のノードサイズのうちの1つのノードサイズを使用して点群を符号化する、
ためのアプリケーションを記憶する非一時的メモリと、
メモリに結合されて、アプリケーションを処理するように構成されたプロセッサと、を含む装置。
10.ノードサイズは、関心領域基準に従って決定される、条項9に記載の装置。
11.ノードサイズは、関心領域では縮小される、条項10に記載の装置。
12.複数のノードサイズは、関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む、条項11に記載の装置。
13.複数のスライスの量は、複数のノードサイズの量に等しい必要はない、条項9に記載の装置。
14.複数のノードサイズは、ユーザが構成ファイル内でノードサイズを指定することによってプログラムされる、条項9に記載の装置。
15.複数のノードサイズは、機械学習を使用して決定される、条項9に記載の装置。
16.複数のノードサイズは、関心領域以外の任意の基準に従って決定される、条項9に記載の装置。
17.
点群情報を受け取り、
点群情報を複数のスライスにセグメント化し、
複数のノードサイズを決定し、
複数のスライスの各々について複数のノードサイズのうちの1つのノードサイズを使用して点群を符号化する、
ように構成されたエンコーダと、
符号化された点群情報を復号するように構成されたデコーダと、を含むシステム。
18.ノードサイズは、関心領域基準に従って決定される、条項17に記載のシステム。
19.ノードサイズは、関心領域では縮小される、条項18に記載のシステム。
20.複数のノードサイズは、関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む、条項19に記載のシステム。
21.複数のスライスの量は、複数のノードサイズの量に等しい必要はない、条項17に記載のシステム。
22.複数のノードサイズは、ユーザが構成ファイル内でノードサイズを指定することによってプログラムされる、条項17に記載のシステム。
23.複数のノードサイズは、機械学習を使用して決定される、条項17に記載のシステム。
24.複数のノードサイズは、関心領域以外の任意の基準に従って決定される、条項17に記載のシステム。
本発明の構成及び動作の原理を容易に理解できるように、詳細を含む特定の実施形態に関して本発明を説明した。本明細書におけるこのような特定の実施形態及びこれらの実施形態の詳細についての言及は、本明細書に添付する特許請求の範囲を限定することを意図したものではない。当業者には、特許請求の範囲によって定められる本発明の趣旨及び範囲から逸脱することなく、例示のために選択した実施形態において他の様々な修正を行えることが容易に明らかになるであろう。

Claims (24)

  1. 装置の非一時的メモリにプログラムされた方法であって、
    点群情報を受け取るステップと、
    前記点群情報を複数のスライスにセグメント化するステップと、
    複数のノードサイズを決定するステップと、
    前記複数のスライスの各々について前記複数のノードサイズのうちの1つのノードサイズを使用して前記点群情報を符号化するステップと、
    を含み、前記複数のスライスのスライス番号が増加するにすれてノードサイズが2倍になり、スライスの数より少ないノードサイズが定義されたときに、定義されたノードサイズの数よりも大きい残りのスライスに最後のノードサイズが適用されることを特徴とする方法。
  2. 前記ノードサイズは、関心領域基準に従って決定される、
    請求項1に記載の方法。
  3. 前記ノードサイズは、関心領域では縮小される、
    請求項2に記載の方法。
  4. 前記複数のノードサイズは、前記関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む、
    請求項3に記載の方法。
  5. 前記複数のスライスの量は、前記複数のノードサイズの量に等しい必要はない、
    請求項1に記載の方法。
  6. 前記複数のノードサイズは、ユーザが構成ファイル内で前記ノードサイズを指定することによってプログラムされる、
    請求項1に記載の方法。
  7. 前記複数のノードサイズは、機械学習を使用して決定される、
    請求項1に記載の方法。
  8. 前記複数のノードサイズは、関心領域以外の任意の基準に従って決定される、
    請求項1に記載の方法。
  9. 点群情報を受け取ること
    前記点群情報を複数のスライスにセグメント化すること
    複数のノードサイズを決定すること
    前記複数のスライスの各々について前記複数のノードサイズのうちの1つのノードサイズを使用して前記点群情報を符号化することここで前記複数のスライスのスライス番号が増加するにすれてノードサイズが2倍になり、スライスの数より少ないノードサイズが定義されたときに、定義されたノードサイズの数よりも大きい残りのスライスに最後のノードサイズが適用される、
    ためのアプリケーションを記憶する非一時的メモリと、
    前記メモリに結合されて、前記アプリケーションを処理するように構成されたプロセッサと、
    を備えることを特徴とする装置。
  10. 前記ノードサイズは、関心領域基準に従って決定される、
    請求項9に記載の装置。
  11. 前記ノードサイズは、関心領域では縮小される、
    請求項10に記載の装置。
  12. 前記複数のノードサイズは、前記関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む、
    請求項11に記載の装置。
  13. 前記複数のスライスの量は、前記複数のノードサイズの量に等しい必要はない、
    請求項9に記載の装置。
  14. 前記複数のノードサイズは、ユーザが構成ファイル内で前記ノードサイズを指定することによってプログラムされる、
    請求項9に記載の装置。
  15. 前記複数のノードサイズは、機械学習を使用して決定される、
    請求項9に記載の装置。
  16. 前記複数のノードサイズは、関心領域以外の任意の基準に従って決定される、
    請求項9に記載の装置。
  17. 点群情報を受け取り、
    前記点群情報を複数のスライスにセグメント化し、
    複数のノードサイズを決定し、
    前記複数のスライスの各々について前記複数のノードサイズのうちの1つのノードサイズを使用して前記点群情報を符号化する、ここで前記複数のスライスのスライス番号が増加するにすれてノードサイズが2倍になり、スライスの数より少ないノードサイズが定義されたときに、定義されたノードサイズの数よりも大きい残りのスライスに最後のノードサイズが適用される、
    ように構成されたエンコーダと、
    前記符号化された点群情報を復号するように構成されたデコーダと、
    を備えることを特徴とするシステム。
  18. 前記ノードサイズは、関心領域基準に従って決定される、
    請求項17に記載のシステム。
  19. 前記ノードサイズは、関心領域では縮小される、
    請求項18に記載のシステム。
  20. 前記複数のノードサイズは、前記関心領域を表すスライスのための小さなノードサイズと、残りのスライスのための大きなノードサイズとを含む、
    請求項19に記載のシステム。
  21. 前記複数のスライスの量は、前記複数のノードサイズの量に等しい必要はない、
    請求項17に記載のシステム。
  22. 前記複数のノードサイズは、ユーザが構成ファイル内で前記ノードサイズを指定することによってプログラムされる、
    請求項17に記載のシステム。
  23. 前記複数のノードサイズは、機械学習を使用して決定される、
    請求項17に記載のシステム。
  24. 前記複数のノードサイズは、関心領域以外の任意の基準に従って決定される、
    請求項17に記載のシステム。
JP2022563466A 2020-06-23 2021-06-20 スライス毎のtrisoupノードサイズ Active JP7466849B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063043116P 2020-06-23 2020-06-23
US63/043,116 2020-06-23
US17/030,244 2020-09-23
US17/030,244 US11375208B2 (en) 2020-06-23 2020-09-23 Trisoup node size per slice
PCT/US2021/038162 WO2021262559A1 (en) 2020-06-23 2021-06-20 Trisoup node size per slice

Publications (2)

Publication Number Publication Date
JP2023522702A JP2023522702A (ja) 2023-05-31
JP7466849B2 true JP7466849B2 (ja) 2024-04-15

Family

ID=79022191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022563466A Active JP7466849B2 (ja) 2020-06-23 2021-06-20 スライス毎のtrisoupノードサイズ

Country Status (6)

Country Link
US (1) US11375208B2 (ja)
EP (1) EP4136620A4 (ja)
JP (1) JP7466849B2 (ja)
KR (1) KR20220127323A (ja)
CN (1) CN114600163A (ja)
WO (1) WO2021262559A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11818401B2 (en) 2017-09-14 2023-11-14 Apple Inc. Point cloud geometry compression using octrees and binary arithmetic encoding with adaptive look-up tables
US10861196B2 (en) 2017-09-14 2020-12-08 Apple Inc. Point cloud compression
US10897269B2 (en) 2017-09-14 2021-01-19 Apple Inc. Hierarchical point cloud compression
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
US10607373B2 (en) 2017-11-22 2020-03-31 Apple Inc. Point cloud compression with closed-loop color conversion
US10909727B2 (en) 2018-04-10 2021-02-02 Apple Inc. Hierarchical point cloud compression with smoothing
US10867414B2 (en) 2018-04-10 2020-12-15 Apple Inc. Point cloud attribute transfer algorithm
US11010928B2 (en) 2018-04-10 2021-05-18 Apple Inc. Adaptive distance based point cloud compression
US10909726B2 (en) 2018-04-10 2021-02-02 Apple Inc. Point cloud compression
US10939129B2 (en) 2018-04-10 2021-03-02 Apple Inc. Point cloud compression
US11017566B1 (en) 2018-07-02 2021-05-25 Apple Inc. Point cloud compression with adaptive filtering
US11202098B2 (en) 2018-07-05 2021-12-14 Apple Inc. Point cloud compression with multi-resolution video encoding
US11012713B2 (en) 2018-07-12 2021-05-18 Apple Inc. Bit stream structure for compressed point cloud data
US11367224B2 (en) 2018-10-02 2022-06-21 Apple Inc. Occupancy map block-to-patch information compression
US11430155B2 (en) 2018-10-05 2022-08-30 Apple Inc. Quantized depths for projection point cloud compression
US11057564B2 (en) 2019-03-28 2021-07-06 Apple Inc. Multiple layer flexure for supporting a moving image sensor
US11711544B2 (en) 2019-07-02 2023-07-25 Apple Inc. Point cloud compression with supplemental information messages
US11562507B2 (en) 2019-09-27 2023-01-24 Apple Inc. Point cloud compression using video encoding with time consistent patches
US11627314B2 (en) 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11538196B2 (en) * 2019-10-02 2022-12-27 Apple Inc. Predictive coding for point cloud compression
US11895307B2 (en) 2019-10-04 2024-02-06 Apple Inc. Block-based predictive coding for point cloud compression
US11798196B2 (en) 2020-01-08 2023-10-24 Apple Inc. Video-based point cloud compression with predicted patches
US11625866B2 (en) 2020-01-09 2023-04-11 Apple Inc. Geometry encoding using octrees and predictive trees
US11770562B2 (en) * 2020-06-23 2023-09-26 Qualcomm Incorporated High-level syntax for geometry-based point cloud compression
US11615557B2 (en) 2020-06-24 2023-03-28 Apple Inc. Point cloud compression using octrees with slicing
US11620768B2 (en) 2020-06-24 2023-04-04 Apple Inc. Point cloud geometry compression using octrees with multiple scan orders
US11948338B1 (en) 2021-03-29 2024-04-02 Apple Inc. 3D volumetric content encoding using 2D videos and simplified 3D meshes
JP2024008352A (ja) * 2022-07-08 2024-01-19 Kddi株式会社 点群復号装置、点群復号方法及びプログラム
JP2024008355A (ja) * 2022-07-08 2024-01-19 Kddi株式会社 点群復号装置、点群復号方法及びプログラム
WO2024042909A1 (ja) * 2022-08-26 2024-02-29 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 復号方法、符号化方法、復号装置及び符号化装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180189982A1 (en) 2017-01-02 2018-07-05 Canon Kabushiki Kaisha Attribute mapping to encode and decode 3d models
WO2020101021A1 (ja) 2018-11-16 2020-05-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10694210B2 (en) * 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression
EP3429207A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing A method and apparatus for encoding/decoding a colored point cloud representing the geometry and colors of a 3d object
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US10192353B1 (en) 2017-10-10 2019-01-29 8i Limited Multiresolution surface representation and compression
EP3942468A4 (en) * 2019-03-18 2023-01-04 Geomagical Labs, Inc. SYSTEM AND METHOD FOR VIRTUAL MODELING OF INTERIOR SCENES FROM IMAGING
US11122102B2 (en) * 2019-07-03 2021-09-14 Lg Electronics Inc. Point cloud data transmission apparatus, point cloud data transmission method, point cloud data reception apparatus and point cloud data reception method
US11593969B2 (en) * 2019-07-12 2023-02-28 Tencent America LLC Method and apparatus for geometry merge mode for point cloud coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180189982A1 (en) 2017-01-02 2018-07-05 Canon Kabushiki Kaisha Attribute mapping to encode and decode 3d models
WO2020101021A1 (ja) 2018-11-16 2020-05-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Also Published As

Publication number Publication date
US11375208B2 (en) 2022-06-28
US20210400280A1 (en) 2021-12-23
WO2021262559A1 (en) 2021-12-30
CN114600163A (zh) 2022-06-07
EP4136620A4 (en) 2023-09-20
JP2023522702A (ja) 2023-05-31
KR20220127323A (ko) 2022-09-19
EP4136620A1 (en) 2023-02-22

Similar Documents

Publication Publication Date Title
JP7466849B2 (ja) スライス毎のtrisoupノードサイズ
US10904564B2 (en) Method and apparatus for video coding
JP7384520B2 (ja) フレーム間点群属性コーディングのための方法、装置及びコンピュータ・プログラム
US20200105025A1 (en) Method and apparatus for video coding
EP4138393A1 (en) Apparatus for transmitting point cloud data, method for transmitting point cloud data, apparatus for receiving point cloud data, and method for receiving point cloud data
WO2020197966A1 (en) Method and apparatus for interframe point cloud attribute coding
CN114175100A (zh) 用于处理点云数据的方法和装置
KR102300045B1 (ko) 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN115918092A (zh) 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法
EP4325852A1 (en) Point cloud data transmission method, point cloud data transmission device, point cloud data reception method, and point cloud data reception device
EP4325853A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
CN114915795A (zh) 基于二维规则化平面投影的点云编解码方法及装置
US20220392114A1 (en) Method and apparatus for calculating distance based weighted average for point cloud coding
CN114915792B (zh) 基于二维规则化平面投影的点云编解码方法及装置
CN114915793B (zh) 基于二维规则化平面投影的点云编解码方法及装置
US20230316581A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
EP4395320A1 (en) Point cloud data transmission method, point cloud data transmission device, point cloud data reception method, and point cloud data reception device
WO2024012381A1 (en) Method, apparatus, and medium for point cloud coding
WO2023131132A1 (en) Method, apparatus, and medium for point cloud coding
US20240357166A1 (en) Point cloud data transmission method, point cloud data transmission device, point cloud data reception method, and point cloud data reception device
WO2024074122A1 (en) Method, apparatus, and medium for point cloud coding
JP2024508090A (ja) 二次元正則化平面投影に基づく点群符号化および復号方法ならびにデバイス
CN118830249A (zh) 用于点云编解码的方法、装置及介质
KR20240108448A (ko) 메시 정점 변위 코딩

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240317

R150 Certificate of patent or registration of utility model

Ref document number: 7466849

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150