JP7541576B2 - 中間サンプルのパッチを使用する点群の符号化及び復号化 - Google Patents

中間サンプルのパッチを使用する点群の符号化及び復号化 Download PDF

Info

Publication number
JP7541576B2
JP7541576B2 JP2022517977A JP2022517977A JP7541576B2 JP 7541576 B2 JP7541576 B2 JP 7541576B2 JP 2022517977 A JP2022517977 A JP 2022517977A JP 2022517977 A JP2022517977 A JP 2022517977A JP 7541576 B2 JP7541576 B2 JP 7541576B2
Authority
JP
Japan
Prior art keywords
sample
attribute
patch
image
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022517977A
Other languages
English (en)
Other versions
JP2022549246A (ja
Inventor
アンドリヴォン、ピエール
オリヴィエ、ヤニック
シュヴェ、ジャン-クロード
ジャンドロン、デイヴィッド
Original Assignee
インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ filed Critical インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Publication of JP2022549246A publication Critical patent/JP2022549246A/ja
Application granted granted Critical
Publication of JP7541576B2 publication Critical patent/JP7541576B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本実施形態のうちの少なくとも1つは、概して、点群の処理に関する。特に、別個のビデオストリーム内/そこからの3Dサンプルの属性の符号化/復号化が開示される。
本節は、以下に記載及び/又は特許請求される本実施形態のうちの少なくとも1つの様々な態様に関連し得る技術の様々な態様を読者に紹介することが意図されている。本考察は、背景情報を読者に提供して、少なくとも1つの実施形態の様々な態様をより良好に理解することを容易にすることに役立つと考えられる。
点群は、文化遺産/建造物などの様々な目的に使用され得、そこにある彫像又は建物のような対象物を3Dでスキャンして、対象物を送付又は訪問せずに、対象物の空間的な構成を共有する。また、その対象物が破壊され得る場合、例えば、地震により寺院が破壊され得る場合、点群は、その対象物の知識を確実に保全するための方法である。このような点群は、通常、静的であり、色分けされており、かつ膨大である。
別の使用例は、地形学及びマップ作成法におけるものであり、そこでは、3D表現を使用することにより、平面に限定されず、起伏を含み得るマップを可能にする。Google Mapsは、現在、3Dマップの良い例であるが、点群の代わりにメッシュを使用している。それにもかかわらず、点群は、3Dマップのための好適なデータ形式であり得、そのような点群は、通常、静的であり、色分けされており、かつ膨大である。
自動車産業及び自動走行車もまた、点群が使用され得る分野である。自動走行車は、それらの環境を「探査」し、それらの目前の近隣の現実に基づいて、良好な運転判断を行うことができる必要がある。LIDAR(光検出と測距)のような典型的なセンサは、決定エンジンによって使用される動的点群を生成する。これらの点群は、人間が見ることを意図しておらず、それらは、通常、小さく、必ずしも色分けされておらず、かつ高い捕捉頻度で動的である。これらの点群は、この属性が、検知された対象物の材料に関する良好な情報を提供するときに、LIDARによって提供される反射率のような他の属性を有し得、決定を下すことに役立ち得る。
仮想現実及び没入型世界が、最近、話題になっており、2D平面ビデオの未来として多くの人によって予測されている。その基本的な考え方は、視聴者を取り囲む環境内に視聴者を没入させることであり、視聴者がその視聴者の前方にある仮想世界を眺めることしかできない標準TVとは対照的である。環境内の視聴者の自由度に応じて、没入性には、いくつかの段階がある。点群は、仮想現実(Virtual Reality、VR)世界を配信するための良好な形式候補である。
多くの用途において、許容可能な(又は好ましくは非常に良好な)体験の品質を維持しながら、妥当な量のビットレート(又は記憶用途のための記憶空間)のみを消費することによって、動的点群をエンドユーザに配信する(又は動的点群をサーバ内に格納する)ことができることが重要である。これらの動的点群の効率的な圧縮は、多くの没入型世界の配信網を実用化するための重要な点である。
少なくとも1つの実施形態が、上記を念頭に置いて、考案されてきた。
以下は、本開示のいくつかの態様の基本的な理解を提供するために、本実施形態のうちの少なくとも1つの簡略化された概要を提示する。この概要は、実施形態の広範な概要ではない。実施形態の重要な要素又は不可欠な要素を識別することは、意図されていない。以下の概要は、本文書内の他のところに提供される更に詳細な説明の序章として、簡略化された形態で、本実施形態のうちの少なくとも1つのいくつかの態様を提示するにすぎない。
少なくとも1つの実施形態の一般的な態様によれば、直交投影された3Dサンプルの属性を符号化する方法であって、当該直交投影された3Dサンプルの属性が、画像の2Dサンプルの少なくとも1つの第1の属性パッチとして符号化され、同じ投影線に沿った2つの直交投影された3Dサンプルの間に位置する中間3Dサンプルの属性が、画像内の2Dサンプルの少なくとも1つの第2の属性パッチとして符号化される方法が提供され、本方法は、当該2Dサンプルの少なくとも1つの第1の属性パッチ及び当該2Dサンプルの少なくとも1つの第2の属性パッチが、別個の画像に格納されているかどうかを示す情報を符号化することを含む。
実施形態によれば、ビデオストリームは、ピクチャレベル、フレームレベル、及びパッチレベルのグループで階層的に構成されており、当該情報は、ピクチャレベル、フレームレベル、アトラスレベル、又はパッチレベルのグループのいずれかで有効である。
実施形態によれば、その情報は、2Dサンプルの少なくとも1つの第1の属性パッチが、第1の画像に格納されているかどうか、又は当該2Dサンプルの少なくとも1つの第1の属性パッチが、第2の画像内に2Dサンプルの他の属性パッチと共に格納されているかどうかを示す第1のフラグと、2Dサンプルの少なくとも1つの第2の属性パッチが、第3の画像に格納されているかどうか、又は当該2Dサンプルの少なくとも1つの第2の属性パッチが、当該第2の画像内に2Dサンプルの他の属性パッチと共に格納されているかどうかを示す第2のフラグと、である。
実施形態によれば、本方法は、別個の画像がどのように圧縮されるかを示す別の情報を符号化することを更に含む。
少なくとも1つの実施形態の一般的な態様によれば、3Dサンプルの属性を復号化する方法であって、当該3Dサンプルの属性が、画像の2Dサンプルの少なくとも1つの第1の属性パッチから復号化され、同じ投影線に沿った2つの3Dサンプルの間に位置する中間3Dサンプルの属性が、画像内の2Dサンプルの少なくとも1つの第2の属性パッチとして復号化される方法が提供され、本方法は、当該2Dサンプルの少なくとも1つの第1の属性パッチ及び当該2Dサンプルの少なくとも1つの第2の属性パッチが、別個の画像に格納されているかどうかを示す情報を復号化することを含む。
実施形態によれば、ビデオストリームは、ピクチャレベル、フレームレベル、及びパッチレベルのグループで階層的に構成されており、当該情報は、ピクチャレベル、フレームレベル、アトラスレベル、又はパッチレベルのグループのいずれかで有効である。
実施形態によれば、その情報は、2Dサンプルの少なくとも1つの第1の属性パッチが、第1の画像に格納されているかどうか、又は当該2Dサンプルの少なくとも1つの第1の属性パッチが、第2の画像内に2Dサンプルの他の属性パッチと共に格納されているかどうかを示す第1のフラグと、2Dサンプルの少なくとも1つの第2の属性パッチが、第3の画像に格納されているかどうか、又は当該2Dサンプルの少なくとも1つの第2の属性パッチが、当該第2の画像内に2Dサンプルの他の属性パッチと共に格納されているかどうかを示す第2のフラグと、である。
実施形態によれば、本方法は、別個の画像がどのように圧縮されるかを示す別の情報を符号化することを更に含む。
少なくとも1つの実施形態のうちの1つ以上はまた、装置、ビットストリーム、コンピュータプログラム製品、及び非一時的なコンピュータ可読媒体も提供する。
本実施形態のうちの少なくとも1つの特異性、並びに当該本実施形態のうちの少なくとも1つの他の目的、利点、特徴、及び使用は、添付の図面と併せて取られる実施例の以下の説明から明らかになるであろう。
図面において、いくつかの実施形態の例が例示される。図面は、以下を示す。
本実施形態のうちの少なくとも1つによる、2層ベースの点群符号化構造の例の概略ブロック図を例示する。 本実施形態のうちの少なくとも1つによる、2層ベースの点群復号化構造の例の概略ブロック図を例示する。 本実施形態のうちの少なくとも1つによる、画像ベースの点群エンコーダの例の概略ブロック図を例示する。 2つのパッチ及びそれらの2D境界ボックスを含むキャンバスの例を例示する。 投影線に沿った2つの3Dサンプルの間に位置する2つの中間3Dサンプルの例を例示する。 本実施形態のうちの少なくとも1つによる、画像ベースの点群デコーダの例の概略ブロック図を例示する。 本実施形態のうちの少なくとも1つによる、ベース層BLを表すビットストリームのシンタックスの例を概略的に例示する。 様々な態様及び実施形態が実装されるシステムの例の概略ブロック図を例示する。 少なくとも1つの実施形態による、点群フレームの直交3Dサンプルを符号化するための方法のフローチャートの実施例を示す。 少なくとも1つの実施形態による、点群フレームの直交3Dサンプルを符号化するための方法のフローチャートの実施例を示す。 少なくとも1つの実施形態による、情報INFを埋め込むシンタックス要素の例を例示する。
本実施形態のうちの少なくとも1つは、添付の図面を参照して、以下に更に十分に説明され、そこでは、本実施形態のうちの少なくとも1つの例が示される。しかしながら、実施形態は、多くの代替形態で具現化され得、本明細書に記載される例に限定されるものとして解釈されるべきではない。したがって、実施形態を、開示された特定の形態に限定する意図はないことを理解されたい。対照的に、本開示は、本出願の趣旨及び範囲内にある全ての変更物、等価物、及び代替物を網羅することを意図している。
図がフロー図として提示される場合、その図が、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示される場合、その図が、対応する方法/プロセスのフロー図も提供することを理解されたい。
同様又は同一の図の要素は、同一の参照番号を用いて参照される。
いくつかの図は、V-PCCに従うビットストリームの構造を定義するためにV-PCCにおいて広く使用されているシンタックステーブルを表す。それらのシンタックステーブルでは、「...」という用語は、V-PCCにおいて与えられた元の定義に関するシンタックスの変化しない部分、及び読み取りを容易にするために図において除去された部分を示す。図における太字の用語は、この用語の値が、ビットストリームを解析することによって得られることを示す。シンタックステーブルの右列は、シンタックス要素のデータを符号化するためのビット数を示す。例えば、u(4)は、4ビットが、データを符号化するために使用され、u(8)は、8ビットが、データを符号化するために使用されることを示し、ae(v)は、コンテキスト適応算術エントロピーコード化されたシンタックス要素を示す。
以下に記載及び企図される態様は、多くの異なる形態で実施され得る。以下の図1~図8では、いくつかの実施形態を提供するが、他の実施形態が企図されており、図1~図8の考察は、実装形態の幅を限定するものではない。
態様のうちの少なくとも1つは、一般に、点群符号化及び復号化に関し、少なくとも1つの他の態様は、一般に、生成されるか又は符号化されたビットストリームの送信に関する。
より正確には、本明細書に記載される様々な方法及び他の態様は、モジュール、例えば、図1~図8に示されるように、画像ベースのエンコーダ3000及びデコーダ4000を変更するために使用され得る。
更に、本態様は、点群圧縮に関係するMPEG-Iパート5などのMPEG標準規格に限定されず、例えば、既存の又は将来開発されるかにかかわらず、他の標準規格及び勧告、並びにこのような任意の標準規格及び勧告の拡張(MPEG-Iパート5を含む)に適用され得る。別段の指示がない限り、又は技術的に排除されない限り、本出願に記載される態様は、個々に又は組み合わせて使用され得る。
以下では、画像データとは、データ、例えば、特定の画像/ビデオ形式における2Dサンプルの1つ又はいくつかの配列を指す。特定の画像/ビデオ形式は、画像(又はビデオ)の画素値に関連する情報を指定し得る。特定の画像/ビデオ形式はまた、情報を指定し得、その情報は、ディスプレイ及び/又は他の任意の装置によって使用されて、例えば、画像(又はビデオ)を視覚化及び/又は復号化し得る。画像は、典型的には、2Dサンプルの第1の配列の形状で、通常、画像の輝度(又はルーマ)を表す第1の成分を含む。画像はまた、2Dサンプルの他の配列の形状で、通常、画像の色度(又はクロマ)を表す第2の成分及び第3の成分も含み得る。いくつかの実施形態は、従来の3色RGB表現などの、一組の2D色サンプル配列を使用して、同じ情報を表す。
画素値は、C値のベクトルによって1つ以上の実施形態で表され、ここで、Cは、成分の数である。ベクトルの各値は、典型的には、画素値のダイナミックレンジを規定し得るビット数を用いて表される。
画像ブロックとは、画像に属する一組の画素を意味する。画像ブロック(又は画像ブロックデータ)の画素値とは、この画像ブロックに属する画素の値を指す。画像ブロックは、任意の形状を有し得るが、長方形が一般的である。
点群は、3D容積空間内の3Dサンプルのデータセットによって表され得、その3Dサンプルのデータセットは、固有の座標を有し、1つ以上の属性も有し得る。
3Dサンプルは、3D空間内のX、Y、及びZ座標によって表され得る、点群の3D点の幾何学的形状を画定する情報を含み得る。また、3Dサンプルは、例えば、RGB若しくはYUV色空間で表される色、透明度、反射率、2つの成分法線ベクトル、又はこのサンプルの特徴を表す任意の特徴などの1つ以上の関連する属性を定義する情報を含み得る。例えば、3Dサンプルは、6成分(X、Y、Z、R、G、B)、又は言い換えると(X、Y、Z、y、U、V)を定義する情報を含み得、ここで、(X、Y、Z)は、3D空間内の3D点の座標を定義し、(R、G、B)又は(y、U、V)は、この3D点の色を定義する。同じタイプの属性が、複数回存在し得る。例えば、複数の色属性は、異なる視点から色情報を提供し得る。
2Dサンプルは、3つの座標(u、v、Z)によって表され得る、直交投影された3Dサンプルの幾何学的形状を定義する情報を含み得、ここで、(u、v)は、直交投影された3Dの2D空間内の座標であり、Zは、3Dサンプルと、当該3Dサンプルが直交投影された投影面との間のユークリッド距離である。Zは、通常、深度値で表される。また、3Dサンプルは、例えば、RGB若しくはYUV色空間で表される色、透明度、反射率、2つの成分法線ベクトル、又はこの直交投影された3Dサンプルの特徴を表す任意の特徴などの1つ以上の関連する属性を定義する情報を含み得る。
したがって、2Dサンプルは、直交投影された3Dサンプルの幾何学的形状及び属性を(u、v、Z、R、G、B)又は言い換えると(u、v、Z、y、U、V)によって定義する情報を含み得る。
点群は、群が時間に対して変化するかどうかに応じて、静的又は動的であり得る。静的点群又は動的点群の事例は、通常、点群フレームとして示される。動的点群の場合、点の数は、一般に一定ではないが、それとは対照的に、一般に時間と共に変化することに留意されたい。より一般的には、点群は、例えば、点の数、1つ以上の点の位置、又は任意の点の任意の属性など、何かが時間と共に変化する場合、動的なものと見なされ得る。
図1は、本実施形態のうちの少なくとも1つによる、2層ベースの点群符号化構造1000の例の概略ブロック図を例示する。
2層ベースの点群符号化構造1000は、入力点群フレームIPCFを表すビットストリームBを提供し得る。場合によっては、当該入力点群フレームIPCFは、動的点群のフレームを表す。次いで、当該動的点群のフレームは、2層ベースの点群符号化構造1000によって符号化され得る。
次いで、当該動的点群の各フレームを表すビットストリームを完全に組み合わせることによって、動的点群を表すためのビデオストリームが得られ得る。
基本的に、2層ベースの点群コード構造1000は、ベース層BL及びエンハンスメント層ELとしてビットストリームBを構造化する能力を提供し得る。ベース層BLは、入力点群フレームIPCFの不可逆表現を提供し得、エンハンスメント層ELは、ベース層BLによって表されない孤立点を符号化することによって、より高品質な(場合により可逆的)表現を提供し得る。
ベース層BLは、図3に例示されるように、画像ベースのエンコーダ3000によって提供され得る。当該画像ベースのエンコーダ3000は、入力点群フレームIPCFの3Dサンプルの幾何学的形状/属性を表す幾何学的形状/属性画像を提供し得る。それは、孤立した3Dサンプルを廃棄するのを可能にし得る。ベース層BLは、図4に例示されるように、画像ベースのデコーダ4000によって復号化され得、その画像ベースのデコーダは、中間の再構築された点群フレームIRPCFを提供し得る。
次いで、図1の2層ベースの点群符号化1000に戻ると、コンパレータCOMPが、見逃した/孤立した3Dサンプルを検出/位置特定するために、入力点群フレームIPCFの3Dサンプルを中間の再構築された点群フレームIRPCFの3Dサンプルと比較し得る。次に、エンコーダENCが、見逃した3Dサンプルを符号化し得、エンハンスメント層ELを提供し得る。最後に、ベース層BL及びエンハンスメント層ELは、多重化デバイスMUXによって共に多重化されてビットストリームBを生成し得る。
実施形態によれば、エンコーダENCは、中間の再構築された点群フレームIRPCFの3D基準サンプルを検出し、見逃した3DサンプルMに関連付け得る検出器を含み得る。
例えば、見逃した3DサンプルMと関連付けられた3D基準サンプルRは、所与のメートル法に従って、Mの最も近くに隣接するものであり得る。
実施形態によれば、エンコーダENCは、次に、当該3D基準サンプルRの空間位置及び属性に従って判定される差として、見逃した3DサンプルMの空間位置、及びそれらの属性を符号化し得る。
変形例では、それらの差は、別個に符号化され得る。
例えば、見逃した3DサンプルMの場合、空間座標x(M)、y(M)、及びz(M)を用いて、x-座標位置差Dx(M)、y-座標位置差Dy(M)、z-座標位置差Dz(M)、R-属性成分差Dr(M)、G-属性成分差Dg(M)、及びB-属性成分差Db(M)は、以下のように、計算され得る。
Dx(M)=x(M)-x(R)、
式中、x(M)は、図3により与えられる幾何学的形状画像における3DサンプルMのx-座標であり、Rについても、それぞれ同様であり、
Dy(M)=y(M)-y(R)
式中、y(M)は、図3により与えられる幾何学的形状画像における3DサンプルMのy-座標であり、Rについても、それぞれ同様であり、
Dz(M)=z(M)-z(R)
式中、z(M)は、図3により与えられる幾何学的形状画像における3DサンプルMのz-座標であり、Rについても、それぞれ同様であり、
Dr(M)=R(M)-R(R)。
式中、R(M)、R(R)は、それぞれ、3DサンプルM、R、それぞれの色属性のr-色成分であり、
Dg(M)=G(M)-G(R)。
式中、G(M)、G(R)は、それぞれ、3DサンプルM、R、それぞれの色属性のg-色成分であり、
Db(M)=B(M)-B(R)。
式中、B(M)、B(R)は、それぞれ、3DサンプルM、R、それぞれの色属性のb-色成分である。
図2は、本実施形態のうちの少なくとも1つによる、2層ベースの点群復号化構造2000の例の概略ブロック図を例示する。
2層ベースの点群復号化構造2000の動作は、その能力に依存する。
限定された能力を有する2層ベースの点群復号化構造2000は、多重分離デバイスDMUXを使用することによって、ビットストリームBからベース層BLのみにアクセスし得、次いで、図4に例示されるように、点群デコーダ4000によりベース層BLを復号化することによって、入力点群フレームIPCFの忠実な(ただし、不可逆な)バージョンIRPCFを提供し得る。
完全な能力を有する2層ベースの点群復号化構造2000は、多重分離デバイスDMUXを使用することによって、ビットストリームBからベース層BL及びエンハンスメント層ELの両方にアクセスし得る。点群デコーダ4000は、図4に例示されるように、ベース層BLから、中間の再構築された点群フレームIRPCFを判定し得る。デコーダDECは、エンハンスメント層ELから相補形点群フレームCPCFを判定し得る。次いで、結合器COMBは、中間の再構築された点群フレームIRPCF、及び相補形点群フレームCPCFを共に結合して、したがって、入力点群フレームIPCFのより高品質な(場合により可逆的)表現(再構築)CRPCFを提供し得る。
図3は、本実施形態のうちの少なくとも1つによる、画像ベースの点群エンコーダ3000の例の概略ブロック図を例示する。
画像ベースの点群エンコーダ3000は、既存のビデオコーデックを活用し、異なるビデオストリームを使用して入力動的点群の3Dサンプルの幾何学的形状及び属性情報を圧縮する。
特定の実施形態では、2つのビデオストリーム、すなわち、入力点群の3Dサンプルの幾何学的情報を取り込むための1つのビデオストリーム、及びこれらの3Dサンプルの属性情報を取り込むための別のビデオストリームが、既存のビデオコーデックを使用して生成及び圧縮され得る。既存のビデオコーデックの例としては、HEVCメインプロファイルエンコーダ/デコーダ(ITU-T H.265 ITU電気通信標準化部門(02/2018)、シリーズH、すなわち、視聴覚及びマルチメディアシステム、視聴覚サービスのインフラストラクチャ-ビデオ動画のコード化、高効率ビデオコード化、勧告ITU-T H.265)がある。
2つのビデオストリームを解釈するために使用される追加のメタデータもまた、通常、別個に生成及び圧縮される。このような追加のメタデータは、例えば、占有率マップOM及び/又は補助パッチ情報PIを含む。
次いで、生成されたビデオストリーム及びメタデータは、合成ストリームを生成するように共に多重化され得る。
メタデータは、通常、情報全体のわずかな量を表すことに留意されたい。情報の大部分は、ビデオストリーム内にある。
このような点群コード化/復号化プロセスの例は、ISO/IEC JTC1/SC29/WG11、Information technology-Coded Representation of Immersive Media-パート5:Video-based Point Cloud Compression、CD stage、SCD_d39、ISO/IEC 23090-5に定義されるように、MPEGドラフト規格を実装する試験モデルカテゴリ2アルゴリズム(V-PCCとも表記される)によって与えられる。
ステップ3100において、モジュールPGMは、最善の圧縮を提供する方策を使用して、入力点群フレームのフレームIPCFの3Dサンプルを、投影面上の2Dサンプルに直交投影することによって、2Dサンプルの少なくとも1つのパッチを生成し得る。
2Dサンプルのパッチは、共通の特性を共有する一組の2Dサンプルとして定義され得る。
例えば、V-PCCでは、例えば、Hoppeらの報告(Hugues Hoppe、Tony DeRose、Tom Duchamp、John McDonald、Werner Stuetzle、Surface reconstruction from unorganized points、ACM SIGGRAPH 1992 Proceedings、71-78)に記載されているように、3Dサンプルごとの法線は、最初に推定される。次に、3Dサンプルの初期のクラスタ化は、3Dサンプルを取り囲む3D境界ボックスの6つの配向面のうちの1つと各3Dサンプルを関連付けることによって、得られる。より正確には、各3Dサンプルは、クラスタ化され、最も近い法線(点法線及び面法線のドット積を最大化する)を有する配向面と関連付けられる。次いで、3Dサンプルは、それらの関連する平面(投影面)に直交して投影される。それらの平面内に接続領域を形成する一組の3Dサンプルは、接続された成分と称される。したがって、接続された成分は、同様の法線及び同じ関連する配向面を有する少なくとも1つの3Dサンプルの一組である。次いで、初期のクラスタ化は、各3Dサンプルと関連付けられたクラスタを、その法線、及びその最も近い隣接するサンプルのクラスタに基づいて、繰り返し更新することによって、精緻化される。最終ステップは、各接続された成分から2Dサンプルの1つのパッチを生成することからなり、これは、各接続された成分の3Dサンプルを、当該接続された成分と関連付けられた配向面上に投影することによって、行われる。
次いで、2Dサンプルのパッチの2Dサンプルは、同じ法線及び同じ配向面を共有し、それらは互いに接近して位置する。
2Dサンプルのパッチは、2Dサンプルのこのパッチの2Dサンプルの幾何学的形状/属性を解釈するために使用される補助パッチ情報を表す補助パッチ情報PIと関連付けられる。
V-PCCにおいて、例えば、補助パッチ情報PIは、1)接続された成分の3Dサンプルを取り囲む、3D境界ボックスの6つの配向面のうちの1つを示す情報、2)面法線に関する情報、3)深度、接線シフト、及び両接線シフトに換算して表されたパッチに対して、接続された成分の3D位置を判定する情報、及び4)パッチを取り囲む2D境界ボックスを定義する投影面における座標(u0、v0、u1、v1)などの情報を含む。
ステップ3200において、パッチパッキングモジュールPPMは、典型的には、未使用空間を最小限に抑える方法で、全く重なり合うことなく、2Dサンプルの少なくとも1つの生成されたパッチを2Dグリッド(キャンバス又はアトラスとも示される)上にマッピング(配設)し得、2DグリッドのTxT(例えば、16x16)のブロックごとに、一意のパッチと関連付けられることを保証し得る。2Dグリッドの所与の最小ブロックサイズTxTは、この2Dグリッド上に配設される際に、2Dサンプルの別個のパッチ間の最小距離を指定し得る。2Dグリッドの解像度は、入力点群フレームサイズに依存し得、その幅W及び高さH、並びにブロックサイズTは、メタデータとしてデコーダに送信され得る。
補助パッチ情報PIは、2Dグリッドのブロックと2Dサンプルのパッチとの間の関連付けに関する情報を更に含み得る。
図3aは、2DサンプルP1及びP2の2つのパッチ、及びそれらの関連する2D境界ボックスB1及びB2を含むキャンバスCの例を例示する。2つの境界ボックスは、図3aに例示されるように、キャンバスC内で重なり合い得る。2Dグリッド(キャンバスの分割)は、境界ボックス内にのみ表されるが、キャンバスの分割はそれらの境界ボックスの外側にも生じる。パッチと関連付けられた境界ボックスは、TxTブロック、典型的には、T=16に分割することができる。
2Dサンプルのパッチに属する2Dサンプルを含むTxTブロックは、占有ブロックと見なされ得る。キャンバスの各占有ブロックは、特定の画素値(例えば、1)によって占有率マップOM内に表され、キャンバスの各非占有ブロックは、特定の別の値、例えば、0によって表される。その後、占有率マップOMの画素値は、キャンバスのTxTブロックが、占有されているかどうか、すなわち、2Dサンプルのパッチに属する少なくとも1つの2Dサンプルを含むかどうかを示し得る。
図3aにおいて、占有ブロックは、白色ブロックによって表され、薄灰色のブロックは、非占有ブロックを表す。画像生成プロセス(ステップ3300及び3400)は、2Dサンプルの少なくとも1つの生成されたパッチの、ステップ3200中に算定された2Dグリッド上へのマッピングを有効活用して、3Dサンプルの幾何学的形状及び属性を画像として格納する。
ステップ3300において、幾何学的形状画像生成器GIGは、2Dサンプルの少なくとも1つのパッチ、占有率マップOM、及び補助パッチ情報PIから、少なくとも1つの幾何学的形状画像GIを生成し得る。
幾何学的形状画像GIは、2Dサンプルの少なくとも1つのパッチの幾何学的形状を表し得、例えば、YUV420-8ビット形式で表されるWxH画素の単色画像であり得る。
幾何学的形状画像生成器GIGは、当該2Dサンプルの少なくとも1つのパッチが定義される2Dグリッドの占有ブロック、したがって、幾何学的形状画像GI内の空でない画素を検出(位置特定)するために、占有率マップ情報を有効活用し得る。
複数の3Dサンプルが(同じ投影方向線に沿って)投影面の同じ座標に投影(マッピング)される場合をより良好に処理するために、複数の層が生成され得る。したがって、異なる深度値D1、...、Dnが得られ、2Dサンプルの同じパッチの2Dサンプルと関連付けられ得る。次いで、複数の幾何学的形状画像GI1、...、GINが、2Dサンプルのパッチの特定の深度値について各々生成され得る。
V-PCCにおいて、パッチの2Dサンプルは、2層上に投影され得る。第1の層は、近い層とも呼ばれるが、例えば、最も低い深度を有する2Dサンプルと関連付けられた深度値D0を格納し得る。第2の層は、遠い層と称されるが、例えば、最も高い深度を有する2Dサンプルと関連付けられた深度値D1を格納し得る。
ステップ3300の実施形態によれば、2Dサンプルの少なくとも1つのパッチの幾何学的形状(少なくとも1つの直交投影された3D点の幾何学的形状)は、規則的な幾何学的形状のコード化モードRGCMに従って符号化される。規則的な幾何学的形状のコード化モードRGCMは、2Dサンプルの少なくとも1つの規則的な幾何学的形状パッチRG2DPを、当該2Dサンプルの少なくとも1つのパッチの幾何学的形状から出力する。
実施形態によれば、規則的な幾何学的形状のコード化モードRGCMは、2Dサンプルのパッチの2Dサンプルと関連付けられた深度値を、層(第1又は第2若しくは両方)に対して、(u、v)=δ(u、v)-δ0によって与えられるルーマ成分g(u、v)としてコード化(導出)し得る。この関係を用いると、付随する補助パッチ情報PIを使用して、再構築された幾何学的形状画像g(u、v)から3Dサンプル位置δ(0、s0、r0)を再構築し得ることに留意されたい。
ステップ3300の実施形態によれば、2Dサンプルの少なくとも1つのパッチの幾何学的形状(少なくとも1つの直交投影された3D点の幾何学的形状)は、第1の幾何学的形状のコード化モードFGCMに従って符号化される。第1の幾何学的形状のコード化モードFGCMは、2Dサンプルの少なくとも1つの第1の幾何学的形状パッチFG2DPを、当該2Dサンプルの少なくとも1つのパッチの幾何学的形状から出力する。
実施形態によれば、第1の幾何学的形状のコード化モードFGCMは、当該2Dサンプルの少なくとも1つのパッチの2Dサンプルの幾何学的形状を、幾何学的形状画像の画素値として直接符号化する。
例えば、幾何学的形状が3つの座標(u、v、Z)によって表されるとき、画像の3つの連続する画素が使用され、1つはu座標を符号化するため、別の1つはv座標を符号化するため、及び別の1つはZ座標を符号化するためのものである。
ステップ3300の実施形態によれば、少なくとも1つの中間3Dサンプルの幾何学的形状は、第2の幾何学的形状のコード化モードSGCMに従って符号化される。第2の幾何学的形状のコード化モードSGCMは、2Dサンプルの少なくとも1つの第2の幾何学的形状パッチSG2DPを、当該少なくとも1つの中間3Dサンプルの幾何学的形状から出力する。
中間3Dサンプルは、同じ投影線に沿って、第1の直交投影された3Dサンプルと第2の直交投影された3Dサンプルとの間に存在し得る。中間3Dサンプル及び当該第1及び第2の直交投影された3Dサンプルは、投影面上に同じ座標と異なる深度値とを有する。
変形例において、中間3Dサンプルは、単一の直交投影された3Dサンプル及びEOMコードワードの長さから定義され得る。「仮想」第2の直交投影された3Dサンプルの深度値は、次いで、第1の直交投影された3Dサンプル及び当該EOMコードワードの長さ値の深度値に等しい。第1及び「仮想」直交投影された3Dサンプルは、投影面上に同じ座標と異なる深度値とを有する。
場合によっては、EOMコードワードの長さは、ビットストリームのシンタックス要素に埋め込まれる。
以下では、中間3Dサンプルは、当該第2の直交投影された3Dサンプルが「仮想」である場合でも、第1の直交投影された3Dサンプルと第2の直交投影された3Dサンプルとの間に存在すると見なされる。
更に、当該中間3Dサンプルは、第1の直交投影された3Dサンプルの深度値よりも大きく、第2の直交投影された3Dサンプルの深度値よりも低い深度値を有する。
複数の中間3Dサンプルは、第1の直交投影された3Dサンプルと第2の直交投影された3Dサンプルとの間に存在し得る。したがって、コードワードの指定されたビットは、中間3Dサンプルが、2つの直交投影された3Dサンプルのうちの1つからの特定の距離(投影線に沿った特定の空間位置)に存在する(又は存在しない)場合を示すために、当該中間3Dサンプルの各々に対して設定され得る。
図3bは、投影線PLに沿った2つの3DサンプルP0とP1と間に位置する2つの中間3DサンプルPi1及びPi2の例を例示する。3DサンプルP0及びP1は、それぞれ、D0及びD1に等しい深度値を有する。2つの中間3DサンプルPi1及びPi2の深度値Di1及びDi2は、それぞれ、D0よりも大きく、D1よりも低い。
次いで、当該投影線に沿った全ての当該指定されたビットを連結させて、コードワードを形成し得、これ以降、エンハンスド占有率マップ(Enhanced-Occupancy map、EOM)コードワードとして表記される。図3bに例示されるように、8ビットの長さのEOMコードワードを想定すると、2ビットが1に等しくなり、2つの3DサンプルPi1及びPi2の位置を示す。
第2の幾何学的形状のコード化モードSGCMの実施形態によれば、全てのEOMコードワードは、2Dサンプルの少なくとも1つの第2の幾何学的形状パッチSG2DPを形成するように一緒にパックされる。
当該2Dサンプルの少なくとも1つの第2の幾何学的形状パッチSG2DPは、画像に属し、当該画像内の画素の座標は、中間3Dサンプルの3つの座標のうちの2つを示し(これらの画素がEOMコードワードを指すとき)、それらの画素の値は、これらの中間3Dサンプルの第3の座標を示す。
実施形態によれば、当該2Dサンプルの少なくとも1つの第2の幾何学的形状パッチSG2DPは、占有率マップOMに属する。
ステップ3400において、属性画像生成器TIGは、2Dサンプルの少なくとも1つのパッチ、占有率マップOM、補助パッチ情報PI、及び少なくとも1つの復号化された幾何学的形状画像DGI、すなわちビデオデコーダVDEC(図4のステップ4200)の出力から導出された3Dサンプルの幾何学的形状から、少なくとも1つの属性画像TIを生成し得る。
属性画像TIは、3Dサンプルの属性を表し得、例えば、YUV420-8ビット形式で表されるWxH画素の画像であり得る。
属性画像生成器TGは、当該2Dサンプルの少なくとも1つのパッチが定義される2Dグリッドの占有ブロック、したがって、属性画像TI内の空でない画素を検出(位置特定)するために、占有率マップ情報を有効活用し得る。
属性画像生成器TIGは、属性画像TIを生成し、その属性画像TIを各幾何学的形状画像DGIと関連付けるように適合され得る。
次いで、複数の属性画像TI1、...、TInが、2Dサンプルのパッチの特定の深度値について各々(各幾何学的形状画像について)生成され得る。
ステップ3400の実施形態によれば、2Dサンプルの少なくとも1つのパッチの属性(直交投影された3Dサンプルの属性)は、規則的な属性のコード化モードRACMに従って符号化される。規則的な属性のコード化モードRACMは、2Dサンプルの少なくとも1つの規則的な属性パッチRA2DPを、当該2Dサンプルの少なくとも1つのパッチの属性から出力する。
実施形態によれば、規則的な属性のコード化モードRACMは、2Dサンプルのパッチの2Dサンプルと関連付けられた属性T0を、第1の属性画像TI0の画素値として第1の層に対して、また2Dサンプルのパッチの2Dサンプルと関連付けられた属性値T1を、第2の属性画像TI1の画素値として第2の層に対してコード化(格納)し得る。
代替的に、属性画像生成モジュールTIGは、2Dサンプルのパッチの2Dサンプルと関連付けられた属性値T1を、第1の属性画像TI0の画素値として第2の層に対して、また2Dサンプルのパッチの2Dサンプルと関連付けられた属性値T0を、第2の属性画像TI1の画素値として第1の層に対してコード化(格納)し得る。
例えば、3Dサンプルの色は、V-PCCのセクション2.2.3、2.2.4、2.2.5、2.2.8、又は2.5で説明されているように、得られ得る。
ステップ3400の実施形態によれば、2Dサンプルの少なくとも1つのパッチの属性(直交投影された3Dサンプルの属性)は、第1の属性のコード化モードFACMに従って符号化される。第1の属性のコード化モードFACMは、2Dサンプルの少なくとも1つの第1の属性パッチFA2DPを、当該2Dサンプルの少なくとも1つのパッチの属性から出力する。
実施形態によれば、第1の属性のコード化モードFACMは、当該2Dサンプルの少なくとも1つのパッチの2Dサンプルの属性を、画像の画素値として直接符号化する。
実施形態によれば、当該2Dサンプルの少なくとも1つのパッチは、属性画像に属する。
例えば、直交投影された3Dサンプルの属性は、V-PCCのセクション2.2.3、2.2.4、2.2.5、2.2.8、又は2.5で説明されているように、得られ得る。
ステップ3400の実施形態によれば、中間3Dサンプルの属性は、第2の属性のコード化モードSACMに従って符号化される。第2の属性のコード化モードSACMは、2Dサンプルの少なくとも1つの第2の属性パッチSA2DPを、当該少なくとも1つの中間3Dサンプルの属性から出力する。
中間3Dサンプルの属性値は、それらの画素の位置が、図3bに例示されるように他の2Dサンプルの属性値を格納するために既に使用されている占有ブロックに対応しているため、属性画像の画素値として直接格納することができない。
第2の属性のコード化モードSACMの実施形態によれば、中間3Dサンプルの属性値は、2Dサンプルの少なくとも1つの第2の属性パッチを形成するように完全にパックされる。
実施形態によれば、当該2Dサンプルの少なくとも1つの第2の属性パッチは、属性画像に属する。
V-PCCにおいて、当該2Dサンプルの少なくとも1つの第2の属性パッチの位置が、手順とおりに画定される(V-PCCのセクション9.4.5)。簡単に言えば、このプロセスでは、属性画像内の非占有ブロックの場所を判定し、中間3Dサンプルと関連付けられた属性値を当該属性画像の非占有ブロックの画素値として格納する。これにより、占有ブロックと2Dサンプルの第2の属性パッチとの間の重なり合いを回避する。
ステップ3500において、ビデオエンコーダVENCは、生成された画像/層TI及びGIを符号化し得る。
ステップ3600において、エンコーダOMENCは、例えば、V-PCCのセクション2.2.2に詳述されているように、占有率マップを画像として符号化し得る。不可逆的又は可逆的符号化が使用され得る。
実施形態によれば、ビデオエンコーダENC及び/又はOMENCは、HEVCベースのエンコーダであり得る。
ステップ3700において、エンコーダPIENCは、補助パッチ情報PI、並びに幾何学的形状/属性画像のブロックサイズT、幅W、及び高さHなど、追加の可能性のあるメタデータを符号化し得る。
実施形態によれば、補助パッチ情報は、差動的に符号化され得る(例えば、V-PCCのセクション2.4.1で定義されているように)。
ステップ3800において、多重化デバイスは、ステップ3500、3600、及び3700の生成された出力に適用され得、その結果、これらの出力は、ベース層BLを表す合成ストリームを生成するように共に多重化され得る。メタデータ情報は、ビットストリーム全体のうちのわずかな割合を表すことに留意されたい。
エンコーダ3000はまた、動的点群を符号化するために使用され得、次いで、この点群の各フレームは、繰り返し符号化される。次いで、少なくとも1つの幾何学的形状画像(ステップ3300)、少なくとも1つの属性画像(ステップ3400)、占有マップ(ステップ3600)、及び補助パッチ情報(ステップ3700)は、各フレームについて生成される。次いで、点群の全てのフレームのために生成された幾何学的形状画像は、ビデオストリーム、別のビデオストリームを形成するための属性画像、及び別のビデオストリームを形成するための占有率マップを形成するために完全に結合され得る。補助パッチ情報は、ビデオストリームを生成するために追加され得るか、又は補助パッチ情報の全てが、別のビデオストリームを形成するために完全にパックされ得る。次いで、これらのビデオストリーム全てが多重化されて(ステップ3800)単一のビットストリームBLを形成し得る。
図4は、本実施形態のうちの少なくとも1つによる、画像ベースの点群デコーダ4000の例の概略ブロック図を例示する。
デコーダ4000は、複数の画像ストリーム(少なくとも1つの幾何学的形状画像ストリーム、少なくとも1つの属性画像ストリーム、占有率マップストリーム、及び補助パッチ情報画像ストリーム)を含むビットストリームから、点群フレームを復号化するために使用され得る。しかし、デコーダ4000は、複数のフレームを含む動的点群を復号化するためにも使用され得る。その場合、動的点群の各フレームは、ビットストリームに埋め込まれたビデオストリーム(幾何学的形状ビデオストリーム、属性ビデオストリーム、占有率ビデオストリーム、補助パッチ情報ビデオストリーム)から、情報を抽出することによって復号化される。
ステップ4100において、多重分離デバイスDMUXは、ベース層BLを表すビットストリームの符号化された情報を多重分離するために適用し得る。
ステップ4200において、ビデオデコーダVDECは、符号化された情報を復号化して、点群フレームの3Dサンプルの復号化に対して、少なくとも1つの復号化された幾何学的形状画像DGI、及び少なくとも1つの復号化された属性画像DTIを導出し得る。
ステップ4300において、デコーダOMDECは、符号化された情報を復号化して、3Dサンプルの復号化に対して、復号化された占有率マップDOMを導出し得る。
実施形態によれば、ビデオデコーダVDEC及び/又はOMDECは、HEVCベースのデコーダであり得る。
ステップ4400において、デコーダPIDECは、符号化された情報を復号化して、3Dサンプルの復号化に対して、補助パッチ情報DPIを導出し得る。
場合によっては、メタデータもまた、ビットストリームBLから導出され得る。
ステップ4500において、幾何学的形状生成モジュールGGMは、少なくとも1つの復号化された幾何学的形状画像DGI、復号化された占有率マップDOM、復号化された補助パッチ情報DPI、及び可能性のある追加のメタデータから、点群フレームIRPCFの3Dサンプルの幾何学的形状RGを導出し得る。
幾何学的形状生成モジュールGGMは、少なくとも1つの復号化された幾何学的形状画像DGI内の空でない画素を位置特定するために、復号化された占有率マップ情報DOMを有効活用し得る。
当該空でない画素は、復号化された占有率情報DOMの画素値及び上記で説明したD1~D0の値に応じて、占有ブロック又はEOM参照ブロックのいずれかに属する。
ステップ4500の実施形態によれば、当該空でない画素が、占有ブロックに属するとき、3Dサンプルの幾何学的形状は、規則的な幾何学的形状の復号化モードRGDMに従って復号化される。
実施形態によれば、規則的な幾何学的形状の復号化モードRGDMは、空でない画素の座標、少なくとも1つの復号化された幾何学的形状画像DGIの当該空でない画素の値、復号化された補助パッチ情報から、及び場合によっては追加のメタデータから、3Dサンプルの3D座標を導出する。
空でない画素の使用は、2D画素の、3Dサンプルとの関係に基づいている。例えば、V-PCC内の当該投影を用いて、再構築された3Dサンプルの3D座標は、深度δ(u、v)、接線シフトs(u、v)、及び両接線シフトr(u、v)に換算して、以下のように表され得る。
δ(u、v)=δ0+g(u、v)
s(u、v)=s0-u0+u
r(u、v)=r0-v0+v
式中、g(u、v)は、復号化された幾何学的形状画像DGIのルーマ成分であり、(u、v)は、再構築された3Dサンプルと関連付けられた画素であり、(δ0、s0、r0)は、再構築された3Dサンプルが属する接続された成分の3D位置であり、(u0、v0、u1、v1)は、当該接続された成分と関連付けられたパッチの投影を包含する2D境界ボックスを画定する、投影面内の座標である。
ステップ4500の実施形態によれば、3Dサンプルの幾何学的形状は、第1の幾何学的形状の復号化モードFGDMに従って復号化される。
実施形態によれば、第1の幾何学的形状の復号化モードFGDMは、復号化された幾何学的形状画像DGIの画素値から、3Dサンプルの幾何学的形状を直接復号化する。
例えば、幾何学的形状が3つの座標(u、v、Z)によって表されるとき、画像の3つの連続する画素が使用され、u座標は、幾何学的形状画像の1つの画素の値、vは幾何学的形状画像の別の1つの画素の値、及びZは幾何学的形状画像の別の1つの画素の値に等しい。
ステップ4500の実施形態によれば、少なくとも1つの中間3Dサンプルの幾何学的形状は、第2の幾何学的形状の復号化モードSGDMに従って復号化される。
実施形態によれば、第2の幾何学的形状のコード化モードSGCMは、中間3Dサンプルの3D座標のうちの2つを、空でない画素の座標、及びEOMコードワードのビット値のうちの第3のビット値から導出し得る。
例えば、図3bの例によれば、EOMコードワードEOMCは、中間3DサンプルPi1及びPi2の3D座標を判定するために使用される。中間3DサンプルPi1の第3の座標は、例えば、D0xDi1=D0+3から導出され得、再構築された3DサンプルPi2の第3の座標は、例えば、D0xDi2=D0+5から導出され得る。オフセット値(3又は5)は、投影線に沿ったD0とD1との間の間隔の数である。
ステップ4600において、属性生成モジュールTGMは、当該3Dサンプルの幾何学的形状RG、及び少なくとも1つの復号化された属性画像DTIから、再構築された点群フレームIRPCFの3Dサンプルの属性を導出し得る。
ステップ4600の実施形態によれば、幾何学的形状が規則的な幾何学的形状の復号化モードRGDMによって復号化された3Dサンプルの属性は、規則的な属性の復号化モードRADMに従って復号化される。第1の属性の復号化モードRADMは、属性画像の画素値から、3Dサンプルの属性を復号化し得る。
ステップ4600の実施形態によれば、幾何学的形状が第1の幾何学的形状の復号化モードFGDMによって復号化された3Dサンプルの属性は、第1の属性の復号化モードFADMに従って復号化される。第1の属性の復号化モードFADMは、属性画像の画素値から、3Dサンプルの属性を復号化し得る。
ステップ4600の実施形態によれば、中間3Dサンプルの属性は、第2の属性の復号化モードSADMに従って復号化される。
実施形態によれば、第2の属性の復号化モードSADMは、2Dサンプルの第2の属性パッチSA2DPから、中間3Dサンプルの属性を導出し得る。
実施形態によれば、当該2Dサンプルの少なくとも1つの第2の属性パッチは、属性画像に属する。
V-PCCにおいて、当該2Dサンプルの少なくとも1つの第2の属性パッチの位置が、手順とおりに画定される(V-PCCのセクション9.4.10)。簡単に言えば、このプロセスでは、属性画像内の非占有ブロックの場所を判定し、中間3Dサンプルと関連付けられた属性値を当該属性画像の非占有ブロックの画素値から導出する。
図5は、本実施形態のうちの少なくとも1つによる、ベース層BLを表すビットストリームのシンタックスの例を概略的に例示する。
ビットストリームは、ビットストリームヘッダSH、及び少なくとも1つのフレームストリームグループGOFSを含む。
フレームストリームグループGOFSは、ヘッダHS、占有率マップOMを表す少なくとも1つのシンタックス要素OMS、少なくとも1つの幾何学的形状画像(又はビデオ)を表す少なくとも1つのシンタックス要素GVS、少なくとも1つの属性画像(又はビデオ)を表す少なくとも1つのシンタックス要素TVS、及び補助パッチ情報を表す少なくとも1つのシンタックス要素PIS、並びに他の追加のメタデータを含む。
変形例では、フレームストリームグループGOFSは、少なくとも1つのフレームストリームを含む。
図6は、様々な態様及び実施形態が実装されるシステムの例を例示する概略ブロック図を示す。
システム6000は、以下に説明されている様々な構成要素を含む1つ以上のデバイスとして具現化され得、本文書に記載される態様のうちの1つ以上を実施するように構成されている。システム6000の全て又は一部を形成し得る機器の例としては、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオレコーディングシステム、接続された家庭電化製品、接続された車両並びにそれらの関連する処理システム、ヘッドマウントディスプレイデバイス(head mounted display device、HMD、シースルーグラス)、プロジェクタ(ビーマー)、「没入型バーチャルリアリティ体験装置(caves)」(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力されるポストプロセッサ処理、ビデオエンコーダへの入力を提供するプリプロセッサ、ウェブサーバ、セットトップボックス、及び点群、ビデオ、若しくは画像を処理するための任意の他のデバイス、又は他の通信デバイスが含まれる。システム6000の要素は、単独で、又は組み合わせて、単一の集積回路、複数のIC、及び/又は個別の構成要素で具現化され得る。例えば、少なくとも1つの実施形態では、システム6000の処理及びエンコーダ/デコーダ要素は、複数のIC及び/又は個別の構成要素にわたって分散され得る。様々な実施形態では、システム6000は、例えば、通信バスを介して、又は専用の入力及び/若しくは出力ポートを通じて、他の同様のシステムに、又は他の電子デバイスに通信可能に結合され得る。様々な実施形態では、システム6000は、本文書に記載された態様のうちの1つ以上を実装するように構成され得る。
システム6000は、例えば、本文書に記載された様々な態様を実装するために、内部にロードされた命令を実行するように構成された少なくとも1つのプロセッサ6010を含み得る。プロセッサ6010は、埋め込み型メモリ、入力出力インターフェース、及び当該技術分野で既知の様々な他の回路を含み得る。システム6000は、少なくとも1つのメモリ6020(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含み得る。システム6000は、記憶デバイス6040を含み得、その記憶デバイスは、不揮発性メモリ及び/又は揮発性メモリを含み得、それらのメモリには、電気的に消去可能なプログラマブル読み出し専用メモリ(Electrically Erasable Programmable Read-Only Memory、EEPROM)、読み出し専用メモリ(Read-Only Memory、ROM)、プログラマブル読み出し専用メモリ(Programmable Read-Only Memory、PROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、ダイナミックランダムアクセスメモリ(Dynamic Random Access Memory、DRAM)、スタティックランダムアクセスメモリ(Static Random Access Memory、SRAM)、フラッシュ、磁気ディスクデバイス、及び/又は光ディスクデバイスが含まれるが、これらに限定されない。記憶デバイス6040は、非限定的な例として、内部記憶デバイス、取り付け型記憶デバイス、及び/又はネットワークアクセス可能型記憶デバイスを含み得る。
システム6000は、例えば、データを処理して符号化されたデータ、又は復号化されたデータを提供するように構成されているエンコーダ/デコーダモジュール6030を含み得、エンコーダ/デコーダモジュール6030は、それ自体のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール6030は、デバイス内に含まれて、符号化及び/又は復号化機能を実施し得るモジュールを表し得る。既知であるように、デバイスは、符号化及び復号化モジュールのうちの一方又は両方を含み得る。追加的に、エンコーダ/デコーダモジュール6030は、システム6000の別個の要素として実装され得、又は当業者には既知であるように、ハードウェア及びソフトウェアの組み合わせとして、プロセッサ6010内に組み込まれ得る。
本文書に記載される様々な態様を実施するためのプロセッサ6010又はエンコーダ/デコーダ6030にロードされるプログラムコードは、記憶デバイス6040内に記憶され得、その後、プロセッサ6010による実行のためのメモリ6020上にロードされ得る。様々な実施形態によれば、プロセッサ6010、メモリ6020、記憶デバイス6040、及びエンコーダ/デコーダモジュール6030のうちの1つ以上は、本文書に記載されるプロセスの実施中に、様々な項目のうちの1つ以上を記憶し得る。このような記憶される項目は、点群フレーム、符号化/復号化された幾何学的形状/属性ビデオ/画像若しくは符号化/復号化された幾何学的形状/属性ビデオ/画像の一部、ビットストリーム、行列、変数、並びに数式、公式、演算、及び演算ロジックの処理からの中間若しくは最終結果を含み得るが、これらに限定されない。
いくつかの実施形態では、プロセッサ6010及び/又はエンコーダ/デコーダモジュール6030内部のメモリを使用して、命令を記憶し、符号化又は復号化中に実施され得る処理のための作業メモリを提供し得る。
しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ6010又はエンコーダ/デコーダモジュール6030のいずれかであり得る)の外部にあるメモリは、これらの機能のうちの1つ以上に使用され得る。外部メモリは、メモリ6020及び/又は記憶デバイス6040、例えば、動的揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部不揮発性フラッシュメモリを使用して、テレビのオペレーティングシステムを記憶し得る。少なくとも1つの実施形態では、RAMなどの高速外部動的揮発性メモリは、MPEG-2パート2(ITU-T勧告H、262及びISO/IEC13818-2としても既知であり、MPEG-2ビデオとしても既知である)、HEVC(High Efficiency Video coding、高効率ビデオコード化)、又はVVC(VersatilleVideoCoding、多機能ビデオコード化)用などのビデオコード化及び復号化動作のための作業メモリとして使用され得る。
システム6000の要素への入力は、ブロック6130に示されるように、様々な入力デバイスを通して提供され得る。このような入力デバイスには、(i)例えば、放送局による、空中をわたって送信されるRF信号を受信し得るRF部分、(ii)複合入力端子、(iii)USB入力端子、及び/又は(iv)HDMI入力端子が含まれるが、これらに限定されない。
様々な実施形態では、ブロック6130の入力デバイスは、当該技術分野で既知の、関連するそれぞれの入力処理要素を有し得る。例えば、RF部分は、(i)所望の周波数を選択する(信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)特定の実施形態で、(例えば)チャネルと称され得る信号周波数帯域を選択するために、再びより狭い周波数帯域に帯域制限する、(iv)ダウンコンバート及び帯域制限された信号を復調する、(v)誤り訂正を実施する、及び(vi)データパケットの所望のストリームを選択するために多重分離する、ために必要な要素と関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実施する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラーコレクタ、及び多重分離デバイスを含み得る。RF部分は、これらの様々な機能を実施するチューナを含み得、例えば、受信した信号をより低い周波数(例えば、中間周波数若しくは近接ベースバンド周波数)に、又はベースバンドにダウンコンバートすることが含まれる。
1つのセットトップボックスの実施形態では、RF部分及びその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体を経由して送信されるRF信号を受信し得る。次いで、RF部分は、所望の周波数帯域へのフィルタリング、ダウンコンバート、及び再度のフィルタリングによって、周波数選択を実施し得る。
様々な実施形態は、上述の(及び他の)要素の順序を再配列し、これらの要素のいくつかを除去し、かつ/又は同様の機能若しくは異なる機能を実施する他の要素を追加する。
要素を追加することには、既存の要素の間に要素を挿入すること、例えば、増幅器及びアナログデジタルコンバータを挿入することなどが含まれ得る。様々な実施形態では、RF部分は、アンテナを含み得る。
追加的に、USB及び/又はHDMI端末は、USB及び/又はHDMI接続全体にわたって、システム6000を他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リードソロモン誤り訂正は、例えば、別個の入力処理IC内に、又は必要に応じて、プロセッサ6010内に実装され得ることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、別個のインターフェースIC内に、又は必要に応じて、プロセッサ6010内に実装され得る。復調され、誤り訂正され、かつ多重分離されたストリームは、様々な処理要素に提供され得、その要素には、例えば、プロセッサ6010、並びに必要に応じて出力デバイスに提示するために、データストリームを処理するためのメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ6030が含まれる。
システム6000の様々な要素は、一体化されたハウジング内に提供され得る。一体化されたハウジング内では、様々な要素が、適切な接続配置6140を使用して相互接続され、かつ互いの間でデータを送信し得、その接続配置としては、例えば、当技術分野で既知の内部バスがあり、I2Cバス、配線、及びプリント回路基板が含まれる。
システム6000は、通信インターフェース6050を含み得、その通信インターフェースは、通信チャネル6060を介して、他のデバイスとの通信を可能にする。通信インターフェース6050は、通信チャネル6060を介してデータを送受信するように構成された送受信機を含み得るが、これに限定されない。通信インターフェース6050は、モデム又はネットワークカードを含み得るが、これに限定されず、通信チャネル6060は、例えば、有線及び/又は無線媒体内に実装され得る。
様々な実施形態では、データは、IEEE802.11などのWi-Fiネットワークを使用して、システム6000にストリーミングされ得る。これらの実施形態のWi-Fi信号は、Wi-Fi通信のために適合された通信チャネル6060及び通信インターフェース6050を介して受信され得る。これらの実施形態の通信チャネル6060は、通常、外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続され得、その外部ネットワークには、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためのインターネットが含まれる。
他の実施形態は、入力ブロック6130のHDMI接続を介してデータを送達するセットトップボックスを使用して、ストリーミングされたデータをシステム6000に提供し得る。
更なる他の実施形態は、入力ブロック6130のRF接続を使用して、ストリーミングされたデータをシステム6000に提供し得る。
ストリーミングされたデータは、システム5000によって使用される情報を信号伝達するための方法として使用され得る。信号伝達情報は、上記で説明した情報INFを含み得る。
信号伝達は、様々な方法で達成され得ることを理解されたい。例えば、様々な実施形態では、1つ以上のシンタックス要素、フラグなどを使用して、情報を、対応するデコーダに信号伝達し得る。
システム6000は、出力信号を、ディスプレイ6100、スピーカ6110、及び他の周辺デバイス6120を含む様々な出力デバイスに提供し得る。他の周辺デバイス6120には、実施形態の様々な例において、スタンドアローン型DVR、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム3000の出力に基づいて機能を提供する他のデバイスのうちの1つ以上が含まれ得る。
様々な実施形態では、制御信号は、AVリンク(AV.Link、オーディオ/ビデオリンク)、CEC(Consumer Electronics Control、家電製品制御)、又はユーザの介在の有無にかかわらずデバイス間制御を可能にする他の通信プロトコルなどの信号方式を使用して、システム6000と、ディスプレイ6100、スピーカ6110、又は他の周辺デバイス6120との間で伝達され得る。
出力デバイスは、それぞれのインターフェース6070、6080、及び6090を通じた専用接続を介して、システム6000に通信可能に結合され得る。
代替的に、出力デバイスは、通信インターフェース6050を介して、通信チャネル6060を使用して、システム6000に接続され得る。ディスプレイ6100及びスピーカ6110は、例えば、テレビなどの電子デバイス内のシステム6000の他の構成要素と共に単一のユニット内に一体化され得る。
様々な実施形態では、ディスプレイインターフェース6070は、例えば、タイミングコントローラ(timing controller、TCon)チップなどのディスプレイドライバを含み得る。
ディスプレイ6100及びスピーカ6110は、代替的に、例えば、入力6130のRF部分が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つ以上から分離され得る。ディスプレイ6100及びスピーカ6110が外部構成要素であり得る様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む、専用の出力接続を介して提供され得る。
V-PCCにおいて、2Dサンプルの規則的な幾何学的形状パッチ及び2Dサンプルの第1の幾何学的形状パッチは、幾何学的形状画像GIに格納され、2Dサンプルの第2の幾何学的形状パッチは、占有率マップOMに格納され、2Dサンプルの規則的な第1及び第2の属性パッチは、シンタックス要素によって示される場所において属性画像TIに格納される。
同じビデオストリームに一緒に格納される、2Dサンプルの規則的な第1及び第2の属性パッチは、3Dサンプルの属性情報をコード化/復号化するためのただ1つのビデオエンコーダ/デコーダを必要とするという利点を有し得る。
設計により、規則的な第1及び第2の幾何学的形状/属性の符号化モードは、異なるニーズに応答する。したがって、それらの属性形式、スキャン順序、サイズ、及び形状は異なる。したがって、情報(又は符号化/コード化/圧縮)を低減するための方法は、特に空間的「イントラ」冗長性を低減させるときに、異なる方法を必要とし得る。その上、中間3Dサンプルの幾何学的形状/属性(EOMコードワード)を可逆的ビデオコーデックでコード化することが目的とされ得るが、まばらな3Dサンプルの幾何学的形状/属性(典型的な点群シーンの焦点を何らかの形で表すことは少ない)は、典型的には、第1の幾何学的形状/属性の符号化モードを使用して符号化され、その用途に従って非可逆コード化又はその逆の対象となり得る。
その結果として、3Dサンプルの幾何学的形状/属性を符号化するには、これら両方の規則的な第1及び第2のコード化モードを必要とし、これらのモードには、これら2つのコード化モードの各々に適合されたプロセスを含むある特定の(一般的ではない)プロファイル化されたビデオコーデックと、3Dサンプルの幾何学的形状及び属性を復号化するためにこれらのコード化モードのうちのどちらかを使用する必要があることをデコーダに示すための追加の信号伝達が必要となる。
したがって、点群フレームの3Dサンプルを符号化するための複数のコード化モードを可能にすることにより、性能(エンコーダ/デコーダの複雑さ及びバンド幅の低減)に影響を与える可能性がある。
一般的に言えば、本実施形態の少なくとも1つは、直交投影された3Dサンプル及び中間3Dサンプルの属性を符号化する方法を提供し、情報INFは、第1の属性コード化モードに従って当該少なくとも1つの直交投影された3Dサンプルの属性を符号化することによって得られた2Dサンプルの少なくとも1つの第1の属性パッチ及び少なくとも1つの中間3Dサンプルの属性を符号化することによって得られた画像の2Dサンプルの少なくとも1つの第2の属性パッチが、別個の画像に格納されているかどうかを示す。
別個の画像は、同じビデオストリームの画像を意味し得るが、異なるビデオストリーム(同じビデオストリームに属していない)の異なる時刻又は画像を意味し得る。
情報INFは、ビデオコーデックの使用に関してより多くの柔軟性を可能にし、また、ビデオコーデックが、直交3Dサンプル又は中間3Dサンプルの属性を符号化するために調整され得るため、より良好な圧縮性能も可能にする。ビデオコーデックの調整は、次いで、これらの3Dサンプルの属性の特性を考慮に入れ、かつ/又はアプリケーションの制約及び要件を満たし得る。例えば、2Dサンプルの第1及び/又は第2の属性パッチは、アプリケーション又はデコーダ/レンダラの能力に従って廃棄され得る(例えば、いくつかの3Dサンプルは、場合によっては、復号化のために関連するローエンドSoCを有する小型ディスプレイ上にレンダリングされた点群には有用でない場合がある)。
更に、それらの属性を格納するビデオストリームは、並列式に処理され得る。
図7は、少なくとも1つの実施形態による、点群フレームの直交3Dサンプルを符号化するための方法のフローチャートの例を示す。
ステップ710において、情報INFは、2Dサンプルの少なくとも1つの第1の属性パッチFA2DP(ステップ3400)及び2Dサンプルの少なくとも1つの第2の属性パッチSA2DP(ステップ3400)が、別個の画像に格納されていることを示すために、第1の特定の値(例えば、1)に設定され得る。また、情報INFは、当該2Dサンプルの少なくとも1つの第1の属性パッチFA2DP及び当該2Dサンプルの少なくとも1つの第2の属性パッチSA2DPが、同じ画像に格納されていることを示すために、第2の特定の値(例えば、0)に設定され得る。
情報INFが当該第1の特定の値に等しいとき、ステップ720において、当該2Dサンプルの少なくとも1つの第1の属性パッチFA2DPが、第1の画像FAIに格納され、当該2Dサンプルの少なくとも1つの第2の属性パッチSA2DPが、第2の画像SAIに格納される。
情報INFが当該第2の特定の値に等しいとき、ステップ730において、当該2Dサンプルの少なくとも1つの第1の属性パッチFA2DP及び当該2Dサンプルの少なくとも1つの第2の属性パッチSA2DPが、同じ画像AIに格納される。
実施形態によれば、図7aに例示されるように、情報INFは、第1のバイナリフラグF1及び第2のバイナリフラグF2を含む。
ステップ740において、第1のフラグF1は、2Dサンプルの少なくとも1つの第1の属性パッチFA2DP(ステップ3400)が、第1の画像FA1に格納されていることを示すために、第1の特定の値(例えば、1)に設定され得、2Dサンプルの少なくとも1つの第1の属性パッチFA2DP(ステップ3400)が、画像AIに格納されていることを示すために、第2の特定の値(例えば、0)に設定され得る。
ステップ750において、第2のフラグF2は、2Dサンプルの少なくとも1つの第2の属性パッチSA2DP(ステップ3400)が、第2の画像FA2に格納されていることを示すために、第1の特定の値(例えば、1)に設定され得、2Dサンプルの少なくとも1つの第2の属性パッチFA2DP(ステップ3400)が、画像AIに格納されていることを示すために、第2の特定の値(例えば、0)に設定され得る。
第1のフラグFA及び第2のフラグF2が1に等しいとき、2Dサンプルの第1の属性パッチFA2DP及び第2の属性パッチSA2DPは、別個の画像に格納される。
第1のフラグF1が0に等しく、第2のフラグF2が1に等しいとき、2Dサンプルの第1の属性パッチFA2DP及び規則的な属性2DパッチRA2DPは、同じ画像に格納され、2Dサンプルの第2の属性パッチSA2DPは、別個の画像に格納される。
第1のフラグF1が1に等しく、第2のフラグF2が0に等しいとき、2Dサンプルの第2の属性パッチSA2DP及び規則的な属性2DパッチRA2DPは、同じ画像に格納され、2Dサンプルの第1の属性パッチFA2DPは、別個の画像に格納される。
第1のフラグFA及び第2のフラグF2が0に等しいとき、2Dサンプルの第1の属性パッチFA2DP及び第2の属性パッチSA2DPは、同じ画像に格納される。
変形例によれば、情報INFは、ピクチャレベル、フレーム/アトラスレベル、又はパッチレベルのグループで有効である。
変形例によれば、シンタックス要素をビットストリームに追加して、2Dサンプルの第2の属性パッチを搬送するビデオストリームを圧縮するために使用されるビデオコーデックを識別する。
このコーデックは、構成要素コーデックマッピングSEIメッセージを介して、又はV-PCC仕様以外の手段を通して識別され得る。
ai_eom_attribute_codec_id[atlas_id]で示されるこのようなシンタックス要素は、図8のシンタックス要素vpcc_eom_patch_separate_video_present_flagなどの別のシンタックス要素の特定の値に条件付きで属性情報シンタックス構造に追加され得る。
図8は、少なくとも1つの実施形態による、情報INFを埋め込むシンタックス要素vpcc_eom_patch_separate_video_present_flagの例を例示する。
シンタックス要素vpcc_eom_patch_separate_video_present_flagは、シーケンスパラメータセット(Sequence Parameter Set、SPS)、アトラスシーケンスパラメータセット(Atlas Sequence Parameter Set、ASPS)、又はピクチャパラメータセット(Picture Parameter Set、PPS)などのパラメータセットでコード化され得る。
図8の要素は、以下の意味を有する。
vpcc_eom_patch_separate_video_present_flag[j]は、1に等しく、インデックスjを有する2Dサンプルの第2の属性パッチが、別個のビデオストリームに格納され得ることを示す。
vpcc_eom_patch_separate_video_present_flag[j]は、0に等しく、インデックスjを有する2Dサンプルの第2の属性パッチが、別個のビデオストリームに格納されないものとすることを示す。
vpcc_eom_patch_separate_video_present_flag[j]が存在しないとき、これは0に等しいと推論される。
epdu_patch_in_eom_video_flag[p]は、現在のアトラスタイルグループ内のインデックスpを有する2Dサンプルの第2の属性パッチと関連付けられた属性データが、イントラ及びインターコード化されたパッチの属性データと比較して別個のビデオに符号化されているかどうかを指定する。epdu_patch_in_eom_video_flag[p]が0に等しい場合、現在のアトラスタイルグループ内のインデックスjを有する2Dサンプルの第2の属性パッチと関連付けられた属性データは、イントラ及びインターコード化されたパッチの属性データと同じビデオに符号化される。epdu_patch_in_eom_video_flag[p]が1に等しい場合、現在のアトラスタイルグループ内のインデックスjを有する2Dサンプルの第2の属性パッチと関連付けられた属性データは、イントラ及びインターコード化されたパッチの属性データから、別個のビデオに符号化される。epdu_patch_in_eom_video_flag[p]が存在しない場合、その値は、0に等しいと推論されるものとする。
変形例では、シンタックス要素vpcc_eom_patch_separate_video_present_flag[j]は、2Dサンプルの第1及び第2の属性パッチに共通であり得る。
次いで、vpcc_separate_video_present_flag[j]が1に等しいときは、2Dサンプルの第2の属性パッチ、2Dサンプルの第1の属性パッチ、及びインデックスjを有するアトラスのための2Dサンプルの第1の幾何学的形状パッチは、別個の画像(別個のビデオストリーム)に格納され得ることを示す。
vpcc_separate_video_present_flag[j]が0に等しいときは、2Dサンプルの第2の属性パッチ、2Dサンプルの第1の属性パッチ、及びインデックスjを有するアトラスのための2Dサンプルの第1の幾何学的形状パッチは、別個のビデオストリームに格納されないものとすることを示す。
vpcc_separate_video_present_flag[j]が存在しないとき、これは0に等しいと推論される。
図1~8において、様々な方法が本明細書に記載されており、本方法の各々は、記載された方法を達成するための1つ以上のステップ又は行為を含む。本方法の適切な動作に特定の順序のステップ若しくは行為が必要でない限り、特定のステップ及び/又は行為の順序及び/又は使用は、変更又は組み合わされ得る。
いくつかの例は、ブロック図及び動作フローチャートに関して説明される。各ブロックは、指定された論理機能を実装するための1つ以上の実行可能な命令を含む、回路要素、モジュール、又はコード部分を表す。また、他の実装形態では、ブロックに記載された機能は、示された順序から生じ得ることにも留意されたい。例えば、連続して示されている2つのブロックは、実際には、実質的に同時に実行され得るか、又はこれらのブロックは、関与する機能性に応じて、逆の順序で実行され得る。
本明細書に記載される実装形態及び態様は、例えば、方法又はプロセス、装置、コンピュータプログラム、データストリーム、ビットストリーム、又は信号で実装され得る。単一形態の実装形態のコンテキストでのみ考察される(例えば、方法としてのみ考察される)場合であっても、考察される特徴の実装は、他の形態(例えば、装置又はコンピュータプログラム)で実装され得る。
本方法は、例えば、一般に処理デバイスを指すプロセッサで実装され得、プロセッサとしては、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスが挙げられる。プロセッサはまた、通信デバイスを含む。
追加的に、本方法は、プロセッサによって実施される命令によって実装され得、そのような命令(及び/又は実装によって生成されたデータ値)は、コンピュータ可読記憶媒体に記憶され得る。コンピュータ可読記憶媒体は、1つ以上のコンピュータ可読媒体に具現化され、コンピュータによって実行可能なコンピュータ可読プログラムコードが具現化されたコンピュータ可読プログラム製品の形態を採り得る。本明細書で使用されるとき、コンピュータ可読記憶媒体は、内部に情報を記憶する固有能力、並びにそこから情報の取り出しを提供する固有能力が与えられている、非一時的な記憶媒体と見なされ得る。コンピュータ可読記憶媒体は、例えば、電子システム、磁気システム、光学システム、電磁システム、赤外線システム、若しくは半導体システム、装置、若しくはデバイス、又は前述の任意の好適な組み合わせであり得るが、これらに限定されない。以下は、本実施形態が適用され得るコンピュータ可読記憶媒体のより具体的な例を提供しながら、単に例示的なものであり、当業者であれば容易に理解されるような網羅的なリストではないことを理解されたい:携帯型コンピュータディスケット;ハードディスク;読み出し専用メモリ(ROM);消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ);携帯型コンパクトディスク読み出し専用メモリ(compact disc read-only memory、CD-ROM);光学記憶デバイス;磁気記憶デバイス;又は前述の任意の好適な組み合わせ。
命令は、プロセッサ可読媒体上に目に見える方法で具現化されたアプリケーションプログラムを形成し得る。
命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、又はこれらの組み合わせであり得る。命令は、例えば、オペレーティングシステム、別個のアプリケーション、又はこれら2つの組み合わせで見出され得る。したがって、プロセッサは、例えば、プロセスを遂行するように構成されたデバイスと、プロセスを遂行するための命令を有するプロセッサ可読媒体(記憶デバイスなど)を含むデバイスとの両方を特徴とし得る。更に、プロセッサ可読媒体は、命令に加えて、又は命令の代わりに、実装によって生成されたデータ値を記憶し得る。
装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。そのような装置の例としては、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオレコーディングシステム、接続された家庭電化製品、ヘッドマウントディスプレイデバイス(HMD、シースルーグラス)、プロジェクタ(ビーマー)、「没入型バーチャルリアリティ体験装置(caves)」(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力されるポストプロセッサ処理、ビデオエンコーダへの入力を提供するプリプロセッサ、ウェブサーバ、セットトップボックス、及び点群、ビデオ、若しくは画像を処理するための任意の他のデバイス、又は他の通信デバイスが含まれる。明確にするべきであるように、機器は、モバイルであり得、更にはモバイル車両に設置され得る。
コンピュータソフトウェアは、プロセッサ6010によって、又はハードウェアによって、若しくはハードウェアとソフトウェアとの組み合わせによって実装され得る。非限定的な例として、実施形態はまた、1つ以上の集積回路によって実装され得る。メモリ6020は、技術的環境に適切な任意のタイプであり得、非限定的な例として、光学メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及び取り外し可能なメモリなどの任意の適切なデータ記憶技術を使用して実装され得る。プロセッサ6010は、技術的環境に適切な任意のタイプであり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を含み得る。
当業者には明らかであるように、実装形態は、例えば、格納又は送信され得る情報を搬送するようにフォーマットされた様々な信号を生成し得る。情報は、例えば、方法を実行するための命令、又は記載された実装形態のうちの1つによって生成されたデータを含み得る。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされ得る。そのような信号は、例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えば、データストリームを符号化すること、及び符号化されたデータストリームを用いてキャリアを変調することを含み得る。信号が搬送する情報は、例えば、アナログ情報又はデジタル情報であり得る。信号は、既知であるように、様々な異なる有線又は無線リンクを経由して送信され得る。信号は、プロセッサ可読媒体に記憶され得る。
本明細書で使用される用語は、特定の実施形態のみを説明する目的のためであり、限定することを意図するものではない。本明細書で使用されるとき、単数形「a」、「an」、及び「the」は、文脈が別途明確に示されない限り、複数形も含むことが意図され得る。本明細書で使用されるとき、「含む(includes)/含む(comprises)」及び/又は「含む(including)/含む(comprising)」という用語は、記載された、例えば、特徴、整数、ステップ、動作、要素、及び/又は構成要素の存在を指定し得るが、1つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、及び/又はそれらのグループの存在又は追加を排除しないことが更に理解されるであろう。更に、要素が別の要素に「応答する」又は「接続される」と称されるとき、それは、他の要素に直接応答するか、若しくは接続され得るか、又は介在要素が存在し得る。対照的に、要素が他の要素に「直接応答する」又は「直接接続される」と称されるとき、介在要素は存在しない。
例えば、「A/B」、「A及び/又はB」並びに「A及びBのうちの少なくとも1つ」の場合、「/」、「及び/又は」、並びに「のうちの少なくとも1つ」という記号/用語のうちのいずれかの使用は、第1の列挙された選択肢(A)のみの選択、又は第2の列挙された選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を含むことが意図され得ることを理解されたい。更なる例として、「A、B、及び/又はC」並びに「A、B、及びCのうちの少なくとも1つ」の場合、そのような表現は、第1の列挙された選択肢(A)のみの選択、又は第2の列挙された選択肢(B)のみの選択、又は第3の列挙された選択肢(C)のみの選択、又は第1及び第2の列挙された選択肢(A及びB)のみの選択、又は第1及び第3の列挙された選択肢(A及びC)のみの選択、又は第2及び第3の列挙された選択肢(B及びC)のみの選択、又は3つ全ての選択肢(A及びB及びC)の選択を含むことが意図される。このことは、本技術及び関連技術の当業者には明らかであるように、列挙されている項目の数だけ拡張され得る。
本出願において、様々な数値が使用され得る。特定の値は、例示目的のためであり得、記載される態様は、これらの特定の値に限定されない。
本明細書では、第1、第2などの用語が様々な要素を説明するために使用され得るが、これらの要素は、これらの用語によって限定されるものではないことが理解されよう。これらの用語は、1つの要素を別の要素と区別するためにのみ使用される。例えば、本出願の教示から逸脱することなく、第1の要素を第2の要素と呼ばれ得、同様に、第2の要素を第1の要素と呼ばれ得る。第1の要素と第2の要素との間には、順序は存在しない。
「一実施形態」又は「実施形態」又は「一実装形態」又は「実装形態」、並びにそれらの他の変形例への言及は、特定の特徴、構造、特性など(実施形態/実装形態に関連して説明される)が少なくとも1つの実施形態/実装形態に含まれることを伝えるために頻繁に使用される。したがって、本明細書の様々な場所に現れる「一実施形態では」又は「実施形態では」又は「一実装形態では」又は「実装形態では」という語句の出現、並びに任意の他の変形例は、必ずしも全てが同じ実施形態を指すものではない。
同様に、本明細書における「実施形態/実施例/実装形態に従って」又は「実施形態/実施例/実装形態では」、並びにそれらの他の変形例への言及は、特定の特徴、構造、又は特性(実施形態/実施例/実装形態に関連して説明される)が少なくとも1つの実施形態/実施例/実装形態に含まれ得ることを伝えるために頻繁に使用される。したがって、本明細書の様々な場所における「実施形態/実施例/実装形態に従って」又は「実施形態/実施例/実装形態では」という表現の出現は、必ずしも全てが同じ実施形態/実施例/実装形態を指すものではなく、また、別個の、若しくは代替の実施形態/実施例/実装形態は、必ずしも他の実施形態/実施例/実装形態を相互に含まないとも限らない。
特許請求の範囲に現れる参照番号は、単に例示としてのものであり、特許請求の範囲に限定的な影響を及ぼさないものとする。明示的に記載されていないが、本実施形態/実施例及び変形例は、任意の組み合わせ又はサブ組み合わせで用いられ得る。
図がフロー図として提示される場合、その図が、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示される場合、その図が、対応する方法/プロセスのフロー図も提供することを理解されたい。
いくつかの図は、通信の主要な方向を示すために通信経路上に矢印を含むが、通信は、図示された矢印と反対方向に生じ得ることを理解されたい。
様々な実装形態は、復号化を伴う。本出願で使用されるとき、「復号化」は、ディスプレイに適した最終出力を生成するか、又は再構築された点群領域で更に処理するために、例えば、受信された点群フレーム(場合によっては、1つ以上の点群フレームを符号化する受信されたビットストリームを含む)上で実施されるプロセスの全て又は一部を包含し得る。様々な実施形態では、そのようなプロセスには、典型的には、画像ベースのデコーダによって実施されるプロセスのうちの1つ以上が含まれる。様々な実施形態では、そのようなプロセスにはまた、若しくは代替的に、例えば、本出願に記載される様々な実装形態のデコーダによって実施されるプロセスも含まれる。
更なる例として、一実施形態では、「復号化」は、エントロピー復号化のみを指し得、別の実施形態では、「復号化」は、差分復号化のみを指し得、別の実施形態では、「復号化」は、エントロピー復号化と差分復号化との組み合わせを指し得る。「復号化プロセス」という語句が、具体的に動作のサブセットを指すか、又は概してより広い復号化プロセスを指すことが意図され得るかは、特定の説明の文脈に基づいて明らかであり、当業者によって十分に理解されると考えられる。
様々な実装形態は、符号化を伴う。「復号化」に関する上記の考察と同様の方法で、本出願で使用されるとき、「符号化」は、例えば、符号化されたビットストリームを生成するために、入力点群フレーム上で実施されるプロセスの全て又は一部を包含し得る。様々な実施形態では、そのようなプロセスには、典型的には、画像ベースのデコーダによって実施されるプロセスのうちの1つ以上が含まれる。様々な実施形態では、そのようなプロセスにはまた、若しくは代替的に、本出願に記載される様々な実装形態のエンコーダによって実施されるプロセスも含まれる。
更なる例として、一実施形態では、「符号化」は、エントロピー符号化のみを指し得、別の実施形態では、「符号化」は、差分符号化のみを指し得、別の実施形態では、「符号化」は、差動符号化とエントロピー符号化との組み合わせを指し得る。「符号化プロセス」という語句が、具体的に動作のサブセットを指すか、又は概してより広い符号化プロセスに指すことが意図され得るかは、特定の説明の文脈に基づいて明らかであり、当業者によって十分に理解されると考えられる。
本明細書で使用されるとき、シンタックス要素は、説明的な用語であることに留意されたい。したがって、それらは他のシンタックス要素名の使用を排除しない。
様々な実施形態は、速度歪み最適化を指す。特に、符号化プロセス中に、速度と歪みとの間の均衡又はトレードオフは、通常、算定の複雑さの制約を与えることが多いと考えられる。速度歪み最適化は、通常、速度及び歪みの加重和である速度歪み関数を最小化するように定式化され得る。速度歪み最適化問題を解決するための異なるアプローチがある。例えば、そのアプローチは、全ての検討されるモード又はコード化パラメータ値を含む、全ての符号化選択肢の広範な試験に基づき得、それらのコード化コストと、コード化及び復号化後の再構築された信号の関連する歪みと、を完全に評価する。また、より速いアプローチを使用して、特に、再構築された信号ではなく、予測又は予測残留信号に基づいた近似歪みの算定用いて、符号化の複雑さを軽減し得る。また、これら2つのアプローチの混合が、可能性のある符号化選択肢のいくつかのみの近似歪み、及び他の符号化選択肢の完全な歪みを使用することなどによって、使用され得る。他のアプローチは、可能性のある符号化選択肢のサブセットのみを評価する。より一般的には、多くのアプローチは、最適化を実施するための様々な技術のうちのいずれかを用いるが、最適化は、必ずしもコード化コストと関連する歪みの両方の完全な評価であるとは限らない。
追加的に、本出願は、様々な情報を「判定すること」を指し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上が含み得る。
更に、本出願は、様々な情報に「アクセスすること」を指し得る。情報にアクセスすることには、例えば、情報を受信すること、情報を(例えば、メモリから)取り出すこと、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上が含まれ得る。
追加的に、本出願は、様々な情報を「受信すること」を指し得る。受信することは、「アクセスすること」と同様に、広範な用語であることを意図している。情報を受信することには、例えば、情報にアクセスすること、又は情報を(例えば、メモリから)取り出すことのうちの1つ以上が含まれ得る。更に、「受信すること」は、典型的には、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することなどの動作中に、何らかの形で、関与される。
また、本明細書で使用するとき、「信号伝達する」という単語は、とりわけ、対応するデコーダに何かを示すことを指す。例えば、ある実施形態では、エンコーダは、シンタックス要素vpcc_eom_patch_separate_video_present_flagによって搬送され得る特定の情報INFを信号伝達する。このようにして、実施形態では、エンコーダ側とデコーダ側の両方で、同じパラメータが使用され得る。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用し得るように、特定のパラメータをデコーダに送信(明示的に信号伝達)し得る。逆に、デコーダが既に特定のパラメータ並びに他のパラメータを有する場合、信号伝達は、デコーダが特定のパラメータを知ること及び選択することを単純に可能にするために、送信(暗黙的に信号伝達)することなく、使用され得る。任意の実際の機能の送信を回避することにより、様々な実施形態でビット節約が実現される。信号伝達は、様々な方法で達成され得ることを理解されたい。例えば、様々な実施形態では、1つ以上のシンタックス要素、フラグなどを使用して、情報を、対応するデコーダに信号伝達する。前述は、「信号伝達する」という単語の動詞形に関するものであるが、「信号」という語はまた、本明細書において名詞として使用され得る。
複数の実装形態が説明されてきた。それにもかかわらず、様々な変更が行われ得ることが理解されるであろう。例えば、異なる実装形態の要素は、組み合わされ、補足され、修正され、又は他の実装形態を生成するために削除され得る。追加的に、当業者であれば、他の構造及びプロセスが、開示されたものに置き換えられ得、結果として生じる実装形態が、少なくとも実質的に同じ機能を、少なくとも実質的に同じ方法で実施して、開示された実装形態と少なくとも実質的に同じ結果を達成することを理解するであろう。したがって、これら及び他の実装形態は、本出願によって企図される。

Claims (15)

  1. 点群の第1の3Dサンプルの少なくとも1つの属性を符号化することであって、前記第1の3Dサンプルの前記少なくとも1つの属性、2Dサンプルの少なくとも1つの第1の属性パッチとして符号化され、前記第1の3Dサンプルの3D座標は、幾何学的形状画像のパッチの画素値として符号化される、ことと、
    中間3Dサンプルの少なくとも1つの属性を符号化することであって、前記中間3Dサンプルは、同じ投影線に沿った前記点群の2つの直交投影された3Dサンプルの間に位置する前記点群の3Dサンプルであり、前記中間3Dサンプルの少なくとも1つの属性、2Dサンプルの少なくとも1つの第2の属性パッチとして符号化されことと、
    記2Dサンプルの少なくとも1つの第1の属性パッチ及び前記2Dサンプルの少なくとも1つの第2の属性パッチが、別々の画像に格納されているかどうかを示す情報を符号化すること
    を含
    前記情報は、
    前記2Dサンプルの少なくとも1つの第1の属性パッチが、第1の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第1の属性パッチが、2Dサンプルの他の属性パッチと共に第2の画像に格納されているかどうかを示す第1のフラグと、
    前記2Dサンプルの少なくとも1つの第2の属性パッチが、第3の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第2の属性パッチが、2Dサンプルの他の属性パッチと共に前記第2の画像に格納されているかどうかを示す第2のフラグと、を含む、方法。
  2. 前記方法は、別個の画像がどのように圧縮されるかを示す別の情報を符号化することを更に含む、請求項1に記載の方法。
  3. 点群の第1の3Dサンプルの少なくとも1つの属性を復号化することであって、前記第1の3Dサンプルの前記少なくとも1つの属性が、2Dサンプルの少なくとも1つの第1の属性パッチから復号化され、前記第1の3Dサンプルの3D座標は、幾何学的形状画像のパッチの画素値から復号化される、ことと、
    中間3Dサンプルの少なくとも1つの属性を復号化することであって、前記中間3Dサンプルは、同じ投影線に沿った前記点群の2つの直交投影された3Dサンプルの間に位置する前記点群の3Dサンプルであり、前記中間3Dサンプルの少なくとも1つの属性、2Dサンプルの少なくとも1つの第2の属性パッチとして復号化される、ことと
    記2Dサンプルの少なくとも1つの第1の属性パッチ及び前記2Dサンプルの少なくとも1つの第2の属性パッチが、別個の画像に格納されているかどうかを示す情報を復号化することと
    を含
    前記情報は、
    前記2Dサンプルの少なくとも1つの第1の属性パッチが、第1の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第1の属性パッチが、2Dサンプルの他の属性パッチと共に第2の画像に格納されているかどうかを示す第1のフラグと、
    前記2Dサンプルの少なくとも1つの第2の属性パッチが、第3の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第2の属性パッチが、2Dサンプルの他の属性パッチと共に前記第2の画像に格納されているかどうかを示す第2のフラグと、を含む、方法。
  4. 前記3Dサンプルの前記少なくとも1つの属性、前記中間3Dサンプルの少なくとも1つの属性、及び前記情報が、ピクチャレベル、フレームレベル、及びパッチレベルのグループで階層的に構成されているビデオストリームから復号化されており、前記情報は、ピクチャレベル、フレームレベル、アトラスレベル、又はパッチレベルのグループのいずれかで有効である、請求項に記載の方法。
  5. 前記方法は、別個の画像がどのように圧縮されるかを示す別の情報を復号化することを更に含む、請求項3又は4に記載の方法。
  6. 点群の第1の3Dサンプルの少なくとも1つの属性を符号化することであって、前記第1の3Dサンプルの前記少なくとも1つの属性、2Dサンプルの少なくとも1つの第1の属性パッチとして符号化され、前記第1の3Dサンプルの3D座標は、幾何学的形状画像のパッチの画素値として符号化される、ことと、
    中間3Dサンプルの少なくとも1つの属性を符号化することであって、前記中間3Dサンプルは、同じ投影線に沿った前記点群の2つの直交投影された3Dサンプルの間に位置する前記点群の3Dサンプルであり、前記中間3Dサンプルの少なくとも1つの属性、2Dサンプルの少なくとも1つの第2の属性パッチとして符号化される、ことと
    記2Dサンプルの少なくとも1つの第1の属性パッチ及び前記2Dサンプルの少なくとも1つの第2の属性パッチが、別個の画像に格納されているかどうかを示す情報を符号化することと、
    を行うように構成された1つ又は複数のプロセッサを備える装置であって
    前記情報は、
    前記2Dサンプルの少なくとも1つの第1の属性パッチが、第1の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第1の属性パッチが、2Dサンプルの他の属性パッチと共に第2の画像に格納されているかどうかを示す第1のフラグと、
    前記2Dサンプルの少なくとも1つの第2の属性パッチが、第3の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第2の属性パッチが、2Dサンプルの他の属性パッチと共に前記第2の画像に格納されているかどうかを示す第2のフラグと、を含む、装置。
  7. 点群の第1の3Dサンプルの少なくとも1つの属性を復号化することであって、前記第1の3Dサンプルの前記少なくとも1つの属性、2Dサンプルの少なくとも1つの第1の属性パッチから復号化され、前記第1の3Dサンプルの3D座標は、幾何学的形状画像のパッチの画素値から復号化される、ことと、
    中間3Dサンプルの少なくとも1つの属性を復号化することであって、前記中間3Dサンプルは、同じ投影線に沿った前記点群の2つの直交投影された3Dサンプルの間に位置する前記点群の3Dサンプルであり、前記中間3Dサンプルの少なくとも1つの属性、2Dサンプルの少なくとも1つの第2の属性パッチとして復号化される、ことと
    記2Dサンプルの少なくとも1つの第1の属性パッチ及び前記2Dサンプルの少なくとも1つの第2の属性パッチが、別個の画像に格納されているかどうかを示す情報を復号化することと
    を行うように構成された1つ又は複数のプロセッサを備える装置であって、
    前記情報は、
    前記2Dサンプルの少なくとも1つの第1の属性パッチが、第1の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第1の属性パッチが、2Dサンプルの他の属性パッチと共に第2の画像に格納されているかどうかを示す第1のフラグと、
    前記2Dサンプルの少なくとも1つの第2の属性パッチが、第3の画像に格納されているかどうか、又は前記2Dサンプルの少なくとも1つの第2の属性パッチが、2Dサンプルの他の属性パッチと共に前記第2の画像に格納されているかどうかを示す第2のフラグと、を含む、装置。
  8. 前記3Dサンプルの前記少なくとも1つの属性、前記中間3Dサンプルの少なくとも1つの属性、及び前記情報が、ピクチャレベル、フレームレベル、及びパッチレベルのグループで階層的に構成されているビデオストリームから復号化されており、前記情報は、ピクチャレベル、フレームレベル、アトラスレベル、又はパッチレベルのグループのいずれかで有効である、請求項7に記載の装置。
  9. 前記1つ又は複数のプロセッサは、別個の画像がどのように圧縮されるかを示す別の情報を符号化又は復号化するように更に構成されている、請求項のいずれか一項に記載の装置。
  10. 命令を含むコンピュータプログラムであって、前記命令は、前記プログラムが1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに、請求項1又は3に記載の方法を遂行させる、コンピュータプログラム。
  11. 1つ以上のプロセッサに、請求項1又は3に記載の方法を実施させるための命令を含む、非一時的なコンピュータ可読媒体。
  12. 前記中間3Dサンプルの3D座標は、中間3Dサンプルが投影される投影面上の画素の座標として、及び占有率画像に格納されるコードワードとして符号化又は復号化され、コードワードの1ビットは、前記投影線に沿った中間3Dサンプルの位置を示し、
    前記直交投影された3Dサンプルの3D座標は、前記直交投影された3Dサンプルが投影される前記投影面上の画素の座標として、及び前記画素の値として符号化される、請求項1又は3に記載の方法。
  13. コードワードは、占有率マップに格納された2Dサンプルの少なくとも1つの第2の幾何学的形状パッチを形成するようにパックされる、請求項12に記載の方法。
  14. 前記中間3Dサンプルの3D座標は、中間3Dサンプルが投影される投影面上の画素の座標として、及び占有率画像に格納されるコードワードとして符号化又は復号化され、コードワードの1ビットは、前記投影線に沿った中間3Dサンプルの位置を示し、
    前記直交投影された3Dサンプルの3D座標は、前記直交投影された3Dサンプルが投影される前記投影面上の画素の座標として、及び前記画素の値として符号化される、請求項6又は7に記載の装置。
  15. コードワードは、占有率マップに格納された2Dサンプルの少なくとも1つの第2の幾何学的形状パッチを形成するようにパックされる、請求項14に記載の装置。
JP2022517977A 2019-09-24 2020-09-15 中間サンプルのパッチを使用する点群の符号化及び復号化 Active JP7541576B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19306190.0 2019-09-24
EP19306190 2019-09-24
PCT/EP2020/075680 WO2021058315A1 (en) 2019-09-24 2020-09-15 Encoding and decoding a point cloud using patches for in-between samples

Publications (2)

Publication Number Publication Date
JP2022549246A JP2022549246A (ja) 2022-11-24
JP7541576B2 true JP7541576B2 (ja) 2024-08-28

Family

ID=68242614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022517977A Active JP7541576B2 (ja) 2019-09-24 2020-09-15 中間サンプルのパッチを使用する点群の符号化及び復号化

Country Status (8)

Country Link
US (2) US11895301B2 (ja)
EP (1) EP4035375A1 (ja)
JP (1) JP7541576B2 (ja)
KR (1) KR20220062556A (ja)
CN (1) CN114503579A (ja)
AU (1) AU2020354341A1 (ja)
MX (1) MX2022003201A (ja)
WO (1) WO2021058315A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4022572A1 (en) * 2019-08-29 2022-07-06 InterDigital VC Holdings France, SAS Transporting format of a coded point cloud
US11924434B2 (en) * 2021-09-07 2024-03-05 Tencent America LLC 2D atlas adaptive sampling in 3D mesh compression

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190087979A1 (en) 2017-09-18 2019-03-21 Apple Inc. Point cloud compression
US20190122393A1 (en) 2017-10-21 2019-04-25 Samsung Electronics Co., Ltd Point cloud compression using hybrid transforms

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019115867A1 (en) * 2017-12-14 2019-06-20 Nokia Technologies Oy An apparatus, a method and a computer program for volumetric video
US11010955B2 (en) * 2018-06-27 2021-05-18 Sony Group Corporation Point cloud mapping
US10650554B2 (en) * 2018-09-27 2020-05-12 Sony Corporation Packing strategy signaling
US10735766B2 (en) * 2018-12-17 2020-08-04 Sony Corporation Point cloud auxiliary information coding
US11190803B2 (en) * 2019-01-18 2021-11-30 Sony Group Corporation Point cloud coding using homography transform
US11334969B2 (en) * 2019-03-19 2022-05-17 Sony Group Corporation Point cloud geometry padding
US11908169B2 (en) * 2020-10-01 2024-02-20 Sony Group Corporation Dense mesh compression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190087979A1 (en) 2017-09-18 2019-03-21 Apple Inc. Point cloud compression
US20190122393A1 (en) 2017-10-21 2019-04-25 Samsung Electronics Co., Ltd Point cloud compression using hybrid transforms

Also Published As

Publication number Publication date
US20240114143A1 (en) 2024-04-04
US20220345709A1 (en) 2022-10-27
CN114503579A (zh) 2022-05-13
JP2022549246A (ja) 2022-11-24
KR20220062556A (ko) 2022-05-17
MX2022003201A (es) 2022-06-08
EP4035375A1 (en) 2022-08-03
AU2020354341A1 (en) 2022-04-07
US11895301B2 (en) 2024-02-06
WO2021058315A1 (en) 2021-04-01

Similar Documents

Publication Publication Date Title
JP7476104B2 (ja) 点群処理
CN111630571A (zh) 处理点云
US20240114143A1 (en) Encoding and decoding a point cloud using patches for in-between samples
JP7541025B2 (ja) 点群の欠落した点の処理
WO2021001193A1 (en) Processing a point cloud
JP7541024B2 (ja) ポイントクラウドの処理
US20220385928A1 (en) Processing a point cloud
US12094177B2 (en) Processing a point cloud
CN113475093B (zh) 用于处理点云的方法和装置
US12106526B2 (en) Processing a point cloud
WO2021048050A1 (en) Processing a point cloud
US20220405975A1 (en) Transporting format of a coded point cloud

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220519

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220624

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230823

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20231110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240816

R150 Certificate of patent or registration of utility model

Ref document number: 7541576

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150