JP7402976B2 - 点群データのためのファイルフォーマット - Google Patents

点群データのためのファイルフォーマット Download PDF

Info

Publication number
JP7402976B2
JP7402976B2 JP2022519702A JP2022519702A JP7402976B2 JP 7402976 B2 JP7402976 B2 JP 7402976B2 JP 2022519702 A JP2022519702 A JP 2022519702A JP 2022519702 A JP2022519702 A JP 2022519702A JP 7402976 B2 JP7402976 B2 JP 7402976B2
Authority
JP
Japan
Prior art keywords
point cloud
track
region
data
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022519702A
Other languages
English (en)
Other versions
JP2022550150A (ja
Inventor
チェン ファン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2022550150A publication Critical patent/JP2022550150A/ja
Application granted granted Critical
Publication of JP7402976B2 publication Critical patent/JP7402976B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/08Volume rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本特許文書は、マルチメディアデータ処理および伝送技術、および点群データ処理の方法、装置、およびシステムを対象とする。
ビデオエンコーディングは、圧縮されたビットストリーム表現にエンコードするために圧縮ツールを使用し、圧縮されたビットストリーム表現は、2次元のビデオフレームを記憶するために、またはネットワークを経由して搬送するためにより効率的である。エンコーディングのために2次元のビデオフレームを使用する従来的なビデオコーディング技法は、時として、3次元の視覚場面の視覚情報の表現に関して非効率的である。
本特許文書は、とりわけ、多次元画像に関連する視覚情報を搬送するデジタルビデオをエンコードおよびデコードするための技法を説明する。
1つの例示的側面では、点群データ処理の方法が、開示される。方法は、点群データの3D領域および3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域を決定することと、2D領域に含まれるパッチフレームデータおよび対応する点群コンポーネントトラックのビデオフレームデータから、点群データの3D領域を再構築することとを含む。
別の例示的側面では、点群データ処理の別の方法が、開示される。方法は、点群データの3D領域および3D領域に対応する点群コンポーネントトラックグループを決定することと、点群コンポーネントトラックグループ内の点群コンポーネントトラックからのビデオフレームデータおよび対応する点群トラックパッチフレームデータに基づいて、点群データの3D領域を再構築することとを含む。
別の例示的側面では、点群データ処理のための装置が、開示される。
さらに別の例示的側面では、コンピュータプログラム記憶媒体が、開示される。コンピュータプログラム記憶媒体は、その上に記憶されたコードを含む。コードは、プロセッサによって実行されると、説明される方法をプロセッサに実装させる。
これらおよび他の側面が、本書に説明される。
本発明は、例えば、以下を提供する。
(項目1)
点群データ処理の方法であって、前記方法は、
点群データの3D領域と、前記3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域とを決定することと、
前記2D領域に含まれるパッチフレームデータと、対応する点群コンポーネントトラックのビデオフレームデータとから、前記点群データの前記3D領域を再構築することと
を含む、方法。
(項目2)
前記点群データの前記3D領域と、前記3D領域の1つ以上の点が投影される前記点群トラックパッチフレームの前記2D領域とは、点群トラックサンプルエントリまたはサンプル内の要素に基づいて決定される、項目1に記載の方法。
(項目3)
特定のボックスタイプに従って前記点群トラック内のパッチデータボックスを識別することを含み、前記パッチデータボックスは、前記2D領域が前記点群データの前記3D領域を再構築するためのパッチデータを含むことを示す、項目1または項目2に記載の方法。
(項目4)
特定のボックスタイプに従って前記点群トラック内の2Dタイルデータボックスを識別することを含み、前記2Dタイルデータボックスは、前記2D領域が前記点群データの前記3D領域の2Dタイルデータを含むことを示す、項目1または項目2に記載の方法。
(項目5)
特定のボックスタイプに従って前記点群トラック内のタイルグループデータボックスを識別することを含み、前記タイルグループデータボックスは、前記2D領域が前記点群データの前記3D領域を再構築するためのタイルグループデータを含むことを示す、項目1または項目2に記載の方法。
(項目6)
前記決定することは、時間指定メタデータトラック内の要素に基づいて、前記点群データの前記3D領域を決定することを含み、前記時間指定メタデータトラックは、前記点群トラックへの特定のトラック参照を含む、項目1に記載の方法。
(項目7)
特定のサンプルエントリタイプに従って前記時間指定メタデータトラックを識別することを含み、
前記時間指定メタデータトラックは、前記2D領域が前記点群データの前記3D領域を再構築するための以下の情報:パッチデータ、2Dタイルデータ、タイルグループデータのうちの1つを含むことを示す、項目1または項目6に記載の方法。
(項目8)
点群データ処理の方法であって、前記方法は、
点群データの3D領域と、前記3D領域に対応する点群コンポーネントトラックグループとを決定することと、
前記点群コンポーネントトラックグループ内の点群コンポーネントトラックからのビデオフレームデータと、対応する点群トラックパッチフレームデータとに基づいて、前記点群データの前記3D領域を再構築することと
を含む、方法。
(項目9)
前記3D領域を決定することは、点群コンポーネントトラックのトラックグループデータボックス内の要素に基づいて、前記点群データの前記3D領域と、前記3D領域に対応する点群コンポーネントトラックグループとを決定することを含み、
前記点群コンポーネントトラックグループは、占有マップトラック、幾何学形状トラック、または属性トラックを含む、項目8に記載の方法。
(項目10)
特定のトラックグループタイプに従って前記点群コンポーネントトラック内のトラックグループデータボックスを識別することを含み、
前記トラックグループデータボックスは、前記点群コンポーネントトラックグループに対応する前記点群データの前記3D領域を示し、点群データの同じ3D領域に対応する点群データコンポーネントトラックの前記トラックグループデータボックスは、同じトラックグループ識別を有する、項目8または9に記載の方法。
(項目11)
前記特定のトラックグループタイプに従って前記点群コンポーネント2Dタイルトラック内のトラックグループデータボックスを識別することを含み、
前記トラックグループデータボックスは、前記点群コンポーネント2Dタイルトラックグループに対応する前記点群データの前記3D領域を示し、前記点群データの同じ3D領域に対応する点群コンポーネント2Dタイルトラックの前記トラックグループデータボックスは、同じトラックグループ識別を有する、項目8または9に記載の方法。
(項目12)
前記特定のトラックグループタイプに従って前記点群コンポーネントタイルグループトラック内のトラックグループデータボックスを識別することを含み、
前記トラックグループデータボックスは、前記点群コンポーネントタイルグループトラックグループに対応する前記点群データの前記3D領域を示し、前記点群データの同じ3D領域に対応する点群コンポーネントタイルグループトラックの前記トラックグループデータボックスは、同じトラックグループ識別を有する、項目8または9に記載の方法。
(項目13)
前記決定することは、
時間指定メタデータトラック内の要素に基づいて、前記点群データの前記3D領域と、前記3D領域に対応する点群コンポーネントトラックグループとを決定することを含み、
前記時間指定メタデータトラックは、前記点群コンポーネントトラックグループへの特定のトラック参照を含む、項目8に記載の方法。
(項目14)
特定のサンプルエントリタイプに従って前記時間指定メタデータトラックを識別することを含み、
前記時間指定メタデータトラックは、前記点群コンポーネントトラックグループに対応する前記点群データの前記3D領域を示す、項目8または項目13に記載の方法。
(項目15)
前記3D領域は、前記点群トラックパッチフレームの2つ以上の2D領域上に投影される点を含む、項目1-14のいずれかに記載の方法。
(項目16)
点群データの3D領域に関する情報は、3D境界ボックスパラメータを含み、前記3D境界ボックスパラメータは、前記3D領域のx、y、z座標オフセットおよび/または前記3D領域の幅、高さ、および奥行を含む、項目1-15のいずれか1項に記載の方法。
(項目17)
点群データの3D領域は、以下の情報:
点群データの標識と、
点群データの点の数と、
点群の属性の数およびタイプと
のうちの1つをさらに含む、項目1-16のいずれかに記載の方法。
(項目18)
前記点群トラックパッチフレームの前記2D領域に関する情報は、2D境界ボックスパラメータを含み、前記2D境界ボックスパラメータは、前記2D領域のx、y座標オフセットおよび/または前記2D領域の幅および高さを含む、項目1-17のいずれか1項に記載の方法。
(項目19)
点群トラックパッチフレームの2D領域は、以下の情報:
レイヤ情報と、
説明情報と、
パッチの数と、
2Dタイル情報と、
タイルグループ情報と
のうちの1つをさらに含む、項目1-18のいずれか1項に記載の方法。
(項目20)
項目1-19のうちのいずれかに規定される方法を実装するように構成されたプロセッサを備えているビデオ処理装置。
(項目21)
コンピュータ読み取り可能な媒体であって、前記コンピュータ読み取り可能な媒体は、上で説明される方法をプロセッサによって実行するためのコードを記憶している、コンピュータ読み取り可能な媒体。
図1は、3D点群データ処理の例示的方法のフローチャートである。
図2は、3D点群データ処理の例示的方法のフローチャートである。
図3は、3D点群データ処理の例示的方法のフローチャートである。
図4は、3D点群データ処理の例示的方法のフローチャートである。
図5は、3D点群データ処理の例示的方法のフローチャートである。
図6は、データ構文のある例を示す。
図7は、別の例示的データ構文を示す。
図8は、例示的ハードウェア装置のブロック図である。
節の見出しは、本書では、読みやすさを改善するためにのみ使用され、各節内の開示される実施形態および技法の範囲をその節のみに限定しない。ある特徴が、H.264/AVC(高度なビデオコーディング)およびH.265/HEVCおよびMPEG規格の例を使用して説明される。しかしながら、開示される技法の適応性は、H.264/AVCまたはH.265/HEVCシステムのみに限定されない。
本書では、点群データ処理のための種々の構文要素が、異なる節に開示される。しかしながら、別様に注記されない限り、同じ名称を伴う構文要素が、異なる節において使用される場合、同じフォーマットおよび構文を有するであろうことを理解されたい。さらに、異なる節の見出し下に説明される異なる構文要素および構造が、種々の実施形態では、一緒に組み合わせられ得る。加えて、具体的な構造が、実装の例として説明されるが、構文構造の種々のエントリの順序が変更され得ることも理解されたい。
ビデオベースの点群圧縮(VPCCまたはV-PCC)は、点群視覚情報の体積エンコーディングを表す。コード化点群シーケンス(CPCS)を含むV-PCCビットストリームは、シーケンスパラメータセット(SPS)データ、パッチ情報ビットストリーム、2Dビデオエンコード占有マップビットストリーム、2Dビデオエンコード幾何学形状ビットストリーム、およびゼロ以上の2Dビデオエンコード属性ビットストリームを搬送するVPCCユニットから構成される。
ユーザは、典型的に、点群オブジェクトを視認するために6自由度(DoF)を有する。任意の所与の時点において、ユーザの場所、視点、視野等に応じて、利用可能な点群オブジェクトの一部のみが、ユーザの各々に見えるであろう。多くの用途に関して、点群オブジェクトデータ全体が、送達され、デコードされ、レンダリングされる必要はない。点群オブジェクトの部分的なアクセスおよび送達をサポートするために、ユーザが点群オブジェクトを視認することを望むDoFおよび方向の全ての可能性を完全に対象にするための1つ以上の3D空間の小領域を識別することへのサポートが、必要である。
(V-PCC ISOBMFFコンテナの例示的構造)
V-PCC基本ストリーム内のV-PCCユニットが、それらのタイプに基づいて、ISOBMFFファイル内の個々のトラックにマップされる。マルチトラックISOBMFF V-PCCコンテナにおいて、2つのタイプのトラックがある:V-PCCトラック、およびV-PCCコンポーネントトラック。
V-PCCトラックは、V-PCCビットストリームにおける体積視覚情報を搬送するトラックであり、体積視覚情報は、パッチ情報サブビットストリームとシーケンスパラメータセットとを含む。
V-PCCコンポーネントトラックは、制限されたビデオスキームトラックであり、V-PCCビットストリームの占有マップサブビットストリーム、幾何学形状サブビットストリーム、および属性サブビットストリームのための2Dビデオエンコードデータを搬送する。
このレイアウトに基づいて、V-PCC ISOBMFFコンテナは、以下を含むものとする:
V-PCCトラック:V-PCCトラックは、(サンプルエントリ内の)シーケンスパラメータセットと、シーケンスパラメータセットV-PCCユニット(ユニットタイプVPCC_SPS)およびパッチデータ群V-PCCユニット(ユニットタイプVPCC_PDG)のペイロードを搬送するサンプルとを含む。このトラックは、ビデオ圧縮V-PCCユニット(すなわち、ユニットタイプVPCC_OVD、VPCC_GVD、およびVPCC_AVD)のペイロードを搬送する他のトラックへのトラック参照も含む。
制限されたビデオスキームトラック:サンプルが、占有マップデータのためのビデオコード基本ストリームのアクセスユニット(すなわち、タイプVPCC_OVDのV-PCCユニットのペイロード)を含む。
1つ以上の制限されたビデオスキームトラック:サンプルが、幾何学形状データのためのビデオコード基本ストリームのアクセスユニット(すなわち、タイプVPCC_GVDのV-PCCユニットのペイロード)を含む。
ゼロ以上の制限されたビデオスキームトラック:サンプルが、属性データのためのビデオコード基本ストリームのアクセスユニット(すなわち、タイプVPCC_AVDのV-PCCユニットのペイロード)を含む。
(簡潔な解説)
本願に開示される技法は、ファイルフォーマットを使用して、点群をビットストリーム表現にエンコード(およびデコード)するために使用され得、ファイルフォーマットは、ISO BMFFと互換性があり、同時に、全方向性ビデオ処理技法を可能にし、全方向性ビデオ処理技法は、異なる視点の全方向性ビデオ間の自然切り替えを実装し、それによって、ユーザの視認体験を改善する。
本発明の実施形態の技術的解決策は、全方向性ビデオトラックに関するビューグループ情報を提供し、同じ視点に属する全方向性ビデオトラックの全てが、そのビューに対応するトラックグループを構成することを示す。全方向性ビデオ視点切り替えプロセスでは、視点切り替えの前後の全方向性ビデオウィンドウコンテンツの一貫性が、確保され、異なる視点の全方向性ビデオ間の自然切り替えが、実現され、それによって、ユーザの視認体験を改善する。
一般に、開示される技法に基づく実施形態が、ビデオデータ処理のために使用され得る。いくつかの実施形態では、全方向性ビデオデータが、ISO(国際標準化機構)基本メディアファイルフォーマットに基づいて、ファイル内に記憶される。それらの中で、制限付きスキーム情報ボックス、トラック参照ボックス、およびトラックグループボックス等のISO基本メディアファイルフォーマットは、動作するためのISO/IEC JTC1/SC29/WG11動画専門家集団(MPEG)MPEG-4. Part 12 ISO基本メディアファイルフォーマットを指し得る。
ISO基本ファイルフォーマット内のデータの全てが、ボックス内にインストールされる。MP4ファイルによって表されるISO基本ファイルフォーマットは、いくつかのボックスから構成され、それらの各々は、タイプと長さとを有し、データオブジェクトと見なされることができる。ボックスは、コンテナボックスと呼ばれる、別のボックスを含むことができる。MP4ファイルは、最初に、ファイルフォーマットのマークアップとして1つのみの「ftyp」タイプのボックスを有し、そのファイルについてのある情報を含むであろう。コンテナボックス(そのサブボックスがそのメディアに関するメタデータ情報を含む)である1つのみの「MOOV」タイプのボックス(ムービーボックス)が、存在するであろう。MP4ファイルのメディアデータは、「mdat」タイプのメディアボックス(メディアデータボックス)(それは、コンテナボックスでもあり、(メディアデータが他のファイルを参照するときに)利用可能であることも、そうでないこともある)に含まれ、メディアデータの構造は、メタデータから構成される。
時間指定メタデータトラックは、ISO基本メディアファイルフォーマット(ISOBMFF)における機構であり、それは、特定のサンプルに関連付けられる時間指定メタデータを確立する。時間指定メタデータは、メディアデータとの結合が少なく、通常、「説明的」である。
本書では、従来的な2Dビデオフォーマット(MP4またはISOBMFFフォーマット等)と互換性があるフォーマットへの点群データ(MPEGのV-PCCデータ等)の3Dまたは空間領域の表現を可能にするためのいくつかの技術的解決策が、提供される。提案される解決策の1つの有利な側面は、新しい機能性の実装のために従来的な2Dビデオ技法および構文を再利用することが可能であることである。
(解決策1)
図1の例示的フローチャートに示されるように、方法は、以下のステップを含む。
ステップS110は、点群データの3D領域と3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域とを決定することを含む。
ステップS120は、2D領域に含まれるパッチフレームデータと対応する点群コンポーネントトラックのビデオフレームデータとから、点群データの3D領域を再構築することを含む。
いくつかの実施形態では、S110内の決定する動作は、3D領域内の1つ以上の点に対応する2つ以上の2D領域を使用することによって、実施され得る。
いくつかの実施形態では、点群データの空間領域(例えば、3D領域)は、以下の情報のうちの少なくとも1つを含むか、または、それらを使用して説明される。
SpatialRegionInfoStruct()は、空間領域のx、y、z座標オフセットと、その領域の幅、高さ、および奥行と、そのソース境界ボックス情報とを含む空間領域の情報を提供する。
1)点群データのx、y、z座標オフセットと、点群データの幅、高さ、および奥行とを含む点群データの3D境界ボックスパラメータ(3D空間位置)。
2)点群データの3D領域のx、y、z座標オフセットと、点群データの3D領域の幅、高さ、および奥行とを含む点群データの3D領域(または3Dブロック)パラメータ。
3)点群データの点の数。
4)点群データの標識。
5)点群の属性の数およびタイプ。
代替として、点群データの空間領域(例えば、3D領域)は、少なくとも以下の情報を含む。
1)点群データの境界ボックスのサイズを表すために使用される点群データの3D境界ボックスの幅、高さ、および奥行と、点群データの3D境界ボックスがx、y、およびz座標方向に分割される3Dブロックの数と、3Dブロックの幅、高さ、および奥行;
または、
2)点群データを含む境界球の半径を規定する点群データの3D境界球半径と、点群データの3D境界球が行、列、およびレイヤ方向に分割される3Dサブ球の数と、3Dサブ球の幅、高さ、および厚さ。
SpatialRegionInfoStruct()は、点群データの3D領域と、3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域とを含む点群データの空間領域情報を提供し、以下のように定義される。
(構文例)
aligned(8) SpatialRegionInfoStruct() {
unsigned int(16) num_points;
string label;

unsigned int(4) num_attributes;
for (i = 0; i < num_attributes; i++) {
unsigned int(4) attribute_type[i];

unsigned int(1) 3d_bounding_box_present_flag;
if(3d_bounding_box_present_flag){
3DRegionStruct();
unsigned int(1) 2d_bounding_box_update_flag;
if(2d_bounding_box_update_flag)
2DRegionStruct();


aligned(8) class 3DRegionStruct(delta_included_flag) {
unsigned int(16) region_id;
unsigned int(16) 3d_bounding_box_x;
unsigned int(16) 3d_bounding_box_y;
unsigned int(16) 3d_bounding_box_z;
if (delta_included_flag) {
unsigned int(16) 3d_bounding_box_delta_x;
unsigned int(16) 3d_bounding_box_delta_y;
unsigned int(16) 3d_bounding_box_delta_z;

else {
unsigned int(16) 3d_bounding_box_width;
unsigned int(16) 3d_bounding_box_height;
unsigned int(16) 3d_bounding_box_depth;


aligned(8) class 2DRegionStruct() {
unsigned int(16) bounding_box_top;
unsigned int(16) bounding_box_left;
unsigned int(16) bounding_box_width;
unsigned int(16) bounding_box_height;
(意味例)
number_pointsは、点群データの点の数を規定する。
lableは、点群データの標識を規定する。
number_attributesは、点群データの属性の数を規定する。
attributes_type[i]は、点群データのi番目の属性のタイプを規定する。
3d_bounding_box_present_flagは、点群データの3D境界ボックスパラメータが存在するかどうかを示す。
2d_bounding_box_update_flagは、点群データの3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域が、更新されるかどうかを示す。
region_idは、点群データの3D領域の識別を規定する。
3d_bounding_box_x、3d_bounding_box_y、および3d_bounding_box_zは、それぞれ、デカルト座標内のソース境界ボックスの3D空間部分に対応する3D領域のxオフセット、yオフセット、およびzオフセットの最小値を規定する。
delta_included_flagは、3d_bounding_box_delta_x、3d_bounding_box_height、および3d_bounding_box_delta_zが、3DRegionStruct ()内に存在するかどうかを示す。
3d_bounding_box_delta_x、3d_bounding_box_delta_y、および3d_bounding_box_delta_zは、それぞれ、デカルト座標内のソース境界ボックスの3D空間部分に対応する3D領域のxオフセット、yオフセット、およびzオフセットの最大値を規定する。
3d_bounding_box_width、3d_bounding_box_height、および3d_bounding_box_depthは、それぞれ、デカルト座標内のソース境界ボックスの3D空間部分に対応する空間領域の幅、高さ、および奥行を示す。
bounding_box_top、bounding_box_leftは、それぞれ、長方形の2D領域の上および左からパッチフレームの上縁までの距離を規定する。
bounding_box_width、bounding_box_heightは、それぞれ、パッチフレームにおける長方形の2D領域の幅および高さを規定する。
パッチフレーム、タイル、およびタイルグループの区分が、以下のように実施され得る。
V-PCCトラックからのパッチフレームが、タイルおよびタイルグループに区分され得る。
パッチフレームが、1つ以上のタイル行および1つ以上のタイル列に分割される。タイルは、パッチフレームの長方形の領域である。
タイルグループは、パッチフレームのいくつかのタイルを含む。
いくつかの実施形態では、長方形のタイルグループのみが、サポートされる。このモードでは、タイルグループは、パッチフレームの長方形の領域を集合的に形成するパッチフレームのいくつかのタイルを含む。
故に、点群トラックパッチフレームの2D領域(その上に、点群データの3D領域の1つ以上の点が投影される)が、少なくとも以下の分割原理に基づいて発生させられる。
1.点群データの3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域が、パッチフレーム上のパッチ位置に基づいて定義される。
2.点群データの3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域が、タイルに区分されるパッチフレーム上のタイル位置に基づいて定義される。
3.点群データの3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域が、タイルグループに区分されるパッチフレーム上のタイルグループ位置基づいて定義される。
対応して、点群パッチフレーム上の2D領域は、以下の情報のうちの少なくとも1つを含む。
1)2D境界ボックスのx、yオフセットと、2D境界ボックスの幅、高さとを含む2D領域位置パラメータ。
2)2D領域レイヤインデックス情報。
3)2D領域説明情報(例えば、意図)。
4)点群パッチ情報(例えば、パッチの数)。
5)点群タイル情報。
6)点群タイルグループ情報。
いくつかの実施形態では、S120における点群再構築動作が、以下のように実施され得る。
点群再構築プロセスへの入力は、以下の通りである:
-2D領域に含まれるブロックからパッチへのマッピング情報、
-公称分解能における対応する点群コンポーネントトラックのデコード幾何学形状ビデオフレーム、
-公称分解能における対応する点群コンポーネントトラックのデコード属性ビデオフレーム、
-公称分解能における対応する点群コンポーネントトラックのデコード占有マップビデオフレーム、および/または
出力順序における、フレームインデックス。
いくつかの実施形態では、上記の入力は、点群データの視覚的に正確な範囲を提供するためのアップスケーリング動作に基づき得る。
点群再構築プロセスの出力は、以下の通りである。
-3D領域に関する再構築された点群フレーム内の点のリストを保持するコンテナ、および、
-3D領域に関する再構築された点群内の点の数。
(実施形態1)
図2に示されるように、ステップS210は、点群トラックサンプルエントリまたはサンプル内の要素に基づいて決定される点群の3D領域を決定することを説明する。点群トラックのサンプルエントリおよびサンプルフォーマットが、代替実施形態と併せて下で説明される。
(V-PCCトラック)
従来的な平面状の2Dビデオ情報を記憶するビデオトラックとは異なり、V-PCCトラックは、3D体積視覚情報を記憶するための新しいタイプのトラックである。
(体積視覚トラック)
各体積視覚場面は、特有の体積視覚トラックによって表される。ISOBMFFファイルが、複数の場面を含み得、したがって、複数の体積視覚トラックが、ファイル内に存在し得る。
体積視覚トラックは、ISO/IEC 14496-12内で定義されるMediaBoxのHandlerBox内の体積視覚メディアハンドラタイプ‘volv’によって識別され得る。
(V-PCCトラックサンプルエントリ)
サンプルエントリタイプ:‘vpc1’、’vpcg’
コンテナ:SampleDescriptionBox (‘stsd’)
必須:‘vpc1’または‘vpcg’サンプルエントリが、必須である。
数量:1つ以上のサンプルエントリが、存在し得る。
V-PCCトラックは、’vpc1’または’vpcg’のサンプルエントリタイプを伴うVolumetricVisualSampleEntryを拡張する、VPCCSampleEntryを使用するべきである。
VPCC体積サンプルエントリは、ここで定義されるようなVPCCDecoderConfigurationRecordを含むVPCCConfigurationBoxを含むべきである。
aligned(8) class VPCCDecoderConfigurationRecord {
unsigned int(8) configurationVersion = 1;
sample_stream_vpcc_header header;
unsigned int(8) numOfSetupUnits;
for (i=0; i<numOfSetupUnits; i++) {
sample_stream_vpcc_unit setupUnit;


class VPCCConfigurationBox extends Box(’vpcc’) {
VPCCDecoderConfigurationRecord() VPCCConfig;
(代替実施形態1)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義されるVolumetricTileInfoBox()を使用して点群データの3D領域を再構築するためのパッチデータ、2Dタイルデータ、またはタイルグループデータを含み得る。
(構文例)
aligned(8) class VPCCSampleEntry() extends VolumetricVisualSampleEntry (’vpc1’) {
VPCCConfigurationBox config;
VPCCUnitHeaderHeaderBox unit;
VolumetricTileInfoBox();

aligned(8) class VolumetricTileInfoBox extends FullBox(’voti’,0,0) {
unsigned int(16) num_regions;
for (i = 0; i < num_regions; i++) {
SpatialRegionInfoStruct();

string region_intent[i];
unsigned int(4) layer_index[i];
unsigned int(4) mapping_type[i];

if(mapping_type[i] == 0) {
unsigned int(8) num_patches[i];
if(mapping_type[i] == 1) {
unsigned int(8) num_tiles[i];
for (j=0; j<num_tiles[i]; j++) {
unsigned int(32) tile_track_group_id[i][j];
if(mapping_type[i] == 2) {
unsigned int(8) num_tile_groups[i];
for (j=0; j<num_tile_groups[i]; j++) {
unsigned int(16) tile_group_id[i][j];


(意味例)
num_regionsは、点群データの3D領域の数を規定する。
region_intent[i]は、点群データの領域[i]の意図を規定する。
layer_index[i]は、点群データの領域[i]のレイヤインデックスを規定する。
mapping_type[i]は、点群データの領域[i]のマッピングタイプを規定する。
num_patches[i]は、点群データの領域[i]内のパッチの数を規定する。
num_tiles[i]は、点群データの領域[i]内の2Dタイルの数を規定する。
tile_track_group_id[i][j]は、点群データの領域[i]の2Dタイルトラックグループ識別のアレイを規定する。
num_tile_groups[i]は、点群データの領域[i]内のタイルグループの数を規定する。
tile_group_id[i][j]は、点群データの領域[i]のタイルグループ識別のアレイを規定する。
(代替実施形態2)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、本書で定義される3DRegionToPatchBox()を使用して点群データの3D領域を再構築するためのパッチデータを含む。
(構文例)
aligned(8) class VPCCSampleEntry() extends VolumetricVisualSampleEntry (’vpc1’) {
VPCCConfigurationBox config;
VPCCUnitHeaderHeaderBox unit;
3DRegionToPatchBox();

aligned(8) class 3DRegionToPatchBox extends FullBox(’r2pa’,0,0) {
unsigned int(16) num_regions;
for (i = 0; i < num_regions; i++) {
SpatialRegionInfoStruct();
string region_intent[i];
unsigned int(4) layer_index[i];
unsigned int(8) num_patches[i];

(意味例)
num_regionsは、点群データの3D領域の数を規定する。
region_intent[i]は、点群データの領域[i]の意図を規定する。
layer_index[i]は、点群データの領域[i]のレイヤインデックスを規定する。
num_patches[i]は、点群データの領域[i]内のパッチの数を規定する。
(代替実施形態3)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義される3DRegionTo2DTileBox()を使用して点群データの3D領域を再構築するための2Dタイルデータを含む。
(構文例)
aligned(8) class VPCCSampleEntry() extends VolumetricVisualSampleEntry (’vpc1’) {
VPCCConfigurationBox config;
VPCCUnitHeaderHeaderBox unit;
3DRegionTo2DTileBox();

aligned(8) class 3DRegionTo2DTileBox extends FullBox(’r2ti’,0,0) {
unsigned int(16) num_regions;
for (i = 0; i < num_regions; i++) {
SpatialRegionInfoStruct();
string region_intent[i];
unsigned int(4) layer_index[i];
unsigned int(8) num_tiles[i];
for (j=0; j<num_tiles[i]; j++) {
unsigned int(16) tile_track_group_id[i][j];


(意味例)
num_regionsは、点群データの3D領域の数を規定する。
region_intent[i]は、点群データの領域[i]の意図を規定する。
layer_index[i]は、点群データの領域[i]のレイヤインデックスを規定する。
num_tiles[i]は、点群データの領域[i]内の2Dタイルの数を規定する。
tile_track_group_id[i][j]は、点群データの領域[i]の2Dタイルトラックグループ識別のアレイを規定する。
(代替実施形態4)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義される3DRegionToPatchTileGroupBox()を使用して点群データの3D領域を再構築するためのタイルグループデータを含む。
(構文例)
aligned(8) class VPCCSampleEntry() extends VolumetricVisualSampleEntry (’vpc1’) {
VPCCConfigurationBox config;
VPCCUnitHeaderHeaderBox unit;
3DRegionToPatchTileGroupBox ();

aligned(8) class 3DRegionToPatchTileGroupBox extends FullBox(’rptg’,0,0) {
unsigned int(16) num_regions;
for (i = 0; i < num_regions; i++) {
SpatialRegionInfoStruct();
string region_intent[i];
unsigned int(4) layer_index[i];
unsigned int(8) num_tile_groups[i];
for (j=0; j<num_tile_groups[i]; j++) {
unsigned int(16) tile_group_id[i][j];


(意味例)
num_regionsは、点群データの3D領域の数を規定する。
region_intent[i]は、点群データの領域[i]の意図を規定する。
layer_index[i]は、点群データの領域[i]のレイヤインデックスを規定する。
num_tile_groups[i]は、点群データの領域[i]内のタイルグループの数を規定する。
tile_group_id[i][j]は、点群データの領域[i]のタイルグループ識別のアレイを規定する。
(V-PCCトラックサンプルフォーマット)
V-PCCトラック内の各パッチサンプルは、単一の点群フレームに対応する。各コンポーネントビデオトラック内のフレームに対応するサンプルは、V-PCCトラックパッチサンプルと同じ合成時間を有するべきである。各V-PCCパッチサンプルは、1つ以上のパッチシーケンスユニットペイロードを含み得るVPCC_PDGタイプの1つのみのV-PCCユニットペイロードを含むべきである。
(代替実施形態1)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義されるVolumetricTileInfoBox()を使用して、点群データの3D領域を再構築するためのパッチデータ、2Dタイルデータ、またはタイルグループデータを含み得る。
(構文例)
aligned(8) class VPCCSample

unsigned int VPCCLength = sample_size;
for (i=0; i< VPCCLength; ) {
sample_stream_vpcc_unit unit;
i += (ssvh_unit_size_precision_bytes_minus1 + 1) +
unit.ssvu_vpcc_unit_size;

VolumetricTileInfoBox();
(意味例)
vpcc_unit_payload_sizeは、vpcc_unit_payload()に関するバイト数を提供する。
vpcc_unit_payload()は、タイプVPCC_PDGのV-PCCユニットのペイロードであり、1つのpatch_data_group()事例を含むものとする。
(代替実施形態2)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義される3DRegionToPatchBox()を使用して点群データの3D領域を再構築するためのパッチデータを含む。
(構文例)
aligned(8) class VPCCSample

unsigned int VPCCLength = sample_size;
for (i=0; i< VPCCLength; ) {
sample_stream_vpcc_unit unit;
i += (ssvh_unit_size_precision_bytes_minus1 + 1) +
unit.ssvu_vpcc_unit_size;

3DRegionToPatchBox();
(代替実施形態3)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義される3DRegionTo2DTileBox()を使用して点群データの3D領域を再構築するための2Dタイルデータを含む。
(構文例)
aligned(8) class VPCCSample

unsigned int VPCCLength = sample_size;
for (i=0; i< VPCCLength; ) {
sample_stream_vpcc_unit unit;
i += (ssvh_unit_size_precision_bytes_minus1 + 1) +
unit.ssvu_vpcc_unit_size;

3DRegionTo2DTileBox();
(代替実施形態4)
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義される3DRegionToPatchTileGroupBox()を使用して点群データの3D領域を再構築するためのタイルグループデータを含む。
(構文例)
aligned(8) class VPCCSample

unsigned int VPCCLength = sample_size;
for (i=0; i< VPCCLength; ) {
sample_stream_vpcc_unit unit;
i += (ssvh_unit_size_precision_bytes_minus1 + 1) +
unit.ssvu_vpcc_unit_size;

3DRegionToPatchTileGroupBox();
(実施形態2)
図3に示されるように、ステップS310は、時間指定メタデータトラック内の要素に基づいて、点群データの3D領域を決定することを説明し、時間指定メタデータトラックは、点群トラックへの特定のトラック参照を含む。時間指定メタデータトラックは、代替実施形態と併せて下で説明される。
(V-PCC時間指定メタデータトラック)
V-PCC空間領域の時間指定メタデータトラックは、経時的に動的に変化する点群データの対応する空間領域情報を示す、’cdsc’トラック参照タイプのTrackReferenceBoxを利用することによって、それぞれのV-PCCトラックにリンクされる。
V-PCC時間指定メタデータトラックのサンプルエントリおよびそのサンプルフォーマットは、以下のように定義される。
点群データの3D領域は、点群トラックパッチフレームの1つ以上の2D領域に関連付けられており、点群トラックパッチフレームは、以下のように定義されるVolumetricTileInfoBox()を使用して点群データの3D領域を再構築するためのパッチデータ、2Dタイルデータ、またはタイルグループデータを含み得る。
(構文例)
class VPCCSpatialRegionSampleEntry extends MetaDataSampleEntry(’pcsr’) {
VolumetricTileInfoBox();

aligned(8) VPCCSpatialRegionSample() {
VolumetricTileInfoBox();
(解決策2)
この例は、点群データ処理方法を提供する。図4に示されるように、方法は、以下のステップを含む。
ステップS410は、点群データの3D領域と、3D領域に対応する点群コンポーネントトラックグループとを決定することを含む。
ステップS420は、点群コンポーネントトラックグループ内の点群コンポーネントトラックからのビデオフレームデータと、対応する点群トラックパッチフレームデータとに基づいて、点群データの3D領域を再構築することを含む。
いくつかの実施形態では、点群データの空間領域(例えば、3D領域)は、解決策1(段落[0042]以下参照)に関して既に説明されたフォーマットに類似するフォーマットを含むか、または、それを使用して説明される。
いくつかの実施形態では、S420における点群再構築動作が、以下のように実施され得る。
点群再構築プロセスへの入力は、以下の通りである:
-公称分解能における点群コンポーネントトラックグループ内の点群コンポーネントトラックからのデコード幾何学形状ビデオフレーム、
-公称分解能における点群コンポーネントトラックグループ内の点群コンポーネントトラックからのデコード属性ビデオフレーム、
-公称分解能における点群コンポーネントトラックグループ内の点群コンポーネントトラックからのデコード占有マップビデオフレーム、
-対応する点群トラックのブロックからパッチへのマッピング情報、および/または、
-出力順序における、フレームインデックス。
いくつかの実施形態では、アップスケーリングが、ビデオおよび他のパラメータと点群データとの間の正確なマッピングを提供するために、上記の入力に適用され得る。
点群再構築プロセスの出力は、以下の通りである:
-3D領域に関する再構築された点群フレーム内の点のリストを保持するコンテナ、および
-3D領域に関する再構築された点群内の点の数。
(実施形態3)
図5に示されるように、ステップS510は、点群コンポーネントトラックのトラックグループデータボックス内の要素に基づいて、点群データの3D領域および3D領域に対応する点群コンポーネントトラックグループを決定することを説明し、点群コンポーネントトラックグループは、占有マップトラック、幾何学形状トラック、または属性トラックを含む。
(ビデオエンコードV-PCCコンポーネントトラック)
プレーヤ側において点群を再構築することなく属性トラック、幾何学形状トラック、または占有マップトラックからのデコードフレームを表示することが意義がないこともあるので、制限されたビデオスキームタイプが、これらのビデオコードトラックのために定義される。
V-PCCコンポーネントビデオトラックは、制限されたビデオとしてファイル内に表され、それらの制限されたビデオサンプルエントリのRestrictedSchemeInfoBoxのSchemeTypeBoxのscheme_typeフィールド内の’pccv’によって識別され得る。
V-PCCコンポーネントビデオトラック内に、VPCCUnitHeaderBoxを含むSchemeInformationBoxが、存在するべきである。
V-PCCコンポーネントビデオトラックは、少なくとも、2Dビデオエンコード占有マップトラックと、2Dビデオエンコード幾何学形状トラックと、ゼロ以上の2Dビデオエンコード属性トラックとを含む。
(代替実施形態1)
点群データの同じ空間領域に対応するV-PCCコンポーネントトラック(占有マップトラック、幾何学形状トラック、および属性トラック)の全てが、VPCCTrackGroupBox(‘pctg’)の具体的なタイプをコンポーネントトラックの全てに追加することによって、ISO/IEC 14496-12のトラックグループ化ツールを使用して、一緒にグループ化され得る。V-PCCコンポーネントビデオトラック内のVPCCTrackGroupBoxが、随意の実装と併せて下で説明される。
VPCCTrackGroupBox
ボックスタイプ: ’pctg’
コンテナ: TrackBox
必須: いいえ
数量: ゼロまたは1
’pctg’に等しいtrack_group_typeを伴うTrackGroupTypeBoxは、V-PCCコンポーネントトラックグループを示す、VPCCTrackGroupBoxである。
’pctg’に等しいtrack_group_typeを伴うTrackGroupTypeBox内のtrack_group_idの同じ値を有するV-PCCコンポーネントトラックは、3D空間関係を伴う同じトラックグループに属する(例えば、点群データの同じ3D領域に対応する)。’pctg’に等しいtrack_group_typeを伴うtrack_group_type内のtrack_group_idは、点群データの空間領域の識別子として使用され得る。
同じ空間領域に対応するV-PCCコンポーネントトラックは、track_group_type ’pctg’のためのtrack_group_idの同じ値を有し、1つの空間領域からのトラックのtrack_group_idは、任意の他の空間領域からのトラックのtrack_group_idと異なる。
(構文例)
aligned(8) class VPCCTrackGroupBox extends TrackGroupTypeBox(’pctg’) {
SpatialRegionInfoStruct();
V-PCCコンポーネントビデオトラックは、’pctg’に等しいtrack_group_typeを伴うTrackGroupTypeBox、すなわち、VPCCTrackGroupBoxを含み得、VPCCTrackGroupBoxを含むV-PCCコンポーネントビデオトラックに関する随意の実施形態が、下で説明される。
図6は、ある実施形態による、V-PCCコンポーネントトラック内のVPCCTrackGroupBoxの概略図である。
図6に示されるように、点群データファイルは、1つの占有マップコンポーネントビデオトラックと、1つの幾何学形状コンポーネントビデオトラックと、ゼロ以上の属性コンポーネントビデオトラックとを含む。異なるV-PCCコンポーネントビデオトラックは、’pctg’に等しいtrack_group_typeを伴うTrackGroupTypeBox、すなわち、VPCCTrackGroupBoxを含み、V-PCC占有マップ、幾何学形状、および属性コンポーネントビデオトラックが、点群データの同じ空間領域(例えば、点群の3D領域)に対応するV-PCCコンポーネントトラックグループを形成することを示す、同じtrack_group_id値を有する。
(代替実施形態2)
点群データの同じ空間領域に対応するV-PCCコンポーネント2Dタイルトラック(占有マップ2Dタイルトラック、幾何学形状2Dタイルトラック、および属性2Dタイルトラック)の全てが、具体的なタイプのVPCC2DTileGroupBox(‘pcti’)をコンポーネント2Dタイルトラックの全てに追加することによって、ISO/IEC 14496-12のトラックグループ化ツールを使用して、一緒にグループ化され得る。V-PCCコンポーネントビデオトラック内のVPCC2DtileGroupBoxが、随意の実装と併せて下で説明される。
VPCC2DTileGroupBox
ボックスタイプ: ’pcti’
コンテナ: TrackBox
必須: いいえ
数量: ゼロまたは1
’pcti’に等しいtrack_group_typeを伴うTrackGroupTypeBoxは、V-PCCコンポーネント2Dタイルトラックグループを示すVPCC2DTileGroupBoxである。
’pcti’に等しいtrack_group_typeを伴うTrackGroupTypeBox内のtrack_group_idの同じ値を有するV-PCCコンポーネント2Dタイルトラックは、3D空間関係を伴う同じトラックグループに属する(例えば、点群データの同じ3D領域に対応する)。’pcti’に等しいtrack_group_typeを伴うTrackGroupTypeBox内のtrack_group_idは、点群データの空間領域の識別子として使用され得る。
同じ空間領域に対応するV-PCCコンポーネント2Dタイルトラックは、track_group_type ’pcti’のためのtrack_group_idの同じ値を有し、1つの空間領域からのトラックのtrack_group_idは、任意の他の空間領域からのトラックのtrack_group_idと異なる。
(構文例)
aligned(8) class VPCC2DTileGroupBox extends TrackGroupTypeBox(’pcti’) {
SpatialRegionInfoStruct();
(代替実施形態3)
同じ点群3D領域に対応する全ての点群コンポーネント(幾何学形状コンポーネント、占有グラフコンポーネント、属性コンポーネント)内の点群コンポーネントタイルグループトラックは、3D領域に関する点群コンポーネントタイルグループトラックグループ内の具体的なタイプのトラックグループデータボックス(トラックグループボックス)から構成されることができる。以下は、随意の実装との組み合わせにおける点群コンポーネントタイルグループトラック内の点群コンポーネントタイルグループデータボックスを説明する。
点群データの同じ空間領域に対応するV-PCCコンポーネントタイルグループトラック(占有マップタイルグループトラック、幾何学形状タイルグループトラック、および属性タイルグループトラック)の全てが、具体的なタイプのVPCCTileGroupBox(‘ptgg’)をコンポーネント2Dタイルトラックの全てに追加することによって、ISO/IEC 14496-12のトラックグループ化ツールを使用して、一緒にグループ化され得る。V-PCCコンポーネントビデオトラック内のVPCCTileGroupBoxが、随意の実装と併せて下で説明される。
VPCCTileGroupBox
ボックスタイプ: ’ptgg’
コンテナ: TrackBox
必須: いいえ
数量: ゼロまたは1
そのトラックグループタイプ(track_group_type)が’ptgg’に等しいトラックグループタイプデータボックス(TrackGroupTypeBox)は、点群コンポーネント内の点群コンポーネントタイルグループトラックグループを示す点群コンポーネントタイルグループのグループデータボックスである。同じトラックグループ識別子(track_group_id)値を有する点群コンポーネントタイルグループのグループデータボックスの点群コンポーネントの全てが、空間領域関係(例えば、同じ点群に対応する3D領域)を有するトラックグループに属する。点群コンポーネント群のグループデータボックスのトラックグループ識別子は、点群空間エリア識別子(region_id)として使用されることもでき、異なる点群空間エリアに対応するトラックグループ識別子の値は、異なるべきである。
’ptgg’に等しいtrack_group_typeを伴うTrackGroupTypeBoxは、V-PCCコンポーネントタイルグループトラックグループを示すVPCCTileGroupBoxである。
’ptgg’に等しいtrack_group_typeを伴うTrackGroupTypeBox内のtrack_group_idの同じ値を有するV-PCCコンポーネントタイルグループトラックは、3D空間関係を伴う同じトラックグループに属する(例えば、点群データの同じ3D領域に対応する)。’ptgg’に等しいtrack_group_typeを伴うTrackGroupTypeBox内のtrack_group_idは、点群データの空間領域の識別子として使用され得る。
同じ空間領域に対応するV-PCCコンポーネントタイルグループトラックは、track_group_type ’ptgg’のためのtrack_group_idの値を有し、1つの空間領域からのトラックのtrack_group_idは、任意の他の空間領域からのトラックのtrack_group_idと異なる。
(構文例)
aligned(8) class PCCTileGroupBox extends TrackGroupTypeBox(’ptgg’) {
SpatialRegionInfoStruct();
unsigned int(16) tile_group_id;
(意味例)
tile_group_idは、V-PCCコンポーネントタイルグループトラックグループのタイルグループ識別を規定する。
(実施形態4)
(V-PCC時間指定メタデータトラック)
V-PCC空間領域の時間指定メタデータトラックは、経時的に動的に変化する、点群データの対応する空間領域情報を示す’cdsc’トラック参照タイプのTrackReferenceBoxを利用することによって、それぞれのV-PCCコンポーネントトラックグループにリンクされる。
V-PCCコンポーネントトラックグループのtrack_group_id値への‘cdsc’トラック参照を含むV-PCC空間領域の時間指定メタデータトラックは、個々に、トラックグループ内の各V-PCCコンポーネントトラックを説明する。
V-PCC時間指定メタデータトラックのサンプルエントリおよびそのサンプルフォーマットが、以下のように定義される。
(構文例)
class VPCCSpatialRegionSampleEntry extends MetaDataSampleEntry(’pcsr’) {
SpatialRegionInfoStruct();

aligned(8) VPCCSpatialRegionSample() {
SpatialRegionStruct();
図6は、ビデオサンプルがメディアデータとして配置される、ある例示的ファイルフォーマットを示す。ビデオサンプルは、トラック(trakとして示される)に従って並べられる。トラックの一例は、トラックグループエントリおよび特定のトラックグループタイプ(pctg)に基づいて識別される点群データの幾何学形状トラックを含む。示されるトラックの別の例は、点群データの属性トラックである。トラックの第3の例は、点群データの占有マップトラックである。占有マップは、例えば、3D領域内の種々の点のマッピングを対応する1つ以上の2D領域に提供するデータを含む。
図7は、本発明のある実施形態による、V-PCCコンポーネントトラックグループへのV-PCC空間領域時間指定メタデータトラック参照の概略図である。
図7に示されるように、TrackReferenceBoxは、サンプルエントリタイプが’pcsr’に等しく、TrackReferenceBox内のtrack_IDs[]がV-PCCコンポーネントトラックグループのtrack_group_id値を参照するV-PCC時間指定メタデータトラックに含まれる。TrackReferenceBox内のreference_typeは、値‘cdsc’をとり、時間指定メタデータトラックが、参照されたV-PCCコンポーネントトラックグループのコンテンツ説明情報を含むことを示す。本実施形態では、V-PCC空間領域時間指定メタデータビデオトラックは、V-PCCコンポーネントトラックグループのtrack_group_typeが、’pctg’に等しく、経時的に動的に変化する点群データの対応する空間領域情報を示すV-PCCコンポーネントトラックグループのトラックグループ識別子を参照する。
いくつかの実施形態が、好ましくは、以下の技術的解決策を実装し得る。
1.点群データ処理の方法であって、方法は、点群データの3D領域および3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域を決定することと、2D領域に含まれるパッチフレームデータおよび対応する点群コンポーネントトラックのビデオフレームデータから、点群データの3D領域を再構築することとを含む、方法。この解決策のある例が、解決策1および図1を参照して説明される。
2.点群データの3D領域および3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域は、点群トラックサンプルエントリまたはサンプル内の要素に基づいて決定される、解決策1に記載の方法。この解決策のある例が、および図2を参照して説明される。
3.特定のボックスタイプに従って点群トラック内のパッチデータボックスを識別することを含み、パッチデータボックスは、2D領域が、点群データの3D領域を再構築するためのパッチデータを含むことを示す、解決策1または解決策2に記載の方法。
4.特定のボックスタイプに従って点群トラック内の2Dタイルデータボックスを識別することを含み、2Dタイルデータボックスは、2D領域が点群データの3D領域の2Dタイルデータを含むことを示す、解決策1または解決策2に記載の方法。
5.特定のボックスタイプに従って点群トラック内のタイルグループデータボックスを識別することを含み、タイルグループデータボックスは、2D領域が点群データの3D領域を再構築するためのタイルグループデータを含むことを示す、解決策1または解決策2に記載の方法。
6.決定することは、時間指定メタデータトラック内の要素に基づいて、点群データの3D領域を決定することを含み、時間指定メタデータトラックは、点群トラックへの特定のトラック参照を含む、解決策1に記載の方法。図3および関連するテキストが、この解決策のいくつかの追加の特徴および実施形態を説明している。
7.特定のサンプルエントリタイプに従って時間指定メタデータトラックを識別することを含み、時間指定メタデータトラックは、2D領域が点群データの3D領域を再構築するための以下の情報:パッチデータ、2Dタイルデータ、タイルグループデータのうちの1つを含むことを示す、解決策1または解決策6に記載の方法。
8.点群データ処理の方法であって、方法は、点群データの3D領域および3D領域に対応する点群コンポーネントトラックグループを決定することと、点群コンポーネントトラックグループ内の点群コンポーネントトラックからのビデオフレームデータおよび対応する点群トラックパッチフレームデータに基づいて、点群データの3D領域を再構築することとを含む、方法。図4、解決策2、および関連するテキストが、この解決策のいくつかの実施形態および特徴を説明する。
9.3D領域を決定することは、点群コンポーネントトラックのトラックグループデータボックス内の要素に基づいて、点群データの3D領域および3D領域に対応する点群コンポーネントトラックグループを決定することを含み、点群コンポーネントトラックグループは、占有マップトラック、幾何学形状トラック、または属性トラックを含む解決策8に記載の方法。
10.特定のトラックグループタイプに従って点群コンポーネントトラック内のトラックグループデータボックスを識別することを含み、トラックグループデータボックスは、点群コンポーネントトラックグループに対応する点群データの3D領域を示す、点群データの同じ3D領域に対応する点群データコンポーネントトラックのトラックグループデータボックスは、同じトラックグループ識別を有する、解決策8または9に記載の方法。
11.特定のトラックグループタイプに従って点群コンポーネント2Dタイルトラック内のトラックグループデータボックスを識別することを含み、トラックグループデータボックスは、点群コンポーネント2Dタイルトラックグループに対応する点群データの3D領域を示し、点群データの同じ3D領域に対応する点群コンポーネント2Dタイルトラックのトラックグループデータボックスは、同じトラックグループ識別を有する、解決策8または9に記載の方法。
12.特定のトラックグループタイプに従って点群コンポーネントタイルグループトラック内のトラックグループデータボックスを識別することを含み、トラックグループデータボックスは、点群コンポーネントタイルグループトラックグループに対応する点群データの3D領域を示し、点群データの同じ3D領域に対応する点群コンポーネントタイルグループトラックのトラックグループデータボックスは、同じトラックグループ識別を有する、解決策8または9に記載の方法。
13.決定することは、時間指定メタデータトラック内の要素に基づいて、点群データの3D領域および3D領域に対応する点群コンポーネントトラックグループを決定することを含み、時間指定メタデータトラックは、点群コンポーネントトラックグループへの特定のトラック参照を含む、解決策8に記載の方法。
14.特定のサンプルエントリタイプに従って時間指定メタデータトラックを識別することを含み、時間指定メタデータトラックは、点群コンポーネントトラックグループに対応する点群データの3D領域を示す、解決策8または解決策13に記載の方法。
15.3D領域は、点群トラックパッチフレームの2つ以上の2D領域上に投影される点を含む、解決策1-14のいずれかに記載の方法。
16.点群データの3D領域に関する情報は、3D領域のx、y、z座標オフセットおよび/または3D領域の幅、高さ、および奥行を含む3D境界ボックスパラメータを含む、解決策1-15のいずれか1項に記載の方法。
17.点群データの3D領域は、以下の情報:点群データの標識、点群データの点の数、または点群の属性の数およびタイプのうちの1つをさらに含む、解決策1-16のいずれかに記載の方法。
18.点群トラックパッチフレームの2D領域に関する情報は、2D領域のx、y座標オフセットおよび/または2D領域の幅および高さを含む2D境界ボックスパラメータを含む、解決策1-17のいずれか1項に記載の方法。
19.点群トラックパッチフレームの2D領域は、以下の情報:レイヤ情報、説明情報、パッチの数、2Dタイル情報、またはタイルグループ情報のうちの1つをさらに含む、解決策1-18のいずれか1項に記載の方法。
20.前述の解決策のうちのいずれかに列挙される方法を実装するように構成されたプロセッサを備えているビデオ処理装置。
21.コンピュータ読み取り可能な媒体であって、コンピュータ読み取り可能な媒体は、プロセッサによって上で説明される方法を実行するためのコードを記憶している、コンピュータ読み取り可能な媒体。
図6および図7は、本明細書に説明される点群データ処理技法を促進するために使用される、ファイルフォーマットの例を示す。
図8は、点群データの処理のために使用される装置800のある例のブロック図である。装置800は、本書に説明される方法を実装するようにプログラムされるプロセッサ802を含む。装置800は、データのデコーディング、コンポーネントトラックへのアクセス等の具体的な関数を実施するための、専用のハードウェア回路網をさらに含み得る。装置800は、メモリも含み得、メモリは、プロセッサのための実行可能コード、および/または2Dボリュームデータおよび他のデータ(本書に説明される種々の構文要素に準拠するデータを含む)を記憶している。
いくつかの実施形態では、3D点群データエンコーダは、本書に説明されるような構文および意味論を使用して3D空間情報をエンコードすることによって、3D点群のビットストリーム表現を発生させるように実装され得る。
点群データエンコーディング装置または点群データデコーディング装置は、コンピュータ、ラップトップ、タブレット、またはゲーム用デバイス等のユーザデバイスの一部として実装され得る。
本書に説明される、開示されるおよび他の実施形態、モジュール、および機能動作が、デジタル電子回路網で、または本書に開示される構造およびそれらの構造均等物を含むコンピュータソフトウェア、ファームウェア、またはハードウェアで、またはそれらのうちの1つ以上の組み合わせで、実装されることができる。開示されるおよび他の実施形態は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のために、またはその動作を制御するために、コンピュータ読み取り可能な媒体上でエンコードされるコンピュータプログラム命令の1つ以上のモジュールとして、実装されることができる。コンピュータ読み取り可能な媒体は、機械読み取り可能な記憶デバイス、機械読み取り可能な記憶基板、メモリデバイス、機械読み取り可能な伝搬信号を生じさせる組成物、または1つ以上のそれらの組み合わせであり得る。用語「データ処理装置」は、例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサまたはコンピュータを含むデータを処理するための全ての装置、デバイス、および機械を包含する。装置は、ハードウェアに加えて、当該コンピュータプログラムのための実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらのうちの1つ以上のある組み合わせを成すコードを含むことができる。伝搬信号は、人工的に発生させられる信号、例えば、好適な受信機装置に伝送するために情報をエンコードするように発生させられる、機械で発生させられる電気、光学、または電磁信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても公知である)が、コンパイラ型またはインタープリタ型言語を含む任意の形態のプログラミング言語で書かれることができ、独立型プログラムとして、またはコンピューティング環境内での使用のために好適なモジュール、コンポーネント、サブルーチン、または他のユニットとしてのものを含む任意の形態で展開されることができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するわけではない。プログラムは、他のプログラムまたはデータを保持するファイル(例えば、マークアップ言語文書内に記憶された1つ以上のスクリプト)の一部内に、当該プログラム専用の単一のファイル内に、または複数の協調ファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を記憶するファイル)内に記憶されることができる。コンピュータプログラムは、1つのコンピュータ上で、または1つの地点に位置する、または複数の地点を横断して分散され、通信ネットワークによって相互接続される複数のコンピュータ上で、実行されるように展開されることができる。
本書に説明されるプロセスおよび論理フローは、入力データに作用し、出力を発生させることによって機能を実施するように、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって、実施されることができる。プロセスおよび論理フローはまた、特殊目的論理回路網、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって実施されることもでき、装置も、それらとして実装されることもできる。
コンピュータプログラムの実行のために好適なプロセッサは、例として、汎用および特殊用途マイクロプロセッサの両方、および任意の種類のデジタルコンピュータのいずれか1つ以上のプロセッサを含む。概して、プロセッサは、読取専用メモリまたはランダムアクセスメモリまたは両方から、命令およびデータを受信するであろう。コンピュータの不可欠な要素は、命令を実施するためのプロセッサ、および命令およびデータを記憶するための1つ以上のメモリデバイスである。概して、コンピュータは、データを記憶するための1つ以上の大容量記憶デバイス、例えば、磁気、磁気光学ディスク、または光ディスクを含むか、または、それらからデータを受信し、またはそれらにデータを転送するか、または、両方を行うように動作可能に結合されるであろう。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するために好適なコンピュータ読み取り可能な媒体は、例として、半導体メモリデバイス、例えば、EPROM、EEPROM、およびフラッシュメモリデバイス、磁気ディスク、例えば、内部ハードディスクまたはリムーバブルディスク、磁気光学ディスク、およびCD-ROMおよびDVD-ROMディスクを含むあらゆる形態の不揮発性メモリ、媒体、およびメモリデバイスを含む。プロセッサおよびメモリは、特殊用途論理回路網によって補完される、またはそれに組み込まれることができる。
本特許文書は、多くの詳細を含むが、これらは、任意の発明または請求され得るものの範囲への限定としてではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明として解釈されるべきである。別個の実施形態との関連で本特許文書に説明されるある特徴も、単一の実施形態において組み合わせて実装されることができる。逆に、単一の実施形態との関連で説明される種々の特徴も、複数の実施形態において別個に、または任意の好適な副次的組み合わせにおいて実装されることができる。さらに、特徴が、ある組み合わせにおいて作用するものとして上で説明され、そのようなものとして最初に請求され得るが、請求される組み合わせからの1つ以上の特徴が、ある場合、組み合わせから削除されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。
同様に、動作が、特定の順序で図面に描写されるが、それは、望ましい結果を達成するために、そのような動作が示される特定の順序で、または順次順序で実施されること、または全ての図示される動作が実施されることを要求するものとして理解されるべきではない。さらに、本特許文書に説明される実施形態における種々のシステムコンポーネントの分離は、全ての実施形態においてそのような分離を要求するものとして理解されるべきではない。
いくつかの実装および例のみが、説明され、他の実装、強化、および変形例も、本特許文書に説明および図示されるものに基づいて成されることができる。

Claims (12)

  1. 点群データ処理の方法であって、前記方法は、
    点群データの3D領域を決定することと、
    群トラックパッチフレームの2D領域決定することであって、前記3D領域の前記点群データ内の1つ以上の点が前記2D領域に投影される、ことと、
    (a)特定のボックスタイプに従って前記点群トラック内のパッチデータボックスを識別すること、または、(b)前記特定のボックスタイプに従って前記点群トラック内の2Dタイルデータボックスを識別することであって、前記パッチデータボックスは、前記2D領域が前記点群データの前記3D領域を再構築するためのパッチデータを含むことを示し、前記2Dタイルデータボックスは、前記2D領域が前記点群データの前記3D領域の2Dタイルデータを含むことを示す、ことと、
    前記2D領域に含まれているパッチフレームデータと、対応する点群コンポーネントトラックのビデオフレームデータとから、前記点群データの前記3D領域を再構築することと
    を含む、方法。
  2. 前記点群データの前記3D領域と、前記3D領域の1つ以上の点が投影される前記点群トラックパッチフレームの前記2D領域とは、点群トラックサンプルエントリまたはサンプル内の要素に基づいて決定される、請求項1に記載の方法。
  3. 点群データ処理の方法であって、前記方法は、
    点群データの3D領域と、前記3D領域の1つ以上の点が投影される点群トラックパッチフレームの2D領域とを決定することと、
    前記2D領域に含まれているパッチフレームデータと、対応する点群コンポーネントトラックのビデオフレームデータとから、前記点群データの前記3D領域を再構築することと
    を含み、
    前記決定することは、時間指定メタデータトラック内の要素に基づいて、前記点群データの前記3D領域を決定することを含み、前記時間指定メタデータトラックは、前記点群トラックへの特定のトラック参照を含む方法。
  4. 前記方法は、特定のサンプルエントリタイプに従って前記時間指定メタデータトラックを識別することを含み、
    前記時間指定メタデータトラックは前記点群データの前記3D領域を再構築するため情報としてパッチデータ、2Dタイルデータ、タイルグループデータのうちの1つを前記2D領域が含むことを示す、請求項に記載の方法。
  5. 点群データ処理の方法であって、前記方法は、
    点群データの3D領域を決定することと、
    記3D領域に対応する点群コンポーネントトラックグループ決定することと、
    特定のトラックグループタイプに従って前記点群コンポーネントトラック内の第1のボックスを識別することであって、前記第1のボックスは、前記点群コンポーネントトラックグループに対応する前記点群データの前記3D領域を示し、前記点群データの同一のD領域に対応する点群データコンポーネントトラックの前記第1のボックスは、同一のトラックグループ識別を有する、ことと、
    前記点群コンポーネントトラックグループ内の点群コンポーネントトラックからのビデオフレームデータと、対応する点群トラックパッチフレームデータとに基づいて、前記点群データの前記3D領域を再構築することであって、前記ビデオフレームデータは、1)デコード幾何学形状ビデオフレーム、2)デコード属性ビデオフレーム、3)デコード占有マップビデオフレーム、4)ブロックからパッチへのマッピング情報、または、5)出力順序における、フレームインデックスのうちの少なくとも1つを含む、こと
    を含む、方法。
  6. 前記3D領域を決定することは、点群コンポーネントトラックのトラックグループデータボックス内の要素に基づいて、前記点群データの前記3D領域と、前記3D領域に対応する前記点群コンポーネントトラックグループとを決定することを含み、
    前記点群コンポーネントトラックグループは、占有マップトラック、幾何学形状トラック、または属性トラックを含む、請求項に記載の方法。
  7. 点群データ処理の方法であって、前記方法は、
    点群データの3D領域と、前記3D領域に対応する点群コンポーネントトラックグループとを決定することと、
    前記点群コンポーネントトラックグループ内の点群コンポーネントトラックからのビデオフレームデータと、対応する点群トラックパッチフレームデータとに基づいて、前記点群データの前記3D領域を再構築することと
    を含み、
    前記決定することは、時間指定メタデータトラック内の要素に基づいて、前記点群データの前記3D領域と、前記3D領域に対応する前記点群コンポーネントトラックグループとを決定することを含み、
    前記時間指定メタデータトラックは、前記点群コンポーネントトラックグループへの特定のトラック参照を含む方法。
  8. 前記方法は、特定のサンプルエントリタイプに従って前記時間指定メタデータトラックを識別することを含み、
    前記時間指定メタデータトラックは、前記点群コンポーネントトラックグループに対応する前記点群データの前記3D領域を示す、請求項に記載の方法。
  9. 前記点群データの前記3D領域に関する情報は、3D境界ボックスパラメータを含み、前記3D境界ボックスパラメータは、前記3D領域のx、y、z座標オフセットおよび/または前記3D領域の幅および高さおよび奥行を含む、請求項に記載の方法。
  10. 前記点群トラックパッチフレームの前記2D領域に関する情報は、2D境界ボックスパラメータを含み、前記2D境界ボックスパラメータは、前記2D領域のx、y座標オフセットおよび/または前記2D領域の幅および高さ、パッチの説明情報、または2Dタイル情報を含む、請求項に記載の方法。
  11. 請求項1~10のうちのいずれか一項に記載の方法を実装するように構成されているプロセッサを備えているビデオ処理装置。
  12. 求項1~10のいずれか一項に記載の方法をプロセッサによって実装するためのコード記憶されているコンピュータ読み取り可能な媒体。
JP2022519702A 2019-09-30 2019-09-30 点群データのためのファイルフォーマット Active JP7402976B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/109490 WO2021062645A1 (en) 2019-09-30 2019-09-30 File format for point cloud data

Publications (2)

Publication Number Publication Date
JP2022550150A JP2022550150A (ja) 2022-11-30
JP7402976B2 true JP7402976B2 (ja) 2023-12-21

Family

ID=75337604

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022519702A Active JP7402976B2 (ja) 2019-09-30 2019-09-30 点群データのためのファイルフォーマット

Country Status (6)

Country Link
US (1) US20220215616A1 (ja)
EP (1) EP4042381A4 (ja)
JP (1) JP7402976B2 (ja)
KR (1) KR102624994B1 (ja)
CN (1) CN114365194A (ja)
WO (1) WO2021062645A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11875539B2 (en) * 2020-03-16 2024-01-16 Samsung Electronics Co., Ltd. Partial access metadata for video-based point cloud compression data
CN115618027A (zh) * 2021-07-12 2023-01-17 腾讯科技(深圳)有限公司 一种数据处理方法、装置、计算机及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019082958A1 (ja) 2017-10-27 2019-05-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元モデル符号化装置、三次元モデル復号装置、三次元モデル符号化方法、および、三次元モデル復号方法
WO2019142666A1 (ja) 2018-01-16 2019-07-25 ソニー株式会社 画像処理装置および方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080310757A1 (en) * 2007-06-15 2008-12-18 George Wolberg System and related methods for automatically aligning 2D images of a scene to a 3D model of the scene
CN107067462A (zh) * 2017-03-10 2017-08-18 东华大学 基于视频流的织物三维悬垂形态重建方法
US10198858B2 (en) * 2017-03-27 2019-02-05 3Dflow Srl Method for 3D modelling based on structure from motion processing of sparse 2D images
AU2019342612B2 (en) * 2018-09-18 2024-05-16 Vid Scale, Inc. Methods and apparatus for point cloud compression bitstream format
CN110009743B (zh) * 2019-02-22 2023-04-04 南京航空航天大学 一种场景理解的网格曲面重建方法
US11245926B2 (en) * 2019-03-19 2022-02-08 Mediatek Singapore Pte. Ltd. Methods and apparatus for track derivation for immersive media data tracks
WO2020189903A1 (ko) * 2019-03-20 2020-09-24 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN110189412B (zh) * 2019-05-13 2023-01-03 武汉大学 基于激光点云的多楼层室内结构化三维建模方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019082958A1 (ja) 2017-10-27 2019-05-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元モデル符号化装置、三次元モデル復号装置、三次元モデル符号化方法、および、三次元モデル復号方法
WO2019142666A1 (ja) 2018-01-16 2019-07-25 ソニー株式会社 画像処理装置および方法

Also Published As

Publication number Publication date
JP2022550150A (ja) 2022-11-30
US20220215616A1 (en) 2022-07-07
EP4042381A1 (en) 2022-08-17
KR102624994B1 (ko) 2024-01-12
CN114365194A (zh) 2022-04-15
EP4042381A4 (en) 2022-11-02
WO2021062645A1 (en) 2021-04-08
KR20220071256A (ko) 2022-05-31

Similar Documents

Publication Publication Date Title
CN112019857B (zh) 用于压缩点云的存储和信号发送的方法和装置
CN111869201B (zh) 处理和发送三维内容的方法
KR102559862B1 (ko) 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램
US12058379B2 (en) Point cloud data processing
US11412267B2 (en) Storage of multiple atlases from one V-PCC elementary stream in ISOBMFF
CN114697668B (zh) 点云媒体的编解码方法及相关产品
US20220215616A1 (en) File format for point cloud data
CN113852829A (zh) 点云媒体文件的封装与解封装方法、装置及存储介质
US12101508B2 (en) Volumetric media process methods and apparatus
WO2024183506A1 (zh) 沉浸媒体的数据处理方法、装置、计算机设备、存储介质及程序产品
WO2021058814A1 (en) Merging friendly file format
CN115086635B (zh) 多视角视频的处理方法、装置、设备及存储介质
KR102715954B1 (ko) 다중-트랙 기반 몰입형 미디어 플레이아웃
KR102721361B1 (ko) 포인트 클라우드 데이터 프로세싱
WO2023169003A1 (zh) 点云媒体的解码方法、点云媒体的编码方法及装置
KR20230113781A (ko) 몰입형 미디어의 다중 아틀라스 캡슐화
KR20230121856A (ko) 다중-트랙 기반 몰입형 미디어 플레이아웃
CN115426502A (zh) 点云媒体的数据处理方法、装置、设备及存储介质
CN116939290A (zh) 媒体数据处理方法、装置、设备及存储介质
CN115061984A (zh) 点云媒体的数据处理方法、装置、设备、存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231211

R150 Certificate of patent or registration of utility model

Ref document number: 7402976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150