JP7487742B2

JP7487742B2 - 画像処理装置および方法

Info

Publication number: JP7487742B2
Application number: JP2021564056A
Authority: JP
Inventors: 遼平高橋; 光浩平林
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2019-12-13
Filing date: 2020-12-11
Publication date: 2024-05-21
Anticipated expiration: 2040-12-11
Also published as: EP4057632A1; EP4057632A4; US20230043987A1; JPWO2021117859A1; CN114762356B; WO2021117859A1; CN114762356A

Description

本開示は、画像処理装置および方法に関し、特に、3Dスペーシャルリージョンとアトラスタイルグループとを紐付けることができるようにした画像処理装置および方法に関する。

従来、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドデータ（Point cloud data）の符号化・復号の標準化がMPEG（Moving Picture Experts Group）で進められている。そして、そのポイントクラウドのジオメトリデータとアトリビュートデータとを小領域毎に２次元平面に投影し、その２次元平面に投影された画像（パッチ）をビデオのフレーム画像内に配置し、そのフレーム画像を２次元画像用の符号化方法で符号化する方法（以下、V-PCC（Video based Point Cloud Compression）とも称する）が提案された（例えば、非特許文献１参照）。

また、動画圧縮の国際標準技術MPEG-4（Moving Picture Experts Group - 4）のファイルコンテナ仕様であるISOBMFF（International Organization for Standardization Base Media File Format）がある（例えば、非特許文献２および非特許文献３参照）。

そして、このV-PCCで符号化されたビットストリームのローカルストレージからの再生処理やネットワーク配信の効率化を目的とし、V-PCCビットストリームをISOBMFFに格納する方法の検討がなされている（例えば、非特許文献４参照）。

"Text of ISO/IEC DIS 23090-5 Video-based Point Cloud Compression", ISO/IEC JTC 1/SC 29/WG 11 N18670, 2019-10-10 "Information technology - Coding of audio-visual objects - Part 12:ISO base media file format", ISO/IEC 14496-12, 2015-02-20 "Information technology - Coding of audio-visual objects - Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format", ISO/IEC FDIS 14496-15:2014(E), ISO/IEC JTC 1/SC 29/WG 11,2014-01-13 "Revised Text of ISO/IEC CD 23090-10 Carriage of Video-based Point Cloud Coding Data", ISO/IEC JTC 1/SC 29/WG 11 N18606,2019-11-08

しかしながら、非特許文献４に記載の規定では、特定の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なアトラスタイルグループを識別するためのシグナリングが定義されていなかった。そのため、復号側において3Dスペーシャルリージョンとアトラスタイルグループとを紐付けることが困難であった。

本開示は、このような状況に鑑みてなされたものであり、3Dスペーシャルリージョンとアトラスタイルグループとを紐付けることができるようにするものである。

本技術の一側面の画像処理装置は、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、前記ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する前記3Dスペーシャルリージョンおよび前記アトラスタイルグループを選択する選択部と、前記ファイルから、前記選択部により選択された前記アトラスタイルグループに対応するアトラスNALユニットと、前記選択部により選択された前記3Dスペーシャルリージョンに対応するビットストリームを抽出する抽出部と、前記抽出部により抽出された前記ビットストリームを復号し、前記所望の３次元空間の前記3Dスペーシャルリージョンに対応する2Dデータを生成し、前記抽出部により抽出された前記アトラスNALユニットを復号し、前記2Dデータに対応するアトラス情報を生成する復号部とを備える画像処理装置である。

本技術の一側面の画像処理方法は、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、前記ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する前記3Dスペーシャルリージョンおよび前記アトラスタイルグループを選択し、前記ファイルから、選択された前記アトラスタイルグループに対応するアトラスNALユニットと、選択された前記3Dスペーシャルリージョンに対応するビットストリームを抽出し、抽出された前記ビットストリームを復号し、前記所望の３次元空間の前記3Dスペーシャルリージョンに対応する2Dデータを生成し、抽出された前記アトラスNALユニットを復号し、前記2Dデータに対応するアトラス情報を生成する画像処理方法である。

本技術の他の側面の画像処理装置は、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成する符号化部と、前記3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成する紐付け情報生成部と、前記符号化部により生成された前記ビットストリームと、前記紐付け情報生成部により生成された前記紐付け情報とを格納するファイルを生成するファイル生成部とを備える画像処理装置である。

本技術の他の側面の画像処理方法は、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成し、前記3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成し、生成された前記ビットストリームおよび前記紐付け情報を格納するファイルを生成する画像処理方法である。

本技術の一側面の画像処理装置および方法においては、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、そのポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する3Dスペーシャルリージョンおよびアトラスタイルグループが選択され、そのファイルから、その選択されたアトラスタイルグループに対応するアトラスNALユニットと、その選択された3Dスペーシャルリージョンに対応するビットストリームが抽出され、その抽出されたビットストリームが復号され、所望の３次元空間の3Dスペーシャルリージョンに対応する2Dデータが生成され、その抽出されたアトラスNALユニットが復号され、その2Dデータに対応するアトラス情報が生成される。

本技術の他の側面の画像処理装置および方法においては、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータが符号化され、ビットストリームが生成され、その3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報が生成され、その生成されたビットストリームおよび紐付け情報を格納するファイルが生成される。

V-PCCの概要を説明する図である。 V-PCCビットストリームの主な構成例を示す図である。アトラスサブビットストリームの主な構成例を示す図である。ファイル構造の例を示す図である。パーシャルアクセス情報の例について説明する図である。ファイル構造の例を示す図である。 SpatialRegionGroupBoxとVPCCSpatialRegionsBoxの例を示す図である。ファイル構造の例を示す図である。ファイル構造の例を示す図である。紐付け情報のシグナリングについて説明する図である。トラックグループ識別情報とタイルグループ識別情報との紐付けについて説明する図である。 VPCCSpatialRegionsBoxの例を示す図である。ビデオサブビットストリームの分割情報を用いた紐付けについて説明する図である。 SpatialRegionGroupBoxの例を示す図である。グループ識別情報を用いた紐付けについて説明する図である。グループ識別情報を用いた紐付けについて説明する図である。 HEVCのタイルを用いた紐付けについて説明する図である。 VPCCSpatialRegionsBoxの例を示す図である。 VPCCSpatialRegionsBoxの例を示す図である。シングルトラックストラクチャの場合のグループ識別情報を用いた紐付けについて説明する図である。 SubSampleToGroupBoxの例を示す図である。 3Dスペーシャルリージョン毎にV-PCCビットストリームを分ける例について説明する図である。 VPCCSpatialRegionsBoxの例を示す図である。 3Dスペーシャルリージョンの切り替えの例を示す図である。 VPCCSpatialRegionsBoxとAlternativeRegionListStructの例を示す図である。 AlternativeRegionListStructの例を示す図である。マトリョーシカメディアコンテナの構成例を示す図である。符号化装置の主な構成例を示すブロック図である。符号化処理の流れの例を示すフローチャートである。復号装置の主な構成例を示すブロック図である。復号処理の流れの例を示すフローチャートである。コンピュータの主な構成例を示すブロック図である。

以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
１．紐付け情報のシグナリング
２．第１の実施の形態（符号化装置）
３．第２の実施の形態（復号装置）
４．付記

＜１．紐付け情報のシグナリング＞
＜技術内容・技術用語をサポートする文献等＞
本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献等に記載されている内容や以下の非特許文献において参照されている他の文献の内容等も含まれる。

非特許文献１：（上述）
非特許文献２：（上述）
非特許文献３：（上述）
非特許文献４：（上述）
非特許文献５：https://www.matroska.org/index.html

つまり、上述の非特許文献に記載されている内容や、上述の非特許文献において参照されている他の文献の内容等も、サポート要件を判断する際の根拠となる。

＜ポイントクラウド＞
従来、点の位置情報や属性情報等により３次元構造を表すポイントクラウド（Point cloud）等の3Dデータが存在した。

例えばポイントクラウドの場合、立体構造物（３次元形状のオブジェクト）を多数の点の集合として表現する。ポイントクラウドは、各点の位置情報（ジオメトリ（geometry）とも称する）と属性情報（アトリビュート（attribute）とも称する）とにより構成される。アトリビュートは任意の情報を含むことができる。例えば、各ポイントの色情報、反射率情報、法線情報等がアトリビュートに含まれるようにしてもよい。このようにポイントクラウドは、データ構造が比較的単純であるとともに、十分に多くの点を用いることにより任意の立体構造物を十分な精度で表現することができる。

＜V-PCCの概要＞
V-PCC（Video based Point Cloud Compression）では、このようなポイントクラウドのジオメトリやアトリビュートが、小領域毎に２次元平面に投影される。本開示において、この小領域を部分領域という場合がある。このジオメトリやアトリビュートが２次元平面に投影された画像を投影画像とも称する。また、この小領域（部分領域）毎の投影画像をパッチ（patch）と称する。例えば、図１のＡのオブジェクト１（3Dデータ）が、図１のＢに示されるようなパッチ２（2Dデータ）に分解される。ジオメトリのパッチの場合、各画素値は、ポイントの位置情報を示す。ただし、その場合、ポイントの位置情報は、その投影面に対して垂直方向（奥行方向）の位置情報（デプス値（Depth））として表現される。

そして、このように生成された各パッチがビデオシーケンスのフレーム画像（ビデオフレームとも称する）内に配置される。ジオメトリのパッチが配置されたフレーム画像をジオメトリビデオフレーム（Geometry video frame）とも称する。また、アトリビュートのパッチが配置されたフレーム画像をアトリビュートビデオフレーム（Attribute video frame）とも称する。例えば、図１のＡのオブジェクト１から、図１のＣに示されるようなジオメトリのパッチ３が配置されたジオメトリビデオフレーム１１と、図１のＤに示されるようなアトリビュートのパッチ４が配置されたアトリビュートビデオフレーム１２が生成される。例えば、ジオメトリビデオフレーム１１の各画素値は、上述のデプス値を示す。

そして、これらのビデオフレームが、例えばAVC（Advanced Video Coding）やHEVC（High Efficiency Video Coding）等といった２次元画像用の符号化方法で符号化される。つまり、３次元構造を表す3Dデータであるポイントクラウドデータを、２次元画像用のコーデックを用いて符号化することができる。

なお、オキュパンシーマップを用いることもできる。オキュパンシーマップは、ジオメトリビデオフレームやアトリビュートビデオフレームのNxN画素毎に、投影画像（パッチ）の有無を示すマップ情報である。例えば、オキュパンシーマップは、ジオメトリビデオフレームやアトリビュートビデオフレームの、パッチが存在する領域（NxN画素）を値「１」で示し、パッチが存在しない領域（NxN画素）を値「０」で示す。

デコーダは、このオキュパンシーマップを参照することにより、パッチが存在する領域であるか否かを把握することができるので、符号化・復号により生じるノイズ等の影響を抑制することができ、より正確に3Dデータを復元することができる。例えば、符号化・復号によりデプス値が変化しても、デコーダは、オキュパンシーマップを参照することにより、パッチが存在しない領域のデプス値を無視することができる。つまり、デコーダは、オキュパンシーマップを参照することにより、3Dデータの位置情報として処理しないようにすることができる。

例えば、ジオメトリビデオフレーム１１およびアトリビュートビデオフレーム１２に対して、図１のＤに示されるようなオキュパンシーマップ１３を生成してもよい。オキュパンシーマップ１３において、白の部分が値「１」を示し、黒の部分が値「０」を示している。

このようなオキュパンシーマップが、ジオメトリビデオフレームやアトリビュートビデオフレームとは別のデータ（ビデオフレーム）として符号化され、復号側に伝送され得る。つまり、オキュパンシーマップも、ジオメトリビデオフレームやアトリビュートビデオフレームと同様に、AVCやHEVC等の２次元画像用の符号化方法で符号化することができる。

ジオメトリビデオフレームを符号化して生成される符号化データ（ビットストリーム）をジオメトリビデオサブビットストリーム（geometry video sub-bitstream）とも称する。アトリビュートビデオフレームを符号化して生成される符号化データ（ビットストリーム）をアトリビュートビデオサブビットストリーム（attribute video sub-bitstream）とも称する。オキュパンシーマップを符号化して生成される符号化データ（ビットストリーム）をオキュパンシーマップビデオサブビットストリーム（occupancy map video sub-bitstream）とも称する。なお、ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリームを互いに区別して説明する必要が無い場合、ビデオサブビットストリーム（video sub-bitstream）と称する。

さらに、パッチ（2Dデータ）からポイントクラウド（3Dデータ）を再構成するための情報であるアトラス情報（atlas）が符号化され、復号側に伝送される。アトラス情報の符号化方法（および復号方法）は任意である。アトラス情報を符号化して生成される符号化データ（ビットストリーム）をアトラスサブビットストリーム（atlas sub-bitstream）とも称する。

なお、以下において、ポイントクラウド（のオブジェクト）は、２次元画像の動画像のように、時間方向に変化し得るものとする。つまり、ジオメトリデータやアトリビュートデータは、時間方向の概念を有し、２次元画像の動画像のように、所定の時間毎にサンプリングされたデータとする。なお、２次元画像のビデオフレームのように、各サンプリング時刻のデータをフレームと称する。つまり、ポイントクラウドデータ（ジオメトリデータやアトリビュートデータ）は、２次元画像の動画像のように、複数フレームにより構成されるものとする。本開示において、このポイントクラウドのフレームのことを、ポイントクラウドフレームとも称する。V-PCCの場合、このような動画像（複数フレーム）のポイントクラウドであっても、各ポイントクラウドフレームをビデオフレーム化してビデオシーケンスとすることで、動画像の符号化方式を用いて高効率に符号化することができる。

＜V-PCCビットストリームの構造＞
エンコーダは、上述したようなジオメトリビデオフレーム、アトリビュートビデオフレーム、オキュパンシーマップ、およびアトラス情報の符号化データを多重化し、１つのビットストリームを生成する。このビットストリームをV-PCCビットストリーム（V-PCC Bitstream）とも称する。

図２は、V-PCCビットストリームの主な構成例を示す図である。図２に示されるようにV-PCCビットストリーム２１は、複数のV-PCCユニット（V-PCC Unit）２２を含む。

V-PCCユニット２２は、V-PCCユニットヘッダ（V-PCC unit header）２３とV-PCCユニットペイロード（V-PCC unit payload）２４を含む。V-PCCユニットヘッダ２３は、V-PCCユニットペイロード２４に格納される情報の種類（タイプ）を示す情報を含む。V-PCCユニットペイロード２４は、そのV-PCCユニットヘッダ２３でシグナルされるタイプに応じて、V-PCCパラメータセット（V-PCC Parameter Set）２５、ジオメトリビデオサブビットストリーム２６（Geometry Video Data）、アトリビュートビデオサブビットストリーム２７（Attribute Video Data）、オキュパンシーマップビデオサブビットストリーム２８（Occupancy Video Data）、アトラスサブビットストリーム２９（Atlas Data）等が格納され得る。V-PCCパラメータセット（V-PCC Parameter Set）２５には、V-PCCユニット２２に関するパラメータが格納される。

＜アトラスサブビットストリームの構造＞
図３のＡは、アトラスサブビットストリームの主な構成例を示す図である。図３のＡに示されるようにアトラスサブビットストリーム３１は、アトラスNALユニット（atlas NAL unit）３２の連続で構成される。図３のＡに示される各四角がアトラスNALユニット３２を示している。

audは、アクセスユニットデリミタ（access unit delimiter）のNALユニットである。atlas spsは、アトラスシーケンスパラメータセット（atlas sequence parameter set）のNALユニットである。atlas fpsは、アトラスフレームパラメータセット（atlas frame parameter set）のNALユニットである。

coded tile groupは、コーデドタイルグループのNALユニットである。このNALユニットのことをコーデドタイルグループNALユニット（coded tile group NAL unit）とも称する。コーデドタイルグループNALユニットは、アトラスタイルグループ情報を持つ。アトラスタイルグループ情報とは、アトラスタイルグループ（atlas tile group）に関する情報のことである。

アトラスタイルグループは、ビデオサブビットストリームの対応矩形領域のパッチに対応する2D3D変換情報を持つ。2D3D変換情報は、2Dデータであるパッチを3Dデータであるポイントクラウドに変換するための情報のことである。例えば、図３のＢに示されるアトリビュートビデオフレーム１２に対して、点線で区切られた矩形領域毎にアトラス情報がグループ化される。つまり、各矩形領域に対応するアトラスタイルグループ３３が形成される。アトラスタイルグループ３３は、図３のＣに示されるように、複数のアトラスタイル３４により構成される。

各アトラスタイルグループは、互いに独立に復号可能に構成される。このアトラスタイルグループの符号化には、HEVCのタイル（tile）と同等の制約がある。例えば、同一フレーム（same frame）の他のアトラスタイルグループには依存しないように構成される。また、参照関係のあるアトラスフレーム（atlas frame）は互いに同一のアトラスタイルグループパーティショニング（atlas tile group partitioning）を持つ。さらに、参照フレームの同一位置のアトラスタイルグループのみ参照する。

アトラスタイルグループが対応するフレーム内位置を示す位置情報は、アトラスフレームパラメータセット（atlas fps）でシグナルされる。その位置情報がid経由でコーデドタイルグループNALユニットに紐づけられる。つまり、アトラスフレームパラメータセットにおいて、アトラスタイルグループを識別するアトラスタイルグループ識別情報としてafti_tile_group_idがシグナルされる。コーデドタイルグループNALユニットにおいて、アトラスタイルグループの位置情報を識別する識別情報としてatgh_addressがシグナルされる。これらの識別情報（id）が一致することにより、アトラスフレームパラメータセットの位置情報とコーデドタイルグループNALユニットに紐づけられる。なお、１つのコーデドタイルグループNALユニットは、１つのアトラスタイルグループの情報を持つ。つまり、コーデドタイルグループNALユニットとアトラスタイルグループは１対１に対応する。

＜ISOBMFFへの格納方法＞
非特許文献４には、V-PCCビットストリームをISOBMFF（International Organization for Standardization Base Media File Format）に格納する方法として、マルチトラックストラクチャ（multi-track structure）とシングルトラックストラクチャ（single track structure）の２種類が規定されている。

マルチトラックストラクチャは、ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリーム、およびアトラスサブビットストリームをそれぞれ個別のトラック（track）に格納する方法である。各ビデオサブビットストリームは、従来の2Dビデオストリームであるので、2Dの場合と同様の手法で格納（管理）することができる。マルチトラックストラクチャを適用する場合のファイルの構成例を図４に示す。

シングルトラックストラクチャは、V-PCCビットストリームを１つのトラックに格納する方法である。つまりこの場合、ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリーム、およびアトラスサブビットストリームが互いに同一のトラックに格納される。

＜パーシャルアクセス＞
ところで非特許文献４には、ポイントクラウドのオブジェクトの一部分を取得したり、復号したりするためのパーシャルアクセス（partial access）情報が規定されている。例えば、このパーシャルアクセス情報を利用することにより、ストリーミング配信時にポイントクラウドのオブジェクトの表示部分の情報のみを取得するといった制御が可能になる。このような制御により、帯域幅を有効活用して高精細化する、といった効果を得ることができる。

例えば、図５のＡに示されるように、ポイントクラウドのオブジェクトに対して、そのオブジェクトを内包する３次元領域であるバウンディングボックス（Bounding box）５１が設定されているとする。つまり、ISOBMFFにおいて、図５のＢに示されるように、バウンディングボックス５１に関する情報であるバウンディングボックス情報（3DBoundingBoxStruct）が設定されている。

パーシャルアクセス情報を設定することにより、図５のＡに示されるように、このバウンディングボックス５１内に、独立に復号可能な部分領域である3Dスペーシャルリージョン（3D spatial region）５２を設定することができる。つまり、図５のＢに示されるように、ISOBMFFにおいてパーシャルアクセス情報として、3Dスペーシャルリージョン５２に関する情報である3Dスペーシャルリージョン情報（3dSpatialRegionStruct）が設定される。

3Dスペーシャルリージョン情報において、その領域は、その基準点の座標（anchor_x, anchor_y, anchor_z）とサイズ（cuboid_delta_x, cuboid_delta_y, cuboid_delta_z）で指定される。

＜ファイル構造例＞
例えば、図６のオブジェクト６１のビットストリームが３つの3Dスペーシャルリージョン（3Dスペーシャルリージョン６１Ａ、3Dスペーシャルリージョン６１Ｂ、3Dスペーシャルリージョン６１Ｃ）に分割されてISOBMFFに格納されるとする。また、マルチトラックストラクチャが適用され、3Dスペーシャルリージョン情報が静的である（時間方向に変化しない）とする。

その場合、図６の右側に示されるように、ビデオサブビットストリームは、3Dスペーシャルリージョン毎に分けて（互いに異なるトラックに）格納される。つまり、互いに同一の3Dスペーシャルリージョンに対応するジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリームを格納する各トラックがグループ化される（図６の点線枠）。このグループをスペーシャルリージョントラックグループ（spatial region track group）とも称する。

なお、１つの3Dスペーシャルリージョンのビデオサブビットストリームは、１つまたは複数のスペーシャルリージョントラックグループに格納される。図６の例の場合、3Dスペーシャルリージョンが３つ構成されるので、３つ以上のスペーシャルリージョントラックグループが形成される。

各スペーシャルリージョントラックグループには、スペーシャルリージョントラックグループを識別する識別情報であるトラックグループ識別情報としてtrack_group_idが割り当てられる。このtrack_group_idは、各トラックにシグナルされる。つまり、互いに同一のスペーシャルリージョントラックグループに属するトラックには、互いに同一の値のtrack_group_idがシグナルされる。したがって、このtrack_group_idの値に基づいて、所望のスペーシャルリージョントラックグループに属するトラックを識別することができる。

換言するに、互いに同一の3Dスペーシャルリージョンに対応するジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリームを格納する各トラックには、互いに同一の値のtrack_group_idがシグナルされる。したがって、このtrack_group_idの値に基づいて、所望の3Dスペーシャルリージョンに対応する各ビデオサブビットストリームを識別することができる。

より具体的には、互いに同一のスペーシャルリージョントラックグループに属するトラックには、図７に示されるように、互いに同一のtrack_group_idを持つSpatialRegionGroupBoxがシグナルされる。track_group_idは、SpatialRegionGroupBoxが継承するTrackGroupTypeBoxでシグナルされる。

なお、アトラスサブビットストリームは、3Dスペーシャルリージョンに関わらず１つのトラックに格納される。つまり、この１つのアトラスサブビットストリームが複数の3Dスペーシャルリージョンのパッチに関する2D3D変換情報を持つ。より具体的には、アトラスサブビットストリームが格納されるトラックにおいて、図７に示されるように、VPCCSpatialRegionsBoxがシグナルされ、そこで各track_group_idがシグナルされる。

なお、3Dスペーシャルリージョン情報が動的である（時間方向に変化する）場合、図８のＡに示されるように、タイムドメタデータトラック（timed metadata track）を用いて、各時刻の3Dスペーシャルリージョンを表現すればよい。つまり、図８のＢに示されるように、Dynamic3DSpatialRegionSampleEntryやDynamicSpatialRegionSampleをシグナルする。

＜パーシャルアクセスの復号処理＞
パーシャルアクセスする場合の復号処理は、以下のような手順で行われる。
１．VPCCSpatialRegionBoxの情報に基づき、アクセスしたい3Dスペーシャルリージョンに対応するSpatialRegionGroupBoxのtrack_group_idを識別する。
２．そのtrack_group_idのSpatialRegionGroupBoxに属するトラックのビデオサブビットストリームを復号する。
３．アトラスサブビットストリームから必要なコーデドタイルグループNALユニットを抽出し、復号する。
４．3Dスペーシャルリージョンに対応するポイントクラウドを構築する。

＜ファイル構造例＞において上述したように、全ての3Dスペーシャルリージョンに対応するアトラスサブビットストリームが１つのトラックに格納される。汎用のデコーダは、入力されたアトラスサブビットストリームに含まれるすべてのアトラスタイルグループを復号する。つまり、汎用のデコーダは、一部のアトラスタイルグループを抽出して復号することはできない。そして、ポイントクラウドを構築する際にアトラス情報に対応するビデオサブビットストリームが揃っていないとエラーになる。

つまり、上述の手順１、２のようにパーシャルアクセスして一部のスペーシャルリージョントラックグループのみを汎用のデコーダで復号する場合、アトラスサブビットストリーム全体を復号するとポイントクラウドを構築する際にビデオサブビットストリームが不足し、エラーになる。したがって、その場合は、手順３のように、アトラスサブビットストリームから、そのスペーシャルリージョントラックグループに対応するコーデドタイルグループNALユニットを抽出し、汎用のデコーダに入力する必要がある。つまり、不要なアトラスタイルグループの情報を復号対象から除外する必要がある。

例えば、図９に示されるように、ビデオサブビットストリームのビデオフレーム７１内に異なる3Dスペーシャルリージョンに対応するビデオフレーム部分領域７１Ａと７１Ｂとが存在するとする。ビデオフレーム部分領域７１Ａのみを復号する場合、そのビデオフレーム部分領域７１Ａに対応するアトラスタイルグループ７２ＡのコーデドタイルグループNALユニットのみが汎用のデコーダに入力される。また、ビデオフレーム部分領域７１Ｂのみを復号する場合、そのビデオフレーム部分領域７１Ｂに対応するアトラスタイルグループ７２ＢのコーデドタイルグループNALユニットのみが汎用のデコーダに入力される。

しかしながら、非特許文献４では、3Dスペーシャルリージョンとアトラスタイルグループとが紐付けられていなかった。つまり、ビデオサブビットストリームのビデオフレーム部分領域とコーデドタイルグループNALユニットとが紐付けされていなかった。そのため、上述の手順３を行うことは困難であった。つまり、アトラスサブビットストリームから、所望の3Dスペーシャルリージョン（スペーシャルリージョントラックグループ）に対応するコーデドタイルグループNALユニットを抽出し、復号することは困難であった。そのため、その所望の3Dスペーシャルリージョンのポイントクラウド（部分ポイントクラウドとも称する）を構築することは困難であった。

＜3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報＞
そこで、3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報（紐付け情報とも称する）を符号化側から復号側に伝送する（シグナリングする）。例えば、その紐付け情報として、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報をシグナリングする。

例えば、画像処理方法（または符号化方法）において、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成し、3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成し、生成されたビットストリームおよび紐付け情報を格納するファイルを生成する。

例えば、画像処理装置（または符号化装置）において、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成する符号化部と、3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成する紐付け情報生成部と、符号化部により生成されたビットストリームと、紐付け情報生成部により生成された紐付け情報とを格納するファイルを生成するファイル生成部とを備えるようにする。

3Dスペーシャルリージョンに対応する2Dデータは、例えば、ジオメトリビデオフレーム、アトリビュートビデオフレーム、およびオキュパンシーマップビデオフレームの、その3Dスペーシャルリージョンに対応するパッチを含む部分領域のデータである。その2Dデータを符号化して生成されるビットストリームは、例えば、その3Dスペーシャルリージョンに対応するスペーシャルリージョントラックグループに属するトラックに格納されるジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、およびオキュパンシーマップビデオサブビットストリームである。ビットストリームおよび紐付け情報を格納するファイルは、例えば、ISOBMFFのファイルである。

例えば、画像処理方法（または復号方法）において、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する3Dスペーシャルリージョンおよびアトラスタイルグループを選択し、そのファイルから、選択されたアトラスタイルグループに対応するアトラスNALユニットと、選択された3Dスペーシャルリージョンに対応するビットストリームを抽出し、その抽出されたビットストリームを復号し、所望の３次元空間の3Dスペーシャルリージョンに対応する2Dデータを生成し、抽出されたアトラスNALユニットを復号し、2Dデータに対応するアトラス情報を生成する。

例えば、画像処理装置（または復号装置）において、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する3Dスペーシャルリージョンおよびアトラスタイルグループを選択する選択部と、そのファイルから、選択部により選択されたアトラスタイルグループに対応するアトラスNALユニットと、選択部により選択された3Dスペーシャルリージョンに対応するビットストリームを抽出する抽出部と、その抽出部により抽出されたビットストリームを復号し、所望の３次元空間の3Dスペーシャルリージョンに対応する2Dデータを生成し、その抽出部により抽出されたアトラスNALユニットを復号し、2Dデータに対応するアトラス情報を生成する復号部とを備えるようにする。

ビットストリームおよび紐付け情報を格納するファイルは、例えば、ISOBMFFのファイルである。3Dスペーシャルリージョンに対応するビットストリームは、例えば、その3Dスペーシャルリージョンに対応するスペーシャルリージョントラックグループに属するトラックに格納されるジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、およびオキュパンシーマップビデオサブビットストリームである。3Dスペーシャルリージョンに対応する2Dデータは、例えば、ジオメトリビデオフレーム、アトリビュートビデオフレーム、およびオキュパンシーマップビデオフレームの、その3Dスペーシャルリージョンに対応するパッチを含む部分領域のデータである。

このようにすることにより、復号側において、3Dスペーシャルリージョンとアトラスタイルグループとを紐付けることができる。したがって、所望の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なコーデドタイルグループNALユニットおよびビデオサブビットストリームを抽出し、汎用のデコーダに入力することができる。よって、所望の3Dスペーシャルリージョンの部分ポイントクラウドのみを構築し、表示することができる。

例えば、ストリーミング配信時にポイントクラウドのオブジェクトの視聴部分のみ取得することで帯域幅を有効活用して高精細化する、といった効果を得ることができる。このようなポイントクラウドのオブジェクトの配信技術は、AR（Augmented Reality）やVR（Virtual Reality）用途での6DoF（Degree of Freedom）コンテンツ配信への活用が期待される。

また、汎用のデコーダを利用することができるので、アトラスサブビットストリームから、所望の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なコーデドタイルグループNALユニットを抽出し、復号することができる機能を有する専用のデコーダを開発する場合に比べて、コストの増大を抑制することができる。

＜方法１＞
例えば、図１０に示される表の最上段に示されるように、マルチトラックストラクチャにおいて、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付けるようにしてもよい（方法１）。

例えば、＜3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報＞で上述した紐付け情報は、マルチトラックストラクチャにおいて、互いに同一の3Dスペーシャルリージョンに対応するビットストリームを格納するトラックのグループであるスペーシャルリージョントラックグループと、アトラスタイルグループとを紐付ける情報を含むようにしてもよい。

符号化側装置は、このような紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、アトラスサブビットストリームのうち、アクセスしたい3Dスペーシャルリージョンに該当する部分を構成するアトラスNALユニットのみを抽出することができる。つまり、復号側装置は、ビデオサブビットストリームおよびアトラスサブビットストリームの、その3Dスペーシャルリージョンに対応する部分のみを汎用のデコーダで復号することができる。つまり、復号側装置は、ポイントクラウドの、その3Dスペーシャルリージョンに対応する部分のみを構築することができる。

＜方法１－１＞
また、図１０に示される表の上から２段目に示されるように、track_group_idにtile_group_idを紐付けるようにしてもよい（方法１－１）。

例えば、＜方法１＞において上述したスペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報は、ビットストリームを格納するトラックを識別するトラックグループ識別情報と、アトラスタイルグループを識別するアトラスタイルグループ識別情報とを紐付ける情報を含むようにしてもよい。

このビットストリームは、例えば、上述したビデオサブビットストリームである。トラックグループ識別情報は、例えばtrack_group_idである。アトラスタイルグループ識別情報は、例えばtile_group_idである。例えば図１１に示されるように、track_group_idとtile_group_idとを紐付けることにより、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付けることができる。

符号化側装置は、このようなトラックグループ識別情報とアトラスタイルグループ識別情報とを紐付ける情報を含む紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、その紐付け情報に基づいて、所望の3Dスペーシャルリージョン（に対応するトラックグループ識別情報）に対応するアトラスタイルグループ識別情報を特定することができる。そして、復号側装置は、その特定したアトラスタイルグループ識別情報を用いて、所望の3Dスペーシャルリージョンに対応するアトラスNALユニットを特定することができる。

例えば、ISOBMFFのVPCCSpatialRegionsBoxを拡張することにより、track_group_idとtile_group_idとを紐付けるようにしてもよい。つまり、トラックグループ識別情報とアトラスタイルグループ識別情報とを紐付ける情報は、ISOBMFFのVPCCSpatialRegionsBoxを用いて、トラックグループ識別情報とアトラスタイルグループ識別情報とを紐付けるようにしてもよい。

このようなVPCCSpatialRegionsBoxの拡張例を図１２に示す。図１２の例の場合、VPCCSpatialRegionsBoxにおいて、各track_group_idに対して、tile_group_idが紐付けられている。このtile_group_idはアトラスタイルグループヘッダ（atlas_tile_group_header）でシグナルされるatgh_addressと同値である。この場合、１つの1スペーシャルリージョントラックグループに対して、単数または複数のアトラスタイルグループを紐付けることができる。

例えば、ISOBMFFのSpatialRegionGroupBoxを拡張することにより、track_group_idとtile_group_idとを紐付けるようにしてもよい。つまり、トラックグループ識別情報とアトラスタイルグループ識別情報とを紐付ける情報は、ISOBMFFのSpatialRegionGroupBoxを用いて、トラックグループ識別情報とアトラスタイルグループ識別情報とを紐付けるようにしてもよい。

例えば、num_tile_groupsのシグナリングを省略してもよい。その場合、１つのアトラスタイルグループは、１つのスペーシャルリージョントラックグループに対応する。

また、スペーシャルリージョントラックグループにビデオサブビットストリームのサブディビジョン（sub-division）情報を紐付けるようにしてもよい。つまり、図１３に示されるように、atlas tile group idの代わりにビデオサブビットストリームの分割情報（分割位置およびサイズ（2d region pos/size））を用いて、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付けてもよい。

つまり、＜方法１＞において上述したスペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報は、3Dスペーシャルリージョンに対応するビデオフレームの部分領域情報を用いて、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報を含むようにしてもよい。

その場合のSpatialRegionGroupBoxの拡張例を図１４に示す。この例の場合、SpatialRegionGroupBoxのTrackGroupTypeBoxにおいて、3Dスペーシャルリージョン（スペーシャルリージョントラックグループ）に対応するビデオフレームの部分領域の位置（offset_x, offset_y）とサイズ（width, height, total_width, total_height）とがシグナルされている。また、アトラスタイルグループの位置およびサイズは、図３を参照して上述したようにatlas fpsでシグナルされる。このような位置情報およびサイズが一致することにより、スペーシャルリージョントラックグループとアトラスタイルグループとが紐付けられる。

符号化側装置は、3Dスペーシャルリージョンに対応するビデオフレームの部分領域情報を用いてスペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、分割情報に基づいて、所望の3Dスペーシャルリージョンに対応するアトラスNALユニットを特定することができる。

なお、全ビデオサブビットストリームを、マルチプレクスドトラック（multiplexed track）として、１つのトラックに格納してもよい。また、SpatialRegionGroupBoxの代わりに、VPCC SpatialRegionsBoxを拡張してもよい。

なお、この方法１－１の場合、所望のスペーシャルリージョントラックグループに対応するアトラスタイルグループを識別するために、アトラスサブビットストリームのパースが必要になる。

＜方法１－２＞
また、図１０に示される表の上から３段目に示されるように、新たにgroupIDを割り当てて紐付けるようにしてもよい（方法１－２）。

例えば、＜方法１＞において上述したスペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報は、ビットストリームを格納するトラックを識別するトラックグループ識別情報と、アトラスNALユニットが属するアトラスタイルグループを識別するグループ識別情報とを紐付ける情報を含むようにしてもよい。

このビットストリームは、例えば、上述したビデオサブビットストリームである。トラックグループ識別情報は、例えばtrack_group_idである。グループ識別情報は、新規に割り当てる識別情報であり、例えばgroupIDである。このgroupIDは、アトラスNALユニットが属するアトラスタイルグループを識別する識別情報であり、各アトラスNALユニットに割り当てられる。

したがって、例えば図１５に示されるように、track_group_idとこのgroupIDとを紐付けることにより、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付けることができる。図１５の例の場合、track_group_id = 1のスペーシャルリージョントラックグループに対応するアトラスタイルグループ（そのアトラスNALユニット）に対してgroupID = 1が割り当てられ、track_group_id = 2のスペーシャルリージョントラックグループに対応するアトラスタイルグループ（そのアトラスNALユニット）に対してgroupID = 2が割り当てられている。なお、aud、atlas sps、およびatlas fpsのアトラスNALユニットには、groupID = 0が割り当てられている。groupID=0は全てのアトラスタイルグループの復号に必要なデータであることを示す。

符号化側装置は、このようなスペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報を含む紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、その紐付け情報に基づいて、所望の3Dスペーシャルリージョン（に対応するトラックグループ識別情報）に対応するグループ識別情報を特定することができる。そして、復号側装置は、その特定したグループ識別情報を用いて、所望の3Dスペーシャルリージョンに対応するアトラスNALユニットを特定することができる。

なお、このグループ識別情報は、図１６に示されるように、ISOBMFFのSampleToGroupBoxを用いて、サンプル毎に、アトラスNALユニットとアトラスタイルグループを紐付けるようにしてもよい。

また、例えば、非特許文献３で規定されるNALUMapEntry (‘nalm’)とTileRegionGroupEntry (‘trif’)とを利用して、スペーシャルリージョントラックグループとアトラスタイルグループ（を構成するアトラスNALユニット）とを紐付けるようにしてもよい。例えば、上述したグループ識別情報は、図１６の上側に示されるように、ISOBMFFのNALUMapEntryとTileRegionGroupEntryとを用いて、アトラスNALユニットとアトラスタイルグループを紐付けるようにしてもよい。

図１６の例の場合、SampleToGroupBoxのsample_count[1]およびgroup_description_index[1]、SampleGroupDescriptionBoxのNALUMapEntry[1]、並びに、SampleGroupDescriptionBoxのTileRegionGroupEntry[1]を用いて、スペーシャルリージョントラックグループとアトラスタイルグループ（を構成するアトラスNALユニット）とが紐付けられている。

符号化側装置は、このような紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、その紐付け情報に基づいて、所望の3Dスペーシャルリージョンに対応するアトラスNALユニットを特定することができる。

例えば、図１６の下側に示されるように、ISOBMFFのVPCCSpatialRegionsBoxを拡張することにより、track_group_idとgroupIDとを紐付けるようにしてもよい。例えば、上述したトラックグループ識別情報とグループ識別情報とを紐付ける情報は、ISOBMFFのVPCCSpatialRegionsBoxを用いて、トラックグループ識別情報とグループ識別情報とを紐付けるようにしてもよい。

図１６に示されるVPCCSpatialRegionsBoxのシンタックスは、図１２の例（方法１－１）と同様である。ただし、tile_group_idのセマンティクスを’nalm’のgroupIDとする。なお、tile_group_idのセマンティクスは、＜方法１－１＞において上述した場合と同一とし、（groupID - 1）がそのアトラスタイルグループNALユニットのtile_group_idとなるように設定してもよい。

なお、全ビデオサブビットストリームをマルチプレクスドトラックとして、１つのトラックに格納してもよい。また、trifのシグナルを省略してもよい。

なお、この方法１－２の場合、アトラスNALユニットに対してgroupIDを新規に割り当てるので、全アトラスサブビットストリームをパースせずに、所望のスペーシャルリージョントラックグループに対応するアトラスタイルグループを識別することができる。

なお、アトラスサブビットストリーム用にAtlasNALUMapEntryを定義して使用してもよい。そのシンタックスおよびセマンティクスは、NALUMapEntryと同一としてもよい。また、NALUMapEntryを拡張して、アトラスNALユニットを参照していることをシグナルしてもよい。HEVC NALユニットとアトラスNALユニットのシンタックスには相違があるため、パースと復号が異なることをクライアントに明示し、処理の切り替えを容易にすることができる。

＜方法１－３＞
また、図１０に示される表の上から４段目に示されるように、ビデオサブビットストリームをHEVC（High Efficiency Video Coding）のタイルを適用した符号化方式（HEVC tile）で符号化し、そのHEVCのタイルをアトラスタイルグループと紐付けるようにしてもよい（方法１－３）。

つまり、各ビデオサブビットストリームは、スペーシャルリージョントラックグループ毎にHEVCのタイルとして符号化される。そして、図１７に示されるように、2D位置を用いて（すなわち互いに同位置にある）そのHEVCのタイル（つまりスペーシャルリージョントラックグループ）とアトラスタイルグループとを紐付けるようにしてもよい。

例えば、＜方法１＞において上述したスペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報は、アトラスタイルグループと、そのアトラスタイルグループと同位置にあるHEVCのタイルに対応するビットストリームとを紐付ける情報を含むようにしてもよい。

符号化側装置は、このような紐付け情報をシグナリングする。復号側装置は、シグナルされたtile_group_idのアトラスタイルグループの位置情報に基づき、各ビデオサブビットストリーム（ジオメトリトラック（geometry track） / アトリビュートトラック（attribute track） / オキュパンシーマップトラック（occupancy map track））の対応する位置のタイルのみを復号する。

その際、復号側装置は、各トラックでシグナリングされるtrifからジオメトリトラック、アトリビュートトラック、およびオキュパンシーマップトラックのそれぞれのタイルリージョン（tile region）位置を識別することができる。したがって、復号側装置は、アトラスタイルグループのタイルリージョンと一致する各ビデオサブビットストリームのタイルリージョンを構成するNALユニットを抽出し、復号することができる。

図１８に示されるように、ISOBMFFのVPCCSpatialRegionsBoxを拡張することにより、アトラスタイルグループと、そのアトラスタイルグループと同位置にあるHEVCのタイルに対応するビットストリームとを紐付けてもよい。その場合のシンタックスは、図１６の例（方法１－２）と同様である。ただし、スペーシャルリージョントラックグループは１つである。

なお、スペーシャルリージョントラックグループの利用をオプション化し、SpatialRegionGroupBoxをシグナル不要にしてもよい。ジオメトリ、アトリビュート、およびオキュパンシーマップの各トラックと、V-PCCトラックは、トラックリファレンス（track reference）で紐づけられており、SpatialRegionGroupBoxのシグナルを省略することができる。その場合のVPCCSpatialRegionsBoxの拡張例を図１９に示す。

＜方法２＞
例えば、図１０に示される表の上から５段目に示されるように、シングルトラックストラクチャにおいて、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付けるようにしてもよい（方法２）。

例えば、＜3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報＞で上述した紐付け情報は、シングルトラックストラクチャにおいて3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報を含むようにしてもよい。

符号化側装置は、このような紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、アトラスサブビットストリームのうち、アクセスしたい3Dスペーシャルリージョンに該当する部分を構成するアトラスNALユニットのみを抽出することができる。つまり、復号側装置は、V-PCCビットストリームの、その3Dスペーシャルリージョンに対応する部分のみを汎用のデコーダで復号することができる。つまり、復号側装置は、ポイントクラウドの、その3Dスペーシャルリージョンに対応する部分のみを構築することができる。

＜方法２－１＞
例えば、図１０に示される表の上から６段目に示されるように、新たにgroupIDを割り当てて紐付けるようにしてもよい（方法２－１）。

例えば、＜方法２＞において上述した3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報は、その3Dスペーシャルリージョンと、アトラスNALユニットが属するアトラスタイルグループを識別するグループ識別情報とを紐付ける情報を含むようにしてもよい。

＜方法１－２＞では、非特許文献２で規定されるsample to group機能を利用し、アトラスサブビットストリームのサンプル（sample）毎にnalm, trifに紐付けを行うように説明した。

V-PCCビットストリーム（つまり、ジオメトリ、アトリビュート、オキュパンシーマップ、およびアトラス情報）を１つのトラックに格納シングルトラックストラクチャでは、方法１－２におけるサンプルがサブサンプル（sub-sample）となる。そこで、図２０に示されるように、方法１－３と同様の仕組みをこのサブサンプルに適用することができるように、新規Box（SubSampleToGroupBox）を定義する。より具体的には、サブサンプルにSampleGroupDescription (nalm, trif)を紐づけるため、sub sample to groupを新規定義し、sample to groupと置き換える。

まずVPCCSpatialRegionBoxを拡張する。その際、スペーシャルリージョントラックグループの利用をオプション化する。つまり、図１９の例（方法１－３）と同様のシンタックスを利用する。

さらに、図２１に示されるように、sub sample to groupを新規定義する。つまり、図２１に示されるようなシンタックスのSubSampleToGroupBoxをシグナルする。その場合、SubSampleInformationBoxもシグナルする。なお、このSubSampleToGroupBoxにおいて、sample_countは、サブサンプルを持つサンプル数を示す。また、subsample_countは、同じサンプルグループディスクリプタ（sample group descriptor）に紐づく連続するサブサンプル数を示す。その他のフィールド（field）のセマンティクスはSubSampleInformationBoxと同一である。

符号化側装置は、このような紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、その紐付け情報に基づいて、所望の3Dスペーシャルリージョンに対応するサブサンプルを特定することができる。

＜方法２－２＞
例えば、図１０に示される表の上から７段目に示されるように、3Dスペーシャルリージョン毎にV-PCCビットストリームを分けるようにしてもよい（方法２－２）。つまり、図２２に示されるように、3Dスペーシャルリージョン毎に分割した各V-PCCビットストリームを、互いに異なるトラックに格納してもよい。そして、紐付け情報によって、3Dスペーシャルリージョンと、その分割されたV-PCCビットストリーム（分割されたV-PCCビットストリームを格納するトラック）とを紐付けるようにしてもよい。

例えば、＜方法２＞において上述した3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報は、その3Dスペーシャルリージョンに対応するビットストリームを格納するトラックを識別するトラックグループ識別情報と、そのアトラスタイルグループを識別するアトラスタイルグループ識別情報とを紐付ける情報を含むようにしてもよい。

この場合、各トラックには、ジオメトリ、アトリビュート、オキュパンシーマップ、およびアトラス情報が格納される。各トラックの3Dスペーシャルリージョン情報は、VPCCSpatialRegionsBoxでシグナルされる。図２３にそのVPCCSpatialRegionsBoxのシンタックスの例を示す。シングルトラック（single track）で使用するときはtrack_group_id毎の3Dスペーシャルリージョンのシグナリングは不要であるので、フラグ（flags）で制御してもよい。なお、シングルトラックにシグナルされる場合、条件（flags & 1）は、１（真）となる。

符号化側装置は、このような紐付け情報をシグナリングする。復号側装置は、シグナリングされたその紐付け情報に基づいて3Dスペーシャルリージョンの復号を行う。このようにすることにより、復号側装置は、その紐付け情報に基づいて、所望の3Dスペーシャルリージョンに対応するトラック（分割されたV-PCCビットストリーム）を特定することができる。

＜方法３＞
例えば、図１０に示される表の上から８段目に示されるように、３次元空間において同一位置の代替3Dスペーシャルリージョンの切り替え表示を可能としてもよい（方法３）。

１つのポイントクラウドのオブジェクトにおいて３次元空間の同じ位置に重複するように異なる部分データを符号化しておき、状況に応じてその重複部分データを切り替えるというユースケースを実現できる。例えば、図２４のＡおよびＢに示されるように、オブジェクト２０１の頭部を、頭部２０２Ａとして表示したり、頭部２０２Ｂとして表示したりすることができるようにする。このようにすることにより、例えばユーザの好みに応じて頭部の表示を切り替えることができる。

このような機能を実現するために、１つのV-PCCビットストリーム中に、３次元空間で重複するポイントをビデオサブビットストリームの2D画像上の異なる矩形領域に配置する。図２４の例の場合、図２４のＣに示されるように、頭部２０２Ａのパッチと、頭部２０２Ｂのパッチを、互いに同一のビデオフレーム２０３の互いに異なる位置に配置する。

＜方法３－１＞
＜方法３＞において上述したような、３次元空間において同一位置にある代替3Dスペーシャルリージョンの切り替え表示を可能にする情報をシグナルするようにしてもよい。

つまり、＜3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける情報＞で上述した紐付け情報は、3Dスペーシャルリージョンの切り替えに関する情報である切替情報を含むようにしてもよい。

例えば、図２５に示されるように、VPCCSpatialRegionsBoxを拡張し、切替情報として、復号側装置が代替3Dスペーシャルリージョンを識別するためのAlternativeRegionListStructを新規定義する。

その切替情報は、表示の切り替えの条件に関する情報を含むようにしてもよい。例えば図２５に示されるAlternativeRegionListStructにおいて、list_type、region_type_value、ref_3d_region_id等の表示の切り替えの条件に関する情報がシグナルされる。

list_typeは、alternative regionの切り替え基準を示す。例えば、値「０」が言語設定に応じて切り替えることを示し、値「１」がユーザの年齢設定に応じて切り替えることを示すようにしてもよい。もちろん、これは一例であり、list_typeが取り得る値は任意である。また、各値が示す基準は任意である。

region_type_valueは、リージョン毎のタイプを示す。例えば、list_typeが言語設定に応じて切り替えることを示す値である場合、region_type_valueの値「０」が日本語（jpn）を示し、値「１」が英語（eng）を示すようにしてもよい。もちろん、これは一例であり、region_type_valueが取り得る値は任意である。また、各値が示すタイプは任意である。

ref_3d_region_idは、alternative regionの3d_region_idを示す。この値は、例えばプリセットされたユーザの嗜好情報によって静的に決定されるようにしてもよい。例えば、ユーザが日本語を希望するなら、region_type=0のalternative regionが選択されるようにしてもよい。これらと同等の情報をV-PCC codecのSEIとしてシグナルしてもよい。

もちろん、これらはシグナルされる情報の一例であり、これら以外の情報がシグナルされてもよい。また、動的に変化する場合には、DynamicRegionSampleを同様に拡張するようにしてもよい。

また、動的に外部から提供されるトリガに基づき、代替3Dスペーシャルリージョンを切り替えるようにしてもよい。そして、例えば、上述した切替情報は、切り替えのトリガとなるイベントに関する情報を含むようにしてもよい。

例えば、MPEG-DASH（Moving Picture Experts Group phase － Dynamic Adaptive Streaming over HTTP）のイベントメッセージ（event message）を適用してもよい。例えば、message_data[]にイベント識別情報（event_id）をシグナルし、コンテンツ配信側が所望のタイミングでイベントメッセージを送付する。クライアントはそのイベントメッセージを受け取ったら、event_idに応じて表示を切り替える。

また、シーンディスクリプション（Scene description）において、ユーザの何等かのインタラクション（interaction）の結果にevent_idを紐づけてもよい。例えば、MPEG-4 Scene Descriptionにおいて、同一V-PCCオブジェクトを参照する複数ノード（node（例えばbitwrapper））の参照URLクエリに異なるevent_idを設定し、これらのノードをSwitchノードでまとめる。さらに、タッチセンサ（TouchSensor）等のインタラクションのノードのeventOutとSwitchノードのexposedFieldを紐づける。このようにすることにより、シーンディスクリプションの機能を利用して、ユーザのインタラクションに応じて表示が切り替わる（シーンディスクリプションの機能を利用する）ようにしてもよい。

＜方法４＞
以上においてはファイルフォーマットとしてISOBMFFを適用する例について説明したが、V-PCCビットストリームを格納するファイルは任意であり、ISOBMFF以外であってもよい。例えば、図１０に示される表の最下段に示されるように、V-PCCビットストリームが、マトリョーシカメディアコンテナ（Matroska Media Container）に格納されるようにしてもよい（方法４）。マトリョーシカメディアコンテナの主な構成例を図２７に示す。

例えば、アトラスタイルグループの紐づけ情報が、Track Entry element下のVPCCSpatialRegionsBoxと同等の情報を持つelementにシグナルされるようにしてもよい。また、代替3Dスペーシャルリージョンの切替表示を可能にする情報は、Track Entry element下に新たに定義したelementとしてシグナルされるようにしてもよい。

＜組み合わせ＞
上述した方法１乃至方法４は、それらの一部または全部を適宜組み合わせて適用することができる。

＜２．第１の実施の形態＞
＜符号化装置＞
符号化側装置について説明する。＜１．紐付け情報のシグナリング＞において説明した本技術は、任意の装置において適用することができる。図２８は、本技術を適用した画像処理装置（符号化側装置）の一態様である符号化装置の構成の一例を示すブロック図である。図２８に示される符号化装置３００は、V-PCCを適用してポイントクラウドデータをビデオフレームとして２次元画像用の符号化方法により符号化を行う装置である。また、符号化装置３００は、その符号化により生成したV-PCCビットストリームをISOBMFFに格納する。

符号化装置３００は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用し、パーシャルアクセスを可能とするようにISOBMFFに情報を格納する。つまり、符号化装置３００は、3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報をシグナリングする。

なお、図２８においては、処理部やデータの流れ等の主なものを示しており、図２８に示されるものが全てとは限らない。つまり、符号化装置３００において、図２８においてブロックとして示されていない処理部が存在したり、図２８において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

図２８に示されるように符号化装置３００は、3D2D変換部３０１、2D符号化部３０２、メタデータ生成部３０３、PCストリーム生成部３０４、およびファイル生成部３０５を有する。

3D2D変換部３０１は、符号化装置３００に入力された3Dデータであるポイントクラウドをパッチに分解し、パッキングする。つまり、3D2D変換部３０１は、ジオメトリビデオフレーム、アトリビュートビデオフレーム、オキュパンシーマップビデオフレームを生成し、それらを2D符号化部３０２に供給する。また、3D2D変換部３０１は、アトラス情報を生成し、それを2D符号化部３０２に供給する。

2D符号化部３０２は、符号化に関する処理を行う。例えば、2D符号化部３０２は、3D2D変換部３０１から供給されるジオメトリビデオフレーム、アトリビュートビデオフレーム、オキュパンシーマップビデオフレーム、およびアトラス情報等を取得する。2D符号化部３０２は、それらを符号化し、ビットストリームを生成する。2D符号化部３０２は、生成したビットストリームをメタデータ生成部３０３およびPCストリーム生成部３０４に供給する。

2D符号化部３０２は、符号化部３１１乃至符号化部３１４を有する。符号化部３１１は、ジオメトリビデオフレームを符号化し、ジオメトリビデオサブビットストリームを生成する。2D符号化部３０２は、生成したジオメトリビデオサブビットストリームをメタデータ生成部３０３およびPCストリーム生成部３０４に供給する。

符号化部３１２は、アトリビュートビデオフレームを符号化し、アトリビュートビデオサブビットストリームを生成する。符号化部３１２は、生成したアトリビュートビデオサブビットストリームをメタデータ生成部３０３およびPCストリーム生成部３０４に供給する。

符号化部３１３は、オキュパンシーマップビデオフレームを符号化し、オキュパンシーマップビデオサブビットストリームを生成する。符号化部３１３は、生成したオキュパンシーマップビデオサブビットストリームをメタデータ生成部３０３およびPCストリーム生成部３０４に供給する。

符号化部３１４は、アトラス情報を符号化し、アトラスサブビットストリームを生成する。符号化部３１４は、生成したアトラスサブビットストリームをメタデータ生成部３０３およびPCストリーム生成部３０４に供給する。

メタデータ生成部３０３は、メタデータの生成に関する処理を行う。例えば、メタデータ生成部３０３は、2D符号化部３０２から供給されるビデオサブビットストリームやアトラスサブビットストリームを取得する。また、メタデータ生成部３０３は、それらのデータを用いてメタデータを生成する。

例えば、メタデータ生成部３０３は、メタデータとして、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成しうる。つまり、メタデータ生成部３０３は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用してメタデータを生成しうる。なお、メタデータ生成部３０３は、例えば、＜１．紐付け情報のシグナリング＞において上述した、方法１、方法１－１、方法１－２、方法１－３、方法２、方法２－１、方法２－２、方法３、方法３－１、および方法４、各種の変形例、並びに、複数方法の組み合わせ（以下、本技術の各種方法と称する）の内、いずれも適用することができる。

メタデータ生成部３０３は、このように、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を含むメタデータを生成すると、そのメタデータをファイル生成部３０５に供給する。

PCストリーム生成部３０４は、V-PCCビットストリームの生成に関する処理を行う。例えば、PCストリーム生成部３０４は、2D符号化部３０２から供給されるビデオサブビットストリームやアトラスサブビットストリームを取得する。また、PCストリーム生成部３０４は、それらを用いてV-PCCビットストリーム（ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリーム、およびアトラスサブビットストリーム、または、それらをまとめたもの）を生成し、ファイル生成部３０５に供給する。

ファイル生成部３０５は、ファイルの生成に関する処理を行う。例えば、ファイル生成部３０５は、メタデータ生成部３０３から供給される、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を含むメタデータを取得する。また、ファイル生成部３０５は、PCストリーム生成部３０４から供給されるV-PCCビットストリームを取得する。ファイル生成部３０５は、その紐付け情報を含むメタデータやV-PCCビットストリームを格納するファイル（例えばISOBMFFやマトリョーシカメディアコンテナ）を生成する。

その際、ファイル生成部３０５は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用し、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報をシグナリングするファイルを生成する。なお、ファイル生成部３０５は、＜１．紐付け情報のシグナリング＞において上述した本技術の各種方法の内、いずれも適用することができる。そして、ファイル生成部３０５は、生成したファイルを符号化装置３００の外部に出力する。

なお、これらの処理部（3D2D変換部３０１乃至ファイル生成部３０５、並びに、符号化部３１１乃至符号化部３１４）は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU（Central Processing Unit）、ROM（Read Only Memory）、RAM（Random Access Memory）等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。

以上のように、符号化装置３００は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用して、3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報をシグナリングする。

このようにすることにより、復号側装置は、アトラスサブビットストリームのうち、アクセスしたい3Dスペーシャルリージョンに該当する部分を構成するアトラスNALユニットのみを抽出することができる。つまり、復号側装置は、V-PCCビットストリームの内、その所望の3Dスペーシャルリージョンに対応する部分のみを復号することができる。つまり、復号側装置は、ポイントクラウドの、その所望の3Dスペーシャルリージョンに対応する部分のみを構築することができる。

このようにすることにより、復号側装置は、3Dスペーシャルリージョンとアトラスタイルグループとを紐付けることができる。したがって、復号側装置は、所望の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なコーデドタイルグループNALユニットおよびビデオサブビットストリームを抽出し、汎用のデコーダに入力することができる。よって、復号側装置は、所望の3Dスペーシャルリージョンの部分ポイントクラウドのみを構築し、表示することができる。

例えば、ストリーミング配信時にポイントクラウドのオブジェクトの視聴部分のみ取得することで帯域幅を有効活用して高精細化する、といった効果を得ることができる。このようなポイントクラウドのオブジェクトの配信技術は、ARやVR用途での6DoFコンテンツ配信への活用が期待される。

また、汎用のデコーダを利用することができるので、復号側装置は、アトラスサブビットストリームから、所望の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なコーデドタイルグループNALユニットを抽出し、復号することができる機能を有する専用のデコーダを開発する場合に比べて、コストの増大を抑制することができる。

＜符号化処理の流れ＞
この符号化装置３００により実行される符号化処理の流れの例を、図２９のフローチャートを参照して説明する。

符号化処理が開始されると、符号化装置３００の3D2D変換部３０１は、ステップＳ３０１において、ポイントクラウドをパッチに分解し、ジオメトリやアトリビュートのパッチを生成する。そして、3D2D変換部３０１は、そのパッチをビデオフレームにパッキングする。また、3D2D変換部３０１は、オキュパンシーマップやアトラス情報を生成する。

ステップＳ３０２において、2D符号化部３０２は、ジオメトリビデオフレーム、アトリビュートビデオフレーム、オキュパンシーマップビデオフレーム、およびアトラス情報を符号化する。例えば、符号化部３１１は、ジオメトリビデオフレームを任意の2Dデータ用の符号化方式（例えばAVCやHEVC等）を用いて符号化し、ジオメトリビデオサブビットストリームを生成する。また符号化部３１２は、アトリビュートビデオフレームを任意の2Dデータ用の符号化方式を用いて符号化し、アトリビュートビデオサブビットストリームを生成する。さらに符号化部３１３は、オキュパンシーマップビデオフレームを任意の2Dデータ用の符号化方式を用いて符号化し、オキュパンシーマップビデオサブビットストリームを生成する。また符号化部３１４は、アトラス情報を任意の符号化方式で符号化し、アトラスサブビットストリームを生成する。

ステップＳ３０３において、メタデータ生成部３０３は、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける紐付け情報を含むパーシャルアクセス情報をメタデータとして生成する。つまり、メタデータ生成部３０３は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用してメタデータを生成しうる。なお、メタデータ生成部３０３は、例えば、＜１．紐付け情報のシグナリング＞において上述した本技術の各種方法の内、いずれも適用することができる。

ステップＳ３０４において、PCストリーム生成部３０４は、ビデオサブビットストリームを用いてV-PCCビットストリーム（ポイントクラウドストリーム）を生成する。

ステップＳ３０５において、ファイル生成部３０５は、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を含むメタデータと、V-PCCビットストリームとを格納するファイル（例えばISOBMFFやマトリョーシカメディアコンテナ）を生成する。

その際、ファイル生成部３０５は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用する。つまりファイル生成部３０５は、＜１．紐付け情報のシグナリング＞において上述したように紐付け情報をシグナリングするファイルを生成する。なお、ファイル生成部３０５は、＜１．紐付け情報のシグナリング＞において上述した本技術の各種方法の内、いずれも適用することができる。

ステップＳ３０５の処理が終了すると符号化処理が終了する。

以上のように、符号化装置３００は、符号化処理において、＜１．紐付け情報のシグナリング＞において説明した本技術を適用し、3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報をシグナリングする。

このようにすることにより、復号側装置は、アトラスサブビットストリームのうち、アクセスしたい3Dスペーシャルリージョンに該当する部分を構成するアトラスNALユニットのみを抽出することができる。つまり、復号側装置は、ビデオサブビットストリームおよびアトラスサブビットストリームの、その3Dスペーシャルリージョンに対応する部分のみを汎用のデコーダで復号することができる。つまり、復号側装置は、ポイントクラウドの、その3Dスペーシャルリージョンに対応する部分のみを構築することができる。

＜３．第２の実施の形態＞
＜復号装置＞
＜１．紐付け情報のシグナリング＞において説明した本技術は、符号化側装置に限らず、復号側装置にも適用することができる。図３０は、本技術を適用した画像処理装置の一態様である復号装置の構成の一例を示すブロック図である。図３０に示される復号装置４００は、V-PCCを適用し、ポイントクラウドデータをビデオフレームとして２次元画像用の符号化方法により符号化されたV-PCCビットストリーム（ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリーム、およびアトラスサブビットストリーム、または、それらをまとめたもの）をファイルから取得し、２次元画像用の復号方法により復号し、ポイントクラウドを生成（再構築）する装置である。例えば、復号装置４００は、符号化装置３００が生成したファイルからV-PCCビットストリームを抽出し、復号してポイントクラウドを生成することができる。

その際、復号装置４００は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用し、パーシャルアクセスを実現する。つまり、復号装置４００は、シグナリングされた3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間領域に対応する3Dスペーシャルリージョン（つまり所望の3Dスペーシャルリージョン）に対応するV-PCCビットストリームのみを復号し、部分ポイントクラウドを構築することができる。

なお、図３０においては、処理部やデータの流れ等の主なものを示しており、図３０に示されるものが全てとは限らない。つまり、復号装置４００において、図３０においてブロックとして示されていない処理部が存在したり、図３０において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

図３０に示されるように復号装置４００は、ファイル処理部４０１、2D復号部４０２、および表示情報生成部４０３を有する。

ファイル処理部４０１は、復号装置４００に入力されるファイルからV-PCCビットストリームを抽出し、2D復号部４０２に供給する。その際、ファイル処理部４０１は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用し、シグナリングされた3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間領域に対応する3Dスペーシャルリージョン（つまり所望の3Dスペーシャルリージョン）に対応するV-PCCビットストリームを抽出する。なお、ファイル処理部４０１は、＜１．紐付け情報のシグナリング＞において上述した本技術の各種方法の内、いずれも適用することができる。そして、ファイル処理部４０１は、抽出したV-PCCビットストリームを2D復号部４０２に供給する。

つまり、抽出したV-PCCビットストリームのみが復号対象とされる。換言するに、ファイル処理部４０１は、シグナリングされたその紐付け情報に基づいて、所望の3Dスペーシャルリージョンのポイントクラウドの再構成に不要なV-PCCビットストリームを復号対象から除外する。

ファイル処理部４０１は、解析部４１１および抽出部４１２を有する。

解析部４１１は、復号装置４００に入力されるファイル（例えばISOBMFF等）の解析に関する処理を行う。例えば、ファイル処理部４０１は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用してファイルを解析し、ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応するスペーシャルリージョントラックグループおよびアトラスタイルグループを選択する。なお、解析部４１１は、＜１．紐付け情報のシグナリング＞において上述した本技術の各種方法の内、いずれも適用することができる。

つまり、解析部４１１は、３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、そのポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する3Dスペーシャルリージョンおよびアトラスタイルグループを選択する。

そして、解析部４１１は、選択したスペーシャルリージョントラックグループおよびアトラスタイルグループを示す情報を抽出部４１２に供給する。

抽出部４１２は、解析部４１１による解析結果に基づいて、V-PCCビットストリームから、復号対象とするデータを抽出する。つまり、抽出部４１２は、解析部４１１により選択されたアトラスタイルグループに対応するアトラスNALユニットをファイルから抽出する。また、抽出部４１２は、解析部４１１により選択されたスペーシャルリージョントラックグループに対応するビデオサブビットストリームをファイルから抽出する。抽出部４１２は、抽出したデータを2D復号部４０２に供給する。

2D復号部４０２は、復号に関する処理を行う。例えば、2D復号部４０２は、ファイル処理部４０１から供給されるジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリーム、およびアトラスサブビットストリーム等を取得する。2D復号部４０２は、それらを復号し、ビデオフレームやアトラス情報を生成する。2D復号部４０２は、生成したビットストリームをメタデータ生成部３０３およびPCストリーム生成部３０４に供給する。

2D復号部４０２は、復号部４２１乃至復号部４２４を有する。復号部４２１は、供給されたジオメトリビデオサブビットストリームを復号し、ジオメトリビデオフレーム（2Dデータ）を生成する。復号部４２１は、生成したジオメトリビデオフレームを表示情報生成部４０３に供給する。

復号部４２２は、アトリビュートビデオサブビットストリームを復号し、アトリビュートビデオフレーム（2Dデータ）を生成する。復号部４２２は、生成したアトリビュートビデオフレームを表示情報生成部４０３に供給する。

復号部４２３は、オキュパンシーマップビデオサブビットストリームを復号し、オキュパンシーマップビデオフレーム（2Dデータ）を生成する。復号部４２３は、生成したオキュパンシーマップビデオフレームを表示情報生成部４０３に供給する。

復号部４２４は、アトラスサブビットストリーム（抽出された前記アトラスNALユニット）を復号し、上述のビデオフレームに対応するアトラス情報を生成する。復号部４２４は、生成したアトラス情報を表示情報生成部４０３に供給する。

表示情報生成部４０３は、ポイントクラウドの構築やレンダリングに関する処理を行う。例えば、表示情報生成部４０３は、2D復号部４０２から供給されるビデオフレームやアトラス情報を取得する。また、表示情報生成部４０３は、取得したアトラス情報に基づいて、取得したビデオフレームにパッキングされたパッチからポイントクラウドを生成する。そして、表示情報生成部４０３は、そのポイントクラウドをレンダリングして、表示用画像を生成し、復号装置４００の外部に出力する。

表示情報生成部４０３は、例えば、2D3D変換部４３１および表示処理部４３３を有する。

2D3D変換部４３１は、2D復号部４０２から供給されるビデオフレームに配置されたパッチ（2Dデータ）をポイントクラウド（3Dデータ）に変換する。2D3D変換部４３１は、生成したポイントクラウドを表示処理部４３２に供給する。

表示処理部４３２は、レンダリングに関する処理を行う。例えば、表示処理部４３２は、2D3D変換部４３１から供給されるポイントクラウドを取得する。また、表示処理部４３２は、取得したポイントクラウドをレンダリングして表示用画像を生成する。表示処理部４３２は、生成した表示用画像を復号装置４００の外部（例えばモニタ等）に出力する。

以上のように、復号装置４００は、＜１．紐付け情報のシグナリング＞において説明した本技術を適用して、シグナリングされた3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいてパーシャルアクセスを行う。

このようにすることにより、復号装置４００は、アトラスサブビットストリームのうち、アクセスしたい3Dスペーシャルリージョンに該当する部分を構成するアトラスNALユニットのみを抽出することができる。つまり、復号装置４００は、V-PCCビットストリームの内、その所望の3Dスペーシャルリージョンに対応する部分のみを復号することができる。つまり、復号装置４００は、ポイントクラウドの、その所望の3Dスペーシャルリージョンに対応する部分のみを構築することができる。

このようにすることにより、復号装置４００は、3Dスペーシャルリージョンとアトラスタイルグループとを紐付けることができる。したがって、復号装置４００は、所望の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なコーデドタイルグループNALユニットおよびビデオサブビットストリームを抽出し、汎用のデコーダに入力することができる。よって、復号装置４００は、所望の3Dスペーシャルリージョンの部分ポイントクラウドのみを構築し、表示することができる。

また、汎用のデコーダを利用することができるので、復号装置４００は、アトラスサブビットストリームから、所望の3Dスペーシャルリージョンの部分ポイントクラウドを構築するために必要なコーデドタイルグループNALユニットを抽出し、復号することができる機能を有する専用のデコーダを開発する場合に比べて、コストの増大を抑制することができる。

＜復号処理の流れ＞
この復号装置４００により実行される復号処理の流れの例を、図３１のフローチャートを参照して説明する。

復号処理が開始されると、復号装置４００の解析部４１１は、ステップＳ４０１において、スペーシャルリージョントラックグループとアトラスタイルグループとを紐付ける情報を含むパーシャルアクセス情報に基づいて、所望の３次元空間に対応するスペーシャルリージョントラックグループとアトラスタイルグループとを選択する。

ステップＳ４０２において、抽出部４１２は、ステップＳ４０１において選択されたアトラスタイルグループに対応するアトラスNALユニットと、スペーシャルリージョントラックグループとに対応するビデオサブビットストリームとを抽出する。

ステップＳ４０３において、2D復号部４０２は、ステップＳ４０２において抽出されたアトラスNALユニットとビデオサブビットストリームとを復号する。

ステップＳ４０４において、2D3D変換部４３１は、ステップＳ４０３の処理により生成されたビデオフレームとアトラス情報とを用いてポイントクラウドを構築する。つまり、2D3D変換部４３１は、所望の３次元空間に対応する部分ポイントクラウドを構築する。

ステップＳ４０５において、表示処理部４３２は、ステップＳ４０４の処理において生成されたポイントクラウド（すなわち、所望の３次元空間に対応する部分ポイントクラウド）をレンダリングして表示用画像を生成する。つまり、表示処理部４３２は、所望の３次元空間に対応する表示用画像を生成する。

ステップＳ４０５の処理が終了すると復号処理が終了する。

以上のように、復号装置４００は、復号処理において、＜１．紐付け情報のシグナリング＞において説明した本技術を適用し、シグナリングされた3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の3Dスペーシャルリージョンに対応する部分ポイントクラウドを構築することができる。

＜４．付記＞
＜コンピュータ＞
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図２７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図２７に示されるコンピュータ９００において、CPU（Central Processing Unit）９０１、ROM（Read Only Memory）９０２、RAM（Random Access Memory）９０３は、バス９０４を介して相互に接続されている。

バス９０４にはまた、入出力インタフェース９１０も接続されている。入出力インタフェース９１０には、入力部９１１、出力部９１２、記憶部９１３、通信部９１４、およびドライブ９１５が接続されている。

入力部９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部９１４は、例えば、ネットワークインタフェースよりなる。ドライブ９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア９２１を駆動する。

以上のように構成されるコンピュータでは、CPU９０１が、例えば、記憶部９１３に記憶されているプログラムを、入出力インタフェース９１０およびバス９０４を介して、RAM９０３にロードして実行することにより、上述した一連の処理が行われる。RAM９０３にはまた、CPU９０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア９２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア９２１をドライブ９１５に装着することにより、入出力インタフェース９１０を介して、記憶部９１３にインストールすることができる。

また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部９１４で受信し、記憶部９１３にインストールすることができる。

その他、このプログラムは、ROM９０２や記憶部９１３に、あらかじめインストールしておくこともできる。

＜本技術の適用対象＞
以上においては、ポイントクラウドデータの符号化・復号に本技術を適用する場合について説明したが、本技術は、これらの例に限らず、任意の規格の３Ｄデータの符号化・復号に対して適用することができる。つまり、上述した本技術と矛盾しない限り、符号化・復号方式等の各種処理、並びに、３Ｄデータやメタデータ等の各種データの仕様は任意である。また、本技術と矛盾しない限り、上述した一部の処理や仕様を省略してもよい。

また、以上においては、本技術の適用例として、符号化装置３００および復号装置４００について説明したが、本技術は、任意の構成に適用することができる。

例えば、本技術は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機（例えばテレビジョン受像機や携帯電話機）、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置（例えばハードディスクレコーダやカメラ）などの、様々な電子機器に応用され得る。

また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

＜本技術を適用可能な分野・用途＞
本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。

＜その他＞
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

なお、本技術は以下のような構成も取ることができる。
（１）３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、前記ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する前記3Dスペーシャルリージョンおよび前記アトラスタイルグループを選択する選択部と、
前記ファイルから、前記選択部により選択された前記アトラスタイルグループに対応するアトラスNALユニットと、前記選択部により選択された前記3Dスペーシャルリージョンに対応するビットストリームを抽出する抽出部と、
前記抽出部により抽出された前記ビットストリームを復号し、前記所望の３次元空間の前記3Dスペーシャルリージョンに対応する2Dデータを生成し、前記抽出部により抽出された前記アトラスNALユニットを復号し、前記2Dデータに対応するアトラス情報を生成する復号部と
を備える画像処理装置。
（２）前記紐付け情報は、マルチトラックストラクチャにおいて、互いに同一の前記3Dスペーシャルリージョンに対応するビットストリームを格納するトラックのグループであるスペーシャルリージョントラックグループと、前記アトラスタイルグループとを紐付ける情報を含む
（１）に記載の画像処理装置。
（３）前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記ビットストリームを格納するトラックを識別するトラックグループ識別情報と、前記アトラスNALユニットが属する前記アトラスタイルグループを識別するグループ識別情報とを紐付ける情報を含む
（２）に記載の画像処理装置。
（４）前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記トラックグループ識別情報と前記グループ識別情報とを紐付ける情報は、前記ISOBMFFのVPCCSpatialRegionsBoxを用いて、前記トラックグループ識別情報と前記グループ識別情報とを紐付ける
（３）に記載の画像処理装置。
（５）前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記グループ識別情報は、前記ISOBMFFのNALUMapEntryを用いて、前記アトラスNALユニットと前記アトラスタイルグループを紐付ける
（３）または（４）に記載の画像処理装置。
（６）前記グループ識別情報は、前記ISOBMFFのSampleToGroupBoxを用いて、サンプル毎に、前記アトラスNALユニットと前記アトラスタイルグループを紐付ける
（５）に記載の画像処理装置。
（７）前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記ビットストリームを格納するトラックを識別するトラックグループ識別情報と、前記アトラスタイルグループを識別するアトラスタイルグループ識別情報とを紐付ける情報を含む
（２）乃至（６）のいずれかに記載の画像処理装置。
（８）前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける情報は、前記ISOBMFFのVPCCSpatialRegionsBoxを用いて、前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける
（７）に記載の画像処理装置。
（９）前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける情報は、前記ISOBMFFのSpatialRegionGroupBoxを用いて、前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける
（７）または（８）に記載の画像処理装置。
（１０）前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記3Dスペーシャルリージョンの分割情報を用いて、前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報を含む
（２）乃至（９）のいずれかに記載の画像処理装置。
（１１）前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記アトラスタイルグループと、前記アトラスタイルグループと同位置にあるHEVC（High Efficiency Video Coding）のタイルに対応する前記ビットストリームとを紐付ける情報を含む
（２）乃至（１０）のいずれかに記載の画像処理装置。
（１２）前記紐付け情報は、シングルトラックストラクチャにおいて前記3Dスペーシャルリージョンと前記アトラスタイルグループとを紐付ける情報を含む
（１）乃至（１１）のいずれかに記載の画像処理装置。
（１３）前記3Dスペーシャルリージョンと前記アトラスタイルグループとを紐付ける情報は、前記3Dスペーシャルリージョンと、前記アトラスNALユニットが属する前記アトラスタイルグループを識別するグループ識別情報とを紐付ける情報を含む
（１２）に記載の画像処理装置。
（１４）前記3Dスペーシャルリージョンと前記アトラスタイルグループとを紐付ける情報は、前記3Dスペーシャルリージョンに対応するビットストリームを格納するトラックを識別するトラックグループ識別情報と、前記アトラスタイルグループを識別するアトラスタイルグループ識別情報とを紐付ける情報を含む
（１２）または（１３）に記載の画像処理装置。
（１５）前記紐付け情報は、前記3Dスペーシャルリージョンの切り替えに関する情報である切替情報を含む
（１）乃至（１４）のいずれかに記載の画像処理装置。
（１６）前記切替情報は、前記切り替えの条件に関する情報を含む
（１５）に記載の画像処理装置。
（１７）前記切替情報は、前記切り替えのトリガとなるイベントに関する情報を含む
（１５）または（１６）に記載の画像処理装置。
（１８）３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、前記ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する前記3Dスペーシャルリージョンおよび前記アトラスタイルグループを選択し、
前記ファイルから、選択された前記アトラスタイルグループに対応するアトラスNALユニットと、選択された前記3Dスペーシャルリージョンに対応するビットストリームを抽出し、
抽出された前記ビットストリームを復号し、前記所望の３次元空間の前記3Dスペーシャルリージョンに対応する2Dデータを生成し、抽出された前記アトラスNALユニットを復号し、前記2Dデータに対応するアトラス情報を生成する
画像処理方法。

（１９）３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成する符号化部と、
前記3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成する紐付け情報生成部と、
前記符号化部により生成された前記ビットストリームと、前記紐付け情報生成部により生成された前記紐付け情報とを格納するファイルを生成するファイル生成部と
を備える画像処理装置。
（２０）３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成し、
前記3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成し、
生成された前記ビットストリームおよび前記紐付け情報を格納するファイルを生成する
画像処理方法。

３００符号化装置，３０１ 3D3D変換部，３０２ 2D符号化部，３０３メタデータ生成部，３０４ PCストリーム生成部，３０５ファイル生成部，３１１乃至３１４符号化部，４００復号装置，４０１ファイル処理部，４０２ 2D復号部，４０３表示情報生成部，４１１解析部，４１２抽出部，４２１乃至４２４復号部，４３１ 2D3D変換部，４３２表示処理部

Claims

３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、前記ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する前記3Dスペーシャルリージョンおよび前記アトラスタイルグループを選択する選択部と、
前記ファイルから、前記選択部により選択された前記アトラスタイルグループに対応するアトラスNALユニットと、前記選択部により選択された前記3Dスペーシャルリージョンに対応するビットストリームを抽出する抽出部と、
前記抽出部により抽出された前記ビットストリームを復号し、前記所望の３次元空間の前記3Dスペーシャルリージョンに対応する2Dデータを生成し、前記抽出部により抽出された前記アトラスNALユニットを復号し、前記2Dデータに対応するアトラス情報を生成する復号部と
を備える画像処理装置。
前記紐付け情報は、マルチトラックストラクチャにおいて、互いに同一の前記3Dスペーシャルリージョンに対応するビットストリームを格納するトラックのグループであるスペーシャルリージョントラックグループと、前記アトラスタイルグループとを紐付ける情報を含む
請求項１に記載の画像処理装置。
前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記ビットストリームを格納するトラックを識別するトラックグループ識別情報と、前記アトラスNALユニットが属する前記アトラスタイルグループを識別するグループ識別情報とを紐付ける情報を含む
請求項２に記載の画像処理装置。
前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記トラックグループ識別情報と前記グループ識別情報とを紐付ける情報は、前記ISOBMFFのVPCCSpatialRegionsBoxを用いて、前記トラックグループ識別情報と前記グループ識別情報とを紐付ける
請求項３に記載の画像処理装置。
前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記グループ識別情報は、前記ISOBMFFのNALUMapEntryを用いて、前記アトラスNALユニットと前記アトラスタイルグループを紐付ける
請求項３に記載の画像処理装置。
前記グループ識別情報は、前記ISOBMFFのSampleToGroupBoxを用いて、サンプル毎に、前記アトラスNALユニットと前記アトラスタイルグループを紐付ける
請求項５に記載の画像処理装置。
前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記ビットストリームを格納するトラックを識別するトラックグループ識別情報と、前記アトラスタイルグループを識別するアトラスタイルグループ識別情報とを紐付ける情報を含む
請求項２に記載の画像処理装置。
前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける情報は、前記ISOBMFFのVPCCSpatialRegionsBoxを用いて、前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける
請求項７に記載の画像処理装置。
前記ファイルは、ISOBMFF（International Organization for Standardization base media file format）のファイルであり、
前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける情報は、前記ISOBMFFのSpatialRegionGroupBoxを用いて、前記トラックグループ識別情報と前記アトラスタイルグループ識別情報とを紐付ける
請求項７に記載の画像処理装置。
前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記3Dスペーシャルリージョンの分割情報を用いて、前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報を含む
請求項２に記載の画像処理装置。
前記スペーシャルリージョントラックグループと前記アトラスタイルグループとを紐付ける情報は、前記アトラスタイルグループと、前記アトラスタイルグループと同位置にあるHEVC（High Efficiency Video Coding）のタイルに対応する前記ビットストリームとを紐付ける情報を含む
請求項２に記載の画像処理装置。
前記紐付け情報は、シングルトラックストラクチャにおいて前記3Dスペーシャルリージョンと前記アトラスタイルグループとを紐付ける情報を含む
請求項１に記載の画像処理装置。
前記3Dスペーシャルリージョンと前記アトラスタイルグループとを紐付ける情報は、前記3Dスペーシャルリージョンと、前記アトラスNALユニットが属する前記アトラスタイルグループを識別するグループ識別情報とを紐付ける情報を含む
請求項１２に記載の画像処理装置。
前記3Dスペーシャルリージョンと前記アトラスタイルグループとを紐付ける情報は、前記3Dスペーシャルリージョンに対応するビットストリームを格納するトラックを識別するトラックグループ識別情報と、前記アトラスタイルグループを識別するアトラスタイルグループ識別情報とを紐付ける情報を含む
請求項１２に記載の画像処理装置。
前記紐付け情報は、前記3Dスペーシャルリージョンの切り替えに関する情報である切替情報を含む
請求項１に記載の画像処理装置。
前記切替情報は、前記切り替えの条件に関する情報を含む
請求項１５に記載の画像処理装置。
前記切替情報は、前記切り替えのトリガとなるイベントに関する情報を含む
請求項１５に記載の画像処理装置。
３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドのビットストリームとともにファイルに格納される、前記ポイントクラウドの3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報に基づいて、所望の３次元空間に対応する前記3Dスペーシャルリージョンおよび前記アトラスタイルグループを選択し、
前記ファイルから、選択された前記アトラスタイルグループに対応するアトラスNALユニットと、選択された前記3Dスペーシャルリージョンに対応するビットストリームを抽出し、
抽出された前記ビットストリームを復号し、前記所望の３次元空間の前記3Dスペーシャルリージョンに対応する2Dデータを生成し、抽出された前記アトラスNALユニットを復号し、前記2Dデータに対応するアトラス情報を生成する
画像処理方法。
３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成する符号化部と、
前記3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成する紐付け情報生成部と、
前記符号化部により生成された前記ビットストリームと、前記紐付け情報生成部により生成された前記紐付け情報とを格納するファイルを生成するファイル生成部と
を備える画像処理装置。
３次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの3Dスペーシャルリージョンに対応する2Dデータを符号化し、ビットストリームを生成し、
前記3Dスペーシャルリージョンとアトラスタイルグループとを紐付ける紐付け情報を生成し、
生成された前記ビットストリームおよび前記紐付け情報を格納するファイルを生成する
画像処理方法。