WO2022220278A1

WO2022220278A1 - 情報処理装置および方法

Info

Publication number: WO2022220278A1
Application number: PCT/JP2022/017789
Authority: WO
Inventors: 由佳木山; 遼平高橋; 光浩平林
Original assignee: ソニーグループ株式会社
Priority date: 2021-04-14
Filing date: 2022-04-14
Publication date: 2022-10-20

Abstract

本開示は、再生制御主体にスペーシャルリージョン情報を提供することができるようにする情報処理装置および方法に関する。 3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、その3Dデータの再生を制御する再生制御者に提供する。また、そのスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成する。また、シーンディスクリプションに基づいてバッファ領域からそのスペーシャルリージョン情報を取得し、再生制御者に提供する。また、そのスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成する。本開示は、例えば、情報処理装置、または情報処理方法等に適用することができる。

Description

情報処理装置および方法

　本開示は、情報処理装置および方法に関し、特に、再生制御主体にスペーシャルリージョン情報を提供することができるようにした情報処理装置および方法に関する。

　従来、3D（３次元）オブジェクトを３次元空間内に配置し、レンダリングするためのシーンディスクリプション（Scene Description）のフォーマットであるglTF（The GL Transmission Format）（登録商標）2.0があった（例えば非特許文献１参照）。

　また、MPEG（Moving Picture Experts Group）-I Scene Descriptionにおいて、glTF2.0を拡張し、時間方向に動的なコンテンツを扱う方法が提案された（例えば非特許文献２参照）。

　ところで、ポイントクラウド（point cloud）の符号化方式として、ポイントクラウドをセグメンテーションして領域を形成し、その領域毎に平面投影して動画コーデックにより符号化するV-PCC（Video based Point Cloud Compression）が提案された（例えば、非特許文献３参照）。ポイントクラウドは、3次元空間上に位置情報と属性情報（色や反射等）を持つ点の集合によりオブジェクトの3次元構造を表現する3Dデータである。

　また、このV-PCCで符号化されたポイントクラウドの符号化データにより構成されるV3CビットストリームをISOBMFFに格納する方法が検討された（例えば、非特許文献４参照）。

　近年、シーン内に配置される3Dオブジェクトの実データとして、ISOBMFFに格納されたV3Cビットストリームを使用するための方法が検討された。その場合、クライアントにおいて、3Dデータの再構成をMAF（Media Access Function）で行う方法とPE（Presentation Engine）で行う方法が検討された。さらに、このV3Cビットストリームへのパーシャルアクセス（partial access）の機能のサポートも望まれた。

Saurabh Bhatia, Patrick Cozzi, Alexey Knyazev, Tony Parisi, "Khronos glTF2.0", https://github.com/KhronosGroup/glTF/tree/master/specification/2.0, June 9, 2017 "Text of ISO/IEC CD 23090-14 Scene Description for MPEG Media", ISO/IEC JTC 1/SC 29/WG 3 N00026, 2020-11-30 "ISO/IEC FDIS 23090-5 Visual Volumetric Video-based Coding and Video-based Point Cloud Compression", ISO/IEC JTC 1/SC 29/ WG 11 N19579, 2020-09-21 "Draft text of ISO/IEC FDIS 23090-10 Carriage of Visual Volumetric Video-based Coding Data",INTERNATIONAL ORGANIZATION FOR STANDARDIZATION ORGANISATION INTERNATIONALE DE NORMALISATION ISO/IEC JTC 1/SC 29/WG 03 MPEG SYSTEMS, ISO/IEC JTC 1/SC 29/WG 03 N0163, 19995, 2021-03-25

　例えば、このパーシャルアクセス機能を利用して、コンテンツを再生するクライアント装置において、コンテンツの再生を制御する再生制御主体（再生制御者とも称する）が3Dデータに含まれる所望のスペーシャルリージョンを選択し、そのスペーシャルリージョンを優先的に（例えば高画質に）再生することが望まれた。その場合、例えば、クライアント装置が、3Dデータに含まれるスペーシャルリージョンについての情報を再生制御主体に提供し、再生制御主体が、優先させるスペーシャルリージョンをその情報に基づいて選択する方法が考えられる。

　しかしながら、上述の非特許文献に記載の方法では、スペーシャルリージョンについての情報を再生制御主体に提供することが困難であった。

　本開示は、このような状況に鑑みてなされたものであり、再生制御主体にスペーシャルリージョン情報を提供することができるようにするものである。

　本技術の一側面の情報処理装置は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、前記3Dデータの再生を制御する再生制御者に提供する提供部を備える情報処理装置である。

　本技術の一側面の情報処理方法は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、前記3Dデータの再生を制御する再生制御者に提供する情報処理方法である。

　本技術の他の側面の情報処理装置は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成するファイル生成部を備える情報処理装置である。

　本技術の他の側面の情報処理方法は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成する情報処理方法である。

　本技術のさらに他の側面の情報処理装置は、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、前記3Dデータの再生を制御する再生制御者に提供する提供部を備える情報処理装置である。

　本技術のさらに他の側面の情報処理方法は、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、前記3Dデータの再生を制御する再生制御者に提供する情報処理方法である。

　本技術のさらに他の側面の情報処理装置は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成するファイル生成部を備える情報処理装置である。

　本技術のさらに他の側面の情報処理方法は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成する情報処理方法である。

　本技術の一側面の情報処理装置および方法においては、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報がシーンディスクリプションから取得され、その3Dデータの再生を制御する再生制御者に提供される。

　本技術の他の側面の情報処理装置および方法においては、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルが生成される。

　本技術のさらに他の側面の情報処理装置および方法においては、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報が取得され、その3Dデータの再生を制御する再生制御者に提供される。

　本技術のさらに他の側面の情報処理装置および方法においては、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルが生成される。

glTF2.0の主な構成例を示す図である。 glTFオブジェクトと参照関係の例を示す図である。シーンディスクリプションの記述例を示す図である。バイナリデータへのアクセス方法について説明する図である。シーンディスクリプションの記述例を示す図である。 buffer object、buffer view object、accessor objectの関係を説明する図である。 buffer object、buffer view object、accessor objectの記述例を示す図である。シーンディスクリプションのオブジェクトの構成例を説明する図である。シーンディスクリプションの記述例を示す図である。オブジェクトの拡張方法について説明する図である。クライアント処理の構成について説明する図である。タイムドメタデータを扱うためのextensionの構成例を示す図である。シーンディスクリプションの記述例を示す図である。シーンディスクリプションの記述例を示す図である。タイムドメタデータを扱うためのextensionの構成例を示す図である。クライアントの主な構成例を示す図である。クライアント処理の流れの例を説明するフローチャートである。 V-PCCの概要を説明する図である。 V-PCCビットストリームの主な構成例を示す図である。マルチトラックストラクチャの場合のISOBMFFのトラックの構成例を示す図である。マルチトラックストラクチャの場合のMPDの記述例を示す図である。パーシャルアクセスのためのISOBMFFのトラックの構成例を示す図である。 3Dスペーシャルリージョンについて説明する図である。バウンディングボックス情報とスペーシャルリージョン情報の格納場所について説明するための図である。バウンディングボックス情報とスペーシャルリージョン情報を格納するためのシンタックスの例を示す図である。スペーシャルリージョン情報を格納するためのシンタックスの例を示す図である。クライアント処理の例を示す図である。 3Dデータの再構成をMAFで行う場合の、シーンディスクリプションにおけるオブジェクトの構成例を示す図である。 3Dデータの再構成をPEで行う場合の、シーンディスクリプションにおけるオブジェクトの構成例を示す図である。 3Dデータの再構成をPEで行う場合の、シーンディスクリプションにおけるオブジェクトの構成例を示す図である。パーシャルアクセスを利用した再生制御のユースケースについて説明するための図である。パーシャルアクセスを利用した再生制御のユースケースについて説明するための図である。スペーシャルリージョン情報を用いた再生制御のための方法の例を示す図である。シーンディスクリプションのオブジェクト構成例を示す図である。シーンディスクリプションの記述例を示す図である。クライアント処理の流れの例を示すフローチャートである。シーンディスクリプションのオブジェクト構成例を示す図である。シーンディスクリプションの記述例を示す図である。クライアント処理の流れの例を示すフローチャートである。ファイル生成装置の主な構成例を示すブロック図である。ファイル生成処理の流れの例を示すフローチャートである。ファイル生成処理の流れの例を示すフローチャートである。クライアント装置の主な構成例を示すブロック図である。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．技術内容・技術用語をサポートする文献等
　２．MPEG-Iシーンディスクリプション
　３．スペーシャルリージョン情報の利用
　４．第１の実施の形態（ファイル生成装置）
　５．第２の実施の形態（クライアント装置）
　６．付記

　＜１．技術内容・技術用語をサポートする文献等＞
　本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献等に記載されている内容や以下の非特許文献において参照されている他の文献の内容等も含まれる。

　非特許文献１：（上述）
　非特許文献２：（上述）
　非特許文献３：（上述）
　非特許文献４：（上述）

　つまり、上述の非特許文献に記載されている内容や、上述の非特許文献において参照されている他の文献の内容等も、サポート要件を判断する際の根拠となる。例えば、非特許文献１乃至非特許文献３に記載されるglTF2.0やそのextensionなどのシンタックスや用語が本開示において直接的に定義されていない場合でも、本開示の範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）等の技術用語についても同様に、本開示において直接的に定義されていない場合でも、本開示の範囲内であり、請求の範囲のサポート要件を満たすものとする。

　＜２．MPEG-Iシーンディスクリプション＞
　　＜gltf2.0＞
　従来、例えば、非特許文献１に記載のように、3D（３次元）オブジェクトを３次元空間内に配置するためのフォーマットであるglTF（The GL Transmission Format）（登録商標）2.0があった。glTF2.0では、例えば図１に示されるように、JSONフォーマットファイル（.glTF）と、バイナリファイル（.bin）と、イメージファイル（.pngや.jpg等）とにより構成される。バイナリファイルは、ジオメトリやアニメーション等のバイナリデータを格納する。イメージファイルは、テクスチャ等のデータを格納する。

　JSONフォーマットファイルは、JSON（JavaScript（登録商標） Object Notation）で記述されたシーンディスクリプションファイル（scene description file）である。シーンディスクリプションとは、3Dコンテンツのシーン（の説明）を記述するメタデータである。このシーンディスクリプションの記述により、どのようなシーンであるかが定義される。シーンディスクリプションファイルは、そのようなシーンディスクリプションを格納するファイルである。本開示においては、シーンディスクリプションファイルのことをシーン記述ファイルとも称する。

　JSONフォーマットファイルの記述は、キー（KEY）とバリュー（VALUE）のペアの羅列により構成される。以下にその書式の例を示す。
　“KEY”:”VALUE”

　キーは文字列により構成される。バリューは数値、文字列、真偽値、配列、オブジェクト、またはnull等により構成される。

　また、複数のキーとバリューのペア（“KEY”:”VALUE”）を、｛｝（中かっこ）を用いてまとめることができる。この中かっこでまとめたものをJSONオブジェクトとも称する。以下にその書式の例を示す。
　“user”:{"id":1, "name":"tanaka”}

　この例の場合、キー（user）に対応するバリューとして、"id":1のペアと"name":"tanaka”のペアをまとめたJSONオブジェクトが定義されている。

　また、０個以上のバリューを、[]（大かっこ）を用いて配列化することもできる。この配列をJSON配列とも称する。このJSON配列の要素として、例えば、JSONオブジェクトを適用することもできる。以下にその書式の例を示す。
　test":["hoge", "fuga", "bar"]
　"users":[{"id":1, "name":"tanaka"},{"id":2,"name":"yamada"},{"id":3, "name":"sato"}]

　JSONフォーマットファイルの最上位に記載できるglTFオブジェクト（glTF object）と、それらが持てる参照関係を図２に示す。図２に示されるツリー構造の長丸がオブジェクトを示し、そのオブジェクト間の矢印が参照関係を示している。図２に示されるように、"scene"、"node"、"mesh"、"camera"、"skin"、"material"、"texture"等のオブジェクトがJSONフォーマットファイルの最上位に記述される。

　このようなJSONフォーマットファイル（シーンディスクリプション）の記述例を図３に示す。図３のJSONフォーマットファイル２０は、最上位の一部の記述例を示している。このJSONフォーマットファイル２０において、使用されるトップレベルオブジェクト（top-level object）２１は、全て最上位に記述される。このトップレベルオブジェクト２１は、図２に示されるglTFオブジェクトである。また、JSONフォーマットファイル２０においては、矢印２２として示されるように、オブジェクト（object）間の参照関係が示される。より具体的には、上位オブジェクトのプロパティ（property）で、参照するオブジェクトの配列の要素のインデックス（index）を指定することによりその参照関係が示される。

　図４は、バイナリデータへのアクセス方法について説明する図である。図４に示されるように、バイナリデータは、バッファオブジェクト（buffer object）に格納される。つまり、バッファオブジェクトにおいてバイナリデータにアクセスするための情報（例えばURI（Uniform Resource Identifier）等）が示される。JSONフォーマットファイルにおいては、図４に示されるように、例えばメッシュ（mesh）、カメラ（camera）、スキン（skin）等のオブジェクトから、そのバッファオブジェクトに対して、アクセサオブジェクト（accessor object）とバッファビューオブジェクト（bufferView object）を介してアクセスすることができる。

　つまり、メッシュ（mesh）、カメラ（camera）、スキン（skin）等のオブジェクトにおいては、参照するアクセサオブジェクトが指定される。JSONフォーマットファイルにおけるメッシュオブジェクト（mesh）の記述例を図５に示す。例えば、図５のように、メッシュオブジェクトにおいては、NORMAL、POSITION、TANGENT、TEXCORD_0等の頂点の属性（アトリビュート（attribute））がキーとして定義され、その属性毎に、参照するアクセサオブジェクトがバリューとして指定されている。

　バッファオブジェクト、バッファビューオブジェクト、アクセサオブジェクトの関係を図６に示す。また、JSONフォーマットファイルにおけるそれらのオブジェクトの記述例を図７に示す。

　図６において、バッファオブジェクト４１は、実データであるバイナリデータにアクセスするための情報（URI等）と、そのバイナリデータのデータ長（例えばバイト長）を示す情報とを格納するオブジェクトである。図７のＡは、そのバッファオブジェクト４１の記述例を示している。図７のＡに示される「"bytelength":102040」は、図６に示されるように、バッファオブジェクト４１のバイト長が102040バイト（bytes）であることを示している。また、図７のＡに示される「"uri":"duck.bin"」は、図６に示されるように、バッファオブジェクト４１のURIが"duck.bin"であることを示している。

　図６において、バッファビューオブジェクト４２は、バッファオブジェクト４１において指定されたバイナリデータのサブセット（subset）領域に関する情報（つまりバッファオブジェクト４１の一部の領域に関する情報）を格納するオブジェクトである。図７のＢは、そのバッファビューオブジェクト４２の記述例を示している。図６や図７のＢに示されるように、バッファビューオブジェクト４２は、例えば、そのバッファビューオブジェクト４２が属するバッファオブジェクト４１の識別情報、そのバッファオブジェクト４１内におけるそのバッファビューオブジェクト４２の位置を示すオフセット（例えばバイトオフセット）、そのバッファビューオブジェクト４２のデータ長（例えばバイト長）を示すレングス（例えばバイトレングス）等の情報を格納する。

　図７のＢに示されるように、バッファビューオブジェクトが複数存在する場合、そのバッファビューオブジェクト毎（つまりサブセット領域毎）に情報が記述される。例えば、図７のＢにおいて上側に示される、「"buffer":0」、「"bytelength":25272」、「"byteOffset":0」等の情報は、図６においてバッファオブジェクト４１内に示される１つ目のバッファビューオブジェクト４２（bufferView[0]）の情報である。また、図７のＢにおいて下側に示される、「"buffer":0」、「"bytelength":76768」、「"byteOffset":25272」等の情報は、図６においてバッファオブジェクト４１内に示される２つ目のバッファビューオブジェクト４２（bufferView[1]）の情報である。

　図７のＢに示される１つ目のバッファビューオブジェクト４２（bufferView[0]）の「"buffer":0」は、図６に示されるように、そのバッファビューオブジェクト４２（bufferView[0]）が属するバッファオブジェクト４１の識別情報が「0」（Buffer[0]）であることを示している。また、「"bytelength":25272」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイト長が25272バイトであることを示している。さらに、「"byteOffset":0」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイトオフセットが0バイトであることを示している。

　図７のＢに示される２つ目のバッファビューオブジェクト４２（bufferView[1]）の「"buffer":0」は、図６に示されるように、そのバッファビューオブジェクト４２（bufferView[0]）が属するバッファオブジェクト４１の識別情報が「0」（Buffer[0]）であることを示している。また、「"bytelength":76768」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイト長が76768バイトであることを示している。さらに、「"byteOffset":25272」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイトオフセットが25272バイトであることを示している。

　図６において、アクセサオブジェクト４３は、バッファビューオブジェクト４２のデータの解釈方法に関する情報を格納するオブジェクトである。図７のＣは、そのアクセサオブジェクト４３の記述例を示している。図６や図７のＣに示されるように、アクセサオブジェクト４３は、例えば、そのアクセサオブジェクト４３が属するバッファビューオブジェクト４２の識別情報、そのバッファビューオブジェクト４２の、バッファオブジェクト４１内における位置を示すオフセット（例えばバイトオフセット）、そのバッファビューオブジェクト４２のコンポーネントタイプ、そのバッファビューオブジェクト４２に格納されるデータ数、そのバッファビューオブジェクト４２に格納されるデータのタイプ等の情報を格納する。これらの情報は、バッファビューオブジェクト毎に記述される。

　図７のＣの例では、「"bufferView":0」、「"byteOffset":0」、「"componentType":5126」、「"count":2106」、「"type":"VEC3"」等の情報が示されている。「"bufferView":0」は、図６に示されるように、そのアクセサオブジェクト４３が属するバッファビューオブジェクト４２の識別情報が「0」（bufferView[0]）であることを示している。また、「"byteOffset":0」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイトオフセットが0バイトであることを示している。さらに、「"componentType":5126」は、コンポーネントタイプが、FLOAT型（OpenGLマクロ定数）であることを示している。また、「"count":2106」は、そのバッファビューオブジェクト４２（bufferView[0]）に格納されるデータが2106個であることを示している。さらに、「"type":"VEC3"」は、そのバッファビューオブジェクト４２（bufferView[0]）に格納されるデータ（のタイプ）が３次元ベクトルであることを示している。

　イメージ（image）以外のデータへのアクセスは、全てこのアクセサオブジェクト４３への参照により（アクセサのインデックスを指定することにより）定義される。

　次に、このようなglTF2.0に準拠するシーンディスクリプション（JSONフォーマットファイル）において、ポイントクラウドの3Dオブジェクトを指定する方法について説明する。ポイントクラウドは、立体構造物（３次元形状のオブジェクト）を多数の点の集合として表現する3Dコンテンツである。ポイントクラウドのデータは、各点の位置情報（ジオメトリ（geometry）とも称する）と属性情報（アトリビュート（attribute）とも称する）とにより構成される。アトリビュートは任意の情報を含むことができる。例えば、各ポイントの色情報、反射率情報、法線情報等がアトリビュートに含まれるようにしてもよい。このようにポイントクラウドは、データ構造が比較的単純であるとともに、十分に多くの点を用いることにより任意の立体構造物を十分な精度で表現することができる。

　ポイントクラウドが時間方向に変化しない（静的であるとも称する）場合、glTF2.0のmesh.primitives objectを用いて3Dオブジェクトを指定する。図８は、ポイントクラウドが静的な場合の、シーンディスクリプションにおけるオブジェクトの構成例を示す図である。図９は、そのシーンディスクリプションの記述例を示す図である。

　図９に示されるように、primitives objectのmodeは、データ（data）がポイントクラウドの点（point）として扱われることを示す0に指定される。図８や図９に示されるように、mesh.primitives内のattributesオブジェクトのポジションプロパティ（POSITION property）において、点（Point）の位置情報を格納するバッファ（buffer）へのアクセサ（accessor）が指定される。同様に、attributesオブジェクトのカラープロパティ（COLOR property）において、点（Point）の色情報を格納するバッファ（buffer）へのアクセサ（accessor）が指定される。バッファ（buffer）とバッファビュー（bufferView）は１つであってもよい（１つのファイル（file）にデータ（data）が格納されてもよい）。

　次に、このようなシーンディスクリプションのオブジェクトの拡張について説明する。glTF2.0の各オブジェクトは、拡張オブジェクト（extension object）内に新たに定義されたオブジェクトを格納することができる。図１０は、新たに定義されたオブジェクト（ExtensionExample）を規定する場合の記述例を示す。図１０に示されるように、新たに定義されたextensionを使用する場合、“extensionUsed”と”extensionRequired”にそのextension object名（図１０の例の場合、ExtensionExample）が記述される。これにより、このextensionが、使用されるなextensionであること、または、ロード（load）に必要なextensionであることが示される。

　　＜クライアント処理＞
　次に、MPEG-I Scene Descriptionにおけるクライアント装置の処理について説明する。クライアント装置は、シーンディスクリプションを取得し、そのシーンディスクリプションに基づいて3Dオブジェクトのデータを取得し、そのシーンディスクリプションや3Dオブジェクトのデータを用いて表示画像を生成する。

　非特許文献２に記載のように、クライアント装置では、プレゼンテーションエンジンやメディアアクセスファンクション等が処理を行う。例えば、図１１に示されるように、クライアント装置５０のプレゼンテーションエンジン（Presentation Engine）５１が、シーンディスクリプションの初期値やそのシーンディスクリプションを更新するための情報（以下、更新情報とも称する）を取得し、処理対象時刻のシーンディスクリプションを生成する。そして、プレゼンテーションエンジン５１は、そのシーンディスクリプションを解析し、再生するメディア（動画や音声等）を特定する。そして、プレゼンテーションエンジン５１は、メディアアクセスAPI（Media Access API（Application Program Interface））経由で、メディアアクセスファンクション（Media Access Function）５２に対してそのメディアの取得を要求する。また、プレゼンテーションエンジン５１は、パイプライン処理の設定やバッファの指定等も行う。

　メディアアクセスファンクション５２は、プレゼンテーションエンジン５１から要求されたメディアの各種データをクラウド（Cloud）やローカルストレージ（Local Storage）等から取得する。メディアアクセスファンクション５２は、取得したメディアの各種データ（符号化データ）をパイプライン（Pipeline）５３に供給する。

　パイプライン５３は、供給されたメディアの各種データ（符号化データ）を、パイプライン処理により復号し、その復号結果をバッファ（Buffer）５４に供給する。バッファ５４は、供給されたメディアの各種データを保持する。

　プレゼンテーションエンジン５１は、バッファ５４に保持されているメディアの各種データを用いてレンダリング（Rendering）等を行う。

　　＜Timed mediaの適用＞
　近年、例えば、非特許文献２に示されるように、MPEG-I Scene Descriptionにおいて、glTF2.0を拡張し、３Ｄオブジェクトコンテンツとしてタイムドメディア（Timed media）を適用することが検討されている。タイムドメディアとは、２次元画像における動画像のように、時間軸方向に変化するメディアデータである。

　glTFは、メディアデータ（3Dオブジェクトコンテンツ）として、静止画データのみ適用可能であった。つまり、glTFは、動画像のメディアデータには対応していなかった。3Dオブジェクトを動かす場合は、アニメーション（時間軸に沿って静止画を切り替える方法）が適用されていた。

　MPEG-I Scene Descriptionでは、そのglTF2.0を適用し、シーンディスクリプションとしてJSONフォーマットファイルを適用し、さらに、メディアデータとして、タイムドメディア（例えばビデオデータ）を扱うことができるようにglTFを拡張することが検討されている。タイムドメディアを扱うために、例えば以下のような拡張が行われる。

　図１２は、タイムドメディアを扱うための拡張について説明する図である。図１２の例において、MPEGメディアオブジェクト（MPEG_media）は、glTFのextensionであり、例えば、uri, track, renderingRate, startTime等、ビデオデータ等のMPEGメディアの属性を指定するオブジェクトである。

　また、図１２に示されるように、テクスチャオブジェクト（texture）の拡張オブジェクト（extensions）として、MPEGテクスチャビデオオブジェクト（MPEG_texture_video）が設けられる。そのMPEGテクスチャビデオオブジェクトには、アクセスするバッファオブジェクトに対応するアクセサの情報が格納される。すなわち、MPEGテクスチャビデオオブジェクトは、MPEGメディアオブジェクト（MPEG_media）で指定されたテクスチャメディア（texture media）が復号されて格納されるバッファ（buffer）に対応するアクセサ（accessor）のインデックスを指定するオブジェクトである。

　図１３は、タイムドメディアを扱うための拡張について説明するための、シーンディスクリプションにおけるMPEGメディアオブジェクト（MPEG_media）およびMPEGテクスチャビデオオブジェクト（MPEG_texture_video）の記述例を示す図である。図１３の例の場合、上から２行目において下記のように、テクスチャオブジェクト（texture）の拡張オブジェクト（extensions）として、MPEGテクスチャビデオオブジェクト（MPEG_texture_video）が設定されている。そして、そのMPEGビデオテクスチャオブジェクトのバリューとして、アクセサのインデックス（この例では「2」）が指定されている。

"texture":[{"sampler":0, "source":1, "extensions":{"MPEG_texture_video ":"accessor":2}}],

　また、図１３の例の場合、上から７行目乃至１６行目において下記のように、glTFの拡張オブジェクト（extensions）として、MPEGメディアオブジェクト（MPEG_media）が設定されている。そして、そのMPEGメディアオブジェクトのバリューとして、例えば、そのMPEGメディアオブジェクトの符号化やURI等といった、MPEGメディアオブジェクトに関する様々な情報が格納されている。

"MPEG_media":{
  "media":[
        {"name":"source_1", "renderingRate":30.0, "startTime":9.0, "timeOffset":0.0,
          "loop":"true", "controls":"false",
          "alternatives":[{"mimeType":"video/mp4;codecs=\"avc1.42E01E\"", "uri":"video1.mp4",
                                     "tracks":[{"track":""#track_ID=1"}]
                         }]
        }
  ]
}

　また、各フレームデータはデコードされ順次バッファに格納されるが、その位置などが変動するため、シーンディスクリプションには、その変動する情報を格納して、レンダラ（renderer）がデータを読みだせるようにする仕組みが設けられる。例えば、図１２に示されるように、バッファオブジェクト（buffer）の拡張オブジェクト（extensions）として、MPEGバッファサーキュラオブジェクト（MPEG_buffer_circular）が設けられる。そのMPEGバッファサーキュラオブジェクトには、バッファオブジェクト内にデータを動的に格納するための情報が格納される。例えば、バッファヘッダ（bufferHeader）のデータ長を示す情報や、フレーム数を示す情報等といった情報がこのMPEGバッファサーキュラオブジェクトに格納される。なお、バッファヘッダは、例えば、インデックス（index）、格納されるフレームデータのタイムスタンプやデータ長等といった情報を格納する。

　また、図１２に示されるように、アクセサオブジェクト（accessor）の拡張オブジェクト（extensions）として、MPEGアクセサタイムドオブジェクト（MPEG_timed_accessor）が設けられる。この場合、メディアデータは動画なので時間方向に参照するバッファビューオブジェクト（bufferView）が変化し得る（位置が変動し得る）。そこで、その参照するバッファビューオブジェクトを示す情報が、このMPEGアクセサタイムドオブジェクトに格納される。例えば、MPEGアクセサタイムドオブジェクトには、タイムドアクセサインフォメーションヘッダ（timedAccessor information header）が記述されるバッファビューオブジェクト（bufferView）への参照を示す情報が格納される。なお、タイムドアクセサインフォメーションヘッダは、例えば、動的に変化するアクセサオブジェクトとバッファビューオブジェクト内の情報を格納するヘッダ情報である。

　図１４は、タイムドメディアを扱うための拡張について説明するための、シーンディスクリプションにおけるMPEGバッファサーキュラオブジェクト（MPEG_buffer_circular）およびMPEGアクセサタイムドオブジェクト（MPEG_accessor_timed）の記述例を示す図である。図１４の例の場合、上から５行目において下記のように、アクセサオブジェクト（accessors）の拡張オブジェクト（extensions）として、MPEGアクセサタイムドオブジェクト（MPEG_accessor_timed）が設定されている。そして、そのMPEGアクセサタイムドオブジェクトのバリューとして、バッファビューオブジェクトのインデックス（この例では「1」）、アップデートレート（updateRate）、不変の情報（immutable）等のパラメータとその値が指定されている。

"MPEG_accessor_timed":{"bufferView":1, "updateRate":25.0, "immutable":1,"}

　また、図１４の例の場合、上から１３行目において下記のように、バッファオブジェクト（buffer）の拡張オブジェクト（extensions）として、MPEGバッファサーキュラオブジェクト（MPEG_buffer_circular）が設定されている。そして、そのMPEGバッファサーキュラオブジェクトのバリューとして、バッファフレームカウント（count）、ヘッダ長（headerLength）、アップデートレート（updateRate）等のパラメータとその値が指定されている。

"MPEG_buffer_circular":{"count":5, "headerLength":12, "updateRate":25.0}

　図１５は、タイムドメディアを扱うための拡張について説明するための図である。図１５において、MPEGアクセサタイムドオブジェクトやMPEGバッファサーキュラオブジェクトと、アクセサオブジェクト、バッファビューオブジェクト、およびバッファオブジェクトとの関係の例を示す。

　バッファオブジェクトのMPEGバッファサーキュラオブジェクトには、上述したように、バッファフレームカウント（count）、ヘッダ長（headerLength）、アップデートレート（updateRate）等といった、バッファオブジェクトによって示されるバッファ領域に時間変化するdataを格納するのに必要な情報が格納される。また、そのバッファ領域のヘッダであるバッファヘッダ（bufferHeader）には、インデックス（index）、タイムスタンプ（timestamp）、データ長（length）等のパラメータが格納される。

　アクセサオブジェクトのMPEGアクセサタイムドオブジェクトには、上述したように、バッファビューオブジェクトのインデックス（bufferView）、アップデートレート（updateRate）、不変の情報（immutable）等といった、参照するバッファビューオブジェクトに関する情報が格納される。また、このMPEGアクセサタイムドオブジェクトには、参照するタイムドアクセサインフォメーションヘッダが格納されるバッファビューオブジェクトに関する情報が格納される。タイムドアクセサインフォメーションヘッダには、タイムスタンプデルタ（timestamp_delta）、アクセサオブジェクトの更新データ、バッファビューオブジェクトの更新データ等が格納され得る。

　　＜MPEG_texture_video使用時のクライアント処理＞
　シーンディスクリプションは、１つ以上の3Dオブジェクトを3D空間に配置するための空間配置情報である。このシーンディスクリプションは、時間軸に沿ってその内容を更新することができる。つまり、時間の経過とともに、3Dオブジェクトの配置を更新することができる。その際のクライアント装置において行われるクライアント処理について説明する。

　図１６は、クライアント装置の、クライアント処理に関する主な構成例を示し、図１７は、そのクライアント処理の流れの例を示すフローチャートである。図１６に示されるように、クライアント装置は、プレゼンテーションエンジン（Presentation Engine（以下、PEとも称する））５１、メディアアクセスファンクション（Media Access Function（以下、MAFとも称する））５２、パイプライン（Pipeline）５３、およびバッファ（Buffer）５４を有する。プレゼンテーションエンジン（PE）５１は、glTF解析部６３およびレンダリング（Rendering）処理部６４を有する。

　プレゼンテーションエンジン（PE）５１は、メディアアクセスファンクション５２にメディアを取得させ、バッファ５４を介してそのデータを取得し、表示に関する処理等を行う。具体的には例えば以下のような流れで処理が行われる。

　クライアント処理が開始されると、プレゼンテーションエンジン（PE）５１のglTF解析部６３は、図１７の例のようにPE処理を開始し、ステップＳ２１において、シーンディスクリプションファイルであるSD(glTF)ファイル６２を取得し、そのシーンディスクリプションを解析（parse）する。

　ステップＳ２２において、glTF解析部６３は、3Dオブジェクト（texture）に紐づくメディア（media）と、そのメディアを処理後に格納するバッファ（buffer）と、アクセサ（accessor）を確認する。ステップＳ２３において、glTF解析部６３は、ファイル取得要求として、メディアアクセスファンクション５２にその情報を通知する。

　メディアアクセスファンクション（MAF）５２は、図１７の例のようにMAF処理を開始し、ステップＳ１１において、その通知を取得する。ステップＳ１２において、メディアアクセスファンクション５２は、その通知に基づいてメディア（3Dオブジェクトファイル（mp4））を取得する。

　ステップＳ１３において、メディアアクセスファンクション５２は、取得したメディア（3Dオブジェクトファイル（mp4））を復号する。ステップＳ１４において、メディアアクセスファンクション５２は、復号して得られたメディアのデータを、プレゼンテーションエンジン（PE５１）からの通知に基づいて、バッファ５４に格納する。

　ステップＳ２４において、プレゼンテーションエンジン５１のレンダリング処理部６４は、そのデータを適切なタイミングにおいてバッファ５４から読み出す（取得する）。ステップＳ２５において、レンダリング処理部６４は、取得したデータを用いてレンダリングを行い、表示用画像を生成する。

　メディアアクセスファンクション５２は、ステップＳ１３およびステップＳ１４の処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。また、プレゼンテーションエンジン５１のレンダリング処理部６４は、ステップＳ２４およびステップＳ２５の処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。全てのフレームについて処理が終了すると、メディアアクセスファンクション５２はMAF処理を終了し、プレゼンテーションエンジン５１はPE処理を終了する。つまり、クライアント処理が終了する。

　　＜V-PCCの概要＞
　ところで、例えば非特許文献３に記載のように、３次元空間上に位置情報と属性情報（色や反射等）を同時に持つ点の集合であるポイントクラウド（point cloud）の符号化方式として、ポイントクラウドをセグメンテーションして領域を形成し、その領域毎に平面投影して動画コーデックにより符号化するV-PCC（Video based Point Cloud Compression）が提案された。

　V-PCCでは、ポイントクラウドのジオメトリやアトリビュートが、小領域毎に２次元平面に投影される。本開示において、この小領域を部分領域という場合がある。このジオメトリやアトリビュートが２次元平面に投影された画像を投影画像とも称する。また、この小領域（部分領域）毎の投影画像をパッチ（patch）と称する。例えば、図１８のＡのオブジェクト７１（3Dデータ）が、図１８のＢに示されるようなパッチ７２（2Dデータ）に分解される。ジオメトリのパッチの場合、各画素値は、ポイントの位置情報を示す。ただし、その場合、ポイントの位置情報は、その投影面に対して垂直方向（奥行方向）の位置情報（デプス値（Depth））として表現される。

　そして、このように生成された各パッチがビデオシーケンスのフレーム画像（ビデオフレームとも称する）内に配置される。ジオメトリのパッチが配置されたフレーム画像をジオメトリビデオフレーム（Geometry video frame）とも称する。また、アトリビュートのパッチが配置されたフレーム画像をアトリビュートビデオフレーム（Attribute video frame）とも称する。例えば、図１８のＡのオブジェクト７１から、図１８のＣに示されるようなジオメトリのパッチ７３が配置されたジオメトリビデオフレーム８１と、図１８のＤに示されるようなアトリビュートのパッチ７４が配置されたアトリビュートビデオフレーム８２が生成される。例えば、ジオメトリビデオフレーム８１の各画素値は、上述のデプス値を示す。

　そして、これらのビデオフレームが、例えばAVC（Advanced Video Coding）やHEVC（High Efficiency Video Coding）等といった２次元画像用の符号化方法で符号化される。つまり、３次元構造を表す3Dデータであるポイントクラウドデータを、２次元画像用のコーデックを用いて符号化することができる。

　なお、オキュパンシーマップ（オキュパンシー画像とも称する）を用いることもできる。オキュパンシーマップは、ジオメトリビデオフレームやアトリビュートビデオフレームのNxN画素毎に、投影画像（パッチ）の有無を示すマップ情報である。例えば、オキュパンシーマップは、ジオメトリビデオフレームやアトリビュートビデオフレームの、パッチが存在する領域（NxN画素）を値「１」で示し、パッチが存在しない領域（NxN画素）を値「０」で示す。

　デコーダは、このオキュパンシーマップを参照することにより、パッチが存在する領域であるか否かを把握することができるので、符号化・復号により生じるノイズ等の影響を抑制することができ、より正確に3Dデータを復元することができる。例えば、符号化・復号によりデプス値が変化しても、デコーダは、オキュパンシーマップを参照することにより、パッチが存在しない領域のデプス値を無視することができる。つまり、デコーダは、オキュパンシーマップを参照することにより、3Dデータの位置情報として処理しないようにすることができる。

　例えば、ジオメトリビデオフレーム１１およびアトリビュートビデオフレーム１２に対して、図１８のＥに示されるようなオキュパンシーマップ８３を生成してもよい。オキュパンシーマップ８３において、白の部分が値「１」を示し、黒の部分が値「０」を示している。

　このようなオキュパンシーマップが、ジオメトリビデオフレームやアトリビュートビデオフレームとは別のデータ（ビデオフレーム）として符号化され、復号側に伝送され得る。つまり、オキュパンシーマップも、ジオメトリビデオフレームやアトリビュートビデオフレームと同様に、AVCやHEVC等の２次元画像用の符号化方法で符号化することができる。

　ジオメトリビデオフレームを符号化して生成される符号化データ（ビットストリーム）をジオメトリビデオサブビットストリーム（geometry video sub-bitstream）とも称する。アトリビュートビデオフレームを符号化して生成される符号化データ（ビットストリーム）をアトリビュートビデオサブビットストリーム（attribute video sub-bitstream）とも称する。オキュパンシーマップを符号化して生成される符号化データ（ビットストリーム）をオキュパンシーマップビデオサブビットストリーム（occupancy map video sub-bitstream）とも称する。なお、ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリームを互いに区別して説明する必要が無い場合、ビデオサブビットストリーム（video sub-bitstream）と称する。

　さらに、パッチ（2Dデータ）からポイントクラウド（3Dデータ）を再構成するための情報であるアトラス情報（atlas）が符号化され、復号側に伝送される。アトラス情報の符号化方法（および復号方法）は任意である。アトラス情報を符号化して生成される符号化データ（ビットストリーム）をアトラスサブビットストリーム（atlas sub-bitstream）とも称する。

　なお、以下において、ポイントクラウド（のオブジェクト）は、２次元画像の動画像のように、時間方向に変化し得る（動的であるとも称する）ものとする。つまり、ジオメトリデータやアトリビュートデータは、時間方向の概念を有し、２次元画像の動画像のように、所定の時間毎にサンプリングされたデータとする。なお、２次元画像のビデオフレームのように、各サンプリング時刻のデータをフレームと称する。つまり、ポイントクラウドデータ（ジオメトリデータやアトリビュートデータ）は、２次元画像の動画像のように、複数フレームにより構成されるものとする。本開示において、このポイントクラウドのフレームのことを、ポイントクラウドフレームとも称する。V-PCCの場合、このような動画像（複数フレーム）のポイントクラウドであっても、各ポイントクラウドフレームをビデオフレーム化してビデオシーケンスとすることで、動画像の符号化方式を用いて高効率に符号化することができる。

　　＜V-PCCビットストリームの構造＞
　エンコーダは、上述したようなジオメトリビデオフレーム、アトリビュートビデオフレーム、オキュパンシーマップ、およびアトラス情報の符号化データを多重化し、１つのビットストリームを生成する。このビットストリームをV-PCCビットストリーム（V-PCC Bitstream）とも称する。

　図１９は、V-PCCビットストリームの主な構成例を示す図である。図１９に示されるようにV-PCCビットストリーム９１は、複数のV-PCCユニット（V-PCC Unit）９２を含む。

　V-PCCユニット９２は、V-PCCユニットヘッダ（V-PCC unit header）９３とV-PCCユニットペイロード（V-PCC unit payload）９４を含む。V-PCCユニットヘッダ９３は、V-PCCユニットペイロード９４に格納される情報の種類（タイプ）を示す情報を含む。V-PCCユニットペイロード９４は、そのV-PCCユニットヘッダ９３でシグナルされるタイプに応じて、V-PCCパラメータセット（V-PCC Parameter Set）９５、ジオメトリビデオサブビットストリーム９６（Geometry Video Data）、アトリビュートビデオサブビットストリーム９７（Attribute Video Data）、オキュパンシーマップビデオサブビットストリーム９８（Occupancy Video Data）、アトラスサブビットストリーム９９（Atlas Data）等が格納され得る。V-PCCパラメータセット（V-PCC Parameter Set）９５には、V-PCCユニット９２に関するパラメータが格納される。

　　＜ISOBMFFへの格納方法＞
　また、例えば非特許文献４に記載のように、このV-PCCで符号化されたポイントクラウドの符号化データにより構成されるV-PCCビットストリーム（V3Cビットストリームとも称する）をISOBMFFに格納する方法が検討された。非特許文献４には、V3CビットストリームをISOBMFFに格納する方法として、シングルトラックストラクチャ（single track structure）とマルチトラックストラクチャ（multi-track structure）との２種類が規定されている。

　シングルトラックストラクチャは、V3Cビットストリームを１つのトラックに格納する方法である。つまりこの場合、ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシーマップビデオサブビットストリーム、およびアトラスサブビットストリームが互いに同一のトラックに格納される。

　マルチトラックストラクチャは、ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシービデオサブビットストリーム、およびアトラスサブビットストリームをそれぞれ個別のトラック（track）に格納する方法である。各ビデオサブビットストリームは、従来の2Dビデオストリームであるので、2Dの場合と同様の手法で格納（管理）することができる。マルチトラックストラクチャを適用する場合のファイルの構成例を図２０に示す。図２０に示されるように、マルチトラックストラクチャの場合、１つのトラック（V3Cアトラストラック（V3C atlas track））に、V3Cビットストリームを格納する他のトラック（V3Cビデオコンポーネントトラック（V3C video component track）とも称する）にアクセスするための情報であるトラックリファレンス（Track References）が格納される。つまり、各V3Cビデオコンポーネントトラックは、このトラックリファレンスによりV3Cアトラストラックに紐づけられている。

　なお、MPEG-DASH（Moving Picture Experts Group Dynamic Adaptive Streaming over HTTP（Hypertext Transfer Protocol））を適用して3Dオブジェクトコンテンツを配信する場合、その配信を制御するための制御ファイルであるMPD（Media Presentation Description）に、V-PCCを構成するAdaptationSetを取りまとめるための情報として、preselection elementやpreselection Descriptorを格納してもよい。図２１にその記述例を示す。つまり、この場合、MPDのこれらの情報により、V3Cビットストリームを構成する各ビットストリームが互いに関連付けられる。

　　＜パーシャルアクセス＞
　ところで非特許文献４には、ポイントクラウドのオブジェクトの一部分を取得したり、復号したりするためのパーシャルアクセス（partial access）情報が規定されている。例えば、このパーシャルアクセス情報を利用することにより、ストリーミング配信時にポイントクラウドのオブジェクトの表示部分の情報のみを取得するといった制御が可能になる。このような制御により、帯域幅を有効活用して高精細化する、といった効果を得ることができる。

　このような機能を実現するために、ポイントクラウドは、その領域（スペーシャルリージョン）毎に独立に復号することができるように符号化される。つまり、スペーシャルリージョン毎に独立にポイントクラウドが符号化され、スペーシャルリージョン毎の符号化データ（V3Cビットストリーム）が生成される。そして、そのスペーシャルリージョン毎のV3Cビットストリームは、ISOBMFFの互いに異なるV3Cビデオコンポーネントトラックに格納される。つまり、V3Cビットストリームがスペーシャルリージョン毎に分けてV3Cビデオコンポーネントトラックに格納される。

　例えば、図２２の例のように、3Dオブジェクト１００Ａのバウンディングボックス１００において、バウンディングボックス１００を２分割したスペーシャルリージョン１０１とスペーシャルリージョン１０２が設けられるとする。図２２に示されるように、スペーシャルリージョン１０１の各コンポーネントのV3Cビットストリームと、スペーシャルリージョン１０２の各コンポーネントV3Cビットストリームは、互いに異なるトラックに格納される。

　各スペーシャルリージョン（V-PCCタイル（V-PCC tile）とも称する）のV3Cアトラストラックには、そのスペーシャルリージョン（V-PCCタイル）の各コンポーネントのV3Cビデオコンポーネントトラックへのトラックリファレンスが格納される。全体のV3Cアトラストラックには、各スペーシャルリージョン（V-PCCタイル）のV3Cアトラストラックへのトラックリファレンスが格納される。また、全体のV3CアトラストラックのV3Cすぺーしょるリージョンボックス（V3CSpatialRegionsBox）には、各V-PCCタイル（各スペーシャルリージョン）の3D空間情報（位置や範囲（大きさ）等の情報）が格納される。

　3D空間情報は、以下のように記述される。例えば、図２３のＡに示されるように、ポイントクラウドのオブジェクトに対して、そのオブジェクトを内包する３次元領域であるバウンディングボックス（Bounding box）１１１が設定されているとする。この場合、ISOBMFFにおいて、図２３のＢに示されるように、バウンディングボックス１１１に関する情報であるバウンディングボックス情報（3DBoundingBoxStruct）が設定される。バウンディングボックス情報において、バウンディングボックス１１１の基準点（orgin）の座標は（0, 0, 0）とされ、バウンディングボックス１１１のサイズは（bb_dx, bb_dy, bb_dz）で指定される。

　図２３のＡに示されるように、このバウンディングボックス１１１内に、独立に復号可能な部分領域である3Dスペーシャルリージョン（3D spatial region）１１２を設定することができる。その場合、図２３のＢに示されるように、ISOBMFFにおいてパーシャルアクセス情報として、3Dスペーシャルリージョン１１２に関する情報である3Dスペーシャルリージョン情報（3dSpatialRegionStruct）を設定すればよい。3Dスペーシャルリージョン情報において、その領域は、その基準点の座標（x, y, z）とサイズ（cuboid_dx, cuboid_dy, cuboid_dz）で指定される。

　3Dスペーシャルリージョンは１つ以上のタイルで構成される。パーシャルアクセスは、3Dスペーシャルリージョン単位で行われるが、3Dスペーシャルリージョンとタイルが同一であるようにすることで、タイル単位でのパーシャルアクセスが可能となる。

　3D空間情報は例えば以下の場所に格納される。バウンディングボックス情報は、例えば、図２４に示されるように、V3CアトラストラックまたはV3Cアトラストラックに紐づけられたダイナミックボリュメトリックメタデータトラック（dynamic volumetric metadata track）のサンプルエントリ（sample entry）内のV3Cバウンディングインフォメーションボックス（V3CBoundingInformationBox）に格納されてもよい。図２５の記述１３１は、そのV3Cバウンディングインフォメーションボックスの記述例を示す。

　また、3Dスペーシャルリージョン情報は、例えば、V3CアトラストラックまたはV3Cアトラストラックに紐づけられたダイナミックボリュメトリックメタデータトラック（dynamic volumetric metadata track）のサンプルエントリ（sample entry）内のV3Cスペーシャルリージョンボックス（V3CSpatialRegionsBox）に格納されてもよい。図２５の記述１３２は、そのV3Cスペーシャルリージョンボックスの記述例を示す。この記述１３２に示されるように、V3Cスペーシャルリージョンボックスにおいて、3Dスペーシャルリージョン情報（3dSpatialRegionStruct）とタイルの識別情報（tile_id）が設定され、スペーシャルリージョンとタイルが紐づけられている。

　なお、3Dスペーシャルリージョン情報は、例えば、ダイナミックボリュメトリックメタデータトラック（dynamic volumetric metadata track）のV3Cボリュメトリックメタデータサンプル（V3CVolumetricMetadataSample）に格納されてもよい。図２６の記述１３３は、そのV3Cボリュメトリックメタデータサンプルの記述例を示す。

　　＜パーシャルアクセスに関するSEI＞
　非特許文献３ではパーシャルアクセスに関わるSEI（Supplemental Enhancement Information）が規定されており、非特許文献４ではそれらの使用が規定されている。

　例えば、パーシャルアクセスに関わるアトラスサブビットストリーム（atlas sub-bitstream）のSEIとして、Scene object information SEI、Patch information SEI、Volumetric rectangle information SEI、およびObject label information SEIの４つが規定されている。

　Scene object information SEIでは、オブジェクト（object）が定義され、プロパティズ（properties）が付与される。Patch information SEIでは、オブジェクトとパッチ（patch）の関係性が定義される。Volumetric rectangle information SEIでは、オブジェクトとビデオコーデッドコンポーネント（video coded component）矩形領域の関係性が定義される。Object label information SEIでは、オブジェクトにラベル（label）が付与される。

　Scene object information SEIおよびObject label information SEIにより、プロパティズ（properties）がパッチ単位で付与される。そのプロパティズには、例えば、オブジェクトの識別子（object id）が含まれてもよい。また、オブジェクトを囲むcuboid領域（3Dスペーシャルリージョン）を示すbounding boxが含まれてもよい。また、オブジェクトを視聴できる３次元円錐領域を示すvisibility coneが含まれてもよい。また、優先度を示すpriorityが含まれてもよい。また、オブジェクトの表示・非表示を示すhiddenが含まれてもよい。また、オブジェクト間の依存関係を示すdependencyが含まれてもよい。また、ラベルを示すlabelが含まれてもよい。また、衝突判定用の形状を示すcollision shapeが含まれてもよい。また、ポイントクラウドの点の形やサイズを示すpoint styleが含まれてもよい。また、ポイントクラウドの点の素材を示すmaterialが含まれてもよい。

　パーシャルアクセスに関するアトラスサブビットストリーム（atlas sub-bitstream）の４つのSEIは、例えば、情報が時間方向に静的（static）な場合、V3Cアトラストラックサンプルエントリ（V3C atlas track sample entry）内のV3Cコンフィグレーションボックス（V3CConfigurationBox）に格納されてもよい。また、情報が時間方向に動的（更新頻度が少ないdynamic）な場合、その４つのSEIは、V3Cアトラストラック（V3C atlas track）のV3CAtlasParamSampleGroupDescriptionEntryに格納されてもよい。また、情報が時間方向に動的（更新頻度が多いdynamic）な場合、その４つのSEIは、V3Cアトラストラック（V3C atlas track）のV3Cサンプル（V3Csample）に格納されてもよい。更新の頻度に応じて適切な箇所が選択され格納される。

　　＜クライアント処理のパタン＞
　コンテンツ（3Dデータ）を再生するクライアント装置は、V3Cビットストリームを復号し、得られた2Dデータから3Dデータ（例えばポイントクラウド）を再構成する。その場合、クライアント装置は、その3Dデータの再構成をMAFで行うこともできるし、PEで行うこともできる。それぞれの場合でバッファに格納されるデータが異なる。

　例えば、図２７に示されるように、MAFが実行するMAF処理においては、3Dオブジェクトを構成するV-PCCファイルの取得処理と、そのV-PCCファイル（V3Cビットストリーム）の復号処理が行われる。MAFにおいて3Dデータが再構成される場合、復号処理の後、図２７の上側の実線矢印のように、再構成処理が行われ、その処理結果、すなわち3Dデータがバッファに格納される。この場合、PEが実行するPE処理では、そのバッファに格納された3Dデータが読み出され、レンダリング処理が行われることにより表示用画像が生成される。

　これに対して、PEにおいて3Dデータが再構成される場合、MAF処理では、図２７の下側の点線矢印のように、復号処理結果、すなわち2Dデータ等がバッファに格納される。この場合、PE処理では、そのバッファに格納された2Dデータ等が読み出され、再構成処理により3Dデータが再構成され、レンダリング処理が行われることにより表示用画像が生成される。

　したがって、MAFにおいて3Dデータ（ポイントクラウドデータ）が再構成される場合、シーンディスクリプションには、図２８に示されるように、3Dデータ用のアトリビュート（attribute）が格納される。ただし、バッファに格納されるデータは再構成されたものである。これに対して、MPEG_mediaで指定されるデータは再構成される前のものである。つまり、属性がトラックと１対１では紐づかない。したがって各バッファから参照するMPEG_mediaは、全てのコンポーネントデータを取りまとめるV3Cアトラストラック（V3C atlas track）とされる。

　これに対して、PEにおいて3Dデータ（ポイントクラウドデータ）が再構成される場合、バッファにはV3C復号されたV3Cコンポーネントストリーム（V3C component stream）が格納される。つまり、2Dデータ等がバッファに格納される。したがって、シーンディスクリプションには、V3Cコンポーネント（2Dデータ）用のアトリビュート（attribute）が格納される。

　この場合、バッファに格納されるV3CコンポーネントデータとMPEG_mediaで示されるトラックとの紐づけ方法には、以下の２通りがある。すなわち、例えば、図２９に示されるように、バッファとV3Cコンポーネントトラックとを１対１で紐づけてもよい。また、図３０に示されるように、全てのコンポーネントデータを取りまとめるV3Cアトラストラック（V3C atlas track）を各バッファから参照してもよい。

　　＜パーシャルアクセス機能を利用した再生制御＞
　上述したパーシャルアクセス機能を利用した再生方法として、例えば、コンテンツを再生するクライアント装置において、コンテンツの再生を制御する再生制御主体（再生制御者とも称する）が3Dデータに含まれる所望のスペーシャルリージョンを選択し、そのスペーシャルリージョンを優先的に（例えば高画質に）再生することが望まれた。

　その場合、例えば、クライアント装置が、3Dデータに含まれるスペーシャルリージョンについての情報を再生制御主体に提供し、再生制御主体が、優先させるスペーシャルリージョンをその情報に基づいて選択する方法が考えられる。

　例えば、図３１に示されるように、3Dデータ全体を包含するバウンディングボックス１８０内に「人物Ａ」の3Dオブジェクト１８１と、「人物Ｂ」の3Dオブジェクト１８２とが存在するとする。そして、その3Dオブジェクト１８１を包含するスペーシャルリージョン１８３と、3Dオブジェクト１８２を包含するスペーシャルリージョン１８４とが設定されているとする。

　クライアント装置は、このようなスペーシャルリージョンについての情報を、再生制御主体に提供する。ここで、再生制御主体（再生制御者）とは、コンテンツの再生を制御する存在である。再生制御主体は、具体的にはどのようなものであってもよい。例えば、再生制御主体は、クライアント装置のユーザ（例えば人物、動物、機械等）であってもよいし、クライアント装置におけるコンテンツの再生を制御するソフトウエアプログラムであってもよい。このソフトウエアプログラムは、クライアント装置において実行されてもよいし、クライアント装置との通信が可能な他の装置において実行されてもよい。

　例えば、図３２に示されるように、モニタ１９１に選択画面（GUI（Graphical User Interface））１９２としてスペーシャルリージョンについての情報を、再生制御主体であるユーザに提示してもよい。

　そして、再生制御主体は、その提供されたスペーシャルリージョンについての情報に基づいて、再生を優先させるスペーシャルリージョンを選択する。クライアント装置は、その選択を受け付け、その選択にしたがって再生を制御する。

　例えば、図３２のように選択画面１９２がユーザに提示された場合、ユーザがその選択画面に基づいて優先させる3Dオブジェクト（例えば、人物Ａ、人物Ｂ等）を選択し、決定ボタンを押すと、クライアント装置は、その選択された3Dオブジェクトに対応するスペーシャルリージョンを優先再生対象として高画質に再生する。

　このようにすることにより、クライアント装置は、例えば、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。そのため、このようなユースケースは有用である。

　しかしながら、上述の非特許文献に記載の方法では、スペーシャルリージョンについての情報をMAFからPEに渡すことが困難であった。そのため、PEがスペーシャルリージョンについての情報を再生制御主体に提供することが困難であった。

　＜３．スペーシャルリージョン情報の利用＞
　　＜スペーシャルリージョン情報の格納＞
　そこで、図３３に示される表の最上段に示されるように、シーンディスクリプション（以下、SDとも称する）において、スペーシャルリージョンを識別するためのスペーシャルリージョン情報を格納するエクステンションが規定されるようにする（#1）。つまり、スペーシャルリージョン情報がシーンディスクリプションに格納されるようにする。シーンディスクリプションは、3Dコンテンツのシーン（の説明）を記述するメタデータである。このシーンディスクリプションの記述により、どのようなシーンであるかが定義される。

　例えば、情報処理装置（例えばファイル生成装置）において、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成するファイル生成部を備えるようにする。

　また、例えば、情報処理方法（例えばファイル生成処理）において、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成するようにする。

　シーンディスクリプションファイルは、シーンディスクリプションを格納するファイルである。このようにすることにより、クライアント装置において、PEが、シーンディスクリプションをパースすることによりスペーシャルリージョン情報を取得することができる。したがって、PEが、スペーシャルリージョンについての情報を再生制御主体に提供することができる。したがって、クライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。もちろん、このユースケースは一例であり、クライアント装置が、スペーシャルリージョンについての情報を再生制御主体に提供することにより、どのような処理を行ってもよいし、どのような機能を実現してもよい。

　なお、その場合、スペーシャルリージョン情報にどのような情報が含まれてもよい。例えば、図３３に示される表の上から２段目に示されるように、スペーシャルリージョン情報が、ラベル（label）、アンカー（anchor）、およびキュボイド（cuboid）を含んでもよい（#1-1）。ラベルは、スペーシャルリージョンの識別情報である。アンカーは、スペーシャルリージョンの位置を示す情報である。例えば、スペーシャルリージョンの基準点の３次元座標（x,y,z）により表現されてもよい。キュボイドは、スペーシャルリージョンの大きさを示す情報である。例えば、スペーシャルリージョンの互いに垂直な３辺の長さ（dx,dy,dz）により表現されてもよい。これらの情報により、クライアント装置は、各スペーシャルリージョンを識別し、処理することができる。もちろん、スペーシャルリージョン情報にこれら以外の情報が含まれてもよい。

　また、スペーシャルリージョン情報（例えばラベル、アンカー、キュボイド等）は、任意の情報に基づいて設定されてもよい。例えば、ラベルは、V3CDecoderConfigurationRecordに含まれるObject label information SEIに格納される情報に基づいて設定されてもよい。また、アンカーやキュボイドは、V3CSpatialRegionsBox()内の 3DspatialRegionStruct()に格納される情報に基づいて設定されてもよい。つまり、例えばファイル生成装置において、ファイル生成部は、V3CDecoderConfigurationRecordに含まれるObject label information SEIと、V3CSpatialRegionsBox()内の 3DspatialRegionStruct()とから取得した情報を、スペーシャルリージョン情報としてシーンディスクリプションに格納してもよい。

　また、シーンディスクリプションにおけるスペーシャルリージョン情報の格納場所は任意である。例えば、図３３に示される表の上から３段目に示されるように、スペーシャルリージョン情報を格納するエクステンションは、シーンディスクリプションのノードに規定されてもよい（#1-2）。

　例えばファイル生成装置において、ファイル生成部が、シーンディスクリプションのノードに、スペーシャルリージョン情報を格納するエクステンション（例えば、MPEG_spatial_region）を規定し、そのシーンディスクリプションをシーンディスクリプションファイルに格納してもよい。また、例えばコンテンツを再生するクライアント装置において、提供部が、シーンディスクリプションのノードに規定されたエクステンション（例えば、MPEG_spatial_region）から、（そのエクステンションに格納される）スペーシャルリージョン情報を取得してもよい。

　また、図３３に示される表の上から４段目に示されるように、このようなシーンディスクリプションファイルからスペーシャルリージョン情報が取得され、再生制御主体に提供されてもよい。

　例えば、情報処理装置（例えばクライアント装置）において、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、その3Dデータの再生を制御する再生制御者に提供する提供部を備えるようにする。

　また、例えば、情報処理方法（例えばクライアント処理）において、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、その3Dデータの再生を制御する再生制御者に提供するようにする。

　このようにすることにより、クライアント装置において、PEが、シーンディスクリプションをパースすることによりスペーシャルリージョン情報を取得することができる。したがって、PEが、スペーシャルリージョンについての情報を再生制御主体に提供することができる。

　なお、例えばクライアント装置が、再生制御者がスペーシャルリージョン情報に基づいて指定したスペーシャルリージョンの3Dデータを取得する取得部をさらに備えてもよい。このようにすることにより、クライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。もちろん、このユースケースは一例であり、クライアント装置が、スペーシャルリージョンについての情報を再生制御主体に提供することにより、どのような処理を行ってもよいし、どのような機能を実現してもよい。

　　＜シーンディスクリプションの構成例と記述例＞
　この場合のシーンディスクリプションにおけるオブジェクトの主な構成例を図３４に示す。図３４の例の場合、ノード内にエクステンション（MPEG_spatial_region）が規定されている。このMPEG_spatial_regionエクステンション内にスペーシャルリージョン情報が格納される。

　図３５に示される記述例２０１は、この場合のシーンディスクリプションの記述例を示している。この記述例２０１に示されるように、ノード内にMPEG_spatial_regionエクステンションが規定され、そのMPEG_spatial_regionエクステンション内に、ラベル、アンカー、キュボイド等のスペーシャルリージョン情報が格納されている。

　このスペーシャルリージョン情報には、例えば四角枠２０２内に示されるラベルのように、V3CDecoderConfigurationRecordに含まれるObject label information SEIの値などの、スペーシャルリージョンを判別するための情報が含まれてもよい。また、このスペーシャルリージョン情報には、例えば四角枠２０３内に示されるアンカーやキュボイドのように、V3CSpatialRegionsBox()内の3DspatialRegionStruct()内に格納されるパラメータが含まれてもよい。

　　＜クライアント処理の流れ１＞
　クライアント装置は、コンテンツを再生するためにクライアント処理を実行する。上述のように、スペーシャルリージョン情報がシーンディスクリプションに格納される場合のクライアント処理の流れの例を、図３６のフローチャートを参照して説明する。図１６を参照して上述したように、コンテンツを再生するクライアント装置は、MAF５２（およびパイプライン５３）、バッファ５４、PE５１等を有する。そして、図３６に示されるように、MAF５２は、MAF処理を実行する。また、PE５１はPE処理を実行する。そして再生制御主体は、制御処理を実行する。

　クライアント処理が開始されると、PE処理を開始したPE５１は、ステップＳ１２１においてシーンディスクリプション（SD）をパース（解析）する。そして、PE５１は、ステップＳ１２２において、そのシーンディスクリプションのノードに規定されるMPEG_spatial_regionエクステンションをパースし、そのエクステンション内に格納されるスペーシャルリージョン情報を取得する。ステップＳ１２３において、PE５１は、そのスペーシャルリージョン情報を再生制御主体に提供する。例えば、PE５１は、スペーシャルリージョン情報を含む選択画面（例えば図３２の選択画面１９２）を生成し、表示部に表示させる。

　つまり、PE５１は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、その3Dデータの再生を制御する再生制御者に提供する。

　制御処理を開始した再生制御主体は、ステップＳ１３１においてそのスペーシャルリージョン情報を取得する。例えば、再生制御主体であるユーザは、表示部に表示された選択画面（例えば図３２の選択画面１９２）を見る。ステップＳ１３２において、再生制御主体は、その提供されたスペーシャルリージョン情報に基づいて、優先するスペーシャルリージョンを選択し、その選択を示す情報（優先指示とも称する）をPE５１に供給する。例えば、再生制御主体は、表示部に表示された選択画面（例えば図３２の選択画面１９２）において、再生を優先させる3Dオブジェクトを選択し、決定ボタンを押下する。これにより、優先指示がクライアント装置に入力され、PE５１へ供給される。

　なお、ここで「再生を優先させる」とは、他の3Dデータよりも高画質に再生することを意味する。つまり、指定されたスペーシャルリージョンについては、他の3Dデータよりも高画質の（高ビットレートの）ビットストリームが取得され、復号される。また、他の3Dデータよりも時間的に先に処理すると言う意味が含まれてもよい。

　PE５１は、ステップＳ１２４において、その優先指示を取得する。PE５１は、ステップＳ１２５において、その優先指示にしたがってメディアの取得をMAF５２に指示する。つまり、PE５１は、優先指示において再生を優先させるように指示されたスペーシャルリージョンのメディア（3Dデータ）を、優先的に取得するようにMAF５２に指示する。例えば、PE５１は、MAF APIのstartFetching(TimeInfo timeInfo, ViewInfo viewInfo)のViewInfo.objectPosition attributeを利用して伝える。

　MAF処理を開始したMAF５２は、ステップＳ１１１において、その指示を取得する。そして、MAF５２は、ステップＳ１１２において、再生するV3Cビットストリームを格納するV3Cトラックを取得する。これにより、MAF５２は、スペーシャルリージョンとタイルとの対応関係を得る。

　そして、MAF５２は、ステップＳ１１３において、タイルを選択する。そして、MAF５２は、ステップＳ１１４において、その選択したタイルのデータ（タイルデータとも称する）を取得する。例えば、MAF５２は、V3Cトラックから抽出したビットストリームを、復号部を制御して復号し、タイルデータを取得する。なお、その際、MAF５２は、PE５１からの指示に従って、タイルを選択し、タイルデータを取得する。例えば、PE５１から優先的に取得するように指示されたスペーシャルリージョンのデータを取得する場合、MAF５２は、より高画質の（より高ビットレートの）タイルデータを取得する。これに対して、そのスペーシャルリージョン以外のデータを取得する場合、MAF５２は、残りのビットレート等に応じてデータが選択される。例えばビットレートに余裕がない場合、より低画質の（より低ビットレートの）タイルデータを取得する。

　つまり、MAF５２は、再生制御者がスペーシャルリージョン情報に基づいて指定したスペーシャルリージョンの3Dデータを取得する。

　そして、MAF５２は、ステップＳ１１５において、その取得したタイルデータを指定されたバッファ形式に変換する。そして、MAF５２は、ステップＳ１１６において、そのタイルデータをバッファ５４に格納する。このようにして、MAF５２は、再生する全てのタイルデータをバッファに格納する。

　PE５１は、ステップＳ１２６において、そのタイルデータを適切なタイミングにおいてバッファ５４から読み出す（取得する）。そして、PE５１は、ステップＳ１２７において、取得したタイルデータを用いて3Dデータを再構成する。そして、PE５１は、ステップＳ１２８において、例えば表示情報生成部を制御する等してレンダリングを行い、表示用画像を生成する。そして、PE５１は、ステップＳ１２９において、その表示用画像を表示部に表示させる。

　再生制御主体は、ステップＳ１３３において、その表示用画像を見る。

　MAF５２は、ステップＳ１１３乃至ステップＳ１１６の各処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。また、PE５１は、ステップＳ１２６乃至ステップＳ１２９の各処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。

　全てのフレームについて処理が終了すると、MAF５２はMAF処理を終了し、PE５１はPE処理を終了し、再生制御主体は、制御処理を終了する。つまり、クライアント処理が終了する。以上のようにクライアント処理を実行することにより、クライアント装置は、再生制御主体にスペーシャルリージョン情報を提供することができる。したがって、そのクライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。

　なお、スペーシャルリージョン情報が、スペーシャルリージョンの識別情報と、スペーシャルリージョンの位置を示す情報と、スペーシャルリージョンの大きさを示す情報とを含んでもよい。

　また、PE５２は、シーンディスクリプションのノードに規定されたエクステンションからスペーシャルリージョン情報を取得してもよい。

　もちろん、その他の本技術を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。

　　＜スペーシャルリージョン情報をバッファ領域へ格納するためのアクセサの格納＞
　なお、図３３に示される表の上から５段目に示されるように、シーンディスクリプションにおいて、スペーシャルリージョンを識別するためのスペーシャルリージョン情報をバッファ領域へ格納するためのアクセサが格納されてもよい（#2）。

　例えば、情報処理装置（例えばファイル生成装置）において、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成するファイル生成部を備えるようにする。

　また、例えば、情報処理方法（例えばファイル生成処理）において、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成するようにする。

　このようにすることにより、クライアント装置において、PEが、シーンディスクリプションのアクセサにより指定されるバッファ領域を介して、スペーシャルリージョン情報を取得することができる。したがって、PEが、スペーシャルリージョンについての情報を再生制御主体に提供することができる。なお、この場合、スペーシャルリージョン情報は、時間方向に変化し得る（時間方向に動的な）情報を含み得る。

　この場合も、クライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。もちろん、このユースケースは一例であり、クライアント装置が、スペーシャルリージョンについての情報を再生制御主体に提供することにより、どのような処理を行ってもよいし、どのような機能を実現してもよい。

　なお、その場合、スペーシャルリージョン情報にどのような情報が含まれてもよい。例えば、図３３に示される表の上から６段目に示されるように、スペーシャルリージョン情報が、ラベル（label）、3Dポイント（3Dpoint）、およびキュボイド（cuboid）を含んでもよい（#2-1）。ラベルは、スペーシャルリージョンの識別情報である。3Dポイントは、スペーシャルリージョンの位置を示す情報である。例えば、スペーシャルリージョンの基準点の３次元座標（x,y,z）により表現されてもよい。キュボイドは、スペーシャルリージョンの大きさを示す情報である。例えば、スペーシャルリージョンの互いに垂直な３辺の長さ（dx,dy,dz）により表現されてもよい。これらの情報により、クライアント装置は、各スペーシャルリージョンを識別し、処理することができる。もちろん、スペーシャルリージョン情報にこれら以外の情報が含まれてもよい。

　また、スペーシャルリージョン情報をバッファ領域へ格納するためのアクセサは、シーンディスクリプションのどこに格納されてもよい。例えば、図３３に示される表の上から７段目に示されるように、ノードにエクステンションを規定し、そのエクステンションに、スペーシャルリージョン情報をバッファ領域へ格納するためのアクセサに対応するプロパティを格納してもよい（#2-2）。

　このアクセサが示すバッファ領域（すなわち、スペーシャルリージョン情報が格納されるバッファ領域）は任意である。例えば、スペーシャルリージョン情報の各パラメータが、互いに異なるバッファ領域に格納されてもよい。換言するに、例えば、図３３に示される表の上から８段目に示されるように、スペーシャルリージョン情報のパラメータ（例えば、ラベル、3Dポイント、キュボイド等）毎に、互いに異なるバッファ領域を示すアクセサが設定され、各アクセサに対応するプロパティがノードに規定されるエクステンションに格納されてもよい（#2-3）。

　例えば、情報処理装置（例えばファイル生成装置）において、ファイル生成部が、互いに異なるバッファ領域を示す、スペーシャルリージョン情報のパラメータ毎のアクセサを、シーンディスクリプションファイルに格納してもよい。また、例えば、情報処理装置（例えばクライアント装置）において、提供部が、スペーシャルリージョン情報の各パラメータを互いに異なるバッファ領域から取得してもよい。

　また、スペーシャルリージョン情報（例えばラベル、3Dポイント、キュボイド等）は、任意の情報に基づいて設定されてもよい。例えば、情報処理装置（例えばファイル生成装置）において、ファイル生成部は、V3C Volumetric Annotation SEIから取得した情報、または、SpatialRegionStructが含まれるトラックから取得したタイムドメタデータを、スペーシャルリージョン情報としてシーンディスクリプションに格納してもよい。

　また、スペーシャルリージョン情報の各パラメータが、共通の（同一の）バッファ領域に格納されてもよい。換言するに、例えば、図３３に示される表の上から９段目に示されるように、スペーシャルリージョン情報の全パラメータ（例えば、ラベル、3Dポイント、キュボイド等）共通のアクセサが設定され、そのアクセサに対応するプロパティがノードに規定されるエクステンションに格納されてもよい（#2-4）。つまり、例えば、情報処理装置（例えばファイル生成装置）において、ファイル生成部が、スペーシャルリージョン情報の全パラメータを共通の（同一の）バッファ領域に格納するためのアクセサを、シーンディスクリプションファイルに格納してもよい。また、例えば、情報処理装置（例えばクライアント装置）において、提供部が、スペーシャルリージョン情報の全パラメータを共通の（同一の）バッファ領域から取得してもよい。

　また、図３３に示される表の最下段に示されるように、このようなシーンディスクリプションのエクステンションにより指定されるバッファ領域からスペーシャルリージョン情報が取得され、再生制御主体に提供されてもよい。

　例えば、情報処理装置（例えばクライアント装置）において、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、その3Dデータの再生を制御する再生制御者に提供する提供部を備えるようにする。

　また、例えば、情報処理方法（例えばクライアント処理）において、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、その3Dデータの再生を制御する再生制御者に提供するようにする。

　このようにすることにより、クライアント装置において、PEが、シーンディスクリプション（に格納されるアクセサ）により示されるバッファ領域からスペーシャルリージョン情報を取得することができる。したがって、PEが、スペーシャルリージョンについての情報を再生制御主体に提供することができる。

　なお、例えば、情報処理装置（例えばクライアント装置）が、再生制御者がスペーシャルリージョン情報に基づいて指定したスペーシャルリージョンの3Dデータを取得する取得部をさらに備えてもよい。このようにすることにより、クライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。もちろん、このユースケースは一例であり、クライアント装置が、スペーシャルリージョンについての情報を再生制御主体に提供することにより、どのような処理を行ってもよいし、どのような機能を実現してもよい。

　　＜シーンディスクリプションの構成例と記述例＞
　この場合のシーンディスクリプションにおけるオブジェクトの主な構成例を図３７に示す。図３７の例の場合、ノード内にエクステンション（MPEG_spatial_region）が規定されている。このMPEG_spatial_regionエクステンション内に、ラベル、アンカー、キュボイド等のプロパティが格納されている。そして、各プロパティに対応するアクセサが設けられている。各アクセサは、自身に対応するパラメータを格納するバッファ領域として、互いに異なるバッファ領域を示す。このようにすることにより、スペーシャルリージョン情報の各パラメータは、互いに異なるバッファ領域に格納される。

　図３８に示される記述例は、この場合のシーンディスクリプションの記述例を示している。この記述例に示されるように、ノード内にMPEG_spatial_regionエクステンションが規定され、そのMPEG_spatial_regionエクステンション内に、ラベル、アンカー、キュボイド等のプロパティが格納されている。各プロパティにはアクセサのインデックス値が格納されており、そのインデックス値によって、プロパティとアクセサが対応付けられている。そして、シーンディスクリプションには、そのアクセサ（各プロパティに対応するアクセサ）が格納されている。各アクセサは、互いに異なるバッファビューに関連付けられている。

　　＜クライアント処理の流れ２＞
　この場合のクライアント処理の流れの例を、図３９のフローチャートを参照して説明する。図３６の場合と同様に、MAF５２は、MAF処理を実行する。また、PE５１はPE処理を実行する。そして再生制御主体は、制御処理を実行する。

　クライアント処理が開始されると、PE処理を開始したPE５１は、ステップＳ２２１においてシーンディスクリプション（SD）をパース（解析）する。そして、PE５１は、ステップＳ２２２において、そのシーンディスクリプションのノードに規定されるMPEG_spatial_regionエクステンションをパースする。

　ステップＳ２２３において、PE５１は、スペーシャルリージョン情報を取得し、そのスペーシャルリージョン情報を、シーンディスクリプションに格納されるアクセサが示すバッファ領域に格納するように、MAF５２に指示する。

　MAF処理を開始したMAF５２は、ステップＳ２１１において、その指示を取得する。そして、MAF５２は、ステップＳ２１２において、その指示に従って、時間方向に動的なスペーシャルリージョン情報を含むトラックを取得する。そして、MF５２は、ステップＳ２１３において、そのトラックからスペーシャルリージョン情報等のデータを取得すると、PE５１の指示に従って、それをバッファ５４に格納する。これにより、スペーシャルリージョン情報が、シーンディスクリプションに格納されたアクセサにより指定されるバッファ領域に格納される。

　PE５１は、ステップＳ２２４において、シーンディスクリプションに基づいて、バッファ５４からデータを取得する。これにより、PE５１は、シーンディスクリプションに格納されるアクセサにより指定されるバッファ領域に格納されたスペーシャルリージョン情報を取得する。

　ステップＳ２２５において、PE５１は、そのスペーシャルリージョン情報を再生制御主体に提供する。例えば、PE５１は、スペーシャルリージョン情報を含む選択画面（例えば図３２の選択画面１９２）を生成し、表示部に表示させる。

　つまり、PE５１は、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、その3Dデータの再生を制御する再生制御者に提供する。

　制御処理を開始した再生制御主体は、ステップＳ２４１においてそのスペーシャルリージョン情報を取得する。例えば、再生制御主体であるユーザは、表示部に表示された選択画面（例えば図３２の選択画面１９２）を見る。ステップＳ２４２において、再生制御主体は、その提供されたスペーシャルリージョン情報に基づいて、優先するスペーシャルリージョンを選択し、その選択を示す情報（優先指示とも称する）をPE５１に供給する。例えば、再生制御主体は、表示部に表示された選択画面（例えば図３２の選択画面１９２）において、再生を優先させる3Dオブジェクトを選択し、決定ボタンを押下する。これにより、優先指示がクライアント装置に入力され、PE５１へ供給される。

　PE５１は、ステップＳ２２６において、その優先指示を取得する。PE５１は、ステップＳ２２７において、その優先指示にしたがってメディアの取得をMAF５２に指示する。つまり、PE５１は、優先指示において再生を優先させるように指示されたスペーシャルリージョンのメディア（3Dデータ）を、優先的に取得するようにMAF５２に指示する。例えば、PE５１は、MAF APIのstartFetching(TimeInfo timeInfo, ViewInfo viewInfo)のViewInfo.objectPosition attributeを利用して伝える。

　MAF５２は、ステップＳ２１４において、その指示を取得する。そして、MAF５２は、ステップＳ２１５において、ステップＳ２１２において取得されたV3Cトラックの中から、タイルを選択する。そして、MAF５２は、ステップＳ２１６において、その選択したタイルのデータ（タイルデータとも称する）を取得する。例えば、MAF５２は、V3Cトラックから抽出したビットストリームを、復号部を制御して復号し、タイルデータを取得する。なお、その際、MAF５２は、PE５１からの指示に従って、タイルを選択し、タイルデータを取得する。例えば、PE５１から優先的に取得するように指示されたスペーシャルリージョンのデータを取得する場合、MAF５２は、より高画質の（より高ビットレートの）タイルデータを取得する。これに対して、そのスペーシャルリージョン以外のデータを取得する場合、MAF５２は、残りのビットレート等に応じてデータが選択される。例えばビットレートに余裕がない場合、より低画質の（より低ビットレートの）タイルデータを取得する。

　そして、MAF５２は、ステップＳ２１７において、その取得したタイルデータを指定されたバッファ形式に変換する。そして、MAF５２は、ステップＳ２１８において、そのタイルデータをバッファ５４に格納する。このようにして、MAF５２は、再生する全てのタイルデータをバッファに格納する。

　PE５１は、ステップＳ２２８において、そのタイルデータを適切なタイミングにおいてバッファ５４から読み出す（取得する）。そして、PE５１は、ステップＳ２２９において、取得したタイルデータを用いて3Dデータを再構成する。そして、PE５１は、ステップＳ２３０において、例えば表示情報生成部を制御する等してレンダリングを行い、表示用画像を生成する。そして、PE５１は、ステップＳ２３１において、その表示用画像を表示部に表示させる。

　再生制御主体は、ステップＳ２４３において、その表示用画像を見る。

　MAF５２は、ステップＳ２１５乃至ステップＳ２１８の各処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。また、PE５１は、ステップＳ２２８乃至ステップＳ２３１の各処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。

　全てのフレームについて処理が終了すると、MAF５２はMAF処理を終了し、PE５１はPE処理を終了し、再生制御主体は、制御処理を終了する。つまり、クライアント処理が終了する。

　以上のように各処理を実行することにより、クライアント装置は、再生制御主体にスペーシャルリージョン情報を提供することができる。したがって、そのクライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。

　また、PE５１は、スペーシャルリージョン情報の各パラメータを互いに異なるバッファ領域から取得してもよい。

　＜４．第１の実施の形態＞
　　＜ファイル生成装置＞
　上述した本技術は、任意の装置に適用し得る。図４０は、本技術を適用した情報処理装置の一態様であるファイル生成装置の構成の一例を示すブロック図である。図４０に示されるファイル生成装置３００は、3Dオブジェクトコンテンツ（例えばポイントクラウド等の3Dデータ）を符号化し、例えばISOBMFF等のファイルコンテナに格納する装置である。また、ファイル生成装置３００は、その3Dオブジェクトコンテンツのシーンディスクリプションファイルを生成する。

　なお、図４０においては、処理部やデータの流れ等の主なものを示しており、図４０に示されるものが全てとは限らない。つまり、ファイル生成装置３００において、図４０においてブロックとして示されていない処理部が存在したり、図４０において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図４０に示されるようにファイル生成装置３００は、制御部３０１およびファイル生成処理部３０２を有する。制御部３０１は、ファイル生成処理部３０２を制御する。ファイル生成処理部３０２は、制御部３０１により制御されて、ファイルの生成に関する処理を行う。例えば、ファイル生成処理部３０２は、ファイルに格納する3Dオブジェクトコンテンツのデータを取得してもよい。また、ファイル生成処理部３０２は、その取得した3Dオブジェクトコンテンツのデータをファイルコンテナに格納することにより、コンテンツファイルを生成してもよい。また、ファイル生成処理部３０２は、その3Dオブジェクトコンテンツに対応するシーンディスクリプションを生成し、シーンディスクリプションファイルに格納してもよい。ファイル生成処理部３０２は、生成したファイルをファイル生成装置３００の外部に出力してもよい。例えば、ファイル生成処理部３０２は、生成したファイルを配信サーバ等にアップロードしてもよい。

　ファイル生成処理部３０２は、入力部３１１、前処理部３１２、符号化部３１３、ファイル生成部３１４、記録部３１５、および出力部３１６を有する。

　入力部３１１は、3Dオブジェクトコンテンツのデータの取得に関する処理を行う。例えば、入力部３１１は、3Dオブジェクトコンテンツのデータをファイル生成装置３００の外部から取得してもよい。この3Dオブジェクトコンテンツのデータは、オブジェクトの3次元構造を表現する3Dデータであればどのようなデータであってもよい。例えば、ポイントクラウドのデータであってもよい。入力部３１１は、取得した3Dオブジェクトコンテンツのデータを前処理部３１２へ供給してもよい。

　前処理部３１２は、3Dオブジェクトコンテンツのデータに対して符号化前に行う前処理に関する処理を実行する。例えば、前処理部３１２は、入力部３１１から供給される3Dオブジェクトコンテンツのデータを取得してもよい。また、前処理部３１２は、取得した3Dオブジェクトコンテンツのデータ等から、シーンディスクリプションの生成に必要な情報を取得してもよい。また、前処理部３１２は、その取得した情報をファイル生成部３１４へ供給してもよい。また、前処理部３１２は、3Dオブジェクトコンテンツのデータを符号化部３１３へ供給してもよい。

　符号化部３１３は、3Dオブジェクトコンテンツのデータの符号化に関する処理を実行する。例えば、符号化部３１３は、前処理部３１２から供給される3Dオブジェクトコンテンツのデータを取得してもよい。また、符号化部３１３は、取得した3Dオブジェクトコンテンツのデータを符号化し、その符号化データを生成してもよい。また、符号化部３１３は、生成した3Dオブジェクトコンテンツの符号化データをV3Cビットストリームとしてファイル生成部３１４に供給してもよい。

　ファイル生成部３１４は、ファイル等の生成に関する処理を行う。例えば、ファイル生成部３１４は、符号化部３１３から供給されたV3Cビットストリームを取得してもよい。また、ファイル生成部３１４は、前処理部３１２から供給された情報を取得してもよい。また、ファイル生成部３１４は、符号化部３１３から供給されたV3Cビットストリームを格納するファイルコンテナ（コンテンツファイル）を生成してもよい。このコンテンツファイル（ファイルコンテナ）の仕様等は任意であり、V3Cビットストリームを格納することができればどのようなファイルであってもよい。例えば、ISOBMFFであってもよい。

　また、ファイル生成部３１４は、前処理部３１２から供給された情報を用いて、そのV3Cビットストリームに対応するシーンディスクリプションを生成してもよい。そして、ファイル生成部３１４は、シーンディスクリプションファイルを生成し、生成したシーンディスクリプションを格納してもよい。また、V3CビットストリームがMPEG-DASHに準拠する方式で配信される場合、ファイル生成部３１４は、そのV3Cビットストリームに対応するMPDを生成してもよい。また、ファイル生成部３１４は、生成したファイル等（ISOBMFF、シーンディスクリプションファイル、MPD等）を記録部３１５へ供給してもよい。

　記録部３１５は、例えば、ハードディスクや半導体メモリ等、任意の記録媒体を有し、データの記録に関する処理を実行する。例えば、記録部３１５は、ファイル生成部３１４から供給されるファイル等をその記録媒体に記録してもよい。また、記録部３１５は、制御部３０１若しくは出力部３１６の要求に従って、または所定のタイミングにおいて、記録媒体に記録されているファイル等を読み出し、出力部３１６に供給してもよい。

　出力部３１６は、記録部３１５から供給されるファイル等を取得し、そのファイル等をファイル生成装置３００の外部（例えば配信サーバや再生装置等）に出力してもよい。

　以上のような構成のファイル生成装置３００において、＜３．スペーシャルリージョン情報の利用＞において上述した本技術を適用してもよい。

　例えば、ファイル生成部３１４が、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成してもよい。

　また、その場合、そのスペーシャルリージョン情報が、スペーシャルリージョンの識別情報と、スペーシャルリージョンの位置を示す情報と、スペーシャルリージョンの大きさを示す情報とを含んでもよい。

　また、ファイル生成部３１４が、V3CDecoderConfigurationRecordに含まれるObject label information SEIと、V3CSpatialRegionsBox()内の 3DspatialRegionStruct()とから取得した情報を、スペーシャルリージョン情報としてシーンディスクリプションファイルに格納してもよい。

　また、ファイル生成部３１４が、シーンディスクリプションのノードに、スペーシャルリージョン情報を格納するエクステンションを規定し、そのシーンディスクリプションをシーンディスクリプションファイルに格納してもよい。

　また、例えば、ファイル生成部３１４が、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成してもよい。

　また、その場合、スペーシャルリージョン情報が、スペーシャルリージョンの識別情報と、スペーシャルリージョンの位置を示す情報と、スペーシャルリージョンの大きさを示す情報とを含んでもよい。

　また、ファイル生成部３１４が、互いに異なるバッファ領域を示す、スペーシャルリージョン情報のパラメータ毎のアクセサを、シーンディスクリプションファイルに格納してもよい。

　また、ファイル生成部３１４が、V3C Volumetric Annotation SEIから取得した情報、または、SpatialRegionStructが含まれるトラックから取得したタイムドメタデータを、スペーシャルリージョン情報としてシーンディスクリプションファイルに格納してもよい。

　もちろん、＜３．スペーシャルリージョン情報の利用＞において上述したその他の本技術を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。

　ファイル生成装置３００が、このような構成を有することにより、コンテンツを再生するクライアント装置が、再生制御主体にスペーシャルリージョン情報を提供することができる。したがって、そのクライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。もちろん、このユースケースは一例であり、クライアント装置が、スペーシャルリージョンについての情報を再生制御主体に提供することにより、どのような処理を行ってもよいし、どのような機能を実現してもよい。

　　＜ファイル生成処理の流れ１＞
　このような構成のファイル生成装置３００が実行するファイル生成処理の流れの例を、図４１のフローチャートを参照して説明する。図４１の例は、スペーシャルリージョン情報をシーンディスクリプションに格納する場合のファイル生成処理の流れの例を示している。

　この場合、ファイル生成処理が開始されると、ファイル生成装置３００の入力部３１１は、ステップＳ３０１において、3Dオブジェクトのデータ（3Dデータ）を取得する。例えば、入力部３１１は、この3Dデータとして、ポイントクラウドのデータを取得する。

　ステップＳ３０２において、前処理部３１２は、ステップＳ３０１において取得された3Dオブジェクトのデータに対して前処理を実行する。例えば、前処理部３１２は、その3Dオブジェクトのデータから、１つ以上の3Dオブジェクトを3D空間に配置するための空間配置情報であるシーンディスクリプションの生成に用いられる情報を取得する。

　ステップＳ３０３において、ファイル生成部３１４は、その情報を用いて、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成する。

　ステップＳ３０４において、符号化部３１３は、ステップＳ３０１において取得されたポイントクラウドのデータ（3Dデータ）を符号化し、その符号化データ（V3Cビットストリーム）を生成する。

　ステップＳ３０５において、ファイル生成部３１４は、ステップＳ３０４において生成されたV3Cビットストリームを格納するコンテンツファイル（ISOBMFF）を生成する。

　ステップＳ３０６において、記録部３１５は、生成されたシーンディスクリプションファイルおよびコンテンツファイルを記録媒体に記録する。

　ステップＳ３０７において、出力部３１６は、ステップＳ３０６において記録されたファイル等を記録媒体より読み出し、所定のタイミングにおいて、その読み出したファイルをファイル生成装置３００の外部に出力する。例えば、出力部３１６は、記録媒体より読み出したファイルを、ネットワーク等の通信媒体を介して、配信サーバや再生装置等の他の装置へ送信（アップロード）してもよい。また、出力部３１６は、記録媒体より読み出したファイル等を、リムーバブルメディア等の外部記録媒体に記録してもよい。その場合、その出力されたファイルは、例えば、その外部記録媒体を介して他の装置（配信サーバや再生装置等）に供給されてもよい。

　ステップＳ３０７の処理が終了すると、ファイル生成処理が終了する。

　このようにファイル生成処理を実行することにより、コンテンツを再生するクライアント装置が、再生制御主体にスペーシャルリージョン情報を提供することができる。したがって、そのクライアント装置は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。

　また、ステップＳ３０３において、ファイル生成部３１４が、V3CDecoderConfigurationRecordに含まれるObject label information SEIと、V3CSpatialRegionsBox()内の 3DspatialRegionStruct()とから取得した情報を、スペーシャルリージョン情報として前記シーンディスクリプションファイルに格納してもよい。

　また、ステップＳ３０３において、ファイル生成部３１４が、シーンディスクリプションのノードに、スペーシャルリージョン情報を格納するエクステンションを規定し、そのシーンディスクリプションをシーンディスクリプションファイルに格納してもよい。

　　＜ファイル生成処理の流れ２＞
　次に、スペーシャルリージョン情報をバッファ領域に格納する場合のファイル生成処理の流れの例を、図４２のフローチャートを参照して説明する。

　この場合、ファイル生成処理が開始されると、ステップＳ３５１およびステップＳ３５２の各処理が、図４１のステップＳ３０１およびステップＳ３０２の各処理と同様に実行される。

　ステップＳ３５３において、ファイル生成部３１４は、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成する。

　ステップＳ３５３の処理が終了すると、ステップＳ３５４乃至ステップＳ３５７の各処理が、図４１のステップＳ３０４乃至ステップＳ３０７の各処理と同様に実行される。

　ステップＳ３５７の処理が終了すると、ファイル生成処理が終了する。

　また、ステップＳ３５３において、ファイル生成部３１４が、互いに異なるバッファ領域を示す、スペーシャルリージョン情報のパラメータ毎のアクセサを、シーンディスクリプションファイルに格納してもよい。

　また、ステップＳ３５３において、ファイル生成部３１４が、V3C Volumetric Annotation SEIから取得した情報、または、SpatialRegionStructが含まれるトラックから取得したタイムドメタデータを、スペーシャルリージョン情報としてシーンディスクリプションファイルに格納してもよい。

　＜５．第２の実施の形態＞
　　＜クライアント装置＞
　図４３は、本技術を適用した情報処理装置の一態様であるクライアント装置の構成の一例を示すブロック図である。図４３に示されるクライアント装置４００は、シーンディスクリプションに基づいて、3Dオブジェクトコンテンツの再生処理を行う再生装置である。例えば、クライアント装置４００は、ファイル生成装置３００により生成されたコンテンツファイルに格納される3Dオブジェクトのデータを再生する。その際、クライアント装置４００は、シーンディスクリプションに基づいて、その再生に関する処理を行う。

　なお、図４３においては、処理部やデータの流れ等の主なものを示しており、図４３に示されるものが全てとは限らない。つまり、クライアント装置４００において、図４３においてブロックとして示されていない処理部が存在したり、図４３において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図４３に示されるようにクライアント装置４００は、制御部４０１および再生処理部４０２を有する。制御部４０１は、再生処理部４０２の制御に関する処理を行う。再生処理部４０２は、3Dオブジェクトのデータの再生に関する処理を行う。

　再生処理部４０２は、ファイル取得部４１１、ファイル処理部４１２、復号部４１３、表示情報生成部４１４、表示部４１５、および表示制御部４１６を有する。

　ファイル取得部４１１は、ファイルの取得に関する処理を行う。例えば、ファイル取得部４１１は、配信サーバやファイル生成装置３００等、クライアント装置４００の外部から供給されるファイル等を取得してもよい。また、ファイル取得部４１１は、図示せぬローカルストレージに記憶されているファイル等を取得してもよい。例えば、ファイル取得部４１１は、シーンディスクリプションファイルを取得してもよい。また、ファイル取得部４１１は、コンテンツファイルを取得してもよい。例えば、ファイル取得部４１１は、取得したファイルをファイル処理部４１２へ供給してもよい。ファイル取得部４１１は、ファイル処理部４１２の制御に従ってこのファイルの取得に関する処理を行ってもよい。例えば、ファイル取得部４１１は、ファイル処理部４１２により要求されたファイルを外部またはローカルストレージから取得し、ファイル処理部４１２へ供給してもよい。

　ファイル処理部４１２は、ファイル等に対する処理に関する処理を行う。例えば、ファイル処理部４１２は、図１６を参照して説明したような構成（例えば、MAF５２、バッファ５４、PE５１等）を有してもよい。

　その場合にファイル処理部４１２のPE５１は、ファイル取得部４１１を制御し、所望の3Dオブジェクトコンテンツに対応するシーンディスクリプションファイルを取得させてもよい。そして、PE５１は、ファイル取得部４１１から供給されるシーンディスクリプションファイルを取得してもよい。また、PE５１は、そのシーンディスクリプションファイルを解析し、そのシーンディスクリプションファイルに基づいてMAF５２を制御し、所望の3Dコンテンツファイルのデータを取得させてもよい。MAF５２は、そのPE５１の制御に従ってファイル取得部４１１を制御し、所望のコンテンツファイルを取得させ、そのコンテンツファイルから所望のV3Cビットストリームを取得してもよい。そして、MAF５２は、復号部４１３を制御し、そのV3Cビットストリームを復号させ、V3Cコンテンツのデータを取得してもよい。そして、MAF５２は、そのV3Cコンテンツのデータ（2Dデータ）をバッファ５４に格納してもよい。PE５１は、シーンディスクリプションに基づいてそのデータをバッファ５４から取得し、3Dデータを再構成してもよい。そして、PE５１は、表示情報生成部４１４を制御して、再構成された3Dデータを用いてレンダリングを行わせ、表示用画像を生成させてもよい。なお、ファイル処理部４１２は、シーンディスクリプション等に含まれる表示情報の生成に有用な情報を表示制御部４１６に供給してもよい。

　復号部４１３は、復号に関する処理を行う。例えば、復号部４１３は、ファイル処理部４１２により制御され、V3Cビットストリームを復号してもよい。また、復号部４１３は、その復号により得られた3Dオブジェクトコンテンツのデータ（例えばポイントクラウドのデータ）をファイル処理部４１２や表示情報生成部４１４に供給してもよい。

　表示情報生成部４１４は、表示に関する処理を行う。例えば、表示情報生成部４１４は、ファイル処理部４１２および復号部４１３の少なくともいずれか一方から供給される3Dオブジェクトのデータを取得してもよい。また、表示情報生成部４１４は、表示制御部４１６やファイル処理部４１２の制御に従って、その3Dオブジェクトコンテンツのデータのレンダリングを行い、表示用画像等を生成してもよい。また、表示情報生成部４１４は、生成した表示用画像等を、表示部４１５に供給してもよい。

　表示部４１５は、表示デバイスを有し、画像表示に関する処理を行う。例えば、表示部４１５は、表示情報生成部４１４から供給された表示用画像をその表示デバイスを用いて表示してもよい。

　表示制御部４１６は、画像表示の制御に関する処理を実行する。例えば、表示制御部４１６は、ファイル処理部４１２から供給されるシーンディスクリプション等の情報を取得してもよい。また、表示制御部４１６はその情報に基づいて表示情報生成部４１４を制御してもよい。

　以上のような構成のクライアント装置４００において、＜３．スペーシャルリージョン情報の利用＞において上述した本技術を適用してもよい。

　例えば、ファイル処理部４１２（のPE５１）が、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、その3Dデータの再生を制御する再生制御者に提供してもよい。つまり、ファイル処理部４１２（のPE５１）は、提供部とも言える。

　なお、スペーシャルリージョン情報は、スペーシャルリージョンの識別情報と、スペーシャルリージョンの位置を示す情報と、スペーシャルリージョンの大きさを示す情報とを含んでもよい。

　また、ファイル処理部４１２（のPE５１）は、シーンディスクリプションのノードに規定されたエクステンションからスペーシャルリージョン情報を取得してもよい。

　また、ファイル処理部４１２（のMAF５２）が、再生制御者がスペーシャルリージョン情報に基づいて指定したスペーシャルリージョンの3Dデータを取得してもよい。つまり、ファイル処理部４１２（のMAF５２）は、取得部とも言える。

　また、例えば、ファイル処理部４１２（のPE５１）が、シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、その3Dデータの再生を制御する再生制御者に提供してもよい。

　また、ファイル処理部４１２（のPE５１）が、スペーシャルリージョン情報の各パラメータを互いに異なるバッファ領域から取得してもよい。

　また、ファイル処理部４１２（のMAF５２）が、再生制御者がスペーシャルリージョン情報に基づいて指定したスペーシャルリージョンの3Dデータを取得してもよい。

　クライアント装置４００は、このような構成を有することにより、再生制御主体にスペーシャルリージョン情報を提供することができる。したがって、クライアント装置４００は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。もちろん、このユースケースは一例であり、クライアント装置４００が、スペーシャルリージョンについての情報を再生制御主体に提供することにより、どのような処理を行ってもよいし、どのような機能を実現してもよい。

　　＜クライアント処理の流れ＞
　スペーシャルリージョン情報がシーンディスクリプションに格納される場合、クライアント装置４００は、クライアント処理を、図３６のフローチャートのような流れで実行する。

　また、スペーシャルリージョン情報が、シーンディスクリプションに格納されるアクセサにより示されるバッファ領域に格納される場合、クライアント装置４００は、クライアント処理を、図３９のフローチャートのような流れで実行する。

　このようにクライアント処理を実行することにより、クライアント装置４００（のPE５１）は、いずれの場合も、再生制御主体にスペーシャルリージョン情報を提供することができる。したがって、クライアント装置４００は、例えば上述したユースケースのように、再生制御主体が注目したい3Dオブジェクトを高画質に再生する等、再生制御主体の意図に応じたコンテンツ再生を行うことができる。

　＜６．付記＞
　　＜組み合わせ＞
　上述した本技術の各例は、矛盾が生じない限り、他の例と適宜組み合わせて適用してもよい。また、上述した本技術の各例を、上述した以外の他の技術と組み合わせて適用してもよい。

　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図４４は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図４４に示されるコンピュータ９００において、CPU（Central Processing Unit）９０１、ROM（Read Only Memory）９０２、RAM（Random Access Memory）９０３は、バス９０４を介して相互に接続されている。

　バス９０４にはまた、入出力インタフェース９１０も接続されている。入出力インタフェース９１０には、入力部９１１、出力部９１２、記憶部９１３、通信部９１４、およびドライブ９１５が接続されている。

　入力部９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部９１４は、例えば、ネットワークインタフェースよりなる。ドライブ９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア９２１を駆動する。

　以上のように構成されるコンピュータでは、CPU９０１が、例えば、記憶部９１３に記憶されているプログラムを、入出力インタフェース９１０およびバス９０４を介して、RAM９０３にロードして実行することにより、上述した一連の処理が行われる。RAM９０３にはまた、CPU９０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア９２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア９２１をドライブ９１５に装着することにより、入出力インタフェース９１０を介して、記憶部９１３にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部９１４で受信し、記憶部９１３にインストールすることができる。

　その他、このプログラムは、ROM９０２や記憶部９１３に、あらかじめインストールしておくこともできる。

　　＜本技術の適用可能な対象＞
　本技術は、任意の符号化・復号方式に適用することができる。

　また、本技術は、任意の構成に適用することができる。例えば、本技術は、様々な電子機器に応用され得る。

　また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

　また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　　＜本技術を適用可能な分野・用途＞
　本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

　例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。

　　＜その他＞
　なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

　また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、前記3Dデータの再生を制御する再生制御者に提供する提供部
　を備える情報処理装置。
　（２）　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　（１）に記載の情報処理装置。
　（３）　前記提供部は、前記シーンディスクリプションのノードに規定されたエクステンションから前記スペーシャルリージョン情報を取得する
　（１）または（２）に記載の情報処理装置。
　（４）　前記再生制御者が前記スペーシャルリージョン情報に基づいて指定した前記スペーシャルリージョンの前記3Dデータを取得する取得部をさらに備える
　（１）乃至（３）のいずれかに記載の情報処理装置。
　（５）　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、前記3Dデータの再生を制御する再生制御者に提供する
　情報処理方法。

　（６）　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　（７）　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　（６）に記載の情報処理装置。
　（８）　前記ファイル生成部は、V3CDecoderConfigurationRecordに含まれるObject label information SEIと、V3CSpatialRegionsBox()内の 3DspatialRegionStruct()とから取得した情報を、前記スペーシャルリージョン情報として前記シーンディスクリプションファイルに格納する
　（６）または（７）に記載の情報処理装置。
　（９）　前記ファイル生成部は、シーンディスクリプションのノードに、前記スペーシャルリージョン情報を格納するエクステンションを規定し、前記シーンディスクリプションを前記シーンディスクリプションファイルに格納する
　（６）乃至（８）のいずれかに記載の情報処理装置。

　（１０）　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成する
　情報処理方法。
　（１１）　シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、前記3Dデータの再生を制御する再生制御者に提供する提供部
　を備える情報処理装置。
　（１２）　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　（１１）に記載の情報処理装置。
　（１３）　前記提供部は、前記スペーシャルリージョン情報の各パラメータを互いに異なる前記バッファ領域から取得する
　（１１）または（１２）に記載の情報処理装置。
　（１４）　前記再生制御者が前記スペーシャルリージョン情報に基づいて指定した前記スペーシャルリージョンの前記3Dデータを取得する取得部をさらに備える
　（１１）乃至（１３）のいずれかに記載の情報処理装置。
　（１５）　シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、前記3Dデータの再生を制御する再生制御者に提供する
　情報処理方法。

　（１６）　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　（１７）　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　（１６）に記載の情報処理装置。
　（１８）　前記ファイル生成部は、互いに異なる前記バッファ領域を示す、前記スペーシャルリージョン情報のパラメータ毎の前記アクセサを、前記シーンディスクリプションファイルに格納する
　（１６）または（１７）に記載の情報処理装置。
　（１９）　前記ファイル生成部は、V3C Volumetric Annotation SEIから取得した情報、または、SpatialRegionStructが含まれるトラックから取得したタイムドメタデータを、前記スペーシャルリージョン情報として前記シーンディスクリプションファイルに格納する
　（１６）乃至（１８）のいずれかに記載の情報処理装置。
　（２０）　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成する
　情報処理方法。

　３００　ファイル生成装置，　３０１　制御部，　３０２　ファイル生成処理部，　３１１　入力部，　３１２　前処理部，　３１３　符号化部，　３１４　ファイル生成部，　３１５　記録部，　３１６　出力部，　４００　クライアント装置，　４０１　制御部，　４０２　クライアント処理部，　４１１　ファイル取得部，　４１２　ファイル処理部，　４１３　復号部，　４１４　表示情報生成部，　４１５　表示部，　４１６　表示制御部

Claims

　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、前記3Dデータの再生を制御する再生制御者に提供する提供部
　を備える情報処理装置。
　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　請求項１に記載の情報処理装置。
　前記提供部は、前記シーンディスクリプションのノードに規定されたエクステンションから前記スペーシャルリージョン情報を取得する
　請求項１に記載の情報処理装置。
　前記再生制御者が前記スペーシャルリージョン情報に基づいて指定した前記スペーシャルリージョンの前記3Dデータを取得する取得部をさらに備える
　請求項１に記載の情報処理装置。
　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報をシーンディスクリプションから取得し、前記3Dデータの再生を制御する再生制御者に提供する
　情報処理方法。
　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　請求項６に記載の情報処理装置。
　前記ファイル生成部は、V3CDecoderConfigurationRecordに含まれるObject label information SEIと、V3CSpatialRegionsBox()内の 3DspatialRegionStruct()とから取得した情報を、前記スペーシャルリージョン情報として前記シーンディスクリプションファイルに格納する
　請求項６に記載の情報処理装置。
　前記ファイル生成部は、シーンディスクリプションのノードに、前記スペーシャルリージョン情報を格納するエクステンションを規定し、前記シーンディスクリプションを前記シーンディスクリプションファイルに格納する
　請求項６に記載の情報処理装置。
　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するシーンディスクリプションファイルを生成する
　情報処理方法。
　シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、前記3Dデータの再生を制御する再生制御者に提供する提供部
　を備える情報処理装置。
　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　請求項１１に記載の情報処理装置。
　前記提供部は、前記スペーシャルリージョン情報の各パラメータを互いに異なる前記バッファ領域から取得する
　請求項１１に記載の情報処理装置。
　前記再生制御者が前記スペーシャルリージョン情報に基づいて指定した前記スペーシャルリージョンの前記3Dデータを取得する取得部をさらに備える
　請求項１１に記載の情報処理装置。
　シーンディスクリプションに基づいてバッファ領域から、3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を取得し、前記3Dデータの再生を制御する再生制御者に提供する
　情報処理方法。
　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　前記スペーシャルリージョン情報は、前記スペーシャルリージョンの識別情報と、前記スペーシャルリージョンの位置を示す情報と、前記スペーシャルリージョンの大きさを示す情報とを含む
　請求項１６に記載の情報処理装置。
　前記ファイル生成部は、互いに異なる前記バッファ領域を示す、前記スペーシャルリージョン情報のパラメータ毎の前記アクセサを、前記シーンディスクリプションファイルに格納する
　請求項１６に記載の情報処理装置。
　前記ファイル生成部は、V3C Volumetric Annotation SEIから取得した情報、または、SpatialRegionStructが含まれるトラックから取得したタイムドメタデータを、前記スペーシャルリージョン情報として前記シーンディスクリプションファイルに格納する
　請求項１６に記載の情報処理装置。
　3Dオブジェクトの３次元形状を表現する3Dデータにおけるスペーシャルリージョンに関するスペーシャルリージョン情報を格納するバッファ領域を示すアクセサを格納するシーンディスクリプションファイルを生成する
　情報処理方法。