WO2023176928A1

WO2023176928A1 - 情報処理装置および方法

Info

Publication number: WO2023176928A1
Application number: PCT/JP2023/010321
Authority: WO
Inventors: 光浩平林; 遼平高橋
Original assignee: ソニーグループ株式会社
Priority date: 2022-03-18
Filing date: 2023-03-16
Publication date: 2023-09-21

Abstract

本開示は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができるようにする情報処理装置および方法に関する。 3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサをシーンディスクリプションファイルにおいて指定し、そのシーンディスクリプションファイルに基づいてその動的なハプティクスメディアの符号化データを取得して復号し、そのシーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶する。また、インタラクション型メディアに関する記述をシーンディスクリプションファイルに格納し、その記述に基づいてインタラクション型メディアの符号化データを取得し、復号する。本開示は、例えば、情報処理装置、または情報処理方法等に適用することができる。

Description

情報処理装置および方法

　本開示は、情報処理装置および方法に関し、特に、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができるようにした情報処理装置および方法に関する。

　従来、3D（３次元）オブジェクトを３次元空間内に配置し、レンダリングするためのシーンディスクリプション（Scene Description）のフォーマットであるglTF（The GL Transmission Format）（登録商標）2.0があった（例えば非特許文献１参照）。

　また、MPEG（Moving Picture Experts Group）-I Scene Descriptionにおいて、glTF2.0を拡張し、時間方向に動的なコンテンツを扱う方法が提案された（例えば非特許文献２参照）。

　ところで、2Dビデオコンテンツや3DoF（Degree of Freedom）/6DoFビデオコンテンツの構成要素であるオーディオメディアやビデオメディアに加えて、触覚情報（ハプティクスメディア（haptics media）とも称する）の符号化伝送技術の規格化が始まった（例えば、非特許文献３参照）。

　また、そのハプティクスメディアが符号化されたビットストリームをISOBMFF（International Organization for Standardization Base Media File Format）に格納するための基本機能が作成された（例えば、非特許文献４参照）。

　また、ハプティクスメディアの符号化伝送技術の規格化と並行して、MPEG-I Scene Descriptionでハプティクスメディアを扱うための技術探索検討が始まった（例えば、非特許文献５参照）。

Saurabh Bhatia, Patrick Cozzi, Alexey Knyazev, Tony Parisi, "Khronos glTF2.0", https://github.com/KhronosGroup/glTF/tree/master/specification/2.0, June 9, 2017 "Text of ISO/IEC CD 23090-14 Scene Description for MPEG Media", ISO/IEC JTC 1/SC 29/WG 3 N00485, 2021/10/12 Quentin Galvane, Fabien Danieau, Philippe Guillotel, Eric Vezzoli, Alexandre Hulsken, Titouan Rabu, Andreas Noll, Lars Nockenberg, "WD on the Coded Representation of Haptics - Phase 1", ISO/IEC JTC 1/SC 29/WG 2, m58748, 2021/10/ "Information technology - Coding of audio-visual objects - Part 12: ISO base media file format, TECHNICAL CORRIGENDUM 1",ISO/IEC 14496-12:2015/Cor.1, ISO/IEC JTC 1/SC 29/WG 11, 2016/6/3 Chris Ullrich, Yeshwant Muthusamy, Fabien Danieau, Quentin Galvane, Philippe Guillotel, Eric Vezzoli, Titouan Rabu, "MPEG-I SD Revised Haptic Schema and Processing Model", ISO/IEC JTC 1/SC 29/WG 3 m58487_v3, 2021/10/

　しかしながら、ハプティクスメディアのように3Dデータに関連付けられたメディアデータをシーンディスクリプションで扱うための技術探索検討は始まったばかりであり、まだシーンディスクリプションで正しく扱うことができないメディアデータも存在した。そのため、3Dデータに関連付けられたメディアデータの再生性能が低減するおそれがあった。

　本開示は、このような状況に鑑みてなされたものであり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができるようにするものである。

　本技術の一側面の情報処理装置は、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得する取得部と、前記シーンディスクリプションファイルの記述に基づいて、前記符号化データを復号し、前記ハプティクスメディアのデータを生成する復号部と、前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶する記憶部と、前記シーンディスクリプションファイルの記述に基づいて、前記記憶領域に記憶されている前記ハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する生成部とを備える情報処理装置である。

　本技術の一側面の情報処理方法は、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得し、前記シーンディスクリプションファイルの記述に基づいて、前記符号化データを復号し、前記ハプティクスメディアのデータを生成し、前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶し、前記シーンディスクリプションファイルの記述に基づいて、前記記憶領域に記憶されている前記ハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する情報処理方法である。

　本技術の他の側面の情報処理装置は、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成するファイル生成部を備える情報処理装置である。

　本技術の他の側面の情報処理方法は、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成する情報処理方法である。

　本技術のさらに他の側面の情報処理装置は、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得する取得部と、前記シーンディスクリプションファイルの記述に基づいて、取得された前記符号化データを復号し、前記インタラクション型メディアのデータを生成する復号部とを備える情報処理装置である。

　本技術のさらに他の側面の情報処理方法は、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得し、前記シーンディスクリプションファイルの記述に基づいて、取得された前記符号化データを復号し、前記インタラクション型メディアのデータを生成する情報処理方法である。

　本技術のさらに他の側面の情報処理装置は、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成するファイル生成部を備える情報処理装置である。

　本技術のさらに他の側面の情報処理方法は、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成する情報処理方法である。

　本技術の一側面の情報処理装置および方法においては、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データが取得され、そのシーンディスクリプションファイルの記述に基づいて、その符号化データが復号され、ハプティクスメディアのデータが生成され、そのハプティクスメディアのデータが、シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶され、シーンディスクリプションファイルの記述に基づいて、その記憶領域に記憶されているハプティクスメディアのデータが読み出され、出力用のハプティクスメディア情報が生成される。

　本技術の他の側面の情報処理装置および方法においては、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルが生成される。

　本技術のさらに他の側面の情報処理装置および方法においては、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられたそのインタラクション型メディアの符号化データが取得され、そのシーンディスクリプションファイルの記述に基づいて、その取得された符号化データが復号され、インタラクション型メディアのデータが生成される。

　本技術のさらに他の側面の情報処理装置および方法においては、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルが生成される。

glTF2.0の主な構成例を示す図である。 glTFオブジェクトと参照関係の例を示す図である。シーンディスクリプションの記述例を示す図である。バイナリデータへのアクセス方法について説明する図である。シーンディスクリプションの記述例を示す図である。 buffer object、buffer view object、accessor objectの関係を説明する図である。 buffer object、buffer view object、accessor objectの記述例を示す図である。シーンディスクリプションのオブジェクトの構成例を説明する図である。シーンディスクリプションの記述例を示す図である。オブジェクトの拡張方法について説明する図である。クライアント処理の構成について説明する図である。タイムドメタデータを扱うためのextensionの構成例を示す図である。シーンディスクリプションの記述例を示す図である。シーンディスクリプションの記述例を示す図である。タイムドメタデータを扱うためのextensionの構成例を示す図である。クライアントの主な構成例を示す図である。クライアント処理の流れの例を説明するフローチャートである。ハプティクスメディアの符号化の概要を説明する図である。ハプティクスメディアを格納するためのISOBMFFの拡張例を示す図である。ハプティクスメディアを扱うためのシーンディスクリプションの拡張例を示す図である。ハプティクスメディアの再生の様子の例を示す図である。ハプティクスメディアを扱うためのシーンディスクリプションの拡張例を示す図である。動的なハプティクスメディアを格納するバッファに対応するアクセサを指定する様子の例を示す図である。シーンディスクリプションの、動的なハプティクスメディアに関する記述例を示す図である。要素のセマンティクスの例を示す図である。シーンディスクリプションの、インタラクション型メディアに関する記述例を示す図である。要素のセマンティクスの例を示す図である。要素のセマンティクスの例を示す図である。シーンディスクリプションの、インタラクション型メディアに関する記述例を示す図である。要素のセマンティクスの例を示す図である。ファイル生成装置の主な構成例を示すブロック図である。ファイル生成処理の流れの例を示すフローチャートである。クライアント装置の主な構成例を示すブロック図である。再生処理の流れの例を示すフローチャートである。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．技術内容・技術用語をサポートする文献等
　２．MPEG-Iシーンディスクリプション
　３．動的なハプティクスメディアのサポート
　４．インタラクション型メディアのサポート
　５．第１の実施の形態（ファイル生成装置）
　６．第２の実施の形態（クライアント装置）
　７．付記

　＜１．技術内容・技術用語をサポートする文献等＞
　本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献等に記載されている内容や以下の非特許文献において参照されている他の文献の内容等も含まれる。

　非特許文献１：（上述）
　非特許文献２：（上述）
　非特許文献３：（上述）
　非特許文献４：（上述）
　非特許文献５：（上述）

　つまり、上述の非特許文献に記載されている内容や、上述の非特許文献において参照されている他の文献の内容等も、サポート要件を判断する際の根拠となる。例えば、非特許文献１乃至非特許文献３に記載されるglTF2.0やそのextensionなどのシンタックスや用語が本開示において直接的に定義されていない場合でも、本開示の範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）等の技術用語についても同様に、本開示において直接的に定義されていない場合でも、本開示の範囲内であり、請求の範囲のサポート要件を満たすものとする。

　＜２．MPEG-Iシーンディスクリプション＞
　　＜gltf2.0＞
　従来、例えば、非特許文献１に記載のように、3D（３次元）オブジェクトを３次元空間内に配置するためのフォーマットであるglTF（The GL Transmission Format）（登録商標）2.0があった。glTF2.0では、例えば図１に示されるように、JSONフォーマットファイル（.glTF）と、バイナリファイル（.bin）と、イメージファイル（.pngや.jpg等）とにより構成される。バイナリファイルは、ジオメトリやアニメーション等のバイナリデータを格納する。イメージファイルは、テクスチャ等のデータを格納する。

　JSONフォーマットファイルは、JSON（JavaScript（登録商標） Object Notation）で記述されたシーンディスクリプションファイル（scene description file）である。シーンディスクリプションとは、3Dコンテンツのシーン（の説明）を記述するメタデータである。このシーンディスクリプションの記述により、どのようなシーンであるかが定義される。シーンディスクリプションファイルは、そのようなシーンディスクリプションを格納するファイルである。本開示においては、シーンディスクリプションファイルのことをシーン記述ファイルとも称する。

　JSONフォーマットファイルの記述は、キー（KEY）とバリュー（VALUE）のペアの羅列により構成される。以下にその書式の例を示す。
　“KEY”:”VALUE”

　キーは文字列により構成される。バリューは数値、文字列、真偽値、配列、オブジェクト、またはnull等により構成される。

　また、複数のキーとバリューのペア（“KEY”:”VALUE”）を、｛｝（中かっこ）を用いてまとめることができる。この中かっこでまとめたものをJSONオブジェクトとも称する。以下にその書式の例を示す。
　“user”:{"id":1, "name":"tanaka”}

　この例の場合、キー（user）に対応するバリューとして、"id":1のペアと"name":"tanaka”のペアをまとめたJSONオブジェクトが定義されている。

　また、０個以上のバリューを、[]（大かっこ）を用いて配列化することもできる。この配列をJSON配列とも称する。このJSON配列の要素として、例えば、JSONオブジェクトを適用することもできる。以下にその書式の例を示す。
　test":["hoge", "fuga", "bar"]
　"users":[{"id":1, "name":"tanaka"},{"id":2,"name":"yamada"},{"id":3, "name":"sato"}]

　JSONフォーマットファイルの最上位に記載できるglTFオブジェクト（glTF object）と、それらが持てる参照関係を図２に示す。図２に示されるツリー構造の長丸がオブジェクトを示し、そのオブジェクト間の矢印が参照関係を示している。図２に示されるように、"scene"、"node"、"mesh"、"camera"、"skin"、"material"、"texture"等のオブジェクトがJSONフォーマットファイルの最上位に記述される。

　このようなJSONフォーマットファイル（シーンディスクリプション）の記述例を図３に示す。図３のJSONフォーマットファイル２０は、最上位の一部の記述例を示している。このJSONフォーマットファイル２０において、使用されるトップレベルオブジェクト（top-level object）２１は、全て最上位に記述される。このトップレベルオブジェクト２１は、図２に示されるglTFオブジェクトである。また、JSONフォーマットファイル２０においては、矢印２２として示されるように、オブジェクト（object）間の参照関係が示される。より具体的には、上位オブジェクトのプロパティ（property）で、参照するオブジェクトの配列の要素のインデックス（index）を指定することによりその参照関係が示される。

　図４は、バイナリデータへのアクセス方法について説明する図である。図４に示されるように、バイナリデータは、バッファオブジェクト（buffer object）に格納される。つまり、バッファオブジェクトにおいてバイナリデータにアクセスするための情報（例えばURI（Uniform Resource Identifier）等）が示される。JSONフォーマットファイルにおいては、図４に示されるように、例えばメッシュ（mesh）、カメラ（camera）、スキン（skin）等のオブジェクトから、そのバッファオブジェクトに対して、アクセサオブジェクト（accessor object）とバッファビューオブジェクト（bufferView object）を介してアクセスすることができる。

　つまり、メッシュ（mesh）、カメラ（camera）、スキン（skin）等のオブジェクトにおいては、参照するアクセサオブジェクトが指定される。JSONフォーマットファイルにおけるメッシュオブジェクト（mesh）の記述例を図５に示す。例えば、図５のように、メッシュオブジェクトにおいては、NORMAL、POSITION、TANGENT、TEXCORD_0等の頂点の属性（アトリビュート（attribute））がキーとして定義され、その属性毎に、参照するアクセサオブジェクトがバリューとして指定されている。

　バッファオブジェクト、バッファビューオブジェクト、アクセサオブジェクトの関係を図６に示す。また、JSONフォーマットファイルにおけるそれらのオブジェクトの記述例を図７に示す。

　図６において、バッファオブジェクト４１は、実データであるバイナリデータにアクセスするための情報（URI等）と、そのバイナリデータのデータ長（例えばバイト長）を示す情報とを格納するオブジェクトである。図７のＡは、そのバッファオブジェクト４１の記述例を示している。図７のＡに示される「"bytelength":102040」は、図６に示されるように、バッファオブジェクト４１のバイト長が102040バイト（bytes）であることを示している。また、図７のＡに示される「"uri":"duck.bin"」は、図６に示されるように、バッファオブジェクト４１のURIが"duck.bin"であることを示している。

　図６において、バッファビューオブジェクト４２は、バッファオブジェクト４１において指定されたバイナリデータのサブセット（subset）領域に関する情報（つまりバッファオブジェクト４１の一部の領域に関する情報）を格納するオブジェクトである。図７のＢは、そのバッファビューオブジェクト４２の記述例を示している。図６や図７のＢに示されるように、バッファビューオブジェクト４２は、例えば、そのバッファビューオブジェクト４２が属するバッファオブジェクト４１の識別情報、そのバッファオブジェクト４１内におけるそのバッファビューオブジェクト４２の位置を示すオフセット（例えばバイトオフセット）、そのバッファビューオブジェクト４２のデータ長（例えばバイト長）を示すレングス（例えばバイトレングス）等の情報を格納する。

　図７のＢに示されるように、バッファビューオブジェクトが複数存在する場合、そのバッファビューオブジェクト毎（つまりサブセット領域毎）に情報が記述される。例えば、図７のＢにおいて上側に示される、「"buffer":0」、「"bytelength":25272」、「"byteOffset":0」等の情報は、図６においてバッファオブジェクト４１内に示される１つ目のバッファビューオブジェクト４２（bufferView[0]）の情報である。また、図７のＢにおいて下側に示される、「"buffer":0」、「"bytelength":76768」、「"byteOffset":25272」等の情報は、図６においてバッファオブジェクト４１内に示される２つ目のバッファビューオブジェクト４２（bufferView[1]）の情報である。

　図７のＢに示される１つ目のバッファビューオブジェクト４２（bufferView[0]）の「"buffer":0」は、図６に示されるように、そのバッファビューオブジェクト４２（bufferView[0]）が属するバッファオブジェクト４１の識別情報が「0」（Buffer[0]）であることを示している。また、「"bytelength":25272」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイト長が25272バイトであることを示している。さらに、「"byteOffset":0」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイトオフセットが0バイトであることを示している。

　図７のＢに示される２つ目のバッファビューオブジェクト４２（bufferView[1]）の「"buffer":0」は、図６に示されるように、そのバッファビューオブジェクト４２（bufferView[0]）が属するバッファオブジェクト４１の識別情報が「0」（Buffer[0]）であることを示している。また、「"bytelength":76768」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイト長が76768バイトであることを示している。さらに、「"byteOffset":25272」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイトオフセットが25272バイトであることを示している。

　図６において、アクセサオブジェクト４３は、バッファビューオブジェクト４２のデータの解釈方法に関する情報を格納するオブジェクトである。図７のＣは、そのアクセサオブジェクト４３の記述例を示している。図６や図７のＣに示されるように、アクセサオブジェクト４３は、例えば、そのアクセサオブジェクト４３が属するバッファビューオブジェクト４２の識別情報、そのバッファビューオブジェクト４２の、バッファオブジェクト４１内における位置を示すオフセット（例えばバイトオフセット）、そのバッファビューオブジェクト４２のコンポーネントタイプ、そのバッファビューオブジェクト４２に格納されるデータ数、そのバッファビューオブジェクト４２に格納されるデータのタイプ等の情報を格納する。これらの情報は、バッファビューオブジェクト毎に記述される。

　図７のＣの例では、「"bufferView":0」、「"byteOffset":0」、「"componentType":5126」、「"count":2106」、「"type":"VEC3"」等の情報が示されている。「"bufferView":0」は、図６に示されるように、そのアクセサオブジェクト４３が属するバッファビューオブジェクト４２の識別情報が「0」（bufferView[0]）であることを示している。また、「"byteOffset":0」は、そのバッファビューオブジェクト４２（bufferView[0]）のバイトオフセットが0バイトであることを示している。さらに、「"componentType":5126」は、コンポーネントタイプが、FLOAT型（OpenGLマクロ定数）であることを示している。また、「"count":2106」は、そのバッファビューオブジェクト４２（bufferView[0]）に格納されるデータが2106個であることを示している。さらに、「"type":"VEC3"」は、そのバッファビューオブジェクト４２（bufferView[0]）に格納されるデータ（のタイプ）が３次元ベクトルであることを示している。

　イメージ（image）以外のデータへのアクセスは、全てこのアクセサオブジェクト４３への参照により（アクセサのインデックスを指定することにより）定義される。

　次に、このようなglTF2.0に準拠するシーンディスクリプション（JSONフォーマットファイル）において、ポイントクラウドの3Dオブジェクトを指定する方法について説明する。ポイントクラウドは、立体構造物（３次元形状のオブジェクト）を多数の点の集合として表現する3Dコンテンツである。ポイントクラウドのデータは、各点の位置情報（ジオメトリ（geometry）とも称する）と属性情報（アトリビュート（attribute）とも称する）とにより構成される。アトリビュートは任意の情報を含むことができる。例えば、各ポイントの色情報、反射率情報、法線情報等がアトリビュートに含まれるようにしてもよい。このようにポイントクラウドは、データ構造が比較的単純であるとともに、十分に多くの点を用いることにより任意の立体構造物を十分な精度で表現することができる。

　ポイントクラウドが時間方向に変化しない（静的であるとも称する）場合、glTF2.0のmesh.primitives objectを用いて3Dオブジェクトを指定する。図８は、ポイントクラウドが静的な場合の、シーンディスクリプションにおけるオブジェクトの構成例を示す図である。図９は、そのシーンディスクリプションの記述例を示す図である。

　図９に示されるように、primitives objectのmodeは、データ（data）がポイントクラウドの点（point）として扱われることを示す0に指定される。図８や図９に示されるように、mesh.primitives内のattributesオブジェクトのポジションプロパティ（POSITION property）において、点（Point）の位置情報を格納するバッファ（buffer）へのアクセサ（accessor）が指定される。同様に、attributesオブジェクトのカラープロパティ（COLOR property）において、点（Point）の色情報を格納するバッファ（buffer）へのアクセサ（accessor）が指定される。バッファ（buffer）とバッファビュー（bufferView）は１つであってもよい（１つのファイル（file）にデータ（data）が格納されてもよい）。

　次に、このようなシーンディスクリプションのオブジェクトの拡張について説明する。glTF2.0の各オブジェクトは、拡張オブジェクト（extension object）内に新たに定義されたオブジェクトを格納することができる。図１０は、新たに定義されたオブジェクト（ExtensionExample）を規定する場合の記述例を示す。図１０に示されるように、新たに定義されたextensionを使用する場合、“extensionUsed”と”extensionRequired”にそのextension object名（図１０の例の場合、ExtensionExample）が記述される。これにより、このextensionが、使用されるextensionであること、または、ロード（load）に必要なextensionであることが示される。

　　＜クライアント処理＞
　次に、MPEG-I Scene Descriptionにおけるクライアント装置の処理について説明する。クライアント装置は、シーンディスクリプションを取得し、そのシーンディスクリプションに基づいて3Dオブジェクトのデータを取得し、そのシーンディスクリプションや3Dオブジェクトのデータを用いて表示画像を生成する。

　非特許文献２に記載のように、クライアント装置では、プレゼンテーションエンジンやメディアアクセスファンクション等が処理を行う。例えば、図１１に示されるように、クライアント装置５０のプレゼンテーションエンジン（Presentation Engine）５１が、シーンディスクリプションの初期値やそのシーンディスクリプションを更新するための情報（以下、更新情報とも称する）を取得し、処理対象時刻のシーンディスクリプションを生成する。そして、プレゼンテーションエンジン５１は、そのシーンディスクリプションを解析し、再生するメディア（動画や音声等）を特定する。そして、プレゼンテーションエンジン５１は、メディアアクセスAPI（Media Access API（Application Program Interface））経由で、メディアアクセスファンクション（Media Access Function）５２に対してそのメディアの取得を要求する。また、プレゼンテーションエンジン５１は、パイプライン処理の設定やバッファの指定等も行う。

　メディアアクセスファンクション５２は、プレゼンテーションエンジン５１から要求されたメディアの各種データをクラウド（Cloud）やローカルストレージ（Local Storage）等から取得する。メディアアクセスファンクション５２は、取得したメディアの各種データ（符号化データ）をパイプライン（Pipeline）５３に供給する。

　パイプライン５３は、供給されたメディアの各種データ（符号化データ）を、パイプライン処理により復号し、その復号結果をバッファ（Buffer）５４に供給する。バッファ５４は、供給されたメディアの各種データを保持する。

　プレゼンテーションエンジン５１は、バッファ５４に保持されているメディアの各種データを用いてレンダリング（Rendering）等を行う。

　　＜Timed mediaの適用＞
　近年、例えば、非特許文献２に示されるように、MPEG-I Scene Descriptionにおいて、glTF2.0を拡張し、３Ｄオブジェクトコンテンツとしてタイムドメディア（Timed media）を適用することが検討されている。タイムドメディアとは、２次元画像における動画像のように、時間軸方向に変化するメディアデータである。

　glTFは、メディアデータ（3Dオブジェクトコンテンツ）として、静止画データのみ適用可能であった。つまり、glTFは、動画像のメディアデータには対応していなかった。3Dオブジェクトを動かす場合は、アニメーション（時間軸に沿って静止画を切り替える方法）が適用されていた。

　MPEG-I Scene Descriptionでは、そのglTF2.0を適用し、シーンディスクリプションとしてJSONフォーマットファイルを適用し、さらに、メディアデータとして、タイムドメディア（例えばビデオデータ）を扱うことができるようにglTFを拡張することが検討されている。タイムドメディアを扱うために、例えば以下のような拡張が行われる。

　図１２は、タイムドメディアを扱うための拡張について説明する図である。図１２の例において、MPEGメディアオブジェクト（MPEG_media）は、glTFのextensionであり、例えば、uri, track, renderingRate, startTime等、ビデオデータ等のMPEGメディアの属性を指定するオブジェクトである。

　また、図１２に示されるように、テクスチャオブジェクト（texture）の拡張オブジェクト（extensions）として、MPEGテクスチャビデオオブジェクト（MPEG_texture_video）が設けられる。そのMPEGテクスチャビデオオブジェクトには、アクセスするバッファオブジェクトに対応するアクセサの情報が格納される。すなわち、MPEGテクスチャビデオオブジェクトは、MPEGメディアオブジェクト（MPEG_media）で指定されたテクスチャメディア（texture media）が復号されて格納されるバッファ（buffer）に対応するアクセサ（accessor）のインデックスを指定するオブジェクトである。

　図１３は、タイムドメディアを扱うための拡張について説明するための、シーンディスクリプションにおけるMPEGメディアオブジェクト（MPEG_media）およびMPEGテクスチャビデオオブジェクト（MPEG_texture_video）の記述例を示す図である。図１３の例の場合、上から２行目において下記のように、テクスチャオブジェクト（texture）の拡張オブジェクト（extensions）として、MPEGテクスチャビデオオブジェクト（MPEG_texture_video）が設定されている。そして、そのMPEGビデオテクスチャオブジェクトのバリューとして、アクセサのインデックス（この例では「2」）が指定されている。

"texture":[{"sampler":0, "source":1, "extensions":{"MPEG_texture_video ":"accessor":2}}],

　また、図１３の例の場合、上から７行目乃至１６行目において下記のように、glTFの拡張オブジェクト（extensions）として、MPEGメディアオブジェクト（MPEG_media）が設定されている。そして、そのMPEGメディアオブジェクトのバリューとして、例えば、そのMPEGメディアオブジェクトの符号化やURI等といった、MPEGメディアオブジェクトに関する様々な情報が格納されている。

"MPEG_media":{
  "media":[
        {"name":"source_1", "renderingRate":30.0, "startTime":9.0, "timeOffset":0.0,
          "loop":"true", "controls":"false",
          "alternatives":[{"mimeType":"video/mp4;codecs=\"avc1.42E01E\"", "uri":"video1.mp4",
                                     "tracks":[{"track":""#track_ID=1"}]
                         }]
        }
  ]
}

　また、各フレームデータはデコードされ順次バッファに格納されるが、その位置などが変動するため、シーンディスクリプションには、その変動する情報を格納して、レンダラ（renderer）がデータを読みだせるようにする仕組みが設けられる。例えば、図１２に示されるように、バッファオブジェクト（buffer）の拡張オブジェクト（extensions）として、MPEGバッファサーキュラオブジェクト（MPEG_buffer_circular）が設けられる。そのMPEGバッファサーキュラオブジェクトには、バッファオブジェクト内にデータを動的に格納するための情報が格納される。例えば、バッファヘッダ（bufferHeader）のデータ長を示す情報や、フレーム数を示す情報等といった情報がこのMPEGバッファサーキュラオブジェクトに格納される。なお、バッファヘッダは、例えば、インデックス（index）、格納されるフレームデータのタイムスタンプやデータ長等といった情報を格納する。

　また、図１２に示されるように、アクセサオブジェクト（accessor）の拡張オブジェクト（extensions）として、MPEGアクセサタイムドオブジェクト（MPEG_timed_accessor）が設けられる。この場合、メディアデータは動画なので時間方向に参照するバッファビューオブジェクト（bufferView）が変化し得る（位置が変動し得る）。そこで、その参照するバッファビューオブジェクトを示す情報が、このMPEGアクセサタイムドオブジェクトに格納される。例えば、MPEGアクセサタイムドオブジェクトには、タイムドアクセサインフォメーションヘッダ（timedAccessor information header）が記述されるバッファビューオブジェクト（bufferView）への参照を示す情報が格納される。なお、タイムドアクセサインフォメーションヘッダは、例えば、動的に変化するアクセサオブジェクトとバッファビューオブジェクト内の情報を格納するヘッダ情報である。

　図１４は、タイムドメディアを扱うための拡張について説明するための、シーンディスクリプションにおけるMPEGバッファサーキュラオブジェクト（MPEG_buffer_circular）およびMPEGアクセサタイムドオブジェクト（MPEG_accessor_timed）の記述例を示す図である。図１４の例の場合、上から５行目において下記のように、アクセサオブジェクト（accessors）の拡張オブジェクト（extensions）として、MPEGアクセサタイムドオブジェクト（MPEG_accessor_timed）が設定されている。そして、そのMPEGアクセサタイムドオブジェクトのバリューとして、バッファビューオブジェクトのインデックス（この例では「1」）、アップデートレート（updataRate）、不変の情報（immutable）等のパラメータとその値が指定されている。

"MPEG_accessor_timed":{"bufferView":1, "updateRate":25.0, "immutable":1,"}

　また、図１４の例の場合、上から１３行目において下記のように、バッファオブジェクト（buffer）の拡張オブジェクト（extensions）として、MPEGバッファサーキュラオブジェクト（MPEG_buffer_circular）が設定されている。そして、そのMPEGバッファサーキュラオブジェクトのバリューとして、バッファフレームカウント（count）、ヘッダ長（headerLength）、アップデートレート（updataRate）等のパラメータとその値が指定されている。

"MPEG_buffer_circular":{"count":5, "headerLength":12, "updateRate":25.0}

　図１５は、タイムドメディアを扱うための拡張について説明するための図である。図１５において、MPEGアクセサタイムドオブジェクトやMPEGバッファサーキュラオブジェクトと、アクセサオブジェクト、バッファビューオブジェクト、およびバッファオブジェクトとの関係の例を示す。

　バッファオブジェクトのMPEGバッファサーキュラオブジェクトには、上述したように、バッファフレームカウント（count）、ヘッダ長（headerLength）、アップデートレート（updataRate）等といった、バッファオブジェクトによって示されるバッファ領域に時間変化するdataを格納するのに必要な情報が格納される。また、そのバッファ領域のヘッダであるバッファヘッダ（bufferHeader）には、インデックス（idex）、タイムスタンプ（timestamp）、データ長（length）等のパラメータが格納される。

　アクセサオブジェクトのMPEGアクセサタイムドオブジェクトには、上述したように、バッファビューオブジェクトのインデックス（bufferView）、アップデートレート（updataRate）、不変の情報（immutable）等といった、参照するバッファビューオブジェクトに関する情報が格納される。また、このMPEGアクセサタイムドオブジェクトには、参照するタイムドアクセサインフォメーションヘッダが格納されるバッファビューオブジェクトに関する情報が格納される。タイムドアクセサインフォメーションヘッダには、タイムスタンプデルタ（timestamp_delta）、アクセサオブジェクトの更新データ、バッファビューオブジェクトの更新データ等が格納され得る。

　　＜MPEG_texture_video使用時のクライアント処理＞
　シーンディスクリプションは、１つ以上の3Dオブジェクトを3D空間に配置するための空間配置情報である。このシーンディスクリプションは、時間軸に沿ってその内容を更新することができる。つまり、時間の経過とともに、3Dオブジェクトの配置を更新することができる。その際のクライアント装置において行われるクライアント処理について説明する。

　図１６は、クライアント装置の、クライアント処理に関する主な構成例を示し、図１７は、そのクライアント処理の流れの例を示すフローチャートである。図１６に示されるように、クライアント装置は、プレゼンテーションエンジン（PresentaionEngine（以下、PEとも称する））５１、メディアアクセスファンクション（MediaAccessFuncon（以下、MAFとも称する））５２、パイプライン（Pipeline）５３、およびバッファ（Buffer）５４を有する。プレゼンテーションエンジン（PE）５１は、glTF解析部６３およびレンダリング（Rendering）処理部６４を有する。

　プレゼンテーションエンジン（PE）５１は、メディアアクセスファンクション５２にメディアを取得させ、バッファ５４を介してそのデータを取得し、表示に関する処理等を行う。具体的には例えば以下のような流れで処理が行われる。

　クライアント処理が開始されると、プレゼンテーションエンジン（PE）５１のglTF解析部６３は、図１７の例のようにPE処理を開始し、ステップＳ２１において、シーンディスクリプションファイルであるSD(glTF)ファイル６２を取得し、そのシーンディスクリプションを解析（parse）する。

　ステップＳ２２において、glTF解析部６３は、3Dオブジェクト（texture）に紐づくメディア（media）と、そのメディアを処理後に格納するバッファ（buffer）と、アクセサ（accessor）を確認する。ステップＳ２３において、glTF解析部６３は、ファイル取得要求として、メディアアクセスファンクション５２にその情報を通知する。

　メディアアクセスファンクション（MAF）５２は、図１７の例のようにMAF処理を開始し、ステップＳ１１において、その通知を取得する。ステップＳ１２において、メディアアクセスファンクション５２は、その通知に基づいてメディア（3Dオブジェクトファイル（mp4））を取得する。

　ステップＳ１３において、メディアアクセスファンクション５２は、取得したメディア（3Dオブジェクトファイル（mp4））を復号する。ステップＳ１４において、メディアアクセスファンクション５２は、復号して得られたメディアのデータを、プレゼンテーションエンジン（PE５１）からの通知に基づいて、バッファ５４に格納する。

　ステップＳ２４において、プレゼンテーションエンジン５１のレンダリング処理部６４は、そのデータを適切なタイミングにおいてバッファ５４から読み出す（取得する）。ステップＳ２５において、レンダリング処理部６４は、取得したデータを用いてレンダリングを行い、表示用画像を生成する。

　メディアアクセスファンクション５２は、ステップＳ１３およびステップＳ１４の処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。また、プレゼンテーションエンジン５１のレンダリング処理部６４は、ステップＳ２４およびステップＳ２５の処理を繰り返すことにより、各時刻（各フレーム）についてこれらの処理を実行する。全てのフレームについて処理が終了すると、メディアアクセスファンクション５２はMAF処理を終了し、プレゼンテーションエンジン５１はPE処理を終了する。つまり、クライアント処理が終了する。

　　＜ハプティクスメディア＞
　ところで、例えば非特許文献３に記載のように、2Dビデオコンテンツや3DoF（Degree of Freedom）/6DoFビデオコンテンツの構成要素であるオーディオメディアやビデオメディアに加えて、触覚情報（ハプティクスメディア（haptics media）とも称する）の符号化伝送技術の規格化が始まった。ハプティクスメディアは、例えば振動等を用いて仮想の感覚を表現する情報である。ハプティクスメディアは例えば、3次元空間を表現する情報である3Dデータに関連付けられて利用される。3Dデータには、例えば、3次元空間に配置された3Dオブジェクトの3次元形状を表現するコンテンツ（例えば、メッシュやポイントクラウド等）や、3次元空間に展開されるビデオコンテンツやオーディオコンテンツ（例えばビデオやオーディオの6DoFコンテンツ等）等が含まれる。

　なお、3Dデータに関連付けられたメディアはどのような情報であってもよく、このハプティクスメディアに限定されない。例えば、画像や音声等がこのメディアに含まれてもよい。3Dデータに関連付けられたメディア（例えば、画像、音声、振動等）には、シーン（3次元空間の状態）の時間方向の進行（変化）に同期して再生される同期型メディアと、ユーザ操作等によりシーンにおいて所定の条件が満たされる場合に再生される（つまり、所定のイベントに対して再生される）インタラクション型メディアとがある。同期型メディアのハプティクスメディアを同期型ハプティクスメディアとも称する。また、インタラクション型メディアのハプティクスメディアをインタラクション型ハプティクスメディアとも称する。同期型ハプティクスメディアは、例えば、風が吹いたり、3Dオブジェクトが移動したりした場合に、その様子に合わせて（そのシーンの変化の様子を表現するように）発生する振動等である。インタラクション型ハプティクスメディアは、例えば、ユーザのアバターが3Dオブジェクトに触れた場合、アバターが3Dオブジェクトを動かした場合、または、アバターが3Dオブジェクトにぶつかった場合等に、その感覚を表現するように発生する振動等である。勿論、これらはハプティクスメディアの一例であり、ハプティクスメディアはこれらの例に限定されない。

　また、3Dデータに関連付けられたメディアには、時間方向に変化し得るメディアと変化しないメディアとがある。

　「時間方向に変化し得るメディア」には、例えば、再生内容（アクション）が時間方向に変化し得るメディアが含まれてもよい。その「再生内容が時間方向に変化し得るメディア」には、例えば、動画像や、長時間の音声情報や振動情報等が含まれてもよい。また、「再生内容が時間方向に変化し得るメディア」には、例えば、所定の時間帯においてのみ再生されるメディアや、時刻に応じた内容が再生されるメディア（例えば、時刻に応じて表示される画像、再生される音声、振動の仕方等が切り替わるメディア）等が含まれてもよい。また、「時間方向に変化し得るメディア」には、例えば、紐づけられる再生条件（イベント）が時間方向に変化し得るメディアが含まれてもよい。その「紐づけられる再生条件が時間方向に変化し得るメディア」には、例えば、触れる、押す、倒す等の、イベントの内容が時間方向に変化し得るメディアが含まれてもよい。また、「紐づけられる再生条件が時間方向に変化し得るメディア」には、例えば、イベントが発生する位置が時間方向に変化し得るメディアが含まれてもよい。例えば、時刻T1においてはオブジェクトの右側に触れた場合に再生され、時刻T2においてはオブジェクトの左側に触れた場合に再生されるメディアが含まれてもよい。勿論、時間方向に変化するものであればどのようなメディアであってもよく、これらの例には限定されない。これに対して、「時間方向に変化しないメディア」には、例えば、再生内容（アクション）が時間方向に変化しないメディア（どの時刻においてもアクションが同一なメディア）が含まれてもよい。また、「時間方向に変化しないメディア」には、例えば、紐づけられる再生条件（イベント）が時間方向に変化しないメディア（イベントの内容やイベントが発生する位置がどの時刻においても同一なメディア）が含まれてもよい。本明細書において、時間方向に変化し得ることを「動的」とも称する。例えば、時間方向に変化し得るメディア（Timed media）のことを動的なメディアとも称する。例えば、時間方向に変化し得るハプティクスメディアを動的なハプティクスメディアとも称する。また、時間方向に変化しないことを「静的」とも称する。例えば、時間方向に変化しないメディアのことを静的なメディアとも称する。例えば、時間方向に変化しないハプティクスメディアを静的なハプティクスメディアとも称する。

　非特許文献３においては、このようなハプティクスメディアの符号化方法が提案されている。この方法では、図１８の上側に示されるようなアーキテクチャを用いて、ハプティクス信号（wav）や、ハプティクス信号記述（ivs,ahap）が符号化され、インターチェンジフォーマット（gmap）やディストリビューションフォーマット（mpg）が生成される。図１８の下側の表は、ディストリビューションフォーマットの構成例を示す。この表に示されるように、ハプティクスメディアのビットストリームは、バイナリヘッダとバイナリボディとにより構成される。バイナリヘッダには、ハプティクスメディアの符号化データ（Haptics stream）の特性、レンダリングデバイス、符号化手法の情報等が格納される。また、バイナリボディには、ハプティクスメディアの符号化データ（Haptics stream）が格納される。

　また、非特許文献４に記載のように、そのハプティクスメディアが符号化されたビットストリームをISOBMFF（International Organization for Standardization Base Media File Format）に格納するための基本機能が作成された。図１９は、そのハプティクスメディアを格納するためのISOBMFFの拡張例を示す図である。非特許文献４には、ハプティクスメディアを格納するために、メディアタイプ’hapt’が定義された。また、メディアインフォメーションボックスとして、ハプティクスサンプルエントリ（HapticsSampleEntry）が用意された。ただし、ハプティクスサンプルエントリの内部の構造については未定義であった。

　また、非特許文献５に記載のように、ハプティクスメディアの符号化伝送技術の規格化と並行して、MPEG-I Scene Descriptionでハプティクスメディアを扱うための技術探索検討が始まった。非特許文献５においては、シーンディスクリプションにおいてハプティクスメディアをサポートするために、図２０に示されるように、MPEG_haptic、MPEG_material_haptic、MPEG_avatar、およびMPEG_interactionの4つのgLTF拡張が提案された。

　MPEG_hapticは、シーンディスクリプションから参照されるハプティクスメディアのデータ（ハプティクスデータとも称する）を参照するための情報（例えばリンク情報等）である。このハプティクスデータは、オーディオや画像等のデータと同様に、独立したデータとして存在する。また、このハプティクスデータは、符号化されていてもよい（符号化データであってもよい）。

　既に定義されている3Dオブジェクトのmesh/material拡張であるMPEG_material_hapticは、ハプティクス素材情報（3Dオブジェクト（メッシュ）の何処にどのハプティクスメディアが関連付けられるか等）を定義する。この素材情報には、静的なハプティクスメディアの情報が定義される。また、このハプティクス素材情報には、MPEG_hapticにアクセスするための情報（例えばリンク情報等）を定義することもできる。

　MPEG_avatarは、3次元空間を移動するユーザの3D形状（アバター）を定義する。MPEG_interactionは、アバター（ユーザ）が実行可能な条件（ユーザができること）と可能なアクション（オブジェクトの反応方法）をリストアップする。例えば、MPEG_interactionは、ユーザ（MPEG_avatar）と3Dオブジェクトとの間で発生するインタラクション（つまり、イベント）と、その結果発生するアクションを定義する（例えば、ユーザが3Dオブジェクトを触ると振動が起きる等）。

　シーンディスクリプションのこれらの拡張を用いてハプティクスメディアを再生する方法の様子の例を、図２１に示す。例えば、MPEG_avatarに定義されるアバターがMPEG_interactionに定義されるインタラクション（イベント）を発生させると、そのインタラクションに対応するアクションを起こすように、MPEG_materal_hapticsの素材情報に従ってインタラクションが発生した場所等に応じた静的なハプティクスメディアが生成され、再生される（例えば、振動デバイスにより出力される振動がレンダリングされる）。または、MPEG_materal_hapticsに示されるMPEG_hapticが参照するハプティクスデータが読み出され、動的なハプティクスメディアが生成され、再生される。

　＜３．動的なハプティクスメディアのサポート＞
　　＜PE・MAFの利用＞
　例えば、上述の例のように、MPEG_hapticを利用して動的なハプティクスメディアを再生することが考えられる。しかしながら、MPEG_hapticsにはMAF（図１６等）に関する定義がなかった。そして、マテリアル（material）プロパティには、静的な情報の記述しか行うことができない。そのため、MPEG_materal_hapticsにおいてタイムドメタデータ（Timed media）を扱うことができなかった。つまり、動的なハプティクスメディアを非特許文献２に記載のような（MAFやPEを利用した）クライアント処理を用いて再生することは困難であった。そのため、3Dデータに関連付けられたメディアデータの再生性能が低減するおそれがあった。

　　＜方法１＞
　そこで、図２２の表の最上段に示されるように、シーンディスクリプション（SD）において、3Dデータに関連付けられた動的なハプティクスメディアが格納されるバッファへのアクセサを指定するようにする（方法１）。換言するに、符号化側においてそのような指定を含むシーンディスクリプションが生成され、復号側に提供される。そして、復号側においてそのシーンディスクリプションに基づいて動的なハプティクスメディアが取得され、その指定されたアクセサに対応するバッファに格納される。

　例えば、シーンディスクリプションファイル等を生成する情報処理装置（以下において第１の情報処理装置とも称する）が、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成するファイル生成部を備える。また、シーンディスクリプションファイル等を生成する情報処理方法（以下において第１の情報処理方法とも称する）において、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成する。

　例えば、3Dデータに関連付けられたメディアを再生する情報処理装置（以下において第２の情報処理装置とも称する）が、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得する取得部と、そのシーンディスクリプションファイルの記述に基づいて、その符号化データを復号し、ハプティクスメディアのデータを生成する復号部と、そのハプティクスメディアのデータを、そのシーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶する記憶部と、そのシーンディスクリプションファイルの記述に基づいて、その記憶領域に記憶されているハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報（つまり、ハプティクスメディアを出力する出力部の駆動（例えば、振動デバイスの振動の仕方）を制御する制御情報等）を生成する生成部とを備える。また、3Dデータに関連付けられたメディアを再生する情報処理方法（以下において第２の情報処理方法とも称する）において、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得し、そのシーンディスクリプションファイルの記述に基づいて、その符号化データを復号し、そのハプティクスメディアのデータを生成し、そのハプティクスメディアのデータを、そのシーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶し、そのシーンディスクリプションファイルの記述に基づいて、その記憶領域に記憶されているハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する。

　このようにすることにより、第２の情報処理装置は、MAFやPEを利用したクライアント処理を用いて動的なハプティクスメディアを再生することができる。換言するに、第１の情報処理装置は、第２の情報処理装置がMAFやPEを利用したクライアント処理を用いて動的なハプティクスメディアを再生することができるようにすることができる。つまり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　なお、この動的なハプティクスメディアは、シーンの時間方向の進行に同期して再生される同期型ハプティクスメディアを含んでもよい。換言するに、第２の情報処理装置の生成部が、所定の再生タイミングに応じたタイミングにおいて、シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域からこの同期型ハプティクスメディアのデータを読み出し、ハプティクスメディア情報を生成してもよい。

　また、この動的なハプティクスメディアは、ユーザ操作等によりシーンにおいて所定の条件が満たされる場合に再生されるインタラクション型ハプティクスメディアを含んでもよい。換言するに、第２の情報処理装置の生成部が、その条件が満たされる場合に、シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域からこのインタラクション型ハプティクスメディアのデータを読み出し、ハプティクスメディア情報を生成してもよい。

　　＜方法１－１＞
　また、方法１が適用される場合において、図２２の表の上から２段目に示されるように、「マテリアル（material）」プロパティを拡張して、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定してもよい（方法１－１）。つまり、方法１におけるアクセサの指定は、シーンディスクリプションの何処で行われてもよいが、例えば、textureの素材情報として定義されている「マテリアル（material）」プロパティにおいて行われてもよい。

　例えば、第１の情報処理装置のファイル生成部が、「マテリアル（material）」プロパティにおいて、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域（バッファ）に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成してもよい。換言するに、第２の情報処理装置の記憶部が、3Dデータに関連付けられた動的なハプティクスメディアのデータを、シーンディスクリプションファイルの「マテリアル（material）」プロパティにおいて指定されるアクセサ（、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域（バッファ）に記憶させるためのアクセサ）に対応する記憶領域に記憶してもよい。

　例えば、図２３に示されるように、マテリアルに定義されたMPEG_material_hapticsにおいて、方法１におけるアクセサの指定が行われてもよい。つまり、MPEG_material_hapticsを拡張し、タイムドメタデータを扱うために規定された属性を定義してもよい。その場合のシーンディスクリプションの記述例を図２４に示す。

　図２４に示されるように、MPEG_media（glTFのextension）において、所定のバッファに対応するアクセサ（source_2）が指定され、そこに、格納する動的なハプティクスメディアの属性等が指定される（例えば、“mimeType”:"video/mp4;codecs=\"avc1.42E01E\“”, "uri”:”video1.mp4”,“tracks”:[{“track”:””#track_ID=1”等）。また、MPEG_material_hapticsにおいて、MPEG_mediaで指定されたハプティクスメディアが格納されるバッファに対応するアクセサのインデックスが指定される（“accessor": 2）。なお、この記述に含まれる要素のセマンティクスの例を図２５に示す。

　PEは、このような記述に基づいて、図２３に示されるように、マテリアル（MPEG_material_haptics）からアクセサを介してバッファに格納されるMPEG_media（動的なハプティクスメディアのデータ）を参照することができる。換言するに、MAFは、このような記述に基づいて、そのMPEG_mediaをそのバッファに格納することができる。したがって、第２の情報処理装置は、PEやMAFを利用して、3Dデータに関連付けられたメディアデータを再生することができる。つまり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　＜４．インタラクション型メディアのサポート＞
　　＜インタラクション処理＞
　例えば、インタラクション型メディアの場合、インタラクション（イベント）が発生すると、クライアント装置により、そのメディアのファイルが取得され、データが復号される。しかしながら、このようにインタラクションが発生したタイミングでメディアのファイルを取得すると、少なくともファイル取得のプロトコル(例えば、HTTP（HyperText Transfer Protocol）でサーバから取得)の時間や、フィードバックに要する時間等の遅延が発生するおそれがあった。そのため、そのようなメディアを正しいタイミングで再生することが困難であった。つまり、3Dデータに関連付けられたメディアデータの再生性能が低減するおそれがあった。

　　＜方法２＞
　そこで、図２２の表の上から３段目に示されるように、シーンディスクリプション（SD）において、3Dデータに関連付けられたインタラクション型メディアに関する情報を記述するようにする（方法２）。換言するに、符号化側において、そのような情報を含むシーンディスクリプションが生成され、復号側に提供される。そして、復号側において、そのシーンディスクリプションの情報に基づいて、（所定のインタラクション（イベント）の発生よりも前に）インタラクション型メディアの符号化データが取得され、復号される。

　例えば、第１の情報処理装置が、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成するファイル生成部を備える。また、第１の情報処理方法において、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成する。

　例えば、第２の情報処理装置が、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられたインタラクション型メディアの符号化データを取得する取得部と、そのシーンディスクリプションファイルの記述に基づいて、取得された符号化データを復号し、インタラクション型メディアのデータを生成する復号部とを備える。また、第２の情報処理方法において、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられたインタラクション型メディアの符号化データを取得し、そのシーンディスクリプションファイルの記述に基づいて、その取得された符号化データを復号し、インタラクション型メディアのデータを生成する。

　このようにすることにより、第２の情報処理装置によるインタラクション型メディアのデータの取得をシーンディスクリプションにおいて制御することができる。換言するに、第１の情報処理装置は、シーンディスクリプションを用いて、第２の情報処理装置によるインタラクション型メディアのデータの取得を制御することができる。例えば、第１の情報処理装置は、上述した再生遅延が生じないようなタイミングにおいて（事前に）、インタラクション型メディアのデータを第２の情報処理装置に取得させることができる。また、第２の情報処理装置は、上述した再生遅延が生じないようなタイミングにおいて（事前に）、インタラクション型メディアのデータを取得することができる。つまり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　なお、このインタラクション型メディアは、ユーザ操作等によりシーンにおいて所定の条件が満たされる場合に処理を実行するメディアであれば、どのようなメディアであってもよい。例えば、このインタラクション型メディアがハプティクス情報を含んでもよい。また、このインタラクション型メディアは、画像情報を含んでもよい。また、このインタラクション型メディアが、音声情報を含んでもよい。勿論、インタラクション型メディアは、これらの例に限定されない。

　　＜方法２－１＞
　また、方法２が適用される場合において、図２２の表の上から４段目に示されるように、インタラクション処理を実行するか否かをシーンディスクリプションに記述してもよい（方法２－１）。例えば、上述したシーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述は、ユーザ操作等によりシーンにおいて所定の条件が満たされる場合に実行するインタラクション型の処理が可能であるか否かを示す記述を含んでもよい。例えば、第２の情報処理装置の取得部が、その記述によりインタラクション型の処理が可能であることが示される場合、インタラクション型メディアの符号化データを取得してもよい。

　図２６は、上述した方法２が適用される場合の、シーンディスクリプションの記述例を示す図である。また、図２７は、その記述に含まれる要素のセマンティクスの例を示す図である。図２６に示されるように、MPEG_mediaにおいて「event_control」が定義されている。event_controlは、図２７に示されるように、イベント（インタラクション）に基づいて、このハプティクスメディアの再生処理が有効であるか否かを示すフラグ情報である。例えば、このevent_controlが真に設定されている場合、イベントに基づく処理の実行が可能であること、すなわち、取り扱われるメディアがインタラクション型メディアであることを示す。

　このような記述により、インタラクション型メディアに関する記述であることを第２の情報処理装置に明示することができる。したがって、第２の情報処理装置は、インタラクション型メディアに関する記述を識別し、その記述に基づいてインタラクション型メディアのデータを取得することができる。例えば、第２の情報処理装置は、その記述に基づいて、インタラクション型メディアのデータを、上述した再生遅延が生じないようなタイミングにおいて（事前に）取得することができる。換言するに、第１の情報処理装置は、このインタラクション型メディアに関する記述により、第２の情報処理装置によるインタラクション型メディアのデータの取得を制御することができる。例えば、第１の情報処理装置は、その記述により、上述した再生遅延が生じないようなタイミングにおいて（事前に）、インタラクション型メディアのデータを第２の情報処理装置に取得させることができる。つまり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　　＜方法２－２＞
　また、方法２が適用される場合において、図２２の表の上から５段目に示されるように、アバターに応じたインタラクション処理を実行するか否かをシーンディスクリプションに記述してもよい（方法２－２）。例えば、上述したシーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述は、ユーザ操作またはアバターの属性情報に応じてそのインタラクション型メディアを選択可能であるか否かを示す記述を含んでもよい。例えば、上述したシーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述において、インタラクション型メディアを選択可能であることが示される場合、第２の情報処理装置の取得部が、ユーザ操作またはアバターの属性情報等に応じてインタラクション型メディアを選択してもよい。また、上述したシーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述において、インタラクション型メディアを選択不可能であることが示される場合、第２の情報処理装置の取得部が、所定のインタラクション型メディアを選択してもよい。

　図２６に示されるように、MPEG_mediaにおいて「avatar_dependent_media」が定義されている。avatar_dependent_mediaは、図２７に示されるように、ユーザ操作またはアバターの属性情報に応じて、複数のメディアの中から適用するインタラクション型メディアを選択することができるか否かを示すフラグ情報である。例えば、このavatar_dependent_mediaが真に設定されている場合、適用するインタラクション型メディアを、複数のメディアの中からユーザ操作またはアバターの属性情報に応じて選択することが可能であることを示す。つまり、ユーザまたはアバターに応じて選択可能なインタラクション型メディアが複数用意されていることが示される。

　したがって、第２の情報処理装置は、このような記述に基づいて、インタラクション型メディアを選択することができる。換言するに、第１の情報処理装置は、このようなインタラクション型メディアの選択を第２の情報処理装置に実行させることができる。これにより、より多様なメディアの再生が可能になる。つまり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　　＜方法２－３＞
　また、方法２が適用される場合において、図２２の表の上から６段目に示されるように、メディアデータの取得処理条件を記述してもよい（方法２－３）。例えば、上述したシーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述は、再生対象の3Dデータに関連付けられたインタラクション型メディアの符号化データの取得に関する記述を含んでもよい。例えば、第２の情報処理装置の取得部が、その符号化データの取得に関する記述に従ってその符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいて「fetch_timing_information」が定義されている。fetch_timing_informationは、図２７に示されるように、インタラクション型メディアの符号化データの取得に関する記述である。第２の情報処理装置は、この記述に基づいて、インタラクション型メディアを取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置によるインタラクション型メディアの取得をより詳細に制御することができる。つまり、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　　＜fetch_timing_information＞
　次に、インタラクション型メディアの取得に関する記述であるfetch_timing_informationについて説明する。fetch_timing_informationにはどのような情報が含まれてもよい。例えば、fetch_timing_informationに、取得の条件に関する記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、その条件が満たされる場合に、インタラクション型メディアの符号化データを取得してもよい。

　第２の情報処理装置は、この取得の条件に関する記述に基づいて、インタラクション型メディアを取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置によるインタラクション型メディアの取得を、この取得の条件に基づいて制御することができる。

　例えば、この取得の条件に関する記述に、その条件が「シーンに必要な情報の初期化前」であるか否かを示す記述が含まれてもよい。例えば、その記述により、取得の条件が、「シーンに必要な情報の初期化前」であることが示される場合、第２の情報処理装置の取得部が、その情報の初期化前において、インタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「Initial」が定義されている。fetch_timing_informationの要素のセマンティクスの例を図２８に示す。このInitialは、図２８に示されるように、シーンに必要な情報を初期化する際に、このインタラクション型メディアの符号化データを取得するか否かを示すフラグ情報である。例えば、このInitialが真に設定されている場合、シーンに必要な情報を初期化する際にこのインタラクション型メディアの符号化データを取得することを示す。

　したがって、第２の情報処理装置は、このInitialの設定に従って、例えば、シーンに必要な情報を初期化する際にこのインタラクション型メディアの符号化データを取得するか否かを選択することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置がシーンに必要な情報を初期化する際にこのインタラクション型メディアの符号化データを取得するか否かを制御することができる。

　例えば、この取得の条件に関する記述に、取得するインタラクション型メディアに対応する位置のLoD（Level Of Detail）を示す記述が含まれてもよい。例えば、その記述により示されるLoDよりも、取得するインタラクション型メディアに対応する位置のLoDの方が大きい場合、第２の情報処理装置の取得部がインタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「Lod」が定義されている。このLodは、図２８に示されるように、インタラクション型メディアの符号化データのLoDに関する取得条件を示す記述である。例えば、取得するインタラクション型メディアに対応する位置のLoDの方がこのLoDよりも大きい場合、そのインタラクション型メディアの符号化データが取得される。

　したがって、第２の情報処理装置は、このLoDの設定に従って、例えば、取得するインタラクション型メディアに対応する位置に十分に近づいた場合（LoDの設定よりもその位置が大きく表示される場合）に、このインタラクション型メディアの符号化データを取得することができる。換言するに、第１の情報処理装置は、この記述により、例えば、取得するインタラクション型メディアに対応する位置に十分に近づいた場合（LoDの設定よりもその位置が大きく表示される場合）にこのインタラクション型メディアの符号化データを取得するように、第２の情報処理装置を制御することができる。

　例えば、この取得の条件に関する記述に、取得するインタラクション型メディアに対応する位置までの距離を示す記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、視点またはアバターがその位置に対して、その記述により示される距離以内に接近した場合にインタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「Distance」が定義されている。このDistanceは、図２８に示されるように、このインタラクション型メディアが紐づけられた位置（mesh/texture）までの視聴距離に関する取得条件を示す記述である。例えば、その視聴距離がこのDistanceよりも近い（短い）場合、そのインタラクション型メディアの符号化データが取得される。

　したがって、第２の情報処理装置は、このDistanceの設定に従って、例えば、取得するインタラクション型メディアに対応する位置に十分に近づいた場合（Distanceの設定よりも近距離の場合）に、このインタラクション型メディアの符号化データを取得することができる。換言するに、第１の情報処理装置は、この記述により、例えば、取得するインタラクション型メディアに対応する位置に十分に近づいた場合（Distanceの設定よりも近距離の場合）にこのインタラクション型メディアの符号化データを取得するように、第２の情報処理装置を制御することができる。

　例えば、この取得の条件に関する記述に、その条件が「インタラクション型メディアに対応する位置が視界に入ること」であるか否かを示す記述が含まれてもよい。例えば、その記述により、インタラクション型メディアに対応する位置が視界に入ることが取得の条件であることが示される場合、第２の情報処理装置の取得部が、その位置が視界内に入った時にそのインタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「view_frustum」が定義されている。このview_frustumは、図２８に示されるように、このインタラクション型メディアに紐づけられた位置（mesh/texture）がユーザ（カメラ）の視界に入った場合に、このインタラクション型メディアの符号化データを取得することを示す。

　したがって、第２の情報処理装置は、このview_frustumの設定に従って、例えば、インタラクション型メディアに対応する位置が視界に入った場合にこのインタラクション型メディアの符号化データを取得するか否かを選択することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置が、インタラクション型メディアに対応する位置が視界に入った場合にこのインタラクション型メディアの符号化データを取得するか否かを制御することができる。

　例えば、この取得の条件に関する記述に、インタラクション型メディアを取得する推奨時刻を示す記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、その記述により示される推奨時刻においてインタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「recommended_Fetch_time」が定義されている。このrecommended_Fetch_timeは、図２８に示されるように、このインタラクション型メディアの符号化データを取得する時刻として推奨される時刻を示す。例えば、インタラクションが発生する可能性のあるシーンが既知である場合、そのタイミングに合わせて（それよりも前のタイミングにおいて）符号化データを取得することができるように推奨時刻がセットされる。

　したがって、第２の情報処理装置は、このrecommended_Fetch_timeの設定に従って、推奨されるタイミング（時刻）において、インタラクション型メディアの符号化データを取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置が、インタラクション型メディアの符号化データを取得するタイミング（時刻）を制御することができる。つまり、第１の情報処理装置は、この記述により、より適切なタイミング（時刻）においてインタラクション型メディアの符号化データを取得するように、第２の情報処理装置を制御することができる。

　例えば、この取得の条件に関する記述に、インタラクション型メディアを取得する所定の空間領域を示す記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、視点またはアバターがその記述により示される空間領域内に位置する場合、インタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「fetch_boundaries」が定義されている。このfetch_boundariesは、図２８に示されるように、このインデックスで表現されるメッシュ空間にユーザ（カメラ）が位置する場合、インタラクション型メディアの符号化データが取得されることを示す。

　したがって、第２の情報処理装置は、このfetch_boundariesの設定に従って、視点またはアバターがその記述により示される空間領域内に位置する場合に、インタラクション型メディアの符号化データを取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置がインタラクション型メディアの符号化データを取得する空間領域を制御することができる。

　また、fetch_timing_informationに、インタラクション型メディアの取得方法に関する記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、その取得方法に関する記述に従ってインタラクション型メディアの符号化データを取得してもよい。

　第２の情報処理装置は、この取得方法に関する記述に基づいて、インタラクション型メディアを取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置によるインタラクション型メディアの取得方法を制御することができる。

　例えば、この取得方法に関する記述に、インタラクション型メディアの符号化データが3Dデータのファイルに含まれるか否かを示す記述が含まれてもよい。例えば、インタラクション型メディアの符号化データが3Dデータのファイルに含まれないことが示される場合、第２の情報処理装置の取得部がその符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「delivery_with_texture_video」が定義されている。このdelivery_with_texture_videoは、図２８に示されるように、インタラクション型メディアの符号化データが、そのインタラクション型メディアに紐づけられた位置（mesh/texture）の3Dデータと同じファイルに格納されているか否かを示すフラグ情報である。例えば、このdelivery_with_texture_videoが真の場合、インタラクション型メディアの符号化データが3Dデータのファイルに含まれることを示す。つまり、この場合、インタラクション型メディアの符号化データは、3Dデータのファイルから取得することができるので、その3Dデータのファイル以外にインタラクション型メディアのファイルを取得する必要がない。

　したがって、第２の情報処理装置は、このdelivery_with_texture_videoの設定に従って、インタラクション型メディアの符号化データの取得元ファイルを選択することができる。つまり、第２の情報処理装置は、インタラクション型メディアのファイルを取得するか否かを、このdelivery_with_texture_videoの設定に従って選択することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置がインタラクション型メディアのファイルを取得するか否かを制御することができる。

　例えば、この取得方法に関する記述に、インタラクション型メディアの優先度を示す記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、この優先度に応じてインタラクション型メディアの符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「priority」が定義されている。このpriorityは、図２８に示されるように、インタラクション型メディアの再生やレンダリングの優先度を示す。例えば、優先度の高いインタラクション型メディアは再生やレンダリングする重要度が高いことを示す。例えば、取得条件が互いに同一の複数のメディアのいずれを優先させるかを示すことができる。

　したがって、第２の情報処理装置は、このpriorityの設定に従って、例えばインタラクション型メディアの符号化データの取得順を制御したり、取得する符号化データを選択したりすることができる。例えば、第２の情報処理装置は、優先度が高いインタラクション型メディアから先に符号化データを取得してもよいし、優先度が十分に高いインタラクション型メディアの符号化データのみを取得してもよい。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置によるインタラクション型メディアの符号化データの取得順や、取得する符号化データの選択を制御することができる。

　また、fetch_timing_informationに、インタラクション型メディアのタイプに関する記述が含まれてもよい。例えば、第２の情報処理装置の取得部が、インタラクション型メディアのタイプに関する記述に従ってそのインタラクション型メディアの符号化データを取得してもよい。

　第２の情報処理装置は、このインタラクション型メディアのタイプに関する記述に基づいて、インタラクション型メディアを取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置によるインタラクション型メディアの取得を制御することができる。

　例えば、このインタラクション型メディアのタイプに関する記述に、そのインタラクション型メディアが動的なメディアであるか否かを示す記述が含まれてもよい。例えば、インタラクション型メディアが動的なメディアであることが示される場合、第２の情報処理装置の取得部が動的なメディアに応じた方法でその符号化データを取得してもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「moving_object」が定義されている。このmoving_objectは、図２８に示されるように、このインタラクション型メディアが3D空間内を移動する（動的である）ため、初期値はFetch_timinig_informationのLoD、Distance、Recommended_Fetch_time、Fetch_boundaries等を参照する。このmoving_objectがTrueの場合、動的に変化する値は、タイムドメタデータ（timed metadata）であるmoving_object_metadataファイルから取得する。

　したがって、第２の情報処理装置は、このmoving_objectの設定に従って、インタラクション型メディアの符号化データを、そのタイプに応じた方法で取得することができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置に対して、インタラクション型メディアのタイプに応じた方法で、その符号化データを取得させることができる。つまり、第２の情報処理装置は、インタラクション型メディアの符号化データの取得を、このmoving_objectの設定に従った方法で行うことができる。換言するに、第１の情報処理装置は、この記述により、第２の情報処理装置がインタラクション型メディアの符号化データを取得する方法を制御することができる。

　例えば、このインタラクション型メディアのタイプに関する記述に、動的なメディアを格納する記憶領域に対応するアクセサを指定する記述が含まれてもよい。例えば、インタラクション型メディアが動的なメディアである場合、第２の情報処理装置の取得部が、この記述により指定されるアクセサに対応する記憶領域にその動的なメディアを記憶させてもよい。

　図２６に示されるように、MPEG_mediaにおいてfetch_timing_informationとして、「accessors」が定義されている。このaccessorsは、図２８に示されるように、このインタラクション型メディアが空間内を移動するため、Moving_object=trueの場合、動的に変化するFetch_timinig_informationである、LoD、Distance、Recommended_Fetch_time、Fetch_boundariesは、このaccessorがアクセスするmoving_object_metadataファイルからバッファを通じて取得する。

　したがって、第２の情報処理装置は、このaccessorsにより示されるアクセサに対応するバッファを用いてインタラクション型メディアを授受することができる。換言するに、第１の情報処理装置は、このaccessorsにより示されるアクセサに対応するバッファを用いてインタラクション型メディアを授受するように、第２の情報処理装置を制御することができる。

　　＜マテリアル＞
　なお、方法２が適用される場合において、上述のようなインタラクション型メディアに関する記述が、シーンディスクリプションファイルのマテリアル（material）に記述されてもよい。例えば、第１の情報処理装置のファイル生成部が、インタラクション型メディアに関する記述をマテリアルに格納するシーンディスクリプションファイルを生成してもよい。また、第２の情報処理装置の取得部が、シーンディスクリプションファイルのマテリアルの、インタラクション型メディアに関する記述に基づいて、そのインタラクション型メディアの符号化データを取得してもよい。

　　＜方法２－４＞
　また、方法２が適用される場合において、図２２の表の上から７段目に示されるように、インタラクション型メディアに関する記述が、シーンディスクリプションのマテリアルにおいてファイル情報として格納されてもよい（方法２－４）。例えば、第２の情報処理装置の取得部が、シーンディスクリプションファイルのマテリアルの、インタラクション型メディアに関する記述に基づいて、そのインタラクション型メディアの符号化データを取得してもよい。

　図２６の例においては、上述したインタラクション型メディアに関する記述は、MPEG_media内に記述されている。つまり、インタラクション型メディアに関する記述は、シーンディスクリプションのマテリアルにおいてファイル情報として格納されている。このような構成としてもよい。

　　＜方法２－５＞
　また、方法２が適用される場合において、図２２の表の最下段に示されるように、インタラクション型メディアに関する記述が、シーンディスクリプションのマテリアルにおいてインタラクション型メディアの事前処理情報として格納されてもよい（方法２－５）。例えば、第２の情報処理装置の取得部が、シーンディスクリプションファイルのマテリアルにおいて、インタラクション型メディアの事前処理情報として記述されたインタラクション型メディアに関する記述に基づいて、そのインタラクション型メディアの符号化データを取得してもよい。

　図２９にその場合の記述例を示す。図２９の例においては、上述したインタラクション型メディアに関する記述は、MPEG_mediaの外に「properties」（事前処理情報）として記述されている。つまり、インタラクション型メディアに関する記述は、シーンディスクリプションのマテリアルにおいて事前処理情報として格納されている。なお、このpropertiesのセマンティクスの例を図３０に示す。なお、event_control、avatar_dependent_media、fetch_timing_information等の要素のセマンティクスの例は、図２７および図２８の場合と同様である。このような構成としてもよい。

　＜５．第１の実施の形態＞
　　＜ファイル生成装置＞
　上述した本技術は、任意の装置に適用し得る。図３１は、本技術を適用した情報処理装置の一態様であるファイル生成装置の構成の一例を示すブロック図である。図３１に示されるファイル生成装置１００は、ハプティクスメディア等のメディアが関連付けられた3Dオブジェクトコンテンツ（例えばポイントクラウド等の3Dデータ）を符号化し、例えばISOBMFF等のファイルコンテナに格納する装置である。また、ファイル生成装置１００は、その3Dオブジェクトコンテンツのシーンディスクリプションファイルを生成する。

　なお、図３１においては、処理部やデータの流れ等の主なものを示しており、図３１に示されるものが全てとは限らない。つまり、ファイル生成装置１００において、図３１においてブロックとして示されていない処理部が存在したり、図３１において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図３１に示されるようにファイル生成装置１００は、制御部１０１およびファイル生成処理部１０２を有する。制御部１０１は、ファイル生成処理部１０２を制御する。ファイル生成処理部１０２は、制御部１０１により制御されて、ファイルの生成に関する処理を行う。

　ファイル生成処理部１０２は、入力部１１１、前処理部１１２、符号化部１１３、前処理部１１４、符号化部１１５、ファイル生成部１１６、記憶部１１７、および出力部１１８を有する。ファイル生成部１１６は、SDファイル生成部１２１、3Dファイル生成部１２２、およびメディアファイル生成部１２３を有する。

　入力部１１１は、3Dオブジェクトコンテンツのデータの取得に関する処理を行う。例えば、入力部１１１は、3Dデータをファイル生成装置１００の外部から取得してもよい。また、入力部１１１は、その3Dデータに関連付けられたメディアデータをファイル生成装置１００の外部から取得してもよい。入力部１１１は、取得した3Dデータを前処理部１１２へ供給してもよい。入力部１１１は、取得したメディアデータを前処理部１１４へ供給してもよい。

　前処理部１１２は、3Dデータに対して符号化前に行う前処理に関する処理を実行する。例えば、前処理部１１２は、入力部１１１から供給される3Dデータを取得してもよい。また、前処理部１１２は、取得した3Dデータ等から、シーンディスクリプションの生成に必要な情報を取得してもよい。また、前処理部１１２は、その取得した情報をファイル生成部１１６（のSDファイル生成部１２１）へ供給してもよい。また、前処理部１１２は、3Dデータを符号化部１１３へ供給してもよい。

　符号化部１１３は、3Dデータの符号化に関する処理を実行する。例えば、符号化部１１３は、前処理部１１２から供給される3Dデータを取得してもよい。また、符号化部１１３は、取得した3Dデータを符号化し、その符号化データを生成してもよい。また、符号化部１１３は、生成した符号化データをファイル生成部１１６（の3Dファイル生成部１２２）へ供給してもよい。

　前処理部１１４は、3Dデータに関連付けられたメディアデータに対して符号化前に行う前処理に関する処理を実行する。例えば、前処理部１１４は、入力部１１１から供給されるメディアデータを取得してもよい。また、前処理部１１４は、取得したメディアデータ等から、シーンディスクリプションの生成に必要な情報を取得してもよい。また、前処理部１１４は、その取得した情報をファイル生成部１１６（のSDファイル生成部１２１）へ供給してもよい。また、前処理部１１４は、メディアデータを符号化部１１５へ供給してもよい。

　符号化部１１５は、メディアデータの符号化に関する処理を実行する。例えば、符号化部１１５は、前処理部１１４から供給されるメディアデータを取得してもよい。また、符号化部１１５は、取得したメディアデータを符号化し、その符号化データを生成してもよい。また、符号化部１１５は、生成した符号化データをファイル生成部１１６（のメディアファイル生成部１２３）へ供給してもよい。

　ファイル生成部１１６は、ファイル等の生成に関する処理を行う。SDファイル生成部１２１は、シーンディスクリプションファイルの生成に関する処理を行う。3Dファイル生成部１２２は、3Dデータ（の符号化データ）を格納する3Dファイルの生成に関する処理を行う。メディアファイル生成部１２３は、メディアデータ（の符号化データ）を格納するメディアファイルの生成に関する処理を行う。

　例えば、SDファイル生成部１２１は、符号化部１１３から供給された情報および符号化部１１５から供給された情報を取得する。SDファイル生成部１２１は、それらの情報に基づいてシーンディスクリプションを生成する。また、SDファイル生成部１２１は、シーンディスクリプションファイルを生成し、生成したシーンディスクリプションを格納させる。また、SDファイル生成部１２１は、そのシーンディスクリプションファイルを記憶部１１７へ供給する。

　3Dファイル生成部１２２は、符号化部１１３から供給される3Dデータの符号化データを取得する。3Dファイル生成部１２２は、3Dファイルを生成し、その符号化データを格納させる。3Dファイル生成部１２２は、その3Dファイルを記憶部１１７へ供給する。

　メディアファイル生成部１２３は、符号化部１１５から供給されるメディアデータの符号化データを取得する。メディアファイル生成部１２３は、メディアファイルを生成し、その符号化データを格納させる。メディアファイル生成部１２３は、そのメディアファイルを記憶部１１７へ供給する。

　記憶部１１７は、例えば、ハードディスクや半導体メモリ等、任意の記憶媒体を有し、データの記憶に関する処理を実行する。例えば、記憶部１１７は、ファイル生成部１１６のSDファイル生成部１２１から供給されるシーンディスクリプションファイルを取得し、その記憶媒体に記憶してもよい。また、記憶部１１７は、ファイル生成部１１６の3Dファイル生成部１２２から供給される3Dファイルを取得し、その記憶媒体に記憶してもよい。また、記憶部１１７は、ファイル生成部１１６のメディアファイル生成部１２３から供給されるメディアファイルを取得し、その記憶媒体に記憶してもよい。また、記憶部１１７は、制御部１０１若しくは出力部１１８の要求に従って、または所定のタイミングにおいて、記憶媒体に記録されているファイル等を読み出し、出力部１１８に供給してもよい。

　出力部１１８は、記憶部１１７から供給されるファイル等を取得し、そのファイル等をファイル生成装置１００の外部（例えば配信サーバや再生装置等）に出力してもよい。

　以上のような構成のファイル生成装置１００において、上述した第１の情報処理装置とし、＜３．動的なハプティクスメディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法１を適用し、SDファイル生成部１２１が、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、ファイル生成装置１００は、＜３．動的なハプティクスメディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、ファイル生成装置１００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　また、以上のような構成のファイル生成装置１００において、上述した第１の情報処理装置とし、＜４．インタラクション型メディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法２を適用し、SDファイル生成部１２１が、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、ファイル生成装置１００は、＜４．インタラクション型メディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、ファイル生成装置１００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　　＜ファイル生成処理の流れ＞
　次に、ファイル生成装置１００が実行するファイル生成処理の流れの例を、図３２のフローチャートを参照して説明する。

　ファイル生成処理が開始されると、ファイル生成装置１００の入力部１１１は、ステップＳ１０１において、3Dデータと、その3Dデータに関連付けられたメディアデータを取得する。

　ステップＳ１０２において、前処理部１１２は、その3Dデータに対して前処理を実行する。例えば、前処理部１１２は、その3Dデータから、１つ以上の3Dオブジェクトを3D空間に配置するための空間配置情報であるシーンディスクリプションの生成に用いられる情報を取得する。また、前処理部１１４は、そのメディアデータに対して前処理を実行する。例えば、前処理部１１４は、そのメディアデータから、１つ以上の3Dオブジェクトを3D空間に配置するための空間配置情報であるシーンディスクリプションの生成に用いられる情報を取得する。

　ステップＳ１０３において、SDファイル生成部１２１は、それらの情報を用いて、3Dデータに関連付けられたメディアデータについて記述するシーンディスクリプションファイルを生成する。

　ステップＳ１０４において、符号化部１１３は、3Dデータを符号化し、その符号化データを生成する。また、符号化部１１５は、その3Dデータに関連付けられたメディアデータを符号化し、その符号化データを生成する。

　ステップＳ１０５において、3Dファイル生成部１２２は、3Dデータの符号化データを格納する3Dファイル（ISOBMFF）を生成する。また、メディアファイル生成部１２３は、メディアデータの符号化データを格納するメディアファイル（ISOBMFF）を生成する。

　ステップＳ１０６において、記憶部１１７は、生成されたシーンディスクリプションファイル、3Dファイル、およびメディアファイルを記憶媒体に記憶する。

　ステップＳ１０７において、出力部１１８は、シーンディスクリプションファイル、3Dファイル、およびメディアファイルを記憶部１１７より読み出し、所定のタイミングにおいて、その読み出したファイルをファイル生成装置１００の外部に出力する。例えば、出力部１１８は、記憶部１１７より読み出したファイルを、ネットワーク等の通信媒体を介して、配信サーバや再生装置等の他の装置へ送信（アップロード）してもよい。また、出力部１１８は、記憶媒体より読み出したファイル等を、リムーバブルメディア等の外部記録媒体に記録してもよい。その場合、その出力されたファイルは、例えば、その外部記録媒体を介して他の装置（配信サーバや再生装置等）に供給されてもよい。

　ステップＳ１０７の処理が終了すると、ファイル生成処理が終了する。

　以上のようなファイル生成処理において、ファイル生成装置１００を上述した第１の情報処理装置とし、＜３．動的なハプティクスメディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法１を適用し、ステップＳ１０３において、SDファイル生成部１２１が、3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、ファイル生成装置１００は、＜３．動的なハプティクスメディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、ファイル生成装置１００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　また、以上のようなファイル生成処理において、ファイル生成装置１００を上述した第１の情報処理装置とし、＜４．インタラクション型メディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法２を適用し、ステップＳ１０３において、SDファイル生成部１２１が、3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、ファイル生成装置１００は、＜４．インタラクション型メディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、ファイル生成装置１００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　＜６．第２の実施の形態＞
　　＜クライアント装置＞
　上述した本技術は、任意の装置に適用し得る。図３３は、本技術を適用した情報処理装置の一態様であるクライアント装置の構成の一例を示すブロック図である。図３３に示されるクライアント装置２００は、シーンディスクリプションに基づいて、3Dデータやその3Dデータに関連付けられたメディアデータの再生処理を行う再生装置である。例えば、クライアント装置２００は、ファイル生成装置１００により生成されたファイルを取得し、そのファイルに格納される3Dデータやメディアデータを再生する。その際、クライアント装置２００は、シーンディスクリプションファイルに基づいて、その再生に関する処理を行う。

　なお、図３３においては、処理部やデータの流れ等の主なものを示しており、図３３に示されるものが全てとは限らない。つまり、クライアント装置２００において、図３３においてブロックとして示されていない処理部が存在したり、図３３において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図３３に示されるようにクライアント装置２００は、制御部２０１およびクライアント処理部２０２を有する。制御部２０１は、クライアント処理部２０２の制御に関する処理を行う。クライアント処理部２０２は、3Dデータやメディアデータの再生に関する処理を行う。

　クライアント処理部２０２は、SDファイル取得部２１１、SDファイル解析部２１２、3Dファイル取得部２１３、3Dデータ復号部２１４、バッファ２１５、表示情報生成部２１６、メディアファイル取得部２１７、メディアデータ復号部２１８、バッファ２１９、メディア情報生成部２２０、出力部２２１を有する。

　SDファイル取得部２１１は、シーンディスクリプションファイルの取得に関する処理を行う。例えば、SDファイル取得部２１１は、配信サーバやファイル生成装置１００等、クライアント装置２００の外部から供給されるシーンディスクリプションファイル等を取得してもよい。また、SDファイル取得部２１１は、取得したシーンディスクリプションファイルをSDファイル解析部２１２へ供給してもよい。

　SDファイル解析部２１２は、シーンディスクリプションファイルの解析に関する処理を行う。例えば、SDファイル解析部２１２は、SDファイル取得部２１１から供給されるシーンディスクリプションファイルを取得してもよい。また、SDファイル解析部２１２は、そのシーンディスクリプションファイルを解析し、その記述に従って、3Dファイル取得部２１３やメディアファイル取得部２１７を制御してもよい。つまり、SDファイル解析部２１２は、そのシーンディスクリプションファイルの記述に従って、3Dファイルやメディアファイルの取得を制御してもよい。また、SDファイル解析部２１２は、シーンディスクリプションファイルの記述に従って、3Dデータ復号部２１４やメディアデータ復号部２１８を制御してもよい。つまり、SDファイル解析部２１２は、そのシーンディスクリプションファイルの記述に従って、3Dデータやメディアデータの復号を制御してもよい。また、SDファイル解析部２１２は、シーンディスクリプションファイルの記述に従って、バッファ２１５やバッファ２１９を制御してもよい。つまり、SDファイル解析部２１２は、そのシーンディスクリプションファイルの記述に従って、3Dデータやメディアデータのバッファへの格納を制御してもよい。

　3Dファイル取得部２１３は、SDファイル解析部２１２の制御に従って3Dファイルの取得に関する処理を行う。例えば、3Dファイル取得部２１３は、配信サーバやファイル生成装置１００等、クライアント装置２００の外部から供給される3Dファイル等を取得してもよい。また、3Dファイル取得部２１３は、取得した3Dファイルに格納される3Dデータの符号化データを抽出し、3Dデータ復号部２１４へ供給してもよい。

　3Dデータ復号部２１４は、SDファイル解析部２１２の制御に従って3Dデータの復号に関する処理を行う。例えば、3Dデータ復号部２１４は、3Dファイル取得部２１３から供給される3Dデータの符号化データを取得してもよい。また、3Dデータ復号部２１４は、その符号化データを復号してもよい。また、3Dデータ復号部２１４は、その復号により得られた3Dデータをバッファ２１５へ供給してもよい。

　バッファ２１５は、SDファイル解析部２１２の制御に従って3Dデータの格納に関する処理を行う。例えば、バッファ２１５は、3Dデータ復号部２１４から供給される3Dデータを取得してもよい。また、バッファ２１５は、その3Dデータを、シーンディスクリプションファイルにおいて指定される記憶領域に記憶してもよい。また、バッファ２１５は、制御部２０１若しくは表示情報生成部２１６の要求に基づいて、または所定のタイミングにおいて、記憶領域から3Dデータを読み出し、表示情報生成部２１６へ供給してもよい。

　表示情報生成部２１６は、3Dデータの表示に関する処理を行う。例えば、表示情報生成部２１６は、バッファ２１５から読み出した3Dデータを取得してもよい。また、表示情報生成部２１６は、その3Dデータのレンダリングを行い、表示情報（例えば、表示用画像等）を生成してもよい。また、表示情報生成部２１６は、生成した表示情報を、出力部２２１へ供給してもよい。

　メディアファイル取得部２１７は、SDファイル解析部２１２の制御に従ってメディアファイルの取得に関する処理を行う。例えば、メディアファイル取得部２１７は、配信サーバやファイル生成装置１００等、クライアント装置２００の外部から供給されるメディアファイル等を取得してもよい。また、メディアファイル取得部２１７は、取得したメディアファイルに格納されるメディアデータの符号化データを抽出し、メディアデータ復号部２１８へ供給してもよい。

　メディアデータ復号部２１８は、SDファイル解析部２１２の制御に従ってメディアデータの復号に関する処理を行う。例えば、メディアデータ復号部２１８は、メディアファイル取得部２１７から供給される3Dデータの符号化データを取得してもよい。また、メディアデータ復号部２１８は、その符号化データを復号してもよい。また、メディアデータ復号部２１８は、その復号により得られたメディアデータをバッファ２１９へ供給してもよい。

　バッファ２１９は、SDファイル解析部２１２の制御に従ってメディアデータの格納に関する処理を行う。例えば、バッファ２１９は、メディアデータ復号部２１８から供給されるメディアデータを取得してもよい。また、バッファ２１９は、そのメディアデータを、シーンディスクリプションファイルにおいて指定される記憶領域に記憶してもよい。また、バッファ２１９は、制御部２０１若しくはメディア情報生成部２２０の要求に基づいて、または所定のタイミングにおいて、記憶領域からメディアデータを読み出し、メディア情報生成部２２０へ供給してもよい。

　メディア情報生成部２２０は、メディアデータの出力に関する処理を行う。例えば、メディア情報生成部２２０は、バッファ２１９から読み出したメディアデータを取得してもよい。また、メディア情報生成部２２０は、そのメディアデータのレンダリングを行い、出力用のメディア情報（例えば、出力用のハプティクスメディア情報、表示用画像、出力用の音声情報等）を生成してもよい。また、メディア情報生成部２２０は、生成したメディア情報を、出力部２２１へ供給してもよい。

　出力部２２１は、表示デバイス、音声出力デバイス、ハプティクスデバイス（例えば振動デバイス）等を有し、上述の表示情報やメディア情報の出力（画像表示、音声出力、ハプティクスメディア出力（例えば振動出力）等）に関する処理を行う。例えば、出力部２２１は、表示情報生成部２１６から供給される表示情報を取得してもよい。また、出力部２２１は、メディア情報生成部２２０から供給されるメディア情報を取得してもよい。また、出力部２２１は、取得した表示情報を表示部（例えばディスプレイ等）に表示させてもよい。また、出力部２２１は、取得したメディア情報を、メディア出力部（例えば振動デバイス等）に出力させてもよい。

　以上のような構成のクライアント装置２００において、上述した第２の情報処理装置とし、＜３．動的なハプティクスメディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法１を適用し、メディアファイル取得部２１７が、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得してもよい。また、メディアデータ復号部２１８が、シーンディスクリプションファイルの記述に基づいて、その符号化データを復号し、ハプティクスメディアのデータを生成してもよい。また、バッファ２１９が、ハプティクスメディアのデータを、シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶してもよい。また、メディア情報生成部２２０が、シーンディスクリプションファイルの記述に基づいて、バッファ２１９の記憶領域に記憶されているハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、クライアント装置２００は、＜３．動的なハプティクスメディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、クライアント装置２００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　また、以上のような構成のクライアント装置２００において、上述した第２の情報処理装置とし、＜４．インタラクション型メディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法２を適用し、メディアファイル取得部２１７が、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられたインタラクション型メディアの符号化データを取得してもよい。また、メディアデータ復号部２１８が、シーンディスクリプションファイルの記述に基づいて、取得された符号化データを復号し、インタラクション型メディアのデータを生成してもよい。このようにすることにより、クライアント装置２００は、＜４．インタラクション型メディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、クライアント装置２００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　　＜再生処理の流れ＞
　次に、再生処理の流れの例を、図３４のフローチャートを参照して説明する。再生処理が開始されると、クライアント装置２００のSDファイル取得部２１１は、ステップＳ２０１においてシーンディスクリプションファイルを取得する。また、SDファイル解析部２１２は、そのシーンディスクリプションファイルを解析する。

　ステップＳ２０２において、3Dファイル取得部２１３は、シーンディスクリプションファイルに従って、3Dファイルを取得する。

　ステップＳ２０３において、3Dデータ復号部２１４は、3Dデータの符号化データを復号する。バッファ２１５は、その復号により得られた3Dデータを、シーンディスクリプションファイルにより指定される記憶領域へ記憶する。

　ステップＳ２０４において、表示情報生成部２１６は、バッファ２１５に格納される3Dデータを読み出し、レンダリングする。つまり、表示情報生成部２１６は、読み出した3Dデータを用いて表示情報（表示画像等）を生成し、それを出力部２２１へ供給して表示させる。ステップＳ２０４の処理が終了すると、処理はステップＳ２０９へ進む。

　このステップＳ２０２乃至ステップＳ２０４の各処理と並行して、ステップＳ２０５乃至ステップＳ２０８の各処理が実行される。

　ステップＳ２０５において、メディアファイル取得部２１７は、シーンディスクリプションファイルに従って、メディアファイルを取得する。ステップＳ２０６において、メディアファイル取得部２１７は、取得したメディアファイルの再生条件を満たすか否かを判定し、満たすと判定されるまで待機する。また、取得したメディアファイルの再生条件を満たすと判定された場合、処理はステップＳ２０７へ進む。

　ステップＳ２０７において、メディアデータ復号部２１８は、メディアデータの符号化データを復号する。バッファ２１９は、その復号により得られた3Dデータを、シーンディスクリプションファイルにより指定される記憶領域へ記憶する。

　ステップＳ２０８において、メディア情報生成部２２０は、バッファ２１９に格納されるメディアデータを読み出し、レンダリングする。つまり、メディア情報生成部２２０は、読み出したメディアデータを用いてメディア情報（振動情報等）を生成し、それを出力部２２１へ供給して出力させる。ステップＳ２０８の処理が終了すると、処理はステップＳ２０９へ進む。

　ステップＳ２０９において、制御部２０１は、再生処理を終了するか否かを判定する。終了しないと判定された場合、処理はステップＳ２０２およびステップＳ２０５へ戻る。また、再生処理を終了すると判定された場合、再生処理が終了する。

　以上のような再生処理において、クライアント装置２００を上述した第２の情報処理装置とし、＜３．動的なハプティクスメディアのサポート＞において上述した本技術を適用してもよい。

　例えば、方法１を適用し、メディアファイル取得部２１７が、シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得してもよい。また、メディアデータ復号部２１８が、シーンディスクリプションファイルの記述に基づいて、その符号化データを復号し、ハプティクスメディアのデータを生成してもよい。また、バッファ２１９が、ハプティクスメディアのデータを、シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶してもよい、また、メディア情報生成部２２０が、シーンディスクリプションファイルの記述に基づいて、その記憶領域に記憶されているハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、クライアント装置２００は、＜３．動的なハプティクスメディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、クライアント装置２００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　例えば、方法２を適用し、メディアファイル取得部２１７が、シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得してもよい。メディアデータ復号部２１８が、そのシーンディスクリプションファイルの記述に基づいて、取得された符号化データを復号し、インタラクション型メディアのデータを生成してもよい。また、その他の方法を適用してもよい。また、複数の本技術を適宜組み合わせて適用してもよい。このようにすることにより、クライアント装置２００は、＜４．インタラクション型メディアのサポート＞において上述したのと同様の効果を得ることができる。すなわち、クライアント装置２００は、3Dデータに関連付けられたメディアデータの再生性能の低減を抑制することができる。

　＜７．付記＞
　　＜組み合わせ＞
　上述した本技術の各例（各方法）は、矛盾が生じない限り、他の例（他の方法）と適宜組み合わせて適用してもよい。また、上述した本技術の各例を、上述した以外の他の技術と組み合わせて適用してもよい。

　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図３５は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図３５に示されるコンピュータ９００において、CPU（Central Processing Unit）９０１、ROM（Read Only Memory）９０２、RAM（Random Access Memory）９０３は、バス９０４を介して相互に接続されている。

　バス９０４にはまた、入出力インタフェース９１０も接続されている。入出力インタフェース９１０には、入力部９１１、出力部９１２、記憶部９１３、通信部９１４、およびドライブ９１５が接続されている。

　入力部９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部９１４は、例えば、ネットワークインタフェースよりなる。ドライブ９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア９２１を駆動する。

　以上のように構成されるコンピュータでは、CPU９０１が、例えば、記憶部９１３に記憶されているプログラムを、入出力インタフェース９１０およびバス９０４を介して、RAM９０３にロードして実行することにより、上述した一連の処理が行われる。RAM９０３にはまた、CPU９０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア９２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア９２１をドライブ９１５に装着することにより、入出力インタフェース９１０を介して、記憶部９１３にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部９１４で受信し、記憶部９１３にインストールすることができる。

　その他、このプログラムは、ROM９０２や記憶部９１３に、あらかじめインストールしておくこともできる。

　　＜本技術の適用可能な対象＞
　本技術は、任意の符号化・復号方式に適用することができる。

　また、本技術は、任意の構成に適用することができる。例えば、本技術は、様々な電子機器に応用され得る。

　また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

　また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　　＜本技術を適用可能な分野・用途＞
　本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

　例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。

　　＜その他＞
　なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

　また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得する取得部と、
　前記シーンディスクリプションファイルの記述に基づいて、前記符号化データを復号し、前記ハプティクスメディアのデータを生成する復号部と、
　前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶する記憶部と、
　前記シーンディスクリプションファイルの記述に基づいて、前記記憶領域に記憶されている前記ハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する生成部と
　を備える情報処理装置。
　（２）　前記記憶部は、前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルのマテリアルにおいて指定される前記アクセサに対応する前記記憶領域に記憶する
　（１）に記載の情報処理装置。
　（３）　前記ハプティクスメディアは、シーンの時間方向の進行に同期して再生される同期型ハプティクスメディアを含み、
　前記生成部は、所定の再生タイミングに応じたタイミングにおいて前記記憶領域から前記同期型ハプティクスメディアのデータを読み出し、前記ハプティクスメディア情報を生成する
　（１）または（２）に記載の情報処理装置。
　（４）　前記ハプティクスメディアは、ユーザ操作によりシーンにおいて所定の条件が満たされる場合に再生されるインタラクション型ハプティクスメディアを含み、
　前記生成部は、前記条件が満たされる場合に前記記憶領域から前記インタラクション型ハプティクスメディアのデータを読み出し、前記ハプティクスメディア情報を生成する
　（１）乃至（３）のいずれかに記載の情報処理装置。
　（５）　シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得し、
　前記シーンディスクリプションファイルの記述に基づいて、前記符号化データを復号し、前記ハプティクスメディアのデータを生成し、
　前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶し、
　前記シーンディスクリプションファイルの記述に基づいて、前記記憶領域に記憶されている前記ハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する
　情報処理方法。

　（１１）　3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　（１２）　前記ファイル生成部は、マテリアルにおいて前記アクセサを指定する前記シーンディスクリプションファイルを生成する
　（１１）に記載の情報処理装置。
　（１３）　前記ハプティクスメディアは、シーンの時間方向の進行に同期して再生される同期型ハプティクスメディアを含む
　（１１）または（１２）に記載の情報処理装置。
　（１４）　前記ハプティクスメディアは、ユーザ操作によりシーンにおいて所定の条件が満たされる場合に再生されるインタラクション型ハプティクスメディアを含む
　（１１）乃至（３）のいずれかに記載の情報処理装置。
　（１５）　3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成する
　情報処理方法。

　（２１）　シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得する取得部と、
　前記シーンディスクリプションファイルの記述に基づいて、取得された前記符号化データを復号し、前記インタラクション型メディアのデータを生成する復号部と
　を備える情報処理装置。
　（２２）　前記インタラクション型メディアに関する記述は、ユーザ操作によりシーンにおいて所定の条件が満たされる場合に実行するインタラクション型の処理が可能であるか否かを示す記述を含み、
　前記取得部は、前記インタラクション型の処理が可能であることが示される場合、前記符号化データを取得する
　（２１）に記載の情報処理装置。
　（２３）　前記インタラクション型メディアに関する記述は、ユーザ操作またはアバターの属性情報に応じて前記インタラクション型メディアを選択可能であるか否かを示す記述を含み、
　前記取得部は、
　　前記インタラクション型メディアを選択可能であることが示される場合、前記ユーザ操作または前記アバターの属性情報に応じて前記インタラクション型メディアを選択し、
　　前記インタラクション型メディアを選択不可能であることが示される場合、所定の前記インタラクション型メディアを選択する
　（２１）または（２２）に記載の情報処理装置。
　（２４）　前記インタラクション型メディアに関する記述は、前記符号化データの取得に関する記述を含み、
　前記取得部は、前記符号化データの取得に関する記述に従って前記符号化データを取得する
　（２１）乃至（２３）のいずれかに記載の情報処理装置。
　（２５）　前記符号化データの取得に関する記述は、取得の条件に関する記述を含み、
　前記取得部は、前記条件が満たされる場合に前記符号化データを取得する
　（２４）に記載の情報処理装置。
　（２６）　前記条件に関する記述は、前記条件がシーンに必要な情報の初期化前であるか否かを示す記述を含み、
　前記取得部は、前記記述により前記条件が前記情報の初期化前であることが示される場合、前記情報の初期化前において前記符号化データを取得する
　（２５）に記載の情報処理装置。
　（２７）　前記条件に関する記述は、前記インタラクション型メディアに対応する位置のLoDを示す記述を含み、
　前記取得部は、前記記述により示される前記LoDよりも前記位置のLoDの方が大きい場合、前記符号化データを取得する
　（２５）または（２６）に記載の情報処理装置。
　（２８）　前記条件に関する記述は、前記インタラクション型メディアに対応する位置までの距離を示す記述を含み、
　前記取得部は、視点またはアバターが前記位置に対して、前記記述により示される前記距離以内に接近した場合、前記符号化データを取得する
　（２５）乃至（２７）のいずれかに記載の情報処理装置。
　（２９）　前記条件に関する記述は、前記条件が前記インタラクション型メディアに対応する位置が視界に入ることであるか否かを示す記述を含み、
　前記取得部は、前記記述により前記位置が視界に入ることが前記条件であることが示される場合、前記位置が前記視界内に入った時に前記符号化データを取得する
　（２５）乃至（２８）のいずれかに記載の情報処理装置。
　（３０）　前記条件に関する記述は、前記符号化データを取得する推奨時刻を示す記述を含み、
　前記取得部は、前記記述により示される前記推奨時刻において前記符号化データを取得する
　（２５）乃至（２９）のいずれかに記載の情報処理装置。
　（３１）　前記条件に関する記述は、所定の空間領域を示す記述を含み、
　前記取得部は、視点またはアバターが前記記述により示される前記空間領域内に位置する場合、前記符号化データを取得する
　（２５）乃至（３０）のいずれかに記載の情報処理装置。
　（３２）　前記符号化データの取得に関する記述は、前記符号化データの取得方法に関する記述を含み、
　前記取得部は、前記取得方法に関する記述に従って前記符号化データを取得する
　（２４）乃至（３１）のいずれかに記載の情報処理装置。
　（３３）　前記取得方法に関する記述は、前記符号化データが前記3Dデータのファイルに含まれるか否かを示す記述を含み、
　前記取得部は、前記符号化データが前記3Dデータのファイルに含まれないことが示される場合、前記符号化データを取得する
　（３２）に記載の情報処理装置。
　（３４）　前記取得方法に関する記述は、前記符号化データの優先度を示す記述を含み、
　前記取得部は、前記優先度に応じて前記符号化データを取得する
　（３２）または（３３）に記載の情報処理装置。
　（３５）　前記符号化データの取得に関する記述は、前記インタラクション型メディアのタイプに関する記述を含み、
　前記取得部は、前記インタラクション型メディアのタイプに関する記述に従って前記符号化データを取得する
　（２４）乃至（３４）のいずれかに記載の情報処理装置。
　（３６）　前記インタラクション型メディアのタイプに関する記述は、前記インタラクション型メディアが動的なメディアであるか否かを示す記述を含み、
　前記取得部は、前記インタラクション型メディアが前記動的なメディアであることが示される場合、前記動的なメディアに応じた方法で前記符号化データを取得する
　（３５）に記載の情報処理装置。
　（３７）　前記インタラクション型メディアのタイプに関する記述は、動的なメディアを格納する記憶領域に対応するアクセサを指定する記述を含み、
　前記取得部は、取得した前記符号化データを、指定された前記アクセサに対応する前記記憶領域に記憶させる
　（３５）または（３６）に記載の情報処理装置。
　（３８）　前記取得部は、前記シーンディスクリプションファイルのマテリアルの、前記インタラクション型メディアに関する記述に基づいて、前記符号化データを取得する
　（２１）乃至（３７）のいずれかに記載の情報処理装置。
　（３９）　前記取得部は、前記マテリアルにおいて、前記インタラクション型メディアのファイル情報として記述された前記インタラクション型メディアに関する記述に基づいて、前記符号化データを取得する
　（３８）に記載の情報処理装置。
　（４０）　前記取得部は、前記マテリアルにおいて、前記インタラクション型メディアの事前処理情報として記述された前記インタラクション型メディアに関する記述に基づいて、前記符号化データを取得する
　（３８）または（３９）に記載の情報処理装置。
　（４１）　前記インタラクション型メディアは、ハプティクス情報を含む
　（２１）乃至（４０）のいずれかに記載の情報処理装置。
　（４２）　前記インタラクション型メディアは、画像情報を含む
　（２１）乃至（４１）のいずれかに記載の情報処理装置。
　（４３）　前記インタラクション型メディアは、音声情報を含む
　（２１）乃至（４２）のいずれかに記載の情報処理装置。
　（４４）　シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得し、
　前記シーンディスクリプションファイルの記述に基づいて、取得された前記符号化データを復号し、前記インタラクション型メディアのデータを生成する
　情報処理方法。

　（５１）　3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　（５２）　前記インタラクション型メディアに関する記述は、ユーザ操作によりシーンにおいて所定の条件が満たされる場合に実行するインタラクション型の処理が可能であるか否かを示す記述を含む
　（５１）に記載の情報処理装置。
　（５３）　前記インタラクション型メディアに関する記述は、ユーザ操作またはアバターの属性情報に応じて前記インタラクション型メディアを選択可能であるか否かを示す記述を含む
　（５１）または（５２）に記載の情報処理装置。
　（５４）　前記インタラクション型メディアに関する記述は、前記インタラクション型メディアの取得に関する記述を含む
　（５１）乃至（５３）のいずれかに記載の情報処理装置。
　（５５）　前記インタラクション型メディアの取得に関する記述は、取得の条件に関する記述を含む
　（５４）に記載の情報処理装置。
　（５６）　前記条件に関する記述は、前記条件がシーンに必要な情報の初期化前であるか否かを示す記述を含む
　（５５）に記載の情報処理装置。
　（５７）　前記条件に関する記述は、取得する前記インタラクション型メディアに対応する位置のLoDを示す記述を含む
　（５５）または（５６）に記載の情報処理装置。
　（５８）　前記条件に関する記述は、取得する前記インタラクション型メディアに対応する位置までの距離を示す記述を含む
　（５５）乃至（５７）のいずれかに記載の情報処理装置。
　（５９）　前記条件に関する記述は、前記条件が前記インタラクション型メディアに対応する位置が視界に入ることであるか否かを示す記述を含む
　（５５）乃至（５８）のいずれかに記載の情報処理装置。
　（６０）　前記条件に関する記述は、前記インタラクション型メディアを取得する推奨時刻を示す記述を含む
　（５５）乃至（５９）のいずれかに記載の情報処理装置。
　（６１）　前記条件に関する記述は、前記インタラクション型メディアを取得する所定の空間領域を示す記述を含む
　（５５）乃至（６０）のいずれかに記載の情報処理装置。
　（６２）　前記インタラクション型メディアの取得に関する記述は、前記インタラクション型メディアの取得方法に関する記述を含む
　（５４）乃至（６１）のいずれかに記載の情報処理装置。
　（６３）　前記取得方法に関する記述は、前記インタラクション型メディアが前記3Dデータのファイルに含まれるか否かを示す記述を含む
　（６２）に記載の情報処理装置。
　（６４）　前記取得方法に関する記述は、前記インタラクション型メディアの優先度を示す記述を含む
　（６１）または（６２）に記載の情報処理装置。
　（６５）　前記インタラクション型メディアの取得に関する記述は、前記インタラクション型メディアのタイプに関する記述を含む
　（５４）乃至（６４）のいずれかに記載の情報処理装置。
　（６６）　前記インタラクション型メディアのタイプに関する記述は、前記インタラクション型メディアが動的なメディアであるか否かを示す記述を含む
　（６５）に記載の情報処理装置。
　（６７）　前記インタラクション型メディアのタイプに関する記述は、動的なメディアを格納する記憶領域に対応するアクセサを指定する記述を含む
　（６５）または（６６）に記載の情報処理装置。
　（６８）　前記ファイル生成部は、前記インタラクション型メディアに関する記述をマテリアルに格納する前記シーンディスクリプションファイルを生成する
　（５１）乃至（６７）のいずれかに記載の情報処理装置。
　（６９）　前記インタラクション型メディアに関する記述は、前記マテリアルにおいてファイル情報として格納される
　（６８）に記載の情報処理装置。
　（７０）　前記インタラクション型メディアに関する記述は、前記マテリアルにおいて事前処理情報として格納される
　（６８）または（６９）に記載の情報処理装置。
　（７１）　前記インタラクション型メディアは、ハプティクス情報を含む
　（５１）乃至（７０）のいずれかに記載の情報処理装置。
　（７２）　前記インタラクション型メディアは、画像情報を含む
　（５１）乃至（７１）のいずれかに記載の情報処理装置。
　（７３）　前記インタラクション型メディアは、音声情報を含む
　（５１）乃至（７２）のいずれかに記載の情報処理装置。
　（７４）　3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成する
　情報処理方法。

　１００　ファイル生成装置，　１０１　制御部，　１０２　ファイル生成処理部，　１１１　入力部，　１１２　前処理部，　１１３　符号化部，　１１４　前処理部，　１１５　符号化部，　１１６　ファイル生成部，　１１７　記録部，　１１８　出力部，　１２１　SDファイル生成部，　１２２　3Dファイル生成部，　１２３　メディアファイル生成部，　２００　クライアント装置，　２０１　制御部，　２０２　クライアント処理部，　２１１　SDファイル取得部，　２１２　SDファイル解析部，　２１３　3Dファイル取得部，　２１４　3Dデータ復号部，　２１５　バッファ，　２１６　表示情報生成部，　２１７　メディアファイル取得部，　２１８　メディアデータ復号部，　２１９　バッファ，　２２０　メディア情報生成部，　２２１　出力部

Claims

　シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得する取得部と、
　前記シーンディスクリプションファイルの記述に基づいて、前記符号化データを復号し、前記ハプティクスメディアのデータを生成する復号部と、
　前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶する記憶部と、
　前記シーンディスクリプションファイルの記述に基づいて、前記記憶領域に記憶されている前記ハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する生成部と
　を備える情報処理装置。
　前記記憶部は、前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルのマテリアルにおいて指定される前記アクセサに対応する前記記憶領域に記憶する
　請求項１に記載の情報処理装置。
　シーンディスクリプションファイルの記述に基づいて、再生対象の3Dデータに関連付けられた動的なハプティクスメディアの符号化データを取得し、
　前記シーンディスクリプションファイルの記述に基づいて、前記符号化データを復号し、前記ハプティクスメディアのデータを生成し、
　前記ハプティクスメディアのデータを、前記シーンディスクリプションファイルにより指定されるアクセサに対応する記憶領域に記憶し、
　前記シーンディスクリプションファイルの記述に基づいて、前記記憶領域に記憶されている前記ハプティクスメディアのデータを読み出し、出力用のハプティクスメディア情報を生成する
　情報処理方法。
　3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　前記ファイル生成部は、マテリアルにおいて前記アクセサを指定する前記シーンディスクリプションファイルを生成する
　請求項４に記載の情報処理装置。
　3Dデータに関連付けられた動的なハプティクスメディアを所定の記憶領域に記憶させるためのアクセサを指定するシーンディスクリプションファイルを生成する
　情報処理方法。
　シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得する取得部と、
　前記シーンディスクリプションファイルの記述に基づいて、取得された前記符号化データを復号し、前記インタラクション型メディアのデータを生成する復号部と
　を備える情報処理装置。
　前記インタラクション型メディアに関する記述は、ユーザ操作によりシーンにおいて所定の条件が満たされる場合に実行するインタラクション型の処理が可能であるか否かを示す記述を含み、
　前記取得部は、前記インタラクション型の処理が可能であることが示される場合、前記符号化データを取得する
　請求項７に記載の情報処理装置。
　前記インタラクション型メディアに関する記述は、ユーザ操作またはアバターの属性情報に応じて前記インタラクション型メディアを選択可能であるか否かを示す記述を含み、
　前記取得部は、
　　前記インタラクション型メディアを選択可能であることが示される場合、前記ユーザ操作または前記アバターの属性情報に応じて前記インタラクション型メディアを選択し、
　　前記インタラクション型メディアを選択不可能であることが示される場合、所定の前記インタラクション型メディアを選択する
　請求項７に記載の情報処理装置。
　前記インタラクション型メディアに関する記述は、前記符号化データの取得に関する記述を含み、
　前記取得部は、前記符号化データの取得に関する記述に従って前記符号化データを取得する
　請求項７に記載の情報処理装置。
　前記取得部は、前記シーンディスクリプションファイルのマテリアルにおいて、前記インタラクション型メディアのファイル情報として記述された前記インタラクション型メディアに関する記述に基づいて、前記符号化データを取得する
　請求項７に記載の情報処理装置。
　前記取得部は、前記シーンディスクリプションファイルのマテリアルにおいて、前記インタラクション型メディアの事前処理情報として記述された前記インタラクション型メディアに関する記述に基づいて、前記符号化データを取得する
　請求項７に記載の情報処理装置。
　シーンディスクリプションファイルに含まれるインタラクション型メディアに関する記述に基づいて、再生対象の3Dデータに関連付けられた前記インタラクション型メディアの符号化データを取得し、
　前記シーンディスクリプションファイルの記述に基づいて、取得された前記符号化データを復号し、前記インタラクション型メディアのデータを生成する
　情報処理方法。
　3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成するファイル生成部
　を備える情報処理装置。
　前記インタラクション型メディアに関する記述は、ユーザ操作によりシーンにおいて所定の条件が満たされる場合に実行するインタラクション型の処理が可能であるか否かを示す記述を含む
　請求項１４に記載の情報処理装置。
　前記インタラクション型メディアに関する記述は、ユーザ操作またはアバターの属性情報に応じて前記インタラクション型メディアを選択可能であるか否かを示す記述を含む
　請求項１４に記載の情報処理装置。
　前記インタラクション型メディアに関する記述は、前記インタラクション型メディアの取得に関する記述を含む
　請求項１４に記載の情報処理装置。
　前記インタラクション型メディアに関する記述は、前記シーンディスクリプションファイルのマテリアルにおいてファイル情報として格納される
　請求項１４に記載の情報処理装置。
　前記インタラクション型メディアに関する記述は、前記シーンディスクリプションファイルのマテリアルにおいて事前処理情報として格納される
　請求項１４に記載の情報処理装置。
　3Dデータに関連付けられたインタラクション型メディアに関する記述を含むシーンディスクリプションファイルを生成する
　情報処理方法。