WO2023176419A1

WO2023176419A1 - 情報処理装置および方法

Info

Publication number: WO2023176419A1
Application number: PCT/JP2023/007210
Authority: WO
Inventors: 遼平高橋; 光浩平林
Original assignee: ソニーグループ株式会社
Priority date: 2022-03-17
Filing date: 2023-02-28
Publication date: 2023-09-21

Abstract

本開示は、3Dデータの再生表示の品質の低減を抑制することができるようにする情報処理装置および方法に関する。ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、サブフレームの表示タイミングに間に合うタイミングで、ファイルに格納されるビットストリームからそのサブフレームを含むサンプルを抽出し、その抽出されたサンプルを復号し、第１の情報に基づいて、復号されたサンプルに含まれるサブフレームの表示タイミングに間に合うタイミングで、そのサブフレームのポイントクラウドを構築する。本開示は、例えば、情報処理装置、または情報処理方法等に適用することができる。

Description

情報処理装置および方法

　本開示は、情報処理装置および方法に関し、特に、3Dデータの再生表示の品質の低減を抑制することができるようにした情報処理装置および方法に関する。

　従来、３次元空間の位置情報と属性情報（例えば色や反射率等）を持つ点の集合であるポイントクラウド（point cloud）について、３次元形状を示すジオメトリ（geometry）と属性情報を示すアトリビュート（attribute）に分けて符号化する符号化技術であるG-PCC（Geometry-based Point Cloud Compression）がMPEG-I Part 9（ISO/IEC（International Organization for Standardization / International Electrotechnical Commission） 23090-9）で規格化作業中である（例えば、非特許文献１参照）。

　また、動画圧縮の国際標準技術MPEG-4（Moving Picture Experts Group - 4）のファイルコンテナ仕様であるISOBMFF（International Organization for Standardization Base Media File Format）がある（例えば、非特許文献２参照）。

　さらに、このG-PCCで符号化された符号化データのビットストリームであるG-PCCビットストリームのローカルストレージからの再生処理やネットワーク配信の効率化を目的とし、G-PCCビットストリームをISOBMFFのファイルに格納する方法がMPEG-I Part 18（ISO/IEC 23090-18）で規格化作業中である（例えば、非特許文献３参照）。

　ところで、ポイントクラウドを符号化する際に、ポイントクラウドの複数のフレームをサブフレームとして組み合わせたコンバインドフレームを符号化し、サンプルとする方法があった（例えば、非特許文献４）。

"Information technology - MPEG-I (Coded Representation of Immersive Media) - Part 9: Geometry-based Point Cloud Compression" ("Text of ISO/IEC FDIS 23090-9 Geometry-based Point Cloud Compression (draft 20)"), ISO/IEC 23090-9:2022(E), MDS19617, 2022/3/13 "Information technology - Coding of audio-visual objects - Part 12: ISO base media file format, TECHNICAL CORRIGENDUM 1", ISO/IEC FDIS 14496-12:2020(E), ISO/IEC 14496-12:2015/Cor.1, ISO/IEC JTC 1/SC 29/WG 11, 2016/6/3 Sejin Oh, Ryohei Takahashi, Youngkwon Lim, "Draft text of ISO/IEC FDIS 23090-18 Carriage of Geometry-based Point Cloud Compression Data", ISO/IEC JTC 1/SC 29/WG 03 N0311, MDS20565, 2021/10/2 "G-PCC codec description", ISO/IEC JTC 1/SC 29/WG 7 N 0215, MDS20983, 2021/12/29

　しかしながら、非特許文献４に記載の方法では、デコーダは、ビットストリームを復号する前に各サンプルをどのようなタイミングで取得し、復号すればよいかわからなかった。そのため、例えば再生処理において遅延が生じたり、表示においてフレームの欠損が生じたりする等、3Dデータの再生表示の品質が低減するおそれがあった。

　本開示は、このような状況に鑑みてなされたものであり、3Dデータの再生表示の品質の低減を抑制することができるようにするものである。

　本技術の一側面の情報処理装置は、ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、前記サブフレームの表示タイミングに間に合うタイミングで、前記ファイルに格納されるビットストリームから前記サブフレームを含むサンプルを抽出する抽出部と、抽出された前記サンプルを復号する復号部と、前記第１の情報に基づいて、復号された前記サンプルに含まれる前記サブフレームの表示タイミングに間に合うタイミングで、前記サブフレームのポイントクラウドを構築する構築部とを備える情報処理装置である。

　本技術の一側面の情報処理方法は、ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、前記サブフレームの表示タイミングに間に合うタイミングで、前記ファイルに格納されるビットストリームから前記サブフレームを含むサンプルを抽出し、抽出された前記サンプルを復号し、前記第１の情報に基づいて、復号された前記サンプルに含まれる前記サブフレームの表示タイミングに間に合うタイミングで、前記サブフレームのポイントクラウドを構築する情報処理方法である。

　本技術の他の側面の情報処理装置は、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成する符号化部と、前記符号化データを含むビットストリームを生成し、前記ビットストリームに基づいて前記サブフレームの表示タイミングに関する第１の情報を生成するビットストリーム生成部と、前記ビットストリームを格納するファイルを生成し、前記ファイルにメタデータとして前記第１の情報を格納するファイル生成部とを備える情報処理装置である。

　本技術の他の側面の情報処理方法は、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成し、前記符号化データを含むビットストリームを生成し、前記ビットストリームに基づいて前記サブフレームの表示タイミングに関する第１の情報を生成し、前記ビットストリームを格納するファイルを生成し、前記ファイルにメタデータとして前記第１の情報を格納する情報処理方法である。

　本技術の一側面の情報処理装置および方法においては、ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、そのサブフレームの表示タイミングに間に合うタイミングで、ファイルに格納されるビットストリームからサブフレームを含むサンプルが抽出され、その抽出されたサンプルが復号され、その第１の情報に基づいて、その復号されたサンプルに含まれるサブフレームの表示タイミングに間に合うタイミングで、そのサブフレームのポイントクラウドが構築される。

　本技術の他の側面の情報処理装置および方法においては、複数のフレームをサブフレームとして組み合わせたコンバインドフレームがサンプルとして符号化されて符号化データが生成され、その符号化データを含むビットストリームが生成され、そのビットストリームに基づいてサブフレームの表示タイミングに関する第１の情報が生成され、そのビットストリームを格納するファイルが生成され、そのファイルにメタデータとして第１の情報が格納される。

G-PCCビットストリームの構成例を示す図である。コンバインドフレームについて説明する図である。 frame number attributeについて説明する図である。 frame index attributeについて説明する図である。 G-PCCファイルの構造の例を示す図である。 SubSampleInformationBoxの例を示す図である。 codec_specific_parametersの例を示す図である。符号化・復号方法の例を示す図である。 codec_specific_parametersの例を示す図である。 subsample_deltaの適用例を示す図である。 codec_specific_parametersの例を示す図である。 durationの適用例を示す図である。マトリョーシカメディアコンテナの構成例を示す図である。ファイル生成装置の主な構成例を示すブロック図である。ファイル生成処理の流れの例を示すフローチャートである。再生装置の主な構成例を示すブロック図である。再生処理の流れの例を示すフローチャートである。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．技術内容・技術用語をサポートする文献等
　２．コンバインドフレームの再生
　３．表示タイミングに関する情報の伝送
　４．第１の実施の形態（ファイル生成装置、再生装置）
　５．付記

　＜１．技術内容・技術用語をサポートする文献等＞
　本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献および特許文献等に記載されている内容や、以下の非特許文献および特許文献等において参照されている他の文献の内容等も含まれる。

　非特許文献１：（上述）
　非特許文献２：（上述）
　非特許文献３：（上述）
　非特許文献４：（上述）
　非特許文献５：https://www.matroska.org/index.html

　つまり、上述の非特許文献および特許文献等に記載されている内容や、上述の非特許文献および特許文献等において参照されている他の文献の内容等も、サポート要件を判断する際の根拠となる。

　＜２．コンバインドフレームの再生＞
　　＜ポイントクラウド＞
　従来、点の位置情報や属性情報等により３次元構造を表すポイントクラウド（Point cloud）等の3Dデータが存在した。

　例えばポイントクラウドの場合、立体構造物（３次元形状のオブジェクト）を多数の点の集合として表現する。ポイントクラウドは、各点の位置情報（ジオメトリ（geometry）とも称する）と属性情報（アトリビュート（attribute）とも称する）とにより構成される。アトリビュートは任意の情報を含むことができる。例えば、各ポイントの色情報、反射率情報、法線情報等がアトリビュートに含まれるようにしてもよい。このようにポイントクラウドは、データ構造が比較的単純であるとともに、十分に多くの点を用いることにより任意の立体構造物を十分な精度で表現することができる。

　　＜G-PCCの概要＞
　非特許文献１には、このポイントクラウドについて、ジオメトリとアトリビュートに分けて符号化する、Geometry-based Point Cloud Compression（G-PCC）という符号化技術が開示された。G-PCCは、MPEG-I Part 9 (ISO/IEC 23090-9) で規格化作業中である。

　ジオメトリの圧縮には、例えばオクツリー（octree）符号化が適用される。オクツリー符号化は、ジオメトリのデータ構造を８分木（オクツリー）に変換して符号化する符号化方式である。

　この場合、ジオメトリは、階層構造の直方体形状（立方体形状を含む）の３次元領域であるボクセル（Voxel）を用いて表現される。つまり、ボクセル毎にポイントが存在するか否かが表現される。ポイントが存在するボクセルは分割され、その分割後の小さい領域（下位のボクセル）においてポイントの有無が表現される。ポイントが存在するボクセルについて、このような分割が最下位層まで再帰的に繰り返されることにより、ボクセルの階層構造が形成される。

　そして、オクツリーは、このようなボクセル表現（ボクセル毎のポイントの有無）を８分木として表現する。オクツリーの各ノードは、ボクセル表現の各ボクセルに対応する。例えば、ポイントが存在するボクセルに対応するノードは値「１」として表現され、ポイントが存在しないボクセルに対応するノードは値「０」として表現される。ポイントが存在するボクセルに対応するノード（値「１」のノード）には、子ノード（１つ下位のノード）が形成される。

　以上のようにジオメトリが符号化されて生成される符号化データのビットストリームをジオメトリビットストリームとも称する。

　また、アトリビュートの圧縮には、Predicting Weight Lifting，Region Adaptive Hierarchical Transform (RAHT)、またはFix Weight Lifting等の手法が適用される。アトリビュートが符号化されて生成される符号化データのビットストリームをアトリビュートビットストリームとも称する。また、ジオメトリビットストリームとアトリビュートビットストリームを１本にまとめたビットストリームをG-PCCビットストリームとも称する。

　　＜ビットストリームの構造＞
　このようなG-PCCビットストリームの構造の例を図１に示す。図１において、各矩形領域は、１つのType-length-value encapsulation structure（tlv_encapsulation()）を示す。

　SPS（Sequence Parameter Set）は、シーケンスパラメータセットが格納される領域を示す。GPS(s)（Geometry Parameter Set）は、ジオメトリパラメータセットが格納される領域を示す。APS(s)（Attribute Parameter Set）は、アトリビュートパラメータセットが格納される領域を示す。なお、GPSおよびAPSは、スライス毎に存在してもよい。GPS(s)およびAPS(s)は、sps_idを用いてSPSと関連付けられる。

　ジオメトリデータユニット（geometry data unit）は、１スライスのジオメトリのデータが格納される領域を示す。ジオメトリデータユニットは、gps_idを用いてGPS(s)と関連付けられる。アトリビュートデータユニット（attribute data unit(s)）は、１スライスのアトリビュートのデータが格納される領域を示す。１つのジオメトリデータユニットに対して複数のアトリビュートデータユニットが存在してもよい。アトリビュートデータユニットは、aps_idを用いてAPS(s)と関連付けられる。

　なお、互いに同一のスライスを構成するジオメトリデータユニットとアトリビュートデータユニットは、slice_idで関連付けられる。また、スライス間でポイントが重複してもよい。また、スライスには、他のスライスと復号の際の依存関係がないインディペンデントスライス（independent slice）と、その依存関係があるディペンデントスライス（dependent slice）とがある。

　　＜コンバインドフレーム＞
　ところで、ポイントクラウドは、動画像のように時間方向に変化し得る（動的とも称する）。G-PCCでは、このような所定の期間の動的なポイントクラウドを符号化することができた。このようなポイントクラウドは、動画像のように、互いに異なる時刻の複数のフレーム（ポイントクラウドフレームとも称する）により構成される。例えばジオメトリの場合、各フレームのオクツリーがそれぞれ（フレーム毎に）符号化された。

　非特許文献４には、複数のフレームを１つにまとめて符号化する方法が開示された。つまり、エンコーダは、図２に示されるように、複数のフレームのオクツリーをサブフレームとして組み合わせて１つのコンバインドフレーム（Combined Frame）を生成し、そのコンバインドフレームを通常のフレームのように符号化し、サンプルとした。つまり、コンバインドフレームのポイントクラウドは、各サブフレームのポイントクラウドを組み合わせたものであり、各サブフレームのポイントを含む。つまり、コンバインドフレームのオクツリーは、各サブフレームのオクツリーを組み合わせたものであり、各サブフレームのオクツリーの値「１」のノードを含む。

　なお、図２の例では、２つのフレーム（Frame1およびFrame2）を組み合わせているが、組み合わせる（１つのコンバインドフレームに含める）フレーム数は任意である。このコンバインドフレームに対して、組み合わされた各フレーム（図２の例の場合、Frame1およびFrame2）をサブフレームとも称する。

　このようにすることにより、フレーム毎に行われるデコーダの初期化（decoder initialization）の回数を削減することができ、復号処理の負荷の増大を抑制することができる。例えば、処理能力が比較的低いクライアント装置等において復号処理を行う場合等に有用である。また、オクツリーは、サブフレーム間で冗長性を有する場合がある。特に上位層においては冗長となる可能性が高い。このようなオクツリーの冗長性により符号化効率が低減するおそれがある。サブフレームを組み合わせることにより、このようなオクツリーの冗長性を低減することができ、符号化効率の低減を抑制することができる。

　なお、このサブフレームはどのように組み合わせてもよい。例えば、組み合わせるサブフレームの数は任意である。また、組み合わせる際のサブフレームの並び順は、サブフレームの表示順でなくてもよい。例えば、連続しないサブフレームを組み合わせることもあり得る。また、3Dデータの場合、再生時のフレーム（サブフレーム）の表示期間の長さは、アプリケーションに依存し、一定でなくてもよい（フレーム（サブフレーム）によって異なってもよい）。

　　＜サブフレームの再生＞
　再生装置は、このようなコンバインドフレームを各サブフレームに分け、サブフレーム毎に再生する（各サブフレームを通常のフレームとして再生する）。つまり、再生装置は各サブフレームをどのような順で再生するかを把握する必要がある。そこで、非特許文献４には、各サブフレームの表示順を示す情報を伝送する方法（フレームナンバーアトリビュートとフレームインデックスアトリビュート）が開示された。

　フレームナンバーアトリビュート（frame number attribute）は、アトリビュートとして、各サブフレームに対して、シーケンス全体における表示順を示すフレームナンバー（frame number）を付与する方法である。図３の例の場合、各スライス（フレームに相当）のアトリビュートデータユニット（ADU）にフレームナンバー（FN#x（xは自然数））が付与されている。再生装置は、各サブフレームのポイントクラウドの画像をこのフレームナンバーに示される順に表示させるように（つまり、FN#0、FN#1、FN#2、FN#3、FN#4、FN#5、FN#6、FN#7・・・の順に表示させるように）、コンバインドフレームの復号および各サブフレームの再生を行う。

　図３に示されるように、このフレームナンバーアトリビュートの場合、サブフレームの順序の入れ替えは、コンバインドフレーム内だけでなく、コンバインドフレームを跨いでも行うことができる。例えば、図３の場合、FN#1のサブフレームとFN#2のサブフレームの順序が入れ替えられ、FN#4のサブフレームとFN#5のサブフレームの順序が入れ替えられている。つまり、FN#1のサブフレームとFN#2のサブフレームは表示順と異なる順序で組み合わせられ、サンプルa（sample a）のコンバインドフレームを形成している。つまり、コンバインドフレーム内において順序が入れ替えられている。

　したがって、フレームナンバーアトリビュートの場合、再生装置は、デコード時刻に従い、処理対象のサンプルを復号し、フレームナンバーに従ってサブフレームを表示し、次に表示すべきサブフレームがこれまでに復号されたサンプル内に存在しない場合、前方もしくは後方のサンプルを復号する、といった処理を繰り返す。

　これに対して、FN#4のサブフレームとFN#5のサブフレームは、その順序を入れ替えることにより、組み合わせる相手（サブフレーム）が変更されている。例えば、FN#4のサブフレームはFN#3のサブフレームと組み合わせられ、サンプルb（sample b）のコンバインドフレームを形成している。また、FN#5のサブフレームは、FN#6のサブフレームおよびFN#7のサブフレームと組み合わせられ、サンプルc（sample c）のコンバインドフレームを形成している。つまり、コンバインドフレームを跨いで順序が入れ替えられている。このように、組み合わせるサブフレームを変えることで符号化効率の低減を抑制することができる場合がある。

　フレームインデックスアトリビュート（frame index attribute）は、アトリビュートとして、各サブフレームに対して、コンバインドフレーム内における表示順を示すフレームインデックス（frame index）を付与する方法である。図４の例の場合、各スライス（フレームに相当）のアトリビュートデータユニット（ADU）にフレームインデックス（FI#x（xは自然数））が付与されている。再生装置は、サンプル（コンバインドフレーム）毎に各サブフレームのポイントクラウドの画像をこのフレームインデックスに示される順に表示させるように、コンバインドフレームの復号および各サブフレームの再生を行う。

　図４に示されるように、このフレームインデックスアトリビュートの場合、サブフレームの順序の入れ替えは、コンバインドフレーム内において行うことができる。例えば、図４の場合、FI#1のサブフレームとFI#2のサブフレームの順序が入れ替えられている。つまり、FN#1のサブフレームとFN#2のサブフレームは表示順と異なる順序で組み合わせられ、サンプルa（sample a）のコンバインドフレームを形成している。つまり、コンバインドフレーム内において順序が入れ替えられている。

　この場合、再生装置は、サンプルa（sample a）のFN#0、FN#1、FN#2、サンプルb（sample b）のFN#0、FN#1、サンプルc（sample c）のFN#0、FN#1、FN#2・・・の順に各サブフレームを表示させる。

　したがって、フレームインデックスアトリビュートの場合、再生装置は、デコード時刻に従い、処理対象のサンプルを復号し、そのサンプル内のサブフレームをフレームインデックスに従って適宜並び替えて表示する、といった処理を繰り返す。

　　＜ISOBMFF＞
　非特許文献２には、動画圧縮の国際標準技術MPEG-4（Moving Picture Experts Group - 4）のファイルコンテナ仕様であるISOBMFF（International Organization for Standardization Base Media File Format）が開示された。

　　＜G-PCCビットストリームのISOBMFFへの格納＞
　非特許文献３には、このG-PCCで符号化されたビットストリームのローカルストレージからの再生処理やネットワーク配信の効率化を目的とし、G-PCCビットストリームをISOBMFFに格納する方法が開示された。この方法は、MPEG-I Part 18（ISO/IEC 23090-18）で規格化作業中である。以下において、G-PCCビットストリームをISOBMFFに格納したものをG-PCCファイルと称する。

　図５は、G-PCCファイル構造の例を示す図である。G-PCCファイルのメタデータを格納する領域であるトラックボックス（TrackBox）内のGPCCサンプルエントリ（GPCCSampleEntry）には、GPCCデコーダコンフィグレーションレコード（GPCCDecoderConfigurationRecord）が設けられている。そのGPCCデコーダコンフィグレーションレコードには、例えば、シーケンスパラメータセット（SPS）が格納される。そのGPCCデコーダコンフィグレーションレコードには、さらに、サンプルエントリタイプ（sample entry type）に応じてジオメトリパラメータセット（GPS）、アトリビュートパラメータセット（APS）、タイルインベントリを格納し得る。

　メディアデータボックス（MediaDataBox）のサンプル（sample）は、１ポイントクラウドフレームに相当するジオメトリとアトリビュートを格納し得る。また、このサンプルは、サンプルエントリタイプに応じてジオメトリパラメータセット、アトリビュートパラメータセット、タイルインベントリを格納し得る。

　なお、G-PCCファイルには、互いに対応するジオメトリとアトリビュートを１つのトラックに格納するシングルトラック方式（single track encapsulation）と、互いに対応するジオメトリとアトリビュートを互いに異なるトラックに格納するマルチトラック方式の２つの手法が規定されている。

　　＜SubSampleInformationBox＞
　サンプル中の、連続した特定バイト（byte）領域をサブサンプル（subsample）とも称する。このサブサンプルの定義は符号化コーデック毎に決まっており、例えばHEVC（（High Efficiency Video Coding））の場合、ナルユニット（NAL unit）がサブサンプルとなる。非特許文献４に記載の方法の場合、コンバインドフレームがサンプルとなり、そのコンバインドフレームを構成する各ポイントクラウドフレーム（サブフレーム）がサブサンプルとなる。G-PCCファイルのメタデータを格納する領域には、サブサンプルインフォメーションボックス（SubSampleInformationBox）が設けられ、そこでは、そのサブサンプル毎に（サブサンプルに対して）情報を付加することができる。

　図６は、そのサブサンプルインフォメーションボックスのシンタックスの例を示す。図６の例の場合、このサブサンプルインフォメーションボックスにおいて、サンプルデルタ（sample_delta）、サブサンプルカウント（subsample_count）、サブサンプルサイズ（subsample_size）、コーデックスペシフィックパラメータ（codec_specific_parameters）等が定義される。サンプルデルタ（sample_delta）は、サブサンプルを有するサンプルを指定するパラメータである。また、サブサンプルカウント（subsample_count）は、サブサンプル数を示すパラメータである。また、サブサンプルサイズ（subsample_size）は、サブサンプルのサイズを示すパラメータである。また、コーデックスペシフィックパラメータ（codec_specific_parameters）では、コーデック毎に決まるサブサンプル（subsample）付加情報が定義される。

　図７は、そのコーデックスペシフィックパラメータのシンタックスの例を示す。図７に示されるように、例えばフラグの値が「０」の場合（flag == 0）、１サブサンプル（G-PCC unit based subsamples. 1 subsample）は１つのGPCCユニット（G-PCC unit）を含む。また、コーデックスペシフィックパラメータでは、GPCCユニットのペイロードタイプ（payloadType（例えば、ジオメトリgeometryやアトリビュート（attribute）等））が格納される。例えば、ペイロード（payload）がアトリビュートデータ（attribute data）である場合（payloadType == 4）、アトリビュート（attribute）識別子であるattrIdxが格納される。

　フラグの値が「１」の場合（flag == 1）、１サブサンプル（Tile based subsamples. 1 subsample）は、１つのGPCCタイル（1GPCC tile）に相当する単数または複数の連続するGPCCユニットを含むか、パラメータセット、タイルインベントリ、フレームバウンダリマーカを含む単数または複数の連続するGPCCユニットを含む。コーデックスペシフィックパラメータでは、サブサンプル（subsample）がGPCCタイルである場合（tile_data==1）、タイル（tile）識別子であるtile_idが格納される。

　　＜表示タイミング＞
　しかしながら、非特許文献４に記載の方法では、G-PCCファイルにおいては、メタデータとして各サブフレームの表示タイミングが明示されなかった。そのため、デコーダは、ビットストリームを復号する前に各サブフレームの表示タイミングを把握することが困難であった。

　上述したように、各ポイントクラウドフレームの表示期間の長さを任意に定義することができる。また、非特許文献４に記載のコンバインドフレームを適用する場合、１サンプルに任意の数のサブフレームを格納することができる。そのため、各コンバインドフレームの表示期間の長さも一定とは限らない。また、上述のようにサブフレームの順序を入れ替えて組み合わせることができるため、サンプルの先頭のサブフレームが最初に表示されるとは限らない。特にフレームナンバーアトリビュートの場合、サンプルを跨いでサブフレームを入れ替えることができるため、あるサンプル内の全てのサブフレームを表示する前にその他のサンプルのサブフレームを表示する場合がある。これらのように、各ポイントクラウドフレームの表示タイミングは自明ではない。

　デコーダは、ビットストリームの各サンプルを、そのサンプルに含まれるサブフレームの最初の表示タイミングよりも前に復号しなければならない。しかしながら、デコーダはG－PCCファイルから各サブフレームの表示タイミングを示す情報を得ることは困難であり、かつ、上述のように自明でもなかった。つまり、デコーダは、各サンプルをどのようなタイミングで（いつまでに）取得し、復号すればよいかわからなかった。そのため、例えば再生処理が遅延し、表示においてフレームの欠損が生じるおそれがあった。また、事前に全てのサンプルを復号してから再生を開始する方法も考えられるが、その場合、表示が開始されるまでの遅延が増大するおそれがあった。また、付言するに、デコーダがビットストリームを復号する前にファイルの再生可否の判断をすることも困難であった。つまり、3Dデータの再生表示の品質が低減するおそれがあった。

　＜３．表示タイミングに関する情報の伝送＞
　　＜方法１＞
　そこで、図８の表の最上段に示されるように、サブフレームの表示タイミングに関する情報をファイルのメタデータとして格納するようにする（方法１）。

　例えば、情報処理装置（第１の情報処理装置とも称する）が、ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、サブフレームの表示タイミングに間に合うタイミングで、ファイルに格納されるビットストリームからサブフレームを含むサンプルを抽出する抽出部と、その抽出されたサンプルを復号する復号部と、第１の情報に基づいて、その復号されたサンプルに含まれるサブフレームの表示タイミングに間に合うタイミングで、サブフレームのポイントクラウドを構築する構築部とを備えてもよい。また、情報処理方法（第１の情報処理方法とも称する）において、ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、サブフレームの表示タイミングに間に合うタイミングで、ファイルに格納されるビットストリームからサブフレームを含むサンプルを抽出し、その抽出されたサンプルを復号し、第１の情報に基づいて、その復号されたサンプルに含まれるサブフレームの表示タイミングに間に合うタイミングで、サブフレームのポイントクラウドを構築してもよい。

　このようにすることにより第１の情報処理装置は、各サブフレームの表示タイミングをより容易に把握することができる。したがって、第１の情報処理装置は、各サブフレームのその表示タイミングに間に合うように、各サンプルを復号することができる。したがって、第１の情報処理装置は、3Dデータの再生表示の品質の低減を抑制することができる。

　また、例えば、情報処理装置（第２の情報処理装置とも称する）が、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成する符号化部と、その符号化データを含むビットストリームを生成し、そのビットストリームに基づいてサブフレームの表示タイミングに関する第１の情報を生成するビットストリーム生成部と、そのビットストリームを格納するファイルを生成し、そのファイルにメタデータとして第１の情報を格納するファイル生成部とを備えてもよい。また、情報処理方法（第２の情報処理方法とも称する）において、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成し、その符号化データを含むビットストリームを生成し、そのビットストリームに基づいてサブフレームの表示タイミングに関する第１の情報を生成し、そのビットストリームを格納するファイルを生成し、そのファイルにメタデータとして第１の情報を格納してもよい。

　第２の情報処理装置がこのように処理を行うことにより第１の情報処理装置は、各サブフレームの表示タイミングをより容易に把握することができる。つまり、第２の情報処理装置は、第１の情報処理装置に対して、各サブフレームのその表示タイミングに間に合うように、各サンプルを復号させることができる。したがって、第２の情報処理装置は、第１の情報処理装置による3Dデータの再生表示の品質の低減を抑制することができる。

　なお、この第１の情報処理装置および第２の情報処理装置において、3Dデータは、３次元空間のオブジェクトの３次元形状を示すものであればどのようなものであってもよく、例えばポイントクラウドであってもよい。その場合、サブフレームは、例えばポイントクラウドフレームであってもよい。また、コンバインドフレームの場合、例えば、サンプルがそのコンバインドフレームに対応し、サブサンプルがサブフレームに対応してもよい。また、3Dデータ（ジオメトリ）の符号化方式は、例えばG-PCCであってもよい。つまり、ビットストリームは、例えばG-PCCビットストリームであってもよく、ファイルは、例えばG-PCCファイルであってもよい。

　また、サブフレームの表示タイミングに関する情報は、例えば、ファイルのメタ情報格納エリアに格納されてもよい。例えば、ファイルがISOBMFFであり、第１の情報がそのサブサンプルインフォメーションボックス（SubSampleInformationBox）に格納されてもよい。例えば、サブサンプルインフォメーションボックスのコーデックスペシフィックパラメータ（codec_specific_parameters）を拡張して第１の情報を格納してもよい。

　また、ファイルがISOBMFFであり、第１の情報がそのサンプルグループボックス（SampleGroupBox）に格納されてもよい。サンプルグループボックスは、複数のサンプルからなるサンプルグループに付与される情報を格納する領域である。つまりこの場合、サンプルグループを構成する各サンプル内のサブサンプル（サブフレーム）についての第１の情報（表示タイミングに関する情報）が、サンプルグループボックスに格納される。例えば、第１の情報が、ボリュメトリックビジュアルサンプルグループエントリ（VolumetricVisualSampleGroupEntry）のサブフレームタイミンググループエントリ（SubFrameTimingGroupEntry）に格納されてもよい。換言するに、第１の情報がサンプルグループ毎に付与されてもよい。

　　＜方法１－１＞
　なお、図８の表の上から２段目に示されるように、サブフレームの表示タイミングに関する情報（第１の情報）は、サンプル表示タイミングからのオフセットを含むようにしてもよい（方法１－１）。

　図９は、この場合のサブサンプルインフォメーションボックスのコーデックスペシフィックパラメータのシンタックスの例を示す図である。図９の例では、フラグの値が「２」の場合（flag == 2）、サブサンプルデルタ（subsample_delta）が格納される。サブサンプルデルタは、サブサンプル（すなわちサブフレーム）が属するサンプルの復号タイミング（decoding time）と、そのサブサンプルの復号タイミング（decoding time）との差を示すパラメータである。G-PCCにおいては、復号タイミング（decoding time）と表示タイミング（presentation time）は等価である。つまり、サブサンプルデルタは、サンプル表示タイミングからのオフセットを示す。

　なお、第１の情報は、符号（正負）を含んでもよい。図９の例では、フラグの値が「２」の場合（flag == 2）、サブサンプルデルタとともにサイン（sign）が格納される。この場合、サブサンプルデルタは、サブサンプルが属するサンプルの復号タイミングと、そのサブサンプルの復号タイミングとの差の絶対値を示す。サインは、そのサブサンプルデルタの符号（正負）を示すパラメータである。例えば、サインは、その値が０なら正を示し、１なら負を示すようにしてもよい。なお、サインを格納する代わりに、サブサンプルデルタが０および正の値だけでなく、負の値も取り得るようにしてもよい。その場合、サインは省略することができる。

　なお、サブサンプルデルタは、サブフレームが属するサンプルの復号タイミングと、そのサブフレームの復号タイミングとの差を示すパラメータであるサブフレームタイムオフセット（subframe_time_offset）としてもよい。また、その場合も、サインを伝送してもよいし、サブフレームタイムオフセットが０および正の値だけでなく、負の値もとり得るようにしてもよい。つまり、サブフレームタイムオフセットは、サブサンプルデルタと等価としてもよいし、サブサンプルデルタおよびサインと等価としてもよい。

　サブフレームタイムオフセット（またはサブフレームタイムオフセットとサインの組み合わせ）が負の値をとることにより、処理対象のサブフレームが所属するサンプルの表示タイミングよりも前にその処理対象のサブフレームを表示させることができる。つまり、サンプルを跨ぐサブフレームの順序の入れ替えが可能になる。

　第１の情報処理装置は、G-PCCファイルからサンプル復号タイミングDT[n]と第１の情報を取得し、サンプル復号タイミングDT[n]に第１の情報を加算することにより各サブフレームの表示タイミングを導出する。図１０は、その導出の様子の例を示す図である。図１０の例の場合、サンプルa、サンプルb、サンプルcのサンプル復号タイミングDT[n]がそれぞれ、0、3、5である。また、サブサンプルデルタ（サブフレームタイムオフセット）が負の値をとり得るものとする。図１０に示されるように、フレームナンバーFN#0が付与されたサブサンプルのサブサンプルデルタは0である。フレームナンバーFN#1が付与されたサブサンプルのサブサンプルデルタは1である。フレームナンバーFN#2が付与されたサブサンプルのサブサンプルデルタは2である。フレームナンバーFN#3が付与されたサブサンプルのサブサンプルデルタは0である。フレームナンバーFN#4が付与されたサブサンプルのサブサンプルデルタは-1である。フレームナンバーFN#5が付与されたサブサンプルのサブサンプルデルタは2である。フレームナンバーFN#6が付与されたサブサンプルのサブサンプルデルタは1である。フレームナンバーFN#7が付与されたサブサンプルのサブサンプルデルタは2である。

　例えば、第１の情報処理装置は、サブフレームの表示タイミング（サブフレームの復号タイミング）を、以下の式（１）のように導出する。

　subsample decoding time (=presentation time) = DT(n)+subsample_delta
　・・・（１）

　したがって、フレームナンバーFN#0が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=0+0=0である。フレームナンバーFN#1が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=0+1=1である。フレームナンバーFN#2が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=0+2=2である。フレームナンバーFN#3が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=3+0=3である。フレームナンバーFN#4が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=5-1=4である。フレームナンバーFN#5が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=3+2=5である。フレームナンバーFN#6が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=5+1=6である。フレームナンバーFN#7が付与されたサブサンプルの表示タイミング（subsample decoding time）は、DT(n)+subsample_delta=5+2=7である。

　第１の情報処理装置は、このように導出されたサブサンプルの表示タイミングに従って、各サブサンプルを表示する。このようにすることにより、第１の情報処理装置は、指定されたタイミングにおいて各サブフレームを表示させることができる。つまり、第１の情報処理装置は、G-PCCファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、各サブフレームの表示タイミングに間に合うタイミングで、各サンプルを取得して復号し、各サブフレームのポイントクラウドを構築することにより、再生の遅延やフレームの欠損の発生を抑制し、3Dデータの再生表示の品質の低減を抑制することができる。

　換言するに、第２の情報処理装置は、サブフレームの表示タイミングに関する第１の情報をG-PCCファイルにメタデータとして格納することにより、第１の情報処理装置が、再生の遅延やフレームの欠損の発生を抑制し、3Dデータの再生表示の品質の低減を抑制することができる。

　なお、上述の第１の情報とは別に、サブフレームの表示順に関する第２の情報が、メタデータとしてさらにファイルに格納されてもよい。このようにすることにより、第１の情報処理装置は、上述のような演算を行わずに、第２の情報を参照するだけで容易に各サブフレームの表示順を把握することができる。なお、この第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよいし、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。

　　＜方法１－２＞
　なお、図８の表の最下段に示されるように、サブフレームの表示タイミングに関する情報（第１の情報）は、サブフレームの表示順を示す第２の情報と、サブフレームの表示期間の長さを示すデュレーション（duration）とを含んでもよい（方法１－２）。第２の情報は、例えば、サブフレームのシーケンス全体での表示順を示すフレームナンバーを含んでもよい。

　図１１は、この場合のサブサンプルインフォメーションボックスのコーデックスペシフィックパラメータのシンタックスの例を示す図である。図１１の例では、フラグの値が「２」の場合（flag == 2）、フレームナンバー（frame number）およびデュレーション（duration）が格納される。フレームナンバーは、図３を参照して説明したとおりである。デュレーションは、サブフレームの表示期間の長さを示す。

　第１の情報処理装置は、G-PCCファイルからこのフレームナンバーと各サブフレームのデュレーションを取得し、各サブサンプル（サブフレーム）を、フレームナンバーに従った順序で、デュレーションに示される表示期間ずつ表示する。図１２は、その様子の例を示す図である。図１２の例の場合、各サブフレームの表示期間はいずれも「１」であるので、フレームナンバーFN#0が付与されたサブサンプル乃至フレームナンバーFN#7が付与されたサブサンプルのそれぞれの表示タイミングは、0乃至7である。

　このようにすることにより、第１の情報処理装置は、指定されたタイミングにおいて各サブフレームを表示させることができる。つまり、第１の情報処理装置は、G-PCCファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、各サブフレームの表示タイミングに間に合うタイミングで、各サンプルを取得して復号し、各サブフレームのポイントクラウドを構築することにより、再生の遅延やフレームの欠損の発生を抑制し、3Dデータの再生表示の品質の低減を抑制することができる。

　なお、第２の情報は、例えば、サブフレームのサンプル内での表示順を示すフレームインデックスを含んでもよい。

　　＜その他の方法＞
　なお、第１の情報は、各サブフレームの表示タイミングそのものを直接的に示す情報であってもよい。また、第１の情報が、サンプル表示タイミングからのオフセットやサブフレームの表示期間の長さを示す情報を含まず、サブフレーム表示順のみを含むようにしてもよい。

　以上においては、互いに対応するジオメトリとアトリビュートを１つのトラックに格納するシングルトラックによりファイルが構成される場合について説明したが、本技術は、ISOBMFFが、互いに対応するジオメトリとアトリビュートを互いに異なるトラックに格納するマルチトラックによりファイルが構成される場合にも適用することができる。その場合、第１の情報は、例えば、フレームナンバーアトリビュートやフレームインデックスアトリビュートが格納されるアトリビュートトラックにのみ格納されてもよい（ジオメトリトラックには第１の情報が格納されなくてもよい）。また、第１の情報は、ジオメトリが格納されるジオメトリトラックにのみ格納されてもよい（アトリビュートが格納されるアトリビュートトラックには第１の情報が格納されなくてもよい）。また、第１の情報は、ジオメトリトラックとアトリビュートトラックの両方に格納されてもよい（ジオメトリトラックとアトリビュートトラックに同一の情報が格納されてもよい）。

　以上においてはファイルフォーマットとしてISOBMFFを適用する例について説明したが、G-PCCビットストリームを格納するファイルは任意であり、ISOBMFF以外であってもよい。例えば、G-PCCビットストリームが、マトリョーシカメディアコンテナ（Matroska Media Container）に格納されてもよい。マトリョーシカメディアコンテナの主な構成例を図１３に示す。

　この場合、例えば、サブフレームの表示タイミングに関する第１の情報が、Track Entry element下の新たに定義したelementとして格納されてもよい。

　つまり、この場合も、サブフレームの表示タイミングに関する第１の情報がマトリョーシカメディアコンテナのシステムレイヤに格納される。したがって、第１の情報処理装置は、システムレイヤを参照することにより、容易に（G-PCCビットストリームをパースせずに）、第１の情報を得ることができる。つまり、第１の情報処理装置は、マトリョーシカメディアコンテナのシステムレイヤを参照することにより、容易に、各サブフレームの表示タイミングを把握することができる。したがって、第１の情報処理装置は、その第１の情報に基づいて、各サブフレームの表示タイミングに間に合うタイミングで、各サンプルを取得して復号し、各サブフレームのポイントクラウドを構築することにより、再生の遅延やフレームの欠損の発生を抑制し、3Dデータの再生表示の品質の低減を抑制することができる。

　＜４．第１の実施の形態＞
　　＜ファイル生成装置＞
　以上に説明した本技術は、任意の装置において適用することができる。図１４は、本技術を適用した情報処理装置の一態様であるファイル生成装置の構成の一例を示すブロック図である。図１４に示されるファイル生成装置３００は、G-PCCを適用してポイントクラウドデータを符号化し、その符号化により生成したG-PCCビットストリームをISOBMFF（G-PCCファイル）に格納する装置である。

　その際、ファイル生成装置３００は、上述した本技術を適用し、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成し、その符号化データを含むビットストリームを生成し、ビットストリームに基づいてサブフレームの表示タイミングに関する第１の情報を生成し、ビットストリームを格納するファイルを生成し、そのファイルにメタデータとして第１の情報を格納する。

　なお、図１４においては、処理部やデータの流れ等の主なものを示しており、図１４に示されるものが全てとは限らない。つまり、ファイル生成装置３００において、図１４においてブロックとして示されていない処理部が存在したり、図１４において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図１４に示されるようにファイル生成装置３００は、コンバインドフレーム生成部３１１、抽出部３１２、符号化部３１３、ビットストリーム生成部３１４、およびファイル生成部３１５、およびファイル生成部３１５を有する。また、符号化部３１３は、ジオメトリ符号化部３２１、アトリビュート符号化部３２２、およびメタデータ生成部３２３を有する。

　コンバインドフレーム生成部３１１は、ファイル生成装置３００に入力されたポイントクラウドの複数のフレームをサブフレームとして組み合わせ、コンバインドフレームを生成する。コンバインドフレーム生成部３１１は、コンバインドフレームを含むポイントクラウドを抽出部３１２へ供給する。

　抽出部３１２は、コンバインドフレーム生成部３１１から供給されるポイントクラウドからジオメトリとアトリビュートをそれぞれ抽出する。抽出部３１２は、抽出したジオメトリのデータを符号化部３１３のジオメトリ符号化部３２１へ供給する。また、抽出部３１２は、抽出したアトリビュートを符号化部３１３のアトリビュート符号化部３２２へ供給する。

　符号化部３１３は、ポイントクラウドのデータを符号化する。ジオメトリ符号化部３２１は、抽出部３１２から供給されるジオメトリを符号化し、ジオメトリビットストリームを生成する。ジオメトリ符号化部３２１は、生成したジオメトリビットストリームをメタデータ生成部３２３に供給する。また、ジオメトリ符号化部３２１は、生成したジオメトリビットストリームをアトリビュート符号化部３２２にも供給する。アトリビュート符号化部３２２は、抽出部３１２から供給されるアトリビュートを符号化し、アトリビュートビットストリームを生成する。アトリビュート符号化部３２２は、生成したアトリビュートビットストリームをメタデータ生成部３２３に供給する。メタデータ生成部３２３は、供給されたジオメトリビットストリームおよびアトリビュートビットストリームを参照し、G-PCCビットストリームに格納するメタデータを生成する。メタデータ生成部３２３は、ジオメトリビットストリームおよびアトリビュートビットストリームとともに、生成したメタデータをビットストリーム生成部３１４に供給する。その際、符号化部３１３は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成する。

　ビットストリーム生成部３１４は、供給されたジオメトリビットストリーム、アトリビュートビットストリーム、およびメタデータを多重化し、G-PCCビットストリームを生成する。つまり、ビットストリーム生成部３１４は、符号化データ（ジオメトリビットストリーム、アトリビュートビットストリーム、およびメタデータ）を含むビットストリーム（G-PCCビットストリーム）を生成する。その際、ビットストリーム生成部３１４は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、そのビットストリームに基づいてサブフレームの表示タイミングに関する第１の情報を生成する。

　例えば、この第１の情報は、サンプルの表示タイミングからのオフセットを示すサブフレームタイムオフセット（subframe_time_offset）を含んでもよい。また、そのサブフレームタイムオフセットは、符号を含んでもよい。また、第１の情報は、サブフレームの表示順を示す第２の情報と、そのサブフレームの表示期間の長さを示すデュレーション（duration）とを含んでもよい。また、その第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよい。また、その第２の情報は、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。ビットストリーム生成部３１４は、生成したG-PCCビットストリームおよび第１の情報をファイル生成部３１５に供給する。

　ファイル生成部３１５は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、供給されたG-PCCビットストリームおよびメタデータ（第１の情報）を格納するG-PCCファイル（ファイルまたはコンテンツファイルとも称する）を生成する。その際、ファイル生成部３１５は、そのファイルにメタデータとしてサブフレームの表示順に関する第２の情報をさらに格納してもよい。例えば、その第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよい。また、その第２の情報は、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。ファイル生成部３１５は、以上のように生成したG-PCCファイルをファイル生成装置３００の外部に出力する。

　このような構成とすることにより、ファイル生成装置３００は、＜３．表示タイミングに関する情報の伝送＞の場合と同様の効果を得ることができる。つまり、ファイル生成装置３００は、3Dデータの再生表示の品質の低減を抑制することができる。

　　＜ファイル生成処理の流れ＞
　このファイル生成装置３００により実行されるファイル生成処理の流れの例を、図１５のフローチャートを参照して説明する。

　ファイル生成処理が開始されると、ファイル生成装置３００のコンバインドフレーム生成部３１１は、ステップＳ３０１において、符号化対象のポイントクラウドについて、複数のフレームをサブフレームとして組み合わせ、コンバインドフレームを生成する。

　ステップＳ３０２において、抽出部３１２は、ポイントクラウドからジオメトリとアトリビュートをそれぞれ抽出する。

　ステップＳ３０３において、符号化部３１３は、ステップＳ３０２において抽出されたジオメトリとアトリビュートを符号化し、ジオメトリビットストリームおよびアトリビュートビットストリームを生成する。符号化部３１３は、さらに、そのメタデータを生成する。その際、符号化部３１３は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成する。

　ステップＳ３０４において、ビットストリーム生成部３１４は、ステップＳ３０３において生成されたジオメトリビットストリーム、アトリビュートビットストリーム、およびメタデータを多重化し、G-PCCビットストリームを生成する。また、ビットストリーム生成部３１４は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、そのG-PCCビットストリームに基づいてサブフレームの表示タイミングに関する第１の情報を生成する。

　例えば、この第１の情報は、サンプルの表示タイミングからのオフセットを示すサブフレームタイムオフセット（subframe_time_offset）を含んでもよい。また、そのサブフレームタイムオフセットは、符号を含んでもよい。また、第１の情報は、サブフレームの表示順を示す第２の情報と、そのサブフレームの表示期間の長さを示すデュレーション（duration）とを含んでもよい。また、その第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよい。また、その第２の情報は、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。

　ステップＳ３０５において、ファイル生成部３１５は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、ステップＳ３０４おいて生成されたG-PCCビットストリームを格納するG-PCCファイル（すなわちコンテンツファイル）を生成する。そして、ファイル生成部３１５は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、そのG-PCCファイルにメタデータとして（メタ情報格納エリアに）第１の情報を格納する。その際、ファイル生成部３１５は、そのファイルにメタデータとしてサブフレームの表示順に関する第２の情報をさらに格納してもよい。例えば、その第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよい。また、その第２の情報は、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。

　ステップＳ３０６において、ファイル生成部３１５は、ステップＳ３０５において生成したG-PCCファイル（すなわちコンテンツファイル）をファイル生成装置３００の外部に出力する。

　ステップＳ３０６の処理が終了するとファイル生成処理が終了する。

　以上のように、ファイル生成装置３００は、ファイル生成処理において本技術を適用し、サブグループの空間構成情報とサブグループおよびレイヤグループの依存関係情報とを含むメタデータを生成し、それをG-PCCファイルのシステムレイヤに格納する。このようにすることにより、ファイル生成装置３００は、＜３．表示タイミングに関する情報の伝送＞の場合と同様の効果を得ることができる。つまり、ファイル生成装置３００は、3Dデータの再生表示の品質の低減を抑制することができる。

　　＜再生装置＞
　図１６は、本技術を適用した情報処理装置の一態様である再生装置の構成の一例を示すブロック図である。図１６に示される再生装置４００は、ISOBMFF（G-PCCファイル）に格納されるG-PCCビットストリームを復号し、ポイントクラウドを再構成し、レンダリングして提示情報を生成する装置である。

　再生装置４００は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、ポイントクラウドのG-PCCビットストリームをG-PCCファイルから抽出し、その抽出したG-PCCビットストリームを復号し、ポイントクラウドを構築する。

　なお、図１６においては、処理部やデータの流れ等の主なものを示しており、図１６に示されるものが全てとは限らない。つまり、再生装置４００において、図１６においてブロックとして示されていない処理部が存在したり、図１６において矢印等として示されていない処理やデータの流れが存在したりしてもよい。

　図１６に示されるように再生装置４００は、ファイル処理部４１１、復号部４１２、および提示情報生成部４１３を有する。

　ファイル処理部４１１は、再生装置４００に入力されるG-PCCファイルを取得し、そのG-PCCファイルに関する処理を行う。例えば、ファイル処理部４１１は、抽出部４２１を有する。抽出部４２１は、供給されたG-PCCファイルからG-PCCビットストリームを抽出する。その際、抽出部４２１は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、G-PCCファイルにメタデータとして格納されているサブフレームの表示タイミングに関する第１の情報に基づいて、サブフレームの表示タイミングに間に合うタイミングで、そのG-PCCファイルに格納されるG-PCCビットストリームからサブフレームを含むサンプルを抽出する。抽出部４２１は、その抽出したサンプルと第１の情報を復号部４１２へ供給する。

　例えば、この第１の情報は、サンプルの表示タイミングからのオフセットを示すサブフレームタイムオフセット（subframe_time_offset）を含んでもよい。また、そのサブフレームタイムオフセットは、符号を含んでもよい。また、このG-PCCファイルには、メタデータとして、サブフレームの表示順に関する第２の情報がさらに格納されてもよい。そして、抽出部４２１は、その第２の情報に示されるサブフレームの表示順に従って、サンプルを抽出してもよい。なお、この第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよい。また、その第２の情報は、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。また、第１の情報は、サブフレームの表示順を示す第２の情報と、そのサブフレームの表示期間の長さを示すデュレーション（duration）とを含んでもよい。また、その第２の情報は、シーケンス全体での表示順を示すフレームナンバー（frame number）を含んでもよい。また、その第２の情報は、サンプル内での表示順を示すフレームインデックス（frame index）を含んでもよい。

　復号部４１２は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、そのサンプル（G-PCCビットストリーム）を復号する。復号部４１２は、得られたサンプルと第１の情報を提示情報生成部４１３（のポイントクラウド構築部４４１）へ供給する。例えば、復号部４１２は、ジオメトリ復号部４３１およびアトリビュート復号部４３２を有する。ジオメトリ復号部４３１は、抽出部４２１から供給されるサンプルに含まれるジオメトリビットストリームを復号し、そのサンプルのジオメトリを得る。ジオメトリ復号部４３１は、そのサンプルのジオメトリをアトリビュート復号部４３２へ供給する。また、ジオメトリ復号部４３１は、そのサンプルのジオメトリと第１の情報を提示情報生成部４１３（ポイントクラウド構築部４４１）へ供給する。また、アトリビュート復号部４３２は、ジオメトリ復号部４３１から供給されるジオメトリを用いて、抽出部４２１から供給されるサンプルに含まれるアトリビュートのビットストリームを復号し、そのサンプルのアトリビュートを得る。アトリビュート復号部４３２は、そのサンプルのアトリビュートを提示情報生成部４１３（ポイントクラウド構築部４４１）へ供給する。

　提示情報生成部４１３は、供給されたサンプル（ジオメトリやアトリビュート）を用いてポイントクラウドを構築し、そのポイントクラウドを提示する（例えば表示する）ための情報である提示情報を生成する。提示情報生成部４１３は、ポイントクラウド構築部４４１および提示処理部４４２を有する。

　ポイントクラウド構築部４４１は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、復号部４１２から供給された第１の情報に基づいて、復号部４１２から供給されたサンプルに含まれるサブフレームの表示タイミングに間に合うタイミングで、そのサブフレームのポイントクラウドを構築する。ポイントクラウド構築部４４１は、構築したポイントクラウドを提示処理部４４２へ供給する。

　提示処理部４４２は、供給されたポイントクラウドを用いて提示情報を生成する。提示処理部４４２は、生成した提示情報を再生装置４００の外部に出力する。例えば、その提示情報がモニタに表示される。

　このような構成とすることにより、再生装置４００は、＜３．表示タイミングに関する情報の伝送＞の場合と同様の効果を得ることができる。つまり、再生装置４００は、3Dデータの再生表示の品質の低減を抑制することができる。

　　＜再生処理の流れ＞
　この再生装置４００により実行される再生処理の流れの例を、図１７のフローチャートを参照して説明する。

　再生処理が開始されると、再生装置４００のファイル処理部４１１（の抽出部４２１）は、ステップＳ４０１において、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、G-PCCファイル（すなわちコンテンツファイル）の再生対象トラックから表示タイミングに関する情報を取得する。

　ステップＳ４０２において、ファイル処理部４１１の抽出部４２１は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、G-PCCファイルにメタデータとして格納されているサブフレームの表示タイミングに関する第１の情報に基づいて、サブフレームの表示タイミングに間に合うタイミングで、そのG-PCCファイルに格納されるG-PCCビットストリームからサブフレームを含むサンプルを抽出する。

　ステップＳ４０３において、復号部４２２は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、ステップＳ４０２において抽出されたサンプルを復号する。ステップＳ４０４において、復号部４２２は、さらに、その復号したサンプルからサブサンプルを抽出する。

　ステップＳ４０５において、ポイントクラウド構築部４４１は、＜３．表示タイミングに関する情報の伝送＞において上述した本技術を適用し、第１の情報に基づいて、ステップＳ４０３において復号されたサンプルに含まれるサブフレームの表示タイミングに間に合うタイミングで、そのサブフレームのポイントクラウドを構築する。

　ステップＳ４０６において、提示処理部４４２は、ステップＳ４０５において構築したポイントクラウドを用いてレンダリングする等して、提示情報を生成する。提示処理部４４２は、ステップＳ４０７において、その提示情報を再生装置４００の外部に供給し、提示させる。

　ステップＳ４０７の処理が終了すると再生処理が終了する。

　以上のように各処理を実行することにより、再生装置４００は、＜３．表示タイミングに関する情報の伝送＞の場合と同様の効果を得ることができる。つまり、再生装置４００は、3Dデータの再生表示の品質の低減を抑制することができる。

　＜５．付記＞
　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図１８は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図１８に示されるコンピュータ９００において、CPU（Central Processing Unit）９０１、ROM（Read Only Memory）９０２、RAM（Random Access Memory）９０３は、バス９０４を介して相互に接続されている。

　バス９０４にはまた、入出力インタフェース９１０も接続されている。入出力インタフェース９１０には、入力部９１１、出力部９１２、記憶部９１３、通信部９１４、およびドライブ９１５が接続されている。

　入力部９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部９１４は、例えば、ネットワークインタフェースよりなる。ドライブ９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア９２１を駆動する。

　以上のように構成されるコンピュータでは、CPU９０１が、例えば、記憶部９１３に記憶されているプログラムを、入出力インタフェース９１０およびバス９０４を介して、RAM９０３にロードして実行することにより、上述した一連の処理が行われる。RAM９０３にはまた、CPU９０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア９２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア９２１をドライブ９１５に装着することにより、入出力インタフェース９１０を介して、記憶部９１３にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部９１４で受信し、記憶部９１３にインストールすることができる。

　その他、このプログラムは、ROM９０２や記憶部９１３に、あらかじめインストールしておくこともできる。

　　＜本技術の適用可能な対象＞
　以上においては、主にG-PCCビットストリームをISOBMFFに格納する方法に本技術を適用する場合について説明したが、本技術の適用対象は任意であり、上述の例に限定されない。つまり、G-PCCビットストリームを格納するファイルの形式は任意であり、上述したISOBMFFやマトリョーシカメディアコンテナに限定されない。また、3Dデータ（ポイントクラウド）の符号化・復号方式は任意であり、G-PCCに限定されない。また、３Ｄデータの形式は任意であり、ポイントクラウド以外であってもよい。つまり、上述した本技術の特徴と矛盾しない限り、ファイル、符号化・復号方式、3Dデータおよびその生成・構築方法等の仕様の一部または全部が、上述した例と異なっていてもよい。また、上述した一部の処理や仕様が省略されてもよい。

　また、本技術は、任意の構成に適用することができる。例えば、本技術は、様々な電子機器に応用され得る。

　また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

　また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　　＜本技術を適用可能な分野・用途＞
　本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

　例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。

　　＜その他＞
　なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

　また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、前記サブフレームの表示タイミングに間に合うタイミングで、前記ファイルに格納されるビットストリームから前記サブフレームを含むサンプルを抽出する抽出部と、
　抽出された前記サンプルを復号する復号部と、
　前記第１の情報に基づいて、復号された前記サンプルに含まれる前記サブフレームの表示タイミングに間に合うタイミングで、前記サブフレームのポイントクラウドを構築する構築部と
　を備える情報処理装置。
　（２）　前記第１の情報は、前記サンプルの表示タイミングからのオフセットを示すsubframe_time_offsetを含む
　（１）に記載の情報処理装置。
　（３）　前記subframe_time_offsetは、符号を含む
　（２）に記載の情報処理装置。
　（４）　前記ファイルは、前記メタデータとして、前記サブフレームの表示順に関する第２の情報をさらに格納し、
　前記抽出部は、前記第２の情報に示される前記サブフレームの表示順に従って、前記サンプルを抽出する
　（２）または（３）に記載の情報処理装置。
　（５）　前記第２の情報は、シーケンス全体での表示順を示すframe numberを含む
　（４）に記載の情報処理装置。
　（６）　前記第２の情報は、前記サンプル内での表示順を示すframe indexを含む
　（４）に記載の情報処理装置。
　（７）　前記第１の情報は、前記サブフレームの表示順を示す第２の情報と、前記サブフレームの表示期間の長さを示すdurationとを含む
　（１）乃至（６）のいずれかに記載の情報処理装置。
　（８）　前記第２の情報は、シーケンス全体での表示順を示すframe numberを含む
　（７）に記載の情報処理装置。
　（９）　前記第２の情報は、前記サンプル内での表示順を示すframe indexを含む
　（７）に記載の情報処理装置。
　（１０）　前記ファイルは、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報をSubSampleInformationBoxに格納する
　（１）乃至（９）のいずれかに記載の情報処理装置。
　（１１）　前記ファイルは、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報をSampleGroupBoxに格納する
　（１）乃至（９）のいずれかに記載の情報処理装置。
　（１２）　ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、前記サブフレームの表示タイミングに間に合うタイミングで、前記ファイルに格納されるビットストリームから前記サブフレームを含むサンプルを抽出し、
　抽出された前記サンプルを復号し、
　前記第１の情報に基づいて、復号された前記サンプルに含まれる前記サブフレームの表示タイミングに間に合うタイミングで、前記サブフレームのポイントクラウドを構築する
　情報処理方法。

　（２１）　複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成する符号化部と、
　前記符号化データを含むビットストリームを生成し、前記ビットストリームに基づいて前記サブフレームの表示タイミングに関する第１の情報を生成するビットストリーム生成部と、
　前記ビットストリームを格納するファイルを生成し、前記ファイルにメタデータとして前記第１の情報を格納するファイル生成部と
　を備える情報処理装置。
　（２２）　前記第１の情報は、前記サンプルの表示タイミングからのオフセットを示すsubframe_time_offsetを含む
　（２１）に記載の情報処理装置。
　（２３）　前記subframe_time_offsetは、符号を含む
　（２２）に記載の情報処理装置。
　（２４）　前記ファイル生成部は、前記ファイルに前記メタデータとして前記サブフレームの表示順に関する第２の情報をさらに格納する
　（２２）または（２３）に記載の情報処理装置。
　（２５）　前記第２の情報は、シーケンス全体での表示順を示すframe numberを含む
　（２４）に記載の情報処理装置。
　（２６）　前記第２の情報は、前記サンプル内での表示順を示すframe indexを含む
　（２４）に記載の情報処理装置。
　（２７）　前記第１の情報は、前記サブフレームの表示順を示す第２の情報と、前記サブフレームの表示期間の長さを示すdurationとを含む
　（２１）乃至（２６）のいずれかに記載の情報処理装置。
　（２８）　前記第２の情報は、シーケンス全体での表示順を示すframe numberを含む
　（２７）に記載の情報処理装置。
　（２９）　前記第２の情報は、前記サンプル内での表示順を示すframe indexを含む
　（２７）に記載の情報処理装置。
　（３０）　前記ファイル生成部は、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報を前記ファイルのSubSampleInformationBoxに格納する
　（２１）乃至（２９）のいずれかに記載の情報処理装置。
　（３１）　前記ファイル生成部は、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報を前記ファイルのSampleGroupBoxに格納する
　（２１）乃至（２９）のいずれかに記載の情報処理装置。
　（３２）　複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成し、
　前記符号化データを含むビットストリームを生成し、前記ビットストリームに基づいて前記サブフレームの表示タイミングに関する第１の情報を生成し、
　前記ビットストリームを格納するファイルを生成し、前記ファイルにメタデータとして前記第１の情報を格納する
　情報処理方法。

　３００　ファイル生成装置，　３１１　コンバインドフレーム生成部，　３１２　抽出部，　３１３　符号化部，　３１４　ビットストリーム生成部，　３１５　ファイル生成部，　３２１　ジオメトリ符号化部，　３２２　アトリビュート符号化部，　３２３　メタデータ生成部，　４００　再生装置，　４１１　ファイル処理部，　４１２　復号部，　４１３　提示情報生成部，　４２１　抽出部，　４３１　ジオメトリ復号部，　４３２　アトリビュート復号部，　４４１　ポイントクラウド構築部，　４４２　提示処理部，　９００　コンピュータ

Claims

　ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、前記サブフレームの表示タイミングに間に合うタイミングで、前記ファイルに格納されるビットストリームから前記サブフレームを含むサンプルを抽出する抽出部と、
　抽出された前記サンプルを復号する復号部と、
　前記第１の情報に基づいて、復号された前記サンプルに含まれる前記サブフレームの表示タイミングに間に合うタイミングで、前記サブフレームのポイントクラウドを構築する構築部と
　を備える情報処理装置。
　前記第１の情報は、前記サンプルの表示タイミングからのオフセットを示すsubframe_time_offsetを含む
　請求項１に記載の情報処理装置。
　前記subframe_time_offsetは、符号を含む
　請求項２に記載の情報処理装置。
　前記ファイルは、前記メタデータとして、前記サブフレームの表示順に関する第２の情報をさらに格納し、
　前記抽出部は、前記第２の情報に示される前記サブフレームの表示順に従って、前記サンプルを抽出する
　請求項２に記載の情報処理装置。
　前記第１の情報は、前記サブフレームの表示順を示す第２の情報と、前記サブフレームの表示期間の長さを示すdurationとを含む
　請求項１に記載の情報処理装置。
　前記第２の情報は、シーケンス全体での表示順を示すframe numberを含む
　請求項５に記載の情報処理装置。
　前記第２の情報は、前記サンプル内での表示順を示すframe indexを含む
　請求項５に記載の情報処理装置。
　前記ファイルは、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報をSubSampleInformationBoxに格納する
　請求項１に記載の情報処理装置。
　前記ファイルは、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報をSampleGroupBoxに格納する
　請求項１に記載の情報処理装置。
　ファイルにメタデータとして格納されるサブフレームの表示タイミングに関する第１の情報に基づいて、前記サブフレームの表示タイミングに間に合うタイミングで、前記ファイルに格納されるビットストリームから前記サブフレームを含むサンプルを抽出し、
　抽出された前記サンプルを復号し、
　前記第１の情報に基づいて、復号された前記サンプルに含まれる前記サブフレームの表示タイミングに間に合うタイミングで、前記サブフレームのポイントクラウドを構築する
　情報処理方法。
　複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成する符号化部と、
　前記符号化データを含むビットストリームを生成し、前記ビットストリームに基づいて前記サブフレームの表示タイミングに関する第１の情報を生成するビットストリーム生成部と、
　前記ビットストリームを格納するファイルを生成し、前記ファイルにメタデータとして前記第１の情報を格納するファイル生成部と
　を備える情報処理装置。
　前記第１の情報は、前記サンプルの表示タイミングからのオフセットを示すsubframe_time_offsetを含む
　請求項１１に記載の情報処理装置。
　前記subframe_time_offsetは、符号を含む
　請求項１２に記載の情報処理装置。
　前記ファイル生成部は、前記ファイルに前記メタデータとして前記サブフレームの表示順に関する第２の情報をさらに格納する
　請求項１２に記載の情報処理装置。
　前記第１の情報は、前記サブフレームの表示順を示す第２の情報と、前記サブフレームの表示期間の長さを示すdurationとを含む
　請求項１１に記載の情報処理装置。
　前記第２の情報は、シーケンス全体での表示順を示すframe numberを含む
　請求項１５に記載の情報処理装置。
　前記第２の情報は、前記サンプル内での表示順を示すframe indexを含む
　請求項１５に記載の情報処理装置。
　前記ファイル生成部は、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報を前記ファイルのSubSampleInformationBoxに格納する
　請求項１１に記載の情報処理装置。
　前記ファイル生成部は、ISOBMFF（International Organization for Standardization Base Media File Format）であり、前記第１の情報を前記ファイルのSampleGroupBoxに格納する
　請求項１１に記載の情報処理装置。
　複数のフレームをサブフレームとして組み合わせたコンバインドフレームをサンプルとして符号化して符号化データを生成し、
　前記符号化データを含むビットストリームを生成し、前記ビットストリームに基づいて前記サブフレームの表示タイミングに関する第１の情報を生成し、
　前記ビットストリームを格納するファイルを生成し、前記ファイルにメタデータとして前記第１の情報を格納する
　情報処理方法。