JP6572222B2

JP6572222B2 - メディアファイルの生成方法、生成装置、及びプログラム

Info

Publication number: JP6572222B2
Application number: JP2016544127A
Authority: JP
Inventors: ドゥヌアルフランク; マゼフレデリック; コンコラトシリル; ルフェーブルジャン
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2014-01-07
Filing date: 2015-01-07
Publication date: 2019-09-04
Anticipated expiration: 2035-01-07
Also published as: JP2017508334A; WO2015104303A2; KR20220034931A; CN105900401A; EP3092796B1; US20160330255A1; US20190014162A1; CN105900401B; EP3713234A1; KR102521495B1; US10320867B2; KR20160105793A; EP3092796A2; WO2015104303A3; US11412017B2

Description

本発明は、一般的には、メディアデータの交換、管理、編集、および提示を容易にする柔軟で拡張可能なフォーマットを提供し、特に圧縮ビデオストリームにおける対象のユーザ選択領域のＨＴＴＰ（ＨｙｐｅｒＴｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）およびＲＴＰ（Ｒｅａｌ−ｔｉｍｅＴｒａｎｓｐｏｒｔＰｒｏｔｏｃｏｌ）ストリーミングに関してストリーム配信を改善するための、たとえば、ＭＰＥＧ標準化機構によって定義されているようなベースメディアファイルフォーマットによるタイムドメディアデータのカプセル化の分野に関する。より詳細には、本発明は、データ、特に１つ以上のタイルの効率的なストリーミングまたは抽出を可能にする空間タイルのような多層分割データを含むエレメンタリストリームのカプセル化において層間依存性を符号化するための方法、デバイス、およびコンピュータプログラムに関する。

ビデオコード化は、一連のビデオ画像を、ビデオ画像を送信または記憶することができるようにコンパクトなデジタル化ビットストリームに変換する方法である。符号化デバイスが使用されてビデオ画像がコード化され、関連する復号デバイスが、表示および閲覧のためにビットストリームを再構築するために利用可能である。一般的な目的は、元のビデオ情報よりもサイズが小さくなるように、ビットストリームを形成することである。これによって、ビットストリームコードを送信または記憶するために必要とされる、伝送ネットワークまたは記憶デバイスの容量が低減される利点がある。送信されるために、ビデオビットストリームは一般的には、ヘッダおよびチェックビットを一般的には追加する送信プロトコルに従ってカプセル化される。ビデオストリーミングメカニズムは、３ＧＰＰの適応ＨＴＴＰストリーミング（ＡＨＳ）、マイクロソフトのＳｍｏｏｔｈＳｔｒｅａｍｉｎｇまたはアップルのＨＴＴＰｌｉｖｅｓｔｒｅａｍｉｎｇのようなＨＴＴＰ（ＨｙｐｅｒＴｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）を介してオーディオ／ビデオメディアをストリーミングするために、インターネットネットワークおよびモバイルネットワーク上に広く配備および使用されている。

最近、ムービングピクチャエキスパートグループ（ＭＰＥＧ）は、ＨＴＴＰを介した既存のストリーミングソリューションを統一し、それらの後継となるための新たな標準を発行した。「ＤｙｎａｍｉｃａｄａｐｔｉｖｅｓｔｒｅａｍｉｎｇｏｖｅｒＨＴＴＰ（ＤＡＳＨ）」と呼ばれるこの新たな基準は、インテリジェンス（すなわち、ストリーミングするためのメディアデータの選択、ならびに、ユーザ選択、ネットワーク状態、およびクライアント機能に対するビットストリームの動的適合）がまったくクライアント選択およびデバイスのみに依拠する、標準的なウェブサーバに基づくＨＴＴＰを介したメディアストリーミングモデルをサポートするように意図されている。

このモデルにおいて、メディアプレゼンテイションは、データセグメント、および、表現されるべきタイムドメディアデータの編成を表す「ＭｅｄｉａＰｒｅｓｅｎｔａｔｉｏｎＤｅｓｃｒｉｐｔｉｏｎ（ＭＰＤ）」と呼ばれるマニフェストにおいて編成される。特に、マニフェストは、データセグメントをダウンロードするためのユーザに対するリソース識別子を含み、有効なメディアプレゼンテイションを得るためにそれらのデータセグメントを組み合わせるためのコンテキストを提供する。リソース識別子は一般的には、バイト範囲と組み合わされる可能性があるＨＴＴＰ−ＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ）である。マニフェストに基づいて、クライアントデバイスは、任意の時点において、その要求、その能力（たとえば、サポートされるコーデック、表示サイズ、フレームレート、品質レベルなど）に従って、ネットワーク状態（たとえば、利用可能な帯域幅）に応じて、いずれのメディアセグメントがメディアデータサーバからダウンロードされるべきであるかを決定する。

ＨＴＴＰに対する代替的なプロトコル、たとえば、Ｒｅａｌ−ｔｉｍｅＴｒａｎｓｐｏｒｔＰｒｏｔｏｃｏｌ（ＲＴＰ）が存在することが留意されるべきである。

加えて、ビデオ解像度は、標準精細度（ＳＤ）から高精細度（ＨＤ）、および超高精細度（たとえば、４Ｋ２Ｋまたは８Ｋ４Ｋ、すなわち、４，０９６×２，４００ピクセルまたは７，６８０×４，３２０ピクセルの画像を含むビデオ）へと向かって絶えず増大している。しかしながら、特にビデオが超高精細度であるとき、すべての受信およびビデオ復号デバイスが、フル解像度におけるビデオにアクセスするためのリソース（たとえば、ネットワークアクセス帯域幅またはＣＰＵ（中央処理装置））を有しているわけではなく、すべてのユーザがそのようなビデオにアクセスする必要があるわけではない。そのようなコンテキストにおいて、特に、いくつかの関心領域（ＲＯＩ）のみにアクセスする、すなわち、ビデオシーケンス全体のうちのいくつかの空間下位区分のみにアクセスする能力を提供することは特に利点がある。

ビデオに属するフレームの空間サブパートにアクセスするための既知のメカニズムは、ビデオの各フレームを、一般的にはタイルと称される、独立して復号可能な空間領域の配列として編成することに存する。ＳＶＣ（ＳｃａｌａｂｌｅＶｉｄｅｏＣｏｄｉｎｇ）またはＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）のようないくつかのビデオフォーマットが、タイル定義に対するサポートを提供する。ユーザ定義のＲＯＩは、１つまたはいくつかの連続したタイルをカバーし得る。

したがって、ＨＴＴＰプロトコルに従って、ユーザ選択のＲＯＩをストリーミングするためには、１つ以上のタイルへの空間アクセスを可能にするとともに、アクセスされるタイルの組み合わせを可能にするように、符号化ビデオビットストリームのタイムドメディアデータのカプセル化を可能にすることが重要である。

符号化ビデオビットストリームは一般的には完全なフレームに対応する連続した時間サンプルのセットとして構成され、時間サンプルは、復号順序に応じて編成されることを想起されたい。そのような符号化ビデオビットストリームをカプセル化および記述するためのファイルフォーマットが使用される。

実例として、国際標準化機構ベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）が、ネットワークまたは別のビットストリーム配信メカニズムを介してローカル記憶または送信のいずれかのために符号化タイムドメディアデータビットストリームを記述する既知の柔軟で拡張可能なフォーマットである。このファイルフォーマットはオブジェクト指向型である。これは、連続的にまたは階層的に編成され、タイミングおよび構造パラメータのような符号化タイムドメディアデータビットストリームのパラメータを定義する、ボックスと呼ばれる構成ブロックから構成される。このファイルフォーマットによれば、タイムドメディアデータビットストリームは、トラックボックスと称される別のデータ構造において定義されるｍｄａｔボックスと称されるデータ構造内に含まれる。トラックは、サンプルが、単一のタイムスタンプと関連付けられたすべてのデータ、すなわち、単一のフレームと関連付けられたすべてのデータ、または、同じタイムスタンプを共有するいくつかのフレームと関連付けられたすべてのデータに対応するタイムドサンプルシーケンスを表す。

ＳＶＣフォーマットのビデオのようなスケーラブルビデオについて、各トラックが特定のスケーラビリティレベルにおいてビデオを表現する、複数の依存トラックを使用することによって層状メディアデータ編成が効率的に表現され得る。トラック間のデータ重複を回避するために、抽出器が使用され得る。標準的なファイルフォーマットによれば、抽出器は、他のビットストリームからのネットワーク抽象化層（ＮＡＬ）ユニットの効率的な抽出を可能にする、ビットストリーム内に直に含まれるデータ構造である。たとえば、エンハンスメントレイヤトラックのビットストリームは、ベースレイヤトラックからのＮＡＬユニットを参照する抽出器を含みんでも良い。その後、そのようなエンハンスメントレイヤトラックがそのファイルフォーマットから抽出されると、抽出器は、それらが参照しているデータに置き換えられなければならない。

副情報を記述し、この副情報へのアクセスを容易にするか、または、ビットストリームを複数のセグメントに効率的に編成するために、これらのメカニズムを組み込んでいるＩＳＯＢＭＦＦを使用するときにいくつかの戦略を採用することができる。

たとえば、「ＩｍｐｌｉｃａｔｉｏｎｓｏｆｔｈｅＩＳＯＢａｓｅＭｅｄｉａＦｉｌｅＦｏｒｍａｔｏｎＡｄａｐｔｉｖｅＨＴＴＰＳｔｒｅａｍｉｎｇｏｆＨ．２６４／ＳＶＣ」と題する論文において、著者Ｋｏｆｌｅｒ他は、ＩＳＯＢＭＦＦの可能性および制限を考慮してＨＴＴＰストリーミングのためのスケーラブルビデオビットストリーム（Ｈ２６４／ＳＶＣ）を編成するための３つの異なる戦略を提示している。
ａ）すべてのＩＳＯＢＭＦＦメタデータ（トラック定義を含む）を含むファイルタイプボックス「ｆｔｙｐ」および動画ボックス「ｍｏｏｖ」を含む特定のファイルヘッダを含む単一のファイル、この単一のファイルは、符号化ビデオビットストリーム全体を含む単一のｍｄａｔボックスをも含む。この編成は、ローカル記憶には適しているが、クライアントがビデオビットストリーム全体のうちの一部分を必要とするであろう場合があるＨＴＴＰストリーミングには適合していない。
ｂ）フラグメンテーションに適した複数のｍｏｏｆ／ｍｄａｔボックスを含む単一のファイル。このフォーマットはプログレシブダウンロードを可能にする。ｍｏｏｆボックスは、フラグメントレベルにおいてはｍｏｏｖボックスと等価である。この方式によれば、フラグメント化メディアファイルを使用して、スケーラブルビデオビットストリームが、異なるスケーラビリティレベルにおいてビデオを表現する複数の依存トラックに分割される。他のトラックからのＮＡＬユニットを参照するために抽出器が使用される。タイルごとのトラックが使用される場合、すべてのアドレス指定可能なトラックが前もって準備される必要があり、トラックを独立して選択することはできない。いくつかのタイルを表示する必要がある場合、いくつかのビットストリームが復号されなければならず、ベースレイヤが数回復号される。
ｃ）複数のセグメントファイル、各ファイルはそれ自体のＵＲＬによってアクセス可能であり、独立してダウンロード可能である。各セグメントは一般的には、一種のファイルヘッダとして作用するセグメントタイプボックス（ｓｔｙｐ）、任意選択のセグメントインデックスボックス（ｓｉｄｘ）および１つ以上のフラグメントから構成される。ここでも、各フラグメントはｍｏｏｆおよびｍｄａｔボックスから構成される。この方式によれば、フラグメント化メディアファイルを使用して、各トラックがそれ自体のセグメント内に記憶され、関連するビットストリームが１つのスケーラビリティレベルに関連している。必要ならば、依存トラックからの必要とされるビットストリームを参照するために抽出器が使用される。そのようなコード化方式は、トラックを独立してストリーミングするのに特に適している。それはＤＡＳＨ規格によく適合しているが、いくつかのビットストリームを復号する必要があり、したがって、トラックあたり１つの復号器が必要とされるため、タイルストリーミングには適合していない。その上、２つ以上のタイルを選択するとき、ベースレイヤのビットストリームが重複する可能性がある。

空間タイルに適用されるとき、これらの戦略はいずれも、ＨＴＴＰストリーミングの文脈において特定のファイルに対する効率的なアクセスを可能にしない。実際、既存のファイルフォーマットの定義によれば、ある時間間隔に対応するいくつかのフレームの空間タイルを表示するためには、依然として符号化ビデオビットストリームにおける複数の非連続的なバイト範囲にアクセスする必要があるか、または、結果としてビットストリームが重複することになる。

これらの問題を解決するために、いずれのトラック組み合わせがクライアントアプリケーションによって選択されようとも、ＩＳＯＢＭＦＦ構文解析の結果が常に、低記述オーバヘッドを必要とするビデオ復号器にとって有効なビデオエレメンタリビットストリームをもたらすことを保証する、多層ビデオストリーム内の空間タイルを処理するのに適切な、効率的なデータ編成およびトラック記述方式が提供される。

本出願に係るメディアファイルの生成方法は、例えば、以下のように表現されうる。すなわち、ビデオデータを取得し、前記取得されたビデオデータに基づいて１又は複数のビデオトラックを生成し、前記１又は複数のビデオトラックの少なくとも１つに対応する空間領域に関連付けられる記述パラメータであって、セットされたときは、当該記述パラメータに関連付けられている空間領域が完全なピクチャであることを示す記述パラメータを生成し、前記記述パラメータがセットされない空間領域のためのパラメータとして、前記空間領域により表される矩形領域の左上画素の水平及び垂直方向のオフセットパラメータを生成し、前記生成された１又は複数のビデオトラックと、前記生成された記述パラメータ及びオフセットパラメータのうち少なくとも何れかと、に基づいて、１又は複数のメディアファイルを生成する。

本発明のさらなる利点は、図面および詳細な説明を精査すれば、当業者には明らかになろう。任意の追加の利点が本明細書に組み込まれることが意図されている。

ここで、本発明の実施形態が、例としてのみ、添付の図面を参照して説明される。
（１ａ）、（１ｂ）、および（１ｃ）を含む図１は、ＨＥＶＣビットストリーム内のタイルおよびスライスセグメントの例を示す。（２ａ）および（２ｂ）を含む図２は、複数のトラックにおけるタイルのカプセル化の例を示す。（３ａ）、（３ｂ）、および（３ｃ）を含む図３は、ＨＥＶＣスケーラブルビットストリームの構成の種々の例を示す。図４は、表示されるべきユーザによって選択されたタイルの時間パイプを示す。図５は、多層ＨＥＶＣ方式を使用しながらの、ビデオデータを符号化するための基準ピクチャセットの使用を示す。（６ａ）、（６ｂ）、（６ｃ）、および（６ｄ）を含む図６は、種々のタイプの層間タイル予測を示す。図７は、層間依存性記述を可能にするタイル記述子の一例を示す。（８ａ）および（８ｂ）を含む図８は、それぞれ、他方のタイルに対する復号依存性の記述を可能にする、本発明の特定の実施形態に従って変更されている単一層タイル記述子、および、タイルセット記述子を示す。図９は、多層タイル化のタイルセット記述子の一例を示す。図１０は、タイルトラックにおける層間依存性のシグナリングの一例を示す。図１１は、ＨＥＶＣビットストリームをベーストラックおよび独立したタイルトラックを含むトラックセットとしてのカプセル化する一例を示す。図１２は、４つのタイルを含むＨＥＶＣビットストリームの事例におけるトラック間の依存性の簡略化された概略図を示しており、各タイルは別個のタイルトラック内に記憶されている。図１３は、ベースレイヤおよびエンハンスメントレイヤを含むスケーラブルＨＥＶＣビットストリームの事例におけるトラック間の依存性の簡略化された概略図を示しており、ベースレイヤおよびエンハンスメントレイヤはタイル化されている。図１４は、再帰抽出器が使用されるときの、ベースレイヤおよびエンハンスメントレイヤを含むスケーラブルＨＥＶＣビットストリームの事例におけるトラック間の依存性の簡略化された概略図を示しており、ベースレイヤおよびエンハンスメントレイヤはタイル化されている。図１５は、多層タイル化ビデオビットストリームを効率的にカプセル化するためにサーバデバイスにおいて実行することができるステップの一例を示す。図１６は、符号化多層タイル化ビデオビットストリームをカプセル開放するためにビットストリーム読み取り器において実行することができるステップの一例を示す。図１７は、再帰抽出器を含むトラックからビデオデータを抽出するためのアルゴリズムの一例を示す。図１８は、１つ以上の実施形態のステップを実施することができるサーバまたはクライアントデバイスのブロック図を示す。

ある特定の実施形態によれば、タイムドサンプル（たとえば、画像）を含む多層タイル化タイムドメディアデータ（たとえば、スケーラブルタイル化ビデオデータ）のような多層分割タイムドメディアデータが、いくつかのタイムドメディアデータトラック、一般的にはベーストラックおよびタイルトラック、よりなるセットとして送信される。またある特定の実施形態によれば、ベーストラックは、ベースレイヤベーストラックおよび少なくとも１つのエンハンスメントレイヤベーストラックを含み、前記タイルトラックは、ベースレイヤタイルトラックおよびエンハンスメントレイヤタイルトラックを含む。各タイムドメディアデータトラックは、いくつかのタイムドサンプルの１つの空間サブサンプル（たとえば、いくつかのＮＡＬユニット）を含む。トラック依存性（タイル化、層間および／または層内依存性）を記述するために、抽出器が使用される。そのようなタイムドメディアデータトラックセットが、多層空間ビデオタイルの選択、構成、および効率的なストリーミングを可能にする。各トラックは、メディアセグメントファイルのセットとしてサーバデバイスからクライアントデバイスへと送信することができる。初期化セグメントファイルを使用して、メディアセグメントファイルを復号するために必要とされるメタデータを送信することができる。

これらの記述は層依存性記述とは別個に考慮され、それによって、経時的な依存性の変化は、タイル化および依存性全体が再び記述されることを必要としないという利点がある。層間依存性は、抽出器、特に再帰抽出器を使用して符号化することができ、再帰は、依存性宣言によって制御される。

本発明のある実施形態は、たとえば、ＨＥＶＣとして知られているビデオフォーマットに適用することができる。

ＨＥＶＣ規格によれば、画像を、タイル、スライス、およびスライスセグメントへと空間的に分割することができる。この規格において、タイルは、水平および垂直境界（すなわち、行および列）によって画定される画像の矩形領域に対応する。これは、整数個のコード化ツリーユニット（ＣＴＵ）を含む。それゆえ、タイルは、たとえば、関心領域の位置およびサイズを定義することによって、関心領域を識別するのに効率よく使用することができる。しかしながら、ＨＥＶＣビットストリームの構造およびネットワーク抽象化層（ＮＡＬ）ユニットとしてのそのカプセル化は、タイルに関連して編成されず、スライスに基づく。

ＨＥＶＣ規格において、スライスはスライスセグメントのセットであり、スライスセグメントのセットのうちの第１のスライスセグメントは独立したスライスセグメント、すなわち、ヘッダ内に記憶されているその一般的な情報が別のスライスセグメントのものを参照しないスライスセグメントである。スライスセグメントセットの他のスライスセグメントは、存在する場合、依存スライスセグメント（すなわち、ヘッダ内に記憶されているその一般的な情報が別のスライスセグメントのうちの１つを参照するスライスセグメント）である。

スライスセグメントは、整数個の連続した（ラスタ走査順の）コード化ツリーユニットを含む。それゆえ、スライスセグメントは、矩形形状のものとすることができるか、またはそうでなくてもよく、そのため、関心領域を表現するのに適していない。これは、スライスセグメントデータが後続するスライスセグメントヘッダについてＨＥＶＣビットストリーム内に符号化される。独立スライスセグメントと依存スライスセグメントとは、それらのヘッダが異なっており、依存スライスセグメントは独立スライスセグメントに依存するため、そのヘッダの情報量が独立スライスセグメントのものよりも小さい。独立スライスセグメントおよび依存スライスセグメントは両方とも、タイルを定義するために、または、エントロピー復号同期点として使用される、対応するビットストリーム内のエントリポイントのリストを含む。

（１ａ）、（１ｂ）、および（１ｃ）含む図１は、タイルおよびスライスセグメントの例を示す。より正確には、（１ａ）は、垂直境界１０５−１および１０５−２ならびに水平境界１１０−１および１１０−２によって９つの部分に分割されている画像（１００）を示す。１１５−１〜１１５−９として参照されている９つの部分の各々が、ある特定のタイルを表す。

（１ｂ）は、垂直境界１０５’によって区切られている２つの垂直タイルを含む画像（１００’）を示す。画像１００’は、５つのスライスセグメント、すなわち、１つの独立スライスセグメント１２０−１（斜線によって表されている）および４つの依存スライスセグメント１２０−２〜１２０−５を含む単一のスライス（参照符号なし）を含む。

（１ｃ）は、垂直境界１０５’’によって区切られている２つの垂直タイルを含む画像（１００’’）を示す。左タイルは２つのスライス、すなわち、１つの独立スライスセグメント（１２０’−１）および１つの依存スライスセグメント（１２０’−２）を含む第１のスライス、ならびに、１つの独立スライスセグメント（１２０’−３）および１つの依存スライスセグメント（１２０’−４）を含む第２のスライスを含む。右タイルは、１つの独立スライスセグメント（１２０’−５）および１つの依存スライスセグメント（１２０’−６）を含む１つのスライスを含む。

ＨＥＶＣ規格によれば、スライスセグメントは、以下のように要約することができる規則に従ってタイルにリンクされる（一方または両方の条件が満たされなければならない）：
スライスセグメント内のすべてのＣＴＵが同じタイルに属する（すなわち、スライスセグメントはいくつかのタイルに属することはできない）；および、
タイル内のすべてのＣＴＵが同じスライスセグメントに属する（すなわち、いくつかのスライスセグメントの各々がそのタイルのみに属することを条件として、タイルはこれらのいくつかのスライスセグメントに分割しても良い）。

明瞭にするために、以下において、１つのタイルが１つの独立スライスセグメントのみを有する１つのスライスを含むとする。しかしながら、本発明の実施形態は、（１ｂ）および（１ｃ）に示すもののような他の構成によって実行されてもよい。

上述したように、タイルは関心領域のための適切なサポートと考えることができるが、スライスセグメントは、通信ネットワークにわたる搬送のためにＮＡＬユニット内に実際に置かれ、アクセスユニット（すなわち、ファイルフォーマットレベルにおけるコード化ピクチャまたはサンプル）を形成するために集約されるエンティティである。

ＨＥＶＣ規格によれば、このタイプのＮＡＬユニットは、以下のように定義することができる２バイトのＮＡＬユニットヘッダ内に符号化されることを想起されたい。
ｎａｌ＿ｕｎｉｔ＿ｈｅａｄｅｒ（）｛
ｆｏｒｂｉｄｄｅｎ＿ｚｅｒｏ＿ｂｉｔ
ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ
ｎｕｈ＿ｌａｙｅｒ＿ｉｄ
ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１
｝
スライスセグメントをコード化するために使用されるＮＡＬユニットは、スライスセグメントアドレス構文要素によってスライスセグメント内の最初のＣＴＵのアドレスを示すスライスセグメントヘッダを含む。そのようなスライスセグメントヘッダは以下のように定義することができる。
ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒ（）｛
ｆｉｒｓｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｉｎ＿ｐｉｃ＿ｆｌａｇ
ｉｆ（ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ＞＝ＢＬＡ＿Ｗ＿ＬＰ＆＆ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ＜＝ＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３）
ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇ
ｓｌｉｃｅ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ
ｉｆ（！ｆｉｒｓｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｉｎ＿ｐｉｃ＿ｆｌａｇ）｛
ｉｆ（ｄｅｐｅｎｄｅｎｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）
ｄｅｐｅｎｄｅｎｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｆｌａｇ
ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ａｄｄｒｅｓｓ
｝
Ｉｆ（！ｄｅｐｅｎｄｅｎｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｆｌａｇ）｛
［…］
タイル化情報は、ＰＰＳ（ピクチャパラメータセット）ＮＡＬユニットにおいて提供される。その後、スライスセグメントとタイルとの間の関係をこれらのパラメータから差し引くことができる。

空間予測は（定義により）タイル境界上でリセットされるが、タイルが基準フレーム内の異なるタイルからの時間予測器を使用することを妨げるものはない。したがって、独立タイルを構築するために、符号化中、予測ユニットの運動ベクトルは、基準フレーム内の共在するタイル内にあるままにするために、タイル内部に制約されるという利点がある。加えて、１つのみのタイルを複合しているときにエラードリフトが導入されないように、タイル境界上ではインループフィルタ（非ブロック化およびサンプル適応オフセット（ＳＡＯ）フィルタ）は機能停止されていることが好ましい。そのようなインループフィルタの制御はＨＥＶＣ規格において利用可能であることが留意されるべきである。これは、スライスセグメントヘッダ内でｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇとして知られているフラグによって設定される。このフラグを明確にゼロに設定することによって、タイル境界にある画素が、隣接するタイルの境界にかかる画素に依存することはできない。運動ベクトルおよびインループフィルタに関係するこれら２つの条件が満たされるとき、タイルは「独立復号可能タイル」または「独立タイル」と考えることができる。

ビデオビットストリームが独立タイルのセットとして符号化されると、これはその後、基準データの喪失および再構築エラーの伝播の一切の危険性なしにフレームごとのタイルベースの復号を可能にする。したがって、この構成は、たとえば、図４に示す関心領域（タイル３および７を含む）に対応する可能性がある元のビデオの空間部分のみを再構築することを可能にする。そのような構成は、タイルベースの復号が信頼できることを示すように、ビデオビットストリーム内の補足情報として示すことができる。

ＭＰＥＧ−４Ｐａｒｔ１２規格の既存のサンプルグループ化メカニズムを使用して、タイルをカプセル化することができる。したがって、特定の種類の標準的なＶｉｓｕａｌＳａｍｐｌｅＧｒｏｕｐＥｎｔｒｙ記述子であるタイル記述子を用いて、特定のサンプルグループ記述が作成される。サンプルグループ化メカニズムは、トラック内のサンプルの区切りを表現するのに使用される。それらは、２つのボックス、すなわち、サンプルのサンプルグループへの割り当てを記述するＳａｍｐｌｅＴｏＧｒｏｕｐボックス（「ｓｂｇｐ」）と、特定のサンプルグループ内のサンプルの共通の特性を記述するＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎボックス（「ｓｇｐｄ」）とを使用することに依拠する。特定のタイプのサンプルグループ化は、タイプフィールド（「ｇｒｏｕｐｉｎｇ＿ｔｙｐｅ」）を介して１つのＳａｍｐｌｅＴｏＧｒｏｕｐボックスと１つのＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎボックスとを組み合わせることによって定義される。種々のグループ化基準に基づいて、複数のグループ化インスタンス（すなわち、ＳａｍｐｌｅＴｏＧｒｏｕｐボックスとＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎボックスとの組み合わせ）が存在する可能性がある。

サンプルのタイル化に関係付けられる特定のグループ化基準が使用される。「ｔｒｉｆ」と呼ばれるこの特定のグループ化タイプは、タイルの特性を記述し、標準的なＶｉｓｕａｌＳａｍｐｌｅＧｒｏｕｐＥｎｔｒｙから導き出される。これは、ＴｉｌｅＲｅｇｉｏｎＳａｍｐｌｅＧｒｏｕｐＥｎｔｒｙとして参照することができ、以下のように定義される。
ｃｌａｓｓＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ（）ｅｘｔｅｎｄｓＶｉｓｕａｌＳａｍｐｌｅＧｒｏｕｐＥｎｔｒｙ（‘ｔｒｉｆ’）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｇｒｏｕｐＩＤ；
ｕｎｓｉｇｎｅｄｉｎｔ（２）ｉｎｄｅｐｅｎｄｅｎｔ；
ｕｎｓｉｇｎｅｄｉｎｔ（６）ｒｅｓｅｒｖｅｄ＝０；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｈｏｒｉｚｏｎｔａｌ＿ｏｆｆｓｅｔ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｖｅｒｔｉｃａｌ＿ｏｆｆｓｅｔ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｒｅｇｉｏｎ＿ｗｉｄｔｈ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｒｅｇｉｏｎ＿ｈｅｉｇｈｔ；
｝

この特定のタイプのグループエントリによれば、パラメータｇｒｏｕｐＩＤは、グループによって記述されるタイルの固有の識別子である。パラメータｈｏｒｉｚｏｎｔａｌ＿ｏｆｆｓｅｔおよびｖｅｒｔｉｃａｌ＿ｏｆｆｓｅｔはそれぞれ、基本領域の輝度サンプルにおける、ＨＥＶＣフレームの左上画素に対する、タイルによって表現される矩形領域の左上画素の水平および垂直オフセットを設定するのに使用される。パラメータｒｅｇｉｏｎ＿ｗｉｄｔｈおよびｒｅｇｉｏｎ＿ｈｅｉｇｈｔはそれぞれ、ＨＥＶＣフレームの輝度サンプルにおける、タイルによって表現される矩形領域の幅および高さを設定するのに使用される。パラメータｉｎｄｅｐｅｎｄｅｎｔは、タイルが、上述したように独立タイルの定義を参照することによって、サンプルタイルのみに属するサンプルに関係する復号依存性を含むことを指定する２ビット語である。実例として、またタイル編成を記述するためのＳＥＩメッセージ（補足強化情報）の標準的な使用を参照して、ｔｉｌｅ＿ｓｅｃｔｉｏｎ＿ｅｘａｃｔ＿ｍａｔｃｈ＿ｆｌａｇとして知られるフラグを使用して、独立フラグの値を設定することができ、その意味は以下のように設定することができる。
−パラメータｉｎｄｅｐｅｎｄｅｎｔが０に等しい場合、このタイルと同じフレームまたは先行するフレーム内の他のタイルとの間のコード化依存性は、タイルセットレベルにおいて記述されているかまたは分からないかのいずれかである；
−パラメータｉｎｄｅｐｅｎｄｅｎｔが１に等しい場合、このタイルと任意の基準フレーム内の異なるｇｒｏｕｐＩＤを有する他のタイルとの間の時間コード化依存性はないが、このタイルと、基準フレーム内の同じｇｒｏｕｐＩＤを有するタイルとの間にはコード化依存性がある可能性がある、および、
−パラメータｉｎｄｅｐｅｎｄｅｎｔが２に等しい場合、このタイルと同じフレーム内の他のタイルとの間にコード化依存性はなく、また、このタイルと基準フレーム内の任意の他のタイルとの間にコード化依存性はなく、
ｉｎｄｅｐｅｎｄｅｎｔパラメータ値３は予約されている。

任意に、タイルあたりの平均ビットレートを記述するパラメータは、ＭＰＥＧ４ＢｉｔＲａｔｅＢｏｘを用いて、タイル記述子において、または、タイルサンプルエントリ、たとえば、４文字コード「ｈｖｔ１」によって表される、特定のＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙであるＨＥＶＣＴｉｌｅＳａｍｐｌｅＥｎｔｒｙ２０５を記述するｍｐ４ボックスにおいて設定することができる。帯域幅に基づく適合のためにストリーミングクライアントに提供されるように、このボックス内にタイルごとのビットレート情報を記憶することが有用であり得る。ほとんどのｍｐ４ボックスに関して、ＨＥＶＣＴｉｌｅＳａｍｐｌｅＥｎｔｒｙボックスは、用途特有の必要性に合致するために、任意の追加のボックスを用いて拡張することができる。

各タイルの特性は、各タイルトラックについて、「ｔｒｉｆ」ｇｒｏｕｐｉｎｇ＿ｔｙｐｅおよびＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙを有する１つのＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎボックス（「ｓｇｐｄ」）を定義することによって動画ヘッダ（「ｍｏｏｖ」ボックス）内で一度与えられる。タイル特性はまた、トラックフラグメントごとに定義することもできる。そのようなｍｐ４トラックは、ビデオタイルトラックまたはタイルトラックとして定義することができる。ＨＥＶＣ規格によれば、ＨＥＶＣタイルトラックは、このトラック内のタイル（複数可）が属するＨＥＶＣ層の他のＮＡＬＵ（一般的には、様々なパラメータセットのようなセットアップ情報）を搬送するＨＥＶＣトラックに対する基準がそれについて存在する、ビデオタイルトラックである。この基準は、タイルベーストラックを示すために、「ｓｂａｓ」４文字コード、または、「ｔｂａｓ」のようなより特定的なコードのような、ＭＰＥＧ−４Ｐａｒｔ１５規格においてすでに定義されている値を使用することができる。

１つのタイルトラックは一つのそして一つだけのＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ（（８ａ）に示す）を有し、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙを有しないか、または、一つだけのＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ、および、そこからこのタイルセットが作成される１つ以上の依存性ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙを有するかのいずれかであるべきであり、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙは、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙの、記述されているタイルのセットへの拡張である。これらのグループの各々には、ＮＡＬＵをグループに関連付けるために使用することができる一意の識別子が割り当てられることが留意されるべきである。タイル領域およびタイルセットは、「ｔｂａｓ」トラック基準によって示されるように、基本ＨＥＶＣ層によってスコープされる、ｇｒｏｕｐＩＤに対する同じ名前空間を共有する（すなわち、同じベースレイヤを有する任意のトラック内に、同じｇｒｏｕｐＩＤを有する２つのタイル領域またはタイルセットがあるべきではない）。

（２ａ）および（２ｂ）を含む図２は、複数のトラックにおけるタイルのカプセル化の例を示す。

（２ａ）は、タイル構成の例を示す。実例として、これは、４つのタイル（タイル１〜タイル４）を含み、各タイルのサイズは、３１０ピクセル幅および２５６ピクセル高さである。

（２ｂ）は、（２ａ）において表現されている４つのタイルの、ＭＰＥＧ−４ファイルフォーマットによる独立トラックへのカプセル化の一例を示す。図示されているように、各タイルはそれ自体のトラック内にカプセル化され、効率的なデータアドレス指定が可能になり、結果として、５つのトラック、すなわち、各タイルをカプセル化するための、２０１、２０２、２０３、および２０４として参照される４つのタイルトラックならびにすべてのタイルトラックに共通の１つのパラメータセットトラック２１０（本明細書においてはベーストラックとも称する）としてビデオがカプセル化されることになる。

各タイルトラック（２０１、２０２、２０３、および２０４）の記述は、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙボックス２０６のようなＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙボックス（「ｔｒｉｆ」参照によって識別される）に基づく。

ここで、「ｔｒｉｆ」ボックスは、タイルトラックのすべてのサンプルを、適切なＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙまたはＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙに関連付けるために、デフォルトサンプルグループ化メカニズム（図面においてはｄｅｆ＿ｓａｍｐｌｅ＿ｄｅｓｃｒ＿ｉｎｄｅｘ＝１と表記されている属性ｄｅｆａｕｌｔ＿ｓａｍｐｌｅ＿ｄｅｓｃｒｉｐｔｉｏｎ＿ｉｎｄｅｘ＝１）を用いる）を使用する。たとえば、タイル１に対応するＮＡＬユニット２２１は、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙボックス２０６内のトラック１（２０１として参照される）に記述されている。

ここで、所与のトラック内のすべてのサンプルがこのトラックによって記述されるタイルにマッピングするので、ＮＡＬＵＭａｐＥｎｔｒｙ記述子は必要ない。参照符号２２１および２２２はそれぞれ、時間１から時間Ｓまで（メディアファイルまたはトラックフラグメントの場合のメディアセグメントの継続時間）のタイル１およびタイル４のデータを含むデータチャンクを示す。

実際には、トラックサンプルは、この実施形態によれはタイルサンプルであるので、従来のビデオサンプルではなく、タイルトラック内に記憶されているサンプルはＩＳＯ／ＩＥＣ２３００８−２（ＨＥＶＣ）において定義されているような、１つ以上のタイルのスライスの完全なセットである。これは、パラメータセット、ＳＥＩメッセージ、および他の非ＶＣＬＮＡＬユニットを除外する。タイルトラック内に記憶されているＨＥＶＣサンプルは、サンプル内に含まれるコード化スライスが瞬時復号リフレッシュ（ＩＤＲ）スライス、クリーンランダムアクセス（ＣＲＡ）スライス、またはブロークンリンクアクセス（ＢＬＡ）スライスであることをサンプル内のＶＣＬＮＡＬユニットが示す場合、ｓｙｎｃサンプルとして考えられる。そのため、それらは従来のサンプルと同じサイズを有せず、（２ａ）の例によれば、従来のＨＥＶＣサンプルは、６４０×５１２ピクセルのサイズを有し、一方、ここでは、各タイルトラック内に記憶されているＨＥＶＣサンプルは、３２０×２５６ピクセルのサイズを有する。構文解析時間における曖昧さを回避するために、タイルサンプルは新たなタイプのＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙ記述子、すなわち、トラック１と関連付けられているＨＥＶＣＴｉｌｅＳａｍｐｌｅＥｎｔｒｙ記述子２０５（４文字コード「ｈｖｔ１」を用いて示されている）のような、ＨＥＶＣＴｉｌｅＳａｍｐｌｅＥｎｔｒｙ記述子を用いてシグナリングされる。

正式には、ＨＥＶＣビデオトラックのサンプルエントリは、各トラックヘッダのサンプル記述ボックス内で宣言されているＨＥＶＣＳａｍｐｌｅＥｎｔｒｙである。ここで、同じビデオストリームを表現する複数のトラックが使用されているので、各タイルトラックは、トラック内のサンプルが完全なビデオストリームの下位部分の実際のサンプルであるという指示を含み、これらのサンプルがＨＥＶＣＴｉｌｅＳａｍｐｌｅＥｎｔｒｙタイプ（各トラックのサンプル記述ボックス「ｓｔｓｄ」内の各「ｈｖｔ１」ボックス）のサンプルであることが示される。このとき、タイルトラックの復号はいかなるレイアウト操作も含まず、タイルは、すべてのタイルが復号された場合のように、ビデオ復号器メモリ内の同じ場所に復号される。このとき、タイルトラックのトラックヘッダ内のレイアウト情報は、「ｔｂａｓ」トラック基準タイプによって示されるような関連するベーストラックのトラックヘッダ情報と同一に設定される。そうでなければ、タイルトラックは無視されるべきである。加えて、タイルトラック内の視覚情報は、その関連するベーストラック内の視覚情報と異ならない。特に、サンプル記述におけるクリーンアパーチャボックス「ｃｌａｐ」またはピクセルサンプルアスペクト比「ｐａｓｐ」のような情報を再定義する必要はない。

サンプル記述タイプ「ｈｖｔ１」について、タイルトラック内のサンプルまたはサンプル記述ボックスのいずれも、ＰＳ、ＳＰＳまたはＰＰＳＮＡＬユニットを含み得ない。これらのＮＡＬユニットは、スケーラビリティの事例において、または、（２ｂ）の専用トラック２１０のような専用トラックにおいてベースレイヤ（トラック基準によって識別されるような）を含むトラックのサンプルまたはサンプル記述ボックス内になければならない。

通常のＨＥＶＣサンプルにたいして定義されているサブサンプルおよびサンプルグループ化は、ＨＥＶＣタイルサンプルにたいして同じ定義を有する。パラメータセット／ベーストラック２１０とタイルトラックとの間の依存性は、２１１によって参照されるタイプ「ｓｃａｌ」（または抽出器ベースのタイル化依存性をシグナリングする任意の他の４バイトコード）のトラック基準ボックス「ｔｒｅｆ」を使用して記述されることが好ましい。
ＨＥＶＣビデオコード化規格は、マルチビューまたはスケーラブル用途のための多層ビデオ符号化をサポートする。この事例において、所与の層を、１つ以上の他の層に対する基準データとして使用することができる。

（３ａ）、（３ｂ）、および（３ｃ）を含む図３は、ＨＥＶＣスケーラブルビットストリームの構成の種々の例を示す。

（３ａ）は、ベースレイヤ３００およびエンハンスメントレイヤ３０５を含む空間スケーラブルビデオビットストリームの例である。エンハンスメントレイヤ３１０はベースレイヤ３００に応じて符号化される。そのようなビデオビットストリームフォーマットにおいては、ベースレイヤおよびエンハンスメントレイヤのいずれもタイルを含まないため、ピクチャからピクチャへの依存関係が存在する。

（３ｂ）は、ベースレイヤ３１０およびエンハンスメントレイヤ３１５を含むスケーラブルビデオビットストリームの別の例を示す。この例によれば、エンハンスメントレイヤ３１５は、特にタイル３２０を含むタイル化エンハンスメントレイヤである。そのようなビデオビットストリームフォーマットにおいては、エンハンスメントレイヤのタイルがベースレイヤに依存するため、タイルからピクチャへの依存性が存在する。

（３ｃ）はさらに、ベースレイヤ３２５およびエンハンスメントレイヤ３３０を含むスケーラブルビデオビットストリームの別の例を示す。この例によれば、ベースレイヤ３２５は、特にタイル３３５および３４０を含むタイル化ベースレイヤであり、エンハンスメントレイヤ３３０は、特にタイル３４５およびタイルセット３５０を含むタイル化エンハンスメントレイヤである。ベースレイヤ３２５は、エンハンスメントレイヤ３３０によって空間的に強化することができる。そのようなビデオビットストリームフォーマットにおいては、エンハンスメントレイヤのタイルがベースレイヤのタイルに依存するため、タイルからタイルへの依存性が存在する。エンハンスメントレイヤのタイルセットがベースレイヤのタイルに依存するため、タイルセットからタイルへの依存性も存在する。実例として、タイル３４５はタイル３４０に依存し、タイルセット３５０はタイル３３５に依存する。タイルからタイルセットへの依存性またはタイルセットからタイルセットへの依存性のような他の依存性が存在する場合がある。

タイル化されている場合があり、またはされていない場合があるベースレイヤの上に、タイル化されている場合があり、またはされていない場合があるＳＮＲスケーラブル層に対する同様な構成が存在することが留意されるべきである。

図４は、提示されるべきユーザによって選択されるタイルの時間パイプを示す。より正確には、図４は、第１のビデオフレームｎおよび第２のビデオフレームｎ＋ｍ（ｎおよびｍは整数値）を表し、第１のビデオフレームおよび第２のビデオフレームの各々は、１〜１２の番号を付された１２個のタイルを含む。実例として、これらの１２個のタイルの間で、第３のタイルおよび第７のタイルのみを表示するものとする（太い線で示す）。ビデオフレームｎおよびｎ＋ｍは、ある期間に対応する一連の連続したフレームに属する。それゆえ、フレームｎ〜フレームｎ＋ｍからの各フレームの第３のタイルおよび第７のタイルが連続して表示される。

一方、標準ｍｐ４ファイルフォーマットに適合するビデオビットストリームのデータは、全フレームに対応する時間サンプルとして編成される。したがって、図４を参照して上述したように所与の期間の間にこれらのフレームの特定の空間領域がアクセスされるものとするとき、各フレームのいくつかの小さいバイト範囲にアクセスすることが必要とされる。これは、生成される要求の数に関して、および、データオーバヘッドに関して、ＨＴＴＰストリーミングにおいては不十分である。また、これは、複数回の細かいファイル検索操作を必要とするため、ＲＴＰストリーミングのためのビットストリーム抽出にはあまり効率的ではない。

それゆえ、ＲＯＩストリーミングのために圧縮ビデオにより効率的なアクセスを提供するために、タイムドメディアデータビットストリームは、特定のタイルのデータがある期間（すなわち、連続フレームのセット）にわたる連続バイト範囲（パイプを形成する）として編成されるように、再編成されるべきである。

したがって、ビデオフレームの空間下位区分のみが表示されるべきであるとき、選択された空間領域に対応するタイルのパイプのみが、パイプあたり、および、期間あたり１つのＨＴＴＰ要求を使用してダウンロードされなければならない（たとえば、図２のタイル３および７）。同様に、ＲＴＰストリーミングにおいて、サーバは、ハードディスクのようなソースから、タイルのパイプに対応するより大きいデータチャンクをより効率的に抽出することができる。

ＨＥＶＣ規格の多層拡張は、予測モード、特に、図５に示されているような、基準ピクチャの構築に影響を与える。

図５は、多層ＨＥＶＣ方式または同様の方式を使用しながらの、ビデオデータを符号化するための基準ピクチャセットの使用を示す。

ピクチャ５００が符号化されるとき、複数の異なる予測器を使用することができる。これらの予測器は、様々な基準ピクチャセット、一般的には、符号化されるべき現在のピクチャに先行するショートタームピクチャに対応する基準ピクチャのセット５０１、符号化されるべき現在のピクチャに後続するショートタームピクチャに対応する基準ピクチャのセット５０２、符号化されるべき現在のピクチャに先行するロングタームピクチャに対応する基準ピクチャのセット５０３、および、層間基準ピクチャのセット５０４内に記憶されている基準ピクチャの中で選択される。

ショートターム基準ピクチャセットおよびロングターム基準ピクチャセットは単一層ＨＥＶＣを処理するために一般的に使用されているが、多層拡張は、両方とも符号化されるべき現在のピクチャに関連付けられる、層間基準ピクチャセット内の少なくとも２つの追加の基準ピクチャリストを提供することが留意されるべきである。

層間基準ピクチャのセットのリスト内に存在する最大数のピクチャは、ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓパラメータ５０５によって与えられる。

実例として、基準ピクチャは、ピクチャ順カウント（ＰＯＣ）および／またはＬａｙｅｒＩｄ値に応じてインデックス付けすることができる。

現在のピクチャ５００を予測するために使用することができる各層間基準ピクチャに対して、その層識別子、すなわち、ＮＡＬユニットｈｅａｄｅｒｓ＿ｌａｙｅｒ＿ｉｄｅｎｔｉｆｉｅｒの値を提供するために、層間基準ピクチャのセットのリスト内に存在する最大数のピクチャが、スライスセグメントヘッダ内で使用される。このとき、スライス（または、１つのタイルが１つのスライスに対応するときは、タイル）にたいして、層間依存性のリストを推定することができる。これは、タイルの「独立して復号可能な」特性に影響を与える。そのため、この層間依存性情報は、再生時にまたはストリーミング用途において、依存層からのデータも、選択されたタイル（複数可）の正確な復号および表示のために存在することを保証するためのファイルフォーマットにおいてカプセル化されるときにタイルの記述と関連付けられるべきである。

ＨＥＶＣの多層拡張（ＩＳＯ／ＩＥＣ２３００８―２ＡｎｎｅｘＦ）において、「層間制約タイルセットＳＥＩメッセージ」として参照される特定のＳＥＩメッセージが、層がタイルで符号化されるときの層間予測プロセスに対する制約を示すように定義される。このＳＥＩメッセージは、ある層について、以下のように定義される、すなわち、「層間制約タイルセットＳＥＩメッセージは、ある層について、その層に対してアクティブであるすべてのＰＰＳが１に等しいｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ［ＶＰＳＶＵＩ（ビデオパラメータセット、ビデオ可用性情報）において］を有しない限り、または、１に等しいｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇによって示される条件を満たさない限り、存在すべきではない」。

そのようなＳＥＩメッセージは、「各識別されたタイルセット外のいずれのサンプル値も、および、識別されたタイルセット外の１つ以上のサンプル値を使用して導出される部分サンプル位置にあるいずれもサンプル値も、識別されたタイルセット内の任意のサンプルの層間インター予測に使用されないように層間インター予測処理が規制されることを示す」。

より詳細には、各タイルセットｉに対する予測制約は、その値が以下のように定義される特定のｉｌｃ＿ｉｄｃフラグ（ｉｌｃ＿ｉｄｃ［ｉ］）によって与えられる：
０：不確定、
１：ＣＶＳ内でｉ番目の識別されたタイルセット外のいずれのサンプルも、および、ｉ番目の識別されたタイルセット外の１つ以上のサンプルを使用して導出される部分サンプル位置にあるいずれのサンプルも、ｉｃｔｓＮｕｈＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するｉ番目の識別されたタイルセット内の任意のサンプルの層間予測に使用されず、ここで、ｉｃｔｓＮｕｈＬａｙｅｒＩｄは、このメッセージのｎｕｈ＿ｌａｙｅｒ＿ｉｄの値である、
２：ＣＶＳ内で、ｉｃｔｓＮｕｈＬａｙｅｒＩｄに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するｉ番目の識別されたタイルセット内のいずれの予測ブロックも、層間基準ピクチャから予測されない、および、
３：予約されている。

たとえ層間基準ピクチャが基準ピクチャのセット内に存在するとしても、それらは必ずしも使用されるとは限らない。その上、計算費用節約のために、符号化器は、同じ現在の層からの情報のみを使用してタイルを符号化するよう決定することができ、時折、たとえば、ランダムアクセスフレーム上で、より下位の層（複数可）からの情報を使用するよう決定することができる。

（６ａ）、（６ｂ）、（６ｃ）、および（６ｄ）を含む図６は、種々のタイプの層間タイル予測を示す。図示されている例によれば、ビデオストリームの各フレームは、少なくとも２つの層を含む（層ｉおよび層ｉ＋１、層ｉ＋１は層ｉのエンハンスメントレイヤである）。

（６ａ）に示されている例によれば、イントラ予測およびインター予測の両方が、各フレームのエンハンスメントレイヤの各タイルに使用される。

たとえば、フレーム６００のエンハンスメントレイヤｉ＋１のタイル６０１は、矢印６０３によって示されているように、同じフレーム６００のより下位の層ｉの対応するタイル６０２、および、矢印６０５によって示されているように、先行するフレームのエンハンスメントレイヤｉ＋１の対応するタイル６０４に依存する。

矢印６０３によって表現されている層間予測指示は、層ｉ＋１のタイルが、層ｉの対応するタイル、層ｉのタイルのセット、または、層ｉの全ピクチャに依存することを示す。層ｉ＋１のいくつかのタイルのみが、より下位の層の１つ以上のタイルに依存するであろう。

その上、それらの依存性は、（３ｂ）〜（３ｄ）に示されているように、ビデオシーケンス内で経時的に変化する場合があり、ここで、符号化器は、フレーム６１０、６１１、６２０、６２１、６３０、および６３１によって表現されているランダムアクセスポイント上のみの層間予測を使用する。

（６ｂ）に示されている例によれば、層ｉ＋１の各タイルは、過去のフレームの同じエンハンスメントレイヤｉ＋１の対応するタイル、または、より下位の層ｉの１つ以上のタイルに依存する。（６ｃ）および（６ｄ）に示されている例によれば、層ｉ＋１の各タイルは、過去のフレームの同じエンハンスメントレイヤｉ＋１の対応するタイル、および／または、より下位の層ｉの１つ以上のタイルに依存する。

これらの異なる依存性方式を鑑みると、ファイルフォーマットにおけるタイル記述子の層間依存性シグナリングは、動的に設定されるべきである。したがって、タイル記述に柔軟性をもたせ、様々な符号化器選択肢をサポートするために、層間依存性シグナリングは、タイル記述自体から分離していることが好ましい。

図７は、層間依存性記述を可能にするタイル記述子の一例を示す。

図示されているように、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子７００および７０１は、この所与の例において、スケーラビリティ情報およびタイルまたは画像依存性情報にアクセスするためのｄｅｐｅｎｄｅｎｔＧｒｏｕｐＩＤパラメータ７０３およびｌａｙｅｒＧｒｏｕｐＩＤパラメータ７０４を含む。この所与の例によれば、スケーラビリティ情報はＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子７０２内に記憶されており、タイルまたは画像依存性情報は、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子７０１内に記憶されている。

ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子７０２は、識別子、依存関係シグナリングメカニズム、および、ビデオエレメンタリビットストリームに由来する追加の特性を含むＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子（またはＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘボックス）のパラメータの例を示す。実例として、追加の特性は、ｖｉｓｕａｌＷｉｄｔｈおよびｖｉｓｕａｌＨｅｉｇｈｔパラメータを含む。しかしながら、追加の特性はまた、フレームレート、ビットレートならびにプロファイルおよびレベル情報のような他のパラメータをも含んでもよい。それらの特性はまた、スケーラビリティ層を記述する高レベル構文情報をも含んでもよい。

修正ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子７０１の追加および修正されたパラメータは、以下のように定義することができる：
（ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子によって定義されるような）タイル、（ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ記述子によって定義されているような）タイルセット、または、このタイルが依存する（ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子、たとえば、ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子７０２によって定義されているような）ＨＥＶＣ層の識別子を与えるｄｅｐｅｎｄｅｎｔＧｒｏｕｐＩＤ（参照符号７０３）。依存性がトラック参照ボックスから導出されるとき、このパラメータは、０に設定されることが好ましい；
−このタイルが属する（ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子によって定義されているような）ＨＥＶＣ層の識別子を与えるｌａｙｅｒＧｒｏｕｐＩＤ（参照符号７０４）。依存性がトラック基準ボックスから導出されるとき、このパラメータは０に設定される；ならびに
−ｌａｙｅｒＧｒｏｕｐＩＤの値がゼロとは異なる、または、当業者に周知である、「ｍｏｏｖ」ボックス内に含まれている「ｓｔｓｄ」ボックスの視覚サンプルエントリにおいて指示されているものとしてのフレームのものである場合、パラメータｌａｙｅｒＧｒｏｕｐＩＤによって識別される層の、輝度サンプルに関してタイルによって表現される矩形領域の幅および高さをそれぞれ定義するｒｅｇｉｏｎ＿ｗｉｄｔｈおよびｒｅｇｉｏｎ＿ｈｅｉｇｈｔ。

パラメータｇｒｏｕｐＩＤを符号化するために使用されるビット数を修正しながら、同様の追加のおよび修正されたパラメータもＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ記述子に適用される（タイル化およびスケーラビリティ構成は組み合わされ、単一の名前空間が使用されるため、ｇｒｏｕｐＩＤパラメータの値の数は増加されることになる）。

必要な適合は、（ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子によって定義されるような）タイル、（ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ記述子によって定義されているような）タイルセット、または、このタイルセットが依存する（ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子によって定義されているような）ＨＥＶＣ層の識別子を定義することができるｄｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤ属性の解釈に関する。ｄｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤ属性の値がゼロに等しい場合、依存性はトラック参照ボックスから導出される。

実例として、ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子（参照符号７０２）のパラメータは以下のように定義することができる：
−グループによって記述される層の固有の識別子であるｇｒｏｕｐＩＤ。値０はＮＡＬＵＭａｐＥｎｔｒｙ（「ｎａｌｍ」）ボックスにおける特別な用途のために確保される；−その層が依存する（ＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ記述子によって定義されているような）ＨＥＶＣ層のｇｒｏｕｐＩＤ識別子を指示するｄｅｐｅｎｄｅｎｔＧｒｏｕｐＩＤ。ｄｅｐｅｎｄｅｎｔＧｒｏｕｐＩＤパラメータの値がゼロに等しい場合、依存性は上述したトラック参照ボックス「ｓｔｓｄ」から導き出される。これはたとえば、スケーラブルＨＶＣ（ＳＨＥＶＣ）ビットストリームがＡＶＣ｜Ｈ２６４トラックを強化する場合である；
−輝度サンプルにおけるコード化画像またはビューの幅の値を与えるｖｉｓｕａｌＷｉｄｔｈ；および
輝度サンプルにおけるコード化画像またはビューの高さの値を与えるｖｉｓｕａｌＨｅｉｇｈｔ。

タイル化参照層記述子を有すること、および、タイルまたは層のいずれかの記述子を参照できる層記述子を有することの利点は、ｇｒｏｕｐＩＤ識別子の使用を通じて、統一された柔軟な依存関係シグナリングを提供することである。タイル、タイルセットおよびＨＥＶＣ層に対するｇｒｏｕｐＩＤ識別子の識別子名前空間を統一することによって、また、２つの依存性識別子（パラメータｄｅｐｅｎｄｅｎｔＧｒｏｕｐＩＤおよびｌａｙｅｒＧｒｏｕｐＩＤ）を導入することによって、以下の依存性、すなわち、
−タイル化層間の依存性、
−非タイル化層間の依存性、
−非タイル化エンハンスメントレイヤとタイル化ベースレイヤとの間の依存性、および、
タイル化エンハンスメントレイヤと非タイル化ベースレイヤとの間の依存性が単純に定義される。

しかしながら、２つのパラメータ７０３および７０４がそれぞれ、あるタイルについて、別のタイルに関する依存性情報およびこのタイルの層に関する情報を提供する場合、そのようなソリューションの制限は、そのようなソリューションが、ＨＥＶＣにおいて記載されている基準ピクチャリストメカニズムによって必要とされるような複数の依存性をサポートしないことである。その上、層間依存性シグナリングはタイル記述子自体に埋め込まれているため、タイルシグナリングは、層間依存性が変化する度ごとに複製されなくてはならない。事実、同じタイルは経時的に（少なくとも１つのＧＯＰから別のＧＯＰへと）変動する依存性を有する場合があるため、タイル化構成が、各可能性のある依存性に対して複製されるべきであり、または、明示的な依存性グループ化が導入されるべきである。

（８ｂ）に示されているような、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ（「ｔｓｉｆ」）タイプのタイル記述子を、層間依存性を含むタイル依存性を記述するために使用することができる。

ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙタイプのタイル記述子は、一般的に、（層内）コード化依存性に基づいてタイルのセットを定義するために使用される。しかしながら、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ記述子は、タイルセットが個々のタイル識別子（タイルＩＤ＝ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ内のｇｒｏｕｐＩＤ）を使用して記述されることを可能にするため、タイルセットが単一のタイルから作成されることを示すことが可能である。それゆえ、以下の依存性リストは、異なる層に由来し得る任意の数のタイルがリストされることを可能にする。したがって、「ｔｓｉｆ」サンプル記述ボックス内に、タイルの、より下位の層にある他のタイルＩＤに対する依存性をリストすることが可能である。

ｍｐ４ファイルにおける図３を参照して説明したようなＨＥＶＣスケーラブルビットストリームをカプセル化するために、後者は以下を含まねばならない：
−ベースレイヤの各タイルについて、「独立」としてフラグ付けされている１つのタイル領域（ｉｌｃ＿ｉｄｃ値が１（またはＩＤＲのみについては２）に等しい）、すなわち、この層にある別のタイルからの時間的依存性なしに復号することができるタイル領域；−エンハンスメントレイヤの各タイルについて、「独立」としてフラグ付けされている１つのタイル領域（ｉｌｃ＿ｉｄｃ値が１に等しい）、すなわち、この層にある他のタイルからの時間的依存性なしに復号することができるタイル領域；
−エンハンスメントレイヤの各タイルについて、単一のタイルおよびベースタイル（複数可）に対する依存性から作成される１つのタイルセット；ならびに
−以下の２つのエントリを有するＮＡＬＵＭａｐＥｎｔｒｙ（「ｎａｌｍ」）サンプルグループ記述ボックス：
−ＮＡＬＵを「ｔｓｉｆ」グループにマッピングする１つのエントリ、タイル間依存性（層間依存性を含む）の使用が記述されている；および
−独立タイル（すなわち、他の共在していないタイルに対する依存性を有しないタイル）について、ＮＡＬＵを「ｔｒｉｆ」グループにマッピングする１つのエントリ。

タイル層と非タイル層との間の依存性（（３ａ）および（３ｂ）を参照して説明されているような）の記述を処理するために、タイル記述設計は、層間のすべての依存性を、タイル化されているか否かにかかわらず、単一の記述ツール（ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ記述子）を通じて表現することができるように、非タイル層が記述子によって記述されることを可能にするように拡張することができる。

（８ａ）および（８ｂ）を含む図８は、それぞれ、他方のタイルに対する復号依存性の記述を可能にする、本発明の特定の実施形態に従って変更されている単一層タイル記述子８００、および、タイルセット記述子８５０を示す。

８０１と表示されている独立パラメータが、現在のフレームおよび同じ層の基準フレーム内の規定のタイルと他のタイルとの間のコード化依存性を指定する。タイル間依存性が存在する場合、これは、（８ｂ）において示されているような記述子ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙのｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータ８５１によって示される。

ｆｕｌｌ＿ｆｒａｍｅパラメータと呼ばれ、８０２と表示されている新規のパラメータは、設定されると、定義されたタイルが実際に完全なフレームであることを示し、この事例において、８０３と表示されているパラメータｒｅｇｉｏｎ＿ｗｉｄｔｈおよびｒｅｇｉｏｎ＿ｈｅｉｇｈｔが、輝度成分の層サイズに設定される。そのような事例において、パラメータｉｎｄｅｐｅｎｄｅｎｔは１に設定される。これによって、ｆｕｌｌ＿ｆｒａｍｅパラメータが１に設定されている「ｔｒｉｆ」サンプルグループを参照する「ｔｓｉｆ」サンプルグループを使用して、ある層のタイルと非タイル化層との間で、すなわち、層にわたるタイル化構成がどのようなものであっても（タイル化されていようともいなくとも）依存性が表現されることが可能になる。

（８ｂ）に示されているように、依存性は、識別子（参照符号８５２）として、または、それ自体、長方形を表す左上頂点および右下頂点に対応する２つの点（参照符号８５３）を使用して画定することができる基準領域として定義することができる。

（８ｂ）において８５１と表示されている、タイルセット記述子のｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータは、そのタイルセットが自己完結型であるか否かを示すが、層内依存性と層間依存性との間で区別することは可能にしない。そして、スケーラブルである事例において一切の曖昧さを回避するために（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータは、現在の層内のタイルセットがベースレイヤに依存しないこと、または、複数層にわたるタイルのセットが自己完結型であることを示すことができる）、また、タイルトラックをカプセル化／解析するときに相互運用可能であるようにするために、図９に示されているように、ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータに特定の意味を与えることができる。

図９は、多層タイル化のタイルセット記述子９００の一例を示す。

図示されている例によれば、タイルセット記述子９００のｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータは、３ビット以上にわたってコード化され、各ビットが特定の意味を有する。

それぞれ参照符号９０１、９０２、および９０３を用いて表されているように、２つの第１の最下位ビットは、何らかの依存性が宣言されているか否かを、何らかの依存性が宣言されている場合はそれらのタイプとともに示す。２進値００は、依存性がシグナリングされていないことを意味し（テスト９０１）、値０１は、層内依存性のみがシグナリングされていることを意味し（テスト９０２）、値１０は、層間依存性のみがシグナリングされていることを意味し（テスト９０３）、最後に、値１１は、層内依存性および層間依存性の両方がシグナリングされていることを意味する（９０２および９０３が存在する）。このとき、第３の最下位ビットは、依存性のリストが、タイルグループ識別子のリストとして提供されている（値０）か、または、領域として提供されているかを示す。

タイルセット記述子９００は、層間タイル依存性が層情報を一切提供することなくシグナリングされる単純な例に対応し、したがって、ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータには３ビットしか必要としない。追加のビット（合計で最大５ビットであることが好ましい）を使用して、層間タイル依存性のより精密な記述を提供することができる。

特定の実施形態（図示せず）によれば、層間依存性が存在する（第２の最下位ビットが１に設定される）ときに、依存性が層（たとえば、値１）によって編成されるか否かを示すために、第４のビットが使用される。依存性がタイルグループ識別子のリストとして記述されるか、または、領域として記述されるかを示すシグナリングモード（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔの第３の最下位ビット、参照符号９０４、によって与えられるリストまたは領域）に応じて、単一リスト（第３のビット値が１）または二重リスト（第３のビット値が０）が作成される。二重リストは、層の数と、各層ごとに、現在の層にあるこのタイルが依存するタイルグループ識別子のリストとを含む。単一リストは、層の数だけを含み、各層ごとに、現在の層の現在のタイルが依存する領域を提供する。このとき、パーサは、層が現在の層からベースレイヤへと降順に編成されていると仮定する。依存性のフラットなリストの代わりに、このとき、パーサは、現在のタイルトラックが依存するトラックの指示を有する。これによって、マッピングすべきトラックのセット内の探索空間が限定される。

先行する実施形態の改善と考えることができる別の実施形態（図示せず）によれば、第４のビットが１に設定されているときに、すなわち、層間タイル依存性が層によって記述されるときに、第５のビットが使用される。この事例において、第５のビットは、各層ごとに、層識別子情報の項目をシグナリングする。たとえば、（依存性をタイルグループ識別子のリストとして記述するために第３のビットが１に設定されていると仮定して）以下のパラメータが得られることになる。
ｉｆ（（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＆２＝＝１）／／ｉｎｔｅｒ−ｌａｙｅｒｄｅｐｅｎｄｅｎｃｉｅｓ｛
ｉｆ（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＆８＝＝１）｛／／４^ｔｈｂｉｔｔｏ１：ｌａｙｅｒ−ｂａｓｅｄｏｒｇａｎｉｚａｔｉｏｎｕｎｓｉｇｎｅｄｉｎｔ（１６）ｌａｙｅｒｓ＿ｃｏｕｎｔ；
ｆｏｒ（ｌ＝１；ｌ＜＝ｌａｙｅｒｓ＿ｃｏｕｎｔ；ｌ＋＋）｛
ｉｆ（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＆１６＝＝１）｛／／５^ｔｈｂｉｔｔｏ１：ｌａｙｅｒＩＤｉｓｐｒｅｓｅｎｔｕｎｓｉｇｎｅｄｉｎｔ（１６）ｌａｙｅｒ＿ＩＤ；
｝
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ；
ｆｏｒ（ｉ＝１；ｉ＜＝ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ；ｉ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｄｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤ；
｝
｝
上記の例におけるｌａｙｅｒ＿ＩＤは、ＮＡＬユニットヘッダｎｕｈ＿ｌａｙｅｒ＿ｉｄに含まれる値をとることができる。そのようなカプセル化されたファイルを処理するパーサは、図７のＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ７０２において、この特定の層を記述する専用ボックス、たとえば、ＭＰＥＧ−４Ｐａｒｔ１５規格からのＴｉｅｒＩｎｆｏＢｏｘ、ＭＰＥＧｃｏｎｔｒｉｂｕｔｉｏｎにおいてＮｏｋｉａによって提案されているものとしてのＬａｙｅｒＩｎｆｏＢｏｘを解析することによって、または、層情報を提供する任意のメタデータボックスから、層関連情報を見出さなければならない。このボックスは、そのＩＤを通じて識別することができる。これは、ｍｐ４パーサが、依存タイルを層情報ボックスに、または、たとえば、図７のＨＥＶＣＬａｙｅｒＤｅｆｉｎｉｔｉｏｎＢｏｘ７０２のような層記述に迅速に関連付けるのを助ける。

第５のビットが０に設定される場合、層識別子は提供されない。この事例において、層は降順に編成されると仮定され、したがって、各層ごとに、タイルグループ識別子のリストまたは領域を指定することができる。ある層において、依存性が存在しないとき、これは、ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ＝０、または、両方とも０に等しいｔｏｐＬｅｆｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄおよびｂｏｔｔｏｍＲｉｇｈｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄを用いて表現される。

また別の実施形態によれば、層間依存性が層ＩＤ情報を用いて層ごとに（第４のビットおよび第５のビットが１の値を有する）、また、タイルグループ識別子のリストとして（第３のビットが０に設定されている）編成されるとき、これは、識別された層内の同じフレーム内に共在するタイルセットに対する依存性として解釈されるべきである。（一般的な事例である）この事例において、先行する例の最後のループがないため、記述はより短い。これは、ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔを値０ｘＦＦＦＦにすることによってシグナリングされる。層間タイル依存性が領域としてシグナリングされる事例において（第３のビットが１に設定されている）、層間依存共在タイルのシグナリングは、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙのｔｏｐＬｅｆｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤおよびｂｏｔｔｏｍＲｉｇｈｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤの両方を０ｘＦＦＦＦに設定することによって表現することができる。ビデオエレメンタリストリーム内のＶＰＳのｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇが１に設定されるとき、共在するタイルを見出すためにタイルインデックスに依拠することができ、または、依存層内の共在するタイルの位置を見出すために、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙから得られる現在のタイルサイズもしくは参照されるタイルサイズと、現在のタイル位置８０３との比を適用することができる。

層間タイル依存性のために選択されるシグナリングが何であれ、情報は、存在するときは層間制約タイルセットＳＥＩメッセージから読み出すことができる。このＳＥＩメッセージは、定義によれば、ある層内の各タイルセットについて、このタイルセットが他の層に対する依存性を有するか否かを示す（ｉｌｃ＿ｉｄｃパラメータ）。このとき、この情報を読み出すことによって、ｍｐ４ライタは、この所与のタイルセットを記述するＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙの依存性リストの第２のビットを設定することができる。現在のタイルセットがいずれかの層に依存し得るかを判定するために、ｍｐ４ライタは、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇパラメータにおけるビデオパラメータセット（ＶＰＳ）の拡張に含まれる他の情報を読み出すことができる。このアレイは、１つの層から別の層への直接の依存性のリストを供給する。したがって、たとえば、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇパラメータが値１を有する（現在の層からこの所与の第２の層への依存性を示す）各層ごとのタイル依存性の入力リストを作成することによって層ごとに（第４のビットが１に設定されている）タイル間層依存性のリストを構築することができるとき。ｉｌｃ＿ｉｄｃパラメータの値が自己完結型タイルセットを示すとき、依存タイルが現在の層内の共在するタイルであることをシグナリングするために、ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔｔｉｌｅ＿の特定の値から１を減算して、最後の実施形態を使用することができる。そうでない場合、そのタイルに対する動きの制約を示す別のＳＥＩメッセージからタイル制約を得ることができる。

上述したソリューションは、所与のトラックまたはトラックフラグメントについてサンプルグループまたはＮＡＬＵグループの層間タイル依存性シグナリングを提供する。これをより柔軟かつ動的にするために、たとえば、図６に示されている種々のタイプの層間タイル予測を処理するために、いくつかのソリューションを考えることができる。

図１０に示されている第１のソリューションによれば、ＮＡＬＵＭａｐＥｎｔｒｙを使用して、サンプルの層間予測によるサンプルのマッピングを行うことができる。明瞭にするために、タイルトラックのセットを含むｍｐ４ファイルのヘッダ１０００のみが示されており、各タイルトラックは、１つのタイルおよびＳ個のサンプルを含み、各サンプルはＮ個のＮＡＬユニットを含む。

さらに明瞭にするために、そのサンプルボックステーブル１００２が対応するサンプルの特性を記述している、１つのみのタイルトラック記述１００１の例が示されている。トラック識別子、たとえば、トラックヘッダボックスのｔｒａｃｋ＿ＩＤパラメータ（ここでは表現されていない）は、これがエンハンスメントレイヤ１のタイルトラックであることを示す。

サンプルエントリボックス１００３は、サンプルを、ＨＥＶＣタイルサンプルであるとして記述し（ＨＥＶＣＴｉｌｅＳａｍｐｌｅＥｎｔｒｙ）、ＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎボックス１００４は、グループエントリにたいする「ｎａｌｍ」グループ化タイプを示し、サンプルグループを定義する。図示されているように、サンプルは、それぞれ層間依存性を有するタイルサンプル、および、層間または層内依存性を有しないタイルサンプルに対応する２つのセット１００５および１００６に分割される。これらのサンプルセットはそれぞれ、ＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎボックス１００７において定義されているＮＡＬＵＭａｐＥｎｔｒｙ１００８および１００９をマッピングする。

第１のＮＡＬＵマップ１００８は、参照符号１０１３（依存性パラメータｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝２）および参照符号１０１２（現在のタイルが依存するタイルの参照ｇｒｏｕｐＩＤ＝Ｔ０１）によって示されているような、層間タイル依存性を記述するＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙ１０１０に、関連するＮＡＬユニットをマッピングする。他のＮＡＬユニットは、いかなる層間または層内依存性も定義しないＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ１０１１にマッピングされる。ビデオデータは、各々がタイルデータを搬送するサンプルのリスト１０２１〜１０２３として、「ｍｄａｔ」ボックス１０２０内に配置される。

専用サーバおよびｍｐ４ライタならびに専用クライアントデバイスおよびｍｐ４パーサの使用に基づく特定の実施形態に対応する第２のソリューションによれば、符号化器は、規則的な層間予測パターンを生成するように制御され、ｍｐ４ライタは、（６ｂ）および（６ｃ）に示されているもののようなランダムアクセスポイントに一致するタイルトラックフラグメントを生成するように制御される。ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１ＭＰＥＧ／Ｎ１４７２７、２０１４年７月、日本国札幌、の最新バージョンにおいて、これらのポイントは、代わりに、ストリームアクセスポイントまたはＳＡＰと呼ばれる。規則的な層間予測パターンを使用することによって、ｍｐ４ライタは、デフォルトのサンプルグループ化を使用するすべてのサンプルをＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙにマッピングすることによってよりコンパクトな記述を生成することができ、このＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙは、タイルを記述するＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙを参照し、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙは、（６ｂ）および（６ｃ）において６１０、６１１および６２０、６２１として参照されているランダムアクセスサンプルに関する、ベースレイヤに対する依存性を記述する。ＮＡＬＵマップ１００８および１００７を削除することができるため、この依存性記述は、図１０を参照して説明されているソリューションと比較して、バイトサイズに関してよりコンパクトである。

その代わりに、トラック内のすべてのサンプルが、ＩＳＯＢＭＦＦのデフォルトのサンプルグループ化メカニズムを使用してＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙにマッピングされる。ランダムアクセスサンプル６１０、６１１および６２０、６２１は、両方とも特定のＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｉｅｓを含むランダムアクセスポイントを提供する「ｓｙｎｃ」または「ｒａｓ」タイプのサンプルグループ記述ボックス内に記述される。ランダムアクセスポイントとして記述されているエントリは、層間タイル依存性が適用されるサンプルである。ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔの特定の値は、これらのランダムアクセスサンプルの層間依存性を提供するために確保される。
ｉｆ（（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝＝１）｜｜（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝＝３））｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ；
ｆｏｒ（ｉ＝１；ｉ＜＝ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ；ｉ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｄｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤ；
｝
ｉｆ（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝＝３）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｉｄｒ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ；
ｆｏｒ（ｉ＝１；ｉ＜＝ｉｄｒ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔ；ｉ＋＋）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｉｄｒ＿ｄｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤ；
｝
｝
あるいは、領域モード記述が選択される場合、値２および４を以下のように使用することができる。
ｉｆ（（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝＝２）｜｜（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝＝４））｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｔｏｐＬｅｆｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｂｏｔｔｏｍＲｉｇｈｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄ；
ｉｆ（ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔ＝＝４）｛
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｉｄｒ＿ＴｏｐＬｅｆｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄ；
ｕｎｓｉｇｎｅｄｉｎｔ（１６）ｉｄｒ＿ＢｏｔｔｏｍＲｉｇｈｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄ；
｝
この実施形態において、ｄｅｐｅｎｄｅｎｃｙ＿ｌｉｓｔパラメータは、依存性の追加のリストが、サンプルがＩＤＲ（復号内リフレッシュ）、ＣＲＡ（クリーンランダムアクセス）、またはＢＬＡ（ブロークンリンクアクセス）ピクチャ（すなわち、ランダムアクセスサンプル）である場合について与えられることを示すために、値３または４を使用する。パラメータｉｄｒ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｉｌｅ＿ｃｏｕｎｔおよびｉｄｒ＿ｄｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩＤは、タイル領域のリスト、および、このタイルが属するサンプルがＩＤＲ、ＣＲＡまたはＢＬＡピクチャであるときはこのタイルセットが依存するタイルセットを指定する。パラメータｉｄｒ＿ＴｏｐＬｅｆｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄおよびｉｄｒ＿ＢｏｔｔｏｍＲｉｇｈｔＤｅｐｅｎｄｅｎｃｙＴｉｌｅＧｒｏｕｐＩｄはそれぞれ、依存層内の左上タイルおよび右下タイルの識別子を指定する。

前述の実施形態におけるように、この実施形態は、層ごとのシグナリングによって拡張することができる。

ビデオコンテンツに対する効率的な時間的アクセスのために、ＩＳＯＢＭＦＦは、抽出器と呼ばれるツールを定義する。抽出器は、他のトラックからのＮＡＬユニットの効率的な抽出を可能にするファイルフォーマット内部構造である。ビットストリーム中に直に挿入されるこれらの構造は、各コード化フォーマットによってこの用途およびトランスポート層のために予約されている専用ＮＡＬユニットタイプ（たとえば、ＩＳＯ／ＩＥＣ１４４９６−１０ビデオのためのタイプ３１）を使用する。それらは、データを重複することなくいくつかのトラックにおいてビデオデータを編成することを可能にする。

抽出器は、最初は、ＳＶＣまたはＭＶＣフォーマットに適合するビデオデータのようなスケーラブルビデオデータ向けに設計されている。それらのフォーマットにおいて、各トラックが特定のスケーラビリティレベルにおいてビデオを表現する、複数の依存トラックを使用することによって層状メディアデータ編成が効率的に表現できる。たとえば、エンハンスメントレイヤトラックのビットストリームは、ベースレイヤトラックからのＮＡＬユニットを参照する抽出器を含んでも良い。そのようなエンハンスメントレイヤトラックがそのファイルフォーマットから抽出されると、抽出器は、それらが参照しているデータに置き換えられる。

より最近になって、抽出器はまた、多層ＨＥＶＣおよびＨＥＶＣタイルの別個のトラックへの効率的なカプセル化のために、ＨＥＶＣファイルフォーマットにおいても定義されている。したがって、インデックス付けされるべき独立タイルの各々は、図１１を参照して記載されているように、「タイルトラック」と呼ばれる特定のトラックによって表現される（１１２０−１および１１２０−１２）。

しかしながら、タイル化およびスケーラビリティを混合するとき、必要とされる抽出器の数は著しく増大するであろう。そのため、好ましい実施形態において、タイルトラックは抽出器を使用するべきではない。タイルトラックは、図１１に示されているように完全なフレームにおけるＨＥＶＣビットストリームに対応するベーストラック（１１１５）によって（タイルトラックの各々の「ｓｃａｌ」定義を含む動画ボックス「ｍｏｏｖ」のトラック基準ボックス「ｔｒｅｆ」を介して）参照される。関連する層を含むこのベーストラックのみが、元のビットストリームがどのように再構築されるかを示すために抽出器を使用することができる。ベーストラックは、「ｔｂａｓ」トラック基準（１１５０）を用いてタイルトラックによって識別される。

タイルトラック内に記憶されるＨＥＶＣサンプルは、ＩＳＯ／ＩＥＣ２３００８−２において定義されているような、１つ以上のタイルの完全なスライスセットであり、すなわち、ＶＣＬＮＡＬユニットのみが、それらのスライスを形成する。これは、タイルサンプルが、いかなるパラメータセット、ＳＥＩメッセージまたは他の非ＶＣＬＮＡＬユニットをも含むべきではないことを暗示する。反対に、ベーストラックは、初期化データに対応する様々なパラメータセット（たとえば、ビデオパラメータセット、シーケンスパラメータセット、および／またはピクチャパラメータセット）を含む。ベーストラックはまた、タイルトラック内のサンプルを指し示す抽出器（すなわち、特定のタイプのＮＡＬユニット）をも含む。

上述したように、抽出器は、以下の構文を有するファイルフォーマット内部構造であり得る。
ｃｌａｓｓａｌｉｇｎｅｄ（８）Ｅｘｔｒａｃｔｏｒ（）｛
ＮＡＬＵｎｉｔＨｅａｄｅｒ（）；
ｕｎｓｉｇｎｅｄｉｎｔ（８）ｔｒａｃｋ＿ｒｅｆ＿ｉｎｄｅｘ；
ｓｉｇｎｅｄｉｎｔ（８）ｓａｍｐｌｅ＿ｏｆｆｓｅｔ；
ｕｎｓｉｇｎｅｄｉｎｔ（（ｌｅｎｇｔｈＳｉｚｅＭｉｎｕｓＯｎｅ＋１）＊８）ｄａｔａ＿ｏｆｆｓｅｔ；
ｕｎｓｉｇｎｅｄｉｎｔ（（ｌｅｎｇｔｈＳｉｚｅＭｉｎｕｓＯｎｅ＋１）＊８）ｄａｔａ＿ｌｅｎｇｔｈ；
｝
抽出器は、他のトラックからのデータに対するポインタまたは参照として作用し、両方のトラックにおいてデータを複製する代わりに、依存トラックに対する参照を用いてコンパクトなトラックが構築されることを可能にする。抽出器は、ＮＡＬユニット構文を使用することが好ましい。したがって、これは、特に、ＮＡＬユニットタイプに関連する情報を含む、ＮＡＬユニットヘッダと同じ構造を有するヘッダを含む。このＮＡＬユニットタイプは、たとえば、現在、ＨＥＶＣにおける予約されているＮＡＬユニットタイプに対応する値「４９」に設定される。抽出器によって参照されるトラックに対応するトラックの識別子（ｔｒａｃｋ＿ｉｄ）を含むｔｒｅｆボックスのタイプ「ｓｃａｌ」のエントリを取り出すことを可能にする、トラック基準ボックス（ｔｒｅｆ）内のインデックス（ｔｒａｃｋ＿ｒｅｆ＿ｉｎｄｅｘと表示されている）が、ヘッダに後続する。第３のパラメータは、現在のサンプルと比較した、抽出器によって参照されるサンプルの時間オフセット（ｓａｍｐｌｅ＿ｏｆｆｓｅｔ）である。第４のパラメータおよび第５のパラメータ（ｄａｔａ＿ｏｆｆｓｅｔおよびｄａｔａ＿ｌｅｎｇｔｈと表示されている）はそれぞれ、コピー元となるべき位置（バイト単位であることが好ましい）およびコピーすべきデータの量（値０は参照されるＮＡＬユニット全体のコピーを示すために確保される）を提供する。

図１１は、ＨＥＶＣビットストリームをベーストラック（１１１５）および独立したタイルトラック（１１２０）を含むトラックセットとしてカプセル化する一例を示す。

図示されているように、カプセル化ビットストリーム１１００は、トラックの定義を与える動画ボックス（「ｍｏｏｖ」）を含む初期化セグメントファイル１１０５と、ベーストラック１１１５および１２個のタイルトラック１１２０−１〜１１２０−１２（タイルトラック１１２０−１〜１１２０−１２の各々は、ビデオシーケンスの１つのタイルと関連付けられている）を表すメディアセグメントファイル１１１０とを含む。

ベーストラック１１１５は、セグメントタイプボックス「ｓｔｙｐ」（図示せず）と、トラックセグメントタイプおよび識別子のようなメタデータを含む少なくとも１つの動画フラグメントボックス「ｍｏｏｆ」１１２５と、各ビデオデータサンプルについて、ＰＰＳおよびビデオデータに対する参照を含む少なくとも１つのメディアデータボックス「ｍｄａｔ」１１３０とを含む。

同様に、タイルトラック１１２０−１〜１１２０−１２の各々は、セグメントタイプボックス「ｓｔｙｐ」（図示せず）と、トラックセグメントタイプおよび識別子のようなメタデータを含む少なくとも１つの動画フラグメントボックス「ｍｏｏｆ」と、ＮＡＬユニット（ＮＡＬＵ）にパッケージされている圧縮ビデオデータを含む少なくとも１つのメディアデータボックス「ｍｄａｔ」とを含む。

識別子２〜１３を有するタイルトラック１１２０−１〜１１２０−１２は、初期化セグメントファイル１１０５の（より正確には、識別子ｉｄ＝１を有するベーストラックの定義においては初期化セグメントファイル１１０５の動画ボックス「ｍｏｏｖ」の）トラック基準ボックス「ｔｒｅｆ」１１３５において参照される。

図示されているように、ベーストラック１１１５は、他のトラックからデータに対するポインタまたは参照として作用する抽出器を含む。実例として、いくつかのパラメータ、中でも、ベーストラック１１１５の抽出器１１３５−１〜１１３５−ｐに対応するタイルトラックインデックス（ｔｒａｃｋ＿ｒｅｆ＿ｉｎｄｅｘ）、データオフセット（ｄａｔａ＿ｏｆｆｓｅｔ）、およびデータ長（ｄａｔａ＿ｌｅｎｇｔｈ）が表現されている。

また実例として、ベーストラック１１１５のＮＡＬユニット１１３５−１が処理されるとき、これが、抽出器タイプのＮＡＬユニットを表す（ＮＡＬＵｎｉｔＨｅａｄｅｒが１６進値６２００に等しい）ことが判定される。したがって、これは、対応する圧縮ビデオデータを取り出すために処理される。そのためには、そのタイルトラックインデックス（すなわち、ｔｒａｃｋ＿ｒｅｆ＿ｉｎｄｅｘ＝１）が得られる。このインデックスより、初期化セグメントファイル１１０５内に記憶されているトラック定義からタイルトラック識別子を取り出すことが可能である。この例において、インデックスは１に等しいため、「ｔｒｅｆ」ボックスの第１のタイルトラック識別子が選択される（ｉｄ＝２）。次に、この識別子が、対応するタイルトラックにアクセスするために使用され、その後、抽出器１１３５−１のデータオフセット（すなわち、情報源として使用されるべきである識別されたトラック内のサンプルの相対インデックス）およびデータ長（すなわち、コピーすべきバイト数、たとえば、ｄａｔａ＿ｌｅｎｇｔｈ＝０であるときはＮＡＬＵ全体）パラメータを使用して、圧縮ビデオデータが、タイルトラック１１２０−１から抽出される（すなわち、この所与の例におけるコード化スライスセグメントＮＡＬＵ１１４０）。

処理された後、抽出器は、それが参照するデータに置き換えられる。図１１に示されている例によれば、抽出器１１３５−１が解析および処理されることによって、当該抽出器が、コード化スライスセグメントＮＡＬＵ１１４０に置き換えられることになり、したがって、ＨＥＶＣ対応ビットストリームが形成される。

ＨＥＶＣ抽出器のパラメータを記憶するために使用される意味解釈は、ＳＶＣ規格において定義されているものに近いものであり得ることが留意されるべきである。したがって、ＨＥＶＣＮＡＬユニットを参照する抽出器について、以下を適用することができる：−ｆｏｒｂｉｄｄｅｎ＿ｚｅｒｏ＿ｂｉｔとして既知であるパラメータが、ＩＳＯ／ＩＥＣ２３００８−２において指定されているように設定される；
−ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅとして既知であるパラメータが、４９に設定される（現在のＦＤＩＳにおいて予約されているコード）；
−ｎｕｈ＿ｌａｙｅｒ＿ｉｄおよびｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１として既知であるパラメータが、抽出器によって参照される第１のＮＡＬＵからコピーされる（ＨＥＶＣＮＡＬユニットを参照するＨＥＶＣトラック内の抽出器は、異なるｎｕｈ＿ｌａｙｅｒ＿ｉｄおよびｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１値を有するいくつかのＮＡＬユニットを参照しない）；ならびに
−ｓａｍｐｌｅ＿ｏｆｆｓｅｔとして既知であるパラメータが０に設定される。

また、ある特定の実施形態によれば、ＨＥＶＣシーケンスのタイルのサブセットのみを復号することができることも留意されるべきである。そのような事例において、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙおよびＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙサンプルグループ記述子内に記憶されている依存性情報を、ＨＥＶＣタイルトラックを復号しながら、不要なタイルトラックを廃棄し、または、いくつかの抽出器を無視するために使用することができる。

図１２は、４つのタイルを含むＨＥＶＣビットストリームの事例におけるトラック間の依存性の簡略化された概略図を示しており、各タイルは別個のタイルトラック内に記憶されている。

上述したように、ＢＴと表示されているベースＨＥＶＣトラック１２１０は、すべてのタイルに共通のデータ、特に、様々なパラメータセット（たとえば、ビデオパラメータセット、シーケンスパラメータセット、および／またはピクチャパラメータセット）を含む。ＢＴは、「ｔｒｅｆ」ボックス内の「ｓｃａｌ」タイプを参照することによって、タイルトラックに対する依存性をシグナリングする。各サンプルに対して、ＢＴはまた、それぞれＴＴ１、ＴＴ２、ＴＴ３、およびＴＴ４と表示されている、各タイルトラック１２２０−１〜１２２０−４を指し示す抽出器（矢印によって表現されている）をも含む。図示されているように、各タイルトラックは、「ｔｂａｓ」タイプを参照することによって、ＨＥＶＣベーストラックを識別する。

スケーラブルＨＥＶＣ（ＳＨＶＣ）フォーマットのようなタイル化および多層ビデオストリームの両方を考慮するとき、以下のような、いくつかのビットストリーム構成が可能である：
−ベースレイヤおよびエンハンスメントレイヤの両方がタイル化されない；
−ベースレイヤはタイル化され、エンハンスメントレイヤはタイル化されない；
−ベースレイヤはタイル化されず、エンハンスメントレイヤはタイル化される；ならびに
−ベースレイヤおよびエンハンスメントレイヤの両方がタイル化される。

抽出器を使用することによって、タイル化およびスケーラビリティ（多層）の両方を処理するためにビデオデータを効率的に編成することが可能になる。

図１３は、ベースレイヤおよびエンハンスメントレイヤを含むスケーラブルＨＥＶＣビットストリームの事例におけるトラック間の依存性の簡略化された概略図を示しており、ベースレイヤおよびエンハンスメントレイヤはタイル化されている（この例においては４つのタイル）。

ベースレイヤは、図１１および図１２を参照して説明されているように編成されている。ＢＬＢＴと表示されているベースレイヤベーストラックは、「ｓｃａｌ」タイプを参照することによって、ＢＬＴＴ１〜ＢＬＴＴ４と表示されている４つの関連するベースレイヤタイルトラックに対する依存性をシグナリングする。同様に、各ベースレイヤタイルトラックは、「ｔｂａｓ」タイプを参照することによって、ベースレイヤベーストラックを識別する。

ベースレイヤベーストラック内の各サンプルは、サンプル内の各タイルによって共有されるべきデータ（たとえば、パラメータセット、様々なＳＥＩメッセージ）を含む。ベースレイヤベーストラック内の各サンプルはまた、サンプルを構成する各ベースレイヤタイルトラックの関連するタイルサンプルを指し示す１つの抽出器をも含む。

同じ原理が、エンハンスメントレイヤに適用される。しかしながら、現行の規格における抽出器の定義によれば、抽出器は別の抽出器を直接的にまたは間接的に参照してはならないため、依存性の構造はより複雑である。

事実、ＥＬＢＴと表示されているエンハンスメントレイヤベーストラックは、抽出器を使用して、ベースレイヤベーストラック、ベースレイヤタイルトラック、および、ＥＬＴＴ１〜ＥＬＴＴ４と表示されているエンハンスメントレイヤタイルトラックを参照しなければならない。したがって、エンハンスメントレイヤベーストラックのサンプルは、以下のものから構成される：
−ベースレイヤベーストラックの共通のデータを指し示す１つの抽出器（抽出器１）；−各ベースレイヤタイルトラックを指し示す１つの抽出器（抽出器２〜５）；
−任意選択的に、ベースレイヤベーストラックの任意のＳＥＩサフィックスメッセージを指し示す抽出器（抽出器６＊）；
−エンハンスメントレイヤに共通のＮＡＬユニット；
−各エンハンスメントレイヤタイルトラックに対する１つの抽出器（抽出器７〜１０）；および
−任意選択的に、ＳＥＩサフィックスメッセージ。

現在の仕様に対応するこの構造は、エンハンスメントレイヤベーストラックの各サンプルにおいて多数の抽出器を必要とする。たとえば、２５Ｈｚにおける２×２タイル化を考慮すると、エンハンスメントレイヤベーストラックの抽出器を送信するために必要とされる帯域幅は２４ｋｂｐｓ（１０個の抽出器×１２バイト×２５Ｈｚ×８ビット）である。

同じ抽出器パターンがすべてのより上位の層にあるある層のタイルについて繰り返されるため、抽出器に関係するオーバヘッドは、各上層によって増大する。

そのように抽出器が増加することを回避するために、図１４に示されているように、再帰抽出器を使用することができる。

再帰抽出器は、１つ以上の抽出器を指し示すことができる抽出器である。そのようなエンハンスメントレイヤトラックがそのファイルフォーマットから抽出されると、それが含む全ての抽出器は、それらが参照しているデータに置き換えられる。参照されるデータも抽出器を含む場合、それらもまた論理的には、それらが参照しているデータに置き換えられ、以下同様である。抽出器の定義におけるパラメータｄａｔａ＿ｌｅｎｇｔｈの値は、可能性として再帰的に解決すべき何らかの抽出器が存在すべきか否かを判定するための手掛かりとして使用することができる。ｄａｔａ＿ｌｅｎｇｔｈパラメータは通常、コピーすべきバイト数を与える。それゆえ、ｄａｔａ＿ｌｅｎｇｔｈパラメータが「ｓｔｓｚ」または「ｔｒｕｎ」テーブルによって示されるものとして参照されるサンプルのサイズに等しい場合、参照されるサンプル内に存在する抽出器は再帰的に解決されるべきである。抽出器経路にはいかなるサイクルもあり得ない。

加えて、ビデオシーケンスの完全なタイルのサブセットのみが復号されなければならない場合、これは、ベーストラックを複合している間に何らかの抽出器を無視するために、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙおよびＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙサンプルグループ記述内のタイル依存性情報を使用するであろう。

図１４に示されているように、再帰抽出器を使用することによって、エンハンスメントレイヤベーストラックは、ベースレイヤベーストラックと関連付けられているベースレイヤタイルトラックを明示的に参照することなく、ベースレイヤベーストラックのみを参照すればよい。言い換えれば、ベースレイヤからの各タイルを明示的に参照する代わりに、エンハンスメントレイヤは、サンプルあたり１つのベースレイヤ抽出器のみを有する。それゆえ、エンハンスメントレイヤベーストラックのサンプルは、以下のものから構成される：
−ベースレイヤベーストラックの対応するサブサンプルを指し示す１つの抽出器（抽出器１）（ベースレイヤタイルトラックに対する抽出器を含む）；
−エンハンスメントレイヤに共通のＮＡＬユニット；
−各エンハンスメントレイヤタイルトラックに対する１つの抽出器（抽出器２〜５）；および
任意な、ＳＥＩサフィックスメッセージ。

非再帰抽出器の使用に基づくソリューションと比較して、再帰抽出器の使用は、必要とされる抽出器の数を低減することが可能である。たとえば、２５Ｈｚにおける２×２タイル化を考慮すると、エンハンスメントレイヤベーストラックの抽出器を送信するために必要とされる帯域幅は１２ｋｂｐｓ（５個の抽出器×１２バイト×２５Ｈｚ×８ビット）であり、これによって５０％の節約がもたらされる。その上、下層には１つの抽出器しか必要ないため、新規の層を追加しても、カプセル化オーバヘッドはわずかしか増大しない。

図１５は、多層タイル化ビデオビットストリームを効率的にカプセル化するためにサーバデバイスにおいて実行することができるステップの一例を示す。

図示されているように、第１のステップ（ステップ１５０１）は、タイル化およびスケーラビリティ特徴を提供する符号化器、たとえば、スケーラブルＨＥＶＣ規格に対応する符号化器を使用してビデオビットストリームを符号化することに関する。符号化ビットストリームは、層および／またはタイルを表すＮＡＬユニットから構成される。

次のステップ（ステップ１５０２）において、サーバデバイスは、タイルと関連付けられたすべてのＮＡＬユニットを識別し、各層について、所与の層内のあるタイルに対応するすべてのＮＡＬユニットから構成されるサブサンプルを含むタイルトラックを作成する。たとえば、サーバデバイスは、ＮＡＬユニットの種々のピクチャ領域との関連を識別するためにサブ画像レベルＳＥＩメッセージに依拠し、ＨＥＶＣ標準化委員会（ｐｒｏｐｏｓａｌＪＣＴＶＣ−Ｋ０１２８）に対して提案されているように各ＲＯＩの位置およびサイズを識別するためにシーケンスレベルＳＥＩメッセージに依拠しても良い。したがって、ある層および期間についてタイルのチューブを作成することができる。（すでに説明したように）タイル情報および依存性を識別するために、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙおよびＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙサンプルグループ記述構造を使用することができる。

次に、サーバデバイスは、各層について、すべてのタイルに共通のＮＡＬユニット、より下位のスケーラビリティのベーストラックに対する再帰抽出器（もしあれば）、および、現在の層のタイルトラックの各々に対する抽出器を含むベーストラックを作成する（ステップ１５０３）。抽出器が、それらが参照しているデータに置き換えられるときに、結果としてもたらされるビットストリームが、復号順序に順序付けられている完全なビデオサンプルから構成される有効なビットストリームであるように、抽出器および共通のＮＡＬユニットが、順序付けられることが好ましい。

次に、サーバデバイスは、ＩＳＯＢＭＦ表現に従って時間的周期を含むセグメントファイルを生成し、好ましくは、記憶する（ステップ１５０４）。ビデオメディアトラック（ベーストラックおよびタイルトラック）の各々が別個のセグメントファイルに記憶される。別の実施形態においては、すべてのメディアトラックが単一のＩＳＯＢＭＦファイルに記憶される。

ステップ１５０５において、サーバデバイスは、要求に応じて、要求しているクライアントデバイスにカプセル化データを供給する。

ある実施形態において、符号化データがいくつかのセグメントファイルにカプセル化されるとき、後者は、要求に応じてクライアントデバイスに供給される。そのような事例において、サーバデバイスは、ＨＴＴＰ要求に応答する従来のＨＴＴＰサーバであってもよい。

あるいは、たとえば、ＲＴＰストリーミングに対して、サーバデバイスは、クライアントデバイスによって要求される関心領域の層およびタイルに対応するビットストリームを抽出し、たとえば、ＲＴＰプロトコルを使用して、それらを送信する。

ビデオビットストリーム抽出は、サーバ側またはクライアント側のいずれにおいて行われてもよい。

ファイルフォーマットカプセル化なしに、ビデオビットストリームのみがクライアントデバイスに送信されるとき、ビデオビットストリーム抽出は、一般的に、サーバ側で行われる。これは特に、サーバデバイスが符号化ビットストリームをクライアントデバイスにプッシュするためにＲＴＰプロトコルを使用する場合に当てはまる。そのような事例において、サーバデバイスは、１つまたはいくつかのカプセル化ＩＳＯＢＭＦファイルからビデオビットストリームを抽出し、ＲＴＰプロトコルのようなプッシュプロトコルを使用して、このビデオビットストリームをクライアントデバイスにストリーミングする。

ビデオビットストリームがＩＳＯＢＭＦファイルセグメントとして交換されるとき、これは、クライアント側で行われる。そのような事例において、クライアントデバイスは、たとえば、ＤＡＳＨのようなＨＴＴＰストリーミングプロトコルを使用して、必要とされるメディアセグメントをサーバデバイスからダウンロードする。これは、ユーザの関心領域を表示するのに必要とされるメディアセグメントのみを選択するために、マニフェストを介してサーバデバイスと以前に交換されている、メディアプレゼンテイションの記述を使用することができる。必要とされるメディアセグメントは、必要とされる空間または時間層、ユーザの関心領域をカバーするタイル、ならびに、それらが依存するすべてのベースレイヤおよびタイルに対応する。これは、受信されるメディアセグメントを連結して、そこから必要とされるビデオビットストリームを抽出することができる対応したＩＳＯＢＭＦファイルを構築する。

図１６は、符号化多層タイル化ビデオビットストリームをカプセル開放するためにビットストリーム読み取り器（クライアントデバイス、たとえば、ビデオプレーヤ内、または、サーバデバイス、たとえば、ＲＴＰサーバ内の）において実行することができるステップの一例を示す。

第１のステップ（ステップ１６００）において、ビットストリーム読み取り器は、初期化データ、たとえば、一般的には「ｍｏｏｖ」ボックスの内容である、ＭＰＥＧ−４規格に対応するカプセル化ビットストリームの初期化データを読み出す。

次に、ステップ１６０１および１６０２において、利用可能である種々のトラック、サンプル、およびタイルが、トラックヘッダ、サンプルテーブル、ならびにＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙおよびＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙサンプルグループ記述を分析することによって識別される。

関心領域に対応するタイルおよびユーザから受信される要求に一致する層が識別された後（ステップ１６０３）、データが抽出され（ステップ１６０４）、復号され、（一般的には）表示されるために、ビデオ復号器に提供される（ステップ１６０５）。

データは、図１７に示されているアルゴリズムに従って抽出することができる。

図１７は、再帰抽出器を含むトラックからビデオデータを抽出するためのアルゴリズムの一例を示す。

処理（一般的には表示）されるべき層がステップ１６０３（図１６）において識別されると、ビットストリーム読み取り器は、現在の層の識別子を最上層の識別子として記録し（ステップ１７０１）、要求される層と関連付けられたベーストラックから次のＮＡＬユニットを得る（ステップ１７０２）。実例として、要求される層は、図１４を参照して説明されているエンハンスメントレイヤベーストラックであってもよい。

その後、ＮＡＬユニットが利用可能であるか否かを判定するためのテストが実施される（ステップ１７０３）。ＮＡＬユニットが利用可能である場合、このＮＡＬユニットが抽出器であるか否かを判定するための別のテストが実施される（ステップ１７０４）。ＮＡＬユニットが抽出器でない場合、データが復号器に提供され（ステップ１７０５）、アルゴリズムはステップ１７０２に分岐して、次のＮＡＬユニット（もしあれば）が得られる。

反対に、ＮＡＬユニットが抽出器である場合、抽出器のパラメータｄａｔａ＿ｌｅｎｇｔｈが「ｓｔｓｚ」または「ｔｒｕｎ」テーブルによって示されるような参照されるサンプルのサイズに等しいか否かを判定するために別のテストが実施される（ステップ１７０６）。

抽出器のパラメータｄａｔａ＿ｌｅｎｇｔｈが参照されるサンプルのサイズに等しい場合、参照されるサンプル内に存在する抽出器は再帰的に解決される。そのために、現在の層の識別子が、先行する層の識別子としてメモリ内に記憶され、現在の層の識別子は、抽出器によって指摘されるトラックの層の識別子として設定される（ステップ１７０７）。次に、図１７に示されているアルゴリズムを抽出器によって指し示されるデータに適用するように、アルゴリズムはステップ１７０２に分岐する。

反対に、パラメータｄａｔａ＿ｌｅｎｇｔｈが参照されるサンプルのサイズに等しくない場合、抽出器によって指摘されるデータがユーザによって選択される関心領域に関連するか否か（たとえば、抽出器がタイルトラックを指し示す場合、これは、タイルの座標が選択された領域の内部に位置するか否かをチェックする）、または、抽出器によって指し示されるデータが、他のデータがそのデータに依存するので、必要とされるか否か（たとえば、抽出器は、ＴｉｌｅＳｅｔＧｒｏｕｐＥｎｔｒｙサンプルグループ記述において記述されているように現在選択されている別のタイルトラックの依存性リスト内にリストされているタイルトラックを指し示す）を判定するために、別のテストが実施される（ステップ１７０８）。これらの条件の１つが満たされる場合、抽出器は解決され、指し示されるデータに置き換えられる（ステップ１７０９）。そうでない場合、抽出器は無視される（ステップ１７１０）。次に、アルゴリズムはステップ１７０２に分岐して、次のＮＡＬユニット（もしあれば）が得られる。

ステップ１７０３において利用可能なＮＡＬユニットがない場合、現在の層の識別子が、アルゴリズムの開始時に選択された層（最上層）の識別子であるか否かを判定するためのテストが実施される。現在の層がアルゴリズムの開始時に選択された層でない場合、実行は先行する層で継続する（ステップ１７１２）。反対に、現在の層がアルゴリズムの開始時に選択された層である場合、アルゴリズムは停止する。

図１８は、１つ以上の実施形態のステップを実施することができるサーバまたはクライアントデバイス１８００のブロック図を示す。

デバイス１８００は、通信バス１８０２と、デバイスが電源投入されたときにプログラムＲＯＭ１８０６からの命令を実行し、電源投入後にメインメモリ１８０８からのソフトウェアアプリケーションに関係する命令を実行することが可能な中央処理装置（ＣＰＵ）１８０４とを備えることが好ましい。メインメモリ１８０８は、たとえば、通信バス１８０２を介してＣＰＵ１８０４の作業領域として機能するランダムアクセスメモリ（ＲＡＭ）タイプのものであり、そのメモリ容量は、拡張ポート（図示せず）に接続される任意選択のＲＡＭによって拡張することができる。ソフトウェアアプリケーションに関係する命令は、たとえば、ハードディスク（ＨＤ）１８１０またはプログラムＲＯＭ１８０６からメインメモリ１８０８にロードされるであろう。そのようなソフトウェアアプリケーションは、ＣＰＵ１８０４によって実行されると、図１５を参照して説明されたステップをサーバにおいて実施させ、図１６および図１７を参照して説明されたステップをサーバまたはクライアントデバイスにおいて実施させる。

参照符号１８１２は、デバイス１８００の通信ネットワーク１８１４への接続を可能にするネットワークインターフェースである。ソフトウェアアプリケーションは、ＣＰＵ１８０４によって実行されると、ネットワークインターフェースを通じて受信される要求に反応し、ネットワークを介して他のデバイスにデータストリームおよび要求を提供するように構成されている。

参照符号１８１６は、ユーザに情報を提示し、かつ／またはユーザからの入力を受信するためのユーザインターフェースを示す。

ここで、変形形態として、マルチメディアビットストリームの受信または送信を管理するためのデバイス１８００は、図１５、図１６、および図１７を参照して説明された方法を実施することが可能である１つ以上の専用集積回路（ＡＳＩＣ）から構成することができることを指摘しておくべきである。これらの集積回路は、たとえば、非限定的に、ビデオシーケンスを生成もしくは表示し、および／またはオーディオシーケンスを聴くための装置に統合される。

本発明の実施形態は、たとえば、特定の関心領域にズームインするために、カメラ、スマートフォン、または、ＴＶのリモートコントローラとして機能するタブレットのようなデバイスに組み込まれてもよい。それらはまた、特定の関心領域を選択することによって、ＴＶ番組のパーソナライズされた閲覧体験を有するために同じデバイスから使用することもできる。ユーザによるこれらのデバイスの別の使用法は、他の接続されたデバイスを用いて、ユーザが好むビデオの選択された下位区分を共有することである。それらはまた、監視カメラが本発明の生成部分をサポートしていることを条件として、監視下に置かれる建造物の特定領域で何が起こるかをモニタリングするために、スマートフォンまたはタブレット内で使用することもできる。

当然ながら、ローカルなおよび特定の要件を満たすために、当業者は、上述したソルーションに多くの修正および変更を適用することができるが、これらのすべてが添付の特許請求の範囲によって規定されているような本発明の保護範囲内に含まれる。
なお、上述の実施形態は、以下のように表現することもできる。
本発明の第１のグループの態様によれば、出願時の（以下同じ）請求項１によって定義されているような、サーバ内で多層分割タイムドメディアデータをカプセル化するための方法、請求項８によって定義されているような、クライアントデバイスにおいて多層分割タイムドメディアデータをカプセル開放（または解析）するための方法、請求項１５によって定義されているような、コンピュータまたはプロセッサによって実行されると、コンピュータまたはプロセッサにカプセル化方法を実行させるプログラム、同じく請求項１５によって定義されているような、コンピュータまたはプロセッサによって実行されると、コンピュータまたはプロセッサにカプセル開放（または解析）方法を実行させるプログラム、請求項１６によって定義されているような、カプセル化プログラムおよび／またはカプセル開放（または解析）プログラムを記憶しているコンピュータ可読記憶媒体、請求項１７によって定義されているような、多層分割タイムドメディアデータをカプセル化するためのデバイス、請求項２４によって定義されているような、多層分割タイムドメディアデータをカプセル開放（または解析）するためのデバイス、請求項３１によって定義されているような、カプセル化方法によってカプセル化されている多層分割タイムドメディアデータの少なくとも一部分を含むメディアセグメントファイル、請求項３２によって定義されているような、メディアセグメントファイルを記憶しているコンピュータ可読記憶媒体、ならびに、請求項３３によって定義されているような、カプセル化方法によってカプセル化されている多層分割タイムドメディアデータの少なくとも一部分を搬送している信号が提供される。

本発明の第２のグループの態様によれば、請求項３４によって定義されているような、サーバ内で多層分割タイムドメディアデータをカプセル化するための方法、請求項４７によって定義されているような、クライアントデバイスにおいて多層分割タイムドメディアデータをカプセル開放（または解析）するための方法、請求項６０によって定義されているような、コンピュータまたはプロセッサによって実行されると、コンピュータまたはプロセッサにカプセル化方法を実行させるプログラム、同じく請求項６０によって定義されているような、コンピュータまたはプロセッサによって実行されると、コンピュータまたはプロセッサにカプセル開放（または解析）方法を実行させるプログラム、請求項６１によって定義されているような、カプセル化プログラムおよび／またはカプセル開放（または解析）プログラムを記憶しているコンピュータ可読記憶媒体、請求項６２によって定義されているような、多層分割タイムドメディアデータをカプセル化するためのデバイス、請求項７５によって定義されているような、多層分割タイムドメディアデータをカプセル開放（または解析）するためのデバイス、請求項８８によって定義されているような、カプセル化方法によってカプセル化されている多層分割タイムドメディアデータの少なくとも一部分を含むメディアセグメントファイル、請求項８９によって定義されているような、メディアセグメントファイルを記憶しているコンピュータ可読記憶媒体、ならびに、請求項９０によって定義されているような、カプセル化方法によってカプセル化されている多層分割タイムドメディアデータの少なくとも一部分を搬送している信号が提供される。

第１のグループおよび／または第２のグループの態様のある実施形態において、多層とは２つ以上の層、たとえば、ベースレイヤおよびエンハンスメントレイヤを意味し、サンプルとは、単一のタイムスタンプ（たとえば、ベースレイヤ内のフレームおよびエンハンスメントレイヤ内のフレーム）と関連付けられたすべてのデータを意味し、サブサンプルは、タイルまたはタイルセットのような、空間サブサンプルである。タイルとは、たとえば、フレーム内の矩形領域を意味し、タイルセットとは、任意の数のタイルの組み合わせを意味する。

本発明の第３のグループの態様は、抽出器に関する。これらの態様は、たとえば、サーバにおいて多層分割タイムドメディアデータをカプセル化するための方法を含み、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、ベースレイヤおよび少なくとも１つのエンハンスメントレイヤに符号化され、少なくとも１つのタイムドサンプルは少なくとも１つのタイルを含み、各タイルはベースレイヤまたは少なくとも１つのエンハンスメントレイヤに符号化され、前記方法は、
ベースレイヤタイルトラックを作成することと、
ベースレイヤタイルトラック内のデータを指し示す第１の抽出器を備えるベースレイヤベーストラックを作成することと、
ベースレイヤベーストラック内の第１の抽出器を指し示す第２の抽出器を備えるエンハンスメントレイヤトラックを作成することとを含み、
それによって、ベースレイヤタイルトラック内の前記データは、エンハンスメントレイヤトラック内の第２の抽出器から、当該データ自体に対するベースレイヤベーストラック内の第１の抽出器への抽出器経路に従うことによって取得可能である。

エンハンスメントレイヤトラックは、エンハンスメントレイヤベーストラックであることが好ましい。

カプセル化方法は、エンハンスメントレイヤタイルトラックを作成するステップをさらに含んでも良く、エンハンスメントレイヤベーストラックは、エンハンスメントレイヤタイルトラック内のデータを指し示す第３の抽出器をさらに備える。

本発明の第３のグループの態様の変形形態もまた、抽出器に関する。これらの態様は、たとえば、サーバにおいて多層タイムドメディアデータをカプセル化するための方法を含み、多層タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、ベースレイヤおよび少なくとも２つのエンハンスメントレイヤに符号化され、前記方法は、ベースレイヤトラックを作成することと、
ベースレイヤトラック内のデータを指し示す第１の抽出器を備えるエンハンスメントレイヤトラックを作成することと、
エンハンスメントレイヤトラック内の第１の抽出器を指し示す第２の抽出器を備える別のエンハンスメントレイヤトラックを作成すること、とを含み、
それによって、ベースレイヤトラック内の前記データは、別のエンハンスメントレイヤトラック内の第２の抽出器から、ベースレイヤトラックのデータに対するエンハンスメントレイヤトラック内の第１の抽出器への抽出器経路に従うことによって取得可能である。本発明の第３のグループの態様はまた、たとえば、クライアントデバイスにおいて多層分割タイムドメディアデータをカプセル開放（または解析）するための方法をも含み、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、ベースレイヤおよび少なくとも１つのエンハンスメントレイヤに符号化され、少なくとも１つのタイムドサンプルは少なくとも１つのタイルを含み、各タイルはベースレイヤおよび少なくとも１つのエンハンスメントレイヤに符号化され、前記方法は、
ベースレイヤタイルトラックを得ることと、
ベースレイヤタイルトラック内のデータを指し示す第１の抽出器を備えるベースレイヤベーストラックを得ることと、
ベースレイヤベーストラック内の第１の抽出器を指し示す第２の抽出器を備えるエンハンスメントレイヤトラックを得ることと、
エンハンスメントレイヤトラック内の第２の抽出器から、当該データ自体に対するベースレイヤベーストラック内の第１の抽出器への抽出器経路に従うことによって、ベースレイヤタイルトラック内のデータを得ることと、を含む。

カプセル開放（または解析）方法は、
エンハンスメントレイヤタイルトラックを受信することであって、エンハンスメントレイヤベーストラックが、エンハンスメントレイヤタイルトラック内のデータを指し示す第３の抽出器をさらに備える、エンハンスメントレイヤタイルトラックを受信することと、エンハンスメントレイヤベーストラック内の第３の抽出器からエンハンスメントレイヤタイルトラック内のデータ自体への抽出器経路に従うことによって、エンハンスメントレイヤタイルトラック内のデータを得ることと、をさらに含むことができる。

本発明の第３のグループの態様の変形形態はまた、たとえば、クライアントにおいて多層タイムドメディアデータをカプセル開放するための方法をも含み、多層タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルはベースレイヤおよび少なくとも２つのエンハンスメントレイヤに符号化され、前記方法は、
ベースレイヤトラックを得ることと、
ベースレイヤトラック内のデータを指し示す第１の抽出器を備えるエンハンスメントレイヤトラックを得ることと、
エンハンスメントレイヤトラック内の第１の抽出器を指し示す第２の抽出器を備える別のエンハンスメントレイヤトラックを得ることと、を含み、
それによって、ベースレイヤトラック内の前記データは、別のエンハンスメントレイヤトラック内の第２の抽出器から、ベースレイヤトラックのデータに対するエンハンスメントレイヤトラック内の第１の抽出器への抽出器経路に従うことによって取得可能である。

本発明の第３のグループの態様はまた、多層分割タイムドメディアデータをカプセル化するためのデバイスをも含み、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、ベースレイヤおよび少なくとも１つのエンハンスメントレイヤに符号化され、少なくとも１つのタイムドサンプルは少なくとも１つのタイルを含み、各タイルはベースレイヤまたは少なくとも１つのエンハンスメントレイヤに符号化され、前記デバイスは、
ベースレイヤタイルトラックを作成するための手段と、
ベースレイヤタイルトラック内のデータを指し示す第１の抽出器を備えるベースレイヤベーストラックを作成するための手段と、
ベースレイヤベーストラック内の第１の抽出器を指し示す第２の抽出器を備えるエンハンスメントレイヤトラックを作成するための手段と、を備え、
それによって、ベースレイヤタイルトラック内の前記データは、エンハンスメントレイヤトラック内の第２の抽出器から、当該データ自体に対するベースレイヤベーストラック内の第１の抽出器への抽出器経路に従うことによって取得可能である。

カプセル化デバイスは、エンハンスメントレイヤタイルトラックを作成するための手段をさらに備えても良く、エンハンスメントレイヤベーストラックは、エンハンスメントレイヤタイルトラック内のデータを指し示す第３の抽出器をさらに備える。

本発明の第３のグループの態様の変形形態はまた、たとえば、サーバ内に含まれる多層タイムドメディアデータをカプセル化するためのデバイスをも含み、多層タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルはベースレイヤおよび少なくとも２つのエンハンスメントレイヤに符号化され、前記デバイスは、
ベースレイヤトラックを作成するための手段と、
ベースレイヤトラック内のデータを指し示す第１の抽出器を備えるエンハンスメントレイヤトラックを作成するための手段と、
エンハンスメントレイヤトラック内の第１の抽出器を指し示す第２の抽出器を備える別のエンハンスメントレイヤトラックを作成するための手段と、を備え、
それによって、ベースレイヤトラック内の前記データは、別のエンハンスメントレイヤトラック内の第２の抽出器から、ベースレイヤトラックのデータに対するエンハンスメントレイヤトラック内の第１の抽出器への抽出器経路に従うことによって取得可能である。

本発明の第３のグループの態様はまた、多層分割タイムドメディアデータをカプセル開放（または解析）するためのデバイスをも含み、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、ベースレイヤおよび少なくとも１つのエンハンスメントレイヤに符号化され、少なくとも１つのタイムドサンプルは少なくとも１つのタイルを含み、各タイルはベースレイヤまたは少なくとも１つのエンハンスメントレイヤに符号化され、デバイスは、
ベースレイヤタイルトラックを得るための手段と、
ベースレイヤタイルトラック内のデータを指し示す第１の抽出器を備えるベースレイヤベーストラックを得るための手段と、
ベースレイヤベーストラック内の第１の抽出器を指し示す第２の抽出器を備えるエンハンスメントレイヤトラックを得るための手段と、
エンハンスメントレイヤトラック内の第２の抽出器から、当該データ自体に対するベースレイヤベーストラック内の第１の抽出器への抽出器経路に従うことによって、ベースレイヤタイルトラック内のデータを得るための手段と、を備える。

前記カプセル開放（または解析）デバイスは、
エンハンスメントレイヤタイルトラックを受信するための手段であって、エンハンスメントレイヤベーストラックが、エンハンスメントレイヤタイルトラック内のデータを指し示す第３の抽出器をさらに備える、エンハンスメントレイヤタイルトラックを受信するための手段と、
エンハンスメントレイヤベーストラック内の第３の抽出器からエンハンスメントレイヤタイルトラック内のデータ自体への抽出器経路に従うことによって、エンハンスメントレイヤタイルトラック内のデータを得るための手段と、をさらに備えても良い。

本発明の前記第３のグループの態様の変形形態はまた、たとえば、クライアント内に含まれる多層タイムドメディアデータをカプセル開放するためのデバイスをも含み、多層タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルはベースレイヤおよび少なくとも２つのエンハンスメントレイヤに符号化され、前記デバイスは、
ベースレイヤトラックを得るための手段と、
ベースレイヤトラック内のデータを指し示す第１の抽出器を備えるエンハンスメントレイヤトラックを得るための手段と、
エンハンスメントレイヤトラック内の第１の抽出器を指し示す第２の抽出器を備える別のエンハンスメントレイヤトラックを得るための手段と、を備え、
それによって、ベースレイヤトラック内の前記データは、別のエンハンスメントレイヤトラック内の第２の抽出器から、ベースレイヤトラックのデータに対するエンハンスメントレイヤトラック内の第１の抽出器への抽出器経路に従うことによって取得可能である。第３の態様グループのさらなる態様およびその変形形態は、コンピュータまたはプロセッサによって実行されると、コンピュータまたはプロセッサにカプセル化方法を実行させるプログラム、コンピュータまたはプロセッサによって実行されると、コンピュータまたはプロセッサにカプセル開放（または解析）方法を実行させるプログラム、カプセル化プログラムおよび／またはカプセル開放（または解析）プログラムを記憶しているコンピュータ可読記憶媒体、カプセル化方法によってカプセル化されている多層分割タイムドメディアデータの少なくとも一部分を含むメディアセグメントファイル、メディアセグメントファイルを記憶しているコンピュータ可読記憶媒体、ならびに、カプセル化方法によってカプセル化されている多層分割タイムドメディアデータの少なくとも一部分を搬送している信号を提供することができる。

本発明の別の態様によれば、サーバにおいて分割タイムドメディアデータをカプセル化するための方法が提供され、分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルはフレームを規定し、少なくとも１つのタイムドサンプルは少なくとも１つのサブサンプルを含み、前記方法は、
タイムドサンプルの少なくとも１つから少なくとも１つのサブサンプルを得ることと、少なくとも１つの得られたサブサンプルを含むトラックを作成することと、
作成されたトラックと関連付けられた記述メタデータを生成することであって、記述メタデータは、設定されると、少なくとも１つの得られたサブサンプルが完全なフレームであることを示すパラメータを含む、記述メタデータを生成することとを含む。

これらの制約に直面し、本発明者らは、サーバにおいて多層タイル化タイムドメディアデータをカプセル化し、複数のメディアセグメントファイル内にカプセル化されている多層タイル化タイムドメディアデータからタイムドメディアデータビットストリームを提供するための方法およびデバイスを提供する。
本発明の広範な目的は、上述したような従来技術の欠点を改善することである。

本発明の第１の態様によれば、サーバにおいて多層分割タイムドメディアデータをカプセル化するための方法が提供され、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第１の層および少なくとも１つの第２の層に符号化され、少なくとも１つのタイムドサンプルは少なくとも１つのサブサンプルを含み、各サブサンプルは第１の層または少なくとも１つの第２の層に符号化され、前記方法は、
タイムドサンプルの少なくとも１つから少なくとも１つのサブサンプルを得ることと、少なくとも１つの得られたサブサンプルを含むトラックを作成することと、
作成されたトラックと関連付けられた記述メタデータを生成することとを含み、記述メタデータは、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の依存関係をシグナリングするための記述子を含み、依存関係は、
少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが同じ層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層内依存性を記述し、
少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが異なる層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層間依存性を記述する。

したがって、本発明は、多層ビデオストリームの複数の異なる部分、特に、複数の異なるタイルの組み合わせ、および、解析時に、クライアントデバイスによってダウンロードされる部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットおよびエレメンタリストリームを作成することを可能にする。

それゆえ、本発明の方法は、多層ビデオストリームの独立した部分またはタイルの効率的なストリーミングに適しており、標準規格、特にＭＰＥＧ−４Ｐａｒｔ１５規格に容易に組み込むための既存のツールを使用し、タイル化から脱相関された、タイルレベルにおける動的な層間依存性をサポートし、２つ以上の部分またはタイル選択（すなわち、任意のＲＯＩ）に適しており、抽出器を使用して層間依存性を処理することによって引き起こされるオーバヘッドを制限する。

層のサブサンプルは、別の層の１つ以上のサブサンプルまたは複数の異なる層のいくつかのサブサンプルにリンクされ得ることが留意されるべきである。

ある実施形態において、多層分割タイムドメディアデータは多層タイル化タイムドメディアデータであり、サブサンプルは空間サブサンプルである。

ある実施形態において、作成されたトラックと関連付けられた記述メタデータは、少なくとも１つの得られたサブサンプルが、タイムドサンプルの少なくとも１つのすべてのメディアデータを含む、同じ層に属する少なくとも１つのサブサンプルよりなるセットを含むか否かを示すパラメータを含む。

ある実施形態において、作成されたトラックと関連付けられた記述メタデータは、少なくとももう１つのサブサンプルが、作成されたトラックと関連付けられた記述メタデータ内でどのように記述されているかを示すパラメータを含む。

ある実施形態において、前記方法は、作成されたトラックのサブサンプルの少なくとも２つのサブサンプルグループを作成するステップをさらに含み、作成されたトラックと関連付けられた記述メタデータは、サブサンプルグループの各々の定義を含み、サブサンプルグループの各々の定義は、対応するサブサンプルグループの各サブサンプルの依存関係を含む。

ある実施形態において、前記方法は、作成されたトラックのサブサンプルの少なくとも１つのサブサンプルグループを作成するステップをさらに含み、作成されたトラックと関連付けられた記述メタデータは、作成されたサブサンプルグループに属しない、作成されたトラックの各サブサンプルの依存関係を含む第１の定義と、サブサンプルグループの各サブサンプルの依存関係を含む、第２の定義とよばれる、作成されたサブサンプルグループの定義とを含む。

ある実施形態において、依存関係はリストに編成され、リストの数は、サンプルを符号化するために使用される層の数に等しく、各リストは、層の降順もしくは昇順に編成されるか、または、層識別子と関連付けられる。

ある実施形態において、依存関係は、各サブサンプルおよび各層のすべての依存関係を含む１つのリストに編成される。

ある実施形態において、各層は、層識別子の関数として識別され、依存関係は、共在するサブサンプルの層識別子を含む１つのリストに編成される。

ある実施形態において、前記方法は、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを作成するステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、第１のトラックを作成するステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを作成するステップであって、少なくとも１つの第２のサブサンプルは、上記少なくとも１つの第１のサンプルの少なくとも１つの項目のサブサンプルであり、第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、第２のトラックを作成するステップと、を含み、
第３のトラックとよばれる、少なくとも１つの得られたサブサンプルを含む作成されたトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器を備え、少なくとも１つの得られたサブサンプルは、少なくとも１つの第２の層に属する。

ある実施形態において、前記方法は、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを作成するステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、第１のトラックを作成するステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを作成するステップであって、少なくとも１つの第２のサブサンプルは、上記少なくとも１つの第１のサンプルの少なくとも１つの項目のサブサンプルであり、第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、第２のトラックを作成するステップと、
少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを作成するステップであって、当該第３のトラックのサンプルの項目は上記少なくとも１つの第２の層に属する、第３のトラックを作成するステップと、をさらに含み、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含む作成されたトラック、第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、少なくとも１つの得られたサブサンプルは、上記少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある実施形態において、前記方法は、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを作成するステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、第１のトラックを作成するステップと、
少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを作成するステップであって、当該第３のトラックのサンプルの項目は上記少なくとも１つの第２の層に属する、第３のトラックを作成するステップと、をさらに含み、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含む作成されたトラック、第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、少なくとも１つの得られたサブサンプルは、上記少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある実施形態において、抽出器は、サンプルの項目のサイズ、または、作成された抽出器によって指摘される層のサブサンプルのサイズに基づく基準値の関数として作成される。

ある実施形態において、作成されたトラックの各々をカプセル化する結果としてもたらされるメディアセグメントファイルは、国際標準化機構によって定義されているものとしてのベースメディアファイルフォーマット（ＢａｓｅＭｅｄｉａＦｉｌｅＦｏｒｍａｔ）に適合する。

本発明の第２の態様によれば、サーバまたはクライアントデバイスにおいて、少なくとも１つのメディアセグメントファイル内にカプセル化されている多層分割タイムドメディアデータから多層タイムドメディアデータビットストリームを提供するための方法が提供され、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第１の層および少なくとも１つの第２の層に符号化され、少なくとも１つのタイムドサンプルは、第１の層または少なくとも１つの第２の層に符号化されている少なくとも１つのサブサンプルを含み、前記少なくとも１つのメディアセグメントファイルは、タイムドサンプルの少なくとも１つから得られる少なくとも１つのサブサンプルを含む少なくとも１つのトラックを含み、
少なくとも１つのメディアセグメントファイルは、少なくとも１つのトラックと関連付けられた記述メタデータと関連付けられ、記述メタデータは、少なくとも１つのサブサンプルと少なくとももう１つのサブサンプルとの間の依存関係をシグナリングするための記述子を含み、依存関係は、少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが同じ層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層内依存性を記述し、少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが異なる層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層間依存性を記述し、前記方法は、
サブサンプルを表す情報項目を選択することと、
選択されたサブサンプルを含む少なくとも１つのトラックを要求することであって、選択されたサブサンプルは、選択された情報項目に対応する、
少なくとも１つのメディアセグメントファイルおよび記述メタデータを受信することと、
多層タイムドメディアデータビットストリームを生成するために少なくとももう１つのサブサンプルを識別することと、を含む。

それゆえ、本発明の方法は、多層ビデオストリームの独立した部分またはタイルの効率的なストリーミングに適しており、標準規格、特にＭＰＥＧ−４Ｐａｒｔ１５規格に容易に組み込むための既存のツールを使用し、タイル化から脱相関された、タイルレベルで動的な層間依存性をサポートし、２つ以上の部分またはタイル選択（すなわち、任意のＲＯＩ）に適しており、抽出器を使用して層間依存性を処理することによって引き起こされるオーバヘッドを制限する。

ある実施形態において、前記方法は、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとも１つの得られたサブサンプルが、前記タイムドサンプルの少なくとも１つのすべてのメディアデータを含む、同じ層に属する少なくとも１つのサブサンプルよりなるセットを含むか否かを示すパラメータを得るステップをさらに含む。

ある実施形態において、前記方法は、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとももう１つのサブサンプルが、少なくとも１つのトラックと関連付けられた記述メタデータ内でどのように記述されているかを示すパラメータを得るステップをさらに含む。

ある実施形態において、前記方法は、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとも１つのトラックの少なくとも２つのサブサンプルグループの定義を得るステップをさらに含み、得られる定義は、対応するサブサンプルグループの各サブサンプルの依存関係を含む。

ある実施形態において、前記方法は、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとも１つのトラックのサブサンプルの少なくとも１つのサブサンプルグループの定義を得るステップをさらに含み、第１の定義とよばれる、少なくとも１つのサブサンプルグループの定義は、少なくとも１つのサブサンプルグループの各サブサンプルの依存関係を含み、第２の定義は、少なくとも１つのサブサンプルグループに属しない、少なくとも１つのトラックの各サブサンプルの依存関係を含む。

ある実施形態において、前記方法は、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを得るステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを得るステップであって、少なくとも１つの第２のサブサンプルは、少なくとも１つの第１のサンプルのサブサンプルであり、第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、ステップと、をさらに含み、
第３のトラックとよばれる、少なくとも１つの得られたサブサンプルを含むトラックは、少なくとも１つの第１のサンプルを指し示す少なくとも１つの第３の抽出器を備え、少なくとも１つの得られたサブサンプルは、少なくとも１つの第２の層に属する。

ある実施形態において、前記方法は、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを得るステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを得るステップであって、少なくとも１つの第２のサブサンプルは、少なくとも１つの第１のサンプルのサブサンプルであり、第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、ステップと、
少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを得るステップであって、第３のトラックのサンプルの項目は少なくとも１つの第２の層に属する、ステップと、をさらに含み、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含むトラック、第３のトラックは、少なくとも１つの第１のサンプルの前記少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、少なくとも１つの得られたサブサンプルは、少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある実施形態において、前記方法は、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを得るステップであって、第１のトラックのサンプルの項目は第１の層に属する、ステップと、少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを得るステップであって、第３のトラックのサンプルの項目は少なくとも１つの第２の層に属する、ステップと、をさらに含み、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含むトラック、第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、少なくとも１つの得られたサブサンプルは、少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある実施形態において、抽出器は、サンプルの項目のサイズ、または、作成された抽出器によって指摘される層のサブサンプルのサイズに基づく基準値の関数として識別される。

ある実施形態において、識別された抽出器によって指摘されるデータの抽出は、依存関係のパラメータの関数として決定される。

ある実施形態において、作成されたトラックの各々をカプセル化する結果としてもたらされるメディアセグメントファイルは、国際標準化機構によって定義されているベースメディアファイルフォーマットに適合する。

本発明の第３の態様によれば、サーバにおいて多層分割タイムドメディアデータをカプセル化するためのデバイスが提供され、多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第１の層および少なくとも１つの第２の層に符号化され、少なくとも１つのタイムドサンプルは少なくとも１つのサブサンプルを含み、各サブサンプルは第１の層または少なくとも１つの第２の層に符号化され、デバイスはプロセッサを備え、当該プロセッサは、以下のステップを実行するよう構成される。
前記タイムドサンプルの少なくとも１つから少なくとも１つのサブサンプルを得るステップと、
前記少なくとも１つの得られたサブサンプルを含むトラックを作成するステップと、
前記作成されたトラックと関連付けられた記述メタデータを生成するステップであって、記述メタデータは、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の依存関係をシグナリングするための記述子を含み、依存関係は、
少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが同じ層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層内依存性を記述し、
少なくとも１つの得られたサブサンプルおよび前記少なくとももう１つのサブサンプルが異なる層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層間依存性を記述する。

それゆえ、本発明のデバイスは、多層ビデオストリームの独立した部分またはタイルの効率的なストリーミングに適しており、標準規格、特にＭＰＥＧ−４Ｐａｒｔ１５規格に容易に組み込むための既存のツールを使用し、タイル化から脱相関された、タイルレベルにおける動的な層間依存性をサポートし、２つ以上の部分またはタイル選択（すなわち、任意のＲＯＩ）に適しており、抽出器を使用して層間依存性を処理することによって引き起こされるオーバヘッドを制限する。

ある実施形態によれば、前記プロセッサは、多層分割タイムドメディアデータが多層タイル化タイムドメディアデータであるようにさらに構成されており、サブサンプルは空間サブサンプルである。

ある実施形態によれば、前記プロセッサは、少なくとも１つの得られたサブサンプルが、タイムドサンプルの少なくとも１つのすべてのメディアデータを含む、同じ層に属する少なくとも１つのサブサンプルよりなるセットを含むか否かを示すパラメータを、作成されたトラックと関連付けられた記述メタデータが含むようにさらに構成されている。

ある実施形態によれば、前記プロセッサは、少なくとももう１つのサブサンプルが、作成されたトラックと関連付けられた記述メタデータ内でどのように記述されているかを示すパラメータを、作成されたトラックと関連付けられた記述メタデータが含むようにさらに構成されている。

ある実施形態によれば、前記プロセッサは、作成されたトラックのサブサンプルの少なくとも２つのサブサンプルグループを作成するステップを実行するようにさらに構成されており、作成されたトラックと関連付けられた記述メタデータは、サブサンプルグループの各々の定義を含み、サブサンプルグループの各々の定義は、対応するサブサンプルグループの各サブサンプルの依存関係を含む。

ある実施形態によれば、前記プロセッサは、作成されたトラックのサブサンプルの少なくとも１つのサブサンプルグループを作成するステップを実行するようにさらに構成されており、作成されたトラックと関連付けられた記述メタデータは、作成されたサブサンプルグループに属しない、作成されたトラックの各サブサンプルの依存関係を含む第１の定義と、サブサンプルグループの各サブサンプルの依存関係を含む、第２の定義とよばれる、作成されたサブサンプルグループの定義とを含む。

ある実施形態によれば、前記プロセッサは、依存関係がリストに編成されるようにさらに構成されており、リストの数は、サンプルを符号化するために使用される層の数に等しく、各リストは、層の降順もしくは昇順に編成されるか、または、層識別子に関連付けられる。

ある実施形態によれば、前記プロセッサは、依存関係が、各サブサンプルおよび各層のすべての依存関係を含む１つのリストに編成されるようにさらに構成されている。

ある実施形態によれば、前記プロセッサは、各層が、層識別子の関数として識別されるようにさらに構成されており、依存関係は、共在するサブサンプルの層識別子を含む１つのリストに編成される。

ある実施形態によれば、前記プロセッサは、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを作成するステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを作成するステップであって、前記少なくとも１つの第２のサブサンプルは、前記少なくとも１つの第１のサンプルの少なくとも１つの項目のサブサンプルであり、第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、第２のトラックを作成するステップと、を実行するようにさらに構成されている、ステップと、を実行するようにさらに構成されており、
第３のトラックとよばれる、少なくとも１つの得られたサブサンプルを含む作成されたトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器を備え、前記少なくとも１つの得られたサブサンプルは、少なくとも１つの第２の層に属する。

ある実施形態によれば、プロセッサは、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを作成するステップであって、前記第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを作成するステップであって、前記少なくとも１つの第２のサブサンプルは、前記少なくとも１つの第１のサンプルの少なくとも１つの項目のサブサンプルであり、前記第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、ステップと、少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを作成するステップであって、前記第３のトラックのサンプルの項目は前記少なくとも１つの第２の層に属する、ステップと、を実行するようにさらに構成されており、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含む作成されたトラック、前記第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、前記少なくとも１つの得られたサブサンプルは、上記少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある実施形態によれば、前記プロセッサは、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを作成するステップであって、前記第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを作成するステップであって、前記第３のトラックのサンプルの項目は上記少なくとも１つの第２の層に属する、ステップと、を実行するようにさらに構成されており、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含む作成されたトラック、前記第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、前記少なくとも１つの得られたサブサンプルは、前記少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある実施形態によれば、前記プロセッサは、抽出器が、サンプルの項目のサイズ、または、作成された抽出器によって指摘される層のサブサンプルのサイズに基づく基準値の関数として作成されるようにさらに構成されている。

ある実施形態によれば、前記プロセッサは、作成されたトラックの各々をカプセル化する結果としてもたらされるメディアセグメントファイルが、国際標準化機構によって定義されているものとしてのベースメディアファイルフォーマットに適合するようにさらに構成されている。

本発明の第４の態様によれば、サーバまたはクライアントデバイスにおいて、少なくとも１つのメディアセグメントファイル内にカプセル化されている多層分割タイムドメディアデータから多層タイムドメディアデータビットストリームを提供するためのデバイスが提供され、前記多層分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第１の層および少なくとも１つの第２の層に符号化され、少なくとも１つのタイムドサンプルは、少なくとも第１の層または少なくとも１つの第２の層に符号化されている少なくとも１つのサブサンプルを含み、
前記少なくとも１つのメディアセグメントファイルは、タイムドサンプルの少なくとも１つから得られる少なくとも１つのサブサンプルを含む少なくとも１つのトラックを含み、前記少なくとも１つのメディアセグメントファイルは、少なくとも１つのトラックと関連付けられた記述メタデータと関連付けられ、前記記述メタデータは、少なくとも１つのサブサンプルと少なくとももう１つのサブサンプルとの間の依存関係をシグナリングするための記述子を含み、
前記依存関係は、少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが同じ層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層内依存性を記述し、少なくとも１つの得られたサブサンプルおよび少なくとももう１つのサブサンプルが異なる層に属する場合は、少なくとも１つの得られたサブサンプルと少なくとももう１つのサブサンプルとの間の層間依存性を記述し、デバイスはプロセッサを備え、前記プロセッサは、
サブサンプルを表す情報項目を選択するステップと、
選択されたサブサンプルを含む少なくとも１つのトラックを要求するステップであって、選択されたサブサンプルは、選択された情報項目に対応する、要求するステップと、
少なくとも１つのメディアセグメントファイルおよび記述メタデータを受信するステップと、
多層タイムドメディアデータビットストリームを生成するために少なくとももう１つのサブサンプルを識別するステップと、を実行するように構成されている。

ある特定の実施形態によれば、前記プロセッサは、多層分割タイムドメディアデータが多層タイル化タイムドメディアデータであるようにさらに構成されており、サブサンプルは空間サブサンプルである。

ある特定の実施形態によれば、前記プロセッサは、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとも１つの得られたサブサンプルが、タイムドサンプルの少なくとも１つのすべてのメディアデータを含む、同じ層に属する少なくとも１つのサブサンプルよりなるセットを含むか否かを示すパラメータを得るステップを実行するようにさらに構成されている。

ある特定の実施形態によれば、前記プロセッサは、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとももう１つのサブサンプルが、少なくとも１つのトラックと関連付けられた記述メタデータ内でどのように記述されているかを示すパラメータを得るステップを実行するようにさらに構成されている。

ある特定の実施形態によれば、前記プロセッサは、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとも１つのトラックの少なくとも２つのサブサンプルグループの定義を得るステップを実行するようにさらに構成されており、得られる定義は、対応するサブサンプルグループの各サブサンプルの依存関係を含む。

ある特定の実施形態によれば、前記プロセッサは、少なくとも１つのトラックと関連付けられた記述メタデータから、少なくとも１つのトラックのサブサンプルの少なくとも１つのサブサンプルグループの定義を得るステップを実行するようにさらに構成されており、第１の定義とよばれる、前記少なくとも１つのサブサンプルグループの定義は、少なくとも１つのサブサンプルグループの各サブサンプルの依存関係を含み、第２の定義は、少なくとも１つのサブサンプルグループに属しない、少なくとも１つのトラックの各サブサンプルの依存関係を含む。

ある特定の実施形態によれば、前記プロセッサは、依存関係がリストに編成されるようにさらに構成されており、前記リストの数は、サンプルを符号化するために使用される層の数に等しく、各リストは、層の降順もしくは昇順に編成されるか、または、層識別子に関連付けられる。

ある特定の実施形態によれば、前記プロセッサは、依存関係が、各サブサンプルおよび各層のすべての依存関係を含む１つのリストに編成されるようにさらに構成されている。

ある特定の実施形態によれば、前記プロセッサは、各層が、層識別子に応じて識別されるようにさらに構成されており、依存関係は、共在するサブサンプルの層識別子を含む１つのリストに編成される。

ある特定の実施形態によれば、前記プロセッサは、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを得るステップであって、前記第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを得るステップであって、前記少なくとも１つの第２のサブサンプルは、前記少なくとも１つの第１のサンプルのサブサンプルであり、前記第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、ステップと、を実行するようにさらに構成されており、
第３のトラックとよばれる、前記少なくとも１つの得られたサブサンプルを含むトラックは、少なくとも１つの第１のサンプルを指し示す少なくとも１つの第３の抽出器を備え、前記少なくとも１つの得られたサブサンプルは、少なくとも１つの第２の層に属する。

ある特定の実施形態によれば、前記プロセッサは、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを得るステップであって、前記第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第２のサブサンプルを含む第２のトラックを得るステップであって、前記少なくとも１つの第２のサブサンプルは、前記少なくとも１つの第１のサンプルのサブサンプルであり、前記第１のトラックは、少なくとも１つの第２のサブサンプルを指し示す少なくとも１つの第１の抽出器を備える、ステップと、
少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを得るステップであって、前記第３のトラックのサンプルの項目は上記少なくとも１つの第２の層に属する、ステップと、を実行するようにさらに構成されており、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含むトラック、前記第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、前記少なくとも１つの得られたサブサンプルは、上記少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある特定の実施形態によれば、前記プロセッサは、
少なくとも１つの第１のサンプルの少なくとも１つの項目を含む第１のトラックを得るステップであって、当該第１のトラックのサンプルの項目は第１の層に属する、ステップと、
少なくとも１つの第３のサンプルの少なくとも１つの項目を含む第３のトラックを得るステップであって、前記第３のトラックのサンプルの項目は前記少なくとも１つの第２の層に属する、ステップと、を実行するようにさらに構成されており、
第４のトラックとよばれる、少なくとも１つの得られたサブサンプルを含むトラック、第３のトラックは、少なくとも１つの第１のサンプルの少なくとも１つの項目を指し示す少なくとも１つの第３の抽出器、および、第４のトラックの少なくとも１つの得られたサブサンプルを指し示す少なくとも１つの第３の追加の抽出器を備え、前記少なくとも１つの得られたサブサンプルは、上記少なくとも１つの第３のサンプルの少なくとも１つの項目のサブサンプルである。

ある特定の実施形態によれば、前記プロセッサは、抽出器が、サンプルの項目のサイズ、または、作成された抽出器によって指摘される層のサブサンプルのサイズに基づく基準値の関数として識別されるようにさらに構成されている。

ある特定の実施形態によれば、前記プロセッサは、識別された抽出器によって指ししめされるデータの抽出が、依存関係のパラメータに応じて決定されるようにさらに構成されている。

ある特定の実施形態によれば、前記プロセッサは、作成されたトラックの各々をカプセル化する結果としてもたらされるメディアセグメントファイルが、国際標準化機構によって定義されているものとしてのベースメディアファイルフォーマットに適合するようにさらに構成されている。

本明細書において上述したカプセル化の方法およびデバイスは、特定の実施形態において、ネットワークにわたって（任意の生成されたメタデータを含む）カプセル化データを送信すること、または、そのようなカプセル化データを記憶することをさらに含んでも良い。カプセル開放（または解析）の方法およびデバイスは、特定の実施形態において、復号および／または表示されるべき解析されたビットストリームを出力することをさらに含んでも良い。

本発明の第５の態様および第６の態様によれば、上述したデバイスを備えるビデオ符号化器およびビデオ復号器が提供される。

それゆえ、本発明のビデオ符号化器およびビデオ復号器は、多層ビデオストリームの独立した部分またはタイルの効率的なストリーミングに適しており、標準規格、特にＭＰＥＧ−４Ｐａｒｔ１５規格に容易に組み込むための既存のツールを使用し、タイル化から脱相関された、タイルレベルにおける動的な層間依存性をサポートし、２つ以上の部分またはタイル選択（すなわち、任意のＲＯＩ）に適しており、抽出器を使用して層間依存性を処理することによって引き起こされるオーバヘッドを制限する。

本発明はソフトウェアにおいて実装することができるため、本発明は、任意の適切なキャリア媒体上でプログラム可能装置に提供するためのコンピュータ可読コードとして具現化することができる。有形キャリア媒体は、フロッピーディスク、ＣＤ−ＲＯＭ、ハードディスクドライブ、磁気テープデバイスまたはソリッドステートメモリデバイスなどのような記憶媒体を含むであろう。一時的キャリア媒体は、電気信号、電子信号、光信号、音響信号、磁気信号または電磁信号、たとえば、マイクロ波もしくはＲＦ信号のような信号が含まれるであろう。

Claims

メディアファイルの生成方法であって、
ビデオデータを取得し、
前記取得されたビデオデータに基づいて１又は複数のビデオトラックを生成し、
前記１又は複数のビデオトラックの少なくとも１つに対応する空間領域に関連付けられる記述パラメータであって、セットされたときは、当該記述パラメータに関連付けられている空間領域が完全なピクチャであることを示す記述パラメータを生成し、
前記記述パラメータがセットされない空間領域のためのパラメータとして、前記空間領域により表される矩形領域の左上画素の水平及び垂直方向のオフセットパラメータを生成し、
前記生成された１又は複数のビデオトラックと、前記生成された記述パラメータ及びオフセットパラメータのうち少なくとも何れかと、に基づいて、１又は複数のメディアファイルを生成することを特徴とする生成方法。
メディアファイルの生成方法であって、
ビデオデータを取得し、
前記取得されたビデオデータに基づいて１又は複数のビデオトラックを生成し、
前記１又は複数のビデオトラックの少なくとも１つに対応する空間領域に関連付けられる記述パラメータであって、セットされたときは、当該記述パラメータに関連付けられている空間領域が完全なピクチャであることを示す記述パラメータと、前記記述パラメータがセットされない空間領域のためのパラメータとして、当該空間領域が表す矩形領域の左上画素の水平及び垂直方向のオフセットパラメータと、のうち少なくとも何れか一方を含むＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子を生成し、
前記生成された１又は複数のビデオトラックと、前記生成されたＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子と、に基づいて、１又は複数のメディアファイルを生成することを特徴とする生成方法。
前記記述パラメータがセットされるとはその値として１が与えられることであり、前記記述パラメータがセットされないとはその値として０が与えられることであることを特徴とする請求項１又は２に記載の生成方法。
前記記述パラメータの値として０が与えられるときは、当該記述パラメータに関連付けられている空間領域がパーシャルピクチャであることが表されることを特徴とする請求項３に記載の生成方法。
前記水平及び垂直方向のオフセットパラメータの値は、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子により関連付けられる複数の空間領域が属するベース領域を基準として定まることを特徴とする請求項１乃至３のうち、何れか１項に記載の生成方法。
前記空間領域は、独立してデコード可能に符号化されたタイル領域に対応することを特徴とする請求項１乃至５のうち、何れか１項に記載の生成方法。
前記ビデオデータは、ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）に基づいて符号化されていることを特徴とする請求項１乃至６のうち、何れか１項に記載の生成方法。
メディアファイルの生成装置であって、
ビデオデータを取得する取得手段と、
前記取得手段により取得されたビデオデータに基づいて１又は複数のビデオトラックを生成するトラック生成手段と、
前記トラック生成手段により生成される１又は複数のビデオトラックの少なくとも１つに対応する空間領域に関連付けられる記述パラメータであって、セットされたときは、当該記述パラメータに関連付けられている空間領域が完全なピクチャであることを示す記述パラメータを生成する記述パラメータ生成手段と、
前記記述パラメータ生成手段により生成される記述パラメータがセットされない空間領域のためのパラメータとして、前記空間領域により表される矩形領域の左上画素の水平及び垂直方向のオフセットパラメータを生成するオフセットパラメータ生成手段と、
前記トラック生成手段により生成された１又は複数のビデオトラックと、前記記述パラメータ生成手段により生成された記述パラメータ及び前記オフセットパラメータ生成手段により生成されたオフセットパラメータのうち少なくとも何れかと、に基づいて、１又は複数のメディアファイルを生成するファイル生成手段と、を有することを特徴とする生成装置。
メディアファイルの生成装置であって、
ビデオデータを取得する取得手段と、
前記取得手段により取得されたビデオデータに基づいて１又は複数のビデオトラックを生成するトラック生成手段と、
前記トラック生成手段により生成される１又は複数のビデオトラックの少なくとも１つに対応する空間領域に関連付けられる記述パラメータであって、セットされたときは、当該記述パラメータに関連付けられている空間領域が完全なピクチャであることを示す記述パラメータと、前記記述パラメータがセットされない空間領域のためのパラメータとして、当該空間領域が表す矩形領域の左上画素の水平及び垂直方向のオフセットパラメータと、のうち少なくとも何れか一方を含むＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子を生成するメタデータ生成手段と、
前記トラック生成手段により生成された１又は複数のビデオトラックと、前記メタデータ生成手段により生成されたＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子と、に基づいて、１又は複数のメディアファイルを生成するファイル生成手段と、を有することを特徴とする生成装置。
前記記述パラメータがセットされるとはその値として１が与えられることであり、前記記述パラメータがセットされないとはその値として０が与えられることであることを特徴とする請求項８又は９に記載の生成装置。
前記記述パラメータの値として０が与えられる場合は、当該記述パラメータに関連付けられている空間領域がパーシャルピクチャであることが表されることを特徴とする請求項１０に記載の生成装置。
前記水平及び垂直方向のオフセットパラメータの値は、ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ記述子に応じた複数の空間領域が属するベース領域を基準として定まることを特徴とする請求項８乃至１１のうち、何れか１項に記載の生成装置。
コンピュータに、請求項１乃至７のうち、何れか１項に記載の生成方法を実行させるためのプログラム。