JP6591009B2

JP6591009B2 - 情報処理装置、情報処理方法、及び、プログラム

Info

Publication number: JP6591009B2
Application number: JP2018149332A
Authority: JP
Inventors: ドゥヌアルフランク; マゼフレデリック
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2013-04-16
Filing date: 2018-08-08
Publication date: 2019-10-16
Anticipated expiration: 2034-04-09
Also published as: US20180020268A1; US11019408B2; JP2016521497A; GB201306899D0; US20160080833A1; WO2014170176A1; GB2513140B; GB2513140A; JP6385424B2; US9794649B2; JP2018182760A

Description

本発明は、一般的には、通信ネットワーク、例えばインターネットプロトコル（ＩＰ）標準規格に準拠する通信ネットワーク上の時分割メディアデータストリーミングの分野に関する。

ビデオ符号化は、ビデオ画像を送信または記憶できるように、一連のビデオ画像をコンパクトなデジタル化されたビットストリームに変換する方法である。符号化装置はビデオ画像を符号化するために用いられ、表示および視聴のためにビットストリームを再構築するために、これと関連させた復号化装置が利用できる。一般的な目的は、当初のビデオ情報より小さいサイズになるようにビットストリームを形成することである。これによって、ビットストリームコードを送信または記憶するために必要となる転送ネットワークまたは記憶装置の容量を有利に低減する。送信するために、ビデオビットストリームは、通常、ヘッダーおよびチェックビットを追加する伝送プロトコルに従って、一般にカプセル化される。

通信ネットワーク上でメディアデータをストリーミングすることは、通常、メディアプレゼンテーションを表現するデータが、通信ネットワーク上で、サーバーと呼ばれるホストコンピュータによってクライアントデバイスと呼ばれる再生装置に提供されることを意味している。クライアントデバイスは、一般に、様々な従来型コンピューティング装置のいずれかとして実現されるメディア再生コンピュータであって、例えば、デスクトップパーソナルコンピュータ（ＰＣ）、タブレットＰＣ、ノートブックもしくは携帯コンピュータ、セルラー電話、無線携帯装置、個人情報機器（ＰＤＡ）、およびゲームコンソールなどである。クライアントデバイスは、通常、（ファイル全体が配信されるのを待つのではなく）ホストからストリーミングされたコンテンツが受信されるにつれて、それを表示する。

メディアプレゼンテーションは、一般に、音声、ビデオ、テキスト、および／またはサブタイトルなどの、クライアントデバイスによって、一緒に再生するためにサーバーからクライアントデバイスに送ることができるいくつかのメディアコンポーネントを含む。それらのメディアコンポーネントは、クライアントデバイスによってサーバーからダウンロードされる。クライアントデバイスがその特性（例えば解像度、コンピューティング能力およびバンド幅）の機能として、１つのバージョンを選択することができるように、通常の実施においては、同じメディアコンポーネントのいくつかのバージョンへのアクセスを与えることを意図している。

近年では、ムービング・ピクチャー・エクスパーツ・グループ（ＭＰＥＧ）は、ＨＴＴＰ（ハイパーテキスト・トランスファー・プロトコル）上の既存のストリーミングソリューションを統一し、取って代わるための新規な標準規格を発表した。この新規な標準規格は、「ＨＴＴＰ上のダイナミック・アダプティブ・ストリーミング（ＤＡＳＨ）」と呼ばれ、標準ウェブサーバーに基づいてＨＴＴＰ上のメディアストリーミングモデルをサポートすることを目的とし、そこでは、情報（すなわちストリームするメディアデータの選択、ならびにユーザー選択、ネットワーク条件、およびクライアント機能に対するビットストリームの動的な適応）がクライアントの選択およびデバイスだけに依存する。

このモデルでは、メディアプレゼンテーションは、データセグメントにおいて、および、提供される時分割メディアデータの構成を表現する「メディアプレゼンテーション記述（ＭＰＤ）」と呼ばれるマニフェストにおいて、構成される。具体的には、マニフェストは、データセグメントをダウンロードするために用いるリソース識別子を含み、有効なメディアプレゼンテーションを取得するためにそれらのデータセグメントを選択し結合するためのコンテキストを提供する。リソース識別子は、通常、おそらくバイト範囲と組み合わされたＨＴＴＰ−ＵＲＬ（ユニフォーム・リソース・ロケータ）である。マニフェストに基づいて、クライアントデバイスは、いかなる時にも、そのニーズ、その能力（例えばサポートされたコーデック、ディスプレイサイズ、フレームレート、品質レベルなど）に従って、およびネットワーク条件（例えば利用可能なバンド幅）に応じて、どのメディアセグメントをメディアデータサーバーからダウンロードするべきかを決定する。ＤＡＳＨ標準規格のコンテキストでは、このマニフェストは、拡張可能なマークアップ言語（ＸＭＬ）標準規格に準拠している。

クライアントデバイスがメディアデータを要求する前に、それはアクセス可能なメディアセグメント各々の記述を取得し、そのようにして必要なメディアセグメントだけを要求するために、ＭＰＤファイルを受信する。言い換えれば、受信したＭＰＤファイルを解析することによって、クライアントデバイスは、メディアプレゼンテーションのアクセス可能なメディアセグメントの、特に、セグメントのアドレス（例えばｈｔｔｐアドレス）を含む情報の項目を取得することができる。したがって、それは、どのメディアセグメントをダウンロードし（ＨＴＴＰ要求を介して）、これらのメディアセグメントを取得し、受信および復号化の後でそれらを再生するかを決定することができる。

この関連に加えて、ＤＡＳＨ標準規格は、小さい期間に従って各メディアコンポーネントをメディアサブコンポーネントに分割することを提案する。時間分解は、ＭＰＤファイルに追加される。したがって、ＭＰＤファイルは、ｈｔｔｐアドレス（またはＵＲＬ）と小さい期間にわたる各メディアセグメントの簡潔な記述との間のリンクを提供し、クライアントデバイスが所望の期間にわたってメディアプレゼンテーションの所望のメディアセグメントをダウンロードすることを可能にする。

ビデオの解像度が標準解像度（ＳＤ）から高精細度（ＨＤ）へ、さらに超高精細度（例えば４Ｋ２Ｋまたは８Ｋ４Ｋ）へと連続的に増加しており、全ての受信およびビデオ復号化装置がフル解像度でビデオにアクセスするリソース（例えばネットワークアクセスバンド幅またはＣＰＵ（中央処理ユニット））を備えているわけではなく、そして、全てのユーザーがこのようなビデオにアクセスする必要があるわけではないので、いくつかの関心領域（ＲＯＩ）にのみアクセスする、すなわちビデオシーケンス全体のいくつかの空間的副部分にのみアクセスする能力を提供することが、特に有益である。

ビデオに属するフレームの空間的副部分にアクセスする既知の機構は、一般にタイルと呼ばれる独立にデコード可能な空間領域の配置としてビデオの各フレームを構成することにある。ＳＶＣ（スケーラブルビデオ符号化）またはＨＥＶＣ（高効率ビデオ符号化）などのいくつかのビデオフォーマットは、タイル定義のためのサポートを提供する。ユーザーが定義するＲＯＩは、１つあるいは複数の隣接するタイルをカバーすることができる。

したがって、ＨＴＴＰプロトコルに従ってユーザーが選択したＲＯＩをストリーミングするために、１つまたは複数のタイルに空間的にアクセスすることを可能にし、かつ、アクセスされたタイルの組み合わせを可能にする方法で、符号化されたビデオビットストリームの時分割メディアデータのカプセル化を提供することが重要である。

符号化されたビデオビットストリームは、完全なフレームに対応する一組の隣接する時間的サンプルとして一般に構築され、時間的サンプルは復号化する順序の関数として構成されることを想起すべきである。このような符号化されたビットストリームをカプセル化し記述するために、ファイルフォーマットが用いられる。

説明のために、国際標準化機構のベース・メディア・ファイル・フォーマット（ＩＳＯＢＭＦＦ）は、よく知られたフレキシブルで拡張可能なフォーマットであり、それは、ローカル記憶装置、またはネットワークもしくは別のビットストリーム配信機構を介した伝送のために符号化された時分割メディアデータ・ビットストリームを記述する。このファイルフォーマットは、オブジェクト指向である。それはボックスと呼ばれるビルディングブロックから構成され、シーケンシャルに、または階層的に構成され、タイミングおよび構造パラメータなどの、符号化された時分割メディアデータ・ビットストリームのパラメータを定義する。

ＩＳＯＢＭＦＦ標準規格のタイルを記述するための解法は、各タイルを特定のトラックにカプセル化すること、および、タイル位置を信号で送るためにトラックの変換行列を用いることにある。ＤＡＳＨ標準規格を用いる自然な手法は、マニフェストの各トラックを独立したメディアコンテンツとして記述することにある。しかし、現行のＭＰＤ定義では、タイル化時分割メディアデータを記述することができないので、各トラックがＭＰＤの同じビデオの下位部分であることを信号で送る方法がない。

したがって、実際には、クライアントデバイスは、ＭＰＤに記述された各ビデオコンポーネントが（例えばｍｏｏｖ／ｔｒａｃｋ／ｔｋｈｄとして知られたボックスにおけるトラックおよび行列定義を介して）タイル化ビデオの副部分であると決定する立場にあるために、（マニフェストに加えて）第１の初期設定セグメントをダウンロードしなければならない。次に、タイル位置とビデオコンポーネントとの間の関連を（例えばｍｏｏｆ／ｔｒａｆ／ｔｆｈｄとして知られたボックスを介して）検索するために、クライアントデバイスは、少なくとも、各ビデオコンポーネントの各第１のメディアデータセグメントの冒頭をダウンロードしなければならない。この初期化情報のダウンロードは、遅延およびさらなるｈｔｔｐラウンドトリップをもたらす。

図１は、ビデオシーケンスの関心領域をストリーミングするためのタイルの使用を模式的に示す。

図示するように、複数の解像度層は、一組の画像１０５−１〜１０５−ｎを含む高い空間的解像度の入力ビデオ１００から計算され、各層はタイルに分割され、各タイルは独立に符号化される。従来のビデオストリームと同様に、ベースレイヤタイルは、全体のビデオシーンを示す。ユーザーがビデオにズームしたい場合には、より高い解像度層のタイルがより高い品質の詳細を提供するために読み出される。したがって、クライアントデバイスは、関心のある特定領域を表示するための複数のタイルを復号化して、同期させる必要がある。

あるいは、関心のある任意の領域を満たすために１つのタイルだけを必要とするように、オーバーラップするタイリング方式を用いることができる。種々のディスプレイサイズおよび種々のネットワーク条件を扱うために、各タイルは、種々の空間的および品質の解像度で符号化される。

入力ビデオ１００に対応するマニフェストファイルの一例は、付録（コード１の抽出）に与えられている。この例によれば、高い空間的解像度の入力ビデオ１００の各画像は、２×２行列に配置された４つのセグメントを含む。各セグメントのアドレスおよび画像の対応するセグメントの位置は、マニフェストの中で提供される。

米国特許出願第２０１００２９９６３０号には、パノラマ画像における関心領域を視覚化するためのシステムが開示されている。しかし、予め生成された関心領域（サーバー側）および切り取られた画像（クライアントデバイス側）の事例だけが考慮されている。それには、ユーザーが選択した関心領域の任意の動的なストリーミングは開示されていない。

ＰａｃｋｅｔＶｉｄｅｏＣｏｎｆｅｒｅｎｃｅ２０１０で発行された論文「Ａｎｉｎｔｅｒａｃｔｉｖｅｒｅｇｉｏｎ−ｏｆ−ｉｎｔｅｒｅｓｔｖｉｄｅｏｓｔｒｅａｍｉｎｇｓｙｓｔｅｍｆｏｒｏｎｌｉｎｅｌｅｃｔｕｒｅｖｉｅｗｉｎｇ」では、著者が関心領域をストリーミングするためのタイルの使用について述べている。マニフェストは、タイルの情報の識別子および位置項目を提供するために用いられる（実際にはＨ．２６４スライス）。しかし、各解像度層のタイリング構成がマニフェストファイルで記述されている場合であっても、このような記述はタイルごとのＵＲＬを提供しない。さらに、選択されたタイルをストリーミングするためにクライアントによって送られた特定のｈｔｔｐクエリを解釈するために、それはサーバー側でいくらかの情報を必要とする。実際、専用のマニフェストにより提供された情報のベースＵＲＬおよびタイル項目（タイル位置および識別子）から、クライアントデバイスは、特定のタイルにアクセスするための、マニフェストから読み出された識別子属性の値によって識別されるＨＴＴＰＧＥＴクエリＵＲＬタイプ、例えばＧＥＴｘｘｘ？ｉｄ＝ｖａｌのクエリを構築することができる。しかし、このようなタイプのＵＲＬは、その要求を満たすためにクライアントデバイスに送られるファイルでファイルおよびバイト範囲を読み出すために、サーバー側で処理タスクを必要とする。さらに、それによっては、マニフェストの情報のタイル構成および／または除外項目を信号で送ることができない。

特許出願国際公開第２０１２１６８３６５号によれば、マニフェストファイルはそれらの位置情報（ＵＲＬ）を有する１つまたは複数の空間的セグメントストリームを記述し、クライアントデバイスは１つまたは複数の空間的領域を選択する可能性を有する。またマニフェストファイルは、特に解像度レベルにわたって空間的領域を整合させるために、空間的セグメント間の関係を記述する。しかし、同時に２つ以上のタイルをストリーミングし、かつ表示する能力を提供するために、クライアント側で同期エンジンが必要となる。このような同期エンジンは、ＤＡＳＨを用いる場合には、マニフェストにおける時限セグメント、およびクライアントデバイスにおけるフレームの再順序付けを必要とする。復号化された空間的セグメントフレームは、選択された関心領域として表示するために互いに継ぎ合せられる。

これらの問題を解決するために、マニフェストのための効率的なパーティションまたはタイル記述方式が提供され、それは、どのようなトラックの組み合わせがクライアントアプリケーションによって選択されても、ＩＳＯＢＭＦＦパーシングの結果が常にビデオデコーダのための有効なビデオ・エレメンタリ・ビットストリームをもたらすことを保証する。

これらの制約条件に直面して、発明者は、ＭＰＥＧ−ＤＡＳＨにおいて規定されるＭＰＤ（ＭｅｄｉａＰｒｅｓｅｎｔａｔｉｏｎＤｅｓｃｒｉｐｔｉｏｎ）であって、ビデオデータの少なくとも一部に対応する第１データを要求するために用いられる第１要求情報を含む第１リプリゼンテーションと、前記第１リプリゼンテーションが属する第１アダプテーションセットとは異なる第２アダプテーションセットに属する第２リプリゼンテーションであって、前記第１データに関連する第２データを要求するために用いられる第２要求情報を含む第２リプリゼンテーションと、前記第１リプリゼンテーションと前記第２リプリゼンテーションとが関連していることを示す関連情報と、が記述されたＭＰＤを取得する取得手段と、前記取得手段により取得されたＭＰＤに記述された前記第１要求情報と前記第２要求情報とを含む複数の要求情報のうちの少なくとも何れかに基づいて、前記ビデオデータの少なくとも一部を要求する要求手段と、を有する情報処理装置を提供する。

上述したような先行技術の欠点を改善することが、本発明の幅広い目的である。

本発明のさらなる利点は、図面および詳細な説明を考察することで、当業者には明らかになろう。いかなる付加的な利点も、本明細書に組み込まれるものとする。

ここで本発明の実施形態について、単なる例として、以下の図面を参照して説明する。

図１は、ビデオシーケンスの関心領域をストリーミングするためのタイルの使用を模式的に示す図である。図２は、ハイパーテキスト・トランスファー・プロトコルによる通信ネットワーク上の適応可能なメディア・プレゼンテーション・ストリーミングの一般的原理を示す図である。図３は、メディアプレゼンテーションおよび対応するマニフェストファイルを生成するためのステップを示す図である。図４は、ビデオタイリング、およびそれがどのように圧縮されたビデオデータに適用されるかを示す図である。図５ａは、タイルおよびスライスセグメントの例を示す図である。図５ｂは、タイルおよびスライスセグメントの例を示す図である。図５ｃは、タイルおよびスライスセグメントの例を示す図である。図６は、所与の時間的期間の連続するビデオフレームの空間部分を表現する有効な復号可能な時分割メディアデータ・ビットストリームを構築するために、ダウンロードされたメディアデータセグメントを連結する例を示す図である。図７は、タイルトラックを信号で伝えるための下位表現を用いるのに好適であるｍｐ４構成の一例を示す図である。図８は、前述の実施形態によるタイル記述を含むマニフェストを処理するためのクライアントデバイスで実行される処理ステップを示すフローチャートである。図９は、前述の実施形態による従属性記述を含むマニフェストを処理するためのクライアントデバイスで実行される処理ステップを示すフローチャートである。図１０は、本発明の記載された実施形態の各々の各ステップまたはいくつかのステップを実行するために用いることができるコンピューティング装置の模式的なブロック図である。図１１ａは、空間的にスケーラブルなビデオのためのタイリング構成の例を示す図である。図１１ｂは、空間的にスケーラブルなビデオのためのタイリング構成の例を示す図である。図１２は、ＳＮＲ（信号対雑音比）スケーラブルなビデオのためのタイリング構成の一例を示す図である。

特定の実施形態によれば、マニフェストのビデオシーケンスの空間的副部分の簡潔な記述に基づく解法が記述され、それは、特に、ＤＡＳＨＭＰＤ標準規格に準拠するファイルに容易に統合することができる。このような解法を用いることにより、クライアントデバイスは、空間的メディアコンポーネントの存在についての知識を得ることができ、これらのメディアコンポーネントの各々をダウンロードするためのハイパーテキスト・トランスファー・プロトコル（ｈｔｔｐ）アドレスを取得することができる。その目的のために、マニフェストファイルは、ビデオ表現間の任意の従属性に関する情報を含む。

特定の実施形態によれば、ビデオシーケンスは独立な空間的パーティション（例えばタイル）に符号化され、各符号化されたパーティションは、独立なトラック（パーティショントラックまたはタイルトラック）としてファイルフォーマットにカプセル化される。パーティショントラックのデータに対する参照を含む、参照トラックまたは複合トラックと呼ばれる付加的なトラックは、２つ以上のパーティショントラックの任意の合成をカプセル化するために用いられる。パーティショントラックおよび参照トラックのこのようなカプセル化は、空間的アクセスの可用性についてクライアントデバイスに通知するために、マニフェストにおいて信号で送られる。またマニフェストは、複合トラックの任意のアドレス可能コンポーネントとして各パーティショントラックの記述を含む。

シンタックス変形の重要性と記述の完全性との間のトレードオフから生じる様々な実施形態を提供することができる。

特定の実施形態によれば、時限サンプル（例えば画像）を含むタイル化時分割メディアデータ（例えばビデオデータ）などのパーティションで分割された時分割メディアデータは、一組のいくつかの時分割メディアデータ、通常はベースレイヤトラックおよびいくつかのタイルトラック、ならびに、時分割メディアデータトラックに対する参照を含む参照または複合トラックとして送信される。各タイルトラックは、いくつかの時限サンプルの１つの空間的サブサンプル（例えばいくつかのネットワークアブストラクション層（ＮＡＬ）ユニット）を含む。複合トラックから時分割メディアデータトラックを参照するために、拡張されたエクストラクタタイプが定義される。時分割メディアデータトラックは、表示可能でないとラベルされ、タイルのための時分割メディアデータを運び、それを記述する。このような一組の時分割メディアデータトラックおよび複合トラックは、空間ビデオタイルの選択、構成、および効率的なストリーミングを可能にする。各トラックは、一組のメディアセグメントファイルとしてサーバーからクライアントデバイスへ送信することができる。メディアセグメントファイルを復号化するのに必要なメタデータを送信するために、初期設定セグメントファイルを用いることができる。

図２は、ｈｔｔｐによる通信ネットワーク上の適応メディアプレゼンテーションストリーミングの一般的原理を示す図である。ｈｔｔｐ上のメディアストリーミングのための大部分のプロトコルおよび標準規格は、この原理に基づく。

図示するように、サーバー２００は、メディアプレゼンテーション、その中でも特に、インタリーブビデオおよび音声コンポーネントを含むメディアプレゼンテーション２０５を含む。図３は、このようなメディアプレゼンテーションがどのように構築され得るかを模式的に示す。

符号化の間、メディアプレゼンテーションは、例えばＭＰ４標準規格（ＩＳＯ／ＩＥＣ１４４９６−１４）に準拠するコンポーネントなどの、独立にアドレスされダウンロードすることができる、小さい独立した連続的な時間的コンポーネントに時間的に分割される。アドレス（すなわち、記載された実施形態のｈｔｔｐアドレス）は、各取得された時間的コンポーネントの全てのセグメントについて、サーバー２００によって設定され、図４を参照して説明するように、マニフェストが生成される。

上述したように、マニフェストは、所与のメディアプレゼンテーションについてアクセスすることができる全ての時間的コンポーネントのコンテンツを記述する文書であって、通常はＸＭＬファイルである。このような記述は、メディアコンポーネントのタイプ（例えば音声、ビデオ、音声ビデオ、またはテキスト）、メディアセグメントの持続時間、およびメディアセグメントと関係するアドレス（例えばＵＲＬ）、すなわちメディアコンポーネントを取得することができるアドレスを含むことができる。

通常は、ＭＰＤは階層データモデルに基づいている。それは、各期間が起動時間および持続時間を有する１つもしくは複数の期間から構成され、１つもしくは複数のアダプテーションセットから構成される。アダプテーションセットは、１つもしくは複数のメディアコンポーネントおよびその様々な符号化された代替例に関する情報を提供し、同じメディアコンポーネントの各符号化された代替例はリプリゼンテーションと呼ばれる。次に、各リプリゼンテーションは、通常、１つまたは複数のセグメントから構成される。

説明のために、メディアプレゼンテーション２０５のインタリーブ音声およびビデオデータは、連続する時間的コンポーネント、例えば３つの連続する期間に対応する３つの連続する時間的コンポーネント２１０−１〜２１０−３に、時間的に分割されている。これらのメディアコンポーネントの各々は、いくつかのメディアセグメント（図示せず）を収容する少なくとも１つのリプリゼンテーション（図示せず）を含む少なくとも１つのアダプテーションセット（図示せず）を含む。これらのセグメントのアドレスは、サーバー２００によって設定される。時間的コンポーネント２１０−１〜２１０−３に関連する情報のこれらのアドレスおよび他の項目は、メディアプレゼンテーション２０５に対応するマニフェスト２１５でアクセス可能である。

このマニフェストファイルは、クライアントデバイス２２０に送られる（ステップ２２５）。受信した後に、メディアプレゼンテーション２０５のメディアコンポーネント２１０―１〜２１０―３のアクセス可能なメディアセグメント、これらのメディアセグメントのｈｔｔｐアドレス、およびこれらのメディアセグメント間の関係を決定するために、マニフェストファイル２１５はクライアントデバイス２２０によって解析される。さらに、マニフェストファイル２１５は、メディアプレゼンテーションのコンテンツ（すなわち所与の例におけるインタリーブ音声およびビデオ）に関する情報の項目を与える。情報のこれらの項目は、解像度、ビットレート、および類似の情報を含むことができる。

したがって、この情報を考慮して、クライアントデバイス２２０は、これらのセグメントをダウンロードするための対応するｈｔｔｐ要求を受信し送信する（ステップ２３０）ために、メディアセグメントを選択することができる。それに応答して、サーバー２００は、要求された時間的セグメントを送信する（ステップ２３５）。これらの時間的セグメントは、デコーダ２４０で復号化され、ディスプレイ２４５に表示することができる。

図３は、メディアプレゼンテーションおよび対応するマニフェストファイルを生成するためのステップを示す図である。このようなステップは、通常、図２のサーバー２００などのサーバーによって実行される。

図示するように、音声データおよびビデオデータは、ステップ３００およびステップ３０５の間にそれぞれ取得される。このようなデータは、例えば、通信ネットワークを介して、図３に示すステップを実行するサーバーに接続されたデータ記憶サーバーなどの外部ソースから取得することができる。

音声データは、ステップ３１０の間に圧縮される。このような圧縮は、例えば、ＭＰ３標準規格（ＭＰＥＧ−１／２音声層３）に基づくことができる。並行して、ビデオデータもステップ３１５の間に圧縮される。その目的のために、ＭＰＥＧ４、ＭＰＥＧ／ＡＶＣ、ＳＶＣ、ＨＥＶＣ、またはスケーラブルなＨＥＶＣのようなビデオデータ圧縮アルゴリズムを用いることができる。

音声データおよびビデオデータは、符号３２０および３２５でそれぞれ示すように、データ基本ストリームとして圧縮される。これらの基本ストリームは、グローバル・メディア・プレゼンテーション３３５を生成するために、ステップ３３０の間にカプセル化される。

例えば、グローバル・メディア・プレゼンテーションとして符号化された音声およびビデオの基本ストリームのコンテンツを記述するために、ＩＳＯＢＭＦＦ標準規格（あるいは、説明のために、このＩＳＯＢＭＦＦ標準規格のＡＶＣ、ＳＶＣ、またはＨＥＶＣに対する拡張）を用いることができる。したがって、カプセル化されたメディアプレゼンテーションは、マニフェスト、例えばＸＭＬマニフェスト３４５の生成（ステップ３４０）のための入力として用いられる。

ＤＡＳＨの特定の事例について上述したように、マニフェストファイル（ＭＰＤ）は、コンポーネント（期間と関係する）、アダプテーションセット、リプリゼンテーション、およびセグメントによって階層的に構成される。言い換えれば、メディアプレゼンテーションは時間的期間に分割され、ＭＰＤは各期間に関連する全てのデータを含む。情報の対応する項目を受信することによって、クライアントデバイスは、期間ごとに、メディア・プレゼンテーション・コンテンツを決定することができる。

再び、このコンテンツはアダプテーションセットの中に構成され、可能性のある構成は、メディアプレゼンテーションに収容されたメディアタイプごとに、１つまたは複数のアダプテーションセットを有することになる。ビデオデータに関するアダプテーションセットは、通常、サーバーから入手可能な対応する符号化されたビデオデータコンポーネントの種々の可能性のあるリプリゼンテーションに関する情報の項目を収容する。説明のために、第１のリプリゼンテーションは、６４０×４８０画素の空間解像度で符号化され、５００ｋｂｉｔ／ｓのビットレートで圧縮されたビデオデータを対象とする。第２のリプリゼンテーションは、類似のビデオコンテンツを対象とするが、２５０ｋｂｉｔ／ｓのビットレートで圧縮されている。それから、各リプリゼンテーションは、クライアントデバイスが対応するｈｔｔｐアドレスを知っているという条件の下でｈｔｔｐ要求を用いて、クライアントデバイスによってセグメントとしてダウンロードすることができる。

各リプリゼンテーションのビデオデータとｈｔｔｐアドレスとの間の関連は、時間的セグメントと呼ばれる特定レベルの記述を用いて作られる。したがって、各ビデオリプリゼンテーションは、時間的セグメント（通常は２、３秒の持続時間を有する）に分割される。したがって、各時間的セグメントは、特定のｈｔｔｐアドレス（ＵＲＬまたは１バイト範囲を有するＵＲＬ）によりアクセス可能なサーバーに格納されたビデオコンテンツの一部である。

さらに、初期設定セグメントとして知られた特定のセグメントが生成されて、クライアントデバイスからアクセス可能になる。この初期設定セグメントは、カプセル化されたビデオストリームを記述する情報のＭＰ４初期化項目を含むことができる（ビデオがＩＳＯＢＭＦＦまたは拡張を用いてカプセル化されている場合）。説明のために、情報のこれらの項目は、クライアントデバイスが、アクセスした圧縮されたビデオデータに関する復号化アルゴリズムを例示化するのを助ける。初期設定セグメントの、およびメディアセグメントのｈｔｔｐアドレスは、ＭＰＤファイルにおいて与えられる。ＭＰＤファイルの一例は、付録（コード２の抽出）に与えられている。

付録に与えられているコード２の抽出は、所与のメディアプレゼンテーションのためのＤＡＳＨマニフェスト（ＭＰＤ）の一例を示す。この例の目的は、ＭＰＤの主要な特性を提示することである。明確にするために、この例で与えられるリプリゼンテーションは、時間的セグメントに分割されていないことに留意する必要がある。

このＭＰＤの例では、２つのタイプのメディアデータが１つの期間に対して記述されている。第１のものは英語の音声ストリームであり、第２のものはビデオストリームである。

英語の音声ストリームは、‘ａｕｄｉｏ／ＭＰ４’タイプの‘ＡｄａｐｔａｔｉｏｎＳｅｔ’タグによって導入される。ＭＰＤは、この音声ストリームの２つのリプリゼンテーションを記述する。第１のリプリゼンテーション（インデックス１を有する：＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”１”…＞）は、６４，０００（帯域幅＝”６４０００”）バイト／秒に等しいビットレートを有するＭＰ４のカプセル化された基本音声ストリームである。この例に示すように、この基本ストリームを扱うために用いるコーデック（ｍｐ４パース後）は、属性‘ｍｐ４ａ．０ｘ４０’ （＜ＡｄａｐｔａｔｉｏｎＳｅｔ …ｃｏｄｅｃｓ＝”ｍｐ４ａ．０ｘ４０”…＞）によって、標準規格において定義される。この例によれば、リプリゼンテーションは、アドレス＜ＢａｓｅＵＲＬ＞７６５７４１２３４８．ｍｐ４＜／ＢａｓｅＵＲＬ＞における要求によりアクセス可能であり、＜ＢａｓｅＵＲＬ＞はＭＰＤにおいて‘ｈｔｔｐ：／／ｃｄｎ１．ｅｘａｍｐｌｅ．ｃｏｍ／’または‘ｈｔｔｐ：／／ｃｄｎ２．ｅｘａｍｐｌｅ．ｃｏｍ／’によって定義される（同じコンテンツをストリーミングするために２つのサーバーが利用できる）。したがって、クライアントデバイスは、アドレス‘ｈｔｔｐ：／／ｃｄｎ１．ｅｘａｍｐｌｅ．ｃｏｍ／７６５７４１２３４８．ｍｐ４’、またはアドレス‘ｈｔｔｐ：／／ｃｄｎ２．ｅｘａｍｐｌｅ．ｃｏｍ／７６５７４１２３４８．ｍｐ４’に対応する要求を用いて英語の音声ストリームを要求することができる。第２のリプリゼンテーション（インデックス２を有する：＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”２”…＞）は、３２，０００バイト／秒に等しいビットレートを有するＭＰ４のカプセル化された基本音声ストリームである。

ビデオストリームは、‘ｖｉｄｅｏ／ＭＰ４’タイプの‘ＡｄａｐｔａｔｉｏｎＳｅｔ’タグによって導入される。ＭＰＤは、このビデオストリームの６つのリプリゼンテーションを記述する。ＭＰＤに示すように、これらのリプリゼンテーションは、異なる空間解像度（３２０×２４０、６４０×４８０、および１２８０×７２０画素）、および異なるビットレート（２５６０００から２０４８０００バイト／秒）のビデオを収容する。これらのリプリゼンテーションの各々について、異なるＵＲＬが関係する。したがって、クライアントデバイスは、推定されているバンド幅およびスクリーン解像度などの基準の関数として、同じビデオデータのこれらの代替的リプリゼンテーションの中からから１つのリプリゼンテーションを選択することができる。

この例から、関心領域をストリーミングするためのタイルトラックの記述に関する従来のＭＰＤの限界を理解することができる。タイルトラックが完全なビデオフレームのリプリゼンテーションとして記述され得るにもかかわらず、カプセル化に応じて、特にタイルトラックがタイルデータのみを含む場合には、タイルトラックは表示可能であり得ない。デコーダのための初期化データが失われるおそれがある。したがって、タイルトラックごとの従来のＭＰＤおよび１つのリプリゼンテーションを用いて、クライアントデバイスは、タイルの組み合わせの可能性または非互換性に関する情報の項目を取得することができない。言い換えれば、各タイルは別のタイルの代替物として見られ、このようにして複数のタイル選択を防止している。信号で送ることができる唯一の組み合わせは、例えば複合トラックのリプリゼンテーション要素におけるｄｅｐｅｎｄｅｎｃｙＩｄとして既知の属性を用いる全てのタイルの組み合わせであるか、あるいは、フルフレームビデオがマニフェストにおいてそれ自体のリプリゼンテーションを有する場合には、全くタイルのない組み合わせである。この問題を解決するために、いくつかの実施形態について、以下本明細書で説明する。

上述したように、タイルは、ビデオフレームの独立に復号化可能な空間的領域である。

図４は、ビデオタイリング、およびそれがどのように圧縮されたビデオデータに適用されるかを示す図である。図示するように、ビデオストリーム４００は、一組の連続する時間的フレームを含む（説明のために、３つの連続する時間的フレームを示す）。各フレームは、長方形、例えばタイルＴｎ（ｎは１から８まで変化する）と呼ばれる符号４０５で示す８つの長方形に分割することができる。当然、タイルの数および形状は、異なってもよい。しかし、説明のために、考慮するビデオフレームのインデックスが何であれ、タイリングは同一であるとみなす。

タイリングの結果、独立な下位ビデオ（図示する例の８つ）が取得される。これらの下位ビデオは、符号４１０で示し、全体のビデオのパーティションである。各独立な下位ビデオは、例えば、ＡＶＣまたはＨＥＶＣ標準規格に準拠した独立なビットストリームとして符号化することができ、あるいは、それはＨＥＶＣビットストリームのタイルまたはＡＶＣのスライスなどの単一のビデオビットストリームの一部であってもよい。

ビデオのこのタイリング構成は、特にＳＶＣまたはスケーラブルなＨＥＶＣなどのスケーラブルなビデオ符号化フォーマットを考える場合に、他の構成まで拡張することができる。

図１１は、図１１ａおよび１１ｂを含み、タイリング構成の例を示す図である。

図１１ａは、特定のタイリング構成を示す。図示するように、ビデオシーケンス（図示せず）のフレーム１１００は、ベースレイヤフレーム１１０５を有するスケーラブルなビデオ、および８つのタイル部分（Ｔ１、Ｔ２、・・・、Ｔ８）に分割された空間的エンハンスメントレイヤフレーム１１１０として符号化される。ベースレイヤは、タイル化されていない。したがって、エンハンスメントレイヤの各タイル（例えば、エンハンスメントレイヤフレーム１１１０の各タイル部分）は、ベースレイヤ全体に従属している。このようなフレーム構成では、部分１１１５などの画像の一部がフレームの空間的部分（例えばフレーム１１００の右下部分）をストリーミングするために選択される場合には、選択されたタイル（例えばタイルＴ６およびＴ８）およびベースレイヤが必要である。図１１ａに示すように、選択された部分１１１５は、関心領域を表し、２つのタイルＴ６およびＴ８、ならびにベースレイヤ１１０５に包含されている。

図１１ｂは、別の特定のタイリング構成を示す。図示するように、フレーム１１５０を含むビデオシーケンスは、タイル化ベースレイヤ（すなわちタイルベースレイヤフレーム１１５５）およびタイル化に基づく空間的従属性を有するタイル化空間的エンハンスメントレイヤ（すなわちタイル化空間的エンハンスメントレイヤフレーム１１６０）として符号化される。エンハンスメントレイヤの１つのタイルは、ベースレイヤの同じ位置にあるタイルだけに従属する。このような構成では、ユーザーがＲＯＩ１１６５などの関心領域を選択する場合には、エンハンスメントレイヤフレーム１１６０の２つのタイルＴ６およびＴ８、ならびにベースレイヤフレーム１１５５の２つの参照タイルＴ０６およびＴ０８を必要とする。

図１２は、ＳＮＲ（信号対雑音比）タイプのスケーラビリティのためのタイリング構成の一例を示す図である。このような構成では、エンハンスメントレイヤのタイル、例えばフレーム１２００のエンハンスメントレイヤフレーム１２１０のタイル部分Ｔ１〜Ｔ２は、ベースレイヤの同じタイル、例えばベースレイヤフレーム１２０５のタイル部分Ｔ０１〜Ｔ０８に従属する。従属性は、タイルに基づいている。このような場合には、ユーザーがストリーミングのための画像部分、例えばフレーム１２００の領域１２１５を選択する場合には、エンハンスメントレイヤのタイルは、ベースレイヤの対応する従属するタイルと共にストリーミングされる。例えば、エンハンスメントレイヤフレーム１２１０のタイル部分Ｔ６およびＴ８はベースレイヤフレーム１２０５のタイル部分ＴＯ６およびＴ０８と共にストリーミングされる。

ユーザーにより選択された関心領域は、１つあるいは複数の隣接するタイル（例えば、図１１および図１２に示す例のタイルＴ６およびＴ８の組み合わせ、または図４に示す例のタイルＴ６およびＴ２の組み合わせ）に対応することができる。

上述したように、本発明の実施形態は、特に、ＨＥＶＣビデオフォーマットに適用することができる。

ＨＥＶＣ標準規格によれば、画像は、タイル、スライス、およびスライスセグメントに空間的に分割することができる。この標準規格では、タイルは、水平境界および垂直境界（すなわち、行および列）によって規定される画像の長方形領域に対応する。それは、整数個の符号化ツリーユニット（ＣＴＵ）を含む。したがって、例えば、関心領域の位置およびサイズを定義することによって、関心領域を識別するために、タイルを効率的に用いることができる。しかし、ＨＥＶＣビットストリームの構造、ならびにネットワークアブストラクト層（ＮＡＬ）ユニットとしてのそのカプセル化は、タイルについて構成されておらず、スライスに基づいている。

ＨＥＶＣ標準規格では、スライスはスライスセグメントの組であって、１組のスライスセグメントの最初のスライスセグメントは、独立なスライスセグメント、すなわち、ヘッダー内に記憶された一般情報が別のスライスセグメントの一般情報を参照しないスライスセグメントである。一組のスライスセグメントの他のスライスセグメントは、もしあれば、従属するスライスセグメント（すなわち、ヘッダー内に記憶された一般情報が独立なスライスセグメントの一般情報を参照するスライスセグメント）である。

スライスセグメントは、整数個の連続する（ラスター走査順の）符号化ツリーユニットを含む。したがって、スライスセグメントは長方形の形状であっても、そうでなくてもよく、したがって関心領域を表すことには適していない。それは、ＨＥＶＣビットストリーム、すなわちスライスセグメントデータが後に続くスライス・セグメント・ヘッダーの形式で符号化される。独立なスライスセグメントおよび従属するスライスセグメントは、それらのヘッダーによって区別され、従属するスライスセグメントは独立なスライスセグメントに従属するので、そのヘッダーの情報量は独立なスライスセグメントのヘッダーより小さい。独立なスライスセグメントおよび従属するスライスセグメントの両方は、タイルを定義するために用いられる対応するビットストリーム中のエントリ点、またはエントロピー復号化同期点としてのエントリ点のリストを含む。

図５は、図５ａ、図５ｂ、および図５ｃを含み、タイルおよびスライスセグメントの例を示す図である。より正確には、図５ａは、垂直境界５０５−１および５０５−２ならびに水平境界５１０−１および５１０−２によって９つの部分に分割された画像（５００）を示す。符号５１５−１〜５１５−９で示す９つの部分の各々は、特定のタイルを表す。

図５ｂは、垂直境界５０５’によって区切られた２つの垂直タイルを含む画像（５００’）を示す。画像５００’は、５つのスライスセグメント、すなわち１つの独立なスライスセグメント５２０−１（ハッチング線で示す）および４つの従属するスライスセグメント５２０−２〜５２０−５を含む単一のスライス（符号なし）を含む。

図５ｃは、垂直境界５０５”によって区切られた２つの垂直タイルを含む画像（５００”）を示す。左のタイルは、２つのスライス、すなわち、１つの独立なスライスセグメント（５２０’−１）および１つの従属するスライスセグメント（５２０’−２）を含む第１のスライスと、１つの独立なスライスセグメント（５２０’−３）および１つの従属するスライスセグメント（５２０’−４）を含む第２のスライスと、を含む。右のタイルは、１つの独立なスライスセグメント（５２０’−５）と、１つの従属するスライスセグメント（５２０’−６）と、を含む、１つのスライスを含む。

ＨＥＶＣ標準規格によれば、スライスセグメントは、以下のように要約することができるルールに従って、タイルにリンクされる（一方または両方の条件が満足されなければならない）。１つのスライスセグメントの全てのＣＴＵは、同じタイルに属する（すなわち、１つのスライスセグメントはいくつかのタイルに属することができない）。そして、１つのタイルの全てのＣＴＵは、同じスライスセグメントに属する（すなわち、１つのタイルはいくつかのスライスセグメントに分割することができるが、ただし、これらのスライスセグメントの各々はそのタイルだけに属する）。

明確にするため、以下では、１つのタイルがただ１つの独立なスライスセグメントを有する１つのスライスを含むと考える。しかし、本発明の実施形態は、図９ｂおよび図９ｃに示したように、他の構成によって実施することができる。

上述したように、タイルは関心領域に対する適切なサポートとみなすことができるが、スライスセグメントは通信ネットワーク上の輸送のためにＮＡＬユニットに実際に配置され、アクセスユニット（すなわちファイルフォーマットレベルの符号化画像またはサンプル）を形成するように集められた実体である。

ＨＥＶＣ標準規格によれば、ＮＡＬユニットのタイプが以下のように定義することができるＮＡＬユニットヘッダーの２バイトに符号化されることを想起すべきである。
ｎａｌ＿ｕｎｉｔ＿ｈｅａｄｅｒ（）｛
ｆｏｒｂｉｄｄｅｎ＿ｚｅｒｏ＿ｂｉｔ
ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ
ｎｕｈ＿ｌａｙｅｒ＿ｉｄ
ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１
｝
スライスセグメントを符号化するために用いられるＮＡＬユニットは、スライス・セグメント・アドレス・シンタックス要素のおかげで、スライスセグメントの最初のＣＴＵのアドレスを示すスライス・セグメント・ヘッダーを含む。このようなスライス・セグメント・ヘッダーは、以下のように定義することができる。
ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒ（）｛
ｆｉｒｓｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｉｎ＿ｐｉｃ＿ｆｌａｇ
ｉｆ（ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ＞＝ＢＬＡ＿Ｗ＿ＬＰ＆＆ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ＜＝ＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３）
ｎｏ＿ｏｕｔｐｕｔ＿ｏｆ＿ｐｒｉｏｒ＿ｐｉｃｓ＿ｆｌａｇ
ｓｌｉｃｅ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ
ｉｆ（！ｆｉｒｓｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｉｎ＿ｐｉｃ＿ｆｌａｇ）｛ｉｆ（ｄｅｐｅｎｄｅｎｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）
ｄｅｐｅｎｄｅｎｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｆｌａｇ
ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ａｄｄｒｅｓｓ
｝
Ｉｆ（！ｄｅｐｅｎｄｅｎｔ＿ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｆｌａｇ）｛
［…］
タイリング情報は、ＰＰＳ（画像パラメータセット）ＮＡＬユニットで提供される。その結果、スライスセグメントとタイルとの間の関係は、これらのパラメータから導き出すことができる。

空間的予測はタイル境界上でリセットされる（定義によって）が、タイルが参照フレームの異なるタイルからの時間的予測を用いることは妨げるものはない。したがって、独立なタイルを構築するために、予測ユニットのための運動ベクトルは、符号化の間、参照フレームの同じ位置に配置されたタイルに留まるように、タイル内部に有利に拘束される。さらに、１つのタイルだけを復号化する場合に誤差変動がもたらされないように、ループ内フィルタ（非ブロッキングおよびサンプル適応可能なオフセット（ＳＡＯ）フィルタ）は、好ましくはタイル境界上で非アクティブである。ループ内フィルタのこのような制御がＨＥＶＣ標準規格において利用できる点に留意する必要がある。それは、ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇとして知られるフラグにより、スライス・セグメント・ヘッダーにセットされる。このフラグをゼロに明示的にセットすることによって、タイル境界の画素は、隣接するタイルの境界にある画素に依存しないようにすることができる。運動ベクトルおよびループ内フィルタに関するこれらの２つの条件が満たされる場合には、タイルは「独立に復号化可能なタイル」または「独立なタイル」とみなすことができる。タイル符号化従属性に関するこの情報は、ＲＯＩ情報を信号で送るために、ＨＥＶＣビットストリームの専用ＳＥＩ（補足的な拡張情報）メッセージにセットすることができる。

ビデオビットストリームが１組の独立なタイルとして符号化されると、それは、参照データを失うリスクまたは再構築誤差の伝搬のリスクを伴わずに、１つのフレームから別のフレームまでタイルベースの復号化を可能にする。その後、この構成は、例えば、図４に示す関心領域（タイルＴ２およびＴ６を含む）、または図１１および図１２に示す関心領域（タイルＴ６およびＴ８を含む）に対応することができる、元のビデオの空間的部分だけを再構築することを可能にする。このような構成、独立なタイル、およびタイルに基づく従属性は、ビデオビットストリームのＳＥＩメッセージに示すことができる。これは、タイルに基づく復号化の信頼性が高いことを示すために、カプセル化および記述レベルにおいて利用することができる。

マニフェストに記述される前に、各タイルは、標準フォーマットでカプセル化されるために処理されなければならない。このようなカプセル化段階については、図６を参照して説明する。説明のために、カプセル化フォーマットは、ＩＳＯＢＭＦＦ標準規格に対応する（あるいは、この標準規格に準拠するメディアファイルの拡張である）。これは、ＭＰＥＧ／ＤＡＳＨ標準規格が構築ガイドラインを特定するフォーマットの１つである。

独立なタイルは、カプセル化モジュールの入力として提供され、各タイルはカプセル化のための独立なトラックとみなされる。符号化されたタイルごとに、作成されたＩＳＯＢＭＦＦファイルにおいてタイルトラックが定義される。それから、各タイルトラックは、全体の（またはフルフレーム）ビデオの空間的部分を表す。オーディオトラックまたはテキストトラックなどの付加的なトラックを用いることができて、同じファイルにカプセル化することができる。

複合トラックは、ＩＳＯＢＭＦＦファイルにおいて生成され定義される。それは、タイルの任意の組み合わせを扱うために用いられる。

タイルトラックおよび複合トラックの構成によれば、タイルデータは、タイルトラックの任意の組み合わせがタイルトラックを参照する複合トラックから容易に構築され得るように、独立でアドレス可能なトラックに分割される。

タイルトラックごとに、タイル位置、タイルサイズ、およびバンド幅などの情報のタイル項目は、トラックヘッダー、例えば「ｍｏｏｖ」ボックスとして知られたトラック・ヘッダー・ボックスに記憶される。ストリーミングのために、情報のこれらの項目は、ＤＡＳＨ標準規格で定義された初期設定セグメントに記憶することができる。

初期設定セグメントに加えて、カプセル化処理は、小さい期間に対応するセグメントファイル（ＭＰＤが生成される時に、ＵＲＬによりアクセスすることができるメディアセグメント）を生成する。セグメントは、通常、ムービーフラグメント（例え「ｍｏｏｆ」および「ｍｄａｔ」として知られたボックス）に対応する。１つのｍｐ４セグメントファイルは、ビデオの各時空的部分がアドレス可能になるように、ムービーフラグメントごとに、およびタイルトラックごとに生成される。

複合トラックは、同じ時間分割に従い、一時的にアドレスすることもできる。それは、エクストラクタ、通常はｍｐ４エクストラクタから主に構成され、各エクストラクタは１つのタイルトラックを参照する。それは、パース時に、データの欠如をサポートする特定のエクストラクタも含む。もちろん、ムービーフラグメントおよび対応するｍｐ４セグメントの数ならびにそれらの粒度は、限定されない。選択は、アプリケーションの機能として行われる。

カプセル化処理は、メディアプレゼンテーションに含まれるビデオをマニフェストに記述するマニフェスト生成器によって用いられる。

図６は、所与の時間的期間の連続するビデオフレームの空間部分を表現する有効な復号可能な時分割メディアデータ・ビットストリームを構築するために、ダウンロードされたメディアデータセグメントを連結する例を示す図である。同じ図は、他の時間的期間について繰り返すことができる。

上述したように、タイル化時分割メディアデータ・ビットストリームは、好ましくは、１つの初期設定セグメントファイルおよび複数のメディアセグメントファイルを含む一組のデータとして送信され、後者はいくつかのタイルトラックおよび１つの複合トラックを含む。

初期設定セグメントファイルは、各トラック上の一般情報、特にトラックのタイプ（例えばメディアトラック（音声もしくはビデオ）またはタイルトラック）、符号化フォーマット、フレーム解像度、およびトラック（トラック参照ボックス「ｔｒｅｆ」において与えられる）間の従属性を提供するムービーボックス６００（「ｍｏｏｖ」）を含む。これらのデータは、ダウンロードされたメディアセグメントファイルを処理するために用いられる。初期設定セグメントファイルのムービーボックスのコンテンツは、特に、以下を含むことができる。

ＭＯＯＶ
−トラック１：タイルａ
−トラック２：タイルｂ
−トラック３：タイルｃ
−トラック４：タイルｄ
−トラック５：タイルｅ
−トラック６：複合トラック
図６は、必要なメディアセグメントファイル（ここではタイルａおよびタイルｃに対応する）だけをサーバーからダウンロードする場合に、メディアセグメントを連結することによって得られるファイルフォーマットを概略的に示す。このような機構は、特に、各タイルが全体のベースレイヤに従属する（図１１ａを参照して説明したように）スケーラブルなビデオストリームの場合には、必要とするメディアセグメントファイルだけのダウンロードを可能にするだけではなく、重複するデータのダウンロードを防止することもできる点に留意すべきである。

図示するように、複合トラック６０５は、タイルトラック６１５および６２０からのデータを参照することによって、および、欠損データを参照するエクストラクタ（例えば、タイルｂと関係するタイルトラックからのデータを参照するエクストラクタ）を適切に扱うことによって、有効な復号化可能な時分割メディアデータ・ビットストリーム６１０を構築することを可能にする。

取得されたファイルフォーマットは、スケーラブルなファイルフォーマット定義に準拠する。例えば、クライアントデバイスは、この領域を選択することにより、タイルａおよびタイルｃに対応する関心領域を再生することを決定することができる。またクライアントデバイスは、それが複合トラックを再生し続ける間に、後の時間的期間において異なる「タイルトラック」（すなわちメディアセグメントファイル）をダウンロードすることによって、表示されるタイルを変更することもできる。

有効な時分割メディアデータ・ビットストリーム６１０は、クライアントデバイスによって受信された連結されたメディアセグメントから、より正確には、複合トラックがクライアントデバイスによって再生される場合に選択されたタイルから、生成される。

複合トラック６００を含む、以前要求されたメディアセグメントファイルを受信した後に、複合トラック６００は、メディアデータボックス「ｍｄａｔ」から、第１のデータの項目（または、受け取ったメディアセグメントの少なくとも１つのデータの項目が処理されている場合には、データの次の項目、通常はＮＡＬユニット）を抽出するために、パースされる。

次に、抽出されたデータの項目（例えば、抽出されたＮＡＬユニット）がエクストラクタ（ＥＸＴ）に対応するか否かを決定するために、テストが実行される。抽出されたデータの項目がエクストラクタに対応しない場合には、それはビデオデコーダによってさらに復号化されるように戻される。逆に、抽出されたデータの項目がエクストラクタである場合には、それを参照しているデータの項目と置き換えなければならない。そのために、エクストラクタのパラメータの値は、その構造から取得される（エクストラクタは、別のトラックからデータを抽出するために必要な全てのパラメータ値（例えば、トラック参照インデックス、サンプルオフセット、データオフセット、およびデータ長として知られるパラメータ）を含む）。

一旦参照されたトラックの識別子が識別されると、参照されたトラックがバッファされた一組のメディアセグメントファイルで利用可能か否かを決定するために、テストが実行される。クライアントデバイスが選択された関心領域に対応するメディアセグメントファイルだけをダウンロードするので、いくつかのタイルトラックは失われていることを想起すべきである。

参照されたトラックがバッファされた一組のメディアセグメントファイルで利用可能な場合には、エクストラクタはそれが参照しているデータと置き換えられ、ビットストリームは復号化するためにビデオデコーダに送られる。

参照されたトラックがバッファされた一組のメディアセグメントファイルで利用できない場合には、エクストラクタで参照されるデータの欠如はＩＳＯＢＭＦＦ標準規格により致命的エラーとなるので、特定のステップを実行する必要がある。参照されたトラックがタイルトラックであるか否か（参照されたトラックは従属するスケーラビリティ層に対応することができる）、およびエクストラクタがタイルタイプであるか否かを決定するために、テストが実行される。

参照されたトラックがタイルトラックでない場合、または、エクストラクタがタイルタイプでない場合には、標準致命的エラーが検出される。逆に、参照されたトラックがタイルトラックである場合で、かつ、エクストラクタがタイルタイプである場合には、エクストラクタは除去されるか、あるいは、エクストラクタは、時分割メディアデータ・ビットストリームを符号化するために用いる符号化フォーマットに応じて、失われたタイルの「スキップされた」データを含む代わりの「パディングトラック」または「パディングボックス」からのパディングと置き換えられる。ここで、「スキップされた」データは、同じスケーラブルな層に属するか、または別のスケーラブルな層に属する、前に復号化された画像から取得された他の画素データと置き換えられた、現行の画像から失われた画素データを表す。スキップされたデータは、一般に少なくとも１つのフラグによって表される。例えば、ＨＥＶＣビデオ圧縮フォーマットを考慮すると、パディングデータは１にセットされたスキップフラグによって符号化された符号化ユニットを排他的に含む１つまたは複数のＮＡＬＵであってもよい。

次に、ビットストリームは、復号化するためにビデオデコーダに送られて表示され、そして、続くデータの項目を扱うために、処理はループする。

上述したように、現行のマニフェスト、特にＭＰＤは、一組の任意の切換可能なコンポーネントとして、ビデオストリームを記述することができない。さらに、データをストリーミングするために用いるカプセル化方式によれば、表示することができる唯一のビデオトラックは、複合トラック（すなわちエクストラクタの解像度）のｍｐ４パーシングから得られるものである。タイルトラックは、単独で表示可能であるようには意図されていない。したがって、マニフェストは、アドレス可能なビデオリプリゼンテーションとして複合トラックを記述することを意図している。しかし、複合トラックは、それがタイルトラックを指し示すエクストラクタで構築されるので、いかなるデータ（いくつかのタイルトラックに共通するヘッダー情報を除く）も含まない。これは、タイルトラックもマニフェストに記述されなければならないこと、そして、クライアントデバイスによるタイル選択に応じて、これらのタイルのいくつかもダウンロードされなければならないことを意味している。

ＤＡＳＨ／ＭＰＤ標準規格で定義したように、メディアプレゼンテーションのタイルトラックなどの任意コンポーネント（例えばユーザーにより選択することができるコンポーネント）を記述する可能な方法は、ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎとして知られた構造の使用に基づく。この構造は、リプリゼンテーションに埋め込まれた１つまたはいくつかのコンポーネントの特性を記述する。

付録に与えられているコード３の抽出は、ビデオのコンポーネントとしてタイルトラックを記述するＤＡＳＨマニフェストの一例を示す。説明のために、１つの期間だけを表現しているが（タグ＜Ｐｅｒｉｏｄ＞ … ＜／Ｐｅｒｉｏｄ＞）、続くコンポーネントも同様である。示しているように、第１のアダプテーションセット（＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝’１’…＞）は、ＳＶＣまたはＨＥＶＣのスケーラブルな標準規格に従って符号化することができる記述されたスケーラブルなビデオのベースレイヤトラックから構成される特定のコンポーネントを記述するために用いられる。ベースレイヤは、識別子「Ｒ１」（＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝’Ｒ１’…＞）を有する単一の表現として記述される。第２のアダプテーションセット（＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝’２’…＞）は、スケーラブルなビデオの最も高い解像度層を記述するために用いられる。

ベースレイヤへのいかなる従属性もなしに（すなわち、いかなる従属性識別子属性もなしに）、非スケーラブルなビデオのマニフェストが第２の表されたものに類似する単一のアダプテーションセットを含む点に留意する必要がある。

第２のアダプテーションセットでは、別の単一のリプリゼンテーションが記述され（＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝’Ｒ２’…＞）、これは、表示可能なビデオに対応するものである。それは、クライアント要求のための対応するＵＲＬを有するセグメントのリスト（＜ｓｅｇｍｅｎｔＬｉｓｔ＞ … ＜／ＳｅｇｍｅｎｔＬｉｓｔ＞）として記述される。パラメータｄｅｐｅｎｄｅｎｃｙＩｄにより示されるように、表現‘Ｒ２’は、表現‘Ｒ１’（ｄｅｐｅｎｄｅｎｃｙＩｄ＝‘Ｒ１’）、すなわち第１のアダプテーションセットからのベースレイヤ表現に従属する。

このような従属性は、対応する現行のエンハンスメントレイヤセグメントを取得する前に、最初に現行のベースレイヤセグメントを要求することを、クライアントデバイスに強制する。この方法で参照されるトラックがクライアントによって自動的にロードされるので、これはタイルトラックに関する従属性を表すために用いることができない。本発明の実施形態の目的は、メディアプレゼンテーションの間のいかなる時にも関心のあるタイル（すなわち関心領域）をユーザーに選択させることであるから、これは回避すべきことである。

コンポーネント間の、特に複合トラックとタイルトラックとの間の従属性を信号で送ることは、ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎタイプの要素によって行われ、表示可能なビデオは、下位リプリゼンテーションのリスト（＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ…＞）として表現される。各下位リプリゼンテーションは、カプセル化されたファイル（例えば、カプセル化されたｍｐ４ファイル）のトラックを表す。したがって、１つの下位リプリゼンテーションは、各タイル（付録のコード３の抽出に示す例における４つのタイルＴａ〜Ｔｄ）および複合トラック（付録のコード３の抽出に示す例におけるＣＴ）に関係する。

各下位リプリゼンテーションは、それがタイルトラック（＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝’ｔｉｌｉｎｇ’＞）に対応するか、あるいは、複合トラック（＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝’ｒｏｌｅ’＞）に対応するか、を示すために、コンテンツコンポーネント要素（＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ …＞）によって記述される。これは、タイリング記述の特定の方式を有するＤＡＳＨ／ＭＰＤ標準規格において利用可能なＲｏｌｅ（役割）記述子タイプを用いて表される。この役割はまた、フルフレームビデオにおけるタイルの位置（＜Ｒｏｌｅ … ｖａｌｕｅ＝’ｘ，ｙ’＞）を示す。説明のために、識別子「Ｔａ」を有するタイル・コンテンツ・コンポーネントは、ビデオの左上（第１行および第１列に対する１：１）にあるタイルを記述する。

タイルの寸法（幅および高さ）は、ＭＰＤにより許容される下位リプリゼンテーションの属性として指定される。バンド幅値は、例えば、図１２を参照して説明したようにＳＮＲスケーラビリティが利用できる場合には、バンド幅基準に従って代わりのタイルバージョンを選択する際にＤＡＳＨクライアントデバイスを助ける下位リプリゼンテーション属性として示すこともできる点に留意する必要がある。

複合トラックは、それらのダウンロードが必須である（ダウンロード終了時に復号可能なビデオストリームを構築できるようにするために）ことを示すように、特定の方法で信号で送られる。このような特徴を示すために、関連したコンテンツコンポーネントの記述子は、それが全てのコンポーネントのうちの主要なコンポーネントであることを示す（＜Ｒｏｌｅ … ｖａｌｕｅ＝’ｍａｉｎ’／＞）。さらに、関係するデータがクライアントデバイスによって要求されなければならないことを示すために、対応する下位リプリゼンテーションにおいて、新規な属性「ｒｅｑｕｉｒｅｄ」が追加される（＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ … ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＝’ＣＴ’ ｒｅｑｕｉｒｅｄ＞）。

複合トラックに対する、または、１つもしくは複数のタイルトラックに対する全ての要求は、セグメントリスト（＜ＳｅｇｍｅｎｔＬｉｓｔ＞）に提供されたＵＲＬから時間間隔ごとに１つ計算される。図示する例（＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝≪ ＵＲＬ＿Ｘｉｎｄｅｘ＿ｒａｎｇｅ＝≪ ０−４３ ≫ ≫／＞）によれば、ＵＲＬＵＲＬ＿Ｘは、クライアントデバイスがそれに基づいてＨＴＴＰＧＥＴタイプの要求を生成することができる完全なＵＲＬを定義するために、ＭＰＤの始めに定義したように、ベースＵＲＬＢａｓｅＵＲＬと結合される。しかし、こうすることによって、クライアントデバイスは、複合トラックのためのデータならびに全てのタイルトラックのための全てのデータを取得する。したがって、用いられる通信ネットワーク上の伝送を最適化するために、第１の要求は、ＵＲＬのｉｎｄｅｘ＿ｒａｎｇｅ属性（例えばｉｎｄｅｘ＿ｒａｎｇｅ＝≪ ０−４３ ≫）を用いて、セグメントインデックス情報（ｓｉｄｘおよびｓｓｉｘと呼ばれ、図７を参照して説明する）を対象とする。次に、取得されたセグメントインデックス情報は、コンポーネントの各々のバイト範囲を決定するために、および、選択されたトラック（必要とされる複合トラックを含む）があるのと同程度に、適切なバイト範囲を有するＨＴＴＰＧＥＴタイプの多くの要求を実行するために、パースされる。

図７は、タイルトラックを信号で送るための下位リプリゼンテーションを用いるのに好適であるｍｐ４構成の一例を示す図である。

図示するように、カプセル化されたデータ７００のストリームは、初期化データを格納するために、「ｓｉｄｘ」および「ｓｓｉｘ」ボックスと同様に、「ｆｔｙｐ」、「ｍｏｏｖ」および「ｍｖｅｘ」として知られるボックスを含む。

「ｍｏｏｖ」ボックスは、特に、トラックの定義を含む。

タイルデータは、シーケンシャルに次々にセグメントに構成され、各セグメントは、考慮されたセグメントの各タイルのデータを含む。データは、メタデータに特有の初期化データを含む「ｍｏｏｆ」ボックスの後にある「ｍｄａｔ」ボックスに格納される。

符号７０５および７１０で示すように、「ｓｉｄｘ」ボックスに格納された情報の項目は、各セグメント（全てのタイルについて）の始まりおよび長さをバイト単位で定義し、「ｓｓｉｘ」ボックスに格納された情報の項目は、各タイルセグメントの長さをそれぞれ定義する。アンカー点（７１５）は、「ｓｓｉｘ」ボックスの始まりとして定義される。したがって、セグメントデータ（「ｍｏｏｆ」および「ｍｄａｔ」ボックス）は、アンカー点に「ｓｓｉｘ」ボックスの長さが追加されて定義されるアドレスから始まる。

この実施形態によれば、マニフェストの既存の要素が再利用される。したがって、それは、マニフェストにおいて最小の修正を必要とする。しかし、それは、クライアントデバイスに対して、タイルデータをアドレスするために用いるバイト範囲を決定することを可能にするために、特定のｍｐ４セグメントインデックス（例えば「ｍｖｅｘ」ボックスの「ｌｅｖａ」パラメータ、ならびにｓｉｄｘおよびｓｓｉｘボックスのパラメータ）をパースすることが可能であることを要求する。さらに、それは、セグメントインデックス要求の遅延、およびビデオデータを要求する位置にある前にパーシングを引き起こす。

メディアリプリゼンテーションの任意コンポーネントを記述するための別の実施形態によれば、コンポーネントは、それがあるままに、すなわち、フルフレームビデオの実際の空間的部分または空間的下位リプリゼンテーションとして、明示的に記述される。

ＤＡＳＨ標準規格に基づく、およびこの実施形態によるマニフェストの一例は、付録（コード４の抽出）に示されている。説明のために、１つの期間だけを表現しているが（タグ＜Ｐｅｒｉｏｄ＞ … ＜／Ｐｅｒｉｏｄ＞）、続くコンポーネントも同様である。

所与の例によれば、マニフェストは、所与の期間に２つのリプリゼンテーションを含み、一方は、スケーラブルなビデオのベースレイヤからなる特定のコンポーネントであり、他方は、同じスケーラブルなビデオ（エンハンスメントレイヤの空間的部分を表すコンポーネント）のエンハンスメントレイヤである。この第２のリプリゼンテーションは、スケーラブルな符号化（ＳＶＣ、スケーラブルなＨＥＶＣ、または任意の階層化した符号化）により、第１のリプリゼンテーションに従属する。示されているように、このような従属性はｄｅｐｅｎｄｅｎｃｙＩｄ属性（＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ … ｉｄ＝”ＥＬ１” ｄｅｐｅｎｄｅｎｃｙＩｄ＝ ”ＢＬ１” … ＞）によって表現される。

従属性に関しては、第２のリプリゼンテーションは、特定の信号送信を必要とするその空間的部分にも従属する。その目的のために、新規な要素は、リプリゼンテーションの「ｃｈｉｌｄ」を特徴づけるために定義される。このような新規な要素は、空間的下位リプリゼンテーション（＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ … ｄｅｐｅｎｄｅｎｃｙＩｄ＝” ” …＞）と呼ばれる。タイルトラックごとに、１つの空間的下位リプリゼンテーションが用いられる。したがって、記載した例では２つのタイルが考慮されているので、２つの空間的下位リプリゼンテーションが用いられる。

付録に与えられているコード６の抽出は、この新規な要素（＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ” ｔｙｐｅ＝”ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０” ｍａｘＯｃｃｕｒｓ＝”ｕｎｂｏｕｎｄｅｄ”／＞）をサポートするための、ＭＰＤＸＭＬスキーマの修正を示し、コード７の抽出は、ＭＰＤ要素のこの新規なタイプのＸＭＬスキーマ（＜ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅｎａｍｅ＝”ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎＴｙｐｅ”＞）を提供する。

具体的には、それは、空間的下位リプリゼンテーションによって表される空間的領域の位置を記述するために、２つの必須の属性（＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｐｏｓｘ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ” ｕｓｅ＝”ｒｅｑｕｉｒｅｄ”／＞および＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｐｏｓｙ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ” ｕｓｅ＝”ｒｅｑｕｉｒｅｄ”／＞）を含む。マニフェストがＸＭＬ標準規格に基づいているので、ＸＭＬスキーマ記述が用いられているが、任意の構造記述言語を用いることができる点に留意する必要がある。

上述した実施形態と比較して、この実施形態は、各空間的下位リプリゼンテーション内のセグメントリスト（＜ＳｅｇｍｅｎｔＬｉｓｔ …＞）を通して、タイルごとの直接的なアドレッシングを可能にする。

これは、特に、クライアントデバイスがｍｐ４ボックスをパースするために構成されることを回避する。

第２のリプリゼンテーション（＜ＲｅｐｒｅｓｅｎｔａｔｉｏｎｍｉｍｅＴｙｐｅ＝”ｖｉｄｅｏ／ｈｅｖｃ” ｃｏｄｅｃｓ＝”ｈｖｃ１．４Ｄ４０１Ｅ” ｉｄ＝”ＥＬ１” ｄｅｐｅｎｄｅｎｃｙＩｄ＝ ”ＢＬ１” ｂａｎｄｗｉｄｔｈ＝”１０２４０００” ｗｉｄｔｈ＝”１９２０” ｈｅｉｇｈｔ＝”１０８０”＞）のための、付録のコード４の抽出に与えられている例の最後のセグメントリスト（＜＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−１．ｍｐ４”／＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−２．ｍｐ４”／＞＜／ＳｅｇｍｅｎｔＬｉｓｔ＞）は、複合トラックのデータをストリーミングするためのＵＲＬに対応する。

ビデオタイプのリプリゼンテーションの空間的下位リプリゼンテーションをパースする場合には、クライアントデバイスは、それをこのリプリゼンテーションの任意コンポーネントとみなさければならない。

逆に、リプリゼンテーションの下で直接提供されるセグメントリスト（またはセグメントテンプレート、または時間的セグメントをアドレスするための任意の手段）は、クライアント側で表示可能なビデオを取得するために、ダウンロードされる。リプリゼンテーションに関係するバンド幅は、全てのタイルをダウンロードするために要求されるバンド幅を示す。空間的選択に基づくバンド幅の適合について、各空間的下位リプリゼンテーションのバンド幅パラメータを考慮することができる。

空間的下位リプリゼンテーションがより下層のスケーラビリティ層を参照するために従来の従属性機構（ｄｅｐｅｎｄｅｎｃｙＩｄ）を用いることができるので、図１１ｂを参照して説明するように、この実施形態がタイルベースのスケーラビリティをサポートするという点に留意する必要がある。これは、特に、各層で（そして、図１１に示す所与の例のように最も高い解像度レベルだけでなく）タイリングが利用できるスケーラブルなビデオストリームを扱うのに有用であり得る。それはまた、容易に理解できるという利点を有し、全てのタイル情報は、マニフェストのパージングの後に（様々な属性を通して）直接利用できる。この情報は、タイリング構成、特に層間タイル従属性を記述するＨＥＶＣに含まれるＳＥＩメッセージを読み出すことにより、サーバー２００によってマニフェストに入れることができる。

さらに、より精緻な適合可能性をクライアントデバイスに提供するために、この記述を用いて、タイルごとに、タイルサイズに関して、またはバンド幅に関して、代わりの空間的下位リプリゼンテーションを記述することができる。これは、図１２に示すような構成に役立つことができる。実際、ＳＮＲスケーラビリティの場合には、ユーザーは異なる品質でビデオに対する空間的アクセスを有し、同じ空間的領域を保持しつつ、１つの品質レベルから別の品質レベルへ動的に切り換えることを決定することができる。

これは、付録に与えられているコード５の抽出に示してあり、１つのＡｄａｐｔａｔｉｏｎＳｅｔだけが２つのリプリゼンテーションで記述されている。１つはベースレイヤについて、１つはＳＮＲエンハンスメントレイヤについてである。各層は、一組の空間的下位表現を有する。タイル間従属性は、エンハンスメントレイヤからベースレイヤへのグローバルな従属性を除去して、タイルに基づく従属性を特定するより精緻な方法で表現することができる点に留意する必要がある。したがって、ユーザーが一組のタイルを選択する場合には、ベースレイヤの対応するタイルだけがストリーミングされ、バンド幅リソースを節約する。さらに、このような記述は、それぞれのバンド幅を考慮して、異なる品質でタイルを結合することによって、より精緻な適合を提供する。これらのＳＮＲタイル（図１２に示すように）は、タイル位置ごとに、品質および関連するバンド幅に関する交互の空間的下位表現（図示する例では示していない）を含む１つの表現だけで、記述することができる。最後に、このような記述は、それがセグメントおよび表現に基づいたままであるので、ＤＡＳＨの動的な適合を壊さない。

別の実施形態によれば、任意コンポーネントの記述は、付録のコード８の抽出に示すように、記述子を参照してセグメントレベルでなされる。

説明のために、２つの層を有するスケーラブルなビデオが考慮されている。各層は、それ自体のアダプテーションセットに記述され、ベースレイヤについては（＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝‘１’ …＞）であり、エンハンスメントレイヤについては（＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝‘１’ …＞）であり、後者は空間的タイルを有するビデオストリームに対応する。唯一の表現がこのアダプテーションセットにおいて提供され、それは複合トラックからなる特定のコンポーネントに対応する。しかし、上述したように、少なくとも１つのタイルトラック（任意コンポーネント）が、表示可能なビデオの生成を可能にするためにダウンロードされなければならない。

示されているように、タイルトラックのアドレス（例えばＵＲＬ）は、複合トラックの主要ＵＲＬと同じレベルでＵＲＬのリスト（＜ＳｅｇｍｅｎｔＬｉｓｔ＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝≪ ＵＲＬ＿ＣＴ ≫ ｒｅｌａｔｅｄ＝≪ ＵＲＬ＿ＴａＵＲＬ＿ＴｂＵＲＬ＿ＴｃＵＲＬ＿Ｔｄ≫ ｔｙｐｅ＝≪ ＴａＴｂＴｃＴｄ≫／＞＜／ＳｅｇｍｅｎｔＬｉｓｔ＞）に与えられている。記述パラメータは複合トラックのＵＲＬと関係しているが、これは任意のＵＲＬのリストについては当てはまらない。これらの任意のＵＲＬを記述するために、各ＵＲＬに関する情報を提供する記述子（ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔａ’ …＞，＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｂ’ …＞，＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｃ’ …＞，および＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｄ’…＞）に対する参照のリストがそのリストの後に続く。コード８の抽出に示す例では、記述子は、コンテンツコンポーネント要素に置かれた役割タイプの要素である。タイルトラックごとに、１つのコンテンツコンポーネントがある。役割タイプの要素は、各タイルの情報を提供するために用いられ、上述したものに類似する。タイル位置に加えて、それらは、タイルサイズおよびバンド幅情報を含むこともできる。

付録のコード９の抽出は、ＵＲＬセグメントと同じレベルで置かれる任意の属性（＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｒｅｌａｔｅｄ” ｔｙｐｅ＝”ＵＲＬＶｅｃｔｏｒＴｙｐｅ”／＞，＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｒｅｌａｔｅｄＲａｎｇｅ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞，および＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｔｙｐｅ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞）を有するセグメントＵＲＬ要素（ＸＭＬスキーマにおいて）の拡張の一例を示す。その目的のために、パラメータの新規なタイプは、ＵＲＬのリスト（＜ｘｓ：ｓｉｍｐｌｅＴｙｐｅｎａｍｅ＝”ＵＲＬＶｅｃｔｏｒＴｙｐｅ”＞＜ｘｓ：ｌｉｓｔｉｔｅｍＴｙｐｅ＝”ｘｓ：ａｎｙＵＲＩ”／＞＜／ｘｓ：ｓｉｍｐｌｅＴｙｐｅ＞）を記述するために定義される。

図８は、前述の実施形態によるタイル記述を含むマニフェストを処理するためのクライアントデバイスで実行される処理ステップを示すフローチャートである。

最初の図示するステップ８００〜８２０は、タイリング情報が存在しない場合に、主としてマニフェスト（ＭＰＤ）をロードしてパースすることから成るＤＡＳＨ標準規格による標準ステップである。

例えばタイリングｓｃｈｅｍｅＩｄＵｒｉパラメータ値を含む役割要素の存在を検出することによって、あるいは、マニフェストの空間的下位リプリゼンテーション要素の存在を検出することによって、ステップ８１５でタイリングが検出される場合には、タイリング記述子または空間的下位リプリゼンテーションのいずれかをパースすることによって、符号８３０で示すものと類似のタイルインデックステーブルが構築される（ステップ８２５）。タイリング構成は、例えば、表示が開始されているビデオの上に重ね合わせられるグリッドとして、ユーザーに対して表示することができる（ステップ８３５）。

次に、ストリーミング処理中のいかなる時にも、ユーザーは、集中したい一組の１つまたはいくつかのタイルを選択することができる（ステップ８４０）。対応するＵＲＬ（インデックステーブル８３０の第３列に格納される）によっていくつかの要求が実行されなければならないということをアルゴリズムを実行するクライアントデバイスが知るように、タイルインデックステーブルにおいて、選択されたタイルはアクティブであるとマークされる（ステップ８４５）。

それから、プレゼンテーション（ステップ８５０）の各時間的セグメントで、すなわち各期間で、反復プロセスが開始され、その間に、各アクティブタイルの位置が、関連するＵＲＬと共にタイルインデックステーブルから読み出される（ステップ８５５および８６０）。取得されたＵＲＬは、アクティブなタイルトラックを受信するために、要求しているストリーミングサーバーに提出される（ステップ８６５）。同様に、現行の時間的セグメントの複合トラックのＵＲＬは、ストリーミングサーバーに提出される（ステップ８７０）。全てのアクティブなタイルトラックおよび複合トラックが受信される場合には、デコードして（ステップ８９０）表示する（ステップ８９５）ことができる標準の復号化可能なビットストリームを構築するために、クライアントデバイスは、複合トラック（再構成されたｍｐ４複合トラック）をパースし、タイルトラックからのデータにアクセスする位置にある（ステップ８８５）。

全てのセグメントデータが受信されない場合には、クライアントデバイスは、タイルトラックおよび複合トラックを待つ（ステップ８７５および８８０）。これによって、データがまだ受信されていない選択されたタイルのエクストラクタ解像度を失わないことを確実にする。

図９に示すように、このような処理は、（特に図８に関して説明したタイル記述子ではなく）任意の記述子について一般化することができる。示しているように、図８に示すアルゴリズムの１つの違いはインデックスにあるが、処理ステップはその図に関して説明したものと同様である。

図９は、前述の実施形態による従属性記述を含むマニフェストを処理するためのクライアントデバイスで実行される処理ステップを示すフローチャートである。

したがって、最初の図示するステップ９００〜９１０は、従属性情報が存在しない場合に、主としてマニフェスト（ＭＰＤ）をロードしてパースすることから成るＤＡＳＨ標準規格による標準ステップである。

例えば従属性ｓｃｈｅｍｅＩｄＵｒｉパラメータ値を含む役割要素の存在を検出することによって、あるいは、マニフェストの空間的下位リプリゼンテーション要素の存在を検出することによって、ステップ９０８で従属性が検出される場合には、記述子または空間的下位リプリゼンテーションのいずれかをパースすることによって、符号９１４で示すものと類似のインデックステーブルが構築される（ステップ９１２）。従属性構成は、ユーザーが表示される１つまたはいくつかの従属性を選ぶことができるように、ユーザーに対して有利に表示される（ステップ９１６）。

次に、ストリーミング処理中のいかなる時にも、ユーザーは、復号化処理によって用いることを望む一組の１つまたはいくつかの従属性を選択することができる（ステップ９１８）。対応するＵＲＬ（インデックステーブル９１４の第３列に格納される）によっていくつかの要求が実行されなければならないということをアルゴリズムを実行するクライアントデバイスがわかるように、インデックステーブルにおいて、選択された従属性はアクティブであるとマークされる（ステップ９２０）。

それから、プレゼンテーション（ステップ９２２）の各時間的セグメントで、すなわち各期間で、反復プロセスが開始され、その間に、復号化処理によって用いられるアクティブな従属性のリストが、関連するＵＲＬと共にインデックステーブルから読み出される（ステップ９２４および９２６）。取得されたＵＲＬは、アクティブな従属性を受信するために、要求しているストリーミングサーバーに提出される（ステップ９２８）。同様に、現行の時間的セグメントの主要トラックのＵＲＬは、ストリーミングサーバーに提出される（ステップ９３０）。全てのアクティブな従属性および主要トラックが受信されている場合には、デコードして（ステップ９３８）表示する（ステップ９４０）ことができる標準の復号化可能なビットストリームを構築するために、クライアントデバイスは、主要トラックをパースし、従属性トラックからのデータにアクセスする位置にある（ステップ９３６）。

データが全てのセグメントから受信されていない場合には、クライアントデバイスは従属性トラックおよび主要トラックを待つ（ステップ９３２および９３４）。これによって、データがまだ受信されていない選択された従属性のエクストラクタ解像度を失わないことを確実にする。

このような手法は、シンタックスの拡張を制限する（新規な要素が導入されない）という利点を有する。さらに、それはセグメントレベルで信号を送る任意のコンテンツのための一般的な方式を提供し、そのようにして、動的な適合のためのセグメントベースの手法および切り換えを維持する。

この実施形態の変形例は、現行のアダプテーションセット内のコンテンツコンポーネントの代わりに、別のアダプテーションセットの記述子に関するものである。これは、これらの表示可能なタイルトラックを参照して複合トラックを介して任意のタイルの組み合わせを提供し続けると共に、表示可能なトラックとしてカプセル化されるタイルトラックの場合に関連する。

図１０は、本発明の記載された実施形態の各々の各ステップまたはいくつかのステップを実行するために用いることができるコンピューティング装置１０００の模式的なブロック図である。コンピューティング装置１０００は、マイクロコンピュータ、ワークステーション、または軽量の携帯型装置などの装置であってもよい。

コンピューティング装置１０００は通信バスを含み、ＣＰＵで示すマイクロプロセッサなどの中央処理ユニット１００５および、本発明の実施形態の方法の実行可能コードを記録する、ＲＡＭで示すランダムアクセスメモリ１０１０、ならびに、マニフェストを読み書きするための、および／またはビデオを符号化するための、および／または所与のファイルフォーマットの下でデータを読み出しもしくは生成するための方法を実施するために必要な変数およびパラメータを格納するように適合したレジスタが、前記通信バスに接続されており、それらの記憶容量は、例えば拡張ポートに結合された任意のＲＡＭによって、拡張することができ、本発明の実施形態を実施するためのコンピュータプログラムを記憶するためのＲＯＭで示す読出し専用メモリ１０１５が、前記通信バスに接続されている。ネットワークインターフェース１０２０は、処理されるデジタルデータが送信または受信される通信ネットワークに通常は接続される。ネットワークインターフェース１０２０は、単一のネットワークインターフェースであってもよいし、あるいは一組の異なるネットワーク（例えば有線および無線インターフェース、または異なる種類の有線もしくは無線インターフェース）で構成されてもよい。データは、ＣＰＵ１００５で走っているソフトウェアアプリケーションの管理下で、送信のためにネットワークインターフェースへ書き込まれるか、または受信のためにネットワークインターフェースから読み出され、通信バスは、ユーザーからの入力を受信するための、または、ユーザーに対して情報を表示するためのユーザーインターフェース１０２５と、ＨＤで示すハードディスク１０３０と、ビデオソースまたはディスプレイなどの外部デバイスからデータを受信／外部デバイスへデータを送信するためのＩ／Ｏモジュール１０３５と、に接続される。

実行可能コードは、読出し専用メモリ１０１５、ハードディスク１０３０、または例えばディスクなどの取外し可能なデジタル媒体に記憶することができる。変形例によれば、プログラムの実行可能コードは、実行する前に、ハードディスク１０３０などの通信装置１０００の記憶装置手段の１つに記憶するために、ネットワークインターフェース１０２０を介して、通信ネットワークによって受信されてもよい。

中央処理ユニット１００５は、本発明の実施形態による１つまたは複数のプログラムの命令またはソフトウェアコードの一部の実行を制御し導くように適合し、その命令は上述した記憶手段の１つに記憶される。電源投入後、それらの命令が例えばプログラムＲＯＭ１０１５またはハードディスク１０３０からロードされた後に、ＣＰＵ１００５はソフトウェアアプリケーションに関する主ＲＡＭメモリ１０１０からの命令を実行することができる。このようなソフトウェアアプリケーションは、ＣＰＵ１００５によって実行されると、前述したアルゴリズムのステップを実行する。

この実施形態では、装置は、本発明を実施するためにソフトウェアを用いるプログラム可能な装置である。しかし、代わりに、本発明の実施形態は、ハードウェア（例えば、特定用途向け集積回路すなわちＡＳＩＣの形）で実施されてもよい。

本発明の実施形態は、例えば特定の関心領域にズームするために、カメラ、スマートフォン、またはＴＶのリモートコントローラとして働くタブレットなどの装置に埋め込むことができる。それらは、特定の関心領域を選択することによって、テレビ番組の個人的な閲覧を経験するために、同じ装置から用いることもできる。ユーザーによるこれらの装置の別の使用は、ユーザーが好むビデオの選択された副部分を他の接続された装置と共有することである。それらは、監視下に置かれた建物の特定の領域で起こることをモニターするために、スマートフォンまたはタブレットで用いることもでき、監視カメラは本発明の生成部分をサポートする。

本発明について特定の実施形態に関して上で説明したが、本発明は特定の実施形態に限定されず、本発明の範囲内にある修正は当業者にとって明らかであろう。

上述した例示的実施形態を参照すれば、当業者には多くのさらなる修正および変形が示唆されるであろうが、それらは単に例示として与えられたものであって、それらは本発明の範囲を限定するものではなく、その範囲は単に添付の特許請求の範囲のみによって決定される。特に、必要に応じて、異なる実施形態による異なる特徴は、相互に置き換えるすることができる。

なお、上述の実施形態は、以下のようにとらえることもできる。すなわち、本発明の第１の態様によれば、時間的メディアセグメントに構成されたストリーミングされた時分割メディアデータを受信するための方法が提供され、時分割メディアデータは、時限サンプルを含むパーティションで分割された時分割メディアデータに属し、各時限サンプルは、複数のサブサンプルを含み、時分割メディアデータは、時限サンプルのうちの１つの、複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのパーティションコンポーネントと、少なくとも１つのパーティションコンポーネントを識別する少なくとも１つのエクストラクタを含む少なくとも１つの参照コンポーネントと、を含む独立にカプセル化されたコンポーネントを含む少なくとも１つのメディアセグメントファイルとして送信され、本方法は、パーティションで分割された時分割メディアデータの複数のバージョンを記述するマニフェストを受信するステップであって、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともパーティションで分割された時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、複数のコンポーネントの記述を含み、複数のコンポーネントのうちの、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされ、かつ、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る任意コンポーネントである、マニフェストを受信するステップと、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの任意コンポーネントを選択するステップと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネント、およびパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを要求するステップと、要求されたコンポーネントを受信すると、受信したコンポーネントから再生可能なメディアリプリゼンテーションビットストリームを生成するステップと、を含む。

したがって、本発明は、クライアントデバイスが、マニフェストファイルから必要なデータおよび任意のデータを識別して、ストリーミングする一組の任意のデータを動的に選択することを可能にする。タイルに適用することにより、これは、ユーザーが定義した関心領域にストリーミングを動的に適合させることを可能にする。本発明により、クライアントデバイスは、メディアプレゼンテーションからのビデオが空間的アクセスを提供することについて通知を受けることができる。マニフェストからの情報を用いて、クライアントデバイスは、ビデオの特定の空間的領域へ動的に切り換えること、さらに、フルフレームビデオに動的に切り換えて戻ることを決定することができる。

一実施形態では、本方法は、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントと、の間の従属関係を確立するために、マニフェストをパースし、解析するステップをさらに含む。

一実施形態では、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントと、の間の従属関係は、マニフェストの従来型データ構造の従来型パラメータの非従来型値の関数として確立される。マニフェストのデータ構造およびデータ構造パラメータは、例えばＤＡＳＨ標準規格に準拠してもよい。

一実施形態では、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを要求するステップは、パラメータ値を要求するステップと、特に、パラメータ値を要求するステップに応答して取得されたパラメータ値の関数として、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを要求するステップと、を含む。

一実施形態では、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントと、の間の従属関係は、マニフェストの従来型データ構造の非従来型パラメータの値の関数として確立される。

一実施形態では、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントと、の間の従属関係は、マニフェストの非従来型データ構造のパラメータの値の関数として確立される。

ベースレイヤのフレームがタイルに分割される場合に、マニフェストの従来型または非従来型データ構造のこのような非従来型パラメータが、ベースレイヤのタイルおよびエンハンスメントレイヤのタイルなどの異なる層のタイル間の従属性を記述するために用いることができる点に留意すべきである。

一実施形態では、本方法は、インデックステーブルを構築するステップをさらに含み、構築されたインデックステーブルは、リクエストアドレスを少なくとも１つのリプリゼンテーションに記載された各任意コンポーネントの識別子と関係づける。

一実施形態では、本方法は、位置をインデックステーブルの各任意コンポーネント識別子と関係づけるステップをさらに含み、位置は、パーティションで分割された時分割メディアデータの再構築された部分において、対応する任意コンポーネントと関係するメディアデータが配置される位置を表す。

一実施形態では、本方法は、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントをパースするステップをさらに含み、再生可能なメディアリプリゼンテーションビットストリームは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントのパースされたデータの関数として決定された、少なくとも１つの選択された任意コンポーネントのメディアデータの関数として生成される。

本発明の第２の態様は、時間的メディアセグメントに構成されたストリーミングされた時分割メディアデータを受信するための方法を提供し、時分割メディアデータは、時限サンプルを含むタイル化時分割メディアデータに属し、各時限サンプルは、複数のサブサンプルを含み、時分割メディアデータは、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのタイルトラックと、少なくとも１つのタイルトラックを識別する少なくとも１つのエクストラクタを含む少なくとも１つの複合トラックと、を含む独立にカプセル化されたトラックを含む少なくとも１つのメディアセグメントファイルとして送信され、本方法は、タイル化時分割メディアデータの複数のバージョンを記述するマニフェストを受信するステップであって、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともタイル化時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、少なくとも１つの複合トラックおよび少なくとも１つのタイルトラックである複数のトラックの記述を含む、マニフェストを受信するステップと、少なくとも１つのタイルトラックを選択するステップと、少なくとも１つの複合トラックおよび少なくとも１つの選択されたタイルトラックを要求するステップと、要求されたトラックを受信すると、受信したトラックから再生可能なメディアリプリゼンテーションビットストリームを生成するステップと、を含む。

一実施形態では、本方法は、少なくとも１つの選択されたタイルトラックと少なくとも１つの複合トラックとの間の従属関係を確立するために、マニフェストをパースし、解析するステップをさらに含む。

一実施形態では、少なくとも１つの選択されたタイルトラックと少なくとも１つの複合トラックとの間の従属関係は、マニフェストの従来型データ構造の従来型パラメータの非従来型値の関数として確立される。マニフェストのデータ構造およびデータ構造パラメータは、例えばＤＡＳＨ標準規格に準拠してもよい。

一実施形態では、少なくとも１つの選択されたタイルトラックを要求するステップは、パラメータ値を要求するステップと、特に、パラメータ値を要求するステップに応答して取得されたパラメータ値の関数として、少なくとも１つの選択されたタイルトラックを要求するステップと、を含む。

一実施形態では、少なくとも１つの選択されたタイルトラックと少なくとも１つの複合トラックとの間の従属関係は、マニフェストの従来型データ構造の非従来型パラメータの値の関数として確立される。

一実施形態では、少なくとも１つの選択されたタイルトラックと少なくとも１つの複合トラックとの間の従属関係は、マニフェストの非従来型データ構造のパラメータの値の関数として確立される。

一実施形態では、本方法は、インデックステーブルを構築するステップをさらに含み、構築されたインデックステーブルは、リクエストアドレスを少なくとも１つのリプリゼンテーションに記載された各タイルトラックの識別子と関係づける。

一実施形態では、本方法は、位置をインデックステーブルの各タイルトラック識別子と関係づけるステップをさらに含み、位置は、タイル化時分割メディアデータの再構築された部分において、対応するタイルトラックと関係するメディアデータが配置される位置を表す。

一実施形態では、本方法は、少なくとも１つの複合トラックをパースするステップをさらに含み、再生可能なメディアリプリゼンテーションビットストリームは、少なくとも１つの複合トラックのパースされたデータの関数として決定された、少なくとも１つの選択されたタイルトラックのメディアデータの関数として生成される。

本発明の第３の態様は、時間的メディアセグメントに構成された時分割メディアデータを送信するための方法を提供し、時分割メディアデータは、時限サンプルを含むパーティションで分割された時分割メディアデータに属し、各時限サンプルは、複数のサブサンプルを含み、時分割メディアデータは、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのパーティションコンポーネントと、少なくとも１つのパーティションコンポーネントを識別する少なくとも１つのエクストラクタを含む少なくとも１つの参照コンポーネントと、を含む独立にカプセル化されたコンポーネントを含む少なくとも１つのメディアセグメントファイルとして送信され、本方法は、パーティションで分割された時分割メディアデータの複数のバージョンを記述するマニフェストを送信するステップを含み、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともパーティションで分割された時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、複数のコンポーネントの記述を含み、複数のコンポーネントのうちの、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされ、かつ、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る任意コンポーネントである。

一実施形態では、本方法は、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントを送信するための要求を受信するステップと、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを送信するための少なくとも１つの要求を受信するステップと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントおよび少なくとも１つの選択されたコンポーネントを送信するステップと、をさらに含む。

一実施形態では、本方法は、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを送信するための少なくとも１つの要求を受信する前に、パラメータ値のための要求を受信し、要求されたパラメータ値を送信するステップをさらに含み、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネント送信するための少なくとも１つの要求は、特に、送信されたパラメータ値に基づく。

本発明の第４の態様は、時限サンプルを含むパーティションで分割された時分割メディアデータの項目の送信を可能にするメディアプレゼンテーション記述を生成するための方法を提供し、各時限サンプルは、複数のサブサンプルを含み、パーティションで分割された時分割メディアデータは、時間的メディアセグメントに構成され、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのパーティションコンポーネントと、少なくとも１つのパーティションコンポーネントを識別する少なくとも１つのエクストラクタを含む少なくとも１つの参照コンポーネントと、を含む独立にカプセル化されたコンポーネントを含む少なくとも１つのメディアセグメントファイルとして送信され、本方法は、パーティションで分割された時分割メディアデータの複数のコンポーネントのコンポーネント間の従属関係を取得するステップであって、複数のコンポーネントのうちの少なくとも１つのコンポーネントは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされ、かつ、複数のコンポーネントのうちの少なくとも１つのコンポーネントは、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために任意である、従属関係を取得するステップと、
パーティションで分割された時分割メディアデータの複数のバージョンを記述するマニフェストを生成するステップであって、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともパーティションで分割された時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントの記述、およびパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために任意である少なくとも１つのコンポーネントの、記述を含む、マニフェストを生成するステップと、を含む。

一実施形態では、従属関係は、マニフェストの従来型データ構造の従来型パラメータの所定の非従来型値を用いて特徴づけられる。マニフェストのデータ構造およびデータ構造パラメータは、例えばＤＡＳＨ標準規格に準拠してもよい。

一実施形態では、従属関係は、マニフェストの従来型データ構造の非従来型パラメータの所定の値を用いて特徴づけられる。

一実施形態では、従属関係は、マニフェストの非従来型データ構造のパラメータの所定の値を用いて特徴づけられる。

本発明の第５の態様は、上述した方法の各ステップを実行するのに適合する手段を含む装置を提供する。

本発明の第６の態様は、時間的メディアセグメントに構成されたストリーミングされた時分割メディアデータを受信するための装置を提供し、時分割メディアデータは、時限サンプルを含むパーティションで分割された時分割メディアデータに属し、各時限サンプルは複数のサブサンプルを含み、時分割メディアデータは、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのパーティションコンポーネントと、少なくとも１つのパーティションコンポーネントを識別する少なくとも１つのエクストラクタを含む少なくとも１つの参照コンポーネントと、を含む独立にカプセル化されたコンポーネントを含む少なくとも１つのメディアセグメントファイルとして送信され、本装置は、パーティションで分割された時分割メディアデータの複数のバージョンを記述するマニフェストを受信するステップであって、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともパーティションで分割された時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、複数のコンポーネントの記述を含み、複数のコンポーネントのうちの、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされ、かつ、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る任意コンポーネントである、マニフェストを受信するステップと、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの任意コンポーネントを選択するステップと、
パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネント、およびパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを要求するステップと、
要求されたコンポーネントを受信すると、受信したコンポーネントから再生可能なメディアリプリゼンテーションビットストリームを生成するステップと、を実行するように構成された少なくとも１つのマイクロプロセッサを含む。

一実施形態では、マイクロプロセッサは、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントと、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントと、の間の従属関係を確立するために、マニフェストをパースし、解析するステップを実行するようにさらに構成される。

一実施形態では、マイクロプロセッサは、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを要求するステップが、パラメータ値を要求するステップと、特に、パラメータ値を要求するステップに応答して取得されたパラメータ値の関数として、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを要求するステップと、を含むようにさらに構成される。

一実施形態では、マイクロプロセッサは、インデックステーブルを構築するステップを実行するようにさらに構成され、構築されたインデックステーブルは、リクエストアドレスを少なくとも１つのリプリゼンテーションに記載された各任意コンポーネントの識別子と関係づける。

一実施形態では、マイクロプロセッサは、位置をインデックステーブルの各任意コンポーネント識別子と関係づけるステップを実行するようにさらに構成され、位置は、パーティションで分割された時分割メディアデータの再構築された部分において、対応する任意コンポーネントと関係するメディアデータが配置される位置を表す。

一実施形態では、マイクロプロセッサは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントをパースするステップを実行するようにさらに構成され、再生可能なメディアリプリゼンテーションビットストリームは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントのパースされたデータの関数として決定された、少なくとも１つの選択された任意コンポーネントのメディアデータの関数として生成される。

本発明の第７の態様は、時間的メディアセグメントに構成されたストリーミングされた時分割メディアデータを受信するための装置を提供し、時分割メディアデータは、時限サンプルを含むタイル化時分割メディアデータに属し、各時限サンプルは複数のサブサンプルを含み、時分割メディアデータは、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのタイルトラックと、少なくとも１つのタイルトラックを識別する少なくとも１つのエクストラクタを含む少なくとも１つの複合トラックと、を含む独立にカプセル化されたトラックを含む少なくとも１つのメディアセグメントファイルとして送信され、
本装置は、
タイル化時分割メディアデータの複数のバージョンを記述するマニフェストを受信するステップであって、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともタイル化時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、少なくとも１つの複合トラックおよび少なくとも１つのタイルトラックである複数のトラックの記述を含む、マニフェストを受信するステップと、
少なくとも１つのタイルトラックを選択するステップと、
少なくとも１つの複合トラックおよび少なくとも１つの選択されたタイルトラックを要求するステップと、
要求されたトラックを受信すると、受信したトラックから再生可能なメディアリプリゼンテーションビットストリームを生成するステップと、を実行するように構成された少なくとも１つのマイクロプロセッサを含む。

したがって、本発明は、クライアントデバイスが、マニフェストファイルから必要なデータおよび任意のデータを識別して、ストリーミングする一組の任意のデータを動的に選択することを可能にする。タイルに適用することにより、これは、ユーザーが定義した関心領域にストリーミングを動的に適合させることを可能にする。本発明により、クライアントデバイスは、メディアプレゼンテーションからのビデオが空間的アクセスを提供することについて通知を受けることができる。マニフェストからの情報を用いて、クライアントデバイスは、ビデオの特定の空間的領域へ動的に切り換えること、さらに、フルフレームビデオに動的に切り換え戻ることを決定することができる。

一実施形態では、マイクロプロセッサは、少なくとも１つの選択されたタイルトラックと少なくとも１つの複合トラックとの間の従属関係を確立するために、マニフェストをパースし、解析するステップを実行するようにさらに構成される。

一実施形態では、マイクロプロセッサは、少なくとも１つの選択されたタイルトラックを要求するステップが、パラメータ値を要求するステップと、特に、パラメータ値を要求するステップに応答して取得されたパラメータ値の関数として、少なくとも１つの選択されたタイルトラックを要求するステップと、を含むようにさらに構成される。

一実施形態では、マイクロプロセッサは、インデックステーブルを構築するステップを実行するようにさらに構成され、構築されたインデックステーブルは、リクエストアドレスを少なくとも１つのリプリゼンテーションに記載された各タイルトラックの識別子と関係づける。

一実施形態では、マイクロプロセッサは、位置をインデックステーブルの各タイルトラック識別子と関係づけるステップを実行するようにさらに構成され、位置は、タイル化時分割メディアデータの再構築された部分において、対応する任意コンポーネントと関係するメディアデータが配置される位置を表す。

一実施形態では、マイクロプロセッサは、少なくとも１つの複合トラックをパースするステップを実行するようにさらに構成され、再生可能なメディアリプリゼンテーションビットストリームは、少なくとも１つの複合トラックのパースされたデータの関数として決定された、少なくとも１つの選択されたタイルトラックのメディアデータの関数として生成される。

本発明の第８の態様は、上述した装置を含むビデオデコーダを提供する。

本発明の第９の態様は、時間的メディアセグメントに構成された時分割メディアデータを送信するための装置を提供し、時分割メディアデータは、時限サンプルを含むパーティションで分割された時分割メディアデータに属し、各時限サンプルは、複数のサブサンプルを含み、時分割メディアデータは、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのパーティションコンポーネントと、少なくとも１つのパーティションコンポーネントを識別する少なくとも１つのエクストラクタを含む少なくとも１つの参照コンポーネントと、を含む独立にカプセル化されたコンポーネントを含む少なくとも１つのメディアセグメントファイルとして送信され、
本装置は、
パーティションで分割された時分割メディアデータの複数のバージョンを記述するマニフェストを送信するステップを実行するように構成された少なくとも１つのマイクロプロセッサを含み、
マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともパーティションで分割された時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、複数のコンポーネントの記述を含み、複数のコンポーネントのうちの、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされ、かつ、少なくとも１つのコンポーネントはパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る任意コンポーネントである。

一実施形態では、マイクロプロセッサは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントを送信するための要求を受信するステップと、
パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを送信するための少なくとも１つの要求を受信するステップと、
パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントおよび少なくとも１つの選択されたコンポーネントを送信するステップと、を実行するようにさらに構成される。

一実施形態では、マイクロプロセッサは、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを送信するための少なくとも１つの要求を受信する前に、パラメータ値のための要求を受信し、要求されたパラメータ値を送信するステップを実行するようにさらに構成され、
パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために選択され得る少なくとも１つの選択された任意コンポーネントを送信するための少なくとも１つの要求は、特に、送信されたパラメータ値に基づく。

本発明の第１０の態様は、時限サンプルを含むパーティションで分割された時分割メディアデータの項目の送信を可能にするメディアプレゼンテーション記述を生成するための装置を提供し、各時限サンプルは複数のサブサンプルを含み、パーティションで分割された時分割メディアデータは、時間的メディアセグメントに構成され、時限サンプルのうちの１つの複数のサブサンプルの中から選択されたサブサンプル、および他の時限サンプルの各々の１つの対応するサブサンプルを収容する少なくとも１つのパーティションコンポーネントと、少なくとも１つのパーティションコンポーネントを識別する少なくとも１つのエクストラクタを含む少なくとも１つの参照コンポーネントと、を含む独立にカプセル化されたコンポーネントを含む少なくとも１つのメディアセグメントファイルとして送信され、
本装置は、
パーティションで分割された時分割メディアデータの複数のコンポーネントのコンポーネント間の従属関係を取得するステップであって、複数のコンポーネントのうちの少なくとも１つのコンポーネントは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされ、かつ、複数のコンポーネントのうちの少なくとも１つのコンポーネントは、パーティションで分割された時分割メディアデータの少なくとも一部を再構築するために任意である、従属関係を取得するステップと、
パーティションで分割された時分割メディアデータの複数のバージョンを記述するマニフェストを生成するステップであって、マニフェストは、リプリゼンテーションを含み、各リプリゼンテーションは、少なくともパーティションで分割された時分割メディアデータの一部のバージョンの記述を含み、少なくとも１つのリプリゼンテーションは、パーティションで分割された時分割メディアデータを少なくとも部分的に再構築するために必要とされる少なくとも１つのコンポーネントの記述、およびパーティションで分割された時分割メディアデータの少なくとも一部を再構築するために任意である少なくとも１つのコンポーネントの、記述を含む、マニフェストを生成するステップと、を実行するように構成された少なくとも１つのマイクロプロセッサを含む。

本発明の第１１の態様は、上述した装置を含むビデオエンコーダを提供する。

本発明はソフトウェアで実現することができるので、本発明は、任意の好適なキャリア媒体上の、プログラム可能な装置に供給するためのコンピュータ可読コードとして具現化することができる。有形のキャリア媒体は、フロッピー（登録商標）ディスク、ＣＤ−ＲＯＭ、ハードディスクドライブ、磁気テープデバイス、または固体状態メモリデバイスなどの記憶媒体を含むことができる。一時的なキャリア媒体は、電気信号、電子信号、光信号、音響信号、磁気信号、または電磁信号、例えばマイクロ波もしくはＲＦ信号などの信号を含むことができる。

＜付録＞
Ｆｉｌｅｎａｍｅ＝Ｍｏｖｉｅ＿４．ｍｆ
Ｔｙｐｅｏｆｓｅｇｍｅｎｔａｔｉｏｎ＝ｓｐａｔｉａｌｌｙ
Ｎｕｍｂｅｒｏｆｓｅｇｍｅｎｔｓ＝４
Ｒｅｌａｔｉｏｎｓｈｉｐｓｂｅｔｗｅｅｎｓｅｇｍｅｎｔｓ＝２ｘ２ｍａｔｒｉｘ
Ｓｅｇｍｅｎｔ
Ｓｅｇｍｅｎｔｎａｍｅ＝ｃａｃｈｅ．ｓｏｕｒｃｅ．ｃｏｍ／ｒｅｓ／Ｍｏｖｉｅ−４−１．ｓｅｇ
Ｐｏｓｉｔｉｏｎｉｎｗｈｏｌｅ＝（０，０）
Ｓｅｇｍｅｎｔ
Ｓｅｇｍｅｎｔｎａｍｅ＝ｃａｃｈｅ．ｓｏｕｒｃｅ．ｃｏｍ／ｒｅｓ／Ｍｏｖｉｅ−４−２．ｓｅｇ
Ｐｏｓｉｔｉｏｎｉｎｗｈｏｌｅ＝（０，１）
Ｓｅｇｍｅｎｔ
Ｓｅｇｍｅｎｔｎａｍｅ＝ｃａｃｈｅ．ｓｏｕｒｃｅ．ｃｏｍ／ｒｅｓ／Ｍｏｖｉｅ−４−３．ｓｅｇ
Ｐｏｓｉｔｉｏｎｉｎｗｈｏｌｅ＝（１，０）
Ｓｅｇｍｅｎｔ
Ｓｅｇｍｅｎｔｎａｍｅ＝ｃａｃｈｅ．ｓｏｕｒｃｅ．ｃｏｍ／ｒｅｓ／Ｍｏｖｉｅ−４−４．ｓｅｇ
Ｐｏｓｉｔｉｏｎｉｎｗｈｏｌｅ＝（１，１）
コード１の抽出：マニフェストファイル
＜？ｘｍｌｖｅｒｓｉｏｎ＝”１．０”？＞
＜ＭＰＤｘｍｌｎｓ：ｘｓｉ＝”ｈｔｔｐ：／／ｗｗｗ．ｗ３．ｏｒｇ／２００１／ＸＭＬＳｃｈｅｍａ‐ｉｎｓｔａｎｃｅ”
ｘｍｌｎｓ＝”ｕｒｎ：ｍｐｅｇ：ＤＡＳＨ：ｓｃｈｅｍａ：ＭＰＤ：２０１１”ｘｓｉ：ｓｃｈｅｍａＬｏｃａｔｉｏｎ＝”ｕｒｎ：ｍｐｅｇ：ＤＡＳＨ：ｓｃｈｅｍａ：ＭＰＤ：２０１１ＤＡＳＨ‐ＭＰＤ．ｘｓｄ”
ｔｙｐｅ＝”ｓｔａｔｉｃ”
ｍｅｄｉａＰｒｅｓｅｎｔａｔｉｏｎＤｕｒａｔｉｏｎ＝”ＰＴ３２５６Ｓ”
ｍｉｎＢｕｆｆｅｒＴｉｍｅ＝”ＰＴ１．２Ｓ”
ｐｒｏｆｉｌｅｓ＝”ｕｒｎ：ｍｐｅｇ：ｄａｓｈ：ｐｒｏｆｉｌｅ：ｉｓｏｆｆ‐ｏｎ‐ｄｅｍａｎｄ：２０１１”＞
＜ＢａｓｅＵＲＬ＞ｈｔｔｐ：／／ｃｄｎ１．ｅｘａｍｐｌｅ．ｃｏｍ／＜／ＢａｓｅＵＲＬ＞
＜ＢａｓｅＵＲＬ＞ｈｔｔｐ：／／ｃｄｎ２．ｅｘａｍｐｌｅ．ｃｏｍ／＜／ＢａｓｅＵＲＬ＞
＜Ｐｅｒｉｏｄ＞
＜！‐‐ ＥｎｇｌｉｓｈＡｕｄｉｏ ‐‐＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｍｉｍｅＴｙｐｅ＝”ａｕｄｉｏ／ｍｐ４” ｃｏｄｅｃｓ＝”ｍｐ４ａ．０ｘ４０” ｌａｎｇ＝”ｅｎ”
ｓｕｂｓｅｇｍｅｎｔＡｌｉｇｎｍｅｎｔ＝”ｔｒｕｅ” ｓｕｂｓｅｇｍｅｎｔＳｔａｒｔｓＷｉｔｈＳＡＰ＝”１”＞
＜ＣｏｎｔｅｎｔＰｒｏｔｅｃｔｉｏｎｓｃｈｅｍｅＩｄＵｒｉ＝”ｕｒｎ：ｕｕｉｄ：７０６Ｄ６９５３‐６５６Ｃ‐５２４４‐４Ｄ４８‐６５６１６４６５７２２１”／＞＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”１” ｂａｎｄｗｉｄｔｈ＝”６４０００”＞
＜ＢａｓｅＵＲＬ＞７６５７４１２３４８．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”２” ｂａｎｄｗｉｄｔｈ＝”３２０００”＞
＜ＢａｓｅＵＲＬ＞３４６３６４６３４６．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜！‐‐ Ｖｉｄｅｏ ‐‐＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｍｉｍｅＴｙｐｅ＝”ｖｉｄｅｏ／ｍｐ４” ｃｏｄｅｃｓ＝”ａｖｃ１．４ｄ０２２８”
ｓｕｂｓｅｇｍｅｎｔＡｌｉｇｎｍｅｎｔ＝”ｔｒｕｅ” ｓｕｂｓｅｇｍｅｎｔＳｔａｒｔｓＷｉｔｈＳＡＰ＝”２”＞
＜ＣｏｎｔｅｎｔＰｒｏｔｅｃｔｉｏｎｓｃｈｅｍｅＩｄＵｒｉ＝”ｕｒｎ：ｕｕｉｄ：７０６Ｄ６９５３‐６５６Ｃ‐５２４４‐４Ｄ４８‐５６１６４６５７２２１”／＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”６” ｂａｎｄｗｉｄｔｈ＝”２５６０００” ｗｉｄｔｈ＝”３２０” ｈｅｉｇｈｔ＝”２４０”＞
＜ＢａｓｅＵＲＬ＞８５６３４５６４７３．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”７” ｂａｎｄｗｉｄｔｈ＝”５１２０００” ｗｉｄｔｈ＝”３２０” ｈｅｉｇｈｔ＝”２４０”＞
＜ＢａｓｅＵＲＬ＞５６３６３６３４．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”８” ｂａｎｄｗｉｄｔｈ＝”１０２４０００” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０”＞
＜ＢａｓｅＵＲＬ＞５６２４６５７３６．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”９” ｂａｎｄｗｉｄｔｈ＝”１３８４０００” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０”＞
＜ＢａｓｅＵＲＬ＞４１３２５６４５．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”Ａ” ｂａｎｄｗｉｄｔｈ＝”１５３６０００” ｗｉｄｔｈ＝”１２８０” ｈｅｉｇｈｔ＝”７２０”＞
＜ＢａｓｅＵＲＬ＞８９０４５６２５．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”Ｂ” ｂａｎｄｗｉｄｔｈ＝”２０４８０００” ｗｉｄｔｈ＝”１２８０” ｈｅｉｇｈｔ＝”７２０”＞
＜ＢａｓｅＵＲＬ＞２３５３６７４５７３４．ｍｐ４＜／ＢａｓｅＵＲＬ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜／Ｐｅｒｉｏｄ＞
＜／ＭＰＤ＞
コード２の抽出：マニフェストファイル
＜ＭＰＤ …＞
＜Ｐｅｒｉｏｄ＞
＜ＢａｓｅＵＲＬ＞ｈｔｔｐ：／／ｍｙｓｅｒｖｅｒ．ｃｏｍ／ｍｅｄｉａ＜／ＢａｓｅＵＲＬ＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＩｎｉｔｉａｌｉｚａｔｉｏｎｓｏｕｒｃｅＵＲＬ＝≪ ＵＲＬ＿ＳＩ ≫／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝‘１’ ｃｏｎｔｅｎｔＴｙｐｅ＝‘ｖｉｄｅｏ’ ｆｒａｍｅｒａｔｅ＝‘３０’＞
＜！−− Ｂａｓｅｌａｙｅｒｄｅｓｃｒｉｐｔｉｏｎ −−＞＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝‘Ｒ１’ ｍｉｍｅＴｙｐｅ＝‘ｖｉｄｅｏ／ｍｐ４’ ｗｉｄｔｈ＝‘２０００’ ｈｅｉｇｈｔ＝‘１０００’ｂａｎｄｗｉｄｔｈ＝‘５１２０００’＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝≪ ＵＲＬ＿ＢＬ ≫／＞＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜！−− Ｅｎｈａｎｃｅｍｅｎｔｌａｙｅｒｄｅｓｃｒｉｐｔｉｏｎ，ｃｏｍｐｏｓｉｔｅｔｒａｃｋ −−＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝‘２’ ｃｏｎｔｅｎｔＴｙｐｅ＝‘ｖｉｄｅｏ’ ｆｒａｍｅｒａｔｅ＝‘３０’＞
＜！− Ｔｉｌｅａ，ｂ，ｃａｎｄｄａｒｅｄｅｓｃｒｉｂｅｄａｓｃｏｍｐｏｎｅｎｔｓｏｆｃｏｍｐｏｓｉｔｅｔｒａｃｋ −−＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔａ’ ／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｖａｌｕｅ＝‘１：１’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｂ’／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｖａｌｕｅ＝‘１：２’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｃ’／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｖａｌｕｅ＝‘２：１’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｄ’／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｖａｌｕｅ＝‘２：２’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘ＣＴ’／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘…ｒｏｌｅ’ ｖａｌｕｅ＝‘ｍａｉｎ’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝‘Ｒ２’ ｍｉｍｅＴｙｐｅ＝‘ｖｉｄｅｏ／ｍｐ４’ ｄｅｐｅｎｄｅｎｃｙＩｄ＝‘Ｒ１’ ｗｉｄｔｈ＝‘４０００’ ｈｅｉｇｈｔ＝‘２０００’ ｂａｎｄｗｉｄｔｈ＝‘２０４８０００’＞
＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｌｅｖｅｌ＝‘１’ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＝‘Ｔａ’ ｗｉｄｔｈ＝‘２０００’ ｈｅｉｇｈｔ＝‘１０００’／＞
＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｌｅｖｅｌ＝‘２’ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＝‘Ｔｂ’ ｗｉｄｔｈ＝‘２０００’ ｈｅｉｇｈｔ＝‘１０００’／＞
＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｌｅｖｅｌ＝‘３’ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＝‘Ｔｃ’ ｗｉｄｔｈ＝‘２０００’ ｈｅｉｇｈｔ＝‘１０００’／＞
＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｌｅｖｅｌ＝‘４’ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＝‘Ｔｄ’ ｗｉｄｔｈ＝‘２０００’ ｈｅｉｇｈｔ＝‘１０００’／＞
＜ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｌｅｖｅｌ＝‘５’ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＝‘ＣＴ’ ｒｅｑｕｉｒｅｄ／＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝≪ ＵＲＬ＿Ｘｉｎｄｅｘ＿ｒａｎｇｅ＝≪ ０−４３ ≫ ≫／＞
…．
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜／Ｐｅｒｉｏｄ＞
＜／ＭＰＤ＞
コード３の抽出：下位リプリゼンテーション構造を含むマニフェストファイル
＜Ｐｅｒｉｏｄ＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞＜ＩｎｉｔｉａｌｉｚａｔｉｏｎｓｏｕｒｃｅＵＲＬ＝”ｓｅｇ−ｍ−ｉｎｉｔ．ｍｐ４”／＞＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｓｕｂｓｅｇｍｅｎｔＡｌｉｇｎｍｅｎｔ＝”ｔｒｕｅ” ｓｕｂｓｅｇｍｅｎｔＳｔａｒｔｓＷｉｔｈＳＡＰ＝”２” ｍｉｎＢａｎｄｗｉｄｔｈ＝”５１２０００” ｍａｘＢａｎｄｗｉｄｔｈ＝”１０２４０００” ｆｒａｍｅＲａｔｅ＝”３０” ＞
＜ＲｅｐｒｅｓｅｎｔａｔｉｏｎｍｉｍｅＴｙｐｅ＝”ｖｉｄｅｏ／ｈｅｖｃ” ｃｏｄｅｃｓ＝”ｈｖｃ１．４Ｄ４０１Ｅ” ｉｄ＝”ＢＬ１” ｂａｎｄｗｉｄｔｈ＝”５１２０００” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＢＬ−１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＢＬ−２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜ＲｅｐｒｅｓｅｎｔａｔｉｏｎｍｉｍｅＴｙｐｅ＝”ｖｉｄｅｏ／ｈｅｖｃ” ｃｏｄｅｃｓ＝”ｈｖｃ１．４Ｄ４０１Ｅ” ｉｄ＝”ＥＬ１” ｄｅｐｅｎｄｅｎｃｙＩｄ＝ ”ＢＬ１” ｂａｎｄｗｉｄｔｈ＝”１０２４０００” ｗｉｄｔｈ＝”１２８０” ｈｅｉｇｈｔ＝”１０８０”＞
＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”ｔｉｌｅＡ” ｄｅｐｅｎｄｅｎｃｙＩｄ＝” ” ｐｏｓｘ＝”０” ｐｏｓｙ＝”０”ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０” ｂａｎｄｗｉｄｔｈ＝”５１２０００”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＡ−１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＡ−２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”ｔｉｌｅＢ” ｄｅｐｅｎｄｅｎｃｙＩｄ＝” ” ｐｏｓｘ＝”６４０” ｐｏｓｙ＝”０” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０” ｂａｎｄｗｉｄｔｈ＝”５１２０００”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＢ−１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＢ−２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜／Ｐｅｒｉｏｄ＞
コード４の抽出：特定の下位リプリゼンテーション構造を含むマニフェストファイル
＜Ｐｅｒｉｏｄ＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞＜ＩｎｉｔｉａｌｉｚａｔｉｏｎｓｏｕｒｃｅＵＲＬ＝”ｓｅｇ−ｍ−ｉｎｉｔ．ｍｐ４”／＞＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｓｕｂｓｅｇｍｅｎｔＡｌｉｇｎｍｅｎｔ＝”ｔｒｕｅ” ｓｕｂｓｅｇｍｅｎｔＳｔａｒｔｓＷｉｔｈＳＡＰ＝”２” ｍｉｎＢａｎｄｗｉｄｔｈ＝”５１２０００” ｍａｘＢａｎｄｗｉｄｔｈ＝”１０２４０００” ｆｒａｍｅＲａｔｅ＝”３０” ＞
＜ＲｅｐｒｅｓｅｎｔａｔｉｏｎｍｉｍｅＴｙｐｅ＝”ｖｉｄｅｏ／ｈｅｖｃ” ｃｏｄｅｃｓ＝”ｈｖｃ１．４Ｄ４０１Ｅ” ｉｄ＝”ＢＬ１” ｂａｎｄｗｉｄｔｈ＝”５１２０００” ｗｉｄｔｈ＝”１２８０” ｈｅｉｇｈｔ＝”１０８０”＞
＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”ｔｉｌｅＡ＿０” ｐｏｓｘ＝”０” ｐｏｓｙ＝”０” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＡ−０１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＡ−０２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”ｔｉｌｅＢ＿０” ｐｏｓｘ＝”６４０” ｐｏｓｙ＝”０” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＢ−０１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＢ−０２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜！−Ｃｏｍｐｏｓｉｔｅｔｒａｃｋｆｏｒｂａｓｅｌａｙｅｒ −−＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＢＬ−１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＢＬ−２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜ＲｅｐｒｅｓｅｎｔａｔｉｏｎｍｉｍｅＴｙｐｅ＝”ｖｉｄｅｏ／ｈｅｖｃ” ｃｏｄｅｃｓ＝”ｈｖｃ１．４Ｄ４０１Ｅ” ｉｄ＝”ＥＬ１” ｂａｎｄｗｉｄｔｈ＝”１０２４０００” ｗｉｄｔｈ＝”１２８０” ｈｅｉｇｈｔ＝”１０８０”＞
＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”ｔｉｌｅＡ＿１” ｄｅｐｅｎｄｅｎｃｙＩｄ＝”ｔｉｌｅＡ＿０” ｐｏｓｘ＝”０” ｐｏｓｙ＝”０” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０” ｂａｎｄｗｉｄｔｈ＝”５１２０００”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＡ−１１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＡ−１２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝”ｔｉｌｅＢ＿１” ｄｅｐｅｎｄｅｎｃｙＩｄ＝”ｔｉｌｅＢ＿０” ｐｏｓｘ＝”６４０” ｐｏｓｙ＝”０” ｗｉｄｔｈ＝”６４０” ｈｅｉｇｈｔ＝”４８０” ｂａｎｄｗｉｄｔｈ＝”５１２０００”＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＢ−１１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−ｔｉｌｅＢ−１２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜！−ＣｏｍｐｏｓｉｔｅｔｒａｃｋｆｏｒＳＮＲｅｎｈａｎｃｅｍｅｎｔｌａｙｅｒ −−＞
＜ＳｅｇｍｅｎｔＬｉｓｔｄｕｒａｔｉｏｎ＝”１０”＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−１．ｍｐ４”／＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝”ｓｅｇ−ＥＬ１−２．ｍｐ４”／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜／Ｐｅｒｉｏｄ＞
コード５の抽出：特定の下位リプリゼンテーション構造を含むマニフェストファイル
＜！− ＭｏｄｉｆｉｃａｔｉｏｎｏｆｔｈｅＲｅｐｒｅｓｅｎｔａｔｉｏｎｔｙｐｅ −−＞
＜ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅｎａｍｅ＝”ＲｅｐｒｅｓｅｎｔａｔｉｏｎＴｙｐｅ”＞
＜ｘｓ：ｃｏｍｐｌｅｘＣｏｎｔｅｎｔ＞
＜ｘｓ：ｅｘｔｅｎｓｉｏｎｂａｓｅ＝”ＲｅｐｒｅｓｅｎｔａｔｉｏｎＢａｓｅＴｙｐｅ”＞
＜ｘｓ：ｓｅｑｕｅｎｃｅ＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＢａｓｅＵＲＬ” ｔｙｐｅ＝”ＢａｓｅＵＲＬＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０” ｍａｘＯｃｃｕｒｓ＝”ｕｎｂｏｕｎｄｅｄ”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ” ｔｙｐｅ＝”ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０” ｍａｘＯｃｃｕｒｓ＝”ｕｎｂｏｕｎｄｅｄ”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎ” ｔｙｐｅ＝”ＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０” ｍａｘＯｃｃｕｒｓ＝”ｕｎｂｏｕｎｄｅｄ”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｅｇｍｅｎｔＢａｓｅ” ｔｙｐｅ＝”ＳｅｇｍｅｎｔＢａｓｅＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｅｇｍｅｎｔＬｉｓｔ” ｔｙｐｅ＝”ＳｅｇｍｅｎｔＬｉｓｔＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｅｇｍｅｎｔＴｅｍｐｌａｔｅ” ｔｙｐｅ＝”ＳｅｇｍｅｎｔＴｅｍｐｌａｔｅＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０”／＞
＜／ｘｓ：ｓｅｑｕｅｎｃｅ＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｉｄ” ｔｙｐｅ＝”ＳｔｒｉｎｇＮｏＷｈｉｔｅｓｐａｃｅＴｙｐｅ” ｕｓｅ＝”ｒｅｑｕｉｒｅｄ”／＞＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｂａｎｄｗｉｄｔｈ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ” ｕｓｅ＝”ｒｅｑｕｉｒｅｄ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｑｕａｌｉｔｙＲａｎｋｉｎｇ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｄｅｐｅｎｄｅｎｃｙＩｄ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｍｅｄｉａＳｔｒｅａｍＳｔｒｕｃｔｕｒｅＩｄ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞
＜／ｘｓ：ｅｘｔｅｎｓｉｏｎ＞
＜／ｘｓ：ｃｏｍｐｌｅｘＣｏｎｔｅｎｔ＞
＜／ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅ＞
コード６の抽出：ＭＰＤリプリゼンテーション要素の修正
＜！− ＤｅｆｉｎｉｔｉｏｎｏｆｔｈｅＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎｅｌｅｍｅｎｔ −−＞
＜ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅｎａｍｅ＝”ＳｐａｔｉａｌＳｕｂＲｅｐｒｅｓｅｎｔａｔｉｏｎＴｙｐｅ”＞
＜ｘｓ：ｃｏｍｐｌｅｘＣｏｎｔｅｎｔ＞
＜ｘｓ：ｅｘｔｅｎｓｉｏｎｂａｓｅ＝”ＲｅｐｒｅｓｅｎｔａｔｉｏｎＢａｓｅＴｙｐｅ”＞
＜ｘｓ：ｓｅｑｕｅｎｃｅ＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＢａｓｅＵＲＬ” ｔｙｐｅ＝”ＢａｓｅＵＲＬＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０” ｍａｘＯｃｃｕｒｓ＝”ｕｎｂｏｕｎｄｅｄ”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｅｇｍｅｎｔＢａｓｅ” ｔｙｐｅ＝”ＳｅｇｍｅｎｔＢａｓｅＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｅｇｍｅｎｔＬｉｓｔ” ｔｙｐｅ＝”ＳｅｇｍｅｎｔＬｉｓｔＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０”／＞
＜ｘｓ：ｅｌｅｍｅｎｔｎａｍｅ＝”ＳｅｇｍｅｎｔＴｅｍｐｌａｔｅ” ｔｙｐｅ＝”ＳｅｇｍｅｎｔＴｅｍｐｌａｔｅＴｙｐｅ” ｍｉｎＯｃｃｕｒｓ＝”０”／＞
＜／ｘｓ：ｓｅｑｕｅｎｃｅ＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｉｄ” ｔｙｐｅ＝”ＳｔｒｉｎｇＮｏＷｈｉｔｅｓｐａｃｅＴｙｐｅ” ／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｄｅｐｅｎｄｅｎｃｙＩｄ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｐｏｓｘ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ” ｕｓｅ＝”ｒｅｑｕｉｒｅｄ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｐｏｓｙ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ” ｕｓｅ＝”ｒｅｑｕｉｒｅｄ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｂａｎｄｗｉｄｔｈ” ｔｙｐｅ＝”ｘｓ：ｕｎｓｉｇｎｅｄＩｎｔ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｃｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞
＜／ｘｓ：ｅｘｔｅｎｓｉｏｎ＞
＜／ｘｓ：ｃｏｍｐｌｅｘＣｏｎｔｅｎｔ＞
＜／ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅ＞
コード７の抽出：ＭＰＤの空間的下位リプリゼンテーションの定義
＜ＭＰＤ …＞
＜Ｐｅｒｉｏｄ＞
＜ＢａｓｅＵＲＬ＞ｈｔｔｐ：／／ｍｙｓｅｒｖｅｒ．ｃｏｍ／ｍｅｄｉａ＜／ＢａｓｅＵＲＬ＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＩｎｉｔｉａｌｉｚａｔｉｏｎｓｏｕｒｃｅＵＲＬ＝≪ ＵＲＬ＿ＳＩ ≫／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝‘１’ ｃｏｎｔｅｎｔＴｙｐｅ＝‘ｖｉｄｅｏ’ ｆｒａｍｅｒａｔｅ＝‘３０’＞
＜！−− Ｂａｓｅｌａｙｅｒｄｅｓｃｒｉｐｔｉｏｎ −−＞＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝‘Ｒ１’ ｍｉｍｅＴｙｐｅ＝‘ｖｉｄｅｏ／ｍｐ４’ ｗｉｄｔｈ＝‘２０００’ ｈｅｉｇｈｔ＝‘１０００’ｂａｎｄｗｉｄｔｈ＝‘５１２０００’＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝≪ ＵＲＬ＿ＢＬ ≫／＞＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜！−− Ｅｎｈａｎｃｅｍｅｎｔｌａｙｅｒｄｅｓｃｒｉｐｔｉｏｎ，ｃｏｍｐｏｓｉｔｅｔｒａｃｋ −−＞
＜ＡｄａｐｔａｔｉｏｎＳｅｔｉｄ＝‘２’ ｃｏｎｔｅｎｔＴｙｐｅ＝‘ｖｉｄｅｏ’ ｆｒａｍｅｒａｔｅ＝‘３０’ ｗｉｄｔｈ＝‘４０００’ ｈｅｉｇｈｔ＝‘２０００’ ＞
＜！− Ｔｉｌｅａ，ｂ，ｃａｎｄｄａｐｐｅａｒａｓｃｏｍｐｏｎｅｎｔｓｏｆｃｏｍｐｏｓｉｔｅｔｒａｃｋ −−＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔａ’ ／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｉｄ＝‘１’ ｖａｌｕｅ＝’１：１’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｂ’ ／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｉｄ＝‘１’ ｖａｌｕｅ＝’１：２’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｃ’ ／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｉｄ＝‘１’ ｖａｌｕｅ＝‘２：１’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔｉｄ＝‘Ｔｄ ‘／＞＜ＲｏｌｅｓｃｈｅｍｅＩｄＵｒｉ＝‘ｔｉｌｉｎｇ’ ｉｄ＝‘１’ ｖａｌｕｅ＝‘２：２’／＞＜／ＣｏｎｔｅｎｔＣｏｍｐｏｎｅｎｔ＞
＜Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｉｄ＝‘Ｒ２’ ｍｉｍｅＴｙｐｅ＝‘ｖｉｄｅｏ／ｍｐ４’ ｄｅｐｅｎｄｅｎｃｙＩｄ＝‘Ｒ１’ ｂａｎｄｗｉｄｔｈ＝‘２０４８０００’ ｗｉｄｔｈ＝‘４０００’ ｈｅｉｇｈｔ＝‘２０００’＞
＜ＳｅｇｍｅｎｔＬｉｓｔ＞
＜ＳｅｇｍｅｎｔＵＲＬｍｅｄｉａ＝≪ ＵＲＬ＿ＣＴ ≫ ｒｅｌａｔｅｄ＝≪ ＵＲＬ＿ＴａＵＲＬ＿ＴｂＵＲＬ＿ＴｃＵＲＬ＿Ｔｄ≫ ｔｙｐｅ＝≪ ＴａＴｂＴｃＴｄ≫／＞
＜／ＳｅｇｍｅｎｔＬｉｓｔ＞
＜／Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ＞
＜／ＡｄａｐｔａｔｉｏｎＳｅｔ＞
＜／Ｐｅｒｉｏｄ＞
＜／ＭＰＤ＞
コード８の抽出：ＭＰＤのセグメントに基づくタイルの信号送信
＜！−− ＳｅｇｍｅｎｔＵＲＬ−−＞
＜ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅｎａｍｅ＝”ＳｅｇｍｅｎｔＵＲＬＴｙｐｅ”＞
＜ｘｓ：ｓｅｑｕｅｎｃｅ＞
＜ｘｓ：ａｎｙｎａｍｅｓｐａｃｅ＝”＃＃ｏｔｈｅｒ” ｐｒｏｃｅｓｓＣｏｎｔｅｎｔｓ＝”ｌａｘ” ｍｉｎＯｃｃｕｒｓ＝”０” ｍａｘＯｃｃｕｒｓ＝”ｕｎｂｏｕｎｄｅｄ”／＞
＜／ｘｓ：ｓｅｑｕｅｎｃｅ＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｍｅｄｉａ” ｔｙｐｅ＝”ｘｓ：ａｎｙＵＲＩ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｍｅｄｉａＲａｎｇｅ” ｔｙｐｅ＝”ｘｓ：ｓｔｒｉｎｇ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｉｎｄｅｘ” ｔｙｐｅ＝”ｘｓ：ａｎｙＵＲＩ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｉｎｄｅｘＲａｎｇｅ” ｔｙｐｅ＝”ｘｓ：ｓｔｒｉｎｇ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｒｅｌａｔｅｄ” ｔｙｐｅ＝”ＵＲＬＶｅｃｔｏｒＴｙｐｅ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｒｅｌａｔｅｄＲａｎｇｅ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞
＜ｘｓ：ａｔｔｒｉｂｕｔｅｎａｍｅ＝”ｔｙｐｅ” ｔｙｐｅ＝”ＳｔｒｉｎｇＶｅｃｔｏｒＴｙｐｅ”／＞＜！−− ＡｃｔｕａｌｌｙｄｅｓｃｒｉｐｔｏｒｓＩＤｓ −−＞
＜ｘｓ：ａｎｙＡｔｔｒｉｂｕｔｅｎａｍｅｓｐａｃｅ＝”＃＃ｏｔｈｅｒ” ｐｒｏｃｅｓｓＣｏｎｔｅｎｔｓ＝”ｌａｘ”／＞
＜／ｘｓ：ｃｏｍｐｌｅｘＴｙｐｅ＞
＜！− ＬｉｓｔｏｆＵＲＬｓ（ａｄｄｅｄ） −−＞
＜ｘｓ：ｓｉｍｐｌｅＴｙｐｅｎａｍｅ＝”ＵＲＬＶｅｃｔｏｒＴｙｐｅ”＞
＜ｘｓ：ｌｉｓｔｉｔｅｍＴｙｐｅ＝”ｘｓ：ａｎｙＵＲＩ”／＞
＜／ｘｓ：ｓｉｍｐｌｅＴｙｐｅ＞
コード９の抽出：ＭＰＤセグメントＵＲＬタイプの拡張

Claims

ＭＰＥＧ−ＤＡＳＨにおいて規定されるＭＰＤ（ＭｅｄｉａＰｒｅｓｅｎｔａｔｉｏｎＤｅｓｃｒｉｐｔｉｏｎ）であって、ビデオデータの少なくとも一部に対応する第１データを要求するために用いられる第１要求情報を含む第１リプリゼンテーションと、前記第１リプリゼンテーションが属する第１アダプテーションセットとは異なる第２アダプテーションセットに属する第２リプリゼンテーションであって、前記第１データに関連する第２データを要求するために用いられる第２要求情報を含む第２リプリゼンテーションと、前記第１リプリゼンテーションと前記第２リプリゼンテーションとが関連していることを示す関連情報と、が記述されたＭＰＤを取得する取得手段と、
前記取得手段によって取得されたＭＰＤを解析し、前記関連情報を検出する検出手段と、
前記検出手段によって検出された関連情報に基づいて、前記取得手段により取得されたＭＰＤに記述された前記第１要求情報と前記第２要求情報とを含む複数の要求情報のうちの少なくとも何れかを用いて、前記ビデオデータの少なくとも一部を要求する要求手段と、
を有する情報処理装置。
前記第１要求情報及び前記第２要求情報はＵＲＬによって表現される請求項１に記載の情報処理装置。
前記第１データはベースレイヤに対応するビデオデータであり、前記第２データはエンハンスメントレイヤに対応するビデオデータである請求項１又は２に記載の情報処理装置。
前記エンハンスメントレイヤに対応するビデオの品質は、前記ベースレイヤに対応するビデオの品質よりも高い請求項３に記載の情報処理装置。
前記要求手段は、ビデオが時間的及び空間的に分割されたメディアセグメントを単位として前記ビデオデータの少なくとも一部を要求する請求項１乃至４のうち、何れか１項に記載の情報処理装置。
前記第１データは複数のメディアセグメントの中から選択的に要求された少なくとも１つのメディアセグメントの復号のために用いられるデータである請求項５に記載の情報処理装置。
前記要求手段は、前記ＭＰＤを提供したサーバに対して前記ビデオデータの少なくとも一部を要求する請求項１乃至６のうち、何れか１項に記載の情報処理装置。
前記取得手段は、前記関連情報として、前記第２リプリゼンテーションに前記第１リプリゼンテーションの識別情報が記述されたＭＰＤを取得する請求項１乃至７のうち、何れか１項に記載の情報処理装置。
前記取得手段により取得される前記ＭＰＤに表される複数のメディアセグメントのうち、要求すべきメディアセグメントを選択する選択手段を有し、
前記要求手段は、前記選択手段により選択されたメディアセグメントを要求する請求項１乃至８のうち、何れか１項に記載の情報処理装置。
ＭＰＥＧ−ＤＡＳＨにおいて規定されるＭＰＤ（ＭｅｄｉａＰｒｅｓｅｎｔａｔｉｏｎＤｅｓｃｒｉｐｔｉｏｎ）であって、ビデオデータの少なくとも一部に対応する第１データを要求するために用いられる第１要求情報を含む第１リプリゼンテーションと、前記第１リプリゼンテーションが属する第１アダプテーションセットとは異なる第２アダプテーションセットに属する第２リプリゼンテーションであって、前記第１データに関連する第２データを要求するために用いられる第２要求情報を含む第２リプリゼンテーションと、前記第１リプリゼンテーションと前記第２リプリゼンテーションとが関連していることを示す関連情報と、が記述されたＭＰＤを取得する取得工程と、
前記取得工程によって取得されたＭＰＤを解析し、前記関連情報を検出する検出工程と、
前記検出工程によって検出された関連情報に基づいて、前記取得工程により取得されたＭＰＤに記述された前記第１要求情報と前記第２要求情報とを含む複数の要求情報のうち少なくとも何れかを用いて、前記ビデオデータの少なくとも一部を要求する要求工程と、
を有する情報処理方法。
前記第１データはベースレイヤに対応するビデオデータであり、前記第２データはエンハンスメントレイヤに対応するビデオデータである請求項１０に記載の情報処理方法。
前記第１データは複数のメディアセグメントの中から選択的に要求された少なくとも１つのメディアセグメントの復号のために用いられるデータである請求項１０に記載の情報処理方法。
前記要求工程においては、ビデオが時間的及び空間的に分割されたメディアセグメントを単位として前記ビデオデータの少なくとも一部が要求される請求項１０乃至１２のうち、何れか１項に記載の情報処理方法。
コンピュータを請求項１乃至９のうち、何れか１項に記載の情報処理装置の各手段として動作させるためのプログラム。