JP2013534101A - 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置 - Google Patents

符号化マルチコンポーネント・ビデオをカプセル化する方法および装置 Download PDF

Info

Publication number
JP2013534101A
JP2013534101A JP2013515412A JP2013515412A JP2013534101A JP 2013534101 A JP2013534101 A JP 2013534101A JP 2013515412 A JP2013515412 A JP 2013515412A JP 2013515412 A JP2013515412 A JP 2013515412A JP 2013534101 A JP2013534101 A JP 2013534101A
Authority
JP
Japan
Prior art keywords
media data
file
extracted
media
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013515412A
Other languages
English (en)
Other versions
JP2013534101A5 (ja
Inventor
ウー,チエンユ
フア ズー,リ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority claimed from PCT/US2011/040164 external-priority patent/WO2011159602A1/en
Publication of JP2013534101A publication Critical patent/JP2013534101A/ja
Publication of JP2013534101A5 publication Critical patent/JP2013534101A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

複数のレイヤを含むメディア・エンティティを複数のコンポーネント・ファイルにカプセル化する(レイヤごとに1つのコンポーネント・ファイルにカプセル化する)方法および装置について、それに対応するコンポーネント・ファイルを読み取る方法および装置とともに説明する。SVC/MVCファイル・フォーマットの抽出器データ構造の拡張を、提案する。本発明の抽出器の拡張により、異なるコンポーネント・ファイルにまたがるNALユニットの参照が可能になる。本発明は、メディア・エンティティの適応型HTTPストリーミングを可能にする。

Description

(関連出願の相互参照)
本特許出願は、2010年6月14日出願の「Extension to the Extractor data structure of SVC/MVC file formats」と題する米国仮特許出願第61/354,422号の優先権の利益を主張するものである。
本願は、本願と同時に出願された「Method and Apparatus for Encapsulating Coded Multi−component Video」と題する、同時係属の所有者が共通の米国特許出願第_/_号(代理人番号PU100141)に関連するものである。
本発明は、一般に、HTTPストリーミングに関する。さらに詳細には、本発明は、HTTPストリーミングのスケーラブル・ビデオ符号化(SVC)ストリームやマルチビュー符号化(MVC)ストリームなどの符号化マルチコンポーネント・ビデオ・ストリームのメディア・エンティティのカプセル化に関する。
HTTPストリーミングの分野では、サーバ側で、MP4ファイルなどのBMFFに準拠したファイルとして、符号化ビデオをカプセル化して記憶することが多い。さらに、適応型HTTPストリーミングを実現するために、通常は、ファイルは、複数の動画フラグメントに分割され、これらのフラグメントが、さらに、クライアントURL要求によってアドレス可能な複数のセグメントにグループ化される。実際には、これらのセグメントには、ビデオ・コンテンツの様々な符号化表現が記憶され、クライアントが、所望の表現を動的に選択して、セッション中にダウンロードして再生することができるようになっている。
SVCやMVCのビットストリームなど、符号化された階層型ビデオは、ビットストリームの様々なサブセットを復号することによって、時間的/空間的解像度、画質、ビューなどに関して様々な動作点すなわち表現を可能にすることにより、このようなビットレート適応の自然なサポートを実現する。しかし、MP4ファイル・フォーマットなど、既存のISO Base Media File Format(BMFF)規格は、各レイヤまたは表現への個別アクセスに対応していないので、HTTPストリーミング分野に適用することができない。図1に示すように、MP4ファイル・フォーマットでは、1つのメディア・ファイルの全てのレイヤまたは表現のメタデータは、moov動画ボックスに記憶され、一方、全てのレイヤまたは表現のメディア・コンテンツ・データは、mdat動画ボックスに記憶される。HTTPストリーミングでは、クライアントが1つのレイヤを要求したとき、全てのレイヤまたは表現が混ざった状態であり、所要のレイヤまたは表現がどこで見つかるのかクライアントには分からないので、ファイル全体を送信しなければならない。
後述のように、適応型HTTPストリーミングの分野では、ネットワーク抽象化レイヤ(NAL)ユニットなどのメディア・データ・サンプルを、動画フラグメントまたはコンポーネント・ファイルの境界をまたいで参照することができることが望ましい。SVC/MVCの状況では、このような参照は、「抽出器」などの機構を用いることによって実現することができる。「抽出器」は、以下のBMFFのAVCファイル・フォーマット拡張に対するSVC/MVC補正に定義される、内部ファイル・データ構造である。Information Technology − coding of audio−visual objects − Part 15:Advanced Video Coding (AVC) File format, Amendment 2:File format support for Scalable Video Coding,2008(15〜17ページ)。抽出器は、コピーを行わずに、参照によってその他のトラックからNALユニットを抽出することを可能にするように設計されている。ここで、トラックとは、ISOベース・メディア・ファイル中の関連するサンプルの時限シーケンスである。メディア・データでは、トラックは、画像またはサンプリングした音声のシーケンスに対応する。抽出器のシンタックスを、以下に示す。
class aligned(8) Extractor () {
NALUnitHeader( );
unsigned int(8) track_ref_index;
signed int(8) sample_offset;
unsigned int ((lengthSizeMinusOne + 1) * 8)
data_offset;
unsigned int ((lengthSizeMinusOne + 1) * 8)
data_length;
}
抽出器データ構造のセマンティクスは、以下の通りである。
NALUnitHeader:タイプ20のNALユニットのISO/IEC 14496−10 Annex Gに指定されるNALユニット構造:
nal_unit_typeは、抽出器NALユニット・タイプ(タイプ31)に設定されるものとする。
forbidden_zero_bit、reserved_one_bitおよびreserved_three_2bitsは、ISO/IEC 14496−10 Annex Gに指定されるように設定されるものとする。
その他のフィールド(nal_ref_idc、idr_flag、priority_id、no_inter_layer_pred_flag、dependency_id、quality_id、temporal_id、use_ref_base_pic_flag、discardable_flagおよびoutput_flag)は、B.4 of Information technology − Coding of audio−visual objects − part 15:Advanced Video Coding (AVC) file format,Amendment 2:File format support for Scalable Video Coding,ISO/IEC 14496−15:2004/Amd.2:2008(17ページ)に指定されるように設定されるものとする。
track_ref_indexは、データを抽出するトラックを発見するために使用するタイプ「scal」のトラック参照の指標を指定する。データが抽出されるトラック中のサンプルは、メディア復号タイムライン中で、すなわち時間/サンプル・テーブルのみを使用して、抽出器を含むサンプルと時間的に整列される、またはそれより先行する最も近い位置に位置し、sample_offsetによって指定されるオフセットだけ調節される。第1のトラック参照は、指標値1を有する。値0は予約される。
sample_offsetは、情報源として使用すべきリンクされたトラック中のサンプルの相対指標を与える。サンプル0(ゼロ)は、抽出器を含むサンプルの復号時間と比較して、同じ復号時間またはそれより先行する最も近い復号時間を有するサンプルである。サンプル1(イチ)は、次のサンプルであり、サンプル−1(マイナス1)は、前のサンプルである。以下同様に続く。
data_offset:コピーする参照サンプル内の最初のバイトのオフセットである。サンプル中のデータの最初のバイトから抽出が開始される場合には、オフセットは、値0をとる。オフセットは、NALユニット長さフィールドの冒頭を参照するものとする。
data_length:コピーするバイト数である。このフィールドが値0をとる場合には、参照した1つのNALユニットの全体がコピーされる(すなわち、コピーする長さは、データ・オフセットによって参照した長さフィールドからとり、Aggregatorの場合にはadditional_bytesフィールドで増補する)。
さらなる詳細は、Information technology − Coding of audio−visual objects − part 15:Advanced Video Coding (AVC) file format,Amendment 2:File format support for Scalable Video Coding,ISO/IEC 14496−15:2004/Amd.2:2008に見ることができる。
現在のところ、抽出器は、参照によってNALユニットを他のトラックから抽出することはできるが、同じ動画ボックス/フラグメント内から抽出することしかできない。換言すれば、抽出器を使用しても、別のセグメントまたはファイルからNALユニットを抽出することはできない。この制約により、抽出器の使用は上記の使用事例に制限されている。
上述の問題に対する従来の解決策は、当技術分野ではまだ十分に確立されていない。速度およびトランスポート効率を犠牲にすることなく、複数のレイヤを構文解析してカプセル化することができるようになれば、望ましいであろう。このような成果は、当技術分野では、これまでのところまだ達成されていない。
本発明は、複数のレイヤを含むメディア・エンティティからコンポーネント・ファイルをカプセル化し、コンポーネント・ファイルを読み取る、方法および装置に関する。
本発明の1つの態様によれば、複数のレイヤを含むメディア・エンティティからコンポーネント・ファイルをカプセル化して作成する方法が提供される。この方法では、メディア・エンティティから、各レイヤに、メタデータを抽出し、その抽出したメタデータに対応するメディア・データを抽出し、各レイヤの抽出したメディア・データに関係する追加メディア・データの参照を識別する。これらの参照は、各レイヤの抽出したメディア・データに埋め込まれる。抽出したメディア・データとメタデータとを関連付けて、抽出したメタデータおよび抽出したメディア・データを含むコンポーネント・ファイルを各レイヤに作成することを可能にする。
本発明の別の態様によれば、ファイル・カプセル化装置が提供される。このファイル・カプセル化装置は、メディア・エンティティから、各レイヤにメタデータを抽出し、且つその抽出したメタデータに対応するメディア・データを抽出する抽出器と、メディア・エンティティから、各レイヤの前記抽出したメディア・データに関係する追加メディア・データの参照を識別する参照識別器と、各レイヤの抽出したメディア・データに参照を埋め込み、抽出したメディア・データを抽出したメタデータと関連付けて、各レイヤにコンポーネント・ファイルを作成することを可能にする相関器とを含む。
本発明の上記の特徴は、添付の図面を参照しながらその例示的な実施例について詳細に説明することにより、さらに明らかになるであろう。
例示的なMP4ファイル・フォーマットを示す図である。 メディア・エンティティをカプセル化する本発明の一実施例を示す図である。 複数のレイヤ/表現を含むメディア・エンティティからコンポーネント・ファイルをカプセル化または作成するために使用されるカプセル化装置の構造を示す図である。 依存関係に基づいて追加メディア・データをコンポーネント・ファイルと関連付ける一例を示す図である。 抽出器が存在する動画ボックス/フラグメントとは異なる動画ボックス/フラグメントから参照によってNALユニットを抽出する一例を示す図である。 本発明の新たな抽出器データ構造を用いた、SVC/MVCタイプ・ビデオ・ビットストリームから複数の動画フラグメントへの関連するカプセル化動作を示す図である。 コンポーネント・ファイルを読み取るために使用されるファイル読取り装置の構造を示す図である。 本発明を含むビデオ・デコーダの、SVC/MVCタイプ・ビデオ・ビットストリームを読み取るプロセスを示す図である。
本発明では、メディア・ファイルもしくはメディア・ファイル・セットまたはストリーミング・メディアなどのメディア・エンティティを、クライアントURL要求によってアドレス可能な複数の動画コンポーネント・ファイルに分割またはカプセル化する。ここでは、コンポーネント・ファイルは、フラグメント、セグメント、ファイル、およびその他のそれらと等価な用語を表す広い意味で用いられる。
本発明の一実施例では、複数の表現またはコンポーネントを含むメディア・エンティティを構文解析して、各表現/コンポーネントのメタデータおよびメディア・データを抽出する。この表現/コンポーネントの例としては、様々な時間的/空間的解像度を有するレイヤなどのレイヤ、SVCの画質レイヤなどのレイヤ、およびMVCのビューなどがある。以下では、レイヤも、表現/コンポーネントを指すために使用され、これらの用語は、入れ替え可能である。メタデータは、例えば、各表現のメディア・エンティティに何が含まれているか、またそこに含まれるメディア・データをどのように使用するかを記述している。メディア・データは、例えばコンテンツの復号など、メディア・データの目的を実施するのに必要なメディア・データ・サンプル、または所要のデータ・サンプルを取得する方法に関する任意の必要な情報を含む。各表現またはレイヤの抽出されたメタデータおよびメディア・データは、関連付け/相関付けされ、ユーザのアクセスに備えて一緒に記憶される。記憶動作は、ハード・ドライブまたはその他の記憶媒体上で物理的に行ってもよいし、あるいは、メタデータおよびメディア・データが実際には記憶媒体上の異なる場所に位置しているときでも、その他のアプリケーションまたはモジュールとのインタフェースをとったときに、それらが一緒に記憶されているように見えるように、関係管理機構を介して仮想的に実行してもよい。図2は、この実施例の例を示す。図2では、メディア・エンティティは、ベース・レイヤ、エンハンスメント・レイヤ1、およびエンハンスメント・レイヤ2の3つのレイヤを含む。メディア・エンティティを構文解析して、3つのレイヤそれぞれのメタデータおよびメディア・データを抽出し、これらのデータを、関連付けられたメタデータと対応するメディア・データとを備えるコンポーネント・ファイルとして、別々に記憶する。
図3は、SVC符号化ビデオなど、複数のレイヤを含むメディア・エンティティからコンポーネント・ファイルをカプセル化して作成するために使用される好ましいカプセル化装置300の構造を示す。入力メディア・エンティティ310は、メタデータ抽出器320およびメディア・データ抽出器340に渡される。メタデータ抽出器320は、各レイヤのメタデータ330を抽出する。メディア・データ抽出器340は、メタデータ330を取り込み、対応するメディア・データ350を抽出する。なお、別の実施例では、メタデータ抽出器320およびメディア・データ抽出器340は、1つの抽出器として実施されることに留意されたい。メタデータ330およびメディア・データ350の両データは、これら2つのタイプのデータを関連付けて出力コンポーネント・ファイル390を作成する相関器380に送られる。コンポーネント・ファイルは、各レイヤに1つ作成される。
SVCまたはMVCのAVC拡張によって符号化されたビデオなど、階層型ビデオは、複数のメディア・コンポーネント(スケーラブルなレイヤまたはビュー)を含む。このような符号化ビットストリームは、ビットストリームの様々なサブセットを復号することによって、時間的/空間的解像度、画質、ビューなどに関して様々な動作点すなわち表現またはレイヤを提供することができる。さらに、ビットストリームのレイヤ間には、符号化依存性がある、すなわち、1つのレイヤの復号が、他のレイヤに依存する場合がある。従って、このようなビットストリームの表現のうちの1つを要求する際には、カプセル化ビデオ・ファイルから1つまたは複数のコンポーネントまたはメディア・データを取り出して復号する必要がある場合がある。様々な表現の抽出プロセスを容易にするために、符号化階層型ビデオは、各レイヤが異なるセグメントまたはコンポーネント・ファイルに別々に記憶されるような方法でMP4ファイルにカプセル化されることが多い。この場合には、上述の復号依存性またはアプリケーションによるその他の依存性によって、NALユニットなど、ビットストリームの特定のメディア・データ・サンプルが、複数のセグメントまたはコンポーネント・ファイルによって必要とされる、またはそれらと関係付けられることを考慮する必要がある。
本発明の別の実施例では、セグメントまたはコンポーネント・ファイルによって必要とされる追加メディア・データを抽出して、当該セグメントまたはコンポーネント・ファイルと関連付ける。図4は、この実施例の例を示す。この図では、SVCビットストリームは、3つの空間レイヤ、HD1080p、SDおよびQVGAを有する。3つの動画フラグメントまたはコンポーネント・ファイルは、これら3つの動作点に対応して形成され、それぞれが異なるURLによってアドレス可能である。各動画フラグメントまたはコンポーネント・ファイル内で、復号に必要な全てのメディア・データ・サンプル(この例ではNALユニット)がコピーされ、「mdat」ボックスに収納されるメディア・サンプルとして記憶される。そのため、クライアントが適切なURLを用いて特定の動作点または表現を要求したとき、サーバは、対応する動画フラグメントまたはコンポーネント・ファイルを取り出して、クライアントに転送することができる。この実施例では、図3のメディア・データ抽出器340は、さらに各レイヤに、入力メディア・エンティティ310から、各レイヤに抽出したメディア・データに関係する追加メディア・データを抽出する。相関器380は、さらに、この各レイヤの追加の抽出メディア・データを関連付けて、対応するコンポーネント・ファイルを作成する。
記憶スペースを節約するために、各コンポーネント・ファイル内の同じデータを実際に複製することなく、複数の動画フラグメントまたはコンポーネント・ファイルの境界をまたいで、NALユニットなどのメディア・データ・サンプルを参照することができることが望ましい。しかし、ISO Base Media File Format(BMFF)およびその拡張では、現在のところこの機能に対応していない。この問題を解決するために、本発明のさらに別の実施例では、動画フラグメントまたはコンポーネント・ファイルのメディア・データと関係付けられる、またはこれによって必要とされる追加メディア・データについて、参照を識別して構築する。これらの追加メディア・データではなく、この参照を、そのメタデータおよびメディア・データとともにコンポーネント・ファイルと関連付ける。参照は、各レイヤの抽出メディア・データに埋め込むことができ、その後、各レイヤの抽出メタデータおよび抽出メディア・データを関連付けて、対応するコンポーネント・ファイルを作成することができる。
この実施例では、カプセル化装置300の構造に参照識別器360が追加される。参照識別器360は、入力メディア・エンティティ310から、各レイヤの抽出メディア・データ350に関係するそれらの追加メディア・データに対する参照370を識別する。次いで、相関器380により、例えば参照370を抽出メディア・データに埋め込むことによって、参照370を各レイヤの抽出メタデータ330および抽出メディア・データ350と関連付けて、対応するコンポーネント・ファイル390を作成する。
上述のように、SVC/MVCの状況では、このような参照は、「抽出器」などの機構を用いることによって構築することができる。現在のところ、抽出器は、参照によってNALユニットを他のトラックから抽出することはできるが、同じ動画ボックス/フラグメント内から抽出することしかできない。換言すれば、抽出器を使用しても、別のセグメントまたはファイルからNALユニットを抽出することはできない。この制約により、他のケースの抽出器の使用は制限されている。以下、抽出器データ構造の拡張を開示するが、この拡張は、上述したSVC/MVCタイプの階層型ビデオ・コンテンツから複数のコンポーネント・ファイルへの効率的なカプセル化をサポートすることを目的とするものである。
この拡張は、抽出器が存在する動画ボックス/フラグメントまたはコンポーネント・ファイルとは異なる動画ボックス/フラグメントまたはコンポーネント・ファイルに存在するNALユニットを参照する追加機能を有する抽出器データ構造を提供するために追加されるものである。
拡張された抽出器は、以下のように定義される。
シンタックス:
aligned (8) class DataEntryUrlBox (bit (24) flags)
extends FullBox ('url', version = 0, flags) {
string location;
}
aligned (8) class DataEntryUrnBox (bit (24) flags)
extends FullBox ('urn', version = 0, flags) {
string name;
string location;
}
class aligned (8) Extractor () {
NALUnitHeader ( );
DataEntryBox (entry_version, entry_flags) data_entry;// added extension
unsigned int(8) track_ref_index;
signed int(8) sample_offset;
unsigned int ((lengthSizeMinusOne + 1) * 8)
data_offset;
unsigned int ((lengthSizeMinusOne + 1) * 8)
data_length;
}
セマンティクス:
data_entryは、統一資源ロケータ(URL)または統一資源名(URN)エントリである。名称はURNであり、URNエントリで必要である。位置はURLであり、URLエントリで必要であるが、URNエントリでは任意選択であり、所与の名称を有する資源が見つかる位置を与える。それぞれはUTF−8文字を用いたナル終了文字列である。自立フラグがセットされた場合には、URLフォームを使用し、文字列は存在せず、ボックスはエントリ・フラグ・フィールドで終了する。URLタイプは、ファイルを配信するサービスのものとする。相対URLは許容されるが、抽出器が属するトラックを含む動画ボックス/フラグメントを含むファイルに関するものである。
その他のフィールドは、前述の元の抽出器と同じセマンティクスを有する。
拡張された抽出器では、参照によって、抽出器が存在する動画ボックス/フラグメントとは異なる動画ボックス/フラグメントから、NALユニットを抽出することができる。図5は、このような例を示し、SVCビットストリームは図4と同じであるが、新たな拡張された抽出器データ構造を用いている。この図から分かるように、SDの動画フラグメントは、QVGAの動画フラグメントのNALユニットを参照することができる。同様に、HD1080pの動画フラグメントは、抽出器を使用して、QVGAおよびSDの両方の動画フラグメントのNALユニットを参照することができる。図4と比較すると、これらの動画フラグメントをまたいで複製されるNALユニットは存在せず、従って、記憶スペースが節約される。
図6は、本発明の新しい抽出器データ構造を用いた、SVC/MVCタイプのビデオ・ビットストリームから複数の動画フラグメントまたはコンポーネント・ファイルへの関連するカプセル化動作を示す。このプロセスは、ステップ601で開始される。ステップ610で、各NALユニットを1つ1つ読み込む。ステップ620で、ビットストリームの末尾に到達した場合には、プロセスは、690で停止し、そうでない場合には、プロセスは、次のステップ630に進む。判断ステップ630では、現在のNALユニットが復号に際して他のトラックのNALユニットに依存するかどうかを判定する。この判定の結果が、現在のNALユニットが復号に際して他のトラックのNALユニットに依存しない場合には、制御はステップ640に移り、現在のNALユニットを用いてサンプルが形成され、現在のトラック中に配置される。ステップ630の判定の結果、現在のNALユニットと他のトラックのNALユニットの間に依存性がある場合には、プロセスは、ステップ650に進む。判断ステップ650では、現在のNALユニットによって必要とされるNALユニットのトラックが同じ動画フラグメント内に存在するかどうかをさらに判定する。この判定の結果、トラックが同じ動画フラグメント内に存在する場合には、ステップ670を利用して、拡張された抽出器に記入(fill in)して、当該他のトラックのNALユニットを参照する。判定の結果、トラックが別の動画フラグメント内に存在する場合には、ステップ660で、この動画フラグメントのURLまたはURNを識別し、この識別したURLおよびURNを拡張された抽出器に記入するものとして、プロセスは、ステップ670に進む。この拡張された抽出器は、記入後に、ステップ680で現在のトラックに埋め込まれる。その後、ステップ610で、次のNALユニットのプロセスが開始される。
コンポーネント・ファイルを読み取るために、図7に示すファイル読取り装置700を利用する。パーサ710が、最初に、コンポーネント・ファイルを構文解析して、メタデータおよびメディア・データを取得し、入手可能であれば参照を取得する。復号した参照から、メディア・データが復号依存性などによって他のコンポーネント・ファイルのメディア・データに関係していることが分かった場合には、リトリーバ(retriever)720が、この関連するメディア・データを、参照に示されている他のコンポーネント・ファイルから取り出す。さらに、プロセッサ730は、コンポーネント・ファイルから取得したメタデータおよびメディア・データを処理し、入手可能であれば追加メディア・データも処理する。パーサ710による構文解析動作は、プロセッサ730のために用意されたメタデータおよびメディア・データ、ならびにリトリーバ720のために用意された参照を取得するために必要な様々な動作を含む。この構文解析動作は、必要に応じて、メタデータおよび/またはメディア・データをさらに構文解析することを含む。一実施例では、参照は、メディア・データに埋め込まれるので、メディア・データを構文解析することによって取得される。参照が入手可能である場合には、構文解析ステップは、参照のシンタックスを分析すること、および参照を復号することをさらに含む。プロセッサ730は、コンポーネント・ファイルがビデオ・コンテンツを含む場合には、ビデオ・デコーダを含むことができる。別の実施例では、パーサおよびリトリーバをプロセッサに組み込むこともできる。
図8は、本発明を含むビデオ・デコーダのSVC/MVCタイプ・ビデオ・ビットストリームを読み取るプロセスを示す。ステップ801で、コンポーネント・ビデオ・ファイルにアクセスし、ステップ805で、当該コンポーネント・ビデオ・ファイルの各レイヤのメタデータおよびメディア・データを識別する。ステップ810で、識別したメタデータおよびメディア・データを構文解析し、ステップ815で、メディア・データの各NALユニットを1つ1つ読み込む。現在のNALユニットについて、ステップ820で最初に判断を行い、ビットストリームの末尾に到達しているかどうかを判定し、その結果が「はい」である場合には、プロセスは、ステップ825で終了する。そうでない場合には、プロセスは、判断ステップ830に進み、現在のNALユニットが抽出器であるかどうかを判定する。現在のNALユニットが抽出器ではない場合には、それは現在のNALユニットが復号用データを含む通常のNALユニットであることを意味するので、ステップ835で、このNALユニットをデコーダに送信する。現在のNALユニットが抽出器である場合には、ステップ840で、現在のNALユニットが同じコンポーネント・ファイル外のNALユニットに依存するかどうかを判定する。必要とされるNALユニットが同じコンポーネント・ファイル内にある場合には、ステップ845で、そのNALユニットを現在のファイルから取り出し、ステップ835で、デコーダに送信する。必要とされるNALユニットが別のコンポーネント・ファイルのものである場合には、ステップ850で、抽出器中のData_entry情報を用いてそのNALユニットを突き止め、ステップ855で遠隔ファイルから取り出し、その後、ステップ835でデコーダに送信する。
本明細書では、本発明の好ましい実施例について詳細に説明したが、本発明はこれらの実施例に限定されるわけではないこと、および当業者なら、添付の特許請求の範囲に定義する本発明の範囲を逸脱することなく、その他の修正形態および変形形態を実施することができることを理解されたい。

Claims (29)

  1. 複数のレイヤを含むメディア・エンティティからコンポーネント・ファイルを作成する方法であって、
    前記メディア・エンティティから各レイヤのメタデータを抽出するステップと、
    前記メディア・エンティティから、前記メディア・エンティティの各レイヤの前記抽出したメタデータに対応するメディア・データを抽出するステップと、
    各レイヤの前記抽出したメディア・データに関係する追加メディア・データの参照を識別するステップと、
    各レイヤの前記抽出したメディア・データに前記参照を埋め込むステップと、
    対応するコンポーネント・ファイルの作成のため、各レイヤの前記抽出したメタデータおよび前記抽出したメディア・データを関連付けるステップと、を含む、方法。
  2. 前記コンポーネント・ファイルが、動画ボックス、動画フラグメント、セグメントおよびファイルのうちの少なくとも1つである、請求項1に記載の方法。
  3. 前記メディア・データおよび前記追加メディア・データが、データ・サンプルを含む、請求項2に記載の方法。
  4. データ・サンプルが、ネットワーク抽象化レイヤ・ユニットを含む、請求項3に記載の方法。
  5. 各レイヤの前記抽出したメディア・データに関係する前記追加メディア・データが、前記抽出したメディア・データ中のネットワーク抽象化レイヤ・ユニットが依存するネットワーク抽象化レイヤ・ユニットを含む、請求項4に記載の方法。
  6. 前記参照が、前記追加メディア・データ中の前記ネットワーク抽象化レイヤ・ユニットの位置情報を含む、請求項5に記載の方法。
  7. 前記位置情報が、統一資源ロケータおよび統一資源名のうちの少なくとも1つを含む、請求項6に記載の方法。
  8. 埋込みステップが、
    前記追加メディア・データ中の前記ネットワーク抽象化レイヤ・ユニットの前記参照を用いて抽出器に記入するステップと、
    前記抽出したメディア・データのトラックに前記抽出器を埋め込むステップとをさらに含む、請求項7に記載の方法。
  9. 複数のレイヤを含むメディア・エンティティからコンポーネント・ファイルを作成するファイル・カプセル化装置であって、
    前記メディア・エンティティから各レイヤのメタデータを抽出し、前記メディア・エンティティから前記メディア・エンティティの各レイヤの前記抽出したメタデータに対応するメディア・データを抽出する抽出器と、
    前記メディア・エンティティから、各レイヤの前記抽出したメディア・データに関係する追加メディア・データの参照を識別する参照識別器と、
    各レイヤの前記抽出したメディア・データに前記参照を埋め込み、前記抽出したメディア・データを前記抽出したメタデータと関連付けて、前記各レイヤに前記抽出したメタデータおよび前記抽出したメディア・データを含むコンポーネント・ファイルを作成することを可能にする相関器とを含む、前記ファイル・カプセル化装置。
  10. 前記コンポーネント・ファイルが、動画ボックス、動画フラグメント、セグメントおよびファイルのうちの少なくとも1つである、請求項9に記載のファイル・カプセル化装置。
  11. 前記メディア・データおよび前記追加メディア・データが、データ・サンプルを含む、請求項9に記載のファイル・カプセル化装置。
  12. データ・サンプルが、ネットワーク抽象化レイヤ・ユニットを含む、請求項11に記載のファイル・カプセル化装置。
  13. 各レイヤの前記抽出したメディア・データに関係する前記追加メディア・データが、前記抽出したメディア・データ中のネットワーク抽象化レイヤ・ユニットが依存するネットワーク抽象化レイヤ・ユニットを含む、請求項12に記載のファイル・カプセル化装置。
  14. 前記参照が、前記追加メディア・データ中の前記ネットワーク抽象化レイヤ・ユニットの位置情報を含む、請求項13に記載のファイル・カプセル化装置。
  15. 前記位置情報が、統一資源ロケータおよび統一資源名のうちの少なくとも1つを含む、請求項14に記載のファイル・カプセル化装置。
  16. 前記相関器が、さらに、前記追加メディア・データ中の前記ネットワーク抽象化レイヤ・ユニットの前記参照を用いて抽出器に記入し、
    前記抽出したメディア・データのトラックに前記抽出器を埋め込む、請求項15に記載のファイル・カプセル化装置。
  17. コンポーネント・ファイルを読み取る方法であって、
    前記コンポーネント・ファイルを構文解析して、その中のメディア・データおよび参照を取得するステップと、
    前記参照によれば、前記コンポーネント・ファイルの前記メディア・データがその他のコンポーネント・ファイルのメディア・データに関係している場合に、前記参照を用いて前記その他のコンポーネント・ファイルから前記関係するメディア・データを取り出すステップと、を含む、前記方法。
  18. 前記コンポーネント・ファイルの前記メディア・データが、符号化依存性に従ってその他のコンポーネント・ファイルのメディア・データに関係付けられる、請求項17に記載の方法。
  19. 前記コンポーネント・ファイルが、動画ボックス、動画フラグメント、セグメントおよびファイルのうちの少なくとも1つである、請求項17に記載の方法。
  20. 前記メディア・データおよび前記関係するメディア・データが、データ・サンプルを含む、請求項17に記載の方法。
  21. データ・サンプルが、ネットワーク抽象化レイヤ・ユニットを含む、請求項20に記載の方法。
  22. 前記参照が抽出器を含む、請求項21に記載の方法。
  23. コンポーネント・ファイルを構文解析して、その中のメディア・データおよび参照を取得するパーサと、
    前記参照に従って、その他のコンポーネント・ファイルから前記メディア・データに関係するメディア・データを取り出すリトリーバと、
    前記メタデータ、前記メディア・データ、および前記その他のコンポーネント・ファイルから取り出したメディア・データを処理するプロセッサと、を含む、ファイル読取り装置。
  24. 前記コンポーネント・ファイルの前記メディア・データが、符号化依存性に従ってその他のコンポーネント・ファイルのメディア・データに関係付けられる、請求項23に記載のファイル読取り装置。
  25. 前記コンポーネント・ファイルが、動画ボックス、動画フラグメント、セグメントおよびファイルのうちの少なくとも1つである、請求項23に記載のファイル読取り装置。
  26. 前記メディア・データおよび前記関係するメディア・データが、データ・サンプルを含む、請求項23に記載のファイル読取り装置。
  27. データ・サンプルが、ネットワーク抽象化レイヤ・ユニットを含む、請求項26に記載のファイル読取り装置。
  28. 前記参照が抽出器を含む、請求項27に記載のファイル読取り装置。
  29. 前記プロセッサが、ビデオ・デコーダを含む、請求項23に記載のファイル読取り装置。
JP2013515412A 2010-06-14 2011-06-13 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置 Pending JP2013534101A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35442210P 2010-06-14 2010-06-14
US61/354,422 2010-06-14
PCT/US2011/040164 WO2011159602A1 (en) 2010-06-14 2011-06-13 Method and apparatus for encapsulating coded multi-component video

Publications (2)

Publication Number Publication Date
JP2013534101A true JP2013534101A (ja) 2013-08-29
JP2013534101A5 JP2013534101A5 (ja) 2014-07-24

Family

ID=48208643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013515412A Pending JP2013534101A (ja) 2010-06-14 2011-06-13 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置

Country Status (2)

Country Link
JP (1) JP2013534101A (ja)
CN (1) CN103098485A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012031874A2 (pt) * 2010-06-14 2017-11-28 Thomsom Licensing método e aparelho para encapsular vídeo multicomponente codificado

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008759A1 (ja) * 2002-07-12 2004-01-22 Matsushita Electric Industrial Co., Ltd. データ処理装置
JP2009502055A (ja) * 2005-07-15 2009-01-22 ソニー株式会社 変更ファイルフォーマット、ファイルサーバ、データ処理システム及びデータ抽出方法
JP2009503950A (ja) * 2005-07-19 2009-01-29 アップル インコーポレイテッド メディアデータ送信方法及び装置
JP2009506475A (ja) * 2005-08-31 2009-02-12 リサーチ・アンド・インダストリアル・コーオペレイション・グループ 統合マルチメディアファイルフォーマット構造と、統合マルチメディアファイルフォーマット構造に基づくマルチメディアサービスシステム及び方法
JP2009522984A (ja) * 2006-01-09 2009-06-11 韓國電子通信研究院 Svcファイルのデータ共有方法およびそのファイル

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI20011871A (fi) * 2001-09-24 2003-03-25 Nokia Corp Multimediadatan prosessointi
US20040006575A1 (en) * 2002-04-29 2004-01-08 Visharam Mohammed Zubair Method and apparatus for supporting advanced coding formats in media files
KR20040106414A (ko) * 2002-04-29 2004-12-17 소니 일렉트로닉스 인코포레이티드 미디어 파일에서 진보된 코딩 포맷의 지원
CN101601305B (zh) * 2006-10-20 2013-01-23 诺基亚公司 用于可伸缩多媒体的自适应路径的通用指示

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008759A1 (ja) * 2002-07-12 2004-01-22 Matsushita Electric Industrial Co., Ltd. データ処理装置
JP2009502055A (ja) * 2005-07-15 2009-01-22 ソニー株式会社 変更ファイルフォーマット、ファイルサーバ、データ処理システム及びデータ抽出方法
JP2009503950A (ja) * 2005-07-19 2009-01-29 アップル インコーポレイテッド メディアデータ送信方法及び装置
JP2009506475A (ja) * 2005-08-31 2009-02-12 リサーチ・アンド・インダストリアル・コーオペレイション・グループ 統合マルチメディアファイルフォーマット構造と、統合マルチメディアファイルフォーマット構造に基づくマルチメディアサービスシステム及び方法
JP2009522984A (ja) * 2006-01-09 2009-06-11 韓國電子通信研究院 Svcファイルのデータ共有方法およびそのファイル

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GRUENEBERG K ET AL., DELIVERABLE D3.2 MVC/SVC STORAGE FORMAT, JPN5013010625, 29 January 2009 (2009-01-29), pages 1 - 34, ISSN: 0003039521 *

Also Published As

Publication number Publication date
CN103098485A (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
EP3703384B1 (en) Media encapsulating and decapsulating
JP2013532441A (ja) 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置
JP6766157B2 (ja) ビデオストリーミングにおけるシーンセクションと関心領域の処理
CN113170239B (zh) 将媒体数据封装到媒体文件的方法、装置和存储介质
US20130097334A1 (en) Method and apparatus for encapsulating coded multi-component video
KR20180018662A (ko) 동작 포인트 디스크립터가 동적으로 설정될 수 있는 캡슐화된 비트-스트림으로부터 미디어 데이터 및 메타데이터를 획득하는 방법, 디바이스, 및 컴퓨터 프로그램
EP2614653A1 (en) A method and apparatus for adaptive streaming
JP7249413B2 (ja) カプセル化メディアコンテンツの部分の送信を最適化する方法、装置及びコンピュータプログラム
TW201909007A (zh) 使用用於檔案格式邏輯框之一通用描述符處理媒體資料
GB2593897A (en) Method, device, and computer program for improving random picture access in video streaming
US20130091154A1 (en) Method And Apparatus For Encapsulating Coded Multi-Component Video
WO2021136881A1 (en) Method for real time texture adaptation
GB2599170A (en) Method, device, and computer program for optimizing indexing of portions of encapsulated media content data
JP7241874B2 (ja) カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム
JP2013534101A (ja) 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置
EP3821614B1 (en) An apparatus, a method and a computer program for video coding and decoding
EP3977750A1 (en) An apparatus, a method and a computer program for video coding and decoding
EP4068781A1 (en) File format with identified media data box mapping with track fragment box
GB2620582A (en) Method, device, and computer program for improving indexing of portions of encapsulated media data
CN112383540B (en) Media encapsulation and decapsulation
JP2022546894A (ja) メディアデータをメディアファイルにカプセル化するための方法、装置、およびコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140604

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150401

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150902