JP2021057899A

JP2021057899A - 画像データカプセル化

Info

Publication number: JP2021057899A
Application number: JP2020161802A
Authority: JP
Inventors: フレデリックマゼ; Frederic Maze; フランクドゥヌアル; Denoual Franck; ナエルウエドラオゴ; Ouedraogo Nael; フェーブルジャンル; Le Feuvre Jean; シリルコンコラト; Concolato Cyril
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2015-06-16
Filing date: 2020-09-28
Publication date: 2021-04-08
Anticipated expiration: 2036-06-08
Also published as: SG10202002513XA; GB2539461B; KR20180016519A; RU2690167C1; US20200228795A1; RU2019115882A3; US20240179297A1; JP2022009845A; EP4135336A1; EP3311585A1; CN107750462B; GB201510608D0; CN107750462A; RU2719368C2; RU2019115882A; CN112153386A; GB2539461A; BR112017025498A2; KR102166877B1; US10645379B2

Abstract

【課題】静止画像のためのファイルフォーマットを改善すること。【解決手段】本発明の一実施形態による方法は、メタデータが格納されたボックスの階層構造を有する画像ファイルを生成する方法であって、該方法は、１つ以上の画像を取得し、１つ以上の画像のそれぞれに関連する１つ以上のプロパティを識別し、生成された画像ファイルは、（１）専用ボックスにリストされる、互いに識別される１つ以上のプロパティと、（２）１以上のプロパティのそれぞれの識別情報と、１以上の画像のそれぞれの識別情報とを関連付けるための関連情報とを含む。【選択図】図８

Description

本発明は、静止画像、静止画像のバースト又はビデオデータのような画像データを、記述メタデータとともにメディアコンテナーに記憶することに関する。そのようなメタデータは一般に、画像データ、及び画像データの一部への容易なアクセスを提供する。

このセクションにおいて説明される手法のうちの幾つかを推進することができたが、それらの手法は、必ずしも以前に考え出されたか、又は推進されてきた手法ではない。それゆえ、このセクションにおいて説明される手法は、必ずしも、本出願における特許請求の範囲に対する先行技術ではなく、このセクションに含むことによって、先行技術であるとは認められない。

ＨＥＶＣ規格は、静止画像の符号化のためのプロファイルを規定し、単一の静止画像又は静止画像のバーストを圧縮するための特定のツールを記述する。その種の画像データのために使用されるＩＳＯベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）の拡張が、「画像ファイルフォーマット」という名称で、ＩＳＯ／ＩＥＣ２３００８規格のパート１２に含むために提案された。その規格は、異なる使用事例に対応する２つの記憶形態をカバーする。
−任意選択で復号器において使用されるタイミングを有し、画像が他の画像に依存する場合がある画像シーケンスの記憶。
−単一の画像と、独立して符号化された画像の集合体の記憶。

第１の事例において、そのカプセル化は、ＩＳＯベースメディアファイルフォーマット（文献「Information technology - Coding of audio-visual objects - Part 12: ISO base media file format」ISO/IEC 14496-12:2014, Fifth edition, Avril 2015を参照）におけるビデオトラックのカプセル化に近く、「ｔｒａｋ」ボックス及び記述のためのサンプルグループ化のような、同じツール及び概念が使用される。「ｔｒａｋ」ボックスは、トラック、すなわち、関連するサンプルの時限シーケンスを記述するためにサブボックスを含むファイルフォーマットボックスである。

第２の事例において、ＩＳＯＢＭＦＦボックスの組、すなわち、「メタ」ボックスが使用される。これらのボックス及びその階層は、「トラック」ボックスより少ない記述ツールを提案し、関連するサンプルの代わりに、「情報アイテム」又は「アイテム」に関連する。

その画像ファイルフォーマットは、マルチメディアファイルをローカルに表示するために、又はマルチメディアプレゼンテーションをストリーミングするために使用することができる。ＨＥＶＣ静止画像は数多くの適用例を有するが、適用例は多くの問題を提起する。

画像バーストが１つの適用例である。画像バーストは、カメラによって取り込まれたスチール写真のシーケンスであり、単一の表現として記憶される（多くの写真アイテムが１つのデータブロックを参照する）。ユーザーがこれらの写真上で幾つかのタイプの作業、すなわち、写真をサムネイル又はカバーとして選択すること、これらの写真に効果を加えること等を実行したい場合がある。

したがって、データブロック内のその対応するバイトで写真のリストを識別するために記述メタデータが必要とされている。

コンピュテーショナルフォトグラフィが別の適用例である。コンピュテーショナルフォトグラフィでは、ユーザーが、異なる解像度（異なる露光、異なる焦点等）の同じ写真にアクセスできる。これらの異なる解像度は、選択することができるように、及びデータの対応する部分の場所を特定して処理（レンダリング、編集、送信等）のために抽出できるように、メタデータとして記憶されなければならない。

それゆえ、サイズの観点から写真解像度が上がると、これらの大きな写真のうちの幾つかの空間部分のみを容易に識別及び抽出することができるように、十分な記述を与える必要がある。

別の種類の適用例は、例えば、ビデオ要約、ビデオ監視データ内の証拠画像等のために、ビデオシーケンスから特定の写真にアクセスすることである。

その種の適用例の場合、圧縮ビデオデータ及びビデオトラックメタデータに加えて、主要な画像に容易にアクセスできるようにする画像メタデータが必要とされている。

さらに、専門家用のカメラは高い空間解像度に達している。４Ｋ２Ｋ解像度を有するビデオ又は画像は今では一般的である。８Ｋ４Ｋビデオ又は画像であっても、今では一般的になりつつある。同時に、ビデオは、ビデオストリーミング能力を有するモバイルデバイス及び接続デバイス上でますます再生されるようになっている。したがって、モバイルデバイスのユーザーがビデオのサブパートを表示したいか、又はサブパートに焦点を合わせたい場合には、品質を維持するか、更には改善することによって、ビデオをタイルに分割することが重要になる。タイルを使用することによって、ユーザーは、それゆえ、ビデオの空間的なサブパートをインタラクティブに要求することができる。

それゆえ、メタデータボックスを単に構文解析する以外の更なる処理を用いることなくアクセス可能にするために、ビデオのこれらの空間サブパートをファイルフォーマットにおいてコンパクトに記述することが必要とされている。画像がそのように記述されたビデオに対応する場合、ユーザーは空間サブパートにアクセスすることにも関心がある。

さらに、ユーザーは通常、画像を変換又は構成して、新たな派生画像を生成する。これらの派生画像は、他の画像又は画像の組に、回転又はクリッピングのような、１つ以上の指定された作業を適用することによって取得される。

したがって、元の画像から派生画像を検索するために、１つ以上の入力画像に適用されることになる作業をファイルフォーマット内にメタデータとして記述する必要がある。

ＩＳＯ／ＩＥＣ２３００８−１２規格は、最近になって議論されている、静止画像をファイルフォーマットにカプセル化するための２つの方法をカバーする。

１つの方法が、「トラック」ボックスと、関連付けられる記述ツールを伴う関連するサンプルの時限シーケンスの概念とに基づき、別の方法は、対象領域記述及びタイリングサポートのために特に、サンプルの代わりに、より少ない記述ツールを与える情報アイテムに基づく「メタ」ボックスに基づく。

したがって、新たな画像ファイルフォーマットにおいてタイリングサポートを提供することが必要とされている。

タイルの使用は、従来技術において、特に圧縮時に一般に知られている。ＩＳＯベースメディアファイルフォーマットにおけるインデックス化に関して、ＩＳＯ／ＩＥＣ１４４９６規格「Carriage of NAL unit structured video in the ISO Base Media File Format」のパート１５の修正案において、タイリング記述子が存在する。

しかしながら、これらの記述子は、「トラック」ボックス及びサンプルグループ化ツールに頼っており、「メタ」ベース手法を使用するとき、静止画像ファイルフォーマットにおいて使用することができない。そのような記述子を用いない場合、このファイルフォーマットにおいて記憶された符号化ピクチャからタイルを選択し、抽出するのが複雑になる。

図１は、ＭＰＥＧコントリビューションｍ３２２５４において開示されるような、ＩＳＯベースメディアファイルフォーマットの「メタ」ボックス（１００）内のタイルで符号化された静止画像の記述を示す。

タイルピクチャ（１０２、１０３、１０４及び１０５）ごとのそれぞれの情報アイテムに加えて、フルピクチャ１０１のための情報アイテムが規定される。それらの情報アイテムは、「ＩｔｅｍＩｎｆｏＢｏｘ」（ｉｉｎｆ）と呼ばれるボックス内に記憶される。ＩＳＯＢＭＦＦ規格からの「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」と呼ばれるボックス（１０６）が、フルピクチャの情報アイテムと、タイルピクチャ（１０８）に対応する４つの情報アイテムとの間に「タイル」関係（１０７）が存在することを示すために使用される。「ＩｔｅｍＬｏｃａｔｉｏｎＢｏｘ」と呼ばれるボックス（１０９）が、各情報アイテムを表す符号化データ（１１０）内のバイト範囲（複数の場合もある）を与えるように、各情報アイテムの識別子が使用される。ＥＸＩＦメタデータ（１１１）をフルピクチャ（１０１）のための情報アイテムに関連付けるために、別のボックス「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」（１１２）が使用され、対応するデータブロック（１１１）がメタデータボックス（１１０）内に作成される。また、ＥＸＩＦメタデータを識別するために付加的な情報アイテム（１１３）が作成される。

フルピクチャ及びそのタイルが情報アイテムとして導入される場合であっても、ここでは、タイリング情報が与えられない。さらに、付加的なメタデータを情報アイテム（ＥＸＩＦ等）に関連付けるとき、付加的な「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」を用いて参照されるデータブロックが作成されない。

ＥＸＩＦからのタイリングに関する情報を再利用し、静止画像ファイルフォーマット案において規定される機構を再利用しても、既存のＥＸＩＦタグで規則的でないグリッドを記述することはできない。

したがって、静止画像、とりわけＨＥＶＣ静止画像のためのファイルフォーマットを改善することが依然として必要とされている。詳細には、このファイルフォーマットで記憶される静止画像内の対象領域を抽出するための方法が必要とされている。
本発明は上記の状況内にある。

本発明の第１の態様によれば、１つ以上の画像を表す符号化ビットストリームをカプセル化する方法が提供され、その方法は、
−画像エリアを１つ以上のタイルに分割するための空間パラメーターを含むタイル記述情報を与えることと、
−単一の画像のタイルを表すビットストリームの部分を識別するタイルピクチャアイテム情報を与えることと、
−上記タイルピクチャアイテムを上記タイル記述情報にリンクする参照情報を与えることと、
−上記ビットストリームを、上記与えられた情報とともに、カプセル化データファイルとして出力することと、
を含む。

出力は、規定された規格に従って実行される場合があり、読出し可能及び復号可能である。

第１の態様による方法は、構文要素を構文解析することによって、複雑な計算を用いることなく、例えば、超高解像度画像（４Ｋ２Ｋ、８Ｋ４Ｋ...）からタイルを容易に識別、選択、及び抽出することを可能にする。

ＩＳＯベースメディアファイルフォーマットのメタデータボックスの記述ツールは拡張することができる。詳細には、これにより、タイル記述を情報アイテムに関連付けることが可能になる。

「メタ」ボックス階層のパートは、付加的な記述ツールを与えるように、特に、静止画像内のタイルベースアクセスをサポートするように拡張することができる。

第１の態様による方法は、符号化ＨＥＶＣ静止ピクチャから、ＨＥＶＣタイルに基づいて対象領域を容易に抽出することを可能にする。

本発明の実施形態は、ＨＥＶＣ規格に従って符号化された静止画像のためのタイル記述サポート及びタイルアクセスを提供する。

これは、静止画像のためのビデオトラックのために入手可能な対象領域特徴を保存することを可能にする。一般に、ユーザー定義の対象領域に対応する静止ピクチャのパートを、レンダリングのために、又はメディアプレーヤーに送信するために、識別し、容易に抽出することができる。

例えば、上記カプセル化された符号化ビットストリームは、ビデオシーケンスに対応する上記データストリームの時限部分を識別する情報も含む。

それゆえ、このビデオの一部である幾つかの静止画像内と同じ、ビデオへのアクセスしやすさを与える二重インデックス化を、単一のデータ部分上に与えることができる。
例えば、記述情報はタイルピクチャアイテムごとに、空間パラメーターの組を含む。
例えば、タイル記述情報は、２つ以上のタイルピクチャアイテムに共通の空間パラメーターを含む。
例えば、タイル記述情報はビットストリーム内に埋め込まれる。
例えば、タイル記述情報はメタデータとして与えられる。
例えば、参照情報は、参照タイプと、上記タイル記述情報を含む付加的な記述メタデータとを含む。
例えば、参照情報は、参照タイプと、上記タイル記述情報に関連する参照パラメーターとを含む。

その方法は、ビットストリーム内の上記タイル記述情報を参照するためのメタデータアイテムを与えることを更に含むことができる。
例えば、タイルピクチャアイテムはグループ化され、タイルピクチャアイテムのグループを上記タイル記述情報にリンクするための参照情報が与えられる。
例えば、メタデータアイテムを別のアイテムにリンクする全ての参照が、カプセル化されたデータファイル内の単一の参照ボックス内に含まれる。
例えば、任意のタイプの、１つのアイテムからの全ての関係が単一のアイテム情報記述子内に記憶される。
例えば、上記出力することは、アダプティブストリーミングのためにサーバーモジュールによって実行される。
例えば、上記出力することは、メモリに記憶するために実行される。
例えば、上記出力することは、表示のためにディスプレイモジュールによって実行される。
例えば、上記出力することは、送信のために通信モジュールによって実行される。
例えば、上記カプセル化されたデータファイルは標準化されたファイルフォーマットに対応する。
例えば、上記カプセル化されたデータファイルは復号可能及び再生可能である。

本発明の第２の態様によれば、１つ以上の画像に対応する符号化ビットストリームと、画像エリアを１つ以上のタイルに分割するための空間パラメーターを含むタイル記述情報を含む情報とを含む、カプセル化されたデータファイルを処理する方法が提供され、その方法は、
−画像対象領域を選択することと、
−上記タイル記述情報から、選択された対象エリアに対応するタイルを識別することと、
−上記識別されたタイルにリンクされる１つ以上のタイルピクチャアイテムを選択することであって、各タイルピクチャアイテムは単一の画像のタイルを表すビットストリームの部分を識別することと、
−選択されたタイルピクチャアイテム（複数の場合もある）によって識別されたビットストリームの部分を抽出することと、
−上記抽出されたビットストリーム部分を出力することと、
を含む。

例えば、上記出力することは、アダプティブストリーミングのためにサーバーモジュールによって実行される。
例えば、上記出力することは、メモリに記憶するために実行される。
例えば、上記出力することは、表示のためにディスプレイモジュールによって実行される。
例えば、上記出力することは、送信のために通信モジュールによって実行される。
例えば、上記カプセル化されたデータファイルは標準化されたファイルフォーマットに対応する。
例えば、上記カプセル化されたデータファイルは復号可能及び再生可能である。

本発明の第３の態様によれば、カプセル化ファイルにカプセル化するための少なくとも１つの画像を表す画像データを処理する方法が提供され、その方法は、
−上記少なくとも１つの画像の複数の画像部分への空間細分割を取得することと、
−上記複数の画像部分のうちの１つの画像部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの部分識別データを特定することと、
−上記画像データを、少なくとも、
○上記少なくとも１つの画像の上記細分割を表す細分割記述データと、
○上記部分識別データと、
○上記細分割記述データ及び上記部分識別データをリンクする参照データと、
ともに、上記カプセル化ファイルにカプセル化することと、
を含む。

例えば、上記画像データはビデオシーケンスの複数の画像を表し、その方法は、上記ビデオシーケンスの時間部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの時間識別データを特定することを更に含み、上記画像データは、上記時間識別データとともにカプセル化される。
例えば、上記ビデオシーケンスの上記時間部分の画像の同じ画像部分をそれぞれ表す、複数の部分識別データが特定される。
例えば、少なくとも上記細分割記述データが画像データへのメタデータとしてカプセル化される。
例えば、上記空間細分割は、上記画像データを含むビットストリーム内に埋め込まれる。
例えば、画像部分ごとに、それぞれの部分識別データが特定される。
例えば、複数の画像部分のための共通の部分識別データが特定される。

その方法は、サーバーデバイスによるアダプティブストリーミングのために、上記カプセル化ファイルをビットストリームの中に出力することを更に含むことができる。

その方法は、上記画像データを表示するためにディスプレイデバイスに送信するために、上記カプセル化ファイルをビットストリームの中に出力することを更に含むことができる。

その方法は、クライアントデバイスに送信するために、上記カプセル化ファイルをビットストリームの中に出力することを更に含むことができる。

その方法は、上記カプセル化ファイルを記憶デバイスに記憶することを更に含むことができる。

例えば、参照データは、参照タイプと、上記細分割記述データを含む付加的な記述メタデータとを含む。
例えば、参照データは、参照タイプと、上記細分割記述データに関連する参照パラメーターとを含む。
例えば、上記細分割記述データはメタデータアイテムにおいて参照される。
例えば、部分識別データはグループ化され、参照データは、部分識別データのグループを上記部分識別データにリンクする。
例えば、上記カプセル化されたファイルは、画像データのための全ての参照データを含む単一の参照ボックスを含む。
例えば、上記カプセル化されたファイルは、上記細分割記述データと、部分識別データと、参照データとの間の関係の表現を含む記述を含む。

本発明の第４の態様によれば、カプセル化ファイルを処理する方法が提供され、カプセル化ファイルは、
−少なくとも１つの画像を表す画像データと、
−上記少なくとも１つの画像データの複数の画像部分への空間細分割を表す細分割記述データと、
−上記複数の画像部分のうちの１つの画像部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの部分識別データと、
−上記細分割記述データと上記部分情報とをリンクする参照データと、
を含み、
その方法は、
−上記少なくとも１つの画像内の対象領域を特定することと、
−上記細分割記述データに基づいて、上記対象領域に属する少なくとも１つの画像部分を特定することと、
−上記参照データに基づいて、上記対象領域に属する上記少なくとも１つの画像部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの部分識別データにアクセスすることと、
−上記画像データ内の上記データ部分を抽出することと、
を含む。

例えば、上記画像データは、ビデオシーケンスの複数の画像を含み、上記カプセル化ファイルは、上記ビデオシーケンスの時間部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの時間識別データを更に含み、上記ビデオシーケンスの上記時間部分の画像のための対象領域が特定され、上記ビデオシーケンスの上記時間部分の複数の画像内の上記対象領域に対応するデータ部分が抽出される。
例えば、複数の部分識別データは、上記ビデオシーケンスの上記時間部分の画像の同じ画像部分をそれぞれ表す。
例えば、少なくとも上記細分割記述データが画像データへのメタデータとしてカプセル化される。
例えば、画像部分ごとに、それぞれの部分識別データが特定される。
例えば、複数の画像部分のための共通の部分識別データが特定される。

その方法は、上記カプセル化ファイルを、サーバーデバイスによって適応的にストリーミングされるビットストリームとして受信することを更に含むことができる。
その方法は、上記対象領域を表示することを更に含むことができる。
例えば、参照データは、参照タイプと、上記細分割記述データを含む付加的な記述メタデータとを含む。
例えば、参照データは、参照タイプと、細分割記述データに関連する参照パラメーターとを含む。
例えば、上記細分割記述データはメタデータアイテムにおいて参照される。
例えば、部分識別データはグループ化され、参照データは、部分識別データのグループを上記部分識別データにリンクする。
例えば、上記カプセル化されたファイルは、画像データのための全ての参照データを含む単一の参照ボックスを含む。
例えば、上記カプセル化されたファイルは、上記細分割記述データと、部分識別データと、参照データとの間の関係の表現を含む記述を含む。

本発明の第５の態様によれば、第１の態様による方法を実施するように構成されるデバイスが提供される。

そのデバイスは、
−画像エリアを１つ以上のタイルに分割するための空間パラメーターを含むタイル記述情報を与え、単一の画像のタイルを表すビットストリームの部分を識別するピクチャアイテム情報を与え、上記タイルピクチャアイテムを上記タイル記述情報にリンクする参照情報を与えるように構成される処理ユニットと、
−上記ビットストリームを、上記与えられた情報とともに、カプセル化されたデータファイルとして出力するように構成される通信ユニットと、
を備えることができる。

本発明の第６の態様によれば、第２の態様による方法を実施するように構成されるデバイスが提供される。

そのデバイスは、１つ以上の画像に対応する符号化ビットストリームと、画像エリアを１つ以上のタイルに分割するための空間パラメーターを含むタイル記述情報を含む情報とを含む、カプセル化されたデータファイルを処理するように構成することができる。また、そのデバイスは、
−画像対象領域を選択し、上記タイル記述情報から、選択された対象エリアに対応するタイルを識別し、上記識別されたタイルにリンクされる、それぞれが単一の画像のタイルを表すビットストリームの部分を識別する１つ以上のピクチャアイテムを選択し、選択されたタイルピクチャアイテム（複数の場合もある）によって識別されたビットストリームの部分を抽出するように構成される処理ユニットと、
−上記抽出されたビットストリーム部分を出力するように構成される通信ユニットと、
を備えることができる。

本発明の第７の態様によれば、第３の態様による方法を実施するように構成されるデバイスが提供される。

そのデバイスは、カプセル化ファイルの中にカプセル化するための少なくとも１つの画像を表す画像データを処理するように構成することができ、そのデバイスは、上記少なくとも１つの画像の複数の画像部分への空間細分割を取得し、上記複数の画像部分のうちの１つの画像部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの部分識別データを特定し、上記画像データを、少なくとも、
−上記少なくとも１つの画像の上記細分割を表す細分割記述データと、
−上記部分識別データと、
−上記細分割記述データと上記部分識別データとをリンクする参照データと、
ともに、上記カプセル化ファイルの中にカプセル化するように構成される処理ユニットを備えることができる。

本発明の第８の態様によれば、第４の態様による方法を実施するように構成されるデバイスが提供される。

そのデバイスは、
−少なくとも１つの画像を表す画像データと、
−上記少なくとも１つの画像データの複数の画像部分への空間細分割を表す細分割記述データと、
−上記複数の画像部分のうちの１つの画像部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの部分識別データと、
−上記細分割記述データと上記部分情報とをリンクする参照データと、
を含むカプセル化ファイルを処理するように構成することができる。

また、そのデバイスは、上記少なくとも１つの画像内の対象領域を特定し、上記細分割記述データに基づいて、上記対象領域に属する少なくとも１つの画像部分を特定し、上記参照データに基づいて、上記対象領域に属する上記少なくとも１つの画像部分を表す、上記画像データ内のデータ部分を識別する少なくとも１つの部分識別データにアクセスし、上記画像データ内の上記データ部分を抽出するように構成される処理ユニットを備えることができる。

本発明の第９の態様によれば、
−第５の態様又は第７の態様による第１のデバイスと、
−上記第１のデバイスからのファイルを処理するための、第６の態様又は第８の態様による第２のデバイスと、
を備えるシステムが提供される。

本発明の第１０の態様によれば、プログラム可能装置のコンピューター手段上にロードされ、実行されるときに、本発明の第１の態様、第２の態様、第３の態様及び／又は第４の態様による方法を実施するための命令を含む、コンピュータープログラム及びコンピュータープログラム製品が提供される。

本発明の第１１の態様によれば、
１つ以上の画像を表す符号化ビットストリームをカプセル化する方法であって、カプセル化されたビットストリームはデータパートと、メタデータパートとを含む、方法が提供される。その方法は、
単一の画像のサブ画像又は画像を表すデータパートの部分を識別する画像アイテム情報を与えることと、
１つ以上の画像に関連する表示パラメーター及び／又は変換演算子を含むパラメーターを含む画像記述情報を与えることと、
上記ビットストリームを、上記与えられた情報とともに、カプセル化されたデータファイルとして出力することと、
を含み、
画像記述情報は、メタデータパート内に記憶される。

一実施形態において、画像記述情報に含まれる各パラメーターは、
−タイプ情報、及び／又は、
−画像アイテム情報を上記パラメーターにリンクするために使用される識別子、
を含む付加データに関連付けられる。

一実施形態において、メタデータパートは、ＩＳＯＢＭＦＦの「メタ」データボックス内に含まれる。
一実施形態において、付加データはヘッダーである。
一実施形態において、付加データは仮想アイテムである。
別の実施形態において、画像記述情報に含まれる各変換演算子が、変換済みアイテムを上記変換演算子にリンクするために使用される識別子を含む付加データに関連付けられる。
一実施形態において、メタデータパートに記憶されるボックスは、少なくとも１つの変換演算子を含む。

カプセル化されたビットストリームのデータパートは、１つ以上の変換演算子に関連付けられる変換済みアイテムを含み、メタデータパートは、
−変換演算子が適用される元の画像を識別するための情報と、
−データパート内の変換済みアイテムの場所を特定するための情報と、
を更に含む。

一実施形態において、変換済みアイテムは、少なくとも１つの変換インデックスを含み、インデックスはメタデータパート内の変換演算子のうちの１つを識別できるようにする。

本発明の第１２の実施形態によれば、データパート内の１つ以上の画像に対応する符号化ビットストリームと、１つ以上の画像又はサブ画像に関連する表示パラメーター及び／又は変換演算子を含む画像又はサブ画像記述情報を含むメタデータパート内の情報とを含む、データパート及びメタデータパートを含むカプセル化されたデータファイルを処理する方法が提供される。その方法は、
−対象の画像又はサブ画像を選択することと、
−上記参照された画像又はサブ画像記述情報から、メタデータパートからの関連する表示パラメーター及び／又は変換演算子を識別することと、
−変換演算子が識別された場合、画像又はサブ画像に変換を適用するとともに、上記表示パラメーターに従って、最終的に変換された上記画像又はサブ画像を表示することと、
を含む。

一実施形態において、その方法は更に、識別するステップの前に、上記パラメーター内に含まれる付加データを検索することを含み、上記付加データは、
−タイプ情報、及び／又は、
−画像又はサブ画像アイテム情報を上記パラメーターにリンクするために使用される識別子、
を含む。
一実施形態において、メタデータパートは、ＩＳＯＢＭＦＦの「メタ」データボックス内に含まれる。
一実施形態において、付加データはヘッダーである。
一実施形態において、付加データは仮想アイテムである。
別の実施形態において、画像記述情報に含まれる各変換演算子が、変換済みアイテムを上記変換演算子にリンクするために使用される識別子を含む付加データに関連付けられる。
一実施形態において、メタデータパートに記憶されるボックスは、少なくとも１つの変換演算子を含む。
一実施形態において、カプセル化されたビットストリームのデータパートは、１つ以上の変換演算子に関連付けられる変換済みアイテムを含み、メタデータパートは、
−変換演算子が適用される元の画像を識別するための情報と、
−データパート内の変換済みアイテムの場所を特定するための情報と、
を更に含む。
一実施形態において、変換済みアイテムは、少なくとも１つの変換インデックスを含み、インデックスはメタデータパート内の変換演算子のうちの１つを識別できるようにする。

本発明の第１３の態様によれば、本発明の第１１の態様によるカプセル化方法を実施するように構成される、１つ以上の画像を表す符号化ビットストリームをカプセル化するサーバーデバイスが提供される。

本発明の第１４の態様によれば、本発明の第１２の態様による処理方法を実施するように構成される、１つ以上の画像を表す符号化ビットストリームをカプセル化するクライアントデバイスが提供される。

本発明の第１５の態様によれば、プログラム可能装置のコンピューター手段上にロードされ、実行されるときに、本発明の第１１の態様及び第１２の態様による方法を実施するための命令を含む、コンピュータープログラム及びコンピュータープログラム製品が提供される。

本発明の第１６の態様によれば、１つ以上の画像を表す符号化ビットストリームをカプセル化する方法であって、前記カプセル化されたビットストリームはデータパートとメタデータパートとを含み、該方法は、
単一の画像及び／又は単一の画像の組のサブ画像又は画像を表す前記データパートの部分を識別する画像アイテム情報を与えることと、
１つ以上の画像に関連する表示パラメーター及び／又は変換演算子を含むパラメーターを含む画像記述情報を与えることと、
前記ビットストリームを、前記与えられた情報とともに、カプセル化されたデータファイルとして出力することと、
を含む、方法が提供される。

前記画像アイテム情報は、前記検討対象のサブ画像又は単一の画像又は単一の画像の組に専用の前記画像記述情報の少なくとも一部を含む、１つ以上の特性を含み、前記画像記述情報は１つ以上のボックスにおいて規定される。

本発明のこの態様によれば、効率的な参照機構のためにデータ及びメタデータの明確な分離を提供できるようになる。

一実施形態において、前記画像アイテム情報はボックスであり、各画像アイテム情報の特性がボックスであり、前記特性ボックスはボックスのテーブルを形成するために編成される。

一実施形態において、各特性は、出現順又は前記ボックスのテーブル内の対応するボックスに従うことによって、前記サブ画像、又は前記画像及び／又は前記単一の画像の組に適用される。

一実施形態において、前記サブ画像又は前記単一の画像及び／又は前記単一の画像の組はビデオシーケンスに関連し、前記画像アイテム情報特性のうちの１つは前記ビデオシーケンスの初期化情報を参照する１つ以上の初期化パラメーターを含む。

一実施形態において、幾つかのサブ画像又は単一の画像及び／又は単一の画像の組の中で共有される前記画像記述情報の部分が１つの専用共有ボックス内で規定され、各画像記述情報は、前記検討対象の画像アイテム情報を少なくとも１つの画像記述情報にリンクするための構造を介して検索可能であり、前記リンク構造は、
検討対象の画像アイテム情報ごとの第１の識別子であって、該第１の識別子は、画像アイテム情報の特性として規定され、前記専用共有ボックス内の同じ値を有する第２の識別子を参照する、第１の識別子と、
前記専用共有ボックス内に含まれる１つ又は幾つかの第２の識別子であって、各第２の識別子は１つの画像記述情報を参照する、１つ又は幾つかの第２の識別子と、
を含む。

一実施形態において、幾つかのサブ画像又は単一の画像及び／又は単一の画像の組の中で共有される画像記述情報の部分は２つの専用共有ボックス内で規定され、一方の共有ボックスは前記表示パラメーターに関連し、他方の共有ボックスは前記変換演算子に関連し、各画像記述情報は、前記画像アイテム情報を少なくとも１つの画像記述情報にリンクするための構造を介して検索可能である。

一実施形態において、前記リンク構造は、前記画像アイテム情報と少なくとも１つの画像記述情報とをリンクする２つの参照タイプパラメーターを含み、各参照タイプパラメーターは、前記専用共有ボックスのうちの１つに特有である。

一実施形態において、前記リンク構造は、
検討対象の画像アイテム情報ごとの第１の識別子及び第２の識別子であって、該第１の識別子は、画像アイテム情報の特性として規定され、前記表示パラメーターに関連する前記専用共有ボックス内の第３の識別子を参照し、該第２の識別子は、画像アイテム情報の特性として規定され、前記変換演算子に関連する前記専用共有ボックス内の第４の識別子を参照する、第１の識別子及び第２の識別子と、
前記表示パラメーター及び前記変換演算子に関連する前記専用共有ボックス内にそれぞれ含まれる１つ又は幾つかの第３の識別子及び第４の識別子であって、各第３の識別子及び第４の識別子はそれぞれ、表示パラメーター及び変換演算子を参照する、１つ又は幾つかの第３の識別子及び第４の識別子と、
を備える。

一実施形態において、前記表示パラメーターのうちの１つは、単一の画像の部分に対応する単一の画像の組を規定するためのグリッドである。

一実施形態において、前記単一の画像の組からの前記画像は同じ単一の画像に関連する。

本発明の第１７の態様によれば、１つ以上の画像を表すカプセル化されたビットストリームを取得する方法であって、前記カプセル化されたビットストリームは符号化データパートと、メタデータパートとを含み、該方法は、
単一の画像及び／又は単一の画像の組のサブ画像又は画像を表す前記データパートの部分を識別する画像アイテム情報を取得することと、
１つ以上の画像に関連する表示パラメーター及び／又は変換演算子を含むパラメーターを含む画像記述情報を取得することと、
前記ビットストリームを、前記決定された情報とともに、カプセル化されたデータファイルとして抽出することと、
を含む、方法が提供される。

前記画像アイテム情報は、前記検討対象のサブ画像又は単一の画像又は単一の画像の組に専用の画像記述情報の少なくとも一部を含む、１つ以上の特性を含み、前記画像記述情報は１つ以上のボックスにおいて規定される。

一実施形態において、前記サブ画像又は前記単一の画像及び／又は前記単一画像の組はビデオシーケンスに関連し、前記画像アイテム情報特性のうちの１つは前記ビデオシーケンスの初期化情報を参照する１つ以上の初期化パラメーターを含む。

一実施形態において、幾つかのサブ画像又は単一の画像及び／又は単一の画像の組の中で共有される前記画像記述情報の部分は１つの専用共有ボックス内で規定され、各画像記述情報は、前記検討対象の画像アイテム情報を、少なくとも１つの画像記述情報にリンクするための構造を介して検索可能であり、前記リンク構造は、
検討対象の画像アイテム情報ごとの第１の識別子であって、該第１の識別子は、画像アイテム情報の特性として規定され、前記専用共有ボックス内の同じ値を有する第２の識別子を参照する、第１の識別子と、
前記専用共有ボックス内に含まれる１つ又は幾つかの第２の識別子であって、各第２の識別子は１つの画像記述情報を参照する、１つ又は幾つかの第２の識別子と、
を含む。

一実施形態において、前記リンク構造は、
検討対象の画像アイテム情報ごとの第１の識別子及び第２の識別子であって、該第１の識別子は、画像アイテム情報の特性として規定され、前記表示パラメーターに関連する前記専用共有ボックス内の第３の識別子を参照し、該第２の識別子は、画像アイテム情報の特性として規定され、前記変換演算子に関連する前記専用共有ボックス内の第４の識別子を参照する、第１の識別子及び第２の識別子と、
前記表示パラメーター及び前記変換演算子に関連する前記専用共有ボックス内にそれぞれ含まれる１つ又は幾つかの第３の識別子及び第４の識別子であって、各第３の識別子及び第４の識別子はそれぞれ、表示パラメーター及び変換演算子を参照する、１つ又は幾つかの第３の識別子及び第４の識別子と、
を備える。
一実施形態において、前記表示パラメーターのうちの１つは、単一の画像の部分に対応する単一の画像の組を規定するためのグリッドである。
一実施形態において、前記単一の画像の組からの前記画像は同じ単一の画像に関連する。

本発明の第１８の態様によれば、本発明の第１６の態様による方法を実施するために構成される、１つ以上の画像を表す符号化ビットストリームをカプセル化するためのデバイスが提供される。

本発明の第１９の態様によれば、本発明の第１７の態様による方法を実施するために構成される、１つ以上の画像を表すカプセル化されたビットストリームを処理するためのデバイスが提供される。

本発明の第２０の態様によれば、本発明の第１８の態様による第１のデバイスと、
前記第１のデバイスからのファイルを処理するための、本発明の第１９の態様による第２のデバイスと、
を備える、システムが提供される。

本発明の第２１の態様によれば、プログラムがロードされ、プログラム可能装置によって実行されるときに、本発明の第１６の態様又は第１７の態様による方法を実施するための命令を含む、コンピュータープログラム製品が提供される。

本発明の第２２の態様によれば、コンピュータープログラムがロードされ、コンピューター又はマイクロプロセッサによって実行されるときに、本発明の第１６の態様又は第１７の態様による方法を実施するための前記プログラムの命令を記憶する、前記コンピューター又は前記マイクロプロセッサによって読出し可能な非一時的情報記憶手段が提供される。

本発明の第２３の態様によれば、１つ以上の画像を表す符号化ビットストリームをカプセル化する方法であって、前記カプセル化されたビットストリームはデータパートとメタデータパートとを含み、該方法は、
単一の画像及び／又は単一の画像の組のサブ画像又は画像を表す前記データパートの部分を識別する画像アイテム情報を与えることと、
１つ以上の画像に関連する表示パラメーター及び／又は変換演算子を含むパラメーターを含む画像記述情報を与えることと、
前記ビットストリームを、前記与えられた情報とともに、カプセル化されたデータファイルとして出力することと、
を含む、方法が提供される。

前記画像記述情報は、１つ又は２つの専用ボックス内で規定され、各画像記述情報は、前記画像アイテム情報を少なくとも１つの画像記述情報にリンクするための構造を介して検索可能である。

一実施形態において、前記画像記述情報は１つの専用ボックス内で規定され、前記リンク構造は、前記画像アイテム情報と少なくとも１つの画像記述情報とをリンクする参照タイプパラメーターを含む。

一実施形態において、前記画像記述情報は１つ又は２つの専用ボックス内で規定され、前記リンク構造は、前記画像アイテム情報と少なくとも１つの画像記述情報とをリンクするためのインデックスの１つ又は２つの組を含み、各組は前記専用ボックスのうちの１つに関連付けられる。

一実施形態において、前記画像記述情報は２つの専用ボックス内で規定され、一方のボックスは前記表示パラメーターに関連し、他方のボックスは前記変換演算子に関連する。

一実施形態において、前記画像記述情報は２つの専用ボックス内で規定され、前記リンク構造は、前記２つの専用ボックスのうちのそれぞれ１つに関連付けられる２つの参照タイプパラメーターを含み、各参照タイプパラメーターは、前記画像アイテム情報と、前記関連付けられる専用ボックス内の少なくとも１つの画像記述情報とをリンクする。

本発明の第２４の態様によれば、１つ以上の画像を表すカプセル化されたビットストリームを取得する方法であって、前記カプセル化されたビットストリームは符号化データパートと、メタデータパートとを含み、該方法は、
単一の画像及び／又は単一の画像の組のサブ画像又は画像を表す前記データパートの一部分を識別する画像アイテム情報を取得することと、
１つ以上の画像に関連する表示パラメーター及び／又は変換演算子を含むパラメーターを含む画像記述情報を取得することと、
前記ビットストリームを、前記決定された情報とともに、カプセル化されたデータファイルとして抽出することと、
を含み、
前記画像記述情報は、１つ又は２つの専用ボックス内で規定され、各画像記述情報は、前記画像アイテム情報を少なくとも１つの画像記述情報にリンクするための構造を介して検索可能である、方法が提供される。

本発明の第２５の態様によれば、本発明の第２３の態様による方法を実施するために構成される、１つ以上の画像を表す符号化ビットストリームをカプセル化するためのデバイスが提供される。

本発明の第２６の態様によれば、本発明の第２４の態様による方法を実施するために構成される、１つ以上の画像を表すカプセル化されたビットストリームを処理するためのデバイスが提供される。

本発明の第２７の態様によれば、本発明の第２５の態様による第１のデバイスと、
前記第１のデバイスからのファイルを処理するための、本発明の第２６の態様による第２のデバイスと、
を備える、システムが提供される。

本発明の第２８の態様によれば、プログラムがロードされ、プログラム可能装置によって実行されるときに、本発明の第２３の態様又は第２４の態様による方法を実施するための命令を含む、コンピュータープログラム製品が提供される。

本発明の第２９の態様によれば、コンピュータープログラムがロードされ、コンピューター又はマイクロプロセッサによって実行されるときに、本発明の第２３の態様又は第２４の態様による方法を実施するための、前記プログラムの命令を記憶する、コンピューター又はマイクロプロセッサによって読出し可能な非一時的情報記憶手段が提供される。

本発明の他の特徴及び利点は、図１に加えて、添付の図面を参照する、非限定的な例示的実施形態の以下の説明から明らかになるであろう。

タイリングされたビデオの一例を示す図である。ＨＥＶＣ内の種々のタイル／スライス構成を示す図である。「トラック」ボックスを有するＩＳＯベースメディアファイルフォーマットによるタイルカプセル化を示す図である。ＩＳＯＢＭＦＦの「メタ」ボックス内の情報アイテムを記述するための標準的なメタデータを示す図である。情報アイテム記述への例示的な拡張を示す図である。情報アイテム間の参照機構を示す図である。本発明の実施形態の実施態様の状況を示す図である。本発明の１つ又は複数の実施形態の実施態様のためのコンピューティングデバイスの概略的なブロック図である。

以下において、本発明の実施形態が説明される。
技術的状況をより深く理解するために、連続した時間フレームを有するビデオ２００を示す図２を参照しながら、ビデオタイリングが説明される。各フレーム２０１は、「タイル」Ｔ１〜Ｔ８と呼ばれる８つの部分に（ここでは、長方形部分）に分割される。タイルの数及び形状は異なることができる。以下において、ビデオフレームのどのインデックスでも、タイリングは同じであると考えられる。

このタイリングの結果は８つの独立したサブビデオ２０２である。これらのサブビデオは、グローバルビデオ全体の１つの区分を表す。独立した各サブビデオは、例えば、ＡＶＣ又はＨＥＶＣ規格に従って、独立したビットストリームとして符号化することができる。サブビデオは、例えば、ＨＥＶＣ規格のタイル又はＡＶＣ規格のスライスのような、単一のビデオのビットストリームの一部とすることもできる。

ＨＥＶＣ規格は、ピクチャの異なる空間細分割、すなわち、タイル、スライス及びスライスセグメントを規定する。これらの異なる細分割（又は区分）は、異なる目的のために導入されてきた。すなわち、スライスはストリーミング問題に関連し、一方、タイル及びスライスセグメントは並列処理のために規定された。

タイルは、整数の符号化ツリーユニット（ＣＴＵ：Coding Tree Units）を含むピクチャの長方形領域を画定する。図３は、行境界及び列境界３０１、３０２によって画定される画像３００のタイリングを示す。これは、位置及びサイズの観点から、タイルを対象領域記述のための良好な候補にする。しかしながら、構文の観点からのＨＥＶＣ規格ビットストリーム編成と、ネットワーク抽象レイヤ（ＮＡＬ）ユニットへのそのカプセル化とはむしろ、スライスに基づく（ＡＶＣ規格と同様）。

ＨＥＶＣ規格によれば、スライスはスライスセグメントの組であり、少なくとも第１のスライスセグメントは独立スライスセグメントであり、他のスライスセグメントは、存在する場合、従属スライスセグメントである。スライスセグメントは、整数の連続したＣＴＵ（ラスター走査順）を含む。スライスセグメントは、必ずしも長方形の形状を有しない（したがって、対象領域を表す場合にタイルより適していない）。スライスセグメントは、「ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒ」と呼ばれるヘッダー、及びこれに後続する「ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｄａｔａ」と呼ばれるデータとして、ＨＥＶＣビットストリーム内に符号化される。独立スライスセグメント及び従属スライスセグメントはそのヘッダーによって異なる。すなわち、従属スライスセグメントは、独立スライスセグメントのヘッダーからの情報を再利用するので、より短いヘッダーを有する。独立スライスセグメント及び従属スライスセグメントはいずれも、タイルへの、又はエントロピー復号同期点への、ビットストリーム内のエントリポイントのリストを含む。

図３は、スライス、スライスセグメント及びタイルの画像３１０及び３２０の異なる構成を示す。これらの構成は、１つのタイルが１つのスライスを有する（１つの独立スライスセグメントのみを含む）画像３００の構成とは異なる。画像３１０は、２つの垂直タイル（３１１、３１２）と、１つのスライス（５つのスライスセグメントを有する）とに区分される。画像３２０は２つのタイル（３２１、３２２）に分割され、左側タイル３２１は２つのスライス（それぞれ２つのスライスを有する）を有し、右側タイル３２２は、１つのスライス（２つのスライスセグメントを有する）を有する。ＨＥＶＣ規格は、タイルとスライスセグメントとの間の編成規則を規定し、それは以下のように要約することができる（一方又は両方の条件が満たされなければならない）。
−スライスセグメント内の全てのＣＴＵが同じタイルに属する。
−タイル内の全てのＣＴＵが同じスライスセグメントに属する。

一致する対象領域サポート及びトランスポートを有するために、１つのタイルが、１つの独立セグメントを有する１つのスライスを含む構成３００が好ましい。しかしながら、そのカプセル化解決策は、他の構成３１０又は３２０であっても機能することになる。

タイルは対象領域に適したサポートであるが、スライスセグメントは、ネットワーク上でのトランスポートのために実際にはＮＡＬユニットの中に入れられ、アクセスユニット（ファイルフォーマットレベルにおける符号化ピクチャ又はサンプル）を形成するために統合されることになるエンティティである。ＨＥＶＣ規格によれば、ＮＡＬユニットのタイプは、ＮＡＬユニットヘッダーにおいて指定される。タイプ「符号化スライスセグメント」のＮＡＬユニットの場合、ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒは、「ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ａｄｄｒｅｓｓ」構文要素を介して、スライスセグメント内の第１の符号化ツリーブロックのアドレスを示す。タイリング情報は、ＰＰＳ（ピクチャパラメーターセット）ＮＡＬユニット内で与えられる。スライスセグメントとタイルとの間の関係を、その後、これらのパラメーターから推測することができる。

規定により、タイル境界において、空間予測はリセットされる。しかしながら、タイルが、参照フレーム（複数の場合もある）内の異なるタイルからの時間予測子を使用するのを妨げるものはない。独立したタイルを構築するために、符号化時に、タイル内の予測ユニットのための動きベクトルが、参照フレーム（複数の場合もある）内の同じ場所に位置するタイル内にとどまるように制約を加えられる。さらに、唯一のタイルを復号するときに誤差ドリフトが導入されないように、タイル境界において、インループフィルター（デブロッキング及びＳＡＯ）は解除されなければならない。インループフィルターのこの制御はＨＥＶＣ規格において既に利用可能であり、「ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ」と呼ばれるフラグを用いてスライスセグメントヘッダー内に設定される。このフラグを明確に０に設定することによって、タイル境界にあるピクセルは、隣接タイルの境界に位置するピクセルに依存しない。動きベクトル及びインループフィルターに関する２つの条件が満たされるとき、タイルは、「独立して復号可能」又は「独立している」と言われる。

ビデオシーケンスが独立タイルの組として符号化されるとき、そのビデオシーケンスは、参照データの紛失又は再構成誤差の伝搬というリスクを冒すことなく、タイルベース復号を用いてフレームを次々に復号することができる。この構成は、例えば、対象領域に対応する元のビデオの空間部分のみを再構成するのを可能にする。

以下において、独立タイルが考察される。
図４を参照すると、タイルのＩＳＯＢＭＦＦファイルフォーマットへのカプセル化が説明される。例えば、各タイルは専用トラックの中にカプセル化される。全てのタイルの共通のセットアップ及び初期化情報が、例えば、「タイルベーストラック」と呼ばれる、特定のトラックの中にカプセル化される。このようにして、フルビデオは、これら全てのトラックの構成物、すなわち、タイルベーストラック、及びタイルトラックの組としてカプセル化される。

図４は、例示的なカプセル化を示す。タイリングされたビデオをＩＳＯＢＭＦＦ規格に従ってカプセル化する１つの方法は、各タイルを専用トラックに分割し、全てのタイルに共通のセットアップ及び初期化情報を、例えば、「タイルベーストラック」と呼ばれる、特定のトラック内にカプセル化し、フルビデオを、これら全てのトラックの構成物、すなわち、タイルベーストラック＋タイルトラックの組としてカプセル化することである。したがって、そのカプセル化は、「マルチトラックタイルカプセル化」と呼ばれる。マルチトラックタイルカプセル化の一例が図４において与えられる。

ボックス４０１は、メインＩＳＯＢＭＦＦボックス「ｍｏｏｖ」を表し、トラックのフルリストを、それらの識別子とともに含む。例えば、ボックス４１１〜４１４は、タイルトラック（この例では４つのタイル）を表し、ボックス４２０はタイルベーストラックを表す。オーディオ又はテキストトラックのような付加的なトラックが使用される場合があり、同じファイル内にカプセル化される場合がある。しかしながら、簡潔にするために、そのような付加的なトラックはここでは論じられない。

図４において表されるように、復号及び表示のためにタイルトラックを参照するタイルベーストラックから、タイルトラック（複数の場合もある）の任意の組み合わせを容易に再構成できるように、タイルデータは、独立しており、アドレス指定可能なトラックに分割される。また、タイルベーストラックは、任意のタイル、すなわち、１つのタイル、多くのタイル又は全てのタイルを組み合わせることができるように設計されるので、「複合トラック」又は「参照トラック」と呼ばれる場合もある。タイルベーストラック４２０は、「ｍｄａｔ」ボックス内に、全てのタイルトラックに共通の情報と、サンプル４５０のリスト（図４には第１のサンプルのみが表される）とを含む。タイルベーストラック４２０の各サンプル４５０は、抽出子（４５１〜４５４、それぞれが各タイルへの１つの抽出子を表す）の使用を通して各タイルトラックを参照することによって構築される。各タイルトラック４１１〜４１４は、ビデオ全体、すなわち、フルフレームの空間部分を表す。各タイルトラック４１１〜４１４のトラックヘッダーボックス（表されない）内にタイル記述（位置、サイズ、帯域幅等）が記憶される。タイルベーストラック及び各タイルトラックは、各トラック内のボックス「ＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘ」を用いて、相互参照される（４０５）。各タイルトラック４１１〜４１４は、ベーストラック４２０を「ｔｂａｓ」トラックと呼ぶ（「ｔｂａｓ」は、各タイルトラックからタイルベーストラックへの符号化依存性を示す、詳細には、ファイルフォーマット構文解析から生じるエレメンタリストリームを処理することになるビデオ復号器をセットアップできるようにするパラメーター「ＨＥＶＣＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄ」を見つける場所を示す特定のコードである）。逆に、フルビデオ再構成を可能にするために、タイルベーストラック４２０は、各タイルトラックへのタイプ「ｓｃａｌ」の依存性を示す（４０５）。これは、符号化依存性を示すことであり、タイルベーストラックのサンプル４５０の定義をタイルトラックデータへの抽出子として反映させることである。これらの抽出子は、構文解析時に、データの不在をサポートすることができる特定の抽出子である。図４において、ファイルのストリーミング可能なバージョンを与えるために、各トラックは、メディアセグメント（タイルトラックの場合に４３１〜４３４及びタイルベーストラックの場合に４６０）に分解される。各メディアセグメントは、「ｍｏｏｆ」ボックス＋データによって示される、１つ以上のムービーフラグメントを含む。タイルトラックの場合、データパートはビデオの空間サブパートに対応し、一方、タイルベーストラックの場合、それはパラメーターセット、存在するときにはＳＥＩメッセージ、及び抽出子のリストを含む。「ｍｏｏｖ」ボックス４０１は、ストリーミングの適用例の場合、初期化セグメントに収まることになる。図４は、１つのセグメントのみを示すが、トラックは任意の数のセグメントに分解することができ、その制約は、タイルトラックのためのセグメント及びタイルベーストラックのためのセグメントが同じ時間分解に従う（すなわち、それらが時間的に位置合わせされる）ことであり、これは、フルビデオからタイル又はタイルの組への切替えを可能にすることである。この時間分解の粒度は、簡潔にするために、ここでは説明されない。

ファイルフォーマットは、記述メタデータ（例えば、「ＶｉｓｕａｌＳａｍｐｌｅＧｒｏｕｐＥｎｔｒｉｅｓ」、又は「ｔｒｅｆ」ボックス内のトラック参照タイプ等）を有し、それは、１つのタイル、タイルの組み合わせ又は全てのタイルに対応するデータを、記述メタデータを構文解析することによって容易に識別できるように、トラック間の関係を記述する。

以下において、静止画像が同じレベルにおいて説明される。したがって、ピクチャの任意のタイル、タイルの組み合わせ又は全てのタイルをユーザーが選択すると、識別及び抽出が容易になる。ピクチャがビデオデータと混合される場合、記述は、ビデオのための記述メタデータと並列に到来する。したがって、同じデータセットの場合、（ビデオ及びオーディオのためのインデックス化レイヤに加えて）そのピクチャのための付加的なインデックス化レイヤが設けられる。

「ｍｅｔａ」ボックスを用いる静止画像ファイルフォーマットでは、ピクチャが、関連する情報とともに、情報アイテムとして記述される。図５に示されるように、情報アイテムは、「メタ」ボックスの専用サブボックス「ＩｔｅｍＩｎｆｏＢｏｘ」５００内にリスト化される。このサブボックスは、ファイル内に存在する情報アイテムの数を与える。また、サブボックスは、アイテムごとに、「ＩｔｅｍＩｎｆｏＥｎｔｒｙ」５０１として表される記述メタデータも与える。ＩＳＯＢＭＦＦ規格の発展にともなって、このボックスの幾つかのバージョン５０２（０、１、２、３）が存在する。

「メタ」アイテムは、ファイル内に隣接して記憶されない場合がある。また、アイテムデータのインターリービングに関する特定の制約はない。したがって、同じファイル内の２つのアイテムが１つ又は幾つかのデータブロックを共有する場合がある。これは、独立して復号可能なタイルあたり１つのアイテムを有するのを簡単にすることができるので、ＨＥＶＣタイルの場合に特に有用である（タイルは隣接して、又は隣接することなく記憶することができる）。このアイテムは、メインＨＥＶＣピクチャ内のデータオフセット、及びＩｔｅｍＬｏｃａｔｉｏｎＢｏｘを通してタイルのために使用されるスライス（複数の場合もある）の長さを示す。

実施形態によれば、例えば、「ｈｖｃｔ」若しくは「ｔｉｌｅ」と呼ばれる、タイルピクチャを記述するための新たなアイテムタイプが追加される場合があるか、又はＩＳＯ／ＩＥＣ１４４９６−１５：「ｈｖｔ１」から再利用される場合がある。タイルピクチャを表す各アイテムは（どの４文字コードが選択されるにしても）、「ｈｖｃ１」アイテムへのタイプ「ｔｂａｓ」の参照を有することができ、各アイテムは「ｈｖｃ１」アイテムから抽出される。各アイテムは、識別子「ｉｔｅｍ＿ＩＤ」５０３を有し、ピクチャのための圧縮データを含む、メディアデータボックス内のバイト位置及びサイズに関して、ボックス「ＩｔｅｍＬｏｃａｔｉｏｎＢｏｘ」内に更に記述される。

そのような構文は、ファイルフォーマットリーダー（又は「パーサー」）が、情報アイテムのリストを介して、それらのタイプに関する情報５０４、例えば、情報アイテムがフルピクチャのタイルピクチャであることを示す「タイル」とともに、幾つの情報アイテムが入手可能であるかを判断することを可能にする。

したがって、他のタイルをスキップしながら、画像の１つのタイルのみ、及び関連する復号器構成をダウンロードするために、ファイル内の情報アイテムのサブセット、その組み合わせ、又は情報アイテムのフルセットを選択できるようになる。

ＨＥＶＣタイルが復号のために別のＨＥＶＣタイルに依存する場合、ISO/IEC 14496-15:2013 AMD 1の文献w14123, WD「Enhanced carriage of HEVC and support of MVC with depth information」MPEG 107 San Jose January 2014において記述されるように、その依存性が、タイプ「ｄｐｎｄ」（又は符号化依存性を示す任意の特定の４文字コード）のアイテム参照によって示されるべきである。

本明細書は、ＨＥＶＣタイルＮＡＬＵを、タイルの空間位置を示すサンプルグループ記述（「ＴｉｌｅＲｅｇｉｏｎＧｒｏｕｐＥｎｔｒｙ」記述子を使用する）と関連付けるためのツールを規定する。しかしながら、これらの記述子を再利用できるようにするメタデータ情報アイテムのためのサンプルグループ化に直接相当するものはない。

それゆえ、実施形態によれば、タイルごとにタイル記述アイテムが規定され、タイルは、以下に説明されるように、「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」ボックスの修正バージョンを用いて、その記述にリンクされる。

他の実施形態によれば、好ましくは一般的な方法において、１つのタイリング記述のみが与えられる。したがって、アイテムリストは、長くなりすぎない。

この設計は以下のようにすることができる。
−幾つかのアイテムが、サンプルグループに類似であるが、各アイテムタイプに特有であるメタデータの組を記述できるようにする。
−任意のアイテムの場合に、所与のタイプのアイテム参照のための１つのパラメーターを記述する能力を追加する。パラメーターは、その後、参照されるアイテムのタイプ（グループ化タイプに類似）に応じて解釈されることになる。

図６を参照しながら以下において説明されるように、情報アイテムのための記述メタデータのアップグレードが必要とされる場合がある。

ＩＳＯＢＭＦＦ規格によれば、サンプルグループ化機構は、以下のような「ｇｒｏｕｐｉｎｇ＿ｔｙｐｅ」パラメーターを有する２つのメインボックスに基づく。
−ボックス「ＳａｍｐｌｅＧｒｏｕｐＤｅｓｃｒｉｐｔｉｏｎＢｏｘ」は、特性のリスト（「ＳａｍｐｌｅＧｒｏｕｐＥｎｔｒｙ」のリスト）を規定するパラメーター「ｓｇｐｄ」を有する。
−ボックス「ＳａｍｐｌｅＴｏＧｒｏｕｐＢｏｘ」は、特性へのマッピングとともにサンプルグループのリストを規定するパラメーター「ｓｂｇｐ」を有する。

「ｇｒｏｕｐｉｎｇ＿ｔｙｐｅ」パラメーターは、サンプルグループのリストを特性のリストにリンクし、そのリスト内の１つの特性へのサンプルグループのマッピングは、ボックス「ＳａｍｐｌｅＴｏＧｒｏｕｐＢｏｘ」において指定される。

情報アイテムのために同じ機能を与えるために、情報アイテムグループのリスト及び特性のリストが記述されなければならない。また、情報アイテムの各グループを１つの特性にマッピングできるようにすべきである。

以下において、そのような記述メタデータを静止画像ファイルフォーマット内に埋め込むことができるようにする方法が説明される。言い換えると、記述子を画像アイテムにリンクする方法が説明される。ＨＥＶＣ静止画像ファイルフォーマットの場合の使用事例が説明される場合であっても、以下の特徴は、任意の種類の情報アイテムを付加的な記述メタデータに関連付けるためにＩＳＯ／ＩＥＣ１４４９６−１２のような他の規格において使用することができる。

実施形態によれば、図６に示されるような、「ｉｒｅｆ＿ｔｙｐｅ」６０４と呼ばれる新たなパラメーターを介して、各アイテムを１つの特性にリンクするために、パラメーター「ｉｎｆｅ」を有する既存の「ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＥｎｔｒｙ」ボックス６０１が、新たなバージョン番号（６０２及び６０３）で拡張される。これは、新たなボックスの作成を回避し、記述を短く保ちながら、改善することを可能にする。

ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＥｎｔｒｙボックスの元の規定が以下によって与えられる。

タイルピクチャをその記述にリンクする新たなバージョン作成は以下の通りとすることができる。

ボックス「ＳａｍｐｌｅＴｏＧｒｏｕｐＢｏｘ」により近い、他の実施形態によれば、４文字コード「ｉｉｎｆ」を伴うボックス「ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｏｘ」の規定が、例えば、このボックスの新たなバージョンを導入することによって、以下のように変更される。
現在のバージョン：

が

に変更される。

代替的には、グループが使用中であるか否かを知らせるために、現在のバージョンが：

に変更される。

「ｇｒｏｕｐ＿ｅｎｔｒｙ＿ｃｏｕｎｔ」パラメーターは、メディアファイル内の情報アイテムグループの数を規定する。情報アイテムのグループごとに、ｉｔｅｍ＿ＩＤ＝０から開始して、情報アイテムの数が示される。サンプルとは対照的に、情報アイテムが時間制約及び関係を有しないので、カプセル化モジュールは情報アイテム識別子を任意の順序において割り当てることができる。アイテムグループ後に増加する識別子番号を割り当てることによって、グループ内の連続した情報アイテム識別子の続きを識別するパラメーター「ｉｔｅｍ＿ｒｕｎ」を用いて、情報グループのリストをより効率的に表すことができる。

関連する情報アイテムは、例えば、「ｐｒｏｐｅｒｔｙ＿ｉｎｄｅｘ」と呼ばれるインデックスを有する。「ｇｒｏｕｐｉｎｇ＿ｔｙｐｅ」パラメーターに関連付けられるこの「ｐｒｏｐｅｒｔｙ＿ｉｎｄｅｘ」パラメーターによって、ファイルフォーマットパーサー（又は「リーダー」）が、記述メタデータへの参照、又は記述メタデータ自体を識別できるようになる。図７は、２つの例示的な実施形態を示す。

ボックス「ＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ」７０１内のグループ特徴は、ｆｒｏｍ＿ｉｔｅｍ＿ＩＤパラメーターの値のために一般に使用される情報アイテム識別（ｉｔｅｍ＿ＩＤ）の代わりに、グループ識別「ｇｒｏｕｐ＿ＩＤ」とともに使用することができる。設計によって、ボックス「ＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ」は、特定の種類又は特定のアイテムの全ての参照を見つけるのをより容易にする。それを「ｉｔｅｍ＿ＩＤ」の代わりに、「ｇｒｏｕｐ＿ＩＤ」とともに使用することは、特定のタイプの全ての参照を容易に識別するためにアイテムのグループを見つけるのを可能にする。有利には、カプセル化されたファイルあたり多くても１つのボックス「ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｏｘ」しか存在しないので、グループ識別を規定する必要はない。カプセル化モジュール（符号化中）及び構文解析モジュール（復号中）は、情報アイテムグループが作成されるか、又は読み出されるのに応じて情報アイテムグループのリスト上のそれぞれのカウンターを（ボックス「ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｏｘ」内の「ｇ」変数として）実行することができる。代替的には、パーサーは、フラグ「ｇｒｏｕｐ＿ｕｓｅｄ＿ｆｌａｇ」を用いて、グループ識別カウンターを維持するか否かを通知される場合がある。

情報アイテムの１つのグループがタイルピクチャに対応する例に戻ると、１つのグループは４つのエントリを含むことができ、参照７００「ＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅ」は、４つのタイルピクチャ情報アイテムが依存し、そして特定の参照タイプ７０３の場合の情報アイテムのリスト７０４を示すことができる。

他の例示的な実施形態によれば、情報アイテムは、後に説明されるような、新たな種類のボックス「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」において使用され、それは、１つのアイテム７２２から、種々の他の情報アイテム７２４への複数の参照タイプ７２３をリスト化することを可能にする。

後者の場合に、特定のボックス「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」７２１は、以下のように実現される場合がある。

標準的なボックス「ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｏｘ」の場合と同様に、アイテムエントリのリストが記述されるが、今度は、グループ化に応じて異なる順序を有する。タイルの例では、この結果として、「ｔｉｌｅ」と呼ばれる場合があるパラメーターとともに１つのグループ内に集められたタイルピクチャに対応する４つの情報アイテムの第１のグループと、それに続く、構成情報のための非グループ化情報アイテム、フルピクチャ情報アイテムのための非グループ化情報アイテム、そして任意選択でＥＸＩＦメタデータのための非グループ化情報アイテムとが生じる場合がある。

したがって、１つのボックスが変更され、１つのボックスが作成され、そのボックスは特定の種類のＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘである。以下において、この新たな種類のＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘが説明される。

ボックス「ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ」は、以下のように、ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘの一部であるボックス「ＦｕｌｌＢｏｘ」内のフラグパラメーターを使用することによって、種々の種類のＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘを区別することによって拡張することもできる。

ボックス「ＭｕｌｔｉｐｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ」７２１を使用するとき、４つのタイルを有する１つのピクチャは以下のように記述することができる。

この設計は、特定のアイテムから任意の種類の全ての参照を見つけるのを極めて容易にする。

所与のタイプ７１３を有する同じアイテム７１４を参照するアイテム７１２のリストのための記述サポート７１１は、以下の通りとすることができる。

４つのタイルを有するピクチャの例では、以下の通りとすることができる。

ボックス「ＳｈａｒｅｄＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ」の設計は、特定のアイテムを指している特定のタイプの全ての参照を見つけるのをより容易にする。これは、ボックス「ＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ」とは対照的である。しかし、トラック参照のために規定される「ｒｅｆｅｒｅｎｃｅ＿ｔｙｐｅ」の大部分は双方向ではないので、ボックス「ＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ」は、他のアイテムへのこの参照タイプを有する全てのノードに知らせるために、何らかの単方向参照タイプとともに使用されない場合がある。代替的には、それが直接参照であるか、逆参照であるかを示し、それにより、新たなＳｈａｒｅｄＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘの必要性を軽減するために、「ＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅ」内にフラグが設けられる場合がある。

上記のことを考慮して、情報アイテムをタイリング情報と関連付けることができる。このタイリング情報の説明が、ここで、提供されなければならない。

例えば、各タイルを、拡張「ＩｔｅｍＩｎｆｏＥｎｔｒｙ」６０１の「ｉｒｅｆ＿ｐａｒａｍｅｔｅｒ」６０５のような、タイル記述子を用いて記述することができる。特定の記述子は以下の通りとすることができる。

実施形態によれば、記憶されることになる１つ以上のピクチャに適用するために、タイルのグリッドのための記述子が使用される場合がある。

そのような記述子は以下の通りとすることができる。

この記述子「ＴｉｌｅＩｎｆｏＤａｔａＩｔｅｍ」は、タイリンググリッド（規則的又は不規則）を記述できるようにする。グリッドは、左上から始めて行ごとに記述される。

記述子は、タイプ「ｔｉｌｅ」のアイテムとして記憶されるべきである。別のアイテムがこのアイテムを参照するとき、それは、この記述へのタイプ「ｔｉｌｅ」の参照を使用すべきであり、指定されたパラメーター「ｉｒｅｆ＿ｐａｒａｍｅｔｅｒ」を有するべきであり、そのパラメーターの値は、記述子によって規定されるグリッド内のセルの０ベースのインデックスであり、ただし、０は左上のアイテムであり、１はセル０の右隣にあるセルであり、それ以降も同様である。

この記述子において：
−「ｖｅｒｓｉｏｎ」は、ＴｉｌｅＩｎｆｏＤａｔａＩｔｅｍのための構文のバージョンを示す。値０のみが規定される。
−「ｒｅｇｕｌａｒ＿ｓｐａｃｉｎｇ」は、グリッド内の全てのタイルが同じ幅及び同じ高さを有するかを示す。
−「ｒｅｆｅｒｅｎｃｅ＿ｗｉｄｔｈ、ｒｅｆｅｒｅｎｃｅ＿ｈｅｉｇｈｔ」は、グリッドが記述される単位を指示する。これらの単位は、このアイテムを参照する画像のピクセル解像度に一致しても、一致しなくてもよい。グリッドが規則的である場合には、「ｒｅｆｅｒｅｎｃｅ＿ｗｉｄｔｈ」（又は「ｒｅｆｅｒｅｎｃｅ＿ｈｅｉｇｈｔ」）は、「ｎｂ＿ｃｅｌｌ＿ｈｏｒｉｚ」（又は「ｎｂ＿ｃｅｌｌ＿ｖｅｒｔ」）の倍数とすべきである。
−「ｃｅｌｌ＿ｗｉｄｔｈ」は、左から始めて、不規則なタイル内のグリッドの水平方向の分割を与える。
−「ｃｅｌｌ＿ｈｅｉｇｈｔ」は、上から始めて、不規則なタイル内のグリッドの垂直方向の分割を与える。
上記の手法は、全てのタイルのためのタイリング情報を共有することを可能にする。

さらに、同じタイリングを共有する複数のピクチャが存在する場合、タイルのグリッド内のセルを単に参照することによって、更に多くの記述が共有される場合がある。

タイリング構成は、メディアデータボックス内に入れることができるか、又はタイル情報アイテム間で（参照により）共有される専用ボックス内に入れることができる。

上記の記述子は、それらの記述子が、より大きな画像内のサブ画像（複数の場合もある）のための空間的な場所及びサイズのみを与えるという意味において純粋な空間記述子である。幾つかの使用事例において、例えば、画像収集又は画像合成の場合、空間的な場所は、典型的には画像が重なり合うときに、画像を記述するのに十分ではない。これは、上記のＴｉｌｅＩｎｆｏＤａｔａＢｌｏｃｋ記述子の１つの限界である。どのような画像でも、すなわち、タイル又は独立した／完全な画像でも、画像を構成できるようにするために、一方において、画像の位置及びサイズ（空間的関係）を含み、他方において、そのピクチャのための表示情報（色、クロッピング...）を含む記述子を規定することが有用な場合がある。例えば、表示のためにサブ画像を或る色空間から別の色空間に変換するために色情報を与えることができる。この種の情報は、ＩＳＯＢＭＦＦのＣｏｌｏｒＩｎｆｏｒｍａｔｉｏｎＢｏｘ「ｃｏｌｒ」において搬送することができる。コンパクトにするために、２つの異なるそのように変換されたピクチャを搬送するのではなく、適用すべき変換パラメーターだけを与えることによって、異なる種類の表示のために準備された同じデータを有することが有用な可能性がある。さらに、各ピクチャの符号化された幅及び高さと異なる可能性がある幅及び高さを再規定するために、この記述子内にＩＳＯＢＭＦＦパート１２において規定されるＰｉｘｅｌＡｓｐｅｃｔＲａｔｉｏボックス「ｐａｓｐ」のようなピクセルアスペクト比を入れることができる。これは、画像の復号後にディスプレイによって適用すべき縮尺比を示すことになる。その際、ビデオサンプルエントリ（例えば、「ｓｔｓｄ」ボックス）内に記憶される符号化されたサイズと、「ｐａｓｐ」ボックスから推測される表示サイズとを有することになる。表示のための別の取り得る情報は、同じくＩＳＯＢＭＦＦにおいて規定されるクリーンアパーチャ情報ボックス「ｃｌａｐ」とすることができる。規格ＳＭＰＴＥ２７４Ｍによれば、クリーンアパーチャは、ピクチャ情報が全てのエッジ過渡歪み（アナログ／デジタル変換後の画像の境界において起こり得るリンギング効果）によって本質的に汚染されていないエリアを画定する。表示のために有用なパラメーターのこのリストは、限定するものではなく、サブ画像記述子内のオプションの構成要素として、任意の他の記述メタデータボックスを置くことができる。それらは既に規格の一部であり、画像クロッピング、サンプルアスペクト比変更及び色調整を示す汎用ツールを提供するので、これらのパラメーターは明示的に言及することができる。残念なことに、それらの使用は、メディアトラックの場合にのみ可能であり、「メタ」ボックスに頼る画像ファイルフォーマットの場合には不可能であった。それゆえ、クリーンアパーチャ又はサンプルアスペクト比のような他の特性とともに、画像アイテムの空間記述をサポートするために、例えば、「ＳｉｍｐｌｅＩｍａｇｅＭｅｔａＤａｔａ」と呼ばれる新たな記述子を提案する。これは、より大きな画像内に構成されるか、又は逆に、より大きな画像から抽出されることを意図した任意のサブ画像（タイル又は独立した画像）に当てはまる：

又は、（例えば、ｅｘｔｒａ＿ｂｏｘｅｓを通して）表示プロセスを助けるために拡張パラメーターを考えるときのその変形は以下の通りである：

ここで、ＩｍａｇｅＳｐａｔｉａｌＲｅｌａｔｉｏｎＢｏｘは以下において説明されるようなＴｉｌｅＩｎｆｏＤａｔａＢｌｏｃｋの拡張である。考慮すべき別の有用なパラメーターは、画像をレイヤとして構成する可能性である。それゆえ、そのようなレイヤ化された構成において画像に関連付けられるレベルを示すパラメーターを挿入することを提案する。これは通常、画像が重なり合うときに有用である。これは、例えば、「ｌａｙｅｒ」と呼ぶことができ、レイヤ情報指示を伴う。そのような記述子のための例示的な構文が与えられる。
定義：
ボックスタイプ：「ｉｓｒｅ」
コンテナー：単純画像メタデータアイテム（「ｓｉｍｄ」）
必須：非必須
量：アイテムあたり０又は１
構文：

関連付けられる意味：
ｈｏｒｉｚｏｎｔａｌ＿ｄｉｓｐｌａｙ＿ｏｆｆｓｅｔは画像の水平オフセットを指定する。
ｖｅｒｔｉｃａｌ＿ｄｉｓｐｌａｙ＿ｏｆｆｓｅｔは画像の垂直オフセットを指定する。
ｄｉｓｐｌａｙ＿ｗｉｄｔｈは画像の幅を指定する。
ｄｉｓｐｌａｙ＿ｈｅｉｇｈｔは画像の高さを指定する。
ｌａｙｅｒは画像の前から後への順序付けを指定する。小さい番号の画像ほど視認者に近く、０は標準値であり、−１はレイヤ０の前方にあり、他も同様である。

この新たな「ｉｓｒｅ」ボックスタイプは、画像集合体内の１つの画像と他の画像との相対位置を記述する能力を与える。それは、ムービー又はメディアファイルのトラックヘッダーボックスにおいて一般に見られる変換行列の機能のサブセットを与える。ＩｍａｇｅＳｐａｔｉａｌＲｅｌａｔｉｏｎＢｏｘ内の座標が、集合体の作者の意図したディスプレイサイズを与える正方形グリッド上に表される。これらの単位は、画像の符号化サイズに一致しても、一致しなくてもよい。意図したディスプレイサイズは以下によって画定される。
−水平方向：全ての「ｉｓｒｅ」ボックスの場合の（ｈｏｒｉｚｏｎｔａｌ＿ｄｉｓｐｌａｙ＿ｏｆｆｓｅｔ＋ｄｉｓｐｌａｙ＿ｗｉｄｔｈ）の最大値。
−垂直方向：全ての「ｉｓｒｅ」ボックスの場合の（ｖｅｒｔｉｃａｌ＿ｄｉｓｐｌａｙ＿ｏｆｆｓｅｔ＋ｄｉｓｐｌａｙ＿ｈｅｉｇｈｔ）の最大値。

幾つかの画像が、関連付けられるいかなる「ｉｓｒｅ」も有せず、一方、ファイル内の他の画像が関連付けられる「ｉｓｒｅ」を有するとき、いかなる「ｉｓｒｅ」も有しないデフォルト画像が、その水平及び垂直オフセットが０であり、そのディスプレイサイズが意図したディスプレイサイズであり、そのレイヤが０であるかのように扱われることになる。

ＩｍａｇｅＳｐａｔｉａｌＲｅｌａｔｉｏｎＢｏｘは、画像に任意のクロッピング又はサンプルアスペクト比が適用された後の画像の相対的な空間位置を示す。これは、「ｉｓｒｅ」がＳｉｍｐｌｅＩｍａｇｅＭｅｔａＤａｔａ内の「ｐａｓｐ」等と組み合わせられるときに、画像が復号され、存在する場合、「ｐａｓｐ」、「ｃｌａｐ」、「ｃｏｌｒ」が適用され、その後、画像が、「ｉｓｒｅ」ボックス内で宣言されるオフセット及びサイズだけ動かされ、拡大縮小される。

画像を表すアイテム情報と、記述子を表すアイテム情報との間の関連付けを規定することによって、この新たな記述子を画像（タイル又は単一の画像）の記述として使用することができる（ＳｉｍｐｌｅＩｍａｇｅＭｅｔａｄａｔａＤｅｆｉｎｉｔｉｏｎのためにタイプ「ｓｉｍｄ」を与えることにし、現在処理しているメタデータの種類をｍｐ４パーサーが容易に識別するために、任意の反転した４文字コードが許容可能になる）。この関連付けは、ＩｔｅｍＲｅｆｅｒｅｒｅｎｃｅＢｏｘと、「空間画像関係」を示す新たな参照タイプ；「ｓｉｍｒ」とを用いて行われる。以下の例示的な説明は、構成自体は関連付けられるアイテムを有しない４つの画像の構成の事例を示す。各画像アイテムは、タイプ「ｓｉｍｒ」のアイテム参照を通して、ＳｉｍｐｌｅＩｍａｇｅＭｅｔａＤａｔａアイテムに関連付けられ、専用「ｈｖｃＣ」アイテム内のＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄ情報を共有する。

データの上記の編成が一例として与えられる。例えば、単一のバイト範囲としてアドレス指定可能な画像＋そのメタデータを有するように、画像及びメタデータをメディアデータボックス内で組み合わせることができる。この記述を受信するとき、パーサーは、「ｓｉｍｄ」アイテム内の情報を構文解析することによって、サブ画像がフルピクチャからクロッピングされたか否か、又は逆に、フルピクチャがサブ画像からの構成であるか否かを通知される。クロップの場合、フルピクチャアイテム及びクロッピングされた画像は、以下の例の場合と同じデータ範囲と、同じ復号器構成情報とを共有することになる。その後、サブ画像は、「ｃｌａｐ」情報のみを有し、位置決めを、それゆえ、「ｉｓｒｅ」を有しない「ｓｉｍｄ」アイテムに関連付けられることになる。

構成の場合：そのような場合には、フルピクチャアイテムは「ｉｓｒｅ」情報のみを含む「ｓｉｍｄ」アイテムに関連付けられ、サブ画像は、フル画像においてその位置を反映する「ｓｉｍｄ」アイテムに関連付けられることになる。

以下の例は、４つの画像がより大きな１つの画像に構成される事例を示す。構成された１つの画像を含む、全ての画像が、提案される記述子を用いて、再生可能アイテムとして並べられる。

この他の例は、フルピクチャが実際にはタイリングされたＨＥＶＣピクチャ（４タイル）である事例を示す。

使用事例によっては、例えば、全ての画像に同じクロッピングが適用されることになるときに、同じメタデータを共有する幾つかの画像アイテムを有することができるであろう。また、例えば、クロッピングが画像間で共有されるが、空間情報間で共有されないとき、画像アイテムが異なるＳｉｍｐｌｅＩｍａｇｅＭｅｔａＤａｔａへの複数の「ｓｉｍｒ」参照を有することもできる。

ＩｔｅｍＩｎｆｏＥｎｔｒｙ（図６に示される）の新たなバージョンに対する代替の実施形態は、情報アイテムエントリ及び参照あたり２つ以上のパラメーター６０５を規定することである。図６の実施形態において、ｉｒｅｆ＿ｐａｒａｍｅｔｅｒは４バイトコードであり、それはタイルインデックスの場合にタイリンググリッド内のセルを参照するのに有用である。しかし、より豊富な記述を有するために、そして、リンクされた記述を、データとともに（ｍｄａｔボックス内）ではなく、アイテムインフォエントリ自体の内部に埋め込むことができるようにするために、以下の拡張が有用な可能性がある。

上記の拡張において、
−ｉｔｅｍ＿ｉｒｅｆ＿ｐａｒａｍｅｔｅｒ＿ｃｏｕｎｔは、それに関するパラメーターが与えられる参照タイプの数を与える。これは、図６のアイテム６０５に対して変更されない。
−ｉｒｅｆ＿ｔｙｐｅは、それに関するパラメーターがこのアイテムの場合に当てはまる、「ｉｒｅｆ」ボックスにおいて示されるような参照タイプを与える。これは、図６のアイテム６０５に対して変更されない。
−ｐａｒａｍｅｔｅｒは、ここでは、新たなボックスＩｔｅｍＲｅｆｅｒｅｎｃｅＰａｒａｍｅｔｅｒＥｎｔｒｙを介して拡張手段を与えるので、ｉｒｅｆ＿ｐａｒａｍｅｔｅｒ（図６のアイテム６０５）とは異なる。この新たなボックスを（タイリング構成においてタイルインデックスのためのＴｉｌｅＩｎｄｅｘＩｔｅｍＲｅｆｅｒｅｎｃｅＰａｒａｍｅｔｅｒＥｎｔｒｙを用いて上記で行われたように）特殊化することによって、カプセル化及び構文解析モジュールがこの特殊化されたボックスの構造を認識している場合には、任意の種類の付加メタデータを情報アイテムエントリに関連付けることができる。これは、ＩｔｅｍＲｅｆｅｒｅｎｃｅＰａｒａｍｅｔｅｒＥｎｔｒｙの標準的なタイプによって、又は構成によって、若しくはネゴシエーションステップにおいて、パラメーターエントリの構造を与えることによって行うことができる。パラメーターの意味は、タイプｉｒｅｆ＿ｔｙｐｅを有するアイテムの意味によって与えられる。

以下において、４つのタイルを有するピクチャを記述する情報アイテムのための例示的な記述メタデータと、フルピクチャのＥＸＩＦメタデータとが与えられる。

従来技術において、タイルピクチャは、本明細書において以下に示されるように、いかなる対応する記述も与えられることなく、情報アイテムとしてリスト化された。さらに、「ｈｖｃＣ」タイプで表されるセットアップ情報は、アイテムとして記述されなかった。これは、全てのタイルピクチャ及びフルピクチャに当てはまるＨＥＶＣパラメーターセット及びＳＥＩメッセージに関連する共通データを分解（factorize）することを可能にする。

ＩｔｅｍＩｎｆｏＥｎｔｒｙボックス６０１のバージョン４（図６、６０２、６０３を参照）を伴う拡張を使用する実施形態によれば、タイルピクチャ情報は、情報アイテム（ＩＤ＝８）としても記述されるタイリング構成のパートへの関連付けられる参照とともにリスト化される。

図８は、本発明の実施形態の実施態様の状況を示す。第１の異なるメディア、すなわち、例えば、ステップ８００ａ中のオーディオ、ステップ８００ｂ中のビデオ及びステップ８００ｃ中の１つ以上のピクチャが記録される。各メディアはそれぞれのステップ８０１ａ、８０１ｂ及び８０１ｃ中に圧縮される。これらの圧縮ステップ中にエレメンタリストリーム８０２ａ、８０２ｂ及び８０２ｃが生成される。次に、アプリケーションレベル（グラフィカルユーザーインターフェースからのユーザー選択、マルチメディア生成システムの構成等）において、これら全てのエレメンタリストリームを融合させるべきか否かを判断するために、カプセル化モードが選択される。「融合」モードが起動される場合（テスト８０３、「ｙｅｓ」）、本明細書において上記で説明されたように、ステップ８０６ｃ中に、オーディオ、ビデオ及び静止画像のためのデータが同じファイル内にカプセル化される。「融合」モードが起動されない場合（テスト８０３、「ｎｏ」）、ステップ８０６ａ及びステップ８０６ｂ中に２つのカプセル化されたファイルが順次に、又は同時に生成され、それにより、結果として、ステップ８０７ａ中に同期した時間メディアデータのための１つのファイルと、静止画像８０７ｂのみを有する付加的なファイルとがそれぞれ生成される。タイル記述と、対象領域特徴とを与えるために、ステップ８０６ａ中に、ＩＳＯＢＭＦＦ規格に従って、オーディオ及びビデオエレメンタリストリームがカプセル化され、静止ピクチャが、本明細書において上記で説明されたように、ステップ８０６ｂ中にカプセル化される。最後に、メディアプレゼンテーション８０７が取得され、全体として、又は記述メタデータを構文解析することによって、幾つかのパート（タイル等）が抽出された後に、ストリーミング用に準備するためにＤＡＳＨ発生器に与えることができるか（ステップ８２０ａ）、メモリに記憶することができるか（ステップ８２０ｂ）、ディスプレイユニット上に描画することができるか（ステップ８２０ｃ）又はリモートエンティティに送信することができる（ステップ８２０ｄ）。

実施形態の先行する説明によれば、例えば、ＳｉｍｐｌｅＩｍａｇｅＭｅｔａｄａｔａ（「ｓｉｍｄ」）ボックスのような記述メタデータ（静止画像ファイルフォーマット仕様の最終バージョンにおいてＩＳＯＢＭＦＦＭｅｔａＤａｔａとも呼ばれる）が、全ての属性を備えたアイテムとして記述されることに留意されたい。付加的な記述メタデータ又は規範メタデータも、文献w14878、ISO/IEC23008-12:2013第１版の委員会草稿論文「Information technology - MPEG systems technologies - Part 12: Image File Format」MPEG 110 Strasbourg October 2014において記述されるように、静止画像ファイルフォーマット仕様によって規定される。記述メタデータ又は規範メタデータの例は、ＣｌｅａｎＡｐｅｒｔｕｒｅＢｏｘ（「ｃｌａｐ」）、ＩｍａｇｅＲｏｔａｔｉｏｎ（「ｉｒｏｔ」）、ＥｘｉｆＤａｔａＢｌｏｃｋ（「ｅｘｉｆ」）又はＩｍａｇｅＯｖｅｒｌａｙ（「ｉｏｖｌ」）である。より一般的には、記述メタデータは、画像又はサブ画像のようなアイテムのための付加情報又は記述を提供するメタデータ（例えば、Ｅｘｉｆメタデータ）であり、規範メタデータは、アイテムに適用されるべき演算又は変換（例えば、回転、クロップ、又は変換演算子を形成する幾つかのアイテムの組み合わせ）である。

しかしながら、そのような記述メタデータ又は規範メタデータを仕様書内に全ての属性を備えたアイテムとして記憶しなければならないことはかなり厄介であるように見える場合がある。これらはまさに擬似アイテムであり、記述メタデータ又は規範メタデータはｍｄａｔボックス１１０内に符号化データとともに記憶される必要があり、ｉｔｅｍＬｏｃａｔｉｏｎＢｏｘ（ｉｌｏｃ）１０９、ｉｔｅｍＩｎｆｏＢｏｘ（ｉｉｎｆ）及びｉｔｅｍＰｒｏｔｅｃｔｉｏｎＢｏｘ（ｉｐｒｏ）内のエントリを規定する必要がある。このためにｉｌｏｃ、ｉｉｎｆ及びｉｐｒｏ内のこれらのエントリを必要とすることは、かなりのオーバーヘッドである。例えば、ｉｔｅｍＩｎｆｏＢｏｘ内のエントリは、少なくとも１２バイトヘッダーを伴うフルボックスの使用を必要とし、さらに、ｉｔｅｍＩｎｆｏＢｏｘ（ｉｉｎｆ）内のエントリあたり全部で１５バイトの追加消費のために、ｉｔｅｍ＿ｐｒｏｔｅｃｔｉｏｎ＿ｉｎｄｅｘ（１６ビット）＋空のｉｔｅｍ＿ｎａｍｅ（８ビット）が規定されなければならない。ｉｔｅｍＬｏｃａｔｉｏｎＢｏｘ（ｉｌｏｃ）内のエントリも、より良好な事例において少なくとも９バイトを必要とする（ｂａｓｅ＿ｏｆｆｓｅｔ＿ｓｉｚｅ＝ｏｆｆｓｅｔ＿ｓｉｚｅ＝ｌｅｎｇｔｈ＿ｓｉｚｅ＝１，１ｅｘｔｅｎｔ）。実際には、ｉｔｅｍＬｏｃａｔｉｏｎＢｏｘエントリは、ｂａｓｅ＿ｏｆｆｓｅｔ＿ｓｉｚｅ＝ｏｆｆｓｅｔ＿ｓｉｚｅ＝ｌｅｎｇｔｈ＿ｓｉｚｅ＝２又は４とともに使用され、それは１２又は１８バイトの追加消費を意味する。さらに、このメタデータは一般に小さく、他のアイテムを効率的に読み出すことを可能にする。それらを専用アイテムとして記憶していることは、ファイル構文解析、特にファイルの部分的なフェッチングを複雑にする場合がある（例えば、ＨＴＴＰ要求の増大）。

代替の実施形態では、全ての記述メタデータ及び規範メタデータは、埋込アイテムとして規定することができ、そのアイテムは、ｍｄａｔボックス１１０内ではなく、メタボックス１００内に他のボックスの一部として記憶することができ、それゆえ、ｉｔｅｍＩｎｆｏＢｏｘ及びｉｔｅｍＬｏｃａｔｉｏｎＢｏｘエントリを規定する追加消費を回避することができる。

記述メタデータ及び規範メタデータをメタボックス内に記憶するために、「ＶｉｒｔｕａｌＩｔｅｍＢｏｘ」と呼ばれる仮想アイテムボックスが規定される。この実施形態によれば、全ての記述メタデータボックス及び規範メタデータボックスは、この仮想アイテムクラスから受け継がれる。

仮想アイテムは、ボックスの組とともに、それに割り当てられたｉｔｅｍ＿ＩＤ及びｉｔｅｍ＿ｔｙｐｅを有する。仮想アイテムは、他のアイテムと関連付けられることになるメタデータを記述するために通常使用される付加データである。例えば、仮想アイテムは、アイテム（画像又はサブ画像）を識別するｉｔｅｍＩｎｆｏＢｏｘのエントリと、このアイテムに適用されることになる演算又は変換とを関連付けることができるようにする。通常、この関連付けは、画像のｉｔｅｍ＿ＩＤから、メタデータ演算又は変換記述ボックスのｉｔｅｍ＿ＩＤへのｉｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ内のタイプ「ｓｉｍｒ」のエントリを規定することによって記述することができる。仮想アイテムは、アイテム参照ボックス及びプライマリアイテムボックスにおいてのみ参照される場合があり、任意の他のボックス（例えば、ｉｔｅｍＬｏｃａｔｉｏｎＢｏｘ（ｉｌｏｃ）、ｉｔｅｍＩｎｆｏＢｏｘ（ｉｉｎｆ）、ｉｔｅｍＰｒｏｔｅｃｔｉｏｎＢｏｘ（ｉｐｒｏ））内で宣言又は参照されるべきでない。「ＶｉｒｔｕａｌＩｔｅｍＢｏｘ」は以下のように規定される。

そのパラメーターに関して以下の意味を有する。
−ｉｔｅｍ＿ＩＤ：このアイテムのＩＤ（又は識別子）。ｉｉｎｆ、ｉｌｏｃ又はｉｐｒｏ内にｉｔｅｍ＿ＩＤ値が同じであるエントリを有することは違反である。
−ｉｔｅｍ＿ｔｙｐｅは、「ｍｉｍｅ」のような規定された有効なアイテムタイプ指示子である３２ビット値、通常、４つの印刷可能文字である。

任意選択では、一変形形態において、「ＶｉｒｔｕａｌＩｔｅｍＢｏｘ」は、「ｄｅｓｃｒｉｐｔｏｒ＿ｆａｍｉｌｙ」と呼ばれる付加的なパラメーターを含むこともできる。記述子ファミリは、メタデータボックスが記述メタデータであるか、規範メタデータであるかを示す。一変形形態において、記述子ファミリは、所定の値のリストからのメタデータボックスのタイプを示す。例えば：ｔｒａｎｓｆｏ＿ｏｐｅｒａｔｏｒ、ｃｏｍｐｏｓｅｄ＿ｉｍａｇｅ、ｄｅｓｃｒｉｐｔｉｖｅ＿ｍｅｔａｄａｔａ．．．。

この仮想アイテムボックスから受け継ぐことによって、ｉｔｅｍＩｎｆｏＢｏｘ（ｉｉｎｆ）及びｉｔｅｍＬｏｃａｔｉｏｎＢｏｘ（ｉｌｏｃ）内の関連付けられるエントリを規定する必要なく、全ての記述メタデータボックス及び規範メタデータボックスをメタボックス内に記憶することができるが、それでも、アイテム参照ボックスによってアドレス指定可能であるという利点は保持される。

この実施形態によれば、ＩｍａｇｅＯｖｅｒｌａｙ（ｉｏｖｌ）、ＳｕｂＳａｍｐｌｅＩｔｅｍＤａｔａ（ｓｕｂｓ）、ＡｕｘｉｌｉａｒｙＣｏｎｆｉｇｕｒａｔｉｏｎ（ａｕｘＣ）、ＥｘｉｆＤａｔａＢｌｏｃｋ（ｅｘｉｆ）、ＳｉｍｐｌｅＩｍａｇｅＭｅｔａｄａｔａ（ｓｉｍｄ）及び派生画像アイテムが、仮想アイテムクラスから受け継いでいる。

それでも、この実施形態によれば、タイプ「ｓｉｍｄ」のアイテムへのタイプ「ｓｉｍｒ」のアイテム参照とともに、「ｄｉｍｇ」と呼ばれる単一の汎用アイテムタイプが導入される。この手法によれば、適切なときには特性を再利用できるようになり、アイテム及びアイテム参照の数が削減される。ＩｍａｇｅＲｏｔａｔｉｏｎＢｏｘは、ＳｉｍｐｌｅＩｍａｇｅＭｅｔａｄａｔａ（ｓｉｍｄ）の中に加えられる。「ｓｉｍｒ」参照タイプは、画像記述メタデータへの直接アクセスを提供するために、画像アイテムから「ｓｉｍｄ」アイテムに向かうリンクを規定する。

さらに、ＩｍａｇｅＯｖｅｒｌａｙ（ｉｏｖｌ）メタデータボックスは、もはや参照順に依存しないように、以下のように再設計される。

ｅｘｐｌｉｃｉｔｉｔｅｍ＿ｉｄは、構成されるアイテムを明確に識別するためにループ内のエントリごとに加えられる。

代替の実施形態において、ＳｉｍｐｌｅＩｍａｇｅＭｅｔａｄａｔａ（ｓｉｍｄ）に含まれる全てのボックスが、仮想アイテムボックスから受け継がれた独立したメタデータボックスとして規定される。

代替の実施形態において、以下のように、画像メタデータ記述子ＳｉｍｐｌｅＩｍａｇｅＭｅｔａｄａｔａ（「ｓｉｍｄ」）ボックス（静止画像ファイルフォーマット仕様の最終バージョンにおいてＩＳＯＢＭＦＦＭｅｔａＤａｔａとも呼ばれる）内に回転演算を直接組み込むことによって、簡単な画像回転を宣言することができる。

回転ボックスは「ｉｒｏｔ」アイテムよりわずかに大きいが（１２バイト）、一連の派生アイテムではなく、１つの「ｓｉｍｄ」しか必要とされないので、この手法を使用する利点は、回転及びクリーンアパーチャのような、変換を組み合わせるときに明らかである。

そのような場合には、汎用の派生アイテム「ｄｉｍｇ」（上記）を用いて、画像アイテム及びメタデータ記述の両方を参照することができる。そのようなアイテムは、その際、ＰｒｉｍａｒｙＩｔｅｍＢｏｘ（「ｐｉｔｍ」）内にプライマリアイテムとしてリスト化することができる。

この手法の別の利点は、作者が、回転したアイテムのみを表示してほしいということを明確に示すことができることである。

以下の段落は、上記の実施形態に対する代替形態を提案する。この代替形態は、有利には、ＩＳＯ静止画像ファイルフォーマットの画像に変換（又は「効果」）をいかに適用できるかに関して簡単である。詳細には、この代替の実施形態によって以下の問題が解決される。
−アイテム参照の数が多い。
−効果を次々につなげるときにアイテムの数が増える。
−画像の組又は対象領域のような画像の部分を意味する、アイテムの所与の組のための効果を相互的にできない。

アイテムの異なるエクステント（データパート内のバイトオフセットを意味する）として効果を相互的にするために既存の解決策が提案された。より詳細には、エクステントは、派生画像がｉｔｅｍＬｏｃａｔｉｏｎＢｏｘ（「ｉｌｏｃ」）内のエクステントのリストとして記述されることを意味し、各エクステントはデータパート（「ｍｄａｔ」）のフラグメントを識別し、各フラグメントは、１つ以上の記述メタデータ又は規範メタデータ又は変換メタデータに対応する。

しかし、この解決策には幾つかの短所が内在する。
−カプセル化された画像ファイルの作成が極めて複雑になる。すなわち、１つの派生画像アイテム内の１つの効果に触ることは、全ての派生画像が同じエクステントを共有するか否かを調べるためにそれらの画像を検査し、潜在的には、その一部を書き換えることを意味する。
−画像ファイルリーダーが、一連の変換／効果がそのファイル内の異なるアイテム上で同じであるか否かを（直接シグナリングすることなく）解明する必要があるので、構文解析もそれほど簡単ではない。
−新たな変換／効果が、適用すべき一連の変換／効果内の変換／効果とともに絶えず記憶されないときにはいつでも、変換／効果ごとに、ｉｔｅｍＬｏｃａｔｉｏｎＢｏｘ（「ｉｌｏｃ」）において新たなエクステントが必要とされることになる。さらに、効果の組み合わせ又は連鎖は、データパート内に隣接するエクステント上に記憶されないときに犠牲が大きい場合がある。

さらに、そのタイプを理解するために（これまで、効果のタイプはｉｔｅｍ＿ｔｙｐｅによって与えられた）、これらの解決策は、記憶の実施を必要とし、それは、効果を記憶するためのボックスの作成を伴う。効果のための新たなボックスフォーマットを規定することによって、より簡単な解決策は、アイテムから別々に効果を規定し、いかなる追加消費も生じることなく、アイテムと効果との間の直接マッピングを有することである。

代替の実施形態は、ファイルフォーマット内に明確な分離を有することによって、効果の取り扱いを簡単にすることを提案する。
−記述メタデータとリンクされる正規のアイテム（画像又は画像の一部（例えば、ｈｖｃ１、．．．）（上記で提案されたように、「ｉｎｉｔ」又は「ｓｉｍｒ」参照タイプを通して、又は記述メタデータを記述する任意の参照タイプを通して）。
−「派生画像」アイテムからソースアイテムへの「ｄｉｍｇ」アイテム参照を通して識別される１つ以上のソースアイテム（画像又は画像の一部）に適用される効果（又は変換）の集合体である「派生画像」。
−幾つかの異なる効果の集合体を含む、変換／効果を表す構造。

この代替の実施形態の利点は、
−効果の再利用可能性：一度だけ宣言され、潜在的には複数回参照される。
−効果の集合体を規定することによる、よりコンパクトな記述（それに関して以下に更に説明される）。
−ｉｔｅｍＬｏｃａｔｉｏｎＢｏｘの新たなエクステントが必要とされないことを含む、全体的な可読性。
−アイテム参照の数が少ないままである。

この代替の実施形態によれば、新たな単一の派生アイテムが、アイテムタイプ「ｄｉｍｇ」とともに規定される。この単一の派生アイテムは具体的には以下によって表される。

ただし、ｎｂ＿ｅｆｆｅｃｔｓは、派生画像を構成するためにソース画像に適用されることになる効果の数を表し、ｅｆｆｅｃｔ＿ｉｄは、適用すべき効果のカプセル化されたファイル内の固有識別子である。効果は、効果のリスト内の出現の逆の順序において適用される。

「ＤｅｒｉｖｅｄＩｍａｇｅ」と呼ばれる派生画像又は変換済みアイテムは、画像を、例えば、ユーザー又は表示画面に提示する前にソース画像に適用されることになる効果の組と定義する。ソース画像は、派生アイテムからソース画像へのタイプ「ｄｉｍｇ」のアイテム参照（又は任意の反転した参照タイプ）によって識別される。ソース画像自体は、ＩＳＯ静止画像ファイルフォーマット仕様において規定される任意の画像アイテム（画像又は画像の一部、画像オーバーレイ、派生画像）とすることができる。同じアイテムからの２つ以上の「ｄｉｍｇ」アイテム参照は存在すべきでない（しかし、このアイテムが種々の構成のために何度も再利用される場合には、同じアイテムに関する複数の「ｄｉｍｇ」アイテム参照が存在する可能性がある）。
派生画像はファイルのデータパート内に記憶される。

カプセル化されたファイルを編集する、例えば、画像ファイルから効果を除去されるとき、この効果への全ての参照が、派生画像から除去されるべきである。

効果は、ＤｅｒｉｖｅｄＩｍａｇｅアイテムを通して、画像、画像の一部、構成された画像又は派生画像に適用することができる。各効果は、以下に示されるＢａｓｅＥｆｆｅｃｔＢｏｘ構造から派生するボックスによって記述される。

ただし、以下の意味を有する：
ｅｆｆｅｃｔ＿ｔｙｐｅは、このクラスから派生する効果のボックスタイプであり、固有の４文字コードがこの種のボックスを識別する。
ｅｆｆｅｃｔ＿ｉｄは、所与の効果又は変換のための固有識別子である。この識別子は「メタ」ボックス内で固有にすべきである。
ｎｂ＿ｂｉｔｓ＿ｅｆｆｅｃｔは、バージョン値から導出され、ｅｆｆｅｃｔ＿ｉｄを表すために使用されるビット数を示す。

効果は、「メタ」ボックスに含まれるオプションのＥｆｆｅｃｔＤｅｃｌａｒａｔｉｏｎＢｏｘにおいて宣言することができる。
ボックスタイプ：「ｅｆｆｄ」
コンテナー：ｍｅｔａ
必須：非必須
量：０又は１

例えば、以下の効果が規定される場合がある（限定的なリストではない）。
−回転効果：回転効果は、９０度の単位において反時計回りの方向にソース画像を変換する。
ボックスタイプ：「ｅｒｏｔ」
コンテナー：ｅｆｆｄ
必須：非必須
量：０以上

その意味は：
ａｎｇｌｅ^＊９０：それは角度の単位において角度（反時計回りの方向）を指定する。
−クリーンアパーチャ効果：クリーンアパーチャ効果は、ソース画像の可視部分を変更する。
ボックスタイプ：「ｅｃｌａ」
コンテナー：ｅｆｆｄ
必須：非必須
量：０以上

その意味は：
ｎｂ＿ｂｉｔｓ＿ｅｆｆｅｃｔは、親クラスＢａｓｅＥｆｆｅｃｔＢｏｘから派生し、ＣｌｅａｎＡｐｅｒｔｕｒｅＥｆｆｅｃｔＢｏｘの異なるフィールドを表すために使用されるビット数を示す。
ｈＳｐａｃｉｎｇ、ｖＳｐａｃｉｎｇ：ピクセルの相対的な幅及び高さを規定する。
ｃｌｅａｎＡｐｅｒｔｕｒｅＷｉｄｔｈＮ、ｃｌｅａｎＡｐｅｒｔｕｒｅＷｉｄｔｈＤ：画像のカウントされたピクセル内の厳密なクリーンアパーチャ幅を規定する分数である。
ｃｌｅａｎＡｐｅｒｔｕｒｅＨｅｉｇｈｔＮ、ｃｌｅａｎＡｐｅｒｔｕｒｅＨｅｉｇｈｔＤ：画像のカウントされたピクセル内の厳密なクリーンアパーチャ高を規定する分数である。
ｈｏｒｉｚＯｆｆＮ、ｈｏｒｉｚＯｆｆＤ：クリーンアパーチャ中心−（幅−１）／２（通常０）の水平オフセットを規定する分数である。
ｖｅｒｔＯｆｆＮ、ｖｅｒｔＯｆｆＤ：クリーンアパーチャ中心−（高さ−１）／２（通常０）の垂直オフセットを規定する分数である。

効果集合体：効果集合体ボックスは、幾つかの画像に対して効果を再利用するために、幾つかの効果の組を単一の効果として規定できるようにし、それにより、バイトの観点から記述消費を削減できるようにする。
ボックスタイプ：「ｅｃｏｌ」
コンテナー：ｅｆｆｄ
必須：非必須
量：０以上

その意味は：
ｎｂ＿ｂｉｔｓ＿ｅｆｆｅｃｔは、親クラスＢａｓｅＥｆｆｅｃｔＢｏｘから派生し、ＥｆｆｅｃｔＣｏｌｌｅｃｔｉｏｎＢｏｘの異なるフィールドを表すために使用されるビット数を示す。
ａｐｐｌｙ＿ｅｆｆｅｃｔ＿ｉｄ：ソース画像に適用すべき効果のＩＤを示す。

効果集合体内の効果は、ＤｅｒｉｖｅｄＩｍａｇｅｄアイテム内の効果と同じ順序において適用される。例えば、各効果は、効果のリスト内の出現の逆の順序において入力に適用されるべきである。

ＯｖｅｒｌａｙＥｆｆｅｃｔＢｏｘは、画像の構成をオーバーレイとして宣言する。この特定の効果の場合、この効果が構造の一部であるソース画像のリストを宣言するために、結果として派生する画像は、任意のソース画像への参照を有しない。

ただし、以下の意味を有する：
ｎｂ＿ｂｉｔｓ＿ｅｆｆｅｃｔｓは、親クラスＢａｓｅＥｆｆｅｃｔＢｏｘから派生し、ＯｖｅｒｌａｙＥｆｆｅｃｔＢｏｘの異なるフィールドを表すために使用されるビット数を示す。
ｆｉｌｌ＿ｒｅｑｕｉｒｅｄは、結果として構成された画像内に、背景値で満たすべき穴が存在するか否かを示す。
ｃａｎｖａｓ＿ｆｉｌｌ＿ｖａｌｕｅ：任意の入力画像のピクセルが特定のピクセルロケーションに位置しない場合に使用される、チャネルあたりのピクセル値を示す。入力画像が３つ未満のチャネルを含む場合には、入力画像内に存在しないチャネルに対応するｃａｎｖａｓ＿ｆｉｌｌ＿ｖａｌｕｅの意味は規定されない。
ｎｂ＿ｉｍａｇｅｓは、それぞれがｉｍａｇｅ＿ｉｔｅｍ＿ＩＤパラメーターによって示されるようなそのｉｔｅｍ＿ＩＤによって識別される、構成すべき画像の数を示す。
ｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ：入力画像が配置される、出力画像の幅及び高さをそれぞれ指定する。出力画像のピクチャエリアはキャンバスと呼ばれる。
ｈｏｒｉｚｏｎｔａｌ＿ｏｆｆｓｅｔ、ｖｅｒｔｉｃａｌ＿ｏｆｆｓｅｔ：入力画像が位置する、キャンバスの左上角からのオフセットを規定する。負のオフセット値を有するピクセルロケーションは出力画像に含まれない。ｏｕｔｐｕｔ＿ｗｉｄｔｈ以上の水平ピクセルロケーションは出力画像に含まれない。ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ以上の垂直ピクセルロケーションは出力画像に含まれない。

本発明の別の態様によれば、全ての記述メタデータ及び規範メタデータの記憶は、記述メタデータ及び／又は規範メタデータが特定の画像アイテムに特有であるか、幾つかの画像アイテム間で共有されるかに応じて、上記の実施形態に比べて更に最適化することができる。そのような共有は、バイト範囲の共有を用いることなく、又は上記の実施形態によって必要とされるようなアイテム参照の大きなリストを規定することなく可能になる。この代替の実施形態によれば、全ての記述メタデータ及び規範メタデータは依然として「メタ」ボックス１００内のボックス階層内部にのみ記憶され、「ｉｄａｔ」又は「ｍｄａｔ」ボックスをフェッチする必要なく、ＩＳＯＢＭＦＦリーダーが全てのシステム情報を構文解析できるようにする。したがって、画像アイテム（「ｉｉｎｆ」ボックス内）及びアイテム参照（「ｉｒｅｆ」ボックス内）の数は、メディアデータをアドレス指定するためにのみ、又は幾つかの画像アイテム間の関係を表すために制限される。そのような設計は、ファイルの構文解析をより簡単にし、ファイルフォーマットの高度の理解を容易にする。

この実施形態の重要な態様は、全てのシステムレベルアイテム情報が、任意の「ｍｄａｔ」又は「ｉｄａｔ」ボックスをフェッチすることなくパーサーにアクセス可能であり、アイテム情報エントリに直接含まれるか、又はアイテム情報エントリによって直接参照される、専用のボックス（ＩＳＯＢＭＦＦフルボックスを使用する）に収められることである。

この実施形態は以下の変更を導入する：
−アイテム間で共有されるボックス構造の記述メタデータ及び規範メタデータを含むために、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘ（「ｓｉｔｐ」)と呼ばれる新たな専用ボックスが規定される。
−ボックス構造の記述メタデータ及び規範メタデータをアイテムに関連付けるためにＩｔｅｍＩｎｆｏＥｎｔｒｙ（「ｉｎｆｅ」）を変更する。そのメタデータは、メタデータがこのアイテムにのみ関連する場合には、「ｉｎｆｅ」ボックス内に直接記憶することができ、メタデータが幾つかのアイテム間で共有される場合には、「ｓｉｔｐ」ボックス内に記憶し、「ｉｎｆｅ」ボックスから参照することができる。
−画像アイテムとトラック内のサンプルとの間で同じ初期化データを共有できるようにするための新たなボックス（初期化パラメーターを表すＳａｍｐｌｅＤｅｓｃｒｉｐｔｉｏｎＥｎｔｒｙＲｅｆｅｒｅｎｃｅ「ｓｄｅｒ」）。

ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘ（「ｓｉｔｐ」）と呼ばれる新たなボックスは以下のように規定される。
ボックスタイプ：「ｓｉｔｐ」
コンテナー：メタボックス（「ｍｅｔａ」）
必須：非必須
量：０又は１

ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックス（専用共有ボックス）は、親「メタ」ボックス内で宣言される幾つかのアイテムに適用可能な場合がある、記述メタデータ（表示パラメーター）及び規範メタデータ（変換演算子）（特性とも呼ばれる）を規定するボックスのリストを含む。これらのボックスは、ＩｔｅｍＩｎｆｏＥｎｔｒｙボックスから、０ベースのインデックスによって参照される。このボックスは以下の構文を有する。

ＩｔｅｍＩｎｆｏＥｎｔｒｙの変更に関して、以下の意味を有する新たなバージョン（４）が規定される。ＩｔｅｍＩｎｆｏＥｎｔｒｙボックスは、アイテムインフォエントリ内に、このアイテムのための特性を与える付加的なボックスを含むか、又は参照する可能性を提供する。含まれる特性及び参照される特性の集合内に、多くても所与のタイプの１つの特性しか存在すべきでない。特性は順序依存とすることができ、その場合、ＩｔｅｍＩｎｆｏＥｎｔｒｙボックス内で与えられる順序が使用されるべきであり、すなわち、最初に含まれる特性が最初に適用され、その後、全ての他の含まれる特性が適用され、その後、全ての参照される特性が適用される。

付加的な構文が以下のように規定される。

関連付けられる意味は：
ｉｎｃｌｕｄｅｄ＿ｐｒｏｐ＿ｃｏｕｎｔ：アレイｉｔｅｍ＿ｐｒｏｐｅｒｔｉｅｓに含まれる特性（記述メタデータ又は規範メタデータ）の数。
ｉｔｅｍ＿ｐｒｏｐｅｒｔｉｅｓ：このアイテムのための付加情報（アイテム情報の特性）を与えるボックスのアレイ又はボックスのテーブル。許されるボックスは、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘの場合と同じである。
ｉｎｄｅｘｅｄ＿ｐｒｏｐ＿ｃｏｕｎｔ：ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックス内の特性への参照数。
ｂｏｘ＿ｐｒｏｐ＿ｉｄｘ：「メタ」ボックスのＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックス内に記憶されるボックスのリストへの０ベースのインデックス。

この実施形態によれば、全ての記述メタデータ及び規範メタデータは、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックスの中に、又はＩｔｅｍＩｎｆｏＥｎｔｒｙボックス内のｉｔｅｍ＿ｐｒｏｐｅｒｔｉｅｓアレイの中に記憶されることになるＩＳＯＢＭＦＦフルボックスである。

例えば、画像回転のための規範メタデータは以下のように規定される。
ボックスタイプ：「ｉｒｏｔ」
コンテナー：ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓ
必須：非必須
量：０以上

画像回転ボックスは、９０度の単位において反時計回りの方向の回転角度を与える。画像アイテムの特性として、１つのそのようなボックスのみが割り当てられるべきである。このボックスの構文は以下のように規定される。

ただし、以下の属性意味を有する：
ｖｅｒｓｉｏｎは０に等しいものとする。
ｆｌａｇｓは０に等しいものとする。
ａｎｇｌｅ^＊９０は角度の単位において角度（反時計回りの方向）を規定する。

画像オーバーレイのための規範メタデータは以下のように規定される。
ボックスタイプ：「ｉｏｖｌ」
コンテナー：ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓ
必須：非必須
量：０以上

画像オーバーレイボックスは、より大きいキャンバス内の所与のレイヤ形成順序内の１つ以上の入力画像を特定する。入力画像は、特性としてこのボックスを含むか、又は参照する派生画像アイテムのためのタイプ「ｄｉｍｇ」のＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘ内の、それらがレイヤを形成する順序において、すなわち、最も下にある入力画像が最初にあり、最も上にある入力画像が最後になるようにリスト化される。画像アイテムの特性として、１つのそのようなボックスのみが割り当てられるべきである。

このボックスの構文は以下のように規定される。

ただし、以下の属性意味を有する：
ｖｅｒｓｉｏｎは０に等しいものとする。
０に等しい（ｆｌａｇｓ＆１）は、フィールドｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ、ｈｏｒｉｚｏｎｔａｌ＿ｏｆｆｓｅｔ及びｖｅｒｔｉｃａｌ＿ｏｆｆｓｅｔの長さが１６ビットであることを規定する。１に等しい（ｆｌａｇｓ＆１）は、フィールドｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ、ｈｏｒｉｚｏｎｔａｌ＿ｏｆｆｓｅｔ及びｖｅｒｔｉｃａｌ＿ｏｆｆｓｅｔの長さが３２ビットであることを規定する。１より大きいｆｌａｇｓの値は予約される。
ｃａｎｖａｓ＿ｆｉｌｌ＿ｖａｌｕｅ：任意の入力画像のピクセルが特定のピクセルロケーションに位置しない場合に使用されるチャネルあたりのピクセル値を示す。ｆｉｌｌ値はＲＧＢＡとして規定される（ループカウンターｊに対応するＲ、Ｇ、Ｂ及びＡはそれぞれ０、１、２、及び３に等しい）。ＲＧＢ値は、ＩＥＣ６１９６６−２−１内に規定されるようなｓＲＧＢ色空間内にある。Ａ値は、０（完全に透明）から６５５３５（完全に不透明）に及ぶ線形不透明値である。
ｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ：入力画像が配置される出力画像の幅及び高さをそれぞれ規定する。出力画像の画像エリアはキャンバスと呼ばれる。
ｒｅｆｅｒｅｎｃｅ＿ｃｏｕｎｔは、タイプ「ｄｉｍｇ」のＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘから取得され、ただし、このボックスを使用するアイテムは、ｆｒｏｍ＿ｉｔｅｍ＿ＩＤフィールドによって識別される。
ｈｏｒｉｚｏｎｔａｌ＿ｏｆｆｓｅｔ、ｖｅｒｔｉｃａｌ＿ｏｆｆｓｅｔ：入力画像が位置する、キャンバスの左上角からのオフセットを規定する。負のオフセット値を有するピクセルロケーションは出力画像に含まれない。ｏｕｔｐｕｔ＿ｗｉｄｔｈ以上の水平ピクセルロケーションは出力画像に含まれない。ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ以上の垂直ピクセルロケーションは出力画像に含まれない。

画像グリッドのための規範メタデータは以下のように規定される。
ボックスタイプ：「ｇｒｉｄ」
コンテナー：ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓ
必須：非必須
量：０以上

画像グリッドボックスは、より大きいキャンバス内に所与のグリッド順序において１つ以上の入力画像から出力画像を形成する。画像アイテムの特性として、１つのそのようなボックスのみが割り当てられるべきである。入力画像は、ＩｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ内のこのボックスを使用する派生画像アイテムのためのタイプ「ｄｉｍｇ」のＳｉｎｇｌｅＩｔｅｍＴｙｐｅＲｅｆｅｒｅｎｃｅＢｏｘの順序において、行優先順に、最も上の行が最初で、左から右に挿入される。このアイテムから入力画像へのｒｏｗｓ^＊ｃｏｌｕｍｎｓアイテム参照が存在すべきである。全ての入力画像が全く同じ幅及び高さを有するべきである。それらをｔｉｌｅ＿ｗｉｄｔｈ及びｔｉｌｅ＿ｈｅｉｇｈｔと呼ぶ。タイリングされた入力画像は、出力画像グリッドキャンバスを完全に「カバー」すべきであり、ただし、ｔｉｌｅ＿ｗｉｄｔｈ^＊ｃｏｌｕｍｎｓはｏｕｔｐｕｔ＿ｗｉｄｔｈ以上であり、ｔｉｌｅ＿ｈｅｉｇｈｔ^＊ｒｏｗｓはｏｕｔｐｕｔ＿ｈｅｉｇｈｔ以上である。出力画像は、ｔｉｌｅ＿ｗｉｄｔｈに等しい列幅（潜在的には最も右の列を除外する）と、ｔｉｌｅ＿ｈｅｉｇｈｔに等しい行高（潜在的には最も下の行を除外する）とを有するグリッドの中に、間隙又は重なりを生じることなく入力画像をタイリングし、その後、右及び下において、指示されたｏｕｔｐｕｔ＿ｗｉｄｔｈ及びｏｕｔｐｕｔ＿ｈｅｉｇｈｔまでトリミングすることによって形成される。

このボックスの構文は以下のように規定される。

ただし、以下の属性意味を有する：
ｖｅｒｓｉｏｎは０に等しいものとする。
０に等しい（ｆｌａｇｓ＆１）は、フィールドｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔの長さが１６ビットであることを規定する。１に等しい（ｆｌａｇｓ＆１）は、フィールドｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔの長さが３２ビットであることを規定する。１より大きいｆｌａｇｓの値は予約される。
ｏｕｔｐｕｔ＿ｗｉｄｔｈ、ｏｕｔｐｕｔ＿ｈｅｉｇｈｔ：入力画像が配置される出力画像の幅及び高さをそれぞれ規定する。出力画像の画像エリアはキャンバスと呼ばれる。
ｒｏｗｓ、ｃｏｌｕｍｎｓ：入力画像の行の数、及び行あたりの入力画像の数を規定する。入力画像は、アイテム参照の順序において、最初に最も上の行を占め、その後、２行目以降を占める。

補助構成ボックス（「ａｕｘＣ」）のような全ての他の記述メタデータ及び規範メタデータと同様に、画像空間エクステントボックス（「ｉｓｐｅ」）、ピクセル情報ボックス（「ｐｉｘｉ」）、相対ロケーションボックス（「ｒｌｏｃ」）、クリーンアパーチャボックス（「ｃｌａｐ」）（非限定的なリスト）は全てＩＳＯＢＭＦＦフルボックスから受け継がれる。

この実施形態によれば、アイテムが、派生への入力である、１つ以上の他の画像アイテムへの「ｄｉｍｇ」アイテム参照を含むとき、そのアイテムは派生画像である。派生画像は、指定された入力画像への、回転のような規定された演算を実行することによって取得される。派生画像を取得するために実行される演算は、アイテムのｉｔｅｍ＿ｔｙｐｅによって識別される。派生画像への入力として使用される画像アイテムは、符号化画像とすることができるか、又は他の派生画像アイテムとすることができる。

例えば、クリーンアパーチャ派生画像アイテムは、ｉｔｅｍ＿ｔｙｐｅ値「ｃｌａｐ」によって識別される。それは、データを記憶せず、「ｉｌｏｃ」テーブル内に関連付けられるエントリを有するべきでない。それは、ＩＳＯ／ＩＥＣ１４４９６−１２において規定されるようなタイプＣｌｅａｎＡｐｅｒｔｕｒｅＢｏｘのアイテム特性を含むか、又は参照すべきである。それは、画像アイテムへのタイプ「ｄｉｍｇ」のアイテム参照を有するべきである。別の例として、画像回転派生画像アイテムは、ｉｔｅｍ＿ｔｙｐｅ値「ｉｒｏｔ」によって識別される。それは、データを有せず、「ｉｌｏｃ」テーブル内に関連付けられるエントリを有するべきでない。それは、上記で規定されたようなタイプＩｍａｇｅＲｏｔａｔｉｏｎＢｏｘのアイテム特性を含むか、又は参照すべきである。それは、画像アイテムへのタイプ「ｄｉｍｇ」のアイテム参照を有するべきである。

同様に、画像オーバーレイ派生画像アイテムは、ｉｔｅｍ＿ｔｙｐｅ「ｉｏｖｌ」によって識別される。それは、データを有せず、「ｉｌｏｃ」テーブル内に関連付けられるエントリを有するべきでない。それは、上記で規定されたようなタイプＩｍａｇｅＯｖｅｒｌａｙＢｏｘのアイテム特性を含むか、又は参照すべきである。それは、画像アイテムの組へのタイプ「ｄｉｍｇ」のアイテム参照を有するべきである。画像グリッド派生画像アイテムは、ｉｔｅｍ＿ｔｙｐｅ値「ｇｒｉｄ」によって識別される。それは、データを有せず、「ｉｌｏｃ」テーブル内に関連付けられるエントリを有するべきでない。それは、上記で規定されたようなタイプＩｍａｇｅＧｒｉｄＢｏｘのアイテム特性を含むか、又は参照すべきである。それは、画像アイテムの組へのタイプ「ｄｉｍｇ」のアイテム参照を有するべきである。

以下は、画像に記述メタデータ及び規範メタデータ（又は特性）を割り当てるために、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックス及び拡張ＩｔｅｍＩｎｆｏＥｎｔｒｙボックスを使用することを例示する幾つかの例である。

以下の例では、２つの特性ボックス（「ｈｖｃＣ」及び「ｉｓｐｅ」）が、アレイｉｔｅｍ＿ｐｒｏｐｅｒｔｉｅｓ内の関連付けられるｉｔｅｍＩｎｆｏＥｎｔｒｙ内において画像アイテムに直接割り当てられる。

以下の例では、前出の例に加えて、画像回転演算子（「ｉｒｏｔ」）が同じようにして画像アイテムに割り当てられる。

以下の例では、異なるＨＥＶＣ構成を有する複数の画像が、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｙボックス（「ｓｉｔｐ」）に記憶される共通の画像空間エクステントボックス（「ｉｓｐｅ」）内に記述される同じ寸法を共有する。各画像ｉｔｅｍＩｎｆｏＥｎｔｒｙボックスは、自らのＨＥＶＣ構成ボックス（「ｈｖｃＣ」）を含み、共通の画像空間エクステントボックス（「ｉｓｐｅ」）を参照するために、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｙボックスへのインデックス（アイテム特性インデックス）を使用する。

テーブルｉｔｅｍｐｒｏｐｅｒｔｉｅｓｉｎｄｉｃｅｓのエントリは識別子の組を形成する。識別子の別の組が、専用共有ボックス（ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘ）内の画像記述情報（ここでは、「ｉｓｐｅ」）のランク（ここでは、０）によって形成される。

別の実施形態において、専用共有ボックス内の画像記述情報に割り振られる別のＩＤによって、他の識別子を形成することができる。例えば、画像記述情報に割り振られるこの別のＩＤは、ＩＳＯＢＭＦＦ「フルボックス」の代わりに、「ＶｉｒｔｕａｌＩｔｅｍＢｏｘ」（上記）から受け継ぐことによって規定することができる。この実施形態によれば、有利には、セット識別子に影響を及ぼすことなく、専用共有ボックス内の画像記述情報を並べ替えることができるようになる。

識別子のいずれの組も、画像アイテム情報（ＩｔｅｍＩｎｆｏＢｏｘ内のエントリによって表される）を少なくとも１つの画像記述情報にリンクするための構造を形成する。

以下の例は、回転したグリッド内の複数の画像から構成される派生画像を記述する。グリッドを構成する全ての画像が、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｙボックス内に位置し、ボックス特性インデックスによって参照される「ｈｖｃＣ」及び「ｉｓｐｅ」ボックスによって同じＨＥＶＣ構成及び同じ画像寸法を共有する。グリッドを表す派生画像は、画像グリッドボックスを含むｉｔｅｍＩｎｆｏＥｎｔｒｙを介して記述される。適用すべき回転は、派生画像に関連付けられる画像回転ボックスで記述される。派生画像を構成する入力画像は、アイテム参照ボックス（「ｉｒｅｆ」）ボックス内のアイテム参照エントリを介して参照される。

以下の例は、ＨＥＶＣタイリング画像を記述する。この例において、全てのアイテム（フル画像（ｉｔｅｍＩＤ＝１）及びタイル（ｉｔｅｍＩＤ＝２、３、４、５））が同じＨＥＶＣ構成ボックスを共有し、全てのタイルが、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘを介してタイルサイズ（Ｗｔ、Ｈｔ）を規定する同じ画像空間エクステントボックスを共有する。さらに、全てのタイルアイテムが、各タイルのｘｙ座標を与える自らの相対ロケーションボックス（「ｒｌｏｃ」）を含む。

さらに、幾つかの画像フォーマットは、画像アイテムデータを復号するための初期化データを必要とする。初期化データはコーデック特有であり、ビデオトラックのために規定される復号器構成記録と同じか、又は類似とすることができる。そのような事例において、初期化データをファイルフォーマットにおいて繰り返すのではなく、共有することが有用である。そのような初期化データが必要とされる場合には、特定のタイプの記述メタデータ（特性）によってアイテム情報において与えられる。幾つかの画像アイテムが、そのような同じ特性を共有することができる。画像アイテムと、トラックの幾つかのサンプルとの間で同じ初期化データを共有できるようにするために、ＳａｍｐｌｅＤｅｓｃｒｉｐｔｉｏｎＥｎｔｒｙＲｅｆｅｒｅｎｃｅ（「ｓｄｅｒ」）と呼ばれる新たな記述メタデータボックスが以下のように規定される。
ボックスタイプ：「ｓｄｅｒ」
コンテナー：ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓ
必須：非必須
量：０以上

ＳａｍｐｌｅＤｅｓｃｒｉｐｔｉｏｎＥｎｔｒｙＲｅｆｅｒｅｎｃｅＢｏｘによって、画像アイテムがトラックの幾つかのサンプルと同じ初期化データを再利用することを示すことができるようになる。それはトラックと、そのトラックのそれらのサンプルのサンプル記述エントリとを識別する。このボックスは以下の構文を有する：

ただし、そのパラメーターに関して以下の意味を有する：
ｔｒａｃｋ＿ＩＤ：その初期化が再利用されるトラックの識別子。
ｓａｍｐｌｅ＿ｄｅｓｃｒｉｐｔｉｏｎ＿ｉｎｄｅｘ：このアイテム内のデータを記述する関連付けられるトラック内のサンプルエントリの１ベースのインデックス。

以下の例は、画像アイテムＩｎｆｏＥｎｔｒｙに関連付けられるＳａｍｐｌｅＤｅｓｃｒｉｐｔｉｏｎＥｎｔｒｙＲｅｆｅｒｅｎｃｅボックス（「ｓｄｅｒ」）を介してトラックと画像アイテムとの間でＨＥＶＣ構成を共有することを例示する。

画像アイテムデータがＨＥＶＣタイルを表すとき、各ＨＥＶＣタイルアイテムは、ＨＥＶＣタイルアイテム内に存在するタイルを復号するために必要とされる全てのパラメーターセットとともに、タイプＨＥＶＣＣｏｎｆｉｇｕｒａｔｉｏｎＢｏｘの特性を含むか、又は参照すべきである。幾つかのＨＥＶＣタイルアイテムは、同じＨＥＶＣＣｏｎｆｉｇｕｒａｔｉｏｎＢｏｘ特性を共有することができる。また、ＨＥＶＣタイルアイテムは、それぞれのＨＥＶＣ画像アイテム内のＨＥＶＣタイルアイテムの位置を示すＲｅｌａｔｉｖｅＬｏｃａｔｉｏｎＢｏｘ特性（「ｒｌｏｃ」）を含むか、又は参照すべきである。異なるＨＥＶＣ画像に属するタイルに対応する幾つかのＨＥＶＣタイルアイテムが、同じＲｅｌａｔｉｖｅＬｏｃａｔｉｏｎＢｏｘを共有することができる。ＨＥＶＣタイルアイテムごとにＩｍａｇｅＳｐａｔｉａｌＥｘｔｅｎｔｓＢｏｘ特性（「ｉｓｐｅ」）が使用されるべきである。ＩｍａｇｅＳｐａｔｉａｌＥｘｔｅｎｔｓＢｏｘのｄｉｓｐｌａｙ＿ｗｉｄｔｈ及びｄｉｓｐｌａｙ＿ｈｅｉｇｈｔは、ＨＥＶＣタイルアイテムの幅及び高さに設定されるべきである。

上記の代替の実施形態への変形形態において、全ての共有される記述メタデータ及び規範メタデータを単一のコンテナーＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘの中にグループ化するのではなく、２つの異なるコンテナーボックスを規定することができ、一方は記述メタデータ専用であり、他方は規範メタデータ専用である。そのような場合には、拡張ＩｔｅｍＩｎｆｏＥｎｔｒｙが２つの異なる特性インデックスアレイ（ｂｏｘ＿ｐｒｏｐ＿ｉｄｘ及びｂｏｘ＿ｏｐｅ＿ｉｄｘ）を含むか、又は関連付けられるコンテナーを検索するために、メタデータのタイプ（記述又は規範）が特性インデックスアレイ（ｂｏｘ＿ｐｒｏｐ＿ｉｄｘ）の各エントリに関連付けられる。

ｂｏｘ＿ｐｒｏｐ＿ｉｄｘ及びｂｏｘ＿ｏｐｅ＿ｉｄｘのエントリは識別子の組を形成する。識別子の他の組が、２つの専用共有ボックス内の画像記述情報のランクによって形成される。

別の実施形態において、識別子の他の組が、各専用共有ボックス内の画像記述情報に割り振られる他のＩＤによって形成される場合がある。この実施形態によれば、有利には、識別子の組に影響を及ぼすことなく、専用共有ボックス内の画像記述情報を並べ替えることができるようになる。

識別子のいずれの組も、画像アイテム情報（ＩｔｅｍＩｎｆｏＢｏｘ内のエントリによって表される）を少なくとも１つの画像記述情報にリンクするための構造を形成する。
本発明のこの最後の態様の更なる例が付録に記述される。

本発明の別の態様において、全ての記述メタデータ及び規範メタデータは依然として、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘに類似の１つ又は２つのボックスにグループ化することができるが、ｉｔｅｍＩｎｆｏＥｎｔｒｙボックスを変更するのではなく、アイテム参照ボックスを用いて、画像アイテムをその記述メタデータ及び規範メタデータと関連付けることができる。この代替の実施形態において、２つの異なるコンテナーボックスが規定され、一方は記述特性（例えば、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓ）用であり、他方は規範特性（例えば、ＳｈａｒｅｄＩｔｅｍＯｐｅｒａｔｏｒｓ）用である。

「ｉｎｆｅ」ボックスを変更する代わりに、ｉｔｅｍＲｅｆｅｒｅｎｃｅＢｏｘ「ｉｒｅｆ」ボックスを用いて、画像及び派生画像アイテムをその記述メタデータ及び規範メタデータ（演算子とも呼ばれる）に関連付ける。

２つの新たな参照タイプ、例えば、記述メタデータ用の「ｓｉｐｒ」及び規範メタデータ用の「ｓｉｏｒ」が規定される。

関連タイプ（「ｓｉｐｒ」又は「ｓｉｏｒ」）に応じて、アイテム参照ボックス内の「ｔｏ＿ｉｔｅｍ＿ＩＤ」パラメーターは、それぞれＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓＢｏｘ又はＳｈａｒｅｄＩｔｅｍＯｐｅｒａｔｏｒｓＢｏｘへのインデックスであると解釈される。「ｔｏ＿ｉｔｅｍ＿ＩＤ」に関連付けられる参照タイプ（ここでは、「ｓｉｐｒ」又は「ｓｉｏｒ」）は、画像アイテム情報（ＩｔｅｍＩｎｆｏＢｏｘ内のエントリによって表される）を画像記述情報（記述メタデータ及び規範メタデータ）にリンクするための構造を形成する。

任意の他の既存の参照タイプの場合、属性「ｔｏ＿ｉｔｅｍ＿ＩＤ」は依然として、ＩｔｅｍＩｎｆｏＢｏｘ内のｉｔｅｍＩＤを指していると解釈される。

以下は、「ｓｉｐｒ」及び「ｓｉｏｒ」関連タイプを用いて、回転したグリッド内の複数の画像を記述する例である。

一変形形態として、共有ボックス内の各画像記述情報が適切なＩＤに関連付けられる。この実施形態によれば、有利には、識別子に影響を及ぼすことなく、専用共有ボックス内の画像記述情報を並べ替えることができるようになる。

一変形形態において、各既存の参照タイプは、ｉｔｅｍＩｎｆｏＢｏｘ、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックス、又はＳｈａｒｅｄＩｔｅｍＯｐｅｒａｔｏｒｓボックスのいずれかに暗に関連付けられる。例えば、「ｉｓｐｅ」、「ｒｌｏｃ」、「ｃｌａｐ」、「ｈｖｃＣ」のような記述メタデータの参照タイプは、ＳｈａｒｅｄＩｔｅｍＰｒｏｐｅｒｔｉｅｓボックスに関連付けられ、「ｉｒｏｔ」、「ｉｏｖｌ」、「ｇｒｉｄ」のような規範メタデータの参照タイプは、ＳｈａｒｅｄＩｔｅｍＯｐｅｒａｔｏｒｓボックスに関連付けられる。

図９は、本発明の１つ以上の実施形態の実施態様のためのコンピューティングデバイス９００の概略的なブロック図である。コンピューティングデバイス９００は、マイクロコンピューター、ワークステーション又は軽量ポータブルデバイスのようなデバイスとすることができる。コンピューティングデバイス９００は、以下のものに接続される通信バスを備える。
−ＣＰＵで表される、マイクロプロセッサのような中央処理ユニット９０１。
−本発明の実施形態の方法の実行可能コードを記憶するための、ＲＡＭで表される、ランダムアクセスメモリ９０２、並びにマニフェストを読み出し、及び書き込むために、及び／又はビデオを符号化するために、及び／又は所与のファイルフォーマット下でデータを読み出すか、又は生成するための方法を実施するために必要とされる変数及びパラメーターを記録するように構成されるレジスタ。その記憶容量は、例えば、拡張ポートに接続されるオプションのＲＡＭによって拡張することができる。
−本発明の実施形態を実施するためのコンピュータープログラムを記憶するための、ＲＯＭで表される、リードオンリーメモリ９０３。
−ネットワークインターフェース９０４は通常、処理されるべきデジタルデータがそれを介して送信又は受信される通信ネットワークに接続される。ネットワークインターフェース９０４は単一のネットワークインターフェースとすることができるか、又は異なるネットワークインターフェースの組（例えば、有線及び無線インターフェース、又は異なる種類の有線又は無線インターフェース）から構成することができる。データが、ＣＰＵ９０１において実行されるソフトウェアアプリケーションの制御下で、送信するためにネットワークインターフェースに書き込まれるか、又は受信するためにネットワークインターフェースから読み出される。
−ユーザーから入力を受信するか、又はユーザーに情報を表示するためのユーザーインターフェース９０５。
−ＨＤで表される、ハードディスク９０６。
−ビデオソース又はディスプレイのような外部デバイスからデータを受信し／外部デバイスにデータを送信するためのＩ／Ｏモジュール９０７。

実行可能コードは、リードオンリーメモリ９０３内に、又はハードディスク９０６上に、又は例えば、ディスクのようなリムーバブルデジタル媒体上に記憶することができる。一変形形態によれば、プログラムの実行可能コードは、実行される前に、ハードディスク９０６のような、通信デバイス９００の記憶手段のうちの１つに記憶するために、通信インターフェース９０４を介して、通信ネットワークを用いて受信することができる。

中央処理ユニット９０１は、本発明の実施形態に従って、単数又は複数のプログラムの命令又はソフトウェアコードの一部の実行を制御し、指示するように構成され、命令は上記の記憶手段のうちの１つに記憶される。電源投入時に、それらの命令が、例えば、プログラムＲＯＭ９０３又はハードディスク（ＨＤ）９０６からロードされた後に、ＣＰＵ９０１は、ソフトウェアアプリケーションに関連するメインＲＡＭメモリ９０２からの命令を実行することができる。そのようなソフトウェアアプリケーションは、ＣＰＵ９０１によって実行されるときに、実施形態による方法のステップを実行する。

代替的には、本発明は、ハードウェア（例えば、特定用途向け集積回路又はＡＳＩＣの形をとる）において実現することができる。

本発明は、例えば、特定の対象領域にズームインするために、カメラ、スマートフォン、又はＴＶのためのリモートコントローラーとしての役割を果たすタブレットのようなデバイスに埋め込むことができる。また、同じデバイスから、特定の対象領域を選択することによって、ＴＶ番組の個人向けのブラウジング体験を有するように使用することもできる。ユーザーによるこれらのデバイスからの別の使用法は、自分の好みのビデオの幾つかの選択されたサブパートを、他の接続されるデバイスと共有することである。また、監視カメラが本発明の生成部分をサポートする場合には、監視下に置かれた建物の特定のエリアにおいて何が発生したかを監視するために、スマートフォン又はタブレットにおいて使用することもできる。

本発明は図面及び上述の記載で詳細に説明及び記載されているが、かかる説明及び記載は説明的なもの又は例示的なものであり、限定的なものではないとみなされる。本発明は開示される実施形態に限定されるものではない。当業者であれば、請求項に係る発明を実施する際に、図面、開示及び添付の特許請求の範囲の検討により、開示される実施形態に対する他の変形形態を理解し、それを行うことができる。

特許請求の範囲において、「を含む」という単語は他の要素又は工程を排除せず、数量を特定していないもの（the indefinite article "a" or "an"）は複数存在することを排除しない。単一のプロセッサ又は他のユニットが、特許請求の範囲において列挙される幾つかのアイテムの機能を果たすことができる。異なる特徴が互いに異なる従属クレーム内に列挙されることは、それだけで、これらの特徴の組み合わせを都合良く使用できないことを示すものではない。特許請求の範囲内のいかなる参照符号も、本発明の範囲を制限するものと解釈されるべきではない。

付録
例１：単一の画像

例２：回転を伴う単一の画像

例３：回転及びクリーンアパーチャを伴う単一の画像

例４：同じ寸法を有するが、異なるＨＥＶＣ構成を有する複数の画像

例５：同じＨＥＶＣ構成及び寸法を有する複数の画像

例６：同じＨＥＶＣ構成及び寸法を有するが、異なる回転を伴う複数の画像

例７：１つのグリッド内の複数の画像

例８：回転したグリッド内の複数の画像

例９：オーバーレイを伴う複数の画像

例１０：１つの画像及びその回転したバージョン

例１１：タイリングされた画像

例１２：マスター画像と同じＨＥＶＣ構成及び寸法を有する補助画像

例１３：サブサンプル記述を伴う画像

例１４：トラックとアイテムとの間で共有されるＨＥＶＣ構成

ＩＳＯベースメディアファイルフォーマットの「メタ」ボックス内のタイルで符号化された静止画像の記述を示す図である。タイリングされたビデオの一例を示す図である。ＨＥＶＣ内の種々のタイル／スライス構成を示す図である。「トラック」ボックスを有するＩＳＯベースメディアファイルフォーマットによるタイルカプセル化を示す図である。ＩＳＯＢＭＦＦの「メタ」ボックス内の情報アイテムを記述するための標準的なメタデータを示す図である。情報アイテム記述への例示的な拡張を示す図である。情報アイテム間の参照機構を示す図である。本発明の実施形態の実施態様の状況を示す図である。本発明の１つ又は複数の実施形態の実施態様のためのコンピューティングデバイスの概略的なブロック図である。

Claims

メタデータが格納されたボックスの階層構造を有する画像ファイルを生成する方法であって、該方法は、
１つ以上の画像を取得し、
前記１つ以上の画像のそれぞれに関連する１つ以上のプロパティを識別し、
前記生成された画像ファイルは、
（１）専用ボックスにリストされる、互いに識別される１つ以上のプロパティと、
（２）前記１以上のプロパティのそれぞれの識別情報と、前記１以上の画像のそれぞれの識別情報とを関連付けるための関連情報と、
を含む
ことを特徴とする、方法。
前記画像ファイルは、前記１以上の画像の夫々に対する情報を示す”ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｏｘ”をさらに含み、
前記１以上のプロパティのそれぞれの前記識別情報と、前記１以上の画像のそれぞれの前記識別情報とを関連付けるための前記関連情報は、前記専用ボックスとは異なる所定のボックスにおいて記述されることを特徴とする請求項１に記載の方法。
前記専用ボックスは、少なくとも１つのサブボックス“ｉｓｐｅ”を含み、前記少なくとも１つのサブボックス“ｉｓｐｅ”のそれぞれは、前記１以上の画像の幅および高さを含むプロパティを記述し、前記関連情報は、前記１以上の画像のそれぞれの前記識別情報と、１以上の”ｉｓｐｅ”のそれぞれの前記識別情報とを関連付けることを特徴とする請求項２に記載の方法。
前記専用ボックスは、少なくとも１つ以上のサブボックス”ｈｖｃＣ”を含み、前記少なくとも１つ以上のサブボックス”ｈｖｃＣ”のそれぞれは、前記１以上の画像をデコードするためのデコーダーを示すプロパティを記述し、前記関連情報は、前記１以上の画像のそれぞれの前記識別情報と、前記１以上の”ｈｖｃＣ”のそれぞれの前記識別情報とを関連付けることを特徴とする請求項１に記載の方法。
前記関連情報は、識別された前記以上のプロパティの識別情報と、少なくとも２つ以上の画像に対応する識別情報との間の対応付けを表すことを特徴とする請求項２または３に記載の方法。
前記画像ファイルは、複数の画像に基づいて生成されることを特徴とする請求項１〜５のいずれか一項に記載の方法。
前記画像ファイルは、１つの画像に対応する複数のサブ画像に基づいて生成されることを特徴とする請求項１から５の何れか１項に記載の方法。
前記画像ファイルは、メタデータ部分とメディアデータ部分とを含み、前記１以上のプロパティと前記関連情報とは、前記メタデータ部分に記述されることを特徴とする請求項１〜７のいずれか一項に記載の方法。
前記識別されたプロパティは、前記１以上のプロパティのそれぞれの前記識別情報に対応する順で順序付けられることを特徴とする請求項１〜８のいずれか一項に記載の方法。
メタデータが格納されたボックスの階層構造を有する画像ファイルに基づいて画像を出力する方法であって、該方法は、
（１）専用ボックスにリストされる、互いに識別される１つ以上のプロパティと、
（２）前記１以上のプロパティのそれぞれの識別情報と、１以上の画像のそれぞれの識別情報とを関連付けるための関連情報と、を少なくとも含む画像ファイルを取得し、
前記取得した画像ファイルに基づいて画像を出力する
ことを特徴とする方法。
前記画像ファイルは、前記１以上の画像の夫々に対する情報を示す”ＩｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｏｘ”をさらに含み、
前記１以上のプロパティのそれぞれの前記識別情報と、前記１以上の画像のそれぞれの前記識別情報とを関連付けるための前記関連情報は、前記専用ボックスとは異なる所定のボックスにおいて記述されることを特徴とする請求項１０に記載の方法。
前記専用ボックスは、少なくとも１つのサブボックス“ｉｓｐｅ”を含み、前記少なくとも１つのサブボックス“ｉｓｐｅ”のそれぞれは、前記１以上の画像の幅および高さを含むプロパティを記述し、前記関連情報は、前記１以上の画像のそれぞれの前記識別情報と、１以上の”ｉｓｐｅ”のそれぞれの前記識別情報とを関連付けることを特徴とする請求項１１に記載の方法。
前記専用ボックスは、少なくとも１つ以上のサブボックス”ｈｖｃＣ”を含み、前記少なくとも１つ以上のサブボックス”ｈｖｃＣ”のそれぞれは、前記１以上の画像をデコードするためのデコーダーを示すプロパティを記述し、前記関連情報は、前記１以上の画像のそれぞれの前記識別情報と、前記１以上の”ｈｖｃＣ”のそれぞれの前記識別情報とを関連付けることを特徴とする請求項１０に記載の方法。
前記関連情報は、識別された前記以上のプロパティの識別情報と、少なくとも２つ以上の画像に対応する識別情報との間の対応付けを表すことを特徴とする請求項１１または１２に記載の方法。
前記画像ファイルは、複数の画像に基づいて生成されることを特徴とする請求項１０〜１４のいずれか一項に記載の方法。
前記画像ファイルは、１つの画像に対応する複数のサブ画像に基づいて生成されることを特徴とする請求項１０〜１４のいずれか一項に記載の方法。
前記画像ファイルは、メタデータ部分とメディアデータ部分とを含み、前記１以上のプロパティと前記関連情報とは、前記メタデータ部分に記述されることを特徴とする請求項１１〜１６のいずれか一項に記載の方法。
前記識別されたプロパティは、前記１以上のプロパティのそれぞれの前記識別情報に対応する順で順序付けられることを特徴とする請求項１０〜１７のいずれか一項に記載の方法。
メタデータが格納されたボックスの階層構造を有する画像ファイルを生成する装置であって、該装置は、
前記１つ以上の画像を取得する取得部と、
前記１つ以上の画像のそれぞれに関連する１つ以上のプロパティを識別する識別部とを備え、
前記生成された画像ファイルは、
（１）専用ボックスにリストされる、互いに識別される１つ以上のプロパティと、
（２）前記１以上のプロパティのそれぞれの識別情報と、前記１以上の画像のそれぞれの識別情報とを関連付けるための関連情報と、
を含むことを特徴とする、装置。
メタデータが格納されたボックスの階層構造を有する画像ファイルに基づいて画像を出力する装置であって、該装置は、
（１）専用ボックスにリストされる、互いに識別される１つ以上のプロパティと、
（２）前記１以上のプロパティのそれぞれの識別情報と、１以上の画像のそれぞれの識別情報とを関連付けるための関連情報と、
を少なくとも含む画像ファイルを取得する取得部と、
前記取得した画像ファイルに基づいて画像を出力する出力部と
を備える
ことを特徴とする、装置。
請求項１〜９のいずれか一項に記載の方法を実施するために構成される、１つ以上の画像を表す符号化ビットストリームをカプセル化するためのデバイス。
請求項１０〜１８のいずれか一項に記載の方法を実施するために構成される、１つ以上の画像を表すカプセル化されたビットストリームを処理するためのデバイス。
請求項２１に記載のデバイスと、
前記デバイスからのファイルを処理するための、請求項２２に記載のデバイスと、
を備える、システム。
請求項１〜１８のいずれか一項に記載の方法をコンピュータが実行するためのプログラム。