JP2004517422A - マルチメディアデータのバイナリ記述用拡張コードを供給する方法 - Google Patents
マルチメディアデータのバイナリ記述用拡張コードを供給する方法 Download PDFInfo
- Publication number
- JP2004517422A JP2004517422A JP2002555536A JP2002555536A JP2004517422A JP 2004517422 A JP2004517422 A JP 2004517422A JP 2002555536 A JP2002555536 A JP 2002555536A JP 2002555536 A JP2002555536 A JP 2002555536A JP 2004517422 A JP2004517422 A JP 2004517422A
- Authority
- JP
- Japan
- Prior art keywords
- mpeg
- description
- extended
- description scheme
- tbc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
- H04N19/25—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with scene description coding, e.g. binary format for scenes [BIFS] compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
Description
従来の技術
MPEG−7標準[1]のコンテキストにおいてマルチメディアデータの記述は記述子(D)と記述スキーム(DS)によって構成されており、この場合、記述要素(DまたはDS)の個数は可変である。MPEG−7におけるすべてのDおよびDSは、いわゆる記述定義言語(DDL)を使用して定義される[3]。また、MPEG−7はテキストフォーマット(XML)でもバイナリフォーマット(BiM)でも表現可能である[1]。MPEG−7を使用したアプリケーション間の共働を可能にするためには、MPEG−7において構成されるDおよびDSのセットを適正な時点でで所定のポイントにおいて決定する必要がある。DDLによってMPEG−7のDSをまえもって定められたセット以上にさらに拡張し続けることができる一方、これら新たな(拡張された)DSの意味はそれを設計した人以外の誰にもわからない。
【0002】
本発明の目的および利点
請求項1記載の方法によれば、バイナリフォーマットにおけるマルチメディア記述スキームのユーザ固有またはアプリケーション固有の拡張が提供され、その際、まえもって定義されているたとえばMPEG−7の記述スキームおよび拡張された記述スキームの双方に共通の記述スキームの部分におけるバイナリフォーマットが保存される。
【0003】
従来技術によるマルチメディア記述スキームのためのバイナリフォーマットすなわちいわゆるBiMにより、テキストによる記述をバイナリ形式で表すことができる。DおよびDSのセットがたとえばMPEG−7のような標準で決定されたならば、定義されたそれらのDおよびDSを原則的にはさらに拡張することができるけれども、拡張されたDまたはDSのセマンティクスはその作成者にしかわからない。それにもかかわらず固有のDやDSをたとえばMPEG−7などのDやDSといっしょに使用する多数のアプリケーションのために、両方の種類に対し同じバイナリフォーマットを使用するのが非常に重要となる。基本的にBiMは、MPEG−7のDDLをベースとしているかぎりいずれの種類のDおよびDSにも使用することができる。しかし現行のBiMをMPEG−7のDまたはDSに適用し、かつMPEG−7のDまたはDSをベースとする拡張されたDSに適用すると、両方のDSのバイナリフォーマットは両方の事例において同一のDSの部分であっても異なるものになってしまう。
【0004】
本発明の利点は、まえもって定義されたたとえばMPEG−7のDSと拡張されたDSの同一部分のバイナリフォーマットを同じままに保つことのできる手段が提供されることであり、その結果、拡張部分に対するバイナリフォーマットだけが異なるようになる。このことはマルチメディアデータバイナリフォーマットに拡張ツリーブランチコードを含めることによって達成される。
【0005】
本発明のさらに別の観点として挙げられるのは、拡張ツリーブランチコード(tree branch code)TBCをポジションコードといっしょに使用できることである。
【0006】
本発明のさらに別の観点によれば、MPEG−7固有の拡張ツリーブランチコード(TBC)をツリーブランチコード(TBC)テーブルに付加的にまたは択一的に含めることができる。このMPEG−7固有の拡張TBCをMPEG−7標準のDおよびDSの拡張に使用することができ、それらは将来のバージョン2,3等で定義されそうである。この種のMPEG−7固有の拡張TBCを含めることによって、所定の範囲まではMPEG−7標準のフォワードコンパチビリティ(forward compatibility)が許容される。ここでいうフォワードコンパチビリティとは、MPEG−7バージョン1のデコーダは、MPEG−7バージョン2+のDSのうち少なくともMPEG−7バージョン1のDSと合致している部分をデコーディングできるということである。さらに既存のMPEG−7バージョン1の内容を、バージョン1のDSから派生された将来のMPEG−7のDSに非常にたやすく組み込むことができる。
【0007】
図面
図面には従来技術を引き合いに出しながら本発明の実施形態が描かれており、以下でそれらの実施形態について詳しく説明する。
【0008】
図1は、ある特定の例に関するMPEG−7記述のツリー表現を示す図である。
【0009】
図2は、MPEG−7記述のツリー表現の一例を示す図である。
【0010】
図3は、BiMフラグメントの構造を示す図である。
【0011】
図4は、BiMフラグメント内部の種々の状態に関するカレントモードのポジションを示す図である。
【0012】
図5は、各要素に関するポジションのビット表現をオカレンスとともに示す図である。
【0013】
図6.aは、ルートノードに関して絶対パスを示す図である。
【0014】
図6.bは、トップレベルノードに関して絶対パスを示す図である。
【0015】
図6.cは、カレントノードに関して相対パスを示す図である。
【0016】
図7は、MPEG−7のDSと拡張MPEG−7のDSのツリー表現を示す図である。
【0017】
図8は、あるDSノードにおいて単一の拡張TBCを使用する例を示す図である。
【0018】
図9は、あるDSノードにおいて複数の拡張TBCを使用する例を示す図である。
【0019】
本発明の詳細な説明
本発明の詳細について論じる前に、いくつかの定義殊にMPEG−7で使用される定義を示しておく。
【0020】
現在開発中のMPEG−7標準のコンテキストにおいて、マルチメディア環境におけるオーディオビジュアルデータを記述するための記述構造が定義されている。したがって記述子(Description, D)および記述スキーム(Description scheme, DS)が、いわゆる記述定義言語(Description Definition Language, DDL)を用いて定義されている。本明細書の以降のコンテキストにおいて、以下の定義が使用される:
・データ Data:データはオーディオビジュアル情報であって、これは記憶やコーディング、表示、伝送、媒体あるいは技術にかかわらず、MPEG−7を使用して記述される。
【0021】
・フィーチャ Feature:フィーチャは何かを誰かに知らせるデータにおいて他との区別を示す特徴である。
【0022】
・記述子 Descriptor(D):記述子はフィーチャの表現である。記述子によってフィーチャ表現のシンタックスおよびセマンティクスが定義される。
【0023】
・記述子値 Descriptor Value(DV):記述子値は、目下のデータを表す所定のデータセット(またはそのサブセット)に対する記述子のインスタンシエーションである。
【0024】
・記述スキーム Description Scheme(DS):記述スキームは、記述子(D)および記述スキーム(DS)の両方とすることのできる各コンポーネント間の関係の構造およびセマンティクスを指定する。
【0025】
・記述:1つの記述は、DS(構造)とデータを記述する記述子値(インスタンシエーション)のセットから成る。
【0026】
・コーディングされた記述:コーディングされた記述は、圧縮効率、フォールトトラレンス、ランダムアクセス等のような関連する要求を満たすためにコーディングされた記述である。
【0027】
・記述定義言語(DDL):記述定義言語は、新たな記述スキームおよび場合によっては記述子を生成することのできる言語である。さらにこれによって既存の記述スキームの拡張や変形も可能である。
【0028】
記述の一番下のレベルは記述子である。これによって1つまたは複数のデータのフィーチャが定義される。これは個々のDVとともに、データの固有の部分を実際に記述するために使用される。次に上のレベルは記述スキームであり、これには少なくとも2つまたはそれよりも多くのコンポーネントおよびそれらの関係が含まれている。コンポーネントは記述子または記述スキームのどちらであってもよい。最も上のレベルは記述定義言語である。これはMPEG−7のDとDSを定義するために使用されるし、さらにたとえばMPEG−7のコンテキストで定義された既存のDSを拡張するなどしてユーザ固有またはアプリケーション固有の新たなDSを定義するためにも使用できる。
【0029】
MPEG−7の記述を表現するために2つのオプションがある。最初のオプションは、eXtended Markup Language (XML) を使用したテキスト表現である。この表現は人間が読むことができるけれども、かなり冗長になる可能性がある。2番目のオプションはバイナリ表現であり、これはMPEG−7データのためのバイナリフォーマットである(Binary format for MPEG−7 Data, BiM)。BiMは人間には読めないが、帯域幅について効率的なMPEG−7データの記憶や伝送、DSの所定のコンポーネントへのランダムアクセスが可能となるし、さらにDSコンポーネントのフレキシブルな伝送順序が許容される。以下のセクションで、MPEG−7記述のテキストフォーマットとバイナリフォーマットについてさらに詳しく説明する。
【0030】
MPEG−7データのためのテキストフォーマットはXML言語をベースとしている。これはいわゆる「XMLタグ」から成り、タグ間でデータの構造と意味を定義する。記述は階層的に組み立てられており、DSコンポーネントの開始を定義する各オープニングXMLタグごとに、DSコンポーネントの終了を定義するそれに対応するクロージングタグが設けられている。非常に簡単なDSの一例を以下に示す。DSの定義はDDLを使用することで行われ、これはMPEG−7のMDSパートに示されている[4]。
【0031】
【外1】
【0032】
括弧(”<...>”)内のテキストは、オープニングXMLタグおよびクロージングXMLタグを表す。タグ間のテキストは記述のデータ値を表す。上述の例では、英国のグループ ”The Beatles” の”Help” という名称のオーディオトラックのタイトル、プレゼンタならびにジャンルが記述されている。この記述も図1に示したように記述ツリーとして描くことができる。この場合、実際のデータはツリーのリーフ中に含まれる一方、個々のブランチノードによって構造が与えられる。このツリー表現は、MPEG−7のバイナリフォーマットを理解するうえで非常に有用であり、これについて以下のセクションで説明する。
【0033】
本発明において引き合いに出すマルチメディア記述のためのバイナリフォーマットに関する従来技術はMPEG−7 BiMとしており、これについては[2]に詳しく記載されている。ここではバイナリフォーマットについて、本発明を理解するうえで必要な範囲で説明する。
【0034】
一般に、各MPEG−7記述はいわゆるMPEG−7ルート要素からスタートし、これには1つまたは複数のMPEG−7記述スキームを含めることができる。ルート要素の子であるMPEG−7のDSを以下では「トップレベル要素」と称する。すべてのMPEG−7記述は階層的に定義されているので、それらを図2に示されているように記述ツリーとして捉えることができる。
【0035】
記述のツリー表現を使用しているので、以下の記述ではルート要素とトップレベル要素も「ルートノード」および「トップレベルノード」と称する。このツリー表現を、バイナリフォーマットのデコーディングの仕方を記述するためにも使用する。ルートノード情報はデコーダによって受け取られるので、ビットストリームの残りはいわゆるBiMフラグメントから成る。各フラグメントは基本的に図3に示されているようになる。
【0036】
図示されているように、BiMフラグメントは主として4つのパートから成り、以下でこれらについて手短に説明する。第1のパートはいわゆる「ナビゲーションコマンド」であって、これは記述スキームのどのインスタンス化パートを次に受け取るかをデコーダに通知する。3種類のアドレッシング記述要素が可能である:
・デコーダが目下存在するノードに対し相対的なアドレッシング
・デコーダが目下存在するDSの目下のトップレベルノードに対する絶対的なアドレッシング
・ルートノードに対し相対的な絶対アドレッシング
BiMフラグメントとの次のパートはナビゲーションパスであって、つまりこれはデコーダがBiMフラグメント中に含められる情報を受け取りたいツリーノードに関する絶対アドレスまたは相対アドレスである。トップレベルDSのアドレス(識別子またはIDとも称する)は8bitのコードから成り、これは以下のテーブルで指定されている。ルートノードを離れてMPEG−7ビットストリームを終わらせることができるよう、トップレベルDS IDに加えて、「イクジットルート ”exit root ”」コマンドを通知する特定のビットコードが存在する。トップレベルDSの後続のサブ要素(子)のためのアドレスはローカルパスコードを使用して計算され、以下の説明ではこれをツリーブランチコードとも称する。
【0037】
BiMフラグメントの第3のパートはいわゆる「コンテントマニピュレーションコマンド ”content manipulation command” 」であって、これはデコーダに対し、どの種類のコンテントマニピュレーションをナビゲーションによりたったいま送られたノードに対してデコーダが受け取るのかを通知する。この場合、3つの可能なコマンドが設けられており、つまりそれらのコマンドとはサブツリーの追加 ”add”、サブツリーの更新 ”update”、ならびにサブツリーの削除 ”delete” である。サブツリーには、デコーダが目下存在するノード要素が含まれている。そしてコマンドが実行される。追加 ”add” または更新 ”update” の場合、サブツリーのコンテントはBiMフラグメントの第4のコンポーネント内に含まれる。削除 ”delete” の場合、BiMフラグメントの第4のコンポーネントは空である。コマンドが実行された後(つまりサブツリー情報がデコーディングされるかまたは既存のサブツリーが削除された後)、デコーダは暗黙的にその親のノードに戻る。
【0038】
BiMフラグメントのコンテントマニピュレーションセクションは2つのパートから成り、すなわちそれらはコンテントマニピュレーションコマンドとサブツリーバイナリ表現である。ナビゲーションパスを含むナビゲーションコマンドの終了後、コンテントマニピュレーションコマンドを待つ。同様に、サブツリーのバイナリ表現を含むコンテントマニピュレーションコマンドの終了後、ナビゲーションコマンドを待ち、これは新たなBiMフラグメントの開始である。デコーダの初期化時はカレントノードがルートノードにデフォルトとして設定され、ナビゲーションコマンドを待つ。BiM中に定義されるコンテントマニピュレーションコマンドに関するコードテーブルを表1として以下に示す。
【0039】
【表1】
【0040】
コマンドがカレントノードに適用される。ナビゲーション後のカレントノード(記述ツリー中の個々のポジション)は、ターミネーションTBC(図4参照)を除いて完全なナビゲーションパスにより参照されるノードである。この場合、コンテントマニピュレーションコマンド(追加 add、更新 update、削除 delete)は、カレントノード自身を含むサブツリーに適用される。コンテントマニピュレーションコマンドが発行された後、カレントノードがナビゲーション後のノードの父 father にセットされる。
【0041】
コマンドコードテーブルには以下のコードが含まれている:
・AddSubtree:ツリー中のカレントポジションを含むサブツリーを追加。このコマンドに続いてサブツリー全体のバイナリ表現がくる。AddSubtree コマンドが発行された後、カレントノードがナビゲーション後のカレントノードの父 father にセットされる。
【0042】
・UpdateSubtree:ツリー中のカレントポジションを含むサブツリーを更新。このコマンドに続いてサブツリー全体のバイナリ表現がくる。UpdateSubtree コマンドが発行された後、カレントノードがナビゲーション後のカレントノードの父 father にセットされる。
【0043】
・DleteSubtree:ツリー中のカレントポジションを含むサブツリーを削除。DeleteSubtree コマンド発行後、カレントノードがナビゲーション後のカレントノードの父にセットされる。
【0044】
カレントノードが単純型の要素または属性であるならば、コマンド直後にバイナリコンテント表現が続く。コマンド実行後、デコーダはナビゲーションモードに戻る。
【0045】
BiMフラグメントのナビゲーションセクションは2つのパートに分割され、それらはすなわちナビゲーションコマンドとナビゲーションパスである。ナビゲーションコマンドは2bitの固定ビット長であり、それに続いて可変長のナビゲーションパスが設けられる。ナビゲーションパスは連続的なツリーブランチコード(TBC)から成り、そこにおいて各TBCは記述ツリー内部のあるノードにおけるパスのフラクションを記述する。したがってナビゲーションパスはローカルナビゲーションパスのシーケンスであり、これはツリーを通るパス中に含まれる各ノードにおけるツリーブランチを指定する(図6参照)。ナビゲーションコマンドによって、表2中で指定されているようにナビゲーションパスをどのように解釈すべきかを指定する。
【0046】
【表2】
【0047】
ナビゲーションコマンドのパラメータでありビットストリーム中のナビゲーションコマンドコードに続く<TBC>は、インスタンス化された記述のベースとなるMPEG−7スキーマから生成される。スキーマ定義によって、種々のTBCによりアドレッシングされるべき記述中の1つのノードの可能な子 children が指定される。スキーマ定義中、子の可能な型およびそれらの最大オカレンス数が指定される。個々の記述ノードに関してインスタンス化された要素内のツリーブランチに従い、TBCは子要素の仕様(SchemaBranch)および1回以上インスタンス化可能ならばポジションが含まれる。1つのナビゲーションパス全体は、連続的なツリーブランチコード(Tree Branch Code, TBC)の順序づけられたリストとして構成される。
【0048】
コードテーブルおよびそのTBCは、複合型 complexType の指定されたすべての要素または記述スキーム中の指定された複合型 complexType について固有のものである。したがってナビゲーションのために、インスタンス化された要素の型により使用されるコードテーブルも決定される。したがって同じ複合型のノードに関するすべての要素は同じコードテーブルを有する。1つのノードにおける各々の子要素および属性はそれを参照する符号語に割り当てられる。これらの符号語はツリーブランチコード(Tree−Branch−Code, TBC)と呼ばれ、以下で説明する規範的アルゴリズムにより記述スキームから生成される。
【0049】
上述のようにTBCは2つのパートによって構成されている。すなわち1つはスキーマブランチ SchemaBranch であって、これはスキーマ中で指定された種々の子要素の定義に対応し、もうひとつはポジションであって、これはスキーマ定義に従いこの子の多数のオカレンスが可能であるときにのみ存在する。記述ツリー内のナビゲーションのため、父のノードを参照するためのコードも設けられている。さらに、パスをターミネートしコマンドモードへ暗黙的にスイッチするためにコードが用いられる。表3にはこの種のコードテーブルのプロトタイプが示されている。
【0050】
【表3】
【0051】
TBCの割り当ては下記のルールに従い実行される:
・種々の子の数は記述スキームから既知であり、これにより以下のルールに従いTBCのスキーマブランチ SchemaBranch ビットフィールドの長さが定義される
【0052】
【外2】
【0053】
・オール0のスキーマブランチ SchemaBranch コードは、父のノードへの参照に常に割り当てられる。
【0054】
・子を参照するスキーマブランチコードは、ISO/IEC 15938 の個々のパートにおいて指定された指定されたその要素または型のスキーマ定義中に定義された順序でシーケンシャルに割り当てられる。
【0055】
・オール1のスキーマブランチコードは、パスをターミネートしコマンドモードにスイッチするために常に使用される。
【0056】
・1つの子が多数のオカレンスを持つことができるならば、フィールド<#position>により以下のルールに従いインスタンス化された記述中の子の個数が指定される:フィールド #position のビット表現は、スキーマ定義におけるmaxOccur の個数を表すために必要とされる最小ビット数である。このビット数が3を超えるならば、最初のビット(Ext)は4つのビットの拡張が存在するのかを指定する(図5参照)。この4つのビットは、以降で拡張が8bitである点を除いて先行する4つのビットと同じセマンティクスをもち、その8bitのうち最初のビットは拡張を通知するために予約されている。代替グループにグループ分けされた要素は付加的に、TBCの後の属性としてこの代替グループ内のアドレスをコーディングしなければならない(これは上述の例の図面には示されていない)。この付加的なコードは SubstGrpSelect と呼ばれる。代替グループ内の各要素は SubstGrpSelect に割り当てられる。要素を参照する SubstGrpSelect コードは、ゼロから始まってスキーマ定義中に定義された順序でシーケンシャルに割り当てられる。
【0057】
単純型 simpleType の属性、要素および指定された単純型 simpleType は、1つのリーフテーブルによって表される。この種のリーフテーブルのプロトタイプを表4として示す。
【0058】
【表4】
【0059】
1つのパスはTBCを連結することによって作成される。リーフノードを除いてすべてのノードはその父への参照をもっているので、相対パスを使用するならば記述ツリー階層において上へ向かって動かすこともできる。
【0060】
絶対ナビゲーションおよび相対ナビゲーションは、後続のコンテントマニピュレーションコマンドを適用するツリー構造内のインスタンスノードの位置決定を目的としている。絶対パスは、インスタンス構造のMPEG−7記述ルートまたはカレントノードのトップレベルからターゲット要素までの経路を表すのに対し、相対パスは個々のノードのカレントポジションから始まるパスを指定しようというものである(図6参照)。
【0061】
本発明はナビゲーションモードの拡張に係わるものであって、殊にいわゆるツリーブランチコードの方法論を拡張することに係わる。以下のセクションでこのことについて詳しく説明する。
【0062】
マルチメディア記述スキームのための従来技術のバイナリフォーマットすなわちいわゆるBiMによって、テキスト形式の記述をバイナリ形態で存在させることができる。たとえばMPEG−7のような標準においてDおよびDSのセットが確定されると、定義されたDおよびDSは基本的にさらに拡張可能であるが、拡張されたDまたはDSのセマンティクスはその作者しかわからない。それにもかかわらず、固有のDとDSをたとえばMPEG−7のDおよびDSといっしょに使用する多くのアプリケーションにとって、両方の種類のために同じバイナリフォーマットを使用するのが非常に重要になる。原則的にBiMは、MPEG−7のDDLをベースとするかぎり、DとDSのどちらの種類にも使用することができる。しかし現行のBiMをMPEG−7のDまたはDSに適用し、かつMPEG−7のDまたはDSをベースとする拡張されたDSにも適用すると、両方の事例において同一であるDSのパートであっても両方のDSのバイナリフォーマットが異なってしまう。図7にはその事例が示されている。この図には単純なMPEG−7のDSと拡張されたDSが示されている。拡張されたDSは、1つのノード ”DiCo” をノード ”Lang” に加えることでMPEG−7のDSから派生している。しかしながら各ノードに関するTBCテーブルはその子の目下の個数に左右されるので、ノード ”LaCo” のアドレスは両方の事例で異なる。つまりMPEG−7の事例では(ノード ”Clas” に対し相対的に)”010 001 111” となる。拡張されたDSについてアドレスは(ノード ”Clas” に対し相対的に) ”010 010 111” となる。ここでわかるように、拡張がなされているノードの子のアドレスは変わっており、したがってMPEG−7のバイナリフォーマットのその部分も変化することになる。
【0063】
本発明の利点は、まえもって定義されているDSたとえばMPEG−7のDSと拡張されたDSの同一のパートにおけるバイナリフォーマットを同じままにしておく手段が得られるので、拡張パートに対するバイナリフォーマットのみしか異ならないようになる。このことはBiM中に「拡張ツリーブランチコード ”extension tree branch code」を含ませることにより達成され、これによりこのコード以降はまえもって定義されたDSについてのいくつかの拡張が続くことになることが通知される。これにより拡張されたDSを2つのパートに分けることができる。この場合、一方のパートはベースのDSと同一であり、すなわちまえもって定義された(たとえばMPEG−7の)DSであり、拡張されたDSはこれをベースとしており、他方のパートはベースのDSについてDSの拡張を記述している。この場合、第1のパートは、1つまたは複数のBiMフラグメントおよび第2のパートによって表すことができる。このようにすることで、拡張されたコードにおいてMPEG−7と合致したパートを符号変換する必要なく抽出するのが非常に簡単になる。さらに、拡張されたDSのユーザにとって拡張DSの一部分であるMPEG−7のDSへのアクセスおよび利用も格段に簡単になり、この場合も内容全体を符号変換する必要がない。それぞれまったく異なるニーズをもつ多数のアプリケーションが存在するが、それらは部分的にMPEG−7のDSを使用するけれども、それらのニーズを満たす目的でおそらくは拡張を望むであろうから、MPEG−7と非MPEG−7のDSの簡単ななコンビネーションは将来、非常に重要になる。
【0064】
本発明の全般的な着想は、「拡張ツリーブランチコード ”extension tree branch code”」をBiMに含めることであり、これによってこのコード後には拡張された事前に定義された(たとえばMPEG−7などの)DSの拡張パートが続くことが通知される。したがって以下で示すように、項目「拡張ツリーブランチコード ”extension tree branch code”」が複合型のツリーブランチコードに関する表3に含められる。
【0065】
【表5】
【0066】
指定された複合型または要素に対しこのようなTBCテーブルを形成する目的で、TBCを割り当てるための本来のルールを以下のとおり変更する:
・種々の子の個数は記述スキームから知られており、以下のルールに従いTBCにおける SchemaBranch ビットフィールドの長さが定義される。
【0067】
【外3】
【0068】
・オール0の SchemaBranch コードは常に父のノードへの参照に割り当てられる。
【0069】
・子を参照する SchemaBranch コードは、ISO/IEC 15938 の個々のパートにおいてこの指定された要素または型のスキーマ定義中で定義されている順序でシーケンシャルに割り当てられる。
【0070】
・オール1のSchemaBranch コードは、パスのターミネーションおよびコマンドモードへのスイッチのために常に使用される。
【0071】
・1つの子が複数のオカレンスをもつことができるならば、あるいは複数のオカレンスをもつことのできる拡張TBCであるならば、フィールド<#position>によって以下のルールに従いインスタンス化された記述中の子の数が指定される:フィールド #position のビット表現はスキーマ定義中の maxOccur の個数を表すのに必要とされる最小ビット数である。このビット数が3を超えたならば、最初のビット(Ext)は4ビットの拡張が存在するかを指定する(図5参照)。これら4つのビットは、それ以降は拡張が8ビットであり最初のビットは拡張を通知するために予約されている点を除いて、先行の4つのビットと同じである。
【0072】
このように変更することで、まえもって定義された(たとえばMPEG−7などの)DおよびDSのためにも、MPEG−7をベースとする拡張されたDおよびDSのためにも、BiMを使用することができるようになり、さらに両方のDSにおいてMPEG−7と合致したパートについてバイナリフォーマットを同じままに保つことができる。しかも、まえもって定義された(たとえばMPEG−7などの)DおよびDSと拡張されたDおよびDSのために、同じBiMエンコーダおよびデコーダを使用することができる。図8には、MPEG−7ベースのDSと拡張されたパートの拡張されたDSインスタンスのツリー表現を描くことで、拡張TBCの利用に関する一例が描かれている。ここに示されているように、2つのサブツリーの各々を1つまたは複数のBiMフラグメントによって表すことができる。しかしMPEG−7と合致したDSのパートのBiMフラグメントのフォーマットはMPEG−7のDS事態のものと同じである。
【0073】
本発明の別の観点によれば、拡張ツリーブランチコードTBCをポジションコードといっしょに使用することができる(たとえば表5を参照)。このポジションコードは何度も現れてよいDSノードの子の場合に使用される。表5に定義されているようにポジションコードがディスエーブル(表のエントリが ”−−”)である拡張TBCであれば、1つのDSノードにおいてただ1つの拡張TBCだけしか現れてはならない。オプションとしてポジションコードをイネーブルにすることもでき、そうすることで1つのDSノードにおいて2つ以上の拡張TBCが許可されるようになる。これはごく小さい変更しか生じないDSの拡張の事例に対して殊に有利である。図9にはやはり、個々の拡張DSパートのツリー表現を描くことで多数の拡張TBCの一例が示されている。やはりすべてのサブツリーは1つまたは複数のBiMフラグメントによって表現されており、MPEG−7のDSのBiMフラグメントのフォーマットが保たれることになる。
【0074】
本発明の別の観点によれば付加的または択一的に、MPEG−7固有の拡張ツリーブランチコード(TBC)をツリーブランチコード(TBC)テーブルに含めることができる。このMPEG−7固有の拡張TBCを、将来のバージョン2,3等で定義される可能性の高いMPEG−7標準のDおよびDSの拡張に使用することができる。このようなMPEG−7固有の拡張TBCを含めることによって、所定の範囲までMPEG−7標準のフォワードコンパチビリティが許容される。ここでいうフォワードコンパチビリティとは、MPEG−7バージョン1のデコーダは、MPEG−7バージョン2+のDSのうち少なくともMPEG−7バージョン1のDSと合致した部分をデコーディングできるということである。さらに、既存のMPEG−7バージョン1の内容をバージョン1のDSから派生した将来のMPEG−7のDSに組み入れるのが非常に容易になる。
【0075】
参考文献
[1] ISO/IEC, ”Introduction to MPEG−7”, Doc. ISO/IEC JTC1/SC29/WG11 N3751, La Baule, France, October 2000.
[2] ISO/IEC, ”Text of ISO/IEC CD 15938−1 Information technology − Multimedia content description interface: Systems”, Doc. ISO/IEC JTC1/SC29/WG11 N3701, La Baule, France, October 2000.
[3] ISO/IEC, ”Text of ISO/IEC CD 15938−2 Information technology − Multimedia content description interface: Description Definition Language”, Doc. ISO/IEC JTC1/SC29/WG11 N3702, La Baule, France, October 2000.
[4] ISO/IEC, ”Text of ISO/IEC CD 15938−5 Information technology − Multimedia content description interface: Description Definition Language”, Doc. ISO/IEC JTC1/SC29/WG11 N3705, La Baule, France, October 2000.
【図面の簡単な説明】
【図1】
ある特定の例に関するMPEG−7記述のツリー表現を示す図である。
【図2】
MPEG−7記述のツリー表現の一例を示す図である。
【図3】
BiMフラグメントの構造を示す図である。
【図4】
BiMフラグメント内部の種々の状態に関するカレントモードのポジションを示す図である。
【図5】
各要素に関するポジションのビット表現をオカレンスとともに示す図である。
【図6】
6.aはルートノードに関して絶対パスを示す図であり、6.bはトップレベルノードに関して絶対パスを示す図であり、6.cはカレントノードに関して相対パスを示す図である。
【図7】
MPEG−7のDSと拡張MPEG−7のDSのツリー表現を示す図である。
【図8】
あるDSノードにおいて単一の拡張TBCを使用する例を示す図である。
【図9】
あるDSノードにおいて複数の拡張TBCを使用する例を示す図である。
Claims (7)
- マルチメディアデータのバイナリ記述のための拡張コードを供給する方法において、
拡張ツリーブランチコード(TBC)をマルチメディアデータバイナリフォーマット(BiM)に含め、該拡張ツリーブランチコード(TBC)によって、前記マルチメディアデータのための記述スキーム(DS)の一方のパートがまえもって定義されベースとなる記述スキーム(DS)と同一であり、他方のパートは前記まもって定義されベースとなる記述スキーム(DS)に関する記述スキーム(DS)の拡張を記述していることを通知することを特徴とする、
マルチメディアデータのバイナリ記述のための拡張コードを供給する方法。 - 前記まえもって定義されベースとなる記述スキーム(DS)はMPEG−7の記述スキーム(DS)である、請求項1記載の方法。
- 前記拡張ツリーブランチコード(TBC)により拡張記述スキーム(DS)を2つのパートに分割し、一方のパートは前記まえもって定義されベースとなる記述スキーム(DS)と同一であり、他方のパートは前記拡張ツリーブランチコード(TBC)以降に続くことになる拡張を記述している、請求項1または2記載の方法。
- 少なくとも前記一方のパートをバイナリフォーマット(BiM)における1つまたは複数のBiMフラグメントにより表し、該フラグメントにより拡張記述スキーム(DS)のうちMPEG−7と合致したパートを符号変換することなく抽出する、請求項1から3のいずれか1項記載の方法。
- 前記拡張ツリーブランチコード(TBC)をポジションコードといっしょに使用して、1つの記述スキーム(DS)のノードにおいて2つ以上の拡張を可能にする、請求項1から4のいずれか1項記載の方法。
- MPEG−7固有の拡張ツリーブランチコード(TBC)を入れ、MPEG−7標準の記述子(D)および記述スキーム(DS)の拡張を定義してフォワードコンパチビリティを可能にするために使用する、請求項1から5のいずれか1項記載の方法。
- 拡張を伴うMPEG−7のデータのためのバイナリフォーマットは、ナビゲーションコマンドとナビゲーションパスとコンテンツマニピュレーションコマンドとサブツリーバイナリ表現であって、
前記ナビゲーションコマンドは、記述スキーム(DS)のどのパートを次に受け取ることになるのかの情報をデコーダに提供し、
前記ナビゲーションパスは、デコーダがMPEG−7データフォーマット中に含まれる情報を受け取るツリーノードのアドレスを提供し、
前記コンテンツマニピュレーションコマンドは、ナビゲーションにより閉ざされたノードに対しどのようなコンテンツマニピュレーションを受け取るのかの情報をデコーダに提供する、
請求項1から6のいずれか1項記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01100441.3 | 2001-01-08 | ||
EP01100441A EP1223759A1 (en) | 2001-01-08 | 2001-01-08 | Method for providing an extension code for a binary description for multimedia data |
PCT/EP2001/015194 WO2002054775A2 (en) | 2001-01-08 | 2001-12-21 | Method for providing an extension code for a binary description for multimedia data |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008321258A Division JP5054663B2 (ja) | 2001-01-08 | 2008-12-17 | マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004517422A true JP2004517422A (ja) | 2004-06-10 |
JP2004517422A5 JP2004517422A5 (ja) | 2009-02-12 |
JP5001510B2 JP5001510B2 (ja) | 2012-08-15 |
Family
ID=8176166
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002555536A Expired - Fee Related JP5001510B2 (ja) | 2001-01-08 | 2001-12-21 | マルチメディアデータのバイナリ記述用拡張コードを供給する方法 |
JP2008321258A Expired - Fee Related JP5054663B2 (ja) | 2001-01-08 | 2008-12-17 | マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008321258A Expired - Fee Related JP5054663B2 (ja) | 2001-01-08 | 2008-12-17 | マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7697613B2 (ja) |
EP (2) | EP1223759A1 (ja) |
JP (2) | JP5001510B2 (ja) |
KR (1) | KR100855192B1 (ja) |
WO (1) | WO2002054775A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009043267A (ja) * | 2001-07-13 | 2009-02-26 | Fr Telecom | 階層化ツリーを圧縮する方法及び圧縮されたマルチメディア信号をデコーディングする方法 |
JP2009537895A (ja) * | 2006-05-18 | 2009-10-29 | オラクル・インターナショナル・コーポレイション | バイナリにエンコードされたxmlデータの効率的な区分的アップデート |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004517410A (ja) * | 2000-12-22 | 2004-06-10 | シーメンス アクチエンゲゼルシヤフト | Mpeg−7および他のxmlベースのコンテンツ記述のバイナリ表現機能を改善する方法 |
JP4615827B2 (ja) * | 2001-02-05 | 2011-01-19 | エクスプウェイ | 文書の構造化された記述を圧縮するための方法 |
KR100493674B1 (ko) * | 2001-12-29 | 2005-06-03 | 엘지전자 주식회사 | 멀티미디어 데이터 검색 및 브라우징 시스템 |
JP2004318188A (ja) * | 2002-09-26 | 2004-11-11 | Victor Co Of Japan Ltd | 構造化データの受信プログラム |
DE10339971A1 (de) * | 2002-12-03 | 2004-07-01 | Siemens Ag | Verfahren zur Codierung eines XML-basierten Dokuments |
US8331433B2 (en) | 2006-08-31 | 2012-12-11 | Samsung Electronics Co., Ltd. | Video encoding apparatus and method and video decoding apparatus and method |
JP4360428B2 (ja) * | 2007-07-19 | 2009-11-11 | ソニー株式会社 | 記録装置、記録方法、コンピュータプログラムおよび記録媒体 |
EP2388701A1 (en) * | 2010-05-17 | 2011-11-23 | Siemens Aktiengesellschaft | Method and apparatus for providing a service implementation |
US9171401B2 (en) | 2013-03-14 | 2015-10-27 | Dreamworks Animation Llc | Conservative partitioning for rendering a computer-generated animation |
US9811936B2 (en) | 2013-03-15 | 2017-11-07 | Dreamworks Animation L.L.C. | Level-based data sharing for digital content production |
US9514562B2 (en) | 2013-03-15 | 2016-12-06 | Dreamworks Animation Llc | Procedural partitioning of a scene |
US9230294B2 (en) | 2013-03-15 | 2016-01-05 | Dreamworks Animation Llc | Preserving and reusing intermediate data |
US9626787B2 (en) | 2013-03-15 | 2017-04-18 | Dreamworks Animation Llc | For node in render setup graph |
US9218785B2 (en) | 2013-03-15 | 2015-12-22 | Dreamworks Animation Llc | Lighting correction filters |
US9589382B2 (en) | 2013-03-15 | 2017-03-07 | Dreamworks Animation Llc | Render setup graph |
US9208597B2 (en) * | 2013-03-15 | 2015-12-08 | Dreamworks Animation Llc | Generalized instancing for three-dimensional scene data |
US9659398B2 (en) | 2013-03-15 | 2017-05-23 | Dreamworks Animation Llc | Multiple visual representations of lighting effects in a computer animation scene |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03282646A (ja) * | 1990-03-29 | 1991-12-12 | Nec Corp | レコード格納制御方式 |
KR0151113B1 (ko) * | 1995-03-28 | 1998-10-15 | 김광호 | 엠피이지 디코더의 동벡터 디코더 |
KR100259471B1 (ko) * | 1997-06-25 | 2000-06-15 | 전주범 | 개선된형태부호화장치및방법 |
JP3312688B2 (ja) * | 1999-01-06 | 2002-08-12 | 富士ゼロックス株式会社 | ハイパーテキスト装置 |
US6490370B1 (en) * | 1999-01-28 | 2002-12-03 | Koninklijke Philips Electronics N.V. | System and method for describing multimedia content |
EP1158420A1 (en) * | 2000-05-24 | 2001-11-28 | Robert Bosch Gmbh | Method for a description of audio-visual data content in a multimedia environment |
JP2004517410A (ja) * | 2000-12-22 | 2004-06-10 | シーメンス アクチエンゲゼルシヤフト | Mpeg−7および他のxmlベースのコンテンツ記述のバイナリ表現機能を改善する方法 |
-
2001
- 2001-01-08 EP EP01100441A patent/EP1223759A1/en not_active Withdrawn
- 2001-12-21 US US10/250,819 patent/US7697613B2/en not_active Expired - Fee Related
- 2001-12-21 EP EP01988057A patent/EP1352525B1/en not_active Expired - Lifetime
- 2001-12-21 WO PCT/EP2001/015194 patent/WO2002054775A2/en active Application Filing
- 2001-12-21 KR KR1020037009135A patent/KR100855192B1/ko not_active IP Right Cessation
- 2001-12-21 JP JP2002555536A patent/JP5001510B2/ja not_active Expired - Fee Related
-
2008
- 2008-12-17 JP JP2008321258A patent/JP5054663B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009043267A (ja) * | 2001-07-13 | 2009-02-26 | Fr Telecom | 階層化ツリーを圧縮する方法及び圧縮されたマルチメディア信号をデコーディングする方法 |
JP2009537895A (ja) * | 2006-05-18 | 2009-10-29 | オラクル・インターナショナル・コーポレイション | バイナリにエンコードされたxmlデータの効率的な区分的アップデート |
Also Published As
Publication number | Publication date |
---|---|
JP2009123225A (ja) | 2009-06-04 |
JP5001510B2 (ja) | 2012-08-15 |
JP5054663B2 (ja) | 2012-10-24 |
US7697613B2 (en) | 2010-04-13 |
WO2002054775A3 (en) | 2002-11-07 |
EP1223759A1 (en) | 2002-07-17 |
WO2002054775A2 (en) | 2002-07-11 |
KR100855192B1 (ko) | 2008-09-01 |
US20040109501A1 (en) | 2004-06-10 |
KR20040018326A (ko) | 2004-03-03 |
EP1352525A2 (en) | 2003-10-15 |
EP1352525B1 (en) | 2013-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5054663B2 (ja) | マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 | |
US7882428B2 (en) | Method for improving the functionality of a binary representation | |
US7263490B2 (en) | Method for description of audio-visual data content in a multimedia environment | |
US7870483B2 (en) | Encoding and distribution of schema for multimedia content descriptions | |
MXPA04000219A (es) | METODO PARA LA COMPRESION DE UN áRBOL JERáRQUICO, SENALES CORRESPONDIENTES Y METODO PARA LA DECODIFICACION DE LA SENAL. | |
US7251277B2 (en) | Efficient means for creating MPEG-4 textual representation from MPEG-4 intermedia format | |
EP1567943A2 (en) | Efficient means for creating mpeg-4 intermedia format from mpeg-4 textual representation | |
US7797346B2 (en) | Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions | |
JP5553466B2 (ja) | バイナリマルチメディアデータを含むビットストリームを生成するための方法 | |
JP4847943B6 (ja) | Mpeg−7および他のxmlベースのコンテンツ記述のバイナリ表現機能を改善する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080326 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080625 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080702 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080728 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080919 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20081217 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090116 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101227 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111130 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111205 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5001510 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |