JP5054663B2 - マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 - Google Patents

マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 Download PDF

Info

Publication number
JP5054663B2
JP5054663B2 JP2008321258A JP2008321258A JP5054663B2 JP 5054663 B2 JP5054663 B2 JP 5054663B2 JP 2008321258 A JP2008321258 A JP 2008321258A JP 2008321258 A JP2008321258 A JP 2008321258A JP 5054663 B2 JP5054663 B2 JP 5054663B2
Authority
JP
Japan
Prior art keywords
mpeg
decoder
description
extension
tbc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008321258A
Other languages
English (en)
Other versions
JP2009123225A (ja
JP2009123225A5 (ja
Inventor
ヴォルボルン ミヒャエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JP2009123225A publication Critical patent/JP2009123225A/ja
Publication of JP2009123225A5 publication Critical patent/JP2009123225A5/ja
Application granted granted Critical
Publication of JP5054663B2 publication Critical patent/JP5054663B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/25Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with scene description coding, e.g. binary format for scenes [BIFS] compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法に関する。
MPEG−7標準[1]のコンテキストにおいてマルチメディアデータの記述は記述子(D)と記述スキーム(DS)によって構成されており、この場合、記述要素(DまたはDS)の個数は可変である。MPEG−7におけるすべてのDおよびDSは、いわゆる記述定義言語(DDL)を使用して定義される[3]。また、MPEG−7はテキストフォーマット(XML)でもバイナリフォーマット(BiM)でも表現可能である[1]。MPEG−7を使用したアプリケーション間の共働を可能にするためには、MPEG−7において構成されるDおよびDSのセットを適正な時点で所定のポイントにおいて決定する必要がある。DDLによってMPEG−7のDSをまえもって定められたセット以上にさらに拡張し続けることができる一方、これら新たな(拡張された)DSの意味はそれを設計した人以外の誰にもわからない。
したがって本発明の課題は、マルチメディアデータのバイナリ記述のための拡張コードを供給する方法において、上述の従来技術の問題点を解消することにある。
本発明によればこの課題は、マルチメディアデータは、記述要素として記述子と記述スキームから成り、拡張ツリーブランチコードがマルチメディアデータバイナリフォーマットに含められており、デコーダは該拡張ツリーブランチコードを検出し、拡張ツリーブランチコードに基づき前記デコーダは、拡張された記述スキームの2つに分割されたパートのうち一方のパートはまえもって定義されベースとなる記述スキームと同一であり、他方のパートは前記拡張ツリーブランチコード以降に続くことになる拡張を記述していることを検出することにより解決される。
請求項1記載の方法によれば、バイナリフォーマットにおけるマルチメディア記述スキームのユーザ固有またはアプリケーション固有の拡張が提供され、その際、まえもって定義されているたとえばMPEG−7の記述スキームおよび拡張された記述スキームの双方に共通の記述スキームの部分におけるバイナリフォーマットが保存される。
従来技術によるマルチメディア記述スキームのためのバイナリフォーマットすなわちいわゆるBiMにより、テキストによる記述をバイナリ形式で表すことができる。DおよびDSのセットがたとえばMPEG−7のような標準で決定されたならば、定義されたそれらのDおよびDSを原則的にはさらに拡張することができるけれども、拡張されたDまたはDSのセマンティクスはその作成者にしかわからない。それにもかかわらず固有のDやDSをたとえばMPEG−7などのDやDSといっしょに使用する多数のアプリケーションのために、両方の種類に対し同じバイナリフォーマットを使用するのが非常に重要となる。基本的にBiMは、MPEG−7のDDLをベースとしているかぎりいずれの種類のDおよびDSにも使用することができる。しかし現行のBiMをMPEG−7のDまたはDSに適用し、かつMPEG−7のDまたはDSをベースとする拡張されたDSに適用すると、両方のDSのバイナリフォーマットは両方の事例において同一のDSの部分であっても異なるものになってしまう。
本発明の利点は、まえもって定義されたたとえばMPEG−7のDSと拡張されたDSの同一部分のバイナリフォーマットを同じままに保つことのできる手段が提供されることであり、その結果、拡張部分に対するバイナリフォーマットだけが異なるようになる。このことはマルチメディアデータバイナリフォーマットに拡張ツリーブランチコードを含めることによって達成される。
本発明のさらに別の観点として挙げられるのは、拡張ツリーブランチコード(tree branch code)TBCをポジションコードといっしょに使用できることである。
本発明のさらに別の観点によれば、MPEG−7固有の拡張ツリーブランチコード(TBC)をツリーブランチコード(TBC)テーブルに付加的にまたは択一的に含めることができる。このMPEG−7固有の拡張TBCをMPEG−7標準のDおよびDSの拡張に使用することができ、それらは将来のバージョン2,3等で定義されそうである。この種のMPEG−7固有の拡張TBCを含めることによって、所定の範囲まではMPEG−7標準のフォワードコンパチビリティ(forward compatibility)が許容される。ここでいうフォワードコンパチビリティとは、MPEG−7バージョン1のデコーダは、MPEG−7バージョン2+のDSのうち少なくともMPEG−7バージョン1のDSと合致している部分をデコーディングできるということである。さらに既存のMPEG−7バージョン1の内容を、バージョン1のDSから派生された将来のMPEG−7のDSに非常にたやすく組み込むことができる。
図面には従来技術を引き合いに出しながら本発明の実施形態が描かれており、以下でそれらの実施形態について詳しく説明する。
本発明の詳細について論じる前に、いくつかの定義殊にMPEG−7で使用される定義を示しておく。
現在開発中のMPEG−7標準のコンテキストにおいて、マルチメディア環境におけるオーディオビジュアルデータを記述するための記述構造が定義されている。したがって記述子(Description, D)および記述スキーム(Description scheme, DS)が、いわゆる記述定義言語(Description Definition Language, DDL)を用いて定義されている。本明細書の以降のコンテキストにおいて、以下の定義が使用される:
・データ Data:データはオーディオビジュアル情報であって、これは記憶やコーディング、表示、伝送、媒体あるいは技術にかかわらず、MPEG−7を使用して記述される。
・フィーチャ Feature:フィーチャは何かを誰かに知らせるデータにおいて他との区別を示す特徴である。
・記述子 Descriptor(D):記述子はフィーチャの表現である。記述子によってフィーチャ表現のシンタックスおよびセマンティクスが定義される。
・記述子値 Descriptor Value(DV):記述子値は、目下のデータを表す所定のデータセット(またはそのサブセット)に対する記述子のインスタンシエーションである。
・記述スキーム Description Scheme(DS):記述スキームは、記述子(D)および記述スキーム(DS)の両方とすることのできる各コンポーネント間の関係の構造およびセマンティクスを指定する。
・記述:1つの記述は、DS(構造)とデータを記述する記述子値(インスタンシエーション)のセットから成る。
・コーディングされた記述:コーディングされた記述は、圧縮効率、フォールトトラレンス、ランダムアクセス等のような関連する要求を満たすためにコーディングされた記述である。
・記述定義言語(DDL):記述定義言語は、新たな記述スキームおよび場合によっては記述子を生成することのできる言語である。さらにこれによって既存の記述スキームの拡張や変形も可能である。
記述の一番下のレベルは記述子である。これによって1つまたは複数のデータのフィーチャが定義される。これは個々のDVとともに、データの固有の部分を実際に記述するために使用される。次に上のレベルは記述スキームであり、これには少なくとも2つまたはそれよりも多くのコンポーネントおよびそれらの関係が含まれている。コンポーネントは記述子または記述スキームのどちらであってもよい。最も上のレベルは記述定義言語である。これはMPEG−7のDとDSを定義するために使用されるし、さらにたとえばMPEG−7のコンテキストで定義された既存のDSを拡張するなどしてユーザ固有またはアプリケーション固有の新たなDSを定義するためにも使用できる。
MPEG−7の記述を表現するために2つのオプションがある。最初のオプションは、eXtended Markup Language (XML) を使用したテキスト表現である。この表現は人間が読むことができるけれども、かなり冗長になる可能性がある。2番目のオプションはバイナリ表現であり、これはMPEG−7データのためのバイナリフォーマットである(Binary format for MPEG-7 Data, BiM)。BiMは人間には読めないが、帯域幅について効率的なMPEG−7データの記憶や伝送、DSの所定のコンポーネントへのランダムアクセスが可能となるし、さらにDSコンポーネントのフレキシブルな伝送順序が許容される。以下のセクションで、MPEG−7記述のテキストフォーマットとバイナリフォーマットについてさらに詳しく説明する。
MPEG−7データのためのテキストフォーマットはXML言語をベースとしている。これはいわゆる「XMLタグ」から成り、タグ間でデータの構造と意味を定義する。記述は階層的に組み立てられており、DSコンポーネントの開始を定義する各オープニングXMLタグごとに、DSコンポーネントの終了を定義するそれに対応するクロージングタグが設けられている。非常に簡単なDSの一例を以下に示す。DSの定義はDDLを使用することで行われ、これはMPEG−7のMDSパートに示されている[4]。
Figure 0005054663
括弧("<...>")内のテキストは、オープニングXMLタグおよびクロージングXMLタグを表す。タグ間のテキストは記述のデータ値を表す。上述の例では、英国のグループ "The Beatles" の"Help" という名称のオーディオトラックのタイトル、プレゼンタならびにジャンルが記述されている。この記述も図1に示したように記述ツリーとして描くことができる。この場合、実際のデータはツリーのリーフ中に含まれる一方、個々のブランチノードによって構造が与えられる。このツリー表現は、MPEG−7のバイナリフォーマットを理解するうえで非常に有用であり、これについて以下のセクションで説明する。
本発明において引き合いに出すマルチメディア記述のためのバイナリフォーマットに関する従来技術はMPEG−7 BiMとしており、これについては[2]に詳しく記載されている。ここではバイナリフォーマットについて、本発明を理解するうえで必要な範囲で説明する。
一般に、各MPEG−7記述はいわゆるMPEG−7ルート要素からスタートし、これには1つまたは複数のMPEG−7記述スキームを含めることができる。ルート要素の子であるMPEG−7のDSを以下では「トップレベル要素」と称する。すべてのMPEG−7記述は階層的に定義されているので、それらを図2に示されているように記述ツリーとして捉えることができる。
記述のツリー表現を使用しているので、以下の記述ではルート要素とトップレベル要素も「ルートノード」および「トップレベルノード」と称する。このツリー表現を、バイナリフォーマットのデコーディングの仕方を記述するためにも使用する。ルートノード情報はデコーダによって受け取られるので、ビットストリームの残りはいわゆるBiMフラグメントから成る。各フラグメントは基本的に図3に示されているようになる。
図示されているように、BiMフラグメントは主として4つのパートから成り、以下でこれらについて手短に説明する。第1のパートはいわゆる「ナビゲーションコマンド」であって、これは記述スキームのどのインスタンス化パートを次に受け取るかをデコーダに通知する。3種類のアドレッシング記述要素が可能である:
・デコーダが目下存在するノードに対し相対的なアドレッシング
・デコーダが目下存在するDSの目下のトップレベルノードに対する絶対的なアドレッシング
・ルートノードに対し相対的な絶対アドレッシング
BiMフラグメントとの次のパートはナビゲーションパスであって、つまりこれはデコーダがBiMフラグメント中に含められる情報を受け取りたいツリーノードに関する絶対アドレスまたは相対アドレスである。トップレベルDSのアドレス(識別子またはIDとも称する)は8bitのコードから成り、これは以下のテーブルで指定されている。ルートノードを離れてMPEG−7ビットストリームを終わらせることができるよう、トップレベルDS IDに加えて、「イクジットルート "exit root "」コマンドを通知する特定のビットコードが存在する。トップレベルDSの後続のサブ要素(子)のためのアドレスはローカルパスコードを使用して計算され、以下の説明ではこれをツリーブランチコードとも称する。
BiMフラグメントの第3のパートはいわゆる「コンテントマニピュレーションコマンド "content manipulation command" 」であって、これはデコーダに対し、どの種類のコンテントマニピュレーションをナビゲーションによりたったいま送られたノードに対してデコーダが受け取るのかを通知する。この場合、3つの可能なコマンドが設けられており、つまりそれらのコマンドとはサブツリーの追加 "add"、サブツリーの更新 "update"、ならびにサブツリーの削除 "delete" である。サブツリーには、デコーダが目下存在するノード要素が含まれている。そしてコマンドが実行される。追加 "add" または更新 "update" の場合、サブツリーのコンテントはBiMフラグメントの第4のコンポーネント内に含まれる。削除 "delete" の場合、BiMフラグメントの第4のコンポーネントは空である。コマンドが実行された後(つまりサブツリー情報がデコーディングされるかまたは既存のサブツリーが削除された後)、デコーダは暗黙的にその親のノードに戻る。
BiMフラグメントのコンテントマニピュレーションセクションは2つのパートから成り、すなわちそれらはコンテントマニピュレーションコマンドとサブツリーバイナリ表現である。ナビゲーションパスを含むナビゲーションコマンドの終了後、コンテントマニピュレーションコマンドを待つ。同様に、サブツリーのバイナリ表現を含むコンテントマニピュレーションコマンドの終了後、ナビゲーションコマンドを待ち、これは新たなBiMフラグメントの開始である。デコーダの初期化時はカレントノードがルートノードにデフォルトとして設定され、ナビゲーションコマンドを待つ。BiM中に定義されるコンテントマニピュレーションコマンドに関するコードテーブルを表1として以下に示す。
Figure 0005054663
コマンドがカレントノードに適用される。ナビゲーション後のカレントノード(記述ツリー中の個々のポジション)は、ターミネーションTBC(図4参照)を除いて完全なナビゲーションパスにより参照されるノードである。この場合、コンテントマニピュレーションコマンド(追加 add、更新 update、削除 delete)は、カレントノード自身を含むサブツリーに適用される。コンテントマニピュレーションコマンドが発行された後、カレントノードがナビゲーション後のノードの父 father にセットされる。
コマンドコードテーブルには以下のコードが含まれている:
・AddSubtree:ツリー中のカレントポジションを含むサブツリーを追加。このコマンドに続いてサブツリー全体のバイナリ表現がくる。AddSubtree コマンドが発行された後、カレントノードがナビゲーション後のカレントノードの父 father にセットされる。
・UpdateSubtree:ツリー中のカレントポジションを含むサブツリーを更新。このコマンドに続いてサブツリー全体のバイナリ表現がくる。UpdateSubtree コマンドが発行された後、カレントノードがナビゲーション後のカレントノードの父 father にセットされる。
・DleteSubtree:ツリー中のカレントポジションを含むサブツリーを削除。DeleteSubtree コマンド発行後、カレントノードがナビゲーション後のカレントノードの父にセットされる。
カレントノードが単純型の要素または属性であるならば、コマンド直後にバイナリコンテント表現が続く。コマンド実行後、デコーダはナビゲーションモードに戻る。
BiMフラグメントのナビゲーションセクションは2つのパートに分割され、それらはすなわちナビゲーションコマンドとナビゲーションパスである。ナビゲーションコマンドは2bitの固定ビット長であり、それに続いて可変長のナビゲーションパスが設けられる。ナビゲーションパスは連続的なツリーブランチコード(TBC)から成り、そこにおいて各TBCは記述ツリー内部のあるノードにおけるパスのフラクションを記述する。したがってナビゲーションパスはローカルナビゲーションパスのシーケンスであり、これはツリーを通るパス中に含まれる各ノードにおけるツリーブランチを指定する(図6参照)。ナビゲーションコマンドによって、表2中で指定されているようにナビゲーションパスをどのように解釈すべきかを指定する。
Figure 0005054663
ナビゲーションコマンドのパラメータでありビットストリーム中のナビゲーションコマンドコードに続く<TBC>は、インスタンス化された記述のベースとなるMPEG−7スキーマから生成される。スキーマ定義によって、種々のTBCによりアドレッシングされるべき記述中の1つのノードの可能な子 children が指定される。スキーマ定義中、子の可能な型およびそれらの最大オカレンス数が指定される。個々の記述ノードに関してインスタンス化された要素内のツリーブランチに従い、TBCは子要素の仕様(SchemaBranch)および1回以上インスタンス化可能ならばポジションが含まれる。1つのナビゲーションパス全体は、連続的なツリーブランチコード(Tree Branch Code, TBC)の順序づけられたリストとして構成される。
コードテーブルおよびそのTBCは、複合型 complexType の指定されたすべての要素または記述スキーム中の指定された複合型 complexType について固有のものである。したがってナビゲーションのために、インスタンス化された要素の型により使用されるコードテーブルも決定される。したがって同じ複合型のノードに関するすべての要素は同じコードテーブルを有する。1つのノードにおける各々の子要素および属性はそれを参照する符号語に割り当てられる。これらの符号語はツリーブランチコード(Tree-Branch-Code, TBC)と呼ばれ、以下で説明する規範的アルゴリズムにより記述スキームから生成される。
上述のようにTBCは2つのパートによって構成されている。すなわち1つはスキーマブランチ SchemaBranch であって、これはスキーマ中で指定された種々の子要素の定義に対応し、もうひとつはポジションであって、これはスキーマ定義に従いこの子の多数のオカレンスが可能であるときにのみ存在する。記述ツリー内のナビゲーションのため、父のノードを参照するためのコードも設けられている。さらに、パスをターミネートしコマンドモードへ暗黙的にスイッチするためにコードが用いられる。表3にはこの種のコードテーブルのプロトタイプが示されている。
Figure 0005054663
TBCの割り当ては下記のルールに従い実行される:
・種々の子の数は記述スキームから既知であり、これにより以下のルールに従いTBCのスキーマブランチ SchemaBranch ビットフィールドの長さが定義される
Figure 0005054663
・オール0のスキーマブランチ SchemaBranch コードは、父のノードへの参照に常に割り当てられる。
・子を参照するスキーマブランチコードは、ISO/IEC 15938 の個々のパートにおいて指定された指定されたその要素または型のスキーマ定義中に定義された順序でシーケンシャルに割り当てられる。
・オール1のスキーマブランチコードは、パスをターミネートしコマンドモードにスイッチするために常に使用される。
・1つの子が多数のオカレンスを持つことができるならば、フィールド<#position>により以下のルールに従いインスタンス化された記述中の子の個数が指定される:フィールド #position のビット表現は、スキーマ定義におけるmaxOccur の個数を表すために必要とされる最小ビット数である。このビット数が3を超えるならば、最初のビット(Ext)は4つのビットの拡張が存在するのかを指定する(図5参照)。この4つのビットは、以降で拡張が8bitである点を除いて先行する4つのビットと同じセマンティクスをもち、その8bitのうち最初のビットは拡張を通知するために予約されている。代替グループにグループ分けされた要素は付加的に、TBCの後の属性としてこの代替グループ内のアドレスをコーディングしなければならない(これは上述の例の図面には示されていない)。この付加的なコードは SubstGrpSelect と呼ばれる。代替グループ内の各要素は SubstGrpSelect に割り当てられる。要素を参照する SubstGrpSelect コードは、ゼロから始まってスキーマ定義中に定義された順序でシーケンシャルに割り当てられる。
単純型 simpleType の属性、要素および指定された単純型 simpleType は、1つのリーフテーブルによって表される。この種のリーフテーブルのプロトタイプを表4として示す。
Figure 0005054663
1つのパスはTBCを連結することによって作成される。リーフノードを除いてすべてのノードはその父への参照をもっているので、相対パスを使用するならば記述ツリー階層において上へ向かって動かすこともできる。
絶対ナビゲーションおよび相対ナビゲーションは、後続のコンテントマニピュレーションコマンドを適用するツリー構造内のインスタンスノードの位置決定を目的としている。絶対パスは、インスタンス構造のMPEG−7記述ルートまたはカレントノードのトップレベルからターゲット要素までの経路を表すのに対し、相対パスは個々のノードのカレントポジションから始まるパスを指定しようというものである(図6参照)。
本発明はナビゲーションモードの拡張に係わるものであって、殊にいわゆるツリーブランチコードの方法論を拡張することに係わる。以下のセクションでこのことについて詳しく説明する。
マルチメディア記述スキームのための従来技術のバイナリフォーマットすなわちいわゆるBiMによって、テキスト形式の記述をバイナリ形態で存在させることができる。たとえばMPEG−7のような標準においてDおよびDSのセットが確定されると、定義されたDおよびDSは基本的にさらに拡張可能であるが、拡張されたDまたはDSのセマンティクスはその作者しかわからない。それにもかかわらず、固有のDとDSをたとえばMPEG−7のDおよびDSといっしょに使用する多くのアプリケーションにとって、両方の種類のために同じバイナリフォーマットを使用するのが非常に重要になる。原則的にBiMは、MPEG−7のDDLをベースとするかぎり、DとDSのどちらの種類にも使用することができる。しかし現行のBiMをMPEG−7のDまたはDSに適用し、かつMPEG−7のDまたはDSをベースとする拡張されたDSにも適用すると、両方の事例において同一であるDSのパートであっても両方のDSのバイナリフォーマットが異なってしまう。図7にはその事例が示されている。この図には単純なMPEG−7のDSと拡張されたDSが示されている。拡張されたDSは、1つのノード "DiCo" をノード "Lang" に加えることでMPEG−7のDSから派生している。しかしながら各ノードに関するTBCテーブルはその子の目下の個数に左右されるので、ノード "LaCo" のアドレスは両方の事例で異なる。つまりMPEG−7の事例では(ノード "Clas" に対し相対的に)"010 001 111" となる。拡張されたDSについてアドレスは(ノード "Clas" に対し相対的に) "010 010 111" となる。ここでわかるように、拡張がなされているノードの子のアドレスは変わっており、したがってMPEG−7のバイナリフォーマットのその部分も変化することになる。
本発明の利点は、まえもって定義されているDSたとえばMPEG−7のDSと拡張されたDSの同一のパートにおけるバイナリフォーマットを同じままにしておく手段が得られるので、拡張パートに対するバイナリフォーマットのみしか異ならないようになる。このことはBiM中に「拡張ツリーブランチコード "extension tree branch code」を含ませることにより達成され、これによりこのコード以降はまえもって定義されたDSについてのいくつかの拡張が続くことになることが通知される。これにより拡張されたDSを2つのパートに分けることができる。この場合、一方のパートはベースのDSと同一であり、すなわちまえもって定義された(たとえばMPEG−7の)DSであり、拡張されたDSはこれをベースとしており、他方のパートはベースのDSについてDSの拡張を記述している。この場合、第1のパートは、1つまたは複数のBiMフラグメントおよび第2のパートによって表すことができる。このようにすることで、拡張されたコードにおいてMPEG−7と合致したパートを符号変換する必要なく抽出するのが非常に簡単になる。さらに、拡張されたDSのユーザにとって拡張DSの一部分であるMPEG−7のDSへのアクセスおよび利用も格段に簡単になり、この場合も内容全体を符号変換する必要がない。それぞれまったく異なるニーズをもつ多数のアプリケーションが存在するが、それらは部分的にMPEG−7のDSを使用するけれども、それらのニーズを満たす目的でおそらくは拡張を望むであろうから、MPEG−7と非MPEG−7のDSの簡単なコンビネーションは将来、非常に重要になる。
本発明の全般的な着想は、「拡張ツリーブランチコード "extension tree branch code"」をBiMに含めることであり、これによってこのコード後には拡張された事前に定義された(たとえばMPEG−7などの)DSの拡張パートが続くことが通知される。したがって以下で示すように、項目「拡張ツリーブランチコード "extension tree branch code"」が複合型のツリーブランチコードに関する表3に含められる。
Figure 0005054663
指定された複合型または要素に対しこのようなTBCテーブルを形成する目的で、TBCを割り当てるための本来のルールを以下のとおり変更する:
・種々の子の個数は記述スキームから知られており、以下のルールに従いTBCにおける SchemaBranch ビットフィールドの長さが定義される。
Figure 0005054663
・オール0の SchemaBranch コードは常に父のノードへの参照に割り当てられる。
・子を参照する SchemaBranch コードは、ISO/IEC 15938 の個々のパートにおいてこの指定された要素または型のスキーマ定義中で定義されている順序でシーケンシャルに割り当てられる。
・オール1のSchemaBranch コードは、パスのターミネーションおよびコマンドモードへのスイッチのために常に使用される。
・1つの子が複数のオカレンスをもつことができるならば、あるいは複数のオカレンスをもつことのできる拡張TBCであるならば、フィールド<#position>によって以下のルールに従いインスタンス化された記述中の子の数が指定される:フィールド #position のビット表現はスキーマ定義中の maxOccur の個数を表すのに必要とされる最小ビット数である。このビット数が3を超えたならば、最初のビット(Ext)は4ビットの拡張が存在するかを指定する(図5参照)。これら4つのビットは、それ以降は拡張が8ビットであり最初のビットは拡張を通知するために予約されている点を除いて、先行の4つのビットと同じである。
このように変更することで、まえもって定義された(たとえばMPEG−7などの)DおよびDSのためにも、MPEG−7をベースとする拡張されたDおよびDSのためにも、BiMを使用することができるようになり、さらに両方のDSにおいてMPEG−7と合致したパートについてバイナリフォーマットを同じままに保つことができる。しかも、まえもって定義された(たとえばMPEG−7などの)DおよびDSと拡張されたDおよびDSのために、同じBiMエンコーダおよびデコーダを使用することができる。図8には、MPEG−7ベースのDSと拡張されたパートの拡張されたDSインスタンスのツリー表現を描くことで、拡張TBCの利用に関する一例が描かれている。ここに示されているように、2つのサブツリーの各々を1つまたは複数のBiMフラグメントによって表すことができる。しかしMPEG−7と合致したDSのパートのBiMフラグメントのフォーマットはMPEG−7のDS事態のものと同じである。
本発明の別の観点によれば、拡張ツリーブランチコードTBCをポジションコードといっしょに使用することができる(たとえば表5を参照)。このポジションコードは何度も現れてよいDSノードの子の場合に使用される。表5に定義されているようにポジションコードがディスエーブル(表のエントリが "--")である拡張TBCであれば、1つのDSノードにおいてただ1つの拡張TBCだけしか現れてはならない。オプションとしてポジションコードをイネーブルにすることもでき、そうすることで1つのDSノードにおいて2つ以上の拡張TBCが許可されるようになる。これはごく小さい変更しか生じないDSの拡張の事例に対して殊に有利である。図9にはやはり、個々の拡張DSパートのツリー表現を描くことで多数の拡張TBCの一例が示されている。やはりすべてのサブツリーは1つまたは複数のBiMフラグメントによって表現されており、MPEG−7のDSのBiMフラグメントのフォーマットが保たれることになる。
本発明の別の観点によれば付加的または択一的に、MPEG−7固有の拡張ツリーブランチコード(TBC)をツリーブランチコード(TBC)テーブルに含めることができる。このMPEG−7固有の拡張TBCを、将来のバージョン2,3等で定義される可能性の高いMPEG−7標準のDおよびDSの拡張に使用することができる。このようなMPEG−7固有の拡張TBCを含めることによって、所定の範囲までMPEG−7標準のフォワードコンパチビリティが許容される。ここでいうフォワードコンパチビリティとは、MPEG−7バージョン1のデコーダは、MPEG−7バージョン2+のDSのうち少なくともMPEG−7バージョン1のDSと合致した部分をデコーディングできるということである。さらに、既存のMPEG−7バージョン1の内容をバージョン1のDSから派生した将来のMPEG−7のDSに組み入れるのが非常に容易になる。
参考文献
[1] ISO/IEC, "Introduction to MPEG-7", Doc. ISO/IEC JTC1/SC29/WG11 N3751, La Baule, France, October 2000.
[2] ISO/IEC, "Text of ISO/IEC CD 15938-1 Information technology - Multimedia content description interface: Systems", Doc. ISO/IEC JTC1/SC29/WG11 N3701, La Baule, France, October 2000.
[3] ISO/IEC, "Text of ISO/IEC CD 15938-2 Information technology - Multimedia content description interface: Description Definition Language", Doc. ISO/IEC JTC1/SC29/WG11 N3702, La Baule, France, October 2000.
[4] ISO/IEC, "Text of ISO/IEC CD 15938-5 Information technology - Multimedia content description interface: Description Definition Language", Doc. ISO/IEC JTC1/SC29/WG11 N3705, La Baule, France, October 2000.
ある特定の例に関するMPEG−7記述のツリー表現を示す図 MPEG−7記述のツリー表現の一例を示す図 BiMフラグメントの構造を示す図 BiMフラグメント内部の種々の状態に関するカレントモードのポジションを示す図 各要素に関するポジションのビット表現をオカレンスとともに示す図。 6.aはルートノードに関して絶対パスを示す図であり、6.bはトップレベルノードに関して絶対パスを示す図であり、6.cはカレントノードに関して相対パスを示す図 MPEG−7のDSと拡張MPEG−7のDSのツリー表現を示す図 あるDSノードにおいて単一の拡張TBCを使用する例を示す図 あるDSノードにおいて複数の拡張TBCを使用する例を示す図

Claims (6)

  1. マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法において、
    前記マルチメディアデータは、記述要素として記述子(D)と記述スキーム(DS)から成り、拡張ツリーブランチコード(TBC)がマルチメディアデータバイナリフォーマット(BiM)に含められており、
    前記デコーダは該拡張ツリーブランチコード(TBC)を検出し、該拡張ツリーブランチコード(TBC)に基づき前記デコーダは、拡張された記述スキーム(DS)の2つに分割されたパートのうち一方のパートはまえもって定義されベースとなる記述スキーム(DS)と同一であり、他方のパートは前記拡張ツリーブランチコード(TBC)以降に続くことになる拡張を記述していることを検出することを特徴とする、
    マルチメディアデータのバイナリ記述のための拡張コードをデコーダによりデコーディングする方法。
  2. 前記まえもって定義されベースとなる記述スキーム(DS)はMPEG−7の記述スキーム(DS)である、請求項1記載の方法。
  3. 少なくとも前記一方のパートが前記マルチメディアバイナリフォーマット(BiM)における1つまたは複数のBiMフラグメントにより表され、該フラグメントにより拡張記述スキーム(DS)のうちMPEG−7と合致したパートは、前記デコーダにより符号変換されることなく抽出される、請求項1または2記載の方法。
  4. 1つの記述スキーム(DS)のノードにおいて2つ以上の拡張を可能にするため、前記拡張ツリーブランチコード(TBC)がポジションコードといっしょに使用される、請求項1から3のいずれか1項記載の方法。
  5. MPEG−7標準の記述子(D)および記述スキーム(DS)の拡張を定義してフォワードコンパチビリティを可能にするために、MPEG−7固有の拡張ツリーブランチコード(TBC)が含まれている、請求項1から4のいずれか1項記載の方法。
  6. 拡張を伴うMPEG−7のデータのためのバイナリフォーマットは、ナビゲーションコマンドとナビゲーションパスとコンテンツマニピュレーションコマンドとサブツリーバイナリ表現であって、
    前記デコーダは、前記ナビゲーションパスを含む前記ナビゲーションコマンドを実行し、記述スキーム(DS)のどのパートを次に受け取ることになるのかの情報を検出し
    前記ナビゲーションパスは、前記デコーダがMPEG−7データフォーマット中に含まれる情報を受け取るツリーノードのアドレスをし、
    前記デコーダは、前記ナビゲーションコマンドの終了後、コンテンツマニピュレーションコマンドを待ち、
    前記デコーダは、前記サブツリーバイナリ表現を含む前記コンテンツマニピュレーションコマンドを実行し、前記サブツリーに対しどのようなコンテンツマニピュレーションを受け取るのかの情報を検出し、
    前記デコーダは、前記コンテンツマニピュレーションコマンドの終了後、ナビゲーションコマンドを待つ、
    請求項1から5のいずれか1項記載の方法。
JP2008321258A 2001-01-08 2008-12-17 マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法 Expired - Fee Related JP5054663B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01100441.3 2001-01-08
EP01100441A EP1223759A1 (en) 2001-01-08 2001-01-08 Method for providing an extension code for a binary description for multimedia data

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002555536A Division JP5001510B2 (ja) 2001-01-08 2001-12-21 マルチメディアデータのバイナリ記述用拡張コードを供給する方法

Publications (3)

Publication Number Publication Date
JP2009123225A JP2009123225A (ja) 2009-06-04
JP2009123225A5 JP2009123225A5 (ja) 2009-07-16
JP5054663B2 true JP5054663B2 (ja) 2012-10-24

Family

ID=8176166

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002555536A Expired - Fee Related JP5001510B2 (ja) 2001-01-08 2001-12-21 マルチメディアデータのバイナリ記述用拡張コードを供給する方法
JP2008321258A Expired - Fee Related JP5054663B2 (ja) 2001-01-08 2008-12-17 マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2002555536A Expired - Fee Related JP5001510B2 (ja) 2001-01-08 2001-12-21 マルチメディアデータのバイナリ記述用拡張コードを供給する方法

Country Status (5)

Country Link
US (1) US7697613B2 (ja)
EP (2) EP1223759A1 (ja)
JP (2) JP5001510B2 (ja)
KR (1) KR100855192B1 (ja)
WO (1) WO2002054775A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2197210A3 (de) * 2000-12-22 2010-08-11 Siemens Aktiengesellschaft Verfahren zur Verbesserung der Funktionalität der binären Repräsentation von MPEG-7 und andere XML basierten Inhaltsbeschreibungen
WO2002063775A2 (en) * 2001-02-05 2002-08-15 Expway Method and system for compressing structured documents
EP1276324B1 (en) * 2001-07-13 2006-10-04 France Telecom Method for compressing a hierarchical tree, corresponding signal and method for decoding a signal
KR100493674B1 (ko) * 2001-12-29 2005-06-03 엘지전자 주식회사 멀티미디어 데이터 검색 및 브라우징 시스템
JP2004318188A (ja) * 2002-09-26 2004-11-11 Victor Co Of Japan Ltd 構造化データの受信プログラム
DE10339971A1 (de) * 2002-12-03 2004-07-01 Siemens Ag Verfahren zur Codierung eines XML-basierten Dokuments
US9460064B2 (en) * 2006-05-18 2016-10-04 Oracle International Corporation Efficient piece-wise updates of binary encoded XML data
US8331433B2 (en) 2006-08-31 2012-12-11 Samsung Electronics Co., Ltd. Video encoding apparatus and method and video decoding apparatus and method
JP4360428B2 (ja) * 2007-07-19 2009-11-11 ソニー株式会社 記録装置、記録方法、コンピュータプログラムおよび記録媒体
EP2388701A1 (en) * 2010-05-17 2011-11-23 Siemens Aktiengesellschaft Method and apparatus for providing a service implementation
US9171401B2 (en) 2013-03-14 2015-10-27 Dreamworks Animation Llc Conservative partitioning for rendering a computer-generated animation
US9218785B2 (en) 2013-03-15 2015-12-22 Dreamworks Animation Llc Lighting correction filters
US9589382B2 (en) 2013-03-15 2017-03-07 Dreamworks Animation Llc Render setup graph
US9811936B2 (en) 2013-03-15 2017-11-07 Dreamworks Animation L.L.C. Level-based data sharing for digital content production
US9208597B2 (en) * 2013-03-15 2015-12-08 Dreamworks Animation Llc Generalized instancing for three-dimensional scene data
US9659398B2 (en) 2013-03-15 2017-05-23 Dreamworks Animation Llc Multiple visual representations of lighting effects in a computer animation scene
US9230294B2 (en) 2013-03-15 2016-01-05 Dreamworks Animation Llc Preserving and reusing intermediate data
US9626787B2 (en) 2013-03-15 2017-04-18 Dreamworks Animation Llc For node in render setup graph
US9514562B2 (en) 2013-03-15 2016-12-06 Dreamworks Animation Llc Procedural partitioning of a scene

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03282646A (ja) * 1990-03-29 1991-12-12 Nec Corp レコード格納制御方式
KR0151113B1 (ko) * 1995-03-28 1998-10-15 김광호 엠피이지 디코더의 동벡터 디코더
KR100259471B1 (ko) * 1997-06-25 2000-06-15 전주범 개선된형태부호화장치및방법
JP3312688B2 (ja) * 1999-01-06 2002-08-12 富士ゼロックス株式会社 ハイパーテキスト装置
US6490370B1 (en) * 1999-01-28 2002-12-03 Koninklijke Philips Electronics N.V. System and method for describing multimedia content
EP1158420A1 (en) * 2000-05-24 2001-11-28 Robert Bosch Gmbh Method for a description of audio-visual data content in a multimedia environment
EP2197210A3 (de) * 2000-12-22 2010-08-11 Siemens Aktiengesellschaft Verfahren zur Verbesserung der Funktionalität der binären Repräsentation von MPEG-7 und andere XML basierten Inhaltsbeschreibungen

Also Published As

Publication number Publication date
JP2009123225A (ja) 2009-06-04
US7697613B2 (en) 2010-04-13
KR20040018326A (ko) 2004-03-03
WO2002054775A2 (en) 2002-07-11
EP1352525B1 (en) 2013-02-20
US20040109501A1 (en) 2004-06-10
EP1223759A1 (en) 2002-07-17
EP1352525A2 (en) 2003-10-15
KR100855192B1 (ko) 2008-09-01
WO2002054775A3 (en) 2002-11-07
JP2004517422A (ja) 2004-06-10
JP5001510B2 (ja) 2012-08-15

Similar Documents

Publication Publication Date Title
JP5054663B2 (ja) マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法
US7844895B2 (en) Method for improving the functionality of a binary representation
US7263490B2 (en) Method for description of audio-visual data content in a multimedia environment
US20070234192A1 (en) Encoding and distribution of schema for multimedia content descriptions
US7251277B2 (en) Efficient means for creating MPEG-4 textual representation from MPEG-4 intermedia format
US7797346B2 (en) Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions
JP5553466B2 (ja) バイナリマルチメディアデータを含むビットストリームを生成するための方法
JP4847943B6 (ja) Mpeg−7および他のxmlベースのコンテンツ記述のバイナリ表現機能を改善する方法
JP4668273B2 (ja) Xmlを基礎とする文書の符号化のための方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090514

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110727

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111025

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111028

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111124

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111129

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120727

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees