JP2006528368A

JP2006528368A - オーディオファイルフォーマット変換

Info

Publication number: JP2006528368A
Application number: JP2006520732A
Authority: JP
Inventors: シュテファンガヤーズベアガー; ハラルドゲアンハート; ベアンハードグリル; ミヒェルヘアトル; ジョーハンヒルペアト; マンフレードルツキ; マーティンバイスハート; ハラルドポップ
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ
Priority date: 2003-07-21
Filing date: 2004-07-13
Publication date: 2006-12-14
Anticipated expiration: 2024-07-13
Also published as: EP1647010B1; CA2533056A1; JP4405510B2; AU2004301746B2; US20060259168A1; KR100717600B1; NO334901B1; WO2005013491A2; RU2006105203A; AU2004301746A1; EP1647010A2; NO20060814L; WO2005013491A3; US7769477B2; RU2335022C2; BRPI0412889A; PL1647010T3; KR20060052854A; CA2533056C; MXPA06000750A

Abstract

オーディオデータの操作は、例えば、個々のオーディオデータストリームをマルチチャンネルオーディオデータストリームに組み合わせる、あるいは、修正されるデータブロックをもつ第２オーディオデータストリームを得るため、データブロックが、データブロックの量すなわちデータ量をそれぞれ、あるいはデータブロックの量すなわちデータ量をそれぞれ示す長さ指標を含むよう、データブロックを完了もしくは追加、あるいはその一部を置き換えること等により、判定ブロック１４，１６およびデータブロックオーディオデータ１８をもつデータブロック１０ａ，１０ｂに分割されるオーディオデータストリーム１０のデータブロックを修正することでオーディオデータストリームを全般的に操作するといったやり方で単純化できる。その他、判定ブロックに関係付けられる判定ブロックオーディオデータを示す判定ブロック１４，１０のポインタをもつもののさまざまなデータブロック内で分配されるオーディオデータストリーム１０がオーディオデータストリームに変換され、ここで判定ブロックオーディオデータ４４，４６が近接判定ブロックオーディオデータ４８に結合される。近接判定ブロックオーディオデータ４８はその後、その判定ブロック１４，１６とともに内蔵チャンネル要素５２ａ内に含めることができる。

Description

本発明は、オーディオ用信号の符号化を行うオーディオデータストリーム、特に、ＭＰ３フォーマットの場合のように時間マークに関係付けられるオーディオデータをさまざまなデータブロック内で分配できるファイルフォーマットでオーディオデータストリームを操作する改良法に関する。

ＭＰＥＧオーディオ圧縮は、音楽あるいは映画用音声といったオーディオ用信号をデジタルフォーマットで保存する場合、特に効果的な方法であるが、一方で可能な限り少ないメモリ容量しか必要とせず、他方でオーディオ品質を可能な限り維持するためのものである。近年、ＭＰＥＧオーディオ圧縮はこの分野において最も成功した解決策の１つであることが証明されてきた。

一方、ＭＰＥＧオーディオ圧縮法のさまざまなバージョンも存在する。一般に、オーディオ用信号はあるサンプル率でサンプリングされ、オーディオサンプルで得られた結果は、重なり時間あるいは時間マークにそれぞれ関係付けられる。これらの時間マークはその後、例えば、多相構成のハイブリッドフィルタバンクやエイリアシング効果を抑える修正離散コサイン変換（ＭＤＣＴ）に対して個別に供給される。実際のデータ圧縮はＭＤＣＴ係数の量子化中に行われる。このようにして量子化されたＭＤＣＴ係数はその後、ハフマン符号ワードのハフマン符号に変換され、短い符号ワードをさらに頻繁に現れる係数と関係付けることでさらなる圧縮を行う。このように、全体として、ＭＰＥＧ圧縮は損失が多い、すなわち”オーディオ”損失があるが、ＤＣＴ係数を量子化する方式に心理音響学的知見が組み込まれていることから、この損失は限定される。

広範に用いられているＭＰＥＧ標準は、ＩＳＯ／ＩＥＣ１１１７２−３および１３８１８−３で説明されているいわゆるＭＰ３標準である。この標準により、圧縮で生じる情報損失を、オーディオ情報がリアルタイムで送信されるビット率に適用させることができるようになる。一定のビット率をもつチャンネルでの圧縮データ信号送信は他のＭＰＥＧ標準でも実施される。受信復号器における聴取品質が、低ビット率においても確実に十分であり続けるようにするため、ＭＰ３標準がいわゆるビット受信機をもつＭＰ３符号器に対して提供される。つまりこういうことである。通常、固定ビット率のため、ＭＰ３復号器は各時間マークを同一サイズの符号ワードのブロックに符号化し、このブロックがその後、時間周期繰り返し率の時間周期におけるあるビット率で送信される。しかし、１つの音楽における非常に騒がしい音に続くと音といったオーディオ用信号の一部では、複数の異なる楽器による部分といったオーディオ用信号の他の部分に比べて一定の品質で低い精緻度での量子化が必要である。これにより、ＭＰ３符合器は、全フレームに対する同一フレーム長の１つのフレームで各時間マークが符号化される１つのビットストリームフォーマットを生成しない。このような内蔵フレームはフレームヘッダ、サイド情報、フレームに関係付けられた時間マークに関係付けられた主データ、すなわち符号化されたＭＤＣＴ係数で構成されるが、ここでサイド情報は、どのＤＣＴ係数が主データに順次含まれるかを示すため、どれだけの数の次位ＤＣＴ係数が０であるかといった、ＤＣＴ係数がどのように復号されるかという復号器に対する情報である。むしろ、バックポインタは、サイド情報、あるいは前フレームの１つの主データ内の位置を示すヘッダ内に含まれる。この位置は、対応するバックポインタが含まれ、フレームが関係付けられる時間マークに関係する主データの開始点である。バックポインタは、例えば、主データの開始点がビットストリーム内でオフセットされるビット数を示す。これらの主データの終了点は、この時間マークに対する圧縮率がどれほど高いかにより、任意のフレーム内でもありうる。個々の時間マークの主データの長さはこのように一定ではない。このようにブロックが符号化されるビット数は信号の特性に対して適合できる。同時に、定ビット率も達成可能である。この技法は”ビット・リザーバ”と呼ばれる。一般に、ビット・リザーバはビットのバッファであり、定出力データ率により一般に許されるものよりも、時間サンプルのブロックを符号化するためにさらに多くのビットをもたらすために用いることができる。ビット・リザーバの技法では、オーディオサンプルのあるブロックが定送信率で指定されるものよりも少ないビット数で符号化できるという事実を利用するため、これらのブロックがビット・リザーバを埋め、他のオーディオサンプルブロックがそのような高圧縮を許さない心理音響学的性質をもつため、利用可能なビットは、実際には、これらのブロックの低干渉あるいは干渉のない復号それぞれに対しては十分ではない。必要な過剰ビットはビット・リザーバから取られるため、そのようなブロックの間にビット・リザーバは空になる。ビット・リザーバの技法もまた、上で示した標準ＭＰＥＧレイヤ３でも説明される。

ＭＰ３フォーマットには符号器側にとってバックポインタをもたらすことで利点はないが、復号器側にとっては否定しがたい不利な点がある。例えば、途中のあるフレームの開始点からではなく始めからＭＰ３ビットストリームを復号器が受信する場合、このフレームに関係付けられる時間マークにおける符号化されたオーディオ用信号は、バックポインタが偶然０である場合だけすぐにプレイできるが、これはこのフレームに対する主データの開始点がヘッダあるいはサイド情報それぞれの直後に偶然あるということを示す。しかし通常はこのようなことはない。このため、受信されたフレームのバックポイントがまず、まだ受信されていない前フレームをさす場合、この時間マークでオーディオ信号をプレイすることは不可能である。この場合、（まず）次フレームだけがプレイできる。

一般にフレームを取り扱う際に受信機側で発生する更なる問題点は、バックポインタで相互結合されるものであるため、内蔵されないということである。ビット・リザーバに対する返信アドレスをもつビットストリームのさらなる問題点は、オーディオ用信号の異なるチャンネルが個別にＭＰ３で符号化される際に、２つのビットストリームでお互いに関係する主データが同一の時間マークで関係付けられているためにお互いにオフセットされ、フレームシーケンスにわたる変動オフセットでも、マルチチャンネルオーディオデータストリームへのこれらの個々のＭＰ３ストリームの結合が阻害されるということである。

さらに、簡単に管理できるＭＰ３に準拠しているマルチチャンネルオーディオデータストリームの生成に対する簡単な方法に対する要求もある。ＩＳＯ／ＩＥＣ標準１３８１８−３によるマルチチャンネルＭＰ３オーディオデータストリームでは、復号器側での送信チャンネルから入力チャンネルを検索するためのマトリクス操作と複数のバックポインタの利用が必要であるため、操作が複雑になる。

ＭＰＥＧ１／２レイヤ２オーディオデータストリームは、後に続くフレームの構造でフレームの構成と配置、すなわちヘッダの構造、サイド情報、主データ部、さらにフレーム毎に変わりうるサンプル率およびビット率に応じた準定常フレーム距離での配置でのＭＰ３オーディオデータストリームに対応するが、符号化中におけるバックポインタあるいはビット・リザーバがそれぞれないことからこれとは異なっている。オーディオ用信号の符号化費用のかかる、また費用のかからない時間周期は同一のフレーム長で符号化される。時間マークに関係する主データは各ヘッダとともに各フレーム内にある。

ＭＰ３−標準ＩＳＯ／ＥＰＣ１３８１８−３ＭＰ３−標準ＩＳＯ／ＥＰＣ１１１７２−３

本発明の目的は、オーディオデータストリームをさらにオーディオデータストリームに変換する、あるいはその逆を行うためのスキームを提供し、それにより、個々のオーディオデータストリームをマルチチャンネルオーディオデータストリームに結合する、あるいはオーディオデータストリームを一般的に取り扱うといったオーディオデータを用いた操作が簡単になるというものである。

この目的は、請求項１，１０，１３，１４あるいは１５による方法および請求項１６，１８，１９，２０あるいは２１による装置により達成される。

オーディオデータの操作は、例えば、個々のオーディオデータストリームをマルチチャンネルオーディオデータストリームに組み合わせる、あるいは、修正されるデータブロックをもつ第２オーディオデータストリームを得るため、データブロックが、データブロックの量すなわちデータ量をそれぞれ、あるいはデータブロックの量すなわちデータ量をそれぞれ示す長さ指標を含むよう、データブロックを完了もしくは追加、あるいはその一部を置き換えること等により、判定ブロックおよびデータブロックオーディオデータをもつデータブロックに分割されるオーディオデータストリームのデータブロックを修正することでオーディオデータストリームを全般的に操作するといったやり方で単純化できる。その他、判定ブロックに関係付けられる判定ブロックオーディオデータを示す判定ブロックのポインタをもつものの、さまざまなデータブロック内で分配されるオーディオデータストリームがオーディオデータストリームに変換され、ここで判定ブロックオーディオデータが近接判定ブロックオーディオデータに結合される。近接判定ブロックオーディオデータは、その後、その判定ブロックとともに内蔵チャンネル要素内に含めることができる。

本発明で見出された点は、前判定ブロックオーディオデータ、すなわち同一の時間マーク、あるいは同一のオーディオマークに対するオーディオ値を符号化することに関するオーディオデータが近接判定ブロックオーディオデータの近接ブロックに結合されるようにこのオーディオデータストリームが取り扱われると、各データブロックの判定ブロックオーディオデータの開始点を示すポインタベースのオーディオデータストリームが容易に取り扱われるといいうことと、近接判定ブロックオーディオデータが関係付けられる各判定ブロックがこれに追加されるということである。これをそれぞれ配置、すなわち整列させた後、このようにして得られるチャンネル要素から新たなオーディオデータストリームが得られ、ここで１つの時間マークあるいはオーディオ値あるいはこの時間マークに対してサンプルをそれぞれ符号化することに関係する全オーディオデータも１つのチャンネル要素内に結合されるため、新たなデータストリームが容易に取り扱われる。

本発明の１つの実施例により、可変長さのチャンネル要素による新たなオーディオデータストリームの復号を容易にするため、中に含まれる近接オーディオデータのチャンネル要素のデータ長さあるいは量をそれぞれ示す長さ指示を得るため、追加もしくは一部置き換えで各判定ブロックもしくは各チャンネル要素が新たなオーディオデータストリームで修正される。各長さ指示で入力オーディオデータストリームの全判定ブロックに対して同一のこれら判定ブロックの冗長部を置き換えることで修正を行うのが有利である。結果的に得られるオーディオデータストリームのデータビット率が、当初のポインタベースのオーディオデータストリームと比較した追加長さ指示を除き当初のオーディオデータストリームの１つに等しく、これによりさらに、新たなオーディオデータストリームから当初のオーディオデータストリームを再構築することができるようになるため、新たなオーディオデータストリームの実際には不必要なバックポインタが得られることでこういった方策が達成される。

これらの判定ブロックの同一冗長部は、全判定ブロックで結果的に得られる新たなオーディオデータストリームの前に置くことができる。受信機側において、ポインタのないフォーマットで得られるオーディオデータストリームを復号するための当初のファイルフォーマットのオーディオデータストリームだけを復号できる既存の復号器を用いるため、得られる第２オーディオデータストリームはこのようにして当初のオーディオデータストリームに再変換できる。

本発明のさらなる実施例により、第１オーディオデータストリームを他のファイルフォーマットの第２オーディオデータストリームに変換する作業を用いて第１ファイルフォーマットの複数のオーディオデータストリームのマルチチャンネルオーディオデータストリームを形成する。受信機側の管理性は、当初のオーディオデータストリームをポインタと組み合わせるだけの場合よりも向上するが、この理由は、マルチチャンネルオーディオデータストリームにおいて時間マークに関係する、あるいは近接判定ブロックオーディオデータをそれぞれ含む全チャンネル要素がマルチチャンネルオーディオ用信号のチャンネルの同時時間周期を符号化することで得られる、すなわち時間マークに関係する異なるチャンネルの時間周期を符号化することでアクセスユニットに結合できるためである。これはポインタベースのオーディオデータフォーマットではできないが、その理由はここで１つの時間マークに対するオーディオデータが異なるデータブロック間で分配可能なためである。複数のオーディオデータストリームのデータブロックを、長さ指示のあるさまざまなチャンネルに供給することで、オーディオデータストリームをアクセスユニットのあるマルチチャンネルデータに組み合わせる間にアクセスユニットによる良好なパージングが可能になる。

さらに、本発明では、上述の得られたオーディオデータストリームを当初のファイルフォーマットに再変換することが非常に容易であり、これがその後、既存の復号器によりオーディオ用信号に復号できるという結果が得られた。得られたチャンネル要素はさまざまな長さをもつため、当初のオーディオデータストリームのデータブロックで利用可能な長さよりも場合によっては長かったり短かったりするが、新たなファイルフォーマットでオーディオデータストリームをプレイするため最終的に得られる不必要なバックポインタによる主データをオフセットあるいは結合する必要はないものの、生成される当初のファイルフォーマットのオーディオデータストリームの判定ブロックにおけるビット率指示を向上させる上では十分である。このことによる効果は、このビット率により、復号されるオーディオデータストリームにおけるチャンネル要素が最長のものであっても、第１ファイルフォーマットのオーディオデータストリームでデータブロックがもつデータブロック長よりも短い、あるいはそれと同じであるということである。バックポインタはゼロにセットされ、気にならない値のビットを追加することで増加するビット率指示に対応する長さまでチャンネル要素が増加される。このように、当初のファイルフォーマットでのオーディオデータストリームのデータブロックが生成されるが、ここで関係する主データはデータブロックそのものの中にだけ含まれ、その他の中には含まれない。そのようにして再変換された第１ファイルフォーマットのオーディオデータストリームは、その後、増加されたビット指示により増加されたビット率を用いることで第１ファイルフォーマットのオーディオデータストリームに対する既存の復号器に供給できる。このように、再変換のための高価なシフト操作は、既存の復号器を新たなものと置き換える必要性とともに無視できる。

一方、さらなる実施例により、長さ指示で上書きされる部分を検索するため、判定ブロックの同一冗長部にわたって得られるオーディオデータストリームの全判定ブロックに含まれる情報を用いることで得られるオーディオデータストリームから当初のオーディオデータストリームを検索することが可能である。

本発明の好ましい実施例について、添付図面を参照しながら以下に論じる。図面には以下のものがある。

図１は、ＭＰ３ファイルフォーマットをバックポインタとともに図示する概略図である。
図２は、ＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換するための構成を図示するブロック図である。
図３は、本発明の１つの実施例によりＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換するための方法のフロー図である。
図４は、判定ブロックを追加することで関連オーディオデータを結合するステップと、図３の方法における判定ブロックを修正するステップとを図示するための概略図である。
図５は、本発明のさらなる実施例により複数のＭＰ３オーディオデータストリームをマルチチャンネルＭＰＥＧ−４オーディオデータストリームに変換するための方法を図示する概略図である。
図６は、既存のＭＰ３復号器でＭＰ３オーディオデータストリームを復号できるようにするため、図３で得られるＭＰＥＧ−４オーディオデータストリームをＭＰ３オーディオデータストリームに戻るよう変換するための配置のブロック図である。
図７は、図３で得られるＭＰＥＧ−４オーディオデータストリームをＭＰ３フォーマットの１つ以上のオーディオデータストリームに再変換するための方法のフロー図である。
図８は、本発明のさらなる実施例により、図３で得られるＭＰＥＧ−４オーディオデータストリームをＭＰ３フォーマットの１つ以上のオーディオデータストリームに再変換するための方法のフロー図である。
図９は、本発明のさらなる実施例によりＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換するための方法のフロー図である。

本発明は実施例に基づく図面を参照しながら以下で論じられるが、ここで、判定ブロックに関係する主データの開始点を指すためのデータブロックの判定ブロックでバックポインタが用いられるファイルフォーマットの当初のオーディオデータストリームは唯一の典型的ＭＰ３オーディオデータストリームである一方、各時間マークに関係するオーディオデータがお互い結合される内蔵チャンネル要素で構成され、結果として得られるオーディオデータストリームもまた唯一の典型的ＭＰＥＧ−４オーディオデータストリームである。ＭＰ３フォーマットは、背景期間で引用されている標準ＩＳＯ／ＩＥＣ１１１７２−３および１３８１８−３で説明されており、ＭＰＥＧ−４ファイルフォーマットは、標準ＩＳＯ／ＩＥＣ１４４９６−３で説明されている。

まず、ＭＰ３フォーマットについて、図１を参照しながら簡単に論じる。図１はＭＰ３オーディオデータストリーム１０の一部を示す。オーディオデータストリーム１０はフレームのシーケンスあるいはデータブロックでそれぞれ構成されるが、ここでは３つだけ、すなわち１０ａ，１０ｂ，１０ｃだけが図１において全て見て取ることができる。ＭＰ３オーディオデータストリーム１０は、オーディオもしくは音声信号それぞれからＭＰ３符合器により生成される。データストリーム１０で符号化されるオーディオ用信号は、例えば、音楽、雑音、さらにこれらの交じり合ったもの等である。データブロック１０ａ，１０ｂ，１０ｃはそれぞれ連続した、場合によっては重なった時間周期の１つに関係付けられるが、これに対してオーディオ用信号はＭＰ３符合器で分割されたものである。各時間周期はオーディオ用信号の時間マークに対応するため、説明では時間マークという用語を時間周期に対して用いることが多い。各時間周期は、例えば、多相フィルタバンク構成のハイブリッドフィルタバンクや、ハフマン符号化といったその後のエントロピーをもつ修正離散コサイン変換で個別にＭＰ３で主データ（ｍａｉｎ＿ｄａｔａ）に符号化されたものである。データブロック１０ａ−１０ｃが関係付けられた連続する３つの時間マークに関係する主データは、図１において１２ａ，１２ｂ，１２ｃとして、実際のオーディオデータストリーム１０だけでなく近接ブロックとして図示されている。

オーディオデータストリーム１０のデータブロック１０ａ−１０ｃはオーディオデータストリーム１０において等距離に配置されている。つまり、各データブロック１０ａ−１０ｃは同一のデータブロック長さ、もしくはフレーム長さをそれぞれをもつ。フレーム長さもまた、オーディオデータストリーム１０が少なくともリアルタイムでプレイされるビット率と、実際の符号化前にオーディオ用信号をサンプリングするためにＭＰ３符号器が用いられるサンプリング率とに依存する。この関係は、時間マークがどれだけの長さであるかを時間当りの固定サンプル数と関連して示し、どれだけのビット数がこの時間周期で送信できるかをビット率と時間マークとから計算できるというものである。

両パラメータ、すなわちビット率とサンプル率とはデータブロック１０ａ−１０ｃのフレームヘッダ１４で示されている。このように、各データブロック１０ａ−１０ｃはそれぞれ独自のフレームヘッダ１４をもつ。一般に、オーディオデータストリームの復号にとって重要な全情報は各フレーム１０ａ−１０ｃそれ自体に保存されるため、復号器はＭＰ３オーディオデータストリーム１０の途中で復号を開始できる。

開始点にあるフレームヘッダ１４とは別に、各データブロック１０ａ−１０ｃは、サイド情報部１６と、データブロックオーディオデータを含む主データ部１８とをもつ。サイド情報部１６はヘッダ１４にすぐに追随する。これは、各データブロックと関係付けられた主データもしくは判定ブロックオーディオデータそれぞれを見出すためのオーディオデータストリーム１０の復号器に対して重要な情報を含むものであるが、これらは直列線形に配列され、ＤＣＴもしくはＭＤＣＴ係数それぞれに対して正しい方法でこれを復号する唯一のハフマン復号ワードである。主データ部１８は各データブロックの終了点を形成する。

説明の背景セクションで述べるとおり、ＭＰ３標準はリザーバ機能をサポートする。これは、図１において２０で示されるサイド情報部１６内のサイド情報に含まれるバックポインタにより有効になる。バックポインタが０に設定されると、これらのサイド情報に対する主データはサイド情報１６部の直後に開始される。その他の場合、ポインタ２０（ｍａｉｎ＿ｄａｔａ＿ｂｅｇｉｎ）はデータブロックが関係付けられる時間マークを符号化する主データの開始点を示すが、ここでバックポインタ２０を含むサイド情報は前データブロックに含まれる。図１において、例えば、データブロック１０ａが、主データ１２ａで符号化される時間マークに関係付けられる。このデータブロック１０ａのサイド情報１６のバックポインタ２０は、例えば主データ１２ａの開始点を指すが、これは、データブロック１６ａのヘッダ１４の開始点から測定されるビットあるいはバイトオフセットを示すことでストリーム方向２２におけるデータブロック１０ａの前のデータブロック内に置かれるものである。つまり、オーディオ用信号の符号化中の当該時間において、ＭＰ３オーディオデータストリーム１０を生成するＭＰ３符号器のビット・リザーバはフルではなく、バックポインタの高さまでロードできる。データブロック１０ａのバックポインタ２０が指し示すこの位置から、主データ１２ａが、等間隔に配設されたヘッダとサイド情報１４，１６との対をもつオーディオデータストリーム１０内に挿入される。この例において、主データ１２ａは、データブロック１０ａの主データ部１８の半分を少し超えるところまで伸びる。次１０ｂのサイド情報部１６のバックポインタ２０は、データブロック１０ａの主データ１２ａの直後の位置を示す。これは、データブロック１０ｃのサイド情報部１６のバックポインタ２０に適用される。

これでわかるとおり、時間マークに関係する主データが、この時間マークに関係付けられたデータブロックにおいて独占的である場合、ＭＰ３オーディオデータストリーム１０においては例外的なものになる。むしろ、データブロックは大部分が１つ以上のデータブロック内で分配されるが、ビット・リザーバの大きさに応じて対応するデータブロックそのものは含まない。バックポインタ値の高さはビット・リザーバの大きさで制限される。

ＭＰ３オーディオデータストリームの構造を図１に関連して説明した後、図２を参照しながら配置を説明するが、これは、ＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換する上で、もしくはＭＰ３フォーマットに容易に変換できるオーディオ用信号からＭＰＥＧ−４オーディオデータストリームを得るうえで適したものである。

図２はＭＰ３符号器およびＭＰ３−ＭＰＥＧ−４変換器３２を示す。ＭＰ３符号器は、符号化されるオーディオ用信号を受信する入力と、出力とを備えるが、ここで入力においてオーディオ用信号を符号化するＭＰ３オーディオデータストリームを出力する。ＭＰ３符号器３０は上述のＭＰ３標準にしたがって作動する。

図１を参照しながら構成を論じたＭＰ３オーディオデータストリームは、上述のとおり、設定ビット率および基礎サンプル率およびパディングバイトに応じた固定フレーム長さをもつフレームで構成されるが、このパディングバイトは設定されている場合と、設定されていない場合がある。ＭＰ３−ＭＰＥＧ−４変換器３２は入力でＭＰ３オーディオデータストリームを受信し、出力でＭＰＥＧ−４オーディオデータストリームを出力するが、こういった構成はＭＰ３−ＭＰＥＧ−４変換器３２の操作モードの次の説明からわかる。変換器３２の目的はＭＰ３オーディオデータストリームをＭＰ３フォーマットからＭＰＥＧ−４フォーマットに変換することである。ＭＰＥＧ−４データフォーマットは、ある時間マークに関係する全主データが近接アクセスユニットもしくはチャンネル要素に含まれるという利点があるため、チャンネル要素の操作が非常に容易になる。

図３は、変換器３２により実施されるＭＰ３オーディオデータストリームからＭＰＥＧ−４オーディオデータストリームへの変換中の個々の方法ステップを示す。まず、ＭＰ３オーディオデータストリームはステップ４０で受信される。受信ステップは、フルオーディオデータストリームもしくはこれの現行部だけをラッチに保存するステップを含む。したがって、変換中の次ステップはリアルタイムでの受信ステップ４０中、もしくはそれに続くステップだけのいずれかで実施される。

その後、ステップ４２において、時間マークに関係する全オーディオデータもしくは主データそれぞれが近接ブロックで結合されるが、これを全時間マークに対して実施する。ステップ４２は図４においてさらに詳細に概略が示されているが、ここで、この図において、図１で示されている要素と同様のＭＰ３オーディオデータストリームの要素は同一あるいは類似の参照番号で与えられており、これらの要素の説明の繰り返しは省略されている。

データストリーム方向２２からわかるとおり、図４の左側でさらに示されているＭＰ３オーディオデータストリーム１０のこれらの部分は、これの右側の部分よりも早く変換器３２に到達する。２つのデータブロック１０ａおよび１０ｂは図４において全体が示されている。データブロック１０ａに関係する時間マークは、データブロック１０の前のデータブロックにおいて典型的には一部、さらにデータブロック１０ａでは一部が、さらにここでは特にこれの主データ部１８において図４で含まれる主データＭＤ１により符号化される。次データブロック１０ｂが関係付けられる時間マークを符号化するこれらの主データはデータブロック１０ａの主データ部１８に独占的に含まれ、ＭＤ２で示される。データブロック１０ｂに続くデータブロックに関係する主データＭＤ３はデータブロック１０ａおよび１０ｂの主データ部１８内で分配される。

ステップ４２において、変換器４２は全ての関係する主データ、すなわち１つの同一時間マークを符号化する全主データを近接ブロックに結合する。このようにして、主データＭＤ１のデータブロック１０ａの部分４６のデータブロック１０ａの前の部分４４は、ステップ４２後の結合ステップにより近接ブロックになる。これは他の主データＭＤ２，ＭＤ３．．．．に対しても実施される。

ステップ４２を実施するため、変換器３２は、データブロック１０ａのサイド情報１６のポインタを読み込み、その後、このポインタに基づき、現行データブロック１０ａのヘッダまでポインタにより決定される場所で始まる前データブロックのフィールド１８に含まれるこのデータブロック１０ａに対する判定ブロックオーディオデータ１２ａの各第１部分４４を読み込む。その後、変換器は、現行データブロック１０ａの部分１８に含まれ、現行オーディオデータブロック１０ａのサイド情報１６の最終点から始まり次オーディオデータ、ここではＭＤ２で示される、次データブロック１０ｂのサイド情報１６のポインタが示す次データブロック１０ｂまでのこのデータブロック１０ａに対する判定ブロックオーディオデータの終了点を含む判定ブロックオーディオデータの第２部分４６を読み込む。前述のとおり、２つの部分４４および４６の結合によりブロック４８が得られる。

ステップ５０において、変換器３２は、関連するサイド情報１６を含む関連ヘッダ１４を近接ブロックに追加し、最終的にＭＰ３チャンネル要素５２ａ，５２ｂ，５２ｃを形成する。このように、各ＭＰ３チャンネル要素５２ａ−５２ｃは、対応するＭＰ３データブロックのヘッダ１４と、同一ＭＰ３データブロックの次サイド情報部１６と、ヘッダおよびサイド情報の元になりデータブロックが関連付けされる時間マークを符号化する主データの近接ブロック４８とで構成される。

ステップ４２および５０から得られるＭＰ３チャンネル要素は、複矢印５４ａ−５４ｃで示されるように、異なるチャンネル要素長さをもつ。ＭＰ３オーディオデータストリーム１０のデータブロック１０ａ，１０ｂは固定フレーム長さ５６をもつが、個々の時間マークに対する主データ数はビット・リザーバ機能による平均値周りで変動するということに注意するべきである。

復号器側において復号、特に個々のＭＰ３チャンネル要素５２ａ−５２ｃのパージングを容易にするため、各チャンネル要素５２ａ−５２ｃの長さ、すなわち５４ａ−５４ｃを得るため、ヘッダ１４Ｈ１−Ｈ３が修正される。これはステップ５６で実施される。長さ入力は、オーディオデータストリーム１０の全ヘッダ１４に対して同一もしくは冗長な部分それぞれに書き込まれる。ＭＰ３フォーマットにおいて、各ヘッダ１４は開始点において、１２ビットで構成されるシンクワード（ｓｙｎｃｗｏｒｄ）を受信する。ステップ５６において、このシンクワードは各チャンネル要素の長さで占められる。シンクワードの１２ビットは、各チャンネル要素の長さをバイナリ形式で表示する上で十分であるため、修正されたヘッダｈ１−ｈ３をもつ得られたＭＰ３チャンネル要素５８ａ−５８ｃの長さは同一デスパイトステップ５６のまま、すなわち５４ａ−５４ｃに等しい。このように、オーディオ情報もリアルタイムに同一のビット率で送信できる、あるいはさらなるオーバヘッドが追加ヘッダで追加されない限り、長さ指示を追加する同一のデスパイトで符号化される時間マークの順番に従ってＭＰ３チャンネル要素５８ａ−５８ｃ結合後に当初のＭＰ３オーディオデータストリーム１０のようにプレイできる。

ステップ５８において、ファイルヘッダ、あるいは生成されるデータストリームがファイルではなくストリーミングである場合、データストリームヘッダが望みのＭＰＥＧ−４オーディオデータストリーム（ステップ６０）に対して生成される。本実施例によればＭＰＥＧ−４準拠オーディオデータストリームが生成されるため、ＭＰＥＧ−４標準に従ってファイルヘッダが生成されるが、この場合、上述のＭＰＥＧ−４標準で定義されるＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇ機能により固定構造をもつ。ＭＰＥＧ−４システムに対するインターフェイスは、０ｘ４０の値をもつ要素ＯｂｊｅｃｔＴｙｐｅＩｎｄｉｃａｔｉｏｎセットにより、さらに番号２９のａｕｄｉｏＯｂｊｅｃｔＴｙｐｅの指示により与えられる。ＭＰＥＧ−４特有のＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇは、ＩＳＯ／ＩＥＣ１４４９６−３における当初の定義に対応して以下のとおり拡張されるが、ここで以下に示す例では、本説明にとって重要なＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇの内容だけであり、それらの全てが考慮されているわけではない：
１ＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇ（）｛
２ａｕｄｉｏＯｂｊｅｃｔＴｙｐｅ；
３ｓａｍｐｌｉｎｇＦｒｅｑｕｅｎｃｙＩｎｄｅｘ；
４ｉｆ（ｓａｍｐｌｉｎｇＦｒｅｑｕｅｎｃｙＩｎｄｅｘ＝＝０ｘｆ）
５ｓａｍｐｌｉｎｇＦｒｅｑｕｅｎｃｙ；
６ｃｈａｎｎｅｌＣｏｎｆｉｇｕｒａｔｉｏｎ；
７ｉｆ（ａｕｄｉｏＯｂｊｅｃｔＴｙｐｅ＝＝２９）｛
８ＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇ（）；
９｝
１０｝

上のＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇのリストは、ＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇ機能に対する共通表記による表示であるが、これは、復号器のファイルヘッダにおける呼び出しパラメータ、つまりｓａｍｐｌｉｎｇＦｒｅｑｕｅｎｃｙＩｎｄｅｘ、ｃｈａｎｎｅｌＣｏｎｆｉｇｕｒａｔｉｏｎ、ａｕｄｉｏＯｂｊｅｃｔＴｙｐｅのパージングあるいは読み込みのために保存される、あるいはどのようにファイルヘッダが復号もしくはパージングされるかの指示を示す。

これでわかるとおり、ステップ６０で生成されるファイルヘッダは、上述のとおり２９（ライン２）として設定されるａｕｄｉｏＯｂｊｅｃｔＴｙｐｅの指示で開始される。ａｕｄｉｏＯｂｊｅｃｔＴｙｐｅパラメータは、どのようにデータが符号化されたか、特に以下に示すとおり、ファイルヘッダを符号化するためのさらなる情報がどのように抽出できるかを復号器に対して示すものである。

その後、呼び出しパラメータｓａｍｐｌｉｎｇＦｒｅｑｕｅｎｃｙＩｎｄｅｘが続くが、これはサンプル周波数に対するノルムテーブルにおける１つの位置を示す（ライン３）。インデックスが０（ライン４）の場合、サンプル周波数の指示はノルムテーブルを示すことなく続く（ライン５）。

その後、チャンネル構成の指示が続くが（ライン６）、これについては以下でさらに詳細に論じるような方式で、生成されたＭＰＥＧ−４オーディオデータストリームにどれだけの数のチャンネルが含まれるかを示すものであるが、さらに、本実施例と対照させて、図５を参照しながら以下で論じるとおり、１つ以上のＭＰ３オーディオデータストリームを１つのＭＰＥＧ−４オーディオデータストリームに結合させることも可能である。

その後、ここでのケースのａｕｄｉｏＯｂｊｅｃｔＴｙｐｅが２９である場合、オーディオデータストリーム１０のＭＰ３フレームヘッダの冗長部を含むファイルヘッダＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇにおける部分、すなわちフレームヘッダ１４内においてこれを保持する部分（ライン８）が続く。この部分については、ここではＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇ（）で示されるものであるが、これもまたこの部分の構造を定義する機能である。

ＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇの構造もＭＰ３標準から取ることができるものの、フレーム毎に変わらないＭＰ３フレームヘッダの固定部分に対応することから、この構造は典型的に以下のようにリストアップされる：
１ＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇ（ｃｈａｎｎｅｌＣｏｎｆｉｇｕｒａｔｉｏｎ）｛
２ｓｙｎｃｗｏｒｄ
３ＩＤ
４ｌａｙｅｒ
５ｒｅｓｅｒｖｅｄ
６ｓａｍｐｌｉｎｇ＿ｆｒｅｑｕｅｎｃｙ
７ｒｅｓｅｒｖｅｄ
８ｒｅｓｅｒｖｅｄ
９ｒｅｓｅｒｖｅｄ
１０ｉｆ（ｃｈａｎｎｅｌＣｏｎｆｉｇｕｒａｔｉｏｎ＝＝０）｛
１１ｃｈａｎｎｅｌｃｏｎｆｉｇｕｒａｔｉｏｎｄｅｓｃｒｉｐｔｉｏｎ；
１２｝
１３｝

ＭＰＥＧ＿１＿２＿ＳｐｅｃｆｉｃＣｏｎｆｉｇ部分において、ＭＮ３オーディオデータストリーム内のフレームヘッダからフレームヘッダ１４で異なる全ビットは０に設定される。どの場合においても、第１のパラメータＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇ、すなわち、ＭＰ３オーディオデータストリーム（ライン２）を受信する際にＭＰ３符号器の同期に寄与する１２ビットシンクワード（ｓｙｎｃｗｏｒｄ）は各フレームヘッダに対して同一である。次パラメータＩＤ（ライン３）は、ＭＰＥＧのバージョン、すなわち１もしくは２を示すが、バージョン２に対しては標準ＩＳＯ／ＩＥＣ１３８１８−３が対応し、バージョン１に対しては標準ＩＳＯ／ＩＥＣ１１１７２−３が対応する。パラメータレイヤ（ライン４）はレイヤ３に対する指示を与えるが、これはＭＰ３標準に対応する。以下のビットがリザーブされるが（ライン５）、この理由はその値がフレーム毎に変わり、ＭＰ３チャンネル要素により送信されるためである。このビットはヘッダの後にＣＲＣ変数が続く可能性があることを示す。次の変数ｓａｍｐｌｉｎｇｆｒｅｑｕｅｎｃｙ（ライン６）は、ＭＰ３標準で定義されるサンプル率をもつテーブルを示し、このためＭＰ３−ＤＣＴ係数の基本となるサンプル率を示す。その後、ライン７において特定の（リザーブされた）適用例に対するビットの指示がライン８および９と同様に続く。その後、ＡｕｄｉｏＳｐｅｃｆｉｃＣｏｎｆｉｇのライン６で示されるパラメータが所定のチャンネル構成を示すのではなく値０をもつ場合、（ライン１１，１２において）チャンネル構成の正確な定義が続く。その他の場合、１４４９６−３サブパート１テーブル１．１１のチャンネル構成が適用される。

ステップ６０、特に当初のＭＰ３オーディオデータストリーム１０のフレームヘッダ１４における全冗長情報を含むファイルヘッダの要素ＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇを供給することで、フレームヘッダにおけるこの冗長部が、データ挿入中に生成されるＭＰＥＧ−４ファイルにおけるこの情報の避けがたい損失を生じることなく、この修正された部分がＭＰＥＧ−４ファイルヘッダに基づいて再構築できる。

ステップ６２において、ＭＰＥＧ−４オーディオデータストリームが、ステップ６０で生成されるＭＰＥＧ−４ファイルヘッダの順番で、チャンネル要素が、その関係付けられた時間マークの順番で出力されるが、ここでフルのＭＰＥＧ−４オーディオデータストリームからＭＰＥＧ−４ファイルが得られる、もしくはＭＰＥＧ−４システムにより送信される。

上の説明は、ＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換することに関するものであった。しかし、図２の点線でわかるとおり、２つのＭＰ３符号器、すなわち３０および３０’からの２つ以上のＭＰ３オーディオデータストリームをＭＰＥＧ−４マルチチャンネルオーディオデータストリームに変換することも可能である。この場合、ＭＰ３−ＭＰＥＧ−４変換器３２は全符号器３０および３０’のＭＰ３オーディオデータストリームを受信し、ＭＰＥＧ−４フォーマットでマルチチャンネルオーディオデータストリームを出力する。

上の半分の部分において、図５は、図４の表示に関連して、ＭＰＥＧ−４に従うマルチチャンネルオーディオデータストリームがどのようにして得られるかを示すが、ここでも変換は変換器３２で実施される。３つのチャンネル要素シーケンス７０，７２，７４が図示されているが、これはＭＰ３符号器３０あるいは３０’により１つのオーディオ用信号からステップ４０−５６により生成されたものである（図２）。チャンネル要素７０，７２，７４の各シーケンスから、２つの各チャンネル要素、すなわち７０ａ，７０ｂ，７２ａ，７２ｂもしくは７４ａ，７４ｂのそれぞれが示されている。図５において、ここで７０ａ−７４ａもしくは７０ｂ−７４ｂでお互いに上に配設されるチャンネル要素がそれぞれ同一の時間マークに関係付けられている。例えばシーケンス７０のチャンネル要素は、前、左、右（前）における適当な規格化により記録されたオーディオ用信号を符号化し、シーケンス７２および８２は、中央前のラウドスピーカ（中央）といった他の方向あるいは他の周波数スペクトルから、また後右および左（周）からの同一オーディオ源の記録を示すオーディオ用信号を符号化する。

矢印７６で示されているとおり、これらのチャンネル要素はここで、以下においてアクセスユニット７８として言及されているＭＰＥＧ−４オーディオデータストリームでの出力（図３のステップ６２参照）中にユニットに結合される。このように、ＭＰＥＧ−４オーディオデータストリームにおいて、アクセスユニット７８内のデータは常に時間マークに関連する。ここでは前、中央、周チャンネルの順番になっているアクセスユニット７８内のＭＰ３チャンネル要素７０ａ，７２ａ，７４ａの配置は、ここでもＩＳＯ／ＩＥＣ１４４９６−３のサブパート１を参照してＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇでの呼び出しパラメータチャンネル構成をそれぞれ設定することで生成されるＭＰＥＧ−４オーディオデータストリーム（図３のステップ６０参照）に対して生成されるようにファイルヘッダで考慮されている。アクセスユニット７８はここでも、その時間マークの順番でＭＰＥＧ−４ストリームにより順番に配置されるが、ＭＰＥＧ−４ファイルヘッダが先行する。アクセスユニットにおけるチャンネル要素の順番あるいは復号器側における重要性をそれぞれ示すため、パラメータｃｈａｎｎｅｌＣｏｎｆｉｇｕｒａｔｉｏｎがＭＰＥＧ−４ファイルヘッダで適切に設定される。

図５の上の説明で示したとおり、本発明により提案されているとおり、ＭＰ３オーディオデータストリームを操作してデータブロックから内蔵チャンネル要素を得る場合、ＭＰ３オーディオデータストリームをマルチチャンネルオーディオデータストリームに結合することは非常に簡単であり、ここで、１つの時間マークに対する全データが１つのチャンネル要素に含まれ、個々のチャンネルのこれらのチャンネル要素がその後容易にアクセスユニットに結合できる。

この説明は、１つ以上のＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換することに関するものであった。しかし、本発明で見出された重要な点は、等しい送信率をもち、マルチチャンネル装置の可能性のある個々の内蔵ＭＰ３チャンネル要素の管理性が向上するといった、得られるＭＰＥＧ−４オーディオデータストリームの全ての利点が、既存のＭＰ３符号器を全て新たな符号器と置き換えることなく活かせることであるが、この再変換も問題なく実施できるため、上述のＭＰＥＧ−４オーディオデータストリームの復号中にこれを用いることができるというものである。

図６において、ＭＰ３再構築器１００の配置でこれが示されているが、再構築器やＭＰ３復号器１０２，１０２’．．．．の作動モードについては以下で詳細に論じる。ＭＰ３再構築器は入力において、前述の実施例の１つにより生成されたものとしてＭＰＥＧ−４オーディオデータストリームを受信し、１つの、マルチチャンネルオーディオデータストリームの場合は複数のＭＰ３オーディオデータストリームを１つ以上のＭＰ３復号器１０２，１０２’．．．に出力するが、これら自体はそれぞれ、受信されたＭＰ３オーディオデータストリームを各オーディオ用信号に復号し、チャンネル配置に従って配設された各ラウドスピーカに受け渡す。

図５により生成されたＭＰＥＧ−４オーディオデータストリームの当初のＭＰ３オーディオデータストリームを再構築する特に簡単な方法は、図５の下部と図７とを参照しながら説明されるが、ここでこれらのステップは図６のＭＰ３再構築器で実施される。

まず、ＭＰ３再構築器１００はステップ１１０において、入力で受信されたＭＰＥＧ−４オーディオデータストリームが再フォーマットされたＭＰ３オーディオデータストリームであることを、値２９を含むかどうかをＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇによりファイルヘッダの呼び出しパラメータａｕｄｉｏＯｂｊｅｃｔＴｙｐｅを確認することで証明する。証明された場合（ＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇにおけるライン７）、ＭＰ３再構築器１００はＭＰＥＧ−４オーディオデータストリームのファイルヘッダのパージングに進み、ＭＰＥＧ−４オーディオデータストリームが得られた（ステップ１１２）部分ＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇからの当初のＭＰ３オーディオデータストリームの全フレームヘッダの冗長部を読み込む。

ＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇの評価後、ＭＰ３再構築器１００は、矢印１１６で示されているとおり、当初のＭＰ３オーディオデータストリームフレームヘッダＨＦ，ＨＣ，ＨＳを再び得るため、ステップ１１４において、各ヘッダｈＦ、ｈＣ，ｈＳの各チャンネル要素７４ａ−７４ｃでＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇの構成要素で特にチャンネル要素の１つ以上の部分を、特にＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇからの同期ワードでチャンネル要素長さ指示を置き換える。ステップ１１８において、ＭＰ３再構築器１００は、各チャンネル要素のＭＰＥＧ−４オーディオデータストリームにおけるサイド情報Ｓｆ，Ｓｃ，Ｓｓを修正する。特に、新たなサイド情報Ｓ’Ｆ，Ｓ’Ｃ，Ｓ’Ｓを得るため、バックポインタは０に設定される。ステップ１１８による操作は図５において矢印１２０で示される。その後、ステップ１２２において、ＭＰ３再構築器１００は、許可される最大値までチャンネル要素長さ指示の代わりに同期ワードを用いてステップ１１４においてもたらされるフレームヘッダＨＦ，ＨＣ，ＨＳの各チャンネル要素７４ａ−７４ｃにおいてビット率指標を設定する。最後に、得られるヘッダは当初のものとは異なるため、図５においてアポストロフィーをつけて、すなわちＨ’Ｆ，Ｈ’Ｃ，Ｈ’Ｓで示される。ステップ１２２によるチャンネル要素の操作も矢印１１６で示される。

ステップ１１４−１２２における変更点を再び示すため、個々のパラメータが、ヘッダＨ’Ｆとサイド指標部Ｓ’Ｆについて、図５においてリストアップされている。１２４において、ヘッダＨ’Ｆの個々のパラメータが示されている。フレームヘッダＨ’Ｆはパラメータシンクワードで開始される。シンクワードは、各ＭＰ３オーディオデータストリームの場合、すなわち０ｘＦＦＦの値と同様に当初の値（ステップ１１４）に設定される。一般に、ステップ１１４−１２２の後に得られるフレームヘッダＨ’Ｆは当初のＭＰ３オーディオデータストリーム１０に含まれる当初のＭＰ３フレームヘッダとは、ビット率指標が許される最大値、すなわちＭＰ３標準によると０ｘＥに設定されるという点だけが異なる。

ビット率指標を変更する目的は、アクセスユニット７８を用いてＭＰＥＧ−４オーディオデータストリームが生成される当初のＭＰ３オーディオデータストリームの１つよりも大きな、新たに生成されるＭＰ３オーディオデータストリームに対して新たなフレーム長あるいはデータブロック長をそれぞれ得ることである。こういった方策によりＭＰ３フォーマットでのバイトによるフレーム長は常に、以下の式にしたがってビット率に依存する。
ＭＰＥＧ１レイヤ３については：
ｆｒａｍｅｌｅｎｇｔｈ［Ｂｉｔ］＝１１５２＊ｂｉｔｒａｔｅ［Ｂｉｔ／ｓ］／ｓａｍｐｌｅｒａｔｅ［Ｂｉｔ／ｓ］＋＋８＊ｐａｄｄｉｎｇｂｉｔ［Ｂｉｔ］
ＭＰＥＧ２レイヤ３については：
ｆｒａｍｅｌｅｎｇｔｈ［Ｂｉｔ］＝５７６＊ｂｉｔｒａｔｅ［Ｂｉｔ／ｓ］／ｓａｍｐｌｅｒａｔｅ［Ｂｉｔ／ｓ］＋＋８＊ｐａｄｄｉｎｇｂｉｔ［Ｂｉｔ］

言い換えると、標準によるＭＰ３オーディオデータストリームのフレーム長はビット率に直接比例し、サンプル率に間接的に比例する。追加値として、パディングビットの値が追加されるが、これはＭＰ３フレームヘッダｈＦ，ｈＣ，ｈＳで示され、ビット率を正確に設定するために用いることができる。サンプル率は固定であるが、この理由はこれが、復号されるオーディオ用信号がどの速度でプレイされるかで決まるためである。当初の設定と比較してビット率の変換を行うことで、当初のものよりも長い、新たに生成されるＭＰ３オーディオデータストリームのデータブロック長さにおけるＭＰ３チャンネル要素７４−７４ｃといったものを用いることができるようになるが、この理由は、当初のオーディオデータストリームを生成するためビット・リザーバからビットを取ることで主データが生成されたためである。

このように、本実施例において、ビット率指標は常に許される最大値に設定される一方、ＭＰ３標準によりデータブロック長さを得るうえで十分な値までビット率指標を大きくすることがさらに可能であるため、最長のＭＰ３チャンネル要素７４ａ−７４ｃであってもその長さからフィットする。

１２６において、バックポインタｍａｉｎ＿ｄａｔａ＿ｂｅｇｉｎは得られるサイド情報において０に設定されることが示されている。これは、図７の方法により生成されるＭＰ３オーディオデータストリームにおいて、データブロックが常に内蔵されているため、あるフレームヘッダに対する主データおよびサイド情報がサイド情報の直後で常に始まり、同一のデータブロック内で終了するということだけを意味する。

ステップ１１４，１１８，１２２は、そのアクセスユニットからおのおのを抽出することで各チャンネル要素において実施されるが、ここでチャンネル要素長さ指示は抽出中有用である。

その後、ステップ１２８において、フィルデータあるいは気にならないビット量が各チャンネル要素７４ａ−７４ｃに追加され、新たなビット率指標０ｘＥで設定されるＭＰ３データブロック長さに対して唯一、全てのＭＰ３チャンネル要素の長さを増加させる。これらのフィルデータを図５の１２８で示す。フィルデータの量は、例えばチャンネル要素長さ指示およびパディングビットを推定することで各チャンネル要素について計算できる。

その後、ステップ１３０において、前のステップで修正された図５の７４’ａ−７４’ｃで示されるチャンネル要素が各ＭＰ３復号器もしくはＭＰ３復号器本体１３４ａ−１３４ｃに、符号化された時間マークの順番のＭＰ３オーディオデータストリームのデータブロックとして渡される。ＭＰＥＧ−４ファイルヘッダは省略される。得られるＭＰ３オーディオデータストリームは図５において、一般に１３２ａ，１３２ｂ，１３２ｃで示される。ＭＰ３復号器本体１３４ａ−１３４ｃは、例えば、前に初期化されているが、チャンネル要素と同じ数が個々のアクセスユニットに含まれる。

ＭＰ３再構築器１００は、ＭＰＥＧ−４オーディオデータストリームのアクセスユニット７８におけるどのチャンネル要素７４ａ−７４ｃが、ＭＰＥＧ−４オーディオデータストリームのＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇの呼び出しパラメータｃｈａｎｎｅｌＣｏｎｆｉｇｕｒａｔｉｏｎの推定からＭＰ３オーディオデータストリーム１３２ａ−１３２ｃのどれが生成されるかということに関係するかということがわかっている。これにより、前ラウドスピーカに接続されたＭＰ３復号器本体１３４ａは、前チャンネルに対応するオーディオデータストリーム１３２ａを受信するため、ＭＰ３復号器本体１３４ｂおよび１３４ｃが中心および周チャンネルに関係付けられたオーディオデータストリーム１３２ｂおよび１３２ｃを受信し、得られたオーディオ用信号をそれぞれ配設されたラウドスピーカに対して、例えばサブウーハに、もしくは後左および後右にそれぞれ配設されたラウドスピーカに出力する。

当然ながら、復号器本体１０２，１０２’あるいは１３４ａ−１３４ｃを用いた図６の配置によるＭＰＥＧ−４オーディオデータストリームのリアルタイムの符号化に対して、当初のオーディオデータストリーム１０よりも高いステップ１２２で増加されたビット率で新たに生成されたＭＰ３オーディオデータストリーム１３２ａ−１３２ｃを送信する必要があるが、しかし、ＭＰ３再構築器１００とＭＰ３復号器１０２，１０２’あるいは１３４ａ−１３４ｃ間の配置が固定されていることからこれは問題ないため、ここでは送信パスはこれに応じて短く、これに応じて低費用・作業で高いデータ率での設計が可能である。

図７を参照しながら説明される実施例により、当初のオーディオデータストリーム１０から図５で得られるＭＰＥＧ−４マルチチャンネルオーディオデータストリームは当初のＭＰ３オーディオデータストリームには正確に再変換されていないが、他のＭＰ３オーディオデータストリームはこれから生成され、ここで、当初のオーディオデータストリームと比較すると、全バックポインタが０に設定され、ビット率指標が最高値に設定される。これらの新たに生成されたＭＰ３オーディオデータストリームのデータブロックはこのように、ある時間マークに関係付けられた全データが同一のデータブロック７４’ａ−７４’ｃに含まれる限りにおいて内蔵され、フィルデータを用いて単一値までデータブロック長さを増加させる。

図８は、図１−５の実施例により生成されるＭＰＥＧ−４オーディオデータストリームを当初のＭＰ３オーディオストリームもしくは当初のＭＰ３オーディオデータストリームにそれぞれ再変換することを可能にする方法に対する実施例を示す。

この場合、ＭＰ３再構築器１００はステップ１５０においてステップ１１０と同様に、ＭＰＥＧ−４オーディオデータストリームが再フォーマットされたＭＰ３オーディオデータストリームであるかどうかを再び正確にテストする。その後のステップ１５２および１５４も図７の手順のステップ１１２および１１４に対応する。

サイド情報におけるバックポインタおよびフレームヘッダにおけるビット率指標を変更する代わりに、ＭＰ３再構築器１００は、図８の方法によりステップ１５６において、サンプル率、ビット率、パディングビットに基づいてＭＰＥＧ−４オーディオデータストリームに変換された当初のＭＰ３オーディオデータストリームにおける当初のデータブロック長さを再構築する。ビット率がフレーム毎に異なる場合、サンプル率およびパディング指示がＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇで示され、ビット率は各チャンネル要素で示される。

当初の、さらに再構成されるオーディオデータストリームの当初のフレーム長さを計算するための式は上で示されたものと同様であり：
ＭＰＥＧ１レイヤ３については：
ｆｒａｍｅｌｅｎｇｔｈ［Ｂｉｔ］＝１１５２＊ｂｉｔｒａｔｅ［Ｂｉｔ／ｓ］／ｓａｍｐｌｅｒａｔｅ［Ｂｉｔ／ｓ］＋＋８＊ｐａｄｄｉｎｇｂｉｔ［Ｂｉｔ］
ＭＰＥＧ２レイヤ３については：
ｆｒａｍｅｌｅｎｇｔｈ［Ｂｉｔ］＝５７６＊ｂｉｔｒａｔｅ［Ｂｉｔ／ｓ］／ｓａｍｐｌｅｒａｔｅ［Ｂｉｔ／ｓ］＋＋８＊ｐａｄｄｉｎｇｂｉｔ［Ｂｉｔ］

その後、ＭＰ３オーディオデータストリームもしくは複数のＭＰ３オーディオデータストリームそれぞれは、計算されたデータブロック長さ間隔の各チャンネルから各フレームヘッダを配置することで生成され、ギャップは、オーディオデータもしくは主データをそれぞれサイド情報のポインタで示される位置に挿入することで埋められる。図７あるいは５それぞれの実施例とは異なり、各ヘッダもしくは各サイド情報それぞれに関係付けられた主データは、バックポインタで示される位置の開始点においてＭＰ３オーディオデータストリーム内に挿入される。あるいは、言い換えると、動的主データの開始点がｍａｉｎ＿ｄａｔａ＿ｂｅｇｉｎに対応してオフセットされる。ＭＰＥＧ−４ファイルヘッダは省略される。得られる複数のＭＰ３オーディオデータストリーム、もしくは得られるＭＰ３オーディオデータストリームそれぞれは、ＭＰＥＧ−４オーディオデータストリームがベースとする当初の複数のＭＰ３オーディオデータストリームに対応する。これらのＭＰ３オーディオデータストリームはこのように、図７のオーディオデータストリームと同様に従来型ＭＰ３復号器によりオーディオ用信号に復号される。

前説明に関して、単チャンネルＭＰ３オーディオデータストリームとして説明されているＭＰ３オーディオデータストリームは、実際にはＩＳＯ／ＩＥＣ標準１３８１８−３により定義される２チャンネルＭＰ３オーディオデータストリームの場所にあったものであるが、ここで、本発明の理解に関して何ら変更がないことから、この説明はここでは詳細に行わない。復号器側における入力チャンネルを検索するための送信されたチャンネルからのマトリクス操作およびこれらのマルチチャンネル信号の複数バックポインタの利用が論じられたが、参照は各標準に対して行う。

上述の実施例により、ＭＰＥＧ−４ファイルフォーマットで別の形式によりＭＰ３データブロックを保存できるようになる。ＭＰＥＧ−１／２−オーディオ−レイヤ−３、ショートＭＰ３あるいはそこから派生したＭＰＥＧ２．５ｍｐ３ＰＲＯといった商標登録をもつフォーマットは、これらの手順に従ってＭＰＥＧ−４ファイルにパックできるため、このような新たな表記では、単純な方式で任意数のチャンネルのマルチチャンネルを表示したものになる。標準ＩＳＯ／ＩＥＣ１３８１８−３からの複雑で難しい使用方法を使う必要はない。特に、ＭＰ３データブロックは、各ブロック−アクセスユニットのチャンネル要素が所定時間マークに関係するようパックされる。

デジタル信号表示のフォーマットを変更するため、上述の実施例において、表示部分は異なるデータで上書きされる。言い換えると、復号器で必要な、あるいは有用な情報は、データストリーム内の異なるブロックに対して一定のＭＰ３データブロックの部分に書き込まれる。

複数のモノラルあるいはステレオデータブロックをＭＰＥＧ−４ファイルフォーマットのアクセスユニットにパックすることで、マルチチャンネル表示が得られるが、これは標準ＩＳＯ／ＩＥＣ１３８１８−３からの表示に比べてはるかに容易に取り扱うことができる。

前の実施例において、ＭＰ３データブロックの表示は、ある時間マークに関係する全データも１つのアクセスユニット内に含まれるよう別の方式でフォーマットされたものである。一般に、ＭＰ３データブロックでは常にこうなるわけではないが、その理由は、要素のｍａｉｎ＿ｄａｔａ＿ｂｅｇｉｎ、あるいは当初のＭＰ３データブロック内のバックポインタがそれぞれ前のデータブロックを指すことができるためである。

当初のデータストリームの再構成も行うことができる（図８）。つまり、図でわかるとおり、検索されたデータストリームは各確認復号器で処理できる。

その上で、上述の実施例により２つ以上のチャンネルの符号化もしくは復号が可能になる。さらに、上述の実施例において、マルチチャンネルフォーマットを得るため、すでに符号化されたＭＰ３データだけを単純な操作で再フォーマットする必要がある。他方、符号器側において、この操作あるいはこういった操作それぞれだけを逆転させる必要がある。

ＭＰ３データストリームは通常、異なる長さのデータブロックを含むが、１つのブロックに関係する動的データを前ブロックにパックできることから、前述の実施例では動的データを直接サイド情報の後にバンドルした。得られるＭＰＥＧ−４オーディオデータストリームは一定の中間的なビット率をもっていたが、データブロックの長さが異なっていた。要素のｍａｉｎ＿ｄａｔａ＿ｂｅｇｉｎあるいはバックポインタそれぞれは、当初のデータストリームの再生を確実に行うため、変更のない方式で送信される。

さらに、図５を参照すると、ＭＰＥＧ−４ファイル内における１つのマルチチャンネルフォーマットに対するＭＰ３チャンネル要素として複数のＭＰ３データブロックをパックするため、ＭＰＥＧ−４シンタクスの拡張について説明した。１つの時点に関係する全ＭＰ３チャンネル要素本体が１つのアクセスユニットにパックされた。ＭＰＥＧ−４標準に対応して、符号器側における構成に対する適切な情報を、いわゆるＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇから取ることができる。ａｕｄｉｏＯｂｊｅｃｔＴｙｐｅ、サンプル率、チャンネル構成等とは別に、これは、各ａｕｄｉｏＯｂｊｅｃｔＴｙｐｅに対して関係する記述子を含む。この記述子はＭＰＥＧ＿１＿２＿ＳｐｅｃｉｆｉｃＣｏｎｆｉｇに関して上で説明した。

前述の実施例により、ヘッダ内の１２ビットＭＰＥＧ−１／２シンクワードは、各ＭＰ３チャンネル要素の長さで置き換えられている。ＩＳＯ／ＩＥＣ１３８１８−３によれば、１２ビットはこれに対して十分である。残りのヘッダはそれ以上修正されないが、例えば、送信される情報の量を減らすため、シンクワードを除くフレームヘッダや残りの冗長部を短縮のため修正することは可能である。

上述の実施例のさまざまな変形例も容易に実行できる。このように、図３，７，８のステップ、特に図３におけるステップ４２，５０，５６，６０や、図７における１１，１１４，１１８，１２２、さらに図８における１５２，１５４，１５６は変更可能である。

さらに、図３，７，８に関して、ここで示されたステップは、図２もしくは６それぞれの変換器あるいは再構築器それぞれにおける各特性により実施され、これは、例えばコンピュータもしくは配線回路として具現化できるということに注意するべきである。

図７の実施例において、サイド情報のヘッダ操作（ステップ１１８，１２２）それぞれは、受信機もしくは復号器側それぞれで、当初のＭＰ３データストリームに比べて若干変更されたＭＰ３データストリームに対してＭＰ３復号器に対して実施された。多くの適用例において、これらのステップを符号器もしくは送信機側それぞれで行うことは有利となりうるが、その理由は、受信機装置は大量生産された装置であることが多いため、受信機側における電子工学面での節約によりかなりの高利得が可能になるためである。他の実施例では、これらのステップがすでにＭＰ３−ＭＰＥＧ−４データフォーマット変換中に実施されている。この他のフォーマット変換方法によるステップが図９で示されているが、ここで図３と同様のステップは同一の参照番号で与えられ、繰り返しを避けるため再び説明することはしない。

まず、変換されるＭＰ３オーディオデータストリームはステップ４０で受信され、ステップ４２において、時間マークに関係する、もしくは各時間マークに関係するＭＰ３オーディオデータストリームで符号化されるオーディオ用信号の時間周期の符号化を示すオーディオデータがそれぞれ近接ブロックに結合され、これを全時間マークに対して行う。チャンネル要素を得るため、ヘッダが再び近接ブロックに追加される（ステップ５０）。しかし、ステップ５６のように同期ワードを各チャンネル要素の長さで置き換えるだけでヘッダが修正されるものではない。むしろ、図７のステップ１１８および１２２に対応するステップ１８０および１８２において、さらなる修正が続けられる。ステップ１８０において、各チャンネル要素のサイド情報はゼロに設定され、ステップ１８２において、各チャンネル要素のヘッダ内のビット率指標は、上述のように、ビット率に依存するＭＰ３データブロック長さがこのチャンネル要素、もしくは関係する時間マークそれぞれの全オーディオデータを、ヘッダやサイド情報の大きさとともに含む上で十分になるよう変更される。図９の方法により形成されるＭＰＥＧ−４オーディオデータストリームを、図７の方法により作動する復号器にステップ１１８および１２２なしで供給する場合、正確なビット率を後に生じさせるため、連続したチャンネル要素のヘッダ内のパディングビットを変更するステップもステップ１８２が含んでいる。パディングステップは、当然ながらステップ１２８内の復号器側でも実施できる。

ステップ１８２において、ステップ１２２に関係して説明したとおり、可能な最高値までビット率指標を設定しない方が有用となりうる。この値はまた最小値に設定することも可能であるが、これは、計算されたＭＰ３フレーム長さにおけるチャンネル要素の全オーディオデータ、ヘッダ、サイド情報を取り込むには十分なものであるが、これはすなわち、少ない係数で符号化できる符号化音響の通路の場合にビット率指標が少なくなることを意味する。

こういった修正後、ステップ６０および６２において、ファイルヘッダ（ＡｕｄｉｏＳｐｅｃｉｆｉｃＣｏｎｆｉｇ）だけが生成されるが、これはＭＰＥＧ−４オーディオデータストリームとしてＭＰ３チャンネル要素とともに出力される。これは、すでに述べたとおり、図７の方法によりプレイできるが、ここで、ステップ１１８および１２２は省略でき、これにより復号器側における実施内容が軽減される。ただし、ステップ４２，５０，５６，１８０，１８２，６０は任意の順番で実施可能である。

前述の説明は、固定データブロックビット長さをもつＭＰ３データストリームに対して典型的なものだけに関係するものである。当然ながら、可変データブロック長のＭＰ３データストリームは、前述の実施例により処理できるが、ここでビット率指標、さらにデータブロック長さもフレーム毎に変わる。

前述の説明はＭＰ３オーディオデータストリームに関係するものであった。他の非ポインタベースのオーディオデータストリームにおいて、本発明の実施例により、ヘッダとは別に、関連するサイド情報や関連するオーディオデータを含み、これによりＭＰＥＧ−４オーディオデータストリームを生成するためのすでに内蔵された典型的な１つのＭＰＥＧ１／２レイヤ２オーディオデータストリームにおけるヘッダを修正するステップが提供される。この修正により、各データブロックもしくは各データブロックのオーディオデータのいずれかのデータ量を示す長さ指示をもつ各ヘッダがもたらされるため、ＭＰＥＧ−４データストリームは、特に、図５に関して上で説明したものと同様に複数のＭＰＥＧ１／２レイヤ２オーディオデータストリームをマルチチャンネルオーディオデータストリームに結合する際には容易に復号できる。好ましくは、シンクワードあるいはＭＰＥＧ１／２レイヤ２データストリームのヘッダのこれの他の冗長部を長さ指示で置き換えることにより上で説明したやり方と同様に修正を行う。１つの時間マークに関係するオーディオデータを結合することで図５の前にポインタの再フォーマットあるいは解体を行う作業がレイヤ２データストリームにおいて省略されるが、この理由はここではバックポインタが存在しないためである。マルチチャンネルオーディオデータストリームの２つのチャンネルを示す２つのＭＰＥＧ１／２レイヤオーディオデータストリームで結合されたＭＰＥＧ−４オーディオデータストリームの復号は、長さ指示を読み込み、それに基づいてアクセスユニットの個々のチャンネル要素にアクセスすることで容易に実施される。これはその後、従来型ＭＰＥＧ１／２レイヤに準拠した復号器に送信できる。

さらに、バックポインタがポインタベースのオーディオデータストリームのデータブロック内に正確にあることは本発明にとって重要ではない。フレームヘッダ内で直接、これとともに近接判定ブロックを定義することもできる。

特に、条件によってはファイルフォーマット変換に対する本発明のスキームをソフトウェア内で実施することもできる。これは、電子的に読み込み可能な制御信号を用いてデジタルメモリ媒体、特にディスクあるいはＣＤ上で行うことが可能であるが、各方法を行うようプログラム可能なコンピュータシステムと協働もできる。これにより、一般に、本発明は、このように、コンピュータプログラム製品がコンピュータ上で実行される際に、本発明の方法を実施するための機械読み込み可能キャリア上に保存されたプログラムコードを用いてコンピュータプログラム製品内でも構成される。言い換えると、本発明はまた、コンピュータプログラムがコンピュータ上で作動する際に本発明を実施するためのプログラムコードをもつコンピュータプログラムとしても実現できる。

ＭＰ３ファイルフォーマットをバックポインタとともに図示する概略図である。ＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換するための構成を図示するブロック図である。本発明の１つの実施例によりＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換するための方法のフロー図である。判定ブロックを追加することで関連オーディオデータを結合するステップと、図３の方法における判定ブロックを修正するステップとを図示するための概略図である。本発明のさらなる実施例により複数のＭＰ３オーディオデータストリームをマルチチャンネルＭＰＥＧ−４オーディオデータストリームに変換するための方法を図示する概略図である。既存のＭＰ３復号器でＭＰ３オーディオデータストリームを復号できるようにするため、図３で得られるＭＰＥＧ−４オーディオデータストリームをＭＰ３オーディオデータストリームに戻るよう変換するための配置のブロック図である。図３で得られるＭＰＥＧ−４オーディオデータストリームをＭＰ３フォーマットの１つ以上のオーディオデータストリームに再変換するための方法のフロー図である。本発明のさらなる実施例により、図３で得られるＭＰＥＧ−４オーディオデータストリームをＭＰ３フォーマットの１つ以上のオーディオデータストリームに再変換するための方法のフロー図である。本発明のさらなる実施例によりＭＰ３オーディオデータストリームをＭＰＥＧ−４オーディオデータストリームに変換するための方法のフロー図である。

Claims

時間周期を含み、第１ファイルフォーマットをもつ符号化されるオーディオ用信号を示す第１オーディオデータストリーム１０を、符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリームに変換するための方法であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより、第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とを含み、判定ブロックオーディオデータが判定ブロック１４，１６に関係付けられ、これらの判定ブロックが時間周期を符号化することで得られ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が、次データブロックに関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ｂ，１２ｃの開始点の前にあることを特徴とする方法であって、この方法が、
第２オーディオデータストリームの一部を形成する近接判定ブロックオーディオデータ４８を得るため、少なくとも２つのデータブロックの判定ブロックに関係付けられる判定ブロックオーディオデータ４４，４６を結合する４２ステップを含む方法。
請求項１に記載の方法であって、この方法がさらに、
チャンネル要素５２ａを得るため、判定ブロックオーディオデータ４４，４６が関係付けられ、近接判定ブロックオーディオデータが得られる判定ブロック１４，１６を、近接判定ブロックオーディオデータ４８に追加する５０ステップと、
第２オーディオデータストリームを得るため、チャンネル要素を配列するステップと、
を含む方法。
請求項２に記載の方法であって、この方法がさらに、
チャンネル要素５４ａ−５４ｃが、チャンネル要素５４ａ−５４ｃのデータ量もしくは近接判定ブロックオーディオデータのデータ量を示す長さ指示を含むようチャンネル要素５４ａ−５４ｃを修正する５６ステップを含む方法。
請求項３に記載の方法であって、修正ステップが、全判定ブロックに対して同一の冗長部を長さ指示で置き換える５６ステップを含むことを特徴とする方法。
請求項１ないし請求項４のいずれかに記載の方法であって、この方法がさらに、
第２オーディオデータストリームの前に全体判定ブロックを置く６０，６２ステップであって、全体判定ブロックが全判定ブロックに対して同一の冗長部をもつステップを含む方法。
請求項１ないし請求項５のいずれかに記載の方法であって、結合ステップが、
判定ブロックのポインタを読み込むサブステップと、
少なくとも２つのデータブロックの内の１つのデータブロックオーディオデータに含まれ、判定ブロックのポインタが示す判定ブロックオーディオデータの開始点を含む判定ブロックオーディオデータの第１部分を読み込むサブステップと、
少なくとも２つのデータブロックの他のデータブロックオーディオデータに含まれ、判定ブロックオーディオデータの終了点を含む判定ブロックオーディオデータの第２部分を読み込むサブステップと、
第１部分と第２部分とを結合させるサブステップと、
を含むことを特徴とする方法。
符号化される第１オーディオ用信号を示す第１オーディオデータストリームおよび符号化される第２オーディオ用信号を示す第２オーディオデータストリームをマルチチャンネルオーディオデータストリームに結合するための方法であって、この方法が、
第１オーディオデータストリームを、請求項２ないし請求項６もしくは請求項１０ないし請求項１２のいずれかに記載の方法により第１サブオーディオデータストリームに変換するステップと、
第２オーディオデータストリームを、請求項２ないし請求項６もしくは請求項１０ないし請求項１２のいずれかに記載の方法により第２サブオーディオデータストリームに変換するステップと、
を含む方法であって、
配列ステップが、２つのサブオーディオデータストリームがともに第２オーディオデータストリームを形成し、第２オーディオデータストリームにおいて、時間の等しい時間周期を符号化することで得られる近接判定ブロックオーディオデータを含む第１サブオーディオデータストリームのチャンネル要素７０ａと第２サブオーディオデータストリームのチャンネル要素７２ａとが近接するアクセスユニット７８において順次配列されることを特徴とする方法。
請求項７に記載の方法であって、この方法がさらに、
全体判定ブロックを第２オーディオデータストリームの前に置くステップであって、全体判定ブロックが、第１サブオーディオデータストリームと第２サブオーディオデータストリーム７０ｂとのチャンネル要素７０ａがアクセスユニット７８においてどの順番で配列されるかを示すフォーマット指示を含むステップを含む方法。
請求項１ないし請求項８のいずれかに記載の方法であって、データブロックが、この判定ブロックのサンプル率指示およびビット率指示に応じて等しい、あるいは所定の変動可能サイズのデータブロックであることを特徴とする方法。
時間周期を含み、第１ファイルフォーマットをもつ符号化されるオーディオ用信号を示す第１オーディオデータストリームを、符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリームに変換するための方法であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロックに分割され、データブロックが判定ブロックとデータブロックオーディオデータとを含むことを特徴とする方法であって、この方法が、
データブロックから第２オーディオデータストリームを形成するチャンネル要素を得るため、データブロックが、データブロックのデータ量もしくはデータブロックオーディオデータのデータ量を示す長さ指示を含むようデータブロックを修正するステップを含む方法。
請求項１０に記載の方法であって、修正ステップが、全判定ブロックに対して同一の冗長部を長さ指示で置き換えるステップを含むことを特徴とする方法。
請求項１ないし請求項６のいずれかに記載の方法であって、この方法がさらに、
判定ブロックオーディオデータが各判定ブロックの直後に始まる判定ブロックの開始点として判定ブロックが指示するよう、判定ブロックのポインタをリセットする１８０ステップと、
第１オーディオファイルフォーマットによるビット率指示に応じてデータブロック長が各判定ブロックと関連判定ブロックオーディオデータとを取り込む上で十分となるよう判定ブロックのビット率指示を変更する１８２ステップと、
を含む方法。
符号化される信号を示し、第１ファイルフォーマットをもつ第１オーディオデータストリームを復号できる復号器に基づき、第１オーディオデータストリーム時間周期を含む符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリーム１０を復号するための方法であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とをもち、時間周期を符号化することで得られる判定ブロックオーディオデータが判定ブロック１４，１６と関係付けられ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が、次データブロックと関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ａ−１２ｃの開始点前にあり、第２オーディオデータストリームが第２ファイルフォーマットに応じてチャンネル要素に分割され、チャンネル要素が、２つのデータブロックからの判定ブロックに関係付けられる判定ブロックオーディオデータと、関係付けられる判定ブロックとを結合することで得られる近接判定ブロックオーディオデータ４４，４６を含むことを特徴とする方法であって、この方法が、
符号化されるオーディオ用信号を示し、第１ファイルフォーマットをもつ入力データストリームを、
リセット判定ブロックを得るため、判定ブロックオーディオデータが各判定ブロックの直後に始まることをポインタが判定ブロックオーディオデータの開始点として指示するよう第２オーディオデータストリームのチャンネル要素の判定ブロックのポインタをリセットするステップと、
ビット率が増加してリセットされる判定ブロックを得るため、第２オーディオデータストリームのチャンネル要素の判定ブロックにおいてビット率指示を上げるステップと、
各チャンネル要素に加えて挿入されるビットの長さが上げられるビット率指示に適応されるよう各チャンネル要素と次位チャンネル要素との間にビットを挿入するステップとにより第２オーディオデータストリームから形成するステップと、
オーディオ用信号を得るため、上げられるビット率指示に応じて入力データストリームを復号器に供給するステップと、
を含む方法。
時間周期を含み、符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリーム１０を、符号化されるオーディオ用信号を示し、第１ファイルフォーマットをもつ第２オーディオデータストリームに変換するための方法であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とをもち、時間周期を符号化することで得られる判定ブロックオーディオデータが判定ブロック１４，１６と関係付けられ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が次データブロックと関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ｂ，１２ｃの開始点前にあり、第２オーディオデータストリームが第２ファイルフォーマットに応じてチャンネル要素に分割され、チャンネル要素が、２つのデータブロックからの判定ブロックに関係付けられる判定ブロックオーディオデータと、関係付けられる判定ブロックとを結合することで得られる近接判定ブロックオーディオデータ４４，４６を含むことを特徴とする方法であって、この方法が、
チャンネル要素の判定ブロックに基づき再構築データブロックビット長を判定するステップと、
再構築データブロックビット長の間隔で第２オーディオデータストリームに判定ブロックを配列するステップと、
近接判定ブロックオーディオデータを２つのデータブロックのデータブロックオーディオデータに分割することで判定ブロックとデータブロックオーディオデータを用いてデータブロックを得るため、第２オーディオデータストリームにおける判定ブロックにポインタに応じた各チャンネル要素の近接判定ブロックオーディオデータを挿入するステップと、
を含む方法。
符号化される信号を示し、第１ファイルフォーマットをもつ第１オーディオデータストリームをオーディオ用信号に復号できる復号器に基づき、時間周期を含む符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリーム１０を復号するための方法であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とをもち、時間周期を符号化することで得られる判定ブロックオーディオデータが判定ブロック１４，１６と関係付けられ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が、次データブロックと関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ａ−１２ｃの開始点前にあり、第２オーディオデータストリームが第２ファイルフォーマットに応じてチャンネル要素に分割され、チャンネル要素が、２つのデータブロックからの判定ブロックに関係付けられる判定ブロックオーディオデータを結合することで得られる近接判定ブロックオーディオデータ４４，４６を含み、判定ブロックオーディオデータが各判定ブロックの直後に始まることを判定ブロックオーディオデータの開始点としてポインタが指示するよう、判定ブロックのポインタが第２オーディオデータストリームでリセットされ、第１オーディオファイルフォーマットによるビット率指示に応じたデータブロック長が各判定ブロックと関連判定ブロックオーディオデータとを取り上げる上で十分になるよう第２オーディオデータストリームの判定ブロックのビット率指示が変更されることを特徴とする方法であって、この方法が、
符号化されるオーディオ用信号を示し、第１ファイルフォーマットをもつ入力データストリームを、
各チャンネル要素に加えて挿入されるビットの長さが変えられるビット率指示に適応されるよう各チャンネル要素と次位チャンネル要素との間にビットを挿入するステップにより第２オーディオデータストリームから形成するステップと、
オーディオ用信号を得るため、変えられるビット率指示に応じて入力データストリームを復号器に供給するステップと、
を含む方法。
時間周期を含み、第１ファイルフォーマットをもつ符号化されるオーディオ用信号を示す第１オーディオデータストリーム１０を、符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリームに変換するための装置であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより、第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とを含み、判定ブロックオーディオデータが判定ブロック１４，１６に関係付けられ、これらの判定ブロックが時間周期を符号化することで得られ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が、次データブロックに関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ｂ，１２ｃの開始点の前にあることを特徴とする装置であって、この装置が、
第２オーディオデータストリームの一部を形成する近接判定ブロックオーディオデータ４８を得るため、２つのデータブロックの判定ブロックに関係付けられる判定ブロックオーディオデータ４４，４６を結合する手段４２を備える装置。
請求項１４に記載の装置であって、この装置がさらに、
チャンネル要素５２ａを得るため、判定ブロックオーディオデータ４４，４６が関係付けられ、近接判定ブロックオーディオデータが得られる判定ブロック１４，１６を、近接判定ブロックオーディオデータ４８に追加するための手段５０と、
第２オーディオデータストリームを得るため、チャンネル要素を配列するための手段と、
を備える装置。
符号化される信号を示し、第１ファイルフォーマットをもつ第１オーディオデータストリームを復号できる復号器に基づき、第１オーディオデータストリーム時間周期を含む符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリーム１０を復号するための装置であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とをもち、時間周期を符号化することで得られる判定ブロックオーディオデータが判定ブロック１４，１６と関係付けられ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が次データブロックと関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ａ−１２ｃの開始点前にあり、第２オーディオデータストリームが第２ファイルフォーマットに応じてチャンネル要素に分割され、チャンネル要素が、２つのデータブロックからの判定ブロックに関係付けられる判定ブロックオーディオデータと、関係付けられる判定ブロックとを結合することで得られる近接判定ブロックオーディオデータ４４，４６を含むことを特徴とする装置であって、この装置が、
符号化されるオーディオ用信号を示し、第１ファイルフォーマットをもつ入力データストリームを、
リセット判定ブロックを得るため、判定ブロックオーディオデータが各判定ブロックの直後に始まるということをポインタが判定ブロックオーディオデータの開始点として指示するよう第２オーディオデータストリームのチャンネル要素の判定ブロックのポインタをリセットするステップと、
ビット率が増加してリセットされる判定ブロックを得るため、第２オーディオデータストリームのチャンネル要素の判定ブロックにおけるビット率指示を上げるステップと、
各チャンネル要素に加えて挿入されるビットの長さが上げられるビット率指示に適応されるよう、各チャンネル要素と次位チャンネル要素との間にビットを挿入するステップと、
により第２オーディオデータストリームから形成するための手段と、
オーディオ用信号を得るため、上げられるビット率指示に応じて入力データストリームを復号器に供給するための手段と、
を備える装置。
時間周期を含み、符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリーム１０を、符号化されるオーディオ用信号を示し、第１ファイルフォーマットをもつ第２オーディオデータストリームに変換するための装置であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とをもち、時間周期を符号化することで得られる判定ブロックオーディオデータが判定ブロック１４，１６と関係付けられ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が次データブロックと関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ｂ，１２ｃの開始点前にあり、第２オーディオデータストリームが第２ファイルフォーマットに応じてチャンネル要素に分割され、チャンネル要素が、２つのデータブロックからの判定ブロックに関係付けられる判定ブロックオーディオデータと、関係付けられる判定ブロックとを結合することで得られる近接判定ブロックオーディオデータ４４，４６を含むことを特徴とする装置であって、この装置が、
チャンネル要素の判定ブロックに基づき再構築データブロックビット長を判定するための手段と、
再構築データブロックビット長の間隔で第２オーディオデータストリームに判定ブロックを配列するための手段と、
近接判定ブロックオーディオデータを２つのデータブロックのデータブロックオーディオデータに分割することで判定ブロックとデータブロックオーディオデータを用いてデータブロックを得るため、第２オーディオデータストリームにおける判定ブロックにポインタに応じた各チャンネル要素の近接判定ブロックオーディオデータを挿入する手段と、
を備える装置。
時間周期を含み、第１ファイルフォーマットをもつ符号化されるオーディオ用信号を示す第１オーディオデータストリームを、符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリームに変換するための装置であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロックに分割され、データブロックが判定ブロックとデータブロックオーディオデータとを含むことを特徴とする装置であって、この装置が、
データブロックから第２オーディオデータストリームを形成するチャンネル要素を得るため、データブロックが、データブロックのデータ量もしくはデータブロックオーディオデータのデータ量を示す長さ指示を含むようデータブロックを修正するための手段を含む装置。
符号化される信号を示し、第１ファイルフォーマットをもつ第１オーディオデータストリームをオーディオ用信号に復号できる復号器に基づき、時間周期を含む符号化されるオーディオ用信号を示し、第２ファイルフォーマットをもつ第２オーディオデータストリーム１０を復号するための装置であって、時間周期が多数のオーディオ値を含み、第１ファイルフォーマットにより第１オーディオデータストリームが次位データブロック１０ａ−１０ｃに分割され、データブロックが判定ブロック１４，１６とデータブロックオーディオデータ１８とをもち、時間周期を符号化することで得られる判定ブロックオーディオデータが判定ブロック１４，１６と関係付けられ、判定ブロックが、判定ブロックオーディオデータ１２ａ−１２ｃの開始点を示すポインタを含み、判定ブロックオーディオデータ１２ａ−１２ｃの終了点が、次データブロックと関係付けられるオーディオデータストリームの判定ブロックオーディオデータ１２ａ−１２ｃの開始点前にあり、第２オーディオデータストリームが第２ファイルフォーマットに応じてチャンネル要素に分割され、チャンネル要素が、２つのデータブロックからの判定ブロックに関係付けられる判定ブロックオーディオデータを結合することで得られる近接判定ブロックオーディオデータ４４，４６を含み、判定ブロックオーディオデータが各判定ブロックの直後に始まるということを判定ブロックオーディオデータの開始点としてポインタが指示するよう判定ブロックのポインタが第２オーディオデータストリームでリセットされ、第１オーディオファイルフォーマットによるビット率指示に応じたデータブロック長が各判定ブロックと関連判定ブロックオーディオデータとを取り上げる上で十分になるよう第２オーディオデータストリームの判定ブロックのビット率指示が変更されることを特徴とする装置であって、この装置が、
符号化されるオーディオ用信号を示し、第１ファイルフォーマットをもつ入力データストリームを、
各チャンネル要素に加えて挿入されるビットの長さが変えられるビット率指示に適応されるよう、各チャンネル要素と次位チャンネル要素との間にビットを挿入するステップにより第２オーディオデータストリームから形成する手段と、
オーディオ用信号を得るため、変えられるビット率指示に応じて入力データストリームを復号器に供給するための手段と、
を備える装置。
コンピュータプログラムがコンピュータプログラム上で実行される際に請求項１，請求項１０，請求項１３，請求項１４もしくは請求項１５のいずれかに記載の方法を実施するためのプログラムコードをもつコンピュータプログラム。