JP2002534702A

JP2002534702A - オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Info

Publication number: JP2002534702A
Application number: JP2000591732A
Authority: JP
Inventors: スペルシュナイダー、ラルフ; ディーツ、マルティン; エーレト、アンドレアス; ブランデンブルク、カールハインツ; ゲルハオイサー、ハインツ; ノブバクート−イラニ、アリ; ラオバー、ピエレ; ビット、ローラント
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 1998-12-28
Filing date: 1998-12-28
Publication date: 2002-10-15
Anticipated expiration: 2018-12-28
Also published as: AU754877B2; AU2163699A; JP3580777B2; CA2356869A1; CA2356869C; KR100391935B1; US6975254B1; KR20010108051A

Abstract

(57)【要約】符号化されたビットストリームを得るためにオーディオ信号を符号化する方法において、スペクトル値を得るために、オーディオ信号の離散時間型サンプルが周波数領域に変換される。このスペクトル値は、暗語によって符号化されたスペクトル値を得るために、限られた数の互いに異なる長さの暗語を有するコード表を用いて符号化される。スペクトル値に与えられる暗語の長さは、そのスペクトル値が発生する可能性が高ければ高いほど、短いものである。符号化されたビットストリームのためにラスターが規定される。このラスターは等距離で並ぶラスターポイントを含み、ラスターポイント間距離は使用されるコード表に基づくものである。誤差許容ハフマンコーディングのために、優先暗語、つまり、他のスペクトル値よりも心理音響的に重要な特別なスペクトル値を表す暗語が、ラスター内に、各優先暗語の始まりがラスターポイントと一致するように配列される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

本発明は誤差許容エントロピー符号化又は復号化、特に誤差許容ハフマンコー
ディング又はデコーディングを実行することができる、オーディオ信号又はビッ
トストリームを符号化あるいは復号化するための方法及び装置に関する。

【０００２】

【従来の技術と課題】

最近のオーディオ符号化あるいは復号化の方法は、例えば、ＭＰＥＧ層３標準
によるものであるが、信号の質の明らかな低下を生じることなく、例えば因数１
２によってオーディオ信号のデータレートを圧縮することが可能である。このよ
うな高いデータレートの圧縮を可能にするためには、オーディオ信号をサンプリ
ングし、結果的に一連の離散時間型サンプルとなる。この種の技術において知ら
れているように、ウィンドウされた時間的なサンプル群を得るために、この一連
の離散時間型サンプルは、適当なウィンドウ機能を使用してウィンドウされる。
ある一つのウィンドウされた時間的なサンプル群は、フィルタバンク、変形離散
コサイン変換（ＭＤＣＴ）あるいは他の適当な方法によって周波数領域に変更さ
れ、それにより、周波数領域における、そのオーディオ信号、つまり、その離散
時間型サンプル群からなるその時間的部分を表すスペクトル値を得る。通常、５
０％重なる時間群が生成され、ＭＣＤＴによって周波数領域に変換される。ＭＤ
ＣＴの特性のために、例えば１０２４の離散時間型サンプルは、常に１０２４の
スペクトル値になる。

【０００３】人間の耳の感受性はオーディオ信号そのものの時間的なスペクトルによること
が知られている。これはいわゆる心理聴覚モデルに反映されている。このモデル
を利用して、時間的スペクトルによるマスキング閾値を計算することが可能であ
った。マスキングとは、ある特定のトーン又はスペクトル部分が、例えば、その
隣り合うスペクトル領域が比較的高いエネルギーを有する時、聞こえないものと
判断されることである。このマスキング現象は、変換後のスペクトル値をできる
だけ粗く量子化するために利用される。従って、目的は、できる限り少ないビッ
トを符号化、あるいはここでは量子化し、復号化されたオーディオ信号には可聴
範囲の妨害を避けることである。量子化により引き起こされる妨害、つまり、量
子化ノイズはマスキング閾値以下であり、従って可聴域外であるべきである。周
知の方法によれば、スペクトル値は従っていわゆる倍率帯域に予備分割され、こ
れは、人間の聴覚の周波数群を反映している。ある倍率群のスペクトル値には、
倍率帯域全体のスペクトル値を調整するために、ある倍率を掛ける。そして、倍
率で調整された倍率帯域は量子化され、量子化されたスペクトル値を生成する。
もちろん、倍率帯域にグルーピングすることは重要でない。しかし、この手順は
ＭＰＥＧ層３標準及びＭＰＥＧ−２ＡＡＣ（ＡＡＣは上級オーディオ符号化）
標準に使用されている。

【０００４】データ圧縮の非常に重要な要素は、量子化されたスペクトル値のエントロピー
符号化である。普通、ハフマンコーディングがこれに利用される。ハフマンコー
ディングは長さが変動する符号化を伴う。つまり、符号化されるべき値のための
暗語の長さは、この値が起こりうる可能性に基づいている。論理的には、最も起
こり易い記号が最も短い符号、つまり、暗語を割り当てられ、その結果、ハフマ
ンコーディングによって非常に良好な余分な部分の削減が達成できる。よく知ら
れている長さ変動の符号化の一つの例は、モールス式符号である。

【０００５】オーディオ符号化の際、ハフマンコードは量子化されたスペクトル値を符号化
するために用いられる。例えば、ＭＰＥＧ−２ＡＡＣ標準で作動する最近のオ
ーディオコーダは、量子化されたスペクトル値を符号化するために、部分ごとに
特定の標準に基づき、スペクトルに割り当てられる、複数の異なるハフマンコー
ド表を使用する。ここでは、二つ又は四つのスペクトル値が常に一体的に一つの
暗語に符号化される。

【０００６】ＭＰＥＧ−２ＡＡＣに基づく方法がＭＰＥＧ層３の方法と異なる点の一つは
、異なる倍率帯域、つまり、異なるスペクトル値が、任意の数のスペクトル部分
にグループ分けされることである。ＡＡＣにおいて、一つのスペクトル部分は少
なくとも四つのスペクトル値、好ましくはそれ以上のスペクトル値を含んでいる
。スペクトル値の全周波数領域は、このようにして隣接するいくつかの部分、そ
れぞれの部分は周波数帯域を表すのだが、に分割され、結果的に、これら全ての
部分が変換前のスペクトル値に渡る全ての周波数領域をカバーする。

【０００７】余分な部分の削減を最大にするために、ＭＰＥＧ層３による方法と同様に、い
わゆるハフマン表、複数のこのようなハフマン表のうちの一つが各部分に割り当
てられる。ＡＡＣ方法のビットストリームでは、普通１０２４のスペクトル値を
含み、これらのスペクトル値のためのハフマン暗語は周波数が高くなって行く順
に並んでいる。各周波数部分で使用される表の情報はサイド情報として送られる
。この状況を図２に示す。

【０００８】図２に一例として示すケースでは、ビットストリームは１０のハフマン暗語を
含んでいる。もし一つの暗語が常に一つのスペクトラル値から形成されるならば
、１０個のスペクトル値がここで符号化できる。しかし、通常、２個又は４個の
スペクトル値が常に一体的に一つの暗語に符号化されるので、図２は２０個又は
４０個のスペクトル値を含む符号化されたビットスリームの一部を示しているこ
とになる。各ハフマン暗語が２個のスペクトル値を含んでいる場合、番号１で示
されている暗語は最初の２個のスペクトル値を表している。この暗語の長さは比
較的短く、この最初の二つのスペクトル値、つまり、最も低い二つの周波数係数
は比較的頻繁に起こることを意味している。他方、番号２で示されている暗語は
比較的長く、この符号化されたオーディオ信号では3番目及び4番目のスペクトル
係数の発生は比較的まれで、それ故にこれらのスペクトル係数は比較的大きなビ
ット数で符号化される。図２に示すように、番号３，４，５で示される暗語はス
ペクトル係数５，６，７，８，９，１０を表しているが、これらの各暗語は比較
的短いので、これらの係数は比較的頻繁に発生する。番号６〜１０で示されてい
る暗語についても同様の考え方ができる。

【０００９】前述したように、図２からも明らかなように、符号化されたスペクトル値のた
めのハフマン暗語は、周知の符号化装置によって生成されるビットストリームの
場合、そのビットストリーム中に周波数が高くなっていく順に一列に並んでいる
。

【００１０】エラーが発生するチャンネルにおけるハフマンコーディングの最大の不利益は
、そのエラーを伝達してしまうことである。例えば、図２中の番号２で示される
暗語が伝えられる際に、この暗語２の長さが変更されるかもしれないという無意
味とは言えない可能性がある。このようにして正しい長さとは異なる場合がある
。図２の場合、もし暗語２の長さが妨害により変更されたなら、デコーダはもは
や、暗語３−１０がどこから始まるのかを判断できなくなり、つまり、そのオー
ディオ信号のほとんど全ての部分が影響を受けることになる。このように、妨害
された暗語に続く他の全ての暗語さえも正確に復号化されなくなる。それは、こ
れらの暗語がどこから始まるのかわからなくなり、この誤差のために、間違った
開始点が選ばれてしまうからである。

【００１１】このようなエラー伝達の問題を解決するために、ヨーロッパ特許第０６１２１
５６号は、一つの暗語の始まりが、完全な復号化をしなくても、あるいは誤った
伝達の場合にでも、より簡単に確認できるように、長さの異なる暗語のいくつか
をラスター配列させ、他の暗語を残りの隙間に配置させることを提案している。

【００１２】この周知の方法の効率を決定づけるパラメータは、そのラスターが実際どのよ
うに定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスタ
ーポイント間のラスター距離等である。しかし、ヨーロッパ特許第０６１２１５
６号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般
的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するた
めにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明
もない。

【００１３】本発明の目的は、誤差許容にもかかわらず効率的なオーディオ信号又はビット
ストリームの符号化及び復号化のための概念を提供することにある。

【００１４】

【発明の構成、作用及び効果】

前記目的は、請求項１又は請求項９に係るオーディオ信号の符号化方法、請求
項２１又は請求項２２に係るオーディオ信号の符号化装置、請求項２３又は請求
項２４に係るビットストリームの復号化方法及び請求項２５又は請求項２６に係
るビットストリームの復号化装置により達成される。

【００１５】本発明は、既に提案されているラスターは誤差許容符号化／復号化だけでなく
、効率的な符号化／復号化を可能にするように形成または使用されなければなら
ないという発見に基づくものである。ここで最も重要なことは、ハフマンコーデ
ィングという形でのエントロピー符号化によって得られる暗語は本質的に長さの
異なるものである。最も大きな符号化の成果は、最も頻繁に起こる値に最も短い
暗語を与える場合、現れる。他方、比較的まれに起こる値は、たとえ長い暗語を
与えても、統計上、データ量としては最適値になる。ハフマンコーディングによ
って得られる暗語は、本質的に異なる長さを有するものである。

【００１６】本発明の第１の特徴点によると、いわゆる優先暗語がラスターポイントに配置
され、これにより、たとえビットストリーム中にエラーがあっても、ラスターを
通してデコーダが間違いなく各優先暗語の始まりを認知することができる。優先
暗語は、心理音響的に重要な暗語である。このことは、いわゆる優先暗語によっ
て符号化されたスペクトル値が、復号化されたオーディオ信号の聴感覚に実質的
に貢献するということを意味している。オーディオ信号が高い割合でスピーチを
含んでいる場合、優先暗語は低いスペクトル値を表す暗語である。なぜならば、
この場合、重要なスペクトル情報はスペクトルの低い領域にあるからである。オ
ーディオ信号がスペクトルの中領域にあるトーン群を持っている場合、優先暗語
は周波数領域のこれに相当する中領域のスペクトル値に割り当てられた暗語であ
る。なぜならば、これらが心理音響的に重要なスペクトル値であるからである。
心理音響的に重要なスペクトル値は、また、その規模つまり信号エネルギーがス
ペクトル内の他のスペクトル値に比べて大きいものである。他方、心理音響的に
さほど重要でない暗語、いわゆる非優先暗語がこのラスターを埋める。従って、
これらの暗語はラスターポイントと共には位置しないが、優先暗語がラスターポ
イントに配置された後、残りの空間に「はめ込まれる」。

【００１７】従って、本発明の第１の特徴点によれば、優先暗語、つまり、心理音響的に重
要なスペクトル値に与えられた暗語が、これらの優先暗語の開始点とラスターポ
イントが一致するようにラスター配列される。

【００１８】本発明の第２の特徴点によると、スペクトル値はスペクトル部分にグループ分
けされ、異なるコード表が各スペクトル部分に与えられる。スペクトル部分への
コード表の割り当ては、信号の統計的な考慮に基づいて、例えば、あるスペクト
ル部分の符号化に最も適するコード表はどれかということに基づいてなされる。
スペクトル部分へのコード表の割り当ては、すでにこの技術分野では周知である
。

【００１９】等距離で配列されたラスターポイントのグループがいくつか集まったラスター
が使用されることになる。一つのラスターポイントグループ内のラスターポイン
ト間の距離は、一つのスペクトル部分の符号化に使用されるコード表に基づいて
いる。他の別のスペクトル部分では、最適なデータ圧縮を行うために別のコード
表が使用される。この別のコード表は、別のグループの等距離で配列されている
ラスターポイントに割り当てられ、このラスターポイントグループ内の二つのラ
スターポイントの距離はその関連するコード表に基づいている。互いに異なるラ
スターポイントグループの二つのラスターポイントの距離は、少なくとも三つの
方法で決定することができる。

【００２０】最初に、一のコード表の暗語の最大長さを確定する。このコード表が与えられ
たラスターポイントグループ内の二つのラスターポイントの距離は、そのコード
表の暗語の最大長さと同じか又は最大長さよりも大きいので、ラスターにはこの
コード表の最長の暗語のための空間がある。別のコード表に関連する別のラスタ
ーポイントグループ内の二つのラスターポイントの距離は、この別のコード表の
暗語の最大長さに基づき、同様の方法で決定される。

【００２１】以下に説明する２番目の方法は、ラスターポイントの数の増加にも貢献する。
ハフマンコードの本質的な特性のために、あまり頻繁に発生しない暗語は、より
頻繁に発生する暗語よりも長い。ラスターポイント間の距離を、ある表の暗語の
最大長さと同じか又はそれよりも大きく設定する場合、そのラスターに挿入され
る暗語は通常そのラスターポイント間距離よりも短い。従って、ラスターポイン
ト間距離は、ある表の暗語の最大長さよりも短く設定することも可能である。符
号化の際にそのラスターに入りきらない暗語が現れた場合、ラスターに入らない
残りの部分は、ビットストリームのラスター配列外の他の適当な場所に挿入され
る。結果として、この分断された暗語はもはやエラー伝達から有効に保護されな
い。これは非常にまれなことであり、ラスターポイントの数の増加という利益の
ために受け入れられるものである。

【００２２】異なるラスターポイント間距離を決定する第３の方法は、コード表の暗語の最
大長さではなく、符号化されたスペクトル部分に実際に生じるビットストリーム
中の暗語の最大長さを考慮することである。

【００２３】本発明の第３の特徴点によると、本質的に周波数に関して直線的に高くなる順
番によるビットストリーム中の暗語の配列に代わり、暗語が周波数領域に渡り分
散される配列が使用され、これはまた「スクランブリング」として知られている
方法である。これはいわゆる「突発的なエラー」が、全周波数帯域の間違った複
合化につながることはなく、単にいくつかの異なる周波数領域で小さな妨害が見
られる程度であるという利点を有している。

【００２４】本発明の第４の特徴点によると、本質的に周波数に関して直線的に高くなる順
番による暗語の配列に代わり、例えばｎ番目ごと（例えば、２番目ごと、３番目
ごと、又は４番目ごと）の暗語だけがラスターに配列されるという配列方法が使
用され得る。この方法では、可能なラスターポイントの数が優先暗語の数よりも
小さい場合、優先暗語を使用するスペクトル領域を可能な限り大きくすること、
つまり、エラー伝達を防止することが可能になる。

【００２５】さらに、効率的な作動を達成するような方法で優先暗語を決定することに優先
権が与えられる。好ましくは、このことは心理音響的に重要な暗語、つまり優先
暗語が低周波のスペクトル値を符号化するものであるという仮説を放棄すること
を意味する。このような場合はしばしばあるが、常にそうであるとは限らない。

【００２６】通常、優先暗語は心理音響的に重要なスペクトルラインを符号化するものであ
り、これらは通常高いエネルギーを有するスペクトル値である。高いエネルギー
を有するスペクトルラインはエラーによっては生じない。

【００２７】本発明によると、すでに暗黙的に決定されたインディケータが使用される。こ
のインディケータは使用されるコード表に基づくものである。ＡＡＣ標準におい
て、例えば、異なる絶対値域を有する１１のコード表がある。コード表１は例え
ば−１〜＋１の絶対値を持つスペクトル値を含み、コード表１１は−８１９１〜
＋８１９１のスペクトル値を符号化する。コード表番号が大きくなればなるほど
、それが符号化できる値域が大きくなる。このことは、小さい番号のコード表は
比較的小さな値のみを表し、それ故に比較的小さなエラーを引き起こすだけであ
り、大きな番号のコード表は比較的大きな値域を表し、比較的大きなエラーを引
き起こすことを意味している。

【００２８】小さな番号のコード表においてエラーが発生しても、それはよく聞こえないも
のであり、間違ったスペクトルラインの結果は、元々の正しいスペクトルライン
とさほど違わないものとなる。しかし、最も大きな番号のコード表においてエラ
ーが発生した場合、このエラーは原則としてこのコード表の絶対値のいくつかと
なり得る。最も大きな番号のコード表で符号化されたスペクトルラインが小さい
値を有し、例えば伝達の間に生じたエラーのために、デコーダ内で、このコード
表によって最も高い絶対値を持つスペクトルラインとして複合化された場合、こ
の間違ったスペクトルラインは確かに聞こえるものとなる。

【００２９】誤差許容に関して、最も重要なコード表は従って最も大きな番号のコード表（
ＡＡＣ標準ではコード表１１）である。なぜならば、このコード表は、値を−２ ¹³ ＋１（−８１９１）〜＋２¹³−１（＋８１９１）の間に逃してしまうからであ
る。

【００３０】本発明のさらなる特徴点によると、短いウィンドウがＡＡＣ標準の伝達信号の
ために使用される。短いウィンドウにより、周波数分解能はより高い時間的分解
能のために減じられる。優先暗語は、心理音響的に重要なスペクトル値、つまり
低周波のスペクトル値又は番号の大きいコード表からのスペクトル値がラスター
ポイント上に確かに配置されるように、決定される。倍率帯域のインターリービ
ングは、これはＡＡＣ標準の特徴であるが、この目的のために解除される。

【００３１】

【発明の実施形態】

本発明の好ましい実施形態を添付図面を参照しながら説明する。

【００３２】本発明を説明するために、図２に優先暗語を斜線で示す。図２は、周知の異な
る長さの暗語の配列を示しているが、これは周波数に関して直線的に高くなる順
番によるものである。図２では、優先暗語が暗語１〜５である。前述したように
、オーディオ信号が例えば高い割合でスピーチを含んでいる場合、または多くの
低周波音を含んでいる場合、低周波のスペクトル値に与えられる暗語が優先暗語
である。図２中、暗語６〜１０は高周波のスペクトル値に関連するものであり、
これらのスペクトル値は復号化された信号の全体的な印象に貢献するものの、聴
感覚には大して影響せず、従って心理音響的にあまり重要ではない。

【００３３】図１は、ラスターポイント１０〜１８を有するビットストリームを示す。図１
中、ラスターポイント１０とラスターポイント１２の間の距離をＤ１、ラスター
ポイント１４とラスターポイント１６の間の距離をＤ２とする。

【００３４】本発明の第１の特徴点の説明に関して、ラスターポイント１０からラスターポ
イント１４の間のビットストリームだけを考える。優先暗語１，２は、図２に示
された例では低周波域に位置している重要なスペクトル部分であるが、これが復
号化の際にエラー伝達の対象とならないように、ラスターに配列されている。非
優先暗語、図１、図２において斜線を符していないものであるが、これらは優先
暗語の後に、ラスターを埋めるように配置される。ハフマン暗語の長さは暗語そ
のものからわかるので、非優先暗語を一固まりでラスターに入れ込む必要はない
。デコーダは、読み取ったものが暗語の単に一部だけであるのかどうかを判別で
きる。この場合、デコーダは自動的に、暗語の最初の部分に、次のラスターポイ
ントの後の優先暗語に引き続き、ある特定のビット数を付加する。従って、非優
先暗語７，８，９のそれぞれがビットストリーム中二つに分けられ、つまり、７
ａ，７ｂ、８ａ，８ｂ、９ａ，９ｂに分けられるように、非優先暗語の最初の部
分をラスターの最初の空き場所に挿入し、残りの部分を他の場所に挿入すること
が可能である。

【００３５】既に説明したように、図１のビットストリームの第２の部分は本発明の第２の
特徴点を説明している。ラスター距離Ｄ１が小さなラスター距離Ｄ２に変更され
なければ、優先暗語１〜５のどれでもが入る距離Ｄ１を有するラスターは、いわ
ば、ラスターの残りの部分を埋めるだけの十分な非優先暗語がないというような
長いビットストリームを作る結果となりうる。従って、ビットストリームに挿入
されるべき多くの優先暗語だけをオーディオ信号から抜き出し、根本的に空き場
所を残さないようにし、ビットストリームが不必要に延長されることがないよう
にする。

【００３６】本発明の第２の特徴点を、図１を参照しながら詳細に説明する。ＭＰＥＧ−２
ＡＡＣ標準に基づく符号化方法の場合において、１１の異なるハフマンコード
表が符号化のために使用される。これらの表の大部分にとって、可能な限りの最
大の暗語長さは１０〜２０ビットである。しかし、特別な表、いわゆる「逃し表
」は４９ビットの最大長さを含む。もし全ての表のうちで最長暗語の長さをラス
ター距離Ｄとして使用するならば、４９ビットのラスター距離を設定することに
なる。この結果、非常に大きな幅のラスターとなり、全ての優先暗語がラスター
ポイントに配列された場合、ビットストリームはあまりにも長すぎるものとなる
ので、ほとんど全ての表にとって非効率的なものとなる。従って、本発明による
と、ラスターの幅は使用されるコード表に基づき調整される。前述したように、
スペクトル値はいくつかのスペクトル部分にグループ分けされ、各スペクトル部
分には、信号の統計的要素を考慮して最適なコード表が与えられる。ひとつのコ
ード表における最大の暗語長さは、普通、他のコード表における最大の暗語長さ
とは異なる。

【００３７】暗語１，２で表されるスペクトル値は第１のスペクトル部分に属し、暗語３〜
１０で表されるスペクトル値は第２のスペクトル部分に属すると仮定する。この
場合、ビットストリームは二つのラスターポイントグループによってラスターさ
れる。第１のラスターポイントグループはラスターポイント１０，１２，１４か
らなり、第２のラスターポイントグループはラスターポイント１４，１６，１８
からなる。さらに、スペクトル部分０はハフマンコード表ｎを与えられ、スペク
トル部分１はハフマンコード表ｍを与えられ、また、暗語２はスペクトル部分０
に与えられた表ｎのうちの最長暗語である。第１のラスターポイントグループの
ラスター距離は表ｎの最大の暗語長さ、つまりこの例での暗語２の長さよりも大
きいか、あるいは好ましくはそれと等しい。

【００３８】他方、ラスターポイント１４と暗語１０でのビットストリームの終点との間の
部分からわかるように、この例ではコード表ｍにおける最長の暗語は現れない。
従って、グループ２で示されるビットストリームのラスターには長さＤ２の暗語
はない。

【００３９】本発明の第２の特徴点によれば、ラスターの幅は使用されるコード表に基づい
て選択される。しかし、この場合、使用される表はデコーダで復号化される際に
認識されなければならない。しかし、コード表番号が各スペクトル部分のサイド
情報として常に送信されるならば、デコーダは、ある特定の異なる、この例では
１１の、ハフマン表のうちのどのコード表であるかを認識することができる。

【００４０】前述したように、ラスター距離が使用されるコード表により決定されても、４
９ビットの暗語を含む逃し表を考えるとわかるように、最適なデータ圧縮が達成
されるわけではない。この逃し表の場合、ラスター距離は最大サイズのスペクト
ル値を符号化できるように４９ビットに調節されることになるからである。逃し
表は、短いコード表を持つために、逃し表と共に短いコード表を使用して比較的
大きい値を符号化できるように、使用される。一つのコード表の値域を超える値
の場合、このスペクトル値のための暗語はある特定の値になり、このことは、コ
ーダ内で逃し表もまた使用されたということをデコーダに示すことになる。ある
コード表が値０〜２を含んでいる場合、例えば、そのコード表の３の値がデコー
ダに逃し表が使用されたことを示すことになる。「基礎」のコード表の値３を有
する暗語は同時に、その基礎コード表の最大値と共に、該当するスペクトル値を
形成する逃し表の値を与える。

【００４１】本発明のさらなる実施形態によると、一つのグループ（例えばグループ１又は
グループ２）内のラスターポイント間距離は、もはやあるコード表における最長
暗語の長さと同じではなく、あるコード表に属するビットストリームに実際に発
生する最長暗語の長さと同じである。本発明の第２の特徴点の第１実施形態にお
いては、逃し表における符号化効率は未だ最適ではないので、この実施形態では
これをさらに改良した。この表の暗語の最大長さ（スペクトル内で）は通常、技
術的符号化の理由からかなり短いものである。逃し表の最長の暗語は例えば４９
ビットである。

【００４２】通常のオーディオ信号中に実際に発生する最も長い逃し表の暗語は、典型的に
は約２０ビットの長さである。従って、ラスターポイントの数、及び一つのブロ
ック内の最長暗語の長さを送信することによりラスターポイントに配列され得る
優先暗語の数をさらに増すことができる。そしてラスターの長さは実際に発生す
る最長暗語の長さか又は現在使用されている表の論理的な最長暗語の長さのうち
のどちらか最小値である方に等しい。最小値を決定するために、各コード表の実
際に発生する暗語又は単に一つのオーディオフレームで使用される全てのコード
表の最長暗語のどちらかを使用することができる。この選択は非逃し表、つまり
「基礎」ハフマン表にも利用できるが、逃し表ほどには効率的ではない。

【００４３】あるスペクトル部分又はスペクトルブロック内の最長暗語の長さを送信するこ
とは別の有利な副作用を生み出す。デコーダは、既に発生した最大長さから、妨
害されたかもしれないより長い暗語がそのビットストリームの中に存在するかど
うかを検知することができる。長い暗語は普通、スペクトル値の高いエネルギー
を表している。非常に長い暗語が伝達エラーのために発生した場合、これは非常
に可聴な妨害となる。最大長さを送信することは、ほとんどの場合このようなエ
ラーを感知し、それに対して策を講じる手段を与えることになる。エラーに対す
る対向策とは、長すぎる暗語を単に空白にしておくか又は何かもっと複雑な隠蔽
工作であろう。

【００４４】誤差許容と同時に効率的な符号化のためにはできる限り多くのラスターポイン
トが望ましいということを銘記しておくことは重要である。しかし、ラスターポ
イントの数はビットストリームの全長によって制限される。これはもちろんラス
タリングの結果として長くされるべきではなく、なぜならば、ビットストリーム
中に使用されない場所ができてしまい、全体的なデータ圧縮の理論とは矛盾する
ことになるからである。しかし、応用によっては、ビットストリームの延長は高
い程度での誤差許容のためには受け入れられることもあるということも、また指
摘しておかねばならない。考慮すべき別の点は、ラスターはできるだけ多くの暗
語がラスターポイントから始まるように構築されることが好ましいということで
ある。よって、本発明は、先行技術に比べてラスターポイント間距離の選択に関
して有効な融通性がある。全く理想的な場合には、この融通性によって全ての暗
語がラスターポイント上に配置されるが、このためには非常に大きな技術努力が
必要である。前述のラスターポイントの配置方法、つまり各スペクトル部分での
ラスターポイント間距離を関連するコード表に基づいて決定する方法は、この最
適ケースに非常に近いものを可能とする。しかし、これは特に、全ての暗語が心
理音響的に重要なものではなく、ビットストリーム中に使用されない場所を残さ
ないために、心理音響的にさほど重要でない暗語は、ビットストリーム内に、ラ
スター配列された心理音響的に重要な暗語の間に挿入されるからである。

【００４５】本発明の第３の特徴点によれば、暗語は、ビットストリーム中に、もはや周波
数に関して高くなる順に直線状に並べられてはいず、異なるスペクトル値の暗語
が「スクランブル」されている。図１において、暗語の周波数に関わる交互的な
直線的配列がある程度見られる。斜線で示された優先暗語は周波数が高くなる順
に配列され、斜線を施されていない非優先暗語も、周波数が高くなる順にビット
ストリーム中に挿入されているからである。いわゆる「突発的」エラーが図１に
示すビットストリーム中に発生した場合、すなわち、引き続くいくつかの暗語の
崩壊につながるような妨害が発生した場合、例えば暗語６，７ａ，２，３，７ｂ
が同時に影響を受けることになる。

【００４６】これに相当する復号化されたオーディオ信号には、スペクトル的に比較的広く
故にはっきりと聞こえる妨害が、優先暗語２，３によって示されるスペクトル帯
域内に発生することになる。突発的なエラーの問題については、図１の非常に単
純な例からはあまり明らかではない。しかし、実際、５個以上のラスターポイン
トがあり、突発的エラーがしばしば複数のラスターポイントに跨って発生するこ
とが考えられ、このような場合には、比較的広い周波数帯域でのデータの損失と
なり得る。この理由から、本発明の第３の特徴点によれば、スペクトル値の優先
暗語は周波数の高くなる順に配列されないことが好ましく、周波数に関してラン
ダムなあるいはランダムに見えるような配列になるように「スクランブル」にす
る方が好ましい。非優先暗語もまた同様に取り扱ってもよい。ランダムのような
配列の場合、この分散状況はデコーダに前もってセットできるので、この分散に
ついてはサイド情報として送信する必要はない。結果として、ビットストリーム
中の連続する暗語の損失が完全な一つの周波数帯域の損失とはならず、単にいく
つかの周波数帯域での非常に小さい損失となるだけである。この妨害が聞こえる
ことはめったになく、一つの周波数帯域全体の損失よりも効果的に隠すことがで
きる。

【００４７】本発明の第４の特徴点によれば、優先暗語及び非優先暗語の周波数に関して高
くなる順の直線的な配列に代わり、例えばｎ番目ごとの暗語がラスター配列され
、残りの暗語はそれらの間に挿入されるという配列が使用可能である。前述した
ように、一つのビットストリームのためのラスターポイントの数は全長及びラス
ターポイント間距離によって限定される。例えば、低い帯域幅でのサンプリング
の場合を考えると、大多数の暗語が心理音響的に重要な暗語である。１６ｋＨｚ
のサンプリングレートが使用された場合、信号全てが論理的に使用可能な８ｋＨ
ｚの帯域幅を有しているからである。経験的には、暗語のうちの３０％だけがラ
スターポイント上に配列され、残りの７０％はラスターを完全に埋めるように配
列されなければならない。しかし、このことは、重要な周波数領域、例えばスピ
ーチ信号の場合は０〜４ｋＨｚであるが、これがラスターポイント上に配置され
た暗語によってカバーあるいは「保護」され得ないということを意味している。
従って、重要な周波数領域でのエラー伝達を適切に阻止するために、全ての優先
暗語をラスターポイント上に配置する代わりに、２番目ごと、３番目ごと、４番
目ごと等の優先暗語のみをこのように配置し、他の優先暗語は一直線に並べられ
るのではなく、ラスターを埋めるように配置される。例えば、２番目ごと、３番
目ごと等のスペクトル値が低周波領域にあることがわかり、点在する暗語が伝達
の間に崩壊する場合、例えば予測等のエラー隠蔽技術を使用してデコーダ内でこ
れらの暗語を再構築することも可能である。

【００４８】ビットストリームを復号化するための方法及び装置は前述の符号化を反映する
ように働く。

【００４９】符号化されたビットストリームが一つのコード表に異なる長さの暗語と等距離
のラスターポイント（１０，１２，１４）を持つラスターを有し、これらの暗語
は、他のスペクトル値と比べて心理音響的に重要なあるスペクトル値を表す優先
暗語を含み、優先暗語はラスターポイントによって配列されているという符号化
されたオーディオ信号で表されるビットストリームを復号化するための一般的な
方法では、（ａ）二つのラスターポイント間の距離Ｄ１が決定される。二つのラ
スターポイント間の距離がわかれば、（ｂ）ラスターポイントに配列されている
符号化されたビットストリーム中の優先暗語が、周波数に関して直線的な順で、
各優先暗語の始まりがラスターポイントと一致する配列となるように、再分類さ
れる。これにより優先暗語は図２に示す一般的な周波数に関する直線的な配列と
なり、（ｃ）復号化されたスペクトル値を得るために、関連するコード表を用い
てこれらの優先暗語を復号化することができる。（ｄ）復号化されたスペクトル
値を時間領域に戻すように変換して、復号化されたオーディオ信号が得られ、例
えばラウドスピーカに送り込めるように何らかのよく知られた方法で加工するこ
とができる。

【００５０】ビットストリームがただ一つのコード表を使用して符号化された場合、ラスタ
ーポイント間距離は、どの表が符号化のために使用されたのかをビットストリー
ムのサイド情報から見つけ出すことによって、極めて簡単に設定することができ
る。符号化によっては、この距離はこの表の最長暗語の長さであるかもしれず、
それはそのコーダに永久的にセットされ得る。その距離が、コード表が与えられ
たビットストリームの一部に実際に発生する最長暗語の長さであれば、このこと
はビットストリームに伴うサイド情報等でデコーダに発信される。

【００５１】デコーダは、優先暗語及び非優先暗語の再分類を、例えば符号化されたビット
ストリームにポインタを当てることによって行う。デコーダがラスター距離を認
識しており、優先暗語が周波数に関して直線的に配列されている場合、デコーダ
はラスターポイントに飛び越し、そこから始まる暗語を読むことができる。一つ
の暗語を読み終えると、ポインタは次のラスターポイントへ飛び、このようなプ
ロセスを繰り返す。全ての優先暗語が読まれても、ビットストリームはまだ非優
先暗語を含んでいる。ビットストリーム中の優先暗語と非優先暗語の直線的配列
が選択された場合、非優先暗語はすでに周波数に関して直線的に配列されており
、さらなる分類をすることなしに、復号化及び元の状態への変換がなされる。

【００５２】本発明の第３又は第４の特徴点に係る符号化が選択されると、スクランブル情
報がサイド情報として送られるか、またはスクランブル状態の分布が前もって固
定され、それにより最初からデコーダはこのことがわかる。同じ考慮が第４の特
徴点にも当てはまる。一定の分布を規定するか、またはデコーダにサイド情報と
して連絡された可変の分布を選択することは常に可能である。

【００５３】ここで、優先暗語を決定し操作する有利な方法を説明する。ただ一つのコード
表を使用する場合には一つのラスター距離を、あるいは多数のコード表を使用す
る場合には複数のラスター距離を設定することによって符号化されたビットスト
リームのためのラスターを決定した後、優先暗語は、それぞれがラスターポイン
トと一致するようにラスターに配置されなければならない。

【００５４】本発明の好ましい実施形態では、この配置は、暗語を一種のソート表から本来
は空のラスターに順に挿入していくことによって達成される。表の最初の暗語か
ら始められる。従って、優先暗語は表中の暗語の並びによって影響されるが、優
先暗語は常にラスターの場所にある暗語、つまり、ラスターポイントが使用可能
である暗語である。もはやラスターポイントがない表中の暗語に関しては、ビッ
トストリーム中の残りの空間にそれらを挿入していく以外に選択の余地はない。
これらの暗語は従って本発明の感覚からすると、優先暗語ではない。

【００５５】優先暗語の数は前もっては決定されない。符号化されたビットストリームのた
めのメモリが満たされるまでは、すなわち、もはや優先暗語が書き込めなくなる
までは、優先暗語が書き込まれる。このメモリの大きさは、そのスペクトルデー
タのために以前に使用されたビットの合計と同じである。つまり、それ以上のビ
ットはラスタリングによって要求されない。メモリは、このように符号化の効率
がラスター処理の結果として落ち込むのを阻止するために、暗語の数によって制
限される。もちろん、誤差を許容することができるように、全ての暗語がラスタ
ーポイント上に配置されてもよい。しかし、この場合、ラスターポイント間に空
のビットが使用されないままになるので、符号化効率の顕著な低下につながる。

【００５６】本発明の第１の特徴点は優先暗語、つまり、他のスペクトル値に比べて心理音
響的に重要なスペクトル値を表す暗語の決定に係わるものである。心理音響的に
重要なスペクトルラインとは、例えば、他のスペクトルラインよりも大きなエネ
ルギーを含んでいるスペクトルラインである。概略的に言えば、大きなエネルギ
ーを有していればいるほど、そのスペクトルラインはより重要である。従って、
高いエネルギーを有するスペクトルラインが妨害されないことと、それと同様に
、高いエネルギーを有するスペクトルラインがエラーの結果として発生すること
はないということが重要である。

【００５７】これまでは、高いエネルギーを有するスペクトルラインが主にスペクトルの低
い部分に位置しているという仮定で説明してきた。これは多くの場合事実である
が、全ての場合ではない。本発明は、一つの暗語に符号化されたスペクトルライ
ンの、または複数のスペクトルラインが一つの暗語に符号化されている場合はこ
れら複数のスペクトルラインのエネルギーを概算するための含蓄されたインディ
ケータを使用することによって、この仮説を無視するものである。

【００５８】このインディケータは、使用されるハフマンコード表のようなコードブック又
はコード表である。例えばＡＡＣ標準では、１１個の表が使用される。これらの
表の値域はかなり違っている。表１〜１１の最大絶対値は以下の通りである。

【００５９】１；１；２；２；４；４；７；７；１２；１２；８１９１．

【００６０】これらの異なる値域の結果として、最大エラーは表による。各表の表示を考え
ると、これは表の中から確認可能であるか、または表以外から送信されてくるが
、最大エラーは前記絶対値の２倍になる。本発明によれば、優先暗語の決定は使
用されるコード表に基づいてなされ、そのインディケータは最大絶対値と含蓄的
にコード表番号である。まず、そのコード表が最大の値域を有している暗語を考
える。次に、そのコード表が２番目に大きい値を有する暗語が続き、という手順
である。従って、ＡＡＣ標準の場合、表１１が最初に考慮され、表９，１０が続
き、表１，２が優先順位の最後である。ラスターポイントに配置される優先暗語
は、このように、ラスターポイントがそれのために使用され得るソート表の中に
ある暗語である。

【００６１】暗語を決定するこの方法の利点は、使用される表がサイド情報で送信され、こ
の情報からデコーダは送信中に使用される暗語の並びを決めることができるので
、他の付加的な情報をデコーダに送信する必要はない。

【００６２】本発明の第２の特徴点は、オーディオ信号を表すスペクトル値を得るためにそ
の周波数領域内でのオーディオ信号の離散時間型サンプルを変換するために、長
いウィンドウに対向するものとして、短い（サンプリング）ウィンドウを使用す
ることに関する。短いウィンドウはＡＡＣ標準及び標準層３で定義される。短い
ウィンドウの場合、一つの長いＭＤＣＴの代わりに多数の短いＭＤＣＴが使用さ
れる。

【００６３】ＡＡＣ標準では、それぞれが１２８の出力値を有する８個のＭＤＣＴからなる
グループが、例えば１０２４の出力値を有する一つのＭＤＣＴの代わりに使用さ
れる。これはコーダの周波数分解能を犠牲にして時間的分解能を高めることにな
る。一般的に短いウィンドウは一時的な信号に使用される。例えば短いウィンド
ウがＡＡＣと共に使用される場合、８つの連続した完全なスペクトル、すなわち
それぞれのセットが全スペクトルを含む８セットのスペクトル値が得られるが、
スペクトル値間の距離もまた８倍の大きさである。これは周波数分解能の低下を
表し、そしてこれは時間的分解能の高まりを伴う。

【００６４】ＡＡＣ標準ではグループ分けが行われる。すなわち、８つのスペクトルからグ
ループが形成される。これらのグループのために１セットの倍率がある。最も単
純な場合、各グループが一つのウィンドウを含んでいる。この場合、８セットの
倍率が送信されなければならない。より強い圧縮を達成するためには、一般的に
心理音響的な必要条件を考慮して、複数のウィンドウがＡＡＣ標準の一つのグル
ープに集められる。これは送信されるべき倍率の数を減少させ、より良いデータ
圧縮となる。スペクトルデータはグループ毎に順に符号化されたビットストリー
ムに記載されて送信される。グループ内では倍率帯域の交互配置が行われる。

【００６５】このことは下記の例によって示される。ここでは三つのグループに分けられる
。第１グループは二つのウィンドウを含み、第２グループは三つのウィンドウを
含み、第３グループも三つのウィンドウを含んでいる。各スペクトルは１２の倍
率帯域を有する。グループ分けは下記の通りである。

【００６６】第１グループ、第１ウィンドウ、第１倍率帯域第１グループ、第２ウィンドウ、第１倍率帯域第１グループ、第１ウィンドウ、第２倍率帯域第１グループ、第２ウィンドウ、第２倍率帯域．．．第１グループ、第２ウィンドウ、第１２倍率帯域第２グループ、第３ウィンドウ、第１倍率帯域第２グループ、第４ウィンドウ、第１倍率帯域第２グループ、第５ウィンドウ、第１倍率帯域第２グループ、第３ウィンドウ、第２倍率帯域．．．

【００６７】この配列は、プレソーティング（予備分類）、あるいはソート表から暗語をラ
スターに挿入するのには適さない。なぜならば、連続的な挿入がなされる場合、
第１グループの全スペクトルは保護されるが最後のグループのスペクトルは保護
されないからである。この理由で、本発明の第２の特徴点に係るプレソーティン
グは、短いウィンドウのために行われる。ＡＡＣ標準の場合、グループ分けと倍
率帯域によるアプローチは放棄される。新しいプレソーティングは、今度はスペ
クトルラインのユニットという形で行われる。

【００６８】本発明の好ましい実施形態において、各ユニットは四つのスペクトルラインを
含む。ＡＡＣ標準では従って各ウィンドウは、１２８のスペクトルラインに相当
する３２のユニットを含む。スペクトルデータは下記の通りである。

【００６９】第１ウィンドウ、第１ユニット第２ウィンドウ、第１ユニット．．．第８ウィンドウ、第１ユニット第１ウィンドウ、第２ユニット第２ウィンドウ、第２ユニット．．．第８ウィンドウ、第２ユニット第１ウィンドウ、第３ユニット．．．

【００７０】このプレソーティングは全てのウィンドウの個々のスペクトル領域は互いに近
くに位置する、つまり、低いスペクトル値は、周波数に基づき、より高い周波数
を有するスペクトル値の前に、個々のセットのスペクトル値から短い表の前部分
に書き込まれる。低いスペクトル領域のスペクトル値は心理音響的に特に重要で
あり、ソート表の前述のプレソーティングは、スペクトル値をソート表からラス
ターに挿入するための基礎を与える。この暗語のプレソーティング、つまり、優
先暗語を決定することにより、いかなる付加的情報をも送る必要はない。なぜな
らば、デコーダはサイド情報からこのブロック又はフレームでは短いウィンドウ
が使用されたことを認識し、ユニットを生成するためのコーダの分類アルゴリズ
ムが常に一定とされ、故にそれがデコーダに永久的にプログラムされるからであ
る。

【００７１】暗語をソート表にプレソーティングすることは優先暗語を決定することに相当
することを銘記しておくことは重要である。なぜなら、ラスターポイントに位置
する暗語、つまり、優先暗語がソート表の最初、つまり前又は上の部分にある可
能性が高いので、この表はそれ自体、高い可能性で、どの暗語がラスターポイン
トに書かれ得るのかを決定するからである。

【００７２】この好ましい実施形態以外では、このプレソーティングはソート表によっては
行われず、個々の暗語を指し、指し示された暗語がビットストリーム中に書き入
れられる順番を決定することで行われる。

【００７３】ＡＡＣ標準から、いくつかのコード表は２次元又は４次元的であること、すな
わち、一つの暗語が２個又は４個のスペクトル値を符号化することが知られてい
る。従って、四つのスペクトルライン又はその倍数を一つのユニットにグループ
化することが有利である。このようにすれば同じ周波数領域を符号化する暗語が
直接互いに連続するように分類されるからである。一つのユニットのスペクトル
ラインの数はそのコード表の異なる次元によって割り切れることが好ましい。す
なわち、ユニットごとのラインの数は暗語ごとのラインの数の公倍数であり、最
小公倍数ならば最適である。

【００７４】本発明は第１、第２の特徴点が組み合わされたとき、特に効果的である。本発
明に係るユニットへの再分類が短いウィンドウのために行われ、次にコード表の
インディケータを用いて優先暗語の決定が行われ、その際、高い程度のエラー防
止を達成するために高いコード表からの暗語が一定のラスターポイント上に配置
されることを確実にするために、ユニットへの再分類の結果が再び再分類される
。この組み合わせは必ずしも必要ではないが、最良の結果を導くものである。

【図面の簡単な説明】

【図１】暗語を含む符号化されたビットストリームの、本発明の第２の特徴点に係るラ
スタリングの一例を示す。

【図２】従来技術による、周波数に関して直線的に高くなる順番による暗語の配列を示
す。

【手続補正書】

【提出日】平成１３年７月１７日（２００１．７．１７）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００１２

【補正方法】変更

【補正の内容】

【００１２】この周知の方法の効率を決定づけるパラメータは、そのラスターが実際どのよ
うに定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスタ
ーポイント間のラスター距離等である。しかし、ヨーロッパ特許第０６１２１５
６号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般
的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するた
めにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明
もない。ＥＰ−Ａ−０７１７５０３は、音楽信号の離散時間型サンプルを周波数領域に変換し、得られたスペクトル値を量子化及びエントロピー符号化するデジタル符号化及び復号化の方法を開示している。このエントロピー符号化は、長さの異なるある特定の数の暗語を生み出し、これらの暗語のいくつかはラスター配列され、他のものはラスターの残りの空間に挿入されている。ＥＰ−Ａ−０４９２５３７は、情報が小さなピクセル群に分けられ、各ピクセル群は直交変換手段によって直交する成分に変換される、ビデオ及びオーディオ情報の記録装置に関する。そして、直交する成分は、長さの異なる暗語を有するコードを用いて符号化される。符号化された暗語のいくつかは第１メモリに書き込まれる。もし暗語が、第１メモリに書込み可能なものよりも多くのビットを有している場合、その暗語の残りのビットは別のメモリに書き込まれる。

───────────────────────────────────────────────────── フロントページの続き (72)発明者エーレト、アンドレアスドイツ国、Ｄ−91058 エルランゲン、ゲルハルト−ハオプトマン−ストラーセ１ (72)発明者ブランデンブルク、カールハインツドイツ国、Ｄ−91054 エルランゲン、ハーグストラーセ 32 (72)発明者ゲルハオイサー、ハインツドイツ国、Ｄ−91344 バイシェンフェルト、サオゲンドルフ 17 (72)発明者ノブバクート−イラニ、アリドイツ国、Ｄ−91052 エルランゲン、ヴィヒェルンストラーセ 18 (72)発明者ラオバー、ピエレドイツ国、Ｄ−90419 ニュルンベルク、リルケストラーセ 30 (72)発明者ビット、ローラントドイツ国、Ｄ−90453 ニュルンベルク、アルフォンス−スタオダー−ストラーセ 77 Ｆターム(参考） 5D045 DA20 5J064 AA01 BA09 BA16 BC01 BC16 BD01

Claims

【特許請求の範囲】

【請求項１】符号化されたビットストリームを得るためにオーディオ信号を
符号化する方法であり、以下のステップを含む、（ａ）オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換する、（ｂ）暗語で符号化されたスペクトル値を得るために、異なる長さを有する限
られた数の暗語を含むコード表を用いてスペクトル値を符号化する、各スペクト
ル値に与えられる各暗語の長さは、概して、スペクトル値が発生する可能性が高
ければ高いほど短いものである、（ｃ）符号化されたビットストリームのためにラスターを決定する、このラス
ターにおいては、等距離のラスターポイント（１０，１２，１４）があり、ラス
ターポイント間の距離（Ｄ１）はそのコード表によるものである、（ｄ）他のスペクトル値に比べて心理音響的に重要な特別なスペクトル値を表
す優先暗語を、各優先暗語の始まりがラスターポイントと一致するように、ラス
ターに配置する。
【請求項２】請求項１記載の方法であり、複数のウィンドウが使用され、これにより、複数セットのスペクトル値が得ら
れ、各スペクトル値セットは全スペクトルを含み、下記のステップが前記ステップ（ｄ）の前に実行される、それぞれのセットからの同じ周波数のスペクトル値を符号化する暗語を優先暗
語として定義する。
【請求項３】請求項１又は請求項２記載の方法であり、コード表の暗語が複
数のスペクトルラインを符号化し、これらのスペクトルラインはグループ又はユ
ニットにまとめられ、その際、一つのグループ中のスペクトルラインの数は一つ
の暗語が符号化するスペクトルラインの数によって割り切れるようになされる。
【請求項４】請求項３記載の方法であり、異なる次元を有する多種のコード
表、つまり、暗語ごとのスペクトルラインが異なるコード表が使用され、一つの
ユニットはｎ個のスペクトルライン（ｎは発生する全ての次元の公倍数である）
を有している。
【請求項５】請求項１、請求項２又は請求項３記載の方法であり、低周波に
与えられるスペクトル値セットのスペクトルラインを符号化する暗語が優先暗語
として定義される。
【請求項６】請求項５記載の方法であり、優先暗語を定義するステップは以
下のステップを含んでいる、暗語を、優先暗語がソート表の前の部分の暗語になるように、従って表のそれ
より後に位置する暗語よりもラスターポイント上に位置され易くなるように、ソ
ート表に順に置き、ソート表の暗語の順番が暗語の中での優先分布を設定し、こ
れにより優先暗語を作成する、ラスターポイントが無くなるまで、暗語をこのソート表からラスターポイント
上へ順に配置していく、残りの暗語を、ソート表から未だ空いているラスターの場所に配置する。
【請求項７】請求項１、請求項２、請求項３、請求項４、請求項５又は請求
項６記載の方法であり、優先暗語は低周波及び／又は高いエネルギーを有するス
ペクトル値を符号化する暗語である。
【請求項８】請求項１、請求項２、請求項３、請求項４、請求項５、請求項
６又は請求項７記載の方法であり、ラスターポイント間距離は、コード表の最長
暗語の長さよりも小さいか、それに等しいか、又はそれよりも大きい、あるいは
、ビットストリーム中に実際に現れる最長の暗語の長さと等しいか又はそれより
も大きいものである。
【請求項９】符号化されたビットストリームを得るためにオーディオ信号を
符号化する方法であり、以下のステップを含む、（ａ）オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換する、（ｂ）そのスペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少
なくとも一つのスペクトル値を有するように、グループ分けする、（ｃ）予め決められた数のコード表から、少なくとも二つのコード表を二つの
異なるスペクトル部分に与え、この際、そのスペクトル部分のスペクトル値の符
号化に最も適するコード表を与える、（ｄ）スペクトル部分のスペクトル値を、そのスペクトル部分に与えられたコ
ード表を用いて符号化し、各スペクトル値に与えられる暗語の長さは、概して、
スペクトル値が発生する可能性が高ければ高いほど短いものである。（ｅ）符号化されたビットストリームのためのラスターを、そのラスターが少
なくとも二つのラスターポイントグループ（１０，１２，１４と１４，１６，１
８）を有し、各グループのラスターポイントは互いに等距離に位置し、各グルー
プのラスターポイント間距離（Ｄ１又はＤ２）は、前記少なくとも二つの異なる
コード表のうちの適当なコード表に基づくように、規定する、（ｆ）他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す優先
暗語をラスター内に、各コード表の各優先暗語の始まりがそれに相当するラスタ
ーポイントグループのラスターポイント（１０，１２，１４又は１４，１６，１
８）と一致するように、配置する。
【請求項１０】請求項９記載の方法であり、前記ステップ（ｆ）の前に以下
のステップを含む、インディケータが優先権を示すとき、暗語を優先暗語として定義する、該イン
ディケータはその暗語が引き出されるコード表に基づくものである。
【請求項１１】請求項１０記載の方法であり、前記インディケータは、それ
が基づくコード表が全てのコード表のうちの最も高い絶対値を有している場合、
最高の優先権を示す。
【請求項１２】請求項９、請求項１０又は請求項１１記載の方法であり、複
数のコード表が使用され、各表にインディケータが存在し、そのインディケータ
はそれぞれの表の最も高い絶対値より決定され、より大きな最大絶対値を有する
表のインディケータは、より小さい最大絶対値を有する表のインディケータがす
るよりも、その表からの暗語に対してより高い優先権を示す。
【請求項１３】請求項９、請求項１０、請求項１１又は請求項１２記載の方
法であり、各ラスターポイントグループのラスターポイント間距離（Ｄ１，Ｄ２
）は、相当するコード表の最長暗語の長さよりも、小さいか、それに等しいか又
はそれよりも大きい。
【請求項１４】請求項９、請求項１０、請求項１１又は請求項１２記載の方
法であり、各ラスターポイントグループのラスターポイント間距離（Ｄ１，Ｄ２
）は、相当するスペクトル部分のスペクトル値のための実際の最長暗語の長さに
等しく、スペクトル部分の実際の最長暗語の長さはビットストリームにサイド情報とし
て送信される。
【請求項１５】請求項９、請求項１０、請求項１１又は請求項１２記載の方
法であり、各ラスターポイントグループのラスターポイント間距離は、グループ
分けされた全てのスペクトル部分の実際の最長暗語とこのグループのコード表の
最長暗語のうちの最小値に等しく、実際の最長暗語はデコーダにサイド情報とし
て送信される。
【請求項１６】請求項１、請求項２、請求項３、請求項４、請求項５、請求
項６、請求項７、請求項８、請求項９、請求項１０、請求項１１、請求項１２、
請求項１３、請求項１４又は請求項１５記載の方法であり、優先暗語及び非優先
暗語の両方に関して、暗語の周波数に関して実質的に直線的な配列を保持して、
ビットストリームのラスターへ配列する。
【請求項１７】請求項１、請求項２、請求項３、請求項４、請求項５、請求
項６、請求項７、請求項８、請求項９、請求項１０、請求項１１、請求項１２、
請求項１３、請求項１４又は請求項１５記載の方法であり、符号化されたスペク
トル値を表す暗語は、相当するスペクトル値の周波数とは関係なく、ビットスト
リームのラスターに配列される。
【請求項１８】請求項１７記載の方法であり、周波数とは無関係の分布が予
め決定されていない場合、周波数と暗語の間の相応関係に関する情報がサイド情
報としてビットストリーム中に挿入される。
【請求項１９】請求項１、請求項２、請求項３、請求項４、請求項５、請求
項６、請求項７、請求項８、請求項９、請求項１０、請求項１１、請求項１２、
請求項１３、請求項１４又は請求項１５、請求項１６、請求項１７又は請求項１
８記載の方法であり、優先暗語のうちのｎ番目ごとの暗語だけがビットストリー
ムのラスターに配列され、残りの優先暗語及び非優先暗語はラスターポイントに
配置されない。
【請求項２０】請求項１、請求項２、請求項３、請求項４、請求項５、請求
項６、請求項７、請求項８、請求項９、請求項１０、請求項１１、請求項１２、
請求項１３、請求項１４又は請求項１５、請求項１６、請求項１７、請求項１８
又は請求項１９記載の方法であり、スペクトル値は、符号化に先立ち、心理音響
モデルを考慮して量子化される。
【請求項２１】符号化されたビットストリームを得るためにオーディオ信号
を符号化するための装置、以下のものを含む、（ａ）オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換するユニット、（ｂ）暗語で符号化されたスペクトル値を得るために、異なる長さを有する限
られた数の暗語を含むコード表を用いてスペクトル値を符号化するユニット、各
スペクトル値に与えられる各暗語の長さは、概して、スペクトル値が発生する可
能性が高ければ高いほど短いものである、（ｃ）符号化されたビットストリームのためにラスターを決定するユニット、
このラスターにおいては、等距離のラスターポイント（１０，１２，１４）があ
り、ラスターポイント間の距離（Ｄ１）はそのコード表によるものである、（ｄ）他のスペクトル値に比べて心理音響的に重要な特別なスペクトル値を表
す優先暗語を、各優先暗語の始まりがラスターポイントと一致するように、ラス
ターに配置するユニット。
【請求項２２】符号化されたビットストリームを得るためにオーディオ信号
を符号化するための装置、以下のものを含む、（ａ）オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換するユニット、（ｂ）そのスペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少
なくとも一つのスペクトル値を有するように、グループ分けするユニット、（ｃ）予め決められた数のコード表から、少なくとも二つのコード表を二つの
異なるスペクトル部分に与えるユニット、そのスペクトル部分のスペクトル値の
符号化に最も適するコード表を与える、（ｄ）スペクトル部分のスペクトル値を、そのスペクトル部分に与えられたコ
ード表を用いて符号化するユニット、各スペクトル値に与えられる暗語の長さは
、概して、スペクトル値が発生する可能性が高ければ高いほど短いものである、（ｅ）符号化されたビットストリームのためのラスターを、そのラスターが少
なくとも二つのラスターポイントグループ（１０，１２，１４と１４，１６，１
８）を有し、各グループのラスターポイントは互いに等距離に位置し、各グルー
プのラスターポイント間距離（Ｄ１又はＤ２）は、前記少なくとも二つの異なる
コード表のうちの適当なコード表に基づくように、規定するユニット、（ｆ）他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す優先
暗語をラスター内に、各コード表の各優先暗語の始まりがそれに相当するラスタ
ーポイントグループのラスターポイント（１０，１２，１４又は１４，１６，１
８）と一致するように、配置するユニット。
【請求項２３】符号化されたオーディオ信号を表すビットストリームを復号
化する方法であり、この符号化されたビットストリームは一のコード表から引き
出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント（１０
，１２，１４）を持つラスターを有しており、暗語は、他の暗語に比べて心理音
響的に重要な特別なスペクトル値を表す優先暗語を含み、優先暗語はラスターポ
イントによって配列されている、該方法は以下のステップを含む、（ａ）二つの隣り合うラスターポイントの距離（Ｄ１）を検知する、（ｂ）ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類する、（ｃ）復号化されたスペクトル値を得るために、関連するコード表を用いて優
先暗語を復号化する、（ｄ）復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換する。
【請求項２４】符号化されたオーディオ信号を表すビットストリームを復号
化する方法であり、この符号化されたビットストリームは少なくとも二つのコー
ド表から引き出された互いに長さの異なる暗語を含み、少なくとも二つの、等距
離で並ぶラスターポイントのグループ（１０，１２，１４と１４，１６，１８）
を持つラスターを有し、暗語は、他の暗語に比べて心理音響的に重要な特別なス
ペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列さ
れている、該方法は以下のステップを含む、（ａ）二つの隣り合うラスターポイントの距離（Ｄ１，Ｄ２）を検知する、（ｂ）ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類する、（ｃ）一のスペクトル部分に関連するコード表を認識する、（ｄ）復号化されたオーディオ信号を得るために、一のスペクトル部分の優先
暗語をそれに関連するコード表を用いて復号化する、（ｅ）復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換する。
【請求項２５】符号化されたオーディオ信号を表すビットストリームを復号
化する装置であり、この符号化されたビットストリームは一のコード表から引き
出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント（１０
，１２，１４）を持つラスターを有しており、暗語は、他の暗語に比べて心理音
響的に重要な特別なスペクトル値を表す優先暗語を含み、優先暗語はラスターポ
イントによって配列されている、該装置は以下のものを含む、（ａ）二つの隣り合うラスターポイントの距離（Ｄ１）を検知するユニット、（ｂ）ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類するユニット、（ｃ）復号化されたスペクトル値を得るために、関連するコード表を用いて優
先暗語を復号化するユニット、（ｄ）復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換するユニット。
【請求項２６】符号化されたオーディオ信号を表すビットストリームを復号
化する装置であり、この符号化されたビットストリームは少なくとも二つのコー
ド表から引き出された互いに長さの異なる暗語を含み、少なくとも二つの、等距
離で並ぶラスターポイントのグループ（１０，１２，１４と１４，１６，１８）
を持つラスターを有し、暗語は、他の暗語に比べて心理音響的に重要な特別なス
ペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列さ
れている、該装置は以下のものを含む、（ａ）二つの隣り合うラスターポイントの距離（Ｄ１，Ｄ２）を検知するユニ
ット、（ｂ）ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類するユニット、（ｃ）一のスペクトル部分に関連するコード表を認識するユニット、（ｄ）復号化されたオーディオ信号を得るために、一のスペクトル部分の優先
暗語をそれに関連するコード表を用いて復号化するユニット、（ｅ）復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換するユニット。