JP3366903B2

JP3366903B2 - オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置

Info

Publication number: JP3366903B2
Application number: JP2000518448A
Authority: JP
Inventors: ベルンハルトグリル; ユルゲンヘルレ; ボドタイヒマン; カールハインツブランデンブルク; ハインツゲルホイザー
Original assignee: フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ
Priority date: 1997-10-24
Filing date: 1998-07-07
Publication date: 2003-01-14
Anticipated expiration: 2018-07-07
Also published as: EP1025646B1; EP1025646A2; WO1999022451A2; AU726762B2; ATE206252T1; KR20010015588A; CA2301663C; DE59801589D1; KR100331166B1; DE19747132A1; CA2301663A1; WO1999022451A3; DE19747132C2; US6502069B1; AU8857798A; JP2001522156A

Description

【発明の詳細な説明】

本願発明は、スケーラブルオーディオコーダ及びオー
ディオデコーダに関し、特に、少なくとも１段階が周波
数ドメインにおいて作動するスケーラブルコーダ及びデ
コーダに関する。スケーラブルオーディオコーダは、モデュール構成の
コーダである。よって、たとえば８ｋＨｚでサンプリン
グされた信号を処理し、たとえば毎秒４．８から８キロ
ビットのデータレートを生成する既存のスピーチコーダ
を使用しようという努力がなされる。たとえば当業者に
知られているＧ．７２９、Ｇ．７２３、ＦＳ１０１６、
ＣＥＬＰまたはＭＰＥＧ−４−Ａｕｄｉｏ用のパラメト
リックモデル等のこれら公知のコーダは、通常８ｋＨｚ
でサンプリングされた信号用に設計されており、最高４
ｋＨｚの可聴バンド幅しかコード化できないため、主に
話声信号をコード化するのに役立つのであり、一般によ
り高い音質の音楽信号のコード化には適していない。し
かしながら、一般にそれらは低いサンプリングレート
で、話声信号について良好な音質を示す。スケーラブルコーダでの音楽信号のオーディオコーデ
ィングについて、たとえばＨＩＦＩ品質またはＣＤ品質
を達成するために、スピーチコーダと、たとえば４８ｋ
Ｈｚのより高いサンプリングレートで信号をコード化す
ることが可能なオーディオコーダが組み合わせられる。
もちろん上記のスピーチコーダを、たとえばＭＰＥＧ
１、ＭＰＥＧ２またはＭＰＥＧ４の標準に従うミュージ
ック／オーディオコーダといった別のコーダに置き換え
ることも可能である。この種のチェーン回路は、スピーチコーダ及びより高
品質のオーディオコーダを含む。たとえばサンプリング
レート４８ｋＨｚの入力信号は、ダウンサンプリングフ
ィルタでスピーチコーダに適当なサンプリング周波数に
変換される。しかし、サンプリングレートは、また、両
方のコーダにおいて同じでもあり得る。変換された信号
は、その後コード化される。コード化された信号は、送
信のためにビットストリームフォーマッティングデバイ
スに直接与えられることが可能である。しかし、それは
たとえば最大でも４ｋＨｚのバンド幅の信号しか含まな
い。コード化された信号も再びデコード化され、アップ
サンプリングフィルタで変換される。しかし、ダウンサ
ンプリングフィルタのために、こうして得られた信号
は、たとえば４ｋＨｚのバンド幅の有用な情報しか含ん
でいない。加えて、４ｋＨｚより低いバンドにおける変
換されコード化／デコード化された信号のスペクトル内
容は、一般的なコーダがコーディングエラーを持ちこむ
ため、４８ｋＨｚでサンプリングされた入力信号の最初
の４ｋＨｚバンドに正確に対応していないことを記して
おかなければならない。既に述べたように、スケーラブルコーダは、周知のス
ピーチコーダと、より高いサンプリングレートで信号を
処理することが可能なオーディオコーダとを含む。４ｋ
Ｈｚより高い周波数の入力信号の信号成分を送信できる
ように、８ｋＨｚにおける入力信号とコード化／デコー
ド化され変換されたスピーチコーダの出力信号との差
が、各々個々の離散時間サンプリング値について形成さ
れる。この差は、その後、当業者に公知の方法で、公知
のオーディオコーダを用いて量子化及びコード化される
ことが可能である。ここで、コーディングエラーとは別
に、より高いサンプリングレートで信号をコード化する
ことが可能なオーディオコーダに与えられる差分信号
は、より低い周波数帯域では基本的にゼロである。上方
に変換されコード化／デコード化されたスピーチコーダ
の出力信号のバンド幅より上に位置するスペクトル域に
おいて、差分信号は、実質的に４８ｋＨｚでの真の入力
信号に対応する。第１の段階すなわちスピーチコーダの段階において、
一般にコード化された信号の非常に低いビットレートが
対象とされているので、低いサンプリング周波数のコー
ダが一般的に使用される。前述のコーダを含む多数のコ
ーダは、現在、数キロビット（２から８キロビットまた
はそれ以上）のビットレートで作動する。更に、この低
いビットレートではいずれにしろ不可能であるととも
に、計算の労力に関しては低いサンプリング周波数での
コード化がより有益であるため、これらは８ｋＨｚの最
大サンプリング周波数を可能にする。最大可能可聴バン
ド幅は４ｋＨｚであり、実際上約３．５ｋＨｚに制限さ
れている。バンド幅の改良が、更なる段階すなわちオー
ディオコーダの段階において達成されるのであれば、こ
の更なる段階は、より高いサンプリング周波数で作動し
なければならない。データ量を更に減ずるための高品質オーディオコーデ
ィングにおけるいわゆるＴＮＳ技術の使用が、先般来公
知になりつつある（Ｊ．Ｈｅｒｒｅ，Ｊ．Ｄ．Ｊｏｈｎ
ｓｔｏｎ，“ＥｎｈａｎｃｉｎｇｔｈｅＰｅｒｆｏ
ｒｍａｎｃｅｏｆＰｅｒｃｅｐｔｕａｌＡｕｄｉ
ｏＣｏｄｅｒｓｂｙＵｓｉｎｇＴｅｍｐｏｒａ
ｌＮｏｉｓｅＳｈａｐｉｎｇ（ＴＮＳ）”，１０
１ｓｔＡＥＳＣｏｎｖｅｎｔｉｏｎ，ＬｏｓＡｎ
ｇｅｌｅｓ１９９６，Ｐｒｅｐｒｉｎｔ４３８
４）。ＴＮＳ技術（ＴＮＳ＝テンポラルノイズシェイピ
ング）は、一般に、スペクトル値の予測コーディングに
よって、量子化ノイズの微細構造のテンポラルシェイピ
ングを可能にする。ＴＮＳ技術は、時間ドメインと周波
数ドメイン間の二重性の一貫した適用に基づく。技術分
野においては、時間信号の自己相関関数が周波数ドメイ
ンに変換される際、まさにこの時間信号のスペクトルパ
ワー密度を与えることが知られている。これに関する二
重の事態が、信号のスペクトルの自己相関関数が形成さ
れ時間ドメインに変換される際に生じる。時間ドメイン
に変換または戻された自己相関関数は、また時間信号の
ヒルベルト包絡線のスクエアとも呼ばれる。よって、信
号のヒルベルト包絡線は、そのスペクトルの自己相関関
数と直接連結される。従って、信号のスクエアリングさ
れたヒルベルト包絡線及びそのスペクトルパワー密度
は、時間ドメインと周波数ドメインにおける二重の側面
を表す。信号のヒルベルト包絡線がある周波数の範囲に
関して各々部分的なバンドパス信号について一定のまま
であれば、隣接するスペクトル値との自己相関もまた一
定である。実は、これは一連のスペクトル係数が周波数
に対して定常であることを意味しており、そのため、予
測コーディング技術がこの信号を表すのに有効に使用さ
れ得るのであり、これは、更に言えば、予測係数の共通
のセットを用いることによる。状況を明確にするために、図６Ａ及び図６Ｂを参照す
る。図６Ａは、持続時間が約４０ｍｓの時間的に強く過
渡的な「カスタネット」信号の短区分を示す。この信号
は多重の部分的バンドパス信号に分解され、各部分的バ
ンドパス信号は、５００Ｈｚのバンド幅を有する。図６
Ｂは、中間周波数が１５００Ｈｚから４０００Ｈｚに渡
るこれらのバンドパス信号のヒルベルト包絡線を示す。
より事態を明らかにするために、全ての包絡線はそれら
の最大振幅に正規化されている。明らかに、全ての単一
の包絡線の形状は互いに非常に類似しており、それがこ
の周波数帯域内で信号を有効にコード化するために一般
的な予測器が使用できる理由である。人間の音声発生メ
カニズムの性質のために、全周波数帯域に渡って声門エ
キサイテーションパルスの効果が存在しているスピーチ
信号についても同様の考察がなされる。よって、図６Ｂは、たとえば周波数２０００Ｈｚでの
隣接する値の相関関係が、たとえば周波数３０００Ｈｚ
または１０００Ｈｚでのそれと類似していることを示
す。その代わりに、過渡信号のスペクトル予測性の性質
は、図５の表を検討することにより理解され得る。表の
上左で、連続的な時間信号ｕ（ｔ）が正弦波の形で示さ
れる。この隣はこの信号のスペクトルＵ（ｆ）であり、
単一のディラックパルスからなる。この信号の最適コー
ディングは、スペクトルデータまたはスペクトル値のコ
ーディングに存する。なぜなら、完全な時間信号につい
て、時間信号を完全に再構成できるように、ここではフ
ーリエ係数の振幅及び位相のみが送信されなければなら
ないからである。スペクトルデータのコーディングは、
同時に、時間ドメインにおける予測に対応する。よっ
て、ここでは時間ドメインにおいて予測コーディングが
起こらなければならないであろう。したがって、正弦の
時間信号は、平坦な時間包絡線を有し、それは周波数ド
メインにおける最も平坦でない包絡線に相当する。次に、時間信号ｕ（ｔ）が時間ドメインにおいてディ
ラックパルスの形で最大に過渡的な信号であるという反
対の場合を検討する。時間ドメインにおけるディラック
パルスは「平坦な」パワースペクトルに相当し、一方、
位相スペクトルはパルスのタイムポジションに従って回
転する。この信号がたとえば変換コーディングまたはス
ペクトルデータのコーディングまたは時間ドメインデー
タの直線予測コーディング等の上述の従来の方法に対し
て問題を呈していることは明らかである。この信号は、
時間ドメインにおいて最良かつ最も効率的にコード化さ
れ得る。なぜなら、ディラックパルスの時間的位置及び
パワーのみが送信されなければならないからであり、そ
れは二重性の一貫した使用を通じて、周波数ドメインに
おける予測コーディングもまた効率的なコーディングに
適する方法を構成することを意味する。周波数に関するスペクトル係数の予測コーディング
を、既に実施され上で引用した記事においても記述され
た、１つのブロックから次のブロックへのスペクトル係
数の予測の公知の二重性コンセプトと混同しないことは
非常に重要である（Ｍ．Ｂｏｓｉ，Ｋ．Ｂｒａｎｄｅｎ
ｂｕｒｇ，Ｓ．Ｑｕａｋｅｎｂｕｓｃｈ，Ｌ．Ｆｉｅｄ
ｌｅｒ，Ｋ．Ａｋａｇｉｒｉ，Ｈ．Ｆｕｃｈｓ，Ｍ．Ｄ
ｉｅｔｚ，Ｊ．Ｈｅｒｒｅ，Ｇ．Ｄａｖｉｄｓｏｎ，Ｙ
ｏｓｈｉａｋｉＯｉｋａｗａ：“ＩＳＯ／ＩＥＣＭ
ＰＥＧ−２ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉ
ｎｇ，”１０１ｓｔＡＥＳＣｏｎｖｅｎｔｉｏｎ，
ＬｏｓＡｎｇｅｌｅｓ１９９６，Ｐｒｅｐｒｉｎｔ
４３８２）。時間に関する予測に相当する１つのブロ
ックから次のブロックへのスペクトル係数の予測におい
て、スペクトル分解能が増大し、一方周波数に関するス
ペクトル係数の予測は時間分解能を増大させる。従っ
て、たとえば１０００Ｈｚでのスペクトル係数は、同じ
ブロックまたはフレームにおけるたとえば９００Ｈｚで
のスペクトル係数から決定され得る。そのため、上記の考察は、過渡信号の効率的なコーデ
ィング方法の達成へとつながった。時間と周波数ドメイ
ンの二重性を考慮して、予測コーディング技術は、ある
スペクトル係数から次のブロックにおける同じ周波数の
スペクトル係数への既に公知の予測と実質的に同様に扱
われることが可能である。ある信号のスペクトルパワー
密度及びスクエアリングされたヒルベルト包絡線は、互
いに二重であるため、従来の予測方法におけるようなス
ペクトル計測の平坦さではなく信号のスクエアリングさ
れた包絡線の計測の平坦さにより、残余信号エネルギー
の減少または予測利得が得られる。潜在コーディング利
得は、信号が過渡的になるほど増加する。後方予測としても知られる閉ループの予測理論及び前
方予測としても知られる開ループの予測理論の両方が、
可能な予測理論として挙げられる。閉ループのスペクト
ル予測理論（後方予測）の場合、エラーの包絡線は平坦
である。別の表現をすれば、エラー信号のエネルギー
は、時間に関して均等に配分される。しかし、前方予測の場合、図７に示されるように、量
子化によって持ちこまれたノイズのテンポラルシェイピ
ングがある。予測されるスペクトル係数ｘ（ｆ）が、加
算ポイント６００に与えられる。同じスペクトル係数が
予測器６１０にも与えられ、その出力信号がまた負の記
号付きで加算ポイント６００に与えられる。よって、量
子化器６２０への入力信号は、スペクトル値ｘ（ｆ）と
予測によって計算されたスペクトル値ｘ_p （ｆ）との差
を表す。前方予測にとって、デコード化されたスペクト
ル係数データにおける合計エラーエネルギーは一定のま
まである。しかし、スペクトル係数に予測が加えられる
ことによって、量子化ノイズが時間的に実際の信号の下
に置かれてマスキングされ得るために、量子化エラー信
号の時間軸上の形状は、デコーダの出力ではテンポラル
シェイピングされているように見える。このようにし
て、たとえば過渡信号またはスピーチ信号の時間マスキ
ングの問題が避けられる。よって、この種のスペクトル値の予測コーディング
は、ＴＮＳすなわちテンポラルノイズシェイピング技術
と呼ばれる。この技術を明確にする目的で、図８Ａを参
照する。図８Ａの上左では、強く過渡的な時間信号の時
間軸上の行動が示される。図８Ａの上右でこの時間軸上
の行動曲線の反対側に示されているのは、ＤＣＴスペク
トルの区分である。図８Ａの下左のグラフは、ＬＰＣ
（ＬＰＣ＝直線予測コーディング）オペレーションによ
り計算されたＴＮＳ合成フィルタの結果として生ずる周
波数応答を示す。この図における（正規化された）周波
数座標は、時間ドメインと周波数ドメインの二重性のた
めに、時間座標に対応する。ＬＰＣ計算は、明らかに入
力信号の「ソースモデル」を生成する。なぜなら、ＬＰ
Ｃ計算された合成フィルタの周波数応答は、強く過渡的
な時間信号の包絡線に似ているからである。周波数に関
する残余スペクトル値の表示すなわち図７の量子化器６
２０の入力信号の表示は、図８Ａの下右に示される。予
測後の残余スペクトル値と直接時間−周波数変換で得ら
れたスペクトル値との比較は、残余スペクトル値がもと
のスペクトル値よりもはるかに少ないエネルギーを有す
るということを示す。示された例において、残余スペク
トル値のエネルギー減少は、約１２ｄＢの合計予測利得
に相当する。図８Ａの下左のグラフに関して、以下の点について注
目すべきである。時間ドメイン信号に関する従来の予測
の使用について、合成フィルタの周波数応答は、入力信
号の振幅スペクトルの近似値である。合成フィルタは、
ほぼ「白色の」スペクトルで残余信号から、信号のスペ
クトル形状をある程度まで（再）生成する。ＴＮＳ技術
の場合におけるように、スペクトル信号について予測が
用いられるとき、合成フィルタの周波数応答は、入力フ
ィルタの包絡線の近似値である。合成フィルタの周波数
応答は、従来の場合のようにパルス応答のフーリエ変換
の結果ではなく、逆フーリエ変換の結果である。ＴＮＳ
合成フィルタは、ほぼ「白色の」（すなわち平坦な）包
絡線で残余信号から、いわば信号の包絡線の形状を
（再）生成する。よって、図８Ａの下左のグラフは、Ｔ
ＮＳ合成フィルタによってかたどられたような入力信号
の包絡線を示す。これは、ここではその上の図において
示されるカスタネット信号の包絡線近似値の対数表示で
ある。続いて、約１３ｄＢのＳＮ比が、たとえば０．５バー
クの幅の各コーディングバンドにおいて生ずるように、
コーディングノイズが残余スペクトル値に導入された。
量子化ノイズの導入によって生ずる時間ドメインにおけ
るエラー信号は、図８Ｂに示される。図８Ｂの左側の図
は、ＴＮＳ技術を用いた場合の量子化ノイズによるエラ
ー信号を示し、右側の図ではＴＮＳ技術が使用されてお
らず、よって比較できるようになっている。予想通り、
左側の図におけるエラー信号は、ブロック中で均等に配
分されておらず、この量子化ノイズを最適にマスキング
するであろうより高い信号内容が存在する領域に集中し
ている。一方、右側の場合では、導入された量子化ノイ
ズは、ブロックすなわち時間に関して均等に配分されて
おり、その結果、信号が全くまたはほとんど存在しない
前方の領域では、ノイズも存在し、それはおそらく可聴
であり、一方、高い信号内容が存在する領域では、比較
的小さなノイズが存在し、信号のマスキングの可能性が
完全には活用されていないということになる。ＴＮＳフィルタ付きの単純なすなわち非スケーラブル
オーディオコーダが以下に記述される。コーダにおけるＴＮＳフィルタ８０４の実行が図９Ａ
に示される。このフィルタは、解析フィルタバンク８０
２と量子化器８０６の間に配置される。図９Ａに示され
るコーダ用の離散時間入力信号がオーディオ入力８００
に入力され、量子化されたオーディオ信号すなわち量子
化されたスペクトル値または量子化された残余スペクト
ル値が出力８０８で出力され、その後に冗長コーダが続
いてよい。そのため、入力信号はスペクトル値へと変換
される。計算されたスペクトル値に基づき、たとえばス
ペクトル値の自己相関マトリクスを形成しレヴィンソン
−ダービンリカージョンを用いることにより、正規直線
予測計算が行なわれる。図９Ｂは、ＴＮＳフィルタ８０
４の詳細図を示す。スペクトル値ｘ（１），・・・，ｘ
（ｉ），・・・，ｘ（ｎ）がフィルタ入力８１０に与え
られる。特定の周波数帯域のみが過渡信号を示す一方、
他の周波数帯域では主に静的であるということも起こり
得る。このことは、入力スイッチ８１２及び出力スイッ
チ８１４を通じて、ＴＮＳフィルタ８０４において許容
されているのであるが、これらのスイッチの主な機能
は、被処理データの並列−直列または直列−並列変換を
もたらすことである。特定の周波数帯域が不安定で、Ｔ
ＮＳ技術によって一定のコーディング利得が得られる見
込みがあるならば、このスペクトル域のみがＴＮＳ処理
されるのだが、これは入力スイッチ８１２がたとえばス
ペクトル値ｘ（ｉ）で始まり、たとえばスペクトル値ｘ
（ｉ＋２）まで通過するということで達成される。フィ
ルタの内部領域もまた前方予測構造すなわち予測器６１
０及び加算ポイント６００を含む。ＴＮＳフィルタのフィルタ係数を決定するためまたは
予測係数を決定するための計算は、次のように実行され
る。自己相関マトリクスの形成及びレヴィンソン−ダー
ビンリカージョンの適用が、たとえば２０のノイズシェ
イピングフィルタの最高許容オーダーについて行なわれ
る。計算された予測利得が特定の閾値を超える場合、Ｔ
ＮＳ処理が作動する。それから、現在のブロックについて使用されるノイズ
シェイピングフィルタのオーダーが、係数配列の末端か
ら十分に小さい絶対値の全ての係数の除去により決定さ
れる。これは、スピーチ信号について通常４〜１２の範
囲内にある値のＴＮＳフィルタのオーダーを生じさせ
る。十分に高いコーディング利得がたとえばスペクトル値
ｘ（ｉ）の範囲について決定される場合、この範囲は処
理され、ＴＮＳスペクトルの出力でスペクトル値ｘ
（ｉ）の代わりに残余スペクトル値ｘ_R （ｉ）が現れ
る。図８Ａから分かるように、この残余値はもとのスペ
クトル値ｘ（ｉ）よりもはるかに小さい振幅を有する。
よって、正規サイド情報に加えて、デコーダに送信され
るサイド情報は、ＴＮＳの使用を示すフラグと、必要な
らば目的周波数帯域及びコーディングに使用されたＴＮ
Ｓフィルタに関する情報を含む。フィルタデータは量子
化されたフィルタ係数として表示されることが可能であ
る。次に、ＴＮＳフィルタ付きのコーダに類似して、逆Ｔ
ＮＳフィルタ付きのデコーダが考慮される。図１０Ａで示されるデコーダにおいて、ＴＮＳコーデ
ィングは各チャンネルについて反転される。残余スペク
トル値ｘ_R （ｉ）は反量子化器２１６において再量子化
され、図１０Ｂで詳細に構造を示す逆ＴＮＳフィルタ９
００に入力される。出力信号として、逆ＴＮＳフィルタ
９００は、合成フィルタバンク２１８で時間ドメインに
変換されるスペクトル値を再び伝送する。ＴＮＳフィル
タ９００は、入力スイッチ９０２と出力スイッチ９０８
を含み、それらもまた主に被処理データの並列−直列ま
たは直列−並列変換をもたらすものである。残余スペク
トル値だけを逆ＴＮＳコーディングの対象とし、ＴＮＳ
コード化されていないスペクトル値は変更されないで出
力９１０にまで通過させられるように、入力スイッチ９
０２もまた可能目的周波数帯域を考慮している。逆予測
フィルタは、予測器９０６と加算ポイント９０４を含
む。しかし、ＴＮＳフィルタとは対照的に、これらは以
下のように接続されている。残余スペクトル値は、入力
スイッチ９０２を介して加算ポイント９０４に達し、そ
こで予測器９０６の出力信号と加算される。出力信号と
して、予測器は推測スペクトル値ｘ_p （ｉ）を供給す
る。スペクトル値ｘ（ｉ）は、出力スイッチを介して逆
ＴＮＳフィルタの出力で出力される。よって、ＴＮＳ関
連のサイド情報は、デコーダにおいてデコード化され、
そのサイド情報は、ＴＮＳの使用を示すフラグと、必要
ならば目的周波数帯域に関する情報を含む。加えて、サ
イド情報は、あるブロックまたは「フレーム」をコード
化するために使用された予測フィルタのフィルタ係数を
含む。よって、ＴＮＳ方法は、以下のように要約される。入
力信号は、高分解能解析フィルタバンクによりスペクト
ル表示に変換される。それから、周波数に関して隣接す
るスペクトル値間の周波数ドメインで直線予測が行なわ
れる。この直線予測は、スペクトルドメインで行なわれ
るスペクトル値のフィルタリングのためのフィルタ工程
として解釈され得る。このようにして、もとのスペクト
ル値が予測エラーすなわち残余スペクトル値によって置
き換えられる。これらの残余スペクトル値は、正規のス
ペクトル値と全く同様に量子化及びコード化され、デコ
ーダに移送され、そこで値はデコード化され反量子化さ
れる。逆フィルタバンク（合成フィルタバンク）を使用
する前に、逆予測（逆とはコーダにおいて実行される予
測に対して）が、送信された予測エラー信号すなわち再
量子化された残余スペクトル値について逆予測フィルタ
が使用されるという方法で実行される。この技術を使用することにより、量子化ノイズの時間
包絡線を入力信号のそれに整合させることが可能であ
る。これは、目立つ時間微細構造または目立つ過渡行動
を有する信号について、エラー信号のマスキングのより
良い活用を可能にする。過渡信号の場合、ＴＮＳ技術
は、いわゆる「プレエコー」を避ける。これについては
そのような信号の「アタック」前に、量子化ノイズが既
に現れている。既に述べたように、スケーラブルオーディオコーダに
おいて、一般的にコード化された信号の非常に低いビッ
トレートが求められるため、低いサンプリング周波数の
コーダが第１の段階で使用される。第２の段階では、よ
り高いビットレートでコード化するがより大きなバンド
幅を要し、そのためスピーチコーダよりもずった高い音
質でオーディオ信号をコード化することが可能なオーデ
ィオコーダがあることが好ましい。コード化され高いサ
ンプリングレートになったオーディオ信号は、通常、た
とえばダウンサンプリングフィルタを用いてまずより低
いサンプリングレートに低変換される。減少されたサン
プリングレート信号は、その後、第１段階のコーダに入
力され、このコーダの出力信号はスケーラブルオーディ
オコーダから現れるビットストリーム中に直接書き込ま
れる。この低いバンド幅を有するコード化された信号
は、再びデコード化され、それからたとえばアップサン
プリングフィルタを用いて高いサンプリングレートに戻
され、その後、周波数ドメインに変換される。同じく周
波数ドメインに変換されるのは、コーダの入力にもとも
と存在したオーディオ信号である。２つのオーディオ信
号がここで入手可能であるが、前者は第１段階のコーダ
のコーディングエラーを被っている。これら周波数ドメ
インの２つの信号は、２つの信号の差のみを表示する信
号を得るために、ここで差分エレメントに供給されるこ
とが可能である。後述する周波数選択スイッチとしても
実行可能なスイッチングモジュールにおいて、次に２つ
の入力信号の差を処理するのが良いか、または周波数ド
メインに変換されたもとのオーディオ信号を直接処理す
るのが良いか、決定することが可能である。いずれにし
ても、ＭＰＥＧ標準に従って機能する場合なら、心理音
響学モデルを考慮する量子化と、好ましくは量子化され
たスペクトル値でのハフマンコーディングを用いるエン
トロピーコーディングを続けて両方行なうような、たと
えば公知の量子化器／コーダに、スイッチングモジュー
ルの出力信号が与えられる。量子化器及びコーダの出力
信号は、第１段階のコーダの出力信号と共にビットスト
リームに書き込まれる。図１０Ａに示される構造を単純
に模倣するために、最初に記述したＴＮＳフィルタのス
イッチングモジュールの直後、すなわち量子化器／コー
ダの前に配置するのが一見良いように思われるかも知れ
ない。しかし、この解決法の不都合は、スイッチングモ
ジュールの出力信号が、コーダの入力におけるもとの時
間オーディオ信号に関して大きく変更されており、その
結果ＴＮＳフィルタのフィルタ係数決定が同じ品質で適
用できないことである。本願発明の目的は、スケーラブルコーディオコーダの
場合でもテンポラルノイズシェイピングが役立つよう
に、スケーラブルオーディオコーディングのコンセプト
とテンポラルノイズシェイピングのコンセプトを組み合
わせることである。この目的は、請求項１または２によるコーディング方
法によって、請求項３または４によるデコーディング方
法によって、請求項５または６によるコーディング装置
によって、請求項７または８によるデコーディング装置
によって達成される。本願発明は、ＴＮＳフィルタ係数または予測係数の決
定が、第１段階のコーダによる影響を受けていないスペ
クトル値に基づいて行なわれなければならないという洞
察に基づく。もちろん、スケーラブルオーディオコーダ
も、第１段階のコーダのように、明細書の導入部で引用
した変形のひとつを利用し得る順応性のあるコーダであ
るべきである。本願発明によると、ＴＮＳ予測係数の決
定は、コーダの入力におけるオーディオ信号の直接表示
であるスペクトル値に基づいて行なわれる。フィルタバ
ンクまたはＭＤＣＴを使用することにより、オーディオ
コーダ入力信号のスペクトル表示が生成できる。しか
し、ＴＮＳコーディングフィルタによる実際のフィルタ
リングのように、コーダの同じ場所においてＴＮＳフィ
ルタ係数の決定を行なうことはもはや不可能である。そ
のため、ＴＮＳフィルタ係数の決定は、実際のＴＮＳコ
ーディングフィルタリングとは別に行なわれなければな
らない。本願発明の第１の観点によると、ＴＮＳフィルタ係数
の決定は、もとのオーディオ入力信号を周波数ドメイン
に変換するフィルタバンクの直後で行なわれる。よっ
て、同種の信号すなわちＴＮＳ処理されていない信号
が、加算器またはスイッチングモジュールの前に存在す
る。本願発明の第１の観点によると、既に決定されたＴ
ＮＳ係数でのＴＮＳフィルタリングが、スイッチングモ
ジュールの後及びおそらく心理音響学モデルに従って作
動する量子化器／コーダの前で起こる。しかし、後で明
らかになるように、このスケーラブルオーディオコーダ
におけるＴＮＳ技術の実行は、デコーダの変更を伴う。しかし、本願発明の第２の観点によると、このデコー
ディングはもはや必要ではない。ここでは、ＴＮＳ予測
係数が、第１の観点についてと同様に、再び同じ場所で
決定される。本願発明の第１の観点とは対照的に、２つ
の関連のスペクトル信号すなわち第１段階のコーディン
グエラーを伴うスペクトル信号及びオーディオ入力信号
の本質的に歪められていない表示であるスペクトル信号
が、加算エレメントの前で、前もって決定されたＴＮＳ
係数で作動するＴＮＳコーディングフィルタにより処理
される。第１段階のコーダのコーディングエラーを負っ
たスペクトル信号のＴＮＳフィルタリングが、エラーの
ないオーディオ信号に由来するＴＮＳ係数を単純に用い
るＴＮＳ係数の再決定なしに作動することに注目するの
は重要である。本願発明の第２の観点によれば、同種の
２つの信号すなわちここではＴＮＳ処理された信号は、
加算器またはスイッチングモジュールの入力において再
び存在する。一般に、本願発明の第１及び第２の観点は、ある例で
はＴＮＳ処理されていない信号が加算器の前に存在する
のに対し、別の例では、ＴＮＳ処理された信号が差分の
対象となるかまたはスイッチングモジュールに入力され
るという点で異なる。記述された条件は、本願発明によるデコーダにおいて
考慮される。本願発明の第１の観点によりコード化され
た信号をデコード化するデコーダの場合、ＴＮＳデコー
ディング、すなわちビットストリームでサイド情報とし
て再び現れるコーディングの際に決定されたＴＮＳ係数
を使用するＴＮＳデコーディングフィルタの使用は、ス
イッチングモジュールに類似した逆スイッチングモジュ
ールの前で起こる。コーダに関して、逆スイッチングモ
ジュールにＴＮＳ処理されていない信号が供給される
が、デコーダの場合もまた同様である。一方、本願発明の第２の観点によりコード化された信
号をデコード化するデコーダの場合、逆スイッチングモ
ジュールにはＴＮＳ処理された信号が与えられる。この
目的のために、第１段階のコーダのデコード化された信
号は、周波数ドメインに変換され、コーダにおいて決定
されたＴＮＳフィルタ係数を用いるＴＮＳコーディング
フィルタによってフィルタリングされなければならな
い。本願発明の第２の観点によるコーダについてと原則
的に同様に、そのときだけ同種すなわちＴＮＳ処理され
た信号が、逆スイッチングモジュールまたはその前に配
置された加算器において比較される。逆スイッチングモ
ジュールの出力信号は、最終的にＴＮＳデコーディング
フィルタに入力され、その出力信号は、全ての装置のコ
ーディングエラーから切り離してもとのオーディオ信号
を再生するために、その後、逆フィルタバンクにより処
理される。既に述べたように、本願発明の第２の観点に
よるコーダまたはデコーダが、本願発明の実施例では好
ましい。なぜなら、逆フィルタバンクの前にＴＮＳデコ
ーディングフィルタまたは逆ＴＮＳフィルタが配置され
るので、デコーダにおける実質的な変更が必要でないか
らであり、これは図１０Ａの配置に対応する。本願発明の実施例は、添付の図面を参照しながら以下
より詳細に記述される。［図面の簡単な説明］図１は、本願発明の第１の観点によるスケーラブルオ
ーディオコーダを示す。図２は、本願発明の第２の観点によるスケーラブルオ
ーディオコーダを示す。図３は、本願発明の第１の観点によるデコーダを示
す。図４は、本願発明の第２の観点によるデコーダを示
す。図５は、時間ドメインと周波数ドメインとの二重性を
解明する表を示す。図６Ａは、過渡信号の一例を示す。図６Ｂは、図６Ａに示される過渡時間信号に基づく部
分的なバンドパス信号のヒルベルト包絡線を示す。図７は、周波数ドメインにおける予測の概略図であ
る。図８Ａは、ＴＮＳ技術を解説するための一例を示す。図８Ｂは、ＴＮＳ技術を用いた場合（左）と用いてい
ない場合（右）の導入された量子化ノイズの時間軸上の
行動の比較を示す。図９Ａは、ＴＮＳフィルタ付きの非スケーラブルコー
ダの簡略化されたブロック図である。図９Ｂは、図９ＡのＴＮＳフィルタの詳細図である。図１０Ａは、逆ＴＮＳフィルタ付きの非スケーラブル
デコーダの簡略化されたブロック図である。図１０Ｂは、図１０Ａの逆ＴＮＳフィルタの詳細図で
ある。

【発明の実施の形態】

図１は、本願発明のスケーラブルオーディオコーダの
概念ブロック図である。たとえば４８ｋＨｚの第１のサ
ンプリングレートでサンプリングされた離散時間信号ｘ
₁ は、ダウンサンプリングフィルタ１２により、たとえ
ば８ｋＨｚの第２のサンプリングレートに導かれ、第２
のサンプリングレートは第１のサンプリングレートより
も低い。第１と第２のサンプリングレートの比は、自然
数であることが好ましい。間引きフィルタとして実行さ
れてもよいダウンサンプリングフィルタ１２の出力信号
は、第１のコーディングアルゴリズムによって入力信号
をコード化するコーダ／デコーダ１４に入力される。既
に述べたように、コーダ／デコーダ１４は、たとえば
Ｇ．７２９、Ｇ．７２３、ＦＳ１０１６、ＭＰＥＧ−４
ＣＥＬＰ、ＭＰＥＧ−４ＰＡＲ等のより低いオーダ
ーのスピーチコーダでよい。そのようなコーダは、毎秒
４．８キロビットのデータレート（ＦＳ１０１６）か
ら、毎秒約８キロビットのデータレート（Ｇ．７２９）
で作動する。それらは全てサンプリング周波数８ｋＨｚ
でサンプリングされた信号を処理する。しかし、当業者
にとっては、他のデータレートまたは他のサンプリング
周波数の他のどのコーダでも使用できることは自明であ
る。コーダ１４によってコード化された信号すなわちコー
ド化された第２の信号ｘ_2c、コーダ１４に依存し上記の
ビットレートの１つで存在するビットストリームは、ラ
イン１６を介してビットフォーマッタ１８に入力され
る。ビットフォーマッタ１８の機能は後述する。ダウン
サンプリングフィルタ１２及びコーダ／デコーダ１４
は、本願発明によるスケーラブルオーディオコーダの第
１の段階を構成する。ライン１６に出力されるコード化された第２の信号ｘ
_2cも、ライン２０上にコード化／デコード化された第２
の時間信号ｘ_2cd を生成するために、第１のコーダ／デ
コーダ１４で再びデコード化される。コード化／デコー
ド化された第２の時間信号ｘ_2cd は、第１の離散時間信
号ｘ₁ より低いバンド幅を有する離散時間信号である。
記述された数値的な例について、第１の離散時間信号ｘ
₁ は、サンプリング周波数が４８ｋＨｚなので、最大２
４ｋＨｚのバンド幅を有する。コード化／デコード化さ
れた第２の時間信号ｘ_2cd は、ダウンサンプリングフィ
ルタ１２が第１の時間信号ｘ₁ を間引きを通じて８ｋＨ
ｚのサンプリング周波数に変換したので、最大４ｋＨｚ
のバンド幅を有する。０から４ｋＨｚのバンド幅内で、
信号ｘ₁ とｘ_2cd は、コーダ／デコーダ１４により持ち
こまれたコーディングエラーを除いては同じである。ここで、コーダ１４により持ちこまれたコーディング
エラーは常に小さなエラーとはかぎらず、たとえば強く
過渡的な信号が第１コーダでコード化される場合、それ
らは有用な信号と同じオーダーの振幅のものでもあり得
るということが指摘される。この理由で、後で説明する
ように、差分コーディングが合理的かどうか調べるため
にチェックが行なわれる。コーダ／デコーダ１４の出力での信号ｘ_2cd は、再び
高サンプリングレートに変換して戻すためにアップサン
プリングフィルタ２３に入力され、その結果信号ｘ₁ と
比較可能になる。アップサンプリングされた信号ｘ_2cd 及び信号ｘ₁
は、各々フィルタバンクＦＢ１２２及びフィルタバン
クＦＢ２２４に入力される。フィルタバンクＦＢ１
２２は、信号ｘ_2cd の周波数ドメイン表示であるスペク
トル値Ｘ_2cd を生成する。一方、フィルタバンクＦＢ２
は、もとの第１の時間信号ｘ₁ の周波数ドメイン表示で
あるスペクトル値Ｘ₁ を生成する。２つフィルタバンク
の出力信号は、加算器２６において減算される。より正
確には、フィルタバンクＦＢ１２２の出力スペクトル
値Ｘ_2cd は、フィルタバンクＦＢ２２４の出力スペク
トル値から減算される。加算器２６の次には、加算器２
６の出力信号Ｘ_d と、以後第１のスペクトル値Ｘ₁ と呼
ばれるフィルタバンク２４の出力信号Ｘ₁ すなわち第１
の時間信号のスペクトル表示の両方が入力されるスイッ
チングモジュールＳＭ２８が続く。本願発明の第１の観点によると、スイッチングモジュ
ール２８に続くＴＮＳフィルタまたは予測フィルタ２８
の予測係数は、ＴＮＳ係数の計算のためのデバイス２５
により計算される。ＴＮＳ係数計算器２５は、図１から
分かるように、ＴＮＳコーディングフィルタ２７とビッ
トフォーマッタ１８の両方に対して係数を与える。ＴＮＳコーディングフィルタは、当業者には公知の心
理音響学モジュール３２の記号で示される心理音響学モ
デルに従って量子化を行なう量子化器／コーダ３０に入
力する。２つのフィルタバンク２２、２４、加算器２
６、スイッチングモジュール２８、量子化器／コーダ３
０及び心理音響学モジュール３２は、本願発明によるス
ケーラブルオーディオコーダの第２の段階を構成する。以下において、スケーラブルオーディオコーダの動作
が図１を利用して説明される。前述のように、第１のサ
ンプリングレートでサンプリングされた離散第１時間信
号ｘ₁ は、第２のサンプリングレートに相当するバンド
幅の第２の時間信号ｘ₂ を生成するために、ダウンサン
プリングフィルタ１２に入力され、第２のサンプリング
レートは、第１のサンプリングレートよりも低い。これ
らの第２の時間信号ｘ₂ から、コーダ／デコーダ１４
は、第１のコーディングアルゴリズムに従って、第２の
コード化された時間信号ｘ_2cを生成し、また続く第１の
コーディングアルゴリズムによるデコーディングによっ
て、コード化／デコード化された第２の時間信号ｘ_2cd
を生成する。コード化／デコード化された第２の時間信
号ｘ_2cd の周波数ドメイン表示である第２のスペクトル
値Ｘ_2cd を生成するために、コード化／デコード化され
た第２の時間信号ｘ_2cd は、第１のフィルタバンクＦＢ
１２２により周波数ドメインに変換される。ここで、コード化／デコード化された第２の時間信号
ｘ_2cd は、第２のサンプリング周波数すなわち例におい
て８ｋＨｚの時間信号であることが指摘される。これら
の信号の周波数ドメイン表示及び第１のスペクトル値Ｘ
₁ が評価されるが、第１のスペクトル値Ｘ₁ は第１の時
間信号ｘ₁ から生成され、第２のフィルタバンクＦＢ２
２４により第１すなわち高いサンプリング周波数を示
す。同一の時間及び周波数分解能の比較信号を得るため
に、８ｋＨｚ信号すなわち第２のサンプリング周波数の
信号が、第１のサンプリング周波数の信号に変換されな
ければならない。しかし、スケーラブルコーダにとっ
て、２つのサンプリング周波数が異なっているというの
は不可避ではなく、それらは同じ値でもあり得る。これは、アップサンプリングフィルタを使用する代わ
りに、信号ｘ_2cd の個々の離散時間のスキャンされた値
の間に特定の数のゼロの値を挿入することによっても達
成できる。ゼロの値の数は、（第１のサンプリング周波
数対第２のサンプリング周波数の比）−１により求めら
れる。第１（高い）対第２（低い）のサンプリング周波
数の比は、アップサンプリングファクターと呼ばれる。
当業者には公知のように、ゼロの挿入は、非常に少ない
計算労力で可能であるが、信号ｘ_2cd においてエイリア
シング効果を生じさせ、その結果として、信号ｘ_2cd の
低周波数または有用なスペクトルが反復され、反復の数
は挿入されたゼロの数に等しい。エイリアシングを被っ
た信号ｘ_2cd は、第２のスペクトル値Ｘ_2cd を生成する
ために、第１のフィルタバンクＦＢ１により周波数ドメ
インに変換される。コード化／デコード化された第２の信号ｘ_2cd の各々
スキャンされた値の間にたとえば５つのゼロを挿入する
ことは、この信号の各６番目のスキャンされた値だけが
ゼロと異なることが最初から分かっている信号を生じさ
せる。この事実は、この信号をフィルタバンクまたはＭ
ＤＣＴによって、または任意のフーリエ変換によって、
周波数ドメインに変換する際に、利用できる。なぜな
ら、たとえば単純ＦＦＴで行なわれる特定の加算を省略
することができるからである。被変換信号の最初から分
かっている構造は、このように、信号を周波数ドメイン
に変換する際に計算時間を節約するという有利な方法で
利用され得る。第２のスペクトル値Ｘ_2cd は、より低い部分において
のみ、コード化／デコード化された第２の時間信号ｘ
_2cd の正しい表示であり、その理由で、全てのスペクト
ル線Ｘ_2cd のうち１／（アップサンプリングファクタ
ー）部分だけがフィルタバンクＦＢ１の出力で使用され
る。ここで、コード化／デコード化された第２の時間信
号ｘ_2cd におけるゼロの挿入のために、ここで使用され
るスペクトル線Ｘ_2cd の数は、エイリアシング障害のな
い第１の時間信号ｘ₁ の周波数表示である第１のスペク
トル値Ｘ₁ と同じ時間及び周波数分解能を有することが
指摘される。減算器２６において、及びスイッチングモ
ジュール２８において、２つの信号Ｘ_2cd 及びＸ₁ は、
評価されたスペクトル値Ｘ_b またはＸ₁ を生成するため
に評価される。ここで、スイッチングモジュール２８
は、いわゆるサイマルキャスト差分転換を実行する。第２の段階において差分コーディングを用いることが
かならずしも有益とは限らない。これは、たとえば差分
信号すなわち加算器２６の出力信号が第２のフィルタバ
ンクの出力信号Ｘ₁ よりも高いエネルギーを有する場合
である。更に、任意のコーダが第１段階のコーダ／デコ
ーダ１４に使用され得るので、コーダは、コード化しに
くい特定の信号を生成することもあり得る。コーダ／デ
コーダ１４は、コード化した信号の位相情報を保存して
いることが好ましく、その工程は専門家により「ウェー
ブフォームコーディング」または「シグナルフォームコ
ーディング」と呼ばれている。差分コーディングかサイ
マルキャストコーディングのいずれが用いられるべきか
に関する第２段階のスイッチングモジュール２８におけ
る決定は、周波数に基づいて行なわれる。「差分コーディング」とは、第２のスペクトル値Ｘ
_2cd と第１のスペクトル値Ｘ₁ との差のみがコード化さ
れるという意味である。しかし、差分信号のエネルギー
内容が第１のスペクトル値Ｘ₁ のエネルギー内容より大
きいために、そのような差分コーディングが有益でない
場合には、差分コーディングは使用されない。差分コー
ディングが使用されない場合は、例において４８ｋＨｚ
でサンプリングされた時間信号ｘ₁ の第１のスペクトル
値Ｘ₁ は、スイッチングモジュール２８によりつなが
れ、スイッチングモジュールＳＭ２８の出力信号とし
て使用される。差の形成が周波数ドメインで起こるので、サイマルキ
ャストコーディングと差分コーディング間の周波数選択
的選択を行うのに問題はない。なぜなら、２つの信号Ｘ
₁ とＸ_2cd の差は、いかなる場合でも計算されるからで
ある。よって、スペクトルにおける差の形成は、差分コ
ーディングされるべき周波数帯域の単純な周波数選択的
選択を可能にする。原則的には、各スペクトル値につい
て個々に差分コーディングからサイマルキャストコーデ
ィングへの転換が起こり得る。しかし、これはあまりに
も大量のサイド情報を要し、絶対に必要でもない。よっ
て、たとえば周波数グループにおける差分スペクトル値
のエネルギーと第１のスペクトル値のエネルギーを比較
する方が良い。その代わりに、たとえば８バンド、各５
００Ｈｚ幅毎というように、一定の周波数バンドを最初
から特定することも可能であり、時間信号ｘ₂ が４ｋＨ
ｚのバンド幅である場合、再び信号Ｘ_2cd のバンド幅と
いう結果になる。周波数バンドを決める際の妥協点は、
送信されるサイド情報の量を平均させる、すなわちある
周波数バンドにおいて差分コーディングが活性か否か
は、可能なかぎり頻繁に差分コーディングが行なわれる
ことから生ずる利益に対して、比較考量することにあ
る。たとえば各バンドにつき８ビット、差分コーディング
またはその他の適切なコーディングについてのオン／オ
フビット等のサイド情報は、ビットストリームにおいて
送信されることが可能であり、そのような情報はある特
定の周波数バンドが差分コーディングされたか否かを示
している。後述のデコーダにおいては、第１のコーダの
相当するサブバンドのみが、その後再構成の際に加えら
れる。よって、第１のスペクトル値Ｘ₁ と第２のスペクトル
値Ｘ_2cd の評価のステップは、差分スペクトル値Ｘ_d を
得るために、第１のスペクトル値Ｘ₁ から第２のスペク
トル値Ｘ_2cd の減算を含むことが好ましい。また、たと
えば８ｋＨｚにおける５００Ｈｚ等の予め決定されたバ
ンドにおける多重のスペクトル値のエネルギーが、その
後たとえば加算やスクエアリングなどの公知の方法によ
り、差分スペクトル値Ｘ_d 及び第１のスペクトル値Ｘ₁
について計算される。各々のエネルギーの周波数選択的
比較が、各周波数バンドにおいて行なわれる。差分スペ
クトル値Ｘ_d のある特定の周波数バンドにおけるエネル
ギーが、予め決められた因子ｋによって乗算された第１
のスペクトル値Ｘ₁ のエネルギーを超えている場合、評
価されたスペクトル値Ｘ_b は第１のスペクトル値Ｘ₁ で
あると決定される。そうでなければ、差分スペクトル値
Ｘ_d が、評価されたスペクトル値Ｘ₁ であると決定され
る。因子ｋは、たとえば約０．１から１０までの値であ
り得る。１より小さいｋの値については、差分信号がも
との信号より低いエネルギーである場合、サイマルキャ
ストコーディングが既に使用されている。一方、１より
大きいｋの値については、たとえ差分信号のエネルギー
内容が第１のコーダでコード化されていないもとの信号
のそれを既に上回っていても、差分コーディングが継続
して使用される。サイマルキャストコーディングが評価
される場合、スイッチングモジュール２８は、第２のフ
ィルタバンク２４の出力信号に直接つなぐ。前述の差の
形成の代わりの方法として、たとえば２つの引用された
信号について比が形成されたり、乗算その他の操作が行
なわれるという評価が行なわれることも可能である。ＴＮＳコーディングフィルタ２７は、スイッチングモ
ジュール２８の出力に接続され、評価された残余スペク
トル値を得るために、ＴＮＳ係数計算器２５により評価
された予測係数を用いて、周波数に関して評価されたス
ペクトル値Ｘ_b の予測を行う。評価された残余スペクトル値は、スイッチングモジュ
ール２８により決定されたとおり、差分スペクトル値Ｘ
_d または第１のスペクトル値Ｘ₁ のいずれかに相当し、
当業者には公知であり心理音響学モデル３２内に存在す
る心理音響学モデルを考慮して第１の量子化／コーダ３
０により量子化され、その後、好ましくはたとえばハフ
マンテーブルを用いる冗長減少コーディングによりコー
ド化される。当業者には公知のように、心理音響学モデ
ルは時間信号から計算され、図１から分かるように、そ
れが高いサンプリングレートの第１の時間信号ｘ₁ が心
理音響学モデル３２に直接入力される理由である。量子
化器／コーダ３０の出力信号Ｘ_cbは、ライン４２でビッ
トフォーマッタ１８へと直接導かれ、出力信号ｘ_AUS に
書き込まれる。ここまで第１及び第２の段階のスケーラブルオーディ
オコーダが記述された。本願発明によるスケーラブルオ
ーディオコーダのコンセプトは、また、３以上の段階の
カスケード接続も可能である。よって、たとえば４８ｋ
Ｈｚでサンプリングされた入力信号ｘ₁ について、おお
よそ電話の通話品質に相当するデコーディング後の信号
品質を達成するために、サンプリングレートを減らすこ
とにより、第１のコーダ／デコーダ１４において、最初
の４ｋＨｚのスペクトルをコード化することが可能であ
ろう。第２の段階において、おおよそＨＩＦＩ品質に相
当する音質を達成するために、量子化器／コーダ３０に
より実行される１２ｋＨｚまでのバンド幅コーディング
が行なわれることが可能であろう。４８ｋＨｚでサンプ
リングされた信号ｘ₁ が２４ｋＨｚのバンド幅を有し得
ることは、当業者にとって自明である。付加量子化器／
コーダ３８により実行される第３の段階は、おおよそコ
ンパクトディスク（ＣＤ）の音質に相当する音質を達成
するために、最大２４ｋＨｚ、または実際的な例ではた
とえば最高２０ｋＨｚのバンド幅までのコーディングを
行なうことが可能であろう。送信されなければならないサイド情報以外に、コード
化されたデータストリームｘ_AUS は、以下の信号を含
む： − コード化された第２の信号ｘ_2c（０から４ｋＨｚの
全スペクトル）；及び − コード化され評価された残余スペクトル値（サイマ
ルキャストコーディングで０から１２ｋＨｚの全スペク
トルまたは差分コーディングでコーダ１４の０から４ｋ
Ｈｚのコーディングエラー及び４から１２ｋＨｚの全ス
ペクトル）。例における第１のコーダ／デコーダ１４から量子化器
／コーダ３０への遷移において、遷移障害は４ｋＨｚか
ら４ｋＨｚより大きい値の遷移を伴うことがある。これ
らの遷移障害は、ビットストリームｘ_AUS に書きこまれ
たエラーのスペクトル値の形で姿を現わす。全体のコー
ダ／デコーダは、たとえば１／（アップサンプリングフ
ァクター引くｘ）（ｘ＝１，２，３）までの周波数ライ
ンだけが使用されるように特定されることが可能であ
る。その結果、第２のサンプリング周波数で到達可能な
最大バンド幅の末端の信号Ｘ_2cd の最終スペクトル線は
考慮に入れられない。暗に、これは評価関数が使用され
たことを意味し、引用された場合では、特定の周波数値
より上はゼロであり、これより下は１の値を有するとい
う矩形関数である。代わりに、遷移障害を有するスペク
トル線の振幅を減らす「よりソフトな」評価関数が用い
られることも可能であり、その後は減少された振幅のス
ペクトル線が考慮される。遷移障害は、デコーダにおいて再び取り除かれるの
で、可聴ではないということが指摘される。しかし、遷
移障害は過分な差分信号へとつながる可能性があり、そ
の場合差分コーディングによるコーディング利得が減少
される。上述のような評価関数での評価により、コーデ
ィング利得の損失が制限できる。矩形関数以外の評価関
数は、矩形関数と同様に、コーダ及びデコーダにアプリ
オリに適合され得るので、付加的なサイド情報を必要と
しない。図２は、本願発明の第２の観点により作動するコーダ
の実際上の実施を示す。図１と同じエレメントには同じ
参照番号を付しており、特別に言及されていないかぎ
り、同じ機能を実行する。既に説明したように、本願発
明の第２の観点は、変更が少なくて済むために、デコー
ダにとってより良いものである。図１のスケーラブルオ
ーディオコーダと対照的に、図２では、第２のＴＮＳコ
ーディングフィルタ２７が、位置２２のフィルタバンク
１の後ろに配置される。更に、第１のＴＮＳコーディン
グフィルタは、既にフィルタバンク２２４の後ろに位
置しており、これはデバイス２６における加算器及びス
イッチングモジュール２８が、ＴＮＳ処理されたスペク
トル値すなわち第１の残余スペクトル値及び第２の残余
スペクトル値を処理することを意味する。スイッチング
モジュール２８及び加算器２６において、評価された残
余スペクトル値を得るために、第２の残余スペクトル値
で第１の残余スペクトル値が評価され、その後量子化器
／コード３０に入力される。よって、図１でのように、
これは評価された残余スペクトル値を量子化及びコード
化する。ＴＮＳ係数計算器２５は、フィルタバンク２４
の後ろのＴＮＳコーダとフィルタバンク２２の後ろのＴ
ＮＳコーダの両方に入力し、フィルタバンク２２の出力
信号は、ＴＮＳフィルタリングの対象となるが、それは
フィルタバンク２４の出力信号から計算されたＴＮＳ係
数に基づいて行われる。図１でのように、ビットストリ
ームフォーマッタ１８のＴＮＳ係数は、サイド情報とし
て供給される。図３は、図１に示されるスケーラブルオーディオコー
ダによってコード化されたデータをデコーディングする
ためのデコーダを示す。図１のビットフォーマッタ１８
の出力データストリームは、データストリームｘ_AUS か
ら図１のライン４２及び１６上の信号を得るために、デ
マルチプレクサ４６に与えられる。コード化された第２
の信号ｘ_2cは遅延エレメント４８に入力され、遅延エレ
メント４８は、システムの他の側面のために必要とされ
本願発明の構成要素ではないデータに遅延を導入する。遅延の後、コード化された第２の信号ｘ_2cは、図３に
示されるように、ライン５２を介して出力されるコード
化／デコード化された第２の時間信号ｘ_cd2 を生成する
ために、図１のコーダ／デコーダ１４においても実行さ
れる第１のコーディングアルゴリズムによりデコーディ
ングするデコーダ５０に入力される。コード化され評価
された残余スペクトル値は、評価された残余スペクトル
値を得るために、再量子化器５４により再量子化され
る。加算器５８は、残余スペクトル値及び任意の更なる
レイヤー（破線で示される）の残余スペクトル値の合計
を形成する。加算器２６と同様に作動する加算器６２の前で再び同
じ状態を作り出すために、加算器５８の後にＴＮＳデコ
ーディングフィルタ５９が続く。ＴＮＳデコーディング
フィルタ５９は、加算器５８の出力信号に関して逆ＴＮ
Ｓフィルタリングを行なう。ここでは、サイド情報に含
まれる予測係数が使用されるが、これらは図２のＴＮＳ
係数計算器２５によって計算されたものである。ＴＮＳ
デコーダ５９の出力には、デコード化され評価されたス
ペクトル値Ｘ_b が存在する。ここで、図３から分かるように、コード化／デコード
化された第２の時間信号は、第２のスペクトル値Ｘ_2cd
を得るために、まず適当なアップサンプリングフィルタ
６３により変換され、フィルタバンク６４により周波数
ドメインに変換されなければならないということが指摘
される。なぜなら、加算器６２の加算はスペクトル値の
加算だからである。フィルタバンク６４は、フィルタバ
ンクＦＢ１２２及びＦＢ２２４と同一であることが
好ましく、それによりただ１つの装置のみが実行されな
ければならないことになり、それには、適当なバッファ
が据え付けられ、連続して異なる信号が供給される。代
わりに、適切でありさえすれば、異なるフィルタバンク
が用いられてもよい。既に述べたように、スペクトル値の量子化で用いられ
る情報は、心理音響学モジュール３２により第１の時間
信号ｘ₁ から得られる。送信されるデータ量を減らすた
めに、できるだけ粗くスペクトル値を量子化するよう特
別な努力がなされる。一方、量子化により導入された障
害は可聴であるべきではない。心理音響学モジュール３
２に含まれそれ自体公知のモデルが、いかなる障害も可
聴でない量子化により導入され得る許容障害エネルギー
の計算に使用される。制御部は、許容障害より小さいか
それと等しい量子化障害を持ちこむ量子化を実行するた
めに、公知の量子化器／コーダにおける量子化器を制御
する。これは、たとえばブロック３０に含まれる量子化
器により量子化された信号が再び反量子化されるという
方法で、公知のシステムにおいて常に監視される。量子
化器への入力信号と、量子化／反量子化された信号とを
比較することにより、量子化によって実際に導入された
障害エネルギーが計算される。量子化／反量子化された
信号の実際の障害エネルギーは、制御部において、許容
障害エネルギーと比較される。実際の障害エネルギーが
許容障害エネルギーより大きければ、量子化器内の制御
部は、量子化の精密度を増加させる。許容障害エネルギ
ーと実際の障害エネルギーとの比較は、典型的に心理音
響学周波数バンド毎に起こる。この方法は公知であり、
サイマルキャストコーディングが使用される場合、本願
発明によるスケーラブルオーディオコーダにより使用さ
れる。いわゆるポストフィルタ６７は、第１段階のデコーダ
に相当するデコーダの出力信号のある種のポストフィル
タリングを行なうことが可能であり、デコーダ５０の出
力側に配置される。しかし、このフィルタは本願発明の
構成要素ではない。図４は、図３のそれと同様のデコーダを示す。しか
し、図４に示すデコーダは、本願発明の第２の観点によ
るコード化された信号について作動する。図３とは対照
的に、逆スイッチングモジュール６０は、ＴＮＳコード
化された入力信号に関して作動し、一方、図３の逆スイ
ッチングモジュール６０は、非ＴＮＳ処理された入力信
号すなわちＴＮＳデコード化された信号に関して作動す
る。デコーダ５０の出力信号は、どこにおいても、コー
ダにおいてでさえも、ＴＮＳコード化されていないの
で、図１及び図２のＴＮＳコーディングフィルタ２７と
同じ方法で実行されることが可能なＴＮＳコーディング
フィルタ２７によりフィルタリングされなければならな
い。本願発明の第２の観点によるデコーダにおいて、締
めくくりのＴＮＳデコーディングフィルタ５９は、フィ
ルタバンク２２及び２４のフィルタバンク操作を反転さ
せることが可能な逆フィルタバンク６６の前に直接配置
される。変換コーダにおいて通常見られる図１０Ａに示
される配置に相当するので、この配置が好ましい。ＴＮ
Ｓデコーディングフィルタ５９及びＴＮＳコーディング
フィルタ２７の両方に、デマルチプレクサ４６がコード
化されたビットストリームｘ_AUS のサイド情報から抽出
した予測係数が供給される。図４によるデコーダにおける付加的なＴＮＳコーディ
ングフィルタ２７は、最小限により高い支出を表す。な
ぜなら、ＴＮＳフィルタパラメータ決定の間に確認され
たパラメータは、ＴＮＳデコーディングフィルタを計算
できるように、いかなる場合でも送信されるからであ
る。それはまたデコーダにおいてＴＮＳコーディングフ
ィルタを計算するにも十分である。送信されたビットス
トリームにおいて変更は必要ない。当業者にとって、第１のサンプリング周波数が４８ｋ
Ｈｚであり第２のサンプリング周波数が８ｋＨｚである
ところの提示された実施例が、単なる例示であることは
自明である。８ｋＨｚより低い周波数が第２の低い方の
サンプリング周波数として用いられてもよい。全体のシ
ステムのサンプリング周波数としては、４８ｋＨｚ、４
４．１ｋＨｚ、３２ｋＨｚ、２４ｋＨｚ、２２．０５ｋ
Ｈｚ、１６ｋＨｚ、８ｋＨｚまたはその他の適当なサン
プリング周波数が使用されてよい。第１の段階のコーダ
／デコーダ１４のビットレート範囲は、既に述べたよう
に、毎秒４．８ｋｂｉｔから毎秒８ｋｂｉｔまででよ
い。第２の段階の第２のコーダのビットレートの範囲
は、サンプリングレート４８、４４．１、３２、２４、
１６及び８ｋＨｚで、毎秒０から６４、６９．６５９、
９６、１２８、１９２及び２５６ｋｂｉｔでよい。第３
の段階のコーダのビットレート範囲は、全てのサンプリ
ングレートについて毎秒８ｋｂｉｔから毎秒４４８ｋｂ
ｉｔでよい。

フロントページの続き (72)発明者タイヒマンボドドイツ連邦共和国Ｄ−90427 ニュルンベルクエバマンシュテターシュトラーセ２ (72)発明者ブランデンブルクカールハインツドイツ連邦共和国Ｄ−91054 エアランゲンハーグシュトラーセ 32 (72)発明者ゲルホイザーハインツドイツ連邦共和国Ｄ−91344 ヴァイシェンフェルトザウゲンドルフ 17 (56)参考文献特開平８−330973（ＪＰ，Ａ) 特開平３−144700（ＪＰ，Ａ) 特開平６−69810（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/30 G10L 19/00

Claims

(57)【特許請求の範囲】

【請求項１】第１のサンプリングレートでサンプリン
グされた離散第１時間信号（ｘ₁ ）をコーディングする
方法であって、以下のステップを含む：第１の時間信号（ｘ₁ ）から、第２のサンプリングレー
トに相当するバンド幅である第２の時間信号（ｘ₂ ）を
生成するステップであって、第２のサンプリングレート
は第１のサンプリングレートに等しいかまたはそれより
低いステップ；コード化された第２の信号（ｘ_2c）を得るために、第１
のコーディングアルゴリズムにより第２の時間信号（ｘ
₂ ）をコーディングするステップ；第２のサンプリング周波数に相当するバンド幅であるコ
ード化／デコード化された第２の時間信号（ｘ_2cd ）を
得るために、コード化された第２の信号（ｘ_2c）を第１
のコーディングアルゴリズムによりデコーディングする
ステップ；第１のスペクトル値（Ｘ₁ ）を得るために、第１の時間
信号（ｘ₁ ）を周波数ドメインに変換するステップ；第１のスペクトル値（Ｘ₁ ）から予測係数を計算するス
テップ；コード化／デコード化された第２の時間信号（ｘ_2cd ）
から第２のスペクトル値（Ｘ_2cd ）を生成するステップ
であって、第２のスペクトル値（Ｘ_2cd ）はコード化／
デコード化された第２の時間信号（ｘ_2cd ）の周波数ド
メインでの表示であるステップ；第１のスペクトル値（Ｘ₁ ）の数に相当する数である評
価されたスペクトル値（Ｘ_b ）を得るために、第１のス
ペクトル値（Ｘ₁ ）を第２のスペクトル値（Ｘ_2cd ）で
評価するステップ；評価された残余スペクトル値を得るために、計算された
予測係数によって、周波数に関して評価されたスペクト
ル値の予測を行なうステップ；及びコード化され評価された残余スペクトル値を得るため
に、評価された残余スペクトル値を、第２のコーディン
グアルゴリズムによってコーディングするステップ。
【請求項２】第１のサンプリングレートでサンプリン
グされた離散第１時間信号（ｘ₁ ）をコーディングする
方法であって、以下のステップを含む：第１の時間信号（ｘ₁ ）から、第２のサンプリングレー
トに相当するバンド幅の第２の時間信号（ｘ₂ ）を生成
するステップであって、第２のサンプリングレートは第
１のサンプリングレートに等しいかまたはそれより低い
ステップ；コード化された第２の信号（ｘ_2c）を得るために、第１
のコーディングアルゴリズムにより第２の時間信号（ｘ
₂ ）をコーディングするステップ；第２のサンプリング周波数に相当するバンド幅であるコ
ード化／デコード化された第２の時間信号（ｘ_2cd ）を
得るために、コード化された第２の信号（ｘ_2c）を第１
のコーディングアルゴリズムによりデコーディングする
ステップ；第１のスペクトル値（Ｘ₁ ）を得るために、第１の時間
信号（ｘ₁ ）を周波数ドメインに変換するステップ；第１のスペクトル値（Ｘ₁ ）から予測係数を計算するス
テップ；コード化／デコード化された第２の時間信号（ｘ_2cd ）
から第２のスペクトル値（Ｘ_2cd ）を生成するステップ
であって、第２のスペクトル値（Ｘ_2cd ）はコード化／
デコード化された第２の時間信号（ｘ_2cd ）の周波数ド
メインでの表示であるステップ；第１の残余スペクトル値及び第２の残余スペクトル値を
得るために、計算された予測係数を用いて、周波数に関
して第１のスペクトル値（Ｘ₁ ）及び第２のスペクトル
値（Ｘ_2cd ）の予測を行なうステップ；第１のスペクトル値（Ｘ₁ ）の数に相当する数である評
価された残余スペクトル値を得るために、第１の残余ス
ペクトル値を第２の残余スペクトル値で評価するステッ
プ；及びコード化され評価された残余スペクトル値を得るため
に、評価された残余スペクトル値（Ｘ_b ）を第２のコー
ディングアルゴリズムによりコーディングするステッ
プ。
【請求項３】オーディオ信号を表すビットストリーム
をデコーディングする方法であって、ビットストリーム
は、第１のコーディングアルゴリズムによりコード化さ
れた信号、第２のコーディングアルゴリズムによりコー
ド化された信号、及びサイド情報を有し、第２のコーデ
ィングアルゴリズムによりコード化された信号は、コー
ド化された残余スペクトル値を有し、残余スペクトル値
は、周波数に関する予測によって、評価されたスペクト
ル値から生成され、予測の予測係数は、サイド情報の中
に存在する方法であって、以下のステップを含む：コード化／デコード化された第２の時間信号（ｘ_2cd ）
を得るために、第１のコーディングアルゴリズムにより
コード化されたコード化信号（ｘ_2c）を、第１のコーデ
ィングアルゴリズムによりデコーディングするステッ
プ；残余スペクトル値を得るために、コード化された残余ス
ペクトル値を第２のコーディングアルゴリズムによりデ
コーディングするステップ；第２のスペクトル値（Ｘ_2cd ）を得るために、コード化
／デコード化された第２の時間信号（ｘ₂ ）を周波数ド
メインに変換するステップ；評価されたスペクトル値（Ｘ_b ）を得るために、サイド
情報中に存在する予測係数を用いて、評価された残余ス
ペクトル値に関して逆予測を行なうステップ；第１のスペクトル値（Ｘ₁ ）を得るために、評価された
スペクトル値（Ｘ_b ）及び第２のスペクトル値（Ｘ
_2cd ）を逆評価するステップ；及び第１の時間信号（ｘ₁ ）を得るために、第１のスペクト
ル値（Ｘ₁ ）を時間ドメインに変換して戻すステップ。
【請求項４】オーディオ信号を表すビットストリーム
をデコーディングする方法であって、ビットストリーム
は、第１のコーディングアルゴリズムによりコード化さ
れた信号、第２のコーディングアルゴリズムによりコー
ド化された信号、及びサイド情報を有し、第２のコーデ
ィングアルゴリズムによりコード化された信号は、コー
ド化された残余スペクトル値を有し、残余スペクトル値
は、周波数に関する予測によって、評価されたスペクト
ル値から生成され、予測の予測係数は、サイド情報中に
存在する方法であって、以下のステップを含む：コード化／デコード化された第２の時間信号（ｘ_2cd ）
を得るために、第１のコーディングアルゴリズムにより
コード化されたコード化信号（ｘ_2c）を、第１のコーデ
ィングアルゴリズムによりデコーディングするステッ
プ；残余スペクトル値を得るために、コード化された残余ス
ペクトル値を第２のコーディングアルゴリズムによりデ
コーディングするステップ；第２のスペクトル値（Ｘ_2cd ）を得るために、コード化
／デコード化された第２の時間信号（ｘ₂ ）を周波数ド
メインに変換するステップ；第２の残余スペクトル値を得るために、サイド情報中に
存在する予測係数を用いて、第２のスペクトル値（Ｘ
_2cd ）に関して予測を行なうステップ；残余スペクトル値を得るために、評価された残余スペク
トル値及び第２の残余スペクトル値を逆評価するステッ
プ；第１のスペクトル値（Ｘ₁ ）を得るために、サイド情報
中に蓄積されている予測係数を用いて、残余スペクトル
値に関して逆予測を行なうステップ；及び第１の時間信号（ｘ₁ ）を得るために、第１のスペクト
ル値（Ｘ₁ ）を時間ドメインに変換して戻すステップ。
【請求項５】第１のサンプリングレートでサンプリン
グされた離散第１時間信号（ｘ₁ ）をコーディングする
ための装置（１０）であって、以下の特徴を含む：第２のサンプリングレートに相当するバンド幅の第２の
時間信号（ｘ₂ ）を第１の時間信号（ｘ₁ ）から生成す
るためのデバイス（１２）であって、第２のサンプリン
グレートは第１のサンプリングレートに等しいかまたは
それより低いデバイス（１２）；コード化された第２の信号（ｘ_2c）を得るために、第２
の時間信号（ｘ₂ ）を第１のコーディングアルゴリズム
によりコーディングするためのデバイス（１４）；第２のサンプリング周波数に相当するバンド幅であるコ
ード化／デコード化された第２の時間信号（ｘ_2cd ）を
得るために、コード化された第２の信号（ｘ_2c）を第１
のコーディングアルゴリズムによりデコーディングする
ためのデバイス（１４）；第１のスペクトル値（Ｘ₁ ）を得るために、第１の時間
信号（ｘ₁ ）を周波数ドメインに変換するためのデバイ
ス（２４）；第１のスペクトル値（Ｘ₁ ）から予測係数を計算するた
めのデバイス（２５）；コード化／デコード化された第２の時間信号（ｘ_2cd ）
から第２のスペクトル値（Ｘ_2cd ）を生成するためのデ
バイス（２２，２３）であって、第２のスペクトル値
（Ｘ_2cd ）は、コード化／デコード化された第２の時間
信号（ｘ_2cd ）の周波数ドメインでの表示であるデバイ
ス（２２，２３）；第１のスペクトル値（Ｘ₁ ）の数に相当する数である評
価されたスペクトル値（Ｘ_b ）を得るために、第１のス
ペクトル値（Ｘ₁ ）を第２のスペクトル値（Ｘ_2cd ）で
評価するためのデバイス（２６，２８）；評価された残余スペクトル値を得るために、計算された
予測係数によって、周波数に関して評価されたスペクト
ル値の予測を行なうためのデバイス（２７）；及びコード化され評価された残余スペクトル値を得るため
に、評価された残余スペクトル値を第２のコーディング
アルゴリズムによりコーディングするためのデバイス
（３０）。
【請求項６】第１のサンプリングレートでサンプリン
グされた離散第１時間信号（ｘ₁ ）をコーディングする
ための装置（１０）であって、以下の特徴を含む：第２のサンプリングレートに相当するバンド幅である第
２の時間信号（ｘ₂ ）を、第１の時間信号（ｘ₁ ）から
生成するためのデバイス（１２）であって、第２のサン
プリングレートは、第１のサンプリングレートに等しい
かまたはそれより低いデバイス（１２）；コード化された第２の信号（ｘ_2c）を得るために、第２
の時間信号（ｘ₂ ）を第１のコーディングアルゴリズム
によりコーディングするためのデバイス（１４）；第２のサンプリング周波数に相当するバンド幅であるコ
ード化／デコード化された第２の時間信号（ｘ_2cd ）を
得るために、コード化された第２の信号（ｘ_2c）を第１
のコーディングアルゴリズムによりデコーディングする
ためのデバイス（１４）；第１のスペクトル値（Ｘ₁ ）を得るために、第１の時間
信号（ｘ₁ ）を周波数ドメインに変換するためのデバイ
ス（２４）；第１のスペクトル値（Ｘ₁ ）から予測係数を計算するた
めのデバイス（２５）；コード化／デコード化された第２の時間信号（ｘ_2cd ）
から第２のスペクトル値（Ｘ_2cd ）を生成するためのデ
バイス（２２，２３）であって、第２のスペクトル値
（Ｘ_2cd ）はコード化／デコード化された第２の時間信
号（ｘ_2cd ）の周波数ドメインでの表示であるデバイス
（２２，２３）；第１の残余スペクトル値及び第２の残余スペクトル値を
得るために、第１のスペクトル値（Ｘ₁ ）及び第２のス
ペクトル値（Ｘ_2cd ）の周波数に関する予測を、計算さ
れた予測係数を用いて行なうためのデバイス（２７）；第１のスペクトル値（Ｘ₁ ）の数に相当する数である評
価された残余スペクトル値を得るために、第１の残余ス
ペクトル値を第２の残余スペクトル値で評価するための
デバイス（２６，２８）；及びコード化され評価された残余スペクトル値を得るため
に、評価された残余スペクトル値（Ｘ_b ）を第２のコー
ディングアルゴリズムによりコーディングするためのデ
バイス（３０）。
【請求項７】オーディオ信号を表すビットストリーム
をデコーディングするための装置であって、ビットスト
リームは、第１のコーディングアルゴリズムによりコー
ド化された信号、第２のコーディングアルゴリズムによ
りコード化された信号、及びサイド情報を有し、第２の
コーディングアルゴリズムによりコード化された信号
は、コード化された残余スペクトル値を有し、残余スペ
クトル値は、評価されたスペクトル値から周波数に関す
る予測により生成され、予測の予測係数は、サイド情報
中に存在する装置であって、以下の特徴を含む：コード化／デコード化された第２の時間信号（ｘ_2cd ）
を得るために、第１のコーディングアルゴリズムにより
コード化されたコード化信号（ｘ_2c）を、第１のコーデ
ィングアルゴリズムによりデコーディングするためのデ
バイス（５０）；残余スペクトル値を得るために、コード化された残余ス
ペクトル値を第２のコーディングアルゴリズムによりデ
コーディングするためのデバイス（５４）；第２のスペクトル値（Ｘ_2cd ）を得るために、コード化
／デコード化された第２の時間信号（ｘ₂ ）を周波数ド
メインに変換するためのデバイス（６４）；評価されたスペクトル値（Ｘ_b ）を得るために、サイド
情報中に存在する予測係数を用いて、評価された残余ス
ペクトル値に関して逆予測を行なうためのデバイス（５
９）；第１のスペクトル値（Ｘ₁ ）を得るために、評価された
スペクトル値（Ｘ_b ）及び第２のスペクトル値（Ｘ
_2cd ）を逆評価するためのデバイス（６０，６２）；及
び第１の時間信号（ｘ₁ ）を得るために、第１のスペクト
ル値（Ｘ₁ ）を時間ドメインに変換して戻すためのデバ
イス（６６）。
【請求項８】オーディオ信号を表すビットストリーム
をデコーディングするための装置であって、ビットスト
リームは、第１のコーディングアルゴリズムによりコー
ド化された信号、第２のコーディングアルゴリズムによ
りコード化された信号、及びサイド情報を有し、第２の
コーディングアルゴリズムによりコード化された信号
は、コード化された残余スペクトル値を有し、残余スペ
クトル値は、評価されたスペクトル値から周波数に関す
る予測により生成され、予測の予測係数は、サイド情報
中に存在する装置であって、以下の特徴を含む：コード化／デコード化された第２の時間信号（ｘ_2cd ）
を得るために、第１のコーディングアルゴリズムにより
コード化されたコード化信号（ｘ_2c）を、第１のコーデ
ィングアルゴリズムによりデコーディングするためのデ
バイス（５０）；残余スペクトル値を得るために、コード化された残余ス
ペクトル値を第２のコーディングアルゴリズムによりデ
コーディングするためのデバイス（５４）；第２のスペクトル値（Ｘ_2cd ）を得るために、コード化
／デコード化された第２の時間信号（ｘ₂ ）を周波数ド
メインに変換するためのデバイス（６４）；第２の残余スペクトル値を得るために、サイド情報中に
存在する予測係数を用いて、第２のスペクトル値（Ｘ
_2cd ）に関する予測を行なうためのデバイス（２７）；残余スペクトル値を得るために、評価された残余スペク
トル値及び第２の残余スペクトル値を逆評価するための
デバイス（６０，６２）；第１のスペクトル値（Ｘ₁ ）を得るために、サイド情報
中に蓄積されている予測係数を用いて、残余スペクトル
値に関する逆予測を行なうためのデバイス（５９）；及
び第１の時間信号（ｘ₁ ）を得るために、第１のスペクト
ル値（Ｘ₁ ）を時間ドメインに変換して戻すためのデバ
イス（６０）。