JP3366903B2 - オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置 - Google Patents

オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置

Info

Publication number
JP3366903B2
JP3366903B2 JP2000518448A JP2000518448A JP3366903B2 JP 3366903 B2 JP3366903 B2 JP 3366903B2 JP 2000518448 A JP2000518448 A JP 2000518448A JP 2000518448 A JP2000518448 A JP 2000518448A JP 3366903 B2 JP3366903 B2 JP 3366903B2
Authority
JP
Japan
Prior art keywords
signal
coded
spectral value
spectral
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000518448A
Other languages
English (en)
Other versions
JP2001522156A (ja
Inventor
ベルンハルト グリル
ユルゲン ヘルレ
ボド タイヒマン
カールハインツ ブランデンブルク
ハインツ ゲルホイザー
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ filed Critical フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ
Publication of JP2001522156A publication Critical patent/JP2001522156A/ja
Application granted granted Critical
Publication of JP3366903B2 publication Critical patent/JP3366903B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth

Description

【発明の詳細な説明】
本願発明は、スケーラブルオーディオコーダ及びオー
ディオデコーダに関し、特に、少なくとも1段階が周波
数ドメインにおいて作動するスケーラブルコーダ及びデ
コーダに関する。 スケーラブルオーディオコーダは、モデュール構成の
コーダである。よって、たとえば8kHzでサンプリン
グされた信号を処理し、たとえば毎秒4.8から8キロ
ビットのデータレートを生成する既存のスピーチコーダ
を使用しようという努力がなされる。たとえば当業者に
知られているG.729、G.723、FS1016、
CELPまたはMPEG−4−Audio用のパラメト
リックモデル等のこれら公知のコーダは、通常8kHz
でサンプリングされた信号用に設計されており、最高4
kHzの可聴バンド幅しかコード化できないため、主に
話声信号をコード化するのに役立つのであり、一般によ
り高い音質の音楽信号のコード化には適していない。し
かしながら、一般にそれらは低いサンプリングレート
で、話声信号について良好な音質を示す。 スケーラブルコーダでの音楽信号のオーディオコーデ
ィングについて、たとえばHIFI品質またはCD品質
を達成するために、スピーチコーダと、たとえば48k
Hzのより高いサンプリングレートで信号をコード化す
ることが可能なオーディオコーダが組み合わせられる。
もちろん上記のスピーチコーダを、たとえばMPEG
1、MPEG2またはMPEG4の標準に従うミュージ
ック/オーディオコーダといった別のコーダに置き換え
ることも可能である。 この種のチェーン回路は、スピーチコーダ及びより高
品質のオーディオコーダを含む。たとえばサンプリング
レート48kHzの入力信号は、ダウンサンプリングフ
ィルタでスピーチコーダに適当なサンプリング周波数に
変換される。しかし、サンプリングレートは、また、両
方のコーダにおいて同じでもあり得る。変換された信号
は、その後コード化される。コード化された信号は、送
信のためにビットストリームフォーマッティングデバイ
スに直接与えられることが可能である。しかし、それは
たとえば最大でも4kHzのバンド幅の信号しか含まな
い。コード化された信号も再びデコード化され、アップ
サンプリングフィルタで変換される。しかし、ダウンサ
ンプリングフィルタのために、こうして得られた信号
は、たとえば4kHzのバンド幅の有用な情報しか含ん
でいない。加えて、4kHzより低いバンドにおける変
換されコード化/デコード化された信号のスペクトル内
容は、一般的なコーダがコーディングエラーを持ちこむ
ため、48kHzでサンプリングされた入力信号の最初
の4kHzバンドに正確に対応していないことを記して
おかなければならない。 既に述べたように、スケーラブルコーダは、周知のス
ピーチコーダと、より高いサンプリングレートで信号を
処理することが可能なオーディオコーダとを含む。4k
Hzより高い周波数の入力信号の信号成分を送信できる
ように、8kHzにおける入力信号とコード化/デコー
ド化され変換されたスピーチコーダの出力信号との差
が、各々個々の離散時間サンプリング値について形成さ
れる。この差は、その後、当業者に公知の方法で、公知
のオーディオコーダを用いて量子化及びコード化される
ことが可能である。ここで、コーディングエラーとは別
に、より高いサンプリングレートで信号をコード化する
ことが可能なオーディオコーダに与えられる差分信号
は、より低い周波数帯域では基本的にゼロである。上方
に変換されコード化/デコード化されたスピーチコーダ
の出力信号のバンド幅より上に位置するスペクトル域に
おいて、差分信号は、実質的に48kHzでの真の入力
信号に対応する。 第1の段階すなわちスピーチコーダの段階において、
一般にコード化された信号の非常に低いビットレートが
対象とされているので、低いサンプリング周波数のコー
ダが一般的に使用される。前述のコーダを含む多数のコ
ーダは、現在、数キロビット(2から8キロビットまた
はそれ以上)のビットレートで作動する。更に、この低
いビットレートではいずれにしろ不可能であるととも
に、計算の労力に関しては低いサンプリング周波数での
コード化がより有益であるため、これらは8kHzの最
大サンプリング周波数を可能にする。最大可能可聴バン
ド幅は4kHzであり、実際上約3.5kHzに制限さ
れている。バンド幅の改良が、更なる段階すなわちオー
ディオコーダの段階において達成されるのであれば、こ
の更なる段階は、より高いサンプリング周波数で作動し
なければならない。 データ量を更に減ずるための高品質オーディオコーデ
ィングにおけるいわゆるTNS技術の使用が、先般来公
知になりつつある(J.Herre,J.D.John
ston,“Enhancing the Perfo
rmance of Perceptual Audi
o Coders by Using Tempora
l Noise Shaping (TNS)”,10
1st AES Convention,Los An
geles 1996,Preprint 438
4)。TNS技術(TNS=テンポラルノイズシェイピ
ング)は、一般に、スペクトル値の予測コーディングに
よって、量子化ノイズの微細構造のテンポラルシェイピ
ングを可能にする。TNS技術は、時間ドメインと周波
数ドメイン間の二重性の一貫した適用に基づく。技術分
野においては、時間信号の自己相関関数が周波数ドメイ
ンに変換される際、まさにこの時間信号のスペクトルパ
ワー密度を与えることが知られている。これに関する二
重の事態が、信号のスペクトルの自己相関関数が形成さ
れ時間ドメインに変換される際に生じる。時間ドメイン
に変換または戻された自己相関関数は、また時間信号の
ヒルベルト包絡線のスクエアとも呼ばれる。よって、信
号のヒルベルト包絡線は、そのスペクトルの自己相関関
数と直接連結される。従って、信号のスクエアリングさ
れたヒルベルト包絡線及びそのスペクトルパワー密度
は、時間ドメインと周波数ドメインにおける二重の側面
を表す。信号のヒルベルト包絡線がある周波数の範囲に
関して各々部分的なバンドパス信号について一定のまま
であれば、隣接するスペクトル値との自己相関もまた一
定である。実は、これは一連のスペクトル係数が周波数
に対して定常であることを意味しており、そのため、予
測コーディング技術がこの信号を表すのに有効に使用さ
れ得るのであり、これは、更に言えば、予測係数の共通
のセットを用いることによる。 状況を明確にするために、図6A及び図6Bを参照す
る。図6Aは、持続時間が約40msの時間的に強く過
渡的な「カスタネット」信号の短区分を示す。この信号
は多重の部分的バンドパス信号に分解され、各部分的バ
ンドパス信号は、500Hzのバンド幅を有する。図6
Bは、中間周波数が1500Hzから4000Hzに渡
るこれらのバンドパス信号のヒルベルト包絡線を示す。
より事態を明らかにするために、全ての包絡線はそれら
の最大振幅に正規化されている。明らかに、全ての単一
の包絡線の形状は互いに非常に類似しており、それがこ
の周波数帯域内で信号を有効にコード化するために一般
的な予測器が使用できる理由である。人間の音声発生メ
カニズムの性質のために、全周波数帯域に渡って声門エ
キサイテーションパルスの効果が存在しているスピーチ
信号についても同様の考察がなされる。 よって、図6Bは、たとえば周波数2000Hzでの
隣接する値の相関関係が、たとえば周波数3000Hz
または1000Hzでのそれと類似していることを示
す。 その代わりに、過渡信号のスペクトル予測性の性質
は、図5の表を検討することにより理解され得る。表の
上左で、連続的な時間信号u(t)が正弦波の形で示さ
れる。この隣はこの信号のスペクトルU(f)であり、
単一のディラックパルスからなる。この信号の最適コー
ディングは、スペクトルデータまたはスペクトル値のコ
ーディングに存する。なぜなら、完全な時間信号につい
て、時間信号を完全に再構成できるように、ここではフ
ーリエ係数の振幅及び位相のみが送信されなければなら
ないからである。スペクトルデータのコーディングは、
同時に、時間ドメインにおける予測に対応する。よっ
て、ここでは時間ドメインにおいて予測コーディングが
起こらなければならないであろう。したがって、正弦の
時間信号は、平坦な時間包絡線を有し、それは周波数ド
メインにおける最も平坦でない包絡線に相当する。 次に、時間信号u(t)が時間ドメインにおいてディ
ラックパルスの形で最大に過渡的な信号であるという反
対の場合を検討する。時間ドメインにおけるディラック
パルスは「平坦な」パワースペクトルに相当し、一方、
位相スペクトルはパルスのタイムポジションに従って回
転する。この信号がたとえば変換コーディングまたはス
ペクトルデータのコーディングまたは時間ドメインデー
タの直線予測コーディング等の上述の従来の方法に対し
て問題を呈していることは明らかである。この信号は、
時間ドメインにおいて最良かつ最も効率的にコード化さ
れ得る。なぜなら、ディラックパルスの時間的位置及び
パワーのみが送信されなければならないからであり、そ
れは二重性の一貫した使用を通じて、周波数ドメインに
おける予測コーディングもまた効率的なコーディングに
適する方法を構成することを意味する。 周波数に関するスペクトル係数の予測コーディング
を、既に実施され上で引用した記事においても記述され
た、1つのブロックから次のブロックへのスペクトル係
数の予測の公知の二重性コンセプトと混同しないことは
非常に重要である(M.Bosi,K.Branden
burg,S.Quakenbusch,L.Fied
ler,K.Akagiri,H.Fuchs,M.D
ietz,J.Herre,G.Davidson,Y
oshiaki Oikawa:“ISO/IEC M
PEG−2 Advanced Audio Codi
ng,”101st AES Convention,
Los Angeles 1996,Preprint
4382)。時間に関する予測に相当する1つのブロ
ックから次のブロックへのスペクトル係数の予測におい
て、スペクトル分解能が増大し、一方周波数に関するス
ペクトル係数の予測は時間分解能を増大させる。従っ
て、たとえば1000Hzでのスペクトル係数は、同じ
ブロックまたはフレームにおけるたとえば900Hzで
のスペクトル係数から決定され得る。 そのため、上記の考察は、過渡信号の効率的なコーデ
ィング方法の達成へとつながった。時間と周波数ドメイ
ンの二重性を考慮して、予測コーディング技術は、ある
スペクトル係数から次のブロックにおける同じ周波数の
スペクトル係数への既に公知の予測と実質的に同様に扱
われることが可能である。ある信号のスペクトルパワー
密度及びスクエアリングされたヒルベルト包絡線は、互
いに二重であるため、従来の予測方法におけるようなス
ペクトル計測の平坦さではなく信号のスクエアリングさ
れた包絡線の計測の平坦さにより、残余信号エネルギー
の減少または予測利得が得られる。潜在コーディング利
得は、信号が過渡的になるほど増加する。 後方予測としても知られる閉ループの予測理論及び前
方予測としても知られる開ループの予測理論の両方が、
可能な予測理論として挙げられる。閉ループのスペクト
ル予測理論(後方予測)の場合、エラーの包絡線は平坦
である。別の表現をすれば、エラー信号のエネルギー
は、時間に関して均等に配分される。 しかし、前方予測の場合、図7に示されるように、量
子化によって持ちこまれたノイズのテンポラルシェイピ
ングがある。予測されるスペクトル係数x(f)が、加
算ポイント600に与えられる。同じスペクトル係数が
予測器610にも与えられ、その出力信号がまた負の記
号付きで加算ポイント600に与えられる。よって、量
子化器620への入力信号は、スペクトル値x(f)と
予測によって計算されたスペクトル値xp (f)との差
を表す。前方予測にとって、デコード化されたスペクト
ル係数データにおける合計エラーエネルギーは一定のま
まである。しかし、スペクトル係数に予測が加えられる
ことによって、量子化ノイズが時間的に実際の信号の下
に置かれてマスキングされ得るために、量子化エラー信
号の時間軸上の形状は、デコーダの出力ではテンポラル
シェイピングされているように見える。このようにし
て、たとえば過渡信号またはスピーチ信号の時間マスキ
ングの問題が避けられる。 よって、この種のスペクトル値の予測コーディング
は、TNSすなわちテンポラルノイズシェイピング技術
と呼ばれる。この技術を明確にする目的で、図8Aを参
照する。図8Aの上左では、強く過渡的な時間信号の時
間軸上の行動が示される。図8Aの上右でこの時間軸上
の行動曲線の反対側に示されているのは、DCTスペク
トルの区分である。図8Aの下左のグラフは、LPC
(LPC=直線予測コーディング)オペレーションによ
り計算されたTNS合成フィルタの結果として生ずる周
波数応答を示す。この図における(正規化された)周波
数座標は、時間ドメインと周波数ドメインの二重性のた
めに、時間座標に対応する。LPC計算は、明らかに入
力信号の「ソースモデル」を生成する。なぜなら、LP
C計算された合成フィルタの周波数応答は、強く過渡的
な時間信号の包絡線に似ているからである。周波数に関
する残余スペクトル値の表示すなわち図7の量子化器6
20の入力信号の表示は、図8Aの下右に示される。予
測後の残余スペクトル値と直接時間−周波数変換で得ら
れたスペクトル値との比較は、残余スペクトル値がもと
のスペクトル値よりもはるかに少ないエネルギーを有す
るということを示す。示された例において、残余スペク
トル値のエネルギー減少は、約12dBの合計予測利得
に相当する。 図8Aの下左のグラフに関して、以下の点について注
目すべきである。時間ドメイン信号に関する従来の予測
の使用について、合成フィルタの周波数応答は、入力信
号の振幅スペクトルの近似値である。合成フィルタは、
ほぼ「白色の」スペクトルで残余信号から、信号のスペ
クトル形状をある程度まで(再)生成する。TNS技術
の場合におけるように、スペクトル信号について予測が
用いられるとき、合成フィルタの周波数応答は、入力フ
ィルタの包絡線の近似値である。合成フィルタの周波数
応答は、従来の場合のようにパルス応答のフーリエ変換
の結果ではなく、逆フーリエ変換の結果である。TNS
合成フィルタは、ほぼ「白色の」(すなわち平坦な)包
絡線で残余信号から、いわば信号の包絡線の形状を
(再)生成する。よって、図8Aの下左のグラフは、T
NS合成フィルタによってかたどられたような入力信号
の包絡線を示す。これは、ここではその上の図において
示されるカスタネット信号の包絡線近似値の対数表示で
ある。 続いて、約13dBのSN比が、たとえば0.5バー
クの幅の各コーディングバンドにおいて生ずるように、
コーディングノイズが残余スペクトル値に導入された。
量子化ノイズの導入によって生ずる時間ドメインにおけ
るエラー信号は、図8Bに示される。図8Bの左側の図
は、TNS技術を用いた場合の量子化ノイズによるエラ
ー信号を示し、右側の図ではTNS技術が使用されてお
らず、よって比較できるようになっている。予想通り、
左側の図におけるエラー信号は、ブロック中で均等に配
分されておらず、この量子化ノイズを最適にマスキング
するであろうより高い信号内容が存在する領域に集中し
ている。一方、右側の場合では、導入された量子化ノイ
ズは、ブロックすなわち時間に関して均等に配分されて
おり、その結果、信号が全くまたはほとんど存在しない
前方の領域では、ノイズも存在し、それはおそらく可聴
であり、一方、高い信号内容が存在する領域では、比較
的小さなノイズが存在し、信号のマスキングの可能性が
完全には活用されていないということになる。 TNSフィルタ付きの単純なすなわち非スケーラブル
オーディオコーダが以下に記述される。 コーダにおけるTNSフィルタ804の実行が図9A
に示される。このフィルタは、解析フィルタバンク80
2と量子化器806の間に配置される。図9Aに示され
るコーダ用の離散時間入力信号がオーディオ入力800
に入力され、量子化されたオーディオ信号すなわち量子
化されたスペクトル値または量子化された残余スペクト
ル値が出力808で出力され、その後に冗長コーダが続
いてよい。そのため、入力信号はスペクトル値へと変換
される。計算されたスペクトル値に基づき、たとえばス
ペクトル値の自己相関マトリクスを形成しレヴィンソン
−ダービンリカージョンを用いることにより、正規直線
予測計算が行なわれる。図9Bは、TNSフィルタ80
4の詳細図を示す。スペクトル値x(1),・・・,x
(i),・・・,x(n)がフィルタ入力810に与え
られる。特定の周波数帯域のみが過渡信号を示す一方、
他の周波数帯域では主に静的であるということも起こり
得る。このことは、入力スイッチ812及び出力スイッ
チ814を通じて、TNSフィルタ804において許容
されているのであるが、これらのスイッチの主な機能
は、被処理データの並列−直列または直列−並列変換を
もたらすことである。特定の周波数帯域が不安定で、T
NS技術によって一定のコーディング利得が得られる見
込みがあるならば、このスペクトル域のみがTNS処理
されるのだが、これは入力スイッチ812がたとえばス
ペクトル値x(i)で始まり、たとえばスペクトル値x
(i+2)まで通過するということで達成される。フィ
ルタの内部領域もまた前方予測構造すなわち予測器61
0及び加算ポイント600を含む。 TNSフィルタのフィルタ係数を決定するためまたは
予測係数を決定するための計算は、次のように実行され
る。自己相関マトリクスの形成及びレヴィンソン−ダー
ビンリカージョンの適用が、たとえば20のノイズシェ
イピングフィルタの最高許容オーダーについて行なわれ
る。計算された予測利得が特定の閾値を超える場合、T
NS処理が作動する。 それから、現在のブロックについて使用されるノイズ
シェイピングフィルタのオーダーが、係数配列の末端か
ら十分に小さい絶対値の全ての係数の除去により決定さ
れる。これは、スピーチ信号について通常4〜12の範
囲内にある値のTNSフィルタのオーダーを生じさせ
る。 十分に高いコーディング利得がたとえばスペクトル値
x(i)の範囲について決定される場合、この範囲は処
理され、TNSスペクトルの出力でスペクトル値x
(i)の代わりに残余スペクトル値xR (i)が現れ
る。図8Aから分かるように、この残余値はもとのスペ
クトル値x(i)よりもはるかに小さい振幅を有する。
よって、正規サイド情報に加えて、デコーダに送信され
るサイド情報は、TNSの使用を示すフラグと、必要な
らば目的周波数帯域及びコーディングに使用されたTN
Sフィルタに関する情報を含む。フィルタデータは量子
化されたフィルタ係数として表示されることが可能であ
る。 次に、TNSフィルタ付きのコーダに類似して、逆T
NSフィルタ付きのデコーダが考慮される。 図10Aで示されるデコーダにおいて、TNSコーデ
ィングは各チャンネルについて反転される。残余スペク
トル値xR (i)は反量子化器216において再量子化
され、図10Bで詳細に構造を示す逆TNSフィルタ9
00に入力される。出力信号として、逆TNSフィルタ
900は、合成フィルタバンク218で時間ドメインに
変換されるスペクトル値を再び伝送する。TNSフィル
タ900は、入力スイッチ902と出力スイッチ908
を含み、それらもまた主に被処理データの並列−直列ま
たは直列−並列変換をもたらすものである。残余スペク
トル値だけを逆TNSコーディングの対象とし、TNS
コード化されていないスペクトル値は変更されないで出
力910にまで通過させられるように、入力スイッチ9
02もまた可能目的周波数帯域を考慮している。逆予測
フィルタは、予測器906と加算ポイント904を含
む。しかし、TNSフィルタとは対照的に、これらは以
下のように接続されている。残余スペクトル値は、入力
スイッチ902を介して加算ポイント904に達し、そ
こで予測器906の出力信号と加算される。出力信号と
して、予測器は推測スペクトル値xp (i)を供給す
る。スペクトル値x(i)は、出力スイッチを介して逆
TNSフィルタの出力で出力される。よって、TNS関
連のサイド情報は、デコーダにおいてデコード化され、
そのサイド情報は、TNSの使用を示すフラグと、必要
ならば目的周波数帯域に関する情報を含む。加えて、サ
イド情報は、あるブロックまたは「フレーム」をコード
化するために使用された予測フィルタのフィルタ係数を
含む。 よって、TNS方法は、以下のように要約される。入
力信号は、高分解能解析フィルタバンクによりスペクト
ル表示に変換される。それから、周波数に関して隣接す
るスペクトル値間の周波数ドメインで直線予測が行なわ
れる。この直線予測は、スペクトルドメインで行なわれ
るスペクトル値のフィルタリングのためのフィルタ工程
として解釈され得る。このようにして、もとのスペクト
ル値が予測エラーすなわち残余スペクトル値によって置
き換えられる。これらの残余スペクトル値は、正規のス
ペクトル値と全く同様に量子化及びコード化され、デコ
ーダに移送され、そこで値はデコード化され反量子化さ
れる。逆フィルタバンク(合成フィルタバンク)を使用
する前に、逆予測(逆とはコーダにおいて実行される予
測に対して)が、送信された予測エラー信号すなわち再
量子化された残余スペクトル値について逆予測フィルタ
が使用されるという方法で実行される。 この技術を使用することにより、量子化ノイズの時間
包絡線を入力信号のそれに整合させることが可能であ
る。これは、目立つ時間微細構造または目立つ過渡行動
を有する信号について、エラー信号のマスキングのより
良い活用を可能にする。過渡信号の場合、TNS技術
は、いわゆる「プレエコー」を避ける。これについては
そのような信号の「アタック」前に、量子化ノイズが既
に現れている。 既に述べたように、スケーラブルオーディオコーダに
おいて、一般的にコード化された信号の非常に低いビッ
トレートが求められるため、低いサンプリング周波数の
コーダが第1の段階で使用される。第2の段階では、よ
り高いビットレートでコード化するがより大きなバンド
幅を要し、そのためスピーチコーダよりもずった高い音
質でオーディオ信号をコード化することが可能なオーデ
ィオコーダがあることが好ましい。コード化され高いサ
ンプリングレートになったオーディオ信号は、通常、た
とえばダウンサンプリングフィルタを用いてまずより低
いサンプリングレートに低変換される。減少されたサン
プリングレート信号は、その後、第1段階のコーダに入
力され、このコーダの出力信号はスケーラブルオーディ
オコーダから現れるビットストリーム中に直接書き込ま
れる。この低いバンド幅を有するコード化された信号
は、再びデコード化され、それからたとえばアップサン
プリングフィルタを用いて高いサンプリングレートに戻
され、その後、周波数ドメインに変換される。同じく周
波数ドメインに変換されるのは、コーダの入力にもとも
と存在したオーディオ信号である。2つのオーディオ信
号がここで入手可能であるが、前者は第1段階のコーダ
のコーディングエラーを被っている。これら周波数ドメ
インの2つの信号は、2つの信号の差のみを表示する信
号を得るために、ここで差分エレメントに供給されるこ
とが可能である。後述する周波数選択スイッチとしても
実行可能なスイッチングモジュールにおいて、次に2つ
の入力信号の差を処理するのが良いか、または周波数ド
メインに変換されたもとのオーディオ信号を直接処理す
るのが良いか、決定することが可能である。いずれにし
ても、MPEG標準に従って機能する場合なら、心理音
響学モデルを考慮する量子化と、好ましくは量子化され
たスペクトル値でのハフマンコーディングを用いるエン
トロピーコーディングを続けて両方行なうような、たと
えば公知の量子化器/コーダに、スイッチングモジュー
ルの出力信号が与えられる。量子化器及びコーダの出力
信号は、第1段階のコーダの出力信号と共にビットスト
リームに書き込まれる。図10Aに示される構造を単純
に模倣するために、最初に記述したTNSフィルタのス
イッチングモジュールの直後、すなわち量子化器/コー
ダの前に配置するのが一見良いように思われるかも知れ
ない。しかし、この解決法の不都合は、スイッチングモ
ジュールの出力信号が、コーダの入力におけるもとの時
間オーディオ信号に関して大きく変更されており、その
結果TNSフィルタのフィルタ係数決定が同じ品質で適
用できないことである。 本願発明の目的は、スケーラブルコーディオコーダの
場合でもテンポラルノイズシェイピングが役立つよう
に、スケーラブルオーディオコーディングのコンセプト
とテンポラルノイズシェイピングのコンセプトを組み合
わせることである。 この目的は、請求項1または2によるコーディング方
法によって、請求項3または4によるデコーディング方
法によって、請求項5または6によるコーディング装置
によって、請求項7または8によるデコーディング装置
によって達成される。 本願発明は、TNSフィルタ係数または予測係数の決
定が、第1段階のコーダによる影響を受けていないスペ
クトル値に基づいて行なわれなければならないという洞
察に基づく。もちろん、スケーラブルオーディオコーダ
も、第1段階のコーダのように、明細書の導入部で引用
した変形のひとつを利用し得る順応性のあるコーダであ
るべきである。本願発明によると、TNS予測係数の決
定は、コーダの入力におけるオーディオ信号の直接表示
であるスペクトル値に基づいて行なわれる。フィルタバ
ンクまたはMDCTを使用することにより、オーディオ
コーダ入力信号のスペクトル表示が生成できる。しか
し、TNSコーディングフィルタによる実際のフィルタ
リングのように、コーダの同じ場所においてTNSフィ
ルタ係数の決定を行なうことはもはや不可能である。そ
のため、TNSフィルタ係数の決定は、実際のTNSコ
ーディングフィルタリングとは別に行なわれなければな
らない。 本願発明の第1の観点によると、TNSフィルタ係数
の決定は、もとのオーディオ入力信号を周波数ドメイン
に変換するフィルタバンクの直後で行なわれる。よっ
て、同種の信号すなわちTNS処理されていない信号
が、加算器またはスイッチングモジュールの前に存在す
る。本願発明の第1の観点によると、既に決定されたT
NS係数でのTNSフィルタリングが、スイッチングモ
ジュールの後及びおそらく心理音響学モデルに従って作
動する量子化器/コーダの前で起こる。しかし、後で明
らかになるように、このスケーラブルオーディオコーダ
におけるTNS技術の実行は、デコーダの変更を伴う。 しかし、本願発明の第2の観点によると、このデコー
ディングはもはや必要ではない。ここでは、TNS予測
係数が、第1の観点についてと同様に、再び同じ場所で
決定される。本願発明の第1の観点とは対照的に、2つ
の関連のスペクトル信号すなわち第1段階のコーディン
グエラーを伴うスペクトル信号及びオーディオ入力信号
の本質的に歪められていない表示であるスペクトル信号
が、加算エレメントの前で、前もって決定されたTNS
係数で作動するTNSコーディングフィルタにより処理
される。第1段階のコーダのコーディングエラーを負っ
たスペクトル信号のTNSフィルタリングが、エラーの
ないオーディオ信号に由来するTNS係数を単純に用い
るTNS係数の再決定なしに作動することに注目するの
は重要である。本願発明の第2の観点によれば、同種の
2つの信号すなわちここではTNS処理された信号は、
加算器またはスイッチングモジュールの入力において再
び存在する。 一般に、本願発明の第1及び第2の観点は、ある例で
はTNS処理されていない信号が加算器の前に存在する
のに対し、別の例では、TNS処理された信号が差分の
対象となるかまたはスイッチングモジュールに入力され
るという点で異なる。 記述された条件は、本願発明によるデコーダにおいて
考慮される。本願発明の第1の観点によりコード化され
た信号をデコード化するデコーダの場合、TNSデコー
ディング、すなわちビットストリームでサイド情報とし
て再び現れるコーディングの際に決定されたTNS係数
を使用するTNSデコーディングフィルタの使用は、ス
イッチングモジュールに類似した逆スイッチングモジュ
ールの前で起こる。コーダに関して、逆スイッチングモ
ジュールにTNS処理されていない信号が供給される
が、デコーダの場合もまた同様である。 一方、本願発明の第2の観点によりコード化された信
号をデコード化するデコーダの場合、逆スイッチングモ
ジュールにはTNS処理された信号が与えられる。この
目的のために、第1段階のコーダのデコード化された信
号は、周波数ドメインに変換され、コーダにおいて決定
されたTNSフィルタ係数を用いるTNSコーディング
フィルタによってフィルタリングされなければならな
い。本願発明の第2の観点によるコーダについてと原則
的に同様に、そのときだけ同種すなわちTNS処理され
た信号が、逆スイッチングモジュールまたはその前に配
置された加算器において比較される。逆スイッチングモ
ジュールの出力信号は、最終的にTNSデコーディング
フィルタに入力され、その出力信号は、全ての装置のコ
ーディングエラーから切り離してもとのオーディオ信号
を再生するために、その後、逆フィルタバンクにより処
理される。既に述べたように、本願発明の第2の観点に
よるコーダまたはデコーダが、本願発明の実施例では好
ましい。なぜなら、逆フィルタバンクの前にTNSデコ
ーディングフィルタまたは逆TNSフィルタが配置され
るので、デコーダにおける実質的な変更が必要でないか
らであり、これは図10Aの配置に対応する。 本願発明の実施例は、添付の図面を参照しながら以下
より詳細に記述される。 [図面の簡単な説明] 図1は、本願発明の第1の観点によるスケーラブルオ
ーディオコーダを示す。 図2は、本願発明の第2の観点によるスケーラブルオ
ーディオコーダを示す。 図3は、本願発明の第1の観点によるデコーダを示
す。 図4は、本願発明の第2の観点によるデコーダを示
す。 図5は、時間ドメインと周波数ドメインとの二重性を
解明する表を示す。 図6Aは、過渡信号の一例を示す。 図6Bは、図6Aに示される過渡時間信号に基づく部
分的なバンドパス信号のヒルベルト包絡線を示す。 図7は、周波数ドメインにおける予測の概略図であ
る。 図8Aは、TNS技術を解説するための一例を示す。 図8Bは、TNS技術を用いた場合(左)と用いてい
ない場合(右)の導入された量子化ノイズの時間軸上の
行動の比較を示す。 図9Aは、TNSフィルタ付きの非スケーラブルコー
ダの簡略化されたブロック図である。 図9Bは、図9AのTNSフィルタの詳細図である。 図10Aは、逆TNSフィルタ付きの非スケーラブル
デコーダの簡略化されたブロック図である。 図10Bは、図10Aの逆TNSフィルタの詳細図で
ある。
【発明の実施の形態】
図1は、本願発明のスケーラブルオーディオコーダの
概念ブロック図である。たとえば48kHzの第1のサ
ンプリングレートでサンプリングされた離散時間信号x
1 は、ダウンサンプリングフィルタ12により、たとえ
ば8kHzの第2のサンプリングレートに導かれ、第2
のサンプリングレートは第1のサンプリングレートより
も低い。第1と第2のサンプリングレートの比は、自然
数であることが好ましい。間引きフィルタとして実行さ
れてもよいダウンサンプリングフィルタ12の出力信号
は、第1のコーディングアルゴリズムによって入力信号
をコード化するコーダ/デコーダ14に入力される。既
に述べたように、コーダ/デコーダ14は、たとえば
G.729、G.723、FS1016、MPEG−4
CELP、MPEG−4 PAR等のより低いオーダ
ーのスピーチコーダでよい。そのようなコーダは、毎秒
4.8キロビットのデータレート(FS1016)か
ら、毎秒約8キロビットのデータレート(G.729)
で作動する。それらは全てサンプリング周波数8kHz
でサンプリングされた信号を処理する。しかし、当業者
にとっては、他のデータレートまたは他のサンプリング
周波数の他のどのコーダでも使用できることは自明であ
る。 コーダ14によってコード化された信号すなわちコー
ド化された第2の信号x2c、コーダ14に依存し上記の
ビットレートの1つで存在するビットストリームは、ラ
イン16を介してビットフォーマッタ18に入力され
る。ビットフォーマッタ18の機能は後述する。ダウン
サンプリングフィルタ12及びコーダ/デコーダ14
は、本願発明によるスケーラブルオーディオコーダの第
1の段階を構成する。 ライン16に出力されるコード化された第2の信号x
2cも、ライン20上にコード化/デコード化された第2
の時間信号x2cd を生成するために、第1のコーダ/デ
コーダ14で再びデコード化される。コード化/デコー
ド化された第2の時間信号x2cd は、第1の離散時間信
号x1 より低いバンド幅を有する離散時間信号である。
記述された数値的な例について、第1の離散時間信号x
1 は、サンプリング周波数が48kHzなので、最大2
4kHzのバンド幅を有する。コード化/デコード化さ
れた第2の時間信号x2cd は、ダウンサンプリングフィ
ルタ12が第1の時間信号x1 を間引きを通じて8kH
zのサンプリング周波数に変換したので、最大4kHz
のバンド幅を有する。0から4kHzのバンド幅内で、
信号x1 とx2cd は、コーダ/デコーダ14により持ち
こまれたコーディングエラーを除いては同じである。 ここで、コーダ14により持ちこまれたコーディング
エラーは常に小さなエラーとはかぎらず、たとえば強く
過渡的な信号が第1コーダでコード化される場合、それ
らは有用な信号と同じオーダーの振幅のものでもあり得
るということが指摘される。この理由で、後で説明する
ように、差分コーディングが合理的かどうか調べるため
にチェックが行なわれる。 コーダ/デコーダ14の出力での信号x2cd は、再び
高サンプリングレートに変換して戻すためにアップサン
プリングフィルタ23に入力され、その結果信号x1
比較可能になる。 アップサンプリングされた信号x2cd 及び信号x1
は、各々フィルタバンクFB1 22及びフィルタバン
クFB2 24に入力される。フィルタバンクFB1
22は、信号x2cd の周波数ドメイン表示であるスペク
トル値X2cd を生成する。一方、フィルタバンクFB2
は、もとの第1の時間信号x1 の周波数ドメイン表示で
あるスペクトル値X1 を生成する。2つフィルタバンク
の出力信号は、加算器26において減算される。より正
確には、フィルタバンクFB1 22の出力スペクトル
値X2cd は、フィルタバンクFB2 24の出力スペク
トル値から減算される。加算器26の次には、加算器2
6の出力信号Xd と、以後第1のスペクトル値X1 と呼
ばれるフィルタバンク24の出力信号X1 すなわち第1
の時間信号のスペクトル表示の両方が入力されるスイッ
チングモジュールSM 28が続く。 本願発明の第1の観点によると、スイッチングモジュ
ール28に続くTNSフィルタまたは予測フィルタ28
の予測係数は、TNS係数の計算のためのデバイス25
により計算される。TNS係数計算器25は、図1から
分かるように、TNSコーディングフィルタ27とビッ
トフォーマッタ18の両方に対して係数を与える。 TNSコーディングフィルタは、当業者には公知の心
理音響学モジュール32の記号で示される心理音響学モ
デルに従って量子化を行なう量子化器/コーダ30に入
力する。2つのフィルタバンク22、24、加算器2
6、スイッチングモジュール28、量子化器/コーダ3
0及び心理音響学モジュール32は、本願発明によるス
ケーラブルオーディオコーダの第2の段階を構成する。 以下において、スケーラブルオーディオコーダの動作
が図1を利用して説明される。前述のように、第1のサ
ンプリングレートでサンプリングされた離散第1時間信
号x1 は、第2のサンプリングレートに相当するバンド
幅の第2の時間信号x2 を生成するために、ダウンサン
プリングフィルタ12に入力され、第2のサンプリング
レートは、第1のサンプリングレートよりも低い。これ
らの第2の時間信号x2 から、コーダ/デコーダ14
は、第1のコーディングアルゴリズムに従って、第2の
コード化された時間信号x2cを生成し、また続く第1の
コーディングアルゴリズムによるデコーディングによっ
て、コード化/デコード化された第2の時間信号x2cd
を生成する。コード化/デコード化された第2の時間信
号x2cd の周波数ドメイン表示である第2のスペクトル
値X2cd を生成するために、コード化/デコード化され
た第2の時間信号x2cd は、第1のフィルタバンクFB
1 22により周波数ドメインに変換される。 ここで、コード化/デコード化された第2の時間信号
2cd は、第2のサンプリング周波数すなわち例におい
て8kHzの時間信号であることが指摘される。これら
の信号の周波数ドメイン表示及び第1のスペクトル値X
1 が評価されるが、第1のスペクトル値X1 は第1の時
間信号x1 から生成され、第2のフィルタバンクFB2
24により第1すなわち高いサンプリング周波数を示
す。同一の時間及び周波数分解能の比較信号を得るため
に、8kHz信号すなわち第2のサンプリング周波数の
信号が、第1のサンプリング周波数の信号に変換されな
ければならない。しかし、スケーラブルコーダにとっ
て、2つのサンプリング周波数が異なっているというの
は不可避ではなく、それらは同じ値でもあり得る。 これは、アップサンプリングフィルタを使用する代わ
りに、信号x2cd の個々の離散時間のスキャンされた値
の間に特定の数のゼロの値を挿入することによっても達
成できる。ゼロの値の数は、(第1のサンプリング周波
数対第2のサンプリング周波数の比)−1により求めら
れる。第1(高い)対第2(低い)のサンプリング周波
数の比は、アップサンプリングファクターと呼ばれる。
当業者には公知のように、ゼロの挿入は、非常に少ない
計算労力で可能であるが、信号x2cd においてエイリア
シング効果を生じさせ、その結果として、信号x2cd
低周波数または有用なスペクトルが反復され、反復の数
は挿入されたゼロの数に等しい。エイリアシングを被っ
た信号x2cd は、第2のスペクトル値X2cd を生成する
ために、第1のフィルタバンクFB1により周波数ドメ
インに変換される。 コード化/デコード化された第2の信号x2cd の各々
スキャンされた値の間にたとえば5つのゼロを挿入する
ことは、この信号の各6番目のスキャンされた値だけが
ゼロと異なることが最初から分かっている信号を生じさ
せる。この事実は、この信号をフィルタバンクまたはM
DCTによって、または任意のフーリエ変換によって、
周波数ドメインに変換する際に、利用できる。なぜな
ら、たとえば単純FFTで行なわれる特定の加算を省略
することができるからである。被変換信号の最初から分
かっている構造は、このように、信号を周波数ドメイン
に変換する際に計算時間を節約するという有利な方法で
利用され得る。 第2のスペクトル値X2cd は、より低い部分において
のみ、コード化/デコード化された第2の時間信号x
2cd の正しい表示であり、その理由で、全てのスペクト
ル線X2cd のうち1/(アップサンプリングファクタ
ー)部分だけがフィルタバンクFB1の出力で使用され
る。ここで、コード化/デコード化された第2の時間信
号x2cd におけるゼロの挿入のために、ここで使用され
るスペクトル線X2cd の数は、エイリアシング障害のな
い第1の時間信号x1 の周波数表示である第1のスペク
トル値X1 と同じ時間及び周波数分解能を有することが
指摘される。減算器26において、及びスイッチングモ
ジュール28において、2つの信号X2cd 及びX1 は、
評価されたスペクトル値Xb またはX1 を生成するため
に評価される。ここで、スイッチングモジュール28
は、いわゆるサイマルキャスト差分転換を実行する。 第2の段階において差分コーディングを用いることが
かならずしも有益とは限らない。これは、たとえば差分
信号すなわち加算器26の出力信号が第2のフィルタバ
ンクの出力信号X1 よりも高いエネルギーを有する場合
である。更に、任意のコーダが第1段階のコーダ/デコ
ーダ14に使用され得るので、コーダは、コード化しに
くい特定の信号を生成することもあり得る。コーダ/デ
コーダ14は、コード化した信号の位相情報を保存して
いることが好ましく、その工程は専門家により「ウェー
ブフォームコーディング」または「シグナルフォームコ
ーディング」と呼ばれている。差分コーディングかサイ
マルキャストコーディングのいずれが用いられるべきか
に関する第2段階のスイッチングモジュール28におけ
る決定は、周波数に基づいて行なわれる。 「差分コーディング」とは、第2のスペクトル値X
2cd と第1のスペクトル値X1 との差のみがコード化さ
れるという意味である。しかし、差分信号のエネルギー
内容が第1のスペクトル値X1 のエネルギー内容より大
きいために、そのような差分コーディングが有益でない
場合には、差分コーディングは使用されない。差分コー
ディングが使用されない場合は、例において48kHz
でサンプリングされた時間信号x1 の第1のスペクトル
値X1 は、スイッチングモジュール28によりつなが
れ、スイッチングモジュールSM 28の出力信号とし
て使用される。 差の形成が周波数ドメインで起こるので、サイマルキ
ャストコーディングと差分コーディング間の周波数選択
的選択を行うのに問題はない。なぜなら、2つの信号X
1 とX2cd の差は、いかなる場合でも計算されるからで
ある。よって、スペクトルにおける差の形成は、差分コ
ーディングされるべき周波数帯域の単純な周波数選択的
選択を可能にする。原則的には、各スペクトル値につい
て個々に差分コーディングからサイマルキャストコーデ
ィングへの転換が起こり得る。しかし、これはあまりに
も大量のサイド情報を要し、絶対に必要でもない。よっ
て、たとえば周波数グループにおける差分スペクトル値
のエネルギーと第1のスペクトル値のエネルギーを比較
する方が良い。その代わりに、たとえば8バンド、各5
00Hz幅毎というように、一定の周波数バンドを最初
から特定することも可能であり、時間信号x2 が4kH
zのバンド幅である場合、再び信号X2cd のバンド幅と
いう結果になる。周波数バンドを決める際の妥協点は、
送信されるサイド情報の量を平均させる、すなわちある
周波数バンドにおいて差分コーディングが活性か否か
は、可能なかぎり頻繁に差分コーディングが行なわれる
ことから生ずる利益に対して、比較考量することにあ
る。 たとえば各バンドにつき8ビット、差分コーディング
またはその他の適切なコーディングについてのオン/オ
フビット等のサイド情報は、ビットストリームにおいて
送信されることが可能であり、そのような情報はある特
定の周波数バンドが差分コーディングされたか否かを示
している。後述のデコーダにおいては、第1のコーダの
相当するサブバンドのみが、その後再構成の際に加えら
れる。 よって、第1のスペクトル値X1 と第2のスペクトル
値X2cd の評価のステップは、差分スペクトル値Xd
得るために、第1のスペクトル値X1 から第2のスペク
トル値X2cd の減算を含むことが好ましい。また、たと
えば8kHzにおける500Hz等の予め決定されたバ
ンドにおける多重のスペクトル値のエネルギーが、その
後たとえば加算やスクエアリングなどの公知の方法によ
り、差分スペクトル値Xd 及び第1のスペクトル値X1
について計算される。各々のエネルギーの周波数選択的
比較が、各周波数バンドにおいて行なわれる。差分スペ
クトル値Xd のある特定の周波数バンドにおけるエネル
ギーが、予め決められた因子kによって乗算された第1
のスペクトル値X1 のエネルギーを超えている場合、評
価されたスペクトル値Xb は第1のスペクトル値X1
あると決定される。そうでなければ、差分スペクトル値
d が、評価されたスペクトル値X1 であると決定され
る。因子kは、たとえば約0.1から10までの値であ
り得る。1より小さいkの値については、差分信号がも
との信号より低いエネルギーである場合、サイマルキャ
ストコーディングが既に使用されている。一方、1より
大きいkの値については、たとえ差分信号のエネルギー
内容が第1のコーダでコード化されていないもとの信号
のそれを既に上回っていても、差分コーディングが継続
して使用される。サイマルキャストコーディングが評価
される場合、スイッチングモジュール28は、第2のフ
ィルタバンク24の出力信号に直接つなぐ。前述の差の
形成の代わりの方法として、たとえば2つの引用された
信号について比が形成されたり、乗算その他の操作が行
なわれるという評価が行なわれることも可能である。 TNSコーディングフィルタ27は、スイッチングモ
ジュール28の出力に接続され、評価された残余スペク
トル値を得るために、TNS係数計算器25により評価
された予測係数を用いて、周波数に関して評価されたス
ペクトル値Xb の予測を行う。 評価された残余スペクトル値は、スイッチングモジュ
ール28により決定されたとおり、差分スペクトル値X
d または第1のスペクトル値X1 のいずれかに相当し、
当業者には公知であり心理音響学モデル32内に存在す
る心理音響学モデルを考慮して第1の量子化/コーダ3
0により量子化され、その後、好ましくはたとえばハフ
マンテーブルを用いる冗長減少コーディングによりコー
ド化される。当業者には公知のように、心理音響学モデ
ルは時間信号から計算され、図1から分かるように、そ
れが高いサンプリングレートの第1の時間信号x1 が心
理音響学モデル32に直接入力される理由である。量子
化器/コーダ30の出力信号Xcbは、ライン42でビッ
トフォーマッタ18へと直接導かれ、出力信号xAUS
書き込まれる。 ここまで第1及び第2の段階のスケーラブルオーディ
オコーダが記述された。本願発明によるスケーラブルオ
ーディオコーダのコンセプトは、また、3以上の段階の
カスケード接続も可能である。よって、たとえば48k
Hzでサンプリングされた入力信号x1 について、おお
よそ電話の通話品質に相当するデコーディング後の信号
品質を達成するために、サンプリングレートを減らすこ
とにより、第1のコーダ/デコーダ14において、最初
の4kHzのスペクトルをコード化することが可能であ
ろう。第2の段階において、おおよそHIFI品質に相
当する音質を達成するために、量子化器/コーダ30に
より実行される12kHzまでのバンド幅コーディング
が行なわれることが可能であろう。48kHzでサンプ
リングされた信号x1 が24kHzのバンド幅を有し得
ることは、当業者にとって自明である。付加量子化器/
コーダ38により実行される第3の段階は、おおよそコ
ンパクトディスク(CD)の音質に相当する音質を達成
するために、最大24kHz、または実際的な例ではた
とえば最高20kHzのバンド幅までのコーディングを
行なうことが可能であろう。 送信されなければならないサイド情報以外に、コード
化されたデータストリームxAUS は、以下の信号を含
む: − コード化された第2の信号x2c(0から4kHzの
全スペクトル);及び − コード化され評価された残余スペクトル値(サイマ
ルキャストコーディングで0から12kHzの全スペク
トルまたは差分コーディングでコーダ14の0から4k
Hzのコーディングエラー及び4から12kHzの全ス
ペクトル)。 例における第1のコーダ/デコーダ14から量子化器
/コーダ30への遷移において、遷移障害は4kHzか
ら4kHzより大きい値の遷移を伴うことがある。これ
らの遷移障害は、ビットストリームxAUS に書きこまれ
たエラーのスペクトル値の形で姿を現わす。全体のコー
ダ/デコーダは、たとえば1/(アップサンプリングフ
ァクター引くx)(x=1,2,3)までの周波数ライ
ンだけが使用されるように特定されることが可能であ
る。その結果、第2のサンプリング周波数で到達可能な
最大バンド幅の末端の信号X2cd の最終スペクトル線は
考慮に入れられない。暗に、これは評価関数が使用され
たことを意味し、引用された場合では、特定の周波数値
より上はゼロであり、これより下は1の値を有するとい
う矩形関数である。代わりに、遷移障害を有するスペク
トル線の振幅を減らす「よりソフトな」評価関数が用い
られることも可能であり、その後は減少された振幅のス
ペクトル線が考慮される。 遷移障害は、デコーダにおいて再び取り除かれるの
で、可聴ではないということが指摘される。しかし、遷
移障害は過分な差分信号へとつながる可能性があり、そ
の場合差分コーディングによるコーディング利得が減少
される。上述のような評価関数での評価により、コーデ
ィング利得の損失が制限できる。矩形関数以外の評価関
数は、矩形関数と同様に、コーダ及びデコーダにアプリ
オリに適合され得るので、付加的なサイド情報を必要と
しない。 図2は、本願発明の第2の観点により作動するコーダ
の実際上の実施を示す。図1と同じエレメントには同じ
参照番号を付しており、特別に言及されていないかぎ
り、同じ機能を実行する。既に説明したように、本願発
明の第2の観点は、変更が少なくて済むために、デコー
ダにとってより良いものである。図1のスケーラブルオ
ーディオコーダと対照的に、図2では、第2のTNSコ
ーディングフィルタ27が、位置22のフィルタバンク
1の後ろに配置される。更に、第1のTNSコーディン
グフィルタは、既にフィルタバンク2 24の後ろに位
置しており、これはデバイス26における加算器及びス
イッチングモジュール28が、TNS処理されたスペク
トル値すなわち第1の残余スペクトル値及び第2の残余
スペクトル値を処理することを意味する。スイッチング
モジュール28及び加算器26において、評価された残
余スペクトル値を得るために、第2の残余スペクトル値
で第1の残余スペクトル値が評価され、その後量子化器
/コード30に入力される。よって、図1でのように、
これは評価された残余スペクトル値を量子化及びコード
化する。TNS係数計算器25は、フィルタバンク24
の後ろのTNSコーダとフィルタバンク22の後ろのT
NSコーダの両方に入力し、フィルタバンク22の出力
信号は、TNSフィルタリングの対象となるが、それは
フィルタバンク24の出力信号から計算されたTNS係
数に基づいて行われる。図1でのように、ビットストリ
ームフォーマッタ18のTNS係数は、サイド情報とし
て供給される。 図3は、図1に示されるスケーラブルオーディオコー
ダによってコード化されたデータをデコーディングする
ためのデコーダを示す。図1のビットフォーマッタ18
の出力データストリームは、データストリームxAUS
ら図1のライン42及び16上の信号を得るために、デ
マルチプレクサ46に与えられる。コード化された第2
の信号x2cは遅延エレメント48に入力され、遅延エレ
メント48は、システムの他の側面のために必要とされ
本願発明の構成要素ではないデータに遅延を導入する。 遅延の後、コード化された第2の信号x2cは、図3に
示されるように、ライン52を介して出力されるコード
化/デコード化された第2の時間信号xcd2 を生成する
ために、図1のコーダ/デコーダ14においても実行さ
れる第1のコーディングアルゴリズムによりデコーディ
ングするデコーダ50に入力される。コード化され評価
された残余スペクトル値は、評価された残余スペクトル
値を得るために、再量子化器54により再量子化され
る。加算器58は、残余スペクトル値及び任意の更なる
レイヤー(破線で示される)の残余スペクトル値の合計
を形成する。 加算器26と同様に作動する加算器62の前で再び同
じ状態を作り出すために、加算器58の後にTNSデコ
ーディングフィルタ59が続く。TNSデコーディング
フィルタ59は、加算器58の出力信号に関して逆TN
Sフィルタリングを行なう。ここでは、サイド情報に含
まれる予測係数が使用されるが、これらは図2のTNS
係数計算器25によって計算されたものである。TNS
デコーダ59の出力には、デコード化され評価されたス
ペクトル値Xb が存在する。 ここで、図3から分かるように、コード化/デコード
化された第2の時間信号は、第2のスペクトル値X2cd
を得るために、まず適当なアップサンプリングフィルタ
63により変換され、フィルタバンク64により周波数
ドメインに変換されなければならないということが指摘
される。なぜなら、加算器62の加算はスペクトル値の
加算だからである。フィルタバンク64は、フィルタバ
ンクFB1 22及びFB2 24と同一であることが
好ましく、それによりただ1つの装置のみが実行されな
ければならないことになり、それには、適当なバッファ
が据え付けられ、連続して異なる信号が供給される。代
わりに、適切でありさえすれば、異なるフィルタバンク
が用いられてもよい。 既に述べたように、スペクトル値の量子化で用いられ
る情報は、心理音響学モジュール32により第1の時間
信号x1 から得られる。送信されるデータ量を減らすた
めに、できるだけ粗くスペクトル値を量子化するよう特
別な努力がなされる。一方、量子化により導入された障
害は可聴であるべきではない。心理音響学モジュール3
2に含まれそれ自体公知のモデルが、いかなる障害も可
聴でない量子化により導入され得る許容障害エネルギー
の計算に使用される。制御部は、許容障害より小さいか
それと等しい量子化障害を持ちこむ量子化を実行するた
めに、公知の量子化器/コーダにおける量子化器を制御
する。これは、たとえばブロック30に含まれる量子化
器により量子化された信号が再び反量子化されるという
方法で、公知のシステムにおいて常に監視される。量子
化器への入力信号と、量子化/反量子化された信号とを
比較することにより、量子化によって実際に導入された
障害エネルギーが計算される。量子化/反量子化された
信号の実際の障害エネルギーは、制御部において、許容
障害エネルギーと比較される。実際の障害エネルギーが
許容障害エネルギーより大きければ、量子化器内の制御
部は、量子化の精密度を増加させる。許容障害エネルギ
ーと実際の障害エネルギーとの比較は、典型的に心理音
響学周波数バンド毎に起こる。この方法は公知であり、
サイマルキャストコーディングが使用される場合、本願
発明によるスケーラブルオーディオコーダにより使用さ
れる。 いわゆるポストフィルタ67は、第1段階のデコーダ
に相当するデコーダの出力信号のある種のポストフィル
タリングを行なうことが可能であり、デコーダ50の出
力側に配置される。しかし、このフィルタは本願発明の
構成要素ではない。 図4は、図3のそれと同様のデコーダを示す。しか
し、図4に示すデコーダは、本願発明の第2の観点によ
るコード化された信号について作動する。図3とは対照
的に、逆スイッチングモジュール60は、TNSコード
化された入力信号に関して作動し、一方、図3の逆スイ
ッチングモジュール60は、非TNS処理された入力信
号すなわちTNSデコード化された信号に関して作動す
る。デコーダ50の出力信号は、どこにおいても、コー
ダにおいてでさえも、TNSコード化されていないの
で、図1及び図2のTNSコーディングフィルタ27と
同じ方法で実行されることが可能なTNSコーディング
フィルタ27によりフィルタリングされなければならな
い。本願発明の第2の観点によるデコーダにおいて、締
めくくりのTNSデコーディングフィルタ59は、フィ
ルタバンク22及び24のフィルタバンク操作を反転さ
せることが可能な逆フィルタバンク66の前に直接配置
される。変換コーダにおいて通常見られる図10Aに示
される配置に相当するので、この配置が好ましい。TN
Sデコーディングフィルタ59及びTNSコーディング
フィルタ27の両方に、デマルチプレクサ46がコード
化されたビットストリームxAUS のサイド情報から抽出
した予測係数が供給される。 図4によるデコーダにおける付加的なTNSコーディ
ングフィルタ27は、最小限により高い支出を表す。な
ぜなら、TNSフィルタパラメータ決定の間に確認され
たパラメータは、TNSデコーディングフィルタを計算
できるように、いかなる場合でも送信されるからであ
る。それはまたデコーダにおいてTNSコーディングフ
ィルタを計算するにも十分である。送信されたビットス
トリームにおいて変更は必要ない。 当業者にとって、第1のサンプリング周波数が48k
Hzであり第2のサンプリング周波数が8kHzである
ところの提示された実施例が、単なる例示であることは
自明である。8kHzより低い周波数が第2の低い方の
サンプリング周波数として用いられてもよい。全体のシ
ステムのサンプリング周波数としては、48kHz、4
4.1kHz、32kHz、24kHz、22.05k
Hz、16kHz、8kHzまたはその他の適当なサン
プリング周波数が使用されてよい。第1の段階のコーダ
/デコーダ14のビットレート範囲は、既に述べたよう
に、毎秒4.8kbitから毎秒8kbitまででよ
い。第2の段階の第2のコーダのビットレートの範囲
は、サンプリングレート48、44.1、32、24、
16及び8kHzで、毎秒0から64、69.659、
96、128、192及び256kbitでよい。第3
の段階のコーダのビットレート範囲は、全てのサンプリ
ングレートについて毎秒8kbitから毎秒448kb
itでよい。
フロントページの続き (72)発明者 タイヒマン ボド ドイツ連邦共和国 D−90427 ニュル ンベルク エバマンシュテター シュト ラーセ 2 (72)発明者 ブランデンブルク カールハインツ ドイツ連邦共和国 D−91054 エアラ ンゲン ハーグシュトラーセ 32 (72)発明者 ゲルホイザー ハインツ ドイツ連邦共和国 D−91344 ヴァイ シェンフェルト ザウゲンドルフ 17 (56)参考文献 特開 平8−330973(JP,A) 特開 平3−144700(JP,A) 特開 平6−69810(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/00

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1のサンプリングレートでサンプリン
    グされた離散第1時間信号(x1 )をコーディングする
    方法であって、以下のステップを含む: 第1の時間信号(x1 )から、第2のサンプリングレー
    トに相当するバンド幅である第2の時間信号(x2 )を
    生成するステップであって、第2のサンプリングレート
    は第1のサンプリングレートに等しいかまたはそれより
    低いステップ; コード化された第2の信号(x2c)を得るために、第1
    のコーディングアルゴリズムにより第2の時間信号(x
    2 )をコーディングするステップ; 第2のサンプリング周波数に相当するバンド幅であるコ
    ード化/デコード化された第2の時間信号(x2cd )を
    得るために、コード化された第2の信号(x2c)を第1
    のコーディングアルゴリズムによりデコーディングする
    ステップ; 第1のスペクトル値(X1 )を得るために、第1の時間
    信号(x1 )を周波数ドメインに変換するステップ; 第1のスペクトル値(X1 )から予測係数を計算するス
    テップ; コード化/デコード化された第2の時間信号(x2cd
    から第2のスペクトル値(X2cd )を生成するステップ
    であって、第2のスペクトル値(X2cd )はコード化/
    デコード化された第2の時間信号(x2cd )の周波数ド
    メインでの表示であるステップ; 第1のスペクトル値(X1 )の数に相当する数である評
    価されたスペクトル値(Xb )を得るために、第1のス
    ペクトル値(X1 )を第2のスペクトル値(X2cd )で
    評価するステップ; 評価された残余スペクトル値を得るために、計算された
    予測係数によって、周波数に関して評価されたスペクト
    ル値の予測を行なうステップ;及び コード化され評価された残余スペクトル値を得るため
    に、評価された残余スペクトル値を、第2のコーディン
    グアルゴリズムによってコーディングするステップ。
  2. 【請求項2】 第1のサンプリングレートでサンプリン
    グされた離散第1時間信号(x1 )をコーディングする
    方法であって、以下のステップを含む: 第1の時間信号(x1 )から、第2のサンプリングレー
    トに相当するバンド幅の第2の時間信号(x2 )を生成
    するステップであって、第2のサンプリングレートは第
    1のサンプリングレートに等しいかまたはそれより低い
    ステップ; コード化された第2の信号(x2c)を得るために、第1
    のコーディングアルゴリズムにより第2の時間信号(x
    2 )をコーディングするステップ; 第2のサンプリング周波数に相当するバンド幅であるコ
    ード化/デコード化された第2の時間信号(x2cd )を
    得るために、コード化された第2の信号(x2c)を第1
    のコーディングアルゴリズムによりデコーディングする
    ステップ; 第1のスペクトル値(X1 )を得るために、第1の時間
    信号(x1 )を周波数ドメインに変換するステップ; 第1のスペクトル値(X1 )から予測係数を計算するス
    テップ; コード化/デコード化された第2の時間信号(x2cd
    から第2のスペクトル値(X2cd )を生成するステップ
    であって、第2のスペクトル値(X2cd )はコード化/
    デコード化された第2の時間信号(x2cd )の周波数ド
    メインでの表示であるステップ; 第1の残余スペクトル値及び第2の残余スペクトル値を
    得るために、計算された予測係数を用いて、周波数に関
    して第1のスペクトル値(X1 )及び第2のスペクトル
    値(X2cd )の予測を行なうステップ; 第1のスペクトル値(X1 )の数に相当する数である評
    価された残余スペクトル値を得るために、第1の残余ス
    ペクトル値を第2の残余スペクトル値で評価するステッ
    プ;及び コード化され評価された残余スペクトル値を得るため
    に、評価された残余スペクトル値(Xb )を第2のコー
    ディングアルゴリズムによりコーディングするステッ
    プ。
  3. 【請求項3】 オーディオ信号を表すビットストリーム
    をデコーディングする方法であって、ビットストリーム
    は、第1のコーディングアルゴリズムによりコード化さ
    れた信号、第2のコーディングアルゴリズムによりコー
    ド化された信号、及びサイド情報を有し、第2のコーデ
    ィングアルゴリズムによりコード化された信号は、コー
    ド化された残余スペクトル値を有し、残余スペクトル値
    は、周波数に関する予測によって、評価されたスペクト
    ル値から生成され、予測の予測係数は、サイド情報の中
    に存在する方法であって、以下のステップを含む: コード化/デコード化された第2の時間信号(x2cd
    を得るために、第1のコーディングアルゴリズムにより
    コード化されたコード化信号(x2c)を、第1のコーデ
    ィングアルゴリズムによりデコーディングするステッ
    プ; 残余スペクトル値を得るために、コード化された残余ス
    ペクトル値を第2のコーディングアルゴリズムによりデ
    コーディングするステップ; 第2のスペクトル値(X2cd )を得るために、コード化
    /デコード化された第2の時間信号(x2 )を周波数ド
    メインに変換するステップ; 評価されたスペクトル値(Xb )を得るために、サイド
    情報中に存在する予測係数を用いて、評価された残余ス
    ペクトル値に関して逆予測を行なうステップ; 第1のスペクトル値(X1 )を得るために、評価された
    スペクトル値(Xb )及び第2のスペクトル値(X
    2cd )を逆評価するステップ;及び 第1の時間信号(x1 )を得るために、第1のスペクト
    ル値(X1 )を時間ドメインに変換して戻すステップ。
  4. 【請求項4】 オーディオ信号を表すビットストリーム
    をデコーディングする方法であって、ビットストリーム
    は、第1のコーディングアルゴリズムによりコード化さ
    れた信号、第2のコーディングアルゴリズムによりコー
    ド化された信号、及びサイド情報を有し、第2のコーデ
    ィングアルゴリズムによりコード化された信号は、コー
    ド化された残余スペクトル値を有し、残余スペクトル値
    は、周波数に関する予測によって、評価されたスペクト
    ル値から生成され、予測の予測係数は、サイド情報中に
    存在する方法であって、以下のステップを含む: コード化/デコード化された第2の時間信号(x2cd
    を得るために、第1のコーディングアルゴリズムにより
    コード化されたコード化信号(x2c)を、第1のコーデ
    ィングアルゴリズムによりデコーディングするステッ
    プ; 残余スペクトル値を得るために、コード化された残余ス
    ペクトル値を第2のコーディングアルゴリズムによりデ
    コーディングするステップ; 第2のスペクトル値(X2cd )を得るために、コード化
    /デコード化された第2の時間信号(x2 )を周波数ド
    メインに変換するステップ; 第2の残余スペクトル値を得るために、サイド情報中に
    存在する予測係数を用いて、第2のスペクトル値(X
    2cd )に関して予測を行なうステップ; 残余スペクトル値を得るために、評価された残余スペク
    トル値及び第2の残余スペクトル値を逆評価するステッ
    プ; 第1のスペクトル値(X1 )を得るために、サイド情報
    中に蓄積されている予測係数を用いて、残余スペクトル
    値に関して逆予測を行なうステップ;及び 第1の時間信号(x1 )を得るために、第1のスペクト
    ル値(X1 )を時間ドメインに変換して戻すステップ。
  5. 【請求項5】 第1のサンプリングレートでサンプリン
    グされた離散第1時間信号(x1 )をコーディングする
    ための装置(10)であって、以下の特徴を含む: 第2のサンプリングレートに相当するバンド幅の第2の
    時間信号(x2 )を第1の時間信号(x1 )から生成す
    るためのデバイス(12)であって、第2のサンプリン
    グレートは第1のサンプリングレートに等しいかまたは
    それより低いデバイス(12); コード化された第2の信号(x2c)を得るために、第2
    の時間信号(x2 )を第1のコーディングアルゴリズム
    によりコーディングするためのデバイス(14); 第2のサンプリング周波数に相当するバンド幅であるコ
    ード化/デコード化された第2の時間信号(x2cd )を
    得るために、コード化された第2の信号(x2c)を第1
    のコーディングアルゴリズムによりデコーディングする
    ためのデバイス(14); 第1のスペクトル値(X1 )を得るために、第1の時間
    信号(x1 )を周波数ドメインに変換するためのデバイ
    ス(24); 第1のスペクトル値(X1 )から予測係数を計算するた
    めのデバイス(25); コード化/デコード化された第2の時間信号(x2cd
    から第2のスペクトル値(X2cd )を生成するためのデ
    バイス(22,23)であって、第2のスペクトル値
    (X2cd )は、コード化/デコード化された第2の時間
    信号(x2cd )の周波数ドメインでの表示であるデバイ
    ス(22,23); 第1のスペクトル値(X1 )の数に相当する数である評
    価されたスペクトル値(Xb )を得るために、第1のス
    ペクトル値(X1 )を第2のスペクトル値(X2cd )で
    評価するためのデバイス(26,28); 評価された残余スペクトル値を得るために、計算された
    予測係数によって、周波数に関して評価されたスペクト
    ル値の予測を行なうためのデバイス(27);及び コード化され評価された残余スペクトル値を得るため
    に、評価された残余スペクトル値を第2のコーディング
    アルゴリズムによりコーディングするためのデバイス
    (30)。
  6. 【請求項6】 第1のサンプリングレートでサンプリン
    グされた離散第1時間信号(x1 )をコーディングする
    ための装置(10)であって、以下の特徴を含む: 第2のサンプリングレートに相当するバンド幅である第
    2の時間信号(x2 )を、第1の時間信号(x1 )から
    生成するためのデバイス(12)であって、第2のサン
    プリングレートは、第1のサンプリングレートに等しい
    かまたはそれより低いデバイス(12); コード化された第2の信号(x2c)を得るために、第2
    の時間信号(x2 )を第1のコーディングアルゴリズム
    によりコーディングするためのデバイス(14); 第2のサンプリング周波数に相当するバンド幅であるコ
    ード化/デコード化された第2の時間信号(x2cd )を
    得るために、コード化された第2の信号(x2c)を第1
    のコーディングアルゴリズムによりデコーディングする
    ためのデバイス(14); 第1のスペクトル値(X1 )を得るために、第1の時間
    信号(x1 )を周波数ドメインに変換するためのデバイ
    ス(24); 第1のスペクトル値(X1 )から予測係数を計算するた
    めのデバイス(25); コード化/デコード化された第2の時間信号(x2cd
    から第2のスペクトル値(X2cd )を生成するためのデ
    バイス(22,23)であって、第2のスペクトル値
    (X2cd )はコード化/デコード化された第2の時間信
    号(x2cd )の周波数ドメインでの表示であるデバイス
    (22,23); 第1の残余スペクトル値及び第2の残余スペクトル値を
    得るために、第1のスペクトル値(X1 )及び第2のス
    ペクトル値(X2cd )の周波数に関する予測を、計算さ
    れた予測係数を用いて行なうためのデバイス(27); 第1のスペクトル値(X1 )の数に相当する数である評
    価された残余スペクトル値を得るために、第1の残余ス
    ペクトル値を第2の残余スペクトル値で評価するための
    デバイス(26,28);及び コード化され評価された残余スペクトル値を得るため
    に、評価された残余スペクトル値(Xb )を第2のコー
    ディングアルゴリズムによりコーディングするためのデ
    バイス(30)。
  7. 【請求項7】 オーディオ信号を表すビットストリーム
    をデコーディングするための装置であって、ビットスト
    リームは、第1のコーディングアルゴリズムによりコー
    ド化された信号、第2のコーディングアルゴリズムによ
    りコード化された信号、及びサイド情報を有し、第2の
    コーディングアルゴリズムによりコード化された信号
    は、コード化された残余スペクトル値を有し、残余スペ
    クトル値は、評価されたスペクトル値から周波数に関す
    る予測により生成され、予測の予測係数は、サイド情報
    中に存在する装置であって、以下の特徴を含む: コード化/デコード化された第2の時間信号(x2cd
    を得るために、第1のコーディングアルゴリズムにより
    コード化されたコード化信号(x2c)を、第1のコーデ
    ィングアルゴリズムによりデコーディングするためのデ
    バイス(50); 残余スペクトル値を得るために、コード化された残余ス
    ペクトル値を第2のコーディングアルゴリズムによりデ
    コーディングするためのデバイス(54); 第2のスペクトル値(X2cd )を得るために、コード化
    /デコード化された第2の時間信号(x2 )を周波数ド
    メインに変換するためのデバイス(64); 評価されたスペクトル値(Xb )を得るために、サイド
    情報中に存在する予測係数を用いて、評価された残余ス
    ペクトル値に関して逆予測を行なうためのデバイス(5
    9); 第1のスペクトル値(X1 )を得るために、評価された
    スペクトル値(Xb )及び第2のスペクトル値(X
    2cd )を逆評価するためのデバイス(60,62);及
    び 第1の時間信号(x1 )を得るために、第1のスペクト
    ル値(X1 )を時間ドメインに変換して戻すためのデバ
    イス(66)。
  8. 【請求項8】 オーディオ信号を表すビットストリーム
    をデコーディングするための装置であって、ビットスト
    リームは、第1のコーディングアルゴリズムによりコー
    ド化された信号、第2のコーディングアルゴリズムによ
    りコード化された信号、及びサイド情報を有し、第2の
    コーディングアルゴリズムによりコード化された信号
    は、コード化された残余スペクトル値を有し、残余スペ
    クトル値は、評価されたスペクトル値から周波数に関す
    る予測により生成され、予測の予測係数は、サイド情報
    中に存在する装置であって、以下の特徴を含む: コード化/デコード化された第2の時間信号(x2cd
    を得るために、第1のコーディングアルゴリズムにより
    コード化されたコード化信号(x2c)を、第1のコーデ
    ィングアルゴリズムによりデコーディングするためのデ
    バイス(50); 残余スペクトル値を得るために、コード化された残余ス
    ペクトル値を第2のコーディングアルゴリズムによりデ
    コーディングするためのデバイス(54); 第2のスペクトル値(X2cd )を得るために、コード化
    /デコード化された第2の時間信号(x2 )を周波数ド
    メインに変換するためのデバイス(64); 第2の残余スペクトル値を得るために、サイド情報中に
    存在する予測係数を用いて、第2のスペクトル値(X
    2cd )に関する予測を行なうためのデバイス(27); 残余スペクトル値を得るために、評価された残余スペク
    トル値及び第2の残余スペクトル値を逆評価するための
    デバイス(60,62); 第1のスペクトル値(X1 )を得るために、サイド情報
    中に蓄積されている予測係数を用いて、残余スペクトル
    値に関する逆予測を行なうためのデバイス(59);及
    び 第1の時間信号(x1 )を得るために、第1のスペクト
    ル値(X1 )を時間ドメインに変換して戻すためのデバ
    イス(60)。
JP2000518448A 1997-10-24 1998-07-07 オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置 Expired - Lifetime JP3366903B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19747132.3 1997-10-24
DE19747132A DE19747132C2 (de) 1997-10-24 1997-10-24 Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
PCT/EP1998/004200 WO1999022451A2 (de) 1997-10-24 1998-07-07 Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms

Publications (2)

Publication Number Publication Date
JP2001522156A JP2001522156A (ja) 2001-11-13
JP3366903B2 true JP3366903B2 (ja) 2003-01-14

Family

ID=7846578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000518448A Expired - Lifetime JP3366903B2 (ja) 1997-10-24 1998-07-07 オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置

Country Status (9)

Country Link
US (1) US6502069B1 (ja)
EP (1) EP1025646B1 (ja)
JP (1) JP3366903B2 (ja)
KR (1) KR100331166B1 (ja)
AT (1) ATE206252T1 (ja)
AU (1) AU726762B2 (ja)
CA (1) CA2301663C (ja)
DE (2) DE19747132C2 (ja)
WO (1) WO1999022451A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9779744B2 (en) 2009-04-03 2017-10-03 Ntt Docomo, Inc. Speech decoder with high-band generation and temporal envelope shaping

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
WO2001069593A1 (en) 2000-03-15 2001-09-20 Koninklijke Philips Electronics N.V. Laguerre fonction for audio coding
US6735561B1 (en) 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
SG99314A1 (en) * 2000-07-19 2003-10-27 Ct For Signal Proc Nanyang Tec Method and apparatus for the prediction of audio signals
JP4538705B2 (ja) * 2000-08-02 2010-09-08 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
KR100927842B1 (ko) * 2001-04-18 2009-11-23 아이피지 일렉트로닉스 503 리미티드 오디오 신호를 인코딩하고 디코딩하는 방법, 오디오 코더, 오디오 플레이어, 그러한 오디오 코더와 그러한 오디오 플레이어를 포함하는 오디오 시스템 및 오디오 스트림을 저장하기 위한 저장 매체
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
US7970606B2 (en) 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US8359197B2 (en) * 2003-04-01 2013-01-22 Digital Voice Systems, Inc. Half-rate vocoder
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
AU2012205170B2 (en) * 2004-08-25 2015-05-14 Dolby Laboratories Licensing Corporation Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
JP5154934B2 (ja) * 2004-09-17 2013-02-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚的歪みを最小化する結合オーディオ符号化
US7554989B2 (en) * 2005-01-18 2009-06-30 Creative Technology Ltd. Real time optimization over a shared communication channel
KR100738077B1 (ko) * 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
DE102006010390A1 (de) * 2006-03-03 2007-09-06 Micronas Gmbh Verfahren zum Bereitstellen eines Gesamtsignals zum Übertragen als ein Rundfunksignal, Sendevorrichtung und Empfangsvorrichtung dafür
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
ES2362920T3 (es) * 2006-03-28 2011-07-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
US8036886B2 (en) 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
KR101425354B1 (ko) * 2007-08-28 2014-08-06 삼성전자주식회사 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
US8614994B2 (en) * 2009-07-09 2013-12-24 Broadcom Corporation Method and system for implementing multiple timing domains for primary and secondary synchronization detection in EUTRA/LTE
US8781844B2 (en) * 2009-09-25 2014-07-15 Nokia Corporation Audio coding
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
CN102884570B (zh) 2010-04-09 2015-06-17 杜比国际公司 基于mdct的复数预测立体声编码
US8891775B2 (en) * 2011-05-09 2014-11-18 Dolby International Ab Method and encoder for processing a digital stereo audio signal
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
LT3511935T (lt) 2014-04-17 2021-01-11 Voiceage Evs Llc Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
CN112311480B (zh) * 2020-10-29 2023-03-14 上海电机学院 一种通信辐射源个体识别方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310480C2 (de) * 1983-03-23 1986-02-13 Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen Digitales Codierverfahren für Audiosignale
DE19537338C2 (de) * 1995-10-06 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren von Audiosignalen
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
US6161089A (en) * 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9779744B2 (en) 2009-04-03 2017-10-03 Ntt Docomo, Inc. Speech decoder with high-band generation and temporal envelope shaping
US10366696B2 (en) 2009-04-03 2019-07-30 Ntt Docomo, Inc. Speech decoder with high-band generation and temporal envelope shaping

Also Published As

Publication number Publication date
EP1025646B1 (de) 2001-09-26
EP1025646A2 (de) 2000-08-09
WO1999022451A2 (de) 1999-05-06
AU726762B2 (en) 2000-11-23
ATE206252T1 (de) 2001-10-15
KR20010015588A (ko) 2001-02-26
CA2301663C (en) 2004-06-15
DE59801589D1 (de) 2001-10-31
KR100331166B1 (ko) 2002-04-03
DE19747132A1 (de) 1999-04-29
CA2301663A1 (en) 1999-05-06
WO1999022451A3 (de) 1999-07-29
DE19747132C2 (de) 2002-11-28
US6502069B1 (en) 2002-12-31
AU8857798A (en) 1999-05-17
JP2001522156A (ja) 2001-11-13

Similar Documents

Publication Publication Date Title
JP3366903B2 (ja) オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置
JP3577324B2 (ja) オーディオ信号の符号化方法
US6104996A (en) Audio coding with low-order adaptive prediction of transients
KR100304055B1 (ko) 음성 신호 부호화동안 잡음 대체를 신호로 알리는 방법
JP3391686B2 (ja) 符号化されたオーディオ信号を復号する方法及び装置
Allamanche et al. MPEG-4 low delay audio coding based on the AAC codec
JP3420250B2 (ja) 離散信号のコード化およびコード化された離散信号のデコード化のための各方法および各装置
EP1111589B1 (en) Wideband speech coding with parametric coding of high frequency component
WO1994028633A1 (fr) Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
KR20080103088A (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
KR20100007651A (ko) 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
Jayant High-quality coding of telephone speech and wideband audio
Koishida et al. A 16-kbit/s bandwidth scalable audio coder based on the G. 729 standard
Ramprashad A two stage hybrid embedded speech/audio coding structure
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
Iwakami et al. Audio coding using transform‐domain weighted interleave vector quantization (twin VQ)
JPH0653911A (ja) 音声データ符号化方法及び音声データ符号化装置
Esteban et al. 9.6/7.2 kbps voice excited predictive coder (VEPC)
Ganapathy et al. Autoregressive models of amplitude modulations in audio compression
Motlicek et al. Wide-band audio coding based on frequency-domain linear prediction
JP3465698B2 (ja) 信号復号化方法及び装置
Ning et al. Wideband audio compression using a combined wavelet and WLPC representation
Herre et al. Perceptual audio coding of speech signals
Ning et al. A new audio coder using a warped linear prediction model and the wavelet transform

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071101

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081101

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101101

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111101

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121101

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131101

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term