JP2001522156A - オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置 - Google Patents

オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置

Info

Publication number
JP2001522156A
JP2001522156A JP2000518448A JP2000518448A JP2001522156A JP 2001522156 A JP2001522156 A JP 2001522156A JP 2000518448 A JP2000518448 A JP 2000518448A JP 2000518448 A JP2000518448 A JP 2000518448A JP 2001522156 A JP2001522156 A JP 2001522156A
Authority
JP
Japan
Prior art keywords
signal
spectral value
coded
coding
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000518448A
Other languages
English (en)
Other versions
JP3366903B2 (ja
Inventor
ベルンハルト グリル
ユルゲン ヘルレ
ボド タイヒマン
カールハインツ ブランデンブルク
ハインツ ゲルホイザー
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ filed Critical フラウンホーファー−ゲゼルシャフト・ツア・フォルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ
Publication of JP2001522156A publication Critical patent/JP2001522156A/ja
Application granted granted Critical
Publication of JP3366903B2 publication Critical patent/JP3366903B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth

Abstract

(57)【要約】 本願発明は、TNS技術を用いたスケーラブルオーディオコーダの組み合わせを可能にする。第1のサンプリングレートでサンプリングされた時間信号(x1)をコーディングする方法において、まず第1のサンプリングレートより低いサンプリングレートの第2の時間信号(x2 )が生成される(12)。それから、第2の時間信号(x2 )が第1のコーディングアルゴリズムによりコード化され(14)、ビットストリーム(xAUS )に書き込まれる(16)。しかし、コード化された第2の時間信号(x2c)は、再びデコード化され(14)、第1の時間信号と同様に、周波数ドメインに変換される(23,24)。第1の時間信号のスペクトル表示(X1 )から、TNS予測係数が計算される(25)。第1のコーディングアルゴリズムを用いるコーダ/デコーダ(14)の変換された出力信号(X2cd )は、第1の時間信号のスペクトル表示(X1 )と同様に、両方の信号についての残余スペクトル値を得るために、周波数に関する予測がなされるが(27)、そこでは第1の時間信号に基づいて計算された予測係数しか用いられない。これらの2つの信号は、互いに対して評価される(26,28)。その後、評価された残余スペクトル値(Xb )は、コード化され評価された残余スペクトル値(Xcb)を得るために、第2のコーディングアルゴリズムによりコード化され(30)、それらは計算された予測係数を含むサイド情報とともに、ビットストリーム(xAUS )中に書き込まれる。

Description

【発明の詳細な説明】
本願発明は、スケーラブルオーディオコーダ及びオーディオデコーダに関し、
特に、少なくとも1段階が周波数ドメインにおいて作動するスケーラブルコーダ
及びデコーダに関する。 スケーラブルオーディオコーダは、モジュール構成のコーダである。よって、
たとえば8kHzでサンプリングされた信号を処理し、たとえば毎秒4.8から
8キロビットのデータレートを生成する既存のスピーチコーダを使用しようとい
う努力がなされる。たとえば当業者に知られているG.729、G.723、F
S1016、CELPまたはMPEG−4−Audio用のパラメトリックモデ
ル等のこれら公知のコーダは、通常8kHzでサンプリングされた信号用に設計
されており、最高4kHzの可聴バンド幅しかコード化できないため、主に話声
信号をコード化するのに役立つのであり、一般により高い音質の音楽信号のコー
ド化には適していない。しかしながら、一般にそれらは低いサンプリングレート
で、話声信号について良好な音質を示す。 スケーラブルコーダでの音楽信号のオーディオコーディングについて、たとえ
ばHIFI品質またはCD品質を達成するために、スピーチコーダと、たとえば
48kHzのより高いサンプリングレートで信号をコード化することが可能なオ
ーディオコーダが組み合わせられる。もちろん上記のスピーチコーダを、たとえ
ばMPEG1、MPEG2またはMPEG4の標準に従うミュージック/オーデ
ィオコーダといった別のコーダに置き換えることも可能である。 この種のチェーン回路は、スピーチコーダ及びより高品質のオーディオコーダ
を含む。たとえばサンプリングレート48kHzの入力信号は、ダウンサンプリ
ングフィルタでスピーチコーダに適当なサンプリング周波数に変換される。しか
し、サンプリングレートは、また、両方のコーダにおいて同じでもあり得る。変
換された信号は、その後コード化される。コード化された信号は、送信のために
ビットストリームフォーマッティングデバイスに直接与えられることが可能であ
る。しかし、それはたとえば最大でも4kHzのバンド幅の信号しか含まない。
コード化された信号も再びデコード化され、アップサンプリングフィルタで変換
される。しかし、ダウンサンプリングフィルタのために、こうして得られた信号
は、たとえば4kHzのバンド幅の有用な情報しか含んでいない。加えて、4k
Hzより低いバンドにおける変換されコード化/デコード化された信号のスペク
トル内容は、一般的なコーダがコーディングエラーを持ちこむため、48kHz
でサンプリングされた入力信号の最初の4kHzバンドに正確に対応していない
ことを記しておかなければならない。 既に述べたように、スケーラブルコーダは、周知のスピーチコーダと、より高
いサンプリングレートで信号を処理することが可能なオーディオコーダとを含む
。4kHzより高い周波数の入力信号の信号成分を送信できるように、8kHz
における入力信号とコード化/デコード化され変換されたスピーチコーダの出力
信号との差が、各々個々の離散時間サンプリング値について形成される。この差
は、その後、当業者に公知の方法で、公知のオーディオコーダを用いて量子化及
びコード化されることが可能である。ここで、コーディングエラーとは別に、よ
り高いサンプリングレートで信号をコード化することが可能なオーディオコーダ
に与えられる差分信号は、より低い周波数帯域では基本的にゼロである。上方に
変換されコード化/デコード化されたスピーチコーダの出力信号のバンド幅より
上に位置するスペクトル域において、差分信号は、実質的に48kHzでの真の
入力信号に対応する。 第1の段階すなわちスピーチコーダの段階において、一般にコード化された信
号の非常に低いビットレートが対象とされているので、低いサンプリング周波数
のコーダが一般的に使用される。前述のコーダを含む多数のコーダは、現在、数
キロビット(2から8キロビットまたはそれ以上)のビットレートで作動する。
更に、この低いビットレートではいずれにしろ不可能であるとともに、計算の労
力に関しては低いサンプリング周波数でのコード化がより有益であるため、これ
らは8kHzの最大サンプリング周波数を可能にする。最大可能可聴バンド幅は
4kHzであり、実際上約3.5kHzに制限されている。バンド幅の改良が、
更なる段階すなわちオーディオコーダの段階において達成されるのであれば、こ
の更なる段階は、より高いサンプリング周波数で作動しなければならない。 データ量を更に減ずるための高品質オーディオコーディングにおけるいわゆる
TNS技術の使用が、先般来公知になりつつある(J.Herre,J.D.J
ohnston,“Enhancing the Performance o
f Perceptual Audio Coders by Using T
emporal Noise Shaping (TNS)”,101st A
ES Convention,Los Angeles 1996,Prepr
int 4384)。TNS技術(TNS=テンポラルノイズシェイピング)は
、一般に、スペクトル値の予測コーディングによって、量子化ノイズの微細構造
のテンポラルシェイピングを可能にする。TNS技術は、時間ドメインと周波数
ドメイン間の二重性の一貫した適用に基づく。技術分野においては、時間信号の
自己相関関数が周波数ドメインに変換される際、まさにこの時間信号のスペクト
ルパワー密度を与えることが知られている。これに関する二重の事態が、信号の
スペクトルの自己相関関数が形成され時間ドメインに変換される際に生ずる。時
間ドメインに変換または戻された自己相関関数は、また時間信号のヒルベルト包
絡線のスクエアとも呼ばれる。よって、信号のヒルベルト包絡線は、そのスペク
トルの自己相関関数と直接連結される。従って、信号のスクエアリングされたヒ
ルベルト包絡線及びそのスペクトルパワー密度は、時間ドメインと周波数ドメイ
ンにおける二重の側面を表す。信号のヒルベルト包絡線がある周波数の範囲に関
して各々部分的なバンドパス信号について一定のままであれば、隣接するスペク
トル値との自己相関もまた一定である。実は、これは一連のスペクトル係数が周
波数に対して定常であることを意味しており、そのため、予測コーディング技術
がこの信号を表すのに有効に使用され得るのであり、これは、更に言えば、予測
係数の共通のセットを用いることによる。 状況を明確にするために、図6A及び図6Bを参照する。図6Aは、持続時間
が約40msの時間的に強く過渡的な「カスタネット」信号の短区分を示す。こ
の信号は多重の部分的バンドパス信号に分解され、各部分的バンドパス信号は、
500Hzのバンド幅を有する。図6Bは、中間周波数が1500Hzから40
00Hzに渡るこれらのバンドパス信号のヒルベルト包絡線を示す。より事態を
明らかにするために、全ての包絡線はそれらの最大振幅に正規化されている。明
らかに、全ての単一の包絡線の形状は互いに非常に類似しており、それがこの周
波数帯域内で信号を有効にコード化するために一般的な予測器が使用できる理由
である。人間の音声発生メカニズムの性質のために、全周波数帯域に渡って声門
エキサイテーションパルスの効果が存在しているスピーチ信号についても同様の
考察がなされる。 よって、図6Bは、たとえば周波数2000Hzでの隣接する値の相関関係が
、たとえば周波数3000Hzまたは1000Hzでのそれと類似していること
を示す。 その代わりに、過渡信号のスペクトル予測性の性質は、図5の表を検討するこ
とにより理解され得る。表の上左で、連続的な時間信号u(t)が正弦波の形で
示される。この隣はこの信号のスペクトルU(f)であり、単一のディラックパ
ルスからなる。この信号の最適コーディングは、スペクトルデータまたはスペク
トル値のコーディングに存する。なぜなら、完全な時間信号について、時間信号
を完全に再構成できるように、ここではフーリエ係数の振幅及び位相のみが送信
されなければならないからである。スペクトルデータのコーディングは、同時に
、時間ドメインにおける予測に対応する。よって、ここでは時間ドメインにおい
て予測コーディングが起こらなければならないであろう。したがって、正弦の時
間信号は、平坦な時間包絡線を有し、それは周波数ドメインにおける最も平坦で
ない包絡線に相当する。 次に、時間信号u(t)が時間ドメインにおいてディラックパルスの形で最大
に過渡的な信号であるという反対の場合を検討する。時間ドメインにおけるディ
ラックパルスは「平坦な」パワースペクトルに相当し、一方、位相スペクトルは
パルスのタイムポジションに従って回転する。この信号がたとえば変換コーディ
ングまたはスペクトルデータのコーディングまたは時間ドメインデータの直線予
測コーディング等の上述の従来の方法に対して問題を呈していることは明らかで
ある。この信号は、時間ドメインにおいて最良かつ最も効率的にコード化され得
る。なぜなら、ディラックパルスの時間的位置及びパワーのみが送信されなけれ
ばならないからであり、それは二重性の一貫した使用を通じて、周波数ドメイン
における予測コーディングもまた効率的なコーディングに適する方法を構成する
ことを意味する。 周波数に関するスペクトル係数の予測コーディングを、既に実施され上で引用
した記事においても記述された、1つのブロックから次のブロックへのスペクト
ル係数の予測の公知の二重性コンセプトと混同しないことは非常に重要である(
M.Bosi,K.Brandenburg,S.Quakenbusch,L
.Fiedler,K.Akagiri,H.Fuchs,M.Dietz,J
.Herre,G.Davidson,Yoshiaki Oikawa:“I
SO/IEC MPEG−2 Advanced Audio Coding,
”101st AES Convention,Los Angeles 19
96,Preprint 4382)。時間に関する予測に相当する1つのブロ
ックから次のブロックへのスペクトル係数の予測において、スペクトル分解能が
増大し、一方周波数に関するスペクトル係数の予測は時間分解能を増大させる。
従って、たとえば1000Hzでのスペクトル係数は、同じブロックまたはフレ
ームにおけるたとえば900Hzでのスペクトル係数から決定され得る。 そのため、上記の考察は、過渡信号の効率的なコーディング方法の達成へとつ
ながった。時間と周波数ドメインの二重性を考慮して、予測コーディング技術は
、あるスペクトル係数から次のブロックにおける同じ周波数のスペクトル係数へ
の既に公知の予測と実質的に同様に扱われることが可能である。ある信号のスペ
クトルパワー密度及びスクエアリングされたヒルベルト包絡線は、互いに二重で
あるため、従来の予測方法におけるようなスペクトル計測の平坦さではなく信号
のスクエアリングされた包絡線の計測の平坦さにより、残余信号エネルギーの減
少または予測利得が得られる。潜在コーディング利得は、信号が過渡的になるほ
ど増加する。 後方予測としても知られる閉ループの予測理論及び前方予測としても知られる
開ループの予測理論の両方が、可能な予測理論として挙げられる。閉ループのス
ペクトル予測理論(後方予測)の場合、エラーの包絡線は平坦である。別の表現
をすれば、エラー信号のエネルギーは、時間に関して均等に配分される。 しかし、前方予測の場合、図7に示されるように、量子化によって持ちこまれ
たノイズのテンポラルシェイピングがある。予測されるスペクトル係数x(f)
が、加算ポイント600に与えられる。同じスペクトル係数が予測器610にも
与えられ、その出力信号がまた負の記号付きで加算ポイント600に与えられる
。よって、量子化器620への入力信号は、スペクトル値x(f)と予測によっ
て計算されたスペクトル値xp (f)との差を表す。前方予測にとって、デコー
ド化されたスペクトル係数データにおける合計エラーエネルギーは一定のままで
ある。しかし、スペクトル係数に予測が加えられることによって、量子化ノイズ
が時間的に実際の信号の下に置かれてマスキングされ得るために、量子化エラー
信号の時間軸上の形状は、デコーダの出力ではテンポラルシェイピングされてい
るように見える。このようにして、たとえば過渡信号またはスピーチ信号の時間
マスキングの問題が避けられる。 よって、この種のスペクトル値の予測コーディングは、TNSすなわちテンポ
ラルノイズシェイピング技術と呼ばれる。この技術を明確にする目的で、図8A
を参照する。図8Aの上左では、強く過渡的な時間信号の時間軸上の行動が示さ
れる。図8Aの上右でこの時間軸上の行動曲線の反対側に示されているのは、D
CTスペクトルの区分である。図8Aの下左のグラフは、LPC(LPC=直線
予測コーディング)オペレーションにより計算されたTNS合成フィルタの結果
として生ずる周波数応答を示す。この図における(正規化された)周波数座標は
、時間ドメインと周波数ドメインの二重性のために、時間座標に対応する。LP
C計算は、明らかに入力信号の「ソースモデル」を生成する。なぜなら、LPC
計算された合成フィルタの周波数応答は、強く過渡的な時間信号の包絡線に似て
いるからである。周波数に関する残余スペクトル値の表示すなわち図7の量子化
器620の入力信号の表示は、図8Aの下右に示される。予測後の残余スペクト
ル値と直接時間−周波数変換で得られたスペクトル値との比較は、残余スペクト
ル値がもとのスペクトル値よりもはるかに少ないエネルギーを有するということ
を示す。示された例において、残余スペクトル値のエネルギー減少は、約12d
Bの合計予測利得に相当する。 図8Aの下左のグラフに関して、以下の点について注目すべきである。時間ド
メイン信号に関する従来の予測の使用について、合成フィルタの周波数応答は、
入力信号の振幅スペクトルの近似値である。合成フィルタは、ほぼ「白色の」ス
ペクトルで残余信号から、信号のスペクトル形状をある程度まで(再)生成する
。TNS技術の場合におけるように、スペクトル信号について予測が用いられる
とき、合成フィルタの周波数応答は、入力フィルタの包絡線の近似値である。合
成フィルタの周波数応答は、従来の場合のようにパルス応答のフーリエ変換の結
果ではなく、逆フーリエ変換の結果である。TNS合成フィルタは、ほぼ「白色
の」(すなわち平坦な)包絡線で残余信号から、いわば信号の包絡線の形状を(
再)生成する。よって、図8Aの下左のグラフは、TNS合成フィルタによって
かたどられたような入力信号の包絡線を示す。これは、ここではその上の図にお
いて示されるカスタネット信号の包絡線近似値の対数表示である。 続いて、約13dBのSN比が、たとえば0.5バークの幅の各コーディング
バンドにおいて生ずるように、コーディングノイズが残余スペクトル値に導入さ
れた。量子化ノイズの導入によって生ずる時間ドメインにおけるエラー信号は、
図8Bに示される。図8Bの左側の図は、TNS技術を用いた場合の量子化ノイ
ズによるエラー信号を示し、右側の図ではTNS技術が使用されておらず、よっ
て比較できるようになっている。予想通り、左側の図におけるエラー信号は、ブ
ロック中で均等に配分されておらず、この量子化ノイズを最適にマスキングする
であろうより高い信号内容が存在する領域に集中している。一方、右側の場合で
は、導入された量子化ノイズは、ブロックすなわち時間に関して均等に配分され
ており、その結果、信号が全くまたはほとんど存在しない前方の領域では、ノイ
ズも存在し、それはおそらく可聴であり、一方、高い信号内容が存在する領域で
は、比較的小さなノイズが存在し、信号のマスキングの可能性が完全には活用さ
れていないということになる。 TNSフィルタ付きの単純なすなわち非スケーラブルオーディオコーダが以下
に記述される。 コーダにおけるTNSフィルタ804の実行が図9Aに示される。このフィル
タは、解析フィルタバンク802と量子化器806の間に配置される。図9Aに
示されるコーダ用の離散時間入力信号がオーディオ入力800に入力され、量子
化されたオーディオ信号すなわち量子化されたスペクトル値または量子化された
残余スペクトル値が出力808で出力され、その後に冗長コーダが続いてよい。
そのため、入力信号はスペクトル値へと変換される。計算されたスペクトル値に
基づき、たとえばスペクトル値の自己相関マトリクスを形成しレヴィンソン−ダ
ービンリカージョンを用いることにより、正規直線予測計算が行なわれる。図9
Bは、TNSフィルタ804の詳細図を示す。スペクトル値x(1),・・・,
x(i),・・・,x(n)がフィルタ入力810に与えられる。特定の周波数
帯域のみが過渡信号を示す一方、他の周波数帯域では主に静的であるということ
も起こり得る。このことは、入力スイッチ812及び出力スイッチ814を通じ
て、TNSフィルタ804において許容されているのであるが、これらのスイッ
チの主な機能は、被処理データの並列−直列または直列−並列変換をもたらすこ
とである。特定の周波数帯域が不安定で、TNS技術によって一定のコーディン
グ利得が得られる見込みがあるならば、このスペクトル域のみがTNS処理され
るのだが、これは入力スイッチ812がたとえばスペクトル値x(i)で始まり
、たとえばスペクトル値x(i+2)まで通過するということで達成される。フ
ィルタの内部領域もまた前方予測構造すなわち予測器610及び加算ポイント6
00を含む。 TNSフィルタのフィルタ係数を決定するためまたは予測係数を決定するため
の計算は、次のように実行される。自己相関マトリクスの形成及びレヴィンソン
−ダービンリカージョンの適用が、たとえば20のノイズシェイピングフィルタ
の最高許容オーダーについて行なわれる。計算された予測利得が特定の閾値を超
える場合、TNS処理が作動する。 それから、現在のブロックについて使用されるノイズシェイピングフィルタの
オーダーが、係数配列の末端から十分に小さい絶対値の全ての係数の除去により
決定される。これは、スピーチ信号について通常4〜12の範囲内にある値のT
NSフィルタのオーダーを生じさせる。 十分に高いコーディング利得がたとえばスペクトル値x(i)の範囲について
決定される場合、この範囲は処理され、TNSフィルタの出力でスペクトル値x
(i)の代わりに残余スペクトル値xR (i)が現れる。図8Aから分かるよう
に、この残余値はもとのスペクトル値x(i)よりもはるかに小さい振幅を有す
る。よって、正規サイド情報に加えて、デコーダに送信されるサイド情報は、T
NSの使用を示すフラグと、必要ならば目的周波数帯域及びコーディングに使用
されたTNSフィルタに関する情報を含む。フィルタデータは量子化されたフィ
ルタ係数として表示されることが可能である。 次に、TNSフィルタ付きのコーダに類似して、逆TNSフィルタ付きのデコ
ーダが考慮される。 図10Aで示されるデコーダにおいて、TNSコーディングは各チャンネルに
ついて反転される。残余スペクトル値xR (i)は反量子化器216において再
量子化され、図10Bで詳細に構造を示す逆TNSフィルタ900に入力される
。出力信号として、逆TNSフィルタ900は、合成フィルタバンク218で時
間ドメインに変換されるスペクトル値を再び伝送する。TNSフィルタ900は
、入力スイッチ902と出力スイッチ908を含み、それらもまた主に被処理デ
ータの並列−直列または直列−並列変換をもたらすものである。残余スペクトル
値だけを逆TNSコーディングの対象とし、TNSコード化されていないスペク
トル値は変更されないで出力910にまで通過させられるように、入力スイッチ
902もまた可能目的周波数帯域を考慮している。逆予測フィルタは、予測器9
06と加算ポイント904を含む。しかし、TNSフィルタとは対照的に、これ
らは以下のように接続されている。残余スペクトル値は、入力スイッチ902を
介して加算ポイント904に達し、そこで予測器906の出力信号と加算される
。出力信号として、予測器は推測スペクトル値xp (i)を供給する。スペクト
ル値x(i)は、出力スイッチを介して逆TNSフィルタの出力で出力される。
よって、TNS関連のサイド情報は、デコーダにおいてデコード化され、そのサ
イド情報は、TNSの使用を示すフラグと、必要ならば目的周波数帯域に関する
情報を含む。加えて、サイド情報は、あるブロックまたは「フレーム」をコード
化するために使用された予測フィルタのフィルタ係数を含む。 よって、TNS方法は、以下のように要約される。入力信号は、高分解能解析
フィルタバンクによりスペクトル表示に変換される。それから、周波数に関して
隣接するスペクトル値間の周波数ドメインで直線予測が行なわれる。この直線予
測は、スペクトルドメインで行なわれるスペクトル値のフィルタリングのための
フィルタ工程として解釈され得る。このようにして、もとのスペクトル値が予測
エラーすなわち残余スペクトル値によって置き換えられる。これらの残余スペク
トル値は、正規のスペクトル値と全く同様に量子化及びコード化され、デコーダ
に移送され、そこで値はデコード化され反量子化される。逆フィルタバンク(合
成フィルタバンク)を使用する前に、逆予測(逆とはコーダにおいて実行される
予測に対して)が、送信された予測エラー信号すなわち再量子化された残余スペ
クトル値について逆予測フィルタが使用されるという方法で実行される。 この技術を使用することにより、量子化ノイズの時間包絡線を入力信号のそれ
に整合させることが可能である。これは、目立つ時間微細構造または目立つ過渡
行動を有する信号について、エラー信号のマスキングのより良い活用を可能にす
る。過渡信号の場合、TNS技術は、いわゆる「プレエコー」を避ける。これに
ついてはそのような信号の「アタック」前に、量子化ノイズが既に現れている。 既に述べたように、スケーラブルオーディオコーダにおいて、一般的にコード
化された信号の非常に低いビットレートが求められるため、低いサンプリング周
波数のコーダが第1の段階で使用される。第2の段階では、より高いビットレー
トでコード化するがより大きなバンド幅を要し、そのためスピーチコーダよりも
ずっと高い音質でオーディオ信号をコード化することが可能なオーディオコーダ
があることが好ましい。コード化され高いサンプリングレートになったオーディ
オ信号は、通常、たとえばダウンサンプリングフィルタを用いてまずより低いサ
ンプリングレートに低変換される。減少されたサンプリングレート信号は、その
後、第1段階のコーダに入力され、このコーダの出力信号はスケーラブルオーデ
ィオコーダから現れるビットストリーム中に直接書き込まれる。この低いバンド
幅を有するコード化された信号は、再びデコード化され、それからたとえばアッ
プサンプリングフィルタを用いて高いサンプリングレートに戻され、その後、周
波数ドメインに変換される。同じく周波数ドメインに変換されるのは、コーダの
入力にもともと存在したオーディオ信号である。2つのオーディオ信号がここで
入手可能であるが、前者は第1段階のコーダのコーディングエラーを被っている
。これら周波数ドメインの2つの信号は、2つの信号の差のみを表示する信号を
得るために、ここで差分エレメントに供給されることが可能である。後述する周
波数選択スイッチとしても実行可能なスイッチングモジュールにおいて、次に2
つの入力信号の差を処理するのが良いか、または周波数ドメインに変換されたも
とのオーディオ信号を直接処理するのが良いか、決定することが可能である。い
ずれにしても、MPEG標準に従って機能する場合なら、心理音響学モデルを考
慮する量子化と、好ましくは量子化されたスペクトル値でのハフマンコーディン
グを用いるエントロピーコーディングを続けて両方行なうような、たとえば公知
の量子化器/コーダに、スイッチングモジュールの出力信号が与えられる。量子
化器及びコーダの出力信号は、第1段階のコーダの出力信号と共にビットストリ
ームに書き込まれる。図10Aに示される構造を単純に模倣するために、最初に
記述したTNSフィルタをスイッチングモジュールの直後、すなわち量子化器/
コーダの前に配置するのが一見良いように思われるかも知れない。しかし、この
解決法の不都合は、スイッチングモジュールの出力信号が、コーダの入力におけ
るもとの時間オーディオ信号に関して大きく変更されており、その結果TNSフ
ィルタのフィルタ係数決定が同じ品質で適用できないことである。 本願発明の目的は、スケーラブルコーディオコーダの場合でもテンポラルノイ
ズシェイピングが役立つように、スケーラブルオーディオコーディングのコンセ
プトとテンポラルノイズシェイピングのコンセプトを組み合わせることである。 この目的は、請求項1または2によるコーディング方法によって、請求項3ま
たは4によるデコーディング方法によって、請求項5または6によるコーディン
グ装置によって、請求項7または8によるデコーディング装置によって達成され
る。 本願発明は、TNSフィルタ係数または予測係数の決定が、第1段階のコーダ
による影響を受けていないスペクトル値に基づいて行なわれなければならないと
いう洞察に基づく。もちろん、スケーラブルオーディオコーダも、第1段階のコ
ーダのように、明細書の導入部で引用した変形のひとつを利用し得る順応性のあ
るコーダであるべきである。本願発明によると、TNS予測係数の決定は、コー
ダの入力におけるオーディオ信号の直接表示であるスペクトル値に基づいて行な
われる。フィルタバンクまたはMDCTを使用することにより、オーディオコー
ダ入力信号のスペクトル表示が生成できる。しかし、TNSコーディングフィル
タによる実際のフィルタリングのように、コーダの同じ場所においてTNSフィ
ルタ係数の決定を行なうことはもはや不可能である。そのため、TNSフィルタ
係数の決定は、実際のTNSコーディングフィルタリングとは別に行なわれなけ
ればならない。 本願発明の第1の観点によると、TNSフィルタ係数の決定は、もとのオーデ
ィオ入力信号を周波数ドメインに変換するフィルタバンクの直後で行なわれる。
よって、同種の信号すなわちTNS処理されていない信号が、加算器またはスイ
ッチングモジュールの前に存在する。本願発明の第1の観点によると、既に決定
されたTNS係数でのTNSフィルタリングが、スイッチングモジュールの後及
びおそらく心理音響学モデルに従って作動する量子化器/コーダの前で起こる。
しかし、後で明らかになるように、このスケーラブルオーディオコーダにおける
TNS技術の実行は、デコーダの変更を伴う。 しかし、本願発明の第2の観点によると、このデコーディングはもはや必要で
はない。ここでは、TNS予測係数が、第1の観点についてと同様に、再び同じ
場所で決定される。本願発明の第1の観点とは対照的に、2つの関連のスペクト
ル信号すなわち第1段階のコーディングエラーを伴うスペクトル信号及びオーデ
ィオ入力信号の本質的に歪められていない表示であるスペクトル信号が、加算エ
レメントの前で、前もって決定されたTNS係数で作動するTNSコーディング
フィルタにより処理される。第1段階のコーダのコーディングエラーを負ったス
ペクトル信号のTNSフィルタリングが、エラーのないオーディオ信号に由来す
るTNS係数を単純に用いるTNS係数の再決定なしに作動することに注目する
のは重要である。本願発明の第2の観点によれば、同種の2つの信号すなわちこ
こではTNS処理された信号は、加算器またはスイッチングモジュールの入力に
おいて再び存在する。 一般に、本願発明の第1及び第2の観点は、ある例ではTNS処理されていな
い信号が加算器の前に存在するのに対し、別の例では、TNS処理された信号が
差分の対象となるかまたはスイッチングモジュールに入力されるという点で異な
る。 記述された条件は、本願発明によるデコーダにおいて考慮される。本願発明の
第1の観点によりコード化された信号をデコード化するデコーダの場合、TNS
デコーディング、すなわちビットストリームでサイド情報として再び現れるコー
ディングの際に決定されたTNS係数を使用するTNSデコーディングフィルタ
の使用は、スイッチングモジュールに類似した逆スイッチングモジュールの前で
起こる。コーダに関して、逆スイッチングモジュールにTNS処理されていない
信号が供給されるが、デコーダの場合もまた同様である。 一方、本願発明の第2の観点によりコード化された信号をデコード化するデコ
ーダの場合、逆スイッチングモジュールにはTNS処理された信号が与えられる
。この目的のために、第1段階のコーダのデコード化された信号は、周波数ドメ
インに変換され、コーダにおいて決定されたTNSフィルタ係数を用いるTNS
コーディングフィルタによってフィルタリングされなければならない。本願発明
の第2の観点によるコーダについてと原則的に同様に、そのときだけ同種すなわ
ちTNS処理された信号が、逆スイッチングモジュールまたはその前に配置され
た加算器において比較される。逆スイッチングモジュールの出力信号は、最終的
にTNSデコーディングフィルタに入力され、その出力信号は、全ての装置のコ
ーディングエラーから切り離してもとのオーディオ信号を再生するために、その
後、逆フィルタバンクにより処理される。既に述べたように、本願発明の第2の
観点によるコーダまたはデコーダが、本願発明の実施例では好ましい。なぜなら
、逆フィルタバンクの前にTNSデコーディングフィルタまたは逆TNSフィル
タが配置されるので、デコーダにおける実質的な変更が必要でないからであり、
これは図10Aの配置に対応する。 本願発明の実施例は、添付の図面を参照しながら以下より詳細に記述される。
【図面の簡単な説明】
図1は、本願発明の第1の観点によるスケーラブルオーディオコーダを示す。 図2は、本願発明の第2の観点によるスケーラブルオーディオコーダを示す。 図3は、本願発明の第1の観点によるデコーダを示す。 図4は、本願発明の第2の観点によるデコーダを示す。 図5は、時間ドメインと周波数ドメインとの二重性を解明する表を示す。 図6Aは、過渡信号の一例を示す。 図6Bは、図6Aに示される過渡時間信号に基づく部分的なバンドパス信号の
ヒルベルト包絡線を示す。 図7は、周波数ドメインにおける予測の概略図である。 図8Aは、TNS技術を解説するための一例を示す。 図8Bは、TNS技術を用いた場合(左)と用いていない場合(右)の導入さ
れた量子化ノイズの時間軸上の行動の比較を示す。 図9Aは、TNSフィルタ付きの非スケーラブルコーダの簡略化されたブロッ
ク図である。 図9Bは、図9AのTNSフィルタの詳細図である。 図10Aは、逆TNSフィルタ付きの非スケーラブルデコーダの簡略化された
ブロック図である。 図10Bは、図10Aの逆TNSフィルタの詳細図である。
【発明の実施の形態】
図1は、本願発明によるスケーラブルオーディオコーダの概念ブロック図であ
る。たとえば48kHzの第1のサンプリングレートでサンプリングされた離散
時間信号x1 は、ダウンサンプリングフィルタ12により、たとえば8kHzの
第2のサンプリングレートに導かれ、第2のサンプリングレートは第1のサンプ
リングレートよりも低い。第1と第2のサンプリングレートの比は、自然数であ
ることが好ましい。間引きフィルタとして実行されてもよいダウンサンプリング
フィルタ12の出力信号は、第1のコーディングアルゴリズムによって入力信号
をコード化するコーダ/デコーダ14に入力される。既に述べたように、コーダ
/デコーダ14は、たとえばG.729、G.723、FS1016、MPEG
−4 CELP、MPEG−4 PAR等のより低いオーダーのスピーチコーダ
でよい。そのようなコーダは、毎秒4.8キロビットのデータレート(FS10
16)から、毎秒約8キロビットのデータレート(G.729)で作動する。そ
れらは全てサンプリング周波数8kHzでサンプリングされた信号を処理する。
しかし、当業者にとっては、他のデータレートまたは他のサンプリング周波数の
他のどのコーダでも使用できることは自明である。 コーダ14によってコード化された信号すなわちコード化された第2の信号x 2c 、コーダ14に依存し上記のビットレートの1つで存在するビットストリーム
は、ライン16を介してビットフォーマッタ18に入力される。ビットフォーマ
ッタ18の機能は後述する。ダウンサンプリングフィルタ12及びコーダ/デコ
ーダ14は、本願発明によるスケーラブルオーディオコーダの第1の段階を構成
する。 ライン16に出力されるコード化された第2の信号x2cも、ライン20上にコ
ード化/デコード化された第2の時間信号x2cd を生成するために、第1のコー
ダ/デコーダ14で再びデコード化される。コード化/デコード化された第2の
時間信号x2cd は、第1の離散時間信号x1 より低いバンド幅を有する離散時間
信号である。記述された数値的な例について、第1の離散時間信号x1 は、サン
プリング周波数が48kHzなので、最大24kHzのバンド幅を有する。コー
ド化/デコード化された第2の時間信号x2cd は、ダウンサンプリングフィルタ
12が第1の時間信号x1 を間引きを通じて8kHzのサンプリング周波数に変
換したので、最大4kHzのバンド幅を有する。0から4kHzのバンド幅内で
、信号x1 とx2cd は、コーダ/デコーダ14により持ちこまれたコーディング
エラーを除いては同じである。 ここで、コーダ14により持ちこまれたコーディングエラーは常に小さなエラ
ーとはかぎらず、たとえば強く過渡的な信号が第1コーダでコード化される場合
、それらは有用な信号と同じオーダーの振幅のものでもあり得るということが指
摘される。この理由で、後で説明するように、差分コーディングが合理的かどう
か調べるためにチェックが行なわれる。 コーダ/デコーダ14の出力での信号x2cd は、再び高サンプリングレートに
変換して戻すためにアップサンプリングフィルタ23に入力され、その結果信号
1 と比較可能になる。 アップサンプリングされた信号x2cd 及び信号x1 は、各々フィルタバンクF
B1 22及びフィルタバンクFB2 24に入力される。フィルタバンクFB
1 22は、信号x2cd の周波数ドメイン表示であるスペクトル値X2cd を生成
する。一方、フィルタバンクFB2は、もとの第1の時間信号x1 の周波数ドメ
イン表示であるスペクトル値X1 を生成する。2つフィルタバンクの出力信号は
、加算器26において減算される。より正確には、フィルタバンクFB1 22
の出力スペクトル値X2cd は、フィルタバンクFB2 24の出力スペクトル値
から減算される。加算器26の次には、加算器26の出力信号Xd と、以後第1
のスペクトル値X1 と呼ばれるフィルタバンク24の出力信号X1 すなわち第1
の時間信号のスペクトル表示の両方が入力されるスイッチングモジュールSM
28が続く。 本願発明の第1の観点によると、スイッチングモジュール28に続くTNSフ
ィルタまたは予測フィルタ27の予測係数は、TNS係数の計算のためのデバイ
ス25により計算される。TNS係数計算器25は、図1から分かるように、T
NSコーディングフィルタ27とビットフォーマッタ18の両方に対して係数を
与える。 TNSコーディングフィルタは、当業者には公知の心理音響学モジュール32
の記号で示される心理音響学モデルに従って量子化を行なう量子化器/コーダ3
0に入力する。2つのフィルタバンク22、24、加算器26、スイッチングモ
ジュール28、量子化器/コーダ30及び心理音響学モジュール32は、本願発
明によるスケーラブルオーディオコーダの第2の段階を構成する。 以下において、スケーラブルオーディオコーダの動作が図1を利用して説明さ
れる。前述のように、第1のサンプリングレートでサンプリングされた離散第1
時間信号x1 は、第2のサンプリングレートに相当するバンド幅の第2の時間信
号x2 を生成するために、ダウンサンプリングフィルタ12に入力され、第2の
サンプリングレートは、第1のサンプリングレートよりも低い。これらの第2の
時間信号x2 から、コーダ/デコーダ14は、第1のコーディングアルゴリズム
に従って、第2のコード化された時間信号x2cを生成し、また続く第1のコーデ
ィングアルゴリズムによるデコーディングによって、コード化/デコード化され
た第2の時間信号x2cd を生成する。コード化/デコード化された第2の時間信
号x2cd の周波数ドメイン表示である第2のスペクトル値X2cd を生成するため
に、コード化/デコード化された第2の時間信号x2cd は、第1のフィルタバン
クFB1 22により周波数ドメインに変換される。 ここで、コード化/デコード化された第2の時間信号x2cd は、第2のサンプ
リング周波数すなわち例において8kHzの時間信号であることが指摘される。
これらの信号の周波数ドメイン表示及び第1のスペクトル値X1 が評価されるが
、第1のスペクトル値X1 は第1の時間信号x1 から生成され、第2のフィルタ
バンクFB2 24により第1すなわち高いサンプリング周波数を示す。同一の
時間及び周波数分解能の比較信号を得るために、8kHz信号すなわち第2のサ
ンプリング周波数の信号が、第1のサンプリング周波数の信号に変換されなけれ
ばならない。しかし、スケーラブルコーダにとって、2つのサンプリング周波数
が異なっているというのは不可避ではなく、それらは同じ値でもあり得る。 これは、アップサンプリングフィルタを使用する代わりに、信号x2cd の個々
の離散時間のスキャンされた値の間に特定の数のゼロの値を挿入することによっ
ても達成できる。ゼロの値の数は、(第1のサンプリング周波数対第2のサンプ
リング周波数の比)−1により求められる。第1(高い)対第2(低い)のサン
プリング周波数の比は、アップサンプリングファクターと呼ばれる。当業者には
公知のように、ゼロの挿入は、非常に少ない計算労力で可能であるが、信号x2c d においてエイリアシング効果を生じさせ、その結果として、信号x2cd の低周
波数または有用なスペクトルが反復され、反復の数は挿入されたゼロの数に等し
い。エイリアシングを被った信号x2cd は、第2のスペクトル値X2cd を生成す
るために、第1のフィルタバンクFB1により周波数ドメインに変換される。 コード化/デコード化された第2の信号x2cd の各々スキャンされた値の間に
たとえば5つのゼロを挿入することは、この信号の各6番目のスキャンされた値
だけがゼロと異なることが最初から分かっている信号を生じさせる。この事実は
、この信号をフィルタバンクまたはMDCTによって、または任意のフーリエ変
換によって、周波数ドメインに変換する際に、利用できる。なぜなら、たとえば
単純FFTで行なわれる特定の加算を省略することができるからである。被変換
信号の最初から分かっている構造は、このように、信号を周波数ドメインに変換
する際に計算時間を節約するという有利な方法で利用され得る。 第2のスペクトル値X2cd は、より低い部分においてのみ、コード化/デコー
ド化された第2の時間信号x2cd の正しい表示であり、その理由で、全てのスペ
クトル線X2cd のうち1/(アップサンプリングファクター)部分だけがフィル
タバンクFB1の出力で使用される。ここで、コード化/デコード化された第2
の時間信号x2cd におけるゼロの挿入のために、ここで使用されるスペクトル線
2cd の数は、エイリアシング障害のない第1の時間信号x1 の周波数表示であ
る第1のスペクトル値X1 と同じ時間及び周波数分解能を有することが指摘され
る。減算器26において、及びスイッチングモジュール28において、2つの信
号X2cd 及びX1 は、評価されたスペクトル値Xb またはX1 を生成するために
評価される。ここで、スイッチングモジュール28は、いわゆるサイマルキャス
ト差分転換を実行する。 第2の段階において差分コーディングを用いることがかならずしも有益とは限
らない。これは、たとえば差分信号すなわち加算器26の出力信号が第2のフィ
ルタバンクの出力信号X1 よりも高いエネルギーを有する場合である。更に、任
意のコーダが第1段階のコーダ/デコーダ14に使用され得るので、コーダは、
コード化しにくい特定の信号を生成することもあり得る。コーダ/デコーダ14
は、コード化した信号の位相情報を保存していることが好ましく、その工程は専
門家により「ウェーブフォームコーディング」または「シグナルフォームコーデ
ィング」と呼ばれている。差分コーディングかサイマルキャストコーディングの
いずれが用いられるべきかに関する第2段階のスイッチングモジュール28にお
ける決定は、周波数に基づいて行なわれる。 「差分コーディング」とは、第2のスペクトル値X2cd と第1のスペクトル値
1 との差のみがコード化されるという意味である。しかし、差分信号のエネル
ギー内容が第1のスペクトル値X1 のエネルギー内容より大きいために、そのよ
うな差分コーディングが有益でない場合には、差分コーディングは使用されない
。差分コーディングが使用されない場合は、例において48kHzでサンプリン
グされた時間信号x1 の第1のスペクトル値X1 は、スイッチングモジュール2
8によりつながれ、スイッチングモジュールSM 28の出力信号として使用さ
れる。 差の形成が周波数ドメインで起こるので、サイマルキャストコーディングと差
分コーディング間の周波数選択的選択を行うのに問題はない。なぜなら、2つの
信号X1 とX2cd の差は、いかなる場合でも計算されるからである。よって、ス
ペクトルにおける差の形成は、差分コーディングされるべき周波数帯域の単純な
周波数選択的選択を可能にする。原則的には、各スペクトル値について個々に差
分コーディングからサイマルキャストコーディングへの転換が起こり得る。しか
し、これはあまりにも大量のサイド情報を要し、絶対に必要でもない。よって、
たとえば周波数グループにおける差分スペクトル値のエネルギーと第1のスペク
トル値のエネルギーを比較する方が良い。その代わりに、たとえば8バンド、各
500Hz幅毎というように、一定の周波数バンドを最初から特定することも可
能であり、時間信号x2 が4kHzのバンド幅である場合、再び信号X2cd のバ
ンド幅という結果になる。周波数バンドを決める際の妥協点は、送信されるサイ
ド情報の量を平均させる、すなわちある周波数バンドにおいて差分コーディング
が活性か否かは、可能なかぎり頻繁に差分コーディングが行なわれることから生
ずる利益に対して、比較考量することにある。 たとえば各バンドにつき8ビット、差分コーディングまたはその他の適切なコ
ーディングについてのオン/オフビット等のサイド情報は、ビットストリームに
おいて送信されることが可能であり、そのような情報はある特定の周波数バンド
が差分コーディングされたか否かを示している。後述のデコーダにおいては、第
1のコーダの相当するサブバンドのみが、その後再構成の際に加えられる。 よって、第1のスペクトル値X1 と第2のスペクトル値X2cd の評価のステッ
プは、差分スペクトル値Xd を得るために、第1のスペクトル値X1 から第2の
スペクトル値X2cd の減算を含むことが好ましい。また、たとえば8kHzにお
ける500Hz等の予め決定されたバンドにおける多重のスペクトル値のエネル
ギーが、その後たとえば加算やスクエアリングなどの公知の方法により、差分ス
ペクトル値Xd 及び第1のスペクトル値X1 について計算される。各々のエネル
ギーの周波数選択的比較が、各周波数バンドにおいて行なわれる。差分スペクト
ル値Xd のある特定の周波数バンドにおけるエネルギーが、予め決められた因子
kによって乗算された第1のスペクトル値X1 のエネルギーを超えている場合、
評価されたスペクトル値Xb は第1のスペクトル値X1 であると決定される。そ
うでなければ、差分スペクトル値Xd が、評価されたスペクトル値X1 であると
決定される。因子kは、たとえば約0.1から10までの値であり得る。1より
小さいkの値については、差分信号がもとの信号より低いエネルギーである場合
、サイマルキャストコーディングが既に使用されている。一方、1より大きいk
の値については、たとえ差分信号のエネルギー内容が第1のコーダでコード化さ
れていないもとの信号のそれを既に上回っていても、差分コーディングが継続し
て使用される。サイマルキャストコーディングが評価される場合、スイッチング
モジュール28は、第2のフィルタバンク24の出力信号に直接つなぐ。前述の
差の形成の代わりの方法として、たとえば2つの引用された信号について比が形
成されたり、乗算その他の操作が行なわれるという評価が行なわれることも可能
である。 TNSコーディングフィルタ27は、スイッチングモジュール28の出力に接
続され、評価された残余スペクトル値を得るために、TNS係数計算器25によ
り評価された予測係数を用いて、周波数に関して評価されたスペクトル値Xb
予測を行う。 評価された残余スペクトル値は、スイッチングモジュール28により決定され
たとおり、差分スペクトル値Xd または第1のスペクトル値X1 のいずれかに相
当し、当業者には公知であり心理音響学モデル32内に存在する心理音響学モデ
ルを考慮して第1の量子化/コーダ30により量子化され、その後、好ましくは
たとえばハフマンテーブルを用いる冗長減少コーディングによりコード化される
。当業者には公知のように、心理音響学モデルは時間信号から計算され、図1か
ら分かるように、それが高いサンプリングレートの第1の時間信号x1 が心理音
響学モデル32に直接入力される理由である。量子化器/コーダ30の出力信号
cbは、ライン42でビットフォーマッタ18へと直接導かれ、出力信号xAUS に書き込まれる。 ここまで第1及び第2の段階のスケーラブルオーディオコーダが記述された。
本願発明によるスケーラブルオーディオコーダのコンセプトは、また、3以上の
段階のカスケード接続も可能である。よって、たとえば48kHzでサンプリン
グされた入力信号x1 について、おおよそ電話の通話品質に相当するデコーディ
ング後の信号品質を達成するために、サンプリングレートを減らすことにより、
第1のコーダ/デコーダ14において、最初の4kHzのスペクトルをコード化
することが可能であろう。第2の段階において、おおよそHIFI品質に相当す
る音質を達成するために、量子化器/コーダ30により実行される12kHzま
でのバンド幅コーディングが行なわれることが可能であろう。48kHzでサン
プリングされた信号x1 が24kHzのバンド幅を有し得ることは、当業者にと
って自明である。付加量子化器/コーダ38により実行される第3の段階は、お
およそコンパクトディスク(CD)の音質に相当する音質を達成するために、最
大24kHz、または実際的な例ではたとえば最高20kHzのバンド幅までの
コーディングを行なうことが可能であろう。 送信されなければならないサイド情報以外に、コード化されたデータストリー
ムxAUS は、以下の信号を含む: − コード化された第2の信号x2c(0から4kHzの全スペクトル);及び − コード化され評価された残余スペクトル値(サイマルキャストコーディング
で0から12kHzの全スペクトルまたは差分コーディングでコーダ14の0か
ら4kHzのコーディングエラー及び4から12kHzの全スペクトル)。 例における第1のコーダ/デコーダ14から量子化器/コーダ30への遷移に
おいて、遷移障害は4kHzから4kHzより大きい値の遷移を伴うことがある
。これらの遷移障害は、ビットストリームxAUS に書きこまれたエラーのスペク
トル値の形で姿を現わす。全体のコーダ/デコーダは、たとえば1/(アップサ
ンプリングファクター引くx)(x=1,2,3)までの周波数ラインだけが使
用されるように特定されることが可能である。その結果、第2のサンプリング周
波数で到達可能な最大バンド幅の末端の信号X2cd の最終スペクトル線は考慮に
入れられない。暗に、これは評価関数が使用されたことを意味し、引用された場
合では、特定の周波数値より上はゼロであり、これより下は1の値を有するとい
う矩形関数である。代わりに、遷移障害を有するスペクトル線の振幅を減らす「
よりソフトな」評価関数が用いられることも可能であり、その後は減少された振
幅のスペクトル線が考慮される。 遷移障害は、デコーダにおいて再び取り除かれるので、可聴ではないというこ
とが指摘される。しかし、遷移障害は過分な差分信号へとつながる可能性があり
、その場合差分コーディングによるコーディング利得が減少される。上述のよう
な評価関数での評価により、コーディング利得の損失が制限できる。矩形関数以
外の評価関数は、矩形関数と同様に、コーダ及びデコーダにアプリオリに適合さ
れ得るので、付加的なサイド情報を必要としない。 図2は、本願発明の第2の観点により作動するコーダの実際上の実施を示す。
図1と同じエレメントには同じ参照番号を付しており、特別に言及されていない
かぎり、同じ機能を実行する。既に説明したように、本願発明の第2の観点は、
変更が少なくて済むために、デコーダにとってより良いものである。図1のスケ
ーラブルオーディオコーダと対照的に、図2では、第2のTNSコーディングフ
ィルタ27が、位置22のフィルタバンク1の後ろに配置される。更に、第1の
TNSコーディングフィルタは、既にフィルタバンク2 24の後ろに位置して
おり、これはデバイス26における加算器及びスイッチングモジュール28が、
TNS処理されたスペクトル値すなわち第1の残余スペクトル値及び第2の残余
スペクトル値を処理することを意味する。スイッチングモジュール28及び加算
器26において、評価された残余スペクトル値を得るために、第2の残余スペク
トル値で第1の残余スペクトル値が評価され、その後量子化器/コーダ30に入
力される。よって、図1でのように、これは評価された残余スペクトル値を量子
化及びコード化する。TNS係数計算器25は、フィルタバンク24の後ろのT
NSコーダとフィルタバンク22の後ろのTNSコーダの両方に入力し、フィル
タバンク22の出力信号は、TNSフィルタリングの対象となるが、それはフィ
ルタバンク24の出力信号から計算されたTNS係数に基づいて行われる。図1
でのように、ビットストリームフォーマッタ18のTNS係数は、サイド情報と
して供給される。 図3は、図1に示されるスケーラブルオーディオコーダによってコード化され
たデータをデコーディングするためのデコーダを示す。図1のビットフォーマッ
タ18の出力データストリームは、データストリームxAUS から図1のライン4
2及び16上の信号を得るために、デマルチプレクサ46に与えられる。コード
化された第2の信号x2cは遅延エレメント48に入力され、遅延エレメント48
は、システムの他の側面のために必要とされ本願発明の構成要素ではないデータ
に遅延を導入する。 遅延の後、コード化された第2の信号x2cは、図3に示されるように、ライン
52を介して出力されるコード化/デコード化された第2の時間信号xcd2 を生
成するために、図1のコーダ/デコーダ14においても実行される第1のコーデ
ィングアルゴリズムによりデコーディングするデコーダ50に入力される。コー
ド化され評価された残余スペクトル値は、評価された残余スペクトル値を得るた
めに、再量子化器54により再量子化される。加算器58は、残余スペクトル値
及び任意の更なるレイヤー(破線で示される)の残余スペクトル値の合計を形成
する。 加算器26と同様に作動する加算器62の前で再び同じ状態を作り出すために
、加算器58の後にTNSデコーディングフィルタ59が続く。TNSデコーデ
ィングフィルタ59は、加算器58の出力信号に関して逆TNSフィルタリング
を行なう。ここでは、サイド情報に含まれる予測係数が使用されるが、これらは
図2のTNS係数計算器25によって計算されたものである。TNSデコーダ5
9の出力には、デコード化され評価されたスペクトル値Xb が存在する。 ここで、図3から分かるように、コード化/デコード化された第2の時間信号
は、第2のスペクトル値X2cd を得るために、まず適当なアップサンプリングフ
ィルタ63により変換され、フィルタバンク64により周波数ドメインに変換さ
れなければならないということが指摘される。なぜなら、加算器62の加算はス
ペクトル値の加算だからである。フィルタバンク64は、フィルタバンクFB1 22及びFB2 24と同一であることが好ましく、それによりただ1つの装
置のみが実行されなければならないことになり、それには、適当なバッファが据
え付けられ、連続して異なる信号が供給される。代わりに、適切でありさえすれ
ば、異なるフィルタバンクが用いられてもよい。 既に述べたように、スペクトル値の量子化で用いられる情報は、心理音響学モ
ジュール32により第1の時間信号x1 から得られる。送信されるデータ量を減
らすために、できるだけ粗くスペクトル値を量子化するよう特別な努力がなされ
る。一方、量子化により導入された障害は可聴であるべきではない。心理音響学
モジュール32に含まれそれ自体公知のモデルが、いかなる障害も可聴でない量
子化により導入され得る許容障害エネルギーの計算に使用される。制御部は、許
容障害より小さいかそれと等しい量子化障害を持ちこむ量子化を実行するために
、公知の量子化器/コーダにおける量子化器を制御する。これは、たとえばブロ
ック30に含まれる量子化器により量子化された信号が再び反量子化されるとい
う方法で、公知のシステムにおいて常に監視される。量子化器への入力信号と、
量子化/反量子化された信号とを比較することにより、量子化によって実際に導
入された障害エネルギーが計算される。量子化/反量子化された信号の実際の障
害エネルギーは、制御部において、許容障害エネルギーと比較される。実際の障
害エネルギーが許容障害エネルギーより大きければ、量子化器内の制御部は、量
子化の精密度を増加させる。許容障害エネルギーと実際の障害エネルギーとの比
較は、典型的に心理音響学周波数バンド毎に起こる。この方法は公知であり、サ
イマルキャストコーディングが使用される場合、本願発明によるスケーラブルオ
ーディオコーダにより使用される。 いわゆるポストフィルタ67は、第1段階のデコーダに相当するデコーダの出
力信号のある種のポストフィルタリングを行なうことが可能であり、デコーダ5
0の出力側に配置される。しかし、このフィルタは本願発明の構成要素ではない
。 図4は、図3のそれと同様のデコーダを示す。しかし、図4に示すデコーダは
、本願発明の第2の観点によりコード化された信号について作動する。図3とは
対照的に、逆スイッチングモジュール60は、TNSコード化された入力信号に
関して作動し、一方、図3の逆スイッチングモジュール60は、非TNS処理さ
れた入力信号すなわちTNSデコード化された信号に関して作動する。デコーダ
50の出力信号は、どこにおいても、コーダにおいてでさえも、TNSコード化
されていないので、図1及び図2のTNSコーディングフィルタ27と同じ方法
で実行されることが可能なTNSコーディングフィルタ27によりフィルタリン
グされなければならない。本願発明の第2の観点によるデコーダにおいて、締め
くくりのTNSデコーディングフィルタ59は、フィルタバンク22及び24の
フィルタバンク操作を反転させることが可能な逆フィルタバンク66の前に直接
配置される。変換コーダにおいて通常見られる図10Aに示される配置に相当す
るので、この配置が好ましい。TNSデコーディングフィルタ59及びTNSコ
ーディングフィルタ27の両方に、デマルチプレクサ46がコード化されたビッ
トストリームxAUS のサイド情報から抽出した予測係数が供給される。 図4によるデコーダにおける付加的なTNSコーディングフィルタ27は、最
小限により高い支出を表す。なぜなら、TNSフィルタパラメータ決定の間に確
認されたパラメータは、TNSデコーディングフィルタを計算できるように、い
かなる場合でも送信されるからである。それはまたデコーダにおいてTNSコー
ディングフィルタを計算するにも十分である。送信されたビットストリームにお
いて変更は必要ない。 当業者にとって、第1のサンプリング周波数が48kHzであり第2のサンプ
リング周波数が8kHzであるところの提示された実施例が、単なる例示である
ことは自明である。8kHzより低い周波数が第2の低い方のサンプリング周波
数として用いられてもよい。全体のシステムのサンプリング周波数としては、4
8kHz、44.1kHz、32kHz、24kHz、22.05kHz、16
kHz、8kHzまたはその他の適当なサンプリング周波数が使用されてよい。
第1の段階のコーダ/デコーダ14のビットレート範囲は、既に述べたように、
毎秒4.8kbitから毎秒8kbitまででよい。第2の段階の第2のコーダ
のビットレートの範囲は、サンプリングレート48、44. 1、32、24、1
6及び8kHzで、毎秒0から64、69.659、96、128、192及び
256kbitでよい。第3の段階のコーダのビットレート範囲は、全てのサン
プリングレートについて毎秒8kbitから毎秒448kbitでよい。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 タイヒマン ボド ドイツ連邦共和国 D−90427 ニュルン ベルク エバマンシュテター シュトラー セ 2 (72)発明者 ブランデンブルク カールハインツ ドイツ連邦共和国 D−91054 エアラン ゲン ハーグシュトラーセ 32 (72)発明者 ゲルホイザー ハインツ ドイツ連邦共和国 D−91344 ヴァイシ ェンフェルト ザウゲンドルフ 17 Fターム(参考) 5D045 DA20 5J064 AA01 BA01 BA13 BB03 BC02 BC08 BC11 BC16 BC18 BC27 BD03 【要約の続き】 れらの2つの信号は、互いに対して評価される(26, 28)。その後、評価された残余スペクトル値(Xb ) は、コード化され評価された残余スペクトル値(Xcb) を得るために、第2のコーディングアルゴリズムにより コード化され(30)、それらは計算された予測係数を 含むサイド情報とともに、ビットストリーム(xAUS ) 中に書き込まれる。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第1のサンプリングレートでサンプリングされた離散第1時 間信号(x1 )をコーディングする方法であって、以下のステップを含む: 第1の時間信号(x1 )から、第2のサンプリングレートに相当するバンド幅
    である第2の時間信号(x2 )を生成するステップであって、第2のサンプリン
    グレートは第1のサンプリングレートに等しいかまたはそれより低いステップ; コード化された第2の信号(x2c)を得るために、第1のコーディングアルゴ
    リズムにより第2の時間信号(x2 )をコーディングするステップ; 第2のサンプリング周波数に相当するバンド幅であるコード化/デコード化さ
    れた第2の時間信号(x2cd )を得るために、コード化された第2の信号(x2c )を第1のコーディングアルゴリズムによりデコーディングするステップ; 第1のスペクトル値(X1 )を得るために、第1の時間信号(x1 )を周波数
    ドメインに変換するステップ; 第1のスペクトル値(X1 )から予測係数を計算するステップ; コード化/デコード化された第2の時間信号(x2cd )から第2のスペクトル
    値(X2cd )を生成するステップであって、第2のスペクトル値(X2cd )はコ
    ード化/デコード化された第2の時間信号(x2cd )の周波数ドメインでの表示
    であるステップ; 第1のスペクトル値(X1 )の数に相当する数である評価されたスペクトル値
    (Xb )を得るために、第1のスペクトル値(X1 )を第2のスペクトル値(X 2cd )で評価するステップ; 評価された残余スペクトル値を得るために、計算された予測係数によって、周
    波数に関して評価されたスペクトル値の予測を行なうステップ;及び コード化され評価された残余スペクトル値を得るために、評価された残余スペ
    クトル値を、第2のコーディングアルゴリズムによってコーディングするステッ
    プ。
  2. 【請求項2】 第1のサンプリングレートでサンプリングされた離散第1時
    間信号(x1 )をコーディングする方法であって、以下のステップを含む: 第1の時間信号(x1 )から、第2のサンプリングレートに相当するバンド幅
    の第2の時間信号(x2 )を生成するステップであって、第2のサンプリングレ
    ートは第1のサンプリングレートに等しいかまたはそれより低いステップ; コード化された第2の信号(x2c)を得るために、第1のコーディングアルゴ
    リズムにより第2の時間信号(x2 )をコーディングするステップ; 第2のサンプリング周波数に相当するバンド幅であるコード化/デコード化さ
    れた第2の時間信号(x2cd )を得るために、コード化された第2の信号(x2c )を第1のコーディングアルゴリズムによりデコーディングするステップ; 第1のスペクトル値(X1 )を得るために、第1の時間信号(x1 )を周波数
    ドメインに変換するステップ; 第1のスペクトル値(X1 )から予測係数を計算するステップ; コード化/デコード化された第2の時間信号(x2cd )から第2のスペクトル
    値(X2cd )を生成するステップであって、第2のスペクトル値(X2cd )はコ
    ード化/デコード化された第2の時間信号(x2cd )の周波数ドメインでの表示
    であるステップ; 第1の残余スペクトル値及び第2の残余スペクトル値を得るために、計算され
    た予測係数を用いて、周波数に関して第1のスペクトル値(X1 )及び第2のス
    ペクトル値(X2cd )の予測を行なうステップ; 第1のスペクトル値(X1 )の数に相当する数である評価された残余スペクト
    ル値を得るために、第1の残余スペクトル値を第2の残余スペクトル値で評価す
    るステップ;及び コード化され評価された残余スペクトル値を得るために、評価された残余スペ
    クトル値(Xb )を第2のコーディングアルゴリズムによりコーディングするス
    テップ。
  3. 【請求項3】 オーディオ信号を表すビットストリームをデコーディングす
    る方法であって、ビットストリームは、第1のコーディングアルゴリズムにより
    コード化された信号、第2のコーディングアルゴリズムによりコード化された信
    号、及びサイド情報を有し、第2のコーディングアルゴリズムによりコード化さ
    れた信号は、コード化された残余スペクトル値を有し、残余スペクトル値は、周
    波数に関する予測によって、評価されたスペクトル値から生成され、予測の予測
    係数は、サイド情報の中に存在する方法であって、以下のステップを含む: コード化/デコード化された第2の時間信号(x2cd )を得るために、第1の
    コーディングアルゴリズムによりコード化されたコード化信号(x2c)を、第1
    のコーディングアルゴリズムによりデコーディングするステップ; 残余スペクトル値を得るために、コード化された残余スペクトル値を第2のコ
    ーディングアルゴリズムによりデコーディングするステップ; 第2のスペクトル値(X2cd )を得るために、コード化/デコード化された第
    2の時間信号(x2 )を周波数ドメインに変換するステップ; 評価されたスペクトル値(Xb )を得るために、サイド情報中に存在する予測
    係数を用いて、評価された残余スペクトル値に関して逆予測を行なうステップ; 第1のスペクトル値(X1 )を得るために、評価されたスペクトル値(Xb
    及び第2のスペクトル値(X2cd )を逆評価するステップ;及び 第1の時間信号(x1 )を得るために、第1のスペクトル値(X1 )を時間ド
    メインに変換して戻すステップ。
  4. 【請求項4】 オーディオ信号を表すビットストリームをデコーディングす
    る方法であって、ビットストリームは、第1のコーディングアルゴリズムにより
    コード化された信号、第2のコーディングアルゴリズムによりコード化された信
    号、及びサイド情報を有し、第2のコーディングアルゴリズムによりコード化さ
    れた信号は、コード化された残余スペクトル値を有し、残余スペクトル値は、周
    波数に関する予測によって、評価されたスペクトル値から生成され、予測の予測
    係数は、サイド情報中に存在する方法であって、以下のステップを含む: コード化/デコード化された第2の時間信号(x2cd )を得るために、第1の
    コーディングアルゴリズムによりコード化されたコード化信号(x2c)を、第1
    のコーディングアルゴリズムによりデコーディングするステップ; 残余スペクトル値を得るために、コード化された残余スペクトル値を第2のコ
    ーディングアルゴリズムによりデコーディングするステップ; 第2のスペクトル値(X2cd )を得るために、コード化/デコード化された第
    2の時間信号(x2 )を周波数ドメインに変換するステップ; 第2の残余スペクトル値を得るために、サイド情報中に存在する予測係数を用
    いて、第2のスペクトル値(X2cd )に関して予測を行なうステップ; 残余スペクトル値を得るために、評価された残余スペクトル値及び第2の残余
    スペクトル値を逆評価するステップ; 第1のスペクトル値(X1 )を得るために、サイド情報中に蓄積されている予
    測係数を用いて、残余スペクトル値に関して逆予測を行なうステップ;及び 第1の時間信号(x1 )を得るために、第1のスペクトル値(X1 )を時間ド
    メインに変換して戻すステップ。
  5. 【請求項5】 第1のサンプリングレートでサンプリングされた離散第1時
    間信号(x1 )をコーディングするための装置(10)であって、以下の特徴を
    含む: 第2のサンプリングレートに相当するバンド幅の第2の時間信号(x2 )を第
    1の時間信号(x1 )から生成するためのデバイス(12)であって、第2のサ
    ンプリングレートは第1のサンプリングレートに等しいかまたはそれより低いデ
    バイス(12); コード化された第2の信号(x2c)を得るために、第2の時間信号(x2 )を
    第1のコーディングアルゴリズムによりコーディングするためのデバイス(14
    ); 第2のサンプリング周波数に相当するバンド幅であるコード化/デコード化さ
    れた第2の時間信号(x2cd )を得るために、コード化された第2の信号(x2c )を第1のコーディングアルゴリズムによりデコーディングするためのデバイス
    (14); 第1のスペクトル値(X1 )を得るために、第1の時間信号(x1 )を周波数
    ドメインに変換するためのデバイス(24); 第1のスペクトル値(X1 )から予測係数を計算するためのデバイス(25)
    ; コード化/デコード化された第2の時間信号(x2cd )から第2のスペクトル
    値(X2cd )を生成するためのデバイス(22,23)であって、第2のスペク
    トル値(X2cd )は、コード化/デコード化された第2の時間信号(x2cd )の
    周波数ドメインでの表示であるデバイス(22,23); 第1のスペクトル値(X1 )の数に相当する数である評価されたスペクトル値
    (Xb )を得るために、第1のスペクトル値(X1 )を第2のスペクトル値(X 2cd )で評価するためのデバイス(26,28); 評価された残余スペクトル値を得るために、計算された予測係数によって、周
    波数に関して評価されたスペクトル値の予測を行なうためのデバイス(27);
    及び コード化され評価された残余スペクトル値を得るために、評価された残余スペ
    クトル値を第2のコーディングアルゴリズムによりコーディングするためのデバ
    イス(30)。
  6. 【請求項6】 第1のサンプリングレートでサンプリングされた離散第1時
    間信号(x1 )をコーディングするための装置(10)であって、以下の特徴を
    含む: 第2のサンプリングレートに相当するバンド幅である第2の時間信号(x2
    を、第1の時間信号(x1 )から生成するためのデバイス(12)であって、第
    2のサンプリングレートは、第1のサンプリングレートに等しいかまたはそれよ
    り低いデバイス(12); コード化された第2の信号(x2c)を得るために、第2の時間信号(x2 )を
    第1のコーディングアルゴリズムによりコーディングするためのデバイス(14
    ); 第2のサンプリング周波数に相当するバンド幅であるコード化/デコード化さ
    れた第2の時間信号(x2cd )を得るために、コード化された第2の信号(x2c )を第1のコーディングアルゴリズムによりデコーディングするためのデバイス
    (14); 第1のスペクトル値(X1 )を得るために、第1の時間信号(x1 )を周波数
    ドメインに変換するためのデバイス(24); 第1のスペクトル値(X1 )から予測係数を計算するためのデバイス(25)
    ; コード化/デコード化された第2の時間信号(x2cd )から第2のスペクトル
    値(X2cd )を生成するためのデバイス(22,23)であって、第2のスペク
    トル値(X2cd )はコード化/デコード化された第2の時間信号(x2cd )の周
    波数ドメインでの表示であるデバイス(22,23); 第1の残余スペクトル値及び第2の残余スペクトル値を得るために、第1のス
    ペクトル値(X1 )及び第2のスペクトル値(X2cd )の周波数に関する予測を
    、計算された予測係数を用いて行なうためのデバイス(27); 第1のスペクトル値(X1 )の数に相当する数である評価された残余スペクト
    ル値を得るために、第1の残余スペクトル値を第2の残余スペクトル値で評価す
    るためのデバイス(26,28);及び コード化され評価された残余スペクトル値を得るために、評価された残余スペ
    クトル値(Xb )を第2のコーディングアルゴリズムによりコーディングするた
    めのデバイス(30)。
  7. 【請求項7】 オーディオ信号を表すビットストリームをデコーディングす
    るための装置であって、ビットストリームは、第1のコーディングアルゴリズム
    によりコード化された信号、第2のコーディングアルゴリズムによりコード化さ
    れた信号、及びサイド情報を有し、第2のコーディングアルゴリズムによりコー
    ド化された信号は、コード化された残余スペクトル値を有し、残余スペクトル値
    は、評価されたスペクトル値から周波数に関する予測により生成され、予測の予
    測係数は、サイド情報中に存在する装置であって、以下の特徴を含む: コード化/デコード化された第2の時間信号(x2cd )を得るために、第1の
    コーディングアルゴリズムによりコード化されたコード化信号(x2c)を、第1
    のコーディングアルゴリズムによりデコーディングするためのデバイス(50)
    ; 残余スペクトル値を得るために、コード化された残余スペクトル値を第2のコ
    ーディングアルゴリズムによりデコーディングするためのデバイス(54); 第2のスペクトル値(X2cd )を得るために、コード化/デコード化された第
    2の時間信号(x2 )を周波数ドメインに変換するためのデバイス(64); 評価されたスペクトル値(Xb )を得るために、サイド情報中に存在する予測
    係数を用いて、評価された残余スペクトル値に関して逆予測を行なうためのデバ
    イス(59); 第1のスペクトル値(X1 )を得るために、評価されたスペクトル値(Xb
    及び第2のスペクトル値(X2cd )を逆評価するためのデバイス(60,62)
    ;及び 第1の時間信号(x1 )を得るために、第1のスペクトル値(X1 )を時間ド
    メインに変換して戻すためのデバイス(66)。
  8. 【請求項8】 オーディオ信号を表すビットストリームをデコーディングす
    るための装置であって、ビットストリームは、第1のコーディングアルゴリズム
    によりコード化された信号、第2のコーディングアルゴリズムによりコード化さ
    れた信号、及びサイド情報を有し、第2のコーディングアルゴリズムによりコー
    ド化された信号は、コード化された残余スペクトル値を有し、残余スペクトル値
    は、評価されたスペクトル値から周波数に関する予測により生成され、予測の予
    測係数は、サイド情報中に存在する装置であって、以下の特徴を含む: コード化/デコード化された第2の時間信号(x2cd )を得るために、第1の
    コーディングアルゴリズムによりコード化されたコード化信号(x2c)を、第1
    のコーディングアルゴリズムによりデコーディングするためのデバイス(50)
    ; 残余スペクトル値を得るために、コード化された残余スペクトル値を第2のコ
    ーディングアルゴリズムによりデコーディングするためのデバイス(54); 第2のスペクトル値(X2cd )を得るために、コード化/デコード化された第
    2の時間信号(x2 )を周波数ドメインに変換するためのデバイス(64); 第2の残余スペクトル値を得るために、サイド情報中に存在する予測係数を用
    いて、第2のスペクトル値(X2cd )に関する予測を行なうためのデバイス(2
    7); 残余スペクトル値を得るために、評価された残余スペクトル値及び第2の残余
    スペクトル値を逆評価するためのデバイス(60,62); 第1のスペクトル値(X1 )を得るために、サイド情報中に蓄積されている予
    測係数を用いて、残余スペクトル値に関する逆予測を行なうためのデバイス(5
    9);及び 第1の時間信号(x1 )を得るために、第1のスペクトル値(X1 )を時間ド
    メインに変換して戻すためのデバイス(60)。
JP2000518448A 1997-10-24 1998-07-07 オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置 Expired - Lifetime JP3366903B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19747132A DE19747132C2 (de) 1997-10-24 1997-10-24 Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE19747132.3 1997-10-24
PCT/EP1998/004200 WO1999022451A2 (de) 1997-10-24 1998-07-07 Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms

Publications (2)

Publication Number Publication Date
JP2001522156A true JP2001522156A (ja) 2001-11-13
JP3366903B2 JP3366903B2 (ja) 2003-01-14

Family

ID=7846578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000518448A Expired - Lifetime JP3366903B2 (ja) 1997-10-24 1998-07-07 オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置

Country Status (9)

Country Link
US (1) US6502069B1 (ja)
EP (1) EP1025646B1 (ja)
JP (1) JP3366903B2 (ja)
KR (1) KR100331166B1 (ja)
AT (1) ATE206252T1 (ja)
AU (1) AU726762B2 (ja)
CA (1) CA2301663C (ja)
DE (2) DE19747132C2 (ja)
WO (1) WO1999022451A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8046234B2 (en) 2002-12-16 2011-10-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data with scalability

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3580777B2 (ja) * 1998-12-28 2004-10-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
EP1190415B1 (en) * 2000-03-15 2007-08-08 Koninklijke Philips Electronics N.V. Laguerre function for audio coding
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
SG99314A1 (en) * 2000-07-19 2003-10-27 Ct For Signal Proc Nanyang Tec Method and apparatus for the prediction of audio signals
JP4538705B2 (ja) * 2000-08-02 2010-09-08 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
ES2266481T3 (es) * 2001-04-18 2007-03-01 Koninklijke Philips Electronics N.V. Codificacion de audio con encriptacion parcial.
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
US7970606B2 (en) * 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US8359197B2 (en) 2003-04-01 2013-01-22 Digital Voice Systems, Inc. Half-rate vocoder
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
AU2012205170B2 (en) * 2004-08-25 2015-05-14 Dolby Laboratories Licensing Corporation Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
MX2007003063A (es) * 2004-09-17 2007-05-16 Koninkl Philips Electronics Nv Codificacion combinada de audio que minimiza la distorsion perceptual.
US7554989B2 (en) * 2005-01-18 2009-06-30 Creative Technology Ltd. Real time optimization over a shared communication channel
KR100738077B1 (ko) * 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
DE102006010390A1 (de) * 2006-03-03 2007-09-06 Micronas Gmbh Verfahren zum Bereitstellen eines Gesamtsignals zum Übertragen als ein Rundfunksignal, Sendevorrichtung und Empfangsvorrichtung dafür
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
AU2006340728B2 (en) * 2006-03-28 2010-08-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Enhanced method for signal shaping in multi-channel audio reconstruction
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
KR101425354B1 (ko) * 2007-08-28 2014-08-06 삼성전자주식회사 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8614994B2 (en) * 2009-07-09 2013-12-24 Broadcom Corporation Method and system for implementing multiple timing domains for primary and secondary synchronization detection in EUTRA/LTE
EP2481048B1 (en) * 2009-09-25 2017-10-25 Nokia Technologies Oy Audio coding
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
DK2556504T3 (en) 2010-04-09 2019-02-25 Dolby Int Ab MDCT-BASED COMPLEX PREVIEW Stereo Encoding
WO2012152764A1 (en) * 2011-05-09 2012-11-15 Dolby International Ab Method and encoder for processing a digital stereo audio signal
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP3511935B1 (en) 2014-04-17 2020-10-07 VoiceAge EVS LLC Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
CN112311480B (zh) * 2020-10-29 2023-03-14 上海电机学院 一种通信辐射源个体识别方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310480C2 (de) * 1983-03-23 1986-02-13 Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen Digitales Codierverfahren für Audiosignale
DE19549621B4 (de) * 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
US6161089A (en) * 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8046234B2 (en) 2002-12-16 2011-10-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data with scalability

Also Published As

Publication number Publication date
CA2301663A1 (en) 1999-05-06
AU8857798A (en) 1999-05-17
EP1025646B1 (de) 2001-09-26
DE59801589D1 (de) 2001-10-31
US6502069B1 (en) 2002-12-31
DE19747132C2 (de) 2002-11-28
KR20010015588A (ko) 2001-02-26
KR100331166B1 (ko) 2002-04-03
EP1025646A2 (de) 2000-08-09
WO1999022451A3 (de) 1999-07-29
WO1999022451A2 (de) 1999-05-06
AU726762B2 (en) 2000-11-23
DE19747132A1 (de) 1999-04-29
ATE206252T1 (de) 2001-10-15
JP3366903B2 (ja) 2003-01-14
CA2301663C (en) 2004-06-15

Similar Documents

Publication Publication Date Title
JP2001522156A (ja) オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置
JP3391686B2 (ja) 符号化されたオーディオ信号を復号する方法及び装置
CN105913851B (zh) 对音频/语音信号进行编码和解码的方法和设备
EP2044589B1 (en) Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
Iwakami et al. High-quality audio-coding at less than 64 kbit/s by using transform-domain weighted interleave vector quantization (TWINVQ)
CN1809872B (zh) 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
EP1111589B1 (en) Wideband speech coding with parametric coding of high frequency component
KR19990041073A (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치
JP3420250B2 (ja) 離散信号のコード化およびコード化された離散信号のデコード化のための各方法および各装置
JPH08263098A (ja) 音響信号符号化方法、音響信号復号化方法
JP2002041099A (ja) マスク済み閾値表現方法、再構成方法、及びそのシステム
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
Esteban et al. 9.6/7.2 kbps voice excited predictive coder (VEPC)
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
Crochiere et al. Frequency domain techniques for speech coding
JP4618823B2 (ja) 信号符号化装置及び方法
Ganapathy et al. Autoregressive models of amplitude modulations in audio compression
LeRoux et al. Comparison of the wavelet decomposition and the fourier transform in TCX encoding of wideband speech and audio
Taniguchi et al. A high-efficiency speech coding algorithm based on ADPCM with Multi-Quantizer
Ning et al. Wideband audio compression using a combined wavelet and WLPC representation
Ning Analysis and coding of high quality audio signals
Boland et al. A new hybrid LPC-DWT algorithm for high quality audio coding
Movassagh New approaches to fine-grain scalable audio coding
Du et al. Reduced complexity conditional entropy coding of LSP parameters

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071101

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081101

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091101

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101101

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111101

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121101

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131101

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term