JPH1051313A - マルチチャネルオーディオ信号のジョイントステレオ符号化方法 - Google Patents

マルチチャネルオーディオ信号のジョイントステレオ符号化方法

Info

Publication number
JPH1051313A
JPH1051313A JP9064052A JP6405297A JPH1051313A JP H1051313 A JPH1051313 A JP H1051313A JP 9064052 A JP9064052 A JP 9064052A JP 6405297 A JP6405297 A JP 6405297A JP H1051313 A JPH1051313 A JP H1051313A
Authority
JP
Japan
Prior art keywords
signal
spectral component
channel
generating
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9064052A
Other languages
English (en)
Other versions
JP3316159B2 (ja
Inventor
Juergen Heinrich Herre
ハインリッヒ ヘール ジャーゲン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JPH1051313A publication Critical patent/JPH1051313A/ja
Application granted granted Critical
Publication of JP3316159B2 publication Critical patent/JP3316159B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 インテンシティステレオ符号化/復号信号の
知覚されるステレオイメージを改善する。 【解決手段】 符号化側では、各チャネルの入力信号を
高分解能フィルタバンク/変換によってスペクトル係数
に分解する。次に、知覚モデルを用いて、各チャネルご
とに1つ以上の時間依存マスキングしきい値を評価す
る。これは、知覚的に障害のない信号品質を維持しなが
ら、オーディオ信号に導入される可能性のある最大の符
号化エラーを与える。次に、各チャネルごとに、周波数
の線形予測を実行するフィルタをフィルタバンク出力に
適用し、実際のフィルタバンク出力信号ではなくその残
差に、従来のインテンシティステレオ符号化法を適用し
た後、復号側へ送信する。復号側では、従来のインテン
シティステレオ復号の後、上記の符号化側の動作と逆の
動作を実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号符
号化の分野に関し、特に、マルチチャネルオーディオ信
号のジョイントステレオ符号化を実行する方法および装
置の改善に関する。
【0002】
【従来の技術】過去数年の間に、いわゆる「知覚オーデ
ィオ符号器」が開発され、従来のコンパクトディスク媒
体(CD)上で一般に使用されているビットレートの約
1/12以下のビットレートで高品質オーディオ信号の
伝送および蓄積が可能となっている。このような符号器
は、オーディオ信号に含まれる、人間の聴覚系の制限に
より無関係な部分を利用して、知覚的に区別できない再
構成された(すなわち復号された)信号となるのに必要
な精度のみで信号を符号化する。さまざまな標準化団体
で、国際標準化機構の動画像専門グループ(ISO/M
PEG)のMPEG1およびMPEG2オーディオ標準
のような標準が制定されている。知覚オーディオ符号器
は、例えば、米国特許第5,285,498号(発明
者:James D.Johnston、発行日:1994年2月8
日)、米国特許第5,341,457号(発明者:Jose
ph L. Hall, James D. Johnston、発行日:1994年
8月23日)に詳細に記載されている。
【0003】一般に、モノトーンオーディオ信号に対す
る知覚オーディオ符号器の構造は以下のように記述する
ことができる。
【0004】・さまざまなタイプのフィルタバンクおよ
び変換(例えば周知の修正離散コサイン変換(MDC
T)、多相フィルタバンクあるいは混成構造)を用い
て、入力サンプルを、サブサンプリングされたスペクト
ル表現に変換する。
【0005】・知覚モデルを用いて、信号に対する1つ
以上の時間依存マスキングしきい値を評価する。これら
のしきい値は、知覚的に障害のない信号品質を維持しな
がら、オーディオ信号に導入される可能性のある最大の
符号化エラーを与える。特に、これらのマスキングしき
い値は、サブバンドごとに個別に決定されることも可能
である。すなわち、各符号器周波数バンドは、1つ以上
のスペクトル係数のグループからなり、それらは、対応
して決定されるマスキングしきい値に基づいてまとめて
符号化される。
【0006】・スペクトル値を、マスキングしきい値評
価値に対応する精度に従って量子化し(符号器周波数バ
ンドごとに)符号化する。このようにして、量子化ノイ
ズはそれぞれの送信信号によって隠され(すなわちマス
クされ)、それによって、復号後には知覚されない。
【0007】・最後に、すべての関連する情報(例え
ば、符号化されたスペクトル値と、それ以外の補助情
報)を、ビットストリームにパックし、復号器へ送信す
る。
【0008】これに応じて、対応する復号器で用いられ
る処理は逆になる。
【0009】・ビットストリームを復号し、符号化され
たスペクトルデータと補助情報へと解析する。
【0010】・量子化されたスペクトル値の逆量子化
を、(符号器で用いられたものに対応して周波数バンド
ごとに)実行する。
【0011】・合成フィルタバンクを用いてスペクトル
値を時間領域表現にマッピングする。
【0012】このような一般的な符号器構造を用いて、
人間聴覚系の制限による各信号内に含まれる無関係な部
分を効率的に利用することが可能となる。特に、量子化
ノイズのスペクトルは、信号のノイズマスキングしきい
値の形状に従って整形することができる。このようにし
て、符号化プロセスから生じるノイズは符号化された信
号の下に「隠す」ことができ、知覚的に透過的な品質が
高い圧縮レートで実現される。
【0013】モノトーン信号に対する知覚符号化技術
は、2チャネルあるいはマルチチャネルのステレオ信号
の符号化に拡張されている。特に、各入力信号に対して
別々の(すなわち独立の)符号化プロセスを実行するの
ではなく、入力信号にジョイント(結合、同時)信号処
理を実行する、いわゆる「ジョイントステレオ」符号化
技術が導入されている。(注意すべき点であるが、一般
に用いられており当業者には周知のように、「ステレ
オ」という用語は複数のオーディオチャネルの使用を指
す。)
【0014】ジョイントステレオ符号化技術の使用には
少なくとも2つの利点がある。第1に、ジョイントステ
レオ符号化法の使用は、バイノラルな(両耳の)音響心
理学的効果を取り入れる能力を提供する。第2に、ステ
レオ信号の符号化に必要なビットレートは、各チャネル
に対して個別かつ独立に符号化を実行するのに必要なビ
ットレートよりも大幅に減少する。
【0015】一般に、マルチチャネルステレオ知覚オー
ディオ符号器の構造は以下のように記述することができ
る。
【0016】・さまざまなタイプのフィルタバンクおよ
び変換(例えば修正離散コサイン変換(MDCT)、多
相フィルタバンクあるいは混成構造)を用いて、各入力
信号のサンプルを、サブサンプリングされたスペクトル
表現に変換する。
【0017】・知覚モデルを用いて、信号に対する時間
依存マスキングしきい値を各チャネルごとに評価する。
これは、知覚的に障害のない信号品質を維持しながら、
オーディオ信号に導入される可能性のある最大の符号化
エラーを与える。
【0018】・ジョイントステレオ符号化を実行するた
め、スペクトル係数データの一部を同時処理し、ステレ
オ信号の効率的表現を得る。使用するジョイントステレ
オ符号化法に応じて、マスキングしきい値にも調整がな
されることがある。
【0019】・マスキングしきい値評価値に対応する精
度に従ってスペクトル値を量子化し符号化する。このよ
うにして、量子化ノイズはそれぞれの送信信号によって
隠され(すなわちマスクされ)、それによって、復号後
には知覚されない。
【0020】・最後に、すべての関連する情報(例え
ば、符号化されたスペクトル値と、それ以外の補助情
報)を、ビットストリームにパックし、復号器へ送信す
る。
【0021】これに応じて、復号器で用いられる処理は
符号器とは逆になる。
【0022】・ビットストリームを復号し、符号化され
たスペクトルデータと補助情報へと解析する。
【0023】・量子化されたスペクトル値の逆量子化を
実行する。
【0024】・ジョイントステレオ処理に対する復号プ
ロセスをスペクトル値に対して実行し、それによって、
各チャネルごとに別々の信号を得る。
【0025】・各チャネルに対するスペクトル値を、対
応する合成フィルタバンクを用いて時間領域表現にマッ
ピングする。
【0026】現在では、最も一般的に用いられるジョイ
ントステレオ符号化方式として、「ミッド/サイド」
(M/S)ステレオ符号化と、「インテンシティ」ステ
レオ符号化の2つが知られている。M/Sステレオ符号
化に基づく符号器の構造および動作は、例えば、米国特
許第5,285,498号(前掲)に記載されている。
この技術を用いて、バイノラルマスキング効果が取り入
れられるとともに、信号に依存する利得が幾分か実現さ
れる。
【0027】しかし、インテンシティステレオ法は、ビ
ット節約の高い可能性を有する。特に、この方法は、す
べてのジョイント符号化チャネル信号に対してただ1つ
のスペクトル係数セットを送信することによって、高い
周波数(例えば、4kHz以上の周波数)における人間
聴覚系の制限を利用し、それにより、データレートの大
幅な節約を実現する。インテンシティステレオ原理に基
づく符号器は、欧州特許出願0 497 413 A1
(発明者:R. Veldhuis他、出願日:1992年1月2
4日、公開日:1992年8月5日)、および、(異な
る用語を用いているが)国際出願公開WO92/126
07(発明者:M. Davis他、出願日:1992年1月8
日、公開日:1992年7月23日)などのいくつかの
文献に記載されている。
【0028】量子化前のスペクトル係数にジョイントス
テレオ処理を適用することによって、必要なビットレー
トに関してさらに節約が実現される。インテンシティス
テレオ符号化の場合、このような節約の一部は、人間聴
覚系が高い周波数(例えば、4kHz以上の周波数)の
位相情報に敏感でないことが知られているという事実か
ら導出される。人間の有毛細胞の特性により、信号波形
そのものではなく信号のエンベロープ(包絡線)が知覚
的に評価される。従って、信号の波形全体を符号化する
必要はなく、信号のエンベロープを符号化すれば十分で
ある。これは、例えば、各チャネルごとに別々の係数セ
ットを送信するのではなく、すべての関連するチャネル
に対する1つの共通のスペクトル係数セット(以下「キ
ャリア信号」という。)を送信することによって実現さ
れる。その後、復号器では、このキャリア信号を各信号
チャネルごとに独立にスケーリングして、それぞれの符
号器ブロックに対する平均エンベロープ(あるいは信号
エネルギー)に一致させる。
【0029】インテンシティステレオ符号化/復号では
符号器周波数バンドごとに以下の処理ステップが一般に
実行される。
【0030】・すべての関連チャネルのスペクトル係数
から、複数のチャネル信号を表現するのに適した1つの
「キャリア」信号を生成する。これは通常は、部分信号
の線形結合を形成することによってなされる。
【0031】・個々の符号器周波数バンドのエンベロー
プあるいはエネルギー内容を記述するスケーリング情報
をもとの信号から抽出する。
【0032】・キャリア信号およびスケーリング情報の
両方を復号器へ送信する。
【0033】・復号器では、キャリア信号のスペクトル
係数を再構成する。その後、各チャネルごとのスケーリ
ング情報を用いてキャリア信号をスケーリングすること
によって各チャネルごとのスペクトル係数を計算する。
【0034】このアプローチの結果、各チャネル信号に
対するスペクトル成分の別々のセットを送信する必要は
なく、ただ1つのスペクトル係数セット(すなわち、キ
ャリア信号の係数セット)を、少量の補助情報とともに
送信するだけでよい。2チャネルステレオの場合、この
結果として、インテンシティ符号化周波数領域のデータ
レートはほぼ50%節約される。
【0035】しかし、このアプローチの利点にもかかわ
らず、インテンシティステレオ符号化法の過度のあるい
は制御されない適用により、知覚されるステレオイメー
ジが劣化することがある。その理由は、一定時間にわた
る信号の詳細構造は、符号化方式の粒度(例えば、ブロ
ックあたり20ms)よりも短い期間では保持されない
ためである。特に、単一のキャリアの使用の結果とし
て、それから再構成されるすべての出力信号は必然的に
互いのスケーリングされたものとなる。換言すれば、符
号化ブロックの継続時間(例えば10〜20ms)では
同じ微細エンベロープ構造を有する。これは、静止信
号、あるいは、インテンシティステレオ符号化チャネル
において類似の微細エンベロープ構造を有する信号では
重大な問題を生じない。
【0036】しかし、異なるチャネルで非類似のエンベ
ロープを有する過渡信号では、符号化チャネル間のエン
ベロープ開始のもとの分布は回復できない。例えば、拍
手する聴衆のステレオ録音では、両側のチャネルで別々
の拍手事象が異なる時刻に起こることにより、個々のエ
ンベロープは左右のチャネルで非常に異なることにな
る。同様の効果は、ステレオマイクロフォンを用いるこ
とによって制作される録音で生じる。例えば、音源の空
間的位置は、本質的に、それぞれのチャネル信号間の時
間差すなわち遅延として符号化される。その結果、イン
テンシティステレオ符号化/復号信号のステレオイメー
ジ品質はこれらの場合には大幅に低下することになる。
空間的印象は結果的に狭くなり、知覚されるステレオイ
メージは中心位置につぶれることになる。臨界的な信号
に対しては、達成される品質は許容できないものとなる
ことがある。
【0037】
【発明が解決しようとする課題】インテンシティステレ
オ符号化/復号信号のステレオイメージの劣化を回避す
るためにいくつかの方略が提案されている。インテンシ
ティステレオ符号化を用いることにはステレオイメージ
に影響を与える危険があるため、符号器のビット数が足
りなくなったときにのみこの技術を用いることにより、
聴取者にいっそう不快であると知覚される重大な量子化
歪みを回避することができる。あるいは、チャネルの微
細な時間構造の非類似性を検出するアルゴリズムを用い
ることができる。エンベロープの不一致が検出される
と、インテンシティステレオ符号化をそのブロックには
適用しない。このようなアプローチは、例えば、"Inten
sity Stereo Coding" (J. Herre et al., 96th Audio E
ngineering Society Convention, Amsterdam, February
1994)に記載されている。しかし、このような信号に対
してインテンシティステレオ符号化が無効にされる場合
にビット節約の可能性が完全に利用されないことは、従
来提案されている解決法の明らかな欠点である。
【0038】
【課題を解決するための手段】本発明の実施例によれ
ば、インテンシティステレオ符号化法を用いてマルチチ
ャネルオーディオ信号のジョイントステレオ符号化を実
行する方法および装置によって、従来技術の欠点が克服
される。特に、予測フィルタリング法をスペクトル係数
データに適用することにより、各チャネルの出力信号の
微細時間構造を保持しながら、インテンシティステレオ
符号化によって提供される高いビットレート節約の利益
を維持する。本発明の一実施例では、2チャネルステレ
オ信号の符号器で以下に以下の処理ステップを適用する
ことによって、インテンシティステレオ符号化/復号信
号の知覚されるステレオイメージを改善する方法が実現
される。
【0039】・各チャネルの入力信号を高分解能フィル
タバンク/変換によってスペクトル係数に分解する。
【0040】・知覚モデルを用いて、各チャネルごとに
1つ以上の時間依存マスキングしきい値を評価する。こ
れは、知覚的に障害のない信号品質を維持しながら、オ
ーディオ信号に導入される可能性のある最大の符号化エ
ラーを与える。
【0041】・各チャネルごとに、周波数の線形予測を
実行するフィルタをフィルタバンク出力に適用し、実際
のフィルタバンク出力信号ではなくその残差が以下のス
テップで使用される。
【0042】・インテンシティステレオ符号化法を適用
して両方の残差信号を1つのキャリア信号へと符号化す
る。
【0043】・マスキングしきい値評価値に対応する精
度に従ってキャリア信号のスペクトル値を量子化し符号
化する。
【0044】・すべての関連する情報(すなわち、符号
化されたスペクトル値、インテンシティスケーリングデ
ータ、各チャネルごとの予測フィルタデータ、および、
それ以外の補助情報)を、ビットストリームにパック
し、復号器へ送信する。
【0045】同様に、本発明のもう1つの実施例によれ
ば、上記の符号器に対応して、ジョイントステレオ符号
化信号の復号器は、以下の処理ステップを実行する。
【0046】・ビットストリームを復号し、符号化され
たスペクトルデータと補助情報へと解析する。
【0047】・キャリア信号の量子化スペクトル値の逆
量子化を実行する。
【0048】・キャリア信号のスペクトル値に対してイ
ンテンシティステレオ復号を実行することにより、各チ
ャネルごとの(残差)信号を生成する。
【0049】・各チャネルごとに、周波数に関して作用
しもとの信号を符号化するために用いられた符号器によ
って適用された予測フィルタに対応する逆予測フィルタ
を残差信号に適用する。
【0050】・逆予測フィルタによって生成されたスペ
クトル値を、合成フィルタバンクを用いて時間領域表現
にマッピングする。
【0051】
【発明の実施の形態】
[概要]本発明の実施例によれば、予測フィルタリング
プロセスを符号器および復号器に組み込むことにより、
同一の微細エンベロープ構造がすべてのインテンシティ
ステレオ復号チャネル信号で生成されるという従来の方
式の制限を克服することによって、インテンシティステ
レオ符号化/復号信号の品質が改善される。特に、本発
明の符号化方法は、予測フィルタリング段でフィルタバ
ンクを効果的に拡張し、一定周波数にわたる共通のエン
ベロープ情報をフィルタ係数として抽出し、ほとんどの
部分で残差信号から除去することによって、従来技術の
欠点を克服する。
【0052】具体的には、各入力チャネル信号に対し
て、その対応するスペクトル係数データに対する線形予
測を実行する。この線形予測は、周波数に関して実行さ
れる。予測符号化がスペクトル領域データに適用される
ため、古典的な予測について知られている関係は、時間
領域と周波数領域を入れ換えることにより正しいものと
なる。例えば、予測エラー信号は理想的には、「平坦
な」パワースペクトルを有するのではなく、「平坦な」
(正方形の)エンベロープを有する(「前白色化」フィ
ルタ効果)。各チャネル信号に対する微細時間構造情報
はその予測フィルタ係数に含まれる。従って、インテン
シティステレオ符号化に用いられるキャリア信号もまた
平坦なエンベロープを有すると仮定することができる。
その理由は、このキャリア信号は、(フィルタリングさ
れた)チャネル信号の線形結合を形成することによって
生成されるためである。
【0053】本発明の実施例による対応する復号器で
は、送信されたスケーリング情報に従って各チャネル信
号を再スケーリングし、逆フィルタリングプロセスをス
ペクトル係数に適用する。このようにして、逆の「前白
色化」プロセスを各復号チャネル信号のエンベロープに
対して実行し、エンベロープ情報をスペクトル係数に効
果的に導入する。これは各チャネルごとに個別に行われ
るため、拡張された符号化/復号システムは、各チャネ
ル信号ごとの個別の微細エンベロープ構造を再生するこ
とが可能となる。注意すべき点であるが、実際、周波数
に関してフィルタバンクと線形予測の組合せを使用する
ことは、入力信号のエンベロープに一致する適応フィル
タバンクを使用することと等価である。信号をエンベロ
ープ整形するプロセスは、信号のスペクトル全体に対し
ても、あるいは、その一部のみに対しても実行すること
ができるため、この時間領域エンベロープ制御は、周波
数に依存して必要に応じて適用することができる。
【0054】本発明のもう1つの実施例によれば、例え
ば上記の実施例の符号器(図2、図3および図7を参照
して以下で詳細に説明する)によって生成されるビット
ストリームは、コンパクトディスクやディジタルオーデ
ィオテープのような記憶媒体に、あるいは、半導体メモ
リデバイスに、記憶することができる。その後、このよ
うな記憶媒体を「読み出し」、例えば上記の実施例の復
号器(図5、図6および図8を参照して以下で詳細に説
明する)によって復号するためのビットストリームを供
給することができる。このようにして、かなりの量のオ
ーディオデータ(例えば音楽)を、再構成信号における
(知覚的な)品質の損失なしに、与えられた記憶媒体上
に圧縮することができる。
【0055】[従来の符号器]図1に、従来のインテン
シティステレオ符号化法が使用される2チャネルステレ
オ信号用の従来の知覚符号器を示す。図1の符号器は以
下のように動作する。
【0056】・左入力信号xl(k)および右入力信号
xr(k)はそれぞれ、分析フィルタバンク/変換モジ
ュール12lおよび12rによってスペクトル係数に分
解され、各分析ブロックごとにそれぞれn個のスペクト
ル成分の対応するセットyl(b,0...n−1)およ
びyr(b,0...n−1)が得られる。ただし、nは
分析ブロックごとのスペクトル係数の数(すなわちブロ
ックサイズ)である。各スペクトル成分yl(b,i)
あるいはyr(b,i)は、使用される個々のフィルタ
バンクによる分析周波数に対応する。
【0057】・各チャネルに対して、知覚モデル11l
あるいは11rは、符号化/復号信号の知覚的に透過的
な品質のために必要な符号化精度を評価する。この評価
データは、例えば、各符号器バンドに必要な最小の信号
対ノイズ比(SNR)に基づいており、量子化/符号化
モジュールに渡される。
【0058】・左右の両方のチャネルのスペクトル値y
l(b,0...n−1)およびyr(b,0...n−1)
がインテンシティステレオ符号化モジュール13に送ら
れる。インテンシティステレオ符号化モジュール13
は、従来のインテンシティステレオ符号化を実行する。
インテンシティステレオ符号化から除かれることになる
スペクトル部分に対しては、対応するyl(b,0...
n−1)およびyr(b,0...n−1)の値は直接量
子化・符号化段に渡される。インテンシティステレオ符
号化を利用することになるスペクトル部分(すなわち、
その高周波部分)に対しては、インテンシティ符号化プ
ロセスが以下のように実行される。各信号yl()およ
びyr()から、各符号器周波数バンドごとにスケーリ
ング情報(例えば、ピーク振幅あるいは全エネルギー)
を抽出し、対応するyl()およびyr()の値を結合
することによって単一のキャリア信号yi()を生成す
る。従って、インテンシティステレオで符号化されるス
ペクトル部分については、両方のチャネルに対してただ
1つの値のセットyi()と、各チャネルごとのスケー
リング補助情報が、量子化・符号化段に送られる。ある
いは、両方のチャネルのスケーリング情報を、向き情報
と結合したものを(単一のキャリア信号とともに)使用
することも可能である。
【0059】・インテンシティステレオ符号化段の出力
のスペクトル成分(yl()およびyr()の別々の値
と共通のyi()の値からなる)は、量子化・符号化モ
ジュール14によって、量子化され、送信シンボルにマ
ッピングされる。このモジュールは、知覚モデル11l
および11rによって決定される必要な符号化精度を考
慮に入れる。
【0060】・量子化・符号化モジュール14によって
生成された送信シンボル値は、その他の補助情報ととも
に、ビットストリーム符号器/マルチプレクサ15に送
られ、それによって、符号化されたビットストリームが
送信される。インテンシティステレオ符号化を用いる符
号器周波数バンドに対しては、インテンシティステレオ
符号化モジュール13によって送られるスケーリング情
報もまたビットストリーム符号器/マルチプレクサ15
に送られ、それによって同様に、符号化されたビットス
トリームで送信される。
【0061】[実施例の符号器]図2に、本発明の実施
例による2チャネルステレオ信号用符号器を示す。図2
の実施例の符号器の動作は、各チャネルごとに、対応す
る分析フィルタバンクとインテンシティステレオ符号化
モジュールの間に予測フィルタリング段が導入されるこ
とを除いては、図1の従来の符号器と同様である。すな
わち、予測フィルタ16lおよび16rがそれぞれ分析
フィルタバンク12lおよび12rの出力に適用され
る。これにより、スペクトル値yl(b,0...n−
1)およびyr(b,0...n−1)は、インテンシテ
ィステレオ符号化モジュール13に送られる前に、それ
ぞれ予測フィルタリングプロセスの出力値yl′(b,
0...n−1)およびyr′(b,0...n−1)によっ
て置き換えられる。
【0062】図3に、図2の実施例の符号器の予測フィ
ルタの実施例を示す。具体的には、各チャネルの予測フ
ィルタリング段内では、線形予測が周波数にわたって
(例えば、サブバンドADPCM符号器によって用いら
れるような時間にわたって実行される予測符号化とは異
なり)実行される。このために、「回転スイッチ」43
が、処理前にスペクトル値を直列順序にするように動作
し、その結果の出力値y′(b,0...n−1)がその
後「回転スイッチ」46によって並列に出力される。
(注意すべき点であるが、直列と並列の間の整列の変換
のための機構として「回転スイッチ」を用いることはこ
こでは便宜上および理解を容易にするためのものであ
る。当業者には明らかなように、このような物理的なス
イッチングデバイスが必ずしも必要なわけではない。む
しろ、直列と並列の間の整列の変換は、ソフトウェアの
みの使用を含む、当業者に周知の任意の方法で実行され
る。)本実施例は、周波数の昇順でスペクトル値の処理
を実行するが、別の実施例として、例えば、周波数の降
順で処理を実行することも可能である。当業者には明ら
かなように、別の順序も可能である。
【0063】図から分かるように、結果の出力値y′
(b,0...n−1)は、入力値から予測値(予測器4
7によって予測される)を減算する(減算器48を用い
て)ことによって、入力値y(b,0...n−1)から
計算され、予測エラー信号のみが出力される。注意すべ
き点であるが、図中でエンベロープ前白色化フィルタ4
4として表示されている予測器47と減算器48の組合
せは、対応する時間信号の時間形状を等化するように作
用する。
【0064】図2の実施例の符号器の予測フィルタ16
lおよび16rによって実行されるプロセスは、スペク
トル全体に対して実行されることも、あるいは、スペク
トルの一部のみ(すなわち、スペクトル係数のサブセッ
ト)に対して実行されることも可能である。さらに、相
異なる予測器フィルタ(例えば、図3で複数の相異なる
予測器47を用いる)を、信号スペクトルの相異なる部
分に対して使用することも可能である。このようにし
て、時間領域のエンベロープ制御のための上記の方法
は、周波数に応じて必要に応じて適用可能である。
【0065】信号の正しい復号を可能にするためには、
ビットストリームは別に補助情報を含む。例えば、この
ような情報の1つのフィールドは予測フィルタリングの
使用を表示し、適用可能な場合、予測フィルタの数を表
示することが可能である。予測フィルタリングが用いら
れている場合、それぞれのフィルタおよびそのフィルタ
係数のターゲット周波数範囲を示すビットストリームの
追加フィールドが、各予測フィルタごとに送信されるこ
とも可能である。このように、図2で「Lフィルタデー
タ」および「Rフィルタデータ」と表示された破線で示
されているように、予測フィルタ16lおよび16r
は、送信されるビットストリームに含めるために、必要
な情報をビットストリーム符号器/マルチプレクサ17
に送る。
【0066】図7は、本発明の実施例によって2チャネ
ルステレオ信号を符号化する方法の流れ図である。この
流れ図に示す実施例は、図2の実施例の符号器の主要部
分を実装する。特に、この流れ図は、単一の予測フィル
タを用いたエンベロープ前白色化プロセスを含む、単一
のチャネルに対する符号器のフロントエンド部分を示
す。この前白色化プロセスは、図のステップ61に示さ
れているように、分析フィルタバンクによるスペクトル
値の計算の後に実行される。
【0067】分析フィルタバンクの動作後、予測フィル
タの次数を設定し、ターゲット周波数範囲が定義する
(ステップ62)。これらのパラメータは、例えば、フ
ィルタ次数を15に設定し、ターゲット周波数範囲は、
インテンシティステレオ符号化を用いて符号化されるこ
とになる全周波数範囲(例えば4kHz〜20kHz)
からなる。このようにして、この方式は、各オーディオ
チャネルごとに個別の微細時間構造データのセットを提
供するように設定される。ステップ63で、ターゲット
周波数範囲に一致するスペクトル計数の範囲を使用する
ことによって、および、周知のような予測符号化の従来
の方法(例えば、差分パルス符号変調(DPCM)符号
器の場合のもの)を適用することによって、予測フィル
タを決定する。例えば、係数の自己相関関数を計算し、
当業者に周知のように、従来のレヴィンソン=ダービン
再帰アルゴリズムで使用することが可能である。その結
果、予測器フィルタ係数と、対応する反射係数(PAR
COR係数)と、期待される予測利得が分かる。
【0068】判定64の判定で、期待される予測利得が
あるしきい値(例えば2dB)を超える場合、ステップ
65〜67の予測フィルタリング手続きが用いられる。
この場合、補助情報の一部として復号器へ送信するため
に必要となる予測フィルタ係数が量子化される(ステッ
プ65)。次に、ステップ66で、予測フィルタは、タ
ーゲット周波数範囲に一致するスペクトル係数の範囲に
適用される。そこでは、量子化されたフィルタ係数が使
用される。従って、その後のすべての処理では、スペク
トル係数は、フィルタリングプロセスの出力によって置
き換えられる。最後に、ステップ67で、送信されるビ
ットストリームの1つのフィールドが、予測フィルタリ
ングの使用を示すようにセットされる(「予測フラグ」
がオンになる)。さらに、ターゲット周波数範囲、予測
フィルタの次数、およびそのフィルタ係数を記述する情
報もまたビットストリームに含められる。
【0069】他方、判定64の判定で、期待される予測
利得が判定しきい値を超えない場合、ステップ68で、
予測フィルタリングが使用されていないことを示すよう
にビットストリーム内のフィールドがセットされる
(「予測フラグ」がオフになる)。最後に、上記の処理
が完了した後、従来の符号器で実行される通常のステッ
プ(例えば図1の符号器によって実行されるようなも
の)が実行される。すなわち、インテンシティステレオ
符号化プロセスをスペクトル係数(これは今の場合残差
データとなる)に適用し、インテンシティステレオ符号
化プロセスの結果を量子化および符号化し、送信される
実際のビットストリームを(適当な補助情報を多重化し
て)送信用に符号化する。しかし、注意すべき点である
が、図1の従来の符号器の従来のビットストリーム符号
器/マルチプレクサ15の代わりに、図2の実施例の符
号器のビットストリーム符号器/マルチプレクサ17で
置き換えられており、予測フィルタ16lおよび16r
によって提供される追加の補助情報(すなわち「Lフィ
ルタデータ」および「Rフィルタデータ」)が出力ビッ
トストリーム内に符号化され送信される。
【0070】[従来の復号器]図4に、図1の従来の符
号器に対応する、従来のインテンシティステレオ符号化
法が使用される、ジョイントステレオ符号化信号用の従
来の復号器を示す。具体的には、図4の復号器は以下の
ステップを実行する。
【0071】・入力ビットストリームはビットストリー
ム復号器/デマルチプレクサ21で解析され、スペクト
ル係数の送信シンボルは、量子化関連補助情報とともに
復号・逆量子化モジュール22に送られる。
【0072】・復号・逆量子化モジュール22で、量子
化されたスペクトル値yql()、yqr()およびy
qi()を再構成する。これらの信号は、独立に符号化
された左チャネル信号部分、独立に符号化された右チャ
ネル信号部分、およびインテンシティステレオキャリア
信号にそれぞれ対応する。
【0073】・キャリア信号の再構成されたスペクトル
値および送信されたスケーリング情報から、従来のイン
テンシティステレオ復号プロセスを用いて左右のチャネ
ル信号のyql()およびyqr()の欠損部分を計算
する。これは、インテンシティステレオ復号モジュール
23によって実行される。このモジュールの出力では、
左右のチャネルのそれぞれに対応して、2つの完全な
(かつ独立の)チャネルスペクトル信号yql()およ
びyqr()が利用可能である。
【0074】・最後に、左右のそれぞれのチャネルのス
ペクトル信号yql()およびyqr()を、合成フィ
ルタバンク24lおよび24rによって時間領域表現に
マッピングすることにより、最終的な出力信号x
l′()およびxr′()を得る。
【0075】[実施例の復号器]図5に、図2の実施例
の符号器に対応する、本発明の実施例によるジョイント
ステレオ符号化信号の復号器を示す。図5の実施例の復
号器の動作は、各チャネルごとに逆予測フィルタリング
段が、インテンシティステレオ復号と、対応する合成フ
ィルタバンクの間に導入されることを除いては、図4の
従来の復号器と同様である。すなわち、逆予測フィルタ
26lおよび26rがそれぞれ合成フィルタバンク24
lおよび24rの前に挿入される。従って、インテンシ
ティステレオ復号モジュール23によって生成されるス
ペクトル値yql()およびyqr()は、それぞれ、
対応する合成フィルタバンク(合成フィルタバンク24
lおよび24r)へ送られる前に、対応する逆予測フィ
ルタリングプロセスの出力値によって置き換えられる。
【0076】図6に、図5の実施例の復号器の逆予測フ
ィルタの実施例を示す。具体的には、この逆量子化フィ
ルタ内で、線形フィルタリング動作が周波数にわたって
(サブバンドADPCM符号器の場合のように時間にわ
たって予測符号化を実行するのとは異なり)実行され
る。図3の予測フィルタの実施例の場合と同様に、図6
の「回転スイッチ」33は、スペクトル値yq(b,
0...n−1)を処理の前に直列順序にするために使用
され、図の「回転スイッチ」36は、その後の結果の出
力値yq′(b,0...n−1)を並列に整列させるた
めに使用される。(再び、注意すべき点であるが、直列
と並列の間の整列の変換のための機構として「回転スイ
ッチ」を用いることはここでは便宜上および理解を容易
にするためのものである。当業者には明らかなように、
このような物理的なスイッチングデバイスが必ずしも必
要なわけではない。むしろ、直列と並列の間の整列の変
換は、ソフトウェアのみの使用を含む、当業者に周知の
任意の方法で実行される。)また、上記の符号器の実施
例の場合と同様に、周波数の昇順または降順での処理が
可能であるとともに、その他の可能な順序も当業者には
明らかである。
【0077】図から分かるように、出力値yq′(b,
0...n−1)は、対応する符号器で用いられたエンベ
ロープ前白色化フィルタの逆を適用することによって入
力値yq(b,0...n−1)から計算される。特に、
出力値は、予測値(予測器37によって予測される)を
図示のように入力値に加算する(加算器38を用いて)
ことによって入力値から計算される。注意すべき点であ
るが、図中でエンベロープ整形フィルタ34として表示
されている予測器37と加算器38の組合せは、もとの
時間信号の時間形状を再生するように作用する。
【0078】図2および図3の実施例の符号器の説明で
述べたように、上記のフィルタリングプロセスは、スペ
クトル全体に対して実行されることも、あるいは、スペ
クトルの一部のみ(すなわち、スペクトル係数のサブセ
ット)に対して実行されることも可能である。さらに、
相異なる予測器フィルタ(例えば、図6で複数の相異な
る予測器37を用いる)を、信号スペクトルの相異なる
部分に対して使用することも可能である。このような場
合(信号の正しい復号を実行するために)、図5の実施
例の復号器は、符号器によって送信された追加の補助情
報(図では「Lフィルタデータ」および「Rフィルタデ
ータ」と表示されている)をビットストリームから復号
し、このデータを逆予測フィルタ26lおよび26rに
供給する。このようにして、予測復号は、対応する予測
フィルタで、指定された各ターゲット周波数範囲に適用
される。
【0079】図8は、図7の符号化方法の実施例に対応
する、本発明の実施例によるジョイントステレオ符号化
信号を復号する方法の流れ図である。この流れ図の実施
例は、図5の実施例の復号器の主要部分を実装する。特
に、この流れ図は、単一の(逆)予測フィルタを用いた
エンベロープ整形プロセスを含む、単一のチャネルに対
する復号器のバックエンド部分を示す。図8の流れ図の
ステップの前に復号器によって実行される処理は、従来
の復号器で実行される通常のステップ(図4の復号器に
よって実行されるようなもの)である。すなわち、ビッ
トストリームは符号化/分離化され、その結果のデータ
は復号され逆量子化され、インテンシティステレオ復号
プロセスが実行される。しかし、注意すべき点である
が、図4の従来の復号器の従来のビットストリーム復号
器/デマルチプレクサ21の代わりに、図5の実施例の
復号器のビットストリーム復号器/デマルチプレクサ2
5で置き換えられており、符号器によって提供される追
加の補助情報(例えば、「Lフィルタデータ」および
「Rフィルタデータ」)が復号され、逆予測フィルタ2
6lおよび26rに送られる。
【0080】インテンシティステレオ復号が完了した
後、予測フィルタリングの使用を通知するビットストリ
ームからのデータを検査する(判定72)。そのデータ
が、予測フィルタリングが符号器で実行されたことを示
している場合(すなわち、「予測フラグ」がオン)、ス
テップ73および74の拡張された復号プロセスを実行
する。特に、予測フィルタリングのターゲット周波数範
囲、前白色化(予測)フィルタの次数、および、フィル
タの係数を記述する情報を、(以前に復号されている)
補助情報から取得する(ステップ73)。次に、逆(復
号器)予測フィルタ(すなわちエンベロープ整形フィル
タ)を、ターゲット周波数範囲に一致するスペクトル係
数の範囲に適用する(ステップ74)。ステップ75に
示されているように、いずれの場合でも(すなわち、予
測フィルタリングが実行されたかどうかにかかわら
ず)、復号器の処理は、スペクトル係数(適用可能な場
合にはエンベロープ整形フィルタによって処理されたも
の)に、合成フィルタバンクを作用させる(各チャネル
ごとに)ことによって、完了する。
【0081】[結論]本発明の実施例による上記のプロ
セス(すなわち、符号器における予測フィルタリングお
よび復号器における逆フィルタリング)を用いて、離散
フーリエ変換(DFT)あるいは離散コサイン変換(D
CT)(いずれも当業者に周知)を含む従来のブロック
変換に対して、直接的なエンベロープ整形効果が達成さ
れる。例えば、本発明による知覚符号器が重畳する窓に
よる臨界的にサブサンプリングされたフィルタバンクを
使用する場合(例えば、従来の修正離散コサイン変換
(MDCT)や、従来の時間領域エイリアシング相殺
(TDAC)に基づくフィルタバンク)、結果のエンベ
ロープ整形効果は、フィルタバンクに固有の時間領域エ
イリアシング効果を受ける。例えば、MDCTの場合、
窓の半分ごとに1回の鏡映(すなわち、エイリアシン
グ)作用が起こり、微細エンベロープ構造が、復号後の
窓の左半分および右半分内にそれぞれ鏡映されて(すな
わち、エイリアシングによって)現れる。最終的なフィ
ルタバンク出力は、各逆変換の出力に合成窓を適用し、
これらのデータセグメントの重畳加算を実行することに
よって得られるため、好ましくないエイリアシング成分
は、使用される合成窓に依存して減衰する。従って、時
間的なエイリアシング効果が最小化されるように、後続
のブロック間で小さい重畳しか示さないフィルタバンク
窓を選択するのが有利である。例えば、符号器における
適当な方略によって、臨界的な信号に対する重畳の程度
の小さい窓を適応的に選択することが可能であり、それ
によって、周波数選択性が改善される。このような方略
の実装の詳細は当業者には明らかである。
【0082】以上、本発明の実施例について説明した
が、さまざまな変形例が可能である。例えば、上記の実
施例では2チャネルのみからなるステレオオーディオ信
号の符号化および復号に限定して説明したが、3チャネ
ル以上のステレオオーディオ信号の符号化および復号の
ための実施例を、上記の説明に基づいて構成すること
は、当業者には明らかである。
【0083】
【発明の効果】以上述べたごとく、本発明によれば、イ
ンテンシティステレオ符号化法を用いたマルチチャネル
オーディオ信号のジョイントステレオ符号化においてビ
ット節約の可能性が完全に利用されないという従来技術
の欠点が克服される。特に、予測フィルタリング法をス
ペクトル係数データに適用することにより、各チャネル
の出力信号の微細時間構造を保持しながら、インテンシ
ティステレオ符号化によって提供される高いビットレー
ト節約の利益を維持する。
【図面の簡単な説明】
【図1】従来のインテンシティステレオ符号化法が使用
される、2チャネルステレオ信号用の従来の符号器の図
である。
【図2】本発明の実施例による2チャネルステレオ信号
用符号器の図である。
【図3】図2の実施例の符号器の予測フィルタの実施例
の図である。
【図4】従来のインテンシティステレオ符号化法が使用
される、図1の従来の符号器に対応するジョイントステ
レオ符号化信号の従来の復号器の図である。
【図5】本発明の実施例による、図2の実施例の符号器
に対応する、ジョイントステレオ符号化信号の復号器の
図である。
【図6】図5の実施例の復号器の逆予測フィルタの実施
例の図である。
【図7】本発明の実施例による2チャネルステレオ信号
を符号化する方法の流れ図である。
【図8】本発明の実施例による、図7の符号化方法の実
施例に対応する、ジョイントステレオ符号化信号を復号
する方法の流れ図である。
【符号の説明】
11 知覚モデル 12 分析フィルタバンク(前方変換) 13 インテンシティステレオ符号化モジュール 14 量子化・符号化モジュール 15 ビットストリーム符号器/マルチプレクサ 16 予測フィルタ 17 ビットストリーム符号器/マルチプレクサ 21 ビットストリーム復号器/デマルチプレクサ 22 復号・逆量子化モジュール 23 インテンシティステレオ復号モジュール 24 合成フィルタバンク 25 ビットストリーム復号器/デマルチプレクサ 26 逆予測フィルタ 33 回転スイッチ 34 エンベロープ整形フィルタ 36 回転スイッチ 37 予測器 38 加算器 43 回転スイッチ 44 エンベロープ前白色化フィルタ 46 回転スイッチ 47 予測器 48 減算器
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A.

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 マルチチャネルオーディオ信号のジョイ
    ントステレオ符号化を実行して符号化信号を生成する方
    法において、 (a)第1オーディオチャネル信号を、複数の第1スペ
    クトル成分信号に分解するスペクトル分解を実行するス
    テップと、 (b)1つの第1スペクトル成分信号の予測値を表す第
    1予測信号を、他の1つ以上の第1スペクトル成分信号
    に基づいて生成するステップと、 (c)前記第1予測信号を前記1つの第1スペクトル成
    分信号と比較して第1予測エラー信号を生成するステッ
    プと、 (d)第2オーディオチャネル信号を、複数の第2スペ
    クトル成分信号に分解するスペクトル分解を実行するス
    テップと、 (e)前記第1予測エラー信号に基づいて、前記1つの
    第1スペクトル成分信号と1つの第2スペクトル成分信
    号のジョイントステレオ符号化を実行して、ジョイント
    符号化スペクトル成分信号を生成するステップと、 (f)前記ジョイント符号化スペクトル成分信号に基づ
    いて前記符号化信号を生成するステップとからなること
    を特徴とする、マルチチャネルオーディオ信号のジョイ
    ントステレオ符号化方法。
  2. 【請求項2】 (g)前記1つの第2スペクトル成分信
    号の予測値を表す第2予測信号を、他の1つ以上の第2
    スペクトル成分信号に基づいて生成するステップと、 (h)前記第2予測信号を、前記1つの第2スペクトル
    成分信号と比較して第2予測エラー信号を生成するステ
    ップとをさらに有し、 前記ステップeは前記第2予測エラー信号にも基づくこ
    とを特徴とする請求項1の方法。
  3. 【請求項3】 前記ステップeは、前記1つの第1スペ
    クトル成分信号と前記1つの第2スペクトル成分信号の
    インテンシティステレオ符号化を実行するステップを含
    むことを特徴とする請求項1の方法。
  4. 【請求項4】 前記ステップfは、前記ジョイント符号
    化スペクトル成分信号を量子化するステップを含むこと
    を特徴とする請求項1の方法。
  5. 【請求項5】 前記ジョイント符号化スペクトル成分信
    号の量子化は知覚モデルに基づくことを特徴とする請求
    項4の方法。
  6. 【請求項6】 もとのマルチチャネルオーディオ信号の
    ジョイントステレオ符号化による符号化信号を復号して
    再構成マルチチャネルオーディオ信号を生成する方法に
    おいて、 (a)前記符号化信号のジョイントステレオ復号を実行
    して、それぞれ複数の復号スペクトル成分予測エラー信
    号からなる複数の復号チャネル信号を生成するステップ
    と、 (b)前記複数の復号チャネル信号のうちの第1復号チ
    ャネル信号に含まれる1つ以上のスペクトル成分予測エ
    ラー信号に基づいて第1スペクトル成分信号を生成する
    ステップと、 (c)前記第1スペクトル成分信号に基づいて、第2ス
    ペクトル成分信号の予測値を表す第1予測信号を生成す
    るステップと、 (d)前記第1予測信号および前記第1復号チャネル信
    号に含まれる1つ以上のスペクトル成分予測エラー信号
    に基づいて、第2スペクトル成分信号を生成するステッ
    プと、 (e)前記第1スペクトル成分信号および前記第2スペ
    クトル成分信号に基づいて、前記再構成マルチチャネル
    オーディオ信号の第1チャネルを生成するステップとか
    らなることを特徴とする、マルチチャネルオーディオ信
    号の復号方法。
  7. 【請求項7】 (f)前記複数の復号チャネル信号のう
    ちの第2復号チャネル信号に含まれる1つ以上のスペク
    トル成分予測エラー信号に基づいて第3スペクトル成分
    信号を生成するステップと、 (g)前記第3スペクトル成分信号に基づいて、第4ス
    ペクトル成分信号の予測値を表す第2予測信号を生成す
    るステップと、 (h)前記第2予測信号および前記第2復号チャネル信
    号に含まれる1つ以上のスペクトル成分予測エラー信号
    に基づいて、第4スペクトル成分信号を生成するステッ
    プと、 (i)前記第3スペクトル成分信号および前記第4スペ
    クトル成分信号に基づいて、前記再構成マルチチャネル
    オーディオ信号の第2チャネルを生成するステップとを
    さらに有することを特徴とする請求項6の方法。
  8. 【請求項8】 前記ステップaは、前記符号化信号のイ
    ンテンシティステレオ復号を実行するステップを含むこ
    とを特徴とする請求項6の方法。
  9. 【請求項9】 マルチチャネルオーディオ信号のジョイ
    ントステレオ符号化を実行して符号化信号を生成する符
    号化装置において、 (a)第1オーディオチャネル信号を、複数の第1スペ
    クトル成分信号に分解するスペクトル分解を実行する第
    1フィルタバンクと、 (b)1つの第1スペクトル成分信号の予測値を表す第
    1予測信号を、他の1つ以上の第1スペクトル成分信号
    に基づいて生成する第1予測フィルタと、 (c)前記第1予測信号を前記1つの第1スペクトル成
    分信号と比較して第1予測エラー信号を生成する第1比
    較器と、 (d)第2オーディオチャネル信号を、複数の第2スペ
    クトル成分信号に分解するスペクトル分解を実行する第
    2フィルタバンクと、 (e)前記第1予測エラー信号に基づいて、前記1つの
    第1スペクトル成分信号と1つの第2スペクトル成分信
    号のジョイントステレオ符号化を実行して、ジョイント
    符号化スペクトル成分信号を生成するジョイントステレ
    オ符号器と、 (f)前記ジョイント符号化スペクトル成分信号に基づ
    いて前記符号化信号を生成する出力符号器とからなるこ
    とを特徴とする、マルチチャネルオーディオ信号符号化
    装置。
  10. 【請求項10】 (g)前記1つの第2スペクトル成分
    信号の予測値を表す第2予測信号を、他の1つ以上の第
    2スペクトル成分信号に基づいて生成する第2予測フィ
    ルタと、 (h)前記第2予測信号を、前記1つの第2スペクトル
    成分信号と比較して第2予測エラー信号を生成する第2
    比較器とをさらに有し、 前記ジョイントステレオ符号器は前記第2予測エラー信
    号にも基づいてジョイントステレオ符号化を実行するこ
    とを特徴とする請求項9の装置。
  11. 【請求項11】 前記ジョイントステレオ符号器は、前
    記1つの第1スペクトル成分信号と前記1つの第2スペ
    クトル成分信号のインテンシティステレオ符号化を実行
    するインテンシティステレオ符号器を含むことを特徴と
    する請求項9の装置。
  12. 【請求項12】 前記出力符号器は、前記ジョイント符
    号化スペクトル成分信号を量子化する量子化器を含むこ
    とを特徴とする請求項9の装置。
  13. 【請求項13】 前記量子化器は知覚モデルに基づくこ
    とを特徴とする請求項12の装置。
  14. 【請求項14】 もとのマルチチャネルオーディオ信号
    のジョイントステレオ符号化による符号化信号を復号し
    て再構成マルチチャネルオーディオ信号を生成する復号
    装置において、 (a)前記符号化信号のジョイントステレオ復号を実行
    して、それぞれ複数の復号スペクトル成分予測エラー信
    号からなる複数の復号チャネル信号を生成するジョイン
    トステレオ復号器と、 (b)前記複数の復号チャネル信号のうちの第1復号チ
    ャネル信号に含まれる1つ以上のスペクトル成分予測エ
    ラー信号に基づいて第1スペクトル成分信号を生成する
    手段と、 (c)前記第1スペクトル成分信号に基づいて、第2ス
    ペクトル成分信号の予測値を表す第1予測信号を生成す
    る第1予測フィルタと、 (d)前記第1予測信号および前記第1復号チャネル信
    号に含まれる1つ以上のスペクトル成分予測エラー信号
    に基づいて、第2スペクトル成分信号を生成する手段
    と、 (e)前記第1スペクトル成分信号および前記第2スペ
    クトル成分信号に基づいて、前記再構成マルチチャネル
    オーディオ信号の第1チャネルを生成する第1フィルタ
    バンクとからなることを特徴とする、マルチチャネルオ
    ーディオ信号の復号装置。
  15. 【請求項15】 (f)前記複数の復号チャネル信号の
    うちの第2復号チャネル信号に含まれる1つ以上のスペ
    クトル成分予測エラー信号に基づいて第3スペクトル成
    分信号を生成する手段と、 (g)前記第3スペクトル成分信号に基づいて、第4ス
    ペクトル成分信号の予測値を表す第2予測信号を生成す
    る第2予測フィルタと、 (h)前記第2予測信号および前記第2復号チャネル信
    号に含まれる1つ以上のスペクトル成分予測エラー信号
    に基づいて、第4スペクトル成分信号を生成する手段
    と、 (i)前記第3スペクトル成分信号および前記第4スペ
    クトル成分信号に基づいて、前記再構成マルチチャネル
    オーディオ信号の第2チャネルを生成する第2フィルタ
    バンクとをさらに有することを特徴とする請求項14の
    装置。
  16. 【請求項16】 前記ジョイントステレオ復号器は、前
    記符号化信号のインテンシティステレオ復号を実行する
    インテンシティステレオ復号器を含むことを特徴とする
    請求項14の装置。
  17. 【請求項17】 (a)第1オーディオチャネル信号
    を、複数の第1スペクトル成分信号に分解するスペクト
    ル分解を実行するステップと、 (b)1つの第1スペクトル成分信号の予測値を表す第
    1予測信号を、他の1つ以上の第1スペクトル成分信号
    に基づいて生成するステップと、 (c)前記第1予測信号を前記1つの第1スペクトル成
    分信号と比較して第1予測エラー信号を生成するステッ
    プと、 (d)第2オーディオチャネル信号を、複数の第2スペ
    クトル成分信号に分解するスペクトル分解を実行するス
    テップと、 (e)前記第1予測エラー信号に基づいて、前記1つの
    第1スペクトル成分信号と1つの第2スペクトル成分信
    号のジョイントステレオ符号化を実行して、ジョイント
    符号化スペクトル成分信号を生成するステップと、 (f)前記ジョイント符号化スペクトル成分信号に基づ
    いて符号化信号を生成するステップとからなる符号化方
    法によって、マルチチャネルオーディオ信号から生成さ
    れた符号化信号を記録した記憶媒体。
  18. 【請求項18】 前記符号化方法は、(g)前記1つの
    第2スペクトル成分信号の予測値を表す第2予測信号
    を、他の1つ以上の第2スペクトル成分信号に基づいて
    生成するステップと、 (h)前記第2予測信号を、前記1つの第2スペクトル
    成分信号と比較して第2予測エラー信号を生成するステ
    ップとをさらに有し、 前記ステップeは前記第2予測エラー信号にも基づくこ
    とを特徴とする請求項17の記憶媒体。
  19. 【請求項19】 前記ステップeは、前記1つの第1ス
    ペクトル成分信号と前記1つの第2スペクトル成分信号
    のインテンシティステレオ符号化を実行するステップを
    含むことを特徴とする請求項17の記憶媒体。
  20. 【請求項20】 前記ステップfは、前記ジョイント符
    号化スペクトル成分信号を量子化するステップを含むこ
    とを特徴とする請求項17の記憶媒体。
  21. 【請求項21】 前記ジョイント符号化スペクトル成分
    信号の量子化は知覚モデルに基づくことを特徴とする請
    求項20の記憶媒体。
  22. 【請求項22】 コンパクトディスクからなることを特
    徴とする請求項17の記憶媒体。
  23. 【請求項23】 ディジタルオーディオテープからなる
    ことを特徴とする請求項17の記憶媒体。
  24. 【請求項24】 半導体メモリからなることを特徴とす
    る請求項17の記憶媒体。
JP06405297A 1996-03-22 1997-03-18 マルチチャネルオーディオ信号のジョイントステレオ符号化方法 Expired - Lifetime JP3316159B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/621,762 US5812971A (en) 1996-03-22 1996-03-22 Enhanced joint stereo coding method using temporal envelope shaping
US621762 1996-03-22

Publications (2)

Publication Number Publication Date
JPH1051313A true JPH1051313A (ja) 1998-02-20
JP3316159B2 JP3316159B2 (ja) 2002-08-19

Family

ID=24491531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06405297A Expired - Lifetime JP3316159B2 (ja) 1996-03-22 1997-03-18 マルチチャネルオーディオ信号のジョイントステレオ符号化方法

Country Status (5)

Country Link
US (1) US5812971A (ja)
EP (1) EP0797324B1 (ja)
JP (1) JP3316159B2 (ja)
CA (1) CA2197128C (ja)
DE (1) DE69731677T2 (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002162996A (ja) * 2000-11-24 2002-06-07 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
WO2006022308A1 (ja) * 2004-08-26 2006-03-02 Matsushita Electric Industrial Co., Ltd. マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
JP2008511040A (ja) * 2004-08-25 2008-04-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP2008517333A (ja) * 2004-10-20 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形
JP2008517334A (ja) * 2004-10-20 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ バイノーラルキュー符号化方法等のための拡散音の整形
US7761304B2 (en) 2004-11-30 2010-07-20 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7941320B2 (en) 2001-05-04 2011-05-10 Agere Systems, Inc. Cue-based audio coding/decoding
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
US8352249B2 (en) 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
US8374883B2 (en) 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
US8983830B2 (en) 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
JP2021502597A (ja) * 2017-11-10 2021-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 一時的ノイズシェーピング
US11217261B2 (en) 2017-11-10 2022-01-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding audio signals
US11315580B2 (en) 2017-11-10 2022-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
US11315583B2 (en) 2017-11-10 2022-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US11380341B2 (en) 2017-11-10 2022-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
US11462226B2 (en) 2017-11-10 2022-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US11545167B2 (en) 2017-11-10 2023-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
US11562754B2 (en) 2017-11-10 2023-01-24 Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. Analysis/synthesis windowing function for modulated lapped transformation

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
ATE371298T1 (de) * 1996-11-07 2007-09-15 Koninkl Philips Electronics Nv Übertragung eines bitstromsignals
US5913191A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
DE69722973T2 (de) * 1997-12-19 2004-05-19 Stmicroelectronics Asia Pacific Pte Ltd. Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio
WO1999034527A1 (en) * 1997-12-27 1999-07-08 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Method and apparatus for estimation of coupling parameters in a transform coder for high quality audio
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
IL142086A0 (en) * 1999-07-20 2002-03-10 Koninkl Philips Electronics Nv Record carrier carrying a stereo signal and data signal
EP1087557A3 (en) * 1999-09-22 2005-01-19 Matsushita Electric Industrial Co., Ltd. Apparatus for transmitting digital audio data and receiving apparatus for receiving the digital audio data
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE60132853D1 (de) * 2000-07-07 2008-04-03 Nokia Siemens Networks Oy Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7002618B2 (en) * 2001-06-01 2006-02-21 Stereographics Corporation Plano-stereoscopic DVD movie
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7437299B2 (en) * 2002-04-10 2008-10-14 Koninklijke Philips Electronics N.V. Coding of stereo signals
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
KR101021079B1 (ko) * 2002-04-22 2011-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 다채널 오디오 표현
AU2003244932A1 (en) * 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
ES2378462T3 (es) 2002-09-04 2012-04-12 Microsoft Corporation Codificación entrópica por adaptación de codificación entre modalidades de nivel y de longitud/nivel de cadencia
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
KR100501930B1 (ko) * 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
KR20050116828A (ko) * 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
US7653255B2 (en) 2004-06-02 2010-01-26 Adobe Systems Incorporated Image region of interest encoding
DE602005011439D1 (de) * 2004-06-21 2009-01-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen
ES2373728T3 (es) * 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
AU2012205170B2 (en) * 2004-08-25 2015-05-14 Dolby Laboratories Licensing Corporation Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
EP1851866B1 (en) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US7599840B2 (en) 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7933337B2 (en) * 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
CN101427307B (zh) * 2005-09-27 2012-03-07 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
KR100754937B1 (ko) * 2006-03-30 2007-09-03 인하대학교 산학협력단 Ofdm/fdd 시스템에서 적응전송을 지원하기 위한 다단계 채널예측장치 및 방법
US20090276210A1 (en) * 2006-03-31 2009-11-05 Panasonic Corporation Stereo audio encoding apparatus, stereo audio decoding apparatus, and method thereof
KR100718416B1 (ko) 2006-06-28 2007-05-14 주식회사 대우일렉트로닉스 예측필터를 이용한 채널간 스테레오 오디오 코딩 방법
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
CN101169934B (zh) * 2006-10-24 2011-05-11 华为技术有限公司 时域听觉阈值加权滤波器的构造方法和设备、编解码器
DE102006055737A1 (de) * 2006-11-25 2008-05-29 Deutsche Telekom Ag Verfahren zur skalierbaren Codierung von Stereo-Signalen
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
KR101546793B1 (ko) 2008-07-14 2015-08-28 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
BRPI1009467B1 (pt) 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
US20120072207A1 (en) * 2009-06-02 2012-03-22 Panasonic Corporation Down-mixing device, encoder, and method therefor
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
MX2012011532A (es) 2010-04-09 2012-11-16 Dolby Int Ab Codificacion a estereo para prediccion de complejos basados en mdct.
US9311923B2 (en) * 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
US8401863B1 (en) * 2012-04-25 2013-03-19 Dolby Laboratories Licensing Corporation Audio encoding and decoding with conditional quantizers
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE457402B (sv) * 1987-02-20 1988-12-19 Harald Brusewitz Foerfarande och anordning foer kodning och avkodning av bildinformation
US4875095A (en) * 1987-06-30 1989-10-17 Kokusai Denshin Denwa Kabushiki Kaisha Noise-shaping predictive coding system
US4943855A (en) * 1988-07-22 1990-07-24 At&T Bell Laboratories Progressive sub-band image coding system
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002162996A (ja) * 2000-11-24 2002-06-07 Matsushita Electric Ind Co Ltd オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
US7941320B2 (en) 2001-05-04 2011-05-10 Agere Systems, Inc. Cue-based audio coding/decoding
US8200500B2 (en) 2001-05-04 2012-06-12 Agere Systems Inc. Cue-based audio coding/decoding
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
JP2008511040A (ja) * 2004-08-25 2008-04-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
US7630396B2 (en) 2004-08-26 2009-12-08 Panasonic Corporation Multichannel signal coding equipment and multichannel signal decoding equipment
WO2006022308A1 (ja) * 2004-08-26 2006-03-02 Matsushita Electric Industrial Co., Ltd. マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP2008517333A (ja) * 2004-10-20 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形
JP2008517334A (ja) * 2004-10-20 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ バイノーラルキュー符号化方法等のための拡散音の整形
US8238562B2 (en) 2004-10-20 2012-08-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
US7761304B2 (en) 2004-11-30 2010-07-20 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8532999B2 (en) 2005-04-15 2013-09-10 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for generating a multi-channel synthesizer control signal, multi-channel synthesizer, method of generating an output signal from an input signal and machine-readable storage medium
US8983830B2 (en) 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
US8374883B2 (en) 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
US8352249B2 (en) 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
JP2021502597A (ja) * 2017-11-10 2021-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 一時的ノイズシェーピング
US11127408B2 (en) 2017-11-10 2021-09-21 Fraunhofer—Gesellschaft zur F rderung der angewandten Forschung e.V. Temporal noise shaping
US11217261B2 (en) 2017-11-10 2022-01-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding audio signals
US11315580B2 (en) 2017-11-10 2022-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
US11315583B2 (en) 2017-11-10 2022-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US11380341B2 (en) 2017-11-10 2022-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
US11380339B2 (en) 2017-11-10 2022-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US11386909B2 (en) 2017-11-10 2022-07-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US11462226B2 (en) 2017-11-10 2022-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US11545167B2 (en) 2017-11-10 2023-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
US11562754B2 (en) 2017-11-10 2023-01-24 Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. Analysis/synthesis windowing function for modulated lapped transformation
US12033646B2 (en) 2017-11-10 2024-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation

Also Published As

Publication number Publication date
CA2197128C (en) 2000-04-11
EP0797324A3 (en) 2004-01-14
JP3316159B2 (ja) 2002-08-19
CA2197128A1 (en) 1997-09-23
DE69731677D1 (de) 2004-12-30
US5812971A (en) 1998-09-22
EP0797324A2 (en) 1997-09-24
DE69731677T2 (de) 2005-12-15
EP0797324B1 (en) 2004-11-24

Similar Documents

Publication Publication Date Title
JP3316159B2 (ja) マルチチャネルオーディオ信号のジョイントステレオ符号化方法
CA2286068C (en) Method for coding an audio signal
RU2411594C2 (ru) Кодирование и декодирование аудио
US5781888A (en) Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
US5488665A (en) Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
EP1866913B1 (en) Audio encoding and decoding
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
EP3561810A1 (en) Method of coding data
BR9611852A (pt) Codificador de áudio.
JP2012163969A5 (ja)
KR20070003594A (ko) 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법
JP4927264B2 (ja) オーディオ信号を符号化する方法
KR20040054235A (ko) 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов
JP2000151414A (ja) ディジタルオーディオ符号化装置、同符号化方法、及び同符号化プログラムを記録した記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080607

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090607

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100607

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110607

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110607

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120607

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120607

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130607

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term