JPH1051313A - マルチチャネルオーディオ信号のジョイントステレオ符号化方法 - Google Patents
マルチチャネルオーディオ信号のジョイントステレオ符号化方法Info
- Publication number
- JPH1051313A JPH1051313A JP9064052A JP6405297A JPH1051313A JP H1051313 A JPH1051313 A JP H1051313A JP 9064052 A JP9064052 A JP 9064052A JP 6405297 A JP6405297 A JP 6405297A JP H1051313 A JPH1051313 A JP H1051313A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- spectral component
- channel
- generating
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000005236 sound signal Effects 0.000 title claims description 26
- 238000001228 spectrum Methods 0.000 claims abstract description 34
- 230000003595 spectral effect Effects 0.000 claims description 128
- 238000013139 quantization Methods 0.000 claims description 21
- 239000004065 semiconductor Substances 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 claims 6
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims 2
- 238000001914 filtration Methods 0.000 abstract description 25
- 230000008569 process Effects 0.000 abstract description 21
- 230000000873 masking effect Effects 0.000 abstract description 12
- 238000011156 evaluation Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 238000007493 shaping process Methods 0.000 description 8
- 230000002087 whitening effect Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 230000036962 time dependent Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
知覚されるステレオイメージを改善する。 【解決手段】 符号化側では、各チャネルの入力信号を
高分解能フィルタバンク/変換によってスペクトル係数
に分解する。次に、知覚モデルを用いて、各チャネルご
とに1つ以上の時間依存マスキングしきい値を評価す
る。これは、知覚的に障害のない信号品質を維持しなが
ら、オーディオ信号に導入される可能性のある最大の符
号化エラーを与える。次に、各チャネルごとに、周波数
の線形予測を実行するフィルタをフィルタバンク出力に
適用し、実際のフィルタバンク出力信号ではなくその残
差に、従来のインテンシティステレオ符号化法を適用し
た後、復号側へ送信する。復号側では、従来のインテン
シティステレオ復号の後、上記の符号化側の動作と逆の
動作を実行する。
Description
号化の分野に関し、特に、マルチチャネルオーディオ信
号のジョイントステレオ符号化を実行する方法および装
置の改善に関する。
ィオ符号器」が開発され、従来のコンパクトディスク媒
体(CD)上で一般に使用されているビットレートの約
1/12以下のビットレートで高品質オーディオ信号の
伝送および蓄積が可能となっている。このような符号器
は、オーディオ信号に含まれる、人間の聴覚系の制限に
より無関係な部分を利用して、知覚的に区別できない再
構成された(すなわち復号された)信号となるのに必要
な精度のみで信号を符号化する。さまざまな標準化団体
で、国際標準化機構の動画像専門グループ(ISO/M
PEG)のMPEG1およびMPEG2オーディオ標準
のような標準が制定されている。知覚オーディオ符号器
は、例えば、米国特許第5,285,498号(発明
者:James D.Johnston、発行日:1994年2月8
日)、米国特許第5,341,457号(発明者:Jose
ph L. Hall, James D. Johnston、発行日:1994年
8月23日)に詳細に記載されている。
る知覚オーディオ符号器の構造は以下のように記述する
ことができる。
び変換(例えば周知の修正離散コサイン変換(MDC
T)、多相フィルタバンクあるいは混成構造)を用い
て、入力サンプルを、サブサンプリングされたスペクト
ル表現に変換する。
以上の時間依存マスキングしきい値を評価する。これら
のしきい値は、知覚的に障害のない信号品質を維持しな
がら、オーディオ信号に導入される可能性のある最大の
符号化エラーを与える。特に、これらのマスキングしき
い値は、サブバンドごとに個別に決定されることも可能
である。すなわち、各符号器周波数バンドは、1つ以上
のスペクトル係数のグループからなり、それらは、対応
して決定されるマスキングしきい値に基づいてまとめて
符号化される。
価値に対応する精度に従って量子化し(符号器周波数バ
ンドごとに)符号化する。このようにして、量子化ノイ
ズはそれぞれの送信信号によって隠され(すなわちマス
クされ)、それによって、復号後には知覚されない。
ば、符号化されたスペクトル値と、それ以外の補助情
報)を、ビットストリームにパックし、復号器へ送信す
る。
る処理は逆になる。
たスペクトルデータと補助情報へと解析する。
を、(符号器で用いられたものに対応して周波数バンド
ごとに)実行する。
値を時間領域表現にマッピングする。
人間聴覚系の制限による各信号内に含まれる無関係な部
分を効率的に利用することが可能となる。特に、量子化
ノイズのスペクトルは、信号のノイズマスキングしきい
値の形状に従って整形することができる。このようにし
て、符号化プロセスから生じるノイズは符号化された信
号の下に「隠す」ことができ、知覚的に透過的な品質が
高い圧縮レートで実現される。
は、2チャネルあるいはマルチチャネルのステレオ信号
の符号化に拡張されている。特に、各入力信号に対して
別々の(すなわち独立の)符号化プロセスを実行するの
ではなく、入力信号にジョイント(結合、同時)信号処
理を実行する、いわゆる「ジョイントステレオ」符号化
技術が導入されている。(注意すべき点であるが、一般
に用いられており当業者には周知のように、「ステレ
オ」という用語は複数のオーディオチャネルの使用を指
す。)
少なくとも2つの利点がある。第1に、ジョイントステ
レオ符号化法の使用は、バイノラルな(両耳の)音響心
理学的効果を取り入れる能力を提供する。第2に、ステ
レオ信号の符号化に必要なビットレートは、各チャネル
に対して個別かつ独立に符号化を実行するのに必要なビ
ットレートよりも大幅に減少する。
ディオ符号器の構造は以下のように記述することができ
る。
び変換(例えば修正離散コサイン変換(MDCT)、多
相フィルタバンクあるいは混成構造)を用いて、各入力
信号のサンプルを、サブサンプリングされたスペクトル
表現に変換する。
依存マスキングしきい値を各チャネルごとに評価する。
これは、知覚的に障害のない信号品質を維持しながら、
オーディオ信号に導入される可能性のある最大の符号化
エラーを与える。
め、スペクトル係数データの一部を同時処理し、ステレ
オ信号の効率的表現を得る。使用するジョイントステレ
オ符号化法に応じて、マスキングしきい値にも調整がな
されることがある。
度に従ってスペクトル値を量子化し符号化する。このよ
うにして、量子化ノイズはそれぞれの送信信号によって
隠され(すなわちマスクされ)、それによって、復号後
には知覚されない。
ば、符号化されたスペクトル値と、それ以外の補助情
報)を、ビットストリームにパックし、復号器へ送信す
る。
符号器とは逆になる。
たスペクトルデータと補助情報へと解析する。
実行する。
ロセスをスペクトル値に対して実行し、それによって、
各チャネルごとに別々の信号を得る。
応する合成フィルタバンクを用いて時間領域表現にマッ
ピングする。
ントステレオ符号化方式として、「ミッド/サイド」
(M/S)ステレオ符号化と、「インテンシティ」ステ
レオ符号化の2つが知られている。M/Sステレオ符号
化に基づく符号器の構造および動作は、例えば、米国特
許第5,285,498号(前掲)に記載されている。
この技術を用いて、バイノラルマスキング効果が取り入
れられるとともに、信号に依存する利得が幾分か実現さ
れる。
ット節約の高い可能性を有する。特に、この方法は、す
べてのジョイント符号化チャネル信号に対してただ1つ
のスペクトル係数セットを送信することによって、高い
周波数(例えば、4kHz以上の周波数)における人間
聴覚系の制限を利用し、それにより、データレートの大
幅な節約を実現する。インテンシティステレオ原理に基
づく符号器は、欧州特許出願0 497 413 A1
(発明者:R. Veldhuis他、出願日:1992年1月2
4日、公開日:1992年8月5日)、および、(異な
る用語を用いているが)国際出願公開WO92/126
07(発明者:M. Davis他、出願日:1992年1月8
日、公開日:1992年7月23日)などのいくつかの
文献に記載されている。
テレオ処理を適用することによって、必要なビットレー
トに関してさらに節約が実現される。インテンシティス
テレオ符号化の場合、このような節約の一部は、人間聴
覚系が高い周波数(例えば、4kHz以上の周波数)の
位相情報に敏感でないことが知られているという事実か
ら導出される。人間の有毛細胞の特性により、信号波形
そのものではなく信号のエンベロープ(包絡線)が知覚
的に評価される。従って、信号の波形全体を符号化する
必要はなく、信号のエンベロープを符号化すれば十分で
ある。これは、例えば、各チャネルごとに別々の係数セ
ットを送信するのではなく、すべての関連するチャネル
に対する1つの共通のスペクトル係数セット(以下「キ
ャリア信号」という。)を送信することによって実現さ
れる。その後、復号器では、このキャリア信号を各信号
チャネルごとに独立にスケーリングして、それぞれの符
号器ブロックに対する平均エンベロープ(あるいは信号
エネルギー)に一致させる。
符号器周波数バンドごとに以下の処理ステップが一般に
実行される。
から、複数のチャネル信号を表現するのに適した1つの
「キャリア」信号を生成する。これは通常は、部分信号
の線形結合を形成することによってなされる。
プあるいはエネルギー内容を記述するスケーリング情報
をもとの信号から抽出する。
両方を復号器へ送信する。
係数を再構成する。その後、各チャネルごとのスケーリ
ング情報を用いてキャリア信号をスケーリングすること
によって各チャネルごとのスペクトル係数を計算する。
対するスペクトル成分の別々のセットを送信する必要は
なく、ただ1つのスペクトル係数セット(すなわち、キ
ャリア信号の係数セット)を、少量の補助情報とともに
送信するだけでよい。2チャネルステレオの場合、この
結果として、インテンシティ符号化周波数領域のデータ
レートはほぼ50%節約される。
らず、インテンシティステレオ符号化法の過度のあるい
は制御されない適用により、知覚されるステレオイメー
ジが劣化することがある。その理由は、一定時間にわた
る信号の詳細構造は、符号化方式の粒度(例えば、ブロ
ックあたり20ms)よりも短い期間では保持されない
ためである。特に、単一のキャリアの使用の結果とし
て、それから再構成されるすべての出力信号は必然的に
互いのスケーリングされたものとなる。換言すれば、符
号化ブロックの継続時間(例えば10〜20ms)では
同じ微細エンベロープ構造を有する。これは、静止信
号、あるいは、インテンシティステレオ符号化チャネル
において類似の微細エンベロープ構造を有する信号では
重大な問題を生じない。
ロープを有する過渡信号では、符号化チャネル間のエン
ベロープ開始のもとの分布は回復できない。例えば、拍
手する聴衆のステレオ録音では、両側のチャネルで別々
の拍手事象が異なる時刻に起こることにより、個々のエ
ンベロープは左右のチャネルで非常に異なることにな
る。同様の効果は、ステレオマイクロフォンを用いるこ
とによって制作される録音で生じる。例えば、音源の空
間的位置は、本質的に、それぞれのチャネル信号間の時
間差すなわち遅延として符号化される。その結果、イン
テンシティステレオ符号化/復号信号のステレオイメー
ジ品質はこれらの場合には大幅に低下することになる。
空間的印象は結果的に狭くなり、知覚されるステレオイ
メージは中心位置につぶれることになる。臨界的な信号
に対しては、達成される品質は許容できないものとなる
ことがある。
オ符号化/復号信号のステレオイメージの劣化を回避す
るためにいくつかの方略が提案されている。インテンシ
ティステレオ符号化を用いることにはステレオイメージ
に影響を与える危険があるため、符号器のビット数が足
りなくなったときにのみこの技術を用いることにより、
聴取者にいっそう不快であると知覚される重大な量子化
歪みを回避することができる。あるいは、チャネルの微
細な時間構造の非類似性を検出するアルゴリズムを用い
ることができる。エンベロープの不一致が検出される
と、インテンシティステレオ符号化をそのブロックには
適用しない。このようなアプローチは、例えば、"Inten
sity Stereo Coding" (J. Herre et al., 96th Audio E
ngineering Society Convention, Amsterdam, February
1994)に記載されている。しかし、このような信号に対
してインテンシティステレオ符号化が無効にされる場合
にビット節約の可能性が完全に利用されないことは、従
来提案されている解決法の明らかな欠点である。
ば、インテンシティステレオ符号化法を用いてマルチチ
ャネルオーディオ信号のジョイントステレオ符号化を実
行する方法および装置によって、従来技術の欠点が克服
される。特に、予測フィルタリング法をスペクトル係数
データに適用することにより、各チャネルの出力信号の
微細時間構造を保持しながら、インテンシティステレオ
符号化によって提供される高いビットレート節約の利益
を維持する。本発明の一実施例では、2チャネルステレ
オ信号の符号器で以下に以下の処理ステップを適用する
ことによって、インテンシティステレオ符号化/復号信
号の知覚されるステレオイメージを改善する方法が実現
される。
タバンク/変換によってスペクトル係数に分解する。
1つ以上の時間依存マスキングしきい値を評価する。こ
れは、知覚的に障害のない信号品質を維持しながら、オ
ーディオ信号に導入される可能性のある最大の符号化エ
ラーを与える。
実行するフィルタをフィルタバンク出力に適用し、実際
のフィルタバンク出力信号ではなくその残差が以下のス
テップで使用される。
して両方の残差信号を1つのキャリア信号へと符号化す
る。
度に従ってキャリア信号のスペクトル値を量子化し符号
化する。
化されたスペクトル値、インテンシティスケーリングデ
ータ、各チャネルごとの予測フィルタデータ、および、
それ以外の補助情報)を、ビットストリームにパック
し、復号器へ送信する。
ば、上記の符号器に対応して、ジョイントステレオ符号
化信号の復号器は、以下の処理ステップを実行する。
たスペクトルデータと補助情報へと解析する。
量子化を実行する。
ンテンシティステレオ復号を実行することにより、各チ
ャネルごとの(残差)信号を生成する。
しもとの信号を符号化するために用いられた符号器によ
って適用された予測フィルタに対応する逆予測フィルタ
を残差信号に適用する。
クトル値を、合成フィルタバンクを用いて時間領域表現
にマッピングする。
プロセスを符号器および復号器に組み込むことにより、
同一の微細エンベロープ構造がすべてのインテンシティ
ステレオ復号チャネル信号で生成されるという従来の方
式の制限を克服することによって、インテンシティステ
レオ符号化/復号信号の品質が改善される。特に、本発
明の符号化方法は、予測フィルタリング段でフィルタバ
ンクを効果的に拡張し、一定周波数にわたる共通のエン
ベロープ情報をフィルタ係数として抽出し、ほとんどの
部分で残差信号から除去することによって、従来技術の
欠点を克服する。
て、その対応するスペクトル係数データに対する線形予
測を実行する。この線形予測は、周波数に関して実行さ
れる。予測符号化がスペクトル領域データに適用される
ため、古典的な予測について知られている関係は、時間
領域と周波数領域を入れ換えることにより正しいものと
なる。例えば、予測エラー信号は理想的には、「平坦
な」パワースペクトルを有するのではなく、「平坦な」
(正方形の)エンベロープを有する(「前白色化」フィ
ルタ効果)。各チャネル信号に対する微細時間構造情報
はその予測フィルタ係数に含まれる。従って、インテン
シティステレオ符号化に用いられるキャリア信号もまた
平坦なエンベロープを有すると仮定することができる。
その理由は、このキャリア信号は、(フィルタリングさ
れた)チャネル信号の線形結合を形成することによって
生成されるためである。
は、送信されたスケーリング情報に従って各チャネル信
号を再スケーリングし、逆フィルタリングプロセスをス
ペクトル係数に適用する。このようにして、逆の「前白
色化」プロセスを各復号チャネル信号のエンベロープに
対して実行し、エンベロープ情報をスペクトル係数に効
果的に導入する。これは各チャネルごとに個別に行われ
るため、拡張された符号化/復号システムは、各チャネ
ル信号ごとの個別の微細エンベロープ構造を再生するこ
とが可能となる。注意すべき点であるが、実際、周波数
に関してフィルタバンクと線形予測の組合せを使用する
ことは、入力信号のエンベロープに一致する適応フィル
タバンクを使用することと等価である。信号をエンベロ
ープ整形するプロセスは、信号のスペクトル全体に対し
ても、あるいは、その一部のみに対しても実行すること
ができるため、この時間領域エンベロープ制御は、周波
数に依存して必要に応じて適用することができる。
ば上記の実施例の符号器(図2、図3および図7を参照
して以下で詳細に説明する)によって生成されるビット
ストリームは、コンパクトディスクやディジタルオーデ
ィオテープのような記憶媒体に、あるいは、半導体メモ
リデバイスに、記憶することができる。その後、このよ
うな記憶媒体を「読み出し」、例えば上記の実施例の復
号器(図5、図6および図8を参照して以下で詳細に説
明する)によって復号するためのビットストリームを供
給することができる。このようにして、かなりの量のオ
ーディオデータ(例えば音楽)を、再構成信号における
(知覚的な)品質の損失なしに、与えられた記憶媒体上
に圧縮することができる。
シティステレオ符号化法が使用される2チャネルステレ
オ信号用の従来の知覚符号器を示す。図1の符号器は以
下のように動作する。
xr(k)はそれぞれ、分析フィルタバンク/変換モジ
ュール12lおよび12rによってスペクトル係数に分
解され、各分析ブロックごとにそれぞれn個のスペクト
ル成分の対応するセットyl(b,0...n−1)およ
びyr(b,0...n−1)が得られる。ただし、nは
分析ブロックごとのスペクトル係数の数(すなわちブロ
ックサイズ)である。各スペクトル成分yl(b,i)
あるいはyr(b,i)は、使用される個々のフィルタ
バンクによる分析周波数に対応する。
あるいは11rは、符号化/復号信号の知覚的に透過的
な品質のために必要な符号化精度を評価する。この評価
データは、例えば、各符号器バンドに必要な最小の信号
対ノイズ比(SNR)に基づいており、量子化/符号化
モジュールに渡される。
l(b,0...n−1)およびyr(b,0...n−1)
がインテンシティステレオ符号化モジュール13に送ら
れる。インテンシティステレオ符号化モジュール13
は、従来のインテンシティステレオ符号化を実行する。
インテンシティステレオ符号化から除かれることになる
スペクトル部分に対しては、対応するyl(b,0...
n−1)およびyr(b,0...n−1)の値は直接量
子化・符号化段に渡される。インテンシティステレオ符
号化を利用することになるスペクトル部分(すなわち、
その高周波部分)に対しては、インテンシティ符号化プ
ロセスが以下のように実行される。各信号yl()およ
びyr()から、各符号器周波数バンドごとにスケーリ
ング情報(例えば、ピーク振幅あるいは全エネルギー)
を抽出し、対応するyl()およびyr()の値を結合
することによって単一のキャリア信号yi()を生成す
る。従って、インテンシティステレオで符号化されるス
ペクトル部分については、両方のチャネルに対してただ
1つの値のセットyi()と、各チャネルごとのスケー
リング補助情報が、量子化・符号化段に送られる。ある
いは、両方のチャネルのスケーリング情報を、向き情報
と結合したものを(単一のキャリア信号とともに)使用
することも可能である。
のスペクトル成分(yl()およびyr()の別々の値
と共通のyi()の値からなる)は、量子化・符号化モ
ジュール14によって、量子化され、送信シンボルにマ
ッピングされる。このモジュールは、知覚モデル11l
および11rによって決定される必要な符号化精度を考
慮に入れる。
生成された送信シンボル値は、その他の補助情報ととも
に、ビットストリーム符号器/マルチプレクサ15に送
られ、それによって、符号化されたビットストリームが
送信される。インテンシティステレオ符号化を用いる符
号器周波数バンドに対しては、インテンシティステレオ
符号化モジュール13によって送られるスケーリング情
報もまたビットストリーム符号器/マルチプレクサ15
に送られ、それによって同様に、符号化されたビットス
トリームで送信される。
例による2チャネルステレオ信号用符号器を示す。図2
の実施例の符号器の動作は、各チャネルごとに、対応す
る分析フィルタバンクとインテンシティステレオ符号化
モジュールの間に予測フィルタリング段が導入されるこ
とを除いては、図1の従来の符号器と同様である。すな
わち、予測フィルタ16lおよび16rがそれぞれ分析
フィルタバンク12lおよび12rの出力に適用され
る。これにより、スペクトル値yl(b,0...n−
1)およびyr(b,0...n−1)は、インテンシテ
ィステレオ符号化モジュール13に送られる前に、それ
ぞれ予測フィルタリングプロセスの出力値yl′(b,
0...n−1)およびyr′(b,0...n−1)によっ
て置き換えられる。
ルタの実施例を示す。具体的には、各チャネルの予測フ
ィルタリング段内では、線形予測が周波数にわたって
(例えば、サブバンドADPCM符号器によって用いら
れるような時間にわたって実行される予測符号化とは異
なり)実行される。このために、「回転スイッチ」43
が、処理前にスペクトル値を直列順序にするように動作
し、その結果の出力値y′(b,0...n−1)がその
後「回転スイッチ」46によって並列に出力される。
(注意すべき点であるが、直列と並列の間の整列の変換
のための機構として「回転スイッチ」を用いることはこ
こでは便宜上および理解を容易にするためのものであ
る。当業者には明らかなように、このような物理的なス
イッチングデバイスが必ずしも必要なわけではない。む
しろ、直列と並列の間の整列の変換は、ソフトウェアの
みの使用を含む、当業者に周知の任意の方法で実行され
る。)本実施例は、周波数の昇順でスペクトル値の処理
を実行するが、別の実施例として、例えば、周波数の降
順で処理を実行することも可能である。当業者には明ら
かなように、別の順序も可能である。
(b,0...n−1)は、入力値から予測値(予測器4
7によって予測される)を減算する(減算器48を用い
て)ことによって、入力値y(b,0...n−1)から
計算され、予測エラー信号のみが出力される。注意すべ
き点であるが、図中でエンベロープ前白色化フィルタ4
4として表示されている予測器47と減算器48の組合
せは、対応する時間信号の時間形状を等化するように作
用する。
lおよび16rによって実行されるプロセスは、スペク
トル全体に対して実行されることも、あるいは、スペク
トルの一部のみ(すなわち、スペクトル係数のサブセッ
ト)に対して実行されることも可能である。さらに、相
異なる予測器フィルタ(例えば、図3で複数の相異なる
予測器47を用いる)を、信号スペクトルの相異なる部
分に対して使用することも可能である。このようにし
て、時間領域のエンベロープ制御のための上記の方法
は、周波数に応じて必要に応じて適用可能である。
ビットストリームは別に補助情報を含む。例えば、この
ような情報の1つのフィールドは予測フィルタリングの
使用を表示し、適用可能な場合、予測フィルタの数を表
示することが可能である。予測フィルタリングが用いら
れている場合、それぞれのフィルタおよびそのフィルタ
係数のターゲット周波数範囲を示すビットストリームの
追加フィールドが、各予測フィルタごとに送信されるこ
とも可能である。このように、図2で「Lフィルタデー
タ」および「Rフィルタデータ」と表示された破線で示
されているように、予測フィルタ16lおよび16r
は、送信されるビットストリームに含めるために、必要
な情報をビットストリーム符号器/マルチプレクサ17
に送る。
ルステレオ信号を符号化する方法の流れ図である。この
流れ図に示す実施例は、図2の実施例の符号器の主要部
分を実装する。特に、この流れ図は、単一の予測フィル
タを用いたエンベロープ前白色化プロセスを含む、単一
のチャネルに対する符号器のフロントエンド部分を示
す。この前白色化プロセスは、図のステップ61に示さ
れているように、分析フィルタバンクによるスペクトル
値の計算の後に実行される。
タの次数を設定し、ターゲット周波数範囲が定義する
(ステップ62)。これらのパラメータは、例えば、フ
ィルタ次数を15に設定し、ターゲット周波数範囲は、
インテンシティステレオ符号化を用いて符号化されるこ
とになる全周波数範囲(例えば4kHz〜20kHz)
からなる。このようにして、この方式は、各オーディオ
チャネルごとに個別の微細時間構造データのセットを提
供するように設定される。ステップ63で、ターゲット
周波数範囲に一致するスペクトル計数の範囲を使用する
ことによって、および、周知のような予測符号化の従来
の方法(例えば、差分パルス符号変調(DPCM)符号
器の場合のもの)を適用することによって、予測フィル
タを決定する。例えば、係数の自己相関関数を計算し、
当業者に周知のように、従来のレヴィンソン=ダービン
再帰アルゴリズムで使用することが可能である。その結
果、予測器フィルタ係数と、対応する反射係数(PAR
COR係数)と、期待される予測利得が分かる。
あるしきい値(例えば2dB)を超える場合、ステップ
65〜67の予測フィルタリング手続きが用いられる。
この場合、補助情報の一部として復号器へ送信するため
に必要となる予測フィルタ係数が量子化される(ステッ
プ65)。次に、ステップ66で、予測フィルタは、タ
ーゲット周波数範囲に一致するスペクトル係数の範囲に
適用される。そこでは、量子化されたフィルタ係数が使
用される。従って、その後のすべての処理では、スペク
トル係数は、フィルタリングプロセスの出力によって置
き換えられる。最後に、ステップ67で、送信されるビ
ットストリームの1つのフィールドが、予測フィルタリ
ングの使用を示すようにセットされる(「予測フラグ」
がオンになる)。さらに、ターゲット周波数範囲、予測
フィルタの次数、およびそのフィルタ係数を記述する情
報もまたビットストリームに含められる。
利得が判定しきい値を超えない場合、ステップ68で、
予測フィルタリングが使用されていないことを示すよう
にビットストリーム内のフィールドがセットされる
(「予測フラグ」がオフになる)。最後に、上記の処理
が完了した後、従来の符号器で実行される通常のステッ
プ(例えば図1の符号器によって実行されるようなも
の)が実行される。すなわち、インテンシティステレオ
符号化プロセスをスペクトル係数(これは今の場合残差
データとなる)に適用し、インテンシティステレオ符号
化プロセスの結果を量子化および符号化し、送信される
実際のビットストリームを(適当な補助情報を多重化し
て)送信用に符号化する。しかし、注意すべき点である
が、図1の従来の符号器の従来のビットストリーム符号
器/マルチプレクサ15の代わりに、図2の実施例の符
号器のビットストリーム符号器/マルチプレクサ17で
置き換えられており、予測フィルタ16lおよび16r
によって提供される追加の補助情報(すなわち「Lフィ
ルタデータ」および「Rフィルタデータ」)が出力ビッ
トストリーム内に符号化され送信される。
号器に対応する、従来のインテンシティステレオ符号化
法が使用される、ジョイントステレオ符号化信号用の従
来の復号器を示す。具体的には、図4の復号器は以下の
ステップを実行する。
ム復号器/デマルチプレクサ21で解析され、スペクト
ル係数の送信シンボルは、量子化関連補助情報とともに
復号・逆量子化モジュール22に送られる。
化されたスペクトル値yql()、yqr()およびy
qi()を再構成する。これらの信号は、独立に符号化
された左チャネル信号部分、独立に符号化された右チャ
ネル信号部分、およびインテンシティステレオキャリア
信号にそれぞれ対応する。
値および送信されたスケーリング情報から、従来のイン
テンシティステレオ復号プロセスを用いて左右のチャネ
ル信号のyql()およびyqr()の欠損部分を計算
する。これは、インテンシティステレオ復号モジュール
23によって実行される。このモジュールの出力では、
左右のチャネルのそれぞれに対応して、2つの完全な
(かつ独立の)チャネルスペクトル信号yql()およ
びyqr()が利用可能である。
ペクトル信号yql()およびyqr()を、合成フィ
ルタバンク24lおよび24rによって時間領域表現に
マッピングすることにより、最終的な出力信号x
l′()およびxr′()を得る。
の符号器に対応する、本発明の実施例によるジョイント
ステレオ符号化信号の復号器を示す。図5の実施例の復
号器の動作は、各チャネルごとに逆予測フィルタリング
段が、インテンシティステレオ復号と、対応する合成フ
ィルタバンクの間に導入されることを除いては、図4の
従来の復号器と同様である。すなわち、逆予測フィルタ
26lおよび26rがそれぞれ合成フィルタバンク24
lおよび24rの前に挿入される。従って、インテンシ
ティステレオ復号モジュール23によって生成されるス
ペクトル値yql()およびyqr()は、それぞれ、
対応する合成フィルタバンク(合成フィルタバンク24
lおよび24r)へ送られる前に、対応する逆予測フィ
ルタリングプロセスの出力値によって置き換えられる。
ィルタの実施例を示す。具体的には、この逆量子化フィ
ルタ内で、線形フィルタリング動作が周波数にわたって
(サブバンドADPCM符号器の場合のように時間にわ
たって予測符号化を実行するのとは異なり)実行され
る。図3の予測フィルタの実施例の場合と同様に、図6
の「回転スイッチ」33は、スペクトル値yq(b,
0...n−1)を処理の前に直列順序にするために使用
され、図の「回転スイッチ」36は、その後の結果の出
力値yq′(b,0...n−1)を並列に整列させるた
めに使用される。(再び、注意すべき点であるが、直列
と並列の間の整列の変換のための機構として「回転スイ
ッチ」を用いることはここでは便宜上および理解を容易
にするためのものである。当業者には明らかなように、
このような物理的なスイッチングデバイスが必ずしも必
要なわけではない。むしろ、直列と並列の間の整列の変
換は、ソフトウェアのみの使用を含む、当業者に周知の
任意の方法で実行される。)また、上記の符号器の実施
例の場合と同様に、周波数の昇順または降順での処理が
可能であるとともに、その他の可能な順序も当業者には
明らかである。
0...n−1)は、対応する符号器で用いられたエンベ
ロープ前白色化フィルタの逆を適用することによって入
力値yq(b,0...n−1)から計算される。特に、
出力値は、予測値(予測器37によって予測される)を
図示のように入力値に加算する(加算器38を用いて)
ことによって入力値から計算される。注意すべき点であ
るが、図中でエンベロープ整形フィルタ34として表示
されている予測器37と加算器38の組合せは、もとの
時間信号の時間形状を再生するように作用する。
述べたように、上記のフィルタリングプロセスは、スペ
クトル全体に対して実行されることも、あるいは、スペ
クトルの一部のみ(すなわち、スペクトル係数のサブセ
ット)に対して実行されることも可能である。さらに、
相異なる予測器フィルタ(例えば、図6で複数の相異な
る予測器37を用いる)を、信号スペクトルの相異なる
部分に対して使用することも可能である。このような場
合(信号の正しい復号を実行するために)、図5の実施
例の復号器は、符号器によって送信された追加の補助情
報(図では「Lフィルタデータ」および「Rフィルタデ
ータ」と表示されている)をビットストリームから復号
し、このデータを逆予測フィルタ26lおよび26rに
供給する。このようにして、予測復号は、対応する予測
フィルタで、指定された各ターゲット周波数範囲に適用
される。
する、本発明の実施例によるジョイントステレオ符号化
信号を復号する方法の流れ図である。この流れ図の実施
例は、図5の実施例の復号器の主要部分を実装する。特
に、この流れ図は、単一の(逆)予測フィルタを用いた
エンベロープ整形プロセスを含む、単一のチャネルに対
する復号器のバックエンド部分を示す。図8の流れ図の
ステップの前に復号器によって実行される処理は、従来
の復号器で実行される通常のステップ(図4の復号器に
よって実行されるようなもの)である。すなわち、ビッ
トストリームは符号化/分離化され、その結果のデータ
は復号され逆量子化され、インテンシティステレオ復号
プロセスが実行される。しかし、注意すべき点である
が、図4の従来の復号器の従来のビットストリーム復号
器/デマルチプレクサ21の代わりに、図5の実施例の
復号器のビットストリーム復号器/デマルチプレクサ2
5で置き換えられており、符号器によって提供される追
加の補助情報(例えば、「Lフィルタデータ」および
「Rフィルタデータ」)が復号され、逆予測フィルタ2
6lおよび26rに送られる。
後、予測フィルタリングの使用を通知するビットストリ
ームからのデータを検査する(判定72)。そのデータ
が、予測フィルタリングが符号器で実行されたことを示
している場合(すなわち、「予測フラグ」がオン)、ス
テップ73および74の拡張された復号プロセスを実行
する。特に、予測フィルタリングのターゲット周波数範
囲、前白色化(予測)フィルタの次数、および、フィル
タの係数を記述する情報を、(以前に復号されている)
補助情報から取得する(ステップ73)。次に、逆(復
号器)予測フィルタ(すなわちエンベロープ整形フィル
タ)を、ターゲット周波数範囲に一致するスペクトル係
数の範囲に適用する(ステップ74)。ステップ75に
示されているように、いずれの場合でも(すなわち、予
測フィルタリングが実行されたかどうかにかかわら
ず)、復号器の処理は、スペクトル係数(適用可能な場
合にはエンベロープ整形フィルタによって処理されたも
の)に、合成フィルタバンクを作用させる(各チャネル
ごとに)ことによって、完了する。
セス(すなわち、符号器における予測フィルタリングお
よび復号器における逆フィルタリング)を用いて、離散
フーリエ変換(DFT)あるいは離散コサイン変換(D
CT)(いずれも当業者に周知)を含む従来のブロック
変換に対して、直接的なエンベロープ整形効果が達成さ
れる。例えば、本発明による知覚符号器が重畳する窓に
よる臨界的にサブサンプリングされたフィルタバンクを
使用する場合(例えば、従来の修正離散コサイン変換
(MDCT)や、従来の時間領域エイリアシング相殺
(TDAC)に基づくフィルタバンク)、結果のエンベ
ロープ整形効果は、フィルタバンクに固有の時間領域エ
イリアシング効果を受ける。例えば、MDCTの場合、
窓の半分ごとに1回の鏡映(すなわち、エイリアシン
グ)作用が起こり、微細エンベロープ構造が、復号後の
窓の左半分および右半分内にそれぞれ鏡映されて(すな
わち、エイリアシングによって)現れる。最終的なフィ
ルタバンク出力は、各逆変換の出力に合成窓を適用し、
これらのデータセグメントの重畳加算を実行することに
よって得られるため、好ましくないエイリアシング成分
は、使用される合成窓に依存して減衰する。従って、時
間的なエイリアシング効果が最小化されるように、後続
のブロック間で小さい重畳しか示さないフィルタバンク
窓を選択するのが有利である。例えば、符号器における
適当な方略によって、臨界的な信号に対する重畳の程度
の小さい窓を適応的に選択することが可能であり、それ
によって、周波数選択性が改善される。このような方略
の実装の詳細は当業者には明らかである。
が、さまざまな変形例が可能である。例えば、上記の実
施例では2チャネルのみからなるステレオオーディオ信
号の符号化および復号に限定して説明したが、3チャネ
ル以上のステレオオーディオ信号の符号化および復号の
ための実施例を、上記の説明に基づいて構成すること
は、当業者には明らかである。
ンテンシティステレオ符号化法を用いたマルチチャネル
オーディオ信号のジョイントステレオ符号化においてビ
ット節約の可能性が完全に利用されないという従来技術
の欠点が克服される。特に、予測フィルタリング法をス
ペクトル係数データに適用することにより、各チャネル
の出力信号の微細時間構造を保持しながら、インテンシ
ティステレオ符号化によって提供される高いビットレー
ト節約の利益を維持する。
される、2チャネルステレオ信号用の従来の符号器の図
である。
用符号器の図である。
の図である。
される、図1の従来の符号器に対応するジョイントステ
レオ符号化信号の従来の復号器の図である。
に対応する、ジョイントステレオ符号化信号の復号器の
図である。
例の図である。
を符号化する方法の流れ図である。
施例に対応する、ジョイントステレオ符号化信号を復号
する方法の流れ図である。
Claims (24)
- 【請求項1】 マルチチャネルオーディオ信号のジョイ
ントステレオ符号化を実行して符号化信号を生成する方
法において、 (a)第1オーディオチャネル信号を、複数の第1スペ
クトル成分信号に分解するスペクトル分解を実行するス
テップと、 (b)1つの第1スペクトル成分信号の予測値を表す第
1予測信号を、他の1つ以上の第1スペクトル成分信号
に基づいて生成するステップと、 (c)前記第1予測信号を前記1つの第1スペクトル成
分信号と比較して第1予測エラー信号を生成するステッ
プと、 (d)第2オーディオチャネル信号を、複数の第2スペ
クトル成分信号に分解するスペクトル分解を実行するス
テップと、 (e)前記第1予測エラー信号に基づいて、前記1つの
第1スペクトル成分信号と1つの第2スペクトル成分信
号のジョイントステレオ符号化を実行して、ジョイント
符号化スペクトル成分信号を生成するステップと、 (f)前記ジョイント符号化スペクトル成分信号に基づ
いて前記符号化信号を生成するステップとからなること
を特徴とする、マルチチャネルオーディオ信号のジョイ
ントステレオ符号化方法。 - 【請求項2】 (g)前記1つの第2スペクトル成分信
号の予測値を表す第2予測信号を、他の1つ以上の第2
スペクトル成分信号に基づいて生成するステップと、 (h)前記第2予測信号を、前記1つの第2スペクトル
成分信号と比較して第2予測エラー信号を生成するステ
ップとをさらに有し、 前記ステップeは前記第2予測エラー信号にも基づくこ
とを特徴とする請求項1の方法。 - 【請求項3】 前記ステップeは、前記1つの第1スペ
クトル成分信号と前記1つの第2スペクトル成分信号の
インテンシティステレオ符号化を実行するステップを含
むことを特徴とする請求項1の方法。 - 【請求項4】 前記ステップfは、前記ジョイント符号
化スペクトル成分信号を量子化するステップを含むこと
を特徴とする請求項1の方法。 - 【請求項5】 前記ジョイント符号化スペクトル成分信
号の量子化は知覚モデルに基づくことを特徴とする請求
項4の方法。 - 【請求項6】 もとのマルチチャネルオーディオ信号の
ジョイントステレオ符号化による符号化信号を復号して
再構成マルチチャネルオーディオ信号を生成する方法に
おいて、 (a)前記符号化信号のジョイントステレオ復号を実行
して、それぞれ複数の復号スペクトル成分予測エラー信
号からなる複数の復号チャネル信号を生成するステップ
と、 (b)前記複数の復号チャネル信号のうちの第1復号チ
ャネル信号に含まれる1つ以上のスペクトル成分予測エ
ラー信号に基づいて第1スペクトル成分信号を生成する
ステップと、 (c)前記第1スペクトル成分信号に基づいて、第2ス
ペクトル成分信号の予測値を表す第1予測信号を生成す
るステップと、 (d)前記第1予測信号および前記第1復号チャネル信
号に含まれる1つ以上のスペクトル成分予測エラー信号
に基づいて、第2スペクトル成分信号を生成するステッ
プと、 (e)前記第1スペクトル成分信号および前記第2スペ
クトル成分信号に基づいて、前記再構成マルチチャネル
オーディオ信号の第1チャネルを生成するステップとか
らなることを特徴とする、マルチチャネルオーディオ信
号の復号方法。 - 【請求項7】 (f)前記複数の復号チャネル信号のう
ちの第2復号チャネル信号に含まれる1つ以上のスペク
トル成分予測エラー信号に基づいて第3スペクトル成分
信号を生成するステップと、 (g)前記第3スペクトル成分信号に基づいて、第4ス
ペクトル成分信号の予測値を表す第2予測信号を生成す
るステップと、 (h)前記第2予測信号および前記第2復号チャネル信
号に含まれる1つ以上のスペクトル成分予測エラー信号
に基づいて、第4スペクトル成分信号を生成するステッ
プと、 (i)前記第3スペクトル成分信号および前記第4スペ
クトル成分信号に基づいて、前記再構成マルチチャネル
オーディオ信号の第2チャネルを生成するステップとを
さらに有することを特徴とする請求項6の方法。 - 【請求項8】 前記ステップaは、前記符号化信号のイ
ンテンシティステレオ復号を実行するステップを含むこ
とを特徴とする請求項6の方法。 - 【請求項9】 マルチチャネルオーディオ信号のジョイ
ントステレオ符号化を実行して符号化信号を生成する符
号化装置において、 (a)第1オーディオチャネル信号を、複数の第1スペ
クトル成分信号に分解するスペクトル分解を実行する第
1フィルタバンクと、 (b)1つの第1スペクトル成分信号の予測値を表す第
1予測信号を、他の1つ以上の第1スペクトル成分信号
に基づいて生成する第1予測フィルタと、 (c)前記第1予測信号を前記1つの第1スペクトル成
分信号と比較して第1予測エラー信号を生成する第1比
較器と、 (d)第2オーディオチャネル信号を、複数の第2スペ
クトル成分信号に分解するスペクトル分解を実行する第
2フィルタバンクと、 (e)前記第1予測エラー信号に基づいて、前記1つの
第1スペクトル成分信号と1つの第2スペクトル成分信
号のジョイントステレオ符号化を実行して、ジョイント
符号化スペクトル成分信号を生成するジョイントステレ
オ符号器と、 (f)前記ジョイント符号化スペクトル成分信号に基づ
いて前記符号化信号を生成する出力符号器とからなるこ
とを特徴とする、マルチチャネルオーディオ信号符号化
装置。 - 【請求項10】 (g)前記1つの第2スペクトル成分
信号の予測値を表す第2予測信号を、他の1つ以上の第
2スペクトル成分信号に基づいて生成する第2予測フィ
ルタと、 (h)前記第2予測信号を、前記1つの第2スペクトル
成分信号と比較して第2予測エラー信号を生成する第2
比較器とをさらに有し、 前記ジョイントステレオ符号器は前記第2予測エラー信
号にも基づいてジョイントステレオ符号化を実行するこ
とを特徴とする請求項9の装置。 - 【請求項11】 前記ジョイントステレオ符号器は、前
記1つの第1スペクトル成分信号と前記1つの第2スペ
クトル成分信号のインテンシティステレオ符号化を実行
するインテンシティステレオ符号器を含むことを特徴と
する請求項9の装置。 - 【請求項12】 前記出力符号器は、前記ジョイント符
号化スペクトル成分信号を量子化する量子化器を含むこ
とを特徴とする請求項9の装置。 - 【請求項13】 前記量子化器は知覚モデルに基づくこ
とを特徴とする請求項12の装置。 - 【請求項14】 もとのマルチチャネルオーディオ信号
のジョイントステレオ符号化による符号化信号を復号し
て再構成マルチチャネルオーディオ信号を生成する復号
装置において、 (a)前記符号化信号のジョイントステレオ復号を実行
して、それぞれ複数の復号スペクトル成分予測エラー信
号からなる複数の復号チャネル信号を生成するジョイン
トステレオ復号器と、 (b)前記複数の復号チャネル信号のうちの第1復号チ
ャネル信号に含まれる1つ以上のスペクトル成分予測エ
ラー信号に基づいて第1スペクトル成分信号を生成する
手段と、 (c)前記第1スペクトル成分信号に基づいて、第2ス
ペクトル成分信号の予測値を表す第1予測信号を生成す
る第1予測フィルタと、 (d)前記第1予測信号および前記第1復号チャネル信
号に含まれる1つ以上のスペクトル成分予測エラー信号
に基づいて、第2スペクトル成分信号を生成する手段
と、 (e)前記第1スペクトル成分信号および前記第2スペ
クトル成分信号に基づいて、前記再構成マルチチャネル
オーディオ信号の第1チャネルを生成する第1フィルタ
バンクとからなることを特徴とする、マルチチャネルオ
ーディオ信号の復号装置。 - 【請求項15】 (f)前記複数の復号チャネル信号の
うちの第2復号チャネル信号に含まれる1つ以上のスペ
クトル成分予測エラー信号に基づいて第3スペクトル成
分信号を生成する手段と、 (g)前記第3スペクトル成分信号に基づいて、第4ス
ペクトル成分信号の予測値を表す第2予測信号を生成す
る第2予測フィルタと、 (h)前記第2予測信号および前記第2復号チャネル信
号に含まれる1つ以上のスペクトル成分予測エラー信号
に基づいて、第4スペクトル成分信号を生成する手段
と、 (i)前記第3スペクトル成分信号および前記第4スペ
クトル成分信号に基づいて、前記再構成マルチチャネル
オーディオ信号の第2チャネルを生成する第2フィルタ
バンクとをさらに有することを特徴とする請求項14の
装置。 - 【請求項16】 前記ジョイントステレオ復号器は、前
記符号化信号のインテンシティステレオ復号を実行する
インテンシティステレオ復号器を含むことを特徴とする
請求項14の装置。 - 【請求項17】 (a)第1オーディオチャネル信号
を、複数の第1スペクトル成分信号に分解するスペクト
ル分解を実行するステップと、 (b)1つの第1スペクトル成分信号の予測値を表す第
1予測信号を、他の1つ以上の第1スペクトル成分信号
に基づいて生成するステップと、 (c)前記第1予測信号を前記1つの第1スペクトル成
分信号と比較して第1予測エラー信号を生成するステッ
プと、 (d)第2オーディオチャネル信号を、複数の第2スペ
クトル成分信号に分解するスペクトル分解を実行するス
テップと、 (e)前記第1予測エラー信号に基づいて、前記1つの
第1スペクトル成分信号と1つの第2スペクトル成分信
号のジョイントステレオ符号化を実行して、ジョイント
符号化スペクトル成分信号を生成するステップと、 (f)前記ジョイント符号化スペクトル成分信号に基づ
いて符号化信号を生成するステップとからなる符号化方
法によって、マルチチャネルオーディオ信号から生成さ
れた符号化信号を記録した記憶媒体。 - 【請求項18】 前記符号化方法は、(g)前記1つの
第2スペクトル成分信号の予測値を表す第2予測信号
を、他の1つ以上の第2スペクトル成分信号に基づいて
生成するステップと、 (h)前記第2予測信号を、前記1つの第2スペクトル
成分信号と比較して第2予測エラー信号を生成するステ
ップとをさらに有し、 前記ステップeは前記第2予測エラー信号にも基づくこ
とを特徴とする請求項17の記憶媒体。 - 【請求項19】 前記ステップeは、前記1つの第1ス
ペクトル成分信号と前記1つの第2スペクトル成分信号
のインテンシティステレオ符号化を実行するステップを
含むことを特徴とする請求項17の記憶媒体。 - 【請求項20】 前記ステップfは、前記ジョイント符
号化スペクトル成分信号を量子化するステップを含むこ
とを特徴とする請求項17の記憶媒体。 - 【請求項21】 前記ジョイント符号化スペクトル成分
信号の量子化は知覚モデルに基づくことを特徴とする請
求項20の記憶媒体。 - 【請求項22】 コンパクトディスクからなることを特
徴とする請求項17の記憶媒体。 - 【請求項23】 ディジタルオーディオテープからなる
ことを特徴とする請求項17の記憶媒体。 - 【請求項24】 半導体メモリからなることを特徴とす
る請求項17の記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/621,762 US5812971A (en) | 1996-03-22 | 1996-03-22 | Enhanced joint stereo coding method using temporal envelope shaping |
US621762 | 1996-03-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1051313A true JPH1051313A (ja) | 1998-02-20 |
JP3316159B2 JP3316159B2 (ja) | 2002-08-19 |
Family
ID=24491531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06405297A Expired - Lifetime JP3316159B2 (ja) | 1996-03-22 | 1997-03-18 | マルチチャネルオーディオ信号のジョイントステレオ符号化方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5812971A (ja) |
EP (1) | EP0797324B1 (ja) |
JP (1) | JP3316159B2 (ja) |
CA (1) | CA2197128C (ja) |
DE (1) | DE69731677T2 (ja) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002162996A (ja) * | 2000-11-24 | 2002-06-07 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム |
WO2006022308A1 (ja) * | 2004-08-26 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd. | マルチチャネル信号符号化装置およびマルチチャネル信号復号装置 |
JP2008511040A (ja) * | 2004-08-25 | 2008-04-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 |
JP2008517333A (ja) * | 2004-10-20 | 2008-05-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形 |
JP2008517334A (ja) * | 2004-10-20 | 2008-05-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | バイノーラルキュー符号化方法等のための拡散音の整形 |
US7761304B2 (en) | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
US7787631B2 (en) | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
US7941320B2 (en) | 2001-05-04 | 2011-05-10 | Agere Systems, Inc. | Cue-based audio coding/decoding |
US7983922B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US8340306B2 (en) | 2004-11-30 | 2012-12-25 | Agere Systems Llc | Parametric coding of spatial audio with object-based side information |
US8352249B2 (en) | 2007-11-01 | 2013-01-08 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
US8374883B2 (en) | 2007-10-31 | 2013-02-12 | Panasonic Corporation | Encoder and decoder using inter channel prediction based on optimally determined signals |
US8983830B2 (en) | 2007-03-30 | 2015-03-17 | Panasonic Intellectual Property Corporation Of America | Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies |
JP2021502597A (ja) * | 2017-11-10 | 2021-01-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 一時的ノイズシェーピング |
US11217261B2 (en) | 2017-11-10 | 2022-01-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding audio signals |
US11315580B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
US11315583B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11380341B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US11462226B2 (en) | 2017-11-10 | 2022-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11545167B2 (en) | 2017-11-10 | 2023-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
ATE371298T1 (de) * | 1996-11-07 | 2007-09-15 | Koninkl Philips Electronics Nv | Übertragung eines bitstromsignals |
US5913191A (en) * | 1997-10-17 | 1999-06-15 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries |
DE69722973T2 (de) * | 1997-12-19 | 2004-05-19 | Stmicroelectronics Asia Pacific Pte Ltd. | Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio |
WO1999034527A1 (en) * | 1997-12-27 | 1999-07-08 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Method and apparatus for estimation of coupling parameters in a transform coder for high quality audio |
SE519552C2 (sv) | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US6463410B1 (en) * | 1998-10-13 | 2002-10-08 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
IL142086A0 (en) * | 1999-07-20 | 2002-03-10 | Koninkl Philips Electronics Nv | Record carrier carrying a stereo signal and data signal |
EP1087557A3 (en) * | 1999-09-22 | 2005-01-19 | Matsushita Electric Industrial Co., Ltd. | Apparatus for transmitting digital audio data and receiving apparatus for receiving the digital audio data |
DE19947877C2 (de) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
DE60132853D1 (de) * | 2000-07-07 | 2008-04-03 | Nokia Siemens Networks Oy | Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
FR2821475B1 (fr) * | 2001-02-23 | 2003-05-09 | France Telecom | Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
US7002618B2 (en) * | 2001-06-01 | 2006-02-21 | Stereographics Corporation | Plano-stereoscopic DVD movie |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US6751587B2 (en) * | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7437299B2 (en) * | 2002-04-10 | 2008-10-14 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
US7275036B2 (en) * | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
KR101021079B1 (ko) * | 2002-04-22 | 2011-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 다채널 오디오 표현 |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
ES2378462T3 (es) | 2002-09-04 | 2012-04-12 | Microsoft Corporation | Codificación entrópica por adaptación de codificación entre modalidades de nivel y de longitud/nivel de cadencia |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
KR100501930B1 (ko) * | 2002-11-29 | 2005-07-18 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
KR20050116828A (ko) * | 2003-03-24 | 2005-12-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다채널 신호를 나타내는 주 및 부 신호의 코딩 |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7447317B2 (en) | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004009954B4 (de) * | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
US7653255B2 (en) | 2004-06-02 | 2010-01-26 | Adobe Systems Incorporated | Image region of interest encoding |
DE602005011439D1 (de) * | 2004-06-21 | 2009-01-15 | Koninkl Philips Electronics Nv | Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen |
ES2373728T3 (es) * | 2004-07-14 | 2012-02-08 | Koninklijke Philips Electronics N.V. | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio. |
EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
AU2012205170B2 (en) * | 2004-08-25 | 2015-05-14 | Dolby Laboratories Licensing Corporation | Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering |
US7895034B2 (en) * | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
EP1851866B1 (en) * | 2005-02-23 | 2011-08-17 | Telefonaktiebolaget LM Ericsson (publ) | Adaptive bit allocation for multi-channel audio encoding |
DE102005010057A1 (de) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
WO2006108543A1 (en) * | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Temporal envelope shaping of decorrelated signal |
MX2007015118A (es) * | 2005-06-03 | 2008-02-14 | Dolby Lab Licensing Corp | Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. |
US7599840B2 (en) | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7933337B2 (en) * | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
JP2009518659A (ja) * | 2005-09-27 | 2009-05-07 | エルジー エレクトロニクス インコーポレイティド | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 |
CN101427307B (zh) * | 2005-09-27 | 2012-03-07 | Lg电子株式会社 | 编码/解码多声道音频信号的方法和装置 |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7590523B2 (en) * | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
KR100754937B1 (ko) * | 2006-03-30 | 2007-09-03 | 인하대학교 산학협력단 | Ofdm/fdd 시스템에서 적응전송을 지원하기 위한 다단계 채널예측장치 및 방법 |
US20090276210A1 (en) * | 2006-03-31 | 2009-11-05 | Panasonic Corporation | Stereo audio encoding apparatus, stereo audio decoding apparatus, and method thereof |
KR100718416B1 (ko) | 2006-06-28 | 2007-05-14 | 주식회사 대우일렉트로닉스 | 예측필터를 이용한 채널간 스테레오 오디오 코딩 방법 |
US7797155B2 (en) * | 2006-07-26 | 2010-09-14 | Ittiam Systems (P) Ltd. | System and method for measurement of perceivable quantization noise in perceptual audio coders |
CN101169934B (zh) * | 2006-10-24 | 2011-05-11 | 华为技术有限公司 | 时域听觉阈值加权滤波器的构造方法和设备、编解码器 |
DE102006055737A1 (de) * | 2006-11-25 | 2008-05-29 | Deutsche Telekom Ag | Verfahren zur skalierbaren Codierung von Stereo-Signalen |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
KR101546793B1 (ko) | 2008-07-14 | 2015-08-28 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
BRPI1009467B1 (pt) | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
US20120072207A1 (en) * | 2009-06-02 | 2012-03-22 | Panasonic Corporation | Down-mixing device, encoder, and method therefor |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
MX2012011532A (es) | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
US9311923B2 (en) * | 2011-05-19 | 2016-04-12 | Dolby Laboratories Licensing Corporation | Adaptive audio processing based on forensic detection of media processing history |
US8401863B1 (en) * | 2012-04-25 | 2013-03-19 | Dolby Laboratories Licensing Corporation | Audio encoding and decoding with conditional quantizers |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE457402B (sv) * | 1987-02-20 | 1988-12-19 | Harald Brusewitz | Foerfarande och anordning foer kodning och avkodning av bildinformation |
US4875095A (en) * | 1987-06-30 | 1989-10-17 | Kokusai Denshin Denwa Kabushiki Kaisha | Noise-shaping predictive coding system |
US4943855A (en) * | 1988-07-22 | 1990-07-24 | At&T Bell Laboratories | Progressive sub-band image coding system |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
WO1992012607A1 (en) * | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
NL9100173A (nl) * | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
DE4320990B4 (de) * | 1993-06-05 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Redundanzreduktion |
DE4331376C1 (de) * | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
-
1996
- 1996-03-22 US US08/621,762 patent/US5812971A/en not_active Expired - Lifetime
-
1997
- 1997-02-10 CA CA002197128A patent/CA2197128C/en not_active Expired - Lifetime
- 1997-03-12 DE DE69731677T patent/DE69731677T2/de not_active Expired - Lifetime
- 1997-03-12 EP EP97301677A patent/EP0797324B1/en not_active Expired - Lifetime
- 1997-03-18 JP JP06405297A patent/JP3316159B2/ja not_active Expired - Lifetime
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002162996A (ja) * | 2000-11-24 | 2002-06-07 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム |
US7941320B2 (en) | 2001-05-04 | 2011-05-10 | Agere Systems, Inc. | Cue-based audio coding/decoding |
US8200500B2 (en) | 2001-05-04 | 2012-06-12 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
JP2008511040A (ja) * | 2004-08-25 | 2008-04-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 |
US7630396B2 (en) | 2004-08-26 | 2009-12-08 | Panasonic Corporation | Multichannel signal coding equipment and multichannel signal decoding equipment |
WO2006022308A1 (ja) * | 2004-08-26 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd. | マルチチャネル信号符号化装置およびマルチチャネル信号復号装置 |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
JP2008517333A (ja) * | 2004-10-20 | 2008-05-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | バイノーラルキュー符号化方法等のための個別に行うチャネル時間エンベロープ整形 |
JP2008517334A (ja) * | 2004-10-20 | 2008-05-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | バイノーラルキュー符号化方法等のための拡散音の整形 |
US8238562B2 (en) | 2004-10-20 | 2012-08-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7787631B2 (en) | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US8340306B2 (en) | 2004-11-30 | 2012-12-25 | Agere Systems Llc | Parametric coding of spatial audio with object-based side information |
US7761304B2 (en) | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
US7983922B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US8532999B2 (en) | 2005-04-15 | 2013-09-10 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for generating a multi-channel synthesizer control signal, multi-channel synthesizer, method of generating an output signal from an input signal and machine-readable storage medium |
US8983830B2 (en) | 2007-03-30 | 2015-03-17 | Panasonic Intellectual Property Corporation Of America | Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies |
US8374883B2 (en) | 2007-10-31 | 2013-02-12 | Panasonic Corporation | Encoder and decoder using inter channel prediction based on optimally determined signals |
US8352249B2 (en) | 2007-11-01 | 2013-01-08 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
JP2021502597A (ja) * | 2017-11-10 | 2021-01-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 一時的ノイズシェーピング |
US11127408B2 (en) | 2017-11-10 | 2021-09-21 | Fraunhofer—Gesellschaft zur F rderung der angewandten Forschung e.V. | Temporal noise shaping |
US11217261B2 (en) | 2017-11-10 | 2022-01-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding audio signals |
US11315580B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
US11315583B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11380341B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US11380339B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11386909B2 (en) | 2017-11-10 | 2022-07-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11462226B2 (en) | 2017-11-10 | 2022-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11545167B2 (en) | 2017-11-10 | 2023-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Also Published As
Publication number | Publication date |
---|---|
CA2197128C (en) | 2000-04-11 |
EP0797324A3 (en) | 2004-01-14 |
JP3316159B2 (ja) | 2002-08-19 |
CA2197128A1 (en) | 1997-09-23 |
DE69731677D1 (de) | 2004-12-30 |
US5812971A (en) | 1998-09-22 |
EP0797324A2 (en) | 1997-09-24 |
DE69731677T2 (de) | 2005-12-15 |
EP0797324B1 (en) | 2004-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3316159B2 (ja) | マルチチャネルオーディオ信号のジョイントステレオ符号化方法 | |
CA2286068C (en) | Method for coding an audio signal | |
RU2411594C2 (ru) | Кодирование и декодирование аудио | |
US5781888A (en) | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain | |
US5488665A (en) | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels | |
EP1866913B1 (en) | Audio encoding and decoding | |
RU2665214C1 (ru) | Стереофонический кодер и декодер аудиосигналов | |
EP3561810A1 (en) | Method of coding data | |
BR9611852A (pt) | Codificador de áudio. | |
JP2012163969A5 (ja) | ||
KR20070003594A (ko) | 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법 | |
JP4927264B2 (ja) | オーディオ信号を符号化する方法 | |
KR20040054235A (ko) | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 | |
RU2798009C2 (ru) | Стереофонический кодер и декодер аудиосигналов | |
JP2000151414A (ja) | ディジタルオーディオ符号化装置、同符号化方法、及び同符号化プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080607 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090607 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100607 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110607 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110607 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120607 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120607 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130607 Year of fee payment: 11 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |