JP4547380B2 - 互換性マルチチャンネル符号化/復号化 - Google Patents

互換性マルチチャンネル符号化/復号化 Download PDF

Info

Publication number
JP4547380B2
JP4547380B2 JP2006530060A JP2006530060A JP4547380B2 JP 4547380 B2 JP4547380 B2 JP 4547380B2 JP 2006530060 A JP2006530060 A JP 2006530060A JP 2006530060 A JP2006530060 A JP 2006530060A JP 4547380 B2 JP4547380 B2 JP 4547380B2
Authority
JP
Japan
Prior art keywords
channel
downmix
information
original
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006530060A
Other languages
English (en)
Other versions
JP2007507731A (ja
Inventor
ユルゲン ハリー
ジョーハン ヒルペアト
シュテファン ガヤーズベアガー
アンドレーアス ヘルツァー
クラウス シュペンガー
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34394093&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP4547380(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2007507731A publication Critical patent/JP2007507731A/ja
Application granted granted Critical
Publication of JP4547380B2 publication Critical patent/JP4547380B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Error Detection And Correction (AREA)
  • Executing Machine-Instructions (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、マルチチャンネル音声信号を処理するための装置および方法に関し、特に、マルチチャンネル音声信号をステレオ互換性があるように処理するための装置および方法に関する。
近年、マルチチャンネル音声再生技術がますます重要になってきている。このことは、周知のmp3手法などの音声圧縮/符号化技術によって、音声記録をインターネットまたは限定された帯域幅を有する他の送信チャンネルを介して配信することが可能になったことによるだろう。mp3符号化技術は、全記録をステレオ形式、すなわち第1または左ステレオチャンネルと、第2または右ステレオチャンネルとを含む音声記録をデジタル表現で配信することを可能にすることから、非常に有名となった。
それでもなお、従来の2チャンネルサウンドシステムには、基本的な欠点がある。そこで、サラウンド技術が開発されてきた。好ましいマルチチャンネルサラウンド表現には、2つのステレオチャンネルLおよびRに加えて、追加の中央チャンネルCと、2つのサラウンドチャンネルLsおよびRsとが含まれる。この基準音声フォーマットは、3/2‐ステレオとも称され、3つのフロントチャンネルと、2つのサラウンドチャンネルとを意味する。一般的に、5つの送信チャンネルが必要である。ある再生環境では、5つの適切に設置されたスピーカから所定の距離にある最適なスイートスポットを得るには、5つの互いに異なる場所に少なくとも5つのスピーカが必要である。
当該技術において、マルチチャンネル音声信号の送信のために必要なデータ量を削減するためのいくつかの手法が当該技術において知られている。そのような手法は、ジョイントステレオ技術と呼ばれている。このために、ジョイントステレオ装置60を示す図10を参照する。この装置は、例えば、インテンシティステレオ(IS)またはバイノーラルキュー符号化(BCC)を実施する装置であってもよい。そのような装置は、一般的に、―入力として―少なくとも2つのチャンネル(CH1,CH2,…CHn)を受信し、単一の搬送チャンネルおよびパラメトリックデータを出力する。パラメトリックデータは、復号器において元チャンネル(CH1,CH2,…CHn)の近似が計算できるように、規定される。
通常、搬送チャンネルは、サブバンドサンプル、スペクトル係数、時間領域サンプルなどを含むことになり、基礎となる信号の比較的細かい表現を提供する。一方、パラメトリックデータは、そのようなスペクトル係数のサンプルは含まないが、乗算による重み付け、時間移動、周波数移動、…などの所定の再構成アルゴリズムを制御するための制御パラメータを含む。したがって、パラメトリックデータは、信号または関連チャンネルの比較的粗い表現のみを含む。数字で言うと、搬送チャンネルによって必要とされるデータ量は、60〜70キロビット/秒の範囲であろう。一方、パラメトリック副情報によって必要とされるデータ量は、1チャンネルにつき1.5〜2.5キロビット/秒の範囲であろう。パラメトリックデータの例としては、以下に説明するような、周知の変倍率、インテンシティステレオ情報、またはバイノーラルキューパラメータが挙げられる。
インテンシティステレオ符号化は、オーディオ技術学会未定稿3799、「インテンシティステレオ符号化(Intensity Stereo Coding)」,ジェイ・ヘア(J.Herre),ケー・エイチ・ブランデンバーグ(K.H.Brandenburg),ディー・レダラー(D.Lederer),1994年2月、アムステルダム.に記載されている。一般的に、インテンシティステレオの概念は、両方の立体音響音声チャンネルのデータに対して適用される主軸変換に基づく。データ点のほとんどが第1の主軸の周りに集中している場合には、符号化前に両方の信号を所定の角度回転させることによって符号化利得が達成できる。しかしながら、これは実際の立体音響再生技術に常に当てはまるものではない。したがって、この手法は、第2の直交成分をビットストリームにおける送信から除外することによって修正される。よって、左右のチャンネルについての再構成された信号は、同一の送信信号を互いに異なるように重み付けまたは変倍したものからなる。それにもかかわらず、再構成された信号は、互いに振幅は異なるが、位相情報に関しては同一である。しかしながら、両方の元の音声チャンネルのエネルギー‐時間エンベロープは、選択的な変倍動作によって保存され、典型的には、周波数選択のやり方で動作する。このことは、人間の高周波数における音の認識に一致しており、そこでは、支配的な空間キューが、エネルギーエンベロープによって決定される。
さらに、実際の実施において、送信された信号、すなわち搬送チャンネルは、左チャンネルおよび右チャンネルの合計信号から生成され、両方の成分を回転させるのではない。さらに、この処理、すなわち変倍動作を行うためのインテンシティステレオパラメータの生成は、周波数が選択的に、すなわち変倍率帯域毎に独立して、すなわち符号器周波数の分割で行われる。好ましくは、両方のチャンネルは合成されて、合成または「搬送」チャンネルを形成し、合成チャンネルに加えて、第1のチャンネルのエネルギー、第2のチャンネルのエネルギー、または合成またはチャンネルのエネルギーに依存するインテンシティステレオ情報が決定される。
BCC手法は、オーディオ技術学会大会論文5574、「ステレオおよびマルチチャンネル音声圧縮に適用されるバイノーラルキュー符号化(Binaural cue coding applied to stereo and multi−channel audio compression)」,シー・フォラー(C.Faller),エフ・バウムガルト(F.Baumgarte),2002年5月、ミュンヘン.に記載されている。BCC符号化において、数多くの音声入力チャンネルが、重なったウィンドウでの離散フーリエ変換に基づく変換を使用して、スペクトル表現に変換される。結果生じた一様なスペクトルは、それぞれがインデックスを有する重ならない区画に分割される。各区画は、等価矩形帯域幅(ERB)に比例する帯域幅を有する。チャンネル間レベル差(ICLD)およびチャンネル間時間差(ICTD)は、区画毎に、フレームk毎に推定される。ICLDおよびICTDは、量子化および符号化されて、BCCビットストリームとなる。チャンネル間レベル差およびチャンネル間時間差は、チャンネル毎に、基準チャンネルを基準として与えられる。その後、パラメータが所定の方式に従って計算され、これは、処理されるべき信号の所定の区画に依存する。
復号器側では、復号器は、モノラル信号と、BCCビットストリームとを受信する。モノラル信号は、周波数領域に変換され、空間合成ブロックに入力され、空間合成ブロックは、復号化されたICLD値およびICTD値も受信する。空間合成ブロックにおいて、マルチチャンネル信号を合成するために、BCCパラメータ(ICLDおよびICTD)値を使用してモノラル信号の重み付け動作が行われ、マルチチャンネル信号は、周波数/時間変換の後、元のマルチチャンネル音声信号の再構成を表す。
BCCの場合は、ジョイントステレオモジュール60は、パラメトリックチャンネルデータが量子化および符号化されたICLDまたはICTDパラメータであるように、チャンネル副情報を出力するように動作し、元チャンネルのうちの1つが、チャンネル副情報を符号化するための基準チャンネルとして使用される。
通常、搬送チャンネルは、関与する元チャンネルの合計から形成される。
当然ながら、上述の手法は、復号器に対してモノラル表現を提供するだけであり、復号器は、搬送チャンネルを処理できるだけで、1つより多い数の入力チャンネルの1つ以上の近似を生成するためのパラメトリックデータを処理することはできない。
5つのチャンネルを互換性があるように、すなわち通常のステレオ復号器も理解可能なビットストリーム形式で送信するためには、「MUSICAMサラウンド:ISO11172−3準拠のユニバーサルマルチチャンネル符号化システム(MUSICAM:surround:a universal multi−channel coding system compatible with ISO11172−3)」,ジー・シアイル(G.Theile)およびジー・ストール(G.Stoll),オーディオ技術学会未定稿3403、1992年10月、サンフランシスコ.に記載されているような、いわゆるマトリクス化の手法が使用されてきた。5つの入力チャンネルL,R,C,Ls,およびRsは、マトリックス化装置に与えられ、マトリックス化装置は、マトリックス化動作を行って、5つの入力チャンネルから基本または互換ステレオチャンネルLoおよびRoを計算する。特に、これらの基本のステレオチャンネルLo/Roは、以下のように計算される。
Lo=L+xC+yLs
Ro=R+xC+yRs
xおよびyは、定数である。他の3つのチャンネルC,Ls,およびRsは、基本ステレオ層に加えて、拡張層にそのまま送信され、基本ステレオ層には、基本ステレオ信号Lo/Roを符号化したものが含まれる。ビットストリームに関して、このLo/Ro基本ステレオ層には、ヘッダと、変倍率およびサブバンドサンプルなどの情報とが含まれる。マルチチャンネル拡張層、すなわち中央チャンネルおよび2つのサラウンドチャンネルは、マルチチャンネル拡張フィールドに含まれ、これは補助データフィールドとも呼ばれる。
復号器側において、基本ステレオチャンネルLoおよびRoならびに3つの追加のチャンネルを使用した5つのチャンネル表現での左右チャンネルの再構成を形成するために、逆マトリックス化動作が行われる。さらに、復号化された5つのチャンネルまたは元のマルチチャンネル音声信号のサラウンド表現を得るために、3つの追加のチャンネルは、補助情報から復号化される。
マルチチャンネル符号化のための他の取り組みについては、「改良MPEG‐2音声マルチチャンネル符号化(Improved MPEG−2 audio multi−channel encoding)」,ビー・グリル(B.Grill),ジェイ・ヘア(J.Herre),ケー・エイチ・ブランデンバーグ(K.H.Brandenburg),イー・エバリン(E.Eberlein),ジェイ・コラー(J.Koller),ジェイ・ミュラー(J.Mueller),オーディオ技術学会未定稿3865、1994年2月、アムステルダム.という刊行物に記載されており、後方互換性を得るために、後方互換モードが考慮されている。このために、互換マトリックスを使用して、2つのいわゆるダウンミックスチャンネルLcおよびRcが元の5つの入力チャンネルから得られる。さらに、補助データとして送信される3つの補助チャンネルを動的に選択することが可能である。
ステレオの不適切性を活用するために、チャンネル群、例えば左チャンネル、右チャンネル、および中央チャンネルについての3つのフロントチャンネルにジョイントステレオ手法が適用される。このために、これら3つのチャンネルは合成されて、合成チャンネルを得る。この合成チャンネルは量子化されて、ビットストリームに詰め込まれる。その後、この合成チャンネルは、対応ジョイントステレオ情報と共にジョイントステレオ復号化モジュールに入力されて、ジョイントステレオ復号化済みチャンネル、すなわちジョイントステレオ復号化済み左チャンネル、ジョイントステレオ復号化済み右チャンネル、およびジョイントステレオ復号化済み中央チャンネルを得る。これらのジョイントステレオ復号化済みチャンネルは、左サラウンドチャンネルおよび右サラウンドチャンネルと共に互換マトリックスブロックに入力されて、第1および第2のダウンミックスチャンネルLcおよびRcを形成する。その後、両ダウンミックスチャンネルを量子化したものと、合成チャンネルを量子化したものとが、ジョイントステレオ符号化パラメータと共にビットストリームに詰め込まれる。
したがって、インテンシティステレオ符号化を使用して、独立した元チャンネル信号の群は、「搬送」データの単一の部分内で送信される。その後、復号器は、当該信号を同一のデータとして再構成して、その元のエネルギー‐時間エンベロープに従って再変倍する。その結果、送信チャンネルの線形合成は、元のダウンミックスとは非常に異なる結果となる。これは、インテンシティステレオの概念に基づくあらゆる種類のジョイントステレオ符号化に当てはまる。互換ダウンミックスチャンネルを提供する符号化システムにとっては、上述の刊行物に記載されたようなデマトリックス化による再構成は、不完全な再構成によって生じるアーティファクトの影響を受けるという、直接的な結果がある。この問題は、符号器においてマトリックス化の前に左、右、および中央チャンネルのジョイントステレオ符号化が行われるという、いわゆるジョイントステレオプリディストーション手法を使用すると緩和される。このように、再構成のためのデマトリックス化手法では、符号器側において、ダウンミックスチャンネルを生成するためにジョイントステレオ復号化済み信号を使用していたので、アーティファクトはほとんど生じない。よって、不完全な再構成処理は、互換ダウンミックスチャンネルLcおよびRcにシフトして、音声信号自体によって隠される可能性がはるかに高い。
そのようなシステムは、復号器側でのデマトリックス化を行うのでアーティファクトが少なくなるが、それでも欠点はある。欠点の1つは、ステレオ互換ダウンミックスチャンネルLcおよびRcは、元チャンネルからではなく、元チャンネルをインテンシティステレオ符号化/復号化したものから導出されたものであるということである。したがって、インテンシティステレオ符号化システムが原因のデータ損失が、互換ダウンミックスチャンネルに含まれる。したがって、拡張インテンシティステレオ符号化されたチャンネルではなく互換チャンネルのみを復号化するステレオ専用復号器が提供する出力信号は、インテンシティステレオが引き起こしたデータ損失によって影響を受ける。
さらに、2つのダウンミックスチャンネルの他に、完全に追加のチャンネルを送信しなければならない。このチャンネルは、合成チャンネルであり、左チャンネル、右チャンネル、および中央チャンネルのジョイントステレオ符号化によって形成される。さらに、合成チャンネルから元チャンネルL,R,およびCを再構成するためのインテンシティステレオ情報を復号器に送信しなければならない。復号器において、逆マトリックス化、すなわちデマトリックス化動作が行われて、2つのダウンミックスチャンネルからサラウンドチャンネルが導出される。さらに、元の左、右、および中央チャンネルは、送信された合成チャンネルと、送信されたジョイントステレオパラメータとを使用するジョイントステレオ復号化によって近似される。注意すべきなのは、元の左、右、および中央チャンネルは、合成チャンネルのジョイントステレオ復号化から導出されることである。
オーディオ技術学会未定稿3799、「インテンシティステレオ符号化(Intensity Stereo Coding)」,ジェイ・ヘア(J.Herre),ケー・エイチ・ブランデンバーグ(K.H.Brandenburg),ディー・レダラー(D.Lederer),1994年2月、アムステルダム. オーディオ技術学会大会論文5574、「ステレオおよびマルチチャンネル音声圧縮に適用されるバイノーラルキュー符号化(Binaural cue coding applied to stereo and multi−channel audio compression)」,シー・フォラー(C.Faller),エフ・バウムガルト(F.Baumgarte),2002年5月、ミュンヘン. 「MUSICAMサラウンド:ISO11172−3準拠のユニバーサルマルチチャンネル符号化システム(MUSICAM:surround:a universal multi−channel coding system compatible with ISO11172−3)」,ジー・シアイル(G.Theile)およびジー・ストール(G.Stoll),オーディオ技術学会未定稿3403、1992年10月、サンフランシスコ. 「改良MPEG‐2音声マルチチャンネル符号化(Improved MPEG−2 audio multi−channel encoding)」,ビー・グリル(B.Grill),ジェイ・ヘア(J.Herre),ケー・エイチ・ブランデンバーグ(K.H.Brandenburg),イー・エバリン(E.Eberlein),ジェイ・コラー(J.Koller),ジェイ・ミュラー(J.Mueller),オーディオ技術学会未定稿3865、1994年2月、アムステルダム.
本発明の目的は、マルチチャンネル音声信号の、ビット効率が高くアーティファクトが軽減された処理または逆処理のための概念を提供することである。
本発明の第1の局面によれば、この目的は、マルチチャンネル音声信号を処理するための装置によって達成され、マルチチャンネル音声信号は、少なくとも3つの元チャンネルを有し、装置は、元チャンネルから導出される第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルを提供するための手段と、元信号のうちから選択された元チャンネルについてのチャンネル副情報を計算するための手段であって、ダウンミックスチャンネル、または第1および第2のダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように、チャンネル副情報を計算するように動作可能な手段と、チャンネル副情報、第1のダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルから導出された信号を含む出力データを生成するための手段とを備える。
本発明の第2の局面によれば、この目的は、マルチチャンネル音声信号を処理する方法によって達成され、マルチチャンネル音声信号は、少なくとも3つの元チャンネルを有し、方法は、元チャンネルから導出される第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルを提供する工程と、元信号のうちから選択された元チャンネルについてのチャンネル副情報の計算を、ダウンミックスチャンネル、または第1および第2のダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように行う工程と、チャンネル副情報、第1のダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルから導出された信号を含む出力データを生成する工程とを含む。
本発明の第3の局面によれば、この目的は、入力データの逆処理のための装置によって達成され、入力データは、チャンネル副情報、第1のダウンミックスチャンネルまたは第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルから導出された信号を含み、第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルは、マルチチャンネル音声信号の少なくとも3つの元チャンネルから導出され、チャンネル副情報は、ダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように計算され、装置は、入力データを読み出して、第1のダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルおよびチャンネル副情報から導出された信号を得るための入力データ読出器と、チャンネル副情報およびダウンミックスチャンネルまたは合成ダウンミックスチャンネルを使用して、選択された元チャンネルの近似を得るように、選択された元チャンネルの近似を再構成するためのチャンネル再構成器とを備える。
本発明の第4の局面によれば、この目的は、入力データの逆処理の方法によって達成され、入力データは、チャンネル副情報、第1のダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルから導出された信号を含み、第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルは、マルチチャンネル音声信号の少なくとも3つの元チャンネルから導出され、チャンネル副情報は、ダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように計算され、方法は、入力データを読み出して、第1のダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルおよびチャンネル副情報から導出された信号とを得る工程と、チャンネル副情報およびダウンミックスチャンネルまたは合成ダウンミックスチャンネルを使用して、選択された元チャンネルの近似を得るように、選択された元チャンネルの近似を再構成する工程とを含む。
本発明の第5および第6の局面によれば、この目的は、上記処理の方法または上記逆処理の方法を含むコンピュータプログラムによって達成される。
本発明は、効率的でアーティファクトが軽減されたマルチチャンネル音声信号符号化が得られるのは、左右ステレオチャンネルを好ましくは表す2つのダウンミックスチャンネルが出力データに詰め込まれた場合であるという知見に基づく。
進歩的なことには、元信号の1つ以上についてのパラメトリックチャンネル副情報は、先行技術のように、追加の「合成」ジョイントステレオチャンネルにではなく、ダウンミックスチャンネルのうちの1つに関連するように導出される。これは、パラメトリックチャンネル副情報の計算は、復号器側において、チャンネル再構成器が、チャンネル副情報と、ダウンミックスチャンネルのうちの1つまたはダウンミックスチャンネルを合成したものとを使用して、チャンネル副信号が割り当てられる元の音声チャンネルの近似を再構成するように行われることを意味する。
この進歩的な概念は、マルチチャンネル音声信号が復号器において再生できるように、ビット効率の高いマルチチャンネル拡張を提供するという点で利点がある。
さらに、この進歩的な概念は、後方互換可能である。なぜならば、2チャンネル処理にのみ採用される低段階の復号器は、拡張情報、すなわちチャンネル副情報を単に無視することができるからである。低段階の復号器は、2つのダウンミックスチャンネルのみを再生して、元のマルチチャンネル音声信号のステレオ表現を得る。しかしながら、マルチチャンネル動作の可能な高段階の復号器は、送信されたチャンネル副情報を使用して、元チャンネルの近似を再構成することができる。
本発明は、先行技術とは対照的に、第1および第2のダウンミックスチャンネルLcおよびRc以外に追加の搬送チャンネルが必要ないので、ビット効率がよいという点で利点がある。代わりに、チャンネル副情報は、1つまたは両方のダウンミックスチャンネルに関連付けられている。これは、ダウンミックスチャンネル自体が、搬送チャンネルとしての役割を果たすことを意味し、チャンネル副情報がこのチャンネルに合成されて、元の音声信号を再構成する。これは、チャンネル副情報は、好ましくはパラメトリック副情報、すなわちサブバンドまたはスペクトル係数のいずれも含まない情報であることを意味する。代わりに、パラメトリック副情報は、各ダウンミックスチャンネルまたは各ダウンミックスチャンネルを合成したものを(時間および/または周波数において)重み付けして、選択された元チャンネルを再構成したものを得るために使用される情報である。
本発明の好ましい一実施形態において、互換ステレオ信号に基づくマルチチャンネル信号の後方互換符号化が得られる。好ましくは、互換ステレオ信号(ダウンミックス信号)は、マルチチャンネル音声信号の元チャンネルをマトリックス化することを使用して生成される。
進歩的なことには、選択された元チャンネルについてのチャンネル副情報は、インテンシティステレオ符号化またはバイノーラルキュー符号化などのジョイントステレオ技術に基づいて得られる。よって、復号器側において、デマトリックス化動作を行う必要はない。デマトリックス化に関連する問題、すなわちデマトリックス化動作における量子化ノイズの望ましくない分布に関する所定のアーティファクトが回避される。これは、復号器が、ダウンミックスチャンネルのうちの1つか、またはダウンミックスチャンネルおよび送信されたチャンネル副情報を合成したものを使用することによって、元信号を再構成するチャンネル再構成器を使用することによる。
好ましくは、この進歩的な概念は、5つのチャンネルを有するマルチチャンネル音声信号に適用される。これらの5つのチャンネルは、左チャンネルL、右チャンネルR,中央チャンネルC、左サラウンドチャンネルLs、および右サラウンドチャンネルRsである。好ましくは、ダウンミックスチャンネルは、ステレオ互換ダウンミックスチャンネルLsおよびRsであり、元のマルチチャンネル音声信号のステレオ表現を提供する。
本発明の好ましい実施形態によれば、元チャンネル毎に、チャンネル副情報が符号器側で計算されて、出力データに詰め込まれる。元の左チャンネルについてのチャンネル副情報は、左ダウンミックスチャンネルを使用して導出される。元の左サラウンドチャンネルについてのチャンネル副情報は、左ダウンミックスチャンネルを使用して導出される。元の右チャンネルについてのチャンネル副情報は、右ダウンミックスチャンネルを使用して導出される。元の右サラウンドチャンネルについてのチャンネル副情報は、右ダウンミックスチャンネルを使用して導出される。
本発明の好ましい実施形態によれば、元の中央チャンネルについてのチャンネル情報は、第1のダウンミックスチャンネルと、第2のダウンミックスチャンネルとを使用して、すなわち2つのダウンミックスチャンネルを合成したものを使用して導出される。好ましくは、この合成物は、加算物である。
よって、グループ化、すなわちチャンネル副情報と搬送信号、すなわち選択された元チャンネルについてのチャンネル副情報を提供するための使用ダウンミックスチャンネルとの間の関係においては、最適品質のために、あるダウンミックスチャンネルが選択される。このダウンミックスチャンネルは、チャンネル副情報によって表わされる元のマルチチャンネル信号それぞれの最大限の相対量を含む。このようなジョイントステレオ搬送信号として、第1および第2のダウンミックスチャンネルが使用される。好ましくは、第1および第2のダウンミックスチャンネルの合計も使用することができる。当然ながら、第1および第2のダウンミックスチャンネルの合計は、各元チャンネルについてのチャンネル副情報を計算するために使用することができる。しかしながら、好ましくは、ダウンミックスチャンネルの合計は、5チャンネルサラウンド、7チャンネルサラウンド、5.1サラウンド、または7.1サラウンドのようなサラウンド環境における元の中央チャンネルのチャンネル副情報を計算するために使用される。第1および第2のダウンミックスチャンネルの合計を使用することは、特に利点である。なぜならば、追加の送信オーバヘッドを行う必要がないからである。これは、復号器において任意の追加の送信ビットを必要とせずにこれらのダウンミックスチャンネルを容易に合計することができるように、ダウンミックスチャンネルの両方が、復号器に存在するからである。
好ましくは、マルチチャンネル拡張を形成するチャンネル副情報は、低段階の復号器がマルチチャンネル拡張を無視して、マルチチャンネル音声信号のステレオ表現のみを与えるような互換性のあるやり方で、出力データビットストリームに入力される。それにもかかわらず、高段階の符号器は、2つのダウンミックスチャンネルを使用するだけでなく、それに加えて、チャンネル副情報を用いて元の音声信号の完全なマルチチャンネル表現を再構成する。
進歩的な復号器は、最初に、両ダウンミックスチャンネルを復号化して、選択された元チャンネルについてのチャンネル副情報を読み出すように動作する。その後、チャンネル副情報およびダウンミックスチャンネルを使用して、元チャンネルの近似を再構成する。このために、好ましくは、デマトリックス化動作は全く行われない。これは、本実施形態において、例えば5つの元の入力チャンネルのそれぞれを、例えば5つの組の互いに異なるチャンネル副情報を使用して再構成することを意味する。復号器において、再構成されたチャンネル近似を計算するために、符号器におけるのと同一のグループ化が行われる。これは、5チャンネルサラウンド環境において、元の左チャンネルを再構成するために、左ダウンミックスチャンネルと、左チャンネルについてのチャンネル副情報とが使用されることを意味する。元の右チャンネルを再構成するためには、右ダウンミックスチャンネルと、右チャンネルについてのチャンネル副情報とが使用される。元の左サラウンドチャンネルを再構成するためには、左ダウンミックスチャンネルと、左サラウンドチャンネルについてのチャンネル副情報とが使用される。元の右サラウンドチャンネルを再構成するためには、右サラウンドチャンネルについてのチャンネル副情報と、右ダウンミックスチャンネルとが使用される。元の中央チャンネルを再構成するためには、第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから形成された合成チャンネルと、中央チャンネル副情報とが使用される。
当然ながら、(例えば5つのうちの)3つの組のチャンネル副情報パラメータだけを送信すればよいように、第1および第2のダウンミックスチャンネルを左右チャンネルとして再生することも可能である。しかしながら、これは、品質に関して規則があまり厳格でない場合にのみ推奨できる。これは、通常、左ダウンミックスチャンネルと右ダウンミックスチャンネルとは元の左チャンネルまたは元の右チャンネルとは異なるからである。そのような処理は、元チャンネルそれぞれについてのチャンネル副情報を送信するだけの余裕がない場合にのみ、利点がある。
本発明の好ましい実施形態を、添付の図面を参照して以下に説明する。
図1は、R,L,およびCなどの少なくとも3つの元チャンネルを有するマルチチャンネル音声信号10を処理するための装置を示す。好ましくは、元の音声信号は、図1に示すサラウンド環境における5つのチャンネルなどの3つより多い数のチャンネルを有する。5つのチャンネルは、左チャンネルL,右チャンネルR,中央チャンネルC,左サラウンドチャンネルLs,および右サラウンドチャンネルRsである。進歩的な装置は、元チャンネルから導出された第1のダウンミックスチャンネルLcおよび第2のダウンミックスチャンネルRcを提供するための手段12を含む。元信号からダウンミックスチャンネルを導出するためには、いくつかの可能性がある。1つの可能性は、図6に示すようなマトリックス化動作を使用して元チャンネルをマトリックス化することによってダウンミックスチャンネルLcおよびRcを導出することである。このマトリックス化動作は、時間領域において行われる。
マトリックス化パラメータa,b,およびtは、1以下となるように選択される。好ましくは、aおよびbは、0.7または0.5である。総合重み付けパラメータtは、好ましくは、チャンネルクリッピングが回避されるように選ばれる。代わりに、図1に示すように、ダウンミックスチャンネルLcおよびRcは、外部的に与えられてもよい。これは、ダウンミックスチャンネルLcおよびRcが「ハンドミキシング」動作の結果である場合に行われてもよい。この場合には、サウンドエンジニアが、自動マトリックス化動作を使用するのではなく、自身でダウンミックスチャンネルをミキシングする。サウンドエンジニアは、創造的なミキシングを行って、元のマルチチャンネル音声信号のできるだけ良好なステレオ表現を与える最適化されたダウンミックスチャンネルLcおよびRcを得る。
ダウンミックスチャンネルが外部から与えられる場合には、提供するための手段は、マトリックス化動作を行わずに、外部から与えられたダウンミックスチャンネルを後続の計算手段14に単に転送する。
計算手段14は、L,Ls,R,またはRsのような選択された元チャンネルについてのli,lsi,ri,またはrsiのようなチャンネル副情報をそれぞれ計算するように動作する。特に、計算するための手段14は、ダウンミックスチャンネルがチャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似を生じさせるように、チャンネル副情報を計算するように動作する。
その代わりにまたはそれに加えて、チャンネル副情報を計算するための手段は、第1および第2のダウンミックスチャンネルを合成したものを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似を生じさせるように、選択された元チャンネルについてのチャンネル副情報を計算するようにさらに動作する。図においてこの特徴を示すために、加算器14aと、合成チャンネル副情報計算器14bとが示されている。
これらの要素が別個の要素として実施される必要がないことは、当業者にとって明白である。代わりに、ブロック14,14a,および14bの機能全体を、汎用プロセッサまたは必要な機能を行うための任意の他の手段のような所定のプロセッサによって実施することができる。
さらに、ここで注意すべきなのは、サブバンドサンプルまたは周波数領域値であるチャンネル信号は、大文字で示されているということである。チャンネル副情報は、チャンネル自体とは対照的に、小文字で示されている。したがって、チャンネル副情報ciは、元の中央チャンネルCについてのチャンネル副情報である。
チャンネル副情報、ならびにダウンミックスチャンネルLcおよびRcまたは音声符号器16によって生成されるような符号化されたLc’およびRc’は、出力データフォーマッタ18に入力される。一般的には、出力データフォーマッタ18は、少なくとも1つの元チャンネルについてのチャンネル副情報を含む出力データと、第1のダウンミックスチャンネルまたは第1のダウンミックスチャンネルから導出された信号(符号化されたものなど)と、第2のダウンミックスチャンネルまたは第2のダウンミックスチャンネルから導出された信号(符号化されたものなど)とを生成するための手段としての役割を果たす。
出力データまたは出力ビットストリーム20は、ビットストリーム復号器へ送信されるか、もしくは、記憶または配信されることができる。好ましくは、出力ビットストリーム20は、マルチチャンネル拡張機能を有していない低段階の復号器によっても読み出し可能な互換ビットストリームである。現時点における既存の標準的なmp3復号器などのそのような低段階の符号器は、単にマルチチャンネル拡張データ、すなわちチャンネル副情報を無視することになる。これらは、第1および第2のダウンミックスチャンネルを単に復号化して、ステレオ出力を生成することになる。マルチチャンネルが使用可能な復号器などの高段階の復号器は、チャンネル副情報を読み出して、その後、マルチチャンネル音声の印象が得られるように、元の音声チャンネルの近似を生成することになる。
図8は、5チャンネルサラウンド/mp3の環境における本発明の好ましい一実施形態を示す。ここで、「mp3サラウンド」ビットストリームが得られるように、標準化されたmp3ビットストリーム構文における補助データフィールドにサラウンド拡張データを書き込むことが好ましい。
図2は、入力データポート22において受信された入力データを逆処理するための装置としての役割を果たす進歩的な復号器の図を示す。入力データポート22において受信されたデータは、図1における出力データポート20における出力と同一のデータである。代わりに、有線チャンネルではなく無線チャンネルを介してデータを送信する場合には、データ入力ポート22において受信されるデータは、符号器によって生じた元データから導出されるデータである。
復号器入力データは、入力データを読み出すためのデータストリーム読出器24に入力されて、最終的にチャンネル副情報26と、左ダウンミックスチャンネル28と、右ダウンミックスチャンネル30とを得る。入力データがダウンミックスチャンネルを符号化したものを含む場合には、図1における音声符号器16が存在する場合に対応し、データストリーム読出器24は、音声復号器も含み、音声復号器は、ダウンミックスチャンネルを符号化するために使用される音声符号器に適合している。この場合に、データストリーム読出器24の一部である音声復号器は、第1のダウンミックスチャンネルLcおよび第2のダウンミックスチャンネルRc、より正確に言えば、これらのチャンネルを復号化したものを生成するように動作する。説明を容易にするために、信号と、その復号化したものとの区別は、明示的に述べる場合にのみ行う。
データストリーム読出器24によって出力されたチャンネル副情報26、ならびに左右ダウンミックスチャンネル28および30は、元の音声信号を再構成したもの34を提供するためのマルチチャンネル再構成器32へ与えられ、マルチチャンネル再生器36によって再生される。マルチチャンネル再構成器が周波数領域で動作する場合には、マルチチャンネル再生器36は、周波数領域の入力データを受信することになり、周波数領域の入力データは、再生される前に時間領域へ変換されるなどの何らかのやり方で復号化されなければならない。このために、マルチチャンネル再生器36は、復号化の機構を含んでもよい。
低段階の復号器は、左右ダウンミックスチャンネル28および30をステレオ出力38に出力するだけのデータストリーム読出器24のみを有することになる。しかしながら、一層進歩的な復号器は、チャンネル副情報26を抽出して、これら副情報およびダウンミックスチャンネル28および30を使用して、元チャンネルを再構成したもの34をマルチチャンネル再構成器32を使用して再構成する。
図3Aは、チャンネル副情報を計算するための進歩的な計算器14の一実施形態を示す。一方で音声符号器および他方でチャンネル副情報計算器は、マルチチャンネル信号の同一のスペクトル表現に対して動作する。しかしながら、図1は、他の代替案を示し、そこにおいて、一方で音声符号器および他方でチャンネル副情報計算器は、マルチチャンネル信号の互いに異なるスペクトル表現に対して動作する。リソースを計算することが音声品質ほど重要ではない場合には、図1の代替案が好ましい。なぜならば、音声符号化および副情報計算について個別に最適化されたフィルタバンクを使用できるからである。しかしながら、リソースを計算することが重要である場合には、図3Aの代替案が好ましい。なぜならば、この代替案は、要素を共用するので、必要な計算能が少ないからである。
図3Aに示す装置は、2つのチャンネルAおよびBを受信するために動作する。図3Aに示す装置は、選択された元チャンネルBについてのこのチャンネル副情報を使用して、チャンネルBを再構成したものをチャンネル信号Aから計算できるように、チャンネルBについての副情報を計算するように動作する。さらに、図3Aに示す装置は、(例えば、BCC符号化においてのように乗算または時間処理を行うことによって)スペクトル値またはサブバンドサンプルを重み付けするためのパラメータなどの周波数領域のチャンネル副情報を形成するように動作する。このために、進歩的な計算器は、出力140bにおけるチャンネルAの周波数表現、または出力140cにおいてチャンネルBの周波数領域表現を得るために、ウィンドウ化および時間/周波数変換手段140aを含む。
好ましい実施形態において、(副情報決定手段140fによる)副情報決定が、量子化されたスペクトル値を使用して行われる。その後、量子化器140dは、音響心理学モデル制御入力140eを有する音響心理学モデルを使用して制御される。それにもかかわらず、副情報決定手段140cが、チャンネルBについてのチャンネル副情報を決定するためにチャンネルAについての量子化されていない表現を使用する場合には、チャンネル量子化器は必要ない。
チャンネルBについてのチャンネル副情報が、チャンネルAの周波数領域表現と、チャンネルBの周波数領域表現とによって計算される場合には、ウィンドウ化および時間/周波数変換手段140aは、フィルタバンクを基本とした音声符号器において使用されるのと同一でありうる。この場合、AAC(ISO/IEC138181‐3)を考慮すると、手段140aは、50%の重複加算機能を有するMDCTフィルタバンク(MDCT=変形離散コサイン変換)として実施される。
そのような場合には、量子化器140dは、mp3またはAAC符号化された音声信号が生成される場合に使用されるような反復量子化器である。好ましくは既に量子化されているチャンネルAの周波数領域表現は、その後、エントロピー符号器140gを使用したエントロピー符号化のために直接使用される。エントロピー符号器140gは、ハフマンを基本とした符号器または算術符号化を実施するエントロピー符号器であってもよい。
図1と比較すると、図3Aの装置の出力は、1つの元チャンネルについてのliのような副情報である(装置140fの出力におけるBについての副情報に対応)。チャンネルAについてのエントロピー符号化されたビットストリームは、例えば図1のブロック16の出力における符号化された左ダウンミックスチャンネルLc’に対応する。図3Aから明らかになるのは、要素14(図1)、すなわちチャンネル副情報を計算するための計算器および音声符号器16は(図1)、別個の手段として実施されてもよいか、または、両方の装置がMDCTフィルタバンク140a、量子化器140e、およびエントロピー符号器140gなどのいくつかの要素を共有するように、共有型として実施されてもよい。当然ながら、チャンネル副情報を決定するために異なる変換が必要な場合には、符号器16および計算器14(図1)は、両方の要素がフィルタバンク等を共有しないような互いに異なる装置で実施されることになる。
一般的には、副情報を計算するための実際の決定器(または一般的に言う計算器14)は、図3Bに示すようなジョイントステレオモジュールとして実施されてもよく、インテンシティステレオ符号化またはバイノーラルキュー符号化のような任意のジョイントステレオ手法に従って動作する。
そのような先行技術のインテンシティステレオ符号器とは対照的に、進歩的な決定手段140fは、合成チャンネルを計算する必要がない。「合成チャンネル」または搬送チャンネルともいえるが、これは既に存在し、左互換ダウンミックスチャンネルLcまたは右互換ダウンミックスチャンネルRcまたはこれらダウンミックスチャンネルを合成したものLc+Rcである。したがって、ダウンミックスチャンネルが変倍情報、またはインテンシティ指向性情報とも言えるものを使用してダウンミックスチャンネルを重み付けする場合には、進歩的な装置140fは、各選択された元チャンネルのエネルギー/時間エンベロープが得られるように、各ダウンミックスチャンネルを変倍するための変倍情報を計算すればよい。
図3Bのジョイントステレオモジュール140fは、入力として、第1または第2のダウンミックスチャンネルもしくはダウンミックスチャンネルを合成したものである「合成」チャンネルAと、元の選択されたチャンネルとを受信するように示されている。このモジュールは、当然ながら、「合成」チャンネルAと、ジョイントステレオパラメータとをチャンネル副情報として出力する。この出力は、合成チャンネルAとジョイントステレオパラメータとを使用して元の選択されたチャンネルBの近似が計算できるように行われる。
代わりに、ジョイントステレオモジュール140fは、バイノーラルキュー符号化を行うために実施されてもよい。
BCCの場合は、ジョイントステレオモジュール140fは、チャンネル副情報が量子化および符号化されたICLDまたはICTDパラメータであるように、チャンネル副情報を出力するように動作し、選択された元チャンネルは、実際に処理すべきチャンネルとしての役割を果たし、その一方で、第1、第2、または第1および第2のダウンミックスチャンネルを合成したものなどの、副情報を計算するために使用される各ダウンミックスチャンネルを、BCC符号化/復号化手法における基準チャンネルとして使用する。
図4を参照すると、エネルギーを対象にした要素140fの簡易的な実施が提供される。この装置は、チャンネルAからの周波数帯域と、チャンネルBの対応周波数帯域とを選択する周波数帯域選択器44を含む。その後、両周波数帯域において、エネルギー計算器42によって分岐毎にエネルギーを計算する。エネルギー計算器42の詳細な実施は、ブロック40からの出力信号がサブバンド信号か、または周波数係数かに依存することになる。他の実施形態において、変倍率帯域についての変倍率を計算する場合には、第1および第2のチャンネルAおよびBの変倍率を、エネルギー値EAおよびEBとして、または少なくともエネルギーの推定値として既に使用することができる。利得率計算装置44において、選択された周波数帯域についての利得率gBは、図4のブロック44に示す利得決定規則のような所定の規則に基づいて決定される。ここで、図5で後述するような時間領域サンプルまたは周波数係数を重み付けするために、利得率gBを直接使用することもできる。このために、選択された周波数帯域について有効な利得率gBは、選択された元チャンネルとしてのチャンネルBについてのチャンネル副情報として使用される。この選択された元チャンネルBは、復号器に送信されることはないが、図1における計算器14によって計算されるようなパラメトリックチャンネル副情報によって表されることになる。
ここで、利得値をチャンネル副情報として送信する必要はないことに注意すべきである。また、選択された元チャンネルの絶対エネルギーに関連した周波数に依存する値を送信すれば十分である。その後、復号器は、ダウンミックスチャンネルの実際のエネルギーと、利得率とを、ダウンミックスチャンネルエネルギーと、チャンネルBについての送信されたエネルギーとに基づいて計算しなければならない。
図5は、変換を基本とした知覚的な音声復号器に関連して設置された復号器の実現可能な一実施を示す。図2と比較すると、エントロピー復号器および逆量子化器50(図5)の機能は、図2のブロック24に含まれることになる。しかしながら、周波数/時間変換要素52aおよび52b(図5)の機能は、図2の要素36において実施されることになる。図5の要素50は、第1または第2のダウンミックス信号Lc’またはRc’を符号化したものを受信する。要素50の出力において、第1および第2のダウンミックスチャンネルを少なくとも一部を復号化したものが存在し、これは、後にチャンネルAと称される。チャンネルAは、チャンネルAから所定の周波数帯域を選択するための周波数帯域選択器54に入力される。この選択された周波数帯域は、乗算器56を使用して重み付けされる。乗算器56は、乗算のために、ある利得率gBを受信し、利得率gBは、周波数帯域選択器54によって選択された選択周波数帯域に割り当てられ、周波数帯域選択器54は、符号器側の図4における周波数帯域選択器40に対応する。周波数時間変換器52aの入力では、他の帯域と共に、チャンネルAの周波数領域表現が存在する。乗算器56の出力、そして特に周波数/時間変換手段52bの入力には、チャンネルBの再構成された周波数領域表現が存在することになる。したがって、要素52aの出力では、チャンネルAの時間領域表現が存在することになり、一方で、要素52bの出力では、再構成されたチャンネルBの時間領域表現が存在することになる。
ここで注意すべきなのは、ある実施によっては、復号化されたダウンミックスチャンネルLcまたはRcは、マルチチャンネル拡張復号器において再生されないということである。そのようなマルチチャンネル拡張復号器においては、復号化されたダウンミックスチャンネルは、元チャンネルを再構成するために使用されるのみである。復号化されたダウンミックスチャンネルは、低段階のステレオ専用復号器において再生されるのみである。
このために、サラウンド/mp3環境における本発明の好ましい実施形態を示す図9を参照する。mp3拡張サラウンドビットストリームが、標準的なmp3復号器24に入力され、mp3復号器24は、元のダウンミックスチャンネルを復号化したものを出力する。これらのダウンミックスチャンネルは、その後、低レベルの復号器によって直接再生される。代わりに、これら2つのチャンネルは、これもまたマルチチャンネル拡張データを受信する高性能ジョイントステレオ復号化装置32に入力され、マルチチャンネル拡張データは、好ましくは、mp3に準拠したビットストリームにおける補助データフィールドに入力される。
次に、選択された元チャンネルおよび各ダウンミックスチャンネルまたは合成ダウンミックスチャンネルのグループ化を示す図7を参照する。これに関して、図7の表の右欄は、図3A,3B,4,および5におけるチャンネルAに対応し、中央の欄は、これらの図面におけるチャンネルBに対応する。図7における左欄において、各チャンネル副情報が明示されている。図7の表によれば、元の左チャンネルLについてのチャンネル副情報liは、左ダウンミックスチャンネルLcを使用して計算される。左サラウンドチャンネル副情報lsiは、元の選択された左サラウンドチャンネルLsおよび担体としての左ダウンミックスチャンネルLcによって使用して決定される。元の右チャンネルRについての右チャンネル副情報riは、右ダウンミックスチャンネルRcを使用して決定される。さらに、右サラウンドチャンネルRsについてのチャンネル副情報は、担体としての右ダウンミックスチャンネルRcを使用して決定される。最後に、中央チャンネルCについてのチャンネル副情報ciは、第1および第2のダウンミックスチャンネルの合成によって得られる合成ダウンミックスチャンネルを使用して決定され、符号器および復号器の両方において容易に計算可能であり、送信には追加のビットを必要としない。
当然ながら、左チャンネルについてのチャンネル副情報を計算することもできる。この計算は、例えば、合成ダウンミックスチャンネルに基づいて行われるか、もしくは、重み付けパラメータが復号器に知られているかまたは適宜に送信される限り、0.7Lcおよび0.3Rcなどの第1および第2のダウンミックスチャンネルの重み付け加算によって取得されたダウンミックスチャンネルに基づいても行われる。しかしながら、ほとんどの応用において、中央チャンネルについてのチャンネル副情報だけが、合成ダウンミックスチャンネル、すなわち、第1および第2のダウンミックスチャンネルを合成したものから導出されるのが好ましいだろう。
本発明のビット節約の可能性を示すために、以下の典型的な例を提示する。5チャンネル音声信号の場合に、通常の符号器は、チャンネル毎に64キロビット/秒のビットレートであって、5チャネル信号については320キロビット/秒の総ビットレートとなるビットレートを必要とする。左右ステレオ信号は、128キロビット/秒を必要とする。チャンネル毎のチャンネル副情報は、1.5〜2キロビット/秒の間である。よって、5つのチャンネルそれぞれについてのチャンネル副情報が送信される場合でさえ、この追加のデータは、合計で7.5から10キロビット/秒にしかならない。よって、この進歩的な概念によって、(320(!)キロビット/秒と比較して)138キロビット/秒のビットレートを使用して5チャンネル音声信号を良好な品質で送信することができる。なぜならば、復号器は、問題のあるデマトリックス化動作を使用しないからである。おそらくさらに重要なのは、この進歩的な概念は、完全な後方互換性があるということである。なぜならば、各既存のmp3再生器が、第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルを再生して、従来のステレオ出力を発生させることができるからである。
応用環境によっては、処理および逆処理のためのこの進歩的な方法は、ハードウェアまたはソフトウェアにおいて実施できる。当該実施は、電子的に読み取り可能な制御信号を有するディスクまたはCDなどのデジタル記憶媒体であってもよく、処理および逆処理のためのこの進歩的な方法が行われるように、プログラム可能なコンピュータシステムと協働することができる。したがって、一般的に言って、本発明は、機械読み取り可能な担体上に記憶されたプログラムコードを有するコンピュータプログラム製品にも関連し、プログラムコードは、コンピュータプログラム製品がコンピュータ上で動作する場合に、当該方法を行うために適応されている。したがって、言い換えれば、本発明は、コンピュータプログラムがコンピュータ上で動作する場合に、当該方法を行うためのプログラムコードを有するコンピュータプログラムにも関連する。
進歩的な符号器の好ましい一実施形態のブロック図である。 進歩的な復号器の好ましい一実施形態のブロック図である。 周波数選択チャンネル副情報を得るために計算をするための手段の好ましい一実施についてのブロック図である。 インテンシティ符号化またはバイノーラルキュー符号化などのジョイントステレオ処理を実施する計算器の好ましい一実施形態である。 チャンネル副情報を計算するための手段の他の好ましい実施形態であって、チャンネル副情報が利得率である場合を示す。 符号器を図4のように実施する場合の復号器の一実施の好ましい一実施形態を示す。 ダウンミックスチャンネルを提供するための手段の好ましい一実施形態を示す。 各元チャンネルについてのチャンネル副情報を計算するための、元チャンネルおよびダウンミックスチャンネルのグループ化を示す。 進歩的な符号器の他の好ましい実施形態を示す。 進歩的な復号器の他の実施を示す。 先行技術のジョイントステレオ符号器を示す。

Claims (28)

  1. マルチチャンネル音声信号を処理するための装置であって、マルチチャンネル音声信号は、少なくとも3つの元チャンネルを有し、
    左右ダウンミックスチャンネルは、再生される場合に、結果がマルチチャンネル音声信号のステレオ表現であるように形成されるように、元チャンネルから導出される左ダウンミックスチャンネルとしての第1のダウンミックスチャンネルおよび右ダウンミックスチャンネルとしての第2のダウンミックスチャンネルを提供するための手段(12)と、
    元信号のうちから選択された元チャンネルについてのチャンネル副情報を計算するための手段であって、ダウンミックスチャンネル、または第1および第2のダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように、チャンネル副情報を計算するように動作する手段(14)と、
    チャンネル副情報を含む出力データを生成するための手段(18)とを備える、装置。
  2. 生成するための手段(18)は、出力データが第1のダウンミックスチャンネル、または第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルから導出された信号、または第2のダウンミックスチャンネルから導出された信号を追加的に含むように、出力データを生成するように動作する、請求項1に記載の装置。
  3. 計算するための手段(14)は、時間領域サンプルもスペクトル値も含まないパラメトリックデータとして、チャンネル副情報を決定するように動作する、請求項1または請求項2に記載の装置。
  4. 計算するための手段(14)は、ダウンミックスチャンネルを搬送チャンネルとして使用してジョイントステレオ符号化を行うように動作し、選択された元チャンネルを入力チャンネルとして使用して、選択された元チャンネルについてのチャンネル副情報としてジョイントステレオパラメータを生成するように動作する、請求項1ないし請求項3のいずれかに記載の装置。
  5. 計算するための手段(14)は、チャンネル副情報がエネルギー分布、または選択された元チャンネルについてのバイノーラルキューパラメータを表すように、インテンシティステレオ符号化またはバイノーラルキュー符号化を行うように動作し、ダウンミックスチャンネルまたは合成ダウンミックスチャンネルは、搬送チャンネルとして使用可能である、請求項3に記載の装置。
  6. マルチチャンネル音声信号は、左チャンネルと、左サラウンドチャンネルと、右チャンネルと、右サラウンドチャンネルとを含み、
    提供するための手段(12)は、第1のダウンミックスチャンネルを左ダウンミックスチャンネルとして提供し、第2のダウンミックスチャンネルを右ダウンミックスチャンネルとして提供するように動作し、左右ダウンミックスチャンネルは、再生される場合に、結果がマルチチャンネル音声信号のステレオ表現であるように形成され、
    計算するための手段(14)は、
    選択された元チャンネルとしての左チャンネルについてのチャンネル副情報を、左ダウンミックスチャンネルを使用して計算し、
    選択された元チャンネルとしての右チャンネルについてのチャンネル副情報を、右ダウンミックスチャンネルを使用して計算し、
    選択された元チャンネルとしての左サラウンドチャンネルについてのチャンネル副情報を、左ダウンミックスチャンネルを使用して計算し、
    選択された元チャンネルとしての右サラウンドチャンネルについてのチャンネル副情報を、右ダウンミックスチャンネルを使用して計算するように動作する、請求項1ないし請求項5に記載の装置。
  7. 元チャンネルは、中央チャンネルを含み、
    装置は、第1のダウンミックスチャンネルと、第2のダウンミックスチャンネルとを合成して、合成ダウンミックスチャンネルを得るための合成器(14a)をさらに含み、
    選択された元チャンネルとしての中央チャンネルについてのチャンネル副情報を計算する手段は、合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、元の中央チャンネルの近似となるように、チャンネル副情報を計算する(14b)ように動作する、請求項1ないし請求項6に記載の装置。
  8. 提供するための手段(12)は、第1のダウンミックスチャンネルについての第1の所定の線形重み付けされた合成物と、第2のダウンミックスチャンネルについての第2の所定の線形重み付けされた合成物とを使用して、第1のダウンミックスチャンネルと、第2のダウンミックスチャンネルとを元チャンネルから導出するように動作する、請求項1ないし請求項6のいずれかに記載の装置。
  9. 第1の所定の線形重み付けされた合成物は、以下のように定義され、
    Lc=t・(L+a・Ls+b・C)、または
    第2の所定の線形重み付けされた合成物は、以下のように定義され、
    Rc=t・(R+a・Rs+b・C)
    式中、Lcは第1のダウンミックスチャンネルであり、Rcは第2のダウンミックスチャンネルであり、t,a,およびbは1より小さい重み付け係数であり、Lは元の左チャンネルであり、Cは元の中央チャンネルであり、Rは元の右チャンネルであり、Lsは元の左サラウンドチャンネルであり、Rsは元の右サラウンドチャンネルである、請求項7に記載の装置。
  10. 提供するための手段(12)は、外部から供給された第1および第2のダウンミックスチャンネルを受信するように動作する、請求項1ないし請求項8のいずれかに記載の装置。
  11. 第1のダウンミックスチャンネルおよび第2のダウンミックスチャンネルは、様々な程度の元チャンネルを合成したものである合成チャンネルであり、計算するための手段は、チャンネル副情報を計算するために、両方のダウンミックスチャンネルのうち、他のダウンミックスチャンネルと比べて選択された元チャンネルによってより強く影響を受けたダウンミックスチャンネルを使用するように動作する、請求項1ないし請求項10のいずれかに記載の装置。
  12. 生成するための手段(18)は、出力データが、第1のダウンミックスチャンネル、もしくは第1のダウンミックスチャンネルまたは第2のダウンミックスチャンネルから導出された信号、もしくは第2のダウンミックスチャンネルから導出された信号を処理して、マルチチャンネル音声信号の復号されたステレオ表現を得るための低レベルの復号器によって使用される出力データ構文に準拠するように、出力データを形成するように動作する、請求項1ないし請求項11のいずれかに記載の装置。
  13. 出力データ構文は、それが低レベルの復号器によって無視される特殊データフィールドを含むように構成され、生成するための手段は、チャンネル副情報を特殊データフィールドに挿入するように動作する、請求項12に記載の装置。
  14. 構文はmp3構文であり、特殊データフィールドは補助データフィールドである、請求項13に記載の装置。
  15. 生成するための手段(18)は、チャンネル副情報が高レベルの復号器によってのみ使用されるが、低レベルの復号器によっては無視されるように、チャンネル副情報を出力データに挿入するように動作する、請求項12ないし請求項14のいずれかに記載の装置。
  16. 第1のダウンミックスチャンネルを符号化して第1のダウンミックスチャンネルから導出された信号を得るため、または、第2のダウンミックスチャンネルを符号化して第2のダウンミックスチャンネルから導出された信号を得るための符号器(16)をさらに備える、請求項2ないし請求項15のいずれかに記載の装置。
  17. 符号器(16)は、符号化すべき信号をスペクトル表現に変換するための手段と、音響心理学モデルを使用してスペクトル表現を量子化する手段と、量子化されたスペクトル表現をエントロピー符号化して、エントロピー符号化された量子化済みのスペクトル表現を第1のダウンミックスチャンネルから導出された信号または第2のダウンミックスチャンネルから導出された信号として取得する手段とを含む知覚符号器である、請求項16に記載の装置。
  18. 知覚符号器(16)は、MPEG‐1/2レイヤIII(mp3)またはMPEG‐2/4高度音声符号化(AAC)に従った符号器である、請求項17に記載の装置。
  19. 計算のための手段(14)は、ダウンミックスチャンネルまたは合成ダウンミックスチャンネルについてのダウンミックスエネルギー値を計算し、
    選択された元チャンネルの元のエネルギー値を計算し、
    ダウンミックスエネルギー値と、元のエネルギー値とから導出される利得率をチャンネル副情報として計算するように動作する、請求項1ないし請求項18のいずれかに記載の装置。
  20. 計算のための手段(14)は、複数の周波数帯域について複数の互いに異なるチャンネル副情報パラメータが取得されるように、周波数に依存するチャンネル副情報パラメータを計算するように動作する、請求項1ないし請求項19のいずれかに記載の装置。
  21. マルチチャンネル音声信号を処理する方法であって、マルチチャンネル音声信号は、少なくとも3つの元チャンネルを有し、
    左右ダウンミックスチャンネルは、再生される場合に、結果がマルチチャンネル音声信号のステレオ表現であるように形成されるように、元チャンネルから導出される左ダウンミックスチャンネルとしての第1のダウンミックスチャンネルおよび右ダウンミックスチャンネルとしての第2のダウンミックスチャンネルを提供する工程(12)と、
    ダウンミックスチャンネル、または第1および第2のダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように、元信号のうちから選択された元チャンネルについてのチャンネル副情報の計算を行う工程(14)と、
    チャンネル副情報を含む出力データを生成する工程(18)とを含む、方法。
  22. 入力データの逆処理のための装置であって、入力データは、チャンネル副情報、ダウンミックスチャンネルまたはダウンミックスチャンネルおよびダウンミックスチャンネルから導出された信号、またはダウンミックスチャンネルから導出された信号を含み、ダウンミックスチャンネルおよびダウンミックスチャンネルは、マルチチャンネル音声信号の少なくとも3つの元チャンネルから導出され、再生される場合に、結果がマルチチャンネル音声信号のステレオ表現となり、チャンネル副情報は、ダウンミックスチャンネル、またはダウンミックスチャンネルおよびダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように計算され、
    入力データを読み出して、ダウンミックスチャンネル、またはダウンミックスチャンネルおよびダウンミックスチャンネルから導出された信号、またはダウンミックスチャンネルおよびチャンネル副情報から導出された信号を得るための入力データ読出器(24)と、
    チャンネル副情報およびダウンミックスチャンネルまたは合成ダウンミックスチャンネルを使用して、選択された元チャンネルの近似を得て、選択された元チャンネルの近似を再構成するためのチャンネル再構成器(32)とを備える、装置。
  23. ダウンミックスチャンネルから導出された信号を復号してダウンミックスチャンネルを復号化したものを得るため、および右ダウンミックスチャンネルから導出された信号を復号してダウンミックスチャンネルを復号化したものを得るための知覚復号器(24)をさらに備える、請求項22に記載の装置。
  24. ダウンミックスチャンネルと、ダウンミックスチャンネルとを合成して、合成ダウンミックスチャンネルを得るための合成器をさらに備える、請求項22または請求項23に記載の装置。
  25. 元の音声信号は、左チャンネルと、左サラウンドチャンネルと、右チャンネルと、右サラウンドチャンネルと、中央チャンネルとを含み
    力データは、左チャンネル、左サラウンドチャンネル、右チャンネル、右サラウンドチャンネル、および中央チャンネルのうちの少なくとも3つについてのチャンネル副情報を含み、
    チャンネル再構成器(32)は、
    左チャンネルおよび左ダウンミックスチャンネルについてのチャンネル副情報を使用して、左チャンネルの近似を再構成し、
    左サラウンドチャンネルおよび左ダウンミックスチャンネルについてのチャンネル副情報を使用して、左サラウンドチャンネルについての近似を再構成し、
    右チャンネルおよび右ダウンミックスチャンネルについてのチャンネル副情報を使用して、右チャンネルについての近似を再構成し、
    右サラウンドチャンネルおよび右ダウンミックスチャンネルについてのチャンネル副情報を使用して、右サラウンドチャンネルについての近似を再構成するように動作する、請求項22ないし請求項24のいずれかに記載の装置。
  26. チャンネル再構成器は、中央チャンネルおよび合成ダウンミックスチャンネルについてのチャンネル副情報を使用して、中央チャンネルについての近似を再構成するように動作する、請求項22ないし請求項25に記載の装置。
  27. 入力データの逆処理の方法であって、入力データは、チャンネル副情報、ダウンミックスチャンネルまたはダウンミックスチャンネルから導出された信号、ダウンミックスチャンネルまたはダウンミックスチャンネルから導出された信号を含み、ダウンミックスチャンネルおよびダウンミックスチャンネルは、マルチチャンネル音声信号の少なくとも3つの元チャンネルから導出され、チャンネル副情報は、ダウンミックスチャンネル、またはダウンミックスチャンネルおよびダウンミックスチャンネルを含む合成ダウンミックスチャンネルが、チャンネル副情報を使用して重み付けされる場合に、選択された元チャンネルの近似となるように計算され、
    入力データを読み出して、ダウンミックスチャンネル、またはダウンミックスチャンネルおよびダウンミックスチャンネルから導出された信号、またはダウンミックスチャンネルおよびチャンネル副情報から導出された信号を得る工程(24)と、
    チャンネル副情報およびダウンミックスチャンネルまたは合成ダウンミックスチャンネルを使用して、選択された元チャンネルの近似を得るように、選択された元チャンネルの近似を再構成する工程(32)とを含む、方法。
  28. コンピュータに、請求項21または請求項27に記載の方法を実行させるためのプログラム。
JP2006530060A 2003-10-02 2004-09-30 互換性マルチチャンネル符号化/復号化 Active JP4547380B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/679,085 US7447317B2 (en) 2003-10-02 2003-10-02 Compatible multi-channel coding/decoding by weighting the downmix channel
PCT/EP2004/010948 WO2005036925A2 (en) 2003-10-02 2004-09-30 Compatible multi-channel coding/decoding

Publications (2)

Publication Number Publication Date
JP2007507731A JP2007507731A (ja) 2007-03-29
JP4547380B2 true JP4547380B2 (ja) 2010-09-22

Family

ID=34394093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006530060A Active JP4547380B2 (ja) 2003-10-02 2004-09-30 互換性マルチチャンネル符号化/復号化

Country Status (18)

Country Link
US (11) US7447317B2 (ja)
EP (1) EP1668959B1 (ja)
JP (1) JP4547380B2 (ja)
KR (1) KR100737302B1 (ja)
CN (1) CN1864436B (ja)
AT (1) ATE350879T1 (ja)
BR (5) BRPI0414757B1 (ja)
CA (1) CA2540851C (ja)
DE (1) DE602004004168T2 (ja)
DK (1) DK1668959T3 (ja)
ES (1) ES2278348T3 (ja)
HK (1) HK1092001A1 (ja)
IL (1) IL174286A (ja)
MX (1) MXPA06003627A (ja)
NO (8) NO347074B1 (ja)
PT (1) PT1668959E (ja)
RU (1) RU2327304C2 (ja)
WO (1) WO2005036925A2 (ja)

Families Citing this family (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
JP2006521577A (ja) * 2003-03-24 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャネル信号を表す主信号と副信号の符号化
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CN1922654A (zh) * 2004-02-17 2007-02-28 皇家飞利浦电子股份有限公司 音频分发系统、音频编码器、音频解码器及其操作方法
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
RU2382419C2 (ru) * 2004-04-05 2010-02-20 Конинклейке Филипс Электроникс Н.В. Многоканальный кодер
WO2005098826A1 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
BRPI0509113B8 (pt) * 2004-04-05 2018-10-30 Koninklijke Philips Nv codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
JP4939933B2 (ja) * 2004-05-19 2012-05-30 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号化装置
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
WO2006004048A1 (ja) * 2004-07-06 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
US7751804B2 (en) * 2004-07-23 2010-07-06 Wideorbit, Inc. Dynamic creation, selection, and scheduling of radio frequency communications
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
CN101027718A (zh) * 2004-09-28 2007-08-29 松下电器产业株式会社 可扩展性编码装置以及可扩展性编码方法
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1710799B1 (en) * 2005-02-01 2012-06-20 Panasonic Corporation Reproduction apparatus
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
EP1866912B1 (en) * 2005-03-30 2010-07-07 Koninklijke Philips Electronics N.V. Multi-channel audio coding
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
CN101167126B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
US8917874B2 (en) * 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
EP1946294A2 (en) * 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP2009500657A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
ES2374309T3 (es) * 2005-07-14 2012-02-15 Koninklijke Philips Electronics N.V. Decodificación de audio.
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR101356586B1 (ko) 2005-07-19 2014-02-11 코닌클리케 필립스 엔.브이. 다중 채널 오디오 신호를 생성하기 위한 디코더, 수신기 및 방법
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
KR100857106B1 (ko) * 2005-09-14 2008-09-08 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
TWI462086B (zh) * 2005-09-14 2014-11-21 Lg Electronics Inc 音頻訊號之解碼方法及其裝置
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
US8319791B2 (en) * 2005-10-03 2012-11-27 Sharp Kabushiki Kaisha Display
EP1946302A4 (en) 2005-10-05 2009-08-19 Lg Electronics Inc SIGNAL PROCESSING METHOD AND APPARATUS, ENCODING AND DECODING METHOD, AND ASSOCIATED APPARATUS
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7716043B2 (en) * 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
JP4806031B2 (ja) * 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
JP5147727B2 (ja) * 2006-01-19 2013-02-20 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
KR100983286B1 (ko) 2006-02-07 2010-09-24 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR20080093422A (ko) * 2006-02-09 2008-10-21 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치
BRPI0707969B1 (pt) 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
KR100904439B1 (ko) * 2006-02-23 2009-06-26 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
TWI483619B (zh) * 2006-03-30 2015-05-01 Lg Electronics Inc 一種媒體訊號的編碼/解碼方法及其裝置
KR100904435B1 (ko) * 2006-04-03 2009-06-24 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
ES2396072T3 (es) * 2006-07-07 2013-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para combinar múltiples fuentes de audio paramétricamente codificadas
KR101438387B1 (ko) 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US8935733B2 (en) 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US8966545B2 (en) 2006-09-07 2015-02-24 Porto Vinci Ltd. Limited Liability Company Connecting a legacy device into a home entertainment system using a wireless home entertainment hub
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US20080061578A1 (en) * 2006-09-07 2008-03-13 Technology, Patents & Licensing, Inc. Data presentation in multiple zones using a wireless home entertainment hub
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US8005236B2 (en) * 2006-09-07 2011-08-23 Porto Vinci Ltd. Limited Liability Company Control of data presentation using a wireless home entertainment hub
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US9233301B2 (en) 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
KR100847453B1 (ko) * 2006-11-20 2008-07-21 주식회사 대우일렉트로닉스 입체 음향을 위한 적응 간섭 제거 방법
JP5463143B2 (ja) * 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
CN103299363B (zh) * 2007-06-08 2015-07-08 Lg电子株式会社 用于处理音频信号的方法和装置
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8170218B2 (en) 2007-10-04 2012-05-01 Hurtado-Huyssen Antoine-Victor Multi-channel audio treatment system and method
JPWO2009050896A1 (ja) * 2007-10-16 2011-02-24 パナソニック株式会社 ストリーム合成装置、復号装置、方法
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101438389B1 (ko) * 2007-11-15 2014-09-05 삼성전자주식회사 오디오 매트릭스 디코딩 방법 및 장치
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2238589B1 (en) 2007-12-09 2017-10-25 LG Electronics Inc. A method and an apparatus for processing a signal
TWI424755B (zh) * 2008-01-11 2014-01-21 Dolby Lab Licensing Corp 矩陣解碼器
WO2009093866A2 (en) * 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing an audio signal
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
US8386267B2 (en) * 2008-03-19 2013-02-26 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
KR20110049863A (ko) * 2008-08-14 2011-05-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호 트랜스포맷팅
KR20110110093A (ko) * 2008-10-01 2011-10-06 톰슨 라이센싱 디코딩 장치, 디코딩 방법, 인코딩 장치, 인코딩 방법, 및 편집 장치
EP2175670A1 (en) 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
KR101513042B1 (ko) * 2008-12-02 2015-04-17 엘지전자 주식회사 신호 전송 방법 및 전송 장치
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
ES2950751T3 (es) * 2010-04-13 2023-10-13 Fraunhofer Ges Forschung Codificador de audio o vídeo, decodificador de audio o vídeo y métodos relacionados para procesar señales de audio o vídeo multicanal usando una dirección de predicción variable
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
KR101748760B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
US20150371643A1 (en) * 2012-04-18 2015-12-24 Nokia Corporation Stereo audio signal encoder
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
JP2015529415A (ja) * 2012-08-16 2015-10-05 タートル ビーチ コーポレーション 多次元的パラメトリック音声のシステムおよび方法
ES2924427T3 (es) * 2013-01-29 2022-10-06 Fraunhofer Ges Forschung Decodificador para generar una señal de audio mejorada en frecuencia, procedimiento de decodificación, codificador para generar una señal codificada y procedimiento de codificación que utiliza información lateral de selección compacta
CN105393304B (zh) 2013-05-24 2019-05-28 杜比国际公司 音频编码和解码方法、介质以及音频编码器和解码器
IL290275B2 (en) 2013-05-24 2023-02-01 Dolby Int Ab Encoding audio scenes
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
TWI671734B (zh) 2013-09-12 2019-09-11 瑞典商杜比國際公司 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102160254B1 (ko) 2014-01-10 2020-09-25 삼성전자주식회사 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US9344825B2 (en) * 2014-01-29 2016-05-17 Tls Corp. At least one of intelligibility or loudness of an audio program
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN104486033B (zh) * 2014-12-03 2017-09-29 重庆邮电大学 一种基于c‑ran平台的下行多模信道编码系统及方法
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
KR102291792B1 (ko) 2016-11-08 2021-08-20 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 적어도 2개의 채널들을 다운믹싱하기 위한 다운믹서 및 방법 및 멀티채널 인코더 및 멀티채널 디코더
CN111034225B (zh) * 2017-08-17 2021-09-24 高迪奥实验室公司 使用立体混响信号的音频信号处理方法和装置
CN111615044B (zh) * 2019-02-25 2021-09-14 宏碁股份有限公司 声音信号的能量分布修正方法及其系统
WO2020178321A1 (en) * 2019-03-06 2020-09-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method of downmixing
US10779105B1 (en) 2019-05-31 2020-09-15 Apple Inc. Sending notification and multi-channel audio over channel limited link for independent gain control

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
EP0631458B1 (en) * 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
SG43996A1 (en) * 1993-06-22 1997-11-14 Thomson Brandt Gmbh Method for obtaining a multi-channel decoder matrix
CA2124379C (en) 1993-06-25 1998-10-27 Thomas F. La Porta Distributed processing architecture for control of broadband and narrowband communications networks
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
SG83122A1 (en) 1995-10-09 2001-09-18 Matsushita Electric Ind Co Ltd An optical disk, an optical disk barcode forming method, and optical disk reproduction apparatus, a marking forming apparatus, a method of forming a laser marking on an optical disk, and a method of manufacturing an optical disk
ES2217385T3 (es) 1996-02-08 2004-11-01 Koninklijke Philips Electronics N.V. Transmision de 7 canales compatible con la transmision de 5 canale.
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
US6928169B1 (en) * 1998-12-24 2005-08-09 Bose Corporation Audio signal processing
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
JP4062905B2 (ja) * 2001-10-24 2008-03-19 ヤマハ株式会社 ディジタル・ミキサ
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US8340306B2 (en) * 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information

Also Published As

Publication number Publication date
EP1668959B1 (en) 2007-01-03
EP1668959A2 (en) 2006-06-14
NO344635B1 (no) 2020-02-17
US20190379990A1 (en) 2019-12-12
CN1864436A (zh) 2006-11-15
NO20200106A1 (no) 2006-06-30
IL174286A (en) 2010-12-30
US20180359589A1 (en) 2018-12-13
US10433091B2 (en) 2019-10-01
BR122018069728B1 (pt) 2019-03-19
PT1668959E (pt) 2007-04-30
US10165383B2 (en) 2018-12-25
WO2005036925A3 (en) 2005-07-14
DE602004004168D1 (de) 2007-02-15
US9462404B2 (en) 2016-10-04
NO20180993A1 (no) 2006-06-30
US20180359588A1 (en) 2018-12-13
US11343631B2 (en) 2022-05-24
IL174286A0 (en) 2006-08-01
RU2006114742A (ru) 2007-11-20
US20190110146A1 (en) 2019-04-11
US20130016843A1 (en) 2013-01-17
NO344093B1 (no) 2019-09-02
US10299058B2 (en) 2019-05-21
MXPA06003627A (es) 2006-06-05
US20090003612A1 (en) 2009-01-01
ES2278348T3 (es) 2007-08-01
CA2540851C (en) 2012-05-01
ATE350879T1 (de) 2007-01-15
NO20180978A1 (no) 2006-06-30
DE602004004168T2 (de) 2007-10-11
NO342804B1 (no) 2018-08-06
WO2005036925A2 (en) 2005-04-21
HK1092001A1 (en) 2007-01-26
BR122018069731B1 (pt) 2019-07-09
US20190239017A1 (en) 2019-08-01
US10425757B2 (en) 2019-09-24
JP2007507731A (ja) 2007-03-29
BR122018069730B1 (pt) 2019-03-19
DK1668959T3 (da) 2007-04-10
NO20191058A1 (no) 2006-06-30
BRPI0414757B1 (pt) 2018-12-26
US20190239016A1 (en) 2019-08-01
KR100737302B1 (ko) 2007-07-09
US20190239018A1 (en) 2019-08-01
NO20180990A1 (no) 2006-06-30
RU2327304C2 (ru) 2008-06-20
NO344091B1 (no) 2019-09-02
US20050074127A1 (en) 2005-04-07
US7447317B2 (en) 2008-11-04
NO20180980A1 (no) 2006-06-30
CA2540851A1 (en) 2005-04-21
CN1864436B (zh) 2011-05-11
AU2004306509A1 (en) 2005-04-21
NO345265B1 (no) 2020-11-23
BRPI0414757A (pt) 2006-11-28
NO344760B1 (no) 2020-04-14
NO20180991A1 (no) 2006-06-30
NO347074B1 (no) 2023-05-08
BR122018069726B1 (pt) 2019-03-19
US10206054B2 (en) 2019-02-12
NO344483B1 (no) 2020-01-13
US10455344B2 (en) 2019-10-22
US8270618B2 (en) 2012-09-18
US20160078872A1 (en) 2016-03-17
KR20060060052A (ko) 2006-06-02
US10237674B2 (en) 2019-03-19
NO20061898L (no) 2006-06-30

Similar Documents

Publication Publication Date Title
JP4547380B2 (ja) 互換性マルチチャンネル符号化/復号化
JP4574626B2 (ja) マルチチャネル出力信号を構築する装置および方法またはダウンミックス信号を生成する装置および方法
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091217

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4547380

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250