JP5539926B2 - マルチチャンネル・エンコーダ - Google Patents

マルチチャンネル・エンコーダ Download PDF

Info

Publication number
JP5539926B2
JP5539926B2 JP2011124944A JP2011124944A JP5539926B2 JP 5539926 B2 JP5539926 B2 JP 5539926B2 JP 2011124944 A JP2011124944 A JP 2011124944A JP 2011124944 A JP2011124944 A JP 2011124944A JP 5539926 B2 JP5539926 B2 JP 5539926B2
Authority
JP
Japan
Prior art keywords
digital audio
signal
audio signal
signals
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011124944A
Other languages
English (en)
Other versions
JP2011209745A (ja
Inventor
ハー ホトー,ヘラルド
イェー ブレーバールト,ディルク
アー フェルビトスキー,イフゲニー
ブリンケル,アルベルテュス セー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2011209745A publication Critical patent/JP2011209745A/ja
Application granted granted Critical
Publication of JP5539926B2 publication Critical patent/JP5539926B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、マルチチャンネル・エンコーダ、たとえば空間音響のパラメータ式の記述を利用したマルチチャンネル・オーディオエンコーダに関する。さらに、本発明はそのようなマルチチャンネル・エンコーダにおいて信号、たとえば空間音響を処理する方法にも関する。さらに、本発明は、そのようなマルチチャンネル・エンコーダによって生成される信号を復号するよう動作できるデコーダに関する。
オーディオの録音および再生は近年、モノラルの単一チャンネル形式から二チャンネルのステレオ形式に、より最近には多チャンネル形式、たとえばホームシアターシステムにおいてしばしば使われるような5チャンネルのオーディオ形式へと発達してきた。スーパーオーディオ・コンパクトディスク(SACD: super audio compact disk)およびデジタル多用途ディスク(DVD: digital versatile disc)のデータ担体が導入された結果、そのような5チャンネルのオーディオ再生が現在関心を得てきている。多くのユーザーは現在、家庭で5チャンネルのオーディオ再生を提供できる装置を所有している。それに応じて、好適なデータ担体上の5チャンネルのオーディオ・プログラム・コンテンツがますます手にはいるようになっている。たとえば、前述したSACDおよびDVDの型のデータ担体である。多チャンネルのプログラム・コンテンツへの関心の高まりのため、多チャンネルのオーディオ・プログラム・コンテンツのより効率的な符号化、たとえば音質向上、再生時間延長あるいはチャンネル増といったことの一つまたは複数を提供することが重要な課題となりつつある。
パラメータ式の記述子によってオーディオ・プログラム・コンテンツなどの空間音響情報を表現できるエンコーダは既知である。たとえば、公開されている国際PCT特許出願第PCT/IB2003/002858(WO2004/008805)では、少なくとも第一の信号成分(LF)、第二の信号成分(LR)および第三の信号成分(RF)を含む多チャンネルオーディオ信号のエンコードが記載されている。このエンコードは:
(a)第一のパラメータ式エンコーダを使って第一のエンコード信号(L)およびエンコードパラメータの第一の組(P2)を生成することによって前記第一および第二の信号成分をエンコードし、
(b)第二のパラメータ式エンコーダを使って第二のエンコード信号(T)およびエンコードパラメータの第二の組(P1)を生成することによって前記第一のエンコード信号およびさらなる信号(R)をエンコードし、ここで、前記さらなる信号(R)は少なくとも前記第三の信号成分(RF)から導かれるものであり、
(c)少なくとも前記第二のエンコード信号(T)、エンコードパラメータの前記第一の組(P2)およびエンコードパラメータの前記第二の組(P1)から導かれる、結果として得られるエンコード信号(T)に少なくともよって、前記多チャンネルオーディオ信号を表現する、
ステップを有する方法を利用している。
オーディオ信号を記述する量子化されたパラメータを伝送するには比較的少ない伝送容量しか必要でないことが示されたため、オーディオ信号のパラメータ式の記述は、近年関心を得ている。これらの量子化されたパラメータは、対応するもともとのオーディオ信号から知覚的に著しく異なりはしないオーディオ信号を再生成するために、デコーダ内で受信され、処理されることができる。
現代のマルチチャンネル・エンコーダからの出力がその後復号されるとき、著しいチャンネル間干渉の問題が生じる。そのような干渉は、2チャンネルのダウンミックスとの関連で良好なステレオ音像を生成するよう構成されたマルチチャンネル・エンコーダにおいて特に顕著である。本発明は、この問題に少なくとも部分的に対処するよう構成されており、それにより対応する復号された多チャンネルオーディオの品質を向上させるものである。
本発明の目的は、あとで復号するときのチャンネル間干渉が削減されうるようなエンコード出力データを生成しうる、マルチチャンネル・エンコーダ内で使用できる代替的なマルチチャンネル・エンコーダまたはブロックを提供することである。
本発明の第一の側面によれば、複数の入力チャンネルにおいて伝達される入力信号を処理して、ダウンミックス出力信号を相補的なパラメータ用データとともに有する対応する出力データを生成するよう動作しうるマルチチャンネル・エンコーダであって:
(a)入力信号をダウンミックスして対応するダウンミックス出力信号を生成するダウンミキサと、
(b)前記ダウンミックス出力信号と相補的な前記パラメータ用データを生成するよう動作しうる、前記入力信号を処理する解析器とを含んでおり、
前記ダウンミックス出力信号を生成するときに、当該エンコーダ内で処理され、そして破棄されるチャンネルの信号を予測するための前記ダウンミックス出力信号のその後の復号を許容するよう動作しうる、マルチチャンネル・エンコーダが提供される。
本発明は、当該エンコーダからの出力データが、削減されたチャンネル間干渉をもって復号されうる、すなわち入力信号の後刻の向上された再生成を可能にするという点で有利である。
さらに、入力信号を表現するために必要とされる当該マルチチャンネル・エンコーダからのデータ出力の量も潜在的には削減される。
好ましくは、当該エンコーダは入力信号を時間/周波数タイルをベースとして処理するよう動作しうる。より好ましくは、それらのタイルは事前に、あるいは入力信号の処理中にエンコーダ内で定義される。
好ましくは、当該エンコーダにおいて、前記解析器は、一つまたは複数の入力信号と、当該マルチチャンネル・エンコーダからの出力データから生成されうる前記一つまたは複数の入力信号の予測値との間の差から導出される少なくとも一つの信号の最適化を適用することによって、前記パラメータ用データ(C1,i;C2,i)の少なくとも一部を生成するよう動作しうる。より好ましくは、前記最適化はユークリッド・ノルムを最小にすることに関わる。
好ましくは、当該エンコーダにおいて、入力チャンネルはN個あり、前記解析器はこれを処理して各時間/周波数タイルについて前記パラメータ用データを生成するよう動作でき、前記解析器は出力データ中で入力データを表現するためにM個のダウンミックス出力信号とともにM(N−M)個のパラメータを出力するよう動作できる。ここでMおよびNは整数で、M<Nである。より好ましくは、当該エンコーダにおいて整数Mが2に等しい場合、前記ダウンミキサは、2チャンネルのステレオ音響装置において再生でき、標準的なステレオ・コーダによってコードされうる2つのダウンミックス出力信号を生成するよう動作できる。そのような特性は、当該エンコーダおよび関連する出力データを以前の再生システム、たとえばステレオ音響2チャンネル再生システムに対して上位互換にすることができる。
本発明の第二の側面によれば、本発明の第一の側面に基づくマルチチャンネル・エンコーダに含めるための信号プロセッサが提供される。該プロセッサは、当該マルチチャンネル・エンコーダ内でデータを処理し、そのダウンミックス出力信号およびパラメータ用データを生成するよう動作しうる。
本発明の第三の側面によれば、マルチチャンネル・エンコーダにおいて入力信号をエンコードして、ダウンミックス出力信号を相補的なパラメータ用データとともに有する対応する出力データを生成する方法であって:
(a)複数(N)の入力チャンネルを介して当該マルチチャンネル・エンコーダに入力信号を提供し、
(b)入力信号をダウンミックスして前記対応する(M個の)ダウンミックス出力信号を生成し、
(c)入力信号を処理して前記ダウンミックス出力信号と相補的な前記パラメータ用データを生成する、
ステップを含んでおり、当該マルチチャンネル・エンコーダにおける前記入力信号の処理が、入力信号の表現を後刻再生成できるようにするためのパラメータ・データを決定することに関わり、前記ダウンミックス信号が、当該エンコーダにおいて処理され、そして破棄されるチャンネルの信号の内容を予測するための該ダウンミックス信号の復号を許容するものであるような方法が提供される。
本発明の第四の側面によれば、本発明の第三の側面の方法によって生成される、データ担体上に保存される、エンコードされた出力データが提供される。
本発明の第五の側面によれば、本発明の第一の側面に基づくエンコーダによって生成された出力データを復号するデコーダであって:
(a)エンコーダからのパラメータ用データとともにダウンミックス出力信号を受け取り、該パラメータ用データを処理して一つまたは複数の係数すなわちパラメータを決定するよう動作できる処理手段と、
(b)前記パラメータ・データおよびまたステップ(a)で決定された前記一つまたは複数の係数を使って、さらなる処理によってエンコーダによって生成された出力信号のもとになった入力信号の表現を実質的に再生成するために、出力データ中にエンコードされている各入力信号の近似表現を計算する計算手段、
とを有するデコーダが提供される。
本発明の第六の側面によれば、本発明の第五の側面に基づくマルチチャンネル・デコーダに含めるための信号プロセッサであって、入力信号の表現を再生成することに関係してデータを処理することにおいて支援するよう動作しうる信号プロセッサが提供される。
本発明の第七の側面によれば、マルチチャンネル・デコーダにおいて、本発明の第一の側面に基づくマルチチャンネル・エンコーダによって生成されたような形のエンコードデータを復号する方法であって:
(a)エンコードデータ中に存在するパラメータ用データとともにダウンミックス出力信号を処理し、その際、前記パラメータ用データを一つまたは複数の係数すなわちパラメータを決定するために利用し、
(b)前記パラメータ・データおよびまたステップ(a)で決定された前記一つまたは複数の係数を使って、さらなる処理によってエンコーダによって生成されたエンコードデータのもとになった入力信号の表現を実質的に再生成するために、エンコードデータ中にエンコードされた各入力信号の近似表現を計算する、
ステップを含む方法が提供される。
本発明の諸特徴は、本発明の範囲から外れることなくいかなる組み合わせにおいても組み合わせうることは理解されるであろう。
本発明の実施形態について、これからあくまでも例として、付属の図面を参照しつつ説明する。
本発明の第一のコンテキストに関係する本発明に基づくコーダを含んでいるマルチチャンネル・エンコーダの実施形態の概略的なブロック図である。 本発明の第一のコンテキストに関係する図1のエンコーダと互換な、本発明に基づくデコーダの実施形態の概略的なブロック図である。 前記コーダが本発明の第二のコンテキストに関係する本発明に基づくマルチチャンネル・エンコーダ内で用いられる、本発明の好ましい実施形態である。 本発明の第二のコンテキストに関係する図3のエンコーダと互換な、本発明のコーダを使ったデコーダの実施形態を示す図である。 本発明に基づくマルチチャンネル・エンコーダおよびマルチチャンネル・デコーダが標準的なステレオ・エンコーダおよびデコーダを用いて相互に構成される構成を示す図である。
本発明について、第一および第二のコンテキストにおいて述べる。第一のコンテキストでは、本発明に関わるエンコーダは、もとの入力信号を処理して対応するエンコードされた出力データを生成するよう動作しうる。そのエンコードされた出力データは、後刻デコーダで復号されてこれまで可能であった以上に知覚的に精確なもとの入力信号の表現を再生成できる。第二のコンテキストでは、本発明は、本発明の特定の実施例に関わる。
第一のコンテキストについてこれから図1および図2に関連して考察する。概観としては、本発明が関わるのは図1で全体として5で指示されるエンコーダである。エンコーダ5は、対応するもとの入力信号を受け取るためのN個の入力チャネルを含んでいる。たとえば、当該エンコーダはN=3のときには3つの入力チャンネルCH1、CH2、CH3を含む。エンコーダ5はNチャンネルのもとの入力信号を処理して:
(a)M<NとしてM個のダウンミックス・チャンネル出力における対応するエンコードされた出力信号、たとえばM=2のときにはそれぞれ610、620で表される2つのチャンネル出力OP1、OP2と、
(b)一つまたは複数のパラメータ用信号出力、たとえば600で表されるパラメータ用出力、
とを生成するよう動作しうる。
後刻デコーダにおいてエンコーダ5によって生成された出力信号を最も最適に、すなわち最小二乗誤差に関して復号するためには、現在のところ、エンコードされた出力信号600、610、620を生成する際にエンコーダ5において主成分解析(PCA: Principal Component Analysis)が用いられることが有益である。図2で10で指示されるデコーダにおいて、エンコーダ5に呈示されたN個の入力信号に対応する信号を可能な限り最良に再生成するためにこれらの出力信号600、610、620を処理することは、エンコーダ5のPCAによって生成されたパラメータを考慮に入れた場合に可能となりうる。信号600、610、620におけるPCAパラメータのための値はもとの入力信号そのものによって誘導され、したがってエンコーダ5において生起するダウンミックスに対しては何らの影響力も許容しない。そのような影響力の欠如のため、現在のところ、エンコーダ5および対応するデコーダ10においてPCAが用いられる際に満足なステレオ音像品質を得ることが実質的に不可能となっている。
本発明人らは、本発明について、エンコーダ5において前述したM個のダウンミックス・チャンネルに関して固定ダウンミックスが用いられるときには、これらM個のダウンミックス・チャンネルを相補的情報を伝達する追加的なN−M個のチャンネルの適切な集合によって拡張すれば、相補的なデコーダ10におけるもとの入力信号の実質的に完璧な再生成が可能となりうることを認識するに至った。よって、そのようなN−M個のチャンネルに関係する情報が少なくとも部分的にエンコード中に破棄されている場合には、固定ダウンミックスによって生成されるM個のダウンミックス・チャンネルの出力信号を使って、N個のチャンネルのもとの入力信号の実質的に完璧な表現を再生成することはできないのである。しかし、本発明人らは、M個のダウンミックス・チャンネルに、たとえば出力610、620に好適な処理を適用すれば、これらのN−M個のチャンネルが少なくとも部分的には予測できることを認識するに至った。
よって、エンコーダ5は、本発明によれば、デコーダにおいてM個のダウンミックス・チャンネルから少なくともN−M個のチャンネルに対応するなにがしかの情報を予測する一方、同時にエンコーダ5からデコーダ10にある種のパラメータを送る必要は回避する。そのような予測は、N個のチャンネルの信号どうしの間に存在する信号冗長性を利用するのであるが、これについてはのちにより詳細に述べる。さらに、対応する互換デコーダ10は、エンコーダ5から与えられたエンコードデータを復号する際にその冗長性を回復する。
本発明をさらに解説するため、図1に示したエンコーダ5の実施例を述べ、それからそこにおいて用いられる信号処理の方法を数学的基礎を参照しつつ呈示する。
前述の第二のコンテキストに従う本発明の実施例についてこれから図3および図4を参照しつつ説明する。
図3には、全体として15で指示されるマルチチャンネル・エンコーダが示されている。エンコーダ15は400ないし450で示される6つの入力信号を受け取るための3つの処理ユニット20、30、40を含んでいる。これら6つの入力信号の性質はのちに解説する。3つの処理ユニット20、30、40は、エンコーダ5に関連して前述したN個のチャンネル500ないし520を生成するよう動作しうる。エンコーダ15はまた、それぞれ処理ユニット20、30、40の処理済み出力500、510、520を受け取る混合およびパラメータ抽出ユニット180を有している。抽出ユニット180からの出力には、前述の第三のパラメータ・セット出力600と、それぞれ左および右の中間信号950、960とがある。これらの中間信号はそれぞれ左および右のチャンネルのための前述のダウンミックス出力610、620を生成するために逆変換およびOLAユニット360を介して接続される。パラメータ・セット出力720、820、920、600およびダウンミックス出力610、620は、エンコーダ15からのエンコードされた出力データに対応し、その後対応する互換デコーダに通信されるのに好適である。該デコーダでは、6つの入力信号400ないし450のうちの一つまたは複数の表現を再生成するため、出力データが復号される。あるいはまた、ダウンミックス出力610および620が標準的なステレオ・コーダに供給されることもできる。
400ないし450で表される6つのもとの入力信号は:左前方オーディオ信号400、左後方オーディオ信号410、効果オーディオ信号420、中央オーディオ信号430、右前方オーディオ信号440および右後方オーディオ信号450を含んでいる。効果信号420は好ましくは、たとえばとどろき、爆発、雷鳴の効果をシミュレートする際に使うための実質的に120Hzの帯域幅を有する。さらに、入力信号400、410、430、440、450は好ましくは5チャンネルのホームシアター・サウンド・チャンネルに対応する。
処理ユニット20、30、40は好ましくは、公開されている欧州特許出願第EP1,107,232号において解説されている仕方で実装される。該出願はこれらのユニット20、30、40に関し、ここに参照によって組み込まれる。
処理ユニット20はセグメントおよび変換ユニット100、パラメータ解析ユニット110、パラメータ‐PCA角ユニット120およびPCA回転ユニット130を含んでいる。変換ユニット100は変換後左前方出力および変換後左後方出力700、710を含んでおり、これらはそれぞれPCA回転ユニット130およびパラメータ解析ユニット110に結合されている。第一のパラメータ・セット出力720はPCA角ユニット120を介してPCA回転ユニット130に結合されている。回転ユニット130は、出力700、710および第一のパラメータ・セット出力を処理し、処理された出力500を出力するよう動作しうる。ユニット20内での処理は時間/周波数タイルをベースとして実行される。
同様に、処理ユニット30はセグメントおよび変換ユニット200、パラメータ解析ユニット210、パラメータ‐PCA角ユニット220およびPCA回転ユニット230を含んでいる。変換ユニット200は変換後左前方出力および変換後左後方出力800、810を含んでおり、これらはそれぞれPCA回転ユニット230およびパラメータ解析ユニット210に結合されている。第四のパラメータ・セット出力820はPCA角ユニット220を介してPCA回転ユニット230に結合されている。回転ユニット230は、出力800、810および第四のパラメータ・セット出力を処理し、処理された出力510を出力するよう動作しうる。ユニット30内での処理は時間/周波数タイルをベースとして実行される。
同様に、処理ユニット40はセグメントおよび変換ユニット300、パラメータ解析ユニット310、パラメータ‐PCA角ユニット320およびPCA回転ユニット330を含んでいる。変換ユニット300は変換後左前方出力および変換後左後方出力900、910を含んでおり、これらはそれぞれPCA回転ユニット330およびパラメータ解析ユニット310に結合されている。第二のパラメータ・セット出力920はPCA角ユニット320を介してPCA回転ユニット330に結合されている。回転ユニット330は、出力900、910および第二のパラメータ・セット出力を処理し、処理された出力520を出力するよう動作しうる。ユニット40内での処理は時間/周波数タイルをベースとして実行される。
処理された出力500、510、520はそれぞれ左、中央および右の処理された信号に対応する。さらに、ダウンミックス出力610、620は、現在の2チャンネル・ステレオ再生装置を介して再生されうるので、以前のステレオ音響システムに対する上位互換性を維持する。第三のパラメータ・セット出力600は追加的なパラメータ・データを含んでおり、それはデコーダ、たとえば図2に示したデコーダ10において出力パラメータ・セット720、820、920およびダウンミックス出力610、620とともに処理されて、6つの入力信号400ないし450の表現を再生成する。ダウンミックス出力610、620と第三のパラメータ・セット出力600におけるパラメータ・データとを生成するためにこのダウンミックスが行われる仕方について次に説明する。
再び図1および図2に関する本発明の第一のコンテキストを参照すると、N個のチャンネルCH1ないしCH3のもとの入力信号、すなわちz1[n]、z2[n]、…zN[n]はN個のチャンネルの離散的な時間領域の波形を記述する。これらのz1[n]ないしzN[n]の信号は3つの処理ユニット20、30、40において、好ましくは時間的に重なり合う解析窓を用いてセグメント分割される。その後、各セグメントは時間形式から周波数形式に、すなわち時間領域から周波数領域に、好適な変換、たとえば高速フーリエ変換(FFT: Fast Fourier Transform)または同様の等価な型の変換を適用することによって変換される。そのような形式の変換は好ましくは、好適なソフトウェアを実行する計算ハードウェアにおいて実装される。あるいはまた、変換は時間/周波数タイルを得るためにフィルタバンク構造を使って実装されてもよい。さらに、変換の結果、チャンネルCH1ないしCH3について入力信号のセグメント分割されたサブバンド表現が生じる。便宜上、入力信号z1[n]ないしzN[n]のこれらのセグメント分割されたサブバンド表現をそれぞれZ1[k]ないしZN[k]で表す。ここでkは周波数の添え字である。
便宜上、エンコーダ15について示したような2つのダウンミックス・チャンネルを考えるが、ダウンミックス・チャンネル数の他の数への拡張も可能である。エンコーダ5は、N個のチャンネルCH1ないしCH3において伝達されるもとの入力信号からの前述のサブバンド表現Z1[k]ないしZN[k]を処理して、式1および2で与えられるような2つのダウンミックス・チャンネルL0[k]およびR0[k]を生成する。
Figure 0005539926
ここで、パラメータαiおよびβiは好ましくは2つのダウンミックス・チャンネルL0[k]およびR0[k]における良好なステレオ音像のために必要とされるように設定される。以上のことからわかるように、CH1ないしCH3についてのもとの入力信号の表現を再生成するその後のデコーダ、たとえばデコーダ10は、2つのダウンミックス・チャンネルL0[k]およびR0[k]がN−2個の欠けているチャンネルを実質的に再生成するために適切なパラメータのセットによって補足されるときにのみ、実質的に完璧な表現を生成することができる。固定ダウンミックスが用いられるときには、ある程度までは、N−2個の破棄されたチャンネルの情報が2つのダウンミックス・チャンネルL0[k]およびR0[k]から予測できる。それにより対応するデコーダ、たとえばデコーダ10におけるチャンネルCH1ないしCH3のもとの入力信号の前述した表現の再生成の精度を高める方法が提供される。
N個のチャンネルのあるものに関係した情報が、出力信号600、610、620を生成する際に破棄されている状況では、すなわち破棄されたチャンネルをC0,i[k]で表すと、これらの破棄されたチャンネルはダウンミックス・チャンネルL0[k]およびR0[k]から式3を適用することによって予測できる。
Figure 0005539926
ここでパラメータ~C1,iおよび~C2,i〔~Cはチルダ付きCを表す〕は一つまたは複数の最適化基準に基づいて選択される。好ましくは、エンコーダ5において用いられる最適化基準は、信号C0,i[k]およびその推定値^C0,i[k]〔^Cはカレット付きCを表す〕の最小ユークリッド・ノルムである。エンコーダ5と相補的なデコーダで式3に基づく処理が用いられうるようにするために、パラメータ~C1,iおよび~C2,iは好ましくはエンコーダ5から出力される第三のパラメータ・セット600に含められる。
本発明人らは、式3におけるパラメータ~C1,iおよび~C2,iが、信号Zi[k]とデコーダ10で生成されるその推定値^Zi[k]との差のユークリッド・ノルムをエンコーダ5において最小にするときに生成されるパラメータに関係していることを認識するに至った。エンコーダ5は好ましくはこれらのパラメータZi[k]および^Zi[k]を用いるよう構成される。もとの入力信号Zi[k]の差のユークリッド・ノルムの二乗が次いでエンコーダ5において式4を適用することによって計算可能である。
Figure 0005539926
式4を最小にすることは、好ましくは式6および7を適用することによって達成される。
Figure 0005539926
ここで、式6および7から計算可能なパラメータC1,ZiおよびC2,Ziについて、式10ないし13からの以下の関係が導出可能である。ここで係数αiおよびβiはたとえば式1および2に関するものである。
Figure 0005539926
このように、エンコーダ5において、式1ないし13によって記述される処理動作を適用して、N個のチャンネルに対応する入力信号、すなわちN=3としてCH1ないしCH3についての入力信号を、チャンネルあたり2つのパラメータおよび2つのダウンミックス・チャンネルを用いて変換することが実行可能である。i番目のチャンネルについての2つのパラメータはC1,ZiおよびC2,Ziである。ダウンミックスがすべての時間/周波数タイルについて固定で、ダウンミックスがデコーダ10において既知であれば、パラメータ間の関係は事前に既知である。他方、ダウンミックスを変動させることを選ぶ場合には、実際のダウンミックスに関する情報をデコーダ10に送る必要がある。
エンコーダ5において、入力信号CH1ないしCH3はチャンネル・ユニット100、200、300において処理されて、時間/周波数タイルにおける入力信号の表現を与える。式1ないし13によって描かれる処理動作はこれらのタイルのそれぞれについて反復される。全周波数タイルの信号L0[k]がエンコーダ5で組み合わされて、時間領域に変換されて、現在のセグメントについての信号が形成される。この信号は少なくとも部分的に少なくともそれに先行するセグメントと関する信号と組み合わされ、エンコードされた出力信号620が生成される。信号R0[k]は信号L0[k]と同様の仕方で処理されて、エンコードされた出力信号610が生成される。
まとめると、エンコーダ5は、そして本発明の特定の実施例であるエンコーダ15も同様に、3つの入力信号CH1ないしCH3を、該入力信号CH1ないしCH3を処理するときに適用される時間/周波数タイルそれぞれについて2つのダウンミックス・チャンネル610、620、すなわちl0[n]、r0[n]および2N−4個のパラメータとしてエンコードするよう動作しうる。
図1に示したエンコーダ5、同様に図3に示したエンコーダ15と相補的なのが、図2に概略的に呈示した相補的なデコーダであり、図2では全体として10で示した。デコーダ10は処理ユニット1000を含む。この処理ユニット1000は、エンコーダ5からのダウンミックス出力信号610、620、およびまたパラメータ情報たとえば前述のパラメータC1,ZiおよびC2,Ziについての値を伝達する第三のパラメータ・セット600を受け取る。デコーダ10はそこで受け取られた出力600、610、620からの信号を処理して復号された出力信号1500、1510、1520を生成するよう動作しうる。これらの復号された出力信号は、それぞれ入力信号CH1、CH2、CH3の復号された表現である。
デコーダ10において、たとえばインターネットならびに/またはデジタルビデオディスク(DVD)もしくは同様のデータ媒体のようなデータ担体のような通信ネットワークによって伝達された、エンコーダ5からの出力600、610、620を、それぞれの時間/周波数タイルについて受け取るとき、以下の処理機能が実行される:
(a)すべてのN個のチャンネルについて2N−4個の係数および4つの式すなわち係数間の関係を記述する式10ないし13に関する情報を使って係数C1,ZiおよびC2,Ziが計算される。
(b)各入力信号Zi[k]の近似表現^Zi[k]が式14を使って計算される:
^Zi=C1,ZiL0[k]+C2,ZiR0[k] (14)
ここで、L0[k]およびR0[k]はデコーダ10において受け取られる2つのダウンミックス・チャンネルの時間/周波数タイルを表現する信号、すなわちそれぞれ610、620である。
第一のコンテキストにおいて図2で示されたデコーダ10の特定の実施例についてこれから第二のコンテキストにおいて図4を参照しつつ説明する。図4では、全体として18と指示されるデコーダが示されている。デコーダ18は、r0、l0によって表される前述のダウンミックス出力610、620を変換してそれぞれR0、L0で表される対応する変換信号1650、1660を生成するためのセグメントおよび変換ユニット1600を有している。さらに、デコーダ18は、信号600、1650、1660を受け取ってそれを処理して、それぞれ左チャンネル(L)、中央チャンネル(C)および右チャンネル(R)に関係する対応する処理された信号1700、1710、1720を生成するための復号プロセッサ1610をも含んでいる。
信号1700は、直接、およびまた図のような脱相関器1750を介して逆PCAユニット1800に結合される。逆PCAユニット1800は2つの中間出力Lf、Lsを生成するよう動作でき、該中間出力は逆変換およびOLAユニット1900に結合される。逆変換ユニット1900は、中間出力Lf、Lsを処理して図2の出力1500に対応するデコーダ出力2000、2010、すなわち入力信号400、410の再生成版を生成するよう動作しうる。
同様に、信号1710は、直接、およびまた図のような脱相関器1760を介して逆PCAユニット1810に結合される。逆PCAユニット1810は2つの中間出力Cs、LFEを生成するよう動作でき、該中間出力は逆変換およびOLAユニット1910に結合される。逆変換ユニット1910は、中間出力Cs、LFEを処理して図2の出力1510に対応するデコーダ出力2020、2030、すなわち入力信号420、430の再生成版を生成するよう動作しうる。
同様に、信号1720は、直接、およびまた図のような脱相関器1770を介して逆PCAユニット1820に結合される。逆PCAユニット1820は2つの中間出力Rf、Rsを生成するよう動作でき、該中間出力は逆変換およびOLAユニット1920に結合される。逆変換ユニット1920は、中間出力Rf、Rsを処理して図2の出力1520に対応するデコーダ出力2040、2050、すなわち入力信号440、450の再生成版を生成するよう動作しうる。
ユニット1800、1810、1820は、正しい動作のために十分なデータを受け取るよう、動作中、パラメータ入力920、820、720を必要とする。
本発明によればデコーダとしても知られる復号プロセッサ1610内で実行される処理動作は、図2に示したデコーダ10に関して先に述べた数学的動作に関わっている。
先に述べた本発明の実施形態は、付属の請求項によって定義される本発明の範囲から外れることなく修正されうることは理解されるであろう。
たとえば、エンコーダ5、同様にエンコーダ15は、好ましくは、処理中に式15および16を適用することによって、ダウンミックス出力において良好なステレオ音像を生成するよう機能するよう構成される。
L0[k]=L[k]+Cs[k] (15)
R0[k]=R[k]+Cs[k] (16)
よって、N=3のような状況では、エンコーダ5からデコーダ10に伝送する必要があるパラメータは、タイルごとに2N−4によって決まる2つだけである。そのような構成は、2つのパラメータまたは係数C1,ZiおよびC2,Ziが名目上同じような数値範囲にあるので同じような量子化が適用できるという点で有利である。
したがって、デコーダ10において、3つ以上のチャンネル再生を提供するとき、各タイルについて6つのパラメータ、すなわちC1,L、C2,L、C1,R、C2,R、C1,Cs、C2,Csが計算される。そのような計算は、2つの伝送されたパラメータおよびこれら6つのパラメータの間の関係に関する情報に基づいている。
例として、係数C1,LおよびC2,Lがエンコーダ5からデコーダ10に伝送される。このとき、デコーダ10はそれから他の係数を式17によって導出することができる。すなわち:
C2,L=C2,R−1 C1,R=C1,L−1
C1,Cs=1−C1,L C2,Cs=1−C2,R (17)
各タイルについてこれら6つの係数が導出されたとき、エンコーダ5内の出力信号の表現、すなわち^L[k]、^R[k]、^Cs[k]は、デコーダ10内において式18を使うことによって、デコーダ10内で実行される計算において再生成できる。
Figure 0005539926
これらの信号^L[k]、^R[k]、^Cs[k]は次いで、たとえばホームシアターでの呈示の間のユーザー鑑賞のためにデコーダ10から出力するための信号1500ないし1520を生成するため、周波数領域から時間領域に変換されることができる。
マルチチャンネル・エンコーダ5、15の最もストレートな使用では、M=2である標準的なステレオ・コーダ、すなわちエンコーダおよびデコーダ両方が、先に述べたマルチチャンネル・エンコーダ5、15とマルチチャンネル・デコーダ10、18の間で用いられる。換言すれば、図3および図4を参照して図3の出力信号610、620は、図5に示すように、直接的には標準的なステレオ・エンコーダ3000に、その後、マルチプレクサ3002を介して与えられる。マルチプレクサ3002の出力3005はパラメータ・データ(600;600、720、820、920)を含んでおり、次いでその後、データ通信経路3010を介して、たとえばデータ担体または通信ネットワークを介してデマルチプレクサ3012に、そしてその後ステレオ・エンコーダ3000と相補的なステレオ・デコーダ3020に伝達される。デコーダ3020からの復号された出力信号3030は、デマルチプレクサ3012からのパラメータ・データ(600;600、720、820、920)とともにマルチチャンネル・コーダ10、18に与えられる。デコーダ3020の出力3030は、マルチチャンネル・エンコーダ5、15からの出力信号610、620の再生成版である。図5に描いたような構成は、マルチチャンネル・エンコーダ5、15およびマルチチャンネル・デコーダ10、18が互いに相互接続されうる仕方の一例である。
付属の請求項において、括弧内に含められた数字その他の記号があったとしても、それは請求項の理解を支援するために含められているのであって、特許請求の範囲をいかなる仕方であれ限定することを意図したものではない。
「有する」「含む」「組み込む」「包含する」「である」「もつ」のような表現は、説明および関連する請求項を解釈する際、非排他的仕方において解釈されるべきものである。すなわち、明示的に規定されていないその他の要素またはコンポーネントも存在することを許容するものと解釈される。単数形への言及は複数への言及であるとも解釈され、その逆もある。
原出願である特願2007−506878の当初請求項を以下に記載しておく。
〔請求項1〕
複数の入力チャンネルにおいて伝達される入力信号を処理して、ダウンミックス出力信号を相補的なパラメータ用データとともに有する対応する出力データを生成するよう動作しうるマルチチャンネル・エンコーダであって:
(a)入力信号をダウンミックスして対応するダウンミックス出力信号を生成するダウンミキサと、
(b)前記ダウンミックス出力信号と相補的な前記パラメータ用データを生成するよう動作しうる、前記入力信号を処理する解析器とを含んでおり、
前記ダウンミックス出力信号を生成するときに、当該エンコーダ内で処理され、そして破棄されるチャンネルの信号を予測するための前記ダウンミックス出力信号のその後の復号を許容するよう動作しうることを特徴とする、マルチチャンネル・エンコーダ。
〔請求項2〕
当該エンコーダが入力信号を時間/周波数タイルをベースとして処理するよう動作しうることを特徴とする、請求項1記載のマルチチャンネル・エンコーダ。
〔請求項3〕
前記タイルが事前に、あるいは入力信号の処理中にエンコーダ内で、定義されることを特徴とする、請求項2記載のマルチチャンネル・エンコーダ。
〔請求項4〕
前記解析器が、一つまたは複数の入力信号と、当該マルチチャンネル・エンコーダからの出力データから生成されうる前記一つまたは複数の入力信号の予測値との間の差から導出される少なくとも一つの信号の最適化を適用することによって、前記パラメータ用データ(C1,i;C2,i)の少なくとも一部を生成するよう動作しうることを特徴とする、請求項1記載のマルチチャンネル・エンコーダ。
〔請求項5〕
前記最適化がユークリッド・ノルムを最小にすることを含むことを特徴とする、請求項4記載のマルチチャンネル・エンコーダ。
〔請求項6〕
MおよびNを整数、M<Nとして、入力チャンネルがN個あり、前記解析器はこれを処理して各時間/周波数タイルについて前記パラメータ用データを生成するよう動作でき、前記解析器は出力データ中で入力データを表現するためにM個のダウンミックス出力信号とともにM(N−M)個のパラメータを出力するよう動作できることを特徴とする、請求項1記載のマルチチャンネル・エンコーダ。
〔請求項7〕
整数Mが2に等しく、前記出力信号が2チャンネルのステレオ音響装置において再生でき、標準的なステレオ・コーダによってコードされうることを特徴とする、請求項6記載のマルチチャンネル・エンコーダ。
〔請求項8〕
請求項1記載のマルチチャンネル・エンコーダに含めるための信号プロセッサであって、当該マルチチャンネル・エンコーダ内でデータを処理し、そのダウンミックス出力信号およびパラメータ用データを生成するよう動作しうることを特徴とする信号プロセッサ。
〔請求項9〕
マルチチャンネル・エンコーダにおいて入力信号をエンコードして、ダウンミックス出力信号を相補的なパラメータ用データとともに有する対応する出力データを生成する方法であって:
(a)複数(N)の入力チャンネルを介して当該エンコーダに入力信号を提供し、
(b)入力信号をダウンミックスして前記対応する(M個の)ダウンミックス出力信号を生成し、
(c)入力信号を処理して前記ダウンミックス出力信号と相補的な前記パラメータ用データを生成する、
ステップを含んでおり、当該マルチチャンネル・エンコーダにおける前記入力信号の処理が、入力信号の表現を後刻再生成できるようにするためのパラメータ・データを決定することを含んでおり、前記ダウンミックス信号が、当該エンコーダにおいて処理され、そして破棄されるチャンネルの信号の内容を予測するための該ダウンミックス信号の復号を許容するものであることを特徴とする方法。
〔請求項10〕
請求項9記載の方法に基づいて生成されることを特徴とする、データ担体上に記憶された、エンコードされた出力データ。
〔請求項11〕
請求項1記載のマルチチャンネル・エンコーダによって生成された出力データを復号するマルチチャンネル・デコーダであって:
(a)エンコーダからのパラメータ用データとともにダウンミックス出力信号を受け取り、該パラメータ用データを処理して一つまたは複数の係数すなわちパラメータを決定するよう動作できる処理手段と、
(b)前記パラメータ・データおよびまたステップ(a)で決定された前記一つまたは複数の係数を使って、さらなる処理によってエンコーダによって生成された出力信号のもとになった入力信号の表現を実質的に再生成するために、出力データ中にエンコードされている各入力信号の近似表現を計算する計算手段、
とを有することを特徴とするマルチチャンネル・デコーダ。
〔請求項12〕
請求項11記載のマルチチャンネル・デコーダでの使用のための信号プロセッサであって、入力信号の表現を再生成することに関係してデータを処理することにおいて支援するよう動作しうることを特徴とする信号プロセッサ。
〔請求項13〕
マルチチャンネル・デコーダにおいて、請求項1記載のマルチチャンネル・エンコーダによって生成されたような形のエンコードデータを復号する方法であって:
(a)エンコードデータ中に存在するパラメータ用データとともにダウンミックス出力信号を処理し、その際、前記パラメータ用データを一つまたは複数の係数すなわちパラメータを予測するために利用し、
(b)前記パラメータ・データおよびまたステップ(a)で決定された前記一つまたは複数の係数を使って、さらなる処理によってエンコーダによって生成されたエンコードデータのもとになった入力信号の表現を実質的に再生成するために、エンコードデータ中にエンコードされた各入力信号の近似表現を計算する、
ステップを含むことを特徴とする方法。

Claims (7)

  1. 少なくとも第一の左側デジタル・オーディオ信号成分、第二の右側デジタル・オーディオ信号成分および第三のデジタル・オーディオ信号成分を含むNチャネルのデジタル・オーディオ信号をエンコードする装置であって、N>2であり、当該装置が:
    ・前記第一、第二および第三のデジタル・オーディオ信号成分を受け取り、これから少なくとも第一および第二の合成デジタル・オーディオ信号を導出するマトリクス処理ユニットであって、前記第一の合成デジタル・オーディオ信号は少なくとも前記第一および第三のデジタル・オーディオ信号成分の線形結合であり、前記第二の合成デジタル・オーディオ信号は少なくとも前記第二および第三のデジタル・オーディオ信号成分の線形結合である、マトリクス処理ユニットと、
    ・少なくとも前記第一および第二の合成デジタル・オーディオ信号からパラメータ信号を導出する手段と;
    ・前記第一および第二の合成デジタル・オーディオ信号ならびに前記パラメータ信号を伝送信号に組み合わせる信号組み合わせユニットとを有しており
    前記パラメータ信号が、前記第一および第二の合成デジタル・オーディオ信号から第三の合成デジタル・オーディオ信号成分の予測を生成することを許容する、
    装置。
  2. 記第三の合成デジタル・オーディオ信号は前記第一、第二および第三のデジタル・オーディオ信号成分の線形結合である、請求項1記載の装置。
  3. 前記信号組み合わせユニットが前記伝送信号の生成を、前記第三の合成デジタル・オーディオ信号成分と前記第三の合成デジタル・オーディオ信号成分の前記予測との間の差を表す差信号がないように行うよう適応されている、請求項2記載の装置。
  4. 第一および第二の合成デジタル・オーディオ信号ならびに少なくとも前記第一および第二の合成デジタル・オーディオ信号から導出されたパラメータ信号を含む伝送信号を、少なくとも第一の左側デジタル・オーディオ信号成分、第二の右側デジタル・オーディオ信号成分および第三のデジタル・オーディオ信号成分を含むNチャネルのデジタル・オーディオ信号に復号する装置であって、N>2であり、当該復号装置が:
    ・前記伝送信号を受け取る入力ユニットと、
    ・前記伝送信号から前記第一および第二の合成デジタル・オーディオ信号および前記パラメータ信号を取り出すデマルチプレクサ・ユニットと、
    ・前記第一および第二の合成デジタル・オーディオ信号を受け取ってそこから、前記パラメータ信号に応じて、前記少なくとも第一、第二および第三のデジタル・オーディオ信号成分を導出する逆マトリクス処理ユニットとを有しており、
    前記少なくとも第一、第二および第三のデジタル・オーディオ信号成分は前記第一および第二の合成デジタル・オーディオ信号のマトリクス処理係数を使った線形結合であり、前記マトリクス処理係数のうち少なくとも一部の係数の値は前記パラメータ信号によって制御できる、
    装置。
  5. 請求項4記載の装置であって、前記逆マトリクス処理ユニットが:
    ・前記第一および第二の合成デジタル・オーディオ信号および前記パラメータ信号から第三の合成デジタル・オーディオ信号を生成するよう適応された第一の回路部分であって、前記第三の合成デジタル・オーディオ信号は前記第一および第二の合成デジタル・オーディオ信号の、第一の逆マトリクス処理係数を使った線形結合であり、前記係数の値は前記パラメータ信号によって制御可能である、第一の回路部分と、
    ・前記第一、第二および第三の合成デジタル・オーディオ信号から第二の逆マトリクス処理係数を使って前記少なくとも第一、第二および第三のデジタル・オーディオ信号成分を生成する第二の回路部分と、
    ・前記少なくとも第一、第二および第三のデジタル・オーディオ信号成分は前記第一、第二および第三の合成デジタル・オーディオ信号の線形結合であり、前記第二の逆マトリクス処理係数は前記パラメータ信号に依存しない、
    装置。
  6. 請求項4記載の装置であって、前記合成デジタル・オーディオ信号は部分信号に分割され、複数の周波数帯のそれぞれに一つの部分信号とされ、前記パラメータ信号もパラメータ部分信号に分割され、前記複数の周波数帯のそれぞれに一つのパラメータ部分信号とされ、
    前記逆マトリクス処理ユニットは、前記第一および第二の合成デジタル・オーディオ信号の対応する部分信号から、前記パラメータ信号の前記対応するパラメータ部分信号に応じて、前記少なくとも第一、第二および第三の広帯域デジタル・オーディオ信号成分の対応する部分信号を導出するよう適応されており、
    当該装置がさらに、前記第一、第二および第三の広帯域デジタル・オーディオ信号の部分信号を前記広帯域デジタル・オーディオ信号成分に変換する変換ユニットを有する、
    装置。
  7. 請求項6記載の装置であって、前記部分信号が相続く時間信号に分割され、時間領域において相続く時間区間のそれぞれについて一つの時間信号とされ、前記パラメータ部分信号も前記相続く時間区間のそれぞれについてのパラメータ部分信号に分割され、
    前記逆マトリクス処理ユニットは、ある周波数帯域において前記相続く時間区間について、前記周波数帯域における前記第一および第二の合成デジタル・オーディオ信号の対応する部分信号の相続く時間信号から、前記相続く時間区間についての前記対応するパラメータ部分信号に応じて、前記周波数帯域における前記少なくとも第一、第二および第三の広帯域デジタル・オーディオ信号成分の対応する部分信号の時間信号をさらに導出するよう適応されている、
    装置。
JP2011124944A 2004-04-05 2011-06-03 マルチチャンネル・エンコーダ Active JP5539926B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405.1 2004-04-05
EP04102862 2004-06-22
EP04102862.2 2004-06-22

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007506878A Division JP4938648B2 (ja) 2004-04-05 2005-03-25 マルチチャンネル・エンコーダ

Publications (2)

Publication Number Publication Date
JP2011209745A JP2011209745A (ja) 2011-10-20
JP5539926B2 true JP5539926B2 (ja) 2014-07-02

Family

ID=34962080

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007506878A Active JP4938648B2 (ja) 2004-04-05 2005-03-25 マルチチャンネル・エンコーダ
JP2011124944A Active JP5539926B2 (ja) 2004-04-05 2011-06-03 マルチチャンネル・エンコーダ

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007506878A Active JP4938648B2 (ja) 2004-04-05 2005-03-25 マルチチャンネル・エンコーダ

Country Status (10)

Country Link
US (2) US7813513B2 (ja)
EP (3) EP1895512A3 (ja)
JP (2) JP4938648B2 (ja)
KR (1) KR101135869B1 (ja)
CN (1) CN1938760B (ja)
BR (1) BRPI0509100B1 (ja)
MX (1) MXPA06011359A (ja)
RU (1) RU2382419C2 (ja)
TW (1) TWI380286B (ja)
WO (1) WO2005098824A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7813513B2 (en) * 2004-04-05 2010-10-12 Koninklijke Philips Electronics N.V. Multi-channel encoder
CN101617360B (zh) 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
SG175632A1 (en) * 2006-10-16 2011-11-28 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
BRPI1009467B1 (pt) 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US8942989B2 (en) 2009-12-28 2015-01-27 Panasonic Intellectual Property Corporation Of America Speech coding of principal-component channels for deleting redundant inter-channel parameters
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
RU2551792C2 (ru) * 2010-06-02 2015-05-27 Конинклейке Филипс Электроникс Н.В. Система и способ для обработки звука
BR112013004362B1 (pt) * 2010-08-25 2020-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
SG193237A1 (en) 2011-03-28 2013-10-30 Dolby Lab Licensing Corp Reduced complexity transform for a low-frequency-effects channel
JP5930441B2 (ja) 2012-02-14 2016-06-08 ホアウェイ・テクノロジーズ・カンパニー・リミテッド マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置
EP2733965A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR102033304B1 (ko) * 2013-05-24 2019-10-17 돌비 인터네셔널 에이비 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
ES2640815T3 (es) 2013-05-24 2017-11-06 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6212645B2 (ja) * 2013-09-12 2017-10-11 ドルビー・インターナショナル・アーベー オーディオ・デコード・システムおよびオーディオ・エンコード・システム
US9756448B2 (en) 2014-04-01 2017-09-05 Dolby International Ab Efficient coding of audio scenes comprising audio objects

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69428939T2 (de) * 1993-06-22 2002-04-04 Deutsche Thomson-Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
JP3342001B2 (ja) * 1998-10-13 2002-11-05 日本ビクター株式会社 記録媒体、音声復号装置
DK1173925T3 (da) * 1999-04-07 2004-03-29 Dolby Lab Licensing Corp Matriksforbedringer til tabsfri kodning og dekodning
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
CN100429960C (zh) * 2000-07-19 2008-10-29 皇家菲利浦电子有限公司 用于获得立体声环绕和/或音频中心信号的多声道立体声转换器
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
US20050141722A1 (en) * 2002-04-05 2005-06-30 Koninklijke Philips Electronics N.V. Signal processing
EP1500084B1 (en) * 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
CN1284319C (zh) * 2002-04-22 2006-11-08 西安大唐电信有限公司 一种多通道amr声码器的实现方法和设备
AU2003244932A1 (en) 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7813513B2 (en) * 2004-04-05 2010-10-12 Koninklijke Philips Electronics N.V. Multi-channel encoder

Also Published As

Publication number Publication date
KR101135869B1 (ko) 2012-04-19
RU2006139082A (ru) 2008-05-20
EP1895512A2 (en) 2008-03-05
US7813513B2 (en) 2010-10-12
JP4938648B2 (ja) 2012-05-23
EP1895512A3 (en) 2014-09-17
BRPI0509100A (pt) 2007-08-28
JP2011209745A (ja) 2011-10-20
EP1735777A1 (en) 2006-12-27
MXPA06011359A (es) 2007-01-16
KR20070001206A (ko) 2007-01-03
JP2007531914A (ja) 2007-11-08
EP3573055B1 (en) 2022-03-23
CN1938760A (zh) 2007-03-28
TW200612392A (en) 2006-04-16
BRPI0509100B1 (pt) 2018-11-06
WO2005098824A1 (en) 2005-10-20
US20070239442A1 (en) 2007-10-11
US20110040398A1 (en) 2011-02-17
CN1938760B (zh) 2012-05-23
US8065136B2 (en) 2011-11-22
TWI380286B (en) 2012-12-21
RU2382419C2 (ru) 2010-02-20
EP3573055A1 (en) 2019-11-27

Similar Documents

Publication Publication Date Title
JP5539926B2 (ja) マルチチャンネル・エンコーダ
JP5455647B2 (ja) オーディオデコーダ
JP5032977B2 (ja) マルチチャンネル・エンコーダ
KR101346120B1 (ko) 오디오 인코딩 및 디코딩
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
AU2007300810B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
US20080255859A1 (en) Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US20090204397A1 (en) Linear predictive coding of an audio signal
EP0990368A1 (en) Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
MX2007014570A (es) Codificacion predictiva de una senal de canales multiples.
KR20240038819A (ko) 오디오 인코더 및 디코더
RU2803142C1 (ru) Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130924

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20131002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140408

R150 Certificate of patent or registration of utility model

Ref document number: 5539926

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140501

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250