JP5032977B2 - マルチチャンネル・エンコーダ - Google Patents

マルチチャンネル・エンコーダ Download PDF

Info

Publication number
JP5032977B2
JP5032977B2 JP2007506877A JP2007506877A JP5032977B2 JP 5032977 B2 JP5032977 B2 JP 5032977B2 JP 2007506877 A JP2007506877 A JP 2007506877A JP 2007506877 A JP2007506877 A JP 2007506877A JP 5032977 B2 JP5032977 B2 JP 5032977B2
Authority
JP
Japan
Prior art keywords
signal
channel
channels
encoder
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007506877A
Other languages
English (en)
Other versions
JP2007531913A (ja
Inventor
イェー ブレーバールト,ディルク
ヘー ペー スハイエルス,エリク
ハー ホトー,ヘラルド
ローン,マヒール ウェー ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007531913A publication Critical patent/JP2007531913A/ja
Application granted granted Critical
Publication of JP5032977B2 publication Critical patent/JP5032977B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Description

本発明は、マルチチャンネル・エンコーダ、たとえば空間音響のパラメータ式の記述を利用したマルチチャンネル・オーディオエンコーダに関する。さらに、本発明はそのようなマルチチャンネル・エンコーダにおいて信号、たとえば空間音響信号を処理する方法にも関する。さらに、本発明は、そのようなマルチチャンネル・エンコーダによって生成される信号を復号するよう動作できるデコーダに関する。
オーディオの録音および再生は近年、モノラルの単一チャンネル形式から二チャンネルのステレオ形式に、より最近には多チャンネル形式、たとえばホームシアターシステムにおいてしばしば使われるような5チャンネルのオーディオ形式へと発達してきた。スーパーオーディオ・コンパクトディスク(SACD: super audio compact disk)およびデジタル多用途ディスク(DVD: digital versatile disc)のデータ担体が導入された結果、そのような5チャンネルのオーディオ再生が現在関心を得てきている。多くのユーザーは現在、家庭で5チャンネルのオーディオ再生を提供できる装置を所有している。それに応じて、好適なデータ担体上の5チャンネルのオーディオ・プログラム・コンテンツがますます手にはいるようになっている。たとえば、前述したSACDおよびDVDの型のデータ担体である。多チャンネルのプログラム・コンテンツへの関心の高まりのため、多チャンネルのオーディオ・プログラム・コンテンツのより効率的な符号化、たとえば音質向上、再生時間延長あるいはチャンネル増といったことの一つまたは複数を提供することが重要な課題となりつつある。
パラメータ式の記述子によってオーディオ・プログラム・コンテンツなどのための空間音響情報を表現できるエンコーダは既知である。たとえば、公開されている国際PCT特許出願第PCT/IB2003/002858(WO2004/008805)では、少なくとも第一の信号成分(LF)、第二の信号成分(LR)および第三の信号成分(RF)を含む多チャンネルオーディオ信号のエンコードが記載されている。この符号化は:
(a)第一のパラメータ式エンコーダを使って第一のエンコード信号(L)およびエンコードパラメータの第一の組(P2)を生成することによって前記第一および第二の信号成分をエンコードし、
(b)第二のパラメータ式エンコーダを使って第二のエンコード信号(T)およびエンコードパラメータの第二の組(P1)を生成することによって前記第一のエンコード信号およびさらなる信号(R)をエンコードし、ここで、前記さらなる信号(R)は少なくとも前記第三の信号成分(RF)から導かれるものであり、
(c)少なくとも前記第二のエンコード信号(T)、エンコードパラメータの前記第一の組(P2)およびエンコードパラメータの前記第二の組(P1)から導かれる、結果として得られるエンコード信号(T)に少なくともよって、前記多チャンネルオーディオ信号を表現する、
ステップを有する方法を利用している。
オーディオ信号を記述する量子化されたパラメータを伝送するには比較的少ない伝送容量しか必要でないことが示されたため、オーディオ信号のパラメータ式の記述は、近年関心を得ている。これらの量子化されたパラメータは、対応するもともとのオーディオ信号から知覚的に著しく異なりはしないオーディオ信号を再生成するために、デコーダ内で受信され、処理されることができる。
現代のマルチチャンネル・エンコーダが出力するエンコードデータのビットレートは、出力エンコードデータにおいて伝達されるオーディオチャンネル数について実質的に線形にスケールする。そのような特性のため、追加チャンネルを含めることには問題がある。所与のデータ担体記憶容量について、チャンネル増を受け入れるために再生継続時間またはオーディオ表現の品質が相応して犠牲にされなければならなくなるからである。
本発明の目的は、マルチチャンネル・データコンテンツ、たとえばマルチチャンネルのオーディオ・データコンテンツのより効率的なエンコードを提供するよう動作しうる、マルチチャンネル・エンコーダを提供することである。
本発明人らは、適切なエンコード方法の使用により、2チャンネルのオーディオ・プログラム・コンテンツ、すなわちステレオを伝達するのに従来必要とされていたビットレートを使いながら、出力されるエンコードデータが、たとえば5チャンネルのオーディオ・プログラム・コンテンツに対応する情報を伝達できるということを認識するに至った。
よって、本発明の第一の側面によれば、MとNを整数、NがMより大きいとして、N個の入力チャンネルで伝達される入力信号を処理してM個の出力チャネルで伝達される対応する出力信号をパラメータ・データとともに生成するよう構成されたマルチチャンネル・エンコーダであって:
(a)入力信号をダウンミックスして対応する出力信号を生成するダウンミキサと、
(b)ダウンミックスの間に、あるいは別個のプロセスとして前記入力信号を処理して、前記出力信号と相補的な前記パラメータ・データを生成するよう動作しうる解析器であって、該パラメータ・データが前記入力信号のN個のチャンネルの間の相互の差を記述して復号の際に前記M個のチャンネルの出力信号から前記N個のチャンネルの入力信号の一つまたは複数を再生成することを実質的に許容するようにするものであり、前記出力信号は過去のものとの互換性(backwards compatibility)を可能にするためにN個またはN個より少ない出力チャンネルを提供するデコーダでの再生にも互換な形であるような解析器とを含むことを特徴とする、エンコーダが提供される。
本発明は、前記マルチチャンネル・エンコーダがマルチチャンネル入力信号を、たとえば2チャンネルステレオ再生装置と互換にされることができる出力ストリームに、より効率的にエンコードできるという点で有利である。
対応するデコーダの以前の型に対する当該エンコーダのそのような上位互換性は、3つの方法で提供される:
(a)エンコーダからの出力ダウンミックス信号は、該信号の、すなわち追加的な処理や復号のない再生の結果として、対応する限られた数のスピーカーの限界を考えれば、たとえば5チャンネルの空間像のよい近似である空間的像が生じるように生成される;
(b)ダウンミックス信号に付随する空間的パラメータはビットストリームの補助データ部分に置かれる。補助データ部分を復号できないデコーダでも伝送された信号を復号することはできる。この属性が過去のものとの復号の互換性を保証する;
(c)ビットストリームおよびデコーダ構造の前記補助部分に保存されたパラメータは、パラメータ式デコーダが適切な2チャンネル、3チャンネルおよび4チャンネルの信号を再生できるように定式化される。
好ましくは、当該エンコーダにおいて、前記解析器は、時間領域から周波数領域への変換により入力信号を変換するための、および該変換された入力信号を処理して前記パラメータ・データを生成するための処理手段を含む。入力信号の周波数領域での処理は、当該エンコーダ内での効率的なエンコードを提供するのに有益である。より好ましくは、当該エンコーダにおいて、前記ダウンミキサおよび解析器の少なくとも一つは入力信号を時間‐周波数タイルのシーケンスとして処理して出力信号を生成するよう構成される。
好ましくは、当該エンコーダにおいて、前記タイルは互いに重なり合う解析窓の変換によって得られる。そのような重なり合いは、出力信号がその後復号されて入力信号の表現を再生成する際に、よりよい連続性を、よってエンコードの人工効果(アーチファクト)の低減を許容する。
好ましくは、当該エンコーダは、入力信号を処理してM個の出力信号に含めるためのM個の中間オーディオデータ・チャンネルを生成する符号器を含み、前記解析器は前記パラメータ・データ中で:
(a)チャンネル間の入力信号のパワー比または対数レベル差;
(b)入力信号どうしの間のチャンネル間コヒーレンス;
(c)一つまたは複数のチャンネルの入力信号と一つまたは複数のチャンネルの入力信号のパワーの和との間のパワー比;
(d)信号対の間の位相差または時間差、
のうちの少なくとも一つに関係する情報を出力するよう構成される。より好ましくは、(d)の位相差は平均位相差である。
好ましくは、当該エンコーダにおいて、位相差、コヒーレンスデータおよびパワー比のうちの少なくとも一つの計算に続いて出力信号を生成するために主成分解析(PCA: principal component analysis)および/またはチャンネル間位相整列が行われる。
好ましくは、入力データが再生成されるときにもともとの入力信号により近くなるようにするために、当該エンコーダにおいて、N個のチャンネルで伝達される入力信号の少なくとも一つが効果チャンネルに対応する。
好ましくは、当該エンコーダは、出力信号を、従来式再生システムを使った再生に好適な形で生成するよう適応される。
本発明の第二の側面によれば、MとNを整数、NがMより大きいとして、マルチチャンネル・エンコーダにおいてN個の入力チャンネルで伝達される入力信号をエンコードしてM個の出力チャネルにおいて伝達される対応する出力信号をパラメータ・データとともに生成する方法であって:
(a)入力信号をダウンミックスして前記対応する出力信号を生成し、
(b)解析器においてダウンミックスの際に、あるいは別個に前記入力信号を処理して、前記出力信号と相補的な前記パラメータ・データを提供するステップを含んでおり、該パラメータ・データが前記入力信号のN個のチャンネルの間の相互の差を記述して復号の際に前記M個のチャンネルの出力信号から前記N個のチャンネルの入力信号の再生成を実質的に許容するようにするものであり、前記出力信号はN個またはN個より少ない出力チャンネルを提供するデコーダでの再生に互換な形であることを特徴とする方法。
好ましくは、当該方法は、5チャンネルに対応する入力信号をエンコードして、対応する2チャンネルステレオデコーダ、3チャンネルデコーダおよび4チャンネルデコーダのうちの一つまたは複数と互換な形で出力信号およびパラメータ・データを生成するよう適応される。
好ましくは、当該方法において、前記処理は、時間領域から周波数領域への変換により入力信号を変換することを含む。
好ましくは、当該方法において、入力信号の少なくとも一つが、出力信号を生成するために時間‐周波数タイルのシーケンスとして処理される。
好ましくは、当該方法において、前記タイルは互いに重なり合う解析窓に対応する。
好ましくは、当該方法は、入力信号を処理して出力信号に含めるためのM個の中間オーディオデータ・チャンネルを生成する符号器を使用するステップを含み、前記符号器は前記パラメータ・データ中で:
(a)チャンネル間の入力信号のパワー比または対数レベル差;
(b)入力信号どうしの間のチャンネル間コヒーレンス;
(c)一つまたは複数のチャンネルの入力信号と一つまたは複数のチャンネルの入力信号のパワーの和との間のパワー比;
(d)信号対の間の位相差または時間差、
のうちの少なくとも一つに関係する情報を出力するよう構成される。より好ましくは、(d)の位相差は平均位相差である。
好ましくは、当該方法において、レベル差、コヒーレンスデータおよびパワー比のうちの少なくとも一つの計算に続いて出力信号を生成するために主成分解析(PCA: principal component analysis)および/または位相整列が行われる。
好ましくは、当該方法において、N個のチャンネルで伝達される入力信号の少なくとも一つが効果チャンネルに対応する。
本発明の第三の側面によれば、本発明の第二の側面に基づく方法を使って生成される、データ担体上に保存される、エンコードされたデータ・コンテンツが提供される。
本発明の第四の側面によれば、本発明の第一の側面に基づくエンコーダによって生成されるようなエンコードされた出力データを復号するよう動作できるデコーダであって、前記エンコードされた出力データは、MとNを整数、M<Nとして、Nチャンネルの入力信号からのMチャンネルおよび付随するパラメータ・データを有し、当該デコーダが:
(a)前記エンコードされた出力データを受け取り、それを時間領域から周波数領域に変換するための;
(b)周波数領域において前記パラメータ・データを適用して、M個のチャンネルから前記エンコードされた出力データには直接含まれていない、または省略されているN個のチャンネルのうちの一つまたは複数の入力信号に対応する再生成データ・コンテンツを再生成するため、M個のチャンネルからのコンテンツを抽出するための;および、
(c)当該デコーダの一つまたは複数の出力においてNチャンネルの再生成された入力信号の一つまたは複数を出力するために前記再生成データ・コンテンツを処理するための、
プロセッサを含むことを特徴とするデコーダが提供される。
好ましくは、当該デコーダにおいて、前記プロセッサは、全域通過の脱相関フィルタを適用して、当該デコーダにおいてNチャンネルの前記一つまたは複数の入力信号を再生成する際に使用するための脱相関されたバージョンの信号を得るよう動作しうる。
好ましくは、当該デコーダにおいて、前記プロセッサは、当該デコーダにおいてNチャンネルの前記一つまたは複数の入力信号を再生成するために、Mチャンネルの信号およびその脱相関バージョンをその構成成分に分割するために逆エンコーダ回転を適用するよう動作しうる。
本発明の諸特徴は、本発明の範囲から外れることなくいかなる組み合わせにおいても組み合わせうることは理解されるであろう。
本発明の実施形態について、これからあくまでも例として、付属の図面を参照しつつ説明する。
Nチャンネルの入力データを与えられ、該入力データをエンコードして対応するエンコードされた出力データストリームを生成するよう構成されたマルチチャンネル・エンコーダ内で実行されるエンコードを改良するために、本発明人らは、当該エンコーダが:
(a)Nチャンネルの入力信号をダウンミックスしてM<NであるようなMチャンネルにし、
(b)前記出力データストリームを生成する際に、前記Mチャンネルのデータと組み合わせるための比較的小さな量のパラメータ・オーバーヘッド・データを生成するよう動作でき、該パラメータ・データが前記出力データストリームを供給されるその後のデコーダにおいて前記Nチャンネルに対応するデータの再構築を可能にするよう構築される、
ことが有益であることを構想するに至った。
たとえば、前記マルチチャンネル・エンコーダは好ましくは5チャンネル・エンコーダである、すなわちN=5である。該5チャンネル・エンコーダは、5つの入力チャンネルに対応するデータをダウンミックスして2チャンネルの、すなわちM=2の中間チャンネルを生成するよう構成される。さらに、前記5チャンネル・エンコーダは、前記出力データストリームを生成するために前記2チャンネルのデータと組み合わせるための付随するパラメータ・オーバーヘッド・データを生成するよう動作しうる。前記パラメータ・データは、デコーダが5つの入力チャンネルの表現を再構築できるようにするのに十分である。前記デコーダは、N=2, 3, 4の状況をサポートするよう上位互換である、すなわち2チャンネル、3チャンネルおよび4チャンネルの出力状況に対して上位互換であることができることにおいて有益である。
本発明のある好ましい実施形態においては、エンコーダがN個の入力データチャンネルを処理するよう動作可能である。N個の入力チャンネルは好ましくは中央オーディオデータ・チャンネル、左前方オーディオデータ・チャンネル、左後方オーディオデータ・チャンネル、右前方オーディオデータ・チャンネル、右後方オーディオデータ・チャンネルに対応し、該5つのチャンネルは、ホームシアター型のプログラム・コンテンツ再生に適切な見かけ上三次元の音の分布を創り出すことができる。N個の入力データチャンネルはダウンミックスされて、たとえば現代のステレオオーディオ符号器を使ってエンコードされた2つの中間オーディオデータ・チャンネルにされる。前記符号器は、左前方および左後方のデータチャンネルの主成分解析および/または位相整列を有益に用いる。当該エンコーダはまた、右前方および右後方の入力チャンネルに対する、別個の主成分解析および/または位相整列を用いるようにも構成される。さらに、当該エンコーダは:
(a)左前方および左後方のデータチャンネルの間のチャンネル間レベル差:
(b)右前方および右後方のデータチャンネルの間のチャンネル間レベル差:
(c)左前方および左後方のチャンネルに関係するチャンネル間コヒーレンスデータ;
(d)右前方および右後方のデータチャンネルに関係するチャンネル間コヒーレンスデータ;および
(e)中央データチャンネルと、左前方、左後方、右前方、右後方のデータチャンネルのパワーの和との間のパワー比、
に関係する情報を含むパラメータ・オーバーヘッド・データを生成するよう動作しうる。
前記2つの中間データチャンネルおよびパラメータ・オーバーヘッド・データは組み合わされて、当該エンコーダからのエンコードされた出力データを生成する。任意的に、左前方および左後方データチャンネルの間の、ならびに右前方および右後方データチャンネルの間のチャンネル間位相差および好ましくは全体としての位相差に関係するデータが当該エンコーダからの前記エンコードされた出力データに含められる。本発明のこの実施例に関して(a)ないし(e)において実行されるパラメータ解析は、好ましくは時間および周波数解析を含む。より好ましくは、前記解析は、のちにさらに解説されるような時間‐周波数タイルによって実行される。
本発明の好ましい実施形態における当該エンコーダの動作についてこれからより詳細に、関連する数学的関数を使って、図1を参照しつつ説明する。図1の諸部分および信号の定義は符号の説明で与えられるとおりである。
図1では、全体として10と示されるエンコーダが示されている。エンコーダ10は第一、第二および第三の入力チャンネル、それぞれ20、30、40を有する。これら3つのチャンネル20、30、40のそれぞれからの出力信号380、400、440、すなわちLI、CI、RIは、混合およびパラメータ抽出ユニット200に結合される。抽出ユニット200は付随する右前出力信号460および左前出力信号470、すなわちPRout、PLoutを有しており、これらはそれぞれエンコードされた右および左の出力信号480、490すなわちRout、Loutを生成するために、逆変換およびOLAユニット210に接続されている。
第一のチャンネル20は、左前方および左後方の入力信号、それぞれ300、310すなわちSlf、Slrを受け取る、セグメント分割および変換ユニット100を含んでいる。対応する左前方および左後方の変換信号350、360すなわちTSlf、TSlrは、チャンネル20のダウンミックス・ユニット130に、そしてまたチャンネル20のパラメータ解析ユニット110に結合されている。第一のパラメータセット信号370すなわちPS1は、パラメータ‐ダウンミックス・ベクトル変換ユニット120の入力に結合され、その対応する出力はダウンミックス・ユニット130に結合される。
第二のチャンネル30は、中央入力信号320すなわちScを受け取るよう構成されたセグメント分割および変換ユニット140を含んでいる。中央中間信号400すなわちCIは、該変換ユニット140から前述したパラメータ抽出ユニット200へと結合される。
第三のチャンネル40は、右前方および右後方の入力信号、それぞれ330、340すなわちSrf、Srrを受け取る、セグメント分割および変換ユニット150を含んでいる。対応する右前方および右後方の変換信号410、420すなわちTSrf、TSrrは、チャンネル40のダウンミックス・ユニット180に、そしてまたチャンネル40のパラメータ解析ユニット160に結合されている。第二のパラメータセット信号430すなわちPS2は、パラメータ‐ダウンミックス・ベクトル変換ユニット170の入力に結合され、その対応する出力はダウンミックス・ユニット180に結合される。
パラメータ抽出ユニット200はチャンネル20、30、40からの信号380、400、440を受け取って第三のパラメータセット出力450すなわちPS3ならびにOLAユニット210のための前出力信号470、460すなわちPRout、PLoutを生成するよう構成されている。
エンコーダ10は専用ハードウェアで実装されうる。あるいはまた、エンコーダ10は、該エンコーダ10の処理機能を実装するためのソフトウェアを実行するよう構成されたコンピュータハードウェアをベースとしていてもよい。さらなる代替としては、エンコーダ10は、ソフトウェア制御のもとで動作するコンピュータハードウェアに結合された専用ハードウェアの組み合わせによって実装されることもできる。
エンコーダ10の動作について、これから図1を参照しつつ説明する。信号Slf[n]、Slr[n]、Srf[n]、Srr[n]、Sc[n]はそれぞれ左前方、左後方、右前方、右後方および中央のオーディオ信号についての離散的な時間的波形を記述する。チャンネル20、30、40において、これら5つの信号は共通のセグメント分割を使って、好ましくは重なり合う解析窓を使ってセグメント分割される。その後、各セグメントは複素変換、たとえばフーリエ変換または等価な型の変換を使って時間領域から周波数領域に変換される。あるいはまた、たとえばハードウェアまたはソフトウェアシミュレーションの少なくとも一つを使って実装される複素フィルタバンク構造を、時間/周波数タイルを得るために用いてもよい。そのような信号処理は、周波数領域における入力信号のセグメント分割されたサブバンド表現を生じる。これをLf[k]、Lr[k]、Rf[k]、Rr[k]、C[k]で表す。ここで、パラメータkは周波数の添え字を表し、Lは左、Rは右、fは前方、rは後方、Cは中央を表す。
パラメータ抽出ユニット200において、第一のステップで、左前方および左後方信号の間の関連パラメータを推定するデータ処理が実行される。これらのパラメータは、レベル差IIDL、位相差IPDLおよびコヒーレンスICCLを含む。好ましくは、位相差IPDLは平均位相差に対応する。さらに、これらのパラメータIIDL、IPDLおよびICCLは式1ないし3に与えられるように計算される。
Figure 0005032977
ここで、アステリスク記号は複素共役を表す。
式1ないし3によって記述されるプロセスは、右前方および右後方信号についても繰り返され、そのような処理は、それぞれレベル差、位相差およびコヒーレンスに関係する対応するパラメータIIDR、IPDRおよびICCRを生じる。
パラメータ‐ダウンミックス・ベクトル変換ユニット120においては、第二のステップで、左前方Lfおよび左後方Lrの2つの信号のダウンミックスのための複素重みを計算するデータ処理が実行される。好ましい実施形態では、ダウンミックス・ユニット130に送られるダウンミックス・ベクトルは、入力信号空間の回転αおよび/または複素位相整列を適用することによりダウンミックス信号Y[k]のエネルギーを最大化するよう構成される。
ダウンミックスは次のように適用される。2つの信号LfおよびLrを回転させて、主要信号Y[k]および対応する残差信号Q[k]を得る。使用される回転角αは、式4に示すような主要信号Y[k]のエネルギーを最大化するものである。
Figure 0005032977
ここで、角OPDLは全体としての位相回転角を表し、位相差IPDLは2つの信号Lf、Lrの最大限の位相整列を保証するよう計算される。回転角αは、式5および式6を使って抽出されるパラメータから計算可能である。
Figure 0005032977
式4からの信号Q[k]はその後、パラメータ抽出ユニット200において破棄され、信号Y[k]がスカラーβによってスケーリングされて、信号Q[k]のパワーに信号Y[k}のパワーを加えたものと同様のパワーを有するようにした信号L[k]が得られる。換言すれば、信号Q[k]は破棄されるが、それに伴う信号パワーの対応する損失は信号Y[k]をスケーリングすることにより補償されるのである。スカラーβは式7および8を使って計算可能である。
Figure 0005032977
前記の第一および第二のステップはまた、右前方および右後方の信号対についても繰り返され、対応する信号R[k]が生成される。PCA回転の使用は、回転角αについての固定値を使用することによって回避できることを注意しておく。
エンコーダ10内で実行される第三の処理ステップは、中央信号C[k]を信号L[k]およびR[k]の両方に混合することに関わるもので、結果としてそれぞれの前出力信号470、460、すなわちPLout、PRoutが生成される。そのような混合は式9に従って実行される。
Figure 0005032977
ここで、パラメータεは式9に関わる混合における信号C[k]の強さを決定する重みを表す。たとえば、典型的にはε=0.707である。好ましくは、L、C、Rのそれぞれの組み合わせは位相に関して整列させられる。そうでなければ位相打ち消しが起こることになる。
信号LおよびRのパワーに対する信号Cのパワーを記述するパラメータIIDCは式10から計算可能である。
Figure 0005032977
上述した第一、第二および第三のステップを有する以上のプロセスは、エンコーダ10において、各時間/周波数タイルについて繰り返される。
信号PLout[k]およびPRout[k]はその後、エンコーダにおいて、時間領域に変換され、重なり‐加算(overlap-add)式の和を使って以前の諸セグメントと組み合わされる。それによりそれぞれの前述の出力信号490、480、すなわちLout、Routが生成される。
エンコーダ10からの出力データは通信ネットワークによって、たとえばインターネットまたはその他の同様のブロードキャストネットワークを通じて通信されうる。
代替的または追加的に、出力データは、たとえばDVD光データディスクまたは他の同様の種類のデータ担持媒体のようなデータ担体によって運ばれることもできる。
エンコーダ10からの出力データは、エンコーダ10と互換なデコーダにおいて復号されることができる。その例が図3で全体として800と示したデコーダである。デコーダ800は、エンコーダ10、600から受け取られた出力信号480、490および付随するパラメータ・データ370、430、450、690をさまざまな数学的処理にかけ、対応する復号された出力信号(DOP: decoded output signals)を生成するデータ処理ユニット810を含んでいる。
上位互換性を提供するため、そのようなデコーダは少なくともステレオ、3チャンネルおよび5チャンネルの装置のうちの一つであることができる。エンコーダ10と互換なステレオ型のデコーダでは、すなわちデコーダ800がDOPとしてデコードされた出力を2つしか含んでいない場合、そのステレオ型のデコーダは2つの再生チャンネルをもっており、エンコーダ10によって与えられる信号Rout、Loutは、該ステレオ型のデコーダにおいて、2つの再生チャンネル上でさらなる処理が実行されることもなく再生される。
エンコーダ10と互換な3チャンネルのデコーダでは、デコーダは3つの再生チャンネルをもっており、すなわちデコーダ800はDOPとしてデコードされた出力を3つ含んでおり、たとえばDVD光ディスクのようなデータ担体から読み込まれた2つの信号Rout、Loutはセグメント分割され、次いで前述した周波数領域に変換される。次いで対応する再生成された信号L[k]、R[k]、C[k]が式11ないし16を使って導出される。
Figure 0005032977
次いでユーザー鑑賞のための3チャンネルのオーディオ信号が信号L[k]、R[k]、C[k]から前述したのと同様の仕方で導出される。
エンコーダ10と互換な5チャンネルのデコーダでは、すなわちデコーダ800がデコードされた出力を5つ含んでおり、前述したような3チャンネル再生再構築が用いられて、デコーダにおいて信号L[k]、R[k]、C[k]の再生成が生じる。5チャンネルのデコーダでは、さらなるステップが実行されるが、それは信号L[k]をその構成成分、すなわち前方左成分Lf[k]および後方左成分Lr[k]に分割することを含む。同様に、信号R[k]もその構成成分、すなわち前方右成分Rf[k]および後方右成分Rr[k]に分割される。そのような信号分割は、前述したエンコーダ10において実行される回転と相補的な逆エンコーダ回転演算を利用する。逆回転に必要とされる主要信号Y[k]および残差信号Q[k]は、式17および18を使って5ウェイ・デコーダにおいて導出される。
Figure 0005032977
ここで、パラメータμは先の式8においてすでに定義してある。式17では、H[k]は、信号L[k]の脱相関バージョンを得るための全域通過脱相関フィルタを表す。その後、信号Lf[k]およびLr[k]が、式19で記述される逆エンコーダ回転関数を使って生成される。
Figure 0005032977
同様の処理は右側のチャンネル成分にも適用される。
エンコーダ10と互換な4チャンネルのデコーダでは、該4チャンネルデコーダはまず、5つのチャンネルを、前述の5チャンネルのデコーダにおいて用いられるのと似た仕方で復号して5つのオーディオ信号Slf、Slr、Srf、Srr、Scを生成するよう動作しうる。その後、式20、21に基づく単純な混合が行われて、ユーザー鑑賞のための左前方および右前方のオーディオ信号Slf,再生およびSrf,再生が生成される。
Slf,再生=Slf+qSc (20)
Srf,再生=Srf+qSc (21)
ここで、係数q=0.707である。
係数qは、当該4チャンネルデコーダについて、単一の中央のスピーカーを通じた再生か、あるいは当該4チャンネルデコーダに結合された左前方および右前方のスピーカーによって生成されるユーザーのための見かけのファントム音源としての再生かに関わりなく、中央信号成分の全パワーが実質的に一定であることを保証する
以上に述べた本発明の諸実施形態が、付属の請求項によって定義される本発明の範囲から外れることなく修正されうることは理解されるであろう。
本発明人らは、エンコーダ10が効果チャンネル(LFE)、たとえば低周波効果チャンネルの符号化をサポートしないことを識別するに至った。そのようなLFEチャンネルは、たとえば、ホームシアターシステムなどにおいてユーザーに同時的に呈示される視覚情報に伴うことが有益である雷鳴情報または爆音情報のような音響効果情報を伝達するために有益である。こうして、本発明人らは、本発明のある実施形態においては、エンコーダ10を修正してその第二のチャンネル30を向上させ、それにより図2に描かれ、そこで全体として600と示されるようなエンコーダを生成することが有益であることを認識するに至った。任意的に、LFEチャンネルは実質的に120Hzという比較的制約された周波数帯域幅をもつ。ただし、選択的な比較的大きな帯域幅も受け入れることができる。
エンコーダ600は概してエンコーダ10と同様であるが、エンコーダ600の第二のチャンネル30はパラメータ解析ユニット630、パラメータ‐ダウンミックス・ベクトル・ユニット640およびダウンミックス・ユニット650を具備しており、これらは第一および第三のチャンネル20、40の対応するコンポーネントとそれぞれ同様の仕方で接続されている。エンコーダ600のチャンネル30は、第四のパラメータセット690すなわちPS4を出力するよう動作しうる。さらに、エンコーダ600の第二のチャンネル30は、低周波効果信号Slfeを受け取るための低周波効果(lfe: low frequency effects)入力610、そしてまた前述した中央信号Scを受け取るための入力620を含んでいる。好ましくは、信号Slfeの処理は可聴下周波から上へ120Hzの周波数帯域幅に制限され、よって潜在的には現代のサブウーファー型のスピーカーを駆動するために好適である。しかしながら、本発明の実施形態は、たとえばインパルス状の音に対応する高周波信号情報を提供するために、この第二のチャンネル30が120Hzよりずっと大きな帯域幅を有する実装もされうる。
低周波効果情報をエンコーダ600からの出力に含めることは、エンコーダ10に比較して追加的なパラメータの使用を必要とする。入力610に呈示される信号はエンコーダ600において解析され、対応する代表パラメータが決定され、それがエンコーダ10を通じて処理される前述の他のオーディオ信号と同様の仕方で時間/周波数タイルベースで解析される。対応するデコーダは好ましくは、たとえばホームシアターシステムにおいてオーディオ・サブウーファー・スピーカーを駆動するための増幅に好適な信号を再生成するため、低周波情報を復号するための追加的な機能を含むよう構成される。
付属の請求項において、括弧内に入れられた数字その他の記号があったとしても、それは請求項の理解を支援するために入れられているのであって、特許請求の範囲をいかなる仕方であれ限定することを意図したものではない。
「有する」「含む」「組み込む」「包含する」「である」「もつ」のような表現は、明細書および関連する請求項を解釈する際、非排他的仕方において解釈されるべきものである。すなわち、明示的に規定されていないその他の要素またはコンポーネントも存在することを許容するものと解釈される。単数形への言及は複数への言及であるとも解釈され、その逆もある。
本発明に基づく第一のマルチチャンネル・エンコーダの概略図である。 本発明に基づく、低周波効果などの効果のための備えを含む第二のマルチチャンネル・エンコーダの概略図である。 本発明に基づく、図1および図2のエンコーダと相補的であり、そのようなエンコーダから提供される出力データを復号できるマルチチャンネル・デコーダの概略図である。
符号の説明
10 エンコーダ
20 第一のチャンネル
30 第二のチャンネル
40 第三のチャンネル
100 セグメント分割および変換ユニット
110 パラメータ解析ユニット
120 パラメータ‐ダウンミックス・ベクトル変換ユニット
130 ダウンミックス・ユニット
140 セグメント分割および変換ユニット
150 セグメント分割および変換ユニット
160 パラメータ解析ユニット
170 パラメータ‐ダウンミックス・ベクトル変換ユニット
180 ダウンミックス・ユニット
200 混合およびパラメータ抽出ユニット
210 逆変換およびOLAユニット
300 左前方(left front)入力信号Slf
310 左後方(left rear)入力信号Slr
320 中央(central)信号Sc
330 右前方(right front)信号Srf
340 右後方(right rear)信号Srr
350 左前方変換信号(transformed signal)TSlf
360 左後方変換信号TSlr
370 第一のパラメータセット(parameter set)PS1
380 左中間(left intermediate)信号LI
400 中央中間(centre intermediate)信号CI
410 右前方変換信号TSrf
420 右後方変換信号TSrr
430 第二のパラメータセットPS2
440 右中間信号RI
450 第三のパラメータセットPS3
460 右前出力(pre-output)信号PRout
470 左前出力信号PLout
480 右出力信号Rout
490 左出力信号Lout

Claims (23)

  1. MとNを整数、NがMより大きいとして、N個の入力チャンネルで伝達されるオーディオ入力信号を処理してM個の出力チャンネルで伝達される対応する出力信号をパラメータ・データとともに生成するよう構成されたマルチチャンネル・エンコーダであって:
    (a)入力信号をダウンミックスして対応する出力信号を生成するダウンミキサと、
    (b)ダウンミックスのプロセスの一部またはダウンミックスとは別個のプロセスであるプロセスにおいて前記入力信号を処理して、前記出力信号と相補的な前記パラメータ・データを生成するよう動作しうる解析器であって、該パラメータ・データが前記入力信号のN個のチャンネルの間の相互の差を記述して復号の際に前記M個のチャンネルの出力信号から前記N個のチャンネルの入力信号の一つまたは複数を再生成することを実質的に許容するようにするものであり、前記出力信号はN個またはN個より少ない出力チャンネルを提供するデコーダでの再生にも互換な形であるような解析器とを含み、
    前記パラメータ・データは、中央チャンネル信号、右チャンネル信号および左チャンネル信号の二チャンネル・ダウンミックスのための前記右チャンネル信号および前記左チャンネル信号のパワーに対する前記中央チャンネル信号のパワーを記述する少なくとも一つのパラメータを含み、該少なくとも一つのパラメータは実質的に
    Figure 0005032977
    によって与えられ、ここで、C[k]は中央チャンネル信号Cのサンプルkを表し、R[k]は右チャンネル信号Rのサンプルkを表し、L[k]は左チャンネル信号Lのサンプルkを表し、εは二チャンネル・ダウンミックスにおける中央信号の強さを決定する重みを表す、
    ことを特徴とするエンコーダ。
  2. 対応する2チャンネルステレオデコーダ、3チャンネルデコーダおよび4チャンネルデコーダのうちの少なくとも一つと互換な形で前記出力信号およびパラメータ・データを生成するよう構成された5チャンネル・エンコーダであることを特徴とする、請求項1記載のエンコーダ。
  3. 前記解析器が、時間領域から周波数領域への変換によって入力信号を変換するための、および該変換された入力信号を処理して前記パラメータ・データを生成するための処理手段を含むことを特徴とする、請求項1記載のエンコーダ
  4. 前記ダウンミキサおよび前記解析器のうちの少なくとも一つが、前記出力信号を生成するために前記入力信号を時間‐周波数タイルのシーケンスとして処理するよう構成されていることを特徴とする、請求項3記載のエンコーダ。
  5. 前記タイルが互いに重なり合う解析窓の変換によって得られることを特徴とする、請求項4記載のエンコーダ。
  6. 請求項1記載のエンコーダであって、前記解析器が前記パラメータ・データ中で:
    (a)チャンネル間の入力信号のパワー比または対数レベル差;
    (b)入力信号どうしの間のチャンネル間コヒーレンス;
    (c)一つまたは複数のチャンネルの入力信号と一つまたは複数のチャンネルの入力信号のパワーの和との間のパワー比;および
    (d)信号対の間の位相差または時間差、
    のうちの少なくとも一つに関係する情報を出力するよう構成されることを特徴とするエンコーダ。
  7. 請求項6記載のエンコーダであって、(d)において前記位相差が平均位相差であることを特徴とするエンコーダ。
  8. 請求項6記載のエンコーダであって、位相差、コヒーレンスデータおよびパワー比のうちの少なくとも一つの計算に続いてM個の出力信号を生成するために主成分解析(PCA)および/またはチャンネル間位相整列が行われることを特徴とするエンコーダ。
  9. 前記N個のチャンネルで伝達される入力信号の少なくとも一つが効果チャンネルに対応することを特徴とする、請求項1記載のエンコーダ。
  10. 出力信号を、Mチャンネル・オーディオ信号用の再生システムを使った再生に適する形で生成するよう適応されていることを特徴とする、請求項1記載のエンコーダ。
  11. MとNを整数、NがMより大きいとして、マルチチャンネル・エンコーダにおいてN個のオーディオ入力チャンネルで伝達される入力信号をエンコードしてM個の出力チャンネルにおいて伝達される対応する出力信号をパラメータ・データとともに生成する方法であって:
    (a)入力信号をダウンミックスして前記対応する出力信号を生成し、
    (b)解析器においてダウンミックスの際に、あるいは別個に前記入力信号を処理して、前記出力信号と相補的な前記パラメータ・データを提供するステップを含んでおり、該パラメータ・データが前記入力信号のN個のチャンネルの間の相互の差を記述して復号の際に前記M個のチャンネルの出力信号から前記N個のチャンネルの入力信号の再生成を実質的に許容するようにするものであり、前記出力信号はN個またはN個より少ないチャンネルを提供するデコーダでの再生に互換な形であり、
    前記パラメータ・データは、中央チャンネル信号、右チャンネル信号および左チャンネル信号の二チャンネル・ダウンミックスのための前記右チャンネル信号および前記左チャンネル信号のパワーに対する前記中央チャンネル信号のパワーを記述する少なくとも一つのパラメータを含み、該少なくとも一つのパラメータは実質的に
    Figure 0005032977
    によって与えられ、ここで、C[k]は中央チャンネル信号Cのサンプルkを表し、R[k]は右チャンネル信号Rのサンプルkを表し、L[k]は左チャンネル信号Lのサンプルkを表し、εは二チャンネル・ダウンミックスにおける中央信号の強さを決定する重みを表す、
    ことを特徴とする方法。
  12. 5チャンネルに対応する入力信号をエンコードして、対応する2チャンネルステレオデコーダ、3チャンネルデコーダおよび4チャンネルデコーダのうちの一つまたは複数と互換な形で出力信号およびパラメータ・データを生成するよう適応されていることを特徴とする、請求項11記載の方法。
  13. 前記処理が、時間領域から周波数領域への変換により入力信号を変換することを含むことを特徴とする、請求項11記載の方法。
  14. 入力信号の少なくとも一つが、出力信号を生成するために時間‐周波数タイルのシーケンスとして処理されることを特徴とする、請求項13記載の方法。
  15. 前記タイルが互いに重なり合う解析窓に対応することを特徴とする、請求項14記載の方法。
  16. 符号器を使用するステップを含み、前記符号器は前記パラメータ・データ中で:
    (a)チャンネル間の入力のパワー比または対数レベル差;
    (b)入力信号どうしの間のチャンネル間コヒーレンス;
    (c)一つまたは複数のチャンネルの入力信号と一つまたは複数のチャンネルの入力信号のパワーの和との間のパワー比;および
    (d)信号対の間の位相差または時間差、
    のうちの少なくとも一つに関係する情報を出力するよう構成されることを特徴とする、請求項11記載の方法。
  17. 前記位相差が平均位相差であることを特徴とする、請求項16記載の方法。
  18. 位相差、コヒーレンスデータおよびパワー比のうちの少なくとも一つの計算に続いて出力信号を生成するために主成分解析(PCA)および/またはチャンネル間位相整列が行われることを特徴とする、請求項16記載の方法。
  19. N個のチャンネルで伝達される入力信号の少なくとも一つが効果チャンネルに対応することを特徴とする、請求項11記載の方法。
  20. エンコーダによって生成されるエンコードされたオーディオ出力データを復号するよう動作できるデコーダであって、前記エンコードされた出力データは、MとNを整数、M<Nとして、N個のチャンネルの入力信号から生成されるM個のチャンネルおよび付随するパラメータ・データを有するものであり、前記M個のチャンネルは、前記N個のチャンネルのうち中央チャンネル信号、右チャンネル信号および左チャンネル信号の二チャンネル・ダウンミックスを含み、当該デコーダが:
    (a)前記エンコードされた出力データを受け取り、それを時間領域から周波数領域に変換するための;
    (b)周波数領域において前記パラメータ・データを適用して、前記M個のチャンネルから前記エンコードされた出力データには直接含まれていない、または省略されているN個のチャンネルのうちの一つまたは複数の入力信号に対応する再生成データ・コンテンツを再生成するため、前記M個のチャンネルからのコンテンツを抽出するための;および、
    (c)当該デコーダの一つまたは複数の出力においてN個のチャンネルの再生成された入力信号の一つまたは複数を出力するために前記再生成データ・コンテンツを処理するための、
    プロセッサを含み、前記プロセッサは、再生成された左チャネルL[k]、再生成された右チャネルR[k]および再生成された中央チャネルC[k]を
    Figure 0005032977
    として生成するよう構成されており、ここで、Loutは前記二チャンネル・ダウンミックスの左チャンネルであり、Routは前記二チャンネル・ダウンミックスの右チャンネルであり、wlcおよびwrcは前記パラメータ・データのチャンネル間レベル・パラメータに依存前記チャンネル間レベル・パラメータは前記右チャンネル信号および前記左チャンネル信号のパワーに対する前記中央チャンネル信号のパワーを記述し、実質的に
    Figure 0005032977
    によって与えられ、ここで、C[k]は中央チャンネル信号Cのサンプルkを表し、R[k]は右チャンネル信号Rのサンプルkを表し、L[k]は左チャンネル信号Lのサンプルkを表し、εは前記二チャンネル・ダウンミックスにおける中央信号の強さを決定する重みを表す、
    ことを特徴とするデコーダ。
  21. 前記プロセッサが、全域通過の脱相関フィルタを適用して、当該デコーダにおいてN個のチャンネルのうちの前記一つまたは複数の入力信号を再生成する際に使用するための脱相関されたバージョンの信号を得るよう動作しうることを特徴とする、請求項20記載のデコーダ。
  22. 前記プロセッサが、当該デコーダにおいてN個のチャンネルの前記一つまたは複数の入力信号を再生成するために、M個のチャンネルの信号およびその脱相関バージョンをその構成成分に分割するために逆エンコーダ回転を適用するよう動作しうることを特徴とする、請求項21記載のデコーダ。
  23. 請求項22記載のデコーダであって、当該デコーダにおいて受け取られた前記エンコードされた出力データのみから一つまたは複数のデコーダ出力を生成するよう動作しうることを特徴とするデコーダ。
JP2007506877A 2004-04-05 2005-03-25 マルチチャンネル・エンコーダ Active JP5032977B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405.1 2004-04-05
EP04102863 2004-06-22
EP04102863.0 2004-06-22
PCT/IB2005/051037 WO2005098821A2 (en) 2004-04-05 2005-03-25 Multi-channel encoder

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012093538A Division JP5311597B2 (ja) 2004-04-05 2012-04-17 マルチチャンネル・エンコーダ

Publications (2)

Publication Number Publication Date
JP2007531913A JP2007531913A (ja) 2007-11-08
JP5032977B2 true JP5032977B2 (ja) 2012-09-26

Family

ID=34962299

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007506877A Active JP5032977B2 (ja) 2004-04-05 2005-03-25 マルチチャンネル・エンコーダ
JP2012093538A Active JP5311597B2 (ja) 2004-04-05 2012-04-17 マルチチャンネル・エンコーダ

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012093538A Active JP5311597B2 (ja) 2004-04-05 2012-04-17 マルチチャンネル・エンコーダ

Country Status (14)

Country Link
US (1) US7602922B2 (ja)
EP (1) EP1735774B1 (ja)
JP (2) JP5032977B2 (ja)
KR (1) KR101158698B1 (ja)
CN (1) CN102122509B (ja)
AT (1) ATE395686T1 (ja)
BR (1) BRPI0509113B8 (ja)
DE (1) DE602005006777D1 (ja)
ES (1) ES2307160T3 (ja)
MX (1) MXPA06011361A (ja)
PL (1) PL1735774T3 (ja)
RU (1) RU2390857C2 (ja)
TW (1) TWI393119B (ja)
WO (1) WO2005098821A2 (ja)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
MXPA06011397A (es) 2004-04-05 2006-12-20 Koninkl Philips Electronics Nv Metodo, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
EP1858006B1 (en) * 2005-03-25 2017-01-25 Panasonic Intellectual Property Corporation of America Sound encoding device and sound encoding method
US7840401B2 (en) * 2005-10-24 2010-11-23 Lg Electronics Inc. Removing time delays in signal paths
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2009524099A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR100904438B1 (ko) 2006-02-23 2009-06-24 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8600740B2 (en) 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
EP2293292B1 (en) * 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8258849B2 (en) 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
WO2010036059A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2345027B1 (en) * 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
JP5163545B2 (ja) 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US8942989B2 (en) 2009-12-28 2015-01-27 Panasonic Intellectual Property Corporation Of America Speech coding of principal-component channels for deleting redundant inter-channel parameters
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
ES2706490T3 (es) 2010-08-25 2019-03-29 Fraunhofer Ges Forschung Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales
CN103262158B (zh) 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
CN104428835B (zh) * 2012-07-09 2017-10-31 皇家飞利浦有限公司 音频信号的编码和解码
US9288603B2 (en) * 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
KR20140016780A (ko) * 2012-07-31 2014-02-10 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
ES2653975T3 (es) 2013-07-22 2018-02-09 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas
EP2830333A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102063790B1 (ko) * 2014-09-24 2020-01-09 한국전자통신연구원 데이터 전송을 위한 도선의 수를 감소시키기 위한 데이터 전송 장치 및 그 방법
CN105897738B (zh) * 2016-05-20 2017-02-22 电子科技大学 一种用于多信道环境的实时流编码方法
WO2018086946A1 (en) 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
KR102615903B1 (ko) * 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들
CN108009347B (zh) * 2017-11-30 2021-06-22 南京理工大学 基于同步压缩联合改进广义s变换的时频分析方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0520068T3 (da) * 1991-01-08 1996-07-15 Dolby Ray Milton Koder/dekoder for flerdimensionale lydfelter
US5982903A (en) * 1995-09-26 1999-11-09 Nippon Telegraph And Telephone Corporation Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
US5857026A (en) * 1996-03-26 1999-01-05 Scheiber; Peter Space-mapping sound system
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
EP1062732B1 (en) * 1999-01-07 2012-05-02 Koninklijke Philips Electronics N.V. Efficient coding of side information in a lossless encoder
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6480984B1 (en) * 1999-06-23 2002-11-12 Agere Systems Inc. Rate (M/N) code encoder, detector, and decoder for control data
US6208699B1 (en) * 1999-09-01 2001-03-27 Qualcomm Incorporated Method and apparatus for detecting zero rate frames in a communications system
US6970567B1 (en) * 1999-12-03 2005-11-29 Dolby Laboratories Licensing Corporation Method and apparatus for deriving at least one audio signal from two or more input audio signals
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
TW511340B (en) * 2000-12-12 2002-11-21 Elan Microelectronics Corp Method and system for data loss detection and recovery in wireless communication
US20030014579A1 (en) * 2001-07-11 2003-01-16 Motorola, Inc Communication controller and method of transforming information
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
JP3778358B2 (ja) * 2003-05-01 2006-05-24 日本電信電話株式会社 音源分離方法、その装置及びプログラム
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding

Also Published As

Publication number Publication date
KR101158698B1 (ko) 2012-06-22
BRPI0509113A (pt) 2007-08-28
JP2007531913A (ja) 2007-11-08
US20070194952A1 (en) 2007-08-23
JP2012191625A (ja) 2012-10-04
ES2307160T3 (es) 2008-11-16
US7602922B2 (en) 2009-10-13
DE602005006777D1 (de) 2008-06-26
EP1735774A2 (en) 2006-12-27
TWI393119B (zh) 2013-04-11
KR20070001208A (ko) 2007-01-03
WO2005098821A2 (en) 2005-10-20
PL1735774T3 (pl) 2008-11-28
EP1735774B1 (en) 2008-05-14
MXPA06011361A (es) 2007-01-16
BRPI0509113B8 (pt) 2018-10-30
RU2006139048A (ru) 2008-05-20
CN102122509B (zh) 2016-03-23
WO2005098821A3 (en) 2006-03-16
CN102122509A (zh) 2011-07-13
BRPI0509113B1 (pt) 2018-08-14
ATE395686T1 (de) 2008-05-15
RU2390857C2 (ru) 2010-05-27
TW200614150A (en) 2006-05-01
JP5311597B2 (ja) 2013-10-09

Similar Documents

Publication Publication Date Title
JP5032977B2 (ja) マルチチャンネル・エンコーダ
JP4685925B2 (ja) 適応残差オーディオ符号化
JP4938648B2 (ja) マルチチャンネル・エンコーダ
JP5081838B2 (ja) オーディオ符号化及び復号
JP5455647B2 (ja) オーディオデコーダ
JP4939933B2 (ja) オーディオ信号符号化装置及びオーディオ信号復号化装置
JP5106383B2 (ja) オーディオ符号化および復号化
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
JP5883561B2 (ja) アップミックスを使用した音声符号器
JP4898673B2 (ja) 方法、装置、エンコーダ装置、デコーダ装置及びオーディオシステム
JP5154538B2 (ja) オーディオ復号

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110704

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120629

R150 Certificate of patent or registration of utility model

Ref document number: 5032977

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150706

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250