JP2009501957A

JP2009501957A - マルチチャンネルオーディオ信号の生成

Info

Publication number: JP2009501957A
Application number: JP2008522125A
Authority: JP
Inventors: ディルクジェイブレーバールト; ラルスエフヴィリィムース; ハイコプルンハーゲン; クリストフファーレル
Original assignee: Koninklijke Philips NV; Dolby International AB; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV; Dolby International AB
Priority date: 2005-07-19
Filing date: 2006-07-12
Publication date: 2009-01-22
Anticipated expiration: 2026-07-12
Also published as: RU2008106223A; BRPI0613734B1; KR20080033993A; PL1905006T3; EP1905006B1; ES2433316T3; CN101248483B; WO2007010451A1; US20080201153A1; US8160888B2; RU2417458C2; KR101356586B1; EP1905006A1; CN101248483A; JP5171622B2

Abstract

デコーダ１１５は、受け取った第１の信号からサラウンドサウンド信号のようなマルチチャンネルオーディオ信号を生成する。このマルチチャンネル信号はオーディオチャンネルの第２のセットを有しており、第１の信号はオーディオチャンネルの第１のセットを有している。デコーダ１１５は、第１の信号を受け取る受信器４０１を有している。受信器４０１は推定プロセッサ４０５に結合されており、推定プロセッサ４０５は、オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する。この推定パラメトリックデータは、オーディオチャンネルの第２のセットの特徴をオーディオチャンネルの第１のセットの特徴に関連付ける。デコーダ１１５は、更に、チャンネルの第２のセットを有するマルチチャンネル信号を生成するために推定パラメトリックデータに応じて第１の信号を復号する空間オーディオデコーダ４０３を有している。本発明は、空間オーディオエンコーダにより符号化されない信号を伴う空間オーディオ復号の使用を可能にする。

Description

本発明は、空間オーディオ復号によるマルチチャンネルオーディオ信号の生成に係り、特に、マトリクス符号化されたサラウンドサウンドステレオ信号からのマルチチャンネルオーディオ信号の生成に関するが、これに限定されるものではない。

デジタル信号表現及び通信が次第にアナログ表現及び通信に取って代わってきているので、種々のソース信号のデジタル符号化はこの１０年間にわたってますます重要になってきている。例えば、ＧＳＭのような移動電話システムは、デジタル音声符号化に基づいている。映像及び音楽のようなメディアコンテンツの配信もまた、次第にデジタルコンテンツ符号化をベースにしている。

更に、この１０年で、従来のステレオ信号を超えて広がるマルチチャンネルオーディオ、具体的には空間オーディオへの傾向が生じている。例えば、これまでのステレオ録音は２チャンネルのみを有するが、今日の高度化されたオーディオシステムは、普及している５．１サラウンドサウンドシステムにおけるように典型的には５又は６チャンネルを用いる。これは、ユーザが音源により囲まれ得るより複雑なリスニングの経験を与える。

そのようなマルチチャンネル信号の通信に関して種々の技術及び規格が開発されている。例えば、５．１サラウンドシステムを意味する６ディスクリートチャンネルは、ＡＡＣ（Advanced Audio Coding）又はドルビーデジタル規格のような規格に準拠して送信され得る。

しかしながら、下位互換性を与えるために、より高い数のチャンネルをより低い数のチャンネルにダウンミックスすることが知られており、具体的には、５．１サラウンドサウンド信号をステレオ信号にダウンミックスすることが多く用いられ、これは、ステレオ信号がレガシー（ステレオ）デコーダにより再現され、５．１信号がサラウンドサウンドデコーダにより再現されることを可能にする。

追加のマルチチャンネル情報を伴うことのない下位互換性のあるマルチチャンネル送信に関するそのような既存の方法は、典型的にはマトリクス化されるサラウンド方法として特徴付けられる。マトリクスサラウンドサウンド符号化の例は、ドルビープロロジックＩＩ及びロジック７のような方法を含んでいる。これらの方法の共通の原理は、これらの方法は入力信号の複数のチャンネルに適切な二次ではない（non-quadratic）マトリクスをマトリクス乗算することであり、それによってより低い数のチャンネルを伴う出力信号を生成する。具体的には、マトリクスエンコーダが、多くの場合サラウンドチャンネルを前方及び中央チャンネルとミキシングする前に該サラウンドチャンネルに位相ずれを与える。ダウンミックス信号（Ｌｔ，Ｒｔ）の生成は、例えば

により与えられ得る。

従って、左ダウンミックス信号（Ｌｔ）は、左前方信号（Ｌｆ）と、ファクタｑを乗じた中央信号（Ｃ）と、９０°位相回転（,ｊ'）し、ファクタａで変倍された左サラウンド信号（Ｌｓ）と、最後に同じく９０°位相回転し、ファクタｂで変倍された右サラウンド（Ｒｓ）信号とから成っている。右ダウンミックス信号（Ｒｔ）は同様に生成される。典型的なダウンミックスファクタは、ｑ及びａについては０．７０７であり、ｂについては０．４０８である。

上記右ダウンミックス信号（Ｒｔ）に関する逆の符号の理由は、サラウンドチャンネルがダウンミックスのペア（Ｌｔ，Ｒｔ）において逆位相で混合されることである。この性質は、デコーダがダウンミックス信号のペアから前方チャンネルと後方チャンネルとに区別することを助ける。デコーダは、ディマトリクス（de-matrixing）操作を与えることによりステレオダウンミックスからマルチチャンネル信号を（部分的に）復元し得る。オリジナルのマルチチャンネル信号に類似した再形成されたマルチチャンネル信号がどれだけ正確であるかは、マルチチャンネルオーディオコンテンツの具体的な性質に依存する。

マトリクス化されるサラウンドサウンドシステムは、下位互換性を与えるが、ＡＡＣ又はドルビーデジタルシステムのようなディスクリートサラウンドシステム／コーダーと比較して低いオーディオの品質しか与えることができない。

空間オーディオ符号化（ＳＡＣ）として知られる符号化／復号技術が、ダウンミックスされたオーディオ信号に改善された品質を与えるために開発されている。ＳＡＣでは、デコーダがチャンネルをより低い数にダウンミックスし、更に、ダウンミックス信号に対してマルチチャンネル信号の特徴を表すパラメトリックデータを生成する。その後、追加のパラメトリックデータが、典型的にはモノラル又はステレオオーディオ信号であるダウンミックス信号とともにビットストリームに含められる。従って、レガシーデコーダは、追加のパラメトリックデータを無視し、モノラル又はステレオ信号（又は場合によっては低品質のマトリクス復号されたサラウンドサウンド信号）を再生し得る。更に、ＳＡＣデコーダは、パラメトリックデータを抽出し、これをより高い品質のマルチチャンネル信号を生成するために用いる。

しかしながら、この手法による問題は、多くのシステムがＳＡＣ符号化された信号を組み込んでいないことである。例えば、多くのシステムは、ＳＡＣパラメトリックデータを生成しないマトリクスサラウンドサウンド符号化のみを利用する。また、多くの信号及びデコーダの規格は、追加のパラメトリックデータが含まれることを可能にするための柔軟性を与えず、従ってＳＡＣが採用される前に新しい規格への完全な切り換えを要する。これは、システムの全ての既存のエンコーダ及びデコーダが、ＳＡＣ対応のエンコーダ及びデコーダと取り替えられることを必要とする。具体的には、ＳＡＣのために必要な追加の情報を加えるための取り組みが実現不可能なほどに大規模である、すなわち、ＳＡＣを用いるためにそのようなシステムを拡張するためのコストが高すぎる（ラジオ、デジタルラジオ等のような）多くの２チャンネルステレオベースのレガシーシステムが存在する。更に、既に利用可能な大量のマトリクス符号化されたオーディオマテリアルが存在し、これはＳＡＣ復号の利益が得られる前にＳＡＣエンコーダによる再符号化を必要とする。

上記理由のために、マルチチャンネルオーディオ信号を処理及び／又は通信する改善されたシステムが有利であり、特に、高められた柔軟性、高められたオーディオの品質、ＳＡＣ動作原理の高められた適用性及び／又は改善された性能を可能にする機能が有利である。

従って、本発明は、単独又は任意の組み合わせで上述した不利点の１つ又はそれ以上をなるべく軽減、解決又は除去しようとするものである。

本発明の第１の観点によれば、マルチチャンネルオーディオ信号を生成するデコーダであって、オーディオチャンネルの第１のセットを有する第１の信号を受け取る手段と、上記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する推定手段であって、上記推定パラメトリックデータは、上記オーディオチャンネルの第２のセットの特徴を上記オーディオチャンネルの第１のセットの特徴に関連付ける当該推定手段と、上記チャンネルの第２のセットを有する上記マルチチャンネルオーディオ信号を生成するために上記推定パラメトリックデータに応じて上記第１の信号を復号する空間オーディオデコーダとを有する当該デコーダが提供される。

本発明は、改善された性能を可能にする。具体的には、本発明は、空間オーディオ復号の原理が空間オーディオ符号化（ＳＡＣ）パラメータを有していない信号に対して用いられることを可能にする。上記デコーダの適用範囲はかなり増大し、デコーダは例えばマトリクスエンコーダ及び符号化信号とともに用いられ得る。空間オーディオ復号により、改善されたオーディオの品質が実現され得る。

上記チャンネルの第２のセットは、一般に、上記チャンネルの第１のセットよりも多くのチャンネルを有する。オーディオチャンネルの第２のセットは、オーディオチャンネルの第１のセットの１つ又はそれ以上を有し得る。オーディオチャンネルの第２のセットの１つ又はそれ以上は、推定パラメトリックデータを用いることなく生成され得る。推定パラメトリックデータは、具体的には空間オーディオパラメータに対応するデータであり、特に従来のＳＡＣエンコーダにより一般的に生成されるような空間オーディオパラメータに対応するデータであり得る。

上記推定パラメトリックデータは、チャンネルの第１のセットの具体的な特徴をチャンネルの第２のセットの具体的な特徴に直接的に関連付け、及び／又は、例えばチャンネルの第２のセットのうちの異なるチャンネルの特徴を関連付けるデータ値を有し、それによりオーディオチャンネルの第２のセットを与えるために第１の信号がどのように復号され得るかを示す。上記特徴は、異なる時間間隔にわたる１つの単一のパラメータの一連のメジャー（measure）であり得る。代替として、上記特徴は１つの単一のパラメータよりも多くのパラメータに関係する。

本発明の必須ではない特徴によれば、上記第１の信号は、上記チャンネルの第２のセットに関連するパラメトリックオーディオデータを有していない。

本発明は、空間オーディオ復号の原理が出力チャンネルのうちの少なくとも幾つかに関してパラメトリックオーディオデータを有していない信号に適用されることを可能にする。従って、本発明は、非ＳＡＣ符号化信号に関する改善された品質を可能にし得る。本発明は、改善された下位互換性を可能にし、特にマトリクス符号化サラウンドサウンド信号から復号されたサラウンドサウンド信号に関して改善されたオーディオの品質を可能にする。

本発明の必須ではない特徴によれば、上記推定手段は、上記オーディオチャンネルの第１のセットに関する第１のパラメータデータを決定する手段と、上記第１のパラメータデータを上記オーディオチャンネルの第２のセットのための上記推定パラメータデータにマッピングする手段とを有する。

これは、特に高い復号されたオーディオの品質を与え得るパラメータデータの推定及び効率的な実行を可能にする。マッピングは、例えばルックアップテーブルの使用により又は数学関数を求めることにより起こる。従って、推定されるパラメータ値と第１のパラメータデータの特定のパラメータ値との間に直接的な関係が存在する。

本発明の必須ではない特徴によれば、上記第１のパラメータデータは、上記オーディオ信号の第１のセットの少なくとも２つのオーディオチャンネルに関する少なくとも１つのチャンネル間レベル差の値を有する。

これは、特に高い復号されたオーディオの品質を与え得るパラメータデータの推定及び効率的な実行を可能にする。特に、チャンネル間レベル差の値はマトリクス符号化サラウンドサウンド信号から関連のあるＳＡＣパラメトリックデータを推定するためにとりわけ適していることが研究により明らかにされている。本願発明者等は、例えばステレオマトリクス符号化サラウンドサウンド信号に関するチャンネル間レベル差と該サラウンドサウンド信号に関するＳＡＣデータとの間に高い相関関係が存在することに気付いた。

本発明の必須ではない特徴によれば、上記第１のパラメータデータは、上記オーディオ信号の第１のセットの少なくとも２つのオーディオチャンネルに関する少なくとも１つのチャンネル間相関係数の値を有する。

これは、特に高い復号されたオーディオの品質を与え得るパラメータデータの推定及び効率的な実行を可能にする。特に、チャンネル間相関係数の値はマトリクス符号化サラウンドサウンド信号から関連のあるＳＡＣパラメトリックデータを推定するためにとりわけ適していることが研究により明らかにされている。本願発明者等は、例えばステレオマトリクス符号化サラウンドサウンド信号に関するチャンネル間相関係数と該サラウンドサウンド信号に関するＳＡＣデータとの間に高い相関関係が存在することに気付いた。

本発明の必須ではない特徴によれば、上記マルチチャンネルオーディオ信号はサラウンドサウンド信号であり、上記推定パラメータデータは、上記チャンネルの第２のセットの左前方チャンネルと左サラウンドチャンネルとの間のチャンネル間レベル差と、上記チャンネルの第２のセットの右前方チャンネルと右サラウンドチャンネルとの間のチャンネル間レベル差と、上記チャンネルの第２のセットの左前方チャンネルと左サラウンドチャンネルとの間のチャンネル間相関係数と、上記チャンネルの第２のセットの右前方チャンネルと右サラウンドチャンネルとの間のチャンネル間相関係数と、上記オーディオチャンネルの第２のセットの中央チャンネルに関する予測係数と、上記チャンネルの第２のセットの中央チャンネルと他のチャンネル（又はチャンネルの組み合わせ）との間のチャンネル間レベル差とより成る群から選択される少なくとも１つのパラメータを有する。

これは、とりわけ高い性能を可能にする。具体的には、これらのパラメータは、空間オーディオデコーダにより高い質の復号信号を生成するのに特に好適であり、典型的にはマトリクス符号化サラウンドサウンドシステムのような入力信号の各パラメータ間において高い相関関係を持っている。

上記の群から選択される少なくとも１つのパラメータは、オーディオ信号の第１のセットの少なくとも２つのオーディオチャンネルに関するチャンネル間レベル差の値及び／又はチャンネル間相関係数の値から少なくとも１つのパラメータへの直接的なマッピングにより生成され得る。

本発明の必須ではない特徴によれば、上記装置は時間周波数タイルを生成する手段を更に有し、上記推定手段は、時間周波数タイルに関する推定パラメトリックデータを生成するように設けられる。

これは演算を容易にする及び／又は品質を改善する。特に、第１の信号から抽出されるパラメータと推定パラメトリックデータとの間の容易な及び／又は改善されたマッピングを可能にする。

本発明の必須ではない特徴によれば、上記推定手段は、上記オーディオチャンネルの第２のセットのためのパラメトリックデータの対応する値に時間周波数タイルに関する上記オーディオチャンネルの第１のセットの少なくとも１つの信号の特徴のセットを直接的にマッピングする手段を有する。

これは、特に高い復号されたオーディオの品質を与え得るパラメータデータの推定及び効率的な実行を可能にする。上記マッピングは、例えばルックアップテーブルの使用により又は数学関数を求めることにより起こる。従って、信号の特徴のセットと推定パラメータデータの対応する値との間に直接的な関係が存在する。上記信号の特徴は、オーディオチャンネルの第１のセットのうちの２つのチャンネルに関するチャンネル間レベル差及び／又はチャンネル間相関係数であり、これらは、例えばオーディオチャンネルの第２のセットのために予測係数及び／又はチャンネル間相関係数及び／又はチャンネル間レベル差に直接的にマップし得る。

本発明の必須ではない特徴によれば、上記空間オーディオデコーダは、上記推定パラメトリックデータに応じて決定されるパラメータを用いて少なくとも１つのマトリクス演算を行うように設けられる。

これは高い性能を可能にする。特に、これは高い復号の品質での好適な実行を可能にする。

本発明の必須ではない特徴によれば、上記デコーダは、第２の信号に関するパラメトリックデータを抽出する手段を更に有し、上記空間オーディオデコーダは抽出された上記パラメトリックデータに応じて上記第２の信号を復号するように動作可能である。

上記デコーダは、同じ空間オーディオエンコーダを用いてＳＡＣ符号化信号及び非ＳＡＣ符号化信号の両方に対応するように設けられ得る。ＳＡＣ符号化信号の場合には抽出されたデータが用いられ、非ＳＡＣ符号化信号の場合には推定されたパラメトリックデータが用いられ得る。本発明は、高められた適用性及び／又は下位互換性を与える。上記装置は、抽出されたパラメトリックデータに応じて第１の信号を復号するように設けられ、それにより第１の信号と第２の信号との相関関係が活用されることを可能にする。

本発明の必須ではない特徴によれば、上記デコーダは、上記第１の信号の特徴に応じて復号モードを選択する手段を更に有する。

上記デコーダは、例えば、ＳＡＣパラメトリックデータが推定される第１のモードとＳＡＣパラメトリックデータが受け取った信号から抽出される第２のモードとにおいて動作するように設けられ、第１の信号がＳＡＣデータを有するか否かに応じて上記第１のモードと第２のモードとの間で選択するように設けられ得る。従って、種々の異なるタイプの信号を処理することができる高い柔軟性のあるデコーダが実現され得る。

本発明の必須ではない特徴によれば、上記オーディオチャンネルの第１のセットは、２つのオーディオチャンネルから成る。

本発明は、ステレオ信号にダウンミックスされたマルチチャンネル信号の改善された復号を可能にする。

本発明の必須ではない特徴によれば、上記第１の信号はマトリクス符号化されたサラウンドサウンド信号である。

本発明は、マトリクス符号化サラウンドサウンド信号にダウンミックスされたマルチチャンネル信号のとりわけ改善された復号を可能にする。特に、実験は、非常に正確なＳＡＣデータが信号のステレオチャンネルに基づいてマトリクス符号化サラウンドサウンド信号に関して推定され得ることを示している。

本発明の必須ではない特徴によれば、上記デコーダは、マトリクス−サラウンド反転マトリクスと、上記推定パラメトリックデータに応じて前記マトリクス−サラウンド反転マトリクスの少なくとも１つの係数を決定する手段とを更に有する。

これは、マトリクス符号化サラウンド信号に関して改善された復号オーディオの品質を可能にする。

本発明の他の観点によれば、マルチチャンネルオーディオ信号を生成する方法であって、オーディオチャンネルの第１のセットを有する第１の信号を受け取ることと、上記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成することであって、上記推定パラメトリックデータは、上記オーディオチャンネルの第２のセットの特徴を上記オーディオチャンネルの第１のセットの特徴に関連付けることと、上記チャンネルの第２のセットを有する上記マルチチャンネルオーディオ信号を生成するために上記推定パラメトリックデータに応じて上記第１の信号を空間オーディオデコーダで復号することとを有する当該方法が提供される。

本発明の他の観点によれば、上記方法を実行するコンピュータプログラム製品が提供される。

本発明の他の観点によれば、マルチチャンネルオーディオ信号を生成する受信器であって、オーディオチャンネルの第１のセットを有する第１の信号を受け取る手段と、上記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する推定手段であって、上記推定パラメトリックデータは、上記オーディオチャンネルの第２のセットの特徴を上記オーディオチャンネルの第１のセットの特徴に関連付ける当該推定手段と、上記チャンネルの第２のセットを有する上記マルチチャンネルオーディオ信号を生成するために上記推定パラメトリックデータに応じて上記第１の信号を復号する空間オーディオデコーダとを有する当該受信器が提供される。

本発明の他の観点によれば、マルチチャンネル信号を符号化することによりオーディオチャンネルの第１のセットを有する第１の信号を生成するエンコーダと、上記第１の信号を送信する送信器と、上記第１の信号を受け取る手段と、上記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する推定手段であって、上記推定パラメトリックデータは、上記オーディオチャンネルの第２のセットの特徴を上記オーディオチャンネルの第１のセットの特徴に関連付ける当該推定手段と、上記チャンネルの第２のセットを有する復号されたマルチチャンネルオーディオ信号を生成するために上記推定パラメトリックデータに応じて上記第１の信号を復号する空間オーディオデコーダとを含む送信システムが提供される。

本発明の他の観点によれば、オーディオ信号を送信及び受信する方法であって、マルチチャンネル信号を符号化することによりオーディオチャンネルの第１のセットを有する第１の信号を生成することと、上記第１の信号を送信することと、上記第１の信号を受信することと、上記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成することであって、上記推定パラメトリックデータは、上記オーディオチャンネルの第２のセットの特徴を上記オーディオチャンネルの第１のセットの特徴に関連付けることと、上記チャンネルの第２のセットを有する復号されたマルチチャンネルオーディオ信号を生成するために上記推定パラメトリックデータに応じて上記第１の信号を空間オーディオデコーダで復号することとを有する当該方法が提供される。

本発明の他の観点によれば、上述したようなデコーダを有するオーディオ再生装置が提供される。

本発明のこれらの観点、特徴及び利点、並びにその他の観点、特徴及び利点は、以下に述べられる実施の形態から明らかであり、以下に述べられる実施の形態を参照して説明されるであろう。

本発明の実施の形態が、図面を参照して専ら例として説明される。

以下の説明は、ステレオ信号にダウンミックスされたマトリクス化サラウンドサウンド信号の復号に適用可能な本発明の実施の形態に焦点を当てている。しかしながら、本発明はこの用途に限定されるものではなく、種々の他の信号に適用され得ることが理解されるであろう。

図１は、本発明の幾つかの実施の形態に係るオーディオ信号の通信のための送信システム１００を示している。この送信システム１００は、具体的にはインターネットであり得るネットワーク１０５を介して受信器１０３に結合された送信器１０１を有している。

上記具体的な例では、送信器１０１は信号記録装置であり、受信器は信号再生装置１０３であるが、他の実施の形態においては送信器及び受信器が他のアプリケーションに用いられ得ること及び他の目的のために用いられ得ることは理解されるであろう。例えば、送信器１０１及び／又は受信器１０３は、トランスコーディング機能の一部であり、例えば他の信号の送信元又は送信先にインターフェースを与え得る。

信号記録機能がサポートされる上記具体的な例では、送信器１０１は、サンプリング及びアナログ−デジタル変換によりデジタルＰＣＭ信号に変換されるアナログ信号を受け取るデジタイザ１０７を有している。上記アナログ信号は、具体的には５．１サラウンドサウンドマルチチャンネル信号である。

上記送信器１０１は、符号化アルゴリズムに従ってＰＣＭ信号を符号化する図１のエンコーダ１０９に結合されている。具体的には、このエンコーダは、数式１のマトリクス演算を用いてダウンミックスされたステレオ信号を生成するマトリクスエンコーダである。従って、符号化された信号は、マトリクス符号化サラウンドサウンド信号である。

上記エンコーダ１０９は、上記符号化信号を受け取り、インターネット１０５にインターフェースで接続するネットワーク送信器１１１に結合されている。このネットワーク送信器は、インターネット１０５を介して受信器１０３に上記符号化信号を送信し得る。

上記受信器１０３は、インターネット１０５にインターフェースで接続し、送信器１０１から上記符号化信号を受け取るように設けられたネットワーク受信器１１３を有している。

上記ネットワーク受信器１１３は、デコーダ１１５に結合されている。このデコーダ１１５は、上記符号化信号を受け取り、それを復号アルゴリズムに従って復号する。

信号再生機能がサポートされるこの具体的な例では、受信器１０３は、デコーダ１１５からの復号されたオーディオ信号を受け取り、これをユーザに与える信号再生器１１７を更に有している。具体的には、信号再生器１１７は、上記復号されたオーディオ信号の出力のために必要に応じて、デジタル−アナログ変換器と、増幅器と、スピーカとを有している。

上述した実施の形態では、デコーダ１１５により用いられる復号アルゴリズムは、ＳＡＣ復号要素を有している。分かりやすくするために、典型的なＳＡＣエンコーダの動作が最初に説明される。

図２は、典型的なＳＡＣエンコーダ２００のブロック図を示している。このエンコーダ２００は、直交ミラーフィルタ（ＱＭＦ）バンク２０１により入力信号を分離した時間−周波数タイルに分割する。これらの時間−周波数タイルは、一般に「パラメータバンド」と呼ばれている。

各パラメータバンドに関して、ＳＡＣ符号化素子２０３が、空間イメージの特性を表す幾つかの空間パラメータ、例えばチャンネル間のレベル差及び相互相関係数を決定する。パラメータの抽出に加えて、ＳＡＣ符号化素子２０３は、上記マルチチャンネル入力信号からモノラル又はステレオダウンミックスもまた生成する。ＱＭＦ合成バンク２０５により、これらの信号は時間ドメインに移される。結果として得られるダウンミックスは、ダウンミックスチャンネルとＳＡＣ符号化素子２０３により生成されたパラメトリックデータとを有するビットストリームを生成するビットストリームプロセッサ２０７に与えられる。好ましくは上記ダウンミックスもまた（通常のモノラル又はステレオ「コア」コーダを用いて）送信前に符号化され、また、上記空間パラメータと上記コアコーダのビットストリームとが単一の出力ビットストリームにまとめられる（多重化される）ことが好ましい。

上記動作のモードに依存して、上記パラメトリックデータのこのデータレートは、良好な品質のマルチチャンネルオーディオのための数キロビット／秒から始まり、ほぼ透明な品質のための数十キロビット／秒まで幅広いビットレートにわたり得る。

また、ステレオダウンミックスの場合、ユーザは、通常のステレオダウンミックス又はマトリクス化されたサラウンドシステムと互換性があるダウンミックスの選択権を有する。後者の場合には、エンコーダ２００は、数式１のマトリクス化の手法を用いてマトリクス化サラウンドと互換のダウンミックスを生成する。代替として、エンコーダ２００は、通常のステレオダウンミックスを扱うダウンミックス後処理ユニットを用いてマトリクス化サラウンドと互換のダウンミックスを生成し得る。この構成では、上記エンコーダは、パラメータ推定段により抽出される空間パラメータを用いて通常のステレオダウンミックスをマトリクス化サラウンドサウンドと互換性をもたせるために通常のステレオダウンミックスを変更するマトリクス化サラウンドポストプロセッサを有し得る。このような手法の利点は、マトリクス化サラウンド処理が空間パラメータを使用可能なデコーダにより完全に逆にされることである。

ＳＡＣデコーダは、原則的には上記エンコーダの逆のプロセスを実行する。図３は、典型的なＳＡＣデコーダの一例を示している。ＳＡＣデコーダ３００は、上記ビットストリームを受け取り、それをダウンミックス信号とパラメトリックデータとに分割するスプリッタ３０１を有している。その後、復号されたダウンミックスは、ＳＡＣエンコーダ２００において利用されるパラメータバンドと同じパラメータバンドをもたらすようにＱＭＦ解析バンク３０３により処理される。空間合成段３０５は、スプリッタ３０１により抽出された上記パラメトリックデータを用いてマルチチャンネル信号を復元する。最後に、ＱＭＦドメイン信号が、最終的なマルチチャンネル出力信号をもたらすためにＱＭＦ合成バンク３０７により時間ドメインに移される。

このように、エンコーダ及びデコーダの両方がＳＡＣ機能を有するシステムでは、かなり低いデータレートに関して復号マルチチャンネル信号の高い品質が達成され得る。しかしながら、多くの既に実施されているシステム及び多くのオーディオマテリアルはＳＡＣ機能を活用していないので、上記恩恵は典型的には新しいシステム及び再符号化オーディオマテリアルに限定される。

図１の例では、デコーダ１１５は、非ＳＡＣエンコーダ及び非ＳＡＣ符号化マテリアルとともに用いられ得るＳＡＣ復号機能を有している。従って、デコーダ１１５は、再符号化又はＳＡＣ互換エンコーダを必要とすることなくＳＡＣの利点の幾つかを取り入れることができ、具体的にはデータレート比について著しく改善されたデータの品質をマルチチャンネル信号に与える。

図４は、図１のデコーダ１１５をより詳細に示している。デコーダ１１５は、オーディオチャンネルのセットを有する信号を受け取る受信器４０１を有している。具体的には、この受信器は、エンコーダ１０９によるサラウンドサウンド信号のマトリクス符号化によって生成された２チャンネルを有するビットストリームを受け取る。受信器４０１は、上記ビットストリームを受け取り、ダウンミックスステレオ信号の２つのチャンネルｙ_１，ｙ_２を生成する。この具体的な例では、エンコーダ１０９は、２つのダウンミックスチャンネルのみを有するビットストリームを生成するサラウンド信号用の通常のマトリクスエンコーダであることに注意されたい。従って、この例では、ビットストリームは空間オーディオパラメータデータを有していない。他の実施の形態では、エンコーダ１０９は、例えばＳＡＣパラメトリックデータを伴うことなくマトリクスサウンド互換ステレオ信号を生成するＳＡＣエンコーダであり得る。

デコーダ１１５は、受信器４０１に結合されたＳＡＣ復号素子４０３を更に有している。このＳＡＣ復号素子４０３は、前述したようなＳＡＣ技術を用いてステレオダウンミックスチャンネルｙ_１，ｙ_２を復号する。具体的には、ＳＡＣ復号素子４０３の動作は、図３のＳＡＣデコーダ３００に関して説明した動作に対応する。従って、ＳＡＣ復号素子４０３は、エンコーダ１０９によりマトリクス符号化されたサラウンド信号に対応する出力サラウンドサウンド信号を生成する。

前述したように、上記ステレオダウンミックスチャンネルは、数式１において説明されたようにマトリクスエンコーダにより符号化されている。代替として、ダウンミックスチャンネルは、マトリクスサラウンド互換のダウンミックスを生成するために後処理ユニットを含むＳＡＣエンコーダ２０３により生成されてもよい。両方のケースにおいて、ＳＡＣ復号素子４０３は、マトリクスサラウンドとの互換性のために上記エンコーダにより適用される動作を反転させる前処理ユニットを含み得る。

デコーダ１１５は、受信器４０１とＳＡＣ復号素子４０３とに結合された推定プロセッサ４０５を更に有している。この推定プロセッサ４０５は、上記出力サラウンド信号を生成するために用いられ得る推定パラメトリックデータを生成するように設けられている。具体的には、推定プロセッサ４０５は、ＳＡＣ符号化が行われた場合にＳＡＣエンコーダがダウンミックスチャンネルのために生成したパラメトリックデータを推定する。従って、推定されるパラメトリックデータは、出力サラウンドチャンネルを生成するためにどのようにダウンミックスチャンネルが復号され得るかという情報を与えるので、出力サラウンドチャンネルの特徴を受け取ったダウンミックスチャンネルの特徴に関連付ける。

図４の例では、推定プロセッサ４０５は、推定パラメトリックデータが、出力サラウンドチャンネルを決定するためにＳＡＣ復号素子４０３が直接的に用いることができるＳＡＣデータに対応するよう該推定パラメトリックデータを生成する。

従って、デコーダ１１５は、マトリクス符号化されたサラウンドオーディオマテリアルを復号するためにＳＡＣの原理を用いる。推定プロセッサ４０５は、ＳＡＣ復号素子４０３により用いられるデータを決定するために受け取ったステレオ入力信号の信号キュー（cue）を用いる。具体的には、推定プロセッサ４０５は、受け取ったステレオ信号のチャンネル間のキューを推定し、これをＳＡＣ復号素子４０３により直接的に用いられ得るＳＡＣキューにマップする。これは、具体的にはＳＡＣ復号素子４０３が通常のＳＡＣデコーダであることを可能にし、それにより、下位互換性を容易にし、設計及び開発の必要を減らし、ＳＡＣ符号化信号及び非ＳＡＣ符号化信号を復号するために同じ機能が用いられることを可能にする。従って、上記例では、必要とされるＳＡＣパラメータは、受け取った２チャンネルのダウンミックスの解析により得られるパラメータを用いてデコーダ側において生成される。

推定プロセッサ４０５は、ステレオダウンミックス信号に関して１つ又はそれ以上のパラメータを決定する解析プロセッサ４０７を有している。具体的には、この解析プロセッサ４０７は、ステレオダウンミックスチャンネルｙ_１，ｙ_２に関するチャンネル間レベル差（ＩＬＤ）の値及びチャンネル間相関係数（ＩＣＣ）の値を生成する。

上記解析プロセッサ４０７は、上記ＩＬＤ及びＩＣＣ値を出力チャンネルに関連するＳＡＣ値にマップするマッピングプロセッサ４０９に結合されている。

このマッピングプロセッサ４０９は、具体的には、マトリクス符号化サラウンド信号に関するＩＬＤ値及びＩＣＣ値とオリジナルのサラウンドサウンドチャンネルに関する空間オーディオパラメータとの間に近い相関が概して存在する以前に知られていない予期しない事実を利用する。

マッピングプロセッサ４０９は、ステレオダウンミックスチャンネルｙ_１，ｙ_２に対して出力サラウンドチャンネルに関するＳＡＣパラメータ値を決定するためにルックアップテーブルを簡単に用いることができる。決定されるＩＬＤ及びＩＣＣ値又はその類似物は、例えば量子化後にテーブルルックアップに関するアドレスとして用いられ得る。同等に、マッピングプロセッサ４０９は、入力パラメータとしてのＩＬＤ及びＩＣＣ値を持ち、出力パラメータとしての必要なＳＡＣパラメータを与える所定の関数を求めることができる。

このやり方では、マッピングプロセッサ４０９は、（例えば）出力サラウンドサウンドチャンネルに関する以下のＳＡＣパラメータを生成し得る。
・左前方チャンネルと左サラウンドチャンネルとの間のチャンネル間レベル差
・右前方チャンネルと右サラウンドチャンネルとの間のチャンネル間レベル差
・左前方チャンネルと左サラウンドチャンネルとの間のチャンネル間相関係数
・右前方チャンネルと右サラウンドチャンネルとの間のチャンネル間相関係数
・中央のチャンネルのようなチャンネルに関する１つ又はそれ以上の予測係数
・中央のチャンネルと出力サラウンドサウンドチャンネルの他のチャンネル（又はチャンネルの組み合わせ）との間のチャンネル間レベル差

具体的な例として、上記解析プロセッサ４０７は、ステレオダウンミックスチャンネルｙ_１，ｙ_２のためにＩＣＣ値及びＩＬＤ値を生成し得る。その後、これら２つの値は、ルックアップテーブルのための固有のアドレスを生成するために用いられる。上記特定のアドレスには、典型的にはこれらＩＣＣ及びＩＬＤ値に関して生じるＳＡＣパラメトリック値が記憶されている。従って、マッピングプロセッサ４０９は、記憶されているデータ値を単に取り出し、それにより好適な推定パラメトリックデータを得る。このデータは、その後、ＳＡＣ復号素子４０３に供給され、ＳＡＣ復号素子４０３においてＳＡＣエンコーダにより生成される通常のＳＡＣデータと同じように用いられる。

あるＩＬＤ及びＩＣＣ値のための対応するＳＡＣパラメータ値が任意の好適なやり方で決定され得ることは理解されるであろう。例えば、多数の信号がマトリクス符号化及びＳＡＣ符号化の両方により符号化されるシミュレーションが行われ得る。その後、マトリクス符号化信号に関してＩＣＣ及びＩＬＤ値が求められ、ＳＡＣエンコーダにより生成されるパラメトリックデータと比較される。上記データは、あるＩＬＤ及びＩＣＣ値に関して生じる可能性が最も高いＳＡＣパラメータを決定するために統計的に処理され、その後、ルックアップテーブルの適切な位置に記憶され得る。そのような解析は一度必要とされるだけであり、決定されたルックアップテーブルは多くのデコーダにより及び任意の受け取った信号のために用いられ得ることが理解されるであろう。

実際に、実験及びシミュレーションが、マトリクス符号化されたダウンミックスサラウンドサウンド信号のＩＣＣ及びＩＬＤ値とＳＡＣ符号化サラウンドサウンド信号に関するＳＡＣ値との間に近い相関が存在することを示している。従って、ＳＡＣパラメータは、かなり高い精度で推定され、著しく改善された復号オーディオの品質が達成される。

図４の例では、推定プロセッサ４０５は、時間−周波数タイルに基づいて動作する。

具体的には、ステレオダウンミックスチャンネルｙ_１，ｙ_２は、最初に、個々の時間−周波数タイルを生成するために複雑に変調されるＱＭＦフィルタバンクにより処理される。そのような処理は、推定プロセッサ４０５とＳＡＣ復号素子４０３との間において共有されてもよく、例えばＳＡＣ復号素子４０３において実現され得ることが理解されるであろう。ある時間間隔の間にある周波数帯を包含する時間−周波数タイルの生成は、当業者にはよく知られており、詳細には説明されない（一例は、Breebaart J., van de Par, S., Kohlrausch, A., and Schuijers, E. (2005). Parametric coding of stereo audio. Eurasip J. Applied Signal Proc., 9: 1305-1322において見出される。）。

時間−周波数タイルは、ある周波数帯及び時間セグメントをグループ化することにより構築される。一般に、これらの時間−周波数タイルは、音響心理学の原理によれば、低周波数において相対的に狭く、高周波数においてより広い。対応する時間解像度は、典型的には１１ｍｓと５０ｍｓとの間である。

各生成された時間−周波数タイルに関して、解析プロセッサ４０７がステレオダウンミックスチャンネルｙ_１，ｙ_２から２つのパラメータＩＬＤ及びＩＣＣを生成する。具体的には、Ｙ_１〔ｋ，ｂ〕が（複素数値の）フィルタの出力ｑ及び時間サンプルｋについての信号ｙ_１に関するフィルタバンクの出力を表し、Ｙ_２〔ｋ，ｂ〕がｙ_２に関する対応するＱＭＦドメイン表現を表す場合、パラメータ帯域ｂに関するＩＬＤパラメータは、

により与えられる。ここで、ｋに関する累積の範囲は、そのときの時間／周波数タイルの対応するＱＭＦ−ドメイン時間サンプルにわたって実行されるとともに、ｑに関する累積は、パラメータ帯域ｂに対応するフィルタバンク出力にわたって実行され、（^＊）は複素共役を意味している。

同様に、実数部を意味する

を用いて、パラメータ帯域ｂに関するＩＣＣ値は

により与えられる。

ＩＣＣ及びＩＬＤ値の各ペアに関して、マッピングプロセッサ４０９が、その後、テーブルルックアップを行い、
・左前方チャンネルと左サラウンドチャンネルとの対応する時間−周波数タイルの間のＩＬＤ
・右前方チャンネルと右サラウンドチャンネルとの対応する時間−周波数タイルの間のＩＬＤ
・左前方チャンネルと左サラウンドチャンネルとの対応する時間−周波数タイルの間のＩＣＣ
・右前方チャンネルと右サラウンドチャンネルとの対応する時間−周波数タイルの間のＩＣＣ
・ダウンミックスから中央のチャンネルを生成するための予測係数
及び／又は
・中央のチャンネルと任意の他のチャンネル（ペア）との間のＩＬＤ
を決定する。

従って、上記デコーダは、ＳＡＣエンコーダによりもたらされるＳＡＣパラメトリックデータに対応する推定パラメトリックデータを供給される。

図５は、ＳＡＣ復号素子４０３の構成要素をより詳細に示している。

ＳＡＣ復号素子４０３は、第２のミキシングマトリクスユニット５０３及びディコレレ−タ（decorrelator）（Ｄ１ないしＤｍ）のセット５０５のための入力部に入る信号を制御するプレミキシングマトリクスユニット５０１を有している。上記第２のミキシングマトリクスは、上記ディコレレ−タの出力及びプレミキシングマトリクス５０１の直接出力に基づいて出力信号を生成する。ＳＡＣの動作は当業者にはよく知られており、明らかで簡略するために、ここでは更には説明されない。更なる詳細は、例えば、Herre等の「The reference model architecture for MPEG spatial audio coding」Proc. 118^th AES convention, Barcelona, Spain, 2005において見出され得る。

推定プロセッサ４０５から受け取られ推定パラメトリックデータは、通常のＳＡＣパラメトリックデータであるかのようにプレミキシングマトリクスユニット５０１及び第２のミキシングマトリクスユニット５０３を制御するために用いられる。具体的には、プレミキシングマトリクスユニット５０１は、

である場合に

のように、入力信号ｙ_１，ｙ_２から３つの中間信号ｌ，ｒ及びｃを生成するためにプレミックスマトリクスＭ１を用い得る。ここで、ｃ_１及びｃ_２は、マッピングプロセッサ４０９により生成される空間パラメータ（予測係数）のうちの２つを表している。２つのディコレレ−タＤ_１及びＤ_２，５０５は、信号ｌ及びｒによりそれぞれ入力される。最後に、左前方，右前方，中央，左サラウンド及び右サラウンドチャンネルのための各出力信号ｌ_ｆ，ｒ_ｆ，ｃ，ｌ_ｓ及びｒ_ｓは、ｈ_ｘｙ，ｚがマッピングプロセッサ４０９により生成されるＩＬＤ及びＩＣＣパラメータに依存する状態で、すなわち

である場合に、

で、第２のミキシングマトリクスユニット５０３においてポストミックスマトリクスＭ_２を用いて生成される。すなわち、

であり、

である。

ここでは、ＩＬＤ_ｘ及びＩＣＣ_ｘは、チャンネルのペアＸ（左前方／左サラウンド，右前方／右サラウンド）のためにマッピングプロセッサ４０９により生成されるＩＬＤ及びＩＣＣパラメータを表している。

エンコーダポストプロセッサを用いてマトリクス−サラウンド互換モードにおいて動作するＳＡＣエンコーダの場合、対応するデコーダ側のプレプロセッサは、プレミキシングマトリクスユニット５０１に含まれ得る。この具体的な例では、代替のプレミキシングマトリクスが用いられてもよく、これは、オリジナルのプレミキシングマトリクスＭ_１とマトリクス−サラウンド互換反転マトリクスＱとの組み合わせにより構成される。マトリクス−サラウンド反転マトリクスＱが

により与えられる場合、

である。ここで、ｑ_ｘｙ，ｚは、マッピングプロセッサ４０９により生成されるパラメータの関数であり、ｇ_１＝ｇ_２＝０．５７７、パラメータの関数ｗ_ｌ及びｗ_ｒ

がマッピングプロセッサ４０９により与えられる状態で、

である。

代替として、Ｍ１又はＭ１´の入力もマッピングプロセッサ４０９により直接的に生成されてもよく、これは上記の数式を省く。

上記の説明は受け取られる信号がＳＡＣパラメトリックデータを有していない実施の形態に焦点を当てたが、他の実施の形態においては、幾つかのパラメトリックデータが受け取られる信号に含まれ得る。例えば、上記受け取られる信号は、幾つかの出力チャンネルに関連するが他の出力チャンネルには関連しないパラメトリックデータを有し、推定パラメータはこれらの他のチャンネルのために用いられ得る。他の例として、上記推定パラメトリックデータは、例えば送信エラーのために破損したパラメトリックデータを取り換えるために用いられ得る。従って、上記推定パラメトリックデータは、エンコーダから受け取られる他のパラメトリックデータを強化し、補完するために用いられ得る。

また、上述した例の利点の１つは、ＳＡＣ復号素子４０３が標準的なＳＡＣ復号技術を用いることができることであることが理解されるであろう。従って、ＳＡＣ復号素子４０３は、ＳＡＣエンコーダから受け取られる従来のＳＡＣ信号を復号するために同様に適用され得る。

具体的には、図１の伝送システム１００は、幾つかの非ＳＡＣエンコーダと幾つかのＳＡＣエンコーダとを有し得る。デコーダ１１５は、受け取った信号に応じてその動作を変更し得る。従って、非ＳＡＣ信号が受け取られた場合、動作は上述の通りである。しかしながら、ＳＡＣ信号が受け取られると、パラメトリックデータが単に抽出され、ダウンミックスチャンネルとともにＳＡＣ復号素子４０３に供給される。従って、非常に柔軟なデコーダが実現され得る。

図６は、本発明の幾つかの実施の形態に係るマルチチャンネルオーディオ信号を生成する方法を示している。この方法は、図４のデコーダ１１５に適用可能であり、図４を参照して説明される。

上記方法は、受信器４０１がオーディオチャンネルの第１のセットを有する第１の信号を受け取るステップ６０１で始まる。

ステップ６０１の後にはステップ６０３が続き、このステップ６０３では、推定プロセッサ４０５が、上記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのための推定パラメトリックデータを生成する。上記推定パラメトリックデータは、オーディオチャンネルの第２のセットの特徴をオーディオチャンネルの第１のセットの特徴と関連付ける。

ステップ６０３の後にはステップ６０５が続き、このステップ６０５では、ＳＡＣ復号素子４０３が、チャンネルの第２のセットを有するマルチチャンネル信号を生成するために推定パラメトリックデータに応じて上記第１の信号を復号する。

明らかにするための上記説明は、種々の機能ユニット及びプロセッサを参照して本発明の実施の形態について述べたことが理解されるであろう。しかしながら、本発明を損なうことなく種々の機能ユニット又はプロセッサ間の機能の任意の好適な分配が用いられ得ることは明らかである。例えば、分離したプロセッサ又はコントローラにより実行されるように説明された機能が同一のプロセッサ又はコントローラにより実行され得る。従って、具体的な機能ユニットについての言及は、厳密な論理的又は物理的な構造又は組織を示しているのではなく、専ら上記説明された機能を与える好適な手段についての言及であると受け止められるべきである。

本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらの任意の組み合わせを含む任意の好適な形態において実現され得る。本発明は、必要に応じて１つ又はそれ以上のデータプロセッサ及び／又はデジタル信号プロセッサ上で動くコンピュータソフトウェアとして少なくとも部分的に実現され得る。本発明の実施の形態の素子及び構成要素は、任意の好適なやり方で物理的、機能的及び論理的に実行され得る。実際には、上記機能は単一のユニットにおいて、複数のユニットにおいて又は他の機能ユニットの一部として実現され得る。そのようなものであるから、本発明は、単一のユニットにおいて実現されてもよいし、異なるユニット及びプロセッサの間に物理的及び機能的に分散されてもよい。

本発明は、幾つかの実施の形態に関連して説明されたが、本明細書に示された具体的な形態に限定されるように意図されてはいない。正しくは、本発明の範囲は添付の特許請求の範囲によってのみ限定される。更に、特徴が特定の実施の形態に関連して説明されているように見てとれるが、当業者であれば説明された上記実施の形態の種々の特徴が本発明に従って組み合わせされ得ることを理解するであろう。特許請求の範囲において、有するという用語は、他の構成要素又はステップの存在を排除するものではない。

また、個々に列挙されているが、複数の手段、構成要素又は方法のステップは例えば単一のユニット又はプロセッサにより実現され得る。加えて、個々の特徴が異なる特許請求の範囲に含まれているが、これらはできうる限り有利に組み合わせられてもよく、異なる特許請求の範囲に含まれているものは、特徴の組み合わせが実現可能及び／又は有利ではないことを意味するものではない。また、特許請求の範囲の１つのカテゴリーにおいて含まれる特徴は、このカテゴリーへの限定を意味するのではなく、特徴が必要に応じて他の特許請求の範囲のカテゴリーに等しく適用可能であることを示している。更に、特許請求の範囲における特徴の順序は、特徴が作用しなければならないいかなる具体的な順序をも意味するものではなく、特に、方法の特許請求の範囲における個々のステップの順序は、各ステップがこの順に実行されなければならないことを意味するものではない。正しくは、各ステップは任意の好適な順序で実行され得る。加えて、単数形の記載は複数形を排除するものではない。従って、「a」、「an」、「first」、「second」等の記載は複数形を除外するものではない。特許請求の範囲における参照符号は、単に明らかにする例として与えられており、任意のやり方で特許請求の範囲を限定するように解釈されるべきではない。

本発明の幾つかの実施の形態に係るオーディオ信号の通信のための送信システムを示している。典型的なＳＡＣエンコーダのブロック図を示している。典型的なＳＡＣデコーダの一例を示している。本発明の幾つかの実施の形態に係るデコーダを示している。本発明の幾つかの実施の形態に係るデコーダの素子を示している。本発明の幾つかの実施の形態に係るマルチチャンネルオーディオ信号を生成する方法を示している。

Claims

マルチチャンネルオーディオ信号を生成するデコーダであって、
オーディオチャンネルの第１のセットを有する第１の信号を受け取る手段と、
前記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する推定手段であって、前記推定パラメトリックデータは、前記オーディオチャンネルの第２のセットの特徴を前記オーディオチャンネルの第１のセットの特徴に関連付ける当該推定手段と、
前記チャンネルの第２のセットを有する前記マルチチャンネルオーディオ信号を生成するために前記推定パラメトリックデータに応じて前記第１の信号を復号する空間オーディオデコーダと
を有する当該デコーダ。
前記第１の信号は、前記チャンネルの第２のセットに関連するパラメトリックオーディオデータを有していない請求項１記載のデコーダ。
前記推定手段は、前記オーディオチャンネルの第１のセットに関する第１のパラメータデータを決定する手段と、前記第１のパラメータデータを前記オーディオチャンネルの第２のセットのための前記推定パラメータデータにマッピングする手段とを有する請求項１記載のデコーダ。
前記第１のパラメータデータは、前記オーディオ信号の第１のセットの少なくとも２つのオーディオチャンネルに関する少なくとも１つのチャンネル間レベル差の値を有する請求項３記載のデコーダ。
前記第１のパラメータデータは、前記オーディオ信号の第１のセットの少なくとも２つのオーディオチャンネルに関する少なくとも１つのチャンネル間相関係数の値を有する請求項３記載のデコーダ。
前記マルチチャンネルオーディオ信号はサラウンドサウンド信号であり、前記推定パラメータデータは、
・前記チャンネルの第２のセットの左前方チャンネルと左サラウンドチャンネルとの間のチャンネル間レベル差と、
・前記チャンネルの第２のセットの右前方チャンネルと右サラウンドチャンネルとの間のチャンネル間レベル差と、
・前記チャンネルの第２のセットの左前方チャンネルと左サラウンドチャンネルとの間のチャンネル間相関係数と、
・前記チャンネルの第２のセットの右前方チャンネルと右サラウンドチャンネルとの間のチャンネル間相関係数と、
・前記オーディオチャンネルの第２のセットの中央チャンネルに関する予測係数と、
・前記チャンネルの第２のセットの中央チャンネルと他のチャンネルとの間のチャンネル間レベル差と
より成る群から選択される少なくとも１つのパラメータを有する請求項１記載のデコーダ。
時間周波数タイルを生成する手段を更に有し、前記推定手段は、時間周波数タイルに関する前記推定パラメトリックデータを生成するように設けられた請求項１記載のデコーダ。
前記推定手段は、前記オーディオチャンネルの第２のセットのためのパラメトリックデータの対応する値に時間周波数タイルに関する前記オーディオチャンネルの第１のセットの少なくとも１つの信号の特徴のセットを直接的にマッピングする手段を有する請求項７記載のデコーダ。
前記空間オーディオデコーダは、前記推定パラメトリックデータに応じて決定されるパラメータを用いて少なくとも１つのマトリクス演算を行うように設けられた請求項１記載のデコーダ。
第２の信号に関するパラメトリックデータを抽出する手段を更に有し、前記空間オーディオデコーダは抽出された前記パラメトリックデータに応じて前記第２の信号を復号するように動作可能である請求項１記載のデコーダ。
前記第１の信号の特徴に応じて復号モードを選択する手段を更に有する請求項１記載のデコーダ。
前記オーディオチャンネルの第１のセットは、２つのオーディオチャンネルから成る請求項１記載のデコーダ。
前記第１の信号は、マトリクス符号化されたサラウンドサウンド信号である請求項１２記載のデコーダ。
マトリクス−サラウンド反転マトリクスと、前記推定パラメトリックデータに応じて前記マトリクス−サラウンド反転マトリクスの少なくとも１つの係数を決定する手段とを更に有する請求項１３記載のデコーダ。
マルチチャンネルオーディオ信号を生成する方法であって、
オーディオチャンネルの第１のセットを有する第１の信号を受け取ることと、
前記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成することであって、前記推定パラメトリックデータは、前記オーディオチャンネルの第２のセットの特徴を前記オーディオチャンネルの第１のセットの特徴に関連付けることと、
前記チャンネルの第２のセットを有する前記マルチチャンネルオーディオ信号を生成するために前記推定パラメトリックデータに応じて前記第１の信号を空間オーディオデコーダで復号することと
を有する当該方法。
請求項１５記載の方法を実行するコンピュータプログラム製品。
マルチチャンネルオーディオ信号を生成する受信器であって、
オーディオチャンネルの第１のセットを有する第１の信号を受け取る手段と、
前記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する推定手段であって、前記推定パラメトリックデータは、前記オーディオチャンネルの第２のセットの特徴を前記オーディオチャンネルの第１のセットの特徴に関連付ける当該推定手段と、
前記チャンネルの第２のセットを有する前記マルチチャンネルオーディオ信号を生成するために前記推定パラメトリックデータに応じて前記第１の信号を復号する空間オーディオデコーダと
を有する当該受信器。
マルチチャンネル信号を符号化することによりオーディオチャンネルの第１のセットを有する第１の信号を生成するエンコーダと、
前記第１の信号を送信する送信器と、
前記第１の信号を受け取る手段と、
前記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成する推定手段であって、前記推定パラメトリックデータは、前記オーディオチャンネルの第２のセットの特徴を前記オーディオチャンネルの第１のセットの特徴に関連付ける当該推定手段と、
前記チャンネルの第２のセットを有する復号されたマルチチャンネルオーディオ信号を生成するために前記推定パラメトリックデータに応じて前記第１の信号を復号する空間オーディオデコーダと
を含む送信システム。
オーディオ信号を送信及び受信する方法であって、
マルチチャンネル信号を符号化することによりオーディオチャンネルの第１のセットを有する第１の信号を生成することと、
前記第１の信号を送信することと、
前記第１の信号を受信することと、
前記オーディオチャンネルの第１のセットの特徴に応じてオーディオチャンネルの第２のセットのために推定パラメトリックデータを生成することであって、前記推定パラメトリックデータは、前記オーディオチャンネルの第２のセットの特徴を前記オーディオチャンネルの第１のセットの特徴に関連付けることと、
前記チャンネルの第２のセットを有する復号されたマルチチャンネルオーディオ信号を生成するために前記推定パラメトリックデータに応じて前記第１の信号を空間オーディオデコーダで復号することと
を有する当該方法。
請求項１記載のデコーダを有するオーディオ再生装置。