JP6644732B2

JP6644732B2 - マルチチャネル・オーディオ・コンテンツの符号化

Info

Publication number: JP6644732B2
Application number: JP2017119471A
Authority: JP
Inventors: プルンハーゲン，ヘイコ; ミュント，ハーラルト; クヨーリング，クリストファー
Original assignee: ドルビー・インターナショナル・アーベー
Priority date: 2013-09-12
Filing date: 2017-06-19
Publication date: 2020-02-12
Anticipated expiration: 2034-09-08
Also published as: JP2023029374A; CN117037811A; US20190267012A1; EP3561809A1; US9646619B2; JP2018146975A; US20220375481A1; JP2022010239A; CN110473560B; CN110648674A; EP3293734A1; WO2015036352A1; JP6759277B2; US11776552B2; HK1218180A1; CN107134280B; CN110634494A; EP3561809B1; US20200265844A1; CN107134280A

Description

本願の開示は概括的には、マルチチャネル・オーディオ信号の符号化に関する。詳細には、ある数のチャネルをもつスピーカー構成での再生のための複数の入力信号のエンコードおよびデコードのためのエンコーダおよびデコーダに関する。

マルチチャネル・オーディオ・コンテンツは、ある数のチャネルをもつスピーカー構成に対応する。たとえば、マルチチャネル・オーディオ・コンテンツは五つの前方チャネル、四つのサラウンド・チャネル、四つの天井チャネルおよび低域効果（LFE）チャネルに対応していてもよい。そのようなチャネル構成は5/4/4.1、9.1＋4または13.1構成と称されることがある。時に、エンコードされたマルチチャネル・オーディオ・コンテンツを、エンコードされたマルチチャネル・オーディオ・コンテンツより少数のチャネル、すなわちスピーカーをもつスピーカー構成をもつ再生システムで再生することが望ましい。以下では、そのような再生システムはレガシー再生システムと称される。たとえば、エンコードされた13.1オーディオ・コンテンツを、三つの前方チャネル、二つのサラウンド・チャネル、二つの天井チャネルおよびLFEチャネルをもつスピーカー構成で、再生することが望ましいことがありうる。そのようなチャネル構成は3/2/2.1、5.1＋2または7.1構成とも称される。

従来技術によれば、もとのマルチチャネル・オーディオ・コンテンツのすべてのチャネルの完全なデコードおよびそれに続くレガシー再生システムのチャネル構成へのダウンミックスが必要とされるであろう。明らかに、そのような構成は、もとのマルチチャネル・オーディオ・コンテンツのすべてのチャネルがデコードされる必要があるので計算効率が悪い。よって、レガシー再生システムのために好適なダウンミックスを直接デコードすることを許容する符号化方式が必要とされている。

ここで例示的実施形態について、付属の図面を参照して述べる。
例示的実施形態に基づくデコード方式を示す図である。図１のデコード方式に対応するエンコード方式を示す図である。例示的実施形態に基づくデコーダを示す図である。例示的実施形態に基づくデコード・モジュールの第一の構成を示す図である。例示的実施形態に基づくデコード・モジュールの第二の構成を示す図である。例示的実施形態に基づくデコーダを示す図である。例示的実施形態に基づくデコーダを示す図である。図７のデコーダにおいて使用される高周波再構成コンポーネントを示す図である。例示的実施形態に基づくエンコーダを示す図である。例示的実施形態に基づくエンコード・モジュールの第一の構成を示す図である。例示的実施形態に基づくエンコード・モジュールの第二の構成を示す図である。すべての図面は概略的であり、一般に、本開示を明快にするために必要な部分を示すのみである。一方、他の部分は省略されたり示唆されるだけであったりすることがある。特に断わりのない限り、同様の参照符号は異なる図面における同様の部分を指す。

上記に鑑み、レガシー再生システムに好適なダウンミックスの効率的なデコードを許容するマルチチャネル・オーディオ・コンテンツのエンコード／デコードのためのエンコード／デコード方法を提供することが目的である。

〈Ｉ．概観――デコーダ〉
第一の側面によれば、マルチチャネル・オーディオ・コンテンツをデコードするためのデコード方法、デコーダおよびコンピュータ・プログラム・プロダクトが提供される。

例示的実施形態によれば、N個のチャネルをもつスピーカー構成での再生のための複数の入力オーディオ信号をデコードするデコーダにおける方法であって、前記複数の入力オーディオ信号は少なくともN個のチャネルに対応するエンコードされたマルチチャネル・オーディオ・コンテンツを表わし、当該方法は：
M個の入力オーディオ信号を受領する段階であって、1＜M≦N≦2Mである、段階と；
第一のデコード・モジュールにおいて、前記M個の入力オーディオ信号を、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号にデコードする段階と；
前記N個のチャネルのうちM個のチャネルを超過するそれぞれについて、
前記M個のミッド信号の一つに対応する追加的な入力オーディオ信号を受領し、前記追加的な入力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号であり；
ステレオ・デコード・モジュールにおいて、前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードして、前記スピーカー構成のN個のチャネルのうちの二つでの再生に好適な第一および第二のオーディオ信号を含むステレオ信号を生成する段階とを含み、
それにより、前記スピーカー構成のN個のチャネルでの再生のために好適なN個のオーディオ信号が生成される、
方法が提供される。

上記の方法は、オーディオ・コンテンツがレガシー再生システムで再生されるべきである場合に、デコーダがマルチチャネル・オーディオ・コンテンツのすべてのチャネルをデコードして完全なマルチチャネル・オーディオ・コンテンツのダウンミックスを形成する必要がない点で有利である。

より詳細には、Mチャネル・スピーカー構成に対応するオーディオ・コンテンツをデコードするよう設計されているレガシー・デコーダは、単にM個の入力オーディオ信号を使って、これらをMチャネル・スピーカー構成での再生に好適なM個のミッド信号にデコードしてもよい。デコーダ側で、オーディオ・コンテンツのさらなるダウンミックスは必要とされない。実際、レガシー再生スピーカー構成に好適なダウンミックスはエンコーダ側においてすでに用意され、エンコードされていて、M個の入力信号によって表現されている。

M個より多いチャネルに対応するオーディオ・コンテンツをデコードするよう設計されているデコーダは、追加的な入力オーディオ信号を受領して、所望されるスピーカー構成に対応する出力チャネルに到達するために、これらを、ステレオ・デコード技法によって前記M個のミッド信号の対応するものと組み合わせてもよい。したがって、提案される方法は、再生のために使われるスピーカー構成に関して柔軟であるという点で有利である。

例示的実施形態によれば、ステレオ・デコード・モジュールは、デコーダがデータを受領するビットレートに依存して少なくとも二つの構成において動作可能である。本方法はさらに、前記少なくとも二つの構成のどちらを前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードする段階において使うかに関する指示を受領することを含んでいてもよい。

これは、本デコード方法がエンコード／デコード・システムによって使用されるビットレートに関して柔軟であるという点で有利である。

例示的実施形態によれば、追加的な入力オーディオ信号を受領する段階は：
前記M個のミッド信号の第一のものに対応する追加的な入力オーディオ信号および前記M個のミッド信号の第二のものに対応する追加的な入力オーディオ信号のジョイント・エンコードに対応する一対のオーディオ信号を受領し；
前記一対のオーディオ信号をデコードして、前記M個のミッド信号の第一および第二のものにそれぞれ対応する前記追加的な入力オーディオ信号を生成することを含む。

これは、追加的な入力オーディオ信号がペアごとに効率的に符号化されうる点で有利である。

例示的実施形態によれば、前記追加的な入力オーディオ信号は第一の周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号であり、前記対応するミッド信号は前記第一の周波数より大きい周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号であり、前記ステレオ・デコード・モジュールの前記第一の構成に従って前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードする段階は：
前記追加的なオーディオ入力信号が相補信号の形である場合には、前記第一の周波数までの周波数についてのサイド信号を、前記ミッド信号に重み付けパラメータaを乗算し、乗算の結果を前記相補信号に加えることによって計算する段階と；
前記ミッド信号および前記サイド信号をアップミックスして、第一および第二のオーディオ信号を含むステレオ信号を生成する段階であって、前記第一の周波数より下の周波数については、前記アップミックスは、前記ミッド信号および前記サイド信号の逆和差変換を実行し、前記第一の周波数より上の周波数については、前記アップミックスは前記ミッド信号のパラメトリック・アップミックスを実行することとを含む、段階とを含む。

これは、ステレオ・デコード・モジュールによって実行されるデコードが、ミッド信号および対応する追加的な入力オーディオ信号のデコードを可能にする点で有利である。前記追加的な入力オーディオ信号は、前記ミッド信号についての対応する周波数より低い周波数まで波形符号化される。このようにして、本デコード方法は、エンコード／デコード・システムが低下したビットレートで動作することを許容する。

ミッド信号のパラメトリック・アップミックスを実行するとは、一般に、前記第一の周波数より上の周波数について、前記第一および第二のオーディオ信号がミッド信号に基づいてパラメトリックに再構成されることを意味する。

例示的実施形態によれば、波形符号化されたミッド信号は、第二の周波数までの周波数に対応するスペクトル・データを含み、本方法はさらに：
パラメトリック・アップミックスを実行するのに先立って、高周波再構成を実行することによって前記第二の周波数より上の周波数範囲まで前記ミッド信号を拡張することを含む。

このようにして、本デコード方法は、エンコード／デコード・システムがさらに低下したビットレートで動作することを許容する。

例示的実施形態によれば、前記追加的な入力オーディオ信号および前記対応するミッド信号は、第二の周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号であり、前記ステレオ・デコード・モジュールの前記第二の構成に従って前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードする段階は：
前記追加的なオーディオ入力信号が相補信号の形である場合には、サイド信号を、前記ミッド信号に前記重み付けパラメータaを乗算し、乗算の結果を前記相補信号に加えることによって計算する段階と；
前記ミッド信号および前記サイド信号の逆和差変換を実行し、第一および第二のオーディオ信号を含むステレオ信号を生成する段階とを含む。

これは、ステレオ・デコード・モジュールによって実行されるデコードが、ミッド信号および対応する追加的な入力オーディオ信号のデコードをさらに可能にする点で有利である。前記追加的な入力オーディオ信号は、同じ周波数まで波形符号化される。このようにして、本デコード方法は、エンコード／デコード・システムが高いビットレートでも動作することを許容する。

例示的実施形態によれば、本方法はさらに、前記ステレオ信号の第一および第二のオーディオ信号を、高周波再構成を実行することによって前記第二の周波数より上の周波数範囲まで拡張することを含む。これは、エンコード／デコード・システムのビットレートに関する柔軟性がさらに増すという点で有利である。

M個のミッド信号がM個のチャネルをもつスピーカー構成で再生される例示的実施形態によれば、本方法はさらに：
前記M個のミッド信号の少なくとも一つおよびその対応する追加的なオーディオ入力信号から生成されうる前記ステレオ信号の前記第一および第二のオーディオ信号に関連付けられている高周波再構成パラメータに基づいて高周波再構成を実行することによって、前記M個のミッド信号の前記少なくとも一つの、周波数範囲を拡張することを含む。

これは、高周波再構成されたミッド信号の品質が改善されうる点で有利である。

前記追加的な入力オーディオ信号がサイド信号の形である例示的実施形態によれば、前記追加的な入力オーディオ信号および前記対応するミッド信号は、異なる変換サイズをもつ修正離散コサイン変換を使って波形符号化される。これは、変換サイズを選ぶことに関する柔軟性が増す点で有利である。

例示的実施形態は、上記に開示したエンコード方法のいずれかを実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトにも関する。コンピュータ可読媒体は非一時的なコンピュータ可読媒体であってもよい。

例示的実施形態は、N個のチャネルをもつスピーカー構成での再生のための複数の入力オーディオ信号をデコードするデコーダにも関する。前記複数の入力オーディオ信号は少なくともN個のチャネルに対応するエンコードされたマルチチャネル・オーディオ・コンテンツを表わし、当該デコーダは：
M個の入力オーディオ信号を受領するよう構成された受領コンポーネントであって、1＜M≦N≦2Mである、受領コンポーネントと；
前記M個の入力オーディオ信号を、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号にデコードするよう構成された第一のデコード・モジュールと；
前記N個のチャネルのうちM個のチャネルを超過するそれぞれについてのステレオ符号化モジュールとを有しており、前記ステレオ符号化モジュールは：
前記M個のミッド信号の一つに対応する追加的な入力オーディオ信号を受領し、前記追加的な入力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号であり；
前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードして、前記スピーカー構成のN個のチャネルのうちの二つでの再生に好適な第一および第二のオーディオ信号を含むステレオ信号を生成するよう構成されており、
それにより、当該デコーダは、前記スピーカー構成のN個のチャネルでの再生のために好適なN個のオーディオ信号を生成するよう構成される。

〈ＩＩ．概観――エンコーダ〉
第二の側面によれば、マルチチャネル・オーディオ・コンテンツをデコードするためのエンコード方法、エンコーダおよびコンピュータ・プログラム・プロダクトが提供される。

該第二の側面は一般に、第一の側面と同じ特徴および利点をもつことがある。

例示的実施形態によれば、K個のチャネルに対応するマルチチャネル・オーディオ・コンテンツを表わす複数の入力オーディオ信号をエンコードするためのエンコーダにおける方法であって：
K個のチャネルをもつスピーカー構成のチャネルに対応するK個の入力オーディオ信号を受領する段階と；
前記K個の入力オーディオ信号から、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号およびK−M個の出力オーディオ信号を生成する段階であって、1＜M＜K≦2Mであり、
前記ミッド信号の2M−K個は、前記入力オーディオ信号の2M−K個に対応し、
残りのK−M個のミッド信号およびK−M個の出力オーディオ信号は、Mを超えるKの各値について、
ステレオ・エンコード・モジュールにおいて、前記K個の入力オーディオ信号のうちの二つをエンコードしてミッド信号および出力オーディオ信号を生成することによって生成され、前記出力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号である、段階と；
第二のエンコード・モジュールにおいて、前記M個のミッド信号をM個の追加的な出力オーディオ・チャネルにエンコードする段階と；
前記K−M個の出力オーディオ信号および前記M個の追加的な出力オーディオ・チャネルをデコーダに伝送するためのデータ・ストリームに含める段階とを含む、方法が提供される。

例示的実施形態によれば、前記ステレオ・エンコード・モジュールは、エンコーダの所望されるビットレートに依存して少なくとも二つの構成で動作可能である。本方法はさらに、前記少なくとも二つの構成のどちらが前記K個の入力オーディオ信号の二つをエンコードする段階において前記ステレオ・エンコード・モジュールによって使用されたかに関する指示を前記データ・ストリーム中に含める段階を含んでいてもよい。

例示的実施形態によれば、本方法はさらに、前記データ・ストリームに含めるのに先立ってペアごとに前記K−M個の出力オーディオ信号のステレオ・エンコードを実行する段階を含んでいてもよい。

前記ステレオ・エンコード・モジュールが第一の構成に従って動作する例示的実施形態によれば、前記K個の入力オーディオ信号の二つをエンコードしてミッド信号および出力オーディオ信号を生成する段階は：
前記二つの入力オーディオ信号をミッド信号である第一の信号およびサイド信号である第二の信号に変換する段階と；
前記第一および第二の信号を第一および第二の波形符号化された信号にそれぞれ波形符号化する段階であって、前記第二の信号は第一の周波数まで波形符号化され、前記第一の信号は前記第一の周波数より大きい第二の周波数まで波形符号化される、段階と；
前記第一の周波数より上の周波数について、前記K個の入力オーディオ信号の前記二つのスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを抽出するために、前記二つの入力オーディオ信号をパラメトリック・ステレオ・エンコードにかける段階と；
前記第一および第二の波形符号化された信号および前記パラメトリック・ステレオ・パラメータを前記データ・ストリーム中に含める段階とを含む。

例示的実施形態によれば、本方法はさらに：
前記第一の周波数より下の周波数について、ミッド信号である前記波形符号化された第一の信号に重み付け因子aを乗算し、乗算の結果を前記第二の波形符号化された信号から減算することによって、サイド信号である前記波形符号化された第二の信号を相補信号に変換する段階と；
前記重み付けパラメータaを前記データ・ストリーム中に含める段階とを含む。

例示的実施形態によれば、本方法はさらに：
前記第二の周波数より上の前記第一の信号の高周波再構成を可能にする高周波再構成パラメータを生成するために、ミッド信号である前記第一の信号を高周波再構成エンコードにかける段階と；
前記高周波再構成パラメータを前記データ・ストリーム中に含める段階とを含む。

前記ステレオ・エンコード・モジュールが第二の構成に従って動作する例示的実施形態によれば、前記K個の入力オーディオ信号の二つをエンコードしてミッド信号および出力オーディオ信号を生成する段階は：
前記二つの入力オーディオ信号を、ミッド信号である第一の信号およびサイド信号である第二の信号に変換する段階と；
前記第一および第二の信号をそれぞれ第一および第二の波形符号化された信号に波形符号化する段階であって、前記第一および第二の信号は第二の周波数まで波形符号化される、段階と；
前記第一および第二の波形符号化された信号を含める段階とを含む。

例示的実施形態によれば、本方法はさらに：
ミッド信号である前記波形符号化された第一の信号に重み付け因子aを乗算し、乗算の結果を前記第二の波形符号化された信号から減算することによって、サイド信号である前記波形符号化された第二の信号を相補信号に変換する段階と；
前記重み付けパラメータaを前記データ・ストリーム中に含める段階とを含む。

例示的実施形態によれば、本方法はさらに：
前記第二の周波数より上の前記K個の入力オーディオ信号の前記二つの高周波再構成を可能にする高周波再構成パラメータを生成するために、前記K個の入力オーディオ信号の前記二つのそれぞれを、高周波再構成エンコードにかける段階と；
前記高周波再構成パラメータを前記データ・ストリーム中に含める段階とを含む。

例示的実施形態は、例示的実施形態のエンコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトにも関する。コンピュータ可読媒体は非一時的なコンピュータ可読媒体であってもよい。

例示的実施形態は、K個のチャネルに対応するマルチチャネル・オーディオ・コンテンツを表わす複数の入力オーディオ信号をエンコードするためのエンコーダにも関する。当該エンコーダは：
K個のチャネルをもつスピーカー構成のチャネルに対応するK個の入力オーディオ信号を受領するよう構成された受領コンポーネントと；
前記K個の入力オーディオ信号から、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号およびK−M個の出力オーディオ信号を生成するよう構成された第一のエンコード・モジュールであって、1＜M＜K≦2Mであり、
前記ミッド信号の2M−K個は、前記入力オーディオ信号の2M−K個に対応し、
前記第一のエンコード・モジュールは、残りのK−M個のミッド信号およびK−M個の出力オーディオ信号を生成するよう構成されたK−M個のステレオ・エンコード・モジュールを有しており、各ステレオ・エンコード・モジュールは：
前記K個の入力オーディオ信号のうちの二つをエンコードしてミッド信号および出力オーディオ信号を生成するよう構成されており、前記出力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号である、第一のエンコード・モジュールと；
前記M個のミッド信号をM個の追加的な出力オーディオ・チャネルにエンコードするよう構成された第二のエンコード・モジュールと；
前記K−M個の出力オーディオ信号および前記M個の追加的な出力オーディオ・チャネルをデコーダに伝送するためのデータ・ストリームに含めるよう構成された多重化コンポーネントとを有する。

〈ＩＩＩ．例示的実施形態〉
左（L）および右（R）チャネルをもつステレオ信号は、異なるステレオ符号化方式に対応して異なる形で表現されうる。本稿で左右符号化「L-R符号化」と称される第一の符号化方式によれば、ステレオ変換コンポーネントの入力チャネルL、Rおよび出力チャネルA、Bは、次式によって関係付けられる：
L＝A; R＝B
換言すれば、LR符号化は単に入力チャネルの素通しを含意する。LおよびRチャネルによって表現されるステレオ信号はL/R表現をもつまたはL/R形式であるといわれる。

本稿で和差符号化（またはミッド‐サイド符号化「MS符号化」）と称される第二の符号化方式によれば、ステレオ変換コンポーネントの入力および出力チャネルは、次式によって関係付けられる：
A＝0.5(L＋R); B＝0.5(L−R)
換言すれば、MS符号化は、入力チャネルの和と差を計算することに関わる。これは本稿では、和差変換を実行すると称される。このため、チャネルAは第一および第二のチャネルLおよびRのミッド信号（和信号M）と見なされてもよく、チャネルBは第一および第二のチャネルLおよびRのサイド信号（差信号）と見なされてもよい。ステレオ信号が和差符号化にかけられた場合、該信号はミッド／サイド（M/S）表現をもつまたはミッド／サイド（M/S）形式であるといわれる。

デコーダの観点からは、対応する式は
L＝(A＋B); R＝(A−B)
である。

ミッド／サイド形式であるステレオ信号をL/R形式に変換することは、本稿では、逆和差変換を実行することと称される。

ミッド‐サイド符号化方式は、本稿で「向上MS符号化」（または向上された和差符号化）と称される第三の符号化方式に一般化されうる。向上MS符号化では、ステレオ・変換コンポーネントの入力および出力チャネルは、次式によって関係付けられる：
A＝0.5(L＋R); B＝0.5(L(1−a)−R(1＋a))
L＝(1＋a)A＋B; R＝(1−a)A−B
ここで、aは重み付けパラメータである。重み付けパラメータは時間および周波数で可変であってもよい。また、この場合、信号Aはミッド信号と考えられてもよく、信号Bは修正されたサイド信号または相補サイド信号と考えられてもよい。特に、a＝0については、向上されたMS符号化方式はミッド‐サイド符号化に帰着する。ステレオ信号が向上されたミッド／サイド符号化にかけられた場合、該信号はミッド／相補／a表現（M/c/a）をもつまたはミッド／相補／a形式であるといわれる。

上記によれば、相補信号は、対応するミッド信号にパラメータaを乗算し、乗算の結果を相補信号に加えることによって、サイド信号に変換されうる。

図１は、例示的実施形態に基づくデコード・システムにおけるデコード方式１００を示している。データ・ストリーム１２０が受領コンポーネント１０２によって受領される。データ・ストリーム１２０は、K個のチャネルに対応するエンコードされたマルチチャネル・オーディオ・コンテンツを表わす。受領コンポーネント１０２は、データ・ストリーム１２０を多重分離し、量子化解除して、M個の入力オーディオ信号１２２およびK−M個の入力オーディオ信号１２４を形成してもよい。ここで、M＜Kであると想定される。

M個の入力オーディオ信号１２２は第一のデコード・モジュール１０４によってデコードされてM個のミッド信号１２６となる。M個のミッド信号はM個のチャネルをもつスピーカー構成での再生に好適である。第一のデコード・モジュール１０４は一般に、M個のチャネルに対応するオーディオ・コンテンツをデコードするための任意の既知のデコード方式に従って動作しうる。こうして、デコード・システムがレガシーまたは低計算量デコード・システムであってM個のチャネルをもつスピーカー構成での再生をサポートするだけのものである場合には、M個のミッド信号は、もとのオーディオ・コンテンツのK個のチャネルすべてをデコードする必要なく、スピーカー構成のM個のチャネルで再生されうる。

M＜N≦Kとして、Nチャネルをもつスピーカー構成での再生をサポートするデコード・システムの場合、デコード・システムは、M個のミッド信号１２６と、K−M個の入力オーディオ信号１２４の少なくとも一部とを第二のデコード・モジュール１０６にかけてもよい。第二のデコード・モジュール１０６は、N個のチャネルをもつスピーカー構成での再生に好適なN個の出力オーディオ信号１２８を生成する。

K−M個の入力オーディオ信号１２４のそれぞれは、二つの代替の一方に従ってM個のミッド信号１２６の一つに対応する。第一の代替によれば、入力オーディオ信号１２４はM個のミッド信号１２６の一つに対応するサイド信号であり、ミッド信号および対応する入力信号はミッド／サイド形式で表現されたステレオ信号をなす。第二の代替によれば、入力オーディオ信号１２４はM個のミッド信号１２６の一つに対応する相補信号であり、ミッド信号および対応する入力信号はミッド／相補／a形式で表現されたステレオ信号をなす。このように、第二の代替によれば、サイド信号はミッド信号および重み付けパラメータaと一緒になった相補信号から再構成されうる。第二の代替が使われるときは、重み付けパラメータaはデータ・ストリーム１２０に含まれる。

下記でより詳細に説明するように、第二のデコード・モジュール１０６のN個の出力オーディオ信号１２８のいくつかは、M個のミッド信号１２６のいくつかへの直接対応であってもよい。さらに、第二のデコード・モジュールは、一つまたは複数のステレオ・デコード・モジュールを有していてもよく、そのそれぞれがM個のミッド信号１２６およびその対応する入力オーディオ信号１２４に作用して、一対の出力オーディオ信号を生成する。生成される出力オーディオ信号の各対は、スピーカー構成のN個のチャネルのうちの二つでの再生のために好適である。

図２は、図１のデコード方式１００に対応するエンコード・システムのエンコード方式２００を示している。K＞2であるとして、K個のチャネルをもつスピーカー構成のチャネルに対応するK個の入力オーディオ信号２２８は受領コンポーネント（図示せず）によって受領される。K個の入力オーディオ信号は、第一のエンコード・モジュール２０６に入力される。K個の入力オーディオ信号２２８に基づいて、第一のエンコード・モジュール２０６は、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号２２６と、K−M個の出力オーディオ信号２２４とを生成する。ここで、M＜K≦2Mである。

一般に、のちにより詳細に説明するように、M個のミッド信号２２６のいくつか、典型的にはミッド信号２２６の2M−K個は、K個の入力オーディオ信号２２８の個々のものに対応する。換言すれば、第一のエンコード・モジュール２０６はM個のミッド信号２２６のいくつかを、K個の入力信号２２８のいくつかを素通しさせることによって生成する。

M個のミッド信号２２６の残りのK−M個は一般に、第一のエンコード・モジュール２０６によって素通しにされていない入力オーディオ信号２２８をダウンミックスする、すなわち線形結合することによって生成される。特に、第一のエンコード・モジュールは、それらの入力オーディオ信号２２８をペアごとにダウンミックスしてもよい。この目的のために、第一のエンコード・モジュールは一つまたは複数の（典型的にはK−M個の）ステレオ・エンコード・モジュールを有していてもよい。各ステレオ・エンコード・モジュールは入力オーディオ信号２２８の対に対して作用して、ミッド信号（すなわち、ダウンミックスまたは和信号）および対応する出力オーディオ信号２２４を生成する。出力オーディオ信号２２４は、上記で論じた二つの代替の任意のものに従ったミッド信号に対応する。すなわち、出力オーディオ信号２２４は、サイド信号またはミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号である。後者の場合、重み付けパラメータaはデータ・ストリーム２２０に含められる。

M個のミッド信号２２６は次いで、第二のエンコード・モジュール２０４に入力され、そこで、M個の追加的な出力オーディオ信号２２２にエンコードされる。第二のエンコード・モジュール２０４は、M個のチャネルに対応するオーディオ・コンテンツをエンコードするための任意の既知のエンコード方式に従って動作してもよい。

第一のエンコード・モジュールからのN−M個の出力オーディオ信号２２４およびM個の追加的な出力オーディオ信号２２２は次いで量子化されて、多重化コンポーネント２０２によって、デコーダへの伝送のためにデータ・ストリーム２２０に含められる。

図１〜図２を参照して述べたエンコード／デコード方式では、Kチャネル・オーディオ・コンテンツのMチャネル・オーディオ・コンテンツへの適切なダウンミックスがエンコーダ側で（第一のエンコード・モジュール２０６によって）実行される。このようにして、M個のチャネル、あるいはより一般にM≦N≦KとしてN個のチャネルをもつチャネル構成での再生のためのKチャネル・オーディオ・コンテンツの効率的なデコードが達成される。

デコーダの例示的実施形態について、図３〜図８を参照して以下で述べる。

図３は、N個のチャネルをもつスピーカー構成での再生のための複数の入力オーディオ信号のデコードのために構成されているデコーダ３００を示している。デコーダ３００は、受領コンポーネント３０２と、第一のデコード・モジュール１０４と、ステレオ・デコード・モジュール３０６を含む第二のデコード・モジュール１０６とを有する。第二のデコード・モジュール１０６はさらに、高周波拡張コンポーネント３０８を有していてもよい。デコーダ３００はステレオ変換コンポーネント３１０をも有していてもよい。

デコーダ３００の動作について以下で説明する。受領コンポーネント３０２はデータ・ストリーム３２０、すなわちビットストリームをエンコーダからを受領する。受領コンポーネント３０２は、たとえば、データ・ストリーム３２０をその構成要素部分に多重分離する多重分離コンポーネントと、受領されたデータの量子化解除のための量子化解除器とを有していてもよい。

受領されたデータ・ストリーム３２０は、複数の入力オーディオ信号を含む。一般に、該複数の入力オーディオ信号は、K≧Nであるとして、K個のチャネルをもつスピーカー構成に対応するエンコードされたマルチチャネル・オーディオ・コンテンツに対応してもよい。

特に、データ・ストリーム３２０は、M個の入力オーディオ信号３２２を含む。ここで、1＜M＜Nである。図示した例では、Mは7に等しく、七つの入力オーディオ信号３２２がある。しかしながら、他の例では、5など他の数であってもよい。さらに、データ・ストリーム３２０はN−M個のオーディオ信号３２３を含み、それからN−M個の入力オーディオ信号３２４がデコードされうる。図示した例では、Nは13に等しく、六つの追加的な入力オーディオ信号３２４がある。

データ・ストリーム３２０はさらに、追加的なオーディオ信号３２１を有していてもよい。これは典型的にはエンコードされたLFEチャネルに対応する。

一例によれば、N−M個のオーディオ信号３２３のうちの一対はN−M個の入力オーディオ信号３２４の一対をジョイント・エンコードしたものに対応してもよい。ステレオ変換コンポーネント３１０はN−M個のオーディオ信号３２４のそのような対をデコードして、N−M個の入力オーディオ信号３２４の対応する対を生成してもよい。たとえば、ステレオ変換コンポーネント３１０は、N−M個のオーディオ信号３２３の対にMSまたは向上MSデコードを適用することによってデコードを実行してもよい。

M個の入力オーディオ信号３２２およびもし入手可能であれば追加的なオーディオ信号３２１は、第一のデコード・モジュール１０４に入力される。図１を参照して論じたように、第一のデコード・モジュール１０４はM個の入力オーディオ信号３２２を、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号３２６にデコードする。本例において示されるように、M個のチャネルは中央前方スピーカー（C）、左前方スピーカー（L）、右前方スピーカー（R）、左サラウンド・スピーカー（LS）、右サラウンド・スピーカー（RS）、左天井スピーカー（LT）および右天井スピーカー（RT）に対応しうる。第一のデコード・モジュール１０４はさらに、追加的なオーディオ信号３２１を、典型的には低域効果LFEスピーカーに対応する出力オーディオ信号３２５にデコードする。

図１を参照してさらに上記で論じたように、追加的な入力オーディオ信号３２４のそれぞれは、ミッド信号に対応するサイド信号またはミッド信号に対応する相補信号であるという点でミッド信号３２６の一つに対応する。例として、入力オーディオ信号３２４の第一のものは、左前方スピーカーに関連付けられたミッド信号３２６に対応してもよく、入力オーディオ信号３２４の第二のものは、右前方スピーカーに関連付けられたミッド信号３２６に対応してもよい、など。

M個のミッド信号３２６およびN−M個のオーディオ入力オーディオ信号３２４は、Nチャネル・スピーカー構成での再生に好適なN個のオーディオ信号３２８を生成する第二のデコード・モジュール１０６に入力される。

第二のデコード・モジュール１０６は、ミッド信号３２６のうち対応する残差信号をもたないものを、任意的には高周波再構成コンポーネント３０８を介して、Nチャネル・スピーカー構成の対応するチャネルにマッピングする。たとえば、Mチャネル・スピーカー構成の中央前方スピーカー（C）に対応するミッド信号は、Nチャネル・スピーカー構成の中央前方スピーカー（C）にマッピングされてもよい。高周波再構成コンポーネント３０８は、図４および図５を参照して後述するものと同様である。

第二のデコード・モジュール１０６は、N−M個のステレオ・デコード・モジュール３０６を有する。ミッド信号３２６および対応する入力オーディオ信号３２４からなる各対について一つである。一般に、各ステレオ・デコード・モジュール３０６はジョイント・ステレオ・デコードを実行して、Nチャネル・スピーカー構成のチャネルのうちの二つにマッピングするステレオ・オーディオ信号を生成する。例として、7チャネル・スピーカー構成の左前方スピーカー（L）に対応するミッド信号およびその対応する入力オーディオ信号３２４を入力として取るステレオ・デコード・モジュール３０６は、13チャネル・スピーカー構成の二つの左前方スピーカー（「Lワイド〔Lwide〕」および「Lスクリーン〔Lscreen〕」）にマッピングするステレオ・オーディオ信号を生成する。

ステレオ・デコード・モジュール３０６は、エンコーダ／デコーダ・システムが動作するデータ伝送レート（ビットレート）、すなわちデコーダ３００がデータを受領するビットレートに依存して、少なくとも二つの構成において動作可能である。第一の構成は、たとえば、ステレオ・デコード・モジュール３０６当たり約32〜48kbpsのような中程度のビットレートに対応してもよい。第二の構成は、たとえば、ステレオ・デコード・モジュール３０６当たり48kbpsを超えるビットレートのような高いビットレートに対応してもよい。デコーダ３００は、どの構成を使うべきかに関する指示を受領する。たとえば、そのような指示は、エンコーダによって、データ・ストリーム３２０中の一つまたは複数のビットを介してデコーダ３００に信号伝達されてもよい。

図４は、中程度のビットレートに対応する第一の構成に従って機能するときのステレオ・デコード・モジュール３０６を示している。ステレオ・デコード・モジュール３０６は、ステレオ変換コンポーネント４４０と、さまざまな時間／周波数変換コンポーネント４４２、４４６、４５４と、高周波再構成（HFR）コンポーネント４４８と、ステレオ・アップミックス・コンポーネント４５２とを有する。ステレオ・デコード・モジュール３０６は、ミッド信号３２６および対応する入力オーディオ信号３２４を入力として取るよう制約されている。ミッド信号３２６および入力オーディオ信号３２４は周波数領域、典型的には修正離散コサイン変換（MDCT）領域で表現されていることが想定される。

中程度のビットレートを達成するために、少なくとも入力オーディオ信号３２４の帯域幅が制限される。より正確には、入力オーディオ信号３２４は、第一の周波数k₁までの周波数に対応するスペクトル・データを含む波形符号化された信号である。ミッド信号３２６は、第一の周波数k₁より大きいある周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号である。いくつかの場合において、データ・ストリーム３２０において送られる必要のあるさらなるビットを節約するために、ミッド信号３２６の帯域幅も制限される。それにより、ミッド信号３２６は第一の周波数k₁より大きい第二の周波数k₂までのスペクトル・データを含む。

ステレオ変換コンポーネント４４０は、入力信号３２６、３２４をミッド／サイド表現に変換する。上記でさらに論じたように、ミッド信号３２６および対応する入力オーディオ信号３２４は、ミッド／サイド形式またはミッド／相補／a形式で表現されていてもよい。前者の場合、入力信号はすでにミッド／サイド形式なので、ステレオ変換コンポーネント４４０は入力信号３２６、３２４を何らの修正もなしに素通しにする。後者の場合、ステレオ変換コンポーネント４４０はミッド信号３２６を素通しにする。一方、相補信号である入力オーディオ信号３２４は、第一の周波数k₁までの周波数についてのサイド信号に変換される。より正確には、ステレオ変換コンポーネント４４０は、ミッド信号３２６に重み付けパラメータa（これはデータ・ストリーム３２０から受領される）を乗算し、乗算の結果を入力オーディオ信号３２４に加えることによって、第一の周波数k₁までの周波数についてのサイド信号を決定する。結果として、ステレオ変換コンポーネントはこのように、ミッド信号３２６および対応するサイド信号４２４を出力する。

これに関連して、ミッド信号３２６および入力オーディオ信号３２４がミッド／サイド形式で受領される場合、信号３２４、３２６の混合はステレオ変換コンポーネント４４０において行なわれないことを注意しておく価値がある。結果として、ミッド信号３２６および入力オーディオ信号３２４は異なる変換サイズをもつMDCT変換によって符号化されうる。しかしながら、ミッド信号３２６および入力オーディオ信号３２４がミッド／相補／a形式で受領される場合には、ミッド信号３２６および入力オーディオ信号３２４のMDCT符号化は、同じ変換サイズに制約される。

ミッド信号３２６が限られた帯域幅をもつ場合、すなわち、ミッド信号３２６のスペクトル内容が第二の周波数k₂までの周波数に制約されている場合には、ミッド信号３２６は、高周波再構成コンポーネント４４８によって高周波再構成（HFR）にかけられる。HFRとは、一般に、信号の低周波数（この場合、第二の周波数k₂より下の周波数）についてのスペクトル内容およびデータ・ストリーム３２０においてエンコーダから受領されるパラメータに基づいて高周波数（この場合、第二の周波数k₂より上の周波数）についての信号のスペクトル内容を再構成するパラメトリックな技法を意味する。そのような高周波再構成技法は当技術分野において知られており、たとえばスペクトル帯域複製（SBR）技法を含む。HFRコンポーネント４４８はこうして、システムにおいて表現される最大周波数までのスペクトル内容をもつミッド信号４２６を出力する。ここで、第二の周波数k₂より上のスペクトル内容はパラメトリックに再構成される。

高周波再構成コンポーネント４４８は典型的には直交ミラー・フィルタ（QMF）領域で動作する。したがって、高周波再構成を実行する前に、ミッド信号３２６および対応するサイド信号４２４はまず、典型的には逆MDCT変換を実行する時間／周波数変換コンポーネント４４２によって時間領域に変換され、次いで時間／周波数変換コンポーネント４４６によってQMF領域に変換される。

ミッド信号４２６およびサイド信号４２４は次いで、L/R形式で表わされたステレオ信号４２８を生成するステレオ・アップミックス・コンポーネント４５２に入力される。サイド信号４２４は第一の周波数k₁までの周波数についてのスペクトル内容をもつのみであり、ステレオ・アップミックス・コンポーネント４５２は第一の周波数k₁より下と上の周波数を異なる仕方で扱う。

より詳細には、第一の周波数k₁までの周波数については、ステレオ・アップミックス・コンポーネント４５２はミッド信号４２６およびサイド信号４２４をミッド／サイド形式からL/R形式に変換する。換言すれば、ステレオ・アップミックス・コンポーネント４５２は、第一の周波数k₁までの周波数については逆和差変換を実行する。

サイド信号４２４についてスペクトル・データが提供されない第一の周波数k₁より上の周波数については、ステレオ・アップミックス・コンポーネント４５２はステレオ信号４２８の第一および第二の成分を、ミッド信号４２６からパラメトリックに再構成する。一般に、ステレオ・アップミックス・コンポーネント４５２は、データ・ストリーム３２０を介して、エンコーダ側でこの目的のために抽出されたパラメータを受領し、これらのパラメータを再構成のために利用する。一般に、パラメトリック・ステレオ再構成のための任意の既知の技法が使用されうる。

上記に鑑み、ステレオ・アップミックス・コンポーネント４５２によって出力されるステレオ信号４２８はこのように、システムにおいて表現される最大周波数までのスペクトル内容をもつ。ここで、第一の周波数k₁より上のスペクトル内容はパラメトリックに再構成される。HFRコンポーネント４４８と同様に、ステレオ・アップミックス・コンポーネント４５２は典型的にはQMF領域で動作する。よって、ステレオ信号４２８は、時間領域で表わされたステレオ信号３２８を生成するために、時間／周波数変換コンポーネント４５４によって時間領域に変換される。

図５は、高ビットレートに対応する第二の構成に従って動作するときのステレオ・デコード・モジュール３０６を示している。ステレオ・デコード・モジュール３０６は第一のステレオ変換コンポーネント５４０、さまざまな時間／周波数変換コンポーネント５４２、５４６、５５４、第二のステレオ変換コンポーネント４５２および高周波再構成（HFR）コンポーネント５４８ａ、５４８ｂを有する。ステレオ・デコード・モジュール３０６は、ミッド信号３２６および対応する入力オーディオ信号３２４を入力として取るよう制約されている。ミッド信号３２６および入力オーディオ信号３２４が周波数領域、典型的には修正離散コサイン変換（MDCT）領域で表現されることが想定される。

高ビットレートの場合、入力信号３２６、３２４の帯域幅に関する制約は、中程度のビットレートの場合とは異なる。より正確には、ミッド信号３２６および入力オーディオ信号３２４は、第二の周波数k₂までの周波数に対応するスペクトル・データを含む波形符号化された信号である。いくつかの場合には、第二の周波数k₂はシステムによって表わされる最大周波数に対応してもよい。他の場合には、第二の周波数k₂はシステムによって表わされる最大周波数より低くてもよい。

ミッド信号３２６および入力オーディオ信号３２４は、ミッド／サイド表現への変換のために第一のステレオ変換コンポーネント５４０に入力される。第一のステレオ変換コンポーネント５４０は図４のステレオ変換コンポーネント４４０と同様である。違いは、入力オーディオ信号３２４が相補信号の形である場合、第一のステレオ変換コンポーネント５４０は、第二の周波数k₂までの周波数について、相補信号をサイド信号に変換するということである。よって、ステレオ変換コンポーネント５４０は、いずれも第二の周波数までのスペクトル内容をもつミッド信号３２６および対応するサイド信号５２４を出力する。

ミッド信号３２６および対応するサイド信号５２４は次いで第二のステレオ変換コンポーネント５５２に入力される。第二のステレオ変換コンポーネント５５２はミッド信号３２６およびサイド信号５２４の和および差を形成して、ミッド信号３２６およびサイド信号５２４をミッド／サイド形式からL/R形式に変換する。換言すれば、第二のステレオ変換コンポーネントは、第一の成分５２８ａおよび第二の成分５２８ｂをもつステレオ信号を生成するために逆和差変換を実行する。

好ましくは、第二のステレオ変換コンポーネント５５２は時間領域で動作する。したがって、第二のステレオ変換コンポーネント５５２に入力されるのに先立ち、ミッド信号３２６およびサイド信号５２４は時間／周波数変換コンポーネント５４２によって周波数領域（MDCT領域）から時間領域に変換されてもよい。代替として、第二のステレオ変換コンポーネント５５２はQMF領域で動作してもよい。そのような場合、図５のコンポーネント５４６および５５２の順序は、逆にされる。これは、第二のステレオ変換コンポーネント５５２において生起する混合がミッド信号３２６および入力オーディオ信号３２４に関するMDCT変換サイズに対してさらなる制約を課さないという点で有利である。さらに上記で論じたように、ミッド信号３２６および入力オーディオ信号３２４がミッド／サイド形式で受領される場合、それらは異なる変換サイズを使ってMDCT変換によって符号化されてもよい。

第二の周波数k₂が最高の表現される周波数より低い場合には、ステレオ信号の第一および第二の成分５２８ａ、５２８ｂは、高周波再構成コンポーネント５４８ａ、５４８ｂによって高周波再構成（HFR）にかけられてもよい。高周波再構成コンポーネント５４８ａ、５４８ｂは図４の高周波再構成コンポーネント４４８と同様である。しかしながら、この場合、高周波再構成パラメータの第一の集合がデータ・ストリーム２３０を介して受領され、ステレオ信号の第一の成分５２８ａの高周波再構成において使用され、高周波再構成パラメータの第二の集合がデータ・ストリーム２３０を介して受領され、ステレオ信号の第二の成分５２８ｂの高周波再構成において使用されることを注意しておく価値がある。よって、高周波再構成コンポーネント５４８ａ、５４８ｂは、システムにおいて表現される最大周波数までのスペクトル・データを含むステレオ信号の第一および第二の成分５３０ａ、５３０ｂを出力する。ここで、第二の周波数k₂より上のスペクトル内容はパラメトリックに再構成される。

好ましくは、高周波再構成はQMF領域で実行される。したがって、高周波再構成にかけられるのに先立って、ステレオ信号の第一および第二の成分５２８ａ、５２８ｂは時間／周波数変換コンポーネント５４６によってQMF領域に変換されてもよい。

高周波再構成コンポーネント５４８から出力されるステレオ信号の第一および第二の成分５３０ａ、５３０ｂは次いで、時間領域において表現されるステレオ信号３２８を生成するために時間／周波数変換コンポーネント５５４によって時間領域に変換されてもよい。

図６は、11.1チャネルをもつスピーカー構成での再生のためのデータ・ストリーム６２０に含まれる複数の入力オーディオ信号のデコードのために構成されているデコーダ６００を示している。デコーダ６００の構造は一般に、図３に示したものと同様であってもよい。違いは、13.1チャネルをもつスピーカー構成が示される図３と比べ、スピーカー構成のチャネルの示される数が少なく、LFEスピーカー、三つの前方スピーカー（中央C、左Lおよび右R）、四つのサラウンド・スピーカー（左側方Lside、左後方Lback、右側方Rside、右後方Rback）および四つの天井スピーカー（左上前方LTF、左上後方LTB、右上前方RTF、右上後方RTB）をもつということである。

図６では、第一のデコード・コンポーネント１０４は、チャネルC、L、R、LS、RS、LTおよびRTのスピーカー構成に対応しうる七つのミッド信号６２６を出力する。さらに、四つの追加的な入力オーディオ信号６２４ａ〜ｄがある。追加的な入力オーディオ信号６２４ａ〜ｄはそれぞれミッド信号６２６の一つに対応する。例として、入力オーディオ信号６２４ａは、LSミッド信号に対応するサイド信号または相補信号であってもよく、入力オーディオ信号６２４ｂは、RSミッド信号に対応するサイド信号または相補信号であってもよく、入力オーディオ信号６２４ｃは、LTミッド信号に対応するサイド信号または相補信号であってもよく、入力オーディオ信号６２４ｄは、RTミッド信号に対応するサイド信号または相補信号であってもよい。

図示した実施形態では、第二のデコード・モジュール１０６は図４および図５に示される型の四つのステレオ・デコード・モジュール３０６を有する。各ステレオ・デコード・モジュール３０６は、ミッド信号６２６のうちの一つおよび対応する追加的な入力オーディオ信号６２４ａ〜ｄを入力として取り、ステレオ・オーディオ信号３２８を出力する。たとえば、LSミッド信号および入力オーディオ信号６２４ａに基づいて、第二のデコード・モジュール１０６はLsideおよびLbackスピーカーに対応するステレオ信号を出力してもよい。さらなる例は図から明らかである。

さらに、第二のデコード・モジュール１０６は、ミッド信号６２６のうちの三つ、ここではC、L、Rチャネルに対応するミッド信号の素通しとして作用する。これらの信号のスペクトル帯域幅に依存して、第二のデコード・モジュール１０６は高周波再構成コンポーネント３０８を使って高周波再構成を実行してもよい。

図７は、レガシーまたは低計算量のデコーダ７００がいかにして、M個のチャネルをもつスピーカー構成での再生のために、K個のチャネルをもつスピーカー構成に対応するデータ・ストリーム７２０のマルチチャネル・オーディオ・コンテンツをデコードするかを示している。例として、Kは11または13に等しくてもよく、Mは7に等しくてもよい。デコーダ７００は受領コンポーネント７０２と、第一のデコード・モジュール７０４と、高周波再構成モジュール７１２とを有する。

図１のデータ・ストリーム１２０を参照してさらに述べたように、データ・ストリーム７２０は一般に、M個の入力オーディオ信号７２２（図１および図３の信号１２２および３２２参照）およびK−M個の追加的な入力オーディオ信号（図１および図３の信号１２４および３２４参照）を有していてもよい。任意的に、データ・ストリーム７２０は、典型的にはLFEチャネルに対応する追加的なオーディオ信号７２１を有していてもよい。デコーダ７００はM個のチャネルをもつスピーカー構成に対応するので、受領コンポーネント７０２は、データ・ストリーム７２０からM個の入力オーディオ信号７２２（および存在すれば追加的なオーディオ信号７２１）を抽出するだけであり、残りのK−M個の追加的な入力オーディオ信号を破棄する。

ここでは七つのオーディオ信号によって例示されているM個の入力オーディオ信号７２２および追加的なオーディオ信号は次いで第一のデコード・モジュール１０４に入力される。第一のデコード・モジュール１０４はM個の入力オーディオ信号７２２を、Mチャネル・スピーカー構成のチャネルに対応するM個のミッド信号７２６にデコードする。

M個のミッド信号７２６が、システムによって表現される最大周波数より低いある周波数までのスペクトル内容しか含まない場合には、M個のミッド信号７２６は、高周波再構成モジュール７１２による高周波再構成にかけられてもよい。

図８は、そのような高周波再構成モジュール７１２の例を示している。高周波モジュール７１２は高周波再構成コンポーネント８４８およびさまざまな時間／周波数変換コンポーネント８４２、８４６、８５４を有する。

HFRモジュール７１２に入力されるミッド信号７２６は、HFRコンポーネント８４８による高周波再構成にかけられる。高周波再構成は好ましくはQMF領域において実行される。したがって、典型的にはMDCTスペクトルの形であるミッド信号７２６は、HFRコンポーネント８４８に入力されるのに先立ち、時間／周波数変換コンポーネント８４２によって時間領域に変換され、次いで、時間／周波数変換コンポーネント８４６によってQMF領域に変換されてもよい。

HFRコンポーネント８４８は一般に、より高い周波数についてのスペクトル内容をパラメトリックに再構成するために、より低い周波数についての入力データのスペクトル内容を、データ・ストリーム７２０から受領されるパラメータと一緒に使うという点で、たとえば図４および図５のHFRコンポーネント４４８、５４８と同じ仕方で動作する。しかしながら、エンコーダ／デコーダ・システムのビットレートに依存して、HRFコンポーネント８４８は異なるパラメータを使ってもよい。

図５を参照して説明したように、高ビットレートの場合について、対応する追加的な入力オーディオ信号をもつ各ミッド信号について、データ・ストリーム７２０は、HRFパラメータの第一の集合およびHRFパラメータの第二の集合を含む（図５の項目５４８ａ、５４８ｂの記述を参照）。デコーダ７００はミッド信号に対応する追加的な入力オーディオ信号を使わないものの、HFRコンポーネント８４８は、ミッド信号の高周波再構成を実行するときに、HRFパラメータの第一および第二の集合の組み合わせを使ってもよい。たとえば、高周波再構成コンポーネント８４８は、第一および第二の集合のHRFパラメータの平均または線形結合のようなダウンミックスを使ってもよい。

このように、HFRコンポーネント８５４は、拡張されたスペクトル内容をもつミッド信号８２８を出力する。ミッド信号８２８は次いで、時間領域表現をもつ出力信号７２８を与えるために、時間／周波数変換コンポーネント８５４によって時間領域に変換されてもよい。

エンコーダの例示的実施形態について、図９〜図１１を参照して以下で述べる。

図９は、図２の一般的構造のもとにはいるエンコーダ９００を示している。エンコーダ９００は、受領コンポーネント（図示せず）と、第一のエンコード／モジュール２０６と、第二のエンコード・モジュール２０４と、量子化および多重化コンポーネント９０２とを有する。第一のエンコード・モジュール２０６はさらに、高周波再構成（HFR）エンコード・コンポーネント９０８と、ステレオ・エンコード・モジュール９０６とを有していてもよい。デコーダ９００はさらに、ステレオ変換コンポーネント９１０を有していてもよい。

エンコーダ９００の動作についてここで説明する。受領コンポーネントは、K個のチャネルをもつスピーカー構成のチャネルに対応するK個の入力オーディオ信号９２８を受領する。たとえば、K個のチャネルは、上記のような13チャネル構成のチャネルに対応していてもよい。さらに、典型的にはLFEチャネルに対応する追加的なチャネル９２５が受領されてもよい。K個のチャネルは第一のエンコード・モジュール２０６に入力され、該第一のエンコード・モジュール２０６がM個のミッド信号９２６およびK−M個の出力オーディオ信号９２４を生成する。

第一のエンコード・モジュール２０６はK−M個のステレオ・エンコード・モジュール９０６を有する。K−M個のステレオ・エンコード・モジュール９０６のそれぞれは、K個の入力オーディオ信号のうちの二つを入力として取り、ミッド信号９２６の一つおよび出力オーディオ信号９２４の一つを生成する。これについてはのちにより詳細に述べる。

第一のエンコード・モジュール２０６はさらに、ステレオ・エンコード・モジュール９０６の一つに入力されない残りの入力オーディオ信号を、M個のミッド信号９２６の一つに、任意的にはHFRエンコード・コンポーネント９０８を介して、マッピングする。HFRエンコード・コンポーネント９０８は図１０および図１１を参照して述べるものと同様である。

M個のミッド信号９２６は、任意的には典型的にはLFEチャネルを表わす追加的な入力オーディオ信号９２５と一緒に、図２を参照して上記したような第二のエンコード・モジュール２０４に入力される。M個の出力オーディオ・チャネル９２２にエンコードするためである。

データ・ストリーム９２０に含められる前に、K−M個の出力オーディオ信号９２４は任意的に、ステレオ変換コンポーネント９１０によってペアごとにエンコードされてもよい。たとえば、ステレオ変換コンポーネント９１０は、K−M個の出力オーディオ信号のうちのある対を、MSまたは向上MS符号化を実行することによって、エンコードしてもよい。

M個の出力オーディオ信号９２２（および追加的な入力オーディオ信号９２５から帰結する追加的な信号）およびK−M個の出力オーディオ信号９２４（またはステレオ・エンコード・コンポーネント９１０から出力されるオーディオ信号）は、量子化および多重化コンポーネント９０２によって量子化され、データ・ストリーム９２０に含められる。さらに、種々のエンコード・コンポーネントおよびモジュールによって抽出されるパラメータが量子化され、データ・ストリームに含められてもよい。

ステレオ・エンコード・モジュール９０６は、エンコーダ／デコーダ・システムが動作するデータ伝送レート（ビットレート）、すなわちエンコーダ９００がデータを伝送するビットレートに依存して少なくとも二つの構成において動作可能である。第一の構成は、たとえば中程度のビットレートに対応してもよい。第二の構成は、たとえば高いビットレートに対応してもよい。エンコーダ９００は、どの構成を使うべきかに関する指示を、データ・ストリーム９２０中に含める。たとえば、そのような指示は、データ・ストリーム９２０における一つまたは複数のビットを介して信号伝達されてもよい。

図１０は、中程度のビットレートに対応する第一の構成に従って動作するときのステレオ・エンコード・モジュール９０６を示している。ステレオ・エンコード・モジュール９０６は第一のステレオ変換コンポーネント１０４０、さまざまな時間／周波数変換コンポーネント１０４２、１０４６、HFRエンコード・コンポーネント１０４８、パラメトリック・ステレオ・エンコード・コンポーネント１０５２および波形符号化コンポーネント１０５６を有する。ステレオ・エンコード・モジュール９０６はさらに、第二のステレオ変換コンポーネント１０４３を有していてもよい。ステレオ・エンコード・モジュール９０６は入力オーディオ信号９２８のうちの二つを入力として取る。入力オーディオ信号９２８は時間領域で表現されていることが想定される。

第一のステレオ変換コンポーネント１０４０は、上記に基づく和および差を形成することによって、入力オーディオ信号９２８をミッド／サイド表現に変換する。よって、第一のステレオ変換コンポーネント９４０はミッド信号１０２６およびサイド信号１０２４を出力する。

いくつかの実施形態では、ミッド信号１０２６およびサイド信号１０２４は次いで第二のステレオ変換コンポーネント１０４３によってミッド／相補／a表現に変換される。第二のステレオ変換コンポーネント１０４３は、データ・ストリーム９２０に含めるための重み付けパラメータaを抽出する。重み付けパラメータaは時間および周波数依存であってもよい。すなわち、データの異なる時間フレームおよび周波数帯域の間で異なってもよい。

波形符号化コンポーネント１０５６はミッド信号１０２６およびサイドもしくは相補信号を波形符号化にかけ、それにより波形符号化されたミッド信号９２６および波形符号化されたサイドもしくは相補信号９２４を生成する。

第二のステレオ変換コンポーネント１０４３および波形符号化コンポーネント１０５６は典型的にはMDCT領域で動作する。こうして、ミッド信号１０２６およびサイド信号１０２４は、第二のステレオ変換および波形符号化に先立って、時間／周波数変換コンポーネント１０４２によってMDCT領域に変換されてもよい。信号１０２６および１０２４が第二のステレオ変換１０４３にかけられない場合には、ミッド信号１０２６およびサイド信号１０２４について異なるMDCT変換サイズが使われてもよい。信号１０２６および１０２４が第二のステレオ変換１０４３にかけられる場合には、ミッド信号１０２６および相補信号１０２４について同じMDCT変換サイズが使われるべきである。

中程度のビットレートを達成するために、少なくともサイドまたは相補信号９２４の帯域幅が制限される。より正確には、サイドまたは相補信号は第一の周波数k₁までの周波数については波形符号化される。よって、波形符号化されたサイドまたは相補信号９２４は、第一の周波数k₁までの周波数に対応するスペクトル・データを含む。ミッド信号１０２６は、第一の周波数k₁より大きいある周波数までの周波数について波形符号化される。よって、ミッド信号９２６は、第一の周波数k₁より大きいある周波数までの周波数に対応するスペクトル・データを含む。いくつかの場合には、データ・ストリーム９２０において送られる必要のあるさらなるビットを節約するために、ミッド信号９２６の帯域幅も制限される。それにより、波形符号化されたミッド信号９２６は、第一の周波数k₁より大きい第二の周波数k₂までのスペクトル・データを含むようになる。

ミッド信号９２６の帯域幅が制限される場合、すなわち、ミッド信号９２６のスペクトル内容が第二の周波数k₂までの周波数に制約される場合、ミッド信号１０２６はHFRエンコード・コンポーネント１０４８によるHFRエンコードにかけられる。一般に、HFRエンコード・コンポーネント１０４８はミッド信号１０２６のスペクトル内容を解析し、パラメータ１０６０の集合を抽出する。それらのパラメータが、低周波数（この場合、第二の周波数k₂より上の周波数）についての信号のスペクトル内容に基づいて高周波数（この場合、第二の周波数k₂より上の周波数）についての信号のスペクトル内容の再構成を可能にする。そのようなHFRエンコード技法は当技術分野において既知であり、たとえばスペクトル帯域複製（SBR）技法を含む。パラメータ１０６０の集合は、データ・ストリーム９２０に含められる。

HFRエンコード・コンポーネント１０４８は典型的には直交ミラー・フィルタ（QMF）領域において動作する。したがって、HFRエンコードを実行するのに先立って、ミッド信号１０２６は時間／周波数変換コンポーネント１０４６によってQMF領域に変換されてもよい。

入力オーディオ信号９２８（あるいは代替的にはミッド信号１０４６およびサイド信号１０２４）は、パラメトリック・ステレオ（PS）エンコード・コンポーネント１０５２においてパラメトリック・ステレオ・エンコードにかけられる。一般に、パラメトリック・ステレオ・エンコード・コンポーネント１０５２は入力オーディオ信号９２８を解析し、第一の周波数k₁より上の周波数についてのミッド信号１０２６に基づいて入力オーディオ信号９２８の再構成を可能にするパラメータ１０６２を抽出する。パラメトリック・ステレオ・エンコード・コンポーネント１０５２はパラメトリック・ステレオ・エンコードのためのいかなる既知の技法を適用してもよい。

パラメトリック・ステレオ・エンコード・コンポーネント１０５２は典型的にはQMF領域において動作する。したがって、入力オーディオ信号９２８（あるいは代替的にはミッド信号１０４６およびサイド信号１０２４）は、時間／周波数変換コンポーネント１０４６によってQMF領域に変換されてもよい。

図１１は、高ビットレートに対応する第二の構成に従って機能するときのステレオ・エンコード・モジュール９０６を示している。ステレオ・エンコード・モジュール９０６は、第一のステレオ変換コンポーネント１１４０と、さまざまな時間／周波数変換コンポーネント１１４２、１１４６と、HFRエンコード・コンポーネント１０４８ａ、１０４８ｂと、波形符号化コンポーネント１１５６とを有する。任意的に、ステレオ・エンコード・モジュール９０６は第二のステレオ変換コンポーネント１１４３を有していてもよい。ステレオ・エンコード・モジュール９０６は入力オーディオ信号９２８のうちの二つを入力として取る。入力オーディオ信号９２８が時間領域で表現されていることが想定される。

第一のステレオ変換コンポーネント１１４０は、第一のステレオ変換コンポーネント１０４０と同様であり、入力オーディオ信号９２８をミッド信号１１２６およびサイド信号１１２４に変換する。

いくつかの実施形態では、ミッド信号１１２６およびサイド信号１１２４は次いで、第二のステレオ変換コンポーネント１１４３によってミッド／相補／a表現に変換される。第二のステレオ変換コンポーネント１０４３は、データ・ストリーム９２０に含めるために重み付けパラメータaを抽出する。重み付けパラメータaは時間および周波数依存であってもよい。すなわち、データの異なる時間フレームおよび周波数帯域の間で異なってもよい。波形符号化コンポーネント１１５６は次いでミッド信号１１２６およびサイドもしくは相補信号を波形符号化にかけ、それにより波形符号化されたミッド信号９２６および波形符号化されたサイドもしくは相補信号９２４を生成する。

波形符号化コンポーネント１１５６は図１０の波形符号化コンポーネント１０５６と同様である。ただし、出力信号９２６、９２４の帯域幅に関して重要な違いが現われる。より正確には、波形符号化コンポーネント１１５６は、第二の周波数k₂（これは典型的には、中程度のレートの場合に関して述べた第一の周波数k₁より大きい）までのミッド信号１１２６およびサイドもしくは相補信号の波形符号化を実行する。結果として、波形符号化されたミッド信号９２６および波形符号化されたサイドもしくは相補信号９２４は、第二の周波数k₂までの周波数に対応するスペクトル・データを含む。いくつかの場合には、第二の周波数k₂はシステムによって表現される最大周波数に対応してもよい。他の場合には、第二の周波数k₂はシステムによって表現される最大周波数より低くてもよい。

第二の周波数k₂がシステムによって表現される最大周波数より低い場合、入力オーディオ信号９２８はHFRコンポーネント１１４８ａ、１１４８ｂによるHFRエンコードにかけられる。HFRエンコード・コンポーネント１１４８ａ、１１４８ｂのそれぞれは、図１０のHFRエンコード・コンポーネント１０４８と同様に動作する。よって、HFRエンコード・コンポーネント１１４８ａ、１１４８ｂはそれぞれパラメータの第一の集合１１６０ａおよびパラメータの第二の集合１１６０ｂを生成する。これらは、低周波数（この場合、第二の周波数k₂より上の周波数）についての入力オーディオ信号９２８のスペクトル内容に基づいて高周波数（この場合、第二の周波数k₂より上の周波数）についてのそれぞれの入力オーディオ信号のスペクトル内容の再構成を可能にする。パラメータの第一および第二の集合１１６０ａ、１１６０ｂは、データ・ストリーム９２０に含められる。

〈等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。

さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する／含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。

上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働するいくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体（または非一時的な媒体）および通信媒体（または一時的な媒体）を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク（DVD）または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。

すべての図面は概略的であり、一般に、本開示を明快にするために必要な部分を示すのみである。一方、他の部分は省略されたり示唆されるだけであったりすることがある。特に断わりのない限り、同様の参照符号は異なる図面における同様の部分を指す。

いくつかの態様を記載しておく。
〔態様１〕
N個のチャネルをもつスピーカー構成での再生のための複数の入力オーディオ信号をデコードするデコーダにおける方法であって、前記複数の入力オーディオ信号は少なくともN個のチャネルに対応するエンコードされたマルチチャネル・オーディオ・コンテンツを表わし、当該方法は：
M個の入力オーディオ信号を受領する段階であって、1＜M≦N≦2Mである、段階と；
第一のデコード・モジュールにおいて、前記M個の入力オーディオ信号を、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号にデコードする段階と；
前記N個のチャネルのうちM個のチャネルを超過するそれぞれについて、
前記M個のミッド信号の一つに対応する追加的な入力オーディオ信号を受領し、前記追加的な入力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号であり；
ステレオ・デコード・モジュールにおいて、前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードして、前記スピーカー構成のN個のチャネルのうちの二つでの再生に好適な第一および第二のオーディオ信号を含むステレオ信号を生成する段階とを含み、
それにより、前記スピーカー構成のN個のチャネルでの再生のために好適なN個のオーディオ信号が生成される、
方法。
〔態様２〕
前記ステレオ・デコード・モジュールは、前記デコーダがデータを受領するビットレートに依存して少なくとも二つの構成において動作可能であり、当該方法はさらに、前記少なくとも二つの構成のどちらを前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードする段階において使うかに関する指示を受領することを含む、態様１記載の方法。
〔態様３〕
追加的な入力オーディオ信号を受領する前記段階は：
前記M個のミッド信号の第一のものに対応する追加的な入力オーディオ信号および前記M個のミッド信号の第二のものに対応する追加的な入力オーディオ信号をジョイント・エンコードしたものに対応する一対のオーディオ信号を受領し；
前記一対のオーディオ信号をデコードして、前記M個のミッド信号の前記第一のものおよび前記第二のものにそれぞれ対応する前記追加的な入力オーディオ信号を生成することを含む、
態様１または２記載の方法。
〔態様４〕
前記追加的な入力オーディオ信号は第一の周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号であり、前記対応するミッド信号は前記第一の周波数より大きいある周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号であり、前記ステレオ・デコード・モジュールの前記第一の構成に従って前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードする段階は：
前記追加的なオーディオ入力信号が相補信号の形である場合には、前記第一の周波数までの周波数についてのサイド信号を、前記ミッド信号に重み付けパラメータaを乗算し、該乗算の結果を前記相補信号に加えることによって計算する段階と；
前記ミッド信号および前記サイド信号をアップミックスして、第一および第二のオーディオ信号を含むステレオ信号を生成する段階であって、前記第一の周波数より下の周波数については、前記アップミックスは、前記ミッド信号および前記サイド信号の逆和差変換を実行し、前記第一の周波数より上の周波数については、前記アップミックスは前記ミッド信号のパラメトリック・アップミックスを実行することとを含む、段階とを含む、
態様２または３記載の方法。
〔態様５〕
前記波形符号化されたミッド信号は、第二の周波数までの周波数に対応するスペクトル・データを含み、当該方法はさらに：
パラメトリック・アップミックスを実行するのに先立って、高周波再構成を実行することによって前記第二の周波数より上の周波数範囲まで前記ミッド信号を拡張することを含む、
態様４記載の方法。
〔態様６〕
前記追加的な入力オーディオ信号および前記対応するミッド信号は、第二の周波数までの周波数に対応するスペクトル・データを含む波形符号化された信号であり、前記ステレオ・デコード・モジュールの前記第二の構成に従って前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードする段階は：
前記追加的なオーディオ入力信号が相補信号の形である場合には、サイド信号を、前記ミッド信号に前記重み付けパラメータaを乗算し、該乗算の結果を前記相補信号に加えることによって計算する段階と；
前記ミッド信号および前記サイド信号の逆和差変換を実行し、第一および第二のオーディオ信号を含むステレオ信号を生成する段階とを含む、
態様２または３記載の方法。
〔態様７〕
前記ステレオ信号の前記第一および第二のオーディオ信号を、高周波再構成を実行することによって前記第二の周波数より上の周波数範囲まで拡張することをさらに含む、
態様６記載の方法。
〔態様８〕
M個のミッド信号がM個のチャネルをもつスピーカー構成で再生されるべきであり、当該方法はさらに：
前記M個のミッド信号の少なくとも一つおよびその対応する追加的なオーディオ入力信号から生成されうる前記ステレオ信号の前記第一および第二のオーディオ信号に関連付けられている高周波再構成パラメータに基づいて高周波再構成を実行することによって、前記M個のミッド信号の前記少なくとも一つの、周波数範囲を拡張することをさらに含む、態様１ないし７のうちいずれか一項記載の方法。
〔態様９〕
前記追加的な入力オーディオ信号がサイド信号の形であり、前記追加的な入力オーディオ信号および前記対応するミッド信号は、異なる変換サイズをもつ修正離散コサイン変換を使って波形符号化される、態様１ないし８のうちいずれか一項記載の方法。
〔態様１０〕
態様１ないし９のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様１１〕
N個のチャネルをもつスピーカー構成での再生のための複数の入力オーディオ信号をデコードするデコーダであって、前記複数の入力オーディオ信号は少なくともN個のチャネルに対応するエンコードされたマルチチャネル・オーディオ・コンテンツを表わし、当該デコーダは：
M個の入力オーディオ信号を受領するよう構成された受領コンポーネントであって、1＜M≦N≦2Mである、受領コンポーネントと；
前記M個の入力オーディオ信号を、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号にデコードするよう構成された第一のデコード・モジュールと；
前記N個のチャネルのうちM個のチャネルを超過するそれぞれについてのステレオ符号化モジュールとを有しており、前記ステレオ符号化モジュールは：
前記M個のミッド信号の一つに対応する追加的な入力オーディオ信号を受領し、前記追加的な入力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号であり；
前記追加的な入力オーディオ信号およびその対応するミッド信号をデコードして、前記スピーカー構成のN個のチャネルのうちの二つでの再生に好適な第一および第二のオーディオ信号を含むステレオ信号を生成するよう構成されており、
それにより、当該デコーダは、前記スピーカー構成のN個のチャネルでの再生のために好適なN個のオーディオ信号を生成するよう構成される、
デコーダ。
〔態様１２〕
K個のチャネルに対応するマルチチャネル・オーディオ・コンテンツを表わす複数の入力オーディオ信号をエンコードするためのエンコーダにおける方法であって：
K個のチャネルをもつスピーカー構成のチャネルに対応するK個の入力オーディオ信号を受領する段階と；
前記K個の入力オーディオ信号から、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号およびK−M個の出力オーディオ信号を生成する段階であって、1＜M＜K≦2Mであり、
前記ミッド信号のうち2M−K個は、前記入力オーディオ信号のうちの2M−K個に対応し、
残りのK−M個のミッド信号および前記K−M個の出力オーディオ信号は、Mを超えるKの各値について、
ステレオ・エンコード・モジュールにおいて、前記K個の入力オーディオ信号のうちの二つをエンコードしてミッド信号および出力オーディオ信号を生成することによって生成され、前記出力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号である、段階と；
第二のエンコード・モジュールにおいて、前記M個のミッド信号をM個の追加的な出力オーディオ・チャネルにエンコードする段階と；
前記K−M個の出力オーディオ信号および前記M個の追加的な出力オーディオ・チャネルをデコーダに伝送するためのデータ・ストリームに含める段階とを含む、
方法。
〔態様１３〕
前記ステレオ・エンコード・モジュールは、当該エンコーダの所望されるビットレートに依存して少なくとも二つの構成で動作可能であり、当該方法はさらに、前記少なくとも二つの構成のどちらが前記K個の入力オーディオ信号のうちの二つをエンコードする段階において前記ステレオ・エンコード・モジュールによって使用されたかに関する指示を前記データ・ストリーム中に含める段階を含む、態様１２記載の方法。
〔態様１４〕
前記データ・ストリームに含めるのに先立ってペアごとに前記K−M個の出力オーディオ信号のステレオ・エンコードを実行する段階をさらに含む、態様１２または１３記載の方法。
〔態様１５〕
前記ステレオ・エンコード・モジュールが第一の構成に従って動作する条件で、前記K個の入力オーディオ信号のうちの二つをエンコードしてミッド信号および出力オーディオ信号を生成する段階は：
前記二つの入力オーディオ信号をミッド信号である第一の信号およびサイド信号である第二の信号に変換する段階と；
前記第一および第二の信号を第一および第二の波形符号化された信号にそれぞれ波形符号化する段階であって、前記第二の信号は第一の周波数まで波形符号化され、前記第一の信号は前記第一の周波数より大きい第二の周波数まで波形符号化される、段階と；
前記第一の周波数より上の周波数について、前記K個の入力オーディオ信号のうちの前記二つのスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを抽出するために、前記二つの入力オーディオ信号をパラメトリック・ステレオ・エンコードにかける段階と；
前記第一および第二の波形符号化された信号および前記パラメトリック・ステレオ・パラメータを前記データ・ストリーム中に含める段階とを含む、
態様１２ないし１４のうちいずれか一項記載の方法。
〔態様１６〕
前記第一の周波数より下の周波数について、ミッド信号である前記波形符号化された第一の信号に重み付け因子aを乗算し、該乗算の結果を前記第二の波形符号化された信号から減算することによって、サイド信号である前記波形符号化された第二の信号を相補信号に変換する段階と；
前記重み付けパラメータaを前記データ・ストリーム中に含める段階とをさらに含む、
態様１５記載の方法。
〔態様１７〕
前記第二の周波数より上の前記第一の信号の高周波再構成を可能にする高周波再構成パラメータを生成するために、ミッド信号である前記第一の信号を高周波再構成エンコードにかける段階と；
前記高周波再構成パラメータを前記データ・ストリーム中に含める段階とをさらに含む、
態様１５または１６記載の方法。
〔態様１８〕
前記ステレオ・エンコード・モジュールが第二の構成に従って動作する条件で、前記K個の入力オーディオ信号のうちの二つをエンコードしてミッド信号および出力オーディオ信号を生成する段階は：
前記二つの入力オーディオ信号を、ミッド信号である第一の信号およびサイド信号である第二の信号に変換する段階と；
前記第一および第二の信号をそれぞれ第一および第二の波形符号化された信号に波形符号化する段階であって、前記第一および第二の信号は第二の周波数まで波形符号化される、段階と；
前記第一および第二の波形符号化された信号を含める段階とを含む、
態様１２ないし１４のうちいずれか一項記載の方法。
〔態様１９〕
ミッド信号である前記波形符号化された第一の信号に重み付け因子aを乗算し、該乗算の結果を前記第二の波形符号化された信号から減算することによって、サイド信号である前記波形符号化された第二の信号を相補信号に変換する段階と；
前記重み付けパラメータaを前記データ・ストリーム中に含める段階とをさらに含む、
態様１８記載の方法。
〔態様２０〕
前記第二の周波数より上の前記N個の入力オーディオ信号のうちの前記二つの高周波再構成を可能にする高周波再構成パラメータを生成するために、前記K個の入力オーディオ信号のうちの前記二つのそれぞれを、高周波再構成エンコードにかける段階と；
前記高周波再構成パラメータを前記データ・ストリーム中に含める段階とを含む、
態様１８または１９記載の方法。
〔態様２１〕
態様１２ないし２０のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様２２〕
K個のチャネルに対応するマルチチャネル・オーディオ・コンテンツを表わす複数の入力オーディオ信号をエンコードするためのエンコーダであって：
K個のチャネルをもつスピーカー構成のチャネルに対応するK個の入力オーディオ信号を受領するよう構成された受領コンポーネントと；
前記K個の入力オーディオ信号から、M個のチャネルをもつスピーカー構成での再生に好適なM個のミッド信号およびK−M個の出力オーディオ信号を生成するよう構成された第一のエンコード・モジュールであって、1＜M＜K≦2Mであり、
前記ミッド信号の2M−K個は、前記入力オーディオ信号の2M−K個に対応し、
前記第一のエンコード・モジュールは、残りのK−M個のミッド信号およびK−M個の出力オーディオ信号を生成するよう構成されたK−M個のステレオ・エンコード・モジュールを有しており、各ステレオ・エンコード・モジュールは：
前記K個の入力オーディオ信号のうちの二つをエンコードしてミッド信号および出力オーディオ信号を生成するよう構成されており、前記出力オーディオ信号は、サイド信号または前記ミッド信号および重み付けパラメータaと一緒にサイド信号の再構成を許容する相補信号である、第一のエンコード・モジュールと；
前記M個のミッド信号をM個の追加的な出力オーディオ・チャネルにエンコードするよう構成された第二のエンコード・モジュールと；
前記K−M個の出力オーディオ信号および前記M個の追加的な出力オーディオ・チャネルをデコーダに伝送するためのデータ・ストリームに含めるよう構成された多重化コンポーネントとを有する、
エンコーダ。

Claims

エンコードされたオーディオ信号をデコードする方法であって、
複数の入力オーディオ信号を受領する段階であって、前記複数の入力オーディオ信号は第一の周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、前記第一の周波数より高い第二の周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号とを含む、段階と；
前記第一の波形符号化された信号をデコードして、前記第一の周波数までの周波数をもつ第一のデコードされたオーディオ信号を生成する段階であって、前記第一のデコードされたオーディオ信号はサイド信号を表わす、段階と；
前記第二の波形符号化された信号をデコードして、前記第二の周波数までの周波数をもつ第二のデコードされたオーディオ信号を生成する段階であって、前記第二のデコードされたオーディオ信号はミッド信号を表わす、段階と；
前記第一のデコードされた信号および前記第二のデコードされた信号に関して向上された逆和差変換を実行して、前記第一の周波数までのステレオ・オーディオ信号を生成する段階であって、前記向上された逆和差変換は、前記ミッド信号に重み付けパラメータを適用することを含む、段階と；
前記第一の周波数より上の周波数について、ミッド信号を表わす前記第二のデコードされたオーディオ信号のパラメトリック・アップミックスを実行して、前記第二の周波数までのステレオ・オーディオ信号を生成する段階と；
前記第一の周波数までの周波数をもつステレオ・オーディオ信号を前記第二の周波数までの周波数をもつステレオ・オーディオ信号と組み合わせる段階とを含む、
方法。
前記重み付けパラメータが時間変化する、請求項１記載の方法。
前記向上された逆和差変換がL＝(1＋a)A＋Bに従って左チャネルLを生成し、aは前記重み付けパラメータであり、Aは前記ミッド信号であり、Bは前記サイド信号である、請求項１記載の方法。
前記向上された逆和差変換がR＝(1−a)A−Bに従って右チャネルRを生成し、aは前記重み付けパラメータであり、Aは前記ミッド信号であり、Bは前記サイド信号である、請求項１記載の方法。
前記重み付けパラメータは実数値である、請求項１記載の方法。
前記重み付けパラメータは前記エンコードされたオーディオ信号に含まれている、請求項１記載の方法。
エンコードされたオーディオ信号をデコードするオーディオ・デコーダであって、
複数の入力オーディオ信号を受領するインターフェースであって、前記複数の入力オーディオ信号は第一の周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、前記第一の周波数より高い第二の周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号とを含む、インターフェースと；
前記第一の波形符号化された信号をデコードして、前記第一の周波数までの周波数をもつ第一のデコードされたオーディオ信号を生成するデコーダであって、前記第一のデコードされたオーディオ信号はサイド信号を表わす、デコーダと；
前記第二の波形符号化された信号をデコードして、前記第二の周波数までの周波数をもつ第二のデコードされたオーディオ信号を生成するデコーダであって、前記第二のデコードされたオーディオ信号はミッド信号を表わす、デコーダと；
前記第一のデコードされた信号および前記第二のデコードされた信号に関して向上された逆和差変換を実行して、前記第一の周波数までのステレオ・オーディオ信号を生成する変換器であって、前記向上された逆和差変換は、前記ミッド信号に重み付けパラメータを適用することを含む、変換器と；
前記第一の周波数より上の周波数について、ミッド信号を表わす前記第二のデコードされたオーディオ信号のパラメトリック・アップミックスを実行して、前記第二の周波数までのステレオ・オーディオ信号を生成する変換器と；
前記第一の周波数までの周波数をもつステレオ・オーディオ信号を前記第二の周波数までの周波数をもつステレオ・オーディオ信号と組み合わせる合成器とを有する、
オーディオ・デコーダ。
前記重み付けパラメータが時間変化する、請求項７記載のオーディオ・デコーダ。
前記向上された逆和差変換がL＝(1＋a)A＋Bに従って左チャネルLを生成し、aは前記重み付けパラメータであり、Aは前記ミッド信号であり、Bは前記サイド信号である、請求項７記載のオーディオ・デコーダ。
前記向上された逆和差変換がR＝(1−a)A−Bに従って右チャネルRを生成し、aは前記重み付けパラメータであり、Aは前記ミッド信号であり、Bは前記サイド信号である、請求項７記載のオーディオ・デコーダ。
前記重み付けパラメータは実数値である、請求項７記載のオーディオ・デコーダ。
前記重み付けパラメータは前記エンコードされたオーディオ信号に含まれている、請求項７記載のオーディオ・デコーダ。