JP2013546021A

JP2013546021A - ダウンミックス制限

Info

Publication number: JP2013546021A
Application number: JP2013538876A
Authority: JP
Inventors: ウィルソン，ロンダ; ワード，ミカエル; ヴェネズイア，スティーヴン; ドレスラー，ロジャー
Original assignee: ドルビーラボラトリーズライセンシングコーポレイション
Priority date: 2010-11-12
Filing date: 2011-11-10
Publication date: 2013-12-26
Anticipated expiration: 2031-11-10
Also published as: CA2815190C; CN103201792B; JP5684917B2; US9224400B2; KR101496754B1; IL225858A0; HK1187442A1; AU2011326473B2; KR20130080852A; EP2638543B1; US20130230177A1; RU2565015C2; WO2012064929A1; CA2815190A1; TWI462087B; AR083783A1; SG190050A1; IL225858A; MX2013004922A; AU2011326473A1

Abstract

本発明は、ダウンミキシング技法に関しており、それにより、出力オーディオ信号が、サブグループに分割された入力オーディオ信号から得られる。可変共通利得制限因子が、サブグループの入力信号からの寄与を支配する全てのダウンミックス係数に適用される。サブグループ内の信号値間の割合を保持しながら、本発明は、比較的より知覚可能な信号が比較的少なく制限されうるように、異なる入力信号サブグループの利得を異なる程度で制限することを可能にする。すると、利得制限がある信号部分と利得制限がない信号部分との間でより知覚可能でない方式で遷移しながら、一貫性があるダイアログレベルを達成することが可能になる。本発明の実施形態は、方法、ミキシングシステム、およびコンピュータプログラム製品を含む。

Description

本出願は、参照によりその全体が組込まれる、２０１０年１１月１２日に出願された米国特許仮出願第６１／４１３，２３７号に対して優先権を主張する。

本明細書で開示される発明は、一般に、アナログまたはデジタルオーディオ信号処理技法に関する。より詳細には、本発明は、少数のオーディオ信号への多数のオーディオ信号のダウンミキシングに関する。

本明細書で使用されるように、ダウンミキシングは、Ｍ個の入力オーディオ信号（またはチャネル）によってエンコードされた情報からＮ個の出力オーディオ信号（またはチャネル）を導出するオペレーションを指す（１≦Ｎ＜Ｍ）。高品質ダウンミキシングに関する一般的な期待は、低い情報損失、適合性があるダイアログレベル、および入力信号と出力信号との間の心理音響的高忠実度を含む。

ダウンミキシングは、しばしば、１つの信号になるように２つの信号を結合することを含み、それを、波形加算、変換係数加算、加重平均、または同様なものによって行う。ステレオ−モノダウンミキシングは、簡単な関係

によって表現できるが、一般的なＭ−Ｎダウンミキシングは、

として行列形態で書くことができる。ここで、ダウンミックス係数ａ_ｋ１、…、ａ_ｋＭによって表現される、所与の出力チャネルｙ_ｋに寄与する入力チャネル間の相対重み分布は、芸術的検討から得られてもよく、または、再生用オーディオ源の空間的レイアウトに関連していてもよい。ダウンミックス係数の相対比を固定した後、ダウンミキシングの利得は、１つの入力チャネルがいくつかの出力チャネルに寄与する場合、他の関心事、特にエネルギー保存によって決定されてもよい。他の状況では、優先事項は、一貫性があるダイアログレベルを維持することとすることができる。この要件は、異なるタイプのミキシングまたはエンコーディングによって得られているにもかかわらずオーディオセクションをシームレスに共に結合することを可能にする。

利得がエネルギー保存によって選択されていようが、ダイアログレベル要件に応答して選択されていようが、ダウンミキシングにおいてしばしば遭遇される困難さは、出力信号がその許容範囲を超えることである。出力信号をクリップすること、または、再生用オーディオ機器を損傷することを回避するために、当技術分野における一般的な慣行は、局所的に―範囲外の値が普通なら生成されることになる時点でまたはその時点のまわりで―、または、大域的に利得を減少させることである。出力信号ｙ_ｋが範囲外である場合、総合利得は、

によって制限されることができる。ここで、０＜γ＜１は制限因子である。同様に、

によって、ｙ_ｋに寄与する信号の利得だけを減少させることもできる。制限因子がどのように適用されるかによらず、ダイアログレベルを満たすという要件と心理音響的に目立たない方法で制限を実施するという要件が両立しないことは明らかである。利得をより局所的に制限することは、ダイアログレベルの一貫性に有利であるが、より急激でかつより知覚可能な利得変化をもたらす。同様に、長い期間にわたって制限を実施することは、一方の問題を改善するが、他方の問題を悪化させる。したがって、改良型ダウンミキシング技法についての必要性が存在する。

従来技術に伴う問題の１つまたは複数を克服する、軽減する、または少なくとも緩和するために、心理音響的により目立たない方式でオーディオストリームをダウンミックスするための技法を提供することが本発明の目的である。本発明の特定の目的は、出力信号（複数可）をクリップすることを回避しながら、一貫性があるダイアログレベルを可能にするダウンミキシング技法を提供することである。本発明の別の特定の目的は、これらの一般的な特性を有し、オーディオの動的、時間的、および／または空間的特性を保持するのに適したダウンミキシング技法を提供することである。

本発明は、独立請求項による、方法、ミキシングシステム、およびコンピュータプログラム製品を提供することによってこれらの目的の少なくとも１つを達成する。従属請求項は、本発明の有利な実施形態を規定する。

第１の態様では、本発明は、入力データを搬送する複数の入力オーディオ信号を少なくとも１つの出力オーディオ信号にダウンミックスする方法を提供する。方法のミキシング特性は、最大ダウンミックス係数、出力オーディオ信号（複数可）に関する少なくとも１つの範囲内条件、および、サブグループへの入力信号の分割に依存する。本方法は、範囲内条件（複数可）を満たすために、同じサブグループに属する全ての最大ダウンミックス係数を共通制限因子によってダウンスケールすることによって最大ダウンミックス係数からダウンミックス係数を導出することを含む。こうして導出されるダウンミックス係数は、入力信号をダウンミックスするのに適する。

第２の態様では、本発明は、第１の態様の方法を実施するために適応されたミキシングシステムを提供する。第３の態様では、本発明は、プログラマブルなコンピュータに、第１の態様の方法を実行させるためのコンピュータプログラム製品を提供する。

本発明は、少なくとも２つのサブグループのうちのあるサブグループの入力信号の寄与を制御する全てのダウンミックス係数に、共通制限因子が適用されることを教示する。異なる入力信号を異なる程度に制限するこの自由裁量によって、比較的より知覚可能な信号が比較的少なく制限されうる。これは、一貫性があるダイアログレベルを、利得制限がある信号部分と利得制限がない信号部分との間の目立たない遷移と組合せることをより容易にする。

添付特許請求の範囲を参照して、信号はそれぞれ、アナログ（連続値）またはデジタル（離散値）とすることができることが留意される。「サブグループ(subgroup)」は、１つの入力信号またはいくつかの入力信号を含むことができる。信号に関する「範囲内条件(in-range condition)」は、信号に関する上限、信号に関する下限、または、信号が、下限および上限を有する区間内に留まるという要件を指すことができる。範囲内条件は、特定の時間セグメント、時間セグメントのセットに適用することができる、または、大域的であり、制限なしで信号全体に適用することができる。用語「範囲内条件」と「非クリップ条件(non-clip condition)」は本開示において交換可能に使用されることができることが理解される。用語「制限因子(limiting factor)」と「利得制限因子(gain limiting factor)」も同様である。したがって、各サブグループについての制限因子は、入力信号に割当てられた最大ダウンミックス係数そのものに基づくだけでなく、入力信号によって搬送される入力データにも基づいて決定される。最後に、ダウンミキシングオペレーション自体、すなわち、出力信号を得るために入力信号の線形結合を形成することは、それ自体は当技術分野で知られている技法によって実行されることができることが留意される。

局所的でない範囲内条件、局所的でない平滑化プロセス（以下を参照）、または適用される同様な処置を例外として、本発明は、リアルタイム実施形態と、オフライン実施形態、たとえばファイル−ファイルベースの〔ファイルごとの〕処理の両方を含む。

一実施形態では、少なくとも１つのサブグループは２つ以上の入力信号を含む。これらの全ての入力信号についてダウンミキシング係数をダウンスケールするために、共通制限因子が使用されるため、いくつかの入力信号の間の有意の関係が、ダウンミキシング下で保持されることができる。したがって、入力信号によって全体として伝達される、動的、時間的、音色的、および／または空間的な知覚印象は、本実施形態によるダウンミキシングによって制限された程度に影響を受けるだけである。

上記実施形態のさらなる発展において、入力信号は、レフトおよびライトチャネル；レフト、センター、およびライトチャネル；レフトおよびライトワイドチャネル；レフトおよびライトセンターチャネル；ならびにレフト、センター、およびライトサラウンドチャネルのような空間的に関連するオーディオチャネルに対応する。

一実施形態では、ダウンミックス係数は、できる限り大きく維持される。これは、一貫性があるダイアログレベルに有利である。たとえば、範囲内条件が、広義の不等号である場合、制限因子は、その上方の値（または「シャープな(sharp)」値または「タイトな(tight)」値または「イグザクトな(exact)」値）、すなわち、範囲内条件において等号をもたらす値に等しくまたはそれに近く設定されることができる。好ましくは、ダウンミックス係数は、上限によって決定された値から２０％を超えて、より好ましくは１０％を超えて、最も好ましくは５％を超えて異なるべきではない。ダウンミックス係数の平滑化をさらに含む実施形態（以下を参照）では、平滑化する前にダウンミックス係数が有する値に上記条件のうちの１つを課すことが好ましい。

一実施形態では、出力信号は、時間セグメントに分割される。時間セグメントは、同一の長さまたは不同の長さを有することができ、時間セグメントは、アナログデータのサンプリング、信号の変換ベース処理の結果であってもよいし、または、何らかの同様のプロセスに起因するのでもよい。時間セグメントは、多数のサンプルからなるとすることができる。あるいは、時間セグメントは、それぞれが多数のサンプルを含む多数のブロックからなるとすることができる。入力信号は、同様のまたは異なる時間セグメントに分割されてもよいし、または、分割されなくてもよい。本実施形態による方法は、範囲内条件を、各時間セグメントにおいて、この時間セグメントに関連する入力データに鑑みて、別々に満たすように試みてもよい。本方法は、範囲内条件を、全ての時間セグメントにおいてまたは一部の時間セグメントにおいて満たすように構成されてもよい。入力信号がゆっくり変動する場合、全ての時間セグメントが考慮される必要がないため、後者のオプションが、制限された品質低下で計算負荷を低減することができる。

いくつかの出力信号にするダウンミキシングを提供するのに適した変形において、本方法は、範囲内条件を、別個の時間セグメントにおいて、しかし連携して全ての出力信号について満たすように構成されてもよい。これは、出力信号の知覚される空間的均衡を保持することができる。

時間セグメントに分割された出力信号を提供する実施形態は、有利には、平滑化（または正則化）と組合されることができる。一例として、種々の時間セグメントについて得られた特定のダウンミックス係数の値は、（時間）シーケンスとして扱われることができ、平滑化オペレーションを受けてもよい。平滑化済みダウンミックス係数は、未平滑化ダウンミックス係数の代わりにダウンミキシングオペレーションで使用されることができる。１つまたはいくつかの選択されたダウンミックス係数あるいは全てのダウンミックス係数が平滑化を受けることができ、これらのプロセスは、互いに並列に働くことができる。特定のサブグループについての制限因子を平滑化することは、このサブグループの入力信号に作用するダウンミックス係数を平滑化することと同じ結果をもたらすことになることを当業者は認識するであろう。したがって、これらの両方の手法が本発明の範囲内に入るが、本開示は、両方を詳細に述べる必要はない。

平滑化は、それ自体としては当技術分野で知られている任意の適したプロセスによって実行されることができる。好ましくは、平滑化は、変化レートの上限によって支配される。こうして平滑化した後、セグメントごとの値のシーケンス内の孤立した値は、急激な変化を回避するように、穏やかに変化する値の下方ランプおよび上方ランプによって囲まれることになる。これらのランプは、線形スケールまたはｄＢスケールなどの対数スケール上でコンスタントな増加または減少を特徴とすることができる。したがって、（絶対値の）増加または減少が大きくなり過ぎない平滑化済みダウンミックス係数が得られるようダウンミックス係数値を調整することによって、ダウンミックスされる信号の利得制限部分と利得非制限部分との間の徐々の、したがってより知覚可能でない遷移を得ることができる。別の好ましいオプションは、元の値を減少させるかまたは維持することによりダウンミックス係数を調整することによって平滑化を実行することである。元のダウンミックス係数を増加させることは、範囲内条件が、その後もはや満たされない場合があるため、回避されるべきである。

一実施形態では、入力信号の少なくとも１つのサブグループは、そのサブグループの入力信号に作用するダウンミックス係数を決定するために使用される制限因子に関する下限に関連付けられる。かかる限界は、本発明のこの実施形態が、かかる下限を超える解だけを探すことによって出力信号に関する範囲内条件を満たそうと試みるという意味で先験的限界である。これは、関係しているサブグループからの寄与が、任意に小さくならないことを保証する。

上記の実施形態のさらなる発展において、１次（primary）および２次（secondary）のサブグループは、それらの各制限因子に関して異なる下限（または先験的限界）に関連付けられる。１次サブグループに関連付けられる下限は、２次サブグループに関連付けられる下限以上である。これは、サブグループ間の相対的均衡を規定するために使用されることができる。たとえば、１次サブグループは、２次サブグループに比べて、相対的により大きな心理音響的重要性を与えられることができる。

別の実施形態では、範囲内条件を満たすための制限因子の値の探索は、１次グループを有利にするように構成されることができる。特に、この実施形態による方法は、１次サブグループ制限因子が１次サブグループについての制限因子に関する上限に等しいまたはその上限に近い、範囲内条件を満たす制限因子の値を探索するように構成されることができる。

上記の実施形態に対する変形において、１次サブグループおよび２次サブグループのための各制限因子について上限および下限が規定されることができる。この実施形態による方法は、その上限に等しい１次サブグループ制限因子を含む解を最初に探すように構成される。２次サブグループ制限因子は、その上限と下限との間で変動する。その後、範囲内条件に対する解が見出されない場合、本方法は、その下限に等しい２次サブグループ制限因子を含む解を探す。１次サブグループ制限因子は、その上限と下限との間で変えられる。言い換えると、本方法は、最初に、両方の制限因子をその最大値（一貫性があるダイアログレベルを最もよく保持することになる値）に等しく設定し、次に、制限因子を選択的な方式で減少させ、ついには、それによって範囲内条件が満たされる一対の制限因子が見出される。選択的な減少は、最初に２次サブグループ制限因子をその下限まで減少させ、次いで必要であれば、１次サブグループ制限因子も減少させることを含む。有利には、これは、知覚的により重要であるチャネルとして規定されることができる１次チャネルが、利得制限によってできる限り少なく影響されることを保証する。

１次および２次のサブグループが識別される上記実施形態を参照して、１次サブグループは、心理音響的観点からより重要であるチャネルに対応する信号を含むとすることができる。これらは、リスナーの前のハーフスペース〔半空間〕内に位置するオーディオ源による再生のために意図されたチャネルを含み、２次グループは、その後、残りのチャネル、特にリスナーの背後または側面での再生のために意図されたチャネルを集めることができる。別のモデルによれば、１次チャネルは、リスナー（またはリスナーの耳）と実質的に同じ高さに位置するかつ／または実質的に水平に伝播するオーディオ源による再生のために意図されたチャネルとすることができ、その際、２次グループは、他の高さのおよび／または非水平に伝播する再生のための残りのチャネルを含むことができる。さらに別のオプションとして、１次サブグループは、フロントハーフスペース〔前方半空間〕内でかつリスナーと実質的に同じ高さで再生されるチャネルからなるとすることができる。

一実施形態では、サブグループのうち少なくとも１つのサブグループは、そのサブグループについての制限因子に関する上限に関連付けられる。いくつかのサブグループが、それらの制限因子に関する上限を割当てられ、本方法が、可能な最大の制限因子を解として探索するように構成される実施形態では、それらの上限に等しい両方の制限因子の組合せが、許容できる解である。この状況では、異なるサブグループからの入力信号間の、予め規定された最大ダウンミックス係数によって表現される割合〔プロポーション〕がダウンミキシング下で保持されるように、上限を等しく設定することが好ましい。

一実施形態は、空間的に関連するチャネルに対応する少なくとも２つのオーディオ信号を提供するように構成される。こうした空間的に関連するチャネルは、以下のチャネルグループまたはそれらの組合せの１つに属することができる。以下のチャネルグループとは、フロント、サラウンド、リアサラウンド、ダイレクトサラウンド、ワイド、センター、サイド、ハイ、バーチカルハイである。本発明は、全ての出力チャネルについて範囲内条件を連携して満たすために、各サブグループについて１つの制限因子を導出することを教示する。これは、入力信号の知覚される空間的均衡を、出力信号の対応する均衡に移し、したがって、オーディオ源の知覚される位置の望ましくないドリフトおよび同様な問題を回避することができる。１つの特定の実施形態では、共通制限因子の決定は、２つのサブステップで起こる場合がある。第１に、ダウンミックス係数は、最大ダウンミックス係数と予備的制限因子との積として決定され、予備的制限因子は、関係しているサブグループの入力信号から導出される（空間的に関連する）出力信号のそれぞれに関して範囲内条件を満たす。第２に、このサブグループに適用される制限因子は、第１のサブステップの前記出力信号について導出された全ての予備的制限因子の最小を抽出することによって得られる。

一実施形態では、エンコーディングシステムは、複数のオーディオ信号を受信し、本発明に従ってこれらの信号を少なくとも１つのダウンミックス信号にダウンミックスし、ダウンミックス信号（複数可）をビットストリームとしてエンコードするように適応される。

一実施形態では、デコーディングシステムは、オーディオ信号をエンコードするビットストリームおよび本発明に従って生成されるダウンミックス仕様を受信するように適応される。ダウンミックス仕様は、ダウンミックス係数および／またはサブグループへの信号の分割を含むことができる。デコーダは、ダウンミックス仕様に従って、たとえばダウンミックス係数を適用することによって、オーディオ信号を少なくとも１つのダウンミックス信号にダウンミックスするようにさらに適応される。

一実施形態では、デコーディングシステムは、入力ポート、デコーダ、およびミキサーを含むことができる。デコーディングシステムは、本発明に従って生成される仕様に従って信号をデコードしダウンミックスするように適応される。上記において見られるように、本発明は、信号の各サブグループ内で共通である乗算的制限因子によって範囲内条件を満たすためにダウンミックス係数がダウンスケールされることを教示する。これは、１つのサブグループの信号に適用される係数の比が一定であり、一方、異なるサブグループの信号に適用される係数の比が可変であることを示唆することになる。ここで、用語「一定の(constant)」および「可変の(variable)」は、ダウンミックス係数の異なるセット間の考えられる変動についていう。たとえば、各時間セグメントについてダウンミックス係数の１つのセットが計算されることができる。しかし、本発明が教示するように、ダウンミキシングシステムは、こうしたセット内のダウンミックス係数間の一定の比を保持することになる。比の一部が可変であるため、デコーディングシステムは、（たとえば、１次サブグループ内の）比較的より知覚可能な信号を比較的少なく制限するように適応されていてもよい。これは、一貫性があるダイアログレベルを、利得制限がある信号部分と利得制限がない信号部分との間の目立たない組合せることをより容易にする。サブグループが２つ以上の信号を含む場合、デコーディングシステムは、これらの信号間の有意の関係を、その組合されたデコーディングとダウンミキシングの下で保持することができるため、入力信号によって全体として伝達される、動的、時間的、音色的、および／または空間的な知覚印象はわずかな程度に影響を受けるだけである。

本発明は、特許請求の範囲で挙げた特徴の可能な全ての組合せに関することが留意される。

本発明は、ここで、添付図面を参照してより詳細に述べられるであろう。

ある実施形態によるミキシングシステムの一部分の一般化されたブロック図である。ある実施形態による、１次および２次のサブグループについてのミキシング因子の選択を示すグラフである。ある実施形態による、最大ダウンミックス係数に基づく制限因子についての許容できる区間の選択を示す２つのグラフである。ある実施形態によるミキシングシステムの一般化されたブロック図である。ある実施形態の一部を形成する平滑化プロセスを示す図である。

図１は、本発明のある実施形態によるミキシングシステム１００の一部分を示す。システム１００は、ｋ番目の出力信号に関する以下の範囲内条件を満たすように適応される。

第１の乗算器１０１および加算器１０３は、

により、１番目、２番目、および４番目の入力信号に基づいてｋ番目の出力信号を計算する。ここで、ａ_ｋ１、ａ_ｋ２、ａ_ｋ４は、制限がない場合に入力信号の相対的重みを決定する予め規定された最大ダウンミックス係数である。予め規定された分割によって、１番目および４番目の入力信号は第１のサブグループに属し、一方、２番目および３番目の入力信号は第２のサブグループに属する。サブグループへのこの分割に鑑みて、コントローラ１０４は、

において制限因子α_１、α_２＞０の値を選択することによって範囲内条件(5)を満たすように試みることになる。図１を参照して、第２の乗算器１０２は、制限因子α_１、α_２を入力信号に適用する。コントローラ１０４は、出力信号ｙ_ｋの値に応答して制限因子α_１、α_２の値を選択する。

ここで先に論じた全体のミキシングシステム１００を参照して、ダウンミキシング時に入力信号を制限するアクションは、次の通りに行列表記で表現されることができる。制限なしのダウンミキシングは、関係Ｙ＝ＡＸに従う。ここで、Ｘ、Ｙは、入力および出力の信号ベクトルであり、

である。制限ありのダウンミキシングは、式

に従い、

および

である。明らかに、範囲内条件

および

（ここで、

は定ベクトルである）の１つが課される場合、制限因子α_１、α_２は、全ての出力信号に関する範囲内条件が連携して満たされるように十分に小さく選択されることになる。

本発明による利得制限は、上記サブグループを異なるように処理することによって、より少なく知覚可能にされることができる。第１のサブグループ｛ｙ_１，ｙ_４｝は、１次サブグループとして処理されることができ、一方、第２のサブグループ｛ｙ_２，ｙ_３｝は、２次サブグループとして処理されることができる。たとえば、１次サブグループ内の信号は、主要な心理音響的重要性があるフロントレフトおよびフロントライト信号に対応するとすることができる。２次サブグループ内の信号は、フロントでないオーディオ源による再生のために意図され、したがって、より低い重要性を保持するサラウンドレフトおよびサラウンドライトに対応するとすることができる。

２つのサブグループの不等の重要性を反映するために、本実施形態によるミキシングシステム１００は、１次制限因子を区間Ｌ_１≦α_１≦Ｕ_１から選択し、２次制限因子を区間Ｌ_２≦α_２≦Ｕ_２から選択することができる。適切には、Ｌ_１，Ｌ_２＞０である。

これについて、これから、例によって示す。その例では、上限が等しく（そのことが、可能な場合には最大ダウンミキシング係数によって表現されるミキシング割合〔プロポーション〕を保持する）かつ１である、すなわちＵ_１＝Ｕ_２＝１であると仮定される。さらに、

であると仮定される。

明らかに、式（６）にてａ_ｋ１ｘ_１＋ａ_ｋ４ｘ_４＝０．５でありかつａ_ｋ２ｘ_２＝０．４である状況では、利得制限は全く必要とされないため、制限因子は、（α_１，α_２）＝（１，１）に設定され、それでも範囲内条件を満たすことができる、すなわち、最大ダウンミキシング係数がダウンミキシング係数として適用される。

さて、式（６）にてａ_ｋ１ｘ_１＋ａ_ｋ４ｘ_４＝０．８でありかつａ_ｋ２ｘ_２＝０．４である場合、範囲内条件｜ｙ_ｋ｜≦１は、図２に示す

および

の角を有する五角形エリア内の制限因子対（α_１，α_２）によって満たされる。既に述べた理由で、利得は、好ましくは必要以上に制限されず、相応して、システム１００は、好ましくは、

と

との間のエッジセグメントから制限因子を選択することによって、上方の（または、「シャープな」）解ｙ_ｋ＝１を見出そうと試みる。さらに、１次入力チャネルではなく２次入力チャネルを制限することが有利であり、これは、このセグメント上で右端（最も大きいα_１）の制限因子の対を選択することに相当する。これは、解

をもたらし、ｋ番目の出力信号は、

で与えられることになる。しかし、

である場合、１次制限因子α_１は、必ず、その上限Ｕ_１＝１より小さいであろう。２次サブグループに比べて１次サブグループを最大限有利にするために、制限因子の好ましい選択は、

である。

この実施形態に対する変形では、システム１００が先の節の例で述べた方法と異なる方法で制限因子を探索するように構成され、１次サブグループは、２次サブグループより大きい下限に関連付けられる、すなわち、Ｌ_１＞Ｌ_２であることによって有利されることができる。

一実施形態では、ミキシングシステム１００は、最大ダウンミックス係数に基づいて制限因子に関する適した上限および下限を決定することができる。範囲内条件が−１≦Ｙ≦１である場合、数Ｗ≦１が与えられ、限界が、

の形態で書かれ、次に、この実施形態は、

を使用する。ここで、Ｐは、１次サブグループの信号に適用されるダウンミックス係数の絶対値の和であり、Ｓは、２次サブグループの信号に適用されるダウンミックス係数の絶対値の和である。定数０＜Ｑ＜１の値を変動させることによって、１次信号よりむしろ２次信号を制限するというシステム１００の傾向が、いくぶん顕著にされうる。先に論じた例では、Ｐ＝｜ａ_ｋ１｜＋｜ａ_ｋ４｜でありかつＳ＝｜ａ_ｋ２｜である。

図３Ａおよび図３Ｂでは、網点を付した領域は、２重不等式
−１≦Ｗ（ｍ_ＰＰ＋ｍ_ＳＳ）≦１
を満たす制限因子の選択（α_１，α_２）を示し、この２重不等式は、全ての入力信号が１の大きさを有しかつダウンミックス係数と同じ符号を持つ、すなわち、あるｋについて、全てのｌについてａ_ｋｌｘ_ｌ＝｜ａ_ｋｌ｜である、または、全てのｌについてａ_ｋｌｘ_ｌ＝−｜ａ_ｋｌ｜である最悪ケースの状況において、上記の範囲内条件が帰するものである。斜線の部分領域は、１次信号が２次信号より小さくなる制限因子の選択を示す。公式（７）、（８）の下限は、範囲内条件が、最悪ケースにおいて、ちょうど満たされる（すなわち、「シャープに」満たされる）制限値の選択を示す。例証のために、定数Ｑは、１／２に設定された。この実施形態は、制限因子が、これらの値より小さく選択される必要が決してないという認識に基づく。この例示的な実施形態を理解すれば、当業者は、−１≦Ｙ≦１以外の範囲内条件に一般化できるであろう。

図４は、８個のオーディオチャネルを２個のチャネルにダウンミックスするためのミキシングシステム４００を示す。システム４００が、構成部４２０とコントローラ（利得制限部）４４０とミキシング部４６０とを備える３層構造を有すると言うことができる。構成部４２０は、システム４００の特性を構成設定するパラメータに基づいて、制限因子用についての適した区間を決定するように適応される。制限コントローラ４４０は、構成部４２０によって供給される区間に基づいて、またさらに、ミキシング部４６０によって供給される一定の入力データに基づいて、ミキシング部４６０によって適用されるダウンミックス係数の値を決定するように適応される。ミキシング部４６０は、入力オーディオ信号のベクトルＸ＝［Ｌ_８Ｒ_８ＣＬＦＥＬｓＲｓＬｒｓＲｒｓ］^Ｔを受信し、ミキサー４６２によりまたダウンミックス係数を使用してこれらのベクトルを出力オーディオ信号のベクトルＹ＝［ＬＲ］^Ｔにダウンミックスするように適応される。

ミキシングシステム４００は、時間セグメントに分割された信号を扱うように適応される。例として、信号は、参照により組込まれる、論文、Ｊ．Ｒ．Ｓｔｕａｒｔ等「ＭＬＰ無損失圧縮（ＭＬＰｌｏｓｓｌｅｓｓｃｏｍｐｒｅｓｓｉｏｎ）」ＭｅｒｉｄｉａｎＡｕｄｉｏＬｔｄ．，Ｈｕｎｔｉｎｇｔｏｎ，Ｅｎｇｌａｎｄに記載されるデジタル配信フォーマットに適合するとすることができる。この配信フォーマットでは、ブロック（またはアクセスユニット）が、４０ないし１６０個のサンプルから形成され、（リスタート区間に対応する）パケットが、固定数のブロックから形成される。１２８ブロックからなり、リスタートヘッダを含んでいてもよいパケットを、この例のための時間セグメントと見なす。

構成部４２０は、最大ダウンミックス係数の行列

を受信し、また、マスキング行列

を受信するためのユニット４２１を含む。マスキング行列は、入力信号の、１次サブグループ（リスナーのフロントでかつほぼ耳のレベルでの再生のために意図されるＬ_８、Ｒ_８、Ｃ）および２次サブグループ（ＬｓＲｓＬｒｓＲｒｓ）への分割を規定する。低周波数効果（ＬＦＥ）チャネルだけを含む第３のサブグループは、このミキシングシステム４００ではどの出力信号にも寄与しない。受信ユニット４２１は、上記で参照された数値Ｐ、Ｓを計算し、マスク済みミキシング行列
ｐｒｉｍａｒｙ_８→２＝ｍａｓｋ_Ｐ・ｄｍ_８→２、
ｓｅｃｏｎｄａｒｙ_８→２＝ｍａｓｋ_Ｓ・ｄｍ_８→２
を形成する。ここで、・は、要素ごとの（またはハダマード（Hadamard））行列乗算を示す。最大ダウンミックス係数が対称であるため、数値は、
Ｐ＝１＋１０^{−３／２０}およびＳ＝１＋１＝２
である。
構成部４２０は、１次および２次のサブグループについて各制限因子に関する上限および下限を計算するためのユニット４２３、４２４、４３４をさらに備える。第１のユニット４２３は、適用される範囲内条件を決定するパラメータｍａｘａｕｄｉｏの値、受信ユニット４２１から得られるＰ、Ｓの値に基づいて、またさらに１次および２次の制限因子に関する共通上限Ｗに基づいて中間値

を決定する。上限Ｗの値は、システム４００への構成パラメータとして第１のユニット４２３に直接供給されることができる。上限Ｗの値はまた、図４に示すように、ダイアログノルム値に基づいて上限Ｗを計算するための変換器４２２によって供給されることもできる。例証的な例として、上限は、関係

によって与えられることができる。ここで、ｄｉａｌｎｏｒｍ_８ｃｈは、オーディオの８チャネル入力表現に関するダイアログノルムを示し、ｄｉａｌｎｏｒｍ_２ｃｈは、２チャネル出力表現での所望のダイアログノルムである。上限および下限の計算に戻って、第２のユニット４２４は、式（８）によって与えられた変数ｍ_Ｐ、ｍ_Ｓを、αに基づいて評価するように適応される。最後に、第３および第４のユニット４２５、４２６は、ｍ_Ｐ、Ｗおよびｍ_Ｓ、Ｗをそれぞれ受信し、式（７）を使用して、制限因子に関する１次および２次の上限および下限を導出するように適応される。

ここでコントローラ４４０を考えると、出力チャネルＬは、パラメータｍａｘａｕｄｉｏによって規定される範囲内条件を満たすために、１次および２次の制限因子α_ＰＬ、α_ＳＬがどんな値を持つことを必要とされるかを判定するための関連するリミター４４２を有する。リミター４４２は、一時に１つの時間セグメントについての値を決定し、また、先に述べた方法でこれを実行し、２次入力信号に比べて１次入力信号を有利にするように構成されることができる。所与の時間セグメントについて、リミター４４２は、その決定を、範囲内パラメータｍａｘａｕｄｉｏと、制限因子α_１，α_２を選択することをリミター４４２が許容される区間［Ｌ_１，Ｕ_１］、［Ｌ_２，Ｕ_２］と、またさらにその時間セグメントについての入力信号データとに基づかせる。この実施形態では、入力データは、

および

によって与えられる信号Ｌ_２Ｐ、Ｌ_２Ｓの形態で、予備的ミキサー４４１からリミター４４２に供給される。予備的ミキサー４４１は、入力信号Ｘまたは、可能性としては、Ｌ_２Ｐ、Ｌ_２Ｓ、Ｒ_２Ｐ、Ｒ_２Ｓを計算するのに十分なサブセット（たとえば、ＬＦＥを含まないサブセット）を得るために入力ポート４６１に通信可能に接続される。他の出力チャネルＲ用のリミター４４３は、Ｌ_２Ｐ、Ｌ_２Ｓの代わりに信号Ｒ_２Ｐ、Ｒ_２Ｓを受信し、α_ＰＲ、α_ＳＲを出力することを除いて、Ｌリミター４４２と同様な方法で構成される。

その後、出力チャネルに進む入力チャネル間の均衡を回復するために、レフトおよびライトの１次制限因子α_ＰＬ、α_ＰＲが、α_Ｐ＝ｍｉｎ｛α_ＰＬ，α_ＰＲ｝を返すように適応された最小抽出器４４４に送給される。同様に、レフトおよびライトの２次制限因子α_ＳＬ、α_ＳＲが、α_Ｓ＝ｍｉｎ｛α_ＳＬ，α_ＳＲ｝を出力するように適応されたさらなる最小抽出器４４５に供給される。

この実施形態では、１次および２次の制限因子の時間シーケンスα_Ｐ（ｎ）、α_Ｓ（ｎ）（ｎは時間セグメント指数である）の平滑化が、レギュラライザ４４６、４４７によって実施され、レギュラライザ４４６、４４７は、制限因子の平滑化されたシーケンス

を返す。レギュラライザ４４６、４４７の機能は、以下でより詳細に述べられる。この実施形態では、レギュラライザ４４６、４４７は、制限因子の目下の値より多くの値にレギュラライザ４４６、４４７が作用することを可能にする各バッファ４４８、４４９によって支援される。バッファ４４８、４４９は、シフトレジスタとして実現されることができる。

コントローラ４４０によって実行される最終ステップとして、乗算器４５０、４５１および加算器４５２は、平滑化済み制限因子およびマスク済みミキシング行列を使用して、ｎ番目の時間セグメントにおいて適用される以下のダウンミックス行列

を計算する。

既に述べたように、ミキシング部４６０は、入力信号Ｘを受信し、これらの信号を予備的ミキサー４４１に供給するための入力ポート４６１を備える。入力ポート４６１は、入力信号Ｘをミキサー４６１にさらに提供し、ミキサー４６１は、ダウンミックス行列を受信し、式

を評価するように適応される。

図５は、レギュラライザ４４６、４４７の一方または両方によって提供される平滑化の例を示す。平滑化前の制限因子（上の曲線）と平滑化後の制限因子（下の曲線）が片対数図にプロットされている。最大（絶対）変化レート条件が満たされることを保証するために、高い入力信号値によって引起される場合がある未平滑化値におけるシャープな下方ピークは、平滑化済みの値における幅広化されたピークに対応する。この例では、幅広化は両側性である。さらに、ピークの位置と振幅が共に保持される。ルックアヘッドフィルタによってこれを達成することが可能である。許容可能な変化レートＲ_ｍ［信号ユニット／時間セグメント］および信号の大きさの最大期待変化Ａ_ｍ［信号ユニット］について、適したタップ数は、

であり、ルックアヘッド期間は、ほぼタップの数にセグメント長を乗算した値であることになる。平滑化時に、既に述べたように、ダウンミックス係数の個々のセグメントごとの値を、増加させることによって調整することは賢明でない。その理由は、このことが、平滑化によって影響を受けた時間セグメントにおいて範囲内条件に違反する場合があるからである。

アナログ実装態様では、レギュラライザ４４６、４４７は、参照により組込まれる米国特許第３，２５２，１０５号によって例示される種類のレート制限フィルタによって実現されることができる。こうしたフィルタは、好ましくは、適切な遅延線と共に適用されて、制限因子とダウンミックスされる入力信号の十分な同期を保証する。図４に示す実施形態では、入力ポート４６１とミキサー４６２との間に遅延線が配置され、バッファ４４８、４４９のサイズに対応することができる。

本発明のさらなる実施形態は、上記の説明を検討した後に当業者に明らかになるであろう。本説明および図面は実施形態および例を開示しているが、本発明は、これらの特定の例に制限されない。多数の変更および変形が、添付特許請求の範囲によって規定される本発明の範囲から逸脱することなく行われうる。

上記で開示したシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェア、またはその組合せとして実装されることができる。ハードウェア実装では、上記の説明において言及される機能ユニット間のタスクの分割は、必ずしも物理的なユニットへの分割に対応しない。逆に、１つの物理コンポーネントは、複数の機能を有することができ、１つのタスクは、いくつかの物理コンポーネントによって共同で実行されることができる。いくつかのコンポーネントまたは全てのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよいし、または、ハードウェアまたは特定用途向け集積回路として実装されてもよい。こうしたソフトウェアは、コンピュータ記憶媒体（または非一時的媒体）および通信媒体（または一時的媒体）を含むことができるコンピュータ可読媒体上に分散されることができる。当業者によく知られているように、コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための任意の方法または技術で実装される揮発性と不揮発性の両方の、取外し可能なおよび取外し不能な媒体を含む。コンピュータ記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリまたは他のメモリ技術、ＣＤ−ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）または他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたは他の磁気記憶デバイス、あるいは、所望の情報を記憶するために使用されることができ、かつ、コンピュータによってアクセスされることができる任意の他の媒体を含むが、それに限定されない。さらに、通信媒体は、通常、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを、搬送波などの変調データ信号または他の輸送メカニズムにおいて具現化し、任意の情報送達媒体を含むことが当業者によく知られている。

Claims

入力データを含む複数の入力オーディオ信号を少なくとも１つの出力オーディオ信号にダウンミックスする方法であって、
最大ダウンミックス係数が予め規定され、前記少なくとも１つの出力信号に関する少なくとも１つの範囲内条件が予め規定され、前記入力信号は、予め規定されたサブグループに分割されており、当該方法は、
前記入力データに鑑みて前記少なくとも１つの出力信号に関する範囲内条件を満たすよう、ダウンミックス係数を、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定すること、および、
前記ダウンミックス係数を適用して前記入力信号をダウンミックスすることを含む方法。
入力信号の前記サブグループの少なくとも１つのサブグループは、２つ以上の入力信号を含む請求項１に記載の方法。
サブグループ内の入力信号は、空間的に関連するオーディオチャネルに対応する請求項１に記載の方法。
あるサブグループが、レフトおよびライトチャネルを含む請求項３に記載の方法。
あるサブグループが、レフト、ライト、およびセンターチャネルを含む請求項４に記載の方法。
前記ダウンミックス係数は、前記範囲内条件が、高々２０％のマージンで、好ましくは高々１０％のマージンで、最も好ましくは高々５％のマージンで満たされるように決定される請求項１に記載の方法。
前記出力信号は、時間セグメントに分割され、ダウンミックス係数のセグメントごとのセットが、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に出力信号上限を満たすよう、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定される請求項１に記載の方法。
前記複数のオーディオ信号は、空間的に関連するチャネルに対応する少なくとも２つの出力オーディオ信号にダウンミックスされ、
ダウンミックス係数のセグメントごとのセットが、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に、前記少なくとも２つの空間的に関連する出力信号のそれぞれに関する範囲内条件を連携して満たすよう、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定される請求項７に記載の方法。
ダウンミックス係数の前記セグメントごとのセットからダウンミックス係数のセグメントごとの値のシーケンスを定義すること、
前記ダウンミックス係数のセグメントごとの値の前記シーケンスを平滑化すること、および、
前記平滑化されたセグメントごとの値を適用して前記入力信号をダウンミックスすることをさらに含む請求項８に記載の方法。
セグメントごとの値の前記シーケンスは、変化レート上限を適用することによって平滑化される請求項９に記載の方法。
セグメントごとの値の前記シーケンスは、前記変化レート上限を満たすために、前記セグメントごとの値を維持するまたは減少させることによって平滑化される請求項１０に記載の方法。
少なくとも１つのサブグループが、そのサブグループについての前記制限因子に関する下限に関連付けられる請求項１に記載の方法。
１次および２次のサブグループが予め規定され、前記１次サブグループに関連付けられる前記制限因子に関する下限は、前記２次サブグループに関連付けられる前記制限因子に関する下限より大きい請求項１２に記載の方法。
１次および２次のサブグループが予め規定され、前記１次サブグループは、前記制限因子に関する上限に関連付けられ、
ダウンミックス係数を前記決定することは、前記１次サブグループについての前記制限因子の値として、前記１次サブグループについての前記制限因子に関する前記上限を有利にすることを含む請求項１に記載の方法。
１次および２次のサブグループが予め規定され、それぞれは、前記制限因子に関する各下限および各上限に関連付けられ（Ｌ_１≦α_１≦Ｕ_１，Ｌ_２≦α_２≦Ｕ_２）、
ダウンミックス係数を前記決定することは、
前記１次サブグループ制限因子がその上限に等しくなるように、制限因子のサブスペース内で（α_１＝Ｕ_１，Ｌ_２≦α_２≦Ｕ_２）前記少なくとも１つの出力信号に関して前記範囲内条件を満たすように最初に試みるサブステップと、
さらに、前記最初の試みが失敗する場合、前記２次サブグループ制限因子がその下限に等しくなるように、制限因子のサブスペース内で（Ｌ_１≦α_１≦Ｕ_１，α_２＝Ｌ_２）前記少なくとも１つの出力信号に関して前記範囲内条件を満たすように試みるサブステップとを含む請求項１４に記載の方法。
前記１次サブグループは、以下のグループ、すなわち、
（ｉ）リスナーに対してフロントハーフスペース内に位置するオーディオ源による再生用のチャネル、
（ｉｉ）リスナーと実質的に同じ高さに位置するオーディオ源による再生用のチャネル
のうちの１つのグループからのチャネルに対応し、
前記２次サブグループは、（ｉ）または（ｉｉ）以外のチャネルに対応する請求項１３から１５のいずれか１項に記載の方法。
前記１次サブグループは、以下のグループ、すなわち、
（ｉｉｉ）フロントチャネル、
（ｉｖ）センターチャネル、
（ｖ）ワイドチャネル
のうちの１つのグループからのチャネルに対応し、
前記２次サブグループは、（ｉｉｉ）、（ｉｖ）、または（ｖ）以外のチャネルに対応する請求項１６に記載の方法。
少なくとも１つのサブグループは、前記制限因子に関する上限に関連付けられる請求項１に記載の方法。
２つ以上のサブグループは、前記制限因子に関する共通の上限に関連付けられる請求項１８に記載の方法。
前記複数の入力オーディオ信号は、空間的に関連するチャネルに対応する少なくとも２つの出力オーディオ信号にダウンミックスされ、
ダウンミックス係数は、前記少なくとも２つの空間的に関連する出力信号のそれぞれに関する前記範囲内条件を連携して満たすよう、前記最大ダウンミックス係数と各サブグループおよび全ての出力信号内で共通である制限因子との積として決定される請求項１に記載の方法。
ダウンミックス係数を前記決定することは、
サブグループ内の入力信号が寄与する出力信号のそれぞれについて、ダウンミックス係数を前記最大ダウンミックス係数と予備的制限因子との積として決定するサブステップと、
前記予備的制限因子の最小を選択することによって前記サブグループ内で共通の制限因子を決定するサブステップとを含む請求項２０に記載の方法。
前記出力信号が対応する前記空間的に関連するチャネルは、以下のチャネルグループ、すなわち、
フロント、サラウンド、リアサラウンド、ダイレクトサラウンド、ワイド、センター、サイド、ハイ、バーチカルハイ
のうちの１つに属する請求項２０に記載の方法。
複数のオーディオ信号をビットストリームとしてエンコードする方法であって、
前記複数のオーディオ信号を受信すること、
請求項１から２２のいずれか１項に記載のダウンミックス方法に従って、前記オーディオ信号をダウンミックス信号にダウンミックスすること、および、
前記ダウンミックス信号をビットストリームとしてエンコードすることを含む方法。
複数のエンコード済みオーディオ信号および少なくとも１つのダウンミックス仕様を含むビットストリームをデコードする方法であって、前記ダウンミックス仕様は請求項１から２２のいずれか１項に記載のダウンミックス方法に従って生成されたものであり、当該方法は、
前記ビットストリームを受信するステップ、および、
前記ビットストリームをデコードするステップを含み、
デコードするステップは、前記ダウンミックス仕様に従って前記オーディオ信号をダウンミックス信号にダウンミックスすることを含む方法。
予め規定されたサブグループに分割された複数のエンコード済みオーディオ信号および少なくとも１つのダウンミックス仕様を含むビットストリームをデコードする方法であって、
前記ダウンミックス仕様は、ダウンミックス係数の複数のセットを含み、各サブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は一定であり、一方、異なるサブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は可変であり、当該デコードする方法は、
前記ビットストリームを受信するステップ、および、
前記ビットストリームをデコードするステップを含み、
デコードするステップは、前記ダウンミックス仕様に従って前記オーディオ信号をダウンミックス信号にダウンミックスすることを含む方法。
請求項１から２５のいずれか１項に記載の方法を実施するためのコンピュータ実行可能命令を記憶するデータキャリア。
ミキシングシステム（４００）であって、
入力データを含む複数の入力オーディオ信号を受信するための入力ポート（４６１）と、
構成部（４２０）であって、
最大ダウンミックス係数、
前記少なくとも１つの出力信号に関する範囲内条件、および、
前記入力信号のサブグループへの分割
を受信するための、構成部（４２０）と、
前記入力データに鑑みて、前記少なくとも１つの出力信号に関する範囲内条件を満たすよう、ダウンミックス係数を、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定するコントローラ（４４０）と、
前記複数の入力オーディオ信号を少なくとも１つの出力オーディオ信号にダウンミックスするために、前記コントローラによって決定された前記ダウンミックス係数を適用するためのミキサー（４６２）とを備えるシステム。
入力信号の前記サブグループの少なくとも１つのサブグループは、２つ以上の入力信号を含む請求項２７に記載のシステム。
サブグループ内の入力信号は、空間的に関連するオーディオチャネルに対応する請求項２７に記載のシステム。
サブグループは、レフトおよびライトチャネルを含む請求項２９に記載のシステム。
サブグループは、レフト、ライト、およびセンターチャネルを含む請求項３０に記載のシステム。
前記コントローラ（４４０）は、前記範囲内条件が、高々２０％のマージンで、好ましくは高々１０％のマージンで、最も好ましくは高々５％のマージンで満たされるように前記ダウンミックス係数を決定するように適応される請求項２７に記載のシステム。
前記出力信号は、時間セグメントに分割され、
前記コントローラ（４００）は、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に出力信号上限を満たすよう、ダウンミックス係数のセグメントごとのセットを、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定するようにさらに適応される請求項２７に記載のシステム。
前記ミキサー（４６２）は、前記複数のオーディオ信号を、空間的に関連するチャネルに対応する少なくとも２つの出力オーディオ信号にダウンミックスするように適応され、
前記コントローラ（４４０）は、複数の時間セグメントのそれぞれについて、その時間セグメント内の入力データに鑑みて独立に、前記少なくとも２つの空間的に関連する出力信号のそれぞれに関する範囲内条件を連携して満たすよう、ダウンミックス係数のセグメントごとのセットを、前記最大ダウンミックス係数と各サブグループ内で共通である制限因子との積として決定するように適応される請求項３３に記載のシステム。
前記コントローラ（４４０）は、
前記ダウンミックス係数のうちの１つの係数のセグメントごとの値のシーケンスをバッファリングするためのメモリ（４４８，４４９）と、
セグメントごとの値の前記シーケンスに基づいて、前記ミキサー（４６２）によって適用される前記ダウンミックス係数のセグメントごとの値の平滑化されたシーケンスを提供するためのレギュラライザ（４４６，４４７）とを備える請求項３４に記載のシステム。
前記レギュラライザ（４４６，４４７）は、変化レート上限を満たす前記ダウンミックス係数のセグメントごとの値の平滑化されたシーケンスを提供するように適応される請求項３５に記載のシステム。
前記レギュラライザ（４４６，４４７）は、前記変化レート上限を満たすために、前記シーケンス内の各値を維持するまたは減少させることによって前記平滑化されたシーケンスを計算するように適応される請求項３６に記載のシステム。
前記コントローラ（４４０）は、少なくとも１つのサブグループについて、そのサブグループについての前記制限因子に関する下限を満たすように適応される請求項２７に記載のシステム。
前記コントローラ（４４０）は、１次サブグループ内の入力信号と２次のサブグループ内の入力信号を、前記２次サブグループについての前記制限因子に関する下限より大きい前記１次サブグループについての前記制限因子に関する下限を満たすことによって、区別するように適応される請求項３８に記載のシステム。
前記コントローラ（４４０）は、１次サブグループ内の入力信号と２次のサブグループ内の入力信号を、
前記１次サブグループについての前記制限因子に関する上限を満たすこと、および、
前記１次サブグループについての前記制限因子の値として、前記１次サブグループについての前記制限因子に関する前記上限を優先すること
によって区別するように適応される請求項２７に記載のシステム。
前記コントローラ（４４０）は、１次サブグループ内の入力信号と２次のサブグループ内の入力信号を、
前記制限因子に関する各下限および各上限を満たす（Ｌ_１≦α_１≦Ｕ_１，Ｌ_２≦α_２≦Ｕ_２）こと、
前記１次サブグループ制限因子がその上限に等しくなるように、制限因子のサブスペース内で（α_１＝Ｕ_１，Ｌ_２≦α_２≦Ｕ_２）前記少なくとも１つの出力信号に関して前記範囲内条件を満たすように最初に試みること、および、
さらに、前記最初の試みが失敗する場合、前記２次サブグループ制限因子がその下限に等しくなるように、制限因子のサブスペース内で（Ｌ_１≦α_１≦Ｕ_１，α_２＝Ｌ_２）前記少なくとも１つの出力信号に関して前記範囲内条件を満たすように試みること
によって区別するように適応される請求項４０に記載のシステム。
前記１次サブグループは、以下のグループ、すなわち、
（ｉ）リスナーに対してフロントハーフスペース内に位置するオーディオ源による再生用のチャネル、
（ｉｉ）リスナーと実質的に同じ高さに位置するオーディオ源による再生用のチャネル
のうちの１つのグループからのチャネルに対応し、
前記２次サブグループは、（ｉ）または（ｉｉ）以外のチャネルに対応する請求項３９から４１のいずれか１項に記載のシステム。
前記１次サブグループは、以下のグループ、すなわち、
（ｉｉｉ）フロントチャネル、
（ｉｖ）センターチャネル、
（ｖ）ワイドチャネル
のうちの１つのグループからのチャネルに対応し、
前記２次サブグループは、（ｉｉｉ）、（ｉｖ）、または（ｖ）以外のチャネルに対応する請求項４２に記載のシステム。
前記コントローラ（４４０）は、少なくとも１つのサブグループについて、そのサブグループについての前記制限因子に関する上限を満たすように適応される請求項２７に記載のシステム。
前記コントローラ（４４０）は、２つ以上のサブグループについて、それらのサブグループについての前記制限因子に関する共通の上限を満たすように適応される請求項４４に記載のシステム。
当該システム（４００）は、前記複数の入力オーディオ信号を、少なくとも２つの空間的に関連する出力オーディオ信号にダウンミックスするために、前記コントローラ（４４０）によって決定される前記ダウンミックス係数を適用するように適応され、
前記コントローラ（４４０）は、前記出力信号のそれぞれに関して前記範囲内条件を連携して満たすよう、ダウンミックス係数を、前記最大ダウンミックス係数と各サブグループおよび全ての前記出力信号内で共通である制限因子との積として決定するように適応される請求項２７に記載のシステム。
前記コントローラ（４４０）は、
サブグループ内の入力信号が寄与する出力信号のそれぞれについて、ダウンミックス係数を前記最大ダウンミックス係数と予備的制限因子との積として決定する手段（４４２，４４３）と、
前記予備的制限因子の最小を決定する最小抽出器（４４４，４４５）とを備える請求項４６に記載のシステム。
前記出力信号が対応する前記空間的に関連するチャネルは、以下のチャネルグループ、すなわち、
フロント、サラウンド、リアサラウンド、ダイレクトサラウンド、ワイド、センター、サイド、ハイ、バーチカルハイ
のうちの１つに属する請求項４６に記載のシステム。
複数のオーディオ信号をビットストリームとしてエンコードするためのエンコーディングシステムであって、
前記複数のオーディオ信号を受信するように適応された請求項２７から４８のいずれか１項に記載のミキシングシステムと、
前記ミキシングシステムから得られる出力信号をビットストリームとしてエンコードするためのエンコーダとを備えるエンコーディングシステム。
複数のエンコード済みオーディオ信号および少なくとも１つのダウンミックス仕様を含むビットストリームをデコードするためのデコーディングシステムであって、前記ダウンミックス仕様は請求項２７から４８のいずれか１項に記載の入力ポート、構成部、およびコントローラによって生成されたものであり、当該デコードするシステムは、
前記ビットストリームをデコードされたオーディオ信号としてデコードするデコーダと、
前記複数のオーディオ信号をダウンミックス信号にダウンミックスする請求項２７から４８のいずれか１項に記載のミキサーとを備えるデコーディングシステム。
ビットストリームをデコードするデコーディングシステムであって、
予め規定されたサブグループに分割された複数のエンコード済みオーディオ信号、および、少なくとも１つのダウンミックス仕様を含むビットストリームを受信するための入力ポートであって、前記ダウンミックス仕様は、ダウンミックス係数の複数のセットを含み、各サブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は一定であり、一方、異なるサブグループ内でオーディオ信号に適用されるダウンミックス係数間の比は可変である、入力ポートと、
前記ビットストリームをデコードされたオーディオ信号としてデコードするためのデコーダと、
前記複数のオーディオ信号をダウンミックス信号にダウンミックスするために前記ダウンミックス係数を適用するためのミキサーとを備えるデコーディングシステム。