JP4307917B2

JP4307917B2 - オーディオミキシングのための等化技術

Info

Publication number: JP4307917B2
Application number: JP2003179073A
Authority: JP
Inventors: バウムガーテフランク
Original assignee: Agere Systems LLC
Current assignee: Agere Systems LLC
Priority date: 2002-06-24
Filing date: 2003-06-24
Publication date: 2009-08-05
Anticipated expiration: 2023-06-24
Also published as: JP2004048741A; US7039204B2; US20030235317A1; EP1377123A1

Description

【０００１】
【関連する特許出願】
本出願は、２００２年６月２４日付けで、ａｔｔｏｒｎｅｙｄｏｃｋｅｔｎｏ．（弁理士事件番号）Ｂａｕｍｇａｒｔｅ３−１１として出願された合衆国仮特許出願第６０／３９１，０９５号の優先権（ｂｅｎｅｆｉｔ）を主張する。
【０００２】
【発明の属する技術分野】
本発明はオーディオ信号の処理、より詳細には、オーディオ信号のミキシングに係る。
【０００３】
【従来の技術】
オーディオの録音、オーディオの再生、及びオーディオの符号化等の多くの分野において、ある数の入力オーディオチャネルをミキシングすることで、異なる数の出力オーディオチャネルを生成するという共通な課題が存在する。このチャネル数の変更は、例えば、録音デバイスのオーディオトラック（チャネル）の数と、再生システムによってサポートされるチャネル数との間の差や、分配媒体（例えば、ＣＤ、ＤＶＤ、ラジオ）のチャネル数と再生システムによってサポートされるチャネル数との間の差を乗り越えるために必要となる。
【０００４】
一例としてＦＭラジオがある。つまり、ＦＭラジオにおいては、オーディオは、通常、２−チャネルステレオ信号として分配されるが、多くの受信機は、たった一つの再生チャネル（一つの拡声器）しか有さない。このような場合、典型的には、これら２つのステレオチャネルをダウンミキシングすることで、再生のための単一のモノのオーディオ信号が形成される。もう一つの例として、サラウンドオーディオフォーマット（ｓｕｒｒｏｕｎｄａｕｄｉｏｆｏｒｍａｔ）、例えば５．１サラウンド、に準拠する入力信号の複数の（例えば５つの）チャネルの場合も、例えば、２−チャネルステレオシステムを用いて再生のためにダウンミキシングが行われる。
【０００５】
（出力チャネル数を入力チャネル数より少なくする）ダウンミキシングに加えて、オーディオ信号のミキシングには、（出力チャネル数を入力チャネル数より多くする）アップミキシングもある。アップミキシングの一例としては、２−チャネル（例えば、左右）入力信号からの３−チャネル（例えば、左右と中央）出力信号の生成がある。
【０００６】
ダウンミキシング及びアップミキシングの両方とも、空間イメージ品質（ｓｐａｔｉａｌｉｍａｇｅｑｕａｌｉｔｙ）の劣化が可能な限り小さな過程を用いて遂行されるべきである。従来のミキシング過程においては、各出力チャネルは、時間領域における入力チャネルの重み付け総和から導かれ、各出力チャネルに対する各入力チャネルの重みの決定には「パニング規則（ｐａｎｎｉｎｇｌａｗｓ）」或いは「マトリキシングスキーム（ｍａｔｒｉｘｉｎｇｓｃｈｅｍｅｓ）」が適用される。
【０００７】
信号が時間領域において操作されるため、従来のミキシング技術はオーディオチャネルの全帯域幅に適用できる。
【０００８】
【発明が解決しようとする課題】
このようなミキシング技術の一つの短所は、ステレオオーディオチャネルのスペクトル成分の幾つかが位相的に整合していない場合、スペクトルエネルギー及び／或いはラウドネスが失われる可能性があることである。このような位相差は、例えば、マルチマイクロホン録音（ｍｕｌｔｉｐｌｅ−ｍｉｃｒｏｐｈｏｎｅｒｅｃｏｒｄｉｎｇ）において、各マイクロホンが音響源に対して異なる距離を有するときにしばしが発生する。この結果、異なる位相がマイクロホン信号内に導入されることとなる。同一振幅の二つのチャネル間に１８０度の位相シフトが存在するような極端なケースにおいては、入力チャネルの和として構成される出力チャネルは、これら入力チャネルが互いに打ち消し合うために零エネルギーとなる。より現実的には、出力チャネル内の幾つかのスペクトル成分について、信号位相の不整合のために信号のエネルギー及び／或いはラウドネスが大幅に低下することがある。
【０００９】
色効果（ｃｏｌｏｒａｔｉｏｎｅｆｆｅｃｔｓ）については、１９５０年から６０年台にかけて２−チャネルステレオサウンドが導入された当時に、「モノ互換性問題（ｍｏｎｏ−ｃｏｍｐａｔｉｂｉｌｉｔｙｐｒｏｂｅｌｅｍ）」のフレームワーク内で幅広く研究された経緯がある。これについては、例えば、Ｆ．Ｋ．ＨａｒｖｅｙａｎｄＥ．Ｈ．Ｕｅｃｋｅ，「Ｃｏｍｐａｔｉｂｉｌｉｔｙｐｒｏｂｌｅｍｉｎｔｗｏ−ｃｈａｎｎｅｌｓｔｅｒｅｏｐｈｏｎｉｃｒｅｃｏｒｄｉｎｇｓ」，１３ｔｈＡＥＳｍｅｅｔｉｎｇ，ｐｒｅｐｒｉｎｔ１９７，Ｏｃｔ．１９６１、を参照されたい。これら研究の目標は、２つのチャネルがモノに混合されたとき知覚ラウドネス（ｐｅｒｃｅｉｖｅｄｌｏｕｄｎｅｓｓ）が全周波数に渡ってできる限り多く維持されるような２−チャネルステレオ信号を生成する方法を発見することに向けられていた。具体的には、総和の前に、それぞれ、左右のオーディオ信号に＋４５度と−４５度の位相シフトを加えたり、或いは録音のために一致マイクロホンを用いる（両方のマイクロホンが音源から同一距離を有するようにする）ことなどが行われた。これら技法は、特定な状況に対しては色効果を低減する傾向はあるが、ただし、これら技法を適用することができない及び／或いはこれら技法では満足できる結果が得られないような多くのオーディオ処理分野が存在する。
【００１０】
【課題を解決するための手段】
本発明の原理によると、この従来の技術のこれら問題は、ミキサ出力信号のエネルギー及び／或いはラウドネスのレベルを、ミキサ入力信号のエネルギー及び／或いはラウドネスのレベルに一致させる等化ミキシング技術（ｅｑａｌｉｚｅｄｍｉｘｉｎｇｔｅｃｈｎｉｑｕｅ）によってアプローチされ、色効果が、低減され、場合によっては、完全に回避される。一つの実施例においては、Ｎ−チャネル入力信号の時間領域チャネル信号が周波数領域に変換され、結果としてのスペクトル成分がミキシングされ、次に、ミキシング過程に伴うスペクトルエネルギー及び／或いはラウドネスの損失を調節するために、これら成分が適応的に増幅される。次に、この結果としての等化された混合チャネルを逆変換することで、Ｍ−チャネル出力信号の時間領域チャネル信号が生成される。
【００１１】
一つの実現においては、本発明は、Ｎ−チャネル入力オーディオ信号を、Ｍ−チャネル出力オーディオ信号を生成するためにミキシングする方法に係る。ここでＮとＭは正の整数を表す。この方法によると、Ｎ−チャネル入力オーディオ信号に対して第一のラウドネス推定値が生成される。Ｎ−チャネル入力オーディオ信号に対応するＮ個の入力チャネル信号をミキシングすることで、Ｍ個の混合チャネル信号が生成され、これらＭ個の混合チャネル信号に対して、第二のラウドネス推定値が生成される。これら第一と第二のラウドネス推定値に基づいてこれらＭ個の混合チャネル信号を等化することで、Ｍ−チャネル出力オーディオ信号が生成される。
【００１２】
もう一つの実現においては、本発明は、上述の方法にて生成されるＭ−チャネル出力オーディオ信号に係る。
【００１３】
さらにもう一つの実現によると、本発明はＮ−チャネル入力オーディオ信号を、Ｍ−チャネル出力オーディオ信号を生成するためにミキシングする装置に係る。ここでＮとＭは正の整数を表す。この装置は、ミキサと、一つ或いは複数のラウドネス推定器と、等化器とを備える。ミキサは、Ｎ−チャネル入力オーディオ信号に対応するＮ個の入力チャネル信号をミキシングすることで、Ｍ個の混合チャネル信号を生成するように構成される。一つ或いは複数のラウドネス推定器は、Ｎ−チャネル入力オーディオ信号に対する第一のラウドネス推定値と、Ｍ個の混合チャネル信号に対する第二のラウドネス推定値とを生成するように構成される。等化器は、第一と第二のラウドネス推定値に基づいてＭ個の混合チャネル信号を等化することで、Ｍ−チャネル出力オーディオ信号を生成するように構成される。
【００１４】
本発明の他の面、特徴及び長所が、以下の詳細な説明、クレーム、及び添付の図面からより一層明らかになるものである。
【００１５】
【発明の実施の形態】
図１は本発明の一つの実施例による等化ミキシング手続き（ｅｑｕａｌｉｚｅｄｍｉｘｉｎｇｐｒｏｃｅｄｕｒｅ）の流れ図を示す。より詳細には、図１の処理は、Ｎ−チャネル入力信号を混合することで、Ｍ−チャネル出力信号を生成することに対応し、ここで、この入力信号は、Ｎ個の時間領域におけるチャネル信号ｘ_ｎ（ｔ），ｎ＝１，．．．，Ｎを有し、この出力信号は、Ｍ個の時間領域におけるチャネル信号ｙ’_ｍ（ｔ），ｍ＝１，．．．，Ｍを有する。
【００１６】
ダウンミキシング用途（ｄｏｗｎ−ｍｉｘｉｎｇａｐｐｌｉｃａｔｉｏｎｓ）に対しては、Ｎ＞Ｍ≧１とされる。例えば、ステレオ入力信号をモノ出力信号にダウンミキシング（混合）するときは、Ｎ＝２、Ｍ＝１とされる。アップミキシング用途に対しては、１≦Ｎ＜Ｍとされる。例えば、ステレオ入力信号を３‐チャネル出力信号にアップミキシング（混合）するときは、Ｎ＝２、Ｍ＝３とされる。入力チャネルの数と出力チャネルの数が同一とされるような（つまり、Ｎ＝Ｍ＞２とされる）ミキシング用途も可能である。
【００１７】
図１の処理によると、ステップ１０２において、各時間領域における入力チャネル信号のフレームに短時間フーリエ変換（ｓｈｏｒｔ−ｔｉｍｅＦｏｕｒｉｅｒｔｒａｎｓｆｏｒｍ，ＳＴＦＴ）が適用される。ここで、入力チャネル信号ｘ_ｎ，ｋ（ｔ）のインデックスｋを有する短時間フレームの複素ＳＴＦＴ変換（ｃｏｍｐｌｅｘＳＴＦＴｔｒａｎｓｆｏｒｍ）は、Ｘ_ｎ，ｋ（ω）として表示される。スペクトル解像度を改善させるためには、このＳＴＦＴ変換（ＳＴＦＴｔｒａｎｓｆｏｒｍ）は、好ましくは、連続時間信号から各時間領域における信号を生成する際にウインドウ関数（ｗｉｎｄｏｗｆｕｎｃｔｉｏｎ）を適用すべきである。典型的なウインドウ関数によると、連続するウインドウ（窓）は、時間において、例えば、各ウインドウの長さの５０％だけ重なり合う。
【００１８】
Ｎ個の入力チャネル信号の各々に対してフレームｋを変換した後に、ステップ１０４において、このＮ−チャネル入力信号のフレームｋの短時間総スペクトルラウドネス（ｏｖｅｒａｌｌｓｈｏｒｔ−ｔｉｍｅｓｐｅｃｔｒａｌｌｏｕｄｎｅｓｓ）Γ_ｋが以下の式（１）に従って計算される：
【数１】

ここで、指数βは１より大きな定数を表す。ラウドネス（ｌｏｕｄｎｅｓｓ）とは、典型的には、モデルによって物理量から近似される知覚量（ｐｅｒｃｅｐｔｕａｌｑｕａｎｔｉｔｙ）を表し、知覚されるラウドネスを直接に測定できないときに用いられる。ラウドネスに対する一つの可能なモデルは、ラウドネスが信号エネルギーに等しいという想定に基づき、これは、式（２）におけるβ＝２に対応する。この値は、様々なオーディオ内容（ａｕｄｉｏｍａｔｅｒｉａｌ）及び再生シナリオに適用できる平均を表す。ただし、これは用途に依存し、幾つかの状況においては、より正確なラウドネス近似を得るために、βの選択が変えられる（つまり、２より大きくしたり、小さくしたりされる）。例えば、βの最適な選択は多くの要因に依存し、これには拡声器の位置、再生システム（例えば、モノ、ステレオ、ヘッドホーン）の音響特性、再生レベル等が含まれる。
【００１９】
次に、ステップ１０６において、Ｎ−チャネル入力信号のフレームｋに対するスペクトル成分Ｘ_ｎ，ｋ（ω）を混合することで、Ｍ−チャネル出力信号のフレームｋに対するＭ個のセットのスペクトル成分Ｙ_ｍ，ｋ（ω）が生成される。これら混合スペクトル成分Ｙ_ｍ，ｋ（ω）を生成するためには、特定の用途に応じて任意の適当なミキシングアルゴリズム（ｍｉｘｉｎｇａｌｇｏｒｉｔｈｍ）を適用することができ、これには、発明の背景のセクションにおいて説明された重み付き和技法（ｗｅｉｇｈｔｅｄｓｕｍｍａｔｉｏｎｔｅｃｈｎｉｑｕｅｓ）も含まれる。一つの可能な重み付き和技法は、以下の式（２）によって表される：
【数２】

【００２０】
ここで、Ｗ_ｍ，ｎは、ｍ番目の混合スペクトル成分Ｙ_ｍ，ｋ（ω）を生成する際にｎ番目の入力スペクトル成分Ｘ_ｎ，ｋ（ω）に適用される重みを表す。
次に、ステップ１０８において、これらＭ個の混合チャネルのフレームｋの短時間総スペクトルラウドネスΛ_ｋが以下の式（３）に従って計算される：
【数３】

【００２１】
これら２つのスペクトルラウドネス推定値Γ_ｋとΛ_ｋは、それぞれ、好ましくは、以下の式（４）と式（５）に従って時間に関して平滑化される：
【数４】

重み係数αは、それぞれ、式（１）と（３）から得られるラウドネス推定値の、式（４）と（５）における時間領域における平滑化（ｔｉｍｅ−ｄｏｍａｉｎｓｍｏｏｔｈｉｎｇ）を決定する。一つの好ましい実現においては、αは、０から１の範囲から選択される定数とされる。α＝０とされた場合は、平滑化は行われない。式（４）と（５）からえられる平滑化されたラウドネス推定値は、αを大きくするほど、時間に関しての変動が小さくなる。リアルタイムオーディオ信号に対してラウドネス推定値が１６ミリ秒毎に更新される場合の適当な値は、α＝０．９である。
【外１】

【００２２】
次に、ステップ１１０において、これら混合スペクトル成分Ｙ_ｍ，ｋ（ω）を、以下の式（７）に従って等化することで、等化された混合スペクトル成分Ｙ’_ｍ，ｋ（ω）が生成される：
【数５】

ここで、ｇ_ｋ（ω）は周波数依存利得係数を表し、これは、好ましくは、平滑化されたラウドネス推定値Γ_ｋとΛ_ｋから以下の式（７）に従って生成される：
【数６】

式（７）の分母は、好ましくは、零による除法を回避するために小さな（例えば、最大信号レベルより１００ｄＢ小さな）正の定数εを含む。一つの好ましい実現においては、ステップ１１０の等化は、Ｍ−チャネル出力信号が元のＮ−チャネル入力信号と等しい推定ラウドネスを有するようにされる。
【００２３】
次に、ステップ１１２において、各等化された混合スペクトルｙ’_ｍ、ｋ（ω）に逆ＳＴＦＴ変換を適用することで、Ｍ−チャネル出力信号の時間領域におけるチャネル信号ｙ’_ｍ（ｔ）が得られる。重なり合うフレームが採用される場合は、前のフレームとのオーバラップ加算手続（ｏｖｅｒｌａｐ−ａｄｄｐｒｏｃｅｄｕｒｅ）も遂行される。
【００２４】
図２は本発明の一つの実施例による等化ミキサ（ｅｑｕａｌｉｚｅｄｍｉｘｅｒ）２００のブロック図を示す。等化ミキサ２００は、図１の処理を遂行するように構成される。図２に示すように、等化ミキサ２００は、Ｎ個の短時間フーリエ変換（ｓｈｏｒｔ−ｔｉｍｅＦｏｕｒｉｅｒｔｒａｎｓｆｏｒｍ，ＳＴＦＴ）ブロック２０２と、周波数領域ミキサ２０４と、周波数領域等化器２０６と、Ｍ個の短時間逆フーリエ変換（ｉｎｖｅｒｓｅｓｈｏｒｔ−ｔｉｍｅＦｏｕｒｉｅｒｔｒａｎｓｆｏｒｍ，ＩＳＴＦＴ）ブロック２０８とを備える。加えて、等化ミキサ２００は、２つのラウドネス推定ブロック２１０と２１２を備える。各変換ブロック２０２は、Ｎ−チャネル入力信号の一つの異なるチャネル信号を周波数領域に変換するために、図１のステップ１０２の部分を遂行する。ラウドネス推定ブロック２１０は、Ｎ−チャネル入力信号の総推定ラウドネスΓを計算（及び平滑化）するために、図１のステップ１０４を遂行する。ミキサ２０４は、Ｍ個の混合スペクトルを生成するために、図１のステップ１０６を遂行する。ラウドネス推定ブロック２１２は、これらＭ個の混合スペクトルの総推定ラウドネスΛを計算（及び平滑化）するために、図１のステップ１０８を遂行する。等化器２０６は、これらＭ個の混合スペクトルを等化するために、図１のステップ１１０を遂行する。各ＩＳＴＦブロック２０８は、結果としてのＭ個の等化混合スペクトルの異なる一つを時間領域に変換し、Ｍ−チャネル出力信号の一つの異なるチャネルを生成するために、図１のステップ１１２の部分を遂行する。
【００２５】
上では、等化ミキサ２００は、並列に動作するＮ個の異なる変換ブロックと、並列に動作するＭ個の異なる逆変換ブロックとを備えるものとして説明されたが、代替の実現として、一つの変換ブロックと一つの逆変換ブロックとを直列に、時分割にて動作させることで、複数の異なる信号を処理することもできる。同様に、本発明の等化ミキサは、Ｎ個の入力チャネル信号とＭ個の混合チャネル信号の両方に対して総スペクトルラウドネス推定値を生成する単一のラウドネス推定器（ｌｏｕｄｎｅｓｓｅｓｔｉｍａｔｏｒ）を用いて実現することもできる。
【００２６】
上では本発明は、連続時間ｔと連続周波数ωとを用いるものとして説明されたが、本発明は、離散時間と離散周波数とを用い、例えば、離散フーリエ変換（ｄｉｓｃｒｅｔｅＦｏｕｒｉｅｒｔｒａｎｓｆｏｒｍ，ＤＦＴ）を用いて実現することもできる。更に、連続であるか、離散であるかに関係なく、本発明はフーリエ変換を用いることに限定されるものではない。より一般に、本発明は、できれば省エネ型のものが好ましいが、任意の適当な直交変換（器）或いはフィルタを用いて実現できる。更に、理論的には、本発明の等化ミキシングは、適応フルタリングを用いて時間領域にて実現することもできる。
【００２７】
本発明のミキシング技術は、オーディオ信号のミキシングが必要とされ、更に、スペクトルの異なる生成された部分がマージングされる問題を回避することが要請される、多くの異なるオーディオ符号化及びサウンドエンジニアリング用途に適用でき、とりわけ、全オーディオ帯域幅の処理が必要とされる分野に効果的である。本発明によると、ミキシング過程が、「スペクトル等化（ｓｐｅｃｔｒａｌｅｑｕａｌｉｚａｔｉｏｎ）」によって、すなわち、全出力チャネルの総スペクトルエネルギー及び／或いはラウドネスを全入力チャネルの総スペクトルエネルギー及び／或いはラウドネスと概ね等しく維持することで改善される。加えて、本発明は全帯域幅の内の一部のみに適用することもできる。すなわち、本発明による等化ミキシングは、オーディオ信号の全帯域幅の内の単に１つ或いは複数の部分についてのみ遂行することもできる。
【００２８】
本発明は、これら方法を実現するための方法及び装置の形態にて具現することができる。本発明は、更に、有体の媒体、例えば、フロッピー（登録商標）ディスケット、ＣＤ−ＲＯＭ、ハードドライブ、或いは任意の他のマシンにて読出し可能なメモリ媒体等の内に具現されたプログラムコードであって、コンピュータ等のマシーン内にロードされ、実行されたとき、そのマシーンを、本発明を実施するための装置とならしめるようなプログラムコードの形態として実現することもできる。本発明は、更に、メモリ媒体に格納されたり、マシーン内にロードされ、実行されたり、伝送媒体や搬送波を通じて伝送されたり、電線やケーブルを通じて、光ファイバを通じて、或いは電磁放射を介して伝送されたりするプログラムコードであって、コンピュータ等のマシーン内にロードされ、実行されたとき、そのマシーンを、本発明を実施するための装置とならしめるようなプログラムコードの形態にて実現することもできる。汎用プロセッサ上に実現された場合、このプログラムコードは、そのプロセッサと一体となって、特定論理回路と類似するユニークなデバイスを提供する。
【００２９】
更に、当業者においては明白なように、上で、本発明の特徴を説明する目的で示された細部、材料及びパーツの配列に対して、クレーム内に表明される本発明の範囲から逸脱することなく、様々な変更を加えることが可能である。
【図面の簡単な説明】
【図１】本発明の一つの実施例による等化ミキシング手続を示す流れ図である。
【図２】本発明の一つの実施例による等化ミキサを示すブロック図である。
【符号の説明】
２００等化ミキサ
２００短時間フーリエ変換（ＳＴＥＴ）ブロック
２０４周波数領域ミキサ
２０６周波数領域等化器
２０８短時間逆フーリエ変換（ＩＳＴＦＴ）ブロック
２１０、２１２ラウドネス推定ブロック

Claims

ＮとＭは正の整数を表わすものとして、Ｎ−チャネル入力オーディオ信号を、ミキシングして、Ｍ−チャネルの出力オーディオ信号を生成するための方法であって、
（ａ）該Ｎ−チャネル入力オーディオ信号を、時間領域から周波数領域に変換するステップと、
（ｂ）該Ｎ−チャネル入力オーディオ信号に対して第一のスペクトルラウドネス推定値を生成するステップと、
（ｃ）該Ｎ−チャネル入力オーディオ信号に対応するＮ個の周波数領域入力チャネル信号をミキシングして、Ｍ個の周波数領域混合チャネル信号を生成するステップと、
（ｄ）該Ｍ個の混合チャネル信号に対して第二のスペクトルラウドネス推定値を生成するステップと、
（ｅ）該第一と第二のラウドネス推定値に基づく周波数依存利得係数を用いて、該Ｍ個の周波数領域混合チャネル信号を等化して、Ｍ個の等化された場合チャンネル信号を生成するステップと、
（ｆ）該Ｍ個の等化された混合チャネル信号を、周波数領域から時間領域に変換して、該Ｍ−チャネル出力オーディオ信号を生成するステップと、を含むことを特徴とする方法。
請求項１に記載の方法において、
該ステップ（ｅ）が、該Ｍ個の混合チャネル信号を、該第一および第二のラウドネス推定値に基づく周波数依存利得係数を用いて増幅することで、該Ｍ−チャネル出力オーディオ信号の総スペクトルラウドネスを該Ｎ−チャネル入力オーディオ信号の総スペクトルラウドネスと実質的に等しくなるように維持するステップから成る方法。
請求項１に記載の方法において、
該第１および第２のスペクトルラウドネス推定値が時間に関して平滑化されるようになっている方法。
請求項１に記載の方法において、
該ステップ（ａ）が、短時間フーリエ変換（ＳＴＦＴ）を各入力チャネル信号の各フレームに対して適用するステップから成り、
該ステップ（ｄ）が、逆ＳＴＦＴ（ＩＳＴＦＴ）を各等化された混合チャネル信号の各フレームに対して適用するステップから成り、および
各入力チャネル信号の連続するフレームが時間的に重り合っている、方法。
請求項４に記載の方法において、
該ステップ（ｃ）が、重みづけされた総和に基づいてミキシングを行うことにより、該Ｎ個の周波数領域入力チャネル信号から該Ｍ個の周波数領域混合チャネル信号を生成するステップから成り、
該ステップ（ｅ）が、該第一と第二のスペクトルラウドネス推定値に基づく周波数依存利得係数を用いて該Ｍ個の混合チャネル信号を増幅することで、該Ｍ−チャネル出力オーディオ信号の総スペクトルラウドネスを該Ｎ−チャネル入力オーディオ信号の総スペクトルラウドネスと実質的に等しくなるように維持するステップと、を含み、
該第一と第二のスペクトルラウドネス推定値が時間に関して平滑化され、
Ｎ＞Ｍとされる場合は、該Ｎ−チャネル入力オーディオ信号をダウンミキシングすることにより、該Ｍ−チャネル出力オーディオ信号が生成され、および
Ｎ＜Ｍとされる場合は、該Ｎ−チャネル入力オーディオ信号をアップミキシングすることにより、該Ｍ−チャネル出力オーディオ信号が生成される、ようになっている方法。
請求項１に記載の方法において、
Ｎ＞Ｍとされる場合は、該Ｎ−チャネル入力オーディオ信号をダウンミキシングすることにより、該Ｍ−チャネル出力オーディオ信号が生成され、および
Ｎ＜Ｍとされる場合は、該Ｎ−チャネル入力オーディオ信号をアップミキシングすることにより、該Ｍ−チャネル出力オーディオ信号が生成される、ようになっている方法。
請求項１に記載の方法において、
前記ステップ（ｃ）が、重みづけされた総和に基づくミキシングを行って、Ｎ個の周波数領域入力チャネル信号から、Ｍ個の周波数領域混合チャネル信号を発生するステップから成る方法。
請求項１に記載の方法において、

を、該第１のラウドネス推定値、

を該第２のラウドネス推定値、εを正の定数、およびβを１よりも大きな定数として、
該周波数依存利得係数ｇ_ｋ（ω）が次式

で与えられる方法。
ＮとＭが正の整数を表わすものとして、Ｎ−チャネル入力オーディオ信号をミキシングして、Ｍ−チャネル出力オーディオ信号を生成するための装置であって、
該Ｎ−チャネル入力オーディオ信号を時間領域から周波数領域に変換するように構成された一つ或いは複数の変換ブロックのセットと、
該Ｎ−チャネル入力オーディオ信号に対応するＮ個の周波数領域入力チャネル信号をミキシングすることにより、Ｍ個の周波数領域混合チャネル信号を生成するように構成されたミキサと、
該Ｎ−チャネル入力オーディオ信号に対する第一のラウドネス推定値および該Ｍ個の周波数領域混合チャネル信号に対する第二のラウドネス推定値とを生成するように構成された一つ或いは複数のラウドネス推定値と、
該第一および第二のラウドネス推定値に基づく周波数依存利得係数を用いて該Ｍ個の周波数領域混合チャネル信号を等化することにより、Ｍ個の等化された混合チャネル信号を生成するよう構成された等化器と、
該Ｍ個の等化された混合チャネル信号を周波数領域から時間領域に変換することにより、該Ｍ−チャネル出力オーディオ信号を生成するように構成された一つ或いは複数の逆変換ブロックのセットと、を備える装置。