JP6546351B2

JP6546351B2 - ヘッドマウントスピーカのためのオーディオエンハンスメント

Info

Publication number: JP6546351B2
Application number: JP2018538234A
Authority: JP
Inventors: セルデスザッカリー; トレイシージェームズ; クレイマーアラン
Original assignee: ブームクラウド３６０インコーポレイテッド
Priority date: 2016-01-19
Filing date: 2017-01-12
Publication date: 2019-07-17
Anticipated expiration: 2037-01-12
Also published as: NZ745422A; JP2022058913A; US20170230777A1; JP7378515B2; AU2017208916A1; KR101858918B1; JP2019506803A; KR20170127570A; EP3406085A4; TWI620171B; BR112018014724B1; EP3406085A1; WO2017127286A1; US10009705B2; CA3011694C; CA3011694A1; CN108781331A; TW201732782A; EP4307718A2; CN108781331B

Description

本開示の実施形態は、一般に、バイノーラル（ｂｉｎａｕｒａｌ）およびステレオオーディオ信号処理の分野に関し、より詳細には、ステレオイヤホンなどのヘッドマウントスピーカ上で再生するためにオーディオ信号を最適化することに関する。

ステレオ音声再生は、１つまたは複数のトランスデューサを使用して音場の空間特性を含む信号を符号化し再生することを含む。ステレオ音声は、リスナーが音場における空間感覚を知覚することを可能にする。典型的な立体音響再生システムにおいては、リスニングフィールドにおける固定された位置に配置された２つの「インフィールド」ラウドスピーカが、ステレオ信号を音波に変換する。各インフィールドラウドスピーカからの音波が、空間を通じてリスナーの両耳に向かって伝播し、音場内で様々な方向から聞かれる音の印象を作り出す。

ヘッドホンまたはインイヤーヘッドホンのようなヘッドマウントスピーカは、典型的には、左耳内へ音を放射する専用左スピーカ、および右耳内へ音を放射する専用右スピーカを含む。ヘッドマウントスピーカによって生成された音波は、インフィールドラウドスピーカによって生成された音波とは異なるように作用し、そのような差異はリスナーに知覚されることがある。同じ入力ステレオ信号が、ヘッドマウントスピーカから出力されたときと、インフィールドラウドスピーカから出力されたときに、異なるリスニング体験、場合によってはより好ましくないリスニング体験をもたらす可能性がある。

Ｊ．Ｆ．Ｙｕ，Ｙ．Ｓ．Ｃｈｅｎ， "ＴｈｅＨｅａｄＳｈａｄｏｗＰｈｅｎｏｍｅｎｏｎＡｆｆｅｃｔｅｄｂｙＳｏｕｎｄＳｏｕｒｃｅ：ＩｎＶｉｔｒｏＭｅａｓｕｒｅｍｅｎｔ"，ＡｐｐｌｉｅｄＭｅｃｈａｎｉｃｓａｎｄＭａｔｅｒｉａｌｓ，Ｖｏｌｓ．２８４−２８７，ｐｐ．１７１５−１７２０，２０１３ＡｒｅｔｉＡｎｄｒｅｏｐｏｕｌｏｕ，ＡｇｎｉｅｓｚｋａＲｏｇｉｎｓｋａ，ＨａｒｉｈａｒａｎＭｏｈａｎｒａｊ， "ＡｎａｌｙｓｉｓｏｆｔｈｅＳｐｅｃｔｒａｌＶａｒｉａｔｉｏｎｓｉｎＲｅｐｅａｔｅｄＨｅａｄ−ＲｅｌａｔｅｄＴｒａｎｓｆｅｒＦｕｎｃｔｉｏｎＭｅａｓｕｒｅｍｅｎｔｓ， "Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１９ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｕｄｉｔｏｒｙＤｉｓｐｌａｙ（ＩＣＡＤ２０１３）．Ｌｏｄｚ，Ｐｏｌａｎｄ．６−９Ｊｕｌｙ２０１３．ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｍｍｕｎｉｔｙｆｏｒＡｕｄｉｔｏｒｙＤｉｓｐｌａｙ，２０１３

オーディオ処理システムは、出力チャネルの各々についてシミュレートされた対側クロストーク信号を作成し、これらのシミュレートされた信号を空間的にエンハンスされた信号と組み合わせることによって、再生のための１つまたは複数の出力チャネルを適応的に生成する。オーディオ処理システムは、ヘッドマウントスピーカ上でのリスニング体験をエンハンスし、音楽、映画、およびゲームを含む幅広いコンテンツ上で効果的に作用することができる。オーディオ処理システムは、リスナーによって経験される空間音場を特にエンハンスする、著しく音響的に満足させる経験を提供する、柔軟な構成（たとえば、フィルタ、ゲイン、および遅延）を含む。たとえば、オーディオ処理システムは、インフィールドラウドスピーカでステレオコンテンツを聴いているときに体験される音場に匹敵する音場を、ヘッドマウントスピーカに提供することができる。

いくつかの実施形態において、オーディオ処理システムは、左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信する。左入力チャネルおよび右入力チャネルを使用して、オーディオ処理システムは、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネル、左クロストークチャネルおよび右クロストークチャネル、低周波数エンハンスメントチャネルおよび高周波数エンハンスメントチャネル、中間チャネル、ならびにパススルーチャネルを生成する。オーディオ処理システムは、異なるゲインをチャネルに適用することなどによって、生成されたチャネルを混合して、左出力チャネルおよび右出力チャネルを生成する。一態様において、オーディオ処理システムは、インフィールドスピーカの音波挙動の特徴である対側信号成分をシミュレートして、ヘッドマウントスピーカに対して出力されたときのオーディオ入力信号のリスニング体験を改善する。シミュレートされた対側信号は、逆側のチャネルスピーカに起因する追加的遅延と、リスナーの頭部および耳に起因するフィルタリング効果との両方を考慮する。フィルタリング効果は、それぞれのオーディオチャネルについての頭影効果に関するフィルタ機能によって提供される。したがって、音場の空間感覚が改善され、音場が拡大され、ヘッドマウントスピーカに関するより楽しめるリスニング体験という結果になる。

空間的にエンハンスされたチャネルは、左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、音場の空間感覚をさらにエンハンスする。低周波数チャネルおよび高周波数チャネルはそれぞれ、入力チャネルの低周波数成分および高周波数成分をブーストする。中間チャネルおよびパススルーチャネルは、出力チャネルに対する（たとえば、空間的にエンハンスされていない）入力オーディオ信号の寄与を制御する。

いくつかの実施形態は、出力チャネルを生成するための方法を含み、この方法は、左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信するステップと、左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するステップと、左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成するステップと、右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成するステップと、空間的にエンハンスされた左チャネルおよび右クロストークチャネルを混合することによって、左出力チャネルを生成するステップと、空間的にエンハンスされた右チャネルおよび左クロストークチャネルを混合することによって、右出力チャネルを生成するステップとを含む。

いくつかの実施形態は、オーディオ処理システムを含み、オーディオ処理システムは、左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するように構成されたサブバンド空間エンハンサと、左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成し、右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成するように構成されたクロストークシミュレータと、空間的にエンハンスされた左チャネルおよび右クロストークチャネルを混合することによって、左出力チャネルを生成し、空間的にエンハンスされた右チャネルおよび左クロストークチャネルを混合することによって、右出力チャネルを生成するように構成されたミキサとを含む。

いくつかの実施形態は、プログラムコードを記憶するように構成された非一時的コンピュータ可読媒体を含んでよく、プログラムコードは、命令を含み、命令は、プロセッサによって実行されたとき、左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信することと、左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成することと、左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成することと、右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成することと、空間的にエンハンスされた左チャネルおよび右クロストークチャネルを混合することによって、左出力チャネルを生成することと、空間的にエンハンスされた右チャネルおよび左クロストークチャネルを混合することによって、右出力チャネルを生成することとを、プロセッサに行わせる。

ステレオオーディオ再生システムを示す図である。一実施形態に従って例示的なオーディオ処理システムを示す図である。一実施形態に従うサブバンド空間エンハンサの周波数バンド分割器を示す図である。一実施形態に従うサブバンド空間エンハンサの周波数バンドエンハンサを示す図である。一実施形態に従うサブバンド空間エンハンサのエンハンス化バンドコンバイナを示す図である。一実施形態に従うサブバンドコンバイナを示す図である。一実施形態に従うクロストークシミュレータを示す図である。一実施形態に従うパススルーを示す図である。一実施形態に従う高／低周波数ブースタを示す図である。一実施形態に従うミキサを示す図である。一実施形態に従う、ヘッドマウントスピーカのためのオーディオ信号を最適化する例示的な方法を示す図である。一実施形態に従う、入力オーディオ信号から空間的にエンハンスされたチャネルを生成する方法を示す図である。一実施形態に従う、オーディオ入力信号からクロストークチャネルを生成する方法を示す図である。一実施形態に従う、オーディオ入力信号から左パススルーチャネルおよび右パススルーチャネルならびに中間チャネルを生成する方法を示す図である。一実施形態に従う、オーディオ入力信号から低周波数エンハンスメントチャネルおよび高周波数エンハンスメントチャネルを生成する方法を示す図である。一実施形態に従う、オーディオ処理システムによって生成されたチャネル信号の周波数応答プロットの例を示す図である。一実施形態に従う、オーディオ処理システムによって生成されたチャネル信号の周波数応答プロットの例を示す図である。一実施形態に従う、オーディオ処理システムによって生成されたチャネル信号の周波数応答プロットの例を示す図である。一実施形態に従う、オーディオ処理システムによって生成されたチャネル信号の周波数応答プロットの例を示す図である。一実施形態に従う、オーディオ処理システムによって生成されたチャネル信号の周波数応答プロットの例を示す図である。

本明細書に説明された特徴および利点はすべてを包含するものではなく、特に、多くの追加の特徴および利点は、図面、明細書、および特許請求の範囲に照らして、当業者には明らかとなろう。さらに、本明細書で使用される言葉は、主として読みやすさおよび教示目的で選択されており、本発明の主題を描写または制限するように選択されていなくてよいことに留意されたい。

図面（図）および以下の説明は、単に例示として好ましい実施形態に関する。以下の議論から、本明細書で開示される構造および方法の代替的実施形態は、本発明の原理から逸脱することなく採用されてよい実施可能な代替形態として容易に認識されることに留意されたい。

ここで、本発明のいくつかの実施形態が詳細に参照され、その例が添付図面に示される。実用可能であれば、類似または同様の参照番号が図面で使用されてよく、類似または同様の機能を示してよいことに留意されたい。図面は、単に例示を目的として実施形態を示す。当業者であれば、以下の説明から、本明細書に例示される構造および方法の代替的実施形態が、本明細書に説明される原理から逸脱することなく採用されてよいことを、容易に認識するであろう。

例示的なオーディオ処理システム
図１を参照すると、リスニングフィールドにおける固定された位置に配置された２つのインフィールドラウドスピーカ１１０Ａおよび１１０Ｂが、ステレオ信号を音波に変換し、音波は、リスナー１２０に向かって空間を通じて伝播して、音場内で様々な方向（たとえば仮想音源１６０）から聞かれる音の印象を作り出している。

ヘッドホンまたはインイヤーヘッドホンのようなヘッドマウントスピーカは、典型的には、左耳１２５_L内へ音を放射する専用左スピーカ１３０_L、および右耳１２５_R内へ音を放射する専用右スピーカ１３０_Rを含む。したがって、したがって、ヘッドマウントスピーカによる信号再生は、インフィールドラウドスピーカ１１０Ａおよび１１０Ｂ上の信号再生とは様々な様式で異なるように作用する。

ヘッドマウントスピーカとは異なり、たとえば、リスナーから距離を置いて配置されたラウドスピーカ１１０Ａおよび１１０Ｂはそれぞれが、リスナー１２０の左耳および右耳１２５_L、１２５_Rの両方で受信される「トランスオーラル」音波を生成する。右耳１２５_Rは、左耳１２５_Lがラウドスピーカ１１０Ａから信号成分１１８_Lを受信するときに対して少し遅延してラウドスピーカ１１０Ａから信号成分１１２_Lを受信する。信号成分１１８_Lに対する信号成分１１２_Lの時間遅延は、ラウドスピーカ１１０Ａと左耳１２５_Lとの間の距離に比べてラウドスピーカ１１０Ａと右耳１２５_Rとの間の距離が大きいことによって引き起こされる。同様に、左耳１２５_Lは、右耳１２５_Rがラウドスピーカ１１０Ｂから信号成分１１８_Rを受信するときに対して少し遅延してラウドスピーカ１１０Ｂから信号成分１１２_Rを受信する。

ヘッドマウントスピーカは、ユーザの耳の近くに音波を放射し、したがってトランスオーラル音波伝播をより少なく生成しまたは生成せず、したがって対側成分を生成しない。リスナー１２０の各耳は、同側音成分を対応するスピーカから受信し、対側クロストーク音成分を他方のスピーカから受信しない。したがって、リスナー１２０は、ヘッドマウントスピーカにより、異なる、典型的にはより小さい音場を知覚する。

図２は、一実施形態に従う、ヘッドマウントスピーカのためのオーディオ信号を処理するためのオーディオ処理システム２００の例を示す。オーディオ処理システム２００は、サブバンド空間エンハンサ２１０、クロストークシミュレータ２１５、パススルー２２０、高／低周波数ブースタ２２５、ミキサ２３０、およびサブバンドコンバイナ２５５を含む。オーディオ処理システム２００の構成要素は、電子回路において実装されてよい。たとえば、ハードウェア構成要素は、（たとえば、デジタル信号プロセッサ（ＤＳＰ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、または特定用途向け集積回路（ＡＳＩＣ）などの専用プロセッサとして、）本明細書に開示された特定の動作を行うように構成された専用回路構成またはロジックを含んでよい。

システム２００は、２つの入力チャネル、すなわち左入力チャネルＸ_Lおよび右入力チャネルＸ_Rを含む、入力オーディオ信号Ｘを受信する。入力オーディオ信号Ｘは、異なる左および右の入力チャネルを有するステレオオーディオ信号であってよい。入力オーディオ信号Ｘを使用して、システムは、２つの出力チャネルＯ_L、Ｏ_Rを生成する。以下でより詳細に論じられるように、出力オーディオ信号Ｏは、入力オーディオ信号Ｘに基づく、空間エンハンスメント信号、シミュレートされたクロストーク信号、低／高周波数エンハンスメント信号、および／または他の処理出力の混合である。ヘッドマウントスピーカ２８０_Lおよび２８０_Rに対して出力されたとき、出力オーディオ信号Ｏは、音場サイズ、空間的音制御、およびトーン特性などの観点から、より大きなインフィールドラウドスピーカシステムに匹敵するリスニング体験を提供する。

サブバンド空間エンハンサ２１０は、入力オーディオ信号Ｘを受信し、空間的にエンハンスされた左チャネルＹ_Lおよび空間的にエンハンスされた右チャネルＹ_Rを含む空間的にエンハンスされた信号Ｙを生成する。サブバンド空間エンハンサ２１０は、周波数バンド分割器２４０、周波数バンドエンハンサ２４５、およびエンハンス化サブバンドコンバイナ２５０を含む。周波数バンド分割器２４０は、左入力チャネルＸ_Lおよび右入力チャネルＸ_Rを受信し、左入力チャネルＸ_Lを左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）に分割し、右入力チャネルＸ_Rを右サブバンド成分Ｅ_R（１）ないしＥ_R（ｎ）に分割し、ここで、ｎはサブバンドの数（たとえば４）である。ｎ個のサブバンドはｎ個の周波数バンドのグループを定義し、各サブバンドは周波数バンドのうちの１つと対応する。

周波数バンドエンハンサ２４５は、左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）の中間およびサイドサブバンド成分間の強度比を変更すること、ならびに右サブバンド成分Ｅ_R（１）ないしＥ_R（ｎ）の中間およびサイドサブバンド成分間の強度比を変更することによって、入力オーディオ信号Ｘの空間成分をエンハンスする。各周波数バンドについて、周波数バンドエンハンサは、中間およびサイドサブバンド成分（たとえば、周波数バンドｎ＝１についてＥ_m（１）およびＥ_s（１））を、対応する左サブバンド成分および右サブバンド成分（たとえば、Ｅ_L（１）およびＥ_R（１））から生成し、異なるゲインを中間およびサイドサブバンド成分に適用して、エンハンスされた中間サブバンド成分およびエンハンスされたサイドサブバンド成分（たとえば、Ｙ_m（１）およびＹ_s（１））を生成し、次いで、エンハンスされた中間およびサイドサブバンド成分を、左および右のエンハンスされたサブバンドチャネル（たとえば、Ｙ_L（１）およびＹ_R（１））に変換する。したがって、周波数バンドエンハンサ２４５は、エンハンスされた左サブバンドチャネルＹ_L（１）ないしＹ_L（ｎ）、およびエンハンスされた右サブバンドチャネルＹ_R（１）ないしＹ_R（ｎ）を生成し、ここで、ｎはサブバンド成分の数である。

エンハンス化サブバンドコンバイナ２５０は、エンハンスされた左サブバンドチャネルＹ_L（１）ないしＹ_L（ｎ）から、空間的にエンハンスされた左チャネルＹ_Lを生成し、エンハンスされた右サブバンドチャネルＹ_R（１）ないしＹ_R（ｎ）から、空間的にエンハンスされた右チャネルＹ_Rを生成する。

サブバンドコンバイナ２５５は、左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）を組み合わせることによって、左サブバンド混合チャネルＥ_Lを生成し、右サブバンド成分Ｅ_R（１）ないしＥ_R（ｎ）を組み合わせることによって、右サブバンド混合チャネルＥ_Rを生成する。左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rは、クロストークシミュレータ２１５、パススルー２２０、および／または高／低周波数ブースタ２２５に対する入力として使用される。いくつかの実施形態において、サブバンドバンドコンバイナ２５５は、サブバンド空間エンハンサ２１０、クロストークシミュレータ２１５、パススルー２２０、または高／低周波数ブースタ２２５のうちの１つと統合される。たとえば、サブバンドバンドコンバイナ２５５がクロストークシミュレータ２１５の一部である場合、クロストークシミュレータ２１５は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを、パススルー２２０および／または高／低周波数ブースタ２２５に提供してよい。

いくつかの実施形態において、サブバンドコンバイナ２５５はシステム２００から省略される。たとえば、クロストークシミュレータ２１５、パススルー２２０、および／または高／低周波数ブースタ２２５は、サブバンド混合チャネルＥ_LおよびＥ_Rの代わりに元のオーディオ入力チャネルＸ_LおよびＸ_Rを受信し処理してよい。

クロストークシミュレータ２１５は、オーディオ入力信号Ｘから「頭影効果」を生成する。頭影効果は、リスナーの頭部の周りおよびそれを通じるトランスオーラル波伝播によって引き起こされる音波の変換を指し、それは、たとえば、図１に示されるように、オーディオ入力信号Ｘが、ラウドスピーカ１１０Ａおよび１１０Ｂからリスナー１２０の左耳および右耳１２５_Lおよび１２５_Rの各々に対して伝送された場合に、リスナーによって知覚されることになる。たとえば、クロストークシミュレータ２１５は、左チャネルＥ_Lから左クロストークチャネルＣ_Lを生成し、右チャネルＥ_Rから右クロストークチャネルＣ_Rを生成する。左クロストークチャネルＣ_Lは、ローパスフィルタ、遅延、およびゲインを、左サブバンド混合チャネルＥ_Lに適用することによって生成されてよい。右クロストークチャネルＣ_Rは、ローパスフィルタ、遅延、およびゲインを右サブバンド混合チャネルＥ_Rに適用することによって生成されてよい。いくつかの実施形態において、ローパスフィルタではなく、ローシェルフフィルタまたはノッチフィルタが、左クロストークチャネルＣ_Lおよび右クロストークチャネルＣ_Rを生成するために使用されてよい。

パススルー２２０は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを加えることによって、中間（Ｌ＋Ｒ）チャネルを生成する。中間チャネルは、左サブバンド混合チャネルＥ_Lと右サブバンド混合チャネルＥ_Rの両方に共通するオーディオデータを表す。中間チャネルは、左中間チャネルＭ_Lおよび右中間チャネルＭ_Rに分離されることができる。パススルー２２０は、左パススルーチャネルＰ_Lおよび右パススルーチャネルＰ_Rを生成する。パススルーチャネルは、元の左および右オーディオ入力信号Ｘ_LおよびＸ_R、または、周波数バンド分割器２４５によってオーディオ入力信号Ｘ_LおよびＸ_Rから生成された左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを表す。

高／低周波数ブースタ２２５は、オーディオ入力信号Ｘから、低周波数チャネルＬＦ_LおよびＬＦ_R、ならびに高周波数チャネルＨＦ_LおよびＨＦ_Rを生成する。低周波数チャネルおよび高周波数チャネルは、オーディオ入力信号Ｘに対する周波数依存エンハンスメントを表す。いくつかの実施形態において、周波数依存エンハンスメントの種類または質は、ユーザによって設定されることができる。

ミキサ２３０は、サブバンド空間エンハンサ２１０、クロストークシミュレータ２１５、パススルー２２０、および高／低周波数ブースタ２２５の出力を組み合わせて、左出力信号Ｏ_Lおよび右出力信号Ｏ_Rを含むオーディオ出力信号Ｏを生成する。左出力信号Ｏ_Lは左スピーカ２３５_Lに提供され、右出力信号Ｏ_Rは右スピーカ２３５_Rに提供される。

ミキサ２３０によって生成された出力信号Ｏは、サブバンド空間エンハンサ２１０、クロストークシミュレータ２１５、パススルー２２０、および高／低周波数ブースタ２２５からの出力の重み付けされた組み合わせである。たとえば、左出力チャネルＯ_Lは、空間的にエンハンスされた左チャネルＹ_Lと、右クロストークチャネルＣ_R（たとえば、トランスオーラル音伝播を介して左耳によって聞かれることになる右ラウドスピーカからの対側信号を表す）との組み合わせを含み、好ましくは、左中間チャネルＭ_L、左パススルーチャネルＰ_L、ならびに左低および高周波数チャネルＬＦ_LおよびＨＦ_Lの組み合わせをさらに含む。右出力チャネルＯ_Rは、空間的にエンハンスされた右チャネルＹ_Rと、左クロストークチャネルＣ_L（たとえば、トランスオーラル音伝播を介して右耳によって聞かれることになる左ラウドスピーカからの対側信号を表す）との組み合わせを含み、好ましくは、右中間チャネルＭ_R、右パススルーチャネルＰ_R、ならびに右低および高周波数チャネルＬＦ_RおよびＨＦ_Rの組み合わせをさらに含む。ミキサ２３０に入力される信号の相対的重みは、入力の各々に適用されるゲインによって制御されることができる。

サブバンド空間エンハンサ２１０、サブバンドバンドコンバイナ２５５、クロストークシミュレータ２１５、パススルー２２０、高／低周波数ブースタ２２５、およびミキサ２３０の詳細な例示的実施形態は、図３Ａないし図８に示されており、以下でより詳細に論じられる。

図３Ａは、一実施形態に従うサブバンド空間エンハンサ２１０の周波数バンド分割器２４０を示す。周波数バンド分割器２４０は、定義されたｎ個の周波数サブバンドｋに関して、左入力チャネルＸ_Lを左サブバンド成分Ｅ_L（ｋ）に分割した、右入力チャネルＸ_Rを右サブバンド成分Ｅ_R（ｋ）に分割する。周波数バンド分割器２４０は、入力ゲイン３０２およびクロスオーバーネットワーク３０４を含む。入力ゲイン３０２は、左入力チャネルＸ_Lおよび右入力チャネルＸ_Rを受信し、予め定義されたゲインを左入力チャネルＸ_Lおよび右入力チャネルＸ_Rの各々に適用する。いくつかの実施形態において、同じゲインが左および右入力チャネルＸ_LおよびＸ_Rの各々に適用される。いくつかの実施形態において、入力ゲイン３０２は、−２ｄＢゲインを入力オーディオ信号Ｘに適用する。いくつかの実施形態において、入力ゲイン３０２は、周波数バンド分割器２４０から分離され、またはシステム２００から省略されるので、ゲインが入力オーディオ信号Ｘに適用されない。

クロスオーバーネットワーク３０４は、入力ゲイン３０２から入力オーディオ信号Ｘを受信し、入力オーディオ信号Ｘをサブバンド信号Ｅ（Ｋ）に分割する。クロスオーバーネットワーク３０４は、もたらされる出力が隣接サブバンドについての信号のセットを形成する限り、シリアル、パラレル、または派生型などの任意の様々な回路トポロジに配置された様々な種類のフィルタを使用してよい。クロスオーバーネットワーク３０４に含まれる例示的なフィルタは、無限インパルス応答（ＩＩＲ）もしくは有限インパルス応答（ＦＩＲ）バンドパスフィルタ、ＩＩＲピーキングおよびシェルフフィルタ、またはリンクウィッツライリーなどを含む。フィルタは、各周波数サブバンドｋについて、左入力チャネルＸ_Lを左サブバンド成分Ｅ_L（ｋ）に分割し、右入力チャネルＸ_Rを右サブバンド成分Ｅ_R（ｋ）に分割する。１つの手法において、いくつかのバンドパスフィルタ、またはローパスフィルタ、バンドパスフィルタ、およびハイパスフィルタの任意の組み合わせが、人間の耳の臨界帯域の組み合わせを近似するために採用される。臨界帯域は、既存の１次トーンを第２のトーンがマスクできるバンド幅に対応する。たとえば、周波数サブバンドの各々は、統合されたバーク尺度臨界帯域のグループに対応してよい。たとえば、クロスオーバーネットワーク３０４は、左入力チャネルＸ_Lを、０ないし３００Ｈｚ（バーク尺度帯域１ないし３に対応する）、３００ないし５１０Ｈｚ（たとえば、バーク尺度帯域４ないし５）、５１０ないし２７００Ｈｚ（たとえば、バーク尺度帯域６ないし１５）、および２７００Ｈｚないしナイキスト（Ｎｙｑｕｉｓｔ）周波数（たとえば、バーク尺度７ないし２４）にそれぞれ対応する、４つの左サブバンド成分Ｅ_L（１）ないしＥ_L（４）に分割し、同様に、対応する周波数バンドについて、右入力チャネルＸ_Rを右サブバンド成分Ｅ_R（１）ないしＥ_R（４）に分割する。臨界帯域の統合されたセットを決定するプロセスは、幅広い音楽ジャンルからオーディオサンプルのコーパスを使用することと、２４個のバーク尺度臨界帯域上のサイド成分に対する中間成分の長期平均エネルギー比をサンプルから決定することとを含む。次いで、同様の長期平均比を有する隣接周波数バンドが、一緒にグループ化されて臨界帯域のセットを形成する。他の実装形態において、フィルタが、左および右入力チャネルを４つより少ないまたは多いサブバンドへと分離する。周波数バンドの範囲は調整可能であってよい。クロスオーバーネットワーク３０４は、ｋ＝１ないしｎについて、左サブバンド成分Ｅ_L（ｋ）および右サブバンド成分Ｅ_R（ｋ）の対を出力し、ここで、ｎは、サブバンドの数（たとえば、図３Ａにおいてはｎ＝４）である。

クロスオーバーネットワーク３０４は、左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）、および右サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）を、サブバンド空間エンハンサ２１０の周波数バンドエンハンサ２４５に提供する。以下により詳細に論じられるように、左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）、および右サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）は、クロストークシミュレータ２１５、パススルー２２０、および高／低周波数ブースタ２２５に提供されてもよい。

図３Ｂは、一実施形態に従うサブバンド空間エンハンサ２１０の周波数バンドエンハンサ２４５を示す。周波数バンドエンハンサ２４５は、空間的にエンハンスされた左サブバンド成分Ｙ_L（１）ないしＹ_L（ｎ）および空間的にエンハンスされた右サブバンド成分Ｙ_R（１）ないしＹ_R（ｎ）を、左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）および右サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）から生成する。

周波数バンドエンハンサ２４５は、各サブバンドｋ（ただし、ｋ＝１ないしｎ）について、Ｌ／Ｒ−Ｍ／Ｓ変換器３２０（ｋ）、中間／サイドプロセッサ３３０（ｋ）、およびＭ／Ｓ−Ｌ／Ｒ変換器３４０（ｋ）を含む。各Ｌ／Ｒ−Ｍ／Ｓ変換器３２０（ｋ）は、エンハンスされたサブバンド成分Ｅ_L（ｋ）およびＥ_R（ｋ）の対を受信し、これらの入力を中間サブバンド成分Ｅ_m（ｋ）およびサイドサブバンド成分Ｅ_s（ｋ）に変換する。中間サブバンド成分Ｅ_m（ｋ）は、左サブバンド成分Ｅ_L（ｋ）と右サブバンド成分Ｅ_R（ｋ）との間の相関された部分に対応する非空間サブバンド成分であり、したがって、非空間情報を含む。いくつかの実施形態において、中間サブバンド成分Ｅ_m（ｋ）は、サブバンド成分Ｅ_L（ｋ）とＥ_R（ｋ）の合計として計算される。サイドサブバンド成分Ｅ_s（ｋ）は、左サブバンド成分Ｅ_L（ｋ）と右サブバンド成分Ｅ_R（ｋ）との間の相関されていない部分に対応する非空間サブバンド成分であり、したがって、空間情報を含む。いくつかの実施形態において、サイドサブバンド成分Ｅ_s（ｋ）は、サブバンド成分Ｅ_L（ｋ）とＥ_R（ｋ）の差として計算される。一例において、Ｌ／Ｒ−Ｍ／Ｓ変換器３２０は、以下の方程式に従って、周波数サブバンドｋの非空間サブバンド成分Ｅ_m（ｋ）および空間サブバンド成分Ｅ_s（ｋ）を得る。
Ｅ_m（ｋ）＝Ｅ_L（ｋ）＋Ｅ_R（ｋ）式（１）
Ｅ_s（ｋ）＝Ｅ_L（ｋ）−Ｅ_R（ｋ）式（２）

各サブバンドｋについて中間／サイドプロセッサ３３０（ｋ）は、受信されたサイドサブバンド成分Ｅ_s（ｋ）を調整して、エンハンスされた空間サイドサブバンド成分Ｙ_s（ｋ）を生成し、受信された中間サブバンド成分Ｅ_m（ｋ）を調整して、エンハンスされた中間サブバンド成分Ｙ_m（ｋ）を生成する。一実施形態において、中間／サイドプロセッサ３３０（ｋ）は、中間サブバンド成分Ｅ_m（ｋ）を、対応するゲイン係数Ｇ_m（ｋ）によって調整し、増幅された非空間サブバンド成分Ｇ_m（ｋ）＊Ｅ_m（ｋ）を、対応する遅延関数Ｄ_mによって遅延して、エンハンスされた中間サブバンド成分Ｙ_m（ｋ）を生成する。同様に、中間／サイドプロセッサ３３０（ｋ）は、受信されたサイドサブバンド成分Ｅ_s（ｋ）を、対応するゲイン係数Ｇ_s（ｋ）によって調整し、増幅された空間サブバンド成分Ｇ_s（ｋ）＊Ｘ_s（ｋ）を、対応する遅延関数Ｄ_sによって遅延して、エンハンスされたサイドサブバンド成分Ｙ_s（ｋ）を生成する。ゲイン係数および遅延量は、調整可能であってよい。ゲイン係数および遅延量は、スピーカパラメータに従って決定されてよく、またはパラメータ値の仮定されたセットに対して固定されてよい。周波数サブバンドｋの中間／サイドプロセッサ４３０（ｋ）は、以下の方程式に従って、エンハンスされた中間サブバンド成分Ｙ_m（ｋ）およびエンハンスされたサイドサブバンド成分Ｙ_m（ｋ）を生成する。
Ｙ_m（ｋ）＝Ｇ_m（ｋ）＊Ｄ_m（Ｅ_m（ｋ），ｋ）式（３）
Ｙ_s（ｋ）＝Ｇ_s（ｋ）＊Ｄ_s（Ｅ_s（ｋ），ｋ）式（４）

各中間／サイドプロセッサ３３０（ｋ）は、中間（非空間）サブバンド成分Ｙ_m（ｋ）およびサイド（空間）サブバンド成分Ｙ_s（ｋ）を、それぞれの周波数サブバンドｋの対応するＭ／Ｓ−Ｌ／Ｒ変換器３４０（ｋ）に出力する。
ゲインおよび遅延係数の例が、以下の表１に列挙される。

いくつかの実施形態において、０ないし３００Ｈｚサブバンドに対する中間／サイドプロセッサ３３０（１）は、０．５ｄＢゲインを中間サブバンド成分Ｅ_m（１）に、および４．５ｄＢゲインをサイドサブバンド成分Ｅ_s（１）に適用する。３００ないし５１０Ｈｚサブバンドに対する中間／サイドプロセッサ３３０（２）は、０ｄＢゲインを中間サブバンド成分Ｅ_m（２）に、および４ｄＢゲインをサイドサブバンド成分Ｅ_s（２）に適用する。５１０ないし２７００Ｈｚサブバンドに対する中間／サイドプロセッサ３３０（３）は、０．５ｄＢゲインを中間サブバンド成分Ｅ_m（３）に、および４．５ｄＢゲインをサイドサブバンド成分Ｅ_s（３）に適用する。２７００Ｈｚないしナイキスト周波数サブバンドに対する中間／サイドプロセッサ３３０（４）は、０ｄＢゲインを中間サブバンド成分Ｅ_m（４）に、および４ｄＢゲインをサイドサブバンド成分Ｅ_s（３）に適用する。

各Ｍ／Ｓ−Ｌ／Ｒ変換器３４０（ｋ）は、エンハンスされたサブバンド中間成分Ｙ_m（ｋ）およびエンハンスされたサブバンドサイド成分Ｙ_s（ｋ）を受信し、それらを、エンハンスされた左サブバンド成分Ｙ_L（ｋ）およびエンハンスされた右サブバンド成分Ｙ_R（ｋ）に変換する。Ｌ／Ｒ−Ｍ／Ｓ変換器３２０（ｋ）が、上記の式（１）および式（２）に従って、中間サブバンド成分Ｅ_m（ｋ）およびサイドサブバンド成分Ｅ_s（ｋ）を生成した場合、Ｍ／Ｓ−Ｌ／Ｒ変換器３４０（ｋ）は、以下の方程式に従って、周波数サブバンドｋのエンハンスされた左サブバンド成分Ｙ_L（ｋ）およびエンハンスされた右サブバンド成分Ｙ_R（ｋ）を生成する。
Ｙ_L（ｋ）＝（Ｙ_m（ｋ）＋Ｙ_s（ｋ））／２式（５）
Ｙ_R（ｋ）＝（Ｙ_m（ｋ）−Ｙ_s（ｋ））／２式（６）

ある実施形態において、式（１）および式（２）におけるＥ_L（ｋ）およびＥ_R（ｋ）は交換されてよく、その場合、式（５）および式（６）におけるＹ_L（ｋ）およびＹ_R（ｋ）も交換される。

図３Ｃは、一実施形態に従うサブバンド空間エンハンサ２１０のエンハンス化サブバンドコンバイナ２５０を示す。エンハンス化サブバンドコンバイナ２５０は、Ｍ／Ｓ−Ｌ／Ｒ変換器３４０（１）ないし３４０（ｎ）からの（周波数バンドｋ＝１ないしｎの）エンハンスされた左サブバンド成分Ｙ_L（１）ないしＹ_L（ｎ）を組み合わせて、左の空間的にエンハンスされたオーディオチャネルＹ_Lを生成し、Ｍ／Ｓ−Ｌ／Ｒ変換器３４０（１）ないし３４０（ｎ）からの（周波数バンドｋ＝１ないしｎの）エンハンスされた右サブバンド成分Ｙ_R（１）ないしＹ_L（ｎ）を組み合わせて、右の空間的にエンハンスされたオーディオチャネルＹ_Rを生成する。エンハンス化サブバンドコンバイナ２５０は、エンハンスされた左サブバンド成分Ｙ_L（ｋ）を組み合わせる左合計３５２、エンハンスされた右サブバンド成分Ｙ_R（ｋ）を組み合わせる右合計３５４、ならびにゲインを左合計３５２および右合計３５４の出力に適用するサブバンドゲイン３４６を含んでよい。いくつかの実施形態において、サブバンドゲイン３５６は０ｄＢゲインを適用する。いくつかの実施形態において、以下の方程式に従って、左合計は、エンハンスされた左サブバンド成分Ｙ_L（ｋ）を組み合わせ、右合計３５４は、エンハンスされた右サブバンド成分Ｙ_R（ｋ）を組み合わせる。
ｋ＝１ないしｎについて、Ｙ_L＝ΣＹ_L（ｋ）式（７）
ｋ＝１ないしｎについて、Ｙ_R＝ΣＹ_R（ｋ）式（８）

いくつかの実施形態において、エンハンス化サブバンドコンバイナ２５０は、サブバンド成分中間サブバンド成分Ｙ_m（ｋ）およびサイドサブバンド成分Ｙ_s（ｋ）を組み合わせて、組み合わされた中間サブバンド成分Ｙ_mおよび組み合わされたサイドサブバンド成分Ｙ_sを生成して、次いで、単一のＭ／Ｓ−Ｌ／Ｒ変換が、チャネルごとに適用されて、Ｙ_mおよびＹ_sからＹ_LおよびＹ_Rを生成する。中間／サイドゲインがサブバンドごとに適用され、様々なやり方で再結合されることができる。

図４は、一実施形態に従うオーディオ処理システム２００のサブバンドコンバイナ２５５を示す。サブバンドコンバイナ２５５は、左合計４０２および右合計４０４を含む。左合計４０２は、周波数バンド分割器２４０から出力された左サブバンド成分Ｅ_L（１）ないしＥ_L（ｎ）をサブバンド混合左チャネルＥ_Lに変換する。右合計４０４は、周波数バンド分割器２４０から出力された右サブバンド成分Ｅ_R（１）ないしＥ_R（ｎ）をサブバンド混合右チャネルＥ_Rに変換する。サブバンドコンバイナ２５５は、サブバンド混合左チャネルＥ_Lおよびサブバンド混合右チャネルＥ_Rを、クロストークシミュレータ２１５、パススルー２２０、および高／低周波数ブースタ２２５に提供する。いくつかの実施形態において、元のオーディオ入力チャネルＸ_LおよびＸ_Rは、サブバンド混合左および右チャネルＥ_LおよびＥ_Rの代わりに、クロストークシミュレータ２１５、パススルー２２０、および高／低周波数ブースタ２２５に提供される。ここで、サブバンドコンバイナ２５５は、システム２００から省略されることが可能である。別の例において、サブバンドコンバイナ２５５は、周波数バンド分割器２４０からのサブバンド混合左チャネルＥ_Lおよびサブバンド混合右チャネルＥ_Rを元の入力チャネルＸ_LおよびＸ_Rにデコードしてよい。いくつかの実施形態において、サブバンドコンバイナ２５５は、クロストークシミュレータ２１５、またはシステム２００の何らかの他の構成要素と統合される。

図５は、一実施形態に従うオーディオ処理システム２００のクロストークシミュレータ２１５を示す。クロストークシミュレータは、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rから左クロストークチャネルＣ_Lおよび右クロストークチャネルＣ_Rを生成する。左クロストークチャネルＣ_Lおよび右クロストークチャネルＣ_Rは、最終出力信号Ｏと混合されたとき、シミュレートされたリスナーの頭部を通じたトランスオーラル音波伝播を、出力信号Ｏに組み込む。たとえば、左クロストークチャネルＣ_Lは、右出力チャネルＯ_Rを生成するために右同側音成分（たとえば、空間的にエンハンスされた右チャネルＹ_R）と（たとえば、ミキサ２３０によって）混合されることができる対側音成分を表す。右クロストークチャネルＣ_Rは、左出力チャネルＯ_Lを生成するために左同側音成分（たとえば、空間的にエンハンスされた右チャネルＹ_L）と混合されることができる対側音成分を表す。

クロストークシミュレータ２１５は、ヘッドマウントスピーカ２３５_Lおよび２３５_Rに対する出力のための対側音成分を生成し、それにより、ヘッドマウントスピーカ２３５_Lおよび２３５_Rにおいてラウドスピーカのようなリスニング体験を提供する。図５に戻ると、クロストークシミュレータ２１５は、左サブバンド混合チャネルＥ_Lを処理するための頭影ローパスフィルタ５０２およびクロストーク遅延５０４、右サブバンド混合チャネルＥ_Rを処理するための頭影ローパスフィルタ５０６およびクロストーク遅延５０８、ならびにゲインをクロストーク遅延５０４およびクロストーク遅延５０８の出力に適用するための頭影ゲイン５１０を含む。頭影ローパスフィルタ５０２は、左サブバンド混合チャネルＥ_Lを受信し、リスナーの頭部を通じて通過した後に信号の周波数応答をモデル化する変調を適用する。頭影ローパスフィルタ５０２の出力は、時間遅延を頭影ローパスフィルタ５０２の出力に適用するクロストーク遅延５０４に提供される。時間遅延は、同側音成分に対する対側音成分によって横切られるトランスオーラル距離を表す。周波数応答は、リスナーの頭部による音波変調の周波数依存特性を決定するために経験的実験に基づいて生成されることができる。たとえば、非特許文献１、非特許文献２を参照されたい。たとえば、図１を参照すると、トランスオーラル伝播からの音波変調を表す周波数応答、および右耳１２５_Rに到達するために対側音成分１１２_Lが（同側音成分１１８_Rに対して）移動する増大された距離をモデル化する時間遅延を用いて、同側音成分１１８_Lをフィルタリングすることによって、右耳１２５_Rに対して伝播する対側音成分１１２_Lが、左耳１２５_Lに伝播する同側音成分１１８_Lから導出されることができる。いくつかの実施形態において、クロストーク遅延５０４が頭影ローパスフィルタ５０２に先立って適用される。

同様に、右サブバンド混合チャネルＥ_Rに関して、頭影ローパスフィルタ５０６は、右サブバンド混合チャネルＥ_Rを受信し、リスナーの頭部の周波数応答をモデル化する変調を適用する。頭影ローパスフィルタ５０６の出力は、クロストーク遅延５０８に提供され、クロストーク遅延５０８は、頭影ローパスフィルタ５０４の出力に時間遅延を適用する。いくつかの実施形態において、クロストーク遅延５０８は、頭影ローパスフィルタ５０６に先立って適用される。

頭影ゲイン５１０は、ゲインをクロストーク遅延５０４の出力に適用して、左クロストークチャネルＣ_Lを生成し、ゲインをクロストーク遅延５０６の出力に適用して、右クロストークチャネルＣ_Rを生成する。

いくつかの実施形態において、頭影ローパスフィルタ５０２および５０６は、２，０２３Ｈｚのカットオフ周波数を有する。クロストーク遅延５０４および５０８は、０．７９２ミリ秒遅延を適用する。頭影ゲイン５１０は、−１４．４ｄＢゲインを適用する。

図６は、一実施形態に従うオーディオ処理システム２００のパススルー２２０を示す。パススルー２２０は、オーディオ入力信号Ｘから中間（Ｌ＋Ｒ）チャネルＭおよびパススルーチャネルＰを生成する。たとえば、パススルー２２０は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rから左中間チャネルＭ_Lおよび右中間チャネルＭ_Rを生成し、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rから左パススルーチャネルＰ_Lおよび右パススルーチャネルＰ_Rを生成する。

パススルー２２０は、Ｌ＋Ｒコンバイナ６０２、Ｌ＋Ｒパススルーゲイン６０４、およびＬ／Ｒパススルーゲイン６０６を含む。Ｌ＋Ｒコンバイナ６０２は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを受信し、左サブバンド混合チャネルＥ_Lと右サブバンド混合チャネルＥ_Rを加えて、左サブバンド混合チャネルＥ_Lと右サブバンド混合チャネルＥ_Rの両方に共通するオーディオデータを生成する。Ｌ＋Ｒパススルーゲイン６０４は、ゲインをＬ＋Ｒコンバイナ６０２の出力に加えて、左中間チャネルＭ_Lおよび右中間チャネルＭ_Rを生成する。中間チャネルＭ_LおよびＭ_Rは、左サブバンド混合チャネルＥ_Lと右サブバンド混合チャネルＥ_Rの両方に共通するオーディオデータを表す。いくつかの実施形態において、左中間チャネルＭ_Lは右中間チャネルＭ_Rと同じである。別の例において、Ｌ＋Ｒパススルーゲイン６０４は、異なるゲインを中間チャネルに適用して、異なる左中間チャネルＭ_Lおよび右中間チャネルＭ_Rを生成する。

Ｌ／Ｒパススルーゲイン６０６は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを受信し、ゲインを左サブバンド混合チャネルＥ_Lに加えて、左パススルーチャネルＰ_Lを生成し、ゲインを右サブバンド混合チャネルＥ_Rに加えて、右パススルーチャネルＰ_Rを生成する。いくつかの実施形態において、第１のゲインが左サブバンド混合チャネルＥ_Lに適用されて、左パススルーチャネルＰ_Lを生成し、第２のゲインが右サブバンド混合チャネルＥ_Rに適用されて、右パススルーチャネルＰ_Rを生成し、ここで、第１のゲインと第２のゲインは異なっている。いくつかの実施形態において、第１のゲインと第２のゲインは同じである。

いくつかの実施形態において、パススルー２２０は、元のオーディオ入力信号Ｘ_LおよびＸ_Rを受信し処理する。ここで、中間チャネルＭは、左入力信号Ｘ_Lと右入力信号Ｘ_Lの両方に共通するオーディオデータを表し、パススルーチャネルＰは、元のオーディオ信号Ｘを表す（たとえば、周波数バンド分割器２４０による周波数サブバンドへの符号化、ならびにサブバンドバンドコンバイナ２５５による左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rへの再結合がない）。

いくつかの実施形態において、Ｌ＋Ｒパススルーゲイン６０４は、−１８ｄＢゲインをＬ＋Ｒコンバイナ６０２の出力に適用する。Ｌ／Ｒパススルーゲイン６０６は、−無限大ｄＢゲインを左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rに適用する。

図７は、一実施形態に従うオーディオ処理システム２００の高／低周波数ブースタ２２５を示す。高／低周波数ブースタ２２５は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rから、低周波数チャネルＬＦ_LおよびＬＦ_Rならびに高周波数チャネルＨＦ_LおよびＨＦ_Rを生成する。低周波数および高周波数チャネルは、オーディオ入力信号Ｘに対する周波数依存エンハンスメントを表す。

高／低周波数ブースタ２２５は、第１の低周波数（ＬＦ）エンハンスバンドパスフィルタ７０２、第２のＬＦエンハンスバンドパスフィルタ７０４、ＬＦフィルタゲイン７０５、高周波数（ＨＦ）エンハンスハイパスフィルタ７０８、およびＨＦフィルタゲイン７１０を含む。ＬＦエンハンスバンドパスフィルタ７０２は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを受信し、周波数のバンドまたは広がりの外側の信号成分を減衰させる変調を適用し、それにより、周波数のバンドの内側の（たとえば低周波数）信号成分が通過するのを可能にする。ＬＦエンハンスバンドパスフィルタ７０４は、ＬＦエンハンスバンドパスフィルタ７０４の出力を受信し、周波数のバンドの外側の信号成分を減衰させる別の変調を適用する。

ＬＦエンハンスバンドパスフィルタ７０２およびＬＦエンハンスバンドパスフィルタ７０４は、低周波数エンハンスメント・カスケード共振器を提供する。いくつかの実施形態において、ＬＦエンハンスバンドパスフィルタ７０２および７０４は、調整可能な品質（Ｑ）ファクタを備える５８．１７５Ｈｚの中心周波数を有する。Ｑファクタは、ユーザ設定またはプログラム構成に基づいて調整されることができる。たとえば、デフォルト設定が２．５のＱファクタを含んでよいが、より積極的な設定は１．３のＱファクタを含んでよい。共振器は、低周波数成分の時間エンベロープをエンハンスするためにアンダーダンプ応答（Ｑ＞０．５）を示すように構成される。

ＬＦフィルタゲイン７０６は、ゲインをＬＦエンハンスバンドパスフィルタ７０４の出力に適用して、左ＬＦチャネルＬＦ_Lおよび右ＬＦチャネルＬＦ_Rを生成する。いくつかの実施形態において、ＬＦフィルタゲイン７０６は、１２ｄＢゲインをＬＦエンハンスバンドパスフィルタ７０４の出力に適用する。

ＨＦエンハンスハイパスフィルタ７０８は、左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rを受信し、カットオフ周波数よりも低い周波数を有する信号成分を減衰させる変調を適用し、それにより、カットオフ周波数よりも高い周波数を有する信号成分が通過するのを可能にする。いくつかの実施形態において、ＨＦエンハンスハイパスフィルタ７０８は、４５７３Ｈｚのカットオフ周波数を有する２次バターワース（ｂｕｔｔｅｒｗｏｒｔｈ）ハイパスフィルタである。

ＨＦフィルタゲイン７１０は、ゲインをＨＦエンハンスハイパスフィルタ７０４の出力に適用して、左ＨＦチャネルＨＦ_Lおよび右ＨＦチャネルＨＦ_Rを生成する。いくつかの実施形態において、ＨＦフィルタゲイン７１０は、０ｄＢゲインをＨＦエンハンスハイパスフィルタ７０８の出力に適用する。

図８は、一実施形態に従うオーディオ処理システム２００のミキサ２３０を示す。ミキサ２３０は、サブバンド空間エンハンサ２１０、クロストークシミュレータ２１５、パススルー２２０、および高／低周波数ブースタ２２５からの出力の重み付けされた組み合わせに基づいて、出力チャネルＯ_LおよびＯ_Rを生成する。ミキサ２３０は、左出力チャネルＯ_Lを左スピーカ２３５_Lに提供し、右出力信号Ｏ_Rを右スピーカ２３５_Rに提供する。

ミキサ２３０は、左合計８０２、右合計８０４、および出力ゲイン８０６を含む。左合計８０２は、サブバンド空間エンハンサ２１０からの空間的にエンハンスされた左チャネルＹ_L、クロストークシミュレータ２１５からの右クロストークチャネルＣ_R、パススルー２２０からの左中間チャネルＭ_Lおよび左パススルーチャネルＰ_L、ならびに高／低周波数ブースタ２２５からの左低および高周波数チャネルＬＦ_LおよびＨＦ_Lを受信し、左合計８０２は、これらのチャネルを組み合わせる。同様に、右合計８０４は、サブバンド空間エンハンサ２１０からの空間的にエンハンスされた左チャネルＹ_R、クロストークシミュレータ２１５からの左クロストークチャネルＣ_L、パススルー２２０からの右中間チャネルＭ_Rおよび右パススルーチャネルＰ_R、ならびに高／低周波数ブースタ２２５からの右低および高周波数チャネルＬＦ_RおよびＨＦ_Rを受信し、右合計８０４は、これらのチャネルを組み合わせる。

出力ゲイン８０６は、ゲインを左合計８０２の出力に適用して、左出力チャネルＯ_Lを生成し、ゲインを右合計の出力８０４に適用して、右出力チャネルＯ_Rを生成する。いくつかの実施形態において、出力ゲイン８０６は、０ｄＢゲインを左合計８０２および右合計８０４の出力に適用する。いくつかの実施形態において、サブバンドゲイン３５６、頭影ゲイン５１０、Ｌ＋Ｒパススルーゲイン６０４、Ｌ／Ｒパススルーゲイン６０６、ＬＦフィルタゲイン７０６、および／またはＨＦフィルタゲイン７１０が、ミキサ２３０と統合される。ここで、ミキサ２３０は、出力チャネルＯ_LおよびＯ_Rに対する入力チャネル寄与の相対的重みを制御する。

図９は、一実施形態に従う、ヘッドマウントスピーカのためのオーディオ信号を最適化する方法９００を示す。オーディオ処理システム２００は、並列にステップを実行し、異なる順序でステップを実行し、または異なるステップを実行してよい。

システム２００は、左入力チャネルＸ_Lおよび右入力チャネルＸ_Rを含む入力オーディオ信号Ｘを受信する９０５。オーディオ入力信号Ｘは、左および右入力チャネルＸ_LおよびＸ_Rが互いに異なるステレオ信号であってよい。

サブバンド空間エンハンサ２１０などのシステム２００は、左および右入力チャネルＸ_LおよびＸ_Rのサイドサブバンド成分および中間サブバンド成分をゲイン調整することから、空間的にエンハンスされた左チャネルＹ_Lおよび空間的にエンハンスされた右チャネルＹ_Rを生成する９１０。図１０に関連して以下により詳細に論じられるように、空間的にエンハンスされた左および右チャネルＹ_LおよびＹ_Rは、左および右入力チャネルＸ_LおよびＸ_Rから導出された中間およびサイドサブバンド成分間の強度比を変更することによって、音場における空間感覚を改善する。

クロストークシミュレータ２１５などのシステム２００は、左入力チャネルＸ_Lをフィルタリングし時間遅延させることから左クロストークチャネルＣ_Lを、右入力チャネルＸ_Rをフィルタリングし時間遅延させることから右クロストークチャネルＣ_Rを生成する９１５。クロストークチャネルＣ_LおよびＣ_Rは、図１などに示されるように、左入力チャネルＸ_Lおよび右入力チャネルＸ_Rがラウドスピーカから出力された場合、リスナーに到達することになる左入力チャネルＸ_Lおよび右入力チャネルＸ_Rについてのトランスオーラルで対側クロストークをシミュレートする。クロストークチャネルを生成することは、図１１に関連して以下により詳細に論じられる。

パススルー２２０などのシステム２００は、左入力チャネルＸ_Lから左パススルーチャネルＰ_Lを、右入力チャネルＸ_Rから右パススルーチャネルＰ_Rを生成する９２０。パススルー２２０などのシステム２００は、左入力チャネルＸ_Lおよび右入力チャネルＸ_Rを組み合わせることから、左および右中間チャネルＭ_LおよびＭ_Rを生成する９２５。パススルーチャネルは、出力チャネルＯに対する未処理の入力チャネルＸ入力チャネルの相対的寄与を制御するために使用されることができ、中間チャネルは、左入力チャネルＸ_Lおよび右入力チャネルＸ_Rの共通オーディオデータの相対的寄与を制御するために使用されることができる。パススルーおよび中間チャネルを生成することは、図１２に関連して以下により詳細に論じられる。

高／低周波数ブースタ２２５などのシステム２００は、カスケード共振器を左入力チャネルＸ_Lおよび右入力チャネルＸ_Rに適用することから、左および右低周波数チャネルＬＦ_LおよびＬＦ_Rを生成する９３０。低周波数チャネルＬＦ_LおよびＬＦ_Rは、出力チャネルＯに対する入力チャネルＸの低周波数オーディオ成分の相対的エンハンスメントを制御する。

高／低周波数ブースタ２５５などのシステム２００は、ハイパスフィルタを左入力チャネルＸ_Lおよび右入力チャネルＸ_Rに適用することから、左および右高周波数チャネルＨＦ_LおよびＨＦ_Rを生成する９３５。高周波数チャネルＨＦ_LおよびＨＦ_Rは、出力チャネルＯに対する入力チャネルＸの高周波数オーディオ成分の相対的エンハンスメントを制御する。ＬＦおよびＨＦチャネルを生成することは、図１３に関連して以下により詳細に論じられる。

ミキサ２３０などのシステム２００は、出力チャネルＯ_Lおよび出力チャネルＯ_Rを生成する９４０。出力チャネルＯ_Lは、ヘッドマウント左スピーカ２３５_Lに提供されることができ、右出力チャネルＯ_Rは、右スピーカ２３５_Rに提供される。出力チャネルＯ_Lは、サブバンド空間エンハンサ２１０からの空間的にエンハンスされた左チャネルＹ_L、クロストークシミュレータ２１５からの右クロストークチャネルＣ_R、パススルー２２０からの左中間チャネルＭ_Lおよび左パススルーチャネルＰ_L、ならびに高／低周波数ブースタ２２５からの左低および高周波数チャネルＬＦ_LおよびＨＦ_Lの重み付けされた組み合わせから生成される。出力チャネルＯ_Rは、サブバンド空間エンハンサ２１０からの空間的にエンハンスされた左チャネルＹ_R、クロストークシミュレータ２１５からの左クロストークチャネルＣ_L、パススルー２２０からの右中間チャネルＭ_Rおよび右パススルーチャネルＰ_R、ならびに高／低周波数ブースタ２２５からの右低および高周波数チャネルＬＦ_RおよびＨＦ_Rの重み付けされた組み合わせから生成される。

ミキサ２３０に対する入力の相対的重みは、入力ゲイン３０２、サブバンドゲイン３５６、頭影ゲイン５１０、Ｌ＋Ｒパススルーゲイン６０４、Ｌ／Ｒパススルーゲイン６０６、ＬＦフィルタゲイン７０６、およびＨＦフィルタゲイン７１０など、上述されたようなチャネル源におけるゲインフィルタによって、制御されることができる。たとえば、ゲインフィルタは、チャネルの信号振幅を低減させて出力チャネルＯに対するチャネルの寄与を低減させること、または信号振幅を増大させて出力チャネルＯに対するチャネルの寄与を増大させることができる。いくつかの実施形態において、１つまたは複数のチャネルの信号振幅は、０または実質的に０に設定されてよく、出力チャネルＯに対する１つまたは複数のチャネルの寄与がないという結果になる。

いくつかの実施形態において、サブバンドゲイン３５６は、−１２ないし６ｄＢ間のゲインを適用し、頭影ゲイン５１０は、−無限大ないし０ｄＢゲインを適用し、ＬＦフィルタゲイン７０６は、０ないし２０ｄＢゲインを適用し、ＨＦフィルタゲイン７１０は、０ないし２０ｄＢゲインを適用し、Ｌ／Ｒパススルーゲイン６０６は、−無限大ないし０ｄＢゲインを適用し、Ｌ＋Ｒパススルーゲイン６０４は、−無限大ないし０ｄＢゲインを適用する。ゲインの相対値は、異なるチューニングを提供するように調整可能であってよい。いくつかの実施形態において、オーディオ処理システムは、ゲイン値の予め定義されたセットを使用する。たとえば、サブバンドゲイン３５６は、０ｄＢゲインを適用し、頭影ゲイン５１０は、−１４．４ｄＢゲインを適用し、ＬＦフィルタゲイン７０６は、１２ｄＢゲインの間を適用し、ＨＦフィルタゲイン７１０は、０ｄＢゲインを適用し、Ｌ／Ｒパススルーゲイン６０６は、−無限大ｄＢゲインを適用し、Ｌ＋Ｒパススルーゲイン６０４は、−１８ｄＢゲインを適用する。

上述されたように、方法９００におけるステップは異なる順序で実行されてよい。一例において、ステップ９１０ないし９３５は、入力チャネルＹ、Ｃ、Ｍ、ＬＦ、およびＨＦが組み合わせのために実質的に同時にミキサ２３０に利用可能であるように、並列に実行される。

図１０は、一実施形態に従う、入力オーディオ信号Ｘから空間的にエンハンスされたチャネルＹ_LおよびＹ_Rを生成する方法１０００を示す。方法１０００は、システム２００のサブバンド空間エンハンサ２１０などによって、方法９００の９１０で実行されてよい。

周波数バンド分割器２４０のクロスオーバーネットワーク３０４などのサブバンド空間エンハンサ２１０は、入力チャネルＸ_Lをサブバンド混合サブバンドチャネルＥ_L（１）ないしＥ_L（ｎ）に分離１０１０し、入力チャネルＸ_Rをサブバンド混合サブバンドチャネルＥ_R（１）ないしＥ_R（ｎ）に分離する。Ｎは、サブバンドチャネルの予め定義された数であり、いくつかの実施形態においては、０ないし３００Ｈｚ、３００ないし５１０Ｈｚ、５１０ないし２７００Ｈｚ、および２７００Ｈｚないしナイキスト周波数にそれぞれ対応する、４つのサブバンドチャネルである。上述されたように、ｎ個のサブバンドチャネルは人間の年の臨界帯域を近似する。ｎ個のサブバンドチャネルは、幅広い音楽ジャンルからオーディオサンプルのコーパスを使用することと、２４個のバーク尺度臨界帯域上のサイド成分に対する中間成分の長期平均エネルギー比をサンプルから決定することとによって決定される、統合された臨界帯域のセットである。次いで、同様の長期平均比を有する隣接周波数バンドが、一緒にグループ化されてｎ個の臨界帯域のセットを形成する。

周波数バンドエンハンサ２４５のＬ／Ｒ−Ｍ／Ｓ変換器３２０（ｋ）などのサブバンド空間エンハンサ２１０は、各サブバンドｋ（ただし、ｋ＝１ないしｎ）について、空間サブバンド成分Ｅ_s（ｋ）および非空間サブバンド成分Ｅ_m（ｋ）を生成する１０２０。たとえば、各Ｌ／Ｒ−Ｍ／Ｓ変換器３２０（ｋ）は、サブバンド混合サブバンド成分Ｅ_L（ｋ）およびＥ_R（ｋ）の対を受信し、上述された式（１）および（２）に従って、これらの入力を中間サブバンド成分Ｅ_m（ｋ）およびサイドサブバンド成分Ｅ_s（ｋ）に変換する。ｎ＝４に関して、Ｌ／Ｒ−Ｍ／Ｓ変換器３２０（１）ないし３２０（４）は、空間サブバンド成分Ｅ_s（１）、Ｅ_s（２）、Ｅ_s（３）、およびＥ_s（４）、ならびに非空間サブバンド成分Ｅ_m（１）、Ｅ_m（２）、Ｅ_m（３）、およびＥ_m（４）を生成する。

周波数バンドエンハンサ２４５の中間／サイドプロセッサ３３０（ｋ）などのサブバンド空間エンハンサ２１０は、各サブバンドｋについて、エンハンスされた空間サブバンド成分Ｙ_s（ｋ）およびエンハンスされた非空間サブバンド成分Ｙ_m（ｋ）を生成する１０３０。たとえば、各中間／サイドプロセッサ３３０（ｋ）は、式（３）に従って、ゲインＧ_m（ｋ）および遅延関数Ｄを適用することによって、中間サブバンド成分Ｅ_m（ｋ）をエンハンスされた空間サブバンド成分Ｙ_m（ｋ）に変換する。各中間／サイドプロセッサ３３０（ｋ）は、式（４）に従って、ゲインＧ_s（ｋ）および遅延関数Ｄを適用することによって、サイドサブバンド成分Ｅ_s（ｋ）をエンハンスされた空間サブバンド成分Ｙ_s（ｋ）に変換する。

いくつかの実施形態において、各サブバンドｋについてのゲインＧ_m（ｋ）およびＧ_s（ｋ）の値は、幅広い音楽ジャンルのようなオーディオサンプルのコーパスから、サブバンドｋにわたるサイド成分に対する中間成分の長期平均エネルギー比をサンプリングすることに基づいて、初期に決定される。いくつかの実施形態において、オーディオサンプルは、映画、映画、およびゲームなどの異なる種類のオーディオコンテンツを含んでよい。別の例において、サンプリングは、望ましい空間特性を含むことが知られるオーディオサンプルを使用して実行されることができる。これらのサイドエネルギーに対する中間エネルギーの比は、中間サブバンド成分Ｙ_m（ｋ）およびエンハンスされたサイドサブバンド成分Ｙ_s（ｋ）についてのＧ_mおよびＧ_sのゲインを計算する開始点として使用される。次いで、上述されたように、幅広いオーディオサンプルにわたって専門家の主観的リスニング試験を通じて、最終サブバンドゲインが定義される。いくつかの実施形態において、ゲインＧ_mおよびＧ_sならびに遅延Ｄ_MおよびＤ_Sは、スピーカパラメータに従って決定されてよく、またはパラメータ値の仮定されたセットに対して固定されてよい。

周波数バンドエンハンサ２４５のＭ／Ｓ−Ｌ／Ｒ変換器３４０（ｋ）などのサブバンド空間エンハンサ２１０は、各サブバンドｋについて、空間的にエンハンスされた左サブバンド成分Ｙ_L（ｋ）および空間的にエンハンスされた右サブバンド成分Ｙ_R（ｋ）を生成する１０４０。各Ｍ／Ｓ−Ｌ／Ｒ変換器３４０（ｋ）は、エンハンスされた中間成分Ｙ_m（ｋ）およびエンハンスされたサイド成分Ｙ_s（ｋ）を受信し、式（５）および（６）に従うなどして、それらを、空間的にエンハンスされた左サブバンド成分Ｙ_L（ｋ）および空間的にエンハンスされた右サブバンド成分Ｙ_R（ｋ）に変換する。ここで、空間的にエンハンスされた左サブバンド成分Ｙ_L（ｋ）は、エンハンスされた中間成分Ｙ_m（ｋ）とエンハンスされたサイド成分Ｙ_s（ｋ）を加えることに基づいて生成され、空間的にエンハンスされた右サブバンド成分Ｙ_R（ｋ）は、エンハンスされたサイド成分Ｙ_s（ｋ）をエンハンスされた中間成分Ｙ_m（ｋ）から引くことに基づいて生成される。ｎ＝４個のサブバンドに関して、Ｍ／Ｓ−Ｌ／Ｒ変換器３４０（１）ないし３４０（４）は、エンハンスされた左サブバンド成分Ｙ_L（１）ないしＹ_L（４）、およびエンハンスされた右サブバンド成分Ｙ_R（１）ないしＹ_R（４）を生成する。

エンハンス化サブバンドコンバイナ２５０などのサブバンド空間エンハンサ２１０は、エンハンスされた左サブバンド成分Ｙ_L（１）ないしＹ_L（ｎ）を組み合わせることによって空間的にエンハンスされた左チャネルＹ_Lを、エンハンスされた右サブバンド成分Ｙ_R（１）ないしＹ_R（ｎ）を組み合わせることによって空間的にエンハンスされた右チャネルＹ_Rを生成する１０５０。組み合わせは、上述されたように式５および６に基づいて実行されてよい。いくつかの実施形態において、エンハンス化サブバンドコンバイナ２５０は、左出力チャネルＯ_Lに対する空間的にエンハンスされた左チャネルＹ_Lの寄与、および右出力チャネルＯ_Rに対する空間的にエンハンスされた右チャネルＹ_Rの寄与を制御する、空間的にエンハンスされた左チャネルＹ_Lおよび空間的にエンハンスされた左チャネルＹ_Rに対するサブバンドゲインをさらに適用する。いくつかの実施形態において、サブバンドゲインは、ベースラインレベルとして機能する０ｄＢゲインであり、本明細書で論じられる他のゲインは、０ｄＢゲインに対して相対的に設定される。いくつかの実施形態において、入力ゲイン３０２が−２ｄＢゲインと異なるときなどに、サブバンドゲインは、しかるべく（たとえば、空間的にエンハンスされた左チャネルＹ_Lおよび空間的にエンハンスされた左チャネルＹ_Rについての望ましいベースラインレベルに到達するように）調整されることができる。

様々な実施形態において、方法１０００におけるステップは異なる順序で実行されてよい。たとえば、サブバンドｋ＝１ないしｎについてのエンハンスされた空間サブバンド成分Ｙ_s（ｋ）が組み合わされて、Ｙ_sを生成してよく、サブバンドｋ＝１ないしｎについてのエンハンスされた非空間サブバンド成分Ｙ_m（ｋ）が組み合わされて、Ｙ_mを生成してよい。Ｙ_sおよびＹ_mは、Ｍ／Ｓ−Ｌ／Ｒ変換を使用して、空間的にエンハンスされたチャネルＹ_LおよびＹ_Rに変換されてよい。

図１１は、一実施形態に従う、オーディオ入力信号からクロストークチャネルを生成する方法１１００を示す。方法１１００は、方法９００の９１５で実行されてよい。対側クロストーク信号を表すクロストークチャネルＣ_LおよびＣ_Rは、フィルタおよび時間遅延を同側入力チャネルＸ_LおよびＸ_Rに適用することに基づいて生成される。

システム２００のサブバンドバンドコンバイナ２５５は、サブバンド混合サブバンドチャネルＥ_L（１）ないしＥ_L（ｎ）を組み合わせることによってサブバンド混合左チャネルＥ_Lを、サブバンド混合サブバンドチャネルＥ_R（１）ないしＥ_R（ｎ）を組み合わせることによってサブバンド混合右チャネルＥ_Rを生成する１１１０。左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rは、クロストークシミュレータ２１５、パススルー２２０、および／または高／低周波数ブースタ２２５に対する入力として使用される。いくつかの実施形態において、クロストークシミュレータ２１５、パススルー２２０、および／または高／低周波数ブースタ２２５は、サブバンド混合チャネルＥ_LおよびＥ_Rの代わりに元のオーディオ入力チャネルＸ_LおよびＸ_Rを受信し処理してよい。ここで、ステップ１１００は実行されず、方法１００の後続の処理ステップが、オーディオ入力チャネルＸ_LおよびＸ_Rを使用して実行される。いくつかの実施形態において、サブバンドバンドコンバイナ２５５は、サブバンド混合左サブバンドチャネルＥ_L（１）ないしＥ_L（ｎ）を左入力チャネルＸ_Lにデコードし、サブバンド混合右サブバンドチャネルＥ_R（１）ないしＥ_R（ｎ）を右入力チャネルＸ_Rにデコードする。

システム２００のクロストークシミュレータ２１５は、第１のローパスフィルタをサブバンド混合左チャネルＥ_Lに適用する１１２０。第１のローパスフィルタは、リスナーの頭部を通じて通過した後の信号の周波数応答をモデル化する変調を適用するクロストークシミュレータ２１５の頭影ローパスフィルタ５０２であってよい。上述されたように、頭影ローパスフィルタ５０２は、２，０２３Ｈｚのカットオフ周波数を有してよく、ここで、カットオフ周波数を超えるサブバンド混合左チャネルＥ_Lの周波数成分が減衰される。システム２００のクロストークシミュレータ２１５の他の実施形態は、頭影ローパスフィルタについてローシェルフまたはノッチフィルタを採用してよい。このフィルタは、０．５と１．０の間のＱ、および−６ｄＢと−２４ｄＢの間のゲインと共に、２，０２３Ｈｚのカットオフ／中心周波数を有してよい。

クロストークシミュレータ２１５は、第１のクロストーク遅延を第１のローパスフィルタの出力に適用する１１３０。たとえば、クロス遅延５０４は、図１に示されるように、リスナー１２０の右耳１２５_Rに到達するために左ラウドスピーカ１１０Ａからの対側音成分１１２_Lが右ラウドスピーカ１１０Ｂからの同側音成分１１８_Rに対して移動する、増大されたトランスオーラル距離（ひいては増大された移動時間）をモデル化する時間遅延を提供する。いくつかの実施形態において、クロス遅延５０４は、０．７９２ミリ秒クロストーク遅延を、フィルタリングされたサブバンド混合左チャネルＥ_Lに適用する。いくつかの実施形態において、ステップ１１２０と１１３０は、第１のクロストーク遅延が第１のローパスフィルタに先立って適用されるように逆順にされる。

クロストークシミュレータ２１５は、第２のローパスフィルタをサブバンド混合右チャネルＥ_Rに適用する１１４０。第２のローパスフィルタは、リスナーの頭部を通じて通過した後の信号の周波数応答をモデル化する変調を適用するクロストークシミュレータ２１５の頭影ローパスフィルタ５０６であってよい。いくつかの実施形態において、頭影ローパスフィルタ５０６は、２，０２３Ｈｚのカットオフ周波数を有してよく、ここで、カットオフ周波数を超えるサブバンド混合右チャネルＥ_Rの周波数成分が減衰される。システム２００のクロストークシミュレータ２１５の他の実施形態は、頭影ローパスフィルタについてローシェルフまたはノッチフィルタを採用してよい。このフィルタは、０．５と１．０の間のＱ、および−６ｄＢと−２４ｄＢの間のゲインと共に、２，０２３Ｈｚのカットオフ周波数を有してよい。

クロストークシミュレータ２１５は、第２のクロストーク遅延を第２のローパスフィルタの出力に適用する１１５０。第２の時間遅延は、図１に示されるように、リスナー１２０の左耳１２５_Lに到達するために右ラウドスピーカ１１０Ｂからの対側音成分１１２_Rが左ラウドスピーカ１１０Ｂからの同側音成分１１８_Lに対して移動する、増大されたトランスオーラル距離をモデル化する。いくつかの実施形態において、クロス遅延５０８は、０．７９２ミリ秒クロストーク遅延を、フィルタリングされたサブバンド混合左チャネルＥ_Rに適用する。いくつかの実施形態において、ステップ１１４０と１１５０は、第２のクロストーク遅延が第２のローパスフィルタに先立って適用されるように逆順にされる。

クロストークシミュレータ２１５は、第１のゲインを第１のクロストーク遅延の出力に適用して１１６０、左クロストークチャネルＣ_Lを生成する。クロストークシミュレータ２１５は、第２のゲインを第２のクロストーク遅延の出力に適用して１１７０、右クロストークチャネルＣ_Rを生成する。いくつかの実施形態において、頭影ゲイン５１０は、−１４．４ｄＢゲインを適用して、左クロストークチャネルＣ_Lおよび右クロストークチャネルＣ_R生成する。

様々な実施形態において、方法１１００におけるステップは異なる順序で実行されてよい。たとえば、ステップ１１２０および１１３０が、ステップ１１４０および１１５０と並列に実行されて、左チャネルおよび右チャネルを並列に処理し、左クロストークチャネルＣ_Lおよび右クロストークチャネルＣ_Rを並列に生成するようにしてよい。

図１２は、一実施形態に従う、オーディオ入力信号から左パススルーチャネルおよび右パススルーチャネルならびに中間チャネルを生成する方法１２００を示す。方法１２００は、方法９００の９２０および９２５で実行されてよい。パススルーチャネルは、空間的にエンハンスされていない入力チャネルＸの出力チャネルＯに対する寄与を制御し、中間チャネルは、出力チャネルＯに対する空間的にエンハンスされていない左入力チャネルＸ_Lおよび空間的にエンハンスされていない右入力チャネルＸ_Rの共通オーディオデータの出力チャネルＯに対する寄与を制御する。

オーディオ処理システム２００のパススルー２２０は、ゲインをサブバンド混合左チャネルＥ_Lに適用して１２１０、パススルーチャネルＰ_Lを生成し、ゲインをサブバンド混合右チャネルＥ_Rに適用して、パススルーチャネルＰ_Rを生成する。いくつかの実施形態において、パススルー２２０のＬ／Ｒパススルーゲイン６０６は、−無限大ｄＢゲインを左サブバンド混合チャネルＥ_Lおよび右サブバンド混合チャネルＥ_Rに適用する。ここで、パススルーチャネルＰ_LおよびＰ_Rは完全に減衰され、出力信号Ｏに寄与しない。ゲインのレベルは、出力信号Ｏに寄与する空間的にエンハンスされていない入力信号の量を制御するように調整されることができる。

パススルー２２０は、サブバンド混合左チャネルＥ_Lおよびサブバンド混合右チャネルＥ_Rを組み合わせて１２２０、中間（Ｌ＋Ｒ）チャネルを生成する。たとえば、パススルー２２０のＬ＋Ｒコンバイナ６０２は、左サブバンド混合チャネルＥ_Lと右サブバンド混合チャネルＥ_Rを加えて、左サブバンド混合チャネルＥ_Lと右サブバンド混合チャネルＥ_Rの両方に共通するオーディオデータを有するチャネルとする。

パススルー２２０は、ゲインを中間チャネルに適用して１２３０、左中間チャネルＭ_Lを生成し、ゲインを中間チャネルに適用して、右中間チャネルＭ_Rを生成する。いくつかの実施形態において、Ｌ＋Ｒパススルーゲイン６０４は、−１８ｄＢゲインをＬ＋Ｒコンバイナ６０２の出力に適用して、左および右中間チャネルＭ_LおよびＭ_Rを生成する。ゲインのレベルは、出力信号Ｏに寄与する空間的にエンハンスされていない中間入力信号の量を制御するように調整されることができる。いくつかの実施形態において、単一のゲインが中間チャネルに適用され、ゲインが適用された中間チャネルは、左および右中間チャネルＭ_LおよびＭ_Rに使用される。

様々な実施形態において、方法１２００におけるステップは異なる順序で実行されてよい。たとえば、ステップ１２１０および１２３０が並列に実行されて、パススルーチャネルおよび中間チャネルを並列に生成するようにしてよい。

図１３は、一実施形態に従う、オーディオ入力信号から低周波数エンハンスメントチャネルおよび高周波数エンハンスメントチャネルを生成する方法１３００を示す図である。方法１３００は、方法９００の９３０および９３５で実行されてよい。ＬＦエンハンスメントチャネルは、空間的にエンハンスされていない入力チャネルＸの低周波数成分の出力チャネルＯに対する寄与を制御する。ＨＦエンハンスメントチャネルは、空間的にエンハンスされていない入力チャネルＸの高周波数成分の出力チャネルＯに対する寄与を制御する。

オーディオ処理システム２００の高／低周波数ブースタ２２５は、第１のバンドパスフィルタをサブバンド混合左チャネルＥ_Lおよびサブバンド混合右チャネルＥ_Rに、第２のバンドパスフィルタを第１のバンドパスフィルタの出力に適用する１３１０。たとえば、ＬＦエンハンスバンドパスフィルタ７０２およびＬＦエンハンスバンドパスフィルタ７０４は、低周波数エンハンスメントのためのカスケード共振器を提供する。第１のバンドパスフィルタおよび第２のバンドパスフィルタの特徴は、バンドパスフィルタの予め定義されたＱファクタおよび／または中心周波数を有する異なる設定などのように、調整可能であってよい。いくつかの実施形態において、中心周波数は、予め定義されたレベル（たとえば、５８．１７５Ｈｚ）に設定され、Ｑファクタは、調整可能である。いくつかの実施形態において、ユーザは、バンドパスフィルタに関する設定の予め定義されたセットから選択をすることができる。カスケード・バンドパスフィルタシステムは、典型的にはインフィールドラウドスピーカシステムにおいては別個のサブウーファを介して処理されるが、ヘッドマウントスピーカ（すなわちヘッドホン）上でレンダリングされるときには十分に表現されないことが多い信号におけるエネルギーを、選択的にエンハンスする。４次フィルタ設計（すなわち、２つのカスケード２次バンドパスフィルタ）は、励起されたときに明瞭な時間応答を示し、バスドラムおよびベースギターのアタックなどの混合における主要低周波要素に「パンチ」を加えると共に、２次バンドパスフィルタ、ローシェルフ、またはピーキングフィルタを使用して、低周波数スペクトルにおけるより広いバンド上で低周波エネルギーを単に増大させる場合に発生することがある全体的な「濁り」を回避する。

高／低周波数ブースタ２２５は、ゲインを第２のバンドパスフィルタの出力に適用して１３２０、低周波数チャネルＬＦ_LおよびＬＦ_Rを生成する。たとえば、ＬＦフィルタゲイン７０６は、ゲインをＬＦエンハンスバンドパスフィルタ７０４の出力に適用して、左ＬＦチャネルＬＦ_Lおよび右ＬＦチャネルＬＦ_Rを生成する。ＬＦフィルタゲイン７０６は、オーディオ出力チャネルＯ_LおよびＯ_Rに対する低周波数チャネルＬＦ_LおよびＬＦ_Rの寄与を制御する。

高／低周波数ブースタ２２５は、ハイパスフィルタをサブバンド混合左チャネルＥ_Lおよびサブバンド混合右チャネルＥ_Rに適用する１３３０。たとえば、ＨＦエンハンスハイパスフィルタ７０８は、ＨＦエンハンスハイパスフィルタ７０８のカットオフ周波数よりも低い周波数を有する信号成分を減衰する変調を適用する。上述されたように、ＨＦエンハンスハイパスフィルタ７０８は、４５７３Ｈｚのカットオフ周波数を有する２次バターワースフィルタであってよい。いくつかの実施形態において、ハイパスフィルタの特徴は調整可能であってよく、たとえば、カットオフ周波数およびゲインの異なる設定がハイパスフィルタの出力に適用される。このハイパスフィルタの追加によって達成される全体的な高周波増幅は、典型的な音楽信号（たとえば、シンバルなどの高周波打楽器、音響室応答の高周波要素など）内の顕著な音色、スペクトル、および時間情報を強調する働きをする。さらに、このエンハンスメントは、低周波数および中間周波数の非空間的信号要素（一般的に、ボーカル及びベースギター）における過度の着色を回避しながら、空間信号エンハンスメントの知覚される有効性を増大させる働きをする。

高／低周波数ブースタ２２５は、ゲインをハイパスフィルタの出力に適用して１３４０、高周波数チャネルＨＦ_LおよびＨＦ_Rを生成する。ゲインのレベルは、オーディオ出力チャネルＯ_LおよびＯ_Rに対する高周波数チャネルＨＦ_LおよびＨＦ_Rの寄与を制御するように調整されることができる。いくつかの実施形態において、ＨＦフィルタゲイン７１０は、０ｄＢゲインをＨＦエンハンスハイパスフィルタ７０８の出力に適用する。

様々な実施形態において、方法１３００におけるステップは異なる順序で実行されてよい。たとえば、ステップ１３１０および１３３０がステップ１３３０および１３４０と並列に実行されて、低周波数および高周波数チャネルを並列に生成するようにしてよい。

図１４は、一実施形態に従うオーディオチャネルの周波数プロット１４００を示す。プロット１４００において、オーディオ処理システム２００はデフォルト設定において動作し、この設定では、高／低周波数ブースタ２２５のカスケード共振器（たとえば、ＬＦエンハンスバンドパスフィルタ７０２およびＬＦエンハンスバンドパスフィルタ７０４）が、５８．１７５Ｈｚの中心周波数、および２．５のＱファクタを有する。ライン１４１０は、左入力チャネルＸ_Lにおけるホワイトノイズのオーディオ入力信号Ｘの周波数応答である。ライン１４２０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、空間的にエンハンスされたチャネルＹを生成するサブバンド空間エンハンサ２１０の周波数応答である。ライン１４３０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、クロストークチャネルＣを生成するクロストークシミュレータ２１５の周波数応答である。ライン１４４０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、低周波数および高周波数チャネルＬＦおよびＨＦを生成する高／低周波数ブースタ２２５の周波数応答である。Ｌ／Ｒパススルーゲイン６０６は、デフォルト設定において−無限大ｄｂに設定され、出力信号Ｏに対するパススルーチャネルＰの寄与を除去する。

図１５は、一実施形態に従うオーディオチャネルの周波数プロット１５００を示す。ライン１５１０は、左入力チャネルＸ_Lにおけるホワイトノイズのオーディオ入力信号Ｘの周波数応答である。プロット１４００においてと同様に、高／低周波数ブースタ２２５のカスケード（ｃａｓｃａｄｅｄ）共振器（たとえば、ＬＦエンハンスバンドパスフィルタ７０２、およびＬＦエンハンスバンドパスフィルタ７０４）は、デフォルト設定において動作し、この設定では、バンドパスフィルタは、５８．１７５Ｈｚの中心周波数、および２．５のＱファクタを有する。ライン１５２０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、左出力チャネルＯ_Lを生成するミキサ２３０の周波数応答である。ライン１５２０は、相関されたステレオホワイトノイズ入力信号が与えられた（すなわち、左信号と右信号が同一である）として、左出力チャネルＯ_Lを生成するミキサ２３０の周波数応答である。ライン１５４０は、相関されていないホワイトノイズ入力信号が与えられた（すなわち、右チャネルが左チャネルの逆バージョンである）として、左出力チャネルＯ_Lを生成するミキサ２３０の周波数応答である。

図１６は、一実施形態に従うチャネル信号の周波数プロット１６００を示す。オーディオ処理システム２００は、ブーストされた設定において動作し、この設定では、高／低周波数ブースタ２２５のカスケード共振器（たとえば、ＬＦエンハンスバンドパスフィルタ７０２およびＬＦエンハンスバンドパスフィルタ７０４）が、５８．１７５Ｈｚの中心周波数、および１．３のＱファクタを有する。ライン１６１０は、左入力チャネルＸ_Lにおけるホワイトノイズのオーディオ入力信号Ｘの周波数応答である。ライン１６２０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、空間的にエンハンスされたチャネルＹを生成するサブバンド空間エンハンサ２１０の周波数応答である。ライン１６３０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、クロストークチャネルＣを生成するクロストークシミュレータ２１５の周波数応答である。ライン１６４０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、ブーストされた設定における高／低周波数ブースタ２２５およびパススルー２３０の組み合わされた周波数応答である。

図１７は、上記のライン１６４０の個々の成分を示す。ライン１７１０は、上記の低周波数エンハンスメントの周波数応答である。ライン１７２０は、上記の高周波数フィルタエンハンスメントの周波数応答である。ライン１７３０は、上記のパススルー２２０の周波数応答である。ライン１７１０、１７２０、および１７３０は、ブーストされた設定において動作しているオーディオ処理システム２００に関する図１６に示されたライン１６４０の組み合わされたフィルタ応答の成分を表す。

図１８は、一実施形態に従うオーディオチャネルの周波数プロット１８００を示す。オーディオ処理システム２００はブーストされた設定において動作する。ライン１８１０は、左入力チャネルＸ_Lにおけるホワイトノイズのオーディオ入力信号Ｘの周波数応答である。ライン１８２０は、同じＸ_Lホワイトノイズ入力信号が与えられたとして、左出力チャネルＯ_Lを生成するミキサ２３０の周波数応答である。ライン１８３０は、相関されたステレオホワイトノイズ入力信号が与えられた（すなわち、左信号と右信号が同一である）として、左出力チャネルＯ_Lを生成するミキサ２３０の周波数応答である。ライン１８４０は、相関されていないホワイトノイズ入力信号が与えられた（すなわち、右チャネルが左チャネルの逆バージョンである）として、左出力チャネルＯ_Lを生成するミキサ２３０の周波数応答である。

本開示を読むと、当業者であれば、本明細書に開示された原理を通じてさらに追加の代替的実施形態を理解するであろう。したがって、特定の実施形態および用途が図示および説明されているが、開示された実施形態は、本明細書に開示された厳密な構成および構成要素に限定されないことを理解されたい。本明細書で開示された方法および装置の配置、動作および詳細について、本明細書に説明された範囲から逸脱することなく、当業者には明らかである様々な修正、変更および変形が行われてよい。

本明細書に説明された任意のステップ、動作、またはプロセスが、単独でまたは他のデバイスと組み合わせて、１つまたは複数のハードウェアまたはソフトウェアモジュールを用いて実行または実装されてよい。一実施形態において、ソフトウェアモジュールは、コンピュータプログラムコードを含むコンピュータ可読媒体（たとえば非一時的コンピュータ可読媒体）を含むコンピュータプログラム製品で実装され、コンピュータプログラムコードは、上述されたステップ、動作、またはプロセスのいずれかまたは全部を実施するためにコンピュータプロセッサによって実行されることができる。

Claims

左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信するステップと、
前記左入力チャネルおよび前記右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するステップと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成するステップと、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成するステップと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成するステップと、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成するステップと、
第１のバンドパスフィルタを前記左入力チャネルおよび前記右入力チャネルに適用することと、
第２のバンドパスフィルタを前記第１のバンドパスフィルタの出力に適用することと、
ゲインを前記第２のバンドパスフィルタの出力に適用することと
によって、左低周波数チャネルおよび右低周波数チャネルを生成するステップと
を含み、
前記左出力チャネルを生成するステップは、前記空間的にエンハンスされた左チャネル、前記右クロストークチャネル、および前記左低周波数チャネルを混合するステップを含み、
前記右出力チャネルを生成するステップは、前記空間的にエンハンスされた右チャネル、前記左クロストークチャネル、および前記右低周波数チャネルを混合するステップを含むことを特徴とする方法。
前記第１のバンドパスフィルタおよび前記第２のバンドパスフィルタは各々が、中心周波数および調整可能な品質（Ｑ）ファクタを有することを特徴とする請求項１に記載の方法。
左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信するステップと、
前記左入力チャネルおよび前記右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するステップと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成するステップと、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成するステップと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成するステップと、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成するステップと、
ハイパスフィルタを前記左入力チャネルおよび前記右入力チャネルに適用することと、
ゲインを前記ハイパスフィルタの出力に適用することと
によって、左高周波数チャネルおよび右高周波数チャネルを生成するステップと
を含み、
前記左出力チャネルを生成するステップは、前記空間的にエンハンスされた左チャネル、前記右クロストークチャネル、および前記左高周波数チャネルを混合するステップを含み、
前記右出力チャネルを生成するステップは、前記空間的にエンハンスされた右チャネル、前記左クロストークチャネル、および前記右高周波数チャネルを混合するステップを含むことを特徴とする方法。
前記ハイパスフィルタは、２次バターワースハイパスフィルタであることを特徴とする請求項３に記載の方法。
左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信するステップと、
前記左入力チャネルおよび前記右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するステップと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成するステップと、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成するステップと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成するステップと、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成するステップと
を含み、
前記左入力チャネルおよび前記右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって前記空間的にエンハンスされた左チャネルおよび前記空間的にエンハンスされた右チャネルを生成するステップは、
前記左入力チャネルを左サブバンド成分へと分離するステップであって、前記左サブバンド成分の各々は、周波数バンドのグループからの１つの周波数バンドに対応する、該ステップと、
右入力チャネルを右サブバンド成分へと分離するステップであって、前記右サブバンド成分の各々は、周波数バンドの前記グループからの１つの周波数バンドに対応する、該ステップと、
前記左サブバンド成分および前記右サブバンド成分から前記中間サブバンド成分および前記サイドサブバンド成分を生成するステップと、
前記中間サブバンド成分に対する前記サイドサブバンド成分のゲインを調整するステップと、
前記ゲイン調整された中間サブバンド成分およびサイドサブバンド成分を再結合して、前記空間的にエンハンスされた左チャネルおよび前記空間的にエンハンスされた右チャネルを生成するステップと
を含むことを特徴とする方法。
左入力チャネルおよび右入力チャネルを含む入力オーディオ信号を受信するステップと、
前記左入力チャネルおよび前記右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するステップと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成するステップと、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成するステップと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成するステップと、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成するステップと
を含み、
前記空間的にエンハンスされた左チャネルおよび前記空間的にエンハンスされた右チャネルを生成するステップは、前記左入力チャネルおよび前記右入力チャネルの前記サイドサブバンド成分および前記中間サブバンド成分に第１のゲインを適用するステップを含み、
前記左クロストークチャネルを生成するステップは、前記フィルタリングされ時間遅延された左入力チャネルに第２のゲインを適用するステップを含み、
前記右クロストークチャネルを生成するステップは、前記フィルタリングされ時間遅延された右入力チャネルに前記第２のゲインを適用するステップを含み、
前記方法は、
第１のバンドパスフィルタを前記左入力チャネルおよび前記右入力チャネルに適用すること、
第２のバンドパスフィルタを前記第１のバンドパスフィルタの出力に適用すること、および
第３のゲインを前記第２のバンドパスフィルタの出力に適用すること
によって、左低周波数チャネルおよび右低周波数チャネルを生成するステップと、
ハイパスフィルタを前記左入力チャネルおよび前記右入力チャネルに適用すること、および
第４のゲインを前記ハイパスフィルタの出力に適用すること
によって、左高周波数チャネルおよび右高周波数チャネルを生成するステップと、
第５のゲインを前記左入力チャネルおよび前記右入力チャネルに適用することによって、左パススルーチャネルおよび右パススルーチャネルを生成するステップと、
前記左入力チャネルおよび前記右入力チャネルを加えること、および
第６のゲインを前記加えられた左入力チャネルおよび右入力チャネルに適用することによって、中間チャネルを生成するステップと
をさらに含み、
前記左出力チャネルを生成するステップは、前記空間的にエンハンスされた左チャネル、前記右クロストークチャネル、前記左低周波数チャネル、前記左高周波数チャネル、前記左パススルーチャネル、および前記中間チャネルを混合するステップを含み、
前記右出力チャネルを生成するステップは、前記空間的にエンハンスされた右チャネル、前記左クロストークチャネル、前記右低周波数チャネル、前記右高周波数チャネル、前記右パススルーチャネル、および前記中間チャネルを混合するステップを含むことを特徴とする方法。
前記第１のゲインは、−１２ないし６ｄＢゲインであり、
前記第２のゲインは、−無限大ないし０ｄＢゲインであり、
前記第３のゲインは、０ないし２０ｄＢゲインであり、
前記第４のゲインは、０ないし２０ｄＢゲインであり、
前記第５のゲインは、−無限大ないし０ｄＢゲインであり、
前記第６のゲインは、−無限大ないし０ｄＢゲインであることを特徴とする請求項６に記載の方法。
オーディオ処理システムであって、
左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するように構成されたサブバンド空間エンハンサと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成し、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成する
ように構成されたクロストークシミュレータと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成し、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成する
ように構成されたミキサと、
左低周波数チャネルおよび右低周波数チャネルを生成するように構成された周波数ブースタと
を備え、前記周波数ブースタは、
前記左入力チャネルおよび前記右入力チャネルをフィルタリングするように構成された第１のバンドパスフィルタと、
前記第１のバンドパスフィルタの出力をフィルタリングするように構成された第２のバンドパスフィルタと、
ゲインを前記第２のバンドパスフィルタの出力に適用するための低周波数フィルタゲインと
を含み、
前記左出力チャネルを生成するように構成された前記ミキサは、前記空間的にエンハンスされた左チャネル、前記右クロストークチャネル、および前記左低周波数チャネルを混合するように構成された前記ミキサを含み、
前記右出力チャネルを生成するように構成された前記ミキサは、前記空間的にエンハンスされた右チャネル、前記左クロストークチャネル、および前記右低周波数チャネルを混合するように構成された前記ミキサを含むことを特徴とするシステム。
前記第１のバンドパスフィルタおよび前記第２のバンドパスフィルタは各々は、中心周波数および調整可能な品質（Ｑ）ファクタを有することを特徴とする請求項８に記載のシステム。
オーディオ処理システムであって、
左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するように構成されたサブバンド空間エンハンサと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成し、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成する
ように構成されたクロストークシミュレータと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成し、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成する
ように構成されたミキサと、
左高周波数チャネルおよび右高周波数チャネルを生成するように構成された周波数ブースタと
を備え、前記周波数ブースタは、
前記左入力チャネルおよび前記右入力チャネルをフィルタリングするように構成されたハイパスフィルタと、
ゲインを前記ハイパスフィルタの出力に適用するための高周波数フィルタゲインと
を含み、
前記左出力チャネルを生成するように構成された前記ミキサは、前記空間的にエンハンスされた左チャネル、前記右クロストークチャネル、および前記左高周波数チャネルを混合するように構成された前記ミキサを含み、
前記右出力チャネルを生成するように構成された前記ミキサは、前記空間的にエンハンスされた右チャネル、前記左クロストークチャネル、および前記右高周波数チャネルを混合するように構成された前記ミキサを含むことを特徴とするシステム。
前記ハイパスフィルタは、２次バターワースハイパスフィルタであることを特徴とする請求項１０に記載のシステム。
オーディオ処理システムであって、
左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するように構成されたサブバンド空間エンハンサと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成し、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成する
ように構成されたクロストークシミュレータと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成し、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成する
ように構成されたミキサと
を備え、
前記左入力チャネルおよび前記右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、前記空間的にエンハンスされた左チャネルおよび前記空間的にエンハンスされた右チャネルを生成するように構成された前記サブバンド空間エンハンサは、
前記左入力チャネルを左サブバンド成分へと分離することであって、前記左サブバンド成分の各々は、周波数バンドのグループからの１つの周波数バンドに対応する、該分離することと、
前記右入力チャネルを右サブバンド成分へと分離することであって、前記右サブバンド成分の各々は、周波数バンドの前記グループからの１つの周波数バンドに対応する、該分離することと、
前記左サブバンド成分および前記右サブバンド成分から前記中間サブバンド成分および前記サイドサブバンド成分を生成することと、
前記中間サブバンド成分に対する前記サイドサブバンド成分のゲインを調整することと、
前記ゲイン調整された中間サブバンド成分およびサイドサブバンド成分を再結合して、前記空間的にエンハンスされた左チャネルおよび前記空間的にエンハンスされた右チャネルを生成することと
を行うように構成された前記サブバンド空間エンハンサを含むことを特徴とするシステム。
オーディオ処理システムであって、
左入力チャネルおよび右入力チャネルのサイドサブバンド成分および中間サブバンド成分をゲイン調整することによって、空間的にエンハンスされた左チャネルおよび空間的にエンハンスされた右チャネルを生成するように構成されたサブバンド空間エンハンサと、
前記左入力チャネルをフィルタリングし時間遅延させることによって、左クロストークチャネルを生成し、
前記右入力チャネルをフィルタリングし時間遅延させることによって、右クロストークチャネルを生成する
ように構成されたクロストークシミュレータと、
前記空間的にエンハンスされた左チャネルおよび前記右クロストークチャネルを混合することによって、左出力チャネルを生成し、
前記空間的にエンハンスされた右チャネルおよび前記左クロストークチャネルを混合することによって、右出力チャネルを生成する
ように構成されたミキサと
を備え、
前記空間的にエンハンスされた左チャネルおよび前記空間的にエンハンスされた右チャネルを生成するように構成された前記サブバンド空間エンハンサは、前記左入力チャネルおよび前記右入力チャネルの前記サイドサブバンド成分および前記中間サブバンド成分に第１のゲインを適用するように構成された前記サブバンド空間エンハンサを含み、
前記左クロストークチャネルを生成するように構成された前記クロストークシミュレータは、前記フィルタリングされ時間遅延された左入力チャネルに第２のゲインを適用するように構成された前記クロストークシミュレータを含み、
前記右クロストークチャネルを生成するように構成された前記クロストークシミュレータは、前記フィルタリングされ時間遅延された右入力チャネルに前記第２のゲインを適用するように構成された前記クロストークシミュレータを含み、
当該システムは、
左低周波数チャネル、右低周波数チャネル、左高周波数チャネル、および右高周波数チャネルを生成するように構成された周波数ブースタであって、
前記左入力チャネルおよび前記右入力チャネルをフィルタリングするように構成された第１のバンドパスフィルタと、
前記第１のバンドパスフィルタの出力をフィルタリングするように構成された第２のバンドパスフィルタと、
第３のゲインを前記第２のバンドパスフィルタの出力に適用して、前記左低周波数チャネルおよび前記右低周波数チャネルを生成するように構成された低周波数フィルタゲインと、
前記左入力チャネルおよび前記右入力チャネルをフィルタリングするように構成されたハイパスフィルタと、
第４のゲインを前記ハイパスフィルタの出力に適用して、前記左高周波数チャネルおよび前記右高周波数チャネルを生成するように構成された高周波数フィルタゲインとを含む、該周波数ブースタと、
左パススルーチャネル、右パススルーチャネル、および中間チャネルを生成するように構成されたパススルーと
をさらに含み、前記パススルーは、
第５のゲインを前記左入力信号および前記右入力信号に適用して、前記左パススルーチャネルおよび前記右パススルーチャネルを生成するように構成されたパススルーゲインと、
前記左入力チャネルおよび前記右入力チャネルを加えるように構成されたコンバイナと、
第６のゲインを前記加えられた左入力チャネルおよび右入力チャネルに適用して、前記左中間チャネルおよび前記右中間チャネルを生成するように構成された中間ゲインと
を含み、
前記左出力チャネルを生成するように構成された前記ミキサは、前記空間的にエンハンスされた左チャネル、前記右クロストークチャネル、前記左低周波数チャネル、前記左高周波数チャネル、前記左パススルーチャネル、および前記中間チャネルを混合するように構成された前記ミキサを含み、
前記右出力チャネルを生成するように構成された前記ミキサは、前記空間的にエンハンスされた右チャネル、前記左クロストークチャネル、前記右低周波数チャネル、前記右高周波数チャネル、前記右パススルーチャネル、および前記中間チャネルを混合するように構成された前記ミキサを含むことを特徴とするシステム。