JP2019530312A

JP2019530312A - ステレオ展開技術

Info

Publication number: JP2019530312A
Application number: JP2019512262A
Authority: JP
Inventors: ベルント、ベーマー
Original assignee: Omnio Sound Ltd
Current assignee: Omnio Sound Ltd
Priority date: 2016-10-04
Filing date: 2017-10-04
Publication date: 2019-10-17
Also published as: US20200045419A1; CN109691138A; BR112019006085A2; EP3523988A4; WO2018067060A1; EP3523988A1; KR20190055116A

Abstract

ステレオ展開技術は、最新のＤＳＰ技術を利用して左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから情報を抽出することにより処理アルゴリズムに取り入れる多数の新たなチャンネルを形成することによってステレオ再生の固有の問題を解決する。ステレオ展開技術は、通常のステレオ情報を聴取者に向けて通常の方法で送信して音場内のパフォーマーの知覚位置を高い精度で確立することによって動作した後、遅延されて周波数整形された抽出信号を前方及びその他の方向に投影して、付加的な心理音響学に基づく手掛かりを耳及び脳へ与える。付加的な手掛かりは、細部及び透明性が向上した感覚を生み出すとともに、音源の立体的な特性とそれらが演奏している音響環境とを確立する。更に、前述した高度なグループ化も本発明にしたがって実施することが可能な一態様である。

Description

我々が音声の録音及び再生のための現代のステレオ技術として一般的に見なすものは、実際には、アランブルームレインによって１９３１年に既に発明され、また、ステレオの背後にあるよく知られた原理は、ほぼ百年にわたって変化してこなかった。録音側では、マイクロホンの配置やマイクロホンと異なるピックアップパターンとの組み合わせにおける様々なバリエーションが試みられてきた。多かれ少なかれ、想像できる変形の全てが試され、幾つかの特に成功した形態が異常に良好な結果に起因して人気を得てきた。８の字マイクロホンの当初のブルームレインの曲がった対は、これらの優れた形態のうちの１つであり、今日でも依然として頻繁に使用される。同様に、ステレオ再生のために多くの異なるタイプのラウドスピーカ形態が試されてきたが、この場合も、当初のブルームレインの着想は依然として大きな変更を伴わずに使用されている。

その原理に目立った変化を何ら伴うことなく停滞したままであった他のいかなる科学分野も想像するのは難しい。現代の多くの製品や慣例において、小型コンピュータの利用可能性は、製品が動作する方法を完全に変え、製品の性能エンベロップを大幅に拡張してきた。それでも、ステレオは変更を伴うことなく同じままである。

ステレオ技術の中には、改善が適用され得る２つの別個のターゲットセグメント、すなわち、録音及び／又は再生がある。我々は、既に半世紀を超えて高品質のステレオ録音を受け継いできており、業界全体が音楽の録音、保存、及び、配信の特定の方法に縛られてきた。明らかに、録音側の任意の変更は、それが使用されて音楽聴取者に幅広く配信されるようになり得る前に多大な障害に直面する。一方、再生の改善は、それが通常録音された音楽を使用する場合にはそのような障害に直面せず、改善を望む誰によっても使用され得る。

ステレオ展開技術は、ステレオ再生をターゲットにしており、聴取体験を大幅に向上させ、それにより、聴取体験をより真に迫った信頼できるものにする。我々のステレオ録音は、幾らかの左から右への位置特定の手掛かりは別として、全ての空間情報を見逃している。ステレオスピーカ及び聴取ルームは、協働して、我々の目の前に立体的なサウンドステージの感覚をもたらすが、これは、スピーカと聴取ルームとが一緒に生み出した単なる錯覚にすぎず、ステレオ録音においてエンコードされるものではない。従来のラウドスピーカは、サウンドステージと該ステージ内の楽器のサイズをそれら自体のサイズにスケーリングする。

最高品質の動作のためには、依然として２つのスピーカだけを要し、マルチチャンネルオーディオにおけるように複数のスピーカが部屋の周囲にわたって広がらない。また、小さいスピーカが大きいスピーカのように聞こえ、サウンドステージのサイズはもはやスピーカのサイズに縛られない。以前は、小さいスピーカが常に小さいスピーカのように聞こえ、そのため、大きいスピーカよりも小さいサウンドステージのイメージが与えられる。

ステレオ展開技術は、人間の脳により解釈可能な連続的な実際の聞こえる音響環境で音を生成する立体音源で占められる立体サウンドステージをもたらす。その実装のうちの１つにおいて、ステレオ展開技術は、再生装置としてヘッドホンを使用しても機能する。

ステレオ展開及び先行技術
予期されるように、オーディオＤＳＰ分野には、サウンド再生において存在する様々な問題を解決しようと試みる多数の従来技術がある。それらの全ては、ＭＲフィルタ、ＦＩＲフィルタ、遅延、左−右抽出アルゴリズムなどのような同じ基本的なＤＳＰビルディングブロックを使用するが、最終結果が異なる。従来技術を見ると、ステレオ展開技術に幾らか関連していると考えられ得る３つの主要なグループがこの分野にはあることが明らかになる。

第１に、より幅広いステレオイメージを得るための方法を概説する従来技術がある。これらは、主に、左右のスピーカが場合により単一の筐体内でさえ物理的に互いに近接して位置されるステレオスピーカに焦点が当てられる。これらは全て、ステレオイメージを広げて、間隔が狭いステレオスピーカに伴って生じる問題を軽減することを目的とする。

第２に、サウンドバーと呼ばれるもの、すなわち、サラウンドサウンドシステム内の聴取ルーム内に広がる複数のサラウンドスピーカに取って代わるフロントセンターに位置されるワンボックススピーカの周囲には、特許文献の他のグループが存在する。このグループの中での目的は、部屋の前後に幾つかのスピーカを使用して通常作り出されるサラウンドサウンドフィールド内にいるという感覚を聴取者に与えることである。サウンドバーは、サラウンドサウンド体験をもたらすようにＤＳＰアルゴリズムと共に異なる方向に向けられるドライバとの様々な技術を利用する。

前述の説明に関連して、例えば、米国特許出願第２０１５／０１８９４３９号明細書及び米国特許出願第２０１５／００７１４５１号明細書の両方の文献がこの第１及び第２のグループを指すことが言及され得る。

第３に、基本的に左−右に派生したコンテンツを前方以外の方向に向けることによってステレオ体験を改善することを目的とした一般的にやや古いグループの従来技術がある。ＤＳＰ技術が容易に利用可能になり且つ費用効果的になる前に行われて以来、使用される処理は、非常に基本的であり、その時点で可能であったものに限られる。利用可能な技術は実現可能な音質をひどく低下させ、また、結果は殆ど期待外れであったため、このグループ内の仕事が終わりに来たように思われる。

第１のグループは、２つのスピーカの間隔を狭くするという技術的問題を扱い、幅広い間隔のステレオスピーカを持つのと同じような結果を得ようとする。第２のグループは、幾つかのスピーカではなく１つのスピーカだけを使用して聴取ルーム内でサラウンドサウンドフィールドを再現しようとする。第３のグループは、ステレオを聴くときに知覚される雰囲気を改善しようと試みるが、不適切な処理のためにうまくいかず、ステレオに固有の心理音響学的問題に対処しない。前述の従来技術のグループはいずれも、ステレオの一般的な欠点、すなわち、方法としてのステレオに欠陥がある理由、及び、ステレオ技術を改良できる方法を扱っていない。ステレオ展開技術は、ステレオ技術に内在するこれらの固有の問題を解決することを目的としている。

ステレオ展開技術は、実際の音響事象に類似する連続的な空間３Ｄ音場を再現する。通常のステレオ再生はせいぜいサウンドステージを投影できるにすぎないが、そのサウンドステージ内の音源はそれらが奥行きの個々の延在を何ら伴わない演奏者の紙の切り抜きのようであり、紙の切り抜きは、黒い部屋で吊り下げられる懐中電灯に酷似するように音響空間におらず孤独に演奏する。ステレオ展開技術は、空間３Ｄ音場を形成するが、サラウンドサウンドシステムを聴くのと全く同じ体験ではない。サラウンドサウンドシステムは、根本的には、ステレオと同じ制限を伴うステレオの拡張である。部屋の周りに位置される付加的なスピーカを使用すると、システムは、左右のスピーカ間の正面からだけでなく部屋の周りの他の場所からも位置情報をもたらすことができる。ステレオ展開は、具体的には、人間の脳における心理音響グループ化現象及び空間音響処理の理解を通して達成されてきたが、それは全く異なる方法であり、その結果は生の音響事象のように聞こえるような空間３Ｄ音場である。

モノ及びステレオ
当初は、音声が録音されてモノラルで再生された。モノラルプロセスは、せいぜい聴取者の正面に投影されるサウンドステージの何らかの知覚される奥行き及び高さを与えることしかできず、基本的に録音内の個々の音源に関する任意の定位的手掛かりを伝えることができない。利用可能な限られたサウンドステージは、聴取ルームの表面からの反射によって形成される。反射は、単一のラウドスピーカ源の周囲に音のクラウドの錯覚をもたらす。これは、クラウドが消える無響環境でモノラルを聴くことによって容易に検証され得る。

１９３１年にＡｌａｎＢｌｕｍｌｅｉｎがステレオプロセスを発明した。ステレオは、モノラルの展開バージョンであり、２つのラウドスピーカを使って物理的な水平面内で展開された。ステレオは、ラウドスピーカ間のどこでも水平に音源の定位を可能にした。ステレオが適切に録音されてラウドスピーカで再生されると、ステレオは、何らかの高さ及び奥行きの存在を伴って聴取者の前に比較的連続した水平な音平面を生み出すように管理する。聴取者の脳は、全ての音声が２つのスピーカからのみ発するという事実にもかかわらず、聴取者の前に複数の音源があると信じることへのプロセスによって欺かれる。ラウドスピーカを通して再生されるステレオは、心理音響学を使用して、聴取者の前の異なる水平位置で複数の音源によって占められるサウンドステージの錯覚をもたらす。モノラルの場合と同様に、聴取ルーム内の表面によって反射されるラウドスピーカからの反射音は、聴取者の前にサウンドステージの錯覚をもたらし、すなわち、付加的な空間情報を伴う音場が形成される。これらの反射がなければ、音声は聴取者の頭の内側から発しているように知覚される。

ステレオ再生及びその限界
我々は、ステレオ再生にはかなり慣れており、その限界については、我々がそれらに関してそれ以上もはや考えないポイントまでよく知っている。このことは、我々がステレオ再生と生の音声との間の違いを聞かずに生の音声とステレオ再生音との間を区別するのが容易であることに何よりも同意し、ステレオが生の音声のように聞こえることを我々が予期しないことを意味するのではなく、それについて考えることなく自動的にそのプロセスを除去して我々の期待を変える。せいぜい、通常の適切に設定されたラウドスピーカを使用しても、ステレオ再生は、奥行き、幅、及び、高さを伴うサウンドステージを投影できるにすぎない。そのサウンドステージ内の音源は、残念ながら、それらが奥行きの個々の延在を何ら伴わない演奏者の紙の切り抜きであったように聞こえる。更に、紙の切り抜きは、聴取者へ向けて真っ直ぐに前方にのみそれらの音声を投影する殆ど黒い部屋に吊り下げられた懐中電灯のように、音響空間内にいることなく孤独に演奏する。ステレオ再生には、録音が行われた音響環境を我々が聞くことができるようにする何らかの環境情報が存在するが、それは現実の空間の音響に全く似たものではない。

図１は、２つの部屋の２つの断面を示す。広い方の部屋は、左側にステージ部を伴うとともに右側に観客席がある典型的なコンサートホールである。ステージ上には演奏者が１人、観客には聴取者が１人いる。音声は、図示の幾つかの想像上の経路に沿って移動するステージ上の演奏者から発する。直接音は、ホール内の任意の表面で反射することなく演奏者から聴取者へ直接伝わる。図示のように、直接音の経路は、かなりの到着時間差をもたらす聴取者に到達する最初の反射経路よりもはるかに短い。

図１の一番下の狭い方の部屋は、左側にラウドスピーカがあり右側に聴取者がいる典型的な聴取ルームである。この場合も先と同様に、音波経路は、直接経路と反射経路とにより図に示される。狭い方の部屋において、直接音と最初の反射との間の経路長差は、大きい方のホールにおけるよりも小さく、そのため、より小さい到着時間差をもたらすことになる。

ホールと部屋との間の根本的な違いのうちの１つは残響時間である。大きい方のホールは、小さい部屋よりもかなり長い残響時間を有する。より広いスペースでは、同時に、音波反射が少なくなる。広い空間において、音声は、音場からのエネルギーを吸収する次の反射面に到達する前により長い距離を移動しなければならず、したがって、音声は、より広い空間内でより長い時間にわたって残存する。

図２は、聴取者の耳での音の到達を５つの異なる図で示す。Ｘ軸に沿って時間があり、Ｙ軸はレベルである。５つの図は、インパルス音からの残響減衰スペクトルを示す。線図１は図１のコンサートホールからのものであり、線図２は図１の聴取ルームからのものであり、線図３は、図１に示されるコンサートホールで行われるステレオ録音であり、線図４は聴取ルームで再生されるステレオ録音であり、最後に、線図５は、ステレオ展開処理された後の聴取ルームで再生されたステレオ録音を示す。

図１のコンサートホールからの図２における最初の線図において、左側の最初のピークは、演奏者から聴取者に届く直接音である。次のピークは、特定の時間遅延の後に到達する最初の反射である。最初の反射の後にその後の反射が続き、疎な間隔の１つの表面だけで跳ね返った最初の反射の後、複数の跳ね返りからの反射の益々密な配列が続く。これは、多くのホールで見られる典型的なインパルス応答減衰である。

図２の２番目の線図は、１番目の線図と同じ種類の音到達を示すが、ここでは図１の典型的な聴取ルームから示される。この場合も先と同様に、直接音、最初のピーク、それに続く初期の幾分疎な間隔の反射、及び、その後の密な複数の反射経路がある。小さい部屋内の音声はホールよりも急速に吸収され、これは、図２の線図１及び線図２における音声減衰を比較することによって明確に示される。

ホールと部屋との間の最も重要な違いは、直接音に対する最初の反射のタイミングである。コンサートホール音響からよく知られるように、ホール内の音声の明確さ及び明瞭度を維持するためには、直接音到達と最初の反射との間が約２５ｍｓ〜３５ｍｓでなければならない。この時間が短縮されれば、音声が殆ど明確でなくなり、疲れるようになるポイントでさえも不正確になる。小さい部屋はこの程度の遅れを我々に与えるのに十分なほど物理的に大きくないため、部屋内の付加的な周囲エネルギーにより、常に、音声が殆ど明確でなくなる。

現在のステレオ再生には、その結果として生じる性能欠点に対処するために理解する必要があるという１つの基本的な固有の制限がある。

我々のステレオ録音は、幾つかの左−右の定位的な手掛かりを除いて全ての空間情報を見逃している［５］。これはヘッドホンを使用してステレオ録音を聴くことによって試すのに十分容易であり、音声は常に耳間の聴取者の頭の中に位置付けられる。この例では、再生が個別の頭部関連の伝達関数（ＨＴＲＦ）補正を得ていないためであると主張する者もいる。したがって、指向性の高い一対のスピーカ、パラボリックスピーカ、又は、無響チャンバ内のスピーカを使用してテストをやり直すようにする。サウンドステージは依然として聴取者の頭の中に位置される。どのようにして、我々が完璧な個別のＨＲＴＦを再生に付加し得たか？
問題は、再生にではなく、むしろ録音にある。個別のＨＴＲＦを用いて、すなわち、録音を聴こうとしているそれぞれの人ごとに１つのカスタムダミーヘッドを用いて録音を行った場合、我々は全てがヘッドホンを聴いて空間情報を正しく解読することができた。残念ながら、これは明白な理由で行うことができないため、任意の意味のある空間情報を欠いている録音が残される。

適切にセットアップされたステレオシステムのスイートスポットで聴くときに、どのようにして我々が自分の目の前のサウンドステージを奥行き、幅、及び、高さで知覚できるか？ステレオスピーカ及び聴取ルームは、協働して、我々の目の前に立体的なサウンドステージの感覚をもたらすが、これは、スピーカと聴取ルームとが一緒に生み出した単なる錯覚にすぎず、ステレオ録音においてエンコードされるものではない。スピーカは聴取ルームと一緒にあり、それにより、人間の脳が解読できる空間音場を聴取ルーム内に形成する。しかしながら、この空間音場は、録音場所に存在する音場に類似していない。

僅かに異なる方法で立体空間錯覚を引き起こす異なる放射パターンを伴うスピーカがあるが、それらは全て、それらの特定の手法に関連する様々な問題を示す。最も一般的なスピーカタイプは、音声を聴取位置に向かって主に広げる中〜高周波数を伴ってその前方放射方向で点光源を多かれ少なかれ複製しており、すなわち、コーン及びドームが前方を向くスピーカである。このタイプのスピーカは、通常、立体サウンドステージを形成するのにはあまり成功しておらず、成功の程度は、制御が難しい幾つかの変数に依存する。ラウドスピーカの軸放射パターンは、従来の設計では得ることが困難なものを立体的な錯覚がもたらすのに良好な周波数領域及び時間領域の挙動を有する必要があるという意味で制御される必要がある。サウンドステージは、聴取者へと直接向かう方向以外の方向に放射されるエネルギーが大きいほど、より立体的で広々としたものになる。残念ながら、サウンドステージは同時に曖昧になり、個々の演奏者の輪郭とそれらの立体空間内での位置はそれほど明確でなくなり、それが全ての明瞭さを失う。この理由は、付加された周囲空間音場がラウドスピーカからの直接音とほぼ同時に聴取者に届き、したがって、聴取者の脳が空間情報を解読し損ない、その結果、音声が不明瞭になるからである。また、音声は聴取ルームの音響に益々依存するようになる。音響及び部屋の両方、部屋のサイズ、及び、部屋内のスピーカの位置は、明瞭さの認識、定位、及び、音色バランスの正確さに影響を与える。また、前方集束放射パターンは、幾らかの音声閃光効果ももたらし、それより、非常に不自然な大量の直接放射音で聴取者を盲目にする。

点光源が全ての周波数で全ての方向に等しい量のエネルギーを放射するとき、それは通常全方向性スピーカと呼ばれる。このタイプのスピーカは、より自然に聞こえる立体的な錯覚を示すが、音声は明瞭さに欠け、個々の演奏者の位置は良好でない。周波数応答精度も周囲によって大きく影響される。その明白な欠点、明瞭さの欠如、分解能、及び、部屋への依存性を無視して、スピーカは、伝統的な技術を使用して聴取者の前で起こる立体的事象の最良の錯覚をもたらす。これは、全方向性スピーカが聴取者の方への直接音に対して聴取ルームの周囲空間内へとより多くのエネルギーを放射してコンサートホール内の直接音と周囲音との比率を通常の前方放射スピーカよりも良好に複製するために起こる。

スピーカタイプ間には様々なバリエーションや重複部分があるが、要約すると、スピーカが聴取者へ向かう方向以外の方向で放射する音響エネルギーが大きければ大きいほど、立体的な錯覚はより説得力のあるものになる。同時に、音声は、直接音と周囲音との間の到達時間の差が短いために明瞭性、定位性を失い、聴取ルームの配置や音響により依存するようになる。

更に、従来のラウドスピーカは、サウンドステージ及びその中の楽器のサイズをそれら自体のサイズにスケーリングする。小型スピーカは大型スピーカよりも常に小さく聞こえる［４］。ブラインドリスニングテストでは、小型スピーカのサイズと大型スピーカのサイズを区別するのが容易であるが、おそらく、ごく少数の非常に珍しいケースでは、ステレオからの再生サウンドステージが当初の録音サウンドステージよりも小さい。

人間はそれを考えずに即座に直感的に任意のあらゆる音源の物理的サイズを判断することができる。これは極めて重要なサバイバルスキルであり、我々は、音声が大きくて潜在的に生命を脅かすものから生じているのかどうか或いはほんの小さな無害なものであるのかどうかを知る必要がある。我々は、生成された音場の空間的特性を聴取することによって物体のサイズを判断する。音声を放射する表面が音声の波長と比較して大きくなると、小さい物体は、大きい物体とは異なって特定の周波数で音声を空間的に放射し、放射が益々指向性を有するようになる。

ラウドスピーカは、それが聴取ルーム内で生成する反射、生成された空間音場と組み合わされたそれ自体のサイズを使用して立体サウンドステージの錯覚をもたらす。ステレオ録音は実行可能な空間情報を含まないため、錯覚は純粋にスピーカと部屋とが一緒に生成した音声の空間特性に基づいている。これを考慮すると、小さいスピーカは小さい物体と同じように音声を空間的に放射するため、小さいスピーカが大きいものより小さく聞こえることが非常に明白になる。物体の大きさを検出できる我々の能力は何千年にもわたって開発されてきており、また、通常の小さなスピーカは、それが大きい物体であると信じることへと我々の聴覚を欺くことができない。

聴取ルーム内で生成される反射は、我々の目の前の我々の頭の外側に存在するように見える立体サウンドステージの錯覚を引き起こす。広い部屋では大きなサウンドステージが与えられ、また、小さな部屋では小さなステージしか得られない。スピーカと部屋とが一緒に生成した空間音場がなければ、ステレオ録音がこの情報を欠くため、立体サウンドステージの錯覚はない。スピーカと部屋とによって生成されるサウンドステージは、録音されたものとは無関係であり、それは特定の部屋によって特定のスピーカにより生成される単なる錯覚であり、スピーカが別の部屋に移動されると完全に変化する。

ステレオに伴う第２の問題は、録音及び再生のチェーン内に同じ空間情報がないことに起因する。録音エンジニアは、コンサートホール内の典型的な聴取位置に録音マイクロホンを配置しない。彼はいつもマイクロホンを演奏者にずっと近づけるように動かす。聴衆が通常座っているホールにマイクロホンが位置された場合、録音は過度に反響して不自然に聞こえる。

これは、ステレオ録音ではホール内の音場から空間情報特性を取得できないために起こる。それは音圧レベルのみを捕捉する。ホール内の聴取者は、音圧及び空間の両方の情報を全て捕捉し、自動的に空間情報を使用してステージ上の演奏者に自分の注意を向ける。周囲音場は、他の方向から聴取者に到達しており、ステージからの音声と比較して知覚的に減衰して脳により異なって観察される。ステレオ録音には空間情報がないため、聴取者はそれを解読するために空間情報を使用することができず、したがって、録音がホールの聴取位置で行われた場合、それは大量の残響エネルギーを持っていると知覚される。人間の脳は、音声環境を理解して処理するために、空間領域及び音圧領域の両方を使用する。

バロンは反射エネルギーと直接エネルギーとの間の比率を調べ、任意の通常の状況をカバーするために−２５ｄＢ〜＋５ｄＢ（Ｄ／Ｒ）の範囲の線図を作成した［１］。典型的なシューボックスコンサートホールでは、少なくとも半分の席のＤ／Ｒが−８ｄＢ以下である［４］。殆ど全てのステレオ録音において、Ｄ／Ｒ比率は＋４ｄＢより小さくなることは決してない。すなわち、コンサートホール内での録音と音声との間に少なくとも１２ｄＢの差がある。これは、録音が空間情報を欠いており、聴取者が録音内の残響場を直接音から区別できないために必要である。録音がホールに存在するのと同じくらい多くの残響エネルギーを含んでいた場合、それは不釣り合いに反響するように聞こえる。

要約すると、ステレオ録音は、当初よりも少なくとも１２ｄＢ少ない残響エネルギーをその中に含み、音場の任意の空間情報を欠く。

更に悪いことには、最も一般的な前方放射型ラウドスピーカは、聴取者へと直接に向かう音響エネルギーの大部分を発し、録音における残響場エネルギーの欠如に関してあまり改善しない。全方向性スピーカはこの点ではるかにうまく機能し、その結果、立体サウンドステージはより説得力のあるものになる。

残念なことに、聴取ルーム内のより大きな量の残響場エネルギーは、明瞭さ、定位、及び、音色バランスの正確さの知覚に悪影響を及ぼす。

その理由は、直接音とスピーカ及び部屋が一緒に生成する残響立体音声との間の時間遅延がごく僅かだからである。典型的な聴取ルームでは、直接音と聴取者に届く最初の反射音との間の時間差が約５ｍｓである。これが問題の根本であり、聴取者が直接音と残響音とを分離するのに十分な時間がないため、全体の音声が曇って混雑し、不正確になる［３］。

図２の線図３は、図１に示されるホールで捕捉されるステレオ録音の残響減衰を示す。図２の線図１に示される録音とホールとの間には違いが存在する。これは、前述のように録音エンジニアがステレオ録音のバランスをとるためにマイクロホンを演奏者の近くに移動させる必要があるからである。マイクロホンは演奏者により近いため、ホールの反射は直接音に比べて減衰する。更に、記録された反射はもはやメインホールのものではなく、ステージ部の隣接する面が物理的に近接しているため、その反射は、ホールの主聴衆部の疎の間隔の反射よりも優勢になる。全体として、ステレオ録音で捕捉された残響場全体がホールの聴取位置にある自然発生場とそれほど似ていないことは、線図を見るとかなり明白である。

図２の線図４は、図２の線図３に示される録音が図２の線図２に示される残響減衰を伴ってスピーカと部屋とにより再生されるときに起こるものを示す。ここでは、録音された残響減衰が部屋の残響減衰に重なって、図２の線図４における合成残響減衰をもたらす。これは、図２の線図１におけるホールの残響減衰のようには全く見えないが、ステレオ録音を再生したときに聴取ルームでよく見られる減衰である。

前述のように、直接音と最初の反射との間の時間間隔の欠如は、疲労になるポイントで音をそれほど明確且つ正確にしない。小さな部屋の音声は明らかに人間の脳に問題を引き起こし、コンサートホールを真似るのに十分な残響減衰エネルギーも欠く。

ステレオ音声が全ての空間情報が欠いていることを考えると、聴取ルーム内ではスピーカと部屋とが一緒になって空間音場を生成するだけであり、また、減衰パターンは、音楽ホールで自然に起こるものと非常に異なるように見え、ステレオが人工的に聞こえることはあまり意外ではない。

ステレオ展開技術
ステレオ展開技術は、最新のＤＳＰ技術を利用してステレオ再生の固有の問題を解決する。ＤＳＰを使用すると、左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから情報を簡単に抽出して、他の処理アルゴリズムに供給する新たなチャンネルを幾つか生成できる。また、ＤＳＰは、これらの異なるフィードを遅延させ、周波数整形し、混合することができる。

ステレオ展開は、人間の脳が容易に解釈できる心理音響学に基づく空間３Ｄ音場を再生することによって及び心理音響グループ化と呼ばれる心理音響学的効果を利用することによってステレオにおける２つの基本的な制限に対処する。

最初の実装において、ステレオ展開は、空間音場と直接音との基本的なグループ化と共に前方以外の方向の付加的なドライバを使用することにより聴取ルームに空間３Ｄ音場を生成する。

第２の実施形態において、ステレオ展開は、開示された高度グループ化方法を通常のラウドスピーカと共に使用する。前方放射型ラウドスピーカは、基本的に最初にステレオ情報を再生し、その後、グループ化された空間情報を再生して、前方以外の方向に向けられた付加的なドライバを使用せずに空間場を再現する。これは、後述の共感的グループ化方法を使用する高度グループ化プロセスを使用することによって可能である。

第３の実施形態において、ステレオ展開は、空間音場と直接音との高度グループ化と共に前方以外の方向の付加的なドライバを使用することにより聴取ルームに空間３Ｄ音場を生成する。この実施は、最良の錯覚を再現するが、付加的なドライバを必要とするため、第２の実施形態と比較してその適用可能性がやや制限される。

第４の実施形態において、ステレオ展開処理は、高度グループ化プロセスを使用するヘッドホンを用いて空間３Ｄ音場を形成する。直接音場及び周囲音場は、音声体験を聴取者の頭の中の共通部分から聴取者の頭の外側の部分へと移動させる高度グループ化によって接続される。それは、聴取者の身体的特性、すなわち、耳、頭及び肩の形状及び大きさについてのいかなる先行情報を伴うことなくそうする。

図２の線図５は、図２の線図２の部屋内で図２の線図３からのステレオ録音のステレオ展開再生により生成される音場を示す。ステレオ展開は、図２の線図３のステレオ録音から図２の線図１に示されるホールの残響減衰を抽出し、それを増幅して、人間の脳に心理音響学的に意味がある時間内にそれを位置させる。図２の線図３からの部屋応答は、勿論、再生にも重ね合わされるが、ステレオ展開バージョンの再生は、ステレオに比べて図２の線図１のホールからの音響減衰パターンとはるかに似ているように見えるとともに、容易に理解できるたくさんの音響情報を聴取者の脳に与える。心理音響学的に一致した空間場生成及び心理音響学的グループ化を通じて新たな減衰場が可能である。

交響楽団及び２つのスピーカの以下の図３は、ステレオからの音声を視覚的に示そうとする試みである。サウンドステージの大部分は、２つのスピーカ間にあり、高さと奥行きが少しあるが、音響環境は殆どない。

図４は、ステレオ展開から知覚されるサウンドステージを視覚的に示し、通常のステレオを示している図３と比較する必要がある。演奏者は、大きさがやや拡大されたほぼ同じ場所に位置され、ホール及び雰囲気が３Ｄ品質と一緒に音声に付加される。

展開ステレオ
その名前が示すように、ステレオ展開は、モノラルが物理的に左右ステレオに展開されたように、通常のステレオ録音を展開するが、今回はステレオは時間の次元で展開される。ステレオからステレオ展開への飛躍は、心理音響学的には実際にモノラルをステレオに展開するのと大差がない。これは説明不可能なように思えるかもしれないが、ステレオとそれが心理音響学的にどのように機能するかを詳しく見てみると、そうでないことが明らかになる。

ステレオ再生における音源の左から右への定位は、２つの主な心理音響学的現象を通して作用する。我々の耳脳は、耳間時間差と左右の耳間の知覚されるレベル差とに基づいて音源の水平方向の定位を判断する。左右の耳のそれぞれで音源からのレベルを調整することにより音源を左から右にパンすることができる。これは、通常、レベルパンと称される。左右の耳への到達時間を変更することによって定位を調整することも可能であり、このパンニング方法は２つのうちより効果的である。耳間時間差を通してパンニングする有効性を試すのは簡単である。聴取者の前にステレオスピーカ対を設置し、聴取者がスピーカ間の中央にある位置から左右に移動できるようにする。近いスピーカが音源であることを両耳間時間差が心理音響的に我々に告げるため、知覚されるサウンドステージはステレオスピーカの１つに向かってかなり速く崩壊する。ヘッドホンを使用して、耳のうちの一方へのステレオ信号を遅らせることで、サウンドステージ全体がレベルを何ら変更することなく遅延のない耳に向かって倒れることで、同じことが分かる。ステレオにおける水平面内の定位は、実際には主に左右の信号間の両耳間時間差によって引き起こされ、すなわち、ステレオは、耳間の時間差に基づいて心理音響的水平定位の手掛かりをもたらすために時間内に展開されるモノラル信号である。ブルームレインは、左から右への定位の作成に必要な耳間時間差を作成できるようにするために、２人の話者を物理的に分離した。

モノラルがステレオに展開されるのと同じように、ステレオ信号を時間内に展開すると、心理音響学的にステレオを真の立体音声に展開することができる。これがステレオ展開の機能である。

図５は、通常のデジタルステレオ録音の１つのチャンネルを示す。図の左から始まり真ん中で終わる軸に沿って、リアルタイムドメイン軸上にサウンドサンプルがある。グラフは時間の各インスタンスで音声信号の絶対値を表示し、高さがレベルに対応する。図の右から中央への軸に沿って、秒の大きさの時間がある。当初のステレオ録音において、ステレオは左右の信号のみを含む２次元プロセスにすぎないため、この次元に付加的な情報はない。

図６は、図５と同じデジタルステレオ音声録音を示す。違いは、それがステレオ展開処理されてしまっていることである。それは時間と共に展開され、軸に沿って右から中心に向かって展開される。ここで、各インスタンスの信号がどのように二次時間次元に展開されるのかを確認できる。この図では、二次時間軸に沿って２０個の別々の展開信号フィードを使用する展開プロセスによって信号が展開されることを観察することができる。図６の３Ｄグラフの概念は、一見すると多少変わっているかもしれないが、人間の脳が音をどのように解釈するかに非常に似ている。ある時点で聞こえた音は、二次時間軸に沿って脳によって追跡され、元の信号の開始から図の最後までの全ての情報は、音に関する情報を得るために脳によって使用される。

脳は我々のビジョンと同じように我々の音声環境を理解しようとする。脳は、物体を作成し、各物体に特定の音声を割り当てることで音声環境を簡素化する［２］。人が部屋を横切って歩くとき、我々は動きからの全ての音をその人に割り当て、我々は付随する残響と共に物体としてドアベルを聞く。我々の視覚的認識とグループ化の例は、おそらく詳細を理解しやすくする。緑の葉のある小さな木と木の後ろに立っている男性について考えてみる。木と男性を見て、我々は直ちに木の枝と葉を一緒に木の物体にまとめ、また、我々は、木の後ろの男性から見える部分から、このポイントでは部分的にしか見えないが、別の物体があると推測し、それを男性グループにグループ化する。葉が弾性の大部分を曖昧にするため、男性グループに対する我々の認識は限られているが、依然として、我々は、それが別のグループであり、おそらくそれは男性であることを合理的な確信を持って伝えることができる。視覚的な例は、我々の聴覚がどのように機能し、脳がどのようにして音を解読してグループ化するかに似ている。たとえ脳が部分的に限られた情報しか持っていなくても、それは、木の後ろの男性のように、音オブジェクトを知覚してグループ化することが依然として可能である。我々が聞く情報が少なくなればなるほど、細部やグループを確実に分類することが難しくなるが、それでも依然として可能であり、頭脳はより懸命に働けば済む。木に葉がなければ、もっと詳細を見たり、木の後ろにいる男性グループをもっと簡単にそして確実に知覚したりすることができる。

これを念頭において、図５と図６の違いをもう一度見てみる。図６の展開されたバージョンの信号には、音に関するより多くの情報があり、その結果、脳が音を部類し、詳細を認識し、音をグループ化することがより簡単になる。これはまさに通常のステレオと比較してステレオ展開で聞こえたものであり、容易さと細部への認識が向上する。それぞれの音に関連する音響環境と減衰ははるかに明確になり、サウンドステージは通常のステレオでは見られない３Ｄ品質を帯びる。サウンドステージ全体のサイズも大幅に増加する。

図６のグラフには２つの時間次元があり、マトリックス内の追加の２番目の時間次元は、処理中にリアルタイム次元に折り畳まれる。

ステレオ展開空間音場生成
ステレオ展開技術は、連続的な実際の聞こえる音響環境で音を生成する立体音源で占められるリアルな信頼できる立体サウンドステージをもたらす。これは、ステレオソース素材から情報を抽出して生の音の中で自然に発生する周囲音と直接音との比率を復元することによって、及び、音声をコントローラ態様で聴取ルームに空間的に広げることによって達成される。ステレオ展開技術は、通常のステレオ情報を聴取者に向けて通常の方法で送信して音場内のパフォーマーの知覚位置を高い精度で確立することによって動作した後、遅延されて周波数整形された抽出信号を前方及びその他の方向に投影して、付加的な心理音響学に基づく手掛かりを耳及び脳へ与える。付加的な手掛かりは、細部及び透明性が向上した感覚を生み出すとともに、音源の立体的な特性とそれらが演奏している音響環境とを確立する。挿入された手掛かりは、通常のステレオ再生と比較して、作業するためのより多くの情報を人間の脳に提供し、音声の解読をはるかに容易にする。

理想的なステレオ展開スピーカは、聴取者ヘ向けて前方に向いているだけでなく左、右、上、後も向いているスピーカドライバを有する。やや限られた利点であるにもかかわらず、ダウンファイアリングドライバを使用することもできる。この文脈でのドライバは、一例として１つのフルレンジドライバ、それらの間で周波数を適切に分割するためにクロスオーバーを使用する幾つかのドライバ、又は、場合によってはクロスオーバーを使用して幾つかの他のドライバと組み合わされる全てが同じ音声を再生する幾つかのドライバとなり得る１つの又は多くの音声生成装置である。従来のコーンドライバから静電ドライバ及び静磁気ドライバなどに至るまで任意のドライバ技術を使用できる。ドライバ技術は特に重要ではなく、任意の音声生成技術が適切に機能する。個々のドライバのそれぞれの放射パターンは、通常のコーン、ドーム又はホーンと同様に規則的な前方発射であり得るが、線源、全方向性又は双極子又はそれらの変形及び組み合わせでもあり得る。

アルゴリズムからの処理済みフィードは、一般に、聴取ルームで音を広げるために、すなわち、空間３Ｄ音場を生成するために、ライブサウンドに似た信頼できるサウンドステージを生成する制御された態様で、さもなければ通常の外見のラウドスピーカの前面、側面、上面及び背面に位置されるスピーカドライバを通して再生される。ステレオ展開技術は、全てのドライバを所定位置に実装した場合と同程度ではないが、前方を直接に向いていない付加的なドライバが１つでも従来のステレオ再生を向上させることができる場合であっても、全ての付加的なドライバほど機能しない。また、ドライバは、必ずしも真っ直ぐ後方に、上方に、側方に、又は、前方に向けられる必要はない。この技術は、単に所定の方向のうちの１つではなく異なって角度付けられたドライバと共にうまく機能する。

ステレオ展開技術は、ステレオチャンネル毎に１つのスピーカを有する２つの通常の外見のスピーカ内で前述の方向のドライバを伴って実装されることが好ましい。また、ステレオ展開技術は、それぞれのステレオスピーカ毎に少なくとも１つであるが任意の数であってもよい、任意のタイプの従来のステレオスピーカにサポートスピーカユニットとして追加される付加的な筐体を使用して実現することもできる。それらは、通常のスピーカ筐体上に配置され又は何らかの方法で取り付けられ、或いは、スタンドアロンスピーカとして別々に配置され得る。付加的なステレオ展開スピーカを壁に掛けたり或いは壁の内側に装着したりすることもできる。

ＤＳＰ抽出プロセスは、処理で元のＬチャンネル及びＲチャンネルと共に使用される付加的なＬ＋Ｒフィード、Ｌ−Ｒフィード、及び、Ｒ−Ｌフィードをもたらす。最も基本的なフィード（Ｆｘ）のための方程式が以下に示される。Ｇｘ、Ｄｘ、Ｆｒｘはそれぞれ、利得、遅延、及び、周波数整形を表わす。

Ｆ１＝Ｌ
Ｆ２＝Ｒ
Ｆ３＝Ｌ＊Ｇ１＊Ｆｒ１＊Ｄ１
Ｆ４＝Ｒ＊Ｇ２＊Ｆｒ２＊Ｄ２
Ｆ５＝（Ｌ^＊Ｇ３^＊Ｆｒ３^＊Ｄ３）＋（Ｒ^＊Ｇ４^＊Ｆｒ４^＊Ｄ４）
Ｆ６＝（Ｌ^＊Ｇ５^＊Ｆｒ５^＊Ｄ５）−（Ｒ^＊Ｇ６^＊Ｆｒ６^＊Ｄ６）
Ｆ７＝（Ｒ^＊Ｇ７^＊Ｆｒ７^＊Ｄ７）−（Ｌ^＊Ｇ８^＊Ｆｒ８^＊Ｄ８）
Ｇｘ利得乗数は、０から無限大までの任意の数であってもよい。周波数整形（Ｆｒｘ）は、周波数範囲を主に５０Ｈｚ超えに制限し、数ある利点の中でも特に限られた出力能力を持つ小型のドライバを使用できるようにし、また、コンサートホールでの典型的な残響場エネルギーをエミュレートするためにより高い周波成分が７ｋＨｚを超えてロールオフされ、必然的に空気中のより高い周波数の吸収が起こる。好ましい周波数範囲は１００Ｈｚ〜４ｋＨｚである。また、周波数整形は、コンサートホールで自然に発生しているのと同じような周囲音場でのロールオフに追従するように応答を輪郭付ける。遅延Ｄｘは、少なくとも５ｍｓから最大で５０ｍｓ、好ましい範囲は１０ｍｓ〜４０ｍｓ、更に好ましい範囲は１５ｍｓ〜３５ｍｓである。示されている基本フィードＦ３〜Ｆ７はそれぞれ、異なるＧｘ、Ｆｒｘ及びＤｘ設定を伴う処理への幾つかの入力フィードになることができる。以下の文章及び式において、フィードＦ３〜Ｆ７のいずれかへの言及は、少なくとも１つを示すが、それぞれの場合に異なるＧｘ、Ｆｒｘ、及びＤｘを伴う２、３、４、５又はそれ以上の同じ基本フィードでもあり得る。以下の実施例では、任意の特定のドライバへの１つのフィードを他のドライバへの同様のフィードと相関させるために使用される別の遅延要素Ｄｆｘがある。遅延は、ラウドスピーカ筐体設計とドライバ位置とに応じて０〜３０ミリ秒の間になり得る。

前方、側方、後方、及び、上方の５つの基本方向の全てでドライバを使用するステレオ展開技術の一実装例では、以下のフィードが異なるドライバに関して使用される。
左スピーカ
前方＝（Ｌ＊Ｇ９）＋（Ｆ６＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝（Ｆ３＊Ｇ１１＊Ｆｒ１１＊Ｄｆ２）＋（Ｆ５＊Ｇ１２＊Ｄｆ３）
外方＝Ｆ６＊Ｇ１３＊Ｄｆ４
上方＝Ｆ６＊Ｇ１３＊Ｄｆ４
後方＝（Ｆ６＊Ｇ１３＊Ｄｆ４）＋（Ｆ３＊Ｇ１４＊Ｆｒ１４＊Ｄｆ５）
右スピーカ
前方＝（Ｒ＊Ｇ９）＋（Ｆ７＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝（Ｆ４＊Ｇ１１＊Ｆｒ１１＊Ｄｆ２）＋（Ｆ５＊Ｇ１２＊Ｄｆ３）
外方＝Ｆ７＊Ｇ１３＊Ｄｆ４
上方＝Ｆ７＊Ｇ１３＊Ｄｆ４
後方＝（Ｆ７＊Ｇ１３＊Ｄｆ４）＋（Ｆ４＊Ｇ１４＊Ｆｒ１４＊Ｄｆ５）

他の１つの例において、前方、側方、後方、及び、上方の５つの基本的な方向の全てでドライバを依然として使用するやや単純な実装では、フィードがこのように構成される。
左スピーカ
前方＝（Ｌ＊Ｇ９）＋（Ｆ６＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ３＊Ｇ１１＊Ｆｒ１１＊Ｄｆ２
外方＝Ｆ６＊Ｇ１３＊Ｄｆ４
上方＝Ｆ６＊Ｇ１３＊Ｄｆ４
後方＝（Ｆ６＊Ｇ１３＊Ｄｆ４）＋（Ｆ３＊Ｇ１４＊Ｆｒ１４＊Ｄｆ５）
右スピーカ
前方＝（Ｒ＊Ｇ９）＋（Ｆ７＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ４＊Ｇ１１＊Ｆｒ１１＊Ｄｆ２
外方＝Ｆ７＊Ｇ１３＊Ｄｆ４
上方＝Ｆ７＊Ｇ１３＊Ｄｆ４
後方＝（Ｆ７＊Ｇ１３＊Ｄｆ４）＋（Ｆ４＊Ｇ１４＊Ｆｒ１４＊Ｄｆ５）

前方、側方、後方、及び、上方の５つの基本的な方向の全てでドライバを使用する更に他の例では、フィードがこのように構成される。
左スピーカ
前方＝（Ｌ＊Ｇ９）＋（Ｆ６＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ３
外方＝Ｆ６＊Ｇ１３＊Ｄｆ４
上方＝Ｆ６＊Ｇ１３＊Ｄｆ４
後方＝Ｆ６＊Ｇ１３＊Ｄｆ４
右スピーカ
前方＝（Ｒ＊Ｇ９）＋（Ｆ７＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ４
外方＝Ｆ７＊Ｇ１３＊Ｄｆ４
上方＝Ｆ７＊Ｇ１３＊Ｄｆ４
後方＝Ｆ７＊Ｇ１３＊Ｄｆ４

前方、側方、後方、及び、上方の５つの基本的な方向の全てでドライバを使用する他の例では、フィードがこのように構成される。
左スピーカ
前方＝Ｌ
内方＝Ｆ３
外方＝Ｆ６
上方＝Ｆ６
後方＝Ｆ６
右スピーカ
前方＝Ｒ
内方＝Ｆ４
外方＝Ｆ７
上方＝Ｆ７
後方＝Ｆ７

前方、側方、及び、上方の４つの基本的な方向でドライバを使用する他の例では、フィードがこのように構成される。
左スピーカ
前方＝（Ｌ＊Ｇ９）＋（Ｆ６＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ３＋（Ｆ６＊Ｇ１５＊Ｆｒ１５＊Ｄｆ５）
外方＝Ｆ６＊Ｇ１３＊Ｄｆ４
上方＝Ｆ６＊Ｇ１３＊Ｄｆ４
右スピーカ
前方＝（Ｒ＊Ｇ９）＋（Ｆ７＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ４＋（Ｆ７＊Ｇ１５＊Ｆｒ１５＊Ｄｆ５）
外方＝Ｆ７＊Ｇ１３＊Ｄｆ４
上方＝Ｆ７＊Ｇ１３＊Ｄｆ４

前方、内方、及び、上方の３つの基本的な方向でドライバを使用する他の例では、フィードがこのように構成される。
左スピーカ
前方＝（Ｌ＊Ｇ９）＋（Ｆ６＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ３＋（Ｆ６＊Ｇ１５＊Ｆｒ１５＊Ｄｆ５）
上方＝Ｆ６＊Ｇ１３＊Ｄｆ４
右スピーカ
前方＝（Ｇ＊Ｇ９）＋（Ｆ７＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ４＋（Ｆ７＊Ｇ１５＊Ｆｒ１５＊Ｄｆ５）
上方＝Ｆ７＊Ｇ１３＊Ｄｆ４

前方及び内方の２つの基本的な方向でドライバを使用する他の例では、フィードがこのように構成される。
左スピーカ
前方＝（Ｌ＊Ｇ９）＋（Ｆ６＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ３＋（Ｆ６＊Ｇ１５＊Ｄｆ５）
右スピーカ
前方＝（Ｇ＊Ｇ９）＋（Ｆ７＊Ｇ１０＊Ｆｒ１０＊Ｄｆ１）
内方＝Ｆ４＋（Ｆ７＊Ｇ１５＊Ｄｆ５）

可能な組み合わせは無限にあり、全てを例示することはできないが、一般的な手法は今や明らかなはずである。通常のＬ信号及びＲ信号は前方を向いているドライバに送られ、また、抽出され処理済みの様々な起源の信号は、他のドライバへ及び場合により前方を向いているドライバを経由しても適切な方向で送られる。アルゴリズムの正確な選択は、実装の特定の特性によって決まる。ドライバ分散パターン、スピーカ筐体上の位置、照準方向、並びに、使用されるドライバの角度及び数などのものは全て、アルゴリズムの最適な選択に影響を及ぼす。

ステレオ展開技術は、ステレオ信号にエコーを追加するだけのものであると考えるのは簡単であるが、それが行うことは、全てのタイプのＤＳＰを装備したオーディオ装置やソフトウェアプラグインなどに普遍的に存在する一般的なＤＳＰエコー効果からはほど遠いものである。ステレオ展開技術は、心理音響現象を利用して、比喩的に言えば空間的な３Ｄサウンド空間を描く。３Ｄ音場は聴取ルーム内で形成される。人間の耳と脳は、音が最初に聞こえてから一定の時間枠内で音源の位置及びサイズ並びに周囲音響の初期の特性を分類する。この時間枠は、音が鳴ってから約５ｍｓ〜５０ｍｓ後である。５ｍｓより前に到着する音は、音源からのいわゆる直接音の一部として解釈され、空間的な３Ｄレクリエーションには役立たない。５０ｍｓ後に到着する音は、エコーとして知覚され、空間３Ｄプロセスでも使用できない。５ｍｓ〜５０ｍｓの間に到着する音は、やはり比喩的に、我々が聴いているときに知覚する空間的な３Ｄ音像を描き、我々の耳脳に音の特性についてのあらゆる種類の手掛かりを与える。

ステレオ展開技術を使用すると、聴取者の耳に届く最初の音声は、抽出されたフィードのいずれかの前に発信されるＬ信号及びＲ信号である。適切な時間遅延を用いると、明瞭さ、細部、像特異性及び音色が実際に付加されたフィードによって大幅に強化される。これが起こる理由は、機能にするのにあまりにも多くの手掛かりが存在することから、付加的なフィードが音声を解読するプロセスを耳脳にとってはるかに容易にするからである。ステレオ展開デコーディングはステレオデコーディングよりもはるかに耳脳に易しく、実際には、ライブパフォーマンスからの音声に似た状況に近づいている。

また、ステレオ展開技術は、任意の種類の知覚できるエコーを音声に付加せず、録音の音響がドライである場合には展開バージョンがドライに聞こえ、録音の音響がウェットであるの場合には展開バージョンがウェットに聞こえる。録音された音響環境は偽りなく通り抜け、音響雰囲気の異なる録音間で完全に変化する。

音声のステレオ展開技術の３Ｄ描写は耳脳を欺くため、ラウドスピーカのサイズは事実上重要でなくなる。音源のサイズやサウンドスケープには他に多くの手掛かりがあり、ラウドスピーカのサイズがそれほど支配的ではなくなるため、耳脳はラウドスピーカのサイズをもはや検出できない。

最後に、ステレオ展開技術によって室内に投影される音場には既に非常に優れた音響雰囲気特性が付加されており、それが聴取者により周囲音として知覚されるように既に十分に遅延されるため、聴取ルームの音響特性は、任意の通常のステレオ再生を伴うよりも重要性が低くなる。聴取ルームは、それがステレオ再生を伴って行うのと同じように音に影響を与える機会をもはや有さない。

高度グループ化を伴うステレオ展開
高度グループ化プロセスは、ステレオ展開が聴取者の方へと前方以外の方向に向けられる付加的なドライバを欠いているヘッドホンや普通のスピーカで動作するために不可欠である。実際の状況において、人間の脳は、空間音場情報と音圧レベルの両方を使用して、音響環境を解釈する、すなわち、音オブジェクトを一緒にグループ化する。ステレオ録音は全ての空間情報を見逃してしまうため、音圧情報のみに頼っている場合、グループ化プロセスは、脳にとってかなり難しくなり、その結果、前述のように残響レベルを減らす必要がある。ステレオ展開技術は、異なる方向に向けられる付加的なドライバによって与えられる聴取ルームで生成される音場の高度空間制御を伴うことなく周囲情報を復元する際には、グループ化プロセスを助けるように編成された音を脳に与えなければならない。これが、以下に説明する高度グループ化方法の目的である。

ステレオ展開ＤＳＰ抽出プロセスは、展開処理で元のＬチャンネル及びＲチャンネルと共にビルディングブロックとして使用される追加の基本的なＬ＋Ｒフィード、Ｌ−Ｒフィード、及び、Ｒ−Ｌフィードを形成する。基本フィード（Ｆｘ）のための方程式が以下に示され、Ｇｘ、Ｄｘ、及び、Ｆｒｘはそれぞれ、利得、遅延、及び、周波数整形を表わし、Ｇｆｘは、ステレオ展開処理後に同じ知覚出力レベルを維持するために前方主出力をレベルで調整するための利得乗数であり、Ｆｒｆｘは、前方直接音の全体的な音色バランスを維持するために修正され得る周波数整形フィルタである。
Ｆ１＝Ｌ＊Ｇｆ１＊Ｆｒｆ１
Ｆ２＝Ｒ＊Ｇｆ２＊Ｆｒｆ２
Ｆ３＝Ｌ＊Ｇ１＊Ｆｒ１＊Ｄ１
Ｆ４＝Ｒ＊Ｇ２＊Ｆｒ２＊Ｄ２
Ｆ５＝（Ｌ^＊Ｇ３^＊Ｆｒ３^＊Ｄ３）＋（Ｒ^＊Ｇ４^＊Ｆｒ４^＊Ｄ４）
Ｆ６＝（Ｌ^＊Ｇ５^＊Ｆｒ５^＊Ｄ５）−（Ｒ^＊Ｇ６^＊Ｆｒ６^＊Ｄ６）
Ｆ７＝（Ｒ^＊Ｇ７^＊Ｆｒ７^＊Ｄ７）−（Ｌ^＊Ｇ８^＊Ｆｒ８^＊Ｄ８）
Ｆ８＝Ｌ＊Ｇ９＊Ｆｒ９＊Ｄ９
Ｆ９＝Ｒ＊Ｇ１０＊Ｆｒ１０＊Ｄ１０

Ｇｘ利得乗数は、０から無限大までの任意の数であってもよい。周波数整形Ｆｒｘは、コンサートホールでの典型的な残響場エネルギーと空気中のより高い周波数の必然的に起こる吸収とをエミュレートするために主に周波数範囲を５０Ｈｚ超えに制限するとともに周波数を７ｋＨｚを超えてロールオフする。好ましい周波数範囲は１００Ｈｚ〜４ｋＨｚである。また、周波数整形は、コンサートホールで自然に発生しているのと同じような周囲音場でのロールオフに追従するように応答を輪郭付ける。遅延Ｄ１，Ｄ２は０ｍｓ〜３ｍｓであり、残りのＤｘは、少なくとも５ｍｓから最大で５０ｍｓであり、好ましくは１０ｍｓ〜４０ｍｓの範囲であり、更に好ましくは１５ｍｓ〜３５ｍｓの範囲である。示されている基本フィードＦ３〜Ｆ９はそれぞれ、異なるＧｘ、Ｆｒｘ及びＤｘ設定を伴う処理への幾つかの入力フィードになることができる。以下の文章及び式において、フィードＦ３〜Ｆ９のいずれかへの言及は、少なくとも１つを示すが、それぞれの場合に異なるＧｘ、Ｆｒｘ、及びＤｘを伴う２、３、４、５又はそれ以上の同じ基本フィードでもあり得る。

５つの展開フィードを使用するステレオ展開の基本的な実装では、以下の信号が式にしたがって再生される。
左チャンネル＝Ｆ１＋Ｆ３＋Ｆ６＋Ｆ８＋Ｆ５
右チャンネル＝Ｆ２＋Ｆ４＋Ｆ７＋Ｆ８＋Ｆ５

非常に単純な実装では、最低３つまでの展開フィードを使用できる。高度なバージョンは、図６に示されるように２０個のフィードを利用でき、フィード数に上限はなく、フィードは、利用可能なＤＳＰ処理リソースによってのみ制限される。知覚的に重要なコンテンツを伴う３０個のフィードを超えると、聴覚上の経験に限られた利点しかもたらさず、有害になる可能性があるため、３〜３０フィードが好ましい範囲である。心理音響学的に有効なグループ化情報がないため、３つ以下のフィードは機能せず、結果が損なわれる。

３つの展開フィードを使用するステレオ展開の他の基本的な実装では、信号が以下の式にしたがって再生される。
左チャンネル＝Ｆ１＋Ｆ３＋Ｆ６
右チャンネル＝Ｆ２＋Ｆ４＋Ｆ７

１２個の展開フィードを使用するステレオ展開のより高度な実装では、信号が以下の式にしたがって再生される。「２＊」は、各フィードがそれぞれの場合にＧｘ、Ｆｒｘ、及びＤｘのための異なるパラメータと共に使用される回数を表わす。
左チャンネル＝Ｆ１＋２＊Ｆ３＋４＊Ｆ６＋２＊Ｆ８＋Ｆ５
右チャンネル＝Ｆ２＋２＊Ｆ４＋４＊Ｆ７＋２＊Ｆ８＋Ｆ５

勿論、可能な組み合わせは無限にあり、全てを例示することはできないが、一般的な手法は今や明らかなはずである。一例における左チャンネル信号及び右チャンネル信号は、ヘッドホン及び／又は通常のラウドスピーカの両方を通じて再生され得る。

左チャンネル及び右チャンネルの信号に加えてラウドスピーカを通じて再生されると、Ｆ１成分及びＦ２成分を伴わないステレオ展開フィードを聴取者へと直接に向かう方向以外の方向に向けられるドライバに送信することもできる。任意のタイプのラウドスピーカドライバ又はそのアレイを使用して、付加的なフィードを１つ又は全ての想定し得る追加の方向、すなわち、内方、外方、上方、後方、及び、下方に送信することができる。基本的には、広範囲に広がる拡散音場を生成する任意のタイプの一群が機能し得る。また、メインスピーカ付近に位置される或いは更には場合によりメインスピーカに取り付けられる付加的なフィードのために付加的な別個のラウドスピーカを使用することもできる。別個のラウドスピーカをサラウンド設定と同じように部屋の周りに位置させる或いは壁や天井に組み込むこともできる。また、前述の任意のタイプの組み合わせも可能であり機能し得る。

音響心理的グループ化現象は、ステレオ展開プロセスの中核である。グループ化を伴わなければ、脳は時間階層化されたフィードを互いに結び付ることができず、また、それらのフィードは付加的な情報を脳に与えず、むしろ逆に、それらのフィードは、混乱をもたらして、音声をあまり明瞭にせず、あまり分かりやすくしない。グループ化は複雑でない例では説明するのが簡単であるため、前述の３展開フィードの例の左チャンネルの信号を出力方程式で詳しく見ていく。
左チャンネル＝Ｆ１＋Ｆ３＋Ｆ６。

この場合、Ｆ１直接フィードには、Ｆ３フィード及びＦ６フィードにも現れる音声があり、それらをグループ化する必要がある。心理音響グループ化がより良く且つより安定すればするほど、可聴結果がより良くなって、明瞭度が向上する。

心理音響的研究から分かるように、グループ化は、当初の直接音信号及び付加的な情報の位相関係及び周波数関係に基づいて行われる。周波数形状が直接音と付加的なフィードとの間で異なる場合、付加的なフィードは人間の脳が実際の音響環境に存在する信号から期待するものと一致する位相及び周波数成分を保持する必要がある。これが意味するのは、直接音と特定の時間後に到着する第２のフィードがある場合に、直接音が聴取者に到達するために移動した距離と時間とに応じて第２の信号の高周波成分が直接音よりも少ないと脳が予期することである。約８．５メートルに相当する２５ｍｓにわたって移動した信号は、少なくともその距離で空気中に存在する量に等しい高周波ロールオフを示さなければならない。信号が直接信号と同じ周波数成分を有する場合には、信号が脳を混乱させ、また、脳は、意図されたように信号を直接音と共にグループ化しない。信号が高周波成分を殆ど有さない場合には、空気中を移動している音とは別の音が少なくとも１つの物体で跳ね返る可能性が最も高く、それ自体の反射が高周波成分を除去する可能性も高いため、信号はより信頼できるものとなる。同様に、より小さい物体の反射は低周波エネルギーの大部分を跳ね返すことがなく、反射音は波長に対する物体の物理的サイズに応じて特定の周波数未満にロールオフされる。本質的に、Ｆ１、Ｆ３及びＦ６の信号を良好にグループ化するためには、物理法則を遵守する必要があり、これらの信号は、前述したように、移動距離などにしたがって修正される同様の周波数成分を有する必要がある。

高度グループ化が起こるための他の重要な妥当性は位相関係である。フィードＦ１，Ｆ６の信号がそれらの位相関係においてランダムである場合、それらの信号は、ステレオ録音が欠けている録音現場からの空間情報を伴わなければグループ化されない。

遅延と組み合わされる低周波ロールオフは協働してグループ化を確立し、また、高度な共感的グループ化が、遅延と周波数ロールオフとの様々な組み合わせで起こる。例えば２５０Ｈｚでロールオフする場合、共感的グループ化を引き起こす遅延は、基本波の倍数、すなわち、４ｍｓ×６＝２４ｍｓとなる。遅延は基本周波数と比較して長いが、良好なグループ化が行われるために最低周波数が依然として直接フィードと同位相であることが重要であることが分かってきた。上記の例では、２４ミリ秒の遅延が与えられる。これは、それが正確に２４ミリ秒である必要がある又はグループ化が起こらないという意味で正確な値ではない。これは、むしろ、グループ化が起こる範囲内の中間点であり、グループ化が起こる遅延へと向かうガイドポイントと見なされるべきである。

Ｆ３フィードは、音声に位相安定化をもたらすためにＦ１及びＦ６と共にグループ化するために必要とされる。Ｆ６フィードは、本質的にＬ−Ｒフィードであり、したがって、かなりの量で付加される場合には、ステレオコンテンツを一方のスピーカで位相をずらして再生した場合に起こるものと同様の特定の度合いまで幾分不快なフェージネスを引き起こす。この現象に対抗するために、Ｆ３フィードは、フェージネスを除去する安定化要素として与えられ、Ｆ１フィード及びＦ６フィードと共にグループ化されると、もはやフェージネスが存在しない。

用途及び技術的解決策
ステレオ展開は、任意の段階で音声録音に適用され得る。ステレオ展開を古い録音に適用することもでき、或いは、ステレオ展開を新たな録音を行う過程で適用することもできる。ステレオ展開情報を録音に付加する前処理としてステレオ展開をオフラインで適用することもでき、或いは、音声録音が再生される間にステレオ展開を適用することもできる。

ステレオ展開を製品に実装する複数の方法があり、その方法は、チップ上の集積回路、ＦＰＧＡ、ＤＳＰ、プロセッサ又は同様のものにおいてハードウェア形式をなし得る。前述した処理を可能にする任意のタイプのハードウェアソリューションを使用することができる。それをＤＳＰ、プロセッサ、ＦＰＧＡ又は同様のものなどの既存の処理装置で実行するファームウェア又はソフトウェアとしてハードウェアプラットフォームに実装することもできる。そのようなプラットフォームは、パーソナルコンピュータ、電話、パッド、専用の音声処理装置、テレビなどであってもよい。

このとき、ステレオ展開を前述したようにハードウェア、ソフトウェア、又は、ファームウェアのいずれかとして想像できる任意のタイプの前処理装置又は再生装置に実装することができる。そのような装置の幾つかの例は、アクティブスピーカ、アンプ、ＤＡコンバータ、ＰＣ音楽システム、テレビ、ヘッドホンアンプ、スマートフォン、電話、パッド、マスタリング及びレコーディング産業用の音声処理ユニット、専門のマスタリング及びミキシングソフトウェアにおけるソフトウェアプラグイン、メディアプレーヤ用のソフトウェアプラグイン、ソフトウェアプレーヤにおけるストリーミングメディアの処理、ストリーミングコンテンツの前処理のための前処理ソフトウェアモジュール又はハードウェアユニット、或いは、任意のタイプの録音の前処理のための前処理ソフトウェアモジュール又はハードウェアユニットである。

他の適用分野
ステレオ展開を使用した作業中に、通常の聴取者が知覚する音声の明瞭度の向上が聴覚障害のある聴取者にとって更に重要になることも分かってきた。聴覚障害のある聴取者は、定期的に音の理解に苦労しており、不安を取り除くことが大きな助けである。

ステレオ展開によって与えられる付加的な手掛かりは、脳が解読できるより多くの情報を与えることによって困難を軽減し、また、より多くの手掛かりがより大きな明瞭度をもたらす。そのため、補聴器、人工内耳、会話増幅器などのような聴覚障害者のための装置においてこの技術が非常に有益である可能性が非常に高い。

また、ステレオ展開は、駅や空港などに限定されないがこのような音響的に困難な環境にいるあらゆる人にとって明瞭度を向上させるために、ＰＡ音声配信システムにも適用される可能性がある。ステレオ展開は、音の明瞭度が懸案となる全てのタイプの用途において利点をもたらし得る。

ステレオ展開は、音響強化が一般に音楽やスピーチの明瞭度及び音質を向上させるためのＰＡシステムでも同様に適している。ステレオ展開は、スタジアム、講堂、会議場、コンサートホール、教会、映画館、屋外コンサートなどにおいて任意のタイプの生の又は再生性能で使用され得る。

ステレオソースを適時に展開することに加え、ステレオ展開は、明瞭度の観点から体験を向上させるために或いは一般に再生性能を向上させるために心理音響グループ化に合わせてステレオソースを展開するのと同様にモノラルソースを展開するために使用され得る。

ステレオ展開プロセスも、ステレオ再生システムに限定されず、個々のサラウンドチャンネルで行われる処理、適時展開、及び、グループ化と共に、任意のサラウンドサウンド設定で同様に使用することができる。

本発明の特定の実施形態
本発明の第１の態様によれば、ラウドスピーカシステムにおけるステレオ再生のための方法であって、
−ＤＳＰ（デジタル信号処理）を利用することによって左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報を与えるステップと、
−左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報の処理済みアルゴリズムであるフィード（Ｆｘ）を伴う幾つかの新たなステレオチャンネルを与えるステップと、
を含み、
遅延（Ｄｘ）及び／又は周波数整形（Ｆｒｘ）が前記処理済みアルゴリズムで利用され、
前記ラウドスピーカシステムで生成される音が少なくとも２つの異なる方向に広げられる、
方法が提供される。

１つの実施形態によれば、遅延（Ｄｘ）が処理済みアルゴリズムで利用される。

更に他の実施形態によれば、遅延（Ｄｘ）及び周波数整形（Ｆｒｘ）が処理済みアルゴリズムで利用される。更に、１つの実施形態によれば、利得（Ｇｘ）も処理済みアルゴリズムで利用される。また、周波数整形（Ｆｒｘ）が利用されされてもよく、周波数整形（Ｆｒｘ）が主に周波数範囲を５０Ｈｚ超えに制限してもよい。更に、別の他の特定の実施形態によれば、周波数整形（Ｆｒｘ）が利用され、周波数整形（Ｆｒｘ）は、より高い周波数成分が７ｋＨｚを超えてロールオフされるように実行される。更に、周波数整形（Ｆｒｘ）が利用されてもよく、周波数整形（Ｆｒｘ）が１００Ｈｚ〜４ｋＨｚの周波数範囲で実行されてもよい。

更に他の実施形態によれば、遅延（Ｄｘ）が利用され、２つの最初の遅延Ｄ１，Ｄ２を除く少なくとも全てが５〜５０ｍｓの範囲、例えば１０〜４０ｍｓの範囲内である。更に、１つの実施形態によれば、最初の２つの遅延Ｄ１，Ｄ２が０〜３ｍｓの範囲内にある。

高度グループ化に関連付けられる本発明の第２の態様に関連する更なる他の実施形態によれば、方法は、左（Ｌ）ステレオチャンネル及び右（Ｒ）のステレオチャンネルから抽出される情報の処理済みアルゴリズムとして幾つかの展開フィード（Ｆｘ）を与えるステップを含む。この方向における１つの実施形態によれば、方法は、少なくとも１つの展開フィード（Ｆｘ）を他の１つ以上の展開フィールドと共に心理音響グループ化するステップを含み、方法は、展開されて心理音響的にグループ化されたフィードサウンドをラウドスピーカシステム内で再生するステップも含む。展開フィード（Ｆｘ）の数は、例えば、少なくとも３、例えば３〜３０の範囲であってもよい。更に、１つ以上のフィード（Ｆｘ）が位相スタビライザとして与えられてもよい。また、更に他の実施形態によれば、フィード（Ｆｘ）は、基本波の倍数を使用することによって心理音響的にグループ化される。更に、幾つかのフィード（Ｆｘ）は、類似の周波数成分を有するように修正されてもよい。

第２の態様によれば、本発明は、少なくとも１つのスピーカを備えるラウドスピーカシステムであって、
−ＤＳＰ（デジタル信号処理）を利用することによって左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報を与えるとともに、
−左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報の処理済みアルゴリズムであるフィード（Ｆｘ）を伴う幾つかの新たなステレオチャンネルを与える、
ようになっており、
遅延（Ｄｘ）及び／又は周波数整形（Ｆｒｘ）が処理済みアルゴリズムで利用され、
前記ラウドスピーカシステムは、少なくとも２つの異なる方向で生成される音を広げるようになっており、
前記ラウドスピーカシステムがステレオ展開スピーカシステムである、
ラウドスピーカシステムにも関連する。

以上から分かるように、本発明は、少なくとも２つの異なる方向に音を投影することに関する。これは、いずれもラウドスピーカシステム内に１つのスピーカだけ又は複数のスピーカを伴う本発明に係る異なる手段によって達成され得る。本発明の１つの特定の実施形態によれば、ラウドスピーカシステムが１つのスピーカだけを備える。更に他の実施形態によれば、システムは、少なくとも２つのスピーカ、例えば、２つの異なる主方向に音を投影する２つのスピーカを備える。１つの特定の実施形態によれば、前記少なくとも２つのスピーカは、特定の位置から見たときに、少なくとも２つの対応する方向に向いており、互いに対して前方、左、右、上、及び、後を向いている。本発明によれば、全部で２つの方向のみ又は幾つかの異なる方向を向いている３、４又はそれ以上のスピーカなど、全てのバージョンがここで可能である。本発明によれば、それらの全ての組み合わせが可能である。更に、１つの実施形態によれば、ラウドスピーカシステムがステレオチャンネル毎に１つのスピーカを備える。サポートスピーカも全く可能である。

本発明の更に他の態様によれば、先に係るとともに高度グループ化も行うラウドスピーカシステムが提供され、前記システムは、
−左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報の処理済みアルゴリズムである幾つかの展開フィード（Ｆｘ）を与えるステップと、
−少なくとも１つの展開フィード（Ｆｘ）を他の１つ以上の展開フィードと共に心理音響グループ化するステップと、
−展開されて心理音響的にグループ化されたフィードサウンドをラウドスピーカシステム内で再生するステップと、
を含む方法によって音声再生を行うようにもなっている。

前述の態様は、システムがステレオ情報及びグループ化された空間情報の両方を再生することを意味する。更に、ラウドスピーカシステムは、前述したように、前方以外の方向に少なくとも１つの付加的なドライバを備えてもよい。

本発明の更に他の態様によれば、
−音声信号の処理済みアルゴリズムである幾つかの展開フィード（Ｆｘ）を与えるステップと、
−少なくとも１つの展開フィード（Ｆｘ）を他の１つ以上の展開フィードと共に心理音響グループ化するステップと、
−展開されて心理音響的にグループ化されたフィードサウンドを音声再生ユニットで再生するステップと、
を含む方法によって高度グループ化を伴う音声再生を行うようになっている装置であって、
装置がヘッドホン又は直接前方方向のドライバを伴う１つ以上のスピーカである、
装置が提供される。

この態様によれば、ヘッドホンが考慮されるとき、ステレオ展開処理は、高度グループ化プロセスを使用するヘッドホンを用いて空間３Ｄ音場を形成する。前述したように、直接音場及び周囲音場は、音声体験を聴取者の頭の中の共通部分から聴取者の頭の外側の部分へと移動させる高度グループ化によって接続される。

前述のように、この場合も、展開フィード（Ｆｘ）の数は、３〜３０の範囲内など、少なくとも３つであってもよい。更に、この場合にも、前方とは別の方向にあるドライバを伴う少なくとも１つの付加的なスピーカが実装されてもよい。

１．参考文献
［１］バロン、マイケル「オーディトリアム音響及び建築設計」Ｅ＆ＦＮＳＰＯＮ１９９３
［２］ＡｌｂｅｒｔＳ．Ｂｒｅｇｍａｎ、『聴覚情景分析』、「知覚的組織の音」、１９９４年、ＩＳＢＮ９７８−０−２６２−５２１９５−６
［３］ＤａｖｉｄＧｒｉｅｓｉｎｇｅｒ、距離、局在性、明瞭さ、及び、包み込みの知覚における直接対残響比の重要性、２００７年５月５日〜８日、オーストリア、ウィーンで開催される第１２２回オーディオ工学会で発表
［４］ＤａｖｉｄＧｒｉｅｓｉｎｇｅｒ、反射エネルギーが直接エネルギーよりも強い座席でのコンサートホール音響の知覚、２００７年５月５日〜８日オーストリア、ウィーンで開催される第１２２回オーディオ工学会コンベンションで発表
［５］ＤａｖｉｄＧｒｉｅｓｉｎｇｅｒ著、ピッチ、ティンバー、音源分離とラウドスピーカイメージングの神話、２０１２年４月２６日〜２９日、ブダペスト、ハンガリーで開催される第１３２回オーディオ工学会コンベンションで発表

Claims

ラウドスピーカシステムにおけるステレオ再生のための方法であって、
−ＤＳＰ（デジタル信号処理）を利用することによって左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報を与えるステップと、
−前記左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報の処理済みアルゴリズムであるフィード（Ｆｘ）を伴う幾つかの新たなステレオチャンネルを与えるステップと、
を含み、
遅延（Ｄｘ）及び／又は周波数整形（Ｆｒｘ）が前記処理済みアルゴリズムで利用され、
前記ラウドスピーカシステムで生成される音が少なくとも２つの異なる方向に広げられる、
方法。
遅延（Ｄｘ）が前記処理済みアルゴリズムで利用される請求項１に記載の方法。
遅延（Ｄｘ）及び周波数整形（Ｆｒｘ）が前記処理済みアルゴリズムで利用される請求項１又は２に記載の方法。
利得（Ｇｘ）も前記処理済みアルゴリズムで利用される請求項１から３のいずれか一項に記載の方法。
周波数整形（Ｆｒｘ）が利用され、前記周波数整形（Ｆｒｘ）が主に周波数範囲を５０Ｈｚ超えに制限する請求項１から４のいずれか一項に記載の方法。
周波数整形（Ｆｒｘ）が利用され、前記周波数整形（Ｆｒｘ）は、より高い周波数成分が７ｋＨｚを超えてロールオフされるように実行される請求項１から５のいずれか一項に記載の方法。
周波数整形（Ｆｒｘ）が利用され、前記周波数整形（Ｆｒｘ）が１００Ｈｚ〜４ｋＨｚの周波数範囲で実行される請求項１から６のいずれか一項に記載の方法。
遅延（Ｄｘ）が利用され、２つの第１の遅延Ｄ１，Ｄ２を除く少なくとも全てが少なくとも５ｍｓである請求項１から７のいずれか一項に記載の方法。
遅延（Ｄｘ）が利用され、２つの最初の遅延Ｄ１，Ｄ２を除く少なくとも全てが５〜５０ｍｓの範囲内である請求項１から８のいずれか一項に記載の方法。
遅延（Ｄｘ）が利用され、２つの最初の遅延Ｄ１，Ｄ２を除く少なくとも全てが１０〜４０ｍｓの範囲内である請求項１から９のいずれか一項に記載の方法。
前記最初の２つの遅延Ｄ１，Ｄ２が０〜３ｍｓの範囲内である請求項１から１０のいずれか一項に記載の方法。
前記方法は、前記左（Ｌ）ステレオチャンネル及び右（Ｒ）のステレオチャンネルから抽出される情報の処理済みアルゴリズムとして幾つかの展開フィード（Ｆｘ）を与えるステップを含む請求項１から１１のいずれか一項に記載の方法。
前記方法は、少なくとも１つの展開フィード（Ｆｘ）を他の１つ以上の展開フィールドと共に心理音響グループ化するステップを含み、前記方法は、展開されて心理音響的にグループ化されたフィードサウンドを前記ラウドスピーカシステム内で再生するステップも含む請求項１から１２のいずれか一項に記載の方法。
展開フィード（Ｆｘ）の数が少なくとも３である請求項１から１３のいずれか一項に記載の方法。
１つ以上のフィード（Ｆｘ）が位相スタビライザとして与えられる請求項１から１４のいずれか一項に記載の方法。
前記フィード（Ｆｘ）は、基本波の倍数を使用することによって心理音響的にグループ化される請求項１から１５のいずれか一項に記載の方法。
幾つかのフィード（Ｆｘ）が類似の周波数成分を有するように修正される請求項１から１６のいずれか一項に記載の方法。
フィード（Ｆｘ）の数が３〜３０の範囲内である請求項１から１７のいずれか一項に記載の方法。
少なくとも１つのスピーカを備えるラウドスピーカシステムであって、
−ＤＳＰ（デジタル信号処理）を利用することによって左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報を与えるとともに、
−前記左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報の処理済みアルゴリズムであるフィード（Ｆｘ）を伴う幾つかの新たなステレオチャンネルを与える、
ようになっており、
遅延（Ｄｘ）及び／又は周波数整形（Ｆｒｘ）が前記処理済みアルゴリズムで利用され、
前記ラウドスピーカシステムは、少なくとも２つの異なる方向で生成される音を広げるようになっており、
前記ラウドスピーカシステムがステレオ展開スピーカシステムである、
ラウドスピーカシステム。
前記ラウドスピーカシステムは、２つの異なる主方向に音声を投影する少なくとも２つのスピーカを有する請求項１９に記載のラウドスピーカシステム。
前記少なくとも２つのスピーカは、特定の位置から見たときに、少なくとも２つの対応する方向に向いており、互いに対して前方、左、右、上、及び、後を向いている請求項２０に記載のラウドスピーカシステム。
前記ラウドスピーカシステムがステレオチャンネル毎に１つのスピーカを備える請求項１９から２１のいずれか一項に記載のラウドスピーカシステム。
前記ラウドスピーカシステムがサポートスピーカも備える請求項１９から２２のいずれか一項に記載のラウドスピーカシステム。
−前記左（Ｌ）ステレオチャンネル及び右（Ｒ）ステレオチャンネルから抽出される情報の処理済みアルゴリズムである幾つかの展開フィード（Ｆｘ）を与えるステップと、
−少なくとも１つの展開フィード（Ｆｘ）を他の１つ以上の展開フィードと共に心理音響グループ化するステップと、
−展開されて心理音響的にグループ化されたフィードサウンドをラウドスピーカシステム内で再生するステップと、
を含む方法によって音声再生を行うようにもなっている請求項１９から２３のいずれか一項に記載のラウドスピーカシステム。
前方以外の方向に少なくとも１つの付加的なドライバも備える請求項２４に記載のラウドスピーカシステム。
−音声信号の処理済みアルゴリズムである幾つかの展開フィード（Ｆｘ）を与えるステップと、
−少なくとも１つの展開フィード（Ｆｘ）を他の１つ以上の展開フィードと共に心理音響グループ化するステップと、
−展開されて心理音響的にグループ化されたフィードサウンドを音声再生ユニットで再生するステップと、
を含む方法によって音声再生を行うようになっている装置であって、
前記装置は、ヘッドホン又は直接前方方向のドライバを伴う１つ以上のスピーカである、
装置。
展開フィード（Ｆｘ）の数が少なくとも３である請求項２６に記載の装置。
請求項２６又は２７に記載の装置と、前方以外の方向のドライバを伴う少なくとも１つの付加的なスピーカとを備えるシステム。