JP4508295B2

JP4508295B2 - 収音及び再生システム

Info

Publication number: JP4508295B2
Application number: JP52910697A
Authority: JP
Inventors: フィリップアーサーネルソン; オールキルケビ; 晴夫濱田
Original assignee: Adaptive Audio Ltd
Current assignee: Adaptive Audio Ltd
Priority date: 1996-02-16
Filing date: 1997-02-14
Publication date: 2010-07-21
Anticipated expiration: 2017-02-14
Also published as: US6760447B1; GB9603236D0; WO1997030566A1; JP2000506691A; EP0880871B1; US7072474B2; DE69726262T2; US20040170281A1; EP0880871A1; DE69726262D1

Description

発明の背景
この発明は音の収音（録音）と再生系（システム）に関するものであり、特に、少なくとも2つのラウドスピーカによるステレオ音響再生システムに関している。
ここで、ある空間において、受聴者の2つの耳元において再生された音圧は、所望の仮想音源の位置にある実音源によって生じる音圧と等しいとき、ある与えられた位置において、受聴者に仮想音源と呼ばれる、音源がそこに存在しているような印象を与えることができる。このように、人間における仮想の聴取の実現はヘッドフォン、またはラウドスピーカによって可能となり、両手法はそれぞれに利点、問題点を有する。
ヘッドフォンを使用する際は、そのシステムが実施されている音場環境に応じてよって所望の信号を処理する必要はない。しかし、ヘッドフォンによるバイノーラル音源の再生では、時々、”頭内に”ある特定の音源が定位し、前方と後方の定位が曖昧であるという問題点が生じる。一般に受聴者に仮想音源が明らかに外部に、つまり”頭外に”存在するような印象を与えることは非常に困難である。
ラウドスピーカを使用する際には、仮想音源を頭外に存在させることはさほど困難ではないが、要求する効果を得るためには比較的精密な（洗練された）ディジタル信号処理技術を必要とし、知覚される仮想音源の音質はラウドスピーカの特性と、再生音場特性に依存する。
2つのラウドスピーカを使用する場合、２つの所望の信号を空間上の2点に非常に正確に再生することができる。この2点が偶然にも受聴者の2つの耳の位置に設定された場合、受聴者に対して非常に明確な音像を提供することができる。この手法は、受聴者に対して典型的には見開き60度の位置に、広い間隔をもって配置された2つのラウドスピーカを使用している様々な異なるシステムによってすでに実現されている。このようなラウドスピーカ配置を採用する場合に、直面する基本的な問題の1つは、明確に仮想音源の再生は非常に制限された領域のみか、あるいは受聴者の頭部を囲む小さな”バブルのような”領域のみであることである。もし、受聴者の頭部が数センチメータ以上側方に移動すれば、仮想音源によって創造される音像は完全に所望とは異なったものとなる。従って、広い間隔を有して配置された2つのラウドスピーカによる仮想音源再生は受聴者の頭部の移動に対して強くない。
ここで我々は、多少驚いたが、近接して配置された2つのラウドスピーカを用いた仮想音源再生システムは、頭部の移動に対して非常にロバスト（強い）であることを発見した。つまり、システムの挙動は目立って劣化することなく、受聴者頭部を囲む小さな”バブルのような”領域は、十分に拡大する。さらに、近接してラウドスピーカを配置することによって、2つのラウドスピーカを1つのスピーカキャビネットに収納することが可能となる。
ここまでで、紹介した発明にて再生される音場は、ポイントモノポールとポイントダイポールを結合することによって生じる音場の近似であるが、この発明は便宜上”ステレオ・ダイポール”と呼ばれる。
発明の概要
記載した発明の1つの局面によると、音響再生システムは、ラウドスピーカと、少なくとも単一チャネルからの信号に反応してラウドスピーカを駆動させるためのラウドスピーカのドライバとで構成され、ラウドスピーカとは近接して配置された２つのラウドスピーカで、その間隔は受聴者に対して6度から20度の間の角度であるものを意味し、ラウドスピーカドライブとはフィルタ群により構成されるものである。
包括する角度は8度から12度の間であってもよいが、10度が望ましい。
フィルタ群とは、1つかそれ以上のクロストークキャンセル手段、最小自乗平均近似手段、仮想音源再生手段、頭部回折伝達手段、周波数レギュラライゼーション手段、モデリングディレイ手段から構成される。
ラウドスピーカ対は2つが接していても（縁を共有していても）よいが、中央に45cm以上にならない空間がもうけられている方が望ましい。
このシステムは、その最適は受聴位置がラウドスピーカから0.2m〜4.0m、できれば前記ラウドスピーカより約2.0m、の距離における頭部の位置となるように設計されているのが望ましい。あるいはラウドスピーカから0.2m〜1.0mの距離における頭部の位置である。
ラウドスピーカの中心は、実際には並列に揃えて配置されるか、またはそれぞれのラウドスピーカの軸が1点に向くように傾斜して配置される。
ラウドスピーカは単一のキャビネットに収納される。
ラウドスピーカのドライバはディジタルフィルタ手段であるのが好ましい。
記載した発明の第２の局面によると、ステレオ音響再生システムは、近接して配置された2つのラウドスピーカで、その間隔は受聴者に対して6度から20度の間の角度であり、2つのラウドスピーカを1つのキャビネットに収納し、ラウドスピーカドライブは、受聴者の頭部回折伝達関数（HRTF）を代表するものを用いて、設計されたフィルタ手段と、ラウドスピーカの駆動信号を前記のフィルタ手段に入力する手段である。
記載した発明の第3の局面によると、ステレオ音響再生システムは、近接して配置された2つのラウドスピーカで、その間隔は受聴者に対して6度から20度の間の角度であり、前記のラウドスピーカから0.2m〜4.0mのある点を向いており、単一のキャビネットの中に並べられるものである。
記載した発明の第4の局面によると、この発明は、録音と、その後に通常のステレオアンプと、録音を行う際に用いられたフィルタ手段を使用し、近接して配置されたラウドスピーカ対から再生を行うことでも実現され、それにより、スピーカへの入力の際にフィルタ手段を供給する必要性を取り除く。
録音で使用されるフィルタ手段は、第1と第2の局面において採用されたシステムにおけるフィルタ手段と同様の特性を有することが好ましい。
発明の第5の局面は、通常のステレオ録音から、前記のフィルタ手段を使ったさらにその上の録音を創造することが可能である。その発展した録音は、ラウドスピーカの入力を、できれば単一のキャビネットに並べて配置された、近接したラウドスピーカ対に供給するのに使用できる。
従って、そのフィルタ手段が発展した録音において用いられ、利用者が、彼自身がフィルタ手段を供給する必要がないまま、実質的に通常のアンプを使用できることは、高く評価に値する。
発明の第６の局面は、ステレオ、あるいは多チャンネル録音された信号を、第1か第2の局面において採用されたシステムにおけるフィルタ手段に導入することによって実施される音の録音である。
【図面の簡単な説明】
記載された発明の様々な局面の例は、関連する図表を参照しながら実例のみで記述される。ここで：
図1（a）はこの発明の一般的な原理を示した平面図であり、
図1（b）はラウドスピーカの配置補正問題の概要を示し、図1（c）はブロック図であり、
図2（a）、2（b）、2（c）は、単一のキャビネットに収納されたラウドスピーカの形状がどのように異なるかを示した前面図であり、
図3はラウドスピーカ対から受聴者の両耳までの電気音響的な伝達関数と角度θを示し、
図4（a）、4（b）、4（c）、4（d）は、図3において4通りの異なったラウドスピーカ対の配置をした場合の、システムのクロストークキャンセルを実現するフィルタ群の周波数応答の振幅特性であり、
図5は受聴者の頭部が側方に移動した際のクロストークキャンセレーションの効果を示す時に用いる幾何学的な配置を定義し、
図6（a）から6（n）は、異なったラウドスピーカ対の配置をした場合の、受聴者の両耳において再生された信号の振幅特性が示されており、
図７は、ラウドスピーカとマイクロフォンの幾何学的な配置を示す。ここで、θは受聴者の頭部の中心からみたラウドスピーカの見開きの角度であり、r₀はその点から2つのラウドスピーカ間の中心の位置までの距離であり、
図8a、8bは、a）クロストークキャンセレーションと、b）仮想音源イメージングに必要な伝達関数、信号、フィルタの定義し、
図9a、9b、9cは、ラウドスピーカの見開き角度θが60度（a）、20度（b）、10度（c）受の3通りの場合において、受聴者の右耳の位置で完全なクロストークキャンセレーションを実現するために要求される、2つの入力音源信号（太線：v₁（t）、細線：v₂（t））の時間応答である。ここでθが減少するに従って、オーバーラップ部分は増加しており、
図10a、10b、10c、10dは、（a）、（b）、（c）、（d）モノポール・ダイポール結合の場合に、受聴者の右耳にて完全なクロストークキャンセレーションを達成するために調整された、4通りの異なった音源の構成による再生音場を示したものであり、
図11aと11bは、生じた音波への受聴者の頭部の影響を補正も考慮されたクロストークキャンセレーションシステムによる再生音場を示す。ラウドスピーカの見開き角度は60度である。図11aは図10aと同じであり、図11bは図11bと同じであるが、ラウドスピーカの見開き角度は10度である。図11bの場合、示されたプロットは図10のcと同じであり、
図12a、12b、12cは、ラウドスピーカの見開き角度が60度（図12（a））、20度（図12（b））、10度（図12（c））の3通りの場合において、（1.0m）の位置に仮想音源を生成するために要求される、2つの入力音源信号（太線：v₁（t）、細線：v₂（t））の時間応答を示す。ここでθが減少するにつれて、v₁（t）とv₂（t）の両方の効果的な持続時間も減少し、
図13a、13b、13c、13dは、（a）、（b）、（c）、（d）モノポール・ダイポール結合の場合に、（1m,0m）の位置に仮想音源を生成するように調整された4つのことなった音源の形成により再生された音場を示し、
図14a、14b、14c、14d、14e、14fは、仮想音源を生成するために必要なインパルス応答v₁（n）とv₂（n）であり、
図15a、15b、15c、15d、15e、15fは、図14に示されたインパルス応答に対応する周波数応答の振幅特性V₁（f）とV₂（f）を示し、
図16a、16b、16c、16d、16e、16fは、図15の周波数応答V₁（f）とV₂（f）の振幅の差を表し、
図17a、17b、17c、17d、17e、17fは、図15の周波数応答V₁（f）とV₂（f）の遅延・補正・アンラップ（unwrapped）・位相特性であり、
図18a、18b、18c、18d、18e、18fは、図17に示した位相特性の差をとった結果であり、
図19a、19b、19c、19d、19e、19fは、図14のインパルス応答に対応するハニングパルス応答v₁（n）と-v₂（n）である。ここで、v₂（n）は-v₂（n）をプロットすることにより位相において効果的にインバースされており、
図20a、20b、20c、20d、20e、20fは、図19のハニングパルス応答v₁（n）とv₂（n）の和をとったもので、
図21a、21b、21c、21dは、クロストークキャンセレーションシステムを実現するために採用されたH（f）の対角要素H₁（f）と非対角要素H₂（f）の振幅ならびに位相特性であり、
図22aと22bは、図21が周波数応答に相当する2つのフィルタのハニングパルス応答h₁（n）と-h₂（n）（a）と、それらの和（b）であり、
図23a、23bでは、所望の信号d₁（n）とd₂（n）と、左方に5cmの位置に頭部のある受聴者の両耳において再生される信号w₁（n）とw₂（n）を比較しており（所望の波面はハニングパルスであり）、
図24a、24bは、所望の信号d₁（n）とd₂（n）と右方に5cm頭部がずれた受聴者の両耳における再生信号w₁（n）とw₂（n）を比較した結果である。所望の波面はハニングパルスである。
好ましい実施例の説明
図1（a）より、仮想音源イメージングを供給する音響再生システム1は、ラウドスピーカ対2からなるラウドスピーカ手段と、複数の音響チャンネル4からの出力信号反応してラウドスピーカ2を駆動するための、ラウドスピーカドライブ手段3とからなる。
ラウドスピーカ2は、近接して配置されたラウドスピーカ対で形成され、発生された出力5は直接に受聴者6に与えられる。ラウドスピーカ2は、受聴者6に対して見開き角度θが6度から20度の間の角度の向きに限定されるように、配置される。
この例では、見開き角度は実質上、約10度である。
ラウドスピーカ2は、単一のキャビネット7の中に並べて隣り合わせに配置される。ラウドスピーカ2からの出力5は、ラウドスピーカから距離r₀が0.2mから4.0mの間の位置8に集中される。この例において、位置8はラウドスピーカ2より約2.0mである。
2つのラウドスピーカ2の中心間の距離ΔSは、45．0cmかそれ以下が望ましい。ここで図2（b）と図2（c）において、ラウドスピーカ手段は幾つかのラウドスピーカユニットから形成され、この距離は、特に低周波数の音を発生する場合に適用される。
ラウドスピーカドライブ手段3は入力u₁とu₂と出力v₁とv₂であるディジタルフィルタ対で構成される。2つの異なったディジタルフィルタシステムは図7と図8を参照しながら後述される。
ラウドスピーカ2は、実質上は並列に配置される。しかしながら、お互いのラウドスピーカの中心軸を1点に集中させるような方法で、配置する方法でもあり得る。
図1において、受聴者から見て2つのラウドスピーカ2の見開きの角度θは、通常のステレオ録音の受聴とミキシングにおいて従来は60度の見開き角度が推奨されているのに反して、約10度である。従って、2つの処理された信号v₁とv₂を受聴者の前方に直接におかれたスピーカキャビネット7の中のスピーカ2に入力することによって、1人の受聴者に対して十分に空間的な音像を確実に生成することが可能であるような2つのラウドスピーカを内蔵した単一の”箱”7を製作することができる。
良好な仮想音源の再生を保証するディジタルフィルタの設計方法については既にヨーロッパ特許番号0434691、特許明細書番号WO94/01981、特許申請番号PCT/GB98/02005にて明確にされている。
ここに記されている発明全般における原理は、明細書PCT/GB98/02005の図3にも記載されている。これらの原理は本申請書の図1（b）と図9（c）にも示されている。
ラウドスピーカの配置補正問題は、図1（b）に概要が、図1（c）にブロック図が示されている。ここで、信号u₁とu₂は通常のステレオ録音における再生信号を意味する。ディジタルフィルタA₁とA₂は、理想的に配置された仮想のラウドスピーカへの入力と受聴者の両耳との間の伝達関数である。また、実音源と仮想音源の両方の位置は受聴者に対して対称であると仮定されるので、ディジタルフィルタはそれぞれが2対2のフィルタ行列を有する2つだけである。
電気音響的な伝達関数の行列C（z）は、ラウドスピーカへの入力信号［v₁（n）v₂（n）］のベクトルと受聴者の両耳において再生される信号のベクトル［w₁（n）w₂（n）］との関係と定義される。逆フィルタ行列H（z）は、誤差信号e₁（n）とe₂（n）の時間自乗平均値の和が最小であることを保証するように設計される。これらの誤差信号は、受聴者の両耳において再生された信号［w₁（n）w₂（n）］と所望の再生信号［d₁（n）d₂（n）］の差を意味する値である。この発明において、これらの所望の信号は、再生に使用される実際のラウドスピーカ音源の位置から十分に離れている距離をおいて配置された仮想音源対により生成される信号として定義される。フィルタ行列A（z）は、一般に通常のステレオ録音に関連する入力信号［u₁（n）u₂（n）］に対して、これら所望の信号を定義するために用いられる。行列の要素A（z）とC（z）は、受聴者の頭部回折伝達関数（HRTF）と記載される。これらのHRTFは、PCT/GB95/02005において明確にされる幾つかの方法により導出することができる。特に本発明を実施するに際して有効であるとわかった1つの技術（技法）は、事前に採取されたHRTFのデータベースを使用することである。また、PCT/GB95/02005にあるように、逆フィルタH（z）は通常、良好な近似において、左のラウドスピーカに入力される信号は受聴者の左耳にのみ再生され、右のラウドスピーカに入力される信号は受聴者の右耳にのみ再生されることを保証する、クロストークキャンセレーションフィルタの行列H_x（z）を算出することにより導出される；つまり、ΔはモデリングディレイでありIは単位行列であるとき、良好な近似C（z）H（z）＝z^-ΔIである。逆フィルタ行列H（z）は、H（z）=H_x（z）A（z）から算出される。ここで、クロストークキャンセレーション行列H_x（z）を算出することにより、バイノーラル録音されたものに対しても本発明を用いることが可能である。この場合、2つの信号［u₁（n）u₂（n）］はダミーヘッドの両耳において録音された信号である。これらの信号は、クロストークキャンセレーションフィルタ行列の入力として用いられ、その後フィルタ出力はラウドスピーカへ送られ、それによりu₁（n）とu₂（n）は受聴者の両耳において再生される信号の良好な近似であることが保証される。しかしながら通常は、信号u₁（n）とu₂（n）は従来のステレオ録音での信号であり、それらは、受聴者の両耳で再生される信号が空間上に離された仮想ラウドスピーカ音源により再生されるように設計された逆フィルタ行列H（z）の入力とされる。
図2には1つのキャビネットの中に入れられた2つのラウドスピーカのユニットをどのように異なって構成するか、その3つの例を示す。それぞれのラウドスピーカ2が1つのフルレンジユニットのみで構成されるとき、2つのユニットは図2（a）のように互いに隣り合わせで配置されるべきである。それぞれのラウドスピーカが2つかそれ以上のユニットで構成されるとき、それらのユニットは、低域周波数用ユニット10、中域周波数ユニット11、高域周波数ユニット12とし、図2（b）と図2（c）に示されるように様々の方法で配置することができる。
受聴者の頭部の前方に配置された2つのラウドスピーカ2を用い、ここで我々は仮想音源イメージシステムの挙動が、2つのラウドスピーカの見開き角度θにどのように依存するかを考慮する。この問題の幾何学的な配置を図3に示す。ラウドスピーカーマイクロフォン（2/15）配置は対称であるので、電気音響的な伝達関数はC₁（z）とC₂（z）の2つだけである。従って、（ラウドスピーカ入力信号のベクトルと受聴者の両耳において生成される信号のベクトルとの関係であるところの）伝達関数行列C（z）は下記の構造をもつ：

同様に、クロストークキャンセレーション行列の要素はH₁（z）とH₂（z）の2つのみである。従ってクロストークキャンセレーション行列H_x（z）は下記の構造を持つ：

H_x（z）の要素は、明細書番号PCT/GB95/02005の中で詳細に記述されている技法のなかで、特に好ましくは周波数領域におけるアプローチを用いて、算出する事ができる。ここで、H_x（z）の中に見られる不都合な好ましくない影響を防ぐために、通常はレギュラライゼーションを採用することが必要である。
C（z）が比較的に複雑でないとき、クロストークキャンセレーション行列H_x（z）は最も容易に算出される。例えば、無響室内で測定された伝達関数よりも残響室にて測定された伝達関数の逆行列を求めることの方が困難である。さらに、すべての周波数領域において完全な逆処理が行われたとしても、周波数応答が比較的にスムースである逆フィルタのセットの方が、周波数応答が激しく変動しているフィルタのセットよりも、より”自然”であり、”色付け”されていない音を出すと仮定することは正当である。この理由により、我々は研究者がインターネット上から使用できるようにMIT Media Labから提供されているHRTFのデータベースを得ている。それぞれのHRTFは、無響室においてサンプリング周波数を44.1kHzとし、水平面内にて5度毎に測定された結果である。我々はデータベースの簡易バージョンを使用する。それぞれのHRTFは、128の係数に保持するためにトランケーションする前にラウドスピーカ応答をイコライジングされている。（我々はまた、それぞれの値が-1から1の範囲に収まるようにHRTFを補正している）
図4は、ラウドスピーカの見開きが、a）60度、b）20度、c）10度、d）5度と4種類に異なる場合の周波数応答H_x1（z）とH_x2（z）を示す。使用されるフィルタはそれぞれ1024点の係数で構成され、それらは前述の周波数領域における逆処理の方法により算出される。レギュラライゼーションは行われていないが、たとえそうであっても標本化による望ましくない″ラップアラウンド（wrap-around）”の効果は深刻な問題ではなく、すべての実際的な目的に対し、前可聴周波数帯域にわたって逆処理は完全である。それでも、ラウドスピーカの角θが減少するに従って、超低周波数での応H_x1（z）H_x2（z）は増加することは重要なことである。これは、ラウドスピーカが互いに近づくように移動されるにしたがって、クロストークキャンセレーションを達成するためにはより多くの低周波数の出力が必要となることを意味している。これは2つの深刻な問題を引き起こす。つまり、1つ目は、システムから低周波数を出力するために要求されるパワーはラウドスピーカと補助アンプを正常に保持することにとって危険であり得るということ；もう1つは、たとえ機器がそれを出力することができたとしても、所望の受聴位置から離れたある位置において再生された音（の振幅）は比較して高いであろうということである。明らかに、実際には音を所望の受聴位置から離れた方へ向ける結果として、ラウドスピーカを非常に無理に駆動することは望ましくない。従って、所望の位置において低周波数音を十分に再生するために、それ以下では実用上不可能となる、最小のラウドスピーカの見開きシータがある。しかし、実音源と仮想音源が近くない場合のみは、ラウドスピーカを無理に駆動しなければならないということを指摘しておくことは有意である。仮想音源がラウドスピーカと近接している場合、システムは自動的に電気的な入力をほとんどすべて直接ラウドスピーカに向ける。
ここで、クロストークキャンセレーションフィルタのみが図4に示され、角度θが減少するにつれて、低周波数の周波数応答の位相差は、180度（パイラジアン）に近づいていく。
仮想音源イメージングシステムの挙動は、主にクロストークキャンセレーションの効果の度合いにより決定されると仮定することは正当である。従って、もし受聴者の右耳では何も受聴されず、左耳では単一のインパルスを生成することが可能であれば、どのような信号も左耳に再生することができる。対称性により、右耳においても同様の議論が成り立つ。受聴者の頭部が移動するにしたがって、左と右の耳に再生される信号は変化する。一般に言えることは、ラウドスピーカの方に向かって、あるいは遠ざかっていくような頭部の回転、移動は、クロストークキャンセレーション効果の著しい劣化の原因とはならない。しかしながら、側方への頭部の移動に対して、クロストークキャンセレーション効果は比較的敏感である。例えば、受聴者の頭部が左方向に18cm移動すると、右耳のほとんどは”ラウドゾーン（loud zone）”内に移動する。従って、受聴者の頭部が15cm以上側方に移動した場合、十分はクロストークキャンセレーションの効果を期待すべきではない。
我々は、ここで、受聴者の頭部が側方に距離dx移動した場合の、クロストーク抑圧の効果を定量的に評価する。変数dxは図5に示す。所望の信号は左耳での単一インパルスであり右耳では無音であると仮定される時、左耳において再生される信号に対する振幅スペクトルは理想的には0dBであり、右耳に再生される信号のスペクトルはできるだけ小さいのが理想的である。従って、我々は受聴者の頭部が本来受聴するべき位置から外れた場合における、クロストーク抑圧の効果を評価するには、両耳に再生された信号を用いることが可能である。
任意の位置における受聴者の両耳への再生信号を算出するためには、補間が必要である。受聴者の位置が移動するにしたがって、頭部の中心とラウドスピーカとの角度θも変化する。これは、測定されたHRFTのデータベースの中で最も近い2つのHRTFの間を線形補間することで修正される。例えば、正確な角度が91度であれば、処理されたHRTFは
C₉₁（k）=0.8C₉₀（k）+0.2C₉₅（k）
から導かれる。ここでkはFFTにより算出された周波数スペクトルのk’番目である。ラウドスピーカと受聴者の頭部の中心6との距離r₀（図1）の変化に対応してHRTFを修正することはさらに困難である。問題は、距離の変化は通常サンプリング間隔の整数値の遅延（あるいは進み）に対応せず、したがって角度補正されたHRTFのインパルス応答をほんの少しのサンプル分だけシフトさせることが必要となる。ディジタル列を少しだけシフトすることは重要なことである。この特定の場合において、距離が1.0mmかそれ以下の場合のみこの技法は正確である。したがって、この微少遅延技術の効果は、空間軸上にて1.0mm×1.0mm内の最も近いポイントにより本当の耳の位置の近似となる。
図6は、2つのラウドスピーカ間の角度θが60度（a,c,e,g,i,k,m）と10度（b,d,f,h,j,l,n）で、dxの値を-15cm（a,b）、-10cm（c,d）、-5cm（e,f）、0cm（g,h）、5cm（i,j）、10cm（k,l）、15cm（m,n）とした場合における再生信号の振幅特性である。角度θが60度の場合、クロストーク抑圧量は受聴者が頭部を5cm程側方に移動した場合においても1kHzまでの帯域でのみ十分であることが見られる。これに比較して、角度θが10度の場合、クロストーク抑圧は、受聴者の頭部が側方に10cm移動しても4kHzの帯域まで十分である。したがって、2つのラウドスピーカが近くなるほど、受聴者のシステムの挙動は頭部の移動に対してよりロバストである。しかしながら、このセクションでは、最も悪い状態でのクロストークの抑圧の場合について考慮していることを指摘するべきである。例えば、ラウドスピーカの位置に仮想音源がある場合は、明らかに仮想音源の音像はロバストである。一般的に言えば、システムは完全なクロストークキャンセレーションをしようとしている場合よりも、仮想音像を生成しようとしている場合において、実用上常に良好に動く。
中心の音像を明確に生成することは、とりわけ重要である。映画会社（業界）において、左右前方のラウドスピーカとは別のセンタースピーカが長い間使われてきた（さらに通常は幾つかのサラウンドスピーカも使われている）。プログラム（映画作品）において最も重要な部分はしばしばこの中心の位置に割り当てられる。特に会話の部分と、その他の、例えばサウンドトラック中のボーカルのような人間の声の信号についてはそうである。通常のステレオ再生においてラウドスピーカの見開き角度θが60度に設定される傾向にある理由は、もしサウンドステージがそれ以上拡げられると、中央のイメージがはっきりしなくなってくるからである。一方、近接してラウドスピーカを配置すると、よりはっきりした中央のイメージが得られ、したがって、本発明はすばらしい中央のイメージを作り出す上で利点を有する。
フィルタ設計処理は、ラウドスピーカは自由音場においてモノポールのように振る舞うという仮定の上に成り立っている。実際のラウドスピーカにこのようなパフォーマンスを期待することは明らかに非現実的で楽観的である。それにもかかわらず、”ステレオダイポール”配置を採用した本発明による仮想音源イメージングは、マルチメディア分野において多くの場合に使用されている小型のアクティブスピーカのように、ラウドスピーカがあまり上質でない場合においても、実用上十分良好である。低周波数を十分に出力できない場合でも、このシステムは十分に働くことは大変驚くべきことである。最も重要な点は2つのラウドスピーカの周波数特性の違いである。2つのラウドスピーカの特性が類似している限り、つまりそれらが”よくマッチしている”場合、このシステムは良好に作動する。しかしながらそれらの特性が明らかに異なっている場合は、仮想音像が一貫して片側へよる（バイアス）傾向を引き起こす。つまり、均等に拡がったサウンドステージ上に、”偏った（side-heavy）”再生となる。これを解決するためには、よくマッチングしている2つのラウドスピーカが同じキャビネットに収納されていることをしっかりと保証することである。
または、2つのラウドスピーカが事実上同じように駆動するように、片方のラウドスピーカに入力するフィルタをイコライジングすることも可能である。
本発明によるステレオシステムは、テストにおいてしばしば数人の受聴者は聞き慣れる必要があるが、一般に大変聴きやすい。処理ではオリジナルの録音物に対して、ほんの少しの色づけしかされない。近接したラウドスピーカ配置の主な利点は、頭部の移動に対してロバスト（強い）であることで、これは受聴者の頭部の周りに心地よく大きな”バブル”を作り出す。
例えばポップ音楽や映画のサウンドトラックのような従来のステレオ音源を本発明を用いて生成された2つの仮想音源を通して再生する場合、視聴において、受聴者はしばしば、それらの音源がラウドスピーカを見開き角度θが60度である従来の方法で再生されたときよりも、再生の全体の音質の点でより良好であると知覚する。この理由の1つは、見開き角度10度のラウドスピーカは、すばらしい中央のイメージを与えるので、仮想音源の角度θを60度から90度に増加させることができることである。このようにサウンドステージを拡げることは大変好ましい。
本発明のシステムを通したバイノーラル音源再生はとても確かなので、知覚した音像に対応する実際の音源を見ようと、受聴者がしばしばラウドスピーカから目を離す。ダミーヘッド録音における高さの情報もまた、受聴者に与えられる；例えばジェット機が頭の上を通り過ぎる音は大変現実的である。
本発明の考えられる限界の1つは、受聴者の側方や後方には確かな仮想音像を生成できないことである。確かな音像は、確実に水平面内にほぼ140度の広がりを持った弧の内側と（まっすぐ前方よりプラスマイナス70度）、正中面内の約90度の範囲（水平面に対してプラス60度とマイナス30度）にのみ生成することができる。受聴者の後方の音像については、しばしば鏡に映したように前方に知覚される。例えば、受聴者の真後ろに音像を生成しようとすると、それは真っ正面にあるように知覚される。これは音の物理的なエネルギーは常に受聴者前方のラウドスピーカより発生されていることも起因している。もちろん後方の音像が要求された場合は、受聴者の真後ろにさらに本発明によるシステムを付け加えることも可能である。
実際には、システムの性能は利用目的に応じて様々に違った形で要求される。例えば、コンピュータゲームと一緒に利用される音への要求は、高品質のハイファイシステムによって再生される音に比べて、格段におちる。一方、あまりよくないハイファイシステムはコンピュータゲームに採用されうる。明らかに、どのような目的で使用するかを考慮することなしに、音響再生システムを”良い”か”悪い”だけで分類することはできない。この理由で、我々はどのようにクロストークキャンセレーションネットワークを構築するかということについて3つの例をあげる。
考え得る最もシンプルなクロストークキャンセレーションネットワークは、US特許の3236949、’見かけの音源伝送装置’の中で、アタール（Atal）とシュレーダ（Shroeder）によって提案されている。彼らの特許は従来の60度に広げたラウドスピーカ配置について記述しているが、それでも彼らの原理はどんなラウドスピーカの配置にも採用できる。ラウドスピーカが自由音場においてモノポールのように振る舞うとされ、C（z）の中の4つの伝達関数のz変換は、以下のように与えられる。

ここで、n₁はラウドスピーカから近い方の耳に音が到達するまでの、サンプリング間隔であり、n₂はラウドスピーカからもう一方の耳に音が到達するまでのサンプリング間隔である。n₁とn₂は、両方とも整数と仮定される。C（z）の逆処理を行うことは用意である。n₁<n₂であるので、直接（exact）の厳密な逆フィルタは安定であり、1つの係数で構成されるIIRフィルタ（無限インパルス応答型フィルタ）により実現することができる。従ってハードウェアを構築することは大変容易である。この方法で設計されたフィルタを用いて再生された音は大変”不自然”で”色づけ”されているが、ゲームのような用途には十分である。
それぞれが比較的短い係数で構成される4つのFIRフィルタを用いると、システムの確実なパフォーマンスを得ることができる。サンプリング周波数が44.1kHzの場合、MITから提供されているHRTFのデータベースを用いて、正確な定位と自然で色づけのない音を得るには、係数は32点で十分である。これらの伝達関数の長さ（128点）はそれらの逆フィルタ（32点）よりも長いので、逆フィルタは、その問題点を欧州特許番号0434691に記述されているような、時間領域での直接行列逆フィルタ演算（記述されている方法は逆フィルタ処理の決定的最小自乗法）により算出されなければならない。しかしながら低周波数（f<500Hz）のためのクロストークキャンセレーションのための短い逆フィルタを使用するのにかかるコストは十分に削減される。それにもかかわらず、マルチメディアコンピュータのような用途にとって、ほとんどのラウドスピーカは、いずれにしろ、それらの周波数を十分に出力することはできず、従って、これらの用途には短いフィルタセットで十分である。
受聴者の両耳に低周波数の所望の信号を非常に正確に再生するためには、フィルタ長の長い逆フィルタを用いることが必要である。理想的には、それぞれのフィルタは少なくとも1024点のフィルタ係数から構成されるべきである（または（タップの）短いIIRフィルタとFIRフィルタを結合することによっても達成できる）。長い逆フィルタは、例えばPCT/GB95/02005の中で記述されていうような、周波数領域で処理する方法で算出するのが最も都合がよい。我々が知る限り、このシステムを実時間処理で実現するようなディジタル信号処理システムは、商業的に見あたらない。このようなシステムは家庭用のハイエンド・ハイファイシステムや、ホームシアターなどに利用されるか、あるいは、放送や録音をさらに伝送や保存するまえに符号化する”マスター”システムに利用される。
問題点と本発明によって解決する方法を図7から図13を参照しながら、さらに説明すると、以下のようになる。これらの図は、仮想音源イメージングの問題点に関係しており、これらは、ラウドスピーカがポイントモノポールであり、受聴者の頭部は発生した音波に影響しないと、単純化した仮定がなされたときに起こる。
問題の幾何学的な配置を図7に示す。距離Δsで離された2つのラウドスピーカ（音源）は、x₁-軸上にx₂-軸におよそ対称に配置される。我々は、受聴者がラウドスピーカに対して正面に距離r₀m離れた位置にいることを創造する。受聴者の両耳は、距離ΔMで離された2つのマイクロフォンによって表され、それらはまたx₂軸に対してほぼ対称である（左のマイクロフォンが右耳に対応し、右のマイクロフォンが左耳に対応する）。受聴者の位置からみてラウドスピーカは角度θで拡げられる。ラウドスピーカからマイクロフォンまでの4つの距離のうち、2つだけが異なる；すなわち、r₁は最短（直接経路）で、r₂は遠い（クロストーク経路）。左と右のラウドスピーカへの入力はそれぞれV₁とV₂で表され、左と右のマイクロフォンの出力はそれぞれW₁とW₂で表される。便宜上、2つの変数を提案する。

これは、常に1より小さい値である”利得”であり、

これは経路差r₂-r₁を音が伝搬するのにかかる時間に対応する正の遅延である。
システムが単一の周波数を処理している場合、我々はラウドスピーカへの入力とマイクロフォンからの出力を説明するのに、複素表示を用いることができる．したがって、我々はV₁、V₂、W₁、W₂は複素数のスカラーであると仮定する。ラウドスピーカの入力とマイクロフォンの出力は2つの伝達関数

と

を通して関係している。
これらの2つの伝達関数を用いて、ラウドスピーカへの入力の関数としてのマイクロフォンからの出力は便宜上、ベクトルー行列積で表される。
w=Cv
ここで、

自由空間にあるモノポールから放射される音場はp_mo

で与えられ、ここでωは角周波数、ρ₀は媒質の密度、qは音源の強さ、kはc₀が音速、rが音源から音場のポイントまでの距離であるときの波数ω/c₀である。Vが

で定義される場合、伝達関数Cは

で与えられる。
図7に示されているシステムは、1対の所望の信号D₁とD₂をマイクロフォンの位置で再生するを目的としている。従って、W₁をD₁と等しく、W₂をD₂と等しくすることが要求される。対になった所望の信号は、意識的には基本的に2つの異なった対象として明確にされている；クロストークキャンセレーションか、仮想音源イメージングである。両方の場合において、2つの線形フィルタH₁とH₂は1つの入力信号Dを操作し以下のようになる。
v=Dh
ここで、

これは図8aと8bに示されている。完全なクロストークキャンセレーション（図8a）は、信号が受聴者の片耳で完全に再生され、もう一方の耳では何も受聴されないことを要求する。もし我々が受聴者の左耳に所望の信号D₂を生成したいならば、D₁は零でなければならない。一方、仮想音源イメージング（図8b）では、受聴者の両耳に再生させる信号は、仮想音源が再生された位置に存在する実音限によって生成される信号と（共通の遅延と共通のスケール因子までも）同一であることが要求される。
D₂をDだけではなく、DとC₁の積であると定義することは、周波数応答関数V₁とV₂に対応する時間応答が因果性を満たす（これは、時間領域において、所望の信号に時間遅延と距離減衰を引き起こすが、その”形状”は影響されない）ことを保証するので、有益なことである。Vについて線形方程式システム

を解くことにより、我々は

を得る。
時間応答vを得るために、

の項を級数展開を用いて以下のように書き直す。

結果は、

となる。
vの逆フーリエ変換ののち、vは時間の関数として書き表され、

ここで、*は畳み込み、δはデルタ関数である。第1のデルタ関数は時間t=0の時発生し、次のデルタ関数は2τ離れて起こる。従って、アタール（Atal）他から解るように、v（t）は本質的には再帰型であるが、そうであったとしても、D（t）が因果で安定である限り、v（t）が因果で安定であることが保証される。この解決方法は、D（t）が非常に短いパルスで（もっと厳密にいえば、τより短い）場合に、物理的に容易に説明できる。初めに、右のラウドスピーカは受聴者の左耳で受聴されるパルスを送り出す。その信号が左耳に到達後、時間τだけ遅れて、何も受聴されない（到達しない）はずの受聴者の右耳に、このパルスは到達するので、このパルスを打ち消すために、左のラウドスピーカから負のパルスが生成されなければならない。この負のパルスは受聴者の右耳において、最初のパルスの到達から2τ後に到達するので、その結果、右のラウドスピーカからもう1つの正のパルスを生成する必要があるが、このパルスはまた、受聴者の左耳に不必要なパルスを与えてしまう。最終的には、右のラウドスピーカは正のパルス列を発生し、左のラウドスピーカは負のパルス列を発生する。それぞれのパルス列において、個々のパルスは周期1/2τの”ringing”周波数f₀毎で発生する。もしD（t）の長さがタウに比べて短くないならば、個々のパルスはもはやそれぞれに完全に分離されずにオーバーラップすることは、直感的に明らかである。このことは図9a、9b、9cに示されており、これらは、ラウドスピーカの間隔を決定する角度θが60度、20度、10度であるときに、所望の対象を達成するために必要であるところの出力源の時系列である。ここでθ=10°対して、出力信号はほぼ正反対である。
音源入力
図9a、9b、9cは、ラウドスピーカの見開き角度が、60度（図9a）、20度（図9b）、10度（図9c）となる3つの異なった場合における2つの音源の入力を示す。受聴者の距離は0.5mであり、マイクロフォンの間隔（頭部の直径）は18cmである。所望の信号はハニングパルスであり、以下のように表現される。

ここで、ω₀は3.2kHz（このパルスの最初の零は6.4kHzであり、したがってこのエネルギーのほとんどは3kHz以下に集中している）の2π倍である。これらの3つのラウドスピーカ角度60度、20度、10度に対して、それぞれに対応する固有（リンギング）周波数は、1.9KHz、5.5kHz、11kHzである。もし、受聴者が音源に対して近接し過ぎていなければ、直接経路とクロストーク経路が平行に並んでいると仮定することによって、τは良好に近似できる。

さらにラウドスピーカの間隔が十分に狭いと仮定すれば、sin（θ/2）はθ/2と表すことができ、f₀は良好に近似できる。

これらの3つのラウドスピーカ角度60度、20度、10度に対して、この近似により、それぞれ1.8kHz、5.4kHz、10.8kHzの3つのf₀の値が得られ（ノウハウは、f₀=100kHzをラウドスピーカの開き角度で割る）、それらは真値とよく一致している。が零に近づくとf₀は無限大になる傾向があり、原則としてf₀を任意に大きく設定することが可能である。しかしながら実際には、f₀は、物理的な制約により必然的に上限を有する。例えば、θがゼロになる場合に、2つの点音源によって生成される音場は、コーディネイトされたシステムにおける元々の位置にある1つのモノポールと1つのダイポールによって生成される音場と等しくなるような場合において、この制限が見られる。
図9a、9b、9cより、f₀が増加するにつれて、隣り合ったパルス同士のオーバーラップも多くなることは明らかである。これは、明らかにv₁（t）とv₂（t）をよりスムースにし、もしf₀が非常に大きければ、リンギング周波数はほとんど完全に抑圧され、v₁（t）とv₂（t）は両者とも単純に指数的に減衰するということは、直感的に明らかである（それらは両者ともｔが大きいときにゼロに戻るという意味で減衰する）。しかしながら、f₀が増加するに従って、vの低周波成分も増加することも直感的に明らかである。したがって、近接して配置された1対のラウドスピーカにより完全なクロストークキャンセレーションを実現するためには、低周波に対して非常に大きな出力が必要である。クロストークキャンセレーションの問題は低周波の不良であるために、これは起こる。この所望でない特性は物理学上の問題によって引き起こされ、クロストークキャンセレーションシステムを実際に実現しようとするときに、無視できないことである。
図10a、10b、10c、10dは4つの異なった音源の構成により再生された音場を示す：ラウドスピーカの見開き角度は60度（図10a）、20度（図10b）、10度（図10c）の3つであり、モノポール点音源とダイポール点音源の足し合わせにより生成された音場を図10dに示す。図10a、10b、10cに示された音場は、図9a、9b、9c0に示された入力音源によって生成されたモノである。4つの図は、それぞれ、9つの音場の’スナップショット’かフレームで構成される。フレームは最上段左から最下段右に向かって”読みとる順番に”連続して並べられており、最上段左は、時間的に最も早く（t=0.2/c₀）、下段右は最も遅い時刻（t=1.0/c₀）である。個々のフレームの時間の進む間隔は0.1/c₀であり、これは音波が10cmを伝搬するのに必要な時間と等しい。所望の信号の正規化（normalisation）は、右のラウドスピーカが正確に時間t=0で音波を発生し始め、左のラウドスピーカが時間（τ）後に音波を発生し始めることを保証する。それぞれのフレームは、（-0.5m<x₁<0.5m,0<x₂<1）の範囲で、点で算出される。ラウドスピーカとマイクロフォンの位置は円で表示される。1より大きい値は、白で、-1より小さい値は黒で表示され、-1から1の間の値は随時適切に濃淡をつけてある。
図10aはθが60度の場合のクロストークキャンセレーション原理について示している。右のラウドスピーカからの正のパルス列と、右のラウドスピーカからの負のパルス列が容易に確認できる。両方のパルス列は、リンギング周波数1.9kHzで発生されている。右のラウドスピーカからの最初のパルスだけが右のマイクロフォンで観測される。しかしながら、音場の他の場所では、元のハニングパルスの’コピー’が多く見ら、それは2つのマイクロフォンのすぐ近傍でも見られるので、この設定は頭部の移動に対してあまりロバストではない。
ラウドスピーカの開き角が20度に狭まった場合（図10b）、再生音場はよりシンプルになる。所望のハニングパルスはここでは、右のマイクロフォンの方へ向かって発生し、よりシンプルな’クロストーク抑圧ライン’は左のマイクロフォンを通して拡がっている。リンギング周波数は主要な波面の後方にさざ波として現れる。
ラウドスピーカの開き角がさらに10度に狭まった場合（図10c）、リンギング周波数の効果は最も除去され、音場内のほとんどの場所で見られる変動は、オリジナルのハニングパルスが減衰し遅延した単一のコピーのみである。このことは、ラウドスピーカの見開き角を狭くすることにより、頭部の移動に対する本システムのロバスト性を向上させることを示唆している。しかしながら、2つのモノポール音源が非常に近接すると、ニアフィールド効果として、低周波数の出力が大きいことが顕著になってくる。
図10dは、モノポール点音源とダイポール点音源の足し合わせにより生成された再生音場を示す。この音源の結合は”リンギング”を完全に防ぐためであり、したがって再生音場は非常に’きれい’である。2つのモノポールが10度の開きである場合も、予想通り、ニアフィールド要素を含んでいる。ここで図10cと図10dが類似していることを指摘する。これは、ラウドスピーカをさらに近接するように移動させても、再生音場に変化はないことを意味している。
まとめると、所望の信号の最高周波数成分がリンギング周波数f₀よりも十分に低い間は、再生音場は、モノポールーダイポール結合点音源により生成された音場と類似している。ラウドスピーカの見開き角θを減らすことにより、リンギング周波数を上昇することができるが、θが小さすぎると、低周波数に対する正確なクロストークキャンセレーションを達成するためには、ラウドスピーカからの非常に大きな出力が必要となる。実際には、ラウドスピーカの見開き角は10度がよい妥協点である。
ここで、θがゼロに向かって減少するにしたがって、所望の対象を生成するための音場の解は、正確にモノポール点音源とダイポール点音源の結合による音場のようになる。
実際には、受聴者頭部は発生した音場の、特に高周波数に対して影響を与えるが、そうであっても、低周波数における再生音場の空間特性は上述の通り、事実上保存される。このことは図11aと図11bに示されており、それぞれ図10aと図10cに相当する。図11aと図11bは、クロストークキャンセレーションが受聴者の右耳で完全に実現されるように入力を調整された1対のラウドスピーカによって再生された剛球近傍の音場を示す。
散乱波による音場を算出するために採用された解析方法では、発生する波面は平面であると仮定された。これは2つのラウドスピーカは非常に遠くにあると仮定することに相当する。剛球の直径は18cmであり、再生音場は60×60平方の領域内、31×31点にて計算された。所望の信号は、自由音場内の例で用いられたものと同じ、主なエネルギーが3kHz以下に集中している様なハニングパルスである。図11aはラウドスピーカの見開き角度が60度、図11bは10度の場合について検討している。これらの結果を算出するために、以下に記載されるような、ディジタルフィルタ設計法が採用された。
クロストークキャンセレーションシステムをどのように算出するかを知れば、仮想音源を生成することは、原理的には簡単である。それぞれの耳におけるクロストークキャンセレーション問題は解決されたのち、2つの結果は足し合わされる。ラウドスピーカにとっては、完全なクロストークキャンセレーションをある1点で実現するよりは、仮想音源を再生するための信号を生成する方が数倍も容易である。
仮想音源イメージング問題は図8bに示される。我々は、モノポール音源が受聴空間のどこかに位置していると想像する。この音源から受聴者の耳元までの伝達関数はC₁とC₂と同様の種類であり、それらはA₁とA₂と表される。クロストークキャンセレーションの場合のように、因果性を満たすために所望の信号を正規化すると都合が良い。従って、所望の信号はD₁=DC₁A₁/A₂とD₂=DC₁で定義される。この定義において、仮想音源は右半分の平面内（x₁>0となる位置）に存在すると仮定される。クロストークキャンセレーションの場合のように、Cv=dをvについて解くことにより入力音源は算出でき、時間領域応答は逆フーリエ変換を行うことで決定される。この結果は、それぞれの入力音源はDと2つのデルタ関数の減衰列の和との畳み込みであり、片方が正、もう片方は負である。これは、音源が1つのパルスだけではなくて、2つの正のパルスを再生する必要があることを考えれば、驚くことではない。従って、v₂（t）の’負の部分’と結合されたv₁（t）の’正の部分’は受聴者の左耳にパルスを生成し、v₂（t）の’正の部分’と結合されたv₁（t）の’負の部分’は受聴者の右耳にパルスを生成する。これは図12a、12b、12cに示される。ここでθ=10の時、2つの入力音源はほとんど同じか、ほぼ正反対である。
音源入力
図12aなどは図9aなどに示されたものに相当する入力音源を示すが（ラウドスピーカの見開き角度θが60度、20度、10度の3通り）、クロストークキャンセレーションシステムに対してではなく、仮想音源イメージングシステムについてである。仮想音源は（1m、0m）の位置であり、これは受聴者からみて真っ正面から左に45度の位置を意味する。θが60度の場合（図12a）、正負両者のパルス列はv₁（t）とv₂（t）においてはっきりと見て取れる。θが20度に減少すると（図12b）、正負のパルス列は打ち消し合うようになる。これはθが10度になると（図12c）、さらにはっきりとする。この場合、2つの入力信号が比較的短い持続時間（この持続時間は仮想音源から発生したパルスがマイクロフォンに到達する時間差）を有した方形波のようになる。このように、パルス列の正と負の部分が打ち消し合うことの利点は、入力音源から低周波数の要素を十分に除去することであり、それ故に実際にはクロストークキャンセレーションシステムよりも仮想音源イメージングシステムを実現する方が容易である。
再生音場
図13a、13b、13c、13dは、図10aなどで示された再生音場の9つの’スナップショット’のもう1つのセットであるが、クロストークキャンセレーションシステムによってではなく、（1m、0m）の位置（各フレームの右下の角の位置）の仮想音源によるものである。図10aなどのように、図はラウドスピーカの見開き角度を減少させると、どのように再生音場がシンプルになっていくかを表している。その限界では、リンギングはもはや見られず、所望の信号に相当する2つのパルスのみが音場内に存在する。
図13（a）などに示されているのは、主な周波数成分が3kHz以下のハニングパルスを用いて得た結果である。これらのシミュレーションから、両耳にパルスが到達した真の時刻は、正確に仮想音源によって生成されるであろう到達時刻をシミュレートしている。バイノーラル（両耳）受聴における音像定位のメカニズムは、与えられた方向にある音源によって両耳で生成されたパルスの、到達時間差に大変依存しており、これは低周波数音源の定位を支配する手がかりであることがよく知られている。2つの近接したラウドスピーカを用いることは、これらの到達時刻差は良好に再現されていることを保証するのに非常に効果的な方法であるのは明らかである。しかし高周波数に対しては、その定位のメカニズムは2つの耳での音の強さの差により依存することが知られている（高周波数信号の包絡線のシフトがみられるが）。したがって、仮想音源イメージングを実際に実現する際には、人間の頭部によるシャドー効果や回折効果を考慮することが重要である。
式（8）に与えられる自由音場の伝達関数は音場再生を基本物理学的に解析する際に有用であるが、これらはもちろん、ラウドスピーカから受聴者の鼓膜までの正確な伝達関数の近似値でしかない。これらの伝達関数は、通常、HRTF（頭部回折伝達関数）と呼ばれる。実際のHRTFを、測定する、あるいはモデリングする方法は沢山ある。剛球は頭部付近の音場を数学的に計算することができるので、この目的にとって有用であるが、発生した音波に対する受聴者の両耳と胴体による影響を考慮しない。ダミーヘッドや人間で測定されたを用いる方法もある。これらの測定は、部屋とラウドスピーカの応答（特性）を含む場合も含まない場合もある。実際のHRTFを得ようとする際に考慮するもう1つの重要な局面は、音源から受聴者までの距離である。1m以上の距離では、音源がそれ以上に受聴者離れるように移動しても（減衰や遅延は考慮しないが）、与えらた方向のHRTFは変化しない。したがって、’遠方音場（farfield）’のある閾値以上では、単一のHRTFのみが必要となる。しかし、ラウドスピーカから受聴者までの距離が短い場合は（例えばコンピュータの前に着席している場合）、’遠方音場’のHRTFを用いるよりは、’距離にマッチングした’HRTFを用いる方がよい、と仮定することは正当である。
たとえHRTFが得られたとしても、多チャンネルシステムは実際には常に非最小位相成分を含むことを認識することは重要である。非最小位相成分を正確に補正することができないことはよく知られている。これを未熟な技術で補正しようと下結果、インパルス応答が非因果で不安定なフィルタができる。この問題を解決する1つの方法は、フィルタの振幅特性が所望の信号の振幅特性と同じになるような一組の非最小位相系フィルタを設計することである（CooperのUS Patent番号5,333,200を参照）。しかし、これらの最小位相系フィルタは所望の信号の位相特性とマッチできず、従って、再生信号の時間応答は所望の信号のそれと必然的に異なるであろう。これは、例えばハニングパルスのような、所望の波面の形状が最小位相系フィルタにより歪められることを意味する。
最小位相系を採用するのに代わり、本発明では、最小自乗近似とレギュラライゼーションを融合したマルチチャネルフィルタ設計手法（PCT/GB95/02005）を採用し、これは、周波数領域あるいは時間領域において定義される、所望の信号と耳元での再生信号との自乗誤差を最小にすることを保証する、因果で安定なディジタルフィルタを算出するものである。このフィルタ設計手法は、受聴者の両耳で再生された信号が所望の信号の波面のほぼ同じに複製されることを保証する。低周波数では、受聴者の頭部を囲む比較的大きな領域で、定位のメカニズムに大変重要である位相（到達時刻）差は正確に再生される。高周波数では、受聴者の両耳に再生されることを要求される強度差（振幅差）が正確に再生される。上述のように、フィルタを設計するとき、HRTFは高周波数にて両耳間の強度差を決定するのに特に重要であるので、受聴者のHRTFを含むことは特に重要である。
レギュラライゼーションは非正常の問題に採用される。非正常とは、所望の信号を再生するために、ラウドスピーカから大変に大きな出力が必要とされる場合（２つの近接したラウドスピーカにより低域周波数において完全なクロストークを実現しようとする場合）の問題を説明するのに用いられる。レギュラライゼーションは、事前に決定されたある周波数が、過度にブーストされないことを保証するように作用する。モデリングディレイ手段は、フィルタが多チャンネル系の最小位相成分を補正するとこができるようにするために用いられる（PCT/GB95/02005）。モデリングディレイにより、フィルタからの出力は、典型的には数ミリ秒くらいの、わずかな量だけ遅延される。
フィルタ設計手法の目的は、クロストークキャンセレーションシステムか、あるいは仮想音源イメージングシステムを実現するために用いられる実際に実現可能であるディジタルフィルタ行列を決定することである。フィルタ設計手法は、時間領域か周波数領域、あるいは、時間／周波数領域両方のハイブリッド型の方法にて実施される。与えられたモデリングディレイとレギュラライゼーションの選択により、同じ最適フィルタですべてのシステムの実現が可能となる。
時間領域フィルタ設計
時間領域でのフィルタ設計手法は、最適フィルタの係数が比較的に小さい場合に特に有効である。最適フィルタは反復法か直接法により求められる。反復法はメモリー使用の点で非常に効果的であり、ハードウェアでの実時間実現に適しているが、収束に時間がかかる。直接法では、最小自乗の観点で線形方程式を解くことにより最適フィルタを見つけることができる。この方程式は

または、Cv=dで、ここでC、v、dは以下の通りである。

ここで、

であり、c₁（n）とc₂（n）は、ラウドスピーカから受聴者の両耳までの電気音響的伝達関数のインパルス応答であり、それぞれがN_c点の係数を有する。ベクトルv₁とv₂は、ラウドスピーカの入力を表し、従って、N_vが2つのインパルス応答それぞれのフィルタのタップ数であるとき、v₁=［v₁（0）...v₁（N_v-1）］^T、v₂=[v₂（0）...v₂（N_v）-1）］^Tとなる。同様に、d₁とd₂は受聴者の両耳で再生されるはずの信号を表し、これは、d₁=［d₁（0）...d₁（N_c+N_v-2）］^T、d₂=［d₂（0）...d₂（N_c+N_v-2）］^Tとなる。モデリングディレイは、右半分dを同量のmサンプルで作る、2つのインパルス応答のそれぞれを遅らせることを含む。最適フィルタvは、
v=［C^TC+βI］^-1・C^Td,
で与えられ、ここでβはレギュラライゼーションパラメータである。
フィルタ長の長いFIRフィルタは低周波数において十分なクロストークキャンセレーションを達成するために必要であり、この方法は、仮想音源イメージングシステムのためのフィルタを設計するにより適している。しかし、もし、低周波数をブーストするために、単一点IIRフィルタが含まれていると、クロストークキャンセレーションシステムを設計するためには、時間領域でのフィルタ設計法を採用することがより現実的である。IIRフィルタは所望の信号を修正ためにも用いることが可能で、最適フィルタがある特定の周波数を過度にブーストしてしまうことを防ぐ働きもする。
周波数領域フィルタ設計法
時間領域での設計法に代わるものとして、‘速い逆処理’と呼ばれる周波数領域での方法がある（PCT/GB95/02005）。これは非常に速く、実現が容易であるが、最適フィルタの係数が大きい時にのみ良好な働きをする。実際の実現方法は簡単である。周波数の離散的な多くの点で方程式CV=Dを解くことにより、周波数応答V₁とV₂を計算するのが基本的な考え方である。ここで、Cは電気音響的な伝達関数の周波数応答

を含んだ、複合行列であり、VとDは、それぞれがラウドスピーカ入力の周波数応答と所望の信号を含んだ、V=［V₁ V₂］^TとD=［D₁ D₂］^Tとなる複合行列である。FFTは周波数領域に入ったりでたりするために用いられ、V₁とV₂の逆FFTの“円状シフト”は、モデリングディレイを行うために用いられる。FFTがV₁とV₂の周波数応答をN_v点でサンプルする際に用いられるとき、これらの周波数におけるそれらの値は、

で与えられ、ここで、βはレギュラライゼーションパラメータ、Hは元の行列を転置し、その共役をとることを表す記号で、kはk’番目の周波数に相当する；これは複素数
exp（j2πk/N_v）
に相当する周波数を意味する。
与えられたβの値に対して、最適フィルタv₁（t）とv₂（t）のインパルス応答を算出するためには、以下の手順が必要となる。
1. インパルス応答c₁（n）、c₂（n）、d₁（n）、d₂（n）をNvポイントでFFTを行うことで、C（k）とD（k）を計算する。
2. それぞれのkにおけるNvの値について、上記の方程式からV（k）を計算する
3. V（k）の要素のNv点の逆FFTを行い、v（n）を計算する。
4. v（n）の個々の要素をmだけ円状シフトし、モデリングディレイを実行する。例えば、もしv1（k）の逆FFTが｛3，2，1，0，0，0，0，1｝であれば、3点の円状シフトを実行した後は｛0，0，1，3，2，1，0，0｝である。
mの正確な値は重要ではない；Nv/2の値はほんの少しの場合を除いて、良好に働くようである。レギュラライゼーションパラメータβを適当な値に設定することは必要であるが、βの正確な値はいつも重要ではなく、何度か‘トライ＆ゴウ’を繰り返すことで決定することができる。
関連するフィルタ設計手法は、特異値分解（singular value decomposition）法（SVD）を用いている。これは非正常（悪性の）逆処理問題の解に用いられることがよく知られており、個々の周波数ことに採用することが可能である。
速い逆処理アルゴリズムはそれぞれの周波数に対してレギュラライゼーションを採用するので、レギュラライゼーションパラメータを周波数の関数として明確に示すことは容易である。
時間／周波数領域ハイブリッド型フィルタ設計
速い逆処理アルゴリズムは、実際には任意の多くの点の離散的な周波数において、最適フィルタの周波数応答を算出するので、最適フィルタの周波数応答を連続な周波数として扱うことが可能である。時間領域手法はこの周波数応答を近似するのに用いられる。これは周波数に依存するリークを短い最適フィルタマトリックスに取り入れることができるという利点がある。
フィルタの特性
ラウドスピーカが近接した場合に、確かな仮想のイメージを生成するために、2つのラウドスピーカの入力は注意深く揃えられなければならない。図12で示したように、2つの入力はほとんど同じか、あるいは反対である；それらの間の時間差は通常大変小さなものであり、これは受聴者の耳へ音が到達する到達時刻は正確であることを保証する。受聴者の頭部が実際のHRTFを用いることでモデル化されている場合においてさえも、これらのことは仮想音源の音像位置の範囲に対しても同様であることを以下に示す。
図14ー20は、ラウドスピーカの2つの入力v₁とv₂を、ラウドスピーカの見開き角度θと音像の位置の組み合わせが6通りに異なった場合について比較したものである。これらの組み合わせば以下の通りである。ラウドスピーカ見開き角10度の場合において音像の位置が、a）15度、b）30度、c）45度、d）60度である。音像位置が45度の場合において、ラウドスピーカの見開き角が、e）20度、f）60度の組み合わせである。この情報はそれぞれの図においても示されている。仮想音源の位置は、真っ正面に対して反時計回りで測定され、つまりこれはすべての音像は受聴者に対して左前方に存在し、ラウドスピーカの見開き角度の外側にあることを意味する。15度の位置の音像は前方にある音像と最も近く、60度の位置の音像は左側方に向かって最も遠方である。図14ー20に示されたすべての結果は、MITのメディア研究室にて、KEMARダミーヘッドを用いて測定され提供されている頭部回折伝達関数のデータベース用いて算出された。時間領域におけるすべての数列は、サンプリング周波数44.1kHzで、すべての周波数応答は周波数帯域0Hzから10kHzまでの線形のx軸にて表示されている。
図14はインパルス応答v₁（n）とv₂（n）である。それぞれのインパルス応答は128点のであり、それらは時間領域にて直接法で算出された。帯域が大変広いので、高周波数において応答の構造を見ることは困難であるが、しかしそれでもv₁（n）は主に正であり、v₂（n）は負である。
図15はリニアスケールにおいて、図14で示されたインパノレス応答の周波数応答V₁（f）とV₂（f）の振幅特性を示す。10度と20度のラウドスピーカの見開きに対して2つの振幅特性は類似している。低周波数に対して、この両ラウドスピーカからは比較的に大きな出力を要求されるが、およそ2kHzまでの周波数でその応答は滑らかに減少していることが見てとれる。2Khzから4kHzの間では、応答は滑らかで比較的平坦である。60度の見開きに対しては、1番のラウドスピーカが全体の周波数帯域において支配的である。
図16は、リニアスケールにおいて、図15で示された周波数応答の振幅間の比を示している。ラウドスピーカの見開きが10度の場合、2つの振幅差は10kHz以下のほとんどの周波数で2以下である。2つのラウドスピーカの入力が低周波数において適度にブーストされている場合でさえ、2つの応答の比は2kHz以下で特に滑らかである。
図17は、図15の周波数特性のアンラップ（unwrapped）位相特性である。共通の遅延に相当する位相の特徴は、6対のそれぞれ（サンプリング間隔における6つの遅延は、a）31、b）29，c）28，d）27，e）29，f）33である）から取り去られている。この目的は、応答をできる限り平坦にすることであり、そうでなければ位相応答は、大きな負の傾斜を有することになり、これはプロットにおいて詳細を検討することを不可能にする。ラウドスピーカの見開き20度と60度に相当する位相応答は（図ｆ中、y軸上）、はっきりと異なった傾斜を有するにもかかわらす、見開き10度では2つの位相応答はほとんど平坦であることがわかる。
図18は図17で示された位相応答間の差を示している。ラウドスピーカの見開き10度において、差はπから0までの間である。これは角度θが10度のラウドスピーカの場合、10kHz以下のいかなる周波数においても2つのラウドスピーカの入力は同位相ではないことを意味している。8kHz以下の周波数では、2つのラウドスピーカの入力の位相差は十分であり、その絶対値は常にπ/4（45度と等しい）より大きい。100HZ以下では、2つの入力は逆位相に非常に近い。2KHZ以下では、位相差は-πラジアンから-π+1ラジアン（-180度から-120度までと等しい）の間であり、4kHz以下では、位相差は-πラジアンから-π+π/2ラジアン（-180度から-90度までと等しい）の間である。これはラウドスピーカの見開きが20度と60度の場合ではない。これは仮想音源の音像をラウドスピーカの見開き角度の外側に生成するためには、ステレオダイポールへの入力は十分な周波数帯域においてほとんど、でも完全にではないが、逆位相でなければならない。上述したように、もし2つのラウドスピーカの周波数特性が十分に同じであれば、ラウドスピーカの振動間の位相差はラウドスピーカへの入力の位相差と十分に等しいであろう。
もちろん、2つの等しい入力信号がそれぞれのラウドスピーカに与えられた場合、2つのラウドスピーカは十分に同位相で振動することも言及しておく。
自由音場における解析によって、2つのラウドスピーカの入力が“同位相”となる最小の周波数は、“リンギング”周波数である。上述したように、3つのラウドスピーカの見開き角度10度、20度、60度に対して、リンギング周波数はそれぞれ1.8kHz、5.4kHz、10.8kHzであり、図18において最初の零点交差が生じる周波数とよく一致している。0Hzにおいて2つのラウドスピーカの入力は常に正確に逆位相である。また、人間の定位のメカニズムが高周波数において時間差に対してセンシティブでないとしても、位相応答の正確な一致は高周波数においても重要である。これは、それによって受聴者の両耳において再生された信号の振幅は正確であることを保証する2つのラウドスピーカの、それぞれから放射されている音の干渉が原因である。いくつかの応用に対しては、制限された周波数帯域内において、2つのラウドスピーカの入力が強制的に同位相になるようにすることが望ましいであろう。例えば、これは低周波数の緩やかなブーストを防ぐためか（類似の技術は、ビニールレコードのためにマスターを切断するときに、非常に低周波数を強制的に同位相にするために用いられた）、あるいは、“スウィートスポット”は非常に狭い領域に限られているが、非常に高周波数において再生された音の色付けを防ぐために実現された。ある周波数帯域において、位相応答が正確にマッチングされていない場合、仮想音源のみかけの像は、例えば1/3オクターブバンドの雑音のような、その帯域内に特にエネルギーが集中している信号によって乱される。しかしながら、過渡音の特性を有した信号に対して、みかけの像は、十分な周波数帯域において位相応答が正確にマッチングしている限りは、また良好に動作する。
ここで記載された位相特性差は、類似したラウドスピーカの振動の差を引き起こす。したがって、例えば低周波数において、ラウドスピーカの振動は180度逆位相に近くなる（例えばラウドスピーカの見開き角度を10度としたときは2kHzである。）
図19は、所望の波面が、周波数帯域がおよそ3kHzのハニングパスルであるときのv₁（n）とv₂（n）を示す（図12と13に示された自由音場における解析と同様に）。v₂（n）はv₁（n）とどのように類似しているかを見るために逆処理される。受聴者の両耳に音が到達する到達時間が正確であることを保証する2つのパルス間の差は非常に小さい。ここで図12において示された結果と図19で示された結果はよく一致している（図19cは図12cに、19eは12bに、19fは12aに相当する）。
図20は図19にプロットされたインパルス応答間の差を示す。V2（n）は図19では逆処理されているので、この差はv₁（n）とv₂（n）の和の差異である。ラウドスピーカの見開きが10度の場合、和の信号のほとんどに寄与する2つのパルスのオンセットは大変に小さい。
2つの近接したラウドスピーカを用いてクロストークキャンセレーションシステムを実現するために、位相と振幅において、よくマッチされたフィルタを用いることは重要である。ラウドスピーカが近づくように移動するにつれて、ダイレクト経路とクロストーク経路はより類似するので、ラウドスピーカが比較的離れた場合よりも近接した場合にはより多くの抑圧されなければならないクロストークが存在する。
大変に正確なクロストークキャンセレーションフィルタを明確にすることの重要性は周波数領域での手法を用いて算出されたフィルタセットの特性を考慮することによって示される。それぞれ128点の係数で構成されたフィルタと頭部回折伝達関数はMITのデータベースから供給される。Hの対角要素はh₁であり、非対角要素はh₂である。
図21は2つのフィルタH₁（f）とH₂（f）の振幅と位相特性を示す。図21aは、それらの振幅特性であり、図21bは2つの差異である（224点のもので遅延を取り除いた後の）位相特性であり、図21dはそれらの差異である。H₁（f）とH₂（f）のダイナミックレンジはほぼ35dBであるが、それらの差異は非常に小さい（8kHz以下の周波数で5dB以内である）。見開き角度10度のラウドスピーカを用いた仮想音源イメージングでは、2つのフィルタは10kHz以下のいかなる周波数においても同位相ではなく、8kHz以下の周波数では、位相差の絶対値はpi/4ラジアン（45度に相当する）より常に大きい。
図22は2つのフィルタのハニングパルス応答（a）とそれらの和（b）である。2つのインパルス応答は正確に一致するか正反対であることに非常に近い。したがって、もしH₁（f）とH₂（f）がそれらの仕様書によって実現されなければ、実際このシステムのパフォーマンスは劣化するようになる。
ステレオダイポールへの2つの入力は正確にマッチしていることが重要であるという意味で、ステレオダイポールが受聴者の頭部移動に対してどのようにロバストであるかということは顕著に優れた点である。これは図23と24に示されている。受聴者の頭部が左に5cm移動した場合（図23）と、右に5cm移動した場合（図24）での、左耳に再生された信号（ω₁（n）、実線、左の列）と右耳の信号（ω₂（n）、実線、右の列）は所望の信号d₁（n）とd₂（n）と比較された。所望の波面は主なエネルギーが3kHz以下に集中しているハニングパルスであり、仮想音像は、真っ正面から45度の位置である。頭部回折伝達関数はMITのデータベースから得られ、ラウドスピーカへの入力は図19cにプロットされたものと同一である（v₂（n）はこの図では逆処理されている）。
図23は、受聴者頭部が5cm左（仮想音像の方に、図5を参照）に移動したした場合の、受聴者の両耳で再生された信号である。図より、見開き60度のラウドスピーカによって受聴者の両耳にて再生された信号は所望の信号と完全に一致してはいないが、見開き10度のラウドスピーカによるシステムのパフォーマンスは顕著な影響を受けていない。
図24は、受聴者頭部が5cm右（仮想音像から遠ざかる方に）に移動したした場合に、受聴者の両耳で再生された信号である。これは仮想音源が左のラウドスピーカにほぼ近接しているにもかかわらず、見開き60度のラウドスピーカ配置によるパフォーマンスに深刻な劣化を引き起こす。しかしながら見開き10度のラウドスピーカ配置には頭部移動による顕著な影響は見られない。
ステレオダイポールは5チャンネル録音音源を伝送するのに用いることも可能である。したがって、およそ近似的に設計されたフィルタ受聴者の前方と後方の両方に仮想のラウドスピーカを配置するのに用いられる。このような仮想のラウドスピーカは通常、5チャンネル録音の音源を伝送するのに用いられる実際のラウドスピーカと同等であろう。
受聴者の後方に正確な仮想音像を再生できることが重要であるとき、第2のステレオダイポールを受聴者の真後ろに設置することができる。第2の後方ダイポールは、例えば2つのサラウンド後方スピーカを実現するために用いられる。また1つのラウドスピーカの上にもう1つを設置した2つの近接したラウドスピーカは、水平面の外側に知覚される仮想音像の音質を改良することが考えられる。複数のステレオダイポールを結合することは、全3次元のサラウンド音を実現することに用いられるであろう。
いくつかのステレオダイポールが、数人の受聴者に対して用いらる場合、ステレオダイポール間のクロストークは、上述された種類のディジタルフィルタ設計手法を用いることで修正されることができる。このようなシステムは、例えば、車室内のエンターテイメントシステムやテレビ会議システムなどに用いられる。
引き続いて近接した1対のラウドスピーカを通して再生されるための録音物は、本発明によるフィルタからの出力信号を録音することにより製作される。図１（a）によれば、例えば、出力信号v₁とv₂は録音され、この録音物は引き続いて個人の再生機で近接した1対のラウドスピーカを通して再生される。
ここで用いられたように、用語‘ステレオダイポール‘は本発明を叙述するために用いられ、‘モノポール‘とは、空間内の1点においてその体積速度を変動させる理想的な音源を叙述するのに用いられ、‘ダイポール‘は、媒質に与えられる力を変動させる理想的な音源を叙述するために用いられる。
本発明によるディジタルフィルタを用いることによって、オーディオ信号を大変に正確に複製することが望ましいが、技術に熟知したものにとっては、ここで明らかにされたディジタルフィルタの特性を近似するアナログフィルタを実現することが可能であるべきである。
したがって、ここで明らかにされたが、ディジタルフィルタの代わりにアナログフィルタを用いることは可能であると考えられるし、このような代用によって、複製の精度は劣化することが考えられる。
単一の音のチャンネル入力にしろ2つ以上のラウドスピーカが用いられることもある（図8（a）、図8（b）を参照）。
ここまででは記述されていないが、従来の動電型ラウドスピーカ（moving coil loudspeaker）の代わりに、トランスデューサー手段を用いることも可能である。例えば、特にコンパクト化の目的で特に小さなトランスデューサーが要求される場合は、ピエゾエレクトリック、またはピエゾセラミックのアクチュエータを使用することも可能である。
要求され、可能であれば、ここに記述されたいかなる形態（特徴）や配置は，他の形態（特徴）や配置に加えられ、あるいは置き換えられる。

Claims

ラウドスピーカ手段と、少なくとも１つの音響チャンネルからの信号に応答してラウドスピーカを駆動するためのラウドスピーカドライブ手段とを含み、ラウドスピーカ手段が、１対の近接して配置されたラウドスピーカ対を含み、ラウドスピーカドライブ手段が、フィルタ手段を含み、フィルタ手段が、少なくとも１対のフィルタを含み、フィルタ対のうちの一方のフィルタの出力が、ラウドスピーカ対のうちの一方のラウドスピーカに与えられ、フィルタ対のもう一方のフィルタの出力が、ラウドスピーカ対のもう一方のラウドスピーカに与えられ、フィルタ手段の特性が、ラウドスピーカ対の見開き角度よりかなり大きな、予め定める受聴者位置に対する見開き角度の仮想音源位置で、音響チャンネルに関連する音源の仮想イメージを生成するように選択される音場再生システムであって、ラウドスピーカ対が、受聴者位置に対する見開き角度を６度から２０度の範囲に定め、フィルタ対の出力が、２つのラウドスピーカの振動の位相差を引き起こし、位相差は、両振動が実質的に一致しない低周波数から両振動が一致する高周波数の周波数で変化し、両振動が一致する最低周波数が、下記の式（１）により定義されるリンギング周波数ｆ₀によりほぼ決定され、

ただし、

であり、
r₂及びr₁：一方のラウドスピーカの中心から受聴者位置にいる受聴者のそれぞれの耳までの距離
ｃ₀：音速
リンギング周波数ｆ₀が少なくとも５．４ｋＨｚであり、
上記フィルタ手段が低周波における上記ラウドスピーカの出力が制限されるように設計されている、音場再生システム。
見開き角度が８度から１２度の範囲である請求項１記載の音場再生システム。
見開き角度が約１０度である請求項２に記載の音場再生システム。
受聴者の頭部が予め定める受聴者位置から側方に１０ｃｍ移動した場合でも、およそ４ｋＨｚまで受聴者の両耳の周りの領域で仮想音源に対応する所望の信号の再生が十分であるように、フィルタ手段が調整された請求項３に記載の音場再生システム。
位相不一致の周波数帯域が１００Ｈｚから４ｋＨｚの範囲である請求項１に記載の音場再生システム。
それぞれのラウドスピーカに同一の入力信号が与えられた場合に、２つのラウドスピーカが実質的に同位相で振動する請求項１ないし５の何れかに記載の音場再生システム。
周波数帯域１００Ｈｚから４ｋＨｚの範囲では２つのラウドスピーカの入力信号が同位相になることがない請求項６に記載の音場再生システム。
フィルタ手段が最小自乗平均近似を採用することで設計される請求項１ないし７の何れかに記載の音場再生システム。
受聴者の両耳に再生された信号が所望の信号の波面の複製となるように、耳元での所望の信号と再生された信号との自乗誤差を最小にする請求項８に記載の音場再生システム。
フィルタ手段が頭部回折伝達関数（ＨＲＴＦ）手段を備える請求項１ないし９の何れかに記載の音場再生システム。
頭部回折伝達関数がフィルタ行列を用いて表現される請求項１０に記載の音場再生システム。
予め定める信号周波数のブーストを制限する処理を行うためのレギュラライゼーション手段を備える請求項１ないし１１の何れかに記載の音場再生システム。
モデリングディレイ手段を備える請求項１ないし１２の何れかに記載の音場再生システム。
ラウドスピーカの中心間の距離が約４５ｃｍを超えない請求項１ないし１３の何れかに記載の音場再生システム。
受聴に際して受聴者の頭部の最適な位置が前記ラウドスピーカから０．２ｍ〜４．０ｍの間である請求項１ないし１４の何れかに記載の音場再生システム。
前記頭部位置が前記ラウドスピーカから０．２ｍ〜１．０ｍである請求項１５に記載の音場再生システム。
前記頭部位置が前記ラウドスピーカから約２．０ｍである請求項１５に記載の音場再生システム。
ラウドスピーカの中心が互いにほぼ並列に並んでいる請求項１ないし１７の何れかに記載の音場再生システム。
ラウドスピーカの中心の軸が１点に集中するように互いに向き合っている請求項１ないし１８の何れかに記載の音場再生システム。
ラウドスピーカが単一のキャビネットに収納されている請求項１ないし１９の何れかに記載の音場再生システム。
フィルタ手段が２対のフィルタを含み、それぞれが２チャンネルステレオ録音の片チャンネルを処理する請求項１ないし２０の何れかに記載の音場再生システム。
ラウドスピーカドライブ手段が、従来の収音チャンネルに対応している請求項１ないし２１の何れかに記載の音場再生システム。
請求項１ないし２２の何れかに従って、音場再生システムのラウドスピーカドライブ手段に使用できるように構成されたフィルタ手段。
ステレオアンプを用い、予め定める受聴者位置に対する見開き角度が６度から２０度の範囲に定められた１対の近接したラウドスピーカを通して再生される録音する方法であって、音響信号から前記録音をするために、受聴者が居るとされる位置において実質的に２０度よりも大きい見開き角度のラウドスピーカ対を通してステレオアンプを用いて再生するのに適したフィルタ手段を採用することにより、仮想音源を生成するために、ラウドスピーカへの入力において仮想のイメージングフィルタ手段を設ける必要を回避し、前記録音をするために採用されたフィルタ手段が、請求項２３に記載のフィルタ手段と同様の特徴を有する録音をする方法。