JP2012147475A

JP2012147475A - 音識別方法および装置

Info

Publication number: JP2012147475A
Application number: JP2012073301A
Authority: JP
Inventors: William R Short; ウィリアム・アール・ショート
Original assignee: Bose Corp
Current assignee: Bose Corp
Priority date: 2007-06-21
Filing date: 2012-03-28
Publication date: 2012-08-02
Anticipated expiration: 2028-05-19
Also published as: JP2010530718A; WO2008156941A1; US20080317260A1; CN101682809A; EP2158788A1; US20140294197A1; US8767975B2; CN101682809B; JP5654513B2; JP4965707B2

Abstract

【課題】音識別システムを提供する。
【解決手段】音源を識別する方法は、音響波の特性にそれぞれ応答する少なくとも2つの変換器によって収集されるデータを、それぞれの変換器ロケーションについて信号に変換するステップを含む。変換器は、約70mmより小さいかまたは約90mmより大きい距離だけ分離する。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。それぞれの帯域について、変換器ロケーションについて信号のマグニチュードの関係についての比較が、閾値を用いて行われる。周波数帯域のマグニチュード関係が閾値の一方の側に入る周波数帯域と、周波数帯域のマグニチュード関係が閾値の他方の側に入る周波数帯域との間に相対的な利得変化がもたらされる。したがって、音源は、変換器からの距離に基づいて互いから識別される。
【選択図】図７

Description

本発明は、一般に、音響学の分野に関し、特に、音ピックアップ(pick-up)および再生に関する。より具体的には、本発明は、音識別方法および装置に関する。

通常のライブ音楽コンサートでは、複数のマイクロフォン(音響ピックアップデバイス)が、機器およびボーカリストのそれぞれの近くに位置決めされる。マイクロフォンからの電気信号は、大きな演奏空間において音楽家が聴衆によって明瞭に聞き取られるように、ミキシングされ、増幅され、ラウドスピーカによって再生される。

従来のマイクロフォンに関する問題は、従来のマイクロフォンが、所望の機器または音声だけでなく、近くの他の機器および/または音声にも応答することである。例えば、ドラムキットの音が、リードシンガーのマイクロフォン内に放出される場合、再生音は悪い影響を受ける。この問題は、音楽家がスタジオで自分の音楽をレコーディングしているときにも起こる。

従来のマイクロフォンはまた、音楽家によってステージ上で使用されるモニタラウドスピーカ、および、増幅された音を聴衆に分配するハウスラウドスピーカに応答する。結果として、演奏を台なしにするハウリングを音楽増幅システムが突然起こし始めるフィードバックを回避するために、利得が注意深く監視されなければならない。これは、ライブの増幅演奏において特に問題となる。それは、マイクロフォンによってピックアップされるラウドスピーカからの信号量が、音楽家がステージ上でどのように動き回るか、または、音楽家が演奏しているときにマイクロフォンをどのように動かすかに応じて、幅広く変動し得るからである。リハーサル中にフィードバックがないように注意深く調整された増幅システムが、音楽家がステージ上で動いたというだけで、演奏中に突然ハウリングを起こす可能性がある。

1つのタイプの音響ピックアップデバイスは、無指向性マイクロフォンである。無指向性マイクロフォンは、フィードバックをより受けやすい傾向があるため、ライブ音楽にはめったに使用されない。より一般的には、指向性受容パターンを有する従来のマイクロフォン(例えば、カージオイドマイクロフォン)は、他の機器または音声あるいはスピーカから出力されるオフアクシス音を排除するために使用され、そのため、システムがハウリングを起こす傾向が低減される。しかし、これらのマイクロフォンは、問題を完全に解決するのには不十分な排除を有する。

指向性マイクロフォンは、一般に、音源からの距離と共に変動する周波数応答を有する。これは、圧力勾配応答マイクロフォンの特徴を示す。この効果は、「近接効果(proximity effect)」と呼ばれ、音源の近くにあるときバスブーストを、音源から遠くにあるときバスの喪失をもたらす。近接効果を好む演奏者は、効果を生成し、また、増幅音のレベルを変えるために、演奏中、マイクロフォンと機器(または音声)との間の距離を変動させることが多い。このプロセスは、「マイクロフォンをうまく働かせること(working the mike)」と呼ばれる。

一部の演奏者は近接効果を好むが、他の演奏者は、マイクロフォンが音を受容する角度および距離の範囲にわって、改良型音再生システムの周波数応答が、できる限り一様のままであるべきであることを好む。これらの演奏者の場合、機器の音色は、マイクロフォンの近くに、または、マイクロフォンから遠くに音楽家が移動するときに変わるべきでない。

携帯電話、一般電話、およびスピーカフォンは、多量の背景ノイズが存在するときに性能問題を有し得る。こうした状況では、所望のスピーカ音声の明瞭さは、このノイズによって低下するか、または、圧倒される。これらの電話が、所望のスピーカと背景ノイズを識別することができることが望ましいことになる。そして、電話は、ノイズに対してスピーカ音声の相対的な強調を提供することになる。

本発明は、先に述べた問題の1つまたは複数を克服することを対象とする。

簡潔に要約すると、本発明の1つの態様によれば、音源を識別する方法は、音響波の特性にそれぞれ応答する少なくとも2つの変換器によって収集されるデータを、それぞれの変換器ロケーションについて信号に変換することを含む。変換器は、約70mmより小さいかまたは約90mmより大きい距離だけ分離する。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。それぞれの帯域について、変換器ロケーションについて信号のマグニチュードの関係が、第1閾値を用いて比較される。周波数帯域であって、周波数帯域のマグニチュード関係が閾値の一方の側に入る、周波数帯域と、周波数帯域であって、周波数帯域のマグニチュード関係が閾値の他方の側に入る、周波数帯域との間に相対的な利得変化がもたらされる。したがって、音源は、変換器からの距離に基づいて互いから識別される。

本発明のさらなる特徴は、(a)時間領域から周波数領域へ信号を変換するために高速フーリエ変換を使用すること、(b)信号の比のマグニチュードを比較すること、(c)周波数帯域であって、周波数帯域のマグニチュード比較結果が閾値の一方の側に入る、周波数帯域が、約1の利得を受取るようにさせること、(d)周波数帯域であって、周波数帯域のマグニチュード比較結果が閾値の他方の側に入る、周波数帯域が、約0の利得を受取るようにさせること、(e)それぞれの変換器が無指向性マイクロフォンであること、(f)周波数帯域を出力信号に変換すること、(g)音を生成する1つまたは複数の音響ドライバを駆動するために出力信号を使用すること、(h)ユーザが変換器の距離感度を調整できるように、ユーザ可変閾値を設けること、または、(i)特性は、局所的音圧、局所的音圧の1次勾配、高次勾配、および/またはその組合せであることを含む。

別の特徴は、第1閾値と異なる第2閾値を設けることを含む。もたらすステップは、周波数帯域であって、周波数帯域のマグニチュード比較結果が閾値間の第1の範囲内に入る、周波数帯域と、周波数帯域であって、周波数帯域のマグニチュード比較結果が閾値の外側に入る、周波数帯域との間に相対的利得変化をもたらす。

なおさらなる特徴は、第1の範囲と異なり、かつ、第1の範囲にオーバラップしない第2の範囲を規定する第3閾値および第4閾値を設けることを含む。もたらすステップは、周波数帯域であって、周波数帯域のマグニチュード比較結果が第1または第2の範囲内に入る、周波数帯域と、周波数帯域であって、周波数帯域のマグニチュード比較結果が第1および第2の範囲の外側に入る、周波数帯域との間に相対的利得変化をもたらす。

さらなる特徴は、(a)変換器が少なくとも約250ミクロンの距離だけ分離すること、(b)変換器が約20mmと約50mmとの間の距離だけ分離すること、(c)変換器が約25mmと約45mmとの間の距離だけ分離すること、(d)変換器が約35mmの距離だけ分離すること、および/または、(e)変換器間の距離が、それぞれの変換器についての振動板の中心から測定されることを要求する。

他の特徴は、(a)もたらすステップは、低利得と高利得との間で相対的利得変化をフェードすること、(b)相対的利得変化のフェードは、第1閾値の前後で行われること、(c)相対的利得変化のフェードは、変換器の1つまたは複数の出力信号についてあるマグニチュードレベルの前後で行われること、および/または、(d)相対的利得変化をもたらすことは、(1)マグニチュード関係に基づく利得項および(2)変換器の1つまたは複数からの出力信号のマグニチュードに基づく利得項によって起こることを含む。

なおさらなる特徴は、(a)周波数帯域の第1群について導出される利得項の群はまた、周波数帯域の第2群に適用されること、(b)第1群の周波数帯域は、第2群の周波数帯域より低いこと、(c)周波数帯域の第1群について導出される利得項の群はまた、周波数帯域の第3群に適用されること、および/または、(d)第1群の周波数帯域は、第3群の周波数帯域より低いことを含む。

さらなる特徴は、(a)音響波は圧縮性流体中を進行すること、(b)圧縮性流体は空気であること、(c)音響波は実質的に非圧縮性流体中を進行すること、(d)実質的に非圧縮性流体は水であること、(e)もたらすステップは、2つの変換器の1つの変換器だけから信号に対する相対的利得変化をもたらすこと、(f)特定の周波数帯域は、その周波数帯域についての利得がどれほど速く変化し得るかに限界があること、および/または、(g)利得がどれほど速く増加するかについての第1の限界、および、利得がどれほど速く減少するかについての第2の限界が存在し、第1の限界および第2の限界は異なることを要求する。

別の態様によれば、音源を識別する方法は、音響波の特性に応答する変換器によって収集されるデータを、それぞれの変換器ロケーションについて信号に変換することを含む。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。それぞれの帯域について、ロケーションについて信号のマグニチュードの関係が確定される。それぞれの帯域について、信号から、音響波が第1変換器によって検出されるときと、この波が第2変換器によって検出されるときとの間の時間遅延が確定される。周波数帯域であって、周波数帯域のマグニチュード関係および時間遅延が、マグニチュード関係および時間遅延の各閾値の一方の側に入る、周波数帯域と、周波数帯域であって、周波数帯域の(a)マグニチュード関係が、マグニチュード関係の閾値の他方の側に入るか、周波数帯域の(b)時間遅延が、時間遅延の閾値の他方の側に入るか、または、周波数帯域の(c)マグニチュード関係および時間遅延が共に、マグニチュード関係および時間遅延の各閾値の他方の側に入る、周波数帯域との間に相対的な利得変化がもたらされる。

さらなる特徴は、(a)マグニチュード関係について調整可能な閾値を設けること、(b)時間遅延について調整可能な閾値を設けること、(c)マグニチュード関係閾値の前後で相対的利得変化をフェードすること、(d)時間遅延閾値の前後で相対的利得変化をフェードすること、(e)相対的利得変化をもたらすことは、(1)マグニチュード関係に基づく利得項および(2)時間遅延に基づく利得項によって起こること、(f)相対的利得変化をもたらすことは、変換器の1つまたは複数からの出力信号のマグニチュードに基づく利得項によってさらに起こること、および/または、(g)それぞれの周波数帯域について、マグニチュード関係用の割当てられた閾値および時間遅延用の割当てられた閾値が存在することを含む。

なおさらなる態様は、音源を識別する方法を含む。音響波の特性にそれぞれ応答する少なくとも3つの無指向性マイクロフォンによって収集されるデータが取り込まれる。データが処理されて、(1)どのデータが、マイクロフォンからある距離より近くに位置する1つまたは複数の音源を表すか、また、(2)どのデータが、マイクロフォンからある距離より遠くに位置する1つまたは複数の音源を表すかが確定される。処理ステップの結果が利用されて、上記(1)または(2)の他方の音源(複数可)を表すデータに対して、上記(1)または(2)の一方の音源(複数可)を表すデータの大きな強調が提供される。したがって、音源は、マイクロフォンからの距離に基づいて互いから識別される。

さらなる特徴は、(a)利用するステップが、(2)の音源(複数可)を表すデータに対して、(1)の音源(複数可)を表すデータの大きな強調を提供すること、(b)利用するステップ後に、データが出力信号に変換されること、(c)第1マイクロフォンが、第2マイクロフォンから第1距離にあり、第3マイクロフォンから第2距離にあり、第1距離は第2距離より小さいこと、(d)処理ステップが、第2マイクロフォンから高周波数を、第3マイクロフォンから高周波数より低い低周波数を選択すること、(e)低周波数および高周波数が、処理ステップにおいて結合されること、および/または、(f)処理ステップが、(1)マイクロフォン1および2からのデータから位相関係を、(2)マイクロフォン1および3からのデータからマグニチュード関係を確定することを含む。

別の態様によれば、個人通信デバイスは、音響波の特性に応答して、特性を表すデータを取り込む2つの変換器を含む。変換器は、約70mm以下の距離だけ分離する。データを処理する信号プロセッサは、(1)どのデータが、変換器からある距離より近くに位置する1つまたは複数の音源を表すか、また、(2)どのデータが、変換器からある距離より遠くに位置する1つまたは複数の音源を表すかを確定する。信号プロセッサは、上記(1)または(2)の他方の音源(複数可)を表すデータに対して、上記(1)または(2)の一方の音源(複数可)を表すデータの大きな強調を提供する。したがって、音源が、変換器からの距離に基づいて互いから識別される。

さらなる特徴は、(a)信号プロセッサがデータを出力信号に変換すること、(b)出力信号が、デバイスから遠隔の第2音響ドライバを駆動して、デバイスから遠隔の音を生成するために使用されること、(c)変換器が、少なくとも約250ミクロンの距離だけ分離すること、(d)デバイスが携帯電話であること、および/または、(e)デバイスがスピーカフォンであることを要求する。

なおさらなる態様は、マイクロフォンシステムが、シリコンチップ、および、音響波の特性に応答して、特性を表すデータを取り込む、チップに固定された2つの変換器を有することを要求する。変換器は、約70mm以下の距離だけ分離する。信号プロセッサであって、データを処理して、(1)どのデータが、変換器からある距離より近くに位置する1つまたは複数の音源を表すか、また、(2)どのデータが、変換器からある距離より遠くに位置する1つまたは複数の音源を表すかを確定する、信号プロセッサが、チップに固定される。信号プロセッサは、上記(1)または(2)の他方の音源(複数可)を表すデータに対して、上記(1)または(2)の一方の音源(複数可)を表すデータの大きな強調を提供し、それにより、音源は、変換器からの距離に基づいて互いから識別される。

別の態様は、音源を識別する方法を要求する。音響波の特性に応答する変換器によって収集されるデータは、それぞれの変換器ロケーションについて信号に変換される。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。信号のマグニチュードの関係は、ロケーションについてそれぞれの帯域について確定される。それぞれの帯域について、音響波が第1変換器によって検出されるときを指示する信号およびこの波が第2変換器によって検出されるときを指示する信号から位相のずれが確定される。周波数帯域であって、周波数帯域のマグニチュード関係および位相のずれが、マグニチュード関係および位相のずれの各閾値の一方の側に入る、周波数帯域と、周波数帯域であって、周波数帯域の(1)マグニチュード関係が、マグニチュード関係の閾値の他方の側に入るか、周波数帯域の(2)位相のずれが、位相のずれの閾値の他方の側に入るか、または、周波数帯域の(3)マグニチュード関係および位相のずれが共に、マグニチュード関係および位相のずれの各閾値の他方の側に入る、周波数帯域との間に相対的な利得変化がもたらされる。

さらなる特徴は、位相のずれについて調整可能な閾値を設けることを要求する。

さらなる態様によれば、音源を識別する方法は、音響波の特性に応答する変換器によって収集されるデータを、それぞれの変換器ロケーションについて信号に変換することを含む。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。それぞれの帯域について、ロケーションについて信号のマグニチュードの関係が確定される。周波数帯域であって、周波数帯域のマグニチュード関係が、閾値の一方の側に入る、周波数帯域と、周波数帯域であって、周波数帯域のマグニチュード関係が、閾値の他方の側に入る、周波数帯域との間に相対的な利得変化がもたらされる。利得変化は、閾値においてまたは閾値の近くでの急激な利得変化を回避するために、閾値の前後でフェードされる。

別の特徴は、信号から、音響波が第1変換器によって検出されるときと、この波が第2変換器によって検出されるときとの間のそれぞれの帯域についての時間遅延を確定することを要求する。周波数帯域であって、周波数帯域のマグニチュード関係および時間遅延が、マグニチュード関係および時間遅延の各閾値の一方の側に入る、周波数帯域と、周波数帯域であって、周波数帯域の(1)マグニチュード関係が、マグニチュード関係の閾値の他方の側に入るか、周波数帯域の(2)時間遅延が、時間遅延の閾値の他方の側に入るか、または、周波数帯域の(3)マグニチュード関係および時間遅延が共に、マグニチュード関係および時間遅延の各閾値の他方の側に入る、周波数帯域との間に相対的な利得変化がもたらされる。利得変化は、閾値においてまたは閾値の近くでの急激な利得変化を回避するために、閾値の前後でフェードされる。

他の特徴は、(a)第1オクターブについて導出される利得項の群が、同様に、第2オクターブに対して適用されること、(b)第1オクターブが第2オクターブより低いこと、(c)第1オクターブについて導出される利得項の群が、同様に、第3オクターブに対して適用されること、(d)第1オクターブの周波数帯域が、第3オクターブの周波数帯域より低いこと、および/または、(e)第1群の周波数帯域が、第3群の周波数帯域より低いことを含む。

別の態様は、音源を識別する方法を含む。音響波の特性に応答する変換器によって収集されるデータは、それぞれの変換器ロケーションについて信号に変換される。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。特定の帯域に対してエネルギーを供給する音源の、変換器に対する距離および角度を指示する信号の特性は、それぞれの帯域について確定される。周波数帯域であって、周波数帯域の信号特性が、特定の帯域に対してエネルギーを供給する音源が距離および角度要件を満たすことを指示する、周波数帯域と、周波数帯域であって、周波数帯域の信号特性が、特定の帯域に対してエネルギーを供給する音源が、(a)距離要件を満たさないか、(b)角度要件を満たさないか、または、(c)距離および角度要件を満たさないことを指示する、周波数帯域との間に相対的な利得変化がもたらされる。

さらなる特徴は、(a)音響波が第1変換器によって検出されるとき、および、この波が第2変換器によって検出されるときを指示する位相のずれ、および/または、(b)音響波が第1変換器によって検出されるときと、この波が第2変換器によって検出されるときとの間の時間遅延を、特性が含み、それにより、特定の帯域に対してエネルギーを供給する音源の、変換器に対する角度が指示されることを含む。

さらなる特徴は、出力信号が、(a)記憶媒体上にレコーディングされること、(b)送信機によって通信されること、および/または、(c)音源のロケーションに関する情報を提示するために、さらに処理され使用されることを要求する。

本発明のさらなる態様は、音源を識別する方法を要求する。音響波の特性にそれぞれ応答する4つの変換器によって収集されるデータは、それぞれの変換器ロケーションについて信号に変換される。信号は、それぞれの変換器ロケーションについて複数の周波数帯域に分離される。それぞれの帯域について、変換器の少なくとも2つの異なる対について信号のマグニチュードの関係が、閾値と比較される。それぞれの変換器対について、マグニチュード関係が、閾値の一方の側に入るか、他方の側に入るかについての判定が行われる。それぞれの判定の結果が利用されて、総合マグニチュード関係が、閾値の一方の側に入るか、他方の側に入るかが決定される。周波数帯域であって、周波数帯域の総合マグニチュード関係が、閾値の一方の側に入る、周波数帯域と、周波数帯域であって、周波数帯域の総合マグニチュード関係が、閾値の他方の側に入る、周波数帯域との間に相対的な利得変化がもたらされ、それにより、音源は、変換器からの距離に基づいて互いから識別される。

他の特徴は、(a)4つの変換器がリニアアレイで配列されること、(b)変換器のそれぞれの隣接対間の距離が、実質的に同じであること、(c)4つの変換器のそれぞれが、仮想多角形の各頂点に位置すること、および/または、(d)それぞれの変換器対について判定結果に重みを与えることを要求する。

別の態様は、音源を識別する方法を要求する。音識別システムは、訓練モードに切換えられる。音源は、音源受容領域内の複数のロケーションに移動し、それにより、音識別システムは、複数の周波数ビンについて複数の閾値を確定し得る。音識別システムは、動作モードに切換えられる。音識別システムは、閾値を使用して、音源受容領域の外側に位置する音源と比べて、音源受容領域内に位置する音源に対して相対的強調を提供する。

別の特徴は、マイクロフォンの2つが、無限遠に対して両方向に延びる仮想直線によって接続されることを要求する。第3のマイクロフォンはこの線から離れて位置する。

1つまたは複数の特徴は、変換器の6つのユニークな対について信号のマグニチュードの関係を閾値と比較することを要求する。

本発明のこれらのまた他の態様、目的、特徴、および利点は、以下の詳細な説明および添付特許請求の範囲を検討することによって、また、添付図面を参照することによってより明確に理解され認識されるであろう。

音響ピックアップデバイスに対する第1位置の音源の略図である。音響ピックアップデバイスに対する第2位置の音源の略図である。音響ピックアップデバイスに対する第3位置の音源の略図である。音響ピックアップデバイスに対する第4位置の音源の略図である。マイクロフォンアレイを有するシリコンチップの断面図である。角度および距離の関数としての一定のdB差および時間差の線のプロットである。角度および距離の関数としての一定のdB差および時間差の線のプロットである。角度および距離の関数としての一定のdB差および時間差の線のプロットである。マイクロフォンシステムの第1の実施形態の略図である。従来のマイクロフォンおよび図7のマイクロフォンシステムの、距離に対する出力のプロットである。カージオイドマイクロフォンおよび図7のマイクロフォンシステムの、角度に対する出力のポーラプロットである。異なる方向からの音響波にさらされる変換器の略図である。異なる方向からの音響波にさらされる変換器の略図である。比較的広く間隔をあけた変換器対についての一定のマグニチュード差(dB単位)の線のプロットである。比較的狭く間隔をあけた変換器対についての一定のマグニチュード差(dB単位)の線のプロットである。マイクロフォンシステムの第2の実施形態の略図である。マイクロフォンシステムの第3の実施形態の略図である。周波数に対する利得のプロットである。周波数に対する利得のプロットである。マイクロフォンシステムの第4の実施形態の略図である。第4の実施形態の別の部分の略図である。第4の実施形態で使用される利得項のグラフである。第4の実施形態で使用される利得項のグラフである。第4の実施形態で使用される利得項のグラフである。一体化されたマイクロフォンを有するイヤフォンの斜視図である。一体化されたマイクロフォンを有する携帯電話の正面図である。周波数対マグニチュードの閾値のプロットである。周波数対時間遅延の閾値のプロットである。スルーレート制限を実証するグラフである。マイクロフォンシステムの第5の実施形態の略側面図である。マイクロフォンシステムの第6の実施形態の略上面図である。

一部の音用途(例えば、ライブ音楽の増幅、音レコーディング、携帯電話、およびスピーカフォン)について、指向性特性の普通でないセットを有するマイクロフォンシステムが望まれる。性能の改善を提供しながら、指向性マイクロフォンの通常の問題の多くを回避するこれらの特性を有する新しいマイクロフォンシステムが開示される。この新しいマイクロフォンシステムは、2つ以上の離間したマイクロフォン要素(変換器)によって測定される圧力を使用して、マイクロフォンシステムに対して距離および角度のある受容窓(acceptance window)内に入る音源からの信号について、すべての他の音源からの信号についての利得と比較して相対的に正の利得をもたらす。

これらの目標は、従来のマイクロフォンと非常に異なる指向性パターンを有するマイクロフォンシステムによって達成される。このパターンを有する新しいマイクロフォンシステムは、「受容窓」内だけの音を受容する。マイクロフォンシステムからある距離および角度内で発生する音が受容される。この距離および/または角度の外側で発生する音が排除される。

新しいマイクロフォンシステムの1つの用途(ライブ音楽演奏)では、歌手のマイクロフォンにおけるドラムキットまたは任意のマイクロフォンにおけるラウドスピーカなどの、排除したいと思われる音源は、遠すぎ、かつ/または、間違った角度になるため、新しいマイクロフォンシステムによって受容されない可能性がある。相応して、上述した問題が回避される。

図1で始めると、音響ピックアップデバイス10は、前部および後部変換器12および14を含む。変換器は、局所的音圧、1次音圧勾配、高次音圧勾配、またはその組合せなどの、音響波の特性に応答することによって、変換器の各ロケーションでデータを収集する。それぞれの変換器は、この実施形態では、従来の無指向性音圧応答マイクロフォンであり得、変換器はリニアアレイで配列される。変換器はそれぞれ、変換器の各ロケーションに存在する瞬時音圧を、そのロケーションにおける経時的な音圧を表す電気信号に変換する。

図1においてスピーカとして示す、自由空間内の点音源15の理想的な状況を考える。音源15はまた、例えば、歌手または音楽機器の出力であるであろう。音源15から前部変換器12までの距離はRであり、音響ピックアップデバイス10と音源との間の角度はθである。変換器12および14は、距離r_tだけ分離される。先に説明した電気信号から、r_tを知り、また、信号の態様を閾値と比較して、音源15からの音を受容するか否かが判定され得る。音圧波が変換器12に達するときと、波が変換器14に達するときとの間の時間差はτである。シンボルcは音速である。相応して、未知数θを含む第1方程式は、

である。同様に、変換器12および14の各ロケーションにおける音圧マグニチュードM1およびM2が測定され得、また、ｒ_tがわかっている。したがって、未知数Rを含む第2方程式

がセットアップされ得る。そのため、2つの方程式ならびに2つの未知数Rおよびθが得られる(ｒ_t、τ、c、およびM1/M2が与えられる)。2つの方程式は、コンピュータを使用して、数値的に同時に解かれる。

図2に例が提供される。この例では、音源15が球面波を放出することが仮定される。Rが、変換器12と14との距離r_tと比較して小さく、かつ、θ=0°であるとき、2つの変換器信号間に大きな音圧マグニチュード差が存在することになる。これは、音源15から変換器12までの距離Rと、音源15から変換器14までの距離R+r_tとの間に大きな相対的な差が存在するために起こる。点音源の場合、音圧マグニチュードは、1/R(音源15から変換器12まで)および1/(R+r_t)(音源15から変換器14まで)の関数として低下する。

距離r_tは、好ましくは、変換器12および14のそれぞれについて振動板の中心から測定される。距離r_tは、好ましくは、最も高い関心周波数についての波長より小さい。しかし、距離の関数としてのマグニチュード比が小さくなり、そのため、測定するのが難しくなるため、r_tは、小さすぎるべきではない。音響波が、cが約343m/sである気体(例えば空気)中を進む場合、距離r_tは、一例では、好ましくは、約70ミリメートル(mm)以下である。約70mmにおいて、システムは、主に人のスピーチおよび同様な信号からなる音響環境に最もよく適合する。好ましくは、距離r_tは、約20mmと約50mmとの間である。より好ましくは、距離r_tは、約25mmと約45mmとの間である。最も好ましくは、距離r_tは約35mmである。

ここまで、説明は、本質的に圧縮性流体(例えば、空気)の環境において行われた。本発明はまた、非圧縮性流体(例えば、水または塩水)の環境で有効であることになることが留意されるべきである。水の場合、変換器間隔は、約90mm以上であり得る。低周波数または極低周波数を測定することが望まれるだけである場合、変換器間隔は、かなり大きくなり得る。例えば、水中の音速が1500メートル/秒であり、最も高い関心周波数が100Hzであると仮定すると、変換器は15メートル離れて配置され得る。

図3に移ると、Rが比較的大きく、かつ、θ=0°であるとき、相対的な時間差(遅延)は同じでままあるが、変換器12の信号と変換器14の信号とのマグニチュードの差は著しく減少する。Rが非常に大きくなると、マグニチュード差はゼロに近づく。

図4を参照すると、任意のRについて、θ=90°であるとき、変換器12と14との時間遅延は、音源15からそれぞれの変換器12、14までの経路長が同じであるため消失する。0°と90°との間の角度において、時間遅延は、r_t/cからゼロまで減少する。一般的に言えば、θ=90°であるときの変換器12、14の信号のマグニチュードは同じになることになる。オーディオデバイス10のロケーションに対する音源15のロケーションの関数として、図2〜4の変換器対からの出力において、相対的マグニチュード、相対的位相(または時間遅延)、あるいは両方の変動が存在することが見てわかる。これは、以下でより詳細に述べる図6A〜6Cでより完全に示される。音源角度は、任意の角度で計算され得る。しかし、この例では、音源距離Rは、θが±90°に近づくにつれて、推定するのが益々難しくなる。これは、±90°において、距離によらず、M1とM2とのマグニチュード差がもはや存在しないためである。

図5を参照すると、シリコンチップ35の断面は、微小電気機械システム(Micro-Electro-Mechanical Systems)(MEMS)マイクロフォンアレイ37を開示する。アレイ37は、互いから少なくとも約250mmの距離r_tだけ離間した音響変換器34、41の対を含む。光学ポート43、45は、変換器34、41が環境を「聞き取る(hear)」有効距離d_tを増加させる。距離d_tは、約70mmまでの任意所望の長さにセットされ得る。チップ35はまた、変換器34、41に接続される関連する信号処理装置(図5には示さず)を含む。MEMSマイクロフォンアレイの利点は、所望の信号処理(以下で説明する)、例えば、信号調節、A/D変換、ウィンドウイング、変換、およびD/A変換などの一部またはすべてが、同じチップ上に載せられ得ることである。これは、非常にコンパクトな単一のマイクロフォンシステムを提供する。MEMSマイクロフォンアレイの例は、Akustica,Inc.(2835 East Carson Street、Suite 301、Pittsburgh、PA 15203)(http://www.akustica.com/documents/AKU2001ProductBrief.pdf)から入手可能なAKU2001トライステートデジタル出力CMOS MEMSマイクロフォンである。

図6Aに移ると、(変換器12および14からなる)オーディオデバイス10のロケーションに対する音源15のロケーション(角度および距離)の関数としての、音源15によって出力される音による、変換器12、14のロケーションに存在する信号のマグニチュード差および時間遅延差(位相)の理論的プロットが提供される。図6A〜6Cのプロットは、変換器12と14との距離r_tが35mmであると仮定して計算された。上記パラグラフの方程式が、このプロットを計算的に生成するために使用された。本明細書では、しかし、Rおよびθは既知の値にセットされ、τおよびM1/M2が計算される。理論的な音源角度θおよび距離Rは、ある範囲のτおよびM1/M2を確定するために、広い範囲にわたって変動する。Y軸は音源角度θ(°単位)を提供し、X軸は音源距離(メートル単位)を提供する。一定のマグニチュード差(dB単位)の線17がプロットされる。変換器12のロケーションにおける信号および変換器14のロケーションにおける信号の一定の時間差(マイクロ秒)の線19もまたプロットされる。所望である場合、より大きなグラデーションが提供され得る。

例えば、変換器12から0.13メートルより近くに位置し、かつ、25°より小さい角度θの音源だけを受容することが望まれる場合、これらの値の交点が点23において見出される。点23にて、マグニチュード差が2dBより大きくなければならず、また、時間遅延が100マイクロ秒より大きくなければならないことが見てわかる。ハッチングエリア27は、この設定についての受容窓を指示する。音源が、2dB以上のマグニチュード差および100マイクロ秒以上の時間遅延をもたらす場合、その音源は受容される。音源が、2dB未満のマグニチュード差および/または100マイクロ秒未満の時間遅延をもたらす場合、その音源は排除される。

上記タイプの処理、ならびに、その結果得られる、変換器からの距離および角度に基づく音源の受容または排除は、周波数帯域ごとに行われる。所望の音を遮断すること、または、所望でない音を通過させることを回避するために、比較的狭い周波数帯域が望ましい。狭い周波数帯域および短い時間ブロックを使用することが好ましいが、これら2つの特性は互いに競合する。より狭い周波数帯域は、好ましくない音響源の排除を向上させるが、より長い時間ブロックを必要とする。しかし、より長い時間ブロックは、マイクロフォンのユーザにとって受容可能でないシステム待ち時間を生じる。受容可能な最大システム待ち時間が確定されると、周波数帯域幅が選択され得る。その後、ブロック時間が選択される。さらなる詳細は以下で述べられる。

システムは、多くの周波数帯域にわたって独立に働くため、Cを歌うマイクロフォンからオンアクシスで0.13メートルのところに位置する所望の歌手は受容され、一方、Eを演奏するマイクロフォンからオフアクシスで0.25メートルのところに位置するギターが排除される。そのため、マイクロフォンから0.13メートルより近くで、かつ、オンアクシスの所望の歌手がCを歌うが、ギターが、任意の角度でマイクロフォンから0.25メートルのところでEを演奏する場合、マイクロフォンシステムは、ボーカリストのCおよびその高調波を通過させ、一方、同時に奏者のEおよびその高調波を排除する。

図6Bは、マグニチュード差および時間差のそれぞれについて2つの閾値が使用される実施形態を示す。2≦dB差≦3のマグニチュード差、および、時間差80≦マイクロ秒≦100をもたらす音源が受容される。受容窓は、ハッチングエリア29によって特定される。受容窓29の外側にマグニチュード差および/または時間差をもたらす音源が排除される。

図6Cは、2つの受容窓31および33が使用される実施形態を示す。≧3dBのマグニチュード差および時間差80≦マイクロ秒≦100をもたらす音源が受容される。2≦dB差≦3のマグニチュード差、および、時間差≧100マイクロ秒をもたらす音源もまた受容される。受容窓31および33の外側にマグニチュード差および/または時間差をもたらす音源が排除される。マグニチュード差および時間差について適切な閾値を使用することによって、任意の数の受容窓が生成され得る。

ここで図7に移ると、マイクロフォンシステム11が述べられる。音源15からの音響波によって、変換器12、14が、時間の関数として音響波の特性を表す電気信号を生成する。変換器12、14はそれぞれ、好ましくは、有線によってまたは無線でシステムの他の部品に接続され得る無指向性マイクロフォン要素である。変換器は、この実施形態では、各振動板の中心が、約35mmの距離だけ分離されている。図7の残りの要素の一部またはすべては、マイクロフォンに組込まれ得るか、または、1つまたは複数の別個のコンポーネント内にあり得る。それぞれの変換器について信号は、従来の各前置増幅器16および18ならびに従来のアナログ-デジタル(A/D)変換器20を通過する。一部の実施形態では、別個のA/D変換器が使用されて、それぞれの変換器によって出力される信号を変換する。あるいは、マルチプレクサが、単一A/D変換器と共に使用され得る。増幅器16および18はまた、必要である場合、各変換器12および14にDC電源(すなわち、ファンタム電源)を供給し得る。

当業者によく知られているブロック処理技法を使用して、オーバラップするデータのブロックが、ブロック22にてウィンドウイングされる(別個のウィンドウイングが、それぞれの変換器について信号に対して行われる)。ウィンドウイングされたデータは、ブロック24にて、高速フーリエ変換(FFT)を使用して時間領域から周波数領域へ変換される(別個のFFTが、それぞれの変換器について信号に対して行われる)。これは、それぞれの変換器ロケーションについて、信号を、複数の離間したリニアな周波数帯域(すなわち、ビン)に分離する。他のタイプの変換が使用されて、ウィンドウイングされたデータが、時間領域から周波数領域へ変換され得る。例えば、離間したlog周波数ビンを得るために、FFTの代わりに、ウェーブレット変換が使用されてもよい。この実施形態では、32000サンプル/秒のサンプリング周波数が、512サンプルを含むそれぞれのブロックに関して使用される。

その逆のディスクリートフーリエ変換(Discrete Fourier Transform)(DFT)の規定は、次の通りである。
関数X=fft(x)およびx=ifft(x)は、

によって、長さNのベクトルについて与えられる変換および逆変換対を実施する。
式中、
ω_N=e^(-2πi)/N
は1のn乗根である。

FFTは、計算の速度を速める、DFTを実施するためのアルゴリズムである。実際の(オーディオなどの)信号のフーリエ変換は複素結果をもたらす。複素数Xのマグニチュードは、
sqrt(real(X)²+imag(X)²)
として規定される。

複素数Xの角度は、

として規定される。

実数部および虚数部の符合が、単位円の適切な象限内に角度を置くことが観測される場合、結果が、範囲
-π≦angle(X)<π
内にあることを可能にする。

等価な時間遅延は、

として規定される。

2つの複素値X1およびX2のマグニチュード比は、いくつかの方法の任意の方法で計算され得る。X1およびX2の比がとられ、その後、結果のマグニチュードが見出される。または、X1およびX2のマグニチュードが別々に見出され、その比がとられ得る。あるいは、log空間が考えられ、比のマグニチュードのlog、または別法として、log(X1)およびlog(X2)の差(減算)がとられ得る。

同様に、2つの複素値間の時間遅延は、いくつかの方法で計算され得る。X1およびX2の比がとられ、結果の角度が見出され、角周波数で除算され得る。X1およびX2の角度が別々に見出され、両者が減算され、結果が角周波数で除算され得る。

上述したように、信号の関係が確立される。一部の実施形態では、関係は、前部変換器12からの信号と後部変換器14からの信号の比であり、デバイダブロック26において、ブロックごとにそれぞれの周波数ビンについて計算される。この比(関係)のマグニチュード(dB単位)は、ブロック28にて計算される。時間差(遅延)T(τ)は、最初にブロック30にて位相を計算し、次に、デバイダ32にて、位相をそれぞれの周波数ビンの中心周波数で除算することによって、ブロックごとにそれぞれの周波数ビンについて計算される。時間遅延は、音響波が変換器12によって検出されるときと、この波が変換器14によって検出されるときとの間の経過時間を表す。

2つの変換器信号間のマグニチュードおよび時間遅延差を推定するためのよく知られている他のデジタル信号処理(digital signal processing)(DSP)技法が使用されてもよい。例えば、時間遅延差を計算する代替の手法は、2つの信号X1とX2との間のそれぞれの周波数帯域における相互相関を使用することである。

それぞれの周波数ビン(帯域)についての計算されたマグニチュード関係および時間差(遅延)は、ブロック34にて閾値と比較される。例えば、図6Aで上述したように、マグニチュード差が2dB以上であり、かつ、時間遅延が100マイクロ秒以上である場合、その周波数ビンが受容される(強調される)。マグニチュード差が2dB未満、かつ/または、時間遅延が100マイクロ秒未満の場合、その周波数ビンが排除される(強調されない)。

ユーザ入力36は、受容角度閾値(複数可)を変えるように操作されてもよく、ユーザ入力38は、ユーザの要求に応じて、距離閾値(複数可)を変えるように操作されてもよい。一実施形態では、ユーザが必要に応じて選択し得る異なる受容パターンについて、少数のユーザプリセットが設けられる。例えば、ユーザは、角度設定については狭いかまたは広い、距離設定については近いかまたは遠いなどの一般的なカテゴリ間で選択することになる。

角度および距離についての閾値設定をユーザに知らせるために、視覚または他の指示が、ユーザに与えられる。相応して、ユーザが、変換器から距離選択性および/または角度選択性を調整し得るように、ユーザ可変閾値が設けられ得る。ユーザインターフェースは、これを、距離および/または角度閾値を変更することとして表す可能性があるが、実際には、ユーザは、マグニチュード差および/または時間差閾値を調整する。

マグニチュード差および時間遅延が共に、特定の周波数帯域についての受容窓内に入るとき、比較的高い利得が、ブロック40にて計算され、パラメータの一方または両方が窓の外側にあるとき、比較的低い利得が計算される。高利得は約1にセットされ、一方、低利得は0である。あるいは、高利得は1を超え、一方、低利得は高利得より小さい。一般に、周波数帯域であって、周波数帯域のパラメータ(マグニチュードおよび時間遅延)比較が共に、各閾値の一方の側に入る、周波数帯域と、周波数帯域であって、一方または両方のパラメータ比較が、各閾値の他方の側に入る、周波数帯域との間に相対的利得変化がもたらされる。

利得は、それぞれのデータブロック内のそれぞれの周波数ビンについて計算される。計算される利得は、こうした利得変化によって発生するアーチファクトを最小にするために、当業者に知られている他の方法でさらに操作されてもよい。例えば、最小利得は、ゼロではなく、ある低い値に制限され得る。さらに、任意の周波数ビンの利得は、ファストアタックスローディケイフィルタを使用して迅速に上がるが、ゆっくり下がることが許容され得る。別の手法では、制限は、任意所与の時間において1つの周波数ビンから次の周波数ビンへ利得がどれだけ変動することを許容されるかに関してセットされる。

周波数ビンごとに、計算された利得は、マルチプレクサ42にて、単一変換器、例えば、変換器12(変換器14も使用されるであろうが)からの周波数領域信号に適用される。そのため、受容窓内の音源は、窓の外側の音源に比べて強調される。

従来のブロック処理技法を使用して、修正された信号は、ブロック44にて逆FFTされて、周波数領域から時間領域へ戻るように信号が変換される。信号は、その後、ブロック46にて、ウィンドウイングされ、オーバラップされ、直前のブロックと加算される。ブロック48にて、信号は、デジタル信号からアナログ(出力)信号へ戻るように変換される。ブロック48の出力は、その後、音を生成するために、音補強システムの従来の増幅器(図示せず)および音響ドライバ(すなわち、スピーカ)(図示せず)に送出される。あるいは、ブロック48への入力信号(デジタル)またはブロック48からの出力信号(アナログ)は、(a)(例えば、電子または磁気の)記憶媒体上にレコーディングされるか、(b)送信機によって(有線でまたは無線で)通信されるか、または、(c)音源のロケーションに関する情報を提示するためにさらに処理され使用され得る。

このマイクロフォンシステムの一部の利益は、図8および9に関して述べられる。距離選択性に関して、従来のマイクロフォンの応答は、距離と共にスムーズに減少する。例えば、一定強度を有する音源の場合、通常の無指向性マイクロフォンの出力レベルは、距離Rに伴って1/Rとして下がる。これは、図8の線分49および50として示され、図8は、R(マイクロフォンから音源までの距離)の対数の関数としての、相対的マイクロフォン出力をdBでプロットする。

図7に示すマイクロフォンシステムは、指定された距離R0までだけであるが、Rに伴って同じ低下(線分49)を有する。R0におけるマイクロフォン出力の低下は、線分52で表される。歌手によって手持ちされるボーカリストのマイクロフォンの場合、R0は、通常、約30cmにセットされることになる。スタンド上に固定されたボーカリストのマイクロフォンの場合、その距離はかなり小さいであろう。新しいマイクロフォンは、R0より近くに位置する歌手に応答するが、他の機器またはラウドスピーカからの音など、それより離れているいずれの音も排除する。

図9に移ると、角度選択性が説明される。従来のマイクロフォンは、種々の指向性パターンの任意のパターンを有し得る。マイクロフォンについて一般的な指向性パターンであるカージオイド応答は、ポーラプロット線54で示される(曲線の半径は、指示された角度で到来する音に対する相対的マイクロフォンマグニチュード応答を指示する)。カージオイドマイクロフォンは、前部に到来する音について最も強いマグニチュードを有し、音源が後部に移動するにつれて、応答が益々小さくなる。後部から到来する音は、かなり減衰する。

図7のマイクロフォンシステムについての指向性パターンは、パイ形状の線56によって示される。受容角度(この例では、±30°)内に到来する音の場合、マイクロフォンは高い応答を有する。この角度の外側に到来する音は、かなり減衰する。

マグニチュード差は、距離の関数であると共に角度の関数である。距離に伴うマグニチュードの最大変化は、変換器に一致する線で起こる。距離に伴うマグニチュードの最小変化は、変換器の軸に直角な線で起こる。90°オフアクシスの音源の場合、音源距離にかかわらず、マグニチュード差は存在しない。しかし、角度は、時間差だけの関数にすぎない。距離選択性が重要である用途の場合、変換器アレイは、選択されることが望まれる1つまたは複数の音源のロケーションを指すように向き調整されるべきである。

この種の極端な指向性を有するマイクロフォンは、2つの理由で、従来のマイクロフォンに比べてフィードバックに対して感受性がずっと低い。第1に、ライブ演奏用途では、新しいマイクロフォンは、存在する可能性があるメインおよびモニタラウドスピーカの音を、それらのスピーカが遠すぎ、かつ、受容窓の外側にあるため、大幅に排除する。感度の減少は、システムのループ利得を低下させ、フィードバックの可能性を低減する。さらに、従来のシステムでは、フィードバックは、ステージ上で、いくつかの「オープン(open)」マイクロフォンおよびスピーカを有することによって悪化する。どの1つのマイクロフォンおよびスピーカも安定であり、フィードバックを生成しないが、複数の相互結合システムの組合せは、より容易に不安定になり、フィードバックをもたらす。本明細書で述べる新しいマイクロフォンシステムは、受容窓内の音源についてだけ「オープン」であり、他のマイクロフォンおよびシステムがたとえ完全に従来型であっても、ステージ上で別のマイクロフォンおよび音増幅システムに結合することによって、フィードバックに寄与する可能性が小さくなる。

新しいマイクロフォンシステムはまた、演奏またはレコーディング用途において、他の演奏者または他の機器からの音のブリードスルーを大幅に低減する。受容窓(距離と角度の両方)は、演奏のニーズを満たすために、演奏者または音クルーによって随時調整され得る。

新しいマイクロフォンシステムは、多くの異なるスタイルのマイクロフォンの音を、その効果を自分の音の一部として欲している演奏者のためにシミュレートし得る。例えば、本発明の一実施形態では、このシステムは、小さなR値を指示するマグニチュード差について、高周波よりも低周波において利得を高めることによって、従来のマイクロフォンの近接効果をシミュレートし得る。図7の実施形態では、変換器12の出力だけが、周波数ビンに基づいて処理されて、出力信号が形成される。変換器12は、通常、無指向性圧力応答変換器であり、通常の圧力勾配応答マイクロフォンにおいて存在する、近接効果を示さないことになる。利得ブロック40は、変換器12の出力に距離依存性利得関数を課すが、これまで述べた関数は、マイクロフォンシステムからの距離/角度に応じて周波数ビンを通過させるか、または、遮断する。より複雑な関数が、利得処理ブロック40に適用されて、述べたシステムの距離/角度選択性を維持しながら、圧力勾配マイクロフォンの近接効果がシミュレートされ得る。1またはゼロの係数を使用するのではなく、可変係数が使用され得、係数値が周波数および距離の関数として変動する。この関数は、1次ハイパスフィルタ形状を有し、折点周波数は、距離が減少するにつれて減少する。

近接効果はまた、変換器12、14を結合して、単一の単指向性または双指向性マイクロフォンにすることによってもたらされ得、それにより、固定指向性アレイが生成される。この場合、計算される利得は、変換器12、14からの結合信号に適用され、図7の処理の選択性の向上に加えて、圧力勾配タイプ指向性動作(ユーザによって調整可能でない)を提供する。本発明の別の実施形態では、新しいマイクロフォンシステムは、小さなR値を指示するマグニチュード差について、高周波よりも低周波において利得を高めないため、近接効果を示さない。

新しいマイクロフォンは、新しいマイクロフォン効果を生成し得る。一例は、受容窓内のすべての音源距離について同じ出力を有するマイクロフォンである。変換器12と14との間のマグニチュード差および時間遅延を使用して、変換器12による1/R低下を補償するために利得が調整される。こうしたマイクロフォンは、「マイクロフォンをうまく働かせる(work the mike)」ことをしない音楽家にとって魅力的であるであろう。一定レベルの音源は、受容窓内の変換器から任意の距離について同じ出力マグニチュードをもたらすことになる。この機能は、パブリックアドレス(public address)(PA)システムにおいて有用であり得る。未熟なプレゼンタは、一般に、マイクロフォンから一定距離を維持することに関して注意深くない。従来のPAシステムによって、プレゼンタの再生音声は、大きすぎることと小さすぎることの間で変動し得る。本明細書で述べる改良型マイクロフォンは、スピーカとマイクロフォンとの距離に無関係に、音声レベルを一定に維持する。結果として、未熟なスピーカについての再生された音声レベルの変動は、低減される。

新しいマイクロフォンは、(ヘッドセットまたはその他のものの中の)消費者用携帯電話用のマイクロフォンまたはパイロット用ブームマイクロフォンなどの、通信用のマイクロフォンを置換えるのに使用され得る。これらの個人通信デバイスは、通常、ユーザの唇から約1フィート以下に位置することを意図されるマイクロフォンを有する。従来のノイズキャンセリングマイクロフォンを、ユーザの唇の近くに配置する(place)ためにブームを使用するのではなく、ヘッドセット上に搭載された一対の小型マイクロフォンが、角度および/または距離閾値を使用して、正しい距離および/または角度(例えば、ユーザの唇)を有する音だけを受容するであろう。他の音は排除されることになる。受容窓は、ユーザの口の予想されるロケーションに集中する。

このマイクロフォンはまた、(例えば、自動車内で)話し手のロケーションがわかっている他の音声入力システムのために使用され得る。一部の例は、車両内でのハンズフリーオペレーションなどのハンズフリー電話、および、車両機能を制御するためにユーザからの音声入力を受容する音声認識能力を使用する車両システムなどによるハンズフリー音声コマンドを含む。別の例は、例えば、電話会議で使用され得るスピーカフォンにおいてマイクロフォンを使用することである。これらのタイプの個人通信デバイスは、通常、ユーザの唇から1フィートより遠くに位置することを意図されるマイクロフォンを有する。この用途の新しいマイクロフォン技術はまた、音声認識ソフトウェアと組み合わせて使用され得る。マイクロフォンからの信号は、周波数領域における音声認識アルゴリズムに渡される。音源についての受容領域の外側にある周波数ビンは、受容領域内にある周波数ビンに比べて低い重みが与えられる。こうした配置構成は、音声認識ソフトウェアが、雑音のある環境において所望のスピーカ音声を処理するのを助ける。

ここで図10Aおよび10Bに移ると、別の実施形態が述べられる。図7で述べる実施形態では、2つの変換器12、14は、変換器の最大動作周波数の音の波長に比較して、2つの変換器12と14との間に比較的広く間隔をあけた状態で使用される。この理由は、以下で述べられる。しかし、周波数が高くなるにつれて、計算的に単純な方法を使用して2つの変換器間の時間遅延を確実に推定することが難しくなる。通常、マイクロフォン間の位相差は、それぞれの周波数ビンについて計算され、ビンの中心周波数で除算されて、時間遅延が推定される。他の技法は、使用され得るが、より計算集約的である。

しかし、音の波長がマイクロフォン間の距離に近づくとき、この単純な手法は正常に働かない。位相測定は、-πとπとの間の範囲の結果を生じる。しかし、2πの整数倍である値を有する測定には不確実性が存在する。位相差の0ラジアンの測定は、2πまたは-2πの位相差を表すことが十分あり得る。

この不確実性は、図10Aおよび10Bにおいてグラフで示される。平行線58は、入って来る音響圧力波の波長間隔を表す。図10Aと10Bの両方において、音響圧力波のピークは、変換器12、14に同時に達するため、0の位相差が測定される。しかし、図10Aでは、波は、変換器12、14を結合する仮想直線に直角に矢印60の方向にやって来る。この場合、2つの変換器間の時間遅延は、実際にはゼロである。逆に、図10Bでは、波は、変換器12、14を結合する仮想線に平行に矢印62の方向にやって来る。この例では、2波長が、2つの変換器間の空間にフィットする。到来時間差は、明らかに非ゼロであり、さらに、測定される位相遅延は、4πの正しい値ではなく、ゼロのままである。

この問題は、検知したいと望まれる最も高い周波数(最も短い波長)の場合でさえも、変換器12、14の間隔が波長より小さいように、変換器12と14との間の距離を減少させることによって回避され得る。この手法は、2πの不確実性をなくす。しかし、変換器間のより狭い間隔は、変換器12と14との間のマグニチュード差を減少させ、マグニチュード差を測定すること(そのため、距離選択性を提供すること)を困難にする。

図11は、変換器12、14が両者間に比較的広い間隔(約35mm)を有するとき、音響源と変換器12との間の種々の距離および角度についての、変換器12と14との間の一定マグニチュード差(dB単位)の線を示す。図12は、変換器間隔がずっと狭い(約7mm)状態における、音響源に対する種々の距離および角度についての、変換器12と14との間の一定マグニチュード差(dB単位)の線を示す。変換器間隔が狭いことによって、マグニチュード差が、著しく減少し、正確な距離推定を得ることが困難になる。

この問題は、変換器要素の2つの対を使用することによって回避され得る。2つの対とは、音源の距離および角度の低周波数推定のための広く間隔をあけた対、および、距離および角度の高周波数推定のための狭く間隔をあけた対である。一実施形態では、3つの変換器要素、すなわち、低周波数用の広く間隔をあけたT1およびT2、ならびに、高周波数用の狭く間隔をあけたT1およびT3だけが使用される。

ここで図13に移る。図13内のブロックの多くは、図7に示すブロックと同じである。変換器64、66、および68からの信号は、従来のマイクロフォン前置増幅器70、72、および74を通過する。それぞれの変換器は、好ましくは、無指向性マイクロフォン要素である。変換器64と66との間隔は、変換器64と68との間隔より小さいことに留意されたい。3つの信号ストリームは、その後、それぞれ、アナログ-デジタル変換器76によってアナログ形態からデジタ形態に変換される。

3つの信号ストリームはそれぞれ、ブロック78にて、標準的なブロック処理ウィンドウイングを受け、FFTブロック80にて、時間領域から周波数領域へ変換される。変換器66の信号からの、予め規定された周波数を超える高周波数ビンが、ブロック82にて選択される。この実施形態では、予め規定された周波数は4kHzである。変換器68の信号からの、4kHz以下の低周波数ビンが、ブロック84にて選択される。ブロック82からの高周波数ビンは、ブロック84からの低周波数ビンと結合されて、周波数ビンの完全補完体(full complement)が生成される。この帯域分割は、あるいは、デジタル領域ではなくアナログ領域で行われ得ることが留意されるべきである。

信号処理の残りの部分は、図7の実施形態の場合と実質的に同じであるため、詳細には述べられない。変換器64からの信号と、ブロック86からの低周波と高周波を結合した信号の比が計算される。商が、図7を参照して述べたように処理される。計算された利得は、変換器64からの信号に適用され、結果得られる信号は、デジタル-アナログ変換器によってアナログ信号に戻るように変換される前に、標準的な逆FFT、ウィンドウイング、およびオーバラップ-および-加算ブロックに適用される。一実施形態では、アナログ信号は、その後、音補強システムの従来の増幅器88およびスピーカ90に送出される。この手法は、2πの不確実性の問題を回避する。

図14に移ると、2πの不確実性の問題を回避する別の実施形態が述べられる。この実施形態の前端は、FFTブロック80まで、図13の場合と実質的に同じである。ここまでで、変換器(マイクロフォン)64および68(広く間隔をあけた)からの信号の比が、デバイダ92にて計算され、dB単位のマグニチュード差が、ブロック94にて確定される。変換器64および68(狭く間隔をあけた)からの信号の比が、デバイダ96にて計算され、位相差が、ブロック98にて確定される。位相は、デバイダ100にて、それぞれの周波数ビンの中心周波数で除算されて、時間遅延が確定される。信号処理の残りの部分は、図13の場合と実質的に同じである。

図14に基づくなおさらなる実施形態では、dB単位のマグニチュード差が、図13と同じ方法で確定される。しかし、(狭く間隔をあけた)変換器64および66からの信号の比は、低周波数ビンについて(例えば、4kHzにおいて、または、4kHz未満で)デバイダにて計算され、位相差が確定される。位相は、それぞれの低周波数ビンの中心周波数で除算されて、時間遅延が確定される。さらに、(広く間隔をあけた)変換器64および68からの信号の比は、高周波数ビンについて(例えば、4kHzを超えて)デバイダにて計算され、位相差が確定される。位相は、それぞれの高周波数ビンの中心周波数で除算されて、時間遅延が確定される。

図15Aおよび15Bを参照すると、第3変換器についての必要性を回避する別の実施形態が存在する。約30〜35mmの変換器分離の場合、音源ロケーションが、約5kHzまで推定され得る。5kHzを超える周波数は、音楽およびスピーチの高品質再生について重要であるため、廃棄されえないが、5kHzを超えるエネルギーだけを生成する音響源はわずかである。一般に、音源はまた、5kHz未満のエネルギーを生成する。

わざわざ5kHzを超える音源を推定することを止めることによって、このことが利用され得る。代わりに、マイクロフォンの受容窓内にある音響エネルギーが、5kHz未満で検知される場合、5kHzを超えるエネルギーはまた、そのエネルギーが同じ音源からやって来ると仮定して、通過することを許容される。

この目標を達成する一方法は、例えば2.5kHzと5kHzとの間のオクターブ内に位置する周波数ビンについて予測される瞬時利得を使用すること、および、これらの同じ利得を、1および2オクターブ高い周波数ビンに対して、すなわち、5kHzと10kHzとの間のビンおよび10kHzと20kHzとの間のビンについて適用することである。この手法は、オーディオ信号内に存在する可能性がある任意の調波構造を保持する。2〜4kHzなどの他の初期オクターブは、変換器間隔に比例する限り使用され得る。

図15Aおよび15Bに示すように、信号処理は、「比較閾値(compare threshold)」ブロック34およびその入力を除いて、図7の場合と実質的に同じである。この差は以下で述べられる。図15Aでは、利得は、推定された音源位置に基づいて5kHzまで計算される。5kHzを超えると、上述した位相における2πの不確実性のため、信頼性のある音源ロケーション推定を得ることは難しい。代わりに、図15Bに示すように、2.5〜5kHzのオクターブ内の利得が、5〜10kHzのオクターブにわたる周波数ビンについて、またやはり、10〜20kHzのオクターブにわたる周波数ビンについて繰返される。

この実施形態の実施は、図7の「比較閾値」とマークをつけたブロック34を置換える、図16Aを参照して述べられる。ブロック28およびデバイダ32(図7)からのマグニチュード比および時間遅延比は、各非線形ブロック108および110(以下でさらに詳細に説明する)を通過する。ブロック108および110は、それぞれの周波数ビンについて、また、オーディオデータのそれぞれのブロックについて独立に働き、マイクロフォンシステム用の受容窓を生成する。この例では、1つの閾値だけが時間遅延のために使用され、1つの閾値だけがマグニチュード差のために使用される。

マグニチュードおよび時間遅延に基づく、ブロック108および110からの2つの計算された利得は、加算器116にて加算される。利得を加算する理由は、以下で述べられる。5kHz未満の周波数についての加算利得は、ブロック118を通過する。2.5kHzと5kHzとの間の周波数ビンについての利得は、ブロック120にて選択され、(上記図15Aおよび15Bに関して先に説明したように)ブロック122にて5〜10kHz用の周波数ビンに、また、ブロック124にて10〜20kHz用の周波数ビンに再マッピングされる(適用される)。これらの3つの領域のそれぞれについての周波数ビンは、ブロック126にて結合されて、周波数ビンの単一の完全帯域幅補完体が作られる。ブロック126の出力「A」は、図16Bで述べるさらなる信号処理に伝えられる。2つの比較的広く間隔をあけた変換器要素によって、良好な高周波演奏が可能になる。

ここで図16Bに移ると、この例の別の重要な特徴が述べられる。ブロックごとのそれぞれの周波数ビンについての、dB単位のT1信号100およびT2信号102の各マグニチュードは、それぞれの同一の非線形ブロック128および130(以下でさらに詳細に説明する)を通過する。これらのブロックは、マイクロフォンが低い信号レベルを有する周波数ビンについて低利得項を生成する。ある周波数ビン内の信号レベルが、どちらのマイクロフォンについても低い場合、利得が減少する。

2つの変換器レベル利得項は、加算器134にて互いに加算される。加算器134の出力は、加算器136にて、マグニチュード利得項と時間利得項の加算から得られた(図16Aのブロック126からの)利得項「A」に加算される。音源のロケーションを推定するときの誤差の影響を低減するために、項は、乗算されるのではなく、加算器134および136にて加算される。4つすべての利得項が、特定の周波数ビンにおいて高い(すなわち、1である)場合、その周波数は、単位元(1)利得で通過する。利得項のうちの任意の利得項が下がる(すなわち、1未満)場合、その周波数ビンの利得を完全に止めるのではなく、利得が単に減少する。利得は、受容窓の外側の音をマイクロフォンが排除するという意図された機能を果たすのに十分に減少して、フィードバックおよびブリードスルーが低減される。しかし、利得の減少は、パラメータの1つの推定が万一誤っている場合、可聴アーチファクトを生成するほど大きくない。その周波数ビンの利得は、完全にではなく、部分的に小さくなり、推定誤差の可聴効果が大幅に可聴でなくなる。

dBで計算された加算器136によって出力される利得項は、ブロック138にて線形利得に変換され、図7に示すように、変換器12からの信号に適用される。この実施形態およびこの用途で説明される他の実施形態では、音源ロケーションの不良の推定による可聴アーチファクトが低減される。

非線形ブロック108、110、128、および130の詳細は、ここで、図16C〜16Eを参照して説明される。この例は、約35mmの変換器12と14との間隔を仮定する。以下で示す値は、変換器間隔が35mm以外のある値に変わる場合、変わることになる。ブロック108、110、128、および130はそれぞれ、単に完全にオンまたは完全にオフ(例えば、1または0の利得)であるのではなく、音響源が受容窓に出入りするときに、閾値の前後で音響源をフェードする短い遷移領域を有する。図16Eは、ブロック110に関して、28〜41マイクロ秒の時間遅延の場合、出力利得が0から1へ立上ることを示す。28マイクロ秒未満の時間遅延の場合、利得は0であり、41マイクロ秒より大きい時間遅延の場合、利得は1である。図16Dは、ブロック108に関して、2〜3dBのマグニチュード差の場合、出力利得が0から1へ立上ることを示す。2dB未満で、利得は0であり、3dBを超えると、利得は1である。図16Cは、ブロック128および130によって適用される利得項を示す。この例では、-60dB未満の信号レベルの場合、0利得が適用される。-60dBから-50dBの信号レベルの場合、利得は0から1へ増加する。-50dBを超える変換器信号レベルの場合、利得は1である。

上述したマイクロフォンシステムは、携帯電話またはスピーカフォンにおいて使用され得る。こうした携帯電話またはスピーカフォンはまた、音をユーザの耳に送信するための音響ドライバを含むことになる。信号プロセッサの出力は、音を生成するために遠隔ロケーションの第2音響ドライバを駆動するのに使用されることになる(例えば、第2音響ドライバは、500マイル離れた別の携帯電話またはスピーカフォン内に位置するであろう)。

本発明のなおさらなる実施形態が、ここで述べられる。この実施形態は、従来技術のブームマイクロフォンに関しており、従来技術のブームマイクロフォンは、ユーザの頭部に装着されたブームの端部にマイクロフォンが位置する状態で、人の音声をピックアップするのに使用される。通常の用途は、パイロットによって使用されるような通信マイクロフォン、または、コンサートにおいて一部の人気歌手によって使用される音補強マイクロフォンである。これらのマイクロフォンは、通常、他の音源からの音のピックアップを低減するために、口の近くに位置するハンズフリーマイクロフォンが所望されるときに使用される。しかし、顔にわたるブームは、目障りでかつ不恰好であり得る。ブームマイクロフォンの別の用途は、携帯電話ヘッドセットのためのものである。これらのヘッドセットは、ユーザの耳の上にまたは耳の中に装着されたイヤピースを有し、マイクロフォンブームはイヤピースから懸垂保持される。このマイクロフォンは、ユーザの口の前部に位置するか、または、コードから垂れ下がっている可能性があり、両方とも煩わしくなり得る。

この用途の新しい指向性技術を使用するイヤピースは、図17を参照して述べられる。イヤフォン150は、耳の中に挿入されるイヤピース152を含む。あるいは、イヤピースは、耳の上にまたは耳の周りに配置され得る。イヤフォンは、イヤピースを通過する音を生成するための内部スピーカ(図示せず)を含む。ワイヤ束153は、例えばユーザのベルトにクリップ留めされた携帯電話からイヤフォン150へDC電源を渡す。ワイヤ束はまた、内部スピーカによって再生されるオーディオ情報をイヤフォン150内に渡す。代替法として、ワイヤ束153はなくされ、イヤピース152は、電源を供給する電池を含み、情報は、イヤピース152へまたイヤピース152から無線で渡される。イヤフォンには、上述したように2つまたは3つの変換器(図示せず)を含むマイクロフォン154がさらに含まれる。あるいは、マイクロフォン154は、頭部の近傍のどこかに(例えば、ヘッドセットのヘッドバンド上に)、イヤピースとは別に位置し得る。2つの変換器は、ユーザの口のおよその方向に向けられるように、方向Xに沿って整列する。変換器は、コンパクトな軽量マイクロフォン154を提供するために使用される可能性があるMEMS技術の一部であってもよい。ワイヤ束153は、変換器から携帯電話へ戻るように信号を渡し、上述した信号処理が、これらの信号に適用される。この配置構成は、ブームについての必要性をなくす。そのため、イヤフォンユニットは、小型で、軽量で、目障りでない。先に(例えば、図7で)開示した信号処理を使用して、マイクロフォンは、他の音源(例えば、イヤフォン150内のスピーカ)からの音を排除しながら、ユーザの口からやって来る音に対して優先的に応答するようにさせられ得る。こうして、ユーザは、物理的ブームの必要性なしで、ブームマイクロフォンを有するという利益を得る。

上述した以前の実施形態の場合、一般的な仮定は、実質的に自由場の音響環境の実施形態であった。しかし、頭部の近くでは、音源からの音響場が、頭部によって修正され、自由場条件がもはや成り立たない。結果として、受容閾値は、好ましくは自由場条件から変化する。

音の波長が頭部よりずっと大きい低周波では、音場は、大幅には変化せず、自由場と同じ受容閾値が使用されてもよい。音の波長が頭部より小さい高周波では、音場は、頭部によってかなり変化し、受容閾値は、相応して変化しなければならない。

この種の用途では、閾値が、周波数の関数であることが望ましい。一実施形態では、利得がそれについて計算されるすべての周波数ビンについて、異なる閾値が使用される。別の実施形態では、少数の閾値が、周波数ビンの群に適用される。これらの閾値は、経験的に確定される。較正プロセス中に、それぞれの周波数ビンにおけるマグニチュードおよび時間遅延差が、連続してレコーディングされ、一方、すべての関心周波数における音源放射エネルギーは、マイクロフォンの周りを動く。マグニチュードおよび時間差に対して、音源が所望の受容ゾーン内に位置するとき、高いスコアが割当てられ、音源が受容ゾーンの外側にあるとき、低いスコアが割当てられる。あるいは、種々のロケーションの複数の音源が、スコア付けおよび表作成を行うコントローラによってターンオン/ターンオフされ得る。

誤差を最小にするためのよく知られている統計的方法を使用して、それぞれの周波数ビンについての閾値は、独立変数としてdb差および時間(または位相)差を、従属変数としてスコアを使用して計算される。この手法は、任意所与のユニットを構成する2つのマイクロフォン要素間に存在する可能性がある周波数応答の任意の差を補償する。

考えるべき問題は、マイクロフォン要素およびアナログ電子部品が公差を有するため、対を構成する2つのマイクロフォンのマグニチュードおよび位相応答は十分に整合しない可能性があることである。さらに、マイクロフォンが配置される音響環境は、所望の受容窓において音源についてのマグニチュードおよび時間遅延関係を変える。

これらの問題に対処するために、マイクロフォンの意図される使用および音響環境が与えられたとすると、適切な閾値がどんなものかをマイクロフォンが学習する実施形態が提供される。比較的低レベルの背景ノイズを有する意図される音響環境では、ユーザは、システムを学習モードに切換え、動作時にマイクロフォンが音源を受容すべき領域内で小さな音源をあちこちに動かす。マイクロフォンシステムは、訓練中に、すべての周波数帯域においてマグニチュードおよび時間遅延差を計算する。データ採取が終了すると、システムは、よく知られている統計的方法を使用してデータの最適適合度を計算し、それぞれの周波数ビンまたは周波数ビンの群について閾値のセットを計算する。この手法は、所望の受容ゾーン内に位置する音源について行われる、音源ロケーションに関する正しい決定の数の増加を達成するのを助ける。

訓練のために使用される音源は、訓練期間中にすべての関心周波数帯域のエネルギーを含む試験信号を、同時にまたは順次に鳴らす小型ラウドスピーカであるであろう。マイクロフォンがライブ音楽システムの一部である場合、音源は、ライブ音楽補強システムの一部として使用されるスピーカの1つであり得る。音源はまた、ノイズを生成する機械式デバイスであるであろう。

あるいは、音楽家は、訓練用音源として自分自身の音声または機器を使用し得る。訓練期間中、音楽家は、受容ゾーン内の種々のロケーションに口または機器を位置決めして、歌うかまたは自分の機器を演奏する。再び、マイクロフォンシステムは、すべての周波数帯域におけるマグニチュードおよび時間遅延差を計算するが、エネルギーがほとんど存在しないどんな帯域をも排除する。閾値は、前と同様に、最良適合手法を使用して計算され、情報が乏しい帯域は、近傍の周波数帯域からの内挿によって埋められる。

システムが訓練されると、ユーザは、マイクロフォンを通常動作モードに戻るように切換え、マイクロフォンは、新しく計算された閾値を使用して動作する。さらに、マイクロフォンシステムが、ほぼ正しくなるように訓練されると、マイクロフォン訓練のチェックは、試験信号として演奏の音楽を使用して演奏(または他の使用)の過程を通して定期的に行われる。

図17Bは、本明細書で述べる2つのマイクロフォン要素を組込む携帯電話174を開示する。これらの2つの要素は、マイクロフォン174の底端176に向かって位置し、図17Bがその上に載る(lie)用紙の表面に直角に延びる方向Yに整列する。相応して、マイクロフォン要素は、携帯電話ユーザの口のおよその方向に向けられる。

図18Aおよび18Bを参照すると、2つのグラフが示され、「ブームなし(boomless)」ブームマイクロフォンについて、周波数対マグニチュード閾値(図18A)および周波数対時間遅延閾値(図18B)をプロットする。この実施形態では、マイクロフォンは、Bose Corporation(登録商標)から入手可能なQC2(登録商標)ヘッドセットなどのヘッドセットのイヤカップの一方に対して2つの変換器を有する。このヘッドセットは、人の頭部、胴体、および音声をシミュレートするマネキンの頭部上に配置された。試験信号は、マネキンの口を通して鳴らされ、2つのマイクロフォン要素間のマグニチュードおよび時間差が、取得され、これらの信号が、通信マイクロフォンにおいて所望の信号を表すため、高いスコアが与えられた。さらに、試験信号は、マネキンの頭部の周りのいくつかのロケーションに移動される別の音源を通して鳴らされた。マグニチュードおよび時間差が、取得され、これらが望ましくない妨害器(jammer)を表すため、低いスコアが与えられた。最適適合アルゴリズムが、それぞれの周波数ビンのデータに適用された。それぞれのビンについての計算されたマグニチュードおよび時間遅延閾値は、図18Aおよび18Bのプロットに示される。実際の用途では、これらの閾値は、計算に応じてそれぞれのビンに適用されるであろう。お金を節約するために、これらのプロットを平滑化し、周波数ビンの群に関して少数の閾値を使用することが可能である。あるいは、関数が、平滑化された曲線に適合され、利得を計算するのに使用される。これらの閾値は、例えば、図7のブロック34において適用される。

本発明の別の実施形態では、信号処理において、スルーレート制限が使用される。この実施形態は、スルーレート制限がブロック40で使用されることを除いて図7の実施形態と同じである。スルーレート制限は、雑音のある信号を平滑化するための非線形方法である。上述した実施形態に適用されると、方法は、利得制御信号(例えば、図7のブロック40から出て来る)が、あまりにも速く変化する(可聴アーチファクトをもたらすであろう)のを防止する。それぞれの周波数ビンについて、利得制御信号は、1つのブロックから次のブロックへ指定された値より大きく変化することを許容されない。値は、利得が減少する場合と利得が増加する場合で異なる。そのため、(図7のブロック40内の)スルーレート制限器の出力から、(例えば、図7の変換器12からの)オーディオ信号に実際に適用される利得は、計算された利得より遅れる可能性がある。

図19を参照すると、点線170は、時間に対してプロットされた特定の周波数ビンについての計算された利得を示す。実線172は、スルーレート制限が適用された後に生じるスルーレート制限された利得を示す。この例では、利得は、100db/秒より速く立上ることを許容されず、また、200db/秒より速く立下がることを許容されない。スルーレートの選択は、競合因子によって確定される。スルーレートは、好ましくない音響源の排除を最大にするために、できる限り速くあるべきである。しかし、可聴アーチファクトを最小にするために、スルーレートは、できる限り遅くあるべきである。利得は、問題のない音響心理因子(psychoacoustic factors)に基づいて、スルーアップされるのと比べてゆっくりスルーダウンされ得る。

そのため、t=0.1秒と0.3秒との間では、計算された利得が閾値より速く立上るため、適用される利得(スルーレート制限された)は、計算された利得より遅れる。t=0.5と0.6との間では、計算された利得が閾値より遅いレートで立下るため、計算された利得と適用される利得は同じである。t=0.6を超えると、計算された利得は、閾値より速く立下り、適用される利得は、追いつくことができるまで再び遅れる。

3つ以上の変換器を使用する別の例は、その音源距離および角度推定値が比較される複数の変換器対を作ることである。残響音場では、音源による任意の2点で測定される音圧間のマグニチュードおよび位相関係は、自由場において同じ2点で測定される関係と実質的に異なり得る。結果として、室内の1つの特定のロケーションの音源および室内の別の特定のロケーションの一対の変換器について、1つの周波数におけるマグニチュードおよび位相関係は、音源の物理的ロケーションがたとえ受容窓の外側にあっても、受容窓内に入り得る。この場合、距離および角度推定値は誤りである。しかし、通常の室内では、短い距離だけ離れたところで行われた、その同じ周波数についての距離および角度推定値は、おそらく正しい。複数対のマイクロフォン要素を使用するマイクロフォンシステムは、それぞれの周波数ビンについて音源の距離および角度の複数の同時推定を行い、大多数の他の対からの推定に一致しない推定を排除し得る。

先のパラグラフで述べたシステムの例は、図20を参照して説明されるであろう。マイクロフォンシステム180は、リニアアレイで配列された4つの変換器182、184、186、および188を含む。変換器のそれぞれの隣接対間の距離は、実質的に同じである。このアレイは、密接して間隔をあけた変換器の3つの対182-184/184-186/186-188、中程度に間隔をあけた変換器の2つの対182-186/184-188、ならびに、遠くに間隔をあけた変換器の1つの対182-188を有する。変換器のこれらの6つの対のそれぞれについての出力信号は、例えば、信号プロセッサ190内で、図7を参照して(ボックス34までで)先に説明したように処理される。受容または排除決定は、それぞれの周波数についてそれぞれの対について行われる。換言すれば、マグニチュード関係(例えば、比)が、閾値の一方の側に入るか、他の側に入るかが、それぞれの変換器対について判定される。それぞれの対についての受容または排除決定は、当業者に知られている種々の基準に基づいてボックス194において重み付けされ得る。例えば、広く間隔をあけた変換器対182-188は、高周波数において、小さい重みが与えられる。重み付けされた受容は、結合され、ボックス196において、結合され重み付けされた排除と比較されて、その周波数ビンについての最終の受容または排除決定が行われる。換言すれば、総合的なマグニチュード関係が、閾値の一方の側に入るか、他の側に入るかが決定される。この決定に基づいて、利得が、ボックス198において確定され、この利得が、図7の場合と同様に、変換器の1つの出力信号に適用される。このシステムは、残響室内で音源を受容するときに、偽陽性エラーをほとんど生じない。

図21を参照して述べる別の例では、マイクロフォンシステム200は、4面仮想多角形の頂点に配列された4つの変換器202、204、206、および208を含む。この例では、多角形は、正方形の形状であるが、多角形は、正方形以外の形状(例えば、矩形、平行四辺形など)であり得る。さらに、5つ以上の変換器が、5つ以上の面の多角形の頂点で使用され得る。このシステムは、前方向「A」を向く2つの前を向く対202-206/204-208、側面BおよびCを向く2つの側面を向く対202-204/206-208、ならびに、2つの斜めに向く対204-206/202-208を有する。変換器のそれぞれの対についての出力信号は、ボックス210において処理され、前のパラグラフで述べたようにボックス212において重み付けされる。ボックス214において先に説明したように、最終の受容または排除決定が行われ、対応する利得が、ボックス216にて関心周波数について選択される。この例は、90°オフアクシスに位置する、例えば、ロケーションBおよび/またはCの音源の場合であっても、マイクロフォンシステム200が、音源距離を確定することを可能にする。もちろん、5つ以上の変換器が使用され得る。例えば、変換器の10の対を形成する5つの変換器が使用され得る。一般に、より多くの変換器を使用することは、音源の距離および角度のより正確な確定をもたらす。

さらなる実施形態では、4つの変換器(例えば、無指向性マイクロフォン)202、204、206、および208のうちの1つがなくされる。例えば、変換器202がなくされる場合、両方向に無限遠に延びる仮想直線によって接続され得る変換器204および208、この線から離れて位置する変換器206が得られるであろう。こうした配置構成は、音源の距離および角度を確定するのに使用され得る変換器の3つの対204-208、206-208、および204-206をもたらす。

本発明は、上述した実施形態を参照して述べられた。しかし、本発明の範囲から逸脱することなく、当業者によって変形および変更が行われ得ることが理解されるであろう。

10 音響ピックアップデバイス
11、180、200 マイクロフォンシステム
12、14、64、66、68、182、184、186、188、202、204、206、208 変換器
15 点音源
16、18、70、72、74 前置増幅器
20、76 A/D変換器
22、46、78 ウィンドウ
24、80 FFT
26、32、92、96、100 デバイダ
28、94 dB
30、98 φ
32 τ
34、41 音響変換器
36、38 ユーザ入力
40、198、216 利得
42 マルチプレクサ
44 逆FFT
48 D/A変換器
82 高周波数選択
84 低周波数選択
86 低周波数と高周波数を結合
88 増幅器
90 スピーカ
100 T1 dB
102 T2 dB
108、110、128、130 非線形
116、134、136 加算器
118 0〜5kHzを選択
120 2.5〜5kHzを選択
122 5〜10kHzへシフトアップする
124 10〜20kHzへシフトアップする
126 結合する
150 イヤフォン
152 イヤピース
153 ワイヤ束
154 マイクロフォン
174 携帯電話
176 底面
190 信号プロセッサ

Claims

マイクロフォンシステムであって、
シリコンチップと、
特性を表すデータをキャプチャするための、音響波の特性に応答する、前記チップに固定された２つのトランスデューサーと、
前記チップに固定された、前記データを処理するための信号プロセッサと、
を具備し、
前記トランスデューサーは、約７０mm以下の距離だけ離れており、
前記信号プロセッサは、(a)どのデータが、トランスデューサーから一定の距離より近くに位置する１つまたは複数の音源を表すか、また、(b)どのデータが、トランスデューサーから一定の距離より遠くに位置する１つまたは複数の音源を表すかを判定し、
前記信号プロセッサは、音源が、トランスデューサーからの距離に基づいて互いから識別されるように、前記(a)または(b)の一方の音源を表すデータに対して前記(a)または(b)の他方の音源を表すデータの大きな強調を提供することを特徴とするマイクロフォンシステム。