JP5710792B2

JP5710792B2 - 可聴音と超音波とを用いたソース特定のためのシステム、方法、装置、およびコンピュータ可読媒体

Info

Publication number: JP5710792B2
Application number: JP2013556775A
Authority: JP
Inventors: ビッサー、エリック; モメヤー、ブライアン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2011-03-03
Filing date: 2012-02-27
Publication date: 2015-04-30
Anticipated expiration: 2032-02-27
Also published as: KR101548848B1; US9354310B2; KR20130137020A; US20120224456A1; CN103443649B; EP2681586B1; JP2014514794A; WO2012161825A1; EP2681586A1; CN103443649A

Description

米国特許法第１１９条に基づく優先権の主張
本特許出願は、２０１１年３月３日に出願され、本出願の譲受人に譲渡された「ＲＯＢＵＳＴＭＵＬＴＩＭＩＣＲＯＰＨＯＮＥＴＲＡＣＫＩＮＧＳＹＳＴＥＭＵＳＩＮＧＡＵＤＩＢＬＥＳＯＵＮＤＡＮＤＵＬＴＲＡＳＯＵＮＤ」と題する仮出願第６１／４４８，９５０号の優先権を主張する。

本開示は信号処理に関する。

雑音の多い環境でボイス録音（たとえば、通信用）が行われる適用例では、所望の音声信号を背景雑音から分離することが望ましいことがある。雑音は、所望の信号と干渉するかあるいは所望の信号を劣化させるすべての信号の合成と定義され得る。背景雑音は、他の人々の背景会話など、音響環境内で発生される多数の雑音信号、ならびに所望の信号および／または他の信号のいずれかから発生される反射および残響を含み得る。所望の音声信号が背景雑音から分離されない限り、所望の音声信号を確実に効率的に利用することが困難であることがある。

典型的な使用環境において受ける音響雑音は、音楽、干渉ソース（たとえば、ＴＶセット、ラジオ、競合話者）からの音、多重漏話雑音、街頭雑音、および／または空港雑音など、様々な異なる成分を含み得る。そのような雑音は、一般的には非静止であり、ユーザ自身の声のスペクトルに近い平均スペクトルを有し得るので、従来のシングルマイクロフォンまたは固定ビームフォーミングタイプ方法を使ってモデル化しにくい場合がある。したがって、空間選択処理など、マルチプルマイクロフォンベースの信号処理技術を使って、雑音のある環境における音声成分の分離をサポートすることが望ましい場合がある。

ボイス録音のための一部のアプリケーションにおいて、マイクロフォンに対する、ユーザの口の場所は、使用中に変わり得る。たとえば、ボイス通信用アプリケーションは、ユーザの口が、使用中にオーディオ感知デバイスから、ある程度の距離だけ離れて配置されるシナリオを含むように、従来のテレフォニーを超えて発展しつつある。そのようなシナリオの例には、ラップトップまたはタブレットコンピュータに組み込まれた、マイクロフォン（および可能性としてはウェブカム）を使うボイスオーバＩＰ（ＶｏＩＰ）テレフォニーがある。そのようなケースにおいて、デバイスに対する、ユーザの口の動きは、空間選択処理演算の実施に大幅に影響し得る。

一般的構成による信号処理の方法は、超音波信号の反射からの情報に基づいて、音放射体のレンジを推定することを含む。この方法は、推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択することと、選択された到着方向推定演算を実施して、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、オーディオ周波数成分の到着方向の推定値を算出することとを含む。機能を読み取る機械にそのような方法を実施させる有形機能（ｔａｎｇｉｂｌｅｆｅａｔｕｒｅ）を有するコンピュータ可読記憶媒体も開示される。

別の一般的構成による、信号処理のための装置は、超音波信号の反射からの情報に基づいて、音放射体のレンジを推定するための手段と、推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択するための手段と、選択された到着方向推定演算を実施して、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、オーディオ周波数成分の到着方向の推定値を算出するための手段とを含む。

別の一般的構成による、信号処理のための装置は、超音波信号の反射からの情報に基づいて、音放射体のレンジを推定するように構成されたレンジ推定器と、推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択するように構成された比較器と、選択された到着方向推定演算を実施して、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、オーディオ周波数成分の到着方向の推定値を算出するように構成された方向計算器とを含む。

マルチマイクロフォンオーディオ感知デバイスＤ１０のブロック図。デバイスＤ１０の適用の一例を示す図。到着方向およびレンジが所望のソースＡＳ１に関連付けられた例を示す図。装置Ｄ１０の実装形態Ｄ２０のブロック図。デバイスＤ１０の４マイクロフォン実装形態Ｄ１２の適用の一例を示す図。一般的構成による方法Ｍ１００のフローチャート。利得差ベースのＤＯＡ推定方法の例を示す図。利得差ベースのＤＯＡ推定方法の例を示す図。非対称アレイについてのビームパターンの例を示す図。ビームフォーマビームパターンの例を示す図。ビームフォーマビームパターンの例を示す図。マルチチャネル信号に基づいてビームを発生するように配列された固定フィルタの例を示す図。マルチチャネル信号に基づいてビームを発生するように配列された固定フィルタの例を示す図。デバイスＤ２０の３マイクロフォン実装形態Ｄ２２の適用の平面図。方向マスキング関数の個々の例を示す図。方向マスキング関数の個々の例を示す図。方向マスキング関数の個々の例を示す図。方向マスキング関数の個々の例を示す図。３つの方向マスキング関数からなる２つのセットの例を示す図。図９に示す、３つの方向マスキング関数からなるセットを同じマルチチャネルオーディオ信号に適用した結果を示す図。デバイスＤ２０の４マイクロフォン実装形態Ｄ２４とともに使われるセクタベースのＤＯＡ推定方法の例を示す図。デバイスＤ２０の４マイクロフォン実装形態Ｄ２４とともに使われるセクタベースのＤＯＡ推定方法の例を示す図。デバイスＤ２０の４マイクロフォン実装形態Ｄ２４とともに使われるセクタベースのＤＯＡ推定方法の例を示す図。デバイスＤ２０の４マイクロフォン実装形態Ｄ２４とともに使われるセクタベースのＤＯＡ推定方法の例を示す図。方法Ｍ１００の適用の一例を示す図。方法Ｍ１００の適用の一例を示す図。方法Ｍ１００の適用の一例を示す図。方法Ｍ１００の適用の一例を示す図。異なる立上りおよび立下り閾値をもつ状態遷移のプロット。オーディオ感知デバイスＤ２０の実装形態の例の一部分を示す図。オーディオ感知デバイスＤ２０の実装形態の例の一部分を示す図。測距パルスの複数のエコーを生成する環境の例を示す図。複数のエコーを含む検出信号の録音のプロット。図１９の信号と、対応するスペクトグラムとを示す図。超音波検出器ＵＤ１０によって生成された信号のプロット。レンジのあいまいさを示す図。複数の超音波検出器からの測距結果を使う、ＤＯＡ推定の適用の例を示す図。複数の超音波検出器からの測距結果を使う、ＤＯＡ推定の適用の例を示す図。複数の超音波検出器からの測距結果を使う、ＤＯＡ推定の適用の例を示す図。時間Ａにおける典型的な使用シナリオを示す図。時間Ｂにおける典型的な使用シナリオを示す図。図２５、図２６と異なる連続する時間における３チャネル超音波録音の例を示す図。図２４、図２６と異なる連続する時間における３チャネル超音波録音の例を示す図。図２４、図２５と異なる連続する時間における３チャネル超音波録音の例を示す図。一般的構成による装置Ａ１００のブロック図。装置Ａ１００の実装形態Ａ１１０の適用のブロック図。装置Ａ１００の実装形態Ａ１２０のブロック図。装置Ａ１００の実装形態Ａ１３０の適用のブロック図。装置Ａ１００の実装形態Ａ１４０のブロック図。超音波領域推定器１００の実装形態１２０のブロック図。装置Ａ１００の実装形態Ａ１５０のブロック図。一般的構成による装置ＭＦ１００のブロック図。装置Ａ１００の実装形態Ａ１６０のブロック図。マイクロフォンアレイの例Ｒ１００のブロック図。アレイＲ１００の実装形態Ｒ１１０のブロック図。オーディオ感知デバイスＤ２０の実装形態Ｄ１００のブロック図。通信デバイスＤ２００のブロック図。デバイスＤ１００のポータブルコンピューティング実装形態Ｄ７００のあるビューを示す図。デバイスＤ１００のポータブルコンピューティング実装形態Ｄ７００の別のビューを示す図。デバイスＤ１００のポータブルコンピューティング実装形態Ｄ７１０のあるビューを示す図。デバイスＤ１００のポータブルコンピューティング実装形態Ｄ７１０の別のビューを示す図。マルチマイクロフォンオーディオ感知デバイスＤ１００のポータブル実装形態Ｄ８００の図。会議デバイスのある例の上面図。会議デバイスの別の例の上面図。会議デバイスのさらに別の例の上面図。会議デバイスのさらに別の例の上面図。ＤＯＡ推定のための逆投影技法を示す図。

本説明は、超音波測距を使って、オーディオ周波数成分の到着方向を推定するための演算を構成するシステム、方法、および装置の開示を含む。そのような演算により、方向選択オーディオ処理演算のより優れた実施をサポートするための、より正確なソース特定ができるようになる。

それの文脈によって明確に限定されない限り、「信号」という用語は、本明細書では、ワイヤ、バス、または他の伝送媒体上に表されたメモリロケーション（またはメモリロケーションのセット）の状態を含む、それの通常の意味のいずれをも示すのに使用される。その文脈によって明確に限定されない限り、「発生（generating）」という用語は、本明細書では、計算（computing）または別様の生成（producing）など、その通常の意味のいずれをも示すのに使用される。その文脈によって明確に限定されない限り、「算出（calculating）」という用語は、本明細書では、複数の値からの計算（computing）、評価、推定、および／または選択など、その通常の意味のいずれをも示すのに使用される。それの文脈によって明確に限定されない限り、「取得（obtaining）」という用語は、算出（calculating）、導出、（たとえば、外部デバイスからの）受信、および／または（たとえば、記憶要素のアレイからの）検索など、それの通常の意味のいずれをも示すのに使用される。その文脈によって明確に限定されない限り、「選択（selecting）」という用語は、２つ以上のセットのうちの少なくとも１つ、およびすべてよりも少数を識別、指示、適用、および／または使用することなど、その通常の意味のいずれをも示すのに使用される。「備える（comprising）」という用語は、本明細書および特許請求の範囲において使用される場合、他の要素または動作を除外しない。「に基づく」（「ＡはＢに基づく」など）という用語は、（ｉ）「から導出される」（たとえば、「ＢはＡのプリカーサーである」）、（ｉｉ）「少なくとも〜に基づく」（たとえば、「Ａは少なくともＢに基づく」）、および特定の文脈で適当な場合に、（ｉｉｉ）「に等しい」（たとえば、「ＡはＢに等しい」）という場合を含む、その通常の意味のいずれをも示すのに使用される。同様に、「に応答して」という用語は、「少なくとも〜に応答して」を含む、その通常の意味のいずれをも示すのに使用される。

マルチマイクロフォンオーディオ感知デバイスのマイクロフォンの「ロケーション」への言及は、文脈によって別段に規定されていない限り、マイクロフォンの音響的に敏感な面の中心のロケーションを示す。「チャネル」という用語は、特定の文脈に応じて、時々、信号経路を示すのに使用され、また他のときには、そのような経路によって搬送される信号を示すのに使用される。別段に規定されていない限り、「一連」という用語は、２つ以上のアイテムのシーケンスを示すのに使用される。「対数」という用語は、１０を底とする対数を示すのに使用されるが、他の底へのそのような演算の拡張は本開示の範囲内である。「周波数成分」という用語は、（たとえば、高速フーリエ変換によって生成される）信号の周波数領域表現のサンプル、あるいは信号のサブバンド（たとえば、バーク尺度またはメル尺度サブバンド）など、信号の周波数または周波数帯域のセットのうちの１つを示すのに使用される。

別段に規定されていない限り、特定の特徴を有する装置の動作のいかなる開示も、類似の特徴を有する方法を開示する（その逆も同様）ことをも明確に意図し、特定の構成による装置の動作のいかなる開示も、類似の構成による方法を開示する（その逆も同様）ことをも明確に意図する。「構成」という用語は、その特定の文脈によって示されるように、方法、装置、および／またはシステムに関して使用され得る。「方法」、「プロセス」、「プロシージャ」、および「技法」という用語は、特定の文脈によって別段に規定されていない限り、一般的、互換的に使用される。「装置」および「デバイス」という用語も、特定の文脈によって別段に規定されていない限り、一般的、互換的に使用される。「要素」および「モジュール」という用語は、一般に、より大きい構成の一部分を示すのに使用される。その文脈によって明確に限定されない限り、「システム」という用語は、本明細書では、「共通の目的を果たすために相互作用する要素のグループ」を含む、その通常の意味のいずれをも示すのに使用される。また、文書の一部分の参照によるいかなる組込みも、その部分内で参照される用語または変数の定義が、その文書中の他の場所、ならびに組み込まれた部分中で参照される図に現れた場合、そのような定義を組み込んでいることを理解されたい。

近距離は、受音機（たとえば、マイクロフォンアレイ）から１波長未満離れている空間の領域として定義され得る。この定義では、領域の境界までの距離は、周波数に反比例して変化する。たとえば、２００、７００、および２０００ヘルツの周波数では、１波長境界までの距離は、それぞれ約１７０、４９、および１７センチメートルである。代わりに、近距離／遠距離境界がマイクロフォンアレイから特定の距離（たとえば、アレイのマイクロフォンまたはアレイの重心から５０センチメートル、あるいはアレイのマイクロフォンまたはアレイの重心から１メートルまたは１．５メートル）にあると見なすことが有用であることがある。

マルチマイクロフォンデバイスは、空間内の１つまたは複数のソースから音響信号を受信するための（たとえば、デバイスのユーザから音声を受信するための）空間選択処理演算を実施するとともに、他の方向から到着する音を抑えるように構成され得る。図１Ａは、２つのマイクロフォンＭＣ１０およびＭＣ２０からなるアレイを含むマルチマイクロフォンデバイスＤ１０の例を示す。デバイスＤ１０の他の例では、マイクロフォンアレイは、２つより多いマイクロフォン（たとえば、３、４、またはそれ以上）を含み得る。そのようなケースにおいて、マイクロフォンは、線形または２もしくは３次元パターンで配設することができ、アレイ中の隣接するマイクロフォンの間の間隔は均一または不均一であり得る。

図１Ｂは、可聴音源ＡＳ１の方向を含む領域（「ピックアップ領域」ともいう）から到着する音を、他の方向から到着する音に対して強めるようにデバイスＤ１０が構成されるアプリケーションの例を示す。ソースＡＳ１（たとえば、デバイスのユーザ）は、時間経過に伴ってあるロケーションから別のロケーションに動くことができ、ソースの現在のロケーションに基づいて、空間選択処理演算を適合させることが望ましい場合がある。デバイスＤ１０は、空間内の異なる様々なロケーションに置かれ得る、複数の所望のソースから到着する音を強調するようにも実装され得る。

図１Ｄは、本明細書に記載する方法Ｍ１００の実装形態を実施するように構成され得るデバイスＤ１０の実装形態Ｄ２０の例を示す。デバイスＤ２０は、超音波エミッタＵＥ１０と、超音波検出器ＵＤ１０とを含む。後で説明するように、検出器ＵＤ１０をマイクロフォンとして（たとえば、マイクロフォンアレイ中の別のマイクロフォンとして）実装することが望ましい場合がある。デバイスＤ１０またはＤ２０の事例を含むように構成され得るオーディオ感知デバイスの例には、セットトップボックス、ゲーム機、スマートフォン、ならびにラップトップおよびタブレットコンピュータがある。

図２Ａは、デバイスの前の複数の異なるピックアップ領域１、２、３のうち１つから到着する音を強めるように、また、現在選択されている領域の外の方向から到着する音を抑えるように空間選択処理演算が構成される、デバイスＤ１０の４マイクロフォン実装形態Ｄ１２の適用の例を示す。そのようなデバイスを、所望の話者の推定される現在のロケーションにより現在のピックアップ領域を選択するように構成することが望ましい場合がある。図２Ａに示す例において、空間選択処理演算は、領域１から領域２への、話者の声の推定到着方向の変化に応答して適応中である。

可聴ソースＡＳ１などの方向性音源から、マルチマイクロフォンアレイによって受信された音成分の到着方向を推定するように、デバイスＤ１０を構成することが望ましい場合がある。そのようなＤＯＡ推定は、たとえば、所望のソースの動きに応答した、空間選択処理演算の適合をサポートするのに有用であり得る。デバイスＤ１０は、到着方向（ＤＯＡ）を推定するためのいくつかの異なる技法のうち、どの１つまたは複数も実施するように構成され得る。類似空間解像度をもつソースＤＯＡの推定値を生成すると予想され得るＤＯＡ推定のための技法は、利得差ベースの方法と、位相差ベースの方法とを含む。相互相関ベースの方法（たとえば、マルチチャネル信号のチャネルの間の遅れを算出し、遅れを、ＤＯＡを判断するための到着時間差として使う）も、いくつかのケースでは有用であり得る。

ＤＯＡ推定演算は、マルチチャネル信号の一連のセグメントの各々についてのＤＯＡ推定値を生成するように構成され得る。典型的なセグメント長は約５または１０ミリ秒から約４０または５０ミリ秒にわたり、セグメントは、重複しても（たとえば、隣接するセグメントが２５％または５０％だけ重複する）、重複しなくてもよい。１つの特定の例では、マルチチャネル信号は、１０ミリ秒の長さをそれぞれ有する一連の重複しないセグメントまたは「フレーム」に分割される。別の特定の例では、各フレームは２０ミリ秒の長さを有する。また、ＤＯＡ推定演算によって処理されるセグメントは、異なるオーディオ処理演算によって処理されるより大きいセグメントのセグメント（すなわち、「サブフレーム」）であり得、またはその逆も同様である。

利得差ベースの方法は、マルチチャネル信号のチャネルに基づく、信号の利得の間の差に基づいてＤＯＡを推定する。たとえば、そのような方法は、マルチチャネル信号の異なるチャネルの利得の間の差（たとえば、規模またはエネルギーの差）に基づいて、ＤＯＡを推定するように実装され得る。マルチチャネル信号のセグメントの利得の測度は、時間領域または周波数領域（たとえば、ＦＦＴ、ＤＣＴ、またはＭＤＣＴ領域などの変換領域）で算出することができる。そのような利得測度の例には、限定はしないが、合計の大きさ（たとえば、サンプル値の絶対値の和）、平均の大きさ（たとえば、サンプル当たり）、ＲＭＳ振幅、中央値の大きさ、最大振幅、ピークエネルギー、総エネルギー（たとえば、サンプル値の平方和）、および平均エネルギー（たとえば、サンプル当たり）がある。利得差技法を用いて正確な結果を得るために、２つのマイクロフォンチャネルの応答が互いに較正されることが望ましいことがある。利得測度の算出がマルチチャネル信号のオーディオ周波数成分に限定されるように、マルチチャネル信号に低域フィルタを適用することが望ましい場合がある。

利得の間の差は、対数領域における各チャネルについての対応する利得測度値（たとえば、デシベルでの値）の間の差として、または、等価には、線形領域における利得測度値の間の比として算出することができる。いくつかのケースでは、フレームについて（たとえば、各フレームについて、または随時フレームについて）、単一の差が算出され得る。他のケースでは、フレームのいくつかの周波数成分（たとえば、サブバンドまたはＦＦＴビン）の各々について、差が算出され得る。

較正マイクロフォンペアの場合、ソースが各マイクロフォンから等距離である（すなわち、ペアの横方向に配置されている）ことを示すように、ゼロの利得差をとることができ、ソースが、一方のマイクロフォンにより接近している（すなわち、ペアの一方の縦方向に配置されている）ことを示すように、大きい正の値をもつ利得差をとることができ、ソースが他方のマイクロフォンにより接近している（すなわち、ペアの他方の縦方向に配置されている）ことを示すように、大きい負の値をもつ利得差をとることができる。図３Ａは、セグメントｎについての利得差ＧＤ［ｎ］と、利得差閾値Ｔ_Lとの間の関係の状態により、縦領域１、横領域２、および縦領域３のうち１つを選択することによって、デバイスＤ１０に相対したソースのＤＯＡが推定される例を示す。図３Ｂは、利得差ＧＤ［ｎ］と第１の利得差閾値Ｔ_L1との間の関係の状態ならびに利得差ＧＤ［ｎ］と第２の利得差閾値Ｔ_L2との間の関係の状態により、５つの領域のうち１つを選択することによって、デバイスＤ１０に相対したソースのＤＯＡが推定される例を示す。

別の例では、利得差ベースの方法は、マルチチャネル信号から（たとえば、マルチチャネル信号のオーディオ周波数成分から）生成されたビームの間の利得の差に基づいてＤＯＡを推定する。そのような方法は、所望の方向レンジ（たとえば、１０度ずつの増分で１８０度）にわたる、対応する１組のビームを発生するための１組の固定フィルタを使うように実装され得る。そのような手法は、固定フィルタの各々をマルチチャネル信号に適用し、最も高い出力エネルギーを呈するビームのルック方向として、（たとえば、各セグメントについて）ＤＯＡを推定する。図６Ａは、マルチチャネル信号Ｓ１０をフィルタリングして、それぞれのビームＢ１０ａ、Ｂ１０ｂ、およびＢ１０ｎを発生するように配列された固定フィルタＢＦ１０ａ、ＢＦ１０ｂ、およびＢＦ１０ｎを含むような構成の例を示す。固定フィルタを発生するのに使われ得るビームフォーミング手法の例には、一般化サイドローブ消去（ＧＳＣ：generalized sidelobe cancellation）、最小分散無ひずみ応答（ＭＶＤＲ：minimum variance distortionless response）、および線形制約最小分散（ＬＣＭＶ：linearly constrained minimum variance）ビームフォーマがある。固定フィルタを発生するのに使われ得るビーム発生手法の他の例には、ヌルビームを干渉点ソースに向けてステアリングすることによって動作する、独立成分分析（ＩＣＡ）および独立ベクトル分析（ＩＶＡ）などのブラインドソース分離（ＢＳＳ）方法がある。

図４および図５は、それぞれ、１５００Ｈｚおよび２３００Ｈｚにおける、３つのマイクロフォンからなるアレイ（点線）の場合、および４つのマイクロフォンからなるアレイ（実線）の場合のビームフォーマビームパターンの例を示す。これらの図において、左上のプロットＡは、約６０度のルック方向をもつビームフォーマについてのパターンを示し、中央下のプロットＢは、約９０度のルック方向をもつビームフォーマについてのパターンを示し、右上のプロットＣは、約１２０度のルック方向をもつビームフォーマについてのパターンを示す。線形アレイに（たとえば、隣接するマイクロフォンの間の間隔が約３．５ｃｍで）並べられた３または４つのマイクロフォンを用いるビームフォーミングは、約１０〜２０度の空間帯域幅区別を取得するのに使うことができる。図３Ｃは、非対称アレイについてのビームパターンの例を示す。

さらなる一例では、利得差ベースの方法は、（たとえば、上述したビームフォーミングまたはＢＳＳ方法を使って）マルチチャネル信号から生成されたビームのチャネルの間の利得の差に基づいてＤＯＡを推定して、マルチチャネル出力を生成する。たとえば、固定フィルタが、特定の方向もしくはソース（たとえば、ルック方向）から到着するエネルギーを、１つの出力チャネルに集中させ、かつ／または別の方向もしくはソースから到着するエネルギーを、異なる出力チャネルに集中させることによって、そのようなビームを発生するように構成され得る。図６Ｂは、マルチチャネル信号Ｓ１０をフィルタリングして、（たとえば、それぞれのルック方向に対応する）信号チャネルＢ２０ａｓ、Ｂ２０ｂｓ、およびＢ２０ｎｓと、雑音チャネルＢ２０ａｎ、Ｂ２０ｂｎ、およびＢ２０ｎｎとを有するそれぞれのビームを発生するように配列された固定フィルタＢＦ２０ａ、ＢＦ２０ｂ、およびＢＦ２０ｎを含む、そのような構成の例を示す。そのようなケースにおいて、利得差ベースの方法は、ＤＯＡを、出力チャネルの間のエネルギーの差が最も大きいビームのルック方向として推定するように実装され得る。

ＤＯＡ推定値は、ＢＳＳ逆混合行列Ｗとマイクロフォン間隔とを直接使うことによって取得することもできる。そのような技法は、逆混合行列Ｗの逆（たとえば、ムーア−ペンローズ擬似逆）、それに続く逆投影データに対する単一ソースＤＯＡ推定を使って、分離されたソース信号の逆投影を使うことによって、（たとえば、ソースとマイクロフォンの各ペアについての）ソースＤＯＡを推定することを含み得る。そのようなＤＯＡ推定方法は、一般的には、マイクロフォン利得応答較正におけるエラーに対して堅牢である。ＢＳＳ逆混合行列Ｗは、ｍ個のマイクロフォン信号Ｘ₁〜Ｘ_Mに適用され、逆投影されるべきソース信号Ｙ_jが、行列Ｗの出力から選択される。各ソース−マイクロフォンペアについてのＤＯＡは、ＧＣＣ−ＰＨＡＴまたはＳＲＰ−ＰＨＡＴなどの技法を使って、逆投影信号から計算することができる。最尤および／または複数の信号分類（ＭＵＳＩＣ）アルゴリズムも、ソース特定のために逆投影信号に適用され得る。上述した逆投影方法については、図３７に示す。

位相差ベースの方法は、マルチチャネル信号の異なるチャネルの位相の間の差に基づいてＤＯＡを推定する。そのような方法は、クロスパワースペクトル密度ベクトルの各要素をその規模によって正規化することによって算出され得る、マルチチャネル信号の（たとえば、マルチチャネル信号のオーディオ周波数成分の）白色化相互相関法（ＣＰＳＰ）に基づく技法を含む。そのような技法の例には、位相変換を伴う一般化相互相関（ＧＣＣ−ＰＨＡＴ：generalized cross-correlation with phase transform）およびステアード応答パワー位相変換（ＳＲＰ−ＰＨＡＴ：steered response power-phase transform）があり、これらは一般的には、推定ＤＯＡを、到着時間差の形で生成する。位相差ベースの手法の１つの可能利点は、マイクロフォンの利得応答の間の不一致に対して一般的に堅牢なことである。

他の位相差ベースの方法は、調べられるべき複数の周波数成分の各々について、各チャネル中の位相を推定することを含む。一例では、周波数成分の位相は、周波数成分のＦＦＴ係数の虚数項と、周波数成分のＦＦＴ係数の実数項との比の逆正接（アークタンジェントともいう）として推定される。調べられるべき各周波数成分についての位相差Δφを、１次チャネル中のその周波数成分についての推定位相を、別の（たとえば、２次）チャネル中のその周波数成分についての推定位相から減算することによって算出することが望ましい場合がある。そのようなケースにおいて、１次チャネルは、デバイスの典型的な使用中にユーザの声を最も直接受信すると予想されるマイクロフォンに対応するチャネルなど、信号対雑音比が最も高いと予想されるチャネルであり得る。

ＤＯＡ推定方法が信号の帯域幅全体にわたって位相差を考慮することは不要であり得る。たとえば、広帯域レンジ（たとえば、０〜８０００Ｈｚ）内の多くの帯域では、位相推定が実際的でないかまたは不要であり得る。超低周波数における受信波形の位相関係の実際的評価は、一般に、トランスデューサ間で相応して大きい間隔を必要とする。したがって、マイクロフォン間の最大の利用可能な間隔は、低周波限界を確立し得る。一方、マイクロフォン間の距離は、空間エイリアシングを回避するために、最小波長の１／２を超えるべきではない。たとえば、８キロヘルツサンプリングレートは０から４キロヘルツまでの帯域幅を与える。４ｋＨｚ信号の波長は約８．５センチメートルであるので、この場合、隣接するマイクロフォン間の間隔は約４センチメートルを超えるべきではない。マイクロフォンチャネルは、空間エイリアシングを生じ得る周波数を除去するために低域フィルタ処理され得る。

音声信号の予想周波数レンジなど、マルチチャネル信号の限定オーディオ周波数レンジにわたって、ＤＯＡ推定を実施することが望ましい場合がある。位相ベースのＤＯＡ推定方法の１つのそのような例は、ユーザの声のエネルギーのほとんどを含むと予想され得る、７００Ｈｚ〜２０００Ｈｚの周波数レンジについての位相差を算出するように構成される。４キロヘルツ帯域幅信号の１２８点ＦＦＴの場合、７００〜２０００Ｈｚのレンジは、ほぼ、第１０のサンプルから第３２のサンプルまでの２３個の周波数サンプルに対応する。さらなる例では、そのような方法は、約５０、１００、２００、３００、または５００Ｈｚの下限から、約７００、１０００、１２００、１５００、または２０００Ｈｚの上限まで伸びる周波数レンジにわたる位相差を算出するように構成される（これらの下限と上限の２５個の組合せの各々が、明白に企図され開示される）。

発声された音声（たとえば、母音）のエネルギースペクトルは、ピッチ周波数の高調波に局地的ピークをもつ傾向がある。一方、背景雑音のエネルギースペクトルは、比較的構造化されていない傾向がある。したがって、ピッチ周波数の高調波での入力チャネルの成分は、他の成分よりも高い信号対雑音比（ＳＮＲ）をもつと予想され得る。推定ピッチ周波数の倍数に対応する位相差を選ぶように、ＤＯＡ推定方法を構成することが望ましい場合がある。たとえば、算出された位相差の少なくとも２５、５０、または７５パーセント（可能性としてはすべて）が、推定ピッチ周波数の倍数に対応すること、またはそのような成分に対応する方向インジケータには、他のインジケータよりも重く重み付けることが望ましい場合がある。男性話者の場合の約７０〜１００Ｈｚから、女性話者の場合の約１５０〜２００Ｈｚまでの典型的なピッチ周波数レンジ、および（たとえば、ピッチ期間または「ピッチ遅れ」の推定値の形の）ピッチ周波数の現在の推定値は一般的に、音声符号化および／または復号を含むアプリケーション（たとえば、符号励起線形予測（ＣＥＬＰ）およびプロトタイプ波形補間（ＰＷＩ）などのピッチ推定を含むコーデックを使うボイス通信）においてすでに利用可能である。同じ原理が、他の所望の高調波信号にも適用され得る。逆に、音の信号（たとえば、アラーム、電話の音、および他の電子アラート）など、既知の干渉物に対応する周波数成分を無視するように、ＤＯＡ推定方法を構成することが望ましい場合がある。

ＤＯＡ推定方法は、複数の算出位相差のうちの各々について、ＤＯＡの対応する指示を算出するように構成され得る。一例では、各周波数成分のＤＯＡ θ_iの指示は、推定位相差

と周波数ｆ_i

との間の比ｒ_iとして算出される。あるいは、ＤＯＡ θ_iの指示は、量

の（逆余弦とも呼ばれる）逆コサインとして計算することができ、ここでｃは音速（約３４０ｍ／秒）を示し、ｄはマイクロフォン間の距離を示し、

は２つのマイクロフォンの対応する位相推定間のラジアンの差を示し、ｆ_iは、位相推定が対応する周波数成分（たとえば、対応するＦＦＴサンプルの周波数、または対応するサブバンドの中心周波数もしくはエッジ周波数）である。あるいは、到着方向θ_iの指示は、量

の逆コサインとして算出することができ、ここでλ_iは、周波数成分ｆ_iの波長を示す。

別の例では、ＤＯＡの指示は、マルチチャネル信号の対応する周波数成分ｆ_iの到着時間遅延τ_iとして（たとえば、秒で）算出される。たとえば、そのような方法は、

または

などの式を使って、１次マイクロフォンに対する２次マイクロフォンにおける到着時間遅延τ_iを推定するように構成され得る。これらの例において、τ_i＝０という値は、横方向から到着する信号を示し、τ_iの大きい正の値は、基準縦方向から到着する信号を示し、τ_iの大きい負の値は、他の縦方向から到着する信号を示す。値τ_iを算出する際、サンプリング期間など、特定のアプリケーションにとって適切と思われる時間単位（たとえば、８ｋＨｚのサンプリングレートに対して１２５マイクロ秒の単位）または１秒の小数（たとえば、１０^-3、１０^-4、１０^-5、または１０^-6秒）を使うことが望ましい場合がある。到着時間遅延τ_iは、時間領域中の各チャネルの周波数成分ｆ_iを相互相関させることによっても算出され得ることに留意されたい。

位相差ベースの方法は、ＤＯＡを、ＤＯＡインジケータの平均（たとえば、平均値、中央値、またはモード）として推定するように構成され得る。あるいは、そのような方法は、所望のレンジのＤＯＡカバレージを複数のビン（たとえば、０〜１８０度の範囲に対して、３、４、５、６、７、８、９、１０、１１、または１２ビンの固定方式）に分割し、値が各ビンの範囲内であるＤＯＡインジケータの数（すなわち、ビン母集団）を判断することによって、ＤＯＡを推定するように構成され得る。ビンが不均等な帯域幅をもつケースでは、各ビン母集団を対応する帯域幅によって正規化することによって、ビン母集団値を算出することが望ましい場合がある。所望のソースのＤＯＡは、母集団値が最も高いビンに対応する方向として、または現在の母集団値が最も大きい対比をもつ（たとえば、そのビンについての母集団値の長時間平均とは、最も大きい相対規模だけ異なる）ビンに対応する方向として推定され得る。

同様の方法が、１組の方向マスキング関数を使って、所望のレンジのＤＯＡカバレージを複数のセクタ（たとえば、０〜１８０度のレンジの場合、３、４、５、６、７、８、９、１０、１１、または１２個のセクタ）に分割する。隣接するセクタに対する方向マスキング関数は重なってよく、方向マスキング関数のプロファイルは、線形または非線形であり得る。停止帯域と通過帯域との間の１つの遷移または複数の遷移の鋭さが、１つまたは複数の因子（たとえば、信号対雑音比（ＳＮＲ）、雑音フロアなど）の値による動作中に選択可能および／または可変であるように、方向マスキング関数が実装され得る。たとえば、ＳＮＲが低いときは、比較的狭い通過帯域を使うことが望ましい場合がある。セクタは、互いと（たとえば、度またはラジアンでの）同じ角度幅を有してよく、またはセクタのうち２つ以上（可能性としてはすべて）が、互いとは異なる幅を有してもよい。図７は、位相差ベースのＤＯＡ推定のために、３つの重なるセクタからなるセットが、マイクロフォンＭＣ１０およびＭＣ２０に対応するチャネルペアに適用される、デバイスＤ２０の３マイクロフォン実装形態Ｄ２２のそのような適用の平面図を示す。

図８Ａ〜図８Ｄは、方向マスキング関数の個々の例を示し、図９は、３つの方向マスキング関数からなる２つの異なるセット（線形対曲線プロファイル）の例を示す。これらの例において、各セグメントについてのマスキング関数の出力は、調べられている周波数成分の対応する位相差についての通過値の合計に基づく。たとえば、出力は、マスキング関数についての最大可能値に関して合計を正規化することによって算出され得る。当然ながら、マスキング関数の応答は、方向θよりもむしろ時間遅延τまたは比ｒによって表すこともできる。

マイクロフォンアレイは、異なる方向から異なる量の周囲雑音を受信すると予想され得る。図１０は、図９に示す３つの方向マスキング関数からなるセットを同じマルチチャネルオーディオ信号に適用した結果に対する（フレームでの）規模対時間のプロットを示す。この信号に対する様々なマスキング関数の平均応答は大幅に異なることがわかる。マスキング関数出力が、対応する検出閾値を上回る（あるいは、以上である）ことがない限り、そのセクタに対応するＤＯＡがセグメントについてのＤＯＡ推定値として選択されないように、それぞれの検出閾値を各マスキング関数の出力に適用することが望ましい場合がある。

異なるチャネルペアに対応するセクタを評価するように、ＤＯＡ推定方法を構成することも可能である。図１１〜図１４は、デバイスＤ２０の４マイクロフォン実施態様Ｄ２４とともに使われる、そのような方法の例を示す。図１１において、セクタ１は、（１次−２次）マイクロフォンペアＭＣ２０−ＭＣ１０の縦方向に適用されるマスキング関数によって定義され、セクタ２は、マイクロフォンペアＭＣ１０−ＭＣ４０の縦方向に適用されるマスキング関数によって定義され、セクタ３は、マイクロフォンペアＭＣ３０−ＭＣ２０の縦方向に適用されるマスキング関数によって定義される。図１２の例は、マイクロフォンペアＭＣ４０−ＭＣ１０の縦方向に適用されるマスキング関数によって定義される第４のセクタを追加する。図１３および図１４は、各セクタに関連付けられたＤＯＡ推定値を示す２つの同様の例（それぞれ、５および８つのセクタを有する）を示す。これらの例において、各セクタに関連付けられたＤＯＡ推定値は、それぞれのマイクロフォンペアの縦方向に対応する。

マルチチャネル信号の「方向コヒーレンス」は、信号の様々な周波数成分が同じ方向から到着する程度として定義される。理想的に方向的にコヒーレントなチャネルペアの場合、

の値はすべての周波数について定数ｋに等しく、ここで、ｋの値は到着方向θおよび到着時間遅延τに関係する。マルチチャネル信号の方向コヒーレンスは、たとえば、各周波数成分について推定される到着方向が特定の方向にどのくらい良く適合するかに従って、各周波数成分について推定される到着方向をレーティングすることと、次いで、その信号についてのコヒーレンシ測度を取得するために様々な周波数成分についてのレーティング結果を組み合わせることとによって、定量化され得る。したがって、各セクタについてのマスキング関数出力は、そのセクタ内のマルチチャネル信号の方向コヒーレンスの測度である。方向コヒーレンスの測度の算出および適用は、たとえば、国際特許公開ＷＯ２０１０／０４８６２０Ａ１およびＷＯ２０１０／１４４５７７Ａ１（Ｖｉｓｓｅｒら）にも記載されている。

各セクタについてのコヒーレンシ測度を時間平滑化値として生成することが望ましい場合がある。１つのそのような例において、ＤＯＡ推定方法は、コヒーレンシ測度を、直近のｍ個のフレームにわたる平均値として生成するように構成され、ｍの可能値は、４、５、８、１０、１６、および２０を含む。別のそのような例において、この方法は、（１次ＩＩＲまたは再帰的フィルタとしても知られる）ｚ（ｎ）＝βｚ（ｎ−１）＋（１−β）ｃ（ｎ）などの式により、フレームｎについての、平滑化コヒーレンシ測度ｚ（ｎ）を算出するように構成され、ここでｚ（ｎ−１）は、前のフレームについての平滑化コヒーレンシ測度を示し、ｃ（ｎ）は、コヒーレンシ測度の現在の非平滑化値を示し、βは、ゼロ（平滑化なし）から１（更新なし）までの範囲から値が選択され得る平滑化係数である。平滑化係数βの典型的な値は、０．１、０．２、０．２５、０．３、０．４および、０．５を含む。異なるセクタに対応するコヒーレンシ測度を平滑化するのに、βの同じ値を使うことは典型的ではあるが、必要なわけではない。

コヒーレンシ測度の対比は、コヒーレンシ測度の現在値と、経時的コヒーレンシ測度の平均値（たとえば、直近の１０、２０、５０、または１００フレームにわたる平均値、最頻値、または中央値）との間の関係の値（たとえば、差または比）として表され得る。ＤＯＡ推定方法は、漏洩積分器などの時間平滑化関数を使って、またはｖ（ｎ）＝αｖ（ｎ−１）＋（１−α）ｃ（ｎ）などの式により、各セクタについてのコヒーレンシ測度の平均的値を算出するように構成することができ、ここでｖ（ｎ）は、現在のフレームについての平均的値を示し、ｖ（ｎ−１）は、前のフレームについての平均的値を示し、ｃ（ｎ）は、コヒーレンシ測度の現在の値を示し、αは、ゼロ（平滑化なし）から１（更新なし）までの範囲から値が選択され得る平滑化係数である。平滑化係数αの典型的な値は、０．０１、０．０２、０．０５および、０．１を含む。

セクタベースのＤＯＡ推定方法は、信号のＤＯＡを、コヒーレンシ測度が最も大きいセクタに関連付けられたＤＯＡとして推定するように構成され得る。あるいは、そのような方法は、信号のＤＯＡを、コヒーレンシ測度が現時点で最も大きい対比をもつ（たとえば、そのセクタについてのコヒーレンシ測度の長時間平均とは、最も大きい相対規模だけ異なる現在の値をもつ）セクタに関連付けられたＤＯＡとして推定するように構成され得る。位相差ベースのＤＯＡ推定の追加記述は、たとえば、米国特許出願公開第２０１１／００３８４８９号（２０１１年２月１７日公開）および米国特許出願第１３／０２９，５８２号（２０１１年２月１７日出願）に見ることができる。

利得差ベースの手法と位相差ベースの手法の両方について、マルチチャネル信号の限定オーディオ周波数レンジにわたってＤＯＡ推定を実施することが望ましい場合がある。たとえば、低周波数における残響および／または高周波数における所望の信号の減衰に起因する問題を回避するために、中間周波数レンジ（たとえば、１００、２００、３００、または５００〜８００、１００、１２００、１５００、または２０００Ｈｚ）にわたってＤＯＡ推定を実施することが望ましい場合がある。

いくつかのアプリケーションでは、オーディオ感知デバイスに相対した１つまたは複数の方向性音源の各々の位置を特定することが望ましい場合がある。ＤＯＡ推定に加え、たとえば、マイクロフォンアレイに対する各方向性音源のレンジ（すなわち、距離）に関する情報を取得することが望ましい場合がある。そのような情報を使って、オーディオ感知デバイスに相対した、人間話者など、移動する方向性ソースの、時間経過に伴う位置を追跡することが望ましい場合がある。ソース特定のためのアプリケーションの例は、方向性マイクロフォンのステアリング、マルチマイクロフォンアレイのビームのステアリング、音声強調のための空間情報の使用、空間強調再生成のための音場の空間情報の記録（たとえば、波面合成の使用）、マイクロフォンパス利得の制御、オーディオ再生利得の制御、電話会議、テレビ会議、ジェスチャー認識、動き検出、存在検出、撮像センサ（たとえば、カメラ）のステアリングおよび／またはフォーカシング、メガネなし立体視のためのディスプレイの制御、たとえば、ダンス、スポーツ、および／または楽器演奏（たとえば、ダンスダンスレボリューション（日本、東京都、コナミ株式会社）、ＷｉｉＳｐｏｒｔｓ（日本、京都府、任天堂株式会社）、ビデオゲームのＨｅｒｏシリーズ（たとえば、カリフォルニア州サンタモニカのＡｃｔｉｖｉｓｉｏｎＢｌｉｚｚａｒｄ社製ＧｕｉｔａｒＨｅｒｏ、ＢａｎｄＨｅｒｏ、ＤＪＨｅｒｏ））などのアクティビティを含み得る対話型運動関連ゲーム用アプリケーションを含むが、それらに限定されない。そのような技法を実施するのに使われ得るオーディオ感知デバイスの例には、セットトップボックス、ゲーム機、ならびにラップトップおよびタブレットコンピュータがある。

測距のための１つの手法は、ソースによって放射された可聴音の録音から、ソースのレンジを推定するものである（「受動測距」ともいう）。ただし、オーディオ録音から信頼できるレンジ情報を取り出すために、一般的には、マイクロフォンアレイの開口が、アレイと音源との間の距離に匹敵することが望ましい。１メートル以上（たとえば、最大３または４メートル）のレンジの推定をサポートすることが望ましいアプリケーションの場合、ワイヤレス通信用デバイス（たとえば、スマートフォン）および／またはポータブルコンピューティング（たとえば、ネットブックもしくはラップトップ）ならびに他の消費者デバイス（たとえば、セットトップボックス、ゲーム機）などの小型形状因子についての、アレイ開口とソースレンジとの間のそのような関係を取得することが実際的でない可能性がある。そのようなアプリケーションの場合、測距のための能動手法を使うことが望ましい場合がある。

録音アプリケーション（たとえば、ボイス通信用）において、可聴音の放射を利用して能動測距をサポートすると、取り込まれた可聴音場を有する干渉が引き起こされ得る。したがって、能動測距のための別の手法を使うことが望ましい場合がある。１つのそのような手法は、人間が気づかない超音波エネルギーを使う能動測距である。そのような測距は、超音波測距パルスを放射することと、測距されるべきオブジェクト（すなわち、ソース）からのパルスの反射によって引き起こされたエコーを検出することと、パルスの放射から反射エコーの検出までの飛行時間に基づいて、レンジ（たとえば、音源と検出器の間の距離）を算出することとを含み得る。超音波エネルギーは一般的には、オーディオ周波数測定値に対するよりも低い雑音フロアを超音波測定値に対してもたらす、ほとんどの雑音が放射される周波数帯をはるかに上回る周波数帯中で放射および検出される。

可聴音からの超音波測距とＤＯＡ推定の組合せは、撮像データに基づくもの（たとえば、モーションキャプチャ）など、他の特定手法に対する、優れた代替法になり得る。オーディオ処理デバイスへの超音波測距の統合は、一般的には、超低電力インパルスレーダ（ＭＩＲ）または赤外線など、他の測距技術の同様の統合よりも容易である。たとえば、一般的には、オーディオマイクロフォンを超音波検出器として使うことが可能である。超音波測距はまた、そのようなオーディオ処理アプリケーションの典型的な距離レンジ（たとえば、１〜５メートルの距離）において、他の手法よりも正確であり得る。図１Ｃは、到着方向とレンジＲＳ１の両方が所望のソースＡＳ１に関連付けられた例を示す。

超音波測距は、部屋寸法など、環境の他の側面を識別する（たとえば、受信したオーディオ周波数信号に対して実施されるべき残響除去演算を構成する）のも助け得る。一般的には対象となっている唯一のレンジが特定の方向のオブジェクトのレンジである（すなわち、すべての付近のオブジェクトのレンジとは反対に）とき、超音波測距演算は、１つまたは複数の方向性区別方法（たとえば、可聴音からのＤＯＡ推定）と合成され得る。

超音波測距などの測距演算からの情報を使って、ＤＯＡ推定を改善することが望ましい場合がある。たとえば、音源とマイクロフォンアレイとの間の推定距離に基づいて、受信した音からＤＯＡを推定するための異なる方法の間で選択を行うことが望ましい場合がある。受信した音からＤＯＡを推定するためのいくつかの位相差ベースの方法は、ソースがアレイに接近しているとき、エネルギー差ベースの方法よりも良好な結果を生成し得るが、ソースがアレイから離れているときは、エネルギー差ベースの方法がより良好な結果を生成し得る。

そのようなケースにおいて、アプリケーションは、ソースがデバイスに接近しているという指示に応答して、位相差を使ってＤＯＡを推定するように構成すればよい。そのようなケースでは、近距離雑音低減方法を使うこともできる。ソースがデバイスから離れているという指示に応答して、アプリケーションは、エネルギー差ベースのＤＯＡ推定方法（および／または異なる位相差ベースの方法）を代わりに使うように構成され得る。

時間領域相互相関方法は、遠くのソースに対してよりも良好な結果を接近ソースに対して生成し得るが、いくつかの位相差ベースの方法は、最大１〜２メートル以上のソースデバイス距離に対して、良好なＤＯＡ推定結果を生成し得る。利得差ベースの方法の中でも、ビーム強度または品質差に基づく方法が、受信されたオーディオ周波数信号のチャネルの間の利得差に基づく方法よりも、比較的大きいソースデバイス間距離では有効であり得る。

図２Ｂは、タスクＴ１００、Ｔ２００、およびＴ３００を含む一般的構成による方法Ｍ１００についてのフローチャートを示す。放射超音波信号の検出された反射からの情報に基づいて、タスクＴ１００は、音放射体（たとえば、ユーザなど、所望の音源）のレンジを推定する。タスクＴ２００は、推定されたレンジと閾値との間の関係の状態を示す。関係の指示された状態に基づいて、タスクＴ３００は、マルチチャネル信号のオーディオ周波数成分の到着方向推定値を算出する。たとえば、タスクＴ３００は、関係が第１の状態をもつ（たとえば、ソースがアレイに接近している）という、タスクＴ２００による指示に応答して、オーディオ周波数成分のチャネルの間の位相差に基づいてＤＯＡ推定値を算出するように、また、関係が第２の状態をもつ（たとえば、ソースがアレイから離れている）という、タスクＴ２００による指示に応答して、オーディオ周波数成分のチャネルの間のエネルギーの差に基づいてＤＯＡ推定値を算出するように構成することができ、または逆も同様である。別の例では、タスクＴ３００は、２つの異なる利得差ベースの方法のうち、選択された１つ、または２つの異なる位相差ベースの方法のうち、選択された１つ、または本明細書で開示した様々なＤＯＡ推定技法のうち任意のものの間で選択された１つ（もしくはそれ以上）に基づいてＤＯＡ推定値を算出するように構成され得る。上記のように、図１Ｄは、方法Ｍ１００の実装形態を実施するように構成され得るデバイスＤ１０の実装形態Ｄ２０の例を示す。

タスクＴ１００は、サブバンド領域または変換領域（たとえば、ＦＦＴ領域）などの時間領域または周波数領域における検出超音波信号からのレンジを推定するように構成され得る。サブバンド領域例において、タスクＴ１００は、１つまたは複数の時間領域帯域通過フィルタのバンクに時間領域受信信号を通し、各サブバンドの出力エネルギーを測定する。変換領域例では、タスクＴ１００は、受信信号のスペクトグラムを算出し、時間に伴うピーク周波数（たとえば、４０ｋＨｚ）でのエネルギーの発展を監視する（たとえば、図２０参照）。

タスクＴ１００は、受信エコーの時間軸ロケーションを、ＦＦＴ領域におけるエネルギーピークのロケーションとして判断するように構成され得る。時間領域信号の場合、タスクＴ１００は、受信したエコーの時間軸ロケーションを、エネルギーが（個別に、または代替的には、まとめて）エコー検出閾値を上回るサンプルの領域のピークのロケーションとして判断するように構成され得る。エコー検出閾値は固定でも適応的でもよく、領域の最大幅（サンプルで表す）を限定することが望ましい場合がある。タスクＴ１００は、ピークを、領域の最も高いエネルギーサンプルとして、または代替的には、領域の時間の中心として識別するように構成され得る。

タスクＴ１００は、レンジを、（たとえば、メートルもしくはセンチメートルでの）距離測度として、または、等価には、（たとえば、秒、ミリ秒、フレーム期間、もしくはサンプル期間での）時間測度として推定するように構成され得る。タスクＴ１００は、算出されたソースデバイスレンジを、エミッタから反射ソース、検出器へのパスの総距離（たとえば、放射から検出までの総飛行時間）によって示すように構成され得る。あるいは、タスクＴ１００は、総距離または飛行時間を２で除算することによって、算出されたソースデバイスレンジを示す（すなわち、算出されたソースデバイスレンジを、反射ソースとデバイスとの間の距離として示す）ように構成され得る。

タスクＴ１００は、検出超音波信号からパルスが放射される瞬間（すなわち、飛行時間の開始）を識別するように構成され得る。あるいは、タスクＴ１００は、パルスを発生する信号ジェネレータから放射時間の指示を受信するように構成され得る。

タスクＴ２００は、推定レンジが閾値未満の場合、推定されたレンジと閾値との間の関係が第１の状態（たとえば、１または論理高）をもつことを示すように、また、推定レンジが閾値よりも大きい場合、関係が第２の状態（たとえば、ゼロまたは論理低）をもつことを示すように構成され得る。そのような方法の一例は、ソースがデバイスに１メートルよりも接近しているときは、位相ベースのＤＯＡ方法が選択され、ソースがデバイスから１メートルを超えて離れているときは、エネルギーベースのＤＯＡ方法が選択されるように、約１メートルのソースデバイス距離に対応する閾値（たとえば、毎秒３４０メートルの音速に対して、約５．８８ミリ秒の総飛行時間）を使う。閾値の他の例には、５０センチメートルから１５０センチメートルまで（たとえば、５０、７５、８０、１２０、１３５、または１５０センチメートル）のレンジ内のソースデバイス距離に対応する値がある。

図１５Ａ〜図１５Ｄは、方法Ｍ１００の適用の一例を示す。図１５Ａは、第１の時間Ａに超音波エミッタＵＥ１０によって放射されたパルスに応答して、また、可聴ソースＡＳ１からのパルスの反射によって引き起こされた受信エコーＥＳ１Ａに応答して、超音波検出器ＵＤ１０によって生成された信号のプロット（振幅対時間）を示す。これらの２つのイベント（パルスの放射とエコーの受信）の間の時間は、図１５Ｂに示すように、時間Ａにおける可聴ソースＡＳ１のレンジＲＳ１Ａを示す超音波パルスの飛行時間ＴＯＦ１Ａである。この場合、タスクＴ２００は、第１のＤＯＡ推定方法（たとえば、位相ベース）が選択されるように、レンジＲＳ１Ａが距離閾値Ｔ_R未満であることを示す。

図１５Ｃは、第２の時間Ｂに超音波エミッタＵＥ１０によって放射されたパルスに応答して、また、可聴ソースＡＳ１からのパルスの反射によって引き起こされた受信エコーＥＳ１Ｂに応答して、超音波検出器ＵＤ１０によって生成された信号の同様のプロットを示す。これらの２つのイベントの間の時間は、図１５Ｄに示すように、時間Ｂにおける可聴ソースＡＳ１のレンジＲＳ１Ｂを示す超音波パルスの飛行時間ＴＯＦ１Ｂである。この場合、タスクＴ２００は、第２のＤＯＡ推定方法（たとえば、エネルギーベース）が選択されるように、レンジＲＳ１Ｂが距離閾値Ｔ_Rよりも大きいことを示す。

短期間にわたるＤＯＡ推定方法の間の過度の切替え（たとえば、閾値Ｔ_Rにレンジが接近しているソースのケースにおける）を防ぐために、ハングオーバまたは他の時間平滑化演算を含むようにタスクＴ３００を実装することが望ましい場合がある。１つのそのような例において、タスクＴ３００は、何らかの最小数の連続指示についての（たとえば、３、５、１０、もしくは２０個の連続パルスについて、または５０、１００、２００、もしくは５００ミリ秒に対応する期間についての）新たな状態をタスクＴ２００が示した後でのみＤＯＡ推定方法を切り替えるように構成される。追加または代替として、短期間にわたるＤＯＡ推定方法の間の過度の切替えは、各状態遷移に対して異なる距離閾を使うようにタスクＴ２００を構成することによって防ぐことができる（たとえば、図１６Ａに示すように）。たとえば、タスクＴ２００は、レンジが立上り閾値Ｔ_Rr（たとえば、１１０、１２０、１３５、または１５０センチメートル）を超える（あるいは、少なくとも等しい）ときのみ、第１の状態から第２の状態への（たとえば、位相ベースのＤＯＡ推定からエネルギーベースのＤＯＡ推定への）遷移を示すように、また、レンジが立下り閾値Ｔ_Rf（たとえば、５０、６０、７５、または９０センチメートル）未満（あるいは、以下）であるときのみ、第２の状態から第１の状態への（たとえば、エネルギーベースのＤＯＡ推定から位相ベースのＤＯＡ推定への）遷移を示すように構成され得る。

異なる瞬間に関連付けられた（たとえば、図１Ｃに示す）デバイスに相対した、可聴ソースＡＳ１のレンジと、対応する方向との履歴を記憶するように、方法Ｍ１００を構成することが望ましい場合がある。そのような履歴は、ソースが時間とともに動くとき、ソースのロケーションの追跡をサポートするのに使うことができる。１つのそのような例において、方法Ｍ１００は、一連のソースロケーションにおける各々を、時間値と、対応するＤＯＡと、レンジ値とのトリプレットとして（たとえば、対応する時間値に関連付けられた極座標として）記憶するように構成される。そのような履歴は、時間とともにロケーションが変わり、または一定のままであり得る、視野内の２つ以上のソースおよび／または他のオブジェクトのロケーションも含み得る。

方法Ｍ１００（または、そのような方法を実施する装置）の実装形態は、マルチチャネル信号Ｓ１０に対して１つまたは複数の空間選択処理演算を実施することも含み得る。たとえば、方法Ｍ１００は、推定ＤＯＡとは異なる方向から（たとえば、推定ＤＯＡ付近の方向の受諾レンジの外の方向から）到着するマルチチャネル信号の周波数成分を減衰することによって、強調信号を生成するように構成され得る。マルチチャネル信号が２つより多いチャネルを含むケースでは、方法Ｍ１００は、推定ＤＯＡに基づいて、チャネルのサブセット（たとえば、ペア）を選択するように構成され得る。たとえば、方法Ｍ１００は、縦（すなわち、軸）方向が推定ＤＯＡと最も厳密に一致するマイクロフォンペアに対応するチャネルのペアを選択するように構成され得る。

代替または追加として、方法Ｍ１００は、推定ＤＯＡとは異なる方向（たとえば、他のセクタ）から到着する、周波数成分を含むマルチチャネル信号の雑音成分の推定値を算出するように構成され得る。雑音推定値が算出されるケースでは、方法Ｍ１００は、雑音推定値を使って、マルチチャネル信号の１つまたは複数のチャネルに対する雑音低減動作（たとえば、ウィーナーフィルタリングまたは強調信号の１つもしくは複数のチャネルからの雑音推定値のスペクトル減算）を実施するようにも構成され得る。方法Ｍ１００の他の適用は、推定ＤＯＡまたはソースロケーションを使って、オーディオ感知デバイスのカメラによって取り込まれた画像の一部分をフォーカスウィンドウとして（たとえば、フォーカスウィンドウがソースの画像の少なくとも一部を含むように）選択することと、推定ソースレンジおよびフォーカスウィンドウからの情報を使って、所望のソースにカメラの焦点を当てることとを含む。

デバイスＤ２０の同じマイクロフォンを、（たとえば、検出器ＵＤ１０を、マイクロフォンアレイ中のマイクロフォンとして実装するために）可聴音録音に関する超音波検出に使うことが、一般的には可能であるが、そのようなデバイスは、１つまたは複数の専用の超音波検出器を代わりに含むように構成され得る。超音波と可聴音の両方を感知するためにマイクロフォンが使われるケースでは、受信信号をフィルタバンクに通して、（ＤＯＡ推定のため、および可能性としては空間選択的処理のための）オーディオ周波数成分から、（測距のため、および可能性としてはＤＯＡ推定のための）超音波成分を分離することが望ましい場合がある。

検出器ＵＤ１０と、アレイのマイクロフォン（たとえば、ＭＣ１０、ＭＣ２０、ＭＣ３０、ＭＣ４０）との各々は、拡張帯域幅微小電気機械システム（ＭＥＭＳ）マイクロフォンとして、および／またはエレクトレットコンデンサマイクロフォン（ＥＣＭ）として実装することができる。超音波および／または可聴音のそのような検出器は、ポリフッ化ビニリデン（ＰＶＤＦ）、圧電セラミック、またはカーボンナノチューブなどの圧電材料の１つまたは複数のシートとしても実装することができる。複数のＰＶＤＦシートが、表面に適用され得る。

超音波測距信号ならびに可聴音信号（たとえば、テレフォニーアプリケーションにおける遠端音声信号）を放射するためのラウドスピーカーを使うことが可能であるが、測距のために専用の超音波エミッタＵＥ１０を代わりに使うことが望ましい場合がある。超音波エミッタの例には、圧電性フィルム、焦電気フィルム、および圧電セラミックがある。圧電性フィルム（たとえば、ＰＶＤＦ）超音波送信機および受信機は、エア測距アプリケーションに、特有の利点をもたらす。ＰＶＤＦフィルム向けの典型的な放射および検出周波数は、４０ｋＨｚと８０ｋＨｚとを含む。円筒型ＰＶＤＦ送信機は一般的には、全方向性水平ビーム指向性と広帯域特性とを呈する。円筒型ＰＶＤＦ受信機は一般的には、非常に広い水平ビーム指向性と広帯域特性とを呈する。アプリケーションによっては、送信機および／または受信機の共振周波数および垂直ビーム指向性は、ＰＶＤＦシリンダの直径および／または長さを変えることによって容易にカスタマイズすることができる。図１７は、ベゼルＢＺ１０に搭載されたスクリーンＳＣＲ１０を含むオーディオ感知デバイスＤ２０（たとえば、ラップトップまたはタブレットコンピュータ）の実装形態、ベゼルＢＺ１０に搭載された超音波エミッタＵＥ１０の円筒型ＰＶＤＦ実装形態ＵＥ１２、およびベゼルＢＺ１０内の対応する音響ポートの後ろに配置された３つのマイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０からなるアレイの一例の一部分を示す。この例では、マイクロフォンＭＣ２０は、検出器ＵＤ１０としても働き、他のマイクロフォンのうち１つまたは複数は、超音波検出器としても使われ得る。図１７に示すように突出するエミッタに対して、使用中でないときはベゼルＢＺ１０内で動かすことができるように、ばね式または場合によっては格納式でエミッタを搭載することが望ましい場合がある。デバイスＤ２０の別の例は、完全な３軸全方向性ビームパターンを与えるように直交して並べられた複数のＰＶＤＦ円筒型受信機を含む。

焦電気フィルムも、超音波エミッタとして使うことができる。たとえば、カーボンナノチューブ技術（ＣＮＴ）エミッタは、焦電気効果を呈するように構成され得る。断熱プロセス中に空気を素早く加熱および冷却すると、空気分子が圧縮および希薄にされ、結果として音波を生じる。そのようなフィルム（たとえば、ＣＮＴフィルム）は、プレーナエミッタにおいて使われ、または代替的には、全方向性ビームパターンのために円筒形状にラッピングされ得る。

圧電セラミックエミッタは、効率的な超音波エミッタでもあるが、一般的には、ＰＶＤＦ送信機よりも低いＱファクタをもつ。そのようなエミッタは、全方向性点音源として作用するように球状に形成され、またはピストンモードもしくはカンチレバービームアクチュエータとして作用するようにシートに形成され得る。図１６Ｂは、ベゼルＢＺ２０内に搭載されたスクリーンＳＣＲ２０と、４つのマイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０、ＭＣ４０からなるアレイとを含むオーディオ感知デバイスＤ２０（たとえば、ラップトップまたはタブレットコンピュータ）の実装形態、ならびにベゼルＢＺ２０内の対応する音響ポートの後ろに配置された超音波エミッタＵＥ１０の圧電セラミック実装形態ＵＥ１４の一例の一部分を示す。この例では、マイクロフォンＭＣ２０は、検出器ＵＤ１０としても働き、他のマイクロフォンのうち１つまたは複数は、超音波検出器としても使われ得る。

デバイスＤ２０は、たとえば、０．２、０．２５、０．５、１、２、５、１０、２０、５０、または１００Ｈｚのレートで測距パルスを放射するようにエミッタＵＥ１０を駆動するように構成され得る。消費者家庭環境（たとえば、セットトップボックス、ゲーム機、ラップトップまたはタブレットコンピュータ）におけるインストールのために、ペットの聴覚の範囲を上回る超音波周波数を使うことが望ましい場合がある。犬は一般的には、最高４０，０００Ｈｚの音が聞こえ、猫は一般的に、最高６０，０００Ｈｚの音が聞こえ、齧歯類は一般的に、最高９０，０００Ｈｚの音が聞こえる。受信信号がサンプリングされるレートは、放射パルスの周波数の２倍よりも大きいこと（たとえば、１９２ｋＨｚなど、８０〜２００ｋＨｚ以上のサンプリングレート）が望ましい場合がある。

部屋の壁など、大きく、平坦で硬い表面は、人体よりも、超音波パルスのエネルギーの多くを反射する見込みがある。そのような表面は、デバイスのユーザからのエコーよりも大きい振幅を有するエコーを生成し得る。超音波信号は一般的に、最大実際的ソースデバイスレンジが約５メートル以下（たとえば、２または３メートル）に限定され得るように、急速に（たとえば、５メートルにおいて約５０パーセントまで）減衰する。受信された超音波信号は一般的に、オブジェクトと検出器との間の距離が増すと、およびオブジェクトのサイズが低下すると、より弱くなる。距離の影響は一般的に、平坦表面よりも非平坦表面の場合、検出超音波信号中で認知可能である。

実際的アプリケーションにおいて、超音波検出器またはマイクロフォンによって生成された信号が、放射パルスの２つ以上の反射からのエコーを含むと予想され得るように、放射超音波パルスは、２つ以上の表面から反射すると予想され得る。図１８は、検出信号がレンジＲＳ１におけるソースＡＳ１からのエコーを含む例を示す。この例では、信号は、レンジＲＬ１における左の壁、レンジＲＴ１における右の壁、およびレンジＲＲ１における後の壁のうち１つまたは複数からのエコーも含み得る。図１９は、複数のエコーを含む検出信号の録音のプロット（振幅対時間領域サンプル）を示す。図２０は、この時間領域信号と、対応するスペクトグラム（たとえば、１６、３２、６４、または１２８サンプルのフレームサイズを有するＦＦＴ演算を使って、感知信号から生じられ得る）とを示す。

図２１Ａは、超音波エミッタＵＥ１０によって放射されたパルスに応答して、可聴ソースＡＳ１からのパルスの反射によって引き起こされたエコーＥＳ１に応答して、および別のオブジェクトＯ１（たとえば、壁、家具の１つ、別の人など）からのパルスの反射によって引き起こされたエコーＥＯ１に応答して、超音波検出器ＵＤ１０によって生成された信号のプロットを示す。上述したように、各反射の飛行時間（ＴＯＦ）は、対応する反射オブジェクトのレンジを示す。ただし、それ以上の情報がない場合は、これらの反射のうちどれが、同じ期間内にＤＯＡが推定される可聴ソースに対応するかを確実に判断することが困難であり得る。その結果生じる、図２１Ｂに示すレンジあいまいさは、状態指示タスクＴ２００のエラーを引き起こし、タスクＴ３００が、ソースＡＳ１から受信された可聴信号に対して、レンジに適したＤＯＡ推定方法を選択するのを妨げ得る。

１つのソリューションは、指定された最小および／または最大値との、指定された関係を満足する限り、最接近レンジを選択するようにタスクＴ１００を構成することである。たとえば、所望のソースが、視野内の他のどのオブジェクトよりもデバイスに接近していると仮定され得る。タスクＴ１００のそのような実装形態は、（たとえば、２０、２５、３０、４０または５０センチメートル以上の、ソースと検出器との距離に対応する）最小値以上である（あるいは、少なくとも等しい）、ならびに／あるいは（たとえば、１、１．２５、１．３、１．５、または２メートル以下である、ソースと検出器の距離に対応する）最大値以下である（代替的には、未満）である限り、最接近レンジを選択するように構成され得る。

オーディオ感知デバイスが、使用中に静止したままになるケースでは、ソースがない場合、ソースＤＯＡが推定されるべき空間（たとえば、アレイの前にあるエリア）を特徴づけるためのレンジ初期化演算を実施することが望ましい場合がある。そのような演算により、可聴ソースから受信された音を処理するためのデバイスの使用中に、これらのレンジを示すエコーが無視され得るように、たとえば、空き空間中の（たとえば、壁および家具からの）エコーのレンジを記憶することによって、ベースラインレンジマップを作成することができる。

代替または追加として、同様に周囲のオーディオ環境を特徴づけるためのベースラインマップを作成することが望ましい場合がある。そのようなマップは、（たとえば、特定のＤＯＡを回避するための）可聴ＤＯＡ推定方法および／または（たとえば、特定のＤＯＡから到着する音を減衰するための）空間選択処理演算に対する幾何学的制約を強化するのに使うことができる。そのような制約は、たとえばラジオ、テレビ、音を出す器具、時計など、ロケーションが固定された方向性干渉ソースによる散乱を削減するのを助け得る。

方法Ｍ１００は、２つ以上の検出器からの（たとえば、アレイのうち、２つ以上のマイクロフォンからの）信号をレンジ推定に使うように実装され得る。複数の超音波検出器からの測距結果が利用可能なとき、たとえば、これらの結果をＤＯＡ推定に使うことが可能になる。そのようなＤＯＡ推定は、たとえば、三角測量アルゴリズム、ラテレーションアルゴリズム（たとえば、三辺測量もしくはマルチラテレーション）、および／または重心アルゴリズムを使って、異なる超音波検出器からの録音における、対応するエネルギーピークからのレンジ（たとえば、飛行時間）を合成することを含み得る。

超音波反射ピックアップが高度に反応し、かつ／または前方向と後方向との間を区別し得るように（たとえば、図２Ａおよび図１１〜図１４に示す配列でのように）、検出器を並べることが望ましい場合がある。マイクロフォン配置により、オーディオ周波数信号に対するよりも高い、超音波に対する空間区別が可能になる。

図２２Ａ〜図２２Ｃは、複数の超音波検出器からの測距結果を使う、ＤＯＡ推定の適用の例を示す。図２２Ａは、オーディオ感知デバイスＤ２０の実装形態Ｄ３０の視野内に置かれたソースＡＳ１とオブジェクトＯ１とを示す。図２２Ｂは、レンジＲ１を示すエコーＥ１を含む、検出器ＵＤ１０（たとえば、マイクロフォンＭＣ１０）によって生成された信号のプロットを示す。この場合、エコーＥ１は、エコーがマージしているように、検出器ＵＤ１０に対して同じレンジをもつ、ソースＡＳ１とオブジェクトＯ１の両方からの放射パルスの反射によって引き起こされる。図２２Ｃは、ソースＡＳ１のレンジＲ２Ｓ１を示すエコーＥ２Ｓ１と、エコーＥ２Ｓ１とは別のエコーＥ２Ｏ１とを含み、オブジェクトＯ１のレンジＲ２Ｏ１を示す検出器ＵＤ２０（たとえば、マイクロフォンＭＣ２０）によって生成された、対応する信号のプロットを示す。

方法Ｍ１００のそのような実装形態は、エコーＥ１、Ｅ２Ｓ１、およびＥ２Ｏ１からの、視野内の２つの候補ロケーションを（たとえば、バイラテレーションを使って）判断するように構成され得る。この方法は、ソースＡＳ１によって生成された可聴信号からのＤＯＡ推定値（たとえば、直近のＤＯＡ推定値）を使って、候補ロケーションのうち適切な１つを選択するようにも構成され得る。この例では、適切な候補ロケーションの選択により、レンジあいまいさも解決し、タスクＴ３００における適切なＤＯＡ推定技法の選択をサポートする。当然ながら、方法Ｍ１００のそのような実装形態は、３つ以上の検出器の各々からの検出信号を使うようにも構成され得る。

超音波ＤＯＡ推定手法は、２つ以上のエミッタの使用も含んでよく、各エミッタは、他の１つのエミッタまたは複数のエミッタによって生成されたパルス（たとえば、時間経過に伴う、異なる放射された周波数および／または異なるパルスエネルギープロファイルをもつパルス）とは区別可能なパルスを生成するように構成される。代替または追加として、同じオブジェクトによって反射され、異なる検出器によって受信される、同じパルスのエコーの利得（たとえば、規模、エネルギー）および／または位相の間の差は、ＤＯＡ推定に使うことができる。ただし、間隔が接近した検出器は、利得差測定値を与える際、不十分な実施をする可能性がある。逆に、マイクロフォンも超音波検出器として使われるケースでは、検出器の間の間隔は一般的に、位相差ベースの超音波測距をサポートするには離れすぎている。

セットトップボックスまたはラップトップもしくはタブレットコンピュータの典型的な形状因子について、超音波反射からのＤＯＡ推定は、約３０センチメートル〜約３メートルのソースデバイス間距離のレンジにわたって実際的であり得ると予想され得る。大きいオブジェクトが検出器に接近しているとき、超音波ＤＯＡ推定は、放射および反射エネルギーの重なりに起因して、信頼できなくなる場合がある。超音波推論レンジに基づいて、超音波ＤＯＡ推定値の（および可能性としては、オーディオ周波数情報に基づくＤＯＡ推定値の）更新を可能にし、かつ／または不能にすることが望ましい場合がある。たとえば、オブジェクトが検出器に閾距離Ｔ_minよりも接近していること、および／またはオブジェクトのサイズが、アレイのサイズ（たとえば、開口）と比較して大きいことをタスクＴ１００が示す場合、対応するＤＯＡ推定値を、信頼できないとして拒否することが望ましい場合がある。そのようなケースでは、タスクＴ１００が、直近のＤＯＡ推定値を、現在の推定値として使うこと、または合成推定値において、オーディオ周波数ＤＯＡ推定値の重みｗ_p［ｎ］に相対した超音波ＤＯＡ推定値の重みｗ_a［ｎ］を（可能性としてはゼロに）削減することが望ましい場合がある。あるいは、そのようなケースでは、ＤＯＡ推定に基づく空間選択処理演算の適合を不能にすること（たとえば、音声不活動の期間中の受信オーディオ周波数信号を時間平均することによって、雑音推定などの単一チャネル処理アルゴリズムの代わりにフォールバックすること）が望ましい場合がある。

対応する飛行時間として表すことができる閾距離Ｔ_min（たとえば、２０または３０センチメートル）は、放射超音波信号の波長およびデューティサイクルに依存し得る。たとえば、距離Ｔ_minは、放射信号に対して、より高い周波数を使うことによって低下され得る。追加または代替として、より低いデューティサイクル（たとえば、より狭いパルス）をもつエミッタを駆動することによって閾距離Ｔ_minが低下され得るように、より低いＱをもつエミッタを使うことができる。

複数の超音波検出器からの結果を使うＤＯＡ推定の代替または追加として、方法Ｍ１００は、時間に伴うレンジ情報の変化を、レンジあいまいさを解決するのに使うように構成され得る。図２３Ａおよび図２３Ｂは、２つの異なる時間ＡおよびＢにおける典型的な使用シナリオを示す。オブジェクトＯ１は、時間Ａから時間Ｂまでは動かないので、レンジＲＯ１ＡとレンジＲＯ１Ｂは同じである。ソースＡＳ１は、時間Ａから時間Ｂまでに動くので、レンジＲＳ１ＡとレンジＲＳ１Ｂは異なる。概して、デバイスのユーザなどの可聴ソースは、視野内の他のオブジェクト（たとえば、壁および家具）よりも、デバイスに向かってまたは離れて動いている見込みが高く、その結果、時間軸上での、受信エコーの対応する相対置換が行われる。静的ピークよりも、超音波反射信号の時間軸変化を追跡するように、方法Ｍ１００を実装することが望ましい場合がある。

方法Ｍ１００のそのような実装形態を、連続受信エコーの飛行時間におけるそのような変化に基づいて所望のソースのレンジを選択する演算を含むように構成することが望ましい場合がある。たとえば、タスクＴ３００によって推定されたＤＯＡを、時間とともに変わるレンジに関連付けることによって、所望のソースを特定することが望ましい場合がある。

図２４〜図２６は、ユーザが検出器アレイから離れるときの、異なる連続する時間における３チャネル録音の例を示す。図２４は、時間Ａにおいて超音波エミッタＵＥ１０によって放射されたパルスと、その結果生じたエコーとに応答して、デバイスＤ３０の実装形態の、３つの超音波検出器（たとえば、マイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０）からなるアレイによって生成された信号のプロット（エネルギー対時間）を示す。図２５および図２６は、それぞれ、時間ＢおよびＣにおいて放射されたパルスに応答した類似プロットを示し、ここで時間Ｂは時間Ａの後であり、時間Ｃは時間Ｂの後である。可聴ソース（たとえば、人間話者）は、一定のままである左および右の壁のレンジとは対照的に、ソースのレンジが時間とともに変わるように、時間Ａから時間Ｃに向かってデバイスから離れる。時間とともに動くエコーは、所望のソースに関連付けられる見込みが比較的高く、時間とともに静止したままであるエコーは、壁、家具、または他のオブジェクトに関連付けられる見込みが比較的高いと仮定され得る。

オブジェクトのロケーションに関する、記憶された情報を使い、時間が経過してもレンジが持続する、検出信号中の特徴（たとえば、静的ピーク、隆起、またはエネルギー集中）を無視し、時間とともにレンジが変わる特徴を追跡するように、タスクＴ１００を構成することが望ましい場合がある。たとえば、タスクＴ１００は、各エコーに対応する連続する飛行時間の間の差を算出し、移動するエコーに対応するレンジを選択することによって、レンジを選択するように実装され得る。タスクＴ１００のそのような実装形態は、特徴の連続レンジの差と動き閾値Ｔ_mとの間の関係により持続し、または動くものとして特徴を識別するように構成され得る。そのようなケースにおいて、タスクＴ１００は、そのレンジがＴ_m未満（代替的には、以下）だけ変わったことを検出したことに応答して持続するものとして特徴を識別するように、およびその現在のレンジが前のレンジとは少なくとも（代替的には、よりも多く）Ｔ_mだけ異なることを検出したことに応答して動いているものとして特徴を識別するように構成され得る。閾値Ｔ_mについての値の例は、１０、２０、および２５センチメートルの距離、ならびにそれに対応する時間を含む。

可聴ソースからのエコーが、別のオブジェクトからのエコーと同じ飛行時間をもつとき、ソースは、デバイスに対して、マスキングオブジェクトとは異なる方向に配置されているとしても、測距検出器には見えなくなる場合がある。図２６は、可聴ソースのエコーがマスキングエコー（この場合、左の壁面からのエコー）とマージされる、可聴ソースが動いているそのような例を示す。マスキングエコーによって占められるレンジは、「ブラインドゾーン」ともいう。時間経過に伴う、所望のソースのレンジ内の変化を追跡するようにタスクＴ１００を実装することにより、この方法は、ソースがブラインドゾーンを通るときを検出することができ、そうすることによって、方法は、所望のソースに適切なレンジを提供し続けることができる。

検出信号の対応するドップラー周波数偏移を検出することによって、ソースの動きを検出するように、方法Ｍ１００を構成することが望ましい場合がある。毎秒１メートルの速度および４０ｋＨｚの放射超音波周波数でのソース動きに対して、（アレイに直接向かって、または離れて動くソースについて）予想され得る結果的ドップラー周波数偏移は、約１００Ｈｚである。

ＤＯＡ推定技法は、超音波を使う手法と、可聴音を使う手法との間の相乗効果から利益を受けるように構成され得る。たとえば、適応的重み付けを使って、反射超音波に基づく推定ＤＯＡを、所望のソースから受信された音に基づく推定ＤＯＡと合成するように、タスクＴ３００を実装することが望ましい場合がある。１つのそのような例では、タスクＴ３００は、Ｄ_e［ｎ］＝ｗ_a［ｎ］Ｄ_a［ｎ］＋ｗ_p［ｎ］Ｄ_p［ｎ］のような式に従ってＤＯＡ推定値を発生するように構成され、ここでＤ_e［ｎ］は、パルスｎについてのＤＯＡ推定値を示し、Ｄ_a［ｎ］は、パルスｎについての能動ＤＯＡ推定値を示し、ｗ_a［ｎ］は、パルスｎについての能動ＤＯＡ推定値の重みを示し、Ｄ_p［ｎ］は、パルスｎについての受動ＤＯＡ推定値を示し、ｗ_p［ｎ］は、パルスｎについての受動ＤＯＡ推定値に対する重みを示す。重みｗ_a［ｎ］およびｗ_p［ｎ］は、ｗ_a［ｎ］＋ｗ_p［ｎ］＝１となるように、ゼロから１までの範囲内の値をもつことが望ましい場合がある。

２つ以上のオブジェクトが、それらの受信エコーが一致するように、超音波検出器から同じ距離に配置されているとき、受信エコーの利得および／または位相の間の差に基づく超音波ＤＯＡ推定技法は、信頼できなくなる場合がある。エコーのそのようなマージによっても、異なる検出器までの飛行時間に基づくＤＯＡ推定技法が複雑になり得る。これらのケースでは、超音波ＤＯＡ推定値の重みｗ_a［ｎ］を、対応するオーディオ周波数ＤＯＡ推定値の重みｗ_p［ｎ］に相対して（可能性としてはゼロまで）低下させることが望ましい場合がある。逆に、音源が沈黙している期間中は、オーディオ周波数ＤＯＡ推定値の重みｗ_p［ｎ］を、対応する超音波ＤＯＡ推定値の重みｗ_a［ｎ］に相対して（可能性としてはゼロまで）低下させることが望ましい場合がある。

経時的にＤＯＡ推定値を平滑化するように、タスクＴ３００を構成することが望ましい場合がある。たとえば、タスクＴ３００は、Ｄ_es［ｎ］＝αＤ_es［ｎ−１］＋（１−α）Ｄ_e［ｎ］などの式（１次無限インパルス応答フィルタまたは漏洩積分器ともいう）により時間平滑化演算を実施するように構成することができ、ここでＤ_e［ｎ］は、（可能性としては、超音波およびオーディオ周波数測定値からのＤＯＡ推定値の組合せとして）パルスｎについて算出されるＤＯＡ推定値を示し、Ｄ_es［ｎ−１］は、前のパルス［ｎ−１］についての平滑化ＤＯＡ推定値を示し、Ｄ_es［ｎ］は、パルスｎについての平滑化ＤＯＡ推定値を示し、αは、ゼロ（平滑化なし）から１（最大平滑化、更新なし）までの範囲内の値をもつ平滑化係数を示す。平滑化係数αの値の例は、０．０５、０．１、０．２、０．２５、０．３、０．４および０．５を含む。

異なる検出器までの飛行時間に基づくＤＯＡ推定技法の場合、より大きいマイクロフォン間距離を使うことによって、時間軸上の反射エコーのピークの間の分離を増大させることが望ましい場合がある。代替または追加として、複数の方向性要素、または分散型モードアクチュエータを使い、放射された波形の時分割多重化を使うことによって、これらの別個の反射ピークを区別することが望ましい場合がある。

検出超音波信号からのＤＯＡの推定は、検出されたオーディオ周波数信号からのＤＯＡの推定とともに、動いてはいるが沈黙しているオブジェクト（たとえば、人々）についてのレンジ情報の拒絶を可能にすることによってレンジあいまいさを解決するのに使われ得る。そのようなケースにおいて、タスクＴ１００は、超音波ＤＯＡが現在のオーディオ周波数ＤＯＡ推定値とは異なるオブジェクトに関連付けられたレンジを拒絶することによって、レンジあいまいさを解決するように構成され得る。

超音波は、非可聴音放射ソースを識別するのに使われ得るが、超音波の使用は、人間オブジェクト追跡には無関係な多くの反射信号にもつながり得る。連続的超音波が存在する場合、話している人間ソースは、喉および胸の振動が位相変調反射を与えるとき、干渉法プロセスによって識別することができる。方法Ｍ１００は、そのような（たとえば、測距パルスの間の、または測距パルスの周波数とは異なる周波数における別のエミッタによる）非パルス化信号の放射を含むように構成することができ、そのような位相変調反射の検出は、ボイスアクティビティの存在を示すのに使われ得る（たとえば、方向性オーディオ周波数雑音信号とは反対に）。

図２７Ａに、超音波レンジ推定器１００と、比較器２００と、受動ＤＯＡ推定器３００とを含む、一般的構成による装置Ａ１００のブロック図を示す。超音波レンジ推定器１００は、（たとえば、本明細書に記載するタスクＴ１００の実装形態を実施することによって）検出された超音波信号ＳＵ１０からの情報に基づいてレンジを推定するように構成される。比較器２００は、（たとえば、本明細書に記載するタスクＴ２００の実装形態を実施することによって）推定レンジと閾値との間の関係の状態を示すように構成される。受動ＤＯＡ推定器３００は、（たとえば、本明細書に記載するタスクＴ３００の実装形態を実施することによって）関係の指示された状態に基づいて、マルチチャネル信号のチャネルＳ１０−１およびＳ１０−２のオーディオ周波数成分の推定到着方向ＤＥ１０を生成するように構成される。検出超音波信号ＳＵ１０は、マルチチャネル信号のチャネルであり得る。

超音波レンジ推定器１００および受動ＤＯＡ推定器３００の各々は、時間領域内または周波数領域（たとえば、サブバンド領域もしくは高速フーリエ変換（ＦＦＴ）領域などの変換領域）内で動作するように実装され得る。図２７Ｂは、マルチチャネル信号のチャネルＳ１０−１およびＳ１０−２が、それぞれのＦＦＴモジュールＦＦＴ１およびＦＦＴ２によって周波数領域に変換される装置Ａ１００の実装形態Ａ１１０の適用のブロック図を示す。装置Ａ１１０は、ＦＦＴ領域内の検出超音波信号ＳＵ１０としてチャネルＳ１０−１を受信するように構成および配置された超音波レンジ推定器１００の実装形態１１０と、ＦＦＴ領域内のチャネルＳ１０−１およびＳ１０−２を受信するように構成および配置された受動ＤＯＡ推定器３００の実装形態３１０とを含む。

検出超音波信号ＳＵ１０が、マルチチャネル信号のチャネルである（すなわち、マイクロフォンアレイのうち１つによって生成された信号に基づく）ケースでは、適度に高いサンプリングレートで（たとえば、放射超音波信号の周波数の２倍を超えて）チャネルをサンプリングすることが望ましい場合がある。ただし、電力消費および／または計算の複雑度を削減するために、より低いサンプリングレート（たとえば、７、８、１２、１６、２０、２２、２４、３２、４４．１または４８ｋＨｚ）においてチャネル上で動作するように、受動ＤＯＡ推定器３００を構成することが望ましい場合がある。

図２８Ａは、高いサンプリングレートで第１のチャネルＳ１０−１を受信するように配置されたフィルタバンクＦＢ１０を含む装置Ａ１００の実装形態Ａ１２０のブロック図を示す。フィルタバンクＦＢ１０は、検出超音波信号ＵＤ１０として、高いサンプリングレートで高周波数（すなわち、超音波）帯域を生成するように、および受動ＤＯＡ推定器３００への入力として、より低いサンプリングレートで低周波数（すなわち、オーディオ周波数）帯域を（たとえば、デシメーションおよび／またはリサンプリングによって）生成するように構成される。この例では、装置Ａ１２０は、チャネルＳ１０−２をより低いサンプリングレートで受信するが、装置Ａ１２０は、高いサンプリングレートから第２のチャネルＳ１０−２を同様にデシメートし、かつ／またはサンプリングし直すようにも実装され得る。この特定の例において、装置Ａ１２０は、受動ＤＯＡ推定器３１０の事例に対して、ＦＦＴ領域内のチャネルＳ１０−１およびＳ１０−２を提供するように構成されたＦＦＴモジュールＦＦＴ１、ＦＦＴ２も含む。

装置Ａ１００は、２つ以上の検出器からの（たとえば、アレイのうち、２つ以上のマイクロフォンからの）検出超音波信号をレンジ推定および可能性としてはＤＯＡ推定に使うように実装され得る。図２８Ｂは、マルチチャネル信号の４つのチャネルＳ１０−１、Ｓ１０−２、Ｓ１０−３およびＳ１０−４が、それぞれのＦＦＴモジュールＦＦＴ１〜ＦＦＴ４によってＦＦＴ領域に変換される装置Ａ１００の実装形態Ａ１３０の適用のブロック図を示す。この例では、レンジ推定器１１０の実装形態１１２は、周波数領域チャネルを、（たとえば、図２４〜図２６に示す）検出超音波信号ＳＵ１０のマルチチャネル事例として受信するように構成され、受動ＤＯＡ推定器３１０の実装形態３１２は、マルチチャネル信号のオーディオ周波数成分の推定ＤＯＡを算出する。装置Ａ１３０は、推定ＤＯＡに基づいて４つのチャネルからなるサブセットを選択する（たとえば、縦方向が推定ＤＯＡと一致するマイクロフォンペアに対応するチャネルペアを選択する）ことを含む空間選択処理演算を実施するようにも構成され得る。推定ＤＯＡに基づくマイクロフォンアレイサブセット選択のこれ以上の開示は、米国特許出願第１３／０２９，５８２号（２０１１年２月１７日出願）に見られる。

図２９Ａは、超音波信号ジェネレータＳＧ１０を含む装置Ａ１００の（たとえば、装置Ａ１１０、Ａ１２０、および／またはＡ１３０の）実装形態Ａ１４０のブロック図を示す。信号ジェネレータＳＧ１０は、エミッタＵＥ１０によって放射されるべき超音波測距信号ＳＲ１０（たとえば、一連のパルス）を発生するように構成される。この例では、信号ジェネレータＳＧ１０は、レンジ推定器１００に対して、各パルスが生成される時間も示す。別の例では、レンジ推定器１００は、代わりに、検出超音波信号ＳＵ１０から、各パルス放射の時間（すなわち、飛行時間の始まり）を判断する。

２つ以上の算出されたレンジの間で選択を行うように（たとえば、本明細書に記載するレンジあいまいさを解決するように）、超音波レンジ推定器１００を実装することが望ましい場合がある。図２９Ｂは、超音波領域推定器１００の実装形態１２０のブロック図を示す。レンジ推定器１２０は、本明細書に記載するように、検出超音波信号ＳＵ１０についての少なくとも１つのレンジを算出するように構成されたレンジ計算器１０２を含む。たとえば、レンジ計算器１０２は、放射超音波パルスの１つまたは複数のエコーの各々からレンジを算出するように構成され得る。

レンジ推定器１２０は、本明細書に記載するように、算出されたレンジの中から選択を行うように構成されたレンジ選択論理１０４も含む。たとえば、レンジ選択論理１０４は、算出されたレンジのうち最も小さいもの（または、最も小さい算出レンジと最小レンジ値のうち最大のもの）を選択するように構成され得る。

この例では、レンジ推定器１２０は、経時的な、所望のソースの一連の推定レンジを記憶するように構成されたレンジ履歴１０６も含む。レンジ選択論理１０４は、レンジ履歴１０６を使って、移動するレンジ（たとえば、レンジ履歴１０６中にはない現在の算出レンジ）を選択するように構成され得る。レンジ履歴１０６は、所望のソースのロケーション（たとえば、レンジおよびＤＯＡ）の履歴を含むことができ、２つ以上の所望のソースのレンジおよび／またはＤＯＡならびに／あるいは視野内の他のオブジェクトのマップを含むようにも構成され得る。

レンジ推定器１２０は、検出超音波信号ＳＵ１０のマルチチャネル事例の異なるチャネルに各々が対応する、レンジ計算器１０２の２つ以上の事例を含むように実装され得る。装置Ａ１００は、本明細書に記載するように、能動ＤＯＡ推定のために同じエコーの複数のレンジを使うように構成され得る。そのようなケースにおいて、レンジ選択論理１０４は、オーディオ周波数および／または超音波ＤＯＡ推定値に基づいて、いくつかの候補ロケーションの中から選択を行うように、また、選択されたロケーションに対応するレンジを選択するように構成され得る。

図３０Ａは、能動ＤＯＡ推定器４００を含む装置Ａ１００の（たとえば、装置Ａ１１０、Ａ１２０、Ａ１３０、および／またはＡ１４０の）実装形態Ａ１５０のブロック図を示す。能動ＤＯＡ推定器４００は、オーディオ周波数成分のＤＯＡの第２の推定値を算出するように構成される。能動ＤＯＡ推定器４００は、２つ以上の検出器によって受信された同じエコーの間の利得および／または位相の差に基づいて、第２のＤＯＡ推定値を算出するように構成され得る。代替または追加として、能動ＤＯＡ推定器４００は、複数の検出器の各々までの、同じエコーの飛行時間の差に基づいて第２のＤＯＡ推定値を算出するように構成され得る。そのようなケースにおいて、能動ＤＯＡ推定器４００は、レンジ推定器１２０からの同じエコーから複数のレンジを受信するように構成および配列され得る。レンジ推定器１２０の事例を含む装置Ａ１５０の実装形態は、能動ＤＯＡ推定値を使ってレンジ履歴１０６を更新するように構成され得る。

装置Ａ１５０は、相対的重み付けにより、推定器３００および４００によって生成されたＤＯＡ推定値を合成して、到着方向の合成推定値を取得するように構成された合成器５００も含む。相対的重み付けは、（たとえば、可聴レベルが低いまたは沈黙しているときよりも、高いときに可聴ＤＯＡの相対的重み付けが重くなるように）オーディオ周波数成分の利得に基づき得る。追加または代替として、相対的重み付けは、（たとえば、超音波ＤＯＡ推定値が、可聴ＤＯＡ推定値とは大きく異なるとき、特にオーディオ周波数成分のレベルが高いおよび／または可聴ＤＯＡ推定値が最近の合成ＤＯＡ推定値と矛盾しないとき、より軽く重み付けされるように）算出ＤＯＡ推定値の間の差に基づき得る。

追加または代替として、合成器５００によって適用される相対的重み付けは、連続超音波信号の飛行時間の間の差に基づき得る。連続超音波信号の飛行時間の間の、ゼロまたは場合によっては非常に低い差は、たとえば、対応する超音波ＤＯＡ推定値の信頼性が低下され得るように、ソースが超音波ブラインドゾーンに動いたことを示し得る。この場合、合成器５００によって超音波ＤＯＡ推定値に適用される相対的重み付けを低下することが望ましい場合がある。

図３０Ｂは、一般的構成による装置ＭＦ１００のブロック図を示す。装置ＭＦ１００は、（たとえば、本明細書に記載するタスクＴ１００の実装形態を実施することによって）検出された超音波信号ＵＳ１０からの情報に基づいてレンジを推定するための手段Ｆ１００を含む。装置ＭＦ１００は、（たとえば、本明細書に記載するタスクＴ２００の実装形態を実施することによって）推定レンジと閾値との間の関係の状態を示すための手段Ｆ２００も含む。装置ＭＦ１００は、（たとえば、本明細書に記載するタスクＴ３００の実装形態を実施することによって）関係の指示された状態に基づいて、マルチチャネル信号のチャネルＳ１０−１およびＳ１０−２のオーディオ周波数成分の推定到着方向ＤＥ１０を生成するための手段Ｆ３００も含む。

図３１は、空間選択フィルタＳＳＰ１０を含む装置Ａ１００の（たとえば、装置Ａ１１０、Ａ１２０、Ａ１３０、Ａ１４０、および／またはＡ１５０の）実装形態Ａ１６０のブロック図を示す。フィルタＳＳＰ１０は、マルチチャネル信号に対して１つまたは複数の空間選択処理演算を実施するように構成される。たとえば、フィルタＳＳＰ１０は、推定ＤＯＡＤＥ１０とは異なる方向から（たとえば、非選択セクタなど、推定ＤＯＡＤＥ１０付近の方向の受諾レンジの外の方向から）到着するマルチチャネル信号の周波数成分を減衰することによって、強調信号ＳＥ１０を生成するように構成され得る。マルチチャネル信号が２つより多いチャネルを含むケースでは、フィルタＳＳＰ１０は、推定ＤＯＡＤＥ１０に基づいて、チャネルのサブセット（たとえば、ペア）を選択するように構成され得る。たとえば、フィルタＳＳＰ１０は、縦（すなわち、軸）方向が推定ＤＯＡＤＥ１０と最も厳密に一致するマイクロフォンペアに対応するチャネルのペアを選択するように構成され得る。

代替または追加として、フィルタＳＳＰ１０は、推定ＤＯＡＤＥ１０とは異なる方向から（たとえば、非選択セクタから）到着する、周波数成分を含むマルチチャネル信号の雑音成分の推定値ＳＮ１０を算出するように構成され得る。装置Ａ１６０は、雑音推定値ＳＮ１０を使って、強調信号ＳＥ１０の１つまたは複数のチャネルに対する雑音低減演算（たとえば、ウィーナーフィルタリングまたは強調信号ＳＥ１０のうち１つもしくは複数のチャネルからの雑音推定値ＳＮ１０のスペクトル減算）を実施するように構成された雑音低減モジュールＮＲ１０も含む。推定ＤＯＡＤＥ１０の他のアプリケーションは、撮像動作における（たとえば、オーディオ感知デバイスのカメラを使っての）フォーカスウィンドウの選択を含む。

概して、本明細書に記載する測距およびＤＯＡ推定ストラテジは、超音波エミッタと、音響信号を受信するように構成された２つ以上のマイクロフォンからなるアレイとを有する固定ロケーションまたはポータブルオーディオ感知デバイスを使って実装され得る。そのようなエミッタおよびアレイを含むように、また、オーディオ記録および／またはボイス通信適用例のためにこれらの測距およびＤＯＡ推定ストラテジとともに使用されるように構築され得るポータブルオーディオ感知デバイスの例には、電話ハンドセット（たとえば、スマートフォンまたは他のセルラー電話ハンドセット）、ハンドヘルドオーディオおよび／またはビデオレコーダ、オーディオおよび／またはビデオコンテンツを記録するように構成されたパーソナルメディアプレーヤ、ならびにノートブックコンピュータ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、あるいは他のポータブルコンピューティングデバイスがある。そのようなエミッタおよびアレイを含むように、また、これらの測距およびＤＯＡ推定ストラテジとともに使用されるように構築され得るオーディオ感知デバイスの他の例には、セットトップボックスならびにオーディオおよび／またはビデオ会議デバイスがある。

アレイの２つ以上のマイクロフォンの各々は、全方向、双方向、または単方向（たとえば、カージオイド）である応答を有することができる。アレイにおいて使用され得る様々なタイプのマイクロフォンには、（限定はしないが）圧電マイクロフォン、ダイナミックマイクロフォン、およびエレクトレットマイクロフォンがある。ハンドセットなど、ポータブルボイス通信のためのデバイスでは、アレイの隣接するマイクロフォン間の中心間間隔は一般に約４〜５センチメートルまでの範囲内であるが、スマートフォンなどのデバイスでは（たとえば、１０または１５センチメートルまでの）より広い間隔も可能であり、タブレットコンピュータなどのデバイスでは（たとえば、２０、２５または３０センチメートル以上までの）さらに広い間隔が可能である。アレイのマイクロフォンは、線に沿って、あるいは代替的に、それらの中心が２次元形状（たとえば、三角形）または３次元形状の頂点に存在するように構成され得る。ただし、概して、アレイのマイクロフォンは、特定の適用例に好適と見なされる任意の構成で配設され得る。

本明細書で説明するマルチマイクロフォンオーディオ感知デバイスの動作中、マイクロフォンアレイはマルチチャネル信号を生成し、各チャネルは、音響環境に対するマイクロフォンのうちの対応する１つの応答に基づく。単一のマイクロフォンを使用してキャプチャされ得るよりも完全な、音響環境の表現を集合的に与えるために、対応するチャネルが互いに異なるように、１つのマイクロフォンが別のマイクロフォンよりも直接的に特定の音を受信し得る。

アレイは、マルチチャネル信号Ｓ１０を生成するために、マイクロフォンによって生成された信号に対して１つまたは複数の処理演算を実施することが望ましいことがある。図３２Ａは、マイクロフォンＭＣ１０とＭＣ２０とを含むマイクロフォンアレイの例Ｒ１００のブロック図を示す。アレイＲ１００は、１つまたは複数のそのような演算を、マイクロフォンによって生成された信号に対して実施するように構成されたオーディオ前処理段ＡＰ１０も含み、演算は、アナログおよび／またはデジタル領域におけるインピーダンス整合、アナログ−デジタルコンバージョン、利得制御、および／またはフィルタリングを（限定なしで）含み得る。

図３２Ｂは、アレイＲ１００の実装形態Ｒ１１０のブロック図を示す。アレイＲ１１０は、アナログ前処理段Ｐ１０ａとアナログ前処理段Ｐ１０ｂとを含むオーディオ前処理段ＡＰ１０の実装形態ＡＰ２０を含む。一例では、段Ｐ１０ａおよびＰ１０ｂはそれぞれ、対応するマイクロフォン信号に対して（たとえば、５０、１００、または２００Ｈｚのカットオフ周波数をもつ）高域フィルタ処理演算を実施するように構成される。

マイクロフォンアレイは、マルチチャネル信号をデジタル信号として、すなわち、サンプルのシーケンスとして生成することが望ましいことがある。アレイＲ１１０は、たとえば、対応するアナログチャネルをサンプリングするようにそれぞれ構成されたアナログデジタル変換器（ＡＤＣ）Ｃ１０ａおよびＣ１０ｂを含む。音響適用例の典型的なサンプリングレートには、８ｋＨｚ、１２ｋＨｚ、１６ｋＨｚ、および約８ｋＨｚから約１６ｋＨｚまでのレンジ内の他の周波数があるが、約４４．１または４８ｋＨｚと同じ程度のサンプリングレートも使用され得る。この特定の例では、アレイＲ２１０は、対応するデジタル化チャネルに対して１つまたは複数の前処理演算（たとえば、エコー消去、雑音低減、および／またはスペクトル整形）を実施するようにそれぞれ構成されたデジタル前処理段Ｐ２０ａおよびＰ２０ｂをも含む。

検出超音波信号ＵＤ１０ならびにマルチチャネル信号Ｓ１０を生成するのにマイクロフォンアレイが使われるケースでは、放射超音波信号の周波数の２倍を超えるサンプリングレートを使うように、コンバータＣ１０ａおよびＣ１０ｂを構成することが望ましい場合がある。そのようなケースにおいて、コンバータＣ１０ａおよび／またはＣ１０ｂの出力において検出超音波信号ＵＤ１０を与えるように、アレイを構成することが望ましい場合もある（すなわち、段Ｐ１０ａおよび／またはＰ２０ｂの出力における処理済み信号とは反対に）。２つより多い（たとえば、３、４、または５つの）マイクロフォンへのアレイＲ１００およびＲ１１０の例の拡張は、明白に企図され、本明細書に開示される。

図３３Ａは、オーディオ感知デバイスＤ２０の（たとえば、Ｄ２２またはＤ２４の）実装形態Ｄ１００のブロック図を示す。デバイスＤ１００は、本明細書で開示するマイクロフォンアレイＲ１００の実装形態のうち任意のものの事例を含む。デバイスＤ１００は、アレイＲ１００によって生成されたマルチチャネル信号Ｓ１０を処理するように構成された、本明細書に記載する装置Ａ１００（代替的には、ＭＦ１００）の実装形態のうち任意のものの事例も含む。たとえば、装置Ａ１００は、本明細書で開示する方法Ｍ１００の実装形態のうち任意のものの事例に従って、マルチチャネル信号Ｓ１０を処理するように構成され得る。装置Ａ１００は、ハードウェアで、またはソフトウェア（ファームウェア）とのハードウェアの組合せで実装され得る。たとえば、装置Ａ１００は、処理済みマルチチャネル信号に対して、本明細書に記載する空間選択処理演算（たとえば、オーディオ感知デバイスと特定の音源との間の距離を判断し、雑音を低減し、特定の方向から到着する信号成分、および／または他の環境音からの別個の１つもしくは複数の音成分を強調する１つまたは複数の演算）を実施するようにも構成されたデバイスＤ１００のプロセッサ上で実装され得る。

図３３Ｂは、デバイスＤ１００の実装形態である通信デバイスＤ２００（たとえば、スマートフォン）のブロック図を示す。デバイスＤ２００は、装置Ａ１００を含むチップまたはチップセットＣＳ１０（たとえば、移動局モデム（ＭＳＭ）チップセット）を含む。チップ／チップセットＣＳ１０は、装置Ａ１００の１つまたは複数のソフトウェアおよび／またはファームウェア部を（たとえば、命令として）実行するように構成され得る１つまたは複数のプロセッサを含み得る。チップ／チップセットＣＳ１０はまた、アレイＲ１００の処理要素（たとえば、オーディオ前処理段ＡＰ１０の要素）を含み得る。チップ／チップセットＣＳ１０は、アンテナＣ３０を介して無線周波（ＲＦ）通信信号を受信し、ラウドスピーカーＳＰ１０を介して、ＲＦ信号内で符号化されたオーディオ信号を復号し再生するように構成された、受信機と、装置Ａ１００によって生成された処理済み信号に基づくオーディオ信号を符号化し、アンテナＣ３０を介して、符号化オーディオ信号を記述しているＲＦ通信信号を送信するように構成された、送信機とを含む。たとえば、チップ／チップセットＣＳ１０の１つまたは複数のプロセッサは、符号化されたオーディオ信号が雑音低減信号に基づくように、マルチチャネル信号の１つまたは複数のチャネルに対して上記で説明した雑音低減演算を実施するように構成され得る。チップ／チップセットＣＳ１０は、タッチスクリーン表示Ｃ２０により情報を表示し、ユーザ入力を受信するように、およびエミッタＵＥ１０を駆動するように（たとえば、本明細書に記載する信号ジェネレータＳＧ１０の事例を含むように）も構成される。

ポータブルコンピューティングデバイスの種類は現在、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、ウルトラポータブルコンピュータ、タブレットコンピュータ、モバイルインターネットデバイス、スマートブック、およびスマートフォンなどの名称を有するデバイスを含む。１つのタイプのそのようなデバイスは、スレートまたはスラブ構成を有し、スライドアウト式キーボードをも含み得る。図３４Ａ〜図３４Ｄに、ディスプレイスクリーンを含む上部パネルと、キーボードを含み得る下部パネルとを有し、２つのパネルが、クラムシェルまたは他のヒンジ結合関係で接続され得る、別のタイプのそのようなデバイスを示す。

図３４Ａは、ディスプレイスクリーンＳＣ１０の上方で上部パネル（たとえば、ベゼル）ＰＬ１０上に線形アレイで構成された超音波エミッタＵＥ１０と、４つのマイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０、ＭＣ４０とを含むような、デバイスＤ１００のポータブルコンピューティング実装形態Ｄ７００の一例の正面図を示している。図３４Ｂは、別の次元における４つのマイクロフォンの位置を示す上部パネルＰＬ１０の上面図を示している。図３４Ｃは、ディスプレイスクリーンＳＣ１０の上方で上部パネルＰＬ１２上に非線形アレイで構成された超音波エミッタＵＥ１０と４つのマイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０、ＭＣ４０とを含むようなポータブルコンピューティングデバイスＤ７１０の別の例の正面図を示している。図３４Ｄは、マイクロフォンＭＣ１０、ＭＣ２０、およびＭＣ３０がパネルの前面に配設され、マイクロフォンＭＣ４０がパネルの背面に配設された、別の次元における４つのマイクロフォンの位置を示す上部パネルＰＬ１２の上面図を示している。図１６Ｂおよび図１７は、同様のデバイス上のアレイＲ１００およびエミッタＵＥ１０の拡大を示す。

ユーザは、使用中に、そのようなデバイスＤ７００またはＤ７１０の前で左右に移動し、デバイスのほうへおよびデバイスから離れて移動し、および／または、さらにはデバイスの周りを（たとえば、デバイスの前面から背面に）移動し得ることが予想され得る。近距離場音声の維持と遠距離場干渉の減衰との間の好適なトレードオフを行うために、および／または不要な方向において非線形信号減衰を行うために、本明細書で説明した関連処理システムを実装することが望ましいことがある。最小ボイスひずみのために線形マイクロフォン構成を選択するか、またはより良い雑音低減のために非線形マイクロフォン構成を選択することが望ましいことがある。

図３５は、ハンドヘルド適用例のためのマルチマイクロフォンオーディオ感知デバイスＤ１００のポータブル実装形態Ｄ８００の図を示す。デバイスＤ８００は、エミッタＵＥ１０と、タッチスクリーンディスプレイＴＳ１０と、ユーザインターフェース選択コントロールＵＩ１０（左側）と、ユーザインターフェースナビゲーションコントロールＵＩ２０（右側）と、２つのラウドスピーカーＳＰ１０およびＳＰ２０と、３つの前面マイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０および１つの背面マイクロフォンＭＣ４０を含むアレイＲ１００の実装形態とを含む。ユーザインターフェースコントロールの各々は、プッシュボタン、トラックボール、クリックホイール、タッチパッド、ジョイスティックおよび／または他のポインティングデバイスなどのうちの１つまたは複数を使用して実装され得る。デバイスＤ８００は、デバイスのディスプレイ面に、および／またはデバイスの裏面（すなわち、タッチスクリーンディスプレイと対向する面）に、カメラＣＡＭも含み得る。ブラウズトークモードまたはゲームプレイモードで使用され得るデバイスＤ８００の典型的なサイズは約１５センチメートル×２０センチメートルである。ポータブルマルチマイクロフォンオーディオ感知デバイスは、アレイＲ１００のマイクロフォンがタブレットコンピュータの上面のマージン内（たとえば、スクリーンベゼル内）および／または１つまたは複数の側面に配設された、上面上にタッチスクリーンディスプレイを含むタブレットコンピュータ（たとえば、ｉＰａｄ（アップル社）などの「スレート」、Ｓｌａｔｅ（カリフォルニア州パロアルトのヒューレットパッカード社）またはＳｔｒｅａｋ（テキサス州ラウンドロックのデル社））として同様に実装され得る。

本明細書で開示するレンジおよびＤＯＡ推定ストラテジの適用例はポータブルオーディオ感知デバイスに限定されない。図３６Ａ〜図３６Ｄは、超音波エミッタＵＥ１０の全方向性（たとえば、円筒型）実装形態を含む会議デバイスのいくつかの例の平面図を示す。図３６Ａは、アレイＲ１００の３マイクロフォン実装形態（マイクロフォンＭＣ１０、ＭＣ２０、およびＭＣ３０）を含む。図３６Ｂは、アレイＲ１００の４マイクロフォン実装形態（マイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０、およびＭＣ４０）を含む。図３６Ｃは、アレイＲ１００の５マイクロフォン実装形態（マイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０、ＭＣ４０、およびＭＣ５０）を含む。図３６Ｄは、アレイＲ１００の６マイクロフォン実装形態（マイクロフォンＭＣ１０、ＭＣ２０、ＭＣ３０、ＭＣ４０、ＭＣ５０、およびＭＣ６０）を含む。アレイＲ１００のマイクロフォンの各々を正多角形の対応する頂点に配置することが望ましいことがある。遠端オーディオ信号の再生のためのラウドスピーカーはデバイス内に含まれ得、かつ／またはそのようなラウドスピーカーは、（たとえば、音響的フィードバックを低減するために）デバイスとは別に配置され得る。

デバイスＤ１００の追加静止使用ケース例は、（たとえば、ボイスオーバＩＰ（ＶｏＩＰ）プロトコルにより）対話型および／または通信アプリケーションをサポートするように構成することができ、ゲームコンソール（たとえば、マイクロソフトＸｂｏｘ、ソニーのプレイステーション、もしくは任天堂のＷｉｉシリーズにおけるコンソールのうちいずれか）および衛星テレビ、ケーブルテレビ、デジタルビデオレコーディング（ＤＶＲ）、またはストリーミングテレビ使用（たとえば、Ｒｅｖｕｅ（カリフォルニア州フリーモントのＬｏｇｉｔｅｃｈ社）、ＲｏｋｕＨＤ、ＸＤ、もしくはＸＤ｜Ｓ（カリフォルニア州サラトガのＲｏｋｕ社）、ＡｐｐｌｅＴＶ（カリフォルニア州キューパーティーノのアップル社））などのためのテレビセットトップボックスを含む。

本明細書で開示した方法および装置は、概して任意の送受信および／またはオーディオ感知適用例、特にそのような適用例のモバイルまたは場合によってはポータブルインスタンスにおいて適用され得る。たとえば、本明細書で開示した構成の範囲は、符号分割多元接続（ＣＤＭＡ）無線インターフェースを採用するように構成されたワイヤレステレフォニー通信システム中に常駐する通信デバイスを含む。とはいえ、本明細書で説明した特徴を有する方法および装置は、ワイヤードおよび／またはワイヤレス（たとえば、ＣＤＭＡ、ＴＤＭＡ、ＦＤＭＡ、および／またはＴＤ−ＳＣＤＭＡ）送信チャネルを介したボイスオーバＩＰ（ＶｏＩＰ）を採用するシステムなど、当業者に知られている広範囲の技術を採用する様々な通信システムのいずれにも常駐し得ることが、当業者には理解されよう。

本明細書で開示した通信デバイスは、パケット交換式であるネットワーク（たとえば、ＶｏＩＰなどのプロトコルに従ってオーディオ送信を搬送するように構成されたワイヤードおよび／またはワイヤレスネットワーク）および／または回線交換式であるネットワークにおける使用に適応し得ることが明確に企図され、本明細書によって開示される。また、本明細書で開示した通信デバイスは、狭帯域コーディングシステム（たとえば、約４または５キロヘルツの可聴周波数レンジを符号化するシステム）での使用、ならびに／あるいは全帯域広帯域コーディングシステムおよびスプリットバンド広帯域コーディングシステムを含む、広帯域コーディングシステム（たとえば、５キロヘルツを超える可聴周波数を符号化するシステム）での使用に適応され得ることが明確に企図され、本明細書によって開示される。

本明細書で説明する構成の提示は、本明細書で開示する方法および他の構造を当業者が製造または使用できるように与えたものである。本明細書で図示および説明したフローチャート、ブロック図、および他の構造は例にすぎず、これらの構造の他の変形態も本開示の範囲内である。これらの構成に対する様々な変更が可能であり、本明細書で提示した一般原理は他の構成にも同様に適用され得る。したがって、本開示は、上記に示した構成に限定されるものではなく、原開示の一部をなす、出願した添付の特許請求の範囲を含む、本明細書において任意の方法で開示した原理および新規の特徴に一致する最も広い範囲が与えられるべきである。

情報および信号は、多種多様な技術および技法のいずれかを使用して表され得ることを当業者なら理解されよう。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、およびシンボルは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。

本明細書で開示する構成の実装形態の重要な設計要件は、８キロヘルツよりも高いサンプリングレート（たとえば、１２、１６、４４．１、４８、または１９２ｋＨｚ）におけるボイス通信の適用例などの計算集約的適用例では特に、（一般に百万命令毎秒またはＭＩＰＳで測定される）処理遅延および／または計算複雑さを最小にすることを含み得る。

本明細書で説明するマルチマイクロフォン処理システムの目的は、全体で１０〜１２ｄＢの雑音低減を達成すること、所望の話者の移動中にボイスレベルおよびカラーを保持すること、アグレッシブな雑音除去、音声の残響除去の代わりに雑音が背景に移動されたという知覚を取得すること、ならびに／またはよりアグレッシブな雑音低減のための後処理（たとえば、スペクトル減算またはウィーナーフィルタ処理など、雑音推定値に基づくスペクトルマスキングおよび／または別のスペクトル修正演算）のオプションを可能にすることを含み得る。

本明細書で開示する装置（たとえば、装置Ａ１００、Ａ１１０、Ａ１２０、Ａ１３０、Ａ１４０、Ａ１５０、Ａ１６０、またはＭＦ１００）の実装形態の様々な要素は、意図された適用例に好適と見なされる、任意のハードウェア構造、あるいはソフトウェアおよび／またはファームウェアとのハードウェアの任意の組合せで実施され得る。たとえば、そのような要素は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ間に常駐する電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたは論理ゲートなどの論理要素の固定アレイまたはプログラマブルアレイであり、これらの要素のいずれも１つまたは複数のそのようなアレイとして実装され得る。これらの要素のうちの任意の２つ以上、さらにはすべてが、同じ１つまたは複数のアレイ内に実装され得る。そのような１つまたは複数のアレイは、１つまたは複数のチップ内（たとえば、２つ以上のチップを含むチップセット内）に実装され得る。

本明細書で開示した装置の様々な実装形態の１つまたは複数の要素は、一部が、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、ＡＳＳＰ（特定用途向け標準製品）、およびＡＳＩＣ（特定用途向け集積回路）など、論理要素の１つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の１つまたは複数のセットとしても実装され得る。本明細書で開示した装置の実装形態の様々な要素のいずれも、１つまたは複数のコンピュータ（たとえば、「プロセッサ」とも呼ばれる、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）としても実施され得、これらの要素のうちの任意の２つ以上、さらにはすべてが、同じそのような１つまたは複数のコンピュータ内に実装され得る。

本明細書で開示したプロセッサまたは処理するための他の手段は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ間に常駐する１つまたは複数の電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたは論理ゲートなどの論理要素の固定アレイまたはプログラマブルアレイであり、これらの要素のいずれも１つまたは複数のそのようなアレイとして実装され得る。そのような１つまたは複数のアレイは、１つまたは複数のチップ内（たとえば、２つ以上のチップを含むチップセット内）に実装され得る。そのようなアレイの例には、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、ＤＳＰ、ＦＰＧＡ、ＡＳＳＰ、およびＡＳＩＣなど、論理要素の固定アレイまたはプログラマブルアレイがある。本明細書で開示したプロセッサまたは処理するための他の手段は、１つまたは複数のコンピュータ（たとえば、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）あるいは他のプロセッサとしても実施され得る。本明細書で説明したプロセッサは、プロセッサが組み込まれているデバイスまたはシステム（たとえば、オーディオ感知デバイス）の別の演算に関係するタスクなど、方法Ｍ１００の実装形態のプロシージャに直接関係しないタスクを実施するかまたは命令の他のセットを実行するために使用することが可能である。また、本明細書で開示する方法の一部はオーディオ感知デバイスのプロセッサによって実施され（たとえば、受動ＤＯＡ推定タスクＴ３００）、その方法の別の一部は１つまたは複数の他のプロセッサの制御下で実施される（たとえば、レンジ推定タスクＴ１００）ことが可能である。

本明細書で開示した構成に関して説明した様々な例示的なモジュール、論理ブロック、回路、およびテストならびに他の動作は、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得ることを、当業者なら諒解されよう。そのようなモジュール、論理ブロック、回路、および動作は、本明細書で開示した構成を生成するように設計された、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣまたはＡＳＳＰ、ＦＰＧＡまたは他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいはそれらの任意の組合せを用いて実装または実施され得る。たとえば、そのような構成は、少なくとも部分的に、ハードワイヤード回路として、特定用途向け集積回路へと作製された回路構成として、あるいは不揮発性記憶装置にロードされるファームウェアプログラム、または汎用プロセッサもしくは他のデジタル信号処理ユニットなどの論理要素のアレイによって実行可能な命令である機械可読コードとしてデータ記憶媒体からロードされるかもしくはデータ記憶媒体にロードされるソフトウェアプログラムとして実装され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成としても実装され得る。ソフトウェアモジュールは、ＲＡＭ（ランダムアクセスメモリ）、ＲＯＭ（読取り専用メモリ）、フラッシュＲＡＭなどの不揮発性ＲＡＭ（ＮＶＲＡＭ）、消去可能プログラマブルＲＯＭ（ＥＰＲＯＭ）、電気的消去可能プログラマブルＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、リムーバブルディスク、またはＣＤ−ＲＯＭなど、非一時的記憶媒体中に、あるいは当技術分野で知られている任意の他の形態の記憶媒体中に常駐し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサに一体化することができる。プロセッサおよび記憶媒体はＡＳＩＣ中に常駐することができる。ＡＳＩＣは、ユーザ端末内に常駐することができる。代替として、プロセッサおよび記憶媒体は、ユーザ端末内に個別構成要素として常駐することもできる。

本明細書で開示した様々な方法（たとえば、方法Ｍ１００、ならびに本明細書で説明した様々な装置およびデバイスの動作に関して開示した他の方法）は、プロセッサなどの論理要素のアレイによって実施され得、本明細書で説明した装置の様々な要素は、そのようなアレイ上で実行するように設計されたモジュールとして部分的に実装され得ることに留意されたい。本明細書で使用する「モジュール」または「サブモジュール」という用語は、ソフトウェア、ハードウェアまたはファームウェアの形態でコンピュータ命令（たとえば、論理式）を含む任意の方法、装置、デバイス、ユニットまたはコンピュータ可読データ記憶媒体を指すことができる。複数のモジュールまたはシステムを１つのモジュールまたはシステムに結合することができ、１つのモジュールまたはシステムを、同じ機能を実施する複数のモジュールまたはシステムに分離することができることを理解されたい。ソフトウェアまたは他のコンピュータ実行可能命令で実装されるとき、プロセスの要素は本質的に、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを用いて関連するタスクを実施するコードセグメントである。「ソフトウェア」という用語は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な命令の１つまたは複数のセットまたはシーケンス、およびそのような例の任意の組合せを含むことを理解されたい。プログラムまたはコードセグメントは、プロセッサ可読記憶媒体に記憶され得、あるいは搬送波に埋め込まれたコンピュータデータ信号によって伝送媒体または通信リンクを介して送信され得る。

本明細書で開示した方法、方式、および技法の実装形態は、（たとえば、本明細書に記載する１つまたは複数のコンピュータ可読記憶媒体の有形のコンピュータ可読特徴において）論理要素のアレイ（たとえば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械によって実行可能な命令の１つまたは複数のセットとしても有形に実施され得る。「コンピュータ可読媒体」という用語は、情報を記憶または転送することができる、揮発性、不揮発性、取外し可能、および取外し不可能な記憶媒体を含む、任意の媒体を含み得る。コンピュータ可読媒体の例には、電子回路、半導体メモリデバイス、ＲＯＭ、フラッシュメモリ、消去可能ＲＯＭ（ＥＲＯＭ）、フロッピー（登録商標）ディスケットまたは他の磁気ストレージ、ＣＤ−ＲＯＭ／ＤＶＤまたは他の光ストレージ、ハードディスクまたは所望の情報を記憶するために使用され得る任意の他の媒体、光ファイバー媒体、無線周波（ＲＦ）リンク、あるいは所望の情報を記憶するために使用され得、アクセスされ得る任意の他の媒体がある。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバー、エアリンク、電磁リンク、ＲＦリンクなどの伝送媒体を介して伝播することができるどんな信号をも含み得る。コードセグメントは、インターネットまたはイントラネットなどのコンピュータネットワークを介してダウンロードされ得る。いずれの場合も、本開示の範囲は、そのような実施形態によって限定されると解釈すべきではない。

本明細書で説明した方法のタスクの各々は、ハードウェアで直接実施され得るか、プロセッサによって実行されるソフトウェアモジュールで実施され得るか、またはその２つの組合せで実施され得る。本明細書で開示する方法の実装形態の典型的な適用例では、論理要素のアレイ（たとえば、論理ゲート）は、この方法の様々なタスクのうちの１つ、複数、さらにはすべてを実施するように構成される。タスクのうちの１つまたは複数（場合によってはすべて）は、論理要素のアレイ（たとえば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械（たとえば、コンピュータ）によって読取り可能および／または実行可能であるコンピュータプログラム製品（たとえば、ディスク、フラッシュまたは他の不揮発性メモリカード、半導体メモリチップなど、１つまたは複数のデータ記憶媒体など）に埋め込まれたコード（たとえば、命令の１つまたは複数のセット）としても実装され得る。本明細書で開示した方法の実装形態のタスクは、２つ以上のそのようなアレイまたは機械によっても実施され得る。これらまたは他の実装形態では、タスクは、セルラー電話など、ワイヤレス通信用のデバイス、またはそのような通信機能を有する他のデバイス内で実施され得る。そのようなデバイスは、（たとえば、ＶｏＩＰなどの１つまたは複数のプロトコルを使用して）回線交換および／またはパケット交換ネットワークと通信するように構成され得る。たとえば、そのようなデバイスは、符号化フレームを受信および／または送信するように構成されたＲＦ回路を含み得る。

本明細書で開示する様々な方法は、ポータブル通信デバイス（たとえば、スマートフォンまたは他のハンドセット）によって実施され得ること、および本明細書で説明する様々な装置は、そのようなデバイスに含まれ得ることが明確に開示される。典型的なリアルタイム（たとえば、オンライン）適用例は、そのようなモバイルデバイスを使用して行われる電話会話である。

１つまたは複数の例示的な実施形態では、本明細書で説明した動作は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装する場合、そのような動作は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体に記憶され得るか、あるいはコンピュータ可読媒体を介して送信され得る。「コンピュータ可読媒体」という用語は、コンピュータ可読記憶媒体と通信（たとえば、伝送）媒体の両方を含む。限定ではなく、例として、コンピュータ可読記憶媒体は、（限定はしないが、ダイナミックまたはスタティックＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、および／またはフラッシュＲＡＭを含み得る）半導体メモリ、または強誘電体メモリ、磁気抵抗メモリ、オボニックメモリ、高分子メモリ、または相変化メモリなどの記憶要素のアレイ、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、ならびに／あるいは磁気ディスクストレージまたは他の磁気ストレージデバイスを備えることができる。そのような記憶媒体は、コンピュータによってアクセスされ得る命令またはデータ構造の形態で情報を記憶し得る。通信媒体は、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む、命令またはデータ構造の形態で所望のプログラムコードを搬送するために使用され得、コンピュータによってアクセスされ得る、任意の媒体を備えることができる。同様に、いかなる接続も適切にコンピュータ可読媒体と称される。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、あるいは赤外線、無線、および／またはマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、あるいは赤外線、無線、および／またはマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピーディスク（disk）およびＢｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ（Ｂｌｕ−ＲａｙＤｉｓｃＡｓｓｏｃｉａｔｉｏｎ、カリフォルニア州ユニヴァーサルシティー）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）はデータをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

本明細書で説明した音響信号処理装置は、いくつかの動作を制御するために音声入力を受容し、あるいは背景雑音から所望の雑音を分離することから利益を得ることがある、通信デバイスなどの電子デバイスに組み込まれ得る。多くの適用例では、複数の方向から発生した背景音から明瞭な所望の音を強調または分離することから利益を得ることがある。そのような適用例は、ボイス認識および検出、音声強調および分離、ボイスアクティブ化制御などの機能を組み込んだ電子デバイスまたはコンピューティングデバイスにおけるヒューマンマシンインターフェースを含み得る。限られた処理機能のみを提供するデバイスに適したそのような音響信号処理装置を実装することが望ましいことがある。

本明細書で説明したモジュール、要素、およびデバイスの様々な実装形態の要素は、たとえば、同じチップ上にまたはチップセット中の２つ以上のチップ間に常駐する電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたはゲートなど、論理要素の固定アレイまたはプログラマブルアレイである。本明細書で説明した装置の様々な実装形態の１つまたは複数の要素は、全体または一部が、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ、ＡＳＳＰ、およびＡＳＩＣなど、論理要素の１つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の１つまたは複数のセットとしても実装され得る。

本明細書で説明した装置の実装形態の１つまたは複数の要素は、その装置が組み込まれているデバイスまたはシステムの別の動作に関係するタスクなど、装置の動作に直接関係しないタスクを実施するために、または装置の動作に直接関係しない命令の他のセットを実行するために使用されることが可能である。また、そのような装置の実装形態の１つまたは複数の要素は、共通の構造（たとえば、異なる要素に対応するコードの部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実施するために実行される命令のセット、あるいは、異なる要素向けの動作を異なる時間に実施する電子デバイスおよび／または光デバイスの構成）を有することが可能である。たとえば、ＦＦＴモジュールＦＦＴ１〜ＦＦＴ４のうち１つまたは複数（可能性としてはすべて）は、異なる時間において同じ構造（たとえば、ＦＦＴ演算を定義する同じ命令セット）を使うように実装され得る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
信号処理の方法であって、
第１の超音波信号の第１の反射からの情報に基づいて、音放射体の第１のレンジを推定することと、
前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択することと、
前記選択された到着方向推定演算を実施して、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の到着方向の推定値を算出することとを備える方法。
［Ｃ２］
前記マルチチャネル信号の第１のチャネルが、第１の検出器によって生成された信号に基づき、前記マルチチャネル信号の第２のチャネルが、第２の検出器によって生成された信号に基づく、Ｃ１に記載の方法。
［Ｃ３］
前記第１のレンジを前記推定することが、前記第１の検出器までの前記第１の超音波信号の飛行時間を算出することを含み、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第１の検出器までの前記第１の超音波信号の前記算出された飛行時間を含む、Ｃ２に記載の方法。
［Ｃ４］
前記第１のレンジを前記推定することが、第１の検出器までの前記第１の超音波信号の飛行時間を算出することを含み、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第１の検出器までの前記第１の超音波信号の前記算出された飛行時間を含み、
前記第１のレンジを前記推定することが、第２の検出器までの前記第１の超音波信号の飛行時間を算出することを含み、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第２の検出器までの前記第１の超音波信号の前記算出された飛行時間を含む、Ｃ１に記載の方法。
［Ｃ５］
前記マルチチャネル信号の前記オーディオ周波数成分が、前記第１および第２の検出器によって生成された信号に基づく、Ｃ４に記載の方法。
［Ｃ６］
前記第１および第２の検出器までの前記第１の超音波信号の前記算出された飛行時間に基づいて、前記オーディオ周波数成分の到着方向の第２の推定値を算出することを備える、Ｃ４に記載の方法。
［Ｃ７］
相対的重み付けにより、前記算出された到着方向推定値と、前記算出された第２の推定値とを合成して、到着方向の合成推定値を取得することを備え、
前記相対的重み付けが前記オーディオ周波数成分のレベルに基づく、Ｃ６に記載の方法。
［Ｃ８］
前記相対的重み付けが、前記算出された到着方向推定値と前記算出された第２の推定値との間の差に基づく、Ｃ７に記載の方法。
［Ｃ９］
前記方法が、前記第１の検出器までの第２の超音波信号の飛行時間を算出することを含み、
前記相対的重み付けが、前記第１の検出器までの前記第１の超音波信号の前記飛行時間と前記第２の超音波信号の前記飛行時間との間の差に基づく、Ｃ７に記載の方法。
［Ｃ１０］
前記第１の超音波信号の第２の反射からの情報に基づいて、第２のレンジを推定することと、
前記第１の超音波信号の後に放射される第２の超音波信号の第１の反射からの情報に基づいて、第３のレンジを推定することと、
前記第２の超音波信号の第２の反射からの情報に基づいて、第４のレンジを推定することと、
（Ａ）前記第１のレンジと前記第３のレンジの差と、（Ｂ）前記第２のレンジと前記第４のレンジの差と、の間の関係に基づいて、前記第３および第４のレンジのうち１つを選択することと、
前記選択されたレンジに基づいて、前記複数の到着方向推定演算のうち１つの、第２の選択を実施することと、
前記第２の選択によって選択された前記到着方向推定演算を実施して、前記オーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の前記到着方向の第２の推定値を算出することとを備える、Ｃ２に記載の方法。
［Ｃ１１］
前記第１の検出器までの第２の超音波信号の飛行時間および前記第２の検出器までの前記第２の超音波信号の飛行時間を算出することと、
（Ａ）前記第１の検出器までの前記第１の超音波信号の前記飛行時間と、前記第１の検出器までの前記第２の超音波信号の前記飛行時間との間の差が、第２の閾値を超えず、（Ｂ）前記第２の超音波信号の前記第２の飛行時間が、前記第１の超音波信号の前記第２の飛行時間とは異なることを検出することと、
前記検出に応答して、前記第２の超音波信号の前記第２の飛行時間に基づいて、前記推定された第１のレンジを更新することとを備える、Ｃ２に記載の方法。
［Ｃ１２］
前記オーディオ周波数成分の前記到着方向の前記推定値に基づいて、画像の一部分をフォーカスウィンドウとして選択することと、
前記音放射体の前記推定された第１のレンジに、また前記フォーカスウィンドウからの情報に基づいて、カメラフォーカス動作を実施することとを含む、Ｃ１に記載の方法。
［Ｃ１３］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ１に記載の方法。
［Ｃ１４］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ１に記載の方法。
［Ｃ１５］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ１に記載の方法。
［Ｃ１６］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、Ｃ１に記載の方法。
［Ｃ１７］
複数の到着方向推定演算のうち１つを前記選択することが、
前記推定された第１のレンジを閾値と比較することと、
前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の１つを選択することと、
前記推定された第１のレンジが前記閾値より大きい場合、前記複数の到着方向推定演算のうち第２の１つを選択することとを備える、Ｃ１に記載の方法。
［Ｃ１８］
前記オーディオ周波数成分が、前記音放射体によって放射された音を含む、Ｃ１に記載の方法。
［Ｃ１９］
信号処理のための装置であって、
第１の超音波信号の第１の反射からの情報に基づいて、音放射体の第１のレンジを推定するための手段と、
前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択するための手段と、
前記選択された到着方向推定演算を実施して、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の到着方向の推定値を算出するための手段とを備える装置。
［Ｃ２０］
前記マルチチャネル信号の第１のチャネルが、第１の検出器によって生成された信号に基づき、前記マルチチャネル信号の第２のチャネルが、第２の検出器によって生成された信号に基づく、Ｃ１９に記載の装置。
［Ｃ２１］
前記第１のレンジを推定するための前記手段が、前記第１の検出器までの前記第１の超音波信号の飛行時間を算出するための手段を含み、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第１の検出器までの前記第１の超音波信号の前記算出された飛行時間を含む、Ｃ２０に記載の装置。
［Ｃ２２］
前記第１のレンジを推定するための前記手段が、第１の検出器までの前記第１の超音波信号の飛行時間を算出するための手段を含み、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第１の検出器までの前記第１の超音波信号の前記算出された飛行時間を含み、
前記第１のレンジを推定するための前記手段が、第２の検出器までの前記第１の超音波信号の飛行時間を算出するための手段を含み、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第２の検出器までの前記第１の超音波信号の前記算出された飛行時間を含む、Ｃ１９に記載の装置。
［Ｃ２３］
前記マルチチャネル信号の前記オーディオ周波数成分が、前記第１および第２の検出器によって生成された信号に基づく、Ｃ２２に記載の装置。
［Ｃ２４］
前記第１および第２の検出器までの前記第１の超音波信号の前記算出された飛行時間に基づいて、前記オーディオ周波数成分の到着方向の第２の推定値を算出するための手段を備える、Ｃ２２に記載の装置。
［Ｃ２５］
相対的重み付けにより、前記算出された到着方向推定値と、前記算出された第２の推定値とを合成して、到着方向の合成推定値を取得するための手段を備え、
前記相対的重み付けが前記オーディオ周波数成分のレベルに基づく、Ｃ２４に記載の装置。
［Ｃ２６］
前記相対的重み付けが、前記算出された到着方向推定値と前記算出された第２の推定値との間の差に基づく、Ｃ２５に記載の装置。
［Ｃ２７］
前記第１の検出器までの第２の超音波信号の飛行時間を算出するための手段を含み、
前記相対的重み付けが、前記第１の検出器までの前記第１の超音波信号の前記飛行時間と前記第２の超音波信号の前記飛行時間との間の差に基づく、Ｃ２５に記載の装置。
［Ｃ２８］
前記第１の超音波信号の第２の反射からの情報に基づいて、第２のレンジを推定するための手段と、
前記第１の超音波信号の後に放射された第２の超音波信号の第１の反射からの情報に基づいて、第３のレンジを推定するための手段と、
前記第２の超音波信号の第２の反射からの情報に基づいて、第４のレンジを推定するための手段と、
（Ａ）前記第１のレンジと前記第３のレンジの差と、（Ｂ）前記第２のレンジと前記第４のレンジの差と、の間の関係に基づいて、前記第３および第４のレンジのうち１つを選択するための手段と、
前記選択されたレンジに基づいて、前記複数の到着方向推定演算のうち１つの第２の選択を実施するための手段と、
前記第２の選択によって選択された前記到着方向推定演算を実施して、前記オーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の前記到着方向の第２の推定値を算出するための手段とを備える、Ｃ２０に記載の装置。
［Ｃ２９］
前記第１の検出器までの第２の超音波信号の飛行時間および前記第２の検出器までの前記第２の超音波信号の飛行時間を算出するための手段と、
（Ａ）前記第１の検出器までの前記第１の超音波信号の前記飛行時間と、前記第１の検出器までの前記第２の超音波信号の前記飛行時間との間の差が、第２の閾値を超えず、（Ｂ）前記第２の超音波信号の前記第２の飛行時間が、前記第１の超音波信号の前記第２の飛行時間とは異なることを検出するための手段と、
前記検出に応答して、前記第２の超音波信号の前記第２の飛行時間に基づいて、前記推定された第１のレンジを更新するための手段とを備える、Ｃ２０に記載の装置。
［Ｃ３０］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ１９に記載の装置。
［Ｃ３１］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ１９に記載の装置。
［Ｃ３２］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ１９に記載の装置。
［Ｃ３３］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、Ｃ１９に記載の装置。
［Ｃ３４］
複数の到着方向推定演算のうち１つを選択するための前記手段が、
前記推定された第１のレンジを閾値と比較するための手段と、
前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の１つを選択するための手段と、
前記推定された第１のレンジが前記閾値より大きい場合、前記複数の到着方向推定演算のうち第２の１つを選択するための手段とを備える、Ｃ１９に記載の装置。
［Ｃ３５］
前記オーディオ周波数成分が、前記音放射体によって放射された音を含む、Ｃ１９に記載の装置。
［Ｃ３６］
信号処理のための装置であって、
第１の超音波信号の第１の反射からの情報に基づいて、音放射体の第１のレンジを推定するように構成されたレンジ推定器と、
前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択するように構成された比較器と、
前記選択された到着方向推定演算を実施して、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の到着方向の推定値を算出するように構成された方向計算器とを備える装置。
［Ｃ３７］
前記マルチチャネル信号の第１のチャネルが、第１の検出器によって生成された信号に基づき、前記マルチチャネル信号の第２のチャネルが、第２の検出器によって生成された信号に基づく、Ｃ３６に記載の装置。
［Ｃ３８］
前記レンジ推定器が、前記第１の検出器までの前記第１の超音波信号の飛行時間を算出するように構成され、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第１の検出器までの前記第１の超音波信号の前記算出された飛行時間を含む、Ｃ３７に記載の装置。
［Ｃ３９］
前記レンジ推定器が、第１の検出器までの前記第１の超音波信号の飛行時間を算出するように構成され、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第１の検出器までの前記第１の超音波信号の前記算出された飛行時間を含み、
前記レンジ推定器が、第２の検出器までの前記第１の超音波信号の飛行時間を算出するように構成され、前記第１の超音波信号の前記第１の反射からの前記情報が、前記第２の検出器までの前記第１の超音波信号の前記算出された飛行時間を含む、Ｃ３６に記載の装置。
［Ｃ４０］
前記マルチチャネル信号の前記オーディオ周波数成分が、前記第１および第２の検出器によって生成された信号に基づく、Ｃ３９に記載の装置。
［Ｃ４１］
前記第１および第２の検出器までの前記第１の超音波信号の前記算出された飛行時間に基づいて、前記オーディオ周波数成分の到着方向の第２の推定値を算出するように構成された第２の方向計算器を備える、Ｃ３９に記載の装置。
［Ｃ４２］
前記装置が、相対的重み付けにより、前記算出された到着方向推定値と、前記算出された第２の推定値とを合成して、到着方向の合成推定値を取得するように構成された合成器を備え、
前記相対的重み付けが前記オーディオ周波数成分のレベルに基づく、Ｃ４１に記載の装置。
［Ｃ４３］
前記相対的重み付けが、前記算出された到着方向推定値と前記算出された第２の推定値との間の差に基づく、Ｃ４２に記載の装置。
［Ｃ４４］
前記レンジ推定器が、前記第１の検出器までの第２の超音波信号の飛行時間を示すように構成され、
前記相対的重み付けが、前記第１の検出器までの前記第１の超音波信号の前記飛行時間と前記第２の超音波信号の前記飛行時間との間の差に基づく、Ｃ４２に記載の装置。
［Ｃ４５］
前記レンジ推定器が、
前記第１の超音波信号の第２の反射からの情報に基づく第２のレンジと、
前記第１の超音波信号の後に放射された第２の超音波信号の第１の反射からの情報に基づく第３のレンジと、
前記第２の超音波信号の第２の反射からの情報に基づく第４のレンジとを推定するように構成され、
前記装置が、
（Ａ）前記第１のレンジと前記第３のレンジの差と、（Ｂ）前記第２のレンジと前記第４のレンジの差と、の間の関係に基づいて、前記第３および第４のレンジのうち１つを選択するように構成されたセレクタと、
前記選択されたレンジに基づいて、前記複数の到着方向推定演算のうち１つの第２の選択を実施するように構成された第２の比較器と、
前記第２の比較器によって選択された前記到着方向推定演算を実施して、前記オーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の前記到着方向の第２の推定値を算出するように構成された第２の方向計算器とを備える、Ｃ３７に記載の装置。
［Ｃ４６］
前記レンジ推定器が、前記第１の検出器までの第２の超音波信号の飛行時間と、前記第２の検出器までの前記第２の超音波信号の飛行時間とを算出するように構成され、
前記装置が、（Ａ）前記第１の検出器までの前記第１の超音波信号の前記飛行時間と、前記第１の検出器までの前記第２の超音波信号の前記飛行時間との間の差が、第２の閾値を超えず、（Ｂ）前記第２の超音波信号の前記第２の飛行時間が、前記第１の超音波信号の前記第２の飛行時間とは異なることを検出するように構成された第２の比較器を備え、
前記レンジ推定器が、前記検出に応答して、前記第２の超音波信号の前記第２の飛行時間に基づいて、前記推定された第１のレンジを更新するように構成される、Ｃ３７に記載の装置。
［Ｃ４７］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ３６に記載の装置。
［Ｃ４８］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ３６に記載の装置。
［Ｃ４９］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ３６に記載の装置。
［Ｃ５０］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、Ｃ３６に記載の装置。
［Ｃ５１］
前記比較器が、前記推定された第１のレンジを閾値と比較し、前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の１つを選択し、前記推定された第１のレンジが前記閾値よりも大きい場合、前記複数の到着方向推定演算のうち第２の１つを選択するように構成される、Ｃ３６に記載の装置。
［Ｃ５２］
前記オーディオ周波数成分が、前記音放射体によって放射された音を含む、Ｃ３６に記載の装置。
［Ｃ５３］
Ｃ３６に記載の装置を含む通信デバイス。
［Ｃ５４］
有形機能を有する非一時的コンピュータ可読記憶媒体であって、前記有形機能が、前記特徴を読み取る機械に、
第１の超音波信号の第１の反射からの情報に基づいて、音放射体の第１のレンジを推定させ、
前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択させ、
前記選択された到着方向推定演算を実施させて、マルチチャネル信号のオーディオ周波数成分からの情報に基づいて、前記オーディオ周波数成分の到着方向の推定値を算出させる媒体。
［Ｃ５５］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ５４に記載の媒体。
［Ｃ５６］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ５４に記載の媒体。
［Ｃ５７］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、Ｃ５４に記載の媒体。
［Ｃ５８］
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、Ｃ５４に記載の媒体。
［Ｃ５９］
複数の到着方向推定演算のうち１つを前記選択することが、
前記推定された第１のレンジを閾値と比較することと、
前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の１つを選択することと、
前記推定された第１のレンジが前記閾値より大きい場合、前記複数の到着方向推定演算のうち第２の１つを選択することとを備える、Ｃ５４に記載の媒体。

Claims

信号処理の方法であって、
(a1) 音放射体から反射された検出超音波信号を受信することと、
(a2) 前記受信した検出超音波信号に基づいて、前記音放射体の第１のレンジを推定する、ここにおいて、前記第１のレンジは、前記音放射体と検出器との間の時間または距離の測定値である、ことと、
(a3) 前記推定された第１のレンジを使って、複数の到着方向推定演算のうち１つを選択することと、
(a4) 検出器アレイ中の複数の検出器に到着する前記音放射体からの音のオーディオ周波数成分を含む１つまたは複数のオーディオ周波数信号を受信することと、
(a5) 前記選択された到着方向推定演算を実施して、オーディオ周波数成分を含む前記１つまたは複数の信号に基づいて、前記検出器アレイに相対した前記音放射体からの音の到着方向推定値を算出することと、
を備える方法。
第１のオーディオ周波数信号が、第１の検出器によって受信された、前記音放射体からのオーディオ周波数成分に基づき、第２のオーディオ周波数信号が、第２の検出器によって受信された、前記音放射体からのオーディオ周波数成分に基づき、前記第１および第２の検出器が互いから離間される、請求項１に記載の方法。
前記超音波信号の放射時間が、信号プロセッサによって受信され、または識別され、前記受信した検出超音波信号に基づいて前記第１のレンジを前記推定することが、第１の超音波信号の、前記音放射体まで、および前記音放射体から第１の検出器への反射の飛行時間を算出することを含み、前記第１の検出器が、オーディオ周波数と超音波信号の両方を検出する、請求項２に記載の方法。
前記超音波信号の放射時間が、信号プロセッサによって受信され、または識別され、音放射体から反射された検出超音波信号を前記受信することが、第１の超音波信号の、前記音放射体まで、および前記音放射体から第１の検出器への反射の第１の飛行時間を算出することであって、前記第１の検出器が、オーディオ周波数と超音波信号の両方を検出することと、
前記第１の超音波信号の、前記音放射体までの、および前記音放射体から第２の検出器への反射の第２の飛行時間を算出し、前記第２の算出された飛行時間に基づいて、前記音放射体の第２のレンジを推定することと
を含む、請求項１に記載の方法。
前記第１および第２の検出器までの、前記第１の超音波信号の前記算出された飛行時間を使って、前記検出された反射超音波信号に基づいて、前記検出器アレイに相対した、音放射ソースの第２の方向推定値を算出することを備える、請求項４に記載の方法。
前記方法が、前記算出された到着方向推定値を、第１の重みによって重み付けすることと、前記算出された第２の方向推定値を、第２の重みによって重み付けすることと、前記重み付き推定値を合成して、到着方向の合成推定値を判断することとを備え、
前記第１および第２の重みが、ゼロから１の範囲の値をもち、合計が１になり、前記第１および第２の重みの相対値が、前記１つまたは複数のオーディオ周波数信号の利得に基づいて判断される、請求項５に記載の方法。
前記重み付けすることが、前記算出された到着方向推定値と前記算出された第２の推定値との間の差にさらに基づく、請求項６に記載の方法。
前記方法が、前記超音波信号の後に放射され、音放射ソースから前記検出器まで反射された第２の超音波信号に対応する第２の検出超音波信号を受信することと、前記第２の超音波信号の放射時間を受信または識別することと、前記第１の検出器までの第２の検出超音波信号の飛行時間を算出することとを含み、
前記第１および第２の重みの相対値が、前記第１の検出器までの前記第１の超音波信号の前記飛行時間と前記第２の超音波信号の前記飛行時間との間の差にさらに基づく、請求項６に記載の方法。
前記音放射体の第１のレンジを前記推定することが、
第１の検出超音波信号を受信することであって、前記第１の検出超音波信号が、第１の超音波信号の、前記音放射体からの反射に対応することと、
前記第１の検出超音波信号に基づいて第１のレンジを推定することと、
第２の検出超音波信号を受信することであって、前記第２の検出超音波信号が、前記音放射体以外のオブジェクトからの、前記第１の超音波信号の反射に対応することと、
前記第２の検出超音波信号に基づいて第２のレンジを推定することと、
第３の検出超音波信号を受信することであって、前記第３の検出超音波信号が、前記第１の超音波信号の後で放射された第２の超音波信号の、前記音放射体からの反射に対応することと、
前記第３の検出超音波信号に基づいて第３のレンジを推定することと、
第４の検出超音波信号を受信することであって、前記第４の検出超音波信号が、前記第２の超音波信号の前記音放射体以外の前記オブジェクトからの反射に対応することと、
前記第４の検出超音波信号に基づいて第４のレンジを推定することと、
（Ａ）前記第１のレンジと前記第３のレンジの差と、（Ｂ）前記第２のレンジと前記第４のレンジの差と、の間の関係に基づいて、前記第３および第４のレンジのうち１つを、前記検出器アレイに相対した音放射ソースのレンジとして選択することと、
複数の到着方向演算のうち１つの前記選択において、前記選択されたレンジを前記第１のレンジとして使うことと
をさらに備える、請求項２に記載の方法。
前記第１の超音波信号に続いて放射された第２の超音波信号の前記音放射体からの反射を備える第２の検出超音波信号を受信することと、
前記第２の超音波信号の放射時間を受信または識別することと、
前記第１の検出器までの前記第２の超音波信号の飛行時間に基づいて第２のレンジを算出することと、
前記第１のレンジと前記第２のレンジとの間の差が動き閾値未満のときに持続するものとして特徴を識別することと、
前記第１のレンジと前記第２のレンジとの間の前記差が少なくとも前記動き閾値だけ異なるときに動いているものとして前記特徴を識別することと
を備える、請求項２に記載の方法。
前記オーディオ周波数成分の前記到着方向推定値に基づいて、画像の一部分をフォーカスウィンドウとして選択することと、
前記音放射体の前記推定された第１のレンジに、および前記フォーカスウィンドウからの情報に基づいて、カメラフォーカス動作を実施することと
を含む、請求項１に記載の方法。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項１に記載の方法。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項１に記載の方法。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、請求項１に記載の方法。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、請求項１に記載の方法。
複数の到着方向推定演算のうち１つを前記選択することが、
前記推定された第１のレンジを閾値と比較することと、
前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の到着方向推定演算を選択することと、
前記推定された第１のレンジが前記閾値より大きい場合、前記複数の到着方向推定演算のうち第２の到着方向推定演算を選択することと
を備える、請求項１に記載の方法。
信号処理のための装置であって、
音放射体から反射された検出超音波信号を受信するための入力、および前記受信した検出超音波信号からの情報に基づいてレンジ推定信号を出力するための出力を備える、前記音放射体の第１のレンジを推定するための手段、ここにおいて、前記第１のレンジは、前記音放射体と検出器との間の時間または距離の測定値である、と、
検出器アレイに相対して、前記音放射体から放射された音の到着方向を推定するための手段であって、複数の到着方向推定演算のうち１つを選択するための入力、検出器アレイ中の複数の検出器に到着する前記音放射体からの音のオーディオ周波数成分を含む１つまたは複数のオーディオ周波数信号を受信するための１つまたは複数の入力、および前記推定到着方向を出力するための出力を有する、手段と、
複数の到着方向推定演算のうち１つを選択するための手段であって、音放射体の第１のレンジを推定するための前記手段の前記出力に結合された入力、および到着方向を推定するための前記手段の前記それぞれの入力に結合された出力を有し、前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを判断し、推定するための前記手段に、前記選択された推定演算を施させる信号を出力する、手段と
を備える装置。
第１のオーディオ周波数信号が、第１の検出器によって受信された、前記音放射体からのオーディオ周波数成分に基づき、第２のオーディオ周波数信号が、第２の検出器によって受信された、前記音放射体からのオーディオ周波数成分に基づき、前記第１および第２の検出器が、互いから離間される、請求項１７に記載の装置。
前記第１のレンジを推定するための前記手段が、前記超音波信号の放射時間を受信または識別するための手段と、第１の超音波信号の、前記音放射体まで、および前記音放射体から前記第１の検出器への反射の飛行時間を算出するための手段とを含み、前記第１の検出器が、オーディオ周波数と超音波信号の両方を検出する、請求項１８に記載の装置。
前記第１のレンジを推定するための前記手段が、前記超音波信号の放射時間を受信または識別するための手段と、第１の超音波信号の、前記音放射体まで、および前記音放射体から第１の検出器への反射の第１の飛行時間を算出するための手段とを含み、
前記第１のレンジを推定するための前記手段が、前記第１の超音波信号の、前記音放射体まで、および前記音放射体から第２の検出器への反射の第２の飛行時間を算出するための手段を含み、到着方向を推定するための前記手段が、前記第２の算出された飛行時間に基づいて第２のレンジを推定する、請求項１７に記載の装置。
前記第１および第２の検出器までの、前記第１の超音波信号の前記算出された飛行時間を使って、前記検出された反射超音波信号に基づいて、前記検出器アレイに相対して、音放射ソースの第２の到着方向推定値を算出するための手段を備える、請求項２０に記載の装置。
前記装置が、前記算出された到着方向推定値を、第１の重みによって重み付けし、前記算出された第２の推定値を、第２の重みによって重み付けし、前記重み付き推定値を合成して、到着方向の合成推定値を判断するための手段を備え、
前記第１および第２の重みが、ゼロから１の範囲の値をもち、合計が１になり、前記第１および第２の重みの相対値が、前記１つまたは複数のオーディオ周波数信号の利得に基づいて判断される、請求項２１に記載の装置。
前記重み付けすることが、前記算出された到着方向推定値と前記算出された第２の推定値との間の差にさらに基づく、請求項２２に記載の装置。
前記装置が、前記超音波信号の後に放射され、音放射ソースから前記検出器まで反射された第２の超音波信号に対応する第２の検出超音波信号を受信する手段と、前記第２の超音波信号の放射時間を受信または識別するための手段と、前記第１の検出器までの第２の超音波信号の飛行時間を算出するための手段とを含み、
前記第１および第２の重みの相対値が、前記第１の検出器までの前記第１の超音波信号の前記飛行時間と前記第２の超音波信号の前記飛行時間との間の差に基づく、請求項２２に記載の装置。
前記装置が、
第１の検出超音波信号を受信するための手段であって、前記第１の検出超音波信号が、第１の超音波信号の、前記音放射体からの反射に対応する手段と、
前記第１の検出超音波信号に基づいて第１のレンジを推定するための手段と、
第２の検出超音波信号を受信するための手段であって、前記第２の検出超音波信号が、前記音放射体以外のオブジェクトからの、前記第１の超音波信号の反射に対応する手段と、
前記第２の検出超音波信号に基づいて第２のレンジを推定するための手段と、
第３の検出超音波信号を受信するための手段であって、前記第３の検出超音波信号が、前記第１の超音波信号の後で放射された第２の超音波信号の、前記音放射体からの反射に対応する手段と、
前記第３の検出超音波信号に基づいて第３のレンジを推定するための手段と、
第４の検出超音波信号を受信するための手段であって、前記第４の検出超音波信号が、前記第２の超音波信号の前記音放射体以外の前記オブジェクトからの反射に対応する手段と、
前記第４の検出超音波信号に基づいて第４のレンジを推定するための手段と、
（Ａ）前記第１のレンジと前記第３のレンジの差と、（Ｂ）前記第２のレンジと前記第４のレンジの差と、の間の関係に基づいて、前記第３および第４のレンジのうち１つを、前記検出器アレイに相対した、音放射ソースのレンジとして選択するための手段と
を備え、
前記選択されたレンジが、複数の到着方向推定演算のうち１つを選択するための前記手段において、前記第１のレンジとして使われる、請求項１８に記載の装置。
前記第１の超音波信号に続いて放射された第２の超音波信号の前記音放射体からの反射を備える第２の検出超音波信号を受信するための手段と、
前記第２の超音波信号の放射時間を受信または識別するための手段と、
前記第１の検出器までの前記第２の超音波信号の飛行時間に基づいて第２のレンジを算出するための手段と、
前記第１のレンジと前記第２のレンジとの間の差が動き閾値未満のときに持続するものとして特徴を識別するための手段と、
前記第１のレンジと前記第２のレンジとの間の前記差が少なくとも前記動き閾値だけ異なるときに動いているものとして前記特徴を識別するための手段と
を備える、請求項１８に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項１７に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項１７に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、請求項１７に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、請求項１７に記載の装置。
複数の到着方向推定演算のうち１つを選択するための前記手段が、
前記推定された第１のレンジを閾値と比較するための手段と、
前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の到着方向推定演算を選択するための手段と、
前記推定された第１のレンジが前記閾値より大きい場合、前記複数の到着方向推定演算のうち第２の到着方向推定演算を選択するための手段と
を備える、請求項１７に記載の装置。
信号処理のための装置であって、
音放射体の第１のレンジを推定するように構成されたレンジ推定器であって、前記音放射体から反射された検出超音波信号を受信するための入力、および前記受信した検出超音波信号に基づいて第１のレンジを出力するための出力を有するレンジ推定器、ここにおいて、前記第１のレンジは、前記音放射体と検出器との間の時間または距離の測定値である、と、
前記レンジ推定器の前記出力に結合された比較器であって、前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択するように、および選択信号を出力するように構成された比較器と、
前記比較器の前記出力に、および検出器アレイ中の複数の検出器に到着する、前記音放射体からの音のオーディオ周波数成分を含む１つまたは複数のオーディオ周波数信号を受信するための１つまたは複数の入力および前記推定到着方向を出力するための出力に結合された方向計算器であって、前記比較器の選択信号によって選択された前記到着方向推定演算を実施し、オーディオ周波数成分を含む前記１つまたは複数のオーディオ周波数信号に基づいて、前記検出器アレイに相対した、前記音放射体からの音の到着方向推定値を算出するように構成された方向計算器と
を備える装置。
第１のオーディオ周波数信号が、第１の検出器によって受信された、前記音放射体からのオーディオ周波数成分に基づき、第２のオーディオ周波数信号が、第２の検出器によって受信された、前記音放射体からのオーディオ周波数成分に基づき、前記第１および第２の検出器が、互いから離間される、請求項３２に記載の装置。
前記レンジ推定器が、前記超音波信号の放射時間を受信または識別し、第１の超音波信号の、前記音放射体まで、および前記音放射体から前記第１の検出器への反射の飛行時間を算出するように構成され、前記第１の検出器が、オーディオ周波数と超音波信号の両方を検出する、請求項３３に記載の装置。
前記レンジ推定器が、前記超音波信号の放射時間を受信または識別し、第１の超音波信号の、前記音放射体まで、および前記音放射体から第１の検出器への反射の第１の飛行時間を算出するように構成され、
前記レンジ推定器が、前記第１の超音波信号の、前記音放射体まで、および前記音放射体から第２の検出器への反射の第２の飛行時間を算出し、前記第２の飛行時間に基づいて第２のレンジを推定するように構成される、請求項３２に記載の装置。
前記第１および第２の検出器までの、前記第１の超音波信号の前記算出された飛行時間を使って、前記検出された反射超音波信号に基づいて、前記検出器アレイに相対して、前記音放射体の第２の到着方向推定値を算出するように構成された第２の方向計算器を備える、請求項３５に記載の装置。
前記装置が、前記算出された到着方向推定値を、第１の重みによって重み付けし、前記算出された第２の推定値を、第２の重みによって重み付けし、前記重み付き推定値を合成して、到着方向の合成推定値を判断するように構成された合成器を備え、
前記第１および第２の重みが、ゼロから１の範囲の値をもち、合計が１になり、前記第１および第２の重みの相対値が、前記１つまたは複数のオーディオ周波数信号の利得に基づいて判断される、請求項３６に記載の装置。
前記重み付けすることが、前記算出された到着方向推定値と前記算出された第２の推定値との間の差にさらに基づく、請求項３７に記載の装置。
前記レンジ推定器が、前記超音波信号の後に放射され、前記音放射体から前記検出器アレイに反射された第２の超音波信号に対応する第２の検出超音波信号を受信し、前記第２の超音波信号の放射時間を受信または識別し、前記第１の検出器までの第２の超音波信号の飛行時間を示すように構成され、
前記第１および第２の重みの相対値が、前記第１の検出器までの前記第１の超音波信号の前記飛行時間と前記第２の超音波信号の前記飛行時間との間の差に基づく、請求項３７に記載の装置。
前記レンジ推定器が、
前記音放射体以外のオブジェクトからの、前記第１の超音波信号の反射に対応する第２の検出超音波信号を受信し、前記第２の検出超音波信号に基づいて第２のレンジを推定し、
前記第１の超音波信号の後に放射された第２の超音波信号の前記音放射体からの反射に対応する第３の検出超音波信号を受信し、前記第３の検出超音波信号に基づいて第３のレンジを推定し、
前記第２の超音波信号の前記音放射体以外の前記オブジェクトからの反射に対応する第４の検出超音波信号を受信するように構成され、
セレクタが、（Ａ）前記第１のレンジと前記第３のレンジの差と、（Ｂ）前記第２のレンジと第４のレンジの差と、の間の関係に基づいて、前記第３および前記第４のレンジのうち１つを、前記検出器アレイに相対した、音放射ソースのレンジとして選択するように構成され、
第２の比較器が、前記第３および第４のレンジのうち前記選択されたものに基づいて、前記複数の到着方向推定演算のうち１つの演算の第２の選択を実施するように構成され、
第２の方向計算器が、前記第２の比較器によって選択された前記到着方向推定演算を実施して、前記複数の検出器に到着する前記音放射体からの音の前記オーディオ周波数成分を備える前記１つまたは複数のオーディオ周波数信号に基づいて、前記オーディオ周波数信号の前記到着方向の第２の推定値を算出するように構成される、請求項３３に記載の装置。
前記レンジ推定器が、前記第１の超音波信号に続いて放射された第２の超音波信号の前記音放射体からの反射を備える第２の検出超音波信号を受信し、前記第２の超音波信号の放射時間を受信または識別し、前記第１の検出器までの前記第２の超音波信号の飛行時間に基づいて第２のレンジを算出し、前記第１のレンジと前記第２のレンジとの間の差が動き閾値未満のときに持続するものとして特徴を識別し、前記第１のレンジと前記第２のレンジとの間の前記差が少なくとも前記動き閾値だけ異なるときに動いているものとして前記特徴を識別するように構成される、請求項３３に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項３２に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項３２に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、請求項３２に記載の装置。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、請求項３２に記載の装置。
前記比較器が、前記推定された第１のレンジを閾値と比較し、前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の到着方向推定演算を選択し、前記推定された第１のレンジが前記閾値よりも大きい場合、前記複数の到着方向推定演算のうち第２の到着方向推定演算を選択するように構成される、請求項３２に記載の装置。
請求項３６に記載の装置を含む通信デバイス。
有形機能を有する非一時的コンピュータ可読記憶媒体であって、前記有形機能が、前記機能を読み取る機械に、
音放射体から反射された検出超音波信号を受信させ、
前記受信した検出超音波信号に基づいて、前記音放射体の第１のレンジ、ここにおいて、前記第１のレンジは前記音放射体と検出器との間の時間または距離の測定値である、を推定させ、
前記推定された第１のレンジに基づいて、複数の到着方向推定演算のうち１つを選択させ、
検出器アレイ中の複数の検出器に到着する前記音放射体からの音のオーディオ周波数成分を含む１つまたは複数のオーディオ周波数信号を受信させ、
前記選択された到着方向推定演算を実施して、オーディオ周波数成分を含む前記１つまたは複数の信号に基づいて、前記検出器アレイに相対した前記音放射体からの音の到着方向推定値を算出させる、媒体。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項４８に記載の媒体。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームのチャネルの間の利得の差に基づいて前記推定値を算出することを含む、請求項４８に記載の媒体。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分から発生したビームの間の利得の差に基づいて前記推定値を算出することを含む、請求項４８に記載の媒体。
前記複数の到着方向推定演算のうち少なくとも１つが、前記オーディオ周波数成分のチャネルの間の位相の差に基づいて前記推定値を算出することを含む、請求項４８に記載の媒体。
複数の到着方向推定演算のうち１つを前記選択することが、
前記推定された第１のレンジを閾値と比較することと、
前記推定された第１のレンジが前記閾値未満の場合、前記複数の到着方向推定演算のうち第１の到着方向推定演算を選択することと、
前記推定された第１のレンジが前記閾値より大きい場合、前記複数の到着方向推定演算のうち第２の到着方向推定演算を選択することと
を備える、請求項４８に記載の媒体。