JP2013535915A

JP2013535915A - 多重マイク位置選択性処理用のシステム、方法、装置、およびコンピュータ可読媒体

Info

Publication number: JP2013535915A
Application number: JP2013521915A
Authority: JP
Inventors: ビッサー、エリック; リウ、イアン・アーナン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2010-07-26
Filing date: 2011-07-26
Publication date: 2013-09-12
Also published as: EP2599329B1; KR101470262B1; CN103026733A; US9025782B2; WO2012018641A3; EP2599329A2; WO2012018641A2; KR20130055650A; US20120020485A1; CN103026733B

Abstract

使用者の頭部の正中矢状面の両側にある複数対のマイクとの関連で到来方向により音源位置が示されオーディオ信号の位置選択性処理を行う多重マイクシステム。
【選択図】図３２

Description

優先権の主張

［米国特許法第１１９条に基づく優先権の主張］
本願は、２０１０年７月２６日に出願された「多重マイク位置選択性処理用のシステム、方法、装置、およびコンピュータ可読媒体」と言う名称の米国仮特許出願通し番号第６１／３６７，７３０号の利益を主張する。この仮出願は、この言及により全体的にここに含まれる。

この開示は信号の処理に関する。

オフィスや家庭の静かな環境で以前に行われていた多くの活動が今日では車や通りやカフェのように音響が様々に変わる状況の下で行われている。例えば、音声通信チャネル（voice communication channel）を用いて誰かと話をしたい場合がある。そのようなチャネルは、例えば、移動無線ハンドセットやヘッドセット、携帯用無線電話機、送受信兼用の無線機、カーキット、その他の通信装置により供給される。したがって、周囲に人がいる環境の下で、すなわち、人が集まると決まって生じる種類のノイズ内容の存在する環境の下で携帯用音声感知装置（portable audio sensing devices）（例えば、スマートフォン、ハンドセット、ヘッドセット）を用いて音声通信のかなりの量が行われている。そのようなノイズは、通話の遠端（far end）の使用者を混乱させたり悩ませたりしがちである。さらに、多くの標準的な自動商取引（例えば、会計残高や株式相場の検査）ではデータの問い合わせに基づく音声認識が採用されていて、これらのシステムの正確性は干渉ノイズにより甚だしい妨害を受ける可能性がある。

騒がしい環境の下で通信が行われる用途では所期の音声信号（speech signal）を背景ノイズ（background noise）から分離することが恐らく望ましい。ノイズは、初期の信号と干渉しているか別の方法で初期の信号を劣化させているかのいずれかの全ての信号の組み合わせとしてこれを定義することができる。背景ノイズには、所期の信号や他の任意の信号により生じる反射や余波はもちろんのこと背後で進行している他人同士の会話のような音響環境内で生じる多数のノイズ信号が含まれる。所期の音声信号が背景ノイズから分離されない限り所期の信号の確かで効率的な使用は恐らく難しい。ある特定の例では騒がしい環境の下で音声信号が生成され、この音声信号を環境ノイズから分離するために様々な音声処理方法が用いられる。

移動中に遭遇するノイズには、周囲の話し声や、音楽や、がやがや音や、町の喧噪や、空港の騒音のように種々様々な異なる成分が恐らく含まれている。そのようなノイズの識別特性は一般に変動することであり、使用者自身の周波数識別特性に近いので、従来のように一本のマイクすなわち据え付けのビームフォーミングを用いる類いの方法でノイズの模擬実験をすることは難しい。単一マイクによるノイズ低減技術で最適な性能を達成するには一般に大幅なパラメータ調整が必要である。例えば、そのような場合に適切なノイズ基準を直接入手することは恐らくできないので、ノイズ基準を間接的に導き出さなければならない。したがって、騒がしい環境下で移動装置を用いた音声通信をサポートするために多重マイクに基づく先進的な信号処理が望まれる。

一般的な構成によるオーディオ信号処理（audio signal processing）の方法には、第一の対のマイクにより受信された第一の音成分の到来方向の第一の表示を第一の対のマイクとの関連で計算することと、第二の対のマイクにより受信された第二の音成分の到来方向の第二の表示を第二の対のマイクとの関連で計算することとが含まれる。

この方法には、第一および第二の両方向表示に基づいてオーディオ信号の利得を制御して出力信号を生成することも含まれる。この方法では、第一の対のマイクは使用者の頭部の正中矢状面（midsagittal plane）の第一の側に位置していて、第二の対のマイクは第一の側とは反対側の正中矢状面の第二の側に位置している。第一の対は第二の対から少なくとも１０ｃｍ離れている。有体的な特徴を有していて、その特徴を読み取る機械に前記のような方法を実行させるコンピュータ可読記憶媒体（例えば、一時的でない媒体）も開示されている。

一般的な構成によるオーディオ信号処理装置は、第一の対のマイクにより受信された第一の音成分の到来方向の第一の表示を第一の対のマイクとの関連で計算する手段と、第二の対のマイクにより受信された第二の音成分の到来方向の第二の表示を第二の対のマイクとの関連で計算する手段とを備えている。この装置は、第一および第二の両方向表示に基づいてオーディオ信号の利得を制御する手段も備えている。この装置では、第一の対のマイクは使用者の頭部の正中矢状面の第一の側に位置していて、第二の対のマイクは第一の側とは反対側の正中矢状面の第二の側に位置している。第一の対は第二の対から少なくとも１０ｃｍ離れている。

一般的な構成によるオーディオ信号処理装置は、装置の使用中に使用者の頭部の正中矢状面の第一の側に位置するように構成されている第一の対のマイクと、装置の使用中に第一の側とは反対側の正中矢状面の第二の側に位置するように構成されている第二の対のマイクとを備えている。この装置では第一の対は、装置の使用中に第二の対から少なくとも１０ｃｍ離れるように構成されている。この装置は、第一の対のマイクにより受信された第一の音成分の到来方向の第一の表示を第一の対のマイクとの関連で計算する第一の方向表示計算機と、第二の対のマイクにより受信された第二の音成分の到来方向の第二の表示を第二の対のマイクとの関連で計算する第二の方向表示計算機とを備えてもいる。この装置は、第一および第二の両方向表示に基づいてオーディオ信号の利得を制御するように構成されている利得制御モジュールも備えている。

音声通信用のヘッドセットＤ１００の典型的な使用例の上面図である。音声通信用のヘッドセットＤ１００の典型的な使用例の上面図である。一般的な構成によるシステムＳ１００のブロック図である。システムＳ１００の使用中におけるマイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０の相対的な配置の例を示す図である。耳当て（earcup）ＥＣＲ１０の水平断面を示す図である。耳当てＥＣＲ２０の水平断面を示す図である。耳当てＥＣＲ１０の実施態様ＥＣＲ１２の水平断面を示す図である。システムＳ１００を一対のヘッドフォンとして具体化した典型的な使用例の上面図および正面図である。システムＳ１００を一対のヘッドフォンとして具体化した典型的な使用例の上面図および正面図である。使用者の頭部の前頭面（coronal plane）において使用者の頭部の正中矢状面に垂直な線に対する様々な角度範囲の例を示す図である。使用者の頭部の正中矢状面および前頭面に垂直な横断面において使用者の頭部の正中矢状面に垂直な線に対する様々な角度範囲の例を示す図である。マイクの対ＭＬ１０、ＭＬ２０およびＭＲ１０、ＭＲ２０の配置例を示す図である。マイクの対ＭＬ１０、ＭＬ２０およびＭＲ１０、ＭＲ２０の配置例を示す図である。アレイＲ１００Ｒの実施態様Ｒ２００Ｒのブロック図である。アレイＲ２００Ｒの実施態様Ｒ２１０Ｒのブロック図である。装置Ａ１００の実施態様Ａ１１０のブロック図である。装置Ａ１００の実施態様Ａ１２０のブロック図である。方向計算機ＤＣ１０Ｒが音源（source）の到来方向（ＤＯＡ：direction of arrival）をマイクの対ＭＲ１０およびＭＲ２０との関連で表示する例を示す図である。方向計算機ＤＣ１０Ｒが音源（source）の到来方向（ＤＯＡ：direction of arrival）をマイクの対ＭＲ１０およびＭＲ２０との関連で表示する例を示す図である。非対称型アレイのビームパターンの例を示す図である。方向表示計算機ＤＣ１０Ｒの実施態様ＤＣ２０Ｒの一例を示すブロック図である。方向表示計算機ＤＣ１０Ｒの実施態様ＤＣ３０Ｒのブロック図である。ビームフォーマ（beamformer）のビームパターンの例を示す図である。ビームフォーマのビームパターンの例を示す図である。ＤＯＡ推定のバックプロジェクション法（back-projection methods）の例を示す図である。計算機ＤＣ１２Ｒの実施態様のセクタに基づく用途の上面図である。計算機ＤＣ１２Ｒの実施態様のセクタに基づく用途の上面図である。それぞれが指向性マスキング関数（directional masking functions）の例を示す図である。それぞれが指向性マスキング関数（directional masking functions）の例を示す図である。それぞれが指向性マスキング関数（directional masking functions）の例を示す図である。それぞれが指向性マスキング関数（directional masking functions）の例を示す図である。二種類の異なるセットの三方向マスキング関数の例を示す図である。図１７に示した三方向マスキング関数のセットを同じマルチチャンネルのオーディオ信号に適用した結果を大きさ対時間のプロットにより示す図である。マイクの対ＭＲ１０、ＭＲ２０の典型的な使用例を示す図である。ノイズ低減モード（noise reduction mode）でシステムが作動する原理を説明する上面図である。ノイズ低減モード（noise reduction mode）でシステムが作動する原理を説明する上面図である。ノイズ低減モード（noise reduction mode）でシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。ノイズ低減モードでシステムが作動する原理を説明する上面図である。装置Ａ１２０の実施態様Ａ１３０のブロック図である。マイクＭＣ１０の配置に関する追加例を示す図である。マイクＭＣ１０の配置に関する追加例を示す図である。シミュレータに取り付けたシステムＳ１００の実施態様の正面図である。シミュレータの左側の面から見たマイクの配置および向きの例を示す図である。シミュレータの左側の面から見たマイクの配置および向きの例を示す図である。マイクＭＣ１０の配置に関する追加例を示す図である。マイクＭＣ１０の配置に関する追加例を示す図である。マイクＭＣ１０の配置に関する追加例を示す図である。装置Ａ１１０の実施態様Ａ１４０のブロック図である。装置Ａ１１０の実施態様Ａ２１０のブロック図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。補聴器モードでシステムが作動する原理を説明する上面図である。テスト用の配置例を示す図である。補聴器モードにおけるそのようなテストの結果を示す図である。装置Ａ２１０の実施態様Ａ２２０のブロック図である。装置Ａ１１０およびＡ２１０の実施態様Ａ３００のブロック図である。一般的な構成による方法Ｎ１００のフローチャートである。一般的な構成による方法Ｎ２００のフローチャートである。一般的な構成による方法Ｎ３００のフローチャートである。一般的な構成による方法Ｎ１００のフローチャートである。一般的な構成による装置ＭＦ１００のブロック図である。システムＳ１００の実施態様を備えている通信装置Ｄ１０のブロック図である。

携帯感知装置が感知する音響信号（acoustic signal）には異なる音源（例えば、使用者の口などの所望の音源や一つ以上の妨害源）から受ける成分が含まれている。受けた信号の成分を時間および周波数の両者または一方で分離することが望ましい。例えば、拡散背景ノイズ（diffuse background noise）や他の指向性のある音（other directional sounds）から使用者の声を区別することが望ましい。

図１および図２は、二本のマイクＭＣ１０およびＭＣ２０から成るアレイを備えていて使用者の耳に装着される音声通信用ヘッドセットＤ１００（例えば、ブルートゥース（登録商標）ヘッドセット）に使用した典型的な例の上面図である。一般にそのようなアレイは、到来方向の異なる信号成分間の識別に対応するために用いられる。しかし到来方向の表示（indication）は、遠く離れていても同じ方向から到来する妨害音を識別するには不十分である。その代わりにまたはその上に、装置と音源（例えば、使用者の口のような所望の音源や周囲の話者のような妨害音源）との距離にしたがって信号成分を識別できることが望ましい。

残念ながら携帯オーディオ感知装置は、一般に容積が余りにも小さいので有効な音響範囲をサポートするのに十分な広さのマイク用空間を確保することができない。さらに、マイクアレイから範囲情報を取得する方法は、一般にマイク間の利得差を測定することに依存している。そして、信頼できる利得差の測定値を得るにはマイク相互の利得応答を較正して維持する必要がある。

四本のマイクを使用したヘッドセットベースの距離範囲選択性音像システム（four-microphone headset-based range-selective acoustic imaging system）を説明する。提案するシステムは、二つの横形取り付けマイクアレイ（例えば、対）（two broadside-mounted microphone arrays (e.g., pairs)）を備えていて、それぞれのアレイから得られる方向に関する情報を用いて到来方向と距離範囲とにより限定される使用者の口の周りの領域を確定する。位相差を用いて到来方向を示す場合には、マイクの利得を相互に較正する必要もなく距離範囲にしたがって信号成分を分離するようにそのようなシステムを構成することができる。そのようなシステムの用途の例には、背景ノイズから使用者の音声を抽出することや使用者の前、後ろ、両側に異なる空間領域を想像させることが含まれる。

文脈により明確に限定されているのでない限り用語「信号（signal）」は電線やバス、その他の送信媒体の上で表現されるようなある記憶場所（memory location）（または一組の記憶場所）の状態を含む通常の意味のいずれをも示すようにここでは用いられている。文脈により明確に限定されているのでない限り用語「生成（generating）」は、計算その他による算出のような通常の意味のいずれをも示すようにここでは用いられている。文脈により明確に限定されているのでない限り用語「計算（calculating）」は算出、評価、平滑化、複数の値からの選択のような通常の意味のいずれをも示すようにここでは用いられている。文脈により明確に限定されているのでない限り用語「取得（obtaining）」は計算、導出、（例えば、外部装置からの）受信、（例えば、記憶素子アレイからの）検索のような通常の意味のいずれをも示すように用いられている。文脈により明確に限定されているのでない限り用語「選択（selecting）」は、二つ以上から成る集合の全てよりも少なくて、しかも少なくとも一つを識別したり、表示したり、適用したり、使用したりする通常の意味のいずれをも示すように用いられている。用語「を含む（comprising）」が発明の詳細な説明や特許請求の範囲に用いられている場合には他の要素や操作が排除されることはない。表現「に基づく（based on）」は、（例えば、「ＡはＢに基づいている」の場合）には（ｉ）「…から導き出される」（例えば、「ＢはＡの前駆物質である」）、(ii)「少なくとも…に基づく」（例えば、「Ａは、少なくともＢに基づいている」）、さらに、文脈に応じて適切であれば、(iii)「…に等しい」（例えば、「ＡはＢに等しい」）を含む通常の意味のいずれをも示すように用いられている。同様に、表現「…に応じて（in response to）」は、「少なくとも…に応じて（in response to at least）」を含む通常の意味のいずれをも示すように用いられている。

多重マイクオーディオ感知装置のマイクの「位置（location）」に関する言及は文脈により他のことが示されていない限りマイクの音響感知面（acoustically sensitive face）の中心位置を示している。用語「チャネル（channel）」は、特定の文脈に応じて信号経路を示すために用いられている場合もあれば、そのような経路により搬送される信号を示すために用いられている場合もある。特に断りのない限り用語「一続き（series）」は二つ以上の項目の連続を示すために用いられている。用語「対数（logarithm）」は、１０を底とする対数を示すために用いられているが、別の様々な底に拡張する演算もこの開示の範囲に含まれている。表現「周波数成分（frequency component）」は、（例えば、高速フーリエ変換により生成される）信号の周波数領域の表示または信号のサブバンド（例えば、バーク尺度（Bark scale）またはメル尺度（mel scale）のサブバンド）のサンプルのように、ある信号の周波数または周波数帯の集合の中の一つを示すために用いられている。

別の指示がない限り、特定の特徴を有している装置の作動に関するどのような開示も類似した特徴を有している方法を開示することが明確に意図されている（逆もまた同様である）。さらに、特定の構成の装置の作動に関するどのような開示も類似した構成の方法を開示することが明確に意図されている（逆もまた同様である）。用語「構成（configuration）」は、特定の文脈により示されるように方法、装置、システムに関して用いられる。用語「方法（method）」、「プロセス（process）」、「手順（procedure）」は特定の文脈により特に示されていない限り包括的および互換的に用いられている。用語「機器（apparatus）」および「装置（device）」は特定の文脈により特に示されていない限り包括的および互換的に用いられている。用語「要素（element）」および「モジュール（module）」は、より大きな構成の一部分を示すために一般的に用いられている。文脈により明確に限定されているのでない限り用語「システム（system）」は「共通の目的にかなうように相互に作用する要素群」を含めて、通常の意味のいずれをも示すようにここでは用いられている。他の文書の一部を参照によりこの開示に組み込むことには、組み込んだ当該部分で参照されている用語や変数に関する定義が文書の別の場所に記載されている場合には、それらの定義も組み込まれるだけでなく、組み込んだ部分で参照されている図面も組み込まれるものと理解されたい。

用語「コーダ（coder）」、「コーデック（codec）」、「コーディングシステム（coding system）」は、（知覚の重み付けおよび他のフィルタリング処理またはそのどちらかのような一種類以上の前処理の恐らく後で）オーディオ信号のフレームを受信して符号化をするように構成されているエンコーダを少なくとも一台とフレームの復号化された表現を生成するように構成されている対応するデコーダとを備えたシステムを示すために互換的に用いられている。そのようなエンコーダとデコーダは通信リンクの反対側の端に一般に配置されている。全二重通信（full-duplex communication）をサポートするためにエンコーダとデコーダの両者を通信リンクのそれぞれの端に共に配置する例が一般的である。

ここでの説明では表現「感知されたオーディオ信号（sensed audio signal）」は一本以上のマイクによって受ける信号を意味し、表現「再生されたオーディオ信号（reproduced audio signal）」は記憶装置から引き出されたり別の装置との有線や無線による接続を介して受信されたりする情報から再生される信号を意味する。通信や再生の装置のようなオーディオ再生装置は再生したオーディオ信号を装置が備えている一台以上のスピーカに出力するように構成されている。あるいはそのような装置は、再生されたオーディオ信号をイヤホンや他のヘッドセット、あるいは、外部の装置に取り付けられている外部スピーカに有線や無線で出力するように構成されている。電話技術などの音声通信用トランシーバへの応用に関しては、感知されたオーディオ信号はトランシーバにより送信される近端信号（near-end signal）であり、再生されたオーディオ信号は（例えば、無線通信リンクを介して）トランシーバにより受信される遠端信号（far-end signal）である。記録されている音楽やビデオや講演（例えば、ＭＰ３で符号化されている音楽ファイル、映画、ビデオクリップ、オーディオブック（audiobooks）、ポッドキャスト（podcasts））の再生やそのようなコンテンツのストリーミングのような移動オーディオ再生への応用（mobile audio reproduction applications）に関しては、再生されたオーディオ信号は再生されたりストリーミングされたりするオーディオ信号である。

図３Ａは、マイクアレイの左側の例Ｒ１００Ｌと右側の例Ｒ１００Ｒとを備えている一般的な構成のシステムＳ１００のブロック図である。システムＳ１００は、左側のマイクアレイＲ１００Ｌにより生成されるマルチチャンネル信号ＳＬ１０、ＳＬ２０からの情報および右側のマイクアレイＲ１００Ｒにより生成されるマルチチャンネル信号ＳＲ１０、ＳＲ２０からの情報に基づいて入力オーディオ信号ＳＩ１０を処理してオーディオ信号ＳＯ１０を生成するように構成されている装置Ａ１００も備えている。

システムＳ１００は、電線またはその他の伝導性経路を介して装置Ａ１００がマイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０のそれぞれに結合されるように構成される。あるいはシステムＳ１００は、マイクの一方の対（例えば、同じ耳当て内に位置している一対のマイク）には伝導的に結合され、マイクの他方の対には無線で結合されるように構成される。あるいはシステムＳ１００は、装置Ａ１００がマイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０に無線で結合されるように構成される（例えば、装置Ａ１００がハンドセットやスマートフォンやラップトップまたはタブレット型のコンピュータのような携帯オーディオ感知装置内に実装される）。

マイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０の各々は全方向性、双方向性、単方向性（例えば、カルジオイド）のいずれかの応答を有している。マイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０のそれぞれに使用することのできる様々な種類のマイクには圧電マイク、ダイナミックマイク、エレクトレットマイクが（限定ではなく）含まれる。

図３Ｂには、システムＳ１００に使用する際のマイクの相対的な配置の例が示されている。この例では、左側のマイクアレイのマイクＭＬ１０、ＭＬ２０は使用者の頭部の左側に位置していて、右側のマイクアレイのマイクＭＲ１０、ＭＲ２０は使用者の頭部の右側に位置している。図３Ｂに示されているように使用者の前方方向に対して軸が側方方向になるようにマイクアレイを向けることが望ましい。もっとも個々のマイクアレイは使用者のそれぞれの耳に一般に装着されるのであるが、各アレイの一個以上のマイクを使用者の肩のように異なる位置に装着することも可能である。例えば、各マイクアレイを使用者のそれぞれの肩に装着するように構成しても良い。

各マイクアレイのマイク相互の間隔（例えば、ＭＬ１０とＭＬ２０との間、ＭＲ１０とＭＲ２０との間）は約２センチから約４センチ（さらには５もしくは６センチまで）の範囲内であることが望ましい。装置の使用中における左右のマイクアレイ間の間隔は両耳間距離（すなわち、使用者の耳孔の開口部相互を結ぶ直線に沿った同開口部相互間の空間距離）に少なくとも等しいことが望まれる。例えば、各アレイの内側のマイク同士の間隔（例えば、マイクＭＬ１０とＭＲ１０との間の距離）は１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２センチのいずれか以上であることが望ましい。そのようなマイクの配置は到来方向の所望の範囲に亘ってノイズ削減性能の満足な水準を提供する。

システムＳ１００は、使用者の頭部に宛がわれる帯状部材で結ばれている一対の耳当てのような一対のヘッドフォンを含むように構成される。図４Ａには、（媒体の再生やストリーミングをする装置から無線や有線で受信した信号から）使用者の耳に音響信号を生成するために配置されているスピーカＬＳＲ１０とマイクＭＲ１０、ＭＲ２０とを備えている耳当ての右側の例ＥＣＲ１０の水平断面が示されている。スピーカが発する機械的な振動を耳当ての構造によりマイクが拾わないようにすることが望ましい。耳当てＥＣＲ１０は、耳の上か耳の周囲に位置するように（すなわち、使用中に耳をすっぽりと覆い隠すのではなくて耳の上に載せたり耳の周りを取り囲んだりするように）構成されている。耳当てＥＣＲ１０の別の実施態様では使用者の頭部から離隔する方向に耳当てから延びている支柱などの突起に外側のマイクＭＲ２０が取り付けられている。

システムＳ１００は、使用者の両耳のそれぞれ用にそのような耳当ての例を備えるように構成されている。例えば、図５Ａおよび図５Ｂは、耳当てＥＣＲ１０の左側の例ＥＣＬ１０や帯ＢＤ１０をも有している一対のヘッドフォンとして具体化したシステムＳ１００の典型的な使用例の平面図および正面図である。図４Ｂは、マイクＭＲ１０、ＭＲ２０が耳当て筐体の湾曲部に沿って配置されている耳当てＥＣＲ２０の水平断面を示す図である。この特定の例では、（図５Ａおよび図５Ｂに示されているように）使用者の頭部の正中矢状面から離れるように僅かに異なる方向を向いてマイクが配置されている。耳当てＥＣＲ２０は、（例えば、図４Ａのように）マイクの一方（例えば、ＭＲ１０）または両方が使用中に使用者の頭部の正中矢状面に平行な方向を向くように構成されていても良いし、両マイクが使用中に同じ僅かな角度（例えば、４５度以下）で正中矢状面に向いていたり正中矢状面から逸れていたりするように構成されていても良い。（ここに記載する様々な右側の耳当てと同じように左側も構成されていることを理解されたい。）
図４Ｃは、環境音を拾うように企図されている第３のマイクＭＲ３０を有している耳当てＥＣＲ１０の実施態様ＥＣＲ１２の水平断面を示す図である。アレイＲ１００ＬおよびＲ１００Ｒの一方または両方に二本より多い数のマイクを取り付けることもできる。

マイクの対ＭＬ１０、ＭＬ２０の軸（すなわち、対を成している個々のマイクの感知面の中心を通る線）はシステムの使用中は使用者の頭部の正中矢状面にほぼ垂直であることが望ましい。同様に、一対のマイクＭＲ１０、ＭＲ２０の軸もシステムの使用中は使用者の頭部の正中矢状面にほぼ垂直であることが望ましい。一対のマイクＭＬ１０、ＭＬ２０の軸および一対のマイクＭＲ１０、ＭＲ２０の軸のそれぞれが使用者の正中矢状面に垂直であることからの使用中における逸脱が、例えば、１５度、２０度、２５度、３０度、４５度のいずれか未満であるようにシステムＳ１００を構成することが望ましい。図６Ａは、使用者の頭部の前額面（coronal plane）におけるそのような範囲の様々な例を示す。図６Ｂは、正中矢状面および前額面に垂直な横断面における同じ範囲の例を示す。

そのような許容角度範囲のプラスマイナスの境界は同じである必要のないことに注意すること。例えば、一対のマイクＭＬ１０、ＭＬ２０の軸と一対のマイクＭＲ１０、ＭＲ２０の軸のそれぞれが使用者の頭部の前額面においてシステムの使用中に使用者の頭部の正中矢状面に垂直である状態から＋１５度以下および−３０度以下であるようにシステムＳ１００を構成しても良い。あるいは、一対のマイクＭＬ１０、ＭＬ２０の軸と一対のマイクＭＲ１０、ＭＲ２０の軸のそれぞれが使用者の頭部の前額面においてシステムの使用中に使用者の頭部の正中矢状面に垂直である状態から＋３０度以下および−１５度以下であるようにシステムＳ１００を構成しても良い。

図７Ａは、一対のマイクＭＲ１０、ＭＲ２０を耳当てＥＣＲ１０に配置する例（どの配置例も点線の楕円で示されている）および一対のマイクＭＬ１０、ＭＬ２０を耳当てＥＣＬ１０に配置する対応例を示す図である。マイクの両対は、使用中には上に示した空間や直交性の制約のいずれかにしたがって使用者の体の別の部分にそれぞれを装着しても良い。図７Ａは、一対のマイクＭ１０、ＭＲ２０のそのような代替的な配置の二種類の例（すなわち、使用者の肩と使用者の胸の上部に配置した例）および一対のマイクＭＬ１０、ＭＬ２０の配置に関する対応する例を示す図である。このような場合にはどちらのマイクの対も（例えば、ベルクロ（登録商標）または類似の取り外し可能な留め具を用いて）使用者の衣服に固定される。図７Ｂは、使用者の頭部の前額面において使用者の頭部の正中矢状面に垂直な状態からどの対の軸も僅かに負の傾斜を有している図７Ａに示した配置の例を示す図である。

上に述べた空間や直交性の制約のいずれかにしたがってマイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０が取り付けられているシステムＳ１００の別の実施態様にはヘルメットのような湾曲した配置が含まれる。例えば、内側のマイクＭＬ１０、ＭＲ１０をそのようなヘルメットのまびさしに取り付けることができる。

ここに述べた多重マイクオーディオ感知装置の作動中はマイクアレイＲ１００のどの例もマルチチャンネル信号を生成するが、このマルチチャンネル信号はどのチャンネルも対応する１つのマイクの音響環境に対する応答に基づいている。あるマイクは他のマイクよりも特定の音を直接的に拾うかも知れないので対応するチャンネルは相互に異なるから一本のマイクで集音した場合に比べて音響環境のより完全な表現を全体的に供給することができる。

マイクが生成した信号にアレイが一種類以上の処理操作を施して対応するマルチチャンネル信号を生成することが望ましい。例えば図８Ａには、どのチャンネルも対応するマイクの音響信号に対する応答に基づいているマルチチャンネル信号を生成するためのアナログやデジタルの両方または一方の領域におけるインピーダンス整合、アナログデジタル変換、利得制御、フィルタリングが（限定ではなく）含まれる可能性のある一種類以上のそのような操作をするように構成されているオーディオ前処理段ＡＰ１０を含むアレイＲ１００Ｒの実施態様Ｒ２００Ｒのブロック図が示されている。アレイＲ１００Ｌも同様に構成されている。

図８Ｂは、アレイＲ２００Ｒの実施態様Ｒ２１０Ｒのブロック図である。アレイＲ２１０Ｒには、アナログ前処理段Ｐ１０ａやＰ１０ｂを含むオーディオ前処理段ＡＰ１０の実施態様ＡＰ２０が含まれている。ある例では、段Ｐ１０ａおよびＰ１０ｂはそれぞれが対応するマイク信号に高域フィルタ処理操作を（例えば、５０Ｈｚまたは１００Ｈｚまたは２００Ｈｚの遮断周波数（cutoff frequency）で）施すように構成されている。アレイＲ１００Ｌも同様に構成されている。

アレイＲ１００ＬおよびＲ１００Ｒのそれぞれが対応するマルチチャンネル信号をデジタル信号として、すなわち、一連のサンプルとして生成することが望ましい。例えば、アレイＲ２１０Ｒは、アナログデジタル変換器（ＡＤＣｓ）Ｃ１０ａおよびＣ１０ｂを備えている。どちらも対応するアナログチャンネルをサンプリングするために配置されている。音響用途の典型的なサンプリングレートには８ｋＨｚ、１２ｋＨｚ、１６ｋＨｚが含まれる他に、約８ｋＨｚ〜約１６ｋＨｚの範囲の他の周波数が含まれる。もっとも４４．１ｋＨｚまたは４８ｋＨｚまたは１９２ｋＨｚのいずれかと同じくらい高いサンプリングレートも使用される。この特定の例ではアレイＲ２１０Ｒは、対応するデジタル化されたチャンネルに一種類以上の操作（例えば、エコー消去、ノイズ低減、スペクトル整形の少なくとも一つ）を施してマルチチャンネル信号ＭＣＳ１０Ｒの対応するチャンネルＳＲ１０、ＳＲ２０を生成するようにそれぞれが構成されているデジタル前処理段Ｐ２０ａおよびＰ２０ｂをも備えている。アレイＲ１００Ｌも同様に構成されている。

図９Ａは、方向表示計算機（direction indication calculator）の実例ＤＣ１０ＬおよびＤＣ１０Ｒを備えた装置Ａ１００の実施態様Ａ１１０のブロック図である。計算機ＤＣ１０Ｌは、左側のマイクアレイＲ１００Ｌにより生成される（左のチャンネルＳＬ１０およびＳＬ２０を含む）マルチチャンネル信号のために方向表示ＤＩ１０Ｌを計算する。計算機ＤＣ１０Ｒは、右側のマイクアレイＲ１００Ｒにより生成される（右のチャンネルＳＲ１０およびＳＲ２０を含む）マルチチャンネル信号のために方向表示ＤＩ１０Ｒを計算する。

方向表示（direction indication）ＤＩ１０ＬおよびＤＩ１０Ｒはそれぞれが対応するマルチチャンネル信号の音成分の到来方向（ＤＯＡ：direction of arrival）を対応するアレイとの関連で示す。計算機ＤＣ１０ＬおよびＤＣ１０Ｒの特定の実施に応じて方向指示器は内側のマイクの位置との関連、外側のマイクの位置との関連、これらの位置の間にある対応するアレイ軸上の別の基準点（例えば、マイクの両位置間の中心点）との関連でＤＯＡを表示する。方向表示の例には、利得差または比、到来時間差、位相差、位相差と周波数との比が含まれる。装置Ａ１１０は、方向表示ＤＩ１０ＬおよびＤＩ１０Ｒの値にしたがって入力オーディオ信号ＳＩ１０の利得を制御するように構成されている利得制御モジュールＧＣ１０も備えている。

方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒは対応するマルチチャンネル信号を一連のセグメントとして処理するようにそれぞれが構成されている。例えば、方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒは、対応するマルチチャンネル信号の一連のセグメントの一つ一つの方向表示（direction indicator）を計算するようにそれぞれが構成されている。典型的なセグメント長は、約５または１０ミリ秒から約４０または５０ミリ秒に及んでいて、セグメントは互いに部分的に重複（例えば、隣のセグメントと２５％または５０％だけ重複）していることもあれば重複していないこともある。ある特定の例ではマルチチャンネル信号が分割されて１０ミリ秒の長さの重複していないセグメントまたは「フレーム」の連続になる。別の特定の例では、どのフレームも長さは２０ミリ秒である。ＤＯＡ推定操作により処理されるセグメントは、別のオーディオ処理操作により処理されるもっと大きなセグメントのセグメント（すなわち、「サブフレーム」）であることもあれば、その逆であることもある。

計算機ＤＣ１０ＬおよびＤＣ１０Ｒは、幾つかの異なるＤＯＡ推定技術のいずれか一つ以上を実行して方向表示を生成するように構成されている。類似した空間解像度でＤＯＡの推定源を生成することが期待されているＤＯＡ推定技術には利得差に基づく方法や位相差に基づく方法がある。相互相関に基づく方法（例えば、マルチチャンネル信号のチャンネル間の遅れを計算して、この遅れを到来の時間差として用いてＤＯＡを決定すること）も場合によっては有効である。

ここに説明するように方向計算機ＤＸ１０ＬおよびＤＣ１０Ｒは、時間領域または周波数領域のいずれか（例えば、ＦＦＴ、ＤＣＴ、ＭＤＣＴのいずれかの領域のような変換領域）で対応するマルチチャンネル信号にＤＯＡ推定を施すようにこれらを具体化することができる。図９Ｂは、装置Ａ１１０の実施態様Ａ１２０のブロック図であり、この実施態様には変換モジュールの四つの例ＸＭ１０Ｌ、ＸＭ２０Ｌ、ＸＭ１０Ｒ、ＸＭ２０Ｒが含まれている。変換モジュールのどの例も高速フーリエ変換（ＦＦＴ）や変形離散コサイン変換（ＭＤＣＴ）のような対応するチャンネルの周波数変換を計算するように構成されている。装置Ａ１２０は、方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒの実施態様ＤＣ１２ＬおよびＤＣ１２Ｒも備えている。どちらの実施態様も対応するチャンネルの受信および操作を変換領域で行うように構成されている。

利得差に基づく方法では、マルチチャンネル信号のチャンネルに基づく信号の利得相互の差に基づいてＤＯＡが推定される。例えば、計算機ＤＣ１０ＬおよびＤＣ１０Ｒのそのような実施態様は、マルチチャンネル信号の異なるチャンネルの利得相互の差（例えば、大きさやエネルギの差）に基づいてＤＯＡを推定するように構成される。マルチチャンネル信号のセグメントの利得の値は時間領域または周波数領域（例えば、ＦＦＴ、ＤＣＴ、ＭＤＣＴのいずれかの領域のような変換領域）で計算される。そのような利得値の例には、総絶対値（例えば、サンプル値の絶対値の合計）、平均の絶対値（例えばサンプル当たりの）、ＲＭＳの絶対値、メジアンの絶対値、ピークの絶対値、ピークエネルギ、総エネルギ（例えば、サンプル値の平方和）、平均エネルギ（例えば、サンプル当たりの）が限定ではなく含まれる。利得差技術で正確な結果を得るためには二本のマイクのチャンネルの応答がお互いに較正されていることが望まれる。マルチチャンネル信号に低域フィルタを適用して利得値の計算をマルチチャンネル信号のオーディオ周波数成分に限定することが望ましい。

方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒは、対数領域（例えば、デシベルの値）のチャネル毎の対応する利得測定値間の差すなわち線形領域の利得測定値間の比として利得相互の差を計算するようにこれらを実現することができる。較正済みのマイクの対では、利得差ゼロを利用して音源（source）がそれぞれのマイクから等距離であることを示し、大きな正の値の利得差を利用して音源が一方のマイクに近いこと（すなわち、対の一方の縦方向（one endfire direction）に位置すること）を示し、大きな負の値の利得差を利用して音源が他方のマイクに近いこと（すなわち、対の他方の縦方向に位置すること）を示す。

図１０Ａは、セグメントｎの利得差ＧＤ［ｎ］と利得差閾値Ｔ_Ｌとの関係の状態にしたがって三つの空間セクタ（すなわち、縦形セクタ１、横形セクタ２、縦形セクタ３）の一つを選択することによって方向計算機ＤＣ１０Ｒがマイクの対ＭＲ１０およびＭＲ２０との関連で音源のＤＯＡを推定する例を示す。図１０Ｂは、利得差ＧＤ［ｎ］と第一の利得差閾値Ｔ_Ｌ１との関係の状態および利得差ＧＤ［ｎ］と第二の利得差閾値Ｔ_Ｌ２との関係の状態にしたがって五つの空間セクタの一つを選択することにより方向計算機ＤＣ１０Ｒが音源のＤＯＡをマイクの対ＭＲ１０およびＭＲ２０との関連で推定する例を示す。

別の例では、マルチチャンネル信号から（例えば、マルチチャンネル信号のオーディオ周波数成分から）生成されるビーム間の利得の差を基準にした利得差に基づく方法を用いて方向計算機ＤＣ１０ＬおよびＤＣ１０Ｒが音源のＤＯＡを推定するように構成されている。計算機ＤＣ１０ＬおよびＤＣ１０Ｒのそのような実施態様は一式の固定フィルタを用いて所望範囲の方向に亘る（例えば、１８０度を１０度刻み、３０度刻み、４５度刻みのいずれかにして）一式の対応するビームを生成するように構成される。ある例では、そのような手法がマルチチャンネル信号の固定フィルタの各々に適用されて、高出力エネルギを示すビームの向き（look direction）としてＤＯＡを（例えば、セグメント毎に）推定する。

図１１Ａは、マルチチャンネル信号Ｓ１０をフィルタリングして個々のビームＢ１０ａ、Ｂ１０ｂ、Ｂ１０ｎを生成する固定フィルタＢＦ１０ａ、ＢＦ１０ｂ、ＢＦ１０ｎが配置されている方向表示計算機ＤＣ１０Ｒの実施態様ＤＣ２０Ｒの例を示すブロック図である。計算機ＤＣ２０Ｒは、エネルギが最大のビームにしたがって方向表示ＤＩ１０Ｒを生成するように構成されている比較器ＣＭ１０も備えている。固定フィルタの生成に用いられるビームフォーミングアプローチの例には一般化側帯波消去（ＧＳＣ：generalized sidelobe cancellation）、最小分散無ひずみ応答（ＭＶＤＲ：minimum variance distortionless response）、線形条件付き最小分散（ＬＣＭＶ：linearly constrained minimum variance）の各ビームフォーマが含まれる。固定フィルタの生成に用いることができるビーム生成アプローチの別の例には独立成分解析（ＩＣＡ：independent component analysis）や独立ベクトル解析（ＩＶＡ：independent vector analysis）のようなブラインドソースセパレーション（ＢＳＳ：blind source separation）法があり、これらはナルビーム（null beams）を干渉点源（interfering point souces）に向けて操舵することにより作動する。

図１２および図１３には、三本のマイクから成るアレイ（点線）と四本のマイクから成るアレイ（実線）について１５００Ｈｚと２３００Ｈｚのそれぞれにおけるビームフォーマビームパターン（beamformer beam patterns）の例が示されている。両図において、上部左のプロットＡは向きが約６０度であるビームフォーマのパターンを示していて、下部中央のプロットＢは向きが約９０度であるビームフォーマのパターンを、上部右のプロットＣは向きが約１２０度であるビームフォーマのパターンをそれぞれ示している。線形に配列されている三本または四本のマイク（例えば、隣のマイクとの間隔は約３．５ｃｍ）によるビームフォーミングは約１０〜２０度の空間帯域幅識別（spatial bandwidth discrimination）を得るために用いることができる。図１０Ｃは、非対称型アレイのビームパターンの例を示す図である。

さらなる例では、マルチチャンネル出力を生成するためにマルチチャンネル信号から（例えば、上に述べたＢＳＳ法やビームフォーミングを用いて）生成されるビームのチャンネル間の利得の差を基準にした利得差に基づく方法を用いて方向計算機ＤＣ１０ＬおよびＤＣ１０Ｒが音源のＤＯＡを推定するように構成されている。例えば、特定の方向や音源（例えば、向き）から到来するエネルギを一本の出力チャンネルに集中させたり別の方向や音源から到来するエネルギを異なる出力チャンネルに集中させたりすることによってそのようなビームを生成するように固定フィルタを構成することができる。そのような場合には、出力チャンネル間でエネルギが最も異なるビームの向き（look direction）としてＤＯＡを推定するように利得差に基づく方法が実現される。

図１１Ｂは、方向表示計算機ＤＣ１０Ｒの実施態様ＤＣ３０Ｒのブロック図であり、マルチチャンネル信号Ｓ１０をフィルタリングして（例えば、個々の向きに対応している）信号チャンネルＢ２０ａｓ、Ｂ２０ｂｓ、Ｂ２０ｎｓおよびノイズチャンネルＢ２０ａｎ、Ｂ２０ｂｎ、Ｂ２０ｎｎを有している個々のビームを生成する固定フィルタＢＦ２０ａ、ＢＦ２０ｂ、ＢＦ２０ｎが設けられている。計算機ＤＣ３０Ｒには、信号対雑音比（ＳＮＲ：signal-to-noise ratio）をビーム毎に計算するように準備されている計算機ＣＬ２０ａ、ＣＬ２０ｂ、ＣＬ２０ｎやＳＮＲが最大のビームにしたがって方向表示ＤＩ１０Ｒを生成するように構成されている比較器ＣＭ２０も設けられている。

方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒは、ＢＳＳ純粋マトリックスＷ（BSS unmixing matrix W）を直に用いてＤＯＡ推定を取得するように具体化されてもいる。そのような技術には、分離されたソース信号の逆射影（back-projection）を用いて（例えば、音源マイクの対毎に）音源のＤＯＡを推定することが含まれる。すなわち、純粋なマトリックスＷの逆関数（例えば、ムーア−ペンローズの疑似逆関数）を使用して逆射影されたデータ（back-projected data）を基に単一音源のＤＯＡが推定される。そのようなＤＯＡ推定は一般にマイクの利得応答の較正誤りに強い。ＢＳＳ純粋マトリックスＷがｍ個のマイク信号Ｘ_１〜Ｘ_Ｍに適用され、逆射影される音源信号Ｙ_ｊがマトリックスＷの出力から選択される。ＧＣＣ−ＰＨＡＴまたはＳＲＰ−ＰＨＡＴのような技術を使用して、逆射影された信号から音源マイク毎にＤＯＡが計算される。音源の場所を突き止めるために最尤多重信号分類（ＭＵＳＩＣ：maximum likelihood and/or multiple signal classification）アルゴリズムが逆射影された信号に適用されることもある。上に述べた逆射影法が図１４に示されている。

あるいは、マルチチャンネル信号の異なるチャンネル相互の位相の差を基にした位相差に基づく方法を用いて音源のＤＯＡを推定するように方向計算機ＤＣ１０ＬおよびＤＣ１０Ｒを構成することもできる。そのような方法には、クロスパワースペクトル密度ベクトル（cross-power-spectral-density vector）の各要素をそれぞれの大きさで正規化することにより計算することのできるマルチチャンネル信号（例えば、マルチチャンネル信号のオーディオ周波数成分）のクロスパワースペクトルフェーズ（ＣＰＳＰ：cross-power-spectrum phase）に基づく技術が含まれる。そのような技術の例には、一般化された相互相関と位相変換（ＧＣＣ−ＰＨＡＴ：generalized cross-correlation with phase transform）および操舵応答電力相変換（ＳＲＰ−ＰＨＡＴ：steered response power-phase transform）が含まれているが、これらは到来時間の差（time difference of arrival）の形式で推定ＤＯＡを一般に生成する。方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒの位相差に基づく実施にはマイクの利得応答間の不整合（mismatches）に一般に強いという潜在的な利点がある。

位相差に基づく別の方法には、調べようとしている複数の周波数成分のそれぞれ毎に各チャンネルの位相を推定することが含まれる。一例では、方向表示計算機ＤＣ１２ＬおよびＤＣ１２Ｒが周波数成分の位相を周波数成分のＦＦＴ係数の虚数項対周波数成分のＦＦＴ係数の実数項の比の逆正接（アークタンジェントとも言う）と推定するように構成されている。主要なチャンネルの当該周波数成分の推定された位相を別の（例えば、副次的な）チャンネルの周波数成分の推定された位相から減算することによって、調べようとしている周波数成分毎に位相差Δψを計算するようにそのような計算機を構成することが望ましい。そのような場合には主要なチャンネルは、装置を普通に使用している際に使用者の声を最も直接的に受けるマイクに対応しているチャンネルのように信号対雑音比の最も高いことが予期されるチャンネルである。

ＤＯＡ推定法では信号の帯域幅全体に亘って位相差を考慮する必要はない。例えば、広帯域の範囲（例えば、０〜８０００Ｈｚ）に亘る多くの帯域では位相の推定は役に立たないか不必要であるかのどちらかである。非常に低い周波数では、受信した波形の位相関係を実際的に評価するには対応する大きな空間が変換器相互の間に必要である。したがって、マイク相互間で利用可能な最大空間により低い周波数帯が決まってしまう。一方、マイク相互の距離は空間エイリアシング（spatial aliasing）を避けるために最小波長の半分を超えてはならない。例えば、８ｋＨｚのサンプリングレートでは帯域幅は０〜４ｋＨｚになる。４ｋＨｚの信号の波長は約８．５ｃｍであるから、この場合には、隣接するマイク相互の間隔は約４ｃｍを超えてはならない。マイクのチャンネルは、空間エイリアシングを引き起こす可能性のある周波数を取り除くために低域フィルタに掛けられる。

音声信号の予期される周波数範囲のようにマルチチャンネル信号の制限されたオーディオ周波数範囲に亘ってＤＯＡ推定を行うことが望まれる。そのような一例では、使用者の声のエネルギの殆どを含んでいることが予期される７００Ｈｚ〜２０００Ｈｚの周波数範囲で位相差を計算するように方向表示計算機ＤＣ１２ＬおよびＤＣ１２Ｒが構成されている。帯域幅が４ｋＨｚの信号の１２８ポイントＦＦＴ（128-point FFT）では、７００〜２０００Ｈｚの範囲は１０番目のサンプルないし３２番目のサンプルから２３個の周波数サンプルに大まかに対応している。さらなる例ではそのような計算機は、約５０、１００、２００、３００、５００Ｈｚのいずれかのように低い範囲から約７００、１０００、１２００、１５００、２０００Ｈｚのいずれかのように高い範囲に及ぶ周波数範囲に亘って位相差を計算するように構成されている。（低い範囲と高い範囲の２５通りの組み合わせのそれぞれについて明確に説明し開示する。）
有声音（例えば、母音）のエネルギスペクトルは高さ周波数（pitch frequency）の倍音（harmonics）に局所的なピークを有する傾向にある。これに対して背景ノイズのエネルギスペクトルは比較的組織立っていない。したがって、高さ周波数の倍音における入力チャンネルの成分は他の成分よりも信号対雑音比（ＳＮＲ）の高いことが予期される。推定された高さ周波数の倍数に対応している位相差を利用するように方向表示計算機ＤＣ１２ＬおよびＤＣ１２Ｒを構成することが望ましい。例えば、算出された位相差の少なくとも２５％または５０％または７５％（できれば全て）が推定された高さ周波数の倍数に対応しているか、そのような成分に他よりも大幅に対応している重み付け方向表示器（weight direction indicators）に対応していることが望ましい。典型的な高さ周波数範囲は男性の約７０〜１００Ｈｚから女性の約１５０〜２００Ｈｚまでに亘り、高さ周波数の現在の推定は（例えば、高さの期間（pitch period）または「高さの遅れ（pitch lag）」の推定の形態で）発話の符号化や復号化を含む用途（例えば、符号励起線形予測（ＣＥＬＰ：code-excited linear prediction）や原型波形補間（ＰＷＩ：prototype waveform interpolation）のような高さの推定を含むコーデックを用いる音声通信）に一般に既に利用可能である。所望する別の倍音信号にも同じ原理が同様に適用される。逆に言えば、邪魔であることが既に分かっている周波数成分、例えば、音の信号（例えば、アラーム、電話のベル、その他の電子アラーム）などを無視するように方向表示計算機ＤＣ１２ＬおよびＤＣ１２Ｒを構成することが望ましい。

方向表示計算機ＤＣ１２ＬおよびＤＣ１２Ｒは、フレーム（またはサブバンド）のＤＯＡを対応する周波数成分のＤＯＡ表示の平均（例えば、平均値や中央値や最頻値）として示すことにより位相差に基づく方法を実施して実現しても良い。あるいは、所望する範囲のＤＯＡ有効範囲を複数のビン（bins）に分けて（例えば、０〜１８０度の範囲では３、４、５、６、７、８、９、１０、１１、１２のいずれかの数のビンに固定した枠組み）、それぞれのビンに値が入る周波数成分に対応しているＤＯＡ表示の数（すなわち、ビンの分布）を決めることによってフレーム（またはサブバンド）のＤＯＡを示すようにそのような計算を構成しても良い。ビンが等しくない帯域幅を有している場合にはそのような計算は個々のビンの分布を対応する帯域幅で正規化してビンの分布値を計算することが望ましい。所望する音源のＤＯＡは、分布値の最も高いビンに対応する方向あるいは現在の分布値が大きなコントラストを示すビン（例えば、ビンの現在の分布値がそのビンの分布値の長期間に亘る平均時間から最も大きい相対的な絶対値だけ異なっているビン）に対応する方向として示される。

計算機ＤＣ１２ＬおよびＤＣ１２Ｒの同様の実施態様では一組の指向性マスキング関数（directional masking functions）を使用してＤＯＡの所望有効範囲を複数の空間セクタ（例えば、０〜１８０度の範囲を３、４、５、６、７、８、９、１０、１１、１２のいずれかの数のセクタ）に分割する。隣接するセクタの指向性マスキング関数は重複していることもあれば重複していないこともあり、指向性マスキング関数のグラフ（profile）は線形のこともあれば非線形のこともある。指向性マスキング関数は、拒絶帯域（stopband）と通過帯域（passband）との遷移の急峻さを一種類以上の係数（例えば、信号対雑音比（ＳＮＲ：signal-to-noise ratio）、ノイズフロア（noise floor）、その他）の値にしたがって操作中に選択可能であったり変動可能であったりするように実施することができる。例えばＳＮＲが低い場合には、より狭い通過帯域を用いることが計算機には望ましい。

セクタはお互いに同じ角度幅（例えば、度またはラジアンの単位で）を有しているか、二つ以上（できれば全て）のセクタがお互いに異なる幅を有しているかのいずれかである。図１５Ａは、マイクＭＲ１０の位置との関連で位相差に基づくＤＯＡを表示するためにマイクＭＲ１０およびＭＲ２０に対応しているチャンネル対に三つの重複しているセクタから成る組を適用した計算機ＤＣ１２Ｒの実施態様の上面図である。図１５Ｂは、マイクの対ＭＲ１０、ＭＲ２０を結ぶ軸の中点との関連で位相差に基づくＤＯＡを表示するためにマイクＭＲ１０およびＭＲ２０に対応しているチャンネル対に五つの重複しているセクタから成る組を適用した計算機ＤＣ１２Ｒの実施態様の上面図である（各セクタの矢印はセクタの中心におけるＤＯＡを示している）。

図１６Ａ〜図１６Ｄは、それぞれが指向性マスキング関数の例を示す図であり、図１７は三種類の指向性マスキング関数の二つの異なる組（線形グラフ対曲線グラフ）の例を示す図である。これらの例では、各セグメントのマスキング関数の出力は調べている周波数成分の対応する位相差の通過した値の合計に基づいている。例えば、計算機ＤＣ１２ＬおよびＤＣ１２Ｒの実施態様はマスキング関数の最大可能値（maximum possible value for the masking function）に関する合計を正規化して出力を計算するように構成されている。勿論、マスキング関数の応答も方向θではなくて時間遅れτまたは比ｒで表現される。

マイクアレイは異なる量の環境ノイズ（ambient noise）を異なる方向から拾う。図１８は、図１７に示した三方向マスキング関数のセットを同じマルチチャンネルのオーディオ信号に適用した結果を大きさ対時間の（フレームにおける）プロットにより示す図である。様々なマスキング関数のこの信号に対する平均応答がかなり異なることがわかる。そのようなマスキング関数を用いる計算機ＤＣ１２ＬおよびＤＣ１２Ｒを実際に構成する際には、それぞれの方向の閾値を個々のマスキング関数の出力に適用してマスキング関数の出力が対応する方向の閾値を超えている場合（あるいは、その閾値以上の場合）を除いて当該セクタに対応しているＤＯＡがセグメントのＤＯＡの表示に選択されないようにすることが望ましい。

一時的な平滑化値（temporally smoothed value）としてコヒーレンス測度（coherency measure）をセクタ毎に生成するように方向計算機ＤＣ１２ＬおよびＤＣ１２Ｒを構成することが望ましい。そのような例の一つでは、最近のｍ個のフレームに亘る平均値としてコヒーレンスの測度を生成するように方向計算機が構成されている。ここで、ｍの可能な値には５、８、１０、１６、２０が含まれる。別のそのような例では、ｚ（ｎ）＝βｚ（ｎ−１）＋（１−β）ｃ（ｎ）のような式にしたがってフレームｎの平滑化したコヒーレンス測度ｚ（ｎ）を計算するように方向計算機が構成されている（一次ＩＩＲまたは再帰型フィルタとしても知られている）。ここで、ｚ（ｎ−１）は先行フレームの平滑化コヒーレンス測度を表し、ｃ（ｎ）はコヒーレンス測度の現在のまだ平滑化されていない値を表し、βは０（平滑化なし（no smoothing））から１（更新処理なし（no updating））の範囲から選択される平滑化係数である。平滑化係数βの典型的な値は０．１、０．２、０．２５、０．３、０．４、０．５である。方向計算機ＤＣ１２ＬおよびＤＣ１２Ｒのそのような実施態様では異なるセクタに対応しているコヒーレンス測度の平滑化にβの同じ値が一般に用いられているが、これは必須ではない。

コヒーレンス測度のコントラストは、コヒーレンス測度の現在値とコヒーレンス測度のある期間に亘る平均値（例えば、最近の１０個、２０個、５０個、１００個のいずれかの個数のフレームに亘る平均値、最頻値、中央値のいずれか）との間の関係（例えば、差や比）の値として表現される。漏えい積分器（a leaky integrator）のように一時的な平滑化係数を使用したり、ｖ（ｎ）＝αｖ（ｎ−１）＋（１−α）ｃ（ｎ）のような式にしたがったりしてコヒーレンス測度の平均値をセクタ毎に計算するように方向計算機ＤＣ１２ＬおよびＤＣ１２Ｒの実施態様は構成される。ここで、ｖ（ｎ）は現在のフレームの平均値を表し、ｖ（ｎ−１）は先行フレームの平均値を表し、ｃ（ｎ）はコヒーレンス測度の現在の値を表し、αは０（平滑化なし）から１（更新処理なし）の範囲から値が選択される平滑化係数である。平滑化係数αの典型的な値は０．０１、０．０２、０．０５、０．１である。

セクタに基づくＤＯＡ推定方法を使用してコヒーレンス測度が最大であるセクタに関連付けられているＤＯＡとして信号のＤＯＡを推定するように方向計算機ＤＣ１２ＬおよびＤＣ１２Ｒを構成することができる。あるいは、コヒーレンス測度のコントラストが現在のところ最も大きいセクタ（例えば、長期に亘るコヒーレンス測度の時間平均からの現在値の逸脱が他に比べて相対的に最も大きいセクタ）に関連付けられているＤＯＡとして信号のＤＯＡを推定するようにそのような方向計算機を構成することもできる。位相差に基づくＤＯＡ推定に関する追加の記載は、例えば、（２０１１年２月１７日に公開された）米国特許出願公開公報第２０１１／００３８４８９号や（２０１１年２月１７日に出願された）米国特許出願第１３／０２９，５８２号に見られる。

利得差に基づく取り組みも位相差に基づく取り組みもマルチチャンネル信号の制限されたオーディオ周波数範囲に亘ってＤＯＡ表示をするように方向計算機ＤＣ１０ＬおよびＤＣ１０Ｒを構成することが望ましい。例えば、低い周波数での残響音や高い周波数での所望の信号の低減による問題を避けるために中間周波数範囲（例えば、１００Ｈｚ、２００Ｈｚ、３００Ｈｚ、５００Ｈｚのいずれかから８００Ｈｚ、１００Ｈｚ、１２００Ｈｚ、１５００Ｈｚ、２０００Ｈｚのいずれかまで）でＤＯＡ推定を方向計算機が実施することが望ましい。

マイクの対に関するＤＯＡの表示は一般に符号（sign）があいまいである。例えば、到来の時間遅れや位相差はマイクの対の前に位置している音源とマイクの対の後ろに位置している音源とで同じである。図１９は、マイクの対ＭＲ１０、ＭＲ２０の典型的な使用例を示す図であり、縦型セクタ（endfire sectors）１および３の円錐はアレイの軸を中心にして対称であり、両円錐の間の空間をセクタ２が占めている。したがって、マイクが全方向性（omnidirectional）の場合、指定された範囲の方向に対応しているピックアップ円錐（pickup cones）ではマイクの対の前と後ろが曖昧になりがちである。

マルチチャンネル信号の一連のフレームのそれぞれの複数の周波数成分（例えば、サブバンドまたは周波数ビン）毎にここに説明するように方向表示を生成するように方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒの各々を構成することもできる。ある例では、フレームの幾つかの周波数成分（例えば、サブバンドやＦＦＴビン）毎に利得差を計算するように装置Ａ１００が構成されている。装置Ａ１００をそのように構成した場合には、変換領域（transform domain）で作動するようにしたり、入力チャンネルのサブバンドを時間領域で生成するようにサブバンドフィルタバンク（subband filter banks）を含めたりすることができる。

ノイズ低減モードで作動するように装置Ａ１００を構成することが恐らく望ましい。このモードでは入力信号ＳＩ１０は、マイクチャンネルＳＬ１０、ＳＬ２０、ＳＲ１０、ＳＲ２０の少なくとも一つに基づいているか、使用者の声を拾うように配置されている別のマイクにより生成される信号に基づいているかのいずれか一方または両方である。そのような操作は、使用者の口から遠い領域のノイズを区別して使用者の口に近い領域の信号に集中するために適用される。

ノイズ低減モードの操作では、使用者の音声をより直接的に受けるように使用者の口の近くに位置している別のマイクＭＣ１０（ブームやコードに取り付けられているマイク）により生成される信号を入力信号ＳＩ１０に含めても良い。装置Ａ１００の使用中にマイク信号ＭＣ３０からの信号における使用者の音声のＳＮＲがマイクチャンネルＳＬ１０、ＳＬ２０、ＳＲ１０、ＳＲ２０のいずれにおける使用者の音声のＳＮＲよりも大きくなるようにマイクＭＣ１０が装置Ａ１００に配置されている。その他にまたはその上に音声マイクＭＣ１０は、ノイズ基準マイクＭＬ１０およびＭＲ１０のどちらよりも使用者の音声の中心出口点に直接的に向くように配備されるか、中心出口点のより近くに配置されるか、中心出口点により近い前頭面に配備されるかのいずれかまたは全ての状態を満たすように使用中に位置付けられる。

図２５Ａは、頭部と胴部のシミュレータまたは「ＨＡＴＳ」（Head and Torso Simulator）（Bruel and Kjaer, DK）に取り付けられたシステムＳ１００の実施態様を示す正面図である。図２５ＢはＨＡＴＳの左側面図である。図２５Ａおよび図２５Ｂでは使用者の音声の中心出口点が十字線で示されている。この中心出口点は、使用者の上下の唇の外面が発話中に交わる使用者の頭部の正中矢状面に位置しているものとして定義される。中心前頭面と中心出口点との距離は一般に７ｃｍ、８ｃｍ、９ｃｍのいずれかから１０ｃｍ、１１ｃｍ、１２ｃｍ、１３ｃｍ、１４ｃｍのいずれかまでの範囲（例えば、８０〜１３０ｍｍ）である。（ここでは、点と面との距離が面に垂直な線に沿って測定されるものと仮定している。）装置Ａ１００の使用中に音声マイクＭＣ１０は一般に中心出口点の３０ｃｍの範囲内に位置している。

装置Ａ１００の使用中における音声マイクＭＣ１０の位置に関する幾つかの異なる例が図２５Ａには符号の付いた円として示されている。位置Ａでは、音声マイクＭＣ１０はキャップやヘルメットのまびさしに取り付けられている。位置Ｂでは、音声マイクＭＣ１０は一対のメガネ、ゴーグル、安全メガネ、その他のメガネ類のブリッジに取り付けられている。位置ＣＬまたはＣＲでは、音声マイクＭＣ１０は一対のメガネ、ゴーグル、安全メガネ、その他のメガネ類の左または右のつるに取り付けられている。位置ＤＬまたはＤＲでは、音声マイクＭＣ１０はマイクＭＬ１０およびＭＲ１０の対応する一方を含むヘッドセットの筐体の前方位置に取り付けられている。位置ＥＬまたはＥＲでは、音声マイクＭＣ１０は使用者の耳に装着されるフックから使用者の口に向かって延びているブームに取り付けられている。位置ＦＬ、ＦＲ、ＧＬ、ＧＲでは、音声マイクＭＣ１０はノイズ基準マイクＭＬ１０およびＭＲ１０の対応する一方ならびに音声マイクＭＣ１０を通信装置に電気的に接続するコードに取り付けられている。

図２５Ｂの側面図は位置Ａ、Ｂ、ＣＬ、ＤＬ、ＥＬ、ＦＬ、ＧＬの全てが（例えば、位置ＦＬとの関連で示されているように）マイクＭＬ２０よりも中心出口点に近い前頭面（すなわち、図示されているように正中前頭面に平行な面）にあることを示している。図２６Ａの側面図には、これらの点の各々におけるマイクＭＣ１０のそれぞれの実施態様の向きが例示されている。位置Ａ、Ｂ、ＤＬ、ＥＬ、ＦＬ、ＧＬにおけるそれぞれの実施態様の各々が（図面の平面に垂直である）マイクＭＬ１０よりも中心出口点に直接的に向くように配置されている。

図２４Ｂ〜Ｃおよび図２６Ｂ〜Ｄは、ここに述べるシステムＳ１００の実施態様に用いることのできるマイクＭＣ１０の追加の配置例である。図２４Ｂは、音声マイクＭＣ１０がつるまたは対応する端部に取り付けられているメガネを示す図である。図２４Ｃは、音声マイクＭＣ１０が使用者の口に取り付けられていて、ノイズ基準対の各マイクＭＬ１０、ＭＲ１０が使用者の頭部の対応する側に取り付けられているヘルメットを示す図である。図２６Ｂ〜Ｄは、ゴーグル（例えば、スキー用のゴーグル）の例を示す図であり、いずれの例も音声マイクＭＣ１０の異なる対応位置を示している。ここに述べるシステムＳ１００の実施態様の使用中における音声マイクＭＣ１０のさらなる配置例にはキャップやハットのまびさし、襟の折り返し、胸ポケット、肩が含まれるがこれらに限定される訳ではない。

図２０Ａ〜図２０Ｃは、ノイズ低減モードでシステムが作動する原理を説明する上面図である。これらの例では、マイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０はいずれも単一指向性（例えば、カルジオイド）の応答を有していて、使用者の正面方向を向いている。この態様では、前方のピックアップ円錐ＬＮ１０内にフレームのＤＯＡがあることを方向表示ＤＩ１０Ｌが示し、前方のピックアップ円錐ＲＮ１０内にフレームのＤＯＡがあることを方向表示ＤＩ１０Ｒが示す場合には、利得制御モジュールＧＣ１０は入力信号ＳＩ１０を通すように構成されている。この場合、音声活動が示されるようにこれらの円錐の交差領域Ｉ１０に音源が位置しているものと仮定される。あるいは、フレームのＤＯＡが円錐ＬＮ１０の中にないことを方向表示ＤＩ１０Ｌが表示しているか、フレームのＤＯＡが円錐ＲＮ１０の中にないことを方向表示ＤＩ１０Ｒが表示している場合には、音源は交差領域Ｉ１０の外にあるものと推定され（例えば、音声活動の欠如を示す）、利得制御モジュールＧＣ１０はそのような場合に入力信号ＳＩ１０を低減するように構成されている。図２１Ａ〜図２１Ｃは、縦型ピックアップ円錐ＬＮ１２およびＲＮ１２の交差領域Ｉ１２に音源が位置しているかどうかを方向表示ＤＩ１０ＬおよびＤＩ１０Ｒが表示している類視した例の上面図である。

ノイズ低減モードでの操作では、使用者の声の中心出口から少なくとも閾値距離（少なくとも２５ｃｍ、３０ｃｍ、５０ｃｍ、７５ｃｍ、１００ｃｍのいずれか）に位置している音源からの音から使用者の声を装置Ａ１００が区別できるようにピックアップ円錐を構成することが望ましい。例えば、使用者の声の中心出口点から正中矢状面に沿って閾値距離よりも遠くに交差領域が延びないようにピックアップ円錐を選択することが望ましい。

図２２Ａ〜図２２Ｃは、マイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０の各々が全方向性の応答を有している類似した例を示す上面図である。この例では、前方のピックアップ円錐ＬＮ１０の中にフレームのＤＯＡがあることを方向表示ＤＩ１０Ｌが示し、前方のピックアップ円錐ＲＮ１０または後方のピックアップ円錐ＲＮ２０の中にフレームのＤＯＡがあることを方向表示ＤＩ１０Ｒが示す場合には、利得制御モジュールＧＣ１０は入力信号ＳＩ１０を通すように構成されている。この場合、音声活動が示されるようにこれらの円錐の交差領域Ｉ１０に音源が位置しているものと仮定される。あるいは、円錐ＬＮ１０およびＬＮ２０のどちらの中にもフレームのＤＯＡがないことを方向表示ＤＩ１０Ｌが示しているか、円錐ＲＮ１０およびＲＮ２０のどちらの中にもフレームのＤＯＡがないことを方向表示ＤＩ１０Ｒが示している場合には、交差領域Ｉ１０の外に音源があるものと推定され（例えば、音声活動の欠如を示す）、利得制御モジュールＧＣ１０はそのような場合に入力信号ＳＩ１０を低減するように構成されている。図２３Ａ〜図２３Ｃは、縦型ピックアップ円錐ＬＮ１５およびＲＮ１５の交差領域Ｉ１５に音源が位置しているかどうかを方向表示ＤＩ１０ＬおよびＤＩ１０Ｒが表示している類視した例の上面図である。

上で述べたように方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒは、（例えば、図１０Ａ、図１０Ｂ、図１５Ａ、図１５Ｂ、図１９を参照してここに説明したように）到来方向を含む空間セクタを識別するようにそれぞれを構成することができる。そのような場合には、対応するピックアップ円錐の中にセクタがあるかどうかを示す値（例えば、０か１の値）にセクタ表示をマッピングすることによって対応する方向表示を生成するように計算機ＤＣ１０ＬおよびＤＣ１０Ｒのそれぞれを構成することができる。図１０Ｂに示されている方法では、例えば、方向表示ＤＩ１０Ｒ用のセクタ５の表示を１の値にマッピングし、方向表示ＤＩ１０Ｒ用のそれ以外のセクタの表示を０の値にマッピングすることによって方向表示ＤＩ１０Ｒを生成するように方向表示計算機ＤＣ１０Ｒを構成することができる。

あるいは、上で述べたように、推定到来方向を示す値（例えば、マイクの軸に対する角度、到来時間の差、位相差と周波数との比）を計算するように方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒのそれぞれを構成することができる。そのような場合に、対応するピックアップ円錐の中に対応するＤＯＡがあるかどうかを示す対応する方向表示ＤＩ１０ＬまたはＤＩ１０Ｒの値（例えば、０または１の値）への個々のマッピングをＤＯＡの算出値に適用することによって対応する方向表示を生成するように計算機ＤＣ１０ＬおよびＤＣ１０Ｒの各々を構成することができる。例えば、一つ以上の閾値としてそのようなマッピングを実現することができる（例えば、ＤＯＡが閾値未満であることを示す値を１の方向表示にマッピングし、ＤＯＡが閾値より大きいことを示す値を０の方向表示にマッピングするか、その逆にする）。

（例えば、交差領域の境界に近い音源の出力信号ＳＯ１０のジッタ（jitter）を避けるために）ハングオーバ（hangover）または他の一時的な平滑化操作を利得制御要素ＧＣ１０により算出される利得係数に組み込むことが望ましい。例えば、連続するフレームの閾値数（例えば、５、１０、２０のいずれか）により新しい状態が示されるまで利得係数の状態を変えることを控えるように利得制御要素ＧＣ１０を構成することができる。

ピックアップ円錐により確定される交差領域に音源があることを方向表示が示しているかどうかにしたがって入力信号ＳＩ１０の二値制御（例えば、ゲーティング）を実行して出力信号ＳＯ１０を生成するように利得制御要素ＧＣ１０を構成することができる。そのような場合に、利得制御要素ＧＣ１０に入力信号の通過や低減を適宜に行わせる音声活動検出信号として利得係数を見なすことができる。あるいは、可能な値が二つよりも多い入力信号ＳＩ１０に利得係数を適用することによって出力信号ＳＯ１０を生成するように利得制御モジュールＧＣ１０を構成することができる。例えば、ピックアップ円錐の中にセクタがある場合に第一の値（例えば、１）を示し、ピックアップ円錐の外にセクタがある場合に第二の値（例えば、０）を示し、ピックアップ円錐の中にセクタが部分的にある場合（例えば、図１０Ｂのセクタ４）に第三の中間的な値（例えば、０．５）を示す方向表示ＤＩ１０ＬおよびＤＩ１０Ｒをピックアップ円錐へのセクタ数のマッピングにしたがって生成するように計算機ＤＣ１０ＬおよびＤＣ１０Ｒを構成することができる。推定ＤＯＡ値のピックアップ円錐へのマッピングも同様に実現することができるが、中間値を任意の数に設定してそのようなマッピングを実現することができることを理解されたい。これらの場合には、方向表示を結合すること（例えば、加算や乗算）によって利得係数を計算するように利得制御モジュールＧＣ１０を構成することができる。利得係数値の許容範囲は、線形項（linear terms）（例えば、０から１）または対数項（例えば、−２０から０ｄＢ）でこれを表現することができる。二進値でない場合には、例えば、有限または無限のインパルス応答（ＦＩＲまたはＩＩＲ）フィルタとして利得係数の一時的な平滑化操作を実現することができる。

上で指摘したように方向表示計算機ＤＣ１０ＬおよびＤＣ１０Ｒはフレームのサブバンド毎に対応する方向表示を生成するようにそれぞれを構成することができる。そのような場合に、各方向表示計算機からのサブバンドレベルの方向表示を結合して対応するフレームレベルの方向表示を（例えば、方向計算機からのサブバンド方向表示の合計、平均、重み付け平均として）取得するように利得制御モジュールＧＣ１０を構成することができる。あるいは、ここに述べた多数の例を実施してサブバンド毎に対応する利得係数を生成するように利得制御モジュールＧＣ１０を構成することができる。そのような場合に、サブバンドレベルの音源位置決定を結合（例えば、加算したり乗算したり）して対応するフレームレベルの利得係数値を取得したり、各サブバンドレベルの音源位置決定を対応するサブバンドレベルの利得係数値にマッピングしたりするように利得制御要素ＧＣ１０を同様に構成することができる。（例えば、サブバンドフィルタバクを用いて）時間領域または周波数領域の入力信号ＳＩ１０の対応するサブバンドに利得係数を適用するように利得制御モジュールＧＣ１０を構成することができる。

出力信号ＳＯ１０からのオーディオ周波数情報を（例えば、無線通信リンクによる送信のために）符号化することが望ましい。図２４Ａは、解析モジュールＡＭ１０を備えている装置Ａ１１０の実施態様Ａ１３０を示すブロック図である。線形予測符号化（ＬＰＣ：linear prediction coding）解析操作を出力信号ＳＯ１０（またはＳＯ１０に基づくオーディオ信号）に施してフレームのスペクトル包絡線を描写する一組のＬＰＣフィルタ係数を生成するように解析モジュールＡＭ１０を構成することができる。そのような場合に、ここに述べる一つ以上の様々なコーデック（例えば、ＥＶＲＣ、ＳＭＶ、ＡＭＲ−ＷＢ）にしたがっているフレームにオーディオ周波数情報を符号化するように装置Ａ１３０を構成することができる。装置Ａ１２０も同様に構成することができる。

出力信号ＳＯ１０の後処理（例えば、ノイズの低減処理）をするように装置Ａ１００を構成することが望ましい。図２７は、後処理された出力信号ＳＰ１０を生成するように構成されている装置Ａ１２０の実施態様Ａ１４０を示すブロック図である（但し、入力信号ＳＩ１０を変換領域へと変換するための変換モジュールＸＭ１０Ｌ、２０Ｌ、１０Ｒ、２０Ｒや対応するモジュールが示されていない）。装置Ａ１４０は、ピックアップ円錐の中から到来するチャンネルＳＲ２０（とチャンネルＳＬ２０の両方または一方）のフレームをブロックしてピックアップ円錐の交差領域の外の方向から到来するフレームを通すことにより方向表示を適用してノイズ推定ＮＥ１０を生成する利得制御要素ＧＣ１０の第二の例ＧＤ１０ｂを備えている。装置Ａ１４０は、ノイズ推定ＮＥ１０からの情報に基づいて出力信号ＳＯ１０（例えば、所望の音声信号の推定）の後処理をして後処理された出力信号ＳＰ１０を生成するように構成されている後処理モジュールＰＰ１０も備えている。そのような後処理には出力信号ＳＯ１０のウィーナフィルタリング（Wiener filtering）や出力信号ＳＯ１０からノイズ推定ＮＥ１０をスペクトル減算（spectral subtraction）することが含まれる。図２７に示すように、周波数領域で後処理操作を実行してその結果得られる信号を逆変換モジュールＩＭ１０により時間領域に変換して後処理された出力信号ＳＰ１０を得るように装置Ａ１４０を構成することができる。

上に述べたノイズ低減モードに加えてまたはその代わりに補聴器モードで作動するように装置Ａ１００を構成することができる。補聴器モードではシステムＳ１００は、使用者の口からの信号や干渉音響信号（interfering sound signals）があるかも知れない近場領域（near-field region）を除去すると同時に遠場方向（far-field direcions）に集中させることにより実行されるフィードバック制御および遠場ビームフォーミング（far-field beamforming）に用いられる。単一指向性や無指向性のマイクを用いて補聴器モードを実現することができる。

補聴器モードでの作動では、使用者の片耳または両耳で出力信号ＳＯ１０を再生するように構成されているスピーカＬＳ１０を一個以上用いてシステムＳ１００を実現することができる。システムＳ１００は、電線またはその他の伝導性経路を介して装置Ａ１００が一個以上のそのようなスピーカＬＳ１０に結合されるように構成される。それとは別にまたはその上に装置Ａ１００が無線で一個以上のそのようなスピーカＬＳ１０に結合するようにシステムＳ１００を構成することができる。

図２８は、装置Ａ１１０が補聴器モードで作動する実施態様Ａ２１０のブロック図である。このモードでは、ピックアップ円錐交差領域から到来するチャンネルＳＲ２０（およびチャンネルＳＬ２０の両方または一方）のフレームを低減させるように利得制御モジュールＧＣ１０が構成される。装置Ａ２１０は、使用者の耳に装着されて使用者の対応する鼓膜に向けられるスピーカＬＳ１０を駆動して出力信号ＳＯ１０に基づいている音響信号を生成するように構成されているオーディオ出力段ＡＯ１０も備えている。

図２９Ａ〜図２９Ｃは、システムＡ２１０の実施態様が補聴器モードで作動する原理を説明する上面図である。これらの例では、マイクＭＬ１０、ＭＬ２０、ＭＲ１０、ＭＲ２０はいずれも単一指向性であり、使用者の正面方向を向いている。そのような態様では、アレイＲ１００Ｌが受信する信号の音成分のＤＯＡが第一指定範囲（図２９Ａにピックアップ円錐ＬＦ１０として示されている空間領域）の中に入るかどうかを示すように方向計算機ＤＣ１０Ｌは構成されていて、アレイＲ１００Ｒが受信する信号の音成分のＤＯＡが第二指定範囲（図２９Ｂにピックアップ円錐ＲＦ１０として示されている空間領域）の中に入るかどうかを示すように方向計算機ＤＣ１０Ｒは構成されている。

ある例では、ピックアップ円錐ＬＦ１０およびＲＦ１０のどちらか一方の中の方向から受信した音響情報を出力信号ＯＳ１０として通すように利得制御要素ＧＣ１０は構成されている（例えば、「論理和」の場合）。別の例では、到来方向がピックアップ円錐ＬＦ１０の中であることを方向表示ＤＩ１０Ｌが示し、到来方向がピックアップ円錐ＲＦ１０の中であることを方向表示ＤＩ１０Ｒが示す場合にだけ少なくとも一個のマイクが拾った音響情報を出力信号ＳＯ１０として通すように利得制御要素ＧＣ１０は構成されている（例えば、「論理積」の場合）。

図３０Ａ〜図３０Ｃは、マイクが無指向性である類似した事例の補聴器モードにおけるシステムの作動原理を示す上面図である。補聴器モードにおいて使用者の口からの近場信号の抑制を維持しながら異なる注意方向（different look directions）の中から使用者が手動で選択することができるようにシステムは構成される。例えば図３１Ａ〜図３１Ｃは、無指向性マイクを有していて図３０Ａ〜図３０Ｃに示されている前後方向の代わりに左右の方向が採用されているシステムの補聴器モードでの作動原理を示す上面図である。

装置Ａ１００は補聴器モードでは各マイクアレイが独立に作動するように構成されている。例えば、補聴器モードにおける装置Ａ１００の作動は、軸に沿って外に向かう信号（signals from an outward endfire direction）を両側でそれぞれ独立に選択することができるように実現される。あるいは、補聴器モードにおける装置Ａ１００の作動は、（例えば、両マルチチャンネル信号に見つかる音成分を遮ることや両マルチチャンネル信号の一方のみの選択された方向範囲内にある指向性音成分を通すことの両方または一方により）分散しているノイズを低減させるように実現される。

図３２は、装置Ａ１００の実施態様を頭部と胴体のシミュレータ（ＨＡＴＳ）に取り付けて、口元のスピーカから近場を模した音声信号を出力する一方で周囲のスピーカから干渉遠場信号（interfering far-field signals）を出力させるテスト用の配置例を示す図である。図３３は、補聴器モードにおけるテストの結果を示す図である。少なくとも一個のマイクで記録した信号と処理した信号（すなわち、出力信号ＯＳ１０）との比較は、所望の方向から到来する遠場信号が保存されるのに対して他の方向から到来する遠場信号や近場信号が抑制されることを示している。補聴器モードにした装置Ａ１００を遠端通信信号または標準的な圧縮フォーマット（例えば、動画像符号化専門家会合（ＭＰＥＧ）−１オーディオレイヤ３（ＭＰ３）、ＭＰＥＧ−４Ｐａｒｔ１４（ＭＰ４）、ウィンドウズ（登録商標）メディアオーディオ／ビデオ（ＷＭＡ／ＷＭＶ）（マイクロソフト社、ワシントン、レッドモンド）のバージョン、アドバンストオーディオコーディング（ＡＣＣ）、国際電気通信連合（ＩＴＵ）−ＴＨ．２６４、その他）にしたがって符号化されたファイルやストリームなどの他の圧縮されたオーディオやオーディオビジュアルの情報のような再生オーディオ信号と組み合わせてシステムＳ１００を構成することが望ましい。図３４は、出力信号ＳＯ１０をそのような再生オーディオ信号ＲＡＳ１０と混合して混合信号でスピーカＬＳ１０を駆動するオーディオ出力段ＡＯ１０の実施態様ＡＯ２０を備えている装置Ａ２１０の実施態様Ａ２２０を示すブロック図である。

ここに述べたようにノイズ低減モードおよび補聴器モードの両方または一方で装置Ａ１００が作動することをサポートするようにシステムＳ１００を構成することが望ましい。図３５は、装置Ａ１１０およびＡ２１０の実施態様Ａ３００を示すブロック図である。装置Ａ３００は、ノイズ低減モードで第一入力信号ＳＩ１０ａにより作動して第一出力信号ＳＯ１０ａを生成するように構成されている利得制御モジュールＧＣ１０の第一態様ＧＣ１０ａおよび補聴器モードで第二入力信号ＳＩ１０ｂにより作動して第二出力信号ＳＯ１０ｂを生成するように構成されている利得制御モジュールＧＣ１０の第二態様ＧＣ１０ｂを備えている。装置Ａ３００は、装置Ａ１２０、Ａ１３０、Ａ１４０の全てまたはいずれかの特徴と装置Ａ２２０の特徴の両方または一方を備えるように構成しても良い。

図３６Ａは、タスクＶ１００およびＶ２００を備えている一般的な構成による方法Ｎ１００のフローチャートである。タスクＶ１００では、第一マイク対が拾った信号のチャンネル相互間の少なくとも一つの位相差の測定と第二マイク対が拾った信号のチャンネル相互間の少なくとも一つの位相差の測定とが行われる。タスクＶ２００では、位相差が所望の円錐交差関係を満足させない場合に拾った信号を低減させ、それ以外は拾った信号を通すことによってノイズ低減モードが実行される。

図３６Ｂは、タスクＶ１００およびＶ３００を備えている一般的な構成による方法Ｎ２００のフローチャートである。タスクＶ３００では、位相差が所望の円錐交差関係を満足させる場合に拾った信号を低減させ、どちらか一方の位相差が遠場定義（far-field definition）を満足させる場合には拾った信号を通し、それ以外では拾った信号を低減させることによって補聴器モードで作動する。

図３７は、タスクＶ１００、Ｖ２００、Ｖ３００を備えている一般的な構成による方法Ｎ３００のフローチャートである。この場合には、例えば、使用者の選択や装置の作動モード（例えば、使用者が電話中であるかどうか）にしたがってタスクＶ２００およびＶ３００の一方が実行される。

図３８Ａは、タスクＴ１００、Ｔ２００、Ｔ３００を備えている一般的な構成による方法Ｎ１００のフローチャートである。タスクＴ１００では、（例えば、方向表示計算機ＤＣ１０Ｌとの関連でここに述べたように）第一の対のマイクが拾った第一音成分の到来方向の第一表示が第一の対のマイクとの関連で算出される。タスクＴ２００では、（例えば、方向表示計算機ＤＣ１０Ｒとの関連でここに述べたように）第二の対のマイクが拾った第二音成分の到来方向の第二表示が第二の対のマイクとの関連で算出される。タスクＴ３００では、（例えば、利得制御要素ＧＣ１０との関連でここに述べたように）第一および第二の両方向表示に基づいてオーディオ信号の利得が制御されて出力信号が生成される。

図３８Ｂは、一般的な構成による装置ＭＦ１００のブロック図である。装置ＭＦ１００は、（例えば、方向表示計算機ＤＣ１０Ｌとの関連でここに述べたように）第一の対のマイクが拾った第一音成分の到来方向の第一表示を第一の対のマイクとの関連で算出する手段Ｆ１００を備えている。装置ＭＦ１００は、（例えば、方向表示計算機ＤＣ１０Ｒとの関連でここに述べたように）第二の対のマイクが拾った第二音成分の到来方向の第二表示を第二の対のマイクとの関連で算出する手段Ｆ２００も備えている。装置ＭＦ１００は、（例えば、利得制御要素ＧＣ１０との関連でここに述べたように）第一および第二の両方向表示に基づいてオーディオ信号の利得を制御して出力信号を生成する手段Ｆ３００も備えている。

図３９は、システムＳ１００として構成することのできる通信装置Ｄ１０のブロック図である。あるいは、一対のヘッドフォンのような別の装置にマイクやスピーカが位置している装置Ｄ１０（例えば、小型携帯移動電話機、スマートフォン、ラップトップやタブレット型のコンピュータ）がシステムＳ１００の一部として構成される。装置Ｄ１０は、装置Ａ１００を含むチップやチップセットＣＳ１０（例えば、移動局モデム（ＭＳＭ：mobile station modem）チップセット）を備えている。チップまたはチップセットＣＳ１０は、装置Ａ１００のソフトウェアやファームウェアの部分として設定される（例えば、命令のような）プロセッサを一台以上備えている。チップまたはチップセットＣＳ１０は、処理要素列Ｒ１００ＬおよびＲ１００Ｒ（例えば、オーディオ前処理段ＡＰ１０の要素）も備えている。チップまたはチップセットＣＳ１０は、無線周波数（ＲＦ）通信信号を受信して、このＲＦ信号内の符号化されているオーディオ信号を復号化して再生するように構成されている受信機と、装置Ａ１００により生成される処理済み信号に基づいているオーディオ信号（例えば、出力信号ＳＯ１０）を符号化して、この符号化されたオーディオ信号を記述するＲＦ通信信号を送信する送信機とを備えている。

そのような装置は、符号化および復号化の一種類以上の方式（いわゆる「コーデック」）を介して音声通信データを無線で送信したり受信したりするように構成することができる。そのようなコーデックの例には、第３世代パートナーシッププロジェクト２（３ＧＰＰ２）による「強化型可変速コーデック、広帯域拡散スペクトルデジタルシステムのスピーチサービスオプション３、６８、７０（Enhanced Variable Rate Codec, Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems）」と言う名称の２００７年２月の文書Ｃ．Ｓ００１４−Ｃ、ｖ１．０（www-dot-3gpp-dot-orgでオンライン入手可能）に記載されている強化型可変速コーデック、「広帯域拡散スペクトル通信システムの選択可能モードボコーダサービスオプション（Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems）」と言う名称の２００４年１月の３ＧＰＰ２の文書Ｃ．Ｓ００３０−０、ｖ３．０に記載されている選択可能なモードボコーダスピーチコーデック（Selectable Mode Vocoder speech codec）（www-dot-3gpp-dot-orgでオンライン入手可能）、文書ＥＴＳＩＴＳ１２６０９２Ｖ６．０．０に記載されている適応マルチレート（ＡＭＲ）スピーチコーデック（Adaptive Multi Rate (AMR) speech codeck）（欧州電気通信規格協会（ＥＴＳＩ）、フランス、ソフィアアンティポリスセデックス、２００４年１２月）、文書ＥＴＳＩＴＳ１２６１９２Ｖ６．００（ＥＴＳＩ、２００４年１２月）に記載されているＡＭＲ広帯域スピーチコーデック（AMR Wideband Speech codec）がある。例えば、チップまたはチップセットＣＳ１０は一種類以上のそのようなコーデックに準拠して符号化されたオーディオ信号を生成するように構成することができる。

装置Ｄ１０は、アンテナＣ３０を介してＲＦ通信信号を送受信するように構成されている。装置Ｄ１０は、アンテナＣ３０に至るまでの経路にダイプレクサ（diplexer）および一台以上の電力増幅器を備えている。チップまたはチップセットＣＳ１０は、キーパッドＣ１０を介して使用者の入力を受け付けてディスプレイＣ２０に情報を表示するようにも構成されている。この例では、装置Ｄ１０は、全世界測位システム（ＧＰＳ）による位置特定サービスや無線（例えば、ブルートゥース（登録商標））ヘッドセットのような外部装置との短距離通信をサポートするために一本以上のアンテナＣ４０を備えている。別の例では、そのような通信装置自体がブルートゥースヘッドセットであり、キーパッドＣ１０やディスプレイＣ２０やアンテナＣ３０は設けられていない。

ここに述べた方法や装置は、送受信やオーディオ感知の両方または一方の任意の装置に一般に適用することができ、そのような装置を携行したり携帯したりする例に特に適用することができる。例えば、ここに開示した構成の範囲には、無線インターフェースによる符号分割多重アクセス（ＣＤＭＡ：code-division multiple-access）を採用するように構成されている無線電話通信システムに帰属する通信装置が含まれる。それにも拘らず、有線や無線の（例えば、ＣＤＭＡ、ＴＤＭＡ、ＦＤＭＡ、ＴＤ−ＳＣＤＭＡなどの）送信チャネルにインターネットプロトコルに載せた音声（ＶｏＩＰ：Voice over IP）を用いるシステムのようにこの技術分野に長けている者に知られている広範囲に亘る技術を採用している様々な通信システムのどれにでもここに述べた諸特徴を有している方法や装置が帰属可能であることをこの技術分野に長けた者であれば理解することができる。

ここに開示した通信システムをパケット交換（例えば、ＶｏＩＰのようなプロトコルにしたがってオーディオ伝送を搬送するように整えられている有線や無線のネットワーク）や回線交換のネットワークに使えるように改造することが明確に意図されていて、しかも、ここに開示されている。全帯域の広帯域符号化システム（whole-band wideband coding systems）や分割帯域の広帯域符号化システム（split-band wideband coding systems）を含む広帯域符号化システム（例えば、５ｋＨｚよりも大きいオーディオ周波数を符号化するシステム）や狭帯域符号化システム（例えば、約４または５ｋＨｚのオーディオ周波数範囲を符号化するシステム）にここに開示した通信装置を使えるように改造することが明確に意図されていて、しかも、ここに開示されている。

この技術分野に長けている者であれば誰でもここに開示した方法その他の構成を製造したり使用したりすることができるように様々な構成を提示して説明した。ここに示したり述べたりしたフローチャート、ブロック図、他の構成は飽くまでも例に過ぎず、これらの構成の他の様々な変種もここに開示した範囲に含まれる。ここに開示したどの構成にも様々な修正を施すことができるだけでなく、ここに示した一般的な原理は別の様々な構成にも同様に適用することができる。したがってこの開示は、上に示した諸構成に限定することを意図してなされているのではなくて、元々の開示の一部を構成している添付の特許請求の範囲を含めて任意の態様でここに開示されている諸原理や新規な諸特徴に一致している限り最も広い範囲を意図してなされている。

この技術分野に長けた者であれば多様な異なる技術や技巧のいずれを用いて情報や信号を表現しても構わないことが理解できるはずである。例えば、上の説明全体に亘って参照されているデータ、命令、指令、情報、信号、ビット、シンボルは電圧、電流、電磁波、磁場、磁粒、光場、光粒、これらの任意の組み合わせにより表すことができる。

ここに開示した構成の具体化にとって重要な設計上の必要条件には、特に、圧縮したオーディやオーディオビジュアルの情報（例えば、ここに示したいずれかの例のように圧縮フォーマットで符号化されているファイルやストリーム）の再生のように計算が集中する用途や広帯域通信（例えば、１２ｋＨｚ、１６ｋＨｚ、４４．１ｋＨｚ、４８ｋＨｚ、１９２ｋＨｚのいずれかのように８ｋＨｚよりも高いサンプリングレートでの音声通信）の用途では処理の遅れや計算の複雑さ（一般に百万命令毎秒すなわちミップス（ＭＩＰＳ）で測定）を最小限にすることが含まれる。

多重マイク処理システムの目標には、総体的なノイズ低減において１０ないし１２ｄＢを達成すること、所望する話者が移動していても音量と音色を維持すること、ノイズを無理やり除去するのではなくてノイズが背後にある感覚を得ること、発話の残響除去（dereverberation of speech）、より積極的なノイズ低減のための後処理のオプションを可能にすることの全てまたはいずれかが含まれる。

ここに開示した装置（例えば、装置Ａ１００、Ａ１１０、Ａ１２０、Ａ１３０、Ａ１４０、Ａ２１０、Ａ２２０、Ａ３００、ＭＦ１００）は、所期の用途に相応しいと思われるハードウェアとソフトゥエアやファームウェアとの任意の組み合わせで実現することができる。例えばそのような装置の要素は、例えば、一枚のチップセットを構成している二枚以上のチップに分散して設けられていたり、同一チップ上に設けられたりしている電子装置や光学装置として製造することができる。そのような装置の一例は、トランジスタや論理ゲートのような論理要素の変更不能かプログラム可能なアレイ（a fixed or programmable array of logic elements）であり、これらの要素のいずれも一本以上のそのようなアレイとして具体化することができる。これらの要素は、二つ以上または全てでさえ同じ一本のアレイや複数本のアレイの中に組み込むことができる。そのような一本のアレイや複数本のアレイは一枚以上のチップ（例えば、二枚以上のチップで構成されているチップセット）に組み込むことができる。

ここに開示した装置（例えば、装置Ａ１００、Ａ１１０、Ａ１２０、Ａ１３０、Ａ１４０、Ａ２１０、Ａ２２０、Ａ３００、ＭＦ１００）の様々な実施態様の一つ以上の要素は、マイクロプロセッサ、組み込み型プロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡｓ（現場でプログラム可能なゲートアレイ）、ＡＳＳＰｓ（特定用途向け標準製品）、ＡＳＩＣｓ（特定用途向け集積回路）のような、論理要素から成る一本以上の変更不能であるかプログラム可能であるかのいずれかのアレイで実行されるように準備されている一種類以上の命令セットとして全体的にまたは部分的に実現することができる。

ここに開示した装置の実施態様の様々な要素のいずれも一台以上のコンピュータ（例えば、一組以上の命令または一本以上の命令の連鎖を実行するようにプログラムされているアレイを一本以上備えていて「プロセッサ」とも呼ばれる機械）として具体化することができる。これらの要素は、二つ以上または全てでさえ同じそのような一台のコンピュータや複数台のコンピュータに組み込むことができる。

ここに開示したプロセッサやその他の処理手段は、例えば、一枚のチップセットを構成している二枚以上のチップに分散して設けられていたり、同一チップ上に設けられたりしている一台以上の電子装置や光学装置として製造することができる。そのような装置の一例は、トランジスタや論理ゲートのように固定されているかプログラム可能な論理要素のアレイであり、これらの要素のいずれも一種類以上のそのようなアレイとして具体化することができる。そのような一本のアレイや複数本のアレイは一枚以上のチップ（例えば、二枚以上のチップで構成されているチップセット）に組み込むことができる。そのようなアレイの例には、マイクロプロセッサ、組み込み型プロセッサ、ＩＰコア、ＤＳＰｓ、ＥＰＧＡｓ、ＡＳＳＰｓ、ＡＳＩＣｓのような論理要素の変更不能であるかプログラム可能であるかのいずれかのアレイが含まれる。ここに開示したプロセッサや他の処理手段は一台以上のコンピュータ（例えば、一組以上の命令または一本以上の命令の連鎖を実行するようにプログラムされているアレイを一本以上備えている機械）やその他のプロセッサとして具体化することができる。ここに述べたプロセッサを用いて方法Ｍ１００の具体化の手順には直接関係していない別の一式の命令やタスク、例えば、プロセッサが組み込まれている装置やシステム（例えば、オーディオ感知装置）の別の作動に関係しているタスクを実行することができる。ここに開示した方法の一部分をオーディオ感知装置のプロセッサに実行させ、当該方法の別の部分を一台以上の別のプロセッサの制御の下で実行させるようにすることもできる。

ここに開示した構成との関連で説明した種々様々の例示的なモジュール、論理ブロック、回路、テストやその他の作動はこれらを電子的なハードウェア、コンピュータソフトウェア、両者の組み合わせのいずれかとして具体化することができることは当業者であれば理解することができるはずである。そのようなモジュール、論理ブロック、回路、作動は、ここに開示した構成を実現するように設計されている汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣやＡＳＳＰ、ＦＰＧＡまたは他のプログラム可能な論理装置、離散的ゲートまたはトランジスタ論理、離散的ハードウェアコンポーネント、これらの任意の組み合わせで実行したり実施したりすることができる。例えば、ハードウェアにより実現されている回路または特定用途向け集積回路に加工された回路構成または不揮発性記憶装置にロードされたファームウェアプログラムもしくは汎用プロセッサや他のデジタル信号処理ユニットのような論理要素のアレイが実行可能な命令である機械可読コードとしてデータ記憶媒体からロードされたりデータ記憶媒体にロードされたりするソフトウェアプログラムなどとして少なくとも部分的にそのような構成を実現することができる。汎用プロセッサはマイクロプロセッサで構わないが、その代わりに汎用プロセッサは任意の通常のプロセッサ、コントローラ、マイクロプロセッサ、状態装置のいずれでも良い。プロセッサは計算装置の組合せとして実現しても良い。例えば、ＤＳＰとマイクロプロセッサとの組み合わせ、複数台のマイクロプロセッサ、コアにした一台のＤＳＰと組み合わせた一台以上のマイクロプロセッサ、任意の他のそのような構成でプロセッサを実現することができる。ソフトウェアモジュールは、ＲＡＭ（ランダムアクセスメモリ）、ＲＯＭ（リードオンリーメモリ）、フラッシュＲＡＭのような不揮発性ＲＡＭ（ＶＲＡＭ）、消去可能プログラム可能ＲＯＭ（ＥＰＲＯＭ）、電気的消去可能プログラム可能ＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、取外し可能ディスク、ＣＤ−ＲＯＭのような一時的でない記憶媒体あるいはこの技術分野で公知の任意の他の形式の記憶媒体に存在していて構わない。記憶媒体がプロセッサに結合されている場合には、そのようなプロセッサは記憶媒体から情報を読み取ったり、記憶媒体に情報を書き込んだりすることができる。あるいは、記憶媒体はプロセッサと一体でも構わない。プロセッサと記憶媒体がＡＳＩＣに内蔵されていても良い。このようなＡＳＩＣが使用者の端末に内蔵されていても良い。あるいは、プロセッサと記憶媒体とが離散的コンポーネントとして使用者の端末に組み込まれていても良い。

ここに開示した様々な方法（例えば、方法Ｎ１００、Ｎ２００、Ｎ３００、Ｍ１００およびここに開示した様々な装置の作動との関連で開示した他の方法）はプロセッサのような論理要素のアレイで実施することができること、ここに記載した装置の様々な要素はそのようなアレイ上で実行するように設計されているモジュールとして実現することができることに注意すること。ここで使用しているように、用語「モジュール」や「サブモジュール」は任意の方法もしくは機械もしくは装置もしくはユニットまたはソフトウェアやハードウェアやファームウェアのいずれかの形式のコンピュータ命令（例えば、論理表現）を含んでいるコンピュータ可読データ記憶媒体に当て嵌まる。多くのモジュールやシステムを組み合わせて一台のモジュールやシステムにしたり、一台のモジュールやシステムを分割して多くのモジュールやシステムにしたりして同じ機能を実行させることができることを理解されたい。ソフトウェアとして実現したり、他のコンピュータ実行可能な命令として実現したりする場合には、プロセスの諸要素は本質的にプログラム、オブジェクト、コンポーネント、データ構造、その他のような関連タスクをルーチンと共に実行するためのコードセグメントである。用語「ソフトウェア」は、ソースコード、アセンブリ言語コード、マシンコード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによる実行が可能な命令の一個以上の集合または一本以上の連鎖、このような例の任意の組み合わせを含むものとして理解されなければならない。プログラムまたはコードセグメントは、プロセッサ可読媒体に記憶したり、搬送波として具体化されたコンピュータデータ信号により伝送媒体や通信リンクで送信したりすることができる。

ここに開示した方法、方式、手法は、論理要素のアレイ（例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、他の有限状態機械）を含む機械が実行することのできる一組以上の命令として（例えば、ここに列挙したような一つ以上のコンピュータ可読記憶媒体のコンピュータ可読有体的特徴において）有体的に実現することもできる。用語「コンピュータ可読媒体」には、情報の記憶や転送が可能で揮発性、不揮発性、取り外し可能、取り外し不能のいずれの記憶媒体をも含む任意の媒体が含まれる。コンピュータ可読媒体の例には、電子回路、半導体記憶装置、ＲＯＭ、フラッシュメモリ、消去可能なＲＯＭ（ＥＲＯＭ）、フロッピー（登録商標）ディスケットまたは他の磁気記憶装置、ＣＤ−ＲＯＭ／ＤＶＤまたは他の光学記憶装置、ハードディスクまたは所望の情報の記憶に使用することのできる任意の他の媒体、光学繊維媒体、無線周波数（ＲＦ）リンク、または所望の情報の搬送に使用することができてアクセスすることができる任意の他の媒体が含まれる。コンピュータデータ信号には、電子ネットワークチャネル、光学繊維、空気、電磁、ＲＦの各リンク、その他のような送信媒体に伝播する任意の信号が含まれる。コードセグメント（code segments）は、インターネットやイントラネットのようなコンピュータネットワークを介してダウンロードすることができる。いずれの場合にも、この開示の範囲はそのような具体化により限定されると解釈してはならない。

ここに記載した様々な方法のどのタスクもプロセッサが実行するソフトウェアモジュール、ハードウェア、両者の組み合わせのいずれかで直接的に実現することができる。ここに開示した方法の実施態様の典型的な用途では論理要素のアレイ（例えば、論理ゲート）は方法の様々なタスクの一つまたは二つ以上を実行したり、あるいは全てさえをも実行したりするように構成されている。一つ以上（あるいは全て）のタスクをコンピュータプログラム製品（例えば、ディスク、フラッシュまたは他の不揮発性のメモリカード、半導体メモリチップ、その他のような一枚以上のデータ記憶媒体）に収録されていて、論理要素のアレイ（例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、他の有限状態機械）を含む機械（例えば、コンピュータ）による読み取りや実行が可能なコード（例えば、一組以上の命令）として実現することができる。ここに述べたような方法を具体化した様々なタスクは複数台のそのようなアレイや機械により実行することができる。これらを含む様々な実施では小型携帯移動電話機やそのような通信機能を備えている他の装置のような無線通信用の装置内でタスクが実行される。そのような装置は、（例えば、ＶｏＩＰのような一種類以上のプロトコルを用いて）回線交換やパケット交換のネットワークで通信をするように構成されている。例えば、そのような装置は符号化されているフレームの送受信をするように構成されているＲＦ回路を備えている。

ここに開示されている様々な方法は、ハンドセット、ヘッドセット、スマートフォン、タブレットコンピュータのいずれかのような携帯用通信装置で実行することができることやここ記載されている様々な装置にはそのような装置が含まれていることが明確に開示されている。典型的な実時間（real-time）（例えば、オンライン）の用途はそのような移動装置を用いて行われる通話である。

一種類以上の例示的な態様ではここに述べた作動はハードウェア、ソフトウェア、ファームウェア、これらの任意の組み合わせのいずれかとして実現することができる。ソフトウェアとして具体化した場合にはそのような作動は一種類以上の命令やコードとしてコンピュータ可読媒体に記憶されたりコンピュータ可読媒体により伝送されたりする。用語「コンピュータ可読媒体」にはコンピュータ可読記憶媒体と通信（例えば、伝送）媒体の両者が含まれる。限定ではなくて例として、コンピュータ可読記憶媒体には、（動的または静的なＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲＡＭが限定ではなく含まれる）半導体メモリのような記憶要素のアレイ、強誘電性、磁気抵抗性、オーボニック性、高分子性、相変化性のいずれかのメモリ、ＣＤ−ＲＯＭまたは他の光学ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶装置が含まれる。そのような記憶媒体は、コンピュータがアクセスすることのできる命令やデータ構造の形式で情報を記憶することができる。通信媒体には、コンピュータプログラムを一方の場所から他方に転送することを容易にする任意の媒体を含めて、命令やデータ構造の形式で所望のプログラムコードを保持するために使用することができてコンピュータがアクセスすることのできる任意の媒体が含まれる。さらに、どのような接続もコンピュータ可読媒体と実質的に呼ぶことができる。例えば、同軸ケーブル、光学繊維ケーブル、撚線対、デジタル加入者回線（ＤＳＬ）あるいは赤外線、無線、極超短波のような無線技術を用いてウェブサイト、サーバ、他の遠隔ソースからソフトウェアが送信される場合には、同軸ケーブル、光学繊維ケーブル、撚線対、ＤＳＬあるいは赤外線、無線、極超短波のような無線技術が媒体の定義に含まれる。ここで使用しているディスクには綴りが「disk」と「disc」の二種類があるが、コンパクトディスク（ＣＤ：compact disc）、レーザディスク（laser disc）、光学ディスク（optical disc）、デジタル多用途ディスク（ＤＶＤ：digital versatile disc）、フロッピー（登録商標）ディスク（floppy（登録商標） disk）、ブルーレイ（登録商標）ディスク（Blu-ray（登録商標） disc）（ブルーレイディスクアソシエーション、カリフォルニア、ユニバーサルシティ）が含まれる。ここで、「disk」と綴られるディスクは通常はデータを磁気的に再生し、「disc」と綴られるディスクは通常はデータをレーザで光学的に再生する。以上に述べたものの組み合わせもコンピュータ可読媒体の範囲に含まれる。

ここに述べた音響信号処理装置は、特定の作動を制御するために音声入力を受容したり、あるいは、通信装置のように背景ノイズから所望のノイズを分離することによりその他の恩恵を受けたりするために音声入力を受容する電子装置に組み込むことができる。多くの方向から生じる背景音（background sounds）から所望の音（clear desired sound）を分離したり増強したりして鮮明にすることで多くの用途で恩恵を受けることができる。そのような用途には、音声の認識や検出、音声の強調や分離、音声による制御（voice-activated control）、その他の機能が組み込まれている電子装置や計算装置における人間機械インターフェースが含まれる。そのような音響信号処理装置を限られた処理機能しか提供しない装置に適合するように具体化することが望ましい。

ここに述べたモジュール、要素、装置の様々な実施態様の諸要素は、例えば、一枚のチップセットを構成している二枚以上のチップに分散して設けられていたり、同一チップ上に設けられたりしている電子装置や光学装置として製造することができる。そのような装置の一例が、トランジスタやゲートのように変更不能であるかプログラム可能であるかのいずれかの論理要素のアレイである。ここに述べた装置の様々な実施態様の一つ以上の要素は、マイクロプロセッサ、組み込み型プロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡｓ、ＡＳＳＰｓ、ＡＳＩＣｓのような、論理要素から成る一本以上の変更不能であるかプログラム可能であるかのいずれかのアレイで実行されるように準備されている一種類以上の命令セットとして全体的にまたは部分的に実現することができる。

ここに述べた装置の実施態様の一つ以上の要素を用いて当該装置の作動には直接関係していない別の一式の命令やタスク、例えば、当該装置が組み込まれている機器やシステムの別の作動に関係しているタスクを実行することができる。そのような装置の実施態様の一つ以上の要素が同じ構造をしていても構わない（例えば、異なる要素に対応している部分のコードを異なる時間に実行するために用いられるプロセッサ、異なる要素に対応しているタスクを異なる時間に行うために実行される一式の命令、異なる要素のために異なる時間に作動する電子装置や光学装置の構成）。

ここに述べた装置の実施態様の一つ以上の要素を用いて当該装置の作動には直接関係していない別の一式の命令やタスク、例えば、当該装置が組み込まれている機器やシステムの別の作動に関係しているタスクを実行することができる。そのような装置の実施態様の一つ以上の要素が同じ構造をしていても構わない（例えば、異なる要素に対応している部分のコードを異なる時間に実行するために用いられるプロセッサ、異なる要素に対応しているタスクを異なる時間に行うために実行される一式の命令、異なる要素のために異なる時間に作動する電子装置や光学装置の構成）。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
（１）第一の対のマイクが拾った第一音成分の到来方向の第一表示（indication）を前記第一の対のマイクとの関連で算出することと、
前記第一の対のマイクから離れている第二の対のマイクが拾った第二音成分の到来方向の第二表示を前記第二の対のマイクとの関連で算出することと、
前記の第一および第二の両方向表示に基づいてオーディオ信号の利得を制御して出力信号を生成することと、を備え、
前記第一の対のマイクはいずれも使用者の頭部の正中矢状面の第一の側に位置し、
前記第二の対のマイクはいずれも前記第一の側とは反対側である前記正中矢状面の第二の側に位置する、オーディオ信号処理方法。
（２）前記オーディオ信号には、前記の第一および第二の対の内の少なくとも一本のマイクにより生成された信号からのオーディオ周波数エネルギが含まれている（１）に記載のオーディオ信号処理方法。
（３）前記オーディオ信号は音声マイクにより生成された信号からのオーディオ周波数エネルギを含み、
前記音声マイクは、前記の第一および第二の両マイク対の各々の少なくとも一本のマイクよりも前記使用者の音声の中心出口点に近い前記使用者の前記頭部の前頭面に位置する、（１）に記載のオーディオ信号処理方法。
（４）前記方法は、前記出力信号のオーディオ周波数エネルギに基づいて複数の線形予測符号化フィルタ係数を算出することを備える、（１）に記載のオーディオ信号処理方法。
（５）前記第一の方向表示を算出することは、前記第一の対のマイクによって生成された信号に基づいているマルチチャンネル信号の複数の異なる周波数成分毎に、前記マルチチャンネル信号の第一チャンネルの前記周波数成分の位相と前記マルチチャンネル信号の第二チャンネルの前記周波数成分の位相との差を計算することを含む、（１）に記載のオーディオ信号処理方法。
（６）前記第一の対の前記マイクの前記位置が第一の軸に沿っており、前記第二の対の前記マイクの前記位置が第二軸に沿っており、前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して４５度以下である（１）に記載のオーディオ信号処理方法。
（７）前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して３０度以下である（６）に記載のオーディオ信号処理方法。
（８）前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して２０度以下である（６）に記載のオーディオ信号処理方法。
（９）前記の利得を制御することは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示すと決定することを含む、（１）乃至（８）のいずれか一項に記載のオーディオ信号処理方法。
（１０）前記の利得を制御することは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示さない限り前記オーディオ信号を低減することを含む、（１）乃至（８）のいずれか一項に記載のオーディオ信号処理方法。
（１１）前記の利得を制御することは、前記の第一および第二の方向表示の少なくとも一方が対応する到来方向が前記正中矢状面から離れていると表示するのに応じて前記オーディオ信号を低減することを含む、（１）乃至（８）のいずれか一項に記載のオーディオ信号処理方法。
（１２）前記方法は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が正中矢状面と交差すると示すことに応じて第二オーディオ信号を低減することを備え、
前記第二オーディオ信号は、前記の第一および第二の対の内の少なくとも一本のマイクから生成された信号からのオーディオ周波数エネルギを含む、（１１）に記載のオーディオ信号処理方法。
（１３）前記の利得を制御することは、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて前記オーディオ信号を低減することを備える、（１）乃至（８）のいずれか一項に記載のオーディオ信号処理方法。
（１４）前記方法は、前記出力信号に基づく信号を再生されたオーディオ信号と混合して混合信号を生成することと、
前記使用者の耳に装着されて前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成することと、を備える、（１３）に記載のオーディオ信号処理方法。
（１５）前記方法は、前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成することを備える、（１）乃至（８）のいずれか一項に記載のオーディオ信号処理方法。
（１６）前記第一の対が前記第二の対から少なくとも１０センチメートル離隔している（１）乃至（８）のいずれか一項に記載のオーディオ信号処理方法。
（１７）第一の対のマイクが拾った第一音成分の到来方向の第一表示を前記第一の対のマイクとの関連で算出する手段と、
前記第一の対のマイクから離れている第二の対のマイクが拾った第二音成分の到来方向の第二表示を前記第二の対のマイクとの関連で算出する手段と、
前記の第一および第二の両方向表示に基づいてオーディオ信号の利得を制御する手段と、を備え、
前記第一の対のマイクはいずれも使用者の頭部の正中矢状面の第一の側に位置し、
前記第二の対のマイクはいずれも前記第一の側とは反対側である前記正中矢状面の第二の側に位置する、オーディオ信号処理装置。
（１８）前記オーディオ信号は、前記の第一および第二の両対の内の少なくとも一本のマイクにより生成された信号からのオーディオ周波数エネルギを含む、（１７）に記載のオーディオ信号処理装置。
（１９）前記オーディオ信号は、音声マイクにより生成された信号からのオーディオ周波数エネルギを含み、
前記音声マイクは、前記第一および第二の両マイク対の各々の少なくとも一本のマイクよりも前記使用者の音声の中心出口点に近い前記使用者の前記頭部の前頭面に位置する、（１７）に記載のオーディオ信号処理装置。
（２０）前記装置は、前記出力信号のオーディオ周波数エネルギに基づいて複数の線形予測符号化フィルタ係数を算出する手段を備える、（１７）に記載のオーディオ信号処理装置。
（２１）前記第一の方向表示を算出する手段は、前記第一の対のマイクによって生成された信号に基づいているマルチチャンネル信号の複数の異なる周波数成分毎に、前記マルチチャンネル信号の第一チャンネルの前記周波数成分の位相と前記マルチチャンネル信号の第二チャンネルの前記周波数成分の位相との差を計算する手段を含む、（１７）に記載のオーディオ信号処理装置。
（２２）前記第一の対の前記マイクの前記位置が第一の軸に沿っており、記第二の対の前記マイクの前記位置が第二軸に沿っており、前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して４５度以下である、（１７）に記載のオーディオ信号処理装置。
（２３）前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して３０度以下である、（２２）に記載のオーディオ信号処理装置。
（２４）前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して２０度以下である、（２２）に記載のオーディオ信号処理装置。
（２５）前記の利得を制御する手段は、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示すと決定する手段を含む、（１７）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（２６）前記の利得を制御する手段は、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示さない限り前記オーディオ信号を低減する手段を含む、（１７）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（２７）前記の利得を制御する手段は、前記の第一および第二の方向表示の少なくとも一方が対応する到来方向が前記正中矢状面から離れていると表示するのに応じて前記オーディオ信号を低減する手段を含む、（１７）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（２８）前記装置は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が正中矢状面と交差すると示すことに応じて第二オーディオ信号を低減する手段を備え、
前記第二オーディオ信号は、前記の第一および第二の両対の内の少なくとも一本のマイクから生成された信号からのオーディオ周波数エネルギを含む、（２７）に記載のオーディオ信号処理装置。
（２９）前記の利得を制御する手段は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて前記オーディオ信号を低減する手段を備える、（１７）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（３０）前記装置は、前記出力信号に基づく信号を再生されたオーディオ信号と混合して混合信号を生成する手段と、
前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成する手段と、を備える、（２９）に記載のオーディオ信号処理装置。
（３１）前記装置は、前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成する手段を備える、（１７）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（３２）前記第一の対が前記第二の対から少なくとも１０センチメートル離隔している（１７）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（３３）使用中に使用者の頭部の正中矢状面の第一の側に位置するように構成される第一の対のマイクと、
前記第一の対から離れていて使用中に前記第一の対とは反対側の前記正中矢状面の第二の側に位置する第二の対のマイクと、
前記第一の対のマイクが拾った第一音成分の到来方向の第一表示を前記第一の対のマイクとの関連で算出するように構成される第一の方向表示計算機と、
前記第二の対のマイクが拾った第二音成分の到来方向の第二表示を前記第二の対のマイクとの関連で算出するように構成される第二の方向表示計算機と、
前記の第一および第二の両方向表示に基づいてオーディオ信号の利得を制御するように構成される利得制御モジュールと、を備える、オーディオ信号処理装置。
（３４）前記オーディオ信号は、前記の第一および第二の対の内の少なくとも一本のマイクにより生成された信号からのオーディオ周波数エネルギを含む、（３３）に記載のオーディオ信号処理装置。
（３５）前記オーディオ信号は、音声マイクにより生成された信号からのオーディオ周波数エネルギを含み、
前記音声マイクは、前記第一および第二の両マイク対の各々の少なくとも一本のマイクよりも前記使用者の音声の中心出口点に近い前記使用者の前記頭部の前頭面に位置する、（３３）に記載のオーディオ信号処理装置。
（３６）前記装置は、前記出力信号のオーディオ周波数エネルギに基づいて複数の線形予測符号化フィルタ係数を算出するように構成される解析モジュールを含む、（３３）に記載のオーディオ信号処理装置。
（３７）前記第一の方向表示計算機は、前記第一の対のマイクが生成した信号に基づくマルチチャンネル信号の複数の異なる周波数成分毎に、前記マルチチャンネル信号の第一チャンネルの前記周波数成分の位相と前記マルチチャンネル信号の第二チャンネルの前記周波数成分の位相との差を計算するように構成される、（３３）に記載のオーディオ信号処理装置。
（３８）前記第一の対の前記マイクの前記位置が第一の軸に沿っており、前記第二の対の前記マイクの前記位置が第二軸に沿っており、前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して４５度以下である、（３３）に記載のオーディオ信号処理装置。
（３９）前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して３０度以下である、（３８）に記載のオーディオ信号処理装置。
（４０）前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して２０度以下である、（３８）に記載のオーディオ信号処理装置。
（４１）前記利得制御モジュールは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示すと決定するように構成される（３３）乃至（２４）のいずれか一項に記載のオーディオ信号処理装置。
（４２）前記利得制御モジュールは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示さない限り前記オーディオ信号を低減するように構成される（３３）乃至（４０）のいずれか一項に記載のオーディオ信号処理装置。
（４３）前記利得制御モジュールは、前記の第一および第二の方向表示の少なくとも一方が対応する到来方向が前記正中矢状面から離れていると表示するのに応じて前記オーディオ信号を低減するように構成される（３３）乃至（４０）のいずれか一項に記載のオーディオ信号処理装置。
（４４）前記装置は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて第二オーディオ信号を低減させるように構成される第二利得制御モジュールを備え、
前記第二オーディオ信号は、前記の第一および第二の対の内の少なくとも一本のマイクから生成された信号からのオーディオ周波数エネルギを含む、（４３）に記載のオーディオ信号処理装置。
（４５）前記利得制御モジュールは、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて前記オーディオ信号を低減するように構成される（３３）乃至（４０）のいずれか一項に記載のオーディオ信号処理装置。
（４６）前記装置は、前記出力信号に基づく信号を再生されたオーディオ信号と混合して混合信号を生成するように構成される混合器と、
前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成するように構成されるオーディオ出力段と、を備える、（４５）に記載のオーディオ信号処理装置。
（４７）前記装置は、前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成するように構成されるオーディオ出力段を備える（３３）乃至（４０）のいずれか一項に記載のオーディオ信号処理装置。
（４８）前記第一の対は、装置の使用中に前記第二の対から少なくとも１０センチメートル離れるように構成される、（３３）乃至（４０）のいずれか一項に記載のオーディオ信号処理装置。
（４９）機械により読み取られると（１）乃至（１６）のいずれか一項の方法を当該機械に実行させる有体的な特徴を備えるコンピュータ可読記憶媒体。

Claims

第一の対のマイクが拾った第一音成分の到来方向の第一表示（indication）を前記第一の対のマイクとの関連で算出することと、
前記第一の対のマイクから離れている第二の対のマイクが拾った第二音成分の到来方向の第二表示を前記第二の対のマイクとの関連で算出することと、
前記の第一および第二の両方向表示に基づいてオーディオ信号の利得を制御して出力信号を生成することと、を備え、
前記第一の対のマイクはいずれも使用者の頭部の正中矢状面の第一の側に位置し、
前記第二の対のマイクはいずれも前記第一の側とは反対側である前記正中矢状面の第二の側に位置する、オーディオ信号処理方法。
前記オーディオ信号には、前記の第一および第二の対の内の少なくとも一本のマイクにより生成された信号からのオーディオ周波数エネルギが含まれている請求項１に記載のオーディオ信号処理方法。
前記オーディオ信号は音声マイクにより生成された信号からのオーディオ周波数エネルギを含み、
前記音声マイクは、前記の第一および第二の両マイク対の各々の少なくとも一本のマイクよりも前記使用者の音声の中心出口点に近い前記使用者の前記頭部の前頭面に位置する、請求項１に記載のオーディオ信号処理方法。
前記方法は、前記出力信号のオーディオ周波数エネルギに基づいて複数の線形予測符号化フィルタ係数を算出することを備える、請求項１に記載のオーディオ信号処理方法。
前記第一の方向表示を算出することは、前記第一の対のマイクによって生成された信号に基づいているマルチチャンネル信号の複数の異なる周波数成分毎に、前記マルチチャンネル信号の第一チャンネルの前記周波数成分の位相と前記マルチチャンネル信号の第二チャンネルの前記周波数成分の位相との差を計算することを含む、請求項１に記載のオーディオ信号処理方法。
前記第一の対の前記マイクの前記位置が第一の軸に沿っており、前記第二の対の前記マイクの前記位置が第二軸に沿っており、前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して４５度以下である請求項１に記載のオーディオ信号処理方法。
前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して３０度以下である請求項６に記載のオーディオ信号処理方法。
前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して２０度以下である請求項６に記載のオーディオ信号処理方法。
前記の利得を制御することは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示すと決定することを含む、請求項１乃至８のいずれか一項に記載のオーディオ信号処理方法。
前記の利得を制御することは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示さない限り前記オーディオ信号を低減することを含む、請求項１乃至８のいずれか一項に記載のオーディオ信号処理方法。
前記の利得を制御することは、前記の第一および第二の方向表示の少なくとも一方が対応する到来方向が前記正中矢状面から離れていると表示するのに応じて前記オーディオ信号を低減することを含む、請求項１乃至８のいずれか一項に記載のオーディオ信号処理方法。
前記方法は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が正中矢状面と交差すると示すことに応じて第二オーディオ信号を低減することを備え、
前記第二オーディオ信号は、前記の第一および第二の対の内の少なくとも一本のマイクから生成された信号からのオーディオ周波数エネルギを含む、請求項１１に記載のオーディオ信号処理方法。
前記の利得を制御することは、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて前記オーディオ信号を低減することを備える、請求項１乃至８のいずれか一項に記載のオーディオ信号処理方法。
前記方法は、前記出力信号に基づく信号を再生されたオーディオ信号と混合して混合信号を生成することと、
前記使用者の耳に装着されて前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成することと、を備える、請求項１３に記載のオーディオ信号処理方法。
前記方法は、前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成することを備える、請求項１乃至８のいずれか一項に記載のオーディオ信号処理方法。
前記第一の対が前記第二の対から少なくとも１０センチメートル離隔している請求項１乃至８のいずれか一項に記載のオーディオ信号処理方法。
第一の対のマイクが拾った第一音成分の到来方向の第一表示を前記第一の対のマイクとの関連で算出する手段と、
前記第一の対のマイクから離れている第二の対のマイクが拾った第二音成分の到来方向の第二表示を前記第二の対のマイクとの関連で算出する手段と、
前記の第一および第二の両方向表示に基づいてオーディオ信号の利得を制御する手段と、を備え、
前記第一の対のマイクはいずれも使用者の頭部の正中矢状面の第一の側に位置し、
前記第二の対のマイクはいずれも前記第一の側とは反対側である前記正中矢状面の第二の側に位置する、オーディオ信号処理装置。
前記オーディオ信号は、前記の第一および第二の両対の内の少なくとも一本のマイクにより生成された信号からのオーディオ周波数エネルギを含む、請求項１７に記載のオーディオ信号処理装置。
前記オーディオ信号は、音声マイクにより生成された信号からのオーディオ周波数エネルギを含み、
前記音声マイクは、前記第一および第二の両マイク対の各々の少なくとも一本のマイクよりも前記使用者の音声の中心出口点に近い前記使用者の前記頭部の前頭面に位置する、請求項１７に記載のオーディオ信号処理装置。
前記装置は、前記出力信号のオーディオ周波数エネルギに基づいて複数の線形予測符号化フィルタ係数を算出する手段を備える、請求項１７に記載のオーディオ信号処理装置。
前記第一の方向表示を算出する手段は、前記第一の対のマイクによって生成された信号に基づいているマルチチャンネル信号の複数の異なる周波数成分毎に、前記マルチチャンネル信号の第一チャンネルの前記周波数成分の位相と前記マルチチャンネル信号の第二チャンネルの前記周波数成分の位相との差を計算する手段を含む、請求項１７に記載のオーディオ信号処理装置。
前記第一の対の前記マイクの前記位置が第一の軸に沿っており、記第二の対の前記マイクの前記位置が第二軸に沿っており、前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して４５度以下である、請求項１７に記載のオーディオ信号処理装置。
前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して３０度以下である、請求項２２に記載のオーディオ信号処理装置。
前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して２０度以下である、請求項２２に記載のオーディオ信号処理装置。
前記の利得を制御する手段は、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示すと決定する手段を含む、請求項１７乃至２４のいずれか一項に記載のオーディオ信号処理装置。
前記の利得を制御する手段は、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示さない限り前記オーディオ信号を低減する手段を含む、請求項１７乃至２４のいずれか一項に記載のオーディオ信号処理装置。
前記の利得を制御する手段は、前記の第一および第二の方向表示の少なくとも一方が対応する到来方向が前記正中矢状面から離れていると表示するのに応じて前記オーディオ信号を低減する手段を含む、請求項１７乃至２４のいずれか一項に記載のオーディオ信号処理装置。
前記装置は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が正中矢状面と交差すると示すことに応じて第二オーディオ信号を低減する手段を備え、
前記第二オーディオ信号は、前記の第一および第二の両対の内の少なくとも一本のマイクから生成された信号からのオーディオ周波数エネルギを含む、請求項２７に記載のオーディオ信号処理装置。
前記の利得を制御する手段は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて前記オーディオ信号を低減する手段を備える、請求項１７乃至２４のいずれか一項に記載のオーディオ信号処理装置。
前記装置は、前記出力信号に基づく信号を再生されたオーディオ信号と混合して混合信号を生成する手段と、
前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成する手段と、を備える、請求項２９に記載のオーディオ信号処理装置。
前記装置は、前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成する手段を備える、請求項１７乃至２４のいずれか一項に記載のオーディオ信号処理装置。
前記第一の対が前記第二の対から少なくとも１０センチメートル離隔している請求項１７乃至２４のいずれか一項に記載のオーディオ信号処理装置。
使用中に使用者の頭部の正中矢状面の第一の側に位置するように構成される第一の対のマイクと、
前記第一の対から離れていて使用中に前記第一の対とは反対側の前記正中矢状面の第二の側に位置する第二の対のマイクと、
前記第一の対のマイクが拾った第一音成分の到来方向の第一表示を前記第一の対のマイクとの関連で算出するように構成される第一の方向表示計算機と、
前記第二の対のマイクが拾った第二音成分の到来方向の第二表示を前記第二の対のマイクとの関連で算出するように構成される第二の方向表示計算機と、
前記の第一および第二の両方向表示に基づいてオーディオ信号の利得を制御するように構成される利得制御モジュールと、を備える、オーディオ信号処理装置。
前記オーディオ信号は、前記の第一および第二の対の内の少なくとも一本のマイクにより生成された信号からのオーディオ周波数エネルギを含む、請求項３３に記載のオーディオ信号処理装置。
前記オーディオ信号は、音声マイクにより生成された信号からのオーディオ周波数エネルギを含み、
前記音声マイクは、前記第一および第二の両マイク対の各々の少なくとも一本のマイクよりも前記使用者の音声の中心出口点に近い前記使用者の前記頭部の前頭面に位置する、請求項３３に記載のオーディオ信号処理装置。
前記装置は、前記出力信号のオーディオ周波数エネルギに基づいて複数の線形予測符号化フィルタ係数を算出するように構成される解析モジュールを含む、請求項３３に記載のオーディオ信号処理装置。
前記第一の方向表示計算機は、前記第一の対のマイクが生成した信号に基づくマルチチャンネル信号の複数の異なる周波数成分毎に、前記マルチチャンネル信号の第一チャンネルの前記周波数成分の位相と前記マルチチャンネル信号の第二チャンネルの前記周波数成分の位相との差を計算するように構成される、請求項３３に記載のオーディオ信号処理装置。
前記第一の対の前記マイクの前記位置が第一の軸に沿っており、前記第二の対の前記マイクの前記位置が第二軸に沿っており、前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して４５度以下である、請求項３３に記載のオーディオ信号処理装置。
前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して３０度以下である、請求項３８に記載のオーディオ信号処理装置。
前記の第一および第二の両軸はそれぞれが前記正中矢状面に垂直な線と平行な線に対して２０度以下である、請求項３８に記載のオーディオ信号処理装置。
前記利得制御モジュールは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示すと決定するように構成される請求項３３乃至２４のいずれか一項に記載のオーディオ信号処理装置。
前記利得制御モジュールは、前記第一の方向表示および前記第二の方向表示が共に前記正中矢状面と交差する到来方向を示さない限り前記オーディオ信号を低減するように構成される請求項３３乃至４０のいずれか一項に記載のオーディオ信号処理装置。
前記利得制御モジュールは、前記の第一および第二の方向表示の少なくとも一方が対応する到来方向が前記正中矢状面から離れていると表示するのに応じて前記オーディオ信号を低減するように構成される請求項３３乃至４０のいずれか一項に記載のオーディオ信号処理装置。
前記装置は、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて第二オーディオ信号を低減させるように構成される第二利得制御モジュールを備え、
前記第二オーディオ信号は、前記の第一および第二の対の内の少なくとも一本のマイクから生成された信号からのオーディオ周波数エネルギを含む、請求項４３に記載のオーディオ信号処理装置。
前記利得制御モジュールは、前記第一の方向表示および前記第二の方向表示が共に対応する到来方向が前記正中矢状面と交差すると示すことに応じて前記オーディオ信号を低減するように構成される請求項３３乃至４０のいずれか一項に記載のオーディオ信号処理装置。
前記装置は、前記出力信号に基づく信号を再生されたオーディオ信号と混合して混合信号を生成するように構成される混合器と、
前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成するように構成されるオーディオ出力段と、を備える、請求項４５に記載のオーディオ信号処理装置。
前記装置は、前記使用者の耳に装着され前記使用者の対応する鼓膜に向けられるスピーカを駆動して前記混合信号に基づくオーディオ信号を生成するように構成されるオーディオ出力段を備える請求項３３乃至４０のいずれか一項に記載のオーディオ信号処理装置。
前記第一の対は、装置の使用中に前記第二の対から少なくとも１０センチメートル離れるように構成される、請求項３３乃至４０のいずれか一項に記載のオーディオ信号処理装置。
機械により読み取られると請求項１乃至１６のいずれか一項の方法を当該機械に実行させる有体的な特徴を備えるコンピュータ可読記憶媒体。