JP6389259B2

JP6389259B2 - マイクロホンアレイを使用した残響音の抽出

Info

Publication number: JP6389259B2
Application number: JP2016534922A
Authority: JP
Inventors: ティエルガルト・オリヴァー; ハーベツ・エマニュエル
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2013-12-11
Filing date: 2014-12-02
Publication date: 2018-09-12
Anticipated expiration: 2034-12-02
Also published as: EP2884491A1; RU2640742C1; EP3080806B1; EP3080806A1; US9984702B2; US20160293179A1; WO2015086377A1; JP2017503388A; CN105981404B; CN105981404A

Description

本発明は、音響分析、立体音響記録、マイクロホンアレイ信号処理、および空間フィルタリングの分野に関する。本発明のいくつかの実施形態は、拡散音フィルタ、すなわち、マイクロホンアレイによる記録から拡散音（残響音）を抽出するためのフィルタのフィルタ係数を決定するために使用することができる方法に関する。いくつかの実施形態は、対応するコンピュータプログラムに関する。いくつかの実施形態は、拡散音フィルタのフィルタ係数を決定するために使用することができる装置に関する。

残響環境におけるマイクロホンアレイによる音声取得は、一般的に、雑音および残響を減衰させながら、音源の直接音を捕捉することを目標とする。多くの用途について、直接音および雑音を抑制しながら残響音も抽出することが可能であることが有益である。たとえば、立体音響再生［Ｐｕｌｋｋｉ２００７、Ｔｈｉｅｒｇａｒｔ２０１３、Ｋｏｗａｌｃｚｙｋ２０１３］において、記録側に存在する残響が、所望の空間的印象を再現するために再生側で再生される必要がある。その上、残響音のある推定値を所与として、様々な他の用途にとって極めて重要な情報を表す、信号対残響比または残響音パワーのようなパラメータを計算することができる。

直接音成分の推定（たとえば、音源分別、脱残響、または雑音低減を使用する）は引用文献においてよく対処されているが、残響音を抽出するための手法はわずかしか存在しない。通常、残響は（時間変動）拡散音場としてモデル化される。拡散音を抽出するために、最近では単一チャネルフィルタ（たとえば、［Ｐｕｌｋｋｉ２００７、Ｔｈｉｅｒｇａｒｔ２０１３］）が使用されているが、これらのフィルタは、複数の音源がアクティブであるとき、または、過渡状信号に対しては性能に乏しい。マルチチャネルフィルタを用いれば、より良好な性能を達成することができる（たとえば、［Ｋｏｗａｌｃｚｙｋ２０１３、Ｔｈｉｅｒｇａｒｔ２０１３ｂ］）。不都合なことに、現在存在するマルチチャネルフィルタは、最適ではなく、拡散音を捕捉するための適切な指向性パターンをもたらさない。

それゆえ、拡散音抽出および／または直接音抑制について性能が改善された拡散音フィルタを提供することが望ましい。また、拡散音フィルタが、直接音成分が到来する方向を除いて、全指向性が高い指向性応答を有することも望ましい場合がある。拡散音はすべての方向からマイクロホンアレイに到来するため、全指向性の高い指向性応答が所望される。

拡散音フィルタのフィルタ係数に対する線形抑圧を規定することを含む方法が提供される。線形抑圧は、第１のマイクロホン信号内の第１の拡散音部分と、第２のマイクロホン信号内の第２の拡散音部分との間の空間コヒーレンスに基づく。第１のマイクロホン信号は、第１のマイクロホンによって捕捉され、第２のマイクロホン信号は、既知の様式で第１のマイクロホンから離間されている第２のマイクロホンによって捕捉される。方法はまた、少なくとも１つの直接音の到来する方向、第１のマイクロホン信号および第２のマイクロホン信号に関する信号統計、ならびに、第１のマイクロホン信号および第２のマイクロホン信号に関する雑音統計のうちの少なくとも１つを計算することも含む。方法は、フィルタ係数に対する線形抑圧を考慮しながら、少なくとも１つの直接音の到来する方向、信号統計および雑音統計の少なくとも１つに関する最適化問題を解くことによって、拡散音フィルタのフィルタ係数を決定することをさらに含む。

実施形態は、コンピュータ上で実行されているときに、上述した方法を実施するためのコンピュータプログラムを提供し、または、信号プロセッサが提供される。

さらなる実施形態は、拡散音フィルタのフィルタ係数に対する線形抑圧を規定するように構成されている線形抑圧計算器を備える装置を提供する。線形抑圧は、第１のマイクロホン信号内の第１の拡散音部分と、第２のマイクロホン信号内の第２の拡散音部分との間の空間コヒーレンスに基づく。第１のマイクロホン信号は、第１のマイクロホンによって捕捉されるかまたは捕捉されており、第２のマイクロホン信号は、既知の様式で第１のマイクロホンから離間されている第２のマイクロホンによって捕捉されるかまたは捕捉されている。装置はまた、少なくとも１つの直接音の到来する方向、第１のマイクロホン信号および第２のマイクロホン信号に関する信号統計、ならびに、第１のマイクロホン信号および第２のマイクロホン信号および第２のマイクロホン信号に関する雑音統計のうちの少なくとも１つを計算するように構成されている統計計算器も含む。装置は、フィルタ係数に対する線形抑圧を考慮しながら、少なくとも１つの直接音の到来する方向、信号統計および雑音統計の少なくとも１つに関する最適化問題を解くことによって、拡散音フィルタのフィルタ係数を決定するように構成されているフィルタ係数計算器をさらに備える。

実施形態は、マイクロホン信号の拡散音部分に関係する少なくとも１つの線形抑圧を考慮に入れながら、拡散音フィルタを決定することができるという洞察に基づく。

以下において、図面を参照して本発明の実施形態をより詳細に説明する。

単一チャネルフィルタを用いて拡散音を抽出するための手法の概略ブロック図である。マルチチャネルフィルタを用いて拡散音を抽出するための手法の概略ブロック図である。第１の実施例による提案されている本発明の概略ブロック図である。第２の実施例による提案されている本発明の概略ブロック図である。第３の実施例による提案されている本発明の概略ブロック図である。図２によるフィルタを用いて拡散音を抽出するための手法からもたらされる集音パターンの一例を示す図である。図４によるフィルタを用いて拡散音を抽出するための手法からもたらされる集音パターンの一例を示す図である。マイクロホンアレイ、および、マイクロホンアレイによって取得される種々の音声信号を概略的に示す図である。

「直接音」および「拡散音」という用語は、以下のように定義される。
直接音：主に特定の突出した方向からマイクロホンに到来する音声。直接音は、たとえば、音源からマイクロホンへと直に進行する音声または特徴的な室内反射を表すことができる。直接音は、たとえば、特定の到来方向を有する平面波または球面波であり得る。直接音の到来方向が分かっているとき、マイクロホン配置が分かっていることを所与として、マイクロホン間の直接音の相対伝達関数を計算することができる。

拡散音：すべての方向からマイクロホンに到来する音声。拡散音は、たとえば、室内に存在する後の残響を表すことができる。一般的に、拡散音と関連付けることができる突出した到来方向はない（等方性音場）、すなわち、音声はすべての方向から等しい平均パワーで到来する。その上、マイクロホン間の拡散音の相対伝達関数は、ランダムで観測不可能であると仮定されなければならない。しかしながら、特定のマイクロホン設定および拡散場仮定について、マイクロホン間の拡散音の平均相対伝達関数は通常分かっているか、または、測定することができる。

以下のサブセクションにおいて、マイクロホン記録から拡散音（または残響音）を抽出するための既存の手法を要約する。以下において、Ｍは使用されるマイクロホンの数を示す。すべてのマイクロホン信号が時間周波数領域に変換されていると仮定し、ｋは周波数インデックスであり、ｎは時間インデックスである（フィルタは一般的に時間領域において適用することもできることに留意されたい）。マイクロホンは、拡散場において伝播するＬ個の平面波（直接音と称される）を捕捉する。ｌ番目の平面波のＤＯＡは、単位ノルムベクトルｎ_ｌ（ｋ，ｎ）によって表される。時間周波数領域において、ｍ番目の（全指向性）マイクロホンの信号は、以下のように記載することができる。

ここで、Ｘ_ｌ（ｋ，ｎ）はｌ番目の平面波の音圧であり、Ｘ_ｄ（ｋ，ｎ，ｄ_ｍ）は拡散音であり、Ｘ_ｎ（ｋ，ｎ，ｄ_ｍ）は定常雑音（たとえば、自己雑音または背景雑音）であり、ｄ_ｍは所与の座標系における（ｍ番目のマイクロホンの）マイクロホン位置を記述するベクトルである。

本発明の目的は、位置ｄ_ｍにおけるＸ_ｄ（ｋ，ｎ，ｄ_ｍ）を推定することである。
単一チャネルフィルタは、単一のマイクロホン信号から拡散音を抽出する（Ｍ＝１）。そのようなフィルタは、たとえば、指向性オーディオコード化［Ｐｕｌｋｋｉ２００７］または仮想マイクロホン［Ｔｈｉｅｒｇａｒｔ２０１３］に使用される。

拡散音の推定値は、たとえば以下のように、マイクロホン信号の１つ、たとえば、第１のマイクロホンのマイクロホン信号Ｘ_１（ｋ，ｎ）に、フィルタＨ（ｋ，ｎ）を乗算することによって求められる。

通常は、フィルタＨ（ｋ，ｎ）は以下によって与えられるウィーナーフィルタであり、

式中、φ_ｄは拡散音のパワーであり、φ_ｕは平面波および定常雑音のパワーである。いくつかの用途において、ウィーナーフィルタの代わりに平方根ウィーナーフィルタ（すなわち、Ｈの平方根）が使用される。Ｈ（ｋ，ｎ）を計算するためには、パワーφ_ｄおよびφ_ｕを推定しなければならないことに留意されたい。この目的のために、たとえば、［Ｔｈｉｅｒｇａｒｔ２０１２］において説明されているように推定することができる信号拡散比（ＳＤＲ）を考慮することができる。代替的に、Ｈ（ｋ，ｎ）は、［Ｐｕｌｋｋｉ２００７、Ｔｈｉｅｒｇａｒｔ２０１３］に記載されているようないわゆる拡散性を推定することによって求めることができる。ＳＤＲまたは拡散性を推定するには、一般的に、２つ以上のマイクロホンが必要とされる。それにもかかわらず、拡散音は最終的に、単一のマイクロホン信号をフィルタリングすることによって得られる。

単一チャネルフィルタを用いて拡散音を抽出するための例示的なシステムが、図１に示されている。第１に、ＳＤＲ（または代替的に拡散性）が、複数のマイクロホン信号から推定される。第２に、フィルタＨ（ｋ，ｎ）が、この情報から計算される。最後に、フィルタＨ（ｋ，ｎ）が単一のマイクロホン信号と乗算されて、拡散音推定値が得られる。

マルチチャネルフィルタはＭ＞１個のマイクロホンを考慮する。そのようなフィルタは、たとえば、［Ｔｈｉｅｒｇａｒｔ２０１３ｂ、Ｋｏｗａｌｃｚｙｋ２０１３］において使用されている。以下の導出において、Ｍ個のマイクロホン信号を、ベクトルｘ（ｋ，ｎ）＝［Ｘ_１（ｋ，ｎ），Ｘ_２（ｋ，ｎ），．．．，Ｘ_ｍ（ｋ，ｎ）］^Ｔによって表すこととする。ｍ番目のマイクロホンにおける拡散音は、Ｍ個のマイクロホン信号の線形結合、すなわち、以下によって推定され、

式中、ｗ_ｍは長さＭの複素荷重ベクトルである。ｗ_ｍの重みは、拡散音の正確な推定値が得られるように計算されなければならない。

適切なフィルタを求めるための単純な方法は、マイクロホン信号に含まれる定常雑音Ｘ_ｎ（ｋ，ｎ，ｄ_ｍ）が最小限に抑えられながらＬ個の平面波が抑制されるように、重みｗ_ｍを計算することである。数学的に表現すると、フィルタ重みは、線形抑圧

を受けて

によって与えられる。

ここで、Φ_ｎは、定常雑音のＰＳＤ行列（パワースペクトル密度行列）、すなわち、

であり、これは、たとえば、拡散音または直接音が存在しないときに既知の手法を用いて推定することができる。その上、ａ_ｌはいわゆる伝搬ベクトルである。その要素は、ｍ番目のマイクロホンから他のマイクロホンへの、ｌ番目の平面波の相対伝達関数である。したがって、ａ_ｌは長さＭの列ベクトルである（ｍ番目のマイクロホンにおける拡散音のみが、Ｍ個のマイクロホン信号のｗ_ｍ、すなわち、重み付き線形結合によって推定され、他のマイクロホンにおける拡散音は、これらの信号がｍ番目のマイクロホンから他のマイクロホンへの相対伝達関数を介して関係付けられ、必要とされる場合にこのように計算され得るため、実質的に冗長であることを想起されたい）。ａ_ｌの要素は、ｌ番目の平面波のＤＯＡに依存する。これは、ａ_ｌがｌ番目の平面波のＤＯＡの関数である、すなわち、ａ_ｌ＝ｆ（ｎ_ｌ）であることを意味する。ａ_ｌは直接音（すなわち、平面波）に依存するため、以下においては直接音抑圧と称される。この空間フィルタによって、実質的に、Ｌ個の平面波の方向に向かってゼロを有する集音パターンを有するビーム形成期が作成される。結果として、すべての平面波が抑制される。不都合なことに、上記最小化問題を解くことによって、ゼロ拘束しかなくなる、すなわち、拡散音を抽出することができないため、ゼロ重みｗ_ｍがもたらされる。

この問題を克服し、ゼロフィルタ重みを回避するために、［Ｔｈｉｅｒｇａｒｔ２０１３ｂ、Ｋｏｗａｌｃｚｙｋ２０１３］は、同じであるが、
（数８）
ｗ^Ｈａ_０（ｋ，ｎ）＝１
によって与えられる追加の拘束を有するフィルタを使用することを提案しており、式中、ａ_０はそこから平面波が到来しない特定のＤＯＡｎ_０に対応する伝搬ベクトルである。この拘束によって、ゼロフィルタ重みは回避されるが、依然として望ましくない直接音は捕捉されない。結果として、このフィルタによって、拡散音および何らかの雑音のみが捕捉され、すべての平面波が減衰される。［Ｔｈｉｅｒｇａｒｔ２０１３ｂ］において、ベクトルａ_０が対応するＤＯＡｎ_０は、平面波のすべてのＤＯＡｎ_ｌ（ｋ，ｎ）に対する最大の角距離を有する方向を選択することによって求められる。たとえば、単一の平面波が０度から到来する場合、ｎ_ｌ（ｋ，ｎ）は１８０度に対応する。不都合なことに、ＤＯＡｎ_０は、可能な限り小さい雑音を有する拡散音推定値が得られることを保証しない。その上、結果としてもたらされる集音パターンは、より高い周波数においては指向性が高くなるため、拡散音を捕捉するにはそれほど最適ではない。これは、すべての方向から拡散音を捕捉することを目標とすると、欠点である。

結果としてもたらされる集音パターンの一例が図６に示されている。ここで、２つの直接音が、方位５１°および９７°から到来する。この図は、５ｃｍのマイクロホン間隔で１６個のマイクロホンを有する均一な線形アレイを使用したときに、２．８ｋＨｚの周波数において結果としてもたらされる集音パターンを示している。この集音パターンは、まさに５１°および９７°についてゼロを保持し、１８０°について高い利得を保持し、これは方向ｎ_０に対応する。その上、集音パターンは、ほぼすべての他の方向について、複数の他の空間的ゼロ値または低利得を有する。この集音パターンは、すべての方向から到来する拡散音を捕捉するのには適していない。ここでも、直接音抑圧ａ_ｌが直接音のＤＯＡに直に関係することに留意されたい。このサブセクションにおける空間フィルタでは達成することができない所望の集音パターンが、図７に示されている。この集音パターンは、直接音のＤＯＡについて２つの空間的ゼロ値を有するが、他の態様ではほぼ全指向性である。この集音パターンは、図７に関連して下記に説明する、提案されているフィルタを使用することによって達成される。

上記拘束を所与としてフィルタ重みｗ_ｍを計算するための閉形式解を、［ＶａｎＴｒｅｅｓ２００２］に見出すことができる。空間フィルタを計算するためには、Ｌ個の平面波のＤＯＡを知らなければならない、すなわち、直接音抑圧ａ_ｌおよびａ_０を計算しなければならない。このＤＯＡ情報は、ＲｏｏｔＭＵＳＩＣまたはＥＳＰＲＩＴのような、既知の狭帯域ＤＯＡ推定器を用いて決定することができる。ａ_０の要素は一般的に複素数であり、平面波のＤＯＡは時間変動性が高いと仮定されなければならないため、ａ_０は一般的に、各ｋおよびｎについて計算し直される必要があることにさらに留意されたい。変動の多いａ_０は可聴アーティファクトをもたらす可能性がある。

提示されているマルチチャネルフィルタを用いて拡散音を抽出するための例示的なシステムが、図２に示されている。マイクロホン信号を時間周波数領域に変換した後、定常雑音およびＬ個の平面波のＤＯＡを推定する。その後、ＤＯＡ情報から、Ｍ＋１個の線形直接音抑圧（ａ_ｌおよびａ_０）が得られる。この情報に基づいて、フィルタ重みを計算することができる。これらの重みをマイクロホン信号に適用することによって、拡散音の所望の推定値がもたらされる。この記述から、得られるフィルタは直接音（すなわち、それぞれ、ＤＯＡおよびマイクロホン間の平面波の対応する相対伝達関数）にのみ依存し、拡散音には依存しないことが明らかである。これは、フィルタが、たとえ拡散音の推定に使用されるとしても、拡散音に関する利用可能である可能性がある情報を考慮しないことを意味する。

本発明において、上述したフィルタの制約を克服する、残響音を抽出するための新規のマルチチャネルフィルタを提案する。提案される空間フィルタは、空間的ゼロ値を呈する直接音の到来方向（ＤＯＡ）を除き、全指向性パターンである傾向にある指向性パターンを特徴とする。これは、少ない歪みですべての方向から拡散音を捕捉するための、非常に所望されている特性を表す。

以下において、Ｍ＞１個のマイクロホンを用いて、位置ｄ_ｍにおける拡散音Ｘ_ｄ（ｋ，ｎ，ｄ_ｍ）を推定するためのマルチチャネルフィルタを提案する。上述したマルチチャネルフィルタに関して、ｍ番目のマイクロホンにおける拡散音圧は、マイクロホン信号の線形結合、すなわち、以下を実施することによって推定される。

以下において提案される重みベクトルｗｍが、特定のコスト関数を最小限に抑え、上述したマルチチャネルフィルタと同様に線形抑圧される。

しかしながら、上述したマルチチャネルフィルタとは対照的に、本発明では、直接音（すなわち、Ｌ個の平面波）に依存しない線形抑圧を使用することを提案する。より正確には、提案される新規の拘束は、それぞれ、平面波のＤＯＡの関数またはマイクロホン間の平面波の対応する相対伝達関数ではない。

対照的に、提案される新規の拘束は、拡散音に関する統計情報に依存する、すなわち、提案される新規の拘束は、マイクロホン間の拡散音の相対伝達関数に依存する。以下において、提案される新規の拘束がマイクロホン間の拡散音のコヒーレンスまたは相関の関数であることを示す。このコヒーレンスは、マイクロホン間の拡散音の平均相対伝達関数に対応する。

提案される空間フィルタは、拡散音に対する歪みのない拘束を満足しながら特定のコスト関数を最小限に抑えることによって得られる。この拘束は、マイクロホン間の拡散音の相対伝達関数に対応する。数学的に表現すると、フィルタは、線形抑圧
（数１０）
ｗ^Ｈｂ_ｍ（ｋ，ｎ）＝１
を受けて

として計算される。

ここで、Ｊはフィルタによって最小化されるべきコスト関数である。コスト関数は、たとえば、フィルタ出力における定常雑音パワー、フィルタ出力における干渉エネルギー、または、推定拡散音の二乗誤差であり得る。Ｊの例を、これらの実施形態において与える。抑圧ベクトルｂ_ｍは、ｂ_ｍ（ｋ，ｎ）＝［Ｂ_１，ｍ（ｋ，ｎ），Ｂ_２，ｍ（ｋ，ｎ），．．．，Ｂ_Ｍ，ｍ（ｋ，ｎ）］^Ｔによって与えられる。ｍ’番目の要素Ｂ_ｍ’，ｍはマイクロホンｍとｍ’との間の拡散音の相対伝達関数である。この相対伝達関数は以下によって与えられる。

ｂ_ｍのｍ番目の要素は１に等しいことに留意されたい。この拘束によって、歪みなしに拡散音が捕捉される。事実、ｘ_ｄ（ｋ，ｎ）＝［Ｘ_ｄ（ｋ，ｎ，ｄ_１），Ｘ_ｄ（ｋ，ｎ，ｄ_２），．．．，Ｘ_ｄ（ｋ，ｎ，ｄ_Ｍ）］^Ｔを、記録される拡散音を含むベクトルとする。上記式を用いて、このベクトルは、
（数１３）
ｘ_ｄ（ｋ，ｎ）＝ｂ_ｍ（ｋ，ｎ）Ｘ_ｄ（ｋ，ｎ，ｄ_ｍ）
と記載することができる。

フィルタの出力における拡散音はｗ^Ｈ（ｋ，ｎ）ｘ_ｄ（ｋ，ｎ）によって与えられ、ｗ^Ｈｂ_ｍ（ｋ，ｎ）＝１であるため、Ｘ_ｄ（ｋ，ｎ，ｄ_ｍ）と同一である。それゆえ、このフィルタは、歪みなしに拡散音を捕捉する。ｂ_ｍにおける相対伝達関数は、基本的にランダムである、すなわち、各ｋおよびｎについて伝達関数には異なる具現化があるため、一般的に実際には推定することができない。したがって、実際には、Ｂ_ｍ’，ｍは、マイクロホンｍとｍ’との間の平均相対伝達関数、すなわち、
（数１４）
Ｂ_ｍ’，ｍ（ｋ，ｎ）＝γ_ｍ’，ｍ（ｋ，ｎ）
として計算される。

これは、相対伝達関数γ_ｍ’，ｍがマイクロホンｍとｍ’との間の拡散音のいわゆる空間コヒーレンスに対応する。空間コヒーレンスは以下のように定義され、

式中、（・）＊は複素共役を示す。この空間コヒーレンスは、周波数領域におけるマイクロホンｍとｍ’との間の拡散音の相関を記述する。このコヒーレンスは、特定の拡散音場に依存する。コヒーレンスは、所与の部屋について前もって測定することができる。代替的に、コヒーレンスは、特定の拡散音場の理論から分かる［Ｅｌｋｏ２００１］。たとえば、実際に仮定され得ることが多い球状等方性拡散音場について、以下のようになり、

式中、ｓｉｎｃはシンク関数を示し、ｆは所与の周波数帯域ｋの音響周波数であり、ｃは音声の速度である。その上、γ_ｍ’，ｍはマイクロホンｍとｍ’との間の距離である。空間コヒーレンスを、マイクロホン間の拡散音の平均相対伝達関数を表す線形抑圧Ｂ_ｍ’，ｍとして使用するとき、得られるフィルタは多くの線形抑圧される空間フィルタの合計と等価であり、これらのフィルタの各々が、歪みのないランダムな拡散音の異なる具現化を捕捉する。

上記で紹介した拡散音抑圧によって、すべての方向から等しく良好に拡散音を捕捉する空間フィルタが得られる。これは、主に１つの方向、すなわち、選択される伝搬ベクトルａ_０が対応する方向から音声を捕捉する、上述したマルチチャネルフィルタとは対照的である。

拡散音抑圧ｂ_ｍは、直接音抑圧ａ_ｌおよびａ_０とは概念的にかなり異なることに留意されたい。それゆえ、このセクションにおいて提案されている新規のフィルタは、上述したマルチチャネルフィルタと比較して、概念的にかなり異なる。

提案されている発明がブロック形式で図３に示されている。第１に、Ｍ個のマイクロホン信号がフィルタバンク（ＦＢ）を使用して時間周波数領域（または信号処理に適した別の領域）に変換される（１０１）。第２に、ブロック（１０２）において、線形拡散音抑圧ベクトルｂ_ｍを計算する。拡散音抑圧ベクトルは、信号から推定されるか、または、たとえば、前述したような特定の仮定される拡散場の理論的空間コヒーレンスに対応するかのいずれかである。ブロック（１０４）において、マイクロホン信号から特定の統計（たとえば、雑音統計）を推定する。通常はＰＳＤ行列Φ（ｋ，ｎ）として表されるこの情報は、フィルタによって最小化されなければならないコスト関数Ｊを生成するために使用される。拡散音抑圧を受けてコスト関数を最小化するフィルタ重みがブロック（１０３）において計算される。最後に、重みがマイクロホン信号に適用されて、所望の拡散音推定値がもたらされる。本発明の特定の具現化を、以下の実施形態において提示する。

拡散音抑圧を満足する出力パワーの最小化
この実施形態では、拡散音抑圧を受けてフィルタの出力全体を最小化する空間フィルタを定義する。拡散音抑圧は、残りの信号部分（望ましくない定常雑音および平面波）が最小限に抑えられながら、拡散音が空間フィルタによって保持されることを保証する。フィルタ重みｗ_ｍは、線形抑圧
（数１７）
ｗ^Ｈｂ_ｍ（ｋ，ｎ）＝１
を受けて

として計算される。

このフィルタに対する閉形式解は、［ＶａｎＴｒｅｅｓ２００２］によって与えられる。

ここで、Φ_ｘはマイクロホン信号のＰＳＤ行列であり、これは
（数２０）
Φ_ｘ（ｋ，ｎ）＝Ｅ｛ｘ（ｋ，ｎ）ｘ^Ｈ（ｋ，ｎ）｝
として計算することができ、式中、ｘ（ｋ，ｎ）はマイクロホン信号を含むベクトルである。実際には、この予測は、たとえば、時間平均によって近似される。その上、抑圧ベクトルｂ_ｍ（ｋ，ｎ）＝［Ｂ_１，ｍ（ｋ，ｎ），Ｂ_２，ｍ（ｋ，ｎ），．．．，Ｂ_Ｍ，ｍ（ｋ，ｎ）］^Ｔの要素は、マイクロホンｍとｍ’との間の拡散音の空間コヒーレンス、すなわち、
（数２１）
Ｂ_ｍ’，ｍ（ｋ，ｎ）＝γ_ｍ’，ｍ（ｋ，ｎ）
に対応する。

実際、空間コヒーレンスは前もって推定することができるか、または、理論値を仮定することができるため、空間コヒーレンスＢ_ｍ’，ｍは時間に依存する（すなわち、Ｂ_ｍ’，ｍ（ｋ，ｎ）＝Ｂ_ｍ’，ｍ（ｋ））必要はない。空間コヒーレンスは、

を使用して（拡散音のみが存在する期間の間に）マイクロホン信号から推定されるか、または、特定の拡散音場を仮定して事前情報として与えられるかのいずれかであり得る。後者の場合、たとえば、球状等方性拡散音場の空間コヒーレンス、すなわち、以下を使用する。

このシンク関数は、仮定される音場に応じて他の関数に置き換えられる場合があることに留意されたい。種々の拡散音場に対して、事前に分かっている種々のコヒーレンス関数が存在する。例は［Ｅｌｋｏ２００１］に見出され得る。

この実施形態は、図３にブロック形式で示されている。フィルタバンクを用いてマイクロホン信号を変換した後（１０１）、信号統計推定ブロック（１０４）において、信号ＰＳＤ行列Φ_ｘを計算する。その上、ブロック（１０２）において、この信号から、または、特定の拡散音場を仮定した事前情報を使用してのいずれかで、線形拡散音抑圧ベクトルｂ_ｍを計算する。その後、ブロック（１０３）においてフィルタ重みが計算される。これらの重みをマイクロホン信号と乗算することによって、拡散音の所望の推定値がもたらされる。

この実施形態において計算されるフィルタは、他の空間フィルタ（たとえば、背景技術に記載されているフィルタ）と比較して、以下の利点を有する。
出力信号全体を最小化するため、フィルタは、Ｌ個の平面波の減衰と定常雑音との間の最適なトレードオフをもたらす。

必要とされる信号ＰＳＤ行列Φ_ｘ、したがってフィルタが、実践において容易に計算される。
Ｌ個の平面波のＤＯＡ情報が必要ない。

線形抑圧最小分散フィルタ
この実施形態は、図２に関連して上述したマルチチャネルフィルタの、新規の手法と現行の技術水準の手法との組み合わせを表す。この実施形態では、拡散拘束および追加の指向性拘束を受けてフィルタ出力における定常雑音を最小限に抑える線形抑圧空間フィルタを定義する。フィルタ重みｗ_ｍは、線形抑圧
（数２４）
ｗ^Ｈｂ_ｍ（ｋ，ｎ）＝１
および

を受けて

として計算される。

明快に、フィルタは、出力において定常雑音のみを最小限に抑える。望ましくない平面波は、第２の線形抑圧（図２のマルチチャネルフィルタについて上記で説明したような）を用いて抑制される。図３による出力パワー最小化フィルタと比較して、これらの追加の拘束は、干渉平面波のさらにより強い抑制を保証する。結果としてもたらされるフィルタは、第１の線形抑圧に起因して依然として拡散音を保持する。実際に計算することができる、このフィルタに対する閉形式解は、以下によって与えられる。

ここで、ベクトルＣ＝［ｂ_ｍ，ａ_１，ａ_２，．．．，ａ_Ｌ］は、上記で定義された線形抑圧を含む拘束行列であり、ｇ＝［１，Ｏ］（Ｏは長さＬの０ベクトルである）が対応する応答である。図２に示すマルチチャネルフィルタについて、ベクトルａ_ｌは、Ｌの平面波のＤＯＡに依存し、引用文献［ＶａｎＴｒｅｅｓ２００２］から既知であるように計算することができる、対照的に、ｂ_ｍの要素は、マイクロホン間の拡散音の相関またはコヒーレンスを記述する。ｂ_ｍの要素は、図３に関連して説明したように計算される。その上、Φ_ｎは定常雑音のＰＳＤ行列である。このＰＳＤ行列は、たとえば、音声が中断している間に推定することができる。複数の異なるマイクロホンにおける定常雑音が相互に独立している場合、単純に、Φ_ｎをＭ×Ｍサイズの恒等行列に置き換えることができる。

この実施形態は、図４にブロック形式で示されている。フィルタバンクを用いてマイクロホン信号を変換した後（１０１）、雑音統計推定ブロック（１０４）において、定常雑音のＰＳＤ行列Φ_ｎを計算する。その上、ブロック（１０２）において、この信号から、または、特定の拡散音場を仮定した事前情報を使用してのいずれかで、線形拡散音抑圧ｂ_ｍを計算する。ブロック（１０５）において、Ｌ個の平面波のＤＯＡを推定する。この情報から、ブロック（１０６）において直接音抑圧ａ_ｌを計算する。計算された情報はフィルタ計算ブロック（１０３）に供給され、フィルタ計算ブロックは、上記で提示した閉形式解を用いてフィルタ重みｗ_ｍを計算する。これらの重みをマイクロホン信号と乗算することによって、拡散音の所望の推定値がもたらされる。

このフィルタについて結果としてもたらされる集音パターンの一例が図７に示されている。ここで、２つの直接音が、方位５１°および９７°から到来する。この図は、５ｃｍのマイクロホン間隔で１６個のマイクロホンを有する均一な線形アレイを使用したときに、２．８ｋＨｚの周波数において結果としてもたらされる集音パターンを示している。この集音パターンは、まさに５１°および９７°についてゼロを保持する。それ以外について、これはほぼ全指向性である。これは、図６の空間フィルタをもたらす、図２に示す現行の技術水準の空間フィルタにまさる大きな利点である。

この実施形態において計算されるフィルタは、他の空間フィルタ（たとえば、背景技術に記載されているフィルタ）と比較して、以下の利点を有する。
直接音抑圧に起因して平面波が強く減衰する。
拡散音を捕捉するために所望される、ほぼ全指向性の集音パターン。

組み合わせ手法
図３および図４に示す空間フィルタは、一般的に、実践において良好な性能をもたらす。しかしながら、それらにはまた、特定の欠点もある。たとえば、図３のフィルタは一般的に、直接音を完全には抑制しない。直接音の残りのパワーが、立体音響再生中の望ましくない影響をもたらす可能性がある。対照的に、図４の空間フィルタは、低周波数において定常雑音に対するロバスト性が相対的に乏しい。以下において、図３および図４の空間フィルタを、欠点を軽減しながら両方の空間フィルタの利点を活かすために組み合わせる。結果として、良好な干渉抑制（直接音抑制）および定常雑音に対する高いロバスト性を特徴とする空間フィルタが得られる。

以下において提案される手法は、いわゆる最小平均二乗誤差（ＭＭＳＥ）空間フィルタと図３の空間フィルタとの間でスケーリングすることができる、いわゆるパラメトリックマルチチャネルウィーナーフィルタ（ＰＭＷＦ）を表す。加えて、図４の空間フィルタが、特定の必要とされる量を推定するために使用される。

提案されているＰＭＷＦの重みベクトルは、

を受けて

として計算され、式中、σ_２は、推定される拡散音の最大二乗絶対誤差である。

この最適化問題を解くことによって、以下がもたらされる。

式中、以下のように定義される。

ここで、α∈［０，１］はユーザ定義の制御パラメータである。α＝０について、推定される拡散音の平均二乗誤差を最小化するＭＭＳＥ空間フィルタが得られる。α＝１について、図３において提案されている空間フィルタが得られる。それらの間のα値について、これら２つの空間フィルタの間のスケーリングが得られる。αが小さくなるほど、より良好な雑音および干渉の抑制がもたらされ、一方で、αが高くなるほど、より歪みの少ない拡散音推定値がもたらされる。ｂ_ｍの要素は、図３に関連して説明したように計算されることに留意されたい。拡散音のパワーφ_ｄは、平面波の非常に良好な抑制をもたらす、図４において提案されている空間フィルタを用いて計算することができる。ｗ_１が、第１のマイクロホンにおける拡散音を推定するための図４の空間フィルタを示すものとする。ｗ_１を所与として、第１のマイクロホンにおける拡散音パワーは、たとえば、［Ｔｈｉｅｒｇａｒｔ２０１３ｂ］に記載されているように、すなわち、以下のように、

または、［Ｋｏｗａｌｃｚｙｋ２０１３］において説明されているような判定指向形手法を用いて得ることができる。先行する式において、Γ_ｄは、拡散音のＭ×Ｍ空間コヒーレンス行列である。Γ_ｄの（ｍ，ｍ’）番目の要素は、マイクロホンｍとｍ’との間の空間コヒーレンスγ_ｍ’，ｍである。この空間コヒーレンスγ_ｍ’，ｍは、上記ですでに定義されている。

この実施形態は、図５にブロック形式で示されている。フィルタバンクを用いてマイクロホン信号を変換した後（１０１）、ブロック（１０４）において、マイクロホンＰＳＤ行列Φ_ｘおよび雑音ＰＳＤ行列Φ_ｎを計算する。その上、ブロック（１０２）において、この信号から、または、特定の拡散音場を仮定した事前情報を使用してのいずれかで、線形拡散音抑圧ｂ_ｍを計算する。ブロック（１０５）において、Ｌ個の平面波のＤＯＡを推定する。この情報から、ブロック（１０６）において直接音抑圧ａ_ｌを計算する。これらの拘束が（１０７）においてΦ_ｎとともに使用されて、重みｗ_１が計算される。拡散音φ_ｄのパワーが、（１０８）においてｗ_１およびΦ_ｎから計算される。その後、空間フィルタの最終的な重みｗ_ｍを、（１０３）において、φ_ｄ、Φ_ｘ、およびｂ_ｍを使用して計算することができる。パラメータαを用いて、空間フィルタを、ＭＭＳＥフィルタとＰＭＷＦとの間でスケーリングすることができる。重みｗ_ｍをマイクロホン信号と乗算することによって、拡散音の所望の推定値がもたらされる。

図８は、Ｍ個のマイクロホンを備えるマイクロホンアレイを概略的に示す。マイクロホンアレイは、直接音部分および拡散音部分を含む音場に晒される。直接音部分は、図８においてはＬ個の音源Ｘ_ｌ＝１〜Ｘ_ｌ＝Ｌとして表されており、これらの各々が、マイクロホンアレイの位置において実質的に平面波を生成すると仮定される。各平面波（マイクロホンアレイの位置にある）の伝播方向は、図８においてベクトルｎ_１〜ｎ_Ｌによって示されている。直接音部分は一般的に、位置ｄ_ｍの関数である。拡散音Ｘ_ｄ（ｋ，ｎ，ｄ_ｍ）は、たとえば、室内の残響をモデル化することができる。拡散音は、ランダムな位相、ランダムな振幅、およびランダムなＤＯＡを有する平面波の無限和によって生成されると仮定される。これは、拡散音が、音響シーンにわたってランダムに分散している無限数の音源によって生成されることを意味する。これらの音源は、後の残響を生成する無限数の室内反射をモデル化する。

たとえば、ｍ番目のマイクロホンの個々のマイクロホン信号Ｘ_ｍ（ｋ，ｎ）は、Ｌ個の直接音部分Ｘ_ｌ＝１〜Ｘ_ｌ＝Ｌ，、拡散音部分Ｘ_ｄ、および雑音Ｘ_ｎの組み合わせであり、すなわち、以下のようになる。

ｍ番目のマイクロホンに対する他のマイクロホン間の拡散音の相対伝達関数Ｂ_１，ｍ，Ｂ_２，ｍ，．．．，Ｂ_ｍ’，ｍ，．．．，Ｂ_Ｍ，ｍが、図８に概略的に示されている。ｍ番目のマイクロホンからそれ自体への相対伝達関数Ｂ_ｍ，ｍ（図８には示されていない）は、一般的に１に等しい。

以下のリストは、上述した態様のいくつかの簡潔な通覧を与える。
少なくとも２つのマイクロホン信号を受信する。
マイクロホン信号を、時間周波数領域または別の適切な領域に変換する。
マイクロホン間の拡散音の相関またはコヒーレンスの関数としての線形拡散音抑圧を計算する。
信号統計および／または雑音統計を計算する。

いくつかの実施形態においては、直接音のＤＯＡを推定し、マイクロホン間の直接音の相対伝達関数を表す直接音抑圧を計算する。

いくつかの実施形態においては、補助フィルタを計算し、拡散音のパワーを推定する。
拡散音抑圧を考慮することによって、得られた信号／雑音統計および任意選択の拡散音パワー情報を使用して拡散音を抽出するための空間フィルタの重みを計算する。
計算された空間フィルタの重みを使用してマイクロホン信号の線形結合を実施する。

いくつかの態様が装置の文脈において説明されているが、これらの態様は対応する方法の説明をも表すことは明らかであり、ブロックまたはデバイスが、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈において説明されている態様は、対応する装置の対応するブロックまたは項目または特徴の説明をも表す。

特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアにおいて実装することができる。実施態様は、それぞれの方法が実施されるようにプログラム可能コンピュータシステムと協働する（または協働することが可能である）、電子可読制御信号を記憶されているデジタル記憶媒体、たとえば、フロッピーディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリを使用して実施することができる。

本発明によるいくつかの実施形態は、本明細書に記載されている方法の１つが実施されるように、プログラム可能コンピュータシステムと協働することが可能である、電子可読制御信号を有する持続性データキャリアを含む。

一般的に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で作動すると、方法の１つを実施するように動作可能である。プログラムコードは、たとえば、機械可読キャリア上に記憶されてもよい。

他の実施形態は、機械可読キャリア上に記憶されている、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを含む。

言い換えれば、本発明の方法の一実施形態は、それゆえ、コンピュータプログラムがコンピュータ上で作動すると、本明細書に記載されている方法の１つを実施するためのプログラムコードを有するコンピュータプログラムである。

それゆえ、本発明の方法のさらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを記録されて含むデータキャリア（またはデジタル記憶媒体、もしくはコンピュータ可読媒体）である。

それゆえ、本発明の方法のさらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを表すデータストリームまたは信号系列である。データストリームまたは信号系列は、たとえば、データ通信接続、たとえば、インターネット上を介して転送されるように構成されてもよい。

さらなる実施形態は、本明細書に記載されている方法の１つを実施するように構成または適合されている処理手段、たとえば、コンピュータまたはプログラム可能論理デバイスを含む。

さらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムをインストールされているコンピュータを含む。

いくつかの実施形態において、プログラム可能論理デバイス（たとえば、フィールドプログラマブルゲートアレイ）が、本明細書に記載されている方法の機能のいくつかまたはすべてを実施するために使用されてもよい。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、本明細書に記載されている方法の１つを実施するためにマイクロプロセッサと協働してもよい。一般的に、方法は、任意のハードウェア装置によって実施されることが好ましい。

上述した実施形態は、本発明の原理の例示にすぎない。本明細書に記載されている構成および詳細の修正および変形が当業者には了解されることが理解される。それゆえ、本明細書において実施形態の記述および説明として提示されている特定の詳細によってではなく、添付の特許請求項の範囲にみによって限定されることが意図されている。

引用文献
［Ｐｕｌｋｋｉ２００７］Ｖ．Ｐｕｌｋｋｉ，「Ｓｐａｔｉａｌｓｏｕｎｄｒｅｐｒｏｄｕｃｔｉｏｎｗｉｔｈｄｉｒｅｃｔｉｏｎａｌａｕｄｉｏｃｏｄｉｎｇ」，Ｊ．ＡｕｄｉｏＥｎｇ．Ｓｏｃ，Ｖｏｌ．５５，Ｎｏ．６，ｐｐ．５０３−５１６，Ｊｕｎｅ２００７．

［Ｔｈｉｅｒｇａｒｔ２０１３］Ｏ．Ｔｈｉｅｒｇａｒｔ，Ｇ．ＤｅｌＧａｌｄｏ，Ｍ．Ｔａｓｅｓｋａ，ａｎｄＥ．Ｈａｂｅｔｓ，「Ｇｅｏｍｅｔｒｙ−ｂａｓｅｄｓｐａｔｉａｌｓｏｕｎｄａｃｑｕｉｓｉｔｉｏｎｕｓｉｎｇｄｉｓｔｒｉｂｕｔｅｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓ」，Ａｕｄｉｏ，Ｓｐｅｅｃｈ，ａｎｄＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎ，Ｖｏｌ．２１，Ｎｏ．１２，ｐｐ．２５８３−２５９４，Ｄｅｃｅｍｂｅｒ２０１３．

［Ｋｏｗａｌｃｚｙｋ２０１３］Ｋ．Ｋｏｗａｌｃｚｙｋ，Ｏ．Ｔｈｉｅｒｇａｒｔ，Ａ．Ｃｒａｃｉｕｎ，ａｎｄＥ．Ａ．Ｐ．Ｈａｂｅｔｓ，「Ｓｏｕｎｄａｃｑｕｉｓｉｔｉｏｎｉｎｎｏｉｓｙａｎｄｒｅｖｅｒｂｅｒａｎｔｅｎｖｉｒｏｎｍｅｎｔｓｕｓｉｎｇｖｉｒｔｕａｌ」，ｉｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇｔｏＡｕｄｉｏａｎｄＡｃｏｕｓｔｉｃｓ（ＷＡＳＰＡＡ），２０１３ＩＥＥＥＷｏｒｋｓｈｏｐｏｎ，Ｏｃｔｏｂｅｒ２０１３．

［Ｔｈｉｅｒｇａｒｔ２０１３ｂ］Ｏ．ＴｈｉｅｒｇａｒｔａｎｄＥ．Ａ．Ｐ．Ｈａｂｅｔｓ，「ＡｎｉｎｆｏｒｍｅｄＬＣＭＶｆｉｌｔｅｒｂａｓｅｄｏｎｍｕｌｔｉｐｌｅｉｎｓｔａｎｔａｎｅｏｕｓｄｉｒｅｃｔｉｏｎ−ｏｆ−ａｒｒｉｖａｌｅｓｔｉｍａｔｅｓ」，ｉｎＡｃｏｕｓｔｉｃｓＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），２０１３ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎ，２０１３，ｐｐ．６５９−６６３．

［Ｔｈｉｅｒｇａｒｔ２０１２］Ｏ．Ｔｈｉｅｒｇａｒｔ，Ｇ．Ｄ．Ｇａｌｄｏ，ａｎｄＥ．Ａ．Ｐ．Ｈａｂｅｔｓ，「Ｏｎｔｈｅｓｐａｔｉａｌｃｏｈｅｒｅｎｃｅｉｎｍｉｘｅｄｓｏｕｎｄｆｉｅｌｄｓａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｔｏｓｉｇｎａｌ−ｔｏ−ｄｉｆｆｕｓｅｒａｔｉｏｅｓｔｉｍａｔｉｏｎ」，ＴｈｅＪｏｕｒｎａｌｏｆｔｈｅＡｃｏｕｓｔｉｃａｌＳｏｃｉｅｔｙｏｆＡｍｅｒｉｃａ，ｖｏｌ．１３２，ｎｏ．４，ｐｐ．２３３７−２３４６，２０１２．

［ＶａｎＴｒｅｅｓ２００２］Ｈ．Ｌ．ＶａｎＴｒｅｅｓ，Ｄｅｔｅｃｔｉｏｎ，Ｅｓｔｉｍａｔｉｏｎ，ａｎｄＭｏｄｕｌａｔｉｏｎＴｈｅｏｒｙ：ＰａｒｔＩＶ：ＡｒｒａｙＰｒｏｃｅｓｓｉｎｇ．ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ａｐｒｉｌ２００２，ｖｏｌ．１．

［Ｅｌｋｏ２００１］Ｇ．Ｗ．Ｅｌｋｏ，「Ｓｐａｔｉａｌｃｏｈｅｒｅｎｃｅｆｕｎｃｔｉｏｎｓｆｏｒｄｉｆｆｅｒｅｎｔｉａｌｍｉｃｒｏ−ｐｈｏｎｅｓｉｎｉｓｏｔｒｏｐｉｃｎｏｉｓｅｆｉｅｌｄｓ」，ｉｎＭｉｃｒｏｐｈｏｎｅＡｒｒａｙｓ：ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＴｅｃｈｎｉｑｕｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，ｅｄｉｔｅｄｂｙＭ．ＢｒａｎｄｓｔｅｉｎａｎｄＤ．Ｗａｒｄ，ｃｈａｐｔｅｒ４，６１−８５（Ｓｐｒｉｎｇｅｒ，Ｂｅｒｌｉｎ）（２００１）．

Claims

拡散音フィルタのためのフィルタ係数を取得する方法であって、
第１のマイクロホンによって捕捉される第１のマイクロホン信号内の第１の拡散音部分と、既知の様式で前記第１のマイクロホンから離間されている第２のマイクロホンによって捕捉される第２のマイクロホン信号内の第２の拡散音部分との間の空間コヒーレンスに基づいて、前記拡散音フィルタの前記フィルタ係数に対する線形抑圧を規定することと、
少なくとも１つの直接音の到来する方向、前記第１のマイクロホン信号および前記第２のマイクロホン信号に関する信号統計、ならびに、前記第１のマイクロホン信号および前記第２のマイクロホン信号に関する雑音統計のうちの少なくとも１つを計算することと、
前記フィルタ係数に対する前記線形抑圧を考慮しながら、前記少なくとも１つの直接音の前記到来する方向、前記信号統計および前記雑音統計の前記少なくとも１つに関する最適化問題を解くことによって、前記拡散音フィルタの前記フィルタ係数を決定することと
を含むことを特徴とする、拡散音フィルタのためのフィルタ係数を取得する方法。
前記第１のマイクロホンと前記第２のマイクロホンとの間の拡散音部分の相対伝達関数または相関に基づいて前記空間コヒーレンスを与えることをさらに含む、請求項１に記載の方法。
前記空間コヒーレンスは、所与の環境に直接音が存在しない期間の間の、前記環境の前記拡散音部分の相対伝達関数または相関の事前測定値に基づく、請求項２に記載の方法。
前記空間コヒーレンスは、拡散音に関する理論的関係に基づき、対応する、仮定される拡散音場は、前記第１のマイクロホンと前記第２のマイクロホンとの間の前記拡散音部分の相関に関する、仮定される理論的特性を有する、請求項２に記載の方法。
前記最適化問題は、前記線形抑圧
（数１）
ｗ^Ｈｂ_ｍ（ｋ，ｎ）＝１
を受けて

によって表され、式中、
ｗ（ｋ，ｎ）は前記拡散音フィルタの前記フィルタ係数のベクトルであり、
ｗ_ｍ（ｋ，ｎ）はｍ番目のマイクロホンにおけるマイクロホン信号の評価に基づく前記最適化問題の解であり、
Ｊ（ｗ）はコスト関数であり、
ｂ_ｍ（ｋ，ｎ）は推定空間コヒーレンスのベクトルであり、前記ベクトルのｍ’番目の要素は、前記ｍ番目のマイクロホンとｍ’番目のマイクロホンとの間の拡散音部分の推定空間コヒーレンスであり、
ｋは周波数領域インデックスであり、
ｎは時間領域インデックスである、
請求項１〜４のいずれか一項に記載の方法。
前記コスト関数Ｊ（ｗ）は、雑音統計、雑音パワースペクトル密度（ＰＳＤ）行列、信号統計、またはマイクロホンパワースペクトル密度（ＰＳＤ）行列の１つに基づく、請求項５に記載の方法。
少なくとも１つの直接音の到来方向、または、前記第１のマイクロホンと前記第２のマイクロホンとの間の前記少なくとも１つの直接音の相対伝達関数の少なくとも１つを推定することと、
前記少なくとも１つの直接音の前記到来方向または前記相対伝達関数を使用して少なくとも１つの直接音抑圧を計算することであって、前記少なくとも１つの直接音抑圧の結果として、前記少なくとも１つの直接音が抑制されることになる、計算することと
をさらに含む、請求項１〜６のいずれか一項に記載の方法。
前記最適化問題に対する解は以下の通りであり、

ここで、

式中、
ｗ_ｍ（ｋ，ｎ）はｍ番目のマイクロホンにおけるマイクロホン信号の評価に基づく前記最適化問題の解であり、
ｂ_ｍ（ｋ，ｎ）は推定空間コヒーレンスのベクトルであり、前記ベクトルのｍ’番目の要素は、前記ｍ番目のマイクロホンとｍ’番目のマイクロホンとの間の拡散音部分の推定空間コヒーレンスであり、
α∈［０，１］は、それによって前記拡散音フィルタを、最小平均二乗誤差空間フィルタと、前記拡散音フィルタの前記フィルタ係数に対する線形抑圧を満足する出力パワーを最小化するフィルタとの間でスケーリングすることができる、ユーザ定義の制御パラメータであり、
φ_ｄは拡散音パワーであり、
Φ_ｘは前記マイクロホン信号のパワースペクトル行列である、
請求項１〜７のいずれか一項記載の方法。
補助拡散音フィルタに基づいて、前記拡散音パワーφ_ｄを推定することをさらに含む、請求項８に記載の方法。
前記拡散音パワーφ_ｄは以下に基づいて実施され、

式中、

は、前記拡散音パワーφ_ｄの推定値を与える推定拡散音パワーであり、
ｗ_１は前記補助拡散音フィルタのフィルタ係数のベクトルであり、
Φ_ｘは前記マイクロホン信号のパワースペクトル密度行列であり、
Φ_ｎは前記マイクロホン信号内の雑音のパワースペクトル密度行列であり、
Γ_ｄは前記拡散音部分の空間コヒーレンス行列であり、Γ_ｄの（ｍ，ｍ’）番目の要素はマイクロホンｍとｍ’との間の空間コヒーレンスγ_ｍ’，ｍである、請求項９に記載の方法。
前記拡散音フィルタの前記フィルタ係数を使用して、前記第１のマイクロホン信号と前記第２のマイクロホン信号との線形結合を実施することをさらに含む、請求項１〜１０のいずれか一項に記載の方法。
コンピュータまたは信号プロセッサ上で実行されるときに、請求項１〜１１のいずれか一項に記載の方法を実施するための、コンピュータプログラムが格納されたコンピュータ可読媒体。
拡散音フィルタのためのフィルタ係数を取得する装置であって、
第１のマイクロホンによって捕捉される第１のマイクロホン信号内の第１の拡散音部分と、既知の様式で前記第１のマイクロホンから離間されている第２のマイクロホンによって捕捉される第２のマイクロホン信号内の第２の拡散音部分との間の空間コヒーレンスに基づいて、前記拡散音フィルタの前記フィルタ係数に対する線形抑圧を規定するように構成されている線形抑圧計算器と、
少なくとも１つの直接音の到来する方向、前記第１のマイクロホン信号および前記第２のマイクロホン信号に関する信号統計、ならびに、前記第１のマイクロホン信号および前記第２のマイクロホン信号に関する雑音統計のうちの少なくとも１つを計算するように構成されている計算器と、
前記フィルタ係数に対する前記線形抑圧を考慮しながら、前記少なくとも１つの直接音の前記到来する方向、前記信号統計および前記雑音統計の前記少なくとも１つに関する最適化問題を解くことによって、前記拡散音フィルタの前記フィルタ係数を決定するように構成されているフィルタ係数計算器と
を備えることを特徴とする、拡散音フィルタのためのフィルタ係数を取得する装置。
前記空間コヒーレンスは、前記第１のマイクロホンと前記第２のマイクロホンとの間の拡散音部分の相対伝達関数に基づく、請求項１３に記載の装置。
前記装置は、
前記フィルタ係数計算器とは異なる、補助拡散音フィルタの補助フィルタ係数に対する線形抑圧を考慮しながら、異なる最適化問題を解くことによって、前記補助フィルタ係数を決定するように構成されている補助フィルタ係数計算器をさらに備え、
前記補助拡散音フィルタは、推定拡散音パワーを推定するように構成されており、
前記フィルタ係数計算器は、前記拡散音フィルタの前記フィルタ係数を決定するときに、前記推定拡散音パワーを考慮に入れるように構成されている、請求項１３または１４に記載の装置。