JP2009529699A

JP2009529699A - 分離信号を生成するシステムおよび方法

Info

Publication number: JP2009529699A
Application number: JP2008557329A
Authority: JP
Inventors: チャン、クウォクルン; ビサー、エリック
Original assignee: ソフトマックス，インコーポレイテッド
Priority date: 2006-03-01
Filing date: 2007-02-27
Publication date: 2009-08-20
Also published as: KR100959050B1; US8898056B2; EP1989777A4; KR20090007304A; WO2007103037A3; EP1989777A2; WO2007103037A2; US20090254338A1

Abstract

本発明は、ブラインド信号源分離に関するものである。より詳細には、本発明は、周波数領域プロセスを使ったブラインド信号源分離に関するものである。
【選択図】図１

Description

関連出願の相互参照

本願は、共に参照によりこれの全文が本明細書に組み込まれる、２００６年３月１日に出願された米国仮特許出願第６０／７７７，９００号と、２００６年３月１日に出願された米国仮特許出願第６０／７７７，９２０号の優先権を主張するものである。

本発明はブラインド信号源分離(blind source separation)に関する。より詳細には本発明は周波数領域プロセスを使ったブラインド信号源分離に関する。

ブラインド信号源分離（ＢＳＳ）法を使って混合音響を分離することができ、この方法は時間領域法または周波数領域法を備える。時間領域法は、より良好な分離性能を達成するが、比較可能な周波数領域法よりも多くの計算量を生じ得る。また、時間領域法では、あらゆるフィルタタップ適応が他のすべてのタップに依存するため、収束が遅く、極小値になる傾向があり、したがって適切な初期設定に大きく依存する。

したがって、計算時間を低減し、かつ／または解の収束を改善すると同時に信号分離の向上をもたらすことのできる装置および方法が求められている。

概要

ある実施形態においては、本発明は、それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える周波数領域第１信号の集合を受け取ることと、周波数領域第１信号の集合を、複数の周波数の個々の周波数に対応する分離された周波数領域第２信号要素の集合を備える周波数領域第２信号の集合であり、周波数領域第２信号の集合のうちのどの信号が各周波数領域第２信号要素を含むかを示す識別子が各周波数領域第２信号要素に割り当てられている周波数領域第２の信号の集合に分離することと、周波数領域第３信号の集合を生成して周波数領域第２信号のコヒーレンスを改善するために少なくとも１つの周波数に対応する各識別子を再順序付けすることとを含む信号分離方法に関するものである。

周波数領域第１信号の集合を分離することはブラインド信号源分離法を含む。ブラインド信号源分離法は、個々の周波数に対応する周波数領域第１信号要素に適用される。コヒーレンスは、異なる周波数における信号の同時活動性(co-activity)を反映する関数を含む。周波数領域第２信号のコヒーレンスを改善することは周波数領域第２信号のコヒーレンスを最適化することを含む。周波数領域第２信号のコヒーレンスを改善することは、隣接する一対の周波数領域第２信号要素のコヒーレンスを改善することを含む。識別子を再順序付けすることは、複数の周波数に対応する各識別子を再順序付けすることを含む。識別子を再順序付けすることは、複数の周波数のうちの低い周波数から複数の周波数のうちの高い周波数へと各識別子を順次再順序付けすることをさらに含む。識別子を再順序付けすることは、複数の周波数に対応する各識別子を再順序付けすることを含む。識別子を再順序付けすることは、オーバーラップしない各周波数領域第２信号要素対の間のコヒーレンスを改善することをさらに含む。周波数領域第２信号のコヒーレンスを改善することは、第１の周波数部分集合に対応する周波数領域第２信号要素のコヒーレンスを最適化することと、第２の周波数部分集合に対応する周波数領域第２信号要素のコヒーレンスを最適化することとを含み、第２の周波数部分集合は第１の周波数部分集合より大きく、第２の周波数部分集合は第１の周波数部分集合を含む。実施形態によっては、本明細書で開示する方法は、時間領域入力信号の集合を変換して周波数領域第１信号の集合を生成することをさらに含む。時間領域入力信号は混合音響信号とすることができる。混合音響信号は音声信号を含み得る。実施形態によっては、本明細書で開示する方法は、周波数領域第３信号の集合の周波数領域第３信号を逆変換して所望の信号を生成することをさらに含む。

ある実施形態では、本発明は、それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える周波数領域第１信号の集合を受け取ることと、学習規則(learning rule)を備える独立ベクトル分析(Independent Vector Analysis)（ＩＶＡ）法を使って周波数領域第１信号の集合を周波数領域第２信号の集合に分離することと、学習規則に１つまたは複数の制約条件を適用することとを含む信号分離法に関するものである。

１つまたは複数の制約条件は、周波数領域第２信号の集合から導出される。学習規則に１つまたは複数の制約条件を適用することは、極小または極大で収束する確率を低減させる。本明細書で開示する方法は、周波数領域第１信号の第２の集合を受け取ることと、制約付き信号分離法を使って周波数領域第１信号の第２の集合を分離することとをさらに含む。１つまたは複数の制約条件は幾何学的制約条件を含み得る。幾何学的制約条件は推定される到来方向情報を含み、到来方向情報は、既知のセンサ位置を使ったヒストグラムおよび／または他の統計的技法から出力信号サブバンドを計算することによって推定される。１つまたは複数の制約条件は、信号のスペクトルまたはエネルギ特性に関する情報を含み得る。信号は、周波数領域第１信号、望ましい出力信号、および望ましくない出力信号の中から選択される。１つまたは複数の制約条件は非導出制約条件(non-derived constraints)を含み得る。

ある実施形態では、本発明は、時間領域入力信号の集合を受け取る受信機と、時間領域入力信号の集合を、それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える周波数領域第１信号の集合に変換する変換モジュールと、周波数領域第１信号の集合を、複数の周波数の個々の周波数に対応する分離された周波数領域第２信号要素の集合を備え、各周波数領域第２信号要素に、周波数領域第２信号の集合のうちのどの信号が各周波数領域第２信号要素を含むかを示す識別子が割り当てられている周波数領域第２信号の集合に分離する周波数領域信号分離モジュールと、周波数領域第２信号のコヒーレンスを改善するために、少なくとも１つの周波数に対応する各識別子を再順序付けして周波数領域第３信号の集合を生成する再順序付けモジュールとを備える、信号分離システムに関するものである。

周波数領域信号分離モジュールは、独立成分分析法(Independent Component Analysis)および／または独立ベクトル分析法を使って周波数領域第１信号の集合を分離する。再順序付けモジュールは、対応する周波数を決定することによって再順序付けすべき第１の周波数領域第２信号要素を決定する初期パラメータサブモジュールと、所定の周波数に隣接する周波数に対応する周波数領域第２信号要素を用いてこの所定の周波数に対応する周波数領域第２信号要素のコヒーレンスを改善するコヒーレンス改善サブモジュールと、再順序付けすべき次の周波数領域第２信号要素を決定する周波数前進サブモジュールであり、次の周波数領域第２信号要素を、最も新しく再順序付けされた周波数領域第２信号要素に対応する周波数に隣接した周波数に対応する周波数領域第２信号要素として決定するサブモジュールとを含む。

再順序付けモジュールは、対応する周波数を決定することによって再順序付けすべき第１の周波数領域第２信号要素を決定する初期パラメータサブモジュールと、所定の周波数に隣接する周波数に対応する周波数領域第２信号要素を用いてこの所定の周波数に対応する周波数領域第２信号要素のコヒーレンスを改善するコヒーレンス改善サブモジュールと、再順序付けすべき次の周波数領域第２信号要素を決定する周波数前進サブモジュールであり、次の周波数領域第２信号要素を、以前にコヒーレンス改善サブモジュールによって分析されていない周波数領域第２信号要素として決定するサブモジュールとを含む。再順序付けモジュールは、再順序付け要素のグループの初期状態を、少なくとも１つの周波数に対応する第１の周波数領域第２信号要素として決定する初期パラメータサブモジュールと、再順序付け要素のグループ内の周波数領域第２信号要素のコヒーレンスを改善するコヒーレンス改善サブモジュールと、再順序付け要素のグループに加えるべき周波数領域第２信号要素を決定する周波数前進サブモジュールとを含む。本明細書で述べるシステムは、周波数領域第３信号の集合の周波数領域第３信号を逆変換して所望の信号を生成する逆変換モジュールを含んでいてもよい。システムは、ヘッドセットおよび／または電話機を含んでいてもよい。

ある実施形態では、本発明は、時間領域入力信号の集合を受け取る受信機と、時間領域入力信号の集合を、それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える周波数領域第１信号の集合に変換する変換モジュールと、学習規則を備える独立ベクトル分析（ＩＶＡ）法を使って周波数領域第１信号の集合を周波数領域第２信号の集合に分離する周波数領域信号分離モジュールと、学習規則に１つまたは複数の制約条件を強制する制約条件強制モジュールとを含む、信号分離システムに関するものである。

本明細書で述べるシステムは、周波数領域第２信号の集合から１つまたは複数の制約条件を導出する制約条件導出モジュールをさらに含んでいてもよい。１つまたは複数の制約条件は幾何学的制約条件を含み得る。幾何学的制約条件は推定される到来方向情報を含む。到来方向情報は、既知のセンサ位置を使ったヒストグラムおよび／または他の統計的技法から出力信号サブバンドを計算することによって推定される。１つまたは複数の制約条件は非導出制約条件を含み得る。１つまたは複数の制約条件は、周波数領域信号分離モジュールにおける信号のスペクトルまたはエネルギ特性に関する情報を含み得る。本明細書で述べるシステムは、ヘッドセットおよび／または電話機を含んでいてもよい。

詳細な説明

信号分離の方法およびシステムにおいては独立ベクトル分析（ＩＶＡ）が使用されている。ＩＶＡ法は周波数領域において実施され、そのため時間領域の混合信号はまず周波数領域に変換される。次いで、出力混合信号を分離するために混合信号の各周波数成分に信号分離法が適用される。ＩＶＡと関連付けられる学習規則は任意の所与の周波数と関連付けられた各分離出力信号要素が独立であることを維持するが、一方では、各周波数にまたがる相関関係も存在し得る。したがってＩＶＡ法は、完全適応フィルタを備える。しかし、かかる方法は極小および極大で収束する傾向がある。さらに、学習規則は出力信号内のサブバンドを設けるが、これらのサブバンドは、すべての信号要素を正しい信号源に対して適正に特定するには不十分なこともある。

ある実施形態では、本発明は、独立ベクトル分析（ＩＶＡ）ステップおよび／またはモジュールを備える方法およびシステムを改善することに関するものである。実施形態によっては、本明細書で開示する方法およびシステムは、例えば、極小または極大で収束する確率を低減し、かつ／または速度および／またはロバスト性を改善することなどによって性能を向上させる。

ある実施形態では、本発明は、信号分離プロセスに適用される制約条件を備える方法および／またはシステムに関するものである。制約条件は、信号分離プロセスの学習規則に適用される。学習規則は規則的な時間間隔で変更される。制約条件は、演繹的(a priori)に知られていても導出されてもよく、幾何学的制約条件を含んでいてもよい。制約条件は、信号分離プロセスが極小または極大に収束する確率を低減する。

ある実施形態では、本発明は、異なる周波数に対応する分離信号源要素を異なる出力源に再割り当てし、各信号源に割り当てられた異なる周波数の信号源要素の間のコヒーレンスを改善することに関するものである。かかる再割り当ては、例えば最適な再割り当てなどを識別するための線形法、ボトムアップ法、またはトップダウン法を備える。

入力信号
ある実施形態では、本発明は、信号を分離する方法またはシステムに関するものである。信号は２つ以上の信号とすることができる。信号は音響信号とすることができる。代替として、信号は、生体医学、スペクトル、データ、または他のデータ源信号とすることもできる。

信号は、１台、２台、またはそれ以上のマイクロホンから生成される。マイクロホンは、ヘッドセットや無線モバイルハンドセットといった音声用アクセサリや音声機器に取り付けられる。マイクロホンは、複数の音源から音響信号を受け取るように配置され、これらの音源には人間の話者などの目標音源が含まれ得る。マイクロホンは、変換器技術を使って音響信号を電気信号に変換する。

本明細書で述べる方法またはシステムは、例えば、暗騒音などから音声信号を分離するように機能する。開示のシステムは、広範囲の音響製品で有利に使用され得ることが理解されるであろう。

制約条件を備える周波数領域信号分離
ある実施形態では、本発明は、周波数領域で行われる信号分離を備え、信号分離に制約条件を強制する方法および／またはシステムに関するものである。制約条件は、信号分離によって以前に生成された分離データから導出される。制約条件は、以前の分離経験に基づいて演繹的(a priori)に知られていてもよい。一実施形態では、制約条件は幾何学的制約条件、すなわち信号源のスペクトル特性に関連する制約条件を備える。加えて、制約条件は学習規則によっても適用される。実施形態の中には、システムおよび装置が時間領域信号をスペクトル入力信号に変換することを備えるものもあり、変換プロセスがシステムおよび装置に含まれない実施形態もある。

ある実施形態では、システムおよび装置は少なくとも１つの分離周波数領域信号を少なくとも１つの時間領域信号に逆変換することを含むものもあり、システムおよび装置がこれを含まない実施形態もある。実施形態によっては、信号分離はブラインド信号源分離を備える。実施形態によっては、信号分離は独立ベクトル分析（ＩＶＡ）または独立成分分析（ＩＣＡ）を備える。

図１を参照すると、システム１０は信号を分離する１つのプロセスおよびシステムを提供する。マイクロホン１２やマイクロホン１６といった複数のマイクロホンが信号を受け取る。２台のマイクロホンしか示していないが、別の実施形態では異なる数のマイクロホンが含まれていてもよいことが理解されるであろう。マイクロホン１２とマイクロホン１６は、それぞれ、音響信号（図示せず）を電気信号１４と電気信号１８に変換するように働く。

電気信号１４および電気信号１８は、実施形態によっては、時間領域信号である。電気信号１４と電気信号１８は、それぞれ、サンプリングウィンドウ集合２０と２２にサンプリングされる。サンプリングウィンドウ集合２０および２２の各サンプリングウィンドウは、例えば、約８ｋＨｚで獲得され、約２００の時間サンプリング単位に及ぶ。時間領域信号の特定の用途および種類に応じて、別のサンプリングウィンドウ長およびサンプリング率を使用してもよいことが理解されるであろう。

次いで、ＦＦＴプロセス２４とＦＦＴプロセス２６が、それぞれ、サンプリングウィンドウ集合２０と２２の各サンプリングウィンドウに対して高速フーリエ変換（ＦＦＴ）を行う。このようにして、各ＦＦＴプロセス２４、２６は、信号分離プロセス２８への入力として使用される周波数領域情報を生成する。

信号分離プロセス２８は、有利には、ＩＣＡ（独立成分分析）プロセスなどのブラインド信号分離プロセスとすることができ、あるいは、別の分離プロセスとすることもできる。信号分離プロセス２８は、出力周波数領域データを独立の信号源に分離しようと試みる。独立の信号源は、図１に示すように２つの信号源を含んでいてもよく、これ以上の信号源を含んでいてもよい。より詳細には、出力データが周波数ビンに入れられ、一時的に分離周波数ビンデータ２９として格納される。ある種の周波数依存サブバンド構造を生み出すウェーブレットフィルタバンク(wavelet filterbanks)のような他のサブバンド変換も使用できることが理解されるであろう。

分離周波数ビンデータ２９は、逆高速フーリエ変換（ＩＦＦＴ）プロセス３５に入力される。次いで、分離周波数ビンデータ２９の各分離成分が、ＩＦＦＴプロセス３５によって、時間領域出力３７や時間領域出力３９といった時間領域出力に対応するように変換される。場合によっては、２つを上回る時間領域出力が生じることもある。時間領域出力の１つを源信号の推定値とし、出力の１つまたは複数を１つまたは複数の雑音信号の推定値とすることができる。場合によっては、必ずしも分離周波数ビンデータ２９の分離成分のすべてがＩＦＦＴプロセス３５によって変換されるとは限らないこともある。例えば、源信号に対応する分離成分だけがＩＦＦＴプロセス３５によって変換される。

信号分離プロセス２８は、学習規則２７を使って周波数領域入力を分離信号源割り当てに分離する。有利には、学習規則２７は、分離性能を改善するためにフィルタ学習規則に追加項目を加えることによって制約される。学習規則２７に制約を付けることにより、より効率的でロバストな分離プロセスが可能となる。学習規則２７は演繹的制約条件(a priori constraints)３１によって制約され得る。これらの演繹的制約条件３１は、例えば、期待される信号源位置または位置範囲、期待される分離信号スペクトル特性、または別の期待される信号品質に関連するものなどとすることができる。具体的な例では、信号源が特定の場所にあることが分かっている場合、学習規則２７は、限られた位置範囲内でこの信号源を見つけるように演繹的に制約される。このようにして、信号源がより迅速に、正確に識別される。別の演繹的制約条件３１を使って学習規則をより効率化してもよいことが理解されるであろう。例えば、演繹的制約条件３１は、例えば、雑音信号の期待される位置またはスペクトル特性などに関連するものとすることもできる。演繹的制約条件は、ユーザが指定する信号スペクトル制約条件を含んでいてもよい。例えば、レーダやソナーなどの用途では、普通、刺激信号の良好な推定を使用することができる。

また、学習規則２７は、導出制約条件(derived constraints)３０によっても制約され得る。これらの導出制約条件３０は、分離周波数ビンデータ２９を使って学習規則２７における分離信号の目標特性を調整し、または設定する。例えば、分離周波数ビンデータ２９で信号源が特定の場所範囲内にあることが示される場合、導出制約条件３０が、学習規則２７の「視野」をこの場所だけに、または少なくとも導出される場所の周りの全般的領域に制限するよう設定される。この場所情報は、例えば、到来方向（ＤＯＡ）情報を含む。また、導出制約条件３０は、実際の動作条件に従ってデフォルトの事前制約条件３１を適合させることもできる。フィルタ学習プロセスが開始する前に利用可能である演繹的制約条件３１とは異なり、導出制約条件３０は、部分的分離解に収束する間に「オンザフライ」様式で獲得され、適合されることに留意すべきである。導出制約条件３０と演繹的制約条件３１の両方が学習規則２７に適用される実施形態もある。導出制約条件３０だけが学習規則２７に適用される実施形態もある。さらに、演繹的制約条件３１だけが学習規則２７に適用される実施形態もある。加えて、演繹的制約条件３１が導出制約条件３０に影響を及ぼすように構成されてもよく、かつ／または導出制約条件３０が演繹的制約条件３１に影響を及ぼすように構成されてもよい。例えば、演繹的制約条件３１が、導出制約条件３０の初期条件に影響を及ぼしてもよい。

ある実施形態においては、本発明は、図２に示すような分離システム５０に関連するものである。信号分離モジュール５４は、図２の入力チャネル５１および５２に対応する１つまたは複数の入力チャネルから入力信号を受け取る。信号分離モジュール５４は、独立成分分析（ＩＣＡ）プロセスを備えるブラインド信号分離プロセスとすることができるが、他のプロセスを使用してもよい。

信号分離モジュール５４は、学習規則５８に影響を及ぼし、また、学習規則５８から影響を受ける。学習規則５８は、学習規則５８の動作を制約する１つまたは複数の制約条件６０を含む。これら１つまたは複数の制約条件６０は指向性行列を含んでもよく、ヌルビームおよび幾何学的情報を含んでもよい。制約条件６０はデフォルト設定を有していてもよく、演繹的制約条件６２を含んでもよい。演繹的制約条件６２には、例えば、装置またはシステムの別の態様などによって獲得される信号源位置、信号源エネルギ、信号源のスペクトル情報などに関する情報が含まれる。また、制約条件６０には、以下で詳細に説明するように、導出制約条件６４も含まれる。

また、学習規則５８は重み係数６１も備え、重み係数６１は１つまたは複数の制約条件６０と掛け合わされ、演繹的制約条件６２および導出制約条件６４の執行に対するＢＳＳ最適化目的のトレードオフに使用される。ＢＳＳ目的に対する１つまたは複数の制約条件６０の重み係数６１は、事前に設定されてもよく、より高信頼でより高速でより最適な分離のために調整されてもよい。重み係数は動作条件に従って適合され得ることが理解されるであろう。いくつかの制約条件は固定され、適合できないものもあり、適合させるためのデフォルトの始点とするものあることも理解されるであろう。重み係数は、以下で詳細に説明するように、導出制約条件６４によって適合され得る。

動作に際して、信号分離モジュール５４は、割り当て信号源に従った周波数ビンにおいて編成される分離周波数ビン出力データ５６を生成する。分離周波数ビン出力データ５６の分離成分は、分離周波数ビン信号源成分５９を含む。一実施形態では、分離周波数ビン信号源成分５９は、分離時間領域源信号が生成されるＩＦＦＴプロセスに出力される。別の実施形態では、周波数領域分離重みだけがＩＦＦＴを介して送られ、時間領域混合信号は、獲得される時間領域分離フィルタを用いてフィルタリングされる。

また、分離周波数ビン出力データ５６は、１つまたは複数の導出制約条件６４を決定するのにも使用される。これらの導出制約条件６４は、典型的には幾何学的情報または位置情報であるが、スペクトル情報またはエネルギ情報を含んでもよい。また、導出制約条件６４は、期待される特性６９またはシステム全体の別の部分からの情報に従って動的に調整されてもよい。例えば、無線ハンドセットは、導出制約条件６４をさらに調整し、または設定するのに役立つ情報を提供する電波を有する。導出制約条件６４は、暗黙的に、学習規則５８において制約付き重み係数６１によって分離周波数ビン出力データ５６を適正に順序付けすること６６に役立つように使用される。

例えば、位相関係が、到来方向（ＤＯＡ）情報を決定するのに使用され、これらの位相関係を決定するプロセスでは、ある出力データが別の信号源とより適切に関連付けられていることを示す情報が生成される。１つの具体例を挙げると、隣接する周波数ビン間に急激な位相差が見られることがあるが、これは、音声信号では一般に予期されないはずである。この場合、位相の不連続性は、出力データ内のある周波数範囲が誤って割り当てられていることを示す可能性があり、したがって、この周波数ビン範囲の出力は、重み付き制約付き学習項目を使って例えばビンごとの位相変化を最小限に抑えることなどによって再配置する必要がある。個々のＢＳＳ出力において出現するＤＯＡの選択は、何らかの管理された方法、すなわち、グラフ内の部分的に解決された分離をＢＳＳ出力ＤＯＡの関数とて評価することによって決定することもでき、管理されないやり方で決定することもできる。例えば、カルマンフィルタは、低い周波数から高い周波数に向かう位相情報と、ビン間刺激変動の典型的な分散を使って、個々のＢＳＳ出力における平均ＤＯＡを推定する。ＤＯＡ位相偏移が典型的なビン間分散を、統計的に有意な起こりそうにない量だけ超過するやいなや、この強いＤＯＡ偏移が発生している周波数ビンは、分離信号源間の周波数ビン範囲の順列イベントをマークする可能性が高くなる。低い周波数ビンから開始されるカルマンフィルタによってそれまでに提供されたＤＯＡ推定値を導出ＤＯＡ制約条件パラメータとして使用し、このＢＳＳの残りの高周波数ＤＯＡをＢＳＳ出力の低周波数の分離部分と整合させる。

ある実施形態では、本発明は、図３に示すような分離システム１００に関するものである。システム１００は、入力チャネル１０２や１０４のような１つまたは複数の入力チャネルから周波数データを受け取る信号分離モジュール１０６を含み、生成分離周波数ビン出力データ１０９を生成する。生成分離周波数ビン出力データ１０９は、周波数ビンの集合１１０を個々の独立信号源１１２と関連付ける。各周波数ビンは、関連するサンプルウィンドウの複素周波数データを表す出力データ１１４を有する。出力データ１１４は、導出プロセスによって、１つまたは複数の信号源の到来方向（ＤＯＡ）情報といった導出制約条件１２１を導出するために使用される。例えば、信号源１のＤＯＡは、出力データＤ１−１、Ｄ１−２、Ｄ１−３からＤ１−ｎまでの分析によって決定される。導出プロセスは、１組の出力データのＤＯＡ情報を平均して信号源をより正確に突き止め、周波数ビン間に、何らかの出力データが誤って割り当てられていることを示す位相情報の異常に大きい変化がないか監視する。ＤＯＡ情報を決定するのに他のフィルタおよび選択プロセスを使用してもよいことが理解されるであろう。

また、監視される位相イベントは、分離周波数ビン出力データ１０９内の出力データを再配置するためにも使用される。例えば、隣接する周波数ビン間で急激な位相差が見られることがあり、これは音声信号では一般に予期されないはずである。この場合、位相の不連続性は、何らかの出力データが誤って割り当てられていることを示している可能性があり、したがって、この周波数ビンの出力が、ビンごとの位相変化を最小限に抑えるなどのために再配置される必要がある。出力データの再配置に役立つ他の情報も導出され得ることが理解されるであろう。図示するように、監視される位相イベントは、信号分離プロセスを調整して誤った割り当てを訂正するよう学習規則を調整するのに使用される。代替として、監視される位相イベントは、再順序付けプロセスが１つまたは複数の周波数ビン内のＢＳＳ出力データを再順序付けするために使用されてもよい。

導出制約条件１２１は、学習規則１２５がより効率よくロバストに信号を分離することを可能にする幾何学的制約条件１２３を定義するために使用される。例えば、１つまたは複数の信号源の導出ＤＯＡ情報が、学習規則の焦点を特定の幾何学的または位置的解決に合わせるために使用される。また、幾何学的制約条件１２３は、デフォルトの条件または他の演繹的制約条件１２７を含んでいてもよい。これらの演繹的制約条件１２７は、マイクロホンが目標信号源と固定した関係にある場合には静的とすることもでき、装置の別の態様によって動的に調整されてもよい。

ある実施形態では、本発明は、図４に示すような、分離プロセス１５０に関するものである。プロセス１５０のステップ１５２で、音響信号をローリングウィンドウに取り込む。プロセス１５０のステップ１５４で、時間領域ローリングウィンドウに高速フーリエ変換（ＦＦＴ）を適用して周波数領域データを作成する。プロセス１５０のステップ１５６で、結果として生じる、ＦＦＴデータとも呼ばれる周波数領域データを信号分離プロセスへのチャネル入力として使用する。演繹的制約条件１５５を使って信号分離プロセスをより効率的でロバストなものにする。これらの演繹的制約条件１５５は、静的なものでもよく、全般的システムの別の態様によって調整されてもよい。プロセス１５０のステップ１５８で、信号分離プロセスからの出力が、信号源に従って分離された分離ＢＳＳ出力データを提供する。プロセス１５０のステップ１６１で、分離出力データを分析してプロセスの各ステップを調整する。例えば、分離出力データを使って分離プロセスの学習規則における適応可能な制約条件または重み係数を調整する。また、出力データを分析して、周波数ビン内の出力データの信号源割り当てを再順序付けし、または訂正するのに役立つ情報を提供してもよい。プロセス１５０のステップ１６３で、ＩＦＦＴが周波数領域データを処理する。次いで、プロセス１５０のステップ１６５で、ＩＦＦＴが分離時間領域信号を生成する。代替として、周波数領域分離重みだけをＩＦＦＴを介して送り、獲得した時間領域分離フィルタを用いて時間領域混合信号をフィルタリングしてもよい。

多変量活性化関数および幾何学的制約条件
いくつかの実施形態では、本明細書で述べる方法および／またはシステムの制約条件には幾何学的制約条件が含まれ、それらの制約条件がＩＶＡ法と関連付けられた学習規則に強制される。制約条件を導出し、制約条件を信号分離のプロセスまたは方法に適用する任意のプロセスまたは方法が使用され得る。しかし、以下では一例として１つの特定の数学的定式化を示す。

周波数領域において、複素ＩＣＡは、Ｘ（ω，ｌ）＝［Ｘ_１（ω，ｌ），……，Ｘ_Ｍ（ω，ｌ）］^Ｔ（時間ウィンドウをｌ、混合信号の数をＭとする）を時間領域混合信号ｘ（ｔ）のＤＦＴとする場合に、分離される出力Ｙ（ω，ｌ）＝Ｗ（ω）Ｘ（ω，ｌ）が相互に独立であるような各周波数ωごとの分離行列Ｗ（ω）を見つけることに関する。Ｗ（ω）の更新規則は以下の式で与えられる。

ΔＷ（ω）＝μ［Ｉ−＜φ（Ｙ（ω，ｌ）Ｙ（ω，ｌ）^Ｈ＞］Ｗ（ω）式（１）
式中、Ｙ（ω，ｌ）＝［Ｙ_１（ω，ｌ），……，Ｙ_Ｍ（ω，ｌ）］^Ｔであり、＜＞は時間ｌ＝１，……，Ｌにおける平均演算子を表し、μは学習率である。従来の情報量最大化（Infomax）活性化関数は、φ（Ｙ_ｊ（ω，ｌ）＝ｔａｎｈ（｜Ｙ_ｊ（ω，ｌ）｜）＊Ｙ_ｊ（ω，ｌ）／｜Ｙ_ｊ（ω，ｌ）｜で与えられ、これは、更新規則（１）と共に、ＩＣＡ問題が各周波数ビンごとに独立に解決され、順列問題に至ることを示唆するものである。しかし、対象とする信号が、多次元プライヤ（prior）によってモデル化することのできる周波数領域における一定の依存関係を有するものと仮定することによって、かかるプライヤ（prior）を使用するグループとして元の依存信号源を抽出することができる。その結果、多変量活性化関数
φ（Ｙ_ｊ（ω，ｌ）＝Ｙ_ｊ（ω，ｌ）／（Σω｜Ｙ_ｊ（ω，ｌ）｜^２）^０．５式（２）
が得られ、式中、分母の項はすべての周波数に及ぶ分離信号源スペクトル電力に関連するものである。ここで使用する多変量活性化関数は、一般的な統計分布から導出されるより一般的な学習規則の特殊な事例であることが分かる（共に参照によりこれらの全文が本明細書に組み込まれる、Ｋｉｍ，Ｔ．、Ｌｅｅ，Ｔ．−Ｗ．、「ブラインド源信号分離のシステムおよび方法（Systems and Methods for Blind Source Signal Separation）」、米国特許出願、２００６年３月１日、およびＫｉｍ，Ｔ．、Ｅｌｔｏｆｔ，Ｔ．、Ｌｅｅ，Ｔ．−Ｗ．、「独立ベクトル分析（ＩＶＡ）：多変量成分へのＩＣＡの拡張（Independent Vector Analysis (IVA): An Extension of ICA to Multivariate Components）」、Ｐｒｏｃ．ｏｆ６^ｔｈＣｏｎｆ．ｏｎＩＣＡａｎｄＢＳＳ、１６５〜１７２頁、２００６年３月を参照）。Ｗのスケーリングの曖昧さは、最小ひずみ原理を用いて設計されたスケーリング行列によって解決される。

式（２）の場合のような多変量活性化関数を使用すれば、フィルタ学習プロセスの間に個々の周波数ビンフィルタ重み間の明示的依存関係を導入することによって順列問題が回避される。実際には、このフィルタ重みの同時接続適合は、時間領域アルゴリズムにおいて観測されているのと同様の初期フィルタ条件への収束依存性の増大をもたらす。したがってこの場合、幾何学的制約条件を使ってこれら実際的な限界が克服される。

本明細書の方法および／またはシステムには任意の幾何学的制約条件が適用される。さらに、本明細書で述べる演繹的制約条件または導出制約条件は、幾何学的制約条件だけを含んでいても、幾何学的制約条件を他の制約条件と共に含んでいても、幾何学的制約条件を全く含まなくてもよい。

幾何学的制約条件を使って、個々の出力チャネルの空間応答を特定の方位に制約し、他の方位にヌルビームを配置することができる。これは、線形制約付き適応ビーム形成、特に汎用型サイドローブキャンセラ（ＧＳＣ）の基底をなす一般概念である。ここで提案する考えは、干渉源方向に空間的ヌルを配置することによって特定の信号源方向に集中するという目的をサポートする独立ベクトル分析（ＩＶＡ、Ｋｉｍら、「ブラインド源信号分離のシステムおよび方法（Systems and Methods for Blind Source Signal Separation）」、米国特許出願、２００６年３月１日参照）費用関数に正規化項を加えるというものである。以下の正規化項が提案される。

式（３）
式中、Ｍ×Ｍ行列Ｃ（ω）は以下で与えられる。

指向性行列Ｄ（ω，θ_ｅｓｔ）の各列は、ベクトルｄ_ｊ、すなわち、
ｄ_ｊ＝ｅｘｐ（−ｉ＊ｃｏｓ（θ_ｅｓｔｊ）＊ｐｏｓ＊ω／ｃ）式（４）
からなり、ｐｏｓ＝［ｐ_１ｐ_２ ……ｐ_Ｍ］^Ｔはセンサ位置であり、ｃは空気中の音の速度であり、ｉは−１の平方根である。

θ_ｅｓｔｊｓは、演繹的な知識から利用でき、または以下のように反復して求める必要のあるＲ≦Ｍ信号源の信号源到来方向（ＤＯＡ）推定値である。前述したように、分離行列Ｗの逆を使って、分離出力Ｙ_ｊのＤＯＡを、

式（５）
を用いて推定することができ、式中、θ_ｊ，ｍｎ（ω）はセンサ対(pair)ｍおよびｎに対する信号源ｊのＤＯＡであり、ｐ_ｍとｐ_ｎはそれぞれマイクロホンｍとｎの位置であり、ｃ＝３４０ｍ／ｓは音の伝搬速度である（参照によりこの全文が本明細書に組み込まれる、Ｍｕｋａｉ，Ｒ．、Ｓａｗａｄａ，Ｈ．、Ａｒａｋｉ，Ｓ．、Ｍａｋｉｎｏ，Ｓ．、「多音声信号の周波数領域ブラインド信号源分離（Frequency domain blind source separation for many speech signals）」、Ｐｒｏｃ．ＩＣＡ２００４、４６１〜４６９頁、２００４参照）。複数のマイクロホン対を使用するとき、特定のＩＶＡ出力Ｙ_ｊのＤＯＡθ_ｅｓｔｊは、選択したサブバンド内のすべてのマイクロホン対および周波数に対して式（５）のθ_ｊ，ｍｎ（ω）のヒストグラムを描くことによって算出することができる（例えば図７を参照）。その場合、平均値θ_ｅｓｔｊは、結果として生じるヒストグラム（θ_ｊ，Ｎ（θ_ｊ））の重力（Σ_{θｊ＝０……１８０} Ｎ（θ_ｊ）＊θ_ｊ）／Σ_{θｊ＝０……１８０} Ｎ（θ_ｊ）の最大値または中心であり、Ｎ（θ_ｊ）は角度θ_ｊにおけるＤＯＡ推定値の数である。かかるヒストグラムからの高信頼ＤＯＡ推定値は、数回の反復後に平均信号源方向が現れるもっと後の学習段階において初めて利用可能になる。式（５）の推定値は、マイクロホンアレイから、Ｄを最大アレイ次元とし、λを考察される最短波長とする（２〜４）＊Ｄ^２／λを超える信号源距離に有効な遠距離音場モデルに基づくものである。

目的（３）は、更新規則、

式（６）
を使って最小化することができ、式中、αは調整パラメータである。更新方程式（６）をＩＶＡ更新方程式（１）に加えて制約付きＩＶＡ重み更新ΔＷ（ω）を求めるとき、調整パラメータαは、音響シナリオの空間的分離可能性および他の考慮事項に応じて正規化制約条件（３）を適切に執行することを可能にする。

信号源Ｒの数が混合信号Ｍの数と等しい場合、所望のビームパターンの選択は、
Ｃ（ω）＝ｄｉａｇ（Ｗ（ω）＊Ｄ（ω，θ））
に設定され、よって、干渉する方位からの信号源を無効にすると同時に、各反復ごとに制約付きＩＶＡアルゴリズムによって求められる所望の方位にビーム強度を保つ。Ｒ＜Ｍの場合、ＤＯＡが識別されていないＷの第ｋ行は、Ｃ（ω）におけるゼロエントリの対応する行を必要とし、したがって、この出力チャネルではすべての信号源が無効とされ、暗騒音だけが残る。代替として、Ｒ＜Ｍの場合には、まず、ＰＣＡを使って次元削減を行ってから、次元削減した部分空間に対してＩＶＡを行うこともできる。次元削減された制約勾配は、

として表され、Ｃ（ω）＝ｄｉａｇ（Ｗ（ω）Ｗｒ（ω）Ｄ（ω，θ））であり、ＷｒはＲ＊ＭのＰＣＡ次元削減行列を表す。

ビーム形成法を用いることができ、音声は一般に広帯域信号であるため、臨界周波数範囲にわたって優れた性能が得られることが保証される。式（５）の基底をなす遠距離音場モデルが無効である場合には、ビームパターンへの近距離音場修正が行われてもよい。また、空間的エイリアシングを回避するために、２つ以上のマイクロホンの間の距離が十分小さく（最高周波数の波長の半分未満に）なるよう選択することもできる。この場合、非常に低い周波数において鋭いビームを強いることは不可能である。

図５は、極小値を回避し、収束を加速するために幾何学的制約条件と組み合わせたＩＶＡに基づく一システムの概要を示す。複数の混合入力（Ｘ_１，Ｘ_２，……Ｘ_Ｍ）１８０が適合プロセス１８５に入力される。適合プロセス１８５は、ＩＶＡプロセス１８７と幾何学的制約条件プロセス１８４の両方を備える。例えば信号源や、あるいは別の例としては雑音などの演繹的知識１９１が幾何学的制約条件１８４の一因となることもある。代替として、またはそれに加えて、以下で詳細に説明する導出情報が幾何学的制約条件１８４の一因となることもある。適合プロセス１８５は、分離行列Ｗ１９３を適合させる。分離行列Ｗ（ω）１９３は、複数の混合入力（Ｘ_１，Ｘ_２，……Ｘ_Ｍ）１８０を受け取り、それらの混合入力１８０を複数の分離信号（Ｙ_１，Ｙ_２，……Ｙ_Ｍ）１９５に変換する。複数の分離信号（Ｙ_１，Ｙ_２，……Ｙ_Ｍ）１９５は、１つまたは複数の源信号を含み得る。導出制約条件は、分離行列Ｗ（ω）の逆を使って部分分離信号の周波数サブバンドを繰り返し算出することによって導出される。

図６に、３台のスピーカ、４つのマイクロホンの音響シナリオにおける手法を示す。信号源１、信号源２、信号源３は、それぞれ、マイクロホンアレイから１３０ｃｍ、１３０ｃｍ、６０ｃｍ離れている。マイクロホンアレイは、各マイクロホンが隣接するマイクロホンから４ｃｍずつ離れて位置するように直線上に配置された４台のマイクロホンを含む。信号源１、信号源２、信号源３は、それぞれ、各マイクロホンの線に沿った軸に対して７０°、９５°、１３５°のところに位置する。

図７には、学習規則（１）と活性化関数（２）を使って各ＩＶＡ分離出力ごとに［０〜４ｋＨｚ］帯域内のすべての周波数にわたり、マイクロホン対（１，２）、（２，３）、（３，４）について式（５）を用いて推定されたＤＯＡのヒストグラムが示されている。ＩＶＡ出力１と２は、それぞれ、信号源１と２に対応し（図６と比較されたい）、そのため、ヒストグラムは、信号源１と２の位置に対応する約７０°と９５°のところで最大となる。ＩＶＡ出力３と４はこれらに類似の鋭いピークを示さず、それによって出力３と４では定義されたＤＯＡが感知されないことを示している。よって、制約なしのＩＶＡアルゴリズムは、信号源３を分離するのに失敗し、極小に収束している。

一方、図８には、制約付きＩＶＡの収束解（更新式（１）および式（４）、α＝０．１）において初期設定されたＩＶＡ分離解（更新規則（１）、活性化関数（２））に対応するすべてのマイクロホン対および周波数に及ぶ式（５）からのＤＯＡ推定値のヒストグラムが示されている。図７とは異なり、ＩＶＡ出力３は信号源３に明確に対応しており、ヒストグラムのピークは約１３５°のところに位置している。よって、制約付きＩＶＡ規則を使ってブラインド信号源分離を行うことにより、極小値への収束が回避され、３つの元の信号源すべてが記録された混合信号から分離される。

表１に、制約付き手法を使ってよりよい最終信号対干渉比（ＳＩＲ）を得ることができることを示す。異なるαの値によって異なる制約付きＩＶＡ手法を評価した。各頭字語の説明は以下の通りである。ＩＶＡ＝関数（１）を使った更新規則（１）によるＩＶＡ、ｃｏｎＩＶＡ＝αの異なる設定での（５）に（１）を加えたものから構成される更新規則を使った制約付きＩＶＡ、ＩＶＡｏｐｔ＝ｃｏｎＩＶＡ（α＝０．１）を用いて獲得した最終解において初期設定されたＩＶＡ。

幾何学的制約条件を実施することの物理的影響を説明するために、図９に、ω＝２ｋＨｚにおいて制約付きＩＶＡ（活性化関数（２）を用いた式（５）に更新規則（１）を加えた）を使用して得られた分離出力ビームパターン｜Ｗ＊ｄ（θ）｜を示す。ヌルビームがＤＯＡ７６度、９６度、１３４度のところに配置され、αを使った制約条件（式５）の強制という別の誘導により、結果として生じるヌルビームの深さを調整することが可能になる（α＝２は破線、α＝０．１は一点短鎖線）。実線は、α＝０．１を使った制約付きＩＶＡから得られた収束フィルタを用いて初期設定された制約なしＩＶＡ（関数（２）を用いた更新規則（１））の最適解に対応する。αを調整することによって、ビームパターンの深さおよび幅を選択した角度で調整することができ、よって、ＢＳＳ解を特殊解として初期設定し、またはＢＳＳ解を特殊解に導く直接手段が可能になることが分かる。

周波数領域信号分離および再順序付け処理
ある実施形態では、本発明は、周波数領域で行われる信号分離を備え、分離信号の信号源割り当てを再割り当てするシステムおよび／または装置に関するものである。再順序付けは、特定の周波数および／または特定の周波数グループに対応する信号データ内の割り当てを再割り当てすることを備える。「再順序付けする（ｒｅｏｒｄｅｒ）」、「再割り当てする（ｒｅａｓｓｉｇｎ）」、「再配置する（ｒｅａｒｒａｎｇｅ）」の各語は同義で使用し得ることが理解されるであろう。実施形態によっては、再順序付けは、本明細書で述べるトップダウン、ボトムアップ、または線形の各プロセスを備える。実施形態の中にはシステムおよび装置が時間領域信号をスペクトル入力信号に変換するものもあり、変換がシステムおよび装置に含まれない実施形態もある。実施形態の中にはシステムおよび装置が少なくとも１つの分離周波数領域信号を少なくとも１つの時間領域信号に逆変換することを備えるものもあり、逆変換を備えない実施形態もある。実施形態によっては、信号分離はブラインド信号源分離を備える。実施形態によっては、信号分離は独立ベクトル分析（ＩＶＡ）または独立成分分析（ＩＣＡ）を備える。

本明細書では特定の再順序付け法を説明するが、任意の再順序付けプロセスを使用し得ることが理解されるであろう。加えて、特定の周波数および／または特定の周波数グループに対応するデータの再順序付けを考察する間、別の周波数および／または周波数グループに進む前に再順序付けした割り当てを固定する必要がないことも理解されるであろう。

図１０に示すシステム５００は、信号を分離する１つのプロセスおよびシステムを提供し、図１に示すシステム１０として開始するものである。マイクロホン１２やマイクロホン１６といった複数のマイクロホンが信号を受け取る。マイクロホン１２およびマイクロホン１６の特性と、マイクロホン１２およびマイクロホン１６によって生成される音響信号１４および１８の特性は、システム１０で示したものと同様である。システム１０について前述したように、時間領域電気信号１４と１８は、それぞれ、サンプリングウィンドウ集合２０と２２にサンプリングされる。

システム１０について前述したように、次いで、ＦＦＴプロセス２４と２６によって、それぞれ、サンプリングウィンドウ集合２０と２２の各サンプリングウィンドウに対して高速フーリエ変換（ＦＦＴ）が行われる。このようにして、各ＦＦＴプロセス２４、２６は、信号分離プロセス２８への入力として使用される周波数領域情報を生成する。

信号分離プロセス２８は、有利にはＩＣＡ（独立成分分析）プロセスなどのブラインド信号分離プロセスとすることができ、別の分離プロセスとすることもできる。信号分離プロセス２８は、出力周波数領域データを独立信号源に分離しようと試みる。独立信号源には、図１０に示すように２つの信号源が含まれていてもよく、これを上回る信号源があってもよい。

より詳細には、出力データを周波数ビンに入れ、一時的に順列表５３２に格納する。順列表５３２は、分離周波数領域データを保持する。

しかし、信号分離プロセス２８はしばしば、特定の出力データ要素を正しい信号源に正確に割り当てるのに失敗する。典型的には、周波数ビンは期待される各独立信号源ごとにデータ出力要素を有し、これは通常は使用するマイクロホンの数でもある。例えば、装置が３台のマイクロホンを有する場合、各周波数ビンは３つの出力データ要素を有することになる。信号を正確に分離するためには、各出力データを正しい信号源と関連付ける必要がある。場合によっては、出力データは、信号源と誤って関連付けられることもある。この周波数データの誤った割り当ては通常は順列問題と呼ばれ、ひずみ、分離の失敗、または他の望ましくない結果につながる。したがってシステム５００は、順列表５３２内の各周波数ビンごとに出力データを順序付けする再順序付けプロセス５３０を備える。したがって順列表５３２は、各成分が複数のデータ点を備え、各データ点が各成分に割り当てられた周波数ビンの信号分離結果に対応する複数の分離成分を備えるように再順序付けされる。

順列表５３２が適正に順序付けされると、訂正された周波数領域データが逆高速フーリエ変換（ＩＦＦＴ）３５に渡される。次いで、ＩＦＦＴプロセス３５によって再順序付けされた順列表の各分離成分が、時間領域出力３７や３９のごとく時間領域出力に対応するように変換される。場合によっては、２つを上回る時間領域出力が生じることもある。時間領域出力のうちの１つを源信号の推定値とし、出力の１つまたは複数を１つまたは複数の雑音信号の推定値とすることができる。場合によっては、必ずしも分離周波数ビンデータ２９の分離成分すべてがＩＦＦＴプロセス３５によって変換されるとは限らないこともある。例えば、源信号に対応する分離成分だけがＩＦＦＴプロセス３５によって変換される。

ある実施形態では、本発明は、図１１に示すような分離プロセス５５０に関するものである。プロセス５５０のステップ５５２で、音響信号がローリングウィンドウに取り込まれる。プロセス５５０のステップ５５４で、時間領域ローリングウィンドウに高速フーリエ変換（ＦＦＴ）を適用して周波数領域データが作成される。プロセス５５０のステップ５５６で、結果として生じる、ＦＦＴデータともいう周波数領域データが信号分離プロセスへのチャネル入力として使用される。プロセス５５０のステップ５５８で、独立信号源に従って周波数ビン内の信号分離プロセスの出力を配置する順列表が生成される。プロセス５５０のステップ５６１で、順列表に周波数ビン内の出力データを再順序付けするプロセスを適用して、各周波数ビン内で、信号分離プロセスからのデータ出力と合致するように信号源の割り当てを再順序付けする。プロセス５５０のステップ５６３で、ＩＦＦＴによって周波数領域再順序付けデータが処理される。プロセス５５０のステップ５６５で、ＩＦＦＴが次いで分離時間領域信号を生成する。代替として、周波数領域分離重みだけをＩＦＦＴを介して送り、獲得される時間領域分離フィルタを用いて時間領域混合信号をフィルタリングしてもよい。

図１２に順列表の一例を示す。順列表６００は独立信号源６０２の識別と利用可能な周波数ビン６０４の識別を含む。典型的には、信号源の数はシステムのマイクロホンの数に関係する。例えば、装置に３台のマイクロホンがある場合、最大３つまでの独立信号源を識別することができる。周波数ビン６０４の数は、実行される高速フーリエ変換の種類、ならびにＦＦＴサンプルブロックおよびサンプリングウィンドウ内のデータ点の数に依存する。各周波数ビン、例えば周波数ビン６０８などは、出力６０９や出力６１０のような出力データの集合を含む。各出力は、すべてのサンプルウィンドウを表す複素数値データの集合を含む。例えば、周波数ビン６０８は、複素数出力６０９および６１０を有し、出力６０９は、最初の３つのサンプルウィンドウの「周波数３」の内容を表す複素数値データＱ１、Ｑ２、Ｑ３を有する。例えば、ある期間に２４０個のサンプルウィンドウが取られる場合、出力６０９などの各出力は２４０個の複素数値を有し、各値が１サンプルウィンドウの１周波数ビン内のデータ要素を表す。

順列再順序付け結果を改善するためには、サンプルデータの最小指定長が必要である。例えば、３秒間の時間領域データが望ましい分離結果をもたらすことが分かっている。８ｋＨｚでサンプリングする場合であり、サンプルウィンドウが２００点に設定されている場合、各サンプルウィンドウの長さは約２５ミリ秒である。サンプルウィンドウは重なり合うため、追加のサンプルウィンドウを使って３秒間の時間を消費する。例えば、各サンプルウィンドウが約１００点だけ重なり合う場合、約２４０個のサンプルウィンドウで３秒間の時間を消費することになる。全般的な時間の長さ、サンプルウィンドウの数、オーバーラップ、ウィンドウの長さ、およびサンプリング速度は調整され得ることが理解されるであろう。

表６２５には、１つの軸に信号源が記載され、別の軸に周波数ビンが記載された順列表が示されている。周波数ビン内の各出力にはＡ、ＢまたはＮの文字が割り当てられている。考察のために、各文字Ａ、Ｂ、Ｎで、個々の信号源からの信号を表わすものとする。このやり方では、完全に分離された信号は、信号源の１つと整合するすべての「Ａ」と、別の信号源と整合するすべての「Ｂ」と、別の信号源と関連付けられたすべての「Ｎ」とになるはずである。しかし、実際にはおそらくこのような完璧な結果が生じることはなく、若干の誤った割り当ては一般には許容される。しかし、本明細書で論じる再順序付けプロセスを使えば明確さおよび分離効率の改善が見られることが理解できるであろう。

次に図１３Ａを参照すると、順列表を再順序付けするシステムが示されている。システム６５０は、信号源６５２や信号源６５４といった信号源を有する順列表を有する。順列表には、信号分離プロセスが個々の周波数ビン内で分離出力データを割り当てており、各出力が特定の信号源に割り当てられていることが示されている。文字ラベルで示すように、分離プロセスは、周波数ビンの多くにおいて特定の信号源を正しい出力データと正確に関連付けるのに失敗している。したがって、有利には再順序付けプロセスを適用する。再順序付けシステム６５０は、周波数ビン６５６など所定の周波数ビンから開始する線形法である。線形法では、グローバル費用関数(global cost function)が最小になるまで選択した周波数ビン内の出力を再配置する。より詳細には、各周波数ビンごとの出力をすべての利用可能な組み合わせに再順序付けし、各順列ごとに各信号源ごとの費用関数を計算する。

システム６５０において、周波数ビン１は最初はＡ−Ｂ−Ｎに配置された。３つの信号源が示されているので、この周波数ビン内では６つの異なる順列が配置され得る。これらの利用可能な配置６５８を順次適用する。各配置ごとに、各信号源ごとの費用の値を計算する。例えば、周波数１がＡ−Ｎ−Ｂに設定されているときには、信号源１６５２と、信号源２６５４と、信号源ｓの費用を計算する。この費用関数はグローバル相関機構６６５とすることができる。別の種類の費用関数を使用してもよく、別の種類のアルゴリズムを使用して最良適合を求めてもよいことが理解されるであろう。比較に従って、最良適合を有する配置を選択する。システム６５０に示すように、配置Ｂ−Ａ−Ｎが最良適合を有するものとして選択される。

したがって、配置Ｂ−Ａ−Ｎを周波数１に固定し、システム６５０は、図１３Ｂのブロック６５７で示すように続いて周波数２を再配置する。再度、この線形法は周波数ビン内の出力を再配置し、各信号源ごとの費用関数を計算し、次いで、最低の全般的費用関数、すなわち最良適合を有する配置を選択する。図１３Ｂに示すように、配置Ｂ−Ａ−Ｎがｆ２の最良適合を有する。したがって、Ｂ−Ａ−Ｎをｆ２に固定し、線形法はｆ３に進む。このプロセスが、すべての周波数を完了するまで続く。複数のパスを使用し得ることが理解されるであろう。

ある実施形態では、本発明は、図１４に示すような、順列表を再配置するプロセスに関するものである。プロセス７００はステップ７０２から開始し、そこで周波数ビン内の出力を信号源に関連付ける表を設ける。プロセス７００のステップ７０４で、周波数ビンの１つを選択する。一例では、周波数ビンは第１の周波数ビンであるが、開始ビンを選択する別のやり方を使用してもよい。プロセス７００のステップ７０６で、周波数ビン内の出力割り当てを再配置し、プロセス７００のステップ７０８でグローバル費用関数を各信号源ごとに計算する。プロセス７００のステップ７１２で、すべての可能な配置が試されていることを検証する。すべての可能な割り当ての組み合わせが試されていない場合、プロセス７００は引き続きステップ７０６、７０８、７１２を繰り返す。そうでない場合、プロセス７００はステップ７１５に進み、そこで全般的最良適合を有する配置をこの周波数ビンの出力割り当てとして固定する。ステップ７１５は、ステップ７０８で計算して得られたグローバル費用関数を比較することを備える。プロセス７００のステップ７１７で、すべての周波数ビンが試され、固定されていることを検証する。すべての周波数ビンが試されていない場合、プロセス７００は引き続きステップ７０４、７０６、７０８、７１２、７１５および７１７を繰り返す。そうでない場合、プロセス７００はステップ７１９に進み、そこで再順序付け周波数領域データにＩＦＦＴを適用する。プロセス７００のステップ７２３で、時間領域信号を生成する。

ある実施形態では、本発明は、図１５Ａに示すような、複数のグループ再順序付けシステムに関するものである。再順序付けシステム７５０では、一方の軸に沿って複数の信号源が割り当てられ、他方の軸に沿って周波数ビンが割り当てられている。ブロック７５２に示すように周波数ビンのグループを選択する。前述のように単一の周波数ビンを操作するのではなく、システム７５０は、複数のビンを一緒に操作する。より詳細には、複数のビン７５２には最初、Ａ−Ａ、Ｂ−Ｎ、Ｎ−Ｂの組み合わせがあった。再配置のために、周波数ビン１と２の出力を１つの要素として一緒に処理する。このやり方では、代替配置７５６で示す６つの異なる配置が利用できる。代替配置のそれぞれを順次試し、信号源７５４などの各信号源ごとに費用関数を計算する。グローバル相関または費用関数７５８を各配置ごとに適用し、最良適合をもたらす配置を選択する。選択後に、最良適合配置を表に挿入する。図１５Ａに示すように、配置Ｂ−Ｎ、Ａ−Ａ、Ｎ−Ｂが最良適合を提供している。したがって、この配置を、図１５Ｂに示すようにｆ１およびｆ２に挿入する。

プロセス７５０は続いて別の周波数ビングループ７６１を選択する。図示するように、このグループは前のグループと重なり合う。また、グループを選択する任意の方法を使用し得ることも理解されるであろう。プロセス７５０は前述のように進行する。例えば、ｆ２およびｆ３を１つの要素として一緒に処理し、そのため、選択配置７５６には、６つの代替配置が利用できることが示されている。これらの各配置を試し、各配置ごとにグローバル費用関数を計算する。最良の相関を有する配置を選択し、次いでこの配置を順列表に挿入する。すべての周波数が使用されるまで引き続き周波数ビングループを進める。複数のパスを使用し得ることが理解されるであろう。また、複数グループのプロセス７５０を単一集合のプロセス７００と組み合わせて複数の再順序付けのパスを提供し得ることも理解されるであろう。例えば、第１のパスで単一集合の再順序付けを使用し、次いで、複数集合の再順序付けを用いて１つまたは複数のパスを行ってもよい。また、複数集合の再順序付けは、１集合で２つまたは別の数の周波数ビンを使用し得ることも理解されるであろう。

ある実施形態では、本発明は、図１６に示すような、順列表を再配置するプロセスに関するものである。プロセス７７５はステップ７７７から開始し、そこで周波数ビン内の出力を信号源に関連付ける表が設けられる。プロセス７７５のステップ７７９で、いくつかの周波数ビンをグループとしてまとめて選択する。考察する例では、グループ化される周波数ビンの数は２であるが、異なる数のビンを選択してもよい。プロセス７７５のステップ７８１で、出力割り当てを一緒に再配置する。プロセス７７５のステップ７８３で、各配置ごとに、各信号源ごとのグローバル費用関数を計算する。プロセス７７５のステップ７８５で、３つの信号源では６つの異なる利用可能な配置になるすべての配置が試されているかどうか判定する。すべての配置が試されていない場合、プロセス７７５は、ステップ７８１、７８３および７８５を繰り返す。そうでない場合、プロセス７７５はステップ７８７に進み、そこで最良適合割り当てを固定する。ステップ７８７は、すべてのグローバル費用関数を比較し、最良適合割り当てを最小のグローバルコストと関連付けられるものとして識別することを備える。プロセス７７５のステップ７８９で、すべての周波数グループが試されているかどうか判定する。すべての周波数グループが試されていない場合、プロセス７７５は次の周波数ブロックに進んでステップ７７９、７８１、７８３、７８５、７８７および７８９を繰り返す。これは１度に１つのビンだけ進めてもよく、別のスケジュールに従って進めてもよい。すべての周波数を再順序付けした後、複数グループプロセスを用いて別のパスを行ってもよく、別の再順序付けプロセスを用いてもよい。プロセス７７５のステップ７９１で、再順序付けした出力にＩＦＦＴを適用し、プロセス７７５のステップ７９３で、分離時間領域信号を生成する。

ある実施形態では、本発明は、図１７に示すような、順列表を再配置するボトムアップシステムに関するものである。再順序付けプロセス８００は、信号源８０２と関連付けられた周波数ビンを有する。方法８００を使用する際、周波数ビンを、線８０３で示すようにグループ化する。例えば、周波数ビンｆ１とｆ２を対にし、周波数ビンｆ３とｆ４を対にし、周波数ビンｆ５とｆ６を対にする。各対ごとに、対の一方のメンバを固定し、対の他方のメンバの出力を再配置する。周波数ビンｆ１とｆ２を表す対８０３を例にとる。周波数ビンｆ２は固定されるため、集合８０５内の第２の要素をＡ−Ｎ−Ｂに固定する。対の第２のメンバを固定して、対の第１のメンバ（ｆ１）を再配置し、各再配置ごとに各グループ内で費用関数を計算する。次いで、最良適合を有する出力の配置を選択し、固定する。このようにして、集合８０５が、ＡＡ、ＮＮ、およびＢＢに配置される。方法８００は、各周波数ビンを対にし、第１レベル８０４で各対ごとの最良適合配置を生成する。集合８０５など、結果として生じる第２レベル８０１内の各集合も同様に対のグループとし、対の第２のメンバの出力値を固定し、対の第１のメンバの出力値を再配置する。例えば、レベル３の第１の集合８０６は、出力ＡＡ、ＢＢおよびＮＮを固定し、次いで、この対（８０５）の第１のメンバの出力を再配置して最良適合を識別することを示している。最良適合が見つかった後で、新しい組み合わせの集合を作成する。同様に、レベル３の各集合８０６を対のグループにし、プロセスは引き続きレベル４の各集合８０８を生成する。最後に、各集合を対にし、組み合わせて最終出力８１０を生成する。

ある実施形態では、本発明は、図１８に示すような、順列表を再配置するボトムアッププロセスに関するものである。プロセス８５０はステップ８５２から開始し、そこで周波数ビン内の出力を信号源に関連付ける表を設ける。プロセス８５０のステップ８５４で、集合のうちの２つを選択し、同じレベルで対にする。第１の選択では、各集合が個々の周波数ビンに対応し、より高いレベルでは、各集合が周波数ビンのグループに対応する。プロセス８５０のステップ８５６で、出力または要素を再配置する。より詳細には、ステップ８５７に示すように、集合の一方の各値を固定し、対の他方のメンバの各値を再配置する。プロセス８５０のステップ８５９で、各グループ内の費用関数を計算する。プロセス８５０のステップ８６１で、すべての配置が試されているかどうか判定する。すべての配置が試されていない場合、プロセス８５０は引き続きステップ８５６、８５７および８５９を繰り返す。そうでない場合、プロセス８５０はステップ８６３に進み、そこで最良の配置の値を使って固定される次のレベルで集合を生成する。プロセス８５０のステップ８６５で、グループが現在のレベルにおける最後のグループであるかどうか判定する。最後のグループでない場合、プロセス８５０は引き続きステップ８５４、８５６、８５７、８５９、８６１、８６３および８６５を繰り返す。最後のグループである場合、プロセス８５０はステップ８６８に進み、そこで次のレベルに進むべきかどうか判定する。プロセス８５０は、複数のレベルを進んで、徐々により多くのビンを含む集合を生成する。プロセス８５０が次のレベルに進むたびに、ステップ８５４、８５６、８５７、８５９、８６１、８６３、８６５および８６８を繰り返す。最後のレベルに到達すると、プロセス８５０はステップ８７１に進み、そこで出力データにＩＦＦＴを適用する。プロセス８５０のステップ８７３で、時間領域信号を生成する。

ある実施形態では、本発明は、図１９Ａから１９Ｃに示すような、順列表を再配置するシステムに関するものである。図１９Ａに示すように、順序付けプロセス９００では、一方の軸に信号源が記載されており、別の軸に周波数ビンが記載されている。方法９００では、比較のために、最初の２つの周波数、例えば周波数９０２と９０４などを選択する。より詳細には、中心周波数９０２の値を固定し、プール９０１内のビンの費用関数が最小になるまで周波数９０４の出力値を再配置する。このようにして、出力９０２との最良適合が見つかるまで、周波数ビン９０４の出力を再配置する。図では、出力９０２を周波数ビンの中心周波数として選択し、周波数９０４は１／４周波数である。他の機構を使って初期の２つの周波数を選択してもよいことが理解されるであろう。次にプールに加えるためにやはり１／４周波数９０６である第３の周波数を選択する。周波数９０２と９０４の値を固定しておき、周波数ビン９０６の出力を最良適合が見つかるまで再配置し、次いで、最良適合値をプール９０７に挿入する。同様に、次に１／８周波数９０８を適用し、周波数９０２、９０４、９０６をプール内で固定する。このようにして、図１９Ｂに示すように、最良適合が見つかるまで周波数ビン９０８の周波数出力を再配置し、最良適合値を周波数プール９０９に挿入する。方法９００は、図１９Ｃに示すように、ブロック９１５で示すようにプール９０１全体が埋まるまで、次の１／８周波数を加え、次いで、１／１６周波数（および、もしあれば、１／３２周波数、１／６４周波数など）に進む。周波数比較を選択し、順序付けする他のプロセスを使用してもよいことが理解されるであろう。

ある実施形態では、本発明は、図２０に示すような、順列表を再配置するプロセスに関するものである。プロセス９５０はステップ９５２から開始し、そこで周波数ビン内の出力を信号源に関連付ける表を設ける。プロセス９５０のステップ９５４で、開始周波数ビンを選択し、再順序付けプールに加える。一例では、プロセス９５０は、開始周波数を中心として選択するステップ９５５を含む。プロセス９５０のステップ９５７で、１／２周波数とし得る別の周波数ビンを選択し、続いて１／４周波数を選択し、続いて１／８周波数を選択し、以下同様とする（９５８）。プロセス９５０のステップ９６１で、選択した周波数ビンにおいて各出力の信号源割り当てを再配置し、プロセス９５０のステップ９６３で、各配置ごとにプール内で費用関数を計算する。プロセス９５０のステップ９６７で、すべての配置が試されているかどうか判定する。すべての配置が試されていない場合、プロセス９５０は引き続きステップ９６１、９６３および９６５を繰り返す。そうでない場合、プロセス９５０はステップ９６７に進み、そこで最良適合を有する配置を再順序付けプールに加える。プロセス９５０のステップ９６９で、すべての周波数が再順序付けプールに加えられているかどうか判定する。すべての周波数が加えられていない場合、プロセス９５０は引き続きステップ９５７、９６１、９６３、９６５、９６７および９６９を繰り返す。そうでない場合、プロセス９５０はステップ９７２に進み、そこで再順序付けプールをＩＦＦＴに送る。プロセス９５０はステップ９７３に進み、そこで時間領域信号を生成する。

ある実施形態では、本発明は、図２１に示すような、順列表を再配置するプロセスに関するものである。プロセス９７５はステップ９７７から開始し、そこで音響信号をローリングウィンドウとして獲得する。プロセス９７５のステップ９７９で、各ウィンドウにＦＦＴを適用し、プロセス９７５のステップ９８１で、ＦＦＴの結果を、信号分離プロセスへの入力として使用する。プロセス９７５のステップ９８３で、信号源に従って周波数ビン内の出力を配置する表を生成する。表を９８５に示すように再順序付けする。より詳細には、ブロック９８６に示すようにトップダウンプロセスを適用し、ブロック９８７に示すようにボトムアッププロセスを適用し、ブロック９８８に示すように線形単一集合を適用し、かつ／またはブロック９８９に示すように線形複数集合を適用する。再順序付けプロセスのそれぞれの詳細についてはすでに論じており、詳細には扱わない。プロセス９７５はステップ９９２に進み、そこで次の再順序付けパスを出すかどうか判定する。そうである場合、プロセス９７５はブロック９８５を繰り返す。例えば、複数の線形単一集合プロセス９８８を実行することが望ましいこともあり、複数の線形複数集合９８９を実行することが望ましいこともある。様々な組み合わせの単一および複数集合の線形プロセスを使用し得ることが理解されるであろう。別の例では、トップダウン９８６プロセスまたはボトムアップ９８７プロセスをまず適用し、次いで、線形プロセスを適用する。しかし、トップダウン９８６プロセスおよびボトムアップ９８７プロセスは通常は相互に排他的であり、トップダウン９８６プロセスまたはボトムアップ９８７プロセスは通常は線形プロセスを使用した後には適用されないことが理解されるであろう。ステップ９９２で、さらなる再順序付けパスが行われない場合、プロセス９７５はステップ９９４に進み、そこで再順序付けした周波数領域データにＩＦＦＴを適用する。プロセス９７５のステップ９９６で、分離時間領域信号を生成する。

以上の各項では、図１３Ａの６５６などの周波数ビン、または図１５Ａのブロック７５２のような周波数ビングループの所与の順列が、この順列が選択されるときに、すべての信号源に関する「グローバル相関」費用関数の結果として生じる総和に基づいて評価されることに言及している。この総和を「グランドグローバル相関費用関数」という。図１２を参照すると、このグローバル相関費用関数は、例えば信号源２などの１つの信号源内で、各周波数間のコヒーレンスを、経時的サンプルウィンドウロールフォワードとして測る。ある周波数からの複素数値のＱ（ブロック６０９）が、別の周波数からの複素数値のＱと同時に活性化するとき、これら２つの周波数は高い相関を有するはずであり、コヒーレントであるという。ある周波数集合に対するグローバル相関費用関数は、この集合内のすべての周波数対のコヒーレンス尺度の総和とすることができる。またこれは、この集合内のすべての３つの周波数の組のコヒーレンス尺度の総和とすることもできる。周波数間のコヒーレンスを反映する任意の形の費用関数を使って、プロセス７００、７７５、８５０および９５０により、周波数ビンまたは周波数ビングループの最良適合順列を求めることができることが理解されるはずである。例えば、参照により全文が本明細書に組み込まれる、ＴａｅｓｕＫｉｍ、ＨａｇａｉＡｔｔｉａｓ、Ｓｏｏ−ＹｏｕｎｇＬｅｅ、およびＴｅ−ＷｏｎＬｅｅ、「高次周波数依存関係を利用したブラインド信号源分離（Blind source separation exploiting higher-order frequency dependencies）」、ＩＥＥＥＴｒａｎｓ．ＳｐｅｅｃｈＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ、第１４巻、第１号、２００６に記載されている独立ベクトル分析費用関数を使って順列最適化のためのコヒーレンスを測定してもよい。グローバル相関費用関数は、ある信号源内のすべての周波数に対して定義される必要はないことに留意すべきである。費用関数は、任意の周波数集合に適用することができる。この集合は、図１２の信号源内のすべての周波数６０４を指すものでもよい。また、この集合は、ブロック８０５のような２つの周波数のグループとすることも、ブロック８０６のような４つの周波数のグループとすることもでき、以下同様である。

さて、入力信号を周波数領域においてＸ（ω，ｌ）で表わされるものとする。ここで、Ｘ（ω，ｌ）＝［Ｘ_１（ω，ｌ），……，Ｘ_Ｍ（ω，ｌ）］^Ｔは、各要素がＭ個のチャネルの各入力を表す複素数値ベクトルである。ωは周波数を表し、ｌはウィンドウインデックスである。信号分離の後、出力はＹ（ω，ｌ）＝［Ｙ_１（ω，ｌ），……，Ｙ_Ｎ（ω，ｌ）］^Ｔで表わされ、これはＮ個の出力チャネルがあることを意味する。

一実施形態では、周波数グループω_ａのコヒーレンス関数は、

式（７）
であり、２つの周波数グループω_ａ、ω_ｂのコヒーレンス関数は、

式（８）
であり、周波数グループω_ａのグランドコヒーレンス関数は、すべての出力チャネルのコヒーレンス関数の単なる総和である。

式（９）
グローバルコヒーレンス関数は、
Ｋ_ｎ＝Ｋ_ｎ（ω_ａ），ω_ａ＝｛１，２，Λ，Ω｝式（１０）
であり、式中、Ωは周波数ビンの総数であり、グランドグローバルコヒーレンス関数は、

式（１１）
である。

別の実施形態では、１つの出力チャネルｎの２つの周波数ω_１、ω_２の間の相関関数が、

式（１２）
として定義され、２つの周波数グループω_ａ、ω_ｂの間の相関費用関数は、

式（１３）
であり、２つの周波数グループω_ａ、ω_ｂのすべての出力チャネルのグランドグローバル相関は、

式（１４）
である。

２つのグループがそれぞれ全周波数集合を含む場合、相関関数は１チャネルのグローバル相関は、
Ｃ_ｎ＝Ｃ_ｎ（ω_ａ，ω_ｂ），ω_ａ＝ω_ｂ＝｛ｌ，２，Λ，Ω｝式（１５）
になり、すべての出力チャネルおよびすべての周波数のグランドグローバル相関は、

式（１６）
である。

周波数順列訂正の線形法の線形法では、これの線形法において周波数を走査し、各周波数ごとにベクトルＹ（ω，ｌ）の各要素を並べ替えてＫまたはＣを最適化する。各周波数を通して走査するときに、ｇ個の隣接周波数を一緒に並べ替えてＫまたはＣを最適化してもよい。線形法の擬似コードは以下の通りである。

１）for g = 1 to g_max do
２）for ω = 1 to Ω-g
３）ω_g = [ω,...,ω+g-l]
４）Permute Y(ωg,l）together to optimize K (or C)
５）end for
６）end for
周波数順列訂正のボトムアップ法は、隣接周波数の対ω_ａ＝｛ω_１，ω_２｝を並べ替えてＫ（｛ω_１，ω_２｝）またはＣ（｛ω_１，ω_２）｝を最適化することを含む。これを他の対について繰り返す。次に、対ω_ａ、ω_ｂの隣接対を並べ替えてＫ（｛ω_ａ，ω_ｂ｝）またはＣ｛（ω_ａ，ω_ｂ）｝を最適化する。このプロセスを他の対の対について繰り返す。次に、対の対の隣接対を並べ替えてこれらのＫまたはＣを最適化する。これを、対の対の対を形成することができなくなるまで繰り返す。擬似コードは以下の通りである。

１）g = 2
２）while g/2 < Ω do
３）for ω = 1 to Ω step g do
４）ω_a = {ω,...ω+g/2-1}, ω_b = {ω +g/2,...ω+ g-1 }
５）Permute Y(ω_b,l）together to optimize K({ω_a, ω_b}）(or C ({ω_a, ω_b}))
６）end for
７）g = 2g
８）end while
トップダウン法は、中心周波数だけのプールから開始し、次いでこのプールに一度に１／４周波数を加える。新たに加えた周波数を並べ替えて、プール内の周波数グループω_ａのＫ（ω_ａ）またはＣ（ω_ａ）を最適化する。擬似コードは以下の通りである。

１）g = (Ω-l)/2, ω_a={g}
２）while g > 1 do
３）for ω = g/2 to Ω-1 step g do
４）add ω to ω_a
５）Permute Y(ω,l）to optimize K(ω_a）or C(ω_a)
６）end while
装置
本明細書の任意の方法またはプロセスを装置に組み込んでもよい。プロセスの各ステップは装置のモジュールまたはサブモジュールとして含まれる。実施形態によっては、装置は音声装置である。音声装置は、ヘッドセット、無線モバイルハンドセット、または電話機とすることができる。装置は１つまたは複数のマイクロホンを含んでいてもよい。装置はマイクロホンアレイを含んでいてもよい。

また、装置を医療用装置とすることもできる。例えば、装置を使ってＥＫＧやＥＥＧデータを分離してもよい。

本明細書で述べる方法、プロセス、またはシステムは、データをリアルタイムで処理するのに使用してもよく、データを事後処理するのに使用してもよい。

ある実施形態では、本発明は、本明細書で述べるプロセスまたは方法を実行するモジュールを含むソフトウェアまたはコンピュータに関するものである。コンピュータは、メモリ、プロセッサ、および／またはディスプレイを備え得る。コンピュータは、ヘッドセットなどの本明細書で述べる別の装置に接続されていてもよい。

本発明の各実施形態は、ステップが省略され、追加され、または再配置されているプロセスを含むことが理解されるであろう。

演繹的制約条件を含む信号分離システムの一実施形態を示す図である。学習規則に演繹的制約条件を適用するモジュールを含む信号分離システムの一実施形態を示す図である。信号分離システムの一実施形態を示す図である。信号分離プロセスの一実施形態を示す流れ図である。信号分離システムの一実施形態を示す図である。音響シナリオの例を示す概略図である。図６で示す例に適用された従来技術のプロセスを使ったＩＶＡ出力の到来方向ヒストグラムを示す図である。図６で示す例に適用された本明細書で述べる信号分離プロセスを使ったＩＶＡ出力の到来方向ヒストグラムを示す図である。図６で示す例に適用された様々なプロセスの空間フィルタ特性を示す図である。信号分離プロセスの一実施形態を示す図である。分離プロセスの一実施形態を示す流れ図である。信号分離プロセスの一実施形態の順列表を示す図である。信号分離プロセスの一実施形態による順列表の再順序付けを示す図である。信号分離プロセスの一実施形態による順列表の再順序付けを示す図である。信号分離プロセスの一実施形態を用いて順列表を再順序付けするプロセスを示す流れ図である。信号分離プロセスの一実施形態による順列表の再順序付けを示す図である。信号分離プロセスの一実施形態による順列表の再順序付けを示す図である。信号分離プロセスを用いて順列表を再順序付けするプロセスの一実施形態を示す流れ図である。信号分離プロセスによる順列表の再順序付けの一実施形態を示す図である。信号分離プロセスを用いて順列表を再順序付けするプロセスの一実施形態を示す流れ図である。信号分離プロセスによる順列表の再順序付けの一実施形態を示す図である。信号分離プロセスによる順列表の再順序付けの一実施形態を示す図である。信号分離プロセスによる順列表の再順序付けの一実施形態を示す図である。信号分離プロセスを用いて順列表を再順序付けするプロセスの一実施形態を示す流れ図である。信号分離プロセスを用いて順列表を再順序付けするプロセスの一実施形態を示す流れ図である。

Claims

それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える前記周波数領域第１信号の集合を受け取ることと、
前記周波数領域第１信号の集合を、前記複数の周波数の個々の周波数に対応する分離された周波数領域第２信号要素の集合を備える周波数領域第２信号の集合であり、前記周波数領域第２信号の集合のうちのどの信号が前記周波数領域第２信号要素を含むかを示す識別子が前記周波数領域第２信号要素のそれぞれに割り当てられている前記周波数領域第２信号の集合に分離することと、
前記周波数領域第２信号のコヒーレンスを改善し、周波数領域第３信号の集合を生成するために、少なくとも１つの周波数に対応する前記識別子を再順序付けすることと、
を備える信号分離の方法。
前記周波数領域第１信号の集合を分離することは、ブラインド信号源分離法を備える、請求項１に記載の方法。
前記ブラインド信号源分離法は、個々の周波数に対応する前記周波数領域第１信号要素に適用される、請求項２に記載の方法。
前記コヒーレンスは、異なる周波数における信号の同時活動性を反映する関数を備える、請求項１に記載の方法。
前記周波数領域第２信号の前記コヒーレンスを改善することは、前記周波数領域第２信号の前記コヒーレンスを最適化することを備える、請求項１に記載の方法。
前記周波数領域第２信号の前記コヒーレンスを改善することは、隣接する１対の前記周波数領域第２信号要素の前記コヒーレンスを改善することを備える、請求項１に記載の方法。
前記識別子を再順序付けすることは、複数の周波数に対応する前記識別子を再順序付けすることを備え、前記識別子を再順序付けすることは、前記複数の周波数のうちの低い周波数から前記複数の周波数のうちの高い周波数へと前記識別子を順次再順序付けすることをさらに備える、請求項６に記載の方法。
前記識別子を再順序付けすることは、複数の周波数に対応する前記識別子を再順序付けすることを備え、前記識別子を再順序付けすることは、オーバーラップしない対の周波数領域第２信号要素の間の前記コヒーレンスを改善することをさらに備える、請求項６に記載の方法。
前記周波数領域第２信号の前記コヒーレンスを改善することは、
第１の周波数部分集合に対応する前記周波数領域第２信号要素の前記コヒーレンスを最適化することと、
第２の周波数部分集合に対応する前記周波数領域第２信号要素の前記コヒーレンスを最適化することと
を備え、
前記第２の周波数部分集合は、前記第１の周波数部分集合より大きく、
前記第２の周波数部分集合は、前記第１の周波数部分集合を含む、請求項１に記載の方法。
時間領域入力信号の集合を変換して前記周波数領域第１信号の集合を生成することをさらに備える、請求項１に記載の方法。
前記時間領域入力信号は混合音響信号である、請求項９に記載の方法。
前記混合音響信号は音声信号を備える、請求項１１に記載の方法。
前記周波数領域第３信号の集合の周波数領域第３信号を逆変換して所望の信号を生成することをさらに備える、請求項１に記載の方法。
それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える前記周波数領域第１信号の集合を受け取ることと、
学習規則を備える独立ベクトル分析（ＩＶＡ）法を使って前記周波数領域第１信号の集合を周波数領域第２信号の集合に分離することと、
前記学習規則に１つまたは複数の制約条件を適用することと
を備える、信号分離の方法。
前記１つまたは複数の制約条件は、前記周波数領域第２信号の集合から導出される、請求項１４に記載の方法。
前記学習規則に１つまたは複数の制約条件を適用することは、極小または極大で収束する確率を低減する、請求項１４に記載の方法。
周波数領域第１信号の第２の集合を受け取ることと、前記制約付きの信号分離の方法を使って周波数領域第１信号の前記第２の集合を分離することとをさらに備える、請求項１４に記載の方法。
前記１つまたは複数の制約条件は幾何学的制約条件を備える、請求項１４に記載の方法。
前記幾何学的制約条件は推定到来方向情報を備え、前記到来方向情報は、既知のセンサ位置を使ったヒストグラムおよび／または他の統計的技法から出力信号サブバンドを算出することによって推定される、請求項１８に記載の方法。
前記１つまたは複数の制約条件は、信号のスペクトルまたはエネルギ特性に関する情報を備える、請求項１４に記載の方法。
前記信号は、周波数領域第１信号、望ましい出力信号、および望ましくない出力信号の中から選択される、請求項２０に記載の方法。
前記１つまたは複数の制約条件は非導出制約条件を備える、請求項１４に記載の方法。
時間領域入力信号の集合を受け取る受信機と、
前記時間領域入力信号の集合を、それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える前記周波数領域第１信号の集合に変換する変換モジュールと、
前記周波数領域第１信号の集合を、前記複数の周波数の個々の周波数に対応する分離された周波数領域第２信号要素の集合を備える周波数領域第２信号の集合であり、前記周波数領域第２信号の集合のうちのどの信号が前記周波数領域第２信号要素を含むかを示す識別子が前記周波数領域第２信号要素のそれぞれに割り当てられている前記周波数領域第２信号の集合に分離する周波数領域信号分離モジュールと、
前記周波数領域第２信号の前記コヒーレンスを改善し、周波数領域第３信号の集合を生成するために、少なくとも１つの周波数に対応する前記識別子を再順序付けする再順序付けモジュールと、
を備える、信号を分離するシステム。
前記周波数領域信号分離モジュールは、独立成分分析法または独立ベクトル分析法を使って前記周波数領域第１信号の集合を分離する、請求項２３に記載のシステム。
前記再順序付けモジュールは、
前記対応する周波数を決定することによって再順序付けすべき第１の周波数領域第２信号要素を決定する初期パラメータサブモジュールと、
所定の周波数に隣接する周波数に対応する周波数領域第２信号要素を用いて、前記所定の周波数に対応する周波数領域第２信号要素の前記コヒーレンスを改善するコヒーレンス改善サブモジュールと、
再順序付けすべき次の周波数領域第２信号要素を決定する周波数前進サブモジュールであり、次の周波数領域第２信号要素を、最も新しく再順序付けされた周波数領域第２信号要素に対応する周波数に隣接した周波数に対応する周波数領域第２信号要素として決定する前記周波数前進サブモジュールと、
を備える、請求項２３に記載のシステム。
前記再順序付けモジュールは、
前記対応する周波数を決定することによって再順序付けすべき第１の周波数領域第２信号要素を決定する初期パラメータサブモジュールと、
所定の周波数に隣接する周波数に対応する周波数領域第２信号要素を用いて、前記所定の周波数に対応する周波数領域第２信号要素の前記コヒーレンスを改善するコヒーレンス改善サブモジュールと、
再順序付けすべき次の周波数領域第２信号要素を決定する周波数前進サブモジュールであり、次の周波数領域第２信号要素を、以前に前記コヒーレンス改善サブモジュールによって分析されていない周波数領域第２信号要素として決定する前記周波数前進サブモジュールと、
を備える、請求項２３に記載のシステム。
前記再順序付けモジュールは、
再順序付け要素グループの初期状態を、少なくとも１つの周波数に対応する第１の周波数領域第２信号要素として決定する初期パラメータサブモジュールと、
前記再順序付け要素グループ内の周波数領域第２信号要素の前記コヒーレンスを改善するコヒーレンス改善サブモジュールと、
前記再順序付け要素グループに加えるべき周波数領域第２信号要素を決定する周波数前進サブモジュールと、
を備える、請求項２３に記載のシステム。
前記周波数領域第３信号の集合の周波数領域第３信号を逆変換して所望の信号を生成する逆変換モジュールをさらに備える、請求項２３に記載のシステム。
ヘッドセットを備える、請求項２７に記載のシステム。
電話機を備える、請求項２７に記載のシステム。
時間領域入力信号の集合を受け取る受信機と、
前記時間領域入力信号の集合を、それぞれが複数の周波数に対応する周波数領域第１信号要素を備える周波数領域第１信号の集合であり、複数の信号源を備える前記周波数領域第１信号の集合に変換する変換モジュールと、
学習規則を備える独立ベクトル分析（ＩＶＡ）法を使って前記周波数領域第１信号の集合を周波数領域第２信号の集合に分離する周波数領域信号分離モジュールと、
前記学習規則に１つまたは複数の制約条件を強制する制約条件強制モジュールと、
を備える、信号を分離するシステム。
前記周波数領域第２信号の集合から前記１つまたは複数の制約条件を導出する制約条件導出モジュールをさらに備える、請求項３１に記載のシステム。
前記１つまたは複数の制約条件は幾何学的制約条件を備える、請求項３１に記載のシステム。
前記幾何学的制約条件は推定到来方向情報を備える、請求項３３に記載のシステム。
前記到来方向情報は、既知のセンサ位置を使ったヒストグラムおよび／または他の統計的技法から出力信号サブバンドを算出することによって推定される、請求項３４に記載のシステム。
前記１つまたは複数の制約条件は非導出制約条件を備える、請求項３１に記載のシステム。
前記１つまたは複数の制約条件は、前記周波数領域信号分離モジュール内の信号のスペクトルまたはエネルギ特性に関する情報を備える、請求項３１に記載のシステム。
ヘッドセットを備える、請求項３１に記載のシステム。
電話機を備える、請求項３１に記載のシステム。