JP5277887B2

JP5277887B2 - 信号処理装置およびプログラム

Info

Publication number: JP5277887B2
Application number: JP2008292169A
Authority: JP
Inventors: 誠山田; 多伸近藤
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2008-11-14
Filing date: 2008-11-14
Publication date: 2013-08-28
Anticipated expiration: 2028-11-14
Also published as: EP2187389B1; EP2187389A2; US20100125352A1; JP2010117653A; EP2187389A3; US9123348B2

Description

本発明は、複数音の混合音のうち特定の音を強調（典型的には分離ないし抽出）または抑制する技術に関する。

別個の音源から放射された複数音（音声や雑音）の混合音を複数の収音機器で収音した複数の観測信号に音源分離を実行することで、各音源からの音が個別に強調または抑制される。観測信号の音源分離に使用される分離行列の算定には独立成分分析（ICA（independent component analysis））による学習が利用される。

例えば特許文献１には、周波数領域の独立成分分析（FDICA（frequency-domain independent component analysis））を利用して複数の周波数（帯域）の各々の分離行列を学習する技術が開示されている。すなわち、各観測信号から抽出された周波数毎の観測ベクトルの時系列に当該周波数の暫定的な分離行列を乗算することで音源分離を実行し、音源分離後の各信号の統計的な独立性が最大化されるように分離行列が反復的に更新される。特許文献１には、学習の過程で分離精度の変化が少ない周波数を以後の学習の対象から除外する（すなわち学習を終了する）ことで演算量を削減する技術が開示されている。
特開２００６−８４８９８号公報

しかし、周波数領域の独立成分分析においては、複数の周波数の各々について観測ベクトルの時系列を記憶する大容量の記憶装置が必要である。特許文献１の技術においては、分離精度の変化が少ない周波数の学習行列について学習を終了することで演算量は削減されるが、学習の開始の当初には総ての周波数について分離行列の学習が実行されるから、観測ベクトルの時系列を総ての周波数について記憶する大容量の記憶装置が必要である。以上の事情を考慮して、本発明は、分離行列の生成（学習）に必要な記憶容量を削減することを目的とする。

以上の課題を解決するために、本発明に係る信号処理装置は、複数音（音声や雑音（非音声）などの音響）の混合音を複数の収音機器で収音した複数の観測信号の各々における各周波数での強度（振幅またはパワー）の時系列を示す観測データを複数の周波数の各々について記憶する記憶手段と、各周波数の観測データを使用した分離行列の学習の有意性の指標値を当該観測データから複数の周波数の各々について算定する指標算定手段と、指標算定手段が算定した各周波数の指標値に応じて複数の周波数のうち少なくともひとつの周波数を選択する周波数選択手段と、記憶手段に記憶された複数の観測データのうち周波数選択手段が選択した周波数の観測データを使用した初期分離行列の学習で当該周波数の分離行列を決定する学習処理手段とを具備する。以上の構成においては、観測データを利用した学習の有意性が高い周波数のみについて選択的に分離行列の学習が実行されるから、非選択の周波数の観測データは学習処理部による学習に不要である。したがって、各周波数の分離行列の生成に必要な記憶手段の容量や学習処理部による処理量が低減されるという利点がある。

分離行列の学習は、独立な基底を音源の個数だけ特定する処理と等価であるから、複数の観測信号の各々における各周波数での強度を要素とする観測ベクトルの分布における基底の総数は、観測データを利用した学習の有意性の指標として好適に利用される。そこで、本発明の好適な態様における指標算定手段は、複数の観測信号の各々における各周波数での強度を要素とする観測ベクトルの分布における基底の総数の指標値を算定し、周波数選択手段は、指標値が示す基底の総数が多い周波数を選択する。基底の総数の指標値としては、例えば、観測ベクトルの共分散行列の行列式や条件数が好適に採用される。共分散行列の行列式を利用する構成において、指標算定手段は、例えば、観測ベクトルの共分散行列の特異値分解で特定される特異値行列の複数の対角成分のうち第１個数（例えばｎ個）の対角成分を乗算した第１行列式と、複数の対角成分のうち第１個数よりも少ない第２個数（例えば(ｎ−１)個）の対角成分を乗算した第２行列式とを算定し、周波数選択手段は、第１行列式を利用した周波数の選択と、第２行列式を利用した周波数の選択とを順次に実行する。

また、複数の観測信号の相互間の独立性が高い（相関が低い）ほど、観測データを利用した学習の有意性は高いという傾向がある。そこで、本発明の好適な態様に係る指標算定手段は、複数の観測信号の相互間の独立性の指標値を算定し、周波数選択手段は、指標値が示す独立性が高い周波数を選択する。複数の観測信号の相互間の独立性の指標値としては、例えば、相互相関や相互情報量が好適に採用される。

観測ベクトルの共分散行列のトレース（パワー）が大きいほど観測ベクトルの分布領域（基底）が音源毎に明確に特定されるという傾向を考慮すると、複数の観測信号の共分散行列のトレースが大きい周波数を選択する構成が好適である。また、観測信号の強度の度数分布における尖度が低いほど観測信号が多くの音源からの音を含むという傾向を考慮すると、観測信号の強度の度数分布における尖度が低い周波数を選択する構成が好適である。

複数の周波数の各々について初期分離行列を生成する初期値生成手段を具備する態様の具体例において、学習処理手段は、周波数選択手段が選択した周波数の初期分離行列を初期値とした学習で当該周波数の分離行列を生成し、周波数選択手段が選択しなかった周波数の初期分離行列を当該周波数の分離行列とする。以上の構成によれば、非選択の周波数の分離行列を簡便に用意することが可能である。

もっとも、初期分離行列が適切でない場合、分離行列を適用した音源分離の精度が低下する可能性がある。そこで、本発明の好適な態様に係る信号処理装置は、学習処理手段が生成した分離行列から複数音の各々の音源の方向を推定する方向推定手段と、周波数選択手段が選択しなかった周波数の分離行列を、方向推定手段が推定した方向から生成する行列補充手段とを具備する。以上の態様においては、学習処理部による学習後の分離行列から非選択周波数の分離行列が生成（補充）されるから、非選択周波数についても高精度な音源分離が実現されるという利点がある。ただし、低域側の周波数や高域側の周波数の分離行列から各音源の方向を高精度に推定することは困難である。したがって、複数の周波数のうち低域側の周波数および高域側の周波数の少なくとも一方を除外した周波数の分離行列から方向推定手段が複数音の各々の音源の方向を推定する構成が好適である。

本発明の好適な態様において、前記指標算定手段は、前記複数の周波数の各々の指標値を単位区間毎に順次に算定し、前記周波数選択手段は、前記複数の周波数の各々の選択／非選択を各単位区間の指標値に応じて単位区間毎に順次に判別する第１選択手段と、複数の単位区間にわたる前記第１選択手段の判別の結果から前記少なくともひとつの周波数を選択する第２選択手段とを含む。以上の態様においては、複数の単位区間にわたる第１選択手段の判別の結果から周波数が選択されるから、１個の単位区間の指標値のみから周波数を選択する構成と比較すると、観測データが変化し易い場合（例えば雑音が多い場合）であっても周波数の選択／非選択が安定的に判別される。したがって、分離行列が高精度に学習されるという利点がある。

さらに好適な態様において、前記第１選択手段は、前記複数の周波数の各々について選択／非選択を示す数値列を単位区間毎に順次に生成し、前記第２選択手段は、前記複数の単位区間の各々の数値列の加重和から前記少なくともひとつの周波数を選択する。以上の態様においては、複数の単位区間の各々の数値列の加重和から周波数が選択されるから、複数の単位区間のうち特定の単位区間の指標値（周波数の選択／非選択の判別の結果）を優先的に考慮して周波数の選択／非選択を判別できるという利点がある。

以上の各態様に係る信号処理装置は、音声の処理に専用されるＤＳＰ（Digital Signal Processor）などのハードウェア（電子回路）によって実現されるほか、ＣＰＵ（Central Processing Unit）などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、複数音の混合音を複数の収音機器で収音した複数の観測信号の各々における各周波数での強度の時系列を示す観測データを複数の周波数の各々について記憶する記憶手段を具備するコンピュータに、各周波数の観測データを使用した分離行列の学習の有意性の指標値を当該観測データから複数の周波数の各々について算定する指標算定処理と、指標算定処理で算定した各周波数の指標値に応じて複数の周波数のうち少なくともひとつの周波数を選択する周波数選択処理と、記憶手段に記憶された複数の観測データのうち周波数選択処理で選択した周波数の観測データを使用した初期分離行列の学習で当該周波数の分離行列を決定する学習処理処理とを実行させる。以上のプログラムによれば、本発明に係る信号処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。

＜Ａ：第１実施形態＞
図１は、本発明の第１実施形態に係る信号処理装置のブロック図である。相互に間隔をあけて平面ＰL内に配置されたｎ個の収音機器Ｍが信号処理装置１００に接続される（ｎは２以上の自然数）。第１実施形態においては、収音機器Ｍ1および収音機器Ｍ2の２個が信号処理装置１００に接続された場合（ｎ＝２）を想定する。収音機器Ｍ1および収音機器Ｍ2の周囲の相異なる位置にはｎ個の音源Ｓ（Ｓ1，Ｓ2）が存在する。音源Ｓ1は、平面ＰLの法線Ｌnに対して角度θ1の方向に位置し、音源Ｓ2は、法線Ｌnに対して角度θ2（θ2≠θ1）の方向に位置する。

音源Ｓ1から放射された音ＳV1と音源Ｓ2から放射された音ＳV2との混合音が収音機器Ｍ1および収音機器Ｍ2に到達する。収音機器Ｍ1および収音機器Ｍ2の各々は、音源Ｓ1からの音ＳV1と音源Ｓ2からの音ＳV2との混合音の波形を表す観測信号Ｖ（Ｖ1，Ｖ2）を生成するマイクロホンである。収音機器Ｍ1は観測信号Ｖ1を生成し、収音機器Ｍ2は観測信号Ｖ2を生成する。

信号処理装置１００は、観測信号Ｖ1および観測信号Ｖ2にフィルタ処理（音源分離）を実行することで分離信号Ｕ1および分離信号Ｕ2を生成する。分離信号Ｕ1は、音源Ｓ1からの音ＳV1を強調した音響信号（音源Ｓ2からの音ＳV2を抑制した音響信号）であり、分離信号Ｕ2は、音ＳV2を強調した音響信号（音ＳV1を抑制した音響信号）である。すなわち、音源Ｓ1からの音ＳV1と音源Ｓ2からの音ＳV2とが分離（音源分離）される。

分離信号Ｕ1や分離信号Ｕ2は、放音機器（例えばスピーカやヘッドホン）に供給されることで音響として再生される。分離信号Ｕ1および分離信号Ｕ2の一方のみを再生する構成（例えば分離信号Ｕ2を雑音として破棄する構成）も採用される。なお、観測信号Ｖ1および観測信号Ｖ2をデジタル信号に変換するＡ/Ｄ変換器や、分離信号Ｕ1および分離信号Ｕ2をアナログ信号に変換するＤ/Ａ変換器の図示は便宜的に省略されている。

図１に示すように、信号処理装置１００は、演算処理装置１２と記憶装置１４とを含むコンピュータシステムで実現される。記憶装置１４は、観測信号Ｖ1および観測信号Ｖ2から分離信号Ｕ1および分離信号Ｕ2を生成するためのプログラムや各種のデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体が記憶装置１４として任意に採用される。

演算処理装置１２は、記憶装置１４に格納されたプログラムを実行することで複数の要素（周波数分析部２２，信号処理部２４，信号合成部２６，分離行列生成部４０）として機能する。なお、観測信号Ｖの処理に専用される電子回路（ＤＳＰ）が演算処理装置１２の各要素を実現する構成や、演算処理装置１２の各要素を複数の集積回路に分散的に搭載した構成も採用される。

周波数分析部２２は、観測信号Ｖ（Ｖ1，Ｖ2）を時間軸上で区分した複数のフレームの各々について周波数スペクトルＱ（観測信号Ｖ1の周波数スペクトルＱ1および観測信号Ｖ2の周波数スペクトルＱ2）を算定する。周波数スペクトルＱの算定には例えば短時間フーリエ変換が利用される。図２に示すように、番号（時刻）ｔで識別される１個のフレームの周波数スペクトルＱ1は、周波数軸上に設定されたＫ個の周波数ｆ1〜ｆKの各々における強度ｘ1(t,f1)〜ｘ1(t,fK)として算定される。同様に、周波数スペクトルＱ2は、Ｋ個の周波数ｆ1〜ｆKの各々における強度ｘ2(t,f1)〜ｘ2(t,fK)として算定される。

周波数分析部２２は、Ｋ個の周波数ｆ1〜ｆKについてフレーム毎に観測ベクトルＸ(t,f1)〜Ｘ(t,fK)）を生成する。第ｋ番目（ｋ＝１〜Ｋ）の周波数ｆkの観測ベクトルＸ(t,fk)は、図２に示すように、周波数スペクトルＱ1のうち周波数ｆkでの強度ｘ1(t,fk)と、共通のフレームの周波数スペクトルＱ2のうち周波数ｆkでの強度ｘ2(t,fk)とを要素とするベクトル（Ｘ(t,fk)＝［ｘ1(t,fk)^＊ｘ2(t,fk)^＊］^Ｈである。記号＊は複素共役を意味し、記号Ｈは行列の転置（エルミート転置）を意味する。周波数分析部２２がフレーム毎に生成した観測ベクトルＸ(t,f1)〜Ｘ(t,fK)は記憶装置１４に格納される。

記憶装置１４に格納された観測ベクトルＸ(t,f1)〜Ｘ(t,fK)は、図２に示すように、所定個（例えば50個）のフレームで構成される単位区間ＴU毎に観測データＤ(f1)〜Ｄ(fK)に区分される。周波数ｆkの観測データＤ(fk)は、単位区間ＴU内の各フレームについて算定された周波数ｆkの観測ベクトルＸ(t,fk)の時系列である。

図１の信号処理部２４は、周波数分析部２２が算定した強度ｘ1(t,fk)と強度ｘ2(t,fk)とにフィルタ処理（音源分離）を実行することでフレーム毎に順次に強度ｕ1(t,fk)および強度ｕ2（t,fk）を生成する。信号合成部２６は、信号処理部２４が生成した強度ｕ1(t,f1)〜ｕ1(t,fK)を時間領域の信号に変換するとともに前後のフレームで連結して分離信号Ｕ1を生成する。同様に、信号合成部２６は、強度ｕ2(t,f1)〜ｕ2(t,fK)を時間領域の信号に変換するとともに前後のフレームで連結して分離信号Ｕ2を生成する。

図３は、信号処理部２４のブロック図である。図３に示すように、信号処理部２４は、Ｋ個の周波数ｆ1〜ｆKの各々に対応するＫ個の処理部Ｐ1〜ＰKで構成される。周波数ｆkに対応する処理部Ｐkは、強度ｘ1(t,fk)および強度ｘ2(t,fk)から強度ｕ1(t,fk)を生成するフィルタ３２と、強度ｘ1(t,fk)および強度ｘ2(t,fk)から強度ｕ2(t,fk)を生成するフィルタ３４とを含んで構成される。

フィルタ３２およびフィルタ３４には遅延加算型（ＤＳ(delay-sum)型）のビームフォーマが利用される。すなわち、処理部Ｐkのフィルタ３２は、数式(1a)で定義されるように、係数ｗ11(fk)に応じた遅延を強度ｘ1(t,fk)に付加する遅延素子３２１と、係数ｗ21(fk)に応じた遅延を強度ｘ2(t,fk)に付加する遅延素子３２３と、遅延素子３２１の出力と遅延素子３２３の出力との加算で分離信号Ｕ1の強度ｕ1(t,fk)を生成する加算部３２５とを含んで構成される。同様に、フィルタ３４は、数式(1b)で定義されるように、係数ｗ12(fk)に応じた遅延を強度ｘ1(t,fk)に付加する遅延素子３４１と、係数ｗ22(fk)に応じた遅延を強度ｘ2(t,fk)に付加する遅延素子３４３と、遅延素子３４１の出力と遅延素子３４３の出力との加算で分離信号Ｕ2の強度ｕ2(t,fk)を生成する加算部３４５とを含む
ｕ1(t,fk)＝ｗ11(fk)・ｘ1(t,fk)＋ｗ21(fk)・ｘ2(t,fk) ……(1a)
ｕ2(t,fk)＝ｗ12(fk)・ｘ1(t,fk)＋ｗ22(fk)・ｘ2(t,fk) ……(1b)

図１および図３の分離行列生成部４０は、信号処理部２４が使用する分離行列Ｗ(f1)〜Ｗ(fK)を生成する。周波数ｆkの分離行列Ｗ(fk)は、処理部Ｐkのフィルタ３２に適用される係数ｗ11(fk)および係数ｗ21(fk)とフィルタ３４に適用される係数ｗ12(fk)および係数ｗ22(fk)とを要素とする２行２列（ｎ行ｎ列）の行列である。分離行列生成部４０は、記憶装置１４に格納された観測データＤ(fk)から分離行列Ｗ(fk)を生成する。すなわち、分離行列Ｗ(fk)は、Ｋ個の周波数ｆ1〜ｆKの各々について単位区間ＴU毎に生成される。

図４は、分離行列生成部４０のブロック図である。図４に示すように、分離行列生成部４０は、初期値生成部４２と学習処理部４４と指標算定部５２と周波数選択部５４とを含んで構成される。初期値生成部４２は、Ｋ個の周波数ｆ1〜ｆKの各々について初期的な分離行列（以下「初期分離行列」という）Ｗ0(f1)〜Ｗ0(fK)を生成する。周波数ｆkに対応する初期分離行列Ｗ0(fk)は、記憶装置１４に格納された観測データＤ(fk)を利用して単位区間ＴU毎に生成される。初期分離行列Ｗ0(f1)〜Ｗ0(fK)の生成には公知の技術が任意に採用される。

例えば、K. Tachibana, et. al., "Efficient Blind Source Separation Combining Closed-Form Second Order ICA and Nonclosed-Form Higher-Order ICA," International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Vol. 1, pp. 45-48, Apr. 2007に開示された主成分分析や２次統計量ICAなどの部分空間法、または、特許第3949074号公報に開示された適応型ビームフォーマが、初期分離行列Ｗ0(f1)〜Ｗ0(fK)の特定に好適に採用される。また、MUSIC（multiple signal classification）法や最小分散法で推定した各音源Ｓの方向から各種のビームフォーマ（例えば適応型ビームフォーマ）を利用して初期分離行列Ｗ0(f1)〜Ｗ0(fK)を特定する方法や、因子分析で特定した因子ベクトルや正準相関分析で特定した正準ベクトルから初期分離行列Ｗ0(f1)〜Ｗ0(fK)を特定する方法も採用される。

図４の学習処理部４４は、Ｋ個の周波数ｆ1〜ｆKの各々について、初期分離行列Ｗ0(fk)を初期値とした逐次的な学習で分離行列Ｗ(fk)（Ｗ(f1)〜Ｗ(fK)）を生成する。分離行列Ｗ(fk)の学習には、記憶装置１４に格納された周波数ｆkの観測データＤ(fk)が使用される。例えば、観測データＤ(fk)を分離行列Ｗ(fk)で分離した分離信号Ｕ1（数式(1a)の強度ｕ1(t,fk)の時系列）と分離信号Ｕ2（数式(1b)の強度ｕ2(t,fk)の時系列）とが統計的に相互に独立となるように分離行列Ｗ(fk)の更新を反復する独立成分分析（例えば高次ICA）が、分離行列Ｗ(fk)の生成に好適に採用される。

ところで、Ｋ種類の周波数ｆ1〜ｆKについて学習処理部４４が分離行列Ｗ(f1)〜Ｗ(fK)の学習を実行する構成では、最終的な分離行列Ｗ(f1)〜Ｗ(fK)の算定に必要な演算量や、学習の過程のデータの記憶に必要な記憶装置１４の容量が過大となる可能性がある。そこで、第１実施形態においては、Ｋ個の周波数ｆ1〜ｆKのうち、観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習の有意性（すなわち、分離行列Ｗ(fk)の学習で音源分離の精度が初期分離行列Ｗ0(fk)から向上する度合）が高い１以上の周波数ｆkのみについて、観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習を実行する。

図４の指標算定部５２は、周波数ｆkの選択の基準となる指標値を算定する。第１実施形態の指標算定部５２は、Ｋ個の周波数ｆ1〜ｆKの各々について観測データＤ(fk)（観測信号Ｖ1および観測信号Ｖ2）の共分散行列Ｒxx(fk)の行列式ｚ1(fk)（ｚ1(f1)〜ｚ1(fK)）を算定する。図５に示すように、指標算定部５２は、共分散行列算定部５２２と行列式算定部５２４とを含んで構成される。

共分散行列算定部５２２は、Ｋ個の周波数ｆ1〜ｆKの各々について観測データＤ(fk)の共分散行列Ｒxx(fk)（Ｒxx(f1)〜Ｒxx(fK)）を算定する。周波数ｆkの共分散行列Ｒxx(fk)は、観測データＤ(fk)内（単位区間ＴU内）の観測ベクトルＸ(t,fk)の共分散を要素とする行列である。したがって、共分散行列Ｒxx(fk)は例えば以下の数式(2)で定義される。ただし、以下の数式(3)のように、単位区間ＴU内の総てのフレームにわたる観測ベクトルＸ(t,fk)の加算を零行列と仮定した（ゼロ平均）。
Ｒxx(fk)＝Ｅ［Ｘ(t,fk)Ｘ(t,fk)^Ｈ］
＝Σ_{t}Ｘ(t,fk)Ｘ(t,fk) ^Ｈ ……(2)
Ｅ［Ｘ(t,fk)］＝［Ｅ［ｘ1(t,fk)］Ｅ［ｘ2(t,fk)］］^Ｈ＝［００］^Ｈ ……(3)

数式(2)や数式(3)における記号Ｅは期待値（加算値）を意味し、記号Σ_{t}は、単位区間ＴU内の複数（例えば50個）のフレームにわたる加算（平均）を意味する。すなわち、共分散行列Ｒxx(fk)は、観測ベクトルＸ(t,fk)と観測ベクトルＸ(t,fk)の転置との乗算を単位区間ＴU内（観測データＤ(fk)内）の複数の観測ベクトルＸ(t,fk)について加算したｎ行ｎ列の行列である。

行列式算定部５２４は、共分散行列算定部５２２が算定したＫ個の共分散行列Ｒxx(f1)〜Ｒxx(fK)の各々について行列式ｚ1(fk)（ｚ1(f1)〜ｚ1(fK)）を算定する。行列式ｚ1(fk)の算定には公知の方法が任意に採用されるが、例えば共分散行列Ｒxx(fk)の特異値分解を利用した以下の方法が好適に採用される。

共分散行列Ｒxx(fk)は以下の数式(4)のように特異値分解される。数式(4)における行列Ｆは、ｎ行ｎ列（本形態では２行２列）の直交行列であり、行列Ｄは、対角成分（ｄ1，……，ｄn）以外がゼロとなるｎ行ｎ列の特異値行列である。
Ｒxx(fk)＝ＦＤＦ^Ｈ ……(4)

したがって、共分散行列Ｒxx(fk)の行列式ｚ1(fk)は、以下の数式(5)で表現される。数式(5)の導出には、行列Ｆの転置Ｆ^Ｈと行列Ｆとの乗算がｎ次の単位行列であるという関係（Ｆ^ＨＦ＝Ｉ）や、行列ＡＢの行列式det（ＡＢ）が行列ＢＡの行列式det（ＢＡ）に等しいという関係を利用した。
ｚ1(fk)＝det(Ｒxx(fk))
＝det(ＦＤＦ^Ｈ)
＝det(Ｄ)
＝ｄ1・ｄ2・……・ｄn ……(5)

数式(5)から理解されるように、共分散行列Ｒxx(fk)の行列式ｚ1(fk)は、共分散行列Ｒxx(fk)の特異値分解で特定される特異値行列Ｄのｎ個の対角成分（ｄ1，……，ｄn）の乗算値に相当する。行列式算定部５２４は、Ｋ個の周波数ｆ1〜ｆKの各々について数式(5)の演算を実行することで行列式ｚ1(f1)〜ｚ1(fK)を算定する。

図６は、単位区間ＴU内の各観測ベクトルＸ(t,fk)の散布図である。横軸は強度ｘ1(t,fk)を意味し、縦軸は強度ｘ2(t,fk)を意味する。図６の部分(A)は、行列式ｚ1(fk)が大きい場合の散布図であり、図６の部分(B)は、行列式ｚ1(fk)が小さい場合の散布図である。

図６の部分(A)のように共分散行列Ｒxx(fk)の行列式ｚ1(fk)が大きい場合には、観測ベクトルＸ(t,fk)の分布する領域の軸線（基底）が音源Ｓ毎に明確に区別される。具体的には、音源Ｓ1からの音ＳV1が優勢な観測ベクトルＸ(t,fk)が軸線α1に沿って分布する領域Ａ1と、音源Ｓ2からの音ＳV2が優勢な観測ベクトルＸ(t,fk)が軸線α2に沿って分布する領域Ａ2とが明確に区別される。一方、共分散行列Ｒxx(fk)の行列式ｚ1(fk)が小さい場合、散布図で明確に区別できる観測ベクトルＸ(t,fk)の分布の領域の個数（軸線の本数）が実際の音源Ｓの総数を下回る。例えば、図６の部分(B)のように、音源Ｓ2からの音ＳV2に対応する明確な領域Ａ2（軸線α2）が存在しない。

以上の傾向から理解されるように、共分散行列Ｒxx(fk)の行列式ｚ1(fk)は、観測データＤ(fk)を構成する各観測ベクトルＸ(t,fk)の分布における基底（観測ベクトルＸ(t,fk)が分布する領域の軸線）の総数の指標として機能する。すなわち、行列式ｚ1(fk)が大きい周波数ｆkほど基底が多いという傾向がある。行列式ｚ1(fk)がゼロとなる周波数ｆkには独立な基底が１個しか含まれない。

学習処理部４４による分離行列Ｗ(fk)の学習に適用される独立成分分析は、独立な基底を音源Ｓの個数だけ特定する処理と等価であるから、Ｋ個の周波数ｆ1〜ｆKのうち共分散行列Ｒxx(fk)の行列式ｚ1(fk)が小さい周波数ｆkの観測データＤ(fk)については学習の有意性（分離行列Ｗ(fk)の学習で音源分離の精度が向上する度合）が低いと言える。すなわち、Ｋ個の周波数ｆ1〜ｆKのうち行列式ｚ1(fk)が大きい周波数ｆkのみについて学習処理部４４による学習で分離行列Ｗ(fk)を生成した場合（行列式ｚ1(fk)が小さい周波数ｆkについては例えば初期分離行列Ｗ0(fk)を分離行列Ｗ(fk)として使用した場合）でも、Ｋ個の周波数ｆ1〜ｆKの総ての観測データＤ(f1)〜Ｄ(fK)について学習で分離行列Ｗ(f1)〜Ｗ(fK)を特定した場合と略同等の精度で音源分離を実行できる。つまり、周波数ｆkの観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習の有意性の指標値として行列式ｚ1(fk)を利用することが可能である。

以上の傾向を考慮して、図４の周波数選択部５４は、指標算定部５２の算定した行列式ｚ1(fk)が大きい１個以上の周波数ｆkをＫ個の周波数ｆ1〜ｆKのなかから選択する。例えば、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち行列式ｚ1(f1)〜ｚ1(fK)の降順（大きい方から小さい方に向かう順番）で上位に位置する所定個の周波数ｆkや、Ｋ個の周波数ｆ1〜ｆKのうち行列式ｚ1(fk)が所定の閾値を上回る１個以上の周波数ｆkを選択する。

図７は、周波数選択部５４による選択と学習処理部４４による学習との関係を説明するための概念図である。図７に示すように、学習処理部４４は、周波数選択部５４が選択した各周波数ｆk（図７における周波数ｆ1，ｆ2，……，ｆK-1）について、当該周波数ｆkの観測データＤ(fk)を利用した初期分離行列Ｗ0(fk)の逐次的な更新で分離行列Ｗ(fk)を生成する。一方、周波数選択部５４が選択しなかった各周波数ｆk（図７における周波数ｆ3，……ｆK）については、初期値生成部４２が特定した初期分離行列Ｗ0(fk)が分離行列Ｗ(fk)として信号処理部２４に設定される。

以上の形態においては、観測データＤ(fk)を使用した学習の有意性が高い周波数ｆkのみについて選択的に分離行列Ｗ(fk)の学習が実行されるから、周波数選択部５４が選択しなかった周波数ｆkの観測データＤ(fk)は分離行列Ｗ(f1)〜Ｗ(fK)の生成（学習処理部４４による学習）に不要である。したがって、分離行列Ｗ(f1)〜Ｗ(fK)の生成に必要な記憶装置１４の容量が削減されるとともに学習処理部４４による処理の負荷が軽減されるという利点がある。

図８は、学習処理部４４による学習の対象とした周波数ｆkの個数（総数Ｋを512個とした場合）と、雑音抑圧率（ＮＲＲ：noise reduction rate）および記憶装置１４の容量との関係を示す図表である。記憶装置１４の容量は、全周波数（ｆ1〜ｆ512）の観測データＤ(fk)を使用した学習に必要な容量を100％として表記されている。また、雑音抑圧率は、分離信号Ｕ1における音ＳV2の強度に対する音ＳV1の強度の比率（すなわち、音ＳV1を目的音として音ＳV2を雑音としたときのＳＮ比）SNR_OUTと、観測信号Ｖ1における音ＳV2の強度に対する音ＳV1の強度の比率SNR_INとの差分である（NRR＝SNR_OUT−SNR_IN）。したがって、雑音抑圧率が高いほど音源分離の精度が高い。

図８から理解されるように、学習の対象となる周波数ｆkの個数の変化に対する記憶装置１４の容量の変化率は、周波数ｆkの個数の変化に対する雑音抑圧率の変化率と比較して充分に高い。例えば、学習の対象となる周波数ｆkの個数を512個から50個に変更した場合、記憶装置１４の容量は90％も削減されるのに対して雑音抑圧率の低下は20％程度（14.37→11.5）である。つまり、Ｋ個の周波数ｆ1〜ｆKのうち周波数選択部５４が選択した周波数ｆkのみについて学習を実行する第１実施形態によれば、所期の雑音抑圧率を維持しながら（雑音抑圧率の大幅な低下を抑制しながら）、記憶装置１４に必要となる容量（さらには演算処理装置１２による処理量）を効果的に低減できる。以上の効果は、記憶装置１４の容量や演算処理装置１２の性能が制約される可搬型の電子機器（例えば携帯電話機）に信号処理装置１００を搭載した場合に格別に有効である。

＜Ｂ：第２実施形態＞
次に、本発明の第２実施形態について説明する。第１実施形態においては２個の収音機器Ｍ（Ｍ1，Ｍ2）を利用したが、第２実施形態においては、３個以上の収音機器Ｍを利用して３個以上の音源からの音を分離する場合（ｎ≧３）を想定する。なお、以下の各形態において作用や機能が第１実施形態と同等である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。

図９は、指標算定部５２および周波数選択部５４の動作のフローチャートである。図９の処理は単位区間ＴU毎に実行される。まず、指標算定部５２は、変数Ｎを収音機器Ｍの総数（音源分離の対象となる音源Ｓの総数）ｎに初期化したうえで（ステップＳ1）、行列式ｚ1(f1)〜ｚ1(fK)を算定する（ステップＳ2）。行列式ｚ1(fk)は、数式(5)で説明したように、共分散行列Ｒxx(fk)の特異値行列ＤのＮ個の対角成分（現段階ではｎ個の対角成分ｄ1，ｄ2，……，ｄn）の乗算値として算定される。

周波数選択部５４は、指標算定部５２がステップＳ2で算定した行列式ｚ1(fk)が大きい１個以上の周波数ｆkを選択する（ステップＳ3）。例えば、第１実施形態と同様に、Ｋ個の周波数ｆ1〜ｆKのうち行列式ｚ1(f1)〜ｚ1(fK)の降順で上位に位置する所定個の周波数ｆkを選択する構成や、Ｋ個の周波数ｆ1〜ｆKのうち行列式ｚ1(fk)が所定の閾値を上回る１個以上の周波数ｆkを選択する構成が好適である。周波数選択部５４は、周波数ｆの選択数が所定値に到達したか否かを判定する（ステップＳ4）。周波数ｆkの選択数が所定値を上回る場合（ステップＳ4：YES）、図９の処理は終了する。

周波数ｆkの選択数が所定値を下回る場合（ステップＳ4：NO）、指標算定部５２は、変数Ｎから１を減算し（ステップＳ5）、更新後の変数Ｎに対応した行列式ｚ1(f1)〜ｚ1(fK)を算定する（ステップＳ2）。すなわち、指標算定部５２は、共分散行列Ｒxx(fk)の特異値行列Ｄのｎ個の対角成分のうち１個の対角成分を除去したうえで行列式ｚ1(fk)を算定する。周波数選択部５４は、過去に選択した周波数ｆkと重複しないように、ステップＳ1で新規に算定された行列式ｚ1(f1)〜ｚ1(fK)を利用して周波数ｆkを選択する（ステップＳ3）。

以上のように、各回のステップＳ3における周波数ｆkの選択数の合計が所定値に到達するまで（ステップＳ4：YES）、共分散行列Ｒxx(fk)の特異値行列Ｄにおけるｎ個の対角成分のうち行列式ｚ1(fk)の算定に使用される対角成分の個数（変数Ｎ）を順次に減少させながら、行列式ｚ1(fk)の算定（ステップＳ2）と周波数ｆkの選択（ステップＳ3）とが反復される。特異値行列Ｄの１個の対角成分を減少させる処理（ステップＳ5）は、観測ベクトルＸ(t,fk)の分布における１個の基底を除去する処理に相当する。

以上の形態においては、観測ベクトルＸ(t,fk)の分布における基底を順次に除去しながら、周波数ｆkの選択の指標となる行列式ｚ1(f1)〜ｚ1(fK)が算定される。したがって、特異値行列Ｄのｎ個の対角成分の乗算値として算定された行列式ｚ1(f1)〜ｚ1(fK)で周波数ｆkを選択する場合と比較すると、観測データＤ(fk)を使用した学習の有意性が高い周波数ｆkを高精度に選択することが可能である。

＜学習の有意性の指標値の具体例＞
第１実施形態や第２実施形態における共分散行列Ｒxx(fk)の行列式ｚ1(fk)に代えて、以下の第３実施形態から第６実施形態に例示する数値（統計量）も、観測データＤ(fk)を使用した学習の有意性の指標値として利用される。

＜Ｃ：第３実施形態＞
観測データＤ(fk)を構成する各観測ベクトルＸ(t,fk)の共分散行列Ｒxx(fk)の条件数ｚ2(fk)は以下の数式(6)で定義される。数式(6)の演算子‖Ａ‖は、行列Ａのノルム（行列の距離）を意味する。共分散行列Ｒxx(fk)に逆行列が存在する場合（正則である場合）に条件数ｚ2(fk)は小さく、共分散行列Ｒxx(fk)に逆行列が存在しない場合に条件数ｚ2(fk)は大きい数値となる。
ｚ2(fk)＝‖Ｒxx(fk)‖・‖Ｒxx(fk)^−１‖ ……(6)

共分散行列Ｒxx(fk)は以下の数式(7a)のように固有値分解される。数式(7a)の行列Ｕは固有行列（固有ベクトルを要素とする行列）であり、行列Σは、対角成分に固有値を配置した行列である。また、共分散行列Ｒxx(fk)の逆行列は、数式(7a)を変形した以下の数式(7b)で表現される。
Ｒxx(fk)＝ＵΣＵ^Ｈ ……(7a)
Ｒxx(fk)^−１＝ＵΣ^−１Ｕ^Ｈ ……(7b)

行列Σの要素にゼロが含まれる場合には数式(7b)の行列Σ^−１が無限大に発散するため、共分散行列Ｒxx(fk)の逆行列は存在しない（すなわち、数式(6)の条件数ｚ2(fk)は大きい数値となる）。一方、行列Σの要素（共分散行列Ｒxx(fk)の固有値）がゼロに近い数値を含むということは、観測ベクトルＸ(t,fk)の分布における基底の総数が少ないことを意味する。したがって、観測ベクトルＸ(t,fk)の基底の総数が少ないほど共分散行列Ｒxx(fk)の条件数ｚ2(fk)が大きい（基底の総数が多いほど条件数ｚ2(fk)は小さい）という傾向が把握される。つまり、共分散行列Ｒxx(fk)の条件数ｚ2(fk)は、行列式ｚ1(fk)と同様に、観測ベクトルＸ(t,fk)の基底の総数の指標として機能する。

以上の傾向を考慮して、第３実施形態においては、共分散行列Ｒxx(fk)の条件数ｚ2(fk)を周波数ｆの選択に使用する。すなわち、指標算定部５２は、Ｋ個の周波数ｆ1〜ｆKの各々の共分散行列Ｒxx(fk)について数式(6)の演算を実行することで条件数ｚ2(fk)（ｚ2(f1)〜ｚ2(fK)）を算定する。周波数選択部５４は、指標算定部５２の算定した条件数ｚ2(fk)が小さい１個以上の周波数ｆkを選択する。例えば、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち条件数ｚ2(f1)〜ｚ2(fK)の昇順（小さい方から大きい方に向かう順番）で上位に位置する所定個の周波数ｆkや、Ｋ個の周波数ｆ1〜ｆKのうち条件数ｚ2(fk)が所定の閾値を下回る１個以上の周波数ｆkを選択する。初期値生成部４２や学習処理部４４の動作は第１実施形態と同様である。

＜Ｄ：第４実施形態＞
学習処理部４４は、観測データＤ(fk)を音源分離した分離信号Ｕ1と分離信号Ｕ2とが統計的に相互に独立となるように分離行列Ｗ(fk)を学習するから、観測信号Ｖ1の強度ｘ1(t,fk)の時系列と観測信号Ｖ2の強度ｘ2(t,fk)の時系列とで統計的な相関が低い周波数ｆkほど、観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習の有意性が高いと言える。そこで、第４実施形態においては、観測信号Ｖ1および観測信号Ｖ2の相互間の独立性に応じた指標値（相互相関または相互情報量）を周波数ｆkの選択に利用する。

観測信号Ｖ1の周波数ｆkの成分と観測信号Ｖ2の周波数ｆkの成分との相互相関ｚ3(fk)は以下の数式(8)で表現される。数式(8)の記号Ｅは、数式(2)と同様に、単位区間ＴU内の複数のフレームにわたる加算（平均）を意味する。また、記号σ1は、単位区間ＴU内の強度ｘ1(t,fk)の標準偏差を意味し、記号σ2は、単位区間ＴU内の強度ｘ2(t,fk)の標準偏差を意味する。
ｚ3(fk)＝Ｅ［{ｘ1(t,fk)−Ｅ(ｘ1(t,fk))}{ｘ2(t,fk)−Ｅ(ｘ2(t,fk))}］／σ1σ2 ……(8)

数式(8)から理解されるように、観測信号Ｖ1と観測信号Ｖ2との独立性が高い（相関が低い）周波数ｆkほど相互相関ｚ3(fk)は小さい数値となる。以上の傾向を考慮して、第４実施形態においては、Ｋ個の周波数ｆ1〜ｆKの各々について数式(8)の演算を実行することで指標算定部５２が相互相関ｚ3(fk)（ｚ3(f1)〜ｚ3(fK)）を算定し、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち相互相関ｚ3(fk)が低い１個以上の周波数ｆkを選択する。例えば、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち相互相関ｚ3(f1)〜ｚ3(fK)の昇順で上位に位置する所定個の周波数ｆkや、Ｋ個の周波数ｆ1〜ｆKのうち相互相関ｚ3(fk)が所定の閾値を下回る１個以上の周波数ｆkを選択する。初期値生成部４２や学習処理部４４の動作は第１実施形態と同様である。

なお、以下の数式(9)で定義される相互情報量ｚ4(fk)を相互相関ｚ3(fk)の代わりに利用して周波数ｆkを選択する構成も好適である。相互相関ｚ3と同様に、観測信号Ｖ1と観測信号Ｖ2との独立性が高い（相関が低い）周波数ｆkほど相互情報量ｚ4(fk)は小さい数値となる。したがって、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち相互情報量ｚ4(fk)が低い１個以上の周波数ｆkを選択する。
ｚ4(fk)＝(−１／２)log(１−ｚ3(fk)^２) ……(9)

＜Ｅ：第５実施形態＞
共分散行列Ｒxx(fk)のトレース（パワー）ｚ5(fk)は共分散行列Ｒxx(fk)の対角成分の総和として定義される。共分散行列Ｒxx(fk)の対角成分は、単位区間ＴUにおける観測信号Ｖ1の強度ｘ1(t,fk)の分散σ1^２と単位区間ＴUにおける観測信号Ｖ2の強度ｘ2(t,fk)の分散σ2^２とに相当するから、共分散行列Ｒxx(fk)のトレースｚ5(fk)は、強度ｘ1(t,fk)の分散σ1^２と強度ｘ2(t,fk)の分散σ2^２との加算値（ｚ5(fk)＝σ1^２＋σ2^２）としても定義される。

図１０は、単位区間ＴU内の各観測ベクトルＸ(t,fk)の散布図である。図１０の部分(A)は、トレースｚ5(fk)が大きい場合の散布図であり、図１０の部分(B)は、トレースｚ5(fk)が小さい場合の散布図である。図１０の部分(A)および部分(B)には、図６の部分(A)と同様に、音源Ｓ1からの音ＳV1が優勢な観測ベクトルＸ(t,fk)が分布する領域Ａ1と、音源Ｓ2からの音ＳV2が優勢な観測ベクトルＸ(t,fk)が分布する領域Ａ2とが模式的に図示されている。

強度ｘ1(t,fk)の分散σ1^２と強度ｘ2(t,fk)の分散σ2^２との加算値という定義からも理解されるように、共分散行列Ｒxx(fk)のトレースｚ5(fk)が大きいほど観測ベクトルＸ(t,fk)は広範に分布する。したがって、トレースｚ5(fk)が大きい場合には、図１０の部分(A)のように、観測ベクトルＸ(t,fk)の分布する領域（領域Ａ1および領域Ａ2）が音源Ｓ毎に明確に区別され、トレースｚ5(fk)が小さい場合には、図１０の部分(B)のように領域Ａ1と領域Ａ2との区別は曖昧になるという傾向がある。つまり、トレースｚ5(fk)は、観測ベクトルＸ(t,fk)が分布する領域の形状（広がり）の指標値として機能する。

学習処理部４４による分離行列Ｗ(fk)の学習（独立成分分析）は、独立な基底を音源Ｓの個数だけ特定する処理と等価であるから、観測ベクトルＸ(t,fk)の分布する領域（基底）が音源Ｓ毎に明確に区別される周波数ｆk（すなわちトレースｚ5(fk)が大きい周波数ｆk）ほど、観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習の有意性が高いと言える。

以上の傾向を考慮して、第５実施形態においては、共分散行列Ｒxx(f1)〜Ｒxx(fK)のトレースｚ5(f1)〜ｚ5(fK)を周波数ｆkの選択に使用する。すなわち、指標算定部５２は、Ｋ個の周波数ｆ1〜ｆKの各々の共分散行列Ｒxx(fk)の対角成分を加算することでトレースｚ5(fk)（ｚ5(f1)〜ｚ5(fK)）を算定する。周波数選択部５４は、指標算定部５２の算定したトレースｚ5(fk)が大きい１個以上の周波数ｆkを選択する。例えば、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうちトレースｚ5(f1)〜ｚ5(fK)の降順で上位に位置する所定個の周波数ｆkや、Ｋ個の周波数ｆ1〜ｆKのうちトレースｚ5(fk)が所定の閾値を上回る１個以上の周波数ｆkを選択する。初期値生成部４２や学習処理部４４の動作は第１実施形態と同様である。

＜Ｆ：第６実施形態＞
観測信号Ｖ1の強度ｘ1(t,fk)の度数分布（強度ｘ1(t,fk)を確率変数とする分布関数）における尖度（カートシス）ｚ6(fk)は、以下の数式(10)で定義される。
ｚ6(fk)＝μ4(fk)／｛μ2(fk)｝^２ ……(10)

数式(10)の記号μ4(fk)は、数式(11a)で定義される４次の中心モーメントを意味し、数式(10)の記号μ2（fk）は、数式(11b)で定義される２次の中心モーメントを意味する。数式(11a)や数式(11b)の記号ｍ(fk)は、単位区間ＴU内の複数のフレームにわたる強度ｘ1(t,fk)の平均値を意味する。
μ4(fk)＝Ｅ{ｘ1(t,fk)−ｍ(fk)}^４ ……(11a)
μ2(fk)＝Ｅ{ｘ1(t,fk)−ｍ(fk)}^２ ……(11b)

音源Ｓ1の音ＳV1および音源Ｓ2の音ＳV2のうちの一方のみが観測信号Ｖ1の周波数ｆkの成分に含まれる（あるいは支配的である）場合には尖度ｚ6(fk)が大きい数値となり、音源Ｓ1の音ＳV1および音源Ｓ2の音ＳV2の双方が略同等の強度で観測信号Ｖ1の周波数ｆkの成分に含まれる場合には尖度ｚ6(fk)が小さい数値となる（中心極限定理）。学習処理部４４による分離行列Ｗ(fk)の学習（独立成分分析）は、独立な基底を音源Ｓの個数だけ特定する処理と等価であるから、有意な音量で観測信号Ｖ1に含まれる音ＳVの音源Ｓの個数が多い周波数ｆk（すなわち、尖度ｚ6(fk)が小さい周波数ｆk）ほど、観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習の有意性が高いと言える。

以上の傾向を考慮して、第６実施形態においては、観測信号Ｖ1の強度ｘ(t,fk)の度数分布における尖度ｚ6(fk)（ｚ6(f1)〜ｚ6(fK)）を周波数ｆkの選択に使用する。すなわち、指標算定部５２は、Ｋ個の周波数ｆ1〜ｆKの各々について数式(10)の演算を実行することで尖度ｚ6(f1)〜ｚ6(fK)を算定する。周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち尖度ｚ6(fk)が小さい１個以上の周波数ｆkを選択する。例えば、周波数選択部５４は、Ｋ個の周波数ｆ1〜ｆKのうち尖度ｚ6(f1)〜ｚ3(fK)の昇順で上位に位置する所定個の周波数ｆkや、Ｋ個の周波数ｆ1〜ｆKのうち尖度ｚ6(fk)が所定の閾値を下回る１個以上の周波数ｆkを選択する。初期値生成部４２や学習処理部４４の動作は第１実施形態と同様である。

ところで、人間の音声の尖度は概ね40から70までの範囲内の数値となる。また、雑音が存在する環境で尖度が低下すること（中心極限定理）や尖度の測定の誤差などを考慮すると、人間の音声の尖度は概ね20から80までの範囲（以下「音声範囲」という）内に収まる。一方、空調設備の動作音や人込みでの雑踏音などの定常的な雑音のみが存在する周波数ｆkについては、観測信号Ｖ1の尖度は充分に低い数値（例えば20を下回る数値）となるから、周波数選択部５４にて選択される可能性が高い。しかし、音源分離の対象音（ＳV1，ＳV2）が人間の音声であるならば、定常的な雑音の周波数ｆkの観測データＤ(fk)を使用した分離行列Ｗの学習の有意性は低いと言える。

そこで、定常的な雑音の周波数ｆkが周波数選択部５４による選択の対象から除外されるように数式(10)の尖度を補正する構成が好適に採用される。例えば、指標算定部５２は、数式(10)で定義される数値（以下「補正前尖度」という）と加重値ｑとの乗算値を補正後の尖度ｚ6(fk)として算定する。加重値ｑは、例えば図１１の例示のように補正前尖度に対して非線形に選定される。すなわち、補正前尖度が音声範囲の下限値（例えば20）を下回る範囲については、加重値ｑの乗算による補正後の尖度ｚ6(fk)が音声範囲内の上限値（例えば80）を上回るように、補正前尖度に応じて加重値ｑが可変に選定され、音声範囲内の尖度については加重値ｑは所定値（例えば１）に設定される。なお、音声範囲の上限値を上回る範囲については、補正前尖度が充分に高い（すなわち周波数ｆkが選択される可能性は低い）ため、加重値ｑは音声範囲内と同等の数値に設定される。以上の構成によれば、所期の音声を高精度に分離できる分離行列Ｗ(fk)を生成することが可能である。

＜Ｇ：第７実施形態＞
以上の各形態においては、周波数選択部５４が選択しなかった各周波数（以下「非選択周波数」という）ｆkについて、初期値生成部４２が特定した初期分離行列Ｗ0(fk)を分離行列Ｗ(fk)として信号処理部２４に適用した。以下に説明する第７実施形態においては、学習処理部４４による学習後の分離行列Ｗ(fk)を利用して非選択周波数ｆkの分離行列Ｗ(fk)を生成（補充）する。

図１２は、第７実施形態の信号処理装置１００における分離行列生成部４０のブロック図であり、図１３は、分離行列生成部４０による処理を説明するための概念図である。図１２に示すように、第７実施形態の分離行列生成部４０は、方向推定部７２と行列補充部７４とを第１実施形態に追加した構成である。

方向推定部７２には、周波数選択部５４が選択した各周波数ｆkについて、学習処理部４４による学習後の分離行列Ｗ(fk)が供給される。方向推定部７２は、学習後の各分離行列Ｗ(fk)から音源Ｓ1の方向θ1と音源Ｓ2の方向θ2とを推定する。方向θ1および方向θ2の推定には例えば以下の方法が好適に採用される。

第１に、方向推定部７２は、図１３に示すように、周波数選択部５４が選択した周波数ｆk毎に音源Ｓ1の方向θ1(fk)と音源Ｓ2の方向θ2(fk)とを推定する。さらに詳述すると、方向推定部７２は、学習処理部４４による学習後の分離行列Ｗ(fk)を構成する係数ｗ11(fk)と係数ｗ21(fk)とから音源Ｓ1の方向θ1(fk)を特定し、係数ｗ12(fk)と係数ｗ22(fk)とから音源Ｓ2の方向θ2(fk)を特定する。例えば、係数ｗ11(fk)および係数ｗ21(fk)を設定したときに処理部Ｐkのフィルタ３２が形成するビームの方向が音源Ｓ1の方向θ1(fk)として推定され、係数ｗ12(fk)および係数ｗ22(fk)を設定したときに処理部Ｐkのフィルタ３４が形成するビームの方向が音源Ｓ2の方向θ2(fk)として推定される。また、分離行列Ｗ(fk)を利用した方向θ1(fk)および方向θ2(fk)の特定には、H. Saruwatari, et. al., "Blind Source Separation Combining Independent Component Analysis and Beamforming", EURASIP Journal on Applied Signal Processing Vol.2003, No.11, pp.1135-1146, 2003に開示された方法も好適に利用される。

第２に、方向推定部７２は、図１３に示すように、周波数選択部５４が選択した周波数ｆk毎の方向θ1(fk)および方向θ2(fk)から音源Ｓ1の方向θ1と音源Ｓ2の方向θ2とを推定する。例えば、周波数ｆk毎に推定した方向θ1(fk)の平均値や中央値が音源Ｓ1の方向θ1として特定され、周波数ｆk毎に推定した方向θ2(fk)の平均値や中央値が音源Ｓ2の方向θ2として特定される。

図１２の行列補充部７４は、図１３に示すように、方向推定部７２が推定した方向θ1および方向θ2から各非選択周波数ｆkの分離行列Ｗ(fk)を特定する。具体的には、行列補充部７４は、処理部Ｐkのフィルタ３２が方向θ1にビームを形成するように算定された係数ｗ11(fk)および係数ｗ21(fk)と、処理部Ｐkのフィルタ３４が方向θ2にビームを形成するように算定された係数ｗ12(fk)および係数ｗ21(fk)とを要素とする２行２列の分離行列Ｗ(fk)を非選択周波数ｆk毎に生成する。図１２および図１３に示すように、周波数選択部５４が選択した周波数ｆkについては学習処理部４４による学習後の分離行列Ｗ(fk)が信号処理部２４にて使用され、非選択周波数ｆkについては行列補充部７４の生成した行列Ｗ(fk)が信号処理部２４にて使用される。

第７実施形態においては、周波数選択部５４が選択した周波数ｆkについての学習後の分離行列Ｗ(fk)を利用して非選択周波数ｆkの分離行列Ｗ(fk)が生成される（すなわち、非選択周波数ｆkの初期分離行列Ｗ0(fk)を使用しない）から、非選択周波数ｆkの初期分離行列Ｗ0(fk)の音源分離の性能に拘わらず、周波数選択部５４が選択した周波数ｆkに加えて非選択周波数ｆkについても高精度な音源分離が実現されるという利点がある。

なお、以上の例示においては、周波数選択部５４が選択した複数の周波数ｆkの各々に対応する方向θ1(fk)および方向θ2(fk)から方向θ1および方向θ2を推定したが、例えば、周波数選択部５４が選択した複数の周波数ｆkのうち何れかの周波数ｆkに対応する方向θ1(fk)および方向θ2(fk)を、行列補充部７４による分離行列Ｗ(fk)の生成に適用される方向θ1および方向θ2として利用する構成も好適である。

＜Ｈ：第８実施形態＞
第７実施形態においては、周波数選択部５４が選択した総ての周波数ｆkの分離行列Ｗ(fk)を利用して方向推定部７２が方向θ1(fk)および方向θ2(fk)を推定した。しかし、低域側の周波数ｆkや高域側の周波数ｆkの分離行列Ｗ(fk)からは方向θ1(fk)や方向θ2(fk)を高精度に推定できない場合がある。そこで、本発明の第８実施形態においては、周波数選択部５４が選択した複数の周波数ｆkのうち低域側の周波数ｆkと高域側の周波数ｆkとを除外した各周波数ｆkの学習後の分離行列Ｗ(fk)のみを方向θ1(fk)および方向θ2(fk)の推定（ひいては方向θ1および方向θ2の推定）に利用する。

例えば０Ｈzから4000Ｈzまでの周波数の範囲を分割した512個の周波数ｆ1〜ｆ512（Ｋ＝512）を想定する。方向推定部７２は、低域側の周波数ｆ1〜ｆ199と高域側の周波数ｆ400〜ｆ512とを除外した周波数ｆ200〜ｆ399のうち周波数選択部５４が選択した周波数ｆkについて、学習処理部４４による学習後の分離行列Ｗ(fk)から方向θ1(fk)および方向θ2(fk)を推定する。低域側の周波数ｆ1〜ｆ199や高域側の周波数ｆ400〜ｆ512については、周波数選択部５４が選択した場合（さらには学習処理部４４による学習で分離行列Ｗ(fk)が生成された場合）であっても、方向θ1(fk)および方向θ2(fk)の推定には利用されない。方向推定部７２が推定した方向θ1(fk)および方向θ2(fk)から非選択周波数ｆkの分離行列Ｗ(fk)が生成される構成は第７実施形態と同様である。

第８実施形態においては、低域側の周波数ｆkや高域側の周波数ｆkを除外した周波数ｆkの学習後の分離行列Ｗ(fk)が方向θ1および方向θ2の推定に使用されるから、周波数選択部５４が選択した総ての周波数ｆkの分離行列Ｗ(fk)を使用する場合と比較して、方向θ1および方向θ2が高精度に推定される。したがって、非選択周波数ｆkについて高精度な音源分離が可能な分離行列Ｗ(fk)を生成することが可能である。なお、以上においては低域側の周波数ｆkおよび高域側の周波数ｆkの双方を除外したが、低域側の周波数ｆkおよび高域側の周波数ｆkの一方のみを除外して方向θ1(fk)および方向θ2(fk)を推定する構成も採用される。

＜Ｉ：第９実施形態＞
以上の各形態においては、１個の単位区間ＴUについて算定された指標値ｚ(f1)〜ｚ(fK)（例えば、行列式ｚ1(fk)，条件数ｚ2(fk)，相互相関ｚ3(fk)，相互情報量ｚ4(fk)，トレースｚ5(fk)，尖度ｚ6(fk)）から所定個の周波数ｆkを選択した。以下に説明する第９実施形態においては、複数の単位区間ＴUにわたる指標値ｚ(f1)〜ｚ(fK)を１個の単位区間ＴUにおける周波数ｆkの選択に利用する。

図１４は、第９実施形態の分離行列生成部４０における周波数選択部５４のブロック図である。図１４に示すように、第９実施形態の周波数選択部５４は、選択部５４１と選択部５４２とを含んで構成される。指標算定部５２が観測データＤ(f1)〜Ｄ(fK)から算定した指標値ｚ(f1)〜ｚ(fK)が単位区間ＴU毎に選択部５４１に供給される。指標値ｚ(fk)は、観測データＤ(fk)を利用した分離行列Ｗ(fk)の学習の有意性の尺度となる数値（例えば、行列式ｚ1(fk)，条件数ｚ2(fk)，相互相関ｚ3(fk)，相互情報量ｚ4(fk)，トレースｚ5(fk)，尖度ｚ6(fk)の何れか）である。

選択部５４１は、以上の各形態における周波数選択部５４と同様に、Ｋ個の周波数ｆ1〜ｆKの各々の選択／非選択を各単位区間ＴUの指標値ｚ(f1)〜ｚ(fK)に応じて単位区間ＴU毎に順次に判別する。具体的には、選択部５４１は、Ｋ個の周波数ｆ1〜ｆKの各々の選択／非選択を示すＫ個の数値ｓA_1〜ｓA_Kの系列（以下「数値列」という）ｙ(T)を単位区間ＴU毎に順次に生成する。変数Ｔは、単位区間ＴUの番号である。数値列ｙ(T)の数値ｓA_kは、指標値ｚ(fk)に応じて周波数ｆkが選択と判定される場合と非選択と判定される場合とで別個の数値に設定される。例えば、数値ｓA_kは、周波数ｆkの選択時に「１」に設定されるとともに周波数ｆkの非選択時に「０」に設定される。

選択部５４２は、複数（(J+1)個）の単位区間ＴUにわたる選択部５４１の判別の結果から所定個の周波数ｆkを選択する。具体的には、選択部５４２は、演算部５６と決定部５７とを含んで構成される。演算部５６は、番号Ｔの単位区間ＴUから計数して過去のＪ個目までの(J+1)個の単位区間ＴUの係数列ｙ(T)〜ｙ(T-J)に応じた係数列Ｙ(T)を算定する。係数列Ｙ(T)は、例えば以下の数式(12)で定義されるように係数列ｙ(T)〜ｙ(T-J)の加重和に相当する。

数式(12)の係数αj（ｊ＝０〜Ｊ）は、係数列ｙ(T-j)に対する加重値を意味する。例えば、時間的に後方（新しい）の単位区間ＴUの加重値αjほど大きい数値に設定される（α0＞α1＞……＞αJ）。係数列Ｙ(T)は、Ｋ個の数値ｓB_1〜ｓB_Kの系列となる。数値ｓB_kは、係数列ｙ(T)〜ｙ(T-J)の各々の数値ｓA_kの加重和である。したがって、係数列Ｙ(T)の数値ｓB_kは、(J+1)個の単位区間ＴUにおいて選択部５４１が周波数ｆkを選択した回数の指標に相当する。すなわち、(J+1)個の単位区間ＴUにおける周波数ｆkの選択の回数が多いほど係数列Ｙ(T)の数値ｓB_kは大きい数値となる。

決定部５７は、演算部５６が算定した係数列Ｙ(T)を利用して所定個の周波数ｆkを選択する。具体的には、決定部５７は、係数列Ｙ(T)のＫ個の数値ｓB_1〜ｓB_Kのうち降順で上位の数値ｓB_kに対応する所定個の周波数ｆkを選択する。すなわち、(J+1)個の単位区間ＴUにおいて選択部５４１による選択の回数が多い周波数ｆkが選択される。決定部５７による周波数ｆkの選択は単位区間ＴU毎に順次に実行される。

学習処理部４４は、Ｋ個の周波数ｆ1〜ｆKのうち決定部５７が選択した各周波数ｆkの観測データＤ(fk)を利用した初期分離行列Ｗ0(fk)の学習で分離行列Ｗ(fk)を生成する。非選択周波数（決定部５７が選択しなかった周波数）ｆkについては、初期分離行列Ｗ0(fk)を分離行列Ｗ(fk)として使用する構成（第１実施形態）や、学習後の分離行列Ｗ(fk)から行列補充部７４が生成した分離行列Ｗ(fk)を使用する構成（第７実施形態または第８実施形態）が採用される。

指標値ｚ(fk)は観測データＤ(fk)に依存するから、１個の単位区間ＴUの指標値ｚ(fk)のみを周波数ｆkの選択に使用する構成（例えば第１実施形態）では、周波数ｆkの選択／非選択が単位区間ＴU毎に頻繁に変化し、分離行列Ｗ(fk)の高精度な学習が阻害される可能性がある。雑音が多い環境（すなわち観測データＤ(fk)が変化し易い環境）では周波数ｆkの選択／非選択の変化の頻度が増加するから、分離行列Ｗ(fk)の学習の精度の低下は特に問題となる。第９実施形態においては、複数（(J+1)個）の単位区間ＴUにわたる周波数ｆkの選択／非選択を総合的に加味して各単位区間ＴUでの周波数ｆkの選択／非選択が決定されるから、例えば雑音に起因して観測データＤ(fk)が突発的に変化した場合でも周波数ｆkの選択／非選択の判別の結果は安定する（すなわち、判別の結果が変化する頻度が低減される）。したがって、所期の音声を高精度に分離できる分離行列Ｗ(fk)が生成されるという利点がある。

図１５は、雑音抑圧率（ＮＲＲ）の測定の結果を示す図表である。図１５においては、学習の対象となる周波数ｆkを１個の単位区間ＴUの指標値ｚ(fk)のみから選択する構成（例えば第１実施形態）を第９実施形態との対比例として雑音抑圧率（ＮＲＲ）が記載されている。なお、音源Ｓ1の角度θ1を０°に固定したうえで音源Ｓ２の角度θ2を−90°から45°ずつ変化させた各場合（−90°，−45°，45°，90°）について雑音抑圧率を測定した。複数（図１５においては50個）の単位区間ＴUにわたる周波数ｆkの選択／非選択を考慮して各単位区間ＴUでの周波数ｆkの選択／非選択を決定する構成（第９実施形態）によって雑音抑圧率が上昇する（すなわち、音源分離の精度が上昇する）ことが図１５から把握される。

なお、以上の例示においては係数列ｙ(T)〜ｙ(T-J)の加重和（係数列Ｙ(T)）を周波数ｆkの選択に適用したが、学習の対象となる周波数ｆkを選択する方法は適宜に変更される。例えば、Ｋ個の周波数ｆ1〜ｆKの各々について、(J+1)個の単位区間ＴU内で選択された回数を計数し、選択の回数が多い所定個の周波数ｆkを学習の対象として選択する構成（係数列ｙ(T)〜ｙ(T-J)の加重和を算定しない構成）も採用される。

また、例えば、係数列ｙ(T)〜ｙ(T-J)の単純な加算で係数列Ｙ(T)を算定する構成も好適である。もっとも、係数列ｙ(T)〜ｙ(T-J)の加重和を算定する構成によれば、(J+1)個の単位区間ＴUのうち特定の単位区間ＴUにおける周波数ｆkの選択／非選択の判別の結果を優先的に考慮して周波数ｆkの選択／非選択を判別することが可能である。なお、係数列ｙ(T)〜ｙ(T-J)の加重和を算定する構成において、加重値α0〜αJの選定の方法は任意である。例えば、(T-j)番目の単位区間ＴUのＳＮ比が低いほど加重値αjを小さい数値に設定する構成が好適に採用される。

＜Ｊ：変形例＞
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から２以上の態様を任意に選択して組合せてもよい。

（１）変形例１
以上の各形態においては、所定の方向からの到来音を強調する遅延加算型ビームフォーマを処理部Ｐk（フィルタ３２，フィルタ３４）に適用したが、所定の方向からの到来音を抑圧する（すなわち収音上の死角を形成する）死角制御型（null）のビームフォーマも処理部Ｐkに適用される。例えば、処理部Ｐkのフィルタ３２の加算部３２５およびフィルタ３４の加算部３４５を減算部に変更することで死角制御型ビームフォーマが実現される。死角制御型ビームフォーマを採用した場合、分離行列生成部４０は、方向θ1に死角が形成されるようにフィルタ３２の各係数（ｗ11(fk)，ｗ21(fk)）を決定し、方向θ2に死角が形成されるようにフィルタ３４の各係数（ｗ12(fk)，ｗ22(fk)）を決定する。したがって、分離信号Ｕ1においては音源Ｓ1の音ＳV1が抑制され（音ＳV2が強調され）、分離信号Ｕ2においては音源Ｓ2の音ＳV2が抑制される（音ＳV1が強調される）。

（２）変形例２
以上の各形態において、周波数分析部２２と信号処理部２４と信号合成部２６とは信号処理装置１００から省略され得る。例えば、観測データＤ(fk)を記憶する記憶装置１４と観測データＤ(fk)から分離行列Ｗ(fk)を生成する分離行列生成部４０とを具備する信号処理装置１００としても本発明は実現される。分離行列生成部４０が生成した分離行列Ｗ(fk)（Ｗ(f1)〜Ｗ(fK)）を信号処理装置１００とは別体の装置の信号処理部２４に提供することで分離信号Ｕ1や分離信号Ｕ2が生成される。

（３）変形例３
以上の各形態においては初期値生成部４２がＫ個の周波数ｆ1〜ｆKの各々について初期分離行列Ｗ0(fk)（Ｗ0(f1)〜Ｗ0(fK)）を生成したが、学習処理部４４による分離行列Ｗ(f1)〜Ｗ(fK)の学習の初期値として所定の初期分離行列Ｗ0を共通に適用する構成も採用される。また、初期分離行列Ｗ0(fk)が観測データＤ(fk)から生成される構成は本発明において必須ではない。例えば、事前に用意されて記憶装置１４に格納された初期分離行列Ｗ0(f1)〜Ｗ0(fK)を学習処理部４４による分離行列Ｗ(f1)〜Ｗ(fK)の学習の初期値として使用する構成も採用される。また、非選択周波数ｆkの初期分離行列Ｗ0(fk)を使用しない構成（例えば第７実施形態や第８実施形態）においては、Ｋ個の周波数ｆ1〜ｆKのうち周波数選択部５４が選択した周波数ｆkのみについて初期値生成部４２が初期分離行列Ｗ0(fk)を生成してもよい。

（４）変形例４
以上の各形態において周波数ｆkの選択の基準として利用した指標値（行列式ｚ1(fk)，条件数ｚ2(fk)，相互相関ｚ3(fk)，相互情報量ｚ4(fk)，トレースｚ5(fk)，尖度ｚ6(fk)）は、周波数ｆkの観測データＤ(fk)を使用した分離行列Ｗ(fk)の学習の有意性の尺度（指標値）の例示に過ぎず、以上の例示以外の指標値を周波数ｆkの選択の基準として適用した構成も当然に本発明の範囲に包含される。また、以上の例示のなかから任意に選択された２以上の指標値の組合わせも周波数ｆkの選択の基準として好適である。例えば、行列式ｚ1(fk)とトレースｚ5(f)との加重和が大きい周波数ｆkを選択する構成や、行列式ｚ1(fk)の逆数と尖度ｚ6(fk)との加重和が小さい周波数ｆkを選択する構成（何れの構成でも学習の有意性が高い周波数ｆkが選択される）が採用される。

また、各指標値の算定の方法も以上の例示に限定されない。例えば、共分散行列Ｒxx(fk)の行列式ｚ1(fk)の算定には、共分散行列Ｒxx(fk)の特異値分解を利用した第１実施形態の方法（数式(5)）のほかに、観測信号Ｖ1の強度ｘ1(r,fk)の分散σ1^２と観測信号Ｖ2の強度ｘ2(r,fk)の分散σ2^２と数式(8)の相互相関ｚ3(fk)とを以下の数式(13)に代入する方法も採用される。
ｚ1(fk)＝σ1^２σ2^２（１−ｚ3(fk)^２） ……(13)

（５）変形例５
第２実施形態を除く各形態においては音源Ｓ（Ｓ1，Ｓ2）が２個である場合（ｎ＝２）を例示したが、３個以上の音源Ｓからの音を分離する場合にも本発明は当然に適用される。音源分離の対象となる音源Ｓがｎ個である場合にはｎ個以上の収音機器Ｍが必要である。

本発明の第１実施形態に係る信号処理装置のブロック図である。観測データの内容を説明するための概念図である。信号処理部のブロック図である。分離行列生成部のブロック図である。指標算定部のブロック図である。共分散行列の行列式と観測ベクトルの分布における基底の総数との関係を説明するための概念図である。分離行列生成部の動作を説明するための概念図である。第１実施形態の効果を説明するための図表である。第２実施形態の指標算定部および周波数選択部の動作のフローチャートである。共分散行列のトレースと観測ベクトルの分布の形状との関係を説明するための概念図である。補正前尖度と加重値との関係を示すグラフである。第７実施形態における分離行列生成部のブロック図である。分離行列生成部の動作を説明するための概念図である。第９実施形態における周波数選択部のブロック図である。第９実施形態の効果を説明するための図表である。

符号の説明

１００……信号処理装置、１２……演算処理装置、１４……記憶装置、２２……周波数分析部、２４……信号処理部、２６……信号合成部、Ｐk……処理部、４０……分離行列生成部、４２……初期値生成部、４４……学習処理部、５２……指標算定部、５４……周波数選択部、７２……方向推定部、７４……行列補充部。

Claims

複数音の混合音を複数の収音機器で収音した複数の観測信号の各々における各周波数での強度の時系列を示す観測データを複数の周波数の各々について記憶する記憶手段と、
前記各周波数の観測データを使用した分離行列の学習の有意性の指標値を当該観測データから前記複数の周波数の各々について算定する指標算定手段と、
前記指標算定手段が算定した各周波数の指標値に応じて前記複数の周波数のうち少なくともひとつの周波数を選択する周波数選択手段と、
前記記憶手段に記憶された複数の観測データのうち前記周波数選択手段が選択した周波数の観測データを使用した初期分離行列の学習で当該周波数の分離行列を決定する学習処理手段とを具備し、
前記指標算定手段は、前記複数の観測信号の各々における各周波数での強度を要素とする観測ベクトルの分布における基底の総数の指標値を算定し、
前記周波数選択手段は、前記指標値が示す基底の総数が多い周波数を選択する
信号処理装置。
前記指標算定手段は、前記観測ベクトルの共分散行列の行列式を前記指標値として算定し、
前記周波数選択手段は、前記行列式が大きい周波数を選択する
請求項１の信号処理装置。
前記指標算定手段は、前記観測ベクトルの共分散行列の特異値分解で特定される特異値行列の複数の対角成分のうち第１個数の対角成分を乗算した第１行列式と、前記複数の対角成分のうち前記第１個数よりも少ない第２個数の対角成分を乗算した第２行列式とを算定し、
前記周波数選択手段は、前記第１行列式を利用した周波数の選択と、前記第２行列式を利用した周波数の選択とを順次に実行する
請求項２の信号処理装置。
前記指標算定手段は、前記観測ベクトルの共分散行列の条件数を前記指標値として算定し、
前記周波数選択手段は、前記条件数が小さい周波数を選択する
請求項１の信号処理装置。
前記複数の周波数の各々について前記初期分離行列を生成する初期値生成手段を具備し、
前記学習処理手段は、前記周波数選択手段が選択した周波数の前記初期分離行列を初期値とした学習で当該周波数の分離行列を生成し、前記周波数選択手段が選択しなかった周波数の前記初期分離行列を当該周波数の分離行列とする
請求項１から請求項４の何れかの信号処理装置。
前記学習処理手段が生成した分離行列から前記複数音の各々の音源の方向を推定する方向推定手段と、
前記周波数選択手段が選択しなかった周波数の分離行列を、前記方向推定手段が推定した方向から生成する行列補充手段と
を具備する請求項１から請求項４の何れかの信号処理装置。
前記方向推定手段は、前記複数の周波数のうち低域側の周波数および高域側の周波数の少なくとも一方を除外した周波数について前記学習処理手段が生成した分離行列から前記複数音の各々の音源の方向を推定する
請求項６の信号処理装置。
前記指標算定手段は、前記複数の周波数の各々の指標値を単位区間毎に順次に算定し、
前記周波数選択手段は、
前記複数の周波数の各々の選択／非選択を各単位区間の指標値に応じて単位区間毎に順次に判別する第１選択手段と、
複数の単位区間にわたる前記第１選択手段の判別の結果から前記少なくともひとつの周波数を選択する第２選択手段とを含む
請求項１から請求項７の何れかの信号処理装置。
前記第１選択手段は、前記複数の周波数の各々について選択／非選択を示す数値列を単位区間毎に順次に生成し、
前記第２選択手段は、前記複数の単位区間の各々の数値列の加重和から前記少なくともひとつの周波数を選択する
請求項８の信号処理装置。
複数音の混合音を複数の収音機器で収音した複数の観測信号の各々における各周波数での強度の時系列を示す観測データを複数の周波数の各々について記憶する記憶手段を具備するコンピュータに、
前記各周波数の観測データを使用した分離行列の学習の有意性の指標値を当該観測データから前記複数の周波数の各々について算定する指標算定処理と、
前記指標算定処理で算定した各周波数の指標値に応じて前記複数の周波数のうち少なくともひとつの周波数を選択する周波数選択処理と、
前記記憶手段に記憶された複数の観測データのうち前記周波数選択処理で選択した周波数の観測データを使用した初期分離行列の学習で当該周波数の分離行列を決定する学習処理処理とを実行させ、
前記指標算定処理では、前記複数の観測信号の各々における各周波数での強度を要素とする観測ベクトルの分布における基底の総数の指標値を算定し、
前記周波数選択処理では、前記指標値が示す基底の総数が多い周波数を選択する
プログラム。