JP4630203B2 - 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 - Google Patents
信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP4630203B2 JP4630203B2 JP2006048833A JP2006048833A JP4630203B2 JP 4630203 B2 JP4630203 B2 JP 4630203B2 JP 2006048833 A JP2006048833 A JP 2006048833A JP 2006048833 A JP2006048833 A JP 2006048833A JP 4630203 B2 JP4630203 B2 JP 4630203B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- signal
- unit
- normalized
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Radar Systems Or Details Thereof (AREA)
Description
複数の源信号が混在した混合信号から、源信号を推定して分離する信号分離技術としてブラインド信号分離がある。
まず、このブラインド信号分離の定式化を行う。すべての信号はあるサンプリング周波数fsでサンプリングされ、離散的に表現されるものとする。また、N個の信号が混合されてM個のセンサで観測されたとする。以下では、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより信号が反射して伝送路の歪みが発生しうる状況を扱う。このような状況での混合は、信号源kからセンサqへのインパルス応答hqk(r)による畳み込み混合
次に、従来のブラインド信号分離の手順について説明する。
ここでは周波数領域において分離の操作を行う。そのためにセンサqでの混合信号xq(t)に、フレームの長さ(サンプル点の数)をL点とした短時間離散フーリエ変換を適用し、周波数ごとの時間系列
周波数領域で処理を行うと、式(1)で示される時間領域での畳み込み混合が、
[独立成分分析による信号分離]
次に、独立成分分析(ICA: Independent Component Analysis)用いて離散周波数f毎に信号分離を行う。ICAでは混合信号ベクトルX(f,τ)のみから、N行M列の分離行列W(f)及び分離信号ベクトル
Y(f,τ)=W(f)X(f,τ) …(5)
を算出する。ここで、分離行列W(f)は、分離信号ベクトルY(f,τ)=[Y1(f,τ),...,YN(f,τ)]Tの各要素(分離信号)Y1(f,τ),...,YN(f,τ)が互いに独立になるように算出される。そのためのアルゴリズムには、非特許文献1に記載されているものなどがある。
A. Hyvarinen and J. Karhunen and E. Oja, "Independent Component Analysis," John Wiley & Sons, 2001, ISBN 0-471-40540-X
図25(a)は、従来のブラインド信号分離手法による分離性能をSIR(Signal-to-Interference Ratio,分離信号における目的信号成分と干渉信号成分のパワー比)で示した棒グラフである。なお、この実験では、二つの音声を同時に鳴らし、これらの混合信号を二つのマイクロホンで観測した。また、サンプリング周波数を8000Hzとし、短時間フーリエ変換に用いたフレームの長さをL=512サンプル(64ms)とし、そのフレームのシフト幅を128サンプル(16ms)とした。そして、数十回以上の試行の平均値を図25(a)に示している。また、このグラフでは、観測データの時間長(Data length)を横軸(0.1,0.2,0.3,0.5,0.75,1秒)に示し、各時間長に対応する分離性能(Signal-to-Interference Ratio)を縦軸に示した。また、各棒グラフの上に3,9,15,28,43,59と数字を示したが、これは、各周波数ビンでICAに用いられるサンプル数を示している。なお、これらのサンプル数は、観測データの時間長、フレームの長さ、そのシフト幅から分かる。例えば、時間長が0.2秒である観測データのサンプル数が9個であることは、フレーム長64ms及びシフト幅16msに対し、64+16×(9−l)の計算結果l92msが0.2秒以下の最大値となることから分かる。また、この棒グラフに対応する観測データの観測状況は、図25(b)に示す通りである。
なお、このような問題は、サンプリング周波数を高くしたり、フレーム長を長くしたり、フレームのシフト幅を狭くしたりしてサンプル数を増やしても解決されるものではない。このような手法をとっても、特徴量が類似するサンプルの数が増加するだけであり、ICAのような統計的処理の精度向上にはほとんど貢献しないからである。また、このような問題が、フーリエ変換によって時間領域から周波数領域への変換を行う場合に限定して生じるものでないことはいうまでもない。また、このような問題はICAの結果を用いた信号の方向推定の際にも生じるものである。
また、本発明において好ましくは、周波数逆正規化部が、正規化分離行列を離散周波数毎の分離行列に変換する。これにより、各離散周波数に対応する周波数領域の分離信号を算出することができる。
また、本発明において好ましくは、周波数逆正規化部は、第1逆行列計算部において、正規化分離行列の一般化逆行列を求め、周波数依存性成分付与部において、一般化逆行列の各要素に周波数依存性成分を付与し、離散周波数毎の一般化逆行列を生成し、第2逆行列計算部において、それらの一般化逆行列を、離散周波数毎の分離行列或いは離散周波数毎の初期分離行列として求める。また、上述の順列正規化一般化逆行列が求まっているならば、周波数依存性成分付与部において、順列正規化一般化逆行列の各要素に周波数依存性成分を付与し、離散周波数毎の一般化逆行列を生成し、第2逆行列計算部において、それらの一般化逆行列を、離散周波数毎の分離行列として求める。このようにすることにより、周波数依存成分を付与することができる。なお、「一般化逆行列」は、単なる逆行列(処理対象となる正規化分離行列或いは順序正規化分離行列が正方行列の場合)をも含む概念である。
また、本発明において好ましくは、正規化部は、第2偏角正規化部において、混合信号ベクトルが具備する特定の1つの要素を基準として当該混合信号ベクトルの各要素の偏角を正規化し、周波数正規化部において、第2偏角正規化部で正規化された各要素の偏角を離散周波数に比例した値で除算し、各要素の偏角の周波数依存性を排除する。これにより、偏角が異なる混合信号ベクトルの各要素から、容易に周波数依存性を排除することができる。
〔第1の実施の形態〕
まず、本発明における第1の実施の形態について説明する。
本形態は、全ての周波数ビンを統合したバンド処理単位で、正規化ベクトルの独立成分分析を行い、正規化分離行列を算出する形態である。
図1は、第1の実施の形態における信号分離装置1のハードウェア構成を例示したブロック図である。
図1に例示するように、この例の信号分離装置1は、CPU(Central Processing Unit)10、入力部20、出力部30、補助記憶装置40、RAM(Random Access Memory)50、ROM(Read Only Memory)60及びバス70を有している。
この例のCPU10は、制御部11、演算部12及びレジスタ13有し、レジスタ13に読み込まれた各種プログラムに従って様々な演算処理を実行する。また、この例の入力部20は、データが入力される入力ポート、キーボード、マウス等であり、出力部30は、データを出力する出力ポート、ディスプレイ等である。補助記憶装置40は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、本形態の信号分離処理を実行するための信号分離プログラムを格納した信号分離プログラム領域41及びセンサで観測された時間領域の混合信号等の各種データが格納されるデータ領域42を有している。また、RAM50は、例えば、SRAM (Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等であり、信号分離プログラムが書き込まれる信号分離プログラム領域51及び各種データが書き込まれるデータ領域52を有している。また、この例のバス70は、CPU10、入力部20、出力部30、補助記憶装置40、RAM50及びROM60を通信可能に接続している。
この例のCPU10は、読み込まれたOS(Operating System)プログラムに従い、補助記憶装置40の信号分離プログラム領域41に格納されている信号分離プログラムを、RAM50の信号分離プログラム領域51に書き込む。同様にCPU10は、補助記憶装置40のデータ領域42に格納されている時間領域の混合信号等の各種データをRAM50のデータ領域52に書き込む。さらに、CPU10は、この信号分離プログラムや各種データが書き込まれたRAM50上のアドレスをレジスタ13に格納する。そして、CPU10の制御部11は、レジスタ13に格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM50上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部12に順次実行させ、その演算結果をレジスタ13に格納していく。
図2に例示するように、信号分離装置1は、メモリ100、周波数領域変換部120、正規化部130、独立成分分析部140、周波数逆正規化部150、分離信号生成部160、時間領域変換部170、制御部180及び一時メモリ190を有している。また、メモリ100は、記憶領域101〜112を有している。また、図3に例示するように、正規化部130は、偏角正規化部131、周波数正規化部132及び偏角一様化部133を有している。さらに、周波数逆正規化部150は、逆行列生成部151、周波数依存成分付与部152及び逆行列生成部153を有し、周波数依存成分付与部152は、偏角正規化部152a及び周波数乗算部152bを有している。
なお、図2及び図3における破線の矢印は理論上の情報の流れを示し、実線の矢印は実際のデータの流れを示す。また、これらの図において制御部180に出入りするデータの流れに対応する矢印は省略してある。
次に、本形態の信号分離装置1の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号xq(t)(q∈{1,...,M})がメモリ100の記憶領域101に格納されているものとする。
図4は、第1の実施の形態における信号分離装置1の処理の全体を説明するためのフローチャートである。また、図5は、図4のステップS2の詳細を説明するためのフローチャートである。また、図6(a)は、図4のステップS4の詳細を説明するためのフローチャートであり、図6(b)は、図6(a)のステップS22の詳細を説明するためのフローチャートである。以下、これらの図に沿って、本形態における信号分離装置1の処理を説明していく。なお、以下の各処理は制御部180の制御のもと実行される。また、明記しない限り、処理過程の各データは一時メモリ190に逐一格納・抽出される。
まず、周波数領域変換部120において、メモリ100の記憶領域101から時間領域の混合信号xq(t)を読み出し、これらを短時間離散フーリエ変換等によって周波数毎の時系列の信号(「周波数領域の混合信号」と呼ぶ)Xq(f,τ)(q∈{1,...,M})に変換し、メモリ100の記憶領域102に格納する(ステップS1)。なお、周波数領域の混合信号Xq(f,τ)は、離散周波数f及び離散時刻τの組(f,τ)に対応する周波数ビン毎の信号である。
次に、正規化部130が、メモリ100の記憶領域102から周波数領域の混合信号Xq(f,τ)を読み込む。そして、正規化部130は、これらを要素とする混合信号ベクトルX(f,τ)=[X1(f,τ),...,XM(f,τ)]Tに対し、周波数依存性を排除する正規化を行い、正規化ベクトルX'''(f,τ)=[X1''' (f,τ),...,XM''' (f,τ)]Tを算出する(ステップS2)。算出された正規化ベクトルX''' (f,τ)は、メモリ100の記憶領域105に格納される。なお、正規化ベクトルX''' (f,τ)は、時間周波数スロット毎に算出されるベクトルである。この処理の詳細は後述する。
次に、独立成分分析部140が、メモリ100の記憶領域105から正規化ベクトルX''' (f,τ)を読み込み、複数の周波数ビンを統合したバンド処理単位毎に独立成分分析(ICA)を行い、正規化分離行列W(B)を算出する(ステップS3)。算出された正規化分離行列W(B)は、メモリ100の記憶領域106に格納される。本形態の独立成分分析部140は、離散周波数f∈{0,fs/L,...,fs(L-1)/L}に対応する全ての周波数ビンを統合したバンド処理単位で、正規化ベクトルの独立成分分析を行い、正規化分離行列W(B)(B={0,fs/L,...,fs(L-1)/L})を算出する。すなわち、本形態の独立成分分析に用いられるサンプルは、対象とする離散時間幅に含まれる全てのτと全ての離散周波数(0,fs/L,...,fs(L-1)/L)との組に対応する正規化ベクトルX''' (f,τ)である。
次に、周波数逆正規化部150が、メモリ100の記憶領域106から正規化分離行列W(B)を読み込む。そして、周波数逆正規化部150は、正規化分離行列W(B)を離散周波数毎の分離行列W(f)(f∈{0,fs/L,...,fs(L-1)/L }=B)に変換し、各離散周波数毎の分離行列W(f)をメモリ100の記憶領域110に格納する(ステップS4)。この処理の詳細は後述する。
次に、分離信号生成部160が、メモリ100の記憶領域102から混合信号ベクトルX(f,τ)を読み込み、記憶領域110から離散周波数毎の分離行列W(f)を読み込む。そして、分離信号生成部160は、混合信号ベクトルX(f,τ)と離散周波数毎の分離行列W(f)とを用い、Y(f,τ)= W(f) X(f,τ)により、周波数領域の分離信号Yp(f,τ) (p∈{1,...,N})を要素とする分離信号ベクトルY(f,τ)=[Y1(f,τ),...,YN(f,τ)]Tを算出する(ステップS5)。算出された分離信号ベクトルY(f,τ)は、メモリ100の記憶領域111に格納される。
次に、時間領域変換部170が、メモリ100の記憶領域111から分離信号ベクトルY(f,τ)=[Y1(f,τ),...,YN(f,τ)]Tを読み込む。そして、時間領域変換部170は、短時間逆フーリエ変換等によって、分離信号ベクトルY(f,τ)=[Y1(f,τ),...,YN(f,τ)]Tを時間領域の分離信号ベクトルy(t)=[y1(t),...,yN(t)]Tに変換し、分離信号ベクトルy(t)をメモリ100の記憶領域112に格納する。
次に、前述した正規化部130の処理の詳細を説明する。前述のように、正規化部130は、混合信号ベクトルX(f,τ)=[X1(f,τ),...,XM(f,τ)]Tに対し、周波数依存性を排除する正規化を施して正規化ベクトルX''' (f,τ)=[X1''' (f,τ),...,XM''' (f,τ)]Tを生成する。このような正規化は、混合信号ベクトルの要素Xq(f,τ)毎に行われる。この正規化の目的は、要素Xq(f,τ)の偏角arg[Xq(f,τ)]に含まれる周波数依存性を取り除くことであり、以下の操作で処理が行われる。
まず、偏角正規化部131(図3(a))が、メモリ100の記憶領域102から混合信号ベクトルX(f,τ)を読み込む。そして、偏角正規化部131は、混合信号ベクトルX(f,τ)が具備する特定の1つの要素XQ(f,τ)(1≦Q≦M,Qは特定のセンサに対応する値)を基準として当該混合信号ベクトルX(f,τ)の各要素Xq(f,τ)の偏角を正規化し、偏角が正規化された各要素Xq’(f,τ)を生成し、これらをメモリ100の記憶領域103に格納する(ステップS11)。なお、この偏角の正規化は、例えば、以下の演算によって行う。ここで、|・|は・の絶対値を意味し、expはネピア数を意味し、arg[・]は偏角を意味し、jは虚数単位を意味する。
次に、周波数正規化部132が、メモリ100の記憶領域103から、偏角が正規化された各要素Xq’(f,τ)を読み込む。そして、周波数正規化部132は、偏角正規化された各要素Xq’(f,τ)の偏角を離散周波数f(f∈B)に比例した値で除算し、各要素Xq’(f,τ)の偏角の周波数依存性を排除し、周波数が正規化された各要素Xq''(f,τ)を生成する(ステップS12)。周波数が正規化された各要素Xq'' (f,τ)は、メモリ100の記憶領域104に格納される。なお、この周波数の正規化は、例えば、以下の演算によって行う。ここで、dは任意の正の数であり、センサQと他のセンサqとの距離の最大値とするのが好ましい。また、cは信号の速度である。
なお、上述の式(6)〜(8)で正規化を行う場合、正規化部130は、以下の演算に示す正規化を行うことになる。
正規化部130が行う正規化としては、上述の式(6)〜(9)の操作を多少変形したものなど、様々なものが考えられる。例えば、式(6)の操作の代わりに、以下の操作によって偏角の正規化を行ってもよい。ただし、・*は、・の複素共役である。また、ψ{・}は関数であり、クラスタリング精度の観点から好ましくは単調増加関数であることが望ましい。
Xq’(f,τ)=|Xq(f,τ)|exp{j・(arg[Xq(f,τ)]−arg[XQ(f,τ)])} …(11)
Xq’(f,τ)=|Xq(f,τ)|exp{j・ψ(arg[Xq(f,τ)/ XQ(f,τ)])} …(12)
また、式(6)(10)〜(12)における|Xq(f,τ)|を1などの定数としてもよい。さらに、例えば、式(8)や(9)のexpの引数に定数を加算したものをexpの引数とする操作を行うこととしてもよい。また、式(8)や(9)においてarg[XQ(f,τ)]を偏角に足し合わせる代わりに、偏角に乱数を足し合わせる操作であってもよい。さらには、独立成分分析部140によるICAアルゴリズムによっては、偏角一様化部133による正規化を行わなくてもよい。
次に、前述した周波数逆正規化部150の処理の詳細を説明する。前述のように、周波数逆正規化部150は、正規化分離行列W(B)を離散周波数毎の分離行列W(f)に変換する。以下にこの操作の詳細を示す。
まず、逆行列生成部151(図3(b))が、メモリ100の記憶領域106から正規化分離行列W(B)を読み込む。そして、逆行列生成部151は、正規化分離行列W(B)の一般化逆行列A(B)を求め、これをメモリ100の記憶領域107に格納する(ステップS21)。なお、正規化分離行列W(B)が正方行列の場合、A(B)は正規化分離行列W(B)の逆行列である。また、正規化分離行列W(B)が正方行列でない場合、A(B)の算出には、ムーア・ペンローズ(Moore-Penrose)型擬似逆行列等の誤差最小型の一般化逆行列を用いることが望ましい。
次に、周波数依存成分付与部152において、一般化逆行列A(B)の各要素に周波数依存性成分を付与し、離散周波数毎の一般化逆行列A’(f)を生成する(ステップS22)。生成された離散周波数毎の一般化逆行列A’(f)は、メモリ100の記憶領域109に格納される。
具体的には、例えばまず、周波数依存成分付与部152の偏角正規化部152aが、メモリ100の記憶領域107から一般化逆行列A(B)を読み込む。そして、偏角正規化部152aは、一般化逆行列A(B)の各列の各要素Aqp(B)の偏角を、当該各列が具備する特定の1つの要素AQp(B)を基準として正規化し、偏角が正規化された各要素Aqp’(B)からなる行列A’(B)を生成する(ステップS31)。偏角が正規化された各要素Aqp’(B)からなる行列A’(B)は、メモリ100の記憶領域108に格納される。なお、この正規化は、例えば、以下の演算によって行われる。
次に、周波数依存成分付与部152の周波数乗算部152bが、メモリ100の記憶領域108から、偏角が正規化された各要素Aqp’(B)を読み込む。そして、周波数乗算部152bは、偏角が正規化された行列A’(B)の各要素Aqp’(B)の偏角に、離散周波数に比例した値を乗じることにより、当該各要素Aqp’(B)の偏角に周波数依存性成分を付与し、偏角に周波数依存性成分を付与した各要素Aqp’(f)からなる離散周波数毎の一般化逆行列A’(f)を生成し、メモリ100の記憶領域109に格納する(ステップS32)。なお、この操作は、例えば、以下の演算によって行われる。ただしf∈{0,fs/L,...,fs(L-1)/L}=Bである。
なお、上述の式(13)(14)で操作を行う場合、周波数依存成分付与部152は、以下の演算に示す操作を行うことになる。
Aqp’'(f)=|Aqp’(B)|exp{j・arg[Aqp(B)/AQp(B)]・4fc-1d} …(15)
式(15)等に示すように、周波数依存成分付与部152は、正規化部130において取り除かれた周波数依存性を戻す操作を行う。結果として、Aqp’'(f)を要素とする行列A(f)は離散周波数に依存したものとなっている。
Aqp’(B)=|Aqp(B)|exp{j・arg[Aqp(B)・AQp *(B)]} …(16)
Aqp’(B)=|Aqp(B)|exp{j・(arg[Aqp(B)]−arg[AQp(B)])} …(17)
Aqp’(B)=|Aqp(B)|exp{j・ψ(arg[Aqp(B)/ AQp(B)])} …(18)
また、式(16)〜(18)における|Aqp(B)|を1などの定数としてもよい([ステップS22の詳細]の説明終わり)。
次に、逆行列生成部153が、メモリ100の記憶領域109から離散周波数毎の一般化逆行列A’(f)を読み込む。そして、逆行列生成部153は、離散周波数毎の一般化逆行列A’(f)の一般化逆行列を、離散周波数毎の分離行列W(f)として求め、これをメモリ100の記憶領域110に格納する(ステップS23)。なお、離散周波数毎の一般化逆行列A’(f)が正方行列の場合、離散周波数毎の分離行列W(f)は、離散周波数毎の一般化逆行列A’(f)の逆行列である。離散周波数毎の一般化逆行列A’(f)が正方行列でない場合、離散周波数毎の分離行列W(f)の算出には、ムーア・ペンローズ(Moore-Penrose)型擬似逆行列等の誤差最小型の一般化逆行列を用いることが望ましい。
図7は、第1の実施の形態の処理においてICAに用いられるデータのサンプル数が増加する様子を示した概念図である。
この図の場合、混合信号ベクトルX(f,τ)は、8個の周波数ビン202に対し、それぞれ4個ずつ存在する。すなわち、32個の時間周波数スロット201が存在する。この場合、従来技術では、離散周波数f毎、4個のデータサンプルに対してICAが適用されることになる(図24参照)。すなわち、従来技術におけるICAのデータサンプル数は4個となる。
本形態では、混合信号ベクトルX(f,τ)の各要素Xq(f,τ)に対し、ステップS2のような操作を行って正規化を行っているが、その背景として以下を仮定している。
1.信号源kからセンサqヘの周波数応答Hqkが直接波モデル(壁などの反射による残響がない)に従っていること。
2.信号源が時間周波数表現においてスパース性を満たしていること(個々の時間周波数スロット(f,τ)で高々一つの源信号が振幅を持ち、他の源信号の振幅は0となる)。
図8は、図25(a)の実験結果(従来技術)を得たのと同じ実験条件、すなわち、図25(b)の条件において、本形態の信号分離装置1を適用した結果を示した棒グラフである。なお、図8の棒グラフの縦軸はSIR(Signal-to-Interference Ratio〔dB〕)を示し、横軸は観測データの時間長(Data length〔sec〕)を示す。
図8に示すように、本形態の信号分離装置1を適用した場合、データの時間長が非常に短い場合にも比較的良好な分離性能を達成していることが分かる。ただし、観測データの時間長が長くなっても、[正規化部130の正規化における仮定]で説明したように、分離性能はある程度のところで頭打ちしている。
本形態の特徴をまとめる。本形態の手法を用いた場合、非常に短い観測データに対しても、ある程度の分離性能を達成できる。すなわち、本形態の手法は、動きのある信号源や、非常に短い時間しか発生しない信号源の分離に適している。
また、本形態の手法を用いた場合の分離性能は、信号源−センサ間距離が短いほど高くなる。さらに、ICAが適用されるサンプル数を増やしていっても、分離性能はある程度のところで頭打ちする。そのため、全ての周波数ビンを統合しなくても十分な数のサンプルが得られる場合には、一部の周波数ビンを統合した1つのバンド処理単位に対してICAを適用する構成としてもよいし、複数のバンド処理単位毎にICAを適用する構成(後述する第2の実施の形態等)としてもよい。
〔参考文献1〕
S. Araki, H. Sawada, R. Mukai and S. Makino, "A novel blind source separation method with observation vector clustering," International Workshop on Acoustic, Echo and Noise Control (IWAENC), pp. 177-120, Sept. 12-15, 2005.
〔第2の実施の形態〕
次に、本発明における第2の実施の形態について説明する。本形態は、第1の実施の形態の変形例である。第2の実施の形態では、複数のバンド処理単位が存在する。すなわち、本形態では、一部の周波数ビンを統合した複数のバンド処理単位毎に、正規化ベクトルの独立成分分析を行い、正規化分離行列を算出する。また、バンド処理単位間でのパーミュテーション問題を周波数ビン間で解決する。なお、以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
図10は、第2の実施の形態の信号分離装置300の構成を例示したブロック図である。なお、第1の実施の形態と同様、第2の実施の形態の信号分離装置300も、公知のコンピュータに信号分離プログラムが読み込まれ、実行されることにより構成されるものである。また、図10において、第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を付した。
図10に例示するように、信号分離装置300は、メモリ100、周波数領域変換部120、正規化部130、独立成分分析部140、周波数逆正規化部150、分離信号生成部160、時間領域変換部170、制御部180、一時メモリ190及び周波数間パーミュテーション問題解決部310を有している。また、メモリ100は、記憶領域101〜112,301を有している。ここで、周波数間パーミュテーション問題解決部310は、CPUにOSプログラムや信号分離プログラムが読み込まれることにより構成されるものである。
なお、図10における破線の矢印は理論上の情報の流れを示し、実線の矢印は実際のデータの流れを示す。また、この図において制御部180に出入りするデータの流れに対応する矢印は省略してある。
次に、本形態の信号分離装置300の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号xq(t)(q∈{1,...,M})がメモリ100の記憶領域101に格納されているものとする。
図11は、第2の実施の形態における信号分離装置300の処理の全体を説明するためのフローチャートである。また、図12は、図11のステップS104の詳細を説明するためのフローチャートである。以下、これらの図に沿って、本形態における信号分離装置300の処理を説明していく。なお、以下の各処理は制御部180の制御のもと実行される。また、明記しない限り、処理過程の各データは一時メモリ190に逐一格納・抽出される。
周波数領域変換部120及び正規化部130の処理(ステップS101,S102)は、第1の実施の形態と同じであるため説明を省略する。
次に、独立成分分析部140が、メモリ100の記憶領域105から正規化ベクトルX'''(f,τ)を読み込む。そして、独立成分分析部140は、一部の周波数ビン(離散周波数fの部分集合B⊂{0,fs/L,...,fs(L-1)/L}に対応)を統合したバンド処理単位で、正規化ベクトルの独立成分分析を行い、正規化分離行列W(B)を算出する(ステップS103)。すなわち、本形態のバンド処理単位毎の独立成分分析に用いられるサンプルは、対象とする離散時間幅に含まれる全てのτと各バンド処理単位に対応する部分集合B⊂{0,fs/L,...,fs(L-1)/L}との組に対応する正規化ベクトルX'''(f,τ)である。なお、算出された各正規化分離行列W(B)は、メモリ100の記憶領域106に格納される。
次に、周波数逆正規化部150が、メモリ100の記憶領域106から、各バンド処理単位に対応する正規化分離行列W(B)を読み込む。そして、周波数逆正規化部150は、各バンド処理単位の正規化分離行列W(B)を離散周波数毎の初期分離行列W'(f)(f∈B)に変換し、離散周波数毎の初期分離行列W'(f)をメモリ100の記憶領域110に格納する(ステップS104)。なお、正規化分離行列W(B)を離散周波数毎の初期分離行列W'(f)(f∈B)に変換する処理の詳細は後述する。
次に、周波数間パーミュテーション問題解決部310が、離散周波数毎の初期分離行列W’(f)の行を並び替え、パーミュテーション問題を解決した離散周波数毎の分離行列W(f)を生成する(ステップS105)。離散周波数毎の分離行列W(f)は、メモリ100の記憶領域301に格納される。なお、パーミュテーションを解決する具体的な手法については特に限定はなく、例えば、参考文献2に記載された手法等の公知のものを用いればよい。
[参考文献2]R. Mukai, H. Sawada, S. Araki and S. Makino, "Frequency Domain Blind Source Separation using Small and Large Spacing Sensor Pairs," in Proc. of ISCAS 2004, vol.V, pp.1-4, May 2004.
次に、分離信号生成部160が、メモリ100の記憶領域102から混合信号ベクトルX(f,τ)を読み込み、記憶領域301から離散周波数毎の分離行列W(f)を読み込む。そして、分離信号生成部160は、混合信号ベクトルX(f,τ)と離散周波数毎の分離行列W(f)とを用い、Y(f,τ)= W(f) X(f,τ)により、周波数領域の分離信号Yp(f,τ) (p∈{1,...,N})を要素とする分離信号ベクトルY(f,τ)=[Y1(f,τ),...,YN(f,τ)]Tを算出する(ステップS106)。算出された分離信号ベクトルY(f,τ)は、メモリ100の記憶領域111に格納される。
時間領域変換部170の処理(ステップS107)は第1の実施の形態と同じであるため、説明を省略する。
次に、前述した周波数逆正規化部150の処理(ステップS104)の詳細を説明する。前述のように、本形態の周波数逆正規化部150は、各バンド処理単位の正規化分離行列W(B)を離散周波数毎の初期分離行列W'(f)(f∈B)に変換する。この処理は、第1の実施の形態におけるステップS4の処理(図6(a))に類似する。第1の実施の形態との相違点は、生成されるのが離散周波数毎の分離行列ではなく、パーミュテーションの問題を有する離散周波数毎の初期分離行列W'(f)(f∈B)である点のみである。
図13は、第2の実施の形態の処理においてICAに用いられるデータのサンプル数が増加する様子を示した概念図である。
この図の場合、混合信号ベクトルX(f,τ)は、8個の周波数ビン202に対し、それぞれ4個ずつ存在する。すなわち、32個の時間周波数スロット201が存在する。この場合、従来技術におけるICAのデータサンプル数は4個となる。
しかし、本形態では、混合信号ベクトルX(f,τ)の周波数依存性を排除して正規化ベクトルX'''(f,τ)を生成し、一部の周波数ビンを統合したバンド処理単位211毎にICAを適用する。図13の例の場合、下3個の離散周波数fの集合B1に対応する周波数ビンが1つ目のバンド処理単位221を構成し、上5個の離散周波数fの集合B2に対応する周波数ビンが2つ目のバンド処理単位222を構成している。そして、バンド処理単位221では、離散周波数fの集合B1に対応する12個の正規化ベクトルX'''(f,τ)をデータサンプルとしてICAを適用し、バンド処理単位222では、離散周波数fの集合B2に対応する20個の正規化ベクトルX'''(f,τ)をデータサンプルとしてICAを適用する。すなわち、本形態におけるICAのデータサンプル数は、バンド処理単位221で12個、バンド処理単位222で20個となり、いずれも従来技術と比較してデータサンプル数が増加している。その結果、ICAにおけるデータの統計的性質が改善され、ICAによる分離の性能向上が期待できる。そして、このようにICAを適用した結果、バンド処理単位221,222にそれぞれ対応する2つの正規化分離行列W(B1),W(B2)が得られる。
本形態の特徴をまとめる。本形態の手法を用いた場合、非常に短い観測データに対しても、ある程度の分離性能を達成できる。すなわち、本形態の手法は、動きのある信号源や、非常に短い時間しか発生しない信号源の分離に適している。
また、第1の実施の形態で述べた通り、ICAが適用されるサンプル数を増やしていっても、分離性能はある程度のところで頭打ちする。そのため、全ての周波数ビンを統合しなくても十分なサンプルが得られる場合には、本形態のように複数のバンド処理単位毎にICAの処理を行うことが望ましい。すなわち、サンプル数が十分である場合、第1の実施の形態で説明した[正規化部130の正規化における仮定]がよく成り立つ離散周波数に対応するバンド処理単位でのICAの精度は、この仮定があまり成り立たない離散周波数に対応するバンド処理単位でのICAの精度よりも高くなる。このように複数のバンド処理単位でICAを行うことにより、上述の仮定がよく成り立つ離散周波数での分離性能をさらに向上させることができる。なお、本形態の手法も第1の実施の形態同様、参考文献1の手法に比較した有利な効果を有する。
次に、本発明における第3の実施の形態について説明する。本形態は、第1,2の実施の形態の変形例である。第2の実施の形態と同様、第3の実施の形態でも、複数のバンド処理単位が存在する。ただし、パーミュテーション問題の解決は、バンド処理単位間で解決する。なお、以下では、第1,2の実施の形態との相違点を中心に説明し、第1,2の実施の形態と共通する事項については説明を省略する。
図14は、第3の実施の形態の信号分離装置400の構成を例示したブロック図である。また、図15(a)は、バンド間パーミュテーション問題解決部410の詳細構成を例示したブロック図であり、図15(b)は、周波数逆正規化部450の詳細構成を例示したブロック図である。なお、第1の実施の形態と同様、第3の実施の形態の信号分離装置400も、公知のコンピュータに信号分離プログラムが読み込まれ、実行されることにより構成されるものである。なお、図14において、第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を付した。
図14に例示するように、信号分離装置400は、メモリ100、周波数領域変換部120、正規化部130、独立成分分析部140、分離信号生成部160、時間領域変換部170、制御部180、一時メモリ190、バンド間パーミュテーション問題解決部410及び周波数逆正規化部450を有している。また、メモリ100は、記憶領域101〜106,108〜112,401〜404を有している。さらに、この例のバンド間パーミュテーション問題解決部410は、逆行列生成部411、正規化部412、クラスタリング部413、順列算出部414、及び並び替え部415を有している。また、周波数逆正規化部450は、周波数乗算部152bを具備する周波数依存成分付与部452と、逆行列生成部153を有している。ここで、バンド間パーミュテーション問題解決部410及び周波数逆正規化部450は、CPUにOSプログラムや信号分離プログラムが読み込まれることにより構成されるものである。
次に、本形態の信号分離装置400の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号xq(t)(q∈{1,...,M})がメモリ100の記憶領域101に格納されているものとする。
図16は、第3の実施の形態における信号分離装置400の処理の全体を説明するためのフローチャートである。また、図17(a)は、図16のステップS204の詳細を説明するためのフローチャートである。また、図17(b)は、図16のステップS205の詳細を説明するためのフローチャートである。以下、これらの図に沿って、本形態における信号分離装置400の処理を説明していく。なお、以下の各処理は制御部180の制御のもと実行される。また、明記しない限り、処理過程の各データは一時メモリ190に逐一格納・抽出される。
周波数領域変換部120及び正規化部130の処理(ステップS201,S202)は、第1の実施の形態と同じであるため説明を省略する。また、独立成分分析部140の処理(ステップS203)は、第2の実施の形態と同じであるため説明を省略する。
次に、バンド間パーミュテーション問題解決部410が、メモリ100の記憶領域106から、各バンド処理単位に対応する正規化分離行列W(B)を読み込む。そして、バンド間パーミュテーション問題解決部410は、正規化分離行列W(B)の一般化逆行列A(B)の列ベクトルを用いて順列ΠBを生成し、パーミュテーション問題を解決した順列正規化一般化逆行列A''(B)を生成する(ステップS204)。生成された順列正規化一般化逆行列A''(B)は、メモリ100の記憶領域404に格納される。なお、この詳細については後述する。
次に、周波数逆正規化部450が、メモリ100の記憶領域404から、順列正規化一般化逆行列A''(B)を読み込む。そして、周波数逆正規化部450は、順列正規化一般化逆行列A''(B)を用い、離散周波数毎の分離行列W(f)(f∈B)を生成する(ステップS205)。離散周波数毎の分離行列W(f)は、メモリ100の記憶領域110に格納される。なお、この処理の詳細については後述する。
分離信号生成部160・時間領域変換部170の処理(ステップS206,S207)は、第1の実施の形態と同じであるため、説明を省略する。
次に、前述したバンド間パーミュテーション問題解決部410の処理の詳細を説明する。前述したように、バンド間パーミュテーション問題解決部410は、正規化分離行列W(B)の一般化逆行列A(B)の列ベクトルを用いて順列ΠBを生成し、パーミュテーション問題を解決した順列正規化一般化逆行列A''(B)を生成する。
まず、逆行列生成部411(図15(a))が、メモリ100の記憶領域106から各正規化分離行列W(B)を読み込む。そして、逆行列生成部411は、各正規化分離行列W(B)の一般化逆行列A(B)=[A1(B),...,AN(B)]を算出する(ステップS211)。なお、一般化逆行列としては、例えば、ムーア・ペンローズ(Moore-Penrose)型擬似逆行列等の誤差最小型の一般化逆行列を用いることが望ましい。また、正規化分離行列W(B)が正方行列の場合、A(B)はW(B)の逆行列である。算出された各一般化逆行列A(B)は、メモリ100の記憶領域401に格納される。
このような正規化の結果、それらをクラスタリングした際に、各クラスタが各信号源に対応するようになる。この正規化を適切に行わないとクラスタが形成されない。また、生成された正規化列ベクトルA'p(B)は、メモリ100の記憶領域108に格納される(正規化列ベクトルA'p(B)を要素とする行列をA'(B)と表記する)。
ノルムの正規化を行っている場合、このクラスタリングは、例えば、各クラスタCpの要素(正規化列ベクトルA'v(B),v∈{1,...,N})と各クラスタCpのセントロイドηpとの間の二乗和Upの総和U
[参考文献3]R. O. Duda, P. E. Hart, and D. G. Stork, Pattern Classification, Wiley Interscience, 2nd edition, 2000.
なお、クラスタCpのセントロイドηpは、
一方、ノルムの正規化を行わない構成の場合、このクラスタリングは、正規化列ベクトルA'p(B)の方向のみが似ているかどうかを基準に行う。これは、類似度を用いた評価になる。類似度の1つとしてコサイン距離
cosθ=|A'p H(B)・ηk|/(‖A'p(B)‖・‖ηk‖)…(22)
を例示できる。ここでθは、正規化列ベクトルA'p(B)とセントロイドηkのベクトルとがなす角度である。また、・Hは、・の複素共役転置を示す。コサイン距離を用いる場合、クラスタリング部413は、コサイン距離の総和
次に、順列算出部414が、メモリ100の記憶領域402から各クラスタCpのセントロイドηpの情報それぞれ読み込む。そして、順列算出部414は、これらを用い、クラスタCpのセントロイドηpと正規化列ベクトルA'p(B)とを用い、正規化列ベクトルA'p(B)の順序を並び替えてパーミュテーション問題を解決するための順列ΠB({1,2,…,N}から{1,2,…,N}への全単射な関数)を算出する(ステップS214)。
なお、この順列ΠBは、
なお、式(24)に従って順列ΠBを決定する手順としては、例えば、採り得るすべての順列Π(N!通り)に対して
信号源の数Nが3であり、バンド処理単位に対応する周波数Bにおける正規化列ベクトルA'1(B),A'2(B),A'3(B)と各セントロイドη1,η2,η3との距離の自乗が、以下の表に示されるものであったとする。
ΠB:[1,2,3]→[2,3,1]
となる。なぜなら、
‖η1- A'Π(1)(B)‖2=‖η1- A'2(B)‖2=0.1
‖η2- A'Π(2)(B)‖2=‖η2- A'3(B)‖2=0.2
‖η3- A'Π(3)(B)‖2=‖η3- A'1(B)‖2=0.15
という組合せが、式(25)を最小とするからである(順列ΠB決定の具体例1の説明終わり)。
まず、上記の表1の場合、距離の自乗の最小値は0.1(正規化列ベクトルA'2(B)と各セントロイドη1との距離の自乗)であるため、Π(1)=2を決定する。そして、正規化列ベクトルA'2(B)とセントロイドη1とに関連する行と列とを消すと以下のようになる。
次に、並び替え部415が、メモリ100の記憶領域108から正規化列ベクトルA'p(B)を、記憶領域403から順列ΠBを読み込む。そして、並び替え部415は、正規化列ベクトルA'p(B)から構成される正規化一般化逆行列A’(B)の列を順列ΠBに従って並び替えた順列正規化一般化逆行列A''(B)を生成する(ステップS215)。
また、ここで説明したバンド間パーミュテーション問題解決部410の処理は一例であり、これ以外の公知の手法(例えば、参考文献1参照)によってパーミュテーション問題を解決してもよい。
[周波数逆正規化部450の処理(ステップS205)の詳細]
次に、前述した周波数逆正規化部150の処理(ステップS205)の詳細を説明する。
図18は、第3の実施の形態の処理においてICAに用いられるデータのサンプル数が増加する様子を示した概念図である。
この図の場合、混合信号ベクトルX(f,τ)は、8個の周波数ビン202に対し、それぞれ4個ずつ存在する。すなわち、32個の時間周波数スロット201が存在する。この場合、従来技術におけるICAのデータサンプル数は4個となる。これに対し、本形態におけるICAのデータサンプル数は、第2の実施の形態で説明したのと同様、バンド処理単位221で12個、バンド処理単位222で20個となり、いずれも従来技術と比較してデータサンプル数が増加している。その結果、ICAにおけるデータの統計的性質が改善され、ICAによる分離の性能向上が期待できる。そして、このようにICAを適用した結果、バンド処理単位221,222にそれぞれ対応する2つの正規化分離行列W(B1),W(B2)が得られる。
本形態の特徴をまとめる。本形態の手法を用いた場合、非常に短い観測データに対しても、ある程度の分離性能を達成できる。すなわち、本形態の手法は、動きのある信号源や、非常に短い時間しか発生しない信号源の分離に適している。
また、第1の実施の形態で述べた通り、ICAが適用されるサンプル数を増やしていっても、分離性能はある程度のところで頭打ちする。そのため、全ての周波数ビンを統合しなくても十分なサンプルが得られる場合には、本形態のように複数のバンド処理単位毎にICAの処理を行うことが望ましい。その理由は、第2の実施の形態で述べた通りである。なお、本形態の手法も第1の実施の形態同様、参考文献1の手法に比較した有利な効果を有する。
次に、本発明における第4の実施の形態について説明する。本形態は、第1〜3の実施の形態に対する応用例である。第1〜3の実施の形態との相違点は、混合信号のスパース性を高める処理を行う点である。なお、第4の実施の形態は、第1〜3の実施の形態のいずれを前提にしたものであってもよい。また、以下では、第1〜3の実施の形態との相違点を中心に説明し、第1〜3の実施の形態と共通する事項については説明を省略する。
図19は、第4の実施の形態の信号分離装置500の構成の一部を例示したブロック図である。図19には、第1〜3の実施の形態との相違点を中心に示しており、第1〜3の実施の形態と共通する部分の一部の記載は省略してある。また、図19において第1〜3の実施の形態と共通する部分については、第1〜3の実施の形態と同じ符号を付している。また、第1の実施の形態と同様、第4の実施の形態の信号分離装置500も、公知のコンピュータに信号分離プログラムが読み込まれ、実行されることにより構成されるものである。
次に、本形態の信号分離装置500の処理について説明する。なお、以下に説明する処理の前提として、第1の実施の形態におけるステップS1〜S5、第2の実施の形態におけるステップS101〜S106、又は第3の実施の形態におけるステップS201〜S206が実行され、メモリ100の記憶領域110に離散周波数毎の分離行列W(f)が格納され、記憶領域111に周波数領域の分離信号Yp(f,τ)(p∈{1,...,N})が格納されているものとする。
ここで、Y(f,τ)=W(f)X(f,τ)の両辺に分離行列W(f)の一般化逆行列A(f)を掛け合わせることで、以下のようなX(f,τ)の分解が得られる。
図20は、このように信号分離装置500において実行される処理を説明するためのフローチャートである。
上述を前提に、まず、逆行列生成部520が、メモリ100の記憶領域110から周波数領域の分離行列W(f)を読み込む。そして、逆行列生成部520は、周波数領域の分離行列W(f)の一般化逆行列A(f)を生成し、それをメモリ100の記憶領域511に格納する(ステップS301)。なお、一般化逆行列としては、ムーア・ペンローズ(Moore-Penrose)型擬似逆行列等の誤差最小型の一般化逆行列を用いることが望ましい。また、分離行列W(f)が正方行列の場合、A(f)はW(f)の逆行列となる。
次に、積ベクトル正規化部540が、メモリ100の記憶領域512から、各積ベクトル[Z1p(f,τ),...,ZMp(f,τ)]Tを読み込む。そして、積ベクトル正規化部540は、積ベクトル[Z1p(f,τ),...,ZMp(f,τ)]Tの周波数依存性を排除する正規化を行い、正規化積ベクトル[Z1p'(f,τ),...,ZMp'(f,τ)]Tを算出する(ステップS303)。なお、この正規化は、第1の実施の形態のステップS2と同様に行う。すなわち、混合信号ベクトルX(f,τ)=[X1(f,τ),..., XM(f,τ)]Tの代わりに、積ベクトル[Z1p(f,τ),...,ZMp(f,τ)]Tを対象とし、第1の実施の形態のステップS2で説明した処理を行う。このように生成された正規化積ベクトル[Z1p'(f,τ),...,ZMp'(f,τ)]Tは、メモリ100の記憶領域512に格納される。
次に、独立成分分析部560が、メモリ100の記憶領域514から正規化ベクトル[Z1'(f,τ),...,ZM'(f,τ)]Tを読み込む。そして、独立成分分析部560は、複数の周波数ビンをまとめたバンド処理単位毎に、正規化ベクトル[Z1'(f,τ),...,ZM'(f,τ)]Tをサンプルとした独立成分分析を行い、正規化分離行列W(B)を算出し、算出した正規化分離行列W(B)をメモリ100の記憶領域515に格納する(ステップS305)。
これ以降の処理は、第1の実施の形態におけるステップS5,6の処理、第2の実施の形態におけるステップS104〜107の処理、又は、第3の実施の形態におけるステップS204〜207の処理と同じであるため、説明を省略する。
本形態では、混合信号ベクトルを推定した信号源毎の積ベクトルに分解し、積ベクトルに周波数依存成分を排除する正規化を行っている。この積ベクトルは、信号源毎のベクトルであるため、スパース性の条件を満たしやすい。よって、周波数依存成分を排除する正規化において歪み成分が導入される割合を減らし、結果として信号分離性能を向上させることができる。なお、本形態の手法も第1の実施の形態同様、参考文献1の手法に比較した有利な効果を有する。
本形態は、第1の実施の形態の変形例であり、源信号の到来方向の推定を行う形態である。なお、以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
図21は、第5の実施の形態の信号到来方向推定装置600の構成を例示したブロック図である。なお、第1の実施の形態と同様、第2の実施の形態の信号到来方向推定装置600も、公知のコンピュータに信号分離プログラムが読み込まれ、実行されることにより構成されるものである。また、図21において、第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を付した。
なお、図21における破線の矢印は理論上の情報の流れを示し、実線の矢印は実際のデータの流れを示す。また、この図において制御部180に出入りするデータの流れに対応する矢印は省略してある。
次に、本形態の信号到来方向推定装置600の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号xq(t)(q∈{1,...,M})がメモリ100の記憶領域101に格納されているものとする。
図22は、第5の実施の形態における信号到来方向推定装置600の処理の全体を説明するためのフローチャートである。以下、この図に沿って、本形態における信号到来方向推定装置600の処理を説明していく。なお、以下の各処理は制御部180の制御のもと実行される。また、明記しない限り、処理過程の各データは一時メモリ190に逐一格納・抽出される。
周波数領域変換部120、正規化部130及び独立成分分析部140の処理(ステップS401〜S403)は、第1の実施の形態と同じであるため説明を省略する。
次に、逆行列生成部620が、メモリ100の記憶領域106から正規化分離行列W(B)を読み込み、正規化分離行列W(B)の一般化逆行列A(B)を求める(ステップS404)。なお、一般化逆行列としては、ムーア・ペンローズ(Moore-Penrose)型擬似逆行列等の誤差最小型の一般化逆行列を用いることが望ましい。また、分離行列W(f)が正方行列の場合、A(B)はW(f)の逆行列となる。算出された一般化逆行列A(B)は、メモリ100の記憶領域611に格納される。
次に、方向推定部630が、メモリ100の記憶領域611から一般化逆行列A(B)を読み込む。一般化逆行列A(B)は、離散周波数fに依存せず、信号がどのように混合されているかを示す情報を含んでいる。そのため、これを適切に解析することで、信号源の方向を推定できる。方向推定部630は、一般化逆行列A(B)=[A1(B),..., AN(B)](Ap(B)=[A1p(B),...,AMp(B)]T,p∈{1,...,N})の要素を用い、例えば、以下の式に従い、センサq,q’の位置を基準とした信号源pの方向の推定値θp qq’を算出する(ステップS405)。
図23は、本形態の信号到来方向推定装置600による信号源の方向推定の結果を示すグラフである。なお、図23における横軸は実時間(Time〔sec〕)を示し、縦軸は式(28)によって算出された信号源の方向の推定値(Estimated direction〔deg〕)を示す。実験状況としては、4cm間隔のマイクロホンを2個配置し、マイクロホンからおよそ115cmの距離に2個の音源("First souce"及び"Second source")を置いた。なお、2個のマイクロホンを基準とした2個の音源の方向は、それぞれ60°と130°である。そして、実験開始から約10秒経ったことに60°の位置に配置されていた音源を30°の位置に動かした。マイクロホンでの観測信号を0.2秒毎のブロックに分割し、正規化分離行列W(B)の一般化逆行列A(B)を算出し、式(28)に従って2音源の方向を推定した。なお、信号の入れ替わりを防ぐために、ICAを適用する際には、正規化分離行列W(B)の初期値として、直前のブロックで得られた正規化分離行列を用いることとした。図23を見ると、0.2秒という非常に短い観測データで、音源の方向が良好に推定されていることが分かる。また、音源の移動に対しても、即座に追従している。
本形態の手法を用いた場合、非常に短い観測データに対しても、音源の方向を良好に推定できる。また、移動する音源に対しても即座に追従し、その方向を推定することができる。すなわち、本形態の手法は、動きのある信号源や、非常に短い時間しか発生しない信号源の方向推定に特に適している。
なお、本発明は上述の実施の形態に限定されるものではない。例えば、上述の第1〜3の実施の形態では、離散周波数毎の分離行列と周波数領域の混合信号ベクトルとを用いて周波数領域の分離信号を算出し、算出された周波数領域の分離信号を時間領域に変換することとした。しかし、離散周波数毎の分離行列を時間領域の分離行列に変換し、変換された時間領域の分離信号と時間領域の混合信号とを用い、時間領域の分離信号を算出することとしてもよい。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
600 信号到来方向推定装置
Claims (18)
- 複数の信号源から発せられた源信号の混合からなる混合信号を当該源信号に分離する信号分離装置であって、
複数のセンサで観測された前記混合信号のそれぞれを、離散周波数及び離散時刻の組に対応する時間周波数スロット毎の周波数領域の混合信号に変換する周波数領域変換部と、
前記周波数領域の混合信号のそれぞれを要素とする前記時間周波数スロット毎の混合信号ベクトルに対し、前記要素の振幅の周波数依存性を排除することなく、前記要素の偏角の周波数依存性を排除する正規化を行い、前記時間周波数スロット毎の正規化ベクトルを算出する正規化部と、
複数の前記離散周波数に対応する複数の周波数ビンを統合したバンド処理単位毎に、前記正規化ベクトルの独立成分分析を行い、バンド処理単位毎の正規化分離行列を算出する独立成分分析部と、
前記正規化分離行列の一般化逆行列を求める第1逆行列計算部と、
前記一般化逆行列の各要素に周波数依存性成分を付与し、離散周波数毎の一般化逆行列を生成する周波数依存性成分付与部と、
前記離散周波数毎の一般化逆行列の一般化逆行列を、離散周波数毎の周波数領域の分離行列として求める第2逆行列計算部と、
を有することを特徴とする信号分離装置。 - 請求項1に記載の信号分離装置であって、
前記独立成分分析部は、
全ての前記周波数ビンを統合したバンド処理単位で、前記正規化ベクトルの独立成分分析を行い、前記正規化分離行列を算出する、
ことを特徴とする信号分離装置。 - 請求項1に記載の信号分離装置であって、
前記独立成分分析部は、
一部の前記周波数ビンを統合したバンド処理単位毎に、前記正規化ベクトルの独立成分分析を行い、前記正規化分離行列を算出する、
ことを特徴とする信号分離装置。 - 請求項3に記載の信号分離装置であって、
前記離散周波数毎の一般化逆行列の一般化逆行列を、離散周波数毎の初期分離行列として求める第2逆行列計算部と、
前記離散周波数毎の初期分離行列の行を並び替え、パーミュテーション問題を解決した離散周波数毎の分離行列を生成する周波数間パーミュテーション問題解決部と、
を有することを特徴とする信号分離装置。 - 請求項3に記載の信号分離装置であって、
前記正規化分離行列の一般化逆行列の列ベクトルを用い、パーミュテーション問題を解決するための順列を生成するバンド間パーミュテーション問題解決部を有する、
ことを特徴とする信号分離装置。 - 請求項5に記載の信号分離装置であって、
前記バンド間パーミュテーション問題解決部は、
さらに、前記列ベクトルを正規化した正規化列ベクトルの順序を前記順列に従って並び替えて構成した順列正規化一般化逆行列を生成する、
ことを特徴とする信号分離装置。 - 請求項6に記載の信号分離装置であって、
前記周波数依存性成分付与部に代えて、前記順列正規化一般化逆行列の各要素に周波数依存性成分を付与し、離散周波数毎の一般化逆行列を生成する第2周波数依存性成分付与部を有する、
ことを特徴とする信号分離装置。 - 請求項7に記載の信号分離装置であって、
前記第2周波数依存性成分付与部は、
前記順列一般化逆行列の各列の各要素の偏角を、当該各列が具備する特定の1つの要素を基準として正規化する第1偏角正規化部と、
前記第1偏角正規化部で正規化された前記各要素の偏角に、前記バンド処理単位が含む複数の前記周波数ビンにそれぞれ対応する各離散周波数に比例した値をそれぞれ乗じることにより、当該各要素の偏角に周波数依存性成分を付与する周波数乗算部と、を有する、
ことを特徴とする信号分離装置。 - 請求項1から6の何れかに記載の信号分離装置であって、
前記周波数依存性成分付与部は、
前記一般化逆行列の各列の各要素の偏角を、当該各列が具備する特定の1つの要素を基準として正規化する第1偏角正規化部と、
前記第1偏角正規化部で正規化された前記各要素の偏角に、前記バンド処理単位が含む複数の前記周波数ビンにそれぞれ対応する各離散周波数に比例した値をそれぞれ乗じることにより、当該各要素の偏角に周波数依存性成分を付与する周波数乗算部と、を有する、
ことを特徴とする信号分離装置。 - 請求項1から9の何れかに記載の信号分離装置であって、
前記正規化部は、
前記時間周波数スロット毎に、前記混合信号ベクトルが具備する特定の1つの要素を基準として当該混合信号ベクトルの各要素の偏角を正規化する第2偏角正規化部と、
前記時間周波数スロット毎に、前記第2偏角正規化部で正規化された各要素の偏角を当該時間周波数スロットに対応する離散周波数に比例した値で除算し、各要素の偏角の周波数依存性を排除する周波数正規化部と、を有する、
ことを特徴とする信号分離装置。 - 請求項10に記載の信号分離装置であって、
前記正規化部は、
前記周波数正規化部において正規化された全要素の平均値を0に近づける処理を行う偏角一様化部をさらに有する、
ことを特徴とする信号分離装置。 - 複数の信号源から発せられた源信号の混合からなる混合信号から、当該源信号の到来方向を推定する信号到来方向推定装置であって、
複数のセンサで観測された前記混合信号のそれぞれを、離散周波数及び離散時刻の組に対応する時間周波数スロット毎の周波数領域の混合信号に変換する周波数領域変換部と、
前記周波数領域の混合信号のそれぞれを要素とする前記時間周波数スロット毎の混合信号ベクトルに対し、前記要素の振幅の周波数依存性を排除することなく、前記要素の偏角の周波数依存性を排除する正規化を行い、前記時間周波数スロット毎の正規化ベクトルを算出する正規化部と、
複数の前記離散周波数に対応する複数の周波数ビンを統合したバンド処理単位毎に、前記正規化ベクトルの独立成分分析を行い、バンド処理単位毎の正規化分離行列を算出する独立成分分析部と、
前記正規化分離行列の一般化逆行列を算出する逆行列生成部と、
前記一般化逆行列の要素を用い、前記センサの位置を基準とした前記信号源の方向の推定値を算出する方向推定部と、
を有することを特徴とする信号到来方向推定装置。 - 複数の信号源から発せられた源信号の混合からなる混合信号を当該源信号に分離する信号分離方法であって、
複数のセンサで観測された前記混合信号のそれぞれを、離散周波数及び離散時刻の組に対応する時間周波数スロット毎の周波数領域の混合信号に変換する過程と、
前記周波数領域の混合信号のそれぞれを要素とする前記時間周波数スロット毎の混合信号ベクトルに対し、前記要素の振幅の周波数依存性を排除することなく、前記要素の偏角の周波数依存性を排除する正規化を行い、前記時間周波数スロット毎の正規化ベクトルを算出する過程と、
複数の前記離散周波数に対応する複数の周波数ビンを統合したバンド処理単位毎に、前記正規化ベクトルの独立成分分析を行い、バンド処理単位毎の正規化分離行列を算出する過程と、
前記正規化分離行列の一般化逆行列を求める過程と、
前記一般化逆行列の各要素に周波数依存性成分を付与し、離散周波数毎の一般化逆行列を生成する過程と、
前記離散周波数毎の一般化逆行列の一般化逆行列を、離散周波数毎の周波数領域の分離行列として求める過程と、
を有することを特徴とする信号分離方法。 - 複数の信号源から発せられた源信号の混合からなる混合信号から、当該源信号の到来方向を推定する信号到来方向推定方法であって、
複数のセンサで観測された前記混合信号のそれぞれを、離散周波数及び離散時刻の組に対応する時間周波数スロット毎の周波数領域の混合信号に変換する過程と、
前記周波数領域の混合信号のそれぞれを要素とする前記時間周波数スロット毎の混合信号ベクトルに対し、前記要素の振幅の周波数依存性を排除することなく、前記要素の偏角の周波数依存性を排除する正規化を行い、前記時間周波数スロット毎の正規化ベクトルを算出する過程と、
複数の前記離散周波数に対応する複数の周波数ビンを統合したバンド処理単位毎に、前記正規化ベクトルの独立成分分析を行い、バンド処理単位毎の正規化分離行列を算出する過程と、
前記正規化分離行列の一般化逆行列を算出する過程と、
前記一般化逆行列の要素を用い、前記センサの位置を基準とした前記信号源の方向の推定値を算出する過程と、
を有することを特徴とする信号到来方向推定方法。 - 請求項1から11の何れかに記載の信号分離装置としてコンピュータを機能させるための信号分離プログラム。
- 請求項15に記載の信号分離プログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項12に記載の信号到来方向推定装置としてコンピュータを機能させるための信号到来方向推定プログラム。
- 請求項17に記載の信号到来方向推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006048833A JP4630203B2 (ja) | 2006-02-24 | 2006-02-24 | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006048833A JP4630203B2 (ja) | 2006-02-24 | 2006-02-24 | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007226036A JP2007226036A (ja) | 2007-09-06 |
JP4630203B2 true JP4630203B2 (ja) | 2011-02-09 |
Family
ID=38547908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006048833A Expired - Fee Related JP4630203B2 (ja) | 2006-02-24 | 2006-02-24 | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4630203B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5078717B2 (ja) * | 2008-04-08 | 2012-11-21 | 三菱電機株式会社 | 入射波数推定装置及び入射波数推定方法 |
CN102812642B (zh) * | 2010-03-09 | 2015-11-25 | 日本电信电话株式会社 | 编码方法、解码方法、装置、程序及记录介质 |
KR101356039B1 (ko) * | 2012-05-08 | 2014-01-29 | 한국과학기술원 | 하모닉 주파수 사이의 종속관계를 이용한 암묵 신호 분리 방법 및 이를 위한 디믹싱 시스템 |
JP6389080B2 (ja) * | 2014-03-14 | 2018-09-12 | Kddi株式会社 | ボイスキャンセリング装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271168A (ja) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体 |
JP2004145172A (ja) * | 2002-10-28 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | ブラインド信号分離方法及び装置、ブラインド信号分離プログラム並びにそのプログラムを記録した記録媒体 |
WO2004079388A1 (ja) * | 2003-03-04 | 2004-09-16 | Nippon Telegraph And Telephone Corporation | 位置情報推定装置、その方法、及びプログラム |
-
2006
- 2006-02-24 JP JP2006048833A patent/JP4630203B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271168A (ja) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体 |
JP2004145172A (ja) * | 2002-10-28 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | ブラインド信号分離方法及び装置、ブラインド信号分離プログラム並びにそのプログラムを記録した記録媒体 |
WO2004079388A1 (ja) * | 2003-03-04 | 2004-09-16 | Nippon Telegraph And Telephone Corporation | 位置情報推定装置、その方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2007226036A (ja) | 2007-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4406428B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 | |
JP3949150B2 (ja) | 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体 | |
JP2008145610A (ja) | 音源分離定位方法 | |
JP7224302B2 (ja) | マルチチャネル空間的オーディオ・フォーマット入力信号の処理 | |
JP4977062B2 (ja) | 残響除去装置とその方法と、そのプログラムと記録媒体 | |
JP4630203B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP4769238B2 (ja) | 信号分離装置、信号分離方法、プログラム及び記録媒体 | |
JP5351856B2 (ja) | 音源パラメータ推定装置と音源分離装置とそれらの方法と、プログラムと記憶媒体 | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
CN114667567B (zh) | 模态混响的模式选择 | |
JP6570673B2 (ja) | 音声抽出装置、音声抽出方法および音声抽出プログラム | |
EP3557576B1 (en) | Target sound emphasis device, noise estimation parameter learning device, method for emphasizing target sound, method for learning noise estimation parameter, and program | |
JP4738284B2 (ja) | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 | |
WO2020184210A1 (ja) | 雑音空間共分散行列推定装置、雑音空間共分散行列推定方法、およびプログラム | |
US11790929B2 (en) | WPE-based dereverberation apparatus using virtual acoustic channel expansion based on deep neural network | |
JP4456571B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 | |
JP6734237B2 (ja) | 目的音源推定装置、目的音源推定方法及び目的音源推定プログラム | |
JP4676920B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 | |
JP5457999B2 (ja) | 雑音抑圧装置とその方法とプログラム | |
JP2019090930A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
CN110677782B (zh) | 信号自适应噪声过滤器 | |
JP2018191255A (ja) | 収音装置、その方法、及びプログラム | |
JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
JP6915579B2 (ja) | 信号分析装置、信号分析方法および信号分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101112 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |