WO2005024788A1

WO2005024788A1 - 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体

Info

Publication number: WO2005024788A1
Application number: PCT/JP2004/012629
Authority: WO
Inventors: Shoko Araki; Hiroshi Sawada; Shoji Makino; Ryo Mukai
Original assignee: Nippon Telegraph And Telephone Corporation
Priority date: 2003-09-02
Filing date: 2004-09-01
Publication date: 2005-03-17
Also published as: JPWO2005024788A1; EP2068308B1; DE602004022175D1; EP2068308A3; DE602004027774D1; JP3949150B2; US7496482B2; EP1662485A1; EP1662485A4; US20060058983A1; EP1662485B1; EP2068308A2; WO2005024788A9

Abstract

　信号源の数Ｎとセンサの数ＭがＮ＞Ｍの関係にある場合に、混合信号を高い品質で分離する。　まず、センサにおいて観測された観測信号の値を周波数領域の信号値に変換し、周波数領域の信号値を用い、センサ間における観測値の相対値を、各周波数において算出する。次に各相対値をＮ個のクラスにクラスタリングし、各クラスの代表値を算出する。そして、これらの代表値を用い、周波数領域の信号値から、Ｖ（１≦Ｖ≦Ｍ）個の信号源から発せられた信号の値を抽出するためのマスクを作成し、このマスクを用い、前記周波数領域の信号値から、Ｖ個の信号源から発せられた信号の値を抽出する。その後、Ｖ＝１であれば限定信号をそのまま分離信号として出力し、Ｖ≧２であればこの限定信号にＩＣＡ等を適用し、分離信号を得る。

Description

明細書

信号分離方法、信号分離装置、信号分離プログラム及び記録媒体技術分野

[0001] 本発明は、信号処理の技術分野に関し、特に、必要である源信号（目的信号)のみを直接観測することができず、目的信号に他の信号が重畳されて観測されるという状況において目的信号を推定する信号分離方法、信号分離装置、信号分離プロダラム及びそれを格納した記録媒体に関する。

^景技術

[0002] 従来から、複数の源信号 (音声信号等)が混合された混合信号を用い、源信号や混合過程の知識を用いることなぐ混合前の源信号を分離 ·抽出するブラインド信号分離（BSS: Blind Source Separation)技術が知られている。

図 27Aは、このブラインド信号分離技術を概念的に例示したブロック図である。この図に例示するように、ブラインド信号分離では、複数 (この例では N個）の信号源 701から発せられた源信号 s (i= l , · · · , N)が混合し、複数 (この例では M個）のセンサ 702で観測される状況下において、その観測信号 x (j = l ,…， M)のみから、源信号と推測される分離信号 y (k= l，…， N)を取り出す。ここで、信号源 701から発せられた源信号 sが混合し、センサ 702で観測されるまでの過程を「混合過程」と呼び、センサ 702の観測結果から分離信号を取り出す過程を「分離過程」と呼ぶ。

[0003] はじめに、観測される信号及び分離問題を定式化する。

〔実環境での混合信号 (観測信号)のモデル〕

まず、混合過程についてモデル化する。

Nを信号源 701の個数、 Mをセンサ 702の個数、 sを i番目の信号源 701 (信号源 i) 力発せられた信号 (源信号）、 hを信号源 iから j番目のセンサ 702 (センサまでのインパルス応答とする。この場合、センサ jで観測される信号 Xは、これら源信号 sとィンパルス応答 hの畳み込み混合

[数 1]

でモデル化される。ここで「畳み込み」とは、信号の伝搬過程で、信号が遅延され、所定の係数が乗算された後、加算されることをいう。また、すべての信号はあるサンプリング周波数でサンプリングされ、離散的に表現されるものとする。そして、式（1)における Pはインパルス応答長を、 tはサンプリング時刻を、 pは掃引（時間シフトした信号のサンプル値それぞれに異なる係数を作用させる操作）のための変数を、それぞれ示している。なお、 N個の信号源 701は統計的に互いに独立であり、それぞれの信号は十分スパースであると仮定する。また、「スパース」とは、信号が殆どの時亥 ijtにおいて 0であることを指し、このスパース性は、例えば音声信号で確認される。

[0004] BSSの目的は、源信号 sやインパルス応答 hを知らずに、観測信号 Xのみから、分離システム (W) 703を推定し分離信号 yを得ることである。

k

また、畳み込み混合の問題は扱いが繁雑であること、さらに、スパース性の仮定は時間一周波数領域でよりょく成立することから、上述の式（1)に短時間離散フーリエ変換（DFT: Discrete Fourier Transform)を施して、信号を時間周波数領域に変換した上で問題を扱うことが有効である。時間周波数領域では、上述の式（1)は、

X(f, m)=H(f)S(f, m)

となる。ここで、 fは周波数、 mは DFTに用いるフレームの時刻を表す。また、 H(f)は

、その ij要素に信号源 iからセンサ jまでの周波数応答 H (f)を持つ（MX N)行列であ n

り、以後これを混合行列と呼ぶ。また、 S(f, m) = [S (f, m), ···, S (f, m)]^T、X(f

1 N

, m) = [X (f， m)， ···， X (f, m)]^Tはそれぞれ、源信号と観測信号の DFT結果で

1 M

ある。なお、記号 [ α ]^τは αの転置行列を表す。また、 S (f, m)及び X(f, m)はべタトルである。

[0005] 以降、時間一周波数領域で説明を行う。

<分離過程のモデル >

次に、分離過程についてモデル化する。

まず、 W(f， m)を、その jk要素にセンサ jでの観測信号から分離信号 yまでの周波 k 数応答 W (f, m)を持つ（NX M)行列であるとする。この W(f， m)を分離行列と呼ぶ。分離行列を用いると、分離信号は時間 -周波数領域で、

Y(f, m)=W(f, m)X(f, m) となる。ここで Y(f, m) = [Y (f, m), ···, Y (f, m)]^Tは、時間一周波数領域での分

1 N

離信号であり、これを短時間逆離散フーリエ変換（IDFT: Inverse Discrete Fourier Transform)することで、源信号の推定結果である分離信号 yを得る。なお、分離され

k

た分離信号 yの順序は、源信号 sの順序と必ずしも一致しない。すなわち、 k=iとは

k i

限らない。また、 Y(f, m)はベクトルである。

[0006] <分離行列 W (f , m)の推定 >

BSSでは、観測信号のみから分離行列 W(f, m)を推定する。

分離信号 Y(f, m)の推定のための従来手法には、（a)独立成分分析による方法、 ( b)信号のスパース性を利用した方法、（c)スパース性により混合行列を推定する方法が知られている。以下、それぞれについて説明を行う。

[従来法 1：独立成分分析による方法]

前述の式（1)のように線形混合された信号を、信号の統計的独立性に基づいて分離する技亍は、独立成分分析 (ICA: Independent Component Analysis)と呼ばれる。 N = M = 2の場合について、この ICAによる分離過程のブロック図を、図 27Bに示す。時間-周波数領域の ICAでは、出力信号 Y(f， m)の各要素が互いに独立となるよう、学習則 W(f) =W(f) + AW(f)により逐次的に学習を行レ、、各周波数における分離行列 W(f, m)を求める。ここでは、 ICA分離行列推定部 705が、例えば、

△ W= μ [I—く φ (Y(f, m))Y(f, m)^H>コ… (2)

という学習則により AW(f)を求める。但し [α]^Ηは αの共役転置を示す。なお、 Iは単位行列、 <·>は時間平均、 Φはある非線形関数、 / は更新係数を、それぞれ表す。また、 ICAで求められる分離システムは、時不変線形システムとなる。なお、 ICAのアルゴリズムは、非特許文献 1に記載されているものなど、様々なものが紹介されている。

[0007] ICAでは信号の独立性に着目して分離を行うため、この分離行列 W(f， m)を用い、 Y， (f, m) =W(f, m)X(f, m)によって得られる Y' (f， m) = [Y，（f, m) ,…， Y '

1 N

(f, m)]^Tには、順序の任意性と大きさの任意性とがある。これは、順序や大きさが変わっても分離信号間の独立性が保たれるからである。

順序の任意性を解くことをパーミュテーシヨン（permutation)の解決と呼ぶが、これは、同じ源信号 ^に対応する分離信号成分が、すべての周波数で同じ添字 iを持つ分離信号 Y (f, m)になるようにするものである。その方法としては、分離行列の逆行列（N≠Mの場合は Moore-Penrose型擬似逆行歹 IJ)を用いて得られる信号の推定到来方向を検証し、 i番目の分離信号に対応する推定到来方向が各周波数においてすべて同じとなるように分離行列 W(f， m)の行を入れ換える方法や、周波数間で i番目の分離信号の絶対値 I Y(f, m) Iの相関が最も高くなるように分離行列 W(f, m )の行を入れ換える方法などがある。なお、この例のパーミュテーシヨン/スケーリング解決部 706は、分離信号 Y (f, m)をフィードバックしつつ、このパーミュテーシヨンの i

解決を行う。

[0008] また、大きさの任意性を解くことをスケーリング (scaling)の解決と呼ぶ。パーミュテ一シヨン/スケーリング解決部 706は、例えば、 permutation解決後に得られている分離行列 W(f, m)の逆行歹 1J(N≠Mの場合は Moore-Penrose型擬似逆行歹 IJ)W— ^f, m) を計算し、分離行列 W(f, m)の各行 w (f, m)について

i

w (f, m)^[W^_1(f, m)] w (f, m)

i ji i

とし、このスケーリングの解決を行う。

そして、順序と大きさの任意性を解決した分離行列 W(f, m)を用い、 Y(f， m) =W (f, m)X(f, m)により各周波数での分離信号を得る。

[0009] なお、上述の学習則については、例えば、式（2)における非線形関数として、 φ (Y) = φ ( I Y I ) -exp(j-Z (Y))

Φ (Xノ =sign (x

などを用いることができる。また、上述のように、 permutation解決法としては、例えば、信号到来方向推定法や分離信号の周波数の周波数類似度を利用した方法の何れか、若しくは、両者を組み合わせた方法を用いることができ、それについては特許文献 1や非特許文献 2に詳しい。さらに、 ICAでは、信号源の数 Nとセンサ数 Mが M≥ Nの関係にある必要がある。

[0010] [従来法 2:スパース性による方法]

信号源の数 Nとセンサ数 Mが M≤Nの関係にある場合の分離手法として、信号のスパース性による方法がある（例えば、非特許文献 3)。信号のスパース性と相互独立性を仮定することで、複数の信号が同時に存在してレ、ても、サンプルレベルでは、同時刻に互いに重なり合って観測される確率が低いとレ、うことを仮定できる。すなわち、各時刻における観測信号には、高々 1個の信号し力、含まれないということを仮定できる。従って、それぞれの時刻で観測された信号が、どの信号源から発せられた信号であるかを何らかの方法で推定し、その時刻の信号のみを抽出するような関数 (バイナリマスク）を分離システム W (f， m)として用いることで、信号を分離することが可能である。これ力 Sスパース性による方法である。

[0011] 図 28 (従来法 2)は、このスパース性による方法を説明するためのブロック図である。

各時刻での信号源の推定には、以下の方法を用いるのが一般的である。すなわち、それぞれの信号源が空間的に離れて配置されているとすると、複数のセンサで観測される信号間に、各信号源とセンサの相対位置によって決まる位相差や振幅比が発生する。各時刻における観測信号には高々 1つの信号しか含まれないという仮定から、各時刻における観測信号の位相差や振幅比は、その時刻の観測信号に含まれる 1つの信号の位相や振幅となる。従って、各サンプルにおける観測信号の位相差や振幅比をクラスタリングすることができ、それぞれのクラスに属する時刻の信号を再構成することで各源信号を推定することができる。

[0012] より具体的に述べる。はじめに観測信号相対値計算部 751において、観測信号 X(f , m)間の

[数 2]

Xi(f，m)|

位相差 (f, m) = ^{Xj (l , m)} (i≠ j)及び振幅比 z₂ (f , m) = (i≠j) Xj(f，m) Xj(f,m) の少なくとも一方を計算し、それを相対値 z (f, m)とする。また、或いは位相差そのものではなぐ位相差から求められる信号の到来方向を相対値 z (f, m)としてもよい。

[0013] そして、クラスタリング部 752で相対値 z (f, m)の分布を調べると、 N個のクラスを持つ分布となる。図 29に、この分布を例示する。なお、この例は、 3信号の混合信号 (N = 3)をセンサ 1 (j = 1)及びセンサ 2 (j = 2)で観測した場合の例であり、図 29Aは位相差又は振幅比のみを用いて分布を求めた例、図 29Bは位相差と振幅比とを用いて分布を求めた例である。この図に示すように、スパース性により、これらの分布は、それぞれ N = 3個のクラス 801— 803或いは 811— 813に分類できることが分かる。

[0014] 次に、代表値算出部 753において、これら N個のクラスの代表値（ピーク'平均値 · 中央値など）を求める。以降記載の便宜上、値の小さい方から a ,a ,···，&とする（図 2

1 2 N

9の場合は a，a，a )。

1 2 3

そして、バイナリマスク作成部 754において、

[数 3] M_k(f,m)=

l,...,N),--(3)

0 otherwise というバイナリマスク M (f, m)を作成する。ここで εはバイナリマスクの幅を決めるパ

k

ラメタである。次に、信号抽出部 755において Y (f,m)=M (f，m)X(f,m)の演算を行レ、、 k k k j

番目の分離信号を得る。なお、 jは任意のセンサ番号である。

即ち、この例のスパース性による方法では、分離行列 W(f， m)は時変であり、 W (f, m) =M (f, m) for ]≡{1, M}

jk k

W (f, m) =0 for l≠j(l=l, ···, M)

kl

という非線型システムとなる。

[0015] [従来法 3:スパース性により混合行列を推定する方法]

信号源の数 Nとセンサ数 Mが M = Nの関係にある場合の信号分離手法として、信号のスパース性を用いて混合行列 H(f)を推定し、その逆行列を用いて信号を分離する方法がある (例えば、非特許文献 4や非特許文献 5参照。）。

図 28 (従来法 3)は、このスパース性により混合行歹 IJを推定する方法を説明するためのブロック図である。

混合信号 X(f, m)は、混合行列 H(f)を用いて

[数 4]

≡H(f)S(f,m) · · · (6)

と表される。そのため、 H(f)を推定できれば、

Y(f , m) = S(f, m) = H(f)"¹ X(f , m) · · -(7) により、分離信号 Y(f , m)を推定できる。以下に、この fi(f)の推定から分離信号 Y(f ， m)を得るまでの流れを説明する。なお、以下において、

Λ

α ^Λは、 αを示す。はじめに、 [従来法 2]と同様な手順により、観測信号相対値計算部 751、クラスタリング部 752、代表値算出部 753、バイナリマスク作成部 754及び信号抽出部 755において、 1つの信号しか存在しない時刻の信号

[数 5]

X(f,m) = M_k(f,m)X(f,m) を得る。ここでは、すべてのセンサの観測信号 X(f, m) = [X (f, m), ···, X (f, m)

1 M

]^Tについてバイナリマスク M (f, m)を適用する。このとき例えば、源信号 S(f, m)の

k i

みがアクティブな時刻 mの観測信号は、

[数 6] X_j(f₅m_i) = M_i(f,m_i)X_j(f_im_i) «H_ji(f)S_i(f,m_i) -(8) となる。

このように求められた分離信号 X ' 』 ( f , m i ) は混合過程計算部 7 5 6に送られ、そこで

を計算することにより H (f)が推定される。ここで、 Ε[ · ]は、 mに関する平均である。

i

このように求められた tr (f)は、逆行列計算部 757に送られ、そこでその逆行列 tr ( f)—¹が求められる。そして、信号分離部 758において、上述の式（7)の演算を行うことにより、分離信号 Y(f， m)の推定ができる。

なお、この手法は、 H (f)の逆行列を用いるため、信号源の数 Nとセンサ数 Mが M =Nの関係にある場合にしか適用できない。

特許文献 1 :特開 2004 - 145172号公報

非特許文献 1： A. Hyvaermen and J. Karhunen and E. Oja, Independent Component Analysis, John Wiley & Sons, 2001, ISBN 0-471-40540

非特許文献 2 : H. Sawada, R. Mukai, S. Araki and S. Makino, "A Robust and Precise Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation", in Pro the 4th International Symposium on Independent Component Analysis and Blind Signal Separation (ICA 2003)， 2003, pp. 505—510

非特許文献 3 : S. Rickard, R. Balan, and J. Rosea, ^Real-Time Time-Frequency Based Blind Source Separation, ^rd International Conference on Independent Component Analysis and Blind Source Separation (ICA2001), San Diego,

December, 2001， pp. 651 - 656

非特許文献 4 : F. Abrard, Y. Deville, P. White, From blind source separation to blind source cancellation in the underdetermined case: a new approach based on time-frequency analysis," Proceedings of the 3rd International Conference on Independent Component Analysis and Signal Separation (ICA'2001), pp. 734-739, San Diego, California, Dec. 2001.

非特許文献 5 : Y. Deville, "Temporal and time-frquency correlation-based blind source separation methods, " in Proc. , ICASSP2003, Apr. 2003, pp. 1059-1064 発明の開示

発明が解決しょうとする課題

従来の信号分離方法では、信号源の数 Nとセンサの数 Mが N > Mの関係にある場合に、混合信号を高い品質で分離することは困難であった。

つまり、前述のように、信号源の数 Nとセンサの数 Mが N > Mの関係にある場合、独立成分分析による方法、及びスパース性により混合行列を推定する方法は使用できない。

また、信号のスパース性を利用した方法は使用できるが、この方法では、分離性能力ぐなおかつ歪みが小さい信号分離を行うことが困難である。つまり、上述の式（3 )で示されるバイナリマスクの作成時、 εを十分小さくすると良い分離性能を得ることができるが、その反面、このバイナリマスクによって排除されるサンプルの数が増加し、分離信号が劣化する。すなわち、信号のスパース性が完全なのであれば、各時刻の観測信号には高々 1個の信号しか含まれず、各時刻における各相対値 z (f， m)は、何れかの代表値 a , a の近傍に収まるはずである。しかし、実際には信号のス

1 N

パース性は完全ではないため、ある時刻において、同一周波数の観測信号が 2個以上存在する場合もある。この場合、この時刻における相対値 z (f， m)は、本来対応すべき代表値 a , · · · , a 力離れた値となり、 εの値によってはバイナリマスクによって

1 Ν

排除されてしまう。その結果、このサンプルに対応する観測信号が 0として取り扱われ、分離信号に 0成分が詰め込まれることになる。そして、この排除されるサンプルの割合は εの値が小さいほど大きいため、この 0成分が詰め込まれる量も εの値が小さいほど大きくなる。そして、各分離信号に多くの 0成分が詰めこまれた場合、これが原因となって、分離信号の歪みが大きくなり、 Musical Noiseと呼ばれる聴感上不快なノィズが発生する。一方、バイナリマスクの εを大きくすると、分離信号に詰められる 0成分が少なくなり Musical Noiseは減少する力その反面、分離性能が劣化する。

[0018] 本発明はこのような点に鑑みてなされたものであり、信号源の数 Nとセンサの数 M 力 SN >Mの関係にある場合でも、混合信号を高い品質で分離することが可能な技術を提供することを目的とする。

課題を解決するための手段

[0019] 第 1の本発明では、以下のように上記課題を解決する。

まず、 M個のセンサで観測された N (N≥ 2)個の信号の混合である観測信号の値を周波数領域値に変換し、その周波数領域値を用い、センサ間における観測値の相対値 (相対値の写像も含む）を、各周波数において算出する。そして、これらの相対値を N個のクラスにクラスタリングし、それらの各クラスの代表値を算出する。その後、それらの代表値を用い、周波数領域値力も V (V≤M)個の信号源力発せられた信号の値を抽出するためのマスクを作成し、生成したマスクを用い、当該 V個の信号源力発せられた信号から成る限定信号の値を抽出する。そして、 V≥ 2の場合には、この限定信号は V個の信号源力発せられた信号力成る混合信号となるため、この限定信号をさらに分離して各分離信号の値を得る。一方、 V= lの場合には、この限定信号の値を分離信号の値とする。

[0020] ここで抽出された V個の信号源から発せられた信号からなる限定信号の分離には、例えば独立成分分析による方法ゃスパース性により混合行歹を推定する方法等を適用できる。そのため N >Mの場合でも高い品質で源信号を抽出することができる。ただし、これだけでは V個の源信号しか抽出できない。そこで、例えば、複数種類のマスクを用レ、、抽出する信号の組合せを変化させながら同様な処理を繰り返すことにより、すべての源信号を抽出する。

また、第 2の本発明では、以下のように上記課題を解決する。

[0021] まず観測信号値 X (t) , . . . , X (t)を周波数領域値 X (f， m)， . . .， X (f， m)

1 M 1 M

に変換する。そして、周波数領域値 X (f, m) , · · · , X (f, m)からなる第 1のべタト

1 M

ノレ X (f， m) = [X (f， m)， . . .，X (f， m) ]を、周波数 fごとに N個ずつのクラスタ C

1 M i

(f) (i= l , · · · , N)にクラスタリングし、各クラスタ C_f (f)を代表する第 2のベクトル a f )を算出し、そこから V (V≤M)個の第 3のベクトル a (f) (p = l , . . . , V)を抽出する。その後、第 3のベクトル a (f)の集合を Gとし、 G ^eを Gの補集合とし、 Ό ( α , ）を

p k k k

ベクトル αと βとのマハラノビス平方距離とした場合における、

[数 7]

、 i¹ max _(f)eGk D(X(f,m)，a_p(f))く min D(X(f,m),a_q(f)) M(f,m) = ^ ^p ' ^aq^^^e°k

[θ otherwise で示されるマスク M (f， m)を生成し、マスク M (f, m)と第 1のベクトル X (f， m)との積を演算して、 V個の信号源から発せられた信号力なる限定信号の値を抽出する。

[0022] ここで抽出された V個の信号源力も発せられた信号力なる限定信号の分離には、例えば独立成分分析による方法ゃスパース性により混合行歹 IJを推定する方法等を適用できる。そのため N > Mの場合でも高い品質で源信号を抽出することができる。ただし、これだけでは V個の源信号しか抽出できない。そこで、例えば、複数種類の集合 Gに対する複数種類のマスクを用い、抽出する信号の組合せを変化させながら同 k

様な処理を繰り返す。これにより、すべての源信号を抽出する。

[0023] また、第 3の本発明では、以下のように上記課題を解決する。

まず、観測信号値 X (t)， · · ·， X (t)を、周波数領域値 X (f, m) , . . · , X (f,

1 M 1 M m)に変換し、それらからなる第 1のベクトル X (f, m) = [X (f， m)， . . .， X (f, m) ]

1 M

^Tを、周波数 fごとに N個ずつのクラスタ C ) (i= l， . . .， N)にクラスタリングする。なお、源信号がスパースであれば、たとえセンサの数が不十分（N > M)の状況でも、 N 個のクラスタ C (f)にクラスタリングでき、それら N個の代表ベクトル a (f)を算出することも可能である。

[0024] そして、それらの各クラスタ C (f)を代表する第 2のベクトル a (f)を算出し、 N個の第

2のベクトル a (f)の中の 0個以上の当該第 2のベクトルを 0ベクトルに置換した M行 N 列の行列 A'のムーア'ペンローズ（Moore-Penrose)型擬似逆行歹 1J (A' + (f)： N = M の場合は逆行列 A'—¹ (f)に一致)である N行 M列の分離行列 W (f, m)を算出する。なお、ここで生成される分離行列 W (f, m)は、センサの数が不十分（N > M)である場合には時間 mに依存する行列となり、センサの数が十分 (N≤M)である場合には時間 mに依存しなレ、行列となる。

[0025] その後、 Y (f, m) =W (f, m) X (f, m)の演算により、分離信号ベクトル Y (f, m) = [ Y (f, m) , · · · , Y (f， m) ]^Tを算出し、時間領域の信号値 y (t) ,…， y (t)に変換

I N I N

する。

ここで、源信号のスパース性により、たとえ信号源の数 Nがセンサの数 Mよりも多レ、（ N >M)場合であっても、離散時間 mごとに見れば、観測結果に影響を及ぼす値をとる信号源の数は M個以下である可能性が高レ、。そのため、離散時間 mごとに見れば、上述のように生成された分離行列 W (f， m)によって、これら M個以下の信号を分離することは可能である。そして、 N >Mである場合、分離行列 W (f， m)は時間依存となるのだから、離散時間 mが相違すれば、得られる分離信号の組合せも相違しうる。そのため、複数の離散時間 mについて分離信号を求めていくことにより、すべての分離信号を得ることもできる。

発明の効果

[0026] 以上のように、本発明では、信号源の数 Nとセンサの数 Mが N >Mの関係にある場合でも、混合信号を高い品質で分離することができる。

図面の簡単な説明

[0027] [図 1]第 1の実施の形態における信号分離装置の全体構成を例示したブロック図。

[図 2]図 1における代表値生成部、マスク制御部、限定信号作成部及び限定信号分離部の詳細を例示したブロック図。

[図 3]図 1及び図 2のマスク作成部の詳細を例示したブロック図。

[図 4]第 1の実施の形態における信号分離装置の処理を説明するためのフローチヤート。

[図 5]クラスタリング部により作成されたヒストグラムの例示。

[図 6]第 1の実施の形態における滑らかな形状のマスクを生成する際使用する信号の推定到来方向 Θ のとり方を説明するための図。

[図 7]第 1の実施の形態におけるマスクの例示。

[図 8]第 2の実施の形態の信号分離装置の 1系統を例示したブロック図。

[図 9]第 3の実施の形態の信号分離装置の 1系統を例示したブロック図。

[図 10]第 3の実施の形態におけるマスクの例示。

[図 11]第 4の実施の形態におけるマスク作成部の構成を例示したブロック図。 [図 12]Aは、第 6の実施の形態におけるバイナリマスクの例示、 Bは、第 7の実施の形態におけるバイナリマスクの例示。

[図 13]第 8の実施の形態における代表値生成部、マスク制御部及び限定信号作成部の構成を例示したブロック図。

[図 14]第 8の実施の形態における信号分離処理を説明するためのフローチャート。

[図 15]第 9の実施の形態の信号分離装置の構成を例示したブロック図。

[図 16]第 9の実施の形態の信号分離装置の処理を説明するためのフローチャート。

[図 17]センサの数が不十分な場合 (Mく N)における分離行列生成処理を説明するためのフローチャート。

[図 18] 1音源の場合の正規化していない観測信号ベクトル X (f, m)のプロット。

[図 19]1音源の場合において、式（36)により正規化した観測信号ベクトル X (f， m)のプロット。

[図 20]1音源の場合において、式（37)により正規化した観測信号ベクトル X (f， m)のプロット。

[図 21]2音源の場合の正規化していない観測信号ベクトル X (f, m)のプロット。

[図 22]2音源の場合において、式（36)により正規化した観測信号ベクトル X (f, m)のプロット。

[図 23]2音源の場合において、式（37)により正規化した観測信号ベクトル X (f, m)のプロット。

[図 24]センサの数が信号源の数に対して十分であるか否かに係わらず適用できる分離行列生成処理を説明するためのフローチャート。

[図 25调波数領域で信号統合を行ってから時間領域に変換する際の構成を例示したブロック図の一部。

[図 26]各実施の形態をコンピュータで構成した信号分離装置の例。

[図 27]Aは、従来のブラインド信号分離技術を概念的に例示したブロック図、 Bは、 IC

Aによる分離過程のブロック図。

[図 28]スパース性による方法及びスパース性により混合行列を推定する方法を説明するためのブロック図。 [図 29]相対値の分布の例示。

符号の説明

[0028] 1 , 500 信号分離装置

2, 501 記憶咅 B

3, 502 信号分離プロセッサ

発明を実施するための最良の形態

[0029] 以下、本発明の実施の形態を図面を参照して説明する。

〔第 1の実施の形態〕

本形態は、第 1の本発明に係る実施の形態であり、死角型ビームフォーマの指向特性を用いた滑らかな形状のマスクを用レ、、観測信号値から、 V (2≤V≤M)個の信号源力発せられた信号力も成る混合信号 (本形態ではこれを「限定信号」と呼ぶ）の値を抽出し、抽出した限定信号値を ICAによって信号分離する例である。

図 1は、本形態の信号分離装置 1の全体構成を例示したブロック図である。また、図 2は、図 1における代表値生成部 30、マスク制御部 40、限定信号作成部 50— k (k = 1 , u、但し uは後述する系統数)及び限定信号分離部 60 - kの詳細を例示したブロック図である。また、図 3は、図 1及び図 2のマスク作成部 51_kの詳細を例示したブロック図である。なお、これらの図における矢印はデータの流れを示す力制御部 10 や一時記憶部 90に出入りするデータの流れは省略してある。すなわち、データが制御部 10や一時記憶部 90を経由する場合であっても、その経由の過程は省略してある。また、図 4は、本形態における信号分離装置 1の処理を説明するためのフローチヤートである。以下、これらの図を用いて、この例の信号分離装置 1の構成及び処理を説明していく。

[0030] <全体構成 >

まず、本形態の信号分離装置の全体構成について説明する。

図 1に例示するように、本形態の信号分離装置 1は、記憶部 2とこれに有線或いは無線で電気的に接続された信号分離プロセッサ 3とを有している。

記憶部 2は、例えば、ハードディスク装置、フレキシブルディスク、磁気テープ等の磁気記録装置、 DVD-RAM (Random Access Memory)、 CD-R (Recordable) /R W (Rewritable)等の光ディスク装置、 MO (Magneto-Optical disc)等の光磁気記録装置、 EEP— ROM (Electronically Erasable and ProgrammaDle—Read Only Memory) 、フラッシュメモリ（flash memory)等の半導体メモリ等である。また、記憶部 2は、信号分離プロセッサ 3と同一の筐体内に存在してもよいし、別個の筐体に構成されてもよレ、。

[0031] またこの例の信号分離プロセッサ 3は、例えば、プロセッサや RAM等によって構成されるハードウェアであり、以下に述べる各処理ブロックを有する。

ぐ信号分離処理の概略 >

次に、信号分離装置 1が行う信号分離処理の概略について説明する。

本形態では、 N個の信号源から発せられた信号は統計的に互いに独立であり、それぞれの信号は十分スパースであると仮定する。ここで「スパース」とは、信号が殆どの時刻 tにおいて 0又は 0に近ぐ大きな値をとることは稀であるという性質である。このスパース性は、例えば音声信号で確認される。なお、音声信号など白色でない信号は、短時間離散フーリエ変換等を施して周波数ごとの時間系列とすることで、より 0 に近い時刻が増えてスパース性が強調される。また、一般には信号のモデルィヒにガウス分布が用いられることが多いが、スパース性を持つ信号はガウス分布ではなくラプラス分布などでモデルィ匕される。

[0032] まず M個の観測信号値 X (t)を周波数領域変換部 20にて周波数領域の観測信号

J

値 X (f, m)に変換した後、代表値生成部 30において、各源信号に対応する N個の代表値 a， a， · · ·， a を算出する。

1 2 N

次に、マスク制御部 40にて代表値 a , a , . . . , a のうち V (2≤V≤M)個を適当

1 2 N

に選び、限定信号作成部 50-kにおいて、観測信号値 X (f, m)から V個の源信号の

J

みから構成される限定信号の値 X (f, m)を推定する。なお、 V= lの場合には、後述する [第 3の実施の形態]の方法を用いる。ここでは、マスク作成部 51— kにおいて V個の信号を取りだすような滑らかな形状のマスクを作成し、限定信号抽出部 52— k でこのマスクを観測信号値 X (f, m)に作用させることで、限定信号値 X (f， m)を推

J

定する。

[0033] 次に限定信号分離部 60-kにおいて、 V個の分離信号を得るための分離システムを推定する。ここでは、 M個の限定信号値 X (f, m)を入力とし、 V個の分離信号値 Y ( f, m)を出力する。ここで、分離システムの入力数 Mと出力数 Vについて、 V≤Mであるので、ここでの分離システムの推定には、 [従来法 1]や [従来法 3]を用いることが可能である。

[0034] 最後に時間領域変換部 70— kにおいて、時間周波数領域で得られている分離信号値 Y(f, m)を時間領域の信号値に変換する。

し力以上の処理だけでは V個の分離信号しか得られない。よって、その他の分離信号を得るために、マスク制御部 40で選択する V個の代表値の構成を変え、限定信号作成部 50— kから時間領域変換部 70— kまでの処理を複数系統 (u系統)行う。そして最後に、信号統合部 80にて、各系統からの出力を統合し、 N個全ての分離信号を得る。

[0035] く構成及び処理の詳細 >

次に、この例の構成及び処理の詳細について説明する。

この例は、 N (N≥ 2)個の信号源から発せられた信号が混合し、 M個のセンサにおレ、て観測される状況において、その観測信号から源信号を分離抽出するものである。なお、上述のようにこの例の信号は音声信号等のスパース性を仮定できる信号であり、その音源数 Nは既知或いは推定可能とする。また、この例のセンサは、この信号を観測できるマイクロホン等であり、それらは直線上に配置されるものとする。

[0036] まず、前処理として、各センサにぉレ、て観測された時間領域の各観測信号 X (t) (j

J

= 1 ,…， M)を記憶部 2に格納しておく。そして、信号分離処理が開始されると、信号分離プロセッサ 3は、制御部 10の制御のもと以下の処理を実行する。

まず信号分離プロセッサ 3は、記憶部 2にアクセスし、そこから各観測信号値 X (t)を

J

順次読み込み、周波数領域変換部 20に送る (ステップ Sl)。周波数領域変換部 20 は、短時間離散フーリエ変換等によって、これらの信号値を時間ごとの周波数領域の観測信号値 X (f, m)に順次変換し、一時記憶部 90に格納する (ステップ S2)。一時

J

記憶部 90に格納された周波数領域の観測信号値 X (f， m)は、代表値生成部 30に

J

送られ、代表値生成部 30の相対値算出部 31は、送られた周波数領域の観測信号値 X (f, m)を用い、各センサ間における観測値の相対値 z (f， m)を、各周波数において算出する（ステップ S3)。

[0037] なお、相対値 z (f, m)としては、例えば、

園

の少なくとも一方を用いてもよぐまた、或いは位相差そのものではなぐその写像（例えば、位相差から求められる信号の到来方向）を用いてもよい。

この例では、 j l番目と j2番目の任意の 2つのセンサにおける観測信号間位相差 z (

1 f, m)から得られる信号の到来方向

[数 9]

をこの相対値 z (f, m)として利用し、相対値算出部 31は、この z (f, m)を算出するも

3

のとする。ここで Vは信号の早さ、 dはセンサ j lとセンサ j2との間隔である。

このように算出された相対値 z (f， m)は、一時記憶部 90に格納される。次に、クラ

3

スタリング部 32は、一時記憶部 90から相対値 z (f, m)を順次読み込み、これら相対

3

値 z (f, m)を N個のクラスにクラスタリングする（ステップ S4)。この例の場合、クラスタ

3

リング部 32は、送られた相対値 z (f, m)からヒストグラムを作成する。

3

[0038] 図 5は、このように作成されたヒストグラムの例示である。なお、この例は源信号の数 N = 3のものである。

この図に例示するように、この例のヒストグラムは、 N ( = 3)個のピークを持つ分布になる。この例のクラスタリング部 32は、この分布を N ( = 3)個のクラス（この例ではクラスタ 91一 93)にクラスタリングする。これは、例えば、適当な閾値を設定してクラスタリングしてもょレ、し、 k- means法や階層的クラスタリング等の多くの教科書で説明されている方法を用いてもよい（例えば、「尾上守夫監訳"パターン識別"，新技術コミュ二ケーシヨンズ， ISBN 4-915851-24-9,第 10章」等参照。）。ここでクラスタリングされた各クラスタ C (i= l , 2， ...， N)は、相対値 z (f, m)の集合であり、離散時間

i 3

の集合 Tを用いて C (f) = {z (f， m) | mET }である。

i i 3 i [0039] クラスタリング部 32で生成されたクラスタリングの情報（クラスタ C ,C ,...,C )は、

1 2 N 一時記憶部 90に格納される。代表値計算部 33は、これらを読み込み、 N個の各クラスタ C ,C ,...,C の代表値 a，a ,...,a を算出する（ステップ S5)。具体的には、例えば、

1 2 N 1 2 N

ヒストグラムの各クラスのピークを代表値としてもよぐまた、各クラスの平均値を代表値としてもよレ、。そして、例えばこの N個の代表値を、（便宜上）値の小さい方から a，a ，...，a とする（図 5参照）。なお、これらの代表値 a ,a，...，a は、 N個の各信号の到来

2 N 1 2 N

方向の推定値になっている。

[0040] この例の代表値 a ,a，...，a の情報は、一時記憶部 90に格納された後、マスク制御

1 2 N

部 40に送られる。マスク制御部 40は、これら代表値 a，a ,...,a を要素に持つ集合 G

1 2 N 0 を特定するデータを変数 SGに代入し、この変数 SGを一時記憶部 90に格納する。

0 0

また、マスク制御部 40は、集合 Gを特定する変数 SGを G= φ (空集合）に初期化し、変数 kを 0とし、それらを一時記憶部 90に格納する（ステップ S6)。

次に、マスク制御部 40での制御のもと、 N個すベての分離信号が得られるまで、限定信号作成部 50 - k (k= l， ...， u) ,限定信号分離部 60 - k及び時間領域変換部 70 一 kの複数系統 (u系統）による処理が行われる。

[0041] まず、マスク制御部 40は、一時記憶部 90に格納された変数 kに 1をカ卩えた値を新たな変数 kとし、再び一時記憶部 90に格納する（ステップ S7)。次に、マスク制御部 40 は、一時記憶部 90から変数 SG及び SGを呼び出す。そして、マスク制御部 40は、

0

変数 SGによって特定される集合 Gから、 SGによって特定される集合 Gの補集合（

0 0

G^c の補集合を示す） )の元を含む適当な V (≤ Μ)個の代表値の集合 Gを k 選択し、この集合 Gを特定するデータを変数 SGに代入し、この変数 SGを一時記 k k k 憶部 90に格納する (ステップ S8)。

[0042] 限定信号作成部 50— kのマスク作成部 51— kは、一時記憶部 90に格納された変数 SGを読み出し、この変数 SGによって特定される集合 Gを代表値に持つクラスの信 k k k

号を抽出する「滑らかな形状のマスク」を作成する（ステップ S9)。ここで、「滑らかな形状のマスク」とは、 V (2≤V≤M)個の代表値を含む所定の範囲（限定範囲）内にある相対値に対してハイレベル値をとり、この限定範囲内にない代表値に対してローレべル値をとり、相対値の変化に伴う当該ハイレベル値から当該ローレベル値への推移が連続的である関数を意味する。なお、この例の「ハイレベル値」とは、 0より十分大きな数値 (例えば 1以上）を意味し、「ローレベル値」とは 0に十分近い値 (例えば、ハイレベル値に対して 60dB以下等）を意味する力特にその値に限定はない。

[0043] 本形態では、 N-V+ 1個のセンサにより形成される死角型ビームフォーマの指向特性を利用して「滑ら力、な形状のマスク」を作成する。このマスクは、限定信号に含まれる V個の信号の方向（G )へは十分な感度を持ち、除去されるべき N— V個の信号

k

の方向（G n G ^e)へは感度の低い特性（死角）を持つ、なめらかな形状のマスクであ

0 k

る。

以下に、本形態の「滑らかな形状のマスク」の生成手順について説明する。まず、マスク作成部 51— k力一時記憶部 90から変数 SG、 SG及び SG ^eを読み

k 0 k

出す。次に、マスク作成部 51— kは、変数 SGが示す集合 Gの要素（限定範囲内の

k k

代表値）の何れか一つを抽出し、これを Θ とする。また、マスク作成部 51— kは、変数

SG及び SG ^eによって特定される G fl G ^eの要素（限定範囲内にない代表値）すべ

O k O k

てを抽出し、これらを θ . (ί = 2, .. ·, N-V+ 1)とする。そして、マスク作成部 51-kは、 Θ 及び Θを一時記憶部 90に格納する。次に、マスク作成部 51-kは、一時記憶部 9 0から Θ 及び Θを順次抽出し、 τ = (d /v) cos 0 (j = l , …， N— V+ l)を順次算丄

出する。さらに、マスク作成部 51— kは、遅延行列 H (f)の ji要素 H (f) = exp (j

NBF NBFji

2 π f τ )を算出して一時記憶部 90に順次格納する。なお、 dはセンサ 1とセンサ jとの距離 (dは 0)であり、 fは周波数の変数、 Vは信号の速さである。これらのパラメータは

1

、例えば事前に一時記憶部 90に格納され、順次呼び出されて使用される。以上の処理により、（ _¥+ 1) ^_¥+ 1) )の遅延行列11 (f)が生成される（図 3 : 51a-

NBF

k)。

[0044] なお、本形態では、 2つのセンサにおける観測信号間位相差 z (f, m)から得られる

1

信号の到来方向 z (f， m)を相対値としているため、上述の Θ は限定範囲内の代表

3 1

値に対応する信号の到来方向を示し、 Θ は、限定範囲内にない代表値に対応する信号の到来方向を示している。また、この Θ (i= l， 2, ... , N— V+ l)のとり方は図 6

i

のようになる。まず、直線上に配置された M個のセンサの中央を原点とする（1番目のセンサと原点との距離 L =原点と M番目のセンサとの距離 L )。この原点と i番目の

1 2 信号源とを結ぶ線分と、原点と 1番目のセンサ 10とを結ぶ線分とがなす角度が、潘目の信号源に対応する Θである。

[0045] 生成された遅延行列 H (f)は、一時記憶部 90 (図 1)から NBF作成部 51b— k (図

NBF

3)に送られ、 NBF作成部 51b— kは、この遅延行列 H (f)を用レ、、死角ビームフォ

NBF

一マ（NBF)の特性を持つ NBF行列 W (f)を作成する。これは、遅延行列 H (f)の

NBF

逆行列 W(f) =H ¹ (f)を算出することで得られる。

NBF

この NBF行歹 IjW (f)は、一時記憶部 90 (図 1)に格納される。指向特性計算部 51c 一 kは、この NBF行列 W (f)の 1行目の要素 W (f)、 d及び vを一時記憶部 90から順

lk k

次抽出し、 Θを信号の到来方向の変数とした場合における、指向特性関数

[数 10]

N-V+1

F(f, 6) = ∑W_lk (f)expQ2nfd_k cos0/ v) ー（10)

k=l を生成する。なお、 Θの取り方は上述の Θ と同じである。

i

[0046] 生成された指向特性関数 F (f， Θ )は、マスク構成部 51d— kに送られる。マスク構成部 51d— kは、この指向特性関数 F (f， Θ )と、一時記憶部 90から読み出した相対値 z ( f, m) (この例では z (f, m) )とを用レ、、滑らかな形状のマスク M (f, m)を生成する

3 DC

[0047] 生成するマスク M (f， m)としては、例えば、この指向特性 F (f

DC ， Θ )自身

[マスク 1] M (f

DC ， m) =F (f，z (f

3 ， m) ) 〜（11)

を用いたものを例示できる。

また、指向特性 F (f, Θ )の絶対値

[マスク 2] M (f, m) =

DC I F (f,z (f, m) ) | 〜（12)

3

を用いたものをマスク M (f, m)としてもよい。

DC

図 7Aは、 [マスク 2]の例（信号数 N = 3、センサ数 M = 2の場合）を示している。この例の「滑らかな形状のマスク」は、信号除去数 N_M= 1のものであり、一方向 aへ小

1 さいゲインを持つものである。なお、この「滑らかな形状のマスク」は、 M (=V) = 2個の信号 (ここでは a及び a方向より到来する 2個の信号)を限定信号として抽出するた

2 3

めのものである（後述の図 7B, Cも同様）, [0048] また、例えば以下のように、指向特性 F (f, Θ )を変形したものをマスク M (f, m)と

DC

してもよレ、。なお以下では、 Gの要素の中の互いに隣り合う 2つの aに挟まれる相対

k i

値 z (f， m)の領域すベてを限定信号領域と呼ぶ。また、 Gに aや a が含まれる場合

3 k 1 N

、 0° ≤z (f, m)≤a、 180° ≥z (f, m)≥aも限定信号領域に含むものとする。さ

3 1 3 N

らに、 G n G cの要素の中の互いに隣り合う 2つの aに挟まれる相対値 z (f， m)の領

O k i 3

域すベてを除去信号領域と呼ぶ。また、 G n G ^eに aや a が含まれる場合、 0° ≤z

0 k 1 N 3

(f, m)≤a、 180° ≥z (f， m)≥aも除去信号領域に含むものとする。そして、限

1 3 N

定信号領域、除去信号領域のどちらにも属さない領域を過渡領域と呼ぶ。

[0049] [数 11]

[マスク 3 ]

_/r. pF( ,z₃(f,m)) z₃(f,m) e除去信号領域以外の領域，ヽ M_{DC (}f,m_{) =} |_{F(fA) Z3 (f},_{m) e}除去信号領域，··⁽¹³⁾

[マスク 4 ]

J| F(f,z₃(f,m)) | z₃(f,m) e除去信号領域以外の領域

M_DC(f ,m) = ^ _{¾ ΘΓ ) |} Z_{3 (f}，_{m) £}除去信号領域

(14) これらは、除去信号領域のゲインを一様に小さくする特性を持つマスクをマスク M

DC

(f, m)としたものである。ここで Θ は、除去信号領域の端点のうち、隣り合う限定信号領域の端点と最も近レ、ものを意味する。図 7Bに、この [マスク 4]の例 (信号数 N = 3、センサ数 M = 2の場合）を示す。

[0050] また、例えば、

[数 12]

[マスク 5 ]

a z₃(f,m) e限定信号領域

M_DC(f,m) = < b z₃(f,m) e除去信号領域…（15)

F(f , ζ₃ (f , m)) ζ₃ (f , m) e過渡領域

のように、限定信号領域の指向特性を一様にしたマスク M_{D C} ( f , m) を用いることも可能である。また、

[マスク 6 ]

a z₃(f,m) e限定信号領域

M_DC(f₅m) = < b z₃(f,m) e除去信号領域…（16)

[| F(f,z₃(f,m)) I z₃(f,m) e過渡領域のように、限定信号領域の指向特性を一様にしたマスクの絶対値を用いることもできる。

ここで aとしては例えば、除去信号領域の I F (f, θ ) Iの最大値などの 0より十分大きい値を用い、 bとしては例えば、指向特性のゲインの最小値などの小さな値を用いる。図 7Cに [マスク 6]の例（信号数 N = 3、センサ数 M = 2の場合）を示す（マスク作成部 51_k/ステップ S9の説明終わり）。

[0051] 以上のようにマスク作成部 51-kで生成されたマスク M (f, m)は、一時記憶部 90

DC

に格納された後、限定信号抽出部 52— kに送られる。限定信号抽出部 52— kは、さらに一時記憶部 90から周波数領域の観測信号値 X (f, m)を読み出す。そして、限定信号抽出部 52— k (図 2)は、このマスク M (f， m)と周波数領域の観測信号値 X (f,

DC

m)とを用い、 X " (f, m) =M (f, m) X (f, m)の積演算により、限定信号値 X ' (f , k DC k m)を生成する（ステップ S 10)。

[0052] この限定信号値 X " (f， m)は、一時記憶部 90に格納され、限定信号分離部 60— k k

は、この限定信号値 X (f, m)を読み出し、限定信号の信号分離を行う（ステップ S1 k

1)。ここで、限定信号値 X " (f, m) =M (f, m) X (f, m)は、 V (2≤V≤M)個の信 k DC

号源力発せられた信号によって構成された混合信号の値であると近似される。よつて、その分離行列の推定には [従来法 1]で述べた独立成分分析による方法を利用できる。すなわち独立成分分析の入力として、観測信号値 Xの代わりに限定信号値 X " (f, m)を用い、例えば [従来法 1]で述べた式 (2)を用いて分離を行う。 [0053] 本実施例における ICAによる分離では、まず、 ICA分離行列推定部 61-kにおいて、限定信号値 X (f, m)を用い、前述の式（2)の学習則に従い分離行列 W (f, m)

k

を生成し、この分離行列 W(f, m)を一時記憶部 90に格納する。なお、この分離行列 W(f, m)の生成には、例えば、以下のパーミュテーシヨン'スケーリング解決部 62_k からの出力値 Y (f， m)のフィードバックを用いる。生成された分離行列 W(f, m)は

k

パーミュテーシヨン'スケーリング解決部 62_kに送られる。パーミュテーシヨン'スケーリング解決部 62— kは、この分離行列 W (f， m)と限定信号値 X (f, m)を用い、 Y (f

k k

， m) =W(f， m) X " (f， m)の演算を行い、それぞれの分離信号値 Y (f， m) = [Y

k k kl n^kl (f, m) , ·.., Y ^nkv (f， m) ]^Tを生成し、それを一時記憶部 90に格納する。そして

kV

、パーミュテーシヨン'スケーリング解決部 62— kは、例えば、この分離信号値 Y (f， m

k

)をフィードバックし、 [従来法 1]で述べた方法で Permutation問題を解決する。

Permutation問題の解決後、パーミュテーシヨン'スケーリング解決部 62_kは、さらに、分離信号値 Y (q= l, ...V)がどの源信号に対応するのかを示すタグ Π を、分離

kq kq 信号値 Y (q= l, ...V)に付与し、これらを対応付けて一時記憶部 90に格納する。こ

kq

こでは、このタグ Π を分離信号値 Y の上付添字 nkqとして表記する。

kq kq

[0054] 具体的には、例えば、パーミュテーシヨン'スケーリング解決部 62-k力一時記憶部 90力抽出した分離行列 W (f)の逆行列（N≠Mの場合は Moore-Penrose型擬似逆行列）を用い、

[数 13] f_t argCtW^J/tW^¹]) 、

θ_η = arccos ~ - ~― ~ --- (17)

q 2πίν-¹ά

[0055] (但し νは信号の速さ、 dはセンサ jとセンサ j 'との間隔）

の演算によって得られる信号の推定到来方向 Θ と、一時記憶部 90から抽出した変数 SGが示す集合 Gに含まれる代表値とを比較し、 Θ に最も近い代表値 aを q番目 k k q i の分離信号 Y に対応付ける（ステップ SI 2)。つまり、パーミュテーシヨン'スケーリン

kq

グ解決部 62— kは、この分離信号 Y に対し、代表値 aを示すタグ Π を付与する（対

kq kq

応付ける)。

[0056] また、この後、パーミュテーシヨン.スケーリング解決部 62— kが、一時記憶部 90から分離行列 W(f)を抽出し、その各行 w (f)を

w (f)— [W—丄（ ] w (f)

q jq q

とすることにより、 ICAのスケーリング問題を解決し、スケーリング問題解決後の分離行列 W(f)を一時記憶部 90に格納する。なお、後の信号統合部 80における処理のため、この処理ではすべての系列 kにおいて同じ jを用いることが望ましい。

[0057] タグ Π が付与された各分離信号値 Y は、時間領域変換部 70-kに送られる。時

kq kq

間領域変換部 70 - kは、例えば、短時間逆離散フーリエ変換等により、時間周波数領域で得られている各分離信号値 Y を時間領域の信号値に変換し、その変換値を

kq

一時記憶部 90に格納する。（ステップ S13)。なお、これら時間領域の信号値 y (t)

k

= [y ^nkl (t) , y ^nkv (t) ]^Tにも上述のタグ Π が関連付けられる。この関連付け kl kV kq

を行う場合、まず、時間領域変換部 70 - kが、一時記憶部 90から、周波数領域の信号値 Y に対応付けられているタグ Π を各周波数について抽出する。次に、時間領 kq kq

域変換部 70— kは、各周波数におけるタグ Π がすべて等しいか否かを判断する。こ

kq

こでこれらがすべて等しかった場合には、時間領域の信号値 y のタグとして、周波数

kq

領域の信号値 Y に対応付けられているタグ Π を対応付ける。一方、これらがすべ

kq kq

て等しくなかった場合には、多数決にて時間領域の信号値 y のタグを決定する。

[0058] 次に、マスク制御部 40において、一時記憶部 90から変数 SGと SGとを抽出し、これ

k

らが示す Gと Gとの和集合 G^UGを新たな集合 Gとし、この集合 Gを変数 SGに代入し

k k

、この変数 SGを一時記憶部 90に格納する（ステップ S14)。また、マスク制御部 40は、一時記憶部 90から変数 SGと SGとを読み出し、この新たな集合 Gが集合 Gと等し

0 0 いか否かを判断する（ステップ S15)。ここで、 G二 Gでなければステップ S7の処理に

0

[0059] 一方、 G = Gであれば、信号統合部 80において、一時記憶部 90から各系統 k (時

0

間領域変換部 70— k/k= l， u)から出力された分離信号 y (t)を読み出し、こ

kp

れらの選択/統合を行い、 N個すベての分離信号を得る (ステップ S16)。具体的には、例えば、まず信号統合部 80は、一時記憶部 90から読み出した各分離信号 y (t

kp

)のタグ Π を比較する。ここで、複数の系統 kにおレ、て同じタグを持つ分離信号値 y

kq k

(t)が存在しないと判断された場合、信号統合部 80は、すべての分離信号値 y (t)

P kq を最終的な分離信号値 y^t) (i= l , . ·· , N)として出力する (ステップ S 17)。一方、複数の系統において同じタグを持つ分離信号値が存在すると判断された場合、信号統合部 80は、これらのタグが等しい分離信号値のどれ力 1つを適当に選択し、最終的な分離信号値 y^t)として出力する力 \同じタグを持つ分離信号値の平均を計算し、それを出力信号とする（ステップ S 17)。

[0060] ここで、どれか 1つの分離信号値 y (t)を適当に選択し、最終的な分離信号値 y (t

kq i

)として出力する処理の場合、信号統合部 80は、例えば、同じタグ aを持つ分離信号値 y (t)の中で最大パワーを持つものを最終的な分離信号値 y (t)として出力する。

kq 1

また、同じタグを持つ分離信号値の平均を最終的な分離信号値 y (t)として出力する

i

処理の場合、信号統合部 80は、例えば、

[0061] [数 14]

4∑1¾= )

(Kは同じタグ aを持つ分離信号の個数）

とする。以上により、 N個の信号が少ない歪で分離される。

[0062] ぐ本形態の特徴 >

従来の「従来法 2：信号のスパース性を利用した方法」で分離性能を上げた際に分離信号の歪が大きくなるのは、分離性能を上げるために上述の式 (3)の εを十分小さくすると、このバイナリマスクによって取り出される信号成分が制限され、本来原信号の成分として取り出されるべきサンプルの多くが取り出されなレ、からである。つまり、この場合、各分離信号に多くの 0成分が詰めこまれ、各分離信号を不連続とし、 Musical Noiseを発生させることになる。

[0063] これに対し、この形態では、滑らかな形状を持つマスクによって、 2個以上 M個以下の原信号からなる混合信号（限定信号)を抽出する。そのため、 1個のみの信号の値を抽出する [従来法 2]のバイナリマスクよりも、広い範囲の相対値 z (f, m)に対する信号 (サンプル)を限定信号と抽出できる。

そのため、ある時刻において同一周波数の観測信号が 2個以上存在し、サンプル値力本来対応すべき代表値から離れてしまった場合であっても、このようなサンプル値を抽出できる可能性は高くなる。その結果、分離信号に不連続に 0成分が詰めこまれることによる品質劣ィ匕（Musical Noiseの発生）を抑制できる。

[0064] また、本形態では N (N≥ 2)個の信号が混合し、 M個のセンサで観測される状況において、滑らかな形状を持つマスクを用いて信号の分離抽出を行った。この滑らかな形状を持つマスクは、 [従来法 2]によるマスク（0或いは 1の値をとるバイナリマスク）と異なり、そのエッジ部分が滑らかに広がった形状を有する。そのため、この滑らかな形状のマスクを用いれば、ある時刻において同一周波数の観測信号が 2個以上存在し、サンプノレ値が、本来対応すべき代表値 a ,…， aから離れた場合であっても、こ

1 N

の位置に対するマスクが 0以外の値を持つ場合もあるため、急峻に値が変化するバイナリマスクよりも、多くの信号を抽出することができる。その結果、分離信号に不連続に 0成分が詰めこまれることによる品質劣化を抑制できる。

[0065] また、滑らかな形状のマスクはエッジ部分に近づくほど値が小さくなるため、従来のバイナリマスクにおいて単に εを大きくした場合に比べ、分離性能の劣化も少ない。さらに、抽出される限定信号は、 V (≤M)個の源信号のみからなると考えられるため、分離問題が簡単になっている。従って、限定信号については、 [従来法 1]や [従来法 3]を用いて容易に信号の分離ができる。また、後述の第 3の実施の形態で説明するように、 V= lの場合には、 [従来法 1]や [従来法 3]の方法を用いる必要もない。

[0066] <性能比較 >

以下は、 [従来法 2]で信号分離を行った場合と、本形態の方法で [マスク 2]を用いて信号分離を行った場合との性能を比較した表である。

[表 1]

この例では、源信号として、 3人の話者 (男性 2名 ·女性 1名）による音声信号を用い、残響の無い環境でのこれらの混合信号を、 2つの無指向性マイクで観測する状況をシミュレートしている。なお、表中の SIRは信号対妨害音比（Signal to interference ratio) (dB)であり、分離性能を示す指標である。また、 SDRは信号対歪比（Signal to distortion ratio) (dB)であり、信号の歪の程度を示す指標である。双方とも値が大きい方が性能が良いことを示している。また、 SIR1及び SDR1は話者 1に、 SIR2及び SDR2は話者 2に、 SIR3及び SDR3は話者 3に、それぞれ対応している。また、本形態のデータは縦 ₂段になっている力 _S、これは k= lの系統の分離結果と、 k= 2の系統の分離結果にそれぞれ対応するものである。

[0067] この表に示すように、この形態の方法では、分離性能 SIRをほとんど落すことなぐ従来法 2に比べ格段に高い SDRを得ることができている。これは信号の歪が少ない分離ができていることを示している。これより、本形態の方法は、信号源の数 Nがセンサの数 Mより多い場合に信号を低歪で分離するために有効であることが分かる。〔第 2の実施の形態〕

本形態も第 1の本発明に係る実施の形態である。本形態では、限定信号作成部で「滑らかな形状のマスク」を用い、限定信号分離部で混合行列推定による分離方法を用いる例を示す。なお、本形態において第 1の実施の形態と共通する事項については説明を省略する。

[0068] 図 8は、本形態の信号分離装置のうち、 V個の分離信号値を得る 1系統のみを例示したブロック図である。

なお、図 8において第 1の実施の形態と共通する構成については、第 1の実施の形態と同じ符号を付した。図 8に例示するように、第 1の実施の形態の信号分離装置 1と本形態の信号分離装置と構成上の相違点は、限定信号作成部 50 - kが限定信号作成部 150 - kに置き換わり、限定信号分離部 60 - kが限定信号分離部 160 - kに置き換わる点である。また、マスク作成部 151— kが 2種類のマスクを作成する点、 V=M に限定される点も異なる。以下、本形態の構成及び処理について説明する。

[0069] まず、代表値生成部 30 (図 8)は、周波数領域変換部 20 (図 1)が生成した周波数領域の観測信号値 X (f， m)を一時記憶部 90から抽出する。次に、代表値生成部 30

J

(図 8)は、第 1の実施の形態と同様に、相対値算出部 31において観測値の相対値 z (f, m)を算出し、クラスタリング部 32においてクラスタリングを行レ、、代表値算出部 33 において代表値 a ,a ,...,a を算出する。なお、本形態では、相対値 z (f, m)として、 i

1 2 N

番目と j番目の任意の 2つのセンサにおける観測信号間位相差 z (f， m)から得られる信号の到来方向

[数 15]

" 、 _i Zj(f,m)v

z,it,m) = cos ― ― を用いるのが望ましい。

[0070] これらの代表値 a ,a ,...,a は、一時記憶部 90 (図 1)に格納された後、マスク制御

1 2 N

部 40 (図 8)を介し、限定信号作成部 150— kのマスク作成部 151— kに送られ、マスク作成部 151-kは、 2種類のマスクを作成する。 1つは、 Gに含まれる V ( = M)個の代 k

表値に対応する V ( = M)個の信号が混合した限定信号の値 X (f， m)を抽出するためのマスクであり、第 1の実施の形態に示した滑らかな形状のマスク M (f, m)であ

DC

る。もう 1つは、 1個の信号のみを含む信号を抽出するバイナリマスク M (f, m)であり k

、 [従来法 2]で示したものと同様のマスク

[数 16]

「1 a_k _ε≤ζ(Τ，ι )≤& + ε ,— 、_τ、，、

M_k(f,m) = <^ ^k 、，ノ k (k ₌ l,.."N)〜（18)

[0 otherwise である。これらのマスクは一時記憶部 90 (図 1)に格納される。

[0071] 次に、限定信号抽出部 152— k (図 8)は、一時記憶部 90 (図 1)から滑らかな形状のマスク M (f, m)と周波数領域の観測信号値 X (f, m)とを読み出す。そして、限定

DC

信号抽出部 152— k (図 8)は、このマスク M (f， m)を周波数領域の観測信号値 X (f

DC

, m)に掛けた限定信号値 X" (f, m) =M (f, m) X (f, m)を算出し、これを一時記

DC

憶部 90 (図 1)に格納する。ここで、この限定信号値 X (f， m)は、 V個の信号が混合したものと近似されるので、限定信号分離部 160-kにおける信号の分離には [従来法 3]で述べた混合行列推定法が応用できる。

[0072] そこでまず、限定信号分離部 160— kの積演算部 161— k (図 8)において、一時記憶部 90 (図 1)からバイナリマスク M (f, m)と周波数領域の観測信号値 X (f, m)とを k

読み出す。そして、積演算部 161— k (図 8)は、 X " (f, m) =M (f, m) X (f, m)の演 k k

算を行い、 1個の信号のみを含む分離信号の値 X (f, m)を求め、これを一時記憶 k

部 90 (図 1)に格納する。次に、混合過程推定部 162-k (図 8)力一時記憶部 90 (図 1)から X ' (f, m)を読み出し、 [従来法 3]と同様

[数 17]

によって推定された混合行列 trを算出する。なお、この混合行列 trのサイズは Ν χ Mとなっている。なお、この混合行列は全ての系列 kで求める必要はなぐある系列で推定した H'を一時記憶部 90に格納し、逐次読み出して用いてもよい。

[0073] この混合行列 ΗΊま逆行列計算部 163— kに送られ、逆行列計算部 163— kは、まずこの混合行列 H'ランクを落す。すなわち、混合行列 H'のうち、 V個の信号からなる限定信号 X (f， m)に対応する V列（すなわち、 Gに含まれる V個の代表値 aに対応

k i する列）のみを取り出し、 V X Vの正方行列 IT を作成する。これは、 V個の信号の混

Μ

合と近似される限定信号 X~ (f， m)の分離を行うためである。

[0074] 次に逆行列計算部 163— kは、作成した正方行列 H' の逆行列 H' ¹ (f)を計算し

M M

、これを一時記憶部 90 (図 1)に格納する。積演算部 164-k (図 8)は、限定信号値 X " (f, m)と逆行列 tT f)とを一時記憶部 90 (図 1)から読み出し、 Y (f， m) =H'

M M

^_1 (f) X" (f, m)の演算により、 V個の分離信号値の推定値 Y (f, m) = [Y ^nkl (f， m n

) ,…， Y (f, m) ]^Tを算出する。なお、分離信号 Y (q= l , ...V)がどの源信号に対応するのかを示すタグ情報の付与は、前述の式（17)において、 W—¹の代わりに H" を用いて信号の推定到来方向を求め、その方向がどの代表値 aに近いかを判

M i

断して行う。

[0075] 〔第 3の実施の形態〕

本形態も第 1の本発明に係る実施の形態である。本形態では、「滑らかな形状のマスク」を用い、観測信号から、何れか 1個の信号源から発せられた信号によって構成される信号 (本形態ではこれを「限定信号」と呼ぶ）のみを抽出し、抽出した限定信号を分離信号とする。なお、本形態において第 1の実施の形態と共通する事項については説明を省略する。

図 9は、本形態の信号分離装置のうち、 1個の分離信号を得る 1系統部分のみを例示したブロック図である。なお、図 9において第 1の実施の形態と共通する構成については、第 1の実施の形態と同じ符号を付した。

[0076] 図 9に例示するように、第 1の実施の形態の信号分離装置 1と、本形態の信号分離装置と構成上の相違点は、限定信号作成部 50 - kが限定信号作成部 250 - kに置き換わる点、及び本形態の信号分離装置には限定信号分離部 60— kが存在しない点である。以下、本形態の構成及び処理について説明する。

まず、代表値生成部 30 (図 9)は、周波数領域変換部 20が生成した周波数領域の観測信号値 X (f, m)を一時記憶部 90 (図 1)力も抽出する。代表値生成部 30 (図 9)

J

は、第 1の実施の形態と同様、相対値算出部 31において観測値の相対値 z (f， m)を算出し、クラスタリング部 32においてクラスタリングを行レ、、代表値算出部 33において代表値 a ,a ,...,a を算出する。なお、相対値 z (f， m)としては、位相差及び振幅比の

1 2 N

少なくとも一方、或いはその写像 (例えば、位相差から求められる信号の到来方向）等を用いることができるが、本形態では、観測信号間位相差力求められる信号の到来方向

[数 18] ζ,Γι,ιη) = cos ― しを相対値とする。

[0077] これらの代表値 a ,a，...，a は、一時記憶部 90 (図 1)に格納され、限定信号作成部

1 2 N

250-kのマスク作成部 251-k (図 9)は、これらの代表値 a，a，...，a を読み出し、何

1 2 N

れかの一つの代表値 aを抽出するための [滑らかな形状のマスク]を生成する。なお、本形態の「滑らかな形状のマスク」は、 V (V= 1)個の代表値を含む限定範囲内にある相対値に対してハイレベル値をとり、この限定範囲内にない代表値に対してローレベノレ値をとり、相対値の変化に伴う当該ハイレベル値から当該ローレベル値への推移が連続的である関数である。

[0078] 以下に、本形態の「滑らかな形状のマスク」の生成手順について説明する。まず、マスク作成部 251— kは、（N X N)の遅延行列 H (f)を生成する。すなわち

NBF

、マスク作成部 251— kは、一時記憶部 90 (図 1)に格納された代表値 a，a ,... ,a うち

1 2 N の一つ（抽出する信号の到来方向の推定値）を抽出し、これを Θ とする。また、マスク作成部 251— kは、それ以外の N— 1個の代表値 (抽出しない信号の到来方向の推定値）を一時記憶部 90 (図 1)力抽出し、それらを θ ^ = 2，…， Ν)とする。これらの Θ 及び Θ は一時記憶部 90 (図 1)に格納される。マスク作成部 251— kは、一時記憶部 90から Θ 及び Θを順次抽出し、 τ = (d /v) cos 0 (j = l , N)を算出し、遅延行列 H (f)の ji要素 H (f) = exp (j2 f τ )を算出して一時記憶部 90に順次

NBF NBFji ji

格納する。なお、 dはセンサ 1とセンサ jとの距離（dは 0)であり、 fは周波数の変数、 V

J 1

は信号の速さである。これらのパラメータは、例えば事前に一時記憶部 90に格納され、順次呼び出されて使用される。以上の処理により、（N X N)の遅延行列H (f)

NBF

が生成される。

[0079] 次に、マスク作成部 251— kは、この遅延行列 H (f)を用い、死角ビームフォーマ

NBF

(NBF)の特性を持つ NBF行列 W (f)を作成する。これは、遅延行列 H (f)の逆行

NBF

列 W (f) =H — ¹ (f)を算出することで得られる。この逆行列 W (f) =H — ¹ (f)は

NBF NBF 一時記憶部 90に格納される。そして、マスク作成部 251— kは、一時記憶部 90からこの NBF行列 W (f)の 1行目の要素 W (f)、 d及び vを一時記憶部 90から順次抽出し、

lk k

前述の式（10)に示した指向特性関数 F (f, Θ )を生成する。その後、マスク作成部 25 l_kは、この指向特性関数 F (f， Θ )を用レ、、滑らかな形状のマスク M (f, m)を生成

DC

する。

[0080] 具体的には、例えば、第 1の実施の形態における式（11)で示されるマスク（[マスク 7]とする）や、式（12)で示されるマスク（[マスク 8]とする）を、本形態の滑らかな形状のマスク M (f， m)として生成する。

DC

また、例えば、以下のように除去信号領域のゲインを一様に小さくする特性を持つ [ 滑らかな形状のマスク]を生成することとしてもよい。

[数 19] [マスク 9 ]

_A/r ,, 、 jF(f,z₃(f₅m)) z₃(f,m)_e除去信号以外の領域

M_DC(f，m) = _F(f ) _Z3(f,_m)e除去信号領域 "'(¹⁹)

[マスク 1 0 ]

、 J|F(f,z₃(f,m))| z₃(f,m)_e除去信号以外の領域

MDC(^f，m) =†_{| F(fA)| Z3}(f,_{m) e}除去信号の領域 … ⁰)

[0081] Θ は、除去する N - 1個の信号の到来方向の推定値 (抽出する代表値 a以外の N- 1個の代表値)のうち、除去しない信号の到来方向の推定値 (抽出する代表値 a)に一番近いものである。

また、例えば、

[数 20]

[マスク 1 1]

z₃(f，m) e除去信号以外の領域

M_DC(f,m) = | F(f，6_r)| z₃(f，m)e除去信号領域 …( ）

Fff.z₃(f,m)) z₃(f，m)e過渡領域のように、取り出す方向についての指向特性を均一にしたマスク M (f, m)を用いる

DC

ことも可能である。また、過渡領域では M (f， m)= I F(f, z (f, m)) |を用レ、ること

DC 3

もできる（[マスク 12])。

[0082] 図 10に、上述の [マスク 8] [マスク 12]の例を示す。これらは、信号数 N = 3、センサ数 M = 2の場合に、 aの方向から到来する信号を抽出し、 a及び aの方向から到来

1 2 3

する信号を抑圧する「滑らかな形状のマスク」の例である。

マスク生成部 251— kで生成された滑らかな形状のマスク M (f, m)は、限定信号

DC

抽出部 252— kに送られ、限定信号抽出部 252— kは、 Y (f, m) =M (f, m)X (f,

k DC j m)により分離信号 Y (f, m)を抽出する。以上の処理はすべての分離信号が抽出

k

されるまで複数の系統で実施され、最終的にすべての分離信号 Y(f， m)が得られる。そして、信号分離装置は、得られた分離信号 Y(f， m)を、時間領域変換部において時間領域の信号に戻し、信号統合部をそのまま通過して出力する。

[0083] <性能比較 >

以下は、 [従来法 2]で信号分離を行った場合と、本形態の方法で [マスク 8] [マスク 11]を用いて信号分離を行った場合との性能を比較した表である _c

[表 2]

この例では、源信号として、 3人の話者 (男性 2名 ·女性 1名）による音声信号を用い、残響の無い環境でのこれらの混合信号を、 2つの無指向性マイクで観測する状況をシミュレートしている。

[表 3]

この例は、表 2の状況において信号の混合の仕方（具体的には話者の位置配置）を変えた場合のシミュレート結果である。

[表 4]

この例は、表 2の状況において話者の組合せ（男性 3名）を変えた場合の例である。

[0084] これらの表に示すように、この形態の方法では、分離性能 SIRをほとんど落すことなぐ従来法 2に比べ格段に高い SDRを得ることができている。これは信号の歪が少ない分離ができていることを示している。これより、本形態の方法は、信号源の数 Nがセンサの数 Mより多い場合に信号を低歪で分離するために有効であることが分かる。

[0085] 〔第 4の実施の形態〕

本形態も第 1の本発明に係る実施の形態である。本形態では、ノくイナリマスクに滑らかな形状の関数を畳み込んで、滑らかな形状のマスクを生成する。以下ではマスク作成部（図 1におけるマスク生成部 51— kに相当）における処理のみを説明する。なお、その他の構成や処理については、第 1から第 3の実施の形態と同様である。また、本形態では、第 1の実施の形態で説明した位相差 z (f, m)、振幅比 z (f, m)、位

1 2

相差 z (f， m)から得られる信号の到来方向 z (f， m)等を、相対値 z (f, m)として使

1 3

用すること力 sできる。

[0086] 図 11は、本形態におけるマスク作成部 300-kの構成を例示したブロック図である。

マスク作成部 300— kの処理が開始されると、まず、バイナリマスク作成部 301— kは、 V個の代表値を含む所定の範囲内にある相対値に対してハイレベル値をとり、この範囲内にない相対値に対してローレベル値をとり、相対値の変化に伴う当該ハイレベル値から当該ローレベル値への推移が不連続な関数であるバイナリマスクを生成する。例えば、マスク作成部 300-kは、 V個の信号が混合した信号を抽出するためのバイナリマスク

[数 21]

F' , ヽ 11 ^min— 一 ^dmax

1 0 otherwise を生成する。

[0087] なお、 a 力 a の V個の代表値を含む信号を抽出する場合、 a 、a は、例え

k+ 1 k+V mm max

ば aく a く a ， a く a く a の範囲で設定する。これらは適当に設定して k min k+ 1 k + V max k + V+ 1

も良いが、より具体的には、例えば、以下の処理によって a 、a を算出する。

min max

[0088] まず、マスク作成部 300— kは、一時記憶部 90 (図 1)に格納されている相対値 z (f, m)、クラスタ C及び代表値 a (i= l , . ··, N) (第 1の実施の形態ステップ S3— 5参照）を読み込み、各クラスタ Cの分散値を

[数 22] a² (f)i = (1/ |)∑„^ ( ,111) - ( )² (22) の演算によって算出する。なお、 | C Iとは、クラスタ Cに属する相対値 z (f, m)の数である。また、この分散値の算出を、例えば、 EMアルゴリズム（例えば、「尾上守夫監訳"パターン識別"，新技術コミュニケーションズ， ISBN 4-915851-24-9,第 1 0章」等参照。）などを用い、データにガウシアンモデルのあてはめを行って求めてもよい。

算出された分散値 σ は一時記憶部 90(図 1)に格納され、次に、マスク作成部 30 1-k (図 11)は、一時記憶部 90に格納されている分散値 σ ²及び代表値 a (この例ではクラスタ Cの平均値）を読み込み、これらを用いて、

[数 23] ak+l "^ak ^+<7k "^ak+l

amm一 ,

^CTk+l^+ak 2 1 < 11 .. … )

一 °k+V · ^ak+V+l + ^g一k σ z+V+l ' ^ak+V

3 max 2

ak+V + ^ak+V+l を算出する (a 、_a の具体的な算出例の説明終わり）。

mm max

[0089] 以上のように生成されたバイナリマスク F (z)は一時記憶部 90 (図 1)に格納される。

b

次に、単峰性関数生成部 302— k (図 11)が、 zの変化に伴って値が連続的に変化する単峰性関数 g(z)を生成し、一時記憶部 90 (図 1)に格納する。なお、単峰性関数 g(z)としては、例えば、ガウシアン

[数 24] g(z) = 等の滑らかな形状の関数を例示できる。なお、 σは g(z)の標準偏差を意味する。例えば、 a — a を取り出す場合、 σとしては、 a — σ >a + σ 、 a + σく a

k+l k + v min k k max k + v+1

-σ となるように適当に設定するのが望ましぐ例えば、 σ =πιίη(_σ ,σ ) k+v+1 k k+v+1 とできる。なお、 σ 及び σ は式（22)のものである。また、 min (ひ，）はひ及び

k k+v+1

βのうち小さい方を取り出す操作を意味する。

[0090] 次に、畳み込み混合部 303— k (図 11)が、一時記憶部 90 (図 1)から、バイナリマスク F (z)及び単峰性関数 g(z)を読み込み、このバイナリマスク F (z)に単峰性関数 g( b b

z)を畳み込んだ関数 F (z) =F (z) * g (z)を計算し、これを一時記憶部 90 (図 1)に

b

格納する。ここで *は zに関する畳み込み演算子である。

そして、次に、マスク構成部 304-k (図 11)が、一時記憶部 90 (図 1)から、相対値 z (f, m)及び関数 F(z)を読み込み、関数 F(z)に相対値 z(f， m)を代入したマスク M (f, m)=F(z(f, m)) ·'·(24)

DC

を生成し、一時記憶部 90 (図 1)に格納する。

[0091] なお、その他、バイナリマスク F (z)の両端に、ある傾きを直線（曲線）を付加した形

b

状のマスクを滑らかな形状の関数を F(z)とし、式（24)のマスクを求めてもよい。

[0092] また、代表値 a (この例ではクラスタ Cの平均値）と、式（22) (23)のように求めた分散値 σ²及び a 、 a とをマスク構成部 304— k (図 11)が読み込み、平均 a (f)、分散

[数 25]

を算出し、さらに _{g i} ( z ) を g ( z ) / g i (_{a i}) にて、 _{a i}における値を 1に正規化し、

「gk(^z) ^amin >^z

F(z) ^amin― Z—"max

[gk+V ^amaxく ^z を算出し、式（24)のマスクを求めてもよい。

[0093] 〔第 5の実施の形態〕

本形態も第 1の本発明に係る実施の形態である。本形態は、奇関数の差から滑ら力、な形状のマスクを生成する。以下ではマスク作成部（図 1におけるマスク生成部 51 一 kに相当）における処理のみを説明する。なお、その他の構成や処理については、第 1から第 3の実施の形態と同様である。

本形態のマスク作成部は、相対値が限定範囲の下限値 a である場合に 0をとる第

mm

1の奇関数と、相対値が限定範囲の上限値 a である場合に 0をとる第 2の奇関数と

max

の差の写像から得られる単峰性の関数を、滑らかな形状のマスクとして生成する。例えば、

M (f, m) = {tanh(z(f, m)-a )_tanh(z(f, m)— a )}^αを「滑らかな形状の

DC min max

マスク」とする。なお、相対値 z(f, m)には、第 1の実施の形態等で示した位相差 _Zi(f , m)及び振幅比 z (f, m)の少なくとも一方、或いはその写像（例えば、位相差から

2 求められる信号の到来方向 z (f, m) )等を用いる。また、 αは任意の正の数であり、 a

3

、 a は第 4の実施の形態と同様に求められたものである。また、必要に応じて、 mm max

M (f, m) = M (f, m) /max (M (f, m) )

DC DC DC

などの正規化を施してもょレ、。

[0094] 〔第 6の実施の形態〕

本形態も第 1の本発明に係る実施の形態である。本形態のマスクは、図 1及び図 2 のマスク作成部 51— kにおいて作成され、 V個の代表値を含む所定の範囲内にある相対値に対してハイレベル値をとり、この所定の範囲内にない代表値に対してローレベル値をとり、ハイレベル値からローレベル値への推移が不連続な関数（バイナリマスク）である。ただし、 2≤V≤Mである。すなわち、例えば、

[数 26]

「1 a_m½≤z(f，m)≤a_m!r)r ,

BCf.m) = ^ ^{mul ma} 〜（25)

[0 otherwise をバイナリマスクとして作成する。なお、 a から a の V個の代表値を含む信号を抽

k+ 1 k+V

出する場合、 a 、 a は、例えば aく a く a ， a く a く a の範囲で設

min max k min k+ 1 k + V max k + V+ 1

定する。より具体的には、例えば第 4の実施の形態で述べた方法と同様な手順により、 a 、 a を生成する。また、本形態でも、位相差 z (f, m)、振幅比 z (f， m)、位相 mm max 1 2

差 z (f， m)から得られる信号の到来方向 z (f， m)等を、相対値 z (f, m)として使用

1 3

すること力 sできる。

[0095] また、 a 力 a の範囲に含まれる相対値 z (f, m)の数は、センサの数 2以上 M以

min max

下であり、好ましくは、センサの数 Mである。さらに、第 1の実施の形態と同様、本形態では複数通りのバイナリマスク B (f,m)を作成する。

[0096] 具体的には、例えば、マスク制御部 40 (図 1 ,図 2)がー時記憶部 90から代表値 a， a , ... ,a を読み出し、これら代表値 a ,a ,... ,a を要素に持つ集合 Gを特定するデー

2 N 1 2 N 0

タを変数 SGに代入し、この変数 SGを一時記憶部 90に格納する。また、マスク制御

0 0

部 40は、集合 Gを特定する変数 SGを G = φ (空集合）に初期化し、変数 kを 0とし、それらを一時記憶部 90に格納する（図 4 :ステップ S6)。次に、マスク制御部 40での制御のもと、 N個すベての分離信号が得られるまで、限定信号作成部 50— k (k= l , ...， u)，限定信号分離部 60 - k及び時間領域変換部 70 - kの複数系統 (u系統）による処理が行われる。まず、マスク制御部 40は、一時記憶部 90に格納された変数 kに 1をカ卩えた値を新たな変数 kとし、再び一時記憶部 90に格納する（図 4 :ステップ S7) 。次に、マスク制御部 40は、一時記憶部 90から変数 SG及び SGを呼び出す。そし

0

て、マスク制御部 40は、変数 SGによって特定される集合 Gから、 SGによって特定

0 0

される集合 Gの補集合 (G^e (ひ ^eはひの補集合を示す)）の元を含む適当な V (≤ M)個の代表値の集合 Gを選択し、この集合 Gを特定するデータを変数 SGに代入し、こ k k k

の変数 SGを一時記憶部 90に格納する（図 4 :ステップ S8)。限定信号作成部 50-k k

のマスク作成部 51— kは、一時記憶部 90に格納された変数 SGを読み出し、この変 k

数 SGによって特定される集合 Gを代表値に持つクラスの信号を抽出するバイナリ k k

マスクを作成する（図 4：ステップ S9)。

[0097] 図 12Aは、本形態におけるバイナリマスクの例示である。この例は、 2個の代表値 a , aを含む所定の範囲内にある相対値 z (f, m)に対してハイレベル値（例えば 1)を

2 3

とり、この所定の範囲内にない代表値 aに対してローレベル値（例えば 0)をとるバイ

3

ナリマスクの例である。この図の縦軸はバイナリマスクのゲインを示し、横軸は相対値 z (f, m) (信号の到来方向（deg.) )。この図に示すように、この例のバイナリマスクの

3

ハイレベル値はフラットであり、このハイレベル値とローレベル値とは不連続である。

[0098] なお、その他の構成や処理については、第 1及び第 2の実施の形態と同様である。

すなわち、本形態では、第 1及び第 2の実施の形態で使用した滑ら力な形状のマスク M (f, m)の換わりにバイナリマスク B (f, m)を用い、周波数領域の信号値から、 V

DC

個の信号源から発せられた信号からなる混合信号 (本形態ではこれを「限定信号」と呼ぶ）の値を抽出し、第 1或いは第 2の実施の形態の処理を実行する。

また、バイナリマスク B (f, m)を用い、周波数領域の信号値から、 V個の信号源から発せられた信号からなる混合信号の値を抽出する処理は、周波数領域の観測信号値 X (f,m)にバイナリマスク B (f,m)を乗じることにより行う（X f ,m)=B (f，m) X (f ,m) ) j

[0099] ぐ本形態の特徴 >

従来の「従来法 2：信号のスパース性を利用した方法」で分離性能を上げた際に分離信号の歪が大きくなるのは、分離性能を上げるために上述の式（3)の εを十分小さくすると、このバイナリマスクによって取り出される信号成分が制限され、本来原信号の成分として取り出されるべきサンプルの多くが取り出されなレ、からである。つまり、この場合、各分離信号に多くの 0成分が詰めこまれ、各分離信号を不連続とし、 Musical Noiseを発生させることになる。

[0100] これに対し、この形態では、バイナリマスク B (f， m)によって、 2個以上 M個以下の原信号からなる混合信号（限定信号)を抽出する。そのため、 1個のみの信号の値を抽出する [従来法 2]のバイナリマスクよりも、広い範囲の相対値 z (f, m)に対する信号 (サンプル)を限定信号として抽出できる。例えば、図 12Aの例の場合、相対値 z (f

, m)が代表値 aや aの近傍となるサンプル値のみではなぐ相対値 z (f， m)が aと a

1 2 1 2 との間に位置するようなサンプノレ値も抽出できる。また、例えば、 aと aとの間に位置

1 2

するようなサンプルは、代表値 a或いは aに対応するサンプルである可能性が高い。

1 2

[0101] そのため、ある時刻において同一周波数の観測信号が 2個以上存在し、サンプル値力本来対応すべき代表値から離れてしまった場合であっても、このようなサンプル値を抽出できる可能性は高くなる。その結果、分離信号に不連続に 0成分が詰めこまれることによる品質劣ィ匕（Musical Noiseの発生）を抑制できる。

[0102] <バイナリマスクによる 0詰めの影響の検証 >

以下に、 3人の話者による音声信号 s、 s、 s力 2つの無指向性マイクで観測され

1 2 3

た場合 (N = 3, M = 2の場合）について、バイナリマスクによる 0詰めの影響を議論する。

バイナリマスクによって 0が詰められ失われた信号のパワーの比率を、

[数 27]

と定義すると、従来の「信号のスパース性を利用した方法 (従来法 2)」では、 s : 17%

1

、s : 14%, s : 23%もの信号のパワーがバイナリマスクにより失われた。

2 3

[0103] 一方、本形態のバイナリマスク B (f , m)による信号のパワー劣化は、限定信号を sと

1 sの 2つの信号の混合とした場合には s : 2. 5%、 s : 5. 7%であり、 sと sの 2つの信

2 1 2 2 3 号の混合とした場合には s : 8. 1%、 s : 0. 7%であった。

すなわち、この形態では、バイナリマスク B (f, m)による信号の劣化が従来法に比ベて少ないことが分かる。これは、この形態では、 Musical Noiseが発生しにくいことを示している。

[0104] <性能比較 >

以下に、本形態のシミュレーション結果を示す。

[表 5]

この例は、本形態のバイナリマスクで限定信号を抽出し、その限定信号に ICAを提供して信号分離を行った例である。またこの例では、原信号として、 3人の話者 (男性 2名 ·女性 1名）による音声信号を用い、残響の無い環境でのこれらの混合信号を、 2 つの無指向性マイクで観測する状況をシミュレートしている。この表に示すように、この形態の方法では、分離性能 SIRをほとんど落すことなぐ従来法 2に比べ格段に高い SDRを得ることができる。これは、この形態の方法が、格段に低い歪で信号の分離を行っていることを示している。

[0105] 〔第 7の実施の形態〕

本形態も第 1の本発明に係る実施の形態であり、上述の第 6の実施の変形例である。すなわち、本形態も 2≤V≤Mの場合にバイナリマスクを用いて限定信号を抽出する形態であるが、バイナリマスク B(f,m)の作成方法及び限定信号の算出処理に違いがある。以下では、このバイナリマスク B(f,m)の作成方法、及び限定信号の算出処理にのみについて説明を行い、その他の処理及び機能構成については、第 1の実施の形態或いは第 2の実施の形態と同一であるため、説明を省略する。

[0106] この形態のノくイナリマスク B(f,m)は、上述の限定信号以外の観測信号成分を抽出するためのものである。すなわち、この形態のマスク作成部が作成するバイナリマスク B(f，m)は、 V個の代表値 (この集合を Gとする）を含む所定の範囲内にある相対値に対してローレベル値をとり、この所定の範囲内にない代表値（G ^c)に対してハイレル値をとり、ハイレベル値からローレベル値への推移が不連続な関数である。ただし、 2≤V≤Mである。

[0107] すなわち、この形態のマスク作成部 51— kは、例えば、 G ^eに含まれる代表値につい

k

て、上述の式（3)で示されるバイナリマスクを生成する。また、本形態でも、位相差 z ( f, m)、振幅比 z (f， m)、位相差 z (f， m)から得られる信号の到来方向 z (f， m)等

2 1 3

を、相対値 z (f, m)として使用することができる。図 12Bは、本形態のバイナリマスク B (f,m)の例示である。この例は、 V = 2個の代表値 a， aを含む所定の範囲内にある相

1 2

対値 z (f, m)に対してローレベル値（例えば 0)をとり、この所定の範囲内にない代表

3

値 aに対してハイレベル値（例えば 1)をとるバイナリマスクの例である。この図の縦軸

3

はバイナリマスクのゲインを示し、横軸は相対値 z (f, m) (信号の到来方向（deg.) )

3

。この図に示すように、この例のバイナリマスクのハイレベル値はフラットであり、このハイレベル値とローレベル値とは不連続である。

[0108] また、この形態の限定信号抽出部は、周波数領域の信号値 X (f，m)にこのノくイナリ

J

マスク B(f，m)を乗じた値を、周波数領域の信号値 X (f,m)力減算し、限定信号値 X"(

J

f，m)を抽出する。例えば、上述の式 (3)で示されるバイナリマスク M (f，m)を集合 G

i k Ίこ含まれる N-M個の代表値について作成し、

[数 28]

X(f , m) = X(f , m) -∑{Mi (f, m)X(f， m)}… (27) を計算することで、 M個の原信号のみからなる限定信号の値 X (f，m)を算出する。なお、上述の式 (3)のバイナリマスク M (f，m)は、それぞれ 1つの代表値のみに対してハィレベル値をとるバイナリマスクである力 2つ以上の代表値に対してハイレベル値をとるバイナリマスクを用いて本形態の処理を実行してもよレ、。また、バイナリマスクの変わりに上述した滑らかな形状のマスクを用いて本形態の処理を実行してもよレ、。

限定信号 X (f,m)が算出されると、以後第 1の実施の形態或いは第 2の実施の形態と同様な限定信号分離、時間領域変換、信号統合の処理が行われる。

[0109] 〔第 8の実施の形態〕

本形態は、第 2の本発明に係る例であり、 M個のセンサで信号が観測される状況において、観測値を M次元領域でクラスタリングし、マスクを定義する。なお、以下では第 1の実施の形態との相違点を中心に説明し、第 1の実施の形態と共通する事項については説明を省略する。

図 13は、本形態における代表値生成部 430、マスク制御部 40及び限定信号作成部 450— kの構成を例示したブロック図である。なお、この図は V個の分離信号を得る 1系統のみを示している。なお、本形態では 1≤V≤Mである。

[0110] 本形態の信号分離装置と第 1の実施の形態の信号分離装置 1との構造上の相違点は代表値生成部及び限定信号作成部である。すなわち、第 1の実施の形態の信号分離装置 1の代表値生成部 30 (図 1)の換わりに代表値生成部 430 (図 13)が設けられ、信号分離装置 1の限定信号作成部 50-k (図 1)の換わりに限定信号作成部 45 0— k (図 13)が設けられる。その他の構成については第 1の実施の形態と同様である図 14は、本形態における信号分離処理を説明するためのフローチャートである。以下、このフローチャートに添って、本形態の信号分離処理について説明する。

[0111] まず、前処理として、各センサにおいて観測された時間領域の各観測信号 X (t) (j

J

= 1 ,…， M)を記憶部 2 (図 1)に格納しておく。そして、信号分離処理が開始されると、信号分離プロセッサ 3は制御部 10の制御のもと以下の処理を実行する。

まず信号分離プロセッサ 3は、制御部 10の制御のもと記憶部 2にアクセスし、そこから各観測信号値 X (t)を順次読み込み、周波数領域変換部 20に送る（ステップ S21)

J

。周波数領域変換部 20は、短時間離散フーリエ変換等によって、これらの信号値を時間ごとの周波数領域の観測信号値 X (f， m)に順次変換し、一時記憶部 90に格納

J

する（ステップ S 22)。

[0112] 次に、クラスタリング部 432 (図 13)が、一時記憶部 90 (図 1)に格納された周波数領域の観測信号値 X (f, m) , . . . , X (f, m)を読み出す。そして、クラスタリング部 4

1 M

32 (図 13)は、これら周波数領域の信号値 X (f, m) , . . . , X (f, m)からなる観測

1 M

信号ベクトル（「第 1のベクトル」に相当） X (f, m) = [X (f, m) , . . .， X (f, m) ]を、

1 M

周波数 fごとに N個ずつのクラスタ C (f) (i= l， . . .， N)にクラスタリングし、信号源

1

数 Nと等しい N個のクラスタ C (i= l， 2,…， N)を生成する（ステップ S23)。なお生成された N個のクラスタは、一時記憶部 90 (図 1)に格納される。

[0113] ここで本形態におけるクラスタとは、観測信号ベクトル X (f, m)の集合であり、離散時間 mの集合 Tを用いて C (f) = {X (f, m) I m eT }と表記される。また、クラスタリングの目的は、同じ信号源が支配的である (主な成分を持つ)サンプル (観測信号べタトル X (f， m) )を同じクラスタに分類することである。なお、得られる N個のクラスタ C (f) , ···, c (f)は、必ずしも、互いに素（c i (f) n c j (f)が空集合， i≠j)である必要は

N

なぐまたクラスタに属さない要素

[数 29]

X(f₅m)iUSiCi

が存在してもよい。

[0114] [クラスタリング部 432での処理の詳細]

ここでクラスタリング部 432の処理をさらに詳細に説明する。

この例のクラスタリング部 432は、クラスタリングを適切に実行できるように、すなわち同じ信号源が支配的であるサンプル (観測信号ベクトル X (f， m) )が同じクラスタに分類されるように、各サンプノレの正規化を行ってからクラスタリングを行う。

具体的には、例えばまず正規化部 432a (図 13) 、一時記憶部 90 (図 1)から観測信号ベクトル X (f， m)を読み込み、

[数 30]

を算出し、

p (f,m)/_Sign(Xj(f,m)) (| Xj(f,m)|≠0)

(29)

(，^m) †x(f,m) (I Xj(f,m)|= 0) · の正規化を行い、クラスタ生成部 432bが、この正規化結果のクラスタリングを行う。

[0115] また、さらに必要であれば、この例の正規化部 432aは、式（28) (29)の正規化を行った後、さらに、

[数 31] _X(f,_m) {^X(f，m)/ li X(f,m)li (II ( ₅m) IM 0)

[X(f,m) (|| X(f，m)||= 0)

の正規化を行い、クラスタ生成部 4 3 2 bが、この正規化結果のクラスタリングを行う。ただし、べクトルの長さ || X(f,m) ||は X(f,m)のノルムであり、具体的には、例えば、

[数 32]

/ k ヽ ^1/k

L_k(X(f₅m)) = (^∑¾|x_j| (f,m)J (31) で定義される Lノルム■ X (f， m) ■ ^ i, m) )を用いる。

2 2

[0116] また、クラスタ生成部 432bが行うクラスタリングの方法としては、例えば、階層的クラスタリングや k-meansクラスタリング等の多くの教科書で説明されている方法を用いること力 Sできる（例えば、「尾上守夫監訳"パターン識別"，新技術コミュニケーションズ， ISBN 4-915851-24-9,第 10章」等参照。）。なお、レヽずれのクラスタリング方法も、 2つのサンプル X (f, m)と X' (f, m)の距離が定義され、それに従ってサンプル間の近さが測られ、なるべく距離の近いサンプノレ同士が同じクラスタに含まれるようにクラス夕リングするものである。

[0117] 例えば、上述の式（29)のみによってサンプルが正規化された場合、クラスタ生成部 432bは、正規化された 2つの観測信号ベクトル X (f, m)間のコサイン距離を距離尺度として用いてクラスタリングを行う。なお、 2つのサンプル X (f, m)と X' (f, m)のコサイン距離は、

1-X^H (f , m) ·Χ，（f , m) / (■ X (f , m) ■ ·■ X，（f , m) ■ ) · · -(32)

によって定義される。

[0118] また、上述の式（29)と式（30)によってサンプノレが正規化された場合、クラスタ生成部 432bは、正規化された 2つの観測信号ベクトル間の差 (X (f, m)-X' (f, m) )の L ノルム■ X (f， m)— X，（f， m) ■ ， m)— ノルム

2 ¾ X，（f， m) )や、任意の kによる L

k

、或いはコサイン距離 (式 (32) )を距離尺度として用いてクラスタリングを行う（ [クラスタリング部 432での処理の詳細]の説明終わり）。

次に、代表値計算部 433が、一時記憶部 90 (図 1)に格納された各クラス C (f)を順次抽出し、各クラス C_f (f)を代表する代表ベクトル（「第 2のベクトル」に相当） (f)を算出する（ステップ S 24)。

[0119] [代表値計算部 433での処理の詳細]

例えば、まず代表値計算部 433の代表ベクトル生成部 433a (図 13)が、一時記憶部 90 (図 1)に格納された各クラス C (f)を順次抽出し、各クラスタ C (f)に属するサンプルの値 X (f， m)の平均値

[数 33] ai(f) =∑x₍f,_m)ec_i(f)^X(^f'^m)^/ l ^Ci(^f) l を各信号源に関する代表ベクトル a (f)として算出する。或いは、各クラスタ C (f)に属するサンプル X (f, m)を適度に量子化し、最瀕値を求めてこれを代表ベクトル a ( と

i してもよレ、。このように求められた代表ベクトル a (f)は一時記憶部 90 (図 1)に格納される。

[0120] 次に、並び替え部 433b (図 13)が、一時記憶部 90 (図 1)から、これらの代表べタトル a (f) , .··, a (f)を読み出し、これらの各代表ベクトル a (f ) , .··, a (f)の各源信号

1 N 1 N

s (t)との対応が、すべての周波数 fにおいて等しくなるように、各代表ベクトル a (f) k i の添字 iを付け替える（ステップ S25)。

具体的には、例えばまず、並び替え部 433b (図 13)が、読み出した各周波数 fの代表ベクトル a (f)を用い、

[数 34] arg a^ /a^Cf))

6i(f) = arccos ^J——— -—— - . . . (33)

I fv-¹ ll dj - dj, )! の演算によって、各周波数 fに対する源信号 iの到来方向の推定値 Θ ωを算出する

。なお、 dはセンサ jの位置、 Vは信号の速さ、 a (f)は代表ベクトル a (f)の i番目の要素であり、 d及び Vは、例えば、予め一時記憶部 90に格納されているデータを用いることとする。

[0121] 算出された各推定値 Θ (f)は、例えば、その算出に用いた代表ベクトル a (f)に対応付けられて一時記憶部 90 (図 1)に格納される。次に、並び替え部 433b (図 13)は、例えば、一時記憶部 90から各推定値 Θ . (f)を読み込み、これらを各周波数 fごとに所定の順序 (例えば、昇順、降順等）で並び替える。なお、この並び替えは、例えば公知の並び替えアルゴリズムによって行われる。そして、この並び替え後の各 fにおける各代表ベクトル a (f)の順番を示す情報 (Γ (f， a (f) ) = l , 2,…， N)が、一時記憶部 90 (図 1)に格納される。そして、並び替え部 433b (図 13)は、例えば、この順序情報 j ' (f, a (f) )を一時記憶部 90から読み込み、当該 a (f)が j， (f， a (f) )番目の源信

i

号に対応するとして、各代表ベクトルと iとの対応付けを変更する（a (f)の添字 iを付け替える）。そして、この添字 iが付け替えられた各代表ベクトル a (f)は、一時記憶部 90 (図 1)に格納される。

[0122] 次に、マスク制御部 40は、これら各代表ベクトル a (f)を要素に持つ集合 Gを特定

i 0 するデータを変数 SGに代入し、この変数 SGを一時記憶部 90に格納する。また、

0 0

マスク制御部 40は、集合 Gを特定する変数 SGを G= φ (空集合）に初期化し、変数 k を 0とし、それらを一時記憶部 90に格納する (ステップ S26)。

[0123] まず、マスク制御部 40は、一時記憶部 90に格納された変数 kに 1をカ卩えた値を新たな変数 kとし、再び一時記憶部 90に格納する（ステップ S27)。

次に、マスク制御部 40は、一時記憶部 90 (図 1)から変数 SG及び SGを呼び出す

0

。そして、マスク制御部 40は、変数 SGによって特定される集合 Gから、 SGによって

0 0

特定される集合 Gの補集合 (G^e ( _α ^eはひの補集合を示す) )の元を含む適当な V (≤ M)個の代表ベクトル a (f) (p = l， ···, V) (「第 3のベクトル」に相当）の集合 Gを選

P k 択し、この集合 Gを特定するデータを変数 SGに代入し、この変数 SGを一時記憶

k k k

部 90に格納する（ステップ S28)。すなわち、マスク制御部 40は、各代表ベクトル a (f

1

) ,…， a (f)の中から、限定信号として取り出す V個の信号に対応する V個の代表べ

N

タトル a (f) (p = l , ·.., V)を抽出する。

P

[0124] 本形態では、この集合 Gに含まれる代表ベクトル a (f)に近いサンプル値 X (f, m)

k P

を抽出し、集合 Gに含まれない代表ベクトル (集合 G ^eの要素、 * ^eは *の補集合を示す）に近いサンプノレ値 X(f, m)を抽出しないことで、 V個の信号が混合した限定信号 X' (f , m)を作成する。

そのために、本形態では、限定信号作成部 450— kのマスク作成部 451— k (図 13) 、一時記憶部 90 (図 1)から変数 SG、 SG及び観測信号ベクトル X(f， m)を読み k 0

込み、以下のマスク M (f， m)を生成する（ステップ S29)。

k

[0125] [数 35]

. max _(f)eG D(X(f,m),a (f))<min _c D(X(f,m),a (f))

(f,m) = p、 ' K ' a_q(i)ed_k

otherwise

なお、 D (X ( f ， m)， a i ( f )) は、ベクトル X ( f ， m) と a ; ( f ) とのマハラノビス平方距離

D(X(f,m),a_i(f)) = (X(f,m)-a_i(f))^H∑"¹(X(f,m)-a_i(f))を示し、 ∑はクラスタ C iの共分散行列∑ - a_i(f))(X(f,m)-a_i(f))^H

を示し、 I c Iは、クラスタ cに属するサンプル数を示す。また、源信号の大きさがほぼ同じであることが分かっている場合、共分散行列∑ =ι(単位行列）としてもよい。

[0126] このマスク M (f, m)は、一時記憶部 90 (図 1)に格納され、限定信号抽出部 452- k

k (図 13)は、一時記憶部 90からマスク M (f, m)と観測信号ベクトル X(f, m)とを読 k

み込み、マスク M (f, m)と観測信号ベクトル X(f, m)との積

k

X '(f， m)=M (f， m) -X(f, m)

k k

を演算し、 V個の信号源から発せられた限定信号値 X " (f, m)を抽出する (ステップ k

S30)。

[0127] この限定信号値 X '(f， m)は、一時記憶部 90 (図 1)に格納された後、限定信号分 k

離部 60-kに送られ、限定信号分離部 60-kは、この限定信号値 X (f, m)を用い、 k

限定信号の信号分離を行う (ステップ S31)。ここで、限定信号値 X ' (f， m)は、 V k (l

≤V≤M)個の信号源から発せられた信号によって構成された混合信号の値であると近似される。よって、その分離行列の推定には [従来法 1]で述べた独立成分分析による方法を利用できる。すなわち独立成分分析の入力として、観測信号値 Xの代わりに限定信号値 X (f， m)を用い、例えば [従来法 1]で述べた式 (2)を用いて分離を行う。なお、 V= lの場合は、ステップ S31の処理は不要である。

[0128] 本実施例における ICAによる分離では、まず、 ICA分離行列推定部 61— k (図 2)において、限定信号値 X ' (f, m)を用い、前述の式（2)の学習則に従い分離行列 W(f

k

, m)を生成し、この分離行列 W (f, m)を一時記憶部 90に格納する。なお、この分離行列 W(f, m)の生成には、例えば、以下のパーミュテーシヨン'スケーリング解決部 6 2-kからの出力値 Y (f, m)のフィードバックを用いる。生成された分離行列 W(f, m

k

)はパーミュテーシヨン'スケーリング解決部 62— kに送られる。パーミュテーシヨン'スケーリング解決部 62— kは、この分離行列 W (f， m)と限定信号値 X (f, m)を用い、

k

Y (f， m) =W (f， m) X " (f, m)の演算を行レ、、それぞれの分離信号値 Y (f， m) = k k k

[Y ^nkl (f， m)， ···， Y ^nkv(f, m) ]^Tを生成し、それを一時記憶部 90に格納する。そ kl kV

して、パーミュテーシヨン'スケーリング解決部 62— kは、例えば、この分離信号値 Y (f

k

, m)をフィードバックし、 [従来法 1]で述べた方法で Permutation問題を解決する。 Permutation問題の解決後、パーミュテーシヨン'スケーリング解決部 62_kは、さらに、分離信号値 Y (q= l , ...V)がどの源信号に対応するのかを示すタグ Π を、分離

kq kq

信号値 Y (q= l , ...V)に付与し、これらを対応付けて一時記憶部 90に格納する。ここでは、このタグ Π を分離信号値 Y の上付添字 Π として表記する。

kq kq kq

[0129] 具体的には、例えば、パーミュテーシヨン'スケーリング解決部 62-k力一時記憶部 90力抽出した分離行列 W (f)の逆行列（N≠Mの場合は Moore-Penrose型擬似逆行列）を用い、

[数 36] θ。 a誦 ^([W¾^MW^^f)]) (34)

2n^-¹||d_j -dj,

(ここで vは信号の速さ、 dはセンサ jの位置）

j

の演算によって得られる信号の推定到来方向 Θ (f)と、一時記憶部 90から抽出した変数 SGが示す集合 Gに含まれる代表ベクトル a (f)とを比較し、 Θ に最も近い代表 k k p q ベクトル a (f)を q番目の分離信号 Y に対応付ける (ステップ S32)。つまり、パーミュ

P kq

テーシヨン 'スケーリング解決部 62— kは、この分離信号 Y に対し、代表値 aを示すタ

kq i グ π を付与する (対応付ける)。

[0130] この後、パーミュテーシヨン'スケーリング解決部 62-k力一時記憶部 90から分離行列 W(f)を抽出し、その各行 w (f)を

w (f)— [W—丄）] w (f)

q jq q

タグ Π が付与された各分離信号値 Y は、時間領域変換部 70-kに送られる。時 kq kq

kq

一時記憶部 90に格納する。（ステップ S33)。なお、これら時間領域の信号値 y (t) k

= [y ^nkl (t) , y ^nw (t) ]^Tにも上述のタグ Π が関連付けられる。この関連付け kl kV kq

を行う場合、まず、時間領域変換部 70 - kが、一時記憶部 90から、周波数領域の信号値 Y に対応付けられているタグ Π を各周波数及び時間について抽出する。次 kq kq

に、時間領域変換部 70— kは、各周波数及び時間におけるタグ Π がすべて等しいか否かを判断する。ここでこれらがすべて等しかった場合には、時間領域の信号値 y k のタグとして、周波数領域の信号値 Y に対応付けられているタグ Π を対応付ける q kq kq

。一方、これらがすべて等しくなかった場合には、多数決にて時間領域の信号値 y kq のタグを決定する。

[0131] 次に、マスク制御部 40において、一時記憶部 90から変数 SGと SGとを抽出し、これ

k

k k

、この変数 SGを一時記憶部 90に格納する（ステップ S34)。また、マスク制御部 40は、一時記憶部 90から変数 SGと SGとを読み出し、この新たな集合 Gが集合 Gと等し

0 0 いか否かを判断する（ステップ S35)。ここで、 G = Gでなければステップ S27の処理

0

に戻る。

[0132] 一方、 G = Gであれば、信号統合部 80において、一時記憶部 90から各系統 k (時

0

kp

れらの選択/統合を行い、 N個すベての分離信号を得る (ステップ S36)。具体的には、例えば、まず信号統合部 80は、一時記憶部 90から読み出した各分離信号 y (t

kp

kq k

P kq を最終的な分離信号値 y^t) (i= l , ..., Ν)として出力する (ステップ S37)。一方、複数の系統において同じタグを持つ分離信号値が存在すると判断された場合、信号統合部 80は、これらのタグが等しい分離信号値のどれ力、 1つを適当に選択し、最終的な分離信号値 y (t)として出力する力 \同じタグを持つ分離信号値の平均を計算し、それを出力信号とする（ステップ S37)。

[0133] ここで、どれか 1つの分離信号値 y (t)を適当に選択し、最終的な分離信号値 y (t

kq i

kq

また、同じタグを持つ分離信号値の平均を最終的な分離信号値 y (t)として出力する処理の場合、信号統合部 80は、例えば、

[数 37]

= り

(Kは同じタグ aを持つ分離信号の個数）

[0134] なお、本形態の変形として、マスク M (f, m)を生成せず、

[数 38]

； fX(f,m) max _(f)eGk D(X(f,m),a_p(f)) < min D(X(f,m),a_q(f))

[0 otherwise として、直接限定信号値を生成してもよい。すなわち、例えば、限定信号作成部 450 一 kが、観測信号ベクトル X (f, m)に対し、

[数 39] m^axa_p(f)eG_k D(X(f,m),a_p(f)) < min_aq_(f)eGC D(X(f,m),a_q(f)) を満たすか否力、を判断し、満たすと判断した観測信号べ外ル X (f， m)を、信号源から発せられた信号の値として抽出することとしてもよい。

[0135] 〔第 9の実施の形態〕

本形態は、第 3の本発明に係る実施の形態である。

ぐ構成 >

図 15は、本形態におけるブランド信号分離装置 500の構成を例示したブロック図である。なお、この図における矢印はデータの流れを示す力制御部 521や一時記憶部 522に出入りするデータの流れは省略してある。すなわち、データが制御部 52 1や一時記憶部 522を経由する場合であつても、その経由の過程は省略してある。

[0136] まず、この図を用いて、本形態の構成について説明する。

図 15に例示するように、本形態の信号分離装置 500は、記憶部 501とこれに有線或いは無線で電気的に接続された信号分離プロセッサ 502とを有している。

記憶部 501は、例えば、ハードディスク装置、フレキシブルディスク、磁気テープ等の磁気記録装置、 DVD-RAM (Random Access Memory) , CD-R (Recordable) / RW (Rewritable)等の光ディスク装置、 MO (Magneto-Optical disc)等の光磁気記録装置、 EEP— ROM (Electronically Erasable and Programmable-Read Only Memory) 、フラッシュメモリ（flash memory)等の半導体メモリ等である。また、記憶部 501は、信号分離プロセッサ 502と同一の筐体内に存在してもよいし、別個の筐体に構成されてもよい。

[0137] またこの例の信号分離プロセッサ 502は、例えばプロセッサや RAM等によって構成されるハードウェアであり、周波数領域変換部 511、混合行列推定部 512、パーミュテーシヨン問題解決部 513、スケーリング問題解決部 514、列選択部 516、行列生成部 517、分離行列生成部 518、分離信号生成部 519、時間領域変換部 520、制御部 521及び一時記憶部 522を有している。また、この例の混合行列推定部 512は、クラスタリング部 512a、代表べクトノレ計算部 512b及びべクトノレ統合部 512cを有している。さらに、クラスタリング部 512aは、正規化部 512aa及びクラスタ生成部 512ab を有している。

[0138] <処理 >

図 16は、本形態における信号分離装置 500の処理の全体を説明するためのフロ一チャートである。以下、図 15及び図 16を用いて、信号分離装置 500の処理を説明していく。なお、以下では N (N≥ 2)個の信号源から発せられた信号が混合され、 M 個のセンサで観測された場合について説明する。

[0139] [処理の全体]

信号分離装置 500は、制御部 521の制御のもと、以下の処理を実行する。まず、 M個のセンサで観測された観測信号の値 X (t)， X が、記

1 …， (t) (tは時間）

M

憶部 501から読み込まれ、周波数領域変換部 51 1に入力される（図 15)。周波数領域変換部 51 1は、これらの観測信号値 X (t) , X (t)を、短時間離散フーリエ変

1 M

換等により、周波数領域の信号値 (周波数 fごとの時系列データ) X (f

1 ， m)，…， X (

M

f, m) (mは離散時間）に変換する (ステップ S51)。これら周波数領域の信号値 X (f , m) , · · ·， X (f, m)は、一時記憶部 522に格納され、混合行列推定部 512のクラス

M

タリング部 512aによって読み込まれる。クラスタリング部 512aは、これらによって構成される観測信号ベクトル X (f, m) = [X (f )，

1 ， m …， X (f

M ， m) ] ^Tを、周波数 fごとに N 個ずつのクラスタ C (f) (i= l , N)にクラスタリングする (ステップ S52)。各クラスタ

i

C (f)は、代表ベクトル計算部 512bに送られ、代表ベクトル計算部 512bは、各クラスタ C (f)の代表ベクトル a (f)を算出する（ステップ S53)。各代表ベクトル a (f)は、一時記憶部 522に格納され、ベクトル統合部 512cは、これらを順次抽出し、各代表べタトル a (f)を列とする推定混合行列 A (f) = [a (f) , . · · , a (f) ]を生成する（ステップ i 1 N

S54)。生成された推定混合行列 A (f)は、一時記憶部 522に格納される。

[0140] パーミュテーシヨン問題解決部 513は、推定混合行列 A (f)を一時記憶部 522から読み込み、推定混合行列 A (f)の列を並び替えてパーミュテーシヨン問題を解決する (ステップ S55)。なお、この処理には、後述する分離信号の値 Y (f

1 ， m) , Y (f

Ν ， m)をフィードバックして用いることも可能であり、その場合、より正確にパーミュテーシヨン問題を解決できる。

[0141] 次に、スケーリング問題解決部 514において推定混合行列 A (f)の列を正規化してスケーリング問題を解決した後（ステップ S 56)、この推定混合行列 A (f)を用いて、分離行列生成部 518が分離行列 W (f， m)を生成する（ステップ S57)。生成された分離行列 W (f, m)は、一時記憶部 522に格納された後、そこから分離信号生成部 519 に送られ、分離信号生成部 519は、一時記憶部 522から周波数領域の信号値 X^f , m) , ···, X (f, m)を読み込み、 Y (f, m) =W(f, m) X (f, m)の演算により、分離

M

信号ベクトル Y (f, m) = [Y (f, m) , .··, Y (f, 111) ] を算出する（ステップ358)。算

1 N

出された分離信号値 Y (f， m) , ..., Υ (f， m)は、一時記憶部 522に格納され、パー

1 N

ミュテーシヨン問題解決部 513にフィードバックされる他、時間領域変換部 520にも送られる。そして、時間領域変換部 520は、分離信号値 Y (f， m) , ···, Y (f， m)を、

1 N

添字 iごとの短時間逆フーリエ変換等により時間領域の信号値 y (t)， ...， y (t)に変

1 Ν

換し (ステップ S59)、時間領域での分離信号値 y (t)が得られる。

[0142] [混合行列推定部 512での処理の詳細]

次に、混合行列推定部 512での処理の詳細について説明する。なお、以下の処理は、周波数ごとに適用されるものである。

まず、クラスタリング部 512aは、一時記憶部 522から読み込んだすべてのセンサの観測信号成分 X (f, m)，…， X (f， m)をまとめ、これらを観測信号ベクトル X (f, m)

1 M

= [X (f, m) , ..·, X (f, m) ]^Tとして関連付ける。そして、クラスタリング部 512aは、

1 M

クラスタリングによって信号源と等しい数 N個のクラスタ C (f)を生成し、これらを一時記憶部 522に格納する（ステップ S 52)。

[0143] ここでクラスタとは、観測信号ベクトル X (f， m)の集合であり、離散時間 mの集合 T を用いて C (f) = {X (f, m) I meT }と表記する。また、クラスタリングの目的は、同じ信号源が支配的である (主な成分を持つ)サンプル (観測信号ベクトル X (f , m) )を同じクラスタに分類することである。なお、得られる N個のクラスタ C (f) , ···, C (f)は、

N

必ずしも、互いに素（c (f) n c (f)が空集合， i≠j)である必要はなぐまたクラスタに属さない要素

[数 40]

が存在してもよい。

[0144] 次に、代表ベクトル計算部 512bは、一時記憶部 522から各クラスタ C (f)を読み込み、各クラスタ C (f)に属するサンプル X (f， m)の平均値

[数 41] ai (m) =∑_X(f,_m)eCi(f)^X(^f'^m)^/ | Ci(^f) l を各信号源に関する代表ベクトル a^f)として算出する（ステップ S53)。或いは、各クラスタ C (f)に属するサンプル X (f, m)を適度に量子化し、最瀕値を求めてこれを代表ベクトル a (f)としてもよい。

[0145] 最後に、ベクトル統合部 12cで N個の代表ベクトル a (f)をまとめて、混合行列 H (f) = [h (f) ,…， h (f) ]の推定行列である推定混合行列 A (f) = [a (f) ,…， a (f) ]を

I N I N

生成して出力する（ステップ S54)。なお、推定混合行列 A (f)は、各ベクトルの順序に関する任意性 (パーミュテーシヨンの任意性)と、各ベクトルの大きさの任意性 (スケ一リングの任意性）を含んでいる。すなわち、代表ベクトル a (f)は、 h (f)に任意の

ί π ω

複素数を掛けたものとして推定される。ここで、 Πは、パーミュテーシヨンの任意性を表現する順列である。

[0146] [クラスタリング部 512aでの処理の詳細]

次にクラスタリング部 512aの処理をさらに詳細に説明する。

この例のクラスタリング部 512aは、クラスタリングを適切に実行できるように、すなわち同じ信号源が支配的であるサンプル (観測信号ベクトル X (f， m) )が同じクラスタに分類されるように、正規化部 512aaで各サンプルの正規化を行ってからクラスタリングを行う。

[0147] 具体的には、この例の正規化部 512aaは、

[数 42] … ）

を

）の正規化を行った後にクラスタリングを行う。

また、さらに必要であれば、この例の正規化部 512aaは、さらに、

[数 43]

の正規化を行った後にクラスタリングを行う。ただし、ベクトルの長さ || X(f,m) ||は X(f,m)のノルムであり、具体的には、例えば、

[数 44]

ヽ l/k

m) •(38)

で定義される Lノルム■ X (f, m) ■ ¾if, m) )を用いる。

2 2

[0148] また、クラスタリングの方法としては、例えば、階層的クラスタリングや k- meansクラスタリング等の多くの教科書で説明されている方法を用いる (例えば、「尾上守夫監訳

"パターン識別"，新技術コミュニケーションズ， ISBN 4-915851-24-9,第 10章」等参照。）。なお、いずれのクラスタリング方法も、 2つのサンプル X (f, m)と X' (f, m)の距離が定義され、それに従ってサンプノレ間の近さが測られ、なるべく距離の近いサンプル同士が同じクラスタに含まれるようにクラス夕リングするものである。

[0149] 例えば、上述の式（36)のみによってサンプルが正規化された場合、クラスタリング部 512aは、正規化された 2つの観測信号ベクトル X (f， m)間のコサイン距離を距離尺度として用いてクラスタリングを行う。なお、 2つのサンプル X (f， m)と X' (f, m)のコサイン距離は、

1— X^H (f， m) ·Χ，（f , m) / (■ X (f , m) ■ .■ X，（f， m) ■ ) · "(39)

によって定義される。

[0150] また、上述の式（36)と式（37)によってサンプノレが正規化された場合、クラスタリング部 512aは、クラスタ生成部 512abにおいて、上記の正規化された 2つの観測信号ベクトル間の差（X (f, m)-X' (f, m) )の Lノルム■ X (f, m) -X' (f, m) ■ ^ i,

2 2

m)— X' (f, m) )や、任意の kによる Lノルム、或いはコサイン距離 (式（39) )を距離

k

尺度として用いてクラスタリングを行う。

以上の操作により、各クラスタ Cの代表ベクトル a (f)が混合ベクトル h (f)の推定 (大

i i k

きさの任意性を含む)となる理由を説明する。

[0151] クラスタ Cには、ある源信号 Sのみが支配的で他の源信号は 0に近いような観測信

i k 号ベクトル X(f, m)が集められている。この状況は、

X(f, m)=h (f)S (f, m)---(40)

k k

と近似できる。

そしてこの関係と式 (36)の正規化により、

X— X/sign(X) =h S /sign(H S )=sign*(H ) | S | h ー(41) j k k jk k jk k k

となる。なおここでは、 sign (H S )=sign(H )sign(S )， l/sign(H )=sign*( jk k jk k jk

H ) (·*は複素数の共役をとる操作)，及び S /sign(S )= I S Iなる関係を用い jk k k k

た。また、これらの記載において f, mは省略してある。

[0152] また、式（37)の正規化と式 (40)により、

X— X/■ X■ H …

(42)

となる。なおここでは、 ■ sig¾H ) | S | h " = | $ - -Hなる関係を用いた。また

jk k k k k

、これらの記載においても f, mは省略してある。

ここで、式 (41)により、式（36)によって正規化された観測信号ベクトル X(f, m)は、混合ベクトル h (f)を sign*(H (f))倍したベクトルの直線上に集まることがわかる。

k jk

そして、直線上のどこに乗るかは、信号源の大きさ I S (f, m)

k Iによる。また、式 (42

)により、式（37)によって正規化された観測信号ベクトル X(f, m)は、複素空間での 1点 sign*(H (f))h (f)/■ If) ■に集まることがわかる。これらは、正規化された観

jk k k

測信号ベクトル X(f， m)の平均として算出した代表ベクトル a (f)が、大きさの任意性を含む混合ベクトル h (f)の推定となっていることを示している。

k

[0153] [パーミュテーシヨン問題解決部 513での処理の詳細]

次に、パーミュテーシヨン問題解決部 513での処理の詳細について説明する。パーミュテーシヨン問題解決部 513では、各周波数 fで算出された推定混合行列 A (f)の列の並べ替えを行レ、、同じ信号源 s (t)に関する代表ベクトル a (f)がすべての

k i

周波数 fで同じになるようにする（ステップ S55)。すなわち、各分離信号 Y (f， m)， …， Y (f， m)と各信号源との対応が各周波数 fにおいて同一となるように添字 iを付

N

け替える。そのために、例えば、従来の技術と同様、非特許文献 2の手順に基づいて 2種類の情報を用いる。 [0154] 1つ目の情報は、信号源の到来方向などの位置情報である。従来の ICAを用いた方法では、分離行列 Wを ICAにより求めて、そのムーア'ペンローズ（Moore-Penrose )型擬似逆行列 W⁺ (M = Nの場合は逆行列 W—¹に一致)から位置情報を得てレ、た。ここで、このムーア'ペンローズ型擬似逆行列 W⁺は、混合行列の推定 A (f)とみなせる。そのため、本形態では従来の ICAを用いた方法とは異なり、推定混合行列 A (f) そのものをムーア ·ペンローズ型擬似逆行列 W⁺とみなし、その各列から直接位置情報を得ることができる。具体的には、例えば、

[数 45]

によって位置情報を得ることができる。ここで、 Θは、センサ jとセンサ j 'とを結ぶ直線と、センサ jとセンサ j 'との中心点と信号源 iを結ぶ直線とのなす角度である。また、 d

J

はセンサ jの位置を示すベクトルである。そして、例えば、各添字 iと Θとの対応が各周波数 fにおいて同一となるように推定混合行列 A (f)の列の並び替えを行レ、、パーミュテーシヨン問題の解決を図る。

[0155] 2つ目の情報は、従来の ICAを用いた方法と同様、分離信号成分の絶対値 I Y (f

1

, m) Iの周波数間での相関である。すなわち、例えば、異なる周波数 flと f2において、同じ添字 iに対する分離信号成分の絶対値の相関

[数 46] . - - (44)

(ただし、 vf m

く '〉 _mは時間 mに関する「 ·」の平均値を示す。）が最大化されるように推定混合行列 A (f)の列の並び替えを行い、パーミュテーシヨン問題の解決を図る。

なお、これらの処理に使用する分離信号は、分離信号生成部 519の出力 Y (f， m) , .··, Y (f, m)をフィードバックすることで得られる。

N [0156] [スケーリング問題解決部 514での処理の詳細]

次に、スケーリング問題解決部 514での処理の詳細を説明する。

パーミュテーシヨン問題解決部 513から推定混合行列 A (f)を受け取ったスケーリング問題解決部 514は、各列の大きさの任意性を解決するために、まず推定混合行列 A (f)の各列（代表ベクトル) a (f)に対し、正規化

a (f) ^a (f) /a (f)

を行う（ステップ S56)。なお、 aは、代表ベクトル a (f)の j行目の要素である。また、 j は各代表ベクトル a (f)ごとに違うものを選んでもよいが、同じ iに対してはすべての各周波数 fにおいて同じ jを用いる必要がある。

[0157] [分離信号生成処理の詳細]

次に、分離信号生成処理の詳細について説明する。

本形態の場合、センサの数が信号源の数に対して十分であるか否かによって分離信号の生成手順が異なる。

まず、センサの数が十分な場合 (M≥N)は、簡単に分離信号を生成できる。すなわち、分離行列生成部 518がスケーリング問題解決部 514から推定混合行列 A (f) を受け取り、そのムーア'ペンローズ型擬似逆行列 A (f) + (M = Nの場合は逆行列 A (f)— ¹に一致)を分離行列 W(f)として生成する (ステップ S57)。生成された分離行列 W(f)は、一時記憶部 522に格納される。分離信号生成部 519は、この分離行列 W ( f)と観測信号ベクトル X (f, m)とを一時記憶部 522から読み込み、これらを用い Y (f , m) =W(f) X (f, m)の演算により、分離信号成分 Y (f, m) , ··., Y (f， m)を生成

1 N

する（ステップ S 58)。

[0158] 一方、センサの数が不十分な場合 (Mく N)は、推定混合行列 A (f)と観測信号べタトル X (f， m)とに対し、分離信号 Y (f, m)は一意には定まらない。

[数 47]

X(f， m) = A(f ) Y(f , m) =∑^_3i (f)^ (f, m) … (45) を満たす Y (f, m)が無数に存在するからである。源信号カ^パース性を持つことに着目すると、無数の解のうち Lノルム： [数 48]

L₁(Y(f,m)) =∑^₁| Y_i(f,m) | ー(46) を最小にする解 Y (f, m)が最も正確な分離信号成分となることが知られている（甘利俊一，「総論一一人と機械はどのように見分け，聞き分けるの力一」，電子情報通信学会誌， VOL. 87, No. 3, pp. 167, 2004年 3月）。このような最小化基準で分離を行う場合は、分離のための行列 W (f, m)が時変となり、分離行列生成部 518は、時間 mごとに観測信号べ外ル X (f, m)と推定混合行列 A (f)とから時間依存の分離行列 W(f, m)を算出し (ステップ S57)、分離信号生成部 519が、 Y (f, m) =W (f, m) X ( f, m)として分離信号成分 Y (f， m)， ···, Y (f, m)を計算する (ステップ S58)。

1 N

[0159] しかし、 L (Y (f, m) )の最小化を厳密に行うのは計算量が大きいため、本形態では近似解法を用いて分離行列 W(f, m)の生成を行う。この解法は、観測信号べタトノレ X (f， m) (或いはある時点での残差ベクトル e)に最も方向が近い推定混合行列 A ( f)の歹' J (代表ベクトル) a (f)を順次選択していき、それらが M個選択されるまで繰り返すというものである。

図 17は、本形態の近似解法を説明するためのフローチャートである。以下、このフローチャートに沿って近似解法を用いて分離行列 W (f, m)を算出する処理を説明する。

[0160] まず、列選択部 516が、一時記憶部 522から推定混合行列 A (f)及び観測信号べタトル X (f, m)を読み込み（ステップ S61)、残差ベクトル eを観測信号ベクトル X (f, m)で初期化し、変数 kに 1を代入し (ステップ S62)、これらの情報を一時記憶部 522 に格納する。

次に、列選択部 516は、一時記憶部 522内の変数 kを参照し、 k≤Mであるか否かを判断する (ステップ S63)。ここで、 k≤Mである場合、列選択部 516は、

q (k) =argmax | a (f) ^H- e | /■ ) ■ · ' ·(47)

i i i

となる q (k)を選択し、その選択結果を一時記憶部 522に格納する (ステップ S64)。ここで、式 (47)は、長さが正規化された列 I a (f) ^H I / -ω ■と残差ベクトル eの内積の絶対値を最大化するもの、すなわち残差ベクトル eに最も方向が近い代表べクトノレ a_f(f)を選択する演算を示している。残差ベクトル eに方向が最も近い代表ベクトル f)を選択する理由は、次の繰り返しでの残差ベクトル eがより小さくなることで、以降の各 Y (f, m)が小さくなり、最終的に式 (46)で定義される Y(f, m)の Lノルムも小さく i 1 なると期待できるからである。

[0161] 次に、列選択部 516は、一時記憶部 522に格納されている選択済みのすべての代表ベクトル a (f)，…， a (f)によって張られる部分空間を示す行列 Q= [a (f) q(l) q(k) q(l)

,■·-, a (f)]を設定し (ステップ S65)、 P = Q(Q^HQ)— ¹"を算出する（ステップ S66 q(k)

)。そして、列選択部 516は、

e=X(f, m)-P-X(f, m)

の演算によって残差ベクトル eを更新して一時記憶部 522に格納する（ステップ S67)

[0162] ここで、 P'X(f， m)は、観測信号ベクトル X(f， m)を部分空間 Qに射影したもの、すなわち観測信号ベクトル X(f, m)のうち、これまで選択された代表ベクトル a (f) , q(l)

···, a (f)の線形和によって実現されるものである。残りの e=X(f, m)-P-X(f, m q(k)

)は、他のベクトルによって実現され、具体的には以降のループ処理で選択される列

(代表ベクトル) a によって実現される。

q(i)

その後、順次、次の列を選択するため、列選択部 516は、一時記憶部 522の変数 k に 1を加えて新たな kとし、ステップ S63に戻る（ステップ S68)。なお、残差ベクトル e には、これまでに選択された代表ベクトル a と直交する成分し力含まれていないた

q(i)

め、既に選択された代表ベクトルが、内積の絶対値 I _ai(f)^H'e の最大化基準のもと（ステップ S64)で再び選択されることはない。

[0163] そして、ステップ S63で、列選択部 516が k≤Mと判断すると（min(M, N)個の代表ベクトル a (f)を選択したことに相当）、列選択部 516はステップ S64 68のループ処理を終了させる。この時点では、選択済みの M個の代表ベクトル a が全空間を

q(i)

張ることになるため、残差ベクトル eは 0となる。ステップ S64 68のループ処理が終了すると、行列生成部 517は、これまで選択された M個の代表ベクトル a を一時記

q(i)

憶部 522から読み込み、ステップ S63— 68の処理で選択されなかった推定混合行列 A (f)の N—M個の代表ベクトル（列ベクトル） a (f)を 0とした、 [数 49] ία_;(0 i _e {q(l),...，q(M)}

a: (f,m) = <^ …（48)

[0 i g {q(l),...,q(M)} とレヽぅ歹 IJベクトル a ' (f, m)を生成する（ステップ S69)。さらに、行列生成部 517は、

i

式（48)の列べクトノレ a，（f, m)を列とする行列 A， (f, m) = [a， (f, m) , ···, a， (f, i 1 N m) ] (「選択された min (M, N)個の代表ベクトル a (f)と max (N_M, 0)個の 0ベタトルとを列とした行列 A' (f， m)」に相当）を算出し、一時記憶部 522に格納する (ステツプ S70)。なお、このように算出された行列 A' (f, m)は、 N X M行列である力そのうち N_M個の行は 0ベクトルである。

[0164] 分離行列生成部 518は、このような行列 A' (f, m)を一時記憶部 522から読み出し、そのムーア.ペンローズ型擬似逆行列 A' (f, m) ⁺を分離行列 W (f, m)として生成する（ステップ S71)。これは、 N個の代表ベクトル a (f)の中の 0個以上の当該代表べタトルを 0ベクトルに置換した M行 N列の行列のムーア'ペンローズ型擬似逆行列である N行 M列の分離行列 W(f, m)に相当する。

[0165] 生成された分離行列 W (f， m)は、一時記憶部 522に格納される。分離信号生成部

519は、この分離行列 W (f, m)と、観測信号ベクトル X (f， m)と一時記憶部 522から読み込み、 Y (f, m) =W (f, m) X (f, m)として分離信号成分 Y (f， m) , ···, Υ (f,

1 Ν m)を生成し、一時記憶部 522に格納する（ステップ S58)。なお、このように生成された分離信号成分 Y (f

1 ， m)， .··， Y (f, m)のうち N— M個の要素は必ず 0になる。す

N

なわち、ある離散時間 mのみについてステップ S61 S71の処理を行っただけでは、最大 M個の分離信号成分しか知ることができない。そのため、本形態では、これまで説明した M個の代表ベクトル a (f)の選択、行列 A' (f,m)の生成、分離行列 W (f, i

m)の算出、分離信号ベクトル Y (f, m)の算出、及び時間領域の信号値 y (t) ,…， y

1

(t)への変換の処理を、離散時間 mごとに行う。これにより、すべの分離信号成分を

N

失口ること力 sできる。

[0166] <本形態の効果 >

[N >Mでのブラインド信号分離]

以上説明した通り本形態では、センサ数が少ない（N >M)状況でも、源信号がスパース性を備えていればブラインド信号分離が達成できる。その結果、センサの数を低減でき装置のコスト低減にも貢献できる。

[正規化の効果]

図 18— 23は、正規化部 512aaで行われた正規化の効果を例示したプロットである。これらの例は、残響時間 130msの部屋で 1つ或いは 2つの音声を 2つのマイクで観測した場合の 2773Hzにおける観測信号べクトノレ X (f, m)のプロットである。なお、これらは 2個のマイクで観測した例であるが、観測信号ベクトル X (f, m)は周波数領域における複素ベクトルであるため、実数では 4次元空間でのベクトルとなる。そのため、図 4一 9ではその 4次元を 4つの 2次元空間に射影して表示した。なお、これらの図の「imag」は各観測信号の虚数項を示し、「real」は実数項を示す。また、 Xは第 1のマイクで観測された観測信号に係るデータを示し、 Xは第 2のマイクで観測された観

2

測信号に係るデータを示している。

[0167] まず、 1音源の場合における正規化の効果を図 18— 20に示す。

図 18は、正規化していない観測信号ベクトル X (f, m)のプロットである。この例では、原点を中心にクラスタが形成されているが、そのクラスタから源信号 1に関する代表ベクトル a (f)についで有益な情報は得られない。一方、図 19は、式（36)により正規化した観測信号ベクトル X (f, m)のプロットである。この例では、原点からある特定の方向にサンプルが散布されている。この方向が推定すべき代表ベクトル a (f)に対応

1 する。これは代表ベクトル a (f)を決定するうえでの有益な情報となる。また、図 20は、式（37)により正規化した観測信号ベクトル X (f, m)のプロットである。この例では、原点から離れた箇所にクラスタが形成されている。このクラスタの中心と原点を結ぶベクトルが推定すべき代表ベクトル a (f)に対応する。

[0168] 次に、 2音源の場合における正規化の効果を図 21— 23に示す。

図 21は、正規化していない観測信号べクトノレ X (f， m)のプロットである。この例の場合も、 1音源の場合と同様に、 2つの源信号に関して有益な情報は得られない。図 22 は、式（36)により正規化した観測信号ベクトル X (f, m)のプロットである。この例の場合、原点から 2つの方向にサンプルが散布している。そして、これら方向が推定すベき代表ベクトル a (f) , a (f)に対応する。図 23は、式 (37)により正規化した観測信号

1 2 ベクトル X (f, m)のプロットである。この例では、原点から離れた箇所に 2個のクラスタを形成されていることがわかる。そして、このクラスタの中心と原点を結ぶベクトルが推定すべき代表ベクトル a (f) , a (f)に対応する。

[0169] [近似解法を用いた分解行列生成の効果]

前述したように、 ^^ > 1^の場合の分離行列， m)の生成において最小化を厳密に行った場合、その計算量は膨大なものとなってしまう。例えば、 N個の代表べクトノレ a (f) ,…， a (f)から M個を選択する組合せは C 個あるため、厳密に Lノルム（式（

46) )を極小化する組合せをみつけようとすれば、 C 個の組についての並び替えの処理等が必要となる。しかし、図 17に示した近似解法では、センサの数 Mに相当する回数のループを繰り返せばよぐ計算量は少なく済む。

[0170] なお、本形態では、センサの数が信号源の数に対して十分であるか否力、、すなわち N≤Mであるか否かによって、分離行列 W (f， m)の生成手順を相違させることとした。しかし、センサの数が信号源の数に対して十分であるか否かに係わらず同じルーチンを用いて分離行列 W (f , m)を生成することとしてもよレ、。

図 24は、このような例を説明するためのフローチャートである。

この変形例の場合、 N≤Mであるか否かに係わらず、まず、列選択部 516が、一時記憶部 522から推定混合行列 A (f)及び観測信号ベクトル X (f， m)を読み込み (ステップ S81)、残差ベクトル eを観測信号ベクトル X (f， m)で初期化し、変数 kに 1を代入する（ステップ S82)。そして、列選択部 516が、 k≤min (M, N)であるか否かを判断し（ステップ S83)、 k≤min (M, N)であれば、 | a (f) ^H' e | /■ a (f) ■ (¾ま α の共役転置行列）を最大にする列 a (f)を選択し (ステップ S84)、選択済みのすべての列 a (u= l，…， k)によって張られる部分空間を示す行列 Q = [a (f ) , ·■· , a (f) ]を設定し (ステップ S85)、 P = Q (Q^HQ)— Q¹¹を算出し (ステップ S86)、 X (f， m) -P -X (f, m)の演算結果によって残差ベクトル eを更新し (ステップ S87)、変数 k に 1を加えた値を新たな kとして (ステップ S88)、ステップ S83に戻る。すなわち、ステップ S83 88の処理を min (M， N)回繰り返す。なお、 min (M, N)とは、 M及び N の何れか小さい方の値を意味し、 max (N_M， 0)とは、 N—M及び 0の何れか大きレヽ方の値を意味する。 [0171] その後、列選択部 516は、これまで選択した min (M, N)個の代表ベクトル a を一 q (i) 時記憶部 522に格納する。

次に、行列生成部 517は、一時記憶部 522からこれら min (M, N)個の代表べタトノレ a を読み込み、

q (i)

[数 50] a_i-(f,_m) J^{ai (f)} i e {_q(l),...,_q(mi_n(M,_N))} …

[0 i {q(l),...,q(min(M,N))} とレヽぅ歹 [Jベクトノレ _a ' (f， m)を生成し (ステップ S89)、ステップ S83 88で選択された

i

min (M, N)個の代表ベクトル a (f)と、 max (N_M, 0)個の 0ベクトルとを列とした行列 A， (f, m) = [a ， (f, m) , ···, a ， (f, m) ]を生成する（ステップ S90)。このように生

1 N

成された行列 A' (f， m)は一時記憶部 522に格納された後、分離行列生成部 518に読み込まれ、分離行列生成部 518は、そのムーア'ペンローズ型擬似逆行列 A (f, m ) + (M = Nの場合は逆行列W—¹にー致)を分離行列 W (f, m)として生成する (ステツプ S91)。なお、これは N個の上記代表ベクトル a (f)の中の 0個以上の当該代表べクトルを 0ベクトルに置換した M行 N列の行列のムーア.ペンローズ型擬似逆行列である N行 M列の分離行列 W (f, m)に相当する。

[0172] 〔変形例等〕

なお、本発明は上述の各実施の形態に限定されるものではない。例えば、第 1の実施の形態から第 8の実施の形態では、抽出信号を時間領域に戻してから統合を行うこととしていたが、ノイナリマスクを用いる場合には、周波数領域で信号統合を行って力時間領域に変換してもよい。

図 25は、周波数領域で信号統合を行って力も時間領域に変換する際の構成を例示したブロック図の一部である。この図の構成は、図 1における限定信号分離部 60— k、時間領域変換部 70— k及び信号統合部 80の換わりに設けられる構成である。

[0173] この例では、すべての系列 1の限定信号分離部 601-kから出力された周波数領域の信号値 Y ^nkq (f， m)について、信号統合部 602が周波数領域にて信号の統合を行った後に、時間領域変換部 603が時間領域へ変換する。ここで、信号統合部 602 は、ある周波数 fにおいて、同じタグ aを持つ分離信号 Y ^nkq (f, m)がーつしかない

i kq 場合、

Y (f, m) =Y ^nkq (f

i kq ，m)

として分離信号値を求める。また、ある周波数 fにおいて、同じタグ ^を持つ分離信号

Y ^nkq (f, m)が二つ以上ある場合、 Y (f, m)は、例えば同じタグ aを持つ分離信号 kq 1 1

Y ^nkq (f, m)の平均として

[数 51]

）

(Kは同じタグ aを持つ分離信号の個数）

として求められる。

[0174] そして最後に、時間領域変換部 603が、例えば短時間逆フーリエ変換などにより、周波数領域で統合された出力信号値 Y (f

1 ， m)を時間領域 y (t)に変換する。

1

また、第 1の実施の形態から第 8の実施の形態では、各分離信号にタグを付与して信号の統合処理を行うこととしたが、各分離信号にタグを付けるのではなぐ各系統 k において分離される信号に対応する V個の代表値の集合 Gを一時記憶部 90に保持

k

しておき、出力信号の統合を行うこととしてもよい。

[0175] 具体的には、例えば、複数の系統において Gが同じ代表値を含むことがない場合

k

は、すべての分離信号 y (t)を最終的な分離信号 y (t) (i= l，…， N)として出力す

kq i

る。また周波数領域におけるすべての分離信号 Y (f, m)を周波数領域における最

kq

終的な分離信号 Y (f， m) (i= l , ..., Ν)とし、時間領域の信号に変換しても良い。

[0176] また、複数の系統において Gが同じ代表値を Κ個（Κ≥ 2)含む場合は、 k系統の分

k

離信号 y (t) (q= l , ..., V /Vは Gの個数)と k'系統の分離信号 y (t) (r= l , kq k k k k' r

..·, V )についてのすべての組合せで信号の相関を計算し、相関の高いもの K個に k'

ついて y (t)と y (t)の平均をとる。これを、同じ代表値を含む複数の系統について kq k'r

繰り返し、信号を統合する。また、同じ操作を周波数領域におけるすべての分離信号について行うことで、周波数領域で信号を統合し、その後で時間領域の信号に変換してもよい。

[0177] さらに、上述の第 1から第 9の各実施の形態を複合したシステムによって信号分離を行ってもよい。

例えば、 [第 8の実施の形態]の方法で代表ベクトルを求め、その後 [第 2の実施の形態」の方法で限定信号を分離することとしてもよい。具体的には、例えば、代表値計算部 430 (図 13)で求めた代表ベクトルを用レ、、 [第 2の実施の形態]における（18 )式のかわりに

[数 52]

M_k(f m) = I^{1 D}(X(f，^m)，^ak(f)) < min_k≠j D(X(f ,m),_aj(f ))

' [0 otherwise

として M _k ( f , m) を、

il max_{a ({)eG} D(X(f , m), a_D (f )) < min "、 _c D(X(f,m),a。（f)) M_DC(f,m) = ^ ^{ap(f)eGk p }> f})^e 、い ^{h q K )}} θ otherwise として M (f , m)を求め（M (f， m)， M (f， m)は、図 8参照。）、あとは [第 2の実

DC k DC

施の形態]の限定信号分離部 160 - kと同じ手順で限定信号を分離する。

二で、上述の M (f, m) , M (f, m)を求めず、直接

k DC

[数 53]

_{) =} jX(f,m) D(X(f，m),a_k(f)) < min_k≠j D(X(f,m),aj(f))

' 0 otherwise にて Xk(f,m) = M_kX (マスク作成部 1 5 1—k及び積演算部 1 6 1 — k (図 8 ) の処理に対応）を求め、

max _(f)eGk D(X(f,m),a_p(f)) < min D(X(f,m),a_q(f))

Xk(f,m) = ^p 。り s _k

otherwise にて限定信号値を生成してもよレ、（マスク作成部 151-k及び限定信号抽出部 152— k (図 8)の処理に対応）。

また、マスク作成部 151— k (図 8)にて M (f, m)を作成せず、かわりに、混合過程 k

推定部 162— k (図 8)にて、代表値計算部 430 (図 13)にて求めた代表ベクトル [a ,

1

…， a ] (aは縦ベクトル）をまとめて Hとし、これを推定混合行列としてもよい。

N 1

また、上述の各実施の形態ではフーリエ変換 Z逆フーリエ変換によって時間領域一周波数領域間の変換を行うこととした力 wavelet変換、 DFTフィルタバンク、ポリフヱィズフィルタバンクなどを用レ、、この変換を行うこととしてもよい（例えば、「R. E.

Crochiere, L. R. RaDiner, Multirate Digital Signal Processing. Eaglewood Cliffs, NJ: Printice- Hall, 1983 (ISBN 0-13-605162-6) )。

[0179] また、上述の第 1から第 9の各実施の形態をコンピュータで構成する場合は以下のようになる。

図 26は、各実施の形態をコンピュータで構成した信号分離装置 610の例である。この例の信号分離装置 610は、 CPU (Central processing Unit：中央処理装置） 62 0、 RAM (Random Access Memory) 630、 ROM (Read Only Memory) 640、外部記憶装置 650、入力部 660、インタフェース 670及びバス 680を有している。

[0180] CPU620は、例えば、演算部 621、制御部 622及びレジスタ 623を有する CISC (Complex Instruction ¾et Computer)方式、 RISし (Reduced Instruction ¾et

Computer)方式等の中央処理装置である。また、レジスタ 623は、例えば DRAM ( Dynamic Random Access Memory)、 SR^ (Static Random Access Memoryノ等の動作が高速なメモリである。

また、 RAM630は、例えば、 DRAM, SRAM,フラッシュメモリ、 NV (Nonvolatile) RAM等の読書き可能な半導体メモリである。また ROM640は、例えば、 MROM ( Mask Read Only Memory)等の読み出し専用の半導体メモリであり、各種プログラムやデータ等が記憶されてレ、る。

[0181] 外部記憶装置 650は、例えば、ハードディスク装置、フレキシブルディスク、磁気テープ等の磁気記録装置、 DVD-RAM (Random Access Memory)、 CD_R ( Recordable) /RW (Rewritable)等の光ディスク装置、 MO (Magneto-Optical disc) 等の光磁気記録装置、 EEP-ROM (Electronically Erasable and

Programmable-Read Only Memory)、フラッシュメモリ (flash memory)等の半導体メモリ等である。

また、入力部 660は、例えば、キーボード、マウス、ジョイスティック等の入力デバィスである。また、インタフェースは、例えば、データの入力、出力、或いはその双方を行う入力 Z出力ポートであり、例えば、センサ、通信ボード、記憶装置等の各種装置が接続可能となっている。 [0182] さらに、ノくス 680は、例えば、データバス、アドレスバス、コントロールバス等によって構成され、 CPU620、 RAM630、 ROM640、外部記憶装置 650、入力部 660及びインタフェース 670でのデータのやり取りが可能なようにこれらを電気的に接続する。また、信号分離装置 610における処理の内容は、例えば、信号分離プログラムに記述され、このような信号分離プログラムは、例えば、コンピュータで読み取り可能な記録媒体に記録される。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、 DVD (Digital Versatile Disc)、 DVD-RA M (Random Access Memory)、 CD— OM (Compact Disc Read unly Memory)、し D _R (Recordable) /RW (Rewritable)等を、光磁気記録媒体として、 MO (

Magneto-Optical disc)等を、半導体メモリとして EEP—ROM (Electronically Erasable and Programmable-Read Only Memory)等を用レヽること； 0、できる。

[0183] また、この信号分離プログラムの流通は、例えば、そのプログラムを記録した DVD、

CD— ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに

、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよレ、。

信号分離装置 610において処理を実行する場合、例えばまず、可搬型記録媒体に記録された信号分離プログラムもしくはサーバコンピュータから転送された信号分離プログラムを、外部記憶装置 650のプログラム領域 651にダウンロードする。

[0184] また、各センサにおいて観測された時間領域の各観測信号 X (t) (j = l,…， M)も、

J

事前に外部記憶装置 650のデータ領域 652に格納される。この各観測信号 X (t)の

J

格納は、センサから送られた各観測信号 X (t)をインタフェース 670に入力し、バス 68

J

0を通じて外部記憶装置 650に格納することとしてもよぐ事前に別の装置で各観測信号 X (t)を外部記憶装置 650に格納しておき、この外部記憶装置 650をバス 680

J

に接続する構成としてもょレヽ。

次に、例えば、 CPU620の制御部 622の制御のもと、外部記憶装置 650のプログラム領域 651から信号分離プログラムが順次読み出され、 RAM630のプログラム領域 631に格納される。 RAM630に格納された信号分離プログラムは、 CPU620に読み込まれ、 CPU620の制御部 622は、この信号分離プログラムの内容に従い、データの入出力、演算部 621での演算、レジスタ 623へのデータ格納等の各処理を実行する。

[0185] CPU620による処理が開始されると、 CPU620は、例えば外部記憶装置 650のデータ領域 652の各観測信号 X (t)を読み出し、例えば RAM630のデータ領域 632に

J

書き込む。その後 CPU620は、制御部 622の制御のもと、 RAM630のプログラム領域 631の信号分離プログラム、及びデータ領域 632の信号分離プログラムを順次抽出しつつ、上述の各処理を実行する。なお、例えば RAM630或いは外部記憶装置 650力第 1から第 9の実施の形態における記憶部 2, 501として機能し、 RAM630 或いはレジスタ 623が、第 1から第 9の実施の形態における一次記憶部 90, 522として機能する。

[0186] また、このプログラムの別の実行形態として、 CPU620が可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよぐさらに、この CPU620にサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンビュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆる ASP (Application Service Provider) 型のサービスによって、上述の処理を実行する構成としてもよい。

[0187] さらに、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよレ、。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはレ、うまでもない。

産業上の利用可能性

[0188] 本発明により、例えば、様々なノイズ ·妨害信号が存在する環境下においても、目的信号を精度よく分離抽出することが可能となる。例えば、オーディオ分野に応用した場合、音声認識機の入力マイクロホンと話者が離れた位置にあり、マイクロホンが目的話者音声以外の音まで集音してしまうような状況でも、目的音声を分離抽出することにより、認識率の高い音声認識系を構築することができる。

Claims

請求の範囲

[1] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離方法であって、

前記センサにおいて観測された観測信号値を周波数領域の信号値に変換する手順と、

前記周波数領域の信号値を用い、前記センサ間における観測値の相対値 (相対値の写像も含む）を、各周波数において算出する手順と、

前記相対値を N個のクラスにクラスタリングする手順と、

前記の各クラスの代表値を算出する手順と、

前記代表値を用い、前記周波数領域の信号値から、 V (2≤V≤M)個の信号源から発せられた信号力成る混合信号の値を抽出するためのマスクを作成する手順と、前記マスクを用い、前記周波数領域の信号値から前記混合信号の値を抽出する手順と、

前記混合信号の値から V個の信号の値を分離抽出する手順と、

を有することを特徴とする信号分離方法。

[2] 請求項 1記載の信号分離方法であって、

前記マスクは、

V個の前記代表値を含む所定の範囲内にある前記相対値に対してハイレベル値をとり、前記所定の範囲内にない前記代表値に対してローレベル値をとる関数であり、前記マスクを用い、前記周波数領域の信号値力前記混合信号の値を抽出する手順は、

前記周波数領域の信号値に前記マスクを乗じる手順である、

ことを特徴とする信号分離方法。

[3] 請求項 1記載の信号分離方法であって、

前記マスクは、

V個の前記代表値を含む所定の範囲内にある前記相対値に対してローレベル値をとり、前記所定の範囲内にない前記代表値に対してハイレベル値をとる関数であり、前記マスクを用い、前記周波数領域の信号値から前記混合信号の値を抽出する手順は、

前記周波数領域の信号値に前記マスクを乗じた値を、前記周波数領域の信号の値力減算する手順である、

ことを特徴とする信号分離方法。

[4] 請求項 2記載の信号分離方法であって、

前記マスクは、

前記相対値の変化に伴う前記ハイレベル値から前記ローレベル値への推移が連続的な関数である、

ことを特徴とする信号分離方法。

[5] 請求項 1記載の信号分離方法であって、

前記代表値を用い、前記周波数領域の信号値から、 V(2≤V≤M)個の信号源から発せられた信号力成る混合信号の値を抽出するためのマスクを作成する手順は死角型ビームフォーマ (NBF)の指向特性を利用して前記マスクを作成する手順でめる、

ことを特徴とする信号分離装置。

[6] 請求項 1記載の信号分離方法であって、

前記代表値を用い、前記周波数領域の信号値から、 V(2≤V≤M)個の信号源から発せられた信号力成る混合信号の値を抽出するためのマスクを作成する手順は fを周波数の変数とし、 Θ を V個の前記代表値に対応する信号源の推定方向の何れか 1つとし、 Θ (i = 2， ..., N— V+1)を前記 V個の代表値以外の前記代表値に対応する各信号源の推定方向とし、 j = l，…， N-V+1とし、 dをセンサ 1とセンサ jとの

j

距離とし、 Vを信号の速さとし、 τ = (d/v)cos 0 とした場合における、 ji要素が exp

(j2 π f τ )である（N—V+ 1) (N—V+ 1)の遅延行列 Η (f)を生成する手順と、 ji NBF

遅延行列 H (f)の逆行列 W(f) =H ¹ (f)を NBF行列 W(f)として算出する手

NBF NBF

順と、

前記 NBF行列 W(f)の 1行目の要素を W (f)とし、 Θを信号の到来方向の変数とした場合における、指向特性関数

[数 54]

N-V+I

F(f, θ) = ∑ W_lk (f) exp(j2nfd_k cos Θ I v)

k=l を生成する手順と、

前記指向特性関数 F (f, Θ )を用いて前記マスクを生成する手順と、

を具備することを特徴とする信号分離方法。

[7] 請求項 1記載の信号分離方法であって、

前記代表値を用い、前記周波数領域の信号値から、 V (2≤V≤M)個の信号源から発せられた信号力成る混合信号の値を抽出するためのマスクを作成する手順は

V個の前記代表値を含む所定の範囲内にある前記相対値に対してハイレベル値をとり、前記所定の範囲内にない前記代表値に対してローレベル値をとり、相対値の変化に伴う当該ハイレベル値から当該ローレベル値への推移が不連続な関数であるバイナリマスクに単峰性関数を畳み込んだ関数を生成する手順と、

前記バイナリマスクに単峰性関数を畳み込んだ関数に前記相対値を代入した関数を前記マスクとして生成する手順と、

を具備することを特徴とする信号分離方法。

[8] 請求項 1記載の信号分離方法であって、

前記代表値を用い、前記周波数領域の信号値から、 V (2≤V≤M)個の信号源から発せられた信号力成る混合信号の値を抽出するためのマスクを作成する手順は前記相対値が V個の前記代表値を含む所定の範囲内の下限値 a である場合に 0

mm

をとる第 1の奇関数と、前記相対値が前記所定の範囲内の上限値 a である場合に

max

0をとる第 2の奇関数との差の写像から得られる単峰性の関数を、前記マスクとして生成する手順である、

ことを特徴とする信号分離方法。

[9] 請求項 2或いは 3に記載の信号分離方法であって、前記マスクは、

前記ハイレベル値から前記ローレベル値への推移が不連続な関数である、ことを特徴とする信号分離方法。

[10] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離方法であって、

前記周波数領域の信号値を用い、前記センサ間における観測値の相対値 (相対値の写像も含む）を各周波数において算出する手順と、

前記相対値を N個のクラスにクラスタリングする手順と、

前記の各クラスの代表値を算出する手順と、

1個の前記代表値を含む所定の範囲内にある前記相対値に対してハイレベル値をとり、前記所定の範囲内にない前記代表値に対してローレベル値をとり、前記相対値の変化に伴う当該ハイレベル値から当該ローレベル値への推移が連続的な関数であるマスクを作成する手順と、

前記周波数領域の信号値に前記マスクを乗じ、 1個の信号源から発せられた信号の値を抽出する手順と、

を有することを特徴とする信号分離方法。

[11] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離方法であって、

前記センサにおいて観測された観測信号値 X (t)， · 波数領域の信

1 · ·， X (t)を周

M

号値 X (f, m)， . . .， X (f， m)に変換する手順と、

1 M

前記周波数領域の信号値 X (f， m)， . . .， X (f， m)からなる第 1のベクトル X (f，

1 M

m) = [X (f， m)， . . .， X (f, m) ]を、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i

1 , . . .， N)にクラスタリングする手順と、

前記各クラスタ C (f)を代表する第 2のベクトル a (f)を算出する手順と、前記第 2のベクトル a (f)から V (1≤V≤M)個の第 3のベクトル a (f) (p= l , . . . , i Ρ

V)を抽出する手順と、前記第 3のベクトル a (f)の集合を Gとし、 G ¾Gの補集合とし、 D ( α， β)をべク

p k k k

トル αととのマハラノビス平方距離とした場合における、

[数 55]

、 I¹ max _(f)eGkD(X(f,m),_ap(f》<mi_n D(X(f,m),a_q(f))

[0 otherwise で示されるマスク M(f， m)を生成する手順と、

前記マスク M(f, m)と前記第 1のベクトル X(f, m)との積を演算し、 V個の前記信号源から発せられた信号の値を抽出する手順と、

を有することを特徴とする信号分離方法。

[12] N(N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離方法であって、

前記センサにおいて観測された観測信号値 X (t)， · 周波数領域の信

1 · ·， X (t)を

M

号値 X (f, m)， · · ·， X (f， m)に変換する手順と、

1 M

前記周波数領域の信号値 X (f， m)， · · ·， X (f， m)からなる第 1のベクトル X(f，

1 M

m) = [X (f, m), . · · , X (f, m)]を、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i

1, · . · , N)にクラスタリングする手順と、

前記各クラスタ〇i(f)を代表する第 2のベクトル ( を算出する手順と、前記第 2のベクトル a (f)から V(1≤V≤M)個の第 3のベクトル a (f) (p=l, ... , i Ρ

V)を抽出する手順と、

前記第 1のベクトル X(f, m)に対し、前記第 3のベクトル a (f )の集合を Gとし、 G ^c p k k を Gの補集合とし、 D (ひ， β)をべクトノレ _αと βとのマハラノビス平方距離とした場合 k

における、

[数 56] max_ap(f)eGk D(X(f,m),a_p(f))<min_ati(f)eGC D(X(f,m),a_q(f)) を満たすか否かを判断し、満たすと判断した前記第 1のベクトル X(f, m)を、 V個の前記信号源から発せられた信号の値として抽出する手順と、

を有することを特徴とする信号分離方法。 [13] 請求項 11或いは 12記載の信号分離方法であって、

前記クラスタリングする手順は、

[数 57]

. " 、、

S^lgn(Xj^(f，^m))

を算出し、

. . JX(f₅m)/sign(X_j(f,m)) (|Xj(f,m)|_≠0)

(，^m) †x(f,m) (|Xj(f,m)|=0) の演算を行った後に行われる、

ことを特徴とする信号分離方法。

[14] 請求項 13記載の信号分離方法であって、

前記クラスタリングする手順は、前記の

[数 58]

を演算を行った後、さらに

fX(f₅m)/||X(f,m)|| (||X(f,m)||≠0)

(t,m) <

X(f,m) (||X(f,m)||=0) (ただし、 II X(f ,m) IIは X(f，m)のノルム）の演算を行った後に行われる、

ことを特徴とする信号分離方法。

[15] N(N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離方法であって、

前記センサにおいて観測された観測信号値 X (t)， . . . (t)を、周波数領域の

1 ， X

M

信号値 X (f, m)， ...

1 ， X (f

M ， m)に変換する手順と、

前記周波数領域の信号値 X (f， m)， ...， X (f， m)からなる第 1のベクトル X(f

1 M ， m) = [X (f, m), . · · , X (f, m)]^Tを、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i 1 ,…， Ν)にクラスタリングする手順と、

前記各クラスタ〇i (f)を代表する第 2のベクトル ( を算出する手順と、

N個の前記第 2のベクトル a^f)の中の 0個以上の当該第 2のベクトルを 0ベクトルに置換した M行 N列の行列のムーア.ペンローズ型擬似逆行列である N行 M列の分離行列 W(f, m)を算出する手順と、

Y (f, m) =W (f, m) X (f, m)の演算により、分離信号ベクトル Y (f, m) = [Y (f, m)， . . .， Y (f, m) ]^Tを算出する手順と、

N

を有することを特徴とする信号分離方法。

[16] 請求項 15記載の信号分離方法であって、

前記分離行列 W (f, m)を算出する手順は、

min (M, N)個の前記第 2のベクトル a (f)を選択し、選択した min (M, N)個の前記第 2のベクトル a (f)と max (N—M, 0)個の 0ベクトルとを列とした行列 A' (f, m)を生成し、前記行列 A' (f, m)のムーア'ペンローズ型擬似逆行列を前記分離行列 W ( f, m)として算出する手順である、

ことを特徴とする信号分離方法。

[17] 請求項 15記載の信号分離方法であって、

N >Mである場合における前記分離行列 W (f， m)を算出する手順は、離散時間 mごとに、 M個の前記第 2のベクトル a (f)を選択し、前記選択した M個の前記第 2のベクトル a (f)と N— M個の 0ベクトルとを列とした行列 A' (f, m)を生成し、前記行列 A' (f, m)のムーア'ペンローズ型擬似逆行列を、時間依存の前記分離行列 W(f, m)として算出する手順であり、

N≤Mである場合における前記分離行列 W (f， m)を算出する手順は、前記各クラスタ C (f)の N個の前記第 2のベクトル a (f)力、らなる行列のムーア'ペンローズ型擬似逆行列を、時不変の前記分離行列 W (f， m)として算出する手順であることを特徴とする信号分離方法。

[18] 請求項 15記載の信号分離方法であって、

前記クラスタリングする手順は、 [数 59]

. _{/v f} 、、 JX_j(f₅m)/|X_j(f,m)| (|Xj(f，m)|_≠0)

^Slgn(Xj^(f，^m))<" o (|X_j(f,m)|=0)

を算出し、

iX(f,m)/sign(X_j(f,m)) (|Xj(f,m)|≠0)

( ，^m) †x(f,m) (|Xj(f,m)|=0) の演算を行った後に行われる、

ことを特徴とする信号分離方法。

[19] 請求項 18記載の信号分離方法であって、

前記クラスタリングする手順は、前記の

[数 60] (f,m)/_Sig_n(Xj(f,m))

( ）、 †x(f,m) ,_m)|=0)

を演算を行った後、さらに

_Y , iX(f,m)/||X(f,m)|| (||X(f,m)||≠0)

[X(f₅m) (||X(f,m)||=0)

(ただし、 II X(f , m) 11は X(f， m)のノルム）の演算を行った後に行われる、

ことを特徴とする信号分離方法。

[20] 請求項 16記載の信号分離方法であって、

前記 min(M, N)個の前記第 2のベクトル a (f)を選択する手順は、

1

第 4のベクトル _eを前記第 1のベクトル X(f, m)で初期化した後、 a (ί) / ' a (f) ■ q (u) q (u) と前記第 4のベクトル eの内積の絶対値を最大化する前記第 2のベクトル a (f)を選

q(u

択し、選択済みのすべての前記第 2のべクトノレ a (u=l, · · . , k)によって張られ

q(u)

る部分空間を示す行列 Q= [a (f)， · · ·， a (f)]を設定し、 P = Q(Q^HQ)^_1Q^H q(l) q(k)

を算出し、 e = X(f， m)_P'X(f， m)の演算結果によって第 4のベクトル eを更新する処理を min(M, N)回繰り返す手順である、ことを特徴とする信号分離方法。

[21] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離装置であって、

前記センサにおいて観測された観測信号値を格納する記憶部と、

前記記憶部に接続され、

前記観測信号値を周波数領域の信号値に変換し、

前記周波数領域の信号値を用い、前記センサ間における観測値の相対値 (相対値の写像も含む）を、各周波数において算出し、

前記相対値を N個のクラスにクラスタリングし、

前記の各クラスの代表値を算出し、

前記代表値を用い、前記周波数領域の信号値から、 V (2≤V≤M)個の信号源から発せられた信号力成る混合信号の値を抽出するためのマスクを作成し、前記マスクを用い、前記周波数領域の信号値から前記混合信号の値を抽出し、前記混合信号の値から V個の信号の値を分離抽出する、処理を実行するプロセッサと、

を有することを特徴とする信号分離装置。

[22] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離装置であって、

前記記憶部に接続され、

前記観測信号値を周波数領域の信号値に変換し、

前記周波数領域の信号値を用い、センサ間における観測値の相対値 (相対値の写像も含む）を各周波数において算出し、

前記相対値を N個のクラスにクラスタリングし、

前記の各クラスの代表値を算出し、

1個の前記代表値を含む所定の範囲内にある前記相対値に対してハイレベル値をとり、前記所定の範囲内にない前記代表値に対してローレベル値をとり、前記相対値の変化に伴う当該ハイレベル値から当該ローレベル値への推移が連続的な関数であるマスクを作成し、

前記周波数領域の信号値に前記マスクを乗じ、 1個の信号源から発せられた信号の値を抽出する、処理を実行するプロセッサと、

を有することを特徴とする信号分離装置。

[23] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離装置であって、

前記センサにおいて観測された観測信号値 X (t)， . . .， X (t)を格納する記憶部

1 M

と、

前記記憶部に接続され、

前記観測信号値 X (t) , . . . , X (t)を周波数領域の信号値 X (f, m) , . . .， X (

1 M 1 M ί, m)に変換し、

1 M

m) = [X (f, m) , . · · , X (f, m) ]を、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i

1 , · · · , N)にクラスタリングし、

前記各クラスタ C (f)を代表する第 2のベクトル a (f)を算出し、前記第 2のベクトル a

(f)から V ( 1≤V≤M)個の第 3のベクトル a (f) (p = l , · · · , V)を抽出し、

Ρ

前記第 3のベクトル a (f)の集合を Gとし、 G ¾Gの補集合とし、 D ( a , β )をべク

p k k k

トル αととのマハラノビス平方距離とした場合における、

[数 61]

_{M(f m)} = j^{1 max}a_p(f).G_k D(X(f,m),a_p(f)) < min_{aq (f)eG}, D(X(f₎m),a_q(f))

[0 otherwise で示されるマスク M (f， m)を生成し、

前記マスク M (f, m)と前記第 1のベクトル X (f, m)との積を演算し、 V個の前記信号源から発せられた信号の値を抽出する、処理を実行するプロセッサと、

を有することを特徴とする信号分離装置。

[24] N (N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離装置であって、

1 M と、

前記記憶部に接続され、

前記観測信号値 X (t), .. ·， X (t)を周波数領域の信号値 X (f, m), · · ·， X (

1 M 1 M ί, m)に変換し、

前記周波数領域の信号値 X (f， m)， ...， X (f， m)からなる第 1のベクトル X(f，

1 M

m) = [X (f， m)， ...， X (f, m)]を、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i

1, ...， N)にクラスタリングし、

前記各クラスタ C (f)を代表する第 2のベクトル a (f)を算出し、

前記第 2のベクトル a (f)から V(1≤V≤M)個の第 3のベクトル a (f) (p=l, ... , i Ρ

V)を抽出し、

における、

[数 62]

max_ap(f)eGk D(X(f,m),_ap(f))<min_aq(f)eGC D(X(f,m),a_q(f)) を満たすか否かを判断し、満たすと判断した前記第 1のベクトル X(f, m)を、 V個の前記信号源から発せられた信号の値として抽出する、処理を実行するプロセッサと、を有することを特徴とする信号分離装置。

[25] N(N≥2)個の信号が混合し、 M個のセンサで観測された状況において信号の分離抽出を行う信号分離装置であって、

1 M

と、

前記記憶部に接続され、

前記観測信号値 X (t) , · · ·， X (t)を、周波数領域の信号値 X (f, m), ... , X

1 M 1

(f， m)に変換し、

M

1 M

m) = [X (f, m), . · · , X (f, m)]^Tを、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i 1 ,…， N)

前記各クラスタ〇i (f)を代表する第 2のベクトル a^f)を算出し、

N個の前記第 2のベクトル a (f)の中の 0個以上の当該第 2のベクトルを 0ベクトルに置換した M行 N列の行列のムーア.ペンローズ型擬似逆行列である N行 M列の分離行列 W(f, m)を算出し、

Y (f, m) =W (f, m) X (f, m)の演算により、分離信号ベクトル Y (f, m) = [Y (f, m)， . . .， Y (f, m) ]^Tを算出する、処理を実行するプロセッサと、

N

を有することを特徴とする信号分離装置。

[26] M個のセンサで観測された N (N≥ 2)個の信号の混合である観測信号の値を周波数領域の信号値に変換する手順と、

前記相対値を N個のクラスにクラスタリングする手順と、

前記の各クラスの代表値を算出する手順と、

前記混合信号の値から、 V個の信号の値を分離抽出する手順と、

をコンピュータに実行させるための信号分離プログラム。

[27] M個のセンサで観測された N (N≥ 2)個の信号の混合である観測信号の値を周波数領域の信号値に変換する手順と、

前記周波数領域の信号値を用い、センサ間における観測値の相対値 (相対値の写像も含む)を各周波数において算出する手順と、

前記相対値を N個のクラスにクラスタリングする手順と、

前記の各クラスの代表値を算出する手順と、

をコンピュータに実行させるための信号分離プログラム。

[28] M個のセンサで観測された N (N≥ 2)個の信号の混合である観測信号の値 X (t)，

. . . , X (t)を周波数領域の信号値 X (f， m)， . . .， X (f， m)に変換する手順と、

M 1 M

1 M

1 M i

1 ,…， N)にクラスタリングする手順と、

V)を抽出する手順と、

前記第 3のベクトル a (f)の集合を Gとし、 G ¾Gの補集合とし、 D ( α， β )をべク

p k k k

トル αととのマハラノビス平方距離とした場合における、

[数 63]

_M(f,_{m) =} ί^{1 max}a_p(f)_eGk D(X(f,m)₅a_p(f)) < min_aq(f)eG, D(X(f,m),a_q(f)) θ otherwise で示されるマスク M (f， m)を生成する手順と、

前記マスク M (f, m)と前記第 1のベクトル X (f, m)との積を演算し、 V個の前記信号源から発せられた信号の値を抽出する手順と、

をコンピュータに実行させるための信号分離プログラム。

[29] M個のセンサで観測された N (N≥ 2)個の信号の混合である観測信号の値 X (t) , • · ·， X (t)を周波数領域の信号値 X (f， m)， · · ·， X (f， m)に変換する手順と、

M 1 M

前記周波数領域の信号値 X (f， m)， · · ·， X (f， m)からなる第 1のベクトル X (f，

1 M

1 M i

1 ,…， N)にクラスタリングする手順と、

V)を抽出する手順と、

前記第 1のベクトル X (f, m)に対し、前記第 3のベクトル a (f )の集合を Gとし、 G ^c p k k を Gの補集合とし、 D (ひ， β )をべクトノレ _αと βとのマハラノビス平方距離とした場合 k

における、

[数 64] max_ap(f)eGk D(X(f,m),a_p(f)) <min_aci(f)^_c D(X(f,m),a_q(f)) を満たすか否かを判断し、満たすと判断した前記第 1のベクトル X (f, m)を、 V個の前記信号源から発せられた信号の値として抽出する手順と、

をコンピュータに実行させるための信号分離プログラム。

[30] M個のセンサで観測された N (N≥ 2)個の信号の混合である観測信号の値 X (t)，

. . . , X (t)を、周波数領域の信号値 X (f, m) , . . .， X (f, m)に変換する手順と

M 1 M 前記周波数領域の信号値 X (f， m)， . . .， X (f， m)からなる第 1のベクトル X (f，

1 M

m) = [X (f， m)， . . .， X (f, m) ]^Tを、周波数 fごとに N個ずつのクラスタ C (f) (i=

1 M i

1 ,…， N)にクラスタリングする手順と、

前記各クラスタ C (f)を代表する第 2のベクトル a (f)を算出する手順と、

N個の前記第 2のベクトル a (f)の中の 0個以上の当該第 2のベクトルを 0ベクトルに置換した M行 N列の行列のムーア.ペンローズ型擬似逆行列である N行 M列の分離行列 W(f, m)を算出する手順と、

Y (f, m) =W (f, m) X (f, m)の演算により、分離信号ベクトル Y (f, m) = [Y (f, m)， · · ·， Y (f, m) ]^Tを算出する手順と、

N

をコンピュータに実行させるための信号分離プログラム。

[31] 請求項 26から 30の何れかに記載の信号分離プログラムを格納したコンピュータ読み取り可能な記録媒体。