JP4676920B2 - Signal separation device, signal separation method, signal separation program, and recording medium - Google Patents
Signal separation device, signal separation method, signal separation program, and recording medium Download PDFInfo
- Publication number
- JP4676920B2 JP4676920B2 JP2006133728A JP2006133728A JP4676920B2 JP 4676920 B2 JP4676920 B2 JP 4676920B2 JP 2006133728 A JP2006133728 A JP 2006133728A JP 2006133728 A JP2006133728 A JP 2006133728A JP 4676920 B2 JP4676920 B2 JP 4676920B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- phase
- cluster
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、信号処理の技術分野に属し、特に複数の源信号が空間内で混合された混合信号から源信号を抽出する技術に関する。 The present invention belongs to the technical field of signal processing, and particularly relates to a technique for extracting a source signal from a mixed signal obtained by mixing a plurality of source signals in a space.
[ブラインド信号分離]
複数の源信号が混在した混合信号から、源信号を推定して分離する信号分離技術としてブラインド信号分離がある。まず、このブラインド信号分離の定式化を行う。すべての信号はあるサンプリング周波数fsでサンプリングされ、離散的に表現されるものとする。また、N個(N≧2)の信号が混合されてM個(M≧2)のセンサで観測されたとする。以下では、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより信号が反射して伝送路の歪みが発生しうる状況を扱う。このような状況で混合される信号は、信号源kからセンサq(qはセンサの番号を示す〔q=1,…,M〕。また、kは信号源の番号を示す〔k=1,…,N〕。)へのインパルス応答hqk(r)による畳み込み混合
Blind signal separation is a signal separation technique for estimating and separating a source signal from a mixed signal in which a plurality of source signals are mixed. First, this blind signal separation is formulated. All signals are sampled at a sampling frequency f s and expressed discretely. Further, it is assumed that N (N ≧ 2) signals are mixed and observed by M (M ≧ 2) sensors. The following deals with a situation where the signal is attenuated / delayed depending on the distance from the signal source to the sensor, and the signal may be reflected by a wall or the like to cause distortion in the transmission path. The signal mixed in such a situation is transmitted from the signal source k to the sensor q (q is a sensor number [q = 1,..., M]. K is a signal source number [k = 1, ..., N].) Convolutional mixing with impulse response h qk (r)
一般的なインパルス応答hqk(r)は、適当な時間経過後にパルス的な強い応答を持ち、時間と共に減衰していく。ブラインド信号分離の目的は、源信号s1(t),…,sN(t)やインパルス応答h11(r),…,h1N(r),…,hM1(r),…,hMN(r)を知らずに、観測信号(以下「混合信号」と呼ぶ)x1(t),…,xM(t)のみから、源信号s1(t),…,sN(t)にそれぞれ対応する分離信号y1(t),…,yN(t)を求めることにある。 The general impulse response h qk (r) has a strong pulse-like response after an appropriate time has elapsed and decays with time. The purpose of blind signal separation is the source signal s 1 (t), ..., s N (t) and impulse response h 11 (r), ..., h 1N (r), ..., h M1 (r), ..., h Without knowing MN (r), only source signals s 1 (t), ..., s N (t) from the observed signals (hereinafter referred to as "mixed signals") x 1 (t), ..., x M (t) the corresponding separated signals y 1 (t), ..., is to seek y N (t).
[周波数領域]
次に、従来のブラインド信号分離の手順について説明する。
ここでは周波数領域において分離の操作を行う。そのためにセンサqでの混合信号xq(t)にL点の短時間離散フーリエ変換(STFT:Short-Time Fourier Transform)を適用し、時間周波数スロット毎(f,τ)の混合信号(以下「周波数領域信号」と呼ぶ)
Next, a conventional blind signal separation procedure will be described.
Here, the separation operation is performed in the frequency domain. For this purpose, an L-point short-time Fourier transform (STFT) is applied to the mixed signal x q (t) at the sensor q, and the mixed signal (hereinafter referred to as “f, τ”) Called "frequency domain signal")
周波数領域で処理を行うと、式(1)で示される時間領域での畳み込み混合が、
[時間周波数マスクによる信号分離]
ブラインド信号分離手法の1つとして、時間周波数マスクを用いる方法がある。この手法は、信号源の数Nとセンサ数Mとの大小にかかわらず適用可能な信号分離抽出手法である。この手法では信号のスパース性を仮定する。スパースとは、信号が殆どの離散時間τにおいて0であることを指す。信号のスパース性は、例えば、周波数領域での音声信号で確認される。信号のスパース性と相互独立性を仮定することで、複数の信号が同時に存在していても、各時間周波数スロット(f,τ)では互いに重なって観測される確率が低いことを仮定できる。信号のスパース性と相互独立性を仮定する場合、上述の式(3)は、
Xq(f,τ)=Hqk(f)Sk(f,τ) …(5)
と表記でき、上述の式(4)は、
X(f,τ)=Hk(f)Sk(f,τ) …(6)
と表記できる。つまり、時間周波数スロット(f,τ)毎にみると、どれか一つの信号源kだけがアクティブで、その他の信号源の信号が0になっているものとモデル化できる。
[Signal separation by time frequency mask]
As one of blind signal separation methods, there is a method using a time-frequency mask. This method is a signal separation and extraction method applicable regardless of the number N of signal sources and the number M of sensors. This method assumes signal sparsity. Sparse refers to the signal being zero at most discrete times τ. The sparsity of the signal is confirmed by an audio signal in the frequency domain, for example. By assuming the sparseness and mutual independence of signals, it can be assumed that even if a plurality of signals are present at the same time, there is a low probability of being observed in each time frequency slot (f, τ). Assuming signal sparsity and mutual independence, Equation (3) above is
X q (f, τ) = H qk (f) S k (f, τ) (5)
The above equation (4) can be expressed as
X (f, τ) = H k (f) S k (f, τ) (6)
Can be written. That is, in each time frequency slot (f, τ), it can be modeled that only one of the signal sources k is active and the signals of the other signal sources are zero.
この場合の信号分離の操作は、時間周波数スロット(f,τ)毎に、どの信号源がアクティブになっているかを判定することで行える。具体的には、混合信号ベクトルから適当な特徴量を生成し、生成した特徴量をクラスタリングしてクラスタCkを生成する。そして、各クラスタCkのメンバに対応する周波数領域信号を抽出する時間周波数マスクMk(f,τ)を推定し、
Yk(f,τ)=Mk(f,τ)XQ'(f,τ)…(7)
により、各信号を分離抽出する。ここで、XQ'(f,τ)は混合信号ベクトルの要素の1つであり、Q’∈{1,…,M}である。
The signal separation operation in this case can be performed by determining which signal source is active for each time frequency slot (f, τ). Specifically, an appropriate feature amount is generated from the mixed signal vector, and the generated feature amount is clustered to generate a cluster C k . Then, estimate a time frequency mask M k (f, τ) that extracts a frequency domain signal corresponding to a member of each cluster C k ,
Y k (f, τ) = M k (f, τ) X Q ′ (f, τ) (7)
Thus, each signal is separated and extracted. Here, X Q ′ (f, τ) is one of the elements of the mixed signal vector, and Q′∈ {1,..., M}.
クラスタリングに用いる特徴量としては、例えば、2つのセンサ(センサqと基準センサQ〔なお、Qを基準値と呼び、基準値Qに対応するセンサを基準センサQと表記する。〕)における周波数領域信号の位相差
その他、クラスタリングの特徴量として、2つのセンサ(センサqと基準センサQ)における周波数領域信号の位相差(式(8))を周波数で除したものを用いてもよい。
As the feature amount used for clustering, for example, frequency regions in two sensors (sensor q and reference sensor Q (Q is referred to as a reference value, and a sensor corresponding to the reference value Q is referred to as a reference sensor Q)). Signal phase difference
In addition, as a clustering feature amount, a value obtained by dividing a phase difference (formula (8)) of frequency domain signals in two sensors (sensor q and reference sensor Q) by a frequency may be used.
また、非特許文献3には、3個以上のセンサの情報を効率的に利用し、時間周波数マスクによって信号分離を行う方法が開示されている。この方法では、各センサで観測された混合信号を短時間離散フーリエ変換し、時間周波数スロット(f,τ)毎の周波数領域信号Xq(f,τ)を生成し、これらを
次に、このように正規化されたベクトルX''(f,τ)を特徴量としてクラスタリングを行い、各信号源に対応すると推定されるクラスタを生成し、各クラスタのサンプルを取り出すための時間周波数マスクを生成する。そして、これらの時間周波数マスクを周波数領域信号に乗じることによって周波数領域の分離信号を求め、それらを短時間逆フーリエ変換(ISTFT: Inverse Short-Time Fourier Transform)することによって時間領域の分離信号を求める。
しかしながら、これらの従来技術において
f<c/(2dmax)(2センサの場合はdmax=d) …(11)
の関係を満たさない場合、いわゆる空間的エイリアシング(aliasing)が発生する可能性がある。そして、この空間的エイリアシングが発生した場合、適切なクラスタリングが実行できない可能性がある。以下に、この空間的エイリアシングに起因する問題を説明する。
However, in these prior art
f <c / (2d max ) (d max = d for 2 sensors) (11)
If this relationship is not satisfied, so-called spatial aliasing may occur. When this spatial aliasing occurs, there is a possibility that appropriate clustering cannot be performed. In the following, problems caused by this spatial aliasing will be described.
信号のスパース性と相互独立性を仮定すると、周波数領域信号Xq(f,τ)は、何れかの信号源kからセンサqヘの周波数応答Hqk(f)と、周波数領域の源信号Sk(f,τ)とを掛けたものに近似できる(式(5)参照)。すなわち、
Xq(f,τ)=Hqk(f)Sk(f,τ)
XQ(f,τ)=HQk(f)Sk(f,τ)
と近似できる。この場合、周波数領域信号Xq(f,τ)の偏角と、周波数領域信号XQ(f,τ)の偏角との相対値は、周波数応答Hqk(f)の偏角と、周波数応答HQk(f)の偏角との相対値のみに依存するものと近似できる。
Assuming sparseness and mutual independence of the signal, the frequency domain signal X q (f, τ) is the frequency response H qk (f) from any signal source k to the sensor q and the frequency domain source signal S. It can be approximated to the product of k (f, τ) (see equation (5)). That is,
X q (f, τ) = H qk (f) S k (f, τ)
X Q (f, τ) = H Qk (f) S k (f, τ)
Can be approximated. In this case, the relative value of the declination of the frequency domain signal X q (f, τ) and the declination of the frequency domain signal X Q (f, τ) is the declination of the frequency response H qk (f) and the frequency It can be approximated that it depends only on the relative value of the response H Qk (f) to the argument.
ここで、周波数応答Hqk(f)を反射や残響の無い直接波モデルで近似すると、
Hqk(f)=λqk・exp[‐j・2π・f・γqk] …(12)
と表現できる。なお、γqkとλqk>0とは、信号源kからセンサqへの到達時間と、減衰とを、それぞれ表現するモデルパラメータである。また、信号源kからセンサqへの到達時間γqkは、
γqk=dkq/c
と表記できる。なお、dkqは、信号源kとセンサqとの距離を示す。よって、式(12)は、
Hqk(f)=λqk・exp[‐j・2π・f・dkq/c] …(13)
と表記できる。
If the frequency response H qk (f) is approximated by a direct wave model without reflection or reverberation,
H qk (f) = λ qk・ exp [−j ・ 2π ・ f ・ γ qk ]… (12)
Can be expressed as Note that γ qk and λ qk > 0 are model parameters that express the arrival time from the signal source k to the sensor q and the attenuation, respectively. The arrival time γ qk from the signal source k to the sensor q is
γ qk = d kq / c
Can be written. D kq represents the distance between the signal source k and the sensor q. Therefore, equation (12) becomes
H qk (f) = λ qk・ exp [−j ・ 2π ・ f ・ d kq / c] (13)
Can be written.
ここで、式(11)の関係を満たす場合、周波数応答Hqk(f)の偏角と、周波数応答HQk(f)の偏角との相対値2π・f・(dkQ‐dkq)/cは必ず−π以上π未満となり、周波数領域信号Xq(f,τ)の偏角と、周波数領域信号XQ(f,τ)の偏角との相対値も必ず−π以上π未満となる。そして、この偏角の相対値は、信号源kからセンサq及び基準センサQへの信号の到達時間差γQk‐γqkと、周波数fとの双方に比例したものになる。 Here, when the relationship of Expression (11) is satisfied, the relative value 2π · f · (d kQ -d kq ) of the deviation angle of the frequency response H qk (f) and the deviation angle of the frequency response H Qk (f) / c is always −π or more and less than π, and the relative value of the declination of the frequency domain signal X q (f, τ) and the declination of the frequency domain signal X Q (f, τ) is always −π or more and less than π. It becomes. The relative value of the deviation angle is proportional to both the arrival time difference γ Qk -γ qk of the signal from the signal source k to the sensor q and the reference sensor Q and the frequency f.
上述の各従来例では、各センサqに対応する周波数領域信号Xq(f,τ)の偏角を、基準センサQに対応する周波数領域信号XQ(f,τ)の偏角を基準に正規化し、さらに正規化された偏角を周波数fに比例した値で除して特徴量を生成している(例えば式(9)(10)など参照)。この場合、当該特徴量の偏角は、信号源kからセンサq及び基準センサQへの信号の到達時間差γQk‐γqkに比例するものとなる。そして、当該到達時間差γQk‐γqkは、信号源k,センサq,基準センサQの相対位置にのみ依存するのだから、当該特徴量は信号源kの位置に依存するクラスタを形成する。 In each of the conventional examples described above, the declination of the frequency domain signal X q (f, τ) corresponding to each sensor q is used as the reference for the declination of the frequency domain signal X Q (f, τ) corresponding to the reference sensor Q. The feature amount is generated by normalizing and dividing the normalized declination by a value proportional to the frequency f (see, for example, equations (9) and (10)). In this case, the declination of the feature value is proportional to the arrival time difference γ Qk -γ qk of the signal from the signal source k to the sensor q and the reference sensor Q. Since the arrival time difference γ Qk -γ qk depends only on the relative positions of the signal source k, the sensor q, and the reference sensor Q, the feature amount forms a cluster depending on the position of the signal source k.
一方、式(11)の関係を満たさない場合、周波数領域信号Xq(f,τ)の偏角と、周波数領域信号XQ(f,τ)の偏角との相対値が−π未満やπ以上の範囲まで達する可能性がある。しかし、実際の混合信号の分析では、−π未満やπ以上の範囲に達した偏角の相対値は、それと等価な−π以上π未満の範囲の偏角としか判定できない。この場合、偏角の相対値は、周波数fの増加に対し、所定の周期で巡回的にジャンプ(πから−π又は−πからπにジャンプ)し、全周波数fにわたる比例関係とはならない。そのため、上述の各従来例のように偏角を正規化し、さらにそれらを周波数fに比例した値で除して特徴量を生成したとしても、クラスタリングによって、各信号源の位置を正しく特定できるクラスタを形成するのは困難である。なぜなら、同じ信号源に対応する特徴量であっても、上述の巡回的なジャンプが生じた周波数を超える領域ではクラスタを形成しないからである。 On the other hand, when the relationship of Expression (11) is not satisfied, the relative value between the declination of the frequency domain signal X q (f, τ) and the declination of the frequency domain signal X Q (f, τ) is less than −π. There is a possibility of reaching a range of π or more. However, in the actual analysis of the mixed signal, the relative value of the declination that reaches a range of less than −π or greater than or equal to π can be determined only as an equivalent declination of a range of −π or more and less than π. In this case, the relative value of the declination jumps cyclically (jumps from π to −π or −π to π) with a predetermined period as the frequency f increases, and does not have a proportional relationship over the entire frequency f. For this reason, even if the declination is normalized as in each of the above-described conventional examples and the feature amount is generated by dividing the deviation by a value proportional to the frequency f, the cluster can correctly identify the position of each signal source by clustering. Is difficult to form. This is because even if the feature amounts correspond to the same signal source, no cluster is formed in a region exceeding the frequency at which the above-described cyclic jump occurs.
本発明はこのような点に鑑みてなされたものであり、上述した従来の技術を拡張し、空間的エイリアシングが起こり得る周波数帯域でも好適にクラスタリングを行い、適切な分離信号を生成することが可能な技術を提供することを目的とする。すなわち、本発明の目的は、空間的エイリアシングが起こらない場合にも適用可能であるが、空間的エイリアシングが発生した場合であっても好適に分離信号を求めることが可能な技術を提供することである。 The present invention has been made in view of these points, and can extend the conventional technique described above to perform appropriate clustering even in a frequency band where spatial aliasing can occur and generate an appropriate separated signal. Aims to provide a new technology. That is, the object of the present invention is applicable to a case where spatial aliasing does not occur, but provides a technique capable of suitably obtaining a separated signal even when spatial aliasing occurs. is there.
第1の本発明では上記課題を解決するために、まず、周波数領域変換部が、複数のセンサで観測された混合信号を、それぞれ、周波数領域の混合信号(周波数領域信号)に変換する。次に、正規化部が、周波数領域信号の位相を正規化し、さらに周波数依存成分を排除した周波数正規化信号を生成する。なお、周波数正規化信号は、そのノルムが正規化されたものであってもよいし、されないものであってもよい。そして、第1クラスタリング部が、周波数正規化信号、或いは、当該周波数正規化信号を所定の関数へ代入して得られる値を各要素とする、時間周波数毎の特徴量ベクトルをクラスタリングし、各クラスタのセントロイド(クラスタの中心ベクトル)を算出する。また、モデルパラメータ抽出部が、当該セントロイドを用い、周波数応答モデルのモデルパラメータを算出する。その後、第2クラスタリング部が、モデルパラメータが代入された周波数応答モデル、又は、モデルパラメータを最適化したモデルパラメータが代入された周波数応答モデルを基準に、周波数領域信号の位相・ノルム正規化値を各要素とする周波数依存の位相・ノルム正規化ベクトルをクラスタリングし、各位相ノルム正規化ベクトルが属するクラスタに対応するクラスタ情報を生成する。そして、分離信号生成部が、周波数領域信号とクラスタ情報を用い、周波数領域の分離信号を生成する。最後に、周波数領域の分離信号を時間領域の分離信号に変換する。 In the first aspect of the present invention, in order to solve the above-described problem, first, the frequency domain conversion unit converts the mixed signals observed by a plurality of sensors into mixed signals (frequency domain signals) in the frequency domain. Next, the normalization unit normalizes the phase of the frequency domain signal and further generates a frequency normalized signal from which frequency dependent components are excluded. The frequency normalized signal may be a signal whose norm is normalized or may not. Then, the first clustering unit clusters the feature vector for each time frequency using each element as a frequency normalized signal or a value obtained by substituting the frequency normalized signal into a predetermined function. Centroid (cluster center vector) is calculated. The model parameter extraction unit calculates model parameters of the frequency response model using the centroid. Thereafter, the second clustering unit calculates the phase-norm normalized value of the frequency domain signal based on the frequency response model in which the model parameters are substituted or the frequency response model in which the model parameters are optimized. Clustering is performed on the frequency-dependent phase / norm normalized vectors as the respective elements, and cluster information corresponding to the clusters to which each phase norm normalized vector belongs is generated. Then, the separated signal generation unit uses the frequency domain signal and the cluster information to generate a frequency domain separated signal. Finally, the frequency domain separation signal is converted into a time domain separation signal.
ここで、第1クラスタリング部によるクラスタリングの対象となる特徴量ベクトルの多くが上述の巡回的なジャンプを起こしていないのであれば、生成される各クラスタのセントロイドは、周波数応答モデルを周波数正規化したものに近づく(詳細は後述)。そのため、このセントロイドを用い、周波数応答モデルのモデルパラメータを推定することができる。また、第2クラスタリング部は、当該モデルパラメータが代入された周波数応答モデル、又は、最適化したモデルパラメータが代入された周波数応答モデルを基準とし、周波数依存の位相・ノルム正規化ベクトルをクラスタリングする。ここで、モデルパラメータは周波数に依存しないが、モデルパラメータが代入された周波数応答モデルは周波数に依存する。この第2クラスタリング部では、この周波数に依存する周波数応答モデルを基準とし、周波数依存の位相・ノルム正規化ベクトルをクラスタリングするため、上述の巡回的なジャンプが生じていても各信号源に対応するクラスタを好適に生成することができる。そのため、当該クラスタの情報を用いることにより、好適に分離信号を求めることができる。 Here, if many of the feature vectors to be clustered by the first clustering unit do not cause the above-described cyclic jump, the centroid of each cluster to be generated is frequency normalized to the frequency response model. (Details will be described later). Therefore, the model parameter of the frequency response model can be estimated using this centroid. The second clustering unit clusters the frequency-dependent phase / norm normalized vectors with reference to the frequency response model into which the model parameter is substituted or the frequency response model into which the optimized model parameter is substituted. Here, the model parameter does not depend on the frequency, but the frequency response model into which the model parameter is substituted depends on the frequency. In this second clustering unit, frequency-dependent phase / norm normalized vectors are clustered based on this frequency-dependent frequency response model, so that even if the above-mentioned cyclic jump occurs, it corresponds to each signal source. A cluster can be suitably generated. Therefore, the separation signal can be suitably obtained by using the information of the cluster.
また、第1の本発明において好ましくは、第1クラスタリング部は、空間的エイリアシングが起き得ない周波数を含む周波数帯域の特徴量ベクトルをクラスタリングし、第2クラスタリング部は、空間的エイリアシングが起き得る周波数を含む周波数帯域の位相・ノルム正規化ベクトルをクラスタリングする。 Preferably, in the first aspect of the present invention, the first clustering unit clusters feature quantity vectors in a frequency band including a frequency at which spatial aliasing cannot occur, and the second clustering unit has a frequency at which spatial aliasing can occur. Cluster the phase / norm normalized vectors in the frequency band including.
ここで、第1クラスタリング部が、空間的エイリアシングが起き得ない周波数を含む周波数帯域の特徴量ベクトルをクラスタリングすることにより、クラスタリングの対象となる特徴量ベクトルの多くを上述の巡回的なジャンプを起こしていないものとすることができる。その結果、妥当なセントロイドを生成することができる。また、第2クラスタリング部が、空間的エイリアシングが起き得る周波数を含む周波数帯域の位相・ノルム正規化ベクトルをクラスタリングすることにより、第1クラスタリング部によって生成されなかった周波数に対応するクラスタをも生成することができる。その結果、空間的エイリアシングが生じる周波数に対しても適切に分離信号を生成することができる。 Here, the first clustering unit performs clustering of feature vectors in a frequency band including frequencies where spatial aliasing cannot occur, thereby causing many of the feature vectors to be clustered to have the above-described cyclic jumps. Can not be. As a result, a valid centroid can be generated. The second clustering unit also generates a cluster corresponding to the frequency that was not generated by the first clustering unit by clustering the phase / norm normalized vector of the frequency band including the frequency at which spatial aliasing can occur. be able to. As a result, a separation signal can be appropriately generated even for a frequency at which spatial aliasing occurs.
また、上述した「空間的エイリアシングが起き得ない周波数を含む周波数帯域」は、一部に空間的エイリアシングが起き得る周波数を含む周波数帯域であってもよいが、好ましくは、空間的エイリアシングが起き得ない周波数のみからなる周波数帯域であることが望ましい。これにより、第1クラスタリング部は、巡回的なジャンプを起こしていない特徴量ベクトルのみを用いてセントロイドを生成できる。その結果、巡回的なジャンプに起因してセントロイドの精度が低下することを防止できる。また、上述した「空間的エイリアシングが起き得る周波数を含む周波数帯域」は、全周波数帯域(全ての時間周波数スロットに対応する周波数帯域)であることが望ましい。 In addition, the above-mentioned “frequency band including a frequency at which spatial aliasing cannot occur” may be a frequency band partially including a frequency at which spatial aliasing may occur, but preferably, spatial aliasing may occur. It is desirable that the frequency band is composed only of no frequencies. As a result, the first clustering unit can generate a centroid using only the feature vector that has not caused a cyclic jump. As a result, it is possible to prevent the accuracy of the centroid from being lowered due to the cyclic jump. Further, the above-described “frequency band including a frequency at which spatial aliasing can occur” is desirably an entire frequency band (a frequency band corresponding to all time frequency slots).
また、第1の本発明において好ましくは、モデルパラメータ最適化部が、クラスタ情報と、空間的エイリアシングが起き得る周波数を含む周波数帯域に対応する位相・ノルム正規化ベクトルとを用い、モデルパラメータを最適化する。これにより、空間的エイリアシングが起き得る周波数に対応する情報をもモデルパラメータの生成に反映させることができ、モデルパラメータの精度を向上させることができる。 In the first aspect of the present invention, preferably, the model parameter optimizing unit uses the cluster information and a phase / norm normalization vector corresponding to a frequency band including a frequency at which spatial aliasing may occur to optimize the model parameter. Turn into. Thereby, information corresponding to a frequency at which spatial aliasing can occur can be reflected in the generation of the model parameter, and the accuracy of the model parameter can be improved.
ここでより好ましくは、モデルパラメータは、センサと、クラスタに対応する信号源との組に対応するパラメータである。そして、モデルパラメータ最適化部は、位相・ノルム正規化ベクトルの各要素に対応するセンサと、クラスタ情報が示す当該位相・ノルム正規化ベクトルが属するクラスタに対応する信号源と、の組に対応するモデルパラメータが代入された周波数応答モデルと、当該位相・ノルム正規化ベクトルの各要素と、の距離の総和からなるコスト関数に対し、モデルパラメータに関する偏微分を行い、算出された偏微分値に比例する値をモデルパラメータから減算することによって当該モデルパラメータを最適化する。これにより、第1クラスタリング部のクラスタリングで利用されなかった特徴量ベクトルの情報を利用し、モデルパラメータの精度を向上させることができる。 More preferably, the model parameter is a parameter corresponding to a set of a sensor and a signal source corresponding to a cluster. The model parameter optimization unit corresponds to a set of a sensor corresponding to each element of the phase / norm normalized vector and a signal source corresponding to the cluster to which the phase / norm normalized vector indicated by the cluster information belongs. The cost function consisting of the sum of the distances between the frequency response model into which the model parameters are assigned and the elements of the phase / norm normalized vector is subjected to partial differentiation with respect to the model parameters and is proportional to the calculated partial differential value. The model parameter is optimized by subtracting the value to be determined from the model parameter. As a result, it is possible to improve the accuracy of the model parameters by using the feature vector information that has not been used in the clustering of the first clustering unit.
さらにここで好ましくは、モデルパラメータの最適化処理及びクラスタ情報の生成処理は、所定の終了条件が満たされるまで交互に実行される。そして、分離信号生成部は、所定の終了条件を満たした時点で最新のクラスタ情報を用い、分離信号を生成する。これにより、モデルパラメータの精度を向上させ、精度の高い分離信号を生成できる。また、モデルパラメータ最適化部でのモデルパラメータの最適化処理は、全ての時間周波数スロットに対応する(即ち全周波数に対応する)位相・ノルム正規化ベクトルを用いて実行されることが望ましい。モデルパラメータの精度をより一層高めることができるからである。 Further preferably, the model parameter optimization process and the cluster information generation process are alternately executed until a predetermined end condition is satisfied. Then, the separation signal generation unit generates a separation signal using the latest cluster information when a predetermined termination condition is satisfied. Thereby, the precision of a model parameter can be improved and a highly accurate separation signal can be generated. In addition, it is preferable that the model parameter optimization processing in the model parameter optimization unit is executed using phase / norm normalization vectors corresponding to all time frequency slots (that is, corresponding to all frequencies). This is because the accuracy of the model parameters can be further increased.
また、第1の本発明において、第1クラスタリング部が、空間的エイリアシングが起き得ない周波数を含む周波数帯域に対応する特徴量ベクトルがそれぞれ属するクラスタに対応する初期クラスタ情報を生成し、第2クラスタリング部が、空間的エイリアシングが起き得る周波数を含む周波数帯域に対応する位相・ノルム正規化ベクトルがそれぞれ属するクラスタに対応するクラスタ情報を生成し、分離信号生成部が、第1クラスタリング部が生成した初期クラスタ情報と、第2クラスタリング部が生成したクラスタ情報とを用い、分離信号を生成してもよい。このように第1クラスタリング部が生成した初期クラスタ情報を分離信号の生成に利用することにより、第2クラスタリング部は、第1クラスタリング部が生成した初期クラスタと重複する周波数のクラスタ情報を生成する必要がなくなる。その結果、全体として演算量を低減できる。 In the first aspect of the present invention, the first clustering unit generates initial cluster information corresponding to clusters to which feature quantity vectors corresponding to frequency bands including frequencies in which spatial aliasing cannot occur, and second clustering. The unit generates cluster information corresponding to the clusters to which the phase and norm normalization vectors corresponding to the frequency bands including frequencies where spatial aliasing may occur, and the separated signal generation unit generates the initial data generated by the first clustering unit. The separation signal may be generated using the cluster information and the cluster information generated by the second clustering unit. As described above, by using the initial cluster information generated by the first clustering unit for the generation of the separation signal, the second clustering unit needs to generate cluster information having a frequency overlapping with the initial cluster generated by the first clustering unit. Disappears. As a result, the calculation amount can be reduced as a whole.
また、第2の本発明では、まず、周波数領域変換部が、複数のセンサで観測された混合信号を、それぞれ、周波数領域信号に変換する。また、モデルパラメータ選択部が、周波数応答モデルのモデルパラメータの初期値を選択する。そして、所定の終了条件を満たすまで、モデルパラメータが代入された周波数応答モデルを基準とし、上記周波数領域信号の位相・ノルム正規化値を各要素とする周波数依存の位相・ノルム正規化ベクトルをクラスタリングし、各位相・ノルム正規化ベクトルが属するクラスタに対応するクラスタ情報を生成する処理と、クラスタ情報と、位相・ノルム正規化ベクトルとを用い、モデルパラメータを最適化する処理とを繰り返す。そして、分離信号生成部が、所定の終了条件を満たした時点において最新のクラスタ情報と、周波数領域信号とを用い、周波数領域の分離信号を生成する。 In the second aspect of the present invention, first, the frequency domain conversion unit converts the mixed signals observed by a plurality of sensors into frequency domain signals. In addition, the model parameter selection unit selects an initial value of the model parameter of the frequency response model. Then, cluster the frequency-dependent phase / norm normalized vectors with the phase / norm normalized values of the frequency domain signal as elements, based on the frequency response model with the model parameters substituted until a predetermined termination condition is satisfied. Then, the process of generating cluster information corresponding to the cluster to which each phase / norm normalized vector belongs, and the process of optimizing the model parameters using the cluster information and the phase / norm normalized vector are repeated. Then, the separation signal generation unit generates a frequency domain separation signal by using the latest cluster information and the frequency domain signal when a predetermined termination condition is satisfied.
ここで、第2の本発明のクラスタリングは、周波数依存の位相・ノルム正規化ベクトルに対するクラスタリングのみであるため、上述した巡回的ジャンプに起因する問題が発生しない。 Here, since the clustering of the second aspect of the present invention is only clustering with respect to the frequency-dependent phase / norm normalized vector, the problem caused by the above-described cyclic jump does not occur.
本発明では、上述した従来の技術を拡張し、空間的エイリアシングが起こり得る周波数帯域でも好適にクラスタリングを行い、適切な分離信号を生成することが可能となる。 In the present invention, it is possible to extend the conventional technique described above, and perform suitable clustering even in a frequency band where spatial aliasing can occur, and generate an appropriate separated signal.
以下、本発明を実施するための最良の形態を図面を参照して説明する。以下では、各形態の原理を説明した後、各実施の形態を説明していく。
〔原理の概要〕
各形態では、まず、複数のセンサで観測された混合信号を、それぞれ、周波数領域信号に変換し、さらにそれを正規化等して得られる特徴量ベクトルをクラスタリングする。なお、各形態の例では、空間的エイリアシングが起き得ない周波数の特徴量ベクトルのみに対し、このクラスタリング(「第1クラスタリング部」でのクラスタリング)を実行する。このクラスタリング結果を解析すると、信号が混合された様子を表現する周波数応答モデルのモデルパラメータ、すなわち、信号源kからセンサq(q∈{1,...,M})への正規化された到達時間γqkと、振幅ゲインλqk>0とが算出できる。そして、これらのモデルパラメータγqk,λqkが代入された周波数応答モデルを基準とし、前述の位相・ノルム正規化ベクトルをクラスタリング(「第2クラスタリング部」でのクラスタリング)する。なお、各形態の例では、空間的エイリアシングが起き得る周波数を含む全周波数帯域の位相・ノルム正規化ベクトルに対し、この第2クラスタリング部でのクラスタリングを実行する。このように生成された各クラスタは各信号源kに対応するため、当該クラスタの情報を用いることにより、分離信号を推定できる。
The best mode for carrying out the present invention will be described below with reference to the drawings. In the following, after explaining the principle of each embodiment, each embodiment will be described.
[Summary of Principle]
In each embodiment, first, mixed signals observed by a plurality of sensors are converted into frequency domain signals, and feature vectors obtained by normalizing the signals are clustered. In each form example, this clustering (clustering in the “first clustering unit”) is performed only on feature vectors of frequencies at which spatial aliasing cannot occur. When this clustering result is analyzed, the model parameters of the frequency response model expressing how the signals are mixed, that is, normalized from the signal source k to the sensor q (qε {1,..., M}) The arrival time γ qk and the amplitude gain λ qk > 0 can be calculated. Then, based on the frequency response model into which these model parameters γ qk and λ qk are substituted, the above-described phase / norm normalized vectors are clustered (clustering in the “second clustering unit”). In each example, clustering in the second clustering unit is performed on the phase / norm normalized vectors in all frequency bands including frequencies at which spatial aliasing can occur. Since each cluster generated in this way corresponds to each signal source k, the separated signal can be estimated by using the information of the cluster.
ただし、上記のモデルパラメータγqk,λqkは、空間的エイリアシングが起き得ない周波数の特徴量ベクトルのみを用いて算出されたものである。そのため、あまり正確でない可能性がある。そこで、第2の実施の形態では、空間的エイリアシングが起き得る周波数を含む全周波数帯域の位相・ノルム正規化ベクトルを用い、モデルパラメータγqk,λqkに微小な修正値を加算・減算する処理を繰り返し、モデルパラメータγqk,λqkを最適化する。 However, the model parameters γ qk and λ qk are calculated using only feature quantity vectors of frequencies at which spatial aliasing cannot occur. Therefore, it may not be very accurate. Therefore, in the second embodiment, processing for adding / subtracting a small correction value to / from the model parameters γ qk and λ qk using the phase / norm normalized vector of the entire frequency band including the frequency at which spatial aliasing can occur. Is repeated to optimize the model parameters γ qk and λ qk .
〔原理の詳細〕
次に、原理の詳細について説明する。
[周波数応答モデルと周波数領域信号]
各形態では、信号のスパース性と相互独立性を仮定する。この場合、各周波数領域信号Xq(f,τ)は、信号源からセンサへの周波数応答に相当する情報を持つ(式(5)(6)参照)。従って、周波数領域信号Xq(f,τ)を解析することで、信号源からセンサへの周波数応答を表現する周波数応答モデルのモデルパラメータを算出することができる。また、各形態では、信号源kからセンサqヘの周波数応答を直接波モデル
Hqk(f)=λqk・exp[‐j・2π・f・γqk] …(14)
によって近似する。ここで、モデルパラメータγqkとλqk>0とは、それぞれ、信号源kからセンサqヘの到達時間と減衰(振幅ゲイン)とを表現する。ただし、周波数領域の源信号Sk(f,τ)の位相及び振幅と、周波数応答Hqk(f)の位相及び振幅とを実際に区別することは困難である。そのため、各形態では、λqk及びγqkを相対的なものとして考え、ある種の正規化を行う。到達時間γqkは、ある基準センサQにおけるものを0、すなわち、到達時間γQk=0とする。また、振幅ゲインλqkは、
Next, the details of the principle will be described.
[Frequency response model and frequency domain signal]
Each form assumes signal sparsity and mutual independence. In this case, each frequency domain signal X q (f, τ) has information corresponding to the frequency response from the signal source to the sensor (see equations (5) and (6)). Therefore, by analyzing the frequency domain signal X q (f, τ), it is possible to calculate model parameters of a frequency response model that expresses the frequency response from the signal source to the sensor. In each embodiment, the frequency response from the signal source k to the sensor q is a direct wave model.
H qk (f) = λ qk・ exp [−j ・ 2π ・ f ・ γ qk ]… (14)
Is approximated by Here, the model parameters γ qk and λ qk > 0 represent the arrival time and attenuation (amplitude gain) from the signal source k to the sensor q, respectively. However, it is difficult to actually distinguish the phase and amplitude of the source signal S k (f, τ) in the frequency domain from the phase and amplitude of the frequency response H qk (f). Therefore, in each embodiment, λ qk and γ qk are considered as relative ones, and some kind of normalization is performed. The arrival time γ qk is 0 for a certain reference sensor Q, that is, the arrival time γ Qk = 0. The amplitude gain λ qk is
そして、そのような正規化を混合信号ベクトルX(f,τ)=[X1(f,τ),…,XM(f,τ)]Tにも反映する。これは、混合信号ベクトルX(f,τ)の位相とノルムとを正規化することにより行う。すなわち、混合信号ベクトルX(f,τ)に対し、ある基準センサQに対応する要素XQ(f,τ)の偏角を0として、各要素X1(f,τ),...,XM(f,τ)の偏角を正規化し、さらにノルムがα(例えば1)になるように正規化する。このように正規化されたベクトルを、位相・ノルム正規化ベクトルX'(f,τ)=[X1'(f,τ),…,XM'(f,τ)]Tと呼ぶ。また、このような正規化は、例えば、
以上のように正規化を行うと、ある位相・ノルム正規化ベクトルX'(f,τ)は、ある信号源kからセンサqヘの周波数応答をモデル化した式(14)(以下「周波数応答モデル」と呼ぶ)に近づく。すなわち、位相・ノルム正規化ベクトルX'(f,τ)の要素と、周波数応答モデルとの距離の総和(各センサについての時間周波数スロット(f,τ)毎の総和)を最小値化する位相・ノルム正規化ベクトルX'(f,τ)が、信号源kに対応するものであると推定でき、この結果を用い、分離信号を推定できる。 When normalization is performed as described above, a certain phase / norm normalization vector X ′ (f, τ) is expressed by an equation (14) (hereinafter “frequency response”) that models the frequency response from a certain signal source k to the sensor q. Called a model). That is, the phase that minimizes the sum of the distances between the elements of the phase / norm normalized vector X ′ (f, τ) and the frequency response model (sum of each time frequency slot (f, τ) for each sensor). It can be estimated that the norm normalized vector X ′ (f, τ) corresponds to the signal source k, and the separated signal can be estimated using this result.
ここで、どの位相・ノルム正規化ベクトルX'(f,τ)が、どの周波数応答モデルHqk(f)に対応するかは、時間周波数スロット(f,τ)毎に異なり、この位相・ノルム正規化ベクトルX'(f,τ)と周波数応答モデルHqk(f)との対応関係は、以下のコスト関数を最小化するものとして表現できる。
ここで、C(f,τ)(「クラスタ情報」と呼ぶ)は、各時間周波数スロット(f,τ)に対応する何らかの特徴量(例えば、位相・ノルム正規化ベクトルや特徴量ベクトル)をクラスタリングして得られる各クラスタに対応する情報である。つまり、ある時間周波数スロット(f,τ)に関してC(f,τ)=kであることは、その時間周波数スロット(f,τ)に対応する何らかの特徴量がk番目のクラスタに属することを意味する。また、C(f,τ)=kの条件を付加した総和Σは、C(f,τ)=kである全ての時間周波数スロット(f,τ)について総和をとることを意味する。 Here, C (f, τ) (referred to as “cluster information”) clusters any feature quantity (eg, phase / norm normalization vector or feature quantity vector) corresponding to each time frequency slot (f, τ). It is the information corresponding to each cluster obtained in this way. That is, C (f, τ) = k for a certain time frequency slot (f, τ) means that some feature quantity corresponding to the time frequency slot (f, τ) belongs to the kth cluster. To do. Further, the summation Σ with the condition of C (f, τ) = k means that the summation is performed for all time frequency slots (f, τ) where C (f, τ) = k.
[コスト関数Gの解法]
各形態では、式(16)のコスト関数Gを最小値化する問題を解くにあたり、まず、空間的エイリアシングが起こり得ない周波数帯域FL⊆Fの各周波数fに対してクラスタを決定するとともに、各信号源kから各センサqヘの周波数応答モデルHqk(f)(式(14))のモデルパラメータλqk及びγqkの初期値を算出する。なお、Fは考慮すべき周波数を全て集めた集合、すなわち、F={0,fs/L,…,fs(L-1)/L}(fsはサンプリング周波数)である。また、空間的エイリアシングが起こり得ない周波数帯域FLは、
FL={f : 0<f<c/(2dmax)} …(17)
によって算出できる。なお、dmaxは、基準センサQと他のセンサqとの距離の最大値である。
[Solution of cost function G]
In each form, in solving the problem of minimizing the cost function G of Equation (16), first, a cluster is determined for each frequency f of the frequency band F L ⊆F where spatial aliasing cannot occur, The initial values of the model parameters λ qk and γ qk of the frequency response model H qk (f) (Equation (14)) from each signal source k to each sensor q are calculated. Note that F is a set in which all the frequencies to be considered are collected, that is, F = {0, f s / L,..., F s (L−1) / L} (f s is a sampling frequency). Further, the frequency band F L that would not occur spatial aliasing,
F L = {f: 0 <f <c / (2d max )}… (17)
Can be calculated. D max is the maximum distance between the reference sensor Q and another sensor q.
空間的エイリアシングが起こり得ない周波数帯域FLだけを考えた場合、式(16)のコスト関数Gは、以下の手順により簡単に最小化できる。
まず、周波数帯域FLに属するすべての周波数fに関し、例えば、
First, For all frequencies f that belong to the frequency band F L, for example,
このような特徴量ベクトルX''(f,τ)の各要素Xq''(f,τ)を用いると、式(16)に示したコスト関数Gは、
また、式(19)をベクトル表記すると、
Further, when expression (19) is expressed in vector,
[周波数帯域FL⊆Fの各周波数fに対するクラスタの決定]
ここで、周波数帯域FL⊆Fの周波数fのみを考慮すると、特徴量ベクトルX''(f,τ)は、信号源k毎のクラスタを形成する(例えば、非特許文献3参照)。そして、上述の正規化周波数応答モデルHqk’を要素とするベクトルHk'=[ H1k',..., HMk']Tは、各クラスタのセントロイド(クラスタの中心ベクトル)とみなすことができる。従って、よく知られたk-means法(例えば、非特許文献2参照)と同様に、以下の<演算1><演算2>を交互に繰返し適用することで、式(19)のコスト関数G’を最小にする各クラスタと、それらのセントロイドHk’とを算出することができる。
[Determination of cluster for each frequency f of frequency band F L ⊆F]
Here, considering only the frequency f of the frequency band F L ⊆F, the feature vector X ″ (f, τ) forms a cluster for each signal source k (see, for example, Non-Patent Document 3). The vector H k '= [H 1k ', ..., H Mk '] T whose elements are the normalized frequency response model H qk ' described above is regarded as the centroid of each cluster (cluster center vector). be able to. Therefore, similarly to the well-known k-means method (see, for example, Non-Patent Document 2), the following <
<演算1>最新のクラスタ情報C(f,τ)に基づき、各クラスタのセントロイドHk’を
<演算2>最新のセントロイドHk’に基づき、クラスタ情報C(f,τ)を更新する。即ち、
なお、<演算1>と<演算2>とはどちらを最初に開始してもよい。また、<演算1>を最初に行う場合のクラスタ情報C(f,τ)の初期値、及び、<演算2>を最初に行う場合のセントロイドHk’の初期値の設定方法については特に制限はないが、広範囲に分布する特徴量ベクトルX''(f,τ)が同一のクラスタに属するようなクラスタ情報C(f,τ)や、狭い範囲に集中するセントロイドHk’を初期値とすることは好ましくない。適切なクラスタが生成されない場合があるからである。このような好ましい初期値の設定方法には、特に制限はないが、例えば、以下のような方法を例示できる。
Either <
セントロイドHk’の初期値設定例:
(1)セントロイドHk’(k∈{1,...,N})の初期値候補の組み合わせをランダムに複数パターン生成する。
(2)各組み合わせに対し、セントロイドHk’の初期値候補の内積を求め、内積が最小となる組み合わせをセントロイドHk’の初期値とする。
Example of initial value setting for Centroid H k ':
(1) A plurality of combinations of initial value candidate combinations of centroid H k ′ (k∈ {1,..., N}) are randomly generated.
(2) For each combination, the inner product of the initial value candidates of the centroid H k ′ is obtained, and the combination having the smallest inner product is set as the initial value of the centroid H k ′.
クラスタ情報C(f,τ)の初期値設定例:
(1)クラスタ情報C(f,τ)の初期値候補の組み合わせをランダムに複数パターン生成する。
(2)各組み合わせに対し、式(21)に従いセントロイドHk’の初期値候補の組み合わせを算出する。
(3)セントロイドHk’の初期値候補の各組み合わせに対し、セントロイドHk’の初期値候補の内積を求め、内積が最小となる組み合わせに対応するクラスタ情報C(f,τ)の初期値候補をクラスタ情報C(f,τ)の初期値とする。
Example of initial value setting for cluster information C (f, τ):
(1) A plurality of patterns of random combinations of initial value candidates for cluster information C (f, τ) are generated.
(2) For each combination, a combination of initial value candidates of centroid H k ′ is calculated according to equation (21).
(3) 'for each combination of initial value options of the centroid H k' centroid H k obtains an inner product of the initial value candidates, the cluster information corresponding to a combination of the inner product becomes minimum C of (f, tau) The initial value candidate is set as the initial value of the cluster information C (f, τ).
[モデルパラメータλqk及びγqkの初期値算出]
<演算1>と<演算2>とは、所定の終了条件を満たすまで繰り返され、所定の条件を満たした際のセントロイドHk’を用い、以下の式に従って、式(14)の周波数応答モデルHqk(f)のモデルパラメータλqk及びγqkを算出する。
<
[コスト関数Gの解]
次に、得られたモデルパラメータλqk及びγqkを用い、全周波数f∈Fについて、式(16)のコスト関数Gを最小化するように、位相・ノルム正規化ベクトルX'(f,τ)をクラスタリングする。単純な方法としては、得られたモデルパラメータλqk及びγqkをそのまま用い、
Next, using the obtained model parameters λ qk and γ qk , the phase / norm normalized vector X ′ (f, τ) is set so as to minimize the cost function G of Equation (16) for all frequencies f∈F. ). As a simple method, the obtained model parameters λ qk and γ qk are used as they are,
しかしながら、周波数帯域FLのみで算出したモデルパラメータλqk,γqkは、それほど正確でない可能性がある。そのため、より良い方法として、全周波数f∈Fの位相・ノルム正規化ベクトルX'(f,τ)を用いて、より正確なモデルパラメータλqk,γqkを算出する。これは、式(16)のコスト関数Gのモデルパラメータλqk及びγqkそれぞれに関する偏微分値を用い、以下のような修正を繰り返すことで実現できる。
なお、μはステップサイズパラメータを示す実数である。また、
式(24)によるクラスタ情報C(f,τ)の算出と、式(25)によるモデルパラメータλqk,γqkの修正とを交互に繰返し適用することで、より良いクラスタ情報C(f,τ)とモデルパラメータλqk,γqkとを算出することができる。この繰り返しは、所定の終了条件を満たすまで行われる。 By repeatedly applying the calculation of the cluster information C (f, τ) according to Equation (24) and the correction of the model parameters λ qk and γ qk according to Equation (25), better cluster information C (f, τ ) And model parameters λ qk and γ qk can be calculated. This repetition is performed until a predetermined end condition is satisfied.
[分離信号生成]
その後、上述のように得られたクラスタ情報C(f,τ)とを用い、周波数領域の分離信号Yk(f,τ)を生成する。具体的には、例えば、以下のように周波数領域の分離信号Yk(f,τ)を生成する
Thereafter, using the cluster information C (f, τ) obtained as described above, a frequency domain separation signal Y k (f, τ) is generated. Specifically, for example, the frequency domain separation signal Y k (f, τ) is generated as follows.
〔第1の実施の形態〕
次に、本発明における第1の実施の形態について説明する。本形態では、モデルパラメータλqk,γqkの最適化を行わずに、全周波数f∈Fについて、式(24)に従ってクラスタ情報C(f,τ)を生成する。
<ハードウェア構成>
図1は、第1の実施の形態における信号分離装置1のハードウェア構成を例示したブロック図である。
図1に例示するように、この例の信号分離装置1は、CPU(Central Processing Unit)10、入力部20、出力部30、補助記憶装置40、RAM(Random Access Memory)10d、ROM(Read Only Memory)50及びバス70を有している。
この例のCPU10は、制御部11、演算部12及びレジスタ13有し、レジスタ13に読み込まれた各種プログラムに従って様々な演算処理を実行する。また、この例の入力部20は、データが入力される入力ポート、キーボード、マウス等であり、出力部30は、データを出力する出力ポート、ディスプレイ等である。補助記憶装置40は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、本形態の信号分離処理を実行するための信号分離プログラムを格納した信号分離プログラム領域41及びセンサで観測された時間領域の混合信号等の各種データが格納されるデータ領域42を有している。また、RAM50は、例えば、SRAM (Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等であり、信号分離プログラムが書き込まれる信号分離プログラム領域51及び各種データが書き込まれるデータ領域52を有している。また、この例のバス70は、CPU10、入力部20、出力部30、補助記憶装置40、RAM50及びROM60を通信可能に接続している。
[First Embodiment]
Next, a first embodiment of the present invention will be described. In this embodiment, the cluster information C (f, τ) is generated according to the equation (24) for all frequencies fεF without optimization of the model parameters λ qk and γ qk .
<Hardware configuration>
FIG. 1 is a block diagram illustrating a hardware configuration of a
As illustrated in FIG. 1, a
The CPU 10 in this example includes a control unit 11, a calculation unit 12, and a
<ハードウェアとソフトウェアとの協働>
この例のCPU10は、読み込まれたOS(Operating System)プログラムに従い、補助記憶装置40の信号分離プログラム領域41に格納されている信号分離プログラムを、RAM50の信号分離プログラム領域51に書き込む。同様にCPU10は、補助記憶装置40のデータ領域42に格納されている時間領域の混合信号等の各種データをRAM50のデータ領域52に書き込む。さらに、CPU10は、この信号分離プログラムや各種データが書き込まれたRAM50上のアドレスをレジスタ13に格納する。そして、CPU10の制御部11は、レジスタ13に格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM50上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部12に順次実行させ、その演算結果をレジスタ13に格納していく。
<Cooperation between hardware and software>
The CPU 10 in this example writes the signal separation program stored in the signal
図2は、このようにCPU10に信号分離プログラムが読み込まれることにより構成される信号分離装置1のブロック図の例示である。また、図3は、図2における混合信号分類部130の詳細を例示したブロック図である。
図2に例示するように、本形態の信号分離装置1は、メモリ100、周波数領域変換部120、混合信号分類部130、分離信号生成部140、時間領域変換部150、制御部160及び一時メモリ170を有している。
FIG. 2 is an example of a block diagram of the
As illustrated in FIG. 2, the
ここで、メモリ100は、記憶領域101〜111を有している。また、図3に例示するように、混合信号分類部130は、周波数帯域決定部131、正規化部132、第1クラスタリング部133、モデルパラメータ抽出部134、第2クラスタリング部135を有している。また、正規化部132は、位相・ノルム正規化部132a及び周波数正規化部132bを有している。さらに、第1クラスタリング部133は、クラスタ決定部133a及びセントロイド算出部133bを有している。
Here, the
<処理>
次に、本形態における信号分離装置1の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、前処理において、各センサで観測された時間領域の混合信号xq(t)(q∈{1,...,M})がメモリ100の記憶領域101に格納され、基準センサQを示す値Qと、基準センサQと他のセンサqとの距離の最大値dmaxとが記憶領域105に格納され、セントロイドHk'の初期値又はクラスタ情報C(f,τ)の初期値が記憶領域107に格納されているものとする。
<Processing>
Next, processing of the
図4は、第1の実施の形態における信号分離装置1の処理を説明するためのフローチャートである。また、図5は、図4のステップS2の処理の詳細を説明するためのフローチャートである。また、図6及び図7は、図4のステップS3の処理の詳細を説明するためのフローチャートである。以下、これらの図を用いて本形態の処理を説明する。
なお、以下の各処理は制御部160の制御のもと実行される。また、明記しない限り、処理過程の各データは一時メモリ170に逐一格納・抽出される。
FIG. 4 is a flowchart for explaining processing of the
The following processes are executed under the control of the
[周波数領域変換部120の処理]
まず、周波数領域変換部120(図2)において、メモリ100の記憶領域101から時間領域の混合信号xq(t)を読み出し、これらを短時間離散フーリエ変換等によって時間周波数スロット(f,τ)毎の信号(周波数領域信号)Xq(f,τ)(q∈{1,...,M})に変換し、メモリ100の記憶領域102に格納する(ステップS1)。
[Processing of Frequency Domain Transformer 120]
First, in the frequency domain transform unit 120 (FIG. 2), the mixed signal x q (t) in the time domain is read from the
[混合信号分類部130の処理]
次に、混合信号分類部130の正規化部132が、メモリ100の記憶領域102から周波数領域信号Xq(f,τ)を読み込む。そして、正規化部132は、空間的エイリアシングが起き得ない周波数(f∈FL)に対し、周波数領域信号Xq(f,τ)の位相を正規化し、さらに周波数依存成分を排除した周波数正規化信号Xq''(f,τ)を生成する(ステップS2)。なお、ステップS2の詳細は後述する。生成された周波数正規化信号Xq''(f,τ)は、メモリ100の記憶領域104に格納される。
[Processing of Mixed Signal Classification Unit 130]
Next, the
次に、混合信号分類部130の第1クラスタリング部133が、メモリ100の記憶領域104から周波数正規化信号Xq'' (f,τ)を読み込む。そして、第1クラスタリング部133は、当該周波数正規化信号Xq'' (f,τ)を各要素とする、時間周波数毎の特徴量ベクトルX''(f,τ)=[X1''(f,τ),...,XM''(f,τ)]Tをクラスタリングし、各クラスタのセントロイドHk’を算出する(ステップS3)。なお、ステップS3の詳細は後述する。生成されたセントロイドHk’は、メモリ100の記憶領域108に格納される。
Next, the
次に、混合信号分類部130のモデルパラメータ抽出部134が、メモリ100の記憶領域108からセントロイドHk’を読み込む。モデルパラメータ抽出部134は、当該セントロイドHk’=[ H1k',..., HMk']Tの各要素を用い、前述の式(23)に従い、周波数応答モデルHqk(f)のモデルパラメータγqk, λqkを抽出する(ステップS4)。抽出されたモデルパラメータγqk, λqkは、メモリ100の記憶領域109に格納される。
Next, the model
次に、混合信号分類部130の第2クラスタリング部135が、メモリ100の記憶領域109からモデルパラメータγqk, λqkを読み込む。そして、第2クラスタリング部135は、全周波数Fについて、前述の式(24)に従い、モデルパラメータγqk, λqkが代入された周波数応答モデルHk(f)を基準とし、周波数領域信号の正規化値Xq’(f,τ)を各要素とする周波数依存の位相・ノルム正規化ベクトルX’(f,τ)=[X1’(f,τ),...,XM’(f,τ)]Tをクラスタリングする。これにより、各位相・ノルム正規化ベクトルX’(f,τ)が属するクラスタに対応する時間周波数スロット(f,τ)を示すクラスタ情報C(f,τ)が生成される(ステップS5)。生成されたクラスタ情報C(f,τ)は、メモリ100の記憶領域107に格納される。
Next, the
[分離信号生成部140の処理]
次に、分離信号生成部140が、メモリ100の記憶領域102,107から、それぞれ、周波数領域信号Xq(f,τ)及びクラスタ情報C(f,τ)を読み込む。そして、分離信号生成部140は、当該周波数領域信号Xq(f,τ)とクラスタ情報C(f,τ)とを用い、例えば、前述の式(28)に従い、周波数領域の分離信号Yk(f,τ)(k∈{1,...,N})を生成する(ステップS6)。生成された分離信号Yk(f,τ)は、メモリ100の記憶領域110に格納される。
[Processing of Separation Signal Generation Unit 140]
Next, the separated
[時間領域変換部150の処理]
次に、時間領域変換部150が、メモリ100の記憶領域110から分離信号Yk(f,τ)を読み込み、それを短時間逆フーリエ変換等によって時間領域の分離信号yk(t)に変換し、メモリ100の記憶領域111に格納する(ステップS7)。
[ステップS2の処理の詳細]
次に、ステップS2の処理の詳細を説明する。
まず、周波数帯域決定部131が、メモリ100の記憶領域105から値dmaxを読み込み、空間的エイリアシングが起き得ない周波数帯域FLを
FL={f: 0<f<c/(2dmax)}
によって算出する(ステップS11)。算出された値FLは、メモリ100の記憶領域106に格納される。
[Processing of time domain conversion unit 150]
Next, the time
[Details of Step S2 Processing]
Next, details of the process of step S2 will be described.
First, the frequency
F L = {f: 0 <f <c / (2d max )}
(Step S11). Calculated value F L is stored in the
次に、正規化部132の位相・ノルム正規化部132aが、メモリ100の記憶領域105から基準センサQを示す値Qを読み込み、さらに、記憶領域102から各周波数領域信号Xq(f,τ)と基準センサQに対応する各周波数領域信号XQ(f,τ)とを読み込む。そして、位相・ノルム正規化部132aは、周波数領域信号Xq(f,τ)の偏角を、基準センサQに対応する周波数領域信号XQ(f,τ)の偏角を基準に正規化し、その正規化値のノルムを所定値に正規化した値を各要素とする位相・ノルム正規化ベクトルX’(f,τ)=[X1’(f,τ),...,XM’(f,τ)]Tを生成する(ステップS12)。なお、この正規化は、例えば、例えば、前述の式(15)に従って行われる。生成された位相・ノルム正規化ベクトルX’(f,τ)は、メモリ100の記憶領域103に格納される。
Next, the phase /
次に、正規化部132の周波数正規化部132bが、メモリ100の記憶領域103,106から、それぞれ、位相・ノルム正規化ベクトルX’(f,τ)と値FLとを読み込む。そして、周波数正規化部132bは、例えば、式(18)に従い、周波数帯域FLに属する全ての周波数fについて、位相・ノルム正規化ベクトルX’(f,τ)の各要素X’q(f,τ)の偏角を周波数fに比例した値で除算する正規化を行い、位相・ノルム正規化ベクトルX’(f,τ)の周波数依存性を排除した周波数正規化信号Xq''(f,τ)(f∈FL)を生成する(ステップS13)。生成された周波数正規化信号Xq''(f,τ)は、メモリ100の記憶領域104に格納される。
Then, the
[ステップS3の処理の詳細(パターンA)]
次に、ステップS3の処理の詳細(パターンA)を説明する(図6)。
まず、第1クラスタリング部133が、メモリ100の記憶領域108からセントロイドHk’の初期値を読み込む(ステップS21)。
次に、第1クラスタリング部133のクラスタ決定部133aが、例えば、前述の式(22)に従い、記憶領域104から読み込んだ特徴量ベクトルX''(f,τ)(f∈FL)と、記憶領域108から読み込んだセントロイドHk’との距離の総和が最小となるように、各特徴量ベクトルX''(f,τ)に対応するクラスタを決定し、各特徴量ベクトルX''(f,τ)の時間周波数スロット(f,τ)に対応するクラスタ情報C(f,τ)に、当該特徴量ベクトルX''(f,τ)が属するクラスタを特定する値kを代入する(ステップS22)。このような処理がなされた各クラスタ情報C(f,τ)は、メモリ100の記憶領域107に格納される。
[Details of processing in step S3 (pattern A)]
Next, details (pattern A) of the processing in step S3 will be described (FIG. 6).
First, the
Next, the
次に、第1クラスタリング部133のセントロイド算出部133bが、メモリ100の記憶領域104,107から、それぞれ、特徴量ベクトルX''(f,τ)及びクラスタ情報C(f,τ)を読み込む。そして、セントロイド算出部133bは、例えば、前述の式(21)に従い、C(f,τ)=kである時間周波数スロット(f,τ)に対応する特徴量ベクトルX''(f,τ)を足し合わせ、その加算結果のノルムを所定値に正規化したものを新たなセントロイドHk’とする(ステップS23)。生成された新たなセントロイドHk’は、メモリ100の記憶領域108に格納される。
Next, the
次に、制御部160が、所定の終了条件を満たした否かを判断する(ステップS24)。この終了条件としては、例えば、「ステップS22,S23の処理を交互に所定回数繰り返したこと」や、「ステップS23で更新されたセントロイドHk’と更新前のセントロイドHk’との変位が、所定の範囲内であること」等を例示できる。ここで、制御部160が、所定の終了条件を満たしていないと判断した場合、制御部160は、処理をステップS22に戻す。一方、制御部160が、所定の終了条件を満たしたと判断した場合には、制御部160は、ステップS3の処理を終了させる。なお、ステップS3の処理が終了した時点でメモリ100の記憶領域108に格納されているセントロイドHk’を、正規のセントロイドHk’として取り扱う([ステップS3の処理の詳細(パターンA)]の説明終わり)。
Next, the
[ステップS3の処理の詳細(パターンB)]
次に、ステップS3の処理の詳細(パターンB)を説明する(図7)。
まず、第1クラスタリング部133が、メモリ100の記憶領域107からクラスタ情報C(f,τ)の初期値を読み込む(ステップS31)。
次に、第1クラスタリング部133のセントロイド算出部133bが、例えば、前述の式(21)に従い、C(f,τ)=kである時間周波数スロット(f,τ)に対応する特徴量ベクトルX''(f,τ)を足し合わせ、その加算結果のノルムを所定値に正規化したものを新たなセントロイドHk’とする。生成された新たなセントロイドHk’は、メモリ100の記憶領域108に格納される(ステップS32)。
[Details of processing in step S3 (pattern B)]
Next, details (pattern B) of the process of step S3 will be described (FIG. 7).
First, the
Next, the
次に、第1クラスタリング部133のクラスタ決定部133aが、例えば、前述の式(22)に従い、記憶領域104から読み込んだ特徴量ベクトルX''(f,τ)(f∈FL)と、記憶領域108から読み込んだセントロイドHk’との距離の総和が最小となるように、各特徴量ベクトルX''(f,τ)に対応するクラスタを決定し、各特徴量ベクトルX''(f,τ)の時間周波数スロット(f,τ)に対応するクラスタ情報C(f,τ)に、当該特徴量ベクトルX''(f,τ)が属するクラスタを特定する値kを代入する(ステップS33)。このような処理がなされた各クラスタ情報C(f,τ)は、メモリ100の記憶領域107に格納される。
Next, the
次に、制御部160が、所定の終了条件を満たした否かを判断する(ステップS34)。この終了条件としては、例えば、「ステップS32,S33の処理を交互に所定回数繰り返したこと」や、「ステップS32で更新されたセントロイドHk’と更新前のセントロイドHk’との変位が、所定の範囲内であること」等を例示できる。ここで、制御部160が、所定の終了条件を満たしていないと判断した場合、制御部160は、処理をステップS32に戻す。一方、制御部160が、所定の終了条件を満たしたと判断した場合には、制御部160は、ステップS3の処理を終了させる。なお、ステップS3の処理が終了した時点でメモリ100の記憶領域108に格納されているセントロイドHk’を、正規のセントロイドHk’として取り扱う([ステップS3の処理の詳細(パターンA)]の説明終わり)。
Next, the
〔第2の実施の形態〕
次に、本発明における第2の実施の形態について説明する。本形態は、モデルパラメータλqk,γqkの最適化を行って、全周波数f∈Fについて、式(24)に従ってクラスタ情報C(f,τ)を生成する。
<構成>
第1の実施の形態との相違点は混合信号分類部のみである。以下では、混合信号分類部の構成のみを示す。
図8は、第2の実施の形態における混合信号分類部230の詳細を例示したブロック図である。なお、図8において、第1の実施の形態と共通する部分については、図3と同じ符号を付し、説明を省略する。
図8に例示するように、本形態の混合信号分類部230は、周波数帯域決定部131、正規化部132、第1クラスタリング部133、モデルパラメータ抽出部134、第2クラスタリング部235を有している。ここで、本形態の第2クラスタリング部235は、クラスタ決定部235a及びモデルパラメータ最適化部235bを有している。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. In this embodiment, the model parameters λ qk and γ qk are optimized to generate cluster information C (f, τ) for all frequencies fεF according to the equation (24).
<Configuration>
The difference from the first embodiment is only the mixed signal classification unit. In the following, only the configuration of the mixed signal classification unit is shown.
FIG. 8 is a block diagram illustrating details of the mixed signal classifying unit 230 according to the second embodiment. In FIG. 8, portions common to the first embodiment are denoted by the same reference numerals as those in FIG. 3, and description thereof is omitted.
As illustrated in FIG. 8, the mixed signal classification unit 230 of this embodiment includes a frequency
<処理>
次に、本形態における信号分離装置の処理について説明する。なお、以下でも、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、第1の実施の形態と同じ前処理が行なわれているものとする。
図9は、第2の実施の形態における信号分離装置の処理を説明するためのフローチャートである。また、図10は、図9に示したステップS105の処理の詳細を説明するためのフローチャートである。
<Processing>
Next, processing of the signal separation device in this embodiment will be described. In the following, the situation where N source signals are mixed and observed by M sensors will be treated. Further, it is assumed that the same preprocessing as in the first embodiment is performed.
FIG. 9 is a flowchart for explaining processing of the signal separation device according to the second embodiment. FIG. 10 is a flowchart for explaining details of the process in step S105 shown in FIG.
以下、これらの図を用いて本形態の処理を説明する。なお、以下の各処理は制御部160の制御のもと実行される。また、明記しない限り、処理過程の各データは一時メモリ170に逐一格納・抽出される。
[周波数領域変換部120、周波数帯域決定部131、正規化部132、第1クラスタリング部133、モデルパラメータ抽出部134の処理]
これらの処理は、第1の実施の形態のステップS1〜S4と同じである(ステップS101〜S104)。
Hereinafter, the processing of this embodiment will be described with reference to these drawings. The following processes are executed under the control of the
[Processing of
These processes are the same as steps S1 to S4 in the first embodiment (steps S101 to S104).
[第2クラスタリング部235の処理]
本形態の第2クラスタリング部235は、全周波数f∈Fについて、モデルパラメータγqk, λqkが代入された周波数応答モデルHqk(f)を基準とし、位相・ノルム正規化ベクトルX’(f,τ)をクラスタリングし、クラスタ情報C(f,τ)を生成する処理と、クラスタ情報C(f,τ)と、位相・ノルム正規化ベクトルX’(f,τ)とを用い、モデルパラメータγqk, λqkを最適化する処理と、を交互に繰り返す(ステップS105)。これにより、最適化されたモデルパラメータγqk, λqkと、最適化されたモデルパラメータγqk, λqkが代入された周波数応答モデルHqk(f)を基準に生成されたクラスタ情報C(f,τ)とを得ることができる。以下、図10を用い、ステップS105の処理の詳細を説明する。
[Processing of Second Clustering Unit 235]
The
まず、第2クラスタリング部235が、メモリ100の記憶領域103,109から、それぞれ、位相・ノルム正規化ベクトルX’(f,τ)とモデルパラメータγqk, λqkとを読み込む。そして、第2クラスタリング部235のクラスタ決定部235aが、前述の式(24)に従い、位相・ノルム正規化ベクトルX'(f,τ)の各要素Xq'(f,τ)と、モデルパラメータγqk, λqkが代入された周波数応答モデルλqk・exp(-j・2π・f・γqk)と、の距離の総和を最小にするkを、位相・ノルム正規化ベクトルX'(f,τ)に対応するクラスタ情報C(f,τ)の値とする(ステップS111)。このような処理がなされたクラスタ情報C(f,τ)は、メモリ100の記憶領域107に格納される。
First, the
次に、第2クラスタリング部235のモデルパラメータ最適化部235bが、前述の式(26)(27)に従い、位相・ノルム正規化ベクトルX'(f,τ)の各要素Xq'(f,τ)に対応するセンサqと、クラスタ情報C(f,τ)が示す位相・ノルム正規化ベクトルX'(f,τ)が属するクラスタに対応する信号源kと、の組に対応するモデルパラメータγqk, λqkが代入された周波数応答モデルλqk・exp(-j・2π・f・γqk)と、当該位相・ノルム正規化ベクトルX'(f,τ)の各要素Xq'(f,τ)との距離の総和からなるコスト関数(式(16))に対し、モデルパラメータγqk, λqkに関する偏微分を行う(ステップS112)。そして、モデルパラメータ最適化部235bは、前述の式(25)に従い、各偏微分値に比例する値を、モデルパラメータγqk, λqkから、それぞれ、減算して当該モデルパラメータγqk, λqkを最適化する(ステップS113)。
Next, the model
次に、制御部160が、所定の終了条件を満たした否かを判断する(ステップS114)。この終了条件としては、例えば、「ステップS111,S112の処理を交互に所定回数繰り返したこと」や、「ステップS112で算出された各編微分値が所定の閾値以下であること」などを例示できる。ここで、制御部160が、所定の終了条件を満たしていないと判断した場合、制御部160は、処理をステップS111に戻す。一方、制御部160が、所定の終了条件を満たしたと判断した場合には、制御部160は、ステップS105の処理を終了させる。
Next, the
[分離信号生成部140及び時間領域変換部150の処理]
これらの処理は、第1の実施の形態のステップS6、S7と同じである(ステップS106,107)。
〔第3の実施の形態〕
次に、本発明における第3の実施の形態について説明する。本形態は、第2の実施の形態の変形例である。本形態では、任意にモデルパラメータλqk,γqkの初期値を選択し、第2の実施の形態と同様にモデルパラメータλqk,γqkの最適化を行ってモデルパラメータλqk,γqkを決定する。そして、全周波数f∈Fについて、式(24)に従ってクラスタ情報C(f,τ)を生成する。以下では、第1,2の実施の形態との相違点のみを示す。
[Processing of Separation
These processes are the same as steps S6 and S7 of the first embodiment (steps S106 and 107).
[Third Embodiment]
Next, a third embodiment of the present invention will be described. This embodiment is a modification of the second embodiment. In this embodiment, the initial values of the model parameters λ qk and γ qk are arbitrarily selected, and the model parameters λ qk and γ qk are optimized as in the second embodiment to obtain the model parameters λ qk and γ qk . decide. Then, cluster information C (f, τ) is generated for all frequencies fεF according to equation (24). Only differences from the first and second embodiments will be described below.
<構成>
第1の実施の形態との相違点は混合信号分類部のみである。以下では、混合信号分類部の構成のみを示す。
図11は、第3の実施の形態における混合信号分類部330の詳細を例示したブロック図である。なお、図11において、第1,2の実施の形態と共通する部分については、図3,8と同じ符号を付し、説明を省略する。
図1に例示するように、本形態の混合信号分類部330は、位相・ノルム正規化部132a、第2クラスタリング部235及びモデルパラメータ選択部333を有している。
<Configuration>
The difference from the first embodiment is only the mixed signal classification unit. In the following, only the configuration of the mixed signal classification unit is shown.
FIG. 11 is a block diagram illustrating details of the mixed signal classification unit 330 according to the third embodiment. In FIG. 11, portions common to the first and second embodiments are denoted by the same reference numerals as in FIGS. 3 and 8, and description thereof is omitted.
As illustrated in FIG. 1, the mixed signal classification unit 330 according to the present exemplary embodiment includes a phase /
<処理>
次に、本形態における信号分離装置の処理について説明する。なお、以下でも、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。また、第1の実施の形態と同じ前処理が行なわれているものとする。
図12は、第3の実施の形態における信号分離装置の処理を説明するためのフローチャートである。以下、これらの図を用いて本形態の処理を説明する。
[周波数領域変換部120の処理]
この処理は、第1の実施の形態のステップS1と同じである(ステップS201)。
<Processing>
Next, processing of the signal separation device in this embodiment will be described. In the following, the situation where N source signals are mixed and observed by M sensors will be treated. Further, it is assumed that the same preprocessing as in the first embodiment is performed.
FIG. 12 is a flowchart for explaining processing of the signal separation device according to the third embodiment. Hereinafter, the processing of this embodiment will be described with reference to these drawings.
[Processing of Frequency Domain Transformer 120]
This process is the same as step S1 of the first embodiment (step S201).
[位相・ノルム正規化部132aの処理]
この処理は、第1の実施の形態のステップS12と同じである(ステップS202)。
[モデルパラメータ選択部333の処理]
モデルパラメータ選択部333は、任意にモデルパラメータγqk, λqkの初期値を選択する。選択されたモデルパラメータγqk, λqkの初期値は、メモリ100の記憶領域109に格納される(ステップS203)。
[第2クラスタリング部235の処理]
この処理は、第2の実施の形態のステップS105と同じである(ステップS204)。
[Processing of phase /
This process is the same as step S12 of the first embodiment (step S202).
[Process of Model Parameter Selection Unit 333]
The model
[Processing of Second Clustering Unit 235]
This process is the same as step S105 of the second embodiment (step S204).
[分離信号生成部140及び時間領域変換部150の処理]
これらの処理は、第1の実施の形態のステップS6、S7と同じである(ステップS205,206)。
〔実験結果〕
次に、上述した各形態の効果を示すために、図13(a)に示した実験条件Aと、さらに図13(b)に示した実験条件Bとについて複数の音声を分離する実験を行った結果を示す。これらの条件は、空間的エイリアシングが起き得る条件である。なお、比較のため、以下の3種類の手順で実験を行った。
[Processing of Separation
These processes are the same as steps S6 and S7 in the first embodiment (steps S205 and 206).
〔Experimental result〕
Next, in order to show the effects of the above-described embodiments, an experiment is performed to separate a plurality of sounds under the experimental condition A shown in FIG. 13 (a) and the experimental condition B shown in FIG. 13 (b). The results are shown. These conditions are conditions under which spatial aliasing can occur. For comparison, the experiment was performed by the following three types of procedures.
手順I:空間的エイリアシングを考慮せず、すべての周波数f∈Fの混合信号ベクトルに対して、第1クラスタリング部によるクラスタリング、即ち、式(21)(22)を繰り返し適用した(従来構成)。そのため、空間的エイリアシングが起こっている高域では、生成されるクラスタが大きく間違っている可能性が高い。
手順II:空間的エイリアシングが起きない低域の周波数f∈FLの混合信号ベクトルのみに対して、第1クラスタリング部によるクラスタリング、即ち、式(21)(22)を繰り返し適用し、クラスタのセントロイドを用いてモデルパラメータを算出した(式(23))。そして、算出したモデルパラメータをそのまま用い、全ての周波数f∈Fについて、式(24)によってクラスタリングを行った(第1の実施の形態)。
手順III:モデルパラメータ最適化部によって、式(24)と(25)とを繰り返し適用して最適化したモデルパラメータλqk,γqkを用い、全ての周波数f∈Fについて、式(24)によってクラスタリングを行った(第2,3の実施の形態)。
Procedure I: Spatial aliasing was not considered, and clustering by the first clustering unit, that is, Expressions (21) and (22) were repeatedly applied to the mixed signal vectors of all frequencies fεF (conventional configuration). Therefore, in the high region where spatial aliasing occurs, there is a high possibility that the generated cluster is largely incorrect.
Procedure II: The clustering by the first clustering unit, that is, the expressions (21) and (22) are repeatedly applied to only the mixed signal vector of the low frequency fεF L where no spatial aliasing occurs, and the cent Model parameters were calculated using Lloyd (formula (23)). Then, using the calculated model parameters as they are, clustering was performed for all frequencies fεF according to Expression (24) (first embodiment).
Step III: Using the model parameters λ qk and γ qk optimized by repeatedly applying the equations (24) and (25) by the model parameter optimizing unit, for all frequencies fεF, the equation (24) is used. Clustering was performed (second and third embodiments).
以下は、16通りの音声の組み合わせに対して行われた各条件に対応する分離性能の平均値を示した表である。
〔各実施の形態の効果〕
以上、上述した各形態の効果をまとめる。各形態の手法により、空間的エイリアシングが起こる高城でも、混合信号ベクトルの分類が正しく行え、結果として分離性能が向上する。さらに、第2の実施の形態のように、全ての帯域での位相・ノルム正規化ベクトルを用いモデルパラメータλqk,γqkを改善することにより、その正確さが高まる。さらに、第3の実施の形態のように、任意にモデルパラメータλqk,γqkを選択し、これらを周波数依存の位相・ノルム正規化ベクトルを用いて改善していく手法によっても、空間的エイリアシングが起こる高城において精度の高い信号分離を行うことができる。
[Effect of each embodiment]
The effects of the above embodiments are summarized as above. With each form of technique, even in Takashiro, where spatial aliasing occurs, the mixed signal vectors can be correctly classified, resulting in improved separation performance. Further, as in the second embodiment, the accuracy is improved by improving the model parameters λ qk and γ qk using the phase / norm normalized vector in all bands. Further, as in the third embodiment, spatial aliasing is also achieved by a method of arbitrarily selecting model parameters λ qk and γ qk and improving them using a frequency-dependent phase / norm normalization vector. High-precision signal separation can be performed in Takashiro where this occurs.
〔変形例など〕
なお、本発明は上述の実施の形態に限定されるものではない。例えば、第1,2の実施の形態では、第1クラスタリング部が、空間的エイリアシングが起き得ない周波数f∈FLの特徴量ベクトルのみをクラスタリングすることとした。しかし、第1クラスタリング部が、空間的エイリアシングが起き得ない周波数f∈FLの特徴量ベクトルに、多少、空間的エイリアシングが起きうる周波数の特徴量ベクトルが混在したものをクラスタリングすることとしてもよい。前述の巡回的ジャンプが生じた特徴量ベクトルが多少混在していても、その割合が特徴量ベクトル全体からみてわずかであれば、ある程度の精度でクラスタリングを行い、モデルパラメータを生成することが可能だからである。すなわち、第1クラスタリング部は、空間的エイリアシングが起き得ない周波数を含む周波数帯域の特徴量ベクトルをクラスタリングするものであればよい。
[Modifications, etc.]
The present invention is not limited to the embodiment described above. For example, in the first and second embodiments, the first clustering unit clusters only the feature quantity vectors having the frequency fεF L at which spatial aliasing cannot occur. However, the first clustering unit may perform clustering of a feature vector having a frequency fεF L at which spatial aliasing cannot occur, and a feature vector having a frequency at which spatial aliasing may occur. . Even if feature vectors that have undergone the above-mentioned cyclic jumps are mixed together, if the ratio is small when viewed from the whole feature vectors, clustering can be performed with a certain degree of accuracy and model parameters can be generated. It is. That is, the first clustering unit only needs to cluster feature quantity vectors in a frequency band including frequencies where spatial aliasing cannot occur.
また、例えば、第1,2の実施の形態では、第2クラスタリング部が、全周波数f∈Fの位相・ノルム正規化ベクトルをクラスタリングすることとした。しかし、一部の周波数での分離信号が不要なのであれば、第2クラスタリング部が、全周波数帯域の一部であって、空間的エイリアシングが起き得る周波数を含む周波数帯域の正規化混合信号ベクトルをクラスタリングする構成であってもよい。 Further, for example, in the first and second embodiments, the second clustering unit clusters the phase / norm normalized vectors of all frequencies fεF. However, if separation signals at some frequencies are not necessary, the second clustering unit may calculate a normalized mixed signal vector of a frequency band that includes a frequency that is a part of the entire frequency band and that may cause spatial aliasing. A configuration for clustering may be used.
また、全ての周波数での分離信号が必要な場合であっても、第1クラスタリング部で生成されたクラスタ情報(「初期クラスタ情報」に相当)をも分離信号の生成に流用し、第2クラスタリング部が、第1クラスタリング部でクラスタ情報が生成されていない周波数のクラスタ情報のみを生成する構成であってもよい。これによって、クラスタリングの演算量を低減させることができる。また、第1クラスタリング部で生成されたクラスタ情報と、第2クラスタリング部で生成されたクラスタ情報が一部の周波数で重複していてもよい。さらに、第1クラスタリング部で生成されたクラスタ情報と、第2クラスタリング部で生成されたクラスタ情報が全周波数帯域Fを網羅していなくてもよい。すなわち、第1クラスタリング部が、空間的エイリアシングが起き得ない周波数を含む周波数帯域に対応する特徴量ベクトルがそれぞれ属するクラスタに対応する初期クラスタ情報を生成し、第2クラスタリング部が、空間的エイリアシングが起き得る周波数を含む周波数帯域に対応する正規化混合信号ベクトルがそれぞれ属するクラスタに対応するクラスタ情報を生成し、分離信号生成部が、第1クラスタリング部が生成した初期クラスタ情報と、第2クラスタリング部が生成したクラスタ情報とを用い、分離信号を生成する構成であってもよい。 Further, even when separated signals at all frequencies are required, the cluster information generated by the first clustering unit (corresponding to “initial cluster information”) is also used for the generation of separated signals, and the second clustering is performed. The unit may generate only cluster information of a frequency for which cluster information is not generated by the first clustering unit. Thereby, the calculation amount of clustering can be reduced. Further, the cluster information generated by the first clustering unit and the cluster information generated by the second clustering unit may overlap at some frequencies. Furthermore, the cluster information generated by the first clustering unit and the cluster information generated by the second clustering unit may not cover the entire frequency band F. That is, the first clustering unit generates initial cluster information corresponding to clusters to which feature vectors corresponding to frequency bands including frequencies where spatial aliasing cannot occur, and the second clustering unit performs spatial aliasing. Cluster information corresponding to clusters to which each of the normalized mixed signal vectors corresponding to frequency bands including frequencies that may occur belongs, and the separated signal generation unit includes initial cluster information generated by the first clustering unit, and a second clustering unit. The configuration may be such that the separated signal is generated using the cluster information generated by.
また、上述の第1,2の実施の形態では、式(15)によって位相・ノルム正規化ベクトルの各要素を生成する手法を例示した。しかし、周波数領域信号偏角を、基準センサに対応する周波数領域信号の偏角を基準に正規化し、その正規化値のノルムを所定値に正規化できるのであれば、特に、これに限定はされない。例えば、以下の式によって位相・ノルム正規化ベクトルの各要素を生成してもよい。
また、第1,2の実施の形態では、位相・ノルム正規化ベクトルの周波数依存成分を排除したものを周波数正規化信号とした。しかし、ノルム正規化を行わず、周波数正規化信号を構成してもよい。すなわち、周波数領域信号偏角を、基準センサに対応する周波数領域信号の偏角を基準に正規化し、ノルム正規化を行うことなく周波数依存成分を排除したものを周波数正規化信号としてもよい。この場合、第1クラスタリング部は、ノルムが正規化されていない周波数正規化ベクトルのクラスタリングを行うことになる。この場合のクラスタリング基準は、ベクトルがノルムを含めて似ているかどうかではなく、ベクトルの方向のみが似ているかどうかになる。これは、類似度を用いた評価になる。類似度の1つとしてコサイン距離
cosθ=|X'H(f,τ)・Hk'|/(‖X'(f,τ)‖・‖Hk'‖) …(29)
を例示できる。ここでθは、周波数正規化ベクトルと、セントロイドHk'のベクトルとがなす角度である。なお、・Hはベクトル・の複素共役転置ベクトルを示す。コサイン距離を用いる場合、第1クラスタリング部は、コサイン距離の総和
cosθ = | X 'H (f , τ) · H k' | / (‖X '(f, τ) || · ‖H k' ||) ... (29)
Can be illustrated. Here, θ is an angle formed by the frequency normalization vector and the vector of the centroid H k ′. Here, · H indicates a complex conjugate transposed vector of vector ·. When using the cosine distance, the first clustering unit calculates the sum of the cosine distances.
また、第1,2の実施の形態では、周波数正規化信号を各要素とし、特徴量ベクトルを構成した。しかし、周波数正規化信号を所定の関数へ代入して得られる値を各要素し、特徴量ベクトルを構成してもよい。例えば、ノルム正規化が行われていない周波数正規化信号を、ノルム正規化を行う関数に代入し、それによって得られた値を各要素して特徴量ベクトルを構成してもよい。また、センサ数2(N=2)の場合には、前述の式(9)で得られる各値を要素とする特徴量ベクトルや、2つのセンサ(センサqと基準センサQ)における周波数領域信号の位相差(式(8))を周波数で除したものを各要素とする特徴量ベクトルを用いてもよい。なお、前述の式(9)で得られる各値を要素とする特徴量ベクトルを用いる場合、第1クラスタリング部は、例えば、式(29)(30)を用いてクラスタリングを行う。 In the first and second embodiments, the frequency normalization signal is used as each element, and the feature quantity vector is configured. However, the value vector obtained by substituting the frequency normalized signal into a predetermined function may be used as each element to form the feature vector. For example, a frequency normalization signal that has not been norm-normalized may be substituted into a function that performs norm normalization, and values obtained thereby may be used as elements to form a feature vector. Further, when the number of sensors is 2 (N = 2), a feature quantity vector having each value obtained by the above equation (9) as an element, and a frequency domain signal in two sensors (sensor q and reference sensor Q). A feature amount vector having each element obtained by dividing the phase difference (equation (8)) by the frequency may be used. In addition, when using the feature-value vector which makes each value obtained by above-mentioned Formula (9) an element, a 1st clustering part performs clustering using Formula (29) (30), for example.
また、上述の各実施の形態では、式(28)を用いて周波数領域の分離信号を生成する手法を例示した。式(28)は、C(f,τ)=kのとき、それに対応する時間周波数スロット(f,τ)の周波数領域信号XQ(f,τ)(基準センサQに対応)を周波数領域の分離信号Yk(f,τ)とするものである。しかし、C(f,τ)=kのとき、基準センサQ以外のセンサに対応する周波数領域信号を周波数領域の分離信号Yk(f,τ)としてもよい。例えば、ある時間周波数スロット(f,τ)においてC(f,τ)=kのとき、その時間周波数スロット(f,τ)の周波数領域信号のうち最大のものを分離信号Yk(f,τ)としてもよい。ただし、この場合であっても、分離信号Yk(f,τ)として選択される周波数領域信号に対応するセンサは、各時間周波数スロット(f,τ)で同一とする。すなわち、ある時間周波数スロット(f,τ)で分離信号Yk(f,τ)として選択する周波数領域信号に対応するセンサを決定したら、他の時間周波数スロット(f,τ)でも同じセンサに対応する周波数領域信号を分離信号Yk(f,τ)として選択する。 In each of the above-described embodiments, the method of generating a frequency domain separation signal using Equation (28) is exemplified. Equation (28) shows that when C (f, τ) = k, the frequency domain signal X Q (f, τ) (corresponding to the reference sensor Q) of the corresponding time frequency slot (f, τ) is The separated signal Y k (f, τ) is used. However, when C (f, τ) = k, a frequency domain signal corresponding to a sensor other than the reference sensor Q may be used as the frequency domain separation signal Y k (f, τ). For example, when C (f, τ) = k in a certain time frequency slot (f, τ), the largest one of the frequency domain signals in that time frequency slot (f, τ) is separated signal Y k (f, τ ). However, even in this case, the sensor corresponding to the frequency domain signal selected as the separated signal Y k (f, τ) is the same in each time frequency slot (f, τ). That is, if the sensor corresponding to the frequency domain signal to be selected as the separation signal Y k (f, τ) is determined in a certain time frequency slot (f, τ), the same sensor is supported in the other time frequency slot (f, τ). The frequency domain signal to be selected is selected as the separation signal Y k (f, τ).
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
In addition, the various processes described above are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Needless to say, other modifications are possible without departing from the spirit of the present invention.
Further, the program describing the above-described processing contents can be recorded on a computer-readable recording medium. The computer-readable recording medium may be any medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, or a semiconductor memory. Specifically, for example, the magnetic recording device may be a hard disk device or a flexible Discs, magnetic tapes, etc. as optical disks, DVD (Digital Versatile Disc), DVD-RAM (Random Access Memory), CD-ROM (Compact Disc Read Only Memory), CD-R (Recordable) / RW (ReWritable), etc. As the magneto-optical recording medium, MO (Magneto-Optical disc) or the like can be used, and as the semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory) or the like can be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
本発明の産業上の利用分野としては、例えば、数十センチ間隔でマイクロホンを配置したテレビ会議システムや、高いサンプリング周波数でサンプリングした音声信号の信号分離を行うシステム等のように、空間的エイリアシングがおきやすい環境で利用されるシステムを例示できる。本発明により、このように空間的エイリアシングがおきやすい環境でも、全周波数について正しく信号分離を行うことができる。 Industrial applications of the present invention include spatial aliasing, such as a video conference system in which microphones are arranged at intervals of several tens of centimeters, and a system that separates audio signals sampled at a high sampling frequency. A system used in an easy-to-occur environment can be exemplified. According to the present invention, signal separation can be correctly performed for all frequencies even in an environment where spatial aliasing is likely to occur.
1 信号分離装置
130,230,330 混合信号分類部
1
Claims (13)
複数のセンサで観測された上記混合信号を、それぞれ、周波数領域信号に変換する周波数領域変換部と、
上記周波数領域信号の位相を正規化し、さらに周波数依存成分を排除した周波数正規化信号を生成する正規化部と、
上記周波数正規化信号、或いは、当該周波数正規化信号を所定の関数へ代入して得られる値を各要素とする、時間周波数毎の特徴量ベクトルをクラスタリングし、各クラスタのセントロイドを算出する第1クラスタリング部と、
上記セントロイドを用い、周波数応答モデルのモデルパラメータを算出するモデルパラメータ抽出部と、
上記モデルパラメータが代入された周波数応答モデル、又は、上記モデルパラメータを最適化したモデルパラメータが代入された周波数応答モデルを基準とし、上記周波数領域信号の位相・ノルム正規化値を各要素とする周波数依存の位相・ノルム正規化ベクトルをクラスタリングし、各位相・ノルム正規化ベクトルが属するクラスタに対応するクラスタ情報を生成する第2クラスタリング部と、
上記周波数領域信号と上記クラスタ情報とを用い、周波数領域の分離信号を生成する分離信号生成部と、
を有することを特徴とする信号分離装置。 A signal separation device that separates a mixed signal composed of a mixture of source signals emitted from a plurality of signal sources into a separated signal that is an estimate of the source signal,
A frequency domain converter that converts the mixed signals observed by a plurality of sensors into frequency domain signals, and
A normalization unit that normalizes the phase of the frequency domain signal and further generates a frequency normalized signal that excludes frequency-dependent components;
Clustering feature vectors for each time frequency using the frequency normalized signal or a value obtained by assigning the frequency normalized signal to a predetermined function as each element, and calculating a centroid for each cluster One clustering unit;
Using the centroid, a model parameter extraction unit that calculates model parameters of a frequency response model,
A frequency response model in which the model parameter is substituted or a frequency response model in which the model parameter optimized by the model parameter is substituted as a reference, and a frequency having a phase / norm normalized value of the frequency domain signal as each element. Clustering dependent phase / norm normalized vectors and generating cluster information corresponding to clusters to which each phase / norm normalized vector belongs;
Using the frequency domain signal and the cluster information, a separation signal generation unit that generates a frequency domain separation signal;
A signal separation device comprising:
上記第1クラスタリング部は、
空間的エイリアシングが起き得ない周波数を含む周波数帯域の上記特徴量ベクトルをクラスタリングし、
上記第2クラスタリング部は、
空間的エイリアシングが起き得る周波数を含む周波数帯域の上記位相・ノルム正規化ベクトルをクラスタリングする、
ことを特徴とする信号分離装置。 The signal separation device according to claim 1,
The first clustering unit includes:
Clustering the above feature vectors in a frequency band that includes frequencies where spatial aliasing cannot occur,
The second clustering unit includes
Clustering the phase-norm normalized vectors in a frequency band that includes frequencies where spatial aliasing can occur,
A signal separation device.
上記空間的エイリアシングが起き得ない周波数を含む周波数帯域は、
空間的エイリアシングが起き得ない周波数のみからなる周波数帯域である、
ことを特徴とする信号分離装置。 The signal separation device according to claim 2,
The frequency band including the frequency where the spatial aliasing cannot occur is
A frequency band consisting only of frequencies where spatial aliasing cannot occur,
A signal separation device.
上記空間的エイリアシングが起き得る周波数を含む周波数帯域は、
全周波数帯域である、
ことを特徴とする信号分離装置。 The signal separation device according to claim 2 or 3,
The frequency band including the frequency at which the spatial aliasing can occur is
All frequency bands,
A signal separation device.
上記第2クラスタリング部は、
上記クラスタ情報と、空間的エイリアシングが起き得る周波数を含む周波数帯域の上記位相・ノルム正規化ベクトルとを用い、上記モデルパラメータを最適化するモデルパラメータ最適化部を有する、
ことを特徴とする信号分離装置。 The signal separation device according to any one of claims 2 to 4,
The second clustering unit includes
A model parameter optimization unit that optimizes the model parameter using the cluster information and the phase / norm normalization vector in a frequency band including a frequency at which spatial aliasing may occur;
A signal separation device.
上記モデルパラメータは、
上記センサと、上記クラスタに対応する信号源との組に対応するパラメータであり、
上記モデルパラメータ最適化部は、
上記位相・ノルム正規化ベクトルの各要素に対応する上記センサと、上記クラスタ情報が示す当該位相・ノルム正規化ベクトルが属する上記クラスタに対応する信号源と、の組に対応する上記モデルパラメータが代入された周波数応答モデルと、当該位相・ノルム正規化ベクトルの各要素と、の距離の総和からなるコスト関数に対し、上記モデルパラメータに関する偏微分を行い、算出された偏微分値に比例する値を上記モデルパラメータから減算することによって当該モデルパラメータを最適化する、
ことを特徴とする信号分離装置。 The signal separation device according to claim 5,
The model parameters above are
A parameter corresponding to a set of the sensor and a signal source corresponding to the cluster;
The model parameter optimization unit
The model parameter corresponding to the set of the sensor corresponding to each element of the phase / norm normalized vector and the signal source corresponding to the cluster to which the phase / norm normalized vector indicated by the cluster information belongs is substituted. The partial differential with respect to the above model parameter is performed on the cost function consisting of the sum of the distances between the frequency response model and each element of the phase / norm normalized vector, and a value proportional to the calculated partial differential value is obtained. Optimize the model parameter by subtracting from the model parameter,
A signal separation device.
上記第2クラスタリング部は、
所定の終了条件が満たされるまで、上記クラスタ情報を生成する処理と、上記モデルパラメータを最適化する処理とを交互に実行し、
上記分離信号生成部は、
上記所定の終了条件を満たした時点で最新の上記クラスタ情報を用い、上記分離信号を生成する、
ことを特徴とする信号分離装置。 The signal separation device according to claim 6,
The second clustering unit includes
Until the predetermined end condition is satisfied, the process of generating the cluster information and the process of optimizing the model parameter are alternately executed,
The separated signal generator is
When the predetermined termination condition is satisfied, the latest cluster information is used to generate the separation signal.
A signal separation device.
上記第1クラスタリング部は、
空間的エイリアシングが起き得ない周波数を含む周波数帯域に対応する上記特徴量ベクトルがそれぞれ属するクラスタに対応する初期クラスタ情報を生成し、
上記第2クラスタリング部は、
空間的エイリアシングが起き得る周波数を含む周波数帯域に対応する上記位相・ノルム正規化ベクトルがそれぞれ属するクラスタに対応する上記クラスタ情報を生成し、
上記分離信号生成部は、
上記第1クラスタリング部が生成した上記初期クラスタ情報と、上記第2クラスタリング部が生成した上記クラスタ情報とを用い、上記分離信号を生成する、
ことを特徴とする信号分離装置。 The signal separation device according to claim 2,
The first clustering unit includes:
Generating initial cluster information corresponding to each cluster to which the feature vector corresponding to a frequency band including a frequency in which spatial aliasing cannot occur;
The second clustering unit includes
Generating the cluster information corresponding to the clusters to which the phase and norm normalization vectors corresponding to frequency bands including frequencies where spatial aliasing may occur;
The separated signal generator is
Generating the separation signal using the initial cluster information generated by the first clustering unit and the cluster information generated by the second clustering unit;
A signal separation device.
複数のセンサで観測された上記混合信号を、それぞれ、周波数領域信号に変換する周波数領域変換部と、
周波数応答モデルのモデルパラメータの初期値を選択するモデルパラメータ選択部と、
モデルパラメータが代入された周波数応答モデルを基準とし、上記周波数領域信号の位相・ノルム正規化値を各要素とする周波数依存の位相・ノルム正規化ベクトルをクラスタリングし、各位相・ノルム正規化ベクトルが属するクラスタに対応するクラスタ情報を生成するクラスタ決定部と、
上記クラスタ情報と、上記位相・ノルム正規化ベクトルとを用い、上記モデルパラメータを最適化するモデルパラメータ最適化部と、
所定の終了条件を満たすまで、上記クラスタ決定部及び上記モデルパラメータ最適化部の処理を交互に実行させる制御部と、
上記所定の終了条件を満たした時点において最新の上記クラスタ情報と、上記周波数領域信号とを用い、周波数領域の分離信号を生成する分離信号生成部と、
を有することを特徴とする信号分離装置。 A signal separation device that separates a mixed signal composed of a mixture of source signals emitted from a plurality of signal sources into a separated signal that is an estimate of the source signal,
A frequency domain converter that converts the mixed signals observed by a plurality of sensors into frequency domain signals, and
A model parameter selection unit for selecting initial values of model parameters of the frequency response model;
Clustering frequency-dependent phase / norm normalization vectors with each element as the phase / norm normalization value of the above frequency domain signal based on the frequency response model into which model parameters are substituted, and each phase / norm normalization vector is A cluster determination unit that generates cluster information corresponding to the cluster to which the cluster belongs;
A model parameter optimization unit that optimizes the model parameter using the cluster information and the phase / norm normalization vector;
Until the predetermined termination condition is satisfied, a control unit that alternately executes the processing of the cluster determination unit and the model parameter optimization unit,
A separation signal generation unit that generates a separation signal in the frequency domain using the latest cluster information and the frequency domain signal at the time when the predetermined termination condition is satisfied;
A signal separation device comprising:
複数のセンサで観測された上記混合信号を、それぞれ、周波数領域信号に変換する周波数領域変換過程と、
上記周波数領域信号の位相を正規化し、さらに周波数依存成分を排除した周波数正規化信号を生成する正規化過程と、
上記周波数正規化信号、或いは、当該周波数正規化信号を所定の関数へ代入して得られる値を各要素とする、時間周波数毎の特徴量ベクトルをクラスタリングし、各クラスタのセントロイドを算出する第1クラスタリング過程と、
上記セントロイドを用い、周波数応答モデルのモデルパラメータを算出するモデルパラメータ算出過程と、
上記モデルパラメータが代入された周波数応答モデル、又は、上記モデルパラメータを最適化したモデルパラメータが代入された周波数応答モデルを基準とし、上記周波数領域信号の位相・ノルム正規化値を各要素とする周波数依存の位相・ノルム正規化ベクトルをクラスタリングし、各位相・ノルム正規化ベクトルが属するクラスタに対応するクラスタ情報を生成する第2クラスタリング過程と、
上記周波数領域信号と上記クラスタ情報とを用い、周波数領域の分離信号を生成する分離信号生成過程と、
を有することを特徴とする信号分離方法。 A signal separation method for separating a mixed signal composed of a mixture of source signals emitted from a plurality of signal sources into a separated signal that is an estimation of the source signal,
A frequency domain conversion process for converting the mixed signals observed by a plurality of sensors into frequency domain signals,
Normalization process for generating a frequency normalized signal that normalizes the phase of the frequency domain signal and further eliminates frequency dependent components;
Clustering feature vectors for each time frequency using the frequency normalized signal or a value obtained by assigning the frequency normalized signal to a predetermined function as each element, and calculating a centroid for each cluster 1 clustering process,
Using the centroid, a model parameter calculation process for calculating a model parameter of a frequency response model,
A frequency response model in which the model parameter is substituted or a frequency response model in which the model parameter optimized by the model parameter is substituted as a reference, and a frequency having a phase / norm normalized value of the frequency domain signal as each element. Clustering dependent phase / norm normalized vectors and generating cluster information corresponding to clusters to which each phase / norm normalized vector belongs;
Using the frequency domain signal and the cluster information, a separation signal generation process for generating a frequency domain separation signal;
A signal separation method comprising:
複数のセンサで観測された上記混合信号を、それぞれ、周波数領域信号に変換する周波数領域変換過程と、
周波数応答モデルのモデルパラメータの初期値を選択するモデルパラメータ選択過程と、
所定の終了条件を満たすまで交互に繰り返される、
(a)モデルパラメータが代入された周波数応答モデルを基準とし、上記周波数領域信号の位相・ノルム正規化値を各要素とする周波数依存の位相・ノルム正規化ベクトルをクラスタリングし、各位相・ノルム正規化ベクトルが属するクラスタに対応するクラスタ情報を生成するクラスタリング過程と、
(b)上記クラスタ情報と、上記位相・ノルム正規化ベクトルとを用い、上記モデルパラメータを最適化するモデルパラメータ最適化過程と、
上記所定の終了条件を満たした後、その時点で最新の上記クラスタ情報と、上記周波数領域信号とを用い、周波数領域の分離信号を生成する分離信号生成過程と、
を有することを特徴とする信号分離方法。 A signal separation method for separating a mixed signal composed of a mixture of source signals emitted from a plurality of signal sources into a separated signal that is an estimation of the source signal,
A frequency domain conversion process for converting the mixed signals observed by a plurality of sensors into frequency domain signals,
Model parameter selection process for selecting initial values of model parameters of the frequency response model,
Repeated alternately until a predetermined termination condition is satisfied,
(A) Clustering frequency-dependent phase / norm normalized vectors having the phase / norm normalized values of the frequency domain signal as elements, based on the frequency response model into which model parameters are substituted, and each phase / norm normal A clustering process for generating cluster information corresponding to the cluster to which the quantization vector belongs;
(B) a model parameter optimization process for optimizing the model parameter using the cluster information and the phase / norm normalization vector;
A separation signal generation process for generating a separation signal in the frequency domain using the latest cluster information and the frequency domain signal at the time after satisfying the predetermined termination condition;
A signal separation method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006133728A JP4676920B2 (en) | 2006-05-12 | 2006-05-12 | Signal separation device, signal separation method, signal separation program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006133728A JP4676920B2 (en) | 2006-05-12 | 2006-05-12 | Signal separation device, signal separation method, signal separation program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007306373A JP2007306373A (en) | 2007-11-22 |
JP4676920B2 true JP4676920B2 (en) | 2011-04-27 |
Family
ID=38839925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006133728A Expired - Fee Related JP4676920B2 (en) | 2006-05-12 | 2006-05-12 | Signal separation device, signal separation method, signal separation program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4676920B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4964259B2 (en) * | 2009-02-10 | 2012-06-27 | 日本電信電話株式会社 | Parameter estimation device, sound source separation device, direction estimation device, method and program thereof |
JP5726790B2 (en) * | 2012-03-09 | 2015-06-03 | 日本電信電話株式会社 | Sound source separation device, sound source separation method, and program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09512676A (en) * | 1994-04-21 | 1997-12-16 | ブラウン ユニバーシティ リサーチ ファンデーション | Adaptive beamforming method and apparatus |
JP2001045592A (en) * | 1999-06-29 | 2001-02-16 | Alexander Goldin | Noise canceling microphone array |
JP2003078988A (en) * | 2001-09-06 | 2003-03-14 | Nippon Telegr & Teleph Corp <Ntt> | Sound pickup device, method and program, recording medium |
JP2006058065A (en) * | 2004-08-18 | 2006-03-02 | Nippon Telegr & Teleph Corp <Ntt> | Estimation method of number of signal sources, estimation device, estimation program and recording medium |
JP2007235784A (en) * | 2006-03-03 | 2007-09-13 | Nippon Telegr & Teleph Corp <Ntt> | Signal separating apparatus, signal separating method, signal separation program and recording medium |
-
2006
- 2006-05-12 JP JP2006133728A patent/JP4676920B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09512676A (en) * | 1994-04-21 | 1997-12-16 | ブラウン ユニバーシティ リサーチ ファンデーション | Adaptive beamforming method and apparatus |
JP2001045592A (en) * | 1999-06-29 | 2001-02-16 | Alexander Goldin | Noise canceling microphone array |
JP2003078988A (en) * | 2001-09-06 | 2003-03-14 | Nippon Telegr & Teleph Corp <Ntt> | Sound pickup device, method and program, recording medium |
JP2006058065A (en) * | 2004-08-18 | 2006-03-02 | Nippon Telegr & Teleph Corp <Ntt> | Estimation method of number of signal sources, estimation device, estimation program and recording medium |
JP2007235784A (en) * | 2006-03-03 | 2007-09-13 | Nippon Telegr & Teleph Corp <Ntt> | Signal separating apparatus, signal separating method, signal separation program and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2007306373A (en) | 2007-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4406428B2 (en) | Signal separation device, signal separation method, signal separation program, and recording medium | |
JP3949150B2 (en) | Signal separation method, signal separation device, signal separation program, and recording medium | |
JP6042858B2 (en) | Multi-sensor sound source localization | |
US9971012B2 (en) | Sound direction estimation device, sound direction estimation method, and sound direction estimation program | |
Bush et al. | A model-based Bayesian framework for sound source enumeration and direction of arrival estimation using a coprime microphone array | |
JP4769238B2 (en) | Signal separation device, signal separation method, program, and recording medium | |
JP6345327B1 (en) | Voice extraction device, voice extraction method, and voice extraction program | |
Nielsen et al. | Bayesian interpolation and parameter estimation in a dynamic sinusoidal model | |
JP6570673B2 (en) | Voice extraction device, voice extraction method, and voice extraction program | |
JP4676920B2 (en) | Signal separation device, signal separation method, signal separation program, and recording medium | |
CN115278496A (en) | Sparse sound source identification method and system for microphone array measurement | |
Zorych et al. | Particle filtering for dispersion curve tracking in ocean acoustics | |
Johnson et al. | Surface shape reconstruction from phaseless scattered acoustic data using a random forest algorithm | |
JP4630203B2 (en) | Signal separation device, signal separation method, signal separation program and recording medium, signal arrival direction estimation device, signal arrival direction estimation method, signal arrival direction estimation program and recording medium | |
JP4456571B2 (en) | Signal separation device, signal separation method, signal separation program, and recording medium | |
CN110036441B (en) | Target sound emphasis device and method, noise estimation parameter learning device and method, and recording medium | |
JP4738284B2 (en) | Blind signal extraction device, method thereof, program thereof, and recording medium recording the program | |
Zeitouni et al. | Single-sensor localization of moving acoustic sources using diffusion kernels | |
US11978441B2 (en) | Speech recognition apparatus, method and non-transitory computer-readable storage medium | |
Sircar et al. | Signal parameter estimation of complex exponentials using fourth order statistics: additive Gaussian noise environment | |
Tengan et al. | Direction-of-arrival and power spectral density estimation using a single directional microphone and group-sparse optimization | |
JP7024615B2 (en) | Blind separation devices, learning devices, their methods, and programs | |
JP2011139409A (en) | Audio signal processor, audio signal processing method, and computer program | |
Lobato et al. | Using learned priors to regularize the Helmholtz equation least-squares method | |
JP4787777B2 (en) | Signal separation device, signal separation method, signal separation program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140204 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4676920 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |