JP4653674B2 - Signal separation device, signal separation method, program thereof, and recording medium - Google Patents

Signal separation device, signal separation method, program thereof, and recording medium Download PDF

Info

Publication number
JP4653674B2
JP4653674B2 JP2006057899A JP2006057899A JP4653674B2 JP 4653674 B2 JP4653674 B2 JP 4653674B2 JP 2006057899 A JP2006057899 A JP 2006057899A JP 2006057899 A JP2006057899 A JP 2006057899A JP 4653674 B2 JP4653674 B2 JP 4653674B2
Authority
JP
Japan
Prior art keywords
output
signal
separation
matrix
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006057899A
Other languages
Japanese (ja)
Other versions
JP2006330687A (en
Inventor
比呂子 加藤
章子 荒木
裕一 永原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006057899A priority Critical patent/JP4653674B2/en
Publication of JP2006330687A publication Critical patent/JP2006330687A/en
Application granted granted Critical
Publication of JP4653674B2 publication Critical patent/JP4653674B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To perform signal separation which is suitable to a mixed signal mixed in actual environment wherein an unsteady noise is present. <P>SOLUTION: The product of a short-time discrete Fourier transformation arithmetic result X(f, m) of time-series data x(n) and a separate matrix W(f) is calculated to find Y(f, m). A differential form of a Pearson distribution system determined with parameters found from the Y(f, m) is used as a score function and a new separate matrix W(f) is repeatedly found from a score function arithmetic result &Phi;(Y(f, m)) of the Y(f, m) and the separate matrix W(f) to optimize the separate matrix W(f). An arithmetic result of the product of the optimized separate matrix W(f) and X(f, m) is processed through short-time discrete Fourier transformation to obtain a separate signal. <P>COPYRIGHT: (C)2007,JPO&amp;INPIT

Description

本発明は、信号処理の技術分野に属し、複数の信号が時間的・空間的に混合された混合信号から原信号を分離抽出する技術に関する。特に、独立成分分析(Independent Component Analysis : ICA)を用いて、原信号を分離抽出する信号分離技術に関する。   The present invention belongs to the technical field of signal processing, and relates to a technique for separating and extracting an original signal from a mixed signal in which a plurality of signals are mixed temporally and spatially. In particular, the present invention relates to a signal separation technique that separates and extracts an original signal using independent component analysis (ICA).

複数の信号源から発せられた信号(人の音声、音楽、騒音・雑音、生体信号、無線信号などの信号を広く指す。)は、空間的に混合し、また、反射や残響などによって時間的にも混合された混合信号となる。例えば信号が音の場合、人間の耳は、このような混合信号を感知するが、所謂カクテルパーティー効果と呼ばれるように、混合信号から所望の音響信号を聞き分けることが可能である。例えば、(音量にもよるが)様々な音が入り乱れる混雑の中で自分の名前を呼ばれても、自分の名前と他の音とを聞き分けることができる。   Signals emitted from multiple signal sources (human voice, music, noise / noise, biological signals, wireless signals, etc. are broadly referred to) are spatially mixed and temporally reflected or reverberated. Are also mixed signals. For example, when the signal is a sound, the human ear senses such a mixed signal, but it is possible to distinguish a desired acoustic signal from the mixed signal, so-called cocktail party effect. For example, even if your name is called in a crowd where various sounds are mixed up (depending on the volume), you can distinguish your name from other sounds.

ここで、音を例にして、人間の耳と同様の効果を得る信号処理を考える。
例えば混合信号をマイクロホン(microphone)によって観測して、観測信号を得るとする。この観測信号(混合信号)だけから、混合前の原信号(ここではマイクロホンによる観測を考えているので、信号源からの音だけをマイクロホンで観測したとした場合に相当する原信号を考える。)を推定することは、一般的にブラインド音源分離(Blind Source Separation : BSS)と呼ばれる。
Here, taking sound as an example, consider signal processing that obtains the same effect as a human ear.
For example, it is assumed that an observation signal is obtained by observing a mixed signal with a microphone. From this observation signal (mixed signal) alone, the original signal before mixing (in this case, since observation with a microphone is considered, consider the original signal corresponding to the case where only the sound from the signal source is observed with the microphone). Estimating is generally called Blind Source Separation (BSS).

信号が時間遅れなどをもって混合(畳み込み)して観測信号となる場合、その観測信号は式(9)によって与えられる。但し、原信号をs(t)=[s(t),s(t),・・・,s(t)]とする。Nは信号源数である。また、観測信号をx(t)=[x(t),x(t),・・・,x(t)]とする。Mは観測装置の総数である。εは時間遅れなどを表すパラメータである。

Figure 0004653674
When the signal is mixed (convolved) with time delay or the like to become an observation signal, the observation signal is given by Equation (9). However, let the original signal be s (t) = [s 1 (t), s 2 (t),..., S N (t)] T. N is the number of signal sources. Further, the observation signal is assumed to be x (t) = [x 1 (t), x 2 (t),..., X M (t)] T. M is the total number of observation devices. ε is a parameter representing time delay or the like.
Figure 0004653674

式(9)は時間領域の関係を表すものであるところ、一般的に、このような畳み込み信号を時間領域で扱うことは困難なので、式(9)に(離散)フーリエ変換を適用して周波数領域において扱うのが一般的である(例えば特許文献1参照)。

Figure 0004653674
Since Equation (9) represents the relationship in the time domain, in general, it is difficult to handle such a convolution signal in the time domain. It is common to handle in the area (see, for example, Patent Document 1).
Figure 0004653674

式(10)を行列表現すれば、式(11)となる。

Figure 0004653674
If Expression (10) is expressed as a matrix, Expression (11) is obtained.
Figure 0004653674

周波数領域において混合信号から分離された分離信号であって、(離散)フーリエ変換されたものをY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]とすると、式(12)が成立する。

Figure 0004653674
Y (f, m) = [Y 1 (f, m), Y 2 (f, m),. .., Y N (f, m)] If T , Equation (12) is established.
Figure 0004653674

式(12)におけるW(f)は、Y(f,m)の成分が互いに独立となるような分離行列である。このW(f)は、その成分の順序(パーミュテーション:Permutation)や大きさ(スケーリング:scaling)を各周波数で揃えた結果である。これについては後述する。これによって得られたY(f,m)を(離散)逆フーリエ変換することによって、所望の分離信号y(t)を得る。   W (f) in equation (12) is a separation matrix such that the components of Y (f, m) are independent of each other. This W (f) is the result of aligning the order (permutation) and size (scaling) of the components at each frequency. This will be described later. The desired separated signal y (t) is obtained by performing (discrete) inverse Fourier transform on Y (f, m) obtained in this way.

<Permutation>
Permutation問題を、信号源数Nと観測装置総数Mが等しく2である場合を例にとって説明する。例えばある周波数fにおいては、出力(周波数領域における分離信号)Y(f,m)に原信号1のf成分の推定が、出力Y(f,m)に原信号2のf成分の推定が得られるかもしれないが、周波数fとは異なる周波数fにおいては、出力Y(f,m)に原信号2のf成分の推定が、出力Y(f,m)に原信号1のf成分の推定が得られるかもしれない。これはICAが出力Yと出力Yとを独立にするだけで、出力の順序は問わないためである。もし出力の順序を考慮しないまま出力(周波数領域における分離信号)を時間領域に戻すならば、原信号1と原信号2の周波数成分の推定が混じってしまい分離できたとは言えなくなる。
<Permutation>
The permutation problem will be described with an example in which the number N of signal sources and the total number M of observation devices are equal to 2. For example, at a certain frequency f 1 , an estimate of the f 1 component of the original signal 1 is output to the output (separated signal in the frequency domain) Y 1 (f 1 , m), and the original signal 2 is output to the output Y 2 (f 1 , m). f 1 is the component of the estimate may be obtained, in the frequency f 2 different from the frequency f 1, the estimation of the output Y 1 (f 2, m) to f 2 components of the original signal 2, output Y 2 ( An estimate of the f 2 component of the original signal 1 may be obtained at f 2 , m). This is because the ICA only makes the output Y 1 and the output Y 2 independent, and the order of the outputs does not matter. If the output (separated signal in the frequency domain) is returned to the time domain without considering the order of the outputs, the estimation of the frequency components of the original signal 1 and the original signal 2 is mixed, and it cannot be said that the signals can be separated.

従って、全ての周波数において、出力Y(f,m)に原信号kの推定が対応するように並べかえなければならない。これをPermutationの解決という。Permutationの解決としては、式(12)から分かるように分離行列W(f)の行を入れかえれば良い。その方法としては例えば、近傍の周波数におけるいくつかの出力Y(f,m)の類似度(相関など)が高くなるように分離行列W(f)の行を入れかえる方法がある(特許文献2、非特許文献4)。 Therefore, it must be arranged so that the estimation of the original signal k corresponds to the output Y i (f, m) at all frequencies. This is called Permutation resolution. As a solution to the permutation, as can be seen from the equation (12), the rows of the separation matrix W (f) may be replaced. As such a method, for example, there is a method of changing the rows of the separation matrix W (f) so that the similarity (correlation, etc.) of some outputs Y i (f, m) at nearby frequencies becomes high (Patent Document 2). Non-Patent Document 4).

<スケーリング>
スケーリング問題を、信号源数Nと観測装置総数Mが等しく2である場合を例にとって説明する。ICAは出力Yと出力Yを独立にするだけで、その大きさは問わない。すなわち、ある周波数fにおいて、Y(f,m)とY(f,m)が解であれば、αY(f,m)およびβY(f,m)〔α、βは任意の定数〕も互いに独立なので解となる。つまり、出力の大きさに任意性があるわけである。この大きさを全ての周波数において同じにすることなく、出力を時間領域に戻すと、信号のスペクトル形状の異なるものが最終的な時間領域における分離信号y(n)として推定されてしまい、正しい信号分離が実現しない。
<Scaling>
The scaling problem will be described using an example in which the number N of signal sources and the total number M of observation devices are equal to 2. The ICA only makes the output Y 1 and the output Y 2 independent, and the size thereof does not matter. That is, at a certain frequency f, if Y 1 (f, m) and Y 2 (f, m) are solutions, αY 1 (f, m) and βY 2 (f, m) [α and β are arbitrary Since [Constant] is independent of each other, it is a solution. In other words, the output size is arbitrary. If the output is returned to the time domain without making this magnitude the same for all frequencies, a signal having a different spectral shape is estimated as the separated signal y (n) in the final time domain, and the correct signal Separation is not realized.

このようなスケーリング問題の解決手段としては、例えばMDP技術を用いることができる(非特許文献5)。   As a means for solving such a scaling problem, for example, MDP technology can be used (Non-Patent Document 5).

また、混合信号を分離するためにピアソン分布系独立成分分析(Pearson-ICA)という技術を提案した研究がある(非特許文献2参照。)。ピアソン分布系とは、データ記述が統計学上重要な課題であった19世紀末頃に、ピアソン(K.Pearson)が、得られたデータを当てはめるための分布系を式(13)に表される微分可能な確率密度関数f(x)で与えたものである(非特許文献3)。ピアソン分布系は、分布の範囲と4次までのサンプルモーメント(平均、分散、歪度、尖度)を用いて12の型に分類される。a、c、c、cは分布の型によって決まるパラメータである。

Figure 0004653674
In addition, there is a study that proposed a technique called Pearson-distributed independent component analysis (Pearson-ICA) in order to separate mixed signals (see Non-Patent Document 2). The Pearson distribution system is expressed by Equation (13) as a distribution system for applying data obtained by K. Pearson around the end of the 19th century, when data description was a statistically important issue. This is given by a differentiable probability density function f p (x) (Non-patent Document 3). Pearson distribution systems are classified into 12 types using the range of distribution and sample moments up to the fourth order (mean, variance, skewness, kurtosis). a, c 0 , c 1 and c 2 are parameters determined by the type of distribution.
Figure 0004653674

非特許文献2では、時間領域におけるICAにおいてスコア関数をピアソン分布系にした方がtanh関数よりも非線形スコア関数の分布を広くカバーしており、従って分離精度も上がることが示されている。   Non-Patent Document 2 shows that the distribution of non-linear score functions covers a wider range of non-linear score functions than the tanh function when the score function is Pearson distribution system in ICA in the time domain.

分離行列Wの推定に用いるスコア関数Φ(x)には適当な非線形関数が適用されるが、原信号のデータの確率分布関数f(x)が既知であれば、Φ(x)=−f’(x)/f(x)となるのが理想である。 An appropriate nonlinear function is applied to the score function Φ (x) used for estimating the separation matrix W. If the probability distribution function f p (x) of the original signal data is known, Φ (x) = − Ideally, f p ′ (x) / f p (x).

非特許文献2では、式(13)で表されるピアソン分布の微分形を時系列(時間領域)に直接適用し、スコア関数Φ(x)を式(14)で表したものが示されている。

Figure 0004653674
Non-Patent Document 2 shows that the differential form of the Pearson distribution represented by the equation (13) is directly applied to the time series (time domain), and the score function Φ (x) is represented by the equation (14). Yes.
Figure 0004653674

しかしながら、非特許文献2において取り扱っている信号は人工データであって、現実の信号においての適用が示されていない。また、非特許文献2で示される信号分離は時間領域(実数信号)で行われており、上述したような残響のある環境で混合された信号の分離に対して有効な周波数領域(複素信号)での信号分離に対してピアソン分布系の適用が示されていない。
特開2003−084793号広報 特開2004−145172号広報 Sawada,H., Mukai,R., Araki,S. and Makino,S.,"Polar coordinate based nonlinear function for frequency-domain blind source separation", IEICE Transactions, Fundamentals, Vol. E-86-A, No.3, March, pp.590-596 2003. Karvanen,J., Riksson,J. and Koivunen,V.,"Pearson system based method for blind separation", Proceedings of the Second International Workshop on Independent Component Analysis and Blind Signal Separation, pp.585-590, 2000. Johnson,N.L., Kotz,S. and Balakrishnan,N.,"Continuous Univariate Distributions", Vol.1, 2nd edition, John Wiley & Sons, New York, 1994. H.Sawada, R.Mukai, S.Araki, and S.Makino,"A Robust and Precise Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation", IEEE Trans. Speech and Audio Processing, Vol.12, No.5, pp.530-538 Sep. 2004. K.Matsuoka and S.Nakashima, "Minimal distortion principle for blind source separation", in Proc. ICA2001, Dec.2001, pp.722-727.
However, the signal handled in Non-Patent Document 2 is artificial data, and application to an actual signal is not shown. Further, the signal separation shown in Non-Patent Document 2 is performed in the time domain (real signal), and the frequency domain (complex signal) effective for the separation of signals mixed in the reverberant environment as described above. Application of the Pearson distribution system is not shown for signal separation at.
JP 2003/084793 PR Japanese Laid-Open Patent Publication No. 2004-145172 Sawada, H., Mukai, R., Araki, S. and Makino, S., "Polar coordinate based nonlinear function for frequency-domain blind source separation", IEICE Transactions, Fundamentals, Vol. E-86-A, No. 3, March, pp.590-596 2003. Karvanen, J., Riksson, J. and Koivunen, V., "Pearson system based method for blind separation", Proceedings of the Second International Workshop on Independent Component Analysis and Blind Signal Separation, pp.585-590, 2000. Johnson, NL, Kotz, S. And Balakrishnan, N., "Continuous Univariate Distributions", Vol.1, 2nd edition, John Wiley & Sons, New York, 1994. H. Sawada, R. Mukai, S. Araki, and S. Makino, "A Robust and Precise Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation", IEEE Trans. Speech and Audio Processing, Vol. 12, No .5, pp.530-538 Sep. 2004. K. Matsuoka and S. Nakashima, "Minimal distortion principle for blind source separation", in Proc.ICA 2001, Dec.2001, pp.722-727.

ところで、例えば音声信号の分布形状は、図16(b)、図17(b)のヒストグラムが示すように、中心が歪んで裾の長い非ガウス分布になる。参考文献1および参考文献2によると、ピアソン分布系の型は、式(15)で定義されるパラメータκによって分類可能である。
(参考文献1) : Nagahara, Y., "Non-Gaussian filter and smoother based on the Pearson distribution system", Journal of Time Series Analysis,Vol.24, No.6, pp.721-738,2003.
(参考文献2) : Nagahara, Y., "A method of Simulating multivariate nonnormal distributions by the Pearson system and estimation", Comp. Stat. Data Anal,Vol.47, issue 1, pp.1-29,2004.

Figure 0004653674
By the way, for example, as shown in the histograms of FIGS. 16B and 17B, the distribution shape of the audio signal becomes a non-Gaussian distribution with a distorted center and a long tail. According to Reference 1 and Reference 2, the type of the Pearson distribution system can be classified by the parameter κ defined by Equation (15).
(Reference 1): Nagahara, Y., "Non-Gaussian filter and smoother based on the Pearson distribution system", Journal of Time Series Analysis, Vol.24, No.6, pp.721-738,2003.
(Reference 2): Nagahara, Y., "A method of Simulating multivariate nonnormal distributions by the Pearson system and estimation", Comp. Stat. Data Anal, Vol. 47, issue 1, pp. 1-29, 2004.
Figure 0004653674

ここで、音声のように非正規的変動をする時系列信号に対して、その時系列信号のデータの3次と4次のサンプルモーメントである歪度sおよび尖度kを用いて、β=s、β=kとして与えられる。 Here, with respect to a time-series signal that fluctuates irregularly as in the case of speech, β 1 = It is given as s 2 , β 2 = k.

κ<0の場合をピアソン分布I型、0<κ<1の場合をピアソン分布IV型、1<κの場合をピアソン分布VI型と呼ぶ。   The case where κ <0 is called Pearson distribution type I, the case where 0 <κ <1 is called Pearson distribution type IV, and the case where 1 <κ is called Pearson distribution type VI.

例えば女性2名、男性2名による非混合音声、混合音声の歪度s、尖度kおよびパラメータκの値を表1に示す。

Figure 0004653674
For example, Table 1 shows values of unmixed speech, mixed speech distortion s, kurtosis k, and parameter κ of two females and two males.
Figure 0004653674

表1によれば、女性2名、男性2名による非混合音声、混合音声は、全てのパラメータκが0<κ<1を満たすことから、ピアソン分布IV型であることがわかる。   According to Table 1, it can be seen that the unmixed speech and the mixed speech by two females and two males satisfy the Pearson distribution type IV because all parameters κ satisfy 0 <κ <1.

特許文献1および非特許文献1では、混合音声を分離する際に、周波数帯域に分解することが示されている。周波数ごとの時系列は複素数であるため、その絶対値をとり、polar型に変換したものを用いている。複素数系列の絶対値の分布形状を上述した方法で調べると、図18(a)(b)(c)に示すように、音声の性質を特定する最初の周波数領域にはピアソン分布IV型やVI型が適しており、それ以外はピアソン分布I型が適していることがわかる。また、周波数によって分布形状は多様であることもわかる。即ち、全ての周波数領域に一律にsuper-Gaussianに限ったスコア関数を用いることは適さないといえる。このような実際の信号のデータの分布形状を考慮した上でのICAを用いた信号分離技術はまだ存在していない。   Patent Document 1 and Non-Patent Document 1 show that when a mixed sound is separated, it is decomposed into frequency bands. Since the time series for each frequency is a complex number, the absolute value is taken and converted to a polar type. When the distribution shape of the absolute value of the complex number sequence is examined by the above-described method, as shown in FIGS. 18 (a), (b), and (c), the Pearson distribution type IV and VI It can be seen that the type is suitable, and otherwise Pearson distribution type I is suitable. It can also be seen that the distribution shape varies depending on the frequency. That is, it can be said that it is not suitable to use a score function limited to super-Gaussian uniformly for all frequency regions. There has not yet been a signal separation technique using ICA in consideration of such an actual signal data distribution shape.

そこで本発明は、非定常雑音の存在する実環境下において混合された混合信号に好適な信号分離を行う信号分離装置およびその方法、プログラム、記録媒体を提供することを目的とする。   SUMMARY OF THE INVENTION An object of the present invention is to provide a signal separation apparatus, a method, a program, and a recording medium that perform signal separation suitable for a mixed signal mixed in an actual environment where non-stationary noise exists.

本発明の信号分離装置は、上記の課題を解決するものとして、次のように構成される。即ち、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕を記憶する記憶手段と、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、変換手段によって出力されたY(f,m)の絶対値|Y(f,m)|のサンプルモーメント(平均e、分散ν、歪度s、尖度k)を演算し、この演算結果を出力するサンプルモーメント演算手段と、サンプルモーメント演算手段によって出力された歪度sおよび尖度kから、β (β +3) /4(2β −3β −6)(4β −3β )〔但し、β =s 、β =kである。〕を演算して、この演算結果をκとして出力するκ演算手段と、κ演算手段によって出力されたκの値に基づいてピアソン分布型を判定するピアソン分布型判定手段と、ピアソン分布型判定手段によって判定されたピアソン分布型の確率密度関数f のパラメータを、サンプルモーメント演算手段によって出力されたサンプルモーメントから演算して、この演算結果を出力するピアソン分布型パラメータ演算手段と、ピアソン分布型パラメータ演算手段によって出力されたパラメータによって定まる確率密度関数f によって、式(16)

Figure 0004653674
〔jは虚数単位を表す。θ(Y(f,m))は複素平面上におけるY(f,m)の偏角を表す。f ’(|Y(f,m)|)は上記確率密度関数f の|Y(f,m)|による微分を表す。〕で表されるスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、第1反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を、各周波数に対して反復実行させる第2反復制御手段と、更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段とを備える(以下、この信号分離装置を信号分離装置Aということにする。)。 The signal separation device of the present invention is configured as follows to solve the above problems. That is, a signal separation device that separates original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices, and M observation devices M time series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T [x i (n) This represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. Storage means for storing], with respect to the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], The product W (f) of the short-time discrete Fourier transform computing means, X (f, m) outputted by the short-time discrete Fourier transform computing means, and the separation matrix W (f) of N rows and M columns X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] The conversion means that outputs as T , and the sample moment (average e, variance ν, skewness s, kurtosis k) of the absolute value | Y (f, m) | ) is calculated and a sample moment calculation means for outputting the operation result from the skewness s and kurtosis k output by the sample moment calculating means, β 1 (β 2 +3) 2/4 (2β 2 -3β 1 -6) (4β 2 −3β 1 ) [where β 1 = s 2 and β 2 = k. , And outputs the result of the calculation as κ, Pearson distribution type determination means for determining the Pearson distribution type based on the value of κ output by the κ calculation means, and Pearson distribution type determination means the parameters of the probability density function f p Pearson distribution types that are determined by and calculated from the output samples moment by the sample moment calculation means, a Pearson distribution type parameter calculation means for outputting the operation result, Pearson distributed parameter the probability density function f p determined by the output parameter by computing means, the equation (16)
Figure 0004653674
[J represents an imaginary unit. θ (Y (f, m)) represents the deflection angle of Y (f, m) on the complex plane. f p ′ (| Y (f, m) |) represents the differentiation of the probability density function f p by | Y (f, m) |. The score function Φ (Y (f, m)) represented by the score function calculating means for outputting the calculation result and the score function calculating means Φ (Y (f, m)) And the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the conversion means, and the average of the sums regarding the frame time is calculated, and the calculation result is expressed as <Φ (Y ( f, m)) Y H (f, m)> [However,
Figure 0004653674
And ], The separation matrix W (f) is the difference between the frame time averaging means, the unit matrix I, and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means. ) And learning size η, and further adding a separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) Then, the updating means for outputting the calculation result as a new separation matrix W (f), and the conversion means, the score function calculating means, the frame time averaging means, and the updating means for a single frequency are subjected to predetermined repetition conditions. The first iteration control means for repeatedly executing until the condition is satisfied, and the second iteration for controlling the first iteration control means to repeatedly execute the conversion means, the score function calculating means, the frame time averaging means, and the updating means for each frequency. The frequency output by the control means and the update means For each separation matrix W (f), each separation matrix W (f) is such that each component of Y (f, m) output by the transform means corresponds to the estimation of the same original signal at all frequencies. And the separation matrix W so that each component of Y (f, m) output by the conversion means has approximately the same amplitude as the estimation of each original signal at all frequencies. The scaling processing means for adjusting (f) and the short-time discrete inverse Fourier transform of Y (f, m) output by the conversion means are calculated, and the calculation result is obtained as a separated signal y (n) = [y 1 ( n), y 2 (n) , ···, obtain Preparations and restoring means for outputting the y n (n)] T (hereinafter, will be the signal separation device that the signal separation device a.).

また、本発明の上記の信号分離装置Aにおいては、記憶手段には、原信号として想定される信号の時系列データである教師信号d(n)をも記憶し、記憶手段に記憶された教師信号d(n)に対して、フレーム時刻mごとに、短時間離散フーリエ変換を演算して、この演算結果をD(f,m)として出力する第2短時間離散フーリエ変換演算手段を備え、サンプルモーメント演算手段は、第2短時間離散フーリエ変換演算手段によって出力されたD(f,m)の絶対値|D(f,m)|のサンプルモーメント(平均、分散、歪度、尖度)を演算し、この演算結果を出力するものであるものとしてもよい。   In the signal separation device A of the present invention, the storage means also stores a teacher signal d (n), which is time-series data of a signal assumed as an original signal, and the teacher stored in the storage means A second short-time discrete Fourier transform calculating means for calculating a short-time discrete Fourier transform for the signal d (n) at each frame time m and outputting the calculation result as D (f, m); The sample moment calculating means is a sample moment (average, variance, skewness, kurtosis) of the absolute value | D (f, m) | of D (f, m) output by the second short-time discrete Fourier transform calculating means. It is good also as what outputs this calculation result.

さらに、本発明の信号分離装置は、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕および式(17)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕を記憶する記憶手段と、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、変換手段によって出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、

Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差である行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値に基づく指標を演算して、この演算結果を<C>として出力する非対角成分演算手段と、非対角成分演算手段によって出力された<C>と、閾値Minとの大小を判定し、この判定結果を出力する非対角成分判定手段と、非対角成分判定手段によって出力された判定結果が、<C>の値が閾値Minの値以下である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Minの値を<C>の値に設定する第2更新手段と、1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、各グリッドBに対して、第1反復手段、非対角成分演算手段、非対角成分判定手段、第2更新手段を実行して、分離行列W(f)を得るグリッド反復制御手段と、第1反復制御手段およびグリッド反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段、非対角成分演算手段、非対角成分判定手段、第2更新手段を、各周波数に対して反復実行させる第2反復制御手段と、更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段とを備え、スコア関数Φ(Y(f,m))は、式(17)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕ことを特徴とする。 Furthermore, the signal separation device of the present invention is a signal separation device that separates original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices. M time series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T of observation signals observed by M observation devices [X i (n) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] And α values {b 01 , b 02 ,..., B } of the parameter b 0 of the score function Φ (Y (f, m)) represented by the equation (17) and β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. Storage means for storing], with respect to the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], The product W (f) of the short-time discrete Fourier transform computing means, X (f, m) outputted by the short-time discrete Fourier transform computing means, and the separation matrix W (f) of N rows and M columns X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A conversion function that outputs as T , and a score function Φ (Y (f, m)) that receives Y (f, m) output by the conversion means as an input, and a score function that outputs the calculation result The product of the calculation means, Φ (Y (f, m)) output by the score function calculation means, and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the conversion means mean calculates the sum concerning the frame time, the result of the calculation <Φ (Y (f, m )) Y H (f, m)> [however ,
Figure 0004653674
And ], The separation matrix W (f) is the difference between the frame time averaging means, the unit matrix I, and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means. ) And learning size η, and further adding a separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) Then, the updating means for outputting the calculation result as a new separation matrix W (f), the unit matrix I, and <Φ (Y (f, m)) Y H (f, m)>, an index based on the absolute value of the off-diagonal component of the matrix I− <Φ (Y (f, m)) Y H (f, m)> is calculated, Determining the magnitude of the non-diagonal component calculation means output as C>, the <C> output by the non-diagonal component calculation means, and the threshold Min; The non-diagonal component determination means for outputting the determination result of the above and the determination result output by the non-diagonal component determination means when the value of <C> is less than or equal to the value of the threshold Min, the separation matrix W (f) Is set to the separation matrix W (f) output by the updating means, and the second updating means for setting the value of the threshold Min to the value of <C>, conversion means, score function calculating means for one frequency , the frame time averaging means, a first iteration control means for repeating perform the update means until a predetermined iteration condition is satisfied, for each grid B R, first iteration means, the non-diagonal component calculation unit, the off-diagonal elements The determination means and the second update means are executed to obtain the separation matrix W (f), the grid iteration control means, the first iteration control means and the grid iteration control means are controlled, the transformation means, the score function calculation means, the frame Time averaging means, further Means, non-diagonal component calculation means, non-diagonal component determination means, and second update means are repeatedly executed for each frequency, and each separation matrix W for each frequency output by the update means. For (f), the rows of each separation matrix W (f) are rearranged so that each component of Y (f, m) output by the conversion means corresponds to the estimation of the same original signal at all frequencies. The separation matrix W (f) is adjusted so that each component of Y (f, m) output by the conversion means at the permutation processing means and at all frequencies has approximately the same amplitude as the estimation of each original signal. And a short-time discrete inverse Fourier transform of Y (f, m) output by the conversion means, and the result of the calculation is obtained as a separated signal y (n) = [y 1 (n), y 2. (N) ..., and a restoring means for outputting the y N (n)] T, the score function [Phi (Y (f, m)), is represented by the formula (17)
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. It is characterized by that.

さらに、本発明の信号分離装置は、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(18)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕、原信号s(n)=[s(n), s(n),・・・,s(n)]、各信号源Jから各観測装置iまでのインパルス応答hiJ(n)および閾値Maxを記憶する記憶手段と、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、変換手段によって出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、

Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、分離行列W(f)に対して、短時間離散逆フーリエ変換を演算して、この演算結果をw(n)として出力する短時間離散逆フーリエ変換演算手段と、短時間離散逆フーリエ変換演算手段によって出力されたw(n)、記憶手段に記憶された原信号s(n)およびインパルス応答hiJ(n)から、各周波数における分離精度値SIRを演算して出力する分離精度値演算手段と、分離精度値演算手段によって出力された分離精度値SIRと記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定手段と、分離精度値判定手段によって出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新手段と、1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、各グリッドBに対して、第1反復手段、短時間離散逆フーリエ変換演算手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を実行して、分離行列W(f)を得るグリッド反復制御手段と、第1反復制御手段およびグリッド反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段、短時間離散逆フーリエ変換演算手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を、各周波数に対して反復実行させる第2反復制御手段と、更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段とを備え、スコア関数Φ(Y(f,m))は、式(18)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕ことを特徴とするものであってもよい。 Furthermore, the signal separation device of the present invention is a signal separation device that separates original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices. M time series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T of observation signals observed by M observation devices [X i (n) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ], Wherein the score function expressed by (18) Φ (Y (f , m)) α number of values of the parameters b 0 of {b 01, b 02, ··· , b 0α}, the parameters b 1 beta Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ], Original signal s (n) = [s 1 (n), s 2 (n),..., S N (n)], impulse response h iJ (n from each signal source J to each observation device i ) storage means for storing and threshold Max, against the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to n m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], The product W (f) of the short-time discrete Fourier transform computing means, X (f, m) outputted by the short-time discrete Fourier transform computing means, and the separation matrix W (f) of N rows and M columns X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A conversion function that outputs as T , and a score function Φ (Y (f, m)) that receives Y (f, m) output by the conversion means as an input, and a score function that outputs the calculation result The product of the calculation means, Φ (Y (f, m)) output by the score function calculation means, and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the conversion means mean calculates the sum concerning the frame time, the result of the calculation <Φ (Y (f, m )) Y H (f, m)> [however ,
Figure 0004653674
And ], The separation matrix W (f) is the difference between the frame time averaging means, the unit matrix I, and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means. ) And learning size η, and further adding a separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) Then, the updating means for outputting the calculation result as a new separation matrix W (f) and the short-time discrete inverse Fourier transform for the separation matrix W (f) are calculated, and the calculation result is expressed as w (n ) Output as the short-time discrete inverse Fourier transform operation means, w (n) output by the short-time discrete inverse Fourier transform operation means, the original signal s (n) stored in the storage means, and the impulse response h iJ (n ) To calculate and output the separation accuracy value SIR at each frequency. An accuracy value calculating means; a separation accuracy value determining means for determining the magnitude of the separation accuracy value SIR output by the separation accuracy value calculating means and the threshold value Max stored in the storage means; and outputting the determination result; If the determination result output by the value determining means indicates that the separation accuracy value SIR is greater than or equal to the threshold Max, the separation matrix W (f) is set to the separation matrix W (f) output by the updating means and the threshold Max is set. A second updating unit that sets a value to the separation accuracy value SIR, and a first unit that repeatedly executes a conversion unit, a score function calculating unit, a frame time averaging unit, and an updating unit for one frequency until a predetermined iteration condition is satisfied. and repeat control means for each grid B R, first iteration means, short discrete inverse Fourier transform computing means, separation accuracy value calculation unit, the separation accuracy value determining section, the second updating means And controlling the grid iterative control means, the first iterative control means and the grid iterative control means to obtain the separation matrix W (f), converting means, score function calculating means, frame time averaging means, updating means, short A second iterative control means for repeatedly executing the time discrete inverse Fourier transform operation means, the separation accuracy value calculation means, the separation accuracy value determination means, and the second update means for each frequency; and for each frequency output by the update means For each separation matrix W (f), each component of Y (f, m) output by the transform means corresponds to that of the same original signal estimation at all frequencies. The permutation processing means for rearranging the rows and the Y (f, m) components output by the conversion means at all frequencies have approximately the same amplitude as the estimation of each original signal. And a scaling processing unit that adjusts the separation matrix W (f) so as to have a short-time discrete inverse Fourier transform of Y (f, m) output by the conversion unit, and the calculation result is converted into a separation signal y ( n) = [y 1 (n), y 2 (n),..., y N (n)] with a restoration means for outputting as T , and the score function Φ (Y (f, m)) It is represented by (18)
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. It may be characterized by that.

さらには、本発明の信号分離装置は、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(19)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕および閾値Maxを記憶する記憶手段と、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、変換手段によって出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、

Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、スコア関数ΦとしてΦ(Y(f,m))=tanh(|Y(f,m)|)exp(jθ(Y(f,m)))などのsuper-Gaussian分布を仮定した関数を用いて、Wp(f)+[I−<Φ(Y(f,m))Y(f,m)>]Wp(f)を演算し、この演算結果を新たな分離行列Wp(f)として出力するsuper-Gaussian型更新手段と、super-Gaussian型更新手段によって出力された分離行列Wp(f)とX(f,m)との積を求めて、Yp(f,m)=Wp(f)X(f,m)として出力するsuper-Gaussian型変換手段と、super-Gaussian型変換手段によって出力されたYp(f,m)と、更新手段によって出力された分離行列W(f)とを用いて各周波数における分離精度値SIRを演算して出力する分離精度値演算手段と、分離精度値SIRと、記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定手段と、分離精度値判定手段によって出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新手段と、1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、各グリッドBに対して、第1反復手段、super-Gaussian型更新手段、super-Gaussian型変換手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を実行して、分離行列W(f)を得るグリッド反復制御手段と、第1反復制御手段およびグリッド反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段、super-Gaussian型更新手段、super-Gaussian型変換手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を、各周波数に対して反復実行させる第2反復制御手段と、更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段とを備え、スコア関数Φ(Y(f,m))は、式(19)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕ことを特徴とするものとしてもよい。 Furthermore, the signal separation device of the present invention separates an original signal emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices. And M time-series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] of observation signals observed by M observation devices. T [x i (n) represents time series data of an observation signal observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 of the score function Φ (Y (f, m)) represented by the equation (19), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ] And storage means for storing a threshold value Max, against the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], The product W (f) of the short-time discrete Fourier transform computing means, X (f, m) outputted by the short-time discrete Fourier transform computing means, and the separation matrix W (f) of N rows and M columns X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A conversion function that outputs as T , and a score function Φ (Y (f, m)) that receives Y (f, m) output by the conversion means as an input, and a score function that outputs the calculation result The product of the calculation means, Φ (Y (f, m)) output by the score function calculation means, and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the conversion means mean calculates the sum concerning the frame time, the result of the calculation <Φ (Y (f, m )) Y H (f, m)> [however ,
Figure 0004653674
And ], The separation matrix W (f) is the difference between the frame time averaging means, the unit matrix I, and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means. ) And learning size η, and further adding a separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) Then, update means for outputting the calculation result as a new separation matrix W (f), and Φ (Y (f, m)) = tanh (| Y (f, m) |) exp (jθ as the score function Φ Wp (f) + [I− <Φ (Y (f, m)) Y H (f, m)>] using a function assuming a super-Gaussian distribution such as (Y (f, m))). Super-Gaussian type updating means for calculating Wp (f) and outputting the calculation result as a new separation matrix Wp (f) and super-Gaussian type updating means Super-Gaussian type conversion means for obtaining the product of the separation matrix Wp (f) and X (f, m) and outputting as Yp (f, m) = Wp (f) X (f, m); Separation accuracy value calculation means for calculating and outputting the separation accuracy value SIR at each frequency using Yp (f, m) output by the Gaussian type conversion means and the separation matrix W (f) output by the updating means. The separation accuracy value SIR and the threshold value Max stored in the storage means are determined, and the separation accuracy value determination means for outputting the determination result and the determination result output by the separation accuracy value determination means are separated. A second update that sets the separation matrix W (f) to the separation matrix W (f) output by the updating means and sets the value of the threshold Max to the separation accuracy value SIR when the accuracy value SIR is equal to or greater than the threshold Max. Means and one frequency Converting means, the score function operation unit, the frame time averaging means, a first iteration control means for repeating perform the update means until a predetermined iteration condition is satisfied, for each grid B R, first iteration means, super-Gaussian type Grid iterative control means for obtaining a separation matrix W (f) by executing updating means, super-Gaussian type converting means, separation accuracy value calculating means, separation accuracy value determining means, and second updating means, and first iteration control means And grid iterative control means, and conversion means, score function calculation means, frame time averaging means, update means, super-Gaussian type update means, super-Gaussian type conversion means, separation accuracy value calculation means, separation accuracy value determination Means, second updating means for repeatedly executing the second updating means for each frequency, and each separation matrix W (f) for each frequency outputted by the updating means is output by the converting means. Permutation processing means for rearranging the rows of each separation matrix W (f) so that each component of Y (f, m) corresponds as an estimate of the same original signal at all frequencies, and all frequencies , The scaling processing means for adjusting the separation matrix W (f) so that each component of Y (f, m) output by the converting means has approximately the same amplitude as the estimation of each original signal, and the output by the converting means The short-time discrete inverse Fourier transform of Y (f, m) performed is calculated, and the calculation result is obtained as a separated signal y (n) = [y 1 (n), y 2 (n),..., Y N (N)] is provided with restoration means for outputting as T , and the score function Φ (Y (f, m)) is expressed by Expression (19).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. It may be characterized by that.

本発明の信号分離方法は、上記の課題を解決するものとして、次のような方法とする。即ち、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕が記憶されるとし、信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、信号分離装置のサンプルモーメント演算手段が、第1変換ステップにおいて出力されたY(f,m)の絶対値|Y(f,m)|のサンプルモーメント(平均e、分散ν、歪度s、尖度k)を演算し、この演算結果を出力するサンプルモーメント演算ステップと、信号分離装置のκ演算手段が、サンプルモーメント演算ステップにおいて出力された歪度sおよび尖度kから、β (β +3) /4(2β −3β −6)(4β −3β )〔但し、β =s 、β =kである。〕を演算して、この演算結果をκとして出力するκ演算ステップと、信号分離装置のピアソン分布型判定手段が、κ演算ステップにおいて出力されたκの値に基づいてピアソン分布型を判定するピアソン分布型判定ステップと、信号分離装置のピアソン分布型パラメータ演算手段が、ピアソン分布型判定ステップにおいて判定されたピアソン分布型の確率密度関数f のパラメータを、サンプルモーメント演算ステップにおいて出力されたサンプルモーメントから演算して、この演算結果を出力するピアソン分布型パラメータ演算ステップと、信号分離装置のスコア関数演算手段が、ピアソン分布型パラメータ演算ステップにおいて出力されたパラメータによって定まる確率密度関数f によって、式(20)

Figure 0004653674
〔jは虚数単位を表す。θ(Y(f,m))は複素平面上におけるY(f,m)の偏角を表す。f ’(|Y(f,m)|)は上記確率密度関数f の|Y(f,m)|による微分を表す。〕で表されるスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、サンプルモーメント演算ステップ、κ演算ステップ、ピアソン分布型判定ステップ、ピアソン分布型パラメータ演算ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、信号分離装置の第2反復制御手段が、第1反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップとを有する(以下、この信号分離方法を信号分離方法Bということにする。)。 The signal separation method of the present invention is as follows to solve the above problems. That is, a signal separation method for separating, in a signal separation device, original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices, In the storage means of the separation device, M time series data x (n) = [x 1 (n), x 2 (n),..., X M of observation signals observed by M observation devices. (N)] T [x i (n) represents time series data of an observation signal observed by the i-th observation device. T represents a transposed matrix. ] Is stored, and the short-time discrete Fourier transform calculation means of the signal separation device performs the frame time m [however, the number of frames is N m with respect to the time-series data x (n) stored in the storage means. To do. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], And the conversion means of the signal separating device outputs X (f, m) output in the short-time discrete Fourier transform operation step and the N-by-M separation matrix W (f ) And the product W (f) X (f, m) and Y (f, m) = [Y 1 (f, m), Y 2 (f, m),. .., Y N (f, m)] The first conversion step that is output as T , and the sample moment calculation means of the signal separation device output the absolute value | Y (Y (f, m) output in the first conversion step. f, m) | sample moment (average e, variance ν, skewness s, kurtosis k), and a sample moment calculation step for outputting the calculation result, and κ calculation means of the signal separation device Skewness s and kurtosis output in the calculation step From, β 1 (β 2 +3) 2/4 (2β 2 -3β 1 -6) (4β 2 -3β 1) [where, β 1 = s 2, a β 2 = k. , And the Pearson distribution type determination means of the signal separation device determines the Pearson distribution type based on the value of κ output in the κ calculation step. The distribution type determination step and the sample moment output from the Pearson distribution type probability density function f p determined in the Pearson distribution type determination step by the Pearson distribution type parameter calculation means of the signal separation device are output in the sample moment calculation step. by calculating from the Pearson distributed parameter calculating step of outputting the result of the calculation, the score function operation unit of the signal separating apparatus, by a probability density function f p determined by the parameter output in Pearson distributed parameter calculating step, wherein (20)
Figure 0004653674
[J represents an imaginary unit. θ (Y (f, m)) represents the deflection angle of Y (f, m) on the complex plane. f p ′ (| Y (f, m) |) represents the differentiation of the probability density function f p by | Y (f, m) |. The score function calculation step for calculating the score function Φ (Y (f, m)) represented by the following formula and outputting the calculation result, and the frame time averaging means of the signal separation device are output in the score function calculation step. Φ (Y (f, m)) and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output in the conversion step, and the average of the sums regarding the frame time is calculated. The calculation result is expressed as <Φ (Y (f, m)) Y H (f, m)>
Figure 0004653674
And ], The frame time averaging step output as, and the updating means of the signal separation device are the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m) is obtained by multiplying the difference between the separation matrix W (f) and the learning size η and further adding the separation matrix W (f). ) >>] W (f) and output the calculation result as a new separation matrix W (f), and the first iterative control means of the signal separation device performs the first operation for one frequency. conversion step, the sample moment calculating step, kappa calculating step, iterative Pearson distributed determining step, Pearson distributed parameter calculating step, the score function operation step, the frame time average step, the updating step until a predetermined iteration condition is satisfied A first iteration step for obtaining the separation matrix W (f) output in the update step when the iteration condition is satisfied, and the second iteration control means of the signal separation device performs the first iteration step for each frequency. A second iterative step to obtain a separation matrix W (f) at each frequency and a permutation processing means of the signal separation device for each separation matrix W (f) for each frequency output by the second iteration step. , A permutation that rearranges the rows of each separation matrix W (f) so that each component of Y (f, m) output in the second conversion step corresponds to an estimation of the same original signal at all frequencies. And the scaling processing means of the signal separation device for all frequencies, the Y (f, m) component output in the second conversion step A scaling processing step for adjusting the separation matrix W (f) output in the permutation processing step so that each has approximately the same amplitude as the estimation of each original signal, and conversion means of the signal separation device, Calculation of product W (f) X (f, m) of separation matrix W (f) at each frequency obtained in the scaling processing step and X (f, m) output in the short-time discrete Fourier transform calculation step And the operation result is output as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T The conversion step and the restoration means of the signal separation device calculate a short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is obtained as a separated signal y (n) = [ y 1 (n), y 2 (n), ··· y N (n)] which have a and restoring step of outputting as T (hereinafter, will be the signal separation method of the signal separation method B. ).

さらに、本発明の上記の信号分離方法Bにおいては、記憶手段には、原信号として想定される信号の時系列データである教師信号d(n)をも記憶し、信号分離装置の第2短時間離散フーリエ変換演算手段が、記憶手段に記憶された教師信号d(n)に対して、フレーム時刻mごとに、短時間離散フーリエ変換を演算して、この演算結果をD(f,m)として出力する第2短時間離散フーリエ変換演算ステップを有し、サンプルモーメント演算ステップは、第2短時間離散フーリエ変換演算ステップにおいて出力されたD(f,m)の絶対値|D(f,m)|のサンプルモーメント(平均、分散、歪度、尖度)を演算し、この演算結果を出力するものであるものとしてもよい。   Furthermore, in the above signal separation method B of the present invention, the storage means also stores the teacher signal d (n), which is the time series data of the signal assumed as the original signal, and the second short circuit of the signal separation device. The time discrete Fourier transform calculation means calculates a short time discrete Fourier transform for each frame time m with respect to the teacher signal d (n) stored in the storage means, and the calculation result is D (f, m). As a second short-time discrete Fourier transform calculation step, and the sample moment calculation step outputs an absolute value | D (f, m) of D (f, m) output in the second short-time discrete Fourier transform calculation step. ) | Sample moments (average, variance, skewness, kurtosis) may be calculated, and the calculation result may be output.

また、本発明の信号分離方法は、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕および式(21)で表されるスコア関数Φ(Y(f,m))におけるパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕が記憶されるとし、信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、信号分離装置のスコア関数演算手段が、変換ステップにおいて出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、

Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、信号分離装置の非対角成分演算手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差である行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値に基づく指標を演算して、この演算結果を<C>として出力する非対角成分演算ステップと、信号分離装置の非対角成分判定手段が、非対角成分演算ステップにおいて出力された<C>と、閾値Minとの大小を判定して、この判定結果を出力する非対角成分判定ステップと、信号分離装置の第2更新手段が、非対角成分判定ステップにおいて出力された判定結果が、<C>の値が閾値Minの値以下である場合に、分離行列W(f)を更新ステップにおいて出力された分離行列W(f)に設定するとともに閾値Minの値を<C>の値に設定する第2更新ステップと、信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、信号分離装置のグリッド反復制御手段が、各グリッドBに対して、第1反復ステップに続いて非対角成分演算ステップ、非対角成分判定ステップ、第2更新ステップを実行して、分離行列W(f)を得るグリッド反復ステップと、信号分離装置の第2反復制御手段が、第1反復ステップおよびグリッド反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップとを有し、スコア関数Φ(Y(f,m))は、式(21)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕ことを特徴とするものでもよい。 In the signal separation method of the present invention, the original signals emitted from N [2 ≦ N] signal sources are separated by the signal separation device from the observation signals observed by M [2 ≦ M] observation devices. In the signal separation method, M time series data x (n) = [x 1 (n), x 2 (n) of observation signals observed by M observation devices are stored in the storage means of the signal separation device. ,..., X M (n)] T [x i (n) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] And α values {b 01 , b 02 ,..., B } of the parameter b 0 in the score function Φ (Y (f, m)) represented by the equation (21) and β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ] Is stored, and the short-time discrete Fourier transform calculation means of the signal separation device performs the frame time m [however, the number of frames is N m with respect to the time-series data x (n) stored in the storage means. To do. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], And the conversion means of the signal separation device outputs the X (f, m) output in the short-time discrete Fourier transform operation step and the N-by-M separation matrix W (f ) And the product W (f) X (f, m) and Y (f, m) = [Y 1 (f, m), Y 2 (f, m),. .., Y N (f, m)] The first conversion step that is output as T , and the score function calculation means of the signal separation device receives score function Φ () that receives Y (f, m) output in the conversion step. Y (f, m)) is calculated, and the score function calculating step for outputting the calculation result and the frame time averaging means of the signal separation device output Φ (Y (f, m) output in the score function calculating step. ) And the complex of Y (f, m) output in the conversion step Role transposed matrix Y H (f, m) the average of the sum for a frame time of a product of a by computing, the result of the calculation <Φ (Y (f, m )) Y H (f, m)> [However,
Figure 0004653674
And ], The frame time averaging step output as, and the updating means of the signal separation device are the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m) is obtained by multiplying the difference between the separation matrix W (f) and the learning size η and further adding the separation matrix W (f). ) >>] W (f) and output the calculation result as a new separation matrix W (f), and the off-diagonal component calculation means of the signal separation device includes the unit matrix I and the frame time average. output in step <Φ (Y (f, m )) Y H (f, m)> difference is that the matrix of the I- <Φ (Y (f, m)) Y H (f, m)> of An index based on the absolute value of the non-diagonal component is calculated, and the calculation result is output as <C>. And the non-diagonal component determination means of the signal separation device determines the magnitude of <C> output in the non-diagonal component calculation step and the threshold value Min, and outputs the determination result. When the determination result output from the determination step and the second updating unit of the signal separation device in the non-diagonal component determination step is that the value of <C> is equal to or smaller than the threshold value Min, the separation matrix W (f) Is set to the separation matrix W (f) output in the updating step and the value of the threshold value Min is set to the value of <C>, and the first iterative control means of the signal separating device has one frequency On the other hand, the first conversion step, the score function calculation step, the frame time averaging step, and the update step are repeatedly executed until a predetermined iteration condition is satisfied, and is output in the update step when this iteration condition is satisfied. And a first iteration step of obtaining the separation matrix W (f), the grid repetition control means of the signal separation device, for each grid B R-diagonal component calculation step following the first iteration step, the off-diagonal A grid iteration step to obtain a separation matrix W (f) by executing a component determination step and a second update step, and a second iteration control means of the signal separation device execute the first iteration step and the grid iteration step for each frequency. The second iteration step for obtaining the separation matrix W (f) at each frequency, and the permutation processing means of the signal separation device for each separation matrix W (f) for each frequency output by the second iteration step, Each separation matrix is such that each component of Y (f, m) output in the second conversion step corresponds to that of the same original signal estimate at all frequencies. The permutation processing step for rearranging the rows of W (f) and the scaling processing means of the signal separation device are configured so that each component of Y (f, m) output in the second conversion step at each frequency is A scaling processing step for adjusting the separation matrix W (f) output in the permutation processing step so as to have approximately the same amplitude as the estimation of the original signal, and conversion means of the signal separation device are obtained in the scaling processing step. The product W (f) X (f, m) of the separation matrix W (f) at each frequency and X (f, m) output in the short-time discrete Fourier transform operation step is calculated. Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T The restoration unit of the separation device calculates a short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is obtained as a separation signal y (n) = [y 1 (n). , Y 2 (n),..., Y N (n)] with a restoration step output as T , and the score function Φ (Y (f, m)) is expressed by the equation (21) Is
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. It may be characterized by that.

さらに、本発明の信号分離方法は、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(22)で表されるスコア関数Φ(Y(f,m))におけるパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕、原信号s(n)=[s(n), s(n),・・・,s(n)]、各信号源Jから各観測装置iまでのインパルス応答hiJ(n)および閾値Maxが記憶されるとし、信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、信号分離装置のスコア関数演算手段が、変換ステップにおいて出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、

Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、信号分離装置の短時間離散逆フーリエ変換演算手段が、分離行列W(f)に対して、短時間離散逆フーリエ変換を演算して、この演算結果をw(n)として出力する短時間離散逆フーリエ変換演算ステップと、信号分離装置の分離精度値演算手段が、短時間離散逆フーリエ変換演算ステップにおいて出力されたw(n)、記憶手段に記憶された原信号s(n)およびインパルス応答hiJ(n)から、各周波数における分離精度値SIRを演算して出力する分離精度値演算ステップと、信号分離装置の分離精度値判定手段が、分離精度値演算ステップにおいて出力された分離精度値SIRと記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定ステップと、信号分離装置の第2更新手段が、分離精度値判定ステップにおいて出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新ステップにおいて出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新ステップと、信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、信号分離装置のグリッド反復制御手段が、各グリッドBに対して、第1反復ステップに続いて短時間離散逆フーリエ変換演算ステップ演算ステップ、分離精度値演算ステップ、分離精度値判定ステップ、第2更新ステップを実行して、分離行列W(f)を得るグリッド反復ステップと、信号分離装置の第2反復制御手段が、第1反復ステップおよびグリッド反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップとを有し、スコア関数Φ(Y(f,m))は、式(22)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕ことを特徴とするものでもよい。 Furthermore, the signal separation method of the present invention separates the original signals emitted from the N [2 ≦ N] signal sources from the observed signals observed by the M [2 ≦ M] observation devices in the signal separation device. In the signal separation method, M time series data x (n) = [x 1 (n), x 2 (n) of observation signals observed by M observation devices are stored in the storage means of the signal separation device. ,..., X M (n)] T [x i (n) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 in the score function Φ (Y (f, m)) represented by the equation (22), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ], Original signal s (n) = [s 1 (n), s 2 (n),..., S N (n)], impulse response h iJ (n from each signal source J to each observation device i ) And threshold value Max are stored, and the short-time discrete Fourier transform calculation means of the signal separation device performs frame time m [however, the number of frames is equal to the time series data x (n) stored in the storage means. and N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], And the conversion means of the signal separation device outputs the X (f, m) output in the short-time discrete Fourier transform operation step and the N-by-M separation matrix W (f ) And the product W (f) X (f, m) and Y (f, m) = [Y 1 (f, m), Y 2 (f, m),. .., Y N (f, m)] The first conversion step that is output as T , and the score function calculation means of the signal separation device receives score function Φ () that receives Y (f, m) output in the conversion step. Y (f, m)) is calculated, and the score function calculating step for outputting the calculation result and the frame time averaging means of the signal separation device output Φ (Y (f, m) output in the score function calculating step. ) And the complex of Y (f, m) output in the conversion step Role transposed matrix Y H (f, m) the average of the sum for a frame time of a product of a by computing, the result of the calculation <Φ (Y (f, m )) Y H (f, m)> [However,
Figure 0004653674
And ], The frame time averaging step output as, and the updating means of the signal separation device are the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m) is obtained by multiplying the difference between the separation matrix W (f) and the learning size η and further adding the separation matrix W (f). ) >>] W (f) and output the calculation result as a new separation matrix W (f), and the short-time discrete inverse Fourier transform calculation means of the signal separation device includes the separation matrix W (f) On the other hand, a short-time discrete inverse Fourier transform calculation step for calculating a short-time discrete inverse Fourier transform and outputting the calculation result as w (n) and a separation accuracy value calculating means of the signal separation device W (output in the inverse Fourier transform calculation step) ), From the stored original signal s (n) and impulse response h iJ (n) in the storage means, and the separation accuracy value calculation step of calculating and outputting the separation accuracy value SIR at each frequency, the separation accuracy of the signal separation device A value determination unit that determines the magnitude of the separation accuracy value SIR output in the separation accuracy value calculation step and the threshold value Max stored in the storage unit, and outputs a determination result; a signal separation device; The second updating means determines that the separation matrix W (f) is output in the update step when the determination result output in the separation accuracy value determination step is that the separation accuracy value SIR is greater than or equal to the threshold Max. f) and the second update step of setting the value of the threshold value Max to the separation accuracy value SIR, and the first iterative control means of the signal separation device for one frequency. Then, the first conversion step, the score function calculation step, the frame time averaging step, and the update step are repeatedly executed until a predetermined iteration condition is satisfied, and when this iteration condition is satisfied, the separation matrix W ( a first iteration step of obtaining a f), the grid repetition control means of the signal separation device, for each grid B R, briefly following the first iteration step the discrete inverse Fourier transform calculating step calculating step, separation accuracy value calculation A grid iteration step for obtaining a separation matrix W (f) by executing a step, a separation accuracy value determination step, and a second update step; and a second iteration control means of the signal separation device comprising the first iteration step and the grid iteration step. A second iteration step is performed for each frequency to obtain a separation matrix W (f) at each frequency, and the signal separator perm. For each separation matrix W (f) for each frequency output by the second iteration step, each of the components of Y (f, m) output in the second conversion step is the same in all frequencies. The permutation processing step for rearranging the rows of each separation matrix W (f) so as to correspond to the signal estimation and the scaling processing means of the signal separation device are output in the second conversion step at all frequencies. A scaling processing step for adjusting the separation matrix W (f) output in the permutation processing step so that each component of Y (f, m) has approximately the same amplitude as the estimation of each original signal; The conversion means of the separation device includes a separation matrix W (f) at each frequency obtained in the scaling processing step, and a short time And the calculation of the discrete Fourier transform operation step X output in (f, m) and the product W (f) X (f, m), the calculation result Y (f, m) = [ Y 1 (f , M ), Y 2 (f, m),..., Y N (f, m)] The second conversion step output as T and the restoration means of the signal separation device were output in the second conversion step. The short-time discrete inverse Fourier transform of Y (f, m) is calculated, and the calculation result is obtained as a separated signal y (n) = [y 1 (n), y 2 (n),..., Y N (n )] and a restoring step of outputting as a T, score function [Phi (Y (f, m)) is represented by the formula (22)
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. It may be characterized by that.

さらには、本発明の信号分離方法は、M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(23)で表されるスコア関数Φ(Y(f,m))におけるパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕および閾値Maxが記憶されるとし、信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、信号分離装置のスコア関数演算手段が、変換ステップにおいて出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、

Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、信号分離装置のsuper-Gaussian型更新手段が、スコア関数ΦとしてΦ(Y(f,m))=tanh(|Y(f,m)|)exp(jθ(Y(f,m)))などのsuper-Gaussian分布を仮定した関数を用いて、Wp(f)+[I−<Φ(Y(f,m))Y(f,m)>]Wp(f)を演算し、この演算結果を新たな分離行列Wp(f)として出力するsuper-Gaussian型更新ステップと、信号分離装置のsuper-Gaussian型変換手段が、super-Gaussian型更新ステップにおいて出力された分離行列Wp(f)とX(f,m)との積を求めて、Yp(f,m)=Wp(f)X(f,m)として出力するsuper-Gaussian型変換ステップと、信号分離装置の分離精度値演算手段が、super-Gaussian型変換ステップにおいて出力されたYp(f,m)と、更新ステップにおいて出力された分離行列W(f)とを用いて各周波数における分離精度値SIRを演算して出力する分離精度値演算ステップと、信号分離装置の分離精度値判定手段が、分離精度値SIRと、記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定ステップと、信号分離装置の第2更新手段が、分離精度値判定ステップにおいて出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新ステップにおいて出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新ステップと、信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、信号分離装置のグリッド反復制御手段が、各グリッドBに対して、第1反復ステップに続いてsuper-Gaussian型更新ステップ、super-Gaussian型変換ステップ、分離精度値演算ステップ、分離精度値判定ステップ、第2更新ステップを実行して、分離行列W(f)を得るグリッド反復ステップと、信号分離装置の第2反復制御手段が、第1反復ステップおよびグリッド反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップとを有し、スコア関数Φ(Y(f,m))は、式(23)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕ことを特徴とするものとしてもよい。 Furthermore, the signal separation method of the present invention separates the original signals emitted from N [2 ≦ N] signal sources from the observed signals observed by M [2 ≦ M] observation devices by the signal separation device. In the signal separation method, the memory means of the signal separation device stores M time-series data x (n) = [x 1 (n), x 2 ( n),..., x M (n)] T [x i (n) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 in the score function Φ (Y (f, m)) represented by the equation (23), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ) And threshold value Max are stored, and the short-time discrete Fourier transform calculation means of the signal separation device performs the frame time m [however, the number of frames is equal to the time series data x (n) stored in the storage means. and N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. ], And the conversion means of the signal separation device outputs the X (f, m) output in the short-time discrete Fourier transform operation step and the N-by-M separation matrix W (f ) And the product W (f) X (f, m) and Y (f, m) = [Y 1 (f, m), Y 2 (f, m),. .., Y N (f, m)] The first conversion step that is output as T , and the score function calculation means of the signal separation device receives score function Φ () that receives Y (f, m) output in the conversion step. Y (f, m)) is calculated, and the score function calculating step for outputting the calculation result and the frame time averaging means of the signal separation device output Φ (Y (f, m) output in the score function calculating step. ) And the complex of Y (f, m) output in the conversion step Role transposed matrix Y H (f, m) the average of the sum for a frame time of a product of a by computing, the result of the calculation <Φ (Y (f, m )) Y H (f, m)> [However,
Figure 0004653674
And ], The frame time averaging step output as, and the updating means of the signal separation device are the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m) is obtained by multiplying the difference between the separation matrix W (f) and the learning size η and adding the separation matrix W (f). ) >>] W (f) and output the calculation result as a new separation matrix W (f), and the super-Gaussian type updating means of the signal separation device uses Φ (Y ( f, m)) = tanh (| Y (f, m) |) exp (jθ (Y (f, m))) and other functions assuming a super-Gaussian distribution, such as Wp (f) + [I - <Φ (Y (f, m)) Y H (f, m)>] Wp (f) is calculated, and the result of the calculation of new separating matrix Wp (f And the super-Gaussian type update step of the signal separator, and the super-Gaussian type conversion means of the signal separation device calculates the product of the separation matrix Wp (f) and X (f, m) output in the super-Gaussian type update step. The super-Gaussian type conversion step that is obtained and output as Yp (f, m) = Wp (f) X (f, m), and the separation accuracy value calculation means of the signal separation device outputs in the super-Gaussian type conversion step. A separation accuracy value calculation step for calculating and outputting a separation accuracy value SIR at each frequency using the Yp (f, m) that has been performed and the separation matrix W (f) output in the update step; The separation accuracy value determining means determines the magnitude of the separation accuracy value SIR and the threshold value Max stored in the storage means, and outputs a result of the determination, and a second updating means of the signal separation device includes: , Separation accuracy If the determination result output in the determination step is that the separation accuracy value SIR is greater than or equal to the threshold Max, the separation matrix W (f) is set to the separation matrix W (f) output in the update step and the value of the threshold Max And the first repetitive control means of the signal separation device perform the first conversion step, the score function calculation step, the frame time averaging step, and the update step for one frequency. A first iteration step for repeatedly executing until a predetermined iteration condition is satisfied and obtaining the separation matrix W (f) output in the update step when the iteration condition is satisfied, and a grid iteration control means of the signal separation device, to the grid B R, super-Gaussian type updating step following the first iteration step, super-Gaussian type conversion step, the separation accuracy value calculation step A grid iteration step to obtain a separation matrix W (f) by executing a separation accuracy value determination step and a second update step, and a second iteration control means of the signal separation device performs the first iteration step and the grid iteration step. A second iteration step is performed for each frequency to obtain a separation matrix W (f) at each frequency, and the permutation processing means of the signal separation device performs each separation matrix W (for each frequency output by the second iteration step. For f), the rows of each separation matrix W (f) are arranged so that each component of Y (f, m) output in the second conversion step corresponds to the estimation of the same original signal at all frequencies. The permutation processing step and the scaling processing means of the signal separation device are output in the second conversion step at all frequencies. A scaling processing step for adjusting the separation matrix W (f) output in the permutation processing step so that each component of Y (f, m) has approximately the same amplitude as the estimation of each original signal, and signal separation The conversion means of the apparatus is the product W (f) X () of the separation matrix W (f) at each frequency obtained in the scaling processing step and X (f, m) output in the short-time discrete Fourier transform operation step. f, m) and Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] The second conversion step that is output as T and the restoration means of the signal separation device calculate the short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is used as the separation signal. y (n) = [y 1 (n) y 2 (n), ···, and a restoration step of outputting as y N (n)] T, the score function Φ (Y (f, m) ), those represented by the formula (23) is there
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. It may be characterized by that.

また、上記信号分離装置をコンピュータ上で機能させる信号分離プログラムによって、コンピュータを信号分離装置として作動処理させることができる。そして、この信号分離プログラムを記録した、コンピュータによって読み取り可能なプログラム記録媒体によって、他のコンピュータを信号分離装置として機能させることや、信号分離プログラムを流通させることなどが可能になる。   Further, the computer can be operated as a signal separation device by a signal separation program for causing the signal separation device to function on the computer. Then, a computer-readable program recording medium that records this signal separation program enables other computers to function as a signal separation device and distribute the signal separation program.

本発明の信号分離装置および方法によれば、非定常雑音の存在する実環境下において混合された混合信号に好適な信号分離を行うことができる。   According to the signal separation device and method of the present invention, it is possible to perform signal separation suitable for a mixed signal mixed in an actual environment where non-stationary noise exists.

また、観測信号の信号データから直接推定されたピアソン分布の微分形をスコア関数とするため、分離精度を向上できるという効果をも有する。   In addition, since the differential form of the Pearson distribution directly estimated from the signal data of the observation signal is used as the score function, the separation accuracy can be improved.

<理論背景>
まず、本発明の理論背景を説明する。
例えば、M個のセンサj〔但しj=1,2,・・・,Mとし、Mはセンサの総数である。〕のそれぞれで、N個の信号源i〔但しi=1,2,・・・,Nとし、Nは信号源総数である。〕からの信号s(n)に信号源―センサ間の応答(時間遅れや反射等)が畳み込まれた混合信号(観測信号)を、信号x(n)〔但しnはサンプリング系列を表し、n=1,2,・・・,Nとする。Nはサンプリング数である。〕として観測したとする。このとき、観測信号x(n)は式(24)で表される。

Figure 0004653674
<Theoretical background>
First, the theoretical background of the present invention will be described.
For example, M sensors j (where j = 1, 2,..., M, where M is the total number of sensors. ], N signal sources i (where i = 1, 2,..., N, where N is the total number of signal sources. Signal s i signal source (n) from] - the response between the sensors (time delay, reflection, etc.) convoluted mixed signal (observation signal), the signal x j (n) [where n is a sampling sequence N = 1, 2,..., N n . N n is the number of samplings. ]. At this time, the observation signal x j (n) is expressed by Expression (24).
Figure 0004653674

ここで、hji(n)は、信号源iからセンサjへのpタップのインパルス応答であり、Pはインパルス応答の持続時間を表す。以下では、説明の便宜から、信号源数Nとセンサの総数Mは等しいとする。なお、一般的にBSSのICAにおいては、センサの総数Mは、信号源数Nと等しいか、あるいはそれ以上であることが望ましい。 Here, h ji (n) is a p-tap impulse response from the signal source i to the sensor j, and P represents the duration of the impulse response. Hereinafter, for convenience of explanation, it is assumed that the number N of signal sources is equal to the total number M of sensors. In general, in BSS ICA, the total number M of sensors is preferably equal to or greater than the number N of signal sources.

一般的に、畳み込み混合信号はBSSの手法では信号分離が困難であるため、短時間離散フーリエ変換(Short-time Discrete Fourier Transform:STDFT)を適用して、畳み込み混合信号を周波数領域に変換して信号分離を行うことが広く行われる。式(19)で表される観測信号x(n)に対して、STDFTを適用すると、式(25)で表される。

Figure 0004653674
In general, it is difficult to separate the convolutional mixed signal using the BSS method, so the short-time discrete Fourier transform (STDFT) is applied to convert the convolutional mixed signal into the frequency domain. Signal separation is widely performed. When STDFT is applied to the observation signal x j (n) represented by Expression (19), it is represented by Expression (25).
Figure 0004653674

ここでfは周波数、mはフレーム時刻を表す。式(20)を行列表現すると式(26)で表される。ここでは行列を、添え字のない大文字の記号(X、Yなど)で表し、その成分を、特に断りの無い限り添え字付きの大文字の記号(Xなど)で表すことにする。

Figure 0004653674
Here, f represents a frequency, and m represents a frame time. When Expression (20) is expressed as a matrix, it is expressed by Expression (26). Here the matrix, expressed as subscripts no case symbols (X, Y, etc.), its components, will be particularly expressed in otherwise free unless subscripted uppercase symbols (X j, etc.).
Figure 0004653674

H(f)は、ji成分に信号源iからセンサjまでの周波数応答Hji(f)を持つN×N行列であり、S(f,m)=[S(f,m),S(f,m),・・・,S(f,m)]、X(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]は、それぞれ原信号および観測信号のSTDFT結果を表す。なお、Tは転置行列であることを表す。 H (f) is an N × N matrix having a frequency response H ji (f) from the signal source i to the sensor j in the ji component, and S (f, m) = [S 1 (f, m), S 2 (f, m),..., S N (f, m)] T , X (f, m) = [X 1 (f, m), X 2 (f, m),. N (f, m)] T represents the STDFT results of the original signal and the observed signal, respectively. Note that T represents a transposed matrix.

次に、ICAによる周波数領域での信号分離処理は、式(27)で表される分離行列W(f)を求めることである。

Figure 0004653674
Next, signal separation processing in the frequency domain by ICA is to obtain a separation matrix W (f) represented by Expression (27).
Figure 0004653674

つまり、各周波数でY(f,m),Y(f,m),・・・,Y(f,m)が互いに独立となるような分離行列W(f)を推定することである。この推定は、式(28)の更新式による学習に基づいて行う。

Figure 0004653674
That is, by estimating the separation matrix W (f) such that Y 1 (f, m), Y 2 (f, m),..., Y N (f, m) are independent from each other at each frequency. is there. This estimation is performed based on learning by the update formula of Formula (28).
Figure 0004653674

ηは学習のステップサイズ、添え字(g)は更新回数、<・>はフレーム時刻mについての平均操作を表す。ここで平均操作とは、式(29)で表される平均を意味する。Nはフレームの数を表す。

Figure 0004653674
η represents the learning step size, the subscript (g) represents the number of updates, and <·> represents the average operation for the frame time m. Here, the average operation means the average represented by the formula (29). N m represents the number of frames.
Figure 0004653674

なお、以上の更新式は、(原信号の確率密度分布の対数尤度を最大化する)最尤推定法に基づいて導出された場合であるから、平均操作<・>によって表されるが、相互情報量(Kullback-Leibler情報量)を最小化する方法に基づいて導出する場合には、更新式(28)は、式(30)で表される。E[・]は、分散共分散行列である。

Figure 0004653674
Since the above update formula is derived based on the maximum likelihood estimation method (maximizing the log likelihood of the probability density distribution of the original signal), it is expressed by the average operation </>. When derived based on a method of minimizing the mutual information amount (Kullback-Leibler information amount), the update equation (28) is expressed by equation (30). E [•] is a variance covariance matrix.
Figure 0004653674

式(28)の関数Φは、原信号の確率密度分布の負の対数の微分を表し、式(28)の関数Φは、分離信号の確率密度分布の負の対数の微分を表す。原信号と分離信号が同等になる場合(即ち、観測信号を互いに独立になるように分離できた場合である。)は、Φ=Φとなるから、式(28)と式(30)は同等の内容を表すものといえる。 The [Phi function of Equation (28) represents the negative logarithm of the derivative of the probability density distribution of the original signal, the function [Phi 1 of formula (28) represents the negative logarithm of the derivative of the probability density distribution of the separated signals. When the original signal and the separated signal are equivalent (that is, when the observed signals can be separated so as to be independent from each other), Φ = Φ 1 is satisfied, and therefore Equations (28) and (30) are It can be said that the content is equivalent.

式(28)の更新式は、いわゆる最急降下法などと同様の考え方によって、更新式が収束したときの分離行列W(f)を解、即ち分離信号が互いに独立となる所望の分離行列とするものである。   The update formula of Equation (28) is a solution similar to the so-called steepest descent method and the like, and the separation matrix W (f) when the update formula converges is a solution, that is, a desired separation matrix in which the separation signals are independent from each other. Is.

上記のとおり、信号源数Nとセンサの総数Mは等しいとしているので、分離行列Wは(正則)正方行列である。また、正則正方行列の最適な勾配方向は、リーマン計量において自然勾配方向である(公知)。従って、式(28)の更新式は、式(31)に改めることによって、より安定して収束の早いものとなる。

Figure 0004653674
As described above, since the number N of signal sources is equal to the total number M of sensors, the separation matrix W is a (regular) square matrix. In addition, the optimum gradient direction of the regular square matrix is a natural gradient direction in the Riemann metric (known). Therefore, the update formula of the formula (28) is changed to the formula (31), so that the update formula is more stable and the convergence is quick.
Figure 0004653674

(f,m)は、Y(f,m)の複素共役転置行列を表す。 Y H (f, m) represents a complex conjugate transpose matrix of Y (f, m).

式(28)、式(29)、式(31)におけるΦ(・)はスコア関数を表し、Y(f,m)をYと略記すると、Φ(Y)=φ(|Y|)exp(iθ(Y))〔Yは複素数値、|・|は絶対値、θ(Y)は複素平面上の偏角を表す。iは虚数単位である。なお、上記ではiは信号源を表すものとしたが、虚数単位をjまたはiで表記するのが慣例であるから、これに従うものとする。このように表記しても、iが添え字であるか否かなどで判断される。また、特に注意が必要な場合は虚数単位であることを明示する。〕である。φ(|Y|)は、原信号の確率密度分布をp(Y)とした場合、式(32)で与えられる(非特許文献1参照。)。

Figure 0004653674
In Expressions (28), (29), and (31), Φ (·) represents a score function, and when Y (f, m) is abbreviated as Y, Φ (Y) = φ (| Y |) exp ( iθ (Y)) [Y is a complex value, | · | is an absolute value, and θ (Y) represents a declination on the complex plane. i is an imaginary unit. In the above description, i represents a signal source. However, since it is customary to express an imaginary unit as j or i, it follows. Even if written in this way, it is determined by whether or not i is a subscript. Also, if you need to pay special attention, indicate that it is an imaginary unit. ]. φ (| Y |) is given by Expression (32) when the probability density distribution of the original signal is p (Y) (see Non-Patent Document 1).
Figure 0004653674

記述のとおり、従来技術ではスコア関数としてtanh関数を用いて、例えばΦ(α)=tanh(zα)としていた(zは任意の定数。)。しかし、上記例示した音声の場合のように、音声は話者や帯域などによって多様な分布形状を持つので、全ての音声や全ての帯域において単一のtanh関数を用いることは適さない。そこで、本発明ではスコア関数にピアソン分布系の微分形を用いる。   As described, in the prior art, the tanh function is used as the score function, for example, Φ (α) = tanh (zα) (z is an arbitrary constant). However, as in the case of the voice exemplified above, since the voice has various distribution shapes depending on the speaker, the band, etc., it is not suitable to use a single tanh function for all voices and all bands. Therefore, in the present invention, a differential form of the Pearson distribution system is used for the score function.

ピアソン分布系の概略は既に説明したとおりである。
ここでは、ピアソン分布I型、IV型、VI型について説明する。勿論、その他のピアソン分布型を排除する趣旨ではない。信号の種類によっては、適宜その他のピアソン分布型や拡張ピアソン分布(ピアソン分布系の微分形の分子・分母の多項式が、より高次のもので定義される〔参考文献3〕)を用いることができる。
(参考文献3) : Ord,J.K, Families of Frequency Distributions, Griffin,1972.
The outline of the Pearson distribution system is as described above.
Here, Pearson distribution type I, type IV, type VI will be described. Of course, it is not intended to exclude other Pearson distribution types. Depending on the type of signal, other Pearson distribution types or extended Pearson distributions may be used as appropriate (the differential numerator / denominator polynomial of the Pearson distribution system is defined in a higher order [reference 3]). it can.
(Reference 3): Ord, JK, Families of Frequency Distributions, Griffin, 1972.

《ピアソン分布IV型》
(参考文献4) : Nagahara, Y., "The PDF and CF of Pearson type IV distributions and the ML estimation of the parameters", Statistics & Probability Letters, 43, pp.251-264,1999.
参考文献4によれば、パラメータ(a、c、c、c)に適宜の拘束条件が課せられた式(13)で表されるピアソン分布IV型(0<κ<1、非特許文献3参照。)は、非心パラメータδを用いて、式(33)で新しく定義される。

Figure 0004653674
<< Pearson distribution type IV >>
(Reference 4): Nagahara, Y., "The PDF and CF of Pearson type IV distributions and the ML estimation of the parameters", Statistics & Probability Letters, 43, pp.251-264, 1999.
According to the reference 4, Pearson distribution type IV (0 <κ <1, non-patent) expressed by the equation (13) in which appropriate constraints are imposed on the parameters (a, c 0 , c 1 , c 2 ). Reference 3) is newly defined in equation (33) using the non-central parameter δ.
Figure 0004653674

このとき、確率密度関数f(x)は式(34)で与えられる。iは虚数単位である。Γ(・)はガンマ関数を表す。

Figure 0004653674
At this time, the probability density function f p (x) is given by Expression (34). i is an imaginary unit. Γ (·) represents a gamma function.
Figure 0004653674

ところで、参考文献1および参考文献2によれば、式(15)のパラメータκによって、ピアソン分布は7つの型に分類可能であることが示されている。そして、各型の分布およびサンプルモーメントを適切なパラメータで記述することで、このパラメータとサンプルモーメントとの変換式を与えている。ピアソン分布IV型では、式(33)、式(34)におけるパラメータb、δ、τ、μと、サンプルモーメント(平均e、分散ν、歪度s、尖度k)との間に式(35)で示される関係がある。

Figure 0004653674
By the way, according to Reference Document 1 and Reference Document 2, it is shown that the Pearson distribution can be classified into seven types by the parameter κ in Expression (15). Each type of distribution and sample moment are described by appropriate parameters, and a conversion formula between this parameter and the sample moment is given. In the Pearson distribution type IV, between the parameters b, δ, τ, μ in the expressions (33) and (34) and the sample moment (average e, variance ν, skewness s, kurtosis k), the expression (35 ).
Figure 0004653674

《ピアソン分布I型》
ピアソン分布I型(κ<0)では、式(33)に相当する−f’(x)/f(x)は、式(36)で与えられる。

Figure 0004653674
<< Pearson distribution type I >>
In the Pearson distribution type I (κ <0), −f p ′ (x) / f p (x) corresponding to the equation (33) is given by the equation (36).
Figure 0004653674

このとき、確率密度関数f(x)は式(37)で与えられる。B(・,・)はベータ関数を表す。

Figure 0004653674
At this time, the probability density function f p (x) is given by Expression (37). B (·, ·) represents a beta function.
Figure 0004653674

ピアソン分布I型では、式(36)、式(37)におけるパラメータa、b、p、qと、サンプルモーメント(平均e、分散ν、歪度s、尖度k)との間に式(38)で示される関係がある。なお、便宜的にrなどの記号をもって置き換えをしている。

Figure 0004653674
In the Pearson distribution type I, the equation (38) between the parameters a, b, p, q in the equations (36) and (37) and the sample moment (average e, variance ν, skewness s, kurtosis k). ). For convenience, it is replaced with a symbol such as r.
Figure 0004653674

《ピアソン分布VI型》
ピアソン分布VI型(1<κ)では、式(33)に相当する−f’(x)/f(x)は、式(39)で与えられる。

Figure 0004653674
<< Pearson distribution type VI >>
In the Pearson distribution type VI (1 <κ), −f p ′ (x) / f p (x) corresponding to the equation (33) is given by the equation (39).
Figure 0004653674

このとき、確率密度関数f(x)は式(40)で与えられる。B(・,・)はベータ関数を表す。

Figure 0004653674
At this time, the probability density function f p (x) is given by Expression (40). B (·, ·) represents a beta function.
Figure 0004653674

ピアソン分布VI型では、式(39)、式(40)におけるパラメータa、b、p、qと、サンプルモーメント(平均e、分散ν、歪度s、尖度k)との間に式(41)で示される関係がある。なお、便宜的にrなどの記号をもって置き換えをしている。

Figure 0004653674
In the Pearson distribution type VI, between the parameters a, b, p, q in the equations (39) and (40) and the sample moment (average e, variance ν, skewness s, kurtosis k), the equation (41 ). For convenience, it is replaced with a symbol such as r.
Figure 0004653674

式(33)、式(36)、式(39)は、結局のところ、式(13)のように分母が高々2次、分子が高々1次の多項式でまとめられた形式の式(42)で表される。

Figure 0004653674
The formula (33), the formula (36), and the formula (39) are, as a result, the formula (42) in the form in which the denominator is at most quadratic and the numerator is at most linear as in the formula (13). It is represented by
Figure 0004653674

《ピアソン分布のパラメータ推定》
さて、ICAのスコア関数にピアソン分布系の微分形を用いることは既に述べたとおりである。そこで、観測信号を周波数帯域に分解し、それぞれの周波数において最適なピアソン分布を推定する必要がある。周波数毎に分解された分離信号の系列Yにおけるスコア関数は、Φ(Y)=−f’(Y)/f(Y)で表される。
《Pearson distribution parameter estimation》
As described above, the differential form of the Pearson distribution system is used for the score function of ICA. Therefore, it is necessary to decompose the observation signal into frequency bands and estimate an optimal Pearson distribution at each frequency. Score function in the sequence Y of has been separated signals decomposed every frequency, Φ (Y) = - represented by f p '(Y) / f p (Y).

分離信号Yは、複素数値で表されるからY=|Y|exp(jθ(Y))とする(ここでは便宜的に虚数単位をjとして表す。)。また、|Y|の分布は位相exp(jθ(Y))とは独立であるとして、確率密度関数f(Y)=α×f(|Y|)とする(非特許文献1)。 Since the separated signal Y is represented by a complex value, it is assumed that Y = | Y | exp (jθ (Y)) (here, the imaginary unit is represented as j for convenience). Further, the distribution of | Y | is assumed to be independent of the phase exp (jθ (Y)), and the probability density function f p (Y) = α × f p (| Y |) is assumed (Non-patent Document 1).

このとき式(43)が成立する。

Figure 0004653674
At this time, Expression (43) is established.
Figure 0004653674

ここで、|Y|の分布を用いたスコア関数について次の定理が成立する。
《定理》

Figure 0004653674
Here, the following theorem holds for the score function using the | Y | distribution.
"theorem"
Figure 0004653674

(証明)

Figure 0004653674
(Proof)
Figure 0004653674

従って、分離信号Yの系列iにおけるスコア関数は、式(42)および上記定理から式(44)で与えられる。

Figure 0004653674
Therefore, the score function in the series i of the separated signal Y is given by the equation (44) from the equation (42) and the above theorem.
Figure 0004653674

以上から、ピアソン分布のパラメータ推定は、式(44)のパラメータ{b、b、c、c、c}について行えばよい。但し、ピアソン分布の型が判明した場合や、適宜にピアソン分布の型を設定した場合などでは、そのピアソン分布の型におけるパラメータ(例えば、ピアソン分布IV型では、パラメータb、δ、τ、μである。)を求めればよく、式(44)のパラメータ{b、b、c、c、c}を求める必要はない。 From the above, the Pearson distribution parameter estimation may be performed for the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } in Expression (44). However, when the type of the Pearson distribution is known, or when the type of the Pearson distribution is appropriately set, the parameters in the type of the Pearson distribution (for example, the parameters b, δ, τ, and μ in the Pearson distribution type IV are There is no need to obtain the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } of equation (44).

次に、ICAにおいて式(44)のパラメータ{b、b、c、c、c}を推定する方法について述べる。
まず、1つの方法としては、式(31)における行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値がより0に近づくようなパラメータ{b、b、c、c、c}を周波数ごとにグリッドサーチする方法である。そこで、周波数の関数となることを明記するために、パラメータ{b、b、c、c、c}を{b(f)、b(f)、c(f)、c(f)、c(f)}と表記する。
Next, a method for estimating the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } of Expression (44) in ICA will be described.
First, as one method, a parameter such that the absolute value of the off-diagonal component of the matrix I- <Φ (Y (f, m)) Y H (f, m)> in equation (31) is closer to 0 is used. {B 0 , b 1 , c 0 , c 1 , c 2 } is a grid search method for each frequency. Therefore, in order to specify that it is a function of frequency, the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } are changed to {b 0 (f), b 1 (f), c 0 (f). , C 1 (f), c 2 (f)}.

式(31)における行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分を書き下すとΦ(Y(f,m))Y (f,m)〔ここでi、jは、行列のi行j列を意味し、i≠jである。また、Y はYの複素共役を表す。〕となり、これは出力信号(つまり、分離過程における分離信号)の高次相関を表している。信号が最も分離されたときはY(f,m)とY(f,m)は独立となり、上記非対角成分の大きさは0となるが、信号が混合したままの場合は上記非対角成分は大きな値をとる。すなわち上記非対角成分は、分離の程度を表す尺度として用いることが可能である。 When the off-diagonal component of the matrix I- <Φ (Y (f, m)) Y H (f, m)> in equation (31) is written down, Φ (Y i (f, m)) Y j * (f , M) [where i and j mean i rows and j columns of the matrix, and i ≠ j. Y j * represents the complex conjugate of Y j . This represents the higher order correlation of the output signal (that is, the separated signal in the separation process). When the signal is most separated, Y j (f, m) and Y j (f, m) are independent, and the magnitude of the off-diagonal component is 0. However, if the signal remains mixed, The off-diagonal component takes a large value. In other words, the off-diagonal component can be used as a scale representing the degree of separation.

従って、この性質を用いて、式(31)における行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値が最も小さくなるピアソン分布系のパラメータ{b(f)、b(f)、c(f)、c(f)、c(f)}をグリッドサーチによって求めればよい。 Therefore, using this property, the Pearson distribution system in which the absolute value of the off-diagonal component of the matrix I- <Φ (Y (f, m)) Y H (f, m)> in Equation (31) is minimized. The parameters {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)} may be obtained by grid search.

ここでグリッドサーチとは、いわゆる総当り的な探索手法である。具体的な一例を以下に述べる。
5つのパラメータb(f)、b(f)、c(f)、c(f)、c(f)のそれぞれについて、ある範囲の(離散的な)値を予め設定しておく。即ち、b={b01,b02,・・・,b0α}、b={b11,b12,・・・,b1β}、c={c01,c02,・・・,c0γ}、c={c11,c12,・・・,c1δ}、c={c21,c22,・・・,c2ε}とする。なお、ここでα、β、γ、δ、εは、上記変換式である式(35)、式(38)、式(41)で用いた記号の意味とは異なり、各パラメータで設定した値の個数を表す(以下に述べるグリッドBにおける記号α、β、γ、δ、εについても同様である。)。
Here, the grid search is a so-called brute force search method. A specific example is described below.
For each of the five parameters b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f), a (discrete) value in a certain range is set in advance. deep. That is, b 0 = {b 01 , b 02 ,..., B }, b 1 = {b 11 , b 12 ,..., B }, c 0 = {c 01 , c 02 ,. , C }, c 1 = {c 11 , c 12 ,..., C }, c 2 = {c 21 , c 22 ,. Here, α, β, γ, δ, and ε are values set by parameters, unlike the meanings of the symbols used in the equations (35), (38), and (41), which are the conversion equations. the representative number of (symbol α in grid B R described below, β, γ, δ, is the same for epsilon.).

そして、各パラメータの範囲から1つずつ値を選択して組み合わせを作ったものをグリッドBと表すことにする。つまり、B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、Rmax=α×β×γ×δ×εである。 Then, to those made of a combination by selecting one by one the value from the range of the parameter representing the grid B R. That is, B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = { b 0α, b 1β, c 0γ , c 1δ, and c 2 [epsilon]}. However, Rmax = α × β × γ × δ × ε.

これらの各グリッドBにおける値をパラメータとするスコア関数を用いた更新式の解を求め、そのときの行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値を求める。この値が最小となるときのグリッドBを、求めるパラメータ{b、b、c、c、c}の値とする。 It computes the solution to update equation using a score function using the value of each of these grids B R as a parameter, a matrix at that time I- <Φ (Y (f, m)) Y H (f, m)> non of Find the absolute value of the diagonal component. Grid B R when this value is minimized, obtaining the value of the parameter {b 0, b 1, c 0, c 1, c 2}.

なお、求める非対角成分は複数個あるから、全ての非対角成分の絶対値が最も小さくなる場合を一意に求めることは困難である。従って例えば、求めた非対角成分の絶対値の平均値が最小になる場合や、求めた非対角成分の二乗値の総和が最小となる場合を、所望の場合であると判断して、このときのグリッドBを求めればよい。 Since there are a plurality of non-diagonal components to be obtained, it is difficult to uniquely obtain a case where the absolute values of all the non-diagonal components are the smallest. Therefore, for example, the case where the average value of the absolute values of the obtained non-diagonal components is minimized or the case where the sum of the square values of the obtained non-diagonal components is minimized is determined as a desired case. it may be obtained a grid B R at this time.

このようにしてパラメータ{b、b、c、c、c}の値を決定することで、式(44)のスコア関数が定まる。そして、このスコア関数を用いた式(31)による更新で得られた分離行列を用いることで、所望の分離信号を得ることとなる。 By determining the values of the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } in this way, the score function of Expression (44) is determined. Then, a desired separation signal is obtained by using the separation matrix obtained by the update by Expression (31) using this score function.

また、スコア関数のパラメータ{b、b、c、c、c}の値の決定は、短時間離散フーリエ変換における各周波数ごとに行われる。 The values of the score function parameters {b 0 , b 1 , c 0 , c 1 , c 2 } are determined for each frequency in the short-time discrete Fourier transform.

非対角要素を用いる代わりに、原信号とインパルス応答が既知であると仮定し、原信号とインパルス応答と分離行列とから分離精度値を求め、分離精度値が最大となるときのグリッドBを選択することでパラメータを推定してもよい(後述の第1.1の実施形態の中で詳細を説明する。)。 Instead of using the non-diagonal elements, the original signal and the impulse response is assumed to be known, the original signal and obtains the separation accuracy values from the impulse response and the separation matrix, a grid B R when separation accuracy value is maximized The parameter may be estimated by selecting (details will be described in the first embodiment described later).

非対角要素を用いる代わりに、スコア関数にtanh関数などを用いたICAなどで既に分離した信号と分離行列から分離精度値を求め、これが最大となるグリッドBを選択することで、パラメータをグリッドサーチすることもできる(後述の第1.2の実施形態の中で詳細を説明する。)。 Instead of using a non-diagonal element, a separation accuracy value is obtained from a signal and separation matrix that have already been separated by ICA using a tanh function or the like as a score function, and a parameter BR is selected by selecting a grid BR that maximizes this. It is also possible to perform a grid search (details will be described later in a first embodiment).

本明細書では、スコア関数に係わる説明において「ピアソン分布(系、型)」、「ピアソン分布の微分形」、「ピアソン分布系の微分形」などの表現を用いている。そして、具体例としてピアソン分布I型、IV型、VI型を挙げて、各型の確率密度関数f(x)の満たす微分方程式(33)、式(36)、式(39)は、一般的に式(42)で表されることを示した。特に、複素数値表現された分離信号Yのスコア関数Φ(Y)は、式(44)で与えられる。ここで式(44)のパラメータ{b、b、c、c、c}は、式(33)、式(36)、式(39)のそれぞれのパラメータに対応する。例えば、式(44)と式(36)とを対比すると、式(44)のパラメータ{b、b、c、c、c}は、式(36)のパラメータ{−(p+q−2)a−(p−1)b、p+q−2、a(a+b)、−(2a+b)、1}に対応している。 In the present specification, expressions such as “Pearson distribution (system, type)”, “differential form of Pearson distribution”, and “differential form of Pearson distribution system” are used in the description relating to the score function. As specific examples, Pearson distribution types I, IV, and VI are given, and the differential equations (33), (36), and (39) that are satisfied by the probability density function f p (x) of each type are It was shown that it is represented by Formula (42). In particular, the score function Φ (Y) of the separated signal Y expressed in a complex value is given by Expression (44). Here, the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } in Expression (44) correspond to the parameters of Expression (33), Expression (36), and Expression (39), respectively. For example, when Expression (44) is compared with Expression (36), the parameter {b 0 , b 1 , c 0 , c 1 , c 2 } in Expression (44) is the same as the parameter {− (p + q) in Expression (36). -2) corresponding to a- (p-1) b, p + q-2, a (a + b),-(2a + b), 1}.

一般的にピアソン分布は、分布の型ごとにそのパラメータの取りえる範囲に制約がある。従って、式(44)のパラメータ{b、b、c、c、c}の取りえる範囲もピアソン分布型に応じた制約があると考えるのが自然であるが、実際の信号分離では、式(44)のパラメータ{b、b、c、c、c}の取りえる範囲は、ピアソン分布型に応じた制約を受けない。なぜなら、式(42)および式(44)は、ピアソン分布の各型の確率密度関数が満たす微分法的式を包括的・一般的に表現したものであり、式(42)ないし式(44)に拠る限りピアソン分布の各型に固有のパラメータ範囲の制約条件に拘束されないからである。 In general, the Pearson distribution is limited in the range of parameters for each distribution type. Therefore, it is natural to think that the range of the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } in Equation (44) is also limited according to the Pearson distribution type, but the actual signal In the separation, the range that can be taken by the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } in Expression (44) is not restricted according to the Pearson distribution type. This is because the equations (42) and (44) are comprehensive and general representations of the differential equations that are satisfied by the probability density function of each type of Pearson distribution, and the equations (42) to (44) This is because it is not constrained by the constraint condition of the parameter range specific to each type of Pearson distribution as long as it depends on the above.

つまり、式(44)のパラメータ{b、b、c、c、c}として、ピアソン分布系で制約されるパラメータ範囲に入らない値をとった場合でも、分離精度の優れたスコア関数が存在するのであり、この事実を示す実施例は後掲する。 That is, even when the parameter {b 0 , b 1 , c 0 , c 1 , c 2 } in the formula (44) is a value that does not fall within the parameter range restricted by the Pearson distribution system, the separation accuracy is excellent. There is a score function, and examples illustrating this fact will be given later.

このことから、本発明のグリッドサーチによるスコア関数のパラメータ推定においては、各パラメータの取り得る範囲をピアソン分布系で制約されるパラメータ範囲に限定しない。   For this reason, in the parameter estimation of the score function by the grid search of the present invention, the range that each parameter can take is not limited to the parameter range restricted by the Pearson distribution system.

以上の説明から明らかなように、本発明において式(44)で与えられるスコア関数は、ピアソン分布系に由来するが、ピアソン分布系のパラメータ範囲の制約条件は適用されないことに留意しなければならない。   As is clear from the above description, it should be noted that the score function given by the equation (44) in the present invention is derived from the Pearson distribution system, but the parameter range constraints of the Pearson distribution system are not applied. .

上記のグリッドサーチは、ある種アドホックな手法と云える。そこで、グリッドサーチによらないで、ICAにおいて式(44)のパラメータ{b、b、c、c、c}を推定してスコア関数を求める方法を示す。 The above grid search is a kind of ad hoc technique. Therefore, a method of obtaining the score function by estimating the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } of the formula (44) in ICA without using the grid search will be shown.

それは、各周波数の系列の絶対値について、歪度と尖度を求めて式(15)のκを計算し、その値でピアソン分布の型を判定し、個々のパラメータからスコア関数を求める方法である。具体的な手順を以下に示す。   This is a method of calculating skewness and kurtosis of the absolute value of each frequency series, calculating κ in equation (15), determining the type of Pearson distribution based on the value, and calculating a score function from individual parameters. is there. The specific procedure is shown below.

(1)観測信号を分離行列で変換したY(f,m)を用いてこの系列のサンプルモーメント(平均e、分散ν、歪度s、尖度k)を求める。 (1) The sample moment (average e, variance ν, skewness s, kurtosis k) of this series is obtained using Y i (f, m) obtained by converting the observed signal with a separation matrix.

(2)歪度sおよび尖度kから、式(15)のκを求める。   (2) From the skewness s and kurtosis k, κ in Expression (15) is obtained.

(3)κの値からピアソン分布の型を判定する。   (3) The type of the Pearson distribution is determined from the value of κ.

(4)上記サンプルモーメントから、上記変換式に従って、判定された型のピアソン分布のパラメータを求める。これによってスコア関数が定まる。   (4) A parameter of the determined type of Pearson distribution is obtained from the sample moment according to the conversion equation. This determines the score function.

この場合、スコア関数はY(f,m)毎に求まる。また、短時間離散フーリエ変換における各周波数毎にもスコア関数が求められる。 In this case, a score function is obtained for each Y i (f, m). A score function is also obtained for each frequency in the short-time discrete Fourier transform.

この場合ではパラメータのグリッドサーチを行わないので、計算量を減らせると共に、より短時間で所望の分離信号が得られる。   In this case, since the parameter grid search is not performed, the amount of calculation can be reduced and a desired separated signal can be obtained in a shorter time.

なお、上記の手順(1)においては、観測信号の変わりに、全ての周波数においてスコア関数にtanh関数などを用いた従来的ICAによって予め粗い信号分離を行った結果得られる分離信号を用いてもよい。   In the above procedure (1), instead of the observation signal, a separated signal obtained as a result of performing coarse signal separation in advance by a conventional ICA using a tanh function or the like as the score function at all frequencies may be used. Good.

また、原信号として想定される信号の集合を教師信号とし、この教師信号に対して各周波数でのサンプルモーメントを求め、そのサンプルモーメントからκやピアソン分布のパラメータを決め、それを固定してスコア関数を求めることもできる(後述の第2.1の実施形態の中で詳細を説明する。)。   Also, a set of signals assumed as the original signal is used as a teacher signal, a sample moment at each frequency is obtained for the teacher signal, κ and Pearson distribution parameters are determined from the sample moment, and then fixed and scored. A function can also be obtained (details will be described in the second embodiment described later).

また、観測信号を周波数領域に変換し、一部の周波数領域では上記グリッドサーチの手法で決定されたスコア関数を用いるとし、その他の周波数領域ではサンプルモーメントに基づいてピアソン分布型判定してスコア関数を決定するようにしてもよい(後述の第3の実施形態の中でも詳細を説明する。)。   Also, the observed signal is converted to the frequency domain, and the score function determined by the grid search method is used in some frequency domains, and the score function is determined by Pearson distribution type determination based on the sample moment in other frequency domains. May be determined (details will be described in the third embodiment described later).

具体的には、予め与えられた観測信号に対してグリッドサーチの手法を適用し、周波数ごとに定まるパラメータ{b、b、c、c、c}を求めておく。複数種類の観測信号からそれぞれの種類における周波数ごとに定まるパラメータ{b、b、c、c、c}を求めるようにしてもよく、この場合には、各種類の周波数ごとに定まるパラメータ{b、b、c、c、c}の平均値{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}を求めておく(下添え字avgは平均値を表す。)。 Specifically, a grid search technique is applied to an observation signal given in advance, and parameters {b 0 , b 1 , c 0 , c 1 , c 2 } determined for each frequency are obtained. Parameters {b 0 , b 1 , c 0 , c 1 , c 2 } determined for each frequency in each type may be obtained from a plurality of types of observation signals. In this case, for each type of frequency, Average values {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 (avg ) of fixed parameters {b 0 , b 1 , c 0 , c 1 , c 2 } )} the previously obtained (. the subscript avg representing the average value).

つまり、例えば種類1(type1と表記する。)の観測信号から周波数ごとに定まるパラメータ{b0(type1)、b1(type1)、c0(type1)、c1(type1)、c2(type1)}が得られ、種類2(type2と表記する。)の観測信号から周波数ごとに定まるパラメータ{b0(type2)、b1(type2)、c0(type2)、c1(type2)、c2(type2)}が得られたとすると、周波数ごとに定まるパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}は、同じ周波数ごとにb0(avg)=(b0(type1)+b0(type2))/2、b1(avg)=(b1(type1)+b1(type2))/2、c0(avg)=(c0(type1)+c0(type2))/2、c1(avg)=(c1(type1)+c1(type2))/2、c2(avg)=(c2(type1)+c2(type2))/2として求めるのである。 That is, for example, parameters {b 0 (type 1) , b 1 (type 1) , c 0 (type 1) , c 1 (type 1) , c 2 (type 1) determined for each frequency from an observation signal of type 1 (denoted as type 1). )} is obtained, referred to as type 2 (type2.) parameter determined for each frequency from the observed signal {b 0 (type2), b 1 (type2), c 0 (type2), c 1 (type2), c 2 (type2) } is obtained, the parameter average { b0 (avg) , b1 (avg) , c0 (avg) , c1 (avg) , c2 (avg) } determined for each frequency is b 0 (avg) for each same frequency = (b 0 (type1) + b 0 (type2)) / 2, b 1 (avg) = (b 1 (type1) + b 1 ( ype2)) / 2, c 0 (avg) = (c 0 (type1) + c 0 (type2)) / 2, c 1 (avg) = (c 1 (type1) + c 1 (type2)) / 2, c 2 (Avg) = (c2 (type1) + c2 (type2) ) / 2.

そして、一部の周波数領域では、このパラメータ{b、b、c、c、c}あるいはパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}で定まるスコア関数を用いるとし、その他の周波数領域ではサンプルモーメントに基づいてピアソン分布型判定してスコア関数を決定するのである。 In some frequency domains, the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } or parameter averages {b 0 (avg) , b 1 (avg) , c 0 (avg) , c Assume that a score function determined by 1 (avg) , c2 (avg) } is used, and in other frequency regions, the score function is determined by Pearson distribution type determination based on the sample moment.

<第1の実施形態>
まず、本発明の信号分離装置・方法の第1の実施形態を説明する。
第1の実施形態では、説明の便宜から、信号源の数は2つ、観測装置の数を2つとする。
図1は、第1の実施形態に係わる信号分離装置(1)のハードウェア構成を例示した構成ブロック図である。
図2は、第1の実施形態に係わる信号分離装置(1)において原信号から分離信号を得るまでのフローを例示する図である。
図3および図4は、第1の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理を例示するフローチャートである。
図5は、第1の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理機能を例示する機能ブロック図である。
<First Embodiment>
First, a first embodiment of the signal separation device / method of the present invention will be described.
In the first embodiment, for convenience of explanation, the number of signal sources is two and the number of observation devices is two.
FIG. 1 is a configuration block diagram illustrating the hardware configuration of the signal separation device (1) according to the first embodiment.
FIG. 2 is a diagram illustrating a flow until the separated signal is obtained from the original signal in the signal separation device (1) according to the first embodiment.
FIG. 3 and FIG. 4 are flowcharts illustrating the process of obtaining the separation signal from the observation signal in the signal separation device (1) according to the first embodiment.
FIG. 5 is a functional block diagram illustrating a processing function for obtaining a separation signal from an observation signal in the signal separation device (1) according to the first embodiment.

図1に例示するように、第1の実施形態に係わる信号分離装置(1)は、キーボードなどが接続可能な入力部(11)、液晶ディスプレイなどが接続可能な出力部(12)、信号分離装置(1)外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部(13)、CPU(Central Processing Unit)(14)、メモリであるRAM(15)、ROM(16)やハードディスクである外部記憶装置(17)並びにこれらの入力部(11)、出力部(12)、通信部(13)、CPU(14)、RAM(15)、ROM(16)、外部記憶装置(17)間のデータのやり取りが可能なように接続するバス(18)を有している。また必要に応じて、信号分離装置(1)に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。   As illustrated in FIG. 1, the signal separation device (1) according to the first embodiment includes an input unit (11) to which a keyboard or the like can be connected, an output unit (12) to which a liquid crystal display or the like can be connected, and signal separation. Device (1) A communication unit (13) to which a communication device (for example, a communication cable) that can communicate with the outside can be connected, a CPU (Central Processing Unit) (14), a RAM (15), a ROM (16), and a hard disk The external storage device (17) and the input unit (11), output unit (12), communication unit (13), CPU (14), RAM (15), ROM (16), external storage device (17) A bus (18) is connected so that data can be exchanged between them. If necessary, the signal separation device (1) may be provided with a device (drive) that can read and write a storage medium such as a CD-ROM.

さらに信号分離装置(1)には、信号(例えば音声、音楽、雑音、無線信号など)を観測する観測装置(例えばマイクロホン)を接続可能であって、観測装置から観測信号の入力を受ける観測信号入力部を設けてもよい。   Further, an observation device (for example, a microphone) for observing a signal (for example, voice, music, noise, radio signal, etc.) can be connected to the signal separation device (1), and an observation signal for receiving an observation signal from the observation device. An input unit may be provided.

信号分離装置(1)の外部記憶装置(17)には、観測信号から分離信号を得るためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている。また、このプログラムの処理によって得られたデータなどを保存記憶するデータ格納領域(171)も確保されている。   The external storage device (17) of the signal separation device (1) stores and stores a program for obtaining a separation signal from the observation signal, data necessary for processing of this program, and the like. In addition, a data storage area (171) for storing and storing data obtained by the processing of this program is also secured.

より具体的には、外部記憶装置(17)には、観測装置であるセンサMで観測した観測信号x(n)、観測装置であるセンサMで観測した観測信号x(n)、閾値Minの初期値(十分に大きい値とする。)、2行2列の分離行列W(f)の初期値(より正確には、分離行列W(f)の各成分の初期値である。なお、以下においては特に断りのない限り、「行列の各成分の値」を「行列の値」ということにする。例えば、行列Xの値を保存記憶すると云えば、行列Xの各成分の値を保存記憶することを意味する。)、2行2列の単位行列の値、学習サイズηの値、式(45)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕が保存記憶されている。

Figure 0004653674
More specifically, the external storage device (17) includes an observation signal x 1 (n) observed by the sensor M 1 as an observation device and an observation signal x 2 (n) observed by the sensor M 2 as an observation device. , An initial value of the threshold Min (a sufficiently large value), an initial value of a 2-by-2 separation matrix W (f) (more precisely, an initial value of each component of the separation matrix W (f)) In the following, unless otherwise specified, “the value of each component of the matrix” is referred to as “the value of the matrix.” For example, if the value of the matrix X is stored and stored, each component of the matrix X is stored. This means that the value is stored and stored.) The value of the 2-by-2 unit matrix, the value of the learning size η, and the parameter b of the score function Φ (Y (f, m)) represented by the equation (45) 0 of α number of values {b 01, b 02, ··· , b 0α}, β number of values of the parameter b 1 {b 11, 12, ···, b 1β}, γ number of values {c 01 parameters c 0, c 02, ···, c 0γ}, δ number of values {c 11 parameters c 1, c 12, ·· .. , C } and grid B R [B 1 = {b, wherein one value is selected from each of ε values {c 21 , c 22 ,..., C } of parameter c 2 and combined. 01, b 11, c 01, c 11, c 21}, B 2 = {b 02, b 11, c 01, c 11, c 21}, ···, B Rmax = {b 0α, b 1β, c 0γ, c 1δ, and c 2 [epsilon]}. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ] Is stored and stored.
Figure 0004653674

なお、観測信号x(n)および観測信号x(n)は、センサM、Mで観測した観測信号を公知のサンプリング方法や量子化方法などによって、サンプリングや量子化などがされた時系列離散データとする(nはサンプリング系列を表し、n=1,2,・・・,Nとする。)。信号分離装置(1)に、公知のサンプリング手段や量子化手段などを備えて、サンプリングや量子化などを実行し、その結果である観測信号x(n)および観測信号x(n)を外部記憶装置(17)に保存記憶するようにしてもよい。 Note that the observation signal x 1 (n) and the observation signal x 2 (n) were sampled or quantized by a known sampling method, quantization method, or the like for the observation signal observed by the sensors M 1 and M 2 . and time-series discrete data (n represents the sampling sequence, n = 1,2, ···, and n n.). The signal separation device (1) is provided with known sampling means, quantization means, etc., and performs sampling, quantization, etc., and the resulting observation signal x 1 (n) and observation signal x 2 (n) are obtained. It may be stored in an external storage device (17).

また、外部記憶装置(17)には、観測信号x(n)および観測信号x(n)から分離信号を得るためのプログラムとして、短時間離散フーリエ変換演算プログラム(172)、変換プログラム(173)、スコア関数演算プログラム(174)、フレーム時間平均プログラム(175)、更新プログラム(176)、非対角成分演算プログラム(177)、非対角成分判定プログラム(178)、第2更新プログラム(179)、復元プログラム(1710)、第1反復制御プログラム(1711)、第2反復制御プログラム(1712)、グリッド反復制御プログラム(1713)、パーミュテーション処理プログラム(1714)、スケーリング処理プログラム(1715)その他各プログラムの処理やデータの読み込みなどを制御する制御プログラムが保存記憶されている。これらのプログラムの処理によって得られるデータなどは、データ格納領域(171)に保存記憶される。 The external storage device (17) has a short-time discrete Fourier transform operation program (172), a conversion program (as a program for obtaining a separated signal from the observation signal x 1 (n) and the observation signal x 2 (n), 173), score function calculation program (174), frame time average program (175), update program (176), off-diagonal component calculation program (177), off-diagonal component determination program (178), second update program ( 179), restoration program (1710), first iteration control program (1711), second iteration control program (1712), grid iteration control program (1713), permutation processing program (1714), scaling processing program (1715) Other processing of each program and reading of data A control program to be controlled is stored and stored. Data obtained by the processing of these programs is stored and stored in the data storage area (171).

第1の実施形態に係る信号分離装置(1)では、外部記憶装置(17)に記憶されたプログラムとこのプログラムの処理に必要なデータが必要に応じてRAM(15)に読み込まれて、CPU(14)で解釈実行・処理される。その結果、CPU(14)が所定の機能を実現して、観測信号x(n)および観測信号x(n)から分離信号を得るものとなっている。 In the signal separation device (1) according to the first embodiment, a program stored in the external storage device (17) and data necessary for processing the program are read into the RAM (15) as necessary, and the CPU Interpretation is executed and processed in (14). As a result, the CPU (14) realizes a predetermined function and obtains a separated signal from the observation signal x 1 (n) and the observation signal x 2 (n).

そこで次に、図2〜図5を参照して、信号分離装置(1)において、観測信号x(n)および観測信号x(n)から分離信号を得る演算処理の流れを順次説明する。 Therefore, next, with reference to FIGS. 2 to 5, in the signal separating device (1) sequentially illustrating the flow of processing for obtaining a separation signal from the observation signal x 1 (n) and the observed signal x 2 (n) .

まず、制御部(図示しない)の制御の下、外部記憶装置(17)から、時系列データである観測信号x(n)、x(n)を読み込み、これらの値をRAM(15)のx(n)格納領域(1501)に格納する(S100)。また、この工程において、後の処理において必要なデータとなる各グリッドBを外部記憶装置(17)から読み込み、これらの値をRAM(15)のグリッドB格納領域(1505)に格納し、また、単位行列の値を外部記憶装置(17)から読み込み、これらの値をRAM(15)の単位行列格納領域(1508)に格納し、さらに、学習サイズηの値を外部記憶装置(17)から読み込み、この値をRAM(15)の学習サイズη格納領域(1509)に格納し、閾値Minの初期値を外部記憶装置(17)から読み込み、この値をRAM(15)の閾値Min格納領域(1511)に格納しておくことにする。 First, under the control of a control unit (not shown), the observation signals x 1 (n) and x 2 (n) as time series data are read from the external storage device (17), and these values are stored in the RAM (15). In the x (n) storage area (1501) (S100). Also, stored in this step, each grid B R required data in the processing after read from the external storage device (17), the grid B R storage area of these values RAM (15) (1505), Further, the values of the unit matrix are read from the external storage device (17), these values are stored in the unit matrix storage area (1508) of the RAM (15), and the value of the learning size η is further stored in the external storage device (17). This value is stored in the learning size η storage area (1509) of the RAM (15), the initial value of the threshold Min is read from the external storage device (17), and this value is stored in the threshold Min storage area of the RAM (15). (1511).

次に、短時間離散フーリエ変換演算部(141)によって、x(n)格納領域(1501)から観測信号x(n)、x(n)を読み込み、これらの短時間離散フーリエ変換を演算して(S101)、その演算結果であるX(f、m)、X(f、m)をRAM(15)のX(f、m)格納領域(1502)に格納する(S102)。なお、短時間離散フーリエ変換における周波数をf(=1,2,・・・,F)、フレーム時刻をm(=1,2,・・・,N)とする。Fは、短時間離散フーリエ変換における周波数fの上限である。また、Nは、短時間離散フーリエ変換におけるフレームの数である。 Next, the observation signals x 1 (n) and x 2 (n) are read from the x (n) storage area (1501) by the short-time discrete Fourier transform calculation unit (141), and these short-time discrete Fourier transforms are calculated. Then, X 1 (f, m) and X 2 (f, m) as the calculation results are stored in the X (f, m) storage area (1502) of the RAM (15) (S102). Incidentally, a short time discrete Fourier frequency in the transform f (= 1,2, ···, F ), the frame time m (= 1,2, ···, N m) and. F is the upper limit of the frequency f in the short-time discrete Fourier transform. N m is the number of frames in the short-time discrete Fourier transform.

短時間離散フーリエ変換演算部(141)によって演算される短時間離散フーリエ変換は公知のものでよい。例えば窓関数は適宜選択可能であり、ハミング窓、ハニング窓などを用いることができる。また、短時間離散フーリエ変換におけるフレーム間隔Δtや周波数の上限Fも、観測信号x(n)、x(n)に応じて適宜に設定できる。例えばフレーム長(=窓長=離散フーリエ変換の長さ)をTとすると、Δt=T/Sとする〔TおよびSは、2のべき乗の値とする。〕。 The short-time discrete Fourier transform computed by the short-time discrete Fourier transform computation unit (141) may be a known one. For example, the window function can be selected as appropriate, and a Hamming window, a Hanning window, or the like can be used. Further, the frame interval Δt and the upper limit F of the frequency in the short-time discrete Fourier transform can be appropriately set according to the observation signals x 1 (n) and x 2 (n). For example, if the frame length (= window length = discrete Fourier transform length) is T, Δt = T / S [T and S are powers of 2. ].

次に、第1反復制御部(140a)の制御の下、各周波数f=1,2,・・・,Fについて、所定の条件を満たすまでステップS102a〜S115の処理を反復実行する。
周波数f=1の場合(S102r)を、以下に説明する。
Next, under the control of the first iterative control unit (140a), the processes of steps S102a to S115 are repeatedly executed for each frequency f = 1, 2,.
The case where the frequency f = 1 (S102r) will be described below.

ステップS103〜S113の処理は、グリッド反復制御部(140c)の制御の下に所定の条件を満たすまで反復実行され、さらに、ステップS104〜S109の処理は、第2反復制御部(140b)の制御の下に所定の条件を満たすまで反復実行される。   The processes of steps S103 to S113 are repeatedly executed until a predetermined condition is satisfied under the control of the grid repetition control unit (140c). Further, the processes of steps S104 to S109 are controlled by the second repetition control unit (140b). Is repeatedly executed until a predetermined condition is satisfied.

まず、グリッド反復制御部(140c)による反復実行を制御するための識別子R=1を設定する(S102a)。なお、識別子Rの最大値はRmaxである。   First, an identifier R = 1 for controlling repetitive execution by the grid repetitive control unit (140c) is set (S102a). The maximum value of the identifier R is Rmax.

制御部(図示しない)の制御の下、外部記憶装置(17)から、2行2列の分離行列W(1)の初期値を読み込み、これらの値をRAM(15)のW(f)格納領域(1503)に格納する(S103)。この実施形態では、分離行列W(f)の初期値は単位行列とする。勿論、単位行列に限定する趣旨ではなく、適宜(任意)の値を成分に持つ行列としてもよい。   Under the control of the control unit (not shown), the initial values of the 2-by-2 separation matrix W (1) are read from the external storage device (17), and these values are stored in W (f) of the RAM (15). It stores in the area (1503) (S103). In this embodiment, the initial value of the separation matrix W (f) is a unit matrix. Of course, it is not intended to be limited to a unit matrix, but may be a matrix having appropriately (arbitrary) values as components.

また、S103においては、第2反復制御部(140b)による反復実行を制御するための識別子g=1を設定する。また、識別子gの最大値をgmaxとする。このgmaxの値は、観測信号のデータ量などから任意に定めておく。   In S103, an identifier g = 1 is set for controlling the repeated execution by the second repetition control unit (140b). The maximum value of the identifier g is gmax. The value of gmax is arbitrarily determined from the data amount of the observation signal.

なお、第1反復制御部(140a)による反復実行の制御に係る周波数fの値およびその上限値F、グリッド反復制御部(140c)による反復実行の制御に係る識別子Rの値およびその最大値Rmax、第2反復制御部(140b)による反復実行の制御に係る識別子gの値およびその最大値gmaxは、RAM(15)の所定の格納領域(図示しない。)に格納しておき、各部(140a)(140b)(140c)は、所定の格納領域から必要な値を読み込んで大小比較をし、反復実行の制御を行うようにする。   Note that the value of the frequency f and its upper limit value F related to the control of the repetitive execution by the first repetitive control unit (140a), the value of the identifier R and the maximum value Rmax of the repetitive execution control by the grid repetitive control unit (140c). The value of the identifier g and the maximum value gmax related to the repetitive execution control by the second repetitive control unit (140b) are stored in a predetermined storage area (not shown) of the RAM (15), and each unit (140a ) (140b) and (140c) read necessary values from a predetermined storage area, compare the magnitudes, and control repetitive execution.

例えば、予め外部記憶装置(17)に記憶しておいたgmaxの値を読み込んでRAM(15)の所定の格納領域(図示しない。)に格納しておき、第2反復制御部(140c)は、識別子gの値と上記格納領域に格納されたgmaxの値の大小を読み込んで比較することで、反復実行の制御を行うようにすればよい。   For example, the value of gmax stored in advance in the external storage device (17) is read and stored in a predetermined storage area (not shown) of the RAM (15), and the second iterative control unit (140c) The repetitive execution control may be performed by reading and comparing the value of the identifier g and the value of the gmax stored in the storage area.

次に、変換部(142)によって、X(f、m)格納領域(1502)からX(1、m)、X(1、m)を読み込み、W(f)格納領域(1503)から分離行列W(1)の初期値(単位行列)を読み込み、これらの値から式(41)の演算を行い、この演算結果Y(1,m),Y(1,m)をRAM(15)のY(f,m)格納領域(1504)に格納する(S104)。式(41)のY(1,m)は、Y(1,m)=[Y(1,m),Y(1,m)]であり、式(46)のX(1,m)は、X(1,m)=[X(1,m),X(1,m)]である(以下同様。)。また、式(41)に表されるように、ステップS104における処理は、フレーム時刻m=1,2,・・・,Nの全フレームに関するバッチ処理である(図3では∀mで表している。また、このバッチ処理については、以下の各ステップでも同様である。)。

Figure 0004653674
Next, the conversion unit (142) reads X 1 (1, m), X 2 (1, m) from the X (f, m) storage area (1502), and reads from the W (f) storage area (1503). The initial value (unit matrix) of the separation matrix W (1) is read, and the calculation of Expression (41) is performed from these values, and the calculation results Y 1 (1, m), Y 2 (1, m) are stored in the RAM ( 15) is stored in the Y (f, m) storage area 1504 (S104). Y (1, m) in the equation (41) is Y (1, m) = [Y 1 (1, m), Y 2 (1, m)] T , and X (1, m) in the equation (46) m) is X (1, m) = [X 1 (1, m), X 2 (1, m)] T (the same applies hereinafter). Further, as expressed in Expression (41), the process in step S104 is a batch process for all frames at frame times m = 1, 2,..., N m (in FIG. 3, represented by ∀m). Also, this batch process is the same in the following steps).
Figure 0004653674

次に、スコア関数演算部(143)によって、Y(f,m)格納領域(1504)からY(1,m)を読み込み、グリッドB格納領域(1505)からグリッドB={b01,b11,c01,c11,c21}の値を読み込み、これらの値から式(47)の演算を行い、この演算結果Φ(Y(1,m))をRAM(15)のΦ(Y(f,m))格納領域(1506)に格納する(S105)。

Figure 0004653674
Then, the score function calculation unit (143), Y (f, m) from the storage area (1504) reads Y (1, m), grid B R stored grid B from the area (1505) 1 = {b 01 , The values of b 11 , c 01 , c 11 , c 21 } are read, the calculation of equation (47) is performed from these values, and the calculation result Φ (Y (1, m)) is converted to Φ ( Y (f, m)) storage area (1506) is stored (S105).
Figure 0004653674

次に、フレーム時間平均部(144)によって、Y(f,m)格納領域(1504)からY(1,m)を読み込み、このY(1,m)の複素共役転置行列の値Y(1,m)を求め、さらに、Φ(Y(f,m))格納領域(1506)からΦ(Y(1,m))を読み込み、これらの値から式(48)の演算を行い、この演算結果<Φ(Y(1,m))Y(1,m)>をRAM(15)の<Φ(Y(f,m))Y(f,m)>格納領域(1507)に格納する(S106)。なお、Y(1,m)の複素共役転置行列の値Y(1,m)は、図示しない複素共役転置行列演算部(公知の複素共役転置行列演算プログラムをCPUが解釈実行するものである。)にて求めるとし、さらに、これをRAM(15)に確保された領域に記憶することで、フレーム時間平均部(144)は、この記憶領域からY(1,m)を読み込むようにしてもよい。

Figure 0004653674
Next, Y (1, m) is read from the Y (f, m) storage area (1504) by the frame time averaging unit (144), and the value Y H ( 1, m), Φ (Y (1, m)) is read from the Φ (Y (f, m)) storage area (1506), and the calculation of equation (48) is performed from these values. The calculation result <Φ (Y (1, m)) Y H (1, m)> is stored in <Φ (Y (f, m)) Y H (f, m)> storage area (1507) of the RAM (15). Store (S106). Note that the complex conjugate transpose matrix value Y H (1, m) of Y (1, m) is used by the CPU to interpret and execute a complex conjugate transpose matrix computation section (not shown). .), And by storing this in an area secured in the RAM (15), the frame time averaging unit (144) reads Y H (1, m) from this storage area. May be.
Figure 0004653674

次に、更新部(145)によって、<Φ(Y(f,m))Y(f,m)>格納領域(1507)から<Φ(Y(1,m))Y(1,m)>を読み込み、単位行列格納領域(1508)から2行2列の単位行列の値を読み込み、学習サイズη格納領域(1509)から学習サイズηの値を読み込み、W(f)格納領域(1503)から分離行列W(1)の値を読み込み、これらの値から式(31)の演算を行い、この演算結果W(1)を新たな分離行列W(1)の値として、W(f)格納領域(1503)に上書き格納する(S107)。なお、図5中のS107における←は、分離行列W(f)の値を新しい値に置換することを意味する。また、上書き格納とは、既に所定の記憶領域に格納されている値を、新しい値に置換して格納することをいう。 Next, the update unit (145) performs the operation from <Φ (Y (f, m)) Y H (f, m)> storage area (1507) to <Φ (Y (1, m)) Y H (1, m )>, The value of the unit matrix of 2 rows and 2 columns is read from the unit matrix storage area (1508), the value of the learning size η is read from the learning size η storage area (1509), and the W (f) storage area (1503) ) Is read from the separation matrix W (1), and the calculation of Expression (31) is performed from these values, and the calculation result W (1) is used as the value of the new separation matrix W (1). The data is overwritten and stored in the storage area (1503) (S107). Note that ← in S107 in FIG. 5 means that the value of the separation matrix W (f) is replaced with a new value. In addition, the overwrite storage means that a value already stored in a predetermined storage area is replaced with a new value and stored.

次に、第2反復制御部(140b)は、反復実行を制御するための識別子gがgmaxと等しいか否かを判定する(S108)。この結果、識別子gがgmaxと等しいと判定されれば、ステップS110の処理へと進む。また、識別子gがgmaxと等しいと判定されなければ、第2反復制御部(140b)は、識別子gに1を加えたものを識別子gの新たな値として(S109)、先に述べたステップS104以降の処理を行う。この際、各ステップで新たに求められた値(Y(1,m)、Φ(Y(1,m))、<Φ(Y(1,m))Y(1,m)>、W(1))は、各値の格納領域に上書き格納される。 Next, the second iteration control unit (140b) determines whether or not the identifier g for controlling iteration execution is equal to gmax (S108). As a result, if it is determined that the identifier g is equal to gmax, the process proceeds to step S110. If it is not determined that the identifier g is equal to gmax, the second iterative control unit (140b) sets the identifier g plus 1 as a new value of the identifier g (S109), and previously described step S104. Perform the following processing. At this time, values newly obtained at each step (Y (1, m), Φ (Y (1, m)), <Φ (Y (1, m)) Y H (1, m)>, W (1)) is overwritten and stored in the storage area of each value.

ステップS108で識別子gがgmaxと等しいと判定された場合、この段階で、W(f)格納領域(1503)には、グリッドBの値をパラメータ値とした場合の分離行列W(1)の値が格納されている。 If the identifier g in step S108 is determined to be equal to gmax, at this stage, W in the (f) storage area (1503), the separation matrix W in the case where the value of the grid B 1 and parameter values (1) A value is stored.

この段階(gmax回の反復実行後)で、非対角成分演算部(146)は、<Φ(Y(f,m))Y(f,m)>格納領域(1507)から<Φ(Y(1,m))Y(1,m)>を読み込み、単位行列格納領域(1508)から2行2列の単位行列の値を読み込み、これらの値から行列I−<Φ(Y(1,m))Y(1,m)>の非対角成分の絶対値の平均値を演算し、この演算結果<C>をRAM(15)の<C>格納領域(1510)に格納する(S110p)。 At this stage (after repeated execution of gmax times), the non-diagonal component calculation unit (146) operates from <Φ (Y (f, m)) Y H (f, m)> storage area (1507) to <Φ ( Y (1, m)) Y H (1, m)> is read, the value of the unit matrix of 2 rows and 2 columns is read from the unit matrix storage area (1508), and the matrix I- <Φ (Y (Y ( 1, m)) Y H (1, m)> is calculated as an average of absolute values of non-diagonal components, and the result <C> is stored in the <C> storage area (1510) of the RAM (15). (S110p).

なお、<C>は、行列I−<Φ(Y(1,m))Y(1,m)>の非対角成分の絶対値の平均値に限定するものではなく、例えば、行列I−<Φ(Y(1,m))Y(1,m)>の非対角成分の二乗値の総和などであってもよい。 Note that <C> is not limited to the average value of absolute values of non-diagonal components of the matrix I- <Φ (Y (1, m)) Y H (1, m)>. -<Φ (Y (1, m)) Y H (1, m)> may be the sum of squares of non-diagonal components.

次に、非対角成分判定部(147)は、<C>格納領域(1510)から<C>の値を読み込み、閾値Min格納領域(1511)から閾値Minを読み込み、<C>の値が閾値Minよりも小さいか否かを判定し、その判定結果をRAM(15)の判定結果格納領域(1512)に格納する(S110)。なお、この判定では、<C>の値が閾値Minよりも小さいか否かを判定するものとしたが、<C>の値が閾値Min以下であるか否かを判定するものとしてもよい。   Next, the non-diagonal component determination unit (147) reads the value of <C> from the <C> storage area (1510), reads the threshold value Min from the threshold Min storage area (1511), and the value of <C> is It is determined whether or not it is smaller than the threshold value Min, and the determination result is stored in the determination result storage area (1512) of the RAM (15) (S110). In this determination, it is determined whether or not the value of <C> is smaller than the threshold value Min, but it may be determined whether or not the value of <C> is equal to or less than the threshold value Min.

次に、グリッド反復制御部(140c)は、判定結果格納領域(1512)から判定結果を読み込み、この判定結果が、<C>の値が閾値Minよりも小さくないというものである場合には、識別子Rに1を加えたものを識別子Rの新たな値として(S111)、先に述べたステップS103〜S110の処理を行う。この際、各ステップで新たに求められた値(Y(1,m)、Φ(Y(1,m))、<Φ(Y(1,m))Y(1,m)>、W(1)、<C>)は、各値の格納領域に上書き格納される。 Next, the grid iteration control unit (140c) reads the determination result from the determination result storage area (1512), and when this determination result is that the value of <C> is not smaller than the threshold value Min, The value obtained by adding 1 to the identifier R is set as a new value of the identifier R (S111), and the processes of steps S103 to S110 described above are performed. At this time, the values (Y (1, m), Φ (Y (1, m)), <Φ (Y (1, m)) Y H (1, m)>, W (1) and <C>) are overwritten and stored in the storage area for each value.

また、グリッド反復制御部(140c)は、判定結果格納領域(1512)から判定結果を読み込み、この判定結果が、<C>の値が閾値Minよりも小さいというものである場合には、第2更新部(148)によるステップS112の処理を実行させる。   Further, the grid iterative control unit (140c) reads the determination result from the determination result storage area (1512), and if this determination result indicates that the value of <C> is smaller than the threshold value Min, the second The process of step S112 by the update unit (148) is executed.

第2更新部(148)は、<C>格納領域(1510)から<C>の値を読み込み、この値を閾値Minの新たな値として、閾値Min格納領域(1511)に上書き格納する。また、第2更新部(148)は、この段階(ステップS110で<C>の値が閾値Minよりも小さいと判定された場合)における分離行列W(1)の値をW(f)格納領域(1503)から読み込んで、最終的に求めるべき分離行列W(1)の候補の値として、RAM(15)の最終W(f)格納領域(1513)に格納する(S112)。   The second updating unit (148) reads the value of <C> from the <C> storage area (1510) and overwrites the value in the threshold Min storage area (1511) as a new value of the threshold Min. In addition, the second updating unit (148) uses the value of the separation matrix W (1) at this stage (when it is determined in step S110 that the value of <C> is smaller than the threshold value Min) as the W (f) storage area. The data is read from (1503) and stored in the final W (f) storage area (1513) of the RAM (15) as a candidate value of the separation matrix W (1) to be finally obtained (S112).

ステップS112に続いて、グリッド反復制御部(140c)は、反復実行を制御するための識別子RがRmaxと等しいか否かを判定する(S113)。この結果、識別子RがRmaxと等しいと判定されれば、ステップS114の処理へと進む。また、識別子RがRmaxと等しいと判定されなければ、グリッド反復制御部(140c)は、識別子Rに1を加えたものを識別子Rの新たな値として(S111)、先に述べたステップS104以降の処理を行う。この際、各ステップで新たに求められた値(Y(1,m)、Φ(Y(1,m))、<Φ(Y(1,m))Y(1,m)>、W(1))は、各値の格納領域に上書き格納される。 Subsequent to step S112, the grid repetitive control unit (140c) determines whether or not the identifier R for controlling repetitive execution is equal to Rmax (S113). As a result, if it is determined that the identifier R is equal to Rmax, the process proceeds to step S114. If it is not determined that the identifier R is equal to Rmax, the grid iterative control unit (140c) sets the identifier R plus 1 as a new value of the identifier R (S111), and after step S104 described above Perform the process. At this time, values newly obtained at each step (Y (1, m), Φ (Y (1, m)), <Φ (Y (1, m)) Y H (1, m)>, W (1)) is overwritten and stored in the storage area of each value.

ステップS113で識別子RがRmaxと等しいと判定された場合、この段階で、最終W(f)格納領域(1513)には、周波数f=1において最適化された分離行列W(1)の値が格納されている。   When it is determined in step S113 that the identifier R is equal to Rmax, the value of the separation matrix W (1) optimized at the frequency f = 1 is stored in the final W (f) storage area (1513) at this stage. Stored.

第1反復制御部(140a)は、反復実行を制御するための周波数fが上限値Fと等しいか否かを判定する(S114)。この結果、周波数fがFと等しいと判定されれば、ステップS116の処理へと進む。また、周波数fがFと等しいと判定されなければ、第1反復制御部(140a)は、周波数fに1を加えたものを周波数fの新たな値として(S115)、ステップS102a以降の処理を行う。   The first iterative control unit (140a) determines whether or not the frequency f for controlling repetitive execution is equal to the upper limit value F (S114). As a result, if it is determined that the frequency f is equal to F, the process proceeds to step S116. If it is not determined that the frequency f is equal to F, the first iterative control unit (140a) sets the frequency f plus 1 as a new value of the frequency f (S115), and performs the processing after step S102a. Do.

各周波数について上記の処理が実行された結果、最終W(f)格納領域(1513)には、各周波数f=1,2,・・・,Fにおいて最適化された分離行列W(1)、W(2)、・・・、W(F)の値が格納されることになる。   As a result of the above processing being executed for each frequency, the separation matrix W (1) optimized at each frequency f = 1, 2,... F is stored in the final W (f) storage area (1513). The values of W (2),..., W (F) are stored.

次に、パーミュテーション処理部(1410)は、最終W(f)格納領域(1513)から各分離行列W(f)を読みこみ、i番目の出力Y(f,m)〔周波数領域における分離信号Y(f,m)のi行目の要素〕が、全ての周波数において、あるk番目の原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理を行う(S114a)。このパーミュテーション処理は公知の処理技術に拠ればよい(上記特許文献2、上記非特許文献4参照)。パーミュテーション処理された各分離行列W(f)は、最終W(f)格納領域(1513)に上書き格納される。 Next, the permutation processing unit (1410) reads each separation matrix W (f) from the final W (f) storage area (1513), and outputs the i-th output Y i (f, m) [in the frequency domain. A par that rearranges the rows of each separation matrix W (f) so that the element of the i-th row of the separation signal Y (f, m) corresponds to the estimation of a certain k-th original signal at all frequencies. Mutation processing is performed (S114a). This permutation process may be based on a known processing technique (see Patent Document 2 and Non-Patent Document 4). Each separation matrix W (f) subjected to permutation processing is overwritten and stored in the final W (f) storage area (1513).

次に、スケーリング処理部(1411)は、最終W(f)格納領域(1513)から各分離行列W(f)を読みこみ、i番目の出力Y(f,m)が、全ての周波数においてあるk番目の原信号の推定のものとしておよそ同じ振幅を持つように各分離行列W(f)を調整するスケーリング処理を行う(S114b)。このスケーリング処理は公知の処理技術に拠ればよい(上記非特許文献5参照)。スケーリング処理された各分離行列W(f)は、最終W(f)格納領域(1513)に上書き格納される。 Next, the scaling processing unit (1411) reads each separation matrix W (f) from the final W (f) storage area (1513), and the i-th output Y i (f, m) is obtained at all frequencies. A scaling process for adjusting each separation matrix W (f) so as to have approximately the same amplitude as an estimate of a certain kth original signal is performed (S114b). This scaling process may be based on a known processing technique (see Non-Patent Document 5 above). Each scaled separation matrix W (f) is overwritten and stored in the final W (f) storage area (1513).

次に、変換部(142)は、X(f,m)格納領域(1502)から、X(1,m)、X(2,m)、・・・、X(F,m)〔m=1,2,・・・,N〕を読み込み、最終W(f)格納領域(1513)から、W(1)、W(2)、・・・、W(F)を読み込み、これらの値からY(1,m)=W(1)X(1,m)、Y(2,m)=W(2)X(2,m)、・・・、Y(F,m)=W(F)X(F,m)を演算して、この演算結果をRAM(15)のY(f,m)格納領域(1514)に格納する(S116)。 Next, the conversion unit (142) starts from the X (f, m) storage area (1502), X (1, m), X (2, m), ..., X (F, m) [m = 1, 2,..., N m ], W (1), W (2),..., W (F) are read from the final W (f) storage area (1513), and these values are read. To Y (1, m) = W (1) X (1, m), Y (2, m) = W (2) X (2, m),..., Y (F, m) = W ( F) X (F, m) is calculated, and the calculation result is stored in the Y (f, m) storage area (1514) of the RAM (15) (S116).

次に、復元部(149)は、Y(f,m)格納領域(1514)からY(1,m)、Y(2,m)、・・・、Y(F,m)を読み込んで、これらの値に対して短時間離散逆フーリエ変換を演算して、この演算結果をRAM(15)のy(n)格納領域(1515)に格納する。このy(n)格納領域(1515)に格納されたy(n)=[y(f,m),y(f,m)]が、分離された時系列データとしての分離信号となる。 Next, the restoration unit (149) reads Y (1, m), Y (2, m),..., Y (F, m) from the Y (f, m) storage area (1514), Short-time discrete inverse Fourier transform is calculated for these values, and the calculation result is stored in the y (n) storage area (1515) of the RAM (15). The y (n) = [y 1 (f, m), y 2 (f, m)] T stored in the y (n) storage area (1515) is a separated signal as separated time-series data and Become.

<第1.1の実施形態>
上記の第1の実施形態では、グリッドサーチを<C>を用いて判定することで行った。この代わりに、各周波数で最も高い分離精度が得られるピアソン分布系のパラメータ{b(f)、b(f)、c(f)、c(f)、c(f)}をグリッドサーチにて求めることもできる(これを第1.1の実施形態とする。)。
<First Embodiment>
In the first embodiment, the grid search is performed by using <C>. Alternatively, parameters of Pearson distribution system to which the highest separation accuracy at each frequency is obtained {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)} Can also be obtained by grid search (this is the first embodiment).

ここでは、原信号s(n)、インパルス応答hji(n)が既知とする。さらに、出力された分離信号y(n)が原信号s(n)の分離結果として得られているとする。このとき、各周波数fにおける分離精度は、SIR(Signal to Interference Ratio)にて与えられる。

Figure 0004653674
Here, it is assumed that the original signal s i (n) and the impulse response h ji (n) are known. Furthermore, it is assumed that the output separated signal y k (n) is obtained as a result of separating the original signal s i (n). At this time, the separation accuracy at each frequency f is given by SIR (Signal to Interference Ratio).
Figure 0004653674

ここで式(49)におけるYki(f,m)は、出力端kにおける各原信号s(n)由来の成分yki(n)〔式(50)〕の短時間離散フーリエ変換結果(但し、uki(l)は、式(51)で表されるものであり、wkj(n)は、スコア関数にグリッドBによるピアソン分布系を用いたICAで得られた分離行列W(f)のkj要素の短時間離散逆フーリエ変換結果、Lは周波数領域における表現を得るために用いた短時間フーリエ変換の窓長を表す。)である。

Figure 0004653674
Here, Y ki (f, m) in the equation (49) is the short-time discrete Fourier transform result (y) of the component y ki (n) [expression (50)] derived from each original signal s i (n) at the output terminal k ( However, u ki (l) are those represented by the formula (51), w kj (n ) is the separation matrix W obtained by ICA using Pearson distribution system according to grid B R to the score function ( f) The result of the short-time discrete inverse Fourier transform of the kj element of L, L represents the window length of the short-time Fourier transform used to obtain the representation in the frequency domain.
Figure 0004653674

以上をもとに、第1.1の実施形態では、第1の実施形態と異なる部分について説明を行うことにする(図11〜13参照)。   Based on the above, in the 1.1st embodiment, the parts different from the 1st embodiment will be described (see FIGS. 11 to 13).

外部記憶装置(17)には、原信号s(n)、インパルス応答hji(n)および閾値Maxをも予め記憶しておく。また、外部記憶装置(17)には、分離行列W(f)に対して短時間離散逆フーリエ変換を演算して、その演算結果w(n)を出力するための短時間離散逆フーリエ変換演算プログラム、w(n)、s(n)およびhji(n)から分離精度値SIRを求めるための分離精度値演算プログラム、分離精度値SIRと閾値Maxとの大小判定を行う分離精度値判定プログラム、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新プログラムも記憶されている。 In the external storage device (17), the original signal s (n), the impulse response h ji (n), and the threshold value Max are also stored in advance. Further, the external storage device (17) calculates a short-time discrete inverse Fourier transform for the separation matrix W (f) and outputs a calculation result w (n). Program, separation accuracy value calculation program for obtaining separation accuracy value SIR from w (n), s (n) and h ji (n), separation accuracy value determination program for determining the size of separation accuracy value SIR and threshold value Max When the separation accuracy value SIR is greater than or equal to the threshold value Max, the separation matrix W (f) is set to the separation matrix W (f) output by the updating unit, and the value of the threshold value Max is set to the separation accuracy value SIR. 2 update programs are also stored.

各プログラムは、CPU(14)によって解釈実行されて機能する(短時間離散逆フーリエ変換演算部、分離精度値演算部、分離精度値判定部、第2更新部)。   Each program functions by being interpreted and executed by the CPU (14) (a short-time discrete inverse Fourier transform calculation unit, a separation accuracy value calculation unit, a separation accuracy value determination unit, and a second update unit).

第1.1の実施形態では、第1の実施形態におけるステップS110pに相当するステップにおいて、分離精度値SIRの平均値を求める。
即ち、ステップS108でg=gmaxが成立した後、まず、短時間離散逆フーリエ変換演算部が、w(n)を求めてRAM(15)の所定の格納領域(w(n)格納領域)にこれを格納する。続いて、分離精度値演算部が、w(n)格納領域からw(n)を読み込み、さらに、予め外部記憶装置(17)からRAM(15)の所定の格納領域に格納されたs(n)、hji(n)を、RAM(15)の所定の格納領域から読み込んで、分離精度値SIRのk〔式(49)参照〕についての平均値<SIR>を求めてRAM(15)の所定の格納領域に格納する(第1の実施形態におけるステップS110pに相当する第1.1の実施形態におけるS410p)。続いて、分離精度値判定部が、第1の実施形態のステップS110と同様の処理(但し、第1の実施形態では、<C> < Min という大小判定をしたが、この実施形態では、<SIR> > Max という大小判定を行う。)を行い、予め外部記憶装置(17)からRAM(15)の所定の格納領域に格納された閾値Maxを、RAM(15)の所定の格納領域から読み込み、また、RAM(15)の所定の格納領域から<SIR>を読み込み、これらの大小判定を行う(S410)(判定結果によって、ステップS111を実行するか、ステップS112(S412)を実行するかは、第1の実施形態で説明したのと同様である。)。続いて、第2更新部は、第1の実施形態のステップS112と同様の処理を行う(S412)。即ち、<SIR>が閾値Max以上である場合には、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を<SIR>に設定する。このようにして、第1.1の実施形態では、SIR値が最も高くなるパラメータ{b(f)、b(f)、c(f)、c(f)、c(f)}をグリッドサーチにて選択するのである(反復処理などは、第1の実施形態で説明したのと同様であるから略する。)。
In the first embodiment, an average value of the separation accuracy values SIR is obtained in a step corresponding to step S110p in the first embodiment.
That is, after g = gmax is established in step S108, first, the short-time discrete inverse Fourier transform calculation unit obtains w (n) and stores it in a predetermined storage area (w (n) storage area) of the RAM (15). Store this. Subsequently, the separation accuracy value calculation unit reads w (n) from the w (n) storage area, and further stores s (n) stored in advance in the predetermined storage area of the RAM (15) from the external storage device (17). ), H ji (n) are read from a predetermined storage area of the RAM (15), and an average value <SIR> k of k of the separation accuracy value SIR [see Equation (49)] is obtained to obtain the RAM (15). In the predetermined storage area (S410p in the 1.1st embodiment corresponding to step S110p in the first embodiment). Subsequently, the separation accuracy value determination unit performs the same process as in step S110 of the first embodiment (however, in the first embodiment, <C><Min is determined as magnitude, but in this embodiment, <SIR> k > Max is determined), and the threshold value Max stored in the predetermined storage area of the RAM (15) from the external storage device (17) in advance is determined from the predetermined storage area of the RAM (15). Read, <SIR> k is read from a predetermined storage area of the RAM (15), and the size is determined (S410) (depending on the determination result, step S111 is executed, or step S112 (S412) is executed. This is the same as described in the first embodiment.) Subsequently, the second update unit performs the same process as step S112 of the first embodiment (S412). That is, when <SIR> k is equal to or greater than the threshold Max, the separation matrix W (f) is set to the separation matrix W (f) output by the updating unit, and the value of the threshold Max is set to <SIR> k . To do. Thus, in the first embodiment, the parameters {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f )} Is selected by grid search (iterative processing and the like are omitted because they are the same as those described in the first embodiment).

<第1.2の実施形態>
さらに、各周波数fにおける分離精度SIRを、上記第1.1の実施形態とは異なり、原信号やインパルス応答を用いることなく、或る程度、信号分離を行った結果であるy (n)を用いて演算することもできる(これを第1.2の実施形態とする。)。ここでも、各周波数で最も高い分離精度が得られるピアソン分布系のパラメータ{b(f)、b(f)、c(f)、c(f)、c(f)}をグリッドサーチにて求める。
<First Embodiment>
Furthermore, the separation accuracy SIR at each frequency f is different from that in the first embodiment, y i j (n, which is the result of signal separation to some extent without using the original signal or impulse response. ) Can also be used for calculation (this is the 1.2th embodiment). Here again, the parameters {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)} of the Pearson distribution system that provides the highest separation accuracy at each frequency are expressed as follows. Find by grid search.

第1.2の実施形態ではSIRを、式(52)として求める。

Figure 0004653674
In the first embodiment, the SIR is obtained as Expression (52).
Figure 0004653674

但し、式(52)におけるYki(f,m)は、(k番目の分離信号が出力される)出力端kにおける各原信号s(n)と推定された成分y (n)〔j=1,2,・・・,M〕に由来する成分yki(n)〔式(53)〕の短時間離散フーリエ変換結果であり、wkj(n)は、ピアソン分布系を用いたICAによる学習で得られた分離行列W(f)のkj要素の短時間離散逆フーリエ変換結果である。

Figure 0004653674
However, Y ki (f, m) in the equation (52) is a component y i j (n) estimated as each original signal s i (n) at the output terminal k (where the k-th separated signal is output). It is a short-time discrete Fourier transform result of the component y ki (n) [Expression (53)] derived from [j = 1, 2,..., M], and w kj (n) uses a Pearson distribution system This is a short-time discrete inverse Fourier transform result of the kj element of the separation matrix W (f) obtained by learning by ICA.
Figure 0004653674

また、y (n)は、何らかの方法で、予め分離された信号であり、y (n)は、式(54)で表される近似値である。

Figure 0004653674
Further, y i j (n) is a signal separated in advance by some method, and y i j (n) is an approximate value represented by Expression (54).
Figure 0004653674

このy (n)は、例えば、スコア関数にtanh関数などのsuper-Gaussian分布を仮定した関数を用いたICAと、このICAにより求まる分離行列Wp(f)への適切なスケーリングによって求められる。 This y i j (n) is obtained by, for example, an ICA using a function assuming a super-Gaussian distribution such as a tanh function as a score function and an appropriate scaling to a separation matrix Wp (f) obtained by this ICA. .

このスケーリング方法としては、例えば、下記の手法をとることができる。
即ち、まず、周波数間のパーミュテーション問題を解き(上記特許文献2)、次に、例えばMDP技術を用いて、全てのi、jについて、y (n)を求め、最後に、これをそれぞれ逆フーリエ変換して、y (n)を求める方法である。
For example, the following method can be used as the scaling method.
That is, first, the permutation problem between frequencies is solved (Patent Document 2), and then y i j (n) is obtained for all i and j using, for example, the MDP technique. Are obtained by performing inverse Fourier transform on each of them to obtain y i j (n).

以上をもとに、第1.2の実施形態では、第1.1の実施形態と異なる部分について説明を行うことにする(図11〜13参照)。   Based on the above, in the 1.2th embodiment, only the parts different from the 1.1st embodiment will be described (see FIGS. 11 to 13).

外部記憶装置(17)には、閾値Maxも予め記憶しておく。また、外部記憶装置(17)には、スコア関数ΦとしてΦ(Y(f,m))=tanh(|Y(f,m)|)exp(jθ(Y(f,m)))などのsuper-Gaussian分布を仮定した関数を用いて、Wp(f)+[I−<Φ(Y(f,m))Y(f,m)>]Wp(f)を演算し、この演算結果を新たな分離行列Wp(f)として出力するためのsuper-Gaussian型更新プログラム、分離行列Wp(f)とX(f,m)との積を求めて、Yp(f,m)=Wp(f)X(f,m)として出力するためのsuper-Gaussian型変換プログラムと、Yp(f,m)と分離行列W(f)とを用いて各周波数における分離精度値SIRを演算して出力するための分離精度値演算プログラムと、分離精度値SIRと、記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定プログラムと、判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定するための第2更新プログラムも記憶されている。 In the external storage device (17), the threshold value Max is also stored in advance. Further, the external storage device (17) has a score function Φ such as Φ (Y (f, m)) = tanh (| Y (f, m) |) exp (jθ (Y (f, m))). Using a function assuming a super-Gaussian distribution, Wp (f) + [I− <Φ (Y (f, m)) Y H (f, m)>] Wp (f) is calculated, and the calculation result Is obtained as a new separation matrix Wp (f), a super-Gaussian update program, the product of the separation matrix Wp (f) and X (f, m) is obtained, and Yp (f, m) = Wp ( f) Using a super-Gaussian conversion program for output as X (f, m), Yp (f, m) and a separation matrix W (f), a separation accuracy value SIR at each frequency is calculated and output. The separation accuracy value calculation program, the separation accuracy value SIR, and the threshold value Max stored in the storage means are determined. Is set to the separation matrix W (f) output by the updating means when the separation accuracy value SIR is greater than or equal to the threshold value Max. A second update program for setting the threshold value Max to the separation accuracy value SIR is also stored.

各プログラムは、CPU(14)によって解釈実行されて機能する(super-Gaussian型更新部、super-Gaussian型変換部、分離精度値演算部、分離精度値判定部、第2更新部)。   Each program functions by being interpreted and executed by the CPU (14) (super-Gaussian type update unit, super-Gaussian type conversion unit, separation accuracy value calculation unit, separation accuracy value determination unit, second update unit).

まず、第1の実施形態あるいは第1.1の実施形態で説明したような分離行列W(f)の算出とは別に、従来的な公知の方法で分離行列Wp(f)を求める。即ち、super-Gaussian型更新部が、例えばスコア関数をtanh関数として、更新式によって分離行列Wp(f)を算出する。そして、super-Gaussian型変換部は、この分離行列Wp(f)とX(f,m)とから、Yp(f,m)=Wp(f)X(f,m)を求めて、RAM(15)の所定の格納領域に格納しておく。これは、第1の実施形態あるいは第1.1の実施形態において分離行列W(f)を求めるのと並行的に実行処理すればよい。なお、上記第1の実施形態で既述のとおり、分離行列W(f)の初期値を単位行列ではなく例えば上記分離行列Wp(f)としてもよい(この場合は、分離行列Wp(f)およびYp(f,m)を算出する処理が、第1の実施形態あるいは第1.1の実施形態において分離行列W(f)を求める処理に先行することは当然である。)。   First, apart from the calculation of the separation matrix W (f) as described in the first embodiment or the first embodiment, the separation matrix Wp (f) is obtained by a conventionally known method. That is, the super-Gaussian type updating unit calculates the separation matrix Wp (f) by an updating formula using, for example, a score function as a tanh function. Then, the super-Gaussian type conversion unit obtains Yp (f, m) = Wp (f) X (f, m) from this separation matrix Wp (f) and X (f, m), and stores the RAM ( 15) is stored in a predetermined storage area. This may be executed in parallel with obtaining the separation matrix W (f) in the first embodiment or the first embodiment. As already described in the first embodiment, the initial value of the separation matrix W (f) may be the separation matrix Wp (f) instead of the unit matrix (in this case, the separation matrix Wp (f)). Naturally, the process of calculating Yp (f, m) precedes the process of obtaining the separation matrix W (f) in the first embodiment or the first embodiment.

以上のようにしてYp(f,m)が求められているとして、ステップS108でg=gmaxが成立した後、分離精度値演算部は、RAM(15)の所定の格納領域から読み込んだYp(f,m)とW(f)格納領域(1503)から読み込んだ分離行列W(f)とから、分離精度値SIR値のk〔式(52)参照〕についての平均値<SIR>を求めてRAM(15)の所定の格納領域に格納する(第1の実施形態におけるステップS110pに相当する第1.2の実施形態におけるS410p)。続いて、分離精度値判定部が、第1の実施形態のステップS110と同様の処理(但し、第1の実施形態では、<C> < Min という大小判定をしたが、この実施形態では、<SIR> > Max という大小判定を行う。)を行い、予め外部記憶装置(17)からRAM(15)の所定の格納領域に格納された閾値Maxを、RAM(15)の所定の格納領域から読み込み、また、RAM(15)の所定の格納領域から<SIR>を読み込み、これらの大小判定を行う(S410)(判定結果によって、ステップS111を実行するか、ステップS112(S412)を実行するかは、第1の実施形態で説明したのと同様である。)。続いて、第2更新部は、第1の実施形態のステップS112と同様の処理を行う(S412)。即ち、<SIR>が閾値Max以上である場合には、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を<SIR>に設定する。このようにして、第1.2の実施形態では、SIR値が最も高くなるパラメータ{b(f)、b(f)、c(f)、c(f)、c(f)}をグリッドサーチにて選択するのである(反復処理などは、第1の実施形態で説明したのと同様であるから略する。)。 Assuming that Yp (f, m) is obtained as described above, after g = gmax is established in step S108, the separation accuracy value calculation unit reads Yp (y) read from a predetermined storage area of the RAM (15). The average value <SIR> k of k of the separation accuracy value SIR value [see Equation (52)] is obtained from the separation matrix W (f) read from the f (m) and W (f) storage area (1503). And stored in a predetermined storage area of the RAM (15) (S410p in the 1.2th embodiment corresponding to step S110p in the first embodiment). Subsequently, the separation accuracy value determination unit performs the same process as in step S110 of the first embodiment (however, in the first embodiment, <C><Min is determined as magnitude, but in this embodiment, <SIR> k > Max is determined), and the threshold value Max stored in the predetermined storage area of the RAM (15) from the external storage device (17) in advance is determined from the predetermined storage area of the RAM (15). Read, <SIR> k is read from a predetermined storage area of the RAM (15), and the size is determined (S410) (depending on the determination result, step S111 is executed, or step S112 (S412) is executed. This is the same as described in the first embodiment.) Subsequently, the second update unit performs the same process as step S112 of the first embodiment (S412). That is, when <SIR> k is equal to or greater than the threshold Max, the separation matrix W (f) is set to the separation matrix W (f) output by the updating unit, and the value of the threshold Max is set to <SIR> k . To do. In this way, in the first embodiment, the parameters {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f )} Is selected by grid search (iterative processing and the like are omitted because they are the same as those described in the first embodiment).

上記の第1の実施形態、第1.1の実施形態、第1.2の実施形態では、式(45)のパラメータをグリッドサーチによって決定した。しかし、ピアソン分布の型が予め判明した場合や、適宜にピアソン分布の型を設定した場合などでは、式(45)のパラメータ{b、b、c、c、c}を求めるのではなく、そのピアソン分布の型におけるパラメータ(例えば、ピアソン分布IV型では、パラメータb、δ、τ、μである。)をグリッドサーチして決定すればよい。 In the first embodiment, the first embodiment, and the first embodiment, the parameter of Expression (45) is determined by grid search. However, when the type of Pearson distribution is known in advance or when the type of Pearson distribution is appropriately set, the parameters {b 0 , b 1 , c 0 , c 1 , c 2 } of Expression (45) are obtained. Instead, the parameters in the Pearson distribution type (for example, the parameters b, δ, τ, and μ in the Pearson distribution type IV) may be determined by grid search.

<第2の実施形態>
次に、本発明の信号分離装置・方法の第2の実施形態を説明する。
第2の実施形態においても、説明の便宜から、信号源の数は2つ、観測装置の数を2つとする。
図6は、第2の実施形態に係わる信号分離装置(2)のハードウェア構成を例示した構成ブロック図である。
図7は、第2の実施形態に係わる信号分離装置(2)において原信号から分離信号を得るまでのフローを例示する図である。
図8および図9は、第2の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理を例示するフローチャートである。
図10は、第2の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理機能を例示する機能ブロック図である。
<Second Embodiment>
Next, a second embodiment of the signal separation device / method of the present invention will be described.
Also in the second embodiment, for convenience of explanation, the number of signal sources is two and the number of observation devices is two.
FIG. 6 is a block diagram illustrating the hardware configuration of the signal separation device (2) according to the second embodiment.
FIG. 7 is a diagram illustrating a flow until a separation signal is obtained from an original signal in the signal separation device (2) according to the second embodiment.
FIG. 8 and FIG. 9 are flowcharts illustrating the process of obtaining the separation signal from the observation signal in the signal separation device (2) according to the second embodiment.
FIG. 10 is a functional block diagram illustrating a processing function for obtaining a separation signal from an observation signal in the signal separation device (2) according to the second embodiment.

図6に例示するように、第2の実施形態に係る信号分離装置(2)は、キーボードなどが接続可能な入力部(21)、液晶ディスプレイなどが接続可能な出力部(22)、信号分離装置(2)外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部(13)、CPU(Central Processing Unit)(24)、メモリであるRAM(25)、ROM(26)やハードディスクである外部記憶装置(27)並びにこれらの入力部(21)、出力部(22)、通信部(23)、CPU(24)、RAM(25)、ROM(26)、外部記憶装置(27)間のデータのやり取りが可能なように接続するバス(28)を有している。また必要に応じて、信号分離装置(2)に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。   As illustrated in FIG. 6, the signal separation device (2) according to the second embodiment includes an input unit (21) to which a keyboard or the like can be connected, an output unit (22) to which a liquid crystal display or the like can be connected, and signal separation. Device (2) A communication unit (13) to which a communication device (for example, a communication cable) that can communicate with the outside can be connected, a CPU (Central Processing Unit) (24), a memory RAM (25), a ROM (26), and a hard disk The external storage device (27) as well as the input unit (21), output unit (22), communication unit (23), CPU (24), RAM (25), ROM (26), external storage device (27) The bus (28) is connected so that data can be exchanged between them. If necessary, the signal separation device (2) may be provided with a device (drive) that can read and write a storage medium such as a CD-ROM.

さらに信号分離装置(2)には、信号(例えば音声、音楽、雑音、無線信号など)を観測する観測装置(例えばマイクロホン)を接続可能であって、観測装置から観測信号の入力を受ける観測信号入力部を設けてもよい。   Further, an observation device (for example, a microphone) for observing a signal (for example, voice, music, noise, radio signal, etc.) can be connected to the signal separation device (2), and an observation signal for receiving an observation signal from the observation device. An input unit may be provided.

信号分離装置(2)の外部記憶装置(27)には、観測信号から分離信号を得るためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている。また、このプログラムの処理によって得られたデータなどを保存記憶するデータ格納領域(271)も確保されている。   The external storage device (27) of the signal separation device (2) stores and stores a program for obtaining a separation signal from the observation signal, data necessary for processing of this program, and the like. In addition, a data storage area (271) for storing and storing data obtained by the processing of this program is also secured.

より具体的には、外部記憶装置(27)には、観測装置であるセンサMで観測した観測信号x(n)、観測装置であるセンサMで観測した観測信号x(n)、2行2列の分離行列W(f)の初期値、2行2列の単位行列の値、学習サイズηの値が保存記憶されている。 More specifically, the external storage device (27) includes an observation signal x 1 (n) observed by the sensor M 1 as an observation device and an observation signal x 2 (n) observed by the sensor M 2 as an observation device. The initial value of the 2 × 2 separation matrix W (f), the value of the unit matrix of 2 × 2 and the value of the learning size η are stored.

なお、観測信号x(n)および観測信号x(n)は、センサM、Mで観測した観測信号を公知のサンプリング方法や量子化方法などによって、サンプリングや量子化などがされた時系列離散データとする(nはサンプリング系列を表し、n=1,2,・・・,Nとする。)。信号分離装置(2)に、公知のサンプリング手段や量子化手段などを備えて、サンプリングや量子化などを実行し、その結果である観測信号x(n)および観測信号x(n)を外部記憶装置(27)に保存記憶するようにしてもよい。 Note that the observation signal x 1 (n) and the observation signal x 2 (n) were sampled or quantized by a known sampling method, quantization method, or the like for the observation signal observed by the sensors M 1 and M 2 . and time-series discrete data (n represents the sampling sequence, n = 1,2, ···, and n n.). The signal separation device (2) is provided with known sampling means, quantization means, etc., and performs sampling, quantization, etc., and the resulting observation signal x 1 (n) and observation signal x 2 (n) are obtained. You may make it preserve | save and memorize | store in an external storage device (27).

また、外部記憶装置(27)には、観測信号x(n)および観測信号x(n)から分離信号を得るためのプログラムとして、短時間離散フーリエ変換演算プログラム(272)、変換プログラム(273)、スコア関数演算プログラム(2710)、フレーム時間平均プログラム(2711)、更新プログラム(2712)、復元プログラム(2713)、第1反復制御プログラム(2714)、第2反復制御プログラム(2715)、サンプルモーメント演算プログラム(274)、κ演算プログラム(275)、ピアソン分布型判定プログラム(276)、ピアソン分布I型パラメータ演算プログラム(277)、ピアソン分布IV型パラメータ演算プログラム(278)、ピアソン分布VI型パラメータ演算プログラム(279)、パーミュテーション処理プログラム(2716)、スケーリング処理プログラム(2717)その他各プログラムの処理やデータの読み込みなどを制御する制御プログラムが保存記憶されている。これらのプログラムの処理によって得られるデータなどは、データ格納領域(271)に保存記憶される。 The external storage device (27) has a short-time discrete Fourier transform operation program (272), a conversion program (as a program for obtaining a separated signal from the observation signal x 1 (n) and the observation signal x 2 (n), 273), score function calculation program (2710), frame time average program (2711), update program (2712), restoration program (2713), first iteration control program (2714), second iteration control program (2715), sample Moment calculation program (274), κ calculation program (275), Pearson distribution type determination program (276), Pearson distribution type I parameter calculation program (277), Pearson distribution type IV parameter calculation program (278), Pearson distribution type VI parameter Arithmetic program (279 , Permutation processing program (2716), the scaling processing program (2717) Other control program that controls the reading process and the data of each program is stored stored. Data obtained by the processing of these programs is stored and stored in the data storage area (271).

第2の実施形態に係る信号分離装置(2)では、外部記憶装置(27)に記憶されたプログラムとこのプログラムの処理に必要なデータが必要に応じてRAM(25)に読み込まれて、CPU(24)で解釈実行・処理される。その結果、CPU(24)が所定の機能を実現して、観測信号x(n)および観測信号x(n)から分離信号を得るものとなっている。 In the signal separation device (2) according to the second embodiment, a program stored in the external storage device (27) and data necessary for processing the program are read into the RAM (25) as necessary, and the CPU Interpretation is executed and processed in (24). As a result, the CPU (24) realizes a predetermined function and obtains a separated signal from the observation signal x 1 (n) and the observation signal x 2 (n).

そこで次に、図7〜図10を参照して、信号分離装置(2)において、観測信号x(n)および観測信号x(n)から分離信号を得る演算処理の流れを順次説明する。 Next, with reference to FIGS. 7 to 10, the flow of arithmetic processing for obtaining the separation signal from the observation signal x 1 (n) and the observation signal x 2 (n) in the signal separation device (2) will be sequentially described. .

まず、制御部(図示しない)の制御の下、外部記憶装置(27)から、時系列データである観測信号x(n)、x(n)を読み込み、これらの値をRAM(25)のx(n)格納領域(2501)に格納する(S300)。また、この工程において、後の処理において必要なデータとなる単位行列の値を外部記憶装置(27)から読み込み、これらの値をRAM(25)の単位行列格納領域(2512)に格納し、さらに、学習サイズηの値を外部記憶装置(27)から読み込み、この値をRAM(25)の学習サイズη格納領域(2513)に格納しておくことにする。 First, under the control of a control unit (not shown), the observation signals x 1 (n) and x 2 (n) as time series data are read from the external storage device (27), and these values are stored in the RAM (25). Are stored in the x (n) storage area (2501) (S300). Further, in this step, the values of the unit matrix that are necessary data in the subsequent processing are read from the external storage device (27), and these values are stored in the unit matrix storage area (2512) of the RAM (25). The value of the learning size η is read from the external storage device (27), and this value is stored in the learning size η storage area (2513) of the RAM (25).

次に、短時間離散フーリエ変換演算部(241)によって、x(n)格納領域(2501)から観測信号x(n)、x(n)を読み込み、これらの短時間離散フーリエ変換を演算して(S301)、その演算結果であるX(f、m)、X(f、m)をRAM(25)のX(f、m)格納領域(2502)に格納する(S302)。なお、短時間離散フーリエ変換における周波数をf(=1,2,・・・,F)、フレーム時刻をm(=1,2,・・・,N)とする。Fは、短時間離散フーリエ変換における周波数fの上限である。また、Nは、短時間離散フーリエ変換におけるフレームの数である。 Next, the short-time discrete Fourier transform operation unit (241) reads the observation signals x 1 (n) and x 2 (n) from the x (n) storage area (2501) and calculates these short-time discrete Fourier transforms. Then, X 1 (f, m) and X 2 (f, m), which are the calculation results, are stored in the X (f, m) storage area (2502) of the RAM (25) (S302). Incidentally, a short time discrete Fourier frequency in the transform f (= 1,2, ···, F ), the frame time m (= 1,2, ···, N m) and. F is the upper limit of the frequency f in the short-time discrete Fourier transform. N m is the number of frames in the short-time discrete Fourier transform.

短時間離散フーリエ変換演算部(241)によって演算される短時間離散フーリエ変換は公知のものでよい。例えば窓関数は適宜選択可能であり、ハミング窓、ハニング窓などを用いることができる。また、短時間離散フーリエ変換におけるフレーム間隔Δtや周波数の上限Fも、観測信号x(n)、x(n)に応じて適宜に設定できる。例えばフレーム長(=窓長=離散フーリエ変換の長さ)をTとすると、Δt=T/Sとする〔TおよびSは、2のべき乗の値とする。〕。 The short-time discrete Fourier transform computed by the short-time discrete Fourier transform computation unit (241) may be a known one. For example, the window function can be selected as appropriate, and a Hamming window, a Hanning window, or the like can be used. Further, the frame interval Δt and the upper limit F of the frequency in the short-time discrete Fourier transform can be appropriately set according to the observation signals x 1 (n) and x 2 (n). For example, if the frame length (= window length = discrete Fourier transform length) is T, Δt = T / S [T and S are powers of 2. ].

次に、第1反復制御部(240a)の制御の下、各周波数f=1,2,・・・,Fについて、所定の条件を満たすまでステップS303〜S313の処理を反復実行する。
周波数f=1の場合(S302r)を、以下に説明する。
Next, under the control of the first repetitive control unit (240a), the processing of steps S303 to S313 is repeatedly executed for each frequency f = 1, 2,.
The case where the frequency f = 1 (S302r) will be described below.

ステップS304〜S313の処理は、第2反復制御部(240b)の制御の下に所定の条件を満たすまで反復実行される。   The processes in steps S304 to S313 are repeatedly executed until a predetermined condition is satisfied under the control of the second repetition control unit (240b).

制御部(図示しない)の制御の下、外部記憶装置(27)から、2行2列の分離行列W(1)の初期値を読み込み、これらの値をRAM(25)のW(f)格納領域(2503)に格納する(S303)。この第2の実施形態では、分離行列W(1)の初期値は単位行列とする。勿論、単位行列に限定する趣旨ではなく、適宜(任意)の値を成分に持つ行列としてもよい。   Under the control of the control unit (not shown), the initial values of the 2-by-2 separation matrix W (1) are read from the external storage device (27), and these values are stored in W (f) of the RAM (25). Store in the area (2503) (S303). In the second embodiment, the initial value of the separation matrix W (1) is a unit matrix. Of course, it is not intended to be limited to a unit matrix, but may be a matrix having appropriately (arbitrary) values as components.

また、S303においては、第2反復制御部(240b)による反復実行を制御するための識別子g=1を設定する。また、識別子gの最大値をgmaxとする。このgmaxの値は、観測信号のデータ量などから任意に定めておく。   In S303, an identifier g = 1 is set for controlling the repeated execution by the second repetition control unit (240b). The maximum value of the identifier g is gmax. The value of gmax is arbitrarily determined from the data amount of the observation signal.

なお、第1反復制御部(240a)による反復実行の制御に係る周波数fの値およびその上限値F、第2反復制御部(240b)による反復実行の制御に係る識別子gの値およびその最大値gmaxは、RAM(25)の所定の格納領域(図示しない。)に格納しておき、各部(240a)(240b)は、所定の格納領域から必要な値を読み込んで大小比較をし、反復実行の制御を行うようにする。   Note that the value of the frequency f and its upper limit value F related to the repeated execution control by the first iteration control unit (240a), the value of the identifier g and the maximum value thereof related to the repeated execution control by the second iteration control unit (240b). gmax is stored in a predetermined storage area (not shown) of the RAM (25), and each unit (240a) (240b) reads a necessary value from the predetermined storage area, compares the magnitudes, and executes repeatedly. To control.

例えば、予め外部記憶装置(27)に記憶しておいたgmaxの値を読み込んでRAM(25)の所定の格納領域に格納しておき、第2反復制御部(240c)は、識別子gの値と上記格納領域に格納されたgmaxの値の大小を読み込んで比較することで、反復実行の制御を行うようにすればよい。   For example, the value of gmax previously stored in the external storage device (27) is read and stored in a predetermined storage area of the RAM (25), and the second iterative control unit (240c) determines the value of the identifier g It is sufficient to control repetitive execution by reading and comparing the magnitudes of the values of gmax stored in the storage area.

次に、変換部(242)によって、X(f、m)格納領域(2502)からX(1、m)、X(1、m)を読み込み、W(f)格納領域(2503)から分離行列W(1)の初期値(単位行列)を読み込み、これらの値から式(55)の演算を行い、この演算結果Y(1,m),Y(1,m)をRAM(25)のY(f,m)格納領域(2504)に格納する(S304)。式(44)のY(1,m)は、Y(1,m)=[Y(1,m),Y(1,m)]であり、式(44)のX(1,m)は、X(1,m)=[X(1,m),X(1,m)]である(以下同様。)。また、式(44)に表されるように、ステップS304における処理は、フレーム時刻m=1,2,・・・,Nの全フレームに関するバッチ処理である(図8では∀mで表している。また、このバッチ処理については、以下の各ステップでも同様である。)。

Figure 0004653674
Next, the conversion unit (242) reads X 1 (1, m) and X 2 (1, m) from the X (f, m) storage area (2502), and from the W (f) storage area (2503). The initial value (unit matrix) of the separation matrix W (1) is read, and the calculation of Expression (55) is performed from these values, and the calculation results Y 1 (1, m), Y 2 (1, m) are stored in the RAM ( 25) in the Y (f, m) storage area (2504) (S304). Y (1, m) in the equation (44) is Y (1, m) = [Y 1 (1, m), Y 2 (1, m)] T , and X (1, m) in the equation (44) m) is X (1, m) = [X 1 (1, m), X 2 (1, m)] T (the same applies hereinafter). Moreover, as represented in formula (44), processing in step S304, the frame time m = 1, 2, · · ·, a batch processing for all frames of N m (expressed in ∀m 8 Also, this batch process is the same in the following steps).
Figure 0004653674

次に、サンプルモーメント演算部(243)によって、Y(f,m)格納領域(1504)からY(1,m)を読み込み、このY(1,m)のサンプルモーメント(平均、分散、歪度、尖度)を演算して、この演算結果をRAM(25)のサンプルモーメント格納領域(2505)に格納する(S305)。   Next, Y (1, m) is read from the Y (f, m) storage area (1504) by the sample moment calculation unit (243), and the sample moment (average, variance, skewness) of this Y (1, m) is read. , Kurtosis) is calculated, and the calculation result is stored in the sample moment storage area (2505) of the RAM (25) (S305).

次に、κ演算部(244)によって、サンプルモーメント格納領域(2505)から、Y(1,m)のサンプルモーメント(歪度sおよび尖度k)を読み込み、式(56)の演算を行い、この演算結果κをRAM(25)のκ格納領域(2506)に格納する(S306)。但し、β=s、β=kである。

Figure 0004653674
Next, the κ calculation unit (244) reads the sample moment (distortion s and kurtosis k) of Y (1, m) from the sample moment storage area (2505), performs the calculation of equation (56), The calculation result κ is stored in the κ storage area (2506) of the RAM (25) (S306). However, β 1 = s 2 and β 2 = k.
Figure 0004653674

次に、ピアソン分布型判定部(245)によって、κ格納領域(2506)からκの値を読み込み、このκの値が、0>κ、0<κ<1、κ>1のいずれであるかを判定する(S307)。   Next, the value of κ is read from the κ storage area (2506) by the Pearson distribution type determination unit (245), and whether the value of κ is 0> κ, 0 <κ <1, or κ> 1. Is determined (S307).

第2反復制御部(240b)は、ステップS307で判定された結果に対応したピアソン分布型パラメータ演算部による処理を実行させる(S308)。   The second iterative control unit (240b) executes processing by the Pearson distribution type parameter calculation unit corresponding to the result determined in step S307 (S308).

即ち、ステップS307において、0>κであると判定された場合には、第2反復制御部(240b)は、ピアソン分布I型パラメータ演算部(246a)による処理を実行させる。   That is, if it is determined in step S307 that 0> κ, the second iterative control unit (240b) causes the Pearson distribution I-type parameter calculation unit (246a) to execute processing.

ステップS307において、0<κ<1であると判定された場合には、第2反復制御部(240b)は、ピアソン分布IV型パラメータ演算部(246b)による処理を実行させる。   If it is determined in step S307 that 0 <κ <1, the second iterative control unit (240b) causes the Pearson distribution IV parameter calculation unit (246b) to execute processing.

ステップS307において、1<κであると判定された場合には、第2反復制御部(240b)は、ピアソン分布VI型パラメータ演算部(246c)による処理を実行させる。   If it is determined in step S307 that 1 <κ, the second iterative control unit (240b) causes the Pearson distribution VI type parameter calculation unit (246c) to execute processing.

各ピアソン分布型パラメータ演算部(246a)(246b)(246c)は、サンプルモーメント格納領域(2505)から、Y(1,m)のサンプルモーメント(平均、分散、歪度、尖度)を読み込み、式(35)(38)(41)の演算を行い、この演算結果をRAM(25)の所定の格納領域に格納する。   Each Pearson distribution type parameter calculation unit (246a) (246b) (246c) reads the sample moment (average, variance, skewness, kurtosis) of Y (1, m) from the sample moment storage area (2505), Calculations of equations (35), (38), and (41) are performed, and the calculation results are stored in a predetermined storage area of the RAM (25).

即ち、ピアソン分布I型パラメータ演算部(246a)は、サンプルモーメント格納領域(2505)から、Y(1,m)のサンプルモーメント(平均、分散、歪度、尖度)を読み込み、式(38)の演算を行い、この演算結果であるピアソン分布I型の確率密度関数のパラメータ(この値が後述のスコア関数のパラメータになる。)をピアソン分布I型パラメータ格納領域(2507)に格納する。   That is, the Pearson distribution type I parameter calculation unit (246a) reads the sample moment (average, variance, skewness, kurtosis) of Y (1, m) from the sample moment storage area (2505), and formula (38) The Pearson distribution type I probability density function parameter (this value becomes the parameter of the score function described later), which is the calculation result, is stored in the Pearson distribution type I parameter storage area (2507).

ピアソン分布IV型パラメータ演算部(246b)は、サンプルモーメント格納領域(2505)から、Y(1,m)のサンプルモーメント(平均、分散、歪度、尖度)を読み込み、式(35)の演算を行い、この演算結果であるピアソン分布IV型の確率密度関数のパラメータ(この値が後述のスコア関数のパラメータになる。)をピアソン分布IV型パラメータ格納領域(2508)に格納する。   The Pearson distribution type IV parameter calculation unit (246b) reads the sample moment (average, variance, skewness, kurtosis) of Y (1, m) from the sample moment storage area (2505), and calculates the equation (35). The Pearson distribution IV type probability density function parameter (this value becomes the parameter of the score function described later), which is the calculation result, is stored in the Pearson distribution IV type parameter storage area (2508).

ピアソン分布VI型パラメータ演算部(246c)は、サンプルモーメント格納領域(2505)から、Y(1,m)のサンプルモーメント(平均、分散、歪度、尖度)を読み込み、式(41)の演算を行い、この演算結果であるピアソン分布VI型の確率密度関数のパラメータ(この値が後述のスコア関数のパラメータになる。)をピアソン分布VI型パラメータ格納領域(25079)に格納する。   The Pearson distribution type VI parameter calculation unit (246c) reads the sample moment (average, variance, skewness, kurtosis) of Y (1, m) from the sample moment storage area (2505), and calculates Formula (41). The Pearson distribution VI type probability density function parameter (this value becomes the parameter of the score function described later), which is the calculation result, is stored in the Pearson distribution VI type parameter storage area (25079).

次に、第2反復制御部(240b)は、ステップS307で判定された結果に対応したスコア関数演算部(247)による処理を実行させる(S309)。   Next, the second iterative control unit (240b) causes the score function calculation unit (247) corresponding to the result determined in step S307 to execute processing (S309).

即ち、ステップS307において、0>κであると判定された場合には、スコア関数演算部(247)によって、ピアソン分布I型パラメータ格納領域(2507)からピアソン分布I型の確率密度関数のパラメータを読み込み、Y(f,m)格納領域(1504)からY(1,m)を読み込み、これらの値から式(36)の演算を行い、この演算結果Φ(Y(1,m))をRAM(25)のΦ(Y(f,m))格納領域(2510)に格納する。   That is, if it is determined in step S307 that 0> κ, the score function calculation unit (247) sets the parameters of the Pearson distribution type I probability density function from the Pearson distribution type I parameter storage area (2507). Read, read Y (1, m) from Y (f, m) storage area (1504), perform the calculation of equation (36) from these values, and store the calculation result Φ (Y (1, m)) in RAM Store in the Φ (Y (f, m)) storage area (2510) of (25).

ステップS307において、0<κ<1であると判定された場合には、スコア関数演算部(247)によって、ピアソン分布IV型パラメータ格納領域(2508)からピアソン分布IV型の確率密度関数のパラメータを読み込み、Y(f,m)格納領域(1504)からY(1,m)を読み込み、これらの値から式(33)の演算を行い、この演算結果Φ(Y(1,m))をRAM(25)のΦ(Y(f,m))格納領域(2510)に格納する。   If it is determined in step S307 that 0 <κ <1, the score function calculation unit (247) sets the parameters of the Pearson distribution IV type probability density function from the Pearson distribution IV type parameter storage area (2508). Read, read Y (1, m) from Y (f, m) storage area (1504), perform calculation of equation (33) from these values, and store the calculation result Φ (Y (1, m)) in RAM Store in the Φ (Y (f, m)) storage area (2510) of (25).

ステップS307において、κ>1であると判定された場合には、スコア関数演算部(247)によって、ピアソン分布VI型パラメータ格納領域(2509)からピアソン分布VI型の確率密度関数のパラメータを読み込み、Y(f,m)格納領域(1504)からY(1,m)を読み込み、これらの値から式(39)の演算を行い、この演算結果Φ(Y(1,m))をRAM(25)のΦ(Y(f,m))格納領域(2510)に格納する。   If it is determined in step S307 that κ> 1, the score function calculation unit (247) reads the parameters of the Pearson distribution VI type probability density function from the Pearson distribution VI type parameter storage area (2509), Y (1, m) is read from the Y (f, m) storage area (1504), the equation (39) is calculated from these values, and the calculation result Φ (Y (1, m)) is stored in the RAM (25 ) In Φ (Y (f, m)) storage area (2510).

次に、フレーム時間平均部(248)によって、Y(f,m)格納領域(2504)からY(1,m)を読み込み、このY(1,m)の複素共役転置行列の値Y(1,m)を求め、さらに、Φ(Y(f,m))格納領域(2510)からΦ(Y(1,m))を読み込み、これらの値から式(57)の演算を行い、この演算結果<Φ(Y(1,m))Y(1,m)>をRAM(25)の<Φ(Y(f,m))Y(f,m)>格納領域(2511)に格納する(S310)。なお、Y(1,m)の複素共役転置行列の値Y(1,m)は、図示しない複素共役転置行列演算部(公知の複素共役転置行列演算プログラムをCPUが解釈実行するものである。)にて求めるとし、さらに、これをRAM(25)に確保された領域に記憶することで、フレーム時間平均部(248)は、この記憶領域からY(1,m)を読み込むようにしてもよい。

Figure 0004653674
Next, Y (1, m) is read from the Y (f, m) storage area (2504) by the frame time averaging unit (248), and the value Y H ( 1, m), Φ (Y (1, m)) is read from the Φ (Y (f, m)) storage area (2510), and the calculation of equation (57) is performed from these values. The calculation result <Φ (Y (1, m)) Y H (1, m)> is stored in <Φ (Y (f, m)) Y H (f, m)> storage area (2511) of the RAM (25). Store (S310). The complex conjugate transpose matrix value Y H (1, m) of Y (1, m) is used by the CPU to interpret and execute a complex conjugate transpose matrix calculation unit (not shown). .), And by storing this in an area secured in the RAM (25), the frame time averaging unit (248) reads Y H (1, m) from this storage area. May be.
Figure 0004653674

次に、更新部(249)によって、<Φ(Y(f,m))Y(f,m)>格納領域(2511)から<Φ(Y(1,m))Y(1,m)>を読み込み、単位行列格納領域(2512)から2行2列の単位行列の値を読み込み、学習サイズη格納領域(2513)から学習サイズηの値を読み込み、W(f)格納領域(2503)から分離行列W(1)の値を読み込み、これらの値から式(31)の演算を行い、この演算結果W(1)を新たな分離行列W(1)の値として、W(f)格納領域(2503)に上書き格納する(S311)。なお、図10中のS311における←は、分離行列W(f)の値を新しい値に置換することを意味する。 Next, the update unit (249) uses the storage area (2511) from the <Φ (Y (f, m)) Y H (f, m)><Φ (Y (1, m)) Y H (1, m )>, The value of the unit matrix of 2 rows and 2 columns is read from the unit matrix storage area (2512), the value of the learning size η is read from the learning size η storage area (2513), and the W (f) storage area (2503) ) Is read from the separation matrix W (1), the equation (31) is calculated from these values, and this calculation result W (1) is used as the value of the new separation matrix W (1). Overwrite the data in the storage area (2503) (S311). Note that ← in S311 in FIG. 10 means that the value of the separation matrix W (f) is replaced with a new value.

次に、第2反復制御部(240b)は、反復実行を制御するための識別子gがgmaxと等しいか否かを判定する(S312)。この結果、識別子gがgmaxと等しいと判定されれば、ステップS311で出力された分離行列W(1)の値を最終W(f)格納領域(2514)に格納して、ステップS314の処理へと進む。また、識別子gがgmaxと等しいと判定されなければ、第2反復制御部(240b)は、識別子gに1を加えたものを識別子gの新たな値として(S313)、先に述べたステップS304以降の処理を行う。この際、各ステップで新たに求められた値(Y(1,m)、Φ(Y(1,m))、<Φ(Y(1,m))Y(1,m)>、W(1))は、各値の格納領域に上書き格納される。 Next, the second iterative control unit (240b) determines whether or not the identifier g for controlling repetitive execution is equal to gmax (S312). As a result, if it is determined that the identifier g is equal to gmax, the value of the separation matrix W (1) output in step S311 is stored in the final W (f) storage area (2514), and the process proceeds to step S314. Proceed with If it is not determined that the identifier g is equal to gmax, the second iterative control unit (240b) sets the identifier g plus 1 as a new value of the identifier g (S313), and previously described step S304. Perform the following processing. At this time, values newly obtained at each step (Y (1, m), Φ (Y (1, m)), <Φ (Y (1, m)) Y H (1, m)>, W (1)) is overwritten and stored in the storage area of each value.

ステップS312で識別子gがgmaxと等しいと判定された場合、この段階で、W(f)格納領域(3503)には、周波数f=1の場合において最適化された分離行列W(1)の値が格納されている。   When it is determined in step S312 that the identifier g is equal to gmax, at this stage, the value of the separation matrix W (1) optimized in the case of the frequency f = 1 is stored in the W (f) storage area (3503). Is stored.

第1反復制御部(240a)は、反復実行を制御するための周波数fが上限値Fと等しいか否かを判定する(S314)。この結果、周波数fがFと等しいと判定されれば、ステップS316の処理へと進む。また、周波数fがFと等しいと判定されなければ、第1反復制御部(240a)は、周波数fに1を加えたものを周波数fの新たな値として(S315)、ステップS303以降の処理を行う。   The first iterative control unit (240a) determines whether or not the frequency f for controlling repetitive execution is equal to the upper limit value F (S314). As a result, if it is determined that the frequency f is equal to F, the process proceeds to step S316. If it is not determined that the frequency f is equal to F, the first iterative control unit (240a) sets the frequency f plus 1 as a new value of the frequency f (S315), and performs the processing after step S303. Do.

この結果、最終W(f)格納領域(2514)には、各周波数f=1,2,・・・,Fにおいて最適化された分離行列W(1)、W(2)、・・・、W(F)の値が格納されることになる。   As a result, in the final W (f) storage area (2514), the separation matrices W (1), W (2),... Optimized at the respective frequencies f = 1, 2,. The value of W (F) is stored.

次に、パーミュテーション処理部(2411)は、最終W(f)格納領域(2514)から各分離行列W(f)を読みこみ、i番目の出力Y(f,m)〔周波数領域における分離信号Y(f,m)のi行目の要素〕が、全ての周波数において、あるk番目の原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理を行う(S314a)。このパーミュテーション処理は公知の処理技術に拠ればよい(上記特許文献2、上記非特許文献4参照)。パーミュテーション処理された各分離行列W(f)は、最終W(f)格納領域(2514)に上書き格納される。 Next, the permutation processing unit (2411) reads each separation matrix W (f) from the final W (f) storage area (2514), and outputs the i-th output Y i (f, m) [in the frequency domain. A par that rearranges the rows of each separation matrix W (f) so that the element of the i-th row of the separation signal Y (f, m) corresponds to the estimation of a certain k-th original signal at all frequencies. Mutation processing is performed (S314a). This permutation process may be based on a known processing technique (see Patent Document 2 and Non-Patent Document 4). Each separation matrix W (f) subjected to permutation processing is overwritten and stored in the final W (f) storage area (2514).

次に、スケーリング処理部(2412)は、最終W(f)格納領域(2514)から各分離行列W(f)を読みこみ、i番目の出力Y(f,m)が、全ての周波数においてあるk番目の原信号の推定のものとしておよそ同じ振幅を持つように各分離行列W(f)を調整するスケーリング処理を行う(S314b)。このスケーリング処理は公知の処理技術に拠ればよい(上記非特許文献5参照)。スケーリング処理された各分離行列W(f)は、最終W(f)格納領域(2514)に上書き格納される。 Next, the scaling processing unit (2412) reads each separation matrix W (f) from the final W (f) storage area (2514), and the i-th output Y i (f, m) is obtained at all frequencies. A scaling process for adjusting each separation matrix W (f) so as to have approximately the same amplitude as an estimate of a certain kth original signal is performed (S314b). This scaling process may be based on a known processing technique (see Non-Patent Document 5 above). Each scaled separation matrix W (f) is overwritten and stored in the final W (f) storage area (2514).

次に、変換部(142)は、X(f,m)格納領域(2502)から、X(1,m)、X(2,m)、・・・、X(F,m)〔m=1,2,・・・,N〕を読み込み、最終W(f)格納領域(2514)から、W(1)、W(2)、・・・、W(F)を読み込み、これらの値からY(1,m)=W(1)X(1,m)、Y(2,m)=W(2)X(2,m)、・・・、Y(F,m)=W(F)X(F,m)を演算して、この演算結果をRAM(25)のY(f,m)格納領域(2515)に格納する(S316)。 Next, the conversion unit (142) starts from the X (f, m) storage area (2502), X (1, m), X (2, m), ..., X (F, m) [m = 1, 2,..., N m ], W (1), W (2),..., W (F) are read from the final W (f) storage area (2514), and these values are read. To Y (1, m) = W (1) X (1, m), Y (2, m) = W (2) X (2, m),..., Y (F, m) = W ( F) X (F, m) is calculated, and the calculation result is stored in the Y (f, m) storage area (2515) of the RAM (25) (S316).

次に、復元部(249)は、Y(f,m)格納領域(2515)からY(1,m)、Y(2,m)、・・・、Y(F,m)を読み込んで、これらの値に対して短時間離散逆フーリエ変換を演算して、この演算結果をRAM(25)のy(n)格納領域(2516)に格納する。このy(n)格納領域(2516)に格納されたy(n)=[y(f,m),y(f,m)]が、分離された時系列データとしての分離信号となる。 Next, the restoration unit (249) reads Y (1, m), Y (2, m),..., Y (F, m) from the Y (f, m) storage area (2515), Short-time discrete inverse Fourier transform is calculated for these values, and the calculation result is stored in the y (n) storage area (2516) of the RAM (25). The y (n) = [y 1 (f, m), y 2 (f, m)] T stored in the y (n) storage area (2516) is a separated signal as separated time-series data and Become.

なお、以上の第2の実施形態では、ピアソン分布型は、I型、IV型、VI型の3種類であるとしたが、勿論、この3種類に型に限定するものでない。原信号の種類などによっては、その他の型(例えば、II型、III型や拡張ピアソン分布)に対応したピアソン分布型パラメータ演算部(そのプログラム)などを設けることで、様々な原信号に対応した、本発明の装置・方法を用いた信号分離が実現できることは言うまでもない。   In the second embodiment described above, there are three types of Pearson distribution types: I type, IV type, and VI type. Of course, the Pearson distribution type is not limited to these three types. Depending on the type of the original signal, etc., by providing a Pearson distribution type parameter calculation unit (its program) corresponding to other types (for example, type II, type III and extended Pearson distribution) Needless to say, signal separation using the apparatus and method of the present invention can be realized.

<第2.1の実施形態>
また、第2の実施形態の変形態である第2.1の実施形態を説明する(図14、15参照)。この第2.1の実施形態は、原信号として想定される時系列データとしての信号の集合を教師信号d(n)とし、この教師信号d(n)に対して各周波数でのサンプルモーメントを求め、そのサンプルモーメントからκやピアソン分布のパラメータを決め、このパラメータをRAM(25)の所定の格納領域に格納して適宜読み込むようにしたものである。第2.1の実施形態では、第2の実施形態と異なる部分について説明を行うことにする。
<Second Embodiment>
The second embodiment, which is a modification of the second embodiment, will be described (see FIGS. 14 and 15). In the second embodiment, a set of signals as time series data assumed as an original signal is a teacher signal d (n), and the sample moment at each frequency is set to the teacher signal d (n). From this sample moment, parameters of κ and Pearson distribution are determined, and these parameters are stored in a predetermined storage area of the RAM (25) and appropriately read. In the 2.1 embodiment, only the parts different from the 2nd embodiment will be described.

外部記憶装置(27)には、原信号として想定される時系列データとしての信号集合である教師信号d(n)も予め記憶しておく。また、外部記憶装置(27)には、教師信号d(n)に対して、フレーム時刻mごとに短時間離散フーリエ変換を演算して、その演算結果であるD(f,m)を出力するための第2短時間離散フーリエ変換演算プログラムも記憶されている。   In the external storage device (27), a teacher signal d (n) which is a signal set as time series data assumed as an original signal is also stored in advance. The external storage device (27) calculates short-time discrete Fourier transform for the teacher signal d (n) at every frame time m, and outputs the calculation result D (f, m). A second short-time discrete Fourier transform calculation program is also stored.

例えば、ステップS302の処理の後に(但し、後述するステップS305’よりは前に処理される。)、第2短時間離散フーリエ変換演算プログラムがCPU(24)によって解釈実行されて機能する第2短時間離散フーリエ変換演算部が、予め外部記憶装置(27)からRAM(25)の所定の格納領域に格納された教師信号d(n)を、RAM(25)の所定の格納領域から読み込んで、短時間離散フーリエ変換を演算し、その演算結果D(f,m)をRAM(25)の所定の格納領域(以下、D(f,m)格納領域という。)に格納する(S302a)。   For example, after the process of step S302 (however, it is processed before step S305 ′ described later), the second short time discrete Fourier transform operation program is interpreted and executed by the CPU (24) and functions. The time discrete Fourier transform calculation unit reads the teacher signal d (n) stored in the predetermined storage area of the RAM (25) from the external storage device (27) in advance from the predetermined storage area of the RAM (25), The short-time discrete Fourier transform is calculated, and the calculation result D (f, m) is stored in a predetermined storage area of the RAM (25) (hereinafter referred to as D (f, m) storage area) (S302a).

第2.1の実施形態においても、第2の実施形態におけるステップS304〜S313に相当するステップが反復処理されるが、第2の実施形態におけるステップS305の処理については、下記に説明するステップS305’の処理が行われる。   Also in the second embodiment, steps corresponding to steps S304 to S313 in the second embodiment are iteratively processed, but the processing in step S305 in the second embodiment is described below in step S305. Processing of 'is performed.

即ち、第2の実施形態におけるステップS305に相当する第2.1の実施形態におけるステップS305’では、サンプルモーメント演算部(243)が、D(f,m)格納領域から、D(f,m)を読み込んで、このサンプルモーメント(平均、分散、歪度、尖度)を演算して、この結果をRAM(25)の所定の格納領域、即ち、第2の実施形態におけるサンプルモーメント格納領域に格納する。   That is, in step S305 ′ in the second embodiment corresponding to step S305 in the second embodiment, the sample moment calculation unit (243) moves from the D (f, m) storage area to D (f, m ) To calculate the sample moment (average, variance, skewness, kurtosis), and the result is stored in a predetermined storage area of the RAM (25), that is, the sample moment storage area in the second embodiment. Store.

なお、第2の実施形態のステップS305では、ステップS304で出力されたY(f,m)に基づいて改めてサンプルモーメントを求めていたが、第2.1の実施形態では、ひとたびステップS305’で教師信号d(n)の短時間離散フーリエ変換演算結果D(f,m)が求められれば、反復処理のたびにD(f,m)を求める必要は無く、ステップS305’、S306、S307、S308を略して反復処理を行うようにしてよい。   In step S305 of the second embodiment, the sample moment is obtained again based on Y (f, m) output in step S304. In the second embodiment, once in step S305 ′. If the short-time discrete Fourier transform operation result D (f, m) of the teacher signal d (n) is obtained, it is not necessary to obtain D (f, m) every time iterative processing is performed, and steps S305 ′, S306, S307, S308 may be omitted and iterative processing may be performed.

<第3の実施形態>
次に、本発明の信号分離装置・方法の第3の実施形態を説明する。
第3の実施形態は、上記第1の実施形態および上記第2の実施形態との組み合わせに相当する。具体的には、基準周波数f以下の周波数領域では第2の実施形態によって信号分離を行ない、基準周波数fよりも大きい周波数領域では第1の実施形態と同様にして信号分離を行う。ここで用いた「同様」の文言の意味は後述する。
基準周波数fは信号分離対象となる観測信号の種類・性質などによって適宜に定めればよい。
<Third Embodiment>
Next, a third embodiment of the signal separation device / method of the present invention will be described.
The third embodiment corresponds to a combination with the first embodiment and the second embodiment. Specifically, signal separation is performed in the frequency region below the reference frequency f 0 according to the second embodiment, and signal separation is performed in the frequency region higher than the reference frequency f 0 in the same manner as in the first embodiment. The meaning of the word “similar” used here will be described later.
The reference frequency f 0 may be determined as appropriate depending on the type and nature of the observation signal that is the signal separation target.

既に説明したが、予め与えられた観測信号に対してグリッドサーチの手法(第1の実施形態、第1.1の実施形態、第1.2の実施形態)を適用し、周波数ごとに定まるパラメータ{b、b、c、c、c}〔あるいはパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}である。〕を求めておく。具体的には、例えば第1の実施形態(あるいは第1.1の実施形態、第1.2の実施形態)のステップS113の処理が終了した段階で或る周波数において最適化された分離行列Wが得られていることになるから、それぞれの周波数ごとに、この最適化された分離行列Wを与えたときのグリッドBを記憶手段に適宜に保存記憶しておけばよい。 As described above, the grid search technique (first embodiment, 1.1 embodiment, 1.2 embodiment) is applied to an observation signal given in advance, and the parameters are determined for each frequency. {B 0 , b 1 , c 0 , c 1 , c 2 } [or parameter average {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 (avg) }. ]. Specifically, for example, the separation matrix W optimized at a certain frequency at the stage where the process of step S113 of the first embodiment (or the first embodiment or the first embodiment) is completed. because so that is obtained, for each frequency, suitably it is sufficient to save stored in the storage means grid B R when given this optimized separating matrix W.

第3の実施形態では、ある(1種類の)観測信号に予め第1の実施形態を適用しており、周波数f(f=1,・・・,F)ごとに定まるパラメータ{b、b、c、c、c}が既に求められているとする。つまり、既に求められた周波数fごとのパラメータは、{b(f),b(f),c(f),c(f),c(f)}と一意に表すことができる。
そして、基準周波数fよりも大きい周波数領域では、周波数fごとに、パラメータ{b(f),b(f),c(f),c(f),c(f)}で定まるスコア関数を用いる。
In the third embodiment, the first embodiment is applied in advance to a certain (one type) of observation signals, and parameters {b 0 , b determined for each frequency f (f = 1,..., F). 1 , c 0 , c 1 , c 2 } are already determined. That is, the already determined parameters for each frequency f can be uniquely expressed as {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)}. it can.
In the frequency region larger than the reference frequency f 0 , the parameters {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)} are set for each frequency f. The score function determined by is used.

つまり、予めパラメータ{b(f),b(f),c(f),c(f),c(f)}を求めておくことで、第3の実施形態における第1の実施形態の適用部分(基準周波数fよりも大きい周波数領域)では、第1の実施形態で説明したステップS110p、S110の各処理およびステップS111、S113に係わる反復処理を省略するのであり、この意味で第1の実施形態と「同様」の処理を実行することになる。 That is, by obtaining the parameters {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)} in advance, the first in the third embodiment. in applying portion of embodiments (larger frequency range than the reference frequency f 0), and than to omit the processes and iterative process relating to step S 111, S113 step S110p, S110 described in the first embodiment, the In a sense, the same processing as in the first embodiment is executed.

換言すれば、第1の実施形態では、それぞれの周波数ごとにグリッドBはB〜BRmaxのRmax個を取りえたが、第3の実施形態における第1の実施形態の適用部分は、周波数fごとにグリッドBは予め求められた、即ち一意に固定された{b(f),b(f),c(f),c(f),c(f)}の1個しかとることができないので、第1の実施形態を簡略化して適用するものとも云える。 In other words, in the first embodiment, the grid B R is E takes Rmax pieces of B 1 .about.B Rmax for each frequency, applying part of the first embodiment in the third embodiment, the frequency For each f, the grid BR is obtained in advance, that is, uniquely fixed {b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f)} Since only one can be taken, it can be said that the first embodiment is applied in a simplified manner.

そこで、第3の実施形態における第1の実施形態の適用部分について、グリッドBが周波数f依存であり1個しかとらないことを明示するため、グリッドBをグリッドBと表すことにする。つまりグリッドBは、B={b(1),b(1),c(1),c(1),c(1)}、B={b(2),b(2),c(2),c(2),c(2)}、・・・、B={b(F),b(F),c(F),c(F),c(F)}である。
なお、第3の実施形態において実際に用いるグリッドBは、f>fに対するものであることに留意しなければならない。
Therefore, the application portion of the first embodiment in the third embodiment, in order to demonstrate that the grid B R does not take only one located at the frequency f depends, to represent the grid B R grid B f . That is, the grid B f has B 1 = {b 0 (1), b 1 (1), c 0 (1), c 1 (1), c 2 (1)}, B 2 = {b 0 (2) , B 1 (2), c 0 (2), c 1 (2), c 2 (2)},..., B F = {b 0 (F), b 1 (F), c 0 (F ), C 1 (F), c 2 (F)}.
It should be noted that the grid B f actually used in the third embodiment is for f> f 0 .

第3の実施形態は、基準周波数f以下の周波数領域では第2の実施形態によって信号分離を行ない、基準周波数fよりも大きい周波数領域では第1の実施形態を簡略化して信号分離を行う実施形態であるから、図21〜図23を参照して第3の実施形態の処理全体について概説する。なお、第3の実施形態における各処理や各処理を担当する機能の詳細は、上記の第1の実施形態および第2の実施形態の説明を参照のこと。
図21〜図23は、第3の実施形態において観測信号から分離信号を得る処理を例示するフローチャートである。
In the third embodiment, signal separation is performed according to the second embodiment in a frequency region below the reference frequency f 0 , and signal separation is performed by simplifying the first embodiment in a frequency region higher than the reference frequency f 0. Since this is an embodiment, the overall processing of the third embodiment will be outlined with reference to FIGS. For details of each process and functions in charge of each process in the third embodiment, refer to the description of the first embodiment and the second embodiment.
FIGS. 21 to 23 are flowcharts illustrating processing for obtaining a separation signal from an observation signal in the third embodiment.

まず、ステップS300〜S313の各処理は、第2の実施形態と同じである。
ステップS312の処理において、識別子gがgmaxと等しいと判定されれば、ステップS314dの処理へと進む。
First, each process of steps S300 to S313 is the same as that of the second embodiment.
If it is determined in step S312 that the identifier g is equal to gmax, the process proceeds to step S314d.

反復実行を制御するための周波数fが基準周波数fと等しいか否かを判定する(S314d)。この結果、周波数fが基準周波数fと等しいと判定されれば、ステップS315dの処理へと進む。また、周波数fが基準周波数fと等しいと判定されなければ、周波数fに1を加えたものを周波数fの新たな値として(S315)、ステップS303以降の処理を行う。 It determines whether the frequency f for controlling the repetitive execution is equal to the reference frequency f 0 (S314d). As a result, if it is determined that the frequency f is equal to the reference frequency f 0 , the process proceeds to step S315d. On the other hand, if it is not determined that the frequency f is equal to the reference frequency f 0 , a value obtained by adding 1 to the frequency f is set as a new value of the frequency f (S 315), and the processes after step S 303 are performed.

ステップS314dの処理において、周波数fが基準周波数fと等しいと判定されると、周波数fに1を加えたものを周波数fの新たな値として設定する(S315d)。次いで、第1の実施形態で説明したステップS103以降の処理を行う。 In the processing of step S314d, the frequency f is determined to be equal to the reference frequency f 0, sets a one plus the frequency f as the new value of the frequency f (S315d). Next, the processing after step S103 described in the first embodiment is performed.

ステップS103以降の処理で第1の実施形態と異なる部分について説明を加える。
まず、第1の実施形態のステップS105の処理では、識別子Rで定まるグリッドBを用いてスコア関数Φ(Y(f,m))を求めたが、第3の実施形態では、周波数fで特定されるグリッドBを用いてスコア関数Φ(Y(f,m))を求める(S105d)。
A description will be given of parts different from those of the first embodiment in the processing after step S103.
First, in the process of step S105 in the first embodiment, the identifier score function using the determined grid B R with R Φ (Y (f, m )) to have been determined, in the third embodiment, the frequency f A score function Φ (Y (f, m)) is obtained using the identified grid B f (S105d).

次に、第1の実施形態では、ステップS108の処理でg=gmaxが成立するとステップS110p、S110の各処理を実行したが、第3の実施形態では、両処理を実行せず、第1の実施形態におけるステップS112の処理に相当するステップS112dの処理を行う。即ち、ステップS108の判定処理が成立したときのステップS107で得られた分離行列W(f)を、周波数fにおいて最適化された分離行列W(f)とする(S112d)。   Next, in the first embodiment, when g = gmax is established in the process of step S108, the processes of steps S110p and S110 are executed. However, in the third embodiment, both processes are not executed, and the first process is executed. The process of step S112d corresponding to the process of step S112 in the embodiment is performed. That is, the separation matrix W (f) obtained in step S107 when the determination process in step S108 is established is set as the separation matrix W (f) optimized at the frequency f (S112d).

次に、第1の実施形態では、ステップS112の処理の後、ステップS113の処理を実行したが、第3の実施形態では、ステップS112dの処理の後、第1の実施形態で説明したステップS114以降の処理を実行する。   Next, in the first embodiment, the process of step S113 is executed after the process of step S112. In the third embodiment, after the process of step S112d, step S114 described in the first embodiment is performed. The subsequent processing is executed.

第3の実施形態は、第1の実施形態および第2の実施形態との組み合わせとしたが、第1の実施形態〜第1.2の実施形態と第2の実施形態〜第2.1の実施形態とのいずれの組み合わせとすることもできる。   The third embodiment is a combination of the first embodiment and the second embodiment, but the first embodiment to the first embodiment to the second embodiment and the second embodiment to the second embodiment. Any combination with the embodiment is possible.

また、第3の実施形態は、基準周波数f以下の周波数領域では第2の実施形態によって信号分離を行ない、基準周波数fよりも大きい周波数領域では第1の実施形態と同様にして信号分離を行うとしたが、観測信号の種類・性質などによっては、基準周波数f以下の周波数領域では第1の実施形態(あるいは、第1.1の実施形態、第1.2の実施形態)と同様にして信号分離を行ない、基準周波数fよりも大きい周波数領域では第2の実施形態(あるいは第2.1の実施形態)によって信号分離を行うことでもよい。 In the third embodiment, signal separation is performed according to the second embodiment in the frequency region below the reference frequency f 0 , and signal separation is performed in the frequency region higher than the reference frequency f 0 in the same manner as in the first embodiment. However, depending on the type and nature of the observation signal, in the frequency region below the reference frequency f 0 , the first embodiment (or 1.1 embodiment, 1.2 embodiment) and performs signal separation in the same manner, a large frequency range than the reference frequency f 0 may by performing signal separation by the second embodiment (or 2.1 embodiment).

さらに、周波数領域を基準周波数fによって、「基準周波数f以下の周波数領域」と「基準周波数fよりも大きい周波数領域」とに分割するのではなく、「基準周波数fよりも小さい周波数領域」と「基準周波数f以上の周波数領域」とに分割してもよい。 Furthermore, the reference frequency f 0 to the frequency domain, rather than splitting into "large frequency range than the reference frequency f 0," "reference frequency f 0 following the frequency domain" and a frequency smaller than the "reference frequency f 0 It may be divided into “region” and “frequency region above the reference frequency f 0 ”.

さらに、このような周波数領域の2分割ではなく、基準周波数を複数設定することで周波数領域を3つ以上に分割することでもよく、分割された周波数領域ごとに、適宜に決めた第1、第1.1、第1.2、第2、第2.1の各実施形態のいずれかの手法を適用するとしてもよい。   Further, the frequency domain may be divided into three or more by setting a plurality of reference frequencies instead of dividing the frequency domain into two, and the first and second frequencies appropriately determined for each divided frequency domain. Any of the methods according to the 1.1, 1.2, second, and 2.1 embodiments may be applied.

以上に説明した各実施形態では、信号源の数および観測装置の数を共に2つとしたが、この実施形態に限定されることはなく、信号源の数および観測装置の数は、一般に複数とすることができる。なお、観測装置の数は、信号源の数と同じかそれ以上であることが好ましい。   In each embodiment described above, the number of signal sources and the number of observation devices are both two. However, the present invention is not limited to this embodiment, and the number of signal sources and the number of observation devices are generally plural. can do. Note that the number of observation devices is preferably equal to or greater than the number of signal sources.

また、上記の各実施形態では、ステップS108およびS312の判定は、g=gmaxが成立するか否かを判定することとした。しかし、この判定に限定されることはなく、例えば、各実施形態の更新部で得られた新たな分離行列W(f)のノルムが所定の閾値以下(あるいは、閾値よりも小さい)か否かを判定するようにしてもよい。   In each of the above embodiments, the determinations in steps S108 and S312 determine whether g = gmax is satisfied. However, the determination is not limited to this. For example, whether the norm of the new separation matrix W (f) obtained by the updating unit of each embodiment is equal to or less than a predetermined threshold (or smaller than the threshold). May be determined.

さらに、上記の各実施形態では、ステップS107およびS311における更新部による分離行列W(f)の更新は式(31)に従うものとしたが、例えば、式(28)や式(30)に従うものに変更することも可能である。   Further, in each of the above embodiments, the update of the separation matrix W (f) by the updating unit in steps S107 and S311 is performed according to the equation (31), but for example, according to the equation (28) or the equation (30). It is also possible to change.

また、本発明の装置・方法による観測信号の分離を実行する前に、その前処理として、周波数領域における従来方法(スコア関数にtanh関数などを用いる。)のICAに基づく信号分離を行い、その結果得られた分離信号を、本発明の装置・方法による信号分離の対象としてもよい。また、教師信号を用いて適当な固定パラメータを前もって決めた場合の本発明における信号分離方法を前処理(初期値設定も含む。)として適用することも可能である。これによって、さらに精度の良い信号分離が実現される。   In addition, before performing observation signal separation by the apparatus / method of the present invention, as preprocessing, signal separation based on ICA of a conventional method in the frequency domain (a tanh function or the like is used as a score function) is performed. The separated signal obtained as a result may be an object of signal separation by the apparatus / method of the present invention. Further, the signal separation method according to the present invention in the case where an appropriate fixed parameter is determined in advance using a teacher signal can be applied as preprocessing (including initial value setting). Thereby, more accurate signal separation is realized.

その他、本発明である信号分離装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記信号分離装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。   In addition, the signal separation device / method according to the present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the gist of the present invention. In addition, the processing described in the signal separation device / method is not only executed in time series in the order described, but also executed in parallel or individually as required by the processing capability of the device that executes the processing. It is good.

また、上記信号分離装置における処理機能をコンピュータによって実現する場合、信号分離装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記信号分離装置における処理機能がコンピュータ上で実現される。   When the processing functions in the signal separation device are realized by a computer, the processing contents of the functions that the signal separation device should have are described by a program. Then, by executing this program on a computer, the processing functions of the signal separation device are realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、信号分離装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the signal separation device is configured by executing a predetermined program on the computer. However, at least a part of these processing contents may be realized by hardware.

本発明者らは、音源数を2つとし、2個のマイクロホンを用いた場合について実験を行った。音源からの音声として、上記女性2名の音声(原信号s(n)、s(n))を用い、2個のマイクロホンアレイに対する話者の位置は、右を0度、正面を90度にしたときに、それぞれ30度と150度とした(図19参照)。残響時間130msの部屋で実測したインパルス応答hji(p)を用いて、式(24)に従って畳み込み及び加算を行ってマイクの観測信号を模擬した。サンプリング周波数は8kHz、短時間離散フーリエ変換のフレームサイズは512とした。 The present inventors conducted an experiment in the case where the number of sound sources was two and two microphones were used. The two female voices (original signals s 1 (n) and s 2 (n)) are used as voices from the sound source, and the positions of the speakers relative to the two microphone arrays are 0 degrees on the right and 90 on the front. When it was set to 30 degrees, it was set to 30 degrees and 150 degrees, respectively (see FIG. 19). Using the impulse response h ji (p) measured in a room with a reverberation time of 130 ms, convolution and addition were performed according to Equation (24) to simulate the observed signal of the microphone. The sampling frequency was 8 kHz, and the short discrete Fourier transform frame size was 512.

この実験結果を図20に示す。図20は、2名の女声の混合音声における第1の実施形態および第2の実施形態で説明した装置・方法を用いた場合の実験結果と、従来法(スコア関数Φ=tanhを全ての周波数で適用した場合である。)を用いた場合の実験結果を示したものである。縦軸はSIR値である。yki(n)は、出力端kにおける各原信号s(n)由来の成分である。第1の実施形態および第2の実施形態のSIR値は、それぞれ19.68dB、19.13dBであった。一方、従来方法に拠った場合のSIR値は、17.27dBであった。

Figure 0004653674
The experimental results are shown in FIG. FIG. 20 shows experimental results when using the apparatus and method described in the first embodiment and the second embodiment for mixed speech of two female voices, and the conventional method (score function Φ = tanh is applied to all frequencies). It is a case where it is applied by.) The experimental result at the time of using is shown. The vertical axis is the SIR value. y ki (n) is a component derived from each original signal s i (n) at the output terminal k. The SIR values of the first embodiment and the second embodiment were 19.68 dB and 19.13 dB, respectively. On the other hand, the SIR value based on the conventional method was 17.27 dB.
Figure 0004653674

この実施結果により、従来法と比較して、本発明の装置・方法を用いた音源分離の方が、SIR値が1.8dBから2.4dB向上することが認められた。つまり、従来法と比較して観測信号の分離精度の向上が確認された。   From this implementation result, it was confirmed that the SIR value was improved from 1.8 dB to 2.4 dB in the sound source separation using the apparatus and method of the present invention as compared with the conventional method. In other words, it was confirmed that the separation accuracy of the observation signal was improved as compared with the conventional method.

なお、予め分かっている原信号と室内インパルス特性を用いた評価では、分離精度のSIR上限値としては、20.98dBを得た。   In the evaluation using the known original signal and the indoor impulse characteristic, 20.98 dB was obtained as the SIR upper limit value of the separation accuracy.

式(44)のパラメータ{b、b、c、c、c}として、ピアソン分布系で制約されるパラメータ範囲に入らない値をとった場合でも、分離精度が優れる場合があることを示す。 Even when the parameter {b 0 , b 1 , c 0 , c 1 , c 2 } in Expression (44) is a value that does not fall within the parameter range restricted by the Pearson distribution system, the separation accuracy may be excellent. It shows that.

式(44)がピアソン分布IV型に拠るものとすれば、パラメータbのグリッドサーチの範囲は、b>0.5でなければならない。そこで、ピアソン分布IV型で制約されるパラメータ範囲に入らない値をとった場合と比較するため、グリッドサーチにおけるパラメータbの制約条件を、
条件1:b>0.5
条件2:b≧0.4
条件3:b≧0.1
とした。そして、上記第1.1の実施形態によって分離精度を表すSIR値の上限値を求めた。上記実施例1で説明したのと同じ実験環境で実験を行った。信号分離対象となる混合音声は、女声1・女声2混合、女声1・男声2混合、男声1・女声1混合、男声1・男声2混合の4種類とした。
If equation (44) is based on Pearson distribution type IV, the range of the grid search for parameter b 0 must be b 0 > 0.5. Therefore, in order to compare with the case of taking a value that does not fall within the parameter range restricted by the Pearson distribution type IV, the constraint condition of the parameter b 0 in the grid search is
Condition 1: b 0 > 0.5
Condition 2: b 0 ≧ 0.4
Condition 3: b 0 ≧ 0.1
It was. Then, the upper limit value of the SIR value representing the separation accuracy was obtained according to the first embodiment. The experiment was performed in the same experimental environment as described in Example 1 above. There are four types of mixed voices to be signal-separated: female voice 1 and female voice 2 mixed, female voice 1 and male voice 2 mixed, male voice 1 and female voice 1 mixed, male voice 1 and male voice 2 mixed.

実験結果を表2に示す。表2は、各条件1〜3と4種類の混合音声との間におけるSIR値(単位:dB)の上限値を示している。このSIR値が高い方がよりよい分離精度を示す。殆どの話者の組み合わせに対しても、条件2および条件3が高いSIR値を示している。条件3のようにパラメータ範囲をできるだけ広げることで、分離精度がさらに上がる組み合わせもあった。この実験結果から、グリッドサーチにおいて、式(44)のパラメータ範囲をピアソン分布の型に固有のパラメータ範囲に限定する必要がないことが確認できた。

Figure 0004653674
The experimental results are shown in Table 2. Table 2 shows the upper limit value of the SIR value (unit: dB) between the conditions 1 to 3 and the four types of mixed speech. A higher SIR value indicates better separation accuracy. Conditions 2 and 3 show high SIR values for most speaker combinations. There was also a combination in which the separation accuracy was further increased by expanding the parameter range as much as possible as in Condition 3. From this experimental result, it was confirmed that it is not necessary to limit the parameter range of the formula (44) to the parameter range specific to the type of Pearson distribution in the grid search.
Figure 0004653674

上記第3の実施形態を具体的に適用した2つの実験例を示す。
ここでは、信号分離対象となる混合音声を、[1]男声1・男声2混合、[2]男声1・女声1混合、[3]女声1・男声2混合、[4]女声1・女声2混合の4種類とした。
Two experimental examples to which the third embodiment is specifically applied are shown.
Here, the mixed speech to be signal-separated is [1] male voice 1 / male voice 2 mixed, [2] male voice 1 / female voice 1 mixed, [3] female voice 1 / male voice 2 mixed, [4] female voice 1 / woman voice 2 Four types of mixing were used.

((実験例1))
まず、上記第1の実施形態によって[3]および[4]の混合音声に対するパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}を求めた。
次に、[1]〜[4]の各混合音声に対して、ある周波数ビンfよりも小さい周波数ビン(前半領域)には上記第2の実施形態を適用し、周波数ビンfよりも大きい周波数ビン(後半領域)には上記パラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}を式(44)のパラメータに代入したスコア関数を用いて信号分離を実行した。周波数fビンは凡そ50〜60程度とした。
((Experiment 1))
First, the parameter average {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 ( for the mixed speech of [3] and [4] according to the first embodiment. avg) }.
Then, [1] for each mixed sound to [4], and applying the second embodiment to the smaller frequency bins (the first half region) than a certain frequency bin f b, than the frequency bin f b For the large frequency bin (second half region), the parameter average {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 (avg) } is changed to the parameter of the equation (44). Signal separation was performed using the score function assigned to. Frequency f b bottle was about 50 to 60 about.

このように周波数領域を2分割し、前半領域には第2の実施形態を適用し後半領域には第1の実施形態を簡略化して適用した理由は、周波数領域の音声混合信号が、周波数ビンfが凡そ50〜60以降ではピアソンI型のJ-Shape型になることに着目したからである。 In this way, the frequency domain is divided into two, the second embodiment is applied to the first half area, and the first embodiment is applied to the second half area in a simplified manner. This is because it has been noted that when f b is about 50 to 60 or more, it becomes a Pearson I type J-Shape type.

((実験例2))
[3]および[4]の混合音声に対するパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}を、第1.1の実施形態によって求めたこと以外は、実験例1と同じである。なお、第1.1の実施形態を適用するにあたり、既知の原信号(女声1、女声2、男声2)とインパルス応答(実験室環境のインパルス応答関数)を用いた。
なお、実験例2は、既知の情報で学習したパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}を、他の混合音声(ここでは[1]、[2]の各混合音声)にも適用するものであり、いわばsupervised-methodである第1.1の実施形態の有用性を検証することができる。
((Experiment 2))
The parameter average {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 (avg) } for the mixed speech of [3] and [4] is calculated as 1.1. This example is the same as Example 1 except that it is obtained according to the embodiment. In applying the first embodiment, the known original signal (female voice 1, female voice 2, male voice 2) and impulse response (impulse response function in the laboratory environment) were used.
In Experimental Example 2, the parameter averages {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 (avg) } learned with known information are set to other values . The present invention is also applied to mixed speech (here, [1] and [2] mixed speech), and the usefulness of the 1.1st embodiment, which is a supervised-method, can be verified.

実験例1および実験例2の実験結果を表3に示す。表3では、比較検討のため、従来法(スコア関数Φ=tanh〔非線形関数〕を全周波数領域で適用した場合である。)および第2の実施形態を全周波数領域に適用した場合の実験結果も示している。表3は、各混合音声[1]〜[4]と従来法、第2の実施形態、実験例1、実験例2との間におけるSIR値(単位:dB)の上限値を示している。このSIR値が高い方がよりよい分離精度を示す。   The experimental results of Experimental Example 1 and Experimental Example 2 are shown in Table 3. In Table 3, for comparison, experimental results when the conventional method (score function Φ = tanh [nonlinear function] is applied in the entire frequency range) and the second embodiment are applied in the entire frequency range are shown. It also shows. Table 3 shows the upper limit value of the SIR value (unit: dB) between each of the mixed sounds [1] to [4] and the conventional method, the second embodiment, Experimental Example 1, and Experimental Example 2. A higher SIR value indicates better separation accuracy.

表3に示すように、第2の実施形態を全周波数領域に適用した場合よりも、実験例1および実験例2の方が、SIR値が0.2〜4.4dB程度向上することが確認された。また、従来の非線形関数を全周波数領域に一律適用した場合と実験例1および実験例2とを比較しても、実験例1および実験例2の方が、SIR値が0.1〜3.6dB程度向上することが確認された。さらに、このように実験例2においてもSIR値が向上していることから、いわばsupervised-methodである第1.1の実施形態の有用性が確認された。つまり、予め何例かの女声男声混合音声によって得られたパラメータ平均{b0(avg)、b1(avg)、c0(avg)、c1(avg)、c2(avg)}を代表パラメータとして決めても、他の混合音声に適用できることが示された。

Figure 0004653674
As shown in Table 3, it is confirmed that the SIR value is improved by about 0.2 to 4.4 dB in Experimental Example 1 and Experimental Example 2 than in the case where the second embodiment is applied to the entire frequency region. It was done. Even when the conventional nonlinear function is uniformly applied to the entire frequency range and the experimental example 1 and the experimental example 2 are compared, the experimental example 1 and the experimental example 2 have SIR values of 0.1 to 3. It was confirmed that the improvement was about 6 dB. Furthermore, since the SIR value is also improved in Experimental Example 2 as described above, the usefulness of the first embodiment, which is a supervised-method, was confirmed. That is, representative of parameter averages {b 0 (avg) , b 1 (avg) , c 0 (avg) , c 1 (avg) , c 2 (avg) } obtained in advance by some female / male mixed voices. It was shown that even if determined as a parameter, it can be applied to other mixed speech.
Figure 0004653674

また、各混合音声[1]〜[4]に対する従来法、第1の実施形態を全周波数領域に適用した場合、実験例1、実験例2の各手法による信号分離に要した計算時間を表4に示す。計算時間は、信号分離処理に用いた計算ソフトのコマンドでプログラム実行時間を出力させたものである。   Further, when the conventional method for the mixed speech [1] to [4] and the first embodiment are applied to the entire frequency region, the calculation time required for the signal separation by each method of Experimental Example 1 and Experimental Example 2 is shown. 4 shows. The calculation time is obtained by outputting the program execution time by a command of calculation software used for the signal separation processing.

表4によれば、非線形関数を用いる従来法が最も計算時間が短く、第1の実施形態の場合はグリッドサーチするため最も計算時間がかかることがわかる。しかし、実験例1および実験例2(つまり第3の実施形態に相当する。)に拠れば、計算時間が大幅に改善されることが示された。表3と併せてみれば、第3の実施形態に拠れば、実用的な計算時間でより高い分離精度を得ることが示された。

Figure 0004653674
According to Table 4, it can be seen that the conventional method using a nonlinear function has the shortest calculation time, and in the case of the first embodiment, the calculation time is the longest because of the grid search. However, according to Experimental Example 1 and Experimental Example 2 (that is, corresponding to the third embodiment), it has been shown that the calculation time is greatly improved. In combination with Table 3, it was shown that, according to the third embodiment, higher separation accuracy can be obtained in practical calculation time.
Figure 0004653674

本発明の信号分離装置および方法によれば、例えば、様々なノイズ・妨害信号・干渉音が存在しうる環境下においても、目的信号を制度良く分離抽出することができるので、音声認識、残響除去、雑音信号抑圧などの音響信号分析に有用である。   According to the signal separation apparatus and method of the present invention, for example, the target signal can be systematically separated and extracted even in an environment where various noises, interference signals, and interference sounds may exist. It is useful for acoustic signal analysis such as noise signal suppression.

例えば、音声認識機のマイクロホンと話者が離れた位置にあるため、マイクロホンが目的話者音声以外の音まで収音してしまうような状況でも、本発明による目的音声の分離抽出で、認識率の高い音声認識システムを構築することができる。   For example, since the microphone of the voice recognizer and the speaker are separated from each other, even in a situation where the microphone picks up sound other than the target speaker voice, the target speech separation and extraction according to the present invention enables the recognition rate. High voice recognition system can be constructed.

第1の実施形態に係わる信号分離装置(1)のハードウェア構成を例示した構成ブロック図。The block diagram which illustrated the hardware constitutions of the signal separation apparatus (1) concerning 1st Embodiment. 第1の実施形態に係わる信号分離装置(1)において原信号から分離信号を得るまでのフローを例示する図。The figure which illustrates the flow until a separated signal is obtained from an original signal in the signal separating apparatus (1) according to the first embodiment. 第1の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理を例示するフローチャート(1枚目)。The flowchart (1st sheet | seat) which illustrates the process which acquires a separated signal from an observation signal in the signal separation apparatus (1) concerning 1st Embodiment. 第1の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理を例示するフローチャート(2枚目)。The flowchart (2nd sheet) which illustrates the processing which acquires a separation signal from an observation signal in signal separation device (1) concerning a 1st embodiment. 第1の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理機能を例示する機能ブロック図。The functional block diagram which illustrates the processing function which acquires a separation signal from an observation signal in the signal separation apparatus (1) concerning a 1st embodiment. 第2の実施形態に係わる信号分離装置(2)のハードウェア構成を例示した構成ブロック図。The block diagram which illustrated the hardware constitutions of the signal separation apparatus (2) concerning 2nd Embodiment. 第2の実施形態に係わる信号分離装置(2)において原信号から分離信号を得るまでのフローを例示する図。The figure which illustrates the flow until it obtains a separation signal from an original signal in the signal separation apparatus (2) concerning 2nd Embodiment. 第2の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理を例示するフローチャート(1枚目)。The flowchart (1st sheet | seat) which illustrates the process which acquires a separation signal from an observation signal in the signal separation apparatus (2) concerning 2nd Embodiment. 第2の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理を例示するフローチャート(2枚目)。The flowchart (2nd sheet | seat) which illustrates the process which acquires a separation signal from an observation signal in the signal separation apparatus (2) concerning 2nd Embodiment. 第2の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理機能を例示する機能ブロック図。The functional block diagram which illustrates the processing function which acquires a separated signal from an observation signal in the signal separation apparatus (2) concerning 2nd Embodiment. 第1.1および第1.2の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理を例示するフローチャート(1枚目)。The flowchart (1st sheet | seat) which illustrates the process which acquires a separation signal from an observation signal in the signal separation apparatus (1) concerning the 1.1 and 1.2 embodiment. 第1.1および第1.2の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理を例示するフローチャート(2枚目)。The flowchart (2nd sheet | seat) which illustrates the process which obtains a separation signal from an observation signal in the signal separation apparatus (1) concerning the 1.1st and 1.2th embodiment. 第1.1および第1.2の実施形態に係わる信号分離装置(1)において観測信号から分離信号を得る処理を略示するブロック図。The block diagram which shows schematically the process which obtains a separation signal from an observation signal in the signal separation apparatus (1) concerning the 1.1 and 1.2 embodiment. 第2.1の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理を例示するフローチャート(1枚目)。The flowchart (1st sheet | seat) which illustrates the process which acquires a separation signal from an observation signal in the signal separation apparatus (2) concerning 2nd Embodiment. 第2.1の実施形態に係わる信号分離装置(2)において観測信号から分離信号を得る処理を例示するフローチャート(2枚目)。The flowchart (2nd sheet | seat) which illustrates the process which acquires a separation signal from an observation signal in the signal separation apparatus (2) concerning 2nd Embodiment. 図16(a)は女声で「自動車や精密機械等で技術系の採用を抑えうる所が目立ち、売り手市場の技術系にも翳りが見え始めた」という文を読み上げた音声時系列であり、図16(b)は女声で「自動車や精密機械等で技術系の採用を抑えうる所が目立ち、売り手市場の技術系にも翳りが見え始めた」という文を読み上げた音声時系列のヒストグラムである。Fig. 16 (a) is a voice time series that reads out the sentence "The place where the adoption of the technology system can be suppressed in automobiles and precision machines, etc. is conspicuous and the technology system in the seller's market has begun to appear" in a female voice, Fig. 16 (b) is a voice time series histogram that reads out a sentence in a woman's voice that reads: "A place where the use of technology can be suppressed in automobiles and precision machinery, etc., and the technology in the seller's market has started to appear." is there. 図17(a)は男声で「新聞、週刊誌雑誌に限らず殆ど全ての取材記者は自分の予定原稿を持ってやってくるのだ」という文を読み上げた音声時系列であり、図17(b)は男声で「新聞、週刊誌雑誌に限らず殆ど全ての取材記者は自分の予定原稿を持ってやってくるのだ」という文を読み上げた音声時系列のヒストグラムである。FIG. 17 (a) is a voice time series that reads out a sentence that reads, “Many reporters, not only newspapers and weekly magazines, bring their scheduled manuscripts,” in a male voice, FIG. 17 (b). Is a histogram of a voice time series that reads out in a male voice the sentence, "Almost all reporters, not just newspapers and weekly magazines, bring their scheduled manuscripts." 図18(a)は、女声1の場合において、周波数帯域に分解された系列のサンプルモーメントから求めたκの値および判定されたピアソン分布である(周波数は1024に分解された片側512うちの最初から100までに関するκの値を示す。)。図18(b)は、男声1の場合において、周波数帯域に分解された系列のサンプルモーメントから求めたκの値および判定されたピアソン分布である(周波数は1024に分解された片側512うちの最初から100までに関するκの値を示す。)。図18(c)は、女声1と男声1の混合音声の場合において、周波数帯域に分解された系列のサンプルモーメントから求めたκの値および判定されたピアソン分布である(周波数は1024に分解された片側512うちの最初から100までに関するκの値を示す。)。FIG. 18A shows the value of κ obtained from the sample moment of the series decomposed into the frequency band and the determined Pearson distribution in the case of female voice 1 (the frequency is the first of the one side 512 decomposed into 1024). Κ values from 1 to 100 are shown.) FIG. 18B shows the value of κ obtained from the sample moment of the sequence decomposed into the frequency band and the determined Pearson distribution in the case of male voice 1 (the frequency is the first of one side 512 decomposed into 1024). Κ values from 1 to 100 are shown.) FIG. 18C shows the value of κ obtained from the sample moment of the series decomposed into the frequency band and the determined Pearson distribution in the case of the mixed voice of female voice 1 and male voice 1 (frequency is decomposed to 1024). Κ values for the first to 100 of the single sides 512 are shown.) 実験に用いたインパルス応答を測定した実験条件。Experimental conditions for measuring the impulse response used in the experiment. 女声1と女声2の混合音に対する分離結果(SIR値の単位はデシベル)。Separation result for mixed voice of female voice 1 and female voice 2 (unit of SIR value is decibel). 第3の実施形態に係わる観測信号から分離信号を得る処理を例示するフローチャート(1枚目)。The flowchart (1st sheet | seat) which illustrates the process which acquires a separation signal from the observation signal concerning 3rd Embodiment. 第3の実施形態に係わる観測信号から分離信号を得る処理を例示するフローチャート(2枚目)。The flowchart which illustrates the process which acquires a separation signal from the observation signal concerning 3rd Embodiment (2nd sheet). 第3の実施形態に係わる観測信号から分離信号を得る処理を例示するフローチャート(3枚目)。The flowchart (3rd sheet) which illustrates the processing which acquires a separation signal from the observation signal concerning a 3rd embodiment.

符号の説明Explanation of symbols

1 信号分離装置
2 信号分離装置
142 短時間離散フーリエ変換部
143 スコア関数演算部
145 更新部
146 非対角成分演算部
147 非対角成分判定部
148 第2更新部
149 復元部
241 短時間離散フーリエ変換部
243 サンプルモーメント演算部
244 κ演算部
245 ピアソン分布型判定部
246a ピアソン分布I型パラメータ演算部
246b ピアソン分布IV型パラメータ演算部
246c ピアソン分布VI型パラメータ演算部
247 スコア関数演算部
249 更新部
2410 復元部
1 Signal Separator 2 Signal Separator 142 Short-Time Discrete Fourier Transform Unit 143 Score Function Calculation Unit 145 Update Unit 146 Off-Diagonal Component Calculation Unit 147 Off-Diagonal Component Determination Unit 148 Second Update Unit 149 Restoration Unit 241 Short-Time Discrete Fourier Conversion unit 243 Sample moment calculation unit 244 κ calculation unit 245 Pearson distribution type determination unit 246a Pearson distribution type I parameter calculation unit 246b Pearson distribution IV type parameter calculation unit 246c Pearson distribution VI type parameter calculation unit 247 Score function calculation unit 249 Update unit 2410 Restoration part

Claims (14)

M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、
M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕を記憶する記憶手段と、
記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、
短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、
変換手段によって出力されたY(f,m)の絶対値|Y(f,m)|のサンプルモーメント(平均e、分散ν、歪度s、尖度k)を演算し、この演算結果を出力するサンプルモーメント演算手段と、
サンプルモーメント演算手段によって出力された歪度sおよび尖度kから、β (β +3) /4(2β −3β −6)(4β −3β )〔但し、β =s 、β =kである。〕を演算して、この演算結果をκとして出力するκ演算手段と、
κ演算手段によって出力されたκの値に基づいてピアソン分布型を判定するピアソン分布型判定手段と、
ピアソン分布型判定手段によって判定されたピアソン分布型の確率密度関数f のパラメータを、サンプルモーメント演算手段によって出力されたサンプルモーメントから演算して、この演算結果を出力するピアソン分布型パラメータ演算手段と、
ピアソン分布型パラメータ演算手段によって出力されたパラメータによって定まる確率密度関数f によって、式(1)
Figure 0004653674
〔jは虚数単位を表す。θ(Y(f,m))は複素平面上におけるY(f,m)の偏角を表す。f ’(|Y(f,m)|)は上記確率密度関数f の|Y(f,m)|による微分を表す。〕で表されるスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、
スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、
単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、
1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、
第1反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を、各周波数に対して反復実行させる第2反復制御手段と、
更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、
全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、
変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段と
を備える信号分離装置。
A signal separation device for separating original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
M time-series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T [x i of observation signals observed by M observation devices (N) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. Storage means for storing
Against time-series data x stored in the storage unit (n), frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. Short-time discrete Fourier transform calculation means for outputting as
A product W (f) X (f, m) of X (f, m) output by the short-time discrete Fourier transform operation means and a separation matrix W (f) of N rows and M columns is calculated. Conversion means for outputting the operation result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T ;
The sample moment (average e, variance ν, skewness s, kurtosis k) of the absolute value | Y (f, m) | of Y (f, m) output by the conversion means is calculated, and the calculation result is output. Sample moment calculating means for
From skewness s and kurtosis k output by the sample moment calculating means, β 1 (β 2 +3) 2/4 (2β 2 -3β 1 -6) (4β 2 -3β 1) [where, beta 1 = s 2 and β 2 = k. Κ calculating means for outputting the calculation result as κ,
Pearson distribution type determination means for determining the Pearson distribution type based on the value of κ output by the κ calculation means;
The parameters of the probability density function f p Pearson distribution type is determined by the Pearson distributed determining means calculates the output samples moment by the sample moment calculation means, a Pearson distribution type parameter calculation means for outputting the operation result ,
The probability density function f p determined by the output parameters by Pearson distributed parameter calculating means, the equation (1)
Figure 0004653674
[J represents an imaginary unit. θ (Y (f, m)) represents the deflection angle of Y (f, m) on the complex plane. f p ′ (| Y (f, m) |) represents the differentiation of the probability density function f p by | Y (f, m) |. And a score function calculating means for calculating a score function Φ (Y (f, m)) represented by
Relating to the frame time of the product of Φ (Y (f, m)) output by the score function calculating means and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the converting means The average of the sum is calculated, and this calculation result is expressed as <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time averaging means for outputting as
The difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means is multiplied by the separation matrix W (f) and the learning size η, and further separated. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) for adding the matrix W (f) is performed, and this operation result is newly separated. Updating means for outputting as a matrix W (f);
A first iterative control means for repeatedly executing a conversion means, a score function computing means, a frame time averaging means, and an updating means for one frequency until a predetermined iteration condition is satisfied;
A second iterative control means for controlling the first iterative control means so that the conversion means, the score function calculating means, the frame time averaging means, and the updating means are repeatedly executed for each frequency;
For each separation matrix W (f) for each frequency output by the updating means, each component of Y (f, m) output by the converting means corresponds to the estimation of the same original signal at all frequencies. Permutation processing means for rearranging the rows of each separation matrix W (f),
Scaling processing means for adjusting the separation matrix W (f) so that each component of Y (f, m) output by the conversion means has approximately the same amplitude as the estimation of each original signal at all frequencies;
The short-time discrete inverse Fourier transform of Y (f, m) output by the conversion means is calculated, and the calculation result is converted into a separated signal y (n) = [y 1 (n), y 2 (n),. · the signal separation device to obtain Bei and restoring means for outputting the y n (n)] T.
記憶手段には、
原信号として想定される信号の時系列データである教師信号d(n)をも記憶し、
記憶手段に記憶された教師信号d(n)に対して、フレーム時刻mごとに、短時間離散フーリエ変換を演算して、この演算結果をD(f,m)として出力する第2短時間離散フーリエ変換演算手段を備え、
サンプルモーメント演算手段は、
第2短時間離散フーリエ変換演算手段によって出力されたD(f,m)の絶対値|D(f,m)|のサンプルモーメント(平均、分散、歪度、尖度)を演算し、この演算結果を出力するものである
ことを特徴とする請求項に記載の信号分離装置。
In the storage means,
A teacher signal d (n) that is time-series data of a signal assumed as an original signal is also stored,
A second short-time discrete operation is performed on the teacher signal d (n) stored in the storage means, and a short-time discrete Fourier transform is calculated at each frame time m, and the calculation result is output as D (f, m). With Fourier transform operation means,
Sample moment calculation means
The sample moment (average, variance, skewness, kurtosis) of the absolute value | D (f, m) | of D (f, m) output by the second short-time discrete Fourier transform computing means is computed, and this computation is performed. 2. The signal separation device according to claim 1 , wherein the signal separation device outputs a result.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、
M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕および式(2)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕を記憶する記憶手段と、
記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、
短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、
変換手段によって出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、
スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、
単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、
単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差である行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値に基づく指標を演算して、この演算結果を<C>として出力する非対角成分演算手段と、
非対角成分演算手段によって出力された<C>と、閾値Minとの大小を判定し、この判定結果を出力する非対角成分判定手段と、
非対角成分判定手段によって出力された判定結果が、<C>の値が閾値Minの値以下である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Minの値を<C>の値に設定する第2更新手段と、
1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、
各グリッドBに対して、第1反復手段、非対角成分演算手段、非対角成分判定手段、第2更新手段を実行して、分離行列W(f)を得るグリッド反復制御手段と、
第1反復制御手段およびグリッド反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段、非対角成分演算手段、非対角成分判定手段、第2更新手段を、各周波数に対して反復実行させる第2反復制御手段と、
更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、
全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、
変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段と
を備え、
スコア関数Φ(Y(f,m))は、式(2)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕
ことを特徴とする信号分離装置。
A signal separation device for separating original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
M time-series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T [x i of observation signals observed by M observation devices (N) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] And α values {b 01 , b 02 ,..., B } of the parameter b 0 of the score function Φ (Y (f, m)) represented by the equation (2), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. Storage means for storing
Against time-series data x stored in the storage unit (n), frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. Short-time discrete Fourier transform calculation means for outputting as
A product W (f) X (f, m) of X (f, m) output by the short-time discrete Fourier transform operation means and a separation matrix W (f) of N rows and M columns is calculated. Conversion means for outputting the operation result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T ;
A score function calculating means for calculating a score function Φ (Y (f, m)) having Y (f, m) output by the converting means as an input, and outputting the calculation result;
Relating to the frame time of the product of Φ (Y (f, m)) output by the score function calculating means and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the converting means The average of the sum is calculated, and this calculation result is expressed as <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time averaging means for outputting as
The difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means is multiplied by the separation matrix W (f) and the learning size η, and further separated. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) for adding the matrix W (f) is performed, and this operation result is newly separated. Updating means for outputting as a matrix W (f);
Matrix I− <Φ (Y (f, m)) Y, which is the difference between unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means A non-diagonal component calculation means for calculating an index based on the absolute value of the non-diagonal component of H (f, m)> and outputting the calculation result as <C>;
Non-diagonal component determination means for determining the magnitude of <C> output by the non-diagonal component calculation means and the threshold Min and outputting the determination result;
When the determination result output by the non-diagonal component determination unit indicates that the value of <C> is equal to or less than the threshold value Min, the separation matrix W (f) is changed to the separation matrix W (f) output by the update unit. Second updating means for setting and setting the value of the threshold Min to the value of <C>;
A first iterative control means for repeatedly executing a conversion means, a score function computing means, a frame time averaging means, and an updating means for one frequency until a predetermined iteration condition is satisfied;
For each grid B R, first iteration means, the non-diagonal component calculation unit, the off-diagonal component determining means executes a second update means, a grid repeat control means for obtaining a separating matrix W (f),
By controlling the first iteration control means and the grid iteration control means, conversion means, score function computing means, frame time averaging means, updating means, off-diagonal component computing means, off-diagonal component determining means, and second updating means are provided. Second repetitive control means for repeatedly executing each frequency;
For each separation matrix W (f) for each frequency output by the updating means, each component of Y (f, m) output by the converting means corresponds to the estimation of the same original signal at all frequencies. Permutation processing means for rearranging the rows of each separation matrix W (f),
Scaling processing means for adjusting the separation matrix W (f) so that each component of Y (f, m) output by the conversion means has approximately the same amplitude as the estimation of each original signal at all frequencies;
The short-time discrete inverse Fourier transform of Y (f, m) output by the conversion means is calculated, and the calculation result is converted into a separated signal y (n) = [y 1 (n), y 2 (n),. .., Y N (n)] including restoration means for outputting as T ,
The score function Φ (Y (f, m)) is expressed by the equation (2).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. ]
A signal separation device.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、
M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(3)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕、原信号s(n)=[s(n), s(n),・・・,s(n)]、各信号源Jから各観測装置iまでのインパルス応答hiJ(n)および閾値Maxを記憶する記憶手段と、
記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、
短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、
変換手段によって出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、
スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、
単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、
分離行列W(f)に対して、短時間離散逆フーリエ変換を演算して、この演算結果をw(n)として出力する短時間離散逆フーリエ変換演算手段と、
短時間離散逆フーリエ変換演算手段によって出力されたw(n)、記憶手段に記憶された原信号s(n)およびインパルス応答hiJ(n)から、各周波数における分離精度値SIRを演算して出力する分離精度値演算手段と、
分離精度値演算手段によって出力された分離精度値SIRと記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定手段と、
分離精度値判定手段によって出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新手段と、
1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、
各グリッドBに対して、第1反復手段、短時間離散逆フーリエ変換演算手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を実行して、分離行列W(f)を得るグリッド反復制御手段と、
第1反復制御手段およびグリッド反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段、短時間離散逆フーリエ変換演算手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を、各周波数に対して反復実行させる第2反復制御手段と、
更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、
全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、
変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段と
を備え、
スコア関数Φ(Y(f,m))は、式(3)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕
ことを特徴とする信号分離装置。
A signal separation device for separating original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
M time-series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T [x i of observation signals observed by M observation devices (N) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 of the score function Φ (Y (f, m)) represented by the expression (3), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ], Original signal s (n) = [s 1 (n), s 2 (n),..., S N (n)], impulse response h iJ (n from each signal source J to each observation device i ) And threshold value Max,
Against time-series data x stored in the storage unit (n), frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. Short-time discrete Fourier transform calculation means for outputting as
A product W (f) X (f, m) of X (f, m) output by the short-time discrete Fourier transform operation means and a separation matrix W (f) of N rows and M columns is calculated. Conversion means for outputting the operation result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T ;
A score function calculating means for calculating a score function Φ (Y (f, m)) having Y (f, m) output by the converting means as an input, and outputting the calculation result;
Relating to the frame time of the product of Φ (Y (f, m)) output by the score function calculating means and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the converting means The average of the sum is calculated, and this calculation result is expressed as <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time averaging means for outputting as
The difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means is multiplied by the separation matrix W (f) and the learning size η, and further separated. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) for adding the matrix W (f) is performed, and this operation result is newly separated. Updating means for outputting as a matrix W (f);
A short-time discrete inverse Fourier transform calculation means for calculating a short-time discrete inverse Fourier transform on the separation matrix W (f) and outputting the calculation result as w (n);
A separation accuracy value SIR at each frequency is calculated from w (n) output by the short-time discrete inverse Fourier transform calculation means, the original signal s (n) stored in the storage means, and the impulse response h iJ (n). Separation accuracy value calculation means for outputting;
A separation accuracy value determination unit that determines the magnitude of the separation accuracy value SIR output by the separation accuracy value calculation unit and the threshold value Max stored in the storage unit, and outputs the determination result;
If the determination result output by the separation accuracy value determination means is that the separation accuracy value SIR is greater than or equal to the threshold Max, the separation matrix W (f) is set to the separation matrix W (f) output by the update means and the threshold Second update means for setting the value of Max to the separation accuracy value SIR;
A first iterative control means for repeatedly executing a conversion means, a score function computing means, a frame time averaging means, and an updating means for one frequency until a predetermined iteration condition is satisfied;
For each grid B R, first iteration means, short discrete inverse Fourier transform computing means, separation accuracy value calculation unit, the separation accuracy value determination unit, by executing the second updating means, the separation matrix W (f) is Obtaining grid repetitive control means;
By controlling the first iteration control means and the grid iteration control means, conversion means, score function computing means, frame time averaging means, updating means, short time discrete inverse Fourier transform computing means, separation accuracy value computing means, separation accuracy value determination Means, second updating means for repeatedly executing the second updating means for each frequency;
For each separation matrix W (f) for each frequency output by the updating means, each component of Y (f, m) output by the converting means corresponds to the estimation of the same original signal at all frequencies. Permutation processing means for rearranging the rows of each separation matrix W (f),
Scaling processing means for adjusting the separation matrix W (f) so that each component of Y (f, m) output by the conversion means has approximately the same amplitude as the estimation of each original signal at all frequencies;
The short-time discrete inverse Fourier transform of Y (f, m) output by the conversion means is calculated, and the calculation result is converted into a separated signal y (n) = [y 1 (n), y 2 (n),. .., Y N (n)] including restoration means for outputting as T ,
The score function Φ (Y (f, m)) is expressed by Expression (3).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. ]
A signal separation device.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を分離する信号分離装置であって、
M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(4)で表されるスコア関数Φ(Y(f,m))のパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕および閾値Maxを記憶する記憶手段と、
記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算手段と、
短時間離散フーリエ変換演算手段によって出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する変換手段と、
変換手段によって出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算手段と、
スコア関数演算手段によって出力されたΦ(Y(f,m))と、変換手段によって出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均手段と、
単位行列Iと、フレーム時間平均手段によって出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新手段と、
スコア関数ΦとしてΦ(Y(f,m))=tanh(|Y(f,m)|)exp(jθ(Y(f,m)))などのsuper-Gaussian分布を仮定した関数を用いて、Wp(f)+[I−<Φ(Y(f,m))Y(f,m)>]Wp(f)を演算し、この演算結果を新たな分離行列Wp(f)として出力するsuper-Gaussian型更新手段と、
super-Gaussian型更新手段によって出力された分離行列Wp(f)とX(f,m)との積を求めて、Yp(f,m)=Wp(f)X(f,m)として出力するsuper-Gaussian型変換手段と、
super-Gaussian型変換手段によって出力されたYp(f,m)と、更新手段によって出力された分離行列W(f)とを用いて各周波数における分離精度値SIRを演算して出力する分離精度値演算手段と、
分離精度値SIRと、記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定手段と、
分離精度値判定手段によって出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新手段によって出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新手段と、
1つの周波数に対して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段を所定の反復条件を満たすまで反復実行させる第1反復制御手段と、
各グリッドBに対して、第1反復手段、super-Gaussian型更新手段、super-Gaussian型変換手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を実行して、分離行列W(f)を得るグリッド反復制御手段と、
第1反復制御手段およびグリッド反復制御手段を制御して、変換手段、スコア関数演算手段、フレーム時間平均手段、更新手段、super-Gaussian型更新手段、super-Gaussian型変換手段、分離精度値演算手段、分離精度値判定手段、第2更新手段を、各周波数に対して反復実行させる第2反復制御手段と、
更新手段によって出力された周波数ごとの各分離行列W(f)について、変換手段によって出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理手段と、
全ての周波数において、変換手段によって出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように分離行列W(f)を調整するスケーリング処理手段と、
変換手段によって出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元手段と
を備え、
スコア関数Φ(Y(f,m))は、式(4)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕
ことを特徴とする信号分離装置。
A signal separation device for separating original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
M time-series data x (n) = [x 1 (n), x 2 (n),..., X M (n)] T [x i of observation signals observed by M observation devices (N) represents time-series data of observation signals observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 of the score function Φ (Y (f, m)) represented by the equation (4), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. And storage means for storing the threshold value Max,
Against time-series data x stored in the storage unit (n), frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. Short-time discrete Fourier transform calculation means for outputting as
A product W (f) X (f, m) of X (f, m) output by the short-time discrete Fourier transform operation means and a separation matrix W (f) of N rows and M columns is calculated. Conversion means for outputting the operation result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T ;
A score function calculating means for calculating a score function Φ (Y (f, m)) having Y (f, m) output by the converting means as an input, and outputting the calculation result;
Relating to the frame time of the product of Φ (Y (f, m)) output by the score function calculating means and the complex conjugate transpose matrix Y H (f, m) of Y (f, m) output by the converting means The average of the sum is calculated, and this calculation result is expressed as <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time averaging means for outputting as
The difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output by the frame time averaging means is multiplied by the separation matrix W (f) and the learning size η, and further separated. The operation W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) for adding the matrix W (f) is performed, and this operation result is newly separated. Updating means for outputting as a matrix W (f);
Using a function assuming a super-Gaussian distribution such as Φ (Y (f, m)) = tanh (| Y (f, m) |) exp (jθ (Y (f, m))) as the score function Φ , Wp (f) + [I− <Φ (Y (f, m)) Y H (f, m)>] Wp (f), and outputs the calculation result as a new separation matrix Wp (f) Super-Gaussian type update means,
The product of the separation matrix Wp (f) and X (f, m) output by the super-Gaussian type updating means is obtained and output as Yp (f, m) = Wp (f) X (f, m). super-Gaussian type conversion means,
A separation accuracy value output by calculating a separation accuracy value SIR at each frequency using Yp (f, m) output by the super-Gaussian type conversion unit and a separation matrix W (f) output by the updating unit. Computing means;
A separation accuracy value determination unit that determines the magnitude of the separation accuracy value SIR and the threshold value Max stored in the storage unit and outputs the determination result;
If the determination result output by the separation accuracy value determination means is that the separation accuracy value SIR is greater than or equal to the threshold Max, the separation matrix W (f) is set to the separation matrix W (f) output by the update means and the threshold Second update means for setting the value of Max to the separation accuracy value SIR;
A first iterative control means for repeatedly executing a conversion means, a score function computing means, a frame time averaging means, and an updating means for one frequency until a predetermined iteration condition is satisfied;
For each grid B R, first iteration means, super-Gaussian type updating means, super-Gaussian type converting means, separation accuracy value calculation unit, the separation accuracy value determination unit, by executing the second updating means, the separating matrix Grid iterative control means for obtaining W (f);
By controlling the first iteration control means and the grid iteration control means, conversion means, score function calculation means, frame time averaging means, update means, super-Gaussian type update means, super-Gaussian type conversion means, separation accuracy value calculation means Second separation control means for repeatedly executing the separation accuracy value determination means and the second update means for each frequency;
For each separation matrix W (f) for each frequency output by the updating means, each component of Y (f, m) output by the converting means corresponds to the estimation of the same original signal at all frequencies. Permutation processing means for rearranging the rows of each separation matrix W (f),
Scaling processing means for adjusting the separation matrix W (f) so that each component of Y (f, m) output by the conversion means has approximately the same amplitude as the estimation of each original signal at all frequencies;
The short-time discrete inverse Fourier transform of Y (f, m) output by the conversion means is calculated, and the calculation result is converted into a separated signal y (n) = [y 1 (n), y 2 (n),. .., Y N (n)] including restoration means for outputting as T ,
The score function Φ (Y (f, m)) is expressed by the equation (4).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. ]
A signal separation device.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、
信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕が記憶されるとし、
信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、
信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、
信号分離装置のサンプルモーメント演算手段が、第1変換ステップにおいて出力されたY(f,m)の絶対値|Y(f,m)|のサンプルモーメント(平均e、分散ν、歪度s、尖度k)を演算し、この演算結果を出力するサンプルモーメント演算ステップと、
信号分離装置のκ演算手段が、サンプルモーメント演算ステップにおいて出力された歪度sおよび尖度kから、β (β +3) /4(2β −3β −6)(4β −3β )〔但し、β =s 、β =kである。〕を演算して、この演算結果をκとして出力するκ演算ステップと、
信号分離装置のピアソン分布型判定手段が、κ演算ステップにおいて出力されたκの値に基づいてピアソン分布型を判定するピアソン分布型判定ステップと、
信号分離装置のピアソン分布型パラメータ演算手段が、ピアソン分布型判定ステップにおいて判定されたピアソン分布型の確率密度関数f のパラメータを、サンプルモーメント演算ステップにおいて出力されたサンプルモーメントから演算して、この演算結果を出力するピアソン分布型パラメータ演算ステップと、
信号分離装置のスコア関数演算手段が、ピアソン分布型パラメータ演算ステップにおいて出力されたパラメータによって定まる確率密度関数f によって、式(5)
Figure 0004653674
〔jは虚数単位を表す。θ(Y(f,m))は複素平面上におけるY(f,m)の偏角を表す。f ’(|Y(f,m)|)は上記確率密度関数f の|Y(f,m)|による微分を表す。〕で表されるスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、
信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、
信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、
信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、サンプルモーメント演算ステップ、κ演算ステップ、ピアソン分布型判定ステップ、ピアソン分布型パラメータ演算ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、
信号分離装置の第2反復制御手段が、第1反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、
信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、
信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、
信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、
信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップと
を有する信号分離方法。
A signal separation method for separating, in a signal separation device, original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
In the storage means of the signal separation device, M time-series data x (n) = [x 1 (n), x 2 (n),..., X of observation signals observed by M observation devices M (n)] T [x i (n) represents time series data of an observation signal observed by the i-th observation device. T represents a transposed matrix. ] Is memorized,
Short discrete Fourier transform computation means of a signal separation device for the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. A short-time discrete Fourier transform operation step to be output as
The conversion means of the signal separation device is a product W (f) X (f, m) of X (f, m) output in the short-time discrete Fourier transform calculation step and a separation matrix W (f) of N rows and M columns. ) And outputs the result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T A first conversion step,
The sample moment calculation means of the signal separation device outputs the sample moment (average e, variance ν, skewness s, cusp of absolute value | Y (f, m) | of Y (f, m) output in the first conversion step. Sample moment calculation step for calculating degree k) and outputting the calculation result;
Κ arithmetic means of the signal separating apparatus, a skewness s and kurtosis k output in sample moment calculating step, β 1 (β 2 +3) 2/4 (2β 2 -3β 1 -6) (4β 2 -3β 1 ) [However, β 1 = s 2 and β 2 = k. ), And outputs a calculation result as κ,
The Pearson distribution type determination means of the signal separation device determines the Pearson distribution type based on the value of κ output in the κ operation step; and
Pearson distributed parameter calculating means of the signal separation device, the parameters of the probability density function f p of the determined Pearson distributed in Pearson distributed determining step, and calculates the output samples moment in the sample moment calculating step, the A Pearson distributed parameter calculation step for outputting a calculation result;
The score function calculation means of the signal separation device uses the probability density function f p determined by the parameter output in the Pearson distribution type parameter calculation step, and the equation (5)
Figure 0004653674
[J represents an imaginary unit. θ (Y (f, m)) represents the deflection angle of Y (f, m) on the complex plane. f p ′ (| Y (f, m) |) represents the differentiation of the probability density function f p by | Y (f, m) |. A score function calculation step of calculating a score function Φ (Y (f, m)) represented by
The frame time averaging means of the signal separation device is a complex conjugate transpose matrix Y H (f) of Φ (Y (f, m)) output in the score function calculation step and Y (f, m) output in the conversion step. , M ) is calculated as the average of the sums of the frame times of the product, and the result of the calculation is <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time average step to be output as
The update means of the signal separation device adds the separation matrix W (f) and the difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. Multiply the learning size η, and further add the separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) An update step of outputting the calculation result as a new separation matrix W (f);
The first iterative control means of the signal separation device performs, for one frequency, a first conversion step, a sample moment calculation step, a κ calculation step, a Pearson distribution type determination step, a Pearson distribution type parameter calculation step, a score function calculation step, A frame time averaging step, an update step is repeatedly performed until a predetermined iteration condition is satisfied, and a separation matrix W (f) output in the update step is obtained when the iteration condition is satisfied;
A second iterative control means of the signal separator for performing a first iteration step for each frequency to obtain a separation matrix W (f) at each frequency;
The permutation processing means of the signal separation device, for each separation matrix W (f) for each frequency output in the second iteration step, each component of Y (f, m) output in the second conversion step is: A permutation processing step of rearranging the rows of each separation matrix W (f) so as to correspond as an estimate of the same original signal at all frequencies;
The scaling processing means of the signal separation device performs permutation so that each component of Y (f, m) output in the second conversion step has approximately the same amplitude as the estimation of each original signal at all frequencies. A scaling processing step for adjusting the separation matrix W (f) output in the processing step;
The conversion means of the signal separation device is a product W (f) of the separation matrix W (f) at each frequency obtained in the scaling processing step and X (f, m) output in the short-time discrete Fourier transform operation step. X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A second conversion step to output as T ;
The restoration means of the signal separation device calculates a short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is obtained as a separation signal y (n) = [y 1 (n ), y 2 (n), ···, the signal separation method for organic and recovery step of outputting as y n (n)] T.
記憶手段には、
原信号として想定される信号の時系列データである教師信号d(n)をも記憶し、
信号分離装置の第2短時間離散フーリエ変換演算手段が、記憶手段に記憶された教師信号d(n)に対して、フレーム時刻mごとに、短時間離散フーリエ変換を演算して、この演算結果をD(f,m)として出力する第2短時間離散フーリエ変換演算ステップを有し、
サンプルモーメント演算ステップは、
第2短時間離散フーリエ変換演算ステップにおいて出力されたD(f,m)の絶対値|D(f,m)|のサンプルモーメント(平均、分散、歪度、尖度)を演算し、この演算結果を出力するものである
ことを特徴とする請求項に記載の信号分離方法。
In the storage means,
A teacher signal d (n) that is time-series data of a signal assumed as an original signal is also stored,
The second short-time discrete Fourier transform calculation means of the signal separation device calculates a short-time discrete Fourier transform for each frame time m with respect to the teacher signal d (n) stored in the storage means. Having a second short-time discrete Fourier transform calculation step for outputting as D (f, m),
The sample moment calculation step is
The sample moment (average, variance, skewness, kurtosis) of the absolute value | D (f, m) | of D (f, m) output in the second short-time discrete Fourier transform calculation step is calculated, and this calculation is performed. The signal separation method according to claim 6 , wherein the result is output.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、
信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕および式(6)で表されるスコア関数Φ(Y(f,m))におけるパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕が記憶されるとし、
信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、
信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、
信号分離装置のスコア関数演算手段が、変換ステップにおいて出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、
信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、
信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、
信号分離装置の非対角成分演算手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差である行列I−<Φ(Y(f,m))Y(f,m)>の非対角成分の絶対値に基づく指標を演算して、この演算結果を<C>として出力する非対角成分演算ステップと、
信号分離装置の非対角成分判定手段が、非対角成分演算ステップにおいて出力された<C>と、閾値Minとの大小を判定して、この判定結果を出力する非対角成分判定ステップと、
信号分離装置の第2更新手段が、非対角成分判定ステップにおいて出力された判定結果が、<C>の値が閾値Minの値以下である場合に、分離行列W(f)を更新ステップにおいて出力された分離行列W(f)に設定するとともに閾値Minの値を<C>の値に設定する第2更新ステップと、
信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、
信号分離装置のグリッド反復制御手段が、各グリッドBに対して、第1反復ステップに続いて非対角成分演算ステップ、非対角成分判定ステップ、第2更新ステップを実行して、分離行列W(f)を得るグリッド反復ステップと、
信号分離装置の第2反復制御手段が、第1反復ステップおよびグリッド反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、
信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、
信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、
信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、
信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップと
を有し、
スコア関数Φ(Y(f,m))は、式(6)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕
ことを特徴とする信号分離方法。
A signal separation method for separating, in a signal separation device, original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
In the storage means of the signal separation device, M time-series data x (n) = [x 1 (n), x 2 (n),..., X of observation signals observed by M observation devices M (n)] T [x i (n) represents time series data of an observation signal observed by the i-th observation device. T represents a transposed matrix. ] And α values {b 01 , b 02 ,..., B } of the parameter b 0 in the score function Φ (Y (f, m)) represented by the equation (6) and β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ] Is memorized,
Short discrete Fourier transform computation means of a signal separation device for the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. A short-time discrete Fourier transform operation step to be output as
The conversion means of the signal separation device is a product W (f) X (f, m) of X (f, m) output in the short-time discrete Fourier transform calculation step and a separation matrix W (f) of N rows and M columns. ) And outputs the result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T A first conversion step,
Score function calculating means of the signal separating device calculates a score function Φ (Y (f, m)) having Y (f, m) output in the conversion step as an input, and outputs the calculation result A computation step;
The frame time averaging means of the signal separation device is a complex conjugate transpose matrix Y H (f) of Φ (Y (f, m)) output in the score function calculation step and Y (f, m) output in the conversion step. , M ) is calculated as the average of the sums of the frame times of the product, and the result of the calculation is <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time average step to be output as
The update means of the signal separation device adds the separation matrix W (f) and the difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. Multiply the learning size η, and further add the separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) An update step of outputting the calculation result as a new separation matrix W (f);
The non-diagonal component calculation means of the signal separation device is a matrix I which is a difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. -<Φ (Y (f, m)) Y H (f, m)> calculates an index based on the absolute value of the non-diagonal component, and outputs the calculation result as <C>. Steps,
A non-diagonal component determination unit of the signal separation device that determines the magnitude of <C> output in the non-diagonal component calculation step and the threshold Min and outputs the determination result; ,
The second updating means of the signal separation device updates the separation matrix W (f) when the determination result output in the non-diagonal component determination step is that the value of <C> is less than or equal to the threshold value Min. A second update step of setting the output separation matrix W (f) and setting the value of the threshold Min to the value of <C>;
The first iterative control means of the signal separation device repeatedly executes the first conversion step, the score function calculating step, the frame time averaging step, and the updating step for one frequency until a predetermined iteration condition is satisfied. A first iteration step to obtain the separation matrix W (f) output in the updating step when
Grid repetition control means of the signal separation device, for each grid B R-diagonal component calculation step following the first iteration step, the non-diagonal component judging step, by performing the second update step, the separation matrix A grid iteration step to obtain W (f);
A second iterative control means of the signal separating device performs a first iteration step and a grid iteration step for each frequency to obtain a separation matrix W (f) at each frequency;
The permutation processing means of the signal separation device, for each separation matrix W (f) for each frequency output in the second iteration step, each component of Y (f, m) output in the second conversion step is: A permutation processing step of rearranging the rows of each separation matrix W (f) so as to correspond as an estimate of the same original signal at all frequencies;
The scaling processing means of the signal separation device performs permutation so that each component of Y (f, m) output in the second conversion step has approximately the same amplitude as the estimation of each original signal at all frequencies. A scaling processing step for adjusting the separation matrix W (f) output in the processing step;
The conversion means of the signal separation device is a product W (f) of the separation matrix W (f) at each frequency obtained in the scaling processing step and X (f, m) output in the short-time discrete Fourier transform operation step. X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A second conversion step to output as T ;
The restoration means of the signal separation device calculates a short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is obtained as a separation signal y (n) = [y 1 (n ), Y 2 (n),..., Y N (n)] and a restoration step for outputting as T ,
The score function Φ (Y (f, m)) is expressed by Expression (6).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. ]
And a signal separation method.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、
信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(7)で表されるスコア関数Φ(Y(f,m))におけるパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕、原信号s(n)=[s(n), s(n),・・・,s(n)]、各信号源Jから各観測装置iまでのインパルス応答hiJ(n)および閾値Maxが記憶されるとし、
信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、
信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、
信号分離装置のスコア関数演算手段が、変換ステップにおいて出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、
信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、
信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、
信号分離装置の短時間離散逆フーリエ変換演算手段が、分離行列W(f)に対して、短時間離散逆フーリエ変換を演算して、この演算結果をw(n)として出力する短時間離散逆フーリエ変換演算ステップと、
信号分離装置の分離精度値演算手段が、短時間離散逆フーリエ変換演算ステップにおいて出力されたw(n)、記憶手段に記憶された原信号s(n)およびインパルス応答hiJ(n)から、各周波数における分離精度値SIRを演算して出力する分離精度値演算ステップと、
信号分離装置の分離精度値判定手段が、分離精度値演算ステップにおいて出力された分離精度値SIRと記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定ステップと、
信号分離装置の第2更新手段が、分離精度値判定ステップにおいて出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新ステップにおいて出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新ステップと、
信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、
信号分離装置のグリッド反復制御手段が、各グリッドBに対して、第1反復ステップに続いて短時間離散逆フーリエ変換演算ステップ演算ステップ、分離精度値演算ステップ、分離精度値判定ステップ、第2更新ステップを実行して、分離行列W(f)を得るグリッド反復ステップと、
信号分離装置の第2反復制御手段が、第1反復ステップおよびグリッド反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、
信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、
信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、
信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、
信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップと
を有し、
スコア関数Φ(Y(f,m))は、式(7)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕
ことを特徴とする信号分離方法。
A signal separation method for separating, in a signal separation device, original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
In the storage means of the signal separation device, M time-series data x (n) = [x 1 (n), x 2 (n),..., X of observation signals observed by M observation devices M (n)] T [x i (n) represents time series data of an observation signal observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 in the score function Φ (Y (f, m)) represented by the equation (7), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ], Original signal s (n) = [s 1 (n), s 2 (n),..., S N (n)], impulse response h iJ (n from each signal source J to each observation device i ) And threshold Max are stored,
Short discrete Fourier transform computation means of a signal separation device for the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. A short-time discrete Fourier transform operation step to be output as
The conversion means of the signal separation device is a product W (f) X (f, m) of X (f, m) output in the short-time discrete Fourier transform calculation step and a separation matrix W (f) of N rows and M columns. ) And outputs the result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T A first conversion step,
Score function calculating means of the signal separating device calculates a score function Φ (Y (f, m)) having Y (f, m) output in the conversion step as an input, and outputs the calculation result A computation step;
The frame time averaging means of the signal separation device is a complex conjugate transpose matrix Y H (f) of Φ (Y (f, m)) output in the score function calculation step and Y (f, m) output in the conversion step. , M ) is calculated as the average of the sums of the frame times of the product, and the result of the calculation is <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time average step to be output as
The update means of the signal separation device adds the separation matrix W (f) and the difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. Multiply the learning size η, and further add the separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) An update step of outputting the calculation result as a new separation matrix W (f);
The short-time discrete inverse Fourier transform computing means of the signal separation device computes the short-time discrete inverse Fourier transform on the separation matrix W (f) and outputs the computation result as w (n). Fourier transform operation step;
The separation accuracy value calculation means of the signal separation device is configured so that w (n) output in the short-time discrete inverse Fourier transform calculation step, the original signal s (n) stored in the storage means, and the impulse response h iJ (n) A separation accuracy value calculating step for calculating and outputting a separation accuracy value SIR at each frequency;
The separation accuracy value determination means for determining the magnitude of the separation accuracy value SIR output in the separation accuracy value calculation step and the threshold value Max stored in the storage means, and outputting the determination result. Steps,
When the determination result output by the second update means of the signal separation device in the separation accuracy value determination step is that the separation accuracy value SIR is greater than or equal to the threshold Max, the separation matrix W (f) output in the update step A second updating step for setting the matrix W (f) and setting the value of the threshold Max to the separation accuracy value SIR;
The first iterative control means of the signal separation device repeatedly executes the first conversion step, the score function calculating step, the frame time averaging step, and the updating step for one frequency until a predetermined iteration condition is satisfied. A first iteration step to obtain the separation matrix W (f) output in the updating step when
Signal grid repetition control means of the separation device, for each grid B R, briefly following the first iteration step the discrete inverse Fourier transform calculating step calculating step, the separation accuracy value calculation step, the separation accuracy value determining step, the second A grid iteration step that performs an update step to obtain a separation matrix W (f);
A second iterative control means of the signal separating device performs a first iteration step and a grid iteration step for each frequency to obtain a separation matrix W (f) at each frequency;
The permutation processing means of the signal separation device, for each separation matrix W (f) for each frequency output in the second iteration step, each component of Y (f, m) output in the second conversion step is: A permutation processing step of rearranging the rows of each separation matrix W (f) so as to correspond as an estimate of the same original signal at all frequencies;
The scaling processing means of the signal separation device performs permutation so that each component of Y (f, m) output in the second conversion step has approximately the same amplitude as the estimation of each original signal at all frequencies. A scaling processing step for adjusting the separation matrix W (f) output in the processing step;
The conversion means of the signal separation device is a product W (f) of the separation matrix W (f) at each frequency obtained in the scaling processing step and X (f, m) output in the short-time discrete Fourier transform operation step. X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A second conversion step to output as T ;
The restoration means of the signal separation device calculates a short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is obtained as a separation signal y (n) = [y 1 (n ), Y 2 (n),..., Y N (n)] and a restoration step for outputting as T ,
The score function Φ (Y (f, m)) is expressed by Expression (7).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. ]
And a signal separation method.
M個〔2≦M〕の観測装置で観測した観測信号から、N個〔2≦N〕の信号源から発せられた原信号を信号分離装置において分離する信号分離方法であって、
信号分離装置の記憶手段には、M個の観測装置で観測された観測信号のM個の時系列データx(n)=[x(n),x(n),・・・,x(n)]〔x(n)は、i番目の観測装置で観測された観測信号の時系列データを表す。また、Tは転置行列を表す。〕、式(8)で表されるスコア関数Φ(Y(f,m))におけるパラメータbのα個の値{b01,b02,・・・,b0α}、パラメータbのβ個の値{b11,b12,・・・,b1β}、パラメータcのγ個の値{c01,c02,・・・,c0γ}、パラメータcのδ個の値{c11,c12,・・・,c1δ}、パラメータcのε個の値{c21,c22,・・・,c2ε}のそれぞれから1つずつ値を選択して組み合わせたグリッドB〔B={b01,b11,c01,c11,c21}、B={b02,b11,c01,c11,c21}、・・・、BRmax={b0α,b1β,c0γ,c1δ,c2ε}とする。但し、R=1,2,・・・,Rmax、Rmax=α×β×γ×δ×εである。〕および閾値Maxが記憶されるとし、
信号分離装置の短時間離散フーリエ変換演算手段が、記憶手段に記憶された時系列データx(n)に対して、フレーム時刻m〔但し、フレームの数はNとする。〕ごとに、短時間離散フーリエ変換を演算して、この演算結果をX(f,m)=[X(f,m),X(f,m),・・・,X(f,m)]〔fは周波数を表す。〕として出力する短時間離散フーリエ変換演算ステップと、
信号分離装置の変換手段が、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)と、N行M列の分離行列W(f)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第1変換ステップと、
信号分離装置のスコア関数演算手段が、変換ステップにおいて出力されたY(f,m)を入力とするスコア関数Φ(Y(f,m))を演算して、この演算結果を出力するスコア関数演算ステップと、
信号分離装置のフレーム時間平均手段が、スコア関数演算ステップにおいて出力されたΦ(Y(f,m))と、変換ステップにおいて出力されたY(f,m)の複素共役転置行列Y(f,m)との積のフレーム時刻に関する総和の平均を演算して、この演算結果を<Φ(Y(f,m))Y(f,m)>〔但し、
Figure 0004653674
とする。〕として出力するフレーム時間平均ステップと、
信号分離装置の更新手段が、単位行列Iと、フレーム時間平均ステップにおいて出力された<Φ(Y(f,m))Y(f,m)>との差に分離行列W(f)および学習サイズηを乗じ、さらに分離行列W(f)を加える演算W(f)+η[I−<Φ(Y(f,m))Y(f,m)>]W(f)をして、この演算結果を新たな分離行列W(f)として出力する更新ステップと、
信号分離装置のsuper-Gaussian型更新手段が、スコア関数ΦとしてΦ(Y(f,m))=tanh(|Y(f,m)|)exp(jθ(Y(f,m)))などのsuper-Gaussian分布を仮定した関数を用いて、Wp(f)+[I−<Φ(Y(f,m))Y(f,m)>]Wp(f)を演算し、この演算結果を新たな分離行列Wp(f)として出力するsuper-Gaussian型更新ステップと、
信号分離装置のsuper-Gaussian型変換手段が、super-Gaussian型更新ステップにおいて出力された分離行列Wp(f)とX(f,m)との積を求めて、Yp(f,m)=Wp(f)X(f,m)として出力するsuper-Gaussian型変換ステップと、
信号分離装置の分離精度値演算手段が、super-Gaussian型変換ステップにおいて出力されたYp(f,m)と、更新ステップにおいて出力された分離行列W(f)とを用いて各周波数における分離精度値SIRを演算して出力する分離精度値演算ステップと、
信号分離装置の分離精度値判定手段が、分離精度値SIRと、記憶手段に記憶された閾値Maxとの大小を判定し、この判定結果を出力する分離精度値判定ステップと、
信号分離装置の第2更新手段が、分離精度値判定ステップにおいて出力された判定結果が、分離精度値SIRが閾値Max以上である場合に、分離行列W(f)を更新ステップにおいて出力された分離行列W(f)に設定するとともに閾値Maxの値を分離精度値SIRに設定する第2更新ステップと、
信号分離装置の第1反復制御手段が、1つの周波数に対して、第1変換ステップ、スコア関数演算ステップ、フレーム時間平均ステップ、更新ステップを所定の反復条件を満たすまで反復実行し、この反復条件を満たしたときに更新ステップにおいて出力された分離行列W(f)を得る第1反復ステップと、
信号分離装置のグリッド反復制御手段が、各グリッドBに対して、第1反復ステップに続いてsuper-Gaussian型更新ステップ、super-Gaussian型変換ステップ、分離精度値演算ステップ、分離精度値判定ステップ、第2更新ステップを実行して、分離行列W(f)を得るグリッド反復ステップと、
信号分離装置の第2反復制御手段が、第1反復ステップおよびグリッド反復ステップを各周波数について実行し、各周波数における分離行列W(f)を得る第2反復ステップと、
信号分離装置のパーミュテーション処理手段が、第2反復ステップによって出力された周波数ごとの各分離行列W(f)について、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、全ての周波数において同じ原信号の推定のものとして対応するように各分離行列W(f)の行を並べかえるパーミュテーション処理ステップと、
信号分離装置のスケーリング処理手段が、全ての周波数において、第2変換ステップにおいて出力されるY(f,m)の成分それぞれが、各原信号の推定とおよそ同じ振幅を持つように、パーミュテーション処理ステップにおいて出力された分離行列W(f)を調整するスケーリング処理ステップと、
信号分離装置の変換手段が、スケーリング処理ステップにおいて得られた各周波数における分離行列W(f)と、短時間離散フーリエ変換演算ステップにおいて出力されたX(f,m)との積W(f)X(f,m)の演算をして、この演算結果をY(f,m)=[Y(f,m),Y(f,m),・・・,Y(f,m)]として出力する第2変換ステップと、
信号分離装置の復元手段が、第2変換ステップにおいて出力されたY(f,m)の短時間離散逆フーリエ変換を演算して、この演算結果を分離信号y(n)=[y(n),y(n),・・・,y(n)]として出力する復元ステップと
を有し、
スコア関数Φ(Y(f,m))は、式(8)で表されるものである
Figure 0004653674
〔但し、b(f)、b(f)、c(f)、c(f)、c(f)はパラメータとする。〕
ことを特徴とする信号分離方法。
A signal separation method for separating, in a signal separation device, original signals emitted from N [2 ≦ N] signal sources from observation signals observed by M [2 ≦ M] observation devices,
In the storage means of the signal separation device, M time-series data x (n) = [x 1 (n), x 2 (n),..., X of observation signals observed by M observation devices M (n)] T [x i (n) represents time series data of an observation signal observed by the i-th observation device. T represents a transposed matrix. ] Α values {b 01 , b 02 ,..., B } of the parameter b 0 in the score function Φ (Y (f, m)) represented by the equation (8), β of the parameter b 1 Values {b 11 , b 12 ,..., B }, γ values {c 01 , c 02 ,..., C } of parameter c 0 , δ values { 0 of parameter c 1 { c 11, c 12, ···, c 1δ}, grid combination by selecting one by one from each value of ε number of values of the parameter c 2 {c 21, c 22 , ···, c 2ε} B R [B 1 = {b 01 , b 11 , c 01 , c 11 , c 21 }, B 2 = {b 02 , b 11 , c 01 , c 11 , c 21 },..., B Rmax = {b 0α, b 1β, c 0γ, c 1δ, c 2ε} to. However, R = 1, 2,..., Rmax, Rmax = α × β × γ × δ × ε. ) And threshold value Max are stored,
Short discrete Fourier transform computation means of a signal separation device for the time-series data x (n) stored in the storage means, the frame time m was prepared in which the number of frames to N m. ], A short-time discrete Fourier transform is calculated, and the calculation result is expressed as X (f, m) = [X 1 (f, m), X 2 (f, m),..., X M (f , M)] T [f represents frequency. A short-time discrete Fourier transform operation step to be output as
The conversion means of the signal separation device is a product W (f) X (f, m) of X (f, m) output in the short-time discrete Fourier transform calculation step and a separation matrix W (f) of N rows and M columns. ) And outputs the result as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m)] T A first conversion step,
Score function calculating means of the signal separating device calculates a score function Φ (Y (f, m)) having Y (f, m) output in the conversion step as an input, and outputs the calculation result A computation step;
The frame time averaging means of the signal separation device is a complex conjugate transpose matrix Y H (f) of Φ (Y (f, m)) output in the score function calculation step and Y (f, m) output in the conversion step. , M ) is calculated as the average of the sums of the frame times of the product, and the result of the calculation is <Φ (Y (f, m)) Y H (f, m)> [
Figure 0004653674
And Frame time average step to be output as
The update means of the signal separation device adds the separation matrix W (f) and the difference between the unit matrix I and <Φ (Y (f, m)) Y H (f, m)> output in the frame time averaging step. Multiply the learning size η, and further add the separation matrix W (f) W (f) + η [I− <Φ (Y (f, m)) Y H (f, m)>] W (f) An update step of outputting the calculation result as a new separation matrix W (f);
The super-Gaussian type updating means of the signal separation device uses Φ (Y (f, m)) = tanh (| Y (f, m) |) exp (jθ (Y (f, m))) as the score function Φ. Wp (f) + [I− <Φ (Y (f, m)) Y H (f, m)>] Wp (f) is calculated using a function assuming a super-Gaussian distribution of A super-Gaussian type updating step for outputting the result as a new separation matrix Wp (f);
The super-Gaussian type conversion means of the signal separation device calculates the product of the separation matrix Wp (f) and X (f, m) output in the super-Gaussian type update step, and Yp (f, m) = Wp (F) a super-Gaussian conversion step of outputting as X (f, m);
The separation accuracy value calculation means of the signal separation device uses the separation matrix W (f) output in the update step and Yp (f, m) output in the super-Gaussian conversion step and the separation accuracy in each frequency. A separation accuracy value calculation step for calculating and outputting the value SIR;
A separation accuracy value determination step of the separation accuracy value determination means of the signal separation device determining the magnitude of the separation accuracy value SIR and the threshold value Max stored in the storage means, and outputting the determination result;
When the determination result output by the second update means of the signal separation device in the separation accuracy value determination step is that the separation accuracy value SIR is greater than or equal to the threshold Max, the separation matrix W (f) output in the update step A second updating step for setting the matrix W (f) and setting the value of the threshold Max to the separation accuracy value SIR;
The first iterative control means of the signal separation device repeatedly executes the first conversion step, the score function calculating step, the frame time averaging step, and the updating step for one frequency until a predetermined iteration condition is satisfied. A first iteration step to obtain the separation matrix W (f) output in the updating step when
Grid repetition control means of the signal separation device, for each grid B R, super-Gaussian type updating step following the first iteration step, super-Gaussian type conversion step, the separation accuracy value calculation step, the separation accuracy value determining step Performing a second update step to obtain a separation matrix W (f);
A second iterative control means of the signal separating device performs a first iteration step and a grid iteration step for each frequency to obtain a separation matrix W (f) at each frequency;
The permutation processing means of the signal separation device, for each separation matrix W (f) for each frequency output in the second iteration step, each component of Y (f, m) output in the second conversion step is: A permutation processing step of rearranging the rows of each separation matrix W (f) so as to correspond as an estimate of the same original signal at all frequencies;
The scaling processing means of the signal separation device performs permutation so that each component of Y (f, m) output in the second conversion step has approximately the same amplitude as the estimation of each original signal at all frequencies. A scaling processing step for adjusting the separation matrix W (f) output in the processing step;
The conversion means of the signal separation device is a product W (f) of the separation matrix W (f) at each frequency obtained in the scaling processing step and X (f, m) output in the short-time discrete Fourier transform operation step. X (f, m) is calculated, and the calculation result is expressed as Y (f, m) = [Y 1 (f, m), Y 2 (f, m),..., Y N (f, m )] A second conversion step to output as T ;
The restoration means of the signal separation device calculates a short-time discrete inverse Fourier transform of Y (f, m) output in the second conversion step, and the calculation result is obtained as a separation signal y (n) = [y 1 (n ), Y 2 (n),..., Y N (n)] and a restoration step for outputting as T ,
The score function Φ (Y (f, m)) is expressed by Expression (8).
Figure 0004653674
[However, b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 (f) are parameters. ]
And a signal separation method.
上記スコア関数Φ(Y(f,m))における各パラメータb、b、c、c、cの値の取り得る範囲に、ピアソン分布に由来するパラメータ範囲の制約条件を課さない
ことを特徴とする請求項から請求項10のいずれかに記載の信号分離方法。
The parameter range constraint derived from the Pearson distribution is not imposed on the possible range of each parameter b 0 , b 1 , c 0 , c 1 , c 2 in the score function Φ (Y (f, m)). signal separation method according to any one of claims 10 claim 8, characterized in that.
観測信号1の時系列データが短時間離散フーリエ変換演算ステップにおいて短時間離散フーリエ変換された周波数領域を1つ以上の基準周波数によって複数の周波数領域に分割し、それぞれの周波数領域ごとに、当該周波数領域のX(f,m)に対して、
請求項6または請求項に記載の信号分離方法における短時間離散フーリエ変換演算ステップより後の処理を実行する、
あるいは、
観測信号1または観測信号1とは異なる観測信号2に対して請求項から請求項11のいずれかに記載の信号分離方法を予め適用し、このいずれかの信号分離方法の上記第2反復ステップにおいて得られた各周波数fにおける分離行列W(f)を与えたときの各グリッドのパラメータb(f)、b(f)、c(f)、c(f)、c(f)の値を、各周波数fにおけるグリッドB〔B={b(1),b(1),c(1),c(1),c(1)}、B={b(2),b(2),c(2),c(2),c(2)}、・・・、B={b(F),b(F),c(F),c(F),c(F)}とする。但し、R=f(f=1,・・・,F)とする。〕として一意に固定して、請求項から請求項11のいずれかに記載の信号分離方法における短時間離散フーリエ変換演算ステップより後の処理を実行する
ことを特徴とする信号分離方法。
The frequency domain in which the time-series data of the observation signal 1 is subjected to the short-time discrete Fourier transform in the short-time discrete Fourier transform operation step is divided into a plurality of frequency domains by one or more reference frequencies, For region X (f, m)
The processing after the short-time discrete Fourier transform operation step in the signal separation method according to claim 6 or 7 ,
Or
The signal separation method according to any one of claims 8 to 11 is applied in advance to the observation signal 1 or the observation signal 2 different from the observation signal 1, and the second iteration step of any one of the signal separation methods The parameters b 0 (f), b 1 (f), c 0 (f), c 1 (f), c 2 () of each grid when the separation matrix W (f) at each frequency f obtained in FIG. the value of f), the grid B R at each frequency f [B 1 = {b 0 (1 ), b 1 (1), c 0 (1), c 1 (1), c 2 (1)}, B 2 = {b 0 (2), b 1 (2), c 0 (2), c 1 (2), c 2 (2)},..., B F = {b 0 (F), b 1 (F), c 0 (F), c 1 (F), c 2 (F)}. However, R = f (f = 1,..., F). ] A signal separation method, wherein the processing after the short-time discrete Fourier transform operation step in the signal separation method according to any one of claims 8 to 11 is executed.
請求項1から請求項5のいずれかに記載された信号分離装置としてコンピュータを機能させるための信号分離プログラム。 A signal separation program for causing a computer to function as the signal separation device according to any one of claims 1 to 5 . 請求項13に記載の信号分離プログラムを記録した、コンピュータによって読み取り可能なプログラム記録媒体。 A computer-readable program recording medium on which the signal separation program according to claim 13 is recorded.
JP2006057899A 2005-04-28 2006-03-03 Signal separation device, signal separation method, program thereof, and recording medium Expired - Fee Related JP4653674B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006057899A JP4653674B2 (en) 2005-04-28 2006-03-03 Signal separation device, signal separation method, program thereof, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005133486 2005-04-28
JP2006057899A JP4653674B2 (en) 2005-04-28 2006-03-03 Signal separation device, signal separation method, program thereof, and recording medium

Publications (2)

Publication Number Publication Date
JP2006330687A JP2006330687A (en) 2006-12-07
JP4653674B2 true JP4653674B2 (en) 2011-03-16

Family

ID=37552377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006057899A Expired - Fee Related JP4653674B2 (en) 2005-04-28 2006-03-03 Signal separation device, signal separation method, program thereof, and recording medium

Country Status (1)

Country Link
JP (1) JP4653674B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5642339B2 (en) * 2008-03-11 2014-12-17 トヨタ自動車株式会社 Signal separation device and signal separation method
JP5550456B2 (en) * 2009-06-04 2014-07-16 本田技研工業株式会社 Reverberation suppression apparatus and reverberation suppression method
JP5565593B2 (en) * 2009-10-01 2014-08-06 日本電気株式会社 Signal processing method, signal processing apparatus, and signal processing program
JP6114053B2 (en) * 2013-02-15 2017-04-12 日本電信電話株式会社 Sound source separation device, sound source separation method, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004005510A (en) * 2002-03-28 2004-01-08 Meiji Univ Random number generation method following multivariate nonnormal distribution, estimation method of parameter thereof, and application to simulation in financial, ion implant to semiconductor and the like
WO2005024788A1 (en) * 2003-09-02 2005-03-17 Nippon Telegraph And Telephone Corporation Signal separation method, signal separation device, signal separation program, and recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004005510A (en) * 2002-03-28 2004-01-08 Meiji Univ Random number generation method following multivariate nonnormal distribution, estimation method of parameter thereof, and application to simulation in financial, ion implant to semiconductor and the like
WO2005024788A1 (en) * 2003-09-02 2005-03-17 Nippon Telegraph And Telephone Corporation Signal separation method, signal separation device, signal separation program, and recording medium

Also Published As

Publication number Publication date
JP2006330687A (en) 2006-12-07

Similar Documents

Publication Publication Date Title
US8391505B2 (en) Reverberation suppressing apparatus and reverberation suppressing method
US7895038B2 (en) Signal enhancement via noise reduction for speech recognition
JP6243858B2 (en) Speech model learning method, noise suppression method, speech model learning device, noise suppression device, speech model learning program, and noise suppression program
US9971012B2 (en) Sound direction estimation device, sound direction estimation method, and sound direction estimation program
JP2011215317A (en) Signal processing device, signal processing method and program
JP6723120B2 (en) Acoustic processing device and acoustic processing method
CN101460996B (en) Gain control system, gain control method
JP4977062B2 (en) Reverberation apparatus and method, program and recording medium
JP4653674B2 (en) Signal separation device, signal separation method, program thereof, and recording medium
JP5351856B2 (en) Sound source parameter estimation device, sound source separation device, method thereof, program, and storage medium
CN101322183B (en) Signal distortion elimination apparatus and method
KR101043114B1 (en) Method of Restoration of Sound, Recording Media of the same and Apparatus of the same
JP5670298B2 (en) Noise suppression device, method and program
JP2013167698A (en) Apparatus and method for estimating spectral shape feature quantity of signal for every sound source, and apparatus, method and program for estimating spectral feature quantity of target signal
JP5438704B2 (en) Sound source parameter estimation device, sound source separation device, method and program thereof
US11322169B2 (en) Target sound enhancement device, noise estimation parameter learning device, target sound enhancement method, noise estimation parameter learning method, and program
CN113241090B (en) Multichannel blind sound source separation method based on minimum volume constraint
JP4630203B2 (en) Signal separation device, signal separation method, signal separation program and recording medium, signal arrival direction estimation device, signal arrival direction estimation method, signal arrival direction estimation program and recording medium
JP5457999B2 (en) Noise suppressor, method and program thereof
Bayestehtashk et al. Robust speech recognition using multivariate copula models
JP5498452B2 (en) Background sound suppression device, background sound suppression method, and program
JP2019035851A (en) Target sound source estimation device, target sound source estimation method, and target sound source estimation program
JPWO2017204226A1 (en) System and method for recovering acoustic signals
JP5530988B2 (en) Background sound suppression device, background sound suppression method, and program
JP5683446B2 (en) Spectral distortion parameter estimated value correction apparatus, method and program thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101217

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees