JP2008060635A - Blind signal extracting device, method thereof, program thereof, and recording medium stored with this program - Google Patents
Blind signal extracting device, method thereof, program thereof, and recording medium stored with this program Download PDFInfo
- Publication number
- JP2008060635A JP2008060635A JP2006231648A JP2006231648A JP2008060635A JP 2008060635 A JP2008060635 A JP 2008060635A JP 2006231648 A JP2006231648 A JP 2006231648A JP 2006231648 A JP2006231648 A JP 2006231648A JP 2008060635 A JP2008060635 A JP 2008060635A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- correlation matrix
- beamformer
- target
- observation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
この発明は、必要である源信号(目的信号)のみを直接観測することが出来ず、目的信号に他のノイズ、干渉信号などが重畳されて観測されるという状況において目的信号を推定して抽出するブラインド信号抽出装置、方法、プログラム、および記録媒体に関するものである。 In the present invention, it is not possible to directly observe only a necessary source signal (target signal), but the target signal is estimated and extracted in a situation where other noise, interference signal, etc. are observed superimposed on the target signal. The present invention relates to a blind signal extraction device, a method, a program, and a recording medium.
ここでは、まず観測信号のモデル化と信号の周波数領域の定義を行い、次に従来技術について簡単に述べる。
[観測信号]
全ての信号はあるサンプリング周波数fsでサンプリングされ、離散的に表現されるものとする。N個(Nは2以上の整数)の源信号が混合されて、M個(Mは2以上の整数)のセンサで観測されたとする。この発明は、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより、信号が反射するなどして伝送路歪みが発生しうる状況を扱う。このような状況では、複数の信号源からの源信号sn(t)(n=1、...、N)が複数のセンサで観測信号xm(t)(m=1、...、M)として観測され、各信号源nからセンサmまでのインパルス応答をhmn(u)(uは時間を表す)とする。センサmでの観測信号xm(t)は各源信号sn(t)に対し、対応するインパルス応答hmn(u)が畳込み混合され、次式で表される。
xm(t)=Σn=1 NΣu=0 ∞hmn(u)sn(t−u) (1)
ここでは、源信号s1(t)、...、sN(t)やインパルス応答h11(u)、...、h1N(u)、...、hM1(u)、...、hMN(u)についての情報を事前に得られない状況を考える。この状況で、観測信号x1(t)、...、xM(t)のみを用いて源信号s1(t)、...、sN(t)を分離抽出することがこの発明の広義の目的である。
[周波数領域表現]
この発明では、周波数領域において、各操作を行う。そのため、センサでの観測信号xm(t)にL点(Lは任意の整数)に、公知の技術である例えば、短時間フーリエ変換を適用して周波数ごとの時間系列
xm(f、τ)=Σu=-L/2 L/2-1xm(τ+u)g(u)e−i2πfu (2)
を求める。ここで、fは周波数であり、f=0、fs/L、...、fs(L−1)/Lと離散化されており、τは任意の時間であり、上述の通り、fsはサンプリング周波数である。g(u)は例えばハニング窓などの窓関数である。
Here, the observation signal is first modeled and the frequency domain of the signal is defined, and then the prior art is briefly described.
[Observation signal]
All signals are sampled at a certain sampling frequency f s and expressed discretely. It is assumed that N (N is an integer of 2 or more) source signals are mixed and observed by M (M is an integer of 2 or more) sensors. The present invention deals with a situation in which a signal is attenuated / delayed depending on a distance from a signal generation source to a sensor, or a signal is reflected by a wall or the like, thereby causing transmission path distortion. In such a situation, the source signals s n (t) (n = 1,..., N) from a plurality of signal sources are observed by a plurality of sensors to be observed signals x m (t) (m = 1,. , M), and the impulse response from each signal source n to sensor m is h mn (u) (u represents time). The observation signal x m (t) at the sensor m is convolutionally mixed with the corresponding impulse response h mn (u) for each source signal s n (t), and is expressed by the following equation.
x m (t) = Σ n = 1 N Σ u = 0 ∞ h mn (u) s n (tu) (1)
Here, the source signals s 1 (t),. . . , S N (t) and impulse response h 11 (u),. . . , H 1N (u),. . . , H M1 (u),. . . Consider a situation where information about h MN (u) cannot be obtained in advance. In this situation, the observation signals x 1 (t),. . . , X M (t) only and source signals s 1 (t),. . . , S N (t) is a broad object of this invention.
[Frequency domain expression]
In the present invention, each operation is performed in the frequency domain. Therefore, a time series x m (f, τ) for each frequency by applying a short-time Fourier transform, for example, a known technique to the L point (L is an arbitrary integer) on the observation signal x m (t) of the sensor. ) = Σ u = −L / 2 L / 2-1 x m (τ + u) g (u) e −i2πfu (2)
Ask for. Where f is the frequency, f = 0, f s / L,. . . , F s (L−1) / L, and τ is an arbitrary time, and as described above, f s is a sampling frequency. g (u) is a window function such as a Hanning window.
式(1)で示される時間領域での畳み込み混合は、周波数領域では、
xm(f、τ)=Σn=1 Nhmn(f)sn(f、τ) (3)
と各周波数での単純混合に近似表現される。ここで、hmn(f)は信号源nからセンサmまでの周波数成分fについての周波数応答(インパルス応答)、sn(f、τ)は式(2)と同様の式に従って、源信号sn(t)に短時間フーリエ変換を施したものであり、以下も同様とする。センサ1〜Mの観測信号x1(f、τ)、...、xM(f、τ)を式(3)を用いて、ベクトルで表記すると、
x(f、τ)=Σn=1 Nhn(f)sn(f、τ) (4)
となる。ここで、x(f、τ)は、x(f、τ)=[x1(f、τ)、...、xm(f、τ)、...、xM(f、τ)]Tとなる観測信号ベクトルであり、hn(f)は、hn(f)=[h1n(f)、...、hmn(f)、...、hMn(f)]Tであり、信号源から各センサへの周波数応答をまとめたベクトルである。また、[A]TはベクトルAの転置ベクトルを示す。以下の説明も同様とする。
[代表的な従来技術]
混合信号から目的とする信号を抽出する代表的な信号抽出手法として、適応型ビームフォーマ(adaptive beamformer:ABF)が非特許文献1等に記載され、広く知られている。
In the frequency domain, the convolutional mixing in the time domain expressed by Equation (1) is
x m (f, τ) = Σ n = 1 N h mn (f) s n (f, τ) (3)
And an approximate representation of simple mixing at each frequency. Here, h mn (f) is a frequency response (impulse response) for the frequency component f from the signal source n to the sensor m, and s n (f, τ) is a source signal s according to an equation similar to equation (2). n (t) is subjected to a short-time Fourier transform, and so on. Observation signals x 1 (f, τ),. . . , X M (f, τ) as a vector using equation (3),
x (f, τ) = Σ n = 1 N h n (f) s n (f, τ) (4)
It becomes. Here, x (f, τ) is x (f, τ) = [x 1 (f, τ),. . . , X m (f, τ),. . . , X M (f, τ)] is an observed signal vector T , and h n (f) is h n (f) = [h 1n (f),. . . , H mn (f),. . . , H Mn (f)] T , a vector summarizing the frequency response from the signal source to each sensor. [A] T indicates a transposed vector of the vector A. The same applies to the following description.
[Representative conventional technology]
As a typical signal extraction method for extracting a target signal from a mixed signal, an adaptive beamformer (ABF) is described in Non-Patent
従来の適応型ビームフォーマ(以下、従来型ビームフォーマという)の機能構成例を図1に示す。複数のセンサ4mで観測された信号xm(t)が周波数領域変換部5に入力される。周波数領域変換部5で信号xm(t)が周波数領域信号xm(f、τ)に変換される。xm(f、τ)(m=1、...、M)は全て従来型ビームフォーマ6へ入力される。
An example of the functional configuration of a conventional adaptive beamformer (hereinafter referred to as a conventional beamformer) is shown in FIG. Signals x m (t) observed by the plurality of
従来型ビームフォーマ6は複数のセンサを用いたシステムにおいて、目的信号sn(t)を強調し、不要信号s1(t)、...、sn−1(t)、...、sn+1(t)、...、sN(t)をできるだけ抑圧するフィルタwn(f)=[w1n(f)、...、wmn(f)、...、wMn(f)]Tを推定することで実現される。 The conventional beamformer 6 emphasizes the target signal s n (t) in the system using a plurality of sensors, and unnecessary signals s 1 (t),. . . , S n-1 (t),. . . , S n + 1 (t),. . . , S N (t) as much as possible filter w n (f) = [w 1n (f),. . . , W mn (f),. . . , W Mn (f)] T is realized.
従来型ビームフォーマ6を設計する際には、「目的信号発生源から各センサへのインパルス応答ベクトルhn(f)もしくは、その近似であるステアリングベクトル
an(f)=[exp(−i2πfτ1n),…,exp(−i2πfτMn)]T (5)
が既知である」ということを仮定する。ここでτmnは信号源nがセンサmに達する時刻と原点0に達する時間差である。従来は、図2に示すように直線状に配置したセンサシステムを用いることが多く、信号源nの方向をθn、センサ4mのセンサ41を基準とした座標dmとすると、上述のτmnは、τmn=dmcosθn/cで与えられる。ここでcは信号の速度である。
When designing the conventional beamformer 6, "impulse response vector h n (f) from the target signal source to each sensor or a steering vector a n is the approximation (f) = [exp (-i2πfτ 1n , ..., exp (-i2πfτ Mn )] T (5)
Is known ". Here, τ mn is the difference between the time when the signal source n reaches the sensor m and the time when it reaches the
図1に説明を戻すと、不要信号を抑圧する従来型ビームフォーマ6として、以下の式で表される出力パワーA’(wn(f))を最小にするフィルタ群(ベクトル)wn(f)を推定する。
A’(wn(f))=E{|yn|2(f、τ)}
=E{yn(f、τ)yn *(f、τ)}
=E{wn H(f)x(f、τ)xH(f、τ)wn(f)}
=wn H(f)Rx(f)wn(f) (6)
ここで、E{・}は時間τに関する平均操作、A*はAの複素共役、Rx(f)=E{x(f、τ)xH(f、τ)}は観測信号の相関行列、[A]Hは行列(ベクトル)Aの共役転置行列(ベクトル)を示し、yn(f、τ)は従来型ビームフォーマ6の出力であり、以下の式(7)で表すことが出来る。
yn(f、τ)=wn H(f)x(f、τ) (7)
ここで、意味のない解(wn(f)=0=[0、...、0]T)を回避するために、目的信号が無歪みで得られるという以下の式に示す拘束条件を付与する。
wn H(f)hn(f)=1 (8)
これにより、式(8)を満たし、かつ上記式(6)のA’(wn(f))の値が最小となるwn(f)の値を求める問題はLagurangeの未定乗数pを用いて、以下の式(9)で表すことができる。
A(wn(f))=A’(wn(f))+p(wn H(f)hn(f)−1) (9)
式(9)を解くことにより、従来型ビームフォーマ6は、
A ′ (w n (f)) = E {| y n | 2 (f, τ)}
= E {y n (f, τ) y n * (f, τ)}
= E {w n H (f) x (f, τ) x H (f, τ) w n (f)}
= W n H (f) R x (f) w n (f) (6)
Here, E {•} is an average operation with respect to time τ, A * is a complex conjugate of A, and R x (f) = E {x (f, τ) x H (f, τ)} is a correlation matrix of an observation signal , [A] H is a conjugate transpose matrix (vector) of the matrix (vector) A, and y n (f, τ) is an output of the conventional beamformer 6 and can be expressed by the following equation (7). .
y n (f, τ) = w n H (f) x (f, τ) (7)
Here, in order to avoid a meaningless solution (w n (f) = 0 = [0,..., 0] T ), the constraint condition shown in the following equation that the target signal can be obtained without distortion is given. Give.
w n H (f) h n (f) = 1 (8)
As a result, the problem of obtaining the value of w n (f) that satisfies equation (8) and minimizes the value of A ′ (w n (f)) in equation (6) uses Lagrange's undetermined multiplier p. And can be represented by the following formula (9).
A (w n (f)) = A ′ (w n (f)) + p (w n H (f) h n (f) −1) (9)
By solving equation (9), the conventional beamformer 6 is
従来型ビームフォーマ6(従来の適応型ビームフォーマ)では、式(10)におけるインパルス応答ベクトルhn(f)は実測してインパルス応答記憶部10に記憶させておいたインパルス応答ベクトルhn(f)を読み出して用いることが理想である。しかし、代わりに上記式(5)に示すステアリングベクトルan(f)をステアリングベクトル記憶部12に記憶させ、読み出されたステアリングベクトルan(f)を上記式(10)のインパルス応答ベクトルhn(f)の代わりに用いることが広く行われている。
In conventional beamformer 6 (conventional adaptive beamformer), the impulse response vector in equation (10) h n (f) the impulse response vector or may be stored by actually measuring the impulse response storage unit 10 h n (f ) Is ideally read and used. However, instead, the steering vector a n (f) shown in the above equation (5) is stored in the steering
しかし、実環境において、インパルス応答ベクトルhn(f)やステアリングベクトルan(f)が正しく与えられることは稀であり、上記式(9)に示すA(wn(f))の最小化が必ずしも不要信号のみの最小化にはならないことが多い。このことから、混合信号(観測信号)の相関行列Rx(f)の代わりに、不要信号のみの時間区間における信号ξ(f、τ)の相関行列RJ(f)=E{ξ(f、τ)ξH(f、τ)}を用いることが非特許文献2などで広く行われている。これは、Rx(f)を用いる場合よりも高い性能を実現することが知られている。即ち、従来型ビームフォーマにおいては、不要信号のみの時間区間(目的音不在の時間区間)における相関行列が精度よく推定できることが望ましい。 However, in a real environment, the impulse response vector h n (f) and the steering vector a n (f) is given correctly are rare, minimization of A (w n (f)) represented by the above formula (9) In many cases, however, it is not always necessary to minimize only unnecessary signals. Therefore, instead of the correlation matrix R x (f) of the mixed signal (observation signal), the correlation matrix R J (f) = E {ξ (f) of the signal ξ (f, τ) in the time interval of only the unnecessary signal. , Τ) ξ H (f, τ)} is widely used in Non-Patent Document 2 and the like. This is known to achieve higher performance than using R x (f). That is, in the conventional beamformer, it is desirable that the correlation matrix can be accurately estimated in the time section of only unnecessary signals (time section in the absence of the target sound).
従来型ビームフォーマ6は上記式(10)のwn(f)と観測信号ベクトルx(f、τ)により、上記式(7)により、出力信号ベクトルyn(f、τ)が出力される。出力信号yn(f、τ)は時間領域変換部8に入力され、周波数領域から時間領域に変換され、yn(t)が生成される。
上述の通り、従来型ビームフォーマでは目的信号源から各センサへのインパルス応答ベクトルhn(f)もしくはその近似であるステアリングベクトルan(f)が必要である。すなわち目的信号に関する事前知識が必要であるという難点がある。更にそれらは、実環境では正しく得ることが困難であり、事前知識と使用環境でのインパルス応答ベクトルhn(f)がずれてしまった場合の従来型ビームフォーマの性能は著しく低下する。
また、高い性能を得るためには、不要信号のみの時間区間における信号の相関行列RJ(f)を推定する必要があるが、不要信号が非定常な信号である場合には、それは非常に困難である。
As described above, the conventional beamformer requires the impulse response vector h n (f) from the target signal source to each sensor or the steering vector a n (f) that is an approximation thereof. That is, there is a difficulty that prior knowledge about the target signal is necessary. Furthermore, they are difficult to obtain correctly in the actual environment, and the performance of the conventional beamformer is significantly degraded when the prior knowledge and the impulse response vector h n (f) in the use environment are deviated.
Further, in order to obtain high performance, it is necessary to estimate the correlation matrix R J (f) of the signal in the time interval of only the unnecessary signal. However, when the unnecessary signal is a non-stationary signal, it is very Have difficulty.
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、上記M個のセンサで観測された観測信号を周波数領域の信号に変換し、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出し、上記正規化観測信号ベクトルを上記N個のクラスタにクラスタリングし、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定し、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算し、上記ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出し、上記抽出された上記目的信号を時間領域の信号に変換する。
In a signal extraction apparatus for observing signals emitted from N signal sources with M sensors and extracting one or more of the observed signals, where N and M are integers of 2 or more Yes, the observation signals observed by the M sensors are converted into frequency domain signals, the frequency domain signals are normalized, a normalized observation signal vector is calculated, and the normalized observation signal vector Are clustered into the N clusters,
An unnecessary signal correlation matrix that is a correlation matrix of an observation signal including only unnecessary signals is estimated from the cluster information, a beam former is calculated from the cluster information and the unnecessary signal correlation matrix, and the beam former is calculated. The target signal is extracted from the frequency domain signal, and the extracted target signal is converted into a time domain signal.
上記の構成により、事前にインパルス応答ベクトルあるいは、ステアリングベクトルを測定しておくことなく、また不要信号が非定常な信号であっても、目的信号を精度よく、分離抽出することが可能となる。 With the above configuration, it is possible to accurately extract and extract a target signal without measuring an impulse response vector or a steering vector in advance and even if an unnecessary signal is a non-stationary signal.
以下に発明を実施するための最良の形態を示す。 The best mode for carrying out the invention will be described below.
この発明の機能構成例を図3に示し、この発明の主要な処理の流れを図4に示す。図1と同一機能構成部分には同一参照符号を付け、重複説明を省略する。以下も同様とする。 An example of the functional configuration of the present invention is shown in FIG. 3, and the main processing flow of the present invention is shown in FIG. The same functional components as those in FIG. 1 are denoted by the same reference numerals, and redundant description is omitted. The same applies to the following.
また、この発明では、信号のスパース性を仮定する。スパースとは、信号が殆どの時刻τにおいて、0であることを示す。信号のスパース性は、例えば、音声信号で確認される。信号のスパース性を仮定することで、複数の源信号が存在しても、各時間周波数ポイント(f、τ)では互いに重ならず、高々1つしか存在しないと仮定することが出来る。即ち上記式(4)は以下の式で表すことができる。 In the present invention, signal sparsity is assumed. Sparse means that the signal is zero at most times τ. The sparsity of the signal is confirmed by an audio signal, for example. By assuming the sparseness of the signal, it can be assumed that even if there are a plurality of source signals, at each time frequency point (f, τ), they do not overlap each other and there is at most one. That is, the above formula (4) can be expressed by the following formula.
x(f、τ)=hn(f)sn(f、τ) (11)
ここで、hn(f)はインパルス応答ベクトル、sn(f、τ)は(f、τ)に存在する源信号を表す。
x (f, τ) = h n (f) s n (f, τ) (11)
Here, h n (f) represents an impulse response vector, and s n (f, τ) represents a source signal existing at (f, τ).
センサ4mで収音されたそれぞれの観測信号xm(t)(m=1、...M)は周波数領域変換部5に入力される。周波数領域変換部5でそれぞれの観測信号xm(t)は、例えば、公知の技術である上記の短時間フーリエ変換などで、時間領域から周波数領域に変換され、xm(f、τ)に変換される(ステップS2)。更に、xm(f、τ)は、観測信号ベクトルx(f、τ)として出力される。観測信号ベクトルx(f、τ)は正規化部22に入力され、正規化観測信号ベクトルが算出される(ステップS4)。具体的には、観測信号ベクトルx(f、τ)=[x1(f、τ)、...、xm(f、τ)]Tに対し、偏角の正規化を以下の式で行う。
x−(f、τ)←x−(f、τ)/‖x−(f、τ)‖ (13)
ここで、x−(f、τ)は正規化された観測信号ベクトルx(f、τ)を表し、arg(r)はrの偏角を表し、iは虚数単位を表し、│r│はrの絶対値を表し、‖r‖はrのノルムを表し、Qは基準とするセンサの番号(Q∈{1、...、M})を表し、cは信号の速度を表し、αは任意の正の定数を表す。αについては、α=4dmaxが最も好ましい。ただし、dmaxは、基準として選択された任意のセンサQと他のセンサとの距離の最大値を表す。また、αは他の数値でもよい。
x − (f, τ) ← x − (f, τ) / ‖x − (f, τ) ‖ (13)
Where x − (f, τ) represents the normalized observed signal vector x (f, τ), arg (r) represents the declination of r, i represents the imaginary unit, and | r | represents the absolute value of r, ‖r‖ represents the norm of r, Q represents the reference sensor number (Q∈ {1,..., M}), c represents the speed of the signal, α Represents any positive constant. For α, α = 4d max is most preferred. However, d max represents the maximum value of the distance between an arbitrary sensor Q selected as a reference and another sensor. Α may be another numerical value.
上記式(11)〜(13)より、正規化された観測信号ベクトルx−(f、τ)は以下の式で表すことができる。
ここで、An=(Σm=1 M│hmn│2)1/2であり、信号sn(f、τ)に関するインパルス応答情報にのみ依存することが分かる。
From the above equations (11) to (13), the normalized observation signal vector x − (f, τ) can be expressed by the following equation.
Here, it can be seen that A n = (Σ m = 1 M | h mn | 2 ) 1/2 and depends only on the impulse response information regarding the signal s n (f, τ).
正規化された全ての時間周波数の観測信号ベクトルx−(f、τ)はクラスタリング部24に入力され、N個のクラスタにクラスタリングされる(ステップS6)。このクラスタリングは、例えば、k−means法を用いて効果的に行うことができる。また、詳細は「R.O.Duda、P.E.Hart、and D.G.Stork,Pattern Classification,Wiley Interscience, 2nd edition,2000.」に記載されている。以下にクラスタリングの方法を具体的に説明する。
Normalized observation signal vectors x − (f, τ) of all time frequencies are input to the
記憶部26にはあらかじめ、上記式(14)で示される正規化観測信号ベクトルx−(f、τ)とセントロイドの初期値cj n(j=0、n=1、...、N)が記憶されている。
クラスタリング部24は、記憶部26から正規化観測信号ベクトルx−(f、τ)を読み込み、これらをクラスタリングしてN個のクラスタC1、...、CNを生成する。すなわち、M次元複素ベクトルである正規化された観測信号ベクトルx−(f、τ)をM次元複素空間で以下の手順で直接クラスタリングする。
In the
The
1.クラスタのセントロイドの初期値cj nを記憶部26から読み込む。セントロイドの初期値cj nは、正規化観測信号ベクトルx−(f、τ)と同じ次元のベクトル(M次元複素ベクトル)である。なお、セントロイドの初期値c0 nの選び方については後述する。
2.j+1を新たなjとする。
3.すべての時間周波数(f、τ)における正規化観測信号ベクトルx−(f、τ)を、最も近いセントロイドcj−1 nで代表されるクラスタCnに割り当てる。すなわち、各正規化ベクトルx−(f、τ)に対して、‖x−(f、τ)−cj−1 n‖が最も小さくなるようにnを選ぶ。
4.各クラスタCnに割りあてられた正規化観測信号ベクトルx−(f、τ)の平均値を計算し、そのノルムを1にすることでセントロイドを更新する。すなわち、各クラスタCnに割りあてられた正規化観測信号ベクトルx−(f、τ)に対して、
cn j=E{x(f、τ)}n/‖E{x−(f、τ)}n‖ (15)
の演算を行うことにより、セントロイドを更新する。ここで、E{・}nは、クラスタCnのメンバに対する平均操作を表す。
5.セントロイドcj nが収束するまで、手順2−5を繰り返す。最後に収束したセントロイドを、cn(n=1、...、N)として、記憶部26に記憶する。以上が、クラスタリング手順である。
1. The initial value c j n of the cluster centroid is read from the
2. Let j + 1 be a new j.
3. The normalized observation signal vector x − (f, τ) at all time frequencies (f, τ) is assigned to the cluster C n represented by the nearest centroid c j−1 n . That is, for each normalized vector x − (f, τ), n is selected such that ‖x − (f, τ) −c j−1 n ‖ is the smallest.
4). The average value of the normalized observation signal vector x − (f, τ) assigned to each cluster C n is calculated, and the centroid is updated by setting the norm to 1. That is, for the normalized observation signal vector x − (f, τ) assigned to each cluster C n ,
c n j = E {x ( f, τ)} n / ‖E {x - (f, τ)} n ‖ (15)
The centroid is updated by performing the above calculation. Here, E {·} n represents an average operation for the members of cluster C n .
5. Repeat steps 2-5 until centroid c j n converges. The finally converged centroid is stored in the
次に、セントロイドの初期値の選び方の例を説明する。
《初期値設定方法1》
正規化観測信号ベクトルx−(f、τ)の中からランダムにN個のベクトルを選び、それをセントロイドの初期値c0 n(n=1、...、N)とする。
《初期値設定方法2》
セントロイドは、式(11)〜(15)において、全てのm、nについて、│hmn(f)│=1と仮定すると、以下の式(16)のように書けるので、これを用いる。
{cn}q=E[x−(f、τ)]n
=exp[i2π(dm−dQ)Tvn/α]/M1/2
=exp[i2π‖dm−dQ‖TcosΘn mQ/α]/M1/2
(16)
ここで、dmはセンサ4mの位置ベクトルを表し、vn=cosΘn mQは、センサ4mと基準として選択したセンサ4Qを結ぶ軸に対する信号sn(t)の到来方向ベクトルを表し、図5において、太いベクトルで示されているものである。また、vnは単位ベクトルであり、‖vn‖=1である。
Next, an example of how to select the initial value of the centroid will be described.
<< Initial
N vectors are randomly selected from the normalized observation signal vector x − (f, τ), and set as the initial value c 0 n (n = 1,..., N) of the centroid.
<< Initial value setting method 2 >>
The centroid can be written as the following equation (16) assuming that | h mn (f) | = 1 for all m and n in the equations (11) to (15), and this is used.
{C n} q = E [ x - (f, τ)] n
= Exp [i2π (d m -d Q) T v n / α] /
= Exp [i2π‖d m -d Q || T cosΘ n mQ / α] /
(16)
Here, d m represents the position vector of the sensor 4 m, v n = cosΘ n mQ represents the arrival direction vector of the signal s n (t) with respect to the axis connecting the selected sensor 4Q as a
センサ位置dm(m=1、...、M)は、記憶部26において保持されている値を、方位θnと仰角φn(n=1、...、N)を適当に与える。ここで、センサ位置dm、方位θnと仰角φnは初期値であるので、適当な値で良い。例えば、θn=2πn/N、φn=0とすると、空間的に散らばった初期値が得られる。
The sensor position d m (m = 1,..., M) appropriately gives the value held in the
図3に説明を戻すと、クラスタリング部24により求まったクラスタCnは各源信号sn(f、τ)に対応している。また、そのセントロイドc− n=E{x−(f、τ)}x−(f、τ)∈Cnは上記式(14)から理解されるように、源信号sn(f、τ)に関するインパルス応答情報を表すことが分かる。
Returning to FIG. 3, the cluster C n obtained by the
各クラスタCnはそれぞれ、不要信号相関行列推定部25に入力される。不要信号相関行列推定部25では各クラスタCnごとにその情報から、源信号sn(f、τ)に対する不要信号区間の相関行列、つまり、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列Rn J(f)を以下の式(17)(18)で推定する(ステップS8)。
計算されたビームフォーマwn(f)は目的信号抽出部30に入力される。目的信号抽出部30では、ビームフォーマwn(f)を用いて、以下の式(19)を計算して、周波数領域の観測信号x(f、τ)から目的信号yn(f、τ)を抽出する(ステップS12)。
yn(f、τ)=wn(f)Hx(f、τ) (19)
式(17)〜(19)を全てのn(n=1、...、N)に対して行うことで、N個全ての信号を抽出する。yn(f、τ)は全て、時間領域変換部32に入力される。目的信号抽出部30で抽出された目的信号yn(f、τ)は、例えば公知の技術である短時間逆フーリエ変換などで時間領域の信号yn(t)に変換される(ステップS14)。
The calculated beamformer w n (f) is input to the target
y n (f, τ) = w n (f) H x (f, τ) (19)
By performing the equations (17) to (19) for all n (n = 1,..., N), all N signals are extracted. All y n (f, τ) are input to the time
次に、この発明の実施例2について説明する。実施例2は、実施例1で説明したビームフォーマ計算部28をより詳細に構成した例である。図6に実施例2のビームフォーマ計算部28とこれに関係する部分の機能構成例を示す。図6に図示されていない部分は実施例1で説明したものと同様の処理を行うものとし、以下の実施例についても同様とする。ビームフォーマ計算部28はインパルス応答推定部40と適応型ビームフォーマ計算部42とで構成されている。
Next, a second embodiment of the present invention will be described. The second embodiment is an example in which the
インパルス応答推定部40では、クラスタCnのセントロイド情報c― nから目的信号のインパルス応答ベクトルhn(f)を推定する。具体的には、クラスタリング部24よりのセントロイド情報c― nについて逆正規化を行うことで源信号sn(f、τ)に対するインパルス応答ベクトルの推定を行う。
In the impulse
まず、クラスタCnのセントロイドは上記式(15)であり、x−(f、τ)は式(14)で表すことができる。ここで、全てのm、nに対して、│hmn│=1と仮定するとセントロイドc― nのm番目の成分c― mnは、以下の式(20)が成り立つ。
図6の説明に戻ると、推定されたインパルス応答ベクトルhn(f)と、不要信号相関行列推定部25よりのRn J(f)とが、適応型ビームフォーマ計算部42に入力される。
Returning to the description of FIG. 6, the estimated impulse response vector h n (f) and R n J (f) from the unnecessary signal correlation
適応型ビームフォーマ計算部42は、インパルス応答ベクトルhn(f)と上記不要信号相関行列Rn J(f)を用いて適応型ビームフォーマwn(f)を計算する。具体的には、以下の式(22)により適応型ビームフォーマwn(f)を計算することが出来る。
上記式(22)は、上記式(10)のRx(f)をRn J(f)に置き換えることで得ることができる。
The adaptive
The above formula (22) can be obtained by replacing R x (f) in the above formula (10) with R n J (f).
目的信号抽出部30では、式(22)の適応型ビームフォーマwn(f)と、周波数領域の信号x(f、τ)とを上記式(19)に適用して、目的信号yn(f、τ)を抽出する。
The target
次に実施例2の変形例として実施例2’を示す。インパルス応答推定部40による、上記式(22)を用いたインパルス応答ベクトルhn(f)の推定を出力する代わりに、ステアリングベクトルan(f)を推定して、出力させることも考えられる。信号sn(f、τ)のステアリングベクトルを上記式(5)と同様に
an(f)=[exp(−i2πfτ1n)、・・・、exp(−i2πfτMn)]T (23)
とすると、ステアリングベクトルan(f)はインパルス応答ベクトルhn(f)の推定であるから、上記式(21)と上記式(23)の位相項を比較すると、τmn(m=1、...、M)は以下の式(24)で推定できる。
τ^mn=αc−1arg[c− mnc− Qn]/2π (24)
この式(24)の計算をインパルス応答推定部40’で行う。
Next, Example 2 ′ is shown as a modification of Example 2. According to the
Then, since the steering vector a n (f) is an estimation of the impulse response vector h n (f), when the phase terms of the equation (21) and the equation (23) are compared, τ mn (m = 1, ..., M) can be estimated by the following equation (24).
τ ^ mn = αc -1 arg [ c - mn c - Qn] / 2π (24)
The calculation of Expression (24) is performed by the impulse
τ^mnを用いたステアリングベクトルan(f)をインパルス応答ベクトルhn(f)の推定として出力する。すなわち上記式(23)(24)からステアリングベクトルan(f)は以下の式(27)で表すことができ、インパルス応答推定部40’からインパルス応答h^n(f)として出力される。
an(f)=[exp(−i2πfτ^1n)、・・・、exp(−i2πfτ^Mn)]T≒h^n(f) (25)
式(25)のh^n(f)とRn Jから、上記式(22)で適応型ビームフォーマを計算する。
The steering vector a n (f) using τ ^ mn is output as an estimate of the impulse response vector h n (f). That is, from the above equations (23) and (24), the steering vector a n (f) can be expressed by the following equation (27), and is output from the impulse
a n (f) = [exp (-i2πfτ ^ 1n), ···, exp (-i2πfτ ^ Mn)] T ≒ h ^ n (f) (25)
An adaptive beamformer is calculated by the above equation (22) from h ^ n (f) and R n J of equation (25).
また、上記式(22)を使用して不要信号相関行列推定部25で適応型ビームフォーマwn(f)を推定する際に、不要信号相関行列Rn J(f)を使用して、音響伝達特性つまり、インパルス応答ベクトルhn(f)やステアリングベクトルan(f)が既知の場合はそれらを使用しても良い。また、式(22)中の不要信号相関行列Rn J(f)の代わりに、観測信号の相関行列Rx(f)を使用しても良い。これらのことは、以下の実施例においても同様である。
In addition, when the unnecessary signal correlation
実施例2で示した適応型ビームフォーマでは、N≦Mの場合には、高い性能を得ることが出来るが、N>Mの場合には、性能が限られることが問題であった。具体的には、適応型ビームフォーマは不要信号の数がM−1個以下であれば、効果的に目的信号yn(f、τ)を抽出できるが、M個以上であると、その効果が不十分であることが知られている。そこで実施例3では、N>Mの場合、即ち、N−1(>M−1)個の不要信号がある場合にも目的信号を抽出できることを示す。実施例3の機能構成例を図7に示す。実施例3は、実施例2と比較して、不要信号選択部49、入力信号推定部50が追加され、不要信号相関行列推定部25、インパルス応答推定部40、適応型ビームフォーマ計算部42、の処理が変更されている。
In the adaptive beamformer shown in the second embodiment, high performance can be obtained when N ≦ M. However, when N> M, the performance is limited. Specifically, the adaptive beamformer can effectively extract the target signal y n (f, τ) if the number of unnecessary signals is M−1 or less. Is known to be inadequate. Therefore, the third embodiment shows that the target signal can be extracted even when N> M, that is, when there are N−1 (> M−1) unnecessary signals. A functional configuration example of the third embodiment is shown in FIG. In the third embodiment, an unnecessary
不要信号選択部49で、K個の不要信号についての不要信号相関行列Rn J(f)を推定する。ここで、Kは、K≦M−1を満たす整数とする。つまり、目的信号sn(f、τ)に相当するクラスタCn以外の不要信号に相当するクラスタCL(L=1、...、n−1、n+1、...、N)からK個のクラスタを選び、これらのクラスタをCJとする。
K個のクラスタの選び方として、クラスタCL中で、クラスタメンバが多いものから順にK個のクラスタを選ぶ方法や、以下の式(26)で表されるξL(f、τ)のパワーが大きいものから順にK個のクラスタを選ぶ方法等が考えられる。
As the choice of K clusters, in cluster C L, and a method of selecting the K clusters in order from many cluster member, the power of the following formula (26) represented by xi] L (f, tau) A method of selecting K clusters in order from the largest is conceivable.
不要信号選択部49で選択されたK個のクラスタCJを用いて、K個の不要信号についての不要信号相関行列Rn J(f)を以下の式(27)(28)で計算する。
また、入力信号推定部50において、不要信号選択部49で選択したK個の不要信号と目的信号Cnとが混合したビームフォーマ入力信号ベクトルx(f、τ)を推定する。これは、不要信号クラスタCJと目的信号クラスタCnを用いて、以下の式(29)で得ることができる。
目的信号抽出部30では、入力信号推定部50よりのビームフォーマ入力信号x(f、τ)が入力される。目的信号抽出部30では適応型ビームフォーマ計算部42よりの適応型ビームフォーマwn(f)と、ビームフォーマ入力信号ベクトルx(f、τ)を用いて、上記式(19)を計算して、目的信号yn(f、τ)を抽出する。
The target
実施例3では上述の通り、N>Mの場合を説明した。しかし、N≦Mの場合でも実施できる。この場合は、実施例2と比較して、入力信号推定部50と不要信号選択部49の処理の分だけ余計にコストがかかる。
In the third embodiment, the case where N> M is described as described above. However, it can be implemented even when N ≦ M. In this case, compared with the second embodiment, an extra cost is required for the processing of the input
実施例4は、センサの位置情報が既知の場合の実施例である。実施例4の機能構成例の一部を図8に示す。実施例2もしくは3で説明したインパルス応答推定部40は到来方向推定部60とインパルス応答計算部62により構成されている。また、M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部64を有する。
The fourth embodiment is an embodiment where the position information of the sensor is known. FIG. 8 shows a part of a functional configuration example of the fourth embodiment. The impulse
到来方向推定部60で、信号の到来方向を推定する。到来方向推定部60には、クラスタリング部24よりのセントロイド情報c− nとセンサ位置情報記憶部64よりの各センサの位置を表す3次元ベクトルdm(m=1、...、M)が入力される。信号snの到来方向を表す長さ1の3次元ベクトルをvn(n=1、...、N)とすると、信号snの到来方向の推定値はセントロイド情報c− nを用いて、以下の式(30)で計算することができる。
The arrival
vn=αD+arg[c− n]/2π (30)
ここで、D=[d1−dQ、...、dm−dQ、...、dM−dQ]Tであり、dQは基準として、任意に選択したセンサ4Qの位置を表す3次元ベクトルであり、D+は、Dの一般化逆行列を表す。
v n = αD + arg [c − n ] / 2π (30)
Here, D = [d 1 -d Q ,. . . , D m -d Q,. . . , D M −d Q ] T , where d Q is a three-dimensional vector representing the position of the sensor 4Q arbitrarily selected as a reference, and D + represents a generalized inverse matrix of D.
次にインパルス応答計算部62において、信号snの到来方向とセンサ位置情報とを用いて、インパルス応答を計算する。インパルス応答計算部62には、到来方向推定部60よりの信号snの到来方向の推定値qnと、センサ位置情報記憶部64よりのセンサ位置情報dQが入力される。インパルス応答計算部62は以下の式(31)で表す信号snについてのステアリングベクトルan^(f)の推定値を求める。このステアリングベクトルan^(f)をインパルス応答ベクトルの推定値hn(f)として計算する。
本実施例では、適応型ビームフォーマの代わりに、最大利得ビームフォーマを用いる構成を示す。最大利得ビームフォーマとは、センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にするようなフィルタwn(f)をビームフォーマとする方法である。(D.H.Johnson and D.E.Dudgeon,“Array Signal Processing Concepts and Techniques”,Prentice Hall,1993.)
最大利得ビームフォーマにおいては、センサアレイ出力中の目的信号成分と不要信号成分を推定することが1つのポイントとなるが、不要信号が非定常信号である場合、不要信号を推定することは非常に困難であるという問題があった。実施例5では、この問題をスパース性の仮定を用いることで解決する。つまり(1)目的信号のみの観測信号の相関行列である目的信号相関行列RT n(f)と、不要信号のみの観測信号の相関行列である不要信号相関行列RJ n(f)とを推定すること、(2)最大利得ビームフォーマ計算部で、目的信号相関行列RT n(f)と不要信号相関行列RJ n(f)とから最大利得ビームフォーマwn(f)を推定することにより解決することが出来る。
In this embodiment, a configuration using a maximum gain beamformer instead of the adaptive beamformer is shown. The maximum gain beamformer is a method in which a filter w n (f) that minimizes an unnecessary signal component in the sensor array output while maximizing a target signal in the sensor array output is used as a beamformer. (DH Johnson and DE Dudgeon, “Array Signal Processing Concepts and Technologies”, Prentice Hall, 1993.)
In the maximum gain beamformer, it is one point to estimate the target signal component and unnecessary signal component in the sensor array output. However, when the unnecessary signal is a non-stationary signal, it is very difficult to estimate the unnecessary signal. There was a problem that it was difficult. In the fifth embodiment, this problem is solved by using a sparsity assumption. In other words, (1) the target signal correlation matrix R T n (f) that is the correlation matrix of the observation signal only of the target signal and the unnecessary signal correlation matrix R J n (f) that is the correlation matrix of the observation signal only of the unnecessary signal (2) The maximum gain beamformer calculation unit estimates the maximum gain beamformer w n (f) from the target signal correlation matrix R T n (f) and the unnecessary signal correlation matrix R J n (f). Can be solved.
また、最大利得ビームフォーマでは「目的信号の歪みを最小にする」という上記式拘束条件(8)が無いため、各周波数fにおいて、様々な、ゲイン特性を持つビームフォーマwn(f)が構成される。これは、例えば、音声信号のような広帯域信号に最大利得ビームフォーマを適用した場合、出力がwn(f)の周波数特性により歪んでしまうことを意味する。このため、従来は最大利得ビームフォーマを広帯域信号に用いることは困難であった。実施例5では、観測信号ベクトルx(f、τ)と最大利得ビームフォーマwn(f)の出力信号との誤差が最小となるように、最大利得ビームフォーマwn(f)を補正することでこれを解決する。 Further, since the maximum gain beamformer does not have the above-mentioned constraint condition (8) of “minimizing distortion of the target signal”, beamformers w n (f) having various gain characteristics are formed at each frequency f. Is done. This means that, for example, when the maximum gain beamformer is applied to a wideband signal such as an audio signal, the output is distorted by the frequency characteristic of w n (f). For this reason, conventionally, it has been difficult to use the maximum gain beamformer for wideband signals. In the fifth embodiment, the maximum gain beamformer w n (f) is corrected so that the error between the observation signal vector x (f, τ) and the output signal of the maximum gain beamformer w n (f) is minimized. To solve this.
まず、最大利得ビームフォーマの原理を簡単に説明する。上述したように「センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にする」との条件より評価関数は以下の式(32)となる。
ここで、分母は不要信号の出力パワー、分子は目的信号の出力パワーであり、RT n(f)は目的信号のみの観測信号の相関行列、RJ n(f)は不要信号のみの観測信号の相関行列である。また、(RJ n(f))1/2=EF1/2EHで表すことが出来、ここで、E=[e1、...em]であり、eiはRJ n(f)の固有ベクトルであり、F=diag(λ1、...、λM)であり、λiはeiに対応するRJ nの固有値とし、w〜=(RJ n(f))1/2wnとすると、上記式(32)は以下の式(33)に変えることが出来る。
ここで「児玉、須田、“システム制御のためのマトリクス理論、コロナ社、1995」に記載のレイリー商の定理より、g(w〜)の最大値は、(RJ n(f))−1/2(RT n(f))(RJ n(f))−1/2の最大固有値λで与えられ、対応する固有ベクトルをeとすると、最大値はmaxg(w〜)=λ=g(e)となる。すなわち求める最大利得ビームフォーマwnは以下の式(34)(35)で表すことができる。
w〜=e (34)
wn=(RJ n(f))−1/2e (35)
実施例5の機能構成例を図9に示す。実施例1と比較して、観測信号相関行列推定部72が追加され、ビームフォーマ計算部28は、目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、補正ベクトル計算部78、補正部80、とで構成されている。
Here, from the Rayleigh quotient theorem described in “Kodama, Suda,“ Matrix Theory for System Control, Corona, 1995 ”, the maximum value of g (w − ) is (R J n (f)) −1. / 2 (R T n (f )) is given by (R J n (f)) the maximum eigenvalue of -1/2 lambda, when the corresponding eigenvectors and e, the maximum value maxg (w ~) = λ = g (E). Maximum gain beamformer w n for obtaining That can be expressed by the following equation (34) (35).
w ~ = e (34)
w n = (R J n (f)) − 1/2 e (35)
FIG. 9 shows a functional configuration example of the fifth embodiment. Compared with the first embodiment, an observation signal correlation
目的信号相関行列推定部70で、クラスタの情報から目的信号sn(f、τ)のみの時間区間の相関行列を以下の式(36)(37)で推定する。
不要信号相関行列推定部25よりのRJ n(f)と固有ベクトル計算部74よりのen(f)とが最大利得ビームフォーマ計算部76に入力される。最大利得ビームフォーマ計算部76では、以下の式(38)より最大利得ビームフォーマwn(f)を計算する。
wn(f)=(RJ n(f))−1/2en(f) (38)
この式(38)は、上記式(35)に基づいている。
R J n (f) from the unnecessary signal correlation
w n (f) = (R J n (f)) -1/2 e n (f) (38)
This equation (38) is based on the above equation (35).
一方、観測信号相関行列推定部72で、観測信号ベクトルx(f、τ)の相関行列である観測信号相関行列Rx(f)を以下の式(39)を用いて推定する。
Rx(f)=E{x(f、τ)xH(f、τ)} (39)
補正ベクトル計算部78に、最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマwn(f)と、観測信号相関行列推定部72よりの観測信号相関行列Rx(f)が入力される。補正ベクトル計算部78では、最大利得ビームフォーマwn(f)を補正するための補正ベクトルαn(f)を生成する。この補正は、最大利得ビームフォーマwn(f)が出力に与える歪みが最小になるよう最大利得ビームフォーマwn(f)を変換する。例えば、以下の式(40)であらわされる観測信号ベクトルx(f、τ)と出力信号ベクトルyn(f、τ)との誤差Aを最小にする補正ベクトルαn(f)を計算する。
A(αn(f))=E{‖x(f、τ)−αn(f)yn(f、τ)‖2} (40)
ここで、yn(f、τ)は最大利得ビームフォーマwn(f)の出力yn(f、τ)=wn(f)x(f、τ)である。
上記式(40)の右辺を展開すると、
A(αn(f))={E[‖x(f、τ)‖]}2−αn(f)E[xH(f、τ)yn(f、τ)]−αn H(f)E[yn(f、τ)*x(f、τ)]
+αnαn HE[│yn(f、τ)│2] (41)
式(41)において、両辺をαn H(f)で偏微分すると、以下の式(42)になる。
∂A(αn(f))/∂ αn H(f)=
−E[yn(f、τ)*x(f、τ)]+αnE[│yn(f、τ)│2] (42)
上記式(42)の左辺を0とおき、αnについて求めると、以下の式(43)になる。
αn(f)=E[yn(f、τ)*x(f、τ)]/E[│yn(f、τ)│2]
(43)
ここで、上記式(19)と上記式(39)より上記式(43)は以下の式(44)になる。
On the other hand, the observation signal correlation
R x (f) = E {x (f, τ) x H (f, τ)} (39)
The maximum gain beamformer w n (f) from the maximum gain
A (α n (f)) = E {‖x (f, τ) -α n (f) y n (f, τ) ‖ 2} (40)
Here, y n (f, τ) is the output y n (f, τ) = w n (f) x (f, τ) of the maximum gain beamformer w n (f).
When the right side of the above equation (40) is expanded,
A (α n (f)) = {E [‖x (f, τ) ‖]} 2 −α n (f) E [x H (f, τ) y n (f, τ)] − α n H (f) E [y n (f, τ) * x (f, τ)]
+ Α n α n H E [ │y n (f, τ) │ 2] (41)
In equation (41), when both sides are partially differentiated by α n H (f), the following equation (42) is obtained.
∂A (α n (f)) / ∂ α n H (f) =
−E [y n (f, τ) * x (f, τ)] + α n E [| y n (f, τ) | 2 ] (42)
When the left side of the equation (42) is set to 0 and α n is obtained, the following equation (43) is obtained.
α n (f) = E [y n (f, τ) * x (f, τ)] / E [| y n (f, τ) | 2 ]
(43)
Here, from the above equation (19) and the above equation (39), the above equation (43) becomes the following equation (44).
補正部80は、最大利得ビームフォーマwn(f)に対し、補正ベクトルαn(f)を用いて、周波数歪みを補正し、補正ビームフォーマを計算する。具体的には以下の式(45)により補正して補正ビームフォーマwn’(f)を求めることが出来る。
wn’(f)=[αn(f)]Bwn(f) (45)
ここで、Bは任意のセンサの番号であり、B∈{1、...、M}であり、[q]BはベクトルqのB番目の要素であることを示している。
The
w n ′ (f) = [α n (f)] B w n (f) (45)
Here, B is the number of an arbitrary sensor, and Bε {1,. . . , M}, and [q] B indicates the Bth element of the vector q.
目的信号抽出部30では、補正ビームフォーマwn’(f)を用いて、以下の式(46)で目的信号yn(f、τ)を抽出する。
yn(f、τ)=wn’H(f)x(f、τ) (46)
また、実施例5の変形例の機能構成例を図10に示す。ビームフォーマ計算部28は目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、とで構成され、目的信号抽出部30は信号抽出部81と歪み補正部82とで構成されている。
The target
y n (f, τ) = w n ′ H (f) x (f, τ) (46)
FIG. 10 shows a functional configuration example of a modification of the fifth embodiment. The
最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマwn(f)と、周波数領域変換部5よりの観測信号ベクトルx(f、τ)とは、信号抽出部81に入力される。信号抽出部81では、以下の式(47)を計算して、歪みを含んだ目的信号yn(f、τ)を抽出する。
yn(f、τ)=wn H(f)x(f、τ) (47)
歪みを含んだ目的信号yn(f、τ)は歪み補正部82に入力される。
また、補正ベクトル計算部78よりの補正ベクトルαn(f)も歪み補正部82に入力される。歪み補正部82では、以下の式(48)で出力信号を変換することで、歪みを補正して補正出力信号yn’(f、τ)を出力する。
yn’(f、τ)=[αn(f)]Byn(f、τ) (48)
なお、以上で説明した実施例1〜5では、全てのnについて信号を抽出するとしてきたが、単独の信号(1つのn)についてのみ、ビームフォーマを構成するだけでもよい。目的信号の選択については、例えば、データベース上の目的信号のインパルス応答ベクトルhdと発明法により全ての音源nについて推定されたインパルス応答ベクトルhnを比較して、最もhdに近いhnを持つ音源nを選ぶことで選択できる。例えば、minn(h1・hn)などのアルゴリズムが考えられる。選ばれたnについてのみ実施例2〜5で説明したビームフォーマ計算部28による上記式(24)などを用いたビームフォーマを構成すれば、目的信号についての適応型ビームフォーマを得ることができる。
The maximum gain beamformer w n (f) from the maximum gain
y n (f, τ) = w n H (f) x (f, τ) (47)
The target signal y n (f, τ) including distortion is input to the
The correction vector α n (f) from the correction
y n '(f, τ) = [α n (f)] B y n (f, τ) (48)
In the first to fifth embodiments described above, signals are extracted for all n. However, a beam former may be configured only for a single signal (one n). For purposes signal selection, for example, by comparing the impulse response vector h n, which is estimated for all the sound sources n by the impulse response vector h d and invention method object signal on the database, the h n closest to the h d The sound source n can be selected by selecting it. For example, an algorithm such as min n (h 1 · h n ) is conceivable. An adaptive beamformer for a target signal can be obtained by configuring a beamformer using the above formula (24) by the
[実験結果]
上記実施例の効果を示すために、実験を行った。図11に示す部屋で測定したインパルス応答を複数の音声に畳み込み混合することで、混合信号を模した。実験条件は図11に示す通りである。長辺が880cm、短辺が375cm、高さが240cm、残響は120msの室内において、底面の長辺から200cm、短辺から282cmの位置に3つのセンサ41、42、43を配置した。長辺と平行軸をx、短辺と平行軸をyとし、図12に示すように、3つのセンサ41、42、43をy軸上に2個、x軸上に1個、辺の長さ4cmの正三角形の頂点につまり2次元に配した場合の実験を行う。またセンサとしてはマイクロホンを用いた。
4通りの音声組み合わせについて、信号対不要信号比(SIR)と信号対歪み比(SDR)を評価した。なお、単位はdBである。
[Experimental result]
Experiments were conducted to show the effects of the above examples. The impulse response measured in the room shown in FIG. 11 was convolved with a plurality of sounds and mixed to simulate the mixed signal. The experimental conditions are as shown in FIG. Three
The signal-to-unnecessary signal ratio (SIR) and the signal-to-distortion ratio (SDR) were evaluated for four voice combinations. The unit is dB.
4つの音源をセンサ位置におけるx軸とy軸の交点を中心とし、x軸の+方向を0度とし、左回りに30度、315度方向とセンサ位置を中心と半径50cmの円との各交差点上にそれぞれの音源を、225度、315度の方向と半径80cmの円との交差点上に、それぞれ音源を配置させる。実施例2の効果を確かめる実験では、120度、225度、315度方向の音源を用い、N(源信号の数)=M(センサの数)=3とした。また実施例3の効果を確かめる実験ではN=4、M=3とした。 Each of the four sound sources is centered on the intersection of the x-axis and y-axis at the sensor position, the + direction of the x-axis is 0 degree, 30 degrees counterclockwise, 315 degrees, and the sensor position is centered on a circle with a radius of 50 cm. Each sound source is arranged on the intersection, and the sound source is arranged on the intersection between the directions of 225 degrees and 315 degrees and a circle having a radius of 80 cm. In the experiment for confirming the effect of the second embodiment, sound sources with directions of 120 degrees, 225 degrees, and 315 degrees were used, and N (number of source signals) = M (number of sensors) = 3. In an experiment for confirming the effect of Example 3, N = 4 and M = 3.
図13にこの実験の結果を示す。実施例3は従来法、実施例2、実施例2’、実施例4、実施例5において、図7記載の入力信号推定部50を設けた場合を示す。従来法では、図1記載の適応型ビームフォーマ6を表す上記式(10)において、hn(f)に既知のステアリングベクトルan(f)を与えたものを用いた。この場合、N=Mの場合も、N>Mの場合も、共に高い性能を得られなかった。これは、残響のある環境での実験であるため、与えられたステアリングベクトルan(f)が残響の影響まで、考慮できなかったことが主な原因として考えられる。また、N>Mの場合に十分なSIRが得られないのは、適応型ビームフォーマの限界つまりM−1個の不要信号しか効果的に抑圧できないことを示している。
FIG. 13 shows the results of this experiment. The third embodiment shows a case where the input
従来法に対し、N=Mの場合、N>Mの場合であっても、上記実施例はSIR、SDRの値を比較すると、従来法よりも高い性能を持つことが理解される。 Compared to the conventional method, even when N = M and N> M, it is understood that the above embodiment has higher performance than the conventional method when comparing the values of SIR and SDR.
以上の各実施形態の他、本発明であるブラインド信号抽出装置は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、ブラインド信号抽出装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。 In addition to the above embodiments, the blind signal extraction device according to the present invention is not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. Further, the processing described in the blind signal extraction device is not only executed in time series according to the order of description, but may also be executed in parallel or individually as required by the processing capability of the device that executes the processing. Good.
また、この発明のブラインド信号抽出装置における処理をコンピュータによって実現する場合、ブラインド信号抽出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、ブラインド信号抽出装置における処理機能がコンピュータ上で実現される。 Further, when the processing in the blind signal extraction device of the present invention is realized by a computer, the processing contents of the functions that the blind signal extraction device should have are described by a program. Then, by executing this program on a computer, the processing function of the blind signal extraction device is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto−Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable−Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape, and the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable-Programmable-Ready), etc. Can be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. A configuration in which the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes a processing function only by an execution instruction and result acquisition without transferring a program from the server computer to the computer. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ブラインド信号抽出装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, the blind signal extraction apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
この発明は、オーディオ分野の応用として、音声認識機の入力マイクロホンと話者が離れた位置にあるためマイクロホンが目的話者音声以外の音まで収音してしまうような状況でも、目的音声を分離抽出することで、認識率の高い音声認識系の構築が可能になる。 As an application in the audio field, the present invention separates target voices even in situations where the microphone picks up sounds other than the target speaker voice because the input microphone of the voice recognizer and the speaker are separated from each other. By extracting, it is possible to construct a speech recognition system with a high recognition rate.
Claims (14)
上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換部と、
上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化部と、
上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング部と、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定部と、
上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算部と、
上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出部と、
上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換部と、を具備することを特徴とするブラインド信号抽出装置。 In a signal extraction apparatus for observing signals emitted from N signal sources with M sensors and extracting one or more of the observed signals, where N and M are integers of 2 or more Yes,
A frequency domain conversion unit that converts observation signals observed by the M sensors into a frequency domain signal;
A normalization unit that normalizes the frequency domain signal and calculates a normalized observation signal vector;
A clustering unit for clustering the normalized observation signal vector into N clusters;
An unnecessary signal correlation matrix estimation unit that estimates an unnecessary signal correlation matrix that is a correlation matrix of an observation signal including only unnecessary signals from the information of the cluster,
A beamformer calculation unit for calculating a beamformer from the information on the cluster and the unnecessary signal correlation matrix;
A target signal extraction unit that extracts a target signal from the frequency domain signal using the beamformer;
A blind signal extraction apparatus comprising: a time domain conversion unit that converts the extracted target signal into a time domain signal.
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。 The blind signal extraction device according to claim 1,
The beamformer calculation unit
An impulse response estimator for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculation unit that calculates an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix,
The blind signal extraction apparatus, wherein the target signal extraction unit extracts the target signal from the frequency domain signal using the adaptive beamformer.
上記不要信号相関行列推定部は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定するものであり、ただし、KはK≦M−1を満たす整数であり、
更に、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定部を有し、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。 The blind signal extraction device according to claim 1,
The unnecessary signal correlation matrix estimation unit estimates an unnecessary signal correlation matrix that is a correlation matrix of K unnecessary signals selected from the cluster information, where K is an integer that satisfies K ≦ M−1. And
And an input signal estimation unit for estimating a beamformer input signal including only the target signal and the selected K unnecessary signals from the cluster information,
The beamformer calculation unit
An impulse response estimator for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculation unit that calculates an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix, and
The blind signal extraction apparatus, wherein the target signal extraction unit extracts the target signal from the beamformer input signal using the adaptive beamformer.
更に、上記M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部を備え、
上記インパルス応答推定部は、
上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定部と、
上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算部と、で構成されていることを特徴とするブラインド信号抽出装置。 The blind signal extraction device according to claim 2 or 3,
Furthermore, a sensor position information storage unit storing sensor position information representing the positions of the M sensors is provided,
The impulse response estimator is
A direction-of-arrival estimation unit that estimates a direction of arrival of a signal using the sensor position information and the centroid information of the cluster;
A blind signal extraction device comprising: an estimated response arrival direction; and an impulse response calculation unit that calculates an impulse response from the sensor position information.
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部と、
上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正部と、を具備し、
上記目的信号抽出部は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出するものである、
ことを特徴とするブラインド信号抽出装置。 The blind signal extraction device according to claim 1,
Furthermore, an observation signal correlation matrix estimation unit for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal is provided,
The beamformer calculation unit
A target signal correlation matrix estimator for estimating a target signal correlation matrix that is a correlation matrix of an observation signal including the target signal from the cluster information;
A maximum gain beamformer calculation unit for calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
A correction unit that corrects frequency distortion using the observed signal correlation matrix and calculates a corrected beamformer for the maximum gain beamformer, and
The target signal extraction unit extracts the target signal from the frequency domain signal using the correction beamformer.
A blind signal extraction device characterized by that.
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部とを具備し、
上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算部を備え、
上記目的信号抽出部は、
上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出部と、
上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正部とを具備する
ことを特徴とするブラインド信号抽出装置。 The blind signal extraction device according to claim 1,
Furthermore, an observation signal correlation matrix estimation unit for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal is provided,
The beamformer calculation unit
A target signal correlation matrix estimator for estimating a target signal correlation matrix that is a correlation matrix of an observation signal including the target signal from the cluster information;
A maximum gain beamformer calculation unit for calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
A correction vector calculation unit that calculates a correction vector using the observed signal correlation matrix and the maximum gain beamformer,
The target signal extraction unit
A signal extraction unit that extracts a target signal including distortion from the frequency domain signal using the maximum beamformer;
A blind signal extraction apparatus comprising: a distortion correction unit that performs distortion correction on the target signal including the extracted distortion using the correction vector and outputs the target signal.
周波数領域変換手段が、上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換過程と、
正規化手段が、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化過程と、
クラスタリング手段が、上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング過程と、
不要信号相関行列推定過程が、上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定過程と、
ビームフォーマ計算手段が、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算過程と、
目的信号抽出手段が、上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出過程と、
時間領域変換手段が、上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換過程と、を有することを特徴とするブラインド信号抽出方法。 In a signal extraction method of observing signals emitted from N signal sources with M sensors and extracting one or more signals from the observed signals, N and M are integers of 2 or more. Yes,
A frequency domain transforming process in which the frequency domain transforming means transforms the observation signals observed by the M sensors into signals in the frequency domain;
A normalization process in which the normalization means normalizes the frequency domain signal and calculates a normalized observation signal vector;
A clustering process in which the clustering means clusters the normalized observation signal vector into N clusters;
An unnecessary signal correlation matrix estimation process is an unnecessary signal correlation matrix estimation process for estimating an unnecessary signal correlation matrix that is a correlation matrix of an observation signal including only an unnecessary signal from the information of the cluster,
A beamformer calculating means for calculating a beamformer from the cluster information and the unnecessary signal correlation matrix;
A target signal extraction means for extracting a target signal from the frequency domain signal using the beam former;
A blind signal extraction method comprising: a time domain conversion process in which time domain conversion means converts the extracted target signal into a time domain signal.
上記ビームフォーマ計算過程は、
インパルス応答推定手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算過程と、を有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。 The blind signal extraction method according to claim 7,
The beamformer calculation process is as follows:
An impulse response estimation means for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculation means comprising: an adaptive beamformer calculation process for calculating an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix;
The blind signal extraction method, wherein the target signal extraction step is a step of extracting the target signal from the frequency domain signal using the adaptive beamformer.
上記不要信号相関行列推定過程は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定する過程であり、ただし、KはK≦M−1を満たす整数であり、
更に、入力信号推定手段が、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定過程を有し、
上記ビームフォーマ計算過程は、
インパルス応答手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算過程とを有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。 The blind signal extraction method according to claim 7,
The unnecessary signal correlation matrix estimation process is a process of estimating an unnecessary signal correlation matrix that is a correlation matrix of K unnecessary signals selected from the cluster information, where K is an integer satisfying K ≦ M−1. And
Further, the input signal estimation means has an input signal estimation process for estimating a beamformer input signal including only the target signal and the selected K unnecessary signals from the cluster information,
The beamformer calculation process is as follows:
An impulse response means for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculating means includes an adaptive beamformer calculating step of calculating an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix;
The blind signal extraction method, wherein the target signal extraction step is a step of extracting a target signal from the beamformer input signal using the adaptive beamformer.
上記インパルス応答推定過程は、
到来方向推定手段が、センサ位置情報記憶部中の上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定過程と、ここで、センサ位置情報記憶部とは、上記M個のセンサの位置を表すセンサ位置情報を記憶しているものであり、
インパルス応答計算手段が、上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算過程と、を有することを特徴とするブラインド信号抽出方法。 A blind signal extraction method according to claim 8 or 9, wherein
The impulse response estimation process is as follows:
An arrival direction estimation unit in which an arrival direction estimation unit estimates an arrival direction of a signal using the sensor position information in the sensor position information storage unit and the centroid information of the cluster, and here, a sensor position information storage unit Is stored sensor position information indicating the positions of the M sensors.
A blind signal extraction method, wherein the impulse response calculation means includes an impulse response calculation step of calculating an impulse response from the estimated arrival direction of the signal and the sensor position information.
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程と、
補正手段が、上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正過程と、を有し、
上記目的信号抽出過程は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する過程である、
ことを特徴とするブラインド信号抽出方法。 The blind signal extraction method according to claim 7,
Further, the observation signal correlation matrix estimation means includes an observation signal correlation matrix estimation process for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal,
The beamformer calculation process is as follows:
A target signal correlation matrix estimation means for estimating a target signal correlation matrix, which is a correlation matrix of an observation signal including the target signal, from the cluster information;
A maximum gain beamformer calculating means for calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
A correcting means for correcting the frequency distortion using the observed signal correlation matrix for the maximum gain beamformer and calculating a corrected beamformer, and
The target signal extraction process is a process of extracting a target signal from the frequency domain signal using the correction beamformer.
And a blind signal extraction method.
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程とを有し、
更に、補正ベクトル計算手段が、上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算過程を有し、
上記目的信号抽出過程は、
信号抽出手段が、上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出過程と、
歪み補正手段が、上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正過程とを有する
ことを特徴とするブラインド信号抽出方法。 The blind signal extraction method according to claim 7,
Further, the observation signal correlation matrix estimation means includes an observation signal correlation matrix estimation process for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal,
The beamformer calculation process is as follows:
A target signal correlation matrix estimation means for estimating a target signal correlation matrix, which is a correlation matrix of an observation signal including the target signal, from the cluster information;
A maximum gain beamformer calculating means includes a maximum gain beamformer calculating step of calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
Further, the correction vector calculation means has a correction vector calculation step of calculating a correction vector using the observed signal correlation matrix and the maximum gain beamformer,
The target signal extraction process is as follows:
A signal extraction process in which a signal extraction means extracts a target signal including distortion from the frequency domain signal using the maximum beamformer;
A blind signal extraction comprising: a distortion correction process, wherein distortion correction means performs distortion correction on the target signal including the extracted distortion by using the correction vector, and outputs the target signal. Method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006231648A JP4738284B2 (en) | 2006-08-29 | 2006-08-29 | Blind signal extraction device, method thereof, program thereof, and recording medium recording the program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006231648A JP4738284B2 (en) | 2006-08-29 | 2006-08-29 | Blind signal extraction device, method thereof, program thereof, and recording medium recording the program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008060635A true JP2008060635A (en) | 2008-03-13 |
JP4738284B2 JP4738284B2 (en) | 2011-08-03 |
Family
ID=39242931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006231648A Expired - Fee Related JP4738284B2 (en) | 2006-08-29 | 2006-08-29 | Blind signal extraction device, method thereof, program thereof, and recording medium recording the program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4738284B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010181467A (en) * | 2009-02-03 | 2010-08-19 | Nippon Telegr & Teleph Corp <Ntt> | A plurality of signals emphasizing device and method and program therefor |
JP2016122111A (en) * | 2014-12-25 | 2016-07-07 | 日本電信電話株式会社 | Filter coefficient calculation device, voice reproducer, filter coefficient calculation method and program |
JP2018141922A (en) * | 2017-02-28 | 2018-09-13 | 日本電信電話株式会社 | Steering vector estimation device, steering vector estimating method and steering vector estimation program |
US20220383106A1 (en) * | 2019-06-20 | 2022-12-01 | Nippon Telegraph And Telephone Corporation | Training data extension apparatus, training data extension method, and program |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09251299A (en) * | 1996-03-15 | 1997-09-22 | Toshiba Corp | Microphone array input type voice recognition device and its method |
-
2006
- 2006-08-29 JP JP2006231648A patent/JP4738284B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09251299A (en) * | 1996-03-15 | 1997-09-22 | Toshiba Corp | Microphone array input type voice recognition device and its method |
Non-Patent Citations (1)
Title |
---|
JPN6011005009, Araki S. ,Sawada H. ,Mukai R. ,Makino S., "Doa Estimation for Multiple Sparse Sources with Normalized Observation Vector Clustering", 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, 200603, ICASSP2006, V−33〜V−36, US, IEEE * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010181467A (en) * | 2009-02-03 | 2010-08-19 | Nippon Telegr & Teleph Corp <Ntt> | A plurality of signals emphasizing device and method and program therefor |
JP2016122111A (en) * | 2014-12-25 | 2016-07-07 | 日本電信電話株式会社 | Filter coefficient calculation device, voice reproducer, filter coefficient calculation method and program |
JP2018141922A (en) * | 2017-02-28 | 2018-09-13 | 日本電信電話株式会社 | Steering vector estimation device, steering vector estimating method and steering vector estimation program |
US20220383106A1 (en) * | 2019-06-20 | 2022-12-01 | Nippon Telegraph And Telephone Corporation | Training data extension apparatus, training data extension method, and program |
US11886996B2 (en) * | 2019-06-20 | 2024-01-30 | Nippon Telegraph And Telephone Corporation | Training data extension apparatus, training data extension method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP4738284B2 (en) | 2011-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7626889B2 (en) | Sensor array post-filter for tracking spatial distributions of signals and noise | |
CN105981404B (en) | Use the extraction of the reverberation sound of microphone array | |
EP1856948B1 (en) | Position-independent microphone system | |
KR102087307B1 (en) | Method and apparatus for estimating direction of ensemble sound source based on deepening neural network for estimating direction of sound source robust to reverberation environment | |
JPWO2006085537A1 (en) | Signal separation device, signal separation method, signal separation program, and recording medium | |
JP2010519602A (en) | System, method and apparatus for signal separation | |
JP2008079256A (en) | Acoustic signal processing apparatus, acoustic signal processing method, and program | |
US20140078867A1 (en) | Sound direction estimation device, sound direction estimation method, and sound direction estimation program | |
JP7235534B2 (en) | Microphone array position estimation device, microphone array position estimation method, and program | |
CN113126028B (en) | Noise source positioning method based on multiple microphone arrays | |
WO2020079957A1 (en) | Audio signal processing device and noise suppression method | |
JP5911101B2 (en) | Acoustic signal analyzing apparatus, method, and program | |
JP4738284B2 (en) | Blind signal extraction device, method thereof, program thereof, and recording medium recording the program | |
Diaz-Guerra et al. | Direction of arrival estimation of sound sources using icosahedral CNNs | |
JP6538624B2 (en) | Signal processing apparatus, signal processing method and signal processing program | |
JP4676893B2 (en) | Signal arrival direction estimation device, signal arrival direction estimation method, signal arrival direction estimation program, and recording medium | |
US11482239B2 (en) | Joint source localization and separation method for acoustic sources | |
Salvati et al. | Acoustic source localization using a geometrically sampled grid SRP-PHAT algorithm with max-pooling operation | |
JP6182169B2 (en) | Sound collecting apparatus, method and program thereof | |
JP4630203B2 (en) | Signal separation device, signal separation method, signal separation program and recording medium, signal arrival direction estimation device, signal arrival direction estimation method, signal arrival direction estimation program and recording medium | |
Bu et al. | TDOA estimation of speech source in noisy reverberant environments | |
JP2018077139A (en) | Sound field estimation device, sound field estimation method and program | |
JP2004279845A (en) | Signal separating method and its device | |
JP7207539B2 (en) | LEARNING DATA EXTENSION DEVICE, LEARNING DATA EXTENSION METHOD, AND PROGRAM | |
Ke et al. | Compressing sensing based source localization for controlled acoustic signals using distributed microphone arrays |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110419 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4738284 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |