JP2008060635A - Blind signal extracting device, method thereof, program thereof, and recording medium stored with this program - Google Patents

Blind signal extracting device, method thereof, program thereof, and recording medium stored with this program Download PDF

Info

Publication number
JP2008060635A
JP2008060635A JP2006231648A JP2006231648A JP2008060635A JP 2008060635 A JP2008060635 A JP 2008060635A JP 2006231648 A JP2006231648 A JP 2006231648A JP 2006231648 A JP2006231648 A JP 2006231648A JP 2008060635 A JP2008060635 A JP 2008060635A
Authority
JP
Japan
Prior art keywords
signal
correlation matrix
beamformer
target
observation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006231648A
Other languages
Japanese (ja)
Other versions
JP4738284B2 (en
Inventor
Akiko Araki
章子 荒木
Hiroshi Sawada
宏 澤田
Shoji Makino
昭二 牧野
Cermak Jan
チェルマーク ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006231648A priority Critical patent/JP4738284B2/en
Publication of JP2008060635A publication Critical patent/JP2008060635A/en
Application granted granted Critical
Publication of JP4738284B2 publication Critical patent/JP4738284B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To extract a target signal from a mixed signal using a beam former even if a user does not have prior knowledge of an impulse response vector of the target signal. <P>SOLUTION: In observing signals emitted from N-sets of signal sources using M-sets of sensors 4m to extract one signal or more (where N, M are each an integer of not less than 2), the observation signal x<SB>m</SB>(t) observed with the sensor 4m is converted into a signal x<SB>n</SB>(f, τ) of a frequency region (5), x<SB>n</SB>(f, τ) is normalized (22), the normalized x<SB>n</SB>(f, τ) is clustered to N-cluster C<SB>n</SB>(24), a correlation matrix R<SP>n</SP><SB>J</SB>(f) of the observation signal including only the unwanted signal is estimated from the C<SB>n</SB>(25), the beam former w<SB>n</SB>(f) is calculated from the cluster information C<SB>n</SB>and the R<SP>n</SP><SB>J</SB>(f) (28), a target signal y<SB>n</SB>(f, τ) is extracted from x<SB>n</SB>(f, τ) using the w<SB>n</SB>(f) (30), and the y<SB>n</SB>(f, τ) is converted into a signal of a time region (32). <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

この発明は、必要である源信号(目的信号)のみを直接観測することが出来ず、目的信号に他のノイズ、干渉信号などが重畳されて観測されるという状況において目的信号を推定して抽出するブラインド信号抽出装置、方法、プログラム、および記録媒体に関するものである。     In the present invention, it is not possible to directly observe only a necessary source signal (target signal), but the target signal is estimated and extracted in a situation where other noise, interference signal, etc. are observed superimposed on the target signal. The present invention relates to a blind signal extraction device, a method, a program, and a recording medium.

ここでは、まず観測信号のモデル化と信号の周波数領域の定義を行い、次に従来技術について簡単に述べる。
[観測信号]
全ての信号はあるサンプリング周波数fでサンプリングされ、離散的に表現されるものとする。N個(Nは2以上の整数)の源信号が混合されて、M個(Mは2以上の整数)のセンサで観測されたとする。この発明は、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより、信号が反射するなどして伝送路歪みが発生しうる状況を扱う。このような状況では、複数の信号源からの源信号s(t)(n=1、...、N)が複数のセンサで観測信号x(t)(m=1、...、M)として観測され、各信号源nからセンサmまでのインパルス応答をhmn(u)(uは時間を表す)とする。センサmでの観測信号x(t)は各源信号s(t)に対し、対応するインパルス応答hmn(u)が畳込み混合され、次式で表される。
(t)=Σn=1 Σu=0 mn(u)s(t−u) (1)
ここでは、源信号s(t)、...、s(t)やインパルス応答h11(u)、...、h1N(u)、...、hM1(u)、...、hMN(u)についての情報を事前に得られない状況を考える。この状況で、観測信号x(t)、...、x(t)のみを用いて源信号s(t)、...、s(t)を分離抽出することがこの発明の広義の目的である。
[周波数領域表現]
この発明では、周波数領域において、各操作を行う。そのため、センサでの観測信号x(t)にL点(Lは任意の整数)に、公知の技術である例えば、短時間フーリエ変換を適用して周波数ごとの時間系列
(f、τ)=Σu=-L/2 L/2-1(τ+u)g(u)e−i2πfu (2)
を求める。ここで、fは周波数であり、f=0、f/L、...、f(L−1)/Lと離散化されており、τは任意の時間であり、上述の通り、fはサンプリング周波数である。g(u)は例えばハニング窓などの窓関数である。
Here, the observation signal is first modeled and the frequency domain of the signal is defined, and then the prior art is briefly described.
[Observation signal]
All signals are sampled at a certain sampling frequency f s and expressed discretely. It is assumed that N (N is an integer of 2 or more) source signals are mixed and observed by M (M is an integer of 2 or more) sensors. The present invention deals with a situation in which a signal is attenuated / delayed depending on a distance from a signal generation source to a sensor, or a signal is reflected by a wall or the like, thereby causing transmission path distortion. In such a situation, the source signals s n (t) (n = 1,..., N) from a plurality of signal sources are observed by a plurality of sensors to be observed signals x m (t) (m = 1,. , M), and the impulse response from each signal source n to sensor m is h mn (u) (u represents time). The observation signal x m (t) at the sensor m is convolutionally mixed with the corresponding impulse response h mn (u) for each source signal s n (t), and is expressed by the following equation.
x m (t) = Σ n = 1 N Σ u = 0 h mn (u) s n (tu) (1)
Here, the source signals s 1 (t),. . . , S N (t) and impulse response h 11 (u),. . . , H 1N (u),. . . , H M1 (u),. . . Consider a situation where information about h MN (u) cannot be obtained in advance. In this situation, the observation signals x 1 (t),. . . , X M (t) only and source signals s 1 (t),. . . , S N (t) is a broad object of this invention.
[Frequency domain expression]
In the present invention, each operation is performed in the frequency domain. Therefore, a time series x m (f, τ) for each frequency by applying a short-time Fourier transform, for example, a known technique to the L point (L is an arbitrary integer) on the observation signal x m (t) of the sensor. ) = Σ u = −L / 2 L / 2-1 x m (τ + u) g (u) e −i2πfu (2)
Ask for. Where f is the frequency, f = 0, f s / L,. . . , F s (L−1) / L, and τ is an arbitrary time, and as described above, f s is a sampling frequency. g (u) is a window function such as a Hanning window.

式(1)で示される時間領域での畳み込み混合は、周波数領域では、
(f、τ)=Σn=1 mn(f)s(f、τ) (3)
と各周波数での単純混合に近似表現される。ここで、hmn(f)は信号源nからセンサmまでの周波数成分fについての周波数応答(インパルス応答)、s(f、τ)は式(2)と同様の式に従って、源信号s(t)に短時間フーリエ変換を施したものであり、以下も同様とする。センサ1〜Mの観測信号x(f、τ)、...、x(f、τ)を式(3)を用いて、ベクトルで表記すると、
x(f、τ)=Σn=1 (f)s(f、τ) (4)
となる。ここで、x(f、τ)は、x(f、τ)=[x(f、τ)、...、x(f、τ)、...、x(f、τ)]となる観測信号ベクトルであり、h(f)は、h(f)=[h1n(f)、...、hmn(f)、...、hMn(f)]であり、信号源から各センサへの周波数応答をまとめたベクトルである。また、[A]はベクトルAの転置ベクトルを示す。以下の説明も同様とする。
[代表的な従来技術]
混合信号から目的とする信号を抽出する代表的な信号抽出手法として、適応型ビームフォーマ(adaptive beamformer:ABF)が非特許文献1等に記載され、広く知られている。
In the frequency domain, the convolutional mixing in the time domain expressed by Equation (1) is
x m (f, τ) = Σ n = 1 N h mn (f) s n (f, τ) (3)
And an approximate representation of simple mixing at each frequency. Here, h mn (f) is a frequency response (impulse response) for the frequency component f from the signal source n to the sensor m, and s n (f, τ) is a source signal s according to an equation similar to equation (2). n (t) is subjected to a short-time Fourier transform, and so on. Observation signals x 1 (f, τ),. . . , X M (f, τ) as a vector using equation (3),
x (f, τ) = Σ n = 1 N h n (f) s n (f, τ) (4)
It becomes. Here, x (f, τ) is x (f, τ) = [x 1 (f, τ),. . . , X m (f, τ),. . . , X M (f, τ)] is an observed signal vector T , and h n (f) is h n (f) = [h 1n (f),. . . , H mn (f),. . . , H Mn (f)] T , a vector summarizing the frequency response from the signal source to each sensor. [A] T indicates a transposed vector of the vector A. The same applies to the following description.
[Representative conventional technology]
As a typical signal extraction method for extracting a target signal from a mixed signal, an adaptive beamformer (ABF) is described in Non-Patent Document 1 and widely known.

従来の適応型ビームフォーマ(以下、従来型ビームフォーマという)の機能構成例を図1に示す。複数のセンサ4mで観測された信号x(t)が周波数領域変換部5に入力される。周波数領域変換部5で信号x(t)が周波数領域信号x(f、τ)に変換される。x(f、τ)(m=1、...、M)は全て従来型ビームフォーマ6へ入力される。 An example of the functional configuration of a conventional adaptive beamformer (hereinafter referred to as a conventional beamformer) is shown in FIG. Signals x m (t) observed by the plurality of sensors 4 m are input to the frequency domain transform unit 5. The signal x m (t) is converted into the frequency domain signal x m (f, τ) by the frequency domain converter 5. x m (f, τ) (m = 1,..., M) are all input to the conventional beamformer 6.

従来型ビームフォーマ6は複数のセンサを用いたシステムにおいて、目的信号s(t)を強調し、不要信号s(t)、...、sn−1(t)、...、sn+1(t)、...、s(t)をできるだけ抑圧するフィルタw(f)=[w1n(f)、...、wmn(f)、...、wMn(f)]を推定することで実現される。 The conventional beamformer 6 emphasizes the target signal s n (t) in the system using a plurality of sensors, and unnecessary signals s 1 (t),. . . , S n-1 (t),. . . , S n + 1 (t),. . . , S N (t) as much as possible filter w n (f) = [w 1n (f),. . . , W mn (f),. . . , W Mn (f)] T is realized.

従来型ビームフォーマ6を設計する際には、「目的信号発生源から各センサへのインパルス応答ベクトルh(f)もしくは、その近似であるステアリングベクトル
(f)=[exp(−i2πfτ1n),…,exp(−i2πfτMn)] (5)
が既知である」ということを仮定する。ここでτmnは信号源nがセンサmに達する時刻と原点0に達する時間差である。従来は、図2に示すように直線状に配置したセンサシステムを用いることが多く、信号源nの方向をθ、センサ4mのセンサ41を基準とした座標dとすると、上述のτmnは、τmn=dcosθ/cで与えられる。ここでcは信号の速度である。
When designing the conventional beamformer 6, "impulse response vector h n (f) from the target signal source to each sensor or a steering vector a n is the approximation (f) = [exp (-i2πfτ 1n , ..., exp (-i2πfτ Mn )] T (5)
Is known ". Here, τ mn is the difference between the time when the signal source n reaches the sensor m and the time when it reaches the origin 0. Conventionally, often using a sensor system arranged in a straight line as shown in FIG. 2, n the direction of the signal source n theta, when the sensor 41 of the sensor 4m and coordinates d m on the basis of above tau mn Is given by τ mn = d m cos θ n / c. Where c is the speed of the signal.

図1に説明を戻すと、不要信号を抑圧する従来型ビームフォーマ6として、以下の式で表される出力パワーA’(w(f))を最小にするフィルタ群(ベクトル)w(f)を推定する。
A’(w(f))=E{|y(f、τ)}
=E{y(f、τ)y (f、τ)}
=E{w (f)x(f、τ)x(f、τ)w(f)}
=w (f)R(f)w(f) (6)
ここで、E{・}は時間τに関する平均操作、AはAの複素共役、R(f)=E{x(f、τ)x(f、τ)}は観測信号の相関行列、[A]は行列(ベクトル)Aの共役転置行列(ベクトル)を示し、y(f、τ)は従来型ビームフォーマ6の出力であり、以下の式(7)で表すことが出来る。
(f、τ)=w (f)x(f、τ) (7)
ここで、意味のない解(w(f)=0=[0、...、0])を回避するために、目的信号が無歪みで得られるという以下の式に示す拘束条件を付与する。
(f)h(f)=1 (8)
これにより、式(8)を満たし、かつ上記式(6)のA’(w(f))の値が最小となるw(f)の値を求める問題はLagurangeの未定乗数pを用いて、以下の式(9)で表すことができる。
A(w(f))=A’(w(f))+p(w (f)h(f)−1) (9)
式(9)を解くことにより、従来型ビームフォーマ6は、

Figure 2008060635
で得られる。 When Returning to FIG. 1, a conventional beamformer 6 for suppressing undesired signals, the following output power A represented by the formula '(w n (f)) filter group that minimizes the (vector) w n ( f) is estimated.
A ′ (w n (f)) = E {| y n | 2 (f, τ)}
= E {y n (f, τ) y n * (f, τ)}
= E {w n H (f) x (f, τ) x H (f, τ) w n (f)}
= W n H (f) R x (f) w n (f) (6)
Here, E {•} is an average operation with respect to time τ, A * is a complex conjugate of A, and R x (f) = E {x (f, τ) x H (f, τ)} is a correlation matrix of an observation signal , [A] H is a conjugate transpose matrix (vector) of the matrix (vector) A, and y n (f, τ) is an output of the conventional beamformer 6 and can be expressed by the following equation (7). .
y n (f, τ) = w n H (f) x (f, τ) (7)
Here, in order to avoid a meaningless solution (w n (f) = 0 = [0,..., 0] T ), the constraint condition shown in the following equation that the target signal can be obtained without distortion is given. Give.
w n H (f) h n (f) = 1 (8)
As a result, the problem of obtaining the value of w n (f) that satisfies equation (8) and minimizes the value of A ′ (w n (f)) in equation (6) uses Lagrange's undetermined multiplier p. And can be represented by the following formula (9).
A (w n (f)) = A ′ (w n (f)) + p (w n H (f) h n (f) −1) (9)
By solving equation (9), the conventional beamformer 6 is
Figure 2008060635
It is obtained by.

従来型ビームフォーマ6(従来の適応型ビームフォーマ)では、式(10)におけるインパルス応答ベクトルh(f)は実測してインパルス応答記憶部10に記憶させておいたインパルス応答ベクトルh(f)を読み出して用いることが理想である。しかし、代わりに上記式(5)に示すステアリングベクトルa(f)をステアリングベクトル記憶部12に記憶させ、読み出されたステアリングベクトルa(f)を上記式(10)のインパルス応答ベクトルh(f)の代わりに用いることが広く行われている。 In conventional beamformer 6 (conventional adaptive beamformer), the impulse response vector in equation (10) h n (f) the impulse response vector or may be stored by actually measuring the impulse response storage unit 10 h n (f ) Is ideally read and used. However, instead, the steering vector a n (f) shown in the above equation (5) is stored in the steering vector storage unit 12, and the read steering vector a n (f) is converted into the impulse response vector h of the above equation (10). It is widely used instead of n (f).

しかし、実環境において、インパルス応答ベクトルh(f)やステアリングベクトルa(f)が正しく与えられることは稀であり、上記式(9)に示すA(w(f))の最小化が必ずしも不要信号のみの最小化にはならないことが多い。このことから、混合信号(観測信号)の相関行列R(f)の代わりに、不要信号のみの時間区間における信号ξ(f、τ)の相関行列R(f)=E{ξ(f、τ)ξ(f、τ)}を用いることが非特許文献2などで広く行われている。これは、R(f)を用いる場合よりも高い性能を実現することが知られている。即ち、従来型ビームフォーマにおいては、不要信号のみの時間区間(目的音不在の時間区間)における相関行列が精度よく推定できることが望ましい。 However, in a real environment, the impulse response vector h n (f) and the steering vector a n (f) is given correctly are rare, minimization of A (w n (f)) represented by the above formula (9) In many cases, however, it is not always necessary to minimize only unnecessary signals. Therefore, instead of the correlation matrix R x (f) of the mixed signal (observation signal), the correlation matrix R J (f) = E {ξ (f) of the signal ξ (f, τ) in the time interval of only the unnecessary signal. , Τ) ξ H (f, τ)} is widely used in Non-Patent Document 2 and the like. This is known to achieve higher performance than using R x (f). That is, in the conventional beamformer, it is desirable that the correlation matrix can be accurately estimated in the time section of only unnecessary signals (time section in the absence of the target sound).

従来型ビームフォーマ6は上記式(10)のw(f)と観測信号ベクトルx(f、τ)により、上記式(7)により、出力信号ベクトルy(f、τ)が出力される。出力信号y(f、τ)は時間領域変換部8に入力され、周波数領域から時間領域に変換され、y(t)が生成される。
Haykin,S. 適応フィルタ理論 科学技術出版 2001 690頁−693頁 大賀寿郎 山崎芳男 金田豊 音響システムとディジタル処理 電子情報通信学会編 コロナ社 190頁−191頁
The conventional beamformer 6 outputs an output signal vector y n (f, τ) according to the above equation (7) from w n (f) in the above equation (10) and the observed signal vector x (f, τ). . The output signal y n (f, τ) is input to the time domain transforming unit 8 and transformed from the frequency domain to the time domain to generate y n (t).
Haykin, S .; Adaptive Filter Theory Science and Technology Publication 2001, pages 690-693 Toshiro Oga Yoshio Yamazaki Yutaka Kaneda Acoustic system and digital processing The Institute of Electronics, Information and Communication Engineers Corona Corporation pages 190-191

上述の通り、従来型ビームフォーマでは目的信号源から各センサへのインパルス応答ベクトルh(f)もしくはその近似であるステアリングベクトルa(f)が必要である。すなわち目的信号に関する事前知識が必要であるという難点がある。更にそれらは、実環境では正しく得ることが困難であり、事前知識と使用環境でのインパルス応答ベクトルh(f)がずれてしまった場合の従来型ビームフォーマの性能は著しく低下する。
また、高い性能を得るためには、不要信号のみの時間区間における信号の相関行列R(f)を推定する必要があるが、不要信号が非定常な信号である場合には、それは非常に困難である。
As described above, the conventional beamformer requires the impulse response vector h n (f) from the target signal source to each sensor or the steering vector a n (f) that is an approximation thereof. That is, there is a difficulty that prior knowledge about the target signal is necessary. Furthermore, they are difficult to obtain correctly in the actual environment, and the performance of the conventional beamformer is significantly degraded when the prior knowledge and the impulse response vector h n (f) in the use environment are deviated.
Further, in order to obtain high performance, it is necessary to estimate the correlation matrix R J (f) of the signal in the time interval of only the unnecessary signal. However, when the unnecessary signal is a non-stationary signal, it is very Have difficulty.

N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、上記M個のセンサで観測された観測信号を周波数領域の信号に変換し、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出し、上記正規化観測信号ベクトルを上記N個のクラスタにクラスタリングし、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定し、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算し、上記ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出し、上記抽出された上記目的信号を時間領域の信号に変換する。
In a signal extraction apparatus for observing signals emitted from N signal sources with M sensors and extracting one or more of the observed signals, where N and M are integers of 2 or more Yes, the observation signals observed by the M sensors are converted into frequency domain signals, the frequency domain signals are normalized, a normalized observation signal vector is calculated, and the normalized observation signal vector Are clustered into the N clusters,
An unnecessary signal correlation matrix that is a correlation matrix of an observation signal including only unnecessary signals is estimated from the cluster information, a beam former is calculated from the cluster information and the unnecessary signal correlation matrix, and the beam former is calculated. The target signal is extracted from the frequency domain signal, and the extracted target signal is converted into a time domain signal.

上記の構成により、事前にインパルス応答ベクトルあるいは、ステアリングベクトルを測定しておくことなく、また不要信号が非定常な信号であっても、目的信号を精度よく、分離抽出することが可能となる。     With the above configuration, it is possible to accurately extract and extract a target signal without measuring an impulse response vector or a steering vector in advance and even if an unnecessary signal is a non-stationary signal.

以下に発明を実施するための最良の形態を示す。   The best mode for carrying out the invention will be described below.

この発明の機能構成例を図3に示し、この発明の主要な処理の流れを図4に示す。図1と同一機能構成部分には同一参照符号を付け、重複説明を省略する。以下も同様とする。     An example of the functional configuration of the present invention is shown in FIG. 3, and the main processing flow of the present invention is shown in FIG. The same functional components as those in FIG. 1 are denoted by the same reference numerals, and redundant description is omitted. The same applies to the following.

また、この発明では、信号のスパース性を仮定する。スパースとは、信号が殆どの時刻τにおいて、0であることを示す。信号のスパース性は、例えば、音声信号で確認される。信号のスパース性を仮定することで、複数の源信号が存在しても、各時間周波数ポイント(f、τ)では互いに重ならず、高々1つしか存在しないと仮定することが出来る。即ち上記式(4)は以下の式で表すことができる。     In the present invention, signal sparsity is assumed. Sparse means that the signal is zero at most times τ. The sparsity of the signal is confirmed by an audio signal, for example. By assuming the sparseness of the signal, it can be assumed that even if there are a plurality of source signals, at each time frequency point (f, τ), they do not overlap each other and there is at most one. That is, the above formula (4) can be expressed by the following formula.

x(f、τ)=h(f)s(f、τ) (11)
ここで、h(f)はインパルス応答ベクトル、s(f、τ)は(f、τ)に存在する源信号を表す。
x (f, τ) = h n (f) s n (f, τ) (11)
Here, h n (f) represents an impulse response vector, and s n (f, τ) represents a source signal existing at (f, τ).

センサ4mで収音されたそれぞれの観測信号x(t)(m=1、...M)は周波数領域変換部5に入力される。周波数領域変換部5でそれぞれの観測信号x(t)は、例えば、公知の技術である上記の短時間フーリエ変換などで、時間領域から周波数領域に変換され、x(f、τ)に変換される(ステップS2)。更に、x(f、τ)は、観測信号ベクトルx(f、τ)として出力される。観測信号ベクトルx(f、τ)は正規化部22に入力され、正規化観測信号ベクトルが算出される(ステップS4)。具体的には、観測信号ベクトルx(f、τ)=[x(f、τ)、...、x(f、τ)]に対し、偏角の正規化を以下の式で行う。

Figure 2008060635
また、ノルム正規化を以下の式で行う。 Each observation signal x m (t) (m = 1,... M) collected by the sensor 4 m is input to the frequency domain conversion unit 5. Each observation signal x m (t) is converted from the time domain to the frequency domain by, for example, the above-described short-time Fourier transform, which is a known technique, and converted to x m (f, τ) by the frequency domain transform unit 5. Conversion is performed (step S2). Further, x m (f, τ) is output as an observation signal vector x (f, τ). The observation signal vector x (f, τ) is input to the normalization unit 22, and a normalized observation signal vector is calculated (step S4). Specifically, the observed signal vector x (f, τ) = [x 1 (f, τ),. . . , X m (f, τ)] For T , normalization of the declination is performed by the following equation.
Figure 2008060635
Norm normalization is performed using the following equation.

(f、τ)←x(f、τ)/‖x(f、τ)‖ (13)
ここで、x(f、τ)は正規化された観測信号ベクトルx(f、τ)を表し、arg(r)はrの偏角を表し、iは虚数単位を表し、│r│はrの絶対値を表し、‖r‖はrのノルムを表し、Qは基準とするセンサの番号(Q∈{1、...、M})を表し、cは信号の速度を表し、αは任意の正の定数を表す。αについては、α=4dmaxが最も好ましい。ただし、dmaxは、基準として選択された任意のセンサQと他のセンサとの距離の最大値を表す。また、αは他の数値でもよい。
x (f, τ) ← x (f, τ) / ‖x (f, τ) ‖ (13)
Where x (f, τ) represents the normalized observed signal vector x (f, τ), arg (r) represents the declination of r, i represents the imaginary unit, and | r | represents the absolute value of r, ‖r‖ represents the norm of r, Q represents the reference sensor number (Q∈ {1,..., M}), c represents the speed of the signal, α Represents any positive constant. For α, α = 4d max is most preferred. However, d max represents the maximum value of the distance between an arbitrary sensor Q selected as a reference and another sensor. Α may be another numerical value.

上記式(11)〜(13)より、正規化された観測信号ベクトルx(f、τ)は以下の式で表すことができる。

Figure 2008060635

ここで、A=(Σm=1 │hmn1/2であり、信号s(f、τ)に関するインパルス応答情報にのみ依存することが分かる。 From the above equations (11) to (13), the normalized observation signal vector x (f, τ) can be expressed by the following equation.
Figure 2008060635

Here, it can be seen that A n = (Σ m = 1 M | h mn | 2 ) 1/2 and depends only on the impulse response information regarding the signal s n (f, τ).

正規化された全ての時間周波数の観測信号ベクトルx(f、τ)はクラスタリング部24に入力され、N個のクラスタにクラスタリングされる(ステップS6)。このクラスタリングは、例えば、k−means法を用いて効果的に行うことができる。また、詳細は「R.O.Duda、P.E.Hart、and D.G.Stork,Pattern Classification,Wiley Interscience, 2nd edition,2000.」に記載されている。以下にクラスタリングの方法を具体的に説明する。 Normalized observation signal vectors x (f, τ) of all time frequencies are input to the clustering unit 24 and clustered into N clusters (step S6). This clustering can be effectively performed using, for example, the k-means method. Details are described in “RO Duda, PE Hart, and DG Stock, Pattern Classification, Wiley Interscience, 2nd edition, 2000”. The clustering method will be specifically described below.

記憶部26にはあらかじめ、上記式(14)で示される正規化観測信号ベクトルx(f、τ)とセントロイドの初期値c (j=0、n=1、...、N)が記憶されている。
クラスタリング部24は、記憶部26から正規化観測信号ベクトルx(f、τ)を読み込み、これらをクラスタリングしてN個のクラスタC、...、Cを生成する。すなわち、M次元複素ベクトルである正規化された観測信号ベクトルx(f、τ)をM次元複素空間で以下の手順で直接クラスタリングする。
In the storage unit 26, the normalized observation signal vector x (f, τ) represented by the above formula (14) and the initial centroid value c j n (j = 0, n = 1,..., N ) Is stored.
The clustering unit 24 reads the normalized observation signal vector x (f, τ) from the storage unit 26 and clusters them to generate N clusters C 1 ,..., CN. That is, the normalized observation signal vector x (f, τ), which is an M-dimensional complex vector, is directly clustered in the following procedure in the M-dimensional complex space.

1.クラスタのセントロイドの初期値c を記憶部26から読み込む。セントロイドの初期値c は、正規化観測信号ベクトルx(f、τ)と同じ次元のベクトル(M次元複素ベクトル)である。なお、セントロイドの初期値c の選び方については後述する。
2.j+1を新たなjとする。
3.すべての時間周波数(f、τ)における正規化観測信号ベクトルx(f、τ)を、最も近いセントロイドcj−1 で代表されるクラスタCに割り当てる。すなわち、各正規化ベクトルx(f、τ)に対して、‖x(f、τ)−cj−1 ‖が最も小さくなるようにnを選ぶ。
4.各クラスタCに割りあてられた正規化観測信号ベクトルx(f、τ)の平均値を計算し、そのノルムを1にすることでセントロイドを更新する。すなわち、各クラスタCに割りあてられた正規化観測信号ベクトルx(f、τ)に対して、
=E{x(f、τ)}/‖E{x(f、τ)}‖ (15)
の演算を行うことにより、セントロイドを更新する。ここで、E{・}は、クラスタCのメンバに対する平均操作を表す。
5.セントロイドc が収束するまで、手順2−5を繰り返す。最後に収束したセントロイドを、c(n=1、...、N)として、記憶部26に記憶する。以上が、クラスタリング手順である。
1. The initial value c j n of the cluster centroid is read from the storage unit 26. The centroid initial value c j n is a vector (M-dimensional complex vector) having the same dimension as the normalized observation signal vector x (f, τ). Note that how to select the initial value c 0 n of the centroid will be described later.
2. Let j + 1 be a new j.
3. The normalized observation signal vector x (f, τ) at all time frequencies (f, τ) is assigned to the cluster C n represented by the nearest centroid c j−1 n . That is, for each normalized vector x (f, τ), n is selected such that ‖x (f, τ) −c j−1 n ‖ is the smallest.
4). The average value of the normalized observation signal vector x (f, τ) assigned to each cluster C n is calculated, and the centroid is updated by setting the norm to 1. That is, for the normalized observation signal vector x (f, τ) assigned to each cluster C n ,
c n j = E {x ( f, τ)} n / ‖E {x - (f, τ)} n ‖ (15)
The centroid is updated by performing the above calculation. Here, E {·} n represents an average operation for the members of cluster C n .
5. Repeat steps 2-5 until centroid c j n converges. The finally converged centroid is stored in the storage unit 26 as c n (n = 1,..., N). The above is the clustering procedure.

次に、セントロイドの初期値の選び方の例を説明する。
《初期値設定方法1》
正規化観測信号ベクトルx(f、τ)の中からランダムにN個のベクトルを選び、それをセントロイドの初期値c (n=1、...、N)とする。
《初期値設定方法2》
セントロイドは、式(11)〜(15)において、全てのm、nについて、│hmn(f)│=1と仮定すると、以下の式(16)のように書けるので、これを用いる。
{c=E[x(f、τ)]
=exp[i2π(d−d/α]/M1/2
=exp[i2π‖d−dcosΘ mQ/α]/M1/2
(16)
ここで、dはセンサ4の位置ベクトルを表し、v=cosΘ mQは、センサ4mと基準として選択したセンサ4Qを結ぶ軸に対する信号s(t)の到来方向ベクトルを表し、図5において、太いベクトルで示されているものである。また、vは単位ベクトルであり、‖v‖=1である。
Next, an example of how to select the initial value of the centroid will be described.
<< Initial value setting method 1 >>
N vectors are randomly selected from the normalized observation signal vector x (f, τ), and set as the initial value c 0 n (n = 1,..., N) of the centroid.
<< Initial value setting method 2 >>
The centroid can be written as the following equation (16) assuming that | h mn (f) | = 1 for all m and n in the equations (11) to (15), and this is used.
{C n} q = E [ x - (f, τ)] n
= Exp [i2π (d m -d Q) T v n / α] / M 1/2
= Exp [i2π‖d m -d Q || T cosΘ n mQ / α] / M 1/2
(16)
Here, d m represents the position vector of the sensor 4 m, v n = cosΘ n mQ represents the arrival direction vector of the signal s n (t) with respect to the axis connecting the selected sensor 4Q as a sensor 4m and a reference, FIG. In FIG. 5, this is indicated by a thick vector. Furthermore, v n is the unit vector, a ‖V n || = 1.

センサ位置d(m=1、...、M)は、記憶部26において保持されている値を、方位θと仰角φ(n=1、...、N)を適当に与える。ここで、センサ位置d、方位θと仰角φは初期値であるので、適当な値で良い。例えば、θ=2πn/N、φ=0とすると、空間的に散らばった初期値が得られる。 The sensor position d m (m = 1,..., M) appropriately gives the value held in the storage unit 26 as the azimuth θ n and the elevation angle φ n (n = 1,..., N). . Here, since the sensor position d m , the azimuth θ n and the elevation angle φ n are initial values, they may be appropriate values. For example, when θ n = 2πn / N and φ n = 0, initial values dispersed spatially are obtained.

図3に説明を戻すと、クラスタリング部24により求まったクラスタCは各源信号s(f、τ)に対応している。また、そのセントロイドc =E{x(f、τ)}x−(f、τ)∈Cnは上記式(14)から理解されるように、源信号s(f、τ)に関するインパルス応答情報を表すことが分かる。 Returning to FIG. 3, the cluster C n obtained by the clustering unit 24 corresponds to each source signal s n (f, τ). Further, the centroid c - n = E {x - (f, τ)} x- (f, τ) ∈Cn , as will be appreciated from the above equation (14), the source signal s n (f, tau) It can be seen that the impulse response information for is represented.

各クラスタCはそれぞれ、不要信号相関行列推定部25に入力される。不要信号相関行列推定部25では各クラスタCごとにその情報から、源信号s(f、τ)に対する不要信号区間の相関行列、つまり、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列R (f)を以下の式(17)(18)で推定する(ステップS8)。

Figure 2008060635
推定された不要信号相関行列R (f)とクラスタリング部24よりのクラスタのセントロイド情報c は、ビームフォーマ計算部28に入力される。ビームフォーマ計算部28ではクラスタの情報Cと、不要信号相関行列R (f)とからビームフォーマw(f)を計算する(ステップS10)。ビームフォーマw(f)の具体的な計算方法については、実施例2で詳細に説明する。 Each cluster C n is input to the unnecessary signal correlation matrix estimation unit 25. The unnecessary signal correlation matrix estimator 25 calculates the correlation matrix of the unnecessary signal section with respect to the source signal s n (f, τ) from the information for each cluster C n , that is, the correlation matrix of the observation signal including only the unnecessary signal. The unnecessary signal correlation matrix R n J (f) is estimated by the following equations (17) and (18) (step S8).
Figure 2008060635
The estimated unnecessary signal correlation matrix R n J (f) and the cluster centroid information c n from the clustering unit 24 are input to the beamformer calculation unit 28. The beamformer calculation unit 28 calculates the beamformer w n (f) from the cluster information C n and the unnecessary signal correlation matrix R n J (f) (step S10). A specific calculation method of the beamformer w n (f) will be described in detail in the second embodiment.

計算されたビームフォーマw(f)は目的信号抽出部30に入力される。目的信号抽出部30では、ビームフォーマw(f)を用いて、以下の式(19)を計算して、周波数領域の観測信号x(f、τ)から目的信号y(f、τ)を抽出する(ステップS12)。
(f、τ)=w(f)x(f、τ) (19)
式(17)〜(19)を全てのn(n=1、...、N)に対して行うことで、N個全ての信号を抽出する。y(f、τ)は全て、時間領域変換部32に入力される。目的信号抽出部30で抽出された目的信号y(f、τ)は、例えば公知の技術である短時間逆フーリエ変換などで時間領域の信号y(t)に変換される(ステップS14)。
The calculated beamformer w n (f) is input to the target signal extraction unit 30. The target signal extraction unit 30 calculates the following equation (19) using the beamformer w n (f), and calculates the target signal y n (f, τ) from the frequency domain observation signal x (f, τ). Is extracted (step S12).
y n (f, τ) = w n (f) H x (f, τ) (19)
By performing the equations (17) to (19) for all n (n = 1,..., N), all N signals are extracted. All y n (f, τ) are input to the time domain conversion unit 32. The target signal y n (f, τ) extracted by the target signal extraction unit 30 is converted into a time domain signal y n (t) by, for example, a short-time inverse Fourier transform which is a known technique (step S14). .

次に、この発明の実施例2について説明する。実施例2は、実施例1で説明したビームフォーマ計算部28をより詳細に構成した例である。図6に実施例2のビームフォーマ計算部28とこれに関係する部分の機能構成例を示す。図6に図示されていない部分は実施例1で説明したものと同様の処理を行うものとし、以下の実施例についても同様とする。ビームフォーマ計算部28はインパルス応答推定部40と適応型ビームフォーマ計算部42とで構成されている。     Next, a second embodiment of the present invention will be described. The second embodiment is an example in which the beamformer calculation unit 28 described in the first embodiment is configured in more detail. FIG. 6 shows a functional configuration example of the beamformer calculation unit 28 according to the second embodiment and parts related thereto. The parts not shown in FIG. 6 perform the same processing as that described in the first embodiment, and the same applies to the following embodiments. The beamformer calculation unit 28 includes an impulse response estimation unit 40 and an adaptive beamformer calculation unit 42.

インパルス応答推定部40では、クラスタCのセントロイド情報c から目的信号のインパルス応答ベクトルh(f)を推定する。具体的には、クラスタリング部24よりのセントロイド情報c について逆正規化を行うことで源信号s(f、τ)に対するインパルス応答ベクトルの推定を行う。 In the impulse response estimating unit 40, a cluster C n centroid information c - n to estimate the impulse response vector h n of the target signal (f) from. Specifically, the impulse response vector for the source signal s n (f, τ) is estimated by denormalizing the centroid information c n from the clustering unit 24.

まず、クラスタCのセントロイドは上記式(15)であり、x(f、τ)は式(14)で表すことができる。ここで、全てのm、nに対して、│hmn│=1と仮定するとセントロイドc のm番目の成分c mnは、以下の式(20)が成り立つ。

Figure 2008060635
式(20)を、hmn(f)について解くと、以下の式(21)を得ることが出来る。 First, the centroid of the cluster C n is the above equation (15), and x (f, τ) can be represented by the equation (14). Here, assuming that | h mn | = 1 for all m and n, the following equation (20) is established for the m-th component c mn of the centroid c n .
Figure 2008060635
Solving equation (20) with respect to h mn (f), the following equation (21) can be obtained.

Figure 2008060635
式(20)の右辺はインパルス応答hmn(f)が正規化されたものになっているが、式(21)は式(20)から逆にインパルス応答ベクトルh(f)について求め直しているので、式(21)は逆正規化と呼ぶ。
Figure 2008060635
The right side of the equation (20) is a normalized impulse response h mn (f), but the equation (21) is obtained by recalculating the impulse response vector h n (f) from the equation (20). Therefore, equation (21) is called denormalization.

図6の説明に戻ると、推定されたインパルス応答ベクトルh(f)と、不要信号相関行列推定部25よりのR (f)とが、適応型ビームフォーマ計算部42に入力される。 Returning to the description of FIG. 6, the estimated impulse response vector h n (f) and R n J (f) from the unnecessary signal correlation matrix estimation unit 25 are input to the adaptive beamformer calculation unit 42. .

適応型ビームフォーマ計算部42は、インパルス応答ベクトルh(f)と上記不要信号相関行列R (f)を用いて適応型ビームフォーマw(f)を計算する。具体的には、以下の式(22)により適応型ビームフォーマw(f)を計算することが出来る。

Figure 2008060635

上記式(22)は、上記式(10)のR(f)をR (f)に置き換えることで得ることができる。 The adaptive beamformer calculation unit 42 calculates an adaptive beamformer w n (f) using the impulse response vector h n (f) and the unnecessary signal correlation matrix R n J (f). Specifically, the adaptive beamformer w n (f) can be calculated by the following equation (22).
Figure 2008060635

The above formula (22) can be obtained by replacing R x (f) in the above formula (10) with R n J (f).

目的信号抽出部30では、式(22)の適応型ビームフォーマw(f)と、周波数領域の信号x(f、τ)とを上記式(19)に適用して、目的信号y(f、τ)を抽出する。 The target signal extraction unit 30 applies the adaptive beamformer w n (f) in Expression (22) and the signal x (f, τ) in the frequency domain to the above Expression (19), thereby generating the target signal y n ( f, τ) is extracted.

次に実施例2の変形例として実施例2’を示す。インパルス応答推定部40による、上記式(22)を用いたインパルス応答ベクトルh(f)の推定を出力する代わりに、ステアリングベクトルa(f)を推定して、出力させることも考えられる。信号s(f、τ)のステアリングベクトルを上記式(5)と同様に
(f)=[exp(−i2πfτ1n)、・・・、exp(−i2πfτMn)] (23)
とすると、ステアリングベクトルa(f)はインパルス応答ベクトルh(f)の推定であるから、上記式(21)と上記式(23)の位相項を比較すると、τmn(m=1、...、M)は以下の式(24)で推定できる。
τ^mn=αc−1arg[c mn Qn]/2π (24)
この式(24)の計算をインパルス応答推定部40’で行う。
Next, Example 2 ′ is shown as a modification of Example 2. According to the impulse response estimator 40, instead of outputting the impulse response vector estimation of h n (f) using the above formula (22), to estimate the steering vector a n (f), it is conceivable to output. Signal s n (f, τ) the expression steering vectors as well as (5) a n (f) = [exp (-i2πfτ 1n), ···, exp (-i2πfτ Mn)] T (23)
Then, since the steering vector a n (f) is an estimation of the impulse response vector h n (f), when the phase terms of the equation (21) and the equation (23) are compared, τ mn (m = 1, ..., M) can be estimated by the following equation (24).
τ ^ mn = αc -1 arg [ c - mn c - Qn] / 2π (24)
The calculation of Expression (24) is performed by the impulse response estimation unit 40 ′.

τ^mnを用いたステアリングベクトルa(f)をインパルス応答ベクトルh(f)の推定として出力する。すなわち上記式(23)(24)からステアリングベクトルa(f)は以下の式(27)で表すことができ、インパルス応答推定部40’からインパルス応答h^(f)として出力される。
(f)=[exp(−i2πfτ^1n)、・・・、exp(−i2πfτ^Mn)]≒h^(f) (25)
式(25)のh^(f)とR から、上記式(22)で適応型ビームフォーマを計算する。
The steering vector a n (f) using τ ^ mn is output as an estimate of the impulse response vector h n (f). That is, from the above equations (23) and (24), the steering vector a n (f) can be expressed by the following equation (27), and is output from the impulse response estimation unit 40 ′ as the impulse response h n (f).
a n (f) = [exp (-i2πfτ ^ 1n), ···, exp (-i2πfτ ^ Mn)] T ≒ h ^ n (f) (25)
An adaptive beamformer is calculated by the above equation (22) from h ^ n (f) and R n J of equation (25).

また、上記式(22)を使用して不要信号相関行列推定部25で適応型ビームフォーマw(f)を推定する際に、不要信号相関行列R (f)を使用して、音響伝達特性つまり、インパルス応答ベクトルh(f)やステアリングベクトルa(f)が既知の場合はそれらを使用しても良い。また、式(22)中の不要信号相関行列R (f)の代わりに、観測信号の相関行列R(f)を使用しても良い。これらのことは、以下の実施例においても同様である。 In addition, when the unnecessary signal correlation matrix estimation unit 25 estimates the adaptive beamformer w n (f) using the above equation (22), the unnecessary signal correlation matrix R n J (f) is used to generate an acoustic signal. If the transfer characteristics, that is, the impulse response vector h n (f) and the steering vector a n (f) are known, they may be used. Further, instead of the unnecessary signal correlation matrix R n J (f) in the equation (22), the correlation matrix R x (f) of the observation signal may be used. The same applies to the following embodiments.

実施例2で示した適応型ビームフォーマでは、N≦Mの場合には、高い性能を得ることが出来るが、N>Mの場合には、性能が限られることが問題であった。具体的には、適応型ビームフォーマは不要信号の数がM−1個以下であれば、効果的に目的信号y(f、τ)を抽出できるが、M個以上であると、その効果が不十分であることが知られている。そこで実施例3では、N>Mの場合、即ち、N−1(>M−1)個の不要信号がある場合にも目的信号を抽出できることを示す。実施例3の機能構成例を図7に示す。実施例3は、実施例2と比較して、不要信号選択部49、入力信号推定部50が追加され、不要信号相関行列推定部25、インパルス応答推定部40、適応型ビームフォーマ計算部42、の処理が変更されている。 In the adaptive beamformer shown in the second embodiment, high performance can be obtained when N ≦ M. However, when N> M, the performance is limited. Specifically, the adaptive beamformer can effectively extract the target signal y n (f, τ) if the number of unnecessary signals is M−1 or less. Is known to be inadequate. Therefore, the third embodiment shows that the target signal can be extracted even when N> M, that is, when there are N−1 (> M−1) unnecessary signals. A functional configuration example of the third embodiment is shown in FIG. In the third embodiment, an unnecessary signal selection unit 49 and an input signal estimation unit 50 are added as compared with the second embodiment, and an unnecessary signal correlation matrix estimation unit 25, an impulse response estimation unit 40, an adaptive beamformer calculation unit 42, The processing of has been changed.

不要信号選択部49で、K個の不要信号についての不要信号相関行列R (f)を推定する。ここで、Kは、K≦M−1を満たす整数とする。つまり、目的信号s(f、τ)に相当するクラスタC以外の不要信号に相当するクラスタC(L=1、...、n−1、n+1、...、N)からK個のクラスタを選び、これらのクラスタをCとする。
K個のクラスタの選び方として、クラスタC中で、クラスタメンバが多いものから順にK個のクラスタを選ぶ方法や、以下の式(26)で表されるξ(f、τ)のパワーが大きいものから順にK個のクラスタを選ぶ方法等が考えられる。

Figure 2008060635
An unnecessary signal selection unit 49 estimates an unnecessary signal correlation matrix R n J (f) for K unnecessary signals. Here, K is an integer that satisfies K ≦ M−1. That is, from clusters C L (L = 1,..., N−1, n + 1,..., N) corresponding to unnecessary signals other than the cluster C n corresponding to the target signal s n (f, τ) to K. Choose clusters and let these clusters be C J.
As the choice of K clusters, in cluster C L, and a method of selecting the K clusters in order from many cluster member, the power of the following formula (26) represented by xi] L (f, tau) A method of selecting K clusters in order from the largest is conceivable.
Figure 2008060635

不要信号選択部49で選択されたK個のクラスタCを用いて、K個の不要信号についての不要信号相関行列R (f)を以下の式(27)(28)で計算する。

Figure 2008060635
Using the K clusters C J selected by the unnecessary signal selection unit 49, the unnecessary signal correlation matrix R n J (f) for the K unnecessary signals is calculated by the following equations (27) and (28).
Figure 2008060635

また、入力信号推定部50において、不要信号選択部49で選択したK個の不要信号と目的信号Cとが混合したビームフォーマ入力信号ベクトルx(f、τ)を推定する。これは、不要信号クラスタCと目的信号クラスタCを用いて、以下の式(29)で得ることができる。

Figure 2008060635
適応型ビームフォーマ計算部42では、上記式(27)(28)で得られた不要信号相関行列R (f)とインパルス応答推定部40または40’よりのインパルス応答ベクトルh(f)を用いて、上記式(22)を用いて、適応型ビームフォーマw(f)を計算する。 Further, the input signal estimation unit 50 estimates a beamformer input signal vector x (f, τ) in which the K unnecessary signals selected by the unnecessary signal selection unit 49 and the target signal C n are mixed. It uses the undesired signal cluster C J and the target signal clusters C n, can be obtained by the following equation (29).
Figure 2008060635
In the adaptive beamformer calculation unit 42, the unnecessary signal correlation matrix R n J (f) obtained by the above equations (27) and (28) and the impulse response vector h n (f) from the impulse response estimation unit 40 or 40 ′. Is used to calculate the adaptive beamformer w n (f) using the above equation (22).

目的信号抽出部30では、入力信号推定部50よりのビームフォーマ入力信号x(f、τ)が入力される。目的信号抽出部30では適応型ビームフォーマ計算部42よりの適応型ビームフォーマw(f)と、ビームフォーマ入力信号ベクトルx(f、τ)を用いて、上記式(19)を計算して、目的信号y(f、τ)を抽出する。 The target signal extraction unit 30 receives the beamformer input signal x (f, τ) from the input signal estimation unit 50. The target signal extraction unit 30 calculates the above equation (19) using the adaptive beamformer w n (f) from the adaptive beamformer calculation unit 42 and the beamformer input signal vector x (f, τ). , The target signal y n (f, τ) is extracted.

実施例3では上述の通り、N>Mの場合を説明した。しかし、N≦Mの場合でも実施できる。この場合は、実施例2と比較して、入力信号推定部50と不要信号選択部49の処理の分だけ余計にコストがかかる。     In the third embodiment, the case where N> M is described as described above. However, it can be implemented even when N ≦ M. In this case, compared with the second embodiment, an extra cost is required for the processing of the input signal estimation unit 50 and the unnecessary signal selection unit 49.

実施例4は、センサの位置情報が既知の場合の実施例である。実施例4の機能構成例の一部を図8に示す。実施例2もしくは3で説明したインパルス応答推定部40は到来方向推定部60とインパルス応答計算部62により構成されている。また、M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部64を有する。   The fourth embodiment is an embodiment where the position information of the sensor is known. FIG. 8 shows a part of a functional configuration example of the fourth embodiment. The impulse response estimation unit 40 described in the second or third embodiment includes an arrival direction estimation unit 60 and an impulse response calculation unit 62. Moreover, it has the sensor position information storage part 64 which has memorize | stored the sensor position information showing the position of M sensors.

到来方向推定部60で、信号の到来方向を推定する。到来方向推定部60には、クラスタリング部24よりのセントロイド情報c とセンサ位置情報記憶部64よりの各センサの位置を表す3次元ベクトルd(m=1、...、M)が入力される。信号sの到来方向を表す長さ1の3次元ベクトルをv(n=1、...、N)とすると、信号sの到来方向の推定値はセントロイド情報c を用いて、以下の式(30)で計算することができる。 The arrival direction estimation unit 60 estimates the arrival direction of the signal. The arrival direction estimation unit 60, the centroid information c than clustering section 24 - three-dimensional vector representing the position of each sensor than n and the sensor position information storage unit 64 d m (m = 1, ..., M) Is entered. V n dimensional vector of length one representing the direction of arrival of the signal s n (n = 1, ..., N) When the estimated value of the arrival direction of the signal s n is the centroid information c - with n And can be calculated by the following equation (30).

=αDarg[c ]/2π (30)
ここで、D=[d−d、...、d−d、...、d−dであり、dは基準として、任意に選択したセンサ4Qの位置を表す3次元ベクトルであり、Dは、Dの一般化逆行列を表す。
v n = αD + arg [c n ] / 2π (30)
Here, D = [d 1 -d Q ,. . . , D m -d Q,. . . , D M −d Q ] T , where d Q is a three-dimensional vector representing the position of the sensor 4Q arbitrarily selected as a reference, and D + represents a generalized inverse matrix of D.

次にインパルス応答計算部62において、信号sの到来方向とセンサ位置情報とを用いて、インパルス応答を計算する。インパルス応答計算部62には、到来方向推定部60よりの信号sの到来方向の推定値qと、センサ位置情報記憶部64よりのセンサ位置情報dが入力される。インパルス応答計算部62は以下の式(31)で表す信号sについてのステアリングベクトルa^(f)の推定値を求める。このステアリングベクトルa^(f)をインパルス応答ベクトルの推定値h(f)として計算する。

Figure 2008060635
そして、ステアリングベクトルa^(f)(インパルス応答ベクトルの推定値h(f))がインパルス応答計算部62から出力され、適応型ビームフォーマ計算部42に入力される。 Next, in the impulse response calculation unit 62, by using the direction of arrival and the sensor position information of the signals s n, to calculate the impulse response. The impulse response calculation unit 62 receives the arrival direction estimation value q n of the signal s n from the arrival direction estimation unit 60 and the sensor position information d Q from the sensor position information storage unit 64. The impulse response calculator 62 obtains an estimated value of the steering vector a n ^ (f) for the signal s n represented by the following equation (31). This steering vector a n ^ (f) is calculated as an estimated value h n (f) of the impulse response vector.
Figure 2008060635
The steering vector a n ^ (f) (impulse response vector estimation value h n (f)) is output from the impulse response calculation unit 62 and input to the adaptive beamformer calculation unit 42.

本実施例では、適応型ビームフォーマの代わりに、最大利得ビームフォーマを用いる構成を示す。最大利得ビームフォーマとは、センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にするようなフィルタw(f)をビームフォーマとする方法である。(D.H.Johnson and D.E.Dudgeon,“Array Signal Processing Concepts and Techniques”,Prentice Hall,1993.)
最大利得ビームフォーマにおいては、センサアレイ出力中の目的信号成分と不要信号成分を推定することが1つのポイントとなるが、不要信号が非定常信号である場合、不要信号を推定することは非常に困難であるという問題があった。実施例5では、この問題をスパース性の仮定を用いることで解決する。つまり(1)目的信号のみの観測信号の相関行列である目的信号相関行列R (f)と、不要信号のみの観測信号の相関行列である不要信号相関行列R (f)とを推定すること、(2)最大利得ビームフォーマ計算部で、目的信号相関行列R (f)と不要信号相関行列R (f)とから最大利得ビームフォーマw(f)を推定することにより解決することが出来る。
In this embodiment, a configuration using a maximum gain beamformer instead of the adaptive beamformer is shown. The maximum gain beamformer is a method in which a filter w n (f) that minimizes an unnecessary signal component in the sensor array output while maximizing a target signal in the sensor array output is used as a beamformer. (DH Johnson and DE Dudgeon, “Array Signal Processing Concepts and Technologies”, Prentice Hall, 1993.)
In the maximum gain beamformer, it is one point to estimate the target signal component and unnecessary signal component in the sensor array output. However, when the unnecessary signal is a non-stationary signal, it is very difficult to estimate the unnecessary signal. There was a problem that it was difficult. In the fifth embodiment, this problem is solved by using a sparsity assumption. In other words, (1) the target signal correlation matrix R T n (f) that is the correlation matrix of the observation signal only of the target signal and the unnecessary signal correlation matrix R J n (f) that is the correlation matrix of the observation signal only of the unnecessary signal (2) The maximum gain beamformer calculation unit estimates the maximum gain beamformer w n (f) from the target signal correlation matrix R T n (f) and the unnecessary signal correlation matrix R J n (f). Can be solved.

また、最大利得ビームフォーマでは「目的信号の歪みを最小にする」という上記式拘束条件(8)が無いため、各周波数fにおいて、様々な、ゲイン特性を持つビームフォーマw(f)が構成される。これは、例えば、音声信号のような広帯域信号に最大利得ビームフォーマを適用した場合、出力がw(f)の周波数特性により歪んでしまうことを意味する。このため、従来は最大利得ビームフォーマを広帯域信号に用いることは困難であった。実施例5では、観測信号ベクトルx(f、τ)と最大利得ビームフォーマw(f)の出力信号との誤差が最小となるように、最大利得ビームフォーマw(f)を補正することでこれを解決する。 Further, since the maximum gain beamformer does not have the above-mentioned constraint condition (8) of “minimizing distortion of the target signal”, beamformers w n (f) having various gain characteristics are formed at each frequency f. Is done. This means that, for example, when the maximum gain beamformer is applied to a wideband signal such as an audio signal, the output is distorted by the frequency characteristic of w n (f). For this reason, conventionally, it has been difficult to use the maximum gain beamformer for wideband signals. In the fifth embodiment, the maximum gain beamformer w n (f) is corrected so that the error between the observation signal vector x (f, τ) and the output signal of the maximum gain beamformer w n (f) is minimized. To solve this.

まず、最大利得ビームフォーマの原理を簡単に説明する。上述したように「センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にする」との条件より評価関数は以下の式(32)となる。

Figure 2008060635
First, the principle of the maximum gain beamformer will be briefly described. As described above, the evaluation function is expressed by the following expression (32) based on the condition that “the target signal at the sensor array output is maximized while the unnecessary signal component at the sensor array output is minimized”.
Figure 2008060635

ここで、分母は不要信号の出力パワー、分子は目的信号の出力パワーであり、R (f)は目的信号のみの観測信号の相関行列、R (f)は不要信号のみの観測信号の相関行列である。また、(R (f))1/2=EF1/2で表すことが出来、ここで、E=[e、...e]であり、eはR (f)の固有ベクトルであり、F=diag(λ、...、λ)であり、λはeに対応するR の固有値とし、w=(R (f))1/2とすると、上記式(32)は以下の式(33)に変えることが出来る。

Figure 2008060635
Here, the denominator is the output power of the unnecessary signal, the numerator is the output power of the target signal, R T n (f) is the correlation matrix of the observation signal only of the target signal, and R J n (f) is the observation of only the unnecessary signal. It is a correlation matrix of a signal. Also, (R J n (f)) 1/2 = EF 1/2 E H , where E = [e 1 ,. . . e m ], e i is the eigenvector of R J n (f), F = diag (λ 1 ,..., λ M ), and λ i is the eigenvalue of R J n corresponding to e i And w ~ = (R J n (f)) 1/2 w n , the above equation (32) can be changed to the following equation (33).
Figure 2008060635

ここで「児玉、須田、“システム制御のためのマトリクス理論、コロナ社、1995」に記載のレイリー商の定理より、g(w)の最大値は、(R (f))−1/2(R (f))(R (f))−1/2の最大固有値λで与えられ、対応する固有ベクトルをeとすると、最大値はmaxg(w)=λ=g(e)となる。すなわち求める最大利得ビームフォーマwは以下の式(34)(35)で表すことができる。
=e (34)
=(R (f))−1/2e (35)
実施例5の機能構成例を図9に示す。実施例1と比較して、観測信号相関行列推定部72が追加され、ビームフォーマ計算部28は、目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、補正ベクトル計算部78、補正部80、とで構成されている。
Here, from the Rayleigh quotient theorem described in “Kodama, Suda,“ Matrix Theory for System Control, Corona, 1995 ”, the maximum value of g (w ) is (R J n (f)) −1. / 2 (R T n (f )) is given by (R J n (f)) the maximum eigenvalue of -1/2 lambda, when the corresponding eigenvectors and e, the maximum value maxg (w ~) = λ = g (E). Maximum gain beamformer w n for obtaining That can be expressed by the following equation (34) (35).
w ~ = e (34)
w n = (R J n (f)) − 1/2 e (35)
FIG. 9 shows a functional configuration example of the fifth embodiment. Compared with the first embodiment, an observation signal correlation matrix estimation unit 72 is added, and a beamformer calculation unit 28 includes a target signal correlation matrix estimation unit 70, an eigenvector calculation unit 74, a maximum gain beamformer calculation unit 76, and a correction vector calculation. Part 78 and correction part 80.

目的信号相関行列推定部70で、クラスタの情報から目的信号s(f、τ)のみの時間区間の相関行列を以下の式(36)(37)で推定する。

Figure 2008060635
ここで、Cは目的信号に対応するクラスタである。不要信号相関行列推定部25よりの不要信号相関行列R (f)と、目的信号相関行列R (f)とが、固有ベクトル計算部74に入力される。固有ベクトル計算部74で(R (f))−1/2(R (f))(R (f))−1/2の最大固有ベクトルe(f)を上記で説明したレイリー商の定理より、計算する。 The target signal correlation matrix estimation unit 70 estimates the correlation matrix of the time interval of only the target signal s n (f, τ) from the cluster information using the following equations (36) and (37).
Figure 2008060635
Here, C n is a cluster corresponding to the target signal. The unnecessary signal correlation matrix R J n (f) and the target signal correlation matrix R T n (f) from the unnecessary signal correlation matrix estimation unit 25 are input to the eigenvector calculation unit 74. In the eigenvector calculation unit 74, the maximum eigenvector e n (f) of (R J n (f)) − 1/2 (R T n (f)) (R J n (f)) − 1/2 has been described above. Calculate from the Rayleigh quotient theorem.

不要信号相関行列推定部25よりのR (f)と固有ベクトル計算部74よりのe(f)とが最大利得ビームフォーマ計算部76に入力される。最大利得ビームフォーマ計算部76では、以下の式(38)より最大利得ビームフォーマw(f)を計算する。
(f)=(R (f))−1/2(f) (38)
この式(38)は、上記式(35)に基づいている。
R J n (f) from the unnecessary signal correlation matrix estimation unit 25 and e n (f) from the eigenvector calculation unit 74 are input to the maximum gain beamformer calculation unit 76. The maximum gain beamformer calculation unit 76 calculates the maximum gain beamformer w n (f) from the following equation (38).
w n (f) = (R J n (f)) -1/2 e n (f) (38)
This equation (38) is based on the above equation (35).

一方、観測信号相関行列推定部72で、観測信号ベクトルx(f、τ)の相関行列である観測信号相関行列R(f)を以下の式(39)を用いて推定する。
(f)=E{x(f、τ)x(f、τ)} (39)
補正ベクトル計算部78に、最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマw(f)と、観測信号相関行列推定部72よりの観測信号相関行列R(f)が入力される。補正ベクトル計算部78では、最大利得ビームフォーマw(f)を補正するための補正ベクトルα(f)を生成する。この補正は、最大利得ビームフォーマw(f)が出力に与える歪みが最小になるよう最大利得ビームフォーマw(f)を変換する。例えば、以下の式(40)であらわされる観測信号ベクトルx(f、τ)と出力信号ベクトルy(f、τ)との誤差Aを最小にする補正ベクトルα(f)を計算する。
A(α(f))=E{‖x(f、τ)−α(f)y(f、τ)‖} (40)
ここで、y(f、τ)は最大利得ビームフォーマw(f)の出力y(f、τ)=w(f)x(f、τ)である。
上記式(40)の右辺を展開すると、
A(α(f))={E[‖x(f、τ)‖]}−α(f)E[x(f、τ)y(f、τ)]−α (f)E[y(f、τ)x(f、τ)]
+αα E[│y(f、τ)│] (41)
式(41)において、両辺をα (f)で偏微分すると、以下の式(42)になる。
∂A(α(f))/∂ α (f)=
−E[y(f、τ)x(f、τ)]+αE[│y(f、τ)│] (42)
上記式(42)の左辺を0とおき、αについて求めると、以下の式(43)になる。
α(f)=E[y(f、τ)x(f、τ)]/E[│y(f、τ)│
(43)
ここで、上記式(19)と上記式(39)より上記式(43)は以下の式(44)になる。
On the other hand, the observation signal correlation matrix estimation unit 72 estimates an observation signal correlation matrix R x (f) that is a correlation matrix of the observation signal vector x (f, τ) using the following equation (39).
R x (f) = E {x (f, τ) x H (f, τ)} (39)
The maximum gain beamformer w n (f) from the maximum gain beamformer calculation unit 76 and the observation signal correlation matrix R x (f) from the observation signal correlation matrix estimation unit 72 are input to the correction vector calculation unit 78. The correction vector calculator 78 generates a correction vector α n (f) for correcting the maximum gain beamformer w n (f). This correction converts the maximum gain beamformer w n (f) so that the distortion that the maximum gain beamformer w n (f) gives to the output is minimized. For example, a correction vector α n (f) that minimizes an error A between the observed signal vector x (f, τ) and the output signal vector y n (f, τ) expressed by the following equation (40) is calculated.
A (α n (f)) = E {‖x (f, τ) -α n (f) y n (f, τ) ‖ 2} (40)
Here, y n (f, τ) is the output y n (f, τ) = w n (f) x (f, τ) of the maximum gain beamformer w n (f).
When the right side of the above equation (40) is expanded,
A (α n (f)) = {E [‖x (f, τ) ‖]} 2 −α n (f) E [x H (f, τ) y n (f, τ)] − α n H (f) E [y n (f, τ) * x (f, τ)]
+ Α n α n H E [ │y n (f, τ) │ 2] (41)
In equation (41), when both sides are partially differentiated by α n H (f), the following equation (42) is obtained.
∂A (α n (f)) / ∂ α n H (f) =
−E [y n (f, τ) * x (f, τ)] + α n E [| y n (f, τ) | 2 ] (42)
When the left side of the equation (42) is set to 0 and α n is obtained, the following equation (43) is obtained.
α n (f) = E [y n (f, τ) * x (f, τ)] / E [| y n (f, τ) | 2 ]
(43)
Here, from the above equation (19) and the above equation (39), the above equation (43) becomes the following equation (44).

Figure 2008060635
ここで、上述したように、R(f)は観測信号ベクトルx(f、τ)の相関行列である。上記式(44)から理解されるように、最大利得ビームフォーマw(f)と観測信号ベクトルx(f、τ)を用いて、補正ベクトル計算部78では、補正ベクトルα(f)が計算される。
Figure 2008060635
Here, as described above, R x (f) is a correlation matrix of the observed signal vector x (f, τ). As can be understood from the above equation (44), the correction vector α n (f) is calculated by the correction vector calculator 78 using the maximum gain beamformer w n (f) and the observed signal vector x (f, τ). Calculated.

補正部80は、最大利得ビームフォーマw(f)に対し、補正ベクトルα(f)を用いて、周波数歪みを補正し、補正ビームフォーマを計算する。具体的には以下の式(45)により補正して補正ビームフォーマw’(f)を求めることが出来る。
’(f)=[α(f)](f) (45)
ここで、Bは任意のセンサの番号であり、B∈{1、...、M}であり、[q]はベクトルqのB番目の要素であることを示している。
The correction unit 80 corrects the frequency distortion for the maximum gain beamformer w n (f) using the correction vector α n (f), and calculates a corrected beamformer. Specifically, the corrected beamformer w n ′ (f) can be obtained by correction using the following equation (45).
w n ′ (f) = [α n (f)] B w n (f) (45)
Here, B is the number of an arbitrary sensor, and Bε {1,. . . , M}, and [q] B indicates the Bth element of the vector q.

目的信号抽出部30では、補正ビームフォーマw’(f)を用いて、以下の式(46)で目的信号y(f、τ)を抽出する。
(f、τ)=w(f)x(f、τ) (46)
また、実施例5の変形例の機能構成例を図10に示す。ビームフォーマ計算部28は目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、とで構成され、目的信号抽出部30は信号抽出部81と歪み補正部82とで構成されている。
The target signal extraction unit 30 extracts the target signal y n (f, τ) by the following equation (46) using the corrected beam former w n ′ (f).
y n (f, τ) = w nH (f) x (f, τ) (46)
FIG. 10 shows a functional configuration example of a modification of the fifth embodiment. The beamformer calculation unit 28 includes an objective signal correlation matrix estimation unit 70, an eigenvector calculation unit 74, and a maximum gain beamformer calculation unit 76, and the target signal extraction unit 30 includes a signal extraction unit 81 and a distortion correction unit 82. Has been.

最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマw(f)と、周波数領域変換部5よりの観測信号ベクトルx(f、τ)とは、信号抽出部81に入力される。信号抽出部81では、以下の式(47)を計算して、歪みを含んだ目的信号y(f、τ)を抽出する。
(f、τ)=w (f)x(f、τ) (47)
歪みを含んだ目的信号y(f、τ)は歪み補正部82に入力される。
また、補正ベクトル計算部78よりの補正ベクトルα(f)も歪み補正部82に入力される。歪み補正部82では、以下の式(48)で出力信号を変換することで、歪みを補正して補正出力信号y’(f、τ)を出力する。
’(f、τ)=[α(f)](f、τ) (48)
なお、以上で説明した実施例1〜5では、全てのnについて信号を抽出するとしてきたが、単独の信号(1つのn)についてのみ、ビームフォーマを構成するだけでもよい。目的信号の選択については、例えば、データベース上の目的信号のインパルス応答ベクトルhと発明法により全ての音源nについて推定されたインパルス応答ベクトルhを比較して、最もhに近いhを持つ音源nを選ぶことで選択できる。例えば、min(h・h)などのアルゴリズムが考えられる。選ばれたnについてのみ実施例2〜5で説明したビームフォーマ計算部28による上記式(24)などを用いたビームフォーマを構成すれば、目的信号についての適応型ビームフォーマを得ることができる。
The maximum gain beamformer w n (f) from the maximum gain beamformer calculation unit 76 and the observation signal vector x (f, τ) from the frequency domain conversion unit 5 are input to the signal extraction unit 81. The signal extraction unit 81 calculates the following equation (47) to extract the target signal y n (f, τ) including distortion.
y n (f, τ) = w n H (f) x (f, τ) (47)
The target signal y n (f, τ) including distortion is input to the distortion correction unit 82.
The correction vector α n (f) from the correction vector calculation unit 78 is also input to the distortion correction unit 82. The distortion correction unit 82 converts the output signal according to the following equation (48) to correct the distortion and output a corrected output signal y n ′ (f, τ).
y n '(f, τ) = [α n (f)] B y n (f, τ) (48)
In the first to fifth embodiments described above, signals are extracted for all n. However, a beam former may be configured only for a single signal (one n). For purposes signal selection, for example, by comparing the impulse response vector h n, which is estimated for all the sound sources n by the impulse response vector h d and invention method object signal on the database, the h n closest to the h d The sound source n can be selected by selecting it. For example, an algorithm such as min n (h 1 · h n ) is conceivable. An adaptive beamformer for a target signal can be obtained by configuring a beamformer using the above formula (24) by the beamformer calculation unit 28 described in the second to fifth embodiments for only selected n.

[実験結果]
上記実施例の効果を示すために、実験を行った。図11に示す部屋で測定したインパルス応答を複数の音声に畳み込み混合することで、混合信号を模した。実験条件は図11に示す通りである。長辺が880cm、短辺が375cm、高さが240cm、残響は120msの室内において、底面の長辺から200cm、短辺から282cmの位置に3つのセンサ41、42、43を配置した。長辺と平行軸をx、短辺と平行軸をyとし、図12に示すように、3つのセンサ41、42、43をy軸上に2個、x軸上に1個、辺の長さ4cmの正三角形の頂点につまり2次元に配した場合の実験を行う。またセンサとしてはマイクロホンを用いた。
4通りの音声組み合わせについて、信号対不要信号比(SIR)と信号対歪み比(SDR)を評価した。なお、単位はdBである。
[Experimental result]
Experiments were conducted to show the effects of the above examples. The impulse response measured in the room shown in FIG. 11 was convolved with a plurality of sounds and mixed to simulate the mixed signal. The experimental conditions are as shown in FIG. Three sensors 41, 42, and 43 were arranged at positions 200 cm from the long side of the bottom surface and 282 cm from the short side in a room having a long side of 880 cm, a short side of 375 cm, a height of 240 cm, and a reverberation of 120 ms. The long side and the parallel axis are x, the short side and the parallel axis are y, and as shown in FIG. 12, three sensors 41, 42 and 43 are provided on the y axis, one on the x axis, and the length of the side. An experiment is conducted in the case where the vertices are arranged in two dimensions at the apex of a regular triangle of 4 cm in length. A microphone was used as the sensor.
The signal-to-unnecessary signal ratio (SIR) and the signal-to-distortion ratio (SDR) were evaluated for four voice combinations. The unit is dB.

4つの音源をセンサ位置におけるx軸とy軸の交点を中心とし、x軸の+方向を0度とし、左回りに30度、315度方向とセンサ位置を中心と半径50cmの円との各交差点上にそれぞれの音源を、225度、315度の方向と半径80cmの円との交差点上に、それぞれ音源を配置させる。実施例2の効果を確かめる実験では、120度、225度、315度方向の音源を用い、N(源信号の数)=M(センサの数)=3とした。また実施例3の効果を確かめる実験ではN=4、M=3とした。   Each of the four sound sources is centered on the intersection of the x-axis and y-axis at the sensor position, the + direction of the x-axis is 0 degree, 30 degrees counterclockwise, 315 degrees, and the sensor position is centered on a circle with a radius of 50 cm. Each sound source is arranged on the intersection, and the sound source is arranged on the intersection between the directions of 225 degrees and 315 degrees and a circle having a radius of 80 cm. In the experiment for confirming the effect of the second embodiment, sound sources with directions of 120 degrees, 225 degrees, and 315 degrees were used, and N (number of source signals) = M (number of sensors) = 3. In an experiment for confirming the effect of Example 3, N = 4 and M = 3.

図13にこの実験の結果を示す。実施例3は従来法、実施例2、実施例2’、実施例4、実施例5において、図7記載の入力信号推定部50を設けた場合を示す。従来法では、図1記載の適応型ビームフォーマ6を表す上記式(10)において、h(f)に既知のステアリングベクトルa(f)を与えたものを用いた。この場合、N=Mの場合も、N>Mの場合も、共に高い性能を得られなかった。これは、残響のある環境での実験であるため、与えられたステアリングベクトルa(f)が残響の影響まで、考慮できなかったことが主な原因として考えられる。また、N>Mの場合に十分なSIRが得られないのは、適応型ビームフォーマの限界つまりM−1個の不要信号しか効果的に抑圧できないことを示している。 FIG. 13 shows the results of this experiment. The third embodiment shows a case where the input signal estimation unit 50 shown in FIG. 7 is provided in the conventional method, the second embodiment, the second embodiment 2 ′, the fourth embodiment, and the fifth embodiment. In the conventional method, the equation (10) representing the adaptive beamformer 6 shown in FIG. 1 is used in which a known steering vector a n (f) is given to h n (f). In this case, high performance was not obtained in both cases of N = M and N> M. This is because an experiment in an environment with reverberation, given steering vector a n (f) until the influence of the reverberation, considered as a main cause that could not be taken into account. Also, the fact that sufficient SIR cannot be obtained when N> M indicates that the limit of the adaptive beamformer, that is, only M−1 unnecessary signals can be effectively suppressed.

従来法に対し、N=Mの場合、N>Mの場合であっても、上記実施例はSIR、SDRの値を比較すると、従来法よりも高い性能を持つことが理解される。     Compared to the conventional method, even when N = M and N> M, it is understood that the above embodiment has higher performance than the conventional method when comparing the values of SIR and SDR.

以上の各実施形態の他、本発明であるブラインド信号抽出装置は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、ブラインド信号抽出装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。     In addition to the above embodiments, the blind signal extraction device according to the present invention is not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. Further, the processing described in the blind signal extraction device is not only executed in time series according to the order of description, but may also be executed in parallel or individually as required by the processing capability of the device that executes the processing. Good.

また、この発明のブラインド信号抽出装置における処理をコンピュータによって実現する場合、ブラインド信号抽出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、ブラインド信号抽出装置における処理機能がコンピュータ上で実現される。   Further, when the processing in the blind signal extraction device of the present invention is realized by a computer, the processing contents of the functions that the blind signal extraction device should have are described by a program. Then, by executing this program on a computer, the processing function of the blind signal extraction device is realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto−Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable−Read Only Memory)等を用いることができる。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape, and the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable-Programmable-Ready), etc. Can be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. A configuration in which the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes a processing function only by an execution instruction and result acquisition without transferring a program from the server computer to the computer. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ブラインド信号抽出装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。     In this embodiment, the blind signal extraction apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

この発明は、オーディオ分野の応用として、音声認識機の入力マイクロホンと話者が離れた位置にあるためマイクロホンが目的話者音声以外の音まで収音してしまうような状況でも、目的音声を分離抽出することで、認識率の高い音声認識系の構築が可能になる。     As an application in the audio field, the present invention separates target voices even in situations where the microphone picks up sounds other than the target speaker voice because the input microphone of the voice recognizer and the speaker are separated from each other. By extracting, it is possible to construct a speech recognition system with a high recognition rate.

従来技術のシステムの機能構成例を示すブロック図。The block diagram which shows the function structural example of the system of a prior art. 直線状に配置したセンサシステムを用いた場合において、音源nが任意のセンサjに達する時刻と原点0に達する時刻との時間差τを説明するための図。The figure for demonstrating the time difference (tau) between the time when the sound source n reaches the arbitrary sensors j, and the time when it reaches the origin 0 in the case of using the sensor system arranged in a straight line. この発明の実施例1のシステムの機能構成例を示すブロック図。1 is a block diagram showing a functional configuration example of a system according to Embodiment 1 of the present invention. この発明の実施例1の主な処理の流れを示すフローチャート。The flowchart which shows the flow of the main processes of Example 1 of this invention. 任意の2つのセンサであるセンサmとセンサQとにおいて、上記式(16)で使用するcosΘ mQを説明するための図。The figure for demonstrating cos ( theta ) nmQ used by the said Formula (16) in the sensor m and the sensor Q which are arbitrary two sensors. この発明の実施例2のシステムの機能構成例の一部を示すブロック図。The block diagram which shows a part of example of a function structure of the system of Example 2 of this invention. この発明の実施例3のシステムの機能構成例の一部を示すブロック図。The block diagram which shows a part of example of a function structure of the system of Example 3 of this invention. この発明の実施例4のシステムの機能構成例の一部を示すブロック図。The block diagram which shows a part of example of a function structure of the system of Example 4 of this invention. この発明の実施例5のシステムの機能構成例の一部を示すブロック図。The block diagram which shows a part of example of a function structure of the system of Example 5 of this invention. この発明の実施例5の変形例のシステムの機能構成例の一部を示すブロック図。The block diagram which shows a part of example of a function structure of the system of the modification of Example 5 of this invention. 従来の技術とこの発明の技術との比較実験を真上から見た図。The figure which looked at the comparison experiment of the prior art and the technique of this invention from right above. 図11の3つのセンサ41、42、43の位置関係の詳細を示す図。The figure which shows the detail of the positional relationship of the three sensors 41, 42, and 43 of FIG. 従来の技術とこの発明の技術の効果を比較した実験結果を示す図。The figure which shows the experimental result which compared the effect of the prior art and the technique of this invention.

Claims (14)

N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、
上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換部と、
上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化部と、
上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング部と、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定部と、
上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算部と、
上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出部と、
上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換部と、を具備することを特徴とするブラインド信号抽出装置。
In a signal extraction apparatus for observing signals emitted from N signal sources with M sensors and extracting one or more of the observed signals, where N and M are integers of 2 or more Yes,
A frequency domain conversion unit that converts observation signals observed by the M sensors into a frequency domain signal;
A normalization unit that normalizes the frequency domain signal and calculates a normalized observation signal vector;
A clustering unit for clustering the normalized observation signal vector into N clusters;
An unnecessary signal correlation matrix estimation unit that estimates an unnecessary signal correlation matrix that is a correlation matrix of an observation signal including only unnecessary signals from the information of the cluster,
A beamformer calculation unit for calculating a beamformer from the information on the cluster and the unnecessary signal correlation matrix;
A target signal extraction unit that extracts a target signal from the frequency domain signal using the beamformer;
A blind signal extraction apparatus comprising: a time domain conversion unit that converts the extracted target signal into a time domain signal.
請求項1記載のブラインド信号抽出装置であって、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。
The blind signal extraction device according to claim 1,
The beamformer calculation unit
An impulse response estimator for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculation unit that calculates an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix,
The blind signal extraction apparatus, wherein the target signal extraction unit extracts the target signal from the frequency domain signal using the adaptive beamformer.
請求項1記載のブラインド信号抽出装置であって、
上記不要信号相関行列推定部は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定するものであり、ただし、KはK≦M−1を満たす整数であり、
更に、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定部を有し、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。
The blind signal extraction device according to claim 1,
The unnecessary signal correlation matrix estimation unit estimates an unnecessary signal correlation matrix that is a correlation matrix of K unnecessary signals selected from the cluster information, where K is an integer that satisfies K ≦ M−1. And
And an input signal estimation unit for estimating a beamformer input signal including only the target signal and the selected K unnecessary signals from the cluster information,
The beamformer calculation unit
An impulse response estimator for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculation unit that calculates an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix, and
The blind signal extraction apparatus, wherein the target signal extraction unit extracts the target signal from the beamformer input signal using the adaptive beamformer.
請求項2又は3記載のブラインド信号抽出装置であって、
更に、上記M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部を備え、
上記インパルス応答推定部は、
上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定部と、
上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算部と、で構成されていることを特徴とするブラインド信号抽出装置。
The blind signal extraction device according to claim 2 or 3,
Furthermore, a sensor position information storage unit storing sensor position information representing the positions of the M sensors is provided,
The impulse response estimator is
A direction-of-arrival estimation unit that estimates a direction of arrival of a signal using the sensor position information and the centroid information of the cluster;
A blind signal extraction device comprising: an estimated response arrival direction; and an impulse response calculation unit that calculates an impulse response from the sensor position information.
請求項1記載のブラインド信号抽出装置であって、
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部と、
上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正部と、を具備し、
上記目的信号抽出部は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出するものである、
ことを特徴とするブラインド信号抽出装置。
The blind signal extraction device according to claim 1,
Furthermore, an observation signal correlation matrix estimation unit for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal is provided,
The beamformer calculation unit
A target signal correlation matrix estimator for estimating a target signal correlation matrix that is a correlation matrix of an observation signal including the target signal from the cluster information;
A maximum gain beamformer calculation unit for calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
A correction unit that corrects frequency distortion using the observed signal correlation matrix and calculates a corrected beamformer for the maximum gain beamformer, and
The target signal extraction unit extracts the target signal from the frequency domain signal using the correction beamformer.
A blind signal extraction device characterized by that.
請求項1記載のブラインド信号抽出装置であって、
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部とを具備し、
上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算部を備え、
上記目的信号抽出部は、
上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出部と、
上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正部とを具備する
ことを特徴とするブラインド信号抽出装置。
The blind signal extraction device according to claim 1,
Furthermore, an observation signal correlation matrix estimation unit for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal is provided,
The beamformer calculation unit
A target signal correlation matrix estimator for estimating a target signal correlation matrix that is a correlation matrix of an observation signal including the target signal from the cluster information;
A maximum gain beamformer calculation unit for calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
A correction vector calculation unit that calculates a correction vector using the observed signal correlation matrix and the maximum gain beamformer,
The target signal extraction unit
A signal extraction unit that extracts a target signal including distortion from the frequency domain signal using the maximum beamformer;
A blind signal extraction apparatus comprising: a distortion correction unit that performs distortion correction on the target signal including the extracted distortion using the correction vector and outputs the target signal.
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出方法において、ただし、N、Mは2以上の整数であり、
周波数領域変換手段が、上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換過程と、
正規化手段が、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化過程と、
クラスタリング手段が、上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング過程と、
不要信号相関行列推定過程が、上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定過程と、
ビームフォーマ計算手段が、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算過程と、
目的信号抽出手段が、上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出過程と、
時間領域変換手段が、上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換過程と、を有することを特徴とするブラインド信号抽出方法。
In a signal extraction method of observing signals emitted from N signal sources with M sensors and extracting one or more signals from the observed signals, N and M are integers of 2 or more. Yes,
A frequency domain transforming process in which the frequency domain transforming means transforms the observation signals observed by the M sensors into signals in the frequency domain;
A normalization process in which the normalization means normalizes the frequency domain signal and calculates a normalized observation signal vector;
A clustering process in which the clustering means clusters the normalized observation signal vector into N clusters;
An unnecessary signal correlation matrix estimation process is an unnecessary signal correlation matrix estimation process for estimating an unnecessary signal correlation matrix that is a correlation matrix of an observation signal including only an unnecessary signal from the information of the cluster,
A beamformer calculating means for calculating a beamformer from the cluster information and the unnecessary signal correlation matrix;
A target signal extraction means for extracting a target signal from the frequency domain signal using the beam former;
A blind signal extraction method comprising: a time domain conversion process in which time domain conversion means converts the extracted target signal into a time domain signal.
請求項7記載のブラインド信号抽出方法であって、
上記ビームフォーマ計算過程は、
インパルス応答推定手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算過程と、を有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。
The blind signal extraction method according to claim 7,
The beamformer calculation process is as follows:
An impulse response estimation means for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculation means comprising: an adaptive beamformer calculation process for calculating an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix;
The blind signal extraction method, wherein the target signal extraction step is a step of extracting the target signal from the frequency domain signal using the adaptive beamformer.
請求項7記載のブラインド信号抽出方法であって、
上記不要信号相関行列推定過程は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定する過程であり、ただし、KはK≦M−1を満たす整数であり、
更に、入力信号推定手段が、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定過程を有し、
上記ビームフォーマ計算過程は、
インパルス応答手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算過程とを有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。
The blind signal extraction method according to claim 7,
The unnecessary signal correlation matrix estimation process is a process of estimating an unnecessary signal correlation matrix that is a correlation matrix of K unnecessary signals selected from the cluster information, where K is an integer satisfying K ≦ M−1. And
Further, the input signal estimation means has an input signal estimation process for estimating a beamformer input signal including only the target signal and the selected K unnecessary signals from the cluster information,
The beamformer calculation process is as follows:
An impulse response means for estimating an impulse response of the target signal from the centroid information of the cluster;
An adaptive beamformer calculating means includes an adaptive beamformer calculating step of calculating an adaptive beamformer using the impulse response and the unnecessary signal correlation matrix;
The blind signal extraction method, wherein the target signal extraction step is a step of extracting a target signal from the beamformer input signal using the adaptive beamformer.
請求項8又は9記載のブラインド信号抽出方法であって、
上記インパルス応答推定過程は、
到来方向推定手段が、センサ位置情報記憶部中の上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定過程と、ここで、センサ位置情報記憶部とは、上記M個のセンサの位置を表すセンサ位置情報を記憶しているものであり、
インパルス応答計算手段が、上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算過程と、を有することを特徴とするブラインド信号抽出方法。
A blind signal extraction method according to claim 8 or 9, wherein
The impulse response estimation process is as follows:
An arrival direction estimation unit in which an arrival direction estimation unit estimates an arrival direction of a signal using the sensor position information in the sensor position information storage unit and the centroid information of the cluster, and here, a sensor position information storage unit Is stored sensor position information indicating the positions of the M sensors.
A blind signal extraction method, wherein the impulse response calculation means includes an impulse response calculation step of calculating an impulse response from the estimated arrival direction of the signal and the sensor position information.
請求項7記載のブラインド信号抽出方法であって、
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程と、
補正手段が、上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正過程と、を有し、
上記目的信号抽出過程は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する過程である、
ことを特徴とするブラインド信号抽出方法。
The blind signal extraction method according to claim 7,
Further, the observation signal correlation matrix estimation means includes an observation signal correlation matrix estimation process for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal,
The beamformer calculation process is as follows:
A target signal correlation matrix estimation means for estimating a target signal correlation matrix, which is a correlation matrix of an observation signal including the target signal, from the cluster information;
A maximum gain beamformer calculating means for calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
A correcting means for correcting the frequency distortion using the observed signal correlation matrix for the maximum gain beamformer and calculating a corrected beamformer, and
The target signal extraction process is a process of extracting a target signal from the frequency domain signal using the correction beamformer.
And a blind signal extraction method.
請求項7記載のブラインド信号抽出方法であって、
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程とを有し、
更に、補正ベクトル計算手段が、上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算過程を有し、
上記目的信号抽出過程は、
信号抽出手段が、上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出過程と、
歪み補正手段が、上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正過程とを有する
ことを特徴とするブラインド信号抽出方法。
The blind signal extraction method according to claim 7,
Further, the observation signal correlation matrix estimation means includes an observation signal correlation matrix estimation process for estimating an observation signal correlation matrix that is a correlation matrix of the observation signal from the observation signal,
The beamformer calculation process is as follows:
A target signal correlation matrix estimation means for estimating a target signal correlation matrix, which is a correlation matrix of an observation signal including the target signal, from the cluster information;
A maximum gain beamformer calculating means includes a maximum gain beamformer calculating step of calculating a maximum gain beamformer from the unnecessary signal correlation matrix and the target signal correlation matrix;
Further, the correction vector calculation means has a correction vector calculation step of calculating a correction vector using the observed signal correlation matrix and the maximum gain beamformer,
The target signal extraction process is as follows:
A signal extraction process in which a signal extraction means extracts a target signal including distortion from the frequency domain signal using the maximum beamformer;
A blind signal extraction comprising: a distortion correction process, wherein distortion correction means performs distortion correction on the target signal including the extracted distortion by using the correction vector, and outputs the target signal. Method.
請求項7〜12の何れかに記載のブラインド信号抽出方法の各過程をコンピュータに実行させるためのブラインド信号抽出プログラム。   The blind signal extraction program for making a computer perform each process of the blind signal extraction method in any one of Claims 7-12. 請求項13記載のブラインド信号抽出プログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the blind signal extraction program according to claim 13 is recorded.
JP2006231648A 2006-08-29 2006-08-29 Blind signal extraction device, method thereof, program thereof, and recording medium recording the program Expired - Fee Related JP4738284B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006231648A JP4738284B2 (en) 2006-08-29 2006-08-29 Blind signal extraction device, method thereof, program thereof, and recording medium recording the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006231648A JP4738284B2 (en) 2006-08-29 2006-08-29 Blind signal extraction device, method thereof, program thereof, and recording medium recording the program

Publications (2)

Publication Number Publication Date
JP2008060635A true JP2008060635A (en) 2008-03-13
JP4738284B2 JP4738284B2 (en) 2011-08-03

Family

ID=39242931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006231648A Expired - Fee Related JP4738284B2 (en) 2006-08-29 2006-08-29 Blind signal extraction device, method thereof, program thereof, and recording medium recording the program

Country Status (1)

Country Link
JP (1) JP4738284B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181467A (en) * 2009-02-03 2010-08-19 Nippon Telegr & Teleph Corp <Ntt> A plurality of signals emphasizing device and method and program therefor
JP2016122111A (en) * 2014-12-25 2016-07-07 日本電信電話株式会社 Filter coefficient calculation device, voice reproducer, filter coefficient calculation method and program
JP2018141922A (en) * 2017-02-28 2018-09-13 日本電信電話株式会社 Steering vector estimation device, steering vector estimating method and steering vector estimation program
US20220383106A1 (en) * 2019-06-20 2022-12-01 Nippon Telegraph And Telephone Corporation Training data extension apparatus, training data extension method, and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09251299A (en) * 1996-03-15 1997-09-22 Toshiba Corp Microphone array input type voice recognition device and its method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09251299A (en) * 1996-03-15 1997-09-22 Toshiba Corp Microphone array input type voice recognition device and its method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6011005009, Araki S. ,Sawada H. ,Mukai R. ,Makino S., "Doa Estimation for Multiple Sparse Sources with Normalized Observation Vector Clustering", 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, 200603, ICASSP2006, V−33〜V−36, US, IEEE *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181467A (en) * 2009-02-03 2010-08-19 Nippon Telegr & Teleph Corp <Ntt> A plurality of signals emphasizing device and method and program therefor
JP2016122111A (en) * 2014-12-25 2016-07-07 日本電信電話株式会社 Filter coefficient calculation device, voice reproducer, filter coefficient calculation method and program
JP2018141922A (en) * 2017-02-28 2018-09-13 日本電信電話株式会社 Steering vector estimation device, steering vector estimating method and steering vector estimation program
US20220383106A1 (en) * 2019-06-20 2022-12-01 Nippon Telegraph And Telephone Corporation Training data extension apparatus, training data extension method, and program
US11886996B2 (en) * 2019-06-20 2024-01-30 Nippon Telegraph And Telephone Corporation Training data extension apparatus, training data extension method, and program

Also Published As

Publication number Publication date
JP4738284B2 (en) 2011-08-03

Similar Documents

Publication Publication Date Title
US7626889B2 (en) Sensor array post-filter for tracking spatial distributions of signals and noise
CN105981404B (en) Use the extraction of the reverberation sound of microphone array
EP1856948B1 (en) Position-independent microphone system
KR102087307B1 (en) Method and apparatus for estimating direction of ensemble sound source based on deepening neural network for estimating direction of sound source robust to reverberation environment
JPWO2006085537A1 (en) Signal separation device, signal separation method, signal separation program, and recording medium
JP2010519602A (en) System, method and apparatus for signal separation
JP2008079256A (en) Acoustic signal processing apparatus, acoustic signal processing method, and program
US20140078867A1 (en) Sound direction estimation device, sound direction estimation method, and sound direction estimation program
JP7235534B2 (en) Microphone array position estimation device, microphone array position estimation method, and program
CN113126028B (en) Noise source positioning method based on multiple microphone arrays
WO2020079957A1 (en) Audio signal processing device and noise suppression method
JP5911101B2 (en) Acoustic signal analyzing apparatus, method, and program
JP4738284B2 (en) Blind signal extraction device, method thereof, program thereof, and recording medium recording the program
Diaz-Guerra et al. Direction of arrival estimation of sound sources using icosahedral CNNs
JP6538624B2 (en) Signal processing apparatus, signal processing method and signal processing program
JP4676893B2 (en) Signal arrival direction estimation device, signal arrival direction estimation method, signal arrival direction estimation program, and recording medium
US11482239B2 (en) Joint source localization and separation method for acoustic sources
Salvati et al. Acoustic source localization using a geometrically sampled grid SRP-PHAT algorithm with max-pooling operation
JP6182169B2 (en) Sound collecting apparatus, method and program thereof
JP4630203B2 (en) Signal separation device, signal separation method, signal separation program and recording medium, signal arrival direction estimation device, signal arrival direction estimation method, signal arrival direction estimation program and recording medium
Bu et al. TDOA estimation of speech source in noisy reverberant environments
JP2018077139A (en) Sound field estimation device, sound field estimation method and program
JP2004279845A (en) Signal separating method and its device
JP7207539B2 (en) LEARNING DATA EXTENSION DEVICE, LEARNING DATA EXTENSION METHOD, AND PROGRAM
Ke et al. Compressing sensing based source localization for controlled acoustic signals using distributed microphone arrays

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110419

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110426

R150 Certificate of patent or registration of utility model

Ref document number: 4738284

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees