JP2007178590A - Object signal extracting device and method therefor, and program - Google Patents

Object signal extracting device and method therefor, and program Download PDF

Info

Publication number
JP2007178590A
JP2007178590A JP2005375284A JP2005375284A JP2007178590A JP 2007178590 A JP2007178590 A JP 2007178590A JP 2005375284 A JP2005375284 A JP 2005375284A JP 2005375284 A JP2005375284 A JP 2005375284A JP 2007178590 A JP2007178590 A JP 2007178590A
Authority
JP
Japan
Prior art keywords
separation matrix
target signal
signal
criterion
component analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005375284A
Other languages
Japanese (ja)
Inventor
Shi Cho
志鵬 張
Minoru Eito
稔 栄藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2005375284A priority Critical patent/JP2007178590A/en
Publication of JP2007178590A publication Critical patent/JP2007178590A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an object signal extracting device and method therefor, and program which can extract the object signals from mixed signals at high speed, as well as with accuracy. <P>SOLUTION: The matrix-diagonalization calculation section 11 of the object signal extracting device 10 obtains an isolated matrix by independent component analysis, based on the maximum criteria of the posterior probability, and the object signal extracting section 12 extracts the object signals from the mixed signals by using the matrix diagonalization. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、混合信号から目的信号を抽出する目的信号抽出装置、目的信号抽出方法、及び、プログラムに関するものである。   The present invention relates to a target signal extraction apparatus, a target signal extraction method, and a program for extracting a target signal from a mixed signal.

混合信号から目的信号を分離抽出する手法の一つとして独立成分分析(Independent Component Analysis : ICA、以下「ICA」ともいう)による手法がある。これは、複数の線形混合された信号を、元の信号や混合過程についての知識を全く用いることなしに推定する手法であり、ブラインド音源分離(Blind Source Separation : BSS)とよばれる。まず、ブラインド音源分離について説明する。
・実環境での混合信号(観測信号)モデル
図8は、ICA法によるブラインド音源分離のモデルを示す図である。siを信号源11iの信号、hjiを信号源11iからセンサ12jまでのインパルス応答(周波数応答)、Pをインパルス応答の次数、信号源11iの数をN個(N1)、センサ12jの数をM(M≧N)個、nを離散的時刻とすると、センサ12jで観測される信号yj
One technique for separating and extracting a target signal from a mixed signal is a technique based on independent component analysis (ICA) (hereinafter also referred to as “ICA”). This is a technique for estimating a plurality of linearly mixed signals without using any knowledge about the original signal and mixing process, and is called blind source separation (BSS). First, blind sound source separation will be described.
Mixed Signal (Observed Signal) Model in Real Environment FIG. 8 is a diagram showing a blind source separation model by the ICA method. s i is the signal from the signal source 11 i , h ji is the impulse response (frequency response) from the signal source 11 i to the sensor 12 j , P is the order of the impulse response, and N is the number of the signal sources 11 i (N > 1) ), the sensor 12 j number of M (M ≧ n) pieces of, when the discrete time n, the signal y j observed by the sensor 12 j is

Figure 2007178590
と表現される。ここでN個の信号siは統計的に互いに独立であると仮定する。観測信号yj(n)は一定周期で標本化され、ディジタル信号系列とされている。
・分離信号のモデル
ブラインド音源分離では、式(1)の形で得られる観測信号と、長さがQタップ、インパルス応答がwijのN×M個の分離フィルタ群13ijから成る分離系を用いて分離する。この分離フィルタ群13ijを用いて、分離して得られる信号yi(n)は
Figure 2007178590
It is expressed. Here, it is assumed that the N signals s i are statistically independent of each other. The observation signal y j (n) is sampled at a constant period to form a digital signal sequence.
Separation signal model In blind sound source separation, a separation system consisting of an observation signal obtained in the form of equation (1), N × M separation filter groups 13 ij having a length of Q taps and an impulse response of w ij Use to separate. A signal y i (n) obtained by separation using the separation filter group 13 ij is

Figure 2007178590
と表される。図8には、N=M=2の場合について、信号源111,112とセンサ121,122間の混合過程と、センサ121,122の出力信号y1,y2から2×2個のフィルタ群13ijを用いるICA法により分離信号y1(n),y2(n)を出力端子141,142に得る分離過程を示している。
分離フィルタ係数(周波数応答)wijの推定には、独立成分分析(ICA)と呼ばれる技術が広く用いられる。時間領域信号を周波数領域へ変換し、各周波数において分離行列を求める手法(周波数領域BSS)が広く用いられている(例えば、非特許文献1参照)。
Figure 2007178590
It is expressed. In FIG. 8, in the case of N = M = 2, the mixing process between the signal sources 11 1 and 11 2 and the sensors 12 1 and 12 2 and the output signals y 1 and y 2 of the sensors 12 1 and 12 2 are 2 The separation process of obtaining separation signals y 1 (n) and y 2 (n) at output terminals 14 1 and 14 2 by the ICA method using two filter groups 13 ij is shown.
A technique called independent component analysis (ICA) is widely used for estimating the separation filter coefficient (frequency response) w ij . A technique (frequency domain BSS) for converting a time domain signal into a frequency domain and obtaining a separation matrix at each frequency is widely used (for example, see Non-Patent Document 1).

従来の尤度最大法に基づくICAによる周波数領域BSS法の機能構成を図9に示す。観測信号y1(n),y2(n)を周波数領域変換部で、例えば短時間離散フーリエ変換(DFT)(窓関数を掛け、例えば1/2フレームごとにずらしながら1フレームずつ離散フーリエ変換)して周波数領域の信号Y(ω)に変換する。
尤度最大化基準に基づく分離行列推定部において、各出力信号の周波数領域の信号Yi(f,m)が互いに独立となるように、次式のように分離行列W(f)を推定する。
FIG. 9 shows a functional configuration of the frequency domain BSS method by ICA based on the conventional maximum likelihood method. The observed signals y 1 (n) and y 2 (n) are subjected to a frequency domain transform unit, for example, a short-time discrete Fourier transform (DFT) (multiplied by a window function, for example, discrete Fourier transform frame by frame while shifting every 1/2 frame) ) To convert it to a frequency domain signal Y (ω).
In the separation matrix estimation unit based on the likelihood maximization criterion, the separation matrix W (f) is estimated as in the following equation so that the frequency domain signals Y i (f, m) of each output signal are independent of each other. .

Figure 2007178590
Figure 2007178590

このようにして各周波数成分においての分離が達成される。
時間領域変換部において、周波数領域で出力される信号Yi(f,m)を例えば逆フーリエ変換により時間領域の信号に変換する。こうして得られる分離信号の中から、何らかの手法を用いて目的信号を選ぶことで、目的信号が分離抽出される。
In this way, separation at each frequency component is achieved.
In the time domain transform unit, the signal Y i (f, m) output in the frequency domain is transformed into a time domain signal by, for example, inverse Fourier transform. The target signal is separated and extracted by selecting the target signal from the separated signals obtained in this way by using some method.

周波数領域においてICAを行う問題点の一つとして、分離行列の行が入れかわっても、出力Z1(f,m)とZ2(f,m)の独立性は保たれる。すなわち分離行列の1行目と2行目を入れかえると、一つ目の出力にZ2(f,m)が、二つ目の出力にZ1(f,m)が得られるが、ここでもやはり二つの出力信号は独立である。即ち、ICAは出力信号同士を互いに独立にはするが、その出力順序は拘束しない。 As one of the problems of performing ICA in the frequency domain, the independence of the outputs Z 1 (f, m) and Z 2 (f, m) is maintained even if the separation matrix rows are switched. That is, if the first and second rows of the separation matrix are switched, Z 2 (f, m) is obtained as the first output and Z 1 (f, m) is obtained as the second output. Again, the two output signals are independent. That is, ICA makes output signals independent of each other, but does not constrain the output order.

これより、任意の二つの周波数f1とf2を考えた時、例えば出力信号Z1(f1,m)とZ1(f2,m)とが、同じ信号siに対する推定信号であるとは限らない。従って、周波数領域ICAでは、Zi(f1,m)とZi(f2,m)が同じ信号源の信号siの推定となるように、分離行列の行(各チャンネル)を正しく並べ替える必要がある。これを置換(Permutation)の問題と呼ぶ。
また、従来のICAでは尤度最大の基準に基づいて分離行列を算出しているため、分離行列の値が最適値に収束するまで繰り返し演算を行う必要があり、演算処理に時間を要する。また、算出された最適値はローカル最適値でありグローバル最適値であることは保証されない。
Thus, when any two frequencies f 1 and f 2 are considered, for example, the output signals Z 1 (f 1 , m) and Z 1 (f 2 , m) are estimated signals for the same signal s i. Not necessarily. Therefore, in the frequency domain ICA, the rows (each channel) of the separation matrix are correctly arranged so that Z i (f 1 , m) and Z i (f 2 , m) are estimates of the signal s i of the same signal source. It is necessary to change. This is called a problem of permutation.
In addition, since the conventional ICA calculates the separation matrix based on the maximum likelihood criterion, it is necessary to repeatedly perform the operation until the value of the separation matrix converges to the optimum value, which requires time. Further, the calculated optimum value is a local optimum value and is not guaranteed to be a global optimum value.

特許文献1には、事前知識を利用して、ICAのPermutationの問題を解決する方法が記載されている。特許文献1では、事前知識から算出した分離ベクトル(分離行列の一成分)の初期値を用いて、尤度最大の基準に基づくICAにより分離行列の一成分を算出している(図10参照)。事前知識としての事前周波数応答情報H1(f)は、目的信号源の方位(目的信号到来方向)θを既知としてHj1(f)=exp(j2πfτj1),τj1=(dj /c)sinθ1を計算したもの、あるいは予め測定したものである。既知である周波数応答をH′j1(f)=exp(j2πfτj1)とする。拘束条件として例えば次式で与えられ、
Σj=1 MH′j11j(f)=W1(f)H1(f)=1
Patent Document 1 describes a method for solving the problem of ICA Permutation using prior knowledge. In Patent Document 1, one component of the separation matrix is calculated by ICA based on the maximum likelihood criterion using the initial value of the separation vector (one component of the separation matrix) calculated from prior knowledge (see FIG. 10). . Prior frequency response information H 1 (f) as prior knowledge is obtained by knowing the direction (target signal arrival direction) θ of the target signal source as H j1 (f) = exp (j2πfτ j1 ), τ j1 = (d j / c ) Sin θ 1 calculated or measured in advance. Let the known frequency response be H ′ j1 (f) = exp (j2πfτ j1 ). For example, the constraint condition is given by
Σ j = 1 M H ′ j1 W 1j (f) = W 1 (f) H 1 (f) = 1

この式の条件を満たしながら誤差信号E(f,m)のパワーを最小とする係数W′1j(f)を求める。ここで、H1(f)=[H′11(f),H′21(f)]T,W1(f)=[W11(f),W12(f)]である。上式は、目的信号から出力までの周波数応答を全ての周波数で1にする、という拘束条件となっている。これは目的信号が歪み無く出力されるための条件である。 A coefficient W ′ 1j (f) that minimizes the power of the error signal E (f, m) while satisfying the condition of this equation is obtained. Here, H 1 (f) = [H ′ 11 (f), H ′ 21 (f)] T , W 1 (f) = [W 11 (f), W 12 (f)]. The above equation is a constraint that the frequency response from the target signal to the output is 1 at all frequencies. This is a condition for outputting the target signal without distortion.

また、特許文献2では、信号源の数がセンサの数よりも小さいときに顕著に発生するPermutationの問題を解決している。特許文献2では、周波数領域(FD)および時間領域(TD)での独立成分分析を順次行い、特に、FDICAにおける信号の識別過程を複数個のサブブロックに分割する構成とし、この処理過程で信号源の数を推定した結果を用いて実質的に実働センサの数と信号源の数とを合わせるようにしている。
特許文献3には、音素モデル(HMM)の平均ベクトルを、最大事後確率(MAP;Maximum A Posteriori)推定法により推定する技術が開示されている。
Further, Patent Document 2 solves the problem of permutation that occurs remarkably when the number of signal sources is smaller than the number of sensors. In Patent Document 2, independent component analysis is sequentially performed in the frequency domain (FD) and time domain (TD), and in particular, the signal identification process in FDICA is divided into a plurality of sub-blocks. The number of active sensors and the number of signal sources are substantially matched using the result of estimating the number of sources.
Patent Document 3 discloses a technique for estimating an average vector of a phoneme model (HMM) using a maximum a posteriori (MAP) estimation method.

特開2004−302122号公報JP 2004-302122 A 特開2005−91560号公報JP 2005-91560 A 特開平8−22296号公報JP-A-8-22296 A. Hyvaerinen and J. Karhunen and E. Oja, "Independent Component Analysis, "John Wiley & Sons,2001,ISBN 0-471-40540A. Hyvaerinen and J. Karhunen and E. Oja, "Independent Component Analysis," John Wiley & Sons, 2001, ISBN 0-471-40540

しかしながら、特許文献1,2では、尤度最大の基準に基づくICAにより分離行列を求めているため、計算時間がかかり、かつ、求められた分離行列や抽出された目的信号の精度が低いという従来の問題点は解決されない。
また、特許文献3のように、HMMに事後確率最大推定法を適用する場合は、既知の事前情報として不特定話者の音声を用いることができるが、ICAでは既知の事前情報が存在しない。このため、ICAに事後確率最大推定法を適用するには事前情報を推定する必要がある。また、計算量を削減し高速に計算を行うためには精度の高い事前情報を推定する必要がある。
本発明は上記問題点に鑑みてなされたものであり、高速かつ高精度に混合信号から目的信号を抽出することを可能とする目的信号抽出装置、目的信号抽出方法、及び、プログラムを提供することを課題とする。
However, in Patent Documents 1 and 2, since the separation matrix is obtained by ICA based on the maximum likelihood criterion, calculation time is required, and the accuracy of the obtained separation matrix and the extracted target signal is low. The problem is not solved.
Also, as in Patent Document 3, when applying the maximum posterior probability estimation method to HMM, the voice of an unspecified speaker can be used as known prior information, but ICA has no known prior information. For this reason, prior information needs to be estimated in order to apply the maximum posterior probability estimation method to ICA. In addition, in order to reduce the amount of calculation and perform the calculation at high speed, it is necessary to estimate the prior information with high accuracy.
The present invention has been made in view of the above problems, and provides a target signal extraction device, a target signal extraction method, and a program capable of extracting a target signal from a mixed signal at high speed and with high accuracy. Is an issue.

上記課題を解決するために、請求項1に記載の発明は、複数の方向から到来する、目的信号を含む混合信号を複数のセンサで観測し、これら複数のセンサからの観測信号に基づき周波数毎の時系列を求め、該時系列を独立成分分析し周波数毎の分離行列を求める分離行列算出手段と、該周波数毎の分離行列を用いて混合信号から目的信号を抽出する目的信号抽出手段とを備える目的信号抽出装置であって、前記分離行列算出手段は、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする目的信号抽出装置を提供する。
本発明によれば、目的信号抽出装置は、事後確率最大の基準に基づく独立成分分析により分離行列を求めるため、従来の尤度最大の基準に基づく独立成分分析よりも、高速かつ高精度に分離行列を求めることができ、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
In order to solve the above-mentioned problem, the invention according to claim 1 observes a mixed signal including a target signal, which comes from a plurality of directions, by a plurality of sensors, and determines each frequency based on the observation signals from the plurality of sensors. A separation matrix calculation means for obtaining an independent component analysis of the time series and obtaining a separation matrix for each frequency, and a target signal extraction means for extracting a target signal from the mixed signal using the separation matrix for each frequency. An objective signal extraction device provided, wherein the separation matrix calculation means obtains a separation matrix by independent component analysis based on a criterion of maximum posterior probability.
According to the present invention, since the target signal extraction apparatus obtains a separation matrix by independent component analysis based on the maximum posterior probability criterion, the target signal extraction device performs separation at higher speed and higher accuracy than the conventional independent component analysis based on the maximum likelihood criterion. A matrix can be obtained, and a target signal can be extracted from the mixed signal at high speed and with high accuracy using the obtained separation matrix.

請求項2に記載の発明は、請求項1に記載の目的信号抽出装置において、前記分離行列算出手段は、目的信号源からセンサまでの周波数応答に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする。
本発明によれば、目的信号抽出装置は、目的信号源からセンサまでの周波数応答に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めるため、事前情報を高い精度で算出することができ、分離行列のチャンネルの入替(Permutation)が発生するという問題が生じなくなる。また、高速かつ高精度に分離行列を求めて、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することができる。
According to a second aspect of the present invention, in the target signal extraction device according to the first aspect, the separation matrix calculation means uses the separation matrix estimated based on the frequency response from the target signal source to the sensor as prior information. The separation matrix is obtained by independent component analysis based on the criterion of maximum posterior probability.
According to the present invention, the target signal extraction apparatus obtains the separation matrix by independent component analysis based on the criterion of the maximum posterior probability, using the separation matrix estimated based on the frequency response from the target signal source to the sensor as prior information. Therefore, prior information can be calculated with high accuracy, and the problem of permutation of the separation matrix channel does not occur. In addition, the separation matrix can be obtained at high speed and with high accuracy, and the target signal can be extracted from the mixed signal at high speed and with high accuracy using the obtained separation matrix.

請求項3に記載の発明は、請求項1又は2に記載の目的信号抽出装置において、前記分離行列算出手段は、干渉信号だけが存在する区間の信号を利用して推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする。
本発明によれば、目的信号抽出装置は、干渉信号だけが存在する区間の信号を利用して推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とするため、事前情報を高い精度で推定することができ、高速かつ高精度に分離行列を求めることができる。従って、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
According to a third aspect of the present invention, in the target signal extraction apparatus according to the first or second aspect, the separation matrix calculation means uses a signal in a section where only an interference signal exists to estimate a separation matrix estimated in advance. And a separation matrix is obtained by independent component analysis based on a criterion of maximum posterior probability.
According to the present invention, the target signal extraction apparatus uses, as a priori information, a separation matrix estimated by using a signal in a section where only an interference signal exists, and obtains a separation matrix by independent component analysis based on a criterion of maximum posterior probability. Since it is characterized by obtaining, the prior information can be estimated with high accuracy, and the separation matrix can be obtained with high speed and high accuracy. Therefore, the target signal can be extracted from the mixed signal with high speed and high accuracy using the obtained separation matrix.

請求項4に記載の発明は、請求項1から3の何れか1項に記載の目的信号抽出装置において、前記分離行列算出手段は、干渉信号だけが存在する区間の信号を利用し、エネルギー最小の拘束条件に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする。
本発明によれば、目的信号抽出装置は、干渉信号だけが存在する区間の信号を利用し、エネルギー最小の拘束条件に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めるため、事前情報を高い精度で推定することができ、高速かつ高精度に分離行列を求めることができる。従って、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
According to a fourth aspect of the present invention, in the target signal extraction device according to any one of the first to third aspects, the separation matrix calculation means uses a signal in a section where only an interference signal exists, and minimizes the energy. A separation matrix is obtained by independent component analysis based on a criterion of maximum posterior probability, using a separation matrix estimated based on the constraint condition of (2) as prior information.
According to the present invention, the target signal extraction device uses a signal in a section where only an interference signal exists, uses a separation matrix estimated based on a constraint condition with the minimum energy as a priori information, and uses it as a criterion for maximizing the posterior probability. Since the separation matrix is obtained by independent component analysis based on it, prior information can be estimated with high accuracy, and the separation matrix can be obtained at high speed and with high accuracy. Therefore, the target signal can be extracted from the mixed signal with high speed and high accuracy using the obtained separation matrix.

請求項5に記載の発明は、請求項1から4の何れか1項に記載の目的信号抽出装置において、前記分離行列算出手段は、各チャンネルの観測信号の相関を利用して推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする。
本発明によれば、目的信号抽出装置は、各チャンネルの観測信号の相関を利用して推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めるため、事前情報を高い精度で推定することができ、高速かつ高精度に分離行列を求めることができる。従って、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
According to a fifth aspect of the present invention, in the target signal extraction device according to any one of the first to fourth aspects, the separation matrix calculation means is a separation matrix estimated using the correlation of the observation signals of each channel. Is used as a priori information, and a separation matrix is obtained by independent component analysis based on a criterion of maximum posterior probability.
According to the present invention, the target signal extraction apparatus obtains a separation matrix by independent component analysis based on the criterion of the maximum posterior probability using the separation matrix estimated using the correlation of the observation signals of each channel as prior information. The prior information can be estimated with high accuracy, and the separation matrix can be obtained with high speed and high accuracy. Therefore, the target signal can be extracted from the mixed signal with high speed and high accuracy using the obtained separation matrix.

請求項6に記載の発明は、請求項1から5の何れか1項に記載の目的信号抽出装置において、前記分離行列算出手段は、各チャンネルの観測信号の相関が0との拘束条件に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする。
本発明によれば、目的信号抽出装置は、各チャンネルの観測信号の相関が0との拘束条件に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めるため、混合信号から独立な特徴を高精度に抽出して事前情報を高い精度で推定することができ、高速かつ高精度に分離行列を求めることができる。従って、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
According to a sixth aspect of the present invention, in the target signal extracting device according to any one of the first to fifth aspects, the separation matrix calculating means is based on a constraint condition that the correlation of the observation signals of each channel is zero. Using the separation matrix estimated in this way as a priori information, the separation matrix is obtained by independent component analysis based on the criterion of maximum posterior probability.
According to the present invention, the target signal extraction device uses the separation matrix estimated based on the constraint condition that the observation signal of each channel is 0 as the prior information, and performs independent component analysis based on the criterion of the maximum posterior probability. In order to obtain the separation matrix, it is possible to extract features independent from the mixed signal with high accuracy and estimate the prior information with high accuracy, and to obtain the separation matrix with high speed and high accuracy. Therefore, the target signal can be extracted from the mixed signal with high speed and high accuracy using the obtained separation matrix.

請求項7に記載の発明は、複数の方向から到来する、目的信号を含む混合信号を複数のセンサで観測する信号観測ステップと、前記複数のセンサからの観測信号に基づき周波数毎の時系列を求める周波数領域変換ステップと、前記周波数領域変換ステップにおいて求められた時系列について事後確率最大の基準に基づく独立成分分析を行うことにより、周波数毎の分離行列を求める分離行列算出ステップと、前記分離行列算出ステップにおいて求められた分離行列を用いて、混合信号から目的信号を抽出する目的信号抽出ステップとを備えることを特徴とする目的信号抽出方法を提供する。
本発明によれば、事後確率最大の基準に基づく独立成分分析により分離行列を求めることによって、従来の尤度最大の基準に基づく独立成分分析よりも高速かつ高精度に分離行列を求めることができる。従って、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
The invention according to claim 7 is a signal observation step of observing a mixed signal including a target signal, which comes from a plurality of directions, by a plurality of sensors, and a time series for each frequency based on the observation signals from the plurality of sensors. A frequency domain transformation step to be obtained; a separation matrix calculation step for obtaining a separation matrix for each frequency by performing independent component analysis based on a criterion of maximum posterior probability for the time series obtained in the frequency domain transformation step; and the separation matrix There is provided a target signal extraction method comprising a target signal extraction step of extracting a target signal from a mixed signal using the separation matrix obtained in the calculation step.
According to the present invention, by obtaining a separation matrix by independent component analysis based on a criterion with the maximum posterior probability, it is possible to obtain a separation matrix at higher speed and with higher accuracy than independent component analysis based on a criterion with the maximum likelihood. . Therefore, the target signal can be extracted from the mixed signal with high speed and high accuracy using the obtained separation matrix.

請求項8に記載の発明は、コンピュータに、混合信号から目的信号を抽出するための分離行列の初期値を事前情報として推定する事前情報推定ステップと、事後確率最大の基準に基づく独立成分分析を用いて、前記事前情報推定ステップにおいて推定された事前情報を逐次更新することにより、分離行列を求める分離行列算出ステップと、前記分離行列算出ステップにおいて求められた分離行列を用いて、混合信号から目的信号を抽出する目的信号抽出ステップとを実行させるためのプログラムを提供する。
本発明によれば、推定した事前情報を用いて事後確率最大の基準に基づく独立成分分析を行うことにより、従来の尤度最大の基準に基づく独立成分分析よりも高速かつ高精度に分離行列を求めることができる。従って、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。
According to an eighth aspect of the present invention, a prior information estimation step for estimating, as prior information, an initial value of a separation matrix for extracting a target signal from a mixed signal, and independent component analysis based on a maximum posterior probability are performed on a computer. Using the separation matrix calculation step for obtaining a separation matrix by sequentially updating the prior information estimated in the prior information estimation step, and using the separation matrix obtained in the separation matrix calculation step, A program for executing a target signal extraction step of extracting a target signal is provided.
According to the present invention, by performing independent component analysis based on the criterion of maximum posterior probability using the estimated prior information, the separation matrix can be obtained at higher speed and higher accuracy than the independent component analysis based on the criterion of maximum likelihood. Can be sought. Therefore, the target signal can be extracted from the mixed signal with high speed and high accuracy using the obtained separation matrix.

本発明によれば、目的信号抽出装置は、事後確率最大の基準に基づく独立成分分析により分離行列を求めるため、従来の尤度最大の基準に基づく独立成分分析よりも、高速かつ高精度に分離行列を求めることができ、求めた分離行列を用いて高速かつ高精度に混合信号から目的信号を抽出することが可能となる。   According to the present invention, since the target signal extraction apparatus obtains a separation matrix by independent component analysis based on the maximum posterior probability criterion, the target signal extraction device performs separation at higher speed and higher accuracy than the independent component analysis based on the conventional maximum likelihood criterion. The matrix can be obtained, and the target signal can be extracted from the mixed signal at high speed and with high accuracy using the obtained separation matrix.

以下、図面を参照して、本発明に係る実施の形態について説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態に係る目的信号抽出装置10の機能構成を示すブロック図である。同図に示すように、目的信号抽出装置10は、分離行列算出部11と目的信号抽出部12とで構成されている。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(First embodiment)
FIG. 1 is a block diagram showing a functional configuration of a target signal extraction apparatus 10 according to the first embodiment of the present invention. As shown in the figure, the target signal extraction device 10 includes a separation matrix calculation unit 11 and a target signal extraction unit 12.

分離行列算出部11は、複数のセンサからの観測信号に基づき周波数毎の時系列を求め、当該時系列を事後確率最大の基準に基づく独立成分分析を行うことにより、周波数毎の分離行列を求める。
分離行列算出部11は事前情報推定部111を備えている。事前情報推定部111は、事後確率最大基準に基づく独立成分分析の事前情報として、分離行列(の初期値)を推定する。
The separation matrix calculation unit 11 obtains a time series for each frequency based on observation signals from a plurality of sensors, and obtains a separation matrix for each frequency by performing independent component analysis on the time series based on a criterion of maximum posterior probability. .
The separation matrix calculation unit 11 includes a prior information estimation unit 111. The prior information estimation unit 111 estimates a separation matrix (its initial value) as prior information for independent component analysis based on the maximum posterior probability criterion.

事前知識保持部112は事前知識を保持する。本実施形態においては、目的信号源からセンサまでの周波数応答の事前計測値を事前知識として保持する。本実施の形態では、この周波数応答の事前計測値に基づいて分離行列の初期値が推定される。
なお、これらの機能構成は、目的信号抽出装置10が備えるCPU、メモリ等のハードウェア、及び、メモリに記憶されているプログラム、データ等のソフトウェアによって実現される。
The prior knowledge holding unit 112 holds prior knowledge. In this embodiment, the prior measurement value of the frequency response from the target signal source to the sensor is held as prior knowledge. In the present embodiment, the initial value of the separation matrix is estimated based on the premeasured value of the frequency response.
These functional configurations are realized by hardware such as a CPU and a memory included in the target signal extraction apparatus 10 and software such as a program and data stored in the memory.

次に、図2を参照して、目的信号抽出装置10が行う処理手順を説明する。ここでは、雑音源が一つであり、目的音源はユーザの音声であり、これらの音を目的信号抽出装置10としての携帯電話機に入力する場合について述べる。また、分離行列が2×2(2行2列)の行列であるものとする。さらに、観測信号がY1(n),Y2(n)、分離信号がZ1(n),Z2(n)であり、分離した目的信号としてZ1(n)を抽出する場合を例とする。また、ユーザの口(目的信号源)から携帯電話機のマイク(センサ)までの周波数応答を事前に測定し、事前知識保持部112に事前測定値(事前知識)として予め保存しておくものとする。
まず、Step1において、事前知識保持部112に保存しておいた事前測定値を取得する。
Step2において、この値を分離行列の一列(つまり以下の式(1)の分離行列の二列目のa1とa2)とする。
Next, a processing procedure performed by the target signal extraction apparatus 10 will be described with reference to FIG. Here, there will be described a case where there is one noise source, the target sound source is the user's voice, and these sounds are input to the mobile phone as the target signal extraction device 10. The separation matrix is assumed to be a 2 × 2 (2 rows × 2 columns) matrix. Furthermore, the observation signals are Y 1 (n), Y 2 (n), the separated signals are Z 1 (n), Z 2 (n), and Z 1 (n) is extracted as the separated target signal. And In addition, the frequency response from the user's mouth (target signal source) to the microphone (sensor) of the mobile phone is measured in advance, and is stored in advance in the prior knowledge holding unit 112 as a prior measurement value (prior knowledge). .
First, in Step 1, the prior measurement value stored in the prior knowledge holding unit 112 is acquired.
In Step 2, this value is set as one column of the separation matrix (that is, a 1 and a 2 in the second column of the separation matrix of the following expression (1)).

Figure 2007178590
Figure 2007178590

Step3において、発声音声のデータを測定し、周波数領域に変換する。
Step4において、MAP推定のICA(事後確率最大基準に基づく独立成分分析)でWの変動を吸収する。具体的には、従来のW=arg maxP(W/data)の代わりにWに関する事前知識を導入し、MAP推定で式(2)によりWの推定を図る。
W=arg maxP(W/data)P(W) (2)
以上のstepで求めたa1,a2をWの平均値としてWの確率分布を仮定し、事後確率最大基準に基づいて、式(3)によりWを逐次に更新することにより推定する。
In Step 3, the voice data is measured and converted to the frequency domain.
In Step 4, the fluctuation of W is absorbed by ICA (independent component analysis based on the maximum posterior probability criterion) of MAP estimation. Specifically, prior knowledge about W is introduced instead of the conventional W = arg maxP (W / data), and W is estimated by Equation (2) by MAP estimation.
W = arg maxP (W / data) P (W) (2)
Assuming a probability distribution of W with a 1 and a 2 obtained in the above steps as an average value of W, estimation is performed by sequentially updating W according to Equation (3) based on the maximum posterior probability criterion.

Figure 2007178590
Figure 2007178590

たとえば、正規分布と仮定する場合は以下の式になる。   For example, when assuming a normal distribution, the following equation is obtained.

Figure 2007178590
Figure 2007178590

ただし、μは事前推定値、σ2は分離行列の事前推定値の変動を表す分散値である。
Step5において、以上のStepで推定した分離行列を用いて分離を行って、目的信号を抽出する。
Step6において、目的信号を時間領域の信号に復元する。
(第2の実施の形態)
次に、第2の実施の形態について説明する。図3は、本発明の第2の実施の形態に係る目的信号抽出装置10の機能構成を示すブロック図である。同図に示すように、第2の実施の形態に係る分離行列算出部11は、第1の実施の形態に係る分離行列算出部11が備える事前情報推定部111及び事前知識保持部112に加えて、無音区間検出部113を備えている。
Here, μ is a prior estimated value, and σ 2 is a variance value representing a change in the prior estimated value of the separation matrix.
In Step 5, the target signal is extracted by performing separation using the separation matrix estimated in the above Step.
In Step 6, the target signal is restored to a time domain signal.
(Second Embodiment)
Next, a second embodiment will be described. FIG. 3 is a block diagram showing a functional configuration of the target signal extraction apparatus 10 according to the second embodiment of the present invention. As shown in the figure, the separation matrix calculation unit 11 according to the second embodiment includes the prior information estimation unit 111 and the prior knowledge holding unit 112 included in the separation matrix calculation unit 11 according to the first embodiment. The silent section detecting unit 113 is provided.

第2の実施の形態に係る事前情報推定部111は、第1の実施の形態に係る事前情報推定部111が備える機能に加えて、干渉信号だけが存在する区間(無音区間)の信号を利用して分離行列の1成分を推定する機能を備えている。
次に、図4を参照して、本実施の形態に係る目的信号抽出装置10が行う処理手順を説明する。ここでの前提条件は、第1の実施の形態で図2を参照して説明した前提条件と同様である。
まず、Step1において、事前知識保持部112から事前測定値を取得する。
次に、Step2において、事前知識保持部112から取得した値を分離行列の一列(つまり以下の式(1)に示す分離行列の二列目のa1とa2)にする。
The prior information estimation unit 111 according to the second embodiment uses a signal in a section (silent section) in which only an interference signal exists, in addition to the functions of the prior information estimation unit 111 according to the first embodiment. Thus, a function of estimating one component of the separation matrix is provided.
Next, a processing procedure performed by the target signal extraction apparatus 10 according to the present embodiment will be described with reference to FIG. The preconditions here are the same as the preconditions described with reference to FIG. 2 in the first embodiment.
First, in Step 1, a prior measurement value is acquired from the prior knowledge holding unit 112.
Next, in Step 2, the value acquired from the prior knowledge holding unit 112 is set to one column of the separation matrix (that is, a 1 and a 2 in the second column of the separation matrix shown in the following formula (1)).

Figure 2007178590
Figure 2007178590

Step3において、発声音声のデータを測定し、周波数領域に変換する。
Step4において、ユーザが発声してない区間を検出する。
Step5において、ユーザの発声してない区間の観測データ(Y1とY2)と以下の式(2)を用いて、出力Z1のエネルギー最小化基準に基づいてw1を求める。
In Step 3, the voice data is measured and converted to the frequency domain.
In Step 4, a section where the user is not speaking is detected.
In Step 5, w 1 is obtained based on the energy minimization criterion of the output Z 1 using observation data (Y 1 and Y 2 ) of the section not uttered by the user and the following equation (2).

Figure 2007178590
Figure 2007178590

その結果、w1を式(4)により推定する:
1=a1*(R22−R21)/(R11−R12) (4)
ここで、R=E[yij] (5)
Step6において、MAP推定のICAでWの変動を吸収する。つまり、従来のW=arg maxP(W/data)の代わりにWに関する事前知識を導入し、MAP推定で式(6)によりWの推定を図る。
W=arg maxP(W/data)P(W) (6)
以上のstepで求めたw1及びa1,a2をWの平均値として、Wの確率分布を仮定し、事後確率最大基準に基づいて、式(7)によりWを逐次に更新することにより推定する。
As a result, w 1 is estimated by equation (4):
w 1 = a 1 * (R 22 -R 21 ) / (R 11 -R 12 ) (4)
Here, R = E [y i y j ] (5)
In Step 6, the fluctuation of W is absorbed by ICA of MAP estimation. That is, prior knowledge about W is introduced instead of the conventional W = arg maxP (W / data), and W is estimated by Equation (6) by MAP estimation.
W = arg maxP (W / data) P (W) (6)
By assuming the probability distribution of W with w 1 and a 1 , a 2 obtained in the above step as the average value of W, and sequentially updating W by equation (7) based on the maximum posterior probability criterion presume.

Figure 2007178590
Figure 2007178590

たとえば、正規分布と仮定する場合は以下の式(8)のようになる。   For example, when assuming a normal distribution, the following equation (8) is obtained.

Figure 2007178590
Figure 2007178590

ただし、μは事前推定値、σ2は分離行列の事前推定値の変動を表す分散値である。
Step7において、以上のStepで推定した分離行列を用いて分離を行って、目的信号を抽出する。
Step8において、目的信号を時間領域の信号に復元する。
(第3の実施の形態)
次に第3の実施の形態について説明する。図5は、本発明の第3の実施の形態に係る目的信号抽出装置10の機能構成を示すブロック図である。
Here, μ is a prior estimated value, and σ 2 is a variance value representing a change in the prior estimated value of the separation matrix.
In Step 7, separation is performed using the separation matrix estimated in the above Step, and a target signal is extracted.
In Step 8, the target signal is restored to a time domain signal.
(Third embodiment)
Next, a third embodiment will be described. FIG. 5 is a block diagram showing a functional configuration of the target signal extraction apparatus 10 according to the third embodiment of the present invention.

第3の実施の形態に係る事前情報推定部111は、第2の実施の形態に係る事前情報推定部111が備える機能に加えて、各チャンネルの観測信号の相関を利用して分離行列の1成分を推定する機能を備えている。
次に、図6を参照して、本実施の形態に係る目的信号抽出装置10が行う処理の手順について説明する。ここでの前提条件は、第1の実施の形態で図2を参照して説明した前提条件と同様である。
まず、Step1において、事前知識保持部112から事前測定値を取得する。
次に、Step2において、Step1で取得した事前測定値を分離行列の一列(つまり以下の式(1)の分離行列の二列目のa1とa2)にする。
The prior information estimation unit 111 according to the third embodiment, in addition to the function of the prior information estimation unit 111 according to the second embodiment, uses the correlation of the observation signals of each channel to obtain 1 of the separation matrix. It has a function to estimate components.
Next, with reference to FIG. 6, the procedure of the process performed by the target signal extraction apparatus 10 according to the present embodiment will be described. The preconditions here are the same as the preconditions described with reference to FIG. 2 in the first embodiment.
First, in Step 1, a prior measurement value is acquired from the prior knowledge holding unit 112.
Next, in Step 2, the pre-measurement value acquired in Step 1 is set to one column of the separation matrix (that is, a 1 and a 2 in the second column of the separation matrix of the following formula (1)).

Figure 2007178590
Figure 2007178590

Step3において、発声音声のデータを測定し、周波数領域に変換する。
Step4において、ユーザが発声していない区間(干渉波だけの区間)を検出する。
Step5において、ユーザの発声してない区間の観測データ(Y1とY2)と以下の式(2)を用いて、出力Z1のエネルギー最小化基準に基づいてw1を求める。
In Step 3, the voice data is measured and converted to the frequency domain.
In Step 4, a section where the user is not speaking (a section including only interference waves) is detected.
In Step 5, w 1 is obtained based on the energy minimization criterion of the output Z 1 using observation data (Y 1 and Y 2 ) of the section not uttered by the user and the following equation (2).

Figure 2007178590
Figure 2007178590

その結果、w1を式(4)により推定する:
1=a1*(R22−R21)/(R11−R12) (4)
ここで、R=E[yij
Step6において、全発声区間の音声データYを用いて、無相関化の拘束条件式(5)でw2を求める(式(6))。
E[Z1,Z2]=0 (5)
2=−(a21E(y12)+a12E(y22))/(w1E(y11)+a1E(y12)) (6)
As a result, w 1 is estimated by equation (4):
w 1 = a 1 * (R 22 -R 21 ) / (R 11 -R 12 ) (4)
Here, R = E [y i y j ]
In Step 6, w 2 is obtained by using a correlation condition expression (5) for decorrelation using the voice data Y of all utterance sections (Expression (6)).
E [Z 1 , Z 2 ] = 0 (5)
w 2 = − (a 2 w 1 E (y 1 y 2 ) + a 1 a 2 E (y 2 y 2 )) / (w 1 E (y 1 y 1 ) + a 1 E (y 1 y 2 )) ( 6)

Step7において、MAP推定のICAでWの変動を吸収する。つまり、従来のW=arg maxP(W/data)の代わりにWに関する事前知識を導入し、MAP推定で式(7)によりWの推定を図る。
W=arg maxP(W/data)P(W) (7)
以上のstepで求めたw1、w2及びa1,a2をWの平均値として、Wの確率分布を仮定し、事後確率最大基準に基づいて、式(8)によりWを逐次に更新することにより推定する。
In Step 7, the fluctuation of W is absorbed by ICA of MAP estimation. That is, prior knowledge about W is introduced instead of the conventional W = arg maxP (W / data), and W is estimated by Equation (7) by MAP estimation.
W = arg maxP (W / data) P (W) (7)
Assuming the probability distribution of W with w 1 , w 2 and a 1 , a 2 obtained in the above step as the mean value of W, W is sequentially updated by Equation (8) based on the maximum posterior probability criterion. To estimate.

Figure 2007178590
Figure 2007178590

たとえば、正規分布だと仮定する場合は以下の式(9)になる。   For example, when assuming a normal distribution, the following equation (9) is obtained.

Figure 2007178590
Figure 2007178590

ただし、μは事前推定値、σ2は分離行列の事前推定値の変動を表す分散値である。
Step8において、以上のStepで推定した分離行列を用いて分離を行い、目的信号を抽出する。
Step9において、目的信号を時間領域の信号に復元する。
図7には、従来の最尤度基準に基づくICA手法を用いて復元した音声信号(図7(a))と、本発明手法の事後確率最大基準に基づくICA手法を用いて復元した音声信号(図7(b))の例を示している。グラフの横軸が時間を表し、縦軸が信号レベルを表している。図7(a)に示すグラフよりも図7(b)に示すグラフの方が信号レベルの変動が小さく、音声信号から雑音信号がより除去されていることがわかる。つまり、本発明手法を用いて復元した音声信号については、従来のICAを用いて復元した音声信号よりも、SNR(Signal-to-Noise Ratio;対雑音信号比)の向上が確認された。
Here, μ is a prior estimated value, and σ 2 is a variance value representing a change in the prior estimated value of the separation matrix.
In Step 8, separation is performed using the separation matrix estimated in the above Step, and a target signal is extracted.
In Step 9, the target signal is restored to a time domain signal.
FIG. 7 shows a speech signal restored using the conventional ICA method based on the maximum likelihood criterion (FIG. 7A) and a speech signal restored using the ICA method based on the maximum posterior probability of the method of the present invention. An example of (FIG. 7B) is shown. The horizontal axis of the graph represents time, and the vertical axis represents the signal level. It can be seen that the signal level fluctuation is smaller in the graph shown in FIG. 7B than in the graph shown in FIG. 7A, and the noise signal is more removed from the audio signal. In other words, the SNR (Signal-to-Noise Ratio) was confirmed to be improved for the audio signal restored using the method of the present invention, compared to the audio signal restored using the conventional ICA.

以上説明したように、事前情報を用いて事後確率最大の基準に基づく独立成分分析を行うようにしたため、分離行列についてグローバル最適値を求めることができ、事前情報を用いない尤度最大の基準に基づく独立成分分析よりも、高速かつ高精度に混合信号から目的信号を抽出することが可能となる。また、高い精度で推定した分離行列を事前情報として用いることができるため、高速かつチャンネルの入替を発生させずに分離行列を算出することが可能となる。   As explained above, since independent component analysis based on the criterion of maximum posterior probability is performed using prior information, a global optimum value can be obtained for the separation matrix, and the maximum likelihood criterion without prior information is used. The target signal can be extracted from the mixed signal at a higher speed and with higher accuracy than the independent component analysis based on the above. In addition, since the separation matrix estimated with high accuracy can be used as prior information, it is possible to calculate the separation matrix at high speed without causing channel replacement.

なお、上述した実施の形態においては、分離行列が2×2の行列である場合について説明したが、これに限定されることはなく、3行以上3列以上の行列についても適用可能である。また、上述した実施の形態のフローチャートにおいては、周波数領域で抽出した目的信号を時間領域に変換するとして説明したが、機能構成図に示すように、時間領域に変換した分離行列を用いて目的信号を抽出するようにしてもよい。   In the above-described embodiment, the case where the separation matrix is a 2 × 2 matrix has been described. However, the present invention is not limited to this, and the present invention can also be applied to a matrix of 3 rows or more and 3 columns or more. Further, in the flowchart of the above-described embodiment, the target signal extracted in the frequency domain has been described as being converted into the time domain. However, as shown in the functional configuration diagram, the target signal is converted using the separation matrix converted into the time domain. May be extracted.

本発明は、複数方向からの信号が混合されて受信され、観測したい目的信号のみを直接観測することはできず、目的信号に他のノイズ(雑音)などが重畳されて観測される状況において、目的信号を推定する場合に有効である。特に、SNRが低い条件において本発明手法は有効である。
例えば、本発明に係る目的信号抽出装置10を携帯電話機に適用することによって、雑音環境においてユーザの入力音声以外に周囲の雑音が携帯電話機に収録される状況でも、ユーザの音声だけを抽出することが可能となる。携帯電話機以外にも、PDA(Personal Digital Assistance)、PHS(Personal Handyphone System)、固定電話機、固定電話の子機等、あらゆる通信端末に適用することが可能である。また、無線通信のような外乱が発生する環境における干渉除去にも利用することができる。
In the present invention, signals from a plurality of directions are mixed and received, and it is not possible to directly observe only a target signal to be observed, and in a situation where other noise (noise) is superimposed on the target signal and observed, This is effective when estimating the target signal. In particular, the method of the present invention is effective under conditions where the SNR is low.
For example, by applying the target signal extraction device 10 according to the present invention to a mobile phone, only the user's voice can be extracted even in a situation where ambient noise is recorded in the mobile phone in addition to the user's input voice in a noisy environment. Is possible. In addition to mobile phones, the present invention can be applied to all communication terminals such as PDAs (Personal Digital Assistance), PHS (Personal Handyphone System), fixed phones, and fixed phones. It can also be used to eliminate interference in an environment where disturbances such as wireless communication occur.

本発明の第1の実施の形態に係る目的信号抽出装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the target signal extraction apparatus which concerns on the 1st Embodiment of this invention. 同実施の形態に係る目的信号抽出装置が行う処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process which the target signal extraction apparatus which concerns on the embodiment performs. 本発明の第2の実施の形態に係る目的信号抽出装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the target signal extraction apparatus which concerns on the 2nd Embodiment of this invention. 同実施の形態に係る目的信号抽出装置が行う処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process which the target signal extraction apparatus which concerns on the embodiment performs. 本発明の第3の実施の形態に係る目的信号抽出装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the target signal extraction apparatus which concerns on the 3rd Embodiment of this invention. 同実施の形態に係る目的信号抽出装置が行う処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process which the target signal extraction apparatus which concerns on the embodiment performs. (a)は、従来の最尤度基準に基づくICA手法を用いて復元した音声信号のグラフであり、(b)は本発明手法の事後確率最大基準に基づくICA手法を用いて復元した音声信号のグラフである。(A) is a graph of a speech signal restored using an ICA method based on the conventional maximum likelihood criterion, and (b) is a speech signal restored using an ICA method based on the maximum posterior probability criterion of the method of the present invention. It is a graph of. 従来のICA法によるブラインド音源分離(BSS)のモデルを示す図である。It is a figure which shows the model of the blind sound source separation (BSS) by the conventional ICA method. 従来の尤度最大法に基づくICAによる周波数領域BSS法の機能構成を示す図である。It is a figure which shows the function structure of the frequency domain BSS method by ICA based on the conventional maximum likelihood method. 従来の特許文献1における目的信号抽出装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the target signal extraction apparatus in the conventional patent document 1. FIG.

符号の説明Explanation of symbols

10 目的信号抽出装置
11 分離行列算出部
12 目的信号抽出部
111 分離行列初期値算出部
112 事前情報保持部
113 無音区間検出部
DESCRIPTION OF SYMBOLS 10 Target signal extraction apparatus 11 Separation matrix calculation part 12 Objective signal extraction part 111 Separation matrix initial value calculation part 112 Prior information holding part 113 Silent section detection part

Claims (8)

複数の方向から到来する、目的信号を含む混合信号を複数のセンサで観測し、これら複数のセンサからの観測信号に基づき周波数毎の時系列を求め、該時系列を独立成分分析し周波数毎の分離行列を求める分離行列算出手段と、該周波数毎の分離行列を用いて混合信号から目的信号を抽出する目的信号抽出手段とを備える目的信号抽出装置であって、
前記分離行列算出手段は、
事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする目的信号抽出装置。
Observe mixed signals including target signals coming from multiple directions with multiple sensors, determine the time series for each frequency based on the observation signals from these multiple sensors, analyze the time series for independent components, A target signal extraction device comprising separation matrix calculation means for obtaining a separation matrix, and target signal extraction means for extracting a target signal from the mixed signal using the separation matrix for each frequency,
The separation matrix calculation means includes
An objective signal extraction apparatus characterized in that a separation matrix is obtained by independent component analysis based on a criterion of maximum posterior probability.
前記分離行列算出手段は、
目的信号源からセンサまでの周波数応答に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする
請求項1に記載の目的信号抽出装置。
The separation matrix calculation means includes
The separation matrix is obtained by independent component analysis based on a criterion of maximum a posteriori probability using a separation matrix estimated based on a frequency response from a target signal source to a sensor as prior information. Signal extraction device.
前記分離行列算出手段は、
干渉信号だけが存在する区間の信号を利用して推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする
請求項1又は2に記載の目的信号抽出装置。
The separation matrix calculation means includes
The separation matrix is obtained by independent component analysis based on a criterion of maximum a posteriori probability using a separation matrix estimated using a signal in a section in which only an interference signal exists as prior information. The target signal extraction device described.
前記分離行列算出手段は、
干渉信号だけが存在する区間の信号を利用し、エネルギー最小の拘束条件に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする
請求項1から3の何れか1項に記載の目的信号抽出装置。
The separation matrix calculation means includes
Using the signal of the section where only the interference signal exists, using the separation matrix estimated based on the minimum energy constraint condition as a priori information, the separation matrix is obtained by independent component analysis based on the criterion of the maximum posterior probability The target signal extraction device according to any one of claims 1 to 3.
前記分離行列算出手段は、
各チャンネルの観測信号の相関を利用して推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする
請求項1から4の何れか1項に記載の目的信号抽出装置。
The separation matrix calculation means includes
5. The separation matrix is obtained by independent component analysis based on a criterion of maximum posterior probability using a separation matrix estimated using correlation of observation signals of each channel as prior information. 2. The target signal extraction device according to item 1.
前記分離行列算出手段は、
各チャンネルの観測信号の相関が0との拘束条件に基づいて推定した分離行列を事前情報として用いて、事後確率最大の基準に基づく独立成分分析により分離行列を求めることを特徴とする
請求項1から5の何れか1項に記載の目的信号抽出装置。
The separation matrix calculation means includes
2. The separation matrix is obtained by independent component analysis based on a criterion of maximum posterior probability, using as a priori information a separation matrix estimated based on a constraint that the correlation of observation signals of each channel is zero. 6. The target signal extraction device according to any one of items 1 to 5.
複数の方向から到来する、目的信号を含む混合信号を複数のセンサで観測する信号観測ステップと、
前記複数のセンサからの観測信号に基づき周波数毎の時系列を求める周波数領域変換ステップと、
前記周波数領域変換ステップにおいて求められた時系列について事後確率最大の基準に基づく独立成分分析を行うことにより、周波数毎の分離行列を求める分離行列算出ステップと、
前記分離行列算出ステップにおいて求められた分離行列を用いて、混合信号から目的信号を抽出する目的信号抽出ステップと
を備えることを特徴とする目的信号抽出方法。
A signal observation step of observing a mixed signal including a target signal, coming from a plurality of directions, by a plurality of sensors;
A frequency domain transforming step for obtaining a time series for each frequency based on observation signals from the plurality of sensors;
A separation matrix calculation step for obtaining a separation matrix for each frequency by performing independent component analysis based on a criterion of maximum posterior probability for the time series obtained in the frequency domain transformation step;
A target signal extraction method comprising: a target signal extraction step of extracting a target signal from the mixed signal using the separation matrix obtained in the separation matrix calculation step.
コンピュータに、
混合信号から目的信号を抽出するための分離行列の初期値を事前情報として推定する事前情報推定ステップと、
事後確率最大の基準に基づく独立成分分析を用いて、前記事前情報推定ステップにおいて推定された事前情報を逐次更新することにより、分離行列を求める分離行列算出ステップと、
前記分離行列算出ステップにおいて求められた分離行列を用いて、混合信号から目的信号を抽出する目的信号抽出ステップと
を実行させるためのプログラム。
On the computer,
A prior information estimation step for estimating an initial value of a separation matrix for extracting a target signal from a mixed signal as prior information;
A separation matrix calculation step for obtaining a separation matrix by sequentially updating the prior information estimated in the prior information estimation step using independent component analysis based on a criterion of maximum posterior probability;
A program for executing a target signal extraction step of extracting a target signal from a mixed signal using the separation matrix obtained in the separation matrix calculation step.
JP2005375284A 2005-12-27 2005-12-27 Object signal extracting device and method therefor, and program Pending JP2007178590A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005375284A JP2007178590A (en) 2005-12-27 2005-12-27 Object signal extracting device and method therefor, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005375284A JP2007178590A (en) 2005-12-27 2005-12-27 Object signal extracting device and method therefor, and program

Publications (1)

Publication Number Publication Date
JP2007178590A true JP2007178590A (en) 2007-07-12

Family

ID=38303861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005375284A Pending JP2007178590A (en) 2005-12-27 2005-12-27 Object signal extracting device and method therefor, and program

Country Status (1)

Country Link
JP (1) JP2007178590A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2450440C1 (en) * 2008-01-23 2012-05-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Audio signal processing method and device
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2450440C1 (en) * 2008-01-23 2012-05-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Audio signal processing method and device
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9319014B2 (en) 2008-01-23 2016-04-19 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9787266B2 (en) 2008-01-23 2017-10-10 Lg Electronics Inc. Method and an apparatus for processing an audio signal

Similar Documents

Publication Publication Date Title
US9668066B1 (en) Blind source separation systems
US20170140771A1 (en) Information processing apparatus, information processing method, and computer program product
JP2007235646A (en) Sound source separation device, method and program
US20090086998A1 (en) Method and apparatus for identifying sound sources from mixed sound signal
CN111899756B (en) Single-channel voice separation method and device
JP5375400B2 (en) Audio processing apparatus, audio processing method and program
CN111418012B (en) Method for processing an audio signal and audio processing device
JP2014219467A (en) Sound signal processing apparatus, sound signal processing method, and program
CN108630222B (en) Signal processing system and signal processing method
CN101131819A (en) Noise suppressor for removing irregular noise
JP6538624B2 (en) Signal processing apparatus, signal processing method and signal processing program
KR101529647B1 (en) Sound source separation method and system for using beamforming
JP2007178590A (en) Object signal extracting device and method therefor, and program
KR101658001B1 (en) Online target-speech extraction method for robust automatic speech recognition
KR101802444B1 (en) Robust speech recognition apparatus and method for Bayesian feature enhancement using independent vector analysis and reverberation parameter reestimation
JP6448567B2 (en) Acoustic signal analyzing apparatus, acoustic signal analyzing method, and program
Yoshioka et al. Dereverberation by using time-variant nature of speech production system
JP2004302122A (en) Method, device, and program for target signal extraction, and recording medium therefor
JP2011081293A (en) Signal separation device and signal separation method
JP6106618B2 (en) Speech section detection device, speech recognition device, method thereof, and program
JP6285855B2 (en) Filter coefficient calculation apparatus, audio reproduction apparatus, filter coefficient calculation method, and program
JP5113096B2 (en) Sound source separation method, apparatus and program
JP2010156742A (en) Signal processing device and method thereof
KR101068666B1 (en) Method and apparatus for noise cancellation based on adaptive noise removal degree in noise environment
JP6519801B2 (en) Signal analysis apparatus, method, and program