JP2008092363A - Signal separation apparatus and method - Google Patents

Signal separation apparatus and method Download PDF

Info

Publication number
JP2008092363A
JP2008092363A JP2006272163A JP2006272163A JP2008092363A JP 2008092363 A JP2008092363 A JP 2008092363A JP 2006272163 A JP2006272163 A JP 2006272163A JP 2006272163 A JP2006272163 A JP 2006272163A JP 2008092363 A JP2008092363 A JP 2008092363A
Authority
JP
Japan
Prior art keywords
separation
signal
independence
signals
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006272163A
Other languages
Japanese (ja)
Other versions
JP4946330B2 (en
Inventor
Atsuo Hiroe
厚夫 廣江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006272163A priority Critical patent/JP4946330B2/en
Publication of JP2008092363A publication Critical patent/JP2008092363A/en
Application granted granted Critical
Publication of JP4946330B2 publication Critical patent/JP4946330B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a signal separation apparatus and method in which signals can be correspondingly separated without performing post-processing after separation, when separating a mixed signal in which a plurality of signals are mixed, for each signal. <P>SOLUTION: The signal separation apparatus comprises a plurality of separation systems 1<SB>j</SB>each for generating a separated signal from an observation signal in a time domain or a time/frequency domain in which a plurality of signals are mixed and a separation matrix and a mapping unit 6 for generating a signal set of corresponding separated signals among a plurality of separated signals generated from different and multiple separation systems 1<SB>j</SB>, wherein the separation matrix is updated to maximize independency among signal sets and the separated signals are generated. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、独立成分分析(Independent Component Analysis;ICA)を用いて信号を分離する信号分離装置及びその方法に関する。   The present invention relates to a signal separation apparatus and method for separating a signal using independent component analysis (ICA).

複数の原信号が未知の係数によって線形に混合されているときに、統計的独立性のみを用いて原信号を分離・復元するという独立成分分析(Independent Component Analysis;ICA)の手法が信号処理の分野で注目されている。この独立成分分析を応用することで、例えば話者とマイクロフォンとが離れた場所にあり、マイクロフォンで話者の音声以外の音を拾ってしまうような状況でも、音声信号を分離・復元することが可能となる。   Independent component analysis (ICA), which uses only statistical independence to separate and restore the original signal when multiple original signals are linearly mixed by unknown coefficients, It is attracting attention in the field. By applying this independent component analysis, voice signals can be separated and restored even in situations where the speaker and the microphone are separated and the microphone picks up sounds other than the speaker's voice. It becomes possible.

図20に示すようにN個の音源からそれぞれ異なる音が鳴っており、それらをn個のマイクロフォンで観測するという状況を想定する。k番目(1≦k≦n)のマイクロフォンkで観測される信号(観測信号)x(t)が、それぞれの原信号s(t)の線形結合であると仮定すると、x(t)は、下記式(1)で表される。また、全てのマイクロフォンについての観測信号を一つの式で表わすと、下記式(2)で表わせる。この式(1)、(2)において、x(t)、s(t)はそれぞれ x(t)、s(t)を要素とする列ベクトルを表し、Aはaij(t)を要素とするn行N列の行列を表す。なお、以下ではN=nとする。 As shown in FIG. 20, it is assumed that different sounds are generated from N sound sources and these are observed by n microphones. Assuming that the signal (observation signal) x k (t) observed by the k-th (1 ≦ k ≦ n) microphone k is a linear combination of the respective original signals s j (t), x k (t ) Is represented by the following formula (1). Further, if the observation signals for all the microphones are expressed by one equation, it can be expressed by the following equation (2). In these formulas (1) and (2), x (t) and s (t) represent column vectors each having x k (t) and s k (t) as elements, and A represents a ij (t). This represents an n-row N-column matrix as an element. In the following, N = n.

Figure 2008092363
Figure 2008092363

ICAは、観測信号xから、原信号sと、xからsを生成する行列(分離行列)とを推定する問題として定式化される。すなわち、分離行列をW、推定された原信号(すなわち分離結果)をyとして、y=Wx なるyとWとを求める問題である。   The ICA is formulated as a problem of estimating an original signal s and a matrix (separation matrix) that generates s from x from the observed signal x. That is, it is a problem of obtaining y and W such that y = Wx, where W is a separation matrix and y is an estimated original signal (ie, separation result).

特開2003−263189号公報JP 2003-263189 A 特開2006−238409号公報JP 2006-238409 A 特開2004−145172号公報JP 2004-145172 A “間隔の異なる複数のマイクペアによるブラインド音源分離”,澤田 宏,荒木 章子,向井 良,牧野 昭二,日本音響学会 春季研究発表会, pp.621-622, 2002年3月“Blind sound source separation using multiple microphone pairs with different intervals”, Hiroshi Sawada, Akiko Araki, Ryo Mukai, Shoji Makino, Acoustical Society of Japan Spring Meeting, pp.621-622, March 2002 “マルチモーダル独立成分分析 −複数情報源からの共通特徴抽出法−”赤穂 昭太郎,梅山 伸二,電子情報通信学会論文誌,VOL.J83-A No.6 June 2000,pp.669-676“Multimodal Independent Component Analysis -Common Feature Extraction Method from Multiple Sources-” Shotaro Akaho, Shinji Umeyama, IEICE Transactions, VOL.J83-A No.6 June 2000, pp.669-676

ICAには、どの原信号がどの出力チャンネルに分離されるかが不定であるという問題が存在する。これを「チャンネル間のパーミュテーション問題」と呼ぶ。なお、「周波数ビン間のパーミュテーション問題」と呼ばれる、時間周波数領域のICAにおいて、どのチャンネルにどの原信号が出力されるかが周波数ビンによって不一致であるという問題も存在するが、この「周波数ビン間のパーミュテーション問題」は、本件発明者によって解決されている(特許文献2参照。)。   The ICA has a problem that it is indeterminate which original signal is separated into which output channel. This is called “permutation problem between channels”. In the ICA in the time-frequency domain, which is called “permutation problem between frequency bins”, there is a problem that which original signal is output to which channel is inconsistent depending on the frequency bin. The permutation problem between bins "has been solved by the present inventors (see Patent Document 2).

上記「チャンネル間のパーミュテーション問題」について、例えば、図20において2個の音源を2本のマイクで収音し、それらを2つの成分へと分離する、すなわちN=2、n=2の場合を考える。この場合、2つある出力チャンネルにどの音源が出力されるかは、以下の2通りがありえる。   Regarding the “permutation problem between channels”, for example, in FIG. 20, two sound sources are picked up by two microphones and separated into two components, that is, N = 2 and n = 2. Think about the case. In this case, there are the following two types of sound sources that are output to two output channels.

ケース1:チャンネル1=音源1、チャンネル2=音源2
ケース2:チャンネル1=音源2、チャンネル2=音源1
分離システムの出力がどちらのケースとなるかは、以下に示すようなさまざまな要因に依存するため、事前に予想することは困難である。
Case 1: channel 1 = sound source 1, channel 2 = sound source 2
Case 2: channel 1 = sound source 2, channel 2 = sound source 1
Which case the output of the separation system becomes depends on various factors as described below, and it is difficult to predict in advance.

・音源の種類
・音源とマイクとの位置関係
・ICAのアルゴリズム
・音響処理(フーリエ変換など)、前処理、後処理
・分離行列Wの初期値
次に、分離システムが複数ある場合について考える。例えば、上記の音源数=2の環境において、2入力・2出力の分離システムを2つ動作させる場合を考える。2番目の分離システムは、1番目とは異なる位置のマイクを使用するものであってもよいし(すなわち、音源とマイクとの位置関係が2つの分離システムで異なる)、共有のマイクで別のアルゴリズムや初期値などを用いるものであっても良い。この場合、出力チャンネルにどの音源が出力されるかは、以下の4通りがあり得る。
-Type of sound source-Positional relationship between sound source and microphone-ICA algorithm-Acoustic processing (Fourier transform, etc.), pre-processing, post-processing-Initial value of separation matrix W Next, consider the case where there are multiple separation systems. For example, consider a case where two 2-input / 2-output separation systems are operated in the above-described environment where the number of sound sources = 2. The second separation system may use a microphone at a position different from the first (that is, the positional relationship between the sound source and the microphone is different between the two separation systems), or a separate microphone may be used. An algorithm, an initial value, or the like may be used. In this case, which sound source is output to the output channel can be the following four types.

ケース1:
分離システム1:チャンネル1=音源1、チャンネル2=音源2
分離システム2:チャンネル1=音源1、チャンネル2=音源2
ケース2:
分離システム1:チャンネル1=音源1、チャンネル2=音源2
分離システム2:チャンネル1=音源2、チャンネル2=音源1
ケース3:
分離システム1:チャンネル1=音源2、チャンネル2=音源1
分離システム2:チャンネル1=音源1、チャンネル2=音源2
ケース4:
分離システム1:チャンネル1=音源2、チャンネル2=音源1
分離システム2:チャンネル1=音源2、チャンネル2=音源1
なお、以降では、分離システムの間で、同一のチャンネルに同一の音源が出力されている場合(ケース1・ケース4)を「チャンネル同士の対応が取れている」と呼び、そうではない場合(ケース2・ケース3)を「チャンネル同士の対応が取れていない」と呼ぶ。
Case 1:
Separation system 1: channel 1 = sound source 1, channel 2 = sound source 2
Separation system 2: channel 1 = sound source 1, channel 2 = sound source 2
Case 2:
Separation system 1: channel 1 = sound source 1, channel 2 = sound source 2
Separation system 2: channel 1 = sound source 2, channel 2 = sound source 1
Case 3:
Separation system 1: channel 1 = sound source 2, channel 2 = sound source 1
Separation system 2: channel 1 = sound source 1, channel 2 = sound source 2
Case 4:
Separation system 1: channel 1 = sound source 2, channel 2 = sound source 1
Separation system 2: channel 1 = sound source 2, channel 2 = sound source 1
In the following, the case where the same sound source is output to the same channel between separation systems (case 1 and case 4) will be referred to as “the correspondence between the channels is taken”, otherwise ( Cases 2 and 3) are referred to as “channels are not compatible”.

ここで、チャンネルの対応が取れている出力のみを生成する、すなわちケース1や4のみを発生させ、ケース2や3を防止する場合において、上述のICAを用いた信号分離システム(以下、分離システムという)が複数あり、それらの出力チャンネル同士で分離結果の対応付けを行なう場合について考える。具体例としては、次のようなバリエーションを挙げることができる。   Here, in the case where only the output corresponding to the channel is generated, that is, only cases 1 and 4 are generated and cases 2 and 3 are prevented, the signal separation system using the above-mentioned ICA (hereinafter referred to as separation system). Let us consider a case where a plurality of output channels are associated with separation results. Specific examples include the following variations.

各分離システムが、関連はあるが異なる種類の信号を扱う場合。例えば、一方の分離システムが体内で発生する音の分離を行い、他方の分離システムが体内で発生する電気信号の分離を行なう場合において、それぞれの分離システムの出力から、心臓に由来する音信号(心音)と心臓の電気信号(心電図)とを対応付ける場合。   Each separation system handles different but related types of signals. For example, when one separation system separates sound generated in the body and the other separation system separates electrical signals generated in the body, the sound signal derived from the heart (from the output of each separation system ( When associating a heart sound with an electrical signal (electrocardiogram) of the heart.

異なる条件で観測された信号(同一種類)をそれぞれの分離システムが扱う場合。例えば、一方の分離システムが広い間隔のマイクで収録された音信号を扱い、他方の分離システムが狭い間隔のマイクで収録された信号を扱う場合において、同一の音源に由来する出力を2つの分離システムの間で対応付ける場合。他にも、一方のシステムでは横一列に配置された複数のマイクを使用し、他のシステムでは直行する方向に配置された(すなわち、縦一列に配置された)マイクを使用するような場合も同様である。   When each separation system handles signals (same type) observed under different conditions. For example, when one separation system handles sound signals recorded with a wide interval microphone and the other separation system handles signals recorded with a narrow interval microphone, the output from the same sound source is separated into two When mapping between systems. In other cases, one system uses a plurality of microphones arranged in a horizontal row, and the other system uses microphones arranged in a perpendicular direction (that is, arranged in a vertical row). It is the same.

信号の種類も観測条件も同一だが、ICAの初期条件がそれぞれの分離システムで異なる場合。例えば、それぞれの分離システムが時間周波数領域の分離システムであり、フーリエ変換の窓長やシフト幅などがそれぞれで異なる場合、又は分離行列の初期値が異なる場合において、同一の音源に由来する出力を2つの分離システムの間で対応付ける場合。   The signal type and observation conditions are the same, but the initial conditions for ICA differ for each separation system. For example, when each separation system is a separation system in the time-frequency domain and the window length and shift width of the Fourier transform are different from each other, or when the initial value of the separation matrix is different, outputs derived from the same sound source When mapping between two separation systems.

しかしながら、一般に、ICAには「パーミュテーション(置換)の不定性」と呼ばれる問題があり、どのチャンネルにどの原信号が出力されるかは不定であるため、複数の分離システムを別々に動作させただけでは、対応の取れていない分離結果が出力される、すなわち前述のケース2やケース3となる可能性がある。   However, in general, ICA has a problem called “permutation (replacement) indefiniteness”, and it is indeterminate which original signal is output to which channel. Therefore, a plurality of separation systems are operated separately. However, there is a possibility that separation results that cannot be dealt with will be output, that is, Case 2 or Case 3 described above.

ICAに関する従来技術の中には、上記の問題領域と一部重なるものが存在する。例えば、特許文献1及び非特許文献1には、広間隔マイクを用いた分離システムと狭間隔マイクを用いた分離システムとを用意し、低い周波数は広間隔マイクのシステムの分離結果を採用し、高い周波数は狭間隔マイクの分離結果を採用することにより、信号の分離性能を向上させる方法が提案されている。しかし、この方法においては、両方の分離システムの間で、出力チャンネル同士の対応付けを行なう必要があるが、その方法については言及されていない。   Some of the prior arts related to ICA overlap with the above problem areas. For example, in Patent Document 1 and Non-Patent Document 1, a separation system using a wide-space microphone and a separation system using a narrow-space microphone are prepared, and the low frequency adopts the separation result of the wide-space microphone system, A method has been proposed for improving the signal separation performance by adopting the separation result of the narrow interval microphone for high frequencies. However, in this method, it is necessary to associate output channels between both separation systems, but this method is not mentioned.

対応付けを行なう方法の1つとして、後処理による並べ替えがある。例えば、分離システム自体は、上記のケース2やケース3を生成するが、その後に何らかの尺度に基づいて出力をチャンネル間で交換し、最終的にケース1やケース4を得る方法である。しかし、後処理で用いる尺度は、信号の種類に依存するため、上記の問題領域全てに対応した方法は存在しない。例えば、音データを扱う場合は、時間方向エンベロープの類似性や音源方向の推定角度といった、周波数ビン間のパーミュテーション問題を解消するために使用されている尺度を流用することで、ある程度はチャンネル間の対応付けができるが、他の種類の信号への応用は困難である。なお、時間方向エンベロープや音源方向を用いた周波数ビン間パーミュテーション解消については、例えば特許文献3を参照されたい。   One method for performing the association is rearrangement by post-processing. For example, the separation system itself generates the case 2 and the case 3 described above, but thereafter, the output is exchanged between channels based on some scale, and finally the case 1 and the case 4 are obtained. However, since the scale used in the post-processing depends on the type of signal, there is no method corresponding to all the above problem areas. For example, when dealing with sound data, by using the scales used to solve permutation problems between frequency bins, such as the similarity of the temporal direction envelope and the estimated angle of the sound source direction, to some extent the channel Can be associated with each other, but application to other types of signals is difficult. For canceling permutation between frequency bins using a time direction envelope or a sound source direction, see, for example, Patent Document 3.

また、音信号であっても、複数の分離システムでマイクの設置位置が異なる場合は、それぞれのシステムで推定された音源方向が異なるため、音源方向に基づく対応付けが困難になる可能性もある。   In addition, even for sound signals, if microphones are installed at different positions in a plurality of separation systems, the sound source directions estimated by the respective systems may be different, which may make association based on the sound source directions difficult. .

さらに、出力チャンネル数や分離システム数が増えるにつれて、対応付けの組み合わせは爆発的に増えるため、後処理で最適な対応付けを見つけるのが計算量的に困難になる。例えば、出力チャンネル数=4、分離システム数=3の場合、可能な組み合わせは(4!)=13824通りにも及ぶ。従って、後処理で対応付けするよりも、対応付けされた結果を分離システムが直接出力する方が計算量的にも望ましい。 Furthermore, as the number of output channels and the number of separation systems increase, the number of combinations increases rapidly, making it difficult to find an optimal association in post-processing. For example, when the number of output channels = 4 and the number of separation systems = 3, there are (4!) 3 = 13824 possible combinations. Therefore, it is more computationally preferable that the separation system directly outputs the associated result than the association in post-processing.

次に、対応付けをICAの後処理で実現するのではなく、対応付けのなされた信号を分離システムが直接出力する場合について考える。例を挙げると、音信号を分離する分離システムが2つあって、一方の分離システムで、「チャンネル1=音声、チャンネル2=音楽」という分離結果が得られるとともに、他方の分離システムでも同様に「チャンネル1=音声、チャンネル2=音楽」という分離結果が得られるような場合である。この場合、原信号は2つで、一方が音声、他方が音楽である。   Next, let us consider a case where the separation system directly outputs the associated signal instead of realizing the association by post-processing of ICA. For example, there are two separation systems for separating sound signals, and one separation system can obtain a separation result of “channel 1 = sound, channel 2 = music”, and the other separation system similarly. This is a case where a separation result “channel 1 = sound, channel 2 = music” is obtained. In this case, there are two original signals, one is voice and the other is music.

図21は、ICAを用いたm個の分離システム100〜100を備えた場合の信号の分離結果を示す模式図である。各分離システムは、n個の独立な成分Yを分離結果として出力する。この図において、Y [j]は、時系列データ(又はそれに類するデータ)であり、i番目の分離システムのj番目のチャンネルの出力全体を表す。また、Y [j]の中で時刻t(又はt番目のサンプル)をY [j](t)と表記する。Y [j](t)は、音声波形といったスカラー量でも、スペクトラムといった多次元量(多変量)でも構わないが、スカラー量は多次元量の特別な場合と考えられるため、以降では主にY [j](t)が多次元量(ベクトル)である場合、特にスペクトラムである場合について考える。なお、次元数は、同一の分離システム内では一致している必要があるが、異なる分離システム間では異なる次元数でも構わない。例えば、Y [1](t)とY [1](t)とは同次元である必要があるが、Y [1](t)とY [2](t)とは次元数が異なっても構わない。 FIG. 21 is a schematic diagram illustrating a signal separation result when m separation systems 100 1 to 100 m using ICA are provided. Each separation system outputs n independent components Y as separation results. In this figure, Y i [j] is time series data (or similar data) and represents the entire output of the j th channel of the i th separation system. Further, denoted Y i [j] at time t in the (or t-th sample) Y i [j] and (t). Y i [j] (t) may be a scalar quantity such as a speech waveform or a multi-dimensional quantity (multivariate) such as a spectrum. However, since the scalar quantity is considered to be a special case of a multi-dimensional quantity, Consider a case where Y i [j] (t) is a multidimensional quantity (vector), particularly a spectrum. Note that the number of dimensions needs to be the same in the same separation system, but the number of dimensions may be different between different separation systems. For example, Y 1 [1] (t) and Y 2 [1] (t) need to have the same dimension, but Y 1 [1] (t) and Y 1 [2] (t) have dimensions. The number may be different.

ここで、同一システム内の異なる出力チャンネル間では信号を独立にする一方で、異なるシステムの同一チャンネル間では信号の対応がついている(=依存関係がある)ように信号を分離することを考える。例えば、Y [1]〜Y [1]は互いに独立だが、Y [1]〜Y [m]は依存関係がある。言い換えると、k番目の出力チャンネル内でY [1]〜Y [m]という信号のペアを作ったときに、ペア内は依存、ペア間は独立になるように信号を分離する。 Here, it is considered that the signals are separated between different output channels in the same system, while signals are separated (= dependence) between the same channels of different systems. For example, Y 1 [1] to Y n [1] are independent from each other, but Y 1 [1] to Y 1 [m] are dependent. In other words, when made k-th Y k [1] in the output channel to Y k [m] that the signal pairs, inside the pair-dependent, is between a pair separates the signal to be independently.

このようなペア単位での独立成分を得る方法の一つとして、「マルチモーダル独立成分分析」と呼ばれる手法が提案されている(例えば、非特許文献2参照。)。この「マルチモーダル独立成分分析」は、分離システムが2つ(m=2)の場合に、同一の分離システムにおいては出力間で独立性を最大にする(図21でたとえると、Y [1]とY [1]とは独立)と共に、異なる分離システム間の同一チャンネル間では独立性を最小にする(Y [1]とY [2]とは独立性が最小)ように信号を分離するようなものである。 As one method for obtaining such independent components in pairs, a technique called “multimodal independent component analysis” has been proposed (see, for example, Non-Patent Document 2). This “multimodal independent component analysis” maximizes the independence between outputs in the same separation system when there are two separation systems (m = 2) (Y 1 [1 ] And Y 2 [1] are independent of each other, and the independence between the same channels between different separation systems is minimized (Y 1 [1] and Y 1 [2] are the least independent). Is like separating.

しかしながら、マルチモーダル独立成分分析では、例えば、図21のようにm>2の場合や、各Y [j]がベクトルである場合、次の理由により信号を分離することが困難であった。 However, in multimodal independent component analysis, for example, when m> 2 as shown in FIG. 21 or when each Y i [j] is a vector, it is difficult to separate signals for the following reason.

先ず、「同一の分離システムにおいての独立性(最大化)」と「異なるシステム間での独立性(最小化)」という2つの尺度を統合するため、両者の重みつき和を用いているが、重みをヒューリスティックに調整しなければならなかった。   First, in order to integrate the two measures of “independence in the same separation system (maximization)” and “independence between different systems (minimization)”, the weighted sum of the two is used. The weight had to be adjusted heuristically.

次に、「異なるチャンネル間での独立性」を計算するため、2次元のGram-Charlier展開を用いてエントロピーを近似しているが、Gram-Charlier展開の式は、2次元の場合で既に複雑であるため、分離システムの個数を3以上に増やしたり、Y [j]を多次元へ拡張したりするのが困難であった。 Next, in order to calculate “independence between different channels”, entropy is approximated using a two-dimensional Gram-Charlier expansion, but the Gram-Charlier expansion formula is already complex in the two-dimensional case. Therefore, it is difficult to increase the number of separation systems to 3 or more, or to extend Y i [j] to multiple dimensions.

本発明は、このような従来の実情に鑑みて提案されたものであり、独立成分分析を用いて複数の信号が混合された混合信号を信号毎に分離する際に、分離後の後処理を行なうことなく、信号を対応付けて分離することができる信号分離装置及び方法を提供することを目的とする。   The present invention has been proposed in view of such a conventional situation, and when separating a mixed signal in which a plurality of signals are mixed for each signal using independent component analysis, post-processing after separation is performed. It is an object of the present invention to provide a signal separation device and method capable of associating and separating signals without performing them.

上述した目的を達成するために、本発明に係る信号分離装置は、複数の信号が混合された時間領域または時間周波数領域の観測信号と分離行列とから分離信号を生成する複数の分離手段と、異なる複数の分離手段から生成される複数の分離信号の間で対応する分離信号の信号組を生成する信号組生成手段と、上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性の尺度の変化分を演算し、上記信号組間の独立性が最大となるように上記複数の分離手段を制御する独立性演算手段とを有し、各分離手段は、上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記独立性演算手段で演算された上記信号組間の独立性に基づいて上記分離行列が略々収束するまで該分離行列を修正し、略々収束した分離行列を用いて上記分離信号を生成する。   In order to achieve the above-described object, a signal separation device according to the present invention includes a plurality of separation means for generating a separation signal from an observation signal and a separation matrix in a time domain or a time frequency domain in which a plurality of signals are mixed, Using a signal set generation means for generating a signal set of corresponding separation signals among a plurality of separation signals generated from different separation means, and a multivariate probability density function or score function taking the signal set as an argument An independence calculation means for calculating the independence between the signal sets or a change in a measure of independence, and controlling the plurality of separation means so that the independence between the signal sets is maximized, Separation means generates a separation signal from the observed signal and a separation matrix into which initial values are substituted, and the separation matrix substantially converges based on the independence between the signal sets computed by the independence computation means. The separation matrix until Correct, and generates the separated signal by using the substantially converged separation matrix.

また、上述した目的を達成するために、複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離装置において、上記観測信号と分離行列とから分離信号を生成する分離手段と、上記分離手段で生成される複数の分離信号の間で対応する分離信号の信号組を生成する信号組生成手段と、上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性の尺度の変化量を演算し、上記信号組間の独立性が最大となるように上記分離手段を制御する独立性演算手段とを有し、上記分離手段は、上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記独立性演算手段で演算された上記信号組間の独立性に基づいて上記分離行列が略々収束するまで該分離行列を修正し、略々収束した分離行列を用いて上記分離信号を生成する。   In order to achieve the above-described object, a signal separation apparatus that separates an observation signal in a time domain or a time frequency domain, in which a plurality of signals are mixed, into a separated signal using independent component analysis, is separated from the observed signal. Separation means for generating a separation signal from the matrix, signal set generation means for generating a signal set of a corresponding separation signal among a plurality of separation signals generated by the separation means, and a multiplicity that takes the signal set as an argument. The independence of calculating the independence between the signal pairs using the random probability density function or the score function, or controlling the separation means so that the independence between the signal sets is maximized. The separation means generates a separation signal from the observation signal and a separation matrix into which the initial values are substituted, and based on the independence between the signal sets computed by the independence computation means Separation Column modifies the separation matrix until substantially converge, it generates the separated signal by using the substantially converged separation matrix.

また、上述した目的を達成するために、本発明に係る信号分離方法は、複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離方法において、上記観測信号と分離行列とから分離信号を複数の分離手段で生成する工程と、異なる複数の分離手段から生成される複数の分離信号の間で対応する分離信号の信号組を生成する工程と、上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性の尺度の変化分を演算する工程と、上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記確率密度関数またはスコア関数を用いて演算された信号組間の独立性が最大となるように上記分離行列が略々収束するまで該分離行列を修正する工程とを有する。   In addition, in order to achieve the above-described object, the signal separation method according to the present invention is a signal for separating an observation signal in a time domain or a time frequency domain in which a plurality of signals are mixed into a separated signal using independent component analysis. In the separation method, a signal set of a corresponding separation signal is generated between the step of generating a separation signal from the observation signal and the separation matrix by a plurality of separation means and a plurality of separation signals generated from a plurality of different separation means. A step of calculating an independence between the signal sets or a change in a measure of independence using a multivariate probability density function or a score function taking the signal set as an argument, and the observed signal and the initial value are A separation signal is generated from the substituted separation matrix and the separation matrix is substantially converged until the separation matrix is substantially converged so that the independence between the signal sets calculated using the probability density function or the score function is maximized. And a step of modifying a column.

また、上述した目的を達成するために、本発明に係る信号分離方法は、複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離方法において、上記観測信号と分離行列とから分離信号を生成する工程と、上記分離信号の間で対応する分離信号の信号組を生成する工程と、上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性の尺度の変化分を演算する工程と、上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記確率密度関数またはスコア関数を用いて演算された信号組間の独立性が最大となるように上記分離行列が略々収束するまで該分離行列を修正する工程とを有する。   In addition, in order to achieve the above-described object, the signal separation method according to the present invention is a signal for separating an observation signal in a time domain or a time frequency domain in which a plurality of signals are mixed into a separated signal using independent component analysis. In the separation method, a step of generating a separation signal from the observed signal and the separation matrix, a step of generating a signal pair of a corresponding separation signal between the separation signals, and a multivariate probability density taking the signal pair as an argument A separation signal is generated from the step of calculating the independence between the signal pairs using a function or a score function, or a change in the measure of independence, and the separation matrix into which the observed signal and the initial value are substituted, and the probability Modifying the separation matrix until the separation matrix is substantially converged so that the independence between the signal sets calculated using the density function or the score function is maximized.

本発明に係る音声信号分離装置及びその方法によれば、分離信号の信号組を生成し、信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性の尺度の変化分を演算し、演算された信号組間の独立性が最大となるように分離行列が略々収束するまで該分離行列を修正し、略々収束した分離行列を用いて分離信号を生成することにより、分離後の後処理を行なうことなく、信号を対応付けて分離することができる。   According to the speech signal separation device and method therefor according to the present invention, a signal set of separated signals is generated, and the independence or independence between the signal sets using a multivariate probability density function or a score function that takes the signal set as an argument. The change of the gender measure is calculated, the separation matrix is corrected until the separation matrix is substantially converged so that the independence between the calculated signal pairs is maximized, and the separation is performed using the substantially converged separation matrix. By generating the signals, the signals can be associated and separated without performing post-processing after separation.

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。以下の説明において使用する「ペア」とは、1より多くの信号の組を表し、2つの信号の組に限定されるものではない。   Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings. A “pair” used in the following description represents more than one set of signals and is not limited to two sets of signals.

図1は、本発明の一実施形態における信号分離装置の構成を示すブロック図である。この信号分離装置は、独立成分分析(Independent Component Analysis;ICA)を用いるm個の分離システム1〜1を有している。なお、分離システムの詳細は後述する。 FIG. 1 is a block diagram showing a configuration of a signal separation device according to an embodiment of the present invention. This signal separation device has m separation systems 1 1 to 1 m using Independent Component Analysis (ICA). Details of the separation system will be described later.

信号統合部2は、各分離システムの出力(=分離結果)を必要に応じていくつかの信号に統合する。   The signal integration unit 2 integrates the outputs (= separation results) of each separation system into several signals as necessary.

出力部3は、スピーカやディスプレイなどのデバイスであり、音声、音楽、波形等を出力する。例えば、時間周波数領域のICAを用いた音信号の分離システムの場合、時間周波数領域信号(=スペクトログラム)を時間領域信号(=波形)に変換し、スピーカ等から出力する。   The output unit 3 is a device such as a speaker or a display, and outputs voice, music, waveforms, and the like. For example, in the case of a sound signal separation system using an ICA in the time frequency domain, a time frequency domain signal (= spectrogram) is converted into a time domain signal (= waveform) and output from a speaker or the like.

制御部4は、各構成部を統括的に制御し、例えば、各分離システムで分離された分離信号の統合や出力を信号間の対応付けに基づいて制御する。   The control unit 4 comprehensively controls each component, and controls, for example, the integration and output of the separated signals separated by each separation system based on the correspondence between the signals.

独立性計算部5は、分離システム1〜1から出力される複数の信号の間で対応する信号の信号ペア間の独立性を計算し、独立性に基づいて分離システム1〜1を制御する。なお、独立性そのものを計算する代わりに、独立性の変化量に対応した何らかの量(例えば後述のスコア関数)を計算しても構わない。 Independence calculation unit 5, the separation system 1 1 to 1 independence between signals corresponding pair of signals calculated between a plurality of signals output from the m, the separation system 1 1 to 1 m based on independence To control. Instead of calculating the independence itself, any amount corresponding to the amount of change in independence (for example, a score function described later) may be calculated.

マッピング部6は、分離システム1〜1から出力される複数の信号の間で対応する信号の信号ペアを生成し、独立性計算部5で信号ペア間の独立性を計算する際、どの信号の間でペアを構成するかを表す情報を与える。すなわち信号間の対応付けを行なう。具体的には、マイクの間隔や位置、サンプリング周波数、短時間フーリエ変換の窓長、短時間フーリエ変換のシフト幅、分離行列の初期値、観測信号スペクトログラムの正規化方法から選択される1以上の条件に基づいてペアを構成する。なお、詳細は後述する。 The mapping unit 6 generates a signal pair of corresponding signals among a plurality of signals output from the separation systems 1 1 to 1 m , and the independence calculation unit 5 calculates the independence between the signal pairs. Information indicating whether a pair is formed between signals is given. That is, association between signals is performed. Specifically, one or more selected from the interval and position of the microphone, the sampling frequency, the window length of the short-time Fourier transform, the shift width of the short-time Fourier transform, the initial value of the separation matrix, and the normalization method of the observation signal spectrogram Configure pairs based on conditions. Details will be described later.

次に、分離システム1〜1について詳細に説明する。図2は、j番目の分離システムの構成を示すブロック図である。分離システム1は、複数個のセンサ11j1〜11jnと、分離行列更新部12とを有し、観測信号X [j](X [j](k番目のセンサで観測された信号)から構成されるベクトルに、分離のための行列W[j]をかけることで、分離結果(又は、「成分」)Y [j]〜Y [j]を生成する。 Next, the separation systems 1 1 to 1 m will be described in detail. FIG. 2 is a block diagram showing the configuration of the jth separation system. The separation system 1 j has a plurality of sensors 11 j1 to 11 jn and a separation matrix update unit 12 j, and is observed by an observation signal X k [j] (X k [j] (kth sensor). A separation result (or “component”) Y 1 [j] to Y n [j] is generated by multiplying a vector composed of the signal) by a matrix W [j] for separation.

センサ11j1〜11jnは、扱う信号の種類に応じて種々ものを用いることができ、例えば、音信号を扱う場合はマイクロフォンを用いることができる。また、センサの個数は、分離システム1ごとに異なってもよく、また、複数の分離システムの間でセンサを共有してもよい。センサ11j1〜11jnで観測された信号X [j]〜X [j]は、スカラー量でも多次元量(ベクトル量)でもよい。また、X [j]の要素数(ベクトルの次元数)は、分離システムごとに異なる値でもよい。 Various sensors 11 j1 to 11 jn can be used in accordance with the type of signal to be handled. For example, when a sound signal is handled, a microphone can be used. Further, the number of sensors may be different for each separation system 1 j , and the sensors may be shared among a plurality of separation systems. Signals X 1 [j] to X n [j] observed by the sensors 11 j1 to 11 jn may be scalar quantities or multidimensional quantities (vector quantities). In addition, the number of elements of X k [j] (the number of vector dimensions) may be different for each separation system.

分離行列更新部12は、独立性計算部5で計算された独立性に基づいて分離行列W[j]を更新する。 The separation matrix update unit 12 j updates the separation matrix W [j] based on the independence calculated by the independence calculation unit 5.

この分離システム1は、分離システム間又は分離システム内でペアを構成するために、分離された成分Y [j]〜Y [j]をマッピング部6へ送る。そして、独立性計算部5は、マッピング部6で構成されたペアの間の独立性(又は、独立性の変化量に対応した量)を計算する。独立性計算部5で計算された独立性を表す尺度は、分離行列更新部12へ送られ、分離行列更新部12は、新たな分離行列W[j]の値を計算する。なお、独立性計算部5及びマッピング部6の詳細な処理については、後述の具体例ごとに説明する。 The separation system 1 j sends the separated components Y 1 [j] to Y n [j] to the mapping unit 6 in order to form a pair between the separation systems or within the separation system. Then, the independence calculation unit 5 calculates the independence between the pairs configured by the mapping unit 6 (or an amount corresponding to the change amount of independence). Measure of the calculated independence at isolation calculation unit 5 is sent to the separation matrix updating section 12 j, a separation matrix updating section 12 j calculates the value of a new separation matrix W [j]. Detailed processing of the independence calculation unit 5 and the mapping unit 6 will be described for each specific example described later.

次に、信号分離処理の概略を図3に示すフローチャートを用いて説明する。先ず、センサ11j1〜11jnを用いて信号を観測する(ステップS11)。音のICAの場合、マイクで音を収録する。ステップS12では、前処理としてセンサ11j1〜11jnで取得した観測信号の加工を行なう。 Next, the outline of the signal separation processing will be described with reference to the flowchart shown in FIG. First, signals are observed using the sensors 11 j1 to 11 jn (step S11). In the case of sound ICA, sound is recorded with a microphone. In step S12, the observation signals acquired by the sensors 11 j1 to 11 jn are processed as preprocessing.

ステップS13からステップS15までは学習ループであり、分離行列及び分離結果が収束するまで分離処理(ステップS14)を繰り返し実行する。このように分離行列及び分離結果が収束するまで処理を繰り返すことを、以下「学習」と呼ぶ。   Steps S13 to S15 are a learning loop, and the separation process (step S14) is repeatedly executed until the separation matrix and the separation result converge. Repeating the process until the separation matrix and the separation result converge in this manner is hereinafter referred to as “learning”.

ステップS15において学習が終了した場合、後処理として信号を再び加工する(ステップS16)。後処理された信号は、分離結果として後段で処理される(ステップS17)。後段の処理とは、例えば音声認識処理などである。   When learning is completed in step S15, the signal is processed again as post-processing (step S16). The post-processed signal is processed at a later stage as a separation result (step S17). The subsequent processing is, for example, voice recognition processing.

次に、ステップS12における前処理について、図4に示すフローチャートを用いて説明する。ここでは、入力として音信号、分離処理として時間周波数領域のICAを用いる場合について説明する。   Next, the pre-processing in step S12 will be described using the flowchart shown in FIG. Here, a case where a sound signal is used as input and a time-frequency domain ICA is used as separation processing will be described.

ステップS121のAD変換でデジタルに変換された観測信号は、短時間フーリエ変換によって時間周波数領域の信号へ変換される(ステップS122)。このような時間周波数領域の信号をスペクトログラムと呼ぶ。この操作により、時系列のスカラー量だった観測信号が時系列のベクトル量(多変量)へと変換される。   The observation signal converted into digital by the AD conversion in step S121 is converted into a signal in the time-frequency domain by short-time Fourier transform (step S122). Such a signal in the time frequency domain is called a spectrogram. By this operation, the observation signal which is a time series scalar quantity is converted into a time series vector quantity (multivariate).

次に、ステップS123において、観測信号スペクトログラムに対して必要に応じて正規化を行なう。正規化としては、例えばスペクトログラムの周波数ビンごとに、時間方向の平均が0、分散が1となるように信号を加工する手法を用いることができる。また、正規化は、分離システム毎、チャンネル毎、又は周波数ビン毎に行ってもよい。   Next, in step S123, normalization is performed on the observed signal spectrogram as necessary. As normalization, for example, a method of processing a signal so that the average in the time direction becomes 0 and the variance becomes 1 for each frequency bin of the spectrogram can be used. Further, normalization may be performed for each separation system, each channel, or each frequency bin.

正規化された観測信号に対して、必要に応じて後述するような無相関化を行なう(ステップS124)。ステップS125では、分離行列の初期値を設定する。初期値としては、単位行列でもよいが、前回の学習で求めた分離行列を用いてもよい。   The normalized observation signal is subjected to decorrelation as will be described later if necessary (step S124). In step S125, the initial value of the separation matrix is set. As an initial value, a unit matrix may be used, but a separation matrix obtained in the previous learning may be used.

次に、ステップS14における分離処理について、図5に示すフローチャートを用いて説明する。この分離処理の概略は、「ペア間の独立性が増大する方向に分離行列を更新する」という処理を、分離行列が収束するまで繰り返すことである。   Next, the separation processing in step S14 will be described using the flowchart shown in FIG. The outline of this separation process is to repeat the process of “updating the separation matrix in a direction in which the independence between pairs increases” until the separation matrix converges.

先ず、ペア間の独立性を計算するため、分離システム間、又は分離システム内の複数チャンネル間の成分でペアを構成する(ステップS141)。次に、ペアの間の独立性を計算し(ステップS142)、その独立性が増大するように、分離行列の修正値であるΔWを計算する(ステップS143)。最後に、修正値に基づいて分離行列を更新する(ステップS144)。   First, in order to calculate the independence between pairs, a pair is constituted by components between separation systems or between a plurality of channels in the separation system (step S141). Next, independence between the pairs is calculated (step S142), and ΔW, which is a modified value of the separation matrix, is calculated so that the independence increases (step S143). Finally, the separation matrix is updated based on the correction value (step S144).

なお、実際のシステムにおいては、ステップS142〜ステップS144をまとめて一つの式で表現してもよく、後述する式(15)及び式(17)がそれに該当する。この場合、ステップS142のペア間の独立性の計算に該当するのは、式(17)に出現するスコア関数の値を計算することである。また、ステップS141のペアを構成する処理に該当するのは、「それぞれのスコア関数がどの成分を引数として取るか」という対応付けであり、マッピング部6で行われる。   In an actual system, step S142 to step S144 may be collectively expressed as one expression, and expressions (15) and (17) described later correspond thereto. In this case, what corresponds to the calculation of the independence between the pairs in step S142 is to calculate the value of the score function appearing in the equation (17). Also, the processing that forms the pair in step S141 corresponds to “which component each score function takes as an argument” and is performed by the mapping unit 6.

次に、ステップS16における後処理について、図6に示すフローチャートを用いて説明する。後処理の概略は、前処理で時間周波数領域へ変換された信号(スペクトログラム)を、時間領域の信号(波形)へ戻すことであり、従来の時間周波数領域ICAの後処理と同様である。   Next, the post-processing in step S16 will be described using the flowchart shown in FIG. The outline of the post-processing is to return the signal (spectrogram) converted to the time-frequency domain in the pre-processing to the time-domain signal (waveform), and is the same as the post-processing of the conventional time-frequency domain ICA.

ステップS161のリスケーリングは、周波数ビンの間のスケールを調整する処理である。その後、ステップS162のフーリエ逆変換によって、分離結果を波形へ戻す。これらの処理は、ステップS16の後段の処理の内容によっては省略可能である。   The rescaling in step S161 is a process of adjusting the scale between frequency bins. Thereafter, the separation result is returned to the waveform by the inverse Fourier transform in step S162. These processes can be omitted depending on the contents of the process subsequent to step S16.

次に、上述した信号分離処理について、信号例として音声のスペクトルを用いて詳細に説明する。   Next, the signal separation processing described above will be described in detail using a speech spectrum as a signal example.

先ず、マイクロフォンで観測された信号に対して短時間フーリエ変換(STFT)をかけ、フレーム毎にスペクトルを求める。サンプリング周波数をFs、STFTの窓幅をL、M=L/2+1とすると、STFTで求めたスペクトルは、0からFs/2までの周波数をM等分した周波数(周波数ビン)に対応する成分である。これらをX [j](1,t),・・・,X [j](M,t)とおき、さらにそれらを縦に並べたベクトルをX [j](t) とする。 First, a short-time Fourier transform (STFT) is applied to the signal observed by the microphone to obtain a spectrum for each frame. Assuming that the sampling frequency is Fs, the STFT window width is L, and M = L / 2 + 1, the spectrum obtained by the STFT is a component corresponding to a frequency (frequency bin) obtained by dividing the frequency from 0 to Fs / 2 into M equal parts. is there. These are set as X k [j] (1, t),..., X k [j] (M, t), and a vector obtained by arranging them vertically is set as X k [j] (t).

次に、観測信号から分離結果を生成するための行列について説明する。この行列の表現方法は、特定の周波数ビンに対応したものから全分離システムの信号をまとめて分離するものまで、いくつかの段階が可能である。   Next, a matrix for generating a separation result from the observation signal will be described. This matrix representation method can have several stages, from one corresponding to a specific frequency bin to one that separates the signals of all separation systems together.

分離システム1において、ω番目の周波数ビンに対応した分離結果Y [j](ω,t),・・・,Y [j](ω,t)は、ω番目の周波数ビンに対応した観測信号X [j](ω,t),・・・,X [j](ω,t)に分離行列W[j](ω)をかけることで生成することができる。これを下記式(3)で表す。 In the separation system 1 j , the separation results Y 1 [j] (ω, t),..., Y n [j] (ω, t) corresponding to the ωth frequency bin correspond to the ωth frequency bin. observed signals X 1 [j] that (ω, t), ···, X n [j] (ω, t) to the separation matrix W [j] (ω) can be produced by applying a. This is represented by the following formula (3).

Figure 2008092363
Figure 2008092363

次に、式(3)を全ての周波数ビン(ω=1〜M)について展開し、要素を並び替えると、下記式(4)を得る。これは、下記式(5)及び下記式(6)と等価であって、一つの分離システムにおいて、そのシステムに入力される観測信号を一度に分離する式である。   Next, when Expression (3) is expanded for all frequency bins (ω = 1 to M) and the elements are rearranged, the following Expression (4) is obtained. This is equivalent to the following formula (5) and the following formula (6), and is a formula that separates observation signals input to the system at one time in one separation system.

Figure 2008092363
Figure 2008092363

次に、全ての分離システム1〜1の観測信号を同時に分離する式を考える。そのためには、上記式(4)を全てのj(j=1〜m)について展開し、要素を並び替えればよく、結果として下記式(7)を得る。式(7)において、分離結果,分離行列,観測信号をそれぞれY(t),W,X(t)とおくと、下記式(8)に示すようにY(t)=WX(t)と書き表すことができる。すなわち、複数の分離システム1〜1を有する装置であっても、全ての観測信号の同時分離を一つの式で書き表すことができる。 Next, consider an equation for simultaneously separating the observation signals of all the separation systems 1 1 to 1 m . For that purpose, the above equation (4) is expanded for all j (j = 1 to m) and the elements are rearranged, and as a result, the following equation (7) is obtained. In Equation (7), if the separation result, separation matrix, and observation signal are Y (t), W, and X (t), respectively, Y (t) = WX (t) as shown in Equation (8) below. Can be written. That is, even in an apparatus having a plurality of separation systems 1 1 to 1 m , simultaneous separation of all observation signals can be expressed by one equation.

Figure 2008092363
Figure 2008092363

このように全分離システム1〜1の信号をまとめて分離する行列を用いることにより、後述する「ペア単位の独立性」を導入することができる。 By using a matrix that collectively separates the signals of all the separation systems 1 1 to 1 m in this way, “independence of pair units” described later can be introduced.

次に、「ペア単位の独立性」を表す尺度の一つとして、多変量(多次元)の確率密度関数(Probability Density Function: PDF)から計算されるKullback-Leiblar(KL)情報量について説明する。   Next, the Kullback-Leiblar (KL) information amount calculated from the multivariate (multidimensional) probability density function (Probability Density Function: PDF) will be described as one of the measures representing “independence of pair units”. .

Kullback-Leiblar情報量を導入するための準備として、2種類のPDFを導入する。一つは、全ての分離システムの分離結果(出力)を引数としてとる関数、すなわち、ある分離結果の同時確率を与える関数である。これを下記式(9)に示す。以下では、式(9)の左端のような全引数を縦ベクトルで表記したものと、中央のような全引数を横に並べたものとを、等価なものとして扱う。なお、式(9)のPDFは、式変形の途中で消えてしまうため、具体的な式を当てはめる必要はない。   As preparation for introducing the Kullback-Leiblar information amount, two types of PDF are introduced. One is a function that takes the separation results (outputs) of all separation systems as an argument, that is, a function that gives the joint probability of a certain separation result. This is shown in the following formula (9). In the following description, all the arguments such as the left end of Expression (9) are expressed as vertical vectors, and all the arguments such as the center arranged horizontally are treated as equivalent. In addition, since PDF of Formula (9) disappears in the middle of formula deformation, it is not necessary to apply a specific formula.

もう一つのPDFは、k番目のペアの要素を引数としてとる関数、すなわち、あるペアが発生する確率を与える関数である。これを下記式(10)に示す。関数の具体例については後述する。   Another PDF is a function that takes an element of the k-th pair as an argument, that is, a function that gives a probability that a certain pair will occur. This is shown in the following formula (10). Specific examples of functions will be described later.

Figure 2008092363
Figure 2008092363

ここで、上記式(10)を全てのk(k=1〜n)について乗算した式を考える(下記式(11)の右辺)。独立性の定義によれば、式(11)の左辺(=式(9))と右辺とが等しくなるのは、ペア単位の分離結果Y〜Yが互いに独立な場合のみである。従って、式(11)の両辺に「距離」のような尺度を用いると、その尺度はY〜Yが独立の場合に最小(理想的には0)となる。 Here, consider an equation obtained by multiplying the above equation (10) for all k (k = 1 to n) (the right side of the following equation (11)). According to the definition of independence, the left side of Equation (11) (= Equation (9)) and the right side are equal only when the pair-wise separation results Y 1 to Y n are independent of each other. Therefore, when a scale such as “distance” is used on both sides of equation (11), the scale is minimum (ideally 0) when Y 1 to Y n are independent.

Figure 2008092363
Figure 2008092363

PDF間の「距離」を表す尺度として、KL情報量がある。上記式(11)の両辺のPDF間の距離、すなわち、KL情報量は、Yの同時エントロピーH(Y)と、Y〜YのそれぞれのエントロピーH(Y)〜H(Y)とを用いて、下記式(12)のように定義される。式(12)は、エントロピーの定義とY=WXの関係(上記式(5))とを用いて、下記式(13)のように変形される。ここで、式(13)に示すP(Yk(t))は、上記式(10)のPDFである。 There is a KL information amount as a measure representing “distance” between PDFs. The distance between the PDF of both sides of the equation (11), i.e., KL information amount, and Y co-entropy H of (Y), Y 1 to Y n of the respective entropy H (Y 1) to H (Y n) And is defined as in the following formula (12). Expression (12) is transformed into the following expression (13) using the definition of entropy and the relationship of Y = WX (the above expression (5)). Here, P (Yk (t)) shown in Equation (13) is the PDF of Equation (10).

Figure 2008092363
Figure 2008092363

ペア単位の分離結果Y〜Yをお互いに独立にするためには、式(13)で計算されるKL情報量I(Y)を最小にする分離行列Wを、何らかのアルゴリズムによって求めればよい。以下では、アルゴリズムの一例として自然勾配法による式を導出する。 In order to make the pair-wise separation results Y 1 to Y n independent of each other, the separation matrix W that minimizes the KL information amount I (Y) calculated by the equation (13) may be obtained by some algorithm. . In the following, as an example of an algorithm, an equation by a natural gradient method is derived.

I(Y)を最小にするWを自然勾配法で求めるには、式(14)〜式(16)をWが収束するまで繰り返せばよい(学習)。ただし、式(14)は、Y(t)=WX(t)を全てのフレームについて行なうことを意味する。また、式(16)のηは、学習率と呼び、小さな正の実数である(例えば、0.1)。ηは、定数でもよいが、学習の度合いに応じて動的に変更してもよい。例えば、学習の初期は、ηを小さい値(例えば、0.05程度)にして、Wのオーバーフローを防ぎ、学習が収束してきたらηを大きい値(例えば、0.5)にして収束を速めるといった処理を行ってもよい。   In order to obtain W that minimizes I (Y) by the natural gradient method, Expressions (14) to (16) may be repeated until W converges (learning). However, Expression (14) means that Y (t) = WX (t) is performed for all frames. In addition, η in equation (16) is called a learning rate and is a small positive real number (for example, 0.1). η may be a constant or may be dynamically changed according to the degree of learning. For example, at the initial stage of learning, η is set to a small value (for example, about 0.05) to prevent W overflow, and when learning has converged, η is set to a large value (for example, 0.5) to accelerate convergence. Also good.

なお、式(15)の偏微分が具体的にどのような式になるかは、信号の種類やペアの構成方法によって異なる。   Note that the specific expression of the partial differentiation of equation (15) varies depending on the type of signal and the pair configuration method.

Figure 2008092363
Figure 2008092363

以下、上述した信号分離処理方法の適用例について具体的に説明する。   Hereinafter, an application example of the above-described signal separation processing method will be specifically described.

(具体例1)
具体例1として、異なるマイク間隔の協調的分離について説明する。例えば、図7に示すような、広い間隔のマイク(mic1,4)と、狭い間隔のマイク(mic2,3)とを備える場合が考えられる。
(Specific example 1)
As specific example 1, cooperative separation of different microphone intervals will be described. For example, as shown in FIG. 7, there may be a case where microphones (mic1, 4) with wide intervals and microphones (mic2, 3) with narrow intervals are provided.

具体的には、広間隔マイクで観測された信号から得られた観測信号スペクトログラムをX [1],X [1]、その分離結果をY [1],Y [1]、狭間隔マイクについても同様にX [2],X [2]、Y [2],Y [2]とし、Y [1]とY [2]との間、及びY [1]とY [2]との間で対応付けのとれた分離結果を生成するものである。なお、図7に示す分離システムは、4本のマイクを装備しているが、これに限られるものではなく、図8に示すように、同じ位置にあるマイクを複数の分離システムの間で共有しても構わない。この図において、例えば枠で囲まれたX [1]とX [2]とは、同一のマイクで観測された信号を2系統の観測信号として用いることを表わしている。 Specifically, the observed signal spectrograms obtained from the signals observed with the wide interval microphone are X 1 [1] , X 2 [1] , and the separation results are Y 1 [1] , Y 2 [1] , narrow. Similarly, the interval microphones are set as X 1 [2] , X 2 [2] , Y 1 [2] , Y 2 [2], between Y 1 [1] and Y 1 [2] , and Y 2 [ 1] and Y 2 [2] are generated as a result of separation. In addition, although the separation system shown in FIG. 7 is equipped with four microphones, the present invention is not limited to this, and as shown in FIG. 8, a microphone at the same position is shared among a plurality of separation systems. It doesn't matter. In this figure, for example, X 1 [1] and X 1 [2] surrounded by a frame indicate that signals observed by the same microphone are used as observation signals of two systems.

分離システムjのω番目の周波数ビンに対応した分離行列をW[j](ω)、その増分をΔW[j](ω)とおくと、ΔW[j](ω)は、下記式(17)で計算される。この式において、φは、ペアYのPDFを対数微分したものを要素として持つ関数であり、スコア関数や活性化関数と呼ばれる。 When the separation matrix corresponding to the ω-th frequency bin of the separation system j is W [j] (ω) and the increment is ΔW [j] (ω), ΔW [j] (ω) is expressed by the following equation (17). ). In this equation, φ is a function having as an element a logarithmically differentiated PDF of the pair Y k , and is called a score function or an activation function.

Figure 2008092363
Figure 2008092363

また、PDFの具体例として、下記式(18)に示す球状分布と呼ばれる一種の多変量(多次元)PDFを適用することができる。これは、任意のスカラー関数f(x)に、ペアY(t)のL−Nノルム(式(19))を代入したものとして表現される。 As a specific example of PDF, a kind of multivariate (multidimensional) PDF called a spherical distribution represented by the following formula (18) can be applied. This is expressed as a value obtained by substituting the LN norm (formula (19)) of the pair Y k (t) into an arbitrary scalar function f (x).

ここで、Nは任意の正の数であり、例えばN=2を用いる。係数hは、確率の総和を1に調整するための項であるが、スコア関数を導出する際に消えてしまうため、具体的な値を求める必要はない。また、Y(t)のノルムの代わりに、要素毎に重みをつけた式(20)を用いてもよい。スカラー関数f(x)としては、任意の非負関数が使用可能だが、例えば式(21)や式(22)を用いる。これらの式において、K及びlは、任意の正の値である。 Here, N is an arbitrary positive number, for example, N = 2 is used. The coefficient h is a term for adjusting the total sum of probabilities to 1, but it disappears when the score function is derived, so it is not necessary to obtain a specific value. Further, instead of the norm of Y k (t), Expression (20) in which a weight is given for each element may be used. As the scalar function f (x), any non-negative function can be used. For example, Expression (21) or Expression (22) is used. In these equations, K and l are arbitrary positive values.

Figure 2008092363
Figure 2008092363

また、PDFとしては他にも、チャンネルごとのノルムの総和をf(x)に代入したり(式(23)参照。)、同じくノルムの積をf(x)に代入しても(式(24)参照。)構わない。また、球状分布以外の多変量PDFを用いても構わない。   In addition, as PDF, the sum of norms for each channel is substituted into f (x) (see equation (23)), or the product of norms is also substituted into f (x) (equation ( See 24). Moreover, you may use multivariate PDF other than spherical distribution.

Figure 2008092363
Figure 2008092363

スコア関数の具体例を下記に示す。式(25)は、式(20)のPDFと式(21)のf(x)とから導出したスコア関数であり、式(26)は、式(20)のPDFと式(22)とから導出したスコア関数である。これらの式において、K [j](ω)は、式(21)又は式(22)のKに対応しており、ペア毎、チャンネル毎、周波数ビン毎に異なる値を用いてもよい。これにより、収束時のYやWのスケールを制御することができる。 A specific example of the score function is shown below. Expression (25) is a score function derived from the PDF of Expression (20) and f (x) of Expression (21). Expression (26) is obtained from the PDF of Expression (20) and Expression (22). This is a derived score function. In these equations, K k [j] (ω) corresponds to K in Equation (21) or Equation (22), and different values may be used for each pair, each channel, and each frequency bin. Thereby, the scale of Y or W at the time of convergence can be controlled.

Figure 2008092363
Figure 2008092363

このようにスコア関数の引数に、周波数ビン間だけでなく、分離システム間、システム内の複数チャンネル間等の、対応をつけたい(ペアにしたい)信号の全てを代入する。これにより、同一のスコア関数に代入されている信号同士はペアを組んだ方が分離結果のKL情報量が低くなる、すなわち信号全体での独立性が高くなるため、チャンネル同士で対応付けられた分離結果が生成されるようになる。   As described above, all the signals to be matched (desired to be paired), such as not only between the frequency bins but also between the separation systems and between the plurality of channels in the system, are substituted into the argument of the score function. As a result, when the signals assigned to the same score function are paired, the KL information amount of the separation result is lower, that is, the independence of the entire signal is higher, so that the channels are associated with each other. A separation result is generated.

続いて、独立性計算部5及びマッピング部6の処理について図9を用いて説明する。   Next, processing of the independence calculation unit 5 and the mapping unit 6 will be described with reference to FIG.

マッピング部6は、上述のようなスコア関数を表現するために、成分(分離結果)とスコア関数の引数との対応関係をとる。独立性計算部5は、例えば、数式(17)のような勾配法に基づく更新式を用いる場合、スコア関数の計算を行なう。   The mapping unit 6 takes a correspondence relationship between the component (separation result) and the argument of the score function in order to express the score function as described above. For example, the independence calculation unit 5 calculates a score function when using an update expression based on a gradient method such as Expression (17).

ここで、スコア関数は、分離システム毎、チャンネル毎、周波数ビン毎に異なるものを用意する。すなわち、システム全体での分離結果をY(t)というベクトルで表わすと、Y(t)の要素数とスコア関数の個数とは同一となる。   Here, different score functions are prepared for each separation system, each channel, and each frequency bin. That is, when the separation result in the entire system is represented by a vector Y (t), the number of elements of Y (t) and the number of score functions are the same.

つまり、スコア関数は、同一の引数をとるもの同士でグルーピングされる。例えば、グループ1のスコア関数は、それぞれ同一の引数をとることを表す。なお、φ11 [1]〜φ1M [1]は、分離システム1の1番目のチャンネルに対応したスコア関数を表し、φ11 [1]は、1番目の周波数ビンに対応した単一のスコア関数を表している。 That is, the score functions are grouped by those having the same argument. For example, the score function of group 1 represents taking the same argument. Φ 11 [1] to φ 1M [1] represents a score function corresponding to the first channel of the separation system 1, and φ 11 [1] represents a single score corresponding to the first frequency bin. Represents a function.

マッピング部6は、各分離システムから対応する成分を取り出し、ペアを構成する。例えば、ペア1は、それぞれの分離システムの1番目のチャンネルから構成されるペアである。同様に、ペアkは、それぞれの分離システムのk番目のチャンネルから構成されるペアである。   The mapping unit 6 extracts corresponding components from each separation system and configures a pair. For example, pair 1 is a pair composed of the first channel of each separation system. Similarly, pair k is a pair composed of the kth channel of each separation system.

マッピング部6で構成されたペアは、独立性計算部5にて同一の引数をとるスコア関数に供給される。例えば、ペア1は、グループ1のスコア関数に供給され、同様に、ペアkは、グループkに供給される。   The pair configured by the mapping unit 6 is supplied to the score function that takes the same argument by the independence calculation unit 5. For example, pair 1 is supplied to the score function of group 1, and similarly pair k is supplied to group k.

なお、ペアを構成するという処理は、必ずしもデータのコピーを伴う必要はなく、ポインタ等による参照でも構わない。例えば、グループ1がペア1を参照し、ペア1の成分Y [1]が分離システム1の成分Y [1]を参照するという方式でも構わない。 Note that the process of forming a pair does not necessarily need to be accompanied by a copy of data, and may be referred to by a pointer or the like. For example, group 1 refers to the pair 1, component Y 1 [1] of the pair 1 may be a method of referring to the components Y 1 [1] of the separation system 1.

(具体例2)
次に、異なる音響の分析について説明する。例えば、分離システム間でマイクペアは共有しているが、分離システム間で音響分析が異なる場合が考えられる。ここでいう音響分析とは、サンプリングや離散フーリエ変換(DFT)などのことである。例えば、2つの分離システムで2本のマイクを共有していて、一方は16kHzサンプリングで、他方は48kHz サンプリングである場合がこれに該当する。他にも、同一サンプリング周波数でも、両者でDFTの窓長が異なる場合(例えば、512と2048)や、窓長が同じでもシフト幅が異なる場合(例えば、128と256)や、窓の種類が異なる場合(例えば、ハニング窓と平方根ハニング窓)なども、異なる音響分析に該当する。
(Specific example 2)
Next, analysis of different sounds will be described. For example, the microphone pair is shared between the separation systems, but the acoustic analysis may be different between the separation systems. The acoustic analysis here refers to sampling, discrete Fourier transform (DFT), and the like. For example, two separation systems share two microphones, one with 16 kHz sampling and the other with 48 kHz sampling. In addition, even when the same sampling frequency is used, the DFT window length is different between the two (for example, 512 and 2048), the window length is the same but the shift width is different (for example, 128 and 256), or the window type is different. Different cases (for example, Hanning window and square root Hanning window) correspond to different acoustic analysis.

このような場合についても、具体例1と同一の式を用いることで、対応付けのとれた分離結果を生成することができる。ただし、音響分析が異なると、フレーム間隔も異なる可能性がある。例えば、16kHzでサンプリングされた信号に対して、シフト幅128のDFTを適用すると、1フレームあたりの長さは8msであり、シフト幅160のDFTを適用すると、1フレームあたりの長さは10msである。このような場合、式(10)のY(t)のような列ベクトルを直接構成することはできないが、例えば、線形補間等の何らかの補間方法を用いることにより、両者のフレーム間隔を統一することができる。また、必要に応じてフレームデータを重複させることで、フレーム間隔を調整することができる。例えば、図10に示すように、Y [1]が8ms間隔のフレーム、Y [2]が10ms間隔のフレームである場合、Y [2]のデータを4フレームに1回の割合で重複させれば、Y [1]とY [2]との間隔を合わせることができる。または逆に、Y [1] を5フレームに1回の割合で間引いてもよい。 Even in such a case, by using the same formula as in the first specific example, it is possible to generate a separation result that is associated with each other. However, if the acoustic analysis is different, the frame interval may be different. For example, when a DFT with a shift width of 128 is applied to a signal sampled at 16 kHz, the length per frame is 8 ms, and when a DFT with a shift width of 160 is applied, the length per frame is 10 ms. is there. In such a case, a column vector like Y k (t) in equation (10) cannot be directly constructed, but for example, by using some interpolation method such as linear interpolation, the frame interval between them is unified. be able to. Further, the frame interval can be adjusted by duplicating the frame data as necessary. For example, as shown in FIG. 10, frame Y 1 [1] is 8ms intervals, if Y 1 [2] is a frame 10ms interval, Y 1 with every other data to four frames of [2] If they are overlapped, the interval between Y 1 [1] and Y 1 [2] can be matched. Or conversely, Y 1 [1] may be thinned out at a rate of once every 5 frames.

以上、具体例1及び具体例2では、異なるマイク間隔と異なる音響分析とを別の例として紹介したが、もちろん、具体例1と具体例2との組み合わせも可能である。例えば、広いマイク間隔の分離システムと狭いマイク間隔の分離システムとの間で異なる音響分析を用いる場合でも、具体例2と同一の方法で、対応付けの取れた分離結果を生成することができる。   As described above, in the specific example 1 and the specific example 2, different microphone intervals and different acoustic analysis have been introduced as different examples. Of course, a combination of the specific example 1 and the specific example 2 is also possible. For example, even when different acoustic analysis is used between a separation system with a wide microphone interval and a separation system with a narrow microphone interval, it is possible to generate an associated separation result by the same method as in the second specific example.

(具体例3)
次に、本発明の簡易的な実現方法について説明する。これは、特許文献2のようなチャンネルごとの分離を行なうシステムを流用して「ペア単位の分離」を実現する方法、言い換えると、図21において分離システムが1つしか存在しない場合に「ペア単位の分離」を実現する方法についてのものである。
(Specific example 3)
Next, a simple method for realizing the present invention will be described. This is a method for realizing “separation of pair units” by diverting a system for performing separation for each channel as in Patent Document 2, in other words, when there is only one separation system in FIG. It is about the method of realizing “separation”.

図11は、簡易的に信号分離を実現するための処理を示す模式図である。ここで、観測信号X [1]〜X [m]のnは、分離システムを表し、mは信号のペアを表す。先ず、観測信号に対し、並べ替えを行なう。すなわち、この図では横方向に並んでいる観測信号のペアX [1]〜X [m]を縦方向に並べ替え、それをX'とする。次に、X'を一枚のスペクトログラムとみなして、X'〜X'をチャンネル毎に独立な成分Y'〜Y'に分離する。X'〜X'の分離においては、分離システムは1つだけあればよい。この分離結果Y'〜Y'も、X'〜X'と同様の並び方をしている。分離結果に対し、観測信号に対する並べ替えと逆の並べ替えを行なうと、所望の分離結果が得られる。 FIG. 11 is a schematic diagram showing processing for realizing signal separation simply. Here, n of the observation signals X 1 [1] to X n [m] represents a separation system, and m represents a signal pair. First, the observation signals are rearranged. That is, in this figure, the pairs of observation signals X k [1] to X k [m] arranged in the horizontal direction are rearranged in the vertical direction, which is denoted as X ′ k . Next, X 'k is regarded as one of the spectrogram, X' is separated into 1 to X 'independent components Y for each channel n' 1 ~Y 'n. In the separation of X ′ 1 to X ′ n , only one separation system is required. The separation results Y ′ 1 to Y ′ n are arranged in the same manner as X ′ 1 to X ′ n . A desired separation result can be obtained by rearranging the separation result in reverse order to the rearrangement with respect to the observation signal.

同様に、図7に示す具体例のように、周波数ビン数=M、チャンネル数=2の分離システムが2系等ある場合は、例えば、周波数ビン数=2M、チャンネル数=2とみなすことにより、簡易的に信号分離を実現することができる。   Similarly, as in the specific example shown in FIG. 7, when there are two separation systems having the frequency bin number = M and the channel number = 2, for example, by assuming that the frequency bin number = 2M and the channel number = 2. Thus, signal separation can be realized easily.

(具体例4)
また、チャンネル数は分離システムの間で異なっていても構わない。図12は、3入力、3出力の分離システム1及び2入力、2出力の分離システム2における信号の対応付けの例を示す図である。この構成例において、1番目と2番目のチャンネルについては、それぞれペア内で対応付ける。分離システム2については、n=2、m=2、j=2として式(17)〜式(26)を適用する。そして、分離システム1については、3番目のチャンネルに対応したスコア関数に変更を加える。
(Specific example 4)
Also, the number of channels may be different between separation systems. FIG. 12 is a diagram illustrating an example of signal correspondence in the separation system 1 with three inputs and three outputs and the separation system 2 with two inputs and two outputs. In this configuration example, the first and second channels are associated with each other in pairs. For the separation system 2, Equations (17) to (26) are applied with n = 2, m = 2, and j = 2. And about the separation system 1, a change is made to the score function corresponding to the 3rd channel.

分離システム1で使用するスコア関数は、下記式(27)のように表される。ここで、3チャンネル目だけスコア関数の引数が異なる理由は、対応する成分が分離システム2には存在しないからである。従って、3チャンネル目は、式(25)及び式(26)とは異なるスコア関数を使用し、例えば、式(28)で導出される式(29)を用いる。この式において、シグマ記号についているj≠2は、2番目以外の分離システムについての総和を意味する。図12の例では、分離システム数=2なので、j≠2は、j=1と同じ意味となる。   The score function used in the separation system 1 is expressed as the following equation (27). Here, the reason why the argument of the score function differs only for the third channel is that the corresponding component does not exist in the separation system 2. Therefore, the third channel uses a score function different from those in Expression (25) and Expression (26), and uses, for example, Expression (29) derived from Expression (28). In this equation, j ≠ 2 attached to the sigma symbol means the sum for the other separation systems. In the example of FIG. 12, since the number of separation systems = 2, j ≠ 2 has the same meaning as j = 1.

Figure 2008092363
Figure 2008092363

なお、上記式(27)において、2チャンネル目のスコア関数についても式(29)を用いる(式(27)の右辺において、上から2番目の要素の代わりに、式(29)でk=2とした式を用いる)と、2番目のペアの対応付けがとれなくなる。すなわち、Y [2]に対応する成分が Y [1]とY [1]とのどちらに現われるかが不定となる。言い換えると、チャンネル毎にスコア関数の引数の個数を異ならせると、チャンネル毎に対応付けの有無を制御することができる。 In the above equation (27), equation (29) is also used for the score function of the second channel (in the right side of equation (27), k = 2 in equation (29) instead of the second element from the top) And the second pair cannot be associated with each other. That is, it is undefined whether the component corresponding to Y 2 [2] appears in Y 2 [1] or Y 3 [1] . In other words, if the number of arguments of the score function is made different for each channel, the presence / absence of association can be controlled for each channel.

すなわち、対応付けをとりたい成分については、それらをスコア関数の引数に含め、対応付ける必要がない、又は対応付けをとることができない成分については、スコア関数の引数から除外することにより、チャンネル毎の対応付けを制御することができる。   In other words, components that are to be associated are included in the argument of the score function, and components that do not need to be associated or cannot be associated are excluded from the argument of the score function. The association can be controlled.

(具体例5)
また、分離システムの中には、出力を固定したものが含まれていてもよい。適用の一例として、マイクとスピーカとを装備したシステムにおいて、マイクで収録した音からスピーカ由来の音を除去するエコーキャンセルが挙げられる。以下では、固定出力を持つシステムも「分離システム」と表現する。
(Specific example 5)
Further, the separation system may include a fixed output. As an example of application, in a system equipped with a microphone and a speaker, echo cancellation for removing the sound derived from the speaker from the sound recorded by the microphone can be mentioned. In the following, a system having a fixed output is also expressed as a “separation system”.

図13は、信号源が2つあり、一方は音声であり、他方はスピーカから出る音(音楽)である場合の信号分離を説明するための模式図である。   FIG. 13 is a schematic diagram for explaining signal separation when there are two signal sources, one is sound, and the other is sound (music) from a speaker.

ここでは、任意の数の音源からの混合音を、音源数以上の複数のマイクで収録する。また、スピーカから出る音は、ライン出力端子などを通じて分離システムの一方に直接入力される。直接入力される信号をX [2]とする。なお、スピーカが複数ある場合、それらからは他の音源とは混ざっていない信号が直接入力されているとし、それらをX [2],X [2],・・・とする。 Here, the mixed sound from any number of sound sources is recorded by a plurality of microphones equal to or more than the number of sound sources. In addition, sound output from the speaker is directly input to one side of the separation system through a line output terminal or the like. Let X 1 [2] be a directly input signal. When there are a plurality of speakers, signals that are not mixed with other sound sources are directly input from these speakers, and these are assumed to be X 2 [2] , X 3 [2] ,.

また、2種類の分離システムを用意する。一方は、マイクで観測された信号を独立な成分に分離する分離システムであり、他方は、直接入力の信号X [2]をそのまま出力する分離システムである。これは、具体例4において、2番目の分離システムの分離行列を単位行列に固定した特別な場合とみなすことができる。従って、具体例4と同様の式を用いることができる。 In addition, two types of separation systems are prepared. One is a separation system that separates a signal observed by a microphone into independent components, and the other is a separation system that outputs a directly input signal X 1 [2] as it is. This can be regarded as a special case in which the separation matrix of the second separation system is fixed to the unit matrix in the specific example 4. Therefore, the same formula as in specific example 4 can be used.

すなわち、分離システム1については、具体例4と同様に式(17)、式(27)〜式(29)を用いて分離行列を更新し、分離システム2については、分離行列の更新は行なわず、Y [2]=X [2]とする。 That is, the separation system 1 is updated using the equations (17) and (27) to (29) similarly to the specific example 4, and the separation matrix 2 is not updated for the separation system 2. , Y k [2] = X k [2] .

これにより、分離システム1の各チャンネルには、分離システム2の各チャンネルに対応した信号が、まるで引き寄せられるように分離される。そして、分離システム1の残りのチャンネルには、スピーカ由来の音がキャンセルされた音が出力される。図13の例では、スピーカ由来の音に対応した成分がY [1]に出力され、人の音声に対応した成分がY [1]に出力される。 Thereby, the signal corresponding to each channel of the separation system 2 is separated into each channel of the separation system 1 so as to be drawn. And the sound from which the sound derived from a speaker was canceled is output to the remaining channels of the separation system 1. In the example of FIG. 13, a component corresponding to a speaker-derived sound is output to Y 1 [1] , and a component corresponding to a human voice is output to Y 2 [1] .

(具体例6)
また、上述の具体例は、分離システム間で信号が混合しない(=ペア内の信号は混合しない)と仮定していたが、ペア内で信号が混合する場合にも本発明は適用可能である。
(Specific example 6)
In the above-described specific example, it is assumed that the signals are not mixed between the separation systems (= the signals in the pair are not mixed), but the present invention can also be applied to the case where the signals are mixed in the pair. .

図14は、3つの音源を3つのマイクで収録し、それらを3つの成分に分離する処理を説明するための模式図である。ここで、音源のうち2つは、相関性の高い信号を発生していると仮定する。例えば、2台のラジオから同一の番組が放送されている場合や、ステレオスピーカーの左右チャンネルである場合などが該当する。従って、3つのマイクで収録した音を3つの成分に分離する際、2つの成分間には依存関係があって、例えば、Y [1]と、Y [1]とのペアには依存関係があり、そのペアとY [1]単独とが独立となるように分離する。 FIG. 14 is a schematic diagram for explaining a process of recording three sound sources with three microphones and separating them into three components. Here, it is assumed that two of the sound sources generate highly correlated signals. For example, a case where the same program is broadcast from two radios or a case where the left and right channels of a stereo speaker are used. Therefore, when the sound recorded by three microphones is separated into three components, there is a dependency between the two components, for example, depending on the pair of Y 1 [1] and Y 2 [1]. There is a relationship, and the pair and Y 3 [1] alone are separated so as to be independent.

[1]及びY [1]のペアと、Y [1]単独とが独立であることは、PDFを用いて式(30)のように書き表すことができる。従って、式(30)の両辺の距離をKL情報量で表し、それを最小化するようなアルゴリズムで分離行列Wを更新していけば、上述のような分離結果を求めることができる。 The fact that the pair of Y 1 [1] and Y 2 [1] and Y 3 [1] alone are independent can be expressed as in Expression (30) using PDF. Therefore, if the distance between both sides of the expression (30) is expressed by the KL information amount and the separation matrix W is updated with an algorithm that minimizes the distance, the separation result as described above can be obtained.

Figure 2008092363
Figure 2008092363

なお、分離行列の更新は、式(17)で行なえばよい。ただし、スコア関数は、式(31)を用いる。すなわち、依存関係を持たせたい成分をスコア関数の引数に含める。   Note that the update of the separation matrix may be performed using Expression (17). However, equation (31) is used for the score function. That is, a component to be given a dependency is included in the argument of the score function.

このようなスコア関数を表現するため、マッピング部6及び独立計算部5は、図9に示す処理とは異なる処理を行なう。図15は、独立性計算部5及びマッピング部6の処理を説明するための模式図である。   In order to express such a score function, the mapping unit 6 and the independent calculation unit 5 perform processing different from the processing shown in FIG. FIG. 15 is a schematic diagram for explaining the processing of the independence calculation unit 5 and the mapping unit 6.

独立性計算部5は、同一の引数をとるスコア関数をグルーピングする。ここでは、チャンネル1とチャンネル2とでペアを構成しているため、これらのチャンネルに対応したスコア関数で一つのグループ1が構成され、チャンネル3に対応したスコア関数だけでもう一つのグループ2が構成される。   The independence calculation unit 5 groups score functions that take the same argument. Here, since a pair is composed of channel 1 and channel 2, one group 1 is composed of score functions corresponding to these channels, and another group 2 is composed of only the score function corresponding to channel 3. Composed.

マッピング部6は、チャンネル1とチャンネル2とでペア1を構成し、それを独立性計算部5のグループ1中のスコア関数に供給する。また、チャンネル3だけでもう一つのペアを構成し、それを独立性計算部5のグループ2のスコア関数に供給する。   The mapping unit 6 forms a pair 1 with the channel 1 and the channel 2 and supplies it to the score function in the group 1 of the independence calculation unit 5. Further, another pair is formed by only channel 3 and is supplied to the score function of group 2 of the independence calculation unit 5.

(具体例7)
また、従来法のICAにおいて、分離行列Wが正規直交行列であるという制約の下で高速に収束するアルゴリズムが知られているが、それらのアルゴリズムを適用することも可能である。なお、以下の説明では、正規直交制約に基づくアルゴリズムの例として、正規直交制約付き勾配法について説明するが、その他のニュートン法や不動点法などのアルゴリズムも適用可能である。
(Specific example 7)
Further, in the conventional ICA, algorithms that converge at high speed under the restriction that the separation matrix W is an orthonormal matrix are known, but it is also possible to apply these algorithms. In the following description, the gradient method with an orthonormal constraint will be described as an example of an algorithm based on the orthonormal constraint, but other algorithms such as the Newton method and the fixed point method are also applicable.

正規直交行列とは、下記式(32)を満たす行列のことである。Wのスパース性を考慮すると、この式は、分離システム毎、且つ周波数ビン毎の分離行列が正規直交であることを表す式(33)と同値である。   The orthonormal matrix is a matrix that satisfies the following equation (32). Considering the sparsity of W, this equation is equivalent to the equation (33) indicating that the separation matrix for each separation system and each frequency bin is orthonormal.

Figure 2008092363
Figure 2008092363

正規直交制約を分離行列に適用するためには、観測信号を事前に無相関化しておく必要がある。無相関化は、白色化(whitening)や球状化(sphering)とも呼ばれ、ここではチャンネル間の相関係数を0にする処理である。式(32)が式(33)と同値であることから、無相関化は、分離システム毎、且つ周波数ビン毎に行なえばよい。つまり、「分離システム全体での同時無相関化」といった処理は不要である。無相関化の過程について下記式を用いて説明する。   In order to apply the orthonormal constraint to the separation matrix, the observed signal needs to be decorrelated in advance. The decorrelation is also called whitening or sphering, and here is a process of setting the correlation coefficient between channels to zero. Since equation (32) is equivalent to equation (33), decorrelation may be performed for each separation system and for each frequency bin. That is, processing such as “simultaneous decorrelation in the entire separation system” is unnecessary. The process of decorrelation will be described using the following equation.

Figure 2008092363
Figure 2008092363

Σ[j](ω)は、分離システムj、周波数ビン=ωにおける観測信号の分散共分散行列である(式(34))。また、Σ[j](ω)は、固有値λ [j](ω)と固有ベクトルpk [j](ω)とを用いて式(35)のように表わすことができる。固有値λ [j](ω)からなる対角行列をΛ[j](ω)(式(38))、固有ベクトルからなる行列をP[j](ω)(式(37))とし、X[j](ω,t)に対して式(36)による変換をかけると、結果であるX'[j](ω,t)の各成分は、互いに無相関となる。すなわち、Et[X'[j](ω,t) X'[j](ω,t)]=Iを満たす。 Σ [j] (ω) is the variance-covariance matrix of the observed signal in the separation system j and frequency bin = ω (formula (34)). Further, Σ [j] (ω) can be expressed as Equation (35) using the eigenvalue λ k [j] (ω) and the eigenvector p k [j] (ω). A diagonal matrix composed of eigenvalues λ k [j] (ω) is Λ [j] (ω) (formula (38)), a matrix composed of eigenvectors is P [j] (ω) (formula (37)), and X When [j] (ω, t) is transformed according to the equation (36), the resulting components of X ′ [j] (ω, t) are uncorrelated with each other. That is, Et [X ′ [j] (ω, t) X ′ [j] (ω, t) H ] = I is satisfied.

また、学習は、式(17)の代わりに式(40)で行なう。この式は、式(17)に対して正規直交制約を適用して得られるものである。この式のスコア関数φについては、式(17)で用いたものと同一である。   In addition, learning is performed using equation (40) instead of equation (17). This equation is obtained by applying an orthonormal constraint to the equation (17). The score function φ in this equation is the same as that used in equation (17).

Figure 2008092363
Figure 2008092363

また、ICAのアルゴリズムの中には、無相関化と分離との両方をΔWの式に組み込んだものも存在し、これは、「独立性による等分散適応的分離」(Equivariant Adaptive Separation via Independence: EASI)と呼ばれている。式(40)に対してEASIを適用すると式(41)を得る。この式(41)を用いれば、I−Y[j](ω,t) Y^[j](ω,t)という項が無相関化を行なうため、事前の無相関化は不要である。 Also, some ICA algorithms incorporate both decorrelation and separation into the ΔW equation, which is equivalent to “Equivariant Adaptive Separation via Independence: EASI). Applying EASI to equation (40) yields equation (41). If this equation (41) is used, the term I−Y [j] (ω, t) Y ^ [j] (ω, t) H is decorrelated, so that prior decorrelation is unnecessary. .

なお、EASIについては、文献(『詳解 独立成分分析――信号解析の新しい世界――』Aapo Hyvarinen 他,東京電機大学出版局,pp.269272,12.5 独立性による等分散適応的分離)を参考されたい。   For EASI, reference is made to the literature (“Detailed Independent Component Analysis – New World of Signal Analysis”, Aapo Hyvarinen et al., Tokyo Denki University Press, pp.269272, 12.5 Equally Distributed Adaptive Separation by Independence) I want.

(具体例8)
マイク間隔が異なる分離システムを複数用い、後で特定の周波数領域を抽出・合成する場合、使用されない周波数ビンが存在する。この使用されない周波数ビンは、あらかじめ X [j] から除外しておくことにより、ICAの計算量を削減することができる。
(Specific example 8)
When a plurality of separation systems having different microphone intervals are used and a specific frequency region is extracted and synthesized later, there are frequency bins that are not used. By removing these unused frequency bins from X k [j] in advance, the amount of ICA calculation can be reduced.

(具体例9)
具体例2では、フレーム間隔の異なるシステム同士を統合する方法として、図10に示すようにフレーム間隔の荒い側(Y [2])を間隔の細かい側(Y [1])にあわせる方法を説明したが、他の例として、時刻の一致するフレームのみを用いて学習するようにしてもよい。
(Specific example 9)
In the second specific example, as a method of integrating systems having different frame intervals, as shown in FIG. 10, a method in which the rough side (Y k [2] ) of the frame interval is adjusted to the fine side (Y k [1] ). However, as another example, learning may be performed using only frames with the same time.

例えば、図10において、最初のフレームの次は、40ms後に再びフレーム時刻が一致している。すなわち、Y [1]側は、5フレーム毎(1,6,11,16,・・・)、Y [2]側は、4フレーム毎(1,5,9,13,・・・)に時刻が一致するため、時刻が一致するフレームのみを観測信号から抽出し、そのデータを用いて全体の分離行列を学習する。この段階の分離行列は、システム間の出力の対応はとれているものの、間引いたデータで学習されたため、全データで学習した場合と比べて精度は落ちることから、この分離行列を初期値として、それぞれの分離システムにおいて一層の学習を行なう。その際は、全てのフレームを用いて学習を行なう。 For example, in FIG. 10, after the first frame, the frame times coincide again after 40 ms. That is, the Y k [1] side is every 5 frames (1, 6, 11, 16,...), And the Y k [2] side is every 4 frames (1, 5, 9, 13,... Therefore, only the frames with the same time are extracted from the observation signal, and the entire separation matrix is learned using the data. Although the separation matrix at this stage has correspondence between the outputs between the systems, it is learned with the thinned data, so the accuracy is lower than when learning with all the data, so this separation matrix is the initial value, Further learning is performed in each separation system. In that case, learning is performed using all frames.

(具体例10)
次に、分離システム間でマイクの設置位置が異なる場合の協調的分離について、図16を用いて説明する。
(Specific Example 10)
Next, cooperative separation when the microphone installation positions are different between the separation systems will be described with reference to FIG.

協調的分離の説明に入る前に、ICAとビームフォーミングとの関係について説明する。時間周波数領域のICAによって求められた分離行列は、マイクロフォンアレイを用いたビームフォーミングの各種方法のうち、死角形成型と等価であることが知られている。両者の等価性については、例えば以下の文献を参照されたい。   Before describing the cooperative separation, the relationship between ICA and beamforming will be described. It is known that the separation matrix obtained by ICA in the time-frequency domain is equivalent to the blind spot forming type among various beam forming methods using a microphone array. For the equivalence of the two, refer to the following documents, for example.

荒木 章子, 牧野 昭二, 向井 良, 猿渡 洋, “周波数領域ブラインド音源分離と周波数領域適応ビームフォーマの関係について” 日本音響学会2001年秋秋季研究発表会 講演論文集 2-6-12, pp. 613-614   Akiko Araki, Shoji Makino, Ryo Mukai, Hiroshi Saruwatari, “Relationship between Frequency Domain Blind Source Separation and Frequency Domain Adaptive Beamformer” Proceedings of the 2001 Acoustical Society of Japan Annual Meeting 2-6-12, pp. 613- 614

従って、ICAの分離結果は、次のように解釈することができる。例えば、チャンネルkにi番目の音源が出力されている場合というのは、マイクロフォンアレイによってi番目以外の音源の方向に死角(感度の低い方向)が形成され、i番目以外の音源の音が抑圧されることで、結果としてi番目の音源からの音のみが残っていると考えられる。   Therefore, the separation result of ICA can be interpreted as follows. For example, when the i-th sound source is output to the channel k, a dead angle (a low sensitivity direction) is formed in the direction of the sound source other than the i-th by the microphone array, and the sound of the sound source other than the i-th sound is suppressed. As a result, it is considered that only the sound from the i-th sound source remains as a result.

形成される死角の鋭さはマイクの設置位置に影響を受けるため、ICAの分離性能もマイクの配置の影響を受ける。例えば、直線状に配置されたマイクを用いて死角を形成する場合、マイク列と直交する方向に対しては幅の狭い(鋭い)死角を形成できるが、マイク列の延長線上に対しては幅の広い死角しか形成できない。従って、直線状に配置されたマイクを用いるICAでは、マイク列と直交する方向に位置する複数の音源同士を高い精度で分離することは容易だが、マイク列の延長線上に位置する複数の音源同士を高い精度で分離するのは難しい。   Since the sharpness of the formed blind spot is affected by the microphone installation position, the ICA separation performance is also affected by the microphone arrangement. For example, when forming a blind spot using microphones arranged in a straight line, a narrow (sharp) blind spot can be formed in a direction orthogonal to the microphone array, but a width is formed on the extension line of the microphone array. Only a wide blind spot can be formed. Therefore, in ICA using microphones arranged in a straight line, it is easy to separate a plurality of sound sources located in a direction orthogonal to the microphone row with high accuracy, but a plurality of sound sources located on an extension line of the microphone row are arranged. Is difficult to separate with high accuracy.

ここで、図16に示すマイク配置について説明する。この図では分離システムが2つあり、一方(分離システム1)は横方向に配置されたマイクを使用し、もう一方(分離システム2)は縦方向に配置されたマイクを使用するものとする。(この図では、中央のマイクは両システムで共有されているが、別々に用意しても構わない。また、各システムは5個のマイクを有しているが、音源数以上ならば何個でも構わない。)また、4つの音源が存在し、それらは同時に鳴っているとする。   Here, the microphone arrangement shown in FIG. 16 will be described. In this figure, there are two separation systems, one (separation system 1) uses a microphone arranged in the horizontal direction, and the other (separation system 2) uses a microphone arranged in the vertical direction. (In this figure, the central microphone is shared by both systems, but you may prepare them separately. Each system has five microphones, but if there are more than the number of sound sources, how many. However, it is assumed that there are four sound sources and they are playing simultaneously.

分離システム1で使用するマイクにとって、音源1と音源2はマイク列とほぼ直交する方向に位置しているため、それぞれの音源からの音は、鋭い死角によってピンポイント的にマスクすることができる。従って、分離システム1は音源1と音源2とを高い精度で分離することができる。一方、音源3と音源4は、マイク列のほぼ延長線上に位置しているため、広い死角で両音源をまとめてマスクすることは容易だが、一方の音源のみをマスクしてもう一方を残すといったことは難しい。以上をまとめると、分離システム1の分離結果は以下のような特徴をもつ。   For the microphone used in the separation system 1, the sound source 1 and the sound source 2 are positioned in a direction substantially orthogonal to the microphone row, so that the sound from each sound source can be pinpointly masked by a sharp blind spot. Therefore, the separation system 1 can separate the sound source 1 and the sound source 2 with high accuracy. On the other hand, since the sound source 3 and the sound source 4 are located almost on the extension line of the microphone row, it is easy to mask both sound sources together with a wide blind spot, but only one sound source is masked and the other is left. It ’s difficult. In summary, the separation result of the separation system 1 has the following characteristics.

音源1が主に出力されているチャンネル:
高い精度で分離されている。音源2は鋭い死角でマスクされ、音源3と4は広い死角でまとめてマスクされるため。
Channel to which sound source 1 is mainly output:
Separated with high accuracy. Sound source 2 is masked with a sharp blind spot, and sound sources 3 and 4 are masked together with a wide blind spot.

音源2が主に出力されているチャンネル:
高い精度で分離されている。音源1は鋭い死角でマスクされ、音源3と4は広い死角でまとめてマスクされるため。
Channel to which sound source 2 is mainly output:
Separated with high accuracy. Sound source 1 is masked with a sharp blind spot, and sound sources 3 and 4 are masked together with a wide blind spot.

音源3が主に出力されているチャンネル:
音源4が残っているように聞こえる。音源1と2は鋭い死角でそれぞれマスクされるのに対し、音源4は広い死角でマスクされ、音源3もある程度は抑圧されるため。
Channel to which sound source 3 is mainly output:
Sounds like sound source 4 remains. The sound sources 1 and 2 are each masked with a sharp blind spot, whereas the sound source 4 is masked with a wide blind spot, and the sound source 3 is suppressed to some extent.

音源4が主に出力されているチャンネル:
音源3が残っているように聞こえる。音源1と2は鋭い死角でそれぞれマスクされるのに対し、音源3は広い死角でマスクされ、音源4もある程度は抑圧されるため。
Channel to which sound source 4 is mainly output:
Sounds like sound source 3 remains. The sound sources 1 and 2 are each masked with a sharp blind spot, whereas the sound source 3 is masked with a wide blind spot, and the sound source 4 is suppressed to some extent.

一方、分離システム2が使用するマイクは、分離システム1のマイクとは直交しているため、音源とマイク列との位置関係が分離システム1とは逆になる。従って、分離システム2の分離結果は以下のような特徴をもつ。   On the other hand, since the microphone used by the separation system 2 is orthogonal to the microphone of the separation system 1, the positional relationship between the sound source and the microphone row is opposite to that of the separation system 1. Therefore, the separation result of the separation system 2 has the following characteristics.

音源1が主に出力されているチャンネル:
音源2が残っているように聞こえる。
Channel to which sound source 1 is mainly output:
Sounds like sound source 2 remains.

音源2が主に出力されているチャンネル:
音源1が残っているように聞こえる。
Channel to which sound source 2 is mainly output:
Sounds like sound source 1 remains.

音源3が主に出力されているチャンネル:
高い精度で分離される。
Channel to which sound source 3 is mainly output:
Separated with high accuracy.

音源4が主に出力されているチャンネル:
高い精度で分離される。
Channel to which sound source 4 is mainly output:
Separated with high accuracy.

以上をまとめると、マイク列と音源とが図16の関係にある場合、音源1と音源2に対応した分離結果については分離システム1のものを採用したほうが良く、音源3と音源4については分離システム2のものを採用した方が良い。このように、マイク配置の異なる分離システムを複数用意することで、分離結果のうち、それぞれのマイク配置が得意とする方向の音源に対応したチャンネルのみを採用することが可能となる。   In summary, when the microphone array and the sound source are in the relationship shown in FIG. 16, it is better to adopt the separation system 1 for the separation results corresponding to the sound source 1 and the sound source 2, and the sound source 3 and the sound source 4 are separated. It is better to adopt the system 2. In this way, by preparing a plurality of separation systems with different microphone arrangements, it is possible to employ only the channel corresponding to the sound source in the direction in which each microphone arrangement is good, among the separation results.

このような、分離システム間でのチャンネルの取捨選択を行なうためには、その前に、分離システム間でチャンネルの対応付けができている必要がある。具体例1と同様の方法や式を用いると、分離システム間でチャンネルの対応付けがとられた出力を得ることができる。例えば、分離システムの1番目のチャンネルに音源4が出力されている場合、分離システム2の1番目のチャンネルにも音源4が出力される。   In order to perform channel selection between separation systems as described above, it is necessary to associate channels between separation systems before that. By using the same method and formula as in the first specific example, it is possible to obtain an output in which the channels are associated between the separation systems. For example, when the sound source 4 is output to the first channel of the separation system, the sound source 4 is also output to the first channel of the separation system 2.

以上説明したように、対応を付けたい出力チャンネルで同一の引数をとるスコア関数を用いることにより、複数の分離システムの間で、出力チャンネル同士の対応付けのとれた分離結果を生成することができる。さらに、「ペア内の信号は依存関係があるが、ペア間の信号は互いに独立」という分離結果を生成することができる。   As described above, by using the score function that takes the same argument in the output channel to be associated, a separation result in which the output channels are associated with each other can be generated between the plurality of separation systems. . Furthermore, it is possible to generate a separation result that “the signals in the pair are dependent but the signals between the pairs are independent of each other”.

図17は、狭間隔マイクと広間隔マイクとの協調的分離の具体例を説明するための模式図である。図17(A)に示すように狭間隔のマイク1〜3は、7.5cmの等間隔で設置されている。広間隔のマイク1,3,4は、15cmの間隔及び30cmの間隔で設置されている。すなわち、チャンネル数n=3、分離システム数m=2である。両者で共有しているマイクがあるため、システム全体でのマイク本数は6ではなく、4となる。   FIG. 17 is a schematic diagram for explaining a specific example of cooperative separation between a narrow interval microphone and a wide interval microphone. As shown in FIG. 17A, the closely spaced microphones 1 to 3 are installed at equal intervals of 7.5 cm. Widely spaced microphones 1, 3, 4 are installed at 15 cm and 30 cm intervals. That is, the number of channels n = 3 and the number of separation systems m = 2. Since there are microphones shared by both parties, the number of microphones in the entire system is four instead of six.

また、図17(B)に示すようにマイク群中央から1m離れた場所にスピーカを3個置き、音源1は右前方45度方向からの音楽、音源2は正面からの音声、音源3は左真横からの音楽とした。   Also, as shown in FIG. 17B, three speakers are placed at a distance of 1 m from the center of the microphone group, the sound source 1 is music from the 45 ° right front direction, the sound source 2 is the sound from the front, and the sound source 3 is the left It was music from the side.

これらの音を4個のマイクで収録し、16kHzでサンプリングした。その信号に対して、窓長512、シフト幅128のFFTをかけ、観測信号のスペクトログラムを生成した(6枚)。すなわち、M=(512/2)+1=257である。なお、後述するSIR(Signal-to-Interference Ratio)という比率を計算するため、原信号はそれぞれ単独で鳴らしたものを複数マイクで観測し、計算機により波形を混合した。   These sounds were recorded with four microphones and sampled at 16 kHz. The signal was subjected to FFT with a window length of 512 and a shift width of 128 to generate spectrograms of observation signals (six images). That is, M = (512/2) + 1 = 257. In order to calculate a ratio called SIR (Signal-to-Interference Ratio), which will be described later, the original signal that was sounded independently was observed with a plurality of microphones, and the waveforms were mixed by a computer.

こうして生成した観測信号スペクトログラムに対して、式(17)及び式(25)を用いて分離を行った。ただし、式(25)において係数aはすべて1、Kも共通でsqrt(M)≒16.03、N=2である。また、反復回数は、300回である。   The observation signal spectrogram generated in this way was separated using Equation (17) and Equation (25). However, in the equation (25), the coefficient a is all 1 and K is common, and sqrt (M) ≈16.03 and N = 2. The number of iterations is 300.

図18及び図19は、それぞれ狭間隔マイク及び広間隔マイクから得られた分離結果である。図18(A)及び図19(A)に示すスペクトログラムにより、両者間で対応する信号が同じチャンネルに出力されていることが分かる。すなわち、Y [1]とY [2]は音楽の音源3に対応した成分、Y [1]とY [2]は音声の音源2に対応した成分、Y [1]とY [2]は音楽の音源1に対応した成分である。なお、従来のように2つの分離システム(狭間隔マイクを持つシステムと広間隔マイクを持つシステム)を別々に動作させた場合は、両システム間でチャンネルの対応が取れた分離結果が出力される保証はない。そのため、このようにシステム間で対応の取れた分離結果が生成されることは、本発明の利点である。 18 and 19 show the separation results obtained from the narrow interval microphone and the wide interval microphone, respectively. It can be seen from the spectrograms shown in FIGS. 18A and 19A that corresponding signals are output to the same channel. That is, Y 1 [1] and Y 1 [2] are components corresponding to the sound source 3 of music, Y 2 [1] and Y 2 [2] are components corresponding to the sound source 2 of sound, and Y 3 [1] and Y 3 [2] is a component corresponding to the music source 1. In addition, when two separation systems (a system with a narrow interval microphone and a system with a wide interval microphone) are operated separately as in the past, a separation result in which the channel correspondence between both systems can be output is output. There is no guarantee. Therefore, it is an advantage of the present invention that a separation result that can be dealt with between systems in this way is generated.

なお、図18及び図19の右側は、周波数ビンごとのSIRである。SIRとは、3つの原信号がどれくらいのパワー比で含まれているかを表わす尺度であり、この図での単位はデシベルである。このグラフのある周波数ビンにおいて、一つの原信号だけ比率が高ければ(右方向に突出していれば)、その周波数ビンでは分離が成功していることを意味し、逆に、3つとも同じくらいの比率で含まれていれば、分離が失敗していることを意味する。図18(B)のグラフと図19(B)のグラフとを比較すると、高い精度で分離されている周波数ビンが両者で異なっていることが分かる。どの周波数ビンで分離に成功しやすい(しにくい)かは、マイクの間隔にある程度依存する。従って、それぞれの分離システムの結果(スペクトログラム)から、高い精度で分離されている周波数ビンの成分を抽出し、次に両者を混合することで、一層高い精度の分離結果を生成することも可能である。   The right side of FIGS. 18 and 19 is the SIR for each frequency bin. The SIR is a scale representing how much power ratio the three original signals are included, and the unit in this figure is decibel. In a frequency bin in this graph, if the ratio of only one original signal is high (projecting to the right), it means that the separation is successful in that frequency bin, and conversely all three are as much If it is included in the ratio, it means that the separation has failed. Comparing the graph of FIG. 18B and the graph of FIG. 19B, it can be seen that the frequency bins separated with high accuracy are different between the two. Which frequency bin is likely (or difficult to) to succeed in separation depends to some extent on the distance between the microphones. Therefore, it is also possible to extract the frequency bin components separated with high accuracy from the results (spectrogram) of each separation system, and then mix them together to generate a higher accuracy separation result. is there.

ではここで、本発明と、特開2006−238409と、特開2006−238409以前の時間周波数領域ICA(以下では「従来の時間周波数領域のICA」)との理論上の違いについて、KL情報量に着目して説明する。KL情報量はPDF間の距離のような尺度であるが、どのPDFの間で距離を計算しているかが三者で異なるのである。以下では、チャンネル数n=3、分離システム数m=1としているが、数は任意であってもよい。ここで、以下の4つのPDFを考える。   Now, regarding the theoretical difference between the present invention and the time frequency domain ICA before JP 2006-238409 (hereinafter, “conventional time frequency domain ICA”), the KL information amount is disclosed. This will be explained with a focus on. The amount of KL information is a measure such as the distance between PDFs, but the difference in which PDF is calculated differs among the three. In the following, the number of channels n = 3 and the number of separation systems m = 1, but the numbers may be arbitrary. Here, the following four PDFs are considered.

Figure 2008092363
Figure 2008092363

式(42)は、出力の全ての要素を引数として持つPDFであり、全部の引数の同時確率を表している。式(43)は、Y [1]とY [1]のペアと、Y [1]単独とが独立であることを表しており、具体例6で使用されているものである。式(44)は、スペクトログラム単位で独立であることを表している。式(45)は、すべての引数が独立であることを表している。 Expression (42) is a PDF having all the elements of the output as arguments, and represents the joint probability of all the arguments. Formula (43) represents that the pair of Y 1 [1] and Y 2 [1] and Y 3 [1] alone are independent, and are used in Specific Example 6. Formula (44) represents that it is independent in spectrogram units. Expression (45) indicates that all arguments are independent.

従来の時間周波数領域のICAは、式(45)と式(42)とのKL情報量を最小化するのと等価であった。式(45)は「同一チャンネル内の周波数ビンの間も独立である」という余計な条件を含んでいるため、このKL情報量を最小にするような分離行列および分離結果を求めると、同一チャンネル内の異なる周波数ビンの間で異なる原信号が現われるという現象、すなわち周波数ビン間のパーミュテーション問題が発生していた。   The conventional ICA in the time-frequency domain is equivalent to minimizing the KL information amount of Equation (45) and Equation (42). Since the expression (45) includes an extra condition that “the frequency bins in the same channel are also independent”, when the separation matrix and the separation result that minimize the amount of KL information are obtained, the same channel is obtained. A phenomenon in which different original signals appear between different frequency bins, that is, a permutation problem between frequency bins has occurred.

一方、特開2006−238409号公報に記載された技術では、式(44)と式(42)とのKL情報量を最小化している。式(44)は「異なるチャンネル間は独立だが、同一チャンネル内の周波数ビン同士は非独立(依存関係あり)」という条件を表わしているため、このKL情報量の最小化によって得られた分離結果では、周波数ビン間のパーミュテーション問題が解消されている。   On the other hand, in the technique described in Japanese Patent Application Laid-Open No. 2006-238409, the KL information amount of Expression (44) and Expression (42) is minimized. Since the equation (44) represents a condition that “different channels are independent but frequency bins in the same channel are not independent (with a dependency relationship)”, the separation result obtained by minimizing this KL information amount Then, the permutation problem between frequency bins is solved.

ここで、式(42)を「全く分解(factorize)されていないPDF」、式(45)を「要素ごとに完全に分解されたPDF」と見なすと、式(44)は両者の中間段階の PDF であると見なすことができる。すなわち、PDFの分解を「チャンネルごとに分解された」状態でとどめたのが式(44)である。   Here, when Equation (42) is regarded as “PDF that has not been factorized at all” and Equation (45) is regarded as “PDF that is completely decomposed element by element”, Equation (44) is an intermediate stage between the two. Can be considered PDF. That is, the expression (44) shows that the decomposition of the PDF is stopped in the state of being decomposed for each channel.

それに対し、本発明は、PDFの分解を「ペアごとに分解された」状態でとどめたものと見なすことができる。例えば、具体例6で使用されている式(43)は、式(42)と式(44)との間の中間的なPDFと見なせる。   On the other hand, the present invention can be regarded as stopping the decomposition of the PDF in a “decomposed pairwise” state. For example, Equation (43) used in Specific Example 6 can be regarded as an intermediate PDF between Equation (42) and Equation (44).

ペアの構成の仕方は任意であり、また、ペア内の要素数はペアごとに異なっていても構わないため、式(42)と式(45)との間に存在しうる任意のPDF(以降「中間段階PDF」)を表現することができる。すなわち、中間段階PDFと式(42)とのKL情報量を最小化するという方式のICAは、全て本発明の範疇に含まれる。   The method of configuring the pair is arbitrary, and the number of elements in the pair may be different for each pair. Therefore, any PDF that can exist between Expression (42) and Expression (45) “Intermediate stage PDF”) can be expressed. In other words, all ICAs that minimize the amount of KL information between the intermediate stage PDF and the equation (42) are included in the scope of the present invention.

本発明の一実施形態における信号分離装置の構成を示すブロック図である。It is a block diagram which shows the structure of the signal separation apparatus in one Embodiment of this invention. j番目の分離システムの構成を示すブロック図である。It is a block diagram which shows the structure of the j-th separation system. 信号分離処理の概略を説明するフローチャートである。It is a flowchart explaining the outline of a signal separation process. 信号分離処理における前処理を説明するフローチャートである。It is a flowchart explaining the pre-process in a signal separation process. 信号分離処理における分離処理を説明するフローチャートである。It is a flowchart explaining the separation process in a signal separation process. 信号分離処理における後処理を説明するフローチャートである。It is a flowchart explaining the post-process in a signal separation process. 広い間隔のマイクと狭い間隔のマイクとを備える場合の分離処理を説明するための模式図である。It is a schematic diagram for demonstrating the isolation | separation process in the case of providing a microphone of a wide space | interval and a microphone of a narrow space | interval. 同じ位置にあるマイクを複数の分離システムの間で共有した場合を示す模式図である。It is a schematic diagram which shows the case where the microphone in the same position is shared between several isolation | separation systems. 独立性計算部及びマッピング部の処理を説明するための模式図ある。It is a schematic diagram for demonstrating the process of an independence calculation part and a mapping part. [1]が8ms間隔のフレーム、Y [2]が10ms間隔のフレームである場合の処理を説明するための模式図である。Y 1 [1] is a schematic diagram for frame 8ms intervals, Y 1 [2] is for explaining a process performed when a frame of 10ms intervals. 簡易的に信号分離を実現するための処理を示す模式図である。It is a schematic diagram which shows the process for implement | achieving signal separation simply. 3入力、3出力の分離システム、及び2入力、2出力の分離システムにおける信号の対応付けの例を示す図である。It is a figure which shows the example of the matching of the signal in the separation system of 3 inputs and 3 outputs, and the separation system of 2 inputs and 2 outputs. 信号源が2つあり、一方は音声であり、他方はスピーカから出る音(音楽)である場合の信号分離を説明するための模式図である。It is a schematic diagram for demonstrating signal separation in case there are two signal sources, one is sound, and the other is sound (music) coming out of a speaker. 3つの音源を3つのマイクで収録し、それらを3つの成分に分離する処理を説明するための模式図である。It is a mimetic diagram for explaining processing which records three sound sources with three microphones, and separates them into three components. 独立性計算部及びマッピング部の処理を説明するための模式図である。It is a schematic diagram for demonstrating the process of an independence calculation part and a mapping part. 分離システム間でマイクの設置位置が異なる場合の協調的分離を説明するための模式図である。It is a schematic diagram for demonstrating cooperative separation in case the installation position of a microphone differs between separation systems. 狭間隔マイクと広間隔マイクとの協調的分離の具体例を説明するための模式図である。It is a schematic diagram for demonstrating the specific example of the cooperative separation of a narrow interval microphone and a wide interval microphone. 狭間隔マイクから得られた分離結果を示す図である。It is a figure which shows the isolation | separation result obtained from the narrow space | interval microphone. 広間隔マイクから得られた分離結果を示す図である。It is a figure which shows the isolation | separation result obtained from the wide space | interval microphone. N個の音源から出力された原信号をn個のマイクロフォンで観測する状況を示す図である。It is a figure which shows the condition which observes the original signal output from N sound sources with n microphones. ICAを用いたm個の分離システムを備えた場合の信号の分離結果を示す模式図である。It is a schematic diagram which shows the separation result of the signal at the time of providing the m pieces of separation system using ICA.

符号の説明Explanation of symbols

〜1 分離システム、 2 信号統合部、3 出力部、4 制御部、5 独立性計算部、6 マッピング部 1 1 to 1 m separation system, 2 signal integration unit, 3 output unit, 4 control unit, 5 independence calculation unit, 6 mapping unit

Claims (8)

複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離装置において、
上記観測信号と分離行列とから分離信号を生成する複数の分離手段と、
異なる複数の分離手段から生成される複数の分離信号の間で対応する分離信号の信号組を生成する信号組生成手段と、
上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性尺度の変化分を演算し、上記信号組間の独立性が最大となるように上記複数の分離手段を制御する独立性演算手段と
を有し、
各分離手段は、上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記独立性演算手段で演算された上記信号組間の独立性に基づいて上記分離行列が略々収束するまで該分離行列を修正し、略々収束した分離行列を用いて上記分離信号を生成する
ことを特徴とする信号分離装置。
In a signal separation device that separates an observation signal in a time domain or a time frequency domain in which a plurality of signals are mixed into a separated signal using independent component analysis,
A plurality of separation means for generating a separation signal from the observed signal and the separation matrix;
A signal set generation means for generating a signal set of corresponding separation signals among a plurality of separation signals generated from different separation means;
Using the multivariate probability density function or score function that takes the signal pair as an argument, calculate the independence between the signal pairs or the change in the independence measure, and so that the independence between the signal pairs is maximized An independence calculating means for controlling a plurality of separating means,
Each separation means generates a separation signal from the observation signal and the separation matrix into which the initial value is substituted, and the separation matrix is approximately based on the independence between the signal sets computed by the independence computation means. A signal separation device, wherein the separation matrix is corrected until convergence, and the separation signal is generated using a substantially converged separation matrix.
上記信号組間の独立性を表す尺度として、上記多変量確率密度関数から計算されるKullback-Leibler情報量を用いることを特徴とする請求項1記載の信号分離装置。   2. The signal separation device according to claim 1, wherein a Kullback-Leibler information amount calculated from the multivariate probability density function is used as a measure representing independence between the signal sets. 上記信号組生成手段は、マイクの間隔または設置位置、サンプリング周波数、短時間フーリエ変換の窓長、短時間フーリエ変換のシフト幅、分離行列の初期値、観測信号スペクトログラムの正規化方法から選択される少なくとも1以上の条件が異なる複数の分離手段から生成される複数の分離信号の間で対応する分離信号の信号組を生成することを特徴とする請求項1記載の信号分離装置。   The signal set generation means is selected from microphone interval or installation position, sampling frequency, short-time Fourier transform window length, short-time Fourier transform shift width, initial value of separation matrix, and observation signal spectrogram normalization method 2. The signal separation device according to claim 1, wherein a signal set of corresponding separation signals is generated among a plurality of separation signals generated from a plurality of separation means having at least one or more different conditions. 複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離装置において、
上記観測信号と分離行列とから分離信号を生成する分離手段と、
上記分離手段のチャンネル間で対応する分離信号の信号組を生成する信号組生成手段と、
上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性尺度の変化分を演算し、上記信号組間の独立性が最大となるように上記分離手段を制御する独立性演算手段と
を有し、
上記分離手段は、上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記独立性演算手段で演算された上記信号組間の独立性に基づいて上記分離行列が略々収束するまで該分離行列を修正し、略々収束した分離行列を用いて上記分離信号を生成する
ことを特徴とする信号分離装置。
In a signal separation device that separates an observation signal in a time domain or a time frequency domain in which a plurality of signals are mixed into a separated signal using independent component analysis,
Separation means for generating a separation signal from the observed signal and the separation matrix;
Signal set generation means for generating a signal set of corresponding separation signals between the channels of the separation means;
Using the multivariate probability density function or score function that takes the signal pair as an argument, calculate the independence between the signal pairs or the change in the independence measure, and so that the independence between the signal pairs is maximized An independence calculating means for controlling the separating means,
The separation means generates a separation signal from the observation signal and a separation matrix into which initial values are substituted, and the separation matrix is approximately based on the independence between the signal sets calculated by the independence calculation means. A signal separation device, wherein the separation matrix is corrected until convergence, and the separation signal is generated using a substantially converged separation matrix.
複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離方法において、
上記観測信号と分離行列とから分離信号を複数の分離手段で生成する工程と、
異なる複数の分離手段から生成される複数の分離信号の間で対応する分離信号の信号組を生成する工程と、
上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性尺度の変化分を演算する工程と、
上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記スコア関数を用いて演算された信号組間の独立性が最大となるように上記分離行列が略々収束するまで該分離行列を修正する工程と
を有する信号分離方法。
In a signal separation method for separating a time-domain or time-frequency domain observation signal in which a plurality of signals are mixed into a separated signal using independent component analysis,
Generating a separation signal from the observed signal and the separation matrix by a plurality of separation means;
Generating a signal set of corresponding separated signals among a plurality of separated signals generated from different separating means;
Calculating an independence between the signal pairs or a change in an independence measure using a multivariate probability density function or a score function taking the signal pairs as arguments;
A separation signal is generated from the observation signal and a separation matrix into which initial values are substituted, and the separation matrix is converged so that the independence between signal sets calculated using the score function is maximized. Modifying the separation matrix.
上記信号組間の独立性を表す尺度として、上記スコア関数から計算されるKullback-Leibler情報量を用いることを特徴とする請求項5記載の信号分離方法。   6. The signal separation method according to claim 5, wherein a Kullback-Leibler information amount calculated from the score function is used as a measure representing independence between the signal sets. 上記信号組を生成する工程では、マイクの間隔または設置位置、サンプリング周波数、短時間フーリエ変換の窓長、短時間フーリエ変換のシフト幅、分離行列の初期値、観測信号スペクトログラムの正規化方法から選択される1以上の条件が異なる複数の分離手段から生成される複数の分離信号の間で対応する分離信号の信号組を生成することを特徴とする請求項5記載の信号分離方法。   In the process of generating the above signal set, select from microphone spacing or installation position, sampling frequency, short Fourier transform window length, short Fourier transform shift width, initial value of separation matrix, and observation signal spectrogram normalization method 6. The signal separation method according to claim 5, wherein a signal set of corresponding separation signals is generated among a plurality of separation signals generated from a plurality of separation means having different one or more conditions. 複数の信号が混合された時間領域または時間周波数領域の観測信号を、独立成分分析を用いて分離信号に分離する信号分離方法において、
上記観測信号と分離行列とから分離信号を生成する工程と、
チャンネル間で対応する分離信号の信号組を生成する工程と、
上記信号組を引数にとる多変量確率密度関数またはスコア関数を用いて上記信号組間の独立性または独立性尺度の変化分を演算する工程と、
上記観測信号と初期値が代入された分離行列とから分離信号を生成し、上記スコア関数を用いて演算された信号組間の独立性が最大となるように上記分離行列が略々収束するまで該分離行列を修正する工程と
を有する信号分離方法。
In a signal separation method for separating a time-domain or time-frequency domain observation signal in which a plurality of signals are mixed into a separated signal using independent component analysis,
Generating a separation signal from the observed signal and the separation matrix;
Generating a signal set of corresponding separated signals between the channels;
Calculating an independence between the signal pairs or a change in an independence measure using a multivariate probability density function or a score function taking the signal pairs as arguments;
A separation signal is generated from the observation signal and a separation matrix into which initial values are substituted, and the separation matrix is converged so that the independence between signal sets calculated using the score function is maximized. Modifying the separation matrix.
JP2006272163A 2006-10-03 2006-10-03 Signal separation apparatus and method Expired - Fee Related JP4946330B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006272163A JP4946330B2 (en) 2006-10-03 2006-10-03 Signal separation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006272163A JP4946330B2 (en) 2006-10-03 2006-10-03 Signal separation apparatus and method

Publications (2)

Publication Number Publication Date
JP2008092363A true JP2008092363A (en) 2008-04-17
JP4946330B2 JP4946330B2 (en) 2012-06-06

Family

ID=39376008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006272163A Expired - Fee Related JP4946330B2 (en) 2006-10-03 2006-10-03 Signal separation apparatus and method

Country Status (1)

Country Link
JP (1) JP4946330B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010092915A1 (en) * 2009-02-13 2010-08-19 日本電気株式会社 Method for processing multichannel acoustic signal, system thereof, and program
WO2010092913A1 (en) * 2009-02-13 2010-08-19 日本電気株式会社 Method for processing multichannel acoustic signal, system thereof, and program
EP2237272A2 (en) 2009-03-30 2010-10-06 Sony Corporation Signal processing apparatus, signal processing method, and program
JP5541551B1 (en) * 2013-02-06 2014-07-09 日本電気株式会社 Signal separating apparatus and signal separating method used therefor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003297580A (en) * 2002-04-01 2003-10-17 Mitsubishi Chemicals Corp Organic electroluminescent element
JP2006238409A (en) * 2005-01-26 2006-09-07 Sony Corp Apparatus and method for separating audio signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003297580A (en) * 2002-04-01 2003-10-17 Mitsubishi Chemicals Corp Organic electroluminescent element
JP2006238409A (en) * 2005-01-26 2006-09-07 Sony Corp Apparatus and method for separating audio signals

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010092915A1 (en) * 2009-02-13 2010-08-19 日本電気株式会社 Method for processing multichannel acoustic signal, system thereof, and program
WO2010092913A1 (en) * 2009-02-13 2010-08-19 日本電気株式会社 Method for processing multichannel acoustic signal, system thereof, and program
JPWO2010092913A1 (en) * 2009-02-13 2012-08-16 日本電気株式会社 Multi-channel acoustic signal processing method, system and program thereof
JPWO2010092915A1 (en) * 2009-02-13 2012-08-16 日本電気株式会社 Multi-channel acoustic signal processing method, system and program thereof
JP5605573B2 (en) * 2009-02-13 2014-10-15 日本電気株式会社 Multi-channel acoustic signal processing method, system and program thereof
JP5605575B2 (en) * 2009-02-13 2014-10-15 日本電気株式会社 Multi-channel acoustic signal processing method, system and program thereof
US9064499B2 (en) 2009-02-13 2015-06-23 Nec Corporation Method for processing multichannel acoustic signal, system therefor, and program
EP2237272A2 (en) 2009-03-30 2010-10-06 Sony Corporation Signal processing apparatus, signal processing method, and program
JP5541551B1 (en) * 2013-02-06 2014-07-09 日本電気株式会社 Signal separating apparatus and signal separating method used therefor

Also Published As

Publication number Publication date
JP4946330B2 (en) 2012-06-06

Similar Documents

Publication Publication Date Title
CN109830245B (en) Multi-speaker voice separation method and system based on beam forming
US9668066B1 (en) Blind source separation systems
JP4556875B2 (en) Audio signal separation apparatus and method
Sawada et al. Multichannel extensions of non-negative matrix factorization with complex-valued data
US11354536B2 (en) Acoustic source separation systems
EP1686831A2 (en) Apparatus and method for separating audio signals
EP2133707A2 (en) Signal processing apparatus, signal processing method, and program
JP6400218B2 (en) Audio source isolation
US10373628B2 (en) Signal processing system, signal processing method, and computer program product
JP4403436B2 (en) Signal separation device, signal separation method, and computer program
Otsuka et al. Bayesian nonparametrics for microphone array processing
JP2011215317A (en) Signal processing device, signal processing method and program
GB2548325A (en) Acoustic source seperation systems
Nesta et al. Robust Automatic Speech Recognition through On-line Semi Blind Signal Extraction
JP4946330B2 (en) Signal separation apparatus and method
Kubo et al. Efficient full-rank spatial covariance estimation using independent low-rank matrix analysis for blind source separation
Leglaive et al. Student's t source and mixing models for multichannel audio source separation
JP5406866B2 (en) Sound source separation apparatus, method and program thereof
US11908487B2 (en) Signal processing apparatus and non-transitory computer readable medium
JP6448567B2 (en) Acoustic signal analyzing apparatus, acoustic signal analyzing method, and program
JP6910609B2 (en) Signal analyzers, methods, and programs
Nakashima et al. Faster independent low-rank matrix analysis with pairwise updates of demixing vectors
CN113241090A (en) Multi-channel blind sound source separation method based on minimum volume constraint
Li et al. Low complex accurate multi-source RTF estimation
Tanji et al. A generalization of Laplace nonnegative matrix factorization and its multichannel extension

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees