JP4952979B2 - 信号分離装置、信号分離方法、ならびに、プログラム - Google Patents

信号分離装置、信号分離方法、ならびに、プログラム Download PDF

Info

Publication number
JP4952979B2
JP4952979B2 JP2006124167A JP2006124167A JP4952979B2 JP 4952979 B2 JP4952979 B2 JP 4952979B2 JP 2006124167 A JP2006124167 A JP 2006124167A JP 2006124167 A JP2006124167 A JP 2006124167A JP 4952979 B2 JP4952979 B2 JP 4952979B2
Authority
JP
Japan
Prior art keywords
matrix
signal separation
variable
separation device
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006124167A
Other languages
English (en)
Other versions
JP2007298564A (ja
Inventor
アンジェイ・チホツキ
ラファル・ズドネク
俊一 甘利
玄 堀
健 梅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RIKEN Institute of Physical and Chemical Research
Original Assignee
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RIKEN Institute of Physical and Chemical Research filed Critical RIKEN Institute of Physical and Chemical Research
Priority to JP2006124167A priority Critical patent/JP4952979B2/ja
Priority to EP07742607A priority patent/EP2012555A4/en
Priority to US12/226,651 priority patent/US8285773B2/en
Priority to PCT/JP2007/059172 priority patent/WO2007126054A1/ja
Publication of JP2007298564A publication Critical patent/JP2007298564A/ja
Application granted granted Critical
Publication of JP4952979B2 publication Critical patent/JP4952979B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Description

本発明は、独立成分分析等の信号分離技術において、精度をできるだけ向上し、収束をできるだけ速くするのに好適な、信号分離装置、信号分離方法、ならびに、これらをコンピュータもしくはディジタル信号プロセッサ上にて実現するプログラムに関する。
従来から、主成分分析(スフィアリングによる成分分析を含む。)、独立成分分析、非負行列因子化(Non-negative Matfix Factorization;NMF)による成分分析など、あるデータ列が与えられたときに、当該データ列を複数の成分(主成分、独立成分、因子等)に分離する手法が提案されている。たとえば、以下のような文献で、このような技術が開示されている。
特開2003−141102号公報
特許文献1では、主成分分析や独立成分分析を用いて、化学物質の量の変化を複数の成分に分離し、当該成分により、当該化学物質の生成の原因をグループ化する技術が提案されている。
一般に、独立成分分析においては、
(1)m個のチャンネルから観測信号を受け付けたときに、その時間方向の観測値を列方向に並べた行を、チャンネルの順序に並べたm行T列の観測信号行列X
を考える。
そして、観測信号行列Xを、
(2)n個のチャンネルの源信号の時間方向の源信号値を列方向に並べた行を、チャンネルの順序に並べたn行T列の源信号行列Sと、
(3)源信号の各チャンネルから観測信号の各チャンネルまでの経路の様子を表すm行n列の混合比行列Aと、
(4)m行T列の雑音行列Nと、
に、分離する。
その際に、所定の行列演算c(・,・)について
(5)X = c(A,S) + N
を満たすように分離をする。行列演算c(・,・)としては、行列の積、行列のコンボリューションのほか、各種の行列の非線型リンク関数が用いられる。
また、この際に、勾配法、共役勾配法、ニュートン法などの反復法を用いるのが一般的であるが、
(6)m行T列の行列とm行n列の行列とn行T列の行列とを受け付けてスカラー値を返す行列関数J(・,・,・)
をコスト関数として採用する。
具体的には、J(X,A,S)に対して、Xを固定して、A,Sを変化させたときに、J(X,A,S)の値が最小(極小。一般には、極大もしくは極小、すなわち、「極値」。)となるようなA,Sの組合せを計算する。
コスト関数としては、たとえば、J(X,A,S)として、行列(X - AS)の絶対値最大の要素の絶対値(要素の最大絶対値)や、行列(X - AS)の各要素の自乗平均、行列(X - AS)の各要素の総自乗和等を用いることができる。また、必要に応じて、非負性(non-negativity)、疎性(sparseness)、統計的独立性(statistical independence)などの制約を課すこともある。
しかしながら、単純に反復法を適用するのみでは、源信号同士の強弱の差が大きい場合や観測信号同士の差が小さい場合(観測信号同士が似ている場合)には、収束に時間がかかり、しかも信号の分離性能が落ちるという問題があった。
したがって、このような場合であっても、高速に収束し、信号の分離性能を向上させるような信号分離技術に対する要望は強い。
本発明は、上記の課題を解決するためのもので、独立成分分析等の信号分離技術において、精度をできるだけ向上し、収束をできるだけ速くするのに好適な、信号分離装置、信号分離方法、ならびに、これらをコンピュータもしくはディジタル信号プロセッサ上にて実現するプログラムを提供することを目的とする。
本発明の第1の観点に係る信号分離装置は、m行T列の観測信号行列Xを、m行n列の混合比行列Aとn行T列の源信号行列Sとm行T列の雑音行列Nとであって、所定の行列演算c(・,・)について
X = c(A,S) + N
を満たす行列A,Sに分離し、反復推測部、繰返計算部、結果出力部を備え、以下のように構成する。
すなわち、反復推測部は、m行T列の行列とm行n列の行列とn行T列の行列とを受け付けてスカラー値を返す行列関数J(・,・,・)に対して、m行T列の行列とm行n列の行列とn行T列の行列とが与えられると、当該m行T列の行列を固定したときに当該行列関数J(・,・,・)が返すスカラー値を極値化する引き数のm行n列の行列とn行T列の行列との組合せを、所定の繰返し回数で反復推測する。
一方、繰返計算部は、L個の行列A1,A2,A3,…,ALであって、
c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
がm行n列の行列となるL個の行列を繰返しにより計算し、
S0 = X
として、i (= 1,2,3,…,L)回目の繰返しにおいて、反復推測部に、i回目の繰返しにおける行列関数Ji(・,・,・)であって、m行T列の行列とm行n列の行列とn行T列の行列とを受け付けてスカラー値を返す行列関数Ji(・,・,・)に対して、m行T列の行列Si-1とm行n列の所定の初期値行列とn行T列の所定の初期値行列とを与えて、反復推測させ、得られたm行n列の行列をAiとし、n行T列の行列をSiとする。
さらに、結果出力部は、求められたL個の行列A1,A2,A3,…,ALから、m行n列の混合比行列Aを
A = c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
により計算し、
求められたn行T列の行列SLを、n行T列の源信号行列Sとして、行列A,Sを出力する。
また、本発明の信号分離装置は、繰返制御部をさらに備え、以下のように構成することができる。
すなわち、繰返制御部は、求められたL個の行列A1,A2,A3,…,ALとn行T列の行列SLとが所定の収束条件を満たすまで、繰返計算部に当該繰返しをやり直させ、i回目の繰返しにおけるm行n列の所定の初期値行列およびn行T列の所定の初期値行列として、やり直しの前回におけるAiおよびやり直しの前回におけるSiを与えさせる。
一方、結果出力部は、当該所定の収束条件が満たされると、行列A,Sを計算して出力する。
また、本発明の信号分離装置において、結果出力部は、m行T列の雑音行列Nを、
N = X - c(A,S)
によりさらに計算して、行列Nをさらに出力するように構成することができる。
また、本発明の信号分離装置において、当該所定の行列演算c(・,・)は、行列の積であるように構成することができる。
また、本発明の信号分離装置において、当該所定の行列演算c(・,・)は、コンボリューション演算であるように構成することができる。
また、本発明の信号分離装置において、当該所定の行列演算c(・,・)は、非線型リンク関数であるように構成することができる。
また、本発明の信号分離装置において、反復推測部における反復回数は、i (= 1,2,3,…,L)回目のいずれの繰返しにおいても1回であるように構成することができる。
また、本発明の信号分離装置において、反復推測部に対するi (= 1,2,3,…,L)回目の行列関数Ji(・,・,・)は、いずれも等しいように構成することができる。
本発明のその他の観点に係る信号分離方法は、m行T列の観測信号行列Xを、m行n列の混合比行列Aと、n行T列の源信号行列Sと、m行T列の雑音行列Nであって、所定の行列演算c(・,・)について
X = c(A,S) + N
を満たす行列A,S,Nに分離し、反復推測部、繰返計算部、結果出力部を有する信号分離装置にて実行され、反復推測工程、繰返計算工程、結果出力工程を備え、以下のように構成する。
すなわち、反復推測工程では、反復推測部が、m行T列の行列とm行n列の行列とn行T列の行列とを受け付けてスカラー値を返す行列関数J(・,・,・)に対して、m行T列の行列とm行n列の行列とn行T列の行列とが与えられると、当該m行T列の行列を固定したときに当該行列関数J(・,・,・)が返すスカラー値を極値化する引き数のm行n列の行列とn行T列の行列との組合せを、所定の繰返し回数で反復推測する。
一方、繰返計算工程では、繰返計算部が、L個の行列A1,A2,A3,…,ALであって、
c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
がm行n列の行列となるL個の行列を繰返しにより計算し、
S0 = X
として、i (= 1,2,3,…,L)回目の繰返しにおいて、反復推測部に、i回目の繰返しにおける行列関数Ji(・,・,・)であって、m行T列の行列とm行n列の行列とn行T列の行列とを受け付けてスカラー値を返す行列関数Ji(・,・,・)に対して、m行T列の行列Si-1とm行n列の所定の初期値行列とn行T列の所定の初期値行列とを与えて、反復推測させ、得られたm行n列の行列をAiとし、n行T列の行列をSiとする。
さらに、結果出力工程では、結果出力部が、求められたL個の行列A1,A2,A3,…,ALから、m行n列の混合比行列Aを
A = c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
により計算し、求められたn行T列の行列SLを、n行T列の源信号行列Sとして、行列A,Sを出力する。
また、本発明の信号分離方法において、当該信号分離装置は、繰返制御部をさらに有し、繰返制御工程をさらに備え、以下のように構成することができる。
すなわち、繰返制御工程では、繰返制御部が、求められたL個の行列A1,A2,A3,…,ALとn行T列の行列SLとが所定の収束条件を満たすまで、繰返計算部に当該繰返しをやり直させ、i回目の繰返しにおけるm行n列の所定の初期値行列およびn行T列の所定の初期値行列として、やり直しの前回におけるAiおよびやり直しの前回におけるSiを与えさせる。
一方、結果出力工程では、当該所定の収束条件が満たされると、行列A,Sを計算して出力する。
本発明のその他の観点に係るプログラムは、コンピュータもしくはディジタル信号プロセッサを上記の信号分離装置の各部として機能させ、もしくは、上記の信号分離方法を実行させるように構成する。
また、本発明のプログラムは、コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、半導体メモリ等のコンピュータ読取可能な情報記憶媒体に記録することができる。
上記プログラムは、プログラムが実行されるコンピュータやディジタル信号プロセッサとは独立して、コンピュータ通信網を介して配布・販売することができる。また、上記情報記憶媒体は、コンピュータやディジタル信号プロセッサとは独立して配布・販売することができる。
本発明によれば、独立成分分析等の信号分離技術において、精度をできるだけ向上し、収束をできるだけ速くするのに好適な、信号分離装置、信号分離方法、ならびに、これらをコンピュータもしくはディジタル信号プロセッサ上にて実現するプログラムを提供することができる。
以下に本発明の実施形態を説明する。なお、以下に説明する実施形態は説明のためのものであり、本発明の範囲を制限する物ではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。
なお、以下の説明では、成分分析の手法として独立成分分析を例としてとりあげて説明するが、これと同様の手法によって、成分分析の手法を主成分分析(スフィアリングによる成分分析を含む。)非負行列因子化に置き換えることができ、これらの実施形態も本発明の範囲に含まれる。
また、以下の説明では、理解を容易にするため、行列の演算c(・,・)として、行列の積を例にあげて説明するが、行列のコンボリューションや各種の行列の非線型リンク関数を利用することも可能であり、これらを採用した場合も本発明の範囲に含まれる。
まず、本実施例における計算処理の理解を容易にするため、各種記号について、説明する。
本実施例では、以下の行列Xを、信号分離の入力として用いる。
(1)m行T列の観測信号行列X
そして、以下の行列A,S,Nを信号分離の結果として得る。
(2)m行n列の混合比行列A
(3)n行T列の源信号行列S
(4)m行T列の雑音行列N
ただし、これらの行列の間には、以下の関係が成立しなければならない。
(5)X = AS + N
また、Xを固定してA,Sを微小に変化させたとしたときに、コスト関数J(X,A,S)最小あるいは極小(コスト関数の種類によっては、最大あるいは極大を含む「極値」。以下では、理解を容易にするため、コスト関数を極小にするものを求めるものとする。)となるものでなければならない。すなわち、以下が成立する。
(6)(A,S) = argmin(A,S)J(X,A,S)
一般的な独立成分分析の手法では、上記のコスト関数として行列(X - AS)の絶対値最大の要素の絶対値(要素の最大絶対値)や、行列(X - AS)の各要素の自乗平均、行列(X - AS)の各要素の総自乗和等のほか、甘利のα divergence、Kullback Leibler divergence、Frobenius norm、Jenssen Shannon divergence等を用いることができる。
また、上記の行列A,Sを求める計算手法としては、反復法(勾配法、共役勾配法、ニュートン法等)を採用する。通常、この反復は、A,Sが所定の反復終了条件を満たすようになるまで繰り返されるのが一般的である。たとえば、A,Sの要素の総自乗和に対する当該行列の反復の前後の要素の差の総自乗和の比が、所定の値εよりも小さくなった場合に反復終了条件が満たされる等である。
もっとも、粗い分析で十分な場合等には、反復回数を数回に固定することもありうる。後者の場合は、反復終了条件として「反復回数○○回」を指定したことと等価である。
このほか、解くべき信号の既知の性質に基づいて、非負性、疎性、時空間無相関性、smoothness、独立性などの束縛条件を課して、計算を行うこともある。
本実施形態では、このような独立成分分析を行う機能を、反復推測部という1つの計算モジュールとしてとらえるものとする。反復推測部が実行する処理については、既存の技術の他、各種の独立成分分析の技術を適用することができる。
図1は、反復推測部に対する入力と出力の様子を示す説明図である。以下、本図を参照して説明する。
反復推測部101は、一般的なコンピュータのCPU(Central Processing Unit)がRAM(Random Access Memory)などの記憶装置と共働して実現される。
反復推測部101に対しては、入力として行列X,A,Sが与えられる。一般には、行列X,A,SはRAM等に記憶されており、本実施形態では、反復推測部101を実現するライブラリ(プログラム)関数に、行列X,A,Sが確保されているメモリ内のアドレスが引き数として渡される構成をとる。
ここで、行列Xは、上記のように観測信号行列に相当するものであるが、広く考えると、反復法における条件を定める定数行列と考えることができる。一方、ここで与えられる行列A,Sは、混合比行列と源信号行列であるが、広く考えると、反復法において、真の値の近似値となる初期値と考えることができる。したがって、RAM等に記憶される行列A,Sは、何らかの値で初期化される必要がある。
何ら情報がない場合には、行列Aの各要素には、要素分布が疎であるように乱数や定数(0や1や−1等)を与え、行列Sの各要素には乱数や定数(0,1,−1等)を与えたり、種々の技術が考えられる(図中の「初期化」)。また、後述するように、反復推測部101が前回の処理において出力した結果を初期値とすることとしても良く、多くの場合、これが好ましい。
このほか、コスト関数と反復終了条件も、反復推測部101に対して与えられる。これらは、反復推測部101を実現するためのコード(プログラム)に直接指定されることもあるし、ライブラリ関数のアドレスを指定することによる場合もありうる。
さて、反復推測部101は、上記のような諸情報を受け付けて、反復終了条件が満たされるまで反復を繰り返し、入力として与えられた行列A,Sを、さらに真の値に近付けた行列A',S'を出力する。A',S'が出力された、ということは、反復終了条件が満たされた、ということである。ここで、反復終了条件としては、以下のようなものが考えられる。
(1)反復回数が1回になったとき
(2)反復回数が所定のn回になったとき(n≧2)
(3)(Σi=1 m Σk=1 n |A'[i,k]-A[i,k]|2 + Σk=1 n Σt=1 T |S'[i,k]-S[i,k]|2) ≦ ε
(4)(maxi=1 m maxk=1 n |A'[i,k]-A[i,k]|2 + maxk=1 n maxt=1 T |S'[i,k]-S[i,k]|2) ≦ ε
(5)Σi=1 m Σk=1 n |A'[i,k]-A[i,k]|2 ≦ ε
(6)maxi=1 m maxk=1 n |A'[i,k]-A[i,k]|2 ≦ ε
(7)Σk=1 n Σt=1 T |S'[i,k]-S[i,k]|2 ≦ ε
(8)maxk=1 n maxt=1 T |S'[i,k]-S[i,k]|2 ≦ ε
ただし、出力方法としては、入力として与えられた行列A,SのRAM等内における領域に、A',S'の内容を上書き(図中の「上書き」。)することとして、出力結果としても良い。本実施形態では、主にそのような態様を採用する。
さて、上記の事項に合わせて説明すると、反復法においては、Xを固定してJ(X,A,S)が小さくなるような方向にA,Sを移動させた結果をA',S'とするのであるが、2つの行列A,Sをまとめて勾配法等に適用することはのは難しい場合もある。
そこで、コスト関数J(X,A,S)を、2つのコスト関数K(X,A,S),H(X,A,S)の組み合わせとして取り扱う。ここで、K(・,・,・)とH(・,・,・)は、同じコスト関数を選択しても良いし(すなわち、K,H,Jの3つは同じコスト関数である。)、適宜異なるコスト関数を選択しても良い。
そして、
(1)まず、X,Aを固定して、K(X,A,S)を小さくする方向にSを移動させた結果をS'とし、
(2)次に、X,S'を固定して、H(X,A,S')を小さくする方向にAを移動させた結果をA'とする
ことを、反復の一回分と考えるのが典型的である。
あるいはその逆に、
(1)まず、X,Sを固定して、H(X,A,S)を小さくする方向にAを移動させた結果をA'とし、
(2)次に、X,A'を固定して、K(X,A',S)を小さくする方向にSを移動させた結果をS'とする
ことを、反復の一回分としても良い。
さて、本実施形態においては、上記のような反復推測部101を、サブルーチン呼び出しによって少なくともL (L≧2)回用いるが、その際に与える引き数等が異なる。そこで、理解を容易にするため、以下では、個別に反復推測部101をL個用意したものとして説明する。
図2は、本実施形態に係る信号分離装置の構成を示す模式図である。以下、本図を参照して説明する。
信号分離装置100は、L個の反復推測部101、繰返計算部102、結果出力部103、繰返制御部104のほか、記憶部105を備える。
本実施形態では、反復推測の多段構成によって独立成分分析を行うため、Lは、「段(step)数」「層(layer)数」に相当するものである。
記憶部105には、以下の情報を記憶するための領域が確保される。
(1)m行T列の観測信号行列X。これは、信号分離の象となる観測値である。
(2)L個の行列A1,…,AL。これは、一時的な計算のために用いられる。
(3)L個のn行T列の行列S1,…,SL。これは、一時的な計算のために用いられる。
(4)m行n列の混合比行列A。これは、信号分離の結果の一つである。
(5)m行T列の雑音行列N。これは、信号分離の結果の一つである。
なお、信号分離の結果の一つであるn行T列の源信号行列Sは、SLと同一視することができる。
また、漸化式による表現の理解を容易にするため、仮想的に、行列XをS0と同一視することとする。
さらに、以下では、混乱のない限り、行列名と行列の要素の値を記憶する記憶部105内での領域とを同じ記号で表記するものとする。
なお、L個の行列A1,…,ALは、所定の演算c(・,・)
c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
がm行n列の行列となるようなものであり、本実施形態では、c(・,・)として、行列の積を用いている。
したがって、本実施形態では、L個の行列の行数と列数を定める数列
n0 = m,n1,n2,…,nL-1,nL = n
が一意に定まり、Aiは、ni-1行ni列の行列であることになる。
図3は、本信号分離装置にて実行される信号分離処理の制御の流れを示すフローチャートである。以下、本図を参照して説明する。
信号分離装置100における処理が開始されると、行列X(すなわち、行列S0)に、入力となる観測信号の値を設定する(ステップS301)。
次に、行列S1,S2,…,SL-1,SLを適切な値で初期化する(ステップS302)。ここで、行列SLは行列Sと同一視することができる。
さらに、行列A1,A2,…,AL-1,ALを適切な値で初期化する(ステップS303)。
ステップS302およびステップS303における値の初期化は、上述した初期値による初期化のほか、種々の技術を適用することができる。本実施形態においては、これらの初期化処理は、CPUがRAM等と共働することによって実現される。
そして、繰返制御部104は、収束条件が満たされない間(ステップS308)、以下のステップS304〜ステップS308の処理を繰り返す(ステップS304)。収束条件については、反復終了条件同様種々のものを採用することができるが、当該繰返しにおける行列S1,…,SLおよび行列A1,…,ALの変化が極めて小さくなったときに、収束条件が満たされたものと考えるのが典型的である。
もっとも、適用分野によっては、繰返しの終端で判断される収束条件は常に真であることとしても良い。この場合、当該繰返しは1回だけ行われ、実際には単なる逐次処理を行うのみとなる。
したがって、繰返制御部104は、CPUがRAM等と共働することによって、実現される。
さて、当該繰返しの中で、繰返計算部102は、カウンタ変数iを、初期値1から終了値Lになるまで、1ずつ増やしながら、以下のステップS305〜ステップS307の処理を繰り返す(ステップS305)。
したがって、繰返計算部102は、CPUがRAM等と共働することによって、実現される。
すなわち、i番目の反復推測部101に、入力として、行列Si-1,Ai,Siを与えて、上記のような反復法の計算処理を行わせる(ステップS306)。
ステップS306における反復法の計算処理では、上述の通り、反復終了条件が満たされるまで反復を繰り返すが、いずれの反復終了条件を選択するかは、適用分野や目的に応じて適宜選択することができる。
また、i番目の反復推測部101に与えられるコスト関数Jiおよび反復終了条件(i)は、i = 1,…,Lのすべてにおいて同じものとしても良いし、異なるものとしても良い。
ステップS306の処理における反復法により「真の値」に近付く行列は、AiおよびSiである。そして、上記のように、記憶領域AiおよびSiに、反復推測部101における今回の推測結果が格納されることになる。
このようにして、反復推測部101における反復推測をi = 1,…,Lの間繰り返すと(ステップS307)、ステップS302、ステップS303において行列S1,…,SLおよび行列A1,…,ALに設定された初期値よりも、精度の高い値が、同じ領域に格納されることになる。
さて、この値を吟味することによって、収束条件が満たされたたか否かを判定し、収束条件が満たされていなければ、ステップS304に戻って繰り返しを続ける(ステップS308)。
一方、収束条件が満たされていれば、結果出力部103は、混合比行列Aを、
A = A1A2…AL-1AL
のように行列の乗算をすることによって求め(ステップS309)、雑音行列Nを、
N = X - AS
のように行列の演算をすることによって求め(ステップS310)、行列A,S (= SL),Nを結果としてRAM等内に格納することによって出力して(ステップS311)、本処理を終了する。したがって、CPUがRAM等と共働して、結果出力部として機能することとなる。
さて、上記のような繰返しは、信号分離を以下のように行うことに相当する。なお、以下の式変形では、理解を容易にするため、雑音行列については表記を省略している。
X =
S0 = A1S1
S1 = A2S2
S2 = A3S3

SL-2 = AL-1SL-1
SL-1 = ALSL
= ALS
これらをまとめると、以下のように表記することができる。
X = A1A2A3…ALS
= AS
ステップ309における乗算は、行列Aを上記のように求めていることに相当するのである。
(所定の行列の演算)
上記実施形態では、所定の行列演算c(・,・)として、行列の積を用いていた。すなわち、行列Zのi行t列の要素をZ[i,t]とし、行列Zの行数をrow(Z)、行列Zの列数をcol(Z)と書くとき、行列Z,Wであって、col(Z) = row(W)が成立する行列Z,Wについて、所定の演算は、
c(Z,W)[i,t] = Σk=1 col(Z) Z[i,k]W[k,t]
と定義される。
c(・,・)として、行列のコンボリューション演算を考える場合は、2次元の行列(2階のテンソル)と3次元の行列(3階のテンソル)とを考慮した、いわゆるテンソル演算を行うことになる。このコンボリューション演算される行列を、混合作用素(mixing operator)と呼ぶ。
観測信号行列Xと源信号行列Sは、上記のように2次元の行列であるが、混合比行列Aは3次元の行列となる。3次元の行列の要素を、上記と同様に[・,・,・]の形式で表現することとし、また、テンソル演算の慣習にしたがって、要素が定義されていない範囲の値を0とおくこととし、Σの添字がテンソル内のインデックスとしてとりうる範囲をすべて走査した総和をとることとする。
すると、3階のテンソルAと2階のテンソルSとのコンボリューションは、[数1]のように定義される。
Figure 0004952979
一方、3階のテンソルAと3階のテンソルBとのコンボリューションは、[数2]のように定義される。
Figure 0004952979
また、非線型リンク関数を用いる場合、
c(A,S)[i,t] = f(Σk Z[i,k]W[k,t])
のように演算を定義する。関数f(・)としては、典型的には、ニューラルネットの分野でよく用いられるステップ関数の原点付近を滑らかにした関数を利用することができる。たとえば、
f(x) = 2 arctan(k x)/π
において、kを十分に大きくしたような関数である。ただし一般には、任意の非線型関数を適用することが可能である。
(実験結果)
以下では、上記の実施形態と従来の手法とを比較する各種の実験結果について説明する。なお、以下の実験は、すべて計算機シミュレーションによっている。
第1の実験は、複数の音源から発せられる音波を、近い位置に配置されたマイクで集めたときに相当する信号分離の様子を対比するものである。
図4は、音源の波形の様子を示すグラフであり、図5は、当該音源から音波をマイクで集めた場合の源信号の波形の様子を示すグラフである。
図4に示す音源波形に対して、条件数が15,000程度のヒルベルト行列を用いて混合を行うと、図5に示すような、互いに波形の類似した観測信号が得られる。
図6は、L = 10として共役勾配法を用いて本実施形態の手法により4つの信号に独立成分分析を行った場合の波形のグラフであり、図7は、これに対して、従来の手法により4つの信号に独立成分分析を行った場合の波形のグラフである。
従来の手法(図7)では、元の波形(図4)とはまったく異なる成分に分解がされてしまっているが、本実施形態の手法(図6)によると、元の波形(図4)に極めて近いものが得られていることがわかる。
第2の実験は、雑音が大きい場合の信号分離の様子を示すものである。
図8は、音源の波形の様子を示すグラフであり、図9は、当該音源から音波をマイクで集めた場合の観測信号の波形の様子を示すグラフである。
図8中の上段a1に示すように、雑音レベルがかなり大きいため、図9に示すように、観測信号にも雑音が乗っていることがわかる。
図10は、L = 5として甘利のα-divergenceNMFアルゴリズムを反復推測部において用いた本実施形態の手法により得られた波形のグラフであり、図11は、SIR値(Singnal to Interference Ratio)を示すグラフである。
図8と対比すると、極めて類似したものが得られていることがわかり、また、SIR値も40dB〜53dB程度と、性能が良いことがわかる。
図12は、NMF Lee-Seungアルゴリズムという従来の手法により得られた波形である。
従来手法は、SIR値が8dB未満となり、本実施形態の手法の性能の高さがわかる。
第3の実験は、画像処理における適用である。
図13は、源信号となる画像を示す図であり、図14は、観測信号に相当する画像を示す図であり、図15は、L = 5として本実施形態の手法を採用した場合に得られる源信号の様子であり、図16は、L = 2として本実施形態の手法を採用した場合に得られる源信号の様子であり、図17は、NMF Lee-Seungアルゴリズムという従来の手法により得られた源信号の画像であり、図18は、本実施形態の手法における信号のSIR値の値を示すグラフである。
図13に示すように、源信号は4つであり、図14に示すように、これらを9個のチャンネルで観測する。
L = 5として本発明の手法により独立成分分析すると、図15に示すように、源信号がほぼ完璧に復元される。SIR値は、図18に示すように、46dB程度である。
一方、L = 2として本発明の手法により独立成分分析すると、図16に示すように、分離は不十分であり、SIR値も15dB未満と低い。Lの値を増やすことの効果がよくあらわれている。
従来手法による分離の結果は、図17に示すようになり、やはり分離は不十分で、SIR値は10db未満である。
本発明によれば、独立成分分析等の信号分離技術において、精度をできるだけ向上し、収束をできるだけ速くするのに好適な、信号分離装置、信号分離方法、ならびに、これらをコンピュータもしくはディジタル信号プロセッサ上にて実現するプログラムを提供することができる。
本発明の実施形態の一つに係る送信装置および信号分離装置の概要構成を示す模式図である。 本実施形態に係る信号分離装置の構成を示す模式図である。 本信号分離装置にて実行される信号分離処理の制御の流れを示すフローチャートである。 第1の実験における音源の波形の様子を示すグラフである。 第1の実験における当該音源から音波をマイクで集めた場合の源信号の波形の様子を示すグラフである。 第1の実験において、L = 10として共役勾配法を用いて本実施形態の手法により4つの信号に独立成分分析を行った場合の波形のグラフである。 第1の実験において、従来の手法により4つ信号に独立成分分析を行った場合の波形のグラフである。 第2の実験における音源の波形の様子を示すグラフである。 第2の実験における当該音源から音波をマイクで集めた場合の観測信号の波形の様子を示すグラフである。 第2の実験においてL = 5として甘利のα-divergenceNMFアルゴリズムを反復推測部において用いた本実施形態の手法により得られた波形のグラフである。 第2の実験におけるSIR値(Singnal to Interference Ratio)を示すグラフである。 第2の実験においてNMF Lee-Seungアルゴリズムという従来の手法により得られた波形である。 第3の実験における源信号となる画像を示す図である。 第3の実験における観測信号に相当する画像を示す図である。 第3の実験においてL = 5として本実施形態の手法を採用した場合に得られる源信号の様子を示す図である。 第3の実験においてL = 2として本実施形態の手法を採用した場合に得られる源信号の様子を示す図である。 第3の実験において、NMF Lee-Seungアルゴリズムという従来の手法により得られた源信号の画像を示す図である。 第3の実験における本実施形態の手法における信号のSIR値の値を示すグラフである。
符号の説明
100 信号分離装置
101 反復推測部
102 繰返計算部
103 結果出力部
104 繰返制御部
105 記憶部

Claims (12)

  1. 観測信号行列Xを、混合比行列Aと源信号行列Sと雑音行列Nとであって、所定の行列演算c(・,・)について
    X = c(A,S) + N
    を満たす行列A,Sに分離する信号分離装置であって、
    観測信号行列Xで行列S 0 を、乱数行列で行列S 1 ,S 2 ,S 3 ,…,S L を、疎な乱数行列で行列A 1 ,A 2 ,A 3 ,…,A L を、それぞれ初期化する初期化部、
    定数行列P、第1変数行列Q、第2変数行列R、コスト関数J(・,・,・)与えられると、スカラー値J(P,Q,R)が最小化されるように、第1変数行列Qと、第2変数行列Rと、を繰り返し更新して、反復推測する反復推測部、
    前記反復推測部に、i (= 1,2,3,…,L)回目の繰返しにおいて、定数行列として行列S i-1 を、第1変数行列として行列A i を、第2変数行列として行列A i+1 を、コスト関数として行列関数J i (・,・,・)であってスカラー値J i (P,Q,R)がPとc(Q,R)との差異を表す行列関数を、それぞれ与えることにより、行列A i と行列S i を更新する繰返計算部、
    行列Aとして
    c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
    を、行列Sとして行列S L を、それぞれ出力する結果出力部
    を備えることを特徴とする信号分離装置。
  2. 請求項1に記載の信号分離装置であって、
    行列A1,A2,A3,…,AL 行列SLとが所定の収束条件を満たすまで、前記繰返計算部に当該繰返しをやり直させる繰返制御部
    をさらに備え、
    前記結果出力部は、当該所定の収束条件が満たされると、行列A,Sを計算して出力する
    ことを特徴とする信号分離装置。
  3. 請求項1または2に記載の信号分離装置であって、
    前記結果出力部は、雑音行列Nを、
    N = X - c(A,S)
    によりさらに計算して、行列Nをさらに出力する
    ことを特徴とする信号分離装置。
  4. 請求項1から3のいずれか1項に記載の信号分離装置であって、当該所定の行列演算c(・,・)は、行列の積である
    ことを特徴とする信号分離装置。
  5. 請求項1から3のいずれか1項に記載の信号分離装置であって、
    当該所定の行列演算c(・,・)は、コンボリューション演算である
    ことを特徴とする信号分離装置。
  6. 請求項1から3のいずれか1項に記載の信号分離装置であって、
    当該所定の行列演算c(・,・)は、非線型リンク関数である
    ことを特徴とする信号分離装置。
  7. 請求項1から6のいずれか1項に記載の信号分離装置であって、
    前記反復推測部における反復回数は、i (= 1,2,3,…,L)回目のいずれの繰返しにおいても1回である
    ことを特徴とする信号分離装置。
  8. 請求項1から7のいずれか1項に記載の信号分離装置であって、
    前記反復推測部に対するi (= 1,2,3,…,L)回目の行列関数Ji(・,・,・)は、
    P-c(Q,R)の要素の絶対値の最大値、
    P-c(Q,R)の要素の自乗の平均値、
    P-c(Q,R)の要素の自乗の総和、
    Pとc(Q,R)の間の甘利のα-divergence、
    Pとc(Q,R)の間のKullback Leibler divergence、
    Pとc(Q,R)の間のJenssen Shannon divergence
    のいずれかである
    ことを特徴とする信号分離装置。
  9. 観測信号行列Xを、混合比行列Aと源信号行列Sと雑音行列Nとであって、所定の行列演算c(・,・)について
    X = c(A,S) + N
    を満たす行列A,Sに分離し、初期化部、反復推測部、繰返計算部、結果出力部を有する信号分離装置にて実行される信号分離方法であって、
    前記初期化部が、観測信号行列Xで行列S 0 を、乱数行列で行列S 1 ,S 2 ,S 3 ,…,S L を、疎な乱数行列で行列A 1 ,A 2 ,A 3 ,…,A L を、それぞれ初期化する初期化工程、
    前記反復推測部が、定数行列P、第1変数行列Q、第2変数行列R、コスト関数J(・,・,・)与えられると、スカラー値J(P,Q,R)が最小化されるように、第1変数行列Qと、第2変数行列Rと、を繰り返し更新して、反復推測する反復推測工程、
    前記繰返計算部が、前記反復推測部に、i (= 1,2,3,…,L)回目の繰返しにおいて、定数行列として行列S i-1 を、第1変数行列として行列A i を、第2変数行列として行列A i+1 を、コスト関数として行列関数J i (・,・,・)であってスカラー値J i (P,Q,R)がPとc(Q,R)との差異を表す行列関数を、それぞれ与えることにより、行列A i と行列S i を更新する繰返計算工程、
    前記結果出力部が、行列Aとして
    c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
    を、行列Sとして行列S L を、それぞれ出力する結果出力工程
    を備えることを特徴とする信号分離方法。
  10. 請求項9に記載の信号分離方法であって、当該信号分離装置は、繰返制御部をさらに有し、
    前記繰返制御部が、行列A1,A2,A3,…,AL 行列SLとが所定の収束条件を満たすまで、前記繰返計算部に当該繰返しをやり直させる繰返制御工程
    をさらに備え、
    前記結果出力工程では、当該所定の収束条件が満たされると、行列A,Sを計算して出力する
    ことを特徴とする信号分離方法。
  11. コンピュータに、
    観測信号行列Xを、混合比行列Aと源信号行列Sと雑音行列Nとであって、所定の行列演算c(・,・)について
    X = c(A,S) + N
    を満たす行列A,Sに分離させるプログラムであって、
    観測信号行列Xで行列S 0 を、乱数行列で行列S 1 ,S 2 ,S 3 ,…,S L を、疎な乱数行列で行列A 1 ,A 2 ,A 3 ,…,A L を、それぞれ初期化する初期化部、
    定数行列P、第1変数行列Q、第2変数行列R、コスト関数J(・,・,・)与えられると、スカラー値J(P,Q,R)が最小化されるように、第1変数行列Qと、第2変数行列Rと、を繰り返し更新して、反復推測する反復推測部、
    前記反復推測部に、i (= 1,2,3,…,L)回目の繰返しにおいて、定数行列として行列S i-1 を、第1変数行列として行列A i を、第2変数行列として行列A i+1 を、コスト関数として行列関数J i (・,・,・)であってスカラー値J i (P,Q,R)がPとc(Q,R)との差異を表す行列関数を、それぞれ与えることにより、行列A i と行列S i を更新する繰返計算部、
    行列Aとして
    c(A1,c(A2,c(A3,c(…,c(AL-1,AL)…))))
    を、行列Sとして行列S L を、それぞれ出力する結果出力部
    として機能させることを特徴とするプログラム。
  12. 請求項11に記載のプログラムであって、当該コンピュータを、
    行列A1,A2,A3,…,AL 行列SLとが所定の収束条件を満たすまで、前記繰返計算部に当該繰返しをやり直させる繰返制御部
    としてさらに機能させ、
    前記結果出力部は、当該所定の収束条件が満たされると、行列A,Sを計算して出力する
    ように機能させることを特徴とするプログラム。
JP2006124167A 2006-04-27 2006-04-27 信号分離装置、信号分離方法、ならびに、プログラム Expired - Fee Related JP4952979B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2006124167A JP4952979B2 (ja) 2006-04-27 2006-04-27 信号分離装置、信号分離方法、ならびに、プログラム
EP07742607A EP2012555A4 (en) 2006-04-27 2007-04-27 SIGNAL SEPARATION DEVICE AND METHOD, INFORMATION RECORDING MEDIUM, AND PROGRAM
US12/226,651 US8285773B2 (en) 2006-04-27 2007-04-27 Signal separating device, signal separating method, information recording medium, and program
PCT/JP2007/059172 WO2007126054A1 (ja) 2006-04-27 2007-04-27 信号分離装置、信号分離方法、情報記録媒体、ならびに、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006124167A JP4952979B2 (ja) 2006-04-27 2006-04-27 信号分離装置、信号分離方法、ならびに、プログラム

Publications (2)

Publication Number Publication Date
JP2007298564A JP2007298564A (ja) 2007-11-15
JP4952979B2 true JP4952979B2 (ja) 2012-06-13

Family

ID=38655575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006124167A Expired - Fee Related JP4952979B2 (ja) 2006-04-27 2006-04-27 信号分離装置、信号分離方法、ならびに、プログラム

Country Status (4)

Country Link
US (1) US8285773B2 (ja)
EP (1) EP2012555A4 (ja)
JP (1) JP4952979B2 (ja)
WO (1) WO2007126054A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4958241B2 (ja) * 2008-08-05 2012-06-20 日本電信電話株式会社 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体
US8340943B2 (en) * 2009-08-28 2012-12-25 Electronics And Telecommunications Research Institute Method and system for separating musical sound source
KR101225932B1 (ko) 2009-08-28 2013-01-24 포항공과대학교 산학협력단 음악 음원 분리 방법 및 장치
KR101272972B1 (ko) 2009-09-14 2013-06-10 한국전자통신연구원 음원 데이터베이스를 사용하지 않는 음악 음원 분리 방법 및 장치
KR20120031854A (ko) * 2010-09-27 2012-04-04 한국전자통신연구원 시간 및 주파수 특징을 이용하는 음악 음원 분리 장치 및 방법
JP6054142B2 (ja) * 2012-10-31 2016-12-27 株式会社東芝 信号処理装置、方法およびプログラム
CN105989851B (zh) * 2015-02-15 2021-05-07 杜比实验室特许公司 音频源分离
US9668066B1 (en) * 2015-04-03 2017-05-30 Cedar Audio Ltd. Blind source separation systems
CN109192220B (zh) * 2018-08-02 2022-11-11 福建师范大学福清分校 一种比例微分控制的混合信号自适应快速分离方法
CN110969248B (zh) * 2018-09-28 2023-04-07 中国石油化工股份有限公司 基于rbf-a2c的强化学习方法及系统
CN110269609B (zh) * 2019-07-08 2021-09-28 江苏理工学院 基于单通道的脑电信号中眼电伪迹分离方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6535666B1 (en) * 1995-06-02 2003-03-18 Trw Inc. Method and apparatus for separating signals transmitted over a waveguide
US6026217A (en) * 1996-06-21 2000-02-15 Digital Equipment Corporation Method and apparatus for eliminating the transpose buffer during a decomposed forward or inverse 2-dimensional discrete cosine transform through operand decomposition storage and retrieval
US7158559B2 (en) * 2002-01-15 2007-01-02 Tensor Comm, Inc. Serial cancellation receiver design for a coded signal processing engine
JP3817161B2 (ja) * 2001-11-05 2006-08-30 独立行政法人理化学研究所 化学物質分類装置、化学物質分類方法、ならびに、プログラム
JP3786038B2 (ja) * 2002-03-14 2006-06-14 日産自動車株式会社 入力信号処理方法および入力信号処理装置
GB0229473D0 (en) * 2002-12-18 2003-01-22 Qinetiq Ltd Signal separation system and method
DE602004029867D1 (de) * 2003-03-04 2010-12-16 Nippon Telegraph & Telephone Positionsinformationsschätzeinrichtung, verfahren dafür und programm
FI20031079A0 (fi) * 2003-07-16 2003-07-16 Nokia Corp Menetelmä tiedonsiirtoresurssien kontrolloimiseksi, sekä kontrolleri
KR100580843B1 (ko) * 2003-12-22 2006-05-16 한국전자통신연구원 V―blast에서 채널전달함수행렬 처리장치 및 그의처리방법

Also Published As

Publication number Publication date
EP2012555A4 (en) 2011-06-08
JP2007298564A (ja) 2007-11-15
US20090234901A1 (en) 2009-09-17
US8285773B2 (en) 2012-10-09
EP2012555A1 (en) 2009-01-07
WO2007126054A1 (ja) 2007-11-08

Similar Documents

Publication Publication Date Title
JP4952979B2 (ja) 信号分離装置、信号分離方法、ならびに、プログラム
Wan et al. Data-assisted reduced-order modeling of extreme events in complex dynamical systems
US11568270B2 (en) Non-transitory computer-readable storage medium storing improved generative adversarial network implementation program, improved generative adversarial network implementation apparatus, and learned model generation method
Alexander Adaptive signal processing: theory and applications
CN110503192A (zh) 资源有效的神经架构
US20160013773A1 (en) Method and apparatus for fast digital filtering and signal processing
KR100795562B1 (ko) 분할 검출 방식을 적용한 송신신호 검출 방법 및 그 장치
US11954115B2 (en) Methods and systems for wavelet based representation
Wei et al. Deep unfolding with normalizing flow priors for inverse problems
JP2008244512A (ja) マルチメディア情報提供システム、サーバ装置、端末装置、マルチメディア情報提供方法、ならびに、プログラム
JP6099032B2 (ja) 信号処理装置、信号処理方法及びコンピュータプログラム
Şimşekli et al. Non-negative tensor factorization models for Bayesian audio processing
JP2023545820A (ja) フィルタバンク領域でオーディオサンプルを処理するための生成ニューラルネットワークモデル
CN113674172A (zh) 一种图像处理方法、系统、装置及存储介质
Tolooshams et al. Unrolled compressed blind-deconvolution
CN114037770A (zh) 一种基于离散傅里叶变换的注意力机制的图像生成方法
CN114169469A (zh) 一种基于量子网络的识别方法、系统、设备及存储介质
JP4090969B2 (ja) 信号分離方法、信号分離プログラム及びそのプログラムを記録した記録媒体
Karami et al. Generative convolutional flow for density estimation
JP7047665B2 (ja) 学習装置、学習方法及び学習プログラム
JP6994572B2 (ja) データ処理システムおよびデータ処理方法
JP2020030373A (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
JP4531738B2 (ja) 行列における数値分解方法
JP4313803B2 (ja) 行列における数値分解方法
Ben Abdallah N-Dimensional Polynomial Neural Networks and their Applications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120229

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees