JP2004302122A - 目的信号抽出方法及びその装置、目的信号抽出プログラム及びその記録媒体 - Google Patents
目的信号抽出方法及びその装置、目的信号抽出プログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP2004302122A JP2004302122A JP2003094840A JP2003094840A JP2004302122A JP 2004302122 A JP2004302122 A JP 2004302122A JP 2003094840 A JP2003094840 A JP 2003094840A JP 2003094840 A JP2003094840 A JP 2003094840A JP 2004302122 A JP2004302122 A JP 2004302122A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- separation
- vector
- target signal
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】目的信号源の与えられた方位に基づき、信号源とセンサ間の周波数応答の近似値H 1(f)を求め、H 1(f)を用いて目的信号を歪み無く抽出する拘束条件を満す初期値ベクトルt 1(0)を求め、t 1(0)を、独立成分分析により、出力信号が非ガウス性をより高めるように更新し、その更新したベクトルをそのノルムが上記拘束条件を満すように変更して分離ベクトルとする。
【選択図】 図2
Description
【発明の属する技術分野】
この発明は、複数方向からの信号が混合されて受信され、観測したい元の信号(目的信号)のみを直接観測することはできず、目的信号に他のノイズ(雑音)などが重畳されて観測されるという状況において、目的信号を推定する方法、その装置、目的信号抽出プログラム、その記録媒体に関し、例えばオーディオ分野において、音声認識装置の入力マイクロホンと話者とが離れているためそのマイクロホンが目的話者音声以外の音まで拾ってしまうような状況でも、目的音声を抽出することで認識率の高い音声認識系の構築を可能とするものである。
【0002】
【従来の技術】
独立成分分析(ICA)法
目的信号を分離抽出する手法の一つ目として独立成分分析(Independent Component Analysis:ICA)による手法がある。これは、複数の線形混合された信号を、元の信号や混合過程についての知識を全く用いることなしに推定する手法であり、ブラインド音源分離(Blind Source Separation:BSS)とよばれる。まず、ブラインド音源分離(BSS)について説明する。
・実環境での混合信号(観測信号)モデル
si を信号源11i の信号、hjiを信号源11i からセンサ12j までのインパルス応答(周波数応答)、Pをインパルス応答の次数、信号源11i の数をN個(N>1)、センサ12j の数をM(M≧N)個、nを離散的時刻とすると、センサ12j で観測される信号xj は
xj(n)=Σi=1 NΣp=1 Phji(p)si(n−p+1)(j=1,…,M)(1)
と表現される。ここでN個の信号si は統計的に互いに独立であると仮定する。観測信号xj(n)は一定周期で標本化され、ディジタル信号系列とされている。
・分離信号のモデル
ブラインド音源分離では、式(1)の形で得られる観測信号と、長さがQタップ、インパルス応答がwijのN×M個の分離フィルタ群13ijから成る分離系を用いて分離する。この分離フィルタ群13ijを用いて、分離して得られる信号yi(n)は、
yk(n)=Σj=1 MΣq=1 Qwij(q)xj(n−q+1)(i=1,…,N)(2)
と表される。図6にN=M=2の場合について、信号源111 ,112 とセンサ121 ,122 間の混合過程と、センサ121 ,122 の出力信号x1 ,x2 から2×2個のフィルタ群13ijを用いるICA法により分離信号y1(n),y2(n)を出力端子141 ,142 に得る分離過程を示す。
【0003】
分離フィルタ係数(周波数応答)wijの推定には、独立成分分析(ICA)と呼ばれる技術が広く用いられる。これは、信号同士の統計的独立性に基づいた技術であり、分離フィルタ係数wijは出力信号yi(n)が互いに独立となるよう逐次的学習により決定される。
混合過程が例えば実音場での集音などでは、信号にシステムのインパルス応答が畳み込まれて混合され、式(1)のように非常に複雑な信号が得られる。これを分離するためには、式(2)のような複雑な形で表される分離フィルタ係数wijを推定する必要がある。これまでに提案されている手法では、このような複雑な分離フィルタ係数wijの推定は推定精度が低く、推定にかかる時間的な費用(コスト)も大きいことが知られている。
このため、信号を周波数領域へ変換し、各周波数において分離行列を求める手法(周波数領域BSS)が広く用いられている。
【0004】
・周波数領域BSS法
周波数領域BSS法の機能構成を図7に示す。観測信号x1(n),x2(n)を周波数領域変換部21で、例えば短時間離散フーリエ変換(DFT)(窓関数を掛け例えば1/2フレームごとにずらしながら1フレームずつ離散フーリエ変換)して次式(3)で示すような関係の周波数領域の信号に変換する。
X(f,m)=H(f)S(f,m) (3)
ここでS(f,m)=[S1(f,m),S2(f,m),…,SN(f,m)]T ,X(f,m)=[X1(f,m),X2(f,m),…,XN(f,m)]T であり、[ ]Tは転置を表わし、H(f)はHji(f)を要素とする混合行列であり、fは周波数、mは観測信号を短時間ごとのフレームに分割した際のフレーム番号である。この式(3)により、式(1)に示した複雑な混合を、各周波数成分での瞬時混合として表現でき、分離問題を簡単化できる。
分離行列推定部22において、各出力信号の周波数領域の信号Yi(f,m)が互いに独立となるように、次式(4)を満す分離行列W(f)を推定する。
Y(f,m)=W(f)X(f,m) (4)
ここでY(f,m)=[Y1(f,m),Y2(f,m),…,YN(f,m)]T ,W(f)は要素Wji(f)のN×Mの行列である。
このようにして各周波数成分においての分離が達成される。
時間領域変換部24において周波数領域で出力される信号Yi(f,m)を例えば逆フーリエ変換により時間領域の信号に変換する。あるいは時間領域変換部25で分離行列W(f)の各要素Wij(f)に例えば逆フーリエ変換を施して時間領域表現の分離フィルタ係数wij(q)に変換し、分離フィルタ群26でこの変換した伝達関数wij(q)を用いて観測信号xj(n)に対し式(2)を計算することで、分離された出力信号yi(n)を得る。こうして得られる分離信号の中から、何らかの手法を用いて目的信号を選ぶことで、目的信号が分離抽出される。
【0005】
分離行列推定部22では一般に、事前白色化(Pre−whitening)処理、ICAによる直交行列推定処理、事後白色化(Post−whitening)処理の3段階の処理が行われる。つまり図8に示すように事前白色化(Pre−whitening)部31で白色化行列V(f)を、直交行列推定部32で直交行列T(f)をそれぞれ推定し、その後、事後白色化(Post−whitening)部33でこれらの推定された二つの行列を用い、分離行列W(f)=T H(f)V(f)を求める。
つまり事前白色化部31では各周波数における観測信号X(f,m)を、白色化行列V(f)を用いてZ(f,m)=V(f)X(f,m)のように事前に白色化(Pre−whitening)する。ここでV(f)は、X(f)の共分散行列Rxx(f)=E[XX T ]の固有値を対角要素に並べた行列Λ(f)と、固有ベクトルを並べた行列O(f)を用いてV(f)=Λ −1/2(f)O(f)で得られる。
【0006】
直交行列推定部32では白色化した観測信号Z(f,m)を分離するための行列をT(f)と書くと、分離信号Y(f,m)は
Y(f,m)=T(f)Z(f,m) (5)
と表される。前段で白色化を行っているため、ここでは行列T(f)を直交行列に限ることができる。すなわち、T(f)のk行目をベクトルt k(f)と表すとき、ベクトルt i (f)とベクトルt j(f) が直交する性質を持つ行列に限ることができる。この分離のための直交行列T(f)を求める際にICAを用いる(例えば非特許文献1および2参照)。
ここではICAの手法の一つである、出力信号の非ガウス性を高めることで個々の独立成分を取り出す手法を説明する。これは、その分布がガウシアンでは無い(非ガウスの)原信号が混合された信号は、中心極限定理によりガウシアンに近くなるという性質を利用し、ガウシアンに近い信号Z(f,m)を、ベクトルt k を用いてより非ガウス性の高い信号Yk(f,m)に変換することで原信号の周波数領域信号を抽出できる、という原理に基づいた手法である。
【0007】
この手法では、出力信号Yk(f)の分布が最もガウシアンから遠い分布となった際に最大値を取る目的関数Γ(f)を最大化する直交行列T(f)の成分ベクトルt k(f)を求め、独立成分Yk(f,m)を一つずつ取り出す。すなわちこの手法では分離のための直交行列T(f)は一行ずつ求められる。尚、k>2の場合には、t k(f)が以前に求めたものと同一にならぬよう、kより大きいr番目のベクトルt r は必ずベクトルt k と直交するt k(f)を求める。
このように取り出される独立成分Y1(f,m),…,Yk(f,m),…,YN(f,m)は原信号の周波数領域信号S1(f,m),…,Si(f,m),…,SN(f,m)のいずれかに対応するが、その大きさと順序には任意性がある。これは、ICAが、信号の独立成分を取り出すという規範にのみ基いてベクトルt k(f)を推定しているためであり、ベクトルt k(f)の長さや求まる順序については規定していないためである。
【0008】
このベクトルの大きさの任意性を回避するためには、一般に、ベクトルt k(f)のノルムを1とする拘束条件を付加することが行われている。すなわち、従来のICAでは次式(6)で示すように‖t k(f)‖=1であるt k(f)中の目的関数Γ(f)を最大とするものを求める。
arg maxt k(f)Γ(f) subject to ‖t k(f)‖=1 (6)
周波数領域BSSでは、目的関数Γ(f)としてE{G(|t k H(f)Z(f)|2)}が用いられる。ここでGはある非線型関数であり、G(z)=log(a+z)やG(z)=√(a+z)(aは定数)などがよく用いられる。
しかし、従来のICAでは、拘束条件を用いてベクトルの大きさの任意性については回避しているが、ベクトルt k(f)の求まる順序には任意性が残ったままである。この順序の任意性が、従来法による周波数領域BSSの問題点であり置換(パーミュテーション:Permutation)の問題と呼ばれている。
このPermutationの問題を、ここではN=M=2の場合について具体的に説明する。
【0009】
図9において多数の黒の小さい点は白色化された信号Z1(f,m)を横軸に、Z2(f,m)を縦軸にプロットしたものであり、太い実線で示した円41は、拘束条件‖t k(f)‖=1を表している。細い実線42は目的関数Γ(f)=E{G(|t k H(f)Z(f)|2)}の等高線を表しており、外側ほど値が大きくなる。
式(6)では、拘束条件の円41の上でΓ(f)を最大にするベクトルt k を求めるものであるから、図9中の円41の中心を通り互いに直交する軸Aと軸B上の、基点を円41の中心とする2つの白いベクトルα,βのうちのどちらかが解として求まる。すなわち、t 1(f)=α,t 2(f)=βという解も、t 2(f)=α,t 1(f)=βという解も求まり得る。これは、どちらの場合でも出力Y1(f,m)とY2(f,m)の独立性を保つことができるからである。このことを式で説明する。式(5)を、N=M=2の場合について書き下すと次式(7)となる。
【数1】
【0010】
直交行列T(f)の一行目から一つ目の出力Y1(f,m)が、T(f)の二行目から二つ目の出力Y2(f,m)が得られ、この時Y1(f,m)とY2(f,m)は独立である。しかし、直交行列T(f)はその行が入れかわっても、出力Y1(f,m)とY2(f,m)の独立性は保たれる。すなわち直交行列T(f)の1行目と2行目を入れかえると、一つ目の出力にY2(f,m)が、二つ目の出力にY1(f,m)が得られるが、ここでもやはり二つの出力信号は独立である。即ち、ICAは出力信号同士を互いに独立にはするが、その出力順序は拘束しない。
これより、任意の二つの周波数f1 とf2 を考えた時、例えば出力信号Y1(f1 ,m)とY1(f2 ,m)とが、同じ信号siに対する推定信号であるとは限らない。従って、周波数領域BSSでは、Yi(f1 ,m)とYi(f2 ,m)が同じ信号源の信号siの推定となるように、直交行列T(f)の行を正しく並べ替える必要がある。これを置換(Permutation)の問題と呼ぶ。
【0011】
このPermutationの問題を解決した後、その直交行列T(f)と事前白色化部31で用いた白色化行列V(f)とを用いて事後白色化(Post−Whitening)部33でW(f)=T H(f)V(f)を演算して分離行列W(f)を求める。
なお、Permutationの問題を解決する方法としては、たとえば非特許文献3がある。
【0012】
適応型ビームフォーマ法
目的信号を分離抽出する手法の二つ目としては、適応型ビームフォーマによる手法がある。この適応型ビームフォーマ法は図10に示すように、センサアレイ50で観測された入力信号を目的信号オフ時推定部51に入力して、妨害信号のみが存在する時間区間を検出する。この検出した時間区間において入力信号をフィルタ群52へ供給し、そのフィルタ群52の出力信号の和を誤差信号e(t)とし、フィルタ制御部53において誤差信号のパワーが最小となるようにフィルタ群52のフィルタ係数(インパルス応答)wijを更新する。次に求まったフィルタ係数wijをフィルタ群54にコピーし、このフィルタ群54に入力信号を通すことで、妨害信号が抑圧され、目的信号が強調された出力信号y(n)が得られる。
ここでは、目的信号がs1(n)であるとして説明を行う。また、適応型ビームフォーマ法は周波数領域で用いられることが多いのでここでも周波数領域で説明を行う。
フィルタ係数更新時、分離行列W 1j(f)が全て0となる意味の無い解(目
的信号も出力されない)が得られることのないように、以下に述べるような拘束条件のもとで、誤差信号E(f,m)のパワーが最小となるよう、分離行列W 1j(f)を推定する。ここでW 1j(f)はフィルタ係数wi(k)を、E(f,m)は誤差信号e(t)をそれぞれ例えば短時間フーリエ変換により周波数領域に変換したものである。
【0013】
適応型ビームフォーマ法では、目的信号源からセンサjまでの周波数応答Hj1(f)が既知である必要がある。既知である周波数応答をH′j1(f)=exp(j2πfτj1)とする。もしくは目的信号源の方位θを既知として、目的信号源からセンサjまでの周波数応答Hj1(f)を、信号のセンサ間遅延時間τj1だけを用いてH′j1(f)=exp(j2πτj1)と近似する。ここで図11に示すようにτj1=(dj /c)sin θ1 であり、dj はセンサ12j の座標、cは音速、θ1 は音源111 の方向である。この近似は、目的信号源(スピーカ)111 からセンサ(マイクロホン)12j に到達する信号は直接音だけであるという近似となっている。
このように、H′j1(f)が既知の時、拘束条件として例えば次式(8)で与えられ、
Σj=1 MH′j1W1j(f)=W 1(f)H 1(f)=1 (8)
この式(8)の条件を満たしながら誤差信号E(f,m)のパワーを最小とする係数W′1j(f)を求める。ここで、H 1(f)=[H′11(f),H′21(f)]T,W 1(f)=[W11(f),W12(f)]である。式(8)は、目的信号から出力までの周波数応答を全ての周波数で1にする、という拘束条件となっている。これは目的信号が歪み無く出力されるための条件である。
【0014】
適応型ビームフォーマ法における拘束条件を与えるためには、上記のように目的信号源111 からセンサ12j までの周波数応答Hj1(f)が必要である。しかし、Hj1(f)は信号源111 の移動や場の変化(温度変化、扉の開放などによる形状の変化など)などにより変動するため、観測時の周波数応答Hj1(f)と、適応型ビームフォーマ駆動時の周波数応答H′j1(f)とが等しいことは少ない。また、目的信号源111 の方位θ1 を用いてH′j1(f)を近似する場合にも、目的信号源111 の方位の推定が誤っている場合や、実環境での録音などのように信号の直接音だけでなく反射音も存在する場合には、H′j1(f)の近似精度は低くなる。
このように、適応型ビームフォーマ法で用いられる拘束条件は、多くの場合、実際に使用する環境に合わないという意味で不正確なものであり、これが適応型ビームフォーマ法の問題点となっている。このような不正確なH′j1(f)を拘束条件とする場合、適応型ビームフォーマ法による妨害信号除去能力は著しく低下する。
【0015】
図12を用いてこれを説明する。この図においてグレー(灰色)で表される点は、白色化された信号Z1(f,m)を横軸に、Z2(f,m)を縦軸にプロットしたものである。また、目的信号に関する直交ベクトルt 1 および拘束条件の式(8)についても、Zi(f)と同じ平面に表示することができ、図において、破線44は適応型ビームフォーマ法により推定されたベクトルt 1 を、t1を横軸、t2を縦軸として表し、一点鎖線45は拘束条件を表している。
正しい拘束条件を与えた場合、図12(a)に示すように、まず拘束条件を示す線45とプロットされたZi(f)の軸の一方(図では軸A)とは平行であることが分かる。また、正しい拘束条件を与えた場合、適応型ビームフォーマ法によって推定された、目的信号に関する直交ベクトルt 1 と軸Aは垂直に交わる。両者が垂直である時、妨害信号が最も良く抑圧される(例えば非特許文献2参照)。
これに対し、目的信号方向を間違えて拘束条件を与えた場合は、図12(b)に示すように推定された直交ベクトルt 1 と軸Aは垂直には交わらない。これは、妨害信号除去能力が低いことを示している。
【0016】
【非特許文献1】
A.Hyvaerinen and J.Karhunen and E.Oja,“Independent Component Analysis,”John Wiley & Sons,2001,ISBN 0−471−40540
【非特許文献2】
M.Knaak and D.Filbert,“Acoustical semi−blind source separation for machine monitoring,”in 3rd. International Conference on Blind Source Separation and Independent Component Analysis,2001,pp.361−366
【非特許文献3】
澤田 宏,向井 良,荒木 章子,牧野 昭二,“周波数領域ブラインド音源分離におけるpermutation問題の解法”,日本音響学会 秋季研究発表会,
pp.541−542,2002年9月
【0017】
【発明が解決しようとする課題】
従来の周波数領域でのBSSは、分離問題を各周波数について解くため、各帯域での分離行列は、時間的コストも小さく分離精度も良く求まる。しかし、周波数領域BSSでは、直交行列T(f)の大きさを直交行列T(f)の各行ベクトルのノルムが1という拘束条件で規定するが、直交行列T(f)の行の順番については拘束が無かった。このため、求めたY(f,m)について置換(Permutation)の問題を解く必要があった。
また、適応型ビームフォーマ法では、目的信号源からセンサまでの周波数応答や目的信号源の方向等が正しく入手できないので、誤った拘束条件のもとでフィルタ信号(逆混合行列)の最適化が行われ、妨害信号の除去能力が十分ではなかった。
【0018】
この発明の目的は、ICAによる学習中にPermutationの問題が生じないアルゴリズムを提案し、Permutationを解く処理を必要なくすると同時に、与えられる拘束条件の信頼性が低い場合でも妨害信号を十分除去することができる目的信号抽出方法、その装置、目的信号抽出プログラム、その記録媒体を提供することにある。
【0019】
【課題を解決するための手段】
この発明による装置の基本的な機能構成は図1に示すように、図7に示した従来の独立成分解析(ICA)法による周波数領域でのブラインド信号分離(BSS)の機能構成と同様であるが、この発明では分離行列推定部に特徴を持つ。事前知識保持部の目的信号源とセンサ間の周波数応答の事前知識H 1 を用いて目的信号を歪みなく抽出する拘束条件を満す分離ベクトルt 1 の初期値t 1(0)を計算し、分離行列推定部においては、この初期値t 1(0)を、ICA法により出力信号の非ガウス性をより高めるように更新し、この更新したベクトルt 1 が前記拘束条件を満たすようにベクトルt 1 のノルムを更新する。必要に応じて上記2つの更新を繰り返し、ベクトルt 1 が十分収束するまで行う。ここで例えばH 1(f)=[H′11(f),H′21(f)]であり、事前知識としては例えば適応型ビームフォーマ法で利用される程度の精度を持った目的信号方向に関するものであれば良い。
【0020】
【発明の実施の形態】
図1にこの発明装置の機能構成例を示し、図2にこの発明の方法の処理手順の例を示す。以下では観測信号がx1(n),x2(n)、分離信号がy1(n),y2(n)であり、分離した目的信号としてy1(n)を抽出する場合を例とする。
センサからの観測信号を取り込んで記憶部(図1に示していない)に一時格納する(S1)。図7に示した従来の周波数領域BSS法と同様にこれら観測信号を例えば短時間フーリエ変換により周波数領域信号行列X(f,m)に周波数領域変換部21で変換する(S2)。この変換された信号行列X(f,m)を用いて分離行列推定部61で推定した分離行列W(f)を推定する(S3)。
この推定は図8に示した手法と同様に事前白色化部31で白色化行列V(f)を算出し(S3−1)、白色化行列V(f)を用いて信号行列X(f,m)を白色化して白色化観測信号行列Z(f,m)を求める(S3−2)。
目的信号方向に関する事前知識H 1 を用いた分離行列推定について詳しく説明を行う。
【0021】
この発明では直交行列推定部63に特色がありこの実施形態では、直交行列推定部63において、目的関数Γ(f)を最大化するベクトルt 1 を、式(10)に示す拘束条件の下に求める。
arg maxt 1 Γ(f) (9)
W 1 H(f)H 1(f)=t 1 H(f)V(f)H 1(f)=1 (10)
これは例えば以下のように実現される。
まず直交ベクトルt 1(f)の初期値t 1(0)(f)を与える(S3−30)。この初期値t 1(0)(f)は式(10)の拘束条件を満たす任意のベクトルを用いることができるが、従来技術の項で説明した適応型ビームフォーマ法で求めたベクトルを用いるとよい。つまり、まず事前知識保持部62に保持されている事前知識としての事前周波数応答H 1(f)の読み出しを行う(S3−31)。初期値計算部63aに事前周波数応答H 1(f)、信号行列Z(f,m)、白色化行列V(f)を入力し、式(8)を満たしながら図10での誤差信号E(f,m)のパワーを最小にするW 1(f)を求める。
W 1(f)=t 1(f)V(f)の関係よりt 1(f)を求め、これを初期値ベクトルt 1(0)(f)とする。(S3−32)。
このベクトルt 1(0)は、拘束条件が正しく与えられる場合には既に分離を達成する直交ベクトルt 1(f)となり、拘束条件の信頼性が低い場合には分離能力は低いが、その向きは正しいベクトル、つまり図12に示した例では軸Aに垂直なベクトルに近くなる。従って、このベクトルを初期値t 1(0)(f)に用いることで良好かつ高速な収束が得られる。なお事前周波数応答情報H 1(f)としては、従来の適応型ビームフォーマ法で説明したように目的信号源の方位(目的信号到来方向)θを既知としてHj1(f)=exp(j2πfτj1),τj1=(dj /c)sin θ1を計算したもの、あるいは予め測定したものでよい。
【0022】
ICA処理部63bに信号行列Z(f,m)、初期値t 1(0)(f)、白色化行列V(f)を入力してICA法を用いて出力信号の非ガウス性をより高めるようにベクトルt 1 を更新する(S3−33)。これにより、式(10)の拘束条件に依らず、出力信号の分離が最も良く行われるベクトルt 1 を推定することができる。
ノルム更新部63cに更新されたベクトルt 1(f)、白色化行列V(f)、事前情報H 1(f)を入力して、更新したベクトルt 1 が拘束条件式(10)を満たすように、ベクトルの長さ(ノルム)を変更する(S3−34)。これは、ICA処理部63bで推定されたベクトルt 1 の方向は変えず、長さだけを変えて、ベクトルt 1 が式(10)の拘束条件を満たすように変更する操作を行えばよい。式(10)は、目的信号から出力信号までの間の周波数応答、つまり目的信号源からこの目的信号抽出装置の出力端までの周波数応答が全ての周波数で1であるという条件であり、目的信号が歪み無く出力されるための条件である。よって、式(10)の拘束条件を満たすベクトルt 1 により分離された全ての周波数成分は全て同一の目的信号の成分である。言いかえると、式(7)の直交行列T(f)の一行目は全ての周波数で目的信号に対応する出力を生成することになり、Permutationの問題が生じない。
【0023】
ノルム変更が行われた後、収束判定部63dでそのベクトルt 1(f)の収束状態の判定を行う(S3−35)。十分に収束している場合、目的信号を分離抽出する為に必要なベクトルt 1 の収束結果を出力する。まだ収束していない場合、そのベクトルt 1(f)をスイッチ部63eを通じてICA処理部63bに再び入力して、つまりステップS3−33に戻り、ステップS3−33〜S3−35を繰り返す。
収束した直交ベクトルt 1(f)と白色化行列V(f)を事後白色化部33に入力して、事後白色化した分離ベクトルw 1(f)を計算する(S3−4)。目的信号が複数の場合は同様にして各目的信号と対応する分離ベクトルw i を求め、つまり分離行列W(f)を求める。この分離行列W(f)と信号行列X(f,m)を分離演算部27に入力して式(4)を演算して分離された目的信号行列Y(f,m)を演算し(S4)、この演算結果を時間領域変換部24で例えば逆フーリエ変換により時間領域信号に変換して、各分離された目的信号y1(n),y2(n)を求める(S5)。
【0024】
あるいは事後白色化して得られた分離行列W(f)を時間領域変換部25で例えば逆フーリエ変換によりフィルタ係数群wijに変換し(S6)、分離フィルタ群26で観測信号xj(n)に対し、対応するフィルタ係数を畳み込んで分離された目的信号y1(n),y2(n)を得るようにしてもよい(S7)。
この実施形態によれば、この発明の課題を解決できる仕組を以下に説明する。
上述した処理によりこの発明の課題が解決される仕組について図4を用いて説明する。グレーで表される点は、白色化された信号Z1(f,m)を横軸に、Z2(f,m)を縦軸にプロットしたものであり、一点鎖線46は拘束条件を表し破線47は適応型ビームフォーマ法により推定された分離ベクトルを、この実施形態の初期値t 1(0)としたものを表わし、実線48はこの実施形態により求まった直交ベクトルt 1 を表わし、図12(a)に示した場合と同様に軸Aと実線ベクトルt 1 とが垂直に交わる時、妨害信号が最も抑圧される。
【0025】
(1)従来のICAによるBSSでは直交行列T(f)のノルムを1とする拘束条件(図4中の円41)の下に最大化問題を解くので、図4中に示す互いに直角でその一方が軸Aと垂直な2本のベクトルa及びbのうち、どちらがベクトルt 1 として求まるかは不定である。この不確定性がPermutationの問題であった。
この実施形態では拘束条件として式(10)を用いるが、これは目的信号から出力信号までの間の周波数応答が全ての周波数で1であるという条件、すなわち目的信号が歪み無く出力されるための条件である。よって、拘束条件を満たすベクトルt 1 は、全ての周波数において目的信号を生成することを可能とする。言いかえると、式(7)の直交行列T(f)の一行目が全ての周波数で目的信号に対応することになり、Permutationの問題が生じない。
【0026】
ベクトルt 1 に対する上記繰り返し処理の各回において、t 1 の長さ(ノルム)はベクトルが式(10)の拘束条件を満たすよう決定されるが、拘束条件が実際と多少ずれている場合でも図4に示した例のように拘束条件は線Bよりも軸Aと平行に近くなるので、ほとんどの場合において軸Aに垂直なベクトルが最終的な直交ベクトルt 1 として求まる。すなわち発明方法により、拘束条件が実際と多少ずれている場合でも、Permutationの問題は生じない。
また、初期値t 1(0)に適応型ビームフォーマ法により求めたものを用いる場合は、拘束条件が実際と多少ずれていても軸Aに垂直に近いベクトルから学習を始めることができることもPermutationの問題を解決することに寄与している。
【0027】
(2)適応型ビームフォーマ法では、目的信号方向を間違えて拘束条件を与えた場合には妨害信号除去能力が低くなる。この時、図12(b)に示したように、推定された直交ベクトルt 1 と軸Aは垂直には交わらなかった。
ICA処理部63bで図2中のステップS3−33におけるICA法によるベクトルt 1 の更新では、ベクトルt 1 は図9に示したベクトルαかβのように軸A又は軸Bに垂直な方向へ近づくよう更新される。ここでは、Permutationの問題が解決されているのでベクトルt 1 は軸Aと垂直な方向へ収束する。
この発明では、更新の各回においてICA法でt 1 を軸Aと垂直な方向へ近づけた後で、拘束条件を満たすためにt 1 の長さを変える操作を行うので、拘束条件の正確さに依らずにベクトルt 1 は軸Aと垂直な方向へ近づいていく。
その結果、拘束条件の信頼性が低い場合でも、軸Aと垂直な方向のベクトルが最終的な分離ベクトルt 1 として求まることになる。
【0028】
実施例
ここでは、目的関数Γ(f)=E{G(|t 1 HZ|2)}の場合についての、この発明の実施例について述べる。ここでGはある非線型関数であり、G(z)=log(a+z)やG(z)=√(a+z)(aは定数)などがよく用いられる。
はじめに初期値計算部63a(ステップS3−32)において、直交ベクトルt 1 (f)の初期値t 1(0)(f)を選ぶ。初期値t 1(0)(f)は任意の値を用いることができるが、図12で示した従来の適応型ビームフォーマ法で求まったベクトルは、分離能力は低いが解の近くにあるので、これを初期値に用いることで良好かつ高速な収束が得られる。この初期値ベクトルt 1(0)(f)は白色化行列V(f)と目的信号源とセンサ間の既知の周波数応答H 1(f)と白色化された信号Z(f)とを用いて次式(11)の計算により求めることができる。
【数2】
ここでRz(f)はZ(f)の共分散行列Rz(f)=E[Z(f)Z T(f)]であり、E[ ]は平均を表わす。
このベクトルt 1(0)(f)は、従来の適応型ビームフォーマ法で用いた規範(妨害信号のみが存在する時間における誤差信号の最小化)で求まるものであり、拘束条件が正しく与えられる場合には既に分離を達成する直交ベクトルt 1(f)と同一のものとなり、拘束条件の信頼性が低い場合には分離能力は低いが解の近くにあるベクトルとなる。
【0029】
次に、ICA処理部63b(ステップS3−33)においてベクトルt 1 の更新を行う。目的関数Γ(f)=E{G(|t 1 H Z|2)}の最大化は次の更新式(12)により行われる。
【数3】
であり、g(z)は非線型関数G(z)のzに関する微分、下付きの()内の値は更新回数をそれぞれ表す。
【0030】
次に、ノルム更新部63c(ステップS3−34)においてベクトルt 1 の長さを変更してベクトルt 1 が式(10)の拘束条件を満たすようにする。これは以下の式(13)により実現できる。
【数4】
次に、判定部63d(ステップS3−35)で収束判定を行う。まだ収束していない場合、ベクトルt 1 の更新と長さの変更を繰り返す。十分に収束している場合、目的信号を分離抽出する為に必要なt 1 の収束結果を出力する。
【0031】
この発明による目的信号抽出装置は、CPUやメモリ等を有するコンピュータと、ユーザ端末と、CD−ROMやDVD−ROM、磁気ディスク装置、半導体メモリ等の読み取り可能な記録媒体とから構成することができる。記録媒体に記録された目的信号に関する事前情報H 1(f)と、記録媒体に記録された目的信号抽出プログラムもしくは回線を通して伝送された目的信号抽出プログラムは、コンピュータに読み取られ、コンピュータ上で前述した各処理を実現する。
この発明は目的音源信号の抽出のみならず、目的電波源の信号の抽出にも適用でき、この場合はセンサとしてはアンテナが用いられ、アンテナよりの観測信号は一般にベースバンドに変換され、サンプリングされたディジタル信号系列として処理される。
【0032】
【発明の効果】
図4の実線48は、目的信号方向を間違えて拘束条件を与えた場合に、発明法を用いて推定した直交ベクトルt 1 を示している。軸Aに垂直なベクトルが推定されている。このように、目的信号方向を間違えて拘束条件を与えた場合にも十分な抑圧性能が得られるベクトルが推定されており、この発明の有効性が分かる。
図5は、出力端子141 に得られる信号について、各周波数における目的信号対妨害信号比(SIR)をdBで示しており、値が正ならば、目的信号が出力端子141 に正しく得られていることを示し、値が負ならば、Permutationの問題が生じて妨害信号が出力端子141 に得られていることを示す。
【0033】
図5(a)は、従来のICA法を用いた場合に出力端子141 に得られる信号の各周波数におけるSIRである。目的信号に関する拘束を入れていないため、Permutationの問題が著しい。
図5(b)(c)はそれぞれ、この発明方法を用いた場合に出力端子141 に得られる信号の各周波数におけるSIRである。図5(b)は無残響で、目的信号の方向が正しい角度と20度ずれて与えられている場合、図5(c)は目的信号の方向が正しく与えられているが、残響がある場合の結果である。すなわち図5(b)(c)の双方とも、正確な拘束条件を与えることができない状況である。しかし、この発明方法によると、双方ともほとんどの周波数で正のSIR値が得られており、Permutationの問題はほとんど生じていないことから、発明方法が有効であることが分かる。
【図面の簡単な説明】
【図1】この発明装置の機能構成例を示すブロック図。
【図2】この発明方法の実施形態の処理手順の例を示す流れ図。
【図3】図1中の分離行列推定部の具体的機能構成例を示すブロック図。
【図4】この発明方法が課題を解決する仕組を説明するための図。
【図5】発明の効果を示す図。
【図6】ICA法によるブラインド音源分離(BSS)のモデルを示す図。
【図7】従来のICA法による周波数領域BSSの機能構成を示すブロック図。
【図8】図7中の従来の分離行列推定部22の詳細な機能構成を示すブロック図。
【図9】置換(Permutation)の問題を説明するための図。
【図10】従来の適応型ビームフォーマ法の機能構成を示すブロック図。
【図11】適応型ビームフォーマ法で使うパラメータを説明するための信号源とセンサとの配置を示す図。
【図12】適応型ビームフォーマ法で得られる解を示す図。
Claims (7)
- 複数の方向から到来する信号を複数のセンサで観測し、これら複数のセンサからの観測信号に基づき周波数領域でのブラインド信号分離方法を用いて目的信号を抽出する方法であって、
上記センサからの観測信号を周波数領域の信号に変換する手順と、
上記周波数領域の信号から、独立成分分析により各周波数での分離行列を算出する手順と、
上記分離行列と上記周波数領域の信号とを乗算し、その乗算結果を時間領域の信号に変換して目的信号を得る手順又は上記分離行列を時間領域の周波数応答に変換し、その周波数応答を上記観測信号に畳み込んで目的信号を得る手順を有し、
上記分離行列を算出する手順は、
目的信号源とセンサ間の周波数領域での周波数応答の事前知識を用いて、目的信号が歪み無く抽出される拘束条件を満す分離ベクトルを計算して分離ベクトルの初期値とする手順と、
上記分離ベクトルの初期値を、独立成分分析により、出力信号の非ガウス性をより高めるように変更する手順と、
上記変更したベクトルをそのノルムが上記拘束条件を満すように変更して上記分離行列の一成分とする手順とを有することを特徴とする目的信号抽出方法。 - 上記事前知識は、上記目的信号源に対する与えられた方位に基づき、上記複数のセンサ間の観測信号到達遅延時間を求め、その遅延時間を用いて上記周波数応答を求めたものであることを特徴とする請求項1記載の目的信号抽出方法。
- 上記事前知識は、上記目的信号源とセンサ間の周波数応答を予め測定したものであることを特徴とする請求項1記載の目的信号抽出方法。
- 上記ノルムを変更したベクトルを分離行列の一成分とする前に、その変更したベクトルが十分収束したか判定し、収束が十分でなければ上記そのベクトルを上記初期値として、上記非ガウス性をより高める手順に戻り、収束が十分であれば、上記分離行列の一成分とする手順を含むことを特徴とする請求項1〜3の何れかに記載の目的信号抽出方法。
- 複数のセンサからの観測信号が入力され、これら観測信号を周波数領域の信号に変換する周波数領域変換部と、
上記信号が入力され、その信号から独立成分分析により各周波数での分離行列を算出する分離行列推定部と、
上記信号及び上記分離行列が入力され、これらを演算して周波数ごとに目的信号を分離した分離信号行列を計算する分離演算部及び上記分離信号行列を時間領域信号に変換して抽出した目的信号を得る時間領域変換部、又は上記分離行列が入力され、これを時間領域の分離フィルタ信号群に変換する時間領域変換部及び上記分離フィルタ信号群と上記観測信号が入力されてフィルタ処理により抽出した目的信号を出力する分離フィルタ部と、
を具備する装置であって、
上記分離行列推定部は、
目的信号源とセンサ間の周波数領域での周波数応答を事前知識として保持する事前知識保持部と、
上記事前知識、上記信号とから、目的信号が歪み無く抽出される拘束条件を満す分離ベクトルを初期値として計算する初期値計算部と、
上記初期値、上記信号から、これらを変数とする目的関数を最大化するように、上記初期値を変更したベクトルを求める独立成分分析処理部と、
上記変更されたベクトルのノルムを上記拘束条件を満すように変更して上記分離行列の一成分としての分離ベクトルを出力するノルム更新部とを備えることを特徴とする目的信号抽出装置。 - 請求項1〜4の少なくとも何れか1つに記載した目的信号抽出方法の各手順をコンピュータに実行させるための目的信号抽出プログラム。
- 請求項6に記載した目的信号抽出プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003094840A JP3949074B2 (ja) | 2003-03-31 | 2003-03-31 | 目的信号抽出方法及びその装置、目的信号抽出プログラム及びその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003094840A JP3949074B2 (ja) | 2003-03-31 | 2003-03-31 | 目的信号抽出方法及びその装置、目的信号抽出プログラム及びその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004302122A true JP2004302122A (ja) | 2004-10-28 |
JP3949074B2 JP3949074B2 (ja) | 2007-07-25 |
Family
ID=33407322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003094840A Expired - Fee Related JP3949074B2 (ja) | 2003-03-31 | 2003-03-31 | 目的信号抽出方法及びその装置、目的信号抽出プログラム及びその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3949074B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181813A (ja) * | 2003-12-22 | 2005-07-07 | Nec Corp | 信号分離方法、信号分離システムおよび信号分離用プログラム |
JP2006308955A (ja) * | 2005-04-28 | 2006-11-09 | Univ Kinki | 耐高残響ブラインド信号分離装置及び方法 |
JP2006339773A (ja) * | 2005-05-31 | 2006-12-14 | Nec Corp | Mimo受信装置、受信方法、および無線通信システム |
JP2007193035A (ja) * | 2006-01-18 | 2007-08-02 | Sony Corp | 音声信号分離装置及び方法 |
JP2009124198A (ja) * | 2007-11-09 | 2009-06-04 | Brother Ind Ltd | 無線タグ通信装置 |
WO2009113192A1 (ja) * | 2008-03-11 | 2009-09-17 | トヨタ自動車株式会社 | 信号分離装置及び信号分離方法 |
JP2010286685A (ja) * | 2009-06-12 | 2010-12-24 | Yamaha Corp | 信号処理装置 |
KR101197407B1 (ko) | 2005-01-26 | 2012-11-05 | 소니 주식회사 | 음성 신호 분리 장치 및 방법 |
US8345884B2 (en) | 2006-12-12 | 2013-01-01 | Nec Corporation | Signal separation reproduction device and signal separation reproduction method |
CN115662409A (zh) * | 2022-10-27 | 2023-01-31 | 亿铸科技(杭州)有限责任公司 | 一种语音识别方法、装置、设备及存储介质 |
-
2003
- 2003-03-31 JP JP2003094840A patent/JP3949074B2/ja not_active Expired - Fee Related
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4525071B2 (ja) * | 2003-12-22 | 2010-08-18 | 日本電気株式会社 | 信号分離方法、信号分離システムおよび信号分離用プログラム |
JP2005181813A (ja) * | 2003-12-22 | 2005-07-07 | Nec Corp | 信号分離方法、信号分離システムおよび信号分離用プログラム |
KR101197407B1 (ko) | 2005-01-26 | 2012-11-05 | 소니 주식회사 | 음성 신호 분리 장치 및 방법 |
JP2006308955A (ja) * | 2005-04-28 | 2006-11-09 | Univ Kinki | 耐高残響ブラインド信号分離装置及び方法 |
JP4714892B2 (ja) * | 2005-04-28 | 2011-06-29 | 財団法人北九州産業学術推進機構 | 耐高残響ブラインド信号分離装置及び方法 |
JP2006339773A (ja) * | 2005-05-31 | 2006-12-14 | Nec Corp | Mimo受信装置、受信方法、および無線通信システム |
JP4666150B2 (ja) * | 2005-05-31 | 2011-04-06 | 日本電気株式会社 | Mimo受信装置、受信方法、および無線通信システム |
US7797153B2 (en) | 2006-01-18 | 2010-09-14 | Sony Corporation | Speech signal separation apparatus and method |
JP4556875B2 (ja) * | 2006-01-18 | 2010-10-06 | ソニー株式会社 | 音声信号分離装置及び方法 |
JP2007193035A (ja) * | 2006-01-18 | 2007-08-02 | Sony Corp | 音声信号分離装置及び方法 |
US8345884B2 (en) | 2006-12-12 | 2013-01-01 | Nec Corporation | Signal separation reproduction device and signal separation reproduction method |
JP2009124198A (ja) * | 2007-11-09 | 2009-06-04 | Brother Ind Ltd | 無線タグ通信装置 |
JP2009217063A (ja) * | 2008-03-11 | 2009-09-24 | Toyota Motor Corp | 信号分離装置及び信号分離方法 |
WO2009113192A1 (ja) * | 2008-03-11 | 2009-09-17 | トヨタ自動車株式会社 | 信号分離装置及び信号分離方法 |
US8452592B2 (en) | 2008-03-11 | 2013-05-28 | Toyota Jidosha Kabushiki Kaisha | Signal separating apparatus and signal separating method |
JP2010286685A (ja) * | 2009-06-12 | 2010-12-24 | Yamaha Corp | 信号処理装置 |
CN115662409A (zh) * | 2022-10-27 | 2023-01-31 | 亿铸科技(杭州)有限责任公司 | 一种语音识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3949074B2 (ja) | 2007-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110100457B (zh) | 基于噪声时变环境的加权预测误差的在线去混响算法 | |
US11894010B2 (en) | Signal processing apparatus, signal processing method, and program | |
Douglas et al. | Scaled natural gradient algorithms for instantaneous and convolutive blind source separation | |
US20090222262A1 (en) | Systems And Methods For Blind Source Signal Separation | |
CN106251877A (zh) | 语音声源方向估计方法及装置 | |
CN106384588B (zh) | 基于矢量泰勒级数的加性噪声与短时混响的联合补偿方法 | |
JP6987075B2 (ja) | オーディオ源分離 | |
JP3975153B2 (ja) | ブラインド信号分離方法及び装置、ブラインド信号分離プログラム並びにそのプログラムを記録した記録媒体 | |
CN108364659A (zh) | 基于多目标优化的频域卷积盲信号分离方法 | |
JP2012042465A (ja) | 音源方向推定装置及び音源方向推定方法 | |
Aichner et al. | Time domain blind source separation of non-stationary convolved signals by utilizing geometric beamforming | |
JP3949074B2 (ja) | 目的信号抽出方法及びその装置、目的信号抽出プログラム及びその記録媒体 | |
Hoang et al. | Joint maximum likelihood estimation of power spectral densities and relative acoustic transfer functions for acoustic beamforming | |
CN110890099B (zh) | 声音信号处理方法、装置以及存储介质 | |
Douglas | Blind separation of acoustic signals | |
CN112037813B (zh) | 一种针对大功率目标信号的语音提取方法 | |
TWI622043B (zh) | 聲源分離方法與裝置 | |
JP5387442B2 (ja) | 信号処理装置 | |
Li et al. | Low complex accurate multi-source RTF estimation | |
JP2022500710A (ja) | 音響源用の結合音源定位及び分離方法 | |
US11322169B2 (en) | Target sound enhancement device, noise estimation parameter learning device, target sound enhancement method, noise estimation parameter learning method, and program | |
JP4616529B2 (ja) | ブラインド信号分離処理装置 | |
Huang et al. | Speaker localization with smoothing generalized cross correlation based on naive bayes classifier | |
JP2007178590A (ja) | 目的信号抽出装置、目的信号抽出方法、及び、プログラム | |
JP4113169B2 (ja) | 信号源数の推定方法、推定装置、推定プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041220 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070410 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070417 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100427 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110427 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |