JP4849404B2 - 信号処理装置、信号処理方法およびプログラム - Google Patents

信号処理装置、信号処理方法およびプログラム Download PDF

Info

Publication number
JP4849404B2
JP4849404B2 JP2006318487A JP2006318487A JP4849404B2 JP 4849404 B2 JP4849404 B2 JP 4849404B2 JP 2006318487 A JP2006318487 A JP 2006318487A JP 2006318487 A JP2006318487 A JP 2006318487A JP 4849404 B2 JP4849404 B2 JP 4849404B2
Authority
JP
Japan
Prior art keywords
separation matrix
learning
interpolation
signals
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006318487A
Other languages
English (en)
Other versions
JP2008134298A (ja
JP2008134298A5 (ja
Inventor
栄治 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MegaChips Corp
Original Assignee
MegaChips Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MegaChips Corp filed Critical MegaChips Corp
Priority to JP2006318487A priority Critical patent/JP4849404B2/ja
Publication of JP2008134298A publication Critical patent/JP2008134298A/ja
Publication of JP2008134298A5 publication Critical patent/JP2008134298A5/ja
Application granted granted Critical
Publication of JP4849404B2 publication Critical patent/JP4849404B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、複数の音源から発生した音から目的の音を分離する技術に関する。
周囲の「音」を電気信号に変換して、記録(録音)あるいは送信し、必要に応じて再生出力する技術は、昨今、いたるところで利用されている。一般に、ある地点で観測される「音(以下、「観測音」と称する)」は、様々な音源から発生した音が合成された状態である。このようにして観測された音をそのまま再生出力すると、必要としている音以外の音は雑音となるため好ましくない。
従来より、目的の音源から発生した音(以下、「抽出対象音」と称する)を、他の音源から発生した音(以下、「雑音」と称する)と分離する技術として、独立成分分析法(ICA:Independent Component Analysis)が知られている。独立成分分析法では、反復学習を行うことにより、少なくとも1つの音源から発生した音を他の音源から発生した音と分離する分離フィルタを決定し、この分離フィルタを用いて観測音の信号から抽出対象音の信号を分離する。このような技術が、例えば、特許文献1に記載されている。
特開2006−084974号公報
ところが、元々、独立成分分析法では、分離フィルタを決定するために、複雑な学習処理が必要であり、処理能力の高い演算装置が要求されるという問題があった。特許文献1に記載されている技術では、前回の学習結果に基づいて学習の反復回数を減らし、学習処理の低減を図ることが提案されているものの、装置の構成が複雑になるという問題がある。また、特許文献1に記載されている技術では、入力される音によっては逆に反復回数が増加する場合もある。
本発明は、上記課題に鑑みなされたものであり、コストを抑制しつつ、複数の音源によって生じた音から目的の音を分離することを目的とする。
上記の課題を解決するため、請求項1の発明は、なる位置に設けられた観測装置で同時に観測された複数の観測音に対応し前記複数の観測音がフーリエ変換された複数の信号を取得する信号取得手段と前記複数の信号における周波数帯域を複数の分割帯域に分割するとともに、分割した前記複数の分割帯域を予め定められた分類規則に従って学習帯域群または補間帯域群に分類する帯域分類手段と、前記信号取得手段により取得された複数の信号に対する分離行列を生成する手段であって、前記学習帯域群における分離行列を学習分離行列として学習処理により求める分離行列演算手段と、前記観測装置間の距離と前記学習分離行列と音源方向との関係が規定されたビームフォーミング演算式に、予め求められている前記観測装置間の距離と、前記分離行列演算手段により求められた前記学習分離行列とを当てはめることによって、前記音源方向を特定する方向特定手段と、前記方向特定手段により特定された音源方向に基づいて、前記補間帯域群における補間分離行列を取得する補間手段と、前記複数の信号と前記分離行列とに基づいて、前記複数の信号から、少なくとも1つの音源により発生した音を示す信号を分離して出力する信号分離手段と、を備え、前記分離行列演算手段は、前記学習処理により求められた前記学習分離行列と、前記補間手段によって取得された前記補間分離行列とに基づいて、前記分離行列を生成することを特徴とする。
また、請求項の発明は、(a)異なる位置に設けられた観測装置で同時に観測された複数の観測音に対応し前記複数の観測音がフーリエ変換された複数の信号を取得する工程と、(b)ビームフォーミング演算手法によって音源方向を特定する工程と、(c)前記複数の信号における周波数帯域を複数の分割帯域に分割するとともに、分割した前記複数の分割帯域を予め定められた分類規則に従って学習帯域群または補間帯域群に分類する工程と、(d)前記学習帯域群に分類された分割帯域について学習分離行列を学習処理により演算する工程と、(e)前記補間帯域群に分類された分割帯域について補間分離行列を取得する工程と、を備え、前記(b)工程で用いる前記ビームフォーミング演算手法は、前記観測装置間の距離と前記学習分離行列と前記音源方向との関係が規定されたビームフォーミング演算式に、予め求められている前記観測装置間の距離と、前記(d)工程により求められた前記学習分離行列とを当てはめることによって、前記音源方向を特定する手法であり、前記(e)工程では、前記(b)工程で特定された前記音源方向に基づいて前記補間分離行列を取得し、(f)前記(d)工程で求められた前記学習分離行列および前記(e)工程で取得された前記補間分離行列に基づいて、前記複数の信号に対する分離行列を生成する工程と、(g)前記複数の信号と前記分離行列とに基づいて、前記複数の信号から、少なくとも1つの音源により発生した音を示す信号を分離する工程と、を備えることを特徴とする。
また、請求項の発明は、コンピュータ読み取り可能なプログラムであって、前記プログラムの前記コンピュータによる実行は、前記コンピュータを、異なる位置に設けられた観測装置で同時に観測された複数の観測音に対応し前記複数の観測音がフーリエ変換された複数の信号を取得する信号取得手段と、前記複数の信号における周波数帯域を複数の分割帯域に分割するとともに、分割した前記複数の分割帯域を予め定められた分類規則に従って学習帯域群または補間帯域群に分類する帯域分類手段と、前記信号取得手段により取得された複数の信号に対する分離行列を生成する手段であって、前記学習帯域群における分離行列を学習分離行列として学習処理により求める分離行列演算手段と、前記観測装置間の距離と前記学習分離行列と音源方向との関係が規定されたビームフォーミング演算式に、予め求められている前記観測装置間の距離と、前記分離行列演算手段により求められた前記学習分離行列とを当てはめることによって、前記音源方向を特定する方向特定手段と、前記方向特定手段により特定された音源方向に基づいて、前記補間帯域群における補間分離行列を取得する補間手段と、前記複数の信号と前記分離行列とに基づいて、前記複数の信号から、少なくとも1つの音源により発生した音を示す信号を分離して出力する信号分離手段と、を備え、前記分離行列演算手段は、前記学習処理により求められた前記学習分離行列と、前記補間手段によって取得された前記補間分離行列とに基づいて、前記分離行列を生成する信号処理装置として機能させることを特徴とする。
請求項1ないしに記載の発明では、特定された音源方向に基づいて、補間帯域群における補間分離行列を取得し、学習分離行列と補間分離行列とに基づいて、分離行列を生成することにより、分離行列を生成するための学習処理を減らすことができる。したがって、比較的廉価な構成で実現できるので、コストを抑制できる。
請求項1ないし3に記載の発明では、学習処理により求められた学習分離行列を用いることにより、音源方向を精度よく特定することができる。
以下、本発明の好適な実施の形態について、添付の図面を参照しつつ、詳細に説明する。
<1. 第1の実施の形態>
図1は、本発明に係る信号処理装置1を含む音声処理システム100を示す図である。
音声処理システム100は、信号処理装置1、2つのマイク2、FFT回路3、およびIFFT回路4を備える。なお、音声処理システム100が備えるマイク2の数は、2つに限定されるものではなく、少なくとも2以上であればよい。
信号処理装置1は、FFT回路3から入力される複数の信号(図1に示す信号X1(f,t),X2(f,t))に、独立成分分析法(ICA:Independent Component Analysis)を適用することにより音源分離処理を行って、音源ごとに分離された信号(図1に示す信号Y1(f,t),Y2(f,t))を出力する装置である。なお、信号処理装置1については、後に詳述する。
マイク2は、一般的なマイクロフォンとしての機能を有しており、観測された音波(観測音)を電気信号に変換する。すなわち、マイク2は、本発明における観測装置に相当する構成であり、それぞれの位置において観測音を観測して、当該観測音を示す信号(図1に示す信号X1(t),X2(t))を生成し、FFT回路3にそれぞれ出力する。なお、2つのマイク2は、同時に観測音の観測を行う。
FFT回路3は、入力された信号に対して一般的なフーリエ変換を行って出力する回路である。したがって、FFT回路3から出力される信号は、それぞれがマイク2において観測された観測音を示しており、先述のように、信号処理装置1に入力される。
IFFT回路4は、信号処理装置1から入力された信号に対して一般的な逆フーリエ変換を行って出力する回路である。IFFT回路4から出力される信号(図1に示す信号Y1(t),Y2(t))は、例えば、図示しないスピーカ等によって音波に変換される。
図2は、信号処理装置1を示す図である。信号処理装置1は、制御部10、分離行列演算部11、方向特定部12、補間部13および信号分離部14を備える。
制御部10は、図示しないメモリに記憶されている設定データに応じて、分離行列演算部11、方向特定部12および補間部13を制御する。なお、本実施の形態における設定データには、マイク2の位置情報(具体的には、2つのマイク2間の距離d)が含まれているものとする。
制御部10は、設定データに従って、信号処理装置1に入力される信号X1(f,t),X2(f,t)における周波数帯域fを複数の分割帯域に分割するとともに、分割した複数の分割帯域をそれぞれ学習帯域群fgまたは補間帯域群fhに分類する。すなわち、制御部10は、本発明における帯域分類手段としての機能を有する。
なお、制御部10は、分離行列演算部11が学習を行う際の反復回数を設定データに従って決定するとともに、各回ごとに前述の分類を行うことが可能である。したがって、例えば、一回目の学習では全周波数帯域を学習帯域群fgとし、二回目の学習では間引いた分割帯域のみを学習帯域群fgとすることも可能である。詳細は後述するが、全周波数帯域を学習帯域群fgとした場合、その回における分離行列W(f)=学習分離行列WG(fg)となる。
分離行列演算部11は、信号X1(f,t),X2(f,t)に対する分離行列W(f)を、補間分離行列WH(fh)と学習分離行列WG(fg)とに基づいて生成する。また、分離行列演算部11は、制御部10から伝達された学習帯域群fgに対して、当該学習帯域群fgにおける学習分離行列WG(fg)を学習により求める。
なお、分離行列演算部11が、学習帯域群fgに含まれる各分割帯域に対する分離行列を学習により求める演算は、先述のように、独立成分分析法を用いる。すなわち、学習帯域群fgに含まれる個々の分割帯域に対する学習処理は従来の手法であるため、ここでは詳細な説明を省略する。
方向特定部12は、いわゆるビームフォーミングと呼ばれる演算手法(DOA:Direction of Arraival)を実行する。概略を説明すると、方向特定部12は、到来する音波について、マイク2の位置によって変わる観測音の遅延時間とマイク2の特性とを利用して、音源方向を特定する。したがって、詳細は図示していないが、方向特定部12は遅延時間を計測するタイマとしての機能も備えている。なお、式1ないし式3は、音源方向Dl(f)を求める演算式を示す。
Figure 0004849404
Figure 0004849404
Figure 0004849404
本実施の形態における方向特定部12は、マイク2の位置に関しては制御部10から伝達される位置情報(距離d)を利用し、マイク2の特性としては分離行列演算部11から伝達される学習分離行列WG(fg)を用いる。
なお、特性情報は、位置情報と同様に予め設定データに含まれていてもよいが、本実施の形態における信号処理装置1のように、マイク2の特性情報として学習分離行列WG(fg)を用いることにより、学習処理の結果を反映させることができる。したがって、方向特定部12によって特定される音源方向Dl(f)の精度が向上する。
補間部13は、方向特定部12により特定された音源方向Dl(f)に基づいて、補間帯域群fhにおける補間分離行列WH(fh)を取得する。補間部13が補間分離行列WH(fh)を取得する方法としては、例えば、演算により求めることができる。なお、式4は、補間分離行列WH(fh)を求める演算式の例である。
Figure 0004849404
式4に示す関数F[x]としては、従来より様々な関数が提案されているが、ここでは詳細な説明を省略する。
信号分離部14は、信号X1(f,t),X2(f,t)と分離行列W(f)とに基づいて、信号X1(f,t),X2(f,t)から、少なくとも1つの音源により発生した音を示す分離信号Y1(f,t),Y2(f,t)を出力する。なお、信号分離部14において信号を分離するための式は、式5である。
Figure 0004849404
信号分離部14から出力される分離信号Y1(f,t),Y2(f,t)は、分離行列演算部11に入力されて学習処理のための信号として使用されるとともに、信号処理装置1の出力信号となる。
以上が、音声処理システム100の構成および機能の説明である。次に、音声処理システム100の動作を説明する。なお、以下では、信号処理装置1の動作を中心に説明する。
図3および図4は、信号処理装置1の動作を示す流れ図である。信号処理装置1は、所定の初期設定を行ってから、入力される信号X1(f,t),X2(f,t)の取得を開始する(ステップS1)。
なお、初期設定では、設定データのロードや、反復回数を示すカウンタiを「1」に初期化する処理等が実行される(iは整数)。また、以下の処理において、Pとは、特性情報(マイク2の指向特性に関する情報)を取得するための学習の反復回数を示す設定値(設定データに含まれているものとする)であり、本実施の形態では初期値「1」に設定されている。さらに、Nとは、信号処理装置1における学習の反復回数(全反復回数)を示す設定値である。
信号X1(f,t),X2(f,t)の取得が開始されると、制御部10は周波数帯域fの分割を行うとともに、反復回数を示すカウンタiの値に応じて、分割帯域の分類を行う(ステップS2)。なお、本実施の形態における制御部10は、P≧iの条件において、全周波数帯域fを学習帯域群fgとして分類する。すなわち、ステップS2では、補間帯域群fhに分類される分割帯域はない。
周波数帯域の分類が終了すると、制御部10は、学習帯域群fgに含まれる分割帯域を示す情報を分離行列演算部11に伝達する。これにより、分離行列演算部11が学習帯域群fgに含まれる分割帯域について、学習処理を行い(ステップS3)、学習分離行列WG(fg)を求める。
図5は、分離行列W(f)の初期値W0(f)に対して、一回目の分離行列W1(f)を求める様子を概念的に示す図である。
図5において、1つの立方体が、それぞれ1つの分割帯域に対する分離行列を表現している。本実施の形態における制御部10は、全周波数帯域(1024Hz)を一つの分割帯域が1Hzとなるように、1024個に分割するが、もちろんこれに限定されるものではない。
また、図5に示す「ICA」は、その分離行列に対して学習処理が行われて、次の分離行列が求められることを示す。
ステップS3においても学習処理によって求まる分離行列は、学習分離行列WG(fg)である。しかし、ステップS2において全分割帯域(周波数帯域f)が学習帯域群fgに分類されているので、学習分離行列WG(fg)=分離行列W(f)である。すなわち、本実施の形態においては、一回目に求まる学習分離行列WG(fg)は、図5に示すように、分離行列W1(f)である。
したがって、分離行列演算部11は、求めた学習分離行列WG(fg)を分離行列W1(f)として信号分離部14に伝達する。これにより、信号分離部14は、式5に、伝達された分離行列W1(f)をセットする(ステップS4)。
次に、カウンタiをインクリメントし(ステップS5)、カウンタiがPより大きいか否かを判定する(ステップS6)。
なお、Pの値は「1」に限定されるものではなく、2以上であってもよい。Pの値を大きくすれば特性情報の精度を向上させることができる。しかし、Pの値が大きくなると、その分、学習の反復回数が増加して演算量が増加する。したがって、Pの値は、本実施の形態に示すように、比較的小さい値(「1」又は「2」程度)が好ましい。
ステップS6においてYesと判定されると、分離行列演算部11は、求めた学習分離行列WG(fg)を方向特定部12に伝達する。これにより、方向特定部12は特性情報としての学習分離行列WG(fg)を取得する(ステップS7)。
特性情報を取得すると、方向特定部12は音源方向を特定する(ステップS8)。ステップS8の処理とは、式1ないし式3を実行することによって、方向特定部12が音源方向Dl(f)を求める処理である。ステップS8において、方向特定部12は、求めた音源方向Dl(f)を補間部13に伝達する。
次に、制御部10は、カウンタiに応じて分割帯域を分類し(ステップS11)、学習帯域群fgに分類された分割帯域を分離行列演算部11に伝達するとともに、補間帯域群fhに分類された分割帯域を補間部13に伝達する。本実施の形態における制御部10は、P<iの条件において、n=4m−3(mは自然数)を満たすn番目の分割帯域を学習帯域群fgに分類し、その他の分割帯域を補間帯域群fhに分類する(ただし、N≧n)。なお、分規則はこれに限定されるものではない。
分割帯域の分類が終了すると、分離行列演算部11は、学習帯域群fgについて学習を行い、学習分離行列WG(fg)を求める(ステップS12)。ステップS12の処理と並行して、補間部13は、式4に従って、補間帯域群fhについて補間分離行列WH(fh)を求める(ステップS13)とともに、求めた補間分離行列WH(fh)を分離行列演算部11に伝達する。
次に、分離行列演算部11は、補間部13から伝達された補間分離行列WH(fh)と、求めた学習分離行列WG(fg)とに基づいて、分離行列W(f)を求め(ステップS14)、信号分離部14に伝達する。
図6は、i回目の分離行列Wi(f)と(i+1)回目の分離行列Wi+1(f)とを概念的に示す図である。図6では、学習帯域群fgに分類された分割帯域における分離行列(学習分離行列)をハッチング無しの立方体で示し、補間帯域群fhに分類された分割帯域における分離行列(補間分離行列)をハッチング付きの立方体で示す。
図6に示すように、本実施の形態における制御部10によって、第1番目の分割帯域、第5番目の分割帯域、・・・が、学習帯域群fgに分類され、学習処理(ICA)によって、次の分離行列が求められている。一方、学習帯域群fgに分類されなかった分割帯域(補間帯域群fh)については、補間部13によって、次の分離行列が求められ、補間されている。
なお、補間される分離行列(補間分離行列WH(fh))も、本実施の形態では演算(式4)により求められるが、学習によって求める場合に比べれば演算量は抑制される。また、ステップS11における分割帯域の分類または音源方向が変化しない限り、補間分離行列WH(fh)は変化しないので、一度求めた補間分離行列WH(fh)を記憶しておけば、ステップS13における実際の演算は1回でもよい。
すなわち、補間部13によって補間することにより、1回の演算量が抑制されるのみならず、演算回数を減らすことによっても演算量が抑制される。ただし、メモリ容量を抑制するためには、毎回補正部13において演算を行ってもよい。
分離行列W(f)が伝達されると、信号分離部14は、伝達された分離行列W(f)をセットし(ステップS15)、式5によって信号X1(f,t),X2(f,t)が、信号Y1(f,t),Y2(f,t)に分離される。
次に、カウンタiをインクリメントし(ステップS16)、カウンタiの値が、予め設定された反復回数であるNよりも大きいか否かを判定する(ステップS17)。カウンタiがN以下の場合は、ステップS11に戻って処理を繰り返す。これにより、さらに分離行列W(f)を求める処理が反復される。
一方、カウンタiがNより大きい場合(ステップS17においてYes)、分離行列W(f)を求める処理を終了する。これにより、以後は、それまでに求めた分離行列W(f)(より詳しくはWN(f))によって信号の分離が行われ、分離された信号Y1(f,t),Y2(f,t)が信号処理装置1からの出力信号となる。なお、全ての処理について処理を終了するように指示された場合、信号処理装置1は処理を終了する(ステップS18)。
以上のように、本実施の形態における信号処理装置1は、方向特定部12によって音源方向を特定し、特定された音源方向に基づいて補間分離行列WH(fh)を取得することによって、分離行列W(f)を全ての周波数帯域について学習処理によって求める場合に比べて、分離行列を生成するための学習処理を減らすことができる。したがって、低パフォーマンスの演算装置(CPU)でも実現可能となるので、信号処理装置1のコストを抑制できる。
なお、詳細には述べなかったが、本実施の形態における信号処理装置1は、方向特定部12によって音源方向を特定しつつ、補間部13によって補間することにより、全体としての反復回数Nを、従来の装置に比べて小さい値に設定することも可能である。
<2. 第2の実施の形態>
第1の実施の形態では、方向特定部12による音源方向の特定(ステップS8)が実行された後は、制御部10による分割帯域の分類規則は固定されていた。しかし、反復回数に応じて、これを変更することも可能である。
図7は、第2の実施の形態における信号処理装置1において、分離行列を求める様子を概念的に示した図である。図7に示す例では、L回目まで第1の実施の形態と同様の処理がなされており、分離行列WL(f)は、1/4の分割帯域(白色で示す)について学習処理がなされている。
第2の実施の形態では、(L+1)回目からM回目までは、1/2の分割帯域について学習処理を行い、(M+1)回目からN回目までは全ての分割帯域について学習処理を行うように分類規則が予め設定されている。これにより、第1の実施の形態に比べて、演算量は増加するものの、分離行列W(f)の精度は向上する。
以上のように、信号処理装置1では、スペック(装置パフォーマンス)と、要求される精度とに応じて、分類規則を定めることができる。
<3. 変形例>
以上、本発明の実施の形態について説明してきたが、本発明は上記実施の形態に限定されるものではなく様々な変形が可能である。
例えば、本実施の形態ではステップS2(一回目の反復)において、全周波数領域を学習帯域群fgに分類すると説明したが、もちろん一回目の学習のときから間引きを行ってもよい。その場合、音源方向に基づく補間処理は行えない(音源方向が特定されていないため)ので、分離行列W(f)の初期値W0(f)で補間して、一回目の分離行列W1(f)を求めてもよい。
また、上記実施の形態では、補間部13は音源方向に基づいて、演算により補間分離行列WH(fh)を取得すると説明した。しかし、音源方向ごとの補間分離行列WH(fh)を予め設定データとして記憶しておき、方向特定部12から伝達された音源方向を検索キーとして、設定データから適切な補間分離行列WH(fh)を検索して取得するように構成してもよい。このように構成することにより、補間部13の演算量はさらに抑制される。なお、この場合、必要とされる記憶容量を抑制するためには、−90°から90°までの方向について、例えば、10°刻み程度で記憶しておくことが好ましい。
また、図3および図4に示した各工程は、あくまでも例示であって、処理内容および処理順序は適宜変更されてもよい。すなわち、同様の効果が得られるのであれば、処理内容および処理順序は上記実施の形態に示すものに限定されるものではない。
また、ソフトウェア的に実現されると説明した演算処理について、その一部または全部を専用の論理回路によってハードウェア的に実現してもよい。
さらに、信号処理装置1を一般的なコンピュータによって実現することも可能である。その場合、当該コンピュータによって読み取られ、実行されるプログラムによって、上記実施の形態に示した各機能(演算)を実現してもよい。
本発明に係る信号処理装置を含む音声処理システムを示す図である。 信号処理装置を示す図である。 信号処理装置の動作を示す流れ図である。 信号処理装置の動作を示す流れ図である。 分離行列W(f)の初期値W0(f)に対して、一回目の分離行列W1(f)を求める様子を概念的に示す図である。 i回目の分離行列Wi(f)と(i+1)回目の分離行列Wi+1(f)とを概念的に示す図である。 第2の実施の形態における信号処理装置において、分離行列を求める様子を概念的に示した図である。
符号の説明
1 信号処理装置
10 制御部
11 分離行列演算部
12 方向特定部
13 補間部
14 信号分離部
2 マイク
3 FFT回路
4 IFFT回路

Claims (3)

  1. なる位置に設けられた観測装置で同時に観測された複数の観測音に対応し前記複数の観測音がフーリエ変換された複数の信号を取得する信号取得手段と
    前記複数の信号における周波数帯域を複数の分割帯域に分割するとともに、分割した前記複数の分割帯域を予め定められた分類規則に従って学習帯域群または補間帯域群に分類する帯域分類手段と、
    前記信号取得手段により取得された複数の信号に対する分離行列を生成する手段であって、前記学習帯域群における分離行列を学習分離行列として学習処理により求める分離行列演算手段と、
    前記観測装置間の距離と前記学習分離行列と音源方向との関係が規定されたビームフォーミング演算式に、予め求められている前記観測装置間の距離と、前記分離行列演算手段により求められた前記学習分離行列とを当てはめることによって、前記音源方向を特定する方向特定手段と、
    前記方向特定手段により特定された音源方向に基づいて、前記補間帯域群における補間分離行列を取得する補間手段と、
    前記複数の信号と前記分離行列とに基づいて、前記複数の信号から、少なくとも1つの音源により発生した音を示す信号を分離して出力する信号分離手段と、
    を備え、
    前記分離行列演算手段は、前記学習処理により求められた前記学習分離行列と、前記補間手段によって取得された前記補間分離行列とに基づいて、前記分離行列を生成することを特徴とする信号処理装置。
  2. (a) 異なる位置に設けられた観測装置で同時に観測された複数の観測音に対応し前記複数の観測音がフーリエ変換された複数の信号を取得する工程と、
    (b) ビームフォーミング演算手法によって音源方向を特定する工程と、
    (c) 前記複数の信号における周波数帯域を複数の分割帯域に分割するとともに、分割した前記複数の分割帯域を予め定められた分類規則に従って学習帯域群または補間帯域群に分類する工程と、
    (d) 前記学習帯域群に分類された分割帯域について学習分離行列を学習処理により演算する工程と、
    (e) 前記補間帯域群に分類された分割帯域について補間分離行列を取得する工程と、
    を備え、
    前記(b)工程で用いる前記ビームフォーミング演算手法は、前記観測装置間の距離と前記学習分離行列と前記音源方向との関係が規定されたビームフォーミング演算式に、予め求められている前記観測装置間の距離と、前記(d)工程により求められた前記学習分離行列とを当てはめることによって、前記音源方向を特定する手法であり、
    前記(e)工程では、前記(b)工程で特定された前記音源方向に基づいて前記補間分離行列を取得し、
    (f) 前記(d)工程で求められた前記学習分離行列および前記(e)工程で取得された前記補間分離行列に基づいて、前記複数の信号に対する分離行列を生成する工程と、
    (g) 前記複数の信号と前記分離行列とに基づいて、前記複数の信号から、少なくとも1つの音源により発生した音を示す信号を分離する工程と、
    を備えることを特徴とする信号処理方法
  3. コンピュータ読み取り可能なプログラムであって、前記プログラムの前記コンピュータによる実行は、前記コンピュータを、
    異なる位置に設けられた観測装置で同時に観測された複数の観測音に対応し前記複数の観測音がフーリエ変換された複数の信号を取得する信号取得手段と、
    前記複数の信号における周波数帯域を複数の分割帯域に分割するとともに、分割した前記複数の分割帯域を予め定められた分類規則に従って学習帯域群または補間帯域群に分類する帯域分類手段と、
    前記信号取得手段により取得された複数の信号に対する分離行列を生成する手段であって、前記学習帯域群における分離行列を学習分離行列として学習処理により求める分離行列演算手段と、
    前記観測装置間の距離と前記学習分離行列と音源方向との関係が規定されたビームフォーミング演算式に、予め求められている前記観測装置間の距離と、前記分離行列演算手段により求められた前記学習分離行列とを当てはめることによって、前記音源方向を特定する方向特定手段と、
    前記方向特定手段により特定された音源方向に基づいて、前記補間帯域群における補間分離行列を取得する補間手段と、
    前記複数の信号と前記分離行列とに基づいて、前記複数の信号から、少なくとも1つの音源により発生した音を示す信号を分離して出力する信号分離手段と、
    を備え、
    前記分離行列演算手段は、前記学習処理により求められた前記学習分離行列と、前記補間手段によって取得された前記補間分離行列とに基づいて、前記分離行列を生成する信号処理装置として機能させることを特徴とするプログラム
JP2006318487A 2006-11-27 2006-11-27 信号処理装置、信号処理方法およびプログラム Expired - Fee Related JP4849404B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006318487A JP4849404B2 (ja) 2006-11-27 2006-11-27 信号処理装置、信号処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006318487A JP4849404B2 (ja) 2006-11-27 2006-11-27 信号処理装置、信号処理方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2008134298A JP2008134298A (ja) 2008-06-12
JP2008134298A5 JP2008134298A5 (ja) 2010-02-25
JP4849404B2 true JP4849404B2 (ja) 2012-01-11

Family

ID=39559206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006318487A Expired - Fee Related JP4849404B2 (ja) 2006-11-27 2006-11-27 信号処理装置、信号処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4849404B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4859130B2 (ja) * 2007-03-27 2012-01-25 株式会社メガチップス 監視システム
JP6961545B2 (ja) * 2018-07-02 2021-11-05 株式会社東芝 音信号処理装置、音信号処理方法、およびプログラム
WO2023276068A1 (ja) * 2021-06-30 2023-01-05 日本電信電話株式会社 音響信号強調装置、音響信号強調方法、プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004027774D1 (de) * 2003-09-02 2010-07-29 Nippon Telegraph & Telephone Signaltrennverfahren, Signaltrenneinrichtung,und Signaltrennprogramm

Also Published As

Publication number Publication date
JP2008134298A (ja) 2008-06-12

Similar Documents

Publication Publication Date Title
US20210089967A1 (en) Data training in multi-sensor setups
US10924849B2 (en) Sound source separation device and method
JP5195979B2 (ja) 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム
EP3484184A1 (en) Acoustic field formation device, method, and program
JP4675177B2 (ja) 音源分離装置,音源分離プログラム及び音源分離方法
JP6807029B2 (ja) 音源分離装置および方法、並びにプログラム
JP5229053B2 (ja) 信号処理装置、および信号処理方法、並びにプログラム
EP2731359B1 (en) Audio processing device, method and program
KR101280253B1 (ko) 음원 분리 방법 및 그 장치
WO2015159731A1 (ja) 音場再現装置および方法、並びにプログラム
JP2016045221A (ja) 信号解析装置、方法、及びプログラム
JP4849404B2 (ja) 信号処理装置、信号処理方法およびプログラム
WO2020129231A1 (ja) 音源方向推定装置、音源方向推定方法、及び音源方向推定プログラム
JP5669036B2 (ja) 信号分離のためのパラメータ推定装置、信号分離装置、信号分離のためのパラメータ推定方法、信号分離方法、および、プログラム
WO2020250797A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5705190B2 (ja) 音響信号強調装置、音響信号強調方法、およびプログラム
JP5784075B2 (ja) 信号区間分類装置、信号区間分類方法、およびプログラム
JP2007033804A (ja) 音源分離装置,音源分離プログラム及び音源分離方法
US9495978B2 (en) Method and device for processing a sound signal
US11862141B2 (en) Signal processing device and signal processing method
KR101621718B1 (ko) 배음 구조 및 성김 구조 제약조건을 이용한 화성악기와 타악기 소리의 분리 방법
EP3860156A1 (en) Information processing device, method, and program
KR102345487B1 (ko) 이중 도메인을 이용한 음원 분리기의 훈련 방법, 음원 분리 방법 및 그 장치
JP2020038315A (ja) 音声情報処理装置および方法
Ibarrola et al. Blind speech dereverberation using convolutive nonnegative matrix factorization with mixed penalization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091113

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20091113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111011

R150 Certificate of patent or registration of utility model

Ref document number: 4849404

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees