JP2007248975A - パーミュテーションフリー・ブラインド音源分離方法および装置 - Google Patents

パーミュテーションフリー・ブラインド音源分離方法および装置 Download PDF

Info

Publication number
JP2007248975A
JP2007248975A JP2006074423A JP2006074423A JP2007248975A JP 2007248975 A JP2007248975 A JP 2007248975A JP 2006074423 A JP2006074423 A JP 2006074423A JP 2006074423 A JP2006074423 A JP 2006074423A JP 2007248975 A JP2007248975 A JP 2007248975A
Authority
JP
Japan
Prior art keywords
frequency
signal
time
sound
permutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006074423A
Other languages
English (en)
Inventor
Persia Leandro Ezequiel Di
レアンドロ・エセキエル・ディ・ペルシア
Diego Milone
ディエゴ・ミローネ
Masuzo Yanagida
益造 柳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NACIONAL DE ENTRE RIOS, University of
NACIONAL DEL LITORAL, University of
Doshisha Co Ltd
Original Assignee
NACIONAL DE ENTRE RIOS, University of
NACIONAL DEL LITORAL, University of
Doshisha Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NACIONAL DE ENTRE RIOS, University of, NACIONAL DEL LITORAL, University of, Doshisha Co Ltd filed Critical NACIONAL DE ENTRE RIOS, University of
Priority to JP2006074423A priority Critical patent/JP2007248975A/ja
Publication of JP2007248975A publication Critical patent/JP2007248975A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】パーミュテーション問題が起きないような周波数領域BSS手法を提案する。
【解決手段】複数の音源から出力された音声を複数の受音装置で受音して目的の音声を抽出する場合、まず、音源から信号を取り出し、この取り出された時間領域の信号を分析フレーム毎に周波数領域の信号に変換する。次に、全分析フレームにおける周波数スペクトルから、各周波数ビン毎の周波数のフーリエ変換の時間変化を読み取り、各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結する。その後、この連結された周波数信号を各音源における周波数領域の信号に分離する。そして、分離された周波数領域での信号を時間領域の信号に戻し、この時間領域の信号を出力する
【選択図】図5

Description

本発明は、ブラインド分離手法を用いた音声分離方法においてパーミュテーション問題を考慮する必要のない手法に関するものである。
現在の音声認識システムは、マイクに接近した位置からの音声に対してはそれなりに高い認識精度を有する一方で、マイクから離れた位置からの音声に対しては、周囲の雑音や部屋の残響の影響を受けて認識率は著しく低下してしまう(非特許文献1)。実環境で音声認識を行うためには音声認識システムそのものの認識能力の向上とともに、それに入力される音声に対して何らか処理を行って認識しやすい形にしておくことが有効であると考えられる。その方法の一つがブラインド音源分離(BSS: Blind Source Separation)である。BSSとは、複数のマイクロホンへ線形に混合された信号が入力された時に、音源信号や混合過程を知ることなく、観測信号のみから音源信号を推定し分離する技術である。マイクロホン数をM、音源数をNとすると、マイクロホンMmでの観測信号は、
Figure 2007248975
と表される。数1において、観測可能な要素はxmだけで、hmnとsnは未知である。BSSはこの状況において、hmnとsnを推定する問題である。しかし、時間領域のBSSでは、計算量が膨大になり、現実的な処理時間で分離フィルタを計算するのが困難であることが指摘されている。
そこで、一般に、このフィルタを直接求めずにその周波数特性を求める周波数領域BSSを用いることが多い。マイクロホン数M、音源数Nの混合モデルを求めるために、数1の両辺をフーリエ変換すると、Xm(f)=ΣnHmn(f)Sn(f)と表される。Xm(f)、Hmn(f)、Sn(f) は、それぞれ xm(t)、hmn(t)、sn(t) のフーリエ変換である。そして、m=1〜Mについてまとめると、周波数領域BSSの混合モデルは、
Figure 2007248975
と表される。ただし、X(f)=(X1(f),…,XM(f))Tは観測ベクトル、S(f)=(S1(f) ,…,SN(f))Tは音源信号ベクトルそして、H(f)は混合行列である。fは周波数である。
BSSを解く手法として、各音源信号の独立性仮定したICAが一般的に用いられる。ICAには時間領域の方法と周波数領域の方法がある。周波数領域ICAは、畳み込みを瞬時混合の問題に置き換えて解くことができるため、現在、実環境で使える手法として盛んに用いられている。
周波数領域ICAは、xmの短時間フーリエ変換により得られた観測信号ベクトルX(f)に対して、各周波数ビンにおいて学習されたW(f)を用いて分離を行う。ここで、Y(f)=(Y1(f) ,…,YN(f))Tを分離信号ベクトルとすると分離過程は、
Figure 2007248975
と表される。
ICAは音源信号の独立性を最大にするという基準に基づいて分離を行っており、W(f)の行が入れ替わったとしてもY(f)の独立性は保たれるので、任意の周波数f1とf2において、Yn(f1)とY(f2)が必ずしも同じ音源に対応しているとは限らない。従って、W(f)の行の並びをYn(f1)とYn(f2)が同じ音源に属するように並べ替える「パーミュテーション問題」を解決する必要がある。
パーミュテーション問題に対する従来の解決手法として、各周波数ビンでの指向特性を調べ、雑音源の方向を推定し、方向推定結果を基に並び替えを行う方法がある(非特許文献5)。しかし、すべての周波数において理想的なビームあるいは死角が形成できるわけではなく、特に低周波数における方向推定性能が低いと指摘されている。
そこで、パーミュテーション問題への対処法として各周波数ビンでの相関を用いた方法(非特許文献2)が提案されている。各周波数ビンのエンベロープは、同じ音源については、特に近傍の周波数で高い相関を持つと考えるのが妥当である。そのため、周波数差が比較的小さい範囲内で相関の和が最大になるように決定していくことが考えられるが、ある周波数で間違えると以降の周波数でも間違えてしまうため、安定性に欠けるといわれている。また、ICAによる分離性能が比較的良いと思われる周波数ビンからパーミュテーションを決定していく方法が提案されている(非特許文献2)が、この方法では、離れた周波数に対してもエンベロープの相関が高いことが仮定されているため適切ではない。
上述の欠点を補うために、方向推定と相関を統合した手法が提案されている(非特許文献6)。この方法では、まず指向特性を各周波数ビンに対して求め、確実に推定できる周波数に対してパーミュテーション問題を解決する。次に、未定の周波数に対して周波数差が小さく、かつパーミュテーションが決定されている周波数との相関の和が最大になるように決定していく。しかし、この方法でも残響が強い場合に不安定になることが報告されている(非特許文献7)。
残響が強い場合に不安定になる原因として、低域での方向推定の困難さが挙げられている(非特許文献7)。そして、この問題を解決するために、調波構造を用いた方法が提案されている(非特許文献7)。音声は基本周波数の整数倍のところで相関が高くなる性質を持っており、調波性を用いることにより、より確実にパーミュテーション問題を解決することが可能となる。
中村哲:" 実音響環境に頑健な音声認識を目指して", 電子情報通信学会技術報告, SP2002-12, pp.31-36,2002. T.W.Lee: "Independent Component Analysis",Kluewer, 1998. S.Ikeda, and N.Murata: "A method of ICA in time-frequency domain", Proc WS on Independent Component Analysis and Blind Signal Separation (ICA’99), pp.365-371, Aussios, France, Jan., 1999. A.Hyvarinen, J.Karhunen, and E.Oja: "Independent Component Analysis", John Wiley, New York, 2001. S. Kurita, H. Saruwatari, S. Kajita, K. Takeda, and F. Itakura: "Evaluation of blind signal separation method using directivity pattern under reverberant conditions", Proc. ICASSP2000, pp3140-3143, Istanbul, Turkey, June, 2000. 澤田宏,向井良,荒木章子,牧野昭二, "周波数領域ブラインド音源分離におけるpermutation問題の解法",音響学会講演論文集,pp. 541-542,Sep, 2002. 澤田宏,向井良,荒木章子,牧野昭二, "周波数領域ブラインド音源分離におけるpermutation問題の頑健な解法",音響学会講演論文集,pp. 777-778,Mar, 2003.
しかし、これらの方法によっても本質的に並べ替えに失敗する可能性があり、パーミュテーション問題は解決されない。
そこで、本発明は上記課題に着目してなされたもので、パーミュテーション問題を考慮する必要のないパーミュテーションフリー・ブラインド音源分離手法を提案することを目的とする。
すなわち、本発明は上記課題を解決するために、複数の音源から出力された音声を複数のマイクで受音して目的の音声を抽出する場合、まず、音源から信号を取り出し、この取り出された時間領域の信号を分析フレーム毎に周波数領域の信号に変換する。次に、全分析フレームにおける周波数スペクトルから、各周波数ビン毎の周波数のフーリエ変換の時間変化を読み取り、各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結した後、この連結された周波数信号を各音源における周波数領域の信号に分離する。そして、分離された周波数領域での信号を時間領域の信号に戻し、この時間領域の信号を出力する。
すなわち、従来の周波数領域BBSでは、受音した時間領域の信号を分析フレーム毎にフーリエ変換して並べ(図3)、これを各周波数ビン毎の周波数のフーリエ変換の時間変化ごとに読み出して(図4)、それぞれの分離行列を用いて分離していたが、この手法では、各周波数ビン毎に異なる値の分離行列を用いていたため、各分離された信号が音源1の信号なのか音源2の信号なのかを判別することができない。このため、組み合わせに自由度ができてしまい、いわゆるパーミュテーション問題を生じてしまう。さらに、学習された分離行列を用いて分離を行う場合、標本点の数が多ければ多いほど学習能力が高くなって分離精度がよくなるが、従来の方法であれば分析フレームの長さ分だけしか標本点を取ることができないため、分離の精度がよくならない。加えて、従来の手法では、周波数ビン毎に異なる値の分離行列を用いていたため、分離された信号の振幅に不確実性を生じてしまい、これを修正しなければならなくなる。これに対して、本発明によれば、図4や図5に示すように、各周波数ビン毎の周波数のフーリエ変換の時間変化を全周波数標本点について連結した後、一括して分離行列を用いて分離するようにしたので、組み合わせの自由度におけるパーミュテーションを考える必要がなくなる。また、連結された多くの標本点に基づいて一括した分離処理を行うので、分離精度もよくなる。加えて、一括した分離処理により、従来のように振幅における不確実性もなくなる。
本発明によれば、各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結した後、一括して分離処理を行うようにしたので、パーミュテーション問題を考える必要がなくなり、また、多くの標本点に基づく処理を行うので分離精度もよくなる。加えて、一括した分離処理を行うので、従来のように振幅における不確実性もなくなる。
以下、本発明の一実施の形態について図面を参照して説明する。図1は、周波数領域BBS手法を用いた装置の機能ブロック図を示したものである。以下では、音源として2つの音源S1と音源S2を用い、集音装置として2つのマイクM1、M2を設けた場合を例とする。ここで、音源の種類としては、人間の声などのような可聴周波数領域の音波を出力する音源を用いる。また、マイクの数は音源の数以上であればよく、3個以上のマイクを設けるようにしてもよい。
図1の機能ブロックについて説明すると、まず、受音装置1はマイクやマイクロホンアレイなどの装置によって構成され、好ましくは、全周波数に対して最適な指向特性を持つビームフォーマーを用いる。そして、図1に示す2つのビームフォーマーを求め、音源と雑音方向の推定を行う。このビームフォーマーを求めるために、図4や図5の関係を用いる。図4および図5については後述する。
この受音装置1によって受音された信号は、まず、時間領域の信号として記憶部に格納される。そして、この信号を周波数領域変換部2にて周波数領域の信号に変換し、同様に記憶部に格納していく。時間領域の信号を周波数領域の信号に変換する場合、分析フレームをずらしながらその分析フレーム内において短時間フーリエ変換(STFT)を行う。ここでは分析フレームの個数をm個としている。これにより、図3や図4に示すように、周波数−時間−スペクトルからなる3次元空間内における離散的な信号が得られる。このうち時間軸方向については、m個の分析フレームに基づく離散的な信号が存在し、また、周波数軸方向については、n個の離散的な信号が存在している。なお、図3と図4は同じ空間を示しており、図3は時間軸に切った信号を示しており、また、図4はある周波数で切った信号を示している。
読取部3は、この記憶部に格納されている周波数−時間−スペクトル空間の信号から、各周波数ビン毎の周波数のフーリエ変換の時間変化を読み取る。すなわち、周波数領域変換部2によって分析フレーム毎に図3のようにマッピングされた信号を、今度は、図4に示すような周波数軸の標本点毎に信号として抽出する。
そして、本提案手法においては特徴的に、図5に示すように、読み取られた各周波数ビン毎の周波数のフーリエ変換の時間変化を強制的に連結し、一つの連続した信号とする。連結に際しては、低周波数ビンから順に高周波数ビンに連続して連結するが、この順序に限定されるものではない。このとき、連結された信号は、周波数f1におけるスペクトルの時間変化t=t1〜tmの信号の後に、周波数f2におけるスペクトルの時間変化t=t1〜tmの信号が連結される。以下、同様にすべての周波数標本点におけるスペクトルの時間変化t=t1〜tmの信号を連結する。
一括分離部4は、連結された周波数信号を、各音源の周波数領域の信号に分離する。この分離手法としては、JADEやFAST ICAなどの手法が存在するが、JADEを用いた場合について説明する。
JADEとは、Cardosoらにより提案された手法で、4次クロスキュムラントを対角化する手法である。4次クロスキュムラントは次のように定義される。
Figure 2007248975
観測信号xが平均0で無相関化したものをzとし、音源信号sと無相関化された観測信号zはある直交行列U = (u1,…,uN)により、
Figure 2007248975
という関係で結ばれている。独立性の仮定から、
Figure 2007248975
となる。ここで、N×N行列M=(mij)により縮約されたkurtosisの行列の第i, j要素は
Figure 2007248975
を考える。sのインデックスが全て同じ時だけが問題であるから、κi = cum(si, si, si, si)として数7を変形すると
Figure 2007248975
となる。ここで
Figure 2007248975
とすると、
Figure 2007248975
直交行列であるWで対角行列を挟んでいるので、C(M)は対称行列になっている。このC(M)を対角化するWを探すのがJADEである。行列の対角化にはJacobi法を用いることができる。Jacobi法は理想的には2次収束することが知られているので、JADEは収束の速いアルゴリズムといえる。ただし、JADEは4次元配列を用いるので、信号数があまり多くない時には問題がないが、信号数が多い時には計算上の問題がある。
周波数上でICAを行う場合は、各周波数ビンに対して分離行列W(f)を求める必要があり、通常はここで、パーミュテーションが問題となる。しかし、提案法では、分離行列を求めるのは1度でよいので、パーミュテーションが問題にならない。
分割部5は、一括分離部4によって分離された信号を周波数ビン毎の周波数のフーリエ変換の時間変化に戻す。すなわち、この分割においては、連結部によって連結された順序と逆の順序で周波数ビン毎の信号に分割する。そして、時間領域変換部6にて各周波数ビン毎に短時間フーリエ逆変換を行い、時間領域の信号に戻す。この時間信号に戻された信号は、各音源毎に分離された信号として音声出力部7を介して出力される。
次に、このように構成された周波数領域BBS手法を用いた処理のフローチャートについて図6を用いて説明する。
まず、複数の音源から出力された信号を複数の受音装置1で受音する(ステップS1)。この受音された信号は、時間領域の波形として記憶部に一時記憶される。そして、周波数領域変換部2により、分析フレーム毎に短時間フーリエ変換を行い(ステップS2)、すべての分析フレームについて短時間フーリエ変換を行うまでこの処理を続ける(ステップS3)。このとき、図3に示すように、周波数−時間−スペクトルの3次元空間内において分析フレーム分(m個)の離散的な信号がマッピングされる。次に、このマッピングされた信号を、図4に示すように、各周波数ビン毎の周波数のフーリエ変換の時間変化として読み出し(ステップS4)、各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結する(ステップS5)。その後、この連結された周波数信号を各音源毎にJADEを用いて一括して分離し(ステップS6)、その分離された周波数領域での信号を各周波数ビンへの信号へ分割する(ステップS7)。そして、時間領域変換部6にて短時間フーリエ逆変換して時間領域の信号に戻し(ステップS8)、この時間領域の信号を音声出力する(ステップS9)。
上述のように本実施の形態によれば、各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結した後、分離行列を用いて一括して分離処理を行うようにしたので、パーミュテーション問題を考える必要がなくなり、また、多くの標本点に基づいて分離処理を行うようにしたので分離精度も向上させることができる。加えて、一括した分離処理を行うので、従来のように振幅における不確実性もなくなる。
以下に、上記実施の形態を用いたシステムの評価結果について説明する。
1.評価データ
音声の収録は一般家庭のリビングルームを想定した部屋で行った。TSPにより測定した残響時間は310msである。音源(スピーカ)と観測点(マイクロホン)の配置を図7に示す。観測点は固定し、音源の配置は図中のθ=-30°,0 °(時計回りを正)となるようにし、それぞれの配置をL,Mとする。マイクロホンには素子間隔5cm の2素子アレイを用いた。音源信号は、男女各1名ずつで、女性(配置:M)による10フレーズ、男性(配置:L)による10フレーズの組み合わせで、合計100個の混合音声について考える。女性および男性の音声を個別に収録し、S/Nの調整を行うことなくそのまま加算した。
2.評価指標
S/N を用いて分離信号を評価する。S/N は以下のように定義した。
Figure 2007248975
3.評価対象
比較対象のアルゴリズムは、JADE法によって周波数領域ICAを行い、パーミュテーションに関しては、周波数ビン間の相関を用いるIkeda et al.(非特許文献2)の手法である。
4.評価結果
評価は、比較対象のアルゴリズムでパーミュテーション問題の解決ができない例に対して、提案法では解決できていることを、スペクトログラムをスペクトル上での比較によって行う。音響分析条件を表1に示す。
Figure 2007248975
図8は、a)混合前の女性音声、b)混合前の男性音声、c)従来ICAによる分離信号1(女性)、d)従来ICAによる分離信号2(男性)、e)提案法による分離信号1(女性)そしてf)提案法による分離信号2(男性)のスペクトログラムを示している。図8のc)とd)において、特に4kHz以上の領域でパーミュテーションの解決に失敗していることがわかる。しかし、図8のe)とf)ではパーミュテーションの問題が起きていないことが確認できる。
次に、パーミュテーション問題が解決できたことによりS/Nがどの程度向上するのかを、セグメンタルSNRによって評価する。
図9と10を比較すると、女性音声側のセグメンタルSNRの平均値で約0.65dB改善し、男性音声側のセグメンタルSNRの平均値では提案法により約5.9dBの改善が確認できた。これにより、パーミュテーション問題を回避することによって解決することが分離性能の向上につながるということがわかる。
さらに図11に分離結果100個についてのセグメンタルSNRの平均値の比較を示す。図11より、SNRはデータにより大きくばらついているが、女性については約1.7dBの改善、男性については平均値の改善についてはほぼ0であるが、標準偏差が小さくなっていることがわかる。図11からもパーミュテーション回避によるS/Nの改善が確認できた。
本発明の一実施の形態におけるパーミュテーションフリー・ブラインド音源分離装置の機能ブロック図 同形態において推定すべき指向特性を示す図 同形態における分析フレーム区間毎にSTFTした値をマッピングした図 図3における信号を各周波数ビン毎にみた図 従来の周波数領域ICAと本実施の形態における対応関係を示す図 同形態における処理のフローチャートを示す図 本発明の実施例におけるデータ収録環境を示す図 同実施例におけるパーミュテーション問題解決の例 同実施例における女性音声のセグメンタルSNRの比較を示す図 同実施例における男性音声のセグメンタルSNRの比較を示す図 同実施例における全分離結果のセグメンタルSNRの平均値の比較を示す図
符号の説明
1・・・受音装置
2・・・周波数領域変換部
3・・・読取部
4・・・一括分離部
5・・・分割部
6・・・時間領域変換部
7・・・音声出力部

Claims (2)

  1. 複数の音源から出力された音声を複数の受音装置で受音し、目的の音声を抽出するパーミュテーションフリー・ブラインド音源分離方法において、
    受音された時間領域の信号を分析フレーム毎に周波数領域の信号に変換するステップと、
    全分析フレームにおける周波数スペクトルから、各周波数ビン毎の周波数のフーリエ変換の時間変化を読み取るステップと、
    各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結するステップと、
    連結された周波数信号を、各音源における周波数領域の信号に分離するステップと、
    分離された周波数領域の信号を時間領域の信号に戻すステップと、
    時間領域の信号に戻された信号を出力するステップとを備えたことを特徴とするパーミュテーションフリー・ブラインド音源分離方法。
  2. 複数の音源から出力された音声を複数の受音装置で受音し、目的の音声を抽出するパーミュテーションフリー・ブラインド音源分離装置において、
    受音装置で受音した時間領域の信号を分析フレーム毎に周波数領域の信号に変換する周波数領域変換部と、
    全分析フレームにおける周波数スペクトルから、各周波数ビン毎の周波数のフーリエ変換の時間変化を読み取る読取部と、
    各周波数でのフーリエ変換の値の時間変化を全周波数標本点について連結する連結部と、
    連結された周波数信号を、各音源における周波数領域の信号に分離する分離部と、
    分離された周波数領域での信号を時間領域の信号に戻す時間領域変換部とを備え、当該時間領域変換部によって変換された信号を出力するようにしたことを特徴とするパーミュテーションフリー・ブラインド音源分離装置。
JP2006074423A 2006-03-17 2006-03-17 パーミュテーションフリー・ブラインド音源分離方法および装置 Pending JP2007248975A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006074423A JP2007248975A (ja) 2006-03-17 2006-03-17 パーミュテーションフリー・ブラインド音源分離方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006074423A JP2007248975A (ja) 2006-03-17 2006-03-17 パーミュテーションフリー・ブラインド音源分離方法および装置

Publications (1)

Publication Number Publication Date
JP2007248975A true JP2007248975A (ja) 2007-09-27

Family

ID=38593318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006074423A Pending JP2007248975A (ja) 2006-03-17 2006-03-17 パーミュテーションフリー・ブラインド音源分離方法および装置

Country Status (1)

Country Link
JP (1) JP2007248975A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008132746A (ja) * 2006-10-31 2008-06-12 Nippon Zeon Co Ltd 積層フィルム、反射防止フィルム、偏光板、および液晶表示装置
CN114172766A (zh) * 2021-12-06 2022-03-11 东莞理工学院城市学院 信号分离方法、装置、电子设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008132746A (ja) * 2006-10-31 2008-06-12 Nippon Zeon Co Ltd 積層フィルム、反射防止フィルム、偏光板、および液晶表示装置
CN114172766A (zh) * 2021-12-06 2022-03-11 东莞理工学院城市学院 信号分离方法、装置、电子设备及介质
CN114172766B (zh) * 2021-12-06 2023-06-30 东莞理工学院城市学院 信号分离方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN112447191B (zh) 信号处理装置以及信号处理方法
US8848933B2 (en) Signal enhancement device, method thereof, program, and recording medium
US9668066B1 (en) Blind source separation systems
US7647209B2 (en) Signal separating apparatus, signal separating method, signal separating program and recording medium
Pedersen et al. Convolutive blind source separation methods
US8874439B2 (en) Systems and methods for blind source signal separation
US11282505B2 (en) Acoustic signal processing with neural network using amplitude, phase, and frequency
JP5127754B2 (ja) 信号処理装置
Schädler et al. Separable spectro-temporal Gabor filter bank features: Reducing the complexity of robust features for automatic speech recognition
US8244547B2 (en) Signal bandwidth extension apparatus
JP2012234150A (ja) 音信号処理装置、および音信号処理方法、並びにプログラム
JP2011215317A (ja) 信号処理装置、および信号処理方法、並びにプログラム
JP2014219467A (ja) 音信号処理装置、および音信号処理方法、並びにプログラム
JP6622159B2 (ja) 信号処理システム、信号処理方法およびプログラム
JP4403436B2 (ja) 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム
JP6345327B1 (ja) 音声抽出装置、音声抽出方法および音声抽出プログラム
EP3847645B1 (en) Determining a room response of a desired source in a reverberant environment
JP5443547B2 (ja) 信号処理装置
Poorjam et al. A parametric approach for classification of distortions in pathological voices
KR20190073852A (ko) 우도 최대화를 이용한 빔포밍 방법
JP2007248975A (ja) パーミュテーションフリー・ブラインド音源分離方法および装置
KR101658001B1 (ko) 강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법
JP2008026625A (ja) マルチビン独立成分分析およびそれを用いたブラインド音源分離装置
Bai et al. Acoustic source localization and deconvolution-based separation
Ono et al. Blind source separation with distributed microphone pairs using permutation correction by intra-pair TDOA clustering