JP2008306712A - 音源分離システム - Google Patents
音源分離システム Download PDFInfo
- Publication number
- JP2008306712A JP2008306712A JP2008133175A JP2008133175A JP2008306712A JP 2008306712 A JP2008306712 A JP 2008306712A JP 2008133175 A JP2008133175 A JP 2008133175A JP 2008133175 A JP2008133175 A JP 2008133175A JP 2008306712 A JP2008306712 A JP 2008306712A
- Authority
- JP
- Japan
- Prior art keywords
- cost function
- sound source
- separation matrix
- separation
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】コスト関数の次回値J(Wk+1)が今回値J(Wk)よりも最小値J(W0)に近づくように今回の分離行列Wkが次回の分離行列Wk+1に更新される処理が繰り返される。分離行列の更新量ΔWkはコスト関数の今回値J(Wk)が大きいほど多くなり、かつ、コスト関数の今回勾配∂J(Wk)/∂Wが急なほど少なくなるように調節される。そして、複数のマイクロホンMiのそれぞれからの入力信号xと最適分離行列W0とに基づき、収束速度および収束精度の向上を図りながら音源信号y(=W0・x)が高精度で分離されうる。
【選択図】 図4
Description
1.BSS(オフライン処理)
BSSの一般的手法は分離度を評価するコスト関数J(y)を最小化するyを求める処理として式(3)により記述される。
φ(y)=[φ(y1),φ(y2),‥,φ(yN)]T‥(9)
φ(yi)=−(∂/∂yi)Logp(yi) ‥(10)
適応BSSによれば、一般的に再起処理での期待値演算を省略して即時データが利用される。具体的にはE[yyH]をyyHに変換する。更新式は式(6)と同様であるが、反復回数「k」が時間の意味をも含む。オフライン処理では精度を高めるために小さいステップサイズで反復回数を多くすることができるが、適応処理でこの方法が採用されると適応時間が長くなってパフォーマンスの質が低下する。したがって、適応BSSのステップサイズパラメータμの調節はオフラインBSSよりも重要である。適応BSSにおけるDSSおよびICAのそれぞれによる行列J’は式(11)および(12)のそれぞれにより表わされる。ただし、ICAについては相関行列の非対角要素のみに着目した手法にしたがって自然勾配に基づく更新方法を利用する方法によって記述されている(非特許文献7参照)。
J’ICA(W)=[φ(y)yH−Diag[φ(y)yH]]W ‥(12)
幾何情報(マイクロホンおよび音源のそれぞれの位置)を利用してICAで起こるパーミュテーション問題およびスケーリング問題を解決する手法が提案されている(非特許文献8〜11参照)。GSSによれば、幾何制約の誤差と分離の誤差とを合成した値がコスト関数として用いられる。たとえば、コスト関数J(W)は幾何情報に基づく線形拘束の誤差JLC(W)と、分離系の誤差JSS(W)と、正規化係数λとに基づき、式(13)にしたがって定められる。
JLCNULL(W)=‖WD−I‖2 ‥(15)
L.Parra and C.Spence, Conductive blind source separation of non-stationary source, IEEE Trans. on Speech and Audio Proceeding, vol.8, no.3, 2000, pp.320-327 F.Asano, S.Ikeda, M.Ogawa, H.Asoh and N.Kitawaki, Combined Approach of Array Proceeding and Independent Component Analysis for Blind Separation of Acoustic Signals, IEEE Trans. on Speech and Audio Proceeding, vol.11, no.3, 2003, pp.204-215 M.Miyoshi and Y.Kaneda, Inverse Filtering of Room Acoustics, IEEE Trans. on Acoustic Speech and Signal Proceeding, vol.ASSP-36, no.2, 1988, pp.145-152 H.Nakajima, M.Miyoshi and M.Tohyama, Sound field control by Indefinite MINT Filters, IEICE Trans., Fundamentals, vol.E-80A, no.5, 1997, pp.821-824 S.Ikeda and M.Murata, A method of ICA in time-frequencydomain, Proc.Workshop Indep. Compom. Anal. Signal. 1999, pp.365-370 D.H.Brandwood, B.A, A complex gradient operator and itsapplication in adaptive array theory, Proc. IEE Proc., vol.130, Pts. Fand H, No.1, 1983, pp.11-16 S.Amari, Natural gradient works efficiently in learning, newral Compt., vol.10, 1988, pp.251-276 L.Parra and C.Alvino, Gepmetric Source Separation: Merging Convultive Source Separation with Geometric Beamforming, IEEE Trans. on Speech and Audio Proceeding, vol.10, no.6, 2002, pp.352-362 R.Mukai, H.Sawada, S.Araki and S.Makino, Blind Source Separation of many signals in the frequency domain, in Proc. of ICASSP2006, vol.V, 2006, pp.969-972 H. Saruwatari, T.Kawamura, T.Nishikawa, A.Lee and K.Shikano, Blind Source Separation Based on a Fast Convergence Algorithm Combining ICA and Beamforming, IEEE Trans. on Speech and Audio Proceeding, vol.14, no.2, 2006, pp.666-678 M.Knaak, S.Araki snd S.Makino, Geometrically ConstrainedIndependent Component Analysis, IEEE Trans. on Speech and Audio Proceeding, vol.15, no.2, 2007, pp.715-726 J.Valin, J.Rouat and F.Michaud, Enhanced Robot Audition Based on Microphone Array Source Separation with Post-Filter, Proc. of 2004 IEE/RSJ IROS, 2004, pp.2123-2128
MA[A,B]≡Re[Σijaijbij] ‥(16)
1.適応ステップサイズDSS(DSS−AS)
本手法をDSSに適用したアルゴリズムは式(101)〜(105)により定義される。
E=yyH−Diag[yyH] ‥(102),
J’=2EWkxxH‥(103),
μ=‖E‖2/2‖J’‖2 ‥(104),
Wk+1=Wk−μJ’‥(105)
本手法をICAに適用したアルゴリズムは式(201)〜(208)により定義される。
E=φ(y)yH−Diag[φ(y)yH] ‥(202),
JICA’=EWk ‥(203),
J’=[Eφ~(y)xH]* ‥(204),
φ~(y)=[φ~(y1),φ~(y2),‥,φ~(yN)]T‥(205)
φ~(yi)=φ(yi)+yi(∂φ(yi)/∂yi) ‥(206)
μ=‖E‖2/2MA[J’,JICA’] ‥(207),
Wk+1=Wk−μJ’‥(208)
本手法を高次DSSに適用したアルゴリズムは式(301)〜(305)により定義される。
E=φ(y)yH−Diag[φ(y)yH] ‥(302),
J’=[Eφ~(y)xH]* ‥(303),
μ=‖E‖2/2‖J’‖2 ‥(304),
Wk+1=Wk−μJ’‥(306)
本手法をGSSに適用したアルゴリズムは式(401)〜(408)により定義される。
Ess=yyH−Diag[yyH] ‥(402),
Jss’=2EssWtxxH ‥(403),
μss=‖Ess‖2/2‖Jss’‖2 ‥(404),
ELC=WD−I ‥(405),
JLC’=ELCDH ‥(406),
μLC=‖ELC‖2/2‖JLC’‖2 ‥(407),
Wk+1=Wk−μLCJLC’−μssJss’ ‥(408)
本手法をGICAに適用したアルゴリズムは式(501)〜(509)により定義される。
EICA=φ(y)yH−Diag[φ(y)yH] ‥(502),
JICA’=EICAWt ‥(503),
J’=[EICAφ~(y)xH]* ‥(504),
μICA=‖EICA‖2/2MA‖J’,JICA’‖2 ‥(505),
ELC=WD−I ‥(506),
JLC’=ELCDH ‥(507),
μLC=‖ELC‖2/2‖JLC’‖2 ‥(508),
Wk+1=Wk−μLCJLC’−μICAJICA’ ‥(509)
本手法をGHDSSに適用したアルゴリズムは、GSS−ASを定義する式(401)〜(408)のうち式(402)で表わされるコスト関数Essを、GICA−ASを定義する式(502)で表わされるコスト関数EICAに置き換えることにより定義される。
=10Log10[(1/T)Σt=1-T|y(t)|2/|n#(t)|2],
n#≡y−s# ‥(19)
=10Log10[(1/F)Σf=1-FCCω(2πf)],
CCω(ω)≡|Σt=1-Ty1*(t)・y2(t)|/(Y1(ω)Y2(ω)),
Y1(ω)≡(Σt=1-T|y1(ω,t)|2)1/2,
Y2(ω)≡(Σt=1-T|y2(ω,t)|2)1/2 ‥(20)
WNULL=D+(=[DHD]-1DH) ‥(23)
Claims (1)
- 複数のマイクロホンを備え、前記複数のマイクロホンのそれぞれからの入力信号に基づいて複数の音源信号を分離する音源分離システムであって、
前記入力信号および前記音源信号の相関関係を表わす分離行列により定義され、かつ、前記音源信号の分離度を評価するためのコスト関数を認識する第1処理要素と、
前記第1処理要素により認識された前記コスト関数の次回値が今回値よりも最小値に近づくように今回の前記分離行列を更新することによって次回の前記分離行列を決定する処理を繰り返すことにより、前記コスト関数が最小値となるときの前記分離行列を最適分離行列として認識するとともに、前記分離行列の今回値から次回値への更新量を、前記コスト関数の今回値が大きいほど多くなる一方、前記コスト関数の今回勾配が急であるほど少なくなるように調節する第2処理要素とを備えていることを特徴とする音源分離システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/133,691 US8131542B2 (en) | 2007-06-08 | 2008-06-05 | Sound source separation system which converges a separation matrix using a dynamic update amount based on a cost function |
DE602008000475T DE602008000475D1 (de) | 2007-06-08 | 2008-06-09 | Schallquellentrennsystem |
EP08251991A EP2012307B1 (en) | 2007-06-08 | 2008-06-09 | Sound source separation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US94279907P | 2007-06-08 | 2007-06-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008306712A true JP2008306712A (ja) | 2008-12-18 |
JP4444345B2 JP4444345B2 (ja) | 2010-03-31 |
Family
ID=40234971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008133175A Active JP4444345B2 (ja) | 2007-06-08 | 2008-05-21 | 音源分離システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4444345B2 (ja) |
DE (1) | DE602008000475D1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010282193A (ja) * | 2009-06-04 | 2010-12-16 | Honda Motor Co Ltd | 残響抑圧装置、及び残響抑圧方法 |
JP2012042953A (ja) * | 2010-08-17 | 2012-03-01 | Honda Motor Co Ltd | 音源分離装置及び音源分離方法 |
CN111435598A (zh) * | 2019-01-15 | 2020-07-21 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、计算机可读介质及电子设备 |
JPWO2021161437A1 (ja) * | 2020-02-13 | 2021-08-19 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7248478B2 (ja) | 2019-03-28 | 2023-03-29 | 本田技研工業株式会社 | 車両制御装置、端末装置、サーバ装置、車両、車両制御システム及び車両制御方法 |
-
2008
- 2008-05-21 JP JP2008133175A patent/JP4444345B2/ja active Active
- 2008-06-09 DE DE602008000475T patent/DE602008000475D1/de active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010282193A (ja) * | 2009-06-04 | 2010-12-16 | Honda Motor Co Ltd | 残響抑圧装置、及び残響抑圧方法 |
US8391505B2 (en) | 2009-06-04 | 2013-03-05 | Honda Motor Co., Ltd. | Reverberation suppressing apparatus and reverberation suppressing method |
JP2012042953A (ja) * | 2010-08-17 | 2012-03-01 | Honda Motor Co Ltd | 音源分離装置及び音源分離方法 |
CN111435598A (zh) * | 2019-01-15 | 2020-07-21 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、计算机可读介质及电子设备 |
CN111435598B (zh) * | 2019-01-15 | 2023-08-18 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、计算机可读介质及电子设备 |
JPWO2021161437A1 (ja) * | 2020-02-13 | 2021-08-19 | ||
WO2021161437A1 (ja) * | 2020-02-13 | 2021-08-19 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、およびプログラム |
JP7420153B2 (ja) | 2020-02-13 | 2024-01-23 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4444345B2 (ja) | 2010-03-31 |
DE602008000475D1 (de) | 2010-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8131542B2 (en) | Sound source separation system which converges a separation matrix using a dynamic update amount based on a cost function | |
US9668066B1 (en) | Blind source separation systems | |
US8898056B2 (en) | System and method for generating a separated signal by reordering frequency components | |
Tan et al. | Nonlinear blind source separation using higher order statistics and a genetic algorithm | |
KR101197407B1 (ko) | 음성 신호 분리 장치 및 방법 | |
JP4444345B2 (ja) | 音源分離システム | |
JP4406428B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 | |
JP6434657B2 (ja) | 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム | |
US8867755B2 (en) | Sound source separation apparatus and sound source separation method | |
US11894010B2 (en) | Signal processing apparatus, signal processing method, and program | |
JP6005443B2 (ja) | 信号処理装置、方法及びプログラム | |
JPH08106295A (ja) | パターン認識方法及び装置 | |
JP2004536330A5 (ja) | ||
EP2023343A1 (en) | Sound-source separation system | |
JP2011215317A (ja) | 信号処理装置、および信号処理方法、並びにプログラム | |
JP2012042465A (ja) | 音源方向推定装置及び音源方向推定方法 | |
Nakajima et al. | Adaptive step-size parameter control for real-world blind source separation | |
JP7131424B2 (ja) | 信号処理装置、学習装置、信号処理方法、学習方法及びプログラム | |
JP6538624B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP6448567B2 (ja) | 音響信号解析装置、音響信号解析方法、及びプログラム | |
JP4738284B2 (ja) | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 | |
Shahnawazuddin et al. | Sparse coding over redundant dictionaries for fast adaptation of speech recognition system | |
Nakajima et al. | Correlation matrix estimation by an optimally controlled recursive average method and its application to blind source separation | |
JP5224950B2 (ja) | 信号処理装置 | |
JP5807914B2 (ja) | 音響信号解析装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091028 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20091028 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20091216 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4444345 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140122 Year of fee payment: 4 |