JP4977100B2 - 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 - Google Patents
残響除去装置、残響除去方法、そのプログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4977100B2 JP4977100B2 JP2008206784A JP2008206784A JP4977100B2 JP 4977100 B2 JP4977100 B2 JP 4977100B2 JP 2008206784 A JP2008206784 A JP 2008206784A JP 2008206784 A JP2008206784 A JP 2008206784A JP 4977100 B2 JP4977100 B2 JP 4977100B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- frequency domain
- sound source
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
Tomohiro Nakatani et al. "BLIND SPEECH DEREVERBERATION WITH MULTI-CHANNEL LINEAR PREDICTION BASED ON SHORT TIME FOURIER TRANSFORM REPRESENTATION ", IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP-2008), 2008, p.85-88
図1に本発明の残響処理装置200の機能構成例を、図2にその処理フローを示す。残響処理装置200は、周波数分割処理部110、ブロック分割部220、AR係数事前PDF記憶部230、音源信号事前PDF推定部240、AR係数事後PDF推定部250、AR係数事後PDF記憶部260、残響事後PDF推定部270、残響除去部280及び周波数統合処理部190から構成される。
なお、式(20)のvdτ,kと式(21)のDτ,kは、それぞれ以下の更新式を用いてブロックごとに逐次的に推定することもできる。
周波数領域観測信号xt,k (m)に含まれる残響成分rt,kは式(4)のところで説明した通り、rt,k = vck H・vxt-d,kと表現されることから、p(vck|ξτ,k)が式(17)〜(21)のように与えられると、残響事後PDF p(rt,k|ξτ,k)は、以下のように推定することができる。
音源信号事後PDF p(st,k|ξτ,k)は、AR係数事後PDFp(vck|ξτ,k)を用いて、以下のように求めてもよい。
事前に、AR係数事前PDF記憶部230に、上述した方法により予め用意した、すべての周波数ビンについてのAR係数事前PDFの期待値μk、共分散行列Σkを記憶させておく。また、AR係数事後PDF記憶部260に、AR係数事後PDFの期待値及び共分散行列の初期値をそれぞれevck=μk、Ck=Σkとして記憶させておく。
第1実施形態においては、音源信号の事前PDFとして観測信号のみから求めた事前PDFを用いた。しかし、第1実施形態の処理の中で得られたAR係数事後PDFを用いると、式(38)〜(40)に示したように音源信号の事後PDFを求めることができる。そして、この事後PDFを用いて再度事前PDFを求めることで、観測信号のみから求めた事前PDFと比較して、より精度の高い推定をすることができると考えられる。そこで第2実施形態においては、音源信号の事前PDFとして、観測信号とAR係数事後PDFとから求めた事後PDFを用いる。
第3実施形態は、残響除去部280における計算方法が第1実施形態の式(36)及び(37)と異なる形態であり、残響除去部280の入出力内容、及び全体の機能構成・処理フローは第1実施形態と共通である。
図4に本発明の残響処理装置300の機能構成例を、図5にその処理フローを示す。残響処理装置300は、周波数分割処理部110、ブロック分割部220、AR係数事前PDF記憶部230、音源信号事前PDF推定部240、AR係数事後PDF推定部250、AR係数事後PDF記憶部260、残響除去部380及び周波数統合処理部190から構成される。残響除去部380以外の各構成部の機能は第1実施形態と同様であるため、それらの機能の説明は省略する。
図6に本発明の残響処理装置400の機能構成例を、図7にその処理フローを示す。残響処理装置400は、周波数分割処理部110、AR係数事前PDF記憶部230、残響事後PDF推定部470、残響除去部280及び周波数統合処理部190から構成される。残響事後PDF推定部470以外の各構成部の機能は第1実施形態と同様であるため、それらの機能の説明は省略する。
本発明の第2実施形態の残響除去方法(以下、「Prop」という)の効果を、非特許文献1の残響除去方法(以下、「Baseline」という)との比較で確認した。ただし、Baselineではバッチ処理により、AR係数を全観測信号が得られた後で全観測信号を用いて推定し、得られたAR係数を用いて観測信号全体の残響除去を実行した(つまり、観測開始直後における観測信号不足による問題は生じない)。これに対しPropでは、AR係数の事後PDFを各ブロックごとに更新し、そのブロックの残響除去はこの事後PDFに基づき実行した。また、AR係数に関する事前知識が残響除去に与える効果を検証するために、Propを更に2つの異なる条件で動作させた。1つは、PropをAR係数事前PDFによる事前知識無しで、すなわち式(18)及び(19)でη=0とおいて動作させた(この条件でのPropの動作を以下、「Posterior」という)。もう1つは、PropをAR係数事前PDFによる事前知識だけで動作させたもので、第5実施形態に該当する(この条件でのPropの動作を以下、「Prior」という)。Prop、Posterior及びPriorはすべて逐次処理で動作させた。本実験では逐次処理によらないBaselineの結果を逐次処理の性能上限値として扱う。
Claims (10)
- 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理部と、
周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割部と、
上記ブロック単位で上記周波数領域観測信号を逐次受け取り、上記音源信号の周波数領域における期待値と上記音源信号の周波数領域における共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定部と、
上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)が予め記憶されたAR係数事前PDF記憶部と、
上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を記憶するAR係数事後PDF記憶部と、
上記ブロック単位で上記周波数領域観測信号を逐次受け取るとともに当該各ブロックに対応する上記音源信号事前PDFを逐次受け取り、更に上記AR係数事前PDF記憶部からAR係数事前PDFを読み出し、当該周波数領域観測信号と当該音源信号事前PDFと当該AR係数事前PDFから上記AR係数事後PDFを逐次推定して、上記AR係数事後PDF記憶部に書き込むAR係数事後PDF推定部と、
上記周波数領域観測信号を逐次受け取るとともに、上記AR係数事後PDF記憶部からAR係数事後PDFを逐次読み出し、当該周波数領域観測信号と当該AR係数事後PDFから残響の周波数領域における期待値と残響の周波数領域における共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定部と、
上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去部と、
上記周波数領域音源信号を時間領域に変換する周波数統合処理部と、
を備える残響除去装置。 - 請求項1に記載の残響除去装置において、
上記音源信号事前PDF推定部は、更に上記AR係数事後PDFを逐次受け取り、周波数領域観測信号とAR係数事後PDFとから音源信号事前PDFを繰り返し推定し、
上記AR係数事後PDF推定部は、上記音源信号事前PDF推定部が繰り返し推定した音源信号事前PDFを逐次受け取ってAR係数事後PDFを繰り返し推定し、AR係数事後PDFが収束するか又は所定の繰り返し回数に達した時点でAR係数事後PDFを上記AR係数事後PDF記憶部に書き込む
ことを特徴とする残響除去装置。 - 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理部と、
周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割部と、
上記ブロック単位で上記周波数領域観測信号を逐次受け取り、上記音源信号の周波数領域における期待値と上記音源信号の共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定部と、
上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)が予め記憶されたAR係数事前PDF記憶部と、
上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を記憶するAR係数事後PDF記憶部と、
上記ブロック単位で上記周波数領域観測信号を逐次受け取るとともに当該各ブロックに対応する上記音源信号事前PDFを逐次受け取り、更に上記AR係数事前PDF記憶部から当該各ブロックに対応するAR係数事前PDFを逐次読み出し、当該周波数領域観測信号と当該音源信号事前PDFと当該AR係数事前PDFから上記AR係数事後PDFを逐次推定して、上記AR係数事後PDF記憶部に書き込むAR係数事後PDF推定部と、
上記周波数領域観測信号を逐次受け取るとともに、上記AR係数事後PDF記憶部からAR係数事後PDFを逐次読み出し、当該周波数領域観測信号と当該AR係数事後PDFから音源信号の事後PDFを逐次推定して、その期待値を周波数領域の音源信号(以下、「周波数領域音源信号」という)として推定する残響除去部と、
上記周波数領域音源信号を時間領域に変換する周波数統合処理部と、
を備える残響除去装置。 - 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理部と、
周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)に含まれる残響を予測する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)が予め記憶されたAR係数事前PDF記憶部と、
上記周波数領域観測信号を逐次受け取るとともに、上記AR係数事前PDF記憶部からAR係数事前PDFを逐次読み出し、当該周波数領域観測信号と当該AR係数事前PDFから残響の周波数領域における期待値と残響の共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定部と、
上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去部と、
推定した上記周波数領域音源信号を時間領域に変換する周波数統合処理部と、
を備える残響除去装置。 - 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理ステップと、
周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割ステップと、
上記ブロック単位の上記周波数領域観測信号を用いて、上記音源信号の周波数領域における期待値と上記音源信号の周波数領域における共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定ステップと、
上記ブロック単位の上記周波数領域観測信号と、当該各ブロックに対応する上記音源信号事前PDFと、上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)とから、上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を逐次推定するAR係数事後PDF推定ステップと、
上記周波数領域観測信号と上記AR係数事後PDFとから、残響の周波数領域における期待値と残響の周波数領域における共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定ステップと、
上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去ステップと、
上記周波数領域音源信号を時間領域に変換する周波数統合処理ステップと、
を実行する残響除去方法。 - 請求項5に記載の残響除去方法において、
上記音源信号事前PDF推定ステップは、更に上記AR係数事後PDFを用い、周波数領域観測信号とAR係数事後PDFとから音源信号事前PDFを繰り返し推定し、
上記AR係数事後PDF推定ステップは、上記音源信号事前PDF推定ステップにて繰り返し推定した音源信号PDFを逐次受け取ってAR係数事後PDFを繰り返し推定し、AR係数事後PDFが収束するか又は所定の繰り返し回数に達した時点でAR係数事後PDF記憶部に書き込む
ことを特徴とする残響除去方法。 - 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理ステップと、
周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割ステップと、
上記ブロック単位で上記周波数領域観測信号を逐次受け取り、上記音源信号の周波数領域における期待値と上記音源信号の周波数領域における共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定ステップと、
上記ブロック単位の上記周波数領域観測信号と、当該各ブロックに対応する上記音源信号事前PDFと、当該各ブロックに対応する上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)とから、上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を逐次推定するAR係数事後PDF推定ステップと、
上記周波数領域観測信号と上記AR係数事後PDFとから、音源信号の事後PDFを逐次推定して、その期待値を周波数領域の音源信号(以下、「周波数領域音源信号」という)として推定する残響除去ステップと、
上記周波数領域音源信号を時間領域に変換する周波数統合処理ステップと、
を実行する残響除去方法。 - 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理ステップと、
上記周波数領域観測信号と周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)に含まれる残響を予測する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)とから、残響の周波数領域における期待値と残響の周波数領域における共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定ステップと、
上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去ステップと、
推定した上記周波数領域音源信号を時間領域に変換する周波数統合処理ステップと、
を実行する残響除去方法。 - 請求項1〜4のいずれかに記載した装置としてコンピュータを機能させるためのプログラム。
- 請求項9に記載したプログラムを記録したコンピュータが読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008206784A JP4977100B2 (ja) | 2008-08-11 | 2008-08-11 | 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008206784A JP4977100B2 (ja) | 2008-08-11 | 2008-08-11 | 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010044150A JP2010044150A (ja) | 2010-02-25 |
JP4977100B2 true JP4977100B2 (ja) | 2012-07-18 |
Family
ID=42015597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008206784A Expired - Fee Related JP4977100B2 (ja) | 2008-08-11 | 2008-08-11 | 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4977100B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101909710B1 (ko) * | 2018-04-18 | 2018-10-18 | 국방과학연구소 | 소나 시스템에서 신호의 희소성을 기초로 주파수영역에서의 공분산행렬 기반 압축센싱 도래각 추정방법 및 시스템 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5172536B2 (ja) * | 2008-08-22 | 2013-03-27 | 日本電信電話株式会社 | 残響除去装置、残響除去方法、コンピュータプログラムおよび記録媒体 |
CN102750956B (zh) * | 2012-06-18 | 2014-07-16 | 歌尔声学股份有限公司 | 一种单通道语音去混响的方法和装置 |
EP3460795A1 (en) * | 2017-09-21 | 2019-03-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal processor and method for providing a processed audio signal reducing noise and reverberation |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006234888A (ja) * | 2005-02-22 | 2006-09-07 | Nippon Telegr & Teleph Corp <Ntt> | 残響除去装置、残響除去方法、残響除去プログラムおよび記録媒体 |
US8290170B2 (en) * | 2006-05-01 | 2012-10-16 | Nippon Telegraph And Telephone Corporation | Method and apparatus for speech dereverberation based on probabilistic models of source and room acoustics |
-
2008
- 2008-08-11 JP JP2008206784A patent/JP4977100B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101909710B1 (ko) * | 2018-04-18 | 2018-10-18 | 국방과학연구소 | 소나 시스템에서 신호의 희소성을 기초로 주파수영역에서의 공분산행렬 기반 압축센싱 도래각 추정방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP2010044150A (ja) | 2010-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1993320B1 (en) | Reverberation removal device, reverberation removal method, reverberation removal program, and recording medium | |
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
US8467538B2 (en) | Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
CN108172231B (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
JP4977062B2 (ja) | 残響除去装置とその方法と、そのプログラムと記録媒体 | |
JP5634959B2 (ja) | 雑音/残響除去装置とその方法とプログラム | |
JP6677662B2 (ja) | 音響処理装置、音響処理方法およびプログラム | |
JP4856662B2 (ja) | 雑音除去装置、その方法、そのプログラム及び記録媒体 | |
JP6748304B2 (ja) | ニューラルネットワークを用いた信号処理装置、ニューラルネットワークを用いた信号処理方法及び信号処理プログラム | |
JP2006243290A (ja) | 外乱成分抑圧装置、コンピュータプログラム、及び音声認識システム | |
JP4977100B2 (ja) | 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 | |
Oudre | Interpolation of missing samples in sound signals based on autoregressive modeling | |
JP2007065204A (ja) | 残響除去装置、残響除去方法、残響除去プログラム及びその記録媒体 | |
KR20220022286A (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
JP4348393B2 (ja) | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
JP2016143042A (ja) | 雑音除去装置及び雑音除去プログラム | |
JP6721165B2 (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
JP2003533753A (ja) | スペクトルのモデル化 | |
JP6827908B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
Evers et al. | Multichannel online blind speech dereverberation with marginalization of static observation parameters in a Rao-Blackwellized particle filter | |
JP5583181B2 (ja) | 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム | |
JP5731929B2 (ja) | 音声強調装置とその方法とプログラム | |
JP5498452B2 (ja) | 背景音抑圧装置、背景音抑圧方法、およびプログラム | |
JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100726 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120413 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |