JP2010049083A - 音響信号強調装置とその方法と、プログラムと記録媒体 - Google Patents
音響信号強調装置とその方法と、プログラムと記録媒体 Download PDFInfo
- Publication number
- JP2010049083A JP2010049083A JP2008214065A JP2008214065A JP2010049083A JP 2010049083 A JP2010049083 A JP 2010049083A JP 2008214065 A JP2008214065 A JP 2008214065A JP 2008214065 A JP2008214065 A JP 2008214065A JP 2010049083 A JP2010049083 A JP 2010049083A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- estimated value
- sound source
- matrix
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】この発明の音響信号強調装置は、帯域分割部と、パラメータ推定部と、残響除去部と、音源分離部と、帯域合成部とを具備する。帯域分割部は、時間領域の観測音響信号を所定数の周波数帯域毎の観測信号に分割する。パラメータ推定部は、周波数帯域毎の観測信号を入力として所定フレーム数前までの残響成分を推定するための回帰行列の推定値と、音源信号を推定するための分離行列の推定値とを生成する。残響除去部は、周波数帯域毎の観測信号に回帰行列を畳み込み演算して残響成分を求める。そして、求めた残響成分を周波数帯域毎の観測信号から減算して残響除去信号を生成する。音源分離部は、残響除去信号に分離行列を乗算して音源信号の推定値を生成する。帯域合成部は、音源信号の推定値を合成して時間領域の強調音響信号に変換する。
【選択図】図1
Description
牧野昭二、荒木章子、向井良、澤田宏「畳み込み混合のブラインド音源分離」システム/制御/情報、Vol.48,No.10,pp.401-408,2004
〔この発明の基本的な考え〕
実施例の説明の前に、この発明の音響信号強調方法の基本的な考えについて説明する。この発明では、観測信号yt,pを式(2)ではなく式(5)で生成されたと仮定する。
関数を表す。例えば、xがD次元ベクトルである場合、N{x;μ,Σ}は具体的には式(18)で与えられる。
対数尤度関数は全極パラメータsΘにも依存するため、パラメータ推定部12は、分離行列wΘと回帰行列gΘだけではなく、全てのパラメータΘ={sΘ,wΘ,gΘ}を推定する。すなわち、式(9)を最大化するΘ^={sΘ^,wΘ^,gΘ^}を未知パラメータΘの推定値として求める。式(9)を最大化する未知パラメータの推定値Θ^の求め方には様々な方法を採用することが出来る。例えば、最急降下法や準ニュートン法等の任意の最適化法を用いる。これらの最適化法は周知であるので、その説明は省略する。パラメータ推定部12は、未知パラメータΘ^の内の分離行列の推定値wΘ^と、回帰行列の推定値gΘ^とを強調信号計算部14に供給する(ステップS12)。
帯域毎に分割された観測信号yt,pに回帰行列の推定値Gk,p^を畳み込み演算して残響成分を求め、観測信号yt,pから残響成分を減算して残響除去信号xt,pを生成する(式(7))(ステップS141)。音源分離部142は、残響除去信号xt,pに分離行列の推定値Wp^を乗算(式(8))して音源信号の推定値を生成する(ステップS142)。帯域合成部66は、音源信号の推定値を合成して時間領域の強調音響信号を生成する(ステップS66)。このようにして生成された強調音響信号は、観測信号から残響成分を除去した後の残響除去信号を音源分離したものなので、残響時間がフレーム幅を越える場合でも音源分離された音響信号になる。また、強調後の音響信号は残響成分が抑圧されているため、より高品質な強調音響信号を得ることが出来る。
ータΘを推定する実施例2を説明する。図3に実施例2のパラメータ推定部30の機能構
成例を示す。その動作フローを図4に示す。パラメータ推定部30は、未知パラメータΘ
の推定に特化した効率的なアルゴリズムを用いて、分離行列の推定値wΘ^と、回帰行列の推定値gΘ^とを生成するものである。
こうして得られる各音源信号の推定値をSt,p^(m)(i+1)と書く。m番目の音源信号のt番目のフレームにおける全極パラメータの更新された推定値a^t,1 (m)(i+1),…,a^t,Q (m)(i+1),svt^(m)(i+1)は、各音源信号の推定値St,p^(m)(i+1)に線形予測分析を適用することで求められる。
行列の推定値gΘ^(i+1)を更新することが出来る。こうして求めたgΘ^(i+1)が式(25)の解である。更新した回帰行列の推定値gΘ^(i+1)は、分離行列推定値更新部306に入力される。
分離行列推定値更新部306は、回帰行列の推定値gΘ^(i+1)と、音源信号のパワースペクトル密度の推定値と、観測信号とを入力として分離行列の推定値wΘ^(i+1)を式(4)に従って更新する(ステップS306)。
この発明の音響信号強調方法の効果を確認する目的で実験を行った。実験条件を説明する。音源信号は、ASJ-JNASデータベースから男女各1話者の音声を抽出した。この音源信号を残響時間が約0.6秒の部屋で互いに異なる位置から再生し、2個のマイクロホンで録音した。録音時の標本化周波数は8kHzとした。音響信号強調装置は、実施例2で説明した構成とした。帯域分割部には、ポリフェーズフィルタバンク分析を用いた。帯域分割数は256、間引き率は128とした。
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (10)
- 時間領域の観測音響信号を所定数の周波数帯域毎の観測信号に分割する帯域分割部と、
上記観測信号を入力として所定フレーム数前までの残響成分を推定するための回帰行列の推定値と、音源信号に分離するための分離行列の推定値とを生成するパラメータ推定部と、
上記観測信号に上記回帰行列を畳み込み演算して残響成分を求め、上記残響成分を上記観測信号から減算して残響除去信号を生成する残響除去部と、
上記残響除去信号に上記分離行列を乗算して音源信号の推定値を生成する音源分離部と、
上記音源信号の推定値を合成して時間領域の強調音響信号を生成する帯域合成部と、
を具備する音響信号強調装置。 - 請求項1に記載した音響信号強調装置において、
上記パラメータ推定部は、
上記観測信号を記録する観測信号記録部と、
上記回帰行列の推定値と上記分離行列の推定値の初期値を設定するパラメータ推定値初期化部と、
上記初期値又は上記回帰行列の推定値と上記分離行列の推定値と、上記観測信号とを入力として全極パラメータ推定値を更新する全極パラメータ推定値更新部と、
上記全極パラメータ推定値を入力として音源信号のパワースペクトル密度の推定値を更新する音源信号パワースペクトル推定値更新部と、
上記音源信号のパワースペクトル密度の推定値と上記分離行列の推定値と上記観測信号とを入力として上記回帰行列の推定値を更新する回帰行列推定値更新部と、
上記回帰行列の推定値と上記音源信号のパワースペクトル密度の推定値と上記観測信号とを入力として上記分離行列の推定値を更新する分離行列推定値更新部と、
上記回帰行列の推定値と上記分離行列の推定値が収束したか否かを判定する収束判定部と、
を備えることを特徴とする音響信号強調装置。 - 請求項2に記載した音響信号強調装置において、
上記分離行列推定値更新部は、
上記分離行列の推定値を、音源分離技術における分離行列の計算法を用いて更新するものであることを特徴とする音響信号強調装置。 - 請求項1乃至3の何れかに記載した音響信号強調装置において、
上記パラメータ推定部は、上記所定フレーム数を上記観測信号の周波数帯域に応じて可変する所定フレーム数可変手段を備えることを特徴とする音響信号強調装置。 - 帯域分割部が、時間領域の観測音響信号を所定数の周波数帯域毎の観測信号に分割する帯域分割過程と、
パラメータ推定部が、上記観測信号を入力として所定フレーム数前までの残響成分を推定するための回帰行列の推定値と、音源信号に分離するための分離行列の推定値とを生成するパラメータ推定過程と、
残響除去部が、上記観測信号に上記回帰行列を畳み込み演算して残響成分を求め、上記残響成分を上記観測信号から減算して残響除去信号を生成する残響除去過程と、
音源分離部が、上記残響除去信号に上記分離行列を乗算して音源信号の推定値を生成する音源分離過程と、
帯域合成部が、上記音源信号の推定値を合成して時間領域の強調音響信号を生成する帯域合成過程と、
を含む音響信号強調方法。 - 請求項5に記載した音響信号強調方法において、
上記パラメータ推定過程は、
パラメータ推定値初期化部が、上記回帰行列の推定値と上記分離行列の推定値の初期値を設定するパラメータ推定値初期化ステップと、
全極パラメータ推定値更新部が、上記初期値又は上記回帰行列の推定値と上記分離行列の推定値と、上記観測信号とを入力として全極パラメータ推定値を更新する全極パラメータ推定値更新ステップと、
音源信号パワースペクトル推定値更新部が、上記全極パラメータ推定値を入力として音源信号のパワースペクトル密度の推定値を更新する音源信号パワースペクトル推定値更新ステップと、
回帰行列推定値更新部が、上記音源信号のパワースペクトル密度の推定値と上記分離行列の推定値と上記観測信号とを入力として上記回帰行列の推定値を更新する回帰行列推定値更新ステップと、
分離行列推定値更新部が、上記回帰行列の推定値と上記音源信号のパワースペクトル密度の推定値と上記観測信号とを入力として上記分離行列の推定値を更新する分離行列推定値更新ステップと、
収束判定部が、上記回帰行列の推定値と上記分離行列の推定値が収束したか否かを判定する収束判定ステップと、
を含むことを特徴とする音響信号強調方法。 - 請求項6に記載した音響信号強調方法において、
上記分離行列推定値更新過程は、
上記分離行列の推定値を、音源分離技術における分離行列の計算法を用いて更新する過程であることを特徴とする音響信号強調方法。 - 請求項5乃至7の何れかに記載した音響信号強調方法において、
上記パラメータ推定過程は、上記所定フレーム数を上記観測信号の周波数帯域に応じて可変する所定フレーム数可変ステップを含むことを特徴とする音響信号強調方法。 - 請求項1乃至4の何れかに記載した音響信号強調装置としてコンピュータを機能させるための装置プログラム。
- 請求項9に記載した何れかの装置プログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008214065A JP4960933B2 (ja) | 2008-08-22 | 2008-08-22 | 音響信号強調装置とその方法と、プログラムと記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008214065A JP4960933B2 (ja) | 2008-08-22 | 2008-08-22 | 音響信号強調装置とその方法と、プログラムと記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010049083A true JP2010049083A (ja) | 2010-03-04 |
JP4960933B2 JP4960933B2 (ja) | 2012-06-27 |
Family
ID=42066205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008214065A Active JP4960933B2 (ja) | 2008-08-22 | 2008-08-22 | 音響信号強調装置とその方法と、プログラムと記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4960933B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015519614A (ja) * | 2012-06-18 | 2015-07-09 | ゴーアテック インコーポレイテッドGoertek Inc | シングルチャンネル音声残響除去方法及びその装置 |
JP2016156944A (ja) * | 2015-02-24 | 2016-09-01 | 日本電信電話株式会社 | モデル推定装置、目的音強調装置、モデル推定方法及びモデル推定プログラム |
JP2018504642A (ja) * | 2015-02-15 | 2018-02-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ源の分離 |
CN110459240A (zh) * | 2019-08-12 | 2019-11-15 | 新疆大学 | 基于卷积神经网络和深度聚类的多说话人语音分离方法 |
JPWO2021024474A1 (ja) * | 2019-08-08 | 2021-02-11 | ||
CN112863537A (zh) * | 2021-01-04 | 2021-05-28 | 北京小米松果电子有限公司 | 一种音频信号处理方法、装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10150343A (ja) * | 1996-09-20 | 1998-06-02 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去方法および装置 |
JP2007235875A (ja) * | 2006-03-03 | 2007-09-13 | Nippon Telegr & Teleph Corp <Ntt> | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
-
2008
- 2008-08-22 JP JP2008214065A patent/JP4960933B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10150343A (ja) * | 1996-09-20 | 1998-06-02 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去方法および装置 |
JP2007235875A (ja) * | 2006-03-03 | 2007-09-13 | Nippon Telegr & Teleph Corp <Ntt> | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015519614A (ja) * | 2012-06-18 | 2015-07-09 | ゴーアテック インコーポレイテッドGoertek Inc | シングルチャンネル音声残響除去方法及びその装置 |
JP2018504642A (ja) * | 2015-02-15 | 2018-02-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ源の分離 |
US10192568B2 (en) | 2015-02-15 | 2019-01-29 | Dolby Laboratories Licensing Corporation | Audio source separation with linear combination and orthogonality characteristics for spatial parameters |
JP2016156944A (ja) * | 2015-02-24 | 2016-09-01 | 日本電信電話株式会社 | モデル推定装置、目的音強調装置、モデル推定方法及びモデル推定プログラム |
JPWO2021024474A1 (ja) * | 2019-08-08 | 2021-02-11 | ||
WO2021024474A1 (ja) * | 2019-08-08 | 2021-02-11 | 日本電信電話株式会社 | Psd最適化装置、psd最適化方法、プログラム |
JP7173355B2 (ja) | 2019-08-08 | 2022-11-16 | 日本電信電話株式会社 | Psd最適化装置、psd最適化方法、プログラム |
CN110459240A (zh) * | 2019-08-12 | 2019-11-15 | 新疆大学 | 基于卷积神经网络和深度聚类的多说话人语音分离方法 |
CN112863537A (zh) * | 2021-01-04 | 2021-05-28 | 北京小米松果电子有限公司 | 一种音频信号处理方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4960933B2 (ja) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
Tan et al. | Real-time speech enhancement using an efficient convolutional recurrent network for dual-microphone mobile phones in close-talk scenarios | |
US7895038B2 (en) | Signal enhancement via noise reduction for speech recognition | |
JP5227393B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体 | |
JP2021036297A (ja) | 信号処理装置、信号処理方法、及びプログラム | |
US9536538B2 (en) | Method and device for reconstructing a target signal from a noisy input signal | |
JP5568530B2 (ja) | 音源分離装置とその方法とプログラム | |
CN111696568B (zh) | 一种半监督瞬态噪声抑制方法 | |
JP4960933B2 (ja) | 音響信号強調装置とその方法と、プログラムと記録媒体 | |
JPWO2007100137A1 (ja) | 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体 | |
EP3685378B1 (en) | Signal processor and method for providing a processed audio signal reducing noise and reverberation | |
US9520138B2 (en) | Adaptive modulation filtering for spectral feature enhancement | |
JP4977062B2 (ja) | 残響除去装置とその方法と、そのプログラムと記録媒体 | |
Simon et al. | A general framework for online audio source separation | |
KR102410850B1 (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
JP6348427B2 (ja) | 雑音除去装置及び雑音除去プログラム | |
JP5351856B2 (ja) | 音源パラメータ推定装置と音源分離装置とそれらの方法と、プログラムと記憶媒体 | |
JP5726790B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
JP5438704B2 (ja) | 音源パラメータ推定装置と音源分離装置とそれらの方法とプログラム | |
Kim et al. | Sound source separation algorithm using phase difference and angle distribution modeling near the target. | |
US11790929B2 (en) | WPE-based dereverberation apparatus using virtual acoustic channel expansion based on deep neural network | |
JP6827908B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
JP5731929B2 (ja) | 音声強調装置とその方法とプログラム | |
JP2018049228A (ja) | 音響処理装置および音響処理方法 | |
JP6553561B2 (ja) | 信号解析装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100726 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120323 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150330 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4960933 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |