JP2007212704A - 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 - Google Patents
雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 Download PDFInfo
- Publication number
- JP2007212704A JP2007212704A JP2006031909A JP2006031909A JP2007212704A JP 2007212704 A JP2007212704 A JP 2007212704A JP 2006031909 A JP2006031909 A JP 2006031909A JP 2006031909 A JP2006031909 A JP 2006031909A JP 2007212704 A JP2007212704 A JP 2007212704A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- current frame
- frame
- noise
- sample sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
【解決手段】算出部50では、現フレームの雑音スペクトルを|N(k)|、前フレームの雑音スペクトルを|No(k)|、現フレームの入力スペクトルを|X(k)|、現フレームの512サンプル,4096サンプルの入力スペクトルをそれぞれ|X1(k)|,|X2(k)|、|X2(k)|,|No(k)|のスペクトル包絡の相関値をρ、|N(k)|更新制御値をxとすると、|N(k)|=|No(k)|・(1−ρx)+|X(k)|・ρxなる式で|N(k)|を推定する。算出部60では|No(k)|に基づき平均雑音パワーPnを求め、算出部62では512サンプルDbに基づいて平均音パワーPbを求める。Pn>Pb以外では|X(k)|=|X2(k)|,x=13.5とし、Pn>Pbならば|X(k)|=|X1(k)|,x=1とし、Pn<Pbならばx=7とする。
【選択図】図3
Description
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御するステップと
を含むものである。この雑音スペクトル推定方法は、以下に述べる第1〜第3の雑音スペクトル推定方法として具体化することができる。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。この雑音抑圧方法は、以下に述べる第1〜第3の雑音抑圧方法として具体化することができる。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。この雑音抑圧装置は、以下に述べる第1〜第3の雑音抑圧装置として具体化することができる。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知手段で前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。
スペクトル包絡|X1’(k)|=xk(k=1,2,…,K)
スペクトル包絡|No’(k)|=yk(k=1,2,…,K)
とすると、次の数1の式(1)により求められ、0〜1の範囲内の値をとる。
式(2)は、前フレームの雑音振幅スペクトル|No(k)|と現フレームの音入力の振幅スペクトル|X(k)|とを相関値ρ及び更新制御値xに応じた比率で加算(混合)して現フレームの雑音振幅スペクトル|N(k)|を推定することを示すものである。式(2)によれば、相関値ρが小さい有音声区間では、相関値ρが大きいときに比べて、雑音振幅スペクトル|No(k)|の比率を高くすると共に振幅スペクトル|X(k)|の比率を低くして加算が行なわれる。このため、音声成分が多い有音声区間では、推定に係る雑音振幅スペクトル|N(k)|が音声成分の影響によりさほど変化しない。これに対し、相関値ρが大きい無音声区間では、相関値ρが小さいときに比べて、雑音振幅スペクトル|No(k)|の比率を低くすると共に振幅スペクトル|X(k)|の比率を高くして加算が行なわれる。このため、無音声区間では、推定に係る雑音振幅スペクトル|N(k)|が新たな雑音成分に応じて変化し、|N(k)|の更新が促進される。
ここで、XR(k):X1(k)の実数部
XI(k):X1(k)の虚数部
また、計算部58は、周波数分析データX1(k)に基づいて次の式(4)により位相スペクトルθ(k)を算出する。
スペクトル減算部60は、次の式(5)に従って減算を行なう。すなわち、計算部56で求めた現フレームの振幅スペクトル|X1(k)|から、図1の平滑化処理部24から供給される現フレームの雑音振幅スペクトル|N’(k)|を減算することにより、雑音振幅スペクトルが除去された現フレームの振幅スペクトル|Y(k)|を求める。
なお、|X1(k)|−|N’(k)|が負の値となる周波数ポイントでは、引き過ぎであるので、減算値|Y(k)|を負の値のままとせずに、ゼロとするのがよい。
作成された音声スペクトルG(k)は、図1のI−FFT部42に供給される。
ここで、|N(k)|:現フレームの雑音振幅スペクトル
|No(k)|:前フレームの雑音振幅スペクトル
|X(k)|:現フレームの音入力の振幅スペクトルであって、 |X1(k)|又はX2(k)|からなるもの
ρ:スペクトル包絡|No’(k)|,|X1’(k)|の相関値
x,m:更新制御値(xは1以上の値、mは0以上の値)
式(7)は、前フレームの雑音振幅スペクトル|No(k)|と、現フレームの音入力の振幅スペクトル|X(k)|とを相関値ρ及び更新制御値x,mに応じた比率で加算(混合)して現フレームの雑音振幅スペクトル|N(k)|を推定することを示すものである。式(7)によれば、相関値ρが小さい有音声区間では、相関値ρが大きいときに比べて、雑音振幅スペクトル|No(k)|の比率を高くすると共に振幅スペクトル|X(k)|の比率を低くして加算が行なわれる。このため、音声成分が多い有音声区間では、推定に係る雑音振幅スペクトル|N(k)|が音声成分の影響によりさほど変化しない。これに対し、相関値ρが大きい無音声区間では、相関値ρが小さいときに比べて、雑音振幅スペクトル|No(k)|の比率を低くすると共に振幅スペクトル|X(k)|の比率を高くして加算が行なわれる。このため、無音声区間では、推定に係る雑音振幅スペクトル|N(k)|が新たな雑音成分に応じて変化し、|N(k)|の更新が促進される。
Claims (14)
- 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御するステップと
を含む雑音スペクトル推定方法。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと
を含む雑音スペクトル推定方法。 - 前記現フレームの雑音スペクトルを推定するステップでは、前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとを混合して前記現フレームの雑音スペクトルを推定し、その推定の際には前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第1のスペクトルの混合比率を増大すべく制御することを特徴とする請求項2記載の雑音スペクトル推定方法。
- 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと
を含む雑音スペクトル推定方法。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと
を含む雑音スペクトル推定方法。 - 前記現フレームの雑音スペクトルを推定するステップでは、前記前フレームの平均雑音パワーと該前フレームより前の複数フレームの平均雑音パワーとを記憶すると共に記憶に係る平均雑音パワーのうちで最小の平均雑音パワーを検知し、検知に係る最小の平均雑音パワーと前記前フレームの平均雑音パターとを比較して前記前フレームの平均雑音パワーの方が前記検知に係る最小の平均雑音パワーより小さいことを条件として前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御することを特徴とする請求項5記載の雑音スペクトル推定方法。
- 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含む雑音抑圧方法。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含む雑音抑圧方法。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含む雑音抑圧方法。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含む雑音抑圧方法。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知手段で前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。 - 入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006031909A JP4454591B2 (ja) | 2006-02-09 | 2006-02-09 | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006031909A JP4454591B2 (ja) | 2006-02-09 | 2006-02-09 | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007212704A true JP2007212704A (ja) | 2007-08-23 |
JP4454591B2 JP4454591B2 (ja) | 2010-04-21 |
Family
ID=38491207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006031909A Expired - Fee Related JP4454591B2 (ja) | 2006-02-09 | 2006-02-09 | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4454591B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010078650A (ja) * | 2008-09-24 | 2010-04-08 | Toshiba Corp | 音声認識装置及びその方法 |
JP2010102204A (ja) * | 2008-10-24 | 2010-05-06 | Yamaha Corp | 雑音抑圧装置及び雑音抑圧方法 |
JP2010539538A (ja) * | 2007-09-12 | 2010-12-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 雑音レベル推定値の調節を備えたスピーチ強調 |
JP2012037603A (ja) * | 2010-08-04 | 2012-02-23 | Fujitsu Ltd | 雑音推定装置、雑音推定方法および雑音推定プログラム |
WO2012098579A1 (ja) * | 2011-01-19 | 2012-07-26 | 三菱電機株式会社 | 雑音抑圧装置 |
JP2014051149A (ja) * | 2012-09-05 | 2014-03-20 | Yamaha Corp | エンジン音加工装置 |
CN104078040A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 语音识别方法及系统 |
CN110168602A (zh) * | 2017-01-03 | 2019-08-23 | 菲力尔系统公司 | 使用频谱变换的图像降噪 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134286A (ja) * | 1999-11-08 | 2001-05-18 | Denso Corp | 雑音抑圧装置、音声認識システム及び記録媒体 |
JP2004020679A (ja) * | 2002-06-13 | 2004-01-22 | Matsushita Electric Ind Co Ltd | 雑音抑圧装置および雑音抑圧方法 |
JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
JP2005077731A (ja) * | 2003-08-29 | 2005-03-24 | Univ Waseda | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム |
JP2005099405A (ja) * | 2003-09-25 | 2005-04-14 | Yamaha Corp | 雑音除去方法、雑音除去装置およびプログラム |
JP2005284163A (ja) * | 2004-03-30 | 2005-10-13 | Univ Waseda | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 |
WO2006123721A1 (ja) * | 2005-05-17 | 2006-11-23 | Yamaha Corporation | 雑音抑圧方法およびその装置 |
-
2006
- 2006-02-09 JP JP2006031909A patent/JP4454591B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
JP2001134286A (ja) * | 1999-11-08 | 2001-05-18 | Denso Corp | 雑音抑圧装置、音声認識システム及び記録媒体 |
JP2004020679A (ja) * | 2002-06-13 | 2004-01-22 | Matsushita Electric Ind Co Ltd | 雑音抑圧装置および雑音抑圧方法 |
JP2005077731A (ja) * | 2003-08-29 | 2005-03-24 | Univ Waseda | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム |
JP2005099405A (ja) * | 2003-09-25 | 2005-04-14 | Yamaha Corp | 雑音除去方法、雑音除去装置およびプログラム |
JP2005284163A (ja) * | 2004-03-30 | 2005-10-13 | Univ Waseda | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 |
WO2006123721A1 (ja) * | 2005-05-17 | 2006-11-23 | Yamaha Corporation | 雑音抑圧方法およびその装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010539538A (ja) * | 2007-09-12 | 2010-12-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 雑音レベル推定値の調節を備えたスピーチ強調 |
JP2010078650A (ja) * | 2008-09-24 | 2010-04-08 | Toshiba Corp | 音声認識装置及びその方法 |
JP2010102204A (ja) * | 2008-10-24 | 2010-05-06 | Yamaha Corp | 雑音抑圧装置及び雑音抑圧方法 |
JP2012037603A (ja) * | 2010-08-04 | 2012-02-23 | Fujitsu Ltd | 雑音推定装置、雑音推定方法および雑音推定プログラム |
WO2012098579A1 (ja) * | 2011-01-19 | 2012-07-26 | 三菱電機株式会社 | 雑音抑圧装置 |
JP5265056B2 (ja) * | 2011-01-19 | 2013-08-14 | 三菱電機株式会社 | 雑音抑圧装置 |
US8724828B2 (en) | 2011-01-19 | 2014-05-13 | Mitsubishi Electric Corporation | Noise suppression device |
JP2014051149A (ja) * | 2012-09-05 | 2014-03-20 | Yamaha Corp | エンジン音加工装置 |
CN104078040A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 语音识别方法及系统 |
WO2015196720A1 (zh) * | 2014-06-26 | 2015-12-30 | 广东美的制冷设备有限公司 | 语音识别方法及系统 |
CN110168602A (zh) * | 2017-01-03 | 2019-08-23 | 菲力尔系统公司 | 使用频谱变换的图像降噪 |
CN110168602B (zh) * | 2017-01-03 | 2023-05-12 | 特利丹菲力尔有限责任公司 | 使用频谱变换的图像降噪 |
Also Published As
Publication number | Publication date |
---|---|
JP4454591B2 (ja) | 2010-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4958303B2 (ja) | 雑音抑圧方法およびその装置 | |
JP4454591B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 | |
US7957964B2 (en) | Apparatus and methods for noise suppression in sound signals | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
JP5870476B2 (ja) | 雑音推定装置、雑音推定方法および雑音推定プログラム | |
JP5387459B2 (ja) | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP2009075536A (ja) | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 | |
US20130311189A1 (en) | Voice processing apparatus | |
JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
JP4434813B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 | |
JP5459220B2 (ja) | 発話音声検出装置 | |
JP2005258158A (ja) | ノイズ除去装置 | |
JP5815435B2 (ja) | 音源位置判定装置、音源位置判定方法、プログラム | |
JP5325130B2 (ja) | Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム | |
JP3849679B2 (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
KR100931487B1 (ko) | 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치 | |
JP2020085975A (ja) | 雑音抑圧プログラム、雑音抑圧方法及び雑音抑圧装置 | |
JP2015031913A (ja) | 音声処理装置、音声処理方法、及びプログラム | |
JP2019060976A (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
KR100931181B1 (ko) | 노이지 음성 신호의 처리 방법 및 이를 위한 컴퓨터 판독가능한 기록매체 | |
JP2005284016A (ja) | 音声信号の雑音推定方法およびそれを用いた雑音除去装置 | |
JP6064561B2 (ja) | 拍情報推定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100126 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100202 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4454591 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |