JP4454591B2 - 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 - Google Patents
雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 Download PDFInfo
- Publication number
- JP4454591B2 JP4454591B2 JP2006031909A JP2006031909A JP4454591B2 JP 4454591 B2 JP4454591 B2 JP 4454591B2 JP 2006031909 A JP2006031909 A JP 2006031909A JP 2006031909 A JP2006031909 A JP 2006031909A JP 4454591 B2 JP4454591 B2 JP 4454591B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- frame
- current frame
- noise
- sample sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
Description
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御するステップと
を含むものである。この雑音スペクトル推定方法は、以下に述べる第1〜第3の雑音スペクトル推定方法として具体化することができる。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。この雑音抑圧方法は、以下に述べる第1〜第3の雑音抑圧方法として具体化することができる。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を含むものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記前フレームの雑音スペクトルに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルの推定態様を制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。この雑音抑圧装置は、以下に述べる第1〜第3の雑音抑圧装置として具体化することができる。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知手段で前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。
入力音波形のサンプル列を比較的短い第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を比較的長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えたものである。
スペクトル包絡|X1’(k)|=xk(k=1,2,…,K)
スペクトル包絡|No’(k)|=yk(k=1,2,…,K)
とすると、次の数1の式(1)により求められ、0〜1の範囲内の値をとる。
式(2)は、前フレームの雑音振幅スペクトル|No(k)|と現フレームの音入力の振幅スペクトル|X(k)|とを相関値ρ及び更新制御値xに応じた比率で加算(混合)して現フレームの雑音振幅スペクトル|N(k)|を推定することを示すものである。式(2)によれば、相関値ρが小さい有音声区間では、相関値ρが大きいときに比べて、雑音振幅スペクトル|No(k)|の比率を高くすると共に振幅スペクトル|X(k)|の比率を低くして加算が行なわれる。このため、音声成分が多い有音声区間では、推定に係る雑音振幅スペクトル|N(k)|が音声成分の影響によりさほど変化しない。これに対し、相関値ρが大きい無音声区間では、相関値ρが小さいときに比べて、雑音振幅スペクトル|No(k)|の比率を低くすると共に振幅スペクトル|X(k)|の比率を高くして加算が行なわれる。このため、無音声区間では、推定に係る雑音振幅スペクトル|N(k)|が新たな雑音成分に応じて変化し、|N(k)|の更新が促進される。
ここで、XR(k):X1(k)の実数部
XI(k):X1(k)の虚数部
また、計算部58は、周波数分析データX1(k)に基づいて次の式(4)により位相スペクトルθ(k)を算出する。
スペクトル減算部60は、次の式(5)に従って減算を行なう。すなわち、計算部56で求めた現フレームの振幅スペクトル|X1(k)|から、図1の平滑化処理部24から供給される現フレームの雑音振幅スペクトル|N’(k)|を減算することにより、雑音振幅スペクトルが除去された現フレームの振幅スペクトル|Y(k)|を求める。
なお、|X1(k)|−|N’(k)|が負の値となる周波数ポイントでは、引き過ぎであるので、減算値|Y(k)|を負の値のままとせずに、ゼロとするのがよい。
作成された音声スペクトルG(k)は、図1のI−FFT部42に供給される。
ここで、|N(k)|:現フレームの雑音振幅スペクトル
|No(k)|:前フレームの雑音振幅スペクトル
|X(k)|:現フレームの音入力の振幅スペクトルであって、 |X1(k)|又はX2(k)|からなるもの
ρ:スペクトル包絡|No’(k)|,|X1’(k)|の相関値
x,m:更新制御値(xは1以上の値、mは0以上の値)
式(7)は、前フレームの雑音振幅スペクトル|No(k)|と、現フレームの音入力の振幅スペクトル|X(k)|とを相関値ρ及び更新制御値x,mに応じた比率で加算(混合)して現フレームの雑音振幅スペクトル|N(k)|を推定することを示すものである。式(7)によれば、相関値ρが小さい有音声区間では、相関値ρが大きいときに比べて、雑音振幅スペクトル|No(k)|の比率を高くすると共に振幅スペクトル|X(k)|の比率を低くして加算が行なわれる。このため、音声成分が多い有音声区間では、推定に係る雑音振幅スペクトル|N(k)|が音声成分の影響によりさほど変化しない。これに対し、相関値ρが大きい無音声区間では、相関値ρが小さいときに比べて、雑音振幅スペクトル|No(k)|の比率を低くすると共に振幅スペクトル|X(k)|の比率を高くして加算が行なわれる。このため、無音声区間では、推定に係る雑音振幅スペクトル|N(k)|が新たな雑音成分に応じて変化し、|N(k)|の更新が促進される。
Claims (14)
- コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記現フレームの第1及び第2のスペクトルのうちのいずれか一方と前記前フレームの雑音スペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルを推定するステップにおいて前記前フレームの雑音スペクトルとともに用いる現フレームのスペクトルを選択するステップと
を実行することを特徴とする雑音スペクトル推定方法。 - コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと
を実行することを特徴とする雑音スペクトル推定方法。 - 前記現フレームの雑音スペクトルを推定するステップにおいて前記コンピュータは、前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとを混合して前記現フレームの雑音スペクトルを推定し、その推定の際には前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第1のスペクトルの混合比率を増大すべく制御することを特徴とする請求項2記載の雑音スペクトル推定方法。
- コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと
を実行することを特徴とする雑音スペクトル推定方法。 - コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと
を実行することを特徴とする雑音スペクトル推定方法。 - 前記現フレームの雑音スペクトルを推定するステップにおいて前記コンピュータは、前記前フレームの平均雑音パワーと該前フレームより前の複数フレームの平均雑音パワーとを記憶すると共に記憶に係る平均雑音パワーのうちで最小の平均雑音パワーを検知し、検知に係る最小の平均雑音パワーと前記前フレームの平均雑音パターとを比較して前記前フレームの平均雑音パワーの方が前記検知に係る最小の平均雑音パワーより小さいことを条件として前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御することを特徴とする請求項5記載の雑音スペクトル推定方法。
- コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記現フレームの第1及び第2のスペクトルのうちのいずれか一方と前記前フレームの雑音スペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記現フレームの雑音スペクトルを推定する際に前記前フレームの雑音スペクトルとともに用いる現フレームのスペクトルを選択するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を実行することを特徴とする雑音抑圧方法。 - コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知するステップで前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を実行することを特徴とする雑音抑圧方法。 - コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を実行することを特徴とする雑音抑圧方法。 - コンピュータが、
入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を得るステップと、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を得た後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を得るステップと、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加するステップと、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを得るステップと、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを得た後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを得るステップと、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定するステップと、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出するステップと、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出するステップと、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知するステップと、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定するステップと、
前記検知するステップで前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御するステップと、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを得るステップと
を実行することを特徴とする雑音抑圧方法。 - 入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記現フレームの第1及び第2のスペクトルのうちのいずれか一方と前記前フレームの雑音スペクトルとに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記平均雑音パワーと前記平均音パワーとを比較し、その比較結果に応じて前記第2の推定手段において現フレームの雑音スペクトルを推定する際に前記前フレームの雑音スペクトルとともに用いる現フレームのスペクトルを選択する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。 - 入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を前記第1のフレーム長よりも長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されないときは前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとに基づいて現フレームの雑音スペクトルを推定し、前記検知手段で前記平均雑音パワーの方が大きいことが検知されたときは前記前フレームの雑音スペクトルと前記現フレームの第1のスペクトルとに基づいて現フレームの雑音スペクトルを推定する第2の推定手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。 - 入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を前記第1のフレーム長より長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより大きいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第1及び第2のスペクトルのうちのいずれか一方のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が大きいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記一方のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。 - 入力音波形のサンプル列を第1のフレーム長で切り出して現フレームの第1のサンプル列を生成する第1の切出手段と、
前記入力音波形のサンプル列を前記第1のフレーム長より長い第2のフレーム長で前記現フレームより前に切り出して前フレームの第2のサンプル列を生成した後、前記入力音波形のサンプル列を前記第2のフレーム長で前記現フレームに同期して切り出して現フレームの第2のサンプル列を生成する第2の切出手段と、
前記現フレームの第1のサンプル列のフレーム長が前記現フレームの第2のサンプル列のフレーム長と等しくなるように前記現フレームの第1のサンプル列の末尾にゼロデータを付加する付加手段と、
前記ゼロデータが付加された現フレームの第1のサンプル列を周波数分析して現フレームの第1のスペクトルを生成する第1の分析手段と、
前記前フレームの第2のサンプル列を周波数分析して前フレームの第2のスペクトルを生成した後、前記現フレームの第2のサンプル列を周波数分析して現フレームの第2のスペクトルを生成する第2の分析手段と、
前記前フレームの第2のスペクトルに基づいて前フレームの雑音スペクトルを推定する第1の推定手段と、
前記前フレームの雑音スペクトルに基づいて前フレーム内の平均雑音パワーを算出する第1の算出手段と、
前記現フレームの第1及び第2のサンプル列のうちのいずれか一方のサンプル列に基づいて現フレーム内の平均音パワーを算出する第2の算出手段と、
前記平均雑音パワーと前記平均音パワーとを比較して前記平均雑音パワーの方が前記平均音パワーより小さいことを検知する検知手段と、
前記前フレームの雑音スペクトルと前記現フレームの第2のスペクトルとを混合して現フレームの雑音スペクトルを推定する第2の推定手段と、
前記検知手段で前記平均雑音パワーの方が小さいことが検知されるのに応答して前記前フレームの雑音スペクトルに対する前記現フレームの第2のスペクトルの混合比率を増大すべく制御する制御手段と、
前記現フレームの第1のスペクトルから前記現フレームの雑音スペクトルを減算して雑音が抑圧された音スペクトルを生成する減算手段と
を備えた雑音抑圧装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006031909A JP4454591B2 (ja) | 2006-02-09 | 2006-02-09 | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006031909A JP4454591B2 (ja) | 2006-02-09 | 2006-02-09 | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2007212704A JP2007212704A (ja) | 2007-08-23 |
| JP4454591B2 true JP4454591B2 (ja) | 2010-04-21 |
Family
ID=38491207
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006031909A Expired - Fee Related JP4454591B2 (ja) | 2006-02-09 | 2006-02-09 | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4454591B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103238183A (zh) * | 2011-01-19 | 2013-08-07 | 三菱电机株式会社 | 噪音抑制装置 |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE602008005477D1 (de) * | 2007-09-12 | 2011-04-21 | Dolby Lab Licensing Corp | Spracherweiterung mit anpassung von geräuschpegelschätzungen |
| JP2010078650A (ja) * | 2008-09-24 | 2010-04-08 | Toshiba Corp | 音声認識装置及びその方法 |
| JP5071346B2 (ja) * | 2008-10-24 | 2012-11-14 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
| JP5870476B2 (ja) * | 2010-08-04 | 2016-03-01 | 富士通株式会社 | 雑音推定装置、雑音推定方法および雑音推定プログラム |
| JP6051701B2 (ja) * | 2012-09-05 | 2016-12-27 | ヤマハ株式会社 | エンジン音加工装置 |
| CN104078040A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 语音识别方法及系统 |
| EP3566202B1 (en) * | 2017-01-03 | 2023-09-13 | Teledyne Flir, LLC | Image noise reduction using spectral transforms |
| JP2021135422A (ja) * | 2020-02-28 | 2021-09-13 | 沖電気工業株式会社 | 信号処理装置および信号処理方法 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
| JP4325044B2 (ja) * | 1999-11-08 | 2009-09-02 | 株式会社デンソー | 音声認識システム |
| JP4123835B2 (ja) * | 2002-06-13 | 2008-07-23 | 松下電器産業株式会社 | 雑音抑圧装置および雑音抑圧方法 |
| JP4457221B2 (ja) * | 2003-08-29 | 2010-04-28 | 学校法人早稲田大学 | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム |
| JP3849679B2 (ja) * | 2003-09-25 | 2006-11-22 | ヤマハ株式会社 | 雑音除去方法、雑音除去装置およびプログラム |
| JP4434813B2 (ja) * | 2004-03-30 | 2010-03-17 | 学校法人早稲田大学 | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 |
| JP4958303B2 (ja) * | 2005-05-17 | 2012-06-20 | ヤマハ株式会社 | 雑音抑圧方法およびその装置 |
-
2006
- 2006-02-09 JP JP2006031909A patent/JP4454591B2/ja not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103238183A (zh) * | 2011-01-19 | 2013-08-07 | 三菱电机株式会社 | 噪音抑制装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2007212704A (ja) | 2007-08-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4958303B2 (ja) | 雑音抑圧方法およびその装置 | |
| JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
| JP5528538B2 (ja) | 雑音抑圧装置 | |
| KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
| JP5870476B2 (ja) | 雑音推定装置、雑音推定方法および雑音推定プログラム | |
| JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
| KR20010023437A (ko) | 잡음에서 주기적인 신호를 감지하기 위한 신호 처리 시스템 | |
| JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
| US20130311189A1 (en) | Voice processing apparatus | |
| JP4454591B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 | |
| US7957964B2 (en) | Apparatus and methods for noise suppression in sound signals | |
| JP4434813B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 | |
| JP5325130B2 (ja) | Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム | |
| JP5459220B2 (ja) | 発話音声検出装置 | |
| JP4419249B2 (ja) | 音響信号分析方法及び装置並びに音響信号処理方法及び装置 | |
| JP3849679B2 (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
| KR100931487B1 (ko) | 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치 | |
| JP2020085975A (ja) | 雑音抑圧プログラム、雑音抑圧方法及び雑音抑圧装置 | |
| JP6064561B2 (ja) | 拍情報推定装置 | |
| JP2015031913A (ja) | 音声処理装置、音声処理方法、及びプログラム | |
| JP2005284016A (ja) | 音声信号の雑音推定方法およびそれを用いた雑音除去装置 | |
| KR100931181B1 (ko) | 노이지 음성 신호의 처리 방법 및 이를 위한 컴퓨터 판독가능한 기록매체 | |
| KR20130037910A (ko) | OpenVG 기반 다중 레이어 중첩부분의 위치좌표 결정 방법 | |
| JP2019060976A (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
| JP5495858B2 (ja) | 音楽音響信号のピッチ推定装置及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090907 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091204 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100126 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100202 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4454591 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 4 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |
