JPWO2006046293A1

JPWO2006046293A1 - 雑音抑圧装置

Info

Publication number: JPWO2006046293A1
Application number: JP2006542170A
Authority: JP
Inventors: 猛大谷; 光良松原; 遠藤　香緒里; 香緒里遠藤; 大田　恭士; 恭士大田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2004-10-28
Filing date: 2004-10-28
Publication date: 2008-05-22
Anticipated expiration: 2024-10-28
Also published as: CN101027719A; WO2006046293A1; CN101027719B; JP4423300B2; US20070232257A1; EP1806739B1; EP1806739A4; EP1806739A1

Abstract

本発明は、入力信号を複数の帯域に分割し、帯域信号を出力する周波数分割手段と、帯域信号の振幅成分を求める振幅算出手段と、入力信号に含まれる雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、帯域毎に異なる重み係数を発生する重み係数発生手段と、重み係数を用いて帯域信号の振幅成分を時間的に平滑化した平滑化振幅成分を求める振幅平滑化手段と、帯域毎に平滑化振幅成分と推定雑音振幅成分から抑圧係数を求める抑圧量算出手段と、帯域信号を抑圧係数に基づいて抑圧する雑音抑圧手段と、雑音抑圧手段が出力する複数の帯域の雑音抑圧後の帯域信号を合成して出力する周波数合成手段を有することにより、ミュージカルノイズの発生を抑えつつ、音声への影響を最小限にし、安定した雑音抑圧性能を実現できる。

Description

本発明は、雑音抑圧装置に関し、雑音が重畳した音声信号から雑音成分を低減させる雑音抑圧装置に関する。

携帯電話システムやＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）電話システム等において、マイクには話者の音声に加えて環境騒音が入力される。その結果、音声信号が劣化し、音声の明瞭感が損なわれる。そこで、劣化した音声信号から雑音成分を低減させ、通話品質を高める技術が従来から開発されている（例えば、非特許文献１及び特許文献１参照）。

図１は、従来の雑音抑圧装置の一例のブロック図を示す。同図中、時間周波数変換部１０は、単位時間（フレーム）毎に、現フレームｎの入力信号ｘ_ｎ（ｋ）を時間領域ｋから周波数領域ｆに変換し、入力信号の周波数領域信号Ｘ_ｎ（ｆ）を求める。振幅算出部１１は周波数領域信号Ｘ_ｎ（ｆ）から入力信号の振幅成分｜Ｘ_ｎ（ｆ）｜（以下、「入力振幅成分」という）を求める。雑音推定部１２は話者の音声が無い場合の入力振幅成分｜Ｘ_ｎ（ｆ）｜から推定雑音の振幅成分μ_ｎ（ｆ）（以下、「推定雑音振幅成分」という）を求める。

抑圧係数算出部１３は｜Ｘ_ｎ（ｆ）｜とμ_ｎ（ｆ）から（１）式にしたがって抑圧係数Ｇ_ｎ（ｆ）を求める。

雑音抑圧部１４はＸ_ｎ（ｆ）とＧ_ｎ（ｆ）から（２）式にしたがって雑音抑圧後の振幅成分Ｓ^＊ _ｎ（ｆ）を求める。

時間周波数変換部１５はＳ^＊ _ｎ（ｆ）を周波数領域から時間領域に変換し、雑音抑圧後の信号ｓ^＊ _ｎ（ｋ）を求める。

（非特許文献１）Ｓ．Ｆ．Ｂｏｌｌ，”ＳｕｐｒｅｓｓｉｏｎｏｆＡｃｏｕｓｔｉｃＮｏｉｓｅｉｎＳｐｅｅｃｈＵｓｉｎｇＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏｎ”，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，ＡＳＳＰ−３３，ｖｏｌ．２７，ｐｐ．１１３−１２０，１９７９
（特許文献１）特開２００４−２０６７９

図１では、推定雑音振幅成分μ_ｎ（ｆ）は、例えば、過去の話者の音声が含まれないフレームにおける入力信号の振幅成分を平均することで求める。このように背景雑音の平均的な（長期的な）傾向は過去の入力振幅成分に基づいて推定する。

図２は、従来の抑圧係数算出方法の一例の原理図を示す。同図中、抑圧係数算出部１６では、現フレームｎの振幅成分｜Ｘ_ｎ（ｆ）｜と推定雑音振幅成分μ_ｎ（ｆ）に基づいて抑圧係数Ｇ_ｎ（ｆ）を算出し、この抑圧係数を入力振幅成分に乗算することで、入力信号に含まれる雑音成分を抑圧する。

しかしながら、現フレームに重畳している（短期的な）雑音の振幅成分を正確に求めることは困難である。すなわち、現フレームに重畳している雑音の振幅成分と推定雑音振幅成分との間には推定誤差（以下、雑音推定誤差）が生じる。このため、図３に示すように、実線で示す雑音の振幅成分と、破線で示す推定雑音振幅成分との差である雑音推定誤差が大きくなる。

この結果、雑音抑圧装置において上記の雑音推定誤差は過剰抑圧や抑圧不足を引き起こす。さらに、雑音推定誤差がフレーム毎に大きく変動するので過剰抑圧や抑圧不足も変動し、雑音抑圧性能に時間的なムラが発生してしまう。この雑音抑圧性能の時間的なムラがミュージカルノイズ（ｍｕｓｉｃａｌｎｏｉｓｅ）として知られる異音を生じさせる。

図４は、従来の抑圧係数算出方法の他の一例の原理図を示す。このものは、雑音抑圧装置における過剰抑圧や抑圧不足に伴って発生する異音を抑止することを目的とした平均化雑音抑圧技術である。同図中、振幅平滑化部１７では現フレームｎの振幅成分｜Ｘ_ｎ（ｆ）｜の平滑化を行い、抑圧係数算出部１８は、平滑化後の入力信号の振幅成分Ｐ_ｎ（ｆ）（以下、「平滑化振幅成分」という）と、推定雑音振幅成分μ_ｎ（ｆ）に基づいて抑圧係数Ｇ_ｎ（ｆ）を求める。

振幅成分の平滑化方法としては、次の２つの方法が用いられる。
（第１の平滑化方法）
現フレームと過去数フレーム分の入力振幅成分の平均値を平滑化振幅成分Ｐ_ｎ（ｆ）とする。この方法は単純な平均化であり、平滑化振幅成分は（３）式により求めることができる。

（第２の平滑化方法）
現フレームの振幅成分｜Ｘ_ｎ（ｆ）｜と、直前フレームの平滑化振幅成分Ｐ_ｎ−１（ｆ）との荷重平均値を平滑化振幅成分Ｐ_ｎ（ｆ）とする。これは指数平滑化と呼ばれ、平滑化振幅成分は（４）式により求めることができる。

図４の抑圧係数算出方法では、抑圧係数を算出する前に入力振幅成分を平均化または指数平滑化することにより、話者の音声が入力されないときは、図５に示すように、実線で示す雑音の振幅成分と、破線で示す推定雑音振幅成分との差である雑音推定誤差を小さくできる。この結果、図２の抑圧係数算出で問題であった、雑音入力時の過剰抑圧や抑圧不足を抑えることができ、ミュージカルノイズを抑止することができる。

しかしながら、話者の音声が入力されるときには、図６に示すように平滑化振幅成分が鈍ってしまい、破線で示す音声信号の振幅成分と、実線で示す平滑化振幅成分との誤差（以下、「音声推定誤差」という）が大きくなる。

この結果、音声推定誤差の大きな平滑化振幅成分と推定雑音振幅に基づいて抑圧係数を求め、入力振幅成分に抑圧係数を乗算するので、入力信号に含まれる音声成分を誤って抑圧してしまい、音質の劣化を引き起こすという問題があった。この現象は特に音声の話頭（音声の始まりの区間）において顕著である。

本発明は、上記の点に鑑みなされたものであり、ミュージカルノイズの発生を抑えつつ、音声への影響を最小限にし、安定した雑音抑圧性能を実現する雑音抑圧装置を提供することを総括的な目的とする。

この目的を達成するため、本発明は、入力信号の振幅成分を帯域毎に求める振幅算出手段と、前記入力信号の雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、帯域毎に異なる重み係数を発生する重み係数発生手段と、前記帯域毎に異なる重み係数を用いて前記入力信号の振幅成分を時間的に平滑化し平滑化振幅成分を帯域毎に求める振幅平滑化手段と、前記平滑化振幅成分と前記推定雑音振幅成分から抑圧係数を帯域毎に求める抑圧量算出手段と、前記入力信号と前記抑圧係数から雑音を抑圧した音声信号を帯域毎に求め出力する雑音抑圧手段を有し構成する。

このような雑音抑圧装置によれば、ミュージカルノイズの発生を抑えつつ、音声への影響を最小限にし、安定した雑音抑圧性能を実現できる。

従来の雑音抑圧装置の一例のブロック図である。従来の抑圧係数算出方法の一例の原理図である。従来の雑音推定誤差を説明するための図である。従来の抑圧係数算出方法の他の一例の原理図従来の雑音推定誤差を説明するための図である。従来の音声推定誤差を説明するための図である。本発明における抑圧係数算出の原理図である。本発明における抑圧係数算出の原理図である。ＦＩＲフィルタを使用する場合の振幅平滑化部の構成図である。ＩＩＲフィルタを使用する場合の振幅平滑化部の構成図である。本発明における重み係数の一例を示す図である。平滑化振幅成分と推定雑音振幅成分から抑圧係数を求める関係式を示す図である。本発明の雑音推定誤差を説明するための図である。本発明の音声推定誤差を説明するための図である。雑音が重畳した音声の入力信号の波形図である。従来の雑音抑圧装置の出力音声信号の波形図である。本発明の雑音抑圧装置の出力音声信号の波形図である。本発明の雑音抑圧装置の第１実施形態のブロック図である。本発明の雑音抑圧装置の第２実施形態のブロック図である。本発明の雑音抑圧装置の第３実施形態のブロック図である。非線形関数ｆｕｎｃを示す図である。本発明の雑音抑圧装置の第４実施形態のブロック図である。信号対雑音比と重み係数の関係を示す図である。本発明の雑音抑圧装置の第５実施形態のブロック図である。本発明装置を適用した携帯電話の一実施形態のブロック図である。本発明装置を適用した携帯電話の他の実施形態のブロック図である。

符号の説明

２１振幅平滑化部
２２抑圧係数算出部
２３重み係数算出部
３０ＦＦＴ部
３１，４１振幅算出部
３２，４２雑音推定部
３３振幅平滑化部
３４振幅保持部
３５重み係数保持部
３６，４６抑圧係数算出部
３７，４７雑音抑圧部
４０チャンネル分割部
４３振幅平滑化部
４４振幅保持部
４５重み係数算出部
４８チャンネル合成部

以下、図面に基づいて本発明の実施形態について説明する。

本発明における抑圧係数算出の原理図を図７および図８に示す。本発明では図４と同様に、抑圧係数を算出する前に入力振幅成分の平滑化を行う。

図７において、振幅平滑化部２１では現フレームｎの振幅成分｜Ｘ_ｎ（ｆ）｜と重み係数ｗ_ｍ（ｆ）を用いて平滑化振幅成分Ｐ_ｎ（ｆ）を得る。抑圧係数算出部２２は、平滑化振幅成分Ｐ_ｎ（ｆ）と、推定雑音振幅成分μ_ｎ（ｆ）に基づいて抑圧係数Ｇ_ｎ（ｆ）を求める。

図８において、重み係数算出部２３は、入力振幅成分から特徴量（信号対雑音比や入力信号の振幅等）を算出し、特徴量に基づいて重み係数ｗ_ｍ（ｆ）を適応的に制御する。振幅平滑化部２１では現フレームｎの振幅成分｜Ｘ_ｎ（ｆ）｜と重み係数算出部２３からの重み係数ｗ_ｍ（ｆ）を用いて平滑化振幅成分Ｐ_ｎ（ｆ）を得る。抑圧係数算出部２２は、平滑化振幅成分Ｐ_ｎ（ｆ）と、推定雑音振幅成分μ_ｎ（ｆ）に基づいて抑圧係数Ｇ_ｎ（ｆ）を求める。

平滑化の方法としてはＦＩＲフィルタを使用する方法とＩＩＲフィルタを使用する方法があり、本発明ではいずれの平滑化方法を選択してもよい。
（ＦＩＲフィルタを使用する場合）
ＦＩＲフィルタを使用する場合の振幅平滑化部２１の構成を図９に示す。同図中、振幅保持部２５では、過去Ｎフレーム分の入力振幅成分（平滑化前の振幅成分）を保持する。さらに平滑化部２６において、過去Ｎフレーム分の平滑化前の振幅成分と、現在の振幅成分から（５）式にしたがって平滑化後の振幅成分を求める。

（ＩＩＲフィルタを使用する場合）
ＩＩＲフィルタを使用する場合の振幅平滑化部の構成を図１０に示す。同図中、振幅保持部２７では、過去Ｎフレーム分の平滑化後の振幅成分を保持する。さらに平滑化部２８において、過去Ｎフレーム分の平滑化後の振幅成分と、現在の振幅成分から（６）式にしたがって平滑化後の振幅成分を求める。

上記の（５），（６）式において、ｍはフィルタを構成する遅延素子数であり、ｗ_０（ｆ）〜ｗ_ｍ（ｆ）はフィルタを構成するｍ＋１個の乗算器それぞれの重み係数であり、この値を調整することで、入力信号を平滑化する際の平滑化の強さを制御することができる。

従来は（３），（４）式から明らかなように全周波数帯域において同じで重み係数を使用していたが、本発明では（５），（６）式のように、重み係数ｗ_ｍ（ｆ）は、周波数の関数として表わされ、帯域毎に異なる値を使用することを特徴としている。

図１１に本発明における重み係数ｗ_０（ｆ）の一例を示す。図１１では、入力信号の性質が低周波数帯域は変動しにくく高周波数帯域は変動しやすいことを想定しており、現フレームの振幅成分｜Ｘ_ｎ（ｆ）｜にかかる重み係数ｗ_０（ｆ）を実線に示すように低域で大きく高域で小さくなる値とすることで、高周波数帯域の変動に追随し、かつ、低周波数帯域には平滑化をより強くかけている。なお、帯域毎に重み係数の時間的な総和は１とされており、ｗ_１（ｆ）＝１−ｗ_０（ｆ）とした場合、ｗ_１（ｆ）は一点鎖線に示すようになる。

また、従来の（４）式は重み係数としての平滑化係数αが定数であったが、本発明では、重み係数ｗ_ｍ（ｆ）を変数として、図８に示す重み係数算出部２３で入力振幅成分から信号対雑音比や入力信号の振幅などの特徴量を算出し、特徴量に基づいて重み係数を適応的に制御する。

平滑化振幅成分Ｐ_ｎ（ｆ）と推定雑音振幅成分μ_ｎ（ｆ）から抑圧係数Ｇ_ｎ（ｆ）を求める際の関係式としては、任意のものを選択可能である。例えば（１）式を用いても良く、さらには、図１２に示すような関係式を適用しても良い。図１２では、Ｐ_ｎ（ｆ）／μ_ｎ（ｆ）が小さくなるほどＧ_ｎ（ｆ）を小さくしている。

本発明の雑音抑圧装置では、抑圧係数を算出する前に入力振幅成分を平滑化するため、話者の音声が入力されないときは、図１３に示すように、実線で示す雑音の振幅成分と、破線で示す推定雑音振幅成分との差である雑音推定誤差を小さくできる。

さらに、話者の音声が入力されるときにも、図１４に示すように、破線で示す音声信号の振幅成分と、実線で示す平滑化振幅成分との差である音声推定誤差を小さくできる。この結果、音声への影響を最小限にしつつ、ミュージカルノイズの発生を抑え安定した雑音抑圧性能を実現できる。

ここで、図１５に示すように、雑音が重畳した音声の入力信号が供給された場合、図４の抑圧係数算出方法を用いた従来の雑音抑圧装置の出力音声信号は図１６に示す波形となり、本発明の雑音抑圧装置の出力音声信号は図１７に示す波形となる。

図１６の波形と図１７の波形を比べてみると、話頭の区間τにおいて、図１７の波形の劣化が小さいことが分かる。それぞれの出力音を比較するために、雑音入力時の抑圧性能を音声が無い区間で測定し、音声入力時の音質劣化を話頭の区間で測定した結果を以下に示す。

雑音入力時の抑圧性能（非音声区間で測定）は、従来の雑音抑圧装置が約１４ｄＢで、本発明の雑音抑圧装置が約１４ｄＢである。音声入力時の音質劣化（音声の話頭区間で測定）は、従来の雑音抑圧装置が約４ｄＢであるのに対し、本発明の雑音抑圧装置は約１ｄＢとなり、約３ｄＢ改善される。これにより、本発明は音声入力時に音声成分の抑圧を小さくして音質劣化を軽減することが可能となる。

図１８は、本発明の雑音抑圧装置の第１実施形態のブロック図を示す。この実施形態はチャネル分割・合成にＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）／ＩＦＦＴ（ＩｎｖｅｒｓｅＦＦＴ）を使用し、ＦＩＲフィルタによる平滑化方法を採用し、抑圧係数の算出には（１）式を採用している。

同図中、ＦＦＴ部３０は、単位時間（フレーム）毎に、現フレームｎの入力信号ｘ_ｎ（ｋ）を時間領域ｋから周波数領域ｆに変換し、入力信号の周波数領域信号Ｘ_ｎ（ｆ）を求める。なお、添字ｎはフレーム番号を表している。

振幅算出部３１は周波数領域信号Ｘ_ｎ（ｆ）から入力振幅成分｜Ｘ_ｎ（ｆ）｜を求める。雑音推定部３２は音声区間検出を行い、話者音声の非検出時に入力振幅成分｜Ｘ_ｎ（ｆ）｜から（７）式にしたがって推定雑音振幅成分μ_ｎ（ｆ）を求める。

振幅平滑化部３３は、入力振幅成分｜Ｘ_ｎ（ｆ）｜と、振幅保持部３４で保持している直前フレームの入力振幅成分｜Ｘ_ｎ−１（ｆ）｜と、重み係数保持部３５で保持している重み係数ｗ_ｍ（ｆ）から（８）式にしたがって平均化振幅成分Ｐ_ｎ（ｆ）を求める。ただし、ｆ_Ｓは音声をデジタル化する際のサンプリング周波数である。また、重み係数ｗ_ｍ（ｆ）は図１１に示すものとする。

抑圧係数算出部３６は、平均化振幅成分Ｐ_ｎ（ｆ）と推定雑音振幅成分μ_ｎ（ｆ）から（９）式にしたがって抑圧係数Ｇ_ｎ（ｆ）を求める。

雑音抑圧部３７は、Ｘ_ｎ（ｆ）とＧ_ｎ（ｆ）から（１０）式にしたがって雑音抑圧後の振幅成分Ｓ^＊ _ｎ（ｆ）を求める。

ＩＦＦＴ部３７は、振幅成分Ｓ^＊ _ｎ（ｆ）を周波数領域から時間領域に変換し、雑音抑圧後の信号ｓ^＊ _ｎ（ｋ）を求める。

図１９は、本発明の雑音抑圧装置の第２実施形態のブロック図を示す。この実施形態はチャネル分割・合成にバンドパスフィルタを使用し、ＦＩＲフィルタによる平滑化方法を採用し、抑圧係数の算出には（１）式を採用している。

同図中、チャンネル分割部４０は、帯域フィルタ（ＢＰＦ）を用いて入力信号ｘ_ｎ（ｋ）を（１１）式にしたがって帯域信号ｘ_ＢＰＦ（ｉ，ｋ）に分割する。なお、添字ｉはチャンネル番号を表す。

振幅算出部４１は、帯域信号ｘ_ＢＰＦ（ｉ，ｋ）から各フレームにおいて（１２）式にしたがって帯域別入力振幅Ｐｏｗ（ｉ，ｎ）を算出する。なお、添字ｎはフレーム番号を表す。

雑音推定部４２は音声区間検出を行い話者音声の非検出時に帯域別入力振幅成分Ｐｏｗ（ｉ，ｎ）から（１３）式にしたがって推定雑音の振幅成分μ（ｉ，ｎ）を求める。

重み係数算出部４５は、帯域別入力振幅成分Ｐｏｗ（ｉ，ｎ）を所定の閾値ＴＨＲ１と比較して重み係数ｗ（ｉ，ｍ）を算出する。ただし、ｍ＝０，１，２とする。
Ｐｏｗ（ｉ，ｎ）≧ＴＨＲ１のとき、
ｗ（ｉ，０）＝０．７
ｗ（ｉ，１）＝０．２
ｗ（ｉ，２）＝０．１
Ｐｏｗ（ｉ，ｎ）＜ＴＨＲ１のとき、
ｗ（ｉ，０）＝０．４
ｗ（ｉ，１）＝０．３
ｗ（ｉ，２）＝０．３
つまり、チャンネル毎に重み係数の時間的な総和は１とされている。

振幅平滑化部４３は、振幅保持部４４で保持している帯域別入力振幅成分Ｐｏｗ（ｉ，ｎ−１），Ｐｏｗ（ｉ，ｎ−２）と、振幅算出部４１からの帯域別入力振幅成分Ｐｏｗ（ｉ，ｎ）と、重み係数ｗ（ｉ，ｍ）から（１４）式にしたがって平滑化入力振幅成分Ｐｏｗ_ＡＶ（ｉ，ｎ）を算出する。

抑圧係数算出部４６は、平滑化入力振幅成分Ｐｏｗ_ＡＶ（ｉ，ｎ）と推定雑音振幅成分μ（ｉ，ｎ）から（１５）式により抑圧係数Ｇ（ｉ，ｎ）を算出する。

雑音抑圧部４７において、帯域信号ｘ_ＢＰＦ（ｉ，ｋ）と抑圧係数Ｇ（ｉ，ｎ）から（１６）式にしたがって雑音抑圧後の帯域信号ｓ^＊ _ＢＰＦ（ｉ，ｋ）を求める。

チャンネル合成部４８は加算回路で構成され、帯域信号ｓ^＊ _ＢＰＦ（ｉ，ｋ）を（１７）式にしたがって加算合成して出力音声信号ｓ^＊（ｋ）を求める。

図２０は、本発明の雑音抑圧装置の第３実施形態のブロック図を示す。この実施形態はチャネル分割・合成にＦＦＴ／ＩＦＦＴを使用し、ＩＩＲフィルタによる平滑化方法を採用し、抑圧係数の算出には非線形関数を採用している。

振幅平滑化部５１は、入力振幅成分｜Ｘ_ｎ（ｆ）｜と、振幅保持部５２で保持している過去２フレームの平均化振幅成分Ｐ_ｎ−１（ｆ），Ｐ_ｎ−２（ｆ）と、重み係数保持部５３で保持している重み係数ｗ_ｍ（ｆ）から（１８）式にしたがって平均化振幅成分Ｐ_ｎ（ｆ）を求める。

重み係数算出部５３は、平均化振幅成分Ｐ_ｎ（ｆ）を所定の閾値ＴＨＲ２と比較して重み係数ｗ_ｍ（ｆ）を算出する。ただし、ｍ＝０，１，２とする。
Ｐ_ｎ（ｆ）≧ＴＨＲ２のとき、
ｗ_ｍ（ｆ）＝１．０
ｗ_ｍ（ｆ）＝０．０
ｗ_ｍ（ｆ）＝０．０
Ｐ_ｎ（ｆ）＜ＴＨＲ２のとき、
ｗ_ｍ（ｆ）＝０．６
ｗ_ｍ（ｆ）＝０．２
ｗ_ｍ（ｆ）＝０．２
つまり、帯域毎に重み係数の時間的な総和は１とされている。

抑圧係数算出部５４は、平均化振幅成分Ｐ_ｎ（ｆ）と推定雑音振幅成分μ_ｎ（ｆ）から（１９）式に示す非線形関数ｆｕｎｃを用いて抑圧係数Ｇ_ｎ（ｆ）を求める。なお、非線形関数ｆｕｎｃを図２１に示す。

雑音抑圧部３７は、Ｘ_ｎ（ｆ）とＧ_ｎ（ｆ）から（１０）式にしたがって雑音抑圧後の振幅成分Ｓ^＊ _ｎ（ｆ）を求める。ＩＦＦＴ部３７は、振幅成分Ｓ^＊ _ｎ（ｆ）を周波数領域から時間領域に変換し、雑音抑圧後の信号ｓ^＊ _ｎ（ｋ）を求める。

このように、重み係数を平滑化後の振幅成分に基づいて制御することにより、非定常な雑音に強固で安定した制御が可能となる。

図２２は、本発明の雑音抑圧装置の第４実施形態のブロック図を示す。この実施形態はチャネル分割・合成にＦＦＴ／ＩＦＦＴを使用し、ＦＩＲフィルタによる平滑化方法を採用し、抑圧係数の算出には非線形関数を採用している。

信号対雑音比計算部５６は、現フレームの入力振幅成分｜Ｘ_ｎ（ｆ）｜と、推定雑音振幅成分μ_ｎ（ｆ）から、（２０）式にしたがって帯域毎に信号対雑音比ＳＮＲ_ｎ（ｆ）を求める。

重み係数算出部５７は、信号対雑音比ＳＮＲ_ｎ（ｆ）から重み係数ｗ_０（ｆ）を求める。なお、ＳＮＲ_ｎ（ｆ）とｗ_０（ｆ）の関係を図２３に示す。また、ｗ_０（ｆ）からｗ_１（ｆ）を（２１）式にしたがって算出する。つまり、帯域毎に重み係数の時間的な総和は１とされている。

振幅平滑化部５８は、現フレームの入力振幅成分｜Ｘ_ｎ（ｆ）｜と、振幅保持部３４で保持している直前フレームの入力振幅成分｜Ｘ_ｎ−１（ｆ）｜と、重み係数算出部５７からの重み係数ｗ_ｍ（ｆ）即ちｗ_０（ｆ），ｗ_１（ｆ）から（２２）式にしたがって平均化振幅成分Ｐ_ｎ（ｆ）を求める。

抑圧係数算出部３６は、平均化振幅成分Ｐ_ｎ（ｆ）と推定雑音振幅成分μ_ｎ（ｆ）から（９）式にしたがって抑圧係数Ｇ_ｎ（ｆ）を求める。雑音抑圧部３７は、Ｘ_ｎ（ｆ）とＧ_ｎ（ｆ）から（１０）式にしたがって雑音抑圧後の振幅成分Ｓ^＊ _ｎ（ｆ）を求める。ＩＦＦＴ部３７は、振幅成分Ｓ^＊ _ｎ（ｆ）を周波数領域から時間領域に変換し、雑音抑圧後の信号ｓ^＊ _ｎ（ｋ）を求める。

このように、重み係数を信号対雑音比に基づいて制御することにより、マイクの音量によらず安定した制御が可能となる。

図２４は、本発明の雑音抑圧装置の第５実施形態のブロック図を示す。この実施形態はチャネル分割・合成にＦＦＴ／ＩＦＦＴを使用し、ＩＩＲフィルタによる平滑化方法を採用し、抑圧係数の算出には非線形関数を採用している。

振幅平滑化部５１は、入力振幅成分｜Ｘ_ｎ（ｆ）｜と、振幅保持部５２で保持している過去２フレームの平均化振幅成分Ｐ_ｎ−１（ｆ），Ｐ_ｎ−２（ｆ）と、重み係数保持部６１からの重み係数ｗ_ｍ（ｆ）から（１８）式にしたがって平均化振幅成分Ｐ_ｎ（ｆ）を求める。

信号対雑音比計算部６０において、平滑化振幅成分Ｐ_ｎ（ｆ）と、推定雑音振幅成分μ_ｎ（ｆ）から、（２３）式にしたがって帯域毎に信号対雑音比ＳＮＲ_ｎ（ｆ）を算出する。

重み係数算出部６１は、信号対雑音比ＳＮＲ_ｎ（ｆ）から重み係数ｗ_０（ｆ）を求める。なお、ＳＮＲ_ｎ（ｆ）とｗ_０（ｆ）の関係を図２３に示す。また、ｗ_０（ｆ）からｗ_１（ｆ）を（２１）式にしたがって算出する。

抑圧係数算出部５４は、平均化振幅成分Ｐ_ｎ（ｆ）と推定雑音振幅成分μ_ｎ（ｆ）から（１９）式に示す非線形関数ｆｕｎｃを用いて抑圧係数Ｇ_ｎ（ｆ）を求める。雑音抑圧部３７は、Ｘ_ｎ（ｆ）とＧ_ｎ（ｆ）から（１０）式にしたがって雑音抑圧後の振幅成分Ｓ^＊ _ｎ（ｆ）を求める。ＩＦＦＴ部３７は、振幅成分Ｓ^＊ _ｎ（ｆ）を周波数領域から時間領域に変換し、雑音抑圧後の信号ｓ^＊ _ｎ（ｋ）を求める。

このように、重み係数を平滑化後の信号対雑音比に基づいて制御することにより、非定常な雑音に強固で安定した制御が可能となり、マイクの音量によらず安定した制御が可能る。

図２５は、本発明装置を適用した携帯電話の一実施形態のブロック図を示す。同図中、マイクロホン７１の出力音声信号は、本発明の雑音抑圧装置７０にて雑音抑圧されたのちエンコーダ７２で符号化され、送信部７３から公衆網７４に送出される。

図２６は、本発明装置を適用した携帯電話の他の実施形態のブロック図を示す。同図中、公衆網７４から送信された信号は受信部７５で受信され、デコーダ７６にて復号され、本発明の雑音抑圧装置７０にて雑音抑圧される。こののち、スピーカ７７に供給され発音される。

なお、図２５と図２６を複合化して送話系と受話系の双方に本発明の雑音抑圧装置７０を設けても良い。

なお、振幅算出部３１，４１が請求項記載の振幅算出手段に対応し、雑音推定部３２，４２が雑音推定手段に対応し、重み係数保持部３５，重み係数算出部４５，信号対雑音比計算部５６，６０が重み係数発生手段に対応し、振幅平滑化部３３，４３が振幅平滑化手段に対応し、抑圧係数算出部３６，４６が抑圧量算出手段に対応し、３７，４７が雑音抑圧手段に対応し、ＦＦＴ部３０，チャンネル分割部４０が周波数分割手段に対応し、ＩＦＦＴ部３８，チャンネル合成部４８が周波数合成手段に対応する。

重み係数算出部５３は、平均化振幅成分Ｐ_ｎ（ｆ）を所定の閾値ＴＨＲ２と比較して重み係数ｗ_ｍ（ｆ）を算出する。ただし、ｍ＝０，１，２とする。
Ｐ_ｎ（ｆ）≧ＴＨＲ２のとき、
ｗ_０（ｆ）＝１．０
ｗ_１（ｆ）＝０．０
ｗ_２（ｆ）＝０．０
Ｐ_ｎ（ｆ）＜ＴＨＲ２のとき、
ｗ_０（ｆ）＝０．６
ｗ_１（ｆ）＝０．２
ｗ_２（ｆ）＝０．２
つまり、帯域毎に重み係数の時間的な総和は１とされている。

振幅平滑化部５１は、入力振幅成分｜Ｘ_ｎ（ｆ）｜と、振幅保持部５２で保持している過去２フレームの平均化振幅成分Ｐ_ｎ−１（ｆ），Ｐ_ｎ−２（ｆ）と、重み係数算出部６１からの重み係数ｗ_ｍ（ｆ）から（１８）式にしたがって平均化振幅成分Ｐ_ｎ（ｆ）を求める。

なお、振幅算出部３１，４１が請求項記載の振幅算出手段に対応し、雑音推定部３２，４２が雑音推定手段に対応し、重み係数保持部３５，重み係数算出部４５，信号対雑音比計算部５６，６０が重み係数発生手段に対応し、振幅平滑化部３３，４３が振幅平滑化手段に対応し、抑圧係数算出部３６，４６が抑圧量算出手段に対応し、雑音抑圧部３７，４７が雑音抑圧手段に対応し、ＦＦＴ部３０，チャンネル分割部４０が周波数分割手段に対応し、ＩＦＦＴ部３８，チャンネル合成部４８が周波数合成手段に対応する。

Claims

入力信号を複数の帯域に分割し、帯域信号を出力する周波数分割手段と、
前記帯域信号の振幅成分を求める振幅算出手段と、
前記入力信号に含まれる雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、
帯域毎に異なる重み係数を発生する重み係数発生手段と、
前記重み係数を用いて前記帯域信号の振幅成分を時間的に平滑化した平滑化振幅成分を求める振幅平滑化手段と、
帯域毎に前記平滑化振幅成分と前記推定雑音振幅成分から抑圧係数を求める抑圧量算出手段と、
前記帯域信号を前記抑圧係数に基づいて抑圧する雑音抑圧手段と、
前記雑音抑圧手段が出力する複数の帯域の雑音抑圧後の帯域信号を合成して出力する周波数合成手段を
有することを特徴とする雑音抑圧装置。
入力信号を複数の帯域に分割し、帯域信号を出力する周波数分割手段と、
前記帯域信号の振幅成分を求める振幅算出手段と、
前記入力信号に含まれる雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、
重み係数を時間的に変化させ、出力する重み係数発生手段と、
前記重み係数を用いて前記帯域信号の振幅成分を時間的に平滑化した平滑化振幅成分を求める振幅平滑化手段と、
帯域毎に前記平滑化振幅成分と前記推定雑音振幅成分から抑圧係数を求める抑圧量算出手段と、
前記帯域信号を前記抑圧係数に基づいて抑圧する雑音抑圧手段と、
前記雑音抑圧手段が出力する複数の帯域の雑音抑圧後の帯域信号を合成して出力する周波数合成手段を
有することを特徴とする雑音抑圧装置。
請求項１または２記載の雑音抑圧装置において、
前記重み係数発生手段は、予め設定された重み係数を出力することを特徴とする雑音抑圧装置。
請求項１または２記載の雑音抑圧装置において、
前記重み係数発生手段は、前記入力信号の振幅成分に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
請求項１または２記載の雑音抑圧装置において、
前記重み係数発生手段は、前記平滑化振幅成分に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
請求項１または２記載の雑音抑圧装置において、
前記重み係数発生手段は、前記入力信号の振幅成分と前記推定雑音振幅成分の比に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
請求項１または２記載の雑音抑圧装置において、
前記重み係数発生手段は、前記平滑化振幅成分と前記推定雑音振幅成分の比に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
請求項１乃至７のいずれか記載の雑音抑圧装置において、
前記重み係数発生手段は、時間的な総和が１となる重み係数を発生することを特徴とする雑音抑圧装置。
請求項１乃至８のいずれか記載の雑音抑圧装置において、
前記周波数分割手段は、高速フーリエ変換器であり、
前記周波数合成手段は、高速逆フーリエ変換器であることを特徴とする雑音抑圧装置。
請求項１乃至８のいずれか記載の雑音抑圧装置において、
前記周波数分割手段は、複数のバンドパスフィルタで構成され、
前記周波数合成手段は、加算回路で構成されたことを特徴とする雑音抑圧装置。
請求項１乃至１０のいずれか記載の雑音抑圧装置において、
前記振幅平滑化手段は、現在の入力信号の振幅成分と過去の入力信号の振幅成分を前記重み係数にしたがって帯域毎に重みづけ加算することを特徴とする雑音抑圧装置。
請求項１乃至１０のいずれか記載の雑音抑圧装置において、
前記振幅平滑化手段は、現在の入力信号の振幅成分と過去の平滑化振幅成分を前記重み係数にしたがって帯域毎に重みづけ加算することを特徴とする雑音抑圧装置。
請求項１乃至１２のいずれか記載の雑音抑圧装置において、
前記重み係数発生手段は、低域で大きく高域で小さくなる値の重み係数を発生することを特徴とする雑音抑圧装置。