JP2008065090A

JP2008065090A - ノイズサプレス装置

Info

Publication number: JP2008065090A
Application number: JP2006243407A
Authority: JP
Inventors: Takehiko Isaka; 岳彦井阪
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2006-09-07
Filing date: 2006-09-07
Publication date: 2008-03-21
Anticipated expiration: 2026-09-07
Also published as: US20080075300A1; US8270633B2; JP4836720B2

Abstract

【課題】雑音区間での抑圧性能を維持しつつ、音声区間の高域における過剰な抑圧を軽減することができるノイズサプレス装置を提供する。
【解決手段】雑音抑圧量計算部３１は、信号対雑音比ＳＮＲ（ｋ）を用いて、雑音抑圧量Ｇ（ｋ）を計算する。雑音抑圧量上限計算部３２は、帯域全体の信号対雑音比ＳＮＲ_ａｌｌを用いて、雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）＝ｌｏｇ１０[ｐｏｗ｛１０、−（ＳＮＲ_ａｌｌ・Ａ−（Ｂ−ｋ／Ｎ・Ｃ））／２０｝／Ｄ]として計算する（Ａ、Ｂ、Ｃ、Ｄは定数）。雑音抑圧量上限制限部３３は、雑音抑圧量Ｇ（ｋ）と雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）を用いて、ゲインＧ_ｎｅｗ（ｋ）＝ｐｏｗ[１０、ＭＡＸ｛−Ｇ（ｋ）、−Ｇ_ＭＡＸ（ｋ）｝]として計算する。このように、雑音抑圧量Ｇ（ｋ）を上限Ｇ_ＭＡＸ（ｋ）によって制限することで、過剰な抑圧による音のかすれを軽減する効果が得られる。
【選択図】図４

Description

本発明は、目的信号以外の雑音を抑圧するノイズサプレス装置に関する。

目的信号以外の雑音を抑圧する雑音抑圧装置がある（特許文献１参照。）。この雑音抑圧装置は、周波数帯域の高域ほどＳＮＲ（信号雑音比）の感度を上げることによって、高域の過剰な抑圧を防いでいる。
特許第３４５４２０６号公報（第８〜１２頁、図３）

従来の雑音抑圧装置では、音声区間では過剰な抑圧が軽減されるが、雑音区間での抑圧性能が劣化するという副作用が発生する問題点がある。本発明は、上記の問題点を解決するためになされたもので、雑音区間での抑圧性能を維持しつつ、音声区間の高域における過剰な抑圧を軽減することができるノイズサプレス装置を提供することを目的とする。

上記目的を達成するために、本発明のノイズサプレス装置は、所定の時間幅の時間波形を振幅成分と位相成分との周波数成分に変換する周波数変換手段と、前記振幅成分を用いて帯域毎の帯域パワーを計算する帯域パワー計算手段と、前記帯域パワーを用いて帯域毎の雑音パワーを推定する雑音推定手段と、前記雑音推定手段で推定された帯域毎の雑音パワーと前記帯域パワーとを用いて帯域毎の信号対雑音比と帯域全体の信号対雑音比とを計算するＳＮＲ計算手段と、前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比と帯域全体の信号対雑音比とを用いて雑音を抑圧するためのゲインを算出するゲイン算出手段と、前記周波数変換手段で変換された振幅成分を前記ゲインで重み付けるゲイン加重手段と、前記周波数変換手段で変換された位相成分と前記ゲイン加重手段で重み付けされた振幅成分とから時間波形を生成する周波数逆変換手段とを有するノイズサプレス装置であって、前記ゲイン算出手段は、前記ＳＮＲ計算手段で計算された帯域全体の信号対雑音比を用いて雑音抑圧量の上限を帯域毎に計算する雑音抑圧量上限計算手段と、前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比を用いて帯域毎の雑音抑圧量を求める雑音抑圧量計算手段と、前記雑音抑圧量上限計算手段で計算された上限で当該雑音抑圧量を制限してゲインを算出する雑音抑圧量上限制限手段とを具備することを特徴とする。

本発明によれば、雑音区間での抑圧性能を維持しつつ、音声区間の高域における過剰な抑圧を軽減することができる。

図１は、本発明の各実施例に係るノイズサプレス装置が適用された移動通信端末装置の構成を示すブロック図である。この移動通信端末装置１００は、制御部１、アンテナ２、通信部３、送受信部４、スピーカ５、マイクロホン６、通話部７、表示部８、入力部９などから構成される。

制御部１は、移動通信端末装置１００全体の制御を行う。アンテナ２は基地局（図示せず）との間で電波の送信受信を行う。通信部３は、変調復調処理などを行う。送受信部４は、画像データや音声データの送信受信処理などを行う。スピーカ５とマイクロホン６は、移動通信端末装置１００のユーザとの間の音声入出力インターフェースである。通話部７は、音声処理を行う。この通話部７に、ノイズサプレス部（ノイズサプレス装置）がある。表示部８と入力部９は、ユーザとの間の表示およびキー入力などのインターフェースである。この中の通話部７の詳細について次に説明する。

図２は、本発明の各実施例に係る通話部の詳細な構成を示すブロック図である。通話部７は、音声復号部１１、ＤＡ変換器１２、増幅器１３、増幅器１４、ＡＤ変換器１５、ノイズサプレス部１６（ノイズサプレス装置）、音声符号部１７などから構成される。
音声復号部１１は、送受信部４からの圧縮された音声信号を復号処理する。ＤＡ変換器１２は、それをＤＡ変換する。増幅器１３は、それを増幅して、スピーカ５へ送出する。

増幅器１４は、マイクロホン６からの音声信号を増幅する。ＡＤ変換器１５はそれをＡＤ変換する。ノイズサプレス部１６は、その信号に対して、ノイズの抑圧処理を行う。音声符号部１７は、それに対して、音声圧縮処理を行い、送受信部４へ送出する。この中のノイズサプレス部１６の詳細について、以下の実施例１、実施例２で説明する。

図３は、本発明の実施例１に係るノイズサプレス部の詳細な構成を示すブロック図である。ノイズサプレス部１６は、周波数変換部２１、帯域パワー計算部２２、雑音推定部２３、ＳＮＲ計算部２４、ゲイン算出部２５、ゲイン加重部２６、周波数逆変換部２７などから構成される。この中のゲイン算出部２５は、更に次の構成を備える。
図４は、本発明の実施例１に係るゲイン算出部の詳細な構成を示すブロック図である。ゲイン算出部２５は、雑音抑圧量計算部３１、雑音抑圧量上限計算部３２、雑音抑圧量上限制限部３３などから構成される。

図３および図４により、ノイズサプレス部１６の各部の動作を説明する。まず、周波数変換部２１は、音声信号ｘ（ｔ）を所定時間長ずつ例えば１２８個ずつフレームに分割し、これらのフレームごとに時間／周波数領域変換処理を行う。これによりフレーム番号ｊにおける振幅スペクトル｜Ｘ（ｎ、ｊ）｜（ｎ＝０〜Ｎ−１。Ｎはフレーム長。）と位相スペクトルＰ（ｎ、ｊ）を得る。以下では、記述の簡略化のため、基本的に絶対値記号｜とフレーム番号ｊを省略して、振幅スペクトルＸ（ｎ）と称するが、数式の説明などでフレーム番号を区別する必要がある場合は、記述する。

なお、周波数変換部２１は、時間／周波数領域変換処理に先立って、スペクトル包絡を平坦化することを目的として、入力されたディジタル音声信号ｘ（ｔ）に対しプレエンファシス処理を設けたり、直流分をカットすることを目的として、ハイパスフィルタを設けたりしてもよい。

また、時間／周波数領域変換処理のフレーム長とシフト幅は同じでなくてもよく、例えばフレーム長を１２８、シフト幅を８０とした場合には、８０サンプル分の入力ディジタル音声信号ｘ（ｔ）をフレーム前半部に格納し、残りの４８サンプルについては０とした後に境界の不連続性を排除するために正弦波特性の窓掛けを行ってもよい。プレエンファシスおよび窓掛けのより具体的な手法は、米国ＴＩＡで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC、1997-01に詳述されている。

このように時間／周波数領域変換によって得られた振幅スペクトルＸ（ｎ）は、帯域パワー計算部２２及びゲイン加重部２６に出力される。また、位相スペクトルＰ（ｎ）は、周波数逆変換部２７に出力される。

帯域パワー計算部２２は、振幅スペクトルＸ（ｎ）を低域から高域まで例えば１６個の周波数帯域に分割し、これらの周波数帯域ごとに平均をとって各周波数帯域を代表する帯域パワーＸｄ（ｋ）（ｋ＝０〜Ｋ−１。Ｋは周波数帯域数で、例えば１６。ｋが小さい方が低域、大きい方が高域とする。）を算出する。ここでは、等間隔に分割する例を示したが、バークスケールやメルスケール等のように、低域ほど分割幅を狭くして、人間の聴覚特性に適した分割幅を採用してもよい。また、瞬時的な変動の大きい振幅スペクトルのパワーを用いるよりも安定したパワーを得ることを目的として、周波数帯域に分割する例を示したが、特定の帯域（例えば、低域あるいは全帯域）で振幅スペクトルのパワーそのものを用いて、より細かく処理してもよい。このようにして求められた各周波数帯域を代表する帯域パワーＸｄ（ｋ）は、雑音推定部２３に出力される。

雑音推定部２３は、求められた各周波数帯域を代表する帯域パワーＸｄ（ｋ）を用いて、帯域毎の雑音帯域パワーＮｄ（ｋ）を推定する。雑音推定部２３は、その区間に音声が存在するか否か、もしくは両者の中間状態も考慮してどれぐらい雑音らしいかを判定し、この判定結果に応じて、雑音帯域パワーＮｄ（ｋ）を推定する。

具体的には、雑音と判定された区間のパワーをそのまま雑音帯域パワーＮｄ（ｋ）としてもよいし、雑音区間と判定された現在を含む過去Ｍ個のフレームの平均パワーを用いてもよい。また、雑音と判定されたときに巡回フィルタによって過去の推定雑音との重み付き和を用いてもよいし、雑音らしいと判定されたときほどその区間を重視して、重み付けを行ってもよい。このように、音声の影響、雑音の瞬時的な変動を受けにくくして、定常的な雑音成分の近似値を雑音帯域パワーＸｄ（ｋ）として推定する。

これらの判定処理と推定処理は、帯域毎に行ってもよいし、複数帯域を一つにまとめて行ってもよいし、両者の重み付き和でもよい。このようにして算出された雑音帯域パワーＮｄ（ｋ）は、ＳＮＲ計算部２４に出力される。

ＳＮＲ計算部２４は、帯域パワーＸｄ（ｋ）及び雑音帯域パワーＮｄ（ｋ）を用いて、帯域毎の信号対雑音比ＳＮＲ（ｋ）をＳＮＲ（ｋ）＝Ｘｄ（ｋ）／Ｎｄ（ｋ）と計算する。また、帯域全体の信号対雑音比ＳＮＲ_ａｌｌをＳＮＲ_ａｌｌ＝Σ（ｋ＝０〜Ｋ−１）Ｘｄ（ｋ）／Σ（ｋ＝０〜Ｋ−１）Ｎｄ（ｋ）と計算する。あるいは、ＳＮＲ_ａｌｌ＝（１／Ｋ）×Σ（ｋ＝０〜Ｋ−１）ＳＮＲ（ｋ）のように、帯域毎のＳＮＲ（ｋ）の平均値としてもよいし、ＳＮＲ_ａｌｌ＝（１／Ｋ）×ｍａｘ（ｋ＝０〜Ｋ−１）｛ＳＮＲ（ｋ）｝のように帯域毎のＳＮＲ（ｋ）の最大値としてもよい。要するに、ＳＮＲ_ａｌｌは帯域全体のＳＮＲを表すパラメータであればよく、これらに限定されるものではない。このように計算されたＳＮＲ（ｋ）、ＳＮＲ_ａｌｌは、ゲイン算出部２５の雑音抑圧量計算部３１及び雑音抑圧量上限計算部３２に出力される。

雑音抑圧量計算部３１は、信号対雑音比ＳＮＲ（ｋ）を用いて、雑音抑圧量Ｇ（ｋ）を計算する。具体的な計算方法としては、例えば、文献（S. F. Boll、 "Suppression of acoustic noise in speech using spectral subtraction、" IEEE Trans. ASSP、 vol. 27、 no. 2、 pp. 113-120、 Feb. 1979（１１４頁、第２章Ｃ項））に開示されている、いわゆるスペクトルサブトラクション(Spectral Subtraction：SS)法がある。

あるいは、Y. Ephraim et al.、 "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator、" ASSP、 vol. 32、 no. 6、 pp. 1109-1121、 1984（１１１８頁、式（５３））に開示されている、いわゆるＭＭＳＥ-ＳＴＳＡ法や、J. S. Lim and A. V. Oppenheim、 "Enhancement and Bandwidth Compression of Noisy Speech、" Proc. of the IEEE、 vol.67、 pp. 1586-1604、 Dec. 1979 に開示されているウィーナーフィルタ法などが代表的である。ＭＭＳＥ-ＳＴＳＡ法では、１フレーム前に抑圧された振幅スペクトル｜Ｙ（ｎ，ｊ）｜も用いるため、点線で示した信号線２６ａが追加になる。

これらの方法は、信号対雑音比ＳＮＲ（ｋ）が大きいときほど、帯域ｋのゲインを１（すなわち抑圧量＝０ｄＢ）に近付け、ＳＮＲ（ｋ）が小さいときほど、帯域ｋのゲインを０または正の下限値に近付けることによって、入力信号中の雑音成分を抑圧する方法である。つまり、雑音らしい帯域ほどゲインを小さくして、雑音を抑圧する。雑音抑圧量Ｇ（ｋ）の計算方法は、これに限るものではない。このようにして求められた雑音抑圧量Ｇ（ｋ）は、雑音抑圧量上限制限部３３に出力される。

雑音抑圧量上限計算部３２は、帯域全体の信号対雑音比ＳＮＲ_ａｌｌを用いて、雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）を次の（式１）として計算する。
Ｇ_ＭＡＸ（ｋ）＝ｌｏｇ１０[ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝／Ｄ] ・・・（式１）
ここで、Ａ，Ｂ，Ｃ，Ｄは所定の定数であり、例えば、Ａ＝１，Ｂ＝６０，Ｃ＝８０，Ｄ＝１０である。
ｋは周波数帯域であり、ｋ＝０〜Ｋ−１。Ｋは周波数帯域数で、例えば１６。ｋが小さい方が低域、大きい方が高域である。
Ｎはフレーム長である。
ＳＮＲ_ａｌｌは、帯域全体の信号対雑音比である。
（Ｂ−ｋ／Ｎ×Ｃ）は、高い周波数帯域ほど小となる所定値である。
（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））は、帯域毎の信号対雑音比である。
ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝は、１０の「−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０」乗を示す。
ｌｏｇ１０[ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝／Ｄ]は、底を１０とした「ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝／Ｄ」の対数を示す。

式（１）において、高い周波数帯域ほど、ｋ／Ｎ×Ｃが大きくなり、高い周波数帯域ほど所定値（Ｂ−ｋ／Ｎ×Ｃ）は小さくなり、帯域毎の信号対雑音比（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））は大きくなり、ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝は、１０の「−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０」乗なので、小さくなり、雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）＝ｌｏｇ１０[ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝／Ｄ]は、底を１０とした[ｐｏｗ｛１０，−（ＳＮＲ_ａｌｌ×Ａ−（Ｂ−ｋ／Ｎ×Ｃ））／２０｝／Ｄ]の対数なので、小さくなる。すなわち、高域ほど雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）を下げる効果があり、高域での音のかすれを軽減することができる。

また、式（１）において、ＳＮＲ_ａｌｌが大きいほど雑音抑圧量の上限を下げる効果があり、音声区間でのかすれを軽減することができる。このように、帯域全体のＳＮＲが大きいときは雑音抑圧量の上限を下げることで、一部の帯域（特に高域）のＳＮＲ（ｋ）が小さくてもその帯域が過剰に抑圧されないようにすることができる。雑音抑圧量上限計算部３２の目的は、このような効果を得ることであるので、その実現方法は（式１）に限るものではない。このようにして求められた雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）は、雑音抑圧量上限制限部３３に出力される。

雑音抑圧量上限制限部３３は、雑音抑圧量Ｇ（ｋ）と雑音抑圧量の上限Ｇ_ＭＡＸ（ｋ）を用いて、ゲインＧ_ｎｅｗ（ｋ）を次の（式２）として計算する。
Ｇ_ｎｅｗ（ｋ）＝
ｐｏｗ[１０，ＭＡＸ｛−Ｇ（ｋ），−Ｇ_ＭＡＸ（ｋ）｝] ・・・（式２）
ＭＡＸ｛−Ｇ（ｋ），−Ｇ_ＭＡＸ（ｋ）｝は、−Ｇ（ｋ）と−Ｇ_ＭＡＸ（ｋ）の大きい方の値である。すなわち、−Ｇ（ｋ）＞−Ｇ＿ＭＡＸ（ｋ）ならば−Ｇ（ｋ）を返し、−Ｇ（ｋ）≦−Ｇ＿ＭＡＸ（ｋ）ならば−Ｇ＿ＭＡＸ（ｋ）を返す。
ｐｏｗ[１０，ＭＡＸ｛−Ｇ（ｋ），−Ｇ_ＭＡＸ（ｋ）｝]は、１０の「ＭＡＸ｛−Ｇ（ｋ），−Ｇ_ＭＡＸ（ｋ）｝」乗を示す。

このように、雑音抑圧量Ｇ（ｋ）を上限Ｇ_ＭＡＸ（ｋ）によって制限することで、過剰な抑圧による音のかすれを軽減する効果が得られる。さらに、同様の効果を得る目的として、Ｇ_ｎｅｗ（ｋ）を所定の下限値Ｇ_ｔｈ（例えば、０．２）で制限してもよい。このようにして求められたゲインＧ_ｎｅｗ（ｋ）は、ゲイン加重部２６に出力される。

ゲイン加重部２６は、周波数変換部２１によって算出された振幅スペクトルＸ（ｎ）に、ゲインＧ_ｎｅｗ（ｋ）を帯域ごとに乗算して重み付けをして、雑音の抑圧された振幅スペクトルＹ（ｎ）を算出する。このようにして得られた振幅スペクトルＹ（ｎ）は、周波数逆変換部２７に出力される。

周波数逆変換部２７は、上記雑音抑圧された振幅スペクトルＹ（ｎ）及び位相スペクトルＰ（ｎ）を時間領域の音声信号ｙ（ｔ）に変換する。ここで、フレーム長とシフト幅が同じ値でない場合には、例えばフレーム長を１２８、シフト幅を８０とした場合には、１フレーム前に処理した１２８サンプルの内、後部４８サンプルのｙ（ｔ）を今回処理した１２８サンプルの前部４８サンプルに加算することで、フレーム境界の不連続性を排除してもよい。また、周波数変換部２１の前処理でプレエンファシスを行った場合には、ディエンファシスという元に戻す処理を行ってもよい。より具体的な手法は、米国ＴＩＡで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC、1997-01に詳述されている。この変換されたディジタル音声信号ｙ（ｔ）は、ノイズサプレス部１６の最終的な出力として音声符号部１７に出力される。

以上の説明では、ノイズサプレス部１６を移動通信端末装置１００の送話音声のノイズを抑圧するために適用されるとしたが、これに限るものではない。受話音声のノイズが抑圧されていない場合、音声復号部１１の出力の受話音声信号に含まれるノイズを抑圧し、ノイズが抑圧された音声信号をＤＡ変換器１２に出力することによって、受話音声に含まれるノイズを抑圧するために適用されてもよい。また、通話相手の装置がノイズを抑圧する機能を有していない場合、送話音声のノイズを抑圧するため及び受話音声のノイズを抑圧するために適用されてもよい。

本発明の実施例１によれば、高域ほど雑音抑圧量の上限を下げる効果があり、高域での音のかすれを軽減することができる。

実施例１では、帯域全体のＳＮＲに応じて、高域ほど雑音抑圧量の上限を下げることで高域のかすれを軽減させた。しかしながら、雑音抑圧量Ｇ（ｋ）が上限Ｇ＿ＭＡＸ（ｋ）には達しないが、ＳＮＲ（ｋ）の値が小さい場合には、Ｇ（ｋ）が制限されず、当該帯域における音のかすれが発生することがある。そこで、実施例２では、このような場合でも、音のかすれを防ぐための手段について説明する。以下では、実施例１と異なる部分を主に説明する。

図５は、本発明の実施例２に係るノイズサプレス部の構成を示すブロック図である。これは、実施例１である図３を変形したものであり、図２のノイズサプレス部１６へ置き換えて使用することができる。実施例１と異なる部分は、ＳＮＲ計算部２４１とゲイン算出部２５１である。ＳＮＲ計算部２４１では、実施例１と同様に帯域毎の信号対雑音比ＳＮＲ（ｋ）を計算し、ＳＮＲ（ｋ）のみをゲイン算出部２５１に出力する。ゲイン算出部２５１は、更に次の構成を備える。

図６は、本発明の実施例２に係るゲイン算出部の詳細な構成を示すブロック図である。ゲイン算出部２５１は、雑音抑圧量計算部３１、雑音抑圧量補正量計算部３４、雑音抑圧量補正部３５などから構成される。

図６により、ゲイン算出部２５１の各部の動作を説明する。まず、雑音抑圧量計算部３１では、信号対雑音比ＳＮＲ（ｋ）を用いて、雑音抑圧量Ｇ（ｋ）を計算する。具体的な計算方法は、実施例１と同様である。このようにして求められた雑音抑圧量Ｇ（ｋ）は、雑音抑圧量補正部３５に出力される。

雑音抑圧量補正量計算部３４は、信号対雑音比ＳＮＲ（ｋ）を用いて、雑音抑圧量の補正量ｄ（ｋ）を計算する。補正量の計算方法としては、時間方向（ｊ−１）または周波数方向（ｋ−１，ｋ，ｋ＋１）に、信号対雑音比ＳＮＲ（ｋ，ｊ）またはゲインＧ（ｋ，ｊ）を見渡し、大きな値がある場合には、抑圧量の補正量も大きくすれば、かすれを軽減できると考えられる。具体的な計算方法としては、次の（式３）として計算する。

ｄ（ｋ）＝Ｅ（ｋ）＋Ｆ（ｋ）×｛Ｇ（ｋ，ｊ−１）−Ｈ（ｋ）｝・・・（式３）
ここで、Ｇ（ｋ，ｊ−１）は１フレーム前のゲインである。また、例えば、Ｅ（ｋ）＝１，Ｆ（ｋ）＝０．０５，Ｈ（ｋ）＝０．２である。これらの値は，高域ほど大きな値にして補正量ｄ（ｋ）へあたえる影響を大きくしてもよい。

あるいは、帯域毎の信号対雑音比ＳＮＲ（ｋ）の最大値に応じて、補正量ｄ（ｋ）を次の（式４）として計算してもよい。
ｄ（ｋ）＝Ｅ（ｋ）＋Ｆ（ｋ）×ｍａｘ（ｉ＝０〜Ｋ−１）｛ＳＮＲ（ｉ）｝
・・・（式４）
ここでは、時間方向としては１フレーム前まで見る例を示したが、任意の数のフレーム前まで見てもよい。また、周波数方向としては、全帯域を見る例を示したが、任意の数の隣接帯域までに限定してもよい。このように計算されたｄ（ｋ）は、雑音抑圧量補正部３５に出力される。

雑音抑圧量補正部３５は、補正量ｄ（ｋ）と雑音抑圧量Ｇ（ｋ）を用いて、ゲインＧ＿ｎｅｗ（ｋ）を次の（式５）として計算する。
Ｇ＿ｎｅｗ（ｋ）＝Ｇ（ｋ）×ｍａｘ｛１，ｄ（ｋ）｝・・・（式５）
ここで、ｍａｘ｛１，ｄ（ｋ）｝は１とｄ（ｋ）の大きい方の値である。すなわち、１＜ｄ（ｋ）ならばｄ（ｋ）を返し、１≧ｄ（ｋ）ならば１を返す。あるいは、１＜ｄ（ｋ）のときのみＧ＿ｎｅｗ（ｋ）＝Ｇ（ｋ）×ｄ（ｋ）として計算し、１≧ｄ（ｋ）ならばＧ＿ｎｅｗ（ｋ）＝Ｇ（ｋ）として代入のみとしてもよい。

本発明の実施例２によれば、以上のように、ゲインＧ＿ｎｅｗ（ｋ）を計算すれば、雑音抑圧量Ｇ（ｋ）が上限Ｇ＿ＭＡＸ（ｋ）には達しないが、ＳＮＲ（ｋ）の値が小さい場合であっても、周波数方向または時間方向に大きな信号対雑音比ＳＮＲ（ｋ，ｊ）またはゲインＧ（ｋ，ｊ）があれば、Ｇ＿ｎｅｗ（ｋ）が大きくなるように補正されるので、音のかすれを軽減することができる。

なお、実施例１、実施例２では、ノイズサプレス部を移動通信端末装置に適用した形態を例にとって行ったが、本発明のノイズサプレス部は、固定電話装置、会議システム、音声認識装置等、あらゆる音声信号を扱う装置に適用することが当然に可能である。本発明は以上の構成に限定されるものではなく、種々の変形が可能である。

本発明の各実施例に係るノイズサプレス装置が適用された移動通信端末装置の構成を示すブロック図。本発明の各実施例に係る通話部の詳細な構成を示すブロック図。本発明の実施例１に係るノイズサプレス部の詳細な構成を示すブロック図。本発明の実施例１に係るゲイン算出部の詳細な構成を示すブロック図。本発明の実施例２に係るノイズサプレス部の詳細な構成を示すブロック図。本発明の実施例２に係るゲイン算出部の詳細な構成を示すブロック図。

符号の説明

１制御部
２アンテナ
３通信部
４送受信部
５スピーカ
６マイクロホン
７通話部
８表示部
９入力部
１１音声復号部
１２ＤＡ変換器
１３増幅器
１４増幅器
１５ＡＤ変換器
１６ノイズサプレス部
１７音声符号部
２１周波数変換部
２２帯域パワー計算部
２３雑音推定部
２４、２４１ＳＮＲ計算部
２５、２５１ゲイン算出部
２６ゲイン加重部
２７周波数逆変換部
３１雑音抑圧量計算部
３２雑音抑圧量上限計算部
３３雑音抑圧量上限制限部
３４雑音抑圧量補正量計算部
３５雑音抑圧量補正部
１００移動通信端末装置

Claims

所定の時間幅の時間波形を振幅成分と位相成分との周波数成分に変換する周波数変換手段と、
前記振幅成分を用いて帯域毎の帯域パワーを計算する帯域パワー計算手段と、
前記帯域パワーを用いて帯域毎の雑音パワーを推定する雑音推定手段と、
前記雑音推定手段で推定された帯域毎の雑音パワーと前記帯域パワーとを用いて帯域毎の信号対雑音比と帯域全体の信号対雑音比とを計算するＳＮＲ計算手段と、
前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比と帯域全体の信号対雑音比とを用いて雑音を抑圧するためのゲインを算出するゲイン算出手段と、
前記周波数変換手段で変換された振幅成分を前記ゲインで重み付けるゲイン加重手段と、
前記周波数変換手段で変換された位相成分と前記ゲイン加重手段で重み付けされた振幅成分とから時間波形を生成する周波数逆変換手段とを有するノイズサプレス装置であって、
前記ゲイン算出手段は、
前記ＳＮＲ計算手段で計算された帯域全体の信号対雑音比を用いて雑音抑圧量の上限を帯域毎に計算する雑音抑圧量上限計算手段と、
前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比を用いて帯域毎の雑音抑圧量を求める雑音抑圧量計算手段と、
前記雑音抑圧量上限計算手段で計算された上限で当該雑音抑圧量を制限してゲインを算出する雑音抑圧量上限制限手段とを具備することを特徴とするノイズサプレス装置。
前記雑音抑圧量上限計算手段は、前記ＳＮＲ計算手段で計算された帯域全体の信号対雑音比を用いて高い周波数帯域ほど雑音抑圧量の上限を下げることを特徴とする請求項１記載のノイズサプレス装置。
所定の時間幅の時間波形を振幅成分と位相成分との周波数成分に変換する周波数変換手段と、
前記振幅成分を用いて帯域毎の帯域パワーを計算する帯域パワー計算手段と、
前記帯域パワーを用いて帯域毎の雑音パワーを推定する雑音推定手段と、
前記雑音推定手段で推定された帯域毎の雑音パワーと前記帯域パワーとを用いて帯域毎の信号対雑音比を計算するＳＮＲ計算手段と、
前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比を用いて雑音を抑圧するためのゲインを算出するゲイン算出手段と、
前記周波数変換手段で変換された振幅成分を前記ゲインで重み付けるゲイン加重手段と、
前記周波数変換手段で変換された位相成分と前記ゲイン加重手段で重み付けされた振幅成分とから時間波形を生成する周波数逆変換手段とを有するノイズサプレス装置であって、
前記ゲイン算出手段は、
前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比を用いて帯域毎の雑音抑圧量を求める雑音抑圧量計算手段と、
前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比，過去に雑音を抑圧するために算出されたゲインの少なくとも一つを用いて雑音抑圧量の補正量を帯域毎に計算する雑音抑圧量補正量計算手段と、
前記雑音抑圧量補正量計算手段で計算された補正量で当該雑音抑圧量を補正してゲインを算出する雑音抑圧量補正手段とを具備することを特徴とするノイズサプレス装置。
前記雑音抑圧量補正量計算手段は、前記ＳＮＲ計算手段で計算された帯域毎の信号対雑音比、過去に雑音を抑圧するために算出されたゲインの少なくとも一つを用いて高い周波数帯域ほど雑音抑圧量の補正量を大きくすることを特徴とする請求項３記載のノイズサプレス装置。