JP2006113515A

JP2006113515A - ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置

Info

Publication number: JP2006113515A
Application number: JP2004370862A
Authority: JP
Inventors: Takehiko Isaka; 岳彦井阪
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2004-09-16
Filing date: 2004-12-22
Publication date: 2006-04-27

Abstract

【課題】音声の減衰感を緩和させつつ、同時にミュージカルノイズも軽減できるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置を提供する。
【解決手段】入力音声信号から算出された振幅スペクトルを複数の帯域に分割し、この分割された帯域ごとに雑音を推定し、この推定された雑音と上記振幅スペクトルとから信号対雑音比を推定し、この推定された信号対雑音比を帯域別に非線形関数によって処理してから帯域共通の非線形関数によって処理して補正値を算出する。この補正値を用いて上記信号対雑音比を補正し、この補正された信号対雑音比に基づいて雑音抑圧係数を設定し、この設定された雑音抑圧係数に従い上記振幅スペクトルを重み付けしたのち音声信号に変換する。
【選択図】図３

Description

本発明は、ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置に係り、特に、入力音声信号に含まれる雑音成分を抑圧する処理に関する。

移動通信端末装置を始めとして、固定電話装置、会議システム等の音声通信装置が用いられている。これらの装置の送話側装置を背景雑音の大きい環境下で使用すると、この背景雑音が取り込まれて音声とともに伝送され、その結果音声の明瞭感が低下してしまう。

また、音声認識装置においては、背景雑音が取り込まれることにより、認識性能が低下してしまう。このため、背景雑音を除去もしくは抑圧して音声のみの信号に近づける技術（ノイズサプレス技術）が種々研究されている。

例えば、移動通信端末装置の場合、音声信号をディジタル信号に変換してＣＥＬＰ（Code Excited Linear Prediction）方式などの音声符号化方式で符号化する方法が用いられている。そこで、変換されたディジタル信号から背景雑音を除去もしくは抑圧することが研究されている。

即ち、入力信号の信号対雑音比を周波数帯域ごとに求め、この信号対雑音比に基づいて雑音抑圧係数を決定し、この係数を周波数領域上で入力信号スペクトルの振幅成分に乗算することにより雑音を抑圧する手法がY. Ephraim et al., "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," ASSP, vol. 32, no. 6, pp. 1109-1121, 1984（１１１８頁、式（５３））に開示されている。

しかしながら、この手法では、固定係数の１次巡回フィルタを用いて事前信号対雑音比を推定するため、語頭や音韻の境界のような音声スペクトルが変動する区間では事前信号対雑音比の推定にディレイが生じ、推定精度が劣化することにより、音声が減衰するという問題点があった。

そこで、この問題点を解決するために、音声パワーのフレーム間変動も加味して上記1次巡回フィルタの更新係数を適応的に変動させる手法が開示されている。即ち、音声パワーのフレーム間変動によって、上記巡回フィルタの更新係数を適応的に変動させる（例えば、非特許文献１参照。）。

また、事前信号対雑音比によって、上記巡回フィルタの更新係数を適応的に変動させる（例えば、非特許文献２参照。）。これらの手法によれば、語頭のような音声パワーの変動の激しい区間で、事前信号対雑音比の推定におけるディレイを軽減でき、事前信号対雑音比の推定精度を改善できる。

更に、上記問題点を解決するために、各周波数帯の信号対雑音比に応じて入力信号に非線形な重み付けを行い、時間的なスムージングを行って雑音推定し、この推定雑音と入力信号とから事後信号対雑音比と事前信号対雑音比を求め、雑音抑圧係数を決定する手法が開示されている（例えば、特許文献１参照。）。この手法によれば、雑音と音声の中間的なレベルの信号成分まで加味して雑音推定することができ、その推定精度の向上が期待できる。
I. Y. Soon and S. N. Koh, "Low distortion speech enhancement," IEE Proc., Visual Image Signal Processing, vol. 147, no. 3, pp.247-253, June 2000（２５０頁、式（２８）及び式（２９）） M. K. Hasan, S. Salahuddin and M. R. Khan, "A modified a priori SNR for speech enhancement using spectral subtraction rules," IEEE Signal Processing Letters, vol. 11, no. 4, pp. 450-453, Apr. 2004（４５１頁、式（１５））特開２００２−２０４１７５号公報（第２〜３頁、図３及び図４）

しかしながら、上述した非特許文献１、非特許文献２及び特許文献１に開示されている手法では、事前信号対雑音比の充分な推定精度が得られず、音声の一部が減衰したり、狭い周波数帯域で局所的散発的に発生するミュージカルノイズが発生して耳障りであるという問題点があった。

本発明は上記問題点を解決するためになされたもので、信号対雑音比の推定精度を高めることによって、音声の減衰感を緩和させつつ、同時にミュージカルノイズも軽減させるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置を提供することを目的とする。

上記目的を達成するために、本発明のノイズサプレス装置は、音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第１の変換手段と、前記第１の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第１の信号対雑音比を推定する第１の信号対雑音比推定手段と、前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、前記補正値算出手段によって算出された補正値を用いて前記第１の信号対雑音比を補正する第１の補正手段と、前記第１の補正手段によって補正された第１の信号対雑音比に基づいて雑音抑圧係数を設定する雑音抑圧係数設定手段と、前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第１の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、前記重み付け手段によって重み付けされた振幅スペクトルと前記第１の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第２の変換手段とを具備することを特徴とする。

また、本発明のノイズサプレス装置は、音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第１の変換手段と、前記第１の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第１の信号対雑音比を推定する第１の信号対雑音比推定手段と、前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から第２の信号対雑音比を推定する第２の信号対雑音比推定手段と、過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比とから第３の信号対雑音比を推定する第３の信号対雑音比推定手段と、前記第２の信号対雑音比推定手段によって推定された第２の信号対雑音比と前記第３の信号対雑音比推定手段によって推定された第３の信号対雑音比とから第４の信号対雑音比を推定する第４の信号対雑音比推定手段と、前記補正値算出手段によって算出された補正値を用いて前記第４の信号対雑音比推定手段によって推定された第４の信号対雑音比を補正する第２の補正手段と、前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比と前記第２の補正手段によって補正された第４の信号対雑音比とに基づいて前記雑音抑圧係数を設定する雑音抑圧係数設定手段と、前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第１の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、前記重み付け手段によって重み付けされた振幅スペクトルと前記第１の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第２の変換手段とを具備することを特徴とする。

本発明によれば、信号対雑音比の推定精度を高めることによって、音声の減衰感を緩和させつつ、同時にミュージカルノイズも軽減させるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置を提供することができる。

以下に、本発明によるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置の実施の形態を、図面を参照して説明する。

（第１の実施形態）
図１は、本発明の第１の実施形態に係るノイズサプレス装置及びノイズサプレス方法が適用された、本発明の第１の実施形態に係る移動通信端末装置の構成を示すブロック図である。

この移動通信端末装置は、装置全体の制御を行う制御部１１と、基地局（図示せず）との間で電波の送受信を行うアンテナ１２ａと、通信部１２ｂと、送受信部１３と、スピーカ１４ａと、マイクロフォン１４ｂと、通話部１４ｃと、表示部１５と、入力装置１６とからなる。

図２は、通話部１４ｃの詳細な構成を示すブロック図である。通話部１４ｃは、送受信部１３と接続される音声復号部１４ｄと、ＤＡ変換器１４ｅと、スピーカ１４ａと接続される増幅器１４ｆと、マイクロフォン１４ｂと接続される増幅器１４ｇと、ＡＤ変換器１４ｈと、ノイズサプレス部１４ｉと、送受信部１３と接続される音声符号部１４ｊとからなる。

図３は、ノイズサプレス部１４ｉの詳細な構成を示すブロック図である。ノイズサプレス部１４ｉは、ＡＤ変換器１４ｈと接続される時間／周波数領域変換部２１と、帯域分割部２２と、雑音推定部２３と、事後信号対雑音比推定部（以後、事後ＳＮＲ推定部と称する。）３１と、補正値算出部４１と、事後信号対雑音比補正部（以後、事後ＳＮＲ補正部と称する。）５１と、事前信号対雑音比補正部（以後、事前ＳＮＲ補正部と称する。）５２と、雑音抑圧係数設定部５３と、雑音スペクトル振幅抑圧部５４と、音声符号部１４ｊと接続される周波数／時間領域変換部５５とからなる。

図４は、事後ＳＮＲ推定部３１の詳細な構成を示すブロック図である。事後ＳＮＲ推定部３１は、帯域分割部２２、雑音推定部２３、補正値算出部４１及び事後ＳＮＲ補正部５１と接続される帯域別事後信号対雑音比計算部（以後、帯域別事後ＳＮＲ計算部と称する。）３２−１、３２−２、…、３２−Ｋからなる。正の整数Ｋについては、後述する。

図５は、補正値算出部４１の詳細な構成を示すブロック図である。補正値算出部４１は、事後ＳＮＲ推定部３１と接続される帯域別非線形処理部４２−１、…、４２−ｍ、４２−ｎ、…、４２−Ｋと、総和平均計算部４３−１、４３−２と、事後ＳＮＲ補正部５１及び事前ＳＮＲ補正部５２と接続される帯域共通非線形処理部４４−１、４４−２とからなる。ここで、ｍ＝Ｋ／２であり、Ｋが奇数の場合、ｍ＝（Ｋ＋１）／２である。また、ｎ＝ｍ＋１である。

上記のように構成された、本発明の第１の実施形態に係る移動通信端末装置の各部の動作を、図１〜図５を参照して説明する。

まず、通信部１２ｂは、アンテナ１２ａが受信した高周波信号を送受信部１３へ出力し、また、送受信部１３から出力される高周波信号をアンテナ１２ａより送信する。

送受信部１３は、通信部１２ｂからの高周波信号を増幅、周波数変換及び復調し、それによって得られたディジタル音声信号を通話部１４ｃへ、また、制御信号を制御部１１に送る。更には、通話部１４ｃから出力されるディジタル音声信号、及び制御部１１から出力される制御信号を変調、周波数変換及び増幅し、高周波信号を得て、それを通信部１２ｂに送る。

次に、通話部１４ｃの動作を、図２を参照して説明する。まず、音声復号部１４ｄによって、送受信部１３から出力されたディジタル音声信号を復号する。この復号されたディジタル音声信号は、ＤＡ変換器１４ｅによってアナログ音声信号に変換され、得られたアナログ音声信号は増幅器１４ｆによって増幅され、増幅された信号はスピーカ１４ａに出力されて音声を発生させる。

また、マイクロフォン１４ｂから出力されたアナログ音声信号は、増幅器１４ｇによって増幅され、増幅された信号はＡＤ変換器１４ｈによってディジタル音声信号に変換される。得られたディジタル音声信号は、ノイズサプレス部１４ｉによって雑音が抑圧され、雑音が抑圧された信号は、音声符号部１４ｊによって符号化されて、送受信部１３に出力される。ノイズサプレス部１４ｉの動作は後述する。

次に、表示部１５の動作を説明する。表示部１５は、制御部１１に制御されることで、文字・数字や画像データの表示動作を行い、表示されているデータは、入力装置１６からの入力操作や着信信号に応答して制御部１１からの指示を受けることで切換わる。

入力装置１６は、通信相手の電話番号を指定するための数字キーと複数の機能キーを含むキーからなる。そして、入力装置１６のキーが操作されると、そのキーの識別子が制御部１１に通知され、制御部１１によって、表示部１５に文字として表示され、または、制御が行われる。

次に、ノイズサプレス部１４ｉの動作を、図３〜図５を参照して説明する。まず、時間／周波数領域変換部２１は、ＡＤ変換器１４ｈから出力されたディジタル音声信号を時間領域の信号から周波数領域の信号に変換し、周波数スペクトル、即ち、振幅スペクトルと位相スペクトルとを算出する。

例えば、音声信号ｘ（ｔ）を所定時間長ずつ例えば１２８個ずつフレームに分割し、これらのフレームごとに時間／周波数領域変換処理を行い、これによりフレーム番号jにおける振幅スペクトルＸ（ｎ、ｊ）（ｎ＝０〜Ｎ−１。Ｎはフレーム長。）を得る。以下では、記述の簡略化のため、基本的にフレーム番号jを省略するが、数式の説明などでフレーム番号を区別する必要がある場合は、記述する。

なお、時間／周波数領域変換部２１は、時間／周波数領域変換処理に先立って、スペクトル包絡を平坦化することを目的として、入力されたディジタル音声信号ｘ（ｔ）に対しプレエンファシス処理を設けたり、直流分をカットすることを目的として、ハイパスフィルタを設けたりしてもよい。

また、時間／周波数領域変換処理のフレーム長とシフト幅は同じでなくてもよく、例えばフレーム長を１２８、シフト幅を８０とした場合には、８０サンプル分の入力ディジタル音声信号ｘ（ｔ）をフレーム前半部に格納し、残りの４８サンプルについては０とした後に境界の不連続性を排除するために正弦波特性の窓掛けを行ってもよい。プレエンファシスおよび窓掛けのより具体的な手法は、米国ＴＩＡで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC, 1997-01に詳述されている。

このように時間／周波数領域変換によって得られた振幅スペクトルＸ（ｎ）は、帯域分割部２２及び雑音スペクトル振幅抑圧部５４に出力される。また、位相スペクトルＰ（ｎ）は、周波数／時間領域変換部５５に出力される。

帯域分割部２２は、振幅スペクトルＸ（ｎ）を低域から高域まで例えば１６個の周波数帯域に分割し、これらの周波数帯域ごとに平均をとって各周波数帯域を代表する帯域パワーＸｄ（ｋ）（ｋ＝０〜Ｋ。Ｋは周波数帯域数で、例えば１６。ｋが小さい方が低域、大きい方が高域とする。）を算出する。

ここでは、等間隔に分割する例を示したが、バークスケールやメルスケール等のような人間の聴覚特性に適した分割幅を採用してもよい。このようにして求められた各周波数帯域を代表する帯域パワーＸｄ（ｋ）は、雑音推定部２３及び事後ＳＮＲ推定部３１に出力される。

雑音推定部２３は、求められた各周波数帯域を代表する帯域パワーＸｄ（ｋ）を用いて、帯域毎の雑音帯域パワーＮｄ（ｋ）を推定する。雑音推定部２３は、その区間に音声が存在するか否か、もしくは両者の中間状態も考慮してどれぐらい雑音らしいかを判定し、この判定結果に応じて、雑音帯域パワーＮｄ（ｋ）を推定する。

具体的には、雑音と判定された区間のパワーをそのまま雑音帯域パワーＮｄ（ｋ）としてもよいし、雑音区間と判定された現在を含む過去Ｍ個のフレームの平均パワーを用いてもよい。また、雑音と判定されたときに巡回フィルタによって過去の推定雑音との重み付き和を用いてもよいし、雑音らしいと判定されたときほどその区間を重視して、重み付けを行ってもよい。

これらの判定処理と推定処理は、帯域毎に行ってもよいし、複数帯域を一つにまとめて行ってもよいし、両者の重み付き和でもよい。このようにして算出された雑音帯域パワーＮｄ（ｋ）は、事後ＳＮＲ推定部３１に出力される。

次に、事後ＳＮＲ推定部３１の動作を、図４を参照して説明する。帯域別事後ＳＮＲ計算部３２−ｋ（ここで、ｋ＝１〜Ｋ。）は、帯域パワーＸｄ（ｋ）及び雑音帯域パワーＮｄ（ｋ）を用いて、帯域毎の事後信号対雑音比ＳＮＲ（ｋ）をＳＮＲ（ｋ）＝Ｘｄ（ｋ）／Ｎｄ（ｋ）と計算して、推定する。このように推定された帯域毎の事後信号対雑音比ＳＮＲ（ｋ）は、補正値算出部４１及び事後ＳＮＲ補正部５１に出力される。

次に、補正値算出部４１の動作を、図５を参照して説明する。補正値算出部４１は、帯域毎の事後信号対雑音比ＳＮＲ（ｋ）を入力し、補正値μを算出する。まず、帯域別非線形処理部４２−ｋ（ここで、ｋ＝１〜Ｋ。）は、帯域毎の事後信号対雑音比ＳＮＲ（ｋ）を入力し、非線形処理をして、帯域毎の非線形処理指数を出力する。

図６は、この非線形処理で用いられる非線形関数の一例を示す。帯域別非線形処理部４２−ｋは、帯域毎の事後信号対雑音比ＳＮＲ（ｋ）がＢ［ｄＢ］以上であるときはＣを出力し、それ以外のときはＳＮＲ（ｋ）×Ｃ／Ｂ＋Ａを出力する。例えば、Ａ＝０、Ｂ＝１０、Ｃ＝１などが用いられる。

ここでは、1次関数を組み合わせて用い、かつ、上限値が設定された非線形関数を用いた例を示したが、これに限るものではない。１次関数の他に、高次関数、対数関数、指数関数あるいはこれらを組み合わせたものであって、上限値が設定された非線形関数でもよい。また、上限値が設定された非線形関数に限るものではなく、上限値に漸近する非線形関数でもよい。

総和平均計算部４３−１は、帯域別非線形処理部４２−ｋ（ｋ＝１〜ｍ。ここで、ｍ＝Ｋ／２。Ｋが奇数の場合、ｍ＝（Ｋ＋１）／２。）によってＣ以下にされたｍ個の非線形処理済み指数の総和平均値β１を計算する。また、総和平均計算部４３−２は、帯域別非線形処理部４２−ｋ（ｋ＝ｎ〜Ｋ。ここで、ｎ＝ｍ＋１。ｍは、上記総和平均計算部４３−１の動作説明で説明した通り。）によってＣ以下にされたＫ−ｍ個の指数の総和平均値β２を計算する。

ここで、総和平均値を計算することにより、周波数帯域１〜ｍについては、後述するように、共通の補正値が算出され、また、周波数帯域ｎ〜Ｋについても、後述するように、共通の補正値が算出される。

なお、ここでは、総和平均値をとる例を示したが、総和平均計算部４３−１、４３−２は、相乗平均値、モード（中央値）またはメディアン（再頻値）をとってもよい。

帯域共通非線形処理部４４−ｐ（ここで、ｐは、１または２。）は、総和平均計算部４３−ｐによって計算された総和平均βｐを入力し、非線形処理して、補正値μｐを出力する。図７に、この非線形処理で用いられる非線形関数の一例を示す。帯域共通非線形処理部４４−ｐは、総和平均βｐがＤ以下のとき（ただし、Ｄ≦Ｃ。）にＥを出力し、それ以外のときは（βｐ−Ｄ）×（Ｆ−Ｅ）／（Ｃ−Ｄ）を出力する。例えば、Ｃ＝１、Ｄ＝０、Ｅ＝０、Ｆ＝１などが用いられる。

ここでは、1次関数を組み合わせて用い、かつ、下限値が設定された非線形関数を用いた例を示したが、これに限るものではない。１次関数の他に、高次関数、対数関数、指数関数あるいはこれらを組み合わせたものであって、下限値が設定された非線形関数でもよい。また、下限値が設定された非線形関数に限るものではなく、下限値に漸近する非線形関数でもよい。

なお、ここでは、帯域別非線形処理部４２−ｋでは上限値が設定され、帯域共通非線形処理部４４−ｐでは下限値が設定されるとしたが、これに限るものではない。帯域別非線形処理部４２−ｋでは下限値が設定され、帯域共通非線形処理部４４−ｐでは上限値が設定されるとしてもよい。

更に、ここでは、帯域を低域と高域に同じ帯域数に２分し、それぞれの帯域毎に補正値μｐが計算されるとしたが、これに限るものではない。帯域を低域と高域に異なる帯域数に２分してもよい。また、帯域を低域と高域、及び、中域に２分し、それぞれに対して補正値が計算されるとしてもよい。

更に、全ての帯域に共通な補正値が計算されるとしてもよい。その場合、補正値算出部４１は、総和平均計算部４３−２及び帯域共通非線形処理部４４−２を有しない構成であってもよい。また、帯域を低域と中域と高域に３分し、それぞれの帯域毎に補正値が計算されるとしてもよい。その場合、補正値算出部４１は、更に、総和平均計算部４３−３と帯域共通非線形処理部４４−３とを備える。

更に、帯域を最大でＫ個に分割し、それぞれの帯域毎に補正値を計算してもよい。その場合、補正値算出部４１は、Ｋ個の総和平均計算部４３とＫ個の帯域共通非線形処理部４４とを備える。

このようにして算出された補正値μｐは、事後ＳＮＲ補正部５１及び事前ＳＮＲ補正部５２に出力される。

事後ＳＮＲ補正部５１は、補正値μｐを用いて帯域毎の事後信号対雑音比ＳＮＲ（ｋ）を補正して、補正された事後信号対雑音比γ（ｋ）を以下のように推定する。ここで、１≦ｋ≦ｍの場合、ｐ＝１、ｍ＋１≦ｋ≦Ｋの場合、ｐ＝２である。

式（１）で計算された、補正された事後信号対雑音比γ（ｋ）は、事前ＳＮＲ補正部５２及び雑音抑圧係数設定部５３に出力される。なお、事後ＳＮＲ補正部５１は、補正された事後信号対雑音比γ（ｋ）として、事後信号対雑音比ＳＮＲ（ｋ）を出力してもよい。言い換えると、ノイズサプレス部１４ｉは、事後ＳＮＲ補正部５１を有しない構成としてもよい。

事前ＳＮＲ補正部５２は、事後ＳＮＲ補正部５１から出力された事後信号対雑音比γ（ｋ）及び後述するように雑音抑圧係数設定部５３から出力された雑音抑圧係数Ｈ（ｋ）を、事前ＳＮＲ補正部５２内の記憶部（図示せず）に記憶する。

そして、事前ＳＮＲ補正部５２は、現フレームの補正された事後信号対雑音比γ（ｋ，ｊ）、事前ＳＮＲ補正部５２内の記憶部に記憶された１フレーム前の補正された事後信号対雑音比γ（ｋ，ｊ−１）及び後述する雑音抑圧係数Ｈ（ｋ，ｊ−１）を用いて、事前信号対雑音比ξ（ｋ）を以下のように推定する。ここで、ｍａｘ［Ｘ，Ｙ］は、ＸとＹとのどちらか大きい方を選択する関数である。

また、事前ＳＮＲ補正部５２は、式（２）の事前信号対雑音比ξ（ｋ）に補正値μｐを乗算して、事前信号対雑音比ξ（ｋ）を以下のように補正してもよい。

このように事前信号対雑音比ξ（ｋ）を補正することによって、音声の語尾のような音声パワーが下がる区間において、事前信号対雑音比ξ（ｋ）が大きな値になることを補正値μｐを乗算することによって防ぎ、雑音抑圧性能を向上させることができる。

ここでは、式（２）、式（２´）の様に２つの値からより大きい値を検出して事前信号対雑音比ξ（ｋ）を計算する場合を示したが、これに限るものではない。より小さい値を検出して事前信号対雑音比ξ（ｋ）としてもよいし、いずれか一方を固定的に選択して事前信号対雑音比ξ（ｋ）としてもよい。また、２つの値の平均値を計算して事前信号対雑音比ξ（ｋ）としてもよい。更に、所定の重み付きの平均値をとってもよい。ここで、重み付けは、上記より大きい値により大きい重みを付けてもよい。

更に、I. Y. Soon and S. N. Koh, "Low distortion speech enhancement," IEE Proc., Visual Image Signal Processing, vol. 147, no. 3, pp.247-253, June 2000（２５０頁、式（２８）及び式（２９））や、M. K. Hasan, S. Salahuddin and M. R. Khan, "A modified a priori SNR for speech enhancement using spectral subtraction rules," IEEE Signal Processing Letters, vol. 11, no. 4, pp. 450-453, Apr. 2004（４５１頁、式（１５））に開示されている手法によって、事前信号対雑音比ξ（ｋ）を推定してもよい。

即ち、事前ＳＮＲ補正部５２は、事前信号対雑音比ξ（ｋ）を事前ＳＮＲ補正部５２内の記憶部に記憶して、帯域パワーＸｄ（ｋ）のフレーム間差分あるいは事後信号対雑音比γ（ｋ）あるいは事前ＳＮＲ補正部５２内の記憶部に記憶された１フレーム前の事前信号対雑音比ξ（ｋ，ｊ−１）等を用いて事前信号対雑音比ξ（ｋ）を推定してもよい。

上述のように事前信号対雑音比ξ（ｋ）を推定することで、固定係数の巡回フィルタで事前信号対雑音比ξ（ｋ）を推定すると、ディレイが生じ、語頭や音韻の境界のような帯域パワーＸｄ（ｋ）や振幅スペクトルＸ（ｎ）が変動する区間で事前信号対雑音比ξ（ｋ）の推定精度が劣化することに比較して、推定精度の劣化を軽減できるという効果が得られる。

一方、雑音区間では、式（２）によって推定された事前信号対雑音比ξ（ｋ）の推定精度が劣化したとしても、補正値μが雑音区間では０に近い値となり、事後信号対雑音比γ（ｋ）と事前信号対雑音比ξ（ｋ）とのいずれか一方、または、両方が補正されることによって小さくなり、ミュージカルノイズが軽減される。

あるいは、事前ＳＮＲ補正部５２は、補正された事前信号対雑音比ξ（ｋ，ｊ）を１フレーム前の補正された事前信号対雑音比ξ（ｋ，ｊ−１）を更新して求める構成としても良い。図８は、この変形された事前ＳＮＲ補正部５２の詳細な構成を示すブロック図である。この変形された事前ＳＮＲ補正部５２は、補正値算出部４１及び事後ＳＮＲ補正部５１と接続される更新係数計算部５２１と、補正値算出部４１及び事後ＳＮＲ補正部５１及び雑音抑圧係数設定部５３と接続される事前ＳＮＲ更新部５２２とからなる。

次に、この事前ＳＮＲ補正部５２の動作を、まず、更新係数計算部５２１の動作から説明する。更新係数計算部５２１は、補正値算出部４１から出力された補正値μｐ（ｊ）と、事後ＳＮＲ補正部５１から出力された事後信号対雑音比γ（ｋ，ｊ）と、後述するように、事前ＳＮＲ補正部５２内の記憶部に記憶された１フレーム前の事後信号対雑音比γ（ｋ，ｊ−１）とを用いて可変更新係数αを以下のように計算して、事前ＳＮＲ更新部５２２へ出力する。ここで、Ａ及びＡ’については、後述する。また、λは所定の定数である。

次に、事前ＳＮＲ更新部５２２は、更新係数計算部５２１によって出力された可変更新係数αと、補正値算出部４１から出力された補正値μｐ（ｊ）と、事後ＳＮＲ補正部５１から出力された事後信号対雑音比γ（ｋ，ｊ）と、事前ＳＮＲ補正部５２内の記憶部に記憶された１フレーム前の補正値μｐ（ｊ−１）と、１フレーム前の事後信号対雑音比γ（ｋ，ｊ−１）と、１フレーム前の雑音抑圧係数Ｈ（ｋ，ｊ−１）とを用いて補正された事前信号対雑音比ξ（ｋ）を以下のように計算する。

ここで、ｓｑｕａｒｅ［Ｘ］は、Ｘの自乗を計算する関数である。そして、上記式（３）及び式（４）において、Ａ＝ｍａｘ［γ（ｋ，ｊ）−１，０］、Ａ’＝ｍａｘ［γ（ｋ，ｊ−１）−１，０］である。あるいは、Ａ＝ｍａｘ［｛γ（ｋ，ｊ）−１｝×μｐ（ｊ），０］、Ａ’＝ｍａｘ［｛γ（ｋ，ｊ−１）−１｝×μｐ（ｊ−１），０］、もしくは、Ａ＝ｍａｘ［γ（ｋ，ｊ）×μｐ（ｊ）−１，０］、Ａ’＝ｍａｘ［γ（ｋ，ｊ−１）×μｐ（ｊ−１）−１，０］としてもよい。なお、事後信号対雑音比から１を差し引く代わりに、事後信号対雑音比にｓｑｕａｒｅ［Ｈ（ｋ，ｊ−１）］を乗算するようにしてもよい。

また、μｐ（ｊ）はフレーム番号ｊにおける補正値であって、周波数帯域ｋに依存して、ｐ＝１またはｐ＝２である。そして、μｐ（ｊ−１）は、１フレーム前の補正値であって、周波数帯域ｋに依存して、ｐ＝１またはｐ＝２である。

事前ＳＮＲ更新部５２２は、補正値算出部４１から出力された補正値μｐ（ｊ）と、事後ＳＮＲ補正部５１から出力された事後信号対雑音比γ（ｋ，ｊ）と、雑音抑圧係数設定部５３から出力された雑音抑圧係数Ｈ（ｋ，ｊ）とを事前ＳＮＲ補正部５２内の記憶部に記憶する。

以上のように、更新係数計算部５２１と事前ＳＮＲ更新部５２２とによって、補正値μｐ(ｊ)と可変更新係数αとを組み合わせて補正された事前信号対雑音比ξ（ｋ）を計算することで、雑音区間では補正値μｐ（ｊ）が小さくなり、可変更新係数αが大きくなるので、補正された事前信号対雑音比ξ（ｋ）のスムージング効果が高まり、ミュージカルノイズが軽減される効果が得られる。

一方、音声区間では補正値μｐ(ｊ)が大きくなり、可変更新係数αが小さくなるので、語頭における補正された事前信号対雑音比ξ（ｋ）の立ち上がりが早くなり、語頭の減衰感が軽減される効果が得られる。

以上のようにして推定された、または、補正された事前信号対雑音比ξ（ｋ）は、雑音抑圧係数設定部５３に出力される。

雑音抑圧係数設定部５３は、事後信号対雑音比γ（ｋ）及び事前信号対雑音比ξ（ｋ）を用いて、雑音抑圧係数Ｈ（ｋ）を設定する。例えば、Y. Ephraim et al., "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," ASSP, vol. 32, no. 6, pp. 1109-1121, 1984（１１１８頁、式（５３））に開示されているように、雑音抑圧係数Ｈ（ｋ）を以下のように計算する。

ここで、υ（ｋ）＝ξ（ｋ）×γ（ｋ）／［１＋ξ（ｋ）］、また、Ｉｎ（ｚ）は、ｎ次変形ベッセル関数である。あるいは、以下のように雑音抑圧係数Ｈ（ｋ）を計算してもよい。

ここで、λは、ラプラス関数の勾配である。なお、雑音抑圧係数Ｈ（ｋ）の計算式は、他にも多数開示されているが、どのような手法を用いてもよい。例えば、スペクトルサブトラクション法によれば、雑音抑圧係数Ｈ（ｋ）は、帯域分割部２２で算出された帯域パワーＸｄ（ｋ）と雑音推定部２３で推定された雑音帯域パワーＮｄ（ｋ）とから以下のように計算される。

ここで、ａは、事後信号対雑音比γ（ｋ）から計算される値であり、ｂは、定数である。このスペクトルサブトラクション法によれば、雑音抑圧係数Ｈ（ｋ）の設定に事前信号対雑音比ξ（ｋ）を用いない。そこで、この手法による場合、ノイズサプレス部１４ｉは、事前ＳＮＲ補正部５２を有しない構成としてもよい。このようにして設定された雑音抑圧係数Ｈ（ｋ）は、事前ＳＮＲ補正部５２及び雑音スペクトル振幅抑圧部５４に出力される。

雑音スペクトル振幅抑圧部５４は、時間／周波数領域変換部２１によって算出された振幅スペクトルＸ（ｎ）に、雑音抑圧係数Ｈ（ｋ）を帯域ごとに乗算して重み付けをして、雑音の抑圧された振幅スペクトルＹ（ｎ）を算出する。このようにして得られた振幅スペクトルＹ（ｎ）は、周波数／時間領域変換部５５に出力される。

周波数／時間領域変換部５５は、上記雑音抑圧された振幅スペクトルＹ（ｎ）及び位相スペクトルＰ（ｎ）を時間領域の音声信号ｙ（ｔ）に変換する。この変換されたディジタル音声信号ｙ（ｔ）は、ノイズサプレス部１４ｉの最終的な出力として、音声符号部１４ｊに送られる。

以上の説明では、ノイズサプレスの方式として、最小平均２乗誤差短時間スペクトル振幅法（いわゆるＭＭＳＥ−ＳＴＳＡ法）を仮定したが、その他の方式にも適用可能である。例えば、S. F. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. ASSP, vol. 27, no. 2, pp. 113-120, Feb. 1979（１１４頁、第２章Ｃ項）に開示されているスペクトルサブトラクション法に適用可能である。

また、J. S. Lim and A. V. Oppenheim, "Enhancement and Bandwidth Compression of Noisy Speech," Proc. of the IEEE, vol.67, pp. 1586-1604, Dec. 1979 に開示されているウィーナーフィルタ法に適用可能である。

（第２の実施形態）
第２の実施形態が第１の実施形態と異なる点は、ノイズサプレス部１４ｉにある。そこで、ノイズサプレス部１４ｉの第２の実施形態を、図面を参照して説明する。なお、第１の実施形態に係るノイズサプレス部１４ｉと同じ部分については、同じ符号を付してその説明を省略する。

図９は、第２の実施形態に係るノイズサプレス部１４ｉの詳細な構成を示すブロック図である。このノイズサプレス部１４ｉは、ＡＤ変換器１４ｈと接続される時間／周波数領域変換部２１と、帯域分割部２２と、雑音推定部２３と、事後ＳＮＲ推定部３１と、補正値算出部４１ｂと、事前ＳＮＲ補正部５２ｂと、雑音抑圧係数設定部５３と、雑音スペクトル振幅抑圧部５４と、音声符号部１４ｊと接続される周波数／時間領域変換部５５とからなる。

このノイズサプレス部１４ｉは、第１の実施形態に係るノイズサプレス部１４ｉと比較して、補正値算出部４１に代えて補正値算出部４１ｂを有し、事前ＳＮＲ補正部５２に代えて事前ＳＮＲ補正部５２ｂを有する構成である。また、事後ＳＮＲ補正部５１を有しない構成であり、事前ＳＮＲ補正部５２ｂと雑音抑圧係数設定部５３とは、事後ＳＮＲ推定部３１によって出力される事後信号対雑音比ＳＮＲ（ｋ）を入力する。

しかし、第２の実施形態に係るノイズサプレス部１４ｉの構成は、これに限るものではなく、補正値算出部４１と事後ＳＮＲ補正部５１とを更に有しても良い。即ち、事後ＳＮＲ補正部５１は、補正値算出部４１によって出力された補正値によって事後信号対雑音比ＳＮＲ（ｋ）を補正し、事前ＳＮＲ補正部５２ｂと雑音抑圧係数設定部５３とは、事後ＳＮＲ補正部５１によって出力された補正された事後信号対雑音比γ（ｋ）を入力しても良い。

そこで、以後の説明では、事前ＳＮＲ補正部５２ｂと雑音抑圧係数設定部５３とが入力する事後信号対雑音比は、補正されているか否かに係らず、事後信号対雑音比γ（ｋ）と記述する。

図１０は、補正値算出部４１ｂの詳細な構成を示すブロック図である。補正値算出部４１ｂは、事後ＳＮＲ推定部３１と接続される帯域別非線形処理部４２ｂ−１、…、４２ｂ−ｋ、…、４２ｂ−Ｋと、事前ＳＮＲ補正部５２ｂと接続される帯域共通非線形処理部４４ｂとからなる。ここで、１＜ｋ＜Ｋであり、Ｋは、既に説明した通り、周波数帯域数である。

図１１は、事前ＳＮＲ補正部５２ｂの詳細な構成を示すブロック図である。事前ＳＮＲ補正部５２ｂは、補正値算出部４１ｂ及び事後ＳＮＲ推定部３１と接続される更新係数計算部５２ｂ１と、補正値算出部４１ｂ及び事後ＳＮＲ推定部３１及び雑音抑圧係数設定部５３と接続される事前ＳＮＲ更新部５２ｂ２とからなる。

上記のように構成された、本発明の第２の実施形態に係る移動通信端末装置の動作を、図９〜図１１を参照して説明する。まず、補正値算出部４１ｂの動作を、図１０を参照して説明する。補正値算出部４１ｂは、帯域毎の事後信号対雑音比ＳＮＲ（ｋ）を入力し、補正値μを算出する。

まず、帯域別非線形処理部４２ｂ−ｋ（ここで、ｋ＝１〜Ｋ。）は、帯域毎の事後信号対雑音比ＳＮＲ（ｋ）を入力し、非線形処理をして、帯域毎の非線形処理指数βｋを出力する。この非線形処理で用いられる非線形関数の一例は、βｋ＝ｍｉｎ｛Ｇ、ＳＮＲ（ｋ）｝である。ここで、Ｇは所定の定数であり、例えば、１０などが用いられる。また、ｍｉｎ｛Ｘ，Ｙ｝は、ＸとＹとのどちらか小さい方を選択する関数である。

次に、帯域共通非線形処理部４４ｂは、帯域別非線形処理部４２ｂ−ｋによって出力された帯域毎の非線形処理指数βｋを入力して、非線形処理して補正値μを出力する。この非線形処理に用いられる非線形関数の一例は、以下の通りである。

ここで、Ｇは、上記帯域別非線形処理部４２ｂ−ｋの動作説明の際に説明した定数である。このようにして算出された補正値μは、事前ＳＮＲ補正部５２ｂに出力される。

次に、事前ＳＮＲ補正部５２ｂの動作を説明する。事前ＳＮＲ補正部５２ｂは、補正された事前信号対雑音比ξ（ｋ，ｊ）を１フレーム前の補正された事前信号対雑音比ξ（ｋ，ｊ−１）を更新して求める装置であり、まず、更新係数計算部５２ｂ１の動作から説明する。

更新係数計算部５２ｂ１は、補正値算出部４１ｂから出力された補正値μと、事後ＳＮＲ推定部３１から出力された事後信号対雑音比γ（ｋ，ｊ）と、後述するように、事前ＳＮＲ補正部５２ｂ内の記憶部（図示せず）に記憶された１フレーム前の補正された事前信号対雑音比ξ（ｋ，ｊ−１）を用いて、可変更新係数αを以下のように計算して、事前ＳＮＲ更新部５２ｂ２へ出力する。

ここで、Ａ＝ｍａｘ（γ（ｋ）−１，０）、また、Ｂは所定の定数であり、例えば、１が用いられる。なお、事後信号対雑音比から１を差し引く代わりに、事後信号対雑音比にｓｑｕａｒｅ［Ｈ（ｋ，ｊ−１）］を乗算するようにしてもよい。

次に、事前ＳＮＲ更新部５２ｂ２は、更新係数計算部５２ｂ１によって出力された上記可変更新係数αと、事後ＳＮＲ推定部３１から出力された事後信号対雑音比γ（ｋ，ｊ）と、後述するように、事前ＳＮＲ補正部５２ｂ内の記憶部に記憶された１フレーム前の事後信号対雑音比γ（ｋ，ｊ−１）及び１フレーム前の雑音抑圧係数Ｈ（ｋ，ｊ−１）とを用いて補正された事前信号対雑音比ξ（ｋ）を以下のように計算する。

ここで、Ａ＝ｍａｘ（γ（ｋ）−１，０）である。また、α’は、固定更新係数であり、通常、０．９５〜０．９９、例えば、０．９８が用いられる。

事前ＳＮＲ更新部５２ｂ２は、事後ＳＮＲ推定部３１から出力された事後信号対雑音比γ（ｋ）と、事前ＳＮＲ更新部５２ｂ２によって求められた事前信号対雑音比ξ（ｋ）と、雑音抑圧係数設定部５３から出力された雑音抑圧係数Ｈ（ｋ）とを、事前ＳＮＲ補正部５２ｂ内の記憶部に記憶する。

上記のように事前ＳＮＲ補正部５２ｂによって計算された、補正された事前信号対雑音比ξ（ｋ）は、雑音抑圧係数設定部５３に出力される。

上記のように補正された事前信号対雑音比ξ（ｋ）を計算すると、雑音区間で特定の帯域（ｋ’とする。ここで、ｋ’＝０〜Ｋ。Ｋは周波数帯域数。）の帯域パワーＸｄ（ｋ’）は上昇しても、ｋ’以外の帯域に対する事後信号対雑音比ＳＮＲ（ｋ）は小さい。そのため、補正値算出部４１ｂによって式（８）に従って求められた補正値μは０に近い値となる。

そこで、式（９）中のＡ×μは０に近い値となり、更新係数計算部５２ｂ１によって式（９）に従って求められた可変更新係数αは、α≒１／｛１＋ｓｑｕａｒｅ［ξ（ｋ，ｊ−１）］｝≒１と、１に近い値となり、事前ＳＮＲ更新部５２ｂ２によって式（１０）に従って求められた補正された事前信号対雑音比ξ（ｋ）はスムージングされる結果、ミュージカルノイズの発生を防ぐことができる。なお、ここでは、可変更新係数αを計算する際の定数Ｂを１としている。

一方、音声区間では、広い帯域に渡って帯域パワーＸｄ（ｋ）が上昇するため、多くのｋに対する事後信号対雑音比ＳＮＲ（ｋ）は大きい。そこで、補正値算出部４１ｂによって式（８）に従って求められた補正値μは１に近い値となる。また、更新係数計算部５２ｂ１によって算出される式（９）中のＡは、γ（ｋ）−１にほぼ等しくなり、従って求められた可変更新係数αは、以下のようになる。なお、ここでは、可変更新係数αを計算する際の定数Ｂを１としている。

そして、特に語頭では、事後信号対雑音比γ（ｋ）≒１＋ξ（ｋ，ｊ）≫１＋ξ（ｋ，ｊ−１）、すわなち、｛１＋ξ（ｋ，ｊ−１）｝／γ（ｋ）≒０となり、上記可変更新係数αを計算する式（１１）中のｓｑｕａｒｅ［１−｛１＋ξ（ｋ，ｊ−１）｝／γ（ｋ）］≒１が導かれ、可変更新係数α≒０．５となる。この可変更新係数の値は、通常の固定更新係数α’よりはるかに小さいため、事前ＳＮＲ更新部５２ｂ２によって式（１０）に従って求められた補正された事前信号対雑音比ξ（ｋ）の立ち上がりが急峻になり、語頭の減衰感が軽減される。

（その他の実施形態）
上記の各実施形態では、ノイズサプレス部１４ｉを移動通信端末装置の送話音声のノイズを抑圧するために適用されるとしたが、これに限るものではない。受話音声のノイズが抑圧されていない場合、音声復号部１４ｄの出力の受話音声信号に含まれるノイズを抑圧し、ノイズが抑圧された音声信号をＤＡ変換器１４ｅに出力することによって、受話音声に含まれるノイズを抑圧するために適用されてもよい。また、通話相手の装置がノイズを抑圧する機能を有していない場合、送話音声のノイズを抑圧するため及び受話音声のノイズを抑圧するために適用されてもよい。

更に、以上の説明は、本発明のノイズサプレス装置及びノイズサプレス方法を移動通信端末装置に適用した形態を例にとって行ったが、本発明のノイズサプレス装置及びノイズサプレス方法は、固定電話装置、会議システム、音声認識装置等、あらゆる音声信号を扱う装置に適用することが当然に可能である。また、上記２つの実施形態で説明した要素を適宜組み合わせても良い。本発明は以上の構成に限定されるものではなく、種々の変形が可能である。

本発明の実施形態に係る移動通信端末装置の構成を示すブロック図。本発明の実施形態に係る通話部の構成を示すブロック図。本発明の第１の実施形態に係るノイズサプレス部の構成を示すブロック図。本発明の実施形態に係る事後ＳＮＲ推定部の構成を示すブロック図。本発明の第１の実施形態に係る補正値算出部の構成を示すブロック図。本発明の第１の実施形態に係る帯域別非線形処理部における非線形関数の一例を示す図。本発明の第１の実施形態に係る帯域共通非線形処理部における非線形関数の一例を示す図。本発明の第１の実施形態に係る事前ＳＮＲ補正部の変形例の構成を示すブロック図。本発明の第２の実施形態に係るノイズサプレス部の構成を示すブロック図。本発明の第２の実施形態に係る補正値算出部の構成を示すブロック図。本発明の第２の実施形態に係る事前ＳＮＲ補正部の構成を示すブロック図。

符号の説明

１２ｂ…通信部
１３…送受信部
１４ａ…スピーカ
１４ｂ…マイクロフォン
１４ｃ…通話部
１４ｄ…音声復号部
１４ｅ…ＤＡ変換器
１４ｈ…ＡＤ変換器
１４ｉ…ノイズサプレス部
１４ｊ…音声符号部
２１…時間／周波数領域変換部
２２…帯域分割部
２３…雑音推定部
３１…事後ＳＮＲ推定部
３２−１〜３２−Ｋ…帯域別事後ＳＮＲ計算部
４１、４１ｂ…補正値算出部
４２−１〜４２−Ｋ、４２ｂ−１〜４２ｂ−Ｋ…帯域別非線形処理部
４３−１、４３−２…総和平均計算部
４４−１、４４−２、４４ｂ…帯域共通非線形処理部
５１…事後ＳＮＲ補正部
５２、５２ｂ…事前ＳＮＲ補正部
５２１、５２ｂ１…更新係数計算部
５２２、５２ｂ２…事前ＳＮＲ更新部
５３…雑音抑圧係数設定部
５４…雑音スペクトル振幅抑圧部
５５…周波数／時間領域変換部

Claims

音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第１の変換手段と、
前記第１の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、
前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、
前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第１の信号対雑音比を推定する第１の信号対雑音比推定手段と、
前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、
前記補正値算出手段によって算出された補正値を用いて前記第１の信号対雑音比を補正する第１の補正手段と、
前記第１の補正手段によって補正された第１の信号対雑音比に基づいて雑音抑圧係数を設定する雑音抑圧係数設定手段と、
前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第１の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、
前記重み付け手段によって重み付けされた振幅スペクトルと前記第１の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第２の変換手段と
を具備することを特徴とするノイズサプレス装置。
音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第１の変換手段と、
前記第１の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、
前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、
前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第１の信号対雑音比を推定する第１の信号対雑音比推定手段と、
前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、
前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から第２の信号対雑音比を推定する第２の信号対雑音比推定手段と、
過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比とから第３の信号対雑音比を推定する第３の信号対雑音比推定手段と、
前記第２の信号対雑音比推定手段によって推定された第２の信号対雑音比と前記第３の信号対雑音比推定手段によって推定された第３の信号対雑音比とから第４の信号対雑音比を推定する第４の信号対雑音比推定手段と、
前記補正値算出手段によって算出された補正値を用いて前記第４の信号対雑音比推定手段によって推定された第４の信号対雑音比を補正する第２の補正手段と、
前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比と前記第２の補正手段によって補正された第４の信号対雑音比とに基づいて前記雑音抑圧係数を設定する雑音抑圧係数設定手段と、
前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第１の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、
前記重み付け手段によって重み付けされた振幅スペクトルと前記第１の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第２の変換手段と
を具備することを特徴とするノイズサプレス装置。
音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第１の変換手段と、
前記第１の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、
前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、
前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第１の信号対雑音比を推定する第１の信号対雑音比推定手段と、
前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、
前記補正値算出手段によって算出された補正値を用いて前記第１の信号対雑音比を補正する第１の補正手段と、
前記第１の補正手段によって補正された第１の信号対雑音比から第２の信号対雑音比を推定する第２の信号対雑音比推定手段と、
過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記第１の補正手段によって補正された第１の信号対雑音比とから第３の信号対雑音比を推定する第３の信号対雑音比推定手段と、
前記第２の信号対雑音比推定手段によって推定された第２の信号対雑音比と前記第３の信号対雑音比推定手段によって推定された第３の信号対雑音比とから第４の信号対雑音比を推定する第４の信号対雑音比推定手段と、
前記第１の補正手段によって補正された第１の信号対雑音比、及び、前記第４の信号対雑音比推定手段によって推定された第４の信号対雑音比または前記補正値算出手段によって算出された補正値を用いて補正された前記第４の信号対雑音比のいずれかに基づいて前記雑音抑圧係数を設定する雑音抑圧係数設定手段と、
前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第１の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、
前記重み付け手段によって重み付けされた振幅スペクトルと前記第１の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第２の変換手段と
を具備することを特徴とするノイズサプレス装置。
前記補正値算出手段は、複数の前記帯域に共通な前記補正値を算出する
ことを特徴とする請求項１乃至請求項３のいずれか１項に記載のノイズサプレス装置。
前記補正値算出手段は、前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比を帯域毎に第１の非線形関数で処理して、前記複数の帯域に対するその処理の結果を第２の非線形関数で処理して前記複数の帯域に共通な補正値を算出する
ことを特徴とする請求項４に記載のノイズサプレス装置。
前記第４の信号対雑音比推定手段は、前記第２の信号対雑音比推定手段によって推定された第２の信号対雑音比と前記第３の信号対雑音比推定手段によって推定された第３の信号対雑音比とのいずれか一方の信号対雑音比を前記第４の信号対雑音比と推定する
ことを特徴とする請求項２または請求項３に記載のノイズサプレス装置。
前記いずれか一方の信号対雑音比は、前記いずれか一方の信号対雑音比の中で大なる信号対雑音比である
ことを特徴とする請求項６に記載のノイズサプレス装置。
音声ディジタル信号をフレームに分割して、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換し、
前記変換された振幅スペクトルを複数の帯域に分割し、
前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、
前記分割された帯域毎に、その帯域の振幅スペクトルと前記推定された雑音とから第１の信号対雑音比を推定し、
前記推定された第１の信号対雑音比から非線形関数によって補正値を算出し、
前記算出された補正値を用いて前記第１の信号対雑音比を補正し、
前記補正された第１の信号対雑音比に基づいて雑音抑圧係数を設定し、
前記設定された雑音抑圧係数に従い、前記分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、
前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する
ことを特徴とするノイズサプレス方法。
音声ディジタル信号をフレームに分割して、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換し、
前記変換された振幅スペクトルを複数の帯域に分割し、
前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、
前記分割された帯域毎に、その帯域の振幅スペクトルと前記推定された雑音とから第１の信号対雑音比を推定し、
前記推定された第１の信号対雑音比から非線形関数によって補正値を算出し、
前記算出された補正値を用いて前記第１の信号対雑音比を補正し、
前記補正された第１の信号対雑音比から第２の信号対雑音比を推定し、
過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記補正された第１の信号対雑音比とから第３の信号対雑音比を推定し、
前記推定された第２の信号対雑音比と前記推定された第３の信号対雑音比とから第４の信号対雑音比を推定し、
前記補正された第１の信号対雑音比、及び、前記推定された第４の信号対雑音比または前記算出された補正値を用いて補正された前記第４の信号対雑音比のいずれかに基づいて前記雑音抑圧係数を設定し、
前記設定された雑音抑圧係数に従い、前記分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、
前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する
ことを特徴とするノイズサプレス方法。
マイクロフォンから出力された音声信号をディジタル信号に変換するディジタル変換手段と、
前記ディジタル変換手段によって変換されたディジタル信号の雑音を抑圧する雑音抑圧手段と、
前記雑音抑圧手段によって雑音が抑圧されたディジタル信号を符号化する符号化手段と、
前記符号化手段によって符号化されたディジタル信号を送信する送信手段と、
音声信号が符号化されたディジタル信号を受信する受信手段と、
前記受信手段によって受信されたディジタル信号を復号する復号手段と、
前記復号手段によって復号された信号をアナログ信号に変換するアナログ変換手段と、
前記アナログ変換手段によって変換されたアナログ信号による音声を発生するスピーカと
を具備し、
前記雑音抑圧手段は、前記ディジタル変換手段によって変換されたディジタル信号を振幅スペクトルと位相スペクトルとに変換し、前記変換された振幅スペクトルを複数の帯域に分割し、前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、前記分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第１の信号対雑音比を推定し、前記第１の信号対雑音比推定手段によって推定された第１の信号対雑音比から非線形関数によって補正値を算出し、前記算出された補正値を用いて前記第１の信号対雑音比を補正し、前記補正された第１の信号対雑音比に基づいて雑音抑圧係数を設定し、前記設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記ディジタル信号に変換し、前記変換されたディジタル信号を前記符号化手段に出力する
ことを特徴とする移動通信端末装置。
マイクロフォンから出力された音声信号をディジタル信号に変換するディジタル変換手段と、
前記ディジタル変換手段によって変換されたディジタル信号の雑音を抑圧する雑音抑圧手段と、
前記雑音抑圧手段によって雑音が抑圧されたディジタル信号を符号化する符号化手段と、
前記符号化手段によって符号化されたディジタル信号を送信する送信手段と、
音声信号が符号化されたディジタル信号を受信する受信手段と、
前記受信手段によって受信されたディジタル信号を復号する復号手段と、
前記復号手段によって復号された信号をアナログ信号に変換するアナログ変換手段と、
前記アナログ変換手段によって変換されたアナログ信号による音声を発生するスピーカと
を具備し、
前記雑音抑圧手段は、前記ディジタル変換手段によって変換されたディジタル信号をフレームに分割して、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換し、前記変換された振幅スペクトルを複数の帯域に分割し、前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、前記分割された帯域毎に、その帯域の振幅スペクトルと前記推定された雑音とから第１の信号対雑音比を推定し、前記推定された第１の信号対雑音比から非線形関数によって補正値を算出し、前記算出された補正値を用いて前記第１の信号対雑音比を補正し、前記補正された第１の信号対雑音比から第２の信号対雑音比を推定し、過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記補正された第１の信号対雑音比とから第３の信号対雑音比を推定し、前記推定された第２の信号対雑音比と前記推定された第３の信号対雑音比とから第４の信号対雑音比を推定し、前記補正された第１の信号対雑音比、及び、前記推定された第４の信号対雑音比または前記算出された補正値を用いて補正された前記第４の信号対雑音比のいずれかに基づいて前記雑音抑圧係数を設定し、前記設定された雑音抑圧係数に従い、前記分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記ディジタル信号に変換し、前記変換されたディジタル信号を前記符号化手段に出力する
ことを特徴とする移動通信端末装置。