JP2006113515A - ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置 - Google Patents

ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置 Download PDF

Info

Publication number
JP2006113515A
JP2006113515A JP2004370862A JP2004370862A JP2006113515A JP 2006113515 A JP2006113515 A JP 2006113515A JP 2004370862 A JP2004370862 A JP 2004370862A JP 2004370862 A JP2004370862 A JP 2004370862A JP 2006113515 A JP2006113515 A JP 2006113515A
Authority
JP
Japan
Prior art keywords
signal
noise
noise ratio
estimated
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004370862A
Other languages
English (en)
Inventor
Takehiko Isaka
岳彦 井阪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004370862A priority Critical patent/JP2006113515A/ja
Publication of JP2006113515A publication Critical patent/JP2006113515A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】 音声の減衰感を緩和させつつ、同時にミュージカルノイズも軽減できるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置を提供する。
【解決手段】 入力音声信号から算出された振幅スペクトルを複数の帯域に分割し、この分割された帯域ごとに雑音を推定し、この推定された雑音と上記振幅スペクトルとから信号対雑音比を推定し、この推定された信号対雑音比を帯域別に非線形関数によって処理してから帯域共通の非線形関数によって処理して補正値を算出する。この補正値を用いて上記信号対雑音比を補正し、この補正された信号対雑音比に基づいて雑音抑圧係数を設定し、この設定された雑音抑圧係数に従い上記振幅スペクトルを重み付けしたのち音声信号に変換する。
【選択図】 図3

Description

本発明は、ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置に係り、特に、入力音声信号に含まれる雑音成分を抑圧する処理に関する。
移動通信端末装置を始めとして、固定電話装置、会議システム等の音声通信装置が用いられている。これらの装置の送話側装置を背景雑音の大きい環境下で使用すると、この背景雑音が取り込まれて音声とともに伝送され、その結果音声の明瞭感が低下してしまう。
また、音声認識装置においては、背景雑音が取り込まれることにより、認識性能が低下してしまう。このため、背景雑音を除去もしくは抑圧して音声のみの信号に近づける技術(ノイズサプレス技術)が種々研究されている。
例えば、移動通信端末装置の場合、音声信号をディジタル信号に変換してCELP(Code Excited Linear Prediction)方式などの音声符号化方式で符号化する方法が用いられている。そこで、変換されたディジタル信号から背景雑音を除去もしくは抑圧することが研究されている。
即ち、入力信号の信号対雑音比を周波数帯域ごとに求め、この信号対雑音比に基づいて雑音抑圧係数を決定し、この係数を周波数領域上で入力信号スペクトルの振幅成分に乗算することにより雑音を抑圧する手法がY. Ephraim et al., "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," ASSP, vol. 32, no. 6, pp. 1109-1121, 1984(1118頁、式(53))に開示されている。
しかしながら、この手法では、固定係数の1次巡回フィルタを用いて事前信号対雑音比を推定するため、語頭や音韻の境界のような音声スペクトルが変動する区間では事前信号対雑音比の推定にディレイが生じ、推定精度が劣化することにより、音声が減衰するという問題点があった。
そこで、この問題点を解決するために、音声パワーのフレーム間変動も加味して上記1次巡回フィルタの更新係数を適応的に変動させる手法が開示されている。即ち、音声パワーのフレーム間変動によって、上記巡回フィルタの更新係数を適応的に変動させる(例えば、非特許文献1参照。)。
また、事前信号対雑音比によって、上記巡回フィルタの更新係数を適応的に変動させる(例えば、非特許文献2参照。)。これらの手法によれば、語頭のような音声パワーの変動の激しい区間で、事前信号対雑音比の推定におけるディレイを軽減でき、事前信号対雑音比の推定精度を改善できる。
更に、上記問題点を解決するために、各周波数帯の信号対雑音比に応じて入力信号に非線形な重み付けを行い、時間的なスムージングを行って雑音推定し、この推定雑音と入力信号とから事後信号対雑音比と事前信号対雑音比を求め、雑音抑圧係数を決定する手法が開示されている(例えば、特許文献1参照。)。この手法によれば、雑音と音声の中間的なレベルの信号成分まで加味して雑音推定することができ、その推定精度の向上が期待できる。
I. Y. Soon and S. N. Koh, "Low distortion speech enhancement," IEE Proc., Visual Image Signal Processing, vol. 147, no. 3, pp.247-253, June 2000(250頁、式(28)及び式(29)) M. K. Hasan, S. Salahuddin and M. R. Khan, "A modified a priori SNR for speech enhancement using spectral subtraction rules," IEEE Signal Processing Letters, vol. 11, no. 4, pp. 450-453, Apr. 2004(451頁、式(15)) 特開2002−204175号公報(第2〜3頁、図3及び図4)
しかしながら、上述した非特許文献1、非特許文献2及び特許文献1に開示されている手法では、事前信号対雑音比の充分な推定精度が得られず、音声の一部が減衰したり、狭い周波数帯域で局所的散発的に発生するミュージカルノイズが発生して耳障りであるという問題点があった。
本発明は上記問題点を解決するためになされたもので、信号対雑音比の推定精度を高めることによって、音声の減衰感を緩和させつつ、同時にミュージカルノイズも軽減させるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置を提供することを目的とする。
上記目的を達成するために、本発明のノイズサプレス装置は、音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第1の変換手段と、前記第1の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第1の信号対雑音比を推定する第1の信号対雑音比推定手段と、前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、前記補正値算出手段によって算出された補正値を用いて前記第1の信号対雑音比を補正する第1の補正手段と、前記第1の補正手段によって補正された第1の信号対雑音比に基づいて雑音抑圧係数を設定する雑音抑圧係数設定手段と、前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第1の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、前記重み付け手段によって重み付けされた振幅スペクトルと前記第1の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第2の変換手段とを具備することを特徴とする。
また、本発明のノイズサプレス装置は、音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第1の変換手段と、前記第1の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第1の信号対雑音比を推定する第1の信号対雑音比推定手段と、前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から第2の信号対雑音比を推定する第2の信号対雑音比推定手段と、過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比とから第3の信号対雑音比を推定する第3の信号対雑音比推定手段と、前記第2の信号対雑音比推定手段によって推定された第2の信号対雑音比と前記第3の信号対雑音比推定手段によって推定された第3の信号対雑音比とから第4の信号対雑音比を推定する第4の信号対雑音比推定手段と、前記補正値算出手段によって算出された補正値を用いて前記第4の信号対雑音比推定手段によって推定された第4の信号対雑音比を補正する第2の補正手段と、前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比と前記第2の補正手段によって補正された第4の信号対雑音比とに基づいて前記雑音抑圧係数を設定する雑音抑圧係数設定手段と、前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第1の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、前記重み付け手段によって重み付けされた振幅スペクトルと前記第1の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第2の変換手段とを具備することを特徴とする。
本発明によれば、信号対雑音比の推定精度を高めることによって、音声の減衰感を緩和させつつ、同時にミュージカルノイズも軽減させるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置を提供することができる。
以下に、本発明によるノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置の実施の形態を、図面を参照して説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係るノイズサプレス装置及びノイズサプレス方法が適用された、本発明の第1の実施形態に係る移動通信端末装置の構成を示すブロック図である。
この移動通信端末装置は、装置全体の制御を行う制御部11と、基地局(図示せず)との間で電波の送受信を行うアンテナ12aと、通信部12bと、送受信部13と、スピーカ14aと、マイクロフォン14bと、通話部14cと、表示部15と、入力装置16とからなる。
図2は、通話部14cの詳細な構成を示すブロック図である。通話部14cは、送受信部13と接続される音声復号部14dと、DA変換器14eと、スピーカ14aと接続される増幅器14fと、マイクロフォン14bと接続される増幅器14gと、AD変換器14hと、ノイズサプレス部14iと、送受信部13と接続される音声符号部14jとからなる。
図3は、ノイズサプレス部14iの詳細な構成を示すブロック図である。ノイズサプレス部14iは、AD変換器14hと接続される時間/周波数領域変換部21と、帯域分割部22と、雑音推定部23と、事後信号対雑音比推定部(以後、事後SNR推定部と称する。)31と、補正値算出部41と、事後信号対雑音比補正部(以後、事後SNR補正部と称する。)51と、事前信号対雑音比補正部(以後、事前SNR補正部と称する。)52と、雑音抑圧係数設定部53と、雑音スペクトル振幅抑圧部54と、音声符号部14jと接続される周波数/時間領域変換部55とからなる。
図4は、事後SNR推定部31の詳細な構成を示すブロック図である。事後SNR推定部31は、帯域分割部22、雑音推定部23、補正値算出部41及び事後SNR補正部51と接続される帯域別事後信号対雑音比計算部(以後、帯域別事後SNR計算部と称する。)32−1、32−2、…、32−Kからなる。正の整数Kについては、後述する。
図5は、補正値算出部41の詳細な構成を示すブロック図である。補正値算出部41は、事後SNR推定部31と接続される帯域別非線形処理部42−1、…、42−m、42−n、…、42−Kと、総和平均計算部43−1、43−2と、事後SNR補正部51及び事前SNR補正部52と接続される帯域共通非線形処理部44−1、44−2とからなる。ここで、m=K/2であり、Kが奇数の場合、m=(K+1)/2である。また、n=m+1である。
上記のように構成された、本発明の第1の実施形態に係る移動通信端末装置の各部の動作を、図1〜図5を参照して説明する。
まず、通信部12bは、アンテナ12aが受信した高周波信号を送受信部13へ出力し、また、送受信部13から出力される高周波信号をアンテナ12aより送信する。
送受信部13は、通信部12bからの高周波信号を増幅、周波数変換及び復調し、それによって得られたディジタル音声信号を通話部14cへ、また、制御信号を制御部11に送る。更には、通話部14cから出力されるディジタル音声信号、及び制御部11から出力される制御信号を変調、周波数変換及び増幅し、高周波信号を得て、それを通信部12bに送る。
次に、通話部14cの動作を、図2を参照して説明する。まず、音声復号部14dによって、送受信部13から出力されたディジタル音声信号を復号する。この復号されたディジタル音声信号は、DA変換器14eによってアナログ音声信号に変換され、得られたアナログ音声信号は増幅器14fによって増幅され、増幅された信号はスピーカ14aに出力されて音声を発生させる。
また、マイクロフォン14bから出力されたアナログ音声信号は、増幅器14gによって増幅され、増幅された信号はAD変換器14hによってディジタル音声信号に変換される。得られたディジタル音声信号は、ノイズサプレス部14iによって雑音が抑圧され、雑音が抑圧された信号は、音声符号部14jによって符号化されて、送受信部13に出力される。ノイズサプレス部14iの動作は後述する。
次に、表示部15の動作を説明する。表示部15は、制御部11に制御されることで、文字・数字や画像データの表示動作を行い、表示されているデータは、入力装置16からの入力操作や着信信号に応答して制御部11からの指示を受けることで切換わる。
入力装置16は、通信相手の電話番号を指定するための数字キーと複数の機能キーを含むキーからなる。そして、入力装置16のキーが操作されると、そのキーの識別子が制御部11に通知され、制御部11によって、表示部15に文字として表示され、または、制御が行われる。
次に、ノイズサプレス部14iの動作を、図3〜図5を参照して説明する。まず、時間/周波数領域変換部21は、AD変換器14hから出力されたディジタル音声信号を時間領域の信号から周波数領域の信号に変換し、周波数スペクトル、即ち、振幅スペクトルと位相スペクトルとを算出する。
例えば、音声信号x(t)を所定時間長ずつ例えば128個ずつフレームに分割し、これらのフレームごとに時間/周波数領域変換処理を行い、これによりフレーム番号jにおける振幅スペクトルX(n、j)(n=0〜N−1。Nはフレーム長。)を得る。以下では、記述の簡略化のため、基本的にフレーム番号jを省略するが、数式の説明などでフレーム番号を区別する必要がある場合は、記述する。
なお、時間/周波数領域変換部21は、時間/周波数領域変換処理に先立って、スペクトル包絡を平坦化することを目的として、入力されたディジタル音声信号x(t)に対しプレエンファシス処理を設けたり、直流分をカットすることを目的として、ハイパスフィルタを設けたりしてもよい。
また、時間/周波数領域変換処理のフレーム長とシフト幅は同じでなくてもよく、例えばフレーム長を128、シフト幅を80とした場合には、80サンプル分の入力ディジタル音声信号x(t)をフレーム前半部に格納し、残りの48サンプルについては0とした後に境界の不連続性を排除するために正弦波特性の窓掛けを行ってもよい。プレエンファシスおよび窓掛けのより具体的な手法は、米国TIAで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC, 1997-01に詳述されている。
このように時間/周波数領域変換によって得られた振幅スペクトルX(n)は、帯域分割部22及び雑音スペクトル振幅抑圧部54に出力される。また、位相スペクトルP(n)は、周波数/時間領域変換部55に出力される。
帯域分割部22は、振幅スペクトルX(n)を低域から高域まで例えば16個の周波数帯域に分割し、これらの周波数帯域ごとに平均をとって各周波数帯域を代表する帯域パワーXd(k)(k=0〜K。Kは周波数帯域数で、例えば16。kが小さい方が低域、大きい方が高域とする。)を算出する。
ここでは、等間隔に分割する例を示したが、バークスケールやメルスケール等のような人間の聴覚特性に適した分割幅を採用してもよい。このようにして求められた各周波数帯域を代表する帯域パワーXd(k)は、雑音推定部23及び事後SNR推定部31に出力される。
雑音推定部23は、求められた各周波数帯域を代表する帯域パワーXd(k)を用いて、帯域毎の雑音帯域パワーNd(k)を推定する。雑音推定部23は、その区間に音声が存在するか否か、もしくは両者の中間状態も考慮してどれぐらい雑音らしいかを判定し、この判定結果に応じて、雑音帯域パワーNd(k)を推定する。
具体的には、雑音と判定された区間のパワーをそのまま雑音帯域パワーNd(k)としてもよいし、雑音区間と判定された現在を含む過去M個のフレームの平均パワーを用いてもよい。また、雑音と判定されたときに巡回フィルタによって過去の推定雑音との重み付き和を用いてもよいし、雑音らしいと判定されたときほどその区間を重視して、重み付けを行ってもよい。
これらの判定処理と推定処理は、帯域毎に行ってもよいし、複数帯域を一つにまとめて行ってもよいし、両者の重み付き和でもよい。このようにして算出された雑音帯域パワーNd(k)は、事後SNR推定部31に出力される。
次に、事後SNR推定部31の動作を、図4を参照して説明する。帯域別事後SNR計算部32−k(ここで、k=1〜K。)は、帯域パワーXd(k)及び雑音帯域パワーNd(k)を用いて、帯域毎の事後信号対雑音比SNR(k)をSNR(k)=Xd(k)/Nd(k)と計算して、推定する。このように推定された帯域毎の事後信号対雑音比SNR(k)は、補正値算出部41及び事後SNR補正部51に出力される。
次に、補正値算出部41の動作を、図5を参照して説明する。補正値算出部41は、帯域毎の事後信号対雑音比SNR(k)を入力し、補正値μを算出する。まず、帯域別非線形処理部42−k(ここで、k=1〜K。)は、帯域毎の事後信号対雑音比SNR(k)を入力し、非線形処理をして、帯域毎の非線形処理指数を出力する。
図6は、この非線形処理で用いられる非線形関数の一例を示す。帯域別非線形処理部42−kは、帯域毎の事後信号対雑音比SNR(k)がB[dB]以上であるときはCを出力し、それ以外のときはSNR(k)×C/B+Aを出力する。例えば、A=0、B=10、C=1などが用いられる。
ここでは、1次関数を組み合わせて用い、かつ、上限値が設定された非線形関数を用いた例を示したが、これに限るものではない。1次関数の他に、高次関数、対数関数、指数関数あるいはこれらを組み合わせたものであって、上限値が設定された非線形関数でもよい。また、上限値が設定された非線形関数に限るものではなく、上限値に漸近する非線形関数でもよい。
総和平均計算部43−1は、帯域別非線形処理部42−k(k=1〜m。ここで、m=K/2。Kが奇数の場合、m=(K+1)/2。)によってC以下にされたm個の非線形処理済み指数の総和平均値β1を計算する。また、総和平均計算部43−2は、帯域別非線形処理部42−k(k=n〜K。ここで、n=m+1。mは、上記総和平均計算部43−1の動作説明で説明した通り。)によってC以下にされたK−m個の指数の総和平均値β2を計算する。
ここで、総和平均値を計算することにより、周波数帯域1〜mについては、後述するように、共通の補正値が算出され、また、周波数帯域n〜Kについても、後述するように、共通の補正値が算出される。
なお、ここでは、総和平均値をとる例を示したが、総和平均計算部43−1、43−2は、相乗平均値、モード(中央値)またはメディアン(再頻値)をとってもよい。
帯域共通非線形処理部44−p(ここで、pは、1または2。)は、総和平均計算部43−pによって計算された総和平均βpを入力し、非線形処理して、補正値μpを出力する。図7に、この非線形処理で用いられる非線形関数の一例を示す。帯域共通非線形処理部44−pは、総和平均βpがD以下のとき(ただし、D≦C。)にEを出力し、それ以外のときは(βp−D)×(F−E)/(C−D)を出力する。例えば、C=1、D=0、E=0、F=1などが用いられる。
ここでは、1次関数を組み合わせて用い、かつ、下限値が設定された非線形関数を用いた例を示したが、これに限るものではない。1次関数の他に、高次関数、対数関数、指数関数あるいはこれらを組み合わせたものであって、下限値が設定された非線形関数でもよい。また、下限値が設定された非線形関数に限るものではなく、下限値に漸近する非線形関数でもよい。
なお、ここでは、帯域別非線形処理部42−kでは上限値が設定され、帯域共通非線形処理部44−pでは下限値が設定されるとしたが、これに限るものではない。帯域別非線形処理部42−kでは下限値が設定され、帯域共通非線形処理部44−pでは上限値が設定されるとしてもよい。
更に、ここでは、帯域を低域と高域に同じ帯域数に2分し、それぞれの帯域毎に補正値μpが計算されるとしたが、これに限るものではない。帯域を低域と高域に異なる帯域数に2分してもよい。また、帯域を低域と高域、及び、中域に2分し、それぞれに対して補正値が計算されるとしてもよい。
更に、全ての帯域に共通な補正値が計算されるとしてもよい。その場合、補正値算出部41は、総和平均計算部43−2及び帯域共通非線形処理部44−2を有しない構成であってもよい。また、帯域を低域と中域と高域に3分し、それぞれの帯域毎に補正値が計算されるとしてもよい。その場合、補正値算出部41は、更に、総和平均計算部43−3と帯域共通非線形処理部44−3とを備える。
更に、帯域を最大でK個に分割し、それぞれの帯域毎に補正値を計算してもよい。その場合、補正値算出部41は、K個の総和平均計算部43とK個の帯域共通非線形処理部44とを備える。
このようにして算出された補正値μpは、事後SNR補正部51及び事前SNR補正部52に出力される。
事後SNR補正部51は、補正値μpを用いて帯域毎の事後信号対雑音比SNR(k)を補正して、補正された事後信号対雑音比γ(k)を以下のように推定する。ここで、1≦k≦mの場合、p=1、m+1≦k≦Kの場合、p=2である。
Figure 2006113515
式(1)で計算された、補正された事後信号対雑音比γ(k)は、事前SNR補正部52及び雑音抑圧係数設定部53に出力される。なお、事後SNR補正部51は、補正された事後信号対雑音比γ(k)として、事後信号対雑音比SNR(k)を出力してもよい。言い換えると、ノイズサプレス部14iは、事後SNR補正部51を有しない構成としてもよい。
事前SNR補正部52は、事後SNR補正部51から出力された事後信号対雑音比γ(k)及び後述するように雑音抑圧係数設定部53から出力された雑音抑圧係数H(k)を、事前SNR補正部52内の記憶部(図示せず)に記憶する。
そして、事前SNR補正部52は、現フレームの補正された事後信号対雑音比γ(k,j)、事前SNR補正部52内の記憶部に記憶された1フレーム前の補正された事後信号対雑音比γ(k,j−1)及び後述する雑音抑圧係数H(k,j−1)を用いて、事前信号対雑音比ξ(k)を以下のように推定する。ここで、max[X,Y]は、XとYとのどちらか大きい方を選択する関数である。
Figure 2006113515
また、事前SNR補正部52は、式(2)の事前信号対雑音比ξ(k)に補正値μpを乗算して、事前信号対雑音比ξ(k)を以下のように補正してもよい。
Figure 2006113515
このように事前信号対雑音比ξ(k)を補正することによって、音声の語尾のような音声パワーが下がる区間において、事前信号対雑音比ξ(k)が大きな値になることを補正値μpを乗算することによって防ぎ、雑音抑圧性能を向上させることができる。
ここでは、式(2)、式(2´)の様に2つの値からより大きい値を検出して事前信号対雑音比ξ(k)を計算する場合を示したが、これに限るものではない。より小さい値を検出して事前信号対雑音比ξ(k)としてもよいし、いずれか一方を固定的に選択して事前信号対雑音比ξ(k)としてもよい。また、2つの値の平均値を計算して事前信号対雑音比ξ(k)としてもよい。更に、所定の重み付きの平均値をとってもよい。ここで、重み付けは、上記より大きい値により大きい重みを付けてもよい。
更に、I. Y. Soon and S. N. Koh, "Low distortion speech enhancement," IEE Proc., Visual Image Signal Processing, vol. 147, no. 3, pp.247-253, June 2000(250頁、式(28)及び式(29))や、M. K. Hasan, S. Salahuddin and M. R. Khan, "A modified a priori SNR for speech enhancement using spectral subtraction rules," IEEE Signal Processing Letters, vol. 11, no. 4, pp. 450-453, Apr. 2004(451頁、式(15))に開示されている手法によって、事前信号対雑音比ξ(k)を推定してもよい。
即ち、事前SNR補正部52は、事前信号対雑音比ξ(k)を事前SNR補正部52内の記憶部に記憶して、帯域パワーXd(k)のフレーム間差分あるいは事後信号対雑音比γ(k)あるいは事前SNR補正部52内の記憶部に記憶された1フレーム前の事前信号対雑音比ξ(k,j−1)等を用いて事前信号対雑音比ξ(k)を推定してもよい。
上述のように事前信号対雑音比ξ(k)を推定することで、固定係数の巡回フィルタで事前信号対雑音比ξ(k)を推定すると、ディレイが生じ、語頭や音韻の境界のような帯域パワーXd(k)や振幅スペクトルX(n)が変動する区間で事前信号対雑音比ξ(k)の推定精度が劣化することに比較して、推定精度の劣化を軽減できるという効果が得られる。
一方、雑音区間では、式(2)によって推定された事前信号対雑音比ξ(k)の推定精度が劣化したとしても、補正値μが雑音区間では0に近い値となり、事後信号対雑音比γ(k)と事前信号対雑音比ξ(k)とのいずれか一方、または、両方が補正されることによって小さくなり、ミュージカルノイズが軽減される。
あるいは、事前SNR補正部52は、補正された事前信号対雑音比ξ(k,j)を1フレーム前の補正された事前信号対雑音比ξ(k,j−1)を更新して求める構成としても良い。図8は、この変形された事前SNR補正部52の詳細な構成を示すブロック図である。この変形された事前SNR補正部52は、補正値算出部41及び事後SNR補正部51と接続される更新係数計算部521と、補正値算出部41及び事後SNR補正部51及び雑音抑圧係数設定部53と接続される事前SNR更新部522とからなる。
次に、この事前SNR補正部52の動作を、まず、更新係数計算部521の動作から説明する。更新係数計算部521は、補正値算出部41から出力された補正値μp(j)と、事後SNR補正部51から出力された事後信号対雑音比γ(k,j)と、後述するように、事前SNR補正部52内の記憶部に記憶された1フレーム前の事後信号対雑音比γ(k,j−1)とを用いて可変更新係数αを以下のように計算して、事前SNR更新部522へ出力する。ここで、A及びA’については、後述する。また、λは所定の定数である。
Figure 2006113515
次に、事前SNR更新部522は、更新係数計算部521によって出力された可変更新係数αと、補正値算出部41から出力された補正値μp(j)と、事後SNR補正部51から出力された事後信号対雑音比γ(k,j)と、事前SNR補正部52内の記憶部に記憶された1フレーム前の補正値μp(j−1)と、1フレーム前の事後信号対雑音比γ(k,j−1)と、1フレーム前の雑音抑圧係数H(k,j−1)とを用いて補正された事前信号対雑音比ξ(k)を以下のように計算する。
Figure 2006113515
ここで、square[X]は、Xの自乗を計算する関数である。そして、上記式(3)及び式(4)において、A=max[γ(k,j)−1,0]、A’=max[γ(k,j−1)−1,0]である。あるいは、A=max[{γ(k,j)−1}×μp(j),0]、A’=max[{γ(k,j−1)−1}×μp(j−1),0]、もしくは、A=max[γ(k,j)×μp(j)−1,0]、A’=max[γ(k,j−1)×μp(j−1)−1,0]としてもよい。なお、事後信号対雑音比から1を差し引く代わりに、事後信号対雑音比にsquare[H(k,j−1)]を乗算するようにしてもよい。
また、μp(j)はフレーム番号jにおける補正値であって、周波数帯域kに依存して、p=1またはp=2である。そして、μp(j−1)は、1フレーム前の補正値であって、周波数帯域kに依存して、p=1またはp=2である。
事前SNR更新部522は、補正値算出部41から出力された補正値μp(j)と、事後SNR補正部51から出力された事後信号対雑音比γ(k,j)と、雑音抑圧係数設定部53から出力された雑音抑圧係数H(k,j)とを事前SNR補正部52内の記憶部に記憶する。
以上のように、更新係数計算部521と事前SNR更新部522とによって、補正値μp(j)と可変更新係数αとを組み合わせて補正された事前信号対雑音比ξ(k)を計算することで、雑音区間では補正値μp(j)が小さくなり、可変更新係数αが大きくなるので、補正された事前信号対雑音比ξ(k)のスムージング効果が高まり、ミュージカルノイズが軽減される効果が得られる。
一方、音声区間では補正値μp(j)が大きくなり、可変更新係数αが小さくなるので、語頭における補正された事前信号対雑音比ξ(k)の立ち上がりが早くなり、語頭の減衰感が軽減される効果が得られる。
以上のようにして推定された、または、補正された事前信号対雑音比ξ(k)は、雑音抑圧係数設定部53に出力される。
雑音抑圧係数設定部53は、事後信号対雑音比γ(k)及び事前信号対雑音比ξ(k)を用いて、雑音抑圧係数H(k)を設定する。例えば、Y. Ephraim et al., "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," ASSP, vol. 32, no. 6, pp. 1109-1121, 1984(1118頁、式(53))に開示されているように、雑音抑圧係数H(k)を以下のように計算する。
Figure 2006113515
ここで、υ(k)=ξ(k)×γ(k)/[1+ξ(k)]、また、In(z)は、n次変形ベッセル関数である。あるいは、以下のように雑音抑圧係数H(k)を計算してもよい。
Figure 2006113515
ここで、λは、ラプラス関数の勾配である。なお、雑音抑圧係数H(k)の計算式は、他にも多数開示されているが、どのような手法を用いてもよい。例えば、スペクトルサブトラクション法によれば、雑音抑圧係数H(k)は、帯域分割部22で算出された帯域パワーXd(k)と雑音推定部23で推定された雑音帯域パワーNd(k)とから以下のように計算される。
Figure 2006113515
ここで、aは、事後信号対雑音比γ(k)から計算される値であり、bは、定数である。このスペクトルサブトラクション法によれば、雑音抑圧係数H(k)の設定に事前信号対雑音比ξ(k)を用いない。そこで、この手法による場合、ノイズサプレス部14iは、事前SNR補正部52を有しない構成としてもよい。このようにして設定された雑音抑圧係数H(k)は、事前SNR補正部52及び雑音スペクトル振幅抑圧部54に出力される。
雑音スペクトル振幅抑圧部54は、時間/周波数領域変換部21によって算出された振幅スペクトルX(n)に、雑音抑圧係数H(k)を帯域ごとに乗算して重み付けをして、雑音の抑圧された振幅スペクトルY(n)を算出する。このようにして得られた振幅スペクトルY(n)は、周波数/時間領域変換部55に出力される。
周波数/時間領域変換部55は、上記雑音抑圧された振幅スペクトルY(n)及び位相スペクトルP(n)を時間領域の音声信号y(t)に変換する。この変換されたディジタル音声信号y(t)は、ノイズサプレス部14iの最終的な出力として、音声符号部14jに送られる。
以上の説明では、ノイズサプレスの方式として、最小平均2乗誤差短時間スペクトル振幅法(いわゆるMMSE−STSA法)を仮定したが、その他の方式にも適用可能である。例えば、S. F. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. ASSP, vol. 27, no. 2, pp. 113-120, Feb. 1979(114頁、第2章C項)に開示されているスペクトルサブトラクション法に適用可能である。
また、J. S. Lim and A. V. Oppenheim, "Enhancement and Bandwidth Compression of Noisy Speech," Proc. of the IEEE, vol.67, pp. 1586-1604, Dec. 1979 に開示されているウィーナーフィルタ法に適用可能である。
(第2の実施形態)
第2の実施形態が第1の実施形態と異なる点は、ノイズサプレス部14iにある。そこで、ノイズサプレス部14iの第2の実施形態を、図面を参照して説明する。なお、第1の実施形態に係るノイズサプレス部14iと同じ部分については、同じ符号を付してその説明を省略する。
図9は、第2の実施形態に係るノイズサプレス部14iの詳細な構成を示すブロック図である。このノイズサプレス部14iは、AD変換器14hと接続される時間/周波数領域変換部21と、帯域分割部22と、雑音推定部23と、事後SNR推定部31と、補正値算出部41bと、事前SNR補正部52bと、雑音抑圧係数設定部53と、雑音スペクトル振幅抑圧部54と、音声符号部14jと接続される周波数/時間領域変換部55とからなる。
このノイズサプレス部14iは、第1の実施形態に係るノイズサプレス部14iと比較して、補正値算出部41に代えて補正値算出部41bを有し、事前SNR補正部52に代えて事前SNR補正部52bを有する構成である。また、事後SNR補正部51を有しない構成であり、事前SNR補正部52bと雑音抑圧係数設定部53とは、事後SNR推定部31によって出力される事後信号対雑音比SNR(k)を入力する。
しかし、第2の実施形態に係るノイズサプレス部14iの構成は、これに限るものではなく、補正値算出部41と事後SNR補正部51とを更に有しても良い。即ち、事後SNR補正部51は、補正値算出部41によって出力された補正値によって事後信号対雑音比SNR(k)を補正し、事前SNR補正部52bと雑音抑圧係数設定部53とは、事後SNR補正部51によって出力された補正された事後信号対雑音比γ(k)を入力しても良い。
そこで、以後の説明では、事前SNR補正部52bと雑音抑圧係数設定部53とが入力する事後信号対雑音比は、補正されているか否かに係らず、事後信号対雑音比γ(k)と記述する。
図10は、補正値算出部41bの詳細な構成を示すブロック図である。補正値算出部41bは、事後SNR推定部31と接続される帯域別非線形処理部42b−1、…、42b−k、…、42b−Kと、事前SNR補正部52bと接続される帯域共通非線形処理部44bとからなる。ここで、1<k<Kであり、Kは、既に説明した通り、周波数帯域数である。
図11は、事前SNR補正部52bの詳細な構成を示すブロック図である。事前SNR補正部52bは、補正値算出部41b及び事後SNR推定部31と接続される更新係数計算部52b1と、補正値算出部41b及び事後SNR推定部31及び雑音抑圧係数設定部53と接続される事前SNR更新部52b2とからなる。
上記のように構成された、本発明の第2の実施形態に係る移動通信端末装置の動作を、図9〜図11を参照して説明する。まず、補正値算出部41bの動作を、図10を参照して説明する。補正値算出部41bは、帯域毎の事後信号対雑音比SNR(k)を入力し、補正値μを算出する。
まず、帯域別非線形処理部42b−k(ここで、k=1〜K。)は、帯域毎の事後信号対雑音比SNR(k)を入力し、非線形処理をして、帯域毎の非線形処理指数βkを出力する。この非線形処理で用いられる非線形関数の一例は、βk=min{G、SNR(k)}である。ここで、Gは所定の定数であり、例えば、10などが用いられる。また、min{X,Y}は、XとYとのどちらか小さい方を選択する関数である。
次に、帯域共通非線形処理部44bは、帯域別非線形処理部42b−kによって出力された帯域毎の非線形処理指数βkを入力して、非線形処理して補正値μを出力する。この非線形処理に用いられる非線形関数の一例は、以下の通りである。
Figure 2006113515
ここで、Gは、上記帯域別非線形処理部42b−kの動作説明の際に説明した定数である。このようにして算出された補正値μは、事前SNR補正部52bに出力される。
次に、事前SNR補正部52bの動作を説明する。事前SNR補正部52bは、補正された事前信号対雑音比ξ(k,j)を1フレーム前の補正された事前信号対雑音比ξ(k,j−1)を更新して求める装置であり、まず、更新係数計算部52b1の動作から説明する。
更新係数計算部52b1は、補正値算出部41bから出力された補正値μと、事後SNR推定部31から出力された事後信号対雑音比γ(k,j)と、後述するように、事前SNR補正部52b内の記憶部(図示せず)に記憶された1フレーム前の補正された事前信号対雑音比ξ(k,j−1)を用いて、可変更新係数αを以下のように計算して、事前SNR更新部52b2へ出力する。
Figure 2006113515
ここで、A=max(γ(k)−1,0)、また、Bは所定の定数であり、例えば、1が用いられる。なお、事後信号対雑音比から1を差し引く代わりに、事後信号対雑音比にsquare[H(k,j−1)]を乗算するようにしてもよい。
次に、事前SNR更新部52b2は、更新係数計算部52b1によって出力された上記可変更新係数αと、事後SNR推定部31から出力された事後信号対雑音比γ(k,j)と、後述するように、事前SNR補正部52b内の記憶部に記憶された1フレーム前の事後信号対雑音比γ(k,j−1)及び1フレーム前の雑音抑圧係数H(k,j−1)とを用いて補正された事前信号対雑音比ξ(k)を以下のように計算する。
Figure 2006113515
ここで、A=max(γ(k)−1,0)である。また、α’は、固定更新係数であり、通常、0.95〜0.99、例えば、0.98が用いられる。
事前SNR更新部52b2は、事後SNR推定部31から出力された事後信号対雑音比γ(k)と、事前SNR更新部52b2によって求められた事前信号対雑音比ξ(k)と、雑音抑圧係数設定部53から出力された雑音抑圧係数H(k)とを、事前SNR補正部52b内の記憶部に記憶する。
上記のように事前SNR補正部52bによって計算された、補正された事前信号対雑音比ξ(k)は、雑音抑圧係数設定部53に出力される。
上記のように補正された事前信号対雑音比ξ(k)を計算すると、雑音区間で特定の帯域(k’とする。ここで、k’=0〜K。Kは周波数帯域数。)の帯域パワーXd(k’)は上昇しても、k’以外の帯域に対する事後信号対雑音比SNR(k)は小さい。そのため、補正値算出部41bによって式(8)に従って求められた補正値μは0に近い値となる。
そこで、式(9)中のA×μは0に近い値となり、更新係数計算部52b1によって式(9)に従って求められた可変更新係数αは、α≒1/{1+square[ξ(k,j−1)]}≒1と、1に近い値となり、事前SNR更新部52b2によって式(10)に従って求められた補正された事前信号対雑音比ξ(k)はスムージングされる結果、ミュージカルノイズの発生を防ぐことができる。なお、ここでは、可変更新係数αを計算する際の定数Bを1としている。
一方、音声区間では、広い帯域に渡って帯域パワーXd(k)が上昇するため、多くのkに対する事後信号対雑音比SNR(k)は大きい。そこで、補正値算出部41bによって式(8)に従って求められた補正値μは1に近い値となる。また、更新係数計算部52b1によって算出される式(9)中のAは、γ(k)−1にほぼ等しくなり、従って求められた可変更新係数αは、以下のようになる。なお、ここでは、可変更新係数αを計算する際の定数Bを1としている。
Figure 2006113515
そして、特に語頭では、事後信号対雑音比γ(k)≒1+ξ(k,j)≫1+ξ(k,j−1)、すわなち、{1+ξ(k,j−1)}/γ(k)≒0となり、上記可変更新係数αを計算する式(11)中のsquare[1−{1+ξ(k,j−1)}/γ(k)]≒1が導かれ、可変更新係数α≒0.5となる。この可変更新係数の値は、通常の固定更新係数α’よりはるかに小さいため、事前SNR更新部52b2によって式(10)に従って求められた補正された事前信号対雑音比ξ(k)の立ち上がりが急峻になり、語頭の減衰感が軽減される。
(その他の実施形態)
上記の各実施形態では、ノイズサプレス部14iを移動通信端末装置の送話音声のノイズを抑圧するために適用されるとしたが、これに限るものではない。受話音声のノイズが抑圧されていない場合、音声復号部14dの出力の受話音声信号に含まれるノイズを抑圧し、ノイズが抑圧された音声信号をDA変換器14eに出力することによって、受話音声に含まれるノイズを抑圧するために適用されてもよい。また、通話相手の装置がノイズを抑圧する機能を有していない場合、送話音声のノイズを抑圧するため及び受話音声のノイズを抑圧するために適用されてもよい。
更に、以上の説明は、本発明のノイズサプレス装置及びノイズサプレス方法を移動通信端末装置に適用した形態を例にとって行ったが、本発明のノイズサプレス装置及びノイズサプレス方法は、固定電話装置、会議システム、音声認識装置等、あらゆる音声信号を扱う装置に適用することが当然に可能である。また、上記2つの実施形態で説明した要素を適宜組み合わせても良い。本発明は以上の構成に限定されるものではなく、種々の変形が可能である。
本発明の実施形態に係る移動通信端末装置の構成を示すブロック図。 本発明の実施形態に係る通話部の構成を示すブロック図。 本発明の第1の実施形態に係るノイズサプレス部の構成を示すブロック図。 本発明の実施形態に係る事後SNR推定部の構成を示すブロック図。 本発明の第1の実施形態に係る補正値算出部の構成を示すブロック図。 本発明の第1の実施形態に係る帯域別非線形処理部における非線形関数の一例を示す図。 本発明の第1の実施形態に係る帯域共通非線形処理部における非線形関数の一例を示す図。 本発明の第1の実施形態に係る事前SNR補正部の変形例の構成を示すブロック図。 本発明の第2の実施形態に係るノイズサプレス部の構成を示すブロック図。 本発明の第2の実施形態に係る補正値算出部の構成を示すブロック図。 本発明の第2の実施形態に係る事前SNR補正部の構成を示すブロック図。
符号の説明
12b…通信部
13…送受信部
14a…スピーカ
14b…マイクロフォン
14c…通話部
14d…音声復号部
14e…DA変換器
14h…AD変換器
14i…ノイズサプレス部
14j…音声符号部
21…時間/周波数領域変換部
22…帯域分割部
23…雑音推定部
31…事後SNR推定部
32−1〜32−K…帯域別事後SNR計算部
41、41b…補正値算出部
42−1〜42−K、42b−1〜42b−K…帯域別非線形処理部
43−1、43−2…総和平均計算部
44−1、44−2、44b…帯域共通非線形処理部
51…事後SNR補正部
52、52b…事前SNR補正部
521、52b1…更新係数計算部
522、52b2…事前SNR更新部
53…雑音抑圧係数設定部
54…雑音スペクトル振幅抑圧部
55…周波数/時間領域変換部

Claims (11)

  1. 音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第1の変換手段と、
    前記第1の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、
    前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、
    前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第1の信号対雑音比を推定する第1の信号対雑音比推定手段と、
    前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、
    前記補正値算出手段によって算出された補正値を用いて前記第1の信号対雑音比を補正する第1の補正手段と、
    前記第1の補正手段によって補正された第1の信号対雑音比に基づいて雑音抑圧係数を設定する雑音抑圧係数設定手段と、
    前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第1の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、
    前記重み付け手段によって重み付けされた振幅スペクトルと前記第1の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第2の変換手段と
    を具備することを特徴とするノイズサプレス装置。
  2. 音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第1の変換手段と、
    前記第1の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、
    前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、
    前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第1の信号対雑音比を推定する第1の信号対雑音比推定手段と、
    前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、
    前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から第2の信号対雑音比を推定する第2の信号対雑音比推定手段と、
    過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比とから第3の信号対雑音比を推定する第3の信号対雑音比推定手段と、
    前記第2の信号対雑音比推定手段によって推定された第2の信号対雑音比と前記第3の信号対雑音比推定手段によって推定された第3の信号対雑音比とから第4の信号対雑音比を推定する第4の信号対雑音比推定手段と、
    前記補正値算出手段によって算出された補正値を用いて前記第4の信号対雑音比推定手段によって推定された第4の信号対雑音比を補正する第2の補正手段と、
    前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比と前記第2の補正手段によって補正された第4の信号対雑音比とに基づいて前記雑音抑圧係数を設定する雑音抑圧係数設定手段と、
    前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第1の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、
    前記重み付け手段によって重み付けされた振幅スペクトルと前記第1の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第2の変換手段と
    を具備することを特徴とするノイズサプレス装置。
  3. 音声ディジタル信号をフレームに分割し、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換する第1の変換手段と、
    前記第1の変換手段によって変換された振幅スペクトルを複数の帯域に分割する帯域分割手段と、
    前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定する雑音推定手段と、
    前記帯域分割手段によって分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第1の信号対雑音比を推定する第1の信号対雑音比推定手段と、
    前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から非線形関数によって補正値を算出する補正値算出手段と、
    前記補正値算出手段によって算出された補正値を用いて前記第1の信号対雑音比を補正する第1の補正手段と、
    前記第1の補正手段によって補正された第1の信号対雑音比から第2の信号対雑音比を推定する第2の信号対雑音比推定手段と、
    過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記第1の補正手段によって補正された第1の信号対雑音比とから第3の信号対雑音比を推定する第3の信号対雑音比推定手段と、
    前記第2の信号対雑音比推定手段によって推定された第2の信号対雑音比と前記第3の信号対雑音比推定手段によって推定された第3の信号対雑音比とから第4の信号対雑音比を推定する第4の信号対雑音比推定手段と、
    前記第1の補正手段によって補正された第1の信号対雑音比、及び、前記第4の信号対雑音比推定手段によって推定された第4の信号対雑音比または前記補正値算出手段によって算出された補正値を用いて補正された前記第4の信号対雑音比のいずれかに基づいて前記雑音抑圧係数を設定する雑音抑圧係数設定手段と、
    前記雑音抑圧係数設定手段によって設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記第1の変換手段によって変換された振幅スペクトルを重み付けする重み付け手段と、
    前記重み付け手段によって重み付けされた振幅スペクトルと前記第1の変換手段によって変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する第2の変換手段と
    を具備することを特徴とするノイズサプレス装置。
  4. 前記補正値算出手段は、複数の前記帯域に共通な前記補正値を算出する
    ことを特徴とする請求項1乃至請求項3のいずれか1項に記載のノイズサプレス装置。
  5. 前記補正値算出手段は、前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比を帯域毎に第1の非線形関数で処理して、前記複数の帯域に対するその処理の結果を第2の非線形関数で処理して前記複数の帯域に共通な補正値を算出する
    ことを特徴とする請求項4に記載のノイズサプレス装置。
  6. 前記第4の信号対雑音比推定手段は、前記第2の信号対雑音比推定手段によって推定された第2の信号対雑音比と前記第3の信号対雑音比推定手段によって推定された第3の信号対雑音比とのいずれか一方の信号対雑音比を前記第4の信号対雑音比と推定する
    ことを特徴とする請求項2または請求項3に記載のノイズサプレス装置。
  7. 前記いずれか一方の信号対雑音比は、前記いずれか一方の信号対雑音比の中で大なる信号対雑音比である
    ことを特徴とする請求項6に記載のノイズサプレス装置。
  8. 音声ディジタル信号をフレームに分割して、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換し、
    前記変換された振幅スペクトルを複数の帯域に分割し、
    前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、
    前記分割された帯域毎に、その帯域の振幅スペクトルと前記推定された雑音とから第1の信号対雑音比を推定し、
    前記推定された第1の信号対雑音比から非線形関数によって補正値を算出し、
    前記算出された補正値を用いて前記第1の信号対雑音比を補正し、
    前記補正された第1の信号対雑音比に基づいて雑音抑圧係数を設定し、
    前記設定された雑音抑圧係数に従い、前記分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、
    前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する
    ことを特徴とするノイズサプレス方法。
  9. 音声ディジタル信号をフレームに分割して、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換し、
    前記変換された振幅スペクトルを複数の帯域に分割し、
    前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、
    前記分割された帯域毎に、その帯域の振幅スペクトルと前記推定された雑音とから第1の信号対雑音比を推定し、
    前記推定された第1の信号対雑音比から非線形関数によって補正値を算出し、
    前記算出された補正値を用いて前記第1の信号対雑音比を補正し、
    前記補正された第1の信号対雑音比から第2の信号対雑音比を推定し、
    過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記補正された第1の信号対雑音比とから第3の信号対雑音比を推定し、
    前記推定された第2の信号対雑音比と前記推定された第3の信号対雑音比とから第4の信号対雑音比を推定し、
    前記補正された第1の信号対雑音比、及び、前記推定された第4の信号対雑音比または前記算出された補正値を用いて補正された前記第4の信号対雑音比のいずれかに基づいて前記雑音抑圧係数を設定し、
    前記設定された雑音抑圧係数に従い、前記分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、
    前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記音声ディジタル信号に変換する
    ことを特徴とするノイズサプレス方法。
  10. マイクロフォンから出力された音声信号をディジタル信号に変換するディジタル変換手段と、
    前記ディジタル変換手段によって変換されたディジタル信号の雑音を抑圧する雑音抑圧手段と、
    前記雑音抑圧手段によって雑音が抑圧されたディジタル信号を符号化する符号化手段と、
    前記符号化手段によって符号化されたディジタル信号を送信する送信手段と、
    音声信号が符号化されたディジタル信号を受信する受信手段と、
    前記受信手段によって受信されたディジタル信号を復号する復号手段と、
    前記復号手段によって復号された信号をアナログ信号に変換するアナログ変換手段と、
    前記アナログ変換手段によって変換されたアナログ信号による音声を発生するスピーカと
    を具備し、
    前記雑音抑圧手段は、前記ディジタル変換手段によって変換されたディジタル信号を振幅スペクトルと位相スペクトルとに変換し、前記変換された振幅スペクトルを複数の帯域に分割し、前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、前記分割された帯域毎に、その帯域の振幅スペクトルと前記雑音推定手段によって推定された雑音とから第1の信号対雑音比を推定し、前記第1の信号対雑音比推定手段によって推定された第1の信号対雑音比から非線形関数によって補正値を算出し、前記算出された補正値を用いて前記第1の信号対雑音比を補正し、前記補正された第1の信号対雑音比に基づいて雑音抑圧係数を設定し、前記設定された雑音抑圧係数に従い、前記帯域分割手段によって分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記ディジタル信号に変換し、前記変換されたディジタル信号を前記符号化手段に出力する
    ことを特徴とする移動通信端末装置。
  11. マイクロフォンから出力された音声信号をディジタル信号に変換するディジタル変換手段と、
    前記ディジタル変換手段によって変換されたディジタル信号の雑音を抑圧する雑音抑圧手段と、
    前記雑音抑圧手段によって雑音が抑圧されたディジタル信号を符号化する符号化手段と、
    前記符号化手段によって符号化されたディジタル信号を送信する送信手段と、
    音声信号が符号化されたディジタル信号を受信する受信手段と、
    前記受信手段によって受信されたディジタル信号を復号する復号手段と、
    前記復号手段によって復号された信号をアナログ信号に変換するアナログ変換手段と、
    前記アナログ変換手段によって変換されたアナログ信号による音声を発生するスピーカと
    を具備し、
    前記雑音抑圧手段は、前記ディジタル変換手段によって変換されたディジタル信号をフレームに分割して、前記分割されたフレームの信号を振幅スペクトルと位相スペクトルとに変換し、前記変換された振幅スペクトルを複数の帯域に分割し、前記分割された帯域毎に、その帯域の振幅スペクトルをもとに雑音を推定し、前記分割された帯域毎に、その帯域の振幅スペクトルと前記推定された雑音とから第1の信号対雑音比を推定し、前記推定された第1の信号対雑音比から非線形関数によって補正値を算出し、前記算出された補正値を用いて前記第1の信号対雑音比を補正し、前記補正された第1の信号対雑音比から第2の信号対雑音比を推定し、過去の前記フレームに対して設定された雑音抑圧係数と前記過去のフレームに対して前記補正された第1の信号対雑音比とから第3の信号対雑音比を推定し、前記推定された第2の信号対雑音比と前記推定された第3の信号対雑音比とから第4の信号対雑音比を推定し、前記補正された第1の信号対雑音比、及び、前記推定された第4の信号対雑音比または前記算出された補正値を用いて補正された前記第4の信号対雑音比のいずれかに基づいて前記雑音抑圧係数を設定し、前記設定された雑音抑圧係数に従い、前記分割された帯域毎に、前記変換された振幅スペクトルを重み付けし、前記重み付けされた振幅スペクトルと前記変換された位相スペクトルとを前記雑音が抑圧された前記ディジタル信号に変換し、前記変換されたディジタル信号を前記符号化手段に出力する
    ことを特徴とする移動通信端末装置。
JP2004370862A 2004-09-16 2004-12-22 ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置 Pending JP2006113515A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004370862A JP2006113515A (ja) 2004-09-16 2004-12-22 ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004270257 2004-09-16
JP2004370862A JP2006113515A (ja) 2004-09-16 2004-12-22 ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置

Publications (1)

Publication Number Publication Date
JP2006113515A true JP2006113515A (ja) 2006-04-27

Family

ID=36382057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004370862A Pending JP2006113515A (ja) 2004-09-16 2004-12-22 ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置

Country Status (1)

Country Link
JP (1) JP2006113515A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004499A1 (fr) * 2006-07-03 2008-01-10 Nec Corporation Procédé, dispositif et programme de suppression du bruit
JP2008257049A (ja) * 2007-04-06 2008-10-23 Yamaha Corp 雑音抑圧装置およびプログラム
WO2010113220A1 (ja) * 2009-04-02 2010-10-07 三菱電機株式会社 雑音抑圧装置
WO2012038998A1 (ja) * 2010-09-21 2012-03-29 三菱電機株式会社 雑音抑圧装置
CN106910511A (zh) * 2016-06-28 2017-06-30 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN109920434A (zh) * 2019-03-11 2019-06-21 南京邮电大学 一种基于会议场景的噪声分类去除方法
US11562763B2 (en) 2020-02-10 2023-01-24 Samsung Electronics Co., Ltd. Method for improving sound quality and electronic device using same

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004499A1 (fr) * 2006-07-03 2008-01-10 Nec Corporation Procédé, dispositif et programme de suppression du bruit
US10811026B2 (en) 2006-07-03 2020-10-20 Nec Corporation Noise suppression method, device, and program
JP2008257049A (ja) * 2007-04-06 2008-10-23 Yamaha Corp 雑音抑圧装置およびプログラム
US8090119B2 (en) 2007-04-06 2012-01-03 Yamaha Corporation Noise suppressing apparatus and program
CN102356427B (zh) * 2009-04-02 2013-10-30 三菱电机株式会社 噪声抑制装置
CN102356427A (zh) * 2009-04-02 2012-02-15 三菱电机株式会社 噪声抑制装置
JP5535198B2 (ja) * 2009-04-02 2014-07-02 三菱電機株式会社 雑音抑圧装置
WO2010113220A1 (ja) * 2009-04-02 2010-10-07 三菱電機株式会社 雑音抑圧装置
WO2012038998A1 (ja) * 2010-09-21 2012-03-29 三菱電機株式会社 雑音抑圧装置
JP5183828B2 (ja) * 2010-09-21 2013-04-17 三菱電機株式会社 雑音抑圧装置
CN103109320A (zh) * 2010-09-21 2013-05-15 三菱电机株式会社 噪声抑制装置
US8762139B2 (en) 2010-09-21 2014-06-24 Mitsubishi Electric Corporation Noise suppression device
CN106910511A (zh) * 2016-06-28 2017-06-30 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN106910511B (zh) * 2016-06-28 2020-08-14 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN109920434A (zh) * 2019-03-11 2019-06-21 南京邮电大学 一种基于会议场景的噪声分类去除方法
CN109920434B (zh) * 2019-03-11 2020-12-15 南京邮电大学 一种基于会议场景的噪声分类去除方法
US11562763B2 (en) 2020-02-10 2023-01-24 Samsung Electronics Co., Ltd. Method for improving sound quality and electronic device using same

Similar Documents

Publication Publication Date Title
JP4836720B2 (ja) ノイズサプレス装置
KR100843522B1 (ko) 노이즈 억제를 위한 방법 및 장치
US8571231B2 (en) Suppressing noise in an audio signal
JP4423300B2 (ja) 雑音抑圧装置
JP3591068B2 (ja) 音声信号の雑音低減方法
JP3963850B2 (ja) 音声区間検出装置
EP2444966B1 (en) Audio signal processing device and audio signal processing method
EP2362389B1 (en) Noise suppressor
JP5923994B2 (ja) 音声処理装置及び音声処理方法
EP2346032B1 (en) Noise suppressor and voice decoder
JP4660578B2 (ja) 信号補正装置
JP2008216720A (ja) 信号処理の方法、装置、及びプログラム
EP2987314B1 (en) Echo suppression
JP2008309955A (ja) ノイズサプレス装置
JP2004341339A (ja) 雑音抑圧装置
JP2006113515A (ja) ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置
JP2002169599A (ja) ノイズ抑制方法及び電子機器
EP1278185A2 (en) Method for improving noise reduction in speech transmission
US9111527B2 (en) Encoding device, decoding device, and methods therefor
JP2002300687A (ja) 電子機器
JP2005331783A (ja) 音声強調装置,音声強調方法および通信端末
JP4209348B2 (ja) エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体
JP4479625B2 (ja) 騒音抑圧装置
JP2008020556A (ja) デジタル無線通信装置