JP2008065090A - ノイズサプレス装置 - Google Patents

ノイズサプレス装置 Download PDF

Info

Publication number
JP2008065090A
JP2008065090A JP2006243407A JP2006243407A JP2008065090A JP 2008065090 A JP2008065090 A JP 2008065090A JP 2006243407 A JP2006243407 A JP 2006243407A JP 2006243407 A JP2006243407 A JP 2006243407A JP 2008065090 A JP2008065090 A JP 2008065090A
Authority
JP
Japan
Prior art keywords
noise
band
noise suppression
gain
suppression amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006243407A
Other languages
English (en)
Other versions
JP4836720B2 (ja
Inventor
Takehiko Isaka
岳彦 井阪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006243407A priority Critical patent/JP4836720B2/ja
Priority to US11/605,570 priority patent/US8270633B2/en
Publication of JP2008065090A publication Critical patent/JP2008065090A/ja
Application granted granted Critical
Publication of JP4836720B2 publication Critical patent/JP4836720B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Noise Elimination (AREA)

Abstract

【課題】 雑音区間での抑圧性能を維持しつつ、音声区間の高域における過剰な抑圧を軽減することができるノイズサプレス装置を提供する。
【解決手段】 雑音抑圧量計算部31は、信号対雑音比SNR(k)を用いて、雑音抑圧量G(k)を計算する。雑音抑圧量上限計算部32は、帯域全体の信号対雑音比SNR_allを用いて、雑音抑圧量の上限G_MAX(k)=log10[pow{10、−(SNR_all・A−(B−k/N・C))/20}/D]として計算する(A、B、C、Dは定数)。雑音抑圧量上限制限部33は、雑音抑圧量G(k)と雑音抑圧量の上限G_MAX(k)を用いて、ゲインG_new(k)=pow[10、MAX{−G(k)、−G_MAX(k)}]として計算する。このように、雑音抑圧量G(k)を上限G_MAX(k)によって制限することで、過剰な抑圧による音のかすれを軽減する効果が得られる。
【選択図】 図4

Description

本発明は、目的信号以外の雑音を抑圧するノイズサプレス装置に関する。
目的信号以外の雑音を抑圧する雑音抑圧装置がある(特許文献1参照。)。この雑音抑圧装置は、周波数帯域の高域ほどSNR(信号雑音比)の感度を上げることによって、高域の過剰な抑圧を防いでいる。
特許第3454206号公報(第8〜12頁、図3)
従来の雑音抑圧装置では、音声区間では過剰な抑圧が軽減されるが、雑音区間での抑圧性能が劣化するという副作用が発生する問題点がある。本発明は、上記の問題点を解決するためになされたもので、雑音区間での抑圧性能を維持しつつ、音声区間の高域における過剰な抑圧を軽減することができるノイズサプレス装置を提供することを目的とする。
上記目的を達成するために、本発明のノイズサプレス装置は、所定の時間幅の時間波形を振幅成分と位相成分との周波数成分に変換する周波数変換手段と、前記振幅成分を用いて帯域毎の帯域パワーを計算する帯域パワー計算手段と、前記帯域パワーを用いて帯域毎の雑音パワーを推定する雑音推定手段と、前記雑音推定手段で推定された帯域毎の雑音パワーと前記帯域パワーとを用いて帯域毎の信号対雑音比と帯域全体の信号対雑音比とを計算するSNR計算手段と、前記SNR計算手段で計算された帯域毎の信号対雑音比と帯域全体の信号対雑音比とを用いて雑音を抑圧するためのゲインを算出するゲイン算出手段と、前記周波数変換手段で変換された振幅成分を前記ゲインで重み付けるゲイン加重手段と、前記周波数変換手段で変換された位相成分と前記ゲイン加重手段で重み付けされた振幅成分とから時間波形を生成する周波数逆変換手段とを有するノイズサプレス装置であって、前記ゲイン算出手段は、前記SNR計算手段で計算された帯域全体の信号対雑音比を用いて雑音抑圧量の上限を帯域毎に計算する雑音抑圧量上限計算手段と、前記SNR計算手段で計算された帯域毎の信号対雑音比を用いて帯域毎の雑音抑圧量を求める雑音抑圧量計算手段と、前記雑音抑圧量上限計算手段で計算された上限で当該雑音抑圧量を制限してゲインを算出する雑音抑圧量上限制限手段とを具備することを特徴とする。
本発明によれば、雑音区間での抑圧性能を維持しつつ、音声区間の高域における過剰な抑圧を軽減することができる。
図1は、本発明の各実施例に係るノイズサプレス装置が適用された移動通信端末装置の構成を示すブロック図である。この移動通信端末装置100は、制御部1、アンテナ2、通信部3、送受信部4、スピーカ5、マイクロホン6、通話部7、表示部8、入力部9などから構成される。
制御部1は、移動通信端末装置100全体の制御を行う。アンテナ2は基地局(図示せず)との間で電波の送信受信を行う。通信部3は、変調復調処理などを行う。送受信部4は、画像データや音声データの送信受信処理などを行う。スピーカ5とマイクロホン6は、移動通信端末装置100のユーザとの間の音声入出力インターフェースである。通話部7は、音声処理を行う。この通話部7に、ノイズサプレス部(ノイズサプレス装置)がある。表示部8と入力部9は、ユーザとの間の表示およびキー入力などのインターフェースである。この中の通話部7の詳細について次に説明する。
図2は、本発明の各実施例に係る通話部の詳細な構成を示すブロック図である。通話部7は、音声復号部11、DA変換器12、増幅器13、増幅器14、AD変換器15、ノイズサプレス部16(ノイズサプレス装置)、音声符号部17などから構成される。
音声復号部11は、送受信部4からの圧縮された音声信号を復号処理する。DA変換器12は、それをDA変換する。増幅器13は、それを増幅して、スピーカ5へ送出する。
増幅器14は、マイクロホン6からの音声信号を増幅する。AD変換器15はそれをAD変換する。ノイズサプレス部16は、その信号に対して、ノイズの抑圧処理を行う。音声符号部17は、それに対して、音声圧縮処理を行い、送受信部4へ送出する。この中のノイズサプレス部16の詳細について、以下の実施例1、実施例2で説明する。
図3は、本発明の実施例1に係るノイズサプレス部の詳細な構成を示すブロック図である。ノイズサプレス部16は、周波数変換部21、帯域パワー計算部22、雑音推定部23、SNR計算部24、ゲイン算出部25、ゲイン加重部26、周波数逆変換部27などから構成される。この中のゲイン算出部25は、更に次の構成を備える。
図4は、本発明の実施例1に係るゲイン算出部の詳細な構成を示すブロック図である。ゲイン算出部25は、雑音抑圧量計算部31、雑音抑圧量上限計算部32、雑音抑圧量上限制限部33などから構成される。
図3および図4により、ノイズサプレス部16の各部の動作を説明する。まず、周波数変換部21は、音声信号x(t)を所定時間長ずつ例えば128個ずつフレームに分割し、これらのフレームごとに時間/周波数領域変換処理を行う。これによりフレーム番号jにおける振幅スペクトル|X(n、j)|(n=0〜N−1。Nはフレーム長。)と位相スペクトルP(n、j)を得る。以下では、記述の簡略化のため、基本的に絶対値記号|とフレーム番号jを省略して、振幅スペクトルX(n)と称するが、数式の説明などでフレーム番号を区別する必要がある場合は、記述する。
なお、周波数変換部21は、時間/周波数領域変換処理に先立って、スペクトル包絡を平坦化することを目的として、入力されたディジタル音声信号x(t)に対しプレエンファシス処理を設けたり、直流分をカットすることを目的として、ハイパスフィルタを設けたりしてもよい。
また、時間/周波数領域変換処理のフレーム長とシフト幅は同じでなくてもよく、例えばフレーム長を128、シフト幅を80とした場合には、80サンプル分の入力ディジタル音声信号x(t)をフレーム前半部に格納し、残りの48サンプルについては0とした後に境界の不連続性を排除するために正弦波特性の窓掛けを行ってもよい。プレエンファシスおよび窓掛けのより具体的な手法は、米国TIAで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC、1997-01に詳述されている。
このように時間/周波数領域変換によって得られた振幅スペクトルX(n)は、帯域パワー計算部22及びゲイン加重部26に出力される。また、位相スペクトルP(n)は、周波数逆変換部27に出力される。
帯域パワー計算部22は、振幅スペクトルX(n)を低域から高域まで例えば16個の周波数帯域に分割し、これらの周波数帯域ごとに平均をとって各周波数帯域を代表する帯域パワーXd(k)(k=0〜K−1。Kは周波数帯域数で、例えば16。kが小さい方が低域、大きい方が高域とする。)を算出する。ここでは、等間隔に分割する例を示したが、バークスケールやメルスケール等のように、低域ほど分割幅を狭くして、人間の聴覚特性に適した分割幅を採用してもよい。また、瞬時的な変動の大きい振幅スペクトルのパワーを用いるよりも安定したパワーを得ることを目的として、周波数帯域に分割する例を示したが、特定の帯域(例えば、低域あるいは全帯域)で振幅スペクトルのパワーそのものを用いて、より細かく処理してもよい。このようにして求められた各周波数帯域を代表する帯域パワーXd(k)は、雑音推定部23に出力される。
雑音推定部23は、求められた各周波数帯域を代表する帯域パワーXd(k)を用いて、帯域毎の雑音帯域パワーNd(k)を推定する。雑音推定部23は、その区間に音声が存在するか否か、もしくは両者の中間状態も考慮してどれぐらい雑音らしいかを判定し、この判定結果に応じて、雑音帯域パワーNd(k)を推定する。
具体的には、雑音と判定された区間のパワーをそのまま雑音帯域パワーNd(k)としてもよいし、雑音区間と判定された現在を含む過去M個のフレームの平均パワーを用いてもよい。また、雑音と判定されたときに巡回フィルタによって過去の推定雑音との重み付き和を用いてもよいし、雑音らしいと判定されたときほどその区間を重視して、重み付けを行ってもよい。このように、音声の影響、雑音の瞬時的な変動を受けにくくして、定常的な雑音成分の近似値を雑音帯域パワーXd(k)として推定する。
これらの判定処理と推定処理は、帯域毎に行ってもよいし、複数帯域を一つにまとめて行ってもよいし、両者の重み付き和でもよい。このようにして算出された雑音帯域パワーNd(k)は、SNR計算部24に出力される。
SNR計算部24は、帯域パワーXd(k)及び雑音帯域パワーNd(k)を用いて、帯域毎の信号対雑音比SNR(k)をSNR(k)=Xd(k)/Nd(k)と計算する。また、帯域全体の信号対雑音比SNR_allをSNR_all=Σ(k=0〜K−1)Xd(k)/Σ(k=0〜K−1)Nd(k)と計算する。あるいは、SNR_all=(1/K)×Σ(k=0〜K−1)SNR(k)のように、帯域毎のSNR(k)の平均値としてもよいし、SNR_all=(1/K)×max(k=0〜K−1){SNR(k)}のように帯域毎のSNR(k)の最大値としてもよい。要するに、SNR_allは帯域全体のSNRを表すパラメータであればよく、これらに限定されるものではない。このように計算されたSNR(k)、SNR_allは、ゲイン算出部25の雑音抑圧量計算部31及び雑音抑圧量上限計算部32に出力される。
雑音抑圧量計算部31は、信号対雑音比SNR(k)を用いて、雑音抑圧量G(k)を計算する。具体的な計算方法としては、例えば、文献(S. F. Boll、 "Suppression of acoustic noise in speech using spectral subtraction、" IEEE Trans. ASSP、 vol. 27、 no. 2、 pp. 113-120、 Feb. 1979(114頁、第2章C項))に開示されている、いわゆるスペクトルサブトラクション(Spectral Subtraction:SS)法がある。
あるいは、Y. Ephraim et al.、 "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator、" ASSP、 vol. 32、 no. 6、 pp. 1109-1121、 1984(1118頁、式(53))に開示されている、いわゆるMMSE-STSA法や、J. S. Lim and A. V. Oppenheim、 "Enhancement and Bandwidth Compression of Noisy Speech、" Proc. of the IEEE、 vol.67、 pp. 1586-1604、 Dec. 1979 に開示されているウィーナーフィルタ法などが代表的である。MMSE-STSA法では、1フレーム前に抑圧された振幅スペクトル|Y(n,j)|も用いるため、点線で示した信号線26aが追加になる。
これらの方法は、信号対雑音比SNR(k)が大きいときほど、帯域kのゲインを1(すなわち抑圧量=0dB)に近付け、SNR(k)が小さいときほど、帯域kのゲインを0または正の下限値に近付けることによって、入力信号中の雑音成分を抑圧する方法である。つまり、雑音らしい帯域ほどゲインを小さくして、雑音を抑圧する。雑音抑圧量G(k)の計算方法は、これに限るものではない。このようにして求められた雑音抑圧量G(k)は、雑音抑圧量上限制限部33に出力される。
雑音抑圧量上限計算部32は、帯域全体の信号対雑音比SNR_allを用いて、雑音抑圧量の上限G_MAX(k)を次の(式1)として計算する。
G_MAX(k)=log10[pow{10,−(SNR_all×A−(B−k/N×C))/20}/D] ・・・(式1)
ここで、A,B,C,Dは所定の定数であり、例えば、A=1,B=60,C=80,D=10である。
kは周波数帯域であり、k=0〜K−1。Kは周波数帯域数で、例えば16。kが小さい方が低域、大きい方が高域である。
Nはフレーム長である。
SNR_allは、帯域全体の信号対雑音比である。
(B−k/N×C)は、高い周波数帯域ほど小となる所定値である。
(SNR_all×A−(B−k/N×C))は、帯域毎の信号対雑音比である。
pow{10,−(SNR_all×A−(B−k/N×C))/20}は、10の「−(SNR_all×A−(B−k/N×C))/20」乗を示す。
log10[pow{10,−(SNR_all×A−(B−k/N×C))/20}/D]は、底を10とした「pow{10,−(SNR_all×A−(B−k/N×C))/20}/D」の対数を示す。
式(1)において、高い周波数帯域ほど、k/N×Cが大きくなり、高い周波数帯域ほど所定値(B−k/N×C)は小さくなり、帯域毎の信号対雑音比(SNR_all×A−(B−k/N×C))は大きくなり、pow{10,−(SNR_all×A−(B−k/N×C))/20}は、10の「−(SNR_all×A−(B−k/N×C))/20」乗なので、小さくなり、雑音抑圧量の上限G_MAX(k)=log10[pow{10,−(SNR_all×A−(B−k/N×C))/20}/D]は、底を10とした[pow{10,−(SNR_all×A−(B−k/N×C))/20}/D]の対数なので、小さくなる。すなわち、高域ほど雑音抑圧量の上限G_MAX(k)を下げる効果があり、高域での音のかすれを軽減することができる。
また、式(1)において、SNR_allが大きいほど雑音抑圧量の上限を下げる効果があり、音声区間でのかすれを軽減することができる。このように、帯域全体のSNRが大きいときは雑音抑圧量の上限を下げることで、一部の帯域(特に高域)のSNR(k)が小さくてもその帯域が過剰に抑圧されないようにすることができる。雑音抑圧量上限計算部32の目的は、このような効果を得ることであるので、その実現方法は(式1)に限るものではない。このようにして求められた雑音抑圧量の上限G_MAX(k)は、雑音抑圧量上限制限部33に出力される。
雑音抑圧量上限制限部33は、雑音抑圧量G(k)と雑音抑圧量の上限G_MAX(k)を用いて、ゲインG_new(k)を次の(式2)として計算する。
G_new(k)=
pow[10,MAX{−G(k),−G_MAX(k)}] ・・・(式2)
MAX{−G(k),−G_MAX(k)}は、−G(k)と−G_MAX(k)の大きい方の値である。すなわち、−G(k)>−G_MAX(k)ならば−G(k)を返し、−G(k)≦−G_MAX(k)ならば−G_MAX(k)を返す。
pow[10,MAX{−G(k),−G_MAX(k)}]は、10の「MAX{−G(k),−G_MAX(k)}」乗を示す。
このように、雑音抑圧量G(k)を上限G_MAX(k)によって制限することで、過剰な抑圧による音のかすれを軽減する効果が得られる。さらに、同様の効果を得る目的として、G_new(k)を所定の下限値G_th(例えば、0.2)で制限してもよい。このようにして求められたゲインG_new(k)は、ゲイン加重部26に出力される。
ゲイン加重部26は、周波数変換部21によって算出された振幅スペクトルX(n)に、ゲインG_new(k)を帯域ごとに乗算して重み付けをして、雑音の抑圧された振幅スペクトルY(n)を算出する。このようにして得られた振幅スペクトルY(n)は、周波数逆変換部27に出力される。
周波数逆変換部27は、上記雑音抑圧された振幅スペクトルY(n)及び位相スペクトルP(n)を時間領域の音声信号y(t)に変換する。ここで、フレーム長とシフト幅が同じ値でない場合には、例えばフレーム長を128、シフト幅を80とした場合には、1フレーム前に処理した128サンプルの内、後部48サンプルのy(t)を今回処理した128サンプルの前部48サンプルに加算することで、フレーム境界の不連続性を排除してもよい。また、周波数変換部21の前処理でプレエンファシスを行った場合には、ディエンファシスという元に戻す処理を行ってもよい。より具体的な手法は、米国TIAで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC、1997-01に詳述されている。この変換されたディジタル音声信号y(t)は、ノイズサプレス部16の最終的な出力として音声符号部17に出力される。
以上の説明では、ノイズサプレス部16を移動通信端末装置100の送話音声のノイズを抑圧するために適用されるとしたが、これに限るものではない。受話音声のノイズが抑圧されていない場合、音声復号部11の出力の受話音声信号に含まれるノイズを抑圧し、ノイズが抑圧された音声信号をDA変換器12に出力することによって、受話音声に含まれるノイズを抑圧するために適用されてもよい。また、通話相手の装置がノイズを抑圧する機能を有していない場合、送話音声のノイズを抑圧するため及び受話音声のノイズを抑圧するために適用されてもよい。
本発明の実施例1によれば、高域ほど雑音抑圧量の上限を下げる効果があり、高域での音のかすれを軽減することができる。
実施例1では、帯域全体のSNRに応じて、高域ほど雑音抑圧量の上限を下げることで高域のかすれを軽減させた。しかしながら、雑音抑圧量G(k)が上限G_MAX(k)には達しないが、SNR(k)の値が小さい場合には、G(k)が制限されず、当該帯域における音のかすれが発生することがある。そこで、実施例2では、このような場合でも、音のかすれを防ぐための手段について説明する。以下では、実施例1と異なる部分を主に説明する。
図5は、本発明の実施例2に係るノイズサプレス部の構成を示すブロック図である。これは、実施例1である図3を変形したものであり、図2のノイズサプレス部16へ置き換えて使用することができる。実施例1と異なる部分は、SNR計算部241とゲイン算出部251である。SNR計算部241では、実施例1と同様に帯域毎の信号対雑音比SNR(k)を計算し、SNR(k)のみをゲイン算出部251に出力する。ゲイン算出部251は、更に次の構成を備える。
図6は、本発明の実施例2に係るゲイン算出部の詳細な構成を示すブロック図である。ゲイン算出部251は、雑音抑圧量計算部31、雑音抑圧量補正量計算部34、雑音抑圧量補正部35などから構成される。
図6により、ゲイン算出部251の各部の動作を説明する。まず、雑音抑圧量計算部31では、信号対雑音比SNR(k)を用いて、雑音抑圧量G(k)を計算する。具体的な計算方法は、実施例1と同様である。このようにして求められた雑音抑圧量G(k)は、雑音抑圧量補正部35に出力される。
雑音抑圧量補正量計算部34は、信号対雑音比SNR(k)を用いて、雑音抑圧量の補正量d(k)を計算する。補正量の計算方法としては、時間方向(j−1)または周波数方向(k−1,k,k+1)に、信号対雑音比SNR(k,j)またはゲインG(k,j)を見渡し、大きな値がある場合には、抑圧量の補正量も大きくすれば、かすれを軽減できると考えられる。具体的な計算方法としては、次の(式3)として計算する。
d(k)=E(k)+F(k)×{G(k,j−1)−H(k)} ・・・(式3)
ここで、G(k,j−1)は1フレーム前のゲインである。また、例えば、E(k)=1,F(k)=0.05,H(k)=0.2である。これらの値は,高域ほど大きな値にして補正量d(k)へあたえる影響を大きくしてもよい。
あるいは、帯域毎の信号対雑音比SNR(k)の最大値に応じて、補正量d(k)を次の(式4)として計算してもよい。
d(k)=E(k)+F(k)×max(i=0〜K−1){SNR(i)}
・・・(式4)
ここでは、時間方向としては1フレーム前まで見る例を示したが、任意の数のフレーム前まで見てもよい。また、周波数方向としては、全帯域を見る例を示したが、任意の数の隣接帯域までに限定してもよい。このように計算されたd(k)は、雑音抑圧量補正部35に出力される。
雑音抑圧量補正部35は、補正量d(k)と雑音抑圧量G(k)を用いて、ゲインG_new(k)を次の(式5)として計算する。
G_new(k)=G(k)×max{1,d(k)}・・・(式5)
ここで、max{1,d(k)}は1とd(k)の大きい方の値である。すなわち、1<d(k)ならばd(k)を返し、1≧d(k)ならば1を返す。あるいは、1<d(k)のときのみG_new(k)=G(k)×d(k)として計算し、1≧d(k)ならばG_new(k)=G(k)として代入のみとしてもよい。
本発明の実施例2によれば、以上のように、ゲインG_new(k)を計算すれば、雑音抑圧量G(k)が上限G_MAX(k)には達しないが、SNR(k)の値が小さい場合であっても、周波数方向または時間方向に大きな信号対雑音比SNR(k,j)またはゲインG(k,j)があれば、G_new(k)が大きくなるように補正されるので、音のかすれを軽減することができる。
なお、実施例1、実施例2では、ノイズサプレス部を移動通信端末装置に適用した形態を例にとって行ったが、本発明のノイズサプレス部は、固定電話装置、会議システム、音声認識装置等、あらゆる音声信号を扱う装置に適用することが当然に可能である。本発明は以上の構成に限定されるものではなく、種々の変形が可能である。
本発明の各実施例に係るノイズサプレス装置が適用された移動通信端末装置の構成を示すブロック図。 本発明の各実施例に係る通話部の詳細な構成を示すブロック図。 本発明の実施例1に係るノイズサプレス部の詳細な構成を示すブロック図。 本発明の実施例1に係るゲイン算出部の詳細な構成を示すブロック図。 本発明の実施例2に係るノイズサプレス部の詳細な構成を示すブロック図。 本発明の実施例2に係るゲイン算出部の詳細な構成を示すブロック図。
符号の説明
1 制御部
2 アンテナ
3 通信部
4 送受信部
5 スピーカ
6 マイクロホン
7 通話部
8 表示部
9 入力部
11 音声復号部
12 DA変換器
13 増幅器
14 増幅器
15 AD変換器
16 ノイズサプレス部
17 音声符号部
21 周波数変換部
22 帯域パワー計算部
23 雑音推定部
24、241 SNR計算部
25、251 ゲイン算出部
26 ゲイン加重部
27 周波数逆変換部
31 雑音抑圧量計算部
32 雑音抑圧量上限計算部
33 雑音抑圧量上限制限部
34 雑音抑圧量補正量計算部
35 雑音抑圧量補正部
100 移動通信端末装置

Claims (4)

  1. 所定の時間幅の時間波形を振幅成分と位相成分との周波数成分に変換する周波数変換手段と、
    前記振幅成分を用いて帯域毎の帯域パワーを計算する帯域パワー計算手段と、
    前記帯域パワーを用いて帯域毎の雑音パワーを推定する雑音推定手段と、
    前記雑音推定手段で推定された帯域毎の雑音パワーと前記帯域パワーとを用いて帯域毎の信号対雑音比と帯域全体の信号対雑音比とを計算するSNR計算手段と、
    前記SNR計算手段で計算された帯域毎の信号対雑音比と帯域全体の信号対雑音比とを用いて雑音を抑圧するためのゲインを算出するゲイン算出手段と、
    前記周波数変換手段で変換された振幅成分を前記ゲインで重み付けるゲイン加重手段と、
    前記周波数変換手段で変換された位相成分と前記ゲイン加重手段で重み付けされた振幅成分とから時間波形を生成する周波数逆変換手段とを有するノイズサプレス装置であって、
    前記ゲイン算出手段は、
    前記SNR計算手段で計算された帯域全体の信号対雑音比を用いて雑音抑圧量の上限を帯域毎に計算する雑音抑圧量上限計算手段と、
    前記SNR計算手段で計算された帯域毎の信号対雑音比を用いて帯域毎の雑音抑圧量を求める雑音抑圧量計算手段と、
    前記雑音抑圧量上限計算手段で計算された上限で当該雑音抑圧量を制限してゲインを算出する雑音抑圧量上限制限手段とを具備することを特徴とするノイズサプレス装置。
  2. 前記雑音抑圧量上限計算手段は、前記SNR計算手段で計算された帯域全体の信号対雑音比を用いて高い周波数帯域ほど雑音抑圧量の上限を下げることを特徴とする請求項1記載のノイズサプレス装置。
  3. 所定の時間幅の時間波形を振幅成分と位相成分との周波数成分に変換する周波数変換手段と、
    前記振幅成分を用いて帯域毎の帯域パワーを計算する帯域パワー計算手段と、
    前記帯域パワーを用いて帯域毎の雑音パワーを推定する雑音推定手段と、
    前記雑音推定手段で推定された帯域毎の雑音パワーと前記帯域パワーとを用いて帯域毎の信号対雑音比を計算するSNR計算手段と、
    前記SNR計算手段で計算された帯域毎の信号対雑音比を用いて雑音を抑圧するためのゲインを算出するゲイン算出手段と、
    前記周波数変換手段で変換された振幅成分を前記ゲインで重み付けるゲイン加重手段と、
    前記周波数変換手段で変換された位相成分と前記ゲイン加重手段で重み付けされた振幅成分とから時間波形を生成する周波数逆変換手段とを有するノイズサプレス装置であって、
    前記ゲイン算出手段は、
    前記SNR計算手段で計算された帯域毎の信号対雑音比を用いて帯域毎の雑音抑圧量を求める雑音抑圧量計算手段と、
    前記SNR計算手段で計算された帯域毎の信号対雑音比,過去に雑音を抑圧するために算出されたゲインの少なくとも一つを用いて雑音抑圧量の補正量を帯域毎に計算する雑音抑圧量補正量計算手段と、
    前記雑音抑圧量補正量計算手段で計算された補正量で当該雑音抑圧量を補正してゲインを算出する雑音抑圧量補正手段とを具備することを特徴とするノイズサプレス装置。
  4. 前記雑音抑圧量補正量計算手段は、前記SNR計算手段で計算された帯域毎の信号対雑音比、過去に雑音を抑圧するために算出されたゲインの少なくとも一つを用いて高い周波数帯域ほど雑音抑圧量の補正量を大きくすることを特徴とする請求項3記載のノイズサプレス装置。
JP2006243407A 2006-09-07 2006-09-07 ノイズサプレス装置 Active JP4836720B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006243407A JP4836720B2 (ja) 2006-09-07 2006-09-07 ノイズサプレス装置
US11/605,570 US8270633B2 (en) 2006-09-07 2006-11-29 Noise suppressing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006243407A JP4836720B2 (ja) 2006-09-07 2006-09-07 ノイズサプレス装置

Publications (2)

Publication Number Publication Date
JP2008065090A true JP2008065090A (ja) 2008-03-21
JP4836720B2 JP4836720B2 (ja) 2011-12-14

Family

ID=39224988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006243407A Active JP4836720B2 (ja) 2006-09-07 2006-09-07 ノイズサプレス装置

Country Status (2)

Country Link
US (1) US8270633B2 (ja)
JP (1) JP4836720B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010539538A (ja) * 2007-09-12 2010-12-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 雑音レベル推定値の調節を備えたスピーチ強調
JP2013525843A (ja) * 2010-04-19 2013-06-20 オーディエンス,インコーポレイテッド 単一又は複数のマイクを備えるシステムにおける雑音低減と音声品質を共に最適化する方法
US9343056B1 (en) 2010-04-27 2016-05-17 Knowles Electronics, Llc Wind noise detection and suppression
US9431023B2 (en) 2010-07-12 2016-08-30 Knowles Electronics, Llc Monaural noise suppression based on computational auditory scene analysis
US9437180B2 (en) 2010-01-26 2016-09-06 Knowles Electronics, Llc Adaptive noise reduction using level cues
US9438992B2 (en) 2010-04-29 2016-09-06 Knowles Electronics, Llc Multi-microphone robust noise suppression
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
JP2008216720A (ja) * 2007-03-06 2008-09-18 Nec Corp 信号処理の方法、装置、及びプログラム
CN101911183A (zh) * 2008-01-11 2010-12-08 日本电气株式会社 信号分析控制、信号分析、信号控制系统、装置以及程序
JP5272920B2 (ja) * 2009-06-23 2013-08-28 富士通株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP5678445B2 (ja) * 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
JP2012032648A (ja) * 2010-07-30 2012-02-16 Sony Corp 機械音抑圧装置、機械音抑圧方法、プログラムおよび撮像装置
EP2629294B1 (en) * 2012-02-16 2015-04-29 2236008 Ontario Inc. System and method for dynamic residual noise shaping
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JP6162254B2 (ja) * 2013-01-08 2017-07-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221093A (ja) * 1995-02-17 1996-08-30 Sony Corp 音声信号の雑音低減方法
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JP2000330597A (ja) * 1999-05-20 2000-11-30 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002073066A (ja) * 2000-08-31 2002-03-12 Matsushita Electric Ind Co Ltd 雑音抑圧装置及び雑音抑圧方法
JP2002508891A (ja) * 1997-04-16 2002-03-19 ディーエスピーファクトリー リミテッド 特に補聴器における雑音を低減する装置および方法
JP2002140100A (ja) * 2000-11-02 2002-05-17 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP2002204175A (ja) * 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置
JP2002536707A (ja) * 1999-02-09 2002-10-29 エイ・ティ・アンド・ティ・コーポレーション 音声活動に基づくゲイン制限による音声強化
JP2004234023A (ja) * 2004-04-02 2004-08-19 Mitsubishi Electric Corp 雑音抑圧装置
WO2006046293A1 (ja) * 2004-10-28 2006-05-04 Fujitsu Limited 雑音抑圧装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
JP3454206B2 (ja) 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6529868B1 (en) * 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
JP3457293B2 (ja) * 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221093A (ja) * 1995-02-17 1996-08-30 Sony Corp 音声信号の雑音低減方法
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JP2002508891A (ja) * 1997-04-16 2002-03-19 ディーエスピーファクトリー リミテッド 特に補聴器における雑音を低減する装置および方法
JP2002536707A (ja) * 1999-02-09 2002-10-29 エイ・ティ・アンド・ティ・コーポレーション 音声活動に基づくゲイン制限による音声強化
JP2000330597A (ja) * 1999-05-20 2000-11-30 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002073066A (ja) * 2000-08-31 2002-03-12 Matsushita Electric Ind Co Ltd 雑音抑圧装置及び雑音抑圧方法
JP2002140100A (ja) * 2000-11-02 2002-05-17 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP2002204175A (ja) * 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置
JP2004234023A (ja) * 2004-04-02 2004-08-19 Mitsubishi Electric Corp 雑音抑圧装置
WO2006046293A1 (ja) * 2004-10-28 2006-05-04 Fujitsu Limited 雑音抑圧装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
JP2010539538A (ja) * 2007-09-12 2010-12-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 雑音レベル推定値の調節を備えたスピーチ強調
US9437180B2 (en) 2010-01-26 2016-09-06 Knowles Electronics, Llc Adaptive noise reduction using level cues
JP2013525843A (ja) * 2010-04-19 2013-06-20 オーディエンス,インコーポレイテッド 単一又は複数のマイクを備えるシステムにおける雑音低減と音声品質を共に最適化する方法
US9502048B2 (en) 2010-04-19 2016-11-22 Knowles Electronics, Llc Adaptively reducing noise to limit speech distortion
US9343056B1 (en) 2010-04-27 2016-05-17 Knowles Electronics, Llc Wind noise detection and suppression
US9438992B2 (en) 2010-04-29 2016-09-06 Knowles Electronics, Llc Multi-microphone robust noise suppression
US9431023B2 (en) 2010-07-12 2016-08-30 Knowles Electronics, Llc Monaural noise suppression based on computational auditory scene analysis

Also Published As

Publication number Publication date
US20080075300A1 (en) 2008-03-27
US8270633B2 (en) 2012-09-18
JP4836720B2 (ja) 2011-12-14

Similar Documents

Publication Publication Date Title
JP4836720B2 (ja) ノイズサプレス装置
US7555075B2 (en) Adjustable noise suppression system
JP3963850B2 (ja) 音声区間検出装置
US8571231B2 (en) Suppressing noise in an audio signal
JP5293817B2 (ja) 音声信号処理装置及び音声信号処理方法
US8521530B1 (en) System and method for enhancing a monaural audio signal
CN104520925B (zh) 噪声降低增益的百分位滤波
JP4520732B2 (ja) 雑音低減装置、および低減方法
US20070232257A1 (en) Noise suppressor
JP4018571B2 (ja) 音声強調装置
EP2346032B1 (en) Noise suppressor and voice decoder
JP2003514473A (ja) ノイズ抑制
JP2014232331A (ja) アダプティブ・インテリジェント・ノイズ抑制システム及び方法
US8019603B2 (en) Apparatus and method for enhancing speech intelligibility in a mobile terminal
WO1997022116A2 (en) A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
JP2008216720A (ja) 信号処理の方法、装置、及びプログラム
JP6073456B2 (ja) 音声強調装置
JP2008309955A (ja) ノイズサプレス装置
JP2004341339A (ja) 雑音抑圧装置
RU2662693C2 (ru) Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP2006113515A (ja) ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
JP6098038B2 (ja) 音声補正装置、音声補正方法及び音声補正用コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090630

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110927

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4836720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3