JP2005202222A - ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 - Google Patents

ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 Download PDF

Info

Publication number
JP2005202222A
JP2005202222A JP2004009332A JP2004009332A JP2005202222A JP 2005202222 A JP2005202222 A JP 2005202222A JP 2004009332 A JP2004009332 A JP 2004009332A JP 2004009332 A JP2004009332 A JP 2004009332A JP 2005202222 A JP2005202222 A JP 2005202222A
Authority
JP
Japan
Prior art keywords
noise
spectrum
noise suppression
suppression coefficient
frequency spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004009332A
Other languages
English (en)
Other versions
JP4542790B2 (ja
Inventor
Takehiko Isaka
岳彦 井阪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004009332A priority Critical patent/JP4542790B2/ja
Publication of JP2005202222A publication Critical patent/JP2005202222A/ja
Application granted granted Critical
Publication of JP4542790B2 publication Critical patent/JP4542790B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

【課題】少ない演算量で雑音抑圧係数の推定を高精度に行えるようにし、これにより高速かつ高精度の雑音抑圧処理を可能にする。
【解決手段】雑音抑圧係数計算部30に、音声スペクトルの実部及び虚部ごとの出現確率をラプラス分布により近似するとともに雑音スペクトルの実部及び虚部ごとの出現確率をガウス分布により近似し、かつMAP推定及びBayesの定理を使用して導出される音声スペクトルの推定式を用意し、この推定式に従い雑音抑圧係数を算出するようにした。
【選択図】 図2

Description

この発明は、入力音声信号に含まれる雑音成分を抑圧するために設けられるノイズサプレッサと、このノイズサプレッサを備える固定電話機や携帯電話機、IP電話機、テレビ会議装置等の音声通信装置に関する。
携帯電話等の音声通信装置では、CELP(Code Excited Linear Prediction)方式などの音声符号化方式が用いられている。この種の装置を背景雑音の大きい環境下で使用すると、この背景雑音が取り込まれて音声とともに符号化され、その結果音声の明瞭感が低下してしまう。このため、背景雑音を除去もしくは抑制して音声のみの信号に近づけて音声符号化を行う技術(ノイズサプレッサ)が種々研究されている。
例えば、第1の先行技術として、入力信号の信号対雑音比を周波数帯域ごとに求め、この信号対雑音比に基づいて雑音抑圧係数を決定し、この係数を周波数帯域ごとに上記入力信号にかけることにより雑音を抑圧する方式が知られている(例えば、非特許文献1を参照)。この方式によれば、雑音が抑圧された音声信号を得ることができるる。しかし、修正ベッセル関数を用いて雑音抑圧係数を計算するため、演算量がきわめて多くなるという問題がある。
また、第2の先行技術として、音声の周波数スペクトルの振幅をガンマ分布で近似するとともにMAP推定とBayesの定理を利用して雑音抑圧係数の推定式を導出し、この推定式を用いて雑音抑圧係数を算出する方式がある(例えば、非特許文献2を参照)。この方式では、雑音抑圧係数の推定式が簡単な式になるので、第1の先行技術に比べ演算量を削減することができる。しかしながら、数学的に完全な導出を行っていない。このため、パラメータを試行錯誤しながら決めなければならないという問題がある。
さらに第3の先行技術として、第2の先行技術と同様の式変形を行うことにより、雑音抑圧係数の計算量を削減した方式がある(例えば、非特許文献3を参照)。この方式では、第2の先行技術に述べた技術と同様、雑音抑圧係数の推定式が簡単な式になるため演算量の削減効果が得られる。しかし、音声の周波数スペクトルをガウス分布で近似しているので、雑音抑圧係数の推定精度が低いという問題がある。
さらに第4の先行技術として、上記第1の先行技術における信号対雑音比の推定方法を改良した方式がある(例えば、特許文献1を参照)。この方式では、信号対雑音比の推定精度が上がることで雑音抑圧係数の推定精度も高めることが可能である。しかし、雑音抑圧係数の計算に修正ベッセル関数を用いているため、依然として演算量が多いという問題を有している。
特開2003−140700公報 Y.Ephraim et al.,"Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator", ASSP-32 (6), pp.1109-1121, 1984 T.Lotter et al.,"Noise reduction by maximum a posteriori spectral amplitude estimation with supergaussian speech modeling", IWAENC 2003,pp.83-86 P.Wolfe et al.,"Simple alternatives to the Ephraim and Malah suppression rule for speech enhancement", Proc. IEEE Workshop on SSP, pp.496-499, Aug, 2001
以上述べたように各先行技術文献に記載された技術は、雑音抑圧係数を算出するための演算量が多いか、或いは雑音抑圧係数の推定精度が低いという問題点を有する。
この発明は上記事情に着目してなされたもので、その目的とするところは、少ない演算量で雑音抑圧係数の推定を高精度に行えるようにし、これにより高速かつ高精度の雑音抑圧処理を可能にしたノイズサプレッサ及びノイズサプレッサを備えた音声通信装置を提供することにある。
上記目的を達成するためにこの発明は、入力信号から求めた周波数スペクトルを複数の帯域に分割し、この分割された帯域ごとに雑音スペクトルを推定してこの雑音スペクトルと上記周波数スペクトルとから信号対雑音比を算出し、算出された信号対雑音比に基づいて雑音抑圧係数を設定して、この設定された雑音抑圧係数に従い上記周波数スペクトルを重み付けしたのち時間領域の信号に変換するようにしたノイズサプレッサにあって、上記周波数スペクトルに含まれる音声スペクトルの実部及び虚部ごとの出現確率を統計分布モデルにより近似することにより導出される音声スペクトルの推定式を偏微分して零とおいた演算式を用意し、この演算式に従い上記雑音抑圧係数を算出して設定するようにしたものである。
したがってこの発明によれば、音声の周波数スペクトルを統計分布モデルで近似するとともにMAP推定とBayesの定理を利用して雑音抑圧係数の推定式を導出し、この推定式を用いて雑音抑圧係数が算出されるため、雑音抑圧係数の推定式が比較的簡単となってこれにより演算量を削減することが可能となる。また、音声スペクトルの実部及び虚部ごとの出現確率を統計分布モデルにより近似するようにしているので近似精度を高めることができ、さらに数学的に完全な導出を行っているので調整するパラメータが少なくなり、これにより雑音抑圧係数の推定精度を高めることが可能となる。
上記音声スペクトルの推定式を導出する際には、上記音声スペクトルの実部及び虚部ごとの出現確率を第1の統計分布モデルにより近似するとともに、雑音スペクトルの実部及び虚部ごとの出現確率を統計分布モデルにより近似するとよい。このようにすると、音声スペクトルに加え雑音スペクトルを考慮して音声スペクトルの推定式を導出することができ、これにより音声スペクトルの推定式の精度をさらに高めることができる。
具体的には、音声スペクトルを近似するための第1の統計分布モデルとしてラプラス分布又はガンマ分布を使用し、一方雑音スペクトルを近似するための第2の統計分布モデルとしてガウス分布を使用するとよい。
さらに、上記雑音抑圧係数の演算式を上記分割された帯域ごとに導出して設定し、これらの演算式を用いて上記分割された帯域ごとに雑音抑圧係数を算出するとよい。このようにすると、周波数帯域ごとに独立して設定された演算式により雑音抑圧係数が算出される。このため、全周波数帯域に対し共通に設定された演算式を用いて雑音抑圧係数を算出する場合に比べ、音声のスペクトル確率密度関数(SPDF:Spectral Probability Density Function)の分布が周波数帯域ごとに異なる点を考慮して、さらに高精度の近似を行うことが可能となる。
要するにこの発明では、雑音抑圧係数を設定する手段において、上記周波数スペクトルに含まれる音声スペクトルの実部及び虚部ごとの出現確率を統計分布モデルにより近似することにより導出される音声スペクトルの推定式を偏微分して零とおいた演算式に従い、上記雑音抑圧係数を算出するようにしている。
したがってこの発明によれば、少ない演算量で雑音抑圧係数の推定を高精度に行うことができ、これにより高速かつ高精度の雑音抑圧処理を可能にしたノイズサプレッサ及びノイズサプレッサを備えた音声通信装置を提供することができる。
図1は、この発明に係わるノイズサプレッサを備えた音声通信装置の第1の実施形態である携帯電話機の構成を示すブロック図である。
図示しない基地局から送信された無線信号は、アンテナ1で受信されたのちアンテナ共用器(DUP)2を介して受信回路(RX)3に入力される。受信回路3は、上記受信された無線信号を周波数シンセサイザ(SYN)4から出力された局部発振信号とミキシングして中間周波信号に周波数変換(ダウンコンバート)する。そして、このダウンコンバートされた受信中間周波信号を直交復調し、これにより生成される受信ベースバンド信号をCDMA(Code Division Multiple Access)信号処理部6に供給する。なお、上記周波数シンセサイザ4から発生される局部発振信号の周波数は、制御部18からの制御信号SYCにより指定される。
CDMA信号処理部6はRAKE受信機を備える。RAKE受信機では、上記受信ベースバンド信号に含まれる複数のパスがそれぞれ拡散符号により逆拡散処理される。そして、この逆拡散処理された各パスの信号が位相を合わされたのち合成される。この結果、受信符号化データが再生され、この受信符号化データは音声符号復号処理部(以後スピーチコーデック(SP−COD)と称する)7に入力される。
スピーチコーデック7は、上記CDMA信号処理部6から出力された受信符号化データを音声復号する。PCMコーデック8は、上記スピーチコーデック7から出力されたディジタル受話信号をPCM復号してアナログ受話信号を出力する。このアナログ受話信号は、受話増幅器9にて増幅されたのちスピーカ10から音声となって出力される。
一方、マイクロホン11に入力された話者の送話音声信号は、送話増幅器12により適正レベルまで増幅されたのち、PCMコーデック8にてPCM符号化処理が施され、これによりディジタル送話信号となる。このディジタル送話信号は、後述するノイズサプレッサ(NS)20を介してスピーチコーデック7に入力される。スピーチコーデック7は、PCMコーデック8から出力されたディジタル送話信号を所定の音声符号化方式に従い符号化する。そして、これにより生成された送信符号化データをCDMA信号処理部6に供給する。
CDMA信号処理部6は、上記スピーチコーデック7から出力された送信符号化データに対し、送信チャネルに割り当てられた拡散符号を用いてスペクトル拡散処理を施す。そして、上記スペクトル拡散処理された信号を送信回路(TX)5に供給する。送信回路5は、上記スペクトル拡散された信号を例えばQPSK(Quadrature Phase Shift Keying)方式等のディジタル変調方式を使用して変調する。そして、この変調により生成された送信信号を、周波数シンセサイザ4から発生される局部発振信号と合成して無線信号に周波数変換する。またそれと共に送信回路5は、制御部12により指示される送信電力レベルとなるように、上記無線信号を電力増幅器により高周波増幅する。この増幅された無線信号は、アンテナ共用器2を介してアンテナ1に供給され、このアンテナ1から図示しない基地局へ向け送信される。
制御部18は、例えばマイクロコンピュータを使用したもので、携帯電話機の通信動作に係わる一切の制御を司る。記憶部13は、RAM及びフラッシュメモリを使用したもので、フラッシュメモリには電話帳や送受信された電子メール、各種制御情報等が記憶される。入力部14には、ダイヤルキーに加え、送信キー、終了キー、電源キー、音量調節キー及びモード指定キー等の機能キーが設けられている。表示部15には、LCD及びLEDが設けられている。このうちLCDは、バッテリ残量や受信電界強度等の自装置の動作状態を示す情報、送受信される電子メール、電話帳や通信相手ユーザが使用する端末の電話番号、送受信履歴等を表示するために使用される。またLEDは、着信の報知やバッテリ16の充電状態を表示するために使用される。電源回路(POW)は、バッテリ17の出力をもとに所定の動作電源電圧Vccを生成して各回路部に供給する。
ところで、ノイズサプレッサ20は例えばDSP(Digital Signal Processor)により構成されるもので、次のような機能を備えている。図2はその構成を示す機能ブロック図である。
ノイズサプレッサ20は、高速フーリエ変換部(FFT)21と、スペクトル振幅抑圧部22と、逆高速フーリエ変換部(IFFT)23と、第1の帯域分割部24と、音声検出部25と、雑音レベル推定部26と、事後SNR推定部27と、第2の帯域分割部28と、事前SNR推定部29と、雑音抑圧係数計算部30とを備える。
高速フーリエ変換部(FFT)21は、入力信号を時間領域の信号から周波数領域の信号に変換する。所定時間長ずつ、例えば128個の入力されたディジタル送話信号x(t) をフレームに分割し、これらのフレームごとに高速フーリエ変換処理を行い、これにより振幅スペクトルX(k) (k=0〜N−1, Nはフレーム長)を得る。
なお、高速フーリエ変換処理に先立って、スペクトル包絡を平坦化することを目的として、入力されたディジタル送話信号x(t) に対しプレエンファシス処理を施すようにしてもよい。また、高速フーリエ変換処理のフレーム長とシフト幅は同じでなくてもよく、例えばフレーム長を128、シフト幅を80とした場合には、80サンプル分の入力ディジタル送話信号x(t) をフレーム前半部に格納し、残りの48サンプルについては0(零)とした後に境界の不連続性を排除するために正弦波特性の窓掛けを行ってもよい。プレエンファシスおよび窓掛けのより具体的な手法は、米国TIAで標準化された符号化方式の規格である、TIA/EIA IS-127 EVRC, 1997-01に詳述されている。
第1の帯域分割部24は、振幅スペクトルX(k) を低域から高域まで例えば8個の周波数帯域に分割し、これらの周波数帯域ごとに平均をとって各周波数帯域を代表する帯域パワーXd(i) (i=0〜Ni, Niは周波数帯域数で例えば16個)を求める。
音声検出部25は、上記第1の帯域分割部24により求められた帯域パワーXd(i) をしきい値q (i) と比較し、帯域パワーXd(i) がしきい値θ(i) より大きければ、音声として検出する。ここで、しきい値θ(i) は固定値としてもよいし、過去のしきい値θ(i) または帯域パワーXd(i) との重み付き平均をとって適応的に更新してもよい。
雑音レベル推定部26は、上記音声検出部24により音声と検出されなかったフレームの帯域パワーXd(i) から帯域ごとの雑音レベルN(i) を推定する。ここで、現在の帯域パワーXd(i) をそのまま雑音レベルN(i) としてもよいし、過去の雑音レベルと帯域パワーXd(i) との重み付き平均をとって適応的に雑音レベルN(i) を求めてもよい。
事後SNR推定部27は、上記帯域分割部24により求められた帯域パワーXd(i) と、上記雑音レベル推定部26により求められた雑音レベルN(i) との比、つまりSNR(i) を求める。
第2の帯域分割部28は、後述するスペクトル振幅抑圧部22において雑音が抑圧された後の振幅スペクトルY(k) を低域から高域まで例えば16個の帯域に分割し、これらの帯域ごとに平均をとって各帯域を代表する帯域パワーYd(i) (i=0〜Ni, Niは帯域数で例えば16)を求める。
事前SNR推定部29は、第2の帯域分割部28により求められた帯域パワーYd(i) と今回の雑音レベルN(k) との比、SNR’(i) を求める。
振幅抑圧係数計算部30は、予め用意された演算式に従い、上記事後SNR推定部27により求められたSNR(i) および上記事前SNR推定部29により求められたSNR’(i) をもとに雑音抑圧係数W(i) を求める。この雑音抑圧係数W(i) の演算式の導出方法については後で詳述する。
スペクトル振幅抑圧部22は、高速フーリエ変換部(FFT)21により求められた振幅スペクトルX(k) に、上記振幅抑圧係数計算部30により求められた雑音抑圧係数W(i)を掛け合わせ、これにより雑音抑圧された振幅スペクトルY(k) を得る。ここで、同一帯域内の振幅スペクトルX(k) には、同一の雑音抑圧係数W(i) を掛け合わせる。
逆高速フーリエ変換部(IFFT)部23は、上記スペクトル振幅抑圧部22により雑音抑圧された振幅スペクトルY(k) および前記高速フーリエ変換部(FFT)21により求められた位相スペクトルP(k) を時間領域の信号y(t) に変換する。この変換された時間領域のディジタル送話信号y(t) は、音声符号復号処理部(SP−COD)7に供給される。
なお、高速フーリエ変換(FFT)処理に先立って、入力ディジタル送話信号x(t) をプレエンファシスした場合には、ディエンファシスして元に戻す。また、高速フーリエ変換(FFT)処理のフレーム長とシフト幅が同じでない場合には、フレーム境界をオーバーラップさせて不連続性をなくす。ディエンファシスおよびオーバーラップのより具体的な方法は、先に述べたTIA/EIA 127 EVRC, 1997-01に詳述されている。
ところで、上記振幅抑圧係数計算部30において使用される雑音抑圧係数W(i) の演算式は以下のように導出される。
先ず、雑音抑圧係数W(i) の演算式を以下に示す。
Figure 2005202222
次に、上記雑音抑圧係数W(i) の演算式の導出過程を説明する。この発明の第1の実施形態では、音声のスペクトル確率密度関数(SPDF:Spectral Probability Density Function)の実部および虚部を統計分布モデルで近似できるものと仮定する。ここで、統計分布モデルとしてラプラス分布を用いれば、音声のスペクトル確率密度関数(SPDF)は次のように表される。
Figure 2005202222
ただし、φは位相スペクトル、σXはXの分散を表す。なお、ここでは記述を簡単にするため、周波数帯域番号iの記載は省略した(以降も省略する)。音声の振幅スペクトルXの推定値X^(エックスハットと読む)は、MAP推定とBayesの定理から次のように表される。
Figure 2005202222
ただし、p(X) はXの出力確率、Rは雑音の振幅スペクトルを表す。p(R) はXに無関係なので、p(R|X)p(X)を最大にするXを求めればよい。条件付き確率p(R|X)、及び事前確率p(X)は、前述の非特許文献2によれば次のように表される。
Figure 2005202222
ただし、σNは雑音の振幅スペクトルの分散を表す。式(2)及び(3)を式(6)に代入し、cosφ+sinφ=a (aは定数)と近似すると、
Figure 2005202222
を得る。式(5)と式(7)との積をとり、その対数をXで微分して0とおけば、X^の最適解を導出できる。そして、最終的に雑音抑圧係数W(i) の計算式として、式(1)が導出される。
以上のような構成であるから、PCM符号復号処理部8から出力されたディジタル送話信号x(t) がノイズサプレッサ20に入力されると、ディジタル送話信号x(t) は先ず高速フーリエ変換部(FFT)21でフレームごとに周波数領域の信号に変換され、これにより振幅スペクトルX(k) が得られる。この振幅スペクトルX(k) は、第1の帯域分割部24により例えば16個の周波数帯域に分割されたのち、これらの周波数帯域ごとに平均化されて帯域パワーXd(i) が得られる。そして、この帯域パワーXd(i) は音声検出部25において予め設定されたしきい値q (i) と比較され、これにより音声フレームが検出される。
雑音レベル推定部26では、上記音声検出部24により音声フレームと検出されなかったフレームの帯域パワーXd(i) をもとに帯域ごとの雑音レベルN(i) が推定され、この推定された雑音レベルN(i) と上記帯域分割部24により求められた帯域パワーXd(i) とをもとに、事後SNR推定部27でSNR(i) が算出される。
一方、スペクトル振幅抑圧部22において雑音が抑圧された後の振幅スペクトルY(k) は、先に述べた抑圧前の振幅スペクトルX(k) と同様に、16個の帯域に分割されたのちこれらの帯域ごとに平均化されて帯域パワーYd(i) となる。そして、この帯域パワーYd(i) と今回の雑音レベルN(k) とをもとに、事前SNR推定部29によりSNR’(i) が算出される。
さて、振幅抑圧係数計算部30では、先に述べたように導出された雑音抑圧係数W(i) の推定演算式に従い、上記事後SNR推定部27により求められたSNR(i) および上記事前SNR推定部29により求められたSNR’(i) をもとに雑音抑圧係数W(i) の算出が行われる。
このとき、雑音抑圧係数W(i) の推定演算式は、(1)式に示したように音声スペクトルの実部および虚部ごとの出現確率をラプラス分布により近似するとともに、雑音スペクトルの実部および虚部ごとの出現確率をガウス分布により近似し、かつMAP推定及びBayesの定理を使用して導出された比較的簡単な演算式である。このため、雑音抑圧係数W(i) は比較的少ない演算量により算出される。しかも、音声スペクトル及び雑音スペクトルの実部及び虚部ごとの出現確率をそれぞれラプラス分布及びガウス分布により近似しているので高精度の近似が可能となり、さらに数学的に完全な導出を行っているので調整するパラメータが少なく、これにより雑音抑圧係数W(i) を高精度に算出することができる。
上記振幅抑圧係数計算部30で算出された雑音抑圧係数W(i) は、スペクトル振幅抑圧部22に与えられる。スペクトル振幅抑圧部22では、高速フーリエ変換部(FFT)21により求められた振幅スペクトルX(k) に、上記振幅抑圧係数計算部30により算出された雑音抑圧係数W(i)が帯域ごとに掛け合わされ、これにより雑音抑圧された振幅スペクトルY(k) が得られる。そして、この雑音抑圧された振幅スペクトルY(k) は、高速フーリエ変換部(FFT)21により求められた位相スペクトルP(k) とともに逆高速フーリエ変換部(IFFT)部23に入力される。逆高速フーリエ変換部(IFFT)部23では、上記雑音抑圧された振幅スペクトルY(k) 及び位相スペクトルP(k) が時間領域の信号y(t) に変換され、この変換されたディジタル送話信号y(t) が音声符号復号処理部7による音声符号化処理に供される。
したがって、音声符号復号処理部7では、雑音成分が抑圧されたディジタル送話信号y(t) に対し音声符号化処理が行われ、これにより生成された送信符号化データが変調されたのち通話相手の携帯電話機へ送信される。この結果、通話相手の話者は雑音の少ない明瞭な音声を聞くことが可能となり、これにより通話品質の向上が図られる。
以上述べたように第1の実施形態では、音声スペクトルの実部および虚部ごとの出現確率をラプラス分布により近似するとともに、雑音スペクトルの実部および虚部ごとの出現確率をガウス分布により近似し、かつMAP推定及びBayesの定理を使用して導出した演算式を使用して、雑音抑圧係数W(i) を算出するようにしている。したがって、比較的少ない演算量でしかも高精度に雑音抑圧係数W(i) を算出することができ、これにより高速かつ高精度の雑音抑圧処理が可能なノイズサプレッサとこのノイズサプレッサを備えた音声通信装置を提供することができる。
図3は、雑音が重畳された音声データを、この発明の第1の実施形態に係わるノイズサプレッサ20により雑音抑圧処理したときのセグメンタルSNRの改善度と、前記した第2の先行技術文献(非特許文献2)及び第3の先行技術文献(非特許文献3)に記載された技術により雑音抑圧処理したときのセグメンタルSNRの改善度を、第1の先行技術文献(非特許文献1)に記載された技術によるセグメンタルSNRの改善度をベースラインとしてそれぞれ示したものである。
ここで、音声データは、NTT Advanced Technology, “Multi-lingual Speech database for telephonometry 1994”の日本語部分を8kHzにダウンサンプリングしたものを、男女各4名(合計8名)が4文章ずつ発声したものである。雑音データとしては、(社)日本電子工業振興協会、“電子協騒音データベース”1990に記載されたBabble(人混み)、Car (自動車内)、Street(歩道)の3種類を用い、これらを重畳後のSNRが9dB、18dBになるようにコンピュータ上で音声データに重畳した。
図3から、この発明の第1の実施形態に係わるノイズサプレッサ20によるSNRの改善度がもっとも良く、高い雑音抑圧効果が得られることがわかる。特に、SNRが小さいとき、すなわち雑音レベルが大きいときに著しい効果が奏せられる。
(第2の実施形態)
この発明の第2の実施形態は、雑音抑圧係数の演算式を分割された周波数帯域ごとに導出して設定し、これらの演算式を用いて上記分割された周波数帯域ごとに雑音抑圧係数を算出するようにしたものである。
図4は、この発明の第2の実施形態に係わるノイズサプレッサの要部である雑音抑圧係数計算部30′の構成を示す機能ブロック図である。同図に示すように、雑音抑圧係数計算部30′は、帯域分割部24において設定される分割帯域数に対応する数の雑音抑圧係数計算部31〜3n(例えば16個)を備えている。これらの雑音抑圧係数計算部31〜3nはそれぞれ、帯域別に独立して導出・設定された雑音抑圧係数W(i) の演算式を備えている。すなわち、雑音抑圧係数計算部31〜3nにはそれぞれ、(1)式の但し書きにおけるλが周波数帯域ごとに独立して設定された雑音抑圧係数W(i) の演算式が用意されている。
したがって、雑音抑圧係数計算部30′では、雑音抑圧係数計算部31〜3nにより周波数帯域別にそれぞれ独立して雑音抑圧係数W(i) (i=1〜n)の算出が行われる。そして、スペクトル振幅抑圧部22ではそれぞれ、上記帯域別に算出された雑音抑圧係数W(i) (i=1〜n)に従い、帯域別に振幅スペクトルX(k) に含まれる雑音成分の抑圧処理が行われる。
ここで、周波数帯域ごとにλを独立に設定する理由は、音声のスペクトル確率密度関数(SPDF)の分布が帯域ごとに異なるためである。図5及び図6はそれぞれ、低域および高域における音声のスペクトル確率密度関数(SPDF)の分布の一例を示した図である。ここでは、低域として0Hz〜250Hz帯および250Hz〜500Hz帯を、また高域として2000Hz〜2250Hz帯および2250Hz〜2500Hz帯を選んだ。
図5及び図6から明らかなように、低域のSPDFはまばらに分布するのに対し、高域のSPDFは小さい値に集中している。こうした分布の異なるSPDFに対して、同一のλで近似するよりは、帯域ごとに最適なλにより近似した方がより高い精度で近似することが可能である。
(その他の実施形態)
前記各実施形態では、音声スペクトルをラプラス分布を用いて近似するようにしたが、ガンマ分布を用いて近似するようにしてもよい。また、前記実施形態ではノイズサプレッサ20をDSPにより実現する場合を例にとって説明したが、雑音抑圧処理プログラムをマイクロプロセッサに実行させることで実現してもよい。その他、ノイズサプレッサの機能構成、各機能の処理手順及び処理内容、音声通信装置の種類とその構成等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
要するにこの発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
この発明に係わるノイズサプレッサを備えた音声通信装置の第1の実施形態であるCDMA携帯電話機の構成を示すブロック図。 図1に示す音声通信装置に設けられるノイズサプレッサの機能構成を示すブロック図。 この発明に係わるノイズサプレッサと先行技術文献に記載されたノイズサプレッサとの使用環境別の雑音抑圧効果を対比して示す図。 この発明の第2の実施形態に係わるノイズサプレッサの雑音抑圧計数計算部の構成を示すブロック図。 低域における音声スペクトルの確率密度関数(SPDF)の一例を示す図。 低域における音声スペクトルの確率密度関数(SPDF)の一例を示す図。
符号の説明
1…アンテナ、2…アンテナ共用器(DUP)、3…受信回路(RX)、4…周波数シンセサイザ(SYN)、5…送信回路(TX)、6…CDMA信号処理部、7…音声符号復号処理部(SP−COD)、8…PCM符号処理部(PCMコーデック)、9…受話増幅器、10…スピーカ、11…マイクロホン、12…送話増幅器、13…記憶部、14…入力部、15…表示部、16…電源回路(POW)、17…バッテリ、18…制御部、20…ノイズサプレッサ(NS)、21…高速フーリエ変換部(FFT)、22…スペクトル振幅抑圧部、23…逆高速フーリエ変換部(IFFT)、24…帯域分割部、25…音声検出部、26…雑音レベル推定部、27…事後SNR推定部、28…帯域分割部、29…事前SNR推定部、30,31〜3n…雑音抑圧係数計算部。

Claims (6)

  1. 入力信号からその周波数スペクトルを求める手段と、
    前記求められた周波数スペクトルを複数の帯域に分割する手段と、
    前記分割された帯域ごとに、その周波数スペクトルをもとに雑音スペクトルを推定する手段と、
    前記分割された帯域ごとに、その周波数スペクトルと前記推定された雑音スペクトルとから信号対雑音比を算出する手段と、
    前記算出された信号対雑音比に基づいて雑音抑圧係数を設定する手段と、
    前記設定された雑音抑圧係数に従い、前記求められた周波数スペクトルを重み付けする手段と、
    前記重み付けされた周波数スペクトルを時間領域の信号に変換する手段と
    を具備し、
    前記雑音抑圧係数を設定する手段は、
    前記周波数スペクトルに含まれる音声スペクトルの実部及び虚部ごとの出現確率を統計分布モデルにより近似することにより導出される音声スペクトルの推定式を偏微分して零とおいた演算式に従い、前記雑音抑圧係数を算出することを特徴とするノイズサプレッサ。
  2. 前記雑音抑圧係数を設定する手段は、
    前記周波数スペクトルに含まれる音声スペクトルの実部及び虚部ごとの出現確率を第1の統計分布モデルにより近似するとともに、前記推定される雑音スペクトルの実部及び虚部ごとの出現確率を第2の統計分布モデルにより近似することにより導出される音声スペクトルの推定式を偏微分して零とおいた演算式に従い、前記雑音抑圧係数を算出することを特徴とする請求項1記載のノイズサプレッサ。
  3. 前記雑音抑圧係数を設定する手段は、
    前記分割された帯域ごとに導出される前記演算式を備え、当該演算式に従い前記分割された帯域ごとに前記雑音抑圧係数を算出することを特徴とする請求項1又は2記載のノイズサプレッサ。
  4. 前記雑音抑圧係数を設定する手段は、
    前記音声スペクトルの統計分布モデルとしてラプラス分布又はガンマ分布を使用し、かつMAP推定(Maximum A posteriori Estimation)及びBayesの定理を使用して、音声スペクトルの推定式を導くことを特徴とする請求項1又は3記載のノイズサプレッサ。
  5. 前記雑音抑圧係数を設定する手段は、
    前記第1の統計分布モデルとしてラプラス分布又はガンマ分布を使用するとともに、前記第2の統計分布モデルとしてガウス分布を使用し、かつMAP推定(Maximum A posteriori Estimation)及びBayesの定理を使用して、音声スペクトルの推定式を導出することを特徴とする請求項2又は3記載のノイズサプレッサ。
  6. 音声を入力し、この入力された音声に対応するディジタル音声信号を出力する音声入力ユニットと、
    前記音声入力ユニットから出力されるディジタル音声信号に含まれる雑音成分を抑圧し、この雑音成分が抑圧されたディジタル音声信号を出力するノイズサプレッサと、
    前記ノイズサプレッサから出力されるディジタル音声信号を送信信号に変換し、この送信信号を伝送路へ送信する送信ユニットと
    を具備し、
    前記ノイズサプレッサは、
    前記音声入力ユニットから出力されるディジタル音声信号からその周波数スペクトルを求める手段と、
    前記求められた周波数スペクトルを複数の帯域に分割する手段と、
    前記分割された帯域ごとに、その周波数スペクトルをもとに雑音スペクトルを推定する手段と、
    前記分割された帯域ごとに、その周波数スペクトルと前記推定された雑音スペクトルとから信号対雑音比を算出する手段と、
    前記算出された信号対雑音比に基づいて雑音抑圧係数を設定する手段と、
    前記設定された雑音抑圧係数に従い、前記求められた周波数スペクトルに対し重み付けする手段と、
    前記重み付けされた周波数スペクトルを時間領域の信号に変換する手段と
    を備え、
    前記雑音抑圧係数を設定する手段は、
    前記周波数スペクトルに含まれる音声スペクトルの実部及び虚部ごとの出現確率を統計分布モデルにより近似することにより導出される音声スペクトルの推定式を偏微分して零とおいた演算式に従い、前記雑音抑圧係数を算出することを特徴とする音声通信装置。
JP2004009332A 2004-01-16 2004-01-16 ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 Expired - Lifetime JP4542790B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004009332A JP4542790B2 (ja) 2004-01-16 2004-01-16 ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004009332A JP4542790B2 (ja) 2004-01-16 2004-01-16 ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置

Publications (2)

Publication Number Publication Date
JP2005202222A true JP2005202222A (ja) 2005-07-28
JP4542790B2 JP4542790B2 (ja) 2010-09-15

Family

ID=34822408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004009332A Expired - Lifetime JP4542790B2 (ja) 2004-01-16 2004-01-16 ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置

Country Status (1)

Country Link
JP (1) JP4542790B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007026691A1 (ja) * 2005-09-02 2007-03-08 Nec Corporation 雑音抑圧の方法及び装置並びにコンピュータプログラム
WO2008004499A1 (fr) * 2006-07-03 2008-01-10 Nec Corporation Procédé, dispositif et programme de suppression du bruit
WO2012098579A1 (ja) * 2011-01-19 2012-07-26 三菱電機株式会社 雑音抑圧装置
JP2013137361A (ja) * 2011-12-28 2013-07-11 Pioneer Electronic Corp ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
WO2013118192A1 (ja) * 2012-02-10 2013-08-15 三菱電機株式会社 雑音抑圧装置
WO2013140733A1 (ja) 2012-03-23 2013-09-26 パナソニック株式会社 帯域パワー算出装置及び帯域パワー算出方法
JP2014051149A (ja) * 2012-09-05 2014-03-20 Yamaha Corp エンジン音加工装置
JP2015143811A (ja) * 2013-12-27 2015-08-06 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
JP2016136286A (ja) * 2016-04-28 2016-07-28 パイオニア株式会社 ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
CN108520310A (zh) * 2018-03-01 2018-09-11 河南师范大学 基于G-L混合噪声特性v-支持向量回归机的风速预报方法
CN111986691A (zh) * 2020-09-04 2020-11-24 腾讯科技(深圳)有限公司 音频处理方法、装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074099A (ja) * 1996-05-06 1998-03-17 Fr Telecom 連続する入力音声フレームの観測されたシーケンスによって構成される音声信号を等化するための方法および装置
JP2003131689A (ja) * 2001-10-25 2003-05-09 Nec Corp ノイズ除去方法及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074099A (ja) * 1996-05-06 1998-03-17 Fr Telecom 連続する入力音声フレームの観測されたシーケンスによって構成される音声信号を等化するための方法および装置
JP2003131689A (ja) * 2001-10-25 2003-05-09 Nec Corp ノイズ除去方法及び装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007026691A1 (ja) * 2005-09-02 2009-03-26 日本電気株式会社 雑音抑圧の方法及び装置並びにコンピュータプログラム
CN101091209B (zh) * 2005-09-02 2010-06-09 日本电气株式会社 抑制噪声的方法及装置
US9318119B2 (en) 2005-09-02 2016-04-19 Nec Corporation Noise suppression using integrated frequency-domain signals
WO2007026691A1 (ja) * 2005-09-02 2007-03-08 Nec Corporation 雑音抑圧の方法及び装置並びにコンピュータプログラム
WO2008004499A1 (fr) * 2006-07-03 2008-01-10 Nec Corporation Procédé, dispositif et programme de suppression du bruit
US10811026B2 (en) 2006-07-03 2020-10-20 Nec Corporation Noise suppression method, device, and program
US8724828B2 (en) 2011-01-19 2014-05-13 Mitsubishi Electric Corporation Noise suppression device
WO2012098579A1 (ja) * 2011-01-19 2012-07-26 三菱電機株式会社 雑音抑圧装置
CN103238183A (zh) * 2011-01-19 2013-08-07 三菱电机株式会社 噪音抑制装置
JP5265056B2 (ja) * 2011-01-19 2013-08-14 三菱電機株式会社 雑音抑圧装置
JP2013137361A (ja) * 2011-12-28 2013-07-11 Pioneer Electronic Corp ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
CN104067339A (zh) * 2012-02-10 2014-09-24 三菱电机株式会社 噪音抑制装置
WO2013118192A1 (ja) * 2012-02-10 2013-08-15 三菱電機株式会社 雑音抑圧装置
JPWO2013118192A1 (ja) * 2012-02-10 2015-05-11 三菱電機株式会社 雑音抑圧装置
DE112012005855B4 (de) 2012-02-10 2021-07-08 Mitsubishi Electric Corporation Störungsunterdrückungsvorrichtung
US9581623B2 (en) 2012-03-23 2017-02-28 Panasonic Intellectual Property Corporation Of America Band power computation device and band power computation method
WO2013140733A1 (ja) 2012-03-23 2013-09-26 パナソニック株式会社 帯域パワー算出装置及び帯域パワー算出方法
JP2014051149A (ja) * 2012-09-05 2014-03-20 Yamaha Corp エンジン音加工装置
US9445189B2 (en) 2013-12-27 2016-09-13 Panasonic Intellectual Property Corporation Of America Noise suppressing apparatus and noise suppressing method
JP2015143811A (ja) * 2013-12-27 2015-08-06 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
JP2016136286A (ja) * 2016-04-28 2016-07-28 パイオニア株式会社 ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
CN108520310A (zh) * 2018-03-01 2018-09-11 河南师范大学 基于G-L混合噪声特性v-支持向量回归机的风速预报方法
CN108520310B (zh) * 2018-03-01 2021-12-03 河南师范大学 G-L混合噪声特性v-支持向量回归机的风速预报方法
CN111986691A (zh) * 2020-09-04 2020-11-24 腾讯科技(深圳)有限公司 音频处理方法、装置、计算机设备及存储介质
CN111986691B (zh) * 2020-09-04 2024-02-02 腾讯科技(深圳)有限公司 音频处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
JP4542790B2 (ja) 2010-09-15

Similar Documents

Publication Publication Date Title
JP4836720B2 (ja) ノイズサプレス装置
JP6147744B2 (ja) 適応音声了解度処理システムおよび方法
CN103650040B (zh) 使用多特征建模分析语音/噪声可能性的噪声抑制方法和装置
CN103109320B (zh) 噪声抑制装置
KR100800725B1 (ko) 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
US8239194B1 (en) System and method for multi-channel multi-feature speech/noise classification for noise suppression
US9100756B2 (en) Microphone occlusion detector
CN106257584B (zh) 改进的语音可懂度
US20050278171A1 (en) Comfort noise generator using modified doblinger noise estimate
WO2013118192A1 (ja) 雑音抑圧装置
KR100876794B1 (ko) 이동 단말에서 음성의 명료도 향상 장치 및 방법
JP4542790B2 (ja) ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
KR20070085729A (ko) 바크 밴드 위너 필터 및 선형 감쇠를 이용한 노이즈 감소및 컴포트 노이즈 이득 제어
WO2009097417A1 (en) Improving sound quality by intelligently selecting between signals from a plurality of microphones
CN111554315A (zh) 单通道语音增强方法及装置、存储介质、终端
CN104981870A (zh) 声音增强装置
EP2943954B1 (en) Improving speech intelligibility in background noise by speech-intelligibility-dependent amplification
EP2716023B1 (en) Control of adaptation step size and suppression gain in acoustic echo control
JP2008309955A (ja) ノイズサプレス装置
US8254590B2 (en) System and method for intelligibility enhancement of audio information
JP2002169599A (ja) ノイズ抑制方法及び電子機器
CN111667842A (zh) 音频信号处理方法及装置
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
JP2002076960A (ja) ノイズ抑制方法及び携帯電話
Yu Speech enhancement based on soft audible noise masking and noise power estimation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100628

R151 Written notification of patent or utility model registration

Ref document number: 4542790

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

EXPY Cancellation because of completion of term