JPWO2006046293A1 - 雑音抑圧装置 - Google Patents

雑音抑圧装置 Download PDF

Info

Publication number
JPWO2006046293A1
JPWO2006046293A1 JP2006542170A JP2006542170A JPWO2006046293A1 JP WO2006046293 A1 JPWO2006046293 A1 JP WO2006046293A1 JP 2006542170 A JP2006542170 A JP 2006542170A JP 2006542170 A JP2006542170 A JP 2006542170A JP WO2006046293 A1 JPWO2006046293 A1 JP WO2006046293A1
Authority
JP
Japan
Prior art keywords
noise
amplitude component
band
noise suppression
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006542170A
Other languages
English (en)
Other versions
JP4423300B2 (ja
Inventor
猛 大谷
猛 大谷
光良 松原
光良 松原
遠藤 香緒里
香緒里 遠藤
大田 恭士
恭士 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2006046293A1 publication Critical patent/JPWO2006046293A1/ja
Application granted granted Critical
Publication of JP4423300B2 publication Critical patent/JP4423300B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Abstract

本発明は、入力信号を複数の帯域に分割し、帯域信号を出力する周波数分割手段と、帯域信号の振幅成分を求める振幅算出手段と、入力信号に含まれる雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、帯域毎に異なる重み係数を発生する重み係数発生手段と、重み係数を用いて帯域信号の振幅成分を時間的に平滑化した平滑化振幅成分を求める振幅平滑化手段と、帯域毎に平滑化振幅成分と推定雑音振幅成分から抑圧係数を求める抑圧量算出手段と、帯域信号を抑圧係数に基づいて抑圧する雑音抑圧手段と、雑音抑圧手段が出力する複数の帯域の雑音抑圧後の帯域信号を合成して出力する周波数合成手段を有することにより、ミュージカルノイズの発生を抑えつつ、音声への影響を最小限にし、安定した雑音抑圧性能を実現できる。

Description

本発明は、雑音抑圧装置に関し、雑音が重畳した音声信号から雑音成分を低減させる雑音抑圧装置に関する。
携帯電話システムやIP(Internet Protocol)電話システム等において、マイクには話者の音声に加えて環境騒音が入力される。その結果、音声信号が劣化し、音声の明瞭感が損なわれる。そこで、劣化した音声信号から雑音成分を低減させ、通話品質を高める技術が従来から開発されている(例えば、非特許文献1及び特許文献1参照)。
図1は、従来の雑音抑圧装置の一例のブロック図を示す。同図中、時間周波数変換部10は、単位時間(フレーム)毎に、現フレームnの入力信号x(k)を時間領域kから周波数領域fに変換し、入力信号の周波数領域信号X(f)を求める。振幅算出部11は周波数領域信号X(f)から入力信号の振幅成分|X(f)|(以下、「入力振幅成分」という)を求める。雑音推定部12は話者の音声が無い場合の入力振幅成分|X(f)|から推定雑音の振幅成分μ(f)(以下、「推定雑音振幅成分」という)を求める。
抑圧係数算出部13は|X(f)|とμ(f)から(1)式にしたがって抑圧係数G(f)を求める。
Figure 2006046293
雑音抑圧部14はX(f)とG(f)から(2)式にしたがって雑音抑圧後の振幅成分S (f)を求める。
Figure 2006046293
時間周波数変換部15はS (f)を周波数領域から時間領域に変換し、雑音抑圧後の信号s (k)を求める。
(非特許文献1)S.F.Boll,”Supression of Acoustic Noise in Speech Using Spectral Subtraction”, IEEE Transaction on Acoustics,Speech,and Signal Processing, ASSP−33, vol.27,pp.113−120,1979
(特許文献1)特開2004−20679
図1では、推定雑音振幅成分μ(f)は、例えば、過去の話者の音声が含まれないフレームにおける入力信号の振幅成分を平均することで求める。このように背景雑音の平均的な(長期的な)傾向は過去の入力振幅成分に基づいて推定する。
図2は、従来の抑圧係数算出方法の一例の原理図を示す。同図中、抑圧係数算出部16では、現フレームnの振幅成分|X(f)|と推定雑音振幅成分μ(f)に基づいて抑圧係数G(f)を算出し、この抑圧係数を入力振幅成分に乗算することで、入力信号に含まれる雑音成分を抑圧する。
しかしながら、現フレームに重畳している(短期的な)雑音の振幅成分を正確に求めることは困難である。すなわち、現フレームに重畳している雑音の振幅成分と推定雑音振幅成分との間には推定誤差(以下、雑音推定誤差)が生じる。このため、図3に示すように、実線で示す雑音の振幅成分と、破線で示す推定雑音振幅成分との差である雑音推定誤差が大きくなる。
この結果、雑音抑圧装置において上記の雑音推定誤差は過剰抑圧や抑圧不足を引き起こす。さらに、雑音推定誤差がフレーム毎に大きく変動するので過剰抑圧や抑圧不足も変動し、雑音抑圧性能に時間的なムラが発生してしまう。この雑音抑圧性能の時間的なムラがミュージカルノイズ(musical noise)として知られる異音を生じさせる。
図4は、従来の抑圧係数算出方法の他の一例の原理図を示す。このものは、雑音抑圧装置における過剰抑圧や抑圧不足に伴って発生する異音を抑止することを目的とした平均化雑音抑圧技術である。同図中、振幅平滑化部17では現フレームnの振幅成分|X(f)|の平滑化を行い、抑圧係数算出部18は、平滑化後の入力信号の振幅成分P(f)(以下、「平滑化振幅成分」という)と、推定雑音振幅成分μ(f)に基づいて抑圧係数G(f)を求める。
振幅成分の平滑化方法としては、次の2つの方法が用いられる。
(第1の平滑化方法)
現フレームと過去数フレーム分の入力振幅成分の平均値を平滑化振幅成分P(f)とする。この方法は単純な平均化であり、平滑化振幅成分は(3)式により求めることができる。
Figure 2006046293
(第2の平滑化方法)
現フレームの振幅成分|X(f)|と、直前フレームの平滑化振幅成分Pn−1(f)との荷重平均値を平滑化振幅成分P(f)とする。これは指数平滑化と呼ばれ、平滑化振幅成分は(4)式により求めることができる。
Figure 2006046293
図4の抑圧係数算出方法では、抑圧係数を算出する前に入力振幅成分を平均化または指数平滑化することにより、話者の音声が入力されないときは、図5に示すように、実線で示す雑音の振幅成分と、破線で示す推定雑音振幅成分との差である雑音推定誤差を小さくできる。この結果、図2の抑圧係数算出で問題であった、雑音入力時の過剰抑圧や抑圧不足を抑えることができ、ミュージカルノイズを抑止することができる。
しかしながら、話者の音声が入力されるときには、図6に示すように平滑化振幅成分が鈍ってしまい、破線で示す音声信号の振幅成分と、実線で示す平滑化振幅成分との誤差(以下、「音声推定誤差」という)が大きくなる。
この結果、音声推定誤差の大きな平滑化振幅成分と推定雑音振幅に基づいて抑圧係数を求め、入力振幅成分に抑圧係数を乗算するので、入力信号に含まれる音声成分を誤って抑圧してしまい、音質の劣化を引き起こすという問題があった。この現象は特に音声の話頭(音声の始まりの区間)において顕著である。
本発明は、上記の点に鑑みなされたものであり、ミュージカルノイズの発生を抑えつつ、音声への影響を最小限にし、安定した雑音抑圧性能を実現する雑音抑圧装置を提供することを総括的な目的とする。
この目的を達成するため、本発明は、入力信号の振幅成分を帯域毎に求める振幅算出手段と、前記入力信号の雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、帯域毎に異なる重み係数を発生する重み係数発生手段と、前記帯域毎に異なる重み係数を用いて前記入力信号の振幅成分を時間的に平滑化し平滑化振幅成分を帯域毎に求める振幅平滑化手段と、前記平滑化振幅成分と前記推定雑音振幅成分から抑圧係数を帯域毎に求める抑圧量算出手段と、前記入力信号と前記抑圧係数から雑音を抑圧した音声信号を帯域毎に求め出力する雑音抑圧手段を有し構成する。
このような雑音抑圧装置によれば、ミュージカルノイズの発生を抑えつつ、音声への影響を最小限にし、安定した雑音抑圧性能を実現できる。
従来の雑音抑圧装置の一例のブロック図である。 従来の抑圧係数算出方法の一例の原理図である。 従来の雑音推定誤差を説明するための図である。 従来の抑圧係数算出方法の他の一例の原理図 従来の雑音推定誤差を説明するための図である。 従来の音声推定誤差を説明するための図である。 本発明における抑圧係数算出の原理図である。 本発明における抑圧係数算出の原理図である。 FIRフィルタを使用する場合の振幅平滑化部の構成図である。 IIRフィルタを使用する場合の振幅平滑化部の構成図である。 本発明における重み係数の一例を示す図である。 平滑化振幅成分と推定雑音振幅成分から抑圧係数を求める関係式を示す図である。 本発明の雑音推定誤差を説明するための図である。 本発明の音声推定誤差を説明するための図である。 雑音が重畳した音声の入力信号の波形図である。 従来の雑音抑圧装置の出力音声信号の波形図である。 本発明の雑音抑圧装置の出力音声信号の波形図である。 本発明の雑音抑圧装置の第1実施形態のブロック図である。 本発明の雑音抑圧装置の第2実施形態のブロック図である。 本発明の雑音抑圧装置の第3実施形態のブロック図である。 非線形関数funcを示す図である。 本発明の雑音抑圧装置の第4実施形態のブロック図である。 信号対雑音比と重み係数の関係を示す図である。 本発明の雑音抑圧装置の第5実施形態のブロック図である。 本発明装置を適用した携帯電話の一実施形態のブロック図である。 本発明装置を適用した携帯電話の他の実施形態のブロック図である。
符号の説明
21 振幅平滑化部
22 抑圧係数算出部
23 重み係数算出部
30 FFT部
31,41 振幅算出部
32,42 雑音推定部
33 振幅平滑化部
34 振幅保持部
35 重み係数保持部
36,46 抑圧係数算出部
37,47 雑音抑圧部
40 チャンネル分割部
43 振幅平滑化部
44 振幅保持部
45 重み係数算出部
48 チャンネル合成部
以下、図面に基づいて本発明の実施形態について説明する。
本発明における抑圧係数算出の原理図を図7および図8に示す。本発明では図4と同様に、抑圧係数を算出する前に入力振幅成分の平滑化を行う。
図7において、振幅平滑化部21では現フレームnの振幅成分|X(f)|と重み係数w(f)を用いて平滑化振幅成分P(f)を得る。抑圧係数算出部22は、平滑化振幅成分P(f)と、推定雑音振幅成分μ(f)に基づいて抑圧係数G(f)を求める。
図8において、重み係数算出部23は、入力振幅成分から特徴量(信号対雑音比や入力信号の振幅等)を算出し、特徴量に基づいて重み係数w(f)を適応的に制御する。振幅平滑化部21では現フレームnの振幅成分|X(f)|と重み係数算出部23からの重み係数w(f)を用いて平滑化振幅成分P(f)を得る。抑圧係数算出部22は、平滑化振幅成分P(f)と、推定雑音振幅成分μ(f)に基づいて抑圧係数G(f)を求める。
平滑化の方法としてはFIRフィルタを使用する方法とIIRフィルタを使用する方法があり、本発明ではいずれの平滑化方法を選択してもよい。
(FIRフィルタを使用する場合)
FIRフィルタを使用する場合の振幅平滑化部21の構成を図9に示す。同図中、振幅保持部25では、過去Nフレーム分の入力振幅成分(平滑化前の振幅成分)を保持する。さらに平滑化部26において、過去Nフレーム分の平滑化前の振幅成分と、現在の振幅成分から(5)式にしたがって平滑化後の振幅成分を求める。
Figure 2006046293
(IIRフィルタを使用する場合)
IIRフィルタを使用する場合の振幅平滑化部の構成を図10に示す。同図中、振幅保持部27では、過去Nフレーム分の平滑化後の振幅成分を保持する。さらに平滑化部28において、過去Nフレーム分の平滑化後の振幅成分と、現在の振幅成分から(6)式にしたがって平滑化後の振幅成分を求める。
Figure 2006046293
上記の(5),(6)式において、mはフィルタを構成する遅延素子数であり、w(f)〜w(f)はフィルタを構成するm+1個の乗算器それぞれの重み係数であり、この値を調整することで、入力信号を平滑化する際の平滑化の強さを制御することができる。
従来は(3),(4)式から明らかなように全周波数帯域において同じで重み係数を使用していたが、本発明では(5),(6)式のように、重み係数w(f)は、周波数の関数として表わされ、帯域毎に異なる値を使用することを特徴としている。
図11に本発明における重み係数w(f)の一例を示す。図11では、入力信号の性質が低周波数帯域は変動しにくく高周波数帯域は変動しやすいことを想定しており、現フレームの振幅成分|X(f)|にかかる重み係数w(f)を実線に示すように低域で大きく高域で小さくなる値とすることで、高周波数帯域の変動に追随し、かつ、低周波数帯域には平滑化をより強くかけている。なお、帯域毎に重み係数の時間的な総和は1とされており、w(f)=1−w(f)とした場合、w(f)は一点鎖線に示すようになる。
また、従来の(4)式は重み係数としての平滑化係数αが定数であったが、本発明では、重み係数w(f)を変数として、図8に示す重み係数算出部23で入力振幅成分から信号対雑音比や入力信号の振幅などの特徴量を算出し、特徴量に基づいて重み係数を適応的に制御する。
平滑化振幅成分P(f)と推定雑音振幅成分μ(f)から抑圧係数G(f)を求める際の関係式としては、任意のものを選択可能である。例えば(1)式を用いても良く、さらには、図12に示すような関係式を適用しても良い。図12では、P(f)/μ(f)が小さくなるほどG(f)を小さくしている。
本発明の雑音抑圧装置では、抑圧係数を算出する前に入力振幅成分を平滑化するため、話者の音声が入力されないときは、図13に示すように、実線で示す雑音の振幅成分と、破線で示す推定雑音振幅成分との差である雑音推定誤差を小さくできる。
さらに、話者の音声が入力されるときにも、図14に示すように、破線で示す音声信号の振幅成分と、実線で示す平滑化振幅成分との差である音声推定誤差を小さくできる。この結果、音声への影響を最小限にしつつ、ミュージカルノイズの発生を抑え安定した雑音抑圧性能を実現できる。
ここで、図15に示すように、雑音が重畳した音声の入力信号が供給された場合、図4の抑圧係数算出方法を用いた従来の雑音抑圧装置の出力音声信号は図16に示す波形となり、本発明の雑音抑圧装置の出力音声信号は図17に示す波形となる。
図16の波形と図17の波形を比べてみると、話頭の区間τにおいて、図17の波形の劣化が小さいことが分かる。それぞれの出力音を比較するために、雑音入力時の抑圧性能を音声が無い区間で測定し、音声入力時の音質劣化を話頭の区間で測定した結果を以下に示す。
雑音入力時の抑圧性能(非音声区間で測定)は、従来の雑音抑圧装置が約14dBで、本発明の雑音抑圧装置が約14dBである。音声入力時の音質劣化(音声の話頭区間で測定)は、従来の雑音抑圧装置が約4dBであるのに対し、本発明の雑音抑圧装置は約1dBとなり、約3dB改善される。これにより、本発明は音声入力時に音声成分の抑圧を小さくして音質劣化を軽減することが可能となる。
図18は、本発明の雑音抑圧装置の第1実施形態のブロック図を示す。この実施形態はチャネル分割・合成にFFT(Fast Fourier Transform)/IFFT(Inverse FFT)を使用し、FIRフィルタによる平滑化方法を採用し、抑圧係数の算出には(1)式を採用している。
同図中、FFT部30は、単位時間(フレーム)毎に、現フレームnの入力信号x(k)を時間領域kから周波数領域fに変換し、入力信号の周波数領域信号X(f)を求める。なお、添字nはフレーム番号を表している。
振幅算出部31は周波数領域信号X(f)から入力振幅成分|X(f)|を求める。雑音推定部32は音声区間検出を行い、話者音声の非検出時に入力振幅成分|X(f)|から(7)式にしたがって推定雑音振幅成分μ(f)を求める。
Figure 2006046293
振幅平滑化部33は、入力振幅成分|X(f)|と、振幅保持部34で保持している直前フレームの入力振幅成分|Xn−1(f)|と、重み係数保持部35で保持している重み係数w(f)から(8)式にしたがって平均化振幅成分P(f)を求める。ただし、fは音声をデジタル化する際のサンプリング周波数である。また、重み係数w(f)は図11に示すものとする。
Figure 2006046293
抑圧係数算出部36は、平均化振幅成分P(f)と推定雑音振幅成分μ(f)から(9)式にしたがって抑圧係数G(f)を求める。
Figure 2006046293
雑音抑圧部37は、X(f)とG(f)から(10)式にしたがって雑音抑圧後の振幅成分S (f)を求める。
Figure 2006046293
IFFT部37は、振幅成分S (f)を周波数領域から時間領域に変換し、雑音抑圧後の信号s (k)を求める。
図19は、本発明の雑音抑圧装置の第2実施形態のブロック図を示す。この実施形態はチャネル分割・合成にバンドパスフィルタを使用し、FIRフィルタによる平滑化方法を採用し、抑圧係数の算出には(1)式を採用している。
同図中、チャンネル分割部40は、帯域フィルタ(BPF)を用いて入力信号x(k)を(11)式にしたがって帯域信号xBPF(i,k)に分割する。なお、添字iはチャンネル番号を表す。
Figure 2006046293
振幅算出部41は、帯域信号xBPF(i,k)から各フレームにおいて(12)式にしたがって帯域別入力振幅Pow(i,n)を算出する。なお、添字nはフレーム番号を表す。
Figure 2006046293
雑音推定部42は音声区間検出を行い話者音声の非検出時に帯域別入力振幅成分Pow(i,n)から(13)式にしたがって推定雑音の振幅成分μ(i,n)を求める。
Figure 2006046293
重み係数算出部45は、帯域別入力振幅成分Pow(i,n)を所定の閾値THR1と比較して重み係数w(i,m)を算出する。ただし、m=0,1,2とする。
Pow(i,n)≧THR1のとき、
w(i,0)=0.7
w(i,1)=0.2
w(i,2)=0.1
Pow(i,n)<THR1のとき、
w(i,0)=0.4
w(i,1)=0.3
w(i,2)=0.3
つまり、チャンネル毎に重み係数の時間的な総和は1とされている。
振幅平滑化部43は、振幅保持部44で保持している帯域別入力振幅成分Pow(i,n−1),Pow(i,n−2)と、振幅算出部41からの帯域別入力振幅成分Pow(i,n)と、重み係数w(i,m)から(14)式にしたがって平滑化入力振幅成分PowAV(i,n)を算出する。
Figure 2006046293
抑圧係数算出部46は、平滑化入力振幅成分PowAV(i,n)と推定雑音振幅成分μ(i,n)から(15)式により抑圧係数G(i,n)を算出する。
Figure 2006046293
雑音抑圧部47において、帯域信号xBPF(i,k)と抑圧係数G(i,n)から(16)式にしたがって雑音抑圧後の帯域信号s BPF(i,k)を求める。
Figure 2006046293
チャンネル合成部48は加算回路で構成され、帯域信号s BPF(i,k)を(17)式にしたがって加算合成して出力音声信号s(k)を求める。
Figure 2006046293
図20は、本発明の雑音抑圧装置の第3実施形態のブロック図を示す。この実施形態はチャネル分割・合成にFFT/IFFTを使用し、IIRフィルタによる平滑化方法を採用し、抑圧係数の算出には非線形関数を採用している。
同図中、FFT部30は、単位時間(フレーム)毎に、現フレームnの入力信号x(k)を時間領域kから周波数領域fに変換し、入力信号の周波数領域信号X(f)を求める。なお、添字nはフレーム番号を表している。
振幅算出部31は周波数領域信号X(f)から入力振幅成分|X(f)|を求める。雑音推定部32は音声区間検出を行い、話者音声の非検出時に入力振幅成分|X(f)|から(7)式にしたがって推定雑音振幅成分μ(f)を求める。
振幅平滑化部51は、入力振幅成分|X(f)|と、振幅保持部52で保持している過去2フレームの平均化振幅成分Pn−1(f),Pn−2(f)と、重み係数保持部53で保持している重み係数w(f)から(18)式にしたがって平均化振幅成分P(f)を求める。
Figure 2006046293
重み係数算出部53は、平均化振幅成分P(f)を所定の閾値THR2と比較して重み係数w(f)を算出する。ただし、m=0,1,2とする。
(f)≧THR2のとき、
(f)=1.0
(f)=0.0
(f)=0.0
(f)<THR2のとき、
(f)=0.6
(f)=0.2
(f)=0.2
つまり、帯域毎に重み係数の時間的な総和は1とされている。
抑圧係数算出部54は、平均化振幅成分P(f)と推定雑音振幅成分μ(f)から(19)式に示す非線形関数funcを用いて抑圧係数G(f)を求める。なお、非線形関数funcを図21に示す。
Figure 2006046293
雑音抑圧部37は、X(f)とG(f)から(10)式にしたがって雑音抑圧後の振幅成分S (f)を求める。IFFT部37は、振幅成分S (f)を周波数領域から時間領域に変換し、雑音抑圧後の信号s (k)を求める。
このように、重み係数を平滑化後の振幅成分に基づいて制御することにより、非定常な雑音に強固で安定した制御が可能となる。
図22は、本発明の雑音抑圧装置の第4実施形態のブロック図を示す。この実施形態はチャネル分割・合成にFFT/IFFTを使用し、FIRフィルタによる平滑化方法を採用し、抑圧係数の算出には非線形関数を採用している。
同図中、FFT部30は、単位時間(フレーム)毎に、現フレームnの入力信号x(k)を時間領域kから周波数領域fに変換し、入力信号の周波数領域信号X(f)を求める。なお、添字nはフレーム番号を表している。
振幅算出部31は周波数領域信号X(f)から入力振幅成分|X(f)|を求める。雑音推定部32は音声区間検出を行い、話者音声の非検出時に入力振幅成分|X(f)|から(7)式にしたがって推定雑音振幅成分μ(f)を求める。
信号対雑音比計算部56は、現フレームの入力振幅成分|X(f)|と、推定雑音振幅成分μ(f)から、(20)式にしたがって帯域毎に信号対雑音比SNR(f)を求める。
Figure 2006046293
重み係数算出部57は、信号対雑音比SNR(f)から重み係数w(f)を求める。なお、SNR(f)とw(f)の関係を図23に示す。また、w(f)からw(f)を(21)式にしたがって算出する。つまり、帯域毎に重み係数の時間的な総和は1とされている。
Figure 2006046293
振幅平滑化部58は、現フレームの入力振幅成分|X(f)|と、振幅保持部34で保持している直前フレームの入力振幅成分|Xn−1(f)|と、重み係数算出部57からの重み係数w(f)即ちw(f),w(f)から(22)式にしたがって平均化振幅成分P(f)を求める。
Figure 2006046293
抑圧係数算出部36は、平均化振幅成分P(f)と推定雑音振幅成分μ(f)から(9)式にしたがって抑圧係数G(f)を求める。雑音抑圧部37は、X(f)とG(f)から(10)式にしたがって雑音抑圧後の振幅成分S (f)を求める。IFFT部37は、振幅成分S (f)を周波数領域から時間領域に変換し、雑音抑圧後の信号s (k)を求める。
このように、重み係数を信号対雑音比に基づいて制御することにより、マイクの音量によらず安定した制御が可能となる。
図24は、本発明の雑音抑圧装置の第5実施形態のブロック図を示す。この実施形態はチャネル分割・合成にFFT/IFFTを使用し、IIRフィルタによる平滑化方法を採用し、抑圧係数の算出には非線形関数を採用している。
同図中、FFT部30は、単位時間(フレーム)毎に、現フレームnの入力信号x(k)を時間領域kから周波数領域fに変換し、入力信号の周波数領域信号X(f)を求める。なお、添字nはフレーム番号を表している。
振幅算出部31は周波数領域信号X(f)から入力振幅成分|X(f)|を求める。雑音推定部32は音声区間検出を行い、話者音声の非検出時に入力振幅成分|X(f)|から(7)式にしたがって推定雑音振幅成分μ(f)を求める。
振幅平滑化部51は、入力振幅成分|X(f)|と、振幅保持部52で保持している過去2フレームの平均化振幅成分Pn−1(f),Pn−2(f)と、重み係数保持部61からの重み係数w(f)から(18)式にしたがって平均化振幅成分P(f)を求める。
信号対雑音比計算部60において、平滑化振幅成分P(f)と、推定雑音振幅成分μ(f)から、(23)式にしたがって帯域毎に信号対雑音比SNR(f)を算出する。
Figure 2006046293
重み係数算出部61は、信号対雑音比SNR(f)から重み係数w(f)を求める。なお、SNR(f)とw(f)の関係を図23に示す。また、w(f)からw(f)を(21)式にしたがって算出する。
抑圧係数算出部54は、平均化振幅成分P(f)と推定雑音振幅成分μ(f)から(19)式に示す非線形関数funcを用いて抑圧係数G(f)を求める。雑音抑圧部37は、X(f)とG(f)から(10)式にしたがって雑音抑圧後の振幅成分S (f)を求める。IFFT部37は、振幅成分S (f)を周波数領域から時間領域に変換し、雑音抑圧後の信号s (k)を求める。
このように、重み係数を平滑化後の信号対雑音比に基づいて制御することにより、非定常な雑音に強固で安定した制御が可能となり、マイクの音量によらず安定した制御が可能る。
図25は、本発明装置を適用した携帯電話の一実施形態のブロック図を示す。同図中、マイクロホン71の出力音声信号は、本発明の雑音抑圧装置70にて雑音抑圧されたのちエンコーダ72で符号化され、送信部73から公衆網74に送出される。
図26は、本発明装置を適用した携帯電話の他の実施形態のブロック図を示す。同図中、公衆網74から送信された信号は受信部75で受信され、デコーダ76にて復号され、本発明の雑音抑圧装置70にて雑音抑圧される。こののち、スピーカ77に供給され発音される。
なお、図25と図26を複合化して送話系と受話系の双方に本発明の雑音抑圧装置70を設けても良い。
なお、振幅算出部31,41が請求項記載の振幅算出手段に対応し、雑音推定部32,42が雑音推定手段に対応し、重み係数保持部35,重み係数算出部45,信号対雑音比計算部56,60が重み係数発生手段に対応し、振幅平滑化部33,43が振幅平滑化手段に対応し、抑圧係数算出部36,46が抑圧量算出手段に対応し、37,47が雑音抑圧手段に対応し、FFT部30,チャンネル分割部40が周波数分割手段に対応し、IFFT部38,チャンネル合成部48が周波数合成手段に対応する。
Figure 2006046293
抑圧係数算出部36は、平均化振幅成分P(f)と推定雑音振幅成分μ(f)から(9)式にしたがって抑圧係数G(f)を求める。
Figure 2006046293
重み係数算出部53は、平均化振幅成分P(f)を所定の閾値THR2と比較して重み係数w(f)を算出する。ただし、m=0,1,2とする。
(f)≧THR2のとき、
(f)=1.0
(f)=0.0
(f)=0.0
(f)<THR2のとき、
(f)=0.6
(f)=0.2
(f)=0.2
つまり、帯域毎に重み係数の時間的な総和は1とされている。
振幅平滑化部51は、入力振幅成分|X(f)|と、振幅保持部52で保持している過去2フレームの平均化振幅成分Pn−1(f),Pn−2(f)と、重み係数算出部61からの重み係数w(f)から(18)式にしたがって平均化振幅成分P(f)を求める。
なお、振幅算出部31,41が請求項記載の振幅算出手段に対応し、雑音推定部32,42が雑音推定手段に対応し、重み係数保持部35,重み係数算出部45,信号対雑音比計算部56,60が重み係数発生手段に対応し、振幅平滑化部33,43が振幅平滑化手段に対応し、抑圧係数算出部36,46が抑圧量算出手段に対応し、雑音抑圧部37,47が雑音抑圧手段に対応し、FFT部30,チャンネル分割部40が周波数分割手段に対応し、IFFT部38,チャンネル合成部48が周波数合成手段に対応する。

Claims (13)

  1. 入力信号を複数の帯域に分割し、帯域信号を出力する周波数分割手段と、
    前記帯域信号の振幅成分を求める振幅算出手段と、
    前記入力信号に含まれる雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、
    帯域毎に異なる重み係数を発生する重み係数発生手段と、
    前記重み係数を用いて前記帯域信号の振幅成分を時間的に平滑化した平滑化振幅成分を求める振幅平滑化手段と、
    帯域毎に前記平滑化振幅成分と前記推定雑音振幅成分から抑圧係数を求める抑圧量算出手段と、
    前記帯域信号を前記抑圧係数に基づいて抑圧する雑音抑圧手段と、
    前記雑音抑圧手段が出力する複数の帯域の雑音抑圧後の帯域信号を合成して出力する周波数合成手段を
    有することを特徴とする雑音抑圧装置。
  2. 入力信号を複数の帯域に分割し、帯域信号を出力する周波数分割手段と、
    前記帯域信号の振幅成分を求める振幅算出手段と、
    前記入力信号に含まれる雑音の振幅成分を推定して推定雑音振幅成分を帯域毎に求める雑音推定手段と、
    重み係数を時間的に変化させ、出力する重み係数発生手段と、
    前記重み係数を用いて前記帯域信号の振幅成分を時間的に平滑化した平滑化振幅成分を求める振幅平滑化手段と、
    帯域毎に前記平滑化振幅成分と前記推定雑音振幅成分から抑圧係数を求める抑圧量算出手段と、
    前記帯域信号を前記抑圧係数に基づいて抑圧する雑音抑圧手段と、
    前記雑音抑圧手段が出力する複数の帯域の雑音抑圧後の帯域信号を合成して出力する周波数合成手段を
    有することを特徴とする雑音抑圧装置。
  3. 請求項1または2記載の雑音抑圧装置において、
    前記重み係数発生手段は、予め設定された重み係数を出力することを特徴とする雑音抑圧装置。
  4. 請求項1または2記載の雑音抑圧装置において、
    前記重み係数発生手段は、前記入力信号の振幅成分に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
  5. 請求項1または2記載の雑音抑圧装置において、
    前記重み係数発生手段は、前記平滑化振幅成分に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
  6. 請求項1または2記載の雑音抑圧装置において、
    前記重み係数発生手段は、前記入力信号の振幅成分と前記推定雑音振幅成分の比に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
  7. 請求項1または2記載の雑音抑圧装置において、
    前記重み係数発生手段は、前記平滑化振幅成分と前記推定雑音振幅成分の比に基づいて帯域毎に重み係数を算出することを特徴とする雑音抑圧装置。
  8. 請求項1乃至7のいずれか記載の雑音抑圧装置において、
    前記重み係数発生手段は、時間的な総和が1となる重み係数を発生することを特徴とする雑音抑圧装置。
  9. 請求項1乃至8のいずれか記載の雑音抑圧装置において、
    前記周波数分割手段は、高速フーリエ変換器であり、
    前記周波数合成手段は、高速逆フーリエ変換器であることを特徴とする雑音抑圧装置。
  10. 請求項1乃至8のいずれか記載の雑音抑圧装置において、
    前記周波数分割手段は、複数のバンドパスフィルタで構成され、
    前記周波数合成手段は、加算回路で構成されたことを特徴とする雑音抑圧装置。
  11. 請求項1乃至10のいずれか記載の雑音抑圧装置において、
    前記振幅平滑化手段は、現在の入力信号の振幅成分と過去の入力信号の振幅成分を前記重み係数にしたがって帯域毎に重みづけ加算することを特徴とする雑音抑圧装置。
  12. 請求項1乃至10のいずれか記載の雑音抑圧装置において、
    前記振幅平滑化手段は、現在の入力信号の振幅成分と過去の平滑化振幅成分を前記重み係数にしたがって帯域毎に重みづけ加算することを特徴とする雑音抑圧装置。
  13. 請求項1乃至12のいずれか記載の雑音抑圧装置において、
    前記重み係数発生手段は、低域で大きく高域で小さくなる値の重み係数を発生することを特徴とする雑音抑圧装置。
JP2006542170A 2004-10-28 2004-10-28 雑音抑圧装置 Expired - Fee Related JP4423300B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2004/016027 WO2006046293A1 (ja) 2004-10-28 2004-10-28 雑音抑圧装置

Publications (2)

Publication Number Publication Date
JPWO2006046293A1 true JPWO2006046293A1 (ja) 2008-05-22
JP4423300B2 JP4423300B2 (ja) 2010-03-03

Family

ID=36227545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006542170A Expired - Fee Related JP4423300B2 (ja) 2004-10-28 2004-10-28 雑音抑圧装置

Country Status (5)

Country Link
US (1) US20070232257A1 (ja)
EP (1) EP1806739B1 (ja)
JP (1) JP4423300B2 (ja)
CN (1) CN101027719B (ja)
WO (1) WO2006046293A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
JP4724054B2 (ja) * 2006-06-15 2011-07-13 日本電信電話株式会社 特定方向収音装置、特定方向収音プログラム、記録媒体
JP5070873B2 (ja) * 2006-08-09 2012-11-14 富士通株式会社 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
JP4836720B2 (ja) * 2006-09-07 2011-12-14 株式会社東芝 ノイズサプレス装置
JP4753821B2 (ja) * 2006-09-25 2011-08-24 富士通株式会社 音信号補正方法、音信号補正装置及びコンピュータプログラム
EP1986005B1 (de) * 2007-04-26 2010-01-13 Gebrüder Loepfe AG Frequenzabhängige Fehlstellenermittlung in einem Garn oder Garnvorgänger
JP4845811B2 (ja) * 2007-05-30 2011-12-28 パイオニア株式会社 音響装置、遅延時間測定方法、遅延時間測定プログラム及びその記録媒体
JP4928376B2 (ja) * 2007-07-18 2012-05-09 日本電信電話株式会社 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
JP4928382B2 (ja) * 2007-08-10 2012-05-09 日本電信電話株式会社 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
DE602007004217D1 (de) * 2007-08-31 2010-02-25 Harman Becker Automotive Sys Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung
JP5453740B2 (ja) * 2008-07-02 2014-03-26 富士通株式会社 音声強調装置
JP5056654B2 (ja) * 2008-07-29 2012-10-24 株式会社Jvcケンウッド 雑音抑制装置、及び雑音抑制方法
JP5535198B2 (ja) * 2009-04-02 2014-07-02 三菱電機株式会社 雑音抑圧装置
JP2010249939A (ja) * 2009-04-13 2010-11-04 Sony Corp ノイズ低減装置、ノイズ判定方法
EP2444966B1 (en) * 2009-06-19 2019-07-10 Fujitsu Limited Audio signal processing device and audio signal processing method
JP5678445B2 (ja) * 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
JP5728903B2 (ja) * 2010-11-26 2015-06-03 ヤマハ株式会社 音響処理装置およびプログラム
CN102074241B (zh) * 2011-01-07 2012-03-28 蔡镇滨 一种通过快速声音波形修复实现声音还原的方法
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP5977138B2 (ja) * 2012-10-10 2016-08-24 日本信号株式会社 車上装置、及び、これを用いた列車制御装置
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
CN105103230B (zh) * 2013-04-11 2020-01-03 日本电气株式会社 信号处理装置、信号处理方法、信号处理程序
WO2016179740A1 (zh) 2015-05-08 2016-11-17 华为技术有限公司 处理信号的方法及装置
JP6559576B2 (ja) * 2016-01-05 2019-08-14 株式会社東芝 雑音抑圧装置、雑音抑圧方法及びプログラム
GB201617408D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201617409D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
CN110089038B (zh) * 2016-12-22 2021-08-03 新唐科技日本株式会社 噪声抑制装置、噪声抑制方法、以及使用它们的接收装置、接收方法
GB201704636D0 (en) 2017-03-23 2017-05-10 Asio Ltd A method and system for authenticating a device
GB2565751B (en) 2017-06-15 2022-05-04 Sonos Experience Ltd A method and system for triggering events
GB2570634A (en) 2017-12-20 2019-08-07 Asio Ltd A method and system for improved acoustic transmission of data
US11988784B2 (en) 2020-08-31 2024-05-21 Sonos, Inc. Detecting an audio signal with a microphone to determine presence of a playback device
CN114650203B (zh) * 2022-03-22 2023-10-27 吉林省广播电视研究所(吉林省广播电视局科技信息中心) 单频振幅抑噪测量方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6021612A (ja) * 1983-07-15 1985-02-04 Matsushita Electric Ind Co Ltd グラフイツク・イコライザ
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
CA2278231A1 (en) * 1997-02-21 1998-08-27 Lernout & Hauspie Speech Products N.V. Accelerated convolution noise elimination
WO1999030315A1 (fr) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
CA2291826A1 (en) * 1998-03-30 1999-10-07 Kazutaka Tomita Noise reduction device and a noise reduction method
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
JP2000330597A (ja) * 1999-05-20 2000-11-30 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6529868B1 (en) * 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
JP3566197B2 (ja) * 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
JP2002140100A (ja) * 2000-11-02 2002-05-17 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP2003044087A (ja) * 2001-08-03 2003-02-14 Matsushita Electric Ind Co Ltd 騒音抑圧装置、騒音抑圧方法、音声識別装置、通信機器および補聴器
JP2003131689A (ja) * 2001-10-25 2003-05-09 Nec Corp ノイズ除去方法及び装置
US20050091049A1 (en) * 2003-10-28 2005-04-28 Rongzhen Yang Method and apparatus for reduction of musical noise during speech enhancement
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US20050288923A1 (en) * 2004-06-25 2005-12-29 The Hong Kong University Of Science And Technology Speech enhancement by noise masking

Also Published As

Publication number Publication date
WO2006046293A1 (ja) 2006-05-04
CN101027719B (zh) 2010-05-05
EP1806739A4 (en) 2008-06-04
EP1806739A1 (en) 2007-07-11
CN101027719A (zh) 2007-08-29
JP4423300B2 (ja) 2010-03-03
US20070232257A1 (en) 2007-10-04
EP1806739B1 (en) 2012-08-15

Similar Documents

Publication Publication Date Title
JP4423300B2 (ja) 雑音抑圧装置
US8521530B1 (en) System and method for enhancing a monaural audio signal
EP2008379B1 (en) Adjustable noise suppression system
EP1252796B1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
JP3568922B2 (ja) エコー処理装置
US8326617B2 (en) Speech enhancement with minimum gating
JP4836720B2 (ja) ノイズサプレス装置
US8560308B2 (en) Speech sound enhancement device utilizing ratio of the ambient to background noise
US9454956B2 (en) Sound processing device
WO2010146711A1 (ja) 音声信号処理装置及び音声信号処理方法
US20080031467A1 (en) Echo reduction system
EP2346032A1 (en) Noise suppression device and audio decoding device
EP2463856B1 (en) Method to reduce artifacts in algorithms with fast-varying gain
JPH09204196A (ja) 雑音抑圧器及び移動局並びに雑音抑圧方法
KR20060125572A (ko) 노이즈 억제를 위한 방법 및 장치
WO2000062280A1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
JP2004341339A (ja) 雑音抑圧装置
JP4413205B2 (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JPH11265199A (ja) 送話器
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JP5131149B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP4209348B2 (ja) エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置
JP2022011893A (ja) ノイズ抑圧回路
Shruthi et al. SPEECH INTELLIGIBILITY PREDICTION AND NEAR END LISTENING ENHANCEMENT FOR MOBILE APPLICIATION

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4423300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees