JP6261749B2 - 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム - Google Patents
雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム Download PDFInfo
- Publication number
- JP6261749B2 JP6261749B2 JP2016547306A JP2016547306A JP6261749B2 JP 6261749 B2 JP6261749 B2 JP 6261749B2 JP 2016547306 A JP2016547306 A JP 2016547306A JP 2016547306 A JP2016547306 A JP 2016547306A JP 6261749 B2 JP6261749 B2 JP 6261749B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- spectrum
- suppression
- target
- noise spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001629 suppression Effects 0.000 title claims description 280
- 238000000034 method Methods 0.000 title claims description 70
- 238000001228 spectrum Methods 0.000 claims description 533
- 238000004364 calculation method Methods 0.000 claims description 88
- 238000012545 processing Methods 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims 3
- 238000012937 correction Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 10
- 238000005311 autocorrelation function Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 3
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Telephone Function (AREA)
Description
図14は、車両が高速(時速70kmおよび時速160km)で走行した場合の車内雑音のスペクトルの様態を示す図である。スペクトルNaは車両が時速70kmで走行した場合における入力信号の推定雑音スペクトルを示し、スペクトルNbは車両が時速160kmで走行した場合における入力信号の推定雑音スペクトルを示す。ここで、入力信号の推定雑音スペクトルとは、入力信号に混入する走行騒音から推定されるスペクトルである。
領域Aおよび領域Bで示すように、車両の走行速度の違いによって、雑音の周波数特性に差異が生じる。図14で示した推定雑音スペクトルNa,Nbに対して、特許文献2に記載の従来技術を適用して雑音抑制を行った結果を図15に示す。
スペクトルNa,Nbは推定雑音スペクトルを示し、スペクトルRa,Rbは目標雑音スペクトルを示し、スペクトルSa,Sbは残留雑音スペクトルを示す。特許文献2に記載の雑音抑制方法では、基準抑圧量を決定する帯域Xa,Xbにおいて、残留雑音スペクトルSa,Sbのレベルを目標雑音スペクトルRa,Rbの振幅レベルに合うように、雑音抑圧のための最大抑圧量を制御する(帯域Xa,Xb内の位置Ya,Yb参照)。制御された最大抑圧量に基づいて、推定雑音スペクトルNa,Nbに対して雑音抑制を行う。具体的には、図15(a)の矢印Za1,Za2,Za3、図15(b)の矢印Zb1,Zb2,Zb3で示した方向へ、最大抑圧量に基づいた雑音抑制処理を行う。
実施の形態1.
図1は、実施の形態1に係る雑音抑圧装置の構成を示すブロック図である。
実施の形態1の雑音抑圧装置100は、入力端子1、フーリエ変換部2、パワースペクトル計算部3、音声・雑音区間判定部4、雑音スペクトル推定部5、目標雑音スペクトル生成部6、抑圧量制限係数計算部7、SN比計算部8、抑圧量計算部9、スペクトル抑圧部10、逆フーリエ変換部11および出力端子12を備えている。
雑音抑圧装置100の入力、すなわち入力端子1への入力としては、マイクロホン(図示せず)などを通じて取り込まれた音声および音楽などの音声信号がA/D(アナログ・デジタル)変換された後、所定のサンプリング周波数(例えば、8kHz)でサンプリングされると共にフレーム単位(例えば、10ms)に分割された信号を用いる。
図2は、実施の形態1に係る雑音抑圧装置100の動作を示すフローチャートである。
入力端子1は、上述した信号を取り込み、入力信号としてフーリエ変換部2に出力する(ステップST1)。フーリエ変換部2は、ステップST1で入力された入力信号に対して例えばハニング窓掛けを行った後、以下の式(1)を用いて例えば256点の高速フーリエ変換を行い、時間領域の信号x(t)からスペクトル成分X(λ,k)に変換する(ステップST2)。得られたスペクトル成分X(λ,k)は、パワースペクトル計算部3およびスペクトル抑圧部10にそれぞれ出力される。
X(λ,k)=FT[x(t)] (1)
式(1)において、λは入力信号をフレーム分割したときのフレーム番号、kはパワースペクトルの周波数帯域の周波数成分を指定する番号(以下、スペクトル番号と称する)、FT[・]はフーリエ変換処理を表す。また、tはサンプリングにおける離散時間番号を表す。
式(2)において、Re{X(λ,k)}およびIm{X(λ,k)}は、それぞれフーリエ変換後の入力信号スペクトルの実数部および虚数部を表す。
ただし、ρ(λ,τ)=FT[Y(λ,k)]
ここで、式(6)は、τ=16〜96の範囲で正規化自己相関関数ρN(λ,τ)の最大値を検索することを意味している。なお、自己相関関数の分析には、式(5)に示した方法の他、ケプストラム分析など公知の手法を用いることができる。
式(7)において、N(λ−1,k)は前フレームにおける推定雑音スペクトルであり、雑音スペクトル推定部5内のRAM(Random Access Memory)などの記憶手段(不図示)に保持されている。また、αは更新係数であり、0<α<1の範囲の所定の定数である。好適な例としてはα=0.95であるが、入力信号の状態および雑音レベルに応じて適宜変更することも可能である。
一方、判定フラグVflag=0の場合(ステップST6)には、現フレームの入力信号が雑音であると判定されていることから、入力信号のパワースペクトルY(λ,k)と更新係数αを用いて、前フレームの推定雑音スペクトルN(λ−1,k)の更新を行い、現フレームの推定雑音スペクトルN(λ,k)として出力する(ステップST8)。
式(9)において、δは忘却係数であって0<δ<1の範囲の所定の定数であり、この実施の形態1ではδ=0.98が好適である。また、F[・]は半波整流を意味し、事後SNRγ(λ,k)がデシベル値で負の場合に値をゼロにフロアリング(flooring)するものである。
[参考文献1]
T.Lotter, P.Vary,“Speech Enhancement by MAP Spectral Amplitude Using a Super−Gaussian Speech Model”,EURASIP Journal on Applied Signal Processing,pp.1110−1126,No.7,2005
まず、目標雑音スペクトル生成部6の構成について説明する。
図3は、実施の形態1に係る雑音抑圧装置100の目標雑音スペクトル生成部6の構成を示すブロック図である。
目標雑音スペクトル生成部6は、雑音パワー計算部61、目標雑音スペクトル選択部62および目標雑音スペクトルメモリ63を備える。
図4は、実施の形態1に係る雑音抑圧装置100の目標雑音スペクトルメモリ63が蓄積する目標雑音スペクトルの一例を示す図である。図4の例では、縦軸は信号振幅(デシベル:dB)、横軸は周波数(0〜4000Hz)を示し、狭帯域電話音声(0〜4000Hz)における雑音抑制を想定した場合を示している。
図5は、実施の形態1に係る雑音抑圧装置100の目標雑音スペクトル生成部6の動作を示すフローチャートであり、図2のフローチャートのステップST9の処理をより詳細に示したものである。
雑音パワー計算部61は、雑音スペクトル推定部5から推定雑音スペクトルN(λ,k)が入力されると(ステップST21)、入力された推定雑音スペクトルN(λ,k)を用いて、以下の式(13)に基づいて入力信号スペクトル中の雑音パワーPN(λ)を計算する(ステップST22)。計算された雑音パワーPN(λ)は分析結果として目標雑音スペクトル選択部62に出力される。
式(13)において、Nはスペクトルの個数であり、N=128とする。
図6は、実施の形態1に係る雑音抑圧装置100の抑圧量制限係数計算部7の構成を示すブロック図である。
抑圧量制限係数計算部7は、パワー計算部71および係数補正部72を備える。
パワー計算部71は、目標雑音スペクトルR(λ,k)のパワーPOWR(λ)を計算し、推定雑音スペクトルN(λ,k)のパワーPOWN(λ)を計算する。係数補正部72は、パワー計算部71が計算したパワーPOWR(λ)およびパワーPOWN(λ)から目標雑音スペクトルR(λ,k)の修正量D(λ)を決定し、決定した修正量D(λ)を用いて目標雑音スペクトルR(λ,k)のゲイン修正を行う。さらにゲイン修正した目標雑音スペクトルRADJ(λ,k)と入力信号のパワースペクトルY(λ,k)とに基づいて抑圧量制限係数Gfloor(λ,k)を計算する。
パワー計算部71は、目標雑音スペクトル生成部6から目標雑音スペクトルR(λ,k)、雑音スペクトル推定部5から入力された推定雑音スペクトルN(λ,k)が入力されると(ステップST31)、以下の式(15)に基づいて、目標雑音スペクトルR(λ,k)のパワーPOWR(λ)を計算し(ステップST32)、また、推定雑音スペクトルN(λ,k)のパワーPOWN(λ)を計算する(ステップST33)。計算されたパワーPOWR(λ),POWN(λ)は、係数補正部72に出力される。
式(15)において、POWR(λ)は現フレームの目標雑音スペクトルR(λ,k)のパワー、POWN(λ)は現フレームの推定雑音スペクトルN(λ,k)のパワーであり、また、N=128である。
式(16)において、DUPおよびDDOWNは所定の定数であり、この実施の形態1ではDUP=1.05,DDOWN=0.95がそれぞれ好適であるが、雑音の種類および雑音レベルに応じて適宜変更することが可能である。また、DUP,DDOWNの値はそれぞれ1種類だけに限らず、複数個用いて修正量D(λ)を決定するように構成してもよい。例えば、上式(16)ではパワーの大小比較だけで修正量D(λ)を決定しているが、パワーの差が所定の閾値より大きい(または小さい)場合に、DUP=1.2(または小さい場合にDDOWN=0.8)として、より大きな修正量D(λ)を設定するように構成してもよい。このように、パワーの差によって修正量D(λ)の値を変更することで、修正誤差をより小さくすると共に、修正速度を速くすることができる。
式(18)において、GMAXは最小抑圧ゲイン量、即ち、この雑音抑圧装置100の「最小」の抑圧量となる1以下の所定の定数、GMINは前述した最大抑圧ゲイン量、即ち、この雑音抑圧装置の「最大」の抑圧量となる1以下の所定の定数である。また、βは所定の平滑化係数を表し、β=0.1が好適である。
図8(a),(b)において、スペクトルN1,N2は推定雑音スペクトルを示し、スペクトルRADJ1,RADJ2は目標雑音スペクトルを示し、スペクトルS1,S2はこの実施の形態1による残留雑音スペクトル、即ち音声信号スペクトルを示している。図8(a)および図8(b)共に、得られた残留雑音スペクトルS1,S2は、目標雑音スペクトルRADJ1,RADJ2に対して雑音の過度な抑圧や抑圧不足である帯域が生じていない。特に従来技術で説明を行った領域Cで示した帯域および領域Dで示した帯域においてもスペクトルの過度な抑圧や抑圧不足などが生じていないのが分かる。これは、例えば車両の走行速度を例に説明すると、目標雑音スペクトル選択部62において、目標雑音スペクトルメモリ63を参照し、車両の走行速度などのノイズ条件に応じた目標雑音スペクトルを選択するように構成したので、推定雑音スペクトルN1,N2の過度な抑制や抑圧不足を抑制することができたためである。
上述した実施の形態1では、目標雑音スペクトル生成部6において推定雑音スペクトルのパワーに基づいて目標雑音スペクトルを生成する場合を示したが、この実施の形態2では推定雑音スペクトルのパワーに加えて推定雑音スペクトルの周波数特性も合わせて用いて目標雑音スペクトルを生成する構成を示す。
目標雑音スペクトルメモリ63aは、雑音パワーのパタンで分類された1以上の周波数形状の目標雑音スペクトルに加えて、推定雑音スペクトルの周波数特性のパタンで分類された1以上の周波数形状の目標雑音スペクトルを蓄積している。周波数特性分析部64は、目標雑音スペクトルメモリ63aに蓄積された目標雑音スペクトルの雑音パワーPRS(m)と、推定雑音スペクトルの雑音パワーPN(λ)を用いて推定雑音スペクトルN(λ,k)の正規化を行い、正規化推定雑音スペクトルと目標雑音スペクトルの二乗誤差DN(λ,m)を算出する。目標雑音スペクトル選択部62aは、目標雑音スペクトルメモリ63aを参照し、周波数特性分析部64が算出した二乗誤差DN(λ,m)を用いて目標雑音スペクトルR(λ,k)を選択する。
図10は、実施の形態2に係る雑音抑圧装置100の目標雑音スペクトル生成部6aの動作を示すフローチャートである。なお、以下では実施の形態1に係る雑音抑圧装置100の目標雑音スペクトル生成部6と同一のステップには図5で使用した符号と同一の符号を付し、説明を省略または簡略化する。
雑音パワー計算部61が入力信号スペクトル中の雑音パワーPN(λ)を計算すると(ステップST22)、周波数特性分析部64は、目標雑音スペクトルメモリ63aに蓄積された目標雑音スペクトルの雑音パワーPRS(m)と、ステップST22で計算された雑音パワーPN(λ)を用いて、推定雑音スペクトルN(λ,k)の正規化を行い(ステップST41)、以下の式(20)を用いて、目標雑音スペクトルと正規化推定雑音スペクトルとの二乗誤差DN(λ,m)を算出する(ステップST42)。算出された二乗誤差DN(λ,m)は、目標雑音スペクトル選択部62aに出力される。
式(20)において、mは図4で示した目標雑音スペクトルRsm(k)を指定するための番号である。
上述した実施の形態2では、目標雑音スペクトル選択部62aにおいて二乗誤差DN(λ,m)の値が最も小さくなる目標雑音スペクトルを選択する構成を示したが、この実施の形態3では、複数の目標雑音スペクトルから1つの目標雑音スペクトルを合成して出力する構成を示す。
目標雑音スペクトル選択部62bは、目標雑音スペクトルメモリ63aを参照し、周波数特性分析部64が算出した二乗誤差DN(λ,m)を用いて複数の目標雑音スペクトルR(λ,k)を選択する。複数とは、例えば、二乗誤差DN(λ,m)の値が小さいものの上位2つの目標雑音スペクトルR(λ,k)を選択するなどである。重み付き平均処理部65は、目標雑音スペクトル選択部62bが選択した複数の目標雑音スペクトルR(λ,k)に対して重み付き平均処理を行い、平均化された1つの目標雑音スペクトルを得る。
周波数特性分析部64が目標雑音スペクトルと正規化推定雑音スペクトルとの二乗誤差DN(λ,m)を算出すると(ステップST42)、目標雑音スペクトル選択部62bは、当該二乗誤差DN(λ,m)を入力とし、例えば、二乗誤差DN(λ,m)の値が小さいものの上位2つの目標雑音スペクトルを目標雑音スペクトルメモリ63aから選択する(ステップST51)。重み付き平均処理部65は、次の式(21)を用いて目標雑音スペクトル選択部62bが選択した2つの目標雑音スペクトルの重み付き平均処理を行い、平均化された1つの目標雑音スペクトルRSYN(λ,k)を得る(ステップST52)。平均化された目標雑音スペクトルRSYN(λ,k)は、抑圧量制限係数計算部7に出力される。
上述した実施の形態1から実施の形態3では、入力信号から推定した雑音スペクトルを用いて目標雑音スペクトルを生成する目標雑音スペクトル生成部6,6a,6bを示したが、この実施の形態4では入力信号以外の外部情報を用いて目標雑音スペクトルを生成する構成を示す。
[参考文献2]
S.F.Boll,“Suppression of Acoustic Noise in Speech Using Spectral Subtraction”(IEEE Trans.on ASSP,Vol.27,No.2,pp.113−120,Apr.1979)
さらに、図8で示した例では雑音抑圧対象が狭帯域電話音声(0〜4000Hz)である場合を想定して説明を行ったが、雑音抑圧対象は狭帯域電話音声に限定されるものではなく、例えば0〜8000Hzの広帯域電話音声および音響信号に対しても適用可能である。
Claims (6)
- 入力信号を時間領域から周波数領域へ変換したスペクトル成分と、前記入力信号から推定した推定雑音スペクトルとを用いて、前記入力信号に含まれた雑音を抑圧するためのスペクトル抑圧量を算出し、算出したスペクトル抑圧量を用いて前記入力信号のスペクトル成分を振幅抑圧し、当該振幅抑圧したスペクトル成分を時間領域に変更して雑音抑圧信号を生成する雑音抑圧装置において、
前記入力信号に関連する情報を用いて、あらかじめ生成された複数の周波数形状に対応した雑音スペクトルである目標雑音スペクトル候補から、目標雑音スペクトルを生成する目標雑音スペクトル生成部と、
前記目標雑音スペクトル生成部が生成した目標雑音スペクトルに基づいて、前記入力信号に含まれた雑音の抑圧量の上下限を規定する抑圧量制限係数を計算する抑圧量制限係数計算部と、
前記抑圧量制限係数計算部が計算した抑圧量制限係数を用いて、前記スペクトル抑圧量を計算する抑圧量計算部とを備え、
前記目標雑音スペクトル生成部は、
前記推定雑音スペクトルの雑音パワーを計算する雑音パワー計算部と、
前記雑音パワー計算部が計算した前記雑音パワーを用いて、前記複数の目標雑音スペクトル候補から目標雑音スペクトルを選択する目標雑音スペクトル選択部と、
前記目標雑音スペクトル選択部が選択した複数の目標雑音スペクトルの重みつき平均を求め、平均化された目標雑音スペクトルを取得する重み付き平均処理部とを備えたことを特徴とする雑音抑圧装置。 - 入力信号を時間領域から周波数領域へ変換したスペクトル成分と、前記入力信号から推定した推定雑音スペクトルとを用いて、前記入力信号に含まれた雑音を抑圧するためのスペクトル抑圧量を算出し、算出したスペクトル抑圧量を用いて前記入力信号のスペクトル成分を振幅抑圧し、当該振幅抑圧したスペクトル成分を時間領域に変更して雑音抑圧信号を生成する雑音抑圧装置において、
前記入力信号に関連する情報を用いて、あらかじめ生成された複数の周波数形状に対応した雑音スペクトルである目標雑音スペクトル候補から、目標雑音スペクトルを生成する目標雑音スペクトル生成部と、
前記目標雑音スペクトル生成部が生成した目標雑音スペクトルに基づいて、前記入力信号に含まれた雑音の抑圧量の上下限を規定する抑圧量制限係数を計算する抑圧量制限係数計算部と、
前記抑圧量制限係数計算部が計算した抑圧量制限係数を用いて、前記スペクトル抑圧量を計算する抑圧量計算部とを備え、
前記目標雑音スペクトル生成部は、
前記推定雑音スペクトルの雑音パワーを計算する雑音パワー計算部と、
前記雑音パワー計算部が計算した雑音パワーを用いて、前記推定雑音スペクトルの周波数特性を分析する周波数特性分析部と、
前記周波数特性分析部が分析した前記推定雑音スペクトルの周波数特性を用いて、前記複数の目標雑音スペクトル候補から目標雑音スペクトルを選択する目標雑音スペクトル選択部と、
前記目標雑音スペクトル選択部が選択した複数の目標雑音スペクトルの重みつき平均を求め、平均化された目標雑音スペクトルを取得する重み付き平均処理部とを備えたことを特徴とする雑音抑圧装置。 - 入力信号を時間領域から周波数領域へ変換したスペクトル成分と、前記入力信号から推定した推定雑音スペクトルとを用いて、前記入力信号に含まれた雑音を抑圧するためのスペクトル抑圧量を算出し、算出したスペクトル抑圧量を用いて前記入力信号のスペクトル成分を振幅抑圧し、当該振幅抑圧したスペクトル成分を時間領域に変更して雑音抑圧信号を生成する雑音抑圧方法において、
雑音パワー計算部が、前記推定雑音スペクトルの雑音パワーを計算する雑音パワー計算ステップと、
目標雑音スペクトル選択部が、前記雑音パワーを用いて、あらかじめ生成された複数の周波数形状に対応した雑音スペクトルである目標雑音スペクトル候補から目標雑音スペクトルを選択する目標雑音スペクトル選択ステップと、
重み付き平均処理部が、前記選択された複数の目標雑音スペクトルの重みつき平均を求め、平均化された目標雑音スペクトルを取得する重み付き平均処理ステップと、
抑圧量制限係数計算部が、前記目標雑音スペクトルに基づいて、前記入力信号に含まれた雑音の抑圧量の上下限を規定する抑圧量制限係数を計算する抑圧量制限係数計算ステップと、
抑圧量計算部が、前記抑圧量制限係数を用いて前記スペクトル抑圧量を計算する抑圧量計算ステップとを備えたことを特徴とする雑音抑圧方法。 - 入力信号を時間領域から周波数領域へ変換したスペクトル成分と、前記入力信号から推定した推定雑音スペクトルとを用いて、前記入力信号に含まれた雑音を抑圧するためのスペクトル抑圧量を算出し、算出したスペクトル抑圧量を用いて前記入力信号のスペクトル成分を振幅抑圧し、当該振幅抑圧したスペクトル成分を時間領域に変更して雑音抑圧信号を生成する雑音抑圧方法において、
雑音パワー計算部が、前記推定雑音スペクトルの雑音パワーを計算する雑音パワー計算部ステップと、
周波数特性分析部が、前記雑音パワーを用いて、前記推定雑音スペクトルの周波数特性を分析する周波数特性分析ステップと、
目標雑音スペクトル選択部が、前記推定雑音スペクトルの周波数特性を用いて、あらかじめ生成された複数の周波数形状に対応した雑音スペクトルである目標雑音スペクトル候補から目標雑音スペクトルを選択する目標雑音スペクトル選択ステップと、
重み付き平均処理部が、前記選択された複数の目標雑音スペクトルの重みつき平均を求め、平均化された目標雑音スペクトルを取得する重み付き平均処理ステップと、
抑圧量制限係数計算部が、前記目標雑音スペクトルに基づいて、前記入力信号に含まれた雑音の抑圧量の上下限を規定する抑圧量制限係数を計算する抑圧量制限係数計算ステップと、
抑圧量計算部が、前記抑圧量制限係数を用いて前記スペクトル抑圧量を計算する抑圧量計算ステップとを備えたことを特徴とする雑音抑圧方法。 - 入力信号を時間領域から周波数領域へ変換したスペクトル成分と、前記入力信号から推定した推定雑音スペクトルとを用いて、前記入力信号に含まれた雑音を抑圧するためのスペクトル抑圧量を算出する手順と、算出したスペクトル抑圧量を用いて前記入力信号のスペクトル成分を振幅抑圧する手順と、当該振幅抑圧したスペクトル成分を時間領域に変更して雑音抑圧信号を生成する手順とをコンピュータに実行させるための雑音抑圧プログラムにおいて、
前記推定雑音スペクトルの雑音パワーを計算する雑音パワー計算手順と、
前記雑音パワー計算手順により計算された前記雑音パワーを用いて、あらかじめ生成された複数の周波数形状に対応した雑音スペクトルである目標雑音スペクトル候補から目標雑音スペクトルを選択する目標雑音スペクトル選択手順と、
前記目標雑音スペクトル選択手順により選択された前記複数の目標雑音スペクトルの重みつき平均を求め、平均化された目標雑音スペクトルを取得する重み付き平均処理手順と、
前記重み付き平均処理手順により取得された前記目標雑音スペクトルに基づいて、前記入力信号に含まれた雑音の抑圧量の上下限を規定する抑圧量制限係数を計算する抑圧量制限係数計算手順と、
前記抑圧量制限係数計算手順により計算された前記抑圧量制限係数を用いて前記スペクトル抑圧量を計算する抑圧量計算手順とから構成されていることを特徴とする雑音抑圧プログラム。 - 入力信号を時間領域から周波数領域へ変換したスペクトル成分と、前記入力信号から推定した推定雑音スペクトルとを用いて、前記入力信号に含まれた雑音を抑圧するためのスペクトル抑圧量を算出する手順と、算出したスペクトル抑圧量を用いて前記入力信号のスペクトル成分を振幅抑圧する手順と、当該振幅抑圧したスペクトル成分を時間領域に変更して雑音抑圧信号を生成する手順とをコンピュータに実行させるための雑音抑圧プログラムにおいて、
前記推定雑音スペクトルの雑音パワーを計算する雑音パワー計算手順と、
前記雑音パワー計算手順により計算された前記雑音パワーを用いて、前記推定雑音スペクトルの周波数特性を分析する周波数特性分析手順と、
前記周波数特性分析手順により分析された前記推定雑音スペクトルの周波数特性を用いて、あらかじめ生成された複数の周波数形状に対応した雑音スペクトルである目標雑音スペクトル候補から目標雑音スペクトルを選択する目標雑音スペクトル選択手順と、
前記目標雑音スペクトル選択手順により選択された前記複数の目標雑音スペクトルの重みつき平均を求め、平均化された目標雑音スペクトルを取得する重み付き平均処理手順と、
前記重み付き平均処理手順により取得された前記目標雑音スペクトルに基づいて、前記入力信号に含まれた雑音の抑圧量の上下限を規定する抑圧量制限係数を計算する抑圧量制限係数計算手順と、
前記抑圧量制限係数計算手順により計算された前記抑圧量制限係数を用いて前記スペクトル抑圧量を計算する抑圧量計算手順とから構成されていることを特徴とする雑音抑圧プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/073969 WO2016038704A1 (ja) | 2014-09-10 | 2014-09-10 | 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016038704A1 JPWO2016038704A1 (ja) | 2017-04-27 |
JP6261749B2 true JP6261749B2 (ja) | 2018-01-17 |
Family
ID=55458492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016547306A Active JP6261749B2 (ja) | 2014-09-10 | 2014-09-10 | 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6261749B2 (ja) |
WO (1) | WO2016038704A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019241608A1 (en) | 2018-06-14 | 2019-12-19 | Pindrop Security, Inc. | Deep neural network based speech enhancement |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3452443B2 (ja) * | 1996-03-25 | 2003-09-29 | 三菱電機株式会社 | 騒音下音声認識装置及び騒音下音声認識方法 |
JP5526524B2 (ja) * | 2008-10-24 | 2014-06-18 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5569291B2 (ja) * | 2010-09-17 | 2014-08-13 | 大日本印刷株式会社 | 騒音源の快音化方法および快音化装置 |
JP6004792B2 (ja) * | 2011-07-06 | 2016-10-12 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、及び音響処理プログラム |
JP5875609B2 (ja) * | 2012-02-10 | 2016-03-02 | 三菱電機株式会社 | 雑音抑圧装置 |
-
2014
- 2014-09-10 WO PCT/JP2014/073969 patent/WO2016038704A1/ja active Application Filing
- 2014-09-10 JP JP2016547306A patent/JP6261749B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2016038704A1 (ja) | 2017-04-27 |
WO2016038704A1 (ja) | 2016-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5265056B2 (ja) | 雑音抑圧装置 | |
JP5183828B2 (ja) | 雑音抑圧装置 | |
JP5646077B2 (ja) | 雑音抑圧装置 | |
JP5875609B2 (ja) | 雑音抑圧装置 | |
JP3574123B2 (ja) | 雑音抑圧装置 | |
KR102487160B1 (ko) | 정량적 신호 대 노이즈비 분석 및 적응형 위너 필터링에 기초한 오디오 신호 품질 향상 방법 | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
JP4753821B2 (ja) | 音信号補正方法、音信号補正装置及びコンピュータプログラム | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP5245714B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP2002508891A (ja) | 特に補聴器における雑音を低減する装置および方法 | |
EP3074975A1 (en) | Method of operating a hearing aid system and a hearing aid system | |
JP5526524B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JPH10254499A (ja) | 帯域分割型雑音低減方法及び装置 | |
JP6261749B2 (ja) | 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム | |
US11984132B2 (en) | Noise suppression device, noise suppression method, and storage medium storing noise suppression program | |
JP5131149B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP4479625B2 (ja) | 騒音抑圧装置 | |
JP2003517761A (ja) | 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6261749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |