JP4123835B2 - Noise suppression device and noise suppression method - Google Patents
Noise suppression device and noise suppression method Download PDFInfo
- Publication number
- JP4123835B2 JP4123835B2 JP2002172315A JP2002172315A JP4123835B2 JP 4123835 B2 JP4123835 B2 JP 4123835B2 JP 2002172315 A JP2002172315 A JP 2002172315A JP 2002172315 A JP2002172315 A JP 2002172315A JP 4123835 B2 JP4123835 B2 JP 4123835B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- speech
- filter
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、スペクトル分析を行って音声信号に含まれる雑音の低減を行う雑音抑圧装置および雑音抑圧方法に関するものである。
【0002】
【従来の技術】
電話機で通話している時に音声信号に雑音が混入すると、例え雑音のレベルが小さくて音声情報の伝達には問題がなくても、人間にとって耳障りで精神的な負担を与える場合が多い。また雑音のレベルが大きい場合には、聞き取りに困難を生じてしまう。また、人間ではなく機械が言葉を認識する音声認識装置においても、音声に雑音が混入すると認識精度が著しく低下する事が知られている。
【0003】
このような理由から、音声信号の雑音除去は従来から色々な方法が提案されており、なかでもスペクトル減算法は少ない演算量で効果が高く、1入力の音声でも実行可能な、非常に有効な手法として知られている。スペクトル減算方式については、Boll、"Suppression of Acoustic Noise in Speech Using Spectral Subtruction"、IEEE Trans. on Acoustics、speech and Signal processing、Vol.Assp-27、No.2、April 1979、pp.113-120を初めとして多くの研究成果が発表されている。この手法は入力音声の短時間スペクトルから推定雑音スペクトルを差し引くことで雑音成分の除去をおこなう。
【0004】
また特開平8−221092号公報には、入力信号を一定間隔毎に切り出すフレーム分割手段と、音声区間の検出をおこなう手段と、フレーム信号の短時間スペクトルを求める手段と、雑音スペクトルを推定する手段とを有し、雑音スペクトル推定手段で推定した雑音スペクトルにスペクトル減算係数をかけて短時間スペクトルから減算する雑音除去システムが開示されている。また、スペクトル減算係数の値をフレーム毎に変更可能にし、音声中のポーズ区間や摩擦子音の部分のように音声のパワが小さいところではサブトラクシヨン係数を小さくすることによつて推定騒音スペクトルの引き過ぎによつてよつて生じる入力音声スペクトルの歪みを押さえるものである。
【0005】
また特開2001−228892号公報に開示されているノイズ除去装置は、入力信号更新部にて入力音声データの周波数成分を積算し、ノイズ更新部では音声区間を除く部分のノイズの周波数成分を積算し、さらに過推定係数算出部では過推定係数を求め、入力音声データからノイズを除去した真の音声の周波数成分を求めるというものであります。
【0006】
【発明が解決しようとする課題】
しかしながら、上述したようなスペクトル減算法による雑音抑圧処理を単純に適用すると、S/N比は大きく改善されるにもかかわらず、聴感的にはかえって音質が劣化してしまうことが少なくない。特に参照信号の無い1入力の音声に適用した場合にそれは顕著になる。その主な原因は、ミュージカルノイズと呼ばれる不自然な雑音成分が処理音声中に形成されることにある。
【0007】
このミュージカルノイズが発生する原因は、該当フレームの短時間スペクトルのみでスペクトル引き算を行うと、雑音スペクトルの推定誤差のために雑音の引き残し信号がフレーム毎に時間的・周波数的不連続な領域で発生してしまうことにある。人間は、このような雑音を連続的な雑音よりもかえって耳障りに感じる場合がある。
【0008】
また、スペクトル減算法で音質が劣化するもう1つの要因として、音声から雑音スペクトルが過剰に減算された場合にスペクトル歪が発生し、音声信号が変質してしまう事が知られている。
【0009】
従来、ミュージカルノイズへの対策としては、入力音声のスペクトルに対して推定雑音スペクトルにある倍率をかけたスペクトルを引く方法がある。この倍率は減算係数と呼ばれ、この減算係数を1より大きい値に設定すると、スペクトルが実際の雑音よりも常に過剰に減算され、結果的にミュージカルノイズを削減できる。しかし、同時に音声信号成分までも減算されるため、スペクトル歪みが増大してしまう。逆に、減算係数を1より小さい値に設定すると、スペクトルが実際の雑音よりも常に小さく減算されるため、音声スペクトルに加減算による歪が発生しにくくなる。しかし、同時に雑音スペクトルが十分に減算されないため、SNRの改善効果が少なくなる。
【0010】
本発明は上記従来の問題点を解決する雑音抑圧装置または方法を提供することを目的とするものである。本発明は減算係数を利用せず、スペクトル減算法によるミュージカルノイズの発生を比較的少ない演算量で抑圧し、特に聴感上のSNRを向上させることを目的としている。
【0011】
【課題を解決するための手段】
本発明は上記従来の課題を解決するために、入力信号の音声区間と非音声区間を判別する音声区間判定部と、非音声区間において信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とを設けたものである。
【0012】
このようにして本発明は、音声信号の雑音除去処理において、従来スペクトル減算法の欠点であったミュージカルノイズの形成を抑圧し、同時にスペクトル歪の増加を避ける事により、聴感的に良好な雑音除去効果を得ることが可能である。
【0013】
【発明の実施の形態】
上記目的を達成するために、本発明の請求項1による音声雑音抑圧装置は、入力信号を一定間隔毎に切り出すフレーム分割部と、フレーム分割された信号のスペクトルを算出するスペクトル算出部と、入力信号の音声区間と非音声区間を判別する音声区間判定部と、音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、入力信号スペクトルにフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部から構成される。
【0014】
これら構成により、入力信号スペクトルのフレーム間変動がスムージングされたスペクトル減算フィルタを算出し、それを用いてスペクトル減算する事で、残留雑音のフレーム間不連続性が改善されるため、聴感的なSNRが向上する効果がある。一方、入力スペクトルの時間平均化の副作用として、音声信号の立ち上がりなど時間変動が大きい区間では加減算によるスペクトル歪が増大する可能性があるが、これに対しては音声区間では非音声区間よりも短い時間幅で入力信号スペクトルを平均化する事により時間応答性を高め、歪の増加を抑制している。また、音声区間判定は従来のスペクトル減算法に含まれ、時間平均はフレーム毎の再帰計算で簡単に求められるので、基本的なスペクトル減算法からの演算量の増加分が小さい事も特徴である。
【0017】
また請求項2の雑音抑圧装置では、減算フィルタ平均部はスペクトル減算フィルタの数フレーム分の時間平均値を、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして算出するようにした。
【0018】
この構成により、スペクトル減算フィルタのフレーム間変動をスムージングしたうえで、短時間スペクトルから減算する事で、残留雑音の不連続性が減少して白色化するため、聴感的なSNRが向上する効果がある。一方、減算フィルタの時間平均化によって音声信号の立ち上がりなど時間変動が大きい区間で加減算によるスペクトル歪が増大する副作用が生じるが、これに対しては音声区間では非音声区間よりも適応的に短い時間幅で減算フィルタを平均化する事で時間応答性を高め、歪の増加を抑制している。
【0019】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0020】
(実施の形態1)
図1は本発明の実施の形態1による雑音抑圧装置のブロック構成図である。まず、図1を用いて、雑音抑圧装置のブロック構成について説明する。この雑音抑圧装置において、フレーム分割部1は、入力信号を所定の長さのフレーム単位に分割する。スペクトル算出部2は、フレーム分割部1によってフレーム分割された音声信号をフーリエ変換(FFT)することによりスペクトル成分を分析してスペクトル情報を出力する。音声区間判定部3は、該フレームが音声区間(音声+雑音信号)であるか非音声区間(雑音信号のみ)であるかをそのエネルギーレベルに基づいて判別し、例えばフラグ等の判別情報を付加する。
【0021】
雑音スペクトル推定部4はスペクトル算出部2より出力されるスペクトル情報を基に雑音スペクトルを推定する。この際、雑音スペクトル推定部4は音声区間判定部3に於いて非音声区間と判定されたフレームのみを対象に過去数フレームのスペクトルを時間平均化することで雑音スペクトルを推定・更新し続ける。
【0022】
平均スペクトル算出部5は、スペクトル算出部2よりフレーム単位で出力されるスペクトル情報の時間平均を算出する。その際、平均スペクトル算出部5は該フレームが音声区間か否かに関係なくスペクトルの時間平均を算出するが、音声区間判定部3の判定結果が音声区間であれば非音声区間よりも少ない過去フレーム数で時間平均する。
【0023】
減算フィルタ算出部6は、上記雑音スペクトル推定部4により推定された雑音スペクトルと平均スペクトル算出部5の平均スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。スペクトル減算部7は、該フレームのスペクトルに前記スペクトル減算フィルタを適用する事で雑音スペクトルの減算を実現する。波形算出部8は、このスペクトル減算部7の出力を逆フーリエ変換(IFFT)する事で時間領域の波形数値を算出する。波形合成部9は、この波形算出部8の出力波形を加算して合成し出力する。
【0024】
次に、図6のフローチャートを用いて、上述したような雑音抑圧装置の動作、またはコンピュータで実行される同雑音抑圧方法の処理プログラムの制御内容を説明する。
【0025】
ステップS1:動作がスタートすると、フレーム分割部1は、入力された信号を所定の長さのフレーム間隔に切り出す。
【0026】
ステップS2:次に、後段でフーリエ分析する際に必要な周波数分解精度が得られるようにフレーム信号に対して窓かけ処理を行う。このときフレームはオーバラップするように処理が行われる。これは、さらに後段の合成処理で合成して接続したときに、フレーム境界で不連続な波形になるのを防止するためである。窓関数としては、例えば次の(数1)に示すようなハニング窓を用いる。
【0027】
【数1】
【0028】
ここに、Lは1フレームあたりのサンプル数、nはフレーム内におけるサンプルの位置を表しており、すなわち、n=(0,1,…,L−1)である。
【0029】
ステップS3:その後、スペクトル算出部2において、フレーム信号に対してフーリエ変換(FFT)を行うことにより、スペクトル成分を分析してスペクトル情報を出力する。以降のステップで使用するために、このスペクトル情報は過去数フレームにわたりメモリに蓄積されるものとする。
【0030】
ステップS4:続いて、該フレームについて、音声区間判定部3により音声/非音声の判別処理を行う。この判別処理の方法については、従来より各種の提案がなされているが、例えば以下の方法がある。
【0031】
入力フレームの振幅スペクトルをX(w)、その時点での推定雑音スペクトルをN(w)とし、(数2)の条件を満たす場合は其のフレームを非音声(雑音)区間と判定し、満たさない場合は音声区間と判定する。
【0032】
【数2】
【0033】
上式のkの値は入力信号のSNRの程度により最適値が異なるが、地上電話の回線雑音程度のSNRでは3程度で良いようである。ここで、フレーム単位で音声区間の判定するのではなく、スペクトルの各次数(帯域)別に独立して(数2)の比較しても良い。例えば音声区間でも音声の成分が存在しない帯域(有声音区間の高周波領域など)のみ雑音信号と判定する。
【0034】
ステップS5:次に、上記ステップS4の判別結果に基づいて、雑音スペクトル推定部4に於いて、現フレームが音声区間でない場合には、メモリから非音声フレームの過去数フレームの振幅スペクトルを読み出して、これらと現フレームの振幅スペクトルとから平均振幅スペクトルを計算し、その平均振幅スペクトルを推定雑音スペクトルとする。この平均のフレーム数は、例えば8kHzサンプリングで1フレーム幅が128ポイントであって64ポイントの重複がある場合を家庭すると、10フレーム程度が良い(以下も、この分析条件を仮定する)。
【0035】
ここで、ステップ4で述べたように、音声/非音声区間を帯域別に判定し、雑音スペクトルの算出も過去数フレームの非音声帯域について平均化しても良い。この場合、音声区間であっても音声信号が存在しない帯域については雑音スペクトルの更新が継続できるので、推定の精度が向上する。
【0036】
ステップS6:続いて、平均スペクトル算出部5に於いて、メモリから過去数フレームの振幅スペクトルを読み出して、これらと現フレームの振幅スペクトルとから平均振幅スペクトルX’(w)を計算する。この平均のフレーム数は、ステップS4の判別結果に基づいて、現フレームが非音声区間の場合をA個、現フレームが音声区間の場合をB個とすると、A:B=2:1程度の比率に設定する。例えばステップS5で述べた分析条件では、A=6、B=3程度のフレーム数が良い。過去フレームには音声区間と非音声区間が混在する場合もあるが、そのまま平均振幅スペクトルを算出して良い。
【0037】
このように平均スペクトルを算出する際に音声・非音声区間で時間幅(平均するフレーム数)を切り替えることにより、非音声区間では時間的な応答速度を遅くすることにつながり、残留雑音のフレーム間の不連続さを抑制し、音声区間では時間的な応答速度を高くする事で可減算等による歪の発生を防ぐことができる。
【0038】
ステップS7:こうして算出された、現フレームにおける推定雑音スペクトルN(w)と平均振幅スペクトルX'(w)の両方を用いて、減算フィルタ算出部6において、次の(数3)に従って現フレームのスペクトル減算フィルタH(w)を算出する。
【0039】
【数3】
【0040】
ここで、H(w)の下限値を0としているが、例えば加減算を許して負の値に設定したり、逆に0より大きな値に設定することで、スペクトル減算処理の全体的な強度を制御することが出来る。
【0041】
ステップS8:その後、スペクトル減算部7において、スペクトル算出部2の出力する現フレームの振幅スペクトルに上記減算フィルタ算出部6の出力するスペクトル減算フィルタH(w)を(数4)のとおり適用することで、推定雑音スペクトルの減算を行う。
【0042】
【数4】
【0043】
S(w)はスペクトル減算処理により雑音が抑圧された、音声信号の振幅スペクトルである。
【0044】
ステップS9:スペクトル減算部7の出力を波形算出部8において逆フーリエ変換(IFFT)し、フレーム単位の波形信号を得る。
【0045】
ステップS10:さらに波形合成部9において、フレーム単位の波形を順次重複しつつ加算する事により連続的な音声波形を合成して、終了する。
【0046】
なお、コンピュータで実行される場合には以上のフローチャートで示した雑音抑圧方法に従って処理プログラムを作成する。
【0047】
以上のような実施の形態によれば、スペクトル減算法による残留雑音が抑制され、特にミュージカルノイズと呼ばれるフレーム間不連続で耳障りな種類の残留雑音が、フレーム間連続で耳障りでない雑音へとある程度質的に変化するため、聴感的なSNRが一層向上する効果が得られる。
【0048】
こうして、簡単な構成や処理により、S/N比を改善するとともに聴感的な音質を向上することができる。
【0049】
(実施の形態2)
図2は本発明の実施の形態2における雑音抑圧装置のブロック構成図である。図2のブロック構成において、フレーム分割部21は、入力信号を一定間隔毎に切り出す。スペクトル算出部22は、フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出する。音声区間判定部23は、雑音を含む音声区間と雑音のみの区間との境界を検出する。雑音スペクトル推定部24は、音声区間判定部23により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する。
【0050】
減算フィルタ算出部25は、雑音スペクトル推定部24からの雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。
【0051】
減算フィルタ平均部26は、減算フィルタ算出部25により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を固定の時間幅で算出する。スペクトル減算部27は、入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算する。波形算出部28は、スペクトル減算部27の出力を逆フーリエ変換(IFFT)する事で時間領域の波形数値を算出する。波形合成部29は波形算出部28の出力波形を加算して合成し出力する。
【0052】
本実施の形態ではスペクトル減算フィルタを時間平均化するが、時間平均のフレーム数を固定することで、音声歪の影響が少ない使用状況における演算量を削減している。
【0053】
(実施の形態3)
図3は本発明の実施の形態3の雑音抑圧装置のブロック構成図であり、図7は同実施の形態3の雑音抑圧方式の制御を示すフローチャートである。本実施の形態では振幅スペクトルを平均化するのではなく、図3のブロック構成と図7のフローチャートに示すようにスペクトル減算フィルタを時間平均化する。
【0054】
図3において、フレーム分割部11は、入力信号を一定間隔毎に切り出す。スペクトル算出部12は、フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出する。音声区間判定部13は、雑音を含む音声区間と雑音のみの区間との境界を検出する。雑音スペクトル推定部14は、音声区間判定部13により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する。
【0055】
減算フィルタ算出部15は、雑音スペクトル推定部14からの雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。
【0056】
減算フィルタ平均部16は減算フィルタ算出部15により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を算出する。その際、減算フィルタ平均部16は非音声区間は長い時間幅で、音声区間は短い時間幅で適応的に平均値を算出する。スペクトル減算部17は、入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算する。
【0057】
波形算出部18は、スペクトル減算部17の出力を逆フーリエ変換(IFFT)する事で時間領域の波形数値を算出する。波形合成部19は波形算出部18の出力波形を加算して合成し出力する。
【0058】
本実施の形態ではスペクトル減算フィルタを時間平均化することにより、フレーム間で減算フィルタ形状が変動して残留雑音が不連続に成る事を抑制する。時間平均のフレーム数は実施の形態1と同様に音声/非音声区間で切り替えることで、この処理による音声歪の増加を避けている。
【0059】
(実施の形態4)
図4は、音声通信装置の受話音声に本雑音除去方式を適用した実施の形態のブロック構成を示す。すなわち、音声通信装置に前実施の形態1〜3いずれかの雑音抑圧装置を内蔵する事により雑音の少ない明瞭な受話音声が得られ、送話音声に適用する事により通話相手に明瞭な音声を送信することが可能になる。
【0060】
なお、前実施の形態1〜3いずれかの雑音抑圧装置を音声録音/再生装置に内蔵し、録音の前処理または再生の後処理として実行することで、雑音除去の効果が得られる。また、音声認識装置の前処理として入力音声に適用することで、雑音下の音声認識精度の向上が期待できる。
【0061】
実際の音声信号による本発明の効果の例を図10に示す。図10は本発明による雑音抑圧方式の効果の例を示す波形およびスペクトログラムを示す。なお、図8は雑音抑圧処理を施さない入力信号の波形およびスペクトログラムを示す。また図9は従来のスペクトル減算法による波形およびスペクトログラムを示す。白色系の雑音が混入した音声信号に対し、従来のスペクトル減算法の例(推定雑音スペクトルと現フレームのスペクトルのみから減算フィルタを算出した。)では、SNRは改善されるものの、残留雑音のスペクトルが部分的に不連続なので耳障りに感じられる。一方、本発明の雑音抑圧方法を入力音声に適用すると、同様にSNRが改善されるが、残留雑音のスペクトルが連続的なので従来方法よりも耳障りに感じられない効果がある。
【0062】
なお、本発明は上述した各実施の形態に限定されるものではなく、発明の主旨を逸脱しない範囲内において種々の変形や応用が可能であることは勿論である。本発明の用途は図4に示すように音声通信機器に内蔵する場合の他に、図5に示すように音声録音/再生装置に内蔵し、録音の前処理または再生の後処理として実行することで、雑音除去の効果が得られる。また図5に示すように、音声認識装置の前処理として入力音声に適用することで、雑音下の音声認識精度の向上が期待できる。
【0063】
【発明の効果】
本発明は、雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、この音声区間判定部により判定された非音声区間において信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間判定部の区間判定結果を参考に、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして入力信号スペクトルの時間平均値を適応的に算出する平均スペクトル算出部と、前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部とを設けた構成により、残留雑音のフレーム間不連続性が改善され、不連続な残留雑音を削減して聴感的なSNRが向上する効果がある。
【図面の簡単な説明】
【図1】本発明の実施の形態1の雑音抑圧装置のブロック構成図
【図2】本発明の実施の形態2の雑音抑圧装置のブロック構成図
【図3】本発明の実施の形態3の雑音抑圧装置のブロック構成図
【図4】本発明の実施の形態4の音声通信装置のブロック構成図
【図5】本発明による雑音抑圧装置のその他の応用例のブロック構成図
【図6】本発明の実施の形態1の雑音抑圧方式の制御を示すフローチャート
【図7】本発明の実施の形態3の雑音抑圧方式の制御を示すフローチャート
【図8】雑音抑圧処理を施さない入力信号の波形およびスペクトログラムを示す図
【図9】従来のスペクトル減算法による波形およびスペクトログラムを示す図
【図10】本発明による雑音抑圧方式の効果の例を示す波形およびスペクトログラムを示す図
【符号の説明】
1 フレーム分割部
2 スペクトル算出部
3 音声区間判定部
4 雑音スペクトル推定部
5 平均スペクトル算出部
6 減算フィルタ算出部
7 スペクトル減算部
8 波形算出部
9 波形合成部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a noise suppression device and a noise suppression method that perform spectrum analysis to reduce noise contained in a speech signal.
[0002]
[Prior art]
When noise is mixed in a voice signal during a telephone call, even if the noise level is low and there is no problem in the transmission of voice information, it is often harsh and a mental burden for humans. In addition, when the noise level is high, it is difficult to hear. It is also known that in a speech recognition device in which a machine, not a human being, recognizes words, the recognition accuracy is significantly lowered when noise is mixed in the speech.
[0003]
For these reasons, various methods have been proposed to remove noise from speech signals, and the spectral subtraction method is particularly effective with a small amount of computation and can be performed even with a single input speech. Known as a technique. For spectral subtraction, see Boll, “Suppression of Acoustic Noise in Speech Using Spectral Subtruction”, IEEE Trans. On Acoustics, speech and Signal processing, Vol. Assp-27, No. 2, April 1979, pp. 113-120. Many research results have been announced at the beginning. This method removes the noise component by subtracting the estimated noise spectrum from the short-time spectrum of the input speech.
[0004]
Japanese Patent Laid-Open No. 8-221092 discloses frame dividing means for cutting out an input signal at regular intervals, means for detecting a speech section, means for obtaining a short-time spectrum of a frame signal, and means for estimating a noise spectrum. And a noise removal system that subtracts a short-time spectrum by applying a spectral subtraction coefficient to the noise spectrum estimated by the noise spectrum estimation means. In addition, the value of the spectral subtraction coefficient can be changed for each frame, and the estimated noise spectrum can be reduced by reducing the subtraction coefficient when the voice power is low, such as the pause period or frictional consonant part in the voice. It suppresses the distortion of the input speech spectrum caused by excessive pulling.
[0005]
In the noise removing device disclosed in Japanese Patent Laid-Open No. 2001-228892, the input signal update unit integrates the frequency components of the input voice data, and the noise update unit integrates the frequency components of the noise excluding the voice section. In addition, the overestimation coefficient calculator calculates the overestimation coefficient, and finds the frequency component of the true speech with noise removed from the input speech data.
[0006]
[Problems to be solved by the invention]
However, if the noise suppression processing using the spectral subtraction method as described above is simply applied, the sound quality is often degraded rather than perceptually, although the S / N ratio is greatly improved. This is particularly noticeable when applied to one-input audio with no reference signal. The main cause is that an unnatural noise component called musical noise is formed in the processed speech.
[0007]
The cause of this musical noise is that when subtracting the spectrum using only the short-time spectrum of the corresponding frame, the residual signal of the noise is discontinuous in time and frequency for each frame due to the noise spectrum estimation error. It is to occur. Humans may feel such annoying rather than continuous noise.
[0008]
In addition, it is known as another factor that the sound quality is deteriorated by the spectrum subtraction method, when the noise spectrum is excessively subtracted from the sound, spectrum distortion occurs and the sound signal is deteriorated.
[0009]
Conventionally, as a countermeasure against musical noise, there is a method of subtracting a spectrum obtained by multiplying the spectrum of an input voice by a certain factor in the estimated noise spectrum. This magnification is called a subtraction coefficient. If this subtraction coefficient is set to a value larger than 1, the spectrum is always subtracted excessively from the actual noise, and as a result, musical noise can be reduced. However, since the audio signal component is also subtracted at the same time, the spectral distortion increases. Conversely, when the subtraction coefficient is set to a value smaller than 1, the spectrum is always subtracted smaller than the actual noise, so that distortion due to addition and subtraction hardly occurs in the speech spectrum. However, since the noise spectrum is not sufficiently subtracted at the same time, the effect of improving the SNR is reduced.
[0010]
An object of the present invention is to provide a noise suppression apparatus or method that solves the above-described conventional problems. An object of the present invention is to suppress the occurrence of musical noise due to the spectral subtraction method without using a subtraction coefficient, with a relatively small amount of calculation, and in particular, to improve the SNR on hearing.
[0011]
[Means for Solving the Problems]
For the present invention to solve the conventional problems described above, it calculates the speech segment determination section that determines between non-speech Zone and audio section of the input signal, the average value of the past several frames of the signal spectrum in the non-speech section The noise spectrum estimator for estimating the noise spectrum at the input signal spectrum by increasing the number of frames to be averaged when the current frame is a non-speech segment, rather than the number of frames to be averaged when the current frame is a speech segment An average spectrum calculation unit for calculating a time average value of the signal, a subtraction filter calculation unit for calculating a filter shape of spectrum subtraction by comparing the noise spectrum and the average spectrum, and multiplying the input signal spectrum by the filter. A spectrum subtracting unit for subtracting the noise spectrum is provided.
[0012]
In this way, the present invention suppresses the formation of musical noise, which has been a drawback of the conventional spectral subtraction method, in the noise removal processing of an audio signal, and at the same time, avoids an increase in spectral distortion, thereby providing excellent noise removal. An effect can be obtained.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
In order to achieve the above object, a speech noise suppression apparatus according to claim 1 of the present invention includes a frame dividing unit that cuts out an input signal at regular intervals, a spectrum calculating unit that calculates a spectrum of the frame-divided signal, and an input a voice section determining part for determining between the non-speech zone and the speech section of the signal in non-speech section determined by the speech segment determination unit, estimates a noise spectrum in calculating the average value of the past several frames of the signal spectrum The number of frames to be averaged when the current frame is a non-speech interval and the time average value of the input signal spectrum to be larger than the number of frames to be averaged when the current frame is a speech interval. The calculated average spectrum calculation unit compares the noise spectrum with the average spectrum to calculate the filter shape for spectrum subtraction. A filter calculation unit, and a spectrum subtraction unit which subtracts the noise spectrum by multiplying the filter to the input signal spectrum.
[0014]
With these configurations, the spectral subtraction filter in which the inter-frame variation of the input signal spectrum is smoothed is calculated, and the spectral subtraction is used to improve the inter-frame discontinuity of the residual noise. Has the effect of improving. On the other hand, as a side effect of time averaging of the input spectrum, spectrum distortion due to addition / subtraction may increase in a section where time fluctuation is large, such as a rising edge of a speech signal. On the other hand, a speech section is shorter than a non-speech section. By averaging the input signal spectrum over the time width, the time response is improved and the increase in distortion is suppressed. In addition, speech segment determination is included in the conventional spectral subtraction method, and the time average is easily obtained by recursive calculation for each frame, so that the increase in the amount of calculation from the basic spectral subtraction method is also small. .
[0017]
In the noise suppression device according to
[0018]
With this configuration, the inter-frame variation of the spectral subtraction filter is smoothed and then subtracted from the spectrum for a short time, thereby reducing the discontinuity of the residual noise and whitening, thereby improving the audible SNR. is there. On the other hand, the time averaging of the subtraction filter has a side effect of increasing spectral distortion due to addition and subtraction in a section where time fluctuation is large, such as the rise of the voice signal. In contrast, the voice section is adaptively shorter than the non-speech section. By averaging the subtraction filter by the width, the time response is improved and the increase in distortion is suppressed.
[0019]
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0020]
(Embodiment 1)
FIG. 1 is a block configuration diagram of a noise suppression apparatus according to Embodiment 1 of the present invention. First, the block configuration of the noise suppression device will be described with reference to FIG. In this noise suppression apparatus, the frame dividing unit 1 divides an input signal into frame units having a predetermined length. The
[0021]
The noise
[0022]
The average
[0023]
The subtraction
[0024]
Next, the operation of the noise suppression apparatus as described above or the control contents of the processing program of the noise suppression method executed by a computer will be described with reference to the flowchart of FIG.
[0025]
Step S1: When the operation starts, the frame dividing unit 1 cuts the input signal into frame intervals of a predetermined length.
[0026]
Step S2: Next, a windowing process is performed on the frame signal so as to obtain the frequency resolution accuracy required for the Fourier analysis in the subsequent stage. At this time, processing is performed so that the frames overlap. This is to prevent discontinuous waveforms at the frame boundaries when they are combined and connected in a subsequent synthesis process. As the window function, for example, a Hanning window as shown in the following (Equation 1) is used.
[0027]
[Expression 1]
[0028]
Here, L represents the number of samples per frame, and n represents the position of the sample in the frame, that is, n = (0, 1,..., L−1).
[0029]
Step S3: Thereafter, the
[0030]
Step S4: Subsequently, the voice
[0031]
If the amplitude spectrum of the input frame is X (w), the estimated noise spectrum at that time is N (w), and if the condition of (Equation 2) is satisfied, the frame is determined as a non-speech (noise) section and is satisfied If not, it is determined as a voice segment.
[0032]
[Expression 2]
[0033]
The optimum value of k in the above equation varies depending on the SNR level of the input signal, but it seems that it may be about 3 for the SNR level of the line noise of the land phone. Here, instead of determining the speech section in units of frames, the (Equation 2) may be compared independently for each order (band) of the spectrum. For example, only a band (such as a high-frequency region in a voiced sound section) in which no voice component exists in the voice section is determined as a noise signal.
[0034]
Step S5: Next, based on the determination result of Step S4, when the current frame is not a speech section, the noise
[0035]
Here, as described in
[0036]
Step S6: Subsequently, the average
[0037]
In this way, when calculating the average spectrum, switching the time width (number of frames to be averaged) in the speech / non-speech interval leads to a slow response time in the non-speech interval, and between residual noise frames The occurrence of distortion due to subtraction or the like can be prevented by suppressing the discontinuity of the sound and increasing the temporal response speed in the voice section.
[0038]
Step S7: Using both the estimated noise spectrum N (w) and the average amplitude spectrum X ′ (w) calculated in this way in the current frame, the subtraction
[0039]
[Equation 3]
[0040]
Here, the lower limit value of H (w) is set to 0. For example, by adding or subtracting and setting it to a negative value, or conversely, setting it to a value larger than 0, the overall intensity of the spectrum subtraction process is increased. Can be controlled.
[0041]
Step S8: Thereafter, the
[0042]
[Expression 4]
[0043]
S (w) is an amplitude spectrum of the audio signal in which noise is suppressed by the spectral subtraction process.
[0044]
Step S9: The
[0045]
Step S10: Further, the waveform synthesizing unit 9 synthesizes a continuous speech waveform by sequentially adding waveforms in units of frames, and the process is terminated.
[0046]
When executed by a computer, a processing program is created according to the noise suppression method shown in the flowchart above.
[0047]
According to the embodiment as described above, the residual noise due to the spectral subtraction method is suppressed. Particularly, the kind of residual noise, which is discontinuous between frames, called musical noise, is reduced to a certain level of noise that is continuous between frames and is not harsh. Therefore, the audible SNR can be further improved.
[0048]
Thus, with a simple configuration and processing, the S / N ratio can be improved and the audible sound quality can be improved.
[0049]
(Embodiment 2)
FIG. 2 is a block configuration diagram of a noise suppression apparatus according to
[0050]
The subtraction
[0051]
The subtraction
[0052]
In the present embodiment, the spectral subtraction filter is time-averaged, but the amount of calculation in a usage situation where the influence of voice distortion is small is reduced by fixing the number of time-averaged frames.
[0053]
(Embodiment 3)
FIG. 3 is a block configuration diagram of the noise suppression apparatus according to the third embodiment of the present invention, and FIG. 7 is a flowchart showing control of the noise suppression method according to the third embodiment. In this embodiment, the amplitude spectrum is not averaged, but the spectrum subtraction filter is time-averaged as shown in the block configuration of FIG. 3 and the flowchart of FIG.
[0054]
In FIG. 3, the frame dividing unit 11 cuts out an input signal at regular intervals. The
[0055]
The subtraction
[0056]
The subtraction filter averaging unit 16 calculates time average values for several frames of the spectrum subtraction filter calculated by the subtraction
[0057]
The
[0058]
In the present embodiment, the spectral subtraction filter is time-averaged to prevent the residual noise from becoming discontinuous due to fluctuations in the shape of the subtraction filter between frames. The time average number of frames is switched in the voice / non-voice section as in the first embodiment, thereby avoiding an increase in voice distortion due to this processing.
[0059]
(Embodiment 4)
FIG. 4 shows a block configuration of an embodiment in which the present noise removal method is applied to the received voice of the voice communication apparatus. That is, a clear received voice with little noise can be obtained by incorporating the noise suppression device according to any one of the first to third embodiments in the voice communication device, and a clear voice can be given to the other party by applying it to the transmitted voice. It becomes possible to transmit.
[0060]
Note that the noise suppression device according to any one of the first to third embodiments is incorporated in the voice recording / reproducing device, and is executed as a recording pre-process or a post-reproduction process, thereby obtaining a noise removal effect. Further, by applying it to input speech as preprocessing of the speech recognition device, it is possible to expect improvement in speech recognition accuracy under noise.
[0061]
An example of the effect of the present invention by an actual audio signal is shown in FIG. FIG. 10 shows a waveform and a spectrogram showing an example of the effect of the noise suppression method according to the present invention. FIG. 8 shows the waveform and spectrogram of an input signal that is not subjected to noise suppression processing. FIG. 9 shows a waveform and spectrogram obtained by the conventional spectral subtraction method. With an example of a conventional spectral subtraction method (a subtraction filter is calculated from only the estimated noise spectrum and the spectrum of the current frame) for an audio signal mixed with white noise, the SNR is improved, but the residual noise spectrum is improved. Is partly discontinuous and feels harsh. On the other hand, applying the noise suppression method of the present invention to the input speech, but likewise SNR is improved, the effect of the spectrum of the residual noise can not feel discordant than continuous since conventional methods.
[0062]
The present invention is not limited to the above-described embodiments, and various modifications and applications can be made without departing from the spirit of the invention. In addition to the case where the present invention is built in a voice communication device as shown in FIG. 4, it is built in a voice recording / playback apparatus as shown in FIG. 5, and is executed as a recording pre-process or a post-playback process. Thus, an effect of noise removal can be obtained. Further, as shown in FIG. 5, improvement in speech recognition accuracy under noise can be expected by applying to input speech as preprocessing of the speech recognition apparatus.
[0063]
【The invention's effect】
The present invention calculates a speech section determination unit that detects a boundary between a speech section including noise and a section containing only noise, and calculates an average value for several frames of a signal spectrum in a non-speech section determined by the speech section determination section. By referring to the noise spectrum estimation unit for estimating the noise spectrum and the segment determination result of the speech segment determination unit , the current frame is a non-speech segment from the average number of frames when the current frame is a speech segment. In this case, an average spectrum calculation unit that adaptively calculates a time average value of an input signal spectrum by increasing the number of frames to be averaged is compared with the noise spectrum and the average spectrum to calculate a filter shape for spectrum subtraction. The structure provided with the subtraction filter calculation unit improves the inter-frame discontinuity of the residual noise, reduces the discontinuous residual noise, and is audible S There is an effect that R is improved.
[Brief description of the drawings]
FIG. 1 is a block configuration diagram of a noise suppression device according to a first embodiment of the present invention. FIG. 2 is a block configuration diagram of a noise suppression device according to a second embodiment of the present invention. FIG. 4 is a block diagram of a voice communication device according to a fourth embodiment of the present invention. FIG. 5 is a block diagram of another application example of the noise suppressor according to the present invention. FIG. 7 is a flowchart showing the control of the noise suppression method according to the first embodiment of the present invention. FIG. 7 is a flowchart showing the control of the noise suppression method according to the third embodiment of the present invention. FIG. 9 is a diagram showing a spectrogram. FIG. 9 is a diagram showing a waveform and spectrogram obtained by a conventional spectral subtraction method. FIG. 10 is a diagram showing a waveform and a spectrogram showing an example of the effect of a noise suppression method according to the present invention. Description]
DESCRIPTION OF SYMBOLS 1
Claims (7)
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、
前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。A frame dividing unit for cutting out the input signal at regular intervals;
A spectrum calculation unit for calculating the spectrum of the frame-divided signal;
A speech segment determination unit for determining a speech segment and a non-speech segment of the input signal;
In a non-voice section determined by the voice section determination unit, a noise spectrum estimation unit that estimates a noise spectrum by calculating an average value of past several frames of a signal spectrum;
An average spectrum calculation unit for calculating a time average value of the input signal spectrum by increasing the number of frames to be averaged when the current frame is a non-speech period, compared to the number of frames to be averaged when the current frame is a voice period; ,
A subtractive filter calculation unit that compares the noise spectrum with an average spectrum to calculate a filter shape for spectral subtraction;
A noise suppression apparatus comprising: a spectrum subtraction unit that subtracts a noise spectrum by multiplying an input signal spectrum by the filter.
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
前記減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして算出する減算フィルタ平均部と、
前記入力信号スペクトルに前記減算フィルタ平均部によって平均されたフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。A frame dividing unit for cutting out the input signal at regular intervals;
A spectrum calculation unit for calculating the spectrum of the frame-divided signal;
A speech segment determination unit for determining a speech segment and a non-speech segment of the input signal;
In a non-voice section determined by the voice section determination unit, a noise spectrum estimation unit that estimates a noise spectrum by calculating an average value of past several frames of a signal spectrum;
A subtraction filter calculating unit that calculates the filter shape of spectrum subtraction by comparing the noise spectrum and the input signal spectrum;
The time average value for several frames of the spectral subtraction filter calculated by the subtraction filter calculation unit is averaged when the current frame is a non-speech interval, rather than the average number of frames when the current frame is a speech interval. A subtraction filter averaging unit for calculating by increasing the number of frames to be taken;
A noise suppression apparatus comprising: a spectrum subtraction unit that subtracts a noise spectrum by multiplying the input signal spectrum by a filter averaged by the subtraction filter averaging unit.
b)フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出するスペクトル算出部と、
c)雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
d)前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
e)入力信号スペクトルの数フレーム分の時間平均値を、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして適応的に算出する平均スペクトル算出部と、
f)前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
g)入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。a) a frame dividing unit for cutting out the input signal at regular intervals;
b) a spectrum calculation unit that multiplies the frame signal by a window function and calculates a short-time spectrum by FFT or the like;
c) a speech segment determination unit for detecting a boundary between a speech segment including noise and a segment including only noise;
d) a noise spectrum estimation unit that estimates a noise spectrum by calculating an average value of the past several frames of the signal spectrum in the non-speech section determined by the speech section determination unit;
e) Increase the time average value for several frames of the input signal spectrum by increasing the number of frames to be averaged when the current frame is a non-speech segment, rather than the number of frames to be averaged when the current frame is a speech segment. An average spectrum calculator for adaptively calculating;
f) a subtraction filter calculation unit that compares the noise spectrum with an average spectrum to calculate a filter shape for spectral subtraction;
g) A noise suppression apparatus comprising a spectrum subtracting unit that subtracts a noise spectrum by multiplying the input signal spectrum by the filter.
b)フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出するスペクトル算出部と、
c)雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
d)前記音声区間判定部により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
e)前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
f)前記フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして適応的に算出する減算フィルタ平均部と、
g)入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。a) a frame dividing unit for cutting out the input signal at regular intervals;
b) a spectrum calculation unit that multiplies the frame signal by a window function and calculates a short-time spectrum by FFT or the like;
c) a speech segment determination unit for detecting a boundary between a speech segment including noise and a segment including only noise;
d) a noise spectrum estimation unit that estimates a noise spectrum by calculating an average value for several frames of the signal spectrum in the non-voice section determined by the voice section determination unit;
e) a subtraction filter calculating unit that compares the noise spectrum with the input signal spectrum to calculate a filter shape for spectral subtraction;
f) The time average value for several frames of the spectral subtraction filter calculated by the filter calculation unit is averaged when the current frame is a non-speech section, compared to the average number of frames when the current frame is a speech section. A subtractive filter averaging unit that adaptively calculates by increasing the number of frames taking
g) A noise suppression device comprising a spectrum subtracting unit that subtracts the noise spectrum by multiplying the input signal spectrum by the average filter.
b)フレーム分割された信号のスペクトルを算出し、
c)入力信号の音声区間と非音声区間を判別し、
d)非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
e)現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして入力信号スペクトルの時間平均値を算出し、
f)雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出し、
g)入力信号スペクトルに前記算出されたフィルタを乗算する事で雑音スペクトルを減算するステップを有する雑音抑圧方法。a) the frame divider input signal at regular intervals,
b) calculating the spectrum of the signal divided into frames;
c) Discriminating between speech and non-speech intervals of the input signal,
d) In the non-speech section, the noise spectrum is estimated by calculating the average value of the past several frames of the signal spectrum,
e) The time average value of the input signal spectrum is calculated by increasing the number of frames to be averaged when the current frame is a non-speech interval, rather than the number of frames to be averaged when the current frame is a speech interval,
f) Comparing the noise spectrum with the average spectrum to calculate the filter shape for spectral subtraction;
g) A noise suppression method including a step of subtracting a noise spectrum by multiplying the input signal spectrum by the calculated filter.
b)フレーム分割された信号のスペクトルを算出し、
c)入力信号の音声区間と非音声区間を判別し、
d)非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
e)雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算フィルタを算出し、
f)算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、現フレームが音声区間である場合に平均をとるフレーム数より、現フレームが非音声区間である場合に平均をとるフレーム数を多くして適応的に算出し、
g)入力信号スペクトルに前記平均されたスペクトル減算フィルタを乗算する事で雑音スペクトルを減算するステップを有する事を特徴とする雑音抑圧方法。a) the frame divider input signal at regular intervals,
b) calculating the spectrum of the signal divided into frames;
c) Discriminating between speech and non-speech intervals of the input signal,
d) In the non-speech section, the noise spectrum is estimated by calculating the average value of the past several frames of the signal spectrum,
e) Compare the noise spectrum with the input signal spectrum to calculate the spectral subtraction filter;
f) The calculated time average value for several frames of the spectral subtraction filter is obtained by calculating the average number of frames when the current frame is a non-speech segment from the average number of frames when the current frame is a non-speech segment. More and more adaptively calculated,
g) A noise suppression method comprising a step of subtracting a noise spectrum by multiplying an input signal spectrum by the averaged spectrum subtraction filter.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002172315A JP4123835B2 (en) | 2002-06-13 | 2002-06-13 | Noise suppression device and noise suppression method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002172315A JP4123835B2 (en) | 2002-06-13 | 2002-06-13 | Noise suppression device and noise suppression method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004020679A JP2004020679A (en) | 2004-01-22 |
JP4123835B2 true JP4123835B2 (en) | 2008-07-23 |
Family
ID=31171916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002172315A Expired - Lifetime JP4123835B2 (en) | 2002-06-13 | 2002-06-13 | Noise suppression device and noise suppression method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4123835B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2360685A1 (en) | 2010-01-13 | 2011-08-24 | Yamaha Corporation | Noise suppressing device |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2005124739A1 (en) * | 2004-06-18 | 2008-04-17 | 松下電器産業株式会社 | Noise suppression device and noise suppression method |
FR2883656B1 (en) | 2005-03-25 | 2008-09-19 | Imra Europ Sas Soc Par Actions | CONTINUOUS SPEECH TREATMENT USING HETEROGENEOUS AND ADAPTED TRANSFER FUNCTION |
JP4454591B2 (en) * | 2006-02-09 | 2010-04-21 | 学校法人早稲田大学 | Noise spectrum estimation method, noise suppression method, and noise suppression device |
JP5034735B2 (en) * | 2007-07-13 | 2012-09-26 | ヤマハ株式会社 | Sound processing apparatus and program |
JP5071346B2 (en) * | 2008-10-24 | 2012-11-14 | ヤマハ株式会社 | Noise suppression device and noise suppression method |
JP5593240B2 (en) * | 2010-01-20 | 2014-09-17 | 公益財団法人鉄道総合技術研究所 | Electric motor control method and electric motor control device |
JP5609182B2 (en) * | 2010-03-16 | 2014-10-22 | 日本電気株式会社 | Speech recognition apparatus, speech recognition method, and speech recognition program |
JP2013186228A (en) * | 2012-03-07 | 2013-09-19 | Seiko Epson Corp | Voice recognition processing device and voice recognition processing method |
CN104424956B9 (en) * | 2013-08-30 | 2022-11-25 | 中兴通讯股份有限公司 | Activation tone detection method and device |
-
2002
- 2002-06-13 JP JP2002172315A patent/JP4123835B2/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2360685A1 (en) | 2010-01-13 | 2011-08-24 | Yamaha Corporation | Noise suppressing device |
Also Published As
Publication number | Publication date |
---|---|
JP2004020679A (en) | 2004-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR950011964B1 (en) | Signal processing device | |
US8612222B2 (en) | Signature noise removal | |
AU696152B2 (en) | Spectral subtraction noise suppression method | |
EP2546831B1 (en) | Noise suppression device | |
JP4279357B2 (en) | Apparatus and method for reducing noise, particularly in hearing aids | |
US6044341A (en) | Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice | |
KR100739905B1 (en) | Computationally efficient background noise suppressor for speech coding and speech recognition | |
EP1806739B1 (en) | Noise suppressor | |
EP2362389B1 (en) | Noise suppressor | |
KR101737824B1 (en) | Method and Apparatus for removing a noise signal from input signal in a noisy environment | |
JP2000347688A (en) | Noise suppressor | |
JP2003517624A (en) | Noise suppression for low bit rate speech coder | |
JPH07306695A (en) | Method of reducing noise in sound signal, and method of detecting noise section | |
US8326621B2 (en) | Repetitive transient noise removal | |
US20140177853A1 (en) | Sound processing device, sound processing method, and program | |
WO2006070560A1 (en) | Noise suppressing device, noise suppressing method, noise suppressing program, and computer readable recording medium | |
JP4123835B2 (en) | Noise suppression device and noise suppression method | |
JP2004341339A (en) | Noise restriction device | |
JP2003280696A (en) | Apparatus and method for emphasizing voice | |
JP2000330597A (en) | Noise suppressing device | |
JPH08160994A (en) | Noise suppression device | |
JP2001159899A (en) | Noise suppressor | |
JPH1138997A (en) | Noise suppression device and recording medium on which processing program for processing noise elimination of speech is recorded | |
JP3106543B2 (en) | Audio signal processing device | |
JPH09171397A (en) | Background noise eliminating device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050520 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050614 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080415 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080428 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4123835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
EXPY | Cancellation because of completion of term |