JP2004020679A - 雑音抑圧装置および雑音抑圧方法 - Google Patents
雑音抑圧装置および雑音抑圧方法 Download PDFInfo
- Publication number
- JP2004020679A JP2004020679A JP2002172315A JP2002172315A JP2004020679A JP 2004020679 A JP2004020679 A JP 2004020679A JP 2002172315 A JP2002172315 A JP 2002172315A JP 2002172315 A JP2002172315 A JP 2002172315A JP 2004020679 A JP2004020679 A JP 2004020679A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- subtraction
- filter
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】入力信号を一定間隔毎に切り出すフレーム分割部1と、フレーム信号の短時間スペクトル算出部2と、音声区間の検出部と、雑音スペクトル推定部4と、入力信号スペクトルの時間平均値を適応的に算出する平均スペクトル算出部5と、前記推定雑音と平均スペクトルとを比較してスペクトル減算フィルタを算出する減算フィルタ算出部6と、入力信号スペクトルに前記フィルタを乗算するフィルタ乗算部とにより構成される。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、スペクトル分析を行って音声信号に含まれる雑音の低減を行う雑音抑圧装置および雑音抑圧方法に関するものである。
【0002】
【従来の技術】
電話機で通話している時に音声信号に雑音が混入すると、例え雑音のレベルが小さくて音声情報の伝達には問題がなくても、人間にとって耳障りで精神的な負担を与える場合が多い。また雑音のレベルが大きい場合には、聞き取りに困難を生じてしまう。また、人間ではなく機械が言葉を認識する音声認識装置においても、音声に雑音が混入すると認識精度が著しく低下する事が知られている。
【0003】
このような理由から、音声信号の雑音除去は従来から色々な方法が提案されており、なかでもスペクトル減算法は少ない演算量で効果が高く、1入力の音声でも実行可能な、非常に有効な手法として知られている。スペクトル減算方式については、Boll、”Suppression of Acoustic Noise in Speech Using Spectral Subtruction”、IEEE Trans. on Acoustics、speech and Signal processing、Vol.Assp−27、No.2、April 1979、pp.113−120を初めとして多くの研究成果が発表されている。この手法は入力音声の短時間スペクトルから推定雑音スペクトルを差し引くことで雑音成分の除去をおこなう。
【0004】
また特開平8−221092号公報には、入力信号を一定間隔毎に切り出すフレーム分割手段と、音声区間の検出をおこなう手段と、フレーム信号の短時間スペクトルを求める手段と、雑音スペクトルを推定する手段とを有し、雑音スペクトル推定手段で推定した雑音スペクトルにスペクトル減算係数をかけて短時間スペクトルから減算する雑音除去システムが開示されている。また、スペクトル減算係数の値をフレーム毎に変更可能にし、音声中のポーズ区間や摩擦子音の部分のように音声のパワが小さいところではサブトラクシヨン係数を小さくすることによつて推定騒音スペクトルの引き過ぎによつてよつて生じる入力音声スペクトルの歪みを押さえるものである。
【0005】
また特開2001−228892号公報に開示されているノイズ除去装置は、入力信号更新部にて入力音声データの周波数成分を積算し、ノイズ更新部では音声区間を除く部分のノイズの周波数成分を積算し、さらに過推定係数算出部では過推定係数を求め、入力音声データからノイズを除去した真の音声の周波数成分を求めるというものであります。
【0006】
【発明が解決しようとする課題】
しかしながら、上述したようなスペクトル減算法による雑音抑圧処理を単純に適用すると、S/N比は大きく改善されるにもかかわらず、聴感的にはかえって音質が劣化してしまうことが少なくない。特に参照信号の無い1入力の音声に適用した場合にそれは顕著になる。その主な原因は、ミュージカルノイズと呼ばれる不自然な雑音成分が処理音声中に形成されることにある。
【0007】
このミュージカルノイズが発生する原因は、該当フレームの短時間スペクトルのみでスペクトル引き算を行うと、雑音スペクトルの推定誤差のために雑音の引き残し信号がフレーム毎に時間的・周波数的不連続な領域で発生してしまうことにある。人間は、このような雑音を連続的な雑音よりもかえって耳障りに感じる場合がある。
【0008】
また、スペクトル減算法で音質が劣化するもう1つの要因として、音声から雑音スペクトルが過剰に減算された場合にスペクトル歪が発生し、音声信号が変質してしまう事が知られている。
【0009】
従来、ミュージカルノイズへの対策としては、入力音声のスペクトルに対して推定雑音スペクトルにある倍率をかけたスペクトルを引く方法がある。この倍率は減算係数と呼ばれ、この減算係数を1より大きい値に設定すると、スペクトルが実際の雑音よりも常に過剰に減算され、結果的にミュージカルノイズを削減できる。しかし、同時に音声信号成分までも減算されるため、スペクトル歪みが増大してしまう。逆に、減算係数を1より小さい値に設定すると、スペクトルが実際の雑音よりも常に小さく減算されるため、音声スペクトルに加減算による歪が発生しにくくなる。しかし、同時に雑音スペクトルが十分に減算されないため、SNRの改善効果が少なくなる。
【0010】
本発明は上記従来の問題点を解決する雑音抑圧装置または方法を提供することを目的とするものである。本発明は減算係数を利用せず、スペクトル減算法によるミュージカルノイズの発生を比較的少ない演算量で抑圧し、特に聴感上のSNRを向上させることを目的としている。
【0011】
【課題を解決するための手段】
本発明は上記従来の課題を解決するために、入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、非音声区間において信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とを設けたものである。
【0012】
このようにして本発明は、音声信号の雑音除去処理において、従来スペクトル減算法の欠点であったミュージカルノイズの形成を抑圧し、同時にスペクトル歪の増加を避ける事により、聴感的に良好な雑音除去効果を得ることが可能である。
【0013】
【発明の実施の形態】
上記目的を達成するために、本発明の請求項1による音声雑音抑圧装置は、入力信号を一定間隔毎に切り出すフレーム分割部と、フレーム分割された信号のスペクトルを算出するスペクトル算出部と、入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、入力信号スペクトルにフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部から構成される。
【0014】
これら構成により、入力信号スペクトルのフレーム間変動がスムージングされたスペクトル減算フィルタを算出し、それを用いてスペクトル減算する事で、残留雑音のフレーム間不連続性が改善されるため、聴感的なSNRが向上する効果がある。一方、入力スペクトルの時間平均化の副作用として、音声信号の立ち上がりなど時間変動が大きい区間では加減算によるスペクトル歪が増大する可能性があるが、これに対しては音声区間では非音声区間よりも短い時間幅で入力信号スペクトルを平均化する事により時間応答性を高め、歪の増加を抑制している。また、音声区間判定は従来のスペクトル減算法に含まれ、時間平均はフレーム毎の再帰計算で簡単に求められるので、基本的なスペクトル減算法からの演算量の増加分が小さい事も特徴である。
【0015】
また請求項2の雑音抑圧装置では、雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、この減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を所定の時間幅で算出する減算フィルタ平均部とを備えたものであります。
【0016】
このように入力信号スペクトルではなくて減算フィルタ平均部により短時間スペクトルの減算フィルタの時間平均行うことにより、スペクトル歪が発生しにくい音声と雑音の組み合わせ状況においては、残留雑音の不連続性が減少して聴感的なSNRが向上する効果が得られ、演算量を削減できる。
【0017】
また請求項3の雑音抑圧装置では、減算フィルタ平均部はスペクトル減算フィルタの数フレーム分の時間平均値を、音声区間における時間幅よりも非音声区間における時間幅を長くして算出するようにした。
【0018】
この構成により、スペクトル減算フィルタのフレーム間変動をスムージングしたうえで、短時間スペクトルから減算する事で、残留雑音の不連続性が減少して白色化するため、聴感的なSNRが向上する効果がある。一方、減算フィルタの時間平均化によって音声信号の立ち上がりなど時間変動が大きい区間で加減算によるスペクトル歪が増大する副作用が生じるが、これに対しては音声区間では非音声区間よりも適応的に短い時間幅で減算フィルタを平均化する事で時間応答性を高め、歪の増加を抑制している。
【0019】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0020】
(実施の形態1)
図1は本発明の実施の形態1による雑音抑圧装置のブロック構成図である。まず、図1を用いて、雑音抑圧装置のブロック構成について説明する。この雑音抑圧装置において、フレーム分割部1は、入力信号を所定の長さのフレーム単位に分割する。スペクトル算出部2は、フレーム分割部1によってフレーム分割された音声信号をフーリエ変換(FFT)することによりスペクトル成分を分析してスペクトル情報を出力する。音声区間判定部3は、該フレームが音声区間(音声+雑音信号)であるか非音声区間(雑音信号のみ)であるかをそのエネルギーレベルに基づいて判別し、例えばフラグ等の判別情報を付加する。
【0021】
雑音スペクトル推定部4はスペクトル算出部2より出力されるスペクトル情報を基に雑音スペクトルを推定する。この際、雑音スペクトル推定部4は音声区間判定部3に於いて非音声区間と判定されたフレームのみを対象に過去数フレームのスペクトルを時間平均化することで雑音スペクトルを推定・更新し続ける。
【0022】
平均スペクトル算出部5は、スペクトル算出部2よりフレーム単位で出力されるスペクトル情報の時間平均を算出する。その際、平均スペクトル算出部5は該フレームが音声区間か否かに関係なくスペクトルの時間平均を算出するが、音声区間判定部3の判定結果が音声区間であれば非音声区間よりも少ない過去フレーム数で時間平均する。
【0023】
減算フィルタ算出部6は、上記雑音スペクトル推定部4により推定された雑音スペクトルと平均スペクトル算出部5の平均スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。スペクトル減算部7は、該フレームのスペクトルに前記スペクトル減算フィルタを適用する事で雑音スペクトルの減算を実現する。波形算出部8は、このスペクトル減算部7の出力を逆フーリエ変換(IFFT)する事で時間領域の波形数値を算出する。波形合成部9は、この波形算出部8の出力波形を加算して合成し出力する。
【0024】
次に、図6のフローチャートを用いて、上述したような雑音抑圧装置の動作、またはコンピュータで実行される同雑音抑圧方法の処理プログラムの制御内容を説明する。
【0025】
ステップS1:動作がスタートすると、フレーム分割部1は、入力された信号を所定の長さのフレーム間隔に切り出す。
【0026】
ステップS2:次に、後段でフーリエ分析する際に必要な周波数分解精度が得られるようにフレーム信号に対して窓かけ処理を行う。このときフレームはオーバラップするように処理が行われる。これは、さらに後段の合成処理で合成して接続したときに、フレーム境界で不連続な波形になるのを防止するためである。窓関数としては、例えば次の(数1)に示すようなハニング窓を用いる。
【0027】
【数1】
【0028】
ここに、Lは1フレームあたりのサンプル数、nはフレーム内におけるサンプルの位置を表しており、すなわち、n=(0,1,…,L−1)である。
【0029】
ステップS3:その後、スペクトル算出部2において、フレーム信号に対してフーリエ変換(FFT)を行うことにより、スペクトル成分を分析してスペクトル情報を出力する。以降のステップで使用するために、このスペクトル情報は過去数フレームにわたりメモリに蓄積されるものとする。
【0030】
ステップS4:続いて、該フレームについて、音声区間判定部3により音声/非音声の判別処理を行う。この判別処理の方法については、従来より各種の提案がなされているが、例えば以下の方法がある。
【0031】
入力フレームの振幅スペクトルをX(w)、その時点での推定雑音スペクトルをN(w)とし、(数2)の条件を満たす場合は其のフレームを非音声(雑音)区間と判定し、満たさない場合は音声区間と判定する。
【0032】
【数2】
【0033】
上式のkの値は入力信号のSNRの程度により最適値が異なるが、地上電話の回線雑音程度のSNRでは3程度で良いようである。ここで、フレーム単位で音声区間の判定するのではなく、スペクトルの各次数(帯域)別に独立して(数2)の比較しても良い。例えば音声区間でも音声の成分が存在しない帯域(有声音区間の高周波領域など)のみ雑音信号と判定する。
【0034】
ステップS5:次に、上記ステップS4の判別結果に基づいて、雑音スペクトル推定部4に於いて、現フレームが音声区間でない場合には、メモリから非音声フレームの過去数フレームの振幅スペクトルを読み出して、これらと現フレームの振幅スペクトルとから平均振幅スペクトルを計算し、その平均振幅スペクトルを推定雑音スペクトルとする。この平均のフレーム数は、例えば8kHzサンプリングで1フレーム幅が128ポイントであって64ポイントの重複がある場合を家庭すると、10フレーム程度が良い(以下も、この分析条件を仮定する)。
【0035】
ここで、ステップ4で述べたように、音声/非音声区間を帯域別に判定し、雑音スペクトルの算出も過去数フレームの非音声帯域について平均化しても良い。この場合、音声区間であっても音声信号が存在しない帯域については雑音スペクトルの更新が継続できるので、推定の精度が向上する。
【0036】
ステップS6:続いて、平均スペクトル算出部5に於いて、メモリから過去数フレームの振幅スペクトルを読み出して、これらと現フレームの振幅スペクトルとから平均振幅スペクトルX’(w)を計算する。この平均のフレーム数は、ステップS4の判別結果に基づいて、現フレームが非音声区間の場合をA個、現フレームが音声区間の場合をB個とすると、A:B=2:1程度の比率に設定する。例えばステップS5で述べた分析条件では、A=6、B=3程度のフレーム数が良い。過去フレームには音声区間と非音声区間が混在する場合もあるが、そのまま平均振幅スペクトルを算出して良い。
【0037】
このように平均スペクトルを算出する際に音声・非音声区間で時間幅(平均するフレーム数)を切り替えることにより、非音声区間では時間的な応答速度を遅くすることにつながり、残留雑音のフレーム間の不連続さを抑制し、音声区間では時間的な応答速度を高くする事で可減算等による歪の発生を防ぐことができる。
【0038】
ステップS7:こうして算出された、現フレームにおける推定雑音スペクトルN(w)と平均振幅スペクトルX’(w)の両方を用いて、減算フィルタ算出部6において、次の(数3)に従って現フレームのスペクトル減算フィルタH(w)を算出する。
【0039】
【数3】
【0040】
ここで、H(w)の下限値を0としているが、例えば加減算を許して負の値に設定したり、逆に0より大きな値に設定することで、スペクトル減算処理の全体的な強度を制御することが出来る。
【0041】
ステップS8:その後、スペクトル減算部7において、スペクトル算出部2の出力する現フレームの振幅スペクトルに上記減算フィルタ算出部6の出力するスペクトル減算フィルタH(w)を(数4)のとおり適用することで、推定雑音スペクトルの減算を行う。
【0042】
【数4】
【0043】
S(w)はスペクトル減算処理により雑音が抑圧された、音声信号の振幅スペクトルである。
【0044】
ステップS9:スペクトル減算部7の出力を波形算出部8において逆フーリエ変換(IFFT)し、フレーム単位の波形信号を得る。
【0045】
ステップS10:さらに波形合成部9において、フレーム単位の波形を順次重複しつつ加算する事により連続的な音声波形を合成して、終了する。
【0046】
なお、コンピュータで実行される場合には以上のフローチャートで示した雑音抑圧方法に従って処理プログラムを作成する。
【0047】
以上のような実施の形態によれば、スペクトル減算法による残留雑音が抑制され、特にミュージカルノイズと呼ばれるフレーム間不連続で耳障りな種類の残留雑音が、フレーム間連続で耳障りでない雑音へとある程度質的に変化するため、聴感的なSNRが一層向上する効果が得られる。
【0048】
こうして、簡単な構成や処理により、S/N比を改善するとともに聴感的な音質を向上することができる。
【0049】
(実施の形態2)
図2は本発明の実施の形態2における雑音抑圧装置のブロック構成図である。図2のブロック構成において、フレーム分割部21は、入力信号を一定間隔毎に切り出す。スペクトル算出部22は、フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出する。音声区間判定部23は、雑音を含む音声区間と雑音のみの区間との境界を検出する。雑音スペクトル推定部24は、音声区間判定部23により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する。
【0050】
減算フィルタ算出部25は、雑音スペクトル推定部24からの雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。
【0051】
減算フィルタ平均部26は、減算フィルタ算出部25により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を固定の時間幅で算出する。スペクトル減算部27は、入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算する。波形算出部28は、スペクトル減算部27の出力を逆フーリエ変換(IFFT)する事で時間領域の波形数値を算出する。波形合成部29は波形算出部28の出力波形を加算して合成し出力する。
【0052】
本実施の形態ではスペクトル減算フィルタを時間平均化するが、時間平均のフレーム数を固定することで、音声歪の影響が少ない使用状況における演算量を削減している。
【0053】
(実施の形態3)
図3は本発明の実施の形態3の雑音抑圧装置のブロック構成図であり、図7は同実施の形態3の雑音抑圧方式の制御を示すフローチャートである。本実施の形態では振幅スペクトルを平均化するのではなく、図3のブロック構成と図7のフローチャートに示すようにスペクトル減算フィルタを時間平均化する。
【0054】
図3において、フレーム分割部11は、入力信号を一定間隔毎に切り出す。スペクトル算出部12は、フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出する。音声区間判定部13は、雑音を含む音声区間と雑音のみの区間との境界を検出する。雑音スペクトル推定部14は、音声区間判定部13により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する。
【0055】
減算フィルタ算出部15は、雑音スペクトル推定部14からの雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。
【0056】
減算フィルタ平均部16は減算フィルタ算出部15により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を算出する。その際、減算フィルタ平均部16は非音声区間は長い時間幅で、音声区間は短い時間幅で適応的に平均値を算出する。スペクトル減算部17は、入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算する。
【0057】
波形算出部18は、スペクトル減算部17の出力を逆フーリエ変換(IFFT)する事で時間領域の波形数値を算出する。波形合成部19は波形算出部18の出力波形を加算して合成し出力する。
【0058】
本実施の形態ではスペクトル減算フィルタを時間平均化することにより、フレーム間で減算フィルタ形状が変動して残留雑音が不連続に成る事を抑制する。時間平均のフレーム数は実施の形態1と同様に音声/非音声区間で切り替えることで、この処理による音声歪の増加を避けている。
【0059】
(実施の形態4)
図4は、音声通信装置の受話音声に本雑音除去方式を適用した実施の形態のブロック構成を示す。すなわち、音声通信装置に前実施の形態1〜3いずれかの雑音抑圧装置を内蔵する事により雑音の少ない明瞭な受話音声が得られ、送話音声に適用する事により通話相手に明瞭な音声を送信することが可能になる。
【0060】
なお、前実施の形態1〜3いずれかの雑音抑圧装置を音声録音/再生装置に内蔵し、録音の前処理または再生の後処理として実行することで、雑音除去の効果が得られる。また、音声認識装置の前処理として入力音声に適用することで、雑音下の音声認識精度の向上が期待できる。
【0061】
実際の音声信号による本発明の効果の例を図10に示す。図10は本発明による雑音抑圧方式の効果の例を示す波形およびスペクトログラムを示す。なお、図8は雑音抑圧処理を施さない入力信号の波形およびスペクトログラムを示す。また図9は従来のスペクトル減算法による波形およびスペクトログラムを示す。白色系の雑音が混入した音声信号に対し、従来のスペクトル減算法の例(推定雑音スペクトルと現フレームのスペクトルのみから減算フィルタを算出した。)では、SNRは改善されるものの、残留雑音のスペクトルが部分的に不連続なので耳障りに感じられる。一方、本発明の請求項6の雑音抑圧方法を入力音声に適用すると、同様にSNRが改善されるが、残留雑音のスペクトルが連続的なので従来方法よりも耳障りに感じられない効果がある。
【0062】
なお、本発明は上述した各実施の形態に限定されるものではなく、発明の主旨を逸脱しない範囲内において種々の変形や応用が可能であることは勿論である。本発明の用途は図4に示すように音声通信機器に内蔵する場合の他に、図5に示すように音声録音/再生装置に内蔵し、録音の前処理または再生の後処理として実行することで、雑音除去の効果が得られる。また図5に示すように、音声認識装置の前処理として入力音声に適用することで、雑音下の音声認識精度の向上が期待できる。
【0063】
【発明の効果】
本発明は、雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、この音声区間判定部により判定された非音声区間において信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間判定部の区間判定結果を参考に、非音声区間は長い時間幅(多いフレーム数)で、音声区間は短い時間幅(少ないフレーム数)で入力信号スペクトルの時間平均値を適応的に算出する平均スペクトル算出部と、前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部とを設けた構成により、残留雑音のフレーム間不連続性が改善され、不連続な残留雑音を削減して聴感的なSNRが向上する効果がある。
【図面の簡単な説明】
【図1】本発明の実施の形態1の雑音抑圧装置のブロック構成図
【図2】本発明の実施の形態2の雑音抑圧装置のブロック構成図
【図3】本発明の実施の形態3の雑音抑圧装置のブロック構成図
【図4】本発明の実施の形態4の音声通信装置のブロック構成図
【図5】本発明による雑音抑圧装置のその他の応用例のブロック構成図
【図6】本発明の実施の形態1の雑音抑圧方式の制御を示すフローチャート
【図7】本発明の実施の形態3の雑音抑圧方式の制御を示すフローチャート
【図8】雑音抑圧処理を施さない入力信号の波形およびスペクトログラムを示す図
【図9】従来のスペクトル減算法による波形およびスペクトログラムを示す図
【図10】本発明による雑音抑圧方式の効果の例を示す波形およびスペクトログラムを示す図
【符号の説明】
1 フレーム分割部
2 スペクトル算出部
3 音声区間判定部
4 雑音スペクトル推定部
5 平均スペクトル算出部
6 減算フィルタ算出部
7 スペクトル減算部
8 波形算出部
9 波形合成部
Claims (11)
- 入力信号を一定間隔毎に切り出すフレーム分割部と、
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、
前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。 - 入力信号を一定間隔毎に切り出すフレーム分割部と、
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
前記減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を所定の時間幅で算出する減算フィルタ平均部と、
前記入力信号スペクトルに前記減算フィルタ平均部によって平均されたフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。 - 入力信号を一定間隔毎に切り出すフレーム分割部と、
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
前期減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、音声区間における時間幅よりも非音声区間における時間幅を長くして算出する減算フィルタ平均部と、
前記入力信号スペクトルに前記減算フィルタ平均部によって平均されたフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。 - 請求項1〜3いずれかの雑音抑圧装置を内蔵し、背景雑音や回線雑音がある状況において聴感的なSNRが良い音声通信が可能なことを特徴とする音声通信装置。
- a)入力信号を一定間隔毎に切り出すフレーム分割部と、
b)フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出するスペクトル算出部と、
c)雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
d)前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
e)入力信号スペクトルの数フレーム分の時間平均値を、非音声区間は長く音声区間は短い時間幅で適応的に算出する平均スペクトル算出部と、
f)前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
g)入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。 - a)入力信号を一定間隔毎に切り出すフレーム分割部と、
b)フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出するスペクトル算出部と、
c)雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
d)前記音声区間判定部により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
e)前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
f)フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を固定の時間幅で算出する減算フィルタ平均部と、
g)入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。 - 減算フィルタ平均部は、減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を音声区間における時間幅よりも非音声区間における時間幅を長くして算出する事を特徴とする請求項6記載の雑音抑圧装置。
- a)入力信号を一定間隔毎に切り出すフレーム分割部と、
b)フレーム信号に窓関数を掛け、FFT等により短時間スペクトルを算出するスペクトル算出部と、
c)雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
d)前記音声区間判定部により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
e)前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
f)前記フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、非音声区間は長く音声区間は短い時間幅で適応的に算出する減算フィルタ平均部と、
g)入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。 - a)入力信号を一定間隔毎に切り出すフレーム分割部し、
b)フレーム分割された信号のスペクトルを算出し、
c)入力信号の音声区間と非音声区間雑音を判別し、
d)非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
e)音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出し、
f)雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出し、
g)入力信号スペクトルに前記算出されたフィルタを乗算する事で雑音スペクトルを減算するステップを有する雑音抑圧方法。 - a)入力信号を一定間隔毎に切り出すフレーム分割部し、
b)フレーム分割された信号のスペクトルを算出し、
c)入力信号の音声区間と非音声区間雑音を判別し、
d)非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
e)雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算フィルタを算出し、
f)算出されたスペクトル減算フィルタの数フレーム分の時間平均値を所定の時間幅で算出し、
g)入力信号スペクトルに前記平均されたスペクトル減算フィルタを乗算する事で雑音スペクトルを減算するステップを有する雑音抑圧方法。 - a)入力信号を一定間隔毎に切り出すフレーム分割部し、
b)フレーム分割された信号のスペクトルを算出し、
c)入力信号の音声区間と非音声区間雑音を判別し、
d)非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
e)雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算フィルタを算出し、
f)算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、非音声区間は長く音声区間は短い時間幅で適応的に算出し、
g)入力信号スペクトルに前記平均されたスペクトル減算フィルタを乗算する事で雑音スペクトルを減算するステップを有する事を特徴とする雑音抑圧方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002172315A JP4123835B2 (ja) | 2002-06-13 | 2002-06-13 | 雑音抑圧装置および雑音抑圧方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002172315A JP4123835B2 (ja) | 2002-06-13 | 2002-06-13 | 雑音抑圧装置および雑音抑圧方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004020679A true JP2004020679A (ja) | 2004-01-22 |
JP4123835B2 JP4123835B2 (ja) | 2008-07-23 |
Family
ID=31171916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002172315A Expired - Lifetime JP4123835B2 (ja) | 2002-06-13 | 2002-06-13 | 雑音抑圧装置および雑音抑圧方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4123835B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005124739A1 (ja) * | 2004-06-18 | 2005-12-29 | Matsushita Electric Industrial Co., Ltd. | 雑音抑圧装置および雑音抑圧方法 |
JP2007212704A (ja) * | 2006-02-09 | 2007-08-23 | Univ Waseda | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
JP2009020472A (ja) * | 2007-07-13 | 2009-01-29 | Yamaha Corp | 音処理装置およびプログラム |
US7693712B2 (en) | 2005-03-25 | 2010-04-06 | Aisin Seiki Kabushiki Kaisha | Continuous speech processing using heterogeneous and adapted transfer function |
JP2010102204A (ja) * | 2008-10-24 | 2010-05-06 | Yamaha Corp | 雑音抑圧装置及び雑音抑圧方法 |
JP2011172472A (ja) * | 2010-01-20 | 2011-09-01 | Railway Technical Research Institute | 電動機制御方法及び電動機制御装置 |
JP2011191682A (ja) * | 2010-03-16 | 2011-09-29 | Nec Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2013186228A (ja) * | 2012-03-07 | 2013-09-19 | Seiko Epson Corp | 音声認識処理装置及び音声認識処理方法 |
JP2016529555A (ja) * | 2013-08-30 | 2016-09-23 | ゼットティーイー コーポレーションZte Corporation | 音声活動検出方法及び装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
-
2002
- 2002-06-13 JP JP2002172315A patent/JP4123835B2/ja not_active Expired - Lifetime
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005124739A1 (ja) * | 2004-06-18 | 2005-12-29 | Matsushita Electric Industrial Co., Ltd. | 雑音抑圧装置および雑音抑圧方法 |
US7693712B2 (en) | 2005-03-25 | 2010-04-06 | Aisin Seiki Kabushiki Kaisha | Continuous speech processing using heterogeneous and adapted transfer function |
JP2007212704A (ja) * | 2006-02-09 | 2007-08-23 | Univ Waseda | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 |
JP2009020472A (ja) * | 2007-07-13 | 2009-01-29 | Yamaha Corp | 音処理装置およびプログラム |
JP2010102204A (ja) * | 2008-10-24 | 2010-05-06 | Yamaha Corp | 雑音抑圧装置及び雑音抑圧方法 |
JP2011172472A (ja) * | 2010-01-20 | 2011-09-01 | Railway Technical Research Institute | 電動機制御方法及び電動機制御装置 |
JP2012249523A (ja) * | 2010-01-20 | 2012-12-13 | Railway Technical Research Institute | 空転滑走発生検出方法及び電動機制御装置 |
JP2011191682A (ja) * | 2010-03-16 | 2011-09-29 | Nec Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2013186228A (ja) * | 2012-03-07 | 2013-09-19 | Seiko Epson Corp | 音声認識処理装置及び音声認識処理方法 |
JP2016529555A (ja) * | 2013-08-30 | 2016-09-23 | ゼットティーイー コーポレーションZte Corporation | 音声活動検出方法及び装置 |
US9978398B2 (en) | 2013-08-30 | 2018-05-22 | Zte Corporation | Voice activity detection method and device |
Also Published As
Publication number | Publication date |
---|---|
JP4123835B2 (ja) | 2008-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8612222B2 (en) | Signature noise removal | |
AU696152B2 (en) | Spectral subtraction noise suppression method | |
EP1706864B1 (en) | Computationally efficient background noise suppressor for speech coding and speech recognition | |
US20070232257A1 (en) | Noise suppressor | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
US20100104113A1 (en) | Noise suppression device and noise suppression method | |
JPH07306695A (ja) | 音声信号の雑音低減方法及び雑音区間検出方法 | |
JPWO2006123721A1 (ja) | 雑音抑圧方法およびその装置 | |
EP2346032A1 (en) | Noise suppression device and audio decoding device | |
JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP4123835B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
JP4757775B2 (ja) | 雑音抑圧装置 | |
JP2000330597A (ja) | 雑音抑圧装置 | |
JP4434813B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 | |
JPH08160994A (ja) | 雑音抑圧装置 | |
JP5840087B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
JP2006126859A (ja) | 音声処理装置及び音声処理方法 | |
JP2006201622A (ja) | 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法 | |
JP2002175099A (ja) | 雑音抑制方法および雑音抑制装置 | |
JP2000010593A (ja) | スペクトル雑音除去装置 | |
JPH1138997A (ja) | 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体 | |
JP2020160290A (ja) | 信号処理装置、信号処理システム及び信号処理方法 | |
US10109291B2 (en) | Noise suppression device, noise suppression method, and computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050520 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050614 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080415 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080428 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4123835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
EXPY | Cancellation because of completion of term |