JP2004020679A

JP2004020679A - 雑音抑圧装置および雑音抑圧方法

Info

Publication number: JP2004020679A
Application number: JP2002172315A
Authority: JP
Inventors: Tadamichi Tokuda; 徳田　肇道
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2002-06-13
Filing date: 2002-06-13
Publication date: 2004-01-22
Anticipated expiration: 2022-06-13
Also published as: JP4123835B2

Abstract

【課題】スペクトル減算処理において従来欠点であった、不連続な残留雑音を削減することを目的とする。
【解決手段】入力信号を一定間隔毎に切り出すフレーム分割部１と、フレーム信号の短時間スペクトル算出部２と、音声区間の検出部と、雑音スペクトル推定部４と、入力信号スペクトルの時間平均値を適応的に算出する平均スペクトル算出部５と、前記推定雑音と平均スペクトルとを比較してスペクトル減算フィルタを算出する減算フィルタ算出部６と、入力信号スペクトルに前記フィルタを乗算するフィルタ乗算部とにより構成される。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、スペクトル分析を行って音声信号に含まれる雑音の低減を行う雑音抑圧装置および雑音抑圧方法に関するものである。
【０００２】
【従来の技術】
電話機で通話している時に音声信号に雑音が混入すると、例え雑音のレベルが小さくて音声情報の伝達には問題がなくても、人間にとって耳障りで精神的な負担を与える場合が多い。また雑音のレベルが大きい場合には、聞き取りに困難を生じてしまう。また、人間ではなく機械が言葉を認識する音声認識装置においても、音声に雑音が混入すると認識精度が著しく低下する事が知られている。
【０００３】
このような理由から、音声信号の雑音除去は従来から色々な方法が提案されており、なかでもスペクトル減算法は少ない演算量で効果が高く、１入力の音声でも実行可能な、非常に有効な手法として知られている。スペクトル減算方式については、Ｂｏｌｌ、”Ｓｕｐｐｒｅｓｓｉｏｎ　ｏｆ　Ａｃｏｕｓｔｉｃ　Ｎｏｉｓｅ　ｉｎ　Ｓｐｅｅｃｈ　Ｕｓｉｎｇ　Ｓｐｅｃｔｒａｌ　Ｓｕｂｔｒｕｃｔｉｏｎ”、ＩＥＥＥ　Ｔｒａｎｓ．　ｏｎ　Ａｃｏｕｓｔｉｃｓ、ｓｐｅｅｃｈ　ａｎｄ　Ｓｉｇｎａｌ　ｐｒｏｃｅｓｓｉｎｇ、Ｖｏｌ．Ａｓｓｐ−２７、Ｎｏ．２、Ａｐｒｉｌ　１９７９、ｐｐ．１１３−１２０を初めとして多くの研究成果が発表されている。この手法は入力音声の短時間スペクトルから推定雑音スペクトルを差し引くことで雑音成分の除去をおこなう。
【０００４】
また特開平８−２２１０９２号公報には、入力信号を一定間隔毎に切り出すフレーム分割手段と、音声区間の検出をおこなう手段と、フレーム信号の短時間スペクトルを求める手段と、雑音スペクトルを推定する手段とを有し、雑音スペクトル推定手段で推定した雑音スペクトルにスペクトル減算係数をかけて短時間スペクトルから減算する雑音除去システムが開示されている。また、スペクトル減算係数の値をフレーム毎に変更可能にし、音声中のポーズ区間や摩擦子音の部分のように音声のパワが小さいところではサブトラクシヨン係数を小さくすることによつて推定騒音スペクトルの引き過ぎによつてよつて生じる入力音声スペクトルの歪みを押さえるものである。
【０００５】
また特開２００１−２２８８９２号公報に開示されているノイズ除去装置は、入力信号更新部にて入力音声データの周波数成分を積算し、ノイズ更新部では音声区間を除く部分のノイズの周波数成分を積算し、さらに過推定係数算出部では過推定係数を求め、入力音声データからノイズを除去した真の音声の周波数成分を求めるというものであります。
【０００６】
【発明が解決しようとする課題】
しかしながら、上述したようなスペクトル減算法による雑音抑圧処理を単純に適用すると、Ｓ／Ｎ比は大きく改善されるにもかかわらず、聴感的にはかえって音質が劣化してしまうことが少なくない。特に参照信号の無い１入力の音声に適用した場合にそれは顕著になる。その主な原因は、ミュージカルノイズと呼ばれる不自然な雑音成分が処理音声中に形成されることにある。
【０００７】
このミュージカルノイズが発生する原因は、該当フレームの短時間スペクトルのみでスペクトル引き算を行うと、雑音スペクトルの推定誤差のために雑音の引き残し信号がフレーム毎に時間的・周波数的不連続な領域で発生してしまうことにある。人間は、このような雑音を連続的な雑音よりもかえって耳障りに感じる場合がある。
【０００８】
また、スペクトル減算法で音質が劣化するもう１つの要因として、音声から雑音スペクトルが過剰に減算された場合にスペクトル歪が発生し、音声信号が変質してしまう事が知られている。
【０００９】
従来、ミュージカルノイズへの対策としては、入力音声のスペクトルに対して推定雑音スペクトルにある倍率をかけたスペクトルを引く方法がある。この倍率は減算係数と呼ばれ、この減算係数を１より大きい値に設定すると、スペクトルが実際の雑音よりも常に過剰に減算され、結果的にミュージカルノイズを削減できる。しかし、同時に音声信号成分までも減算されるため、スペクトル歪みが増大してしまう。逆に、減算係数を１より小さい値に設定すると、スペクトルが実際の雑音よりも常に小さく減算されるため、音声スペクトルに加減算による歪が発生しにくくなる。しかし、同時に雑音スペクトルが十分に減算されないため、ＳＮＲの改善効果が少なくなる。
【００１０】
本発明は上記従来の問題点を解決する雑音抑圧装置または方法を提供することを目的とするものである。本発明は減算係数を利用せず、スペクトル減算法によるミュージカルノイズの発生を比較的少ない演算量で抑圧し、特に聴感上のＳＮＲを向上させることを目的としている。
【００１１】
【課題を解決するための手段】
本発明は上記従来の課題を解決するために、入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、非音声区間において信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とを設けたものである。
【００１２】
このようにして本発明は、音声信号の雑音除去処理において、従来スペクトル減算法の欠点であったミュージカルノイズの形成を抑圧し、同時にスペクトル歪の増加を避ける事により、聴感的に良好な雑音除去効果を得ることが可能である。
【００１３】
【発明の実施の形態】
上記目的を達成するために、本発明の請求項１による音声雑音抑圧装置は、入力信号を一定間隔毎に切り出すフレーム分割部と、フレーム分割された信号のスペクトルを算出するスペクトル算出部と、入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、入力信号スペクトルにフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部から構成される。
【００１４】
これら構成により、入力信号スペクトルのフレーム間変動がスムージングされたスペクトル減算フィルタを算出し、それを用いてスペクトル減算する事で、残留雑音のフレーム間不連続性が改善されるため、聴感的なＳＮＲが向上する効果がある。一方、入力スペクトルの時間平均化の副作用として、音声信号の立ち上がりなど時間変動が大きい区間では加減算によるスペクトル歪が増大する可能性があるが、これに対しては音声区間では非音声区間よりも短い時間幅で入力信号スペクトルを平均化する事により時間応答性を高め、歪の増加を抑制している。また、音声区間判定は従来のスペクトル減算法に含まれ、時間平均はフレーム毎の再帰計算で簡単に求められるので、基本的なスペクトル減算法からの演算量の増加分が小さい事も特徴である。
【００１５】
また請求項２の雑音抑圧装置では、雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、この減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を所定の時間幅で算出する減算フィルタ平均部とを備えたものであります。
【００１６】
このように入力信号スペクトルではなくて減算フィルタ平均部により短時間スペクトルの減算フィルタの時間平均行うことにより、スペクトル歪が発生しにくい音声と雑音の組み合わせ状況においては、残留雑音の不連続性が減少して聴感的なＳＮＲが向上する効果が得られ、演算量を削減できる。
【００１７】
また請求項３の雑音抑圧装置では、減算フィルタ平均部はスペクトル減算フィルタの数フレーム分の時間平均値を、音声区間における時間幅よりも非音声区間における時間幅を長くして算出するようにした。
【００１８】
この構成により、スペクトル減算フィルタのフレーム間変動をスムージングしたうえで、短時間スペクトルから減算する事で、残留雑音の不連続性が減少して白色化するため、聴感的なＳＮＲが向上する効果がある。一方、減算フィルタの時間平均化によって音声信号の立ち上がりなど時間変動が大きい区間で加減算によるスペクトル歪が増大する副作用が生じるが、これに対しては音声区間では非音声区間よりも適応的に短い時間幅で減算フィルタを平均化する事で時間応答性を高め、歪の増加を抑制している。
【００１９】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【００２０】
（実施の形態１）
図１は本発明の実施の形態１による雑音抑圧装置のブロック構成図である。まず、図１を用いて、雑音抑圧装置のブロック構成について説明する。この雑音抑圧装置において、フレーム分割部１は、入力信号を所定の長さのフレーム単位に分割する。スペクトル算出部２は、フレーム分割部１によってフレーム分割された音声信号をフーリエ変換（ＦＦＴ）することによりスペクトル成分を分析してスペクトル情報を出力する。音声区間判定部３は、該フレームが音声区間（音声＋雑音信号）であるか非音声区間（雑音信号のみ）であるかをそのエネルギーレベルに基づいて判別し、例えばフラグ等の判別情報を付加する。
【００２１】
雑音スペクトル推定部４はスペクトル算出部２より出力されるスペクトル情報を基に雑音スペクトルを推定する。この際、雑音スペクトル推定部４は音声区間判定部３に於いて非音声区間と判定されたフレームのみを対象に過去数フレームのスペクトルを時間平均化することで雑音スペクトルを推定・更新し続ける。
【００２２】
平均スペクトル算出部５は、スペクトル算出部２よりフレーム単位で出力されるスペクトル情報の時間平均を算出する。その際、平均スペクトル算出部５は該フレームが音声区間か否かに関係なくスペクトルの時間平均を算出するが、音声区間判定部３の判定結果が音声区間であれば非音声区間よりも少ない過去フレーム数で時間平均する。
【００２３】
減算フィルタ算出部６は、上記雑音スペクトル推定部４により推定された雑音スペクトルと平均スペクトル算出部５の平均スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。スペクトル減算部７は、該フレームのスペクトルに前記スペクトル減算フィルタを適用する事で雑音スペクトルの減算を実現する。波形算出部８は、このスペクトル減算部７の出力を逆フーリエ変換（ＩＦＦＴ）する事で時間領域の波形数値を算出する。波形合成部９は、この波形算出部８の出力波形を加算して合成し出力する。
【００２４】
次に、図６のフローチャートを用いて、上述したような雑音抑圧装置の動作、またはコンピュータで実行される同雑音抑圧方法の処理プログラムの制御内容を説明する。
【００２５】
ステップＳ１：動作がスタートすると、フレーム分割部１は、入力された信号を所定の長さのフレーム間隔に切り出す。
【００２６】
ステップＳ２：次に、後段でフーリエ分析する際に必要な周波数分解精度が得られるようにフレーム信号に対して窓かけ処理を行う。このときフレームはオーバラップするように処理が行われる。これは、さらに後段の合成処理で合成して接続したときに、フレーム境界で不連続な波形になるのを防止するためである。窓関数としては、例えば次の（数１）に示すようなハニング窓を用いる。
【００２７】
【数１】

【００２８】
ここに、Ｌは１フレームあたりのサンプル数、ｎはフレーム内におけるサンプルの位置を表しており、すなわち、ｎ＝（０，１，…，Ｌ−１）である。
【００２９】
ステップＳ３：その後、スペクトル算出部２において、フレーム信号に対してフーリエ変換（ＦＦＴ）を行うことにより、スペクトル成分を分析してスペクトル情報を出力する。以降のステップで使用するために、このスペクトル情報は過去数フレームにわたりメモリに蓄積されるものとする。
【００３０】
ステップＳ４：続いて、該フレームについて、音声区間判定部３により音声／非音声の判別処理を行う。この判別処理の方法については、従来より各種の提案がなされているが、例えば以下の方法がある。
【００３１】
入力フレームの振幅スペクトルをＸ（ｗ）、その時点での推定雑音スペクトルをＮ（ｗ）とし、（数２）の条件を満たす場合は其のフレームを非音声（雑音）区間と判定し、満たさない場合は音声区間と判定する。
【００３２】
【数２】

【００３３】
上式のｋの値は入力信号のＳＮＲの程度により最適値が異なるが、地上電話の回線雑音程度のＳＮＲでは３程度で良いようである。ここで、フレーム単位で音声区間の判定するのではなく、スペクトルの各次数（帯域）別に独立して（数２）の比較しても良い。例えば音声区間でも音声の成分が存在しない帯域（有声音区間の高周波領域など）のみ雑音信号と判定する。
【００３４】
ステップＳ５：次に、上記ステップＳ４の判別結果に基づいて、雑音スペクトル推定部４に於いて、現フレームが音声区間でない場合には、メモリから非音声フレームの過去数フレームの振幅スペクトルを読み出して、これらと現フレームの振幅スペクトルとから平均振幅スペクトルを計算し、その平均振幅スペクトルを推定雑音スペクトルとする。この平均のフレーム数は、例えば８ｋＨｚサンプリングで１フレーム幅が１２８ポイントであって６４ポイントの重複がある場合を家庭すると、１０フレーム程度が良い（以下も、この分析条件を仮定する）。
【００３５】
ここで、ステップ４で述べたように、音声／非音声区間を帯域別に判定し、雑音スペクトルの算出も過去数フレームの非音声帯域について平均化しても良い。この場合、音声区間であっても音声信号が存在しない帯域については雑音スペクトルの更新が継続できるので、推定の精度が向上する。
【００３６】
ステップＳ６：続いて、平均スペクトル算出部５に於いて、メモリから過去数フレームの振幅スペクトルを読み出して、これらと現フレームの振幅スペクトルとから平均振幅スペクトルＸ’（ｗ）を計算する。この平均のフレーム数は、ステップＳ４の判別結果に基づいて、現フレームが非音声区間の場合をＡ個、現フレームが音声区間の場合をＢ個とすると、Ａ：Ｂ＝２：１程度の比率に設定する。例えばステップＳ５で述べた分析条件では、Ａ＝６、Ｂ＝３程度のフレーム数が良い。過去フレームには音声区間と非音声区間が混在する場合もあるが、そのまま平均振幅スペクトルを算出して良い。
【００３７】
このように平均スペクトルを算出する際に音声・非音声区間で時間幅（平均するフレーム数）を切り替えることにより、非音声区間では時間的な応答速度を遅くすることにつながり、残留雑音のフレーム間の不連続さを抑制し、音声区間では時間的な応答速度を高くする事で可減算等による歪の発生を防ぐことができる。
【００３８】
ステップＳ７：こうして算出された、現フレームにおける推定雑音スペクトルＮ（ｗ）と平均振幅スペクトルＸ’（ｗ）の両方を用いて、減算フィルタ算出部６において、次の（数３）に従って現フレームのスペクトル減算フィルタＨ（ｗ）を算出する。
【００３９】
【数３】

【００４０】
ここで、Ｈ（ｗ）の下限値を０としているが、例えば加減算を許して負の値に設定したり、逆に０より大きな値に設定することで、スペクトル減算処理の全体的な強度を制御することが出来る。
【００４１】
ステップＳ８：その後、スペクトル減算部７において、スペクトル算出部２の出力する現フレームの振幅スペクトルに上記減算フィルタ算出部６の出力するスペクトル減算フィルタＨ（ｗ）を（数４）のとおり適用することで、推定雑音スペクトルの減算を行う。
【００４２】
【数４】

【００４３】
Ｓ（ｗ）はスペクトル減算処理により雑音が抑圧された、音声信号の振幅スペクトルである。
【００４４】
ステップＳ９：スペクトル減算部７の出力を波形算出部８において逆フーリエ変換（ＩＦＦＴ）し、フレーム単位の波形信号を得る。
【００４５】
ステップＳ１０：さらに波形合成部９において、フレーム単位の波形を順次重複しつつ加算する事により連続的な音声波形を合成して、終了する。
【００４６】
なお、コンピュータで実行される場合には以上のフローチャートで示した雑音抑圧方法に従って処理プログラムを作成する。
【００４７】
以上のような実施の形態によれば、スペクトル減算法による残留雑音が抑制され、特にミュージカルノイズと呼ばれるフレーム間不連続で耳障りな種類の残留雑音が、フレーム間連続で耳障りでない雑音へとある程度質的に変化するため、聴感的なＳＮＲが一層向上する効果が得られる。
【００４８】
こうして、簡単な構成や処理により、Ｓ／Ｎ比を改善するとともに聴感的な音質を向上することができる。
【００４９】
（実施の形態２）
図２は本発明の実施の形態２における雑音抑圧装置のブロック構成図である。図２のブロック構成において、フレーム分割部２１は、入力信号を一定間隔毎に切り出す。スペクトル算出部２２は、フレーム信号に窓関数を掛け、ＦＦＴ等により短時間スペクトルを算出する。音声区間判定部２３は、雑音を含む音声区間と雑音のみの区間との境界を検出する。雑音スペクトル推定部２４は、音声区間判定部２３により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する。
【００５０】
減算フィルタ算出部２５は、雑音スペクトル推定部２４からの雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。
【００５１】
減算フィルタ平均部２６は、減算フィルタ算出部２５により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を固定の時間幅で算出する。スペクトル減算部２７は、入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算する。波形算出部２８は、スペクトル減算部２７の出力を逆フーリエ変換（ＩＦＦＴ）する事で時間領域の波形数値を算出する。波形合成部２９は波形算出部２８の出力波形を加算して合成し出力する。
【００５２】
本実施の形態ではスペクトル減算フィルタを時間平均化するが、時間平均のフレーム数を固定することで、音声歪の影響が少ない使用状況における演算量を削減している。
【００５３】
（実施の形態３）
図３は本発明の実施の形態３の雑音抑圧装置のブロック構成図であり、図７は同実施の形態３の雑音抑圧方式の制御を示すフローチャートである。本実施の形態では振幅スペクトルを平均化するのではなく、図３のブロック構成と図７のフローチャートに示すようにスペクトル減算フィルタを時間平均化する。
【００５４】
図３において、フレーム分割部１１は、入力信号を一定間隔毎に切り出す。スペクトル算出部１２は、フレーム信号に窓関数を掛け、ＦＦＴ等により短時間スペクトルを算出する。音声区間判定部１３は、雑音を含む音声区間と雑音のみの区間との境界を検出する。雑音スペクトル推定部１４は、音声区間判定部１３により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する。
【００５５】
減算フィルタ算出部１５は、雑音スペクトル推定部１４からの雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する。
【００５６】
減算フィルタ平均部１６は減算フィルタ算出部１５により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を算出する。その際、減算フィルタ平均部１６は非音声区間は長い時間幅で、音声区間は短い時間幅で適応的に平均値を算出する。スペクトル減算部１７は、入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算する。
【００５７】
波形算出部１８は、スペクトル減算部１７の出力を逆フーリエ変換（ＩＦＦＴ）する事で時間領域の波形数値を算出する。波形合成部１９は波形算出部１８の出力波形を加算して合成し出力する。
【００５８】
本実施の形態ではスペクトル減算フィルタを時間平均化することにより、フレーム間で減算フィルタ形状が変動して残留雑音が不連続に成る事を抑制する。時間平均のフレーム数は実施の形態１と同様に音声／非音声区間で切り替えることで、この処理による音声歪の増加を避けている。
【００５９】
（実施の形態４）
図４は、音声通信装置の受話音声に本雑音除去方式を適用した実施の形態のブロック構成を示す。すなわち、音声通信装置に前実施の形態１〜３いずれかの雑音抑圧装置を内蔵する事により雑音の少ない明瞭な受話音声が得られ、送話音声に適用する事により通話相手に明瞭な音声を送信することが可能になる。
【００６０】
なお、前実施の形態１〜３いずれかの雑音抑圧装置を音声録音／再生装置に内蔵し、録音の前処理または再生の後処理として実行することで、雑音除去の効果が得られる。また、音声認識装置の前処理として入力音声に適用することで、雑音下の音声認識精度の向上が期待できる。
【００６１】
実際の音声信号による本発明の効果の例を図１０に示す。図１０は本発明による雑音抑圧方式の効果の例を示す波形およびスペクトログラムを示す。なお、図８は雑音抑圧処理を施さない入力信号の波形およびスペクトログラムを示す。また図９は従来のスペクトル減算法による波形およびスペクトログラムを示す。白色系の雑音が混入した音声信号に対し、従来のスペクトル減算法の例（推定雑音スペクトルと現フレームのスペクトルのみから減算フィルタを算出した。）では、ＳＮＲは改善されるものの、残留雑音のスペクトルが部分的に不連続なので耳障りに感じられる。一方、本発明の請求項６の雑音抑圧方法を入力音声に適用すると、同様にＳＮＲが改善されるが、残留雑音のスペクトルが連続的なので従来方法よりも耳障りに感じられない効果がある。
【００６２】
なお、本発明は上述した各実施の形態に限定されるものではなく、発明の主旨を逸脱しない範囲内において種々の変形や応用が可能であることは勿論である。本発明の用途は図４に示すように音声通信機器に内蔵する場合の他に、図５に示すように音声録音／再生装置に内蔵し、録音の前処理または再生の後処理として実行することで、雑音除去の効果が得られる。また図５に示すように、音声認識装置の前処理として入力音声に適用することで、雑音下の音声認識精度の向上が期待できる。
【００６３】
【発明の効果】
本発明は、雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、この音声区間判定部により判定された非音声区間において信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、音声区間判定部の区間判定結果を参考に、非音声区間は長い時間幅（多いフレーム数）で、音声区間は短い時間幅（少ないフレーム数）で入力信号スペクトルの時間平均値を適応的に算出する平均スペクトル算出部と、前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部とを設けた構成により、残留雑音のフレーム間不連続性が改善され、不連続な残留雑音を削減して聴感的なＳＮＲが向上する効果がある。
【図面の簡単な説明】
【図１】本発明の実施の形態１の雑音抑圧装置のブロック構成図
【図２】本発明の実施の形態２の雑音抑圧装置のブロック構成図
【図３】本発明の実施の形態３の雑音抑圧装置のブロック構成図
【図４】本発明の実施の形態４の音声通信装置のブロック構成図
【図５】本発明による雑音抑圧装置のその他の応用例のブロック構成図
【図６】本発明の実施の形態１の雑音抑圧方式の制御を示すフローチャート
【図７】本発明の実施の形態３の雑音抑圧方式の制御を示すフローチャート
【図８】雑音抑圧処理を施さない入力信号の波形およびスペクトログラムを示す図
【図９】従来のスペクトル減算法による波形およびスペクトログラムを示す図
【図１０】本発明による雑音抑圧方式の効果の例を示す波形およびスペクトログラムを示す図
【符号の説明】
１　フレーム分割部
２　スペクトル算出部
３　音声区間判定部
４　雑音スペクトル推定部
５　平均スペクトル算出部
６　減算フィルタ算出部
７　スペクトル減算部
８　波形算出部
９　波形合成部

Claims

入力信号を一定間隔毎に切り出すフレーム分割部と、
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出する平均スペクトル算出部と、
前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。
入力信号を一定間隔毎に切り出すフレーム分割部と、
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
前記減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を所定の時間幅で算出する減算フィルタ平均部と、
前記入力信号スペクトルに前記減算フィルタ平均部によって平均されたフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。
入力信号を一定間隔毎に切り出すフレーム分割部と、
フレーム分割された信号のスペクトルを算出するスペクトル算出部と、
入力信号の音声区間と非音声区間雑音を判別する音声区間判定部と、
前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
前期減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、音声区間における時間幅よりも非音声区間における時間幅を長くして算出する減算フィルタ平均部と、
前記入力信号スペクトルに前記減算フィルタ平均部によって平均されたフィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。
請求項１〜３いずれかの雑音抑圧装置を内蔵し、背景雑音や回線雑音がある状況において聴感的なＳＮＲが良い音声通信が可能なことを特徴とする音声通信装置。
ａ）入力信号を一定間隔毎に切り出すフレーム分割部と、
ｂ）フレーム信号に窓関数を掛け、ＦＦＴ等により短時間スペクトルを算出するスペクトル算出部と、
ｃ）雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
ｄ）前記音声区間判定部により判定された非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
ｅ）入力信号スペクトルの数フレーム分の時間平均値を、非音声区間は長く音声区間は短い時間幅で適応的に算出する平均スペクトル算出部と、
ｆ）前記雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
ｇ）入力信号スペクトルに前記フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。
ａ）入力信号を一定間隔毎に切り出すフレーム分割部と、
ｂ）フレーム信号に窓関数を掛け、ＦＦＴ等により短時間スペクトルを算出するスペクトル算出部と、
ｃ）雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
ｄ）前記音声区間判定部により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
ｅ）前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
ｆ）フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を固定の時間幅で算出する減算フィルタ平均部と、
ｇ）入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。
減算フィルタ平均部は、減算フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を音声区間における時間幅よりも非音声区間における時間幅を長くして算出する事を特徴とする請求項６記載の雑音抑圧装置。
ａ）入力信号を一定間隔毎に切り出すフレーム分割部と、
ｂ）フレーム信号に窓関数を掛け、ＦＦＴ等により短時間スペクトルを算出するスペクトル算出部と、
ｃ）雑音を含む音声区間と雑音のみの区間との境界を検出する音声区間判定部と、
ｄ）前記音声区間判定部により判定された非音声区間において、信号スペクトルの数フレーム分の平均値を算出することで雑音スペクトルを推定する雑音スペクトル推定部と、
ｅ）前記雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算のフィルタ形状を算出する減算フィルタ算出部と、
ｆ）前記フィルタ算出部により算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、非音声区間は長く音声区間は短い時間幅で適応的に算出する減算フィルタ平均部と、
ｇ）入力信号スペクトルに前記平均フィルタを乗算する事で雑音スペクトルを減算するスペクトル減算部とにより構成した事を特徴とする雑音抑圧装置。
ａ）入力信号を一定間隔毎に切り出すフレーム分割部し、
ｂ）フレーム分割された信号のスペクトルを算出し、
ｃ）入力信号の音声区間と非音声区間雑音を判別し、
ｄ）非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
ｅ）音声区間における時間幅よりも非音声区間における時間幅を長くして入力信号スペクトルの時間平均値を算出し、
ｆ）雑音スペクトルと平均スペクトルとを比較して、スペクトル減算のフィルタ形状を算出し、
ｇ）入力信号スペクトルに前記算出されたフィルタを乗算する事で雑音スペクトルを減算するステップを有する雑音抑圧方法。
ａ）入力信号を一定間隔毎に切り出すフレーム分割部し、
ｂ）フレーム分割された信号のスペクトルを算出し、
ｃ）入力信号の音声区間と非音声区間雑音を判別し、
ｄ）非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
ｅ）雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算フィルタを算出し、
ｆ）算出されたスペクトル減算フィルタの数フレーム分の時間平均値を所定の時間幅で算出し、
ｇ）入力信号スペクトルに前記平均されたスペクトル減算フィルタを乗算する事で雑音スペクトルを減算するステップを有する雑音抑圧方法。
ａ）入力信号を一定間隔毎に切り出すフレーム分割部し、
ｂ）フレーム分割された信号のスペクトルを算出し、
ｃ）入力信号の音声区間と非音声区間雑音を判別し、
ｄ）非音声区間において、信号スペクトルの過去数フレーム分の平均値を算出することで雑音スペクトルを推定し、
ｅ）雑音スペクトルと入力信号スペクトルとを比較してスペクトル減算フィルタを算出し、
ｆ）算出されたスペクトル減算フィルタの数フレーム分の時間平均値を、非音声区間は長く音声区間は短い時間幅で適応的に算出し、
ｇ）入力信号スペクトルに前記平均されたスペクトル減算フィルタを乗算する事で雑音スペクトルを減算するステップを有する事を特徴とする雑音抑圧方法。