JP5131149B2 - 雑音抑圧装置及び雑音抑圧方法 - Google Patents
雑音抑圧装置及び雑音抑圧方法 Download PDFInfo
- Publication number
- JP5131149B2 JP5131149B2 JP2008274895A JP2008274895A JP5131149B2 JP 5131149 B2 JP5131149 B2 JP 5131149B2 JP 2008274895 A JP2008274895 A JP 2008274895A JP 2008274895 A JP2008274895 A JP 2008274895A JP 5131149 B2 JP5131149 B2 JP 5131149B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- noise suppression
- frame
- voice
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
そのような雑音抑圧の技術としては、例えば以下の特許文献1及び非特許文献1乃至4に開示されているようなものが知られている。
例えば、雑音を実効的に抑圧するためには、入力信号に含まれる音声フレーム(主に音声が占める部分)と雑音フレーム(音声が殆どない部分)との区別に着目するのが有力である。前者では、雑音の存在が然程目立たず、後者では、その逆であるという状況が想定されるため、両者間で雑音抑圧処理の態様を異ならせることが行われるのである。
しかしながら、この場合、音声フレームと雑音フレームとの区別が、正確に行われることが是非とも要求される。そうでなければ、本当は(あるいは実体は)音声フレームであるのに、雑音フレーム用の雑音抑圧処理が行われ、あるいは、その逆の事態が生じることとなって、実効的な雑音抑圧処理が行われないおそれが出てくることになるからである。
そして、本発明によれば、そのような正確な音声検出、あるいは音声フレーム及び雑音フレームの区分に応じた、雑音抑圧処理が行われることから、より実効的な雑音抑圧効果を享受することができる。
本態様によれば、既に述べたように、正確な音声フレーム及び雑音フレームの区分に応じた雑音抑圧処理が行われることから、より実効的な雑音抑圧効果を享受することができる。
なお、本発明において、音声が「含まれる」あるいは「含まれない」という用語は、いわば絶対的な意味に解されてはならない。例えば、“すべてが音声”で満たされるフレームと、“全く音声が不存在”のフレームという2つの態様が観念的には想定されるが、この両者両極端を指して「音声フレーム」及び「雑音フレーム」の区別が行われる場合に本発明が限定されるわけでは勿論なく、また、後者のみが「雑音フレーム」で、それ以外はすべて「音声フレーム」という区別が行われる場合に、本発明が限定されるわけでもない。つまり、本発明は、「雑音フレーム」と認定される場合においても、当該の雑音フレームに「音声」が全く含まれてはならないということまで要求せず、本発明にいう「音声フレーム」及び「雑音フレーム」の区別は、上記の2つの場合の適当な中間点を基準に行われてよいのである。
以上のような意味において、本発明にいう「含まれる」あるいは「含まれない」という用語、あるいは、本発明に係る「音声フレーム」及び「雑音フレーム」の区別は、相対的なものということができる。
本態様によれば、前記散らばりの程度が第1所定値以上である場合に、音声フレームを認定する(したがって、好適には、第1所定値を下回る場合に、「雑音フレーム」を認定するとよい。)。このように、本態様では、比較的容易な手法によりながら、なお前述したような正確な音声フレーム及び雑音フレームの区分を行うことになるので、処理の効率化等が達成される。
本態様によれば、散らばりの程度に、分散が含まれるので、その「散らばりの程度」の実質がよりよく把握されるので、前述した本発明に係る作用効果がより実効的に享受される。この点についての、より詳細な具体例については、後述する実施形態、特に式(9)に関して説明される。
なお、本態様にいう「雑音抑圧ゲインの分散」なる概念は、前記K個の周波数帯域に関するものとして、即ち、周波数軸上の分散を含むほか、時間軸上の分散をも含む。また、「分散」が求められる以上は、「標準偏差」は一義的に導出可能であるので、「散らばりの程度」に「雑音抑圧ゲインの標準偏差」が含まれる場合も、本発明は当然含む。
本態様によれば、散らばりの程度が、例えば次のように把握される。すなわち、K個の雑音抑圧ゲインが、仮にG(1),G(2),…,G(K)と表されるとして、そのうちのG(1)が最大値であり、G(K)が最小値であるとする場合、G(1)−G(K)が、ある所定値以上となるなら、その散らばりの程度は大であり、そうでなければ小である、などというようである。
いずれにしても、本態様によっても、「散らばりの程度」の実質がよりよく把握されるので、前述した本発明に係る作用効果がより実効的に享受される。
本態様によれば、上述した、本発明に係る雑音抑圧装置の各種態様のうち、散らばりの程度が「分散」を含む態様に関して述べた作用効果と本質的に異ならない作用効果が奏されることが明白である。
以下では、本発明に係る第1の実施の形態について図1を参照しながら説明する。なお、ここに言及した図1に加え、以下で参照する各図面(例えば図6等のグラフをも含む。)においては、各部の寸法の比率が実際のものとは適宜に異ならせてある場合がある。
前記の周波数領域の信号は、振幅スペクトル及び位相スペクトルに分けられ、このうちの位相スペクトルは、後述する周波数・時間変換部70にそのまま送られる。他方、振幅スペクトルは、後述する雑音スペクトル推定部20以後の各部に送られて、後述する各種の処理を受ける。
この音声信号は、例えば、入力信号のレベルが予め定めた閾値を超えるか否かを基準として検出される。もっとも、本発明は、これ以外にも様々な手法を採用することが可能である。例えば、確率・統計的手法を用いて音声信号の発生確率を推定する手法等が採用されてもよいし、あるいは、検出対象としても、前記入力信号を利用するのではなく、そのフーリエ変換後の信号(つまり、前記でいう周波数領域の信号)を利用する手法等が採用されてもよい。
なお、以下では、この音声検出部80によって音声信号が存在すると判定されたフレームは、「音声フレーム」と、不存在であると判定されたフレームは、「雑音フレーム」と、それぞれ呼ぶことがある。なお、ここで存在・不存在というのは、いわば絶対的な意義をもたない。前述のように、音声信号の有無が所定の閾値を基準に判断されることがある以上、「雑音フレーム」に、厳密に言えば音声信号と呼べるものが含まれている可能性は排除されない。
ここで、Nt(n)は、現に処理中であるフレームにおける雑音スペクトル推定値、Nt−1(n)は、その直前のフレームにおける雑音スペクトル推定値(したがって、“t”は、現に処理中であるフレームそれ自体を表現する添え字である。)、Y(n)は入力された振幅スペクトル、nは周波数帯域(に付けられた番号。なお、周波数帯域はN個に分割される。なお、このNは、本発明にいう「K個の周波数帯域」のK以下(=N≦K)である。)、βは平滑化係数である。また、式(1)中、case・Aとあるのは、雑音スペクトル推定部20が雑音フレームを処理する場合を表現し、case・Bとあるのは、音声フレームを処理する場合を表現している。
このように、雑音スペクトル推定部20は、現に処理しているフレームが、雑音フレームであるか音声フレームであるかに応じて、雑音スペクトル推定値Nt(n)を求めるために利用する式を変更する。すなわち、音声フレーム処理時(case・B)には、その直前の雑音スペクトル推定値をそのまま用いて雑音スペクトル推定値Nt(t)を求め、雑音フレーム処理時(case・A)には、入力した振幅スペクトルを時間軸上で平滑化することで、雑音スペクトル推定値Nt(n)を求める。
ここで、max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する(以下、同じ。)。
この式(2)により、入力された振幅スペクトルY(n)に対する雑音スペクトル推定値Nt(n)との間において、Y(n)<Nt(n)が成立する場合は、G(n)=0となり、Y(n)>Nt(n)が成立する場合は、G(n)=(Y(n)−Nt(n))/Y(n)となる。
この雑音抑圧ゲイン演算部30で算出された雑音抑圧ゲインは、前記音声検出部80によって区分された音声フレーム及び雑音フレームの別に応じて、雑音期間・雑音抑圧ゲイン演算部40を介して又は直接に、原音加算ゲイン演算部60に供給される。図1に示す雑音抑圧装置1は、このような処理を実現するためのスイッチを備える(図中弧線矢印参照)。
まず、式(2)で求められた雑音抑圧ゲインG(n)に基づいて、以下の式(3)で表現されるgが算出される。
このgは、式(3)の右辺から明らかなように、式(2)の雑音抑圧ゲインについての、周波数帯域nに関する平均値を意味する。
次いで、この式(3)の雑音抑圧ゲイン平均値gが、以下の式(4)によって平滑化される。
ここで、μは平滑化係数、Gtは、現に処理中である雑音フレームについての雑音抑圧ゲイン、Gt−1は、その直前に処理した雑音フレームについての雑音抑圧ゲインである。
前述の式(1)のcase・Aとして示される式もそうであるが、この式(4)では、現に処理中のフレームにおける雑音抑圧ゲインを求めるにあたって、その直前に処理されたフレームにおけるそれが参照されていることから、時間軸上で平滑化が行われているということがいえる(後述する式(7)についても同様である。)。
この式(4)中のGtが、本雑音期間用ゲイン演算部40において求められるべき、雑音期間に適用するための雑音抑圧ゲイン(以下、簡単のため、「雑音期間用ゲイン」ということがある。)である。
雑音期間用ゲイン演算部40は、このようにして求められた雑音期間用ゲインGtを、すべての周波数帯域に対して一律に適用する。以下では、この事情を表現するため、この一律に適用されるGtを、G1(n)と表現する。この場合、G1(0),G1(1),…,G1(N−1)のすべてが、Gtに等しい。
ここで、tgは、目標雑音抑圧ゲインであり、以下の式(6)に基づいている。
この式(6)中のTGは、目標雑音抑圧量であり、dB単位で与えられる。このTG(あるいは、tg)は、装置外部から図示しない操作部等を介することによって人為的に与えられたり、あるいは、何らかの適当な手法により自動的に演算されてよい。
以上の式(5)によれば、目標雑音抑圧ゲインtgと雑音期間用ゲインGtとの間において、tg<Gtが成立する場合は、og=0となり、tg≧Gtが成立する場合は、og=tg−Gtとなる。
まず、式(5)で求められた原音加算率ogに基づいて、以下の式(7)で表現されるOGtが算出される。
ここでOGtは、現に処理中であるフレームにおける原音加算割合、OGt−1は、その直前のフレームにおける原音加算割合、λは平滑化係数である。なお、式(7)中のcase・A及びcase・Bの意義は、上述の式(1)の場合と同様である(以下の式(8)においても同じである。)。
このように、原音加算ゲイン演算部60は、現に処理しているフレームが、雑音フレームであるか音声フレームであるかに応じて、原音加算割合OGtを求めるために利用する式を変更する。すなわち、音声フレーム処理時(case・B)には、その直前の原音加算割合をそのまま用いて、原音加算割合OGtを求め、雑音フレーム処理時(case・A)には、前記の原音加算率ogを時間軸上で平滑化することで、原音加算割合OGtを求める。
ここで、G1(n)は、上で説明したように、雑音フレームにおいて、すべての周波数帯域に対して一律に適用される雑音期間用ゲインを表している。
この式(8)によれば、前述の式(7)における場合分けに応じて、原音加算後の雑音抑圧ゲインG2(n)(以下、簡単のため、「修正後ゲインG2(n)」ということがある。)が求められる。
まず、時間・周波数変換部10は、入力信号に対して、フーリエ変換を施し、更にこれを、図1に示すように、振幅スペクトルY(n)及び位相スペクトルに分解する(図2のステップS101)。この際、時間・周波数変換部10は、前述のように、フレームごとの処理を実施する。
また、これと並行して、音声検出部80は、入力信号中に含まれる音声信号の有無を検出する(図2のステップS102)。この検出処理は、入力信号を、音声フレームと雑音フレームとに分別する処理を可能にする。音声検出部80は、当該の処理も行う。
なお、このような分別処理は、図1に示すように、音声検出部80の検出結果に応じたスイッチの切り替えによっている。
このように、第1実施形態においては、式(2)により求められる雑音抑圧ゲインG(n)をそのままの状態で用いるのではなく、そのG(n)に対して、式(3)による周波数帯域に関する平均化、及び、式(4)による時間軸上の平滑化、を行った後の雑音期間用ゲインGtを、全周波数帯域用の雑音期間用ゲインG1(n)として用いることに、その大きな特徴の1つがある。
なお、図3(D)では、雑音抑圧ゲインG(n)に対する平均化処理を行った場合の一例が例示されている(図3(C)中に示される破線も参照)。
このように、第1実施形態においては、原音加算率ogが、雑音期間用ゲインGtを利用することによって求められることに、その大きな特徴の1つがある。
この場合、この修正後ゲインG2(n)は結局、前述の平均化・平滑化を経た雑音期間用ゲインG1(n)と、原音加算の程度とを勘案した上で決定されたゲインであるという意味合いをもつ。
ただし、この音声フレーム処理では、雑音フレーム処理と比べて、以下のような異同、あるいは注意点がある。
要するに、音声フレームでは、直近の雑音フレームにおいて算出された雑音スペクトル推定値Nt−p(n)(pは、当該の音声フレームの直前のフレームから数えて、その直近の雑音フレームまでのフレーム数(両端を含む。))が利用されることになるのである。
上述の場合と表現を一致させるなら、音声フレームでは、直近の雑音フレームにおいて算出された原音加算割合OGt−p(n)(pは、当該の音声フレームの直前のフレームから数えて、その直近の雑音フレームまでのフレーム数(両端を含む。))が利用される、ということになる。
図3(E)では、簡単のため、単純に図3(A)の振幅スペクトルY(n)に、図3(C)の平均化された雑音抑圧ゲイン(つまり、g)が乗算された結果が示されている。第1実施形態では、上述のように、これに加えて、原音加算の程度に配慮されたゲインの調整が更に行われはするが(式(8)、特にOGt(n)の役割、参照)、図3(E)は、仮に、そのような原音加算処理への配慮を省く場合を想定したときの処理の本質をよく表している(式(8)において、OGt(n)=0ならば、修正後ゲインG2(n)は、単にG1(n)、又は、G(n)に等しいというだけである。)。
まず、第1実施形態の雑音抑圧装置1によれば、入力信号に含まれる雑音が極めて好適に抑圧される。ここで「好適に」ということのうちには、第1実施形態において特に、以下に記す各点の内実が含まれる。
例えば、雑音スペクトル推定値に基づく雑音抑圧ゲインは、簡単には、前記式(2)中の(Y(n)−N(n))/Y(n)を用いて求めることが可能であり、これをそのまま図1に示す乗算器11で適用する態様を想定すれば、雑音抑圧後の振幅スペクトルS(n)は、S(n)={(Y(n)−N(n))/Y(n)}・Y(n)=Y(n)−N(n)として求められることになる。つまり、この場合は、入力信号の振幅スペクトルから雑音スペクトル推定値を単純に差し引くことによって、雑音抑圧後の振幅スペクトルS(n)が得られることになる。
しかし、この場合の雑音スペクトル推定値は、あくまでも“推定値”であるから、必ずしも、実際の雑音スペクトルを反映しているとは限らない。したがって、ある周波数帯域では、雑音スペクトル推定値差し引き後にもなお雑音が残る場合があり、また、他の周波数帯域では、引き過ぎが生じる場合もある(この引き過ぎの場合は、負の振幅スペクトルが考えられない以上、0に設定される。)。図4では、このような事情が概念的に表現されており、例えば図4(C)中の実線は引き残り(符号“KN”参照)、破線は引き過ぎ(符号“HS”参照)の各場合を表現している(なお、図4(A)及び(B)は、図3(A)及び(B)と全く同じである。また、図4(C)の符号HStが指示する部分は、たまたま、Y(n)−N(n)=0が成立する場合の例示である。)。
このような振幅スペクトルS(n)を時間領域に逆フーリエ変換すると、その信号は、複数のランダムな周波数をもつ正弦波が合成されたもののようになり、これが再生されれば、非常に耳障りな音となって聞こえてくることになる。これがミュージカルノイズである。
このように、ミュージカルノイズは、厳密に言えば不可知の実際の雑音スペクトルと、雑音スペクトル推定値とが一致しないことを主な原因として発生する。
以上の(2)及び(3)を要するに、第1実施形態では、音声フレームにおいて、実効的な雑音抑圧が行われながらも、なお雑音フレーム処理時における雑音抑圧処理(特に、その効果)を尊重して、両フレーム間の流れがより自然なものとなるような工夫がなされているのである。これによれば、第1実施形態の雑音抑圧装置1が何らかの音声再生手段に接続されたとした場合、雑音フレームから音声フレームへの切り替わりの場面において、聴取者に、雑音に係る音量感の変更等々の聴感上の違和感を与えることがない。
また、図4(C)中の破線で示す、雑音抑圧後の振幅スペクトルが0となってしまう部分(即ち、符号HS及びHStが指示する部分)に、一定の値(ノイズ・フロア)を加算する手法をとることによって、ミュージカルノイズを抑圧することも考えられる。これは、当該の部分HS及びHStに、いわば下駄を履かせることによって、引き残りの部分KNをマスキングしよう(あるいは、目立たなくしよう)とする発想に出ている(また、この手法と、前記のαを使う手法とを併用する場合、αはより小さく設定されてもよいから、その場合、音質の劣化防止という効果も得られる。)。
しかし、このようなノイズ・フロアの加算は、とりもなおさず雑音の絶対量を増加させることを意味するから、雑音抑圧という本来の目的達成の観点からみて問題があるだけでなく、そのノイズ・フロアの量の設定如何によっては、雑音抑圧効果が極めて不十分になるおそれが高いという問題を生じさせる。
なお、上述においては、第1実施形態の雑音抑圧装置1によって奏される効果をより明瞭に把握するため、前記αを用いる手法、あるいはノイズ・フロアを用いる手法との対比において、当該効果についての説明を行っている部分があるが、本発明は、これらαあるいはノイズ・フロアを用いてミュージカルノイズを抑圧する手法を積極的に排除する意図までは有しない。すなわち、これらの手法と本発明及びその各種態様とは併用可能であり、そのような併用形態によれば、当該手法の良いところを享受しつつ、本発明及びその各種態様の効果をより際立たせること等が可能となる。
(4-i) まず、原音加算の割合(即ち、OGt)が、雑音期間用ゲインGtと目標雑音抑圧ゲインtgとの大きさの如何に応じて定まる原音加算率ogに基づいて定められるようになっている。具体的には、既に述べたように、原音加算処理においては、目標としている雑音抑圧の程度(即ち、tg)を支配的要因の1つとし、これとの関係において原音加算率ogが決められるようになっているので、雑音期間用ゲインGtに基づく処理と、原音加算処理との間で、バランスがとれた使い分けが行われることにより、より実効的に雑音抑圧効果ないしミュージカルノイズ抑圧効果、さらには音質改善効果が享受されることになる。
以下では、本発明に係る第2の実施の形態について図5乃至図7を参照しながら説明する。なお、この第2実施形態は、上記第1実施形態との対比において、音声検出処理に関連する相違点があり、その他の点については、特に断りがない限り上記第1実施形態と全く同じである。したがって、以下では、前記相違点に関する説明を主に行い、その他の点についての説明は簡略化ないし省略する。また、図面上の符号についても前記相違点以外については流用する。
まず、式(2)で求められた雑音抑圧ゲインG(n)に基づいて、以下の式(9)で表現されるVarが算出される。
ここで、gは、上記第1実施形態において利用されていた式(3)によって表現されるgであって、要するに、G(n)についての周波数帯域nに関する平均値である(第2実施形態は、このgの演算を、雑音期間用ゲイン演算部40だけでなく、音声検出部801も行う。むろん、両者の一方で行った演算の結果を、両者間で共用してもよい。)。
この式(9)のVarは、表式から明らかな通り、G(n)の分散を表す。
一般に、式(2)によって算出される雑音抑圧ゲインG(n)は、音声信号が含まれる場合と含まれない場合とで大きく異なる様相を示す。図6及び図7はその一例を示しており、前者は、音声信号が含まれる場合の雑音抑圧ゲインG(n)の演算例、後者は、含まれない場合の雑音抑圧ゲインG(n)の演算例である。これらの図を対比すると明らかなように、両者の場合それぞれにおけるG(n)の分散を計算すれば、両者間に大きな隔たりが生じることが容易に推測される。つまり、あるフレームについてのG(n)の分散の値が一定程度大きければ、それは音声信号を含み、そうでなければ、音声信号を含まないという判断を行うことが、相当程度の確からしさで可能である。
前述のVarに係る大小判断の意義は、ここにある。改めていえば、ある所定値VBがあるとして、Var>VBであれば、当該フレームには音声信号があり、したがって、それは「音声フレーム」に区別され、Var≦VBであれば、当該フレームには音声信号がなく、したがって、それは「雑音フレーム」に区別される、ということになる。
このような場合における雑音スペクトル推定値Nt(n)は、例えば、以下の式(10)及び式(11)によって求められてよい。
ここで、PAt(n)は、現に処理中であるフレームにおける入力信号中の振幅スペクトルであって平滑化されたもの、PAt−1(n)は、その直前のフレームにおける当該振幅スペクトルであって平滑化されたもの、αは平滑化係数、γ・βは制御パラメータである。また、式(11)中、case・Cとあるのは、PAt(n)>Nt−1(n)が成立する場合を表現し、case・Dとあるのは、それ以外の場合を表現している。
他方、式(11)のcase・Cとして示される式は、前記式(1)中においては該当するものはない。もっとも、この式は、上述のように、即ちPAt(n)>Nt−1(n)が成立する場合、即ち、現に処理中であるフレームにおける振幅スペクトルが、その直前のフレームにおける雑音スペクトル推定値を越える場合に発動するから、このcase・Cは、その現に処理中であるフレームが、音声フレームである可能性を示唆するものと捉えることも不可能でない(仮に、多くのn(=0,1,2,3,…)について、かかる条件が満たされるなら、その可能性はより高まるといえる。ただし、あくまでも“示唆”に過ぎない。)。
これら式(10)及び式(11)は、以上のような意味における限りで、前記式(1)と共通性をもつといえる。
いずれにしても、雑音スペクトル推定値が好適に算出されることに変わりはない。
まず、この第2実施形態によっても、上記第1実施形態によって奏された作用効果と本質的に異ならない作用効果が奏されることは明白である。すなわち、この第2実施形態でも、上記第1実施形態に関し述べた(1)から(4)の効果がほぼ同様に奏される。
本発明においては、雑音抑圧ゲインG(n)の演算は必ず行わなければならない処理である以上、その演算結果を利用して音声検出処理をも行ってしまうことが、処理の効率化・合理化を導くことは論を俟たない。しかも、その検出性能は相当程度高い(図6及び図7対比参照)。
(1) 上記第1及び第2実施形態では、雑音期間用ゲインGtが、周波数軸上で平均化され、時間軸上で平滑化されているが、本発明は、かかる形態に限定されない。上でも既に述べたが、平均化処理と平滑化処理とでは、その主な狙いが異なっているので、特に平滑化処理に関しては、場合によっては省略されてよい。図3(E)にみられるように、平均化処理だけを実施したとしても、ミュージカルノイズの抑圧効果は一定程度享受可能である。
まず、本発明において、雑音抑圧ゲイン平均値gは、式(3)によって求められる形態に限定されない。
すなわち、式(3)において、gは、N個すべての周波数帯域(全部でN個の0,1,2,…,N−1番目の周波数帯域)を用いて算出されているが、このgは、例えば、そのうちの一部だけの周波数帯域を用いて算出されてもよい。この場合、極低域(DC成分に近い帯域)や極高域(ナイキスト周波数に近い帯域)の双方又は一方を除く、周波数帯域を用いることが考えられる。
また、雑音抑圧ゲイン平均値gを求めるにあたっては、個々の周波数帯域に異なる重み付けを行ってもよい。例えば、ある特定の重み係数を特定の周波数帯域についてだけ乗算したり、あるいは、連続的、段階的に増加又は減少する重み付け係数をすべての周波数帯域について乗算したり、等々のようである。
次に、本発明において、雑音期間用ゲインGtは、前記式(4)によって求められる形態に限定されない。
すなわち、式(4)において、Gtは、雑音抑圧ゲイン平均値gを時間軸上で平滑化することにより求められているが、このGtは、例えば、相隣接するフレームのgの平均値として算出されてもよい。
例えば、前述した極低域や極高域の双方又は一方を除く周波数帯域にだけ、当該雑音期間用ゲインGtないしG1(n)が適用されてよい。この場合、その適用除外となった周波数帯域については、固定値たるゲインが適用されるとよい。
例えば、分散に代えて、標準偏差が用いられてよいことは当然、時間軸上の分散、あるいは標準偏差が用いられてもよい。また、周波数帯域ごとの雑音抑圧ゲインG(n)のうち、所定の2つの基準値によって画された空間内に収まるものが幾つあるか等に基づいて、音声フレーム及び雑音フレーム間の区別が行われてもよい(例えば、その数が比較的大であれば、雑音抑圧ゲインG(n)は一定の箇所に集中して存在すると判断可能であるから、その散らばりの程度は小さいといえ、したがって、当該のフレームは、雑音フレームと認定される、などというようである。)。さらには、上述した各種の判断手法は、場合によって併用されてよい。これによれば、例えば、散らばりの程度が、前記分散と前記空間内に収まる雑音抑圧ゲインG(n)の数との双方が参照された上で判断される、などということになる。
Y(n)……入力信号の振幅スペクトル、N(n)……雑音スペクトル推定値、G(n)……雑音抑圧ゲイン、g……雑音抑圧ゲイン平均値、Gt,G1(n)……雑音期間に適用するための雑音抑圧ゲイン(雑音期間用ゲイン)、og……原音加算率、tg……目標雑音抑圧ゲイン、TG……目標雑音抑圧量、OG……原音加算割合、G2(n)……原音加算後の雑音抑圧ゲイン(修正後ゲイン)
Claims (7)
- K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に含まれる音声の有無にかかわらず推定する雑音スペクトル推定手段と、
前記雑音スペクトル推定手段による推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出するゲイン演算手段と、
前記K個の周波数帯域ごとの雑音抑圧ゲインの値の散らばりの程度に基づいて、前記入力信号に含まれる音声の有無を検出する音声検出手段と、
前記音声検出手段の検出結果に応じた雑音抑圧処理を行う雑音抑圧手段と、
を備えることを特徴とする雑音抑圧装置。 - 前記音声検出手段は、検出された前記音声の有無に基づいて、
前記入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分し、
前記雑音抑圧手段は、
前記音声フレーム及び前記雑音フレームの別に応じた雑音抑圧処理を行う、
ことを特徴とする請求項1に記載の雑音抑圧装置。 - 前記音声検出手段は、
前記入力信号中のあるフレームに関する前記散らばりの程度が第1所定値以上である場合に、
当該フレームを前記音声フレームに区分する、
ことを特徴とする請求項1又は2に記載の雑音抑圧装置。 - 前記散らばりの程度は、
前記雑音抑圧ゲインの分散を含む、
ことを特徴とする請求項1乃至3のいずれか一項に記載の雑音抑圧装置。 - 前記散らばりの程度は、
前記K個の周波数帯域ごとの雑音抑圧ゲインの各値のうち最大値及び最小値間の差を含む、
ことを特徴とする請求項1乃至4のいずれか一項に記載の雑音抑圧装置。 - K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に含まれる音声の有無にかかわらず推定する雑音スペクトル推定工程と、
前記雑音スペクトル推定工程における推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出するゲイン演算工程と、
前記K個の周波数帯域ごとの雑音抑圧ゲインの値の散らばりの程度に基づいて、前記入力信号に含まれる音声の有無を検出する音声検出工程と、
前記音声検出手段の検出結果に応じた雑音抑圧処理を行う雑音抑圧工程と、
を含むことを特徴とする雑音抑圧方法。 - 前記散らばりの程度は、
前記雑音抑圧ゲインの分散を含む、
ことを特徴とする請求項6に記載の雑音抑圧方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008274895A JP5131149B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置及び雑音抑圧方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008274895A JP5131149B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置及び雑音抑圧方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010102203A JP2010102203A (ja) | 2010-05-06 |
JP5131149B2 true JP5131149B2 (ja) | 2013-01-30 |
Family
ID=42292887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008274895A Expired - Fee Related JP5131149B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置及び雑音抑圧方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5131149B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559887B (zh) * | 2013-11-04 | 2016-08-17 | 深港产学研基地 | 用于语音增强系统的背景噪声估计方法 |
CN112309414B (zh) * | 2020-07-21 | 2024-01-12 | 东莞市逸音电子科技有限公司 | 基于音频编解码的主动降噪方法、耳机及电子设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69736198T2 (de) * | 1997-09-02 | 2007-05-03 | Qualcomm, Inc., San Diego | System und verfahren zur regelung der kanalverstärkung für geräuschunterdrückung in der sprachkommunikation |
JP3454206B2 (ja) * | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP3574123B2 (ja) * | 2001-03-28 | 2004-10-06 | 三菱電機株式会社 | 雑音抑圧装置 |
JP3963850B2 (ja) * | 2003-03-11 | 2007-08-22 | 富士通株式会社 | 音声区間検出装置 |
US8239191B2 (en) * | 2006-09-15 | 2012-08-07 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
JP2008216721A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 雑音抑圧の方法、装置、及びプログラム |
JP4173525B2 (ja) * | 2007-04-23 | 2008-10-29 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
-
2008
- 2008-10-24 JP JP2008274895A patent/JP5131149B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010102203A (ja) | 2010-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5245714B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP5071346B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP5183828B2 (ja) | 雑音抑圧装置 | |
KR100860805B1 (ko) | 음성 강화 시스템 | |
JP4423300B2 (ja) | 雑音抑圧装置 | |
EP2546831B1 (en) | Noise suppression device | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
US8560308B2 (en) | Speech sound enhancement device utilizing ratio of the ambient to background noise | |
US7912567B2 (en) | Noise suppressor | |
JP5526524B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP2002508891A (ja) | 特に補聴器における雑音を低減する装置および方法 | |
JP2001134287A (ja) | 雑音抑圧装置 | |
WO2013118192A1 (ja) | 雑音抑圧装置 | |
WO2002101729A1 (fr) | Attenuateur de bruit | |
WO2005124739A1 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2014137405A (ja) | 音響処理装置及び音響処理方法 | |
JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP2021522550A (ja) | ギャップ信頼度を用いた背景雑音推定 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
Lu et al. | A gain factor adapted by masking property and SNR variation for speech enhancement in colored-noise corruptions | |
US11183172B2 (en) | Detection of fricatives in speech signals | |
JP5131149B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
Brouckxon et al. | Time and frequency dependent amplification for speech intelligibility enhancement in noisy environments | |
JP5316127B2 (ja) | 音処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121009 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121022 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |