JP2014518404A - 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 - Google Patents
雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 Download PDFInfo
- Publication number
- JP2014518404A JP2014518404A JP2014518528A JP2014518528A JP2014518404A JP 2014518404 A JP2014518404 A JP 2014518404A JP 2014518528 A JP2014518528 A JP 2014518528A JP 2014518528 A JP2014518528 A JP 2014518528A JP 2014518404 A JP2014518404 A JP 2014518404A
- Authority
- JP
- Japan
- Prior art keywords
- interference
- signal
- filter
- identified
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/07—Mechanical or electrical reduction of wind noise generated by wind passing a microphone
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
音声信号等の信号は、周波数成分から成る。各周波数成分は、エネルギーレベルを有する。単語または音素の発話の過程の間等、経時的に、信号において見出される周波数および各周波数成分のエネルギーレベルは、変動し得る。我々は、多くのインパルス性干渉の開始が、ある一定の組の周波数成分(本明細書では、一組の周波数成分または一組の周波数と称される)のエネルギーにおける大きくかつ突然の変化によって特徴付けられることを発見した。我々は、経時的変化を「時間導関数」と称し、我々は、これらのエネルギーにおける大きくかつ突然の変化の開始を「発生」と称する。図1は、破線100と103との間で境界される、仮想信号106中のインパルス性干渉の仮想発生を図示する、単一周波数ビンに対するエネルギー−時間のグラフである。発生は、インパルス性干渉より遥かに短いものであり得ることに留意されたい。干渉発生における特徴的な組の周波数成分は、非常に低い周波数から、可能性として、約数kHzまで及ぶ、比較的に高エネルギーレベルかつ連続的またはほぼ連続的な周波数(集合的に、本明細書では、連続的周波数、近接周波数、接続周波数または接続領域と称される)によって特徴付けられる。したがって、我々は、多くのインパルス性干渉が、周波数に沿って相関し、非常に低い周波数から、可能性として、約数kHzまで及ぶ、大きな時間導関数に対して、高エネルギー成分のスペクトルを検索することによって、検出されることができると考える。
我々は、インパルス性干渉から生じる時間−周波数画像において、接続領域を構成する発生を見出すことを所望し、音声がそのような発生に間違えられることを所望しないので、高エネルギー成分に焦点を当てる。高SNRが存在するとき、有声音の間等、いくつかの音声発生が、接続領域を含むように見える場合があり、これらの見かけの接続領域は、インパルス性干渉の発生と間違えられる場合がある。音声発生は、一般に使用される図7におけるフィルタ703等の分析フィルタバンクが、通常、そのバンドパスフィルタの有限選択性に起因して、近隣周波数バンドからの成分の何らかのエイリアシングを呈するため、接続領域を含むように見える場合がある。したがって、エネルギーが、音声の調和的に関連する周波数間のギャップに漏出し、それによって、音声が接続領域を含むように見られ得る。
記載されるように、高エネルギー成分の時間導関数は、発生を識別するために算出される。原則として、また、周波数軸に沿って、導関数を算出し得る。これは、しかしながら、本明細書に開示される方法および装置に必須ではない。それでも、スペクトル導関数を算出後、風の直撃が現れる程度を考慮することは、有益であり得る。いくつかの演算子の任意のものは、導関数を算出するために採用され得る。例えば、Sobel、Canny、およびPrewittは、画像処理において使用される公知の演算子である。他の演算子もまた、使用され得る。演算子は、そのフィルタカーネルDによって定義され得る。フィルタリングされた画像は、式(2)および(3)に従って、離散2D−畳み込みによって得られる。
集合的に、我々は、発生検出および干渉推定をモルフォロジー干渉推定と称する。記載されるように、発生検出および干渉推定は、図8に関連して論じられるように、連続的に行なわれ得、随意に、フィードバックループが、図9に関連して論じられるように、これらの演算間で採用され得る。
発生検出は、いくつかの段階を伴い得る。我々は、閾値関数を高エネルギー成分の時間導関数Gκ(κ,μ)に適用することによって開始することを提案する。閾値関数は、式(5)によって定義される2進数画像Gbin(κ,μ)をもたらす。
記載されるように、インパルス性干渉のエネルギーの推定が、必要とされ、したがって、それぞれの信号成分は、適切なフィルタリング手段を使用して抑制することができる。干渉の発生が決定されると、干渉エネルギーが、前述の発生検出に基づいて、推定される。本質的に、発生は、干渉エネルギー推定プロセスをトリガするために使用される。干渉エネルギーPSDは、各時間フレームに対して推定される。
前述の2つの演算(発生検出および干渉推定)は、別個の演算(図8に関連して論じられるように)として、連続して行なわれ得、または、記載されるように、フィードバックループを用いて、相互接続され得る(図9に関連して論じられるように)。そのようなフィードバックループが使用される場合、所与の時間フレームに対する計算は、1つ以上の前の時間フレームからのデータを使用し、それによって、再帰の要素を導入し得る。我々は、そのような再帰が、発生検出および干渉推定を有意に改善することができることを見出した。例えば、我々は、直前の時間フレームが、干渉を含んでいた場合、時間フレームが、干渉を含む可能性がより高いと考える。特に、我々は、後述されるように、フィードバックループ内側の「干渉ビン」と呼ばれるものを算出することが有用であることを見出した。
干渉推定は、入力信号中の周波数を弱めるために使用されるであろうことに留意されたい。事後処理演算の目標は、非修正干渉推定が、所望の音声信号に及ぼし得る負の影響を低減させるように、これまで計算された干渉推定
推定された干渉を抑制するために、Wienerフィルタ[8]または古典的スペクトル減算[10][9]等の任意の好適な雑音抑制フィルタが、使用され得、Φii(κ,μ)が、Φnn(κ,μ)の代わりに使用される。雑音抑制技法の概要は、[11]に提供される。Weinerフィルタと同様の特性を伴うフィルタの場合、フィルタ重みは、式(13)に示されるようになるであろう。
事後処理段階を制御するために、我々は、モルフォロジー干渉推定から利用可能なブロードバンド情報を使用する。総干渉対雑音比(INR)を使用して、干渉の存在を検出することができ、信号対干渉比(SIR)を採用して、干渉の存在下でも、音声を検出することができる。
[1]E.Hansler,G.Schmidt:Acoustic Echo and Noise Control:A Practical Approach.Wiley IEEE Press,New York,NY(USA),2004.
[2]S.V.Vaseghi、および、P.J.W.Rayner:A new application of adaptive filters for restoration of archived gramophone recordings,Proc.IEEE International Conference on Acoustics,Speech,and Signal Processing (ICASSP),1988.
[3]S.J.Godsill、および、C.H.Tan:Removal of low frequency transient noise from old recordings using model−based signal separation techniques,IEEE ASSP Workshop on Applications of Signal Processing to Audio and Acoustics,1997.
[4]B.King、および、L.Atlas:Coherent modulation comb filtering for enhancing speech in wind noise,11th International Workshop on Acoustic Echo and Noise Control(IWAENC),2008.
[5]N.Abu−Shikhah、および、M.Deriche:A robust technique for harmonic analysis of speech,Proc.IEEE International Conference on Acoustics,Speech,and Signal Processing(ICASSP),2001.
[6]N.Ahmed,T.Natarajan、および、K.R.Rao:Discrete cosine transfom,IEEE Transactions on Computers,Vol.100,No.23,1974.
[7]E.Nemer、および、W.Leblanc:Single−Microphone wind noise reduction by adaptive post−filtering,IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,2009.
[8]E.Hansler:Statistische Signale.Springer Verlag,Berlin(Germany),2001.
[9]Y.Ephraim,D.Malah:Speech Enhancement Using a Minimum Mean−Square Error Short−Time Spectral Amplitude Estimator.IEEE Transactions On Acoustics,Speech,And Signal Processing,Vol.ASSP−32,No.6,December 1984.
[10]S.F.Boll:Suppression of Acoustic Noise in Speech Using Spectral Subtraction.IEEE Trans.Acoust.Speech Signal Process,Vol.27,No.2,pp:113−120,1979.
[11]G.Schmidt:Single−Channel Noise Suppression Based on Spectral Weighting − An Overview.Eurasip Newsletter,Vol.15,No.1,pp.9−24,March 2004.
Claims (37)
- 信号中のインパルス性干渉を低減させる方法であって、前記方法は、
前記信号の複数の高エネルギー成分を自動的に識別することであって、前記複数の識別された高エネルギー成分の各々のエネルギーは、所定の閾値を超えている、ことと、
前記複数の識別された高エネルギー成分の複数の時間導関数を自動的に識別することと、
前記識別された複数の時間導関数を自動的にモルフォロジー的にフィルタリングすることであって、前記モルフォロジー的にフィルタリングすることは、少なくとも部分的に前記複数の識別された時間導関数に基づいて、前記インパルス性干渉の発生を検出することと、前記信号中の複数の干渉エネルギーを推定することとを含む、ことと、
前記複数の推定された干渉エネルギーに基づいて、前記信号の一部を自動的に抑制することと
を含む、方法。 - 前記複数の高エネルギー成分を識別することは、前記閾値が、前記信号のスペクトルエンベロープを下回るように、前記閾値を決定することを含む、請求項1に記載の方法。
- 前記複数の高エネルギー成分を識別することは、少なくとも部分的に前記信号のスペクトルエンベロープに基づき、および、少なくとも部分的に前記信号中の定常雑音のパワースペクトル密度に基づいて、前記閾値を決定することを含む、請求項1に記載の方法。
- 前記閾値を決定することは、
第1の条件下で、前記閾値が、前記信号のスペクトルエンベロープを下回る計算された値であり、
第2の条件下で、前記閾値が、前記定常雑音のパワースペクトル密度を上回る計算された値であるように、
前記閾値を決定することを含む、請求項3に記載の方法。 - 前記複数の識別された時間導関数の各々は、周波数範囲に関連付けられ、
前記複数の識別された時間導関数に関連付けられた周波数範囲は、集合的に、所定の周波数を下回って開始する周波数の連続的範囲を形成する、
請求項1に記載の方法。 - 前記所定の周波数は、約200Hzである、請求項5に記載の方法。
- 前記所定の周波数は、約100Hzである、請求項5に記載の方法。
- 前記周波数の連続的範囲内のギャップを自動的に考慮することをさらに含み、各ギャップは、所定のサイズ未満である、請求項5に記載の方法。
- 前記複数の時間導関数を識別することは、所定の値を超える時間導関数を識別することを含む、請求項1に記載の方法。
- 前記複数の時間導関数を識別することは、前記複数の識別された高エネルギー成分のスペクトル内の近接する時間導関数の領域を識別することを含む、請求項1に記載の方法。
- 前記識別された複数の時間導関数をモルフォロジー的にフィルタリングすることは、2次元画像フィルタを前記複数の識別された時間導関数に適用することを含む、請求項1に記載の方法。
- 前記複数の識別された時間導関数を2値化することをさらに含む、請求項1に記載の方法。
- 前記複数の干渉エネルギーを推定することは、最初に、少なくとも所定の時間期間の間、前記信号のパワースペクトル密度に基づいて、前記干渉エネルギーを推定し、その後、前記推定された干渉エネルギーに時間単調減衰を課すことを含む、請求項1に記載の方法。
- 前記識別された複数の時間導関数をモルフォロジー的にフィルタリングすることは、少なくとも部分的に前記複数の推定された干渉エネルギーに基づいて、複数の干渉ビンに対する値を計算することを含む、請求項1に記載の方法。
- 前記インパルス性干渉の発生を検出することは、少なくとも部分的に前の時間フレームの複数の干渉ビンに対して計算された値に基づいて、前記インパルス性干渉の発生を検出することを含む、請求項14に記載の方法。
- 開始周波数を自動的に決定することと、
前記決定された開始周波数から開始して、徐々により高い周波数に対して、徐々により小さい推定された干渉エネルギーを強制するように、前記複数の推定された干渉エネルギーを自動的に修正することと
をさらに含む、請求項1に記載の方法。 - 信号対干渉比(SIR)および総干渉対雑音比(INR)のうちの少なくとも1つを自動的に計算することと、
前記計算されたSIRおよびINRのうちの少なくとも1つに基づいて、前記複数の推定された干渉エネルギーが修正される方法に影響を及ぼす演算パラメータを自動的に調節することと
をさらに含む、請求項16に記載の方法。 - 信号対干渉比(SIR)および総干渉対雑音比(INR)のうちの少なくとも1つを自動的に計算することと、
前記計算されたSIRおよびINRのうちの少なくとも1つに基づいて、前記開始周波数を自動的に調節することと
をさらに含む、請求項16に記載の方法。 - 信号中のインパルス性干渉を低減させるためのフィルタであって、前記フィルタは、
前記信号の複数の高エネルギー成分を識別するように構成されている成分識別器であって、前記複数の識別された高エネルギー成分の各々のエネルギーは、所定の閾値を超えている、成分識別器と、
前記成分識別器に連結され、前記複数の識別された高エネルギー成分の複数の時間導関数を識別するように構成されている時間微分器と、
前記時間微分器に連結され、少なくとも部分的に前記複数の識別された時間導関数に基づいて、前記インパルス性干渉の発生を検出し、前記信号中の複数の干渉エネルギーを推定するように構成されているモルフォロジーフィルタと、
前記モルフォロジーフィルタに連結され、前記複数の推定された干渉エネルギーに基づいて、前記信号の一部を抑制するように構成されている雑音低減フィルタと
を備えている、フィルタ。 - 前記所定の閾値は、前記信号のスペクトルエンベロープを下回る、請求項19に記載のフィルタ。
- 前記所定の閾値は、少なくとも部分的に前記信号のスペクトルエンベロープに基づき、および、少なくとも部分的に前記信号中の定常雑音のパワースペクトル密度に基づく、請求項19に記載のフィルタ。
- 第1の条件下で、前記閾値は、前記信号のスペクトルエンベロープを下回る計算された値であり、
第2の条件下で、前記閾値は、前記定常雑音のパワースペクトル密度を上回る計算された値である、
請求項21に記載のフィルタ。 - 前記複数の識別された時間導関数の各々は、周波数範囲に関連付けられ、
前記複数の識別された時間導関数に関連付けられた周波数範囲は、集合的に、所定の周波数を下回って開始する周波数の連続的範囲を形成する、
請求項19に記載のフィルタ。 - 前記所定の周波数は、約200Hzである、請求項23に記載のフィルタ。
- 前記所定の周波数は、約100Hzである、請求項23に記載のフィルタ。
- 前記周波数の連続的範囲は、所定のサイズ未満の少なくとも1つのギャップを含む、請求項23に記載のフィルタ。
- 前記時間微分器は、前記複数の識別された時間導関数の各々が所定の値を超えるように、前記複数の時間導関数を識別するように構成されている、請求項19に記載のフィルタ。
- 前記時間微分器は、前記複数の識別された高エネルギー成分のスペクトル内の近接する時間導関数の領域を識別することによって、前記複数の時間導関数を識別するように構成されている、請求項19に記載のフィルタ。
- 前記モルフォロジーフィルタは、2次元画像フィルタを前記複数の識別された時間導関数に適用するように構成されている、請求項19に記載のフィルタ。
- 前記モルフォロジーフィルタは、前記複数の識別された時間導関数を2値化するように構成されている、請求項19に記載のフィルタ。
- 前記モルフォロジーフィルタは、最初に、少なくとも所定の時間期間の間、前記信号のパワースペクトル密度に基づいて、前記干渉エネルギーを推定し、その後、前記推定された干渉エネルギーに時間単調減衰を課すことによって、前記複数の干渉エネルギーを推定するように構成されている、請求項19に記載のフィルタ。
- 前記モルフォロジーフィルタは、少なくとも部分的に前記複数の推定された干渉エネルギーに基づいて、複数の干渉ビンに対する値を計算するように構成されている、請求項19に記載のフィルタ。
- 前記モルフォロジーフィルタは、少なくとも部分的に前の時間フレームの複数の干渉ビンに対して計算された値に基づいて、発生を検出するように構成されている、請求項32に記載のフィルタ。
- ポストプロセッサをさらに備え、前記ポストプロセッサは、
開始周波数を自動的に決定し、
前記所定の開始周波数から開始して、徐々により高い周波数に対して、徐々により小さい推定された干渉エネルギーを強制するように、前記複数の推定された干渉エネルギーを自動的に修正する
ように構成されている、請求項19に記載のフィルタ。 - 前記ポストプロセッサに連結されているポストプロセッサコントローラをさらに備え、前記ポストプロセッサコントローラは、
信号対干渉比(SIR)および総干渉対雑音比(INR)のうちの少なくとも1つを自動的に計算し、
前記計算されたSIRおよびINRのうちの少なくとも1つに基づいて、前記ポストプロセッサが、前記複数の推定された干渉エネルギーを修正する方法に影響を及ぼす演算パラメータを自動的に調節する
ように構成されている、請求項34に記載のフィルタ。 - 前記ポストプロセッサに連結されているポストプロセッサコントローラをさらに備え、前記ポストプロセッサコントローラは、
信号対干渉比(SIR)および総干渉対雑音比(INR)のうちの少なくとも1つを自動的に計算し、
前記計算されたSIRおよびINRのうちの少なくとも1つに基づいて、前記開始周波数を自動的に調節する
ように構成されている、請求項34に記載のフィルタ。 - 信号中のインパルス性干渉を低減させるためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、コンピュータ読み取り可能なプログラムコードを記憶している非一過性コンピュータ読み取り可能な媒体を備え、前記コンピュータ読み取り可能なプログラムは、
前記信号の複数の高エネルギー成分を識別するためのプログラムコードであって、前記複数の識別された高エネルギー成分の各々のエネルギーは、所定の閾値を超えている、プログラムコードと、
前記複数の識別された高エネルギー成分の複数の時間導関数を識別するためのプログラムコードと、
前記識別された複数の時間導関数をモルフォロジー的にフィルタリングするためのプログラムコードであって、前記モルフォロジー的にフィルタリングすることは、少なくとも部分的に前記複数の識別された時間導関数に基づいて、前記インパルス性干渉の発生を検出することと、前記信号中の複数の干渉エネルギーを推定することとを含む、プログラムコードと、
前記複数の推定された干渉エネルギーに基づいて、前記信号の一部を抑制するためのプログラムコードと
を含む、コンピュータプログラム製品。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2011/043145 WO2013006175A1 (en) | 2011-07-07 | 2011-07-07 | Single channel suppression of impulsive interferences in noisy speech signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014518404A true JP2014518404A (ja) | 2014-07-28 |
JP5752324B2 JP5752324B2 (ja) | 2015-07-22 |
Family
ID=44317645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014518528A Active JP5752324B2 (ja) | 2011-07-07 | 2011-07-07 | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9858942B2 (ja) |
EP (1) | EP2724340B1 (ja) |
JP (1) | JP5752324B2 (ja) |
CN (1) | CN103765511B (ja) |
WO (1) | WO2013006175A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5752324B2 (ja) * | 2011-07-07 | 2015-07-22 | ニュアンス コミュニケーションズ, インコーポレイテッド | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 |
EP2980800A1 (en) * | 2014-07-30 | 2016-02-03 | Dolby Laboratories Licensing Corporation | Noise level estimation |
EP3152756B1 (en) | 2014-06-09 | 2019-10-23 | Dolby Laboratories Licensing Corporation | Noise level estimation |
KR20160102815A (ko) * | 2015-02-23 | 2016-08-31 | 한국전자통신연구원 | 잡음에 강인한 오디오 신호 처리 장치 및 방법 |
US10366710B2 (en) * | 2017-06-09 | 2019-07-30 | Nxp B.V. | Acoustic meaningful signal detection in wind noise |
US11133023B1 (en) * | 2021-03-10 | 2021-09-28 | V5 Systems, Inc. | Robust detection of impulsive acoustic event onsets in an audio stream |
US11127273B1 (en) | 2021-03-15 | 2021-09-21 | V5 Systems, Inc. | Acoustic event detection using coordinated data dissemination, retrieval, and fusion for a distributed array of sensors |
CN114124626B (zh) * | 2021-10-15 | 2023-02-17 | 西南交通大学 | 信号的降噪方法、装置、终端设备以及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001124621A (ja) * | 1999-10-28 | 2001-05-11 | Matsushita Electric Ind Co Ltd | 風雑音低減可能な騒音計測装置 |
JP2004254322A (ja) * | 2003-02-21 | 2004-09-09 | Herman Becker Automotive Systems-Wavemakers Inc | ウィンドノイズを抑制するシステム |
JP2004254329A (ja) * | 2003-02-21 | 2004-09-09 | Herman Becker Automotive Systems-Wavemakers Inc | ウィンドノイズを抑圧するシステム |
JP2006163417A (ja) * | 2004-12-08 | 2006-06-22 | Herman Becker Automotive Systems-Wavemakers Inc | 雨ノイズを抑制するためのシステム |
JP2007114774A (ja) * | 2005-10-17 | 2007-05-10 | Qnx Software Systems (Wavemakers) Inc | 音声信号における一過性ノイズの最小化 |
JP2011248296A (ja) * | 2010-05-31 | 2011-12-08 | Kanto Auto Works Ltd | 音信号区間抽出装置及び音信号区間抽出方法 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4771472A (en) * | 1987-04-14 | 1988-09-13 | Hughes Aircraft Company | Method and apparatus for improving voice intelligibility in high noise environments |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5388182A (en) * | 1993-02-16 | 1995-02-07 | Prometheus, Inc. | Nonlinear method and apparatus for coding and decoding acoustic signals with data compression and noise suppression using cochlear filters, wavelet analysis, and irregular sampling reconstruction |
JP3186892B2 (ja) | 1993-03-16 | 2001-07-11 | ソニー株式会社 | 風雑音低減装置 |
US6377919B1 (en) * | 1996-02-06 | 2002-04-23 | The Regents Of The University Of California | System and method for characterizing voiced excitations of speech and acoustic signals, removing acoustic noise from speech, and synthesizing speech |
US5946649A (en) * | 1997-04-16 | 1999-08-31 | Technology Research Association Of Medical Welfare Apparatus | Esophageal speech injection noise detection and rejection |
DE19736669C1 (de) * | 1997-08-22 | 1998-10-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals |
US20020071573A1 (en) | 1997-09-11 | 2002-06-13 | Finn Brian M. | DVE system with customized equalization |
US7028899B2 (en) * | 1999-06-07 | 2006-04-18 | Metrologic Instruments, Inc. | Method of speckle-noise pattern reduction and apparatus therefore based on reducing the temporal-coherence of the planar laser illumination beam before it illuminates the target object by applying temporal phase modulation techniques during the transmission of the plib towards the target |
US6209094B1 (en) * | 1998-10-14 | 2001-03-27 | Liquid Audio Inc. | Robust watermark method and apparatus for digital signals |
US6205422B1 (en) * | 1998-11-30 | 2001-03-20 | Microsoft Corporation | Morphological pure speech detection using valley percentage |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
DE10017646A1 (de) | 2000-04-08 | 2001-10-11 | Alcatel Sa | Geräuschunterdrückung im Zeitbereich |
FR2808917B1 (fr) * | 2000-05-09 | 2003-12-12 | Thomson Csf | Procede et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant |
EP1310099B1 (en) * | 2000-08-16 | 2005-11-02 | Dolby Laboratories Licensing Corporation | Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information |
US8098844B2 (en) * | 2002-02-05 | 2012-01-17 | Mh Acoustics, Llc | Dual-microphone spatial noise suppression |
AU2003274617A1 (en) * | 2002-11-29 | 2004-06-23 | Koninklijke Philips Electronics N.V. | Audio coding |
US8271279B2 (en) * | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
IL155955A0 (en) * | 2003-05-15 | 2003-12-23 | Widemed Ltd | Adaptive prediction of changes of physiological/pathological states using processing of biomedical signal |
CN1989548B (zh) * | 2004-07-20 | 2010-12-08 | 松下电器产业株式会社 | 语音解码装置及补偿帧生成方法 |
WO2006035776A1 (ja) * | 2004-09-29 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | 音場測定方法および音場測定装置 |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7536304B2 (en) * | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
KR100713366B1 (ko) * | 2005-07-11 | 2007-05-04 | 삼성전자주식회사 | 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치 |
US20070011001A1 (en) * | 2005-07-11 | 2007-01-11 | Samsung Electronics Co., Ltd. | Apparatus for predicting the spectral information of voice signals and a method therefor |
JP2009524101A (ja) * | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
KR100827153B1 (ko) * | 2006-04-17 | 2008-05-02 | 삼성전자주식회사 | 음성 신호의 유성음화 비율 검출 장치 및 방법 |
PT2165328T (pt) * | 2007-06-11 | 2018-04-24 | Fraunhofer Ges Forschung | Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária |
US8352274B2 (en) | 2007-09-11 | 2013-01-08 | Panasonic Corporation | Sound determination device, sound detection device, and sound determination method for determining frequency signals of a to-be-extracted sound included in a mixed sound |
US8131543B1 (en) * | 2008-04-14 | 2012-03-06 | Google Inc. | Speech detection |
US9253568B2 (en) | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
US8515097B2 (en) * | 2008-07-25 | 2013-08-20 | Broadcom Corporation | Single microphone wind noise suppression |
EP2159593B1 (en) * | 2008-08-26 | 2012-05-02 | Nuance Communications, Inc. | Method and device for locating a sound source |
EP2321978A4 (en) * | 2008-08-29 | 2013-01-23 | Dev Audio Pty Ltd | MICROPHONE NETWORK SYSTEM AND METHOD FOR ACQUIRING SOUNDS |
JP5262614B2 (ja) | 2008-11-20 | 2013-08-14 | 株式会社リコー | 無線通信装置 |
US8275148B2 (en) * | 2009-07-28 | 2012-09-25 | Fortemedia, Inc. | Audio processing apparatus and method |
ES2656815T3 (es) * | 2010-03-29 | 2018-02-28 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung | Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica |
US9578159B2 (en) * | 2011-06-20 | 2017-02-21 | Prasad Muthukumar | Fisheye lens based proactive user interface for mobile devices |
JP5752324B2 (ja) * | 2011-07-07 | 2015-07-22 | ニュアンス コミュニケーションズ, インコーポレイテッド | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 |
-
2011
- 2011-07-07 JP JP2014518528A patent/JP5752324B2/ja active Active
- 2011-07-07 CN CN201180073151.4A patent/CN103765511B/zh active Active
- 2011-07-07 US US14/126,556 patent/US9858942B2/en active Active
- 2011-07-07 WO PCT/US2011/043145 patent/WO2013006175A1/en active Application Filing
- 2011-07-07 EP EP11730861.9A patent/EP2724340B1/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001124621A (ja) * | 1999-10-28 | 2001-05-11 | Matsushita Electric Ind Co Ltd | 風雑音低減可能な騒音計測装置 |
JP2004254322A (ja) * | 2003-02-21 | 2004-09-09 | Herman Becker Automotive Systems-Wavemakers Inc | ウィンドノイズを抑制するシステム |
JP2004254329A (ja) * | 2003-02-21 | 2004-09-09 | Herman Becker Automotive Systems-Wavemakers Inc | ウィンドノイズを抑圧するシステム |
JP2006163417A (ja) * | 2004-12-08 | 2006-06-22 | Herman Becker Automotive Systems-Wavemakers Inc | 雨ノイズを抑制するためのシステム |
JP2007114774A (ja) * | 2005-10-17 | 2007-05-10 | Qnx Software Systems (Wavemakers) Inc | 音声信号における一過性ノイズの最小化 |
JP2011248296A (ja) * | 2010-05-31 | 2011-12-08 | Kanto Auto Works Ltd | 音信号区間抽出装置及び音信号区間抽出方法 |
Non-Patent Citations (7)
Title |
---|
CSNG200600972251; 山口亮他: '"雑音抑圧信号処理におけるミュージカルノイズ改善の検討"' 日本音響学会2004年春季研究発表会講演論文集-I- , 200403, pp.619-620 * |
CSNG200700786003; 林寛晃他: '"モルフォロジ成分分析による突発性雑音除去"' 電子情報通信学会技術研究報告 Vol.107,No.64, 200705, pp.13-18 * |
CSNG200800004008; 林寛晃他: '"DFTを用いたモルフォロジ成分分析による音声からのインパクト雑音除去"' 電子情報通信学会技術研究報告 Vol.107,No.374, 200712, pp.47-52 * |
JPN6015001632; 山口亮他: '"雑音抑圧信号処理におけるミュージカルノイズ改善の検討"' 日本音響学会2004年春季研究発表会講演論文集-I- , 200403, pp.619-620 * |
JPN6015001636; Bing WANG, et al.: '"An improved CANNY edge detection algorithm"' Proceedings of the 2nd International Workshop on Computer Science and Engineering(WCSE 2009) , 200910, pp.497-500, IEEE * |
JPN6015001639; 林寛晃他: '"モルフォロジ成分分析による突発性雑音除去"' 電子情報通信学会技術研究報告 Vol.107,No.64, 200705, pp.13-18 * |
JPN6015001641; 林寛晃他: '"DFTを用いたモルフォロジ成分分析による音声からのインパクト雑音除去"' 電子情報通信学会技術研究報告 Vol.107,No.374, 200712, pp.47-52 * |
Also Published As
Publication number | Publication date |
---|---|
US9858942B2 (en) | 2018-01-02 |
CN103765511B (zh) | 2016-01-20 |
US20140095156A1 (en) | 2014-04-03 |
WO2013006175A1 (en) | 2013-01-10 |
JP5752324B2 (ja) | 2015-07-22 |
CN103765511A (zh) | 2014-04-30 |
EP2724340B1 (en) | 2019-05-15 |
EP2724340A1 (en) | 2014-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5752324B2 (ja) | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
US7286980B2 (en) | Speech processing apparatus and method for enhancing speech information and suppressing noise in spectral divisions of a speech signal | |
US8352257B2 (en) | Spectro-temporal varying approach for speech enhancement | |
JP4965891B2 (ja) | 信号処理装置およびその方法 | |
KR100784456B1 (ko) | Gmm을 이용한 음질향상 시스템 | |
US11183172B2 (en) | Detection of fricatives in speech signals | |
JP2006126859A (ja) | 音声処理装置及び音声処理方法 | |
Evans et al. | Noise estimation without explicit speech, non-speech detection: A comparison of mean, modal and median based approaches | |
EP1635331A1 (en) | Method for estimating a signal to noise ratio | |
Kato et al. | A wind-noise suppressor based on wind-onset detection and spectral gain modification | |
Xia et al. | A modified spectral subtraction method for speech enhancement based on masking property of human auditory system | |
Yong et al. | Real time noise suppression in social settings comprising a mixture of non-stationary anc transient noise | |
Zavarehei et al. | Speech enhancement using Kalman filters for restoration of short-time DFT trajectories | |
Ma et al. | A perceptual kalman filtering-based approach for speech enhancement | |
Erkelens et al. | A general optimization procedure for spectral speech enhancement methods | |
Hendriks et al. | Adaptive time segmentation of noisy speech for improved speech enhancement | |
Indumathi et al. | Noise estimation using standard deviation of the frequency magnitude spectrum for mixed non-stationary noise | |
Singh et al. | Sigmoid based Adaptive Noise Estimation Method for Speech Intelligibility Improvement | |
Brookes et al. | Enhancement | |
PHANEENDRA et al. | Speech Enhancement using Combination of Digital Audio Effects with Kalman Filter | |
JPH0844390A (ja) | 音声認識装置 | |
Alam et al. | Speech enhancement based on a hybrid a priori signal-to-noise ratio (SNR) estimator and a self-adaptive Lagrange multiplier | |
Li et al. | LONG-TERM TEMPORAL MODULATION FEATURE FOR ROBUST SPEECH RECOGNITION IN UNKNOWN NOISE | |
Alam et al. | A new perceptual post-filter for single channel speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150519 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5752324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |