JPWO2010113220A1 - 雑音抑圧装置 - Google Patents

雑音抑圧装置 Download PDF

Info

Publication number
JPWO2010113220A1
JPWO2010113220A1 JP2011506852A JP2011506852A JPWO2010113220A1 JP WO2010113220 A1 JPWO2010113220 A1 JP WO2010113220A1 JP 2011506852 A JP2011506852 A JP 2011506852A JP 2011506852 A JP2011506852 A JP 2011506852A JP WO2010113220 A1 JPWO2010113220 A1 JP WO2010113220A1
Authority
JP
Japan
Prior art keywords
noise
frequency
band
unit
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011506852A
Other languages
English (en)
Other versions
JP5535198B2 (ja
Inventor
訓 古田
訓 古田
田崎 裕久
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2010113220A1 publication Critical patent/JPWO2010113220A1/ja
Application granted granted Critical
Publication of JP5535198B2 publication Critical patent/JP5535198B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

低域振幅スペクトル102から音声・雑音区間判定部2によって、入力信号100が音声らしいかどうかを判定する。雑音スペクトル推定部3は、音声・雑音区間判定部2の出力に基づいて低域雑音スペクトルおよび高域雑音スペクトルを推定する。低域処理部201と高域処理部202とは、雑音スペクトル推定部3から出力された雑音スペクトルに基づいて雑音抑圧を行う。

Description

本発明は、種々の雑音環境下で用いられる音声通信システム、音声蓄積システム、音声認識システム等において、音声・音響信号などの目的信号以外の雑音を抑圧して、カーナビゲーション・携帯電話・インターフォンなどの音声通信システム・ハンズフリー通話システム・TV会議システム・監視システム等の音質改善や、音声認識システムの認識率の向上等を行う雑音抑圧装置に関するものである。
雑音が混入した入力信号から目的外信号である雑音を抑圧することで、目的信号である音声信号などを強調する雑音抑圧処理の代表的な手法として、例えば、スペクトルサブトラクション(Spectral Subtraction:SS)法があり、これは振幅スペクトルから別途推定した平均的な雑音スペクトルを減算することにより雑音抑圧を行うものである(例えば、非特許文献1参照)。
入力信号を周波数領域信号に変換した後に所定の小帯域に分割し、帯域別に雑音抑圧を行う従来の方法としては、例えば、特許文献1に記載されたものがあった。また、サンプリング周波数が異なる方式を切り替える(狭帯域雑音抑圧方式と広帯域雑音抑圧方式を切り替える)従来の方法としては、例えば、特許文献2に記載されているものがあった。
特許文献1に記載されている方法は、非特許文献1に開示された方法を基本とし、入力信号を低域成分と高域成分に分割し、それぞれの帯域において適した雑音抑圧を行うことで、少ない処理量で音声歪が少なく、かつ雑音抑圧量を大きくできる雑音抑圧装置を得ることを目的としている。
また、特許文献2に記載された方法は、複数のサンプリング変換レートに応じた雑音抑圧処理と切り替え手段を備え、音声復号化処理にとって好適なサンプリング周波数と雑音抑圧装置を切り替えることにより、復号化音声の品質を改善することを目的としている。
特開2006−201622号公報(第4頁〜9頁、図1) 特開2000−206995号公報(第6頁〜16頁、図4) Steven F. Boll, "Suppression of Acoustic noise in speech using spectral subtraction",IEEE Trans. ASSP, Vol. ASSP-27, No.2, April 1979.
しかしながら、上記の従来法には、以下に述べる課題があった。
例えば、特許文献1に開示された従来の雑音抑圧装置では、低域用、高域用の独立した構成を成しており、低域用、高域用に別個の音声・雑音区間判定手段が必要であるため、全帯域処理よりは少ないものの、依然として処理量やメモリ量が大きいという課題があった。また、雑音抑圧装置において重要な構成である音声・雑音区間判定や雑音スペクトル推定のための制御パラメータを、低域・高域でそれぞれ独立して調整する必要があり、制御や調整が複雑であるという課題があった。
また、特許文献2に開示された受信装置に係る従来の雑音抑圧装置では、複数のサンプリング周波数別に独立した雑音抑圧処理を持っており、特許文献1の場合と同様に、それぞれ制御パラメータを独立して調整する必要があることと、それぞれの雑音抑圧処理毎にプログラムメモリなどを保持する必要があり、メモリ量が大きくなるという課題があった。
この発明は、かかる問題を解決するためになされたもので、小さな処理量およびメモリ量で雑音抑圧が可能、かつ品質劣化の少ない雑音抑圧装置を提供することを目的とすると共に、制御や調整が容易な雑音抑圧装置を提供することを目的とする。
この発明に係る雑音抑圧装置は、入力信号を複数の帯域に分割し、分割した複数の帯域のうち、所定の帯域成分の分析結果に応じて、所定の帯域成分の雑音抑圧と、所定の帯域以外の帯域成分の雑音抑圧を行うようにしたものである。これにより、処理量やメモリ量を削減できると共に、制御や調整が容易な雑音抑圧装置を提供することができる。
この発明に係る雑音抑圧装置の実施の形態1の全体構成図である。 この発明の実施の形態1に記載の雑音スペクトル推定部の内部構成図である。 この発明の実施の形態1に記載の雑音スペクトルのサブバンド化の一例を示す説明図である。 この発明に係る雑音抑圧装置の実施の形態2の全体構成図である。 この発明に係る雑音抑圧装置の実施の形態4の全体構成図である。
以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態1.
図1は本実施の形態による雑音抑圧装置の全体構成を示したものである。
図1において、雑音抑圧装置200は、時間・周波数変換部1、音声・雑音区間判定部2、雑音スペクトル推定部3、低域抑圧量制御部4、高域抑圧量制御部5、低域雑音抑圧部6、高域雑音抑圧部7、帯域合成部8、第1の周波数・時間変換部9、第2の周波数・時間変換部10を備えている。また、音声・雑音区間判定部2、低域抑圧量制御部4および低域雑音抑圧部6で低域処理部201を構成し、高域抑圧量制御部5と高域雑音抑圧部7とで高域処理部202を構成すると共に、雑音スペクトル推定部3がこれら低域処理部201および高域処理部202の共通構成要素として設けられている。
従来の雑音抑圧装置の構成と異なる点として、低域処理部201内にのみ音声・雑音区間判定部2を持つことと、雑音スペクトル推定部3が低域処理部201と高域処理部202の共有構成要素となっていることである。
以下、図1に示す雑音抑圧装置の動作原理について説明する。
まず、目的信号である音声・楽音などに雑音が混入した入力信号100が、A/D(アナログ/デジタル)変換された後、所定のサンプリング周波数(例えば、16kHz)でサンプリングされ、所定のフレーム周期(例えば、20msec)にフレーム分割されて、雑音抑圧装置200内の時間・周波数変換部1に入力される。
時間・周波数変換部1は、上記のフレーム周期に分割された入力信号100に対して、窓掛け処理(必要に応じてゼロ詰め処理も実施)を行い、その窓掛け後の信号に対して、例えば512点のFFT(Fast Fourier Transform:高速フーリエ変換)を用いて、時間軸上の信号を周波数軸上の信号(スペクトル)に変換する。時間・周波数変換部1から得られる、nフレーム目の入力信号100の振幅スペクトルS(n,k)と位相スペクトルP(n,k)は、次の式(1)で表すことができる。
Figure 2010113220
ここで、kはスペクトル番号、Re{X(n,k)}およびIm{X(n,k)}は、それぞれFFT後の入力信号のスペクトル実数部および虚数部である。以降、特に示す必要が無い限り、現フレームの信号を表す場合にはフレーム番号を省略する。
以上得られた振幅スペクトルS(k)について、例えば、0〜4kHzと4kHz〜8kHzの2帯域に帯域分割し、0〜4kHzまでの低域成分を低域振幅スペクトル102、4〜8kHzまでの高域成分を高域振幅スペクトル103としてそれぞれ出力するとともに、位相スペクトル101を出力する。
得られた低域振幅スペクトル102は、低域処理部201内部の音声・雑音区間判定部2、雑音スペクトル推定部3、低域抑圧量制御部4、低域雑音抑圧部6にそれぞれ出力される。また、高域振幅スペクトル103は、高域処理部202内部の雑音スペクトル推定部3、高域抑圧量制御部5、高域雑音抑圧部7へそれぞれ出力される。本実施の形態での窓掛け処理には、例えばハニング窓、台形窓など公知の手法を用いることができる。また、FFTは周知の手法であるので説明は省略する。
まず、低域処理部201内部の構成要素の動作について説明する。なお、入力信号100の様態が“音声らしいかどうか”の判定を行う音声・雑音区間判定部2と、低域処理部201と高域処理部202の共有構成要素である雑音スペクトル推定部3の動作については後述する。まず、低域抑圧量制御部4は、低域振幅スペクトル102と、雑音スペクトル推定部3が出力する低域雑音スペクトル105より、次の式(2)に従って、スペクトル成分毎の信号対雑音比snr(k)を計算する。ここで、S(k)は低域振幅スペクトル102の第k番目のスペクトル、N(k)は低域雑音スペクトル105の第k番目のスペクトル、kはスペクトル番号、Kはスペクトル番号数であり、例えば、FFT点数が512点で帯域分割点が4kHzであればK=128となる。得られたスペクトル成分毎の信号対雑音比snr(k)を用いて、低域雑音抑圧量107を計算する。具体的な計算方法としては、例えば、非特許文献1に開示されているスペクトル減算法や、J.S.Lim and A V.Oppenheim,“Enhancement and Bandwidth Compression of Noisy Speech,”Proc.of the IEEE, vol.67,pp.1586-1604,Dec.1979(以下、非特許文献2という)に開示されている、いわゆるWiener Filter(ウィナーフィルタ)法などの公知の手法を用いることができる。
Figure 2010113220
低域雑音抑圧部6は、時間・周波数変換部1より入力された低域振幅スペクトル102に対し、低域雑音抑圧量107を用いて雑音抑圧処理し、得られた結果を、雑音抑圧された低域振幅スペクトル109として、第1の周波数・時間変換部9に出力するとともに、帯域合成部8に出力する。
ここで、低域雑音抑圧部6における雑音抑圧処理の手法としては、例えば、非特許文献1に開示されているような、スペクトル減算に基づくものや、非特許文献2に開示されているような、スペクトル成分毎の信号対雑音比に基づいて、スペクトル成分毎に減衰量を与えるスペクトル振幅抑圧などの公知の方法の他、スペクトル減算とスペクトル振幅抑圧を組み合わせた手法(例えば、特許第3454190号公報に記載の方法)などを用いることが可能である。
第1の周波数・時間変換部9は、低域雑音抑圧部6から入力された雑音抑圧された低域振幅スペクトル109と位相スペクトル101とを用いて、時間・周波数変換部1で実施したFFT点数(512点)に対応する逆FFT処理を行うことで時間領域信号に戻し、前後フレームとの滑らかな接続のための窓掛け処理を行いつつ連接を行い、得られた信号を、雑音抑圧された低域出力信号113として出力する。なお、上記の逆FFT処理において、4kHz〜8kHzの高域スペクトル成分に関してはゼロ詰めする。
帯域制御信号111は、それぞれ後述する狭帯域符号化部12、広帯域符号化部13の切り替え制御と、後述するサンプリング変換部11と帯域合成部8の動作を制御する信号であり、例えば、無線・有線通信路の状況に応じて自動的に符号化方法や伝送帯域を切り替える制御信号や、ユーザからの要求(符号化品質あるいは音声データの圧縮率の変更など)により、手動で符号化方法や周波数帯域を切り替えるための制御信号である。この実施の形態においては、狭帯域符号化部12における狭帯域符号化と広帯域符号化部13における広帯域符号化の2種類の方式を切り替えるので、雑音抑圧された入力信号を狭帯域符号化方法にて符号化する場合、即ち、狭帯域符号化部12を動作させる場合には、“狭帯域モード”を表す値(例えば、0[ゼロ])を持ち、広帯域符号化部13を動作させる場合には、“広帯域モード”を表す値(例えば、1)を持つ。
サンプリング変換部11は、雑音抑圧された低域出力信号113と帯域制御信号111を入力し、雑音抑圧装置200に接続されている音声符号化部を切り替えるための帯域制御信号111の値が“狭帯域モード”の場合には、入力信号1のサンプリング周波数である16kHzから、例えば8kHzへダウンサンプリングを行い、狭帯域出力信号114を狭帯域符号化部12へ出力する。
狭帯域符号化部12は、狭帯域出力信号114と帯域制御信号111とを入力し、帯域制御信号111が“狭帯域モード”の場合に、例えば、AMR(Adaptive Multi−Rate)音声符号化方式などの公知の符号化方法を用いて、狭帯域出力信号114の圧縮・符号化を行う。符号化された狭帯域出力信号114は、例えば無線・有線通信路を通じて符号化データとして送出されたり、ICレコーダ等のメモリに蓄えられた後に、音声・音響信号データとして読み出されて利用されたりすることとなる。
続いて、高域処理部202内部の構成要素の動作について説明する。
高域抑圧量制御部5は、高域振幅スペクトル103と、後述説明する雑音スペクトル推定部3が出力する高域雑音スペクトル106より、次の式(3)に従って、スペクトル成分毎の信号対雑音比snr(k)を計算する。ここで、S(k)は高域振幅スペクトル103の第k番目のスペクトル、N(k)は高域雑音スペクトル106の第k番目のスペクトル、kはスペクトル番号、KおよびKはスペクトル番号数であり、例えば、FFT点数が512点で、帯域分割点が4kHzであれば、K=128およびK=256となる。得られたスペクトル成分毎の信号対雑音比SNR(k)を用いて、高域雑音抑圧量108を計算する。具体的な計算方法としては、低域処理部201の場合と同様に、例えば、非特許文献1に開示されているスペクトル減算法や、非特許文献2に開示されている、Wiener Filter法などの公知の手法を用いることができる。
Figure 2010113220
高域雑音抑圧部7は、時間・周波数変換部1より入力された高域振幅スペクトル103に対し、高域雑音抑圧量108を用いて雑音抑圧処理し、得られた結果を、雑音抑圧された高域振幅スペクトル110として、帯域合成部8に出力する。
ここで、高域雑音抑圧部7における雑音抑圧処理の手法としては、低域処理部201の場合と同様に、例えば、非特許文献1に開示されているような、スペクトル減算に基づくものや、非特許文献2に開示されているような、スペクトル成分毎の信号対雑音比に基づいて、スペクトル成分毎に減衰量を与えるスペクトル振幅抑圧などの公知の方法の他、スペクトル減算とスペクトル振幅抑圧を組み合わせた手法などを用いることが可能である。
帯域合成部8は、低域雑音抑圧部6が出力する雑音抑圧された低域振幅スペクトル109と、高域雑音抑圧部7が出力する高域振幅スペクトル110と、狭帯域・広帯域符号化方法を切り替えるための帯域制御信号111とを入力し、帯域制御信号111が“広帯域モード”の場合には、振幅スペクトルの高域と低域をつなぎ合わせて全帯域の振幅スペクトルとする帯域合成処理を行い、雑音抑圧された全帯域振幅スペクトル112を出力する。
第2の周波数・時間変換部10は、帯域合成部8が出力する、雑音抑圧された全帯域振幅スペクトル112と位相スペクトル101とを入力し、時間・周波数変換部1で実施したFFT点数に対応する逆FFT処理を行うことで時間領域信号に戻し、前後フレームとの滑らかな接続のための窓掛け処理(重ね合わせ処理)を行いつつ連接を行い、得られた信号を、雑音抑圧された広帯域出力信号115として広帯域符号化部13へ出力する。
広帯域符号化部13は、広帯域出力信号115と帯域制御信号111とを入力し、帯域制御信号111が“広帯域モード”の場合に、例えば、AMR−WB(Adaptive Multi−Rate Wide Band)音声符号化方式などの公知の符号化方法を用いて、広帯域出力信号115の圧縮・符号化を行う。符号化された広帯域出力信号115は、狭帯域符号化部12の場合と同様に、例えば無線・有線通信路を通じて符号化データとして送出されたり、ICレコーダ等のメモリに蓄えられた後に、音声・音響信号データとして読み出されて利用されたりすることとなる。
続いて、低域処理部201内の音声・雑音区間判定部2と、低域処理部201と高域処理部202の共有構成要素である雑音スペクトル推定部3を説明する。雑音スペクトル推定部3は、雑音成分推定手段を構成し、図2に示すように、サブバンド圧縮部14、雑音スペクトル更新部15、雑音スペクトル記憶部16、サブバンド展開部17を備えている。
以下、図2および図3を参照して、音声・雑音区間判定部2と雑音スペクトル推定部3の詳細な動作説明を行う。
まず、音声・雑音区間判定部2において、時間・周波数変換部1が出力する低域振幅スペクトル102と、過去のフレームから推定した低域雑音スペクトル105とを用いて、現フレームの入力信号100が、音声あるいは雑音であるかどうかの度合いとして、例えば、音声の可能性が高い場合には大きな評価値を取り、音声の可能性が低い場合には小さな評価値を取るような、音声らしさ信号VADの算出を行う。
音声らしさ信号VADの算出方法として、例えば、入力信号100の低域振幅スペクトル102の加算結果と、後述する雑音スペクトル推定部3が出力する、低域雑音スペクトル105の加算結果のパワーの比から算出できる現フレームの低域SN比や、低域振幅スペクトル102から得られる低域パワー、あるいは、前述の式(2)にて示したスペクトル成分毎のSN比snr(k)から求めることができるsnr(k)の分散などを、それぞれ単独あるいは組み合わせて用いることが可能である。ここでは、説明の簡略化のため、現フレームの低域SN比を単独で用いた場合について示すこととする。現フレームの低域SN比SNRFLは、次の式(4)で表すことができる。
Figure 2010113220
ここで、S(k)は低域振幅スペクトル102の第k番目の成分、N(k)は低域雑音スペクトル105の第k番目の成分、Kは低域のスペクトル番号数である。また、max{x,y}は、要素x、yのうち、値の大きい方を出力する関数であり、現フレームの低域SN比SNRFLは、0以上の正値をとることとなる。
式(4)で求められた低域SN比SNRFLから、音声らしさ信号VADは、例えば次の式(5)を用いて算出できる。
Figure 2010113220
ここで、THSNR(・)は判定用しきい値であって所定の定数であり、それぞれ騒音の種類や騒音のパワーに応じて、音声区間と雑音区間が好適に判定できるように予め調整すればよい。以上示した処理によって算出された音声らしさ信号VADを、音声・雑音区間判定結果信号104として雑音スペクトル更新部15へ出力する。
なお、式(5)では音声らしさ信号VADを、所定の判定しきい値による0〜1の範囲の離散値として表現しているが、例えば、式(6)のように最大値(例えば、SNRmaxFL=50dB)でSNRFLの正規化を行い、0〜1の範囲の連続値として取り扱うことも可能である。
Figure 2010113220
サブバンド圧縮部14は、雑音スペクトルを記憶するための処理量・メモリ量削減のために、式(7)と図3に示すスペクトル対応表に従って、0〜255までの低域振幅スペクトル102と高域振幅スペクトル103のスペクトル番号kの成分を、例えば、30チャンネルのサブバンドz毎にまとめて平均化することで、サブバンドz毎の平均スペクトルB(z)およびB(z)に圧縮し、雑音スペクトル更新部15に出力する。ここで、f(z)およびf(z)は、図3に記載のサブバンドzに対応するスペクトル成分(帯域)の端点である。
Figure 2010113220
図3では、少ないメモリ量で、低域では聴感上良好な特性で雑音スペクトル推定を行いつつ、高域では雑音成分の周波数方向の追従性に優れた雑音スペクトルの推定を行うことを目的として、0〜4kHzはバークスケールで帯域分割し、4kHz〜8kHzは4kHz近傍のバークスケールに基づく臨界帯域幅で等間隔に帯域分割して平均化する例を示したが、例えば、特定の周波数帯域(全帯域、あるいは高域)の精度を向上させるために、スペクトルの平均化を行わずに振幅スペクトルそのものを用いて、より細かく処理しても良い。
雑音スペクトル更新部15は、音声・雑音区間判定部2の出力である音声・雑音区間判定結果信号104を参照し、現フレームの入力信号100の様態が雑音の可能性が高い場合、現フレームの入力信号成分である、低域振幅スペクトル102および高域振幅スペクトル103を用いて、雑音スペクトル記憶部16に格納してある過去のフレームから推定された推定雑音スペクトルの更新を行う。
例えば、次の式(8)に従って、音声・雑音区間判定結果信号104である音声らしさ信号VADが例えば0.2以下の場合に、入力信号の振幅スペクトルを雑音スペクトルに反映することで更新を行う。雑音スペクトル記憶部16は、例えば、半導体メモリやハードディスク等に代表されるような、電気的あるいは磁気的な随時読み出し・書き込み可能な記憶手段にて構成される。
Figure 2010113220

また、α(z)およびα(z)は、0〜1の値を取る所定の更新速度係数であり、比較的0に近い値を設定すると良い。また、周波数が高くになるに従って、係数値をやや大きくした方が良い場合があり、雑音の種類などに応じて調整することも可能である。
サブバンド展開部17は、上記で更新された雑音スペクトルを、式(7)の逆変換を行うことでサブバンドzからスペクトルkの成分に展開し、低域雑音スペクトル105は前述の低域抑圧量制御部4と音声・雑音区間判定部2にそれぞれ出力し、高域雑音スペクトル106は高域抑圧量制御部5へ出力する。ここで、音声・雑音区間判定部2に出力された低域雑音スペクトル105は、次フレーム(n+1フレーム目)の音声・雑音区間判定において適用されることとなる。
なお、この雑音スペクトルの更新方法については、更に推定精度や推定追従性を向上させるために、例えば、音声・雑音区間判定結果信号104の値に応じて、複数の更新速度係数を適用したり、フレーム間での入力信号のパワーや雑音のパワーの変動性を参照し、これらの変動が大きい場合には更新速度を速めるような更新速度係数を適用したり、ある一定時間において、最もパワーが小さいフレーム、あるいは、音声・雑音区間判定結果信号104が最も小さい値を取るフレームの入力信号スペクトルで雑音スペクトルを置き換える(リセットする)など、様々な変形・改良が可能である。また、音声・雑音区間判定結果信号104の値が十分大きい場合、すなわち、現フレームの入力信号100が確率的に音声の可能性が高い場合には、雑音スペクトルの更新を行わなくても良い。なお、入力信号100のパワーや雑音のパワーについては、例えば、低域振幅スペクトル102や低域雑音スペクトル105から算出できる。
この実施の形態1によれば、入力信号の低域成分だけを使用して音声・雑音区間判定を行い、その結果に応じて低域雑音スペクトルならびに高域雑音スペクトルを推定するようにしたので、従来の方法では必要であった高域処理部の音声・雑音区間判定を省略することができ、処理量やメモリ量を削減できる効果がある。
また、雑音抑圧装置において重要な構成である、音声・雑音区間判定や雑音スペクトル推定が、低域処理と高域処理とで共通化することができるので、低域・高域でそれぞれ制御パラメータを独立して調整する必要が無くなり、それらの制御や調整を簡便化できる効果がある。
また、低域成分だけで音声・雑音区間判定を行うので、高域にパワーが集中するような騒音、例えば、自動車走行時の風切り音やエアコンのファンノイズなどが混入した音声信号でも、低域入力信号の音声・雑音区間判定精度を維持することができるので、正しく雑音スペクトルの推定を行うことができ、その結果、安定した雑音抑圧を行うことができる。
また、この実施の形態1では、各帯域に属する推定雑音成分の内部成分の細分度合いを帯域毎に異なるようにしたので、少ないメモリ量で各帯域に適した雑音スペクトル推定を行うことができる。
また、この実施の形態1における雑音スペクトルのサブバンド構成が、低域ではバークスペクトル帯域、高域では等間隔帯域構成になっているので、少ないメモリ量で低域では聴感上良好な特性で雑音スペクトル推定を行えるとともに、高域では雑音成分の追従性に優れた雑音スペクトル推定を行うことができる。
また、本実施の形態の構成を成すことにより、複数の異なる帯域の音声音響符号化方式に対応可能な帯域スケーラブル構成の雑音抑圧装置を、少ないメモリ量・処理量で構成することができる。
本実施の形態では、説明の簡略化のため帯域分割数を低域・高域の2分割としたが、例えば、0〜4kHz/4〜7kHz/7〜8kHzのように3つ以上の分割数でも良いし、分割後の帯域幅が異なっても良く、様々な音声音響符号化方式に対応することができる。この場合には、0〜4kHzの帯域で音声・雑音区間判定を行い、その音声・雑音区間判定結果を0〜4kHz/4〜7kHz/7〜8kHzの各帯域にそれぞれ適用し、各帯域の雑音スペクトル推定を行えばよい。
また、帯域制御信号が“狭帯域モード”の場合、高域処理部202内の高域抑圧量制御部5と高域雑音抑圧部7の動作を休止するとともに、低域雑音抑圧部6の出力結果である雑音抑圧された低域振幅スペクトル109の帯域合成部8への出力を休止することにより、更に処理量を削減することが可能である。
本実施の形態では、第1の周波数・時間変換部9の逆FFT処理に要する周波数点数を、時間・周波数変換部1と同一の点数である512点で実施しているが、例えば、低域振幅スペクトル102に対応した点数である256点の逆FFT処理にて実施することで、サンプリング変換部11が不要となり、更に処理量を削減することが可能である。
実施の形態2.
実施の形態1の変形例として、音声・雑音区間判定だけを全帯域の振幅スペクトルを用いて行い、その後の処理手段については実施の形態1と同様な構成とすることも可能であり、これを実施の形態2として説明する。
図4は、実施の形態2による雑音抑圧装置の全体構成を示すものであり、図1と異なる構成要素として、全帯域音声・雑音区間判定部18を有する全帯域処理部203を備えている。その他の構成要素に関しては、低域処理部201から音声・雑音区間判定部2が削除されている他は、図1の構成と同様であるため、対応する部分については同一符号を付してその説明を省略する。なお、全帯域処理部203が分析手段を構成し、低域処理部201および高域処理部202が複数の雑音抑圧手段を、また、帯域合成部8〜サンプリング変換部11および帯域制御信号111が切替手段を構成している。
時間・周波数変換部1は、所定のサンプリング周波数、所定のフレーム長(例えば、それぞれ16kHz、20ms)でサンプリング・フレーム分割された入力信号100に対し、例えば512点のFFTを用いて振幅スペクトルと位相スペクトルに変換した後、例えば0〜4kHzの帯域成分の低域振幅スペクトル102と、4kHz〜8kHzの帯域成分の高域振幅スペクトル103と、0〜8kHzの全帯域振幅スペクトル116、ならびに位相スペクトル101を出力する。
全帯域処理部203の構成要素である全帯域音声・雑音区間判定部18は、時間・周波数変換部1が出力する全帯域振幅スペクトル116と、過去のフレームから推定した低域雑音スペクトル105と、同じく過去のフレームから推定した高域雑音スペクトル106を用いて、現フレームの入力信号100が、音声あるいは雑音であるかどうかの度合いとして、例えば、音声の可能性が高い場合には大きな評価値を取り、音声の可能性が低い場合には小さな評価値を取るような、全帯域の音声らしさ信号VADWIDEの算出を行う。
全帯域の音声らしさ信号VADWIDEの算出方法として、例えば、入力信号100の全帯域振幅スペクトル116の加算結果と、雑音スペクトル推定部3が出力する、低域雑音スペクトル105と高域雑音スペクトル106との加算結果のパワーの比から算出できる現フレームの全帯域SN比や、全帯域振幅スペクトル116から得られるフレームパワー、あるいは、前述の式(2)と同様の手法にてスペクトル成分毎にSN比を算出し、得られたスペクトル成分毎のSN比から求めることができる、スペクトル成分毎のSN比の分散などを、それぞれ単独あるいは組み合わせて用いることが可能である。ここでは、実施の形態1と同様に説明の簡略化のため、現フレームの全帯域SN比を単独で用いた場合について示すこととする。現フレームの全帯域SN比SNRWIDE_FLは、次の式(9)で表すことができる。
Figure 2010113220
ここで、S(K)は、全帯域振幅スペクトル116の第k番目の成分、N(k)とN(k)は、それぞれ低域雑音スペクトル105、高域雑音スペクトル106の第k番目の成分、KとKはそれぞれ低域、高域のスペクトル番号数である。また、max{x,y}は、要素x、yのうち、値の大きい方を出力する関数であり、現フレームの全帯域SN比SNRWIDE_FLは、0以上の正値をとることとなる。
式(9)で求められた全帯域SN比SNRWIDE_FLから、全帯域の音声らしさ信号VADWIDEは、実施の形態1と同様に、例えば次の式(10)を用いて算出できる。
Figure 2010113220
ここで、THSNR(・)は判定用しきい値であって所定の定数であり、それぞれ騒音の種類や騒音のパワーに応じて、音声区間と雑音区間が好適に判定できるように予め調整すればよい。以上示した処理によって算出された全帯域の音声らしさ信号VADWIDEを、全帯域音声・雑音区間判定結果信号117として雑音スペクトル推定部3内の雑音スペクトル更新部15へ出力する。
なお、式(10)では、全帯域の音声らしさ信号VADWIDEを、所定の判定しきい値による0〜1の範囲の離散値として表現しているが、例えば、式(11)のように最大値(例えば、SNRmaxWIDE_FL=60dB)でSNRWIDE_FLの正規化を行い、0〜1の範囲の連続値として取り扱うことも可能である。
Figure 2010113220
雑音スペクトル推定部3は、全帯域音声・雑音区間判定部18が出力する全帯域音声・雑音区間判定結果信号117と、時間・周波数変換部1が出力する低域振幅スペクトル102と、高域振幅スペクトル103とを用いて、現フレームの入力信号100の様態が雑音の可能性が高い場合に雑音スペクトルの更新を行い、低域雑音スペクトル105と高域雑音スペクトル106を出力する。ここで、雑音スペクトルの更新方法や雑音スペクトルの記憶方法としては、例えば、実施の形態1と同様の方法をとることができる。
低域処理部201は、時間・周波数変換部1が出力する低域振幅スペクトル102と、雑音スペクトル推定部3が出力する低域雑音スペクトル105とを用いて、低域抑圧量制御部4で低域雑音抑圧量107の算出を行い、低域雑音抑圧部6では算出された低域雑音抑圧量107を用いて、低域振幅スペクトル102の雑音抑圧処理を行い、雑音抑圧された低域振幅スペクトル109を出力する。ここで、低域抑圧量制御部4と低域雑音抑圧部6の処理方法としては、例えば、実施の形態1と同様の方法をとることができる。
高域処理部202は、時間・周波数変換部1が出力する高域振幅スペクトル103と、雑音スペクトル推定部3が出力する高域雑音スペクトル106とを用いて、高域抑圧量制御部5で高域雑音抑圧量108の算出を行い、低域雑音抑圧部7では算出された高域雑音抑圧量108を用いて、高域振幅スペクトル103の雑音抑圧処理を行い、雑音抑圧された高域振幅スペクトル110を出力する。ここで、高域抑圧量制御部5と高域雑音抑圧部7の処理方法としては、例えば、実施の形態1と同様の方法をとることができる。
第1の周波数・時間変換部9は、低域雑音抑圧部6から入力された雑音抑圧された低域振幅スペクトル109と位相スペクトル101とを用いて、時間・周波数変換部1で実施したFFT点数(512点)に対応する逆FFT処理を行うことで時間領域信号に戻し、前後フレームとの滑らかな接続のための窓掛け処理を行いつつ連接を行い、得られた信号を、雑音抑圧された低域出力信号113として出力する。なお、上記の逆FFT処理において、4kHz〜8kHzの高域スペクトル成分に関してはゼロ詰めする。
サンプリング変換部11は、雑音抑圧された低域出力信号113と帯域制御信号111とを入力し、雑音抑圧装置200に接続されている音声符号化部を切り替えるための帯域制御信号111の値が“狭帯域モード”の場合には、入力信号1のサンプリング周波数である16kHzから、例えば8kHzへダウンサンプリングを行い、狭帯域出力信号114を狭帯域符号化部12へ出力する。
狭帯域符号化部12は、狭帯域出力信号114と帯域制御信号111とを入力し、帯域制御信号111が“狭帯域モード”の場合に、実施の形態1と同様に、例えば、AMR音声符号化方式などの公知の符号化方法を用いて、狭帯域出力信号114の圧縮・符号化を行う。
帯域合成部8は、低域雑音抑圧部6が出力する雑音抑圧された低域振幅スペクトル109と、高域雑音抑圧部7が出力する高域振幅スペクトル110と、狭帯域・広帯域符号化方法を切り替えるための帯域制御信号111とを入力し、帯域制御信号111が“広帯域モード”の場合には、振幅スペクトルの高域と低域をつなぎ合わせて全帯域の振幅スペクトルとする帯域合成処理を行い、雑音抑圧された全帯域振幅スペクトル112を出力する。
第2の周波数・時間変換部10は、帯域合成部8が出力する、雑音抑圧された全帯域振幅スペクトル112と位相スペクトル101とを入力し、時間・周波数変換部1で実施したFFT点数に対応する逆FFT処理を行うことで時間領域信号に戻し、前後フレームとの滑らかな接続のための窓掛け処理(重ね合わせ処理)を行いつつ連接を行い、得られた信号を、雑音抑圧された広帯域出力信号115として広帯域符号化部13へ出力する。
広帯域符号化部13は、広帯域出力信号115と帯域制御信号111とを入力し、帯域制御信号111が“広帯域モード”の場合に、実施の形態1と同様に、例えば、AMR−WB音声符号化方式などの公知の符号化方法を用いて、広帯域出力信号115の圧縮・符号化を行う。
この実施の形態2によれば、入力信号の全帯域信号を用いて音声・雑音区間判定を行い、その結果に応じて低域雑音スペクトルならびに高域雑音スペクトルを推定するようにしたので、従来の方法では必要であった高域処理部の音声・雑音区間判定を省略することができ、処理量やメモリ量を削減できる効果がある。
また、雑音抑圧装置において重要な構成である、音声・雑音区間判定や雑音スペクトル推定が、低域処理と高域処理とで共通化することができるので、低域・高域でそれぞれ制御パラメータを独立して調整する必要が無くなり、それらの制御や調整を簡便化できる効果がある。
上記2つの効果に加え、入力信号の低域成分だけでなく高域成分をも含む全帯域信号を用いて音声・雑音区間判定を行うことで、入力信号の音声らしさを分析するための情報量が多くなって音声・雑音区間判定精度が向上するので、更に雑音抑圧装置の品質を向上することができる。
また、雑音スペクトルのサブバンド構成が、低域ではバークスペクトル帯域、高域では等間隔帯域構成になっているので、少ないメモリ量で低域では聴感上良好な特性で雑音スペクトル推定を行えるとともに、高域では雑音成分の追従性に優れた雑音スペクトル推定を行うことができる。
また、本実施の形態の構成を成すことにより、複数の異なる帯域の音声音響符号化方式に対応可能な帯域スケーラブル構成の雑音抑圧装置を、少ないメモリ量・処理量で構成することができる。
本実施の形態では、説明の簡略化のため帯域分割数を低域・高域の2分割としたが、例えば、0〜4kHz/4〜7kHz/7〜8kHzのように3つ以上の分割数でも良いし、分割後の帯域幅が異なっても良く、様々な音声音響符号化方式に対応することができる。
また、帯域制御信号が“狭帯域モード”の場合、高域処理部202内の高域抑圧量制御部5と高域雑音抑圧部7の動作を休止するとともに、低域雑音抑圧部6の出力結果である雑音抑圧された低域振幅スペクトル109の帯域合成部8への出力を休止することにより、更に処理量を削減することが可能である。
本実施の形態では、第1の周波数・時間変換部9の逆FFT処理に要する周波数点数を、時間・周波数変換部1と同一の点数である512点で実施しているが、例えば、低域振幅スペクトル102に対応した点数である256点の逆FFT処理にて実施することで、サンプリング変換部11が不要となり、更に処理量を削減することが可能である。
実施の形態3.
実施の形態2の変形例として、全帯域処理部203内の全帯域音声・雑音区間判定部18に入力する全帯域振幅スペクトルを複数の帯域に帯域分割し、各帯域の音声・雑音区間判定を実施した総合結果を全帯域音声・雑音区間判定結果とし、その後の処理については実施の形態2と同様な構成とすることも可能であり、これを実施の形態3として次に説明する。
全帯域音声・雑音区間判定部18での全帯域振幅スペクトル116の帯域分割方法や帯域分割数は、低域処理部201と高域処理部202の帯域にとらわれる必要は無く、例えば、0〜2kHz/2〜4kHz/4〜8kHzの3分割でも構わない。また、音声検出に重要な帯域に分析帯域を重ねるために0〜4kHz/2〜8kHzなどと帯域が重なったり、ピーク性の雑音が常時混入している帯域を避けて分析するために1kHz〜4kHz/6〜8kHzなどと帯域が抜けたりしても構わない。上記のように、音声検出に重要な帯域を重ねたり、ピーク性雑音を避けて分析したりすることで、音声・雑音区間判定精度を更に向上することが可能である。
帯域分割した各帯域の音声・雑音区間判定方法としては、例えば、実施の形態2と同様な手法をとることができ、式(9)ならびに式(10)を各帯域向けに変形して適用した上、スペクトル数やしきい値定数などのパラメータについては、分割した帯域に併せて適宜調整すればよい。以上、得られた各帯域における音声らしさ信号を、例えば、次の式(12)に示すような重み付け平均を行い、その結果である全帯域の音声らしさ信号VADWIDEを全帯域音声・雑音区間判定結果信号117として出力する。
Figure 2010113220
ここで、Mは帯域分割数、VADSB(m)は帯域分割した帯域mにおける音声らしさ信号である。また、WVAD(m)は帯域mにおける所定の重み付け係数であり、帯域分割方法や騒音の種類などに応じて、音声・雑音区間判定結果が良好になるように適宜調整すればよい。
この実施の形態3によれば、音声・雑音区間判定において、音声検出に重要な帯域を重ねたり、ピーク性雑音を避けて分析したりすることで、音声・雑音区間判定精度を更に向上することができ、実施の形態2にて述べた効果に加え、更に雑音抑圧装置の品質を向上することができる。
実施の形態4.
実施の形態1の変形例として、音声復号化処理後に雑音抑圧することも可能であり、これを実施の形態4として次に説明する。
図5は、実施の形態4による雑音抑圧装置の全体構成を示すものであり、図1の構成と異なる点は、雑音抑圧装置200の入力側に、狭帯域復号化部19、広帯域復号化部20、アップサンプリング部21、切り替え部22を備えていることである。また、図1における狭帯域符号化部12および広帯域符号化部13は接続されていない。その他の構成については、図1と同様であるため、対応する部分に同一符号を付してその説明を省略する。
例えば、有線・無線通信路やメモリなどの記憶手段などを介して、復号化方式を切り替えるための帯域制御信号111に従って、帯域制御信号111が“狭帯域モード”の場合には、狭帯域符号化データ118が狭帯域復号化部19に、帯域制御信号111が“広帯域モード”の場合には、広帯域符号化データ119が広帯域復号化部20にそれぞれ入力される。なお、それぞれの符号化データは、別途音声符号化部(例えば、AMR音声符号化方式やAMR−WB音声符号化方式)が音声音響信号を符号化した結果である。
狭帯域復号化部19は、狭帯域符号化データ118に対して前記の音声符号化部に対応する所定の復号化処理を行い、狭帯域復号信号120を後述のアップサンプリング部21に出力する。
広帯域復号化部20は、広帯域符号化データ119に対して前記音声符号化部に対応する所定の復号化処理を行い、広帯域復号信号121を切り替え部22に出力する。
アップサンプリング部21は、狭帯域復号信号120を入力し、広帯域復号信号121と同じサンプリング周波数にアップサンプリング処理を行い、アップサンプリングされた狭帯域復号信号122として出力する。
切り替え部22は、広帯域復号信号121と、アップサンプリングされた狭帯域復号信号122と、帯域制御信号111とを入力し、帯域制御信号111が“狭帯域モード”の場合には、アップサンプリングされた狭帯域復号信号122を復号信号123として出力し、帯域制御信号111が“広帯域モード”の場合には、広帯域復号信号121を復号信号123として出力する。
時間・周波数変換部1は、実施の形態1と同様に、入力信号100の代わりに復号信号123に対してフレーム分割、窓掛け処理を行い、窓掛け後の信号に対して例えばFFTを行って、周波数毎のスペクトル成分である低域振幅スペクトル102を低域処理部201における図示省略した音声・雑音区間判定部2、低域抑圧量制御部4、低域雑音抑圧部6と雑音スペクトル推定部3へと出力し、また、高域振幅スペクトル103を高域処理部202における図示省略した高域抑圧量制御部5および高域雑音抑圧部7と、雑音スペクトル推定部3とに対してそれぞれ出力する。
雑音スペクトル推定部3は、音声・雑音区間判定結果信号104と、低域振幅スペクトル102と、高域振幅スペクトル103とを用いて、復号信号123中の平均的な雑音スペクトルを推定し、低域雑音スペクトル105ならびに高域雑音スペクトル106として出力する。なお、この雑音スペクトル推定部3内の構成と各処理と、音声・雑音区間判定部2の処理については、実施の形態1と同様なものを用いることが可能である。
以降の処理内容については、実施の形態1と同様であるので、説明を省略する。
この実施の形態4によれば、雑音抑圧装置において重要な構成である、音声・雑音区間判定や雑音スペクトル推定が、低域処理と高域処理とで共通化することができるので、低域・高域でそれぞれ制御パラメータを独立して調整する必要が無くなり、それらの制御や調整を簡便化できる効果がある。
また、本実施の形態の構成を成すことにより、複数の異なる帯域の音声音響復号化方式に対応可能な帯域スケーラブル構成の雑音抑圧装置を、少ないメモリ量・処理量で構成することができる。
なお、図5にて示した本実施の形態における雑音抑圧装置200の内部構成を、図4にて示した実施の形態2の雑音抑圧装置200の内部構成に置き換えても、上記述べたのと同様な効果を奏効することが可能である。
実施の形態5.
上記実施の形態1から実施の形態4では、高速フーリエ変換によってスペクトル成分を算出し、変形処理を実施し、逆高速フーリエ変換によって時間領域の信号に戻しているが、高速フーリエ変換の代わりにバンドパスフィルタ群の各出力に対して、雑音抑圧処理を実施し、帯域別信号の加算によって出力信号を得る構成も可能であるし、ウェーブレット(Wavelet)変換等の変換関数を用いることも可能である。
この実施の形態5によれば、フーリエ変換を使用しない構成でも、実施の形態1から実施の形態4にて述べたのと同様の効果が得られる。
以上のように、この発明に係る雑音抑圧装置は、雑音が混入した入力信号から目的外信号である雑音を抑圧する構成に関するものであり、種々の雑音環境下で用いられる音声通信システム、音声蓄積システム、音声認識システムに用いるのに適している。

Claims (4)

  1. 入力信号を複数の帯域に分割し、当該分割した複数の帯域のうち、所定の帯域成分の分析結果に応じて、前記所定の帯域成分の雑音抑圧と、前記所定の帯域以外の帯域成分の雑音抑圧を行うことを特徴とする雑音抑圧装置。
  2. 入力信号から、複数の帯域の各帯域に属する推定雑音成分を抽出する雑音成分推定手段を備え、前記推定雑音成分の内部成分の細分度合いが、前記帯域毎に異なることを特徴とする請求項1記載の雑音抑圧装置。
  3. 推定雑音成分の内部成分の細分度合いとして、低域部では前記推定雑音成分を非均等に細分し、高域部では前記推定雑音成分を均等に細分することを特徴とする請求項2記載の雑音抑圧装置。
  4. 入力信号の全帯域成分を分析する分析手段と、
    前記入力信号を帯域分割して得られた複数の帯域成分の雑音抑圧を行う複数の雑音抑圧手段と、
    全帯域成分あるいは一部の帯域成分の雑音抑圧手段を切り替える切替手段とを備え、
    前記分析手段の分析結果に応じて、全帯域成分あるいは一部帯域成分の雑音抑圧処理を行うことを特徴とする雑音抑圧装置。
JP2011506852A 2009-04-02 2009-04-02 雑音抑圧装置 Active JP5535198B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/001554 WO2010113220A1 (ja) 2009-04-02 2009-04-02 雑音抑圧装置

Publications (2)

Publication Number Publication Date
JPWO2010113220A1 true JPWO2010113220A1 (ja) 2012-10-04
JP5535198B2 JP5535198B2 (ja) 2014-07-02

Family

ID=42827554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011506852A Active JP5535198B2 (ja) 2009-04-02 2009-04-02 雑音抑圧装置

Country Status (5)

Country Link
US (1) US20110286605A1 (ja)
EP (1) EP2416315B1 (ja)
JP (1) JP5535198B2 (ja)
CN (1) CN102356427B (ja)
WO (1) WO2010113220A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8311085B2 (en) 2009-04-14 2012-11-13 Clear-Com Llc Digital intercom network over DC-powered microphone cable
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) * 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8762139B2 (en) * 2010-09-21 2014-06-24 Mitsubishi Electric Corporation Noise suppression device
US8924206B2 (en) * 2011-11-04 2014-12-30 Htc Corporation Electrical apparatus and voice signals receiving method thereof
JPWO2013136742A1 (ja) * 2012-03-14 2015-08-03 パナソニックIpマネジメント株式会社 車載通話装置
US20130282372A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9304010B2 (en) * 2013-02-28 2016-04-05 Nokia Technologies Oy Methods, apparatuses, and computer program products for providing broadband audio signals associated with navigation instructions
US9639906B2 (en) 2013-03-12 2017-05-02 Hm Electronics, Inc. System and method for wideband audio communication with a quick service restaurant drive-through intercom
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
CN107210824A (zh) 2015-01-30 2017-09-26 美商楼氏电子有限公司 麦克风的环境切换
GB2548614A (en) 2016-03-24 2017-09-27 Nokia Technologies Oy Methods, apparatus and computer programs for noise reduction
DE102017203469A1 (de) * 2017-03-03 2018-09-06 Robert Bosch Gmbh Verfahren und eine Einrichtung zur Störbefreiung von Audio-Signalen sowie eine Sprachsteuerung von Geräten mit dieser Störbefreiung
CN109147795B (zh) * 2018-08-06 2021-05-14 珠海全志科技股份有限公司 声纹数据传输、识别方法、识别装置和存储介质
JP7398895B2 (ja) * 2019-07-31 2023-12-15 株式会社デンソーテン ノイズ低減装置
CN113571078B (zh) * 2021-01-29 2024-04-26 腾讯科技(深圳)有限公司 噪声抑制方法、装置、介质以及电子设备
CN113539226B (zh) * 2021-06-02 2022-08-02 国网河北省电力有限公司电力科学研究院 一种变电站主动降噪控制方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03223798A (ja) * 1989-12-22 1991-10-02 Sanyo Electric Co Ltd 音声切り出し装置
US5583961A (en) * 1993-03-25 1996-12-10 British Telecommunications Public Limited Company Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
JP2000066691A (ja) * 1998-08-21 2000-03-03 Kdd Corp オーディオ情報分類装置
JP2000206995A (ja) 1999-01-11 2000-07-28 Sony Corp 受信装置及び方法、通信装置及び方法
JP2000261530A (ja) * 1999-03-10 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 通話装置
JP3454190B2 (ja) 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
JP2001318694A (ja) * 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
EP1768108A4 (en) * 2004-06-18 2008-03-19 Matsushita Electric Ind Co Ltd NOISE SUPPRESSION DEVICE AND NOISE SUPPRESSION METHOD
JP2006113515A (ja) * 2004-09-16 2006-04-27 Toshiba Corp ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置
WO2006046293A1 (ja) * 2004-10-28 2006-05-04 Fujitsu Limited 雑音抑圧装置
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
JP2006201622A (ja) 2005-01-21 2006-08-03 Matsushita Electric Ind Co Ltd 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法
DK1760696T3 (en) * 2005-09-03 2016-05-02 Gn Resound As Method and apparatus for improved estimation of non-stationary noise to highlight speech
JP4728791B2 (ja) * 2005-12-08 2011-07-20 日本電信電話株式会社 音声認識装置、音声認識方法、そのプログラムおよびその記録媒体
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법

Also Published As

Publication number Publication date
CN102356427A (zh) 2012-02-15
US20110286605A1 (en) 2011-11-24
CN102356427B (zh) 2013-10-30
JP5535198B2 (ja) 2014-07-02
WO2010113220A1 (ja) 2010-10-07
EP2416315B1 (en) 2015-05-20
EP2416315A1 (en) 2012-02-08
EP2416315A4 (en) 2013-06-19

Similar Documents

Publication Publication Date Title
JP5535198B2 (ja) 雑音抑圧装置
JP5528538B2 (ja) 雑音抑圧装置
KR100851716B1 (ko) 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제
US8571231B2 (en) Suppressing noise in an audio signal
US8521530B1 (en) System and method for enhancing a monaural audio signal
US8249861B2 (en) High frequency compression integration
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
US8712074B2 (en) Noise spectrum tracking in noisy acoustical signals
JP5535241B2 (ja) 音声信号復元装置および音声信号復元方法
JP5646077B2 (ja) 雑音抑圧装置
JP5127754B2 (ja) 信号処理装置
JP4836720B2 (ja) ノイズサプレス装置
JP5153886B2 (ja) 雑音抑圧装置および音声復号化装置
WO2006001960A1 (en) Comfort noise generator using modified doblinger noise estimate
WO2011127832A1 (en) Time/frequency two dimension post-processing
US9390718B2 (en) Audio signal restoration device and audio signal restoration method
JPWO2018163328A1 (ja) 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
JP4448464B2 (ja) 雑音低減方法、装置、プログラム及び記録媒体
JP2012181561A (ja) 信号処理装置
JP5840087B2 (ja) 音声信号復元装置および音声信号復元方法
Upadhyay et al. A perceptually motivated stationary wavelet packet filter-bank utilizing improved spectral over-subtraction algorithm for enhancing speech in non-stationary environments
Kim et al. Noise reduction scheme for multi-screen aware IP-based triple play service on U-Home's Smart Devices

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140422

R150 Certificate of patent or registration of utility model

Ref document number: 5535198

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250