JP4163267B2 - 雑音抑圧器及び移動局並びに雑音抑圧方法 - Google Patents

雑音抑圧器及び移動局並びに雑音抑圧方法 Download PDF

Info

Publication number
JP4163267B2
JP4163267B2 JP33223796A JP33223796A JP4163267B2 JP 4163267 B2 JP4163267 B2 JP 4163267B2 JP 33223796 A JP33223796 A JP 33223796A JP 33223796 A JP33223796 A JP 33223796A JP 4163267 B2 JP4163267 B2 JP 4163267B2
Authority
JP
Japan
Prior art keywords
noise
signal
suppression
voice
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP33223796A
Other languages
English (en)
Other versions
JPH09204196A (ja
Inventor
ベーヘータロ アンティ
ヘッキネン ユーハ
パージャネン エルッキ
マッティラ ビレ−ベイコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JPH09204196A publication Critical patent/JPH09204196A/ja
Application granted granted Critical
Publication of JP4163267B2 publication Critical patent/JP4163267B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、雑音抑圧方法、移動局、及び、音声信号中の雑音を抑圧するための雑音抑圧器に関する。この抑圧器は、前記音声信号を所定の第1周波数範囲を表す第1の量のサブ信号に分割するための手段と、サブ信号中の雑音を所定の抑圧係数に従って抑圧するための抑圧手段とを有する。本発明の雑音抑圧器は、特にセルラー通信網で動作する移動局において音響暗騒音を消去するために用いることのできるものである。本発明は、特にスペクトル減算に基づく暗騒音抑圧に関する。
【0002】
【従来の技術】
スペクトル減算に基づく種々の雑音抑圧方法が従来技術から知られている。スペクトル減算を使用するアルゴリズムは、一般に、特許公報WO89/06877及びUS5、012、519に開示されているように高速フーリエ変換(FFT)を使用することにより、又は特許公報US4、630、305、US4、630、304、US4、628、529、US4、811、404及びEP343792に開示されているようにフィルター群を使用することによって、信号を周波数に応じて各周波数成分に、即ちより小さな周波数範囲に、分割することに基づいている。スペクトル減算に基づく従来の手法では、パワースペクトル(振幅スペクトル)の各周波数範囲に対応する成分が計算され、各周波数範囲が別々に処理される、即ち雑音は各周波数範囲について別々に抑圧される。通常、この様な処理は次のように行われる。即ち、各周波数範囲の信号が音声を含んでいるか否か各周波数範囲について別々に検出し、もし含んでいなければ雑音が関係しているので、その信号を抑圧する。最後に、各周波数範囲の信号を再結合させることにより、雑音抑圧された信号である出力とする。スペクトル減算に基づく従来公知の方法の欠点は、各周波数範囲について別々に計算を実行しなければならないために計算量が多いことである。
【0003】
スペクトル減算に基づく雑音抑圧方法は、一般に、雑音信号の推定値を求め、種々の周波数帯域での雑音減衰量を調整するためにそれを利用する。雑音のパワーを表す変数の量を測定し、それを利用して増幅率を調整することが従来公知である。特許US4、630、305は雑音抑圧方法を開示しており、その方法は、種々の周囲雑音値についての抑圧値のテーブルを利用して、減衰量調整のために平均雑音レベルを利用しようとするものである。
【0004】
スペクトル減算に関連して窓掛け(windowing) が知られている。窓掛けの目的は、一般に、信号を時間領域において各フレームに分割することによって、その信号のスペクトル推定値の質を高めることである。窓掛けのもう一つの基本的目的は、例えばスピーチなどの変動する(不安定な)信号を、変動しないと(安定していると)見なすことのできる各セグメント(各フレーム)に細分することである。窓掛けに関して、ハミング型(Hamming type)、ハニング型(Hanning type)、又はカイゼル型(Kaiser type)の窓掛け方法を使うことが一般に知られている。スペクトル減算に基づく方法では、いわゆる50%重なりハニング窓掛け方法(50 % overlapping Hanning windowing)と、逆FFT(IFFT)と関連して使用されるいわゆる重なり・加算方法(overlap-add method)を使用するのが一般的である。
【0005】
【発明が解決しようとする課題】
これらの従来公知の方法の全てに伴う問題は、窓掛け方法が特定のフレーム長を持っていて、窓掛けフレームの長さを他のフレーム長と調和させるのが困難であるということである。例えばデジタル移動電話通信網では、音声はフレームにより符号化され、特定の音声フレームがシステムで使用され、従って各音声フレームは例えば20msなどの指定された同じ長さを有する。窓掛けのためのフレーム長が音声符号化用のフレーム長と異なるときには、雑音抑圧及び音声符号化に使用される各フレーム長が異なるために雑音抑圧及び音声符号化を行うことに起因して発生する総遅延量が問題となる。
【0006】
【課題を解決するための手段】
本発明による雑音を抑圧する方法においては、入力信号は始めに第1の量の周波数帯域に分割し、各周波数帯域に対応するパワースペクトル成分を計算し、第2の量のパワースペクトル成分を再結合させることにより、前記の第1の周波数帯域より広い第2の周波数帯域を表す計算スペクトル成分とし、この計算スペクトル成分に含まれている雑音に基づいて該計算スペクトル成分についての抑圧係数を決定し、前記計算スペクトル成分に基づく抑圧係数を用いて前記の第2の量のパワースペクトル成分を抑圧する。隣り合う数個の周波数帯域を表す数個の計算スペクトル成分を形成するのが好ましく、各計算スペクトル成分は種々のパワースペクトル成分を再結合させることにより形成される。各計算スペクトル成分は、他とは異なる数個のパワースペクトル成分からなり、或いは他の計算スペクトル成分と等しい数個のパワースペクトル成分からなっていてもよい。この様にして各計算スペクトル成分について雑音抑圧のための抑圧係数が形成され、各計算スペクトル成分が減衰させられ、減衰後の計算スペクトル成分が時間領域に再変換され、再結合されて、雑音抑圧された出力信号となる。計算スペクトル成分を前記の第1の量の周波数帯域より少数とし、その結果として声の質を低下させることなく計算量を減らすのが好ましい。
【0007】
本発明の一実施例は、FFT変換に基づいて各周波数成分に分割する。本発明の利点の一つは、本発明の方法では周波数範囲成分の数が減少していて、その結果として抑圧係数を計算する際の計算が少なくなるという顕著な利点が得られることである。各抑圧係数を広い周波数範囲に基づいて形成するときには、ランダムな雑音は抑圧係数の値を急に変化させることはできない。抑圧係数の値の急な変動は不快に聞こえるので、この様にして音声の質の向上が達成される。
【0008】
本発明の方法では、入力信号から窓掛けにより各フレームが形成され、その窓掛けにおいては、音声符号化に用いられるフレーム長の均等商(even quotient)であるような長さのフレームが用いられる。この文脈において均等商とは音声符号化に用いられるフレーム長で均等に割り切れる数を意味し、例えばフレーム長160の均等商は80、40、32、20、16、8、5、4、2及び1であることを意味する。この種の手法は総遅延量を著しく短くする。
【0009】
更に前記の米国特許第4、630、305号と本発明の方法との他の差違は、平均音声パワーを得て相対雑音レベルを決定することである。推定音声レベル及び雑音レベルを決定し、それらを用いて雑音抑圧を行うことにより、雑音レベルだけを用いる場合より良好な結果が得られる。その理由は、雑音抑圧アルゴリズムに関しては音声のレベルと雑音レベルとの比率が非常に重要な意味を持つことである。
【0010】
更に、本発明の方法では、テーブルに載っている固定された値を使用する従来の方法とは異なって、連続的な雑音レベル値(連続的な相対雑音レベル値)に従って抑圧量を調整する。本発明の方法では、後でもっと詳しく説明するように、各帯域での現在の信号対雑音比に応じて、相対雑音推定値に従って抑圧量を減少させる。このため、音声は可能な限り自然なままに保たれ、音声が優勢となっている帯域で音声が雑音を圧倒することが可能となる。この連続的抑圧調整は、連続的な値を有する各変数を使用することにより実現されている。連続的な、即ちテーブル上で固定されていない、各パラメータを使用することにより、雑音抑圧値に大きな瞬間的変化が生じることのない雑音抑圧が可能となる。また、従来公知の利得値のテーブル化のために必要な大きな記憶容量が不要となる。
【0011】
本発明の雑音抑圧器及び移動局は、第2の量のサブ信号を再結合させて、前記の第1の周波数範囲より広い所定の第2の周波数範囲を表す計算信号とする再結合手段と、該計算信号に含まれている雑音に基づいて該計算信号についての抑圧係数を決定するための決定手段とを更にそなえており、抑圧手段が、再結合されて該計算信号となっている各該サブ信号を、該計算信号に基づいて決定された前記抑圧係数により抑圧するようにされていることを特徴とする。
【0012】
本発明の雑音抑圧方法は、雑音抑圧を行う前に、第2の量のサブ信号を再結合させて、前記の第1の周波数範囲より広い所定の第2の周波数範囲を表す計算信号とし、該計算信号に含まれる雑音に基づいて該計算信号についての抑圧係数を決定し、再結合されて該計算信号となった各該サブ信号を、該計算信号に基づいて決定された前記抑圧係数により抑圧することを特徴とする。
【0013】
【発明の実施の形態】
次に、添付図面を参照して本発明の雑音抑圧システムについて詳しく解説する。
【0014】
図1は、本発明の装置の基本的機能を示すためのブロック図である。該装置の一実施例が図2及び図3に一層詳しく示されている。マイクロホン1から到来する音声信号はA/D変換器2でサンプリングされてデジタル信号x(n)となる。
【0015】
音声コーデックにより使用されるフレーム長の均等商(even quotient)に対応する量の各サンプルがデジタル信号x(n)から取り出されて窓掛けブロック(windowing block)10に送られる。窓掛けブロック10において、フレームを形成するために、各サンプルに所定の窓(window)が乗算される。ブロック10において、フレームの長さをフーリエ変換に適するように調整するために、もし必要ならば窓掛けされたフレームに各サンプルが加算される。窓掛け後に、FFTブロック20において該フレームについて高速フーリエ変換(FFT)を使用してスペクトルが計算される。
【0016】
FFT計算20の後に、信号中の雑音を抑圧するために計算ブロック200で雑音抑制のための計算が行われる。雑音抑制のための計算を実行するために、FFTブロック20から得られたスペクトル成分X(f)に基づいて例えば振幅又はパワースペクトルP(f)などの所望のタイプのスペクトルがスペクトル形成ブロック50で形成される。各スペクトル成分P(f)は周波数領域において或る周波数範囲を表す、即ちスペクトルを利用して、処理される信号が異なる周波数の幾つかの信号即ちスペクトル成分P(f)に分割される。計算量を少なくするために、隣り合うスペクトル成分P(f)同士が計算ブロック60で合計され、スペクトル成分P(f)の数より少数の、或る数のスペクトル成分結合が得られて、前記スペクトル成分結合が抑圧係数を計算するために計算スペクトル成分S(s)として使われる。計算スペクトル成分S(s)に基づいて、推定ブロック190において信号が音声又は暗騒音を含んでいるか否かが検出され、暗騒音についてのモデルが形成され、計算スペクトル成分の各周波数範囲について信号対雑音比が形成される。この様にして得られた信号対雑音比と暗騒音モデルとに基づいて、各計算スペクトル成分S(s)について計算ブロック130で抑圧値G(s)が計算される。
【0017】
雑音を抑圧するために、掛け算器30において、スペクトル成分X(f)がその中に位置する周波数範囲に対応する抑圧係数G(s)が、FFTブロック20から得られた各スペクトル成分X(f)に乗じられる。IFFTブロック40において、雑音抑圧係数G(s)で調整された各スペクトル成分に対して逆高速フーリエ変換IFFTが実行され、ここから、窓掛けブロック10のために選択された各サンプルに対応する各サンプルが選択されて出力されて、出力即ち雑音抑圧されたデジタル信号y(n)となり、この信号は移動局において音声コーデックに回送されて音声符号化される。デジタル信号y(n)の各サンプルの量は、音声コーデックが使用するフレーム長の均等商であるので、音声コーデックのフレーム長に対応するような信号フレームが得られるまで、連続する雑音抑圧された信号y(n)が必要な量だけ音声コーデックに集められ、その後に音声コーデックは該音声フレームに対して音声符号化を実行することができるようになる。雑音抑圧器に使用されるフレーム長は音声コーデックのフレーム長の均等商であるので、この様にして雑音抑圧音声フレームと音声コーデック音声フレームとの長さが異なることに起因する遅延が防止される。
【0018】
計算スペクトル成分S(s)の数はスペクトル成分P(f)の数より少ないので、それらに基づいて抑圧成分を計算することは、パワースペクトル成分P(f)を計算に用いる場合よりかなり容易である。より広い周波数範囲について各々の新しい計算スペクトル成分S(s)が計算されているので、それらの変化はスペクトル成分P(f)の変化より小さい。それらの変化の原因は特に信号中のランダム雑音である。計算に使用される成分S(s)のランダムな変化が小さいので、連続するフレーム同士の間で計算される抑圧係数G(s)の変化も小さい。上記のように、周波数応答X(f)の数個のサンプルを乗じるために同じ抑圧係数G(s)が使用される結果として、同じフレーム内での周波数領域の変化が小さくなる。その結果として、抑圧係数の急激すぎる変化は不快に聞こえるので、音声の質が向上する。
【0019】
次に、主として図2及び図3を参照して本発明の一実施例を更に詳しく説明する。以下の記述に現れるパラメータの値は例示的な値であって、本発明の一実施例を描写するものであるけれども、それらは本発明の方法の機能を特定のパラメータ値のみに限定するものではない。この実施例では、FFT計算の長さは128サンプルであり、音声コーデックが使用するフレーム長は160サンプルであり、各音声フレームは20msの音声から成ると仮定されている。また、この実施例では、各スペクトル成分の数を65から8まで減らす、スペクトル成分の再結合が提示される。
【0020】
図2及び図3は本発明の装置の一実施例のより詳しいブロック図である。図2及び図3において、該装置への入力はA/D変換されたマイクロホン信号であるが、このことは、音声信号がサンプリングされて80個のサンプルから成るデジタル音声フレームとなっていることを意味する。音声フレームは窓掛けブロック10に入力され、ここで音声フレームに窓が乗算させられる。この実施例で使用される窓掛け(windowing)では窓同士が部分的に重なり合うので、部分的に重なり合う各サンプルが次のフレームのためにメモリ(ブロック15)に記憶される。80個のサンプルが信号から取り出されて、前のフレームの際に記憶された16個のサンプルと結合されて、合計で96サンプルとなる。最後に収集された各80個のサンプルの中から、最後の16個のサンプルが次のフレームの計算のために記憶される。
【0021】
この様にして、与えられた96個のサンプルに96個のサンプル値から成る窓が窓掛けブロック10において乗算され、図11に描かれているようにその窓の始めの8個の値は窓の立ち上がり部IU を形成し、最後の8個の値は窓の立ち下がり部ID を形成する。窓I(n)を下記のように定義することができ、ブロック11(図4)で実現される:
【数1】
Figure 0004163267
【0022】
窓掛け(ブロック11)をデジタル的に実施する方法はデジタル信号処理技術から当業者に知られている。この窓で中間の80個の値(n = 8,..,87 即ち中間部IM )は1であり、従ってそれらを乗算しても結果は変わらないので掛け算は省略される。従って、窓の中の始めの8個のサンプルと終わりの8個のサンプルだけを掛ければよい。FFTの長さは2の累乗でなければならないので、ブロック11から得られた96個のサンプルの終端部に32個のゼロ(0)がブロック12(図4)において付加されて、128個のサンプルから成る音声フレームとなる。サンプル列の終端部にサンプルを付加することは単純な操作であって、ブロック12をデジタル的に実現することは当業者にとっては従来公知のことである。
【0023】
窓掛けブロック10で実行される窓掛けの後に、ブロック20において音声フレームのスペクトルが高速フーリエ変換FFTにより計算される。FFTから得られた実数成分及び虚数成分は平方ブロック50で絶対値平方され、対をなして加え合わされ、その出力は音声フレームのパワースペクトルである。FFTの長さが128であるならば、得られるパワースペクトル成分の数は65であり、これはFFT変換の長さを2で割って、その結果を1だけ増やす(インクリメントする)ことにより得られる。即ちFFT/2+1の長さである。
【0024】
FFTブロック20に到着したフレームの中の各サンプルx(0),x(1),..,x(n);n=127(即ち前記の128個のサンプル)は実数(real)FFT(高速フーリエ変換)により周波数領域に変換されて周波数領域サンプルX(0),X(1),..,X(f);f=64(より一般的にはf=(n+1)/2)となり、その各サンプルは実数成分Xr(f)と虚数成分Xi(f)とから成る:
【数2】
Figure 0004163267
【0025】
高速フーリエ変換をデジタル的に実現することは当業者にとっては従来公知のことである。パワースペクトルは、実数成分及び虚数成分の2乗の和を成分毎に計算することにより平方ブロック(squaring block)50から得られる:
【数3】
Figure 0004163267
【0026】
図5に示されているように、実数成分及び虚数成分を平方ブロック(squaring blocks)51及び52(これらのブロックは従来公知の単純な2乗の計算をデジタル的に実行する)に入力し、その2乗された成分同士を総和器53で加え合わせることによって、平方ブロック50の機能を実現することができる。この様にして、平方ブロック50の出力として、パワースペクトル成分P(0),P(1),..,P(f);f=64が得られ、これらのパワースペクトル成分は次のように時間領域信号の種々の周波数の成分のパワーに対応する(8kHzのサンプリング周波数を使用すると仮定する):
f=0,...,64の値についてのP(f)は中間周波数(f・4000/64Hz)に対応する。 (4)
【0027】
8個の新しいパワースペクトル成分、すなわちパワースペクトル成分結合(すなわち一群の合成信号に相当する)S(s),s=0,..,7がブロック60で形成され、本書ではそれらを計算スペクトル成分と称する。この計算スペクトル成分(すなわち上記の合成信号)S(s)は、次の〔数4〕の通りに各計算スペクトル成分S(s)について常に7個の隣り合うパワースペクトル成分P(f)を合計することにより形成される:
【数4】
Figure 0004163267
【0028】
図6に示されているように、カウンタ61が常に7まで数え上げ、該カウンタにより制御されて総和器62が常に7個の連続する成分を合計してその総和を出力として発生するようにカウンタ61と総和器62とを利用することにより、これを実現することができる。この場合、最低位の結合成分S(0)は中間周波数 [62.5Hz〜437.5Hz] に対応し、最高位の結合成分S(7)は中間周波数 [3125Hz〜3500Hz] に対応する。これより低い(62.5Hzより低い)周波数と、これより高い(3500Hzより高い)周波数とは音声については重要でないので、電話システムでは常に減衰させられ、従って、それらを抑圧係数の計算に使うことは必要でない。
【0029】
他の種類の周波数範囲分割方法を用いてパワースペクトル成分P(f)から計算スペクトル成分S(s)を形成することもできる。例えば、結合されて1つの計算スペクトル成分S(s)とされるパワースペクトル成分P(f)の個数は、異なる計算スペクトル成分又は異なるsの値に対応する異なる周波数帯域について異なっていてもよい。更に、異なる数、即ち8より大きい数や小さい数、の計算スペクトル成分S(s)を使用することもできる。
【0030】
隣り合う成分同士を加え合わせるという方法以外にも、各成分を再結合させる方法が幾つもあることに注意しなければならない。一般に、次のように適当な係数でパワースペクトル成分P(f)に重みを付けることによって前記計算スペクトル成分S(s)を計算することができる:
【数5】
Figure 0004163267
ここで係数a(0)〜a(64)は定数(各成分S(s),s=0,・・・,7について異なる係数)である。
【0031】
上記したように、スペクトル成分、即ち周波数範囲、の質は数個の範囲の成分を合計することによってかなり低下している。計算スペクトル成分を形成した後の、次の段階は、抑圧係数の計算である。
【0032】
抑圧係数を計算するとき、前記の計算スペクトル成分S(s)が使われ、それらに対応する抑圧係数G(s),s=0,・・・,7が計算ブロック130で計算される。周波数領域サンプルX(0),X(1),...,X(f);f=0,..,64に前記の抑圧係数が乗算される。各係数G(s)は、各成分S(s)を計算する基礎として使われた各サンプルに乗算される、例えば各サンプルX(15),..,X(21)にG(2)が乗算される。また、最下位のサンプルX(0)にはサンプルX(1)と同じ係数が乗算され、最高位の各サンプルX(57),..,X(64)にはサンプルX(56)と同じ係数が乗算される。
【0033】
乗算は掛け算器30で実数成分と虚数成分とを別々に掛け合わせることにより実行され、その出力として下記の結果が得られる:
【数6】
Figure 0004163267
【0034】
この様にしてY(f);f=0,..,64が得られ、その実逆高速フーリエ変換(real inverse fast Fourier transform)がIFFTブロック40で計算され、その出力として時間領域サンプルy(n),n=0,..,127が得られるが、その中の雑音は抑圧されている。
【0035】
より一般的には、各周波数領域サンプルX(0),X(1),..,X(f),f=0,..,64についての抑圧を、次のようにして数個の抑圧係数の重み付き総和として計算することができる:
【数7】
Figure 0004163267
ここで各係数b(0),..,b(7)は定数である(各成分X(f),f=0,..,64について異なる係数)。
【0036】
計算スペクトル成分S(s)は8個しかないので、それらに基づく抑圧係数の計算は、65個のパワースペクトル成分P(f)を用いて計算を行う場合よりは相当容易である。各々の新しい計算スペクトル成分S(s)はより広い範囲について計算されているので、それらの値の変化は各パワースペクトル成分P(f)の変化より小さい。これらの変化は特に信号中のランダム雑音に起因するものである。計算に用いられる計算スペクトル成分S(s)のランダムな変化が小さいので、連続するフレーム同士の間での計算された各抑圧係数G(s)の変化も小さい。同じ抑圧係数G(s)が、上記の通りに、周波数応答X(f)の幾つかのサンプルに乗算されるので、フレーム内の周波数領域の変化が小さくなる。抑圧係数の急激すぎる変化は不快に聞こえるので、その結果として音声の質が向上する。
【0037】
計算ブロック90において、次に説明するように、関係するフレームのパワースペクトル成分と、暗騒音モデルの対応する成分との比として各周波数帯域で後天的(posteriori)信号対雑音比が計算される。
【0038】
音声活性検出器(voice activity detector)が音声を検出しないとき、雑音のスペクトルN(s),s=0,..,7が推定ブロック80で推定される(図10により詳しく示されている)。ブロック80において、ブロック60から得られた信号のスペクトルの各成分S(s),s=0,..,7について時間平均された平均値を巡回的に(recursively)計算することにより、推定が行われる:
【数8】
Figure 0004163267
【0039】
この文脈において、Nn-1 (s) は、図10に示されているように、メモリ83から得られる、前のフレームについて計算された雑音スペクトル推定値を意味し、Nn (s) は上記の等式による現在のフレーム(n=フレームの順序番号)についての推定値を意味する。この計算はブロック81で好ましくはデジタル的に実行される。ブロック81の入力は、ブロック60からの各スペクトル成分S(s)と、メモリ83から得られる前のフレームについての推定値Nn-1 (s) と、ブロック82で計算される変数λの値とである。変数λは、Vind ’(音声活性検出器の出力)の値とSTcount (暗騒音スペクトル推定値の更新の制御に関連する変数)の値とに依存し、その計算については後述する。変数λの値は、下記の表3のテーブル(λについての代表的な値)に従って決定される:
【表3】
Figure 0004163267
【0040】
後に、現在のフレームについて計算された雑音スペクトル推定値について、より短い記号N(s)が用いられる。上記の推定方法による計算はデジタル的に実行されるのが好ましい。上記の式に従って掛け算、足し算及び引き算をデジタル的に実行する方法は当業者にとっては従来公知のことである。
【0041】
計算ブロック90において、入力スペクトル及び雑音スペクトルから、比γ(s),s=0,..,7が成分毎に計算され、この比は後天的信号対雑音比と呼ばれる:
【数9】
Figure 0004163267
【0042】
【表4】
Figure 0004163267
計算ブロック90も好ましくはデジタル的に実現され、該ブロックは上記の割り算を実行する。割り算をデジタル的に実行すること自体は当業者にとっては従来公知のことである。この後天的信号対雑音比推定値γ(s)と、前のフレームの抑圧係数(ハ)、s=0,..,7とを利用して、抑圧係数を計算するために使用されるべき先天的(priori)信号対雑音比推定値(ニ)が第2計算ユニット140で各周波数帯域について計算される。この推定は、下記の式に従ってデジタル的に実行されるのが好ましい:
【数10】
Figure 0004163267
ここでnは上記したようにフレームの順序番号を表し、各副添え字(subindex)は、各推定値(先天的信号対雑音比、抑圧係数、後天的信号対雑音比)が計算されるフレームを指す。計算ブロック140のより詳しい構成が図9に示されている。パラメータμは定数で、その値は0.0〜1.0であり、これで現在及びその前のフレームに関する情報に重みが付けられ、このμの値は例えば前もってメモリ141に記憶され、このメモリからμがブロック145に読み込まれ、該ブロックは上記の式の計算を実行する。音声フレーム及び雑音フレームについて係数μに異なる値を与えることができ、正しい値は音声活性検出器の決定に従って選択される(通常、雑音フレームについては音声フレームについてよりも大きな値がμに与えられる)。ξ_min は、音声を全く含んでいないような入力信号の各シーケンスにおいて、信号対雑音比の急速な変動に起因する残留雑音を減少させるために使われる先天的信号対雑音比の最小値である。ξ_min は前もってメモリ146に記憶され、保持される。通常、ξ_min の値は0.35〜0.8である。前の式において、関数P( γn (s) −1) は下記の様に半波整流を実現するものである:
【数11】
Figure 0004163267
この計算は計算ブロック144で実行され、このブロックに、前の式に従って、ブロック90から得られた後天的信号対雑音比γ(s) が入力される。計算ブロック144からの出力として、関数P( γn (s) −1) の値がブロック145へ送られる。また、先天的信号対雑音比推定値(ニ)を計算するとき、前のフレームについての後天的信号対雑音比γn-1 (s) が使われ、前のフレームの対応する抑圧係数の2乗が乗算される。この値は、ブロック145において後天的信号対雑音比γ(s) の値と、同じフレームで計算された対応する抑圧係数の2乗との積をメモリ143に記憶させることにより、得られる。抑圧係数G(s)はブロック130(これは図8に詳しく示されている)から得られ、ここで始めに係数(ハ)が下記の式:
【数12】
Figure 0004163267
から計算される。ここで先天的信号対雑音比推定値(ヘ)の修正推定値(ホ)、s=0,..,7が使用され、この(ホ)の計算方法について後に図8を参照して説明する。この種の計算をデジタル的に実行する方法も当業者にとっては従来公知のことである。
【0043】
この修正推定値(ホ)を計算するときには、本発明に従って相対雑音レベル(relative noise level)を使用する。このことについて次に説明をする。
【0044】
本発明の方法では、雑音抑圧の調節は、相対雑音レベルη(その計算については後述する)に基づいて、現在のフレームから計算されるパラメータを追加的に使用して制御され、このパラメータは入力信号と雑音モデルとの間のスペクトル距離DSNR を表し、この距離の計算方法については後述する。このパラメータは、相対雑音レベルを表すパラメータを、そしてそれを通じて先天的信号対雑音比(ヘ)の値をスケーリング(scaling)するために使われる。スペクトル距離パラメータの値は、現在のフレームにおける音声の出現確率を表す。従って、フレームに暗騒音だけがきれいに含まれているほど、先天的信号対雑音比(ヘ)の値の増加量は少なくされ、これにより実際上より効果的な雑音抑圧を行えるようになる。フレームが音声を含んでいるときには抑圧量は少なくされるが、音声が周波数領域及び時間領域の両方で効果的に雑音をマスクする。抑圧量の調節のために使われるスペクトル距離パラメータの値は連続的な値を持っていて、信号のパワーの変化に即座に反応するので、不快に聞こえる抑圧量調節の中断は生じない。
【0045】
音声と比べて雑音が大きくなるほど、雑音抑圧により一層大きな歪みが音声に生じるというのが従来公知の雑音抑圧方法の特徴である。本発明では、操作が改善されていて、音声のパワー及び雑音のパワーから、滑らかに移行する平均値(ト)及び(チ)が巡回的に(recursively)計算される。それらに基づいて、相対雑音レベルを表すパラメータηが計算され、雑音抑圧G(s)がそれにより調整される。
【0046】
前記の平均値及びパラメータはブロック70で計算される。このブロックのより詳細な構成が図7に示されており、これについて次に説明する。抑圧量の調節は、相対雑音レベルηに基づいて先天的信号対雑音比(ヘ)の値を大きくすることにより実行される。これにより、顕著な歪みが音声に生じないように雑音抑圧量を相対雑音レベルηに従って調節することができる。
【0047】
音声の過渡的変化に対する良好な応答を確保するために、等式(11)の抑圧係数G(s)は音声の活性に対して速やかに反応しなければならない。残念なことに、音声の過渡的変化に対する抑圧係数の感度が高くなると、不安定な雑音に対する抑圧係数の感度も高くなり、残留雑音の響きは元の雑音より滑らかでなくなる。更に、等式(7)の暗騒音スペクトルN(s)の形及びレベルの推定は算術平均により巡回的に実行されるので、推定アルゴリズムは、急速に変化する雑音成分を模するのに充分な速さで順応することができなくて、その様な雑音成分の減衰の効率が悪くなる。実際、減衰させられた変化しない雑音によるその様な急速に変化する雑音成分のマスキング効果が低下しているために、強化後にはその様な成分がもっとはっきりと区別できるようになることがある。
【0048】
スペクトル成分の数を増やすことにより抑圧係数の計算のスペクトル分解能を高めたときにも、残留雑音の望ましくない変化が生じる。この様な滑らかさの低下は、周波数領域でのパワースペクトル成分の平均化が弱まった結果である。しかし、音声活性時の適切な減衰と、音声に生じる歪みの極小化とのために、充分な分解能が必要である。
【0049】
周波数範囲の分割が最適でない場合には、雑音が低周波数に高度に集中していると、抑圧作用において低周波数暗騒音に望ましくない変動が生じることがある。音声に低周波数の雑音が大量に含まれているために、音声を含むフレームにおいて同じ低周波数領域の雑音の減衰が弱まり、不快に聞こえる変調が残留雑音に対して音声のリズムでかけられる結果となる。
【0050】
上記した3つの問題を、最小利得探索により効率よく軽減することができる。この方式の原理は、各周波数成分において信号のパワーは雑音よりも音声においてゆっくりと且つ比較的に軽い不規則性をもって変化するという事実に導かれている。この方式により、暗騒音抑圧の結果が滑らかになり且つ安定し、音声音の劣化の程度が軽くなり、残留暗騒音がより滑らかになり、強化された音声の主観的な質が向上する。特に、音声及び雑音の双方がある時にこの方法により、あらゆる種類の急速に変化する不安定な暗騒音成分を効率よく減衰させることができる。更に、この方法は音声に如何なる歪みも生じさせず、余計な雑音を減らして音声をきれいに響かせる。更に、最小利得探索法(minimum gain search)によれば、残留雑音に余分の変動を生じさせることなく等式(11)での抑圧係数G(s)の計算における周波数成分の数を増やすようにすることができる。
【0051】
最小利得探索法では、現在のフレームと、現在のフレームが音声音を含んでいるか否かにより例えば1個又は2個の前のフレームとから、各周波数成分sでの等式(24)の抑圧係数G’(s)の最小値を探索する。最小利得探索方式は、下記の様に表現できるものである:
【数13】
Figure 0004163267
ここでG(s,n)は、最小利得探索後のフレームnでの周波数sでの抑圧係数を表し、Vind ’は音声活性検出器の出力を表す。その計算については後述する。
【0052】
抑圧係数G’(s)は、ブロック30(図3の)での複素FFT(complex FFT)の該抑圧係数との乗算の前に等式(12)に従って最小利得探索法により修正される。最小利得法(minimum gain)は、ブロック130で、又はブロック130と120との間に挿入される別のブロックで実行されることができる。
【0053】
その中から抑圧係数の最小値を探し出す前のフレームの個数は2より多くてもよい。更に、最小値を取る方法以外の、抑圧係数についての他の種類の非線形フィルタリング操作(例えば、中央値、最小値と中央値との何らかの組み合わせ、など)又は線形フィルタリング操作(例えば、平均)を本発明で用いることもできる。
【0054】
上記した方式の算術的複雑さは低い。雑音抑圧に抑圧係数の下限を導入することにより最大減衰量を限定しており、また抑圧係数は振幅領域に関連するものであって累乗変数(power variable)ではなく、従って程良いダイナミックレンジを保有するので、これらの係数を効率よく圧縮することができる。前の数個のフレームの抑圧係数を記憶させなければならないけれども、静的メモリの消費量は少ない。雑音抑圧結果を滑らかにする上記の方法のメモリ要件は、例えば以前の幾つかの方式で提案されている、同じ目的のために過去のフレームの高分解能パワースペクトルを利用する方法と比べて、有利である。
【0055】
【表5】
Figure 0004163267
図7に示されているブロックにおいて、パワースペクトル推定値S(s),s=0,..,7を用いて音声についての時間平均された平均値(リ)が計算される。時間平均された平均値(リ)は、音声活性検出器(voice activity detector)110(VAD)が音声を検出したときに、更新される。始めに現在のフレームの各成分(ヌ)についての平均値がブロック71で下記の様に計算され、これに入力として各スペクトル成分S(s)がブロック60から得られる:
【数14】
Figure 0004163267
【0056】
時間平均された平均値(リ)は、前のフレームの時に計算された時間平均された平均値が記憶されているメモリ78から得られる前のフレームについての時間平均された平均値(ル)と、ブロック71から得られる計算スペクトル平均値(ヌ)と、前もってメモリ79aに記憶されている時定数αとに基づいて、ブロック72において(例えば巡回的に)計算される:
【数15】
Figure 0004163267
ここでnはフレームの順序番号であり、αは前記の時定数であり、その値は0.0〜1.0であり、通常は0.9と1.0との間である。非常に弱い音声を時間平均された平均値に含めないために(例えば、文の終わりで)、この平均値は、現在のフレームについてのスペクトル成分の平均値が時間平均された平均値に依存する閾値を上回る場合に限って更新される。この閾値は通常は時間平均された平均値の四分の一である。前の2つの等式の計算はデジタル的に実行されるのが好ましい。
【0057】
同様に、雑音のパワーの時間平均された平均値(オ)は雑音N(s),s=0,..,7のパワースペクトル推定値を用いて計算ブロック73から得られ、成分平均値(ワ)はそれから次の等式に従って計算される:
【数16】
Figure 0004163267
【0058】
ここでβは時定数であって、その値は0.0〜1.0であり、通常は0.9と1.0との間である。雑音パワーの時間平均された平均値は各フレームで更新される。雑音スペクトル成分の平均値(ワ)は、スペクトル成分N(s)に基づいてブロック76で次のように計算される:
【数17】
Figure 0004163267
前のフレームについての雑音パワーの時間平均された平均値(カ)はメモリ74から得られるが、それは前のフレームの時に該メモリに記憶されたものである。
【0059】
相対雑音レベルηは、ブロック75において、雑音及び音声の時間平均された平均値のスケーリングされ且つ最大値限定された商として計算される:
【数18】
Figure 0004163267
ここでκはスケーリング定数(scaling constant)(代表的な値は4.0)であり、前もってメモリ77に記憶されており、max_ηは相対雑音レベルの最大値であり(通常は1.0)、メモリ79bに記憶されている。
【0060】
相対雑音レベルηについてのこのパラメータから、抑圧量調整に使われる最終補正項が、入力信号と雑音モデルとの間の距離を表すパラメータDSNR でそれをスケーリングすることによって得られ、このDSNR は、後天的信号対雑音比γ(s)を用いて音声活性検出器110で計算され、これはデジタル的計算により次の式を実現する:
【数19】
Figure 0004163267
ここでs_l及びs_hは、含まれている最低周波数成分及び最高周波数成分の指数の値であり、υS は成分についての重み付け係数であり、これらは前もって決められてメモリに記憶され、このメモリから計算のために読み出される。通常、全ての後天的信号対雑音推定値成分s_l=0及びs_h=7が使われ、等しい重みυS =1.0/8.0;s=0,..,7がそれらに付けられる。
【0061】
次に、図12を参照して音声活性検出器110の実施例について詳しく説明する。音声活性検出器の実施例は新しいものであって、本発明の雑音抑圧器に用いるのに特に適しているけれども、この音声活性検出器を、例えば断続的な接続を制御するため及び音響エコー消去のために音声検出を行う他の種類の雑音抑圧器に、或いは他の目的のために、用いることも可能である。音声活性検出器における音声の検出は、信号対雑音比に、又は図2及び図3から分かるようにブロック90で計算された種々の周波数帯域での後天的信号対雑音比に基づいている。この信号対雑音比は、フレームについてのパワースペクトル成分S(s)(ブロック60からの)を、暗騒音推定値の対応する成分N(s)(ブロック80からの)で割ることにより、計算される。音声活性検出器の中の総和器111は、種々の周波数帯域から得られる後天的信号対雑音比の値を合計し、これにより、入力信号と雑音モデルとの間のスペクトル距離を表すパラメータDSNR が上記の式(18)に従って得られ、この総和器からの値は比較器112において所定の閾値vthと比較される。もし閾値の方が小さければ、そのフレームは音声を含むと見なされる。この合計を計算するとき、信号対雑音比が良好であると期待することのできる周波数に、より大きな重みを付けるように、重み付けを行うこともできる。音声活性検出器の出力を変数Vind ’で表すことができるが、その値について下記の条件が得られる:
【数20】
Figure 0004163267
【0062】
音声活性検出器110は暗騒音スペクトル推定値N(s)の更新を制御し、この推定値は上記したように音声活性検出器の機能に影響を及ぼすので、もし暗騒音レベルが急に上昇すると暗騒音スペクトル推定値N(s)が低すぎるレベルにとどまる可能性がある。これを防止するために、その中では連続するフレームが音声を含んでいると考えられる時間(フレームの個数)が監視される。もしこの連続するフレームの個数が閾値max_spf(その値は例えば50である)を上回れば、変数STcount の値は1にセットされる。変数STcount は、Vind ’が値0となったときに0にリセットされる。
【0063】
しかし、連続するフレームのエネルギーの変化が信号が安定していないことをブロック80に示すならば、連続するフレームのためのカウンタ(この図には示されていないけれども図10にはブロック82として含まれており、ここに変数STcount の値も記憶される)の値は増やされない。定常度を表すパラメータSTind がブロック100で計算される。もしエネルギーの変化が充分に大きければ、該カウンタはリセットされる。これらのことの目的は、音声時に暗騒音スペクトル推定値が更新されないことを保証することである。また、当該フレームのパワースペクトル成分が暗騒音スペクトル推定値N(s)の対応する成分より小さいときには常に各周波数帯域で暗騒音スペクトル推定値N(s)が小さくされる。これにより、誤った更新がなされた後に暗騒音スペクトル推定値N(s)が確実に急速に正しいレベルに戻ることになる。
【0064】
定常度についての条件を、後記の式(27)で見ることができる。項目a)は信号が安定した状況に対応し、このときは連続する音声フレームのカウンタの値が増やされる。項目b)は非安定状態に対応し、このときは該カウンタはリセットされ、項目c)は該カウンタの値が変えられない状態に対応する。
【0065】
また、本発明では、相対雑音レベルη(これはブロック70で計算される)を利用して音声活性検出器の前記の閾値vthを調整することにより、音声活性検出器110及び暗騒音スペクトル推定値N(s)の精度が高められる。信号対雑音比が非常に良好である(即ち相対雑音レベルηが低い)様な環境では、閾値vthの値は相対雑音レベルηに基づいて高められる。これにより暗騒音の急速な変化を音声と解釈することが少なくなる。閾値の適応化は、次の式に従ってブロック113で実行される:
【数21】
Figure 0004163267
ここでvth_fix、vth_min、及びvth_slopeは定数であり、その代表的な値は、例えば、vth_fix=2.5、vth_min=2.0、vth_slope=−8.0である。
【0066】
【表6】
Figure 0004163267
音声活性検出器110でしばしば生じる問題は、スピーチ開始時にスピーチが直ぐには検出されず、談話の終わりも正しく検出されないということである。これが原因となって暗騒音スペクトル推定値N(s)が正しくない値となり、そのために音声活性検出器の後の結果に影響が及ぶことになる。遅延を用いて暗騒音推定値を更新することによりこの問題を解消することができる。この場合、暗騒音推定値N(s)を更新する前に最後の数個のフレームの一定の数N(例えばN=4)のパワースペクトルS1 (s),..,SN (s)が記憶される。もし最後の2倍の量のフレーム(即ち2N個のフレーム)の間に、音声活性検出器110が音声を検出しなければ、暗騒音推定値N(s)はメモリの中の最も古いパワースペクトルS1 (s)で更新され、その他の場合には更新は行われない。これにより、更新時に使われたフレームの前のN個のフレームと後のN個のフレームとが雑音であったことが保証される。この方法に伴う問題は、大量のメモリを、即ちN×8個の記憶場所を必要とすることである。始めに次のM個のパワースペクトル(ヨ)の平均値を計算して記憶場所Aに記憶させ、その後に次のM個(例えばM=4)のパワースペクトル(タ)の平均値を記憶場所Bに記憶させることにより、メモリの消費を更に最適化することができる。最後の3M個のフレームの間に音声活性検出器が雑音だけを検出したならば、暗騒音推定値は記憶場所Aに記憶されている値で更新される。その後に記憶場所Aはリセットされ、次のM個のフレームについてのパワースペクトル平均値(レ)が計算される。これが計算された後、最後の3M個のフレームの間に雑音だけがあったならば暗騒音スペクトル推定値N(s)は記憶場所Bの値で更新される。このプロセスがこの様にして続けて行われ、平均値を計算して記憶場所A及びBに交互に記憶させてゆく。このようにして、必要な記憶場所は2×8個だけになる(記憶場所A及びBは各々8個の値を包含する。)
【0067】
音声バースト後でも、音声活性検出器が雑音だけを検出してもN個のフレーム(例えばN=1)(このときは「ホールド時間」と呼ばれる)の間の音声を意味する決定を音声活性検出器から強制的に出させるようにして音声活性検出器110を強化することもできる。これにより、音声がゆっくりと静かになりつつあるときに音声の終わりが雑音と解されることがあり得るので、作用が向上する。
【0068】
前記ホールド時間を相対雑音レベルηに適応的に依存させることができる。その場合、暗騒音が強いとき、静かなときと比べてホールド時間はゆっくりと長くされる。このホールド作用を次のように実現することができる。即ち、ホールド時間nに値0,1,..,Nが与えられ、相対雑音レベルの閾値η0 ,η1 ,....,ηN-1 ;ηK <ηK+1 ,が計算され、その値はホールド時間に対応すると見なされ得るものである。実時間でホールド時間は相対雑音レベルの瞬時値を閾値と比較することにより選択される。例えば、次の通りである(N=1,η0 =0.01):
【数22】
Figure 0004163267
【0069】
このホールド時間を含むVAD決定はVind で表される。
【0070】
ホールド作用を、図12に示されているように音声活性検出器の出力側に置かれる遅延ブロック114を用いて好ましく実現することができる。特許US4,811,404は、暗騒音スペクトル推定値を更新する方法を開示しており、この方法では、暗騒音スペクトル推定値の前回の更新の時から一定の時間が経過すると自動的に新たに更新が行われる。本発明では暗騒音スペクトル推定値の更新は、一定の間隔では行わず、上記したように音声活性検出器の検出結果に応じて行う。暗騒音スペクトル推定値が計算された後、音声活性検出器が現在のフレームの前にも後にも音声を検出していないときに限って暗騒音スペクトル推定値の更新が行われる。この処理手順により、可能な限り正しい値を暗騒音スペクトル推定値に与えることができる。特にこの特徴と、前記の他の特徴(例えば、音声があるか無いかを判定する基礎となる閾値の値vthを、音声及び雑音の両方のレベルを考慮に入れた相対雑音レベルに基づいて調節するという特徴など)は、暗騒音スペクトル推定値の精度と音声活性検出器の動作との双方を本質的に向上させる。
【0071】
次に、抑圧係数G’(s)の計算方法を図8を参照して説明する。相対雑音レベルについてのパラメータηにスペクトル距離についてのパラメータDSNR を乗じ、その積をメモリ132に記憶されているスケーリング定数(scalingconstant)ρでスケーリングし、その積の最大値を制限することによって、抑圧係数の計算を制御するための補正項φがブロック131から得られる:
【数23】
Figure 0004163267
ここでρ=スケーリング定数(scaling constant)(代表的な値は8.0)、max_φは補正項の最大値(代表的な値は1.0)であり、これは前もってメモリ135に記憶されている。
【0072】
抑圧係数(ソ)(s=0,...,7)の計算の調整は次のようにして行われる。即ち、式(9)に従って計算ブロック140から得られる先天的信号対雑音比(ツ)の値を、先ずブロック131で計算された補正項φを使って、ブロック133での計算により次のように変換する:
【数24】
Figure 0004163267
そして抑圧係数(ソ)はブロック134で式(11)から更に計算される。
【0073】
信号が最早音声を含んでいないことを音声活性検出器110が検出すると、適当な時定数を用いて信号が更に抑圧される。音声活性検出器110は、音声表示出力Vind ’を出すことによって、信号が音声を含んでいるか否かを示し、この出力は例えば1ビットであり、その値は、もし音声がなければ0であり、信号が音声を含んでいるならば1である。追加の抑圧は、動き検出器(mobility detector)、すなわち安定度指示手段100で計算される信号安定度指示子STind に基づいて更に調整される。この方法により、音声活性検出器110が暗騒音と解釈する可能性のある静かな音声シーケンスを抑圧することが防止される。
【0074】
追加の抑圧は、抑圧係数G’(s)を計算する計算ブロック138で実行される。音声の開始時に、適当な時定数を用いて追加の抑圧が解除される。音声活性検出器110により、音声活性の終了後に、音声を含まない或る数(その数は予め決められた定数(ハングオーバー期間(hangover period) である)のフレームが検出されたときに、追加の抑圧が開始される。関係期間(ハングオーバー期間)に含まれるフレームの数は分かっているので、フレームの数を数えるカウンタCTを用いてその期間の終了を検出することができる。
【0075】
追加の抑圧を含む抑圧係数G’(s)は、前もってブロック134で計算された抑圧値(ソ)とブロック137で計算される追加の抑圧係数σとに基づいてブロック138で次の式に従って計算される:
【数25】
Figure 0004163267
ここでσは追加の抑圧係数であり、その値は、安定度指示子STind に基づいてブロック136で決定される差項δ(n)の値と、前のフレームの時に抑圧係数が格納されたメモリ139aから得られる前のフレームについての追加の抑圧係数σ(n−1)の値と、前もってメモリ139bに記憶されている抑圧係数の最小値min_σとを用いてブロック137で計算される。最初は追加の抑圧係数はσ=1(追加の抑圧は無し)であり、その値は、音声活性検出器110が音声を含まないフレームを検出したときに指示子Vind ’に基づいて次のように調整される:
【数26】
Figure 0004163267
ここでn=フレームの順序番号であり、n0 =追加の抑圧に先立つ期間に属する最後のフレームの順序番号の値である。追加の抑圧係数σの最小値は、最高の最終抑圧量を決定するmin_σにより限定される最小値である(代表的な値は0.5...1.0)。差項δ(n)の値は信号の安定度に依存する。安定度を決定するために、前のフレームと現在のフレームとの間で信号のパワースペクトル平均値(ネ)の変化を比較する。差項δ(n)の値はブロック136で次のように決定される:
【数27】
Figure 0004163267
ここで差項の値は、安定度指示子STind に基づいて決定される条件a)、b)及びc)に従ってこの様に決定される。条件a)、b)及びc)の比較はブロック100で実行され、出力として得られる安定度指示子STind は、ブロック136に対して、条件a)、b)及びc)のうちのどれが満たされるかを知らせ、ブロック100は次の比較を実行する:
【数28】
Figure 0004163267
【0076】
定数th_s及びth_nは1より大きい。代表的な値は、例えば、th_s=6.0/5.0で、th_n=2.0、又は例えばth_s=3.0/2.0で、th_n=8.0である。各差項δs、δn及びδmの値は、たとえ安定度指示子STind の値が非常に頻繁に変化しても連続するフレーム間での追加の抑圧量の差が騒がしく聞こえることのない様に、選択される。
【数29】
Figure 0004163267
【0077】
音声活性検出器110が音声を再び検出すると、追加の抑圧は、追加の抑圧係数σをブロック137で次の様に計算することにより除去される:
【数30】
Figure 0004163267
ここでn1 =雑音シーケンス後の第1フレームの順序番号であり、δγは正の定数で、その絶対値は、前もって例えばメモリ139bなどのメモリに記憶された、追加の抑圧(代表的な値は例えば(1.0-min_σ)/4.0)を調整する上記の差項の絶対値より一般に相当大きい。図8に示されている各ブロックの機能は好ましくはデジタル的に実現される。ブロック130で実行されるべき、各等式の計算動作をデジタル的に実行することは、当業者にとってよく知られている。
【0078】
抑圧値計算ブロック130から得られた8個の抑圧値G(s)は、処理される周波数範囲の外側の周波数(0−62.5Hz及び3500Hz−4000Hz)に対応する抑圧値が、隣接する処理される周波数帯域についての抑圧値に等しくセットされることとなるように、補間器120において補間されて65個のサンプルとされる。補間器120もデジタル的に実現されるのが好ましい。
【0079】
掛け算器30において、FFTブロック20により作られた対をなす実数成分Xr (f)及び虚数部分Xi (f)に補間器120から得られた抑圧値が乗算され、ここでFFTブロックからの8個の連続するサンプルX(f)に実際上常に同じ抑圧値G(s)が乗算され、前記の式(6)に従って各サンプルが掛け算器30の出力として得られる。
【0080】
ここで各サンプルY(f),f=0,..,64が得られ、これから実逆高速フーリエ変換がIFFTブロック40で計算され、ここでその出力として時間領域サンプルy(n),n=0,..,127が得られ、このサンプルでは雑音が抑圧されている。雑音が既に抑圧されている各サンプルy(n)は、FFTブロックに入力される各サンプルx(n)に対応する。
【0081】
それらのサンプルy(n)の中から80個のサンプルが選択ブロック160で選択されて送信されるべく出力される。それらのサンプルはy(n);n=8,..,87であり、それらに対応するx(n)の値には窓のストリップが乗算されていないので、それらを直接出力側に送ることができる。この場合、出力側に80個のサンプルが得られるが、それらのサンプルは、窓掛けブロック10に入力信号として読み込まれる各サンプルに対応するサンプルである。ここで説明した実施例では各サンプルは8番目のサンプルから出力側へ選択されるけれども、現在のフレームに対応する各サンプルは16番目のサンプルからはじめて始まるので(始めの16個は前のフレームからメモリに記憶されたサンプルである)、信号に8サンプルの遅延即ち1msの遅延が生じる。もし最初に、もっと多数の(例えば112個の)サンプルを読み出していれば(112+前のフレームの16サンプル=128)、0を信号に付け加える必要はなく、その結果として前記の112個のサンプルが直接出力側から得られることになる。しかし、今は一度に80個のサンプルを出力側から得たいので、2個の連続するフレームに対する計算の後に160個のサンプルが得られ、これは現在(例えばGSM移動電話などで)使用されている殆どの音声コーデックが利用しているサンプルに等しい。これにより、上記の1msを除いて、如何なる遅延も生じさせることなく雑音抑圧と音声符号化とを効果的に組み合わせることができる。比較のために、次の様に言うことができる、即ち、現在の技術水準では遅延は通常は窓(window)の長さの半分であり、従って本書に開示した例示的解決策による窓(window)を使用するときは(この窓の長さは96フレームである)、遅延は48サンプル即ち6msとなり、この遅延は本発明の解決策で達成される遅延の6倍の長さである。
【0082】
雑音抑圧のための本発明の方法と装置とは移動局又は移動通信システムに用いるのに特に適していて、特別のアーキテクチャ(TDMA、CDMA、デジタル/アナログ)に限定されるものではない。図13は本発明の移動局を示し、これに本発明の雑音抑圧方法が使用されている。マイクロホン1から到来する、送信されるべき音声信号は、A/D変換器2でサンプリングされ、本発明の雑音抑圧器3で雑音抑圧され、音声符号器4で音声符号化され、その後に、例えばチャネル符号化、インタリーブなどの従来公知の基本周波数信号処理がブロック5で実行される。この後、信号は無線周波数に変換され、送信器6により複式フィルターDPLX及びアンテナANTを通して送信される。受信された音声に対して受信部7の公知の動作が受信時に実行され、スピーカー8を通して再生される。
【0083】
本発明の方法及び装置の実施態様及び実施例をここに開示した。本発明は、ここに開示した実施例の細目に限定されるものではなく、本発明の特徴から逸脱せずに他の形でも本発明を実施し得ることは当業者には明かである。ここに開示した実施例は単なる例に過ぎないと見なされるべきであり、発明を限定するものと解されるべきではない。従って、本発明を実施し利用する可能性は、特許請求の範囲に規定された種々の請求項のみにより限定される。該請求項で規定される発明を実施するための、均等実施態様を含む種々の選択肢が本発明の範囲に含まれる。
【図面の簡単な説明】
【図1】音声信号中の雑音を抑圧するための本発明の装置の基本的機能に関するブロック図である。
【図2】本発明による雑音抑圧器(noise suppressor)の一層詳しいブロック図(その1)である。
【図3】本発明による雑音抑圧器の一層詳しいブロック図(その2)である。
【図4】窓掛けブロック(windowing block)の実施態様をブロック図の形で示す図である。
【図5】平方ブロック(squaring block)の実施態様を示す図である。
【図6】スペクトル再結合ブロック(spectral recombination block)の実施態様を示す図である。
【図7】相対雑音レベル(relative noise level)を計算するためのブロックの実施態様を示す図である。
【図8】抑圧係数(suppression coefficients)を計算するためのブロックの実施態様を示す図である。
【図9】信号対雑音比を計算するための構成を示す図である。
【図10】暗騒音モデル(background noise model)を計算するための構成を示す図である。
【図11】本発明による窓掛け(windowing)における連続する音声信号フレームを示す図である。
【図12】音声活性検出器(voice activity detector)の実施態様をブロック図の形で示す図である。
【図13】本発明による移動局をブロック図の形で示す図である。
【符号の説明】
1…マイクロホン
10…窓掛けブロック
20…FFTブロック
30…掛け算器
40…IFFTブロック
50…スペクトル形成ブロック
60…計算ブロック
130…計算ブロック
190…推定ブロック
200…計算ブロック
G(s)…抑圧係数

Claims (13)

  1. 音声信号中の雑音を抑圧するための雑音抑圧器であって、該抑圧器は、前記音声信号を、各々がパワースペクトル成分(P)を有し、かつ所定の帯域幅を有する周波数領域信号成分を表す多数のスペクトル成分(X)に分割するための手段(20,50)と、抑圧係数(G)を用いることによってスペクトル成分(X)中の雑音を抑圧するための抑圧手段(30)とをそなえ、前記雑音抑圧器は更に、隣り合うスペクトル成分(X)を、各々が前記所定の帯域幅より広い帯域幅を有する一群の合成信号(S)に再合成するための再合成手段(60)と、該合成信号(S)に含まれている前記の雑音に基づいて前記一群の合成信号(S)についての抑圧係数(G)を決定するための決定手段(190,130)とをそなえており、前記抑圧手段(30)は、前記抑圧係数(G)を用いて前記スペクトル成分(X)をスケーリングするように構成されていることを特徴とする雑音抑圧器。
  2. 前記音声信号をスペクトル成分(X)に分割するための手段(20,50)は高速フーリエ変換を行う処理手段(20)を含むことを特徴とする、請求項1に記載の雑音抑圧器。
  3. 前記雑音抑圧器は、前記音声信号をサンプリングして時間領域の各サンプルとするためのサンプリング手段(2)と、各サンプル同士を組み立ててフレームとするための窓掛け手段(10)と、前記フレームのスペクトル成分(X)を周波数領域で形成するための処理手段(20)とをそなえ、またスペクトル形成手段(50)は、前記スペクトル成分(X)から前記パワースペクトル成分(P)を形成するようにされており、前記再合成手段(60)は、前記スペクトル成分(X)を再合成させて一群の合成信号(S)とするようにされており、前記決定手段(190,130)は、少なくとも各合成信号に含まれる雑音に基づいて前記一群の合成信号(S)についての抑圧係数(G)を計算するための計算手段(130)をそなえており、ここに前記抑圧係数はSNR/1+SNR(ここで、SNRは先天的信号対雑音比推定値)に比例しており、かつ前記抑圧手段(30)は、雑音抑圧された周波数領域成分(Y)を形成するために、再合成されて一群の合成信号(S)とされている、前記パワースペクトル成分(P)に対応する前記スペクトル成分(X)に前記抑圧係数(G)を乗算するための掛け算器をそなえ、さらに前記雑音抑圧器は、前記の雑音抑圧された周波数領域成分(Y)を時間領域信号(y)に変換して、それを雑音抑圧された出力信号として出力するための手段をそなえることを特徴とする、請求項1に記載の雑音抑圧器。
  4. 前記決定手段(190,130)は、入力信号に含まれている時間平均された雑音パワー平均値(イ)及び時間平均された音声パワー平均値(ロ)を決定するための手段(70)と、少なくとも前記の雑音パワー及び音声パワー平均値(ハ)及び前記の入力信号と雑音モデルとの間のスペクトル距離に基づいて前記合成信号(S)についての抑圧係数(G)を計算するための計算手段(130)とを含むことを特徴とする、請求項3に記載の雑音抑圧器。
    Figure 0004163267
  5. 前記雑音抑圧器の出力信号は音声コーデックに供給されて音声符号化されるようになっており、前記出力信号のサンプルの量は音声フレーム中のサンプルの数の均等商である、請求項3に記載の雑音抑圧器。
  6. 前記スペクトル成分(X)を形成するための前記処理手段(20)は所定のスペクトル長を有し、前記窓掛け手段(10)は、各サンプルに所定の窓を乗算するための掛け算手段(11)と、フレームを形成するために、その乗算された各サンプルに付加サンプルを付加するためのサンプル作成手段(12)とをそなえており、該フレームの長さは前記スペクトル長に等しくされていることを特徴とする、請求項3に記載の雑音抑圧器。
  7. 前記音声信号中の音声と各ポーズとを検出して、該音声信号における音声の発生に応じて抑圧を調整するために、該抑圧係数を計算するための前記計算手段(130)に検出結果を与える音声活性検出器(110)をそなえることを特徴とする、請求項4に記載の雑音抑圧器。
  8. 前記計算手段(130)は、現在のフレーム及び前のフレームに基づく信号対雑音比の値と前のフレームに基づく抑圧係数の値だけ、現在のフレームについての抑圧係数(G)を更に修正するようにされていることを特徴とする、請求項4に記載の雑音抑圧器。
  9. 音声検出判定を行うために前記の検出器に入力された信号を所定の閾値と比較するための手段(112)と、前記の時間平均された音声パワー平均値(ニ)と前記の時間平均された雑音パワー平均値(ホ)との比(ヘ)が増加するとき前記閾値が増加又は同一のままとされ、前記の比(ヘ)が減少するとき前記閾値が減少又は同一のままとされるように、前記の音声パワー平均値(ニ)及び前記の雑音パワー平均値(ホ)に基づいて前記閾値を調整するための手段(113)とをそなえることを特徴とする、請求項7に記載の雑音抑圧器。
    Figure 0004163267
  10. 前記雑音のレベルを推定して前記レベルの値を記憶するための雑音推定手段(80)をそなえ、各々の分析された音声信号の時に、各々の検出された音声信号の前後の所定の時間内に該音声活性検出器(110)が音声を検出しなかった場合に限って雑音推定値が更新されることを特徴とする、請求項7に記載の雑音抑圧器。
  11. 連続するフレームのエネルギーの変化を調べることによって、音声信号源の安定度を示すための安定度指示手段(100)をそなえており、前記雑音推定手段(80)は、その安定度の示度が該音声信号源が安定であることを示しているときに、前のフレームの雑音推定値及び前記合成信号(S)に基づいて、現在のフレームの雑音推定値を更新するようにされていることを特徴とする、請求項10に記載の雑音抑圧器。
  12. 送信されるべき音声を音声信号に変換するためのマイクロホン(1)を有する音声送受信用の移動局であって、該音声信号中の雑音を抑圧するために該移動局は、前記音声信号を、各々がパワースペクトル成分(P)を有し、かつ所定の帯域幅を有する周波数領域信号成分を表す多数のスペクトル成分(X)に分割するための手段(20,50)と、抑圧係数(G)を用いることによってスペクトル成分(X)中の雑音を抑圧するための抑圧手段(30)とをそなえ、前記移動局は更に、隣り合うスペクトル成分(X)を、各々が前記所定の帯域幅より広い帯域幅を有する一群の合成信号(S)に再合成するための再合成手段(60)と、該合成信号(S)に含まれている前記の雑音に基づいて前記一群の合成信号(S)についての抑圧係数(G)を決定するための決定手段(190,130)とをそなえており、前記抑圧手段(30)は、前記抑圧係数(G)を用いて前記スペクトル成分(X)をスケーリングするように構成されていることを特徴とする移動局。
  13. 音声信号中の雑音を抑圧する雑音抑圧方法であって、前記音声信号を、各々がパワースペクトル成分(P)を有し、かつ所定の帯域幅を有する周波数領域信号成分を表す多数のスペクトル成分(X)に分割し、抑圧係数(G)を用いることによってスペクトル成分(X)中の雑音を抑圧するようになっており、雑音抑圧の前に、隣り合うスペクトル成分(X)を、各々が前記所定の帯域幅より広い帯域幅を有する一群の合成信号(S)に再合成し、該合成信号(S)に含まれている前記の雑音に基づいて前記一群の合成信号(S)についての抑圧係数(G)を決定し、該抑圧係数(G)を用いて前記スペクトル成分(X)をスケーリングすることを特徴とする方法。
JP33223796A 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法 Expired - Lifetime JP4163267B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI955947 1995-12-12
FI955947A FI100840B (fi) 1995-12-12 1995-12-12 Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin

Publications (2)

Publication Number Publication Date
JPH09204196A JPH09204196A (ja) 1997-08-05
JP4163267B2 true JP4163267B2 (ja) 2008-10-08

Family

ID=8544524

Family Applications (4)

Application Number Title Priority Date Filing Date
JP33223796A Expired - Lifetime JP4163267B2 (ja) 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Country Status (7)

Country Link
US (2) US5839101A (ja)
EP (2) EP0790599B1 (ja)
JP (4) JP4163267B2 (ja)
AU (2) AU1067897A (ja)
DE (2) DE69630580T2 (ja)
FI (1) FI100840B (ja)
WO (2) WO1997022116A2 (ja)

Families Citing this family (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6427134B1 (en) * 1996-07-03 2002-07-30 British Telecommunications Public Limited Company Voice activity detector for calculating spectral irregularity measure on the basis of spectral difference measurements
US6766176B1 (en) * 1996-07-23 2004-07-20 Qualcomm Incorporated Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
US6510408B1 (en) * 1997-07-01 2003-01-21 Patran Aps Method of noise reduction in speech signals and an apparatus for performing the method
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
CN1737903A (zh) * 1997-12-24 2006-02-22 三菱电机株式会社 声音译码方法以及声音译码装置
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
FI116505B (fi) 1998-03-23 2005-11-30 Nokia Corp Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6067646A (en) * 1998-04-17 2000-05-23 Ameritech Corporation Method and system for adaptive interleaving
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
JPH11344999A (ja) * 1998-06-03 1999-12-14 Nec Corp ノイズキャンセラ
JP2000047696A (ja) * 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
US6272460B1 (en) * 1998-09-10 2001-08-07 Sony Corporation Method for implementing a speech verification system for use in a noisy environment
US6188981B1 (en) * 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
FI118359B (fi) 1999-01-18 2007-10-15 Nokia Corp Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin
US6604071B1 (en) * 1999-02-09 2003-08-05 At&T Corp. Speech enhancement with gain limitations based on speech activity
US6327564B1 (en) * 1999-03-05 2001-12-04 Matsushita Electric Corporation Of America Speech detection using stochastic confidence measures on the frequency spectrum
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6349278B1 (en) 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
SE514875C2 (sv) 1999-09-07 2001-05-07 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
FI19992453A (fi) 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
WO2001039175A1 (fr) * 1999-11-24 2001-05-31 Fujitsu Limited Procede et appareil de detection vocale
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
JP4510977B2 (ja) * 2000-02-10 2010-07-28 三菱電機株式会社 音声符号化方法および音声復号化方法とその装置
US6885694B1 (en) 2000-02-29 2005-04-26 Telefonaktiebolaget Lm Ericsson (Publ) Correction of received signal and interference estimates
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
DE10026904A1 (de) * 2000-04-28 2002-01-03 Deutsche Telekom Ag Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal
JP4580508B2 (ja) * 2000-05-31 2010-11-17 株式会社東芝 信号処理装置及び通信装置
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
US6898566B1 (en) 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US7457750B2 (en) 2000-10-13 2008-11-25 At&T Corp. Systems and methods for dynamic re-configurable speech recognition
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US20020103636A1 (en) * 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US20030004720A1 (en) * 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
FI110564B (fi) * 2001-03-29 2003-02-14 Nokia Corp Järjestelmä automaattisen kohinanvaimennuksen (ANC) kytkemiseksi päälle ja poiskytkemiseksi matkapuhelimessa
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US20020147585A1 (en) * 2001-04-06 2002-10-10 Poulsen Steven P. Voice activity detection
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
US6978010B1 (en) * 2002-03-21 2005-12-20 Bellsouth Intellectual Property Corp. Ambient noise cancellation for voice communication device
JP3946074B2 (ja) * 2002-04-05 2007-07-18 日本電信電話株式会社 音声処理装置
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
DE10234130B3 (de) * 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
US7146315B2 (en) * 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
DE10251113A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren zum Betrieb eines Spracherkennungssystems
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
KR100506224B1 (ko) * 2003-05-07 2005-08-05 삼성전자주식회사 이동 통신 단말기에서 노이즈 제어장치 및 방법
US20040234067A1 (en) * 2003-05-19 2004-11-25 Acoustic Technologies, Inc. Distributed VAD control system for telephone
JP2004356894A (ja) * 2003-05-28 2004-12-16 Mitsubishi Electric Corp 音質調整装置
US6873279B2 (en) * 2003-06-18 2005-03-29 Mindspeed Technologies, Inc. Adaptive decision slicer
GB0317158D0 (en) * 2003-07-23 2003-08-27 Mitel Networks Corp A method to reduce acoustic coupling in audio conferencing systems
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
KR101058003B1 (ko) * 2004-02-11 2011-08-19 삼성전자주식회사 소음 적응형 이동통신 단말장치 및 이 장치를 이용한통화음 합성방법
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
FR2875633A1 (fr) * 2004-09-17 2006-03-24 France Telecom Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
CN1763844B (zh) * 2004-10-18 2010-05-05 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别系统
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
EP1845520A4 (en) * 2005-02-02 2011-08-10 Fujitsu Ltd SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE
FR2882458A1 (fr) * 2005-02-18 2006-08-25 France Telecom Procede de mesure de la gene due au bruit dans un signal audio
WO2006104555A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive noise state update for a voice activity detector
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
JP4395772B2 (ja) * 2005-06-17 2010-01-13 日本電気株式会社 ノイズ除去方法及び装置
WO2007017993A1 (ja) 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
EP1982324B1 (en) 2006-02-10 2014-09-24 Telefonaktiebolaget LM Ericsson (publ) A voice detector and a method for suppressing sub-bands in a voice detector
US8032370B2 (en) 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US7680657B2 (en) * 2006-08-15 2010-03-16 Microsoft Corporation Auto segmentation based partitioning and clustering approach to robust endpointing
JP4890195B2 (ja) * 2006-10-24 2012-03-07 日本電信電話株式会社 ディジタル信号分波装置及びディジタル信号合波装置
EP2103175A1 (en) * 2006-12-20 2009-09-23 Phonak AG Wireless communication system
US8069039B2 (en) * 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
JP4840149B2 (ja) * 2007-01-12 2011-12-21 ヤマハ株式会社 発音期間を特定する音信号処理装置およびプログラム
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
JP5229216B2 (ja) * 2007-02-28 2013-07-03 日本電気株式会社 音声認識装置、音声認識方法及び音声認識プログラム
KR101009854B1 (ko) * 2007-03-22 2011-01-19 고려대학교 산학협력단 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
WO2008137870A1 (en) 2007-05-04 2008-11-13 Personics Holdings Inc. Method and device for acoustic management control of multiple microphones
US9191740B2 (en) * 2007-05-04 2015-11-17 Personics Holdings, Llc Method and apparatus for in-ear canal sound suppression
US8526645B2 (en) 2007-05-04 2013-09-03 Personics Holdings Inc. Method and device for in ear canal echo suppression
US11856375B2 (en) 2007-05-04 2023-12-26 Staton Techiya Llc Method and device for in-ear echo suppression
US11683643B2 (en) 2007-05-04 2023-06-20 Staton Techiya Llc Method and device for in ear canal echo suppression
US10194032B2 (en) 2007-05-04 2019-01-29 Staton Techiya, Llc Method and apparatus for in-ear canal sound suppression
JP4580409B2 (ja) * 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8374851B2 (en) * 2007-07-30 2013-02-12 Texas Instruments Incorporated Voice activity detector and method
JP5483000B2 (ja) * 2007-09-19 2014-05-07 日本電気株式会社 雑音抑圧装置、その方法及びプログラム
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
KR101437830B1 (ko) * 2007-11-13 2014-11-03 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8180634B2 (en) 2008-02-21 2012-05-15 QNX Software Systems, Limited System that detects and identifies periodic interference
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8589152B2 (en) * 2008-05-28 2013-11-19 Nec Corporation Device, method and program for voice detection and recording medium
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
JP5103364B2 (ja) 2008-11-17 2012-12-19 日東電工株式会社 熱伝導性シートの製造方法
JP2010122617A (ja) * 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
GB2473266A (en) * 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
US8571231B2 (en) 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
EP2816560A1 (en) 2009-10-19 2014-12-24 Telefonaktiebolaget L M Ericsson (PUBL) Method and background estimator for voice activity detection
EP2491549A4 (en) 2009-10-19 2013-10-30 Ericsson Telefon Ab L M DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
WO2011077924A1 (ja) * 2009-12-24 2011-06-30 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
JP5424936B2 (ja) * 2010-02-24 2014-02-26 パナソニック株式会社 通信端末及び通信方法
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP5870476B2 (ja) * 2010-08-04 2016-03-01 富士通株式会社 雑音推定装置、雑音推定方法および雑音推定プログラム
SI3493205T1 (sl) 2010-12-24 2021-03-31 Huawei Technologies Co., Ltd. Postopek in naprava za adaptivno zaznavanje glasovne aktivnosti v vstopnem avdio signalu
ES2665944T3 (es) * 2010-12-24 2018-04-30 Huawei Technologies Co., Ltd. Aparato para realizar una detección de actividad de voz
US20140006019A1 (en) * 2011-03-18 2014-01-02 Nokia Corporation Apparatus for audio signal processing
US20120265526A1 (en) * 2011-04-13 2012-10-18 Continental Automotive Systems, Inc. Apparatus and method for voice activity detection
JP2013148724A (ja) * 2012-01-19 2013-08-01 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US9280984B2 (en) * 2012-05-14 2016-03-08 Htc Corporation Noise cancellation method
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN103730110B (zh) * 2012-10-10 2017-03-01 北京百度网讯科技有限公司 一种检测语音端点的方法和装置
CN112992188B (zh) * 2012-12-25 2024-06-18 中兴通讯股份有限公司 一种激活音检测vad判决中信噪比门限的调整方法及装置
US9210507B2 (en) * 2013-01-29 2015-12-08 2236008 Ontartio Inc. Microphone hiss mitigation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6339896B2 (ja) * 2013-12-27 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
US9978394B1 (en) * 2014-03-11 2018-05-22 QoSound, Inc. Noise suppressor
CN107086043B (zh) * 2014-03-12 2020-09-08 华为技术有限公司 检测音频信号的方法和装置
RU2713852C2 (ru) 2014-07-29 2020-02-07 Телефонактиеболагет Лм Эрикссон (Пабл) Оценивание фонового шума в аудиосигналах
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
US9450788B1 (en) 2015-05-07 2016-09-20 Macom Technology Solutions Holdings, Inc. Equalizer for high speed serial data links and method of initialization
JP6447357B2 (ja) * 2015-05-18 2019-01-09 株式会社Jvcケンウッド オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US9691413B2 (en) * 2015-10-06 2017-06-27 Microsoft Technology Licensing, Llc Identifying sound from a source of interest based on multiple audio feeds
EP3430821B1 (en) 2016-03-17 2022-02-09 Sonova AG Hearing assistance system in a multi-talker acoustic network
WO2018152034A1 (en) * 2017-02-14 2018-08-23 Knowles Electronics, Llc Voice activity detector and methods therefor
US10224053B2 (en) * 2017-03-24 2019-03-05 Hyundai Motor Company Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
US10339962B2 (en) 2017-04-11 2019-07-02 Texas Instruments Incorporated Methods and apparatus for low cost voice activity detector
US10332545B2 (en) * 2017-11-28 2019-06-25 Nuance Communications, Inc. System and method for temporal and power based zone detection in speaker dependent microphone environments
US10911052B2 (en) 2018-05-23 2021-02-02 Macom Technology Solutions Holdings, Inc. Multi-level signal clock and data recovery
CN109273021B (zh) * 2018-08-09 2021-11-30 厦门亿联网络技术股份有限公司 一种基于rnn的实时会议降噪方法及装置
US11005573B2 (en) 2018-11-20 2021-05-11 Macom Technology Solutions Holdings, Inc. Optic signal receiver with dynamic control
EP4088394A4 (en) 2020-01-10 2024-02-07 MACOM Technology Solutions Holdings, Inc. OPTIMAL EQUALIZATION PARTITIONING
US11575437B2 (en) 2020-01-10 2023-02-07 Macom Technology Solutions Holdings, Inc. Optimal equalization partitioning
CN111508514A (zh) * 2020-04-10 2020-08-07 江苏科技大学 基于补偿相位谱的单通道语音增强算法
US12013423B2 (en) 2020-09-30 2024-06-18 Macom Technology Solutions Holdings, Inc. TIA bandwidth testing system and method
US11658630B2 (en) 2020-12-04 2023-05-23 Macom Technology Solutions Holdings, Inc. Single servo loop controlling an automatic gain control and current sourcing mechanism
US11616529B2 (en) 2021-02-12 2023-03-28 Macom Technology Solutions Holdings, Inc. Adaptive cable equalizer
CN113707167A (zh) * 2021-08-31 2021-11-26 北京地平线信息技术有限公司 残留回声抑制模型的训练方法和训练装置

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4071826A (en) * 1961-04-27 1978-01-31 The United States Of America As Represented By The Secretary Of The Navy Clipped speech channel coded communication system
JPS56104399A (en) * 1980-01-23 1981-08-20 Hitachi Ltd Voice interval detection system
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
DE3230391A1 (de) * 1982-08-14 1984-02-16 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur signalverbesserung von gestoerten sprachsignalen
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
JPS6023899A (ja) * 1983-07-19 1985-02-06 株式会社リコー 音声認識装置における音声切り出し方式
JPS61177499A (ja) * 1985-02-01 1986-08-09 株式会社リコー 音声区間検出方式
US4630304A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
GB8801014D0 (en) 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5276765A (en) 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
US5285165A (en) * 1988-05-26 1994-02-08 Renfors Markku K Noise elimination method
FI80173C (fi) 1988-05-26 1990-04-10 Nokia Mobile Phones Ltd Foerfarande foer daempning av stoerningar.
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JP2701431B2 (ja) * 1989-03-06 1998-01-21 株式会社デンソー 音声認識装置
JPH0754434B2 (ja) * 1989-05-08 1995-06-07 松下電器産業株式会社 音声認識装置
JPH02296297A (ja) * 1989-05-10 1990-12-06 Nec Corp 音声認識装置
DE69132749T2 (de) * 1990-05-28 2002-07-04 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur Sprachsignalverarbeitung für die Bestimmung eines Sprachsignals in einem verrauschten Sprachsignal
JP2658649B2 (ja) * 1991-07-24 1997-09-30 日本電気株式会社 車載用音声ダイヤラ
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
JP3176474B2 (ja) * 1992-06-03 2001-06-18 沖電気工業株式会社 適応ノイズキャンセラ装置
DE69331719T2 (de) * 1992-06-19 2002-10-24 Agfa-Gevaert, Mortsel Verfahren und Vorrichtung zur Geräuschunterdrückung
JPH0635498A (ja) * 1992-07-16 1994-02-10 Clarion Co Ltd 音声認識装置及び方法
FI100154B (fi) * 1992-09-17 1997-09-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä kohinan vaimentamiseksi
JPH08506427A (ja) * 1993-02-12 1996-07-09 ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 雑音減少
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5446757A (en) * 1993-06-14 1995-08-29 Chang; Chen-Yi Code-division-multiple-access-system based on M-ary pulse-position modulated direct-sequence
EP0707763B1 (en) * 1993-07-07 2001-08-29 Picturetel Corporation Reduction of background noise for speech enhancement
US5406622A (en) * 1993-09-02 1995-04-11 At&T Corp. Outbound noise cancellation for telephonic handset
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
WO1995015550A1 (en) * 1993-11-30 1995-06-08 At & T Corp. Transmitted noise reduction in communications systems
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
WO1995016259A1 (en) * 1993-12-06 1995-06-15 Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5550893A (en) * 1995-01-31 1996-08-27 Nokia Mobile Phones Limited Speech compensation in dual-mode telephone
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech

Also Published As

Publication number Publication date
US5839101A (en) 1998-11-17
JPH09212195A (ja) 1997-08-15
WO1997022117A1 (en) 1997-06-19
DE69614989D1 (de) 2001-10-11
EP0790599A1 (en) 1997-08-20
DE69630580D1 (de) 2003-12-11
WO1997022116A2 (en) 1997-06-19
DE69630580T2 (de) 2004-09-16
US5963901A (en) 1999-10-05
AU1067897A (en) 1997-07-03
JP2007179073A (ja) 2007-07-12
EP0784311B1 (en) 2001-09-05
JP2008293038A (ja) 2008-12-04
AU1067797A (en) 1997-07-03
FI955947A0 (fi) 1995-12-12
JP5006279B2 (ja) 2012-08-22
JPH09204196A (ja) 1997-08-05
EP0784311A1 (en) 1997-07-16
WO1997022116A3 (en) 1997-07-31
FI100840B (fi) 1998-02-27
FI955947A (fi) 1997-06-13
DE69614989T2 (de) 2002-04-11
EP0790599B1 (en) 2003-11-05

Similar Documents

Publication Publication Date Title
JP4163267B2 (ja) 雑音抑圧器及び移動局並びに雑音抑圧方法
JP3574123B2 (ja) 雑音抑圧装置
US7957965B2 (en) Communication system noise cancellation power signal calculation techniques
JP3568922B2 (ja) エコー処理装置
EP2008379B1 (en) Adjustable noise suppression system
KR100860805B1 (ko) 음성 강화 시스템
US6122384A (en) Noise suppression system and method
US6839666B2 (en) Spectrally interdependent gain adjustment techniques
US6766292B1 (en) Relative noise ratio weighting techniques for adaptive noise cancellation
JP4423300B2 (ja) 雑音抑圧装置
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
WO2010046954A1 (ja) 雑音抑圧装置および音声復号化装置
WO2001073751A9 (en) Speech presence measurement detection techniques
US9172791B1 (en) Noise estimation algorithm for non-stationary environments
JP4173525B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP4098271B2 (ja) 雑音抑圧装置
EP1010169B1 (en) Channel gain modification system and method for noise reduction in voice communication
JP2003517761A (ja) 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070109

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term