JPH09212195A - 音声活性検出装置及び移動局並びに音声活性検出方法 - Google Patents

音声活性検出装置及び移動局並びに音声活性検出方法

Info

Publication number
JPH09212195A
JPH09212195A JP8331874A JP33187496A JPH09212195A JP H09212195 A JPH09212195 A JP H09212195A JP 8331874 A JP8331874 A JP 8331874A JP 33187496 A JP33187496 A JP 33187496A JP H09212195 A JPH09212195 A JP H09212195A
Authority
JP
Japan
Prior art keywords
signal
voice activity
sub
noise
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8331874A
Other languages
English (en)
Inventor
Antti Vaehaetalo
ベヘタロ アンチ
Juha Haekkinen
ヘッキネン ユハ
Erkki Paajanen
パーヤネン エルッキ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JPH09212195A publication Critical patent/JPH09212195A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)

Abstract

(57)【要約】 【課題】 本発明は音声活性検出装置に関し、この装置
では入力音声信号(x(n))は特定の周波数帯域を表すサ
ブ信号(S(s))に分割され、該サブ信号中の雑音(N
(s))が推定される。 【解決手段】 該サブ信号中の推定された雑音に基づい
て副判定信号(SNR(s))が生成され、該副判定信号に基
づいて該入力音声信号についての音声活性判定
(Vind )が形成される。入力音声信号のスペクトル成
分及び雑音推定値が計算され、比較される。より具体的
には、各サブ信号について信号対雑音比が計算され、そ
の各信号対雑音比は副判定信号(SNR(s))を表す。その
信号対雑音比から、それらの合計に比例する値が計算さ
れて閾値と比較され、入力音声信号についての音声活性
判定信号(Vind )がその比較に基づいて形成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は入力信号中の音声活
性を検出し、その検出結果に基づいて音声活性判定を行
うための手段をそなえる音声活性検出装置に関する。本
発明は、音声活性を検出する方法と、音声活性検出手段
を含む通信装置とにも関する。
【0002】
【従来の技術】音声活性検出器(Voice Activity Detec
tor (VAD))は、入力が音声又は暗騒音を含むか否か判定
する。VADの典型的なアプリケーションは無線通信シ
ステムにあり、無線通信システムでは、音声が検出され
ないときには送信が禁止される不連続送信システムを制
御するために音声活性検出方法を利用することができ
る。例えばエコー消去及び雑音消去のためにもVADを
使用することができる。
【0003】
【発明が解決しようとする課題】音声活性検出のための
種々の方法が従来公知である。主な問題は、騒々しい環
境で暗騒音から音声を確実に検出することである。特許
公報US5、459、814は、音声信号について平均
信号レベルとゼロ点交差とを計算する音声活性検出方法
を開示している。この手法は、計算に関しては単純な方
法であるけれども、検出結果の信頼性が余り良くはない
という問題点を有する。特許公報WO95/08170
及びUS5、276、765は、音声信号と雑音推定値
とのスペクトル差をLPC(Liner Prediction Coding
(線形予測符号化))パラメータを用いて計算する音声
活性検出方法を開示している。これらの公報は雑音推定
値の更新を制御する補助VAD検出器を提示している。
上記の全ての公報に示されるVAD方法は、音声のパワ
ーが雑音のパワーと比べて小さいときに確実に音声を検
出しなければならないという問題がある。
【0004】
【課題を解決するための手段】本発明は、入力音声信号
を、特定の周波数帯域を表すサブ信号に分割し、該サブ
信号において音声活性を検出する音声活性検出装置に関
する。該サブ信号の検出に基づいて、副判定信号が生成
され、入力音声信号についての音声活性判定が該副判定
信号に基づいて形成される。本発明では、入力音声信号
の各スペクトル成分と雑音推定値とが計算されて比較さ
れる。より具体的に言えば、信号対雑音比が各サブ信号
について計算され、各信号対雑音比が副判定信号を表
す。その信号対雑音比から、それらの合計に比例する値
が計算されて閾値と比較され、入力音声信号についての
音声活性判定信号がその比較に基づいて形成される。
【0005】各サブ信号について信号対雑音比を得るた
めに、各サブ周波数帯域について(即ち各サブ信号につ
いて)雑音推定値が計算される。このことは、雑音をよ
り精密に推定でき、その雑音推定値を各サブ周波数帯域
について別々に更新することもできることを意味する。
雑音推定値の精度が向上することによって音声活性検出
の判定がより精密かつ信頼性のあるものとなる。音声活
性検出装置の音声/雑音・判定を用いて暗騒音推定値の
更新を制御することにより、雑音推定値の精度も向上す
る。
【0006】本発明の音声活性検出装置及び通信装置
は、前記入力信号を特定の周波数帯域を表すサブ信号に
分割するための手段と、該サブ信号中の雑音を推定する
ための手段と、該サブ信号中の雑音に基づいて副判定信
号を計算するための手段と、該副判定信号に基づいて該
入力信号について音声活性判定を行うための手段とを有
することを特徴とする。
【0007】本発明の方法は、前記入力信号を特定の周
波数帯域を表すサブ信号に分割し、該サブ信号中の雑音
を推定し、該サブ信号中の雑音に基づいて副判定信号を
計算し、該副判定信号に基づいて該入力信号について音
声活性判定を行う各ステップを有することを特徴とす
る。
【0008】次に、添付図面を参照して本発明を詳しく
説明する。
【0009】
【発明の実施の形態】図1は、本発明の音声活性検出
(Voice activity detection(VAD))装置4の使用
状況を簡単に示す。以下の記述において提示されるパラ
メータの値は、例示の値であって本発明の1実施例を記
載するものであり、それらの値は本発明の方法の機能を
特定のパラメータの値のみに限定するものではない。図
1を参照すると、マイクロホン1から到来する信号はA
/D変換器2でサンプリングされる。例示的な値とし
て、A/D変換器2のサンプリング速度は8000H
z、音声コーデック3のフレーム長は80サンプル、各
音声フレームは10msの音声から成るものとする。該
VAD装置4は音声コーデック3と同じ入力フレーム長
を用いることができ、或いはその長さは音声コーデック
が用いるフレーム長の均等商(even quotient)であるこ
とができる。符号化された音声信号は、更に送信部にお
いて例えば不連続送信ハンドラー5に供給され、これ
は、該VAD4から受け取った判定Vindに従って送
信を制御する。
【0010】本発明の音声活性検出装置の1実施例が図
2により詳しく示されている。マイクロホン1から来る
音声信号はA/D変換器2でサンプリングされてデジタ
ル信号 x(n) となる。図2のVAD装置への入力フレー
ムは、デジタル信号 x(n) から各サンプルを取り出すこ
とにより形成される。このフレームはブロック6に供給
され、ここで所定の帯域のパワーを表すパワースペクト
ル成分が計算される。FFT、フィルター群を使って、
又は線形予測係数を使って、入力フレームの振幅又はパ
ワースペクトルに比例する各成分を計算することができ
る。このことについて後に詳しく説明する。該VADが
線形予測係数を計算する音声コーデックと共に作動する
場合には、それらの係数をその音声コーデックから受け
取ることができる。
【0011】各パワースペクトル成分 P(f) は、始めに
図3に示されているように高速フーリエ変換(FFT)
を用いて入力フレームから計算される。実施例では、F
FT計算の長さが128であることが仮定されている。
また、パワースペクトル成分P(f) は再結合されて計算
スペクトル成分 S(s) とされ、スペクトル成分の数が6
5から8まで減少する。
【0012】図3を参照すると、音声フレームは窓掛け
ブロック10に入力され、ここで音声フレームに所定の
窓が乗算される。窓掛けの目的は、一般に信号のスペク
トル推定の質を高め、信号を時間領域の各フレームに分
割することである。この実施例で使われる窓掛けでは、
窓同士が部分的に重複するので、重複する各サンプルが
次のフレームのためにメモリ(ブロック15)に記憶さ
れる。信号から80個のサンプルが取られ、それらのサ
ンプルは、前のフレームの際に記憶された16個のサン
プルと組み合わされて、合計で96個のサンプルとな
る。また、最後に収集された80個のサンプルの中か
ら、その中の最後の16個のサンプルが次のフレームを
計算するときに使われるべく記憶される。
【0013】この様にして与えられた96個のサンプル
に、窓掛けブロック10において96個のサンプル値か
ら成る窓が乗算される。図7に示されているように、窓
の始めの8個の値は窓の立ち上がり部 IU を形成し、終
わりの8個の値は窓の立ち下がり部 ID を形成する。窓
I(n) を次のように定義することができ、そしてブロッ
ク11(図6)において実施される:
【数1】
【0014】窓掛け(ブロック11)をデジタル的に実
施することはデジタル信号処理として当業者には従来か
ら知られていることである。この窓掛けでは、中央の8
0個の値(n = 8,..,87 即ち中央の部分 IM )は1に等
しいので、それらを乗算しても結果は変わらないから乗
算を省略することができる。従って窓の始めの8個のサ
ンプルと終わりの8個のサンプルとを乗算するだけでよ
い。FFTの長さは2の累乗でなければならないので、
ブロック12(図6)においてブロック11から得られ
た96個のサンプルの終わりに32個の「0」が付加さ
れ、128個のサンプルから成る音声フレームとなる。
サンプル列の終わりにサンプルを付加することは単純な
操作であって、ブロック12をデジタル的に実現するこ
とは当業者の技術の範囲内のことである。
【0015】窓掛け用ブロック10で窓掛けが実行され
た後、ブロック20で高速フーリエ変換FFTを用いて
音声フレームのスペクトルが計算される。FFTブロッ
ク20に到達したフレームの中のサンプル x(0), x
(1),.., x(n); n = 127 (即ち前記の128個のサンプ
ル)は実(real) FFT(高速フーリエ変換)により周
波数領域へ変換されて周波数領域サンプル X(0), X
(1),.., X(f); f = 64(より一般的には f=(n+1)/2)と
なり、その各サンプルは実数成分 Xr(f) と虚数成分 X
i(f) とから成る:
【数2】
【0016】高速フーリエ変換をデジタル的に実現する
ことは当業者にとっては従来公知のことである。FFT
から得られた実数成分及び虚数成分は平方ブロック(sq
uaring block) 50において二乗されて対をなして加え
合わされ、その出力は音声フレームのパワースペクトル
である。FFTの長さが128であるならば、得られる
パワースペクトル成分の数は65であり、これはFFT
変換の長さを2で割り、その結果を1だけ大きくする
(インクリメントする)ことにより得られる、即ち(F
FTの長さ/2)+1である。従って、パワースペクト
ルは、実数成分及び虚数成分の2乗の和を成分毎に計算
することにより平方ブロック50から得られる:
【数3】
【0017】平方ブロック50の機能は、図8に示され
ているように、実数成分及び虚数成分を平方ブロック
(squaring blocks)51及び52(これらは、デジタル
的に実行されるものとして従来公知の単純な数学的平方
の計算を実行する)に入力し、その平方された各成分を
総和ユニット(summing unit) 53で合計することによ
り実現されることができる。この様にして、平方ブロッ
ク50の出力として、パワースペクトル成分 P(0), P
(1),.., P(f); f = 64が得られ、これらのパワースペク
トル成分は、次に述べるように時間領域信号の種々の周
波数での成分の各パワーに対応する(8kHzのサンプ
リング速度が使用されるものとする): f = 0,...,64の値についての P(f) は中間周波数(f ・4000/64 Hz) に対応す る。 (4)
【0018】この後、ブロック60で8個の新しいパワ
ースペクトル成分、即ちパワースペクトル成分結合 S
(s), s = 0,..,7 が形成され、それらは本明細書では計
算スペクトル成分と呼ばれる。計算スペクトル成分 S
(s) は、次のように常に各計算スペクトル成分 S(s) に
ついて隣り合う7個のパワースペクトル成分 P(f) の合
計を計算することにより形成される:
【数4】
【0019】図9に示されているように、カウンタ61
と総和ユニット62とを使って、カウンタ61に常に7
まで数え上げさせ、カウンタに制御させて総和ユニット
62に常に7個の連続する成分の合計を計算させて出力
として総和(sum)を出させることにより、これを実現す
ることができる。この場合、最低位の結合成分 S(0)は
中間周波数 [62.5 Hz 〜 437.5 Hz]に対応し、最高位の
結合成分 S(7) は中間周波数 [3125 Hz 〜 3500 Hz] に
対応する。これより低い周波数(62.5 Hz より下)や、
これより高い周波数(3500 Hz より上)は、音声につい
ては重要でなくて、無視することができる。
【0020】図3の手法を使う代わりに、図4に示され
ている様にフィルタ列を用いて入力フレームからパワー
スペクトル成分 P(f) を計算することもできる。このフ
ィルタ列は、問題の周波数帯域をカバーする帯域フィル
タ Hj (z), j = 0,...,7から成る。該フィルタ列は、均
一な帯域幅フィルタであってもよいが、可変帯域幅フィ
ルタからなっていてもよい。効率を改善するために、通
常は該フィルタ列の出力は複数のうちから1個選択され
る(decimated)。フィルタ列のデザイン及びデジタル実
施形態は当業者には従来公知の事項である。各帯域 jの
副帯域(sub−band) サンプル zj (i) は、フィルタ Hj
(z) を用いて入力信号 x(n) から計算される。各帯域の
信号パワーを次のように計算することができる:
【数5】 ここで Lは1入力フレーム内の副帯域中のサンプルの個
数である。
【0021】VADを音声コーデックと共に用いるとき
には、デジタル移動電話システムで使われる殆どの音声
コーデックにより計算される線形予測係数(Linear Pre
diction Coefficients (LPC)) を使って計算スペクトル
成分 S(s) を計算することができる。その様な構成が図
5に示されている。LPC係数は線形予測(linear pre
diction)と呼ばれる手法により音声コーデック3で計算
され、そこに線形フィルターが形成される。該フィルタ
ーのLPC係数は直接順序係数 d(i) (directorder co
efficients)であり、これを自己相関係数(autocorrela
tion coefficients) ACF(k)から計算することが
できる。後述するように、直接順序係数d(i) を使って
計算スペクトル成分 S(s) を計算することができる。入
力フレームサンプル x(n) から計算することのできる自
己相関係数ACF(k)を使ってLPC係数を計算する
ことができる。もしLPC係数又はACF(k)係数を
音声コーデックから得ることができないならば、それら
を入力フレームから計算することができる。
【0022】自己相関係数ACF(k)は音声コーデッ
ク3で次のように計算される:
【数6】 ここで、N は入力フレーム中のサンプルの個数、M はL
PC次数(order)(例えば8)、x(i)は入力フレーム中
のサンプルである。
【0023】短周期分析フィルタ(short term analysi
s filter) のインパルス応答を表すLPC係数 d(i)
を、例えばシュール巡回アルゴリズム(the Schur recu
rsionalgorithm)やレビンソン・ダービンのアルゴリズ
ム(the Levinson-Durbin algorithm)などの従来公知の
方法により自己相関係数ACF(k)から計算すること
ができる。
【0024】図5に示されているブロック8において高
速フーリエ変換(FFT)を使って下記の式に従ってL
PCの値から所望の周波数での振幅が計算される:
【数7】 ここで、K は定数、例えば8000、であり、k はパワ
ーが計算される周波数に対応し(即ち、A(k)は周波数 k
/K・fsに対応し、ここで fs はサンプル周波数であ
る)、また、M は短周期分析の次数(order)である。
【0025】所望の周波数帯域の振幅を次のようにして
推定することができる:
【数8】 ここでk1は周波数帯域のスタート指標(start index)で
あり、k2は周波数帯域のエンド指標(end index)であ
る。
【0026】各係数 C(k1,k2,i) を前もって計算してお
き、それらをメモリ(図示せず)に記憶させておくこと
により、必要な計算ロードを少なくすることができる。
それらの係数を次のように計算することができる:
【数9】
【0027】振幅 A(k1,k2) の平方の逆数を取り、更に
ACF(0) と掛け合わせることにより、計算スペクトル成
分 S(s) での信号パワーの近似値を計算することができ
る。この逆数を取る計算が必要なのは、線形予測係数が
入力信号の反転スペクトル(inverse spectrum)を表す
からである。ACF(0)は、信号のパワーを表し、式7で計
算される。
【数10】 ここで各計算スペクトル成分 S(s) は、帯域の両端(ba
nd limits)を定義する特定の定数 k1 及び k2 を用いて
計算される。以上、パワー(計算)スペクトル成分 S
(s) を計算する種々の方法を説明した。
【0028】更に図2において、音声活性検出装置が音
声を検出しないときに推定ブロック80(図11により
詳しく示されている)で雑音のスペクトル N(s), s =
0,..,7 が推定される。推定はブロック80においてブ
ロック6から入力された信号の各スペクトル成分 S(s),
s = 0,..,7 について時間平均された平均値を巡回的に
計算することにより実行される:
【数11】
【0029】この文脈で、Nn-1(s)は図11に示されて
いるようにメモリ83から得られる前のフレームについ
て計算された雑音スペクトル推定値を意味し、Nn (s)
は上の式による現在のフレーム(n = フレーム順序番
号)についての推定値を意味する。この計算はブロック
81で好ましくはデジタル的に実行される。このブロッ
クへの入力は、ブロック6からのスペクトル成分 S(s)
と、メモリ83から得られる前のフレームについての推
定値Nn-1(s)と、ブロック82で計算される時定数変数
λ(s) の値とである。入力スペクトル成分が雑音推定値
n-1(s)成分より低い S(s) であるときに、より速い時
定数を使って更新を行うことができる。変数λ(s) の値
は次の表(λ(s) の代表的な値)に従って決定される:
【表2】
【0030】値Vind 及びSTcount については後に詳し
く説明する。
【0031】以下の記述においては記号 N(s) は、現在
のフレームについて計算された雑音スペクトル推定用に
用いられる。上記の推定による計算は好ましくはデジタ
ル的に実行される。上記の式に従ってデジタル的に乗
算、加算及び減算を行うことは当業者に周知されている
ことである。
【0032】更に図2において計算ブロック90で入力
スペクトル S(s) 及び雑音スペクトル N(s) から比 SNR
(s), s = 0,..,7 が成分毎に計算され、この比は信号対
雑音比と呼ばれる:
【数12】
【0033】信号対雑音比 SNR(s) は、計算スペクトル
成分の各周波数帯域についての一種の音声活性判定を表
す。信号対雑音比 SNR(s) から、その周波数帯域信号が
音声又は雑音を含むか否か判定することができ、従って
これは音声活性(voice activity) を表す。計算ブロッ
ク90も好ましくはデジタル的に実現され、上記の割り
算を実行する。割り算をデジタル的に実行する方法自体
は当業者に従来から知られている。
【0034】
【表3】 図2において相対雑音レベルが計算ブロック70で計算
される。このブロックは図10に詳しく示されており、
ここでパワースペクトル推定値 S(s), s = 0,..,7 を用
いて音声についての時間平均された平均値(ロ)が計算
される。音声が検出されたとき、時間平均された平均値
(ロ)は更新される。始めに現在のフレームでのパワー
スペクトル成分の平均値(ハ)がブロック71で計算さ
れ、このブロック71に次のようにブロック60からス
ペクトル成分 S(s) が入力として与えられる:
【数13】
【0035】ブロック72で、時間平均された平均値
(ロ)は、前のフレームの時に計算された時間平均され
た平均値が記憶されているメモリ78から得られる前の
フレームについての時間平均された平均値(ニ)と、ブ
ロック71から得られる計算スペクトル平均値(ハ)
と、前もってメモリ79aに記憶されている時定数αと
に基づいて(例えば巡回的に)計算されることにより得
られる:
【数14】 ここで nはフレームの順序番号であり、αは前記の時定
数であり、その値は 0.0〜 1.0であり、通常は 0.9〜
1.0である。時間平均された平均値に非常に弱い音声
(例えば文の終わりで)を含ませないために、現在のフ
レームについての各スペクトル成分の平均値が時間平均
された平均値に依存する閾値を上回る場合に限ってそれ
は更新される。この閾値は通常は時間平均された平均値
の1/4である。前の2つの式の計算は好ましくはデジ
タル的に実行される。
【0036】同様に、雑音パワーの時間平均された平均
値(ホ)は、雑音のパワースペクトル推定値 N(s), s =
0,..,7 及び次の式に従ってそれから計算される成分平
均値(ヘ)を用いて計算ブロック73から得られる:
【数15】 ここでβは時定数であり、その値は 0.0〜 1.0であり、
通常は 0.9と 1.0との間である。雑音パワーの時間平均
された平均値は各フレームにおいて更新される。雑音ス
ペクトル成分の平均値(へ)は、スペクトル成分 N(s)
に基づいて、ブロック76で次のようにして計算され
る:
【数16】 そして前のフレームの時にメモリ74に記憶された前の
フレームについての雑音パワーの時間平均された平均値
(ト)がメモリ74から得られる。相対雑音レベルη
は、雑音及び音声の時間平均された各平均値のスケーリ
ングされ(scaled)且つ最大値を限定された商(maximum
limited quotient) としてブロック75で計算され
る:
【数17】 ここでκは前もってメモリ77に記憶されているスケー
リング定数(scaling constant) であり(代表的な値は
4.0)、 max ηはメモリ79bに記憶されている相対
雑音レベルの最大値(代表的な値は 1.0)である。
【0037】図2の装置でVAD判定を生成するため
に、VAD判定ブロック110で信号対雑音比 SNR(s)
を利用して入力信号と雑音モデルとの間の距離DSNR
計算され、それはデジタル計算により次の式を実現す
る:
【数18】 ここで s l 及び s h は、含まれている最低周波数成
分及び最高周波数成分の指標値(index values) であ
り、υs は成分重み付け係数であり、これらは予め決め
られて前もってメモリに記憶され、そこからそれらは計
算のために検索される。通常は、全ての信号対雑音推定
値成分が使われ(s l = 0及び s h= 7) であり、それら
に等しい重みが付けられる:υs = 1.0/8.0; s =
0,.., 7 。
【0038】次に、図12を参照してVAD判定ブロッ
ク110の実施例を詳しく解説する。音声活性検出器に
おける総和ユニット(summing unit) 111は、種々の
周波数帯域から得られる信号対雑音比 SNR(s) の値を合
計し、それにより、入力信号と雑音モデルとの間のスペ
クトル距離を表すパラメータDSNR が上記の式(19)
に従って得られ、総和ユニット111からの値DSNR
比較ユニット112で所定の閾値 vthと比較される。閾
値 vthの方が小さければ、そのフレームは音声を含むと
見なされる。信号対雑音比が良好であると期待すること
のできる周波数に一層大きな重みが付けられるように、
合計の計算(summing)に重み付けを行うこともできる。
音声活性検出器の出力及び判定を変数Vind で表すこと
ができ、その値について下記の条件が得られる:
【数19】
【0039】該VADは背景(background)スペクトル
推定値 N(s) の更新を制御し、後者はそれに代わって上
記したように音声活性検出器の機能に影響を及ぼすの
で、もし背景雑音(暗騒音)レベルが急に増大すると雑
音及び音声の両方が音声と指摘される可能性がある(V
ind = 1)。このことは、更に背景スペクトル推定値 N
(s) の更新が禁止されることになる。それを防止するた
めに、その間は連続するフレームが音声を含んでいない
と見なされる時間(フレームの個数)が監視される。安
定していて、有声と指摘されない連続するフレームは音
声を含んでいないものとされる。
【0040】図2のブロック7で、ピッチ分析(pitch
analysis)とも呼ばれる長周期予測(Long Term Predic
tion (LTP)) 分析が計算される。有声検出は長周期予測
パラメータを用いて行われる。長周期予測パラメータ
は、遅れ(即ちピッチ周期)と長周期予測利得(long t
erm predictor gain) とである。これらのパラメータは
殆どの音声コーデック(符号器を含む)で計算される。
よって音声コーデックの他に音声活性検出器を使用する
ならば(図5に記載されているように)、それらのパラ
メータを音声コーデックから得ることができる。
【0041】フレーム長 Nに等しいサンプルの量 Mから
長周期予測分析を計算することができ、或いは入力フレ
ーム長をサブフレームに分割し(例えば4サブフレー
ム、4・M = N )、長周期パラメータを各サブフレーム
から別々に計算することもできる。入力フレームのこれ
らのサブフレームへの分割はLTP分析ブロック7(図
2)で行われる。該サブフレーム・サンプルは xs(i)で
表される。
【0042】従って、ブロック7では始めに各サブフレ
ーム・サンプル xs(i)から自己相関R(l) が計算され
る:
【数20】 ここで l = Lmin,..., Lmax (例えば Lmin = 40、Lmax = 160) である。
【0043】上記の計算のために、旧サブフレームから
最後の Lmax 個のサンプルを保存しておかなければなら
ない。
【0044】次に該 R(l) からRmax = max(R(l))となる
ような最大値 Rmax を探す。ここでl = 40,..., 160で
ある。
【0045】長周期予測(long term predictor)の遅れ
LTP lag(j)は、Rmaxに対応する指標(index) lであ
る。変数 jはサブフレームの指標(index)を表す(j =
0...3)。
【0046】LTP gainを次のように計算することがで
きる: LTP gain(j) = Rmax/Rtot ここで
【数21】
【0047】サブフレームの長周期予測の遅れ利得(LTP
gain(j) )を合計することによってフレームの長周期
予測の遅れ利得(LTP gain sum )を表すパラメータを
計算することができる:
【数22】
【0048】もし LTP gain sum が一定の閾値 thr
lag より大きければ、そのフレームは有声であるとされ
る:
【数23】
【0049】更に図2においてブロック100で次のよ
うに平均雑音スペクトル推定値 NA(s)が計算される:
【数24】 ここで aは 0 < a < 1の値(例えば 0.9)の時定数であ
る。
【0050】平均雑音スペクトル推定値 NA(s)とスペク
トル推定値 S(s) との間のスペクトル距離 Dもブロック
100で次のように計算される:
【数25】
【0051】Low Limit は小さな定数で、いくつかの
周波数帯域での雑音スペクトル又は信号スペクトルが低
いときに割り算の結果を小さく保つために使われる。
【0052】もしスペクトル距離 Dが所定の閾値 Dlim
より大きければ、定常度カウンタ stat cnt は 0にセ
ットされる。もしスペクトル距離 Dが閾値 Dlim より小
さくて、信号が有声とは検出されなければ(voiced =
0)、定常度カウンタの値が増やされる(インクリメン
トされる)。定常度カウンタについて下記の条件が受け
入れられる:
【数26】
【0053】ブロック100は出力stat cnt を与え、
これは次の条件に合致するようにV ind の値が 0になる
と、 0にリセットされる:
【数27】
【0054】もしこの連続するフレームの個数が所定の
閾値 max spf (その値は例えば50である)より大き
ければ、STcount の値は1にセットされる。これにより
カウンタ値stat cnt との関連で出力STcount に関して
下記の条件が与えられる:
【数28】
【0055】また、本発明では、背景スペクトル推定値
N(s) の精度は、相対雑音レベルη(これはブロック7
0で計算される)を利用して音声活性検出器の前記閾値
vthを調整することにより改善される。信号対雑音比が
非常に良好である(或いは相対雑音レベルηが低い)よ
うな環境では、相対雑音レベルηに基づいて閾値 vthの
値が大きくされる。これにより、背景雑音(暗騒音)の
急激な変化を音声と解釈することが少なくなる。閾値 v
thの適応化は下記の式に従ってブロック113で実行さ
れる:
【数29】 ここで vth fix1、 vth min1、及び vth slope1は正
の定数であり、それらの代表的な値は例えば次の通りで
ある: vth fix1 = 2.5;vth min1 = 2.0;vth slope1 =
8.0。
【0056】
【表4】 雑音レベルの高い環境では、音声を雑音として検出する
確率を低くするために閾値が低くされる。そのとき、閾
値 vth を低くするために次のように雑音スペクトル成
分の平均値(チ)が使われる:
【数30】 ここで vth fix2及び vth slope2は正の定数である。
よって、もし雑音スペクトル成分の平均値(チ)が充分
に大きければ、閾値 vth2 は閾値 vth1 より小さい。
【0057】音声バースト時に閾値 vth2 が更に小さく
されるようにして本発明の音声活性検出器を改善するこ
ともできる。これにより、音声がゆっくりと静かになっ
てゆくときに音声の終わりが雑音と解される可能性が無
くなるので、動作が改善する。この付加的な閾値適応化
を下記のようにように(ブロック113で)実施するこ
とができる。
【0058】始めに、次の条件に従ってDSNR を所望の
最大値(代表的には5)及び最小値(代表的には2)の
間に限定する:
【数31】
【0059】その後、閾値適応化係数 ta0を次のように
計算する:
【数32】 ここでthmin 及びthmax はそれぞれ最小スケーラ値(th
e minimum scaler value) (代表的には 0.5)及び最大
スケーラ値(the maximum scaler value)(代表的には
1)である。
【0060】フレーム nについての実際のスケーラ ta
(n)は、値を増減するために種々の時定数を有するフィ
ルターで ta0を平滑化することにより計算される。この
平滑化を下記の式に従って実行することができる:
【数33】
【0061】ここで、λ0 及びλ1 はアタック時定数
(増加期間(increase period);代表的な値は 0.9)及
びリリース時定数(減少期間(decrease period);代表
的な値は 0.5)である。最後に、スケーラ ta(n)を用い
て、新しいVAD閾値 vthを得るために閾値 vthをスケ
ーリングすることができ、これにより次のようになる:
【数34】
【0062】音声活性検出器においてしばしば起こる問
題は、音声のちょうど始まりの時には音声が直ぐには検
出されず、また音声の終わりも正しく検出されないとい
うことである。そのために暗騒音推定値 N(s) が誤った
値となり、そのために音声活性検出器の後の結果に影響
が及ぶことになる。遅延を用いて暗騒音推定値を更新す
ることにより、この問題を無くすることができる。この
場合、暗騒音推定値 N(s) を更新する前に最後のフレー
ムの或る数 N(例えば N = 2)のパワースペクトル(こ
こでは計算スペクトル)S1(s),..., SN (s) が記憶され
る(例えば、図11には示されていない、ブロック80
の入力に設けられるバッファに)。もし最後の2倍の量
のフレームの間に(即ち 2・N 個のフレームの間に)音
声活性検出器が音声を検出していなければ暗騒音推定値
N(s) はメモリの中の最も古いパワースペクトル S1(s)
で更新され、その他の場合には更新は行われない。これ
により、更新時に使用されるフレームの前後の N個のフ
レームが雑音であったことが保証される。
【0063】本発明の方法及び音声活性検出装置は移動
局や移動通信システム(例えば基地局の)などの通信装
置に用いるのに特に適しており、この方法及び装置は特
定のアーキテクチャ(TDMA、CDMA、デジタル/
アナログ)に限定されない。図13は本発明の移動局を
示しており、これに本発明の音声活性検出方法が採用さ
れている。マイクロホン1から出る送信されるべき音声
信号はA/D変換器2でサンプリングされ、音声コーデ
ック3で音声符号化され、その後に基本周波数信号処理
(例えばチャネル符号化、インタリーブなど)、混合及
び無線周波数への変調及び送信がブロックTXで行われ
る。音声活性検出器4(VAD)を使って、該VADの
出力Vind に従ってブロックTXを制御することにより
不連続送信を制御することができる。移動局がエコー及
び/又は雑音消去装置(キャンセラ)ENCを含んでい
るならば、本発明のVAD4をブロックENCを制御す
るためにも使うことができる。ブロックTXから信号は
複式フィルターDPLX及びアンテナANTを通して送
信される。受信された音声に対して受信部RXの公知の
動作が受信時に行われて、その音声はスピーカー9を通
して再生される。VAD4を使って受信部RXの如何な
る動作も、例えばエコー消去と関連して、制御すること
ができる。
【0064】本発明の方法及び装置の実施例を本明細書
に開示した。本発明は、ここに開示した実施例の細目に
限定されるものではなく、本発明の範囲から逸脱せずに
他の形で本発明を実施し得ることは当業者には明かであ
る。ここに開示した実施例は単なる例に過ぎず、発明を
限定するものではないと解されるべきである。従って本
発明を実施し使用する可能性は特許請求の範囲の請求項
のみにより限定される。各請求項により定義される発明
を実施するための、均等実施態様を含む種々の選択肢が
本発明の範囲に含まれる。
【図面の簡単な説明】
【図1】本発明の音声活性検出装置(VAD)の使用状
況を示すブロック図である。
【図2】本発明のVADの実施態様を示すブロック図で
ある。
【図3】図2のパワースペクトル計算ブロックの実施態
様を示す図である。
【図4】パワースペクトル計算ブロックの別の実施態様
を示す図である。
【図5】本発明の装置の別の実施例のブロック図であ
る。
【図6】窓掛けブロックの実施態様を示すブロック図で
ある。
【図7】本発明による窓掛けの際の連続する音声信号フ
レームを示す図である。
【図8】平方ブロックの実施態様を示す図である。
【図9】スペクトル再結合ブロックの実施態様を示す図
である。
【図10】相対雑音レベルを計算するためのブロックの
実施態様を示す図である。
【図11】暗騒音モデルを計算するための構成を示す図
である。
【図12】VAD判定ブロックの実施態様を示すブロッ
ク図である。
【図13】本発明の移動局を示す図である。
【符号の説明】
3…音声コーデック 4…音声活性検出装置(VAD) 50…平方ブロック 70…計算ブロック 80…推定ブロック 90…計算ブロック 110…VAD判定ブロック
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ユハ ヘッキネン フィンランド国,エフイーエン−33710 タンペーレ,ルコンメーエンカツ 20 ベ ー 11 (72)発明者 エルッキ パーヤネン フィンランド国,エフイーエン−33540 タンペーレ,サルビヤーコンカツ 16 ア ー 20

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力信号(x(n))中の音声活性を検出する
    ための手段と、 その検出に基づいて音声活性判定(Vind )を行うため
    の手段とを有する音声活性検出装置において、 前記入力信号(x(n))を特定の周波数帯域を表すサブ信
    号(S(s))に分割するための手段(6)と、 該サブ信号中の雑音(N(s))を推定するための手段(8
    0)と、 該サブ信号中の雑音に基づいて副判定信号(SNR(s))を
    計算するための手段(90)と、 該副判定信号に基づいて該入力信号について音声活性判
    定(Vind )を行うための手段(110)とをそなえる
    ことを特徴とする音声活性検出装置。
  2. 【請求項2】 各サブ信号について信号対雑音比(SNR)
    を計算し、前記信号対雑音比を副判定信号(SNR(s))と
    して供給するための手段(90)をそなえる、請求項1
    に記載の音声活性検出装置。
  3. 【請求項3】 入力信号について音声活性判定
    (Vind )を行うための手段(110)は、前記信号対
    雑音比(SNR(s))に基づいて値(DSNR )を生成するた
    めの手段(111)と、前記の値(DSNR ) を閾値(vt
    h)と比較し、前記の比較に基づいて音声活性判定信号
    (Vind )を出力するための手段(112)とから成る
    請求項2に記載の音声活性検出装置。
  4. 【請求項4】 入力信号に含まれている雑音成分及び音
    声成分の平均レベル(イ)を決定するための手段(7
    0)と、雑音成分及び音声成分の平均レベル(イ)に基
    づいて前記閾値(vth)を調整するための手段(113)
    とを有する、請求項1に記載の音声活性検出装置。 【表1】
  5. 【請求項5】 過去の信号対雑音比(SNR(s))に基づい
    て前記閾値(vth)を調整するための手段(113)を有
    する、請求項2に記載の音声活性検出装置。
  6. 【請求項6】 前記音声活性検出装置は、推定された雑
    音の値(N(s))を記憶するための手段(80)を有し、
    前記雑音(N(s))は過去の及び現在の信号対雑音比(SN
    R(s))に依存して過去のサブ信号(S(s))で更新され
    る、請求項2に記載の音声活性検出装置。
  7. 【請求項7】 入力信号(x(n))に基づいて線形予測係
    数を計算するための手段(3)と、前記線形予測係数に
    基づいて前記サブ信号(S(s))を計算するための手段
    (8)とを有する、請求項1に記載の音声活性検出装
    置。
  8. 【請求項8】 長周期予測分析を計算し、長周期予測利
    得(LTP gain sum)を含む長周期予測パラメータを生成
    するための手段(7)と、 前記長周期予測利得を閾値(thr lag)と比較するための
    手段(7)と、 前記比較に基づいて有声検出判定を生成するための手段
    とを有する、請求項1に記載の音声活性検出装置。
  9. 【請求項9】 音声メッセージ(x(n))中の音声活性を
    検出するための手段と、 その検出に基づいて音声活性判定(Vind )を行うため
    の手段とを有する、音声メッセージを送受信するための
    移動局において、 前記音声メッセージ(x(n))を特定の周波数帯域を表す
    サブ信号(S(s))に分割するための手段(6)と、 該サブ信号中の雑音(N(s))を推定するための手段(8
    0)と、 該サブ信号中の雑音に基づいて副判定信号(SNR(s))を
    計算するための手段(90)と、 該副判定信号に基づいて入力信号について音声活性判定
    (Vind )を行うための手段(110)とをそなえるこ
    とを特徴とする移動局。
  10. 【請求項10】 入力信号(x(n))を受信し、 該入力信号中の音声活性を検出し、 その検出に基づいて音声活性判定(Vind )を行う(1
    10)各ステップを有する、通信装置における音声活性
    を検出する方法において、 前記入力信号を特定の周波数帯域を表すサブ信号(S
    (s))に分割し(6)、 該サブ信号中の雑音(N(s))を推定し、 該サブ信号中の雑音に基づいて副判定信号(SNR(s))を
    計算し(90)、 該副判定信号に基づいて該入力信号についての音声活性
    判定(Vind )を行う(110)各ステップをそなえる
    ことを特徴とする方法。
JP8331874A 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法 Withdrawn JPH09212195A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI955947A FI100840B (fi) 1995-12-12 1995-12-12 Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
FI955947 1995-12-12

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007051941A Division JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法

Publications (1)

Publication Number Publication Date
JPH09212195A true JPH09212195A (ja) 1997-08-15

Family

ID=8544524

Family Applications (4)

Application Number Title Priority Date Filing Date
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP33223796A Expired - Lifetime JP4163267B2 (ja) 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP33223796A Expired - Lifetime JP4163267B2 (ja) 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Country Status (7)

Country Link
US (2) US5963901A (ja)
EP (2) EP0790599B1 (ja)
JP (4) JPH09212195A (ja)
AU (2) AU1067897A (ja)
DE (2) DE69630580T2 (ja)
FI (1) FI100840B (ja)
WO (2) WO1997022117A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222298A (ja) * 2000-02-10 2001-08-17 Mitsubishi Electric Corp 音声符号化方法および音声復号化方法とその装置
JP2002533772A (ja) * 1998-12-21 2002-10-08 クゥアルコム・インコーポレイテッド 可変レートスピーチコーディング
JP2002538514A (ja) * 1999-03-05 2002-11-12 パナソニック テクノロジーズ, インコーポレイテッド 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法
JP2005189518A (ja) * 2003-12-25 2005-07-14 Ntt Docomo Inc 有音無音判定装置および有音無音判定方法
JP2005215204A (ja) * 2004-01-28 2005-08-11 Ntt Docomo Inc 有音無音判定装置および有音無音判定方法
WO2006082636A1 (ja) * 2005-02-02 2006-08-10 Fujitsu Limited 信号処理方法および信号処理装置
WO2007017993A1 (ja) * 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
WO2009145192A1 (ja) * 2008-05-28 2009-12-03 日本電気株式会社 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
WO2011077924A1 (ja) * 2009-12-24 2011-06-30 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム

Families Citing this family (191)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69716266T2 (de) * 1996-07-03 2003-06-12 British Telecommunications P.L.C., London Sprachaktivitätsdetektor
US6744882B1 (en) * 1996-07-23 2004-06-01 Qualcomm Inc. Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
US6510408B1 (en) * 1997-07-01 2003-01-21 Patran Aps Method of noise reduction in speech signals and an apparatus for performing the method
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
CN1494055A (zh) * 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
FI116505B (fi) 1998-03-23 2005-11-30 Nokia Corp Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6067646A (en) * 1998-04-17 2000-05-23 Ameritech Corporation Method and system for adaptive interleaving
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
JPH11344999A (ja) * 1998-06-03 1999-12-14 Nec Corp ノイズキャンセラ
JP2000047696A (ja) * 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
US6272460B1 (en) * 1998-09-10 2001-08-07 Sony Corporation Method for implementing a speech verification system for use in a noisy environment
US6188981B1 (en) * 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
FI114833B (fi) * 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
FI118359B (fi) * 1999-01-18 2007-10-15 Nokia Corp Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin
US6604071B1 (en) * 1999-02-09 2003-08-05 At&T Corp. Speech enhancement with gain limitations based on speech activity
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6349278B1 (en) 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
SE514875C2 (sv) 1999-09-07 2001-05-07 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
FI19992453A (fi) * 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
FI116643B (fi) 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
US6885694B1 (en) 2000-02-29 2005-04-26 Telefonaktiebolaget Lm Ericsson (Publ) Correction of received signal and interference estimates
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
DE10026872A1 (de) * 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
JP4580508B2 (ja) * 2000-05-31 2010-11-17 株式会社東芝 信号処理装置及び通信装置
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
US6898566B1 (en) 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US7457750B2 (en) 2000-10-13 2008-11-25 At&T Corp. Systems and methods for dynamic re-configurable speech recognition
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US20020103636A1 (en) * 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US20030004720A1 (en) * 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
FI110564B (fi) * 2001-03-29 2003-02-14 Nokia Corp Järjestelmä automaattisen kohinanvaimennuksen (ANC) kytkemiseksi päälle ja poiskytkemiseksi matkapuhelimessa
US20020147585A1 (en) * 2001-04-06 2002-10-10 Poulsen Steven P. Voice activity detection
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
US6978010B1 (en) 2002-03-21 2005-12-20 Bellsouth Intellectual Property Corp. Ambient noise cancellation for voice communication device
JP3946074B2 (ja) * 2002-04-05 2007-07-18 日本電信電話株式会社 音声処理装置
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
DE10234130B3 (de) * 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
US7146315B2 (en) * 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
DE10251113A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren zum Betrieb eines Spracherkennungssystems
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
KR100506224B1 (ko) * 2003-05-07 2005-08-05 삼성전자주식회사 이동 통신 단말기에서 노이즈 제어장치 및 방법
US20040234067A1 (en) * 2003-05-19 2004-11-25 Acoustic Technologies, Inc. Distributed VAD control system for telephone
JP2004356894A (ja) * 2003-05-28 2004-12-16 Mitsubishi Electric Corp 音質調整装置
US6873279B2 (en) * 2003-06-18 2005-03-29 Mindspeed Technologies, Inc. Adaptive decision slicer
GB0317158D0 (en) * 2003-07-23 2003-08-27 Mitel Networks Corp A method to reduce acoustic coupling in audio conferencing systems
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
KR101058003B1 (ko) * 2004-02-11 2011-08-19 삼성전자주식회사 소음 적응형 이동통신 단말장치 및 이 장치를 이용한통화음 합성방법
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
FR2875633A1 (fr) * 2004-09-17 2006-03-24 France Telecom Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
CN1763844B (zh) * 2004-10-18 2010-05-05 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别系统
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
FR2882458A1 (fr) * 2005-02-18 2006-08-25 France Telecom Procede de mesure de la gene due au bruit dans un signal audio
WO2006104576A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
JP4395772B2 (ja) * 2005-06-17 2010-01-13 日本電気株式会社 ノイズ除去方法及び装置
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204754B2 (en) * 2006-02-10 2012-06-19 Telefonaktiebolaget L M Ericsson (Publ) System and method for an improved voice detector
US8032370B2 (en) 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7680657B2 (en) * 2006-08-15 2010-03-16 Microsoft Corporation Auto segmentation based partitioning and clustering approach to robust endpointing
JP4890195B2 (ja) * 2006-10-24 2012-03-07 日本電信電話株式会社 ディジタル信号分波装置及びディジタル信号合波装置
US8069039B2 (en) * 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
JP5530720B2 (ja) 2007-02-26 2014-06-25 ドルビー ラボラトリーズ ライセンシング コーポレイション エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体
US8612225B2 (en) * 2007-02-28 2013-12-17 Nec Corporation Voice recognition device, voice recognition method, and voice recognition program
KR101009854B1 (ko) * 2007-03-22 2011-01-19 고려대학교 산학협력단 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
US11856375B2 (en) 2007-05-04 2023-12-26 Staton Techiya Llc Method and device for in-ear echo suppression
US8526645B2 (en) * 2007-05-04 2013-09-03 Personics Holdings Inc. Method and device for in ear canal echo suppression
US10194032B2 (en) 2007-05-04 2019-01-29 Staton Techiya, Llc Method and apparatus for in-ear canal sound suppression
US9191740B2 (en) * 2007-05-04 2015-11-17 Personics Holdings, Llc Method and apparatus for in-ear canal sound suppression
US11683643B2 (en) 2007-05-04 2023-06-20 Staton Techiya Llc Method and device for in ear canal echo suppression
WO2008137870A1 (en) 2007-05-04 2008-11-13 Personics Holdings Inc. Method and device for acoustic management control of multiple microphones
JP4580409B2 (ja) * 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8374851B2 (en) * 2007-07-30 2013-02-12 Texas Instruments Incorporated Voice activity detector and method
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
KR101437830B1 (ko) * 2007-11-13 2014-11-03 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8180634B2 (en) * 2008-02-21 2012-05-15 QNX Software Systems, Limited System that detects and identifies periodic interference
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
JP5103364B2 (ja) 2008-11-17 2012-12-19 日東電工株式会社 熱伝導性シートの製造方法
JP2010122617A (ja) 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
GB2473266A (en) * 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
US8571231B2 (en) 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
EP2491549A4 (en) 2009-10-19 2013-10-30 Ericsson Telefon Ab L M DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY
PT2491559E (pt) * 2009-10-19 2015-05-07 Ericsson Telefon Ab L M Método e estimador de fundo para a detecção de actividade de voz
GB0919672D0 (en) 2009-11-10 2009-12-23 Skype Ltd Noise suppression
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
JP5424936B2 (ja) * 2010-02-24 2014-02-26 パナソニック株式会社 通信端末及び通信方法
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP5870476B2 (ja) * 2010-08-04 2016-03-01 富士通株式会社 雑音推定装置、雑音推定方法および雑音推定プログラム
CN102971789B (zh) 2010-12-24 2015-04-15 华为技术有限公司 用于执行话音活动检测的方法和设备
EP3493205B1 (en) 2010-12-24 2020-12-23 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting a voice activity in an input audio signal
US20140006019A1 (en) * 2011-03-18 2014-01-02 Nokia Corporation Apparatus for audio signal processing
US20120265526A1 (en) * 2011-04-13 2012-10-18 Continental Automotive Systems, Inc. Apparatus and method for voice activity detection
JP2013148724A (ja) * 2012-01-19 2013-08-01 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US9280984B2 (en) * 2012-05-14 2016-03-08 Htc Corporation Noise cancellation method
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN103730110B (zh) * 2012-10-10 2017-03-01 北京百度网讯科技有限公司 一种检测语音端点的方法和装置
CN103903634B (zh) * 2012-12-25 2018-09-04 中兴通讯股份有限公司 激活音检测及用于激活音检测的方法和装置
US9210507B2 (en) * 2013-01-29 2015-12-08 2236008 Ontartio Inc. Microphone hiss mitigation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6339896B2 (ja) * 2013-12-27 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
US9978394B1 (en) * 2014-03-11 2018-05-22 QoSound, Inc. Noise suppressor
CN107293287B (zh) * 2014-03-12 2021-10-26 华为技术有限公司 检测音频信号的方法和装置
RU2665916C2 (ru) * 2014-07-29 2018-09-04 Телефонактиеболагет Лм Эрикссон (Пабл) Оценивание фонового шума в аудиосигналах
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9450788B1 (en) 2015-05-07 2016-09-20 Macom Technology Solutions Holdings, Inc. Equalizer for high speed serial data links and method of initialization
JP6447357B2 (ja) * 2015-05-18 2019-01-09 株式会社Jvcケンウッド オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US9691413B2 (en) * 2015-10-06 2017-06-27 Microsoft Technology Licensing, Llc Identifying sound from a source of interest based on multiple audio feeds
EP3430821B1 (en) * 2016-03-17 2022-02-09 Sonova AG Hearing assistance system in a multi-talker acoustic network
WO2018152034A1 (en) * 2017-02-14 2018-08-23 Knowles Electronics, Llc Voice activity detector and methods therefor
US10224053B2 (en) * 2017-03-24 2019-03-05 Hyundai Motor Company Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
US10339962B2 (en) 2017-04-11 2019-07-02 Texas Instruments Incorporated Methods and apparatus for low cost voice activity detector
US10332545B2 (en) * 2017-11-28 2019-06-25 Nuance Communications, Inc. System and method for temporal and power based zone detection in speaker dependent microphone environments
US10911052B2 (en) 2018-05-23 2021-02-02 Macom Technology Solutions Holdings, Inc. Multi-level signal clock and data recovery
CN109273021B (zh) * 2018-08-09 2021-11-30 厦门亿联网络技术股份有限公司 一种基于rnn的实时会议降噪方法及装置
US11005573B2 (en) 2018-11-20 2021-05-11 Macom Technology Solutions Holdings, Inc. Optic signal receiver with dynamic control
US11575437B2 (en) 2020-01-10 2023-02-07 Macom Technology Solutions Holdings, Inc. Optimal equalization partitioning
CN115191090B (zh) 2020-01-10 2024-06-14 Macom技术解决方案控股公司 最佳均衡划分
CN111508514A (zh) * 2020-04-10 2020-08-07 江苏科技大学 基于补偿相位谱的单通道语音增强算法
US12013423B2 (en) 2020-09-30 2024-06-18 Macom Technology Solutions Holdings, Inc. TIA bandwidth testing system and method
US11658630B2 (en) 2020-12-04 2023-05-23 Macom Technology Solutions Holdings, Inc. Single servo loop controlling an automatic gain control and current sourcing mechanism
US11616529B2 (en) 2021-02-12 2023-03-28 Macom Technology Solutions Holdings, Inc. Adaptive cable equalizer
CN113707167A (zh) * 2021-08-31 2021-11-26 北京地平线信息技术有限公司 残留回声抑制模型的训练方法和训练装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
JPS6023899A (ja) * 1983-07-19 1985-02-06 株式会社リコー 音声認識装置における音声切り出し方式
JPS61177499A (ja) * 1985-02-01 1986-08-09 株式会社リコー 音声区間検出方式
JPH02232697A (ja) * 1989-03-06 1990-09-14 Nippondenso Co Ltd 音声認識装置
JPH02293797A (ja) * 1989-05-08 1990-12-04 Matsushita Electric Ind Co Ltd 音声認識装置
JPH02296297A (ja) * 1989-05-10 1990-12-06 Nec Corp 音声認識装置
JPH0530174A (ja) * 1991-07-24 1993-02-05 Nec Corp 車載用音声ダイヤラ
JPH0635498A (ja) * 1992-07-16 1994-02-10 Clarion Co Ltd 音声認識装置及び方法
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4071826A (en) * 1961-04-27 1978-01-31 The United States Of America As Represented By The Secretary Of The Navy Clipped speech channel coded communication system
JPS56104399A (en) * 1980-01-23 1981-08-20 Hitachi Ltd Voice interval detection system
DE3230391A1 (de) * 1982-08-14 1984-02-16 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur signalverbesserung von gestoerten sprachsignalen
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
GB8801014D0 (en) 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5276765A (en) 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
FI80173C (fi) 1988-05-26 1990-04-10 Nokia Mobile Phones Ltd Foerfarande foer daempning av stoerningar.
US5285165A (en) * 1988-05-26 1994-02-08 Renfors Markku K Noise elimination method
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
EP0763811B1 (en) * 1990-05-28 2001-06-20 Matsushita Electric Industrial Co., Ltd. Speech signal processing apparatus for detecting a speech signal
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
JP3176474B2 (ja) * 1992-06-03 2001-06-18 沖電気工業株式会社 適応ノイズキャンセラ装置
DE69331719T2 (de) * 1992-06-19 2002-10-24 Agfa-Gevaert, Mortsel Verfahren und Vorrichtung zur Geräuschunterdrückung
FI100154B (fi) * 1992-09-17 1997-09-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä kohinan vaimentamiseksi
ES2137355T3 (es) * 1993-02-12 1999-12-16 British Telecomm Reduccion de ruido.
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5446757A (en) * 1993-06-14 1995-08-29 Chang; Chen-Yi Code-division-multiple-access-system based on M-ary pulse-position modulated direct-sequence
EP0707763B1 (en) * 1993-07-07 2001-08-29 Picturetel Corporation Reduction of background noise for speech enhancement
US5406622A (en) * 1993-09-02 1995-04-11 At&T Corp. Outbound noise cancellation for telephonic handset
IN184794B (ja) 1993-09-14 2000-09-30 British Telecomm
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
PL174216B1 (pl) * 1993-11-30 1998-06-30 At And T Corp Sposób redukcji w czasie rzeczywistym szumu transmisji mowy
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
WO1995016259A1 (en) * 1993-12-06 1995-06-15 Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5550893A (en) * 1995-01-31 1996-08-27 Nokia Mobile Phones Limited Speech compensation in dual-mode telephone
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
JPS6023899A (ja) * 1983-07-19 1985-02-06 株式会社リコー 音声認識装置における音声切り出し方式
JPS61177499A (ja) * 1985-02-01 1986-08-09 株式会社リコー 音声区間検出方式
JPH02232697A (ja) * 1989-03-06 1990-09-14 Nippondenso Co Ltd 音声認識装置
JPH02293797A (ja) * 1989-05-08 1990-12-04 Matsushita Electric Ind Co Ltd 音声認識装置
JPH02296297A (ja) * 1989-05-10 1990-12-06 Nec Corp 音声認識装置
JPH0530174A (ja) * 1991-07-24 1993-02-05 Nec Corp 車載用音声ダイヤラ
JPH0635498A (ja) * 1992-07-16 1994-02-10 Clarion Co Ltd 音声認識装置及び方法
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002533772A (ja) * 1998-12-21 2002-10-08 クゥアルコム・インコーポレイテッド 可変レートスピーチコーディング
JP2013178545A (ja) * 1998-12-21 2013-09-09 Qualcomm Inc 可変レートスピーチ符号化
JP4927257B2 (ja) * 1998-12-21 2012-05-09 クゥアルコム・インコーポレイテッド 可変レートスピーチ符号化
JP2011123506A (ja) * 1998-12-21 2011-06-23 Qualcomm Inc 可変レートスピーチ符号化
JP4745502B2 (ja) * 1999-03-05 2011-08-10 マツシタ エレクトリック コーポレーション オブ アメリカ 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法
JP2002538514A (ja) * 1999-03-05 2002-11-12 パナソニック テクノロジーズ, インコーポレイテッド 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法
JP2001222298A (ja) * 2000-02-10 2001-08-17 Mitsubishi Electric Corp 音声符号化方法および音声復号化方法とその装置
JP2005189518A (ja) * 2003-12-25 2005-07-14 Ntt Docomo Inc 有音無音判定装置および有音無音判定方法
US8442817B2 (en) 2003-12-25 2013-05-14 Ntt Docomo, Inc. Apparatus and method for voice activity detection
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP2005215204A (ja) * 2004-01-28 2005-08-11 Ntt Docomo Inc 有音無音判定装置および有音無音判定方法
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
WO2006082636A1 (ja) * 2005-02-02 2006-08-10 Fujitsu Limited 信号処理方法および信号処理装置
US8300834B2 (en) 2005-07-15 2012-10-30 Yamaha Corporation Audio signal processing device and audio signal processing method for specifying sound generating period
WO2007017993A1 (ja) * 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
JP5388447B2 (ja) * 2005-07-15 2014-01-15 ヤマハ株式会社 発音期間を特定する音信号処理装置および音信号処理方法
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
WO2009145192A1 (ja) * 2008-05-28 2009-12-03 日本電気株式会社 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
US8589152B2 (en) 2008-05-28 2013-11-19 Nec Corporation Device, method and program for voice detection and recording medium
WO2011077924A1 (ja) * 2009-12-24 2011-06-30 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
JPWO2011077924A1 (ja) * 2009-12-24 2013-05-02 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
JP5621786B2 (ja) * 2009-12-24 2014-11-12 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム

Also Published As

Publication number Publication date
EP0784311B1 (en) 2001-09-05
AU1067897A (en) 1997-07-03
EP0790599A1 (en) 1997-08-20
EP0784311A1 (en) 1997-07-16
DE69630580T2 (de) 2004-09-16
DE69630580D1 (de) 2003-12-11
EP0790599B1 (en) 2003-11-05
WO1997022116A2 (en) 1997-06-19
US5839101A (en) 1998-11-17
AU1067797A (en) 1997-07-03
DE69614989T2 (de) 2002-04-11
FI100840B (fi) 1998-02-27
JP5006279B2 (ja) 2012-08-22
JPH09204196A (ja) 1997-08-05
WO1997022117A1 (en) 1997-06-19
FI955947A (fi) 1997-06-13
JP2008293038A (ja) 2008-12-04
WO1997022116A3 (en) 1997-07-31
JP4163267B2 (ja) 2008-10-08
JP2007179073A (ja) 2007-07-12
DE69614989D1 (de) 2001-10-11
FI955947A0 (fi) 1995-12-12
US5963901A (en) 1999-10-05

Similar Documents

Publication Publication Date Title
JP5006279B2 (ja) 音声活性検出装置及び移動局並びに音声活性検出方法
US9646621B2 (en) Voice detector and a method for suppressing sub-bands in a voice detector
KR100546468B1 (ko) 잡음 억제 시스템 및 방법
US8135587B2 (en) Estimating the noise components of a signal during periods of speech activity
JP3224132B2 (ja) 音声活動検出装置
EP0548054B1 (en) Voice activity detector
US20040078199A1 (en) Method for auditory based noise reduction and an apparatus for auditory based noise reduction
EP1806739B1 (en) Noise suppressor
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
US20110066429A1 (en) Voice activity detector and a method of operation
US5430826A (en) Voice-activated switch
US8144862B2 (en) Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation
US6633847B1 (en) Voice activated circuit and radio using same

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060829

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060829

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061107

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070205

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070315

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070404

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070406