JPH09212195A - 音声活性検出装置及び移動局並びに音声活性検出方法 - Google Patents
音声活性検出装置及び移動局並びに音声活性検出方法Info
- Publication number
- JPH09212195A JPH09212195A JP8331874A JP33187496A JPH09212195A JP H09212195 A JPH09212195 A JP H09212195A JP 8331874 A JP8331874 A JP 8331874A JP 33187496 A JP33187496 A JP 33187496A JP H09212195 A JPH09212195 A JP H09212195A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- voice activity
- sub
- noise
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000000694 effects Effects 0.000 title claims abstract description 62
- 238000001514 detection method Methods 0.000 title claims description 27
- 238000000034 method Methods 0.000 title claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 description 32
- 238000001228 spectrum Methods 0.000 description 32
- 238000004364 calculation method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 11
- 230000006978 adaptation Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mobile Radio Communication Systems (AREA)
- Noise Elimination (AREA)
Abstract
では入力音声信号(x(n))は特定の周波数帯域を表すサ
ブ信号(S(s))に分割され、該サブ信号中の雑音(N
(s))が推定される。 【解決手段】 該サブ信号中の推定された雑音に基づい
て副判定信号(SNR(s))が生成され、該副判定信号に基
づいて該入力音声信号についての音声活性判定
(Vind )が形成される。入力音声信号のスペクトル成
分及び雑音推定値が計算され、比較される。より具体的
には、各サブ信号について信号対雑音比が計算され、そ
の各信号対雑音比は副判定信号(SNR(s))を表す。その
信号対雑音比から、それらの合計に比例する値が計算さ
れて閾値と比較され、入力音声信号についての音声活性
判定信号(Vind )がその比較に基づいて形成される。
Description
性を検出し、その検出結果に基づいて音声活性判定を行
うための手段をそなえる音声活性検出装置に関する。本
発明は、音声活性を検出する方法と、音声活性検出手段
を含む通信装置とにも関する。
tor (VAD))は、入力が音声又は暗騒音を含むか否か判定
する。VADの典型的なアプリケーションは無線通信シ
ステムにあり、無線通信システムでは、音声が検出され
ないときには送信が禁止される不連続送信システムを制
御するために音声活性検出方法を利用することができ
る。例えばエコー消去及び雑音消去のためにもVADを
使用することができる。
種々の方法が従来公知である。主な問題は、騒々しい環
境で暗騒音から音声を確実に検出することである。特許
公報US5、459、814は、音声信号について平均
信号レベルとゼロ点交差とを計算する音声活性検出方法
を開示している。この手法は、計算に関しては単純な方
法であるけれども、検出結果の信頼性が余り良くはない
という問題点を有する。特許公報WO95/08170
及びUS5、276、765は、音声信号と雑音推定値
とのスペクトル差をLPC(Liner Prediction Coding
(線形予測符号化))パラメータを用いて計算する音声
活性検出方法を開示している。これらの公報は雑音推定
値の更新を制御する補助VAD検出器を提示している。
上記の全ての公報に示されるVAD方法は、音声のパワ
ーが雑音のパワーと比べて小さいときに確実に音声を検
出しなければならないという問題がある。
を、特定の周波数帯域を表すサブ信号に分割し、該サブ
信号において音声活性を検出する音声活性検出装置に関
する。該サブ信号の検出に基づいて、副判定信号が生成
され、入力音声信号についての音声活性判定が該副判定
信号に基づいて形成される。本発明では、入力音声信号
の各スペクトル成分と雑音推定値とが計算されて比較さ
れる。より具体的に言えば、信号対雑音比が各サブ信号
について計算され、各信号対雑音比が副判定信号を表
す。その信号対雑音比から、それらの合計に比例する値
が計算されて閾値と比較され、入力音声信号についての
音声活性判定信号がその比較に基づいて形成される。
めに、各サブ周波数帯域について(即ち各サブ信号につ
いて)雑音推定値が計算される。このことは、雑音をよ
り精密に推定でき、その雑音推定値を各サブ周波数帯域
について別々に更新することもできることを意味する。
雑音推定値の精度が向上することによって音声活性検出
の判定がより精密かつ信頼性のあるものとなる。音声活
性検出装置の音声/雑音・判定を用いて暗騒音推定値の
更新を制御することにより、雑音推定値の精度も向上す
る。
は、前記入力信号を特定の周波数帯域を表すサブ信号に
分割するための手段と、該サブ信号中の雑音を推定する
ための手段と、該サブ信号中の雑音に基づいて副判定信
号を計算するための手段と、該副判定信号に基づいて該
入力信号について音声活性判定を行うための手段とを有
することを特徴とする。
波数帯域を表すサブ信号に分割し、該サブ信号中の雑音
を推定し、該サブ信号中の雑音に基づいて副判定信号を
計算し、該副判定信号に基づいて該入力信号について音
声活性判定を行う各ステップを有することを特徴とす
る。
説明する。
(Voice activity detection(VAD))装置4の使用
状況を簡単に示す。以下の記述において提示されるパラ
メータの値は、例示の値であって本発明の1実施例を記
載するものであり、それらの値は本発明の方法の機能を
特定のパラメータの値のみに限定するものではない。図
1を参照すると、マイクロホン1から到来する信号はA
/D変換器2でサンプリングされる。例示的な値とし
て、A/D変換器2のサンプリング速度は8000H
z、音声コーデック3のフレーム長は80サンプル、各
音声フレームは10msの音声から成るものとする。該
VAD装置4は音声コーデック3と同じ入力フレーム長
を用いることができ、或いはその長さは音声コーデック
が用いるフレーム長の均等商(even quotient)であるこ
とができる。符号化された音声信号は、更に送信部にお
いて例えば不連続送信ハンドラー5に供給され、これ
は、該VAD4から受け取った判定Vindに従って送
信を制御する。
2により詳しく示されている。マイクロホン1から来る
音声信号はA/D変換器2でサンプリングされてデジタ
ル信号 x(n) となる。図2のVAD装置への入力フレー
ムは、デジタル信号 x(n) から各サンプルを取り出すこ
とにより形成される。このフレームはブロック6に供給
され、ここで所定の帯域のパワーを表すパワースペクト
ル成分が計算される。FFT、フィルター群を使って、
又は線形予測係数を使って、入力フレームの振幅又はパ
ワースペクトルに比例する各成分を計算することができ
る。このことについて後に詳しく説明する。該VADが
線形予測係数を計算する音声コーデックと共に作動する
場合には、それらの係数をその音声コーデックから受け
取ることができる。
図3に示されているように高速フーリエ変換(FFT)
を用いて入力フレームから計算される。実施例では、F
FT計算の長さが128であることが仮定されている。
また、パワースペクトル成分P(f) は再結合されて計算
スペクトル成分 S(s) とされ、スペクトル成分の数が6
5から8まで減少する。
ブロック10に入力され、ここで音声フレームに所定の
窓が乗算される。窓掛けの目的は、一般に信号のスペク
トル推定の質を高め、信号を時間領域の各フレームに分
割することである。この実施例で使われる窓掛けでは、
窓同士が部分的に重複するので、重複する各サンプルが
次のフレームのためにメモリ(ブロック15)に記憶さ
れる。信号から80個のサンプルが取られ、それらのサ
ンプルは、前のフレームの際に記憶された16個のサン
プルと組み合わされて、合計で96個のサンプルとな
る。また、最後に収集された80個のサンプルの中か
ら、その中の最後の16個のサンプルが次のフレームを
計算するときに使われるべく記憶される。
に、窓掛けブロック10において96個のサンプル値か
ら成る窓が乗算される。図7に示されているように、窓
の始めの8個の値は窓の立ち上がり部 IU を形成し、終
わりの8個の値は窓の立ち下がり部 ID を形成する。窓
I(n) を次のように定義することができ、そしてブロッ
ク11(図6)において実施される:
施することはデジタル信号処理として当業者には従来か
ら知られていることである。この窓掛けでは、中央の8
0個の値(n = 8,..,87 即ち中央の部分 IM )は1に等
しいので、それらを乗算しても結果は変わらないから乗
算を省略することができる。従って窓の始めの8個のサ
ンプルと終わりの8個のサンプルとを乗算するだけでよ
い。FFTの長さは2の累乗でなければならないので、
ブロック12(図6)においてブロック11から得られ
た96個のサンプルの終わりに32個の「0」が付加さ
れ、128個のサンプルから成る音声フレームとなる。
サンプル列の終わりにサンプルを付加することは単純な
操作であって、ブロック12をデジタル的に実現するこ
とは当業者の技術の範囲内のことである。
た後、ブロック20で高速フーリエ変換FFTを用いて
音声フレームのスペクトルが計算される。FFTブロッ
ク20に到達したフレームの中のサンプル x(0), x
(1),.., x(n); n = 127 (即ち前記の128個のサンプ
ル)は実(real) FFT(高速フーリエ変換)により周
波数領域へ変換されて周波数領域サンプル X(0), X
(1),.., X(f); f = 64(より一般的には f=(n+1)/2)と
なり、その各サンプルは実数成分 Xr(f) と虚数成分 X
i(f) とから成る:
ことは当業者にとっては従来公知のことである。FFT
から得られた実数成分及び虚数成分は平方ブロック(sq
uaring block) 50において二乗されて対をなして加え
合わされ、その出力は音声フレームのパワースペクトル
である。FFTの長さが128であるならば、得られる
パワースペクトル成分の数は65であり、これはFFT
変換の長さを2で割り、その結果を1だけ大きくする
(インクリメントする)ことにより得られる、即ち(F
FTの長さ/2)+1である。従って、パワースペクト
ルは、実数成分及び虚数成分の2乗の和を成分毎に計算
することにより平方ブロック50から得られる:
ているように、実数成分及び虚数成分を平方ブロック
(squaring blocks)51及び52(これらは、デジタル
的に実行されるものとして従来公知の単純な数学的平方
の計算を実行する)に入力し、その平方された各成分を
総和ユニット(summing unit) 53で合計することによ
り実現されることができる。この様にして、平方ブロッ
ク50の出力として、パワースペクトル成分 P(0), P
(1),.., P(f); f = 64が得られ、これらのパワースペク
トル成分は、次に述べるように時間領域信号の種々の周
波数での成分の各パワーに対応する(8kHzのサンプ
リング速度が使用されるものとする): f = 0,...,64の値についての P(f) は中間周波数(f ・4000/64 Hz) に対応す る。 (4)
ースペクトル成分、即ちパワースペクトル成分結合 S
(s), s = 0,..,7 が形成され、それらは本明細書では計
算スペクトル成分と呼ばれる。計算スペクトル成分 S
(s) は、次のように常に各計算スペクトル成分 S(s) に
ついて隣り合う7個のパワースペクトル成分 P(f) の合
計を計算することにより形成される:
と総和ユニット62とを使って、カウンタ61に常に7
まで数え上げさせ、カウンタに制御させて総和ユニット
62に常に7個の連続する成分の合計を計算させて出力
として総和(sum)を出させることにより、これを実現す
ることができる。この場合、最低位の結合成分 S(0)は
中間周波数 [62.5 Hz 〜 437.5 Hz]に対応し、最高位の
結合成分 S(7) は中間周波数 [3125 Hz 〜 3500 Hz] に
対応する。これより低い周波数(62.5 Hz より下)や、
これより高い周波数(3500 Hz より上)は、音声につい
ては重要でなくて、無視することができる。
ている様にフィルタ列を用いて入力フレームからパワー
スペクトル成分 P(f) を計算することもできる。このフ
ィルタ列は、問題の周波数帯域をカバーする帯域フィル
タ Hj (z), j = 0,...,7から成る。該フィルタ列は、均
一な帯域幅フィルタであってもよいが、可変帯域幅フィ
ルタからなっていてもよい。効率を改善するために、通
常は該フィルタ列の出力は複数のうちから1個選択され
る(decimated)。フィルタ列のデザイン及びデジタル実
施形態は当業者には従来公知の事項である。各帯域 jの
副帯域(sub−band) サンプル zj (i) は、フィルタ Hj
(z) を用いて入力信号 x(n) から計算される。各帯域の
信号パワーを次のように計算することができる:
数である。
には、デジタル移動電話システムで使われる殆どの音声
コーデックにより計算される線形予測係数(Linear Pre
diction Coefficients (LPC)) を使って計算スペクトル
成分 S(s) を計算することができる。その様な構成が図
5に示されている。LPC係数は線形予測(linear pre
diction)と呼ばれる手法により音声コーデック3で計算
され、そこに線形フィルターが形成される。該フィルタ
ーのLPC係数は直接順序係数 d(i) (directorder co
efficients)であり、これを自己相関係数(autocorrela
tion coefficients) ACF(k)から計算することが
できる。後述するように、直接順序係数d(i) を使って
計算スペクトル成分 S(s) を計算することができる。入
力フレームサンプル x(n) から計算することのできる自
己相関係数ACF(k)を使ってLPC係数を計算する
ことができる。もしLPC係数又はACF(k)係数を
音声コーデックから得ることができないならば、それら
を入力フレームから計算することができる。
ク3で次のように計算される:
PC次数(order)(例えば8)、x(i)は入力フレーム中
のサンプルである。
s filter) のインパルス応答を表すLPC係数 d(i)
を、例えばシュール巡回アルゴリズム(the Schur recu
rsionalgorithm)やレビンソン・ダービンのアルゴリズ
ム(the Levinson-Durbin algorithm)などの従来公知の
方法により自己相関係数ACF(k)から計算すること
ができる。
速フーリエ変換(FFT)を使って下記の式に従ってL
PCの値から所望の周波数での振幅が計算される:
ーが計算される周波数に対応し(即ち、A(k)は周波数 k
/K・fsに対応し、ここで fs はサンプル周波数であ
る)、また、M は短周期分析の次数(order)である。
推定することができる:
あり、k2は周波数帯域のエンド指標(end index)であ
る。
き、それらをメモリ(図示せず)に記憶させておくこと
により、必要な計算ロードを少なくすることができる。
それらの係数を次のように計算することができる:
ACF(0) と掛け合わせることにより、計算スペクトル成
分 S(s) での信号パワーの近似値を計算することができ
る。この逆数を取る計算が必要なのは、線形予測係数が
入力信号の反転スペクトル(inverse spectrum)を表す
からである。ACF(0)は、信号のパワーを表し、式7で計
算される。
nd limits)を定義する特定の定数 k1 及び k2 を用いて
計算される。以上、パワー(計算)スペクトル成分 S
(s) を計算する種々の方法を説明した。
声を検出しないときに推定ブロック80(図11により
詳しく示されている)で雑音のスペクトル N(s), s =
0,..,7 が推定される。推定はブロック80においてブ
ロック6から入力された信号の各スペクトル成分 S(s),
s = 0,..,7 について時間平均された平均値を巡回的に
計算することにより実行される:
いるようにメモリ83から得られる前のフレームについ
て計算された雑音スペクトル推定値を意味し、Nn (s)
は上の式による現在のフレーム(n = フレーム順序番
号)についての推定値を意味する。この計算はブロック
81で好ましくはデジタル的に実行される。このブロッ
クへの入力は、ブロック6からのスペクトル成分 S(s)
と、メモリ83から得られる前のフレームについての推
定値Nn-1(s)と、ブロック82で計算される時定数変数
λ(s) の値とである。入力スペクトル成分が雑音推定値
Nn-1(s)成分より低い S(s) であるときに、より速い時
定数を使って更新を行うことができる。変数λ(s) の値
は次の表(λ(s) の代表的な値)に従って決定される:
く説明する。
のフレームについて計算された雑音スペクトル推定用に
用いられる。上記の推定による計算は好ましくはデジタ
ル的に実行される。上記の式に従ってデジタル的に乗
算、加算及び減算を行うことは当業者に周知されている
ことである。
スペクトル S(s) 及び雑音スペクトル N(s) から比 SNR
(s), s = 0,..,7 が成分毎に計算され、この比は信号対
雑音比と呼ばれる:
成分の各周波数帯域についての一種の音声活性判定を表
す。信号対雑音比 SNR(s) から、その周波数帯域信号が
音声又は雑音を含むか否か判定することができ、従って
これは音声活性(voice activity) を表す。計算ブロッ
ク90も好ましくはデジタル的に実現され、上記の割り
算を実行する。割り算をデジタル的に実行する方法自体
は当業者に従来から知られている。
される。このブロックは図10に詳しく示されており、
ここでパワースペクトル推定値 S(s), s = 0,..,7 を用
いて音声についての時間平均された平均値(ロ)が計算
される。音声が検出されたとき、時間平均された平均値
(ロ)は更新される。始めに現在のフレームでのパワー
スペクトル成分の平均値(ハ)がブロック71で計算さ
れ、このブロック71に次のようにブロック60からス
ペクトル成分 S(s) が入力として与えられる:
(ロ)は、前のフレームの時に計算された時間平均され
た平均値が記憶されているメモリ78から得られる前の
フレームについての時間平均された平均値(ニ)と、ブ
ロック71から得られる計算スペクトル平均値(ハ)
と、前もってメモリ79aに記憶されている時定数αと
に基づいて(例えば巡回的に)計算されることにより得
られる:
数であり、その値は 0.0〜 1.0であり、通常は 0.9〜
1.0である。時間平均された平均値に非常に弱い音声
(例えば文の終わりで)を含ませないために、現在のフ
レームについての各スペクトル成分の平均値が時間平均
された平均値に依存する閾値を上回る場合に限ってそれ
は更新される。この閾値は通常は時間平均された平均値
の1/4である。前の2つの式の計算は好ましくはデジ
タル的に実行される。
値(ホ)は、雑音のパワースペクトル推定値 N(s), s =
0,..,7 及び次の式に従ってそれから計算される成分平
均値(ヘ)を用いて計算ブロック73から得られる:
通常は 0.9と 1.0との間である。雑音パワーの時間平均
された平均値は各フレームにおいて更新される。雑音ス
ペクトル成分の平均値(へ)は、スペクトル成分 N(s)
に基づいて、ブロック76で次のようにして計算され
る:
フレームについての雑音パワーの時間平均された平均値
(ト)がメモリ74から得られる。相対雑音レベルη
は、雑音及び音声の時間平均された各平均値のスケーリ
ングされ(scaled)且つ最大値を限定された商(maximum
limited quotient) としてブロック75で計算され
る:
リング定数(scaling constant) であり(代表的な値は
4.0)、 max ηはメモリ79bに記憶されている相対
雑音レベルの最大値(代表的な値は 1.0)である。
に、VAD判定ブロック110で信号対雑音比 SNR(s)
を利用して入力信号と雑音モデルとの間の距離DSNR が
計算され、それはデジタル計算により次の式を実現す
る:
分及び最高周波数成分の指標値(index values) であ
り、υs は成分重み付け係数であり、これらは予め決め
られて前もってメモリに記憶され、そこからそれらは計
算のために検索される。通常は、全ての信号対雑音推定
値成分が使われ(s l = 0及び s h= 7) であり、それら
に等しい重みが付けられる:υs = 1.0/8.0; s =
0,.., 7 。
ク110の実施例を詳しく解説する。音声活性検出器に
おける総和ユニット(summing unit) 111は、種々の
周波数帯域から得られる信号対雑音比 SNR(s) の値を合
計し、それにより、入力信号と雑音モデルとの間のスペ
クトル距離を表すパラメータDSNR が上記の式(19)
に従って得られ、総和ユニット111からの値DSNR は
比較ユニット112で所定の閾値 vthと比較される。閾
値 vthの方が小さければ、そのフレームは音声を含むと
見なされる。信号対雑音比が良好であると期待すること
のできる周波数に一層大きな重みが付けられるように、
合計の計算(summing)に重み付けを行うこともできる。
音声活性検出器の出力及び判定を変数Vind で表すこと
ができ、その値について下記の条件が得られる:
推定値 N(s) の更新を制御し、後者はそれに代わって上
記したように音声活性検出器の機能に影響を及ぼすの
で、もし背景雑音(暗騒音)レベルが急に増大すると雑
音及び音声の両方が音声と指摘される可能性がある(V
ind = 1)。このことは、更に背景スペクトル推定値 N
(s) の更新が禁止されることになる。それを防止するた
めに、その間は連続するフレームが音声を含んでいない
と見なされる時間(フレームの個数)が監視される。安
定していて、有声と指摘されない連続するフレームは音
声を含んでいないものとされる。
analysis)とも呼ばれる長周期予測(Long Term Predic
tion (LTP)) 分析が計算される。有声検出は長周期予測
パラメータを用いて行われる。長周期予測パラメータ
は、遅れ(即ちピッチ周期)と長周期予測利得(long t
erm predictor gain) とである。これらのパラメータは
殆どの音声コーデック(符号器を含む)で計算される。
よって音声コーデックの他に音声活性検出器を使用する
ならば(図5に記載されているように)、それらのパラ
メータを音声コーデックから得ることができる。
長周期予測分析を計算することができ、或いは入力フレ
ーム長をサブフレームに分割し(例えば4サブフレー
ム、4・M = N )、長周期パラメータを各サブフレーム
から別々に計算することもできる。入力フレームのこれ
らのサブフレームへの分割はLTP分析ブロック7(図
2)で行われる。該サブフレーム・サンプルは xs(i)で
表される。
ーム・サンプル xs(i)から自己相関R(l) が計算され
る:
最後の Lmax 個のサンプルを保存しておかなければなら
ない。
ような最大値 Rmax を探す。ここでl = 40,..., 160で
ある。
LTP lag(j)は、Rmaxに対応する指標(index) lであ
る。変数 jはサブフレームの指標(index)を表す(j =
0...3)。
きる: LTP gain(j) = Rmax/Rtot ここで
gain(j) )を合計することによってフレームの長周期
予測の遅れ利得(LTP gain sum )を表すパラメータを
計算することができる:
lag より大きければ、そのフレームは有声であるとされ
る:
うに平均雑音スペクトル推定値 NA(s)が計算される:
る。
トル推定値 S(s) との間のスペクトル距離 Dもブロック
100で次のように計算される:
周波数帯域での雑音スペクトル又は信号スペクトルが低
いときに割り算の結果を小さく保つために使われる。
より大きければ、定常度カウンタ stat cnt は 0にセ
ットされる。もしスペクトル距離 Dが閾値 Dlim より小
さくて、信号が有声とは検出されなければ(voiced =
0)、定常度カウンタの値が増やされる(インクリメン
トされる)。定常度カウンタについて下記の条件が受け
入れられる:
これは次の条件に合致するようにV ind の値が 0になる
と、 0にリセットされる:
閾値 max spf (その値は例えば50である)より大き
ければ、STcount の値は1にセットされる。これにより
カウンタ値stat cnt との関連で出力STcount に関して
下記の条件が与えられる:
N(s) の精度は、相対雑音レベルη(これはブロック7
0で計算される)を利用して音声活性検出器の前記閾値
vthを調整することにより改善される。信号対雑音比が
非常に良好である(或いは相対雑音レベルηが低い)よ
うな環境では、相対雑音レベルηに基づいて閾値 vthの
値が大きくされる。これにより、背景雑音(暗騒音)の
急激な変化を音声と解釈することが少なくなる。閾値 v
thの適応化は下記の式に従ってブロック113で実行さ
れる:
の定数であり、それらの代表的な値は例えば次の通りで
ある: vth fix1 = 2.5;vth min1 = 2.0;vth slope1 =
8.0。
確率を低くするために閾値が低くされる。そのとき、閾
値 vth を低くするために次のように雑音スペクトル成
分の平均値(チ)が使われる:
よって、もし雑音スペクトル成分の平均値(チ)が充分
に大きければ、閾値 vth2 は閾値 vth1 より小さい。
されるようにして本発明の音声活性検出器を改善するこ
ともできる。これにより、音声がゆっくりと静かになっ
てゆくときに音声の終わりが雑音と解される可能性が無
くなるので、動作が改善する。この付加的な閾値適応化
を下記のようにように(ブロック113で)実施するこ
とができる。
最大値(代表的には5)及び最小値(代表的には2)の
間に限定する:
計算する:
e minimum scaler value) (代表的には 0.5)及び最大
スケーラ値(the maximum scaler value)(代表的には
1)である。
(n)は、値を増減するために種々の時定数を有するフィ
ルターで ta0を平滑化することにより計算される。この
平滑化を下記の式に従って実行することができる:
(増加期間(increase period);代表的な値は 0.9)及
びリリース時定数(減少期間(decrease period);代表
的な値は 0.5)である。最後に、スケーラ ta(n)を用い
て、新しいVAD閾値 vthを得るために閾値 vthをスケ
ーリングすることができ、これにより次のようになる:
題は、音声のちょうど始まりの時には音声が直ぐには検
出されず、また音声の終わりも正しく検出されないとい
うことである。そのために暗騒音推定値 N(s) が誤った
値となり、そのために音声活性検出器の後の結果に影響
が及ぶことになる。遅延を用いて暗騒音推定値を更新す
ることにより、この問題を無くすることができる。この
場合、暗騒音推定値 N(s) を更新する前に最後のフレー
ムの或る数 N(例えば N = 2)のパワースペクトル(こ
こでは計算スペクトル)S1(s),..., SN (s) が記憶され
る(例えば、図11には示されていない、ブロック80
の入力に設けられるバッファに)。もし最後の2倍の量
のフレームの間に(即ち 2・N 個のフレームの間に)音
声活性検出器が音声を検出していなければ暗騒音推定値
N(s) はメモリの中の最も古いパワースペクトル S1(s)
で更新され、その他の場合には更新は行われない。これ
により、更新時に使用されるフレームの前後の N個のフ
レームが雑音であったことが保証される。
局や移動通信システム(例えば基地局の)などの通信装
置に用いるのに特に適しており、この方法及び装置は特
定のアーキテクチャ(TDMA、CDMA、デジタル/
アナログ)に限定されない。図13は本発明の移動局を
示しており、これに本発明の音声活性検出方法が採用さ
れている。マイクロホン1から出る送信されるべき音声
信号はA/D変換器2でサンプリングされ、音声コーデ
ック3で音声符号化され、その後に基本周波数信号処理
(例えばチャネル符号化、インタリーブなど)、混合及
び無線周波数への変調及び送信がブロックTXで行われ
る。音声活性検出器4(VAD)を使って、該VADの
出力Vind に従ってブロックTXを制御することにより
不連続送信を制御することができる。移動局がエコー及
び/又は雑音消去装置(キャンセラ)ENCを含んでい
るならば、本発明のVAD4をブロックENCを制御す
るためにも使うことができる。ブロックTXから信号は
複式フィルターDPLX及びアンテナANTを通して送
信される。受信された音声に対して受信部RXの公知の
動作が受信時に行われて、その音声はスピーカー9を通
して再生される。VAD4を使って受信部RXの如何な
る動作も、例えばエコー消去と関連して、制御すること
ができる。
に開示した。本発明は、ここに開示した実施例の細目に
限定されるものではなく、本発明の範囲から逸脱せずに
他の形で本発明を実施し得ることは当業者には明かであ
る。ここに開示した実施例は単なる例に過ぎず、発明を
限定するものではないと解されるべきである。従って本
発明を実施し使用する可能性は特許請求の範囲の請求項
のみにより限定される。各請求項により定義される発明
を実施するための、均等実施態様を含む種々の選択肢が
本発明の範囲に含まれる。
況を示すブロック図である。
ある。
様を示す図である。
を示す図である。
る。
ある。
レームを示す図である。
である。
実施態様を示す図である。
である。
ク図である。
Claims (10)
- 【請求項1】 入力信号(x(n))中の音声活性を検出する
ための手段と、 その検出に基づいて音声活性判定(Vind )を行うため
の手段とを有する音声活性検出装置において、 前記入力信号(x(n))を特定の周波数帯域を表すサブ信
号(S(s))に分割するための手段(6)と、 該サブ信号中の雑音(N(s))を推定するための手段(8
0)と、 該サブ信号中の雑音に基づいて副判定信号(SNR(s))を
計算するための手段(90)と、 該副判定信号に基づいて該入力信号について音声活性判
定(Vind )を行うための手段(110)とをそなえる
ことを特徴とする音声活性検出装置。 - 【請求項2】 各サブ信号について信号対雑音比(SNR)
を計算し、前記信号対雑音比を副判定信号(SNR(s))と
して供給するための手段(90)をそなえる、請求項1
に記載の音声活性検出装置。 - 【請求項3】 入力信号について音声活性判定
(Vind )を行うための手段(110)は、前記信号対
雑音比(SNR(s))に基づいて値(DSNR )を生成するた
めの手段(111)と、前記の値(DSNR ) を閾値(vt
h)と比較し、前記の比較に基づいて音声活性判定信号
(Vind )を出力するための手段(112)とから成る
請求項2に記載の音声活性検出装置。 - 【請求項4】 入力信号に含まれている雑音成分及び音
声成分の平均レベル(イ)を決定するための手段(7
0)と、雑音成分及び音声成分の平均レベル(イ)に基
づいて前記閾値(vth)を調整するための手段(113)
とを有する、請求項1に記載の音声活性検出装置。 【表1】 - 【請求項5】 過去の信号対雑音比(SNR(s))に基づい
て前記閾値(vth)を調整するための手段(113)を有
する、請求項2に記載の音声活性検出装置。 - 【請求項6】 前記音声活性検出装置は、推定された雑
音の値(N(s))を記憶するための手段(80)を有し、
前記雑音(N(s))は過去の及び現在の信号対雑音比(SN
R(s))に依存して過去のサブ信号(S(s))で更新され
る、請求項2に記載の音声活性検出装置。 - 【請求項7】 入力信号(x(n))に基づいて線形予測係
数を計算するための手段(3)と、前記線形予測係数に
基づいて前記サブ信号(S(s))を計算するための手段
(8)とを有する、請求項1に記載の音声活性検出装
置。 - 【請求項8】 長周期予測分析を計算し、長周期予測利
得(LTP gain sum)を含む長周期予測パラメータを生成
するための手段(7)と、 前記長周期予測利得を閾値(thr lag)と比較するための
手段(7)と、 前記比較に基づいて有声検出判定を生成するための手段
とを有する、請求項1に記載の音声活性検出装置。 - 【請求項9】 音声メッセージ(x(n))中の音声活性を
検出するための手段と、 その検出に基づいて音声活性判定(Vind )を行うため
の手段とを有する、音声メッセージを送受信するための
移動局において、 前記音声メッセージ(x(n))を特定の周波数帯域を表す
サブ信号(S(s))に分割するための手段(6)と、 該サブ信号中の雑音(N(s))を推定するための手段(8
0)と、 該サブ信号中の雑音に基づいて副判定信号(SNR(s))を
計算するための手段(90)と、 該副判定信号に基づいて入力信号について音声活性判定
(Vind )を行うための手段(110)とをそなえるこ
とを特徴とする移動局。 - 【請求項10】 入力信号(x(n))を受信し、 該入力信号中の音声活性を検出し、 その検出に基づいて音声活性判定(Vind )を行う(1
10)各ステップを有する、通信装置における音声活性
を検出する方法において、 前記入力信号を特定の周波数帯域を表すサブ信号(S
(s))に分割し(6)、 該サブ信号中の雑音(N(s))を推定し、 該サブ信号中の雑音に基づいて副判定信号(SNR(s))を
計算し(90)、 該副判定信号に基づいて該入力信号についての音声活性
判定(Vind )を行う(110)各ステップをそなえる
ことを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI955947A FI100840B (fi) | 1995-12-12 | 1995-12-12 | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
FI955947 | 1995-12-12 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007051941A Division JP2007179073A (ja) | 1995-12-12 | 2007-03-01 | 音声活性検出装置及び移動局並びに音声活性検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09212195A true JPH09212195A (ja) | 1997-08-15 |
Family
ID=8544524
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8331874A Withdrawn JPH09212195A (ja) | 1995-12-12 | 1996-12-12 | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JP33223796A Expired - Lifetime JP4163267B2 (ja) | 1995-12-12 | 1996-12-12 | 雑音抑圧器及び移動局並びに雑音抑圧方法 |
JP2007051941A Withdrawn JP2007179073A (ja) | 1995-12-12 | 2007-03-01 | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JP2008184572A Expired - Lifetime JP5006279B2 (ja) | 1995-12-12 | 2008-07-16 | 音声活性検出装置及び移動局並びに音声活性検出方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33223796A Expired - Lifetime JP4163267B2 (ja) | 1995-12-12 | 1996-12-12 | 雑音抑圧器及び移動局並びに雑音抑圧方法 |
JP2007051941A Withdrawn JP2007179073A (ja) | 1995-12-12 | 2007-03-01 | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JP2008184572A Expired - Lifetime JP5006279B2 (ja) | 1995-12-12 | 2008-07-16 | 音声活性検出装置及び移動局並びに音声活性検出方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US5963901A (ja) |
EP (2) | EP0790599B1 (ja) |
JP (4) | JPH09212195A (ja) |
AU (2) | AU1067897A (ja) |
DE (2) | DE69630580T2 (ja) |
FI (1) | FI100840B (ja) |
WO (2) | WO1997022117A1 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001222298A (ja) * | 2000-02-10 | 2001-08-17 | Mitsubishi Electric Corp | 音声符号化方法および音声復号化方法とその装置 |
JP2002533772A (ja) * | 1998-12-21 | 2002-10-08 | クゥアルコム・インコーポレイテッド | 可変レートスピーチコーディング |
JP2002538514A (ja) * | 1999-03-05 | 2002-11-12 | パナソニック テクノロジーズ, インコーポレイテッド | 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法 |
JP2005189518A (ja) * | 2003-12-25 | 2005-07-14 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
JP2005215204A (ja) * | 2004-01-28 | 2005-08-11 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
WO2006082636A1 (ja) * | 2005-02-02 | 2006-08-10 | Fujitsu Limited | 信号処理方法および信号処理装置 |
WO2007017993A1 (ja) * | 2005-07-15 | 2007-02-15 | Yamaha Corporation | 発音期間を特定する音信号処理装置および音信号処理方法 |
JP2008170806A (ja) * | 2007-01-12 | 2008-07-24 | Yamaha Corp | 発音期間を特定する音信号処理装置およびプログラム |
WO2009145192A1 (ja) * | 2008-05-28 | 2009-12-03 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
WO2011077924A1 (ja) * | 2009-12-24 | 2011-06-30 | 日本電気株式会社 | 音声検出装置、音声検出方法、および音声検出プログラム |
Families Citing this family (191)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69716266T2 (de) * | 1996-07-03 | 2003-06-12 | British Telecommunications P.L.C., London | Sprachaktivitätsdetektor |
US6744882B1 (en) * | 1996-07-23 | 2004-06-01 | Qualcomm Inc. | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone |
US6510408B1 (en) * | 1997-07-01 | 2003-01-21 | Patran Aps | Method of noise reduction in speech signals and an apparatus for performing the method |
FR2768544B1 (fr) * | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de detection d'activite vocale |
FR2768547B1 (fr) * | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
CN1494055A (zh) * | 1997-12-24 | 2004-05-05 | ������������ʽ���� | 声音编码方法和声音译码方法以及声音编码装置和声音译码装置 |
US6023674A (en) * | 1998-01-23 | 2000-02-08 | Telefonaktiebolaget L M Ericsson | Non-parametric voice activity detection |
FI116505B (fi) | 1998-03-23 | 2005-11-30 | Nokia Corp | Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä |
US6182035B1 (en) | 1998-03-26 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for detecting voice activity |
US6067646A (en) * | 1998-04-17 | 2000-05-23 | Ameritech Corporation | Method and system for adaptive interleaving |
US6175602B1 (en) * | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
JPH11344999A (ja) * | 1998-06-03 | 1999-12-14 | Nec Corp | ノイズキャンセラ |
JP2000047696A (ja) * | 1998-07-29 | 2000-02-18 | Canon Inc | 情報処理方法及び装置、その記憶媒体 |
US6272460B1 (en) * | 1998-09-10 | 2001-08-07 | Sony Corporation | Method for implementing a speech verification system for use in a noisy environment |
US6188981B1 (en) * | 1998-09-18 | 2001-02-13 | Conexant Systems, Inc. | Method and apparatus for detecting voice activity in a speech signal |
US6108610A (en) * | 1998-10-13 | 2000-08-22 | Noise Cancellation Technologies, Inc. | Method and system for updating noise estimates during pauses in an information signal |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
FI114833B (fi) * | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
FI118359B (fi) * | 1999-01-18 | 2007-10-15 | Nokia Corp | Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin |
US6604071B1 (en) * | 1999-02-09 | 2003-08-05 | At&T Corp. | Speech enhancement with gain limitations based on speech activity |
US6556967B1 (en) * | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
US6618701B2 (en) | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6349278B1 (en) | 1999-08-04 | 2002-02-19 | Ericsson Inc. | Soft decision signal estimation |
SE514875C2 (sv) | 1999-09-07 | 2001-05-07 | Ericsson Telefon Ab L M | Förfarande och anordning för konstruktion av digitala filter |
US7161931B1 (en) * | 1999-09-20 | 2007-01-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
FI19992453A (fi) * | 1999-11-15 | 2001-05-16 | Nokia Mobile Phones Ltd | Kohinanvaimennus |
FI116643B (fi) | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
JP3878482B2 (ja) * | 1999-11-24 | 2007-02-07 | 富士通株式会社 | 音声検出装置および音声検出方法 |
US7263074B2 (en) * | 1999-12-09 | 2007-08-28 | Broadcom Corporation | Voice activity detection based on far-end and near-end statistics |
US6885694B1 (en) | 2000-02-29 | 2005-04-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Correction of received signal and interference estimates |
US6671667B1 (en) * | 2000-03-28 | 2003-12-30 | Tellabs Operations, Inc. | Speech presence measurement detection techniques |
US7225001B1 (en) | 2000-04-24 | 2007-05-29 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for distributed noise suppression |
DE10026872A1 (de) * | 2000-04-28 | 2001-10-31 | Deutsche Telekom Ag | Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector) |
JP4580508B2 (ja) * | 2000-05-31 | 2010-11-17 | 株式会社東芝 | 信号処理装置及び通信装置 |
US7035790B2 (en) * | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
US7010483B2 (en) * | 2000-06-02 | 2006-03-07 | Canon Kabushiki Kaisha | Speech processing system |
US20020026253A1 (en) * | 2000-06-02 | 2002-02-28 | Rajan Jebu Jacob | Speech processing apparatus |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US6741873B1 (en) * | 2000-07-05 | 2004-05-25 | Motorola, Inc. | Background noise adaptable speaker phone for use in a mobile communication device |
US6898566B1 (en) | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US7457750B2 (en) | 2000-10-13 | 2008-11-25 | At&T Corp. | Systems and methods for dynamic re-configurable speech recognition |
US20020054685A1 (en) * | 2000-11-09 | 2002-05-09 | Carlos Avendano | System for suppressing acoustic echoes and interferences in multi-channel audio systems |
US6707869B1 (en) * | 2000-12-28 | 2004-03-16 | Nortel Networks Limited | Signal-processing apparatus with a filter of flexible window design |
JP4282227B2 (ja) | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US20020103636A1 (en) * | 2001-01-26 | 2002-08-01 | Tucker Luke A. | Frequency-domain post-filtering voice-activity detector |
US20030004720A1 (en) * | 2001-01-30 | 2003-01-02 | Harinath Garudadri | System and method for computing and transmitting parameters in a distributed voice recognition system |
US7013273B2 (en) * | 2001-03-29 | 2006-03-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition based captioning system |
FI110564B (fi) * | 2001-03-29 | 2003-02-14 | Nokia Corp | Järjestelmä automaattisen kohinanvaimennuksen (ANC) kytkemiseksi päälle ja poiskytkemiseksi matkapuhelimessa |
US20020147585A1 (en) * | 2001-04-06 | 2002-10-10 | Poulsen Steven P. | Voice activity detection |
FR2824978B1 (fr) * | 2001-05-15 | 2003-09-19 | Wavecom Sa | Dispositif et procede de traitement d'un signal audio |
US7031916B2 (en) * | 2001-06-01 | 2006-04-18 | Texas Instruments Incorporated | Method for converging a G.729 Annex B compliant voice activity detection circuit |
DE10150519B4 (de) * | 2001-10-12 | 2014-01-09 | Hewlett-Packard Development Co., L.P. | Verfahren und Anordnung zur Sprachverarbeitung |
US7299173B2 (en) * | 2002-01-30 | 2007-11-20 | Motorola Inc. | Method and apparatus for speech detection using time-frequency variance |
US6978010B1 (en) | 2002-03-21 | 2005-12-20 | Bellsouth Intellectual Property Corp. | Ambient noise cancellation for voice communication device |
JP3946074B2 (ja) * | 2002-04-05 | 2007-07-18 | 日本電信電話株式会社 | 音声処理装置 |
US7116745B2 (en) * | 2002-04-17 | 2006-10-03 | Intellon Corporation | Block oriented digital communication system and method |
DE10234130B3 (de) * | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
US7146315B2 (en) * | 2002-08-30 | 2006-12-05 | Siemens Corporate Research, Inc. | Multichannel voice detection in adverse environments |
US7146316B2 (en) * | 2002-10-17 | 2006-12-05 | Clarity Technologies, Inc. | Noise reduction in subbanded speech signals |
US7343283B2 (en) * | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
DE10251113A1 (de) * | 2002-11-02 | 2004-05-19 | Philips Intellectual Property & Standards Gmbh | Verfahren zum Betrieb eines Spracherkennungssystems |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8073689B2 (en) * | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
KR100506224B1 (ko) * | 2003-05-07 | 2005-08-05 | 삼성전자주식회사 | 이동 통신 단말기에서 노이즈 제어장치 및 방법 |
US20040234067A1 (en) * | 2003-05-19 | 2004-11-25 | Acoustic Technologies, Inc. | Distributed VAD control system for telephone |
JP2004356894A (ja) * | 2003-05-28 | 2004-12-16 | Mitsubishi Electric Corp | 音質調整装置 |
US6873279B2 (en) * | 2003-06-18 | 2005-03-29 | Mindspeed Technologies, Inc. | Adaptive decision slicer |
GB0317158D0 (en) * | 2003-07-23 | 2003-08-27 | Mitel Networks Corp | A method to reduce acoustic coupling in audio conferencing systems |
US7133825B2 (en) * | 2003-11-28 | 2006-11-07 | Skyworks Solutions, Inc. | Computationally efficient background noise suppressor for speech coding and speech recognition |
JP4497911B2 (ja) * | 2003-12-16 | 2010-07-07 | キヤノン株式会社 | 信号検出装置および方法、ならびにプログラム |
KR101058003B1 (ko) * | 2004-02-11 | 2011-08-19 | 삼성전자주식회사 | 소음 적응형 이동통신 단말장치 및 이 장치를 이용한통화음 합성방법 |
KR100677126B1 (ko) * | 2004-07-27 | 2007-02-02 | 삼성전자주식회사 | 레코더 기기의 잡음 제거 장치 및 그 방법 |
FI20045315A (fi) * | 2004-08-30 | 2006-03-01 | Nokia Corp | Ääniaktiivisuuden havaitseminen äänisignaalissa |
FR2875633A1 (fr) * | 2004-09-17 | 2006-03-24 | France Telecom | Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
CN1763844B (zh) * | 2004-10-18 | 2010-05-05 | 中国科学院声学研究所 | 基于滑动窗口的端点检测方法、装置和语音识别系统 |
KR100677396B1 (ko) * | 2004-11-20 | 2007-02-02 | 엘지전자 주식회사 | 음성인식장치의 음성구간 검출방법 |
FR2882458A1 (fr) * | 2005-02-18 | 2006-08-25 | France Telecom | Procede de mesure de la gene due au bruit dans un signal audio |
WO2006104576A2 (en) * | 2005-03-24 | 2006-10-05 | Mindspeed Technologies, Inc. | Adaptive voice mode extension for a voice activity detector |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8170875B2 (en) * | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
JP4395772B2 (ja) * | 2005-06-17 | 2010-01-13 | 日本電気株式会社 | ノイズ除去方法及び装置 |
DE102006032967B4 (de) * | 2005-07-28 | 2012-04-19 | S. Siedle & Söhne Telefon- und Telegrafenwerke OHG | Hausanlage und Verfahren zum Betreiben einer Hausanlage |
GB2430129B (en) * | 2005-09-08 | 2007-10-31 | Motorola Inc | Voice activity detector and method of operation therein |
US7813923B2 (en) * | 2005-10-14 | 2010-10-12 | Microsoft Corporation | Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset |
US7565288B2 (en) * | 2005-12-22 | 2009-07-21 | Microsoft Corporation | Spatial noise suppression for a microphone array |
JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8204754B2 (en) * | 2006-02-10 | 2012-06-19 | Telefonaktiebolaget L M Ericsson (Publ) | System and method for an improved voice detector |
US8032370B2 (en) | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8934641B2 (en) | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US7680657B2 (en) * | 2006-08-15 | 2010-03-16 | Microsoft Corporation | Auto segmentation based partitioning and clustering approach to robust endpointing |
JP4890195B2 (ja) * | 2006-10-24 | 2012-03-07 | 日本電信電話株式会社 | ディジタル信号分波装置及びディジタル信号合波装置 |
US8069039B2 (en) * | 2006-12-25 | 2011-11-29 | Yamaha Corporation | Sound signal processing apparatus and program |
US8352257B2 (en) * | 2007-01-04 | 2013-01-08 | Qnx Software Systems Limited | Spectro-temporal varying approach for speech enhancement |
EP1947644B1 (en) * | 2007-01-18 | 2019-06-19 | Nuance Communications, Inc. | Method and apparatus for providing an acoustic signal with extended band-width |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
JP5530720B2 (ja) | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
US8612225B2 (en) * | 2007-02-28 | 2013-12-17 | Nec Corporation | Voice recognition device, voice recognition method, and voice recognition program |
KR101009854B1 (ko) * | 2007-03-22 | 2011-01-19 | 고려대학교 산학협력단 | 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치 |
US11856375B2 (en) | 2007-05-04 | 2023-12-26 | Staton Techiya Llc | Method and device for in-ear echo suppression |
US8526645B2 (en) * | 2007-05-04 | 2013-09-03 | Personics Holdings Inc. | Method and device for in ear canal echo suppression |
US10194032B2 (en) | 2007-05-04 | 2019-01-29 | Staton Techiya, Llc | Method and apparatus for in-ear canal sound suppression |
US9191740B2 (en) * | 2007-05-04 | 2015-11-17 | Personics Holdings, Llc | Method and apparatus for in-ear canal sound suppression |
US11683643B2 (en) | 2007-05-04 | 2023-06-20 | Staton Techiya Llc | Method and device for in ear canal echo suppression |
WO2008137870A1 (en) | 2007-05-04 | 2008-11-13 | Personics Holdings Inc. | Method and device for acoustic management control of multiple microphones |
JP4580409B2 (ja) * | 2007-06-11 | 2010-11-10 | 富士通株式会社 | 音量制御装置および方法 |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8374851B2 (en) * | 2007-07-30 | 2013-02-12 | Texas Instruments Incorporated | Voice activity detector and method |
WO2009038136A1 (ja) * | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
US8954324B2 (en) | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
KR101437830B1 (ko) * | 2007-11-13 | 2014-11-03 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8483854B2 (en) * | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
US8223988B2 (en) | 2008-01-29 | 2012-07-17 | Qualcomm Incorporated | Enhanced blind source separation algorithm for highly correlated mixtures |
US8180634B2 (en) * | 2008-02-21 | 2012-05-15 | QNX Software Systems, Limited | System that detects and identifies periodic interference |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8611556B2 (en) * | 2008-04-25 | 2013-12-17 | Nokia Corporation | Calibrating multiple microphones |
US8275136B2 (en) * | 2008-04-25 | 2012-09-25 | Nokia Corporation | Electronic device speech enhancement |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
JP4660578B2 (ja) * | 2008-08-29 | 2011-03-30 | 株式会社東芝 | 信号補正装置 |
JP5103364B2 (ja) | 2008-11-17 | 2012-12-19 | 日東電工株式会社 | 熱伝導性シートの製造方法 |
JP2010122617A (ja) | 2008-11-21 | 2010-06-03 | Yamaha Corp | ノイズゲート、及び収音装置 |
WO2010146711A1 (ja) * | 2009-06-19 | 2010-12-23 | 富士通株式会社 | 音声信号処理装置及び音声信号処理方法 |
GB2473267A (en) | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
GB2473266A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | An improved filter bank |
US8571231B2 (en) | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
EP2491549A4 (en) | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY |
PT2491559E (pt) * | 2009-10-19 | 2015-05-07 | Ericsson Telefon Ab L M | Método e estimador de fundo para a detecção de actividade de voz |
GB0919672D0 (en) | 2009-11-10 | 2009-12-23 | Skype Ltd | Noise suppression |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
JP5424936B2 (ja) * | 2010-02-24 | 2014-02-26 | パナソニック株式会社 | 通信端末及び通信方法 |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US9378754B1 (en) * | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
JP5870476B2 (ja) * | 2010-08-04 | 2016-03-01 | 富士通株式会社 | 雑音推定装置、雑音推定方法および雑音推定プログラム |
CN102971789B (zh) | 2010-12-24 | 2015-04-15 | 华为技术有限公司 | 用于执行话音活动检测的方法和设备 |
EP3493205B1 (en) | 2010-12-24 | 2020-12-23 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting a voice activity in an input audio signal |
US20140006019A1 (en) * | 2011-03-18 | 2014-01-02 | Nokia Corporation | Apparatus for audio signal processing |
US20120265526A1 (en) * | 2011-04-13 | 2012-10-18 | Continental Automotive Systems, Inc. | Apparatus and method for voice activity detection |
JP2013148724A (ja) * | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US9280984B2 (en) * | 2012-05-14 | 2016-03-08 | Htc Corporation | Noise cancellation method |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
CN103730110B (zh) * | 2012-10-10 | 2017-03-01 | 北京百度网讯科技有限公司 | 一种检测语音端点的方法和装置 |
CN103903634B (zh) * | 2012-12-25 | 2018-09-04 | 中兴通讯股份有限公司 | 激活音检测及用于激活音检测的方法和装置 |
US9210507B2 (en) * | 2013-01-29 | 2015-12-08 | 2236008 Ontartio Inc. | Microphone hiss mitigation |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
JP6339896B2 (ja) * | 2013-12-27 | 2018-06-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 雑音抑圧装置および雑音抑圧方法 |
US9978394B1 (en) * | 2014-03-11 | 2018-05-22 | QoSound, Inc. | Noise suppressor |
CN107293287B (zh) * | 2014-03-12 | 2021-10-26 | 华为技术有限公司 | 检测音频信号的方法和装置 |
RU2665916C2 (ru) * | 2014-07-29 | 2018-09-04 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
DE112015003945T5 (de) | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
US9450788B1 (en) | 2015-05-07 | 2016-09-20 | Macom Technology Solutions Holdings, Inc. | Equalizer for high speed serial data links and method of initialization |
JP6447357B2 (ja) * | 2015-05-18 | 2019-01-09 | 株式会社Jvcケンウッド | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム |
US9691413B2 (en) * | 2015-10-06 | 2017-06-27 | Microsoft Technology Licensing, Llc | Identifying sound from a source of interest based on multiple audio feeds |
EP3430821B1 (en) * | 2016-03-17 | 2022-02-09 | Sonova AG | Hearing assistance system in a multi-talker acoustic network |
WO2018152034A1 (en) * | 2017-02-14 | 2018-08-23 | Knowles Electronics, Llc | Voice activity detector and methods therefor |
US10224053B2 (en) * | 2017-03-24 | 2019-03-05 | Hyundai Motor Company | Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering |
US10339962B2 (en) | 2017-04-11 | 2019-07-02 | Texas Instruments Incorporated | Methods and apparatus for low cost voice activity detector |
US10332545B2 (en) * | 2017-11-28 | 2019-06-25 | Nuance Communications, Inc. | System and method for temporal and power based zone detection in speaker dependent microphone environments |
US10911052B2 (en) | 2018-05-23 | 2021-02-02 | Macom Technology Solutions Holdings, Inc. | Multi-level signal clock and data recovery |
CN109273021B (zh) * | 2018-08-09 | 2021-11-30 | 厦门亿联网络技术股份有限公司 | 一种基于rnn的实时会议降噪方法及装置 |
US11005573B2 (en) | 2018-11-20 | 2021-05-11 | Macom Technology Solutions Holdings, Inc. | Optic signal receiver with dynamic control |
US11575437B2 (en) | 2020-01-10 | 2023-02-07 | Macom Technology Solutions Holdings, Inc. | Optimal equalization partitioning |
CN115191090B (zh) | 2020-01-10 | 2024-06-14 | Macom技术解决方案控股公司 | 最佳均衡划分 |
CN111508514A (zh) * | 2020-04-10 | 2020-08-07 | 江苏科技大学 | 基于补偿相位谱的单通道语音增强算法 |
US12013423B2 (en) | 2020-09-30 | 2024-06-18 | Macom Technology Solutions Holdings, Inc. | TIA bandwidth testing system and method |
US11658630B2 (en) | 2020-12-04 | 2023-05-23 | Macom Technology Solutions Holdings, Inc. | Single servo loop controlling an automatic gain control and current sourcing mechanism |
US11616529B2 (en) | 2021-02-12 | 2023-03-28 | Macom Technology Solutions Holdings, Inc. | Adaptive cable equalizer |
CN113707167A (zh) * | 2021-08-31 | 2021-11-26 | 北京地平线信息技术有限公司 | 残留回声抑制模型的训练方法和训练装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
JPS5999497A (ja) * | 1982-11-29 | 1984-06-08 | 松下電器産業株式会社 | 音声認識装置 |
JPS6023899A (ja) * | 1983-07-19 | 1985-02-06 | 株式会社リコー | 音声認識装置における音声切り出し方式 |
JPS61177499A (ja) * | 1985-02-01 | 1986-08-09 | 株式会社リコー | 音声区間検出方式 |
JPH02232697A (ja) * | 1989-03-06 | 1990-09-14 | Nippondenso Co Ltd | 音声認識装置 |
JPH02293797A (ja) * | 1989-05-08 | 1990-12-04 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH02296297A (ja) * | 1989-05-10 | 1990-12-06 | Nec Corp | 音声認識装置 |
JPH0530174A (ja) * | 1991-07-24 | 1993-02-05 | Nec Corp | 車載用音声ダイヤラ |
JPH0635498A (ja) * | 1992-07-16 | 1994-02-10 | Clarion Co Ltd | 音声認識装置及び方法 |
JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4071826A (en) * | 1961-04-27 | 1978-01-31 | The United States Of America As Represented By The Secretary Of The Navy | Clipped speech channel coded communication system |
JPS56104399A (en) * | 1980-01-23 | 1981-08-20 | Hitachi Ltd | Voice interval detection system |
DE3230391A1 (de) * | 1982-08-14 | 1984-02-16 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur signalverbesserung von gestoerten sprachsignalen |
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4630304A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4897878A (en) * | 1985-08-26 | 1990-01-30 | Itt Corporation | Noise compensation in speech recognition apparatus |
US4764966A (en) * | 1985-10-11 | 1988-08-16 | International Business Machines Corporation | Method and apparatus for voice detection having adaptive sensitivity |
US4811404A (en) | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
IL84948A0 (en) | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
GB8801014D0 (en) | 1988-01-18 | 1988-02-17 | British Telecomm | Noise reduction |
US5276765A (en) | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
FI80173C (fi) | 1988-05-26 | 1990-04-10 | Nokia Mobile Phones Ltd | Foerfarande foer daempning av stoerningar. |
US5285165A (en) * | 1988-05-26 | 1994-02-08 | Renfors Markku K | Noise elimination method |
US5027410A (en) * | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
EP0763811B1 (en) * | 1990-05-28 | 2001-06-20 | Matsushita Electric Industrial Co., Ltd. | Speech signal processing apparatus for detecting a speech signal |
US5410632A (en) * | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
JP3176474B2 (ja) * | 1992-06-03 | 2001-06-18 | 沖電気工業株式会社 | 適応ノイズキャンセラ装置 |
DE69331719T2 (de) * | 1992-06-19 | 2002-10-24 | Agfa-Gevaert, Mortsel | Verfahren und Vorrichtung zur Geräuschunterdrückung |
FI100154B (fi) * | 1992-09-17 | 1997-09-30 | Nokia Mobile Phones Ltd | Menetelmä ja järjestelmä kohinan vaimentamiseksi |
ES2137355T3 (es) * | 1993-02-12 | 1999-12-16 | British Telecomm | Reduccion de ruido. |
US5533133A (en) * | 1993-03-26 | 1996-07-02 | Hughes Aircraft Company | Noise suppression in digital voice communications systems |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5446757A (en) * | 1993-06-14 | 1995-08-29 | Chang; Chen-Yi | Code-division-multiple-access-system based on M-ary pulse-position modulated direct-sequence |
EP0707763B1 (en) * | 1993-07-07 | 2001-08-29 | Picturetel Corporation | Reduction of background noise for speech enhancement |
US5406622A (en) * | 1993-09-02 | 1995-04-11 | At&T Corp. | Outbound noise cancellation for telephonic handset |
IN184794B (ja) | 1993-09-14 | 2000-09-30 | British Telecomm | |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
PL174216B1 (pl) * | 1993-11-30 | 1998-06-30 | At And T Corp | Sposób redukcji w czasie rzeczywistym szumu transmisji mowy |
US5471527A (en) * | 1993-12-02 | 1995-11-28 | Dsc Communications Corporation | Voice enhancement system and method |
WO1995016259A1 (en) * | 1993-12-06 | 1995-06-15 | Philips Electronics N.V. | A noise reduction system and device, and a mobile radio station |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
US5544250A (en) * | 1994-07-18 | 1996-08-06 | Motorola | Noise suppression system and method therefor |
US5550893A (en) * | 1995-01-31 | 1996-08-27 | Nokia Mobile Phones Limited | Speech compensation in dual-mode telephone |
JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5689615A (en) * | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
-
1995
- 1995-12-12 FI FI955947A patent/FI100840B/fi not_active IP Right Cessation
-
1996
- 1996-11-08 DE DE69630580T patent/DE69630580T2/de not_active Expired - Lifetime
- 1996-11-08 EP EP96117902A patent/EP0790599B1/en not_active Expired - Lifetime
- 1996-11-19 DE DE69614989T patent/DE69614989T2/de not_active Expired - Lifetime
- 1996-11-19 EP EP96118504A patent/EP0784311B1/en not_active Expired - Lifetime
- 1996-12-05 AU AU10678/97A patent/AU1067897A/en not_active Abandoned
- 1996-12-05 AU AU10677/97A patent/AU1067797A/en not_active Abandoned
- 1996-12-05 WO PCT/FI1996/000649 patent/WO1997022117A1/en active Application Filing
- 1996-12-05 WO PCT/FI1996/000648 patent/WO1997022116A2/en active Application Filing
- 1996-12-10 US US08/763,975 patent/US5963901A/en not_active Expired - Lifetime
- 1996-12-10 US US08/762,938 patent/US5839101A/en not_active Expired - Lifetime
- 1996-12-12 JP JP8331874A patent/JPH09212195A/ja not_active Withdrawn
- 1996-12-12 JP JP33223796A patent/JP4163267B2/ja not_active Expired - Lifetime
-
2007
- 2007-03-01 JP JP2007051941A patent/JP2007179073A/ja not_active Withdrawn
-
2008
- 2008-07-16 JP JP2008184572A patent/JP5006279B2/ja not_active Expired - Lifetime
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
JPS5999497A (ja) * | 1982-11-29 | 1984-06-08 | 松下電器産業株式会社 | 音声認識装置 |
JPS6023899A (ja) * | 1983-07-19 | 1985-02-06 | 株式会社リコー | 音声認識装置における音声切り出し方式 |
JPS61177499A (ja) * | 1985-02-01 | 1986-08-09 | 株式会社リコー | 音声区間検出方式 |
JPH02232697A (ja) * | 1989-03-06 | 1990-09-14 | Nippondenso Co Ltd | 音声認識装置 |
JPH02293797A (ja) * | 1989-05-08 | 1990-12-04 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH02296297A (ja) * | 1989-05-10 | 1990-12-06 | Nec Corp | 音声認識装置 |
JPH0530174A (ja) * | 1991-07-24 | 1993-02-05 | Nec Corp | 車載用音声ダイヤラ |
JPH0635498A (ja) * | 1992-07-16 | 1994-02-10 | Clarion Co Ltd | 音声認識装置及び方法 |
JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002533772A (ja) * | 1998-12-21 | 2002-10-08 | クゥアルコム・インコーポレイテッド | 可変レートスピーチコーディング |
JP2013178545A (ja) * | 1998-12-21 | 2013-09-09 | Qualcomm Inc | 可変レートスピーチ符号化 |
JP4927257B2 (ja) * | 1998-12-21 | 2012-05-09 | クゥアルコム・インコーポレイテッド | 可変レートスピーチ符号化 |
JP2011123506A (ja) * | 1998-12-21 | 2011-06-23 | Qualcomm Inc | 可変レートスピーチ符号化 |
JP4745502B2 (ja) * | 1999-03-05 | 2011-08-10 | マツシタ エレクトリック コーポレーション オブ アメリカ | 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法 |
JP2002538514A (ja) * | 1999-03-05 | 2002-11-12 | パナソニック テクノロジーズ, インコーポレイテッド | 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法 |
JP2001222298A (ja) * | 2000-02-10 | 2001-08-17 | Mitsubishi Electric Corp | 音声符号化方法および音声復号化方法とその装置 |
JP2005189518A (ja) * | 2003-12-25 | 2005-07-14 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
US8442817B2 (en) | 2003-12-25 | 2013-05-14 | Ntt Docomo, Inc. | Apparatus and method for voice activity detection |
JP4490090B2 (ja) * | 2003-12-25 | 2010-06-23 | 株式会社エヌ・ティ・ティ・ドコモ | 有音無音判定装置および有音無音判定方法 |
JP2005215204A (ja) * | 2004-01-28 | 2005-08-11 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
JP4601970B2 (ja) * | 2004-01-28 | 2010-12-22 | 株式会社エヌ・ティ・ティ・ドコモ | 有音無音判定装置および有音無音判定方法 |
WO2006082636A1 (ja) * | 2005-02-02 | 2006-08-10 | Fujitsu Limited | 信号処理方法および信号処理装置 |
US8300834B2 (en) | 2005-07-15 | 2012-10-30 | Yamaha Corporation | Audio signal processing device and audio signal processing method for specifying sound generating period |
WO2007017993A1 (ja) * | 2005-07-15 | 2007-02-15 | Yamaha Corporation | 発音期間を特定する音信号処理装置および音信号処理方法 |
JP5388447B2 (ja) * | 2005-07-15 | 2014-01-15 | ヤマハ株式会社 | 発音期間を特定する音信号処理装置および音信号処理方法 |
JP2008170806A (ja) * | 2007-01-12 | 2008-07-24 | Yamaha Corp | 発音期間を特定する音信号処理装置およびプログラム |
WO2009145192A1 (ja) * | 2008-05-28 | 2009-12-03 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
US8589152B2 (en) | 2008-05-28 | 2013-11-19 | Nec Corporation | Device, method and program for voice detection and recording medium |
WO2011077924A1 (ja) * | 2009-12-24 | 2011-06-30 | 日本電気株式会社 | 音声検出装置、音声検出方法、および音声検出プログラム |
JPWO2011077924A1 (ja) * | 2009-12-24 | 2013-05-02 | 日本電気株式会社 | 音声検出装置、音声検出方法、および音声検出プログラム |
JP5621786B2 (ja) * | 2009-12-24 | 2014-11-12 | 日本電気株式会社 | 音声検出装置、音声検出方法、および音声検出プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP0784311B1 (en) | 2001-09-05 |
AU1067897A (en) | 1997-07-03 |
EP0790599A1 (en) | 1997-08-20 |
EP0784311A1 (en) | 1997-07-16 |
DE69630580T2 (de) | 2004-09-16 |
DE69630580D1 (de) | 2003-12-11 |
EP0790599B1 (en) | 2003-11-05 |
WO1997022116A2 (en) | 1997-06-19 |
US5839101A (en) | 1998-11-17 |
AU1067797A (en) | 1997-07-03 |
DE69614989T2 (de) | 2002-04-11 |
FI100840B (fi) | 1998-02-27 |
JP5006279B2 (ja) | 2012-08-22 |
JPH09204196A (ja) | 1997-08-05 |
WO1997022117A1 (en) | 1997-06-19 |
FI955947A (fi) | 1997-06-13 |
JP2008293038A (ja) | 2008-12-04 |
WO1997022116A3 (en) | 1997-07-31 |
JP4163267B2 (ja) | 2008-10-08 |
JP2007179073A (ja) | 2007-07-12 |
DE69614989D1 (de) | 2001-10-11 |
FI955947A0 (fi) | 1995-12-12 |
US5963901A (en) | 1999-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5006279B2 (ja) | 音声活性検出装置及び移動局並びに音声活性検出方法 | |
US9646621B2 (en) | Voice detector and a method for suppressing sub-bands in a voice detector | |
KR100546468B1 (ko) | 잡음 억제 시스템 및 방법 | |
US8135587B2 (en) | Estimating the noise components of a signal during periods of speech activity | |
JP3224132B2 (ja) | 音声活動検出装置 | |
EP0548054B1 (en) | Voice activity detector | |
US20040078199A1 (en) | Method for auditory based noise reduction and an apparatus for auditory based noise reduction | |
EP1806739B1 (en) | Noise suppressor | |
US20050108004A1 (en) | Voice activity detector based on spectral flatness of input signal | |
US20110066429A1 (en) | Voice activity detector and a method of operation | |
US5430826A (en) | Voice-activated switch | |
US8144862B2 (en) | Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation | |
US6633847B1 (en) | Voice activated circuit and radio using same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060530 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060829 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20060829 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060926 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070205 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070315 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070404 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070406 |