JP3992545B2 - 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ - Google Patents
信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ Download PDFInfo
- Publication number
- JP3992545B2 JP3992545B2 JP2002168375A JP2002168375A JP3992545B2 JP 3992545 B2 JP3992545 B2 JP 3992545B2 JP 2002168375 A JP2002168375 A JP 2002168375A JP 2002168375 A JP2002168375 A JP 2002168375A JP 3992545 B2 JP3992545 B2 JP 3992545B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- noise
- energy
- decision
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000000694 effects Effects 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 title claims description 32
- 238000009499 grossing Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 description 16
- 230000007704 transition Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Circuits Of Receivers In General (AREA)
- Communication Control (AREA)
Description
【発明の属する技術分野】
本発明は、改良した音声活動検知装置を含む音声信号コーダ、特に、ITU−T勧告G.729A、補遺Bに準拠するコーダに関する。
【0002】
【従来の技術】
音声信号は、無音または本質的な雑音を60%まで含む。伝送する情報量を減らすために、実際に有効信号を含む音声信号部分と、無音またはノイズしか含まない部分とを区別し、これらをそれぞれ異なる2個のアルゴリズムに従って符号化することが知られており、無音またはノイズしか含まない各部分は、周囲のノイズの特徴を示すごくわずかな情報によって符号化される。このようなコーダは、スペクトル特性と、符号化する音声信号のエネルギー(各信号フレームについて計算される)とによって、上記の区別を実施する音声活動検知装置を含む。
【0003】
音声信号は、たとえば持続時間10msに相当するデジタルフレームに分割される。各フレームに対して、信号から一組のパラメータが抽出される。主なパラメータは、自動相関係数である。線形予測による符号化係数の集合と、一組の周波数パラメータとが、次に自動相関係数から導き出される。実際に有効信号を含む音声部分と、無音またはノイズしか含まない部分とを区別する方法の一つのステップは、信号のフレームエネルギーを閾値と比較する。閾値を計算する装置は、閾値をノイズ変化に適合させる。音声信号を損なうノイズは、電気的なノイズと周囲のノイズとからなる。周囲のノイズは、同一の通信中に著しく増えたり減ったりすることがある。一方、ノイズの周波数フィルタリング係数もまた、それ自体ノイズの変化に適合しなければならない。
【0004】
アディル ベナサンニュ(Adil Benyassine)らによる文献「ITU−T勧告G729補遺B:A Silence CompressionScheme for Use With G729 Optimized for V.70 Digital Simultaneous Voice and Data Applications」、IEEE Communication Magazine、1997年9月は、このようなコーダを記載している。
【0005】
符号化された音声信号を復号するデコーダは、音声として符号化された信号部分と、無音または本質的に雑音として符号化された信号部分とにそれぞれ対応する2個の復号アルゴリズムを選択的に使用しなければならない。あるアルゴリズムから他のアルゴリズムへの移行は、無音期間またはノイズ期間を符号化する情報によって同期される。
【0006】
ITU−T勧告G.729A、補遺B11/96を実装する既知のコーダは、ノイズレベルが、この勧告によって定義された量子化レベルの8000レベルを越えると、もはや有効信号とノイズ信号とを区別できなくなる。その結果、音声活動検知信号の無効な遷移が多数発生し、そのために、有効信号の部分が損失される。
【0007】
G723.1 VADに記載された解決方法は既知であり、SN比が所定値未満であるとき、コーダにおける音声活動の検知を完全に禁止する。この解決方法は、有効信号の完全性を保護するが、トラヒックを増加するという欠点を有する。
【0008】
【発明が解決しようとする課題】
本発明の目的は、トラヒックに関して音声活動検知の有効性を保護し、復号後に再生される信号の品質を損なわない、有効な解決方法を提案することにある。
【0009】
【課題を解決するための手段】
本発明の対象は、信号内の音声活動を検知する方法であり、信号を複数フレームに分割し、この方法は各フレームに対して下される「音声」か「ノイズ」かの最初の決定の平滑化ステップを含み、この平滑化ステップが、フレームnに対して最初の決定が「音声」で、フレームn−2に対して最終決定が「ノイズ」で、フレームn−1のエネルギーが、フレームn−2のエネルギーより大きく、フレームnのエネルギーがフレームn−2のエネルギーより大きい場合、フレームnに対して「音声」の最終決定を下すステップを含むことを特徴とする。
【0010】
このような特徴を持つ方法は、フレームnの間だけ、遷移エネルギーが増える時に、「ノイズ」から「音声」への望ましくない遷移を回避する。何故なら、平滑化機能は、「ノイズ」から「音声」への遷移決定に際して、現行フレームnに先行するフレームn−1に対して下される最終決定だけを考慮するからである。
【0011】
好適な実施形態によれば、フレームnに対して「音声」の最終決定が下された場合、本発明による方法は、iが一定の慣性時間を定義する整数であるとき、さらにフレームn+1からn+iに対して「ノイズ」のあらゆる最終決定を回避することからなる。
【0012】
このような特徴を持つ方法により、言語セグメントの損失現象が回避される。何故なら、平滑化機能は、「ノイズ」決定に戻る場合、i個のフレームの持続時間に対応する一定の慣性を有するからである。
【0013】
本発明はまた、本発明による方法を実施するための平滑化手段を含む音声信号コーダを目的とする。
【0014】
本発明は、以下の説明および添付図面により、いっそう理解され、他の特徴が明らかになるであろう。
【0015】
【発明の実施の形態】
図1に機能的な構成を示したコーダの実施例は、符号化される音声信号をアナログで受信する入力端子1と、音声信号をフィルタリングし、サンプリングし、量子化し、フレームに配置する回路2と、回路2の出力に接続される1個の入力と、2個の出力とを有するスイッチ3と、実際に有効信号を示すものとみなされ、スイッチ3の第一の出力に接続される入力を有するフレーム符号化回路4と、無音またはノイズを示すものとみなされ、スイッチ3の第二の出力に接続される入力を有するフレーム符号化回路5と、回路4の出力と回路5の出力とにそれぞれ接続される第一および第二の入力と、コーダの出力端子を構成する出力端子9とを有する第二のスイッチ6と、回路2の出力に接続される入力と、各スイッチ3、6の制御入力に特に接続される出力とを有し、音声信号内で認識される内容、すなわち有効信号か無音信号(またはノイズ信号)かに対応する符号化フレームを選択する音声活動検知器7とを含む。
【0016】
音声信号が有効信号である場合、コーダは、10ms毎に1個のフレームを供給する。音声信号が、無音信号(またはノイズ信号)から構成される場合、コーダは、無音期間(またはノイズ期間)の冒頭に1つのフレームのみを供給する。
【0017】
実際には、このようなコーダは、適切にプログラミングされたプロセッサによって構成することができる。特に、本発明による方法は、当業者が実現可能なソフトウェアによって実施可能である。
【0018】
図2は、規格G.729補遺B11/96により既知の符号化方法による、「音声」または「ノイズ」の決定のフローチャートである。この方法は、持続時間を10msに固定したデジタル信号フレームに適用される。
【0019】
第一のステップ11は、符号化する信号の現行フレームに対して、全ての周波数帯域におけるこのフレームのエネルギーと、低周波数におけるこのフレームのエネルギーと、一組のスペクトル係数と、ゼロ移行率との4個のパラメータを抽出する。
【0020】
次のステップ12は、バッファメモリの最小サイズを更新する。
【0021】
次のステップ13は、現行フレームの番号と、所定値Niとを比較する。
【0022】
フレームの番号が所定値Ni未満である場合、次のステップ14は、符号化する信号のパラメータのスライド平均値を初期化する。すなわち、スペクトル係数と、全ての帯域における平均エネルギーと、低周波数における平均エネルギーと、平均ゼロ移行率とである。
【0023】
次のステップ15は、フレームのエネルギーを所定の閾値と比較し、フレームのエネルギーがこの閾値より大きい場合、信号が音声に属すると決定し、フレームのエネルギーがこの閾値より低い場合、信号がノイズであると決定する。現行フレームの処理は、そこで、終了16となる。
【0024】
フレームの番号がNi未満でない場合、次のステップ17は、この番号がNiに等しいか、あるいはNiより大きいか決定する。
【0025】
この番号がNiに等しい場合、次のステップ18は、全ての帯域におけるノイズの平均エネルギーの値と、低周波数におけるノイズの平均エネルギーの値とを初期化する。
【0026】
この番号がNiより大きい場合、次のステップ19は、フレームパラメータの現行値をフレームパラメータのスライド平均値から引くことにより、一組のパラメータ差を計算し、フレームパラメータのスライド平均値がノイズを示す。これらのパラメータ差は、スペクトルのひずみ、全ての帯域におけるエネルギー差、低周波におけるエネルギー差、およびゼロ移行率の差である。
【0027】
次のステップ20は、フレームのエネルギーを所定の閾値と比較する。
【0028】
フレームのエネルギーが所定の閾値未満でない場合、ステップ21は、複数の基準に基づいた最初の決定を下し(「音声」か「ノイズ」か)、次のステップ22は、あまりに多数の決定変更を回避するために、この決定を「平滑化」する。
【0029】
フレームのエネルギーが所定の閾値以下である場合、ステップ23は、信号がノイズであると決定し、次のステップ22は、この決定を「平滑化」する。
【0030】
平滑化ステップ22の後、次のステップ24は、現行フレームのエネルギーと、全ての帯域におけるエネルギーのスライド平均にある定数を加えたものに等しい適応閾値とを比較する。
【0031】
現行フレームのエネルギーが閾値より大きい場合、次のステップ25は、ノイズを示すパラメータのスライド平均値を更新し、次いで、現行フレームの処理は、終了26となる。
【0032】
現行フレームのエネルギーが閾値より大きくない場合、現行フレームの処理は、終了27となる。
【0033】
図3は、規格G.729補遺B、11/96により既知の符号化方法による音声活動検知信号の平滑化操作を詳しく示す。この平滑化は、以下の複数の基準に基づいた最初の決定21(「音声」か「ノイズ」か)に続く4個のステップを含む。
【0034】
先行する1個のフレームに対する決定が「音声」であった場合で、現行フレームの平均エネルギーが、先行する複数フレームのエネルギーのスライド平均値にある定数を加えたものより大きい場合、換言すれば、現行フレームのエネルギーが、ノイズの平均エネルギーよりずっと大きい場合、第一のステップは「音声」の決定を下すテスト31からなる。反対の場合には、「ノイズ」の決定42が最終的に下される。
【0035】
先行する2個のフレームに対する決定が「音声」であった場合で、現行フレームの平均エネルギーが先行するフレームのエネルギーのスライド平均にある定数を加えたものより大きい場合、換言すれば、このエネルギーが、先行フレームから現行フレームまでに著しく減少しなかった場合、第二のステップ32から35は「音声」の決定を確認するテスト32からなる。
【0036】
この第二のステップは、さらに、カウンタをインクリメントし(操作33)、その内容を値4と比較し(操作34)、次いで、現行フレームが、「音声」と決定された連続フレームの第四のフレームである場合、次のフレームに対してはテスト32の作動を解除する(操作35)。「音声」の決定が確認されない場合、「ノイズ」の決定42が最終的に下される。
【0037】
現行フレームに先行する10個のフレームに対して「ノイズ」の決定が下された場合(ステップ31から35で現行フレームに対して「音声」の決定が下された場合)で、現行フレームのエネルギーが先行するフレームのエネルギーにある定数を加えたもの未満である場合、換言すれば、エネルギーが先行フレームから現行フレームまでに著しく増加しなかった場合、第三のステップ36から39は最終的に「ノイズ」の決定42を下すテスト36からなる。
【0038】
この第三のステップは、さらに、現行フレームが、「ノイズ」と決定された(テスト38)連続するフレームの10番目のフレームであった場合、フレームのカウントを再初期化することによって(操作39)、テスト36を再初期化する(操作37)。
【0039】
現行フレームのエネルギーが、先行する複数フレームのエネルギースライド平均値の和に定数614を加えたもの未満である場合、第四のステップは最終的に「ノイズ」の決定42を下すテスト40からなる。換言すれば、「音声」の決定が最終的に確認されるのは(操作41)フレームのエネルギーが、先行する複数フレームのエネルギーのスライド平均値よりもずっと大きい場合だけである。そうでない場合、「ノイズ」の決定42が最終的に下される。
【0040】
この第四のステップ40(最終決定)は、信号ノイズが著しい場合、誤った「ノイズ」の決定を供給する。実際、このステップ40は、先行して行われた複数の決定を考慮せずに、先行する複数フレームのエネルギーのスライド平均値に定数614を加えた値とによって示される現行フレームと本質的な雑音とのエネルギー差だけに基づいて、信号がノイズであると決定する。事実、本質的な雑音が大きい場合、この定数614から構成される閾値は、もはや有効ではない。
【0041】
本発明による方法は、平滑化ステップに関して、規格G.279.1、添付B、11/96により既知の方法とは異なる。
【0042】
図4は、本発明による方法における、音声活動検知信号の平滑化の実施例を示すフローチャートである。この平滑化は、複数の基準に基づいた初期の決定21(「音声」または「ノイズ」)に続く4個のステップを含む。この4個のステップの中で、3個のステップ(テスト131、132、136)は、上記の3個のステップ(テスト31、32、36)と同じである。前述の第四のステップ40は、削除されており、いわゆる予備ステップが、上記第一のステップ31の前に付加されている。たとえば、フレームのエネルギーが弱くなるとき、いわゆる慣性カウントが付加され、「音声」の決定を「ノイズ」の決定に変える前に、1フレームの持続時間の5倍に等しい持続時間の慣性を得る。従って、この持続時間は、この例では50msである。こうした慣性カウントは、ノイズの平均エネルギーが、規格G.279.1、添付B、11/96により規定された量子化レベルの8000レベルより大きくなるときしか有効でない。
【0043】
追加される予備ステップ101から104は、ステップ21の最初の決定が「音声」である場合、慣性カウンタを0にリセットし(操作102)、さらにテスト131に移行する。
【0044】
ステップ21の最初の決定が「ノイズ」である場合、現行フレームのエネルギーが固定の閾値より大きいかどうか決定し、また、慣性カウンタの内容が6未満で1より大きいかどうか決定する(操作103)。
【0045】
この二つの条件が満たされる場合、(最初の決定とは相反して)「音声」の決定を下し、次いで、慣性カウンタを1単位インクリメントし(操作104)、さらに、テスト131に移行する。
【0046】
あるいは、これらの条件の一方が満たされない場合、最終的に「ノイズ」の決定を下す(142)。
【0047】
先行する決定が「音声」であり、現行フレームの平均エネルギーが、先行する複数フレームのエネルギーのスライド平均に定数を加えたものより大きい場合、第一のステップは、「音声」の決定を保持するテスト131(テスト31と同じ)からなる。
【0048】
2個の先行フレームに対する決定が「音声」であった場合で、現行フレームの平均エネルギーが、先行する1フレームのエネルギーのスライド平均に定数を加えたものより大きい場合、換言すれば、先行フレームから現行フレームまでエネルギーが著しく減らなかった場合、第二のステップ132から135(ステップ32から35と同じ)は「音声」の決定を下す。
【0049】
この第二のステップ132から135は、さらに、現行フレームが、「音声」と決定された連続する四番目のフレームである場合、次のフレームに対してこのテストの作動を停止する(カウンタをインクリメントし(133)、その内容と値4とを比較し(134)、値4に達している場合は作動停止する(135))。 最後の10個のフレームに対して「ノイズ」の決定が下された場合で、現行フレームのエネルギーが先行する1フレームのエネルギーに定数を加えたものより小さい場合、換言すれば、先行フレームから現行フレームまでエネルギーが著しく増加しなかった場合、第三のステップ136から139、143(ステップ36から39とは少し異なる)は最終的に「ノイズ」の決定を下す(142)。
【0050】
さらに、現行フレームが、「ノイズ」と決定された連続する10番目のフレームである場合、この第三のステップはフレームカウントを再初期化することによりテスト136を再初期化する(カウンタをインクリメントし(137)、カウンタの内容と値10とを比較し(138)、値10に達している場合カウンタを0に再リセットする(139))。第三のステップは、前述の既知の方法に対して変更されている。何故なら、このステップは、テスト136と慣性カウンタとのあらゆる相互作用を回避するために、さらに慣性カウンタを値6にしているからである(操作143)。ステップ40のような第四のステップは存在しない。
【0051】
図5において、曲線E1、E2は、様々なSN比の値に対して、既知の方法と、本発明による方法とによる誤り率をそれぞれ示している。
【0052】
図6において、曲線L1、L2は、様々なSN比の値に対して、既知の方法と、本発明による方法とによる音声損失率をそれぞれ示している。
【0053】
以上から、音声活動検知動作が、騒音環境において、大幅に改善されることが分かる。全体の誤り率が減少し、特に、失われる会話の割合が著しく減っている。従って、会話の完全性が保護され、会話は理解しやすい。
【図面の簡単な説明】
【図1】本発明による方法を実施するコーダの実施例の機能図である。
【図2】G.729補遺B、11/96規格により既知の符号化方法による「音声」/「ノイズ」決定のフローチャートである。
【図3】G.729補遺B、11/96規格により既知の符号化方法による音声活動検知信号の平滑化操作を詳しく示す図である。
【図4】本発明による方法における、音声活動検知信号の平滑化の実施例を示すフローチャートである。
【図5】SN比の様々な値に対して、既知の方法と本発明による方法とによる誤り率をそれぞれ示す図である。
【図6】SN比の様々な値に対して、既知の方法と本発明の方法とによる会話損失率をそれぞれ示す図である。
【符号の説明】
1 入力端子
2 回路
3、6 スイッチ
4、5 フレーム符号化回路
7 音声活動検知機
8 出力端子
Claims (4)
- 信号の音声活動を検知する方法であって、信号を複数フレームに分割し、各フレームに対して下される「音声」か「ノイズ」かの最初の決定の平滑化ステップを含み、この平滑化ステップが、
フレームnに対して最初の決定が「音声」で、
フレームn−2に対して最終決定が「ノイズ」で、
フレームn−1のエネルギーが、フレームn−2のエネルギーより大きく、
フレームnのエネルギーがフレームn−2のエネルギーより大きい場合、
n番目のフレームに対して「音声」の最終決定を下すステップを含み、
前記平滑化ステップが、フレームnに対して、
最初の決定が「音声」である場合、慣性カウンタを0に初期化し(102)、
最初の決定が「ノイズ」である場合、フレームnのエネルギーが閾値より大きいかどうか決定し、また慣性カウンタの内容が固定された閾値より小さく、かつ1より大きいかどうか決定し(103)、次いで、
この三つの条件が満たされる場合、「音声」の決定を下し、慣性カウンタを1単位インクリメントし(104)、
あるいは、これらの条件の1つが満たされない場合、「ノイズ」の決定を下すステップを含むことを特徴とする方法。 - 「音声」の最終決定がフレームnに対して下された場合、iが一定の慣性時間を定義する整数であるとき、さらに、フレームn+1からn+iに対して「ノイズ」のあらゆる最終決定を回避することを特徴とする請求項1に記載の方法。
- 音声活動の検知装置を含む音声信号コーダであって、信号を複数フレームに分割し、装置は各フレームに対して下された「音声」か「ノイズ」かの最初の決定を平滑化する手段を含み、この平滑化手段は、
フレームnに対する最初の決定が「音声」で、
フレームn−2に対する最終決定が「ノイズ」で、
フレームn−1のエネルギーがフレームn−2のエネルギーより大きく、
フレームnのエネルギーがフレームn−2のエネルギーより大きい場合、
n番目のフレームに対して「音声」の最終決定を下す手段を含み、
前記平滑化手段は、
フレームnに対して最初の決定が「音声」である場合、慣性カウンタを0に初期化し(102)、
最初の決定が「ノイズ」である場合、フレームnのエネルギーが閾値より大きいかどうか決定し、また慣性カウンタの内容が固定された閾値より小さく、かつ1より大きいかどうか決定し(103)、次いで、
この三つの条件が満たされている場合、「音声」の決定を下し、慣性カウンタを1単位インクリメントし(104)、
あるいは、これらの条件の1つが満たされない場合、「ノイズ」の決定を下す手段を含むことを特徴とするコーダ。 - 平滑化手段は、「音声」の最終決定がフレームnに対して下された場合、iが一定の慣性時間を定義する整数であるとき、フレームn+1からn+iに対して「ノイズ」のあらゆる最終決定を回避する手段を含むことを特徴とする請求項3に記載のコーダ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0107585A FR2825826B1 (fr) | 2001-06-11 | 2001-06-11 | Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede |
FR0107585 | 2001-06-11 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006087186A Division JP2006189907A (ja) | 2001-06-11 | 2006-03-28 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003005772A JP2003005772A (ja) | 2003-01-08 |
JP3992545B2 true JP3992545B2 (ja) | 2007-10-17 |
Family
ID=8864153
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002168375A Expired - Fee Related JP3992545B2 (ja) | 2001-06-11 | 2002-06-10 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
JP2006087186A Pending JP2006189907A (ja) | 2001-06-11 | 2006-03-28 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006087186A Pending JP2006189907A (ja) | 2001-06-11 | 2006-03-28 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
Country Status (8)
Country | Link |
---|---|
US (1) | US7596487B2 (ja) |
EP (1) | EP1267325B1 (ja) |
JP (2) | JP3992545B2 (ja) |
CN (1) | CN1162835C (ja) |
AT (1) | ATE269573T1 (ja) |
DE (1) | DE60200632T2 (ja) |
ES (1) | ES2219624T3 (ja) |
FR (1) | FR2825826B1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756709B2 (en) * | 2004-02-02 | 2010-07-13 | Applied Voice & Speech Technologies, Inc. | Detection of voice inactivity within a sound stream |
GB0408856D0 (en) * | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
MXPA06012578A (es) * | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con distintos modelos de codificacion. |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
US20060241937A1 (en) * | 2005-04-21 | 2006-10-26 | Ma Changxue C | Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments |
KR20080059881A (ko) * | 2006-12-26 | 2008-07-01 | 삼성전자주식회사 | 음성 신호의 전처리 장치 및 방법 |
CN102667927B (zh) * | 2009-10-19 | 2013-05-08 | 瑞典爱立信有限公司 | 语音活动检测的方法和背景估计器 |
CN102137194B (zh) * | 2010-01-21 | 2014-01-01 | 华为终端有限公司 | 一种通话检测方法及装置 |
ES2860986T3 (es) * | 2010-12-24 | 2021-10-05 | Huawei Tech Co Ltd | Método y aparato para detectar adaptivamente una actividad de voz en una señal de audio de entrada |
US9659571B2 (en) * | 2011-05-11 | 2017-05-23 | Robert Bosch Gmbh | System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure |
US20130090926A1 (en) * | 2011-09-16 | 2013-04-11 | Qualcomm Incorporated | Mobile device context information using speech detection |
CN103325385B (zh) * | 2012-03-23 | 2018-01-26 | 杜比实验室特许公司 | 语音通信方法和设备、操作抖动缓冲器的方法和设备 |
CN103325386B (zh) * | 2012-03-23 | 2016-12-21 | 杜比实验室特许公司 | 用于信号传输控制的方法和系统 |
CN105681966B (zh) * | 2014-11-19 | 2018-10-19 | 塞舌尔商元鼎音讯股份有限公司 | 降低噪音的方法及电子装置 |
US10928502B2 (en) * | 2018-05-30 | 2021-02-23 | Richwave Technology Corp. | Methods and apparatus for detecting presence of an object in an environment |
CN109360585A (zh) * | 2018-12-19 | 2019-02-19 | 晶晨半导体(上海)股份有限公司 | 一种语音激活检测方法 |
CN113555025A (zh) * | 2020-04-26 | 2021-10-26 | 华为技术有限公司 | 一种静音描述帧发送、协商方法及装置 |
CN115132231B (zh) * | 2022-08-31 | 2022-12-13 | 安徽讯飞寰语科技有限公司 | 语音活性检测方法、装置、设备及可读存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0240700A (ja) * | 1988-08-01 | 1990-02-09 | Matsushita Electric Ind Co Ltd | 音声検出装置 |
JPH0424692A (ja) * | 1990-05-18 | 1992-01-28 | Ricoh Co Ltd | 音声区間検出方式 |
US5410632A (en) * | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
US5583961A (en) * | 1993-03-25 | 1996-12-10 | British Telecommunications Public Limited Company | Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
JP2897628B2 (ja) * | 1993-12-24 | 1999-05-31 | 三菱電機株式会社 | 音声検出器 |
US5826230A (en) * | 1994-07-18 | 1998-10-20 | Matsushita Electric Industrial Co., Ltd. | Speech detection device |
JP3109978B2 (ja) * | 1995-04-28 | 2000-11-20 | 松下電器産業株式会社 | 音声区間検出装置 |
US5819217A (en) * | 1995-12-21 | 1998-10-06 | Nynex Science & Technology, Inc. | Method and system for differentiating between speech and noise |
JP3297346B2 (ja) * | 1997-04-30 | 2002-07-02 | 沖電気工業株式会社 | 音声検出装置 |
US6188981B1 (en) * | 1998-09-18 | 2001-02-13 | Conexant Systems, Inc. | Method and apparatus for detecting voice activity in a speech signal |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
JP3759685B2 (ja) * | 1999-05-18 | 2006-03-29 | 三菱電機株式会社 | 雑音区間判定装置,雑音抑圧装置及び推定雑音情報更新方法 |
FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
CN1210690C (zh) * | 2000-11-30 | 2005-07-13 | 松下电器产业株式会社 | 音频解码器和音频解码方法 |
-
2001
- 2001-06-11 FR FR0107585A patent/FR2825826B1/fr not_active Expired - Fee Related
-
2002
- 2002-04-18 EP EP02290984A patent/EP1267325B1/fr not_active Expired - Lifetime
- 2002-04-18 ES ES02290984T patent/ES2219624T3/es not_active Expired - Lifetime
- 2002-04-18 DE DE60200632T patent/DE60200632T2/de not_active Expired - Lifetime
- 2002-04-18 AT AT02290984T patent/ATE269573T1/de not_active IP Right Cessation
- 2002-05-10 US US10/142,060 patent/US7596487B2/en not_active Expired - Fee Related
- 2002-05-29 CN CNB021217432A patent/CN1162835C/zh not_active Expired - Fee Related
- 2002-06-10 JP JP2002168375A patent/JP3992545B2/ja not_active Expired - Fee Related
-
2006
- 2006-03-28 JP JP2006087186A patent/JP2006189907A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
ATE269573T1 (de) | 2004-07-15 |
EP1267325A1 (fr) | 2002-12-18 |
FR2825826B1 (fr) | 2003-09-12 |
JP2003005772A (ja) | 2003-01-08 |
EP1267325B1 (fr) | 2004-06-16 |
JP2006189907A (ja) | 2006-07-20 |
DE60200632D1 (de) | 2004-07-22 |
DE60200632T2 (de) | 2004-12-23 |
US7596487B2 (en) | 2009-09-29 |
CN1391212A (zh) | 2003-01-15 |
US20020188442A1 (en) | 2002-12-12 |
FR2825826A1 (fr) | 2002-12-13 |
ES2219624T3 (es) | 2004-12-01 |
CN1162835C (zh) | 2004-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006189907A (ja) | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ | |
JP4236726B2 (ja) | 音声活動検出方法及び音声活動検出装置 | |
KR100455225B1 (ko) | 보코더에 의해 인코드되는 다수의 프레임들에 잔존 프레임들을 추가하는 방법 및 장치 | |
US5657422A (en) | Voice activity detection driven noise remediator | |
EP0790599B1 (en) | A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station | |
US7983906B2 (en) | Adaptive voice mode extension for a voice activity detector | |
US6807525B1 (en) | SID frame detection with human auditory perception compensation | |
JP3273599B2 (ja) | 音声符号化レート選択器と音声符号化装置 | |
KR101648290B1 (ko) | 컴포트 노이즈의 생성 | |
US6381568B1 (en) | Method of transmitting speech using discontinuous transmission and comfort noise | |
US7231348B1 (en) | Tone detection algorithm for a voice activity detector | |
JPS62274941A (ja) | 音声符号化方式 | |
KR102000227B1 (ko) | 디지털 오디오 신호의 프리에코 판별 및 감쇠 | |
JP6531449B2 (ja) | 音声処理装置、プログラム及び方法、並びに、交換装置 | |
WO2003065703A1 (en) | Telephone having four vad circuits | |
US7962334B2 (en) | Receiving device and method | |
JP3603470B2 (ja) | 音声品質改善装置 | |
JP3315708B2 (ja) | 比較減衰器付音声符復号器 | |
WO2003065693A2 (en) | Analog voice activity detector for telephone | |
JP2772598B2 (ja) | 音声符号化装置 | |
JPH06118993A (ja) | 有声/無声判定回路 | |
JP2952776B2 (ja) | 可変ビットレート式適応予測符号化方式 | |
JPH03241400A (ja) | 音声検出器 | |
JPH0832526A (ja) | 音声検出器 | |
JPH0844385A (ja) | 雑音区間検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20051221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20051227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070302 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070724 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110803 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110803 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120803 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120803 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130803 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |