JP2003005772A - 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ - Google Patents
信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダInfo
- Publication number
- JP2003005772A JP2003005772A JP2002168375A JP2002168375A JP2003005772A JP 2003005772 A JP2003005772 A JP 2003005772A JP 2002168375 A JP2002168375 A JP 2002168375A JP 2002168375 A JP2002168375 A JP 2002168375A JP 2003005772 A JP2003005772 A JP 2003005772A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- noise
- voice
- signal
- decision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000000694 effects Effects 0.000 title claims abstract description 19
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 238000009499 grossing Methods 0.000 claims description 19
- 238000004891 communication Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 16
- 230000007704 transition Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Communication Control (AREA)
- Circuits Of Receivers In General (AREA)
Abstract
号品質を損なわない、有効な音声検知方法と、この方法
の実施装置を含む音声信号コーダとを提供する。 【解決手段】 本方法は「音声」か「ノイズ」かの決定
を平滑化し、会話セグメントの損失を回避する信号の音
声活動検知を可能とする。本方法はノイズレベルが高い
場合に特に適する。トラフィック最適化を優先する既知
の方法に対し、本方法は復号化後の再生信号の了解性を
優先する。符号化信号を、複数フレームに分割し、各信
号フレームに対し、「音声」か「ノイズ」かの最初の決
定を下す。この方法は、現行フレームに先行するフレー
ムに対して信号エネルギーの増加があると、この増加が
わずかなものであっても「音声」の決定を下し、信号の
特性が、少なくともi個の後続フレーム中(たとえばi
=6)、ノイズ特性に対応する場合のみ、「ノイズ」の
決定を下す。本発明は電話通信に適用される。
Description
検知装置を含む音声信号コーダ、特に、ITU−T勧告
G.729A、補遺Bに準拠するコーダに関する。
60%まで含む。伝送する情報量を減らすために、実際
に有効信号を含む音声信号部分と、無音またはノイズし
か含まない部分とを区別し、これらをそれぞれ異なる2
個のアルゴリズムに従って符号化することが知られてお
り、無音またはノイズしか含まない各部分は、周囲のノ
イズの特徴を示すごくわずかな情報によって符号化され
る。このようなコーダは、スペクトル特性と、符号化す
る音声信号のエネルギー(各信号フレームについて計算
される)とによって、上記の区別を実施する音声活動検
知装置を含む。
相当するデジタルフレームに分割される。各フレームに
対して、信号から一組のパラメータが抽出される。主な
パラメータは、自動相関係数である。線形予測による符
号化係数の集合と、一組の周波数パラメータとが、次に
自動相関係数から導き出される。実際に有効信号を含む
音声部分と、無音またはノイズしか含まない部分とを区
別する方法の一つのステップは、信号のフレームエネル
ギーを閾値と比較する。閾値を計算する装置は、閾値を
ノイズ変化に適合させる。音声信号を損なうノイズは、
電気的なノイズと周囲のノイズとからなる。周囲のノイ
ズは、同一の通信中に著しく増えたり減ったりすること
がある。一方、ノイズの周波数フィルタリング係数もま
た、それ自体ノイズの変化に適合しなければならない。
nyassine)らによる文献「ITU−T勧告G7
29補遺B:A Silence Compressi
onScheme for Use With G72
9 Optimizedfor V.70 Digit
al Simultaneous Voiceand
Data Applications」、IEEE C
ommunication Magazine、199
7年9月は、このようなコーダを記載している。
は、音声として符号化された信号部分と、無音または本
質的に雑音として符号化された信号部分とにそれぞれ対
応する2個の復号アルゴリズムを選択的に使用しなけれ
ばならない。あるアルゴリズムから他のアルゴリズムへ
の移行は、無音期間またはノイズ期間を符号化する情報
によって同期される。
/96を実装する既知のコーダは、ノイズレベルが、こ
の勧告によって定義された量子化レベルの8000レベ
ルを越えると、もはや有効信号とノイズ信号とを区別で
きなくなる。その結果、音声活動検知信号の無効な遷移
が多数発生し、そのために、有効信号の部分が損失され
る。
法は既知であり、SN比が所定値未満であるとき、コー
ダにおける音声活動の検知を完全に禁止する。この解決
方法は、有効信号の完全性を保護するが、トラヒックを
増加するという欠点を有する。
ヒックに関して音声活動検知の有効性を保護し、復号後
に再生される信号の品質を損なわない、有効な解決方法
を提案することにある。
の音声活動を検知する方法であり、信号を複数フレーム
に分割し、この方法は各フレームに対して下される「音
声」か「ノイズ」かの最初の決定の平滑化ステップを含
み、この平滑化ステップが、フレームnに対して最初の
決定が「音声」で、フレームn−2に対して最終決定が
「ノイズ」で、フレームn−1のエネルギーが、フレー
ムn−2のエネルギーより大きく、フレームnのエネル
ギーがフレームn−2のエネルギーより大きい場合、フ
レームnに対して「音声」の最終決定を下すステップを
含むことを特徴とする。
の間だけ、遷移エネルギーが増える時に、「ノイズ」か
ら「音声」への望ましくない遷移を回避する。何故な
ら、平滑化機能は、「ノイズ」から「音声」への遷移決
定に際して、現行フレームnに先行するフレームn−1
に対して下される最終決定だけを考慮するからである。
して「音声」の最終決定が下された場合、本発明による
方法は、iが一定の慣性時間を定義する整数であると
き、さらにフレームn+1からn+iに対して「ノイ
ズ」のあらゆる最終決定を回避することからなる。
グメントの損失現象が回避される。何故なら、平滑化機
能は、「ノイズ」決定に戻る場合、i個のフレームの持
続時間に対応する一定の慣性を有するからである。
るための平滑化手段を含む音声信号コーダを目的とす
る。
り、いっそう理解され、他の特徴が明らかになるであろ
う。
ダの実施例は、符号化される音声信号をアナログで受信
する入力端子1と、音声信号をフィルタリングし、サン
プリングし、量子化し、フレームに配置する回路2と、
回路2の出力に接続される1個の入力と、2個の出力と
を有するスイッチ3と、実際に有効信号を示すものとみ
なされ、スイッチ3の第一の出力に接続される入力を有
するフレーム符号化回路4と、無音またはノイズを示す
ものとみなされ、スイッチ3の第二の出力に接続される
入力を有するフレーム符号化回路5と、回路4の出力と
回路5の出力とにそれぞれ接続される第一および第二の
入力と、コーダの出力端子を構成する出力端子9とを有
する第二のスイッチ6と、回路2の出力に接続される入
力と、各スイッチ3、6の制御入力に特に接続される出
力とを有し、音声信号内で認識される内容、すなわち有
効信号か無音信号(またはノイズ信号)かに対応する符
号化フレームを選択する音声活動検知器7とを含む。
は、10ms毎に1個のフレームを供給する。音声信号
が、無音信号(またはノイズ信号)から構成される場
合、コーダは、無音期間(またはノイズ期間)の冒頭に
1つのフレームのみを供給する。
ログラミングされたプロセッサによって構成することが
できる。特に、本発明による方法は、当業者が実現可能
なソフトウェアによって実施可能である。
により既知の符号化方法による、「音声」または「ノイ
ズ」の決定のフローチャートである。この方法は、持続
時間を10msに固定したデジタル信号フレームに適用
される。
現行フレームに対して、全ての周波数帯域におけるこの
フレームのエネルギーと、低周波数におけるこのフレー
ムのエネルギーと、一組のスペクトル係数と、ゼロ移行
率との4個のパラメータを抽出する。
小サイズを更新する。
と、所定値Niとを比較する。
合、次のステップ14は、符号化する信号のパラメータ
のスライド平均値を初期化する。すなわち、スペクトル
係数と、全ての帯域における平均エネルギーと、低周波
数における平均エネルギーと、平均ゼロ移行率とであ
る。
ーを所定の閾値と比較し、フレームのエネルギーがこの
閾値より大きい場合、信号が音声に属すると決定し、フ
レームのエネルギーがこの閾値より低い場合、信号がノ
イズであると決定する。現行フレームの処理は、そこ
で、終了16となる。
のステップ17は、この番号がNiに等しいか、あるい
はNiより大きいか決定する。
プ18は、全ての帯域におけるノイズの平均エネルギー
の値と、低周波数におけるノイズの平均エネルギーの値
とを初期化する。
ップ19は、フレームパラメータの現行値をフレームパ
ラメータのスライド平均値から引くことにより、一組の
パラメータ差を計算し、フレームパラメータのスライド
平均値がノイズを示す。これらのパラメータ差は、スペ
クトルのひずみ、全ての帯域におけるエネルギー差、低
周波におけるエネルギー差、およびゼロ移行率の差であ
る。
ーを所定の閾値と比較する。
ない場合、ステップ21は、複数の基準に基づいた最初
の決定を下し(「音声」か「ノイズ」か)、次のステッ
プ22は、あまりに多数の決定変更を回避するために、
この決定を「平滑化」する。
ある場合、ステップ23は、信号がノイズであると決定
し、次のステップ22は、この決定を「平滑化」する。
4は、現行フレームのエネルギーと、全ての帯域におけ
るエネルギーのスライド平均にある定数を加えたものに
等しい適応閾値とを比較する。
い場合、次のステップ25は、ノイズを示すパラメータ
のスライド平均値を更新し、次いで、現行フレームの処
理は、終了26となる。
くない場合、現行フレームの処理は、終了27となる。
6により既知の符号化方法による音声活動検知信号の平
滑化操作を詳しく示す。この平滑化は、以下の複数の基
準に基づいた最初の決定21(「音声」か「ノイズ」
か)に続く4個のステップを含む。
「音声」であった場合で、現行フレームの平均エネルギ
ーが、先行する複数フレームのエネルギーのスライド平
均値にある定数を加えたものより大きい場合、換言すれ
ば、現行フレームのエネルギーが、ノイズの平均エネル
ギーよりずっと大きい場合、第一のステップは「音声」
の決定を下すテスト31からなる。反対の場合には、
「ノイズ」の決定42が最終的に下される。
「音声」であった場合で、現行フレームの平均エネルギ
ーが先行するフレームのエネルギーのスライド平均にあ
る定数を加えたものより大きい場合、換言すれば、この
エネルギーが、先行フレームから現行フレームまでに著
しく減少しなかった場合、第二のステップ32から35
は「音声」の決定を確認するテスト32からなる。
をインクリメントし(操作33)、その内容を値4と比
較し(操作34)、次いで、現行フレームが、「音声」
と決定された連続フレームの第四のフレームである場
合、次のフレームに対してはテスト32の作動を解除す
る(操作35)。「音声」の決定が確認されない場合、
「ノイズ」の決定42が最終的に下される。
に対して「ノイズ」の決定が下された場合(ステップ3
1から35で現行フレームに対して「音声」の決定が下
された場合)で、現行フレームのエネルギーが先行する
フレームのエネルギーにある定数を加えたもの未満であ
る場合、換言すれば、エネルギーが先行フレームから現
行フレームまでに著しく増加しなかった場合、第三のス
テップ36から39は最終的に「ノイズ」の決定42を
下すテスト36からなる。
ームが、「ノイズ」と決定された(テスト38)連続す
るフレームの10番目のフレームであった場合、フレー
ムのカウントを再初期化することによって(操作3
9)、テスト36を再初期化する(操作37)。
数フレームのエネルギースライド平均値の和に定数61
4を加えたもの未満である場合、第四のステップは最終
的に「ノイズ」の決定42を下すテスト40からなる。
換言すれば、「音声」の決定が最終的に確認されるのは
(操作41)フレームのエネルギーが、先行する複数フ
レームのエネルギーのスライド平均値よりもずっと大き
い場合だけである。そうでない場合、「ノイズ」の決定
42が最終的に下される。
信号ノイズが著しい場合、誤った「ノイズ」の決定を供
給する。実際、このステップ40は、先行して行われた
複数の決定を考慮せずに、先行する複数フレームのエネ
ルギーのスライド平均値に定数614を加えた値とによ
って示される現行フレームと本質的な雑音とのエネルギ
ー差だけに基づいて、信号がノイズであると決定する。
事実、本質的な雑音が大きい場合、この定数614から
構成される閾値は、もはや有効ではない。
して、規格G.279.1、添付B、11/96により
既知の方法とは異なる。
活動検知信号の平滑化の実施例を示すフローチャートで
ある。この平滑化は、複数の基準に基づいた初期の決定
21(「音声」または「ノイズ」)に続く4個のステッ
プを含む。この4個のステップの中で、3個のステップ
(テスト131、132、136)は、上記の3個のス
テップ(テスト31、32、36)と同じである。前述
の第四のステップ40は、削除されており、いわゆる予
備ステップが、上記第一のステップ31の前に付加され
ている。たとえば、フレームのエネルギーが弱くなると
き、いわゆる慣性カウントが付加され、「音声」の決定
を「ノイズ」の決定に変える前に、1フレームの持続時
間の5倍に等しい持続時間の慣性を得る。従って、この
持続時間は、この例では50msである。こうした慣性
カウントは、ノイズの平均エネルギーが、規格G.27
9.1、添付B、11/96により規定された量子化レ
ベルの8000レベルより大きくなるときしか有効でな
い。
は、ステップ21の最初の決定が「音声」である場合、
慣性カウンタを0にリセットし(操作102)、さらに
テスト131に移行する。
ある場合、現行フレームのエネルギーが固定の閾値より
大きいかどうか決定し、また、慣性カウンタの内容が6
未満で1より大きいかどうか決定する(操作103)。
の決定とは相反して)「音声」の決定を下し、次いで、
慣性カウンタを1単位インクリメントし(操作10
4)、さらに、テスト131に移行する。
ない場合、最終的に「ノイズ」の決定を下す(14
2)。
ームの平均エネルギーが、先行する複数フレームのエネ
ルギーのスライド平均に定数を加えたものより大きい場
合、第一のステップは、「音声」の決定を保持するテス
ト131(テスト31と同じ)からなる。
声」であった場合で、現行フレームの平均エネルギー
が、先行する1フレームのエネルギーのスライド平均に
定数を加えたものより大きい場合、換言すれば、先行フ
レームから現行フレームまでエネルギーが著しく減らな
かった場合、第二のステップ132から135(ステッ
プ32から35と同じ)は「音声」の決定を下す。
さらに、現行フレームが、「音声」と決定された連続す
る四番目のフレームである場合、次のフレームに対して
このテストの作動を停止する(カウンタをインクリメン
トし(133)、その内容と値4とを比較し(13
4)、値4に達している場合は作動停止する(13
5))。 最後の10個のフレームに対して「ノイズ」
の決定が下された場合で、現行フレームのエネルギーが
先行する1フレームのエネルギーに定数を加えたものよ
り小さい場合、換言すれば、先行フレームから現行フレ
ームまでエネルギーが著しく増加しなかった場合、第三
のステップ136から139、143(ステップ36か
ら39とは少し異なる)は最終的に「ノイズ」の決定を
下す(142)。
定された連続する10番目のフレームである場合、この
第三のステップはフレームカウントを再初期化すること
によりテスト136を再初期化する(カウンタをインク
リメントし(137)、カウンタの内容と値10とを比
較し(138)、値10に達している場合カウンタを0
に再リセットする(139))。第三のステップは、前
述の既知の方法に対して変更されている。何故なら、こ
のステップは、テスト136と慣性カウンタとのあらゆ
る相互作用を回避するために、さらに慣性カウンタを値
6にしているからである(操作143)。ステップ40
のような第四のステップは存在しない。
SN比の値に対して、既知の方法と、本発明による方法
とによる誤り率をそれぞれ示している。
SN比の値に対して、既知の方法と、本発明による方法
とによる音声損失率をそれぞれ示している。
において、大幅に改善されることが分かる。全体の誤り
率が減少し、特に、失われる会話の割合が著しく減って
いる。従って、会話の完全性が保護され、会話は理解し
やすい。
機能図である。
の符号化方法による「音声」/「ノイズ」決定のフロー
チャートである。
の符号化方法による音声活動検知信号の平滑化操作を詳
しく示す図である。
の平滑化の実施例を示すフローチャートである。
明による方法とによる誤り率をそれぞれ示す図である。
明の方法とによる会話損失率をそれぞれ示す図である。
Claims (6)
- 【請求項1】 信号の音声活動を検知する方法であっ
て、信号を複数フレームに分割し、各フレームに対して
下される「音声」か「ノイズ」かの最初の決定の平滑化
ステップを含み、この平滑化ステップが、 フレームnに対して最初の決定が「音声」で、 フレームn−2に対して最終決定が「ノイズ」で、 フレームn−1のエネルギーが、フレームn−2のエネ
ルギーより大きく、 フレームnのエネルギーがフレームn−2のエネルギー
より大きい場合、n番目のフレームに対して「音声」の
最終決定を下すステップを含むことを特徴とする方法。 - 【請求項2】 「音声」の最終決定がフレームnに対し
て下された場合、iが一定の慣性時間を定義する整数で
あるとき、さらに、フレームn+1からn+iに対して
「ノイズ」のあらゆる最終決定を回避することを特徴と
する請求項1に記載の方法。 - 【請求項3】 平滑化ステップが、フレームnに対し
て、 最初の決定が「音声」である場合、慣性カウンタを0に
初期化し(102)、 最初の決定が「ノイズ」である場合、フレームnのエネ
ルギーが閾値より大きいかどうか決定し、また慣性カウ
ンタの内容が固定された閾値より小さく、かつ1より大
きいかどうか決定し(103)、次いで、 この三つの条件が満たされる場合、「音声」の決定を下
し、慣性カウンタを1単位インクリメントし(10
4)、 あるいは、これらの条件の1つが満たされない場合、
「ノイズ」の決定を下すステップを含むことを特徴とす
る請求項1に記載の方法。 - 【請求項4】 音声活動の検知装置を含む音声信号コー
ダであって、信号を複数フレームに分割し、装置は各フ
レームに対して下された「音声」か「ノイズ」かの最初
の決定を平滑化する手段を含み、この平滑化手段は、 フレームnに対する最初の決定が「音声」で、 フレームn−2に対する最終決定が「ノイズ」で、 フレームn−1のエネルギーがフレームn−2のエネル
ギーより大きく、 フレームnのエネルギーがフレームn−2のエネルギー
より大きい場合、n番目のフレームに対して「音声」の
最終決定を下す手段を含むことを特徴とするコーダ。 - 【請求項5】 平滑化手段は、「音声」の最終決定がフ
レームnに対して下された場合、iが一定の慣性時間を
定義する整数であるとき、フレームn+1からn+iに
対して「ノイズ」のあらゆる最終決定を回避する手段を
含むことを特徴とする請求項4に記載のコーダ。 - 【請求項6】 平滑化手段は、 フレームnに対して最初の決定が「音声」である場合、
慣性カウンタを0に初期化し(102)、 最初の決定が「ノイズ」である場合、フレームnのエネ
ルギーが閾値より大きいかどうか決定し、また慣性カウ
ンタの内容が固定された閾値より小さく、かつ1より大
きいかどうか決定し(103)、次いで、 この三つの条件が満たされている場合、「音声」の決定
を下し、慣性カウンタを1単位インクリメントし(10
4)、 あるいは、これらの条件の1つが満たされない場合、
「ノイズ」の決定を下す手段を含むことを特徴とする請
求項4に記載のコーダ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0107585 | 2001-06-11 | ||
FR0107585A FR2825826B1 (fr) | 2001-06-11 | 2001-06-11 | Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006087186A Division JP2006189907A (ja) | 2001-06-11 | 2006-03-28 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003005772A true JP2003005772A (ja) | 2003-01-08 |
JP3992545B2 JP3992545B2 (ja) | 2007-10-17 |
Family
ID=8864153
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002168375A Expired - Fee Related JP3992545B2 (ja) | 2001-06-11 | 2002-06-10 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
JP2006087186A Pending JP2006189907A (ja) | 2001-06-11 | 2006-03-28 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006087186A Pending JP2006189907A (ja) | 2001-06-11 | 2006-03-28 | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
Country Status (8)
Country | Link |
---|---|
US (1) | US7596487B2 (ja) |
EP (1) | EP1267325B1 (ja) |
JP (2) | JP3992545B2 (ja) |
CN (1) | CN1162835C (ja) |
AT (1) | ATE269573T1 (ja) |
DE (1) | DE60200632T2 (ja) |
ES (1) | ES2219624T3 (ja) |
FR (1) | FR2825826B1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756709B2 (en) * | 2004-02-02 | 2010-07-13 | Applied Voice & Speech Technologies, Inc. | Detection of voice inactivity within a sound stream |
GB0408856D0 (en) * | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
CN1954365B (zh) * | 2004-05-17 | 2011-04-06 | 诺基亚公司 | 使用不同编码模型的音频编码 |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
US20060241937A1 (en) * | 2005-04-21 | 2006-10-26 | Ma Changxue C | Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments |
KR20080059881A (ko) * | 2006-12-26 | 2008-07-01 | 삼성전자주식회사 | 음성 신호의 전처리 장치 및 방법 |
JP5712220B2 (ja) * | 2009-10-19 | 2015-05-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声活動検出のための方法および背景推定器 |
CN102137194B (zh) * | 2010-01-21 | 2014-01-01 | 华为终端有限公司 | 一种通话检测方法及装置 |
EP3726530B1 (en) * | 2010-12-24 | 2024-05-22 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting a voice activity in an input audio signal |
WO2012152323A1 (en) * | 2011-05-11 | 2012-11-15 | Robert Bosch Gmbh | System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure |
US20130090926A1 (en) * | 2011-09-16 | 2013-04-11 | Qualcomm Incorporated | Mobile device context information using speech detection |
CN103325386B (zh) * | 2012-03-23 | 2016-12-21 | 杜比实验室特许公司 | 用于信号传输控制的方法和系统 |
CN103325385B (zh) * | 2012-03-23 | 2018-01-26 | 杜比实验室特许公司 | 语音通信方法和设备、操作抖动缓冲器的方法和设备 |
CN105681966B (zh) * | 2014-11-19 | 2018-10-19 | 塞舌尔商元鼎音讯股份有限公司 | 降低噪音的方法及电子装置 |
US10928502B2 (en) * | 2018-05-30 | 2021-02-23 | Richwave Technology Corp. | Methods and apparatus for detecting presence of an object in an environment |
CN109360585A (zh) * | 2018-12-19 | 2019-02-19 | 晶晨半导体(上海)股份有限公司 | 一种语音激活检测方法 |
CN113555025A (zh) * | 2020-04-26 | 2021-10-26 | 华为技术有限公司 | 一种静音描述帧发送、协商方法及装置 |
CN115132231B (zh) * | 2022-08-31 | 2022-12-13 | 安徽讯飞寰语科技有限公司 | 语音活性检测方法、装置、设备及可读存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0240700A (ja) * | 1988-08-01 | 1990-02-09 | Matsushita Electric Ind Co Ltd | 音声検出装置 |
JPH0424692A (ja) * | 1990-05-18 | 1992-01-28 | Ricoh Co Ltd | 音声区間検出方式 |
US5410632A (en) * | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
US5583961A (en) * | 1993-03-25 | 1996-12-10 | British Telecommunications Public Limited Company | Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
JP2897628B2 (ja) * | 1993-12-24 | 1999-05-31 | 三菱電機株式会社 | 音声検出器 |
US5826230A (en) * | 1994-07-18 | 1998-10-20 | Matsushita Electric Industrial Co., Ltd. | Speech detection device |
JP3109978B2 (ja) * | 1995-04-28 | 2000-11-20 | 松下電器産業株式会社 | 音声区間検出装置 |
US5819217A (en) * | 1995-12-21 | 1998-10-06 | Nynex Science & Technology, Inc. | Method and system for differentiating between speech and noise |
JP3297346B2 (ja) * | 1997-04-30 | 2002-07-02 | 沖電気工業株式会社 | 音声検出装置 |
US6188981B1 (en) * | 1998-09-18 | 2001-02-13 | Conexant Systems, Inc. | Method and apparatus for detecting voice activity in a speech signal |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
JP3759685B2 (ja) * | 1999-05-18 | 2006-03-29 | 三菱電機株式会社 | 雑音区間判定装置,雑音抑圧装置及び推定雑音情報更新方法 |
FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
DE60139144D1 (de) * | 2000-11-30 | 2009-08-13 | Nippon Telegraph & Telephone | Audio-dekodierer und audio-dekodierungsverfahren |
-
2001
- 2001-06-11 FR FR0107585A patent/FR2825826B1/fr not_active Expired - Fee Related
-
2002
- 2002-04-18 AT AT02290984T patent/ATE269573T1/de not_active IP Right Cessation
- 2002-04-18 ES ES02290984T patent/ES2219624T3/es not_active Expired - Lifetime
- 2002-04-18 DE DE60200632T patent/DE60200632T2/de not_active Expired - Lifetime
- 2002-04-18 EP EP02290984A patent/EP1267325B1/fr not_active Expired - Lifetime
- 2002-05-10 US US10/142,060 patent/US7596487B2/en not_active Expired - Fee Related
- 2002-05-29 CN CNB021217432A patent/CN1162835C/zh not_active Expired - Fee Related
- 2002-06-10 JP JP2002168375A patent/JP3992545B2/ja not_active Expired - Fee Related
-
2006
- 2006-03-28 JP JP2006087186A patent/JP2006189907A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US7596487B2 (en) | 2009-09-29 |
FR2825826B1 (fr) | 2003-09-12 |
US20020188442A1 (en) | 2002-12-12 |
ATE269573T1 (de) | 2004-07-15 |
ES2219624T3 (es) | 2004-12-01 |
JP3992545B2 (ja) | 2007-10-17 |
JP2006189907A (ja) | 2006-07-20 |
CN1391212A (zh) | 2003-01-15 |
FR2825826A1 (fr) | 2002-12-13 |
DE60200632T2 (de) | 2004-12-23 |
EP1267325B1 (fr) | 2004-06-16 |
CN1162835C (zh) | 2004-08-18 |
DE60200632D1 (de) | 2004-07-22 |
EP1267325A1 (fr) | 2002-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006189907A (ja) | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ | |
US5657422A (en) | Voice activity detection driven noise remediator | |
KR100581413B1 (ko) | 음성 복호기에서 프레임 오류 은폐를 위한 개선된스펙트럼 매개변수 대체 | |
JP4236726B2 (ja) | 音声活動検出方法及び音声活動検出装置 | |
JP4146489B2 (ja) | 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体 | |
KR100455225B1 (ko) | 보코더에 의해 인코드되는 다수의 프레임들에 잔존 프레임들을 추가하는 방법 및 장치 | |
US7246057B1 (en) | System for handling variations in the reception of a speech signal consisting of packets | |
RU2120667C1 (ru) | Способ и устройство для маскирования отброшенных кадров | |
RU2417456C2 (ru) | Системы, способы и устройства для обнаружения изменения сигналов | |
EP0877355A2 (en) | Speech coding | |
EP0677202B1 (en) | Discriminating between stationary and non-stationary signals | |
KR20050061615A (ko) | 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법 | |
JP3273599B2 (ja) | 音声符号化レート選択器と音声符号化装置 | |
KR101648290B1 (ko) | 컴포트 노이즈의 생성 | |
KR100216018B1 (ko) | 배경음을 엔코딩 및 디코딩하는 방법 및 장치 | |
JPH09506187A (ja) | Adpcm音声コーダのための適応誤差制御 | |
US8175867B2 (en) | Voice communication apparatus | |
US7962334B2 (en) | Receiving device and method | |
JP3603470B2 (ja) | 音声品質改善装置 | |
US8204753B2 (en) | Stabilization and glitch minimization for CCITT recommendation G.726 speech CODEC during packet loss scenarios by regressor control and internal state updates of the decoding process | |
JP3315708B2 (ja) | 比較減衰器付音声符復号器 | |
US20040138878A1 (en) | Method for estimating a codec parameter | |
EP3787270A1 (en) | Methods and devices for improvements relating to voice quality estimation | |
JP3603469B2 (ja) | 音声品質改善装置 | |
KR100547898B1 (ko) | 오디오 정보 제공 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20051221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20051227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070302 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070724 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110803 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110803 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120803 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120803 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130803 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |