JP2003005772A - 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ - Google Patents

信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ

Info

Publication number
JP2003005772A
JP2003005772A JP2002168375A JP2002168375A JP2003005772A JP 2003005772 A JP2003005772 A JP 2003005772A JP 2002168375 A JP2002168375 A JP 2002168375A JP 2002168375 A JP2002168375 A JP 2002168375A JP 2003005772 A JP2003005772 A JP 2003005772A
Authority
JP
Japan
Prior art keywords
frame
noise
voice
signal
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002168375A
Other languages
English (en)
Other versions
JP3992545B2 (ja
Inventor
Raymond Gass
レイモンド・ガス
Richard Atzenhoffer
リシヤール・アトザノフエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel CIT SA
Alcatel Lucent SAS
Original Assignee
Alcatel CIT SA
Alcatel SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel CIT SA, Alcatel SA filed Critical Alcatel CIT SA
Publication of JP2003005772A publication Critical patent/JP2003005772A/ja
Application granted granted Critical
Publication of JP3992545B2 publication Critical patent/JP3992545B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Communication Control (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

(57)【要約】 【課題】 音声活動検知の有効性を保護し、復号後の信
号品質を損なわない、有効な音声検知方法と、この方法
の実施装置を含む音声信号コーダとを提供する。 【解決手段】 本方法は「音声」か「ノイズ」かの決定
を平滑化し、会話セグメントの損失を回避する信号の音
声活動検知を可能とする。本方法はノイズレベルが高い
場合に特に適する。トラフィック最適化を優先する既知
の方法に対し、本方法は復号化後の再生信号の了解性を
優先する。符号化信号を、複数フレームに分割し、各信
号フレームに対し、「音声」か「ノイズ」かの最初の決
定を下す。この方法は、現行フレームに先行するフレー
ムに対して信号エネルギーの増加があると、この増加が
わずかなものであっても「音声」の決定を下し、信号の
特性が、少なくともi個の後続フレーム中(たとえばi
=6)、ノイズ特性に対応する場合のみ、「ノイズ」の
決定を下す。本発明は電話通信に適用される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、改良した音声活動
検知装置を含む音声信号コーダ、特に、ITU−T勧告
G.729A、補遺Bに準拠するコーダに関する。
【0002】
【従来の技術】音声信号は、無音または本質的な雑音を
60%まで含む。伝送する情報量を減らすために、実際
に有効信号を含む音声信号部分と、無音またはノイズし
か含まない部分とを区別し、これらをそれぞれ異なる2
個のアルゴリズムに従って符号化することが知られてお
り、無音またはノイズしか含まない各部分は、周囲のノ
イズの特徴を示すごくわずかな情報によって符号化され
る。このようなコーダは、スペクトル特性と、符号化す
る音声信号のエネルギー(各信号フレームについて計算
される)とによって、上記の区別を実施する音声活動検
知装置を含む。
【0003】音声信号は、たとえば持続時間10msに
相当するデジタルフレームに分割される。各フレームに
対して、信号から一組のパラメータが抽出される。主な
パラメータは、自動相関係数である。線形予測による符
号化係数の集合と、一組の周波数パラメータとが、次に
自動相関係数から導き出される。実際に有効信号を含む
音声部分と、無音またはノイズしか含まない部分とを区
別する方法の一つのステップは、信号のフレームエネル
ギーを閾値と比較する。閾値を計算する装置は、閾値を
ノイズ変化に適合させる。音声信号を損なうノイズは、
電気的なノイズと周囲のノイズとからなる。周囲のノイ
ズは、同一の通信中に著しく増えたり減ったりすること
がある。一方、ノイズの周波数フィルタリング係数もま
た、それ自体ノイズの変化に適合しなければならない。
【0004】アディル ベナサンニュ(Adil Be
nyassine)らによる文献「ITU−T勧告G7
29補遺B:A Silence Compressi
onScheme for Use With G72
9 Optimizedfor V.70 Digit
al Simultaneous Voiceand
Data Applications」、IEEE C
ommunication Magazine、199
7年9月は、このようなコーダを記載している。
【0005】符号化された音声信号を復号するデコーダ
は、音声として符号化された信号部分と、無音または本
質的に雑音として符号化された信号部分とにそれぞれ対
応する2個の復号アルゴリズムを選択的に使用しなけれ
ばならない。あるアルゴリズムから他のアルゴリズムへ
の移行は、無音期間またはノイズ期間を符号化する情報
によって同期される。
【0006】ITU−T勧告G.729A、補遺B11
/96を実装する既知のコーダは、ノイズレベルが、こ
の勧告によって定義された量子化レベルの8000レベ
ルを越えると、もはや有効信号とノイズ信号とを区別で
きなくなる。その結果、音声活動検知信号の無効な遷移
が多数発生し、そのために、有効信号の部分が損失され
る。
【0007】G723.1 VADに記載された解決方
法は既知であり、SN比が所定値未満であるとき、コー
ダにおける音声活動の検知を完全に禁止する。この解決
方法は、有効信号の完全性を保護するが、トラヒックを
増加するという欠点を有する。
【0008】
【発明が解決しようとする課題】本発明の目的は、トラ
ヒックに関して音声活動検知の有効性を保護し、復号後
に再生される信号の品質を損なわない、有効な解決方法
を提案することにある。
【0009】
【課題を解決するための手段】本発明の対象は、信号内
の音声活動を検知する方法であり、信号を複数フレーム
に分割し、この方法は各フレームに対して下される「音
声」か「ノイズ」かの最初の決定の平滑化ステップを含
み、この平滑化ステップが、フレームnに対して最初の
決定が「音声」で、フレームn−2に対して最終決定が
「ノイズ」で、フレームn−1のエネルギーが、フレー
ムn−2のエネルギーより大きく、フレームnのエネル
ギーがフレームn−2のエネルギーより大きい場合、フ
レームnに対して「音声」の最終決定を下すステップを
含むことを特徴とする。
【0010】このような特徴を持つ方法は、フレームn
の間だけ、遷移エネルギーが増える時に、「ノイズ」か
ら「音声」への望ましくない遷移を回避する。何故な
ら、平滑化機能は、「ノイズ」から「音声」への遷移決
定に際して、現行フレームnに先行するフレームn−1
に対して下される最終決定だけを考慮するからである。
【0011】好適な実施形態によれば、フレームnに対
して「音声」の最終決定が下された場合、本発明による
方法は、iが一定の慣性時間を定義する整数であると
き、さらにフレームn+1からn+iに対して「ノイ
ズ」のあらゆる最終決定を回避することからなる。
【0012】このような特徴を持つ方法により、言語セ
グメントの損失現象が回避される。何故なら、平滑化機
能は、「ノイズ」決定に戻る場合、i個のフレームの持
続時間に対応する一定の慣性を有するからである。
【0013】本発明はまた、本発明による方法を実施す
るための平滑化手段を含む音声信号コーダを目的とす
る。
【0014】本発明は、以下の説明および添付図面によ
り、いっそう理解され、他の特徴が明らかになるであろ
う。
【0015】
【発明の実施の形態】図1に機能的な構成を示したコー
ダの実施例は、符号化される音声信号をアナログで受信
する入力端子1と、音声信号をフィルタリングし、サン
プリングし、量子化し、フレームに配置する回路2と、
回路2の出力に接続される1個の入力と、2個の出力と
を有するスイッチ3と、実際に有効信号を示すものとみ
なされ、スイッチ3の第一の出力に接続される入力を有
するフレーム符号化回路4と、無音またはノイズを示す
ものとみなされ、スイッチ3の第二の出力に接続される
入力を有するフレーム符号化回路5と、回路4の出力と
回路5の出力とにそれぞれ接続される第一および第二の
入力と、コーダの出力端子を構成する出力端子9とを有
する第二のスイッチ6と、回路2の出力に接続される入
力と、各スイッチ3、6の制御入力に特に接続される出
力とを有し、音声信号内で認識される内容、すなわち有
効信号か無音信号(またはノイズ信号)かに対応する符
号化フレームを選択する音声活動検知器7とを含む。
【0016】音声信号が有効信号である場合、コーダ
は、10ms毎に1個のフレームを供給する。音声信号
が、無音信号(またはノイズ信号)から構成される場
合、コーダは、無音期間(またはノイズ期間)の冒頭に
1つのフレームのみを供給する。
【0017】実際には、このようなコーダは、適切にプ
ログラミングされたプロセッサによって構成することが
できる。特に、本発明による方法は、当業者が実現可能
なソフトウェアによって実施可能である。
【0018】図2は、規格G.729補遺B11/96
により既知の符号化方法による、「音声」または「ノイ
ズ」の決定のフローチャートである。この方法は、持続
時間を10msに固定したデジタル信号フレームに適用
される。
【0019】第一のステップ11は、符号化する信号の
現行フレームに対して、全ての周波数帯域におけるこの
フレームのエネルギーと、低周波数におけるこのフレー
ムのエネルギーと、一組のスペクトル係数と、ゼロ移行
率との4個のパラメータを抽出する。
【0020】次のステップ12は、バッファメモリの最
小サイズを更新する。
【0021】次のステップ13は、現行フレームの番号
と、所定値Niとを比較する。
【0022】フレームの番号が所定値Ni未満である場
合、次のステップ14は、符号化する信号のパラメータ
のスライド平均値を初期化する。すなわち、スペクトル
係数と、全ての帯域における平均エネルギーと、低周波
数における平均エネルギーと、平均ゼロ移行率とであ
る。
【0023】次のステップ15は、フレームのエネルギ
ーを所定の閾値と比較し、フレームのエネルギーがこの
閾値より大きい場合、信号が音声に属すると決定し、フ
レームのエネルギーがこの閾値より低い場合、信号がノ
イズであると決定する。現行フレームの処理は、そこ
で、終了16となる。
【0024】フレームの番号がNi未満でない場合、次
のステップ17は、この番号がNiに等しいか、あるい
はNiより大きいか決定する。
【0025】この番号がNiに等しい場合、次のステッ
プ18は、全ての帯域におけるノイズの平均エネルギー
の値と、低周波数におけるノイズの平均エネルギーの値
とを初期化する。
【0026】この番号がNiより大きい場合、次のステ
ップ19は、フレームパラメータの現行値をフレームパ
ラメータのスライド平均値から引くことにより、一組の
パラメータ差を計算し、フレームパラメータのスライド
平均値がノイズを示す。これらのパラメータ差は、スペ
クトルのひずみ、全ての帯域におけるエネルギー差、低
周波におけるエネルギー差、およびゼロ移行率の差であ
る。
【0027】次のステップ20は、フレームのエネルギ
ーを所定の閾値と比較する。
【0028】フレームのエネルギーが所定の閾値未満で
ない場合、ステップ21は、複数の基準に基づいた最初
の決定を下し(「音声」か「ノイズ」か)、次のステッ
プ22は、あまりに多数の決定変更を回避するために、
この決定を「平滑化」する。
【0029】フレームのエネルギーが所定の閾値以下で
ある場合、ステップ23は、信号がノイズであると決定
し、次のステップ22は、この決定を「平滑化」する。
【0030】平滑化ステップ22の後、次のステップ2
4は、現行フレームのエネルギーと、全ての帯域におけ
るエネルギーのスライド平均にある定数を加えたものに
等しい適応閾値とを比較する。
【0031】現行フレームのエネルギーが閾値より大き
い場合、次のステップ25は、ノイズを示すパラメータ
のスライド平均値を更新し、次いで、現行フレームの処
理は、終了26となる。
【0032】現行フレームのエネルギーが閾値より大き
くない場合、現行フレームの処理は、終了27となる。
【0033】図3は、規格G.729補遺B、11/9
6により既知の符号化方法による音声活動検知信号の平
滑化操作を詳しく示す。この平滑化は、以下の複数の基
準に基づいた最初の決定21(「音声」か「ノイズ」
か)に続く4個のステップを含む。
【0034】先行する1個のフレームに対する決定が
「音声」であった場合で、現行フレームの平均エネルギ
ーが、先行する複数フレームのエネルギーのスライド平
均値にある定数を加えたものより大きい場合、換言すれ
ば、現行フレームのエネルギーが、ノイズの平均エネル
ギーよりずっと大きい場合、第一のステップは「音声」
の決定を下すテスト31からなる。反対の場合には、
「ノイズ」の決定42が最終的に下される。
【0035】先行する2個のフレームに対する決定が
「音声」であった場合で、現行フレームの平均エネルギ
ーが先行するフレームのエネルギーのスライド平均にあ
る定数を加えたものより大きい場合、換言すれば、この
エネルギーが、先行フレームから現行フレームまでに著
しく減少しなかった場合、第二のステップ32から35
は「音声」の決定を確認するテスト32からなる。
【0036】この第二のステップは、さらに、カウンタ
をインクリメントし(操作33)、その内容を値4と比
較し(操作34)、次いで、現行フレームが、「音声」
と決定された連続フレームの第四のフレームである場
合、次のフレームに対してはテスト32の作動を解除す
る(操作35)。「音声」の決定が確認されない場合、
「ノイズ」の決定42が最終的に下される。
【0037】現行フレームに先行する10個のフレーム
に対して「ノイズ」の決定が下された場合(ステップ3
1から35で現行フレームに対して「音声」の決定が下
された場合)で、現行フレームのエネルギーが先行する
フレームのエネルギーにある定数を加えたもの未満であ
る場合、換言すれば、エネルギーが先行フレームから現
行フレームまでに著しく増加しなかった場合、第三のス
テップ36から39は最終的に「ノイズ」の決定42を
下すテスト36からなる。
【0038】この第三のステップは、さらに、現行フレ
ームが、「ノイズ」と決定された(テスト38)連続す
るフレームの10番目のフレームであった場合、フレー
ムのカウントを再初期化することによって(操作3
9)、テスト36を再初期化する(操作37)。
【0039】現行フレームのエネルギーが、先行する複
数フレームのエネルギースライド平均値の和に定数61
4を加えたもの未満である場合、第四のステップは最終
的に「ノイズ」の決定42を下すテスト40からなる。
換言すれば、「音声」の決定が最終的に確認されるのは
(操作41)フレームのエネルギーが、先行する複数フ
レームのエネルギーのスライド平均値よりもずっと大き
い場合だけである。そうでない場合、「ノイズ」の決定
42が最終的に下される。
【0040】この第四のステップ40(最終決定)は、
信号ノイズが著しい場合、誤った「ノイズ」の決定を供
給する。実際、このステップ40は、先行して行われた
複数の決定を考慮せずに、先行する複数フレームのエネ
ルギーのスライド平均値に定数614を加えた値とによ
って示される現行フレームと本質的な雑音とのエネルギ
ー差だけに基づいて、信号がノイズであると決定する。
事実、本質的な雑音が大きい場合、この定数614から
構成される閾値は、もはや有効ではない。
【0041】本発明による方法は、平滑化ステップに関
して、規格G.279.1、添付B、11/96により
既知の方法とは異なる。
【0042】図4は、本発明による方法における、音声
活動検知信号の平滑化の実施例を示すフローチャートで
ある。この平滑化は、複数の基準に基づいた初期の決定
21(「音声」または「ノイズ」)に続く4個のステッ
プを含む。この4個のステップの中で、3個のステップ
(テスト131、132、136)は、上記の3個のス
テップ(テスト31、32、36)と同じである。前述
の第四のステップ40は、削除されており、いわゆる予
備ステップが、上記第一のステップ31の前に付加され
ている。たとえば、フレームのエネルギーが弱くなると
き、いわゆる慣性カウントが付加され、「音声」の決定
を「ノイズ」の決定に変える前に、1フレームの持続時
間の5倍に等しい持続時間の慣性を得る。従って、この
持続時間は、この例では50msである。こうした慣性
カウントは、ノイズの平均エネルギーが、規格G.27
9.1、添付B、11/96により規定された量子化レ
ベルの8000レベルより大きくなるときしか有効でな
い。
【0043】追加される予備ステップ101から104
は、ステップ21の最初の決定が「音声」である場合、
慣性カウンタを0にリセットし(操作102)、さらに
テスト131に移行する。
【0044】ステップ21の最初の決定が「ノイズ」で
ある場合、現行フレームのエネルギーが固定の閾値より
大きいかどうか決定し、また、慣性カウンタの内容が6
未満で1より大きいかどうか決定する(操作103)。
【0045】この二つの条件が満たされる場合、(最初
の決定とは相反して)「音声」の決定を下し、次いで、
慣性カウンタを1単位インクリメントし(操作10
4)、さらに、テスト131に移行する。
【0046】あるいは、これらの条件の一方が満たされ
ない場合、最終的に「ノイズ」の決定を下す(14
2)。
【0047】先行する決定が「音声」であり、現行フレ
ームの平均エネルギーが、先行する複数フレームのエネ
ルギーのスライド平均に定数を加えたものより大きい場
合、第一のステップは、「音声」の決定を保持するテス
ト131(テスト31と同じ)からなる。
【0048】2個の先行フレームに対する決定が「音
声」であった場合で、現行フレームの平均エネルギー
が、先行する1フレームのエネルギーのスライド平均に
定数を加えたものより大きい場合、換言すれば、先行フ
レームから現行フレームまでエネルギーが著しく減らな
かった場合、第二のステップ132から135(ステッ
プ32から35と同じ)は「音声」の決定を下す。
【0049】この第二のステップ132から135は、
さらに、現行フレームが、「音声」と決定された連続す
る四番目のフレームである場合、次のフレームに対して
このテストの作動を停止する(カウンタをインクリメン
トし(133)、その内容と値4とを比較し(13
4)、値4に達している場合は作動停止する(13
5))。 最後の10個のフレームに対して「ノイズ」
の決定が下された場合で、現行フレームのエネルギーが
先行する1フレームのエネルギーに定数を加えたものよ
り小さい場合、換言すれば、先行フレームから現行フレ
ームまでエネルギーが著しく増加しなかった場合、第三
のステップ136から139、143(ステップ36か
ら39とは少し異なる)は最終的に「ノイズ」の決定を
下す(142)。
【0050】さらに、現行フレームが、「ノイズ」と決
定された連続する10番目のフレームである場合、この
第三のステップはフレームカウントを再初期化すること
によりテスト136を再初期化する(カウンタをインク
リメントし(137)、カウンタの内容と値10とを比
較し(138)、値10に達している場合カウンタを0
に再リセットする(139))。第三のステップは、前
述の既知の方法に対して変更されている。何故なら、こ
のステップは、テスト136と慣性カウンタとのあらゆ
る相互作用を回避するために、さらに慣性カウンタを値
6にしているからである(操作143)。ステップ40
のような第四のステップは存在しない。
【0051】図5において、曲線E1、E2は、様々な
SN比の値に対して、既知の方法と、本発明による方法
とによる誤り率をそれぞれ示している。
【0052】図6において、曲線L1、L2は、様々な
SN比の値に対して、既知の方法と、本発明による方法
とによる音声損失率をそれぞれ示している。
【0053】以上から、音声活動検知動作が、騒音環境
において、大幅に改善されることが分かる。全体の誤り
率が減少し、特に、失われる会話の割合が著しく減って
いる。従って、会話の完全性が保護され、会話は理解し
やすい。
【図面の簡単な説明】
【図1】本発明による方法を実施するコーダの実施例の
機能図である。
【図2】G.729補遺B、11/96規格により既知
の符号化方法による「音声」/「ノイズ」決定のフロー
チャートである。
【図3】G.729補遺B、11/96規格により既知
の符号化方法による音声活動検知信号の平滑化操作を詳
しく示す図である。
【図4】本発明による方法における、音声活動検知信号
の平滑化の実施例を示すフローチャートである。
【図5】SN比の様々な値に対して、既知の方法と本発
明による方法とによる誤り率をそれぞれ示す図である。
【図6】SN比の様々な値に対して、既知の方法と本発
明の方法とによる会話損失率をそれぞれ示す図である。
【符号の説明】
1 入力端子 2 回路 3、6 スイッチ 4、5 フレーム符号化回路 7 音声活動検知機 8 出力端子

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 信号の音声活動を検知する方法であっ
    て、信号を複数フレームに分割し、各フレームに対して
    下される「音声」か「ノイズ」かの最初の決定の平滑化
    ステップを含み、この平滑化ステップが、 フレームnに対して最初の決定が「音声」で、 フレームn−2に対して最終決定が「ノイズ」で、 フレームn−1のエネルギーが、フレームn−2のエネ
    ルギーより大きく、 フレームnのエネルギーがフレームn−2のエネルギー
    より大きい場合、n番目のフレームに対して「音声」の
    最終決定を下すステップを含むことを特徴とする方法。
  2. 【請求項2】 「音声」の最終決定がフレームnに対し
    て下された場合、iが一定の慣性時間を定義する整数で
    あるとき、さらに、フレームn+1からn+iに対して
    「ノイズ」のあらゆる最終決定を回避することを特徴と
    する請求項1に記載の方法。
  3. 【請求項3】 平滑化ステップが、フレームnに対し
    て、 最初の決定が「音声」である場合、慣性カウンタを0に
    初期化し(102)、 最初の決定が「ノイズ」である場合、フレームnのエネ
    ルギーが閾値より大きいかどうか決定し、また慣性カウ
    ンタの内容が固定された閾値より小さく、かつ1より大
    きいかどうか決定し(103)、次いで、 この三つの条件が満たされる場合、「音声」の決定を下
    し、慣性カウンタを1単位インクリメントし(10
    4)、 あるいは、これらの条件の1つが満たされない場合、
    「ノイズ」の決定を下すステップを含むことを特徴とす
    る請求項1に記載の方法。
  4. 【請求項4】 音声活動の検知装置を含む音声信号コー
    ダであって、信号を複数フレームに分割し、装置は各フ
    レームに対して下された「音声」か「ノイズ」かの最初
    の決定を平滑化する手段を含み、この平滑化手段は、 フレームnに対する最初の決定が「音声」で、 フレームn−2に対する最終決定が「ノイズ」で、 フレームn−1のエネルギーがフレームn−2のエネル
    ギーより大きく、 フレームnのエネルギーがフレームn−2のエネルギー
    より大きい場合、n番目のフレームに対して「音声」の
    最終決定を下す手段を含むことを特徴とするコーダ。
  5. 【請求項5】 平滑化手段は、「音声」の最終決定がフ
    レームnに対して下された場合、iが一定の慣性時間を
    定義する整数であるとき、フレームn+1からn+iに
    対して「ノイズ」のあらゆる最終決定を回避する手段を
    含むことを特徴とする請求項4に記載のコーダ。
  6. 【請求項6】 平滑化手段は、 フレームnに対して最初の決定が「音声」である場合、
    慣性カウンタを0に初期化し(102)、 最初の決定が「ノイズ」である場合、フレームnのエネ
    ルギーが閾値より大きいかどうか決定し、また慣性カウ
    ンタの内容が固定された閾値より小さく、かつ1より大
    きいかどうか決定し(103)、次いで、 この三つの条件が満たされている場合、「音声」の決定
    を下し、慣性カウンタを1単位インクリメントし(10
    4)、 あるいは、これらの条件の1つが満たされない場合、
    「ノイズ」の決定を下す手段を含むことを特徴とする請
    求項4に記載のコーダ。
JP2002168375A 2001-06-11 2002-06-10 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ Expired - Fee Related JP3992545B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0107585 2001-06-11
FR0107585A FR2825826B1 (fr) 2001-06-11 2001-06-11 Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006087186A Division JP2006189907A (ja) 2001-06-11 2006-03-28 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ

Publications (2)

Publication Number Publication Date
JP2003005772A true JP2003005772A (ja) 2003-01-08
JP3992545B2 JP3992545B2 (ja) 2007-10-17

Family

ID=8864153

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002168375A Expired - Fee Related JP3992545B2 (ja) 2001-06-11 2002-06-10 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
JP2006087186A Pending JP2006189907A (ja) 2001-06-11 2006-03-28 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2006087186A Pending JP2006189907A (ja) 2001-06-11 2006-03-28 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ

Country Status (8)

Country Link
US (1) US7596487B2 (ja)
EP (1) EP1267325B1 (ja)
JP (2) JP3992545B2 (ja)
CN (1) CN1162835C (ja)
AT (1) ATE269573T1 (ja)
DE (1) DE60200632T2 (ja)
ES (1) ES2219624T3 (ja)
FR (1) FR2825826B1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756709B2 (en) * 2004-02-02 2010-07-13 Applied Voice & Speech Technologies, Inc. Detection of voice inactivity within a sound stream
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CN1954365B (zh) * 2004-05-17 2011-04-06 诺基亚公司 使用不同编码模型的音频编码
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
KR20080059881A (ko) * 2006-12-26 2008-07-01 삼성전자주식회사 음성 신호의 전처리 장치 및 방법
JP5712220B2 (ja) * 2009-10-19 2015-05-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声活動検出のための方法および背景推定器
CN102137194B (zh) * 2010-01-21 2014-01-01 华为终端有限公司 一种通话检测方法及装置
EP3726530B1 (en) * 2010-12-24 2024-05-22 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting a voice activity in an input audio signal
WO2012152323A1 (en) * 2011-05-11 2012-11-15 Robert Bosch Gmbh System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure
US20130090926A1 (en) * 2011-09-16 2013-04-11 Qualcomm Incorporated Mobile device context information using speech detection
CN103325386B (zh) * 2012-03-23 2016-12-21 杜比实验室特许公司 用于信号传输控制的方法和系统
CN103325385B (zh) * 2012-03-23 2018-01-26 杜比实验室特许公司 语音通信方法和设备、操作抖动缓冲器的方法和设备
CN105681966B (zh) * 2014-11-19 2018-10-19 塞舌尔商元鼎音讯股份有限公司 降低噪音的方法及电子装置
US10928502B2 (en) * 2018-05-30 2021-02-23 Richwave Technology Corp. Methods and apparatus for detecting presence of an object in an environment
CN109360585A (zh) * 2018-12-19 2019-02-19 晶晨半导体(上海)股份有限公司 一种语音激活检测方法
CN113555025A (zh) * 2020-04-26 2021-10-26 华为技术有限公司 一种静音描述帧发送、协商方法及装置
CN115132231B (zh) * 2022-08-31 2022-12-13 安徽讯飞寰语科技有限公司 语音活性检测方法、装置、设备及可读存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0240700A (ja) * 1988-08-01 1990-02-09 Matsushita Electric Ind Co Ltd 音声検出装置
JPH0424692A (ja) * 1990-05-18 1992-01-28 Ricoh Co Ltd 音声区間検出方式
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
US5583961A (en) * 1993-03-25 1996-12-10 British Telecommunications Public Limited Company Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
JP2897628B2 (ja) * 1993-12-24 1999-05-31 三菱電機株式会社 音声検出器
US5826230A (en) * 1994-07-18 1998-10-20 Matsushita Electric Industrial Co., Ltd. Speech detection device
JP3109978B2 (ja) * 1995-04-28 2000-11-20 松下電器産業株式会社 音声区間検出装置
US5819217A (en) * 1995-12-21 1998-10-06 Nynex Science & Technology, Inc. Method and system for differentiating between speech and noise
JP3297346B2 (ja) * 1997-04-30 2002-07-02 沖電気工業株式会社 音声検出装置
US6188981B1 (en) * 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
JP3759685B2 (ja) * 1999-05-18 2006-03-29 三菱電機株式会社 雑音区間判定装置,雑音抑圧装置及び推定雑音情報更新方法
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
DE60139144D1 (de) * 2000-11-30 2009-08-13 Nippon Telegraph & Telephone Audio-dekodierer und audio-dekodierungsverfahren

Also Published As

Publication number Publication date
US7596487B2 (en) 2009-09-29
FR2825826B1 (fr) 2003-09-12
US20020188442A1 (en) 2002-12-12
ATE269573T1 (de) 2004-07-15
ES2219624T3 (es) 2004-12-01
JP3992545B2 (ja) 2007-10-17
JP2006189907A (ja) 2006-07-20
CN1391212A (zh) 2003-01-15
FR2825826A1 (fr) 2002-12-13
DE60200632T2 (de) 2004-12-23
EP1267325B1 (fr) 2004-06-16
CN1162835C (zh) 2004-08-18
DE60200632D1 (de) 2004-07-22
EP1267325A1 (fr) 2002-12-18

Similar Documents

Publication Publication Date Title
JP2006189907A (ja) 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
US5657422A (en) Voice activity detection driven noise remediator
KR100581413B1 (ko) 음성 복호기에서 프레임 오류 은폐를 위한 개선된스펙트럼 매개변수 대체
JP4236726B2 (ja) 音声活動検出方法及び音声活動検出装置
JP4146489B2 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
KR100455225B1 (ko) 보코더에 의해 인코드되는 다수의 프레임들에 잔존 프레임들을 추가하는 방법 및 장치
US7246057B1 (en) System for handling variations in the reception of a speech signal consisting of packets
RU2120667C1 (ru) Способ и устройство для маскирования отброшенных кадров
RU2417456C2 (ru) Системы, способы и устройства для обнаружения изменения сигналов
EP0877355A2 (en) Speech coding
EP0677202B1 (en) Discriminating between stationary and non-stationary signals
KR20050061615A (ko) 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법
JP3273599B2 (ja) 音声符号化レート選択器と音声符号化装置
KR101648290B1 (ko) 컴포트 노이즈의 생성
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
JPH09506187A (ja) Adpcm音声コーダのための適応誤差制御
US8175867B2 (en) Voice communication apparatus
US7962334B2 (en) Receiving device and method
JP3603470B2 (ja) 音声品質改善装置
US8204753B2 (en) Stabilization and glitch minimization for CCITT recommendation G.726 speech CODEC during packet loss scenarios by regressor control and internal state updates of the decoding process
JP3315708B2 (ja) 比較減衰器付音声符復号器
US20040138878A1 (en) Method for estimating a codec parameter
EP3787270A1 (en) Methods and devices for improvements relating to voice quality estimation
JP3603469B2 (ja) 音声品質改善装置
KR100547898B1 (ko) 오디오 정보 제공 시스템 및 그 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20051221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070302

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070724

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130803

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees