JP2002366174A

JP2002366174A - Ｇ．７２９の付属書ｂに準拠した音声アクティビティ検出回路を収束させるための方法

Info

Publication number: JP2002366174A
Application number: JP2002162041A
Authority: JP
Inventors: Dunling Li; リダンリン; Daniel C Thomas; シー、トーマスダニエル; Gokhan Sisli; シスリゴカーン
Original assignee: Telogy Networks Inc
Current assignee: Telogy Networks Inc
Priority date: 2001-06-01
Filing date: 2002-06-03
Publication date: 2002-12-20
Also published as: US7043428B2; EP1265224A1; US20020188445A1; US7031916B2; US20020184015A1

Abstract

(57)【要約】【課題】Ｇ．７２９の付属書Ｂの方法を使って得られ
たバックグラウンドノイズ特性の発散問題を解決するこ
と【解決手段】ＩＴＵ（国際通信連合）勧告Ｇ．７２９
の付属書Ｂの音声アクティビティ検出（ＶＡＤ）デバイ
スを初期化する方法は、信号の特性を定める一組のパラ
メータを信号から抽出する工程（１６）と、前記パラメ
ータの組から前記信号のエネルギー測度を計算する工程
と、前記エネルギー測度と基準値とを比較する工程（２
３）と、信号のノイズ特性の平均値に対する初期値を決
定する工程（２０）と、前記エネルギー測度が前記基準
レベルに等しくなったかまたはこれを越えた回数をカウ
ントする工程（２６）とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はＧ．７２９の音声ア
クティビティ検出（ＶＡＤ）デバイスによる通信チャン
ネルにおけるバックグラウンドノイズエネルギーの推定
を改善することに関する。より詳細には、本発明は平均
バックグラウンドノイズエネルギーのより良好な初期推
定値を設定し、実際の値に向けて平均バックグラウンド
ノイズエネルギーのその後のすべての推定値を収束させ
るものである。

【０００２】

【従来の技術】国際電気通信連合（ＩＴＵ）勧告Ｇ．７
２９の付属書Ｂは、信号内で音声アクティビティが検出
されない時に、着信信号内の受信されたバックグラウン
ドノイズに関する情報を伝送するための圧縮方式につい
て記述している。この圧縮方式は勧告Ｖ．７０を満たす
ターミナルに対しては最適となっている。本願ではこの
文書のうちのＩＴＵ−ＴＧ．７２９および付属書Ｂの
内容を参考例として援用する。

【０００３】従来のスピーチエンコーダ／デコーダ（コ
ーデック）は着信信号内で音声アクティビティが検出さ
れない時の期間中に通信リンクのバックグラウンドノイ
ズをシミュレートするために合成されたコンフォート
（comfort）ノイズを使用している。バックグラウンド
ノイズを合成することによりリンクの通信チャンネルを
通して実際のバックグラウンドノイズに関する情報をほ
とんどまたは全く送る必要がなくなる。しかしながら、
バックグラウンドノイズが統計的に定常状態となってい
ない（すなわち時間と共に分布関数が変化する）場合、
シミュレートされたコンフォートノイズは最初のバック
グラウンドノイズの自然さを与えることはできない。従
って、着信信号内でスピーチ信号が検出されない時に、
合成されたノイズの品位を改善するためにバックグラウ
ンドノイズに関するある情報を時々送ることが望まし
い。着信信号のうちのデジタル化されたフレーム（すな
わち１０ｍｓ部分）におけるバックグラウンドノイズの
適当な表示は音声信号を適当に表示するのに必要な数よ
りも実質的に少ない、１５程度のデジタルビットで達成
できる。勧告Ｇ．７２９の付属書Ｂは着信信号内で音声
アクティビティが検出されない時にこの情報を自動的に
送信する代わりにバックグラウンドノイズフレームの先
に送信した特徴に関し、かなりの変化が検出された時に
しかバックグラウンドノイズフレームの表示を伝送しな
いことを提案している。着信信号において音声アクティ
ビティがない時に、チャンネルを通して情報がほとんど
または全く伝送されないので、この圧縮方式によりかな
りの量のチャンネルバンド幅が保存される。

【０００４】図１は勧告Ｇ．７２９の付属書Ｂに準拠し
た半デュプレックス通信リンクを示している。このリン
クの送信側では着信信号におけるノイズまたは音声エネ
ルギーの検出を表示するためのデジタル出力をＶＡＤモ
ジュール１が発生する。出力値「１」は音声アクティビ
ティの存在が検出されたことを示し、出力値「０」は音
声アクティビティが存在しないことを示す。ＶＡＤ１が
音声アクティビティを検出した場合、検出された音声信
号のデジタル表示を符号化するのにＧ．７２９スピーチ
エンコーダ３が呼び出される。しかしながら、ＶＡＤ１
が音声アクティビティを検出しない場合、検出されたバ
ックグラウンドノイズ信号のデジタル表示を符号化する
のに不連続送信／コンフォートノイズ発生器（ノイズ）
エンコーダ２が使用される。これら音声信号およびバッ
クグラウンドノイズ信号のデジタル表示７は、連続する
１０ｍｓの期間中に取り込まれた着信アナログ信号のサ
ンプルからの情報を含むデータフレームにフォーマット
化される。

【０００５】デコーダ側では各フレームに対する受信さ
れたビットストリームが検査される。フレームに対する
ＶＡＤフィールドが「１」の値を含む場合、デジタル表
示内に含まれる情報を使ってフレームに対するアナログ
信号を再構成するために音声デコーダ６が使用される。
フレームに対するＶＡＤフィールドが「０」の値を含む
場合、関連するエンコーダが提供する情報を使ってバッ
クグラウンドノイズを合成するのにノイズデコーダ５が
使用される。

【０００６】フレームが音声アクティビティを含むの
か、ノイズを含むのかを判断するために、ＶＡＤ１はフ
レーム内の情報の４つのパラメータ特性を抽出し、これ
らを分析する。これら特性としてはフルバンドノイズエ
ネルギーと、ローバンドノイズエネルギーと、ラインス
ペクトル周波数（ＬＳＦ）の組と、ゼロクロスレートと
が挙げられる。現在フレームの抽出された特性とバック
グラウンドノイズ特性の継続平均値との間の測度差がフ
レーム毎に計算される。小さい差が検出された場合、現
在フレームの特性はバックグラウンドノイズに対する継
続平均値の特性との相関性が高く、現在フレームは音声
アクティビティよりもバックグラウンドノイズを含む可
能性のほうがより高い。大きな差が検出された場合、現
在フレームは差分タイプの信号、例えば音声信号を含む
可能性のほうがより高い。

【０００７】ＩＴＵＧ．７２９の付属書Ｂに記載され
ているような４つの測度差のスペースでのマルチ境界判
断領域を使って着信フレームのコンテントに関する初期
のＶＡＤ判断が行われる。その後、現在フレームの検出
されたエネルギーと隣接する過去のフレームの検出され
たエネルギーとの関係に基づき、最終ＶＡＤ判断が行わ
れる。この最終判断工程は、状態遷移の回数を減らす作
用がある。

【０００８】バックグラウンドノイズ特性の継続平均値
はバックグラウンドノイズが存在し、スピーチ信号が存
在しない時にしか更新されない。従って、ＶＡＤ１がノ
イズアクティビティしか含まない着信フレームを識別し
た時にしか更新は行われない。着信フレームの特性は適
用型スレッショルドと比較され、次の３つの条件が満た
された場合にしか更新が行われない。

【０００９】

【数１】

【００１０】ここで、Ｅ_f＝現在フレームのフルバンド
ノイズエネルギーであり、次の式を使って計算される。

【００１１】

【数２】

【００１２】ここで、Ｒ（０）は最初の自己相関係数で
あり、Ｅ_f,avg.＝平均フルバンドノイズエネルギー、ＲＣ（１）＝最初の反射係数であり、 ∈ＳＤ＝現在フレームに対して測定されたスペクトル距
離とスペクトル距離の継続（running）平均値との差で
あり、０．０６３７の∈ＳＤは２５４．６Ｈｚに対応す
る。

【００１３】更に、フルバンドノイズエネルギーＥ_fは
次の条件に従ってノイズフレームのカウンターＣ_nのよ
うに更新される。

【００１４】

【数３】

【００１５】ノイズのフレームが検出されると、一次の
自己回帰（ＡＲ）方式を使って現在フレームの分布を示
すためにバックグラウンドノイズ特性の継続平均値を更
新する。異なるパラメータに対しては異なるＡＲ係数が
使用され、通信開始時、またはノイズ特性の大きい変化
が検出された時に、係数の異なる組が使用される。設定
されたリンクのうちの最初の３２個のフレーム（すなわ
ち最初の３２０ｍｓ）に対し、特性を平均化することに
より、バックグラウンドノイズ特性の継続平均値が初期
化される。３２個のフレームのカウントには−７０ｄＢ
ｍよりも低いフルバンドノイズエネルギーＥ_fを有する
フレームは含まれず、これらフレームは初期継続平均値
を得るのに使用されない。

【００１６】バックグラウンドノイズ特性の継続平均値
を更新するための、上記Ｇ．７２９の付属書Ｂによって
定められた条件に基づくと、継続平均値を現在および将
来のフレームのバックグラウンドノイズ特性から実質的
に発散させるような一般的な状況が存在する。継続平均
値を更新するかどうかを決定するための条件は、継続平
均値の値に依存しているので、これらの状況が生じる。
短時間の間に発生するバックグラウンドノイズ特性の実
質的な変動は、現在のバックグラウンドノイズ特性とこ
れら特性の継続平均値によって示されるような予測され
るバックグラウンドノイズ特性との相関性を減少させ
る。相関性が発散するにつれ、ＶＡＤ１はバックグラウ
ンドノイズのフレームと音声アクティビティを含むフレ
ームとを区別することがより困難となる。発散値が臨界
点に達すると、ＶＡＤ１はそれ以上バックグラウンドノ
イズと音声アクティビティとを正確に区別することがで
きなくなるので、バックグラウンドノイズ特性の継続平
均値を更新しなくなる。更に、ＶＡＤ１はその後のすべ
ての着信信号を音声信号として解釈し、よって音声アク
ティビティとノイズとを区別することによってバンド幅
を節約することができなくなる。

【００１７】

【発明が解決しようとする課題】勧告Ｇ．７２９の付属
書Ｂに記述されているアルゴリズムに対しある変更を行
わない場合、バックグラウンドノイズ特性の継続平均値
と実際の特性とが一旦クリティカルに発散状態となる
と、ＶＡＤ１は設定されたリンクの残りの期間中に、意
図したようには作動しなくなる。次のようなときに実際
のアプリケーションでは重大な発散が生じる。

【００１８】１．ＶＡＤがチャンネルリンクの開始時お
よび３２０ｍｓよりも長い間に極めて低レベルの信号を
受信した時。２．ＶＡＤがチャンネルリンクの開始時および３２０ｍ
ｓよりも長い間に、その後の信号を表示しない信号を受
信した時。３．バックグラウンドノイズの特性が急激に変化した
時。

【００１９】第１の状況では、バックグラウンドノイズ
特性の継続平均を含むベクトルはすべてゼロで初期化さ
れる。第２の状況では、ベクトルは実際のバックグラウ
ンドノイズ特性から除かれた値を含む。第３の状況で
は、スペクトル距離の差、すなわち∈ＳＤが０．０６３
７よりも小さくなることはない。ＶＡＤ１が通信チャン
ネル４を通してノイズの伝達に大幅にリソースを割り当
てるにつれ、ＶＡＤ１はそれに比例してチャンネル４の
効率を低下させる。非効率的な通信チャンネルは高価に
つくので、本発明はこれら欠陥を克服せんとするもので
ある。

【００２０】完全性について、以下、バックグラウンド
ノイズの特徴を定めるのに使用されるパラメータの記述
について説明する。着信信号のうちの１０ｍｓ部分を示
す情報のフレームから抽出される自己相関係数の組を次
の式で表示するものとする。

【００２１】

【数４】

【００２２】勧告Ｇ．７２９に従い、自己相関係数から
一組のラインスペクトル周波数が誘導され、これは次の
式で示される。

【００２３】

【数５】

【００２４】先に示したように、フルバンドエネルギー
Ｅ_fは次の式によって得られる。

【００２５】

【数６】

【００２６】ここで、Ｒ（０）は第１の自己相関係数で
ある。ゼロからある周波数の上限Ｆ ₁までの周波数スペ
クトルの間で測定される低バンドエネルギーは次の式に
よって得られる。

【００２７】

【数７】

【００２８】ここで、ｈはＦ₁Ｈｚにカットオフ周波数
を有するＦＩＲフィルタのインパルス応答であり、Ｒは
各対角線上に自己相関係数を有するテプリッツ（Toepli
tz）自己相関マトリックスである。

【００２９】正規化されたゼロクロスレートは次の式で
示される。

【００３０】

【数８】

【００３１】ここで、ｘ（ｉ）はあらかじめ処理した入
力信号である。

【００３２】最初の３２個のフレームに対し、｛ＬＳＦ
_avg｝と示されるバックグラウンドノイズの平均スペク
トルパラメータはフレームのラインスペクトル周波数の
平均値として初期化され、ＺＣ_avgと示されるバックグ
ラウンドノイズゼロクロスレートの平均値はフレームの
ゼロクロスレートの平均値ＺＣとして初期化される。Ｅ
_f,avgと示されるフルバンドのバックグラウンドノイズ
エネルギーの継続平均値およびＥ_l,avgと示されるバッ
クグラウンドノイズの低レベルエネルギーは次のように
初期化される。初期化方法はまず最初の３２個のフレー
ムに対するフレームエネルギーの平均値Ｅ_fをＥ_n,avgに
置換する。これら３つのパラメータ｛ＬＳＦ_avg｝、Ｚ
Ｃ_avgおよびＥ_n,avgは−７０ｄＢｍより大きいエネルギ
ー、すなわちＥ_fを有するフレームしか含まない。その
後、初期化方法は次のようにパラメータを設定する。

【００３３】

【数９】

【００３４】先の１２８個のフレームに対し、上記最小
エネルギーパラメータＥ_minを最小値Ｅ_fとして計算す
る。

【００３５】現在のフレームパラメタータとバックグラ
ウンドノイズパラメータの継続平均値との差から４つの
差の値が発生される。現在フレーム

【外１】ベクトルとスペクトル歪の継続平均値｛ＬＳＦ_avg｝と
の差の平方の和として、スペクトル歪の差の値が発生さ
れ、この値は次の式によって表示できる。

【００３６】

【数１０】

【００３７】フルバンドエネルギーの差の値は次の式で
示される。

【００３８】

【数１１】

【００３９】ここで、Ｅ_fは現在フレームの低バンドエ
ネルギーである。

【００４０】低バンドエネルギーの差の値は次の式で示
される。

【００４１】

【数１２】

【００４２】ここで、Ｅ_lは現在フレームの低バンドエ
ネルギーである。

【００４３】最後に、ゼロクロスレートの差の値は次の
式で示される。

【００４４】

【数１３】

【００４５】ここで、ＺＣは現在フレームのゼロクロス
レートである。

【００４６】

【課題を解決するための手段】ＩＴＵＧ．７２９の付
属書Ｂに準拠した通信では問題が生じるので、この問題
に対する解決案はこれら条件から逸脱することなく、勧
告を改善しなければならない。これを行うためのキー
は、バックグラウンドノイズパラメータを更新するため
の条件を、更新されたパラメータの値から独立させるこ
とである。この解決案は次のことから成る。

【００４７】１．（ａ）リンクの呼設定の開始時に設定
されたバックグラウンドノイズ特性を更新し、（ｂ）初
期化期間の終了を決定するのに使用されるフレームカウ
ントに貢献することから極めて低いレベル、例えば−７
０ｄＢｍより低いレベルを有するすべてのフレームを除
く工程。２．上記工程（１）の条件を満たすすべてのフレームに
対し、バックグラウンドノイズ特性を平均する補助バッ
クグラウンドノイズ識別アルゴリズムを提供する工程。３．Ｇ．７２９の付属書Ｂに記載された方法を使って得
られた平均バックグラウンドノイズ特性と補助アルゴリ
ズムを使って得られた平均バックグラウンドノイズ特性
とを比較する工程。４．Ｇ．７２９の付属書Ｂの方法を使って得られたバッ
クグラウンドノイズ特性と補助アルゴリズムを使って得
られたバックグラウンドノイズ特性の２つの組が実質的
に発散した時に、Ｇ．７２９の付属書Ｂの方法を使って
得られたバックグラウンドノイズ特性を補助アルゴリズ
ムを使用して得られたバックグラウンドノイズ特性に置
換する工程。

【００４８】補助アルゴリズムは最も可能性の高いノイ
ズエネルギーと音声エネルギーの領域の間のマージンを
維持するのに使用される２つのスレッショルドを設定す
る。一方のスレッショルドはノイズエネルギーの上方の
境界を識別し、他方のスレッショルドは音声エネルギー
の下方の境界を識別する。現在フレームのブロックエネ
ルギーがノイズエネルギースレッショルドよりも小さい
場合、現在フレームの信号から抽出されたパラメータを
使って補助アルゴリズムのための予想バックグラウンド
ノイズの特性を定める。現在フレームのエネルギーが音
声スレッショルドよりも大であれば、現在フレームの信
号から抽出したパラメータを使って補助アルゴリズムに
対する現在の音声エネルギーの特性を定める。補助アル
ゴリズムのためのバックグラウンドノイズまたはノイズ
エネルギースレッショルドおよび音声エネルギースレッ
ショルドの特性を更新するのに、ノイズスレッショルド
と音声スレッショルドとの間にあるブロックエネルギー
は使用しない。

【００４９】現在フレームのブロックエネルギーが２つ
のスレッショルドレベルの間のエネルギー範囲外にある
時の、ノイズエネルギースレッショルドおよび音声エネ
ルギースレッショルドの特性とブロックエネルギーがノ
イズスレッショルド以下の時にバックグラウンドノイズ
の継続平均値の双方を更新するために、補助アルゴリズ
ムが使用される。Ｇ．７２９の付属書Ｂのアルゴリズム
を通して得られるよりもバックグラウンドノイズ特性の
継続平均値をより頻繁な更新をサポートするようにノイ
ズスレッショルドおよび音声スレッショルドが決定され
るので、補助アルゴリズムの継続平均値が次のフレーム
に対するバックグラウンドノイズ特性の予想値を表す可
能性のほうがより高い。Ｇ．７２９の付属書Ｂのアルゴ
リズムによるバックグラウンドノイズの特性決定を、補
助アルゴリズムによるバックグラウンドノイズの特性決
定に置換することにより、ノイズエネルギーの推定値と
音声エネルギーの推定値との結合を外し、発散が生じた
ときにこれらをＧ．７２９の付属書Ｂの特性決定から独
立したものにすることができる。ノイズスレッショルド
と音声スレッショルドの双方は１回の更新期間中の最小
ブロックエネルギーおよび最大ブロックエネルギーに基
づくものであり、１．２８秒ごとに更新される。

【００５０】以下、図面を参照し、本発明の好ましい実
施例について説明する。

【００５１】

【発明の実施の形態】図２はＧ．７２９の付属書Ｂの通
信チャンネルの入力端におけるバックグラウンドノイズ
エネルギー８および音声エネルギー９に対する代表的な
確率分布関数を示す。この図では、水平軸１２はエネル
ギーレベルの領域を示し、垂直軸１３はプロットされた
関数８、９に対する確率密度範囲を示す。バックグラウ
ンドノイズだけを含む可能性のあるエネルギー領域の上
の境界をマークするために、ダイナミックノイズスレッ
ショルド１０を数学的に決定し、これを使用する。同じ
ように、音声エネルギーを含む可能性のあるエネルギー
領域の下方の境界をマークするためにダイナミック音声
スレッショルド１１を数学的に決定し、これを使用す
る。これらダイナミックスレッショルド１０、１１は、
確率分布関数が設定される時間θの間、ノイズエネルギ
ー確率分布関数８および音声エネルギー確率分布関数９
に従って変化する。

【００５２】設定された確率分布関数のうちの各期間θ
の間のノイズスレッショルド１０および音声スレッショ
ルド１１を決定するための補助アルゴリズムを使用す
る。この期間は長さが１．２８秒であることが好ましい
ので、ノイズスレッショルドおよび音声スレッショルド
は１．２８秒ごとに更新される。次のようにノイズスレ
ッショルド１０および音声スレッショルド１１を更新す
るのに補助アルゴリズムが使用される。

【００５３】Ｅ_max＝現在の更新期間θ_p中に測定される
最大ブロックエネルギーとし、Ｅ_min＝現在の更新期間
θ_p中に測定される最小ブロックエネルギーとし、Ｔ₁＝
Ｅ_min＋（Ｅ_max−Ｅ_min）／３２とし、Ｔ₂＝４×Ｅ_min
とする。

【００５４】次の式からノイズエネルギースレッショル
ドＴ_noiseおよび音声エネルギースレッショルドＴ_voice
を計算する。

【００５５】

【数１４】

【００５６】明細書に記載したように、まず最初に２つ
の値Ｔ₁とＴ₂のうちの小さい方を決定することにより、
現在の更新期間θ_pの間にＴ_noiseを計算する。Ｔ₁とＴ₂
のうちの小さい方の値に２を掛け、その積と−２１ｄＢ
ｍの値とを比較する。最後に−２１ｄＢｍと前の文章で
説明した積のうちの小さい方の値を現在の更新期間θ _p
中のノイズスレッショルドを識別するパラメータとして
指定する。

【００５７】明細書で同じように説明したように、まず
２つの値Ｔ₁とＴ₂のうちの大きい方を決定することによ
り、現在の更新期間θ_pにおいてＴ_voiceを計算する。Ｔ
₁とＴ₂のうちの大きい方の値に∀の値を掛け、その積と
−６５ｄＢｍの値とを比較する。次に−６０ｄＢｍと先
の文章で説明した積のうちの大きい方の値と−１７ｄＢ
ｍの値とを比較し、現在の更新期間θ_pにおける音声ス
レッショルドを識別するパラメータとしてこれら２つの
値のうちの小さい方の値を指定する。

【００５８】これとは別に、組｛Ｅ_voice（１）、Ｅ
_voice（２）、Ｅ_voice（３）、．．．．、Ｅ
_voice（ｊ）｝および｛Ｅ_noise（１）、Ｅ
_noise（２）、Ｅ_noise（３）、．．．．、Ｅ
_noise（ｊ）｝（ここで、ｊは更新期間における最大の
値のブロックインデックスである）から各更新期間θに
おけるノイズ確率分布関数および音声確率分布関数を決
定できる。これら組の値は次の式を使って計算される。

【００５９】

【数１５】

【００６０】各更新期間θに対するノイズエネルギース
レッショルドおよび音声エネルギースレッショルドを更
新する他に、補助アルゴリズムは２つのスレッショルド
とデジタル化された信号の各着信フレームのうちのブロ
ックエネルギーとを比較し、補助バックグラウンドノイ
ズ特性の継続平均値をいつ更新するかを判断する。現在
フレームのブロックエネルギーがノイズスレッショルド
よりも低下したときはいつも、補助バックグラウンドノ
イズ特性の継続平均値を更新する。現在フレームのブロ
ックエネルギーが音声スレッショルドを越える時はいつ
も、音声エネルギーレベルの特性を更新する。スレッシ
ョルドに等しいか、または２つのスレッショルドの間に
あるブロックエネルギーを有するフレームは、補助バッ
クグラウンドノイズ特性の継続平均値または音声エネル
ギー特性のいずれかを更新するのに使用しない。

【００６１】補助ＶＡＤアルゴリズムは基本アルゴリズ
ムであるＧ．７２９の付属書ＢのＶＡＤアルゴリズムと
共に作動する。本明細書の発明が解決しようとする課題
の欄に記載したように、この基本ＶＡＤアルゴリズムは
着信フレームの特性と適応型スレッショルドとを比較す
る。次の３つの条件が満たされた場合にしか基本バック
グラウンドノイズ特性の更新を行わない。

【００６２】

【数１６】

【００６３】現実のシナリオでは、補助アルゴリズムに
対するバックグラウンドノイズ特性の継続平均値は基本
アルゴリズムよりもより頻繁に更新されることになる。
従って、補助アルゴリズムのバックグラウンドノイズ特
性の継続平均値のほうがバックグラウンドノイズの次の
着信フレームに対する実際の特性を示す可能性が高い。

【００６４】補助アルゴリズムにより、基本バックグラ
ウンドノイズ特性の継続平均値に対する更新を生じさせ
ない、連続する着信フレームのカウント数が維持され
る。このカウント数が臨界値に達すると、基本バックグ
ラウンドノイズ特性の継続平均値が実際の現在の値から
実質的に発散し、Ｇ．７２９の付属書Ｂのアルゴリズム
を使った再収束を単独で行うことはできなくなる。しか
しながら、補助バックグラウンドノイズ特性の継続平均
値を基本バックグラウンドノイズ特性の継続平均値に置
換することによって収束を設定できる。

【００６５】従って、補助アルゴリズムは基本アルゴリ
ズムの情報に相補的な情報を提供する。この情報はバッ
クグラウンドノイズ特性の期待値と実際の現在の値との
収束を維持するのに使用される。更に、補助アルゴリズ
ムは極端に低振幅の信号が初期化期間中にバックグラウ
ンドノイズ特性の継続平均値にバイアスをかけるのを防
止する。変則的なバイアスを解消することにより、補助
アルゴリズムは基本バックグラウンドノイズ特性の初期
の継続平均値を実際の値に向けて良好に収束させる。

【００６６】図３および４を参照し、次の章でＧ．７２
９の付属書Ｂと補助ＶＡＤアルゴリズムの相補的な特徴
について更に詳細に説明する。２つのＶＡＤアルゴリズ
ムはパラレルに実行される別個のエンティティであるこ
とが好ましいが、これらは図解および説明を容易にする
ために図３および４では統合されたプロセス１４として
示されている。

【００６７】通信リンクが設定されると、統合プロセス
１４がスタートされる（１５）。リンクの送信側のマイ
クロフォンで受信される音響アナログ信号はトランスジ
ューサによって電気的アナログ信号に変換される。これ
ら電気アナログ信号はアナログ−デジタル（Ａ／Ｄコン
バータ）によってサンプリングされ、サンプリングされ
た信号は多数のデジタルビットによって表示される。サ
ンプリングされた信号のデジタル化された表示はデジタ
ルビットから成るフレームに変換される。各フレームは
元の音響信号の連続する１０ｍｓの部分のデジタル表示
を含む。マイクロフォンは話し手の音声またはバックグ
ラウンドノイズのいずれかを連続して受信するので、
Ｇ．７２９の付属書ＢのＶＡＤおよび補助ＶＡＤによ
り、１０ｍｓのフレームがシリアル状に連続して受信さ
れる。

【００６８】参照番号１６が示すような各フレーム内に
含まれる情報から元の音響信号の特性を定める一組のパ
ラメータが抽出される。これらパラメータは勧告Ｇ．７
２９に従って誘導され、次の式で示される自己相関係数
である。

【００６９】

【数１７】

【００７０】特性パラメータの抽出後に、Ｇ．７２９に
記述されているような最小バッファへの更新が実行され
る（１７）。

【００７１】ノイズ特性の継続平均値の初期化が行われ
たかどうかを判断するため、参照番号１８が示すよう
に、フレームカウントと値３２との比較が行われる。フ
レームカウントの最後の初期化以来、−７０ｄＢｍ以上
のフルバンドエネルギーを有するＧ．７２９の付属書Ｂ
のＶＡＤが受信したフレーム数が３２未満であれば、統
合プロセス１４は参照番号２３〜２５および２７で示さ
れるノイズ特性初期化プロセスを実行する。

【００７２】通信リンクにおいてバックグラウンドノイ
ズが極端に低いレベルとなる期間が生じることが時々あ
り得る。バックグラウンドノイズのこのような変則的な
期間がノイズ特性の初期平均化にネガティブなバイアス
を掛けるのを防止するために、統合プロセス１４は着信
フレームをフィルタリングする。参照番号２３が示すよ
うに、現在フレームのフルバンドエネルギーと−７０ｄ
Ｂｍの基準レベルとの比較が行われる。現在フレームの
エネルギーが基準レベル以上であれば、参照番号２４が
示し、勧告Ｇ．７２９の付属書Ｂが記述するように、初
期平均フレームエネルギーＥ_n,avg、平均ゼロクロスレ
ートＺＣ_avgおよび平均ラインスペクトル周波数ＬＳＭ
_i,avgに対する更新が行われる。その後、Ｇ．７２９の
付属書ＢのＶＡＤは参照番号２５が示すように、現在フ
レームにおける音声アクティビティの存在が検出された
ことを示すために出力を「１」にセットし、フレームカ
ウントを「１」の値だけインクリメントする（２６）。
現在フレームのエネルギーは基準レベル未満であれば、
参照番号２７が示すように、現在フレームにおいて音声
アクティビティが検出されないことを示すためにＧ．７
２９の付属書ＢのＶＡＤはその出力を「０」にセットす
る。Ｇ．７２９の付属書ＢのＶＡＤが音声アクティビテ
ィの存在に関する判断を行った（２５、２７）後に、統
合プロセス１４は最大および最小フレームエネルギーの
値を抽出して続行する。

【００７３】−７０ｄＢｍ以上のフルバンドエネルギー
を有する受信された各フレームに対し、フレームカウン
トは「１」の値だけインクリメントされる。参照番号１
９が示す比較によって決定されるように、フレームカウ
ントが３２に等しいときに、統合プロセス１４は参照番
号２０が示す、勧告Ｇ．７２９の付属書Ｂが記述するよ
うに、低バンドノイズエネルギーの継続平均値Ｅ_l,avg
とフルバンドエネルギーの継続平均値Ｅ_f,avgとを初期
化する。

【００７４】次に、参照番号２１が示すように、現在フ
レームのバックグラウンドノイズ特性とこれらノイズ特
性の継続平均値との間の差の値が発生される。このプロ
セスの工程はフレームカウントが３２である時、低バン
ドエネルギーおよびフルバンドエネルギーの継続平均値
を初期化した後に実行されるが、フレームカウントが３
２を越える時は、参照番号１９が示すフレームカウント
の比較後に直接実行される。勧告Ｇ．７２９の付属書Ｂ
はＧ．７２９の付属書ＢのＶＡＤおよび補助ＶＡＤの双
方が使用する差分パラメータを発生するための方法につ
いて記述している。差分パラメータが発生された後に、
参照番号２２が示すように現在フレームのフルバンドエ
ネルギーと−７０ｄＢｍの基準値とが比較される。

【００７５】次に図３を参照すると、現在フレームのフ
ルバンドエネルギーが基準値以上であれば、マルチ境界
の初期のＧ．７２９の付属書ＢのＶＡＤ判断が行われ
る。基準値が現在フレームのフルバンドエネルギーを越
えていれば、現在フレーム内で検出された音声アクティ
ビティがないことを表示するために、初期のＧ．７２９
の付属書ＢのＶＡＤ判断はゼロ出力を発生する（２
９）。指定された初期値に係わらず、Ｇ．７２９の付属
書ＢのＶＡＤは参照番号３０が示し、勧告Ｇ．７２９の
付属書Ｂに記述されるように音声信号の長期定常特性を
表すために初期判断を改善する。

【００７６】最終ＶＡＤ判断を行うために、先のＶＡＤ
判断に関し、初期ＶＡＤ判断がスムーズにされた後に、
統合プロセスは参照番号３１が示すように現在フレーム
のノイズ特性によってバックグラウンドノイズエネルギ
ースレッショルドが満たされたかどうかの判断を行う。
Ｇ．７２９の付属書ＢのＶＡＤによって着信フレームの
特性と適応性スレッショルドとが比較され、次の３つの
条件が満たされた場合に限り、Ｇ．７２９の付属書Ｂの
ノイズ特性の継続平均値に対する更新が行われる（３
２）。

【００７７】

【数１８】

【００７８】ここで、Ｅ_f＝現在フレームのフルバンドノイズエネルギー、Ｅ_f,avg＝平均フルバンドノイズエネルギー、ＲＣ（１）＝第１反射係数、 ∈ＳＤ＝現在フレームに対する測定されたスペクトル距
離とスペクトル距離の継続平均値との差であり、０．０
６３７の∈ＳＤは２５４．６Ｈｚに対応している。更
に、次の条件に従ってフルバンドノイズエネルギーＥ_f
を更にカウンターＣ_nのように更新する。

【００７９】

【数１９】

【００８０】本明細書に述べたように、ノイズアクティ
ビティしか含まないフレームが検出されると、一次の自
己回帰方式を使って現在フレームの分布を示すように、
Ｇ．７２９の付属書Ｂのバックグラウンドノイズ特性の
継続平均値が更新される（３２）。

【００８１】統合プロセス１４は各着信フレームのフル
バンドエネルギーを測定する。１．２８秒の時間ｉごと
に最大および最小フルバンドエネルギーを識別し（３
３）、次の時間ｉ＋１の間にノイズスレッショルドを発
生する（３４）。次の時間の間にノイズスレッショルド
Ｔ_noise,i+1を発生するために、期間ｉの間に最大フル
バンドエネルギーＥ_maxおよび最小フルバンドエネルギ
ーＥ_minを識別するこのプロセスは、次の条件のいずれ
かが満たされた時に実行される。

【００８２】１．フレームカウントが３２未満の間に、
Ｇ．７２９の付属書ＢのＶＡＤ出力判断を行う場合。２．参照番号３１が識別する工程で決定されるように、
Ｇ．７２９の付属書Ｂのバックグラウンドノイズエネル
ギーのスレッショルドが満たされない場合。３．参照番号３２が示すように、Ｇ．７２９の付属書Ｂ
のバックグラウンドノイズ特性の継続平均値の更新が行
われる場合。最初の時間ｉの間のＴ_noise,iの値は−５５ｄＢｍに初
期化される。その後のすべての期間のｉの間で補助アル
ゴリズムは次のようにノイズスレッショルドを発生する
（１０）。

【００８３】

【数２０】

【００８４】ここで、Ｔ₁＝Ｅ_min＋（Ｅ_max−Ｅ_min）／３２、Ｔ₂＝４×Ｅ_min、Ｅ_max＝現在更新期間θ_pの間に測定される最大ブロック
エネルギー、Ｅ_min＝現在更新期間θ_pの間に測定される最小ブロック
エネルギーである。

【００８５】次に、参照番号３５が示すように、現在フ
レームのフルバンドエネルギーは−７０ｄＢｍの基準お
よび補助ＶＡＤアルゴリズムが発生するノイズスレッシ
ョルドＴ_noise（１０）と比較される。現在フレームの
フルバンドエネルギーが基準レベル以上である場合、お
よびノイズスレッショルド１０、すなわちＴ_noise以下
である場合、補助ＶＡＤアルゴリズムが発生するバック
グラウンドノイズ特性の継続平均値はＧ．７２９の付属
書ＢのＶＡＤに対して記述された自己回帰アルゴリズム
を使って更新される。この更新は、参照番号３６により
統合プロセスのフローチャート１４内に示されている。

【００８６】その後、もしくは参照番号３５が示す比較
において、現在フレームに対して否定的な判断がされた
場合、参照番号３７が示すようなノイズスレッショルド
１０を更新するかどうかの判断がなされる。ノイズスレ
ッショルド１０に対する最終更新以来、約１．２８秒が
経過していれば、参照番号３８が示すように、先の期間
中に測定される最高フルバンドエネルギーレベルおよび
最低フルバンドエネルギーレベルに基づき、ノイズスレ
ッショルドが更新される。

【００８７】次に、参照番号３９が示すように別個の
Ｇ．７２９の付属書ＢのＶＡＤアルゴリズムと補助ＶＡ
Ｄアルゴリズムによって維持されるバックグラウンドノ
イズ特性の継続平均値を比較するかどうかの判断がなさ
れる。別個のＶＡＤアルゴリズムのノイズ特性を比較す
るとの判断は経過した時間、特定の数の経過フレームま
たは他の同様な尺度に基づいて行うことができる。好ま
しい実施例では、参照番号３１が示すＧ．７２９の付属
書Ｂの更新条件が満たされなくても統合プロセス１４に
よって受信された連続するフレームの数をカウントする
のにカウンターが使用される。

【００８８】カウンターが別個のＧ．７２９の付属書Ｂ
のＶＡＤアルゴリズムと補助ＶＡＤアルゴリズムを使っ
て発生されたバックグラウンドノイズ特性の継続平均値
の間の発散の臨界点を最適に識別する連続フレームの特
定の数に達すると、これら２つの組の特性の間の比較が
なされる。この２つの組のノイズ特性の比較は参照番号
４０で示されるプロセスステップで行われる。Ｇ．７２
９の付属書ＢのＶＡＤアルゴリズムと補助ＶＡＤアルゴ
リズムを使って計算されたバックグラウンドノイズ特性
の継続平均値が発散している場合、Ｇ．７２９の付属書
Ｂのアルゴリズムが発生したこれら特性のそれぞれの値
の代わりに補助ＶＡＤアルゴリズムを発生したこれら特
性の値に置換される。この置換は参照番号４１が示すス
テップで行われる。

【００８９】その後、次の条件のいずれかが満たされた
場合、参照番号４２が示すように、リンクが終了し、そ
れ以上作用するフレームがないかどうかの判断がなされ
る。

【００９０】１．参照番号３９が示すステップにおい
て、Ｇ．７２９の付属書ＢのＶＡＤアルゴリズムと補助
ＶＡＤアルゴリズムに発生されたバックグラウンドノイ
ズ特性の継続平均値を比較するための最適時間に到達し
たかどうかに関して否定的な判断がなされた場合。２．参照番号４０が示すステップにおいて、Ｇ．７２９
の付属書ＢのＶＡＤアルゴリズムと補助ＶＡＤアルゴリ
ズムに発生されたバックグラウンドノイズ特性の継続平
均値が発散したかどうかに関して否定的な判断がなされ
た場合。３．参照番号４１が示すステップにおいて、Ｇ．７２９
の付属書Ｂのアルゴリズムからのバックグラウンドノイ
ズ特性の継続平均値が補助アルゴリズムからのバックグ
ラウンドノイズ特性のそれぞれの継続平均値に置換され
た場合。

【００９１】Ｇ．７２９の付属書ＢのＶＡＤアルゴリズ
ムによってリンクの最終フレームが受信された場合、参
照番号４３が示すように、統合プロセス１４が終了され
る。受信されない場合、統合プロセス１４は参照番号１
６が示すように、次に順次受信されたフレームから特性
パラメータを抽出する。

【００９２】次に図５を参照する。話し手の音声を示す
テスト信号４８はＧ．７２９の付属書Ｂの通信リンクへ
与えられる。Ｇ．７２９の付属書ＢのＶＡＤは着信テス
ト信号５８に応答して出力信号４５を発生する。グラフ
４６の水平軸は時間を単位とし、グラフ４７の水平軸は
経過したフレームを単位とする。双方のグラフの垂直軸
は振幅を単位とする。ＶＡＤ出力信号４５に対する
「１」の振幅の値は、水平軸に沿った対応する値が示す
フレーム内に音声アクティビティが存在することが検出
されたことを示す。ＶＡＤ出力４５における振幅値
「０」は水平軸に沿った対応する値によって識別される
フレーム内で検出される音声アクティビティがないこと
を示す。

【００９３】図６は、低レベルの信号５４が先行してい
るグラフ４６のテスト信号４４を示す。低レベルの信号
５４はＧ．７２９の付属書Ｂによりデジタルに符号化さ
れた信号からの６４０個の連続するゼロのアナログ表示
によって発生される。これと共に、テスト信号４４と６
４０個のゼロのアナログ表示はグラフ５１におけるテス
ト信号４８を形成する。グラフ５２はテスト信号４８に
対するＧ．７２９の付属書ＢのＶＡＤ応答４９を示し、
同様に、グラフ５３はテスト信号４８に対する補助ＶＡ
Ｄアルゴリズムの応答５０を示す。ある数の初期化フレ
ームが経過した後に、Ｇ．７２９の付属書ＢのＶＡＤア
ルゴリズムは着信するすべてのフレームを音声フレーム
として識別することに留意されたい。Ｇ．７２９の付属
書ＢのＶＡＤは３２０ｍｓよりも長い間、チャンネルリ
ンクの発生時に極めて低いレベルの信号５４を受信して
いるので、バックグラウンドノイズのＶＡＤの特性決定
は予想された特性からクリティカルに発散している。こ
の結果、設定されたリンクの残りの時間にはＧ．７２９
の付属書ＢのＶＡＤは意図するようには作動しない。補
助ＶＡＤアルゴリズムは結合された信号４８におけるテ
スト信号４４に先行する低レベル信号５４の効果を無視
する。従って、変則的なノイズ信号は予想された特性か
ら離れたバックグラウンドノイズの補助ＶＡＤによる特
性決定にバイアスを掛けない。グラフ５３における信号
４４に対する補助ＶＡＤ応答はグラフ４７における信号
４４に対するＧ．７２９の付属書ＢのＶＡＤ応答と同一
またはほぼ同一であることを指摘したい。

【００９４】図７は、Ｇ．７２９の付属書Ｂの通信リン
クに提供される、グラフ５８における会話テスト信号５
５を示す。グラフ５９は標準Ｇ．７２９の付属書ＢのＶ
ＡＤによるテスト信号５５に対する応答５６を示し、グ
ラフ６０はテスト信号５５に対する補助ＶＡＤの応答５
７を示す。補助ＶＡＤ応答と標準Ｇ．７２９の付属書Ｂ
の応答とを比較すると、補助ＶＡＤ応答のほうがバンド
幅の節約および再生される音声の品位の点で性能がより
良好であることが判る。

【００９５】図８は、Ｇ．７２９の付属書Ｂの通信リン
クに提供される、別の会話テスト信号６１を示す。グラ
フ６４は標準Ｇ．７２９の付属書ＢのＶＡＤによるテス
ト信号６１に対する応答４８を示し、グラフ６５はテス
ト信号６１に対する補助ＶＡＤの応答６３を示す。補助
ＶＡＤ応答と標準Ｇ．７２９の付属書Ｂの応答とを比較
すると、補助ＶＡＤ応答のほうが後者のＧ．７２９の付
属書Ｂの応答よりも識別されるノイズフレームが５％多
いことが判る。従って、補助ＶＡＤアルゴリズムは現在
フレームの予想特性と共により良好に収束することが判
る。

【００９６】本明細書に示した発明の概念の範囲内で多
くの種々の異なる実施例が可能であり、法律上の説明上
の要件に従って詳細に本明細書に示した実施例におい
て、多数の変更を行うことができるので、本明細書に示
した細部は単に説明のものであり、発明を限定するもの
でないと理解すべきである。

【００９７】以上の説明に関して、更に以下の項を開示
する。（１）信号の特性を定める一組のパラメータを信号か
ら抽出する工程と、前記パラメータの組から前記信号の
エネルギー測度を計算する工程と、前記エネルギー測度
と基準値とを比較する工程と、前記エネルギー測度が前
記基準レベルに等しくなったか、またはこれを越えた回
数をカウントする工程とを備えた、ＩＴＵ（国際電気通
信連合）勧告Ｇ．７２９の付属書Ｂの音声アクティビテ
ィ検出（ＶＡＤ）デバイスを初期化する方法。

【００９８】（２）前記抽出する工程がデータフレー
ム内の前記信号のデジタル表示から前記信号の特性を決
定するパラメータの組を抽出することを含み、前記パラ
メータが前記勧告Ｇ．７２９に従って誘導される自己相
関係数であり、前記自己相関係数のうちの第１自己相関
係数Ｒ（０）を２４０の定数値で割ることにより得られ
る商の１０を底とする対数に１０倍の値を掛けることに
よりフルバンドフレームエネルギーを計算することによ
って前記エネルギー測度を計算し、前記エネルギーと前
記基準値との前記比較が前記フルバンドフレームエネル
ギーの基準レベルとの比較を含み、前記フルバンドエネ
ルギーが前記基準レベルに等しいか、またはそれを越え
た場合に限り、前記カウント工程が前記初期化中にフレ
ームカウンターの値を変更することを含み、前記勧告
Ｇ．７２９の付属書Ｂに従ってノイズ特性の平均値に対
する初期値を更新する工程を更に備えた、ＩＴＵ勧告
Ｇ．７２９の付属書Ｂの音声アクティビティ検出（ＶＡ
Ｄ）を初期化するための、第１項記載の方法。

【００９９】（３）ノイズ識別スレッショルド値を決
定する工程と、信号の所定のエネルギー測度と前記ノイ
ズスレッショルド値とを比較する工程と、前記エネルギ
ー測度が前記ノイズスレッショルドよりも低くなったと
きに、前記数のエネルギー測度の平均値を示す第１の値
を決定する工程を備え、前記第１の値を決定するのに前
記ノイズスレッショルド値よりも低い値を有する、前記
数のエネルギー測度のうちのエネルギー測度しか使用し
ないようになっており、前記数のエネルギー測度の平均
値を示す第２の値を決定する工程と、前記第１の値と第
２の値との間の発散が時間と共に増加した時に、前記第
２の値を前記第１の値に置換する工程を備えた、ＩＴＵ
勧告Ｇ．７２９の付属書Ｂの音声アクティビティ検出
（ＶＡＤ）デバイスを収束させる方法。

【０１００】（４）所定の時間の終了時に前記第２の
値を前記第１の値に置換する工程を更に含む、第３項記
載の方法。

【０１０１】（５）高いスレッショルド基準値を設定
する工程と、前記数のエネルギー測度のうちの前記エネ
ルギー測度が前記高いスレッショルド基準値に等しくな
るか、またはこれを越えた連続する回数をカウントする
工程とを備え、前記高いスレッショルド基準値よりも低
い値を有する前記数のエネルギー測度のうちのエネルギ
ー測度だけを使って前記第２の値を決定し、前記数のエ
ネルギー測度のうちの前記エネルギー測度が所定の連続
する回数だけ前記基準値に等しくなるか、またはこれを
越えたときに、前記第２の値を前記第１の値に置換する
ようになっている、第３項記載の方法。

【０１０２】（６）ノイズ識別スレショルド値を決定
する工程と、信号の所定の数のエネルギー測度と前記ノ
イズスレショルド値を比較する工程と、前記信号の現在
のスペクトル状態と前記信号の所定の数の先のスペクト
ル状態の平均値を示す値との間のスペクトル距離差を決
定する工程と、前記エネルギー測度が前記ノイズスレッ
ショルドよりも小さくなった時に、前記信号のノイズ特
性の平均値を示す第１の組の値を更新する工程と、前記
エネルギー測度が基準レベルよりも小さくなり、前記ス
レッショルド距離差が約０．０６３７よりも小さい値を
有する時に、前記信号のノイズ特性の平均値を示す第２
の組の値を更新する工程と、特定の事象が生じたときに
前記第２の値を前記第１の値に置換する工程とを備え
た、ＩＴＵ勧告Ｇ．７２９の付属書Ｂの音声アクティビ
ティ検出（ＶＡＤ）デバイスを収束させる方法。

【０１０３】（７）前記数のエネルギー測度のうちの
前記エネルギー測度が前記基準値に等しくなるか、また
はこれを越えた連続する回数をカウントする工程と、前
記数のエネルギー測度のうちの前記エネルギー測度が所
定の連続する回数だけ前記基準値に等しくなるか、また
はこれを越えた時に前記第２の値を前記第１の値に置換
する工程とを更に備えた、第６項記載の方法。

【０１０４】（８）更新期間θ_pを定める工程と、前
記更新期間θ_p中に生じた最大ブロックエネルギーを測
定し、前記測定された最大ブロックエネルギーをＥ_max
と指定する工程と、前記更新期間θ_p中に生じた最小ブ
ロックエネルギーを測定し、前記測定された最小ブロッ
クエネルギーをＥ_minと指定する工程と、式Ｔ₁＝Ｅ_min
＋（Ｅ_max−Ｅ_min）／３２で示されるＴ₁の値を計算す
る工程と、式Ｔ₂＝４×Ｅ_minで示されるＴ₂の値を計算
する工程と、２つの値Ｔ₁とＴ₂のうちの小さい方の値を
決定する工程と、Ｔ₁とＴ₂のうちの前記小さい方の値に
２を掛け、積を得る工程と、前記積と−２１ｄＢｍの値
とを比較する工程と、−２０ｄＢｍと前記積とのうちの
小さい方の値を前記更新期間θ_pにおける前記ノイズス
レッショルドと指定する工程とを更に備えた、第６項記
載の方法。

【０１０５】（９）更新期間θ_p中に生じた最大ブロ
ックエネルギーを測定し、前記測定された最大ブロック
エネルギーをＥ_maxと指定する工程と、前記更新期間θ_p
中に生じた最小ブロックエネルギーを測定し、前記測定
された最小ブロックエネルギーをＥ_minと指定する工程
と、式Ｔ₁＝Ｅ_min＋（Ｅ_max−Ｅ_min）／３２で示される
Ｔ₁の値を計算する工程と、式Ｔ₂＝４×Ｅ_minで示され
るＴ₂の値を計算する工程と、２つの値Ｔ₁とＴ₂のうち
の小さい方の値を決定する工程と、Ｔ₁とＴ₂のうちの前
記小さい方の値に２を掛け、積を得る工程と、前記積と
−２１ｄＢｍの値とを比較する工程と、信号のある数の
エネルギー測度と前記ノイズスレショルド値を比較する
工程と、前記信号の現在のスペクトル状態と前記信号の
所定の数の先のスペクトル状態の平均値を示す値との間
のスペクトル距離差を決定する工程と、前記エネルギー
測度が前記ノイズスレッショルドよりも小さくなった時
に、前記信号のノイズ特性の平均値を示す第１の組の値
を更新する工程と、前記エネルギー測度が基準レベルよ
りも小さくなり、前記スレッショルド距離差は約０．０
６３７よりも小さい値を有する時に、前記信号のノイズ
特性の平均値を示す第２の組の値を更新する工程と、前
記数のエネルギー測度のうちの前記エネルギー測度が前
記基準値に等しくなるか、またはこれを越えた連続する
回数をカウントする工程と、前記数のエネルギー測度の
うちの前記エネルギー測度が所定の連続する回数だけ前
記基準値に等しくなるか、またはこれを越えた時に前記
第２の値を前記第１の値に置換する工程とを更に備え
た、ＩＴＵ勧告Ｇ．７２９の付属書Ｂの音声アクティビ
ティ検出（ＶＡＤ）デバイスを収束させる方法。

【０１０６】（１０）通信リンク中に約１．２５秒ご
とに前記ノイズスレッショルド値を更新する工程を更に
備えた、第９項記載の方法。

【０１０７】（１１）信号の特性を定める一組のパラ
メータを信号から抽出する工程（１６）と、前記パラメ
ータの組から前記信号のエネルギー測度を計算する工程
と、前記エネルギー測度と基準値とを比較する工程（２
３）と、信号のノイズ特性の平均値に対する初期値を決
定する工程（２０）と、前記エネルギー測度が前記基準
レベルに等しくなったかまたはこれを越えた回数をカウ
ントする工程（２６）とを備えた、ＩＴＵ（国際通信連
合）勧告Ｇ．７２９の付属書Ｂの音声アクティビティ検
出（ＶＡＤ）デバイスを初期化する方法が開示されてい
る。ノイズ識別スレッショルド値を決定する工程（２
８）と、信号の所定のエネルギー測度と前記ノイズスレ
ッショルド値とを比較する工程（３１）と、前記エネル
ギー測度が前記ノイズスレッショルドよりも低くなった
ときに、前記数のエネルギー測度の平均値を示す第１の
値を決定する工程を備え、前記第１の値を決定するのに
前記ノイズスレッショルド値よりも低い値を有する、前
記数のエネルギー測度のうちのエネルギー測度しか使用
しないようになっており（３２）、前記数のエネルギー
測度の平均値を示す第２の値を決定する工程（３６）
と、前記第１の値と第２の値との間の発散を示す特定の
事象が生じた時に、前記第２の値を前記第１の値に置換
する工程（４１）を備えた、ＩＴＵ勧告Ｇ．７２９の付
属書Ｂの音声アクティビティ検出（ＶＡＤ）デバイスを
収束する方法も開示されている。

【図面の簡単な説明】

【図１】勧告Ｇ．７２９の付属書Ｂに準拠した半デュプ
レックス通信リンクを示す。

【図２】Ｇ．７２９の付属書Ｂの通信チャンネルの入力
端におけるバックグラウンドノイズエネルギーおよび音
声エネルギーに対する代表的な確率分布関数を示す。

【図３】統合されたＧ．７２９の付属書ＢのＶＡＤアル
ゴリズムと補助ＶＡＤアルゴリズムのためのプロセスフ
ローを示す。

【図４】図３のプロセスフローの連続性を示す。

【図５】Ｇ．７２９の付属書Ｂの通信リンクに与えられ
る話し手の音声を示すテスト信号およびこの入力信号に
対するＧ．７２９の付属書ＢのＶＡＤ応答を示す。

【図６】低レベル信号が先行する図４のテスト信号、組
み合わされたテスト信号に対するＧ．７２９の付属書Ｂ
のＶＡＤ応答および組み合わされテスト信号に対する補
助ＶＡＤの応答を示す。

【図７】Ｇ．７２９の付属書Ｂの通信リンクに与えられ
る会話テスト信号、標準Ｇ．７２９の付属書ＢのＶＡＤ
によるテスト信号に対する応答、およびテスト信号に対
する補助ＶＡＤの応答を示す。

【図８】Ｇ．７２９の付属書Ｂの通信リンクに与えられ
る第２の会話テスト信号、標準Ｇ．７２９の付属書Ｂの
ＶＡＤによるテスト信号に対する応答、およびテスト信
号に対する補助ＶＡＤの応答を示す。

【符号の説明】

２ノイズエンコーダ３音声エンコーダ４通信チャンネル５ノイズデコーダ６音声デコーダ７着信信号

───────────────────────────────────────────────────── フロントページの続き (72)発明者ダニエルシー、トーマスアメリカ合衆国メリーランド、ジャーマンタウン、ステージコーチコート７ (72)発明者ゴカーンシスリアメリカ合衆国メリーランド、ベテスダ、バタフライレイン 4858

Claims

【特許請求の範囲】

【請求項１】信号の特性を定める一組のパラメータを
信号から抽出する工程と、前記パラメータの組から前記信号のエネルギー測度を計
算する工程と、前記エネルギー測度と基準値とを比較する工程と、前記エネルギー測度が前記基準レベルに等しくなった
か、またはこれを越えた回数をカウントする工程とを備
えた、ＩＴＵ（国際電気通信連合）勧告Ｇ．７２９の付
属書Ｂの音声アクティビティ検出（ＶＡＤ）デバイスを
初期化する方法。