JPH09204199A

JPH09204199A - 非活性音声の効率的符号化のための方法および装置

Info

Publication number: JPH09204199A
Application number: JP9008589A
Authority: JP
Inventors: Adil Benyassine; アディル・ベンヤシン; Huan-Yu Su; フアン−ユー・スー
Original assignee: Rockwell International Corp
Current assignee: Boeing North American Inc
Priority date: 1996-01-22
Filing date: 1997-01-21
Publication date: 1997-08-05
Also published as: EP0785541B1; EP0785541A2; DE69720822D1; EP0785541A3; US5689615A

Abstract

(57)【要約】【課題】非活性音声フレームが検出されると、必要な
場合背景雑音に関する何らかの情報を間欠的に送って全
体的な音声の質を高める。【解決手段】（ａ）音声符号化器、（ｂ）通信チャネ
ルおよび（ｃ）音声復号化器とを備える音声通信システ
ムのための非活性音声期間を効率的に符号化するための
方法であって、非活性音声フレームの符号化効率はわず
か１５ビットでフレームのエネルギおよびそのスペクト
ルを符号化することにより達成することができる。これ
らのビットは非活性音声が検出されるたびに自動的に伝
送されるのではなく、むしろ最も最近非活性音声フレー
ムが送られた時点に対して評価可能な変化が検出された
場合にのみ伝送される（２２０）。本発明によれば、通
常の音声会話の間に平均４ｋｂ／ｓという低いレートで
全体的に良好な品質が達成できる。

Description

【発明の詳細な説明】

【０００１】

【関連出願】本発明は、本件と同日出願で同一譲受人の
「音声通信システムにおいてフレーム音声決定を生成す
るための方法および装置」と題する係属中の米国特許出
願連続番号第０８／５８９５０９号に関連し、同関連出
願の開示をここに引用により援用する。

【０００２】

【発明の分野】本発明は、通信システムにおける音声符
号化に関連し、かつ特に、デュアルモード音声符号化方
式に関連する。

【０００３】

【技術的背景】今日の通信システムは一般にデジタル音
声処理に大きく依存しかつ特にデジタル音声圧縮に依存
している。そのような通信システムの例には、デジタル
電話幹線、ボイスメール、音声注釈、自動応答装置、デ
ータリンクによるデジタル音声の伝送等がある。

【０００４】図１に示すとおり、音声通信システムは典
型的には音声符号化器１１０、通信チャネル１５０およ
び音声復号化器１５５から構成される。符号化器１１０
側には、音声１７５を復元するために使用される３つの
機能部分、すなわち非活性音声符号化器１１５、活性音
声符号化器１２０、および音声活性度検出ユニット１２
５がある。復号化器１５５側には、非活性音声復号化器
１６５と活性音声復号化器１７０がある。

【０００５】当業者においては、「非活性音声」は一般
に伝送における「無音」または「無音の際の背景雑音」
を指し、「活性音声」はその伝送の実際の「音声」部分
を指すことが理解されるはずである。

【０００６】音声符号化器１１０はビットストリームの
形に既にデジタル化されている音声１０５を変換する。
ビットストリームは通信チャネル１５０（たとえば記憶
媒体などが可能）上を伝送され、復号化器１５５によっ
て再びデジタル化された音声１７５へ変換される。この
デジタル化された音声を表わすために必要なビット数と
ビットストリームにおけるビット数との比率が圧縮率で
ある。復元される音声を高品質に保ちながら１２から１
６の圧縮率が達成可能である。

【０００７】正常な音声のかなりの部分は非活性音声の
期間から構成されており、双方向の会話においてはこれ
は平均６０％までに達する。これら非活性音声の期間の
間、マイクロフォン等の音声入力装置は背景雑音を拾
う。その雑音レベルと特性は、静かな部屋から雑音の多
い街頭や高速で移動する車までさまざまなに異なるが、
雑音源は音声よりも運ぶ情報が少ない場合が多いので非
活性音声期間においてはより高い圧縮率を達成すること
が可能である。

【０００８】このような議論が通常「率可変符号化方
式」としても知られるデュアルモード音声符号化方式の
概念のもとになっている。入力信号の異なるモード（活
性または非活性音声）が音声活性度検出器（「ＶＡ
Ｄ」）１５２としても知られる信号類別装置により判別
される。この装置は音声符号化器１１０の外部または内
部で動作することができる。非活性音声符号化器１１５
を介する非活性音声信号の場合にはより少ない数のビッ
トを利用し、より高い平均圧縮率が得られる異なる符号
化方式を採用する。ＶＡＤ１２５の出力は２値であり、
一般に「音声決定」１４０と呼ばれる。この音声決定を
利用してビットストリームのデュアルモード、すなわち
非活性音声ビットストリーム１３０であるかまたは活性
音声ビットストリーム１３５であるかを切換える。

【０００９】

【発明の要約】伝統的な音声コーダおよび復号化器では
非活性音声フレームにおける背景雑音を真似るために快
適雑音を使用する。背景雑音は変化することが多いの
で、そのような場合、快適雑音では元の背景雑音の自然
さが得られない。そこで非活性音声フレームが検出され
ると、必要な場合背景雑音に関する何らかの情報を間欠
的に送って質を高めることが望ましい。わずか１５ビッ
トでそのフレームのエネルギとそのスペクトルを符号化
することによって非活性音声フレームの符号化効率が達
成され得る。これらのビットは非活性音声が検出される
たびに自動的に伝送されるわけではない。むしろ、最も
最近非活性音声フレームが送られた時点に対して評価可
能な変化が検出された場合のみ伝送される。本発明によ
れば、通常の音声会話の際に平均４ｋｂ／ｓという低い
レートで高品質が達成され得る。このような高品質は、
８ｋｂ／ｓのフルレートで動作が行なわれない限り非活
性音声期間の間への単純な快適雑音の挿入だけでは達成
され得ない。

【００１０】（ａ）入来音声信号を受信して符号化し音
声復号化器へ伝送するためのビットストリームを生成す
るための音声符号化器、（ｂ）伝送用通信チャネル、お
よび（ｃ）音声符号化器からのビットストリームを受け
て復号化するための音声復号化器を備える音声通信シス
テムにおいて、本発明による非活性音声期間の効率的な
符号化のための方法を開示する。本発明の方法は、ａ）
フレームごとに入来音声信号から予め定められた組のパ
ラメータを抽出するステップと、ｂ）この予め定められ
た組のパラメータのうち第１の組によりフレームごとに
入来音声信号のフレーム音声決定を行なうステップと、
ｃ）フレーム音声決定が活性音声を示す場合、入来音声
信号を活性音声符号化器により符号化して活性音声ビッ
トストリームを生成し、これを連続的に連結してチャネ
ル上を伝送するステップと、ｄ）フレーム音声決定が非
活性音声を示す場合には、非活性音声符号化器により符
号化されている入来音声信号を使用して非活性音声ビッ
トストリームを生成するステップとを含む。非活性ビッ
トストリームは各々幅２バイトの少なくとも１つのパケ
ットから構成され、かつ各パケットは非活性音声パラメ
ータを表わす複数の表に対する複数の指標を有し、ｅ）
受信したビットストリームが活性音声フレームのもので
あれば、活性音声復号化器を呼出して復元された音声信
号を生成し、ｆ）フレーム音声決定が非活性音声を示す
場合には、非活性音声ビットストリームの伝送は、予め
定められた比較基準が満たされた場合にのみ行なわれ、
ｇ）フレーム音声決定が非活性音声を示す場合には、非
活性音声復号化器を呼出して復元された音声信号を生成
し、かつｈ）非活性音声ビットストリームが音声復号化
器により受信された場合には非活性音声復号化器を更新
し、それ以外の場合は以前に受信した非活性音声情報を
使用する。

【００１１】本発明の他の目的、特徴および利点につい
ては以下の説明から当業者にはより明らかになるであろ
う。

【００１２】

【図面の詳細な説明】ＶＡＤを利用して音声を効率的に
符号化する方法を開示する。以下の説明においては、本
発明は機能ブロック図とプロセスフローチャートの形で
記述されるが、これは通信のための音声符号化技術の当
業者の間では一般に行なわれているやり方である。当業
者であれば本発明の教示を実現する最も適切なやり方を
容易に決定できるので、本発明はいかなる特定のプログ
ラミング言語にも限定されない。

【００１３】Ａ．一般的説明本発明に従い、ＶＡＤ（図１、１２５）および間欠非活
性音声期間更新（Intermittent Non-active Voice Peri
od Update ）（「ＩＮＰＵ」）（図２、２２０）モジュ
ールはＣＥＬＰ（「符号励起線形予測」）（Code Excit
ed Linear Prediction）音声コーダおよび特に推奨され
るＣＳ−ＡＣＥＬＰ８ｋｂｐｓ音声コーダ（「Ｇ．７２
９」）とともに動作するよう設計されている。快適雑音
を聞くために、ＩＮＰＵアルゴリズムは、平均ビットレ
ートを低く維持しながら非活性音声期間に関する連続的
かつ平滑な情報を提供する。活性音声フレームにおい
て、音声符号化器１１０はＧ．７２９音声符号化器１２
０を使用し、対応するビットストリームは連続的に音声
復号化器１５５へ送られる。なおＧ．７２９仕様は国際
電気通信連合（ＩＴＵ）により推奨される音声符号化仕
様を指す。

【００１４】各非活性音声フレームについて、ＩＮＰＵ
モジュール（２２０）は、非活性音声信号における変化
を測定することによって非活性音声更新パラメータの組
を音声復号化器１５５に送るべきか否かを決定する。フ
レームエネルギおよびスペクトル歪み測定に関する絶対
および適応しきい値を使用して更新の決定を得る。更新
が必要な場合、非活性音声符号化器１１５は元の非活性
音声信号に知覚的に類似する信号を生成するのに必要な
情報を送る。この情報はエネルギレベルとスペクトル包
絡線の記述とを含み得る。更新が必要でない場合には非
活性音声信号は非活性音声フレームの最も最近に受信し
たエネルギおよびスペクトル形状情報に従い、非活性復
号化器により生成される。

【００１５】本発明のＶＡＤ／ＩＮＰＵを組合せたプロ
セスの一般的なフローチャートを図２に示す。第１段
（２００）では、音声パラメータが以下に説明するとお
り初期化される。次いで、ＶＡＤおよびＩＮＰＵに関連
するパラメータがブロック（２０５）において入来信号
から抽出される。その後、ＶＡＤモジュール（２１０、
図１、１３５）により音声活性度決定が行なわれて音声
決定が生成され（図１、１４０）、それにより活性音声
符号化器／復号化器（図２、１２０、１７０）と非活性
符号化器／復号化器（図１、１１５、１６５）とが切換
えられる。２値音声決定は、活性音声については「１」
（真）または非活性音声については「０」（偽）のいず
れかに設定することが可能である。

【００１６】非活性音声がＶＡＤにより決定される場合
（２１５）、ＩＮＰＵおよび非活性音声符号化器に関連
するパラメータが図３に示すように、量子化および伝送
目的のために変換される。

【００１７】Ｂ．パラメータの初期化（２００）当業者により理解されるとおり、適切な動作のためには
十分な初期化が必要である。これは、入力信号の第１の
フレームが処理される直前に１回限り行なわれる。この
初期化プロセスを以下のように要約する。

【００１８】音声符号化の変数を以下のように設定す
る。

【００１９】

【数１】

【００２０】Ｃ．パラメータの抽出および量子化（２０
５、３０５）パラメータ抽出ブロック（２０５）では、全入力信号フ
レームに対して行なう線形予測（ＬＰ）分析によってフ
レームエネルギＲ（０）が得られかつ現在ＬＰＣで実現
される反射係数｛Ｋ_i｝、ｉ＝１，１０．が得られる。
これらのパラメータは、まず特に入力音声信号の非活性
期間の符号化および復号化に用いられることになる。こ
れらはそれぞれＥ＝１０ｌｏｇ₁₀（Ｒ（０））で表わす
［ｄＢ］ドメインとＬＡＲ_i＝ｌｏｇ（（１−ｋ_i）／
（１＋ｋ_i））で表わすＬＡＲドメインとに変換され
る。

【００２１】これら変換されたパラメータ（３０５）は
次に以下のように量子化される。エネルギＥは現在５ビ
ット不均一スカラー量子化器を用いて符号化されてい
る。これに対しＬＡＲは現在各５ビットの２段ベクトル
量子化（「ＶＱ」）を用いることによって量子化されて
いる。しかし、当業者であれば異なるドメインにおいて
および／または異なるやり方でスペクトル包絡線の情報
を容易に符号化することが可能である。さらに、Ｅまた
はＬＡＲ以外の情報を用いて非活性音声期間を符号化す
ることもできる。エネルギＥの量子化は３２エントリの
表のサーチを包含する。２乗平均という意味でエネルギ
Ｅに最も近いエントリを選択しこれをチャネルによって
送る。一方、ＬＡＲベクトルの量子化は２段ベクトル量
子化において行なわれるとのと同様、各々異なるベクト
ル表から２つの最良の指標を決定することを含む。した
がって、これら３つの指標は非活性フレームに関する代
表的な情報を構成する。

【００２２】Ｄ．非活性音声パラメータ決定の伝送と補
間（３１０）量子化された非活性音声パラメータ、すなわちＥおよび
ＬＡＲから、ＬＰＣ利得と呼ばれるものを計算する。ｌ
ｐｃ＿ｇａｉｎは以下のとおり規定される。

【００２３】

【数２】

【００２４】ここで、｛ｋ_i｝は量子化されたＬＡＲか
ら得られる反射係数であり、かつＥは量子化されたフレ
ームエネルギである。スペクトル静止度測定値も計算さ
れ、これは以下のとおり現在のフレームのＬＡＲと最も
最近伝送された非活性フレーム（ｌａｒ＿ｐｒｅｖ）の
ＬＡＲとの間の２乗平均の差として以下のとおり定義さ
れる。

【００２５】

【数３】

【００２６】図４は図３の３１０において行なわれるＩ
ＮＰＵ決定のフローチャートを示す。前回のＶＡＤ決定
が「１」（すなわち前回のフレームが活性音声）であっ
たか否か、最も最近伝送された非活性音声エネルギと現
在の非活性音声エネルギとの間の差がしきい値Ｔ₃を超
えるか否か、ＬＰＣ利得における変化のパーセンテージ
がしきい値Ｔ₁を超えるか否か、またはＳＳＭがしきい
値Ｔ₂を超えるか否かのチェック（４００）が行なわ
れ、パラメータ更新が活性化される（４０５）。なお、
しきい値は本発明を実施する特定のシステムおよび環境
によって修正することが可能である。

【００２７】パラメータ更新（４０５）を活性化する
際、初期条件の補間および更新が次のように行なわれ
る。Ｅとｅｎｅｒｇｙ＿ｐｒｅｖとの間の線形補間を行
なって以下のようにサブフレームエネルギ｛Ｅ_i｝（ｉ
＝１，２）を計算する。（なお推奨されるＧ．７２９仕
様では「ｉ」は１つのフレームを含む２つのサブフレー
ムを表わすが、各フレーム内にさまざまな数のサブフレ
ームを含む他の仕様も可能である。）

【００２８】

【数４】

【００２９】ＬＡＲはまた以下のとおりフレームの境界
を横切って補間される。

【００３０】

【数５】

【００３１】なお、モジュール４０５が、前回のＶＡＤ
決定が「１」であるという事実によって呼出される場合
には、補間は行なわれない。

【００３２】Ｅ．非活性符号化器／復号化器、励起エネ
ルギ計算および平滑化（３１５）音声信号を符号化するためのＣＥＬＰアルゴリズムは合
成音声コーダによる分析のカテゴリに属する。したがっ
て、実際には復号化器のレプリカが符号化器に埋込まれ
る。各非活性音声フレームは２つのサブフレームに分割
される。次に、各サブフレームは復号化器で合成されて
元のフレームのレプリカを形成する。サブフレームの合
成は励起ベクトル、利得係数およびフィルタの決定を含
む。以下にこれら３つの決定方法について説明する。現
在非活性音声フレームを符号化するために使用される情
報はフレームエネルギＥとＬＡＲとを含む。これらは上
記のとおり補間されて以下の式に従いサブフレームＬＰ
Ｃ利得を計算するために使用される。

【００３３】

【数６】

【００３４】ここでｉ＝１，２および｛ｋ^j _i｝は補間
されたＬＡＲから得られるｉ番目のサブフレームのｊ番
目の反射係数である。

【００３５】ここでブロック３１５をさらに説明する図
５を参照する。非活性音声サブフレームを合成するた
め、４０次元（現在使用される）白色ガウスランダムベ
クトルを生成する（５０５）。このベクトルは正規化さ
れて単位ノルムを有する。この正規化されたランダムベ
クトルｘ（ｎ）を利得係数でスケールする（５１０）。
得られたベクトルｙ（ｎ）を逆ＬＰＣフィルタに通す
（５１５）。このフィルタの出力ｚ（ｎ）が合成された
非活性音声サブフレームである。

【００３６】非活性符号化器はＶＡＤ決定によって活性
音声符号化器と交互に動作するので、切換えの間に平滑
なエネルギの移動を行なう必要がある。このため、励起
エネルギの移動平均（ＲＧ＿ＬＰＣ）を非活性および
活性音声期間の両方で計算する。ＲＧ＿ＬＰＣを非活
性音声期間の間に更新する方法についてこのセクション
で説明することにする。まず、Ｇ＿ＬＰＣＰを現在の
非活性音声フレームの直前の音声の第２のフレームの間
に計算されたＲＧ＿ＬＰＣの値に規定する。したがっ
て、以下のように書き表すことができる。

【００３７】

【数７】

【００３８】Ｇ＿ＬＰＣＰはｘ（ｎ）のスケールファ
クタにおいて使用されることになる。

【００３９】移動平均ＲＧ＿ＬＰＣは、は、図６のフ
ローチャートに示されるスケーリングの前に更新され
る。

【００４０】ブロック５１０の出力であるｙ（ｎ）を得
るために、図７に示すようにブロック５０５の出力であ
る励起ｘ（ｎ）の利得スケーリングが行なわれる。非活
性音声サブフレームの励起の利得スケーリングが図７が
示す追加の減衰係数を必要とする点に留意されたい。実
際には、定数である減衰係数α＝１／２．２５が、前回
のフレームが活性音声フレームでなかった場合にｘ
（ｎ）を多重化するために使用される。それ以外の場
合、以下の形式の線形減衰係数α_jが使用される。

【００４１】

【数８】

【００４２】ここでβ＝１．２５／７９、ｊはサブフレ
ームのｊ番目のサンプルでありかつｉはｉ番目のサブフ
レームである。

【００４３】ブロック５２０において、スケーリングさ
れた励起ｙ（ｎ）のエネルギが計算される。Ｅｘｔ＿
Ｒ＿Ｅｎｅｒｇｙで表わされかつ以下のように計算さ
れる。

【００４４】

【数９】

【００４５】ｙ（ｎ）のエネルギの移動平均は以下のと
おり計算される。

【００４６】

【数１０】

【００４７】なお重み付け係数はシステムおよび環境に
より修正することができる。また、ＲｅｘｔＲＰ＿Ｅｎ
ｅｒｇｙの初期化は活性音声コーダの動作の際にのみ行
なわれるが、更新は非活性および活性両方のコーダの動
作の際に行なわれる。

【００４８】Ｆ．Ｇ．７２９活性音声符号化器／復号化
器励起エネルギ計算および平滑化活性音声符号化器／復
号化器は推奨されるＧ．７２９仕様に従い動作し得る。
音声符号化器／復号化器の動作についてはここに詳しく
説明しないが、活性音声フレームの間、励起が生じて逆
ＬＰＣフィルタを駆動し、活性音声フレームのレプリカ
を合成する点を申し述べておく。この合成プロセスのブ
ロック図については図８に示す。

【００４９】ＥｘｔＲＰ＿Ｅｎｅｒｇｙで表わされる励
起ｘ（ｎ）のエネルギは以下のとおり各サブフレームご
とに計算される。

【００５０】

【数１１】

【００５１】このエネルギは励起エネルギＲｅｘｔＲＰ
＿Ｅｎｅｒｇｙの移動平均を更新するために使用され
る。

【００５２】まず連続する活性音声フレームの数のカウ
ンタ（ｃｏｕｎｔ＿ｍａｒｋｅｒ）を使用してＲｅｘ
ｔＲＰ＿Ｅｎｅｒｇｙの更新をどのように行なうかを決
定する。図９はこのプロセスのフローチャートである。
活性音声励起エネルギを更新するためのこのプロセスフ
ローを以下の式に表わすことができる。

【００５３】

【数１２】

【００５４】なお重み係数については必要に応じて修正
することができる。励起ｘ（ｎ）は正規化されて単位ノ
ルムを有し、かつ

【００５５】

【数１３】

【００５６】でスケーリングされ、それ以外の場合発生
した状態のままブロック８００に保持される。活性音声
部分と非活性音声部分との間の平滑な遷移において十分
な注意を払う。ＲＧ＿ＬＰＣも活性音声フレームの間
以下のとおり絶えず更新される。

【００５７】

【数１４】

【００５８】本発明のいくつかの例示的実施例のみにつ
いて詳細に説明したが、当業者においては、本発明の新
規な教示および利点から実質的に逸脱することなく、多
くの修正が例示の実施例において可能であることを理解
するであろう。したがって、そのような修正はすべて先
行の特許請求の範囲に規定される発明の範囲に包含され
るものとする。特許請求の範囲におけるミーンズ・プラ
ス・ファンクションの表現は記載の機能を行なうものと
して本明細書中に説明した構造を包含しかつ構造的等価
物を含むのみならず等価な構造物をも含むものとして意
図される。したがって、釘とねじとは、釘がその円筒状
の表面を用いて木片を互いに固定するのに対しねじが螺
旋状の表面を用いているという点で構造的等価物ではな
いかもしれないが、木片を固定するという条件下におい
ては釘とねじとは等価な構造物ということができる。

【図面の簡単な説明】

【図１】ＶＡＤを用いる典型的な音声通信システムを示
す図である。

【図２】非活性音声検出のプロセスを示す図である。

【図３】非活性音声がＶＡＤにより検出された際のＶＡ
Ｄ／ＩＮＰＵプロセスを示す図である。

【図４】図３の３１０で示すＩＮＰＵ決定動作を示す図
である。

【図５】図３の３１５で示す非活性音声フレームを合成
するプロセスを示す図である。

【図６】「移動平均」を更新するプロセスを示す図であ
る。

【図７】図５の５１０で示す励起の利得スケーリングの
プロセスを示す図である。

【図８】活性音声フレームを合成するプロセスを示す図
である。

【図９】活性音声励起エネルギを更新するプロセスを示
す図である。

【符号の説明】

１１０音声符号化器１１５非活性音声符号化器１５５音声復号化器２２０ＩＮＰＵモジュール

───────────────────────────────────────────────────── フロントページの続き (72)発明者フアン−ユー・スーアメリカ合衆国、92673 カリフォルニア州、サン・クレメンテ、カレ・フロンテーラ、3009

Claims

【特許請求の範囲】

【請求項１】（ａ）入来音声信号を受けかつ符号化し
て音声復号化器へ伝送するビットストリームを生成する
ための音声符号化器と、（ｂ）伝送用通信チャネルと、
（ｃ）前記音声符号化器からの前記ビットストリームを
受けて前記ビットストリームを復号化して復元された音
声信号を生成するための音声復号化器とを備える音声通
信システムにおいて、前記入来音声信号が活性音声と非
活性音声とからなる期間を含み、非活性音声の効率的符
号化の方法であって、ａ）フレームごとに前記入来音声信号からスペクトル
の内容とエネルギとを含む予め定められた組のパラメー
タ抽出するステップと、ｂ）前記予め定められた組のパラメータのうち第１の
組に従いフレームごとに入来音声信号のフレーム音声決
定を行なうステップと、ｃ）前記フレーム音声決定が活性音声を示す場合に、
前記入来音声信号を活性音声符号化器により符号化して
活性音声ビットストリームを生成し、前記活性音声ビッ
トストリームを連続的に連結して前記チャネルにより伝
送するステップと、ｄ）前記音声復号化器が前記活性音声ビットストリー
ムを受けた場合に、活性音声復号化器を呼出して復元さ
れた音声信号を生成するステップと、ｅ）前記フレーム音声決定が非活性音声を示す場合
に、入来音声信号を非活性音声符号化器により符号化し
て非活性音声ビットストリームを生成するステップを含
み、前記非活性ビットストリームが各々幅２バイトの少
なくとも１つのパケットを含み、各パケットが非活性音
声パラメータを表わす複数の表に対する複数の指標を含
み、さらにｆ）前記フレーム音声決定が非活性音声を示す場合
に、予め定められた比較基準が満たされる場合のみ前記
非活性音声ビットストリームを伝送するステップと、ｇ）前記フレーム音声決定が非活性音声を示す場合
に、非活性音声復号化器を呼出して復元された音声信号
を生成するステップと、ｈ）前記非活性音声ビットストリームが前記音声復号
化器により受信された場合に、前記非活性音声復号化器
を更新し、それ以外の場合には以前に受信された非活性
音声情報を使用するステップとを含む、方法。
【請求項２】前記ステップ（ｅ）において、前記非活
性ビットストリーム内の前記パケットが３つの指標を含
み、その３つのうち２つが前記スペクトルの内容を表わ
すために使用され、かつ前記３つのうちの１つが前記パ
ラメータからの前記エネルギを表わすために使用され
る、請求項１に記載の方法。
【請求項３】フレームごとの前記予め定められた組の
パラメータのうちの１つがエネルギ、ＬＰＣ利得、およ
びスペクトル静止度測定値（「ＳＳＭ」）を含み、前記
予め定められた比較基準が、以下の条件、すなわちａ）最も最近伝送された非活性音声フレームと現在の
フレームとの間のエネルギの差が第１のしきい値以上で
ある場合、ｂ）現在のフレームが活性音声フレームの後の最初の
フレームである場合、ｃ）最も最近伝送された非活性音声フレームと現在の
フレームとの間のＬＰＣ利得における変化のパーセンテ
ージが第２のしきい値以上である場合、かつｄ）ＳＳＭが第３のしきい値より大きい場合のうち少
なくとも１つの条件が満たされた場合に満たされる、請
求項１に記載の方法。
【請求項４】フレームごとの前記予め定められた組の
パラメータのうち１つが、エネルギ、ＬＰＣ利得、およ
びスペクトル静止度測定値（「ＳＳＭ」）を含み、かつ
前記予め定められた比較基準が、以下の条件、すなわ
ち、ａ）最も最近伝送された非活性音声フレームと現在の
フレームとの間のエネルギの差が第１のしきい値以上で
ある場合、ｂ）現在のフレームが活性音声フレーム後の最初のフ
レームである場合、ｃ）最も最近伝送された非活性音声フレームと現在の
フレームとの間のＬＰＣ利得における変化のパーセンテ
ージが第２のしきい値以上である場合、かつｄ）ＳＳＭが第３のしきい値より大きい場合のうち少
なくとも１つが満たされた場合に満たされる、請求項２
に記載の方法。
【請求項５】活性音声および非活性音声フレーム間の
遷移を平滑化するために、ａ）活性および非活性音声フレーム双方の間に前記入
来音声信号の励起エネルギの移動平均を計算するステッ
プと、ｂ）前記非活性音声符号化器および非活性音声復号化
器双方で利用可能な局部白色ガウス雑音発生器から励起
ベクトルを抽出するステップと、ｃ）前記移動平均を使用して前記励起ベクトルの利得
スケーリングを行なうステップと、ｄ）予め定められた係数を使用して前記励起ベクトル
を減衰するステップと、ｅ）前記非活性音声のフレームに対応する第１の予め
定められた組の音声パラメータを使用することにより逆
ＬＰＣフィルタを発生させるステップと、ｆ）前記非活性音声復号化器のための前記利得スケー
リングされた励起ベクトルを使用して前記逆ＬＰＣフィ
ルタを駆動し元の非活性音声期間を複製するようにさせ
るステップとを含む、請求項１に記載の方法。
【請求項６】活性音声および非活性音声フレーム間の
遷移を平滑化するため、ａ）活性および非活性音声フレーム両方の間に前記入
来音声信号の励起エネルギの移動平均を計算するステッ
プと、ｂ）前記非活性音声符号化器および非活性音声復号化
器両方で利用可能な局部白色ガウス雑音発生器から励起
ベクトルを抽出するステップと、ｃ）前記移動平均を使用して前記励起ベクトルを利得
スケーリングするステップと、ｄ）予め定められた係数を使用して前記励起ベクトル
を減衰するステップと、ｅ）前記非活性音声のフレームに対応する第１の予め
定められた組の音声パラメータを利用することによって
逆ＬＰＣフィルタを発生するステップと、ｆ）前記非活性音声復号化器のための前記利得スケー
リングされた励起ベクトルを使用して前記逆ＬＰＣフィ
ルタを駆動し元の非活性音声期間を複製するようにさせ
るステップとを含む、請求項２に記載の方法。
【請求項７】（ａ）入来音声信号を受信しかつ符号化
して音声復号化器へ伝送するビットストリームを生成す
る音声符号化器と、（ｂ）伝送用通信チャネルと、
（ｃ）前記音声符号化器からの前記ビットストリームを
受信して前記ビットストリームを復号化して復元された
音声信号を生成するための音声復号化器とを備える音声
通信システムにおいて、前記入来音声信号が活性音声と
非活性音声の期間を含み、前記音声符号化器に結合され
る、非活性音声の効率的符号化のための装置であって、ａ）フレームごとに前記入来音声信号からスペクトル
の内容とエネルギとを含む予め定められた組のパラメー
タを抽出するための抽出手段と、ｂ）前記予め定められた組のパラメータのうちの第１
の組に従ってフレームごとに入来音声信号のフレーム音
声決定を行なうためのＶＡＤ手段と、ｃ）前記フレーム音声決定が活性音声を示す場合に前
記入来音声信号を符号化して活性音声ビットストリーム
を生成し、前記活性ビットストリームを連続的に結合さ
せかつ前記チャネルにより伝送するための活性音声符号
化器手段と、ｄ）前記音声復号化器により前記活性音声ビットスト
リームが受信された場合に復元された音声信号を生成す
るための活性音声復号化器手段と、ｅ）前記フレーム音声決定が非活性音声を示す場合
に、前記入来音声信号を符号化して非活性音声ビットス
トリームを生成するための非活性音声符号化器手段とを
含み、前記非活性ビットストリームが、各々幅２バイト
の少なくとも１つのパケットを含み、各パケットが非活
性音声パラメータを表わす複数の表に対する複数の指標
を含み、前記非活性音声符号化手段が、予め定められた
比較基準が満たされた場合にのみ前記非活性音声ビット
ストリームを伝送し、さらにｆ）前記フレーム音声決定が非活性音声を示す場合に
は、復元された音声信号を生成するための非活性音声復
号化器手段と、ｇ）前記非活性音声ビットストリームが前記音声復号
化器により受信された場合に前記非活性音声復号化器を
更新するための更新手段とを含む、装置。
【請求項８】前記非活性ビットストリーム内の前記パ
ケットが３つの指標を含み、前記３つの指標のうち２つ
が前記スペクトルの内容を表わすために使用され、かつ
前記３つのうちの１つが前記パラメータからの前記エネ
ルギを表わすために使用される、請求項７に記載の装
置。
【請求項９】フレームごとの前記予め定められた組の
パラメータの１つがエネルギ、ＬＰＣ利得、およびスペ
クトル静止度測定値（「ＳＳＭ」）を含み、かつ前記予
め定められた比較基準が、以下の条件、すなわちａ）最も最近伝送された非活性音声フレームと現在の
フレームとの間のエネルギの差が第１のしきい値以上で
ある場合、ｂ）現在のフレームが活性音声フレームの後の最初の
フレームである場合、ｃ）最も最近伝送された非活性音声フレームと現在の
フレームとの間のＬＰＣ利得における変化のパーセンテ
ージが第２のしきい値以上である場合、かつｄ）ＳＳＭが第３のしきい値より大きい場合のうち少
なくとも１つが満たされた場合に満たされる、請求項７
に記載の装置。