JP2006525533A5

JP2006525533A5 -

Info

Publication number: JP2006525533A5
Application number: JP2006504076A
Authority: JP
Filing date: 2004-03-12
Publication date: 2009-07-30
Anticipated expiration: 2024-03-12

Description

可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置

本発明は、音の信号、限定はしないが特に通話信号のディジタル符号化の改良技術に関し、音の信号の伝送および合成を考慮したものである。

発明の背景

遠隔会議、マルチメディアおよび無線通信などの種々の応用分野において、主観的品質とビットレートとの良好なトレードオフを伴う狭帯域および広帯域通話の効果的なディジタル符号化技術がますます求められている。最近まで、２００−３４００Ｈｚの領域に限定された電話の帯域幅が、主として通話の符号化への応用に用いられてきた。しかしながら、広帯域の通話を適用すると、従来の電話の帯域幅と比較して、通信における了解性および自然さが増大する。５０−７０００Ｈｚの領域の帯域幅は顔を合わせて話し合う印象を与えるほど良好な品質を配信するのに十分であると見られている。一般のオーディオ信号に対して、この帯域幅は受容可能な主観的品質を与えるが、それぞれ２０−１６０００Ｈｚおよび２０−２００００Ｈｚの領域で動作するＦＭラジオあるいはＣＤの品質よりは依然として劣る。

通話エンコーダは通話信号をディジタルビットストリームに変換し、ディジタルビットストリームは通信チャネルを経て伝送され、あるいは蓄積媒体に蓄積される。通話信号はディジタル化される、即ち標本化され、通常１６ビット／サンプルにより量子化される。通話エンコーダは、より少ないビット数によりこれらディジタルサンプルを表現し、かつ良好な主観的通話品質を維持する役割を有する。通話デコーダあるいは合成器は伝送された、あるいは蓄積されたビットストリームについて動作し、ビットストリームを音の信号に逆変換する。

符号励起線形予測（ＣＥＬＰ）符号化は、主観的品質とビットレートとの間で良好な折り合いを付ける最良の従来技術の一つである。この符号化技術は、無線および有線応用の両者における幾つかの通話符号化標準の基礎をなす。ＣＥＬＰ符号化では、標本化された通話信号は通常フレームと呼ばれるＬサンプルからなる連続するブロックにおいて処理され、Ｌは一般に１０−３０ｍｓに相当する予め決められた数である。線形予測（ＬＰ）フィルタが計算され、フレーム毎に伝送される。ＬＰフィルタの計算は一般に、例えば後続のフレームから５−１５ｍｓの通話セグメント先を見ることが必要とする。Ｌサンプルフレームはサブフレームと呼ばれるより小さいブロックに分割される。通常、サブフレームの数は、４−１０ｍｓとなる３あるいは４サブフレームである。各フレームでは、励起信号は、通常過去の励起およびイノベーションの固定コードブック励起の２つの構成要素から得られる。過去の励起から形成される構成要素は、屡々適応形コードブックあるいはピッチ励起と言い表される。励起信号を特徴づけるパラメータは符号化され、デコーダに伝送され、デコーダにおいて再構成された励起信号はＬＰフィルタの入力として使用される。

符号分割多重アクセス（ＣＤＭＡ）技術を使用する無線システムでは、ソース制御可変ビットレート（ＶＢＲ）通話符号化の使用により、システム容量はかなり改善する。ソース制御ＶＢＲ符号化では、コーデックは幾つかのビットレートで動作し、レート選択モジュールが使用され、通話フレームの性質（例えば、音声、非音声、経過音、背景雑音など）に基づいて各通話フレームの符号化に使用されるビットレートを決定する。目的は、平均データレート（ＡＤＲ）としても参照される所与の平均ビットレートにおいて最良の通話品質を達成することである。レート選択モジュールを調節して、種々の動作モードにより種々のＡＤＲｓを達成することにより、コーデックは異なるモードにより動作することが出来、ＡＤＲｓが増大するとコーデックの性能が改善される。動作モードは、チャネル条件に応じてシステムにより決定される。これにより、通話品質とシステム容量との間にトレードオフの機構を持つコーデックが可能になる。ＣＤＭＡシステム（例えば、ＣＤＭＡ−１およびＣＤＭＡ２０００）では、代表的に４つのビットレートが使用され、フルレート（ＦＲ）、ハーフレート（ＨＲ）、４分の１レート（ＱＲ）および８分の１レート（ＥＲ）と言い表される。このシステムでは、２つのレートの組がサポートされ、レートの組Iおよびレートの組IIと言い表される。レートの組IIでは、レート選択機構を有する可変レートコーデックは、１４．４、７．２、３．６および１．８ｋｂｉｔ／ｓの総ビットレート（誤り検出に対して付加された幾らかのビットを加えて）に対応して、１３．３（ＦＲ）、６．２（ＨＲ）、２．７（ＱＲ）および１．０（ＥＲ）ｋｂｉｔ／ｓのソース符号化ビットレートで動作する。

ＣＤＭＡシステムに対するＶＢＲ符号化では代表的に、通話活動のないフレーム（無音あるいは雑音のみのフレーム）の符号化に８分の１レートが使用される。フレームが動きのない音声あるいは動きのない非音声である場合、動作モードに応じてハーフレートあるいは４分の１レートが使用される。動きのない非音声フレームにハーフレートが使用されると、ピッチコードブックを持たないＣＥＬＰモードが使用される。動きのない音声フレームの場合にハーフレートが使用されると、信号変更が使用され、周期性を高め、ピッチインデックスに対するビット数を削減する。もし動作モードが４分の１レートを決定すると、ビット数が不十分であるので、通常波形整合は不可能であり、一般にあるパラメトリック符号化が適用される。開始時音、経過フレームおよび混合音声フレームにはフルレートが使用される（代表的なＣＥＬＰモードが通常使用される）。ＣＤＭＡシステムではソース制御コーデック動作に加えて、帯域内信号情報（ディムおよびバースト信号通知と呼ばれる）を送信するためにある通話フレームにおいて、あるいはコーデックの強さを改善するために悪チャネル条件中に（セル境界の近くなど）、システムは最大ビットレートを制限することが出来る。これはハーフレートマックスと言い表される。レート選択モジュールが符号化されるべきフレームをフルレートフレームとして選択し、システムが、例えばＨＲフレームを決定すると、供されたＨＲモードは開始時音および経過信号を有効に符号化できないので、通話性能は劣化する。これら特別のケースに対処するために、別の汎用ＨＲ符号化モデルが設計される。

幾つかの広帯域通話の電話およびサービスに対してＩＴＵ−Ｔ（国際通信連合−通信標準化部門）により、およびＧＳＭおよびＷ−ＣＤＭＡ第３世代無線システムに対して３ＧＰＰ（第３世代連合プロジェクト）により、適応型マルチレート広帯域（ＡＭＲ−ＷＢ）通話コーデックが採用された。ＡＭＲ−ＷＢコーデックは９つのビットレート、即ち６．６０、８．８５、１２．６５、１４．２５、１５．８５、１８．２５、１９．８５、２３．０５および２３．８５ｋｂｉｔ／ｓからなる。ＣＤＭＡシステムに対するＡＭＲ−ＷＢベースのソース制御ＶＢＲコーデックを設計することには、ＣＤＭＡとＡＭＲ−ＷＢコーデックを使用する他のシステムとの間の相互動作を可能にする利点がある。１２．６５ｋｂｉｔ／ｓのＡＭＲ−ＷＢビットレートはレートの組IIの１３．３６５ｋｂｉｔ／ｓフルレートに適合することの出来る最も近いレートである。このレートは、ＣＤＭＡ広帯域ＶＢＲコーデックとＡＭＲ−ＷＢ間の共通レートとして使用することが出来、符号変換（通話品質を劣化させる）を必要とすることなく相互動作を可能にする。レートの組IIの構成における有効な動作を可能にするためにはＣＤＭＡＶＢＲ広帯域ソリューションに対して特に、より低レートの符号化タイプが設計されなければならない。次に、全てのレートを使用する幾つかのＣＤＭＡ特有のモードでコーデックは動作することが出来るが、コーデックにはＡＭＲ−ＷＢコーデックを使用するシステムとの間の相互動作を可能にするモードがあり得る。

ＣＥＬＰに基づくＶＢＲ符号化では、非音声および非活動的通話クラスを除き、代表的に全てのクラスがピッチ（あるいは適応型）コードブックおよびイノベーション（あるいは固定）コードブックの両者を使用し、励起信号を表現する。従って、符号化された励起は、ピッチラグ（あるいはピッチコードブックインデックス）、ピッチゲイン、イノベーションコードブックインデックスおよびイノベーションコードブックゲインからなる。代表的には、ビットレートを削減するために、ピッチゲインとイノベーションゲインは関連して量子化され、あるいはベクトル量子化される。もし個別に量子化されると、ピッチゲインは４ビットを要求し、イノベーションコードブックゲインは５あるいは６ビットを要求する。しかしながら、まとめて量子化すると、６あるいは７ビットで十分である（５ｍｓ当たり３ビットの節約は０．６ｋｂｉｔ／ｓの節約に等価である）。一般に、量子化テーブルあるいはコードブックは全てのタイプの通話セグメント（例えば、音声、非音声、経過時、開始時音、終了時音など）を使用して訓練される。ＶＢＲ符号化に関しては、ハーフレート符号化モデルが通常クラスに特有である。それ故、異なる信号クラス（音声、非音声あるいは汎用）に対して、異なるハーフレートモデルが設計される。従って、これらクラス特有の符号化モデルに対して、新しい量子化テーブルが設計される必要がある。

本発明は、符号化中にＬ個のサンプルからなる連続する複数のフレームによって処理される標本化された音の信号の符号化技術において使用するゲイン量子化方法に関係し、
・各フレームは複数のサブフレームに分割され、
・各サブフレームは、Ｎ＜Ｌなる数Ｎのサンプルを含み、
・ゲイン量子化方法は、サブフレームの数ｆに基づいて一次ピッチゲインを計算するステップ、一次ピッチゲインに関してゲイン量子化コードブックの一部を選択するステップ、ｆサブフレームの連続するグループ当たりに少なくとも１ビットを使用してゲイン量子化コードブックの選択された部分を特定するステップ、およびピッチゲインと固定コードブックゲインをまとめて量子化するステップを含む。
ピッチゲインと固定コードブックゲインとをまとめて量子化することは、サブフレームの数ｆに対して検索評価基準に関連してゲイン量子化コードブックを検索するステップを含む。ゲイン量子化コードブックを検索するステップは、コードブック検索をゲイン量子化コードブックの選択された部分に限定するステップ、および検索評価基準を最も良く満たすゲイン量子化コードブックの選択された部分のインデックスを見つけるステップを含む。

本発明は、また符号化中にＬサンプルからなる連続するフレームによって処理される標本化された音の信号符号化システムにおいて使用するゲイン量子化装置に関係し、
・各フレームは複数のサブフレームに分割され、
・各サブフレームは、Ｎ＜Ｌなる数Ｎのサンプルを含み、
・ゲイン量子化装置は、サブフレームの数ｆに基づいて一次ピッチゲインを計算する手段、一次ピッチゲインに関してゲイン量子化コードブックの一部を選択する手段、ｆサブフレームの連続するグループ当たりに少なくとも１ビットを使用してゲイン量子化コードブックの選択された部分を特定する手段およびピッチゲインと固定コードブックゲインとをまとめて量子化する手段を含む。
ピッチゲインと固定コードブックゲインとをまとめて量子化する手段は、検索評価基準に関連してゲイン量子化コードブックを検索する手段を含む。ゲイン量子化コードブックの検索手段は、サブフレームの数ｆに対してコードブック検索をゲイン量子化コードブックの選択された部分に限定する手段、および検索評価基準を最も良く満たすゲイン量子化コードブックの選択された部分のインデックスを見つける手段を含む。

本発明は、さらに符号化中にＬサンプルからなる連続するフレームによって処理される標本化された音の信号の符号化技術において使用するゲイン量子化装置に関係し、
・各フレームは複数のサブフレームに分割され、
・各サブフレームは、Ｎ＜Ｌなる数Ｎのサンプルを含み、
・ゲイン量子化装置は、サブフレームの数ｆに基づいて一次ピッチゲインを計算する計算器、一次ピッチゲインに関するゲイン量子化コードブックの一部を選択する選択器、ｆサブフレームの連続するグループ当たりに少なくとも１ビットを使用して、ゲイン量子化コードブックの選択された部分を特定する特定器、およびピッチゲインと固定コードブックゲインとをまとめて量子化するベクトル量子化器を含む。
このベクトル量子化器は、検索評価基準に関連してゲイン量子化コードブックの選択された部分を検索する検索器を含み、この検索器は、コードブック検索をゲイン量子化コードブックの選択された部分に限定し、検索評価基準を最も良く満たすゲイン量子化コードブックの選択された部分のインデックスを見つける。

さらに本発明は、符号化中にＬサンプルからなる連続するフレームによって処理される標本化された音の信号の符号化技術において使用するゲイン量子化方法に関係し、各フレームは複数のサブフレームに分割され、各サブフレームは、Ｎ＜Ｌなる数Ｎのサンプルを含む。このゲイン量子化方法は、
サブフレームより長い期間Ｋに基づいて一次ピッチゲインを計算するステップ、
一次ピッチゲインに関してゲイン量子化コードブックの一部を選択するステップ、
ｆサブフレームの連続するグループ当たりに少なくとも１ビットを使用してゲイン量子化コードブックの選択された部分を特定するステップおよび
ピッチゲインと固定コードブックゲインをまとめて量子化するステップ
を含む。

ただし、ピッチゲインと固定コードブックゲインをまとめて量子化するステップは、
・検索評価基準に関連してゲイン量子化コードブックを検索すること、ただしコードブック検索をゲイン量子化コードブックの選択された部分に限定することと、検索評価基準を最も良く満たすゲイン量子化コードブックの選択された部分のインデックスを見つけることとを含む、前記検索することと、
・次式を使用してサブフレームより長い期間Ｋに基づいて一次ピッチゲインを計算することと、
を含む。

ここで、Ｔ_ＯＬは開ループのピッチラグであり、ｓ_ｗ（ｎ）は標本化された音の信号を知覚的に重み付けしたものから導出された信号である。

最後に、本発明は、符号化中にＬサンプルからなる連続するフレームによって処理される標本化された音の信号の符号化技術において使用するゲイン量子化装置に関係し、各フレームは複数のサブフレームに分割され、各サブフレームは、Ｎ＜Ｌなる数Ｎのサンプルを含む。上記ゲイン量子化装置は、
サブフレームより長い期間Ｋに基づく一次ピッチゲインの計算器、
一次ピッチゲインに関するゲイン量子化コードブックの一部の選択器、
ｆサブフレームの連続するグループ当たりに少なくとも１ビットを使用するゲイン量子化コードブックの選択された部分の特定器、および、
ピッチゲインと固定コードブックゲインをまとめて量子化するベクトル量子化器
を備える。

このベクトル量子化器は、
・検索評価基準に関連するゲイン量子化コードブックの選択された部分を検索する検索器であって、コードブック検索をゲイン量子化コードブックの選択された部分に限定し、検索評価基準を最も良く満たすゲイン量子化コードブックの選択された部分のインデックスを見つける、検索器と、
・一次ピッチゲインｇ'_ｐを計算するために使用される次式を含む一次ピッチゲインの計算器と、
を含む。

ここで、Ｔ_ＯＬは開ループのピッチラグであり、ｓ_ｗ（ｎ）は音の信号を知覚的に重み付けしたものから導出された信号である。

添付する図面を参照して例としてのみ与えられる本発明の実施例に関する以下の非限定的説明を読めば、本発明の前記および他の目的、利点および特徴はより明らかになる。

例示的な実施態様の詳細な説明

本発明の非限定的実施例を通話信号に関連して説明するが、本発明は、例えばオーディオ信号など他のタイプの音の信号にも適用されうることに留意すべきである。

図１は、本発明に従う通話符号化装置および復号装置が使用される状況を示す通話通信システム１００を説明する。通話通信システム１００は、通信チャネル１０５を介する通話信号の伝送および再生をサポートする。通信チャネルは、例えば線路、光あるいはファイバリンクを含むが、通信チャネル１０５は、代表的には少なくとも一部無線周波数リンクを含む。屡々、無線周波数リンクは、セル電話の実施例に見られる様な共有帯域幅リソースを要求する複数の、同時通話通信をサポートする。図示されないが、通信チャネル１０５は、後の再生のために符号化された通話信号を記録し、蓄積する通信システムの単一装置の実施形態における蓄積ユニットにより置き換えられることが出来る。

送信機側では、マイクロフォン１０１が通話をアナログ通話信号１１０に変換し、アナログ通話信号１１０はアナログからディジタル（Ａ／Ｄ）へのコンバータ１０２に供給される。Ａ／Ｄコンバータ１０２の機能は、アナログ通話信号１１０をディジタル通話信号１１１に変換することである。通話エンコーダ１０３はディジタル通話信号１１１を符号化し、バイナリ形式で、任意選択のチャネルエンコーダ１０４に供給すされる、１組の信号符号化パラメータ１１２を生成する。任意選択のチャネルエンコーダ１０４は信号符号化パラメータ１１２のバイナリ表現に冗長性を加えた後、パラメータを通信チャネル１０５を介して送信する（１１３参照）。

受信機側では、チャネルデコーダ１０６は受信ビットストリーム１１４の冗長情報を利用して、伝送中に生じたチャネル誤りを検出し、訂正する。通話デコーダ１０７は、合成音声信号１１６の創成のためにチャネルデコーダから受信したビットストリーム１１５を１組の信号符号化パラメータに逆変換する。通話デコーダ１０７において再構成された合成音声信号１１６は、ディジタルからアナログ（Ｄ／Ａ）へのコンバータ１０８においてアナログ通話信号１１７に逆変換される。最後に、アナログ通話信号１１７は、拡声器ユニット１０９を通して再生される。

〔ＡＭＲ−ＷＢエンコーダの概要〕

この節では、12.65kbit/sのビットレートで動作するＡＭＲ−ＷＢエンコーダの概要を述べる。本発明の非限定的、実施例では、このＡＭＲ−ＷＢエンコーダはフルレートエンコーダとして使用される。

エンコーダへの入力である、標本化された音の信号２１２，例えば通話信号は、２０１から２１１の番号を付された１１のモジュールに細分化される図２のエンコーダ２００により、ブロック毎に処理あるいは符号化される。

エンコーダへの入力である、標本化された通話信号２１２は、上述の連続するブロックへと処理される。各ブロックは、フレームと呼ばれるＬ個のサンプルからなる。

図２を参照すると、入力である、標本化された通話信号１１２は、ダウンサンプリング器２０１においてダウンサンプリングされる。この技術に通常の知識を有する人によく知られた技術を使用して、入力通話信号２１２は、１６ｋＨｚの標本化周波数から１２．８ｋＨｚの標本化周波数にダウンサンプリングされる。より狭い周波数帯域幅が符号化されるので、ダウンサンプリングにより符号化効率が増大する。フレーム内のサンプル数が減少するので、ダウンサンプリングはまた、アルゴリズムの複雑さを低減する。ダウンサンプリングの後、３２０個のサンプルを含む２０ｍｓのフレームは、２５６個のサンプルを含むフレーム（符号２１３）へと小さくなる（４／５のダウンサンプリング率）。

ダウンサンプリングフレーム２１３は、次いでオプションの前処理ユニットに供給される。図２の非限定的実施例では、前処理ユニットは５０Ｈｚのカットオフ周波数を持つ高域通過フィルタ２０２からなる。この高域通過フィルタ２０２は５０Ｈ以下の不要の音要素を除去する。

ダウンサンプリング及び前処理された信号はｓ_ｐ（ｎ）で示され、ｎ＝０、１、２、...、Ｌ−１であり、Ｌはフレームの長さ（１２．８ｋＨｚの標本化周波数の時２５６）である。非限定的実施例によれば、以下の伝達関数を有するプリエンファシスフィルタ２０３を使用して、信号ｓ_ｐ（ｎ）は事前強調される。
Ｐ（ｚ）＝１−μｚ^−１（１）
ここで、μは０から１の間の値（代表値はμ＝０．７）を有するプリエンファシスファクタである。プリエンファシスフィルタ２０３の機能は入力通話信号の高周波数成分を強めることである。プリエンファシスフィルタ２０３は、また入力通話信号のダイナミックレンジを狭くすることにより、固定小数点実装により良く適合するようにする。プリエンファシスは、また量子化誤差の適切な総合的知覚的重み付けを達成するのに重要な役割を果たし、音の品質の改善に貢献する。これについては、以下でより詳しく説明する。

プリエンファシスフィルタ２０３の出力信号はｓ（ｎ）で示される。この信号ｓ（ｎ）は、ＬＰ分析、量子化および補間モジュール２０４におけるＬＰ分析の実行に使用される。ＬＰ分析はこの技術の通常の知識を有する人によく知られた技術である。図２の非限定的実施例では、自己相関法が使用される。自己相関法によれば、典型的に、通常３０−４０ｍｓのオーダの長さを持つハミング（Hamming）窓を使用して、信号ｓ（ｎ）を窓掛けする。自己相関は窓掛けされた信号から計算され、レビンソン−ダービン（Levinson-Durbin）回帰を使用して、ＬＰフィルタの係数α_ｉを計算する。ただしｉ＝０，１，２，...ｐであり、ｐはＬＰのオーダであり、広帯域符号化では代表的に１６である。パラメータα_ｉはＬＰフィルタの伝達関数の係数であり、次式で与えられる。

ＬＰ分析は、ＬＰフィルタの係数の量子化および補間（Interpolation）をも行う、ＬＰ分析、量子化および補間モジュール２０４において行われる。ＬＰフィルタの係数α_ｉは、まず量子化および補間の目的により良く適する別の等価領域に変換される。線スペクトルペア（Line Spectral Pair；ＬＳＰ）およびイミッタンススペクトルペア（Immitance Spectral Pair；ＩＳＰ）の領域は、量子化と補間が有効に行われうる２つの領域である。分割あるいはマルチステージ量子化あるいは前記の組み合わせを使用して、１６のＬＰフィルタ係数α_ｉは、３０から５０のオーダのビット数により量子化されうる。補間の目的は、フレーム毎に１度ＬＰフィルタ係数を送信する一方、サブフレーム毎にＬＰフィルタ係数α_ｉの更新を可能にすることであり、これによりビットレートを増すことなくエンコーダ性能を改良させる。ＬＰフィルタ係数の量子化および補間は、その他の点ではこの技術に通常の知識を有する人にはよく知られているものと信じられ、従って本明細書ではこれ以上説明しない。

以下の数節で、サブフレームベースで行われる符号化動作の残りを説明する。図２の非限定的実施例では、入力フレームは５ｍｓの４つのサブフレーム（１２．８ｋＨｚサンプリングの場合は６４サンプル）に分割される。以下の説明では、フィルタ

は、サブフレームの量子化されていない補間ＬＰフィルタを示し、フィルタ

はサブフレームの量子化された補間ＬＰフィルタを示す。

分析−合成型のエンコーダにおいて、最適なピッチとイノベーションパラメータは、知覚的に重み付けされた領域における入力通話と合成音声間の平均二乗誤差を最小にすることにより検索される。図２で、ｓ_ｗ（ｎ）で示す、知覚的重み付け信号は、知覚的重み付けフィルタ２０５において計算される。広帯域信号に適する、固定分母を持つ知覚的重み付けフィルタ２０５が使用される。知覚的重み付けフィルタ２０５の伝達関数の例は次式で与えられる。
Ｗ（ｚ）＝Ａ（ｚ／γ_１）／（１−γ_２ｚ^−１）ここで、０＜γ_２＜γ_１≦１

ピッチ解析を簡単にするために、重み付けがされた通話信号ｓ_ｗ（ｎ）を使用して、開ループピッチラグＴ_ＯＬが、まず開ループピッチ検索モジュール２０６において評価される。次いで、閉ループピッチ検索モジュール２０７においてサブフレームベースで行われる、閉ループピッチ分析は、開ループピッチラグＴ_ＯＬの周りに限定されるが、それによって、ＬＴＰパラメータのＴおよびｇ_ｐ（それぞれピッチラグおよびピッチゲイン）の検索の複雑さが相当に減少する。この技術に通常の知識を有する人にはよく知られている技術を使用して、開ループピッチ分析は、通常モジュール２０６において１０ｍｓ毎に１度行われる。

長期予測（Long Term Prediction；ＬＴＰ）分析のための目標ベクトルｘがまず計算される。これは、重み付けされた通話信号ｓ_ｗ（ｎ）から、重み付けされた合成フィルタ

の零入力応答ｓ_０を減算して行われる。この零入力応答ｓ_０は、ＬＰ分析、量子化および補間モジュール２０４からの量子化された補間ＬＰフィルタ

、
ＬＰフィルタ

、
および

に対応してメモリ更新モジュール２１１に蓄積された、重み付けされた合成フィルタ

の初期状態および励起ベクトルｕに応じて、零入力応答計算器２０８により計算される。この動作は、この技術に通常の知識を有する人にはよく知られており、従って本明細書ではこれ以上説明しない。

ＬＰ分析、量子化および補間モジュール２０４からのＬＰフィルタ

および

の係数を使用して、重み付けされた合成フィルタ

のＮ次元インパルス応答ベクトルｈが、インパルス応答生成器２０９において計算される。この動作も、この技術に通常の知識を有する人にはよく知られており、従って本明細書ではこれ以上説明しない。

目標ベクトルｘ（ｎ）、インパルス応答ベクトルｈ（ｎ）および開ループピッチラグＴ_ＯＬを入力として使用する閉ループピッチ検索モジュール２０７において、閉ループピッチ（あるいはピッチコードブック）パラメータｇ_ｐ、Ｔおよびｊが計算される。

ピッチ検索は、目標ベクトルｘ（ｎ）と過去の励起ｇ_ｐｙ_Ｔ（ｎ）を評価、フィルタリングしたものとの間の平均二乗加重ピッチ予測誤差、例えば

を最小にする最良のピッチラグＴおよびゲインｇ_ｐの検出からなる。

より明確には、ピッチコードブック（適応型コードブック）の検索は３つのステージから構成される。

第１ステージでは、開ループピッチ検索モジュール２０６において、開ループピッチラグＴ_ＯＬが加重通話信号ｓ_ｗ（ｎ）に応じて評価される。前述のように当業者によく知られた技術を使用して、この開ループピッチ分析は、通常１０ｍｓ（２サブフレーム）ごとに１度行われる。

第２ステージでは、評価開ループピッチラグＴ_ＯＬの周りの整数ピッチラグに対して（通常±５）、検索評価基準Ｃが閉ループピッチ検索モジュール２０７において検索されるが、これは、ピッチコードブックの検索手順を著しく簡単にする。各ピッチラグに対する畳み込みを計算する必要なく、フィルタリングした符号ベクトルｙ_Ｔ（ｎ）（このベクトルは以下の説明で定義される）の更新に簡単な手順が使用される。検索評価基準Ｃの例は次式により与えられる。

第２ステージで最適の整数ピッチラグが一度検出されると、検索の第３ステージ（閉ループピッチ検索モジュール２０７）は、検索評価基準Ｃによりその最適整数ピッチラグの周りの端数を試験する。例えば、ＡＭＲ−ＷＢエンコーダは１／４および１／２サブサンプル分解度を使用する。

広帯域信号では、通話セグメントに応じてある周波数まで高調波構造が存在するに過ぎない。従って、広帯域通話信号の音声セグメントにおけるピッチ寄与度の有効な表現を行うために、広帯域スペクトラムに対する周期性の程度を変更する柔軟性が要求される。これは、複数の周波数整形フィルタ（例えば、低域通過あるいは帯域通過フィルタ）によりピッチ符号ベクトルを処理することにより達成され、以上に定義した平均二乗加重誤差ｅ^（ｊ）を最小にする周波数整形フィルタが選択される。選択された周波数整形フィルタはインデックスｊにより特定される。

ピッチコードブックインデックスＴは符号化され、通信チャネルを通して伝送されるためにマルチプレクサ２１４に送られる。ピッチゲインｇ_ｐは量子化され、マルチプレクサ２１４に送られる。特別のビットを使用してインデックスｊを符号化し、この特別のビットもマルチプレクサ２１４に送られる。

ピッチ、あるいは長期予測（ＬＴＰ）パラメータｇ_ｐ、Ｔおよびｊが一度決定すると、次のステップは、図２のイノベーション励起検索モジュール２１０による最適なイノベーション（固定コードブック）励起の検索からなる。まず、目標ベクトルｘ（ｎ）がＬＴＰの寄与を差し引いて更新される。
ｘ'（ｎ）＝ｘ（ｎ）−ｇ_ｐｙ_Ｔ（ｎ）
ここで、ｇ_ｐはピッチゲインであり、ｙ_Ｔ（ｎ）はフィルタリングされたピッチコードブックベクトルである（選択された周波数整形フィルタ（インデックスｊ）によりフィルタリングされ、インパルス応答ｈ（ｎ）と畳み込みがされた、ピッチラグＴにおける過去の励起）。

目標ベクトルｘ'（ｎ）と符号ベクトルｃ_ｋの評価、フィルタリングされたものとの間の平均二乗誤差Ｅ、例えば次式を最小にする最適励起（固定コードブック）符号ベクトルｃ_ｋおよびゲインｇ_ｃを見つけるために、ＣＥＬＰにおけるイノベーション励起検索手順がイノベーション（固定）コードブックにおいて実行される。

ここで、Ｈはインパルス応答ｈ（ｎ）から導出された、より低位の３角畳み込みマトリックスである。検出された最適符号ベクトルｃ_ｋおよびゲインｇ_ｃに対応するイノベーションコードブックのインデックスｋは通信チャネルを通して伝送するためにマルチプレクサ２１４に供給される。

使用したイノベーションコードブックが、１９９５年８月２２日にアドゥール（Ａｄｏｕｌ）他に与えられた米国特許５、４４４、８１６に従い、合成音声の品質を改善するために所与のスペクトル成分を高める適応型予備フィルタを伴う代数コードブックからなる、動的コードブックであり得ることに留意すべきである。より明確には、１９９５年８月２２日に公開された米国特許番号第５、４４４、８１６（アドゥール（Ａｄｏｕｌ）他）、１９９７年１２月１７日にアドゥール（Ａｄｏｕｌ）他に与えられた米国特許第５、６９９、４８２、１９９８年５月１９日にアドゥール（Ａｄｏｕｌ）他に与えられた米国特許第５、７５４、９７６および１９９７年１２月２３日付けの第５、７０１、３９２（アドゥール（Ａｄｏｕｌ）他）において述べられているように代数コードブックにより、イノベーションコードブック検索がモジュール２１０において実行されうる。

最適イノベーション符号ベクトルのインデックスｋは送信される。非限定的実施例として代数コードブックが使用され、ここでインデックスは励起ベクトルにおける振幅が零でないパルスの位置と符号からなる。以下の説明において記述する同時量子化（Joint quantization）手続を使用して、ピッチゲインｇ_ｐおよびイノベーションゲインｇ_ｃが最終的に量子化される。

１２．６５ｋｂｉｔ／ｓで動作するＡＭＲ−ＷＢエンコーダのビット配置は表１において与えられる。

ゲインの同時量子化（Joint quantization）
ピッチコードブックゲインｇ_ｐおよびイノベーションコードブックゲインｇ_ｃはスカラー型あるいはベクトル型のいずれかで量子化されうる。

スカラー量子化では、代表的には４ビット（０から１．２の範囲の一様でない量子化）を使用して、ピッチゲインは独立に量子化される。イノベーションコードブックゲインは、通常５あるいは６ビットを使用して量子化される。符号は１ビットを用いて量子化され、大きさ（magnitude）は４あるいは５ビットを用いる。ゲインの大きさは、通常対数領域において一様に量子化される。

同時量子化、あるいはベクトル量子化では、量子化テーブルあるいはゲイン量子化コードブックが設計され、エンコーダおよびデコーダ端末の両方に格納される。このコードブックは、２つのゲインｇ_ｐおよびｇ_ｃの量子化に使用されるビット数に依存するサイズを有する、２次元コードブックであり得る。例えば、２つのゲインｇ_ｐおよびｇ_ｃの量子化に使用される７ビットコードブックは２つの次元を有する１２８のエントリを含む。あるサブフレームにとって最良のエントリは、ある誤差評価基準を最小にすることにより見出される。例えば、入力信号と合成信号間の平均二乗誤差を最小にすることにより、最良コードブックエントリが検索されうる。

さらに信号相関を利用するために、イノベーションコードブックゲインｇ_ｃについて予測が行なわれうる。代表的には、予測は対数領域において評価されたイノベーションコードブックエネルギーに関して行われる。

例えば、固定係数を持つ移動平均（ＭＡ）予測を使用して、予測が行われうる。例えば、４次オーダのＭＡ予測は、以下のようにイノベーションコードブックエネルギーに関して行われる。Ｅ（ｎ）がサブフレームｎにおける平均を除去したイノベーションコードブックエネルギー（ｄＢ）であり、次式で与えられるものとする。

ただし、
Ｎはサブフレームのサイズ、
ｃ（ｉ）はイノベーションコードブック励起、

はイノベーションコードブックエネルギーの平均（ｄＢ）である。この非限定的実施例では、１２．８ｋｂｉｔ／ｓの標本化周波数における５ｍｓに対応してＮ＝６４および

である。イノベーションコードブック予測エネルギーは次式で与えられる。

ここで、［ｂ_１、ｂ_２、ｂ_３、ｂ_４］＝［０．５、０．４、０．３、０．２］はＭＡ予測係数であり、

はサブフレームｎ−ｉにおける量子化エネルギー予測誤差である。イノベーションコードブック予測エネルギーを使用して、式（３）におけるように、Ｅ（ｎ）を

により置き換え、ｇ_ｃをｇ'_ｃにより置き換えて、予測イノベーションゲインｇ'_ｃを計算する。これは以下のように行われる。まず、次式を使用して、平均イノベーションコードブックエネルギーが計算される。

そして次に、予測イノベーションゲインｇ'_ｃは次式により見出される。

入力通話信号２１２の処理中に計算されるようにゲインｇ_ｃと評価、予測されたゲインｇ'_ｃとの間の相関ファクタは次式により与えられる。
γ＝ｇ_ｃ／ｇ'_ｃ（７）

エネルギー予測誤差が次式により与えられることに注意されたい。

８．８５ｋｂｉｔ／ｓおよび６．６０ｋｂｉｔ／ｓのＡＭＲ−ＷＢレートの場合は６ビットコードブック、他のＡＭＲ−ＷＢレートの場合は７ビットコードブックを使用して、ピッチゲインｇ_ｐおよび相関ファクタγがまとめてベクトル量子化される。次式で与えられる、元の通話と再構成された通話間の重み付けされた誤差の平均二乗を最小化することにより、ゲイン量子化コードブックの検索が行われる。
Ｅ＝ｘ^ｔｘ＋ｇ_ｐ ^２ｙ^ｔｙ＋ｇ_ｃ ^２ｚ^ｔｚ−２ｇ_ｐｘ^ｔｙ−２ｇ_ｃｘ^ｔｚ＋２ｇ_ｐｇ_ｃｙ^ｔｚ（９）
ここで、ｘは目標ベクトルであり、ｙはフィルタリングされたピッチコードブック信号（信号ｙ（ｎ）は、通常ピッチコードブックベクトルと加重合成フィルタのインパルス応答ｈ（ｎ）との畳み込みとして計算される）であり、ｚは加重合成フィルタによりフィルタリングされたイノベーションコードブックベクトルであり、ｔは「転置」を示す。選択されたゲインと関連した量子化エネルギー予測誤差を使用してＲ（ｎ）を更新する。

〔可変レート符号化におけるゲイン量子化〕

ソース制御ＶＢＲ通話符号化の使用により、多くの通信システム、特にＣＤＭＡ技術を使用する無線システムの能力は著しく改善される。ソース制御ＶＢＲ符号化では、コーデックは幾つかのビットレートで動作し、レート選択モジュールを使用して、通話フレームの性質、例えば音声、非音声、経過音、背景雑音などに基づいて各通話フレームを符号化するのに使用すべきビットレートを決定する。目的は所与の平均ビットレートにおいて最良の通話品質を得ることである。レート選択モジュールを調節して、種々の平均データレート（ＡＤＲｓ）を達成することにより、コーデックは異なるモードにおいて動作することが出来、ＡＤＲｓが増大すると、コーデックの性能が改善される。幾つかの通信システムではチャネル条件に応じて、動作モードはシステムにより決定されうる。これは、通話品質とシステム容量とのトレードオフの機構をコーデックに提供する。そしてコーデックは、信号分類アルゴリズムを備え、入力通話信号を分析し、各通話フレームを予め決められたクラスの組みの１つ、例えば背景雑音、音声、非音声、混合音声、経過音などに分類する。また、コーデックはレート選択アルゴリズムを含み、決定された通話フレームのクラスと所望の平均ビットレートに基づいて使用すべきビットレートと符号化モデルを決定する。

ＣＤＭＡ２０００システム（以下、このシステムはＣＤＭＡシステムと言い表される）における使用例を考えると、代表的には４つのビットレートが使用され、それぞれフルレート（ＦＲ）、ハーフレート（ＨＲ）、４分の１レート（ＱＲ）および８分の１レート（ＥＲ）と言い表される。また、レートの組Iおよびレートの組IIと言い表される２つのレートの組がＣＤＭＡシステムによりサポートされる。レートの組IIでは、レート選択機構を有する可変レートコーデックは、１３．３（ＦＲ）、６．２（ＨＲ）、２．７（ＱＲ）および１．０（ＥＲ）ｋｂｉｔ／ｓのソース符号化ビットレートで動作する。レートの組Iでは、ソース符号化ビットレートは８．５５（ＦＲ）、４．０（ＨＲ）、２．０（ＱＲ）および０．８（ＥＲ）ｋｂｉｔ／ｓである。本発明の非限定的実施例では、レートの組IIが考慮される。

マルチモードＶＢＲ符号化では、個々のビットレートの使用率を定義することにより、異なる平均ビットレートに対応して異なる動作モードが得られる。従って、レート選択アルゴリズムは、通話フレームの性質（分類情報）と所望の平均ビットレートに基づいて、ある通話フレームに使用すべきビットレートを決定する。

帯域内信号情報（ディムおよびバースト信号と呼ばれる）を送信するため、あるいは（セル境界の近くなどの）悪チャネル条件におけるコーデックのロバスト性を改善するために、ＣＤＭＡシステムは、動作モードの強制に加えて、ある通話フレームの最大ビットレートを制限することが出来る。

本発明の非限定的実施形態では、ＣＤＭＡ２０００システムのレートの組IIにおいて動作することの出来る、ソース制御マルチモード可変ビットレート符号化システムが使用される。以下の説明では、この符号化システムはＶＭＲ−ＷＢ（可変マルチレート広帯域）コーデックと言い表される。上記の説明で記述したように、このコーデックは適応型マルチレート広帯域（ＡＭＲ−ＷＢ）通話コーデックをベースとする。フルレート（ＦＲ）符号化は１２．６５ｋｂｉｔ／ｓのＡＭＲ−ＷＢをベースとする。静的な音声フレームに対して、音声ＨＲ符号化モデルが設計される。非音声フレームに対して、非音声ＨＲおよび非音声ＱＲ符号化モデルが設計される。背景雑音フレーム（非活動的通話）に対しては、ＥＲコンフォート雑音生成器（ＣＮＧ）が設計される。レート選択アルゴリズムは特定のフレームにＦＲモデルを選択するが、通信システムが信号通知の目的にＨＲの使用を決定すると、その時は音声ＨＲも非音声ＨＲもフレームの符号化には適さない。この目的には、汎用ＨＲモデルが設計された。また、汎用ＨＲモデルは音声あるいは非音声として分類されないが、知覚上の重要性は低いので、長期平均エネルギーに関して比較的低いエネルギーを有するフレームの符号化に使用することが出来る。

上記のシステムに対する符号化方法は表２にまとめられ、一般に符号化タイプと言い表される。一般性を失うことなく、他の符号化タイプを使用することが出来る。

この技術に通常の知識を有する人によく知られた訓練手順を使用して、例えば音声、非音声、経過音、開始時音、終了時音などの全てのクラスの信号に対して、ＦＲ符号化タイプに対するゲイン量子化コードブックが設計される。ＶＢＲ符号化に関して、音声および汎用ＨＲ符号化タイプは共にピッチコードブックおよびイノベーションコードブックを使用して、励起信号を形成する。従ってＦＲ符号化タイプに類似して、ピッチおよびイノベーションゲイン（ピッチコードブックゲインおよびイノベーションコードブックゲイン）は量子化される必要がある。しかしながら低いビットレートでは、新しいコードブックの設計を必要とする量子化ビット数を削減するのは有利である。さらに音声ＨＲに対して、このクラスに特有の符号化タイプのために新しい量子化コードブックが要求される。それ故に、本発明の非限定的実施例では、低いレートの符号化タイプにおいても、新しい量子化コードブックの設計を必要とすることなく、ゲイン量子化におけるビット数の削減を可能にする、ＶＢＲＣＥＬＰ符号化ベースのゲイン量子化を提供する。特に、汎用ＦＲ符号化タイプに設計されたコードブックの一部が使用される。ゲイン量子化コードブックはピッチゲイン値に基づいて順序づけされる。長い期間、例えば２サブフレームあるいはそれ以上に亘って計算された一次ピッチゲイン値をベースに、あるいは１ピッチ期間あるいはそれ以上に亘るピッチ同期法において、量子化に使用されるコードブックの部分が決定される。コードブックの部分に関する情報はサブフレームベースでは送信されないので、これによりビットレートの削減が結果として得られる。さらにフレーム内におけるゲイン変動が削減されるので、静的な音声フレームの場合、これにより品質の改善が結果として得られる。

サブフレームにおける量子化されていないピッチゲインは以下のように計算される。

ここで、ｘ（ｎ）は目標信号、ｙ（ｎ）はフィルタリングピッチコードブックベクトル、Ｎはサブフレームのサイズ（サブフレームにおけるサンプル数）である。信号ｙ（ｎ）は、通常ピッチコードブックベクトルと、重み付けされた合成フィルタのインパルス応答ｈ（ｎ）との畳み込みとして計算される。ＣＥＬＰベースの符号化における目的ベクトルとフィルタリングされたピッチコードブックベクトルの計算は、この技術に通常の知識を有する人によく知られている。参考文献、「適応型マルチレート広帯域（ＡＭＲ−ＷＢ）を使用する約１６ｋｂｉｔ／ｓの通話の広帯域符号化（Wideband coding of speech at around 16kbit/s using Adaptive Multi-Rate Wideband（ＡＭＲ−ＷＢ））、ITU-T勧告G.722.2，ジュネーブ、２００２年」および「ＡＭＲ広帯域通話コーデック；符号変換機能（AMR Wideband Speech Codec; Transcoding Functions）、3GPP TS 26.190，3GPP技術仕様書」に、この計算の例が記述されている。チャネル誤差の場合の不安定性の可能性を減らすために、計算されるピッチゲインは０と１．２の間の範囲に限定される。

第１の非限定的実施例では、フレームの４つのサブフレームのうち１番目のサブフレームの符号化を行う間に、一次ピッチゲインｇ_ｉが、式（１０）を用いて、同じフレームの最初の２つのサブフレームに基づいて、つまり２Ｎの長さ（サブフレーム２つ）によって計算される。

次いで、目標信号ｘ（ｎ）とフィルタリングピッチコードブック信号ｙ（ｎ）の計算が、やはり２つのサブフレーム、例えばフレームの１番目と２番目のサブフレームの期間に亘って行われる。サブフレーム１つより長い期間に亘る目標信号ｘ（ｎ）の計算は、重み付けされた通話信号ｓ _ｗ（ｎ）と零入力応答ｓ _０の計算期間を延長するが、最初の２つのサブフレームの最初のサブフレームにおけるＬＰフィルタを、延長された全ての期間に対して使用することにより、行われる。目標信号ｘ（ｎ）は、重み付けされた合成フィルタ

の零入力応答ｓ_０を差し引いた、重み付けされた通話信号ｓ_ｗ（ｎ）として計算される。

同様に、重み付けされたピッチコードブック信号ｙ（ｎ）の計算は、ピッチコードブックベクトルｖ（ｎ）と、第１のサブフレームの重み付けされた合成フィルタ

のインパルス応答ｈ（ｎ）の計算を、サブフレームの長さより長い期間に延長することにより行われる。重み付けされたピッチコードブック信号は、ピッチコードブックベクトルｖ（ｎ）とインパルス応答ｈ（ｎ）との畳み込みであり、この場合の畳み込みは長い期間に亘って計算される。

２つのサブフレームに亘って一次ピッチゲインｇ_ｉを計算した後は、最初の２つのサブフレームのＨＲ（ハーフレート）符号化中において、ピッチゲインｇ_ｐとイノベーションゲインｇ_ｃのベクトル量子化は、フルレート（ＦＲ）におけるゲイン量子化に使用されるコードブックの一部に限定される。ただしその部分は、２つのサブフレームに亘って計算された一次ピッチゲイン値によって決定される。第１の非限定的実施例において、ＦＲ（フルレート）符号化タイプでは、以前に説明した量子化手順に従い、７ビットを使用して、ゲインｇ_ｐとｇ_ｃがまとめて量子化される。ＭＡ予測を対数領域におけるイノベーション励起エネルギーに適用して、予測イノベーションコードブックゲインを得、相関ファクタγが量子化される。ＦＲ（フルレート）符号化タイプにおいて使用される量子化テーブルの内容は表３に示される（ＡＭＲ−ＷＢ「適応型マルチレート広帯域（ＡＭＲ−ＷＢ）を使用する約16kbit/sの通話の広帯域符号化（Wideband coding of speech at around 16kbit/s using Adaptive Multi-Rate Wideband（AMR-WB））、ITU-T勧告G.722.2，ジュネーブ、2002年」および「ＡＭＲ広帯域通話コーデック；符号変換機能（AMR Wideband Speech Codec; Transcoding Functions）、3GPP TS 26.190、3GPP技術仕様書」において使用されるように）。第１の非限定的実施例では、表３（量子化テーブルあるいはコードブック）の検索を、２つのサブフレームに亘って計算された一次ピッチゲイン値ｇ_ｉに従って、この量子化テーブルの第１あるいは第２の半分のいずれかに限定して、２つのサブフレームのゲインｇ_ｐとｇ_ｃの量子化が行われる。もし一次ピッチゲイン値ｇ_ｉが０．７６８６０６より小さければ、最初の２つのサブフレームの量子化は、表３（量子化テーブルあるいはコードブック）の最初の半分に限定される。そうでなければ、量子化は、表３の第２の半分に限定される。０．７６８６０６のピッチ値は、量子化テーブルの第２の半分の始め（表３の第５列の始め）の量子化ピッチゲイン値ｇ_ｐに対応する。量子化に使用される量子化テーブルあるいはコードブックの部分を示すために、２つのサブフレーム毎に１ビットが必要とされる。

３番目及び４番目のサブフレームに対して、類似のゲイン量子化手順が行われることに注意すべきである。即ち、一次ゲインｇ_ｉが３番目と４番目のサブフレームに対して計算され、次の量子化手順において使用されるゲイン量子化表３（ゲイン量子化コードブック）の部分は、この一次ピッチゲイン値ｇ_ｉをベースに決定される。最後に、２つのゲインｇ_ｐとｇ_ｃのベクトル量子化は、決定されたコードブック部分に限定され、使用される部分を指示するべく１ビットが送信される。各コードブック部分がゲイン量子化コードブックの半分に対応するとき、テーブルあるいはコードブック部分の指示に１ビットが必要とされる。

図３および図４は本発明による方法と装置の上述の第１の実施例をまとめた概要フローチャートおよびブロック図である。

図３のステップ３０１は、２つのサブフレームに亘る一次ピッチゲインｇ_ｉを計算するステップからなる。ステップ３０１は図４に示すように計算器４０１により実行される。

ステップ３０２は、例えば７ビットベクトルゲイン量子化コードブックにおいて一次ピッチゲインｇ_ｉに最も近いピッチゲインに関連する一次インデックスを見つけるステップからなる。ステップ３０２は検索ユニット４０２により実行される。

ステップ３０３は、ステップ３０２において決定された一次インデックスを含む量子化コードブックの部分（例えば半分）を選択するステップからなり、２つのフレーム当たりに少なくとも１ビットを使用して、選択されたコードブック部分（例えば半分）を特定する。ステップ３０３は選択器４０３および特定器４０４により実行される。

ステップ３０４は、２つのフレームついての、テーブルあるいはコードブック検索を、選択されたコードブック部分（例えば半分）に限定するステップ、および、選択されたインデックスを、例えばサブフレーム当たり６ビットにより表現するステップからなる。ステップ３０４は検索器４０５および量子化器４０６により実行される。

上述の第１の実施例では、ＦＲ（フルレート）符号化においては、サブフレーム当たり７ビットを使用して、ゲインｇ_ｐおよびｇ_ｃを量子化し、フレーム当たり２８ビットとなる。ＨＲ（ハーフレート）音声および汎用符号化では、ＦＲ（フルレート）符号化と同じ量子化コードブックが使用される。しかしながら、サブフレーム当たり６ビットのみが使用され、半分のケースでは２つサブフレーム毎に量子化におけるコードブック部分を指示するために、フレーム全体に対して特別の２ビットが必要である。メモリ増加を伴うことなく、これによりサブフレーム当たりに合計２６ビットが与えられ、実験において見出されたように新しい６ビットコードブックを設計することと比較して、品質が改善される。事実、元の７ビット量子化器を使用して得られる結果に等しいか、あるいはよりよい結果（例えば、部分的な信号対雑音比（Ｓｅｇ−ＳＮＲ）、平均ビットレート、...）が得られることが実験により示された。このよりよい性能はフレーム内のゲイン変動の減少によると思われる。表４は第１の実施例による種々の符号化モードのビット配列を示す。

ビット数のさらなる節約の達成するために、第１の実施例の別の変形が容易に導出されうる。例えば、一次ピッチゲインを全フレームに亘って計算することが出来、２つのゲインｇ_ｐとｇ_ｃの量子化に使用されるコードブックの部分（例えばコードブックの半分）は一次ピッチゲイン値ｇ_ｉに基づき全てのサブフレームに対して決定される。この場合、フレーム当たり１ビットのみがコードブック部分（例えばコードブックの半分）の指示に必要であり、合計で２５ビットとなる。

別の実施例では、ピッチゲインに基づいて分類されるゲイン量子化コードブックは４つの部分に分割され、一次ピッチゲイン値ｇ_ｉを使用して、量子化処理に使用されるコードブック部分を決定する。表３で与えられる７ビットコードブックの実施例に対して、以下のピッチゲイン範囲に対応して、コードブックは、それぞれ３２個のエントリからなる次の４つの部分に分割される：

０．４４５８４２より小さい部分
０．４４５８２から０．７６８６０６より小さい部分
０．７６８６０６から０．９６２６２５より小さい部分
０．９６２６２５以上

サブフレーム毎に各部分における量子化インデックスを送信するのに、僅か５ビットが必要であるに過ぎず、次いで使用されているコードブックの部分を指示するのに、２サブフレーム毎に２ビットが必要である。これにより合計２４ビットとなる。各フレーム当たり僅か２ビットのオーバーヘッドを必要とするに過ぎず、全ての４つのサブフレームに対して同じコードブック部分を使用することができるので、合計で２２ビットとなる。

また第１の実施例によるデコーダ（図示せず）は、例えば量子化ゲインベクトルを格納するために使用される７ビットコードブックを含む。２つのサブフレーム毎に、デコーダは１ビット（コードブック半分の場合）を受信し、ゲインｇ_ｐとｇ_ｃの符号化に使用されたコードブック部分を特定し、サブフレーム毎に６ビットを受信し、そのコードブック部分から量子化されたゲインを抽出する。

一次ピッチゲインｇ_ｉの計算が異なることを除いて、第２の実施例はここで上に図３及び図４に関して説明した第１の実施例に類似である。式（１１）の計算を単純にするために、重み付けされた音の信号ｓ_ｗ（ｎ）、あるいは低域フィルタリングによりサイズを小さくした、重み付けされた音の信号を使用することが出来る。以下の式が得られる。

ここで、Ｔ_ＯＬは開ループピッチラグ、Ｋは一次ピッチゲインｇ_ｉが計算される時間である。上述の如く、時間は２あるいは４つのサブフレーム、あるいは開ループピッチ期間Ｔ_ＯＬの複数倍であり得る。例えば、ＫはＴ_ＯＬの値に従ってＴ_ＯＬ、２Ｔ_ＯＬ、３Ｔ_ＯＬ、などに等しく設定され得る。より大きいピッチサイクル数を短いピッチ期間に使用することが出来る。ＣＥＬＰベースの符号化処理において作成される残差信号などの他の信号を、一般性を失うことなく式（１２）において使用することが出来る。

本発明の第３の非限定的実施例では上述の如く、より長い時間に亘って計算された一次ピッチゲイン値ｇ_ｉに従って検索されたゲイン量子化コードブックの部分を限定する考え方が用いられる。しかしながらこの手法を用いる目的は、ビットスレートを削減することではなく、品質を改善することである。従って、常にインデックスは全コードブックサイズ（表３の実施例によれば７ビット）に対して量子化されるので、サブフレーム当たりのビット数を削減し、使用されるコードブックの部分に関するオーバーヘッド情報を送信する必要はない。これにより、検索に使用されるコードブックの部分に関する限定はなくなる。より長い時間に亘って計算された一次ピッチゲイン値ｇ_ｉに従ってコードブックの一部に検索を限定することにより、量子化ゲイン値の変動が減少し、全体としての品質が改善され、より円滑な波形変化が得られる。

非限定的実施例によれば、表３の量子化コードブックは各サブフレームにおいて使用される。一次ピッチゲインｇ_ｉは式（１２）あるいは式（１１）あるいは他の適した方法におけるように計算されうる。式（１２）が使用されると、Ｋの値の実施例（開ループピッチ期間の複数倍）は以下の通りである。ピッチ値Ｔ_ＯＬ＜５０に対して、Ｋは３Ｔ_ＯＬに設定され、ピッチ値５１＜Ｔ_ＯＬ＜９６に対して、Ｋは２Ｔ_ＯＬに設定され、その他では、ＫはＴ_ＯＬに設定される。

一次ピッチゲインｇ_ｉを計算した後、ベクトル量子化コードブックの検索はＩ_init−ｐからＩ_init＋ｐの範囲に限定され、ここでＩ_initはピッチゲイン値が一次ピッチゲインｇ_ｉに最も近いゲイン量子化コードブックのベクトルインデックスである。ｐの代表値は１５であり、限界はＩ_init−ｐ≧０およびＩ_init＋ｐ＜１２８である。一度ゲイン量子化インデックスが検出されると、通常のゲイン量子化における如く７ビットを使用して、インデックスは符号化される。

勿論、開示された発明に多くの他の変更および変形が可能である。本発明および関連する図の上記の詳細な説明を考慮すれば、そのような他の変更および変形はこの技術に精通した人には明らかになる。また、そのような他の変形が、本発明の精神と範囲から逸脱することなく請求の範囲内において成し遂げられ得ることも明らかである。

図１は本発明に従い通話符号化および復号装置が使用される状況を説明する通話による通信システムの概要ブロック図である。図２は適応型マルチレート広帯域（ＡＭＲ−ＷＢ）エンコーダの機能ブロック図である。図３は本発明による方法の非限定的実施例の概要フローチャートである。図４は本発明による装置の非限定的実施例の概要フローチャートである。