JP4394578B2

JP4394578B2 - 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置

Info

Publication number: JP4394578B2
Application number: JP2004562408A
Authority: JP
Inventors: ミランジェリネク
Original assignee: Nokia Oyj
Current assignee: Nokia Oyj
Priority date: 2002-12-24
Filing date: 2003-12-18
Publication date: 2010-01-06
Anticipated expiration: 2023-12-18
Also published as: RU2005123381A; EP1576585B1; EP1576585A1; AU2003294528A1; KR20050089071A; WO2004059618A1; US20070112564A1; MY141174A; ATE410771T1; CN100576319C; JP2006510947A; KR100712056B1; DE60324025D1; BRPI0317652B1; UA83207C2; CN1739142A; MXPA05006664A; US7502734B2; HK1082587A1; US20050261897A1

Description

本発明は、音声信号の伝送および合成の観点における特に通話信号の、しかし通話信号に制限しない音声信号のディジタル符号化の改良技術に関する。より詳細には、本発明は、可変ビットレート線形予測に基づく符号化における線形予測パラメータのベクトル量子化の方法と装置に関する。

線形予測（ＬＰ）パラメータの通話符号化と量子化
無線システムなどのディジタル音声通信システムは、通話符号化器を使用して、音声の高品質を維持しつつ容量の増大を図る。通話符号化器は、通話信号をディジタルビットストリームに変換し、ディジタルビットストリームを通信チャネルに送信する、あるいは記憶媒体に蓄積する。通話信号はディジタル化される、即ちサンプルされ、サンプル当たり通常１６ビットにより量子化される。通話符号化器は、主体とする通話の良好な品質を維持しつつ、より少ないビット数によりこれらディジタルサンプルを表現する役割を有する。通話デコーダあるいは合成器は、送信あるいは蓄積されたビットストリームを操作し、音声信号に逆変換する。

線形予測解析に基づくディジタル通話符号化法は、低ビットレート通話符号化において極めて良い成果を収めた。特に、符号励起線形予測（ＣＥＬＰ）符号化は、主体とする品質とビットレート間の良好な妥協を得るための既知の最良技術の１つである。この符号化技術は、無線および有線両応用における幾つかの通話符号化標準の基礎をなしている。ＣＥＬＰ符号化では、サンプルされた通話信号は、通常フレームと呼ぶＮサンプルの連続するブロックで処理され、ここでＮは代表的には１０−３０ｍｓに相当する予め定められた数である。フレーム毎に、線形予測（ＬＰ）フィルタＡ（ｚ）を計算し、符号化し、そして送信する。ＬＰフィルタＡ（ｚ）の計算には、先を見ることが典型的に必要であり、これは後続フレームの５−１５ｍｓの通話セグメントからなる。Ｎサンプルのフレームはサブフレームと呼ぶより小さいブロックに分割される。通常、サブフレームの数は３あるいは４で、４−１０ｍｓのサブフレームとなる。各サブフレームで励起信号は、過去の励起と新規固定符号帳励起の２つの要素から通常得られる。過去の励起から構成される要素は、屡々適応符号帳あるいはピッチ励起と呼ばれる。励起信号を特徴づけるパラメータは符号化され、デコーダに送信され、デコーダでは再構成された励起信号をＬＰ合成フィルタの入力として使用する。

ＬＰ合成フィルタは次式で与えられる。

上式で、ａ_ｉは線形予測係数であり、ＭはＬＰ解析の次数である。ＬＰ合成フィルタは、通話信号のスペクトラム包絡線をモデル化する。デコーダでは、通話信号はデコードした励起をＬＰ合成フィルタにより濾過して再構成される。

線形予測係数ａ_ｉの組は、次式に示す予測誤差が最小になるように計算される。

Ｍサンプルに基づく予測信号である。

従って、予測誤差は、次式で与えられる。

これは、ｚ変換領域では次式に対応する。

上式で、Ａ（ｚ）は、次式で与えられる次数ＭのＬＰフィルタである。

代表的には、線形予測係数ａ_ｉはＬサンプルのブロックに対する平均２乗予測誤差を最小にすることにより計算され、Ｌ（Ｌは通常２０−３０ｍｓに対応する）は通常Ｎに等しいか、Ｎより大きい整数である。線形予測係数の計算は、その他の点ではこの技術の通常の知識を有する人に既知である。このような計算例は、ＩＴＵ−Ｔ勧告Ｇ．７２２．２「適応型マルチレート広帯域（ＡＭＲ−ＷＢ）を使用する大凡１６ｋｂｉｔ／ｓにおける通話の広帯域符号化（Ｗｉｄｅｂａｎｄｃｏｄｉｎｇｏｆｓｐｅｅｃｈａｔａｒｏｕｎｄ１６ｋｂｉｔ／ｓｕｓｉｎｇａｄａｐｔｉｖｅｍｕｌｔｉ−ｒａｔｅｗｉｄｅｂａｎｄ（ＡＭＲ−ＷＢ））」、２００２年、ジュネーブに与えられている。

線形予測係数ａ_ｉをデコーダへの送信のために直接量子化することは出来ない。その理由は、線形予測係数に関する小さな量子化誤差がＬＰフィルタの変換関数の大きなスペクトラム誤差を生じる可能性があり、フィルタの不安定化さえも誘起する可能性がある、ということである。従って量子化に先だって、線形予測係数ａ_ｉに変換を適用する。変換によって、線形予測係数ａ_ｉの所謂表現を生成する。量子化し、変換された線形予測係数ａ_ｉを受信後、デコーダは、次いで逆変換を適用して、量子化線形予測係数を得る。線形予測係数ａ_ｉに広く使用される１つの表現は、線スペクトルの組（ＬＳＰ）としても既知の線スペクトル周波数（ＬＳＦ）である。線スペクトル周波数の計算の詳細は、ＩＴＵ−Ｔ勧告Ｇ．７２９「共役構造代数符号励起線形予測（ＣＳ−ＡＣＥＬＰ）を使用する８ｋｂｉｔ／ｓにおける通話符号化（Ｃｏｄｉｎｇｏｆｓｐｅｅｃｈａｔ８ｋｂｉｔ／ｓｕｓｉｎｇｃｏｎｊｕｇａｔｅ−ｓｔｒｕｃｔｕｒｅａｌｇｅｂｒａｉｃ−ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ））」、１９９６年３月、ジュネーブに見ることが出来る。

類似の表現は、イミタンススペクトル周波数（ＩＳＦ）であり、これはＡＭＲ−ＷＢ符号化標準において使用されている（ＩＴＵ−Ｔ勧告Ｇ．７２２．２「適応型マルチレート広帯域（ＡＭＲ−ＷＢ）を使用する大凡１６ｋｂｉｔ／ｓにおける通話の広帯域符号化」（Ｗｉｄｅｂａｎｄｃｏｄｉｎｇｏｆｓｐｅｅｃｈａｔａｒｏｕｎｄ１６ｋｂｉｔ／ｓｕｓｉｎｇＡｄａｐｔｉｖｅＭｕｌｔｉ−ＲａｔｅＷｉｄｅｂａｎｄ（ＡＭＲ−ＷＢ）、２００２年、ジュネーブ）。他の表現も可能であり、使用されている。一般性を失うことなく、ＩＳＦ表現の特種ケースを以下の説明において考慮する。

そのようにして得られるＬＰパラメータ（ＬＳＦｓ、ＩＳＦｓなど）はスカラー量子化（ＳＱ）あるいはベクトル量子化（ＶＱ）のいずれかにより量子化される。スカラー量子化では、ＬＰパラメータは、個々に量子化され、通常パラメータ当たり３または４ビットが必要である。ベクトル量子化では、ＬＰパラメータはベクトルにグループ化され、実体として量子化される。量子化ベクトルの組を含むコード帳あるいはテーブルが蓄積される。量子化器は、一定の距離の測定により入力ベクトルに最も近いコード帳入力に対するコード帳を探索する。選択した量子化ベクトルの指標はデコーダに送信される。ベクトル量子化は、スカラー量子化より優れた性能を示すが、複雑さの増大とメモリ要求の犠牲を伴う。

構造化ベクトル量子化は、通常ＶＱの複雑さとメモリ要求の削減に使用される。分離ＶＱでは、ＬＰパラメータベクトルは、少なくとも２つのサブベクトルに分離され、サブベクトルは個々に量子化される。多段ＶＱでは、量子化ベクトルは幾つかのコード帳入力の和である。分離ＶＱおよび多段ＶＱは共に、良好な量子化性能を維持しつつ、結果としてメモリと複雑さを削減する。さらに、興味あるアプローチは、多段および分離ＶＱを組み合わせて、さらに複雑さとメモリ要求を削減することである。参照文献、ＩＴＵ−Ｔ勧告Ｇ．７２９「共役構造代数符号励起線形予測（ＣＳ−ＡＣＥＬＰ）を使用する８ｋｂｉｔ／ｓにおける通話符号化（Ｃｏｄｉｎｇｏｆｓｐｅｅｃｈａｔ８ｋｂｉｔ／ｓｕｓｉｎｇｃｏｎｊｕｇａｔｅ−ｓｔｒｕｃｔｕｒｅａｌｇｅｂｒａｉｃ−ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ））」、１９９６年３月、ジュネーブでは、ＬＰパラメータベクトルは２段で量子化され、第２段ベクトルは、２つのサブベクトルに分離される。

ＬＰパラメータは、後続するフレーム間に強い相関を示し、これは通常予測量子化の使用により性能の改善に利用される。予測ベクトル量子化では、予測ＬＰパラメータベクトルは、過去のフレームの情報に基づいて計算される。次いで予測ベクトルは入力ベクトルから除去され、予測誤差はベクトル量子化される。２種の予測が通常使用される：自動回帰（ＡＲ）予測と移動平均（ＭＡ）予測である。ＡＲ予測では、予測ベクトルは過去のフレームの量子化ベクトルの組み合わせとして計算される。ＭＡ予測では、予測ベクトルは過去のフレームの予測誤差ベクトルの組み合わせとして計算される。ＡＲ予測はよりよい性能を呈する。しかしながら、ＡＲ予測は、無線およびパケットベースの通信システムにおいて遭遇するフレーム損失の状態に強くない。フレーム損失の場合、予測は以前の不正フレームに基づくので、誤差は後続するフレームに伝搬する。

可変ビットレート（ＶＢＲ）符号化
幾つかの通信システム、例えば符号分割多重アクセス（ＣＤＭＡ）技術を使用する無線システムでは、ソース制御可変ビットレート（ＶＢＲ）通話符号化の使用によりシステム容量を大きく改善する。ソース制御ＶＢＲ符号化では、符号化器は幾つかのビットレートで動作することが出来、レート選択モジュールを使用して、例えば音声、非音声、非定常、背景雑音などの通話フレームの性格に基づいた各通話フレームの符号化に使用するビットレーを決定する。目標は平均データレート（ＡＤＲ）とも呼ばれる、所与の平均ビットレートにおいて最良の通話品質を達成することにある。符号化器はまた、レート選択モジュールを調節することにより異なる動作モードに従って動作することが出来、異なるモードに対して異なるＡＤＲｓを達成する、この場合符号化器の性能は、ＡＤＲの増加と共に改善される。これは、符号化器に通話品質とシステム容量との間のトレードオフの機構を付与する。ＣＤＭＡシステム、例えばＣＤＭＡ−１およびＣＤＭＡ２０００では、代表的に４ビットレートが使用され、フルレート（ＦＲ）、半レート（ＨＲ）、４分の１レート（ＱＲ）、８分の１レート（ＥＲ）と呼ばれる。このＣＤＭＡシステムでは、２組のレートがサポートされ、レートセットＩ、レートセットＩＩと呼ばれる。レートセットＩＩでは、レート選択機構を持つ可変レート符号化器は、１４．４、７．２、３．６および１．８ｋｂｉｔ／ｓ（誤り検出のために追加した幾らかのビットを含む）の実ビットレートに対応して１３．３（ＦＲ）、６．２（ＨＲ）、２．７（ＱＲ）および１．０（ＥＲ）８ｋｂｉｔ／ｓのソース符号化ビットレートで動作する。

適応型マルチレート広帯域（ＡＭＲ−ＷＢ）通話コーデックとして既知の広帯域コーデックは、幾つかの広帯域電話通話およびサービスのためにＩＴＵ−Ｔ（国際通信連合−通信標準化部門（ＩｎｔｅｒｎａｔｉｏｎａｌＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓＵｎｉｏｎ−ＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｔａｎｄａｒｄｉｚａｔｉｏｎＳｅｃｔｏｒ））により、そしてＧＳＭおよびＷ−ＣＤＭＡ（広帯域符号分割多重アクセス）第３世代無線システムのために３ＧＰＰ（第３世代合同計画）により、最近採択された。ＡＭＲ−ＷＢコーデックは６．６から２３．８５８ｋｂｉｔ／ｓの範囲の９ビットレートからなる。ＣＤＭＡ２０００システムのためのＡＭＲ−ＷＢベースのソース制御ＶＢＲコーデックの設計には、ＣＤＭＡ２０００とＡＭＲ−ＷＢコーデックを使用する他のシステム間の相互運用を可能にする利点がある。１２．６５ｋｂｉｔ／ｓのＡＭＲ−ＷＢビットレートは、ＣＤＭＡ２０００のレートセットＩＩの１３．３ｋｂｉｔ／ｓフルレートに適合することの出来る最も近いレートである。１２．６５ｋｂｉｔ／ｓのレートは、ＣＤＭＡ２０００広帯域ＶＢＲコーデックとＡＭＲ−ＷＢコーデック間の共通レートとして使用して、通話品質を劣化させる符号変換を行わない相互運用性を可能にすることが出来る。レートセットＩＩの枠組みにおける効率的運用を可能にするためには、６．２ｋｂｉｔ／ｓの半レートを追加する必要がある。得られるコーデックは、少数のＣＤＭＡ２０００に特有のモードで動作することが出来、ＡＭＲ−ＷＢコーデックを使用するシステムとの相互運用性を可能にするモードを組み込む。

半レート符号化は、入力通話信号が安定なフレームにおいて代表的に選ばれる。符号化パラメータの更新頻度を少なくする、あるいはこれら符号化パラメータの幾つかの符号化に使用するビットを少なくすることにより、フルレートと比較したビットの節減が達成される。より詳細には、安定な音声セグメントにおいては、ピッチ情報はフレーム毎に１度だけ符号化され、より少ないビットを使用して固定符号帳パラメータおよび線形予測計数を表現する。

ＭＡ予測による予測ＶＱは、線形予測計数の符号化に代表的に適用されるので、量子化雑音の不要な増加がこれら線形予測計数に観測することが出来る。ＡＲ予測に反して、ＭＡ予測は、フレーム損失に対する強固さを増すために使用される；しかしながら、安定なフレームでは、線形予測係数はゆっくりと変化するので、この特種なケースにＡＲ予測を使用すれば、フレームが失われる場合の誤差の伝搬への影響はより少なくなる。これは、フレームが失われる場合、大部分のデコーダが、最後のフレームの線形予測係数を本質的に外挿する隠蔽処理を適用することを見れば理解できる。もし失われるフレームが安定な音声であれば、この外挿により実際に送信したが、受信されなかったＬＰパラメータに極めて似た価値を生じる。再構成ＬＰパラメータベクトルは、従ってフレームが失われなかった場合にデコードされるものに近い。この特種な場合には、それ故線形予測係数の量子化過程にＡＲ予測を使用しても量子化誤差の伝搬に極めて不利な影響があることはあり得ない。

ＩＴＵ−Ｔ勧告Ｇ．７２２．２「適応型マルチレート広帯域（ＡＭＲ−ＷＢ）を使用する大凡１６ｋｂｉｔ／ｓにおける通話の広帯域符号化」（Ｗｉｄｅｂａｎｄｃｏｄｉｎｇｏｆｓｐｅｅｃｈａｔａｒｏｕｎｄ１６ｋｂｉｔ／ｓｕｓｉｎｇａｄａｐｔｉｖｅｍｕｌｔｉ−ｒａｔｅｗｉｄｅｂａｎｄ（ＡＭＲ−ＷＢ）、２００２年、ジュネーブＩＴＵ−Ｔ勧告Ｇ．７２９「共役構造代数符号励起線形予測（ＣＳ−ＡＣＥＬＰ）を使用する８ｋｂｉｔ／ｓにおける通話符号化（Ｃｏｄｉｎｇｏｆｓｐｅｅｃｈａｔ８ｋｂｉｔ／ｓｕｓｉｎｇｃｏｎｊｕｇａｔｅ−ｓｔｒｕｃｔｕｒｅａｌｇｅｂｒａｉｃ−ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ））」、１９９６年３月、ジュネーブ

本発明によれば、可変ビットレートの音声信号の符号化における線形予測パラメータの量子化方法が提供され、本方法は入力線形予測パラメータベクトルする受信する工程、前記入力線形予測パラメータベクトルに対応する音声信号フレームを分類する工程、予測ベクトルを計算する工程、前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する工程、前記予測誤差ベクトルをスケーリングする工程、および前記スケーリングした予測誤差ベクトルを量子化する工程を含む。予測ベクトルを計算する工程は、前記音声信号フレームの分類に関連する複数の予測方式の１つを選択する工程、および前記選択した予測方式に従って前記予測ベクトルを計算する工程を含む。前記予測誤差ベクトルをスケーリングする工程は、前記選択した予測方式に関連する複数のスケーリング方式の少なくとも１つを選択する工程、および前記選択したスケーリング方式に従って前記予測誤差ベクトルをスケーリングする工程を含む。

また本発明によれば、可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置が提供され、本装置は、入力線形予測パラメータベクトルを受信する手段、前記入力線形予測パラメータベクトルに対応する音声信号フレームを分類する手段、予測ベクトルを計算する手段、前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する手段、前記予測誤差ベクトルをスケーリングする手段、および前記スケーリングした予測誤差ベクトルを量子化する手段を含む。予測ベクトルを計算する手段は、前記音声信号フレームの前記分類に関連する複数の予測方式の１つを選択する手段、および前記選択した予測方式に従って前記予測ベクトルを計算する手段を含む。また、前記予測誤差ベクトルをスケーリングする手段は、前記選択した予測方式に関連する複数のスケーリング方式の少なくとも１つを選択する手段、および前記選択したスケーリング方式に従って前記予測誤差ベクトルをスケーリングする手段を含む。

本発明はまた、可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置に関連し、本装置は、入力線形予測パラメータベクトルを受信する入力、前記入力線形予測パラメータベクトルに対応する音声信号フレームの分類器、予測ベクトル計算機、前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する減算器、前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルのスケーリングを行うスケーリングユニット、および前記スケーリングした予測誤差ベクトルの量子化器を含む。前記予測ベクトル計算機は、前記音声信号フレームの前記分類に関連する複数の予測方式の１つを選択する選択器を含み、前記選択した予測方式に従う前記予測ベクトルの計算を行う。前記スケーリングユニットは、前記選択した予測方式に関連する複数のスケーリング方式の少なくとも１つを選択する選択器を含み、前記選択したスケーリング方式に従う予測誤差ベクトルのスケーリングを行う。

本発明はさらに、可変ビットレートの音声信号の符号化解除における線形予測パラメータの量子化解除方法に関連し、本方法は、少なくとも１つの量子化指標を受信する工程、前記少なくとも１つの量子化指標に対応する音声信号フレームの分類に関する情報を受信する工程、少なくとも１つの量子化テーブルに少なくとも１つの指標を適用することによって予測誤差ベクトルを回復する工程、予測ベクトルを再構成する工程、および前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する工程を含む。予測ベクトル再構成は、前記フレーム分類情報に応じ、複数の予測方式の１つによって前記回復した予測誤差ベクトルを処理する工程を含む。

本発明はなおさらに、可変ビットレートの音声信号の符号化解除における線形予測パラメータの量子化解除装置に関連し、本装置は、少なくとも１つの量子化指標を受信する手段、前記少なくとも１つの量子化指標に対応する音声信号フレームの分類に関する情報を受信する手段、少なくとも１つの量子化テーブルに少なくとも１つの指標の適用することによって予測誤差ベクトルを回復する手段、予測ベクトルを再構成する手段、および前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する手段を含む。予測ベクトルを再構成する手段は、前記フレーム分類情報に応じ、複数の予測方式の１つによって前記回復した予測誤差ベクトルを処理する手段を含む。

本発明の最後の態様によれば、可変ビットレートの音声信号の符号化解除における線形予測パラメータの量子化解除装置が提供され、本装置は、少なくとも１つの量子化指標を受信する手段、前記少なくとも１つの量子化指標に対応する音声信号フレームの分類に関する情報を受信する手段、前記少なくとも１つの量子化指標の供給を受け、予測誤差ベクトルを回復する少なくとも１つの量子化テーブル、予測ベクトルを再構成するユニット、および前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルの生成器を含む。前記予測ベクトルを再構成するユニットは、回復予測誤差ベクトルの供給を受けて、前記フレーム分類情報に応じ、複数の予測方式の１つによって前記回復した予測誤差ベクトルを処理する少なくとも１つの予測器を含む。

本発明の前記および他の目的、利点および特徴は、添付する図面を参照することのみにより、実施例により与えられる本発明を例証する実施形態の以下の非限定的説明を読めば、一層明らかになる。

実施例の詳細な説明

通話信号への適用に関連して以下に本発明を例証する実施形態を説明するが、本発明はまた、他のタイプの音声信号へも適用可能であることを記憶に留めておくべきである。

大部分の最近の通話符号化技術は、ＣＥＬＰ符号化などの線形予測解析に基づいている。ＬＰパラメータを計算し、１０−３０ｍｓのフレームに量子化する。本例証的実施形態では、２０ｍｓのフレームを使用し、１６のＬＰ解析次数を想定する。通話符号化システムにおけるＬＰパラメータの計算例は、非特許文献１に見られる。この説明例では、事前処理された通話信号に窓を設け、窓を開けた通話の自動相関を計算する。次いで、レビンソンーダービン（Ｌｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ）循環を使用して、自動相関Ｒ（ｋ）、ｋ＝０、．．．、Ｍ、Ｍは予測次数から線形予測係数ａ_ｉ、ｉ＝１、．．．、Ｍを計算する。

線形予測係数ａ_ｉはデコーダへの送信のために直接量子化することは出来ない。その理由は、線形予測係数に関する小さな量子化誤差がＬＰフィルタの変換関数の大きなスペクトラム誤差を生じる可能性があり、フィルタの不安定化さえも誘起する可能性がある、ということである。従って量子化に先だって、線形予測係数ａ_ｉに変換を適用する。変換によって、線形予測係数の所謂表現を生成する。量子化し、変換された線形予測係数を受信後、デコーダは、次いで逆変換を適用して、量子化線形予測係数を得る。線形予測係数ａ_ｉに広く使用される１つの表現は、線スペクトルの組（ＬＳＰ）としても既知の線スペクトル周波数（ＬＳＦ）である。ＬＳＦｓの計算の詳細は、非特許文献２に見ることが出来る。ＬＳＦｓは以下の多項式の極からなる：

および

て、多項式を以下のように書くことが出来る：

および

上式で、ｑ_ｉ＝ｃｏｓ（ｗ_ｉ）であり、ｗ_ｉは順序特性０＜ｗ_１＜ｗ_２＜．．．＜ｗ_ｍ＜πを満たす線スペクトル周波数（ＬＳＦ）である。この特別な例では、ＬＳＦｓはＬＰ（線形予測）パラメータを構成する。

類似の表現は、イミタンススペクトルの組（ＩＳＰ）あるいはイミタンススペクトル周波数（ＩＳＦ）であり、これはＡＭＲ−ＷＢ符号化標準において使用されている。ＩＳＦｓの計算の詳細は、非特許文献１に見ることが出来る。他の表現も可能であり、使用されている。一般性を失うことなく、以下の説明で、非制限、例証的実施例としてＩＳＦ表現のケースを考慮する。

Ｍが偶数である、Ｍ次順位ＬＰフィルタに対して、ＩＳＰｓを以下の多項式の根として定義する：

および

共役根をそれぞれ有する。従って、多項式を以下のように書くことが出来る：

および

上式で、ｑ_ｉ＝ｃｏｓ（ｗ_ｉ）であり、ｗ_ｉはイミタンススペクトル周波数（ＩＳＦ）であり、ａ_Ｍ最後の線形予測係数である。ＩＳＦｓは順序特性０＜ｗ_１＜ｗ_２＜．．．＜ｗ_Ｍ−１＜πを満たす。この特別な例では、ＬＳＦｓはＬＰ（線形予測）パラメータを構成する。従ってＩＳＦｓは、最後の線形予測係数に加えて、Ｍ−１の周波数からなる。本例証的実施形態においては、ＩＳＦｓは、０からｆ_ｓ／２の範囲の周波数にマップされるが、ここでｆ_ｓは以下の関係を利用するサンプル周波数である：

および

ＬＳＦｓおよびＩＳＦｓ（ＬＰパラメータ）は、量子化目的に適合させる幾つかの特性の故に広く使用されている。これらの特性の中では、動作範囲が良く定義されており、そのスムースな変化によりフレーム間およびフレーム内の強い相関が得られ、順序特性の存在により量子化ＬＰフィルタの安定性が保証される。

本明細書では、用語「ＬＰパラメータ」をＬＰ係数、例えばＬＳＦ、ＩＳＦ、平均除去ＬＳＦあるいは平均除去ＩＳＦの表現を意味するのに使用する。

次に、ＩＳＦｓ（ＬＰ（線形予測）パラメータ）の主要な特性を説明し、使用する量子化手法を理解するようにする。図７に、ＩＳＦ係数の確率分布関数（ＰＤＦ）の代表例を示す。各曲線は個々のＩＳＦ係数のＰＤＦを表す。各分布の平均値を水平軸に示す（μ_ｋ）。例えば、ＩＳＦ_１の曲線は、フレームの第１のＩＳＦ係数が取りうる全ての値をその生起確率により示す。ＩＳＦ_２の曲線は、フレームの第２のＩＳＦ係数が取りうる全ての値をその生起確率により示す、などである。ＰＤＦ関数は、幾つかの連続フレームを通じた観測において所与の係数が取る値にヒストグラムを適用することにより代表的に得られる。それぞれのＩＳＦ係数が全ての可能なＩＳＦの値に対して制限された値の幅を占めることが見て取れる。これにより量子化器がカバーすべき空間が効率的に削減され、ビットレートの効率を高める。ＩＳＦ係数のＰＤＦｓが重なりうる一方、所与のフレームのＩＳＦ係数は常に順序づけられていることに注目することが重要である（ＩＳＦ_ｋ＋１−ＩＳＦ_ｋ＞０、ｋはＩＳＦ係数のベクトル内におけるＩＳＦ係数の位置である）。

通話符号化器において代表的な１０−３０ｍｓのフレーム長により、ＩＳＦ係数はフレーム間相関を示す。図８に、通話信号のフレームに亘るＩＳＦ係数の変化を示す。図８は、音声および非音声両フレームを含む通話セグメントの２０ｍｓの連続３０フレームに亘るＬＰ解析を実行することにより得られた。ＬＰ係数（フレーム当たり１６）をＩＳＦ係数に変換した。図８は、ＩＳＦｓが常に順序づけられていることを意味する、線が互いに決して交わらないことを示す。図８はまた、フレームレートに比較して、ＩＳＦ係数が典型的にゆっくりと変化することを示す。これは実際に、予測量子化を適用して量子化誤差を削減することが出来ることを意味する。

図３は、自動回帰（ＡＲ）予測を使用する予測ベクトル量子化器３００の実施例を示す。図３に示すように、予測誤差ベクトルｅ_ｎは、量子化すべき入力ＬＰパラメータベクトルｘ_ｎから予測ベクトルｐ_ｎを減算する（プロセッサ３０１）ことによりまず得られる。ここで、記号ｎは、フレームの時間指標を意味する。予測ベクトルｐ_ｎは、過去に量子化さ

により計算される。次に、予測誤差ベクトルｅ_ｎが量子化され（プロセッサ３０３）、例

を加算する（プロセッサ３０４）ことにより得られる。予測器Ｐ（プロセッサ３０２）の一般形は以下の通りである：

上式で、Ａ_ｋは次元ＭｘＭの予測マトリックスで、Ｋは予測器の次数である。予測器Ｐ（プロセッサ３０２）の単純形は、第１次予測を使用することである：

上式で、Ａは次元ＭｘＭの予測マトリックスで、ＭはＬＰパラメータベクトルｘ_ｎの次元である。予測マトリックスＡの単純形は、対角線要素α_１、α_２、．．．、α_Ｍを持つ対角線マトリックスであり、α_１は個々のＬＰパラメータの予測ファクタである。もし全てのＬＰパラメータに同じファクタαが使用されれば、その場合式（２）は以下になる：

次に、図３において式（３）の単純な予測形式を使用して、量子化ＬＰパラメータベクト

式（４）の循環形式は、図３に示すような形のＡＲ予測量子化器３００を使用する場合、チャネル誤りは、幾つかのフレームに亘って伝搬することを意味する。もし式（４）を以下の数学的に等価な形に書けば、これをさらに容易に理解することが出来る：

では同じではない。予測器Ｐの循環性の故に、この符号化器−デコーダの不一致は先々伝

を与える。それ故、特に予測ファクタが大きい（式（４）および（５）にいてαが１に近い）場合、予測ベクトル量子化はチャネル誤りに対して強くない。

この伝搬問題を軽減するために、ＡＲ予測の代わりに移動平均（ＭＡ）予測を使用することが出来る。ＭＡ予測では、式（５）の無限級数の端を切って、有限数の項とする。この考え方では、式（５）において少数の項を使用することにより式（４）における予測器Ｐの自動回帰形式に近似させる。総和の加重値を変更して、式（４）の予測器Ｐにより良く近似できることに注目されたい。

図４に、ＭＡ予測ベクトル量子化器４００の非制限的実施例を示すが、プロセッサ４０１、４０２、４０３および４０４はそれぞれプロセッサ３０１、３０２、３０３および３０４に対応する。予測器Ｐ（プロセッサ４０２）の一般形は以下の通りである：

上式で、Ｂ_Ｋは次元ＭｘＭの予測マトリックスであり、Ｋは予測器の次数である。ＭＡ予測では、伝送誤りは次のＫフレームにのみ伝搬することに注目すべきである。

予測器Ｐ（プロセッサ４０２）の単純形は、第１次予測を使用することである：

上式で、Ｂは次元ＭｘＭの予測マトリックスであり、ＭはＬＰパラメータベクトルの次元である。予測マトリックスの単純形は、対角線要素β_１、β_２、．．．、β_Ｍを持つ対角線マトリックスであり、β_１は個々のＬＰパラメータの予測ファクタである。もし全てのＬＰパラメータに同じファクタβが使用されれば、その場合式（６）は以下になる：

次いで、図４において式（７）の単純な予測形式を使用すると、量子化ＬＰパラメータベ

図４に示すようなＭＡ予測を使用する予測ベクトル量子化器４００を説明する実施例で

測器Ｐ（プロセッサ４０２）の次数である。式（８）を説明する予測器の実施例においては、第１次予測が使用され、その結果ＭＡ予測誤差はただ１フレームにのみ伝搬しうるに過ぎない。

ＡＲ予測より伝送誤りにより強い一方、ＭＡ予測は所与の予測次数に対して同じ予測利得に達しない。予測誤差は、従ってより広い動作範囲を持ち、同じ符号化利得を得るためにＡＲ予測量子化によるより、より多くのビットを必要とする可能性がある。従って、妥協点は、所与のビットレートにおけるチャネル誤りに対する強さ対符号化利得である。

ソース制御可変ビットレート（ＶＢＲ）符号化では、符号化器は幾つかのビットレートで動作し、レート選択モジュールを使用して、通話フレーム、例えば音声、非音声、非定常、背景雑音の性質に基づいて各通話フレームの符号化に使用するビットレートを決定すする。通話フレーム、例えば音声、非音声、非定常、背景雑音などの性質は、ＣＤＭＡＶＢＲの場合と同じように決定することが出来る。目標は平均データレート（ＡＤＲ）とも呼ばれる、所与の平均ビットレートにおいて最良の通話品質を達成することにある。例証的実施例としてＣＤＭＡシステム、例えばＣＤＭＡ−１およびＣＤＭＡ２０００では、代表的に４つのビットレートが使用され、フルレート（ＦＲ）、半レート（ＨＲ）、４分の１レート（ＱＲ）、８分の１レート（ＥＲ）と呼ばれる。このＣＤＭＡシステムでは、２組のレートがサポートされ、レートセットＩ、レートセットＩＩと呼ばれる。レートセットＩＩでは、レート選択機構を持つ可変レート符号化器は、１３．３（ＦＲ）、６．２（ＨＲ）、２．７（ＱＲ）および１．０（ＥＲ）ｋｂｉｔ／ｓのソース符号化ビットレートで動作する。

ＶＢＲ符号化では、分類およびレート選択機構を使用して、通話フレームをその性質（音声、非音声、非定常、雑音、など）に従って分類し、分類と要求される平均データレート（ＡＤＲ）に従ってフレームの符号化に必要なビットレートを選択する。半レート符号化は、入力通話信号が安定なフレームにおいて代表的に選ばれる。符号化器パラメータの更新頻度を少なくする、あるいはあるパラメータの符号化に使用するビットを少なくすることにより、フルレートと比較したビットの節減が達成される。さらに、これらのフレームは、ビットレートの削減に利用可能な強い相関を示す。より詳細には安定な音声セグメントにおいては、ピッチ情報はフレームにおいて１度だけ符号化され、固定符号帳およびＬＰ計数により少ないビットを使用する。非音声フレームでは、ピッチ予測は必要ではなく、励起はＨＲの小さなコード帳あるいはＱＲのランダム雑音によりモデル化される。

ＭＡ予測によるＶＱ予測は、ＬＰパラメータの符号化に典型的に適用されるので、これにより量子化雑音が不必要に増加することになる。ＡＲ予測に反して、ＭＡ予測は、フレーム損失に対する強固さを増すために使用される；しかしながら、安定なフレームでは、ＬＰパラメータはゆっくりと変化するので、このケースにＡＲ予測を使用すれば、フレームが失われる場合の誤差伝搬への影響はより少なくなる。これは、フレームが失われる場合、大部分のデコーダが、最後のフレームのＬＰパラメータを本質的に外挿する隠蔽処理を適用することを見れば検出される。もし失われるフレームが安定な音声であれば、この外挿により実際に送信したが、受信されなかったＬＰパラメータに極めて似た値を生む。再構成ＬＰパラメータベクトルは、従ってフレームが失われなかった場合にデコードされるものに近い。この特種な場合には、ＬＰ係数の量子化過程にＡＲ予測を使用しても量子化誤差の伝搬に極めて不利な影響があることはあり得ない。

従って、本発明の非制限、例証的実施形態によれば、ＬＰパラメータの予測ＶＱ法（predictive VQ method）が開示され、そこでは、処理する通話フレームの性質に従い、予測器がＭＡおよびＡＲ予測の間で切り替えられる。より詳細には、安定なフレームではＡＲ予測が使用される一方、非定常および非安定なフレームではＭＡ予測が使用される。さらに、ＡＲ予測はＭＡ予測よりより狭いダイナミックレンジを持つ予測誤差ベクトルｅ_ｎをもたらすので、両方のタイプの予測に同じ量子化テーブルを使用するのは効率的ではない。この問題を克服するために、ＡＲ予測の後、予測誤差ベクトルを適切にスケーリングして、ＭＡ予測の場合と同じ量子化テーブルを使用して予測誤差ベクトルが量子化されうるようにする。多段ＶＱを使用して予測誤差ベクトルを量子化する場合、正しいＡＲ予測誤差ベクトルを適切にスケーリングした後、両タイプの予測に第１段を使用することが出来る。第２段では、多くのメモリを要求しない分離ＶＱ（split VQ）を使用すれば十分であるので、この第２段の量子化テーブルは学習させることができ、両タイプの予測に対して個別に設計することが出来る。勿論、第１段の量子化テーブルをＭＡ予測により設計し、ＡＲ予測誤差ベクトルをスケーリングする代わりに、反対もまた有効である、即ち第１段をＡＲ予測のために設計し、量子化に先だってＭＡ予測誤差ベクトルがスケーリングされるようにすることができる。

従って、本発明の非制限且つ例証的実施形態によれば、可変ビットレート通話コーデックにおけるＬＰパラメータの量子化のための予測ベクトル量子化法も開示され、そこでは、処理する通話フレームの性質に関する分類情報に従い、予測器ＰがＭＡおよびＡＲ予測の間で切り替えられ、かつその際予測誤差ベクトルが適切にスケーリングされ、予測誤差の多段ＶＱにおける同じ第１段量子化テーブルが両方のタイプの予測に使用されうる。

図１に、２段ベクトル量子化器１００の非制限的実施例を示す。量子化器Ｑ１（プロセ

プロセッサ１０２）、第２段ＶＱ（プロセッサ１０３）により、さらに誤差ベクトルｘ_２

図２に、分離ベクトル量子化器２００を説明する実施例を示す。次元Ｍの入力ベクトルｘが、次元Ｎ_１、Ｎ_２、．．．、Ｎ_ＫのＫ個のサブベクトルに分離され、ベクトル量子化器Ｑ_１、Ｑ_２、．．．、Ｑ_Ｋによりそれぞれ量子化される（プロセッサ２０１．１、２０１．２．．．２

ベクトル量子化の効率的手法は、多段および分離ＶＱの両方を結合することであり、これにより品質と複雑さの良好なトレードオフが得られる。第１の例証的実施例では、２段

分離され、第２段量子化器Ｑ_２１、Ｑ_２２、．．．、Ｑ_２Ｋによりそれぞれ量子化される。第２の例証的実施例では、入力ベクトルは２つのサブベクトルに分離され、次いで各サブベクトルは、第１の例証的実施例におけるように第２段における分離をさらに使用する２段ＶＱにより量子化される。

図５に、本発明に従い、切り替え型予測ベクトル量子化器５００を説明する非制限的実施例の概要ブロック図を示す。まず、平均ＬＰパラメータμのベクトルが入力ＬＰパラメータベクトルｚから除去され、平均除去ＬＰパラメータベクトルｘを生成する（プロセッサ５０１）。以前の説明で示したように、ＬＰパラメータベクトルは、ＬＳＦパラメータ、ＩＳＦパラメータ、あるいは任意の他の関連するＬＰパラメータ表現のベクトルであり得る。入力ＬＰパラメータベクトルｚから平均ＬＰパラメータμを除去することは任意であるとはいえ、それによって予測性能は改善する。もしプロセッサ５０１を用いることができなければ、平均除去ＬＰパラメータベクトルｘは入力ＬＰパラメータベクトルｚと同じである。図３および図４で使用するフレーム指標ｎは、ここでは単純化の目的のために省略する。次いで、予測ベクトルｐが計算され、平均除去ＬＰパラメータベクトルｘから除去され、予測誤差ベクトルｅを生成する（プロセッサ５０２）。次いで、フレーム分類情報に基づいて、もし入力ＬＰパラメータベクトルｚに対応するフレームが安定な音声であれば、ＡＲ予測が使用され、誤差ベクトルｅはあるファクタによりスケーリングされ（プロセッサ５０３）、スケーリングされた予測誤差ベクトル（スケーリング予測誤差ベクトル）ｅ'を生成する。もしフレームが安定な音声でなければ、ＭＡ予測が使用され、スケーリングファクタ（プロセッサ５０３）は１に等しい。フレーム、例えば音声、非音声、非定常、背景雑音などの分類は、例えばCDMA VBRに対する方法と同じように判定することが出来る。スケーリングファクタは典型的には１より大きく、予測誤差ベクトルのダイナミックレンジを広くスケーリングすることになる。その結果、ＭＡ予測に対して設計された量子化器により予測誤差ベクトルが量子化されうる。スケーリングファクタの値は、ＭＡおよびＡＲ予測に使用する係数に依存する。非制限的な代表値は：ＭＡ予測係数β＝０．３３及びＡＲ予測係数α＝０．６５に対してスケーリングファクタ＝１．２５である。もしＡＲ予測用に量子化器が設計されれば、その場合反対の操作が行われる。すなわち、１より小さいスケーリングファクタによって、ＭＡ予測による予測誤差ベクトルがスケーリングされる。

次いでスケーリング予測誤差ベクトルｅ’が、ベクトル量子化され（プロセッサ５０

サ５０８は２段ベクトル量子化器からなり、両段において分離ＶＱが使用され、第１段のベクトル量子化テーブルは、ＭＡおよびＡＲ両予測に対して同じである。２段ベクトル量子化器５０８は、プロセッサ５０４、５０５、５０６、５０７、および５０９からなる。第１段量子化器Ｑ１では、スケーリング予測誤差ベクトルｅ’が量子化され、第１段量

グ予測誤差ベクトルｅ’から除去され（プロセッサ５０５）、第２段予測誤差ベクトルｅ_２を生成する。次いでこの第２段予測誤差ベクトルｅ_２は、第２段ベクトル量子化器Ｑ_ＭＡあるいは第２段ベクトル量子化器Ｑ_ＡＲのいずれかにより量子化され（プロセッサ５０６）、

選択は、フレーム分類情報に依存する（例えば以前に示したように、もしフレームが安定な音声ならＡＲ、もしフレームが安定な音声でないならＭＡ）。量子化スケーリング予測

再構成される（プロセッサ５０９）。最後に、プロセッサ５０３のスケーリングの逆のス

り、両段で分離ＶＱが使用される。量子化器Ｑ１および量子化器Ｑ_ＭＡまたは量子化器Ｑ_ＡＲからの量子化指標ｉ_１およびｉ_２は乗算され、通信チャネルを介して伝送される（プロセッサ５０７）。

予測ベクトルｐは、フレーム分類情報に依存して（例えば以前に示したように、もしフレームが安定な音声ならＡＲ、もしフレームが安定な音声でないならＭＡ）ＭＡ予測器（プロセッサ５１１）あるいはＡＲ予測器（プロセッサ５１２）のいずれかにおいて計算される。次いでもしフレームが安定な音声なら、予測ベクトルはＡＲ予測器５１２の出力に等しい。そうでなければ、予測ベクトルはＭＡ予測器５１１の出力に等しい。以前に説明したように、ＡＲ予測器５１２が前のフレームからの量子化入力ＬＰパラメータベクトルを操作する一方、ＭＡ予測器５１１は前のフレームからの量子化予測誤差ベクトルを操作

図６は、本発明によるデコーダにおける切り替え予測ベクトル量子化器６００の例証的実施形態を示す概略ブロック図である。デコーダ側で、受信量子化指標の組ｉ_１およびｉ_２が量子化テーブル（プロセッサ６０１および６０２）により使用され、第１段および第

説明したように、第２段量子化（プロセッサ６０２）はＭＡおよびＡＲ予測に対する２組のテーブルからなることに注目されたい。次いで、２段からの量子化予測誤差ベクトルの

構成される。プロセッサ６０９において、逆スケーリングが適用され、量子化予測誤差ベ

ロセッサ５０３により実行されるスケーリングの逆に相当することに注目されたい。次い

平均ＬＰパラメータのベクトルμが符号器側で除去された場合、ベクトルμはプロセッサ

化器側の場合のように、フレーム分類情報に依存して、予測ベクトルｐはＭＡ予測器６０５の出力あるいはＡＲ予測器６０６の出力のいずれかである；この選択はフレーム分類情報に対応してプロセッサ６０７の論理に従ってなされる、ことに注意すべきである。より詳細には、もしフレームが安定な音声であれば、その場合予測ベクトルｐはＡＲ予測器６０６の出力に等しい。そうでない場合、予測ベクトルｐはＭＡ予測器６０５の出力に等しい。

勿論、ＭＡ予測器あるいはＡＲ予測器のいずれかの出力のみが一定のフレームにおいて使用されるのは事実であるが、ＭＡ予測器あるいはＡＲ予測器のいずれかが次のフレームにおいて使用されうることを想定して、両予測器のメモリはフレーム毎に更新される。これは符号化器およびデコーダ側の両側に当てはまる。

符号化利得を最適化するために、ＭＡ予測に設計された第１段の幾つかのベクトルは、ＡＲ予測に設計された新しいベクトルにより置き換えることが出来る。非制限、例証的実施形態では、第１段コード帳のサイズは２５６であり、１２．６５ｋｂｉｔ／ｓのＡＭＲ−ＷＢ標準におけるのと同じ内容を有し、ＡＲ予測を使用する場合、第１段コード帳において２８ベクトルが置き換えられる。従って、拡張第１段コード帳は次のように形成される：まず、ＡＲ予測を適用する場合余り使用されないが、ＭＡ予測に使用しうる２８の第１段ベクトルがテーブルの始めに配置され、次いでＡＲおよびＭＡ両予測に使用可能な残りの２５６−２８＝２２８の第１段ベクトルがテーブルに追加され、最後にＡＲ予測に使用可能な２８の新しいベクトルがテーブルの末尾に置かれる。テーブル長は、従って２５６＋２８＝２８４ベクトルである。ＭＡ予測を使用する場合、テーブルの最初の２５６ベクトルは第１段で使用される；ＡＲ予測を使用する場合、テーブルの最後の２５６ベクトルが使用される。ＡＭＲ−ＷＢ標準との相互運用性を保証するために、この新コード帳における第１段ベクトルの位置とＡＭＲ−ＷＢ第１段コード帳における元の位置との間のマッピングを含むテーブルが使用される。

要約すると、図５および図６に関して説明した、上述の本発明の非制限、例証的実施形態は以下の特徴を提示する：
・現通話フレームの性質に依存する、可変レート符号化器の符号化モードに依存して、ＡＲ／ＭＡ切り替え型の予測方式が使用される。
・ＡＲあるいはＭＡ予測のいずれが適用されようとも、本質的に同じ第１段量子化器が使用され、これによりメモリの節減が得られる。非制限、例証的実施形態では、１６次のＬＰ予測が使用され、ＬＰパラメータはＩＳＦ領域で表現される。第１段のコード帳は、ＭＡ予測を使用して設計されたＡＭＲ−ＷＢ符号化器の１２．６５ｋｂｉｔ／ｓモードにおいて使用されるコード帳と同じである（１６次元ＬＰパラメータベクトルは、次元７および９の２つのサブベクトルに分離され、量子化の第１段において２５６エントリを有する２つのコード帳が使用される）。
・安定モード、特に半レート音声モードでは、ＭＡ予測の代わりにＡＲ予測が使用され、そうでない場合はＭＡ予測が使用される。
・ＡＲ予測の場合、量子化器の第１段はＭＡ予測の場合と同じである。しかしながら、第２段は、ＡＲ予測に適切となるように設計され学習させることが出来る。
・予測器のモードにこの切り替えを考慮に入れるために、ＭＡおよびＡＲの両予測が次のフレームに使用されうることを想定して、ＭＡおよびＡＲの両予測器のメモリがフレーム毎に更新される。
・さらに、符号化利得の最適化のために、ＭＡ予測に設計された第１段の幾つかのベクトルは、ＡＲ予測に設計された新ベクトルによって置き換えることが出来る。この非制限、例証的実施形態によれば、ＡＲ予測を使用する場合、２８個のベクトルが第１段コード帳において置き換えられる。
・この拡張第１段コード帳は以下のように形成することが出来る：まず、ＡＲ予測を適用する場合は余り使用されない２８個の第１段ベクトルがテーブルの始めに配置され、次いで残りの２５６−２８＝２２８個の第１段ベクトルがテーブルに配置され、最後に２８個の新しいベクトルがテーブルの末尾に置かれる。テーブル長は、従って２５６＋２８＝２８４ベクトルである。ＭＡ予測を使用する場合、テーブルの最初の２５６個のベクトルが第１段で使用される；ＡＲ予測を使用する場合、テーブルの最後の２５６個のベクトルが使用される。
・ＡＭＲ−ＷＢ標準との相互運用性を保証するために、この新コード帳における第１段ベクトルの位置とＡＭＲ−ＷＢ第１段コード帳における元の位置との間のマッピングを含むテーブルが使用される。
・安定な信号に関して使用する場合、ＡＲ予測はＭＡ予測よりより少ない予測誤差エネルギーを達成するので、スケーリングファクタが予測誤差に適用される。非制限、例証的実施形態では、ＭＡ予測が使用される場合スケーリングファクタは１であり、ＡＲ予測が使用される場合は１／０．８である。これはＡＲ予測誤差をＭＡ予測誤差と等しいダイナミックレンジに拡大する。従って、第１段において、ＭＡおよびＡＲの両予測方式に対して同じ量子化器が使用されうる。

上記の説明では本発明の非制限、例証的実施形態に関連して、本発明を説明したが、本発明の性質と範囲から逸脱することなく添付の請求範囲内において、これらの実施形態は随意に変更することが出来る。

多段ベクトル量子化器の非制限的実施例を説明する概略ブロック図である。分離ベクトルベクトル量子化器の非制限的実施例を説明する概略ブロック図である。自動回帰（ＡＲ）予測を使用する予測ベクトル量子化器の非制限的実施例を説明する概略ブロック図である。移動平均（ＭＲ）予測を使用する予測ベクトル量子化器の非制限的実施例を説明する概略ブロック図である。本発明の非制限、例証的実施形態による符号化器における切り替え予測ベクトル量子化器の実施例の概略ブロック図である。本発明の非制限、例証的実施形態による符号化解除器における切り替え予測ベクトル量子化器の実施例の概略ブロック図である。周波数へのＩＳＦｓの分布の非制限、例証的実施例であり、ここで各分布はＩＳＦベクトルの所与の位置にＩＳＦを見つける確率関数である。後続通話フレームによるＩＳＦパラメータの変化の代表例を示すグラフである。

Claims

可変ビットレートの音声信号の符号化における線形予測パラメータの量子化方法であって、
入力線形予測パラメータベクトルを受信する段階、
前記入力線形予測パラメータベクトルに対応する音声信号フレームを、安定な音声フレームか安定でない音声フレームかに分類する段階、
予測ベクトルを計算する段階、
前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する段階、
前記予測誤差ベクトルをスケーリングする段階、
前記スケーリングした予測誤差ベクトルを量子化する段階、
を含み、
・前記予測ベクトルを計算する段階は、前記音声信号フレームの前記分類に関連する複数の予測方式の１つを選択する段階、および該選択した予測方式に従って該予測ベクトルを計算する段階を含み、
・前記予測誤差ベクトルをスケーリングする段階は、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも１つを選択する段階、および該選択したスケーリングファクタに従って該予測誤差ベクトルをスケーリングする段階を含む、量子化方法。
請求項１に記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
前記選択した予測方式を使用し、少なくとも１つの量子化器によって前記予測誤差ベクトルを処理する段階、
を含む、量子化方法。
請求項１または２に記載の線形予測パラメータの量子化方法であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含む、
量子化方法。
請求項１から３のいずれかに記載の線形予測パラメータの量子化方法であって、さらに、
平均線形予測パラメータのベクトルを生成する段階、および
前記入力線形予測パラメータベクトルから前記平均線形予測パラメータのベクトルを除去し、平均除去線形予測パラメータベクトルを生成する段階、
を含む、量子化方法。
請求項１から４のいずれかに記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、該音声信号フレームが安定な音声フレームであると分類した場合、前記複数の予測方式の１つを選択する段階が、自己回帰予測を選択することを含み、
前記予測ベクトルを計算する段階が、自己回帰予測によって前記予測誤差ベクトルを計算することを含み、
前記予測誤差ベクトルをスケーリングする段階が、前記スケーリングファクタを使用して、量子化に先立って該予測誤差ベクトルをスケーリングすることを含む、
量子化方法。
請求項１から５のいずれかに記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、該音声信号フレームが安定でない音声フレームであると分類した場合、前記予測ベクトルを計算する段階が、移動平均予測によって前記予測誤差ベクトルを計算することを含む、
量子化方法。
請求項１から５に記載の線形予測パラメータの量子化方法であって、前記スケーリングファクタが１より大きい、量子化方法。
請求項１から６のいずれかに記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
２段ベクトル量子化過程によって前記予測誤差ベクトルを処理する段階、
を含む、量子化方法。
請求項８に記載の線形予測パラメータの量子化方法であって、さらに前記ベクトル量子化過程の前記２段において分離ベクトル量子化を使用する段階を含む、量子化方法。
請求項３に記載の線形予測パラメータの量子化方法であって、
前記予測誤差ベクトルを量子化する段階が、第１および第２段を含む２段ベクトル量子化過程によって前記予測誤差ベクトルを処理する段階を含み、かつ
前記２段ベクトル量子化過程によって前記予測誤差ベクトルを処理することが、移動平均および自己回帰の両予測に対して同一である前記第１段のベクトル量子化テーブルに前記予測誤差ベクトルを適用することを含む、
量子化方法。
請求項８または９に記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
前記２段ベクトル量子化過程の第１段において、前記予測誤差ベクトルを量子化し、第１段量子化予測誤差ベクトルを生成する段階、
前記予測誤差ベクトルから前記第１段量子化予測誤差ベクトルを除去し、第２段予測誤差ベクトルを生成する段階、
前記２段ベクトル量子化過程の前記第２段において、前記第２段予測誤差ベクトルを量子化し、第２段量子化予測誤差ベクトルを生成する段階、および
前記第１段および前記第２段量子化予測誤差ベクトルの和によって量子化した予測誤差ベクトルを生成する段階、
を含む、量子化方法。
請求項１１に記載の線形予測パラメータの量子化方法であって、前記第２段予測誤差ベクトルを量子化する段階が、
前記音声信号フレームの前記分類に応じ、移動平均予測量子化器または自己回帰予測量子化器によって前記第２段予測誤差ベクトルを処理すること、
を含む、量子化方法。
請求項８，９，１１のいずれかに記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
前記２段ベクトル量子化過程の前記２段に対する量子化指標を生成する段階、
通信チャネルを介し前記量子化指標を伝送する段階、
を含む、量子化方法。
請求項８に記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、前記音声信号フレームが安定な音声フレームであると分類した場合、前記予測ベクトルを計算する段階が、
（ａ）前記第１段および前記第２段量子化予測誤差ベクトルの和によって生成された前記量子化した予測誤差ベクトルと（ｂ）前記計算した予測ベクトルとを加算し、量子化した入力ベクトルを生成する段階、および
自己回帰予測によって前記量子化した入力ベクトルを生成する段階、
を含む、量子化方法。
請求項２に記載の線形予測パラメータの量子化方法であって、
・前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
・前記予測誤差ベクトルを量子化する段階が、
第１段コード帳を含む２段ベクトル量子化器によって前記予測誤差ベクトルを処理する段階を含み、前記第１段コード帳自体が、連続して、
移動平均予測を適用するときに使用でき、テーブルの始めに配置された第１グループのベクトル、
移動平均および自己回帰予測のいずれかを適用するときに使用でき、前記テーブルの前記第１グループのベクトルと第３グループのベクトルとの中間に配置された第２グループのベクトル、
自己回帰予測を適用するときに使用でき、前記テーブルの末尾に配置された前記第３グループのベクトル、
を含み、
・前記選択した予測方式を使用して少なくとも１つの量子化器によって前記予測誤差ベクトルを処理する段階が、
前記選択した予測方式が移動平均予測であるとき、前記テーブルの前記第１および第２グループのベクトルによって前記予測誤差ベクトルを処理する段階、および
前記選択した予測方式が自己回帰予測であるとき、前記第２および前記第３グループのベクトルによって前記予測誤差ベクトルを処理する段階、
を含む、量子化方法。
請求項１５に記載の線形予測パラメータの量子化方法であって、ＡＭＲ−ＷＢ標準との相互運用性を保証するために、前記第１段コード帳の前記テーブルにおける第１段ベクトルの位置と前記ＡＭＲ−ＷＢ第１段コード帳における前記第１段ベクトルの元の位置との間のマッピングがマッピングテーブルにより行われる、量子化方法。
請求項１−６，８，１４のいずれかに記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、該音声信号フレームは安定な音声フレームであると分類した場合、前記音声信号フレームの前記分類に関連する複数の予測方式の１つを選択する段階が、自己回帰予測を選択する段階を含み、前記選択した予測方式に従って前記予測ベクトルを計算する段階が、自己回帰予測によって前記予測誤差ベクトルを計算する段階を含み、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも１つを選択する段階が、１より大きいスケーリングファクタを選択する段階を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする段階が、１より大きい前記スケーリングファクタを使用する量子化に先立って前記予測誤差ベクトルをスケーリングする段階を含み、
前記音声信号フレームを分類する段階において、該音声信号フレームは安定でない音声フレームであると分類した場合、前記音声信号フレームの前記分類に関連する複数の予測方式の１つを選択する段階が、移動平均予測を選択する段階を含み、前記選択した予測方式に従って前記予測ベクトルを計算する段階が、移動平均予測によって前記予測誤差ベクトルを計算する段階を含み、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも１つを選択する段階が、１に等しいスケーリングファクタを選択する段階を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする段階が、１に等しいスケーリングファクタを使用する量子化に先立って前記予測誤差ベクトルをスケーリングする段階を含む、
量子化方法。
可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除方法であって、
少なくとも１つの量子化指標を受信する段階、
前記少なくとも１つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する段階、
少なくとも１つの量子化テーブルに前記少なくとも１つの指標を適用することによって予測誤差ベクトルを回復する段階、
予測ベクトルを再構成する段階、
前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する段階、
を含み、前記予測ベクトルを再構成する段階が、前記フレーム分類情報に応じ、複数の予測方式の１つによって前記回復した予測誤差ベクトルを処理する段階を含む、量子化解除方法。
請求項１８に記載の線形予測パラメータの量子化解除方法であって、前記予測誤差ベクトルを回復する段階が、
前記１つの予測方式を使用し、少なくとも１つの量子化テーブルに前記少なくとも１つの指標および前記分類情報を適用する段階、
を含む、量子化解除方法。
請求項１８または１９に記載の線形予測パラメータの量子化解除方法であって、
前記少なくとも１つの量子化指標を受信する段階が、第１段量子化指標および第２段量子化指標を受信する段階を含み、
前記少なくとも１つの量子化テーブルに前記少なくとも１つの指標を適用する段階が、第１段量子化テーブルに前記第１段量子化指標を適用し、第１段予測誤差ベクトルを生成する段階、および第２段量子化テーブルに前記第２段量子化指標を適用し、第２段予測誤差ベクトルを生成する段階を含む、
量子化解除方法。
請求項２０に記載の線形予測パラメータの量子化解除方法であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記第２段量子化テーブルが、移動平均予測テーブルおよび自己回帰予測テーブルを含み、
前記方法が、さらに前記第２段量子化テーブルに前記音声信号フレームの分類を適用し、前記受信したフレームの分類情報に応じ、前記移動平均予測テーブルまたは前記自己回帰予測テーブルによって前記第２段量子化指標を処理する段階を含む、
量子化解除方法。
請求項２０又は２１に記載の線形予測パラメータの量子化解除方法であって、前記予測誤差ベクトルを回復する段階が、
前記第１段予測誤差ベクトルと前記第２段予測誤差ベクトルとを加え、前記回復した予測誤差ベクトルを生成する段階、
を含む、量子化解除方法。
請求項２２に記載の線形予測パラメータの量子化解除方法であって、さらに、
前記回復したフレーム分類情報の関数として、前記回復した予測ベクトルへ逆スケーリング演算を実行する段階、
を含む、量子化解除方法。
請求項１８から２３のいずれかに記載の線形予測パラメータの量子化解除方法であって、前記線形予測パラメータベクトルを生成する段階が、
前記回復した予測誤差ベクトルと前記再構成した予測ベクトルとを加算し、前記線形予測パラメータベクトルを生成する段階、
を含む、量子化解除方法。
請求項２４に記載の線形予測パラメータの量子化解除方法であって、さらに、前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに平均線形予測パラメータのベクトルを加算し、前記線形予測パラメータベクトルを生成する段階を含む、量子化解除方法。
請求項１８から２０のいずれかに記載の線形予測パラメータの量子化解除方法であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記予測ベクトルを再構成する段階が、フレーム分類情報に応じ、前記回復した予測誤差ベクトルを移動平均予測によって処理するかまたは前記生成したパラメータベクトルを自己回帰予測によって処理する段階を含む、量子化解除方法。
請求項２６に記載の線形予測パラメータの量子化解除方法であって、前記予測ベクトルを再構成する段階が、
前記音声信号フレームが安定な音声であることを前記フレーム分類情報が示すとき、前記生成したパラメータベクトルを自己回帰予測によって処理する段階、および
前記音声信号フレームが安定な音声でないことをフレーム分類情報が示すとき、前記回復した予測誤差ベクトルを移動平均予測によって処理する段階、
を含む、量子化解除方法。
可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置であって、
入力線形予測パラメータベクトルを受信する手段、
前記入力線形予測パラメータベクトルに対応する音声信号フレームが安定な音声フレームであるか否かを判断する手段、
予測ベクトルを計算する手段、
前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する手段、
前記予測誤差ベクトルをスケーリングする手段、
前記スケーリングした予測誤差ベクトルを量子化する手段、
を含み、
・予測ベクトルを計算する前記手段が、前記音声信号フレームの前記分類に関連する複数の予測方式の１つを選択する手段、および該選択した予測方式に従って前記予測ベクトルを計算する手段を含み、
・前記予測誤差ベクトルをスケーリングする手段が、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも１つを選択する手段、および前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする手段を含む、
量子化装置。
可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置であって、
入力線形予測パラメータベクトルを受信する入力部、
前記入力線形予測パラメータベクトルに対応する音声信号フレームの分類器であって、該音声信号フレームが安定な音声フレームか安定でない音声フレームかを判断しうる分類器、
予測ベクトルの計算機、
前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する減算器、
前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルをスケーリングするスケーリングユニット、および
前記スケーリングした予測誤差ベクトルの量子化器、
を含み、
・前記予測ベクトル計算機が、前記音声信号フレームの前記分類に関連する複数の予測方式から１つを選択する選択器を含み、前記選択した予測方式に従って前記予測ベクトルの計算を行い、
・前記スケーリングユニットが、前記選択した予測方式に関連する複数のスケーリングファクタから少なくとも１つを選択する選択器を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルのスケーリングを行う、
量子化装置。
請求項２９に記載の線形予測パラメータの量子化装置であって、
前記量子化器が、前記予前記測誤差ベクトルの供給を受け、前記選択した予測方式によって前記予測誤差ベクトルを処理する、
量子化装置。
請求項２９または３０に記載の線形予測パラメータの量子化装置であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含む、
量子化装置。
請求項２９から３１のいずれかに記載の線形予測パラメータの量子化装置であって、
平均線形予測パラメータをベクトル生成する手段、および
前記入力線形予測パラメータベクトルから平均線形予測パラメータの前記ベクトルを除去し、平均除去入力線形予測パラメータベクトルを生成する減算器、
を含む、量子化装置。
請求項２９から３２のいずれかに記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームであると前記分類器が判定するとき、前記予測ベクトル計算機が、
前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器、
を含む、量子化装置。
請求項２９から３３のいずれかに記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームでないと前記分類器が判定するとき、
前記予測ベクトル計算機が、前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含む、
量子化装置。
請求項２９から３３に記載の線形予測パラメータの量子化装置であって、前記スケーリングユニットが、
前記予測誤差ベクトルに１より大きいスケーリングファクタを適用する乗算器、
を含む、量子化装置。
請求項２９から３５のいずれかに記載の線形予測パラメータの量子化装置であって、前記量子化器が、２段ベクトル量子化器を含む、量子化装置。
請求項３６に記載の線形予測パラメータの量子化装置であって、前記２段ベクトル量子化器が、分離ベクトル量子化を使用する前記２段を含む、量子化装置。
請求項３１から３７のいずれかに記載の線形予測パラメータの量子化装置であって、
前記量子化器が、第１段および第２段を含む２段ベクトル量子化器を含み、
前記２段ベクトル量子化器が、移動平均および自己回帰の両予測に対して同一である第１段量子化テーブルを含む、
量子化装置。
請求項３６又は３７に記載の線形予測パラメータの量子化装置であって、前記２段ベクトル量子化器が、
前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルを量子化し、第１段量子化予測誤差ベクトルを生成する第１段ベクトル量子化器、
前記予測誤差ベクトルから前記第１段量子化予測誤差ベクトルを除去し、第２段予測誤差ベクトルを生成する減算器、
前記第２段予測誤差ベクトルの供給を受け、前記第２段予測誤差ベクトルを量子化し、第２段量子化予測誤差ベクトルを生成する第２段ベクトル量子化器、および
第１段および第２段量子化予測誤差ベクトルの和によって量子化した予測誤差ベクトルを生成する加算器、
を含む、量子化装置。
請求項３９に記載の線形予測パラメータの量子化装置であって、前記２段ベクトル量子化器が、
移動平均予測を使用して前記第２段予測誤差ベクトルを量子化する移動平均第２段ベクトル量子化器、および
自己回帰予測を使用して前記第２段予測誤差ベクトルを量子化する自己回帰第２段ベクトル量子化器、
を含む、量子化装置。
請求項３６，３７，３９のいずれかに記載の線形予測パラメータの量子化装置であって、前記２段ベクトル量子化器が、
第１段量子化指標を生成する第１段ベクトル量子化器、
第２段量子化指標を生成する第２段ベクトル量子化器、および
通信チャネルを介し、前記第１段および前記第２段量子化指標を送信する送信機、
を含む、量子化装置。
請求項３９に記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームであると前記分類器が判定するとき、前記予測ベクトル計算機が、
（ａ）前記第１段および前記第２段量子化予測誤差ベクトルの和によって生成された前記量子化した予測誤差ベクトルと（ｂ）前記計算した予測ベクトルとを加え、量子化入力ベクトルを生成する加算器、および
前記量子化した入力ベクトルを処理する自己回帰予測器、
を含む、量子化装置。
請求項３０に記載の線形予測パラメータの量子化装置であって、
・前記複数の予想方式が、移動平均予測および自己回帰予測を含み、
・前記量子化器が、
第１段コード帳を含む２段ベクトル量子化器を含み、第１段コード帳自体が、連続して、
移動平均予測を適用するときに使用でき、テーブルの前記始めに配置された第１グループのベクトル、
移動平均および自己回帰予測のいずれかを適用するときに使用でき、前記テーブルの前記第１グループのベクトルと第３グループのベクトルとの中間に配置された第２グループのベクトル、
自己回帰予測を適用するときに使用でき、前記テーブルの前記末尾に配置された前記第３グループのベクトル、
を含み、
・前記予測誤差ベクトル処理手段が、
前記選択した予測方式が移動平均予測であるとき、前記テーブルの前記第１および第２グループのベクトルによって前記予測誤差ベクトルを処理する手段、および
前記選択した予測方式が自己回帰予測であるとき、前記第２および前記第３グループのベクトルによって前記予測誤差ベクトルを処理する手段、
を含む、量子化装置。
請求項４３に記載の線形予測パラメータの量子化装置であって、さらに、前記ＡＭＲ−ＷＢ標準との相互運用性を保証するために、前記第１段コード帳の前記テーブルにおける第１段ベクトルの前記位置とＡＭＲ−ＷＢ第１段コード帳における第１段ベクトルの元の位置との間のマッピングを確立するマッピングテーブルを含む、量子化装置。
請求項３１または３８に記載の線形予測パラメータの量子化装置であって、
前記予測ベクトル計算機が、前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器および前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含み、
前記自己回帰予測あるいは移動平均予測のいずれかが、次のフレームにおいて使用されうることを想定して、前記自己回帰予測器および移動平均予測器が、音声信号のフレーム毎に更新されるメモリをそれぞれ含む、
量子化装置。
可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除装置であって、
少なくとも１つの量子化指標を受信する手段、
前記少なくとも１つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する手段、
少なくとも１つの量子化テーブルに前記少なくとも１つの指標を適用することによって予測誤差ベクトルを回復する手段、
予測ベクトルを再構成する手段、
前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する手段、
を含み、
前記予測ベクトルを再構成する手段が、前記フレーム分類情報に応じ、複数の予測方式の１つによって前記回復した予測誤差ベクトルを処理する手段を含む、
量子化解除装置。
可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除装置であって、
少なくとも１つの量子化指標を受信する手段、
前記少なくとも１つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する手段、
前記少なくとも１つの量子化指標の供給を受け、予測誤差ベクトルを回復する少なくとも１つの量子化テーブル、
予測ベクトルを再構成するユニット、
前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルの生成器、
を含み、
前記予測ベクトル再構成ユニットは、回復した予測誤差ベクトルの供給を受けて、前記フレーム分類情報に応じ、複数の予測方式の１つによって前記回復した予測誤差ベクトルを処理する少なくとも１つの予測器を含む、
量子化解除装置。
請求項４７に記載の線形予測パラメータの量子化解除装置であって、前記少なくとも１つの量子化テーブルが、
前記１つの予測方式を使用し、前記少なくとも１つの指標および前記分類情報の両者の供給を受ける量子化テーブル、
を含む、量子化解除装置。
請求項４７または４８に記載の線形予測パラメータの量子化解除装置であって、
前記量子化指標受信手段が、第１段量子化指標および第２段量子化指標を受信する２つの入力を含み、
前記少なくとも１つの量子化テーブルが、第１段予測誤差ベクトルを生成するために、前記第１段量子化指標の供給を受ける第１段量子化テーブルを含み、第２段予測誤差ベクトルを生成するために、前記第２段量子化指標の供給を受ける第２段量子化テーブルを含む、
量子化解除装置。
請求項４９に記載の線形予測パラメータの量子化解除装置であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記第２段量子化テーブルが、移動平均予測テーブルおよび自己回帰予測テーブルを含み、
前記装置が、さらに前記第２段量子化テーブルに前記音声信号フレームの分類を適用し、前記受信したフレームの分類情報に応じ、前記移動平均予測テーブルまたは前記自己回帰予測テーブルによって前記第２段量子化指標を処理する手段を含む、
量子化解除装置。
請求項４９又は５０に記載の線形予測パラメータの量子化解除装置であって、さらに
前記第１段予測誤差ベクトルと前記第２段予測誤差ベクトルを加え、前記回復した予測誤差ベクトルを生成する加算器、
を含む、量子化解除装置。
請求項５１に記載の線形予測パラメータの量子化解除装置であって、さらに、
前記受信したフレームの分類情報の関数として、前記再構成した予測ベクトルに対し逆スケーリング演算を実行する手段、
を含む、量子化解除装置。
請求項４７から５２のいずれかに記載の線形予測パラメータの量子化解除装置であって、前記線形予測パラメータベクトルの生成器が、
前記回復した予測誤差ベクトルと前記再構成した予測ベクトルとを加算して、前記線形予測パラメータベクトルを生成する加算器、
を含む、量子化解除装置。
請求項５３に記載の線形予測パラメータの量子化解除装置であって、さらに、前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに平均線形予測パラメータのベクトルを加算し、前記線形予測パラメータベクトルを生成する手段を含む、量子化解除装置。
請求項４７から４９のいずれかに記載の線形予測パラメータの量子化解除装置であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記予測ベクトル再構成ユニットが、前記フレーム分類情報に応じ、移動平均予測によって前記回復した予測誤差ベクトルを処理するか、または自己回帰予測によって前記生成したパラメータベクトルを処理する移動平均予測器および自己回帰予測器を含む、
量子化解除装置。
請求項５５に記載の線形予測パラメータの量子化解除装置であって、前記予測ベクトル再構成ユニットが、
前記音声信号フレームが安定な音声であることを前記フレーム分類情報が示すとき、前記自己回帰予測器によって前記生成したパラメータベクトルを処理する手段、および
前記音声信号フレームが安定な音声でないことを前記フレーム分類情報が示すとき、前記移動平均予測器によって前記回復した予測誤差ベクトルを処理する手段、
を含む、量子化解除装置。
請求項５５又は５６に記載の線形予測パラメータの量子化解除装置であって、
前記少なくとも１つの予測器が、前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器および前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含み、
移動平均あるいは自己回帰予測のいずれかが次のフレームにおいて使用されうることを想定して、前記自己回帰予測器および移動平均予測器が、音声信号のフレーム毎に更新されるメモリをそれぞれ含む、
量子化解除装置。