JPH11500837A

JPH11500837A - スピーチコーダ用信号予測方法及び装置

Info

Publication number: JPH11500837A
Application number: JP9514782A
Authority: JP
Inventors: ジャックポーラン; ベルトランラヴェラ
Original assignee: フィリップスエレクトロニクスネムローゼフェンノートシャップ
Priority date: 1995-10-11
Filing date: 1996-10-11
Publication date: 1999-01-19
Also published as: WO1997014139A1; DE69609592T2; DE69609592D1; EP0796490B1; EP0796490A1

Abstract

(57)【要約】本発明は符号化すべき音声信号を連続するサブフィールドに分割し、該音声信号内に存在する周期性情報を予測する方法及び装置に関する。この予測は各前サブフィールドの最適励起に基づいて構成されたアダプティブディクショナリを用いて行い、これらの前予測をフィルタ処理し、次いで相関させて所望の予測信号を選択し、次にこの予測信号を初期情報と比較して予測誤差のみを符号化し、伝送する。

Description

【発明の詳細な説明】スピーチコーダ用信号予測方法及び装置本発明は、ＣＥＬＰスピーチコーダにおいて短時間分析の残差ベクトル信号又は残差ベクトル、即ち符号化すべき初期音声信号に存在する周期性情報を含む信号を予測する方法であって、前記音声信号を連続するサブフィールドに分割し、前記予測を前サブフィールドに対し予測された最適励起に基づいて行う予測方法に関するものである。本発明は、符号化すべき初期音声信号を受信し、該音声信号を連続するサブフィールドに分割し、該音声信号内の周期性情報を規定する残差ベクトル信号を出力する短時間分析フィルタと、この残差ベクトル信号を予測する予測装置と、この残差ベクトル信号と予測ベクトル信号との差により予測誤差を推定する回路とを具えるＣＥＬＰスピーチコーダ、特に前記予測装置に関するものである。発声器官により発生された音声は２つの特性を有する音声信号を構成し、一方の特性はこの信号を人間の聴覚器官（有限通過帯域、有限周波数分解能、共振周波数に対する感度、信号の周波数成分の位相に対する不感応度等）を通して知覚するメカニズムに関連し、他方の特性は発声器官の機能（音声の擬似周期性、信号の共振構造、．．）に関連する。音声メッセージ自体は、内容についての情報と、表現情報という、メッセージの音響表現の個々の変化を解釈する補助情報との組合せとみなすことができる。このようなメッセージの有効な伝送はたぶん忠実度基準の決定を必要とすること明らかである。しかも、一般に、伝送メッセージと、対応する受信信号との間に知覚の差がないことが検出される知覚基準を決定するのが一層現実的である。実際上、音声信号は音声発生に必要なエネルギーを供給する呼吸器系の制御の下で声道により発生された空気圧の変化により構成される。肺を出た空気の流れが母音の発生と関連する基本周波数という周波数Ｆ₀で変調される。この周波数は男では約７０Hzと１５０Hzの間で変化し、女では約１５０Hzと４００Hzの間で変化し、有声音を特徴づける（有声音の一例の振幅Ａを時間ｔの関数として図１に示す）。この場合、空気流が声道の空胴を励起して強制振動させ、声道の形がホルマントという周波数Ｆ₁、Ｆ₂、Ｆ₃等に対応する。音声信号は、任意の固有の周波数を持たない音源により発生される声道の適正周波数を励起しない信号、即ち有声音のコヒーレンス性を持たないで雑音に関連する信号も含む（これらの音声は大多数の子音の発生に関連する）。音声信号の特徴は、発生スペクトルが有声音を発生する線スペクトル（周期的励起）及び無声音を発生する連続スペクトル（インコヒーレント励起）を具えることを示すスペクトル分析により示すことができる。音声信号の一層広範な分析は、音声信号の通過帯域の正確且つ高信頼度の伝送のための処理は音響レベルにおけるかなり多量のデータストリームの処理になることを最終的に示す。このデータストリームを相当程度低減するために種々の音声分析技術が開発されている。得られた冗長性を除去するために、最初アナログ形式の音声信号を、ディジタル化後に、現行のビットレートラインを経て伝送しうるビットレートに圧縮することができる。音声信号圧縮に関しては、国際電気通信連合が低ビットレート電話に関する応用のフレームワークにおける勧告案を公表している（"Draft Recommendation G. 723- Dual rate speech coder for multimedia telecommunication transmittin g at 5.3 and 6.3 kbits/s"，ITU，Study Group 15，1995，10th "LBC Meeting" ，Newton，Ma，USA）。これにはスピーチコーダに対する標準規格が規定されている。このコーダはアナリシス・バイ・シンセシス（合成による分析）線形予測符号化に関する原理に基づいている。この符号化は合成フィルタ係数を決定する分析ステップと、所定の誤差基準（最小二乗誤差基準がしばしば使用される）を最小にする励起の系列を検出又は計算する合成による分析ステップとを具える。前記勧告案に述べられている、コード・エクサイテッド・リニア・プレディクティブ・エンコーデイング（Ｃode Ｅxcited Ｌinear Ｐredictive Ｅncoding）又はＣＥＬＰ符号化（以後この語を使用する）という符号化は音声発生モードの簡単化モデルに関連し、このモデルによれば第１近似において音声信号を短時間相関フィルタ（声道）とその入力として励起信号を有する長時間相関フィルタ（音源）とによりモデル化することができる。ＣＥＬＰコーダの詳細な実施例が多くの刊行物、例えば "Digital audio codi ng for visual communications"，P．Noll，Proceedings of the IEEE，vol.83 ，no.6，June 1995に記載されている。知覚フィルタリングが全てのＣＥＬＰコードに使用され、前記勧告案Ｇ．７２３も調波フィルタリングを使用している。これらのフィルタリング処理は本発明の範囲に含まれず、ここにはこれ以上詳しく述べない。このように、コーダにおいては、短時間分析がＬＰＣ(Ｌinear Ｐr edictive Ｃoding)という線形予測フィルタリング処理からなり、このフィルタリング処理は一般にＡ(z)：（勧告Ｇ．７２３の場合にはｎ＝１０）で表されが、ＬＴＰ(Ｌong Ｔerm Ｐrediction)という長時間分析はＡ(z)の係数ａ_kの量子化を有する合成フィルタリングＳ(z)＝１／Ａ(z)を使用する。短時間分析は予測方法に基づく。この予測方法の基本思想は、音声入力信号又は観察信号s(n)（n はサンプルのランクを示す）が既知であるとき、励起信号x( n)により励起され、s(n)にできるだけ近い予測信号p(n)を供給するフィルタを見つけ出すことにあり、この方法ではs(n)とp(n)との差を設定することによりできるだけ小さい残差誤差e(n)を得ることができる。短時間分析に使用する予測方法は線形である。その理由は、伝送すべき初期音声信号の各サンプルs(n)は所定数（例えば１０）の前サンプルの線形結合の形で予測することができ（信号p(n)）、この線形結合は、例えば次のように書き表せる。Ｎが例えば１０サンプルの場合には、この式は次のようになる。 p(n)＝a₁.s(n-1)＋a₂.s(n-2)＋...＋a₁₀.s(n-10) (2) これは、予測信号p(n)は、フィルタの係数ａ_k（式(2)の例ではａ₁〜ａ₁₀）を予測誤差e(n)= s(n)-p(n)が最小になるよう計算することにより得られることを意味する（一般に、得られる誤差を最小にするために最小二乗法が使用されている）。前記文書Ｇ．７２３に記載されているスピーチコーダは８ｋＨｚのサンプリング周波数の２４０サンプルを具えるブロック又はフィールドからなる信号を受信し、各フィールドは各６０サンプルの４つのサブフィールドに分割するものとしている。伝送すべき信号s(n)が既知であるとき、励起信号x(n)が供給され、サンプリング信号s(n)にできるだけ近い信号p(n)を得ることができる合成フィルタというフィルタ１／Ａ(z)を探索することは、伝送すべき信号を受信すると出力信号ができるだけ白色雑音になる（理想的なコーダでは出力信号が真の白色雑音になる）ような係数を有する分析フィルタというフィルタＡ(z)を探索することと等価であると言える。音声信号を伝送する代わりに、フィルタＡ(z)の係数を伝送すれば後にこの信号を再構成することができる（これらの係数の伝送は予測誤差又は信号自体の伝送より少数のビットを必要とする）。従って、上述したＣＥＬＰコーダは、伝送すべき音声信号を受信し、理想的な場合には白色雑音を出力する短時間分積フィルタを具える。理想的でない場合には、このフィルタは完全に白色雑音でない残差信号e(n)を出力し、この縮退された信号はまだ音声信号の有声音部分の周期性情報を含んでおり、上述した長時間 e(n))。ＣＥＬＰコーダでは、２つのタイプの予測を区別する必要がある。短時間分析という第１のタイプの予測は隣接サンプルの減相関を行い、その目的は、既知信号のフィルタリング後に、白色雑音をできるだけよく近似する残差信号を得るのに最適な入力フィルタの係数を決定することにある。長時間予測という、各サブフィールド毎に行われる第２のタイプの予測（後述する本発明はこの第２のタイプの予測にのみ関連する）は、次式(3)に従って有声音の残差周期性情報を使用する。 p(n)= β.t(n-OLP) (3) この式(3)において、t(.)及びp(.)はそれぞれモデル化すべき信号のサンプル及び予測サンプルを示し、βは利得値であり、ＯＬＰ（Ｏpen Ｌoop Ｐitch）は信号の周期性を表すＯＬＰ周期という量を示す。式(3)により表される予測を行うにはＯＬＰ周期及び利得βを決定すれば十分である。式(3)において、この決定は直接依存の形を取り、利得係数を別にすれば、予測すべきサンプルは既に発生したサンプルのうちの一つに等しいことがわかる。実際には、採用されている原理はもっと一般的なものである。直接依存の値であるこの値に関し、もっと複雑な関係が例えば５の予測次数に対し次式(4)の形に構成される。ＣＥＬＰコーダ、特に上述した標準規格に対する勧告案の目的であるコーダの場合には、このような予測をアダプティブディクショナリというメモリを用いて実現している。このアダプティブディクショナリは各サブフィールドごとに部分的に更新される前サブフィールドの最適励起ベクトル用メモリに基づいて構成される。偶数サブフィールドに対しては、このディクショナリは（５の予測次数の場合）５つのベクトルの３つのグループで構成され、奇数サブフィールドに対しては、５つのベクトルの４つのグループで構成される。５つのベクトルのこれらのグループの各々を以後”Ｖ−ベクトル”という。δは偶数サブフィールドに対し値(-1,0,1)及び奇数サブフィールドに対し(-1,0,1,2)であることが既知であれば、各Ｖ−ベクトルの第１ベクトルの第１成分は過去の（OLP-2+δ）をシフトさせることにより得られる。各Ｖ−ベクトルの他の４つのベクトルは第１ベクトルを用いてサンプルの連続シフトにより得られる。従って、式(4)の対応する実行はサンプルの線形結合による予測であって、この予測においては利得βを変えることにより、例えば上述のＧ．７２３勧告案のえるとともに量ＯＬＰを低い値δで調整することにより、解ベクトルの探索が正確になる。この探索中における可能な最良のベクトル解の選択は、決定プロシーと式(4)の実行により得られる解ベクトルとの差の最小化ステップ（最小二乗誤差に基づく）を含めることにより行う。最後に、ＣＥＬＰコーダは、その入力側に、伝送すべき音声信号を受信し、この初期音声信号の周期性情報を構成する残差信号を出力するのみである分析フィルタを具えるので、この縮退された信号t( n)に対し図２につき後述する予測を行う。従って、アダプティブディクショナリ図２は、Ｇ．７２３勧告案の場合における予測装置の一例を示し、この装置は上述した決定原理を実施する。この装置は前サブフィールドの最適励起に基づいて、即ち前サンプルに対する同一の予測方法の前回の実施中に選択された励起に基づいて構成された励起ベクトルを記憶する回路２０（これは上述したアダプテＬＰ（Ｃlosed Ｌoop Ｐitch）を見つけ出すために、回路２０の後にチャネル３０を接続し、偶数サブフィールドの場合には３つの同一のチャネル３０ａ，３０ｂ，３０ｃを接続し、この場合にはδは、例えば３つの値−１，０及び＋１であるものとする（これは図２に示す場合である）。（奇数サブフィールドの場合には、回路２０の後に４つの同一のチャネルを接続し、この場合にはδは４つの値 −１，０，＋１，＋２であるものとする）。これらのチャネル（即ち記載の実施例では３又は４つのチャネル、このチャネル数は限定要素ではない）の各々は当該チャネルのピッチδに対応するアダプティブディクショナリのＶ−ベクトルを処理し、この目的のために、（先に定義した）合成フィルタのパルス応答を有するフィルタ３１を直列に具える。その後にラ積により与えられる、フィルタ処理されたベクトルと残差ベクトルとの間の５つの相関項（又は換言すれば交差積）と、アダプティブディクショナリの５つのフィルタ処理されたベクトル自体のスカラ積により与えられる５つのエネルギー項と、５つのフィルタ処理されたベクトル間の１０の相関項とにより構成されるらどの程度までモデル化することができるか決定することができる。利得（量子化される）は、種々の利得に対する可能な値を含むメモリ４０又は量子化テーブルにより与えられる（５．３ｋビット／ｓに対し１７０の利得、６．３ｋビット／ｓに対し８５又は１７０の利得を含み、異なる２つの場合に使用する１７０のベクトルは同一である）。利得に関する情報はこの量子化テーブル内に、次のように定義された２０の項：５つの利得値、これらの利得の二乗に等しい５つの値、これらの５つの利得値の交差積に対応する１０の値を有するベクトルの形で与えられる。 δの各値につき（即ち、上述した実施例では３又は４つのチャネルの各々において３つの値δ＝−１，０，＋１又は４つの値δ＝−１，０，＋１，＋２につき）実行すべき、次式(5)に従う予測誤差の最小化：（例えば６０サンプルのサブフィールドの対しｎ＝０〜５９、及びf(.)＝合成フィルタによりフィルタ処理された過去の最適励起のサンプル）を回路３３においーブルのベクトルとのスカラ積を最大にするベクトルである点に注意されたい。回路３３の出力側において、回路５０がこれらの３つ（又は４つ）の回路の出力に得られる３つ又は４つのスカラ積から最大のスカラ積を選択し、この最大スカラ積に対応するステップサイズδの最適値（メモリ１１０に記憶される）及び利用される３つ（又は４つ）の値の一つであり、こうして選択された値がチャネルと同数（３又は４つ）の入力端子を有するスイッチ６０を制御する。フィルタ３１の出力側に配置されたこのスイッチは探索解ベクトルの最良の表現を構成するフィルタ処理されたＶ−ベクトルを選択することができる。この選択したフィルタ処理されたベクトルは次に増幅器７０の入力端子に供給され、選択回路５０の出力側に設けられたメモリ８０に回路５０により供給され入力端子に供給され、この減算器はその正入力端子にＣＥＬＰコーダの分析フィこのようなスピーチコーダ（文書Ｇ．７２３に記載されている）により得られる品質は、アダプティブディクショナリを構成する回路２０を用いて実行されるこの閉ループ長時間相関の分析の精度によりほぼ決まる。しかしながら、この品質は、コーダの実現に含まれる一連の演算から明らかなように、構成が極めて複雑になるという犠牲を払ってのみ得られるものである。本発明の第１の目的は、上述した品質にほぼ等しい品質を有する一層簡単な予測方法を提供することにある。この目的のために、本発明は、頭書に記載の予測方法において、当該方法は、各サブフィールドに対し、 (1) ステップサイズδの種々の値に対し、前記周期性情報を決定し、前記先にズの対応する値を選択するために、δの各値に対し次のサブステップ： (a) フィルタリングサブステップと、 (b) フィルタ処理されたベクトルと残差ベクトルとの間の相関の項、フィルタ処理されたベクトルのエネルギーの項及びフィルタ処理されたベクトル間の相 δ）_initを発生させるサブステップと、を直列に実施するステップと、なるチャネルに対応するステップサイズδの前記最適値を選択し、このδの最適を選択するステップと、 (3) 前記先に選択されたδの最適値に対応する前サブフィールドのフィルタ処理された励起ベクトルと、前記選択された最適利得ベクトルとに基づいて前記予測残差ベクトル信号又は予測残差ベクトルを計算するステップ、とを具えることを特徴とする。本発明の他の目的はほぼ等しい品質を維持しながら低減された複雑度を有する上述したスピーチコーダに類似のスピーチコーダを提供することにある。この目的のために、本発明は、頭書に記載のコーダにおいて、予測装置が、 (A) 前サブフィールドに対する予測最適励起ベクトルを記憶する、アダプティブディクショナリという記憶回路と、する複数のチャネルであって、各チャネルが所定値のステップサイズδに対し前記周期性情報を決定し、各チャネルが、 (a) 前記分析フィルタに基づいて構成された合成フィルタのインパルス応答に等しいインパルス応答を有するインパルス応答フィルタと、 (b) 前記アダプティブディクショナリから到来するフィルタ処理されたベクトルと前記残差ベクトル又は目標ベクトルとの相関の項、フィルタ処理されたベクトルのエネルギーの項及びフィルタ処理されたベクトル間の相関の項を計算する回路と、 (c) チャネル毎に、初期利得ベクトルの成分、該ベクトルの成分の二乗値及選択する回路と、を直列に具える複数のチャネルと、 (C) 前記ステップサイズの最適値を計算し、記憶するサブアセンブリと、 (D) 候補利得ベクトルの成分とそれらの二乗値及びそれらの交差積を含む、量子化テーブルというメモリと、 (E) 前記最適値のステップサイズと関連して、フィルタ処理されたベクトルと残差ベクトルとのスカラ積により与えられる相関項からなる対応する最適ベクトネルギー項と、フィルタ処理されたベクトルのスカラ交差積により与えられる相関項とを選択するスイッチと、 (F) 前記量子化テーブル内の各候補利得ベクトルを選択する回路と、 (G) このように選択された利得ベクトルを記憶するメモリと、 (H) このメモリの出力側にあって、前記最適ステップサイズ値に従ってスイッチにより選択されたフィルタ出力信号を増幅する増幅器と、により前記予測誤差を推定する減算器と、を具えることを特徴とする。文書Ｇ．７２３の場合には、量子化テーブル内の利得の軌道又は走査が極めて複雑であり、これはテーブル走査が２４０サンプルのフィールド毎に１４回行われるためであるが、本発明による解決方法によれば、品質を殆ど低下することなくもっと少ない走査（この文書に従うコーダの場合には４回）をカバーすることができる。上述の如き提案の基本思想は、予測子が減相関である、即ちフィルタ処理されたベクトル間の先に決定された相関が零であるという仮説の簡単化を行うことにより、各サブフィールド及び各ステップサイズδに対応する各チャネル要なしに決定することができるという点にある。当該チャネルに対するこのベクトルの成分はフィルタ処理されたベクトルと目標ベクトルとの間の相関の項と先（次善値）を決定することができ、サブフィールド毎に１回の量子化テーブルの走査を必要とするのみとすることができる。予測誤差を最小にするステップサイに関するこの式の微分係数を相殺するベクトルであるという上述の説明から直接得られ、チャネルの出力端の計算サブアセンブリにより各サブフィールドに対し（偶数サブフィールドの場合）又は４つのスカラ積（奇数サブフィールドの場合）のうちの一つを最大にするものであり、このスカラ積は各チャネル内に設けら乗及びこれらの成分の１０の交差積を有するベクトルである）。各サブフィールドに対する最適利得ベクトルは量子化テーブルの出力端に設けられた回路により得られ、この回路は計算されたステップサイズの最適値に対応するベクトルV(δ ）と前記テーブルの各ベクトル（ここではビットレートに応じて１７０又は８５ベクトル）とのスカラ積の最大値を探索する。この最適利得ベクトルの決定はサブフィールド毎に１回、フィールド毎に４回の量子化テーブルの走査を必要とするのみであり（これまでは偶数サブフィールドであるか奇数サブフィールドであるかに応じてサブフィールド毎に３回又は４回、即ちフィールド毎に１４回の走査を必要とした）、複雑度の著しい低減が得られる。本発明のこれらの特徴及び他の特徴は以下に記載する実施例の説明から明らかになる。図面において、図１は時間の関数としての有声音の振幅の一例を示し、図２及び図３はそれぞれ前記文書Ｇ．７２３の場合及び本発明の場合において閉ループ内で音声周期を予測する装置の構造を示す。図３に示す本発明による予測装置は図２に示すものと共通の素子、即ち候補励起ベクトルを記憶する回路（又はアダプティブディクショナリ）、フィルタ３１、相関項及びエネルギー項を計算する回路３２、メモリ４０（又は量子化テーブル）、スイッチ６０、メモリ８０、減算器９０及びメモリ１１０を有する。図３に示す実施例によれば次のような簡単化が実現される。各チャネル１３０によりδの初期値を決定することができ、この決定はサブフィールド毎に１回の量子化テーブル（メモリ４０）の走査を必要としない（この選択はチャネル数に応じて３又は４つの予選択回路１０１で行われる）。このように選択された初期利得ベクトルに対し最適ステップサイズδの選択が計算回路１０２において行われ、このδ値がメモリ１１０に記憶され、スイッチ１６１によりこの値に対応する計算回路３２の出力の一つが選択される。次に最適利得ベクトルが選択回路１５０により探索され、このように選択されたベクトルがメモリ８０に記憶される。フィルタ３１の出力側に設けられた、メモリ１１０により供給されるδの値により制御されるスイッチ６０が選択したフィルタ処理されたＶ−ベクトルを増幅器７０に供給する。このように増幅された最適なフィルタ処理Ｖ−ベクトルが予このように実現される簡単化は、２０人の異なる話者により与えられる１２秒の２０の音声信号に基づいて試験したところ、前記文書Ｇ．７２３の場合に得られる品質を平均０．２ｄＢ低減するだけであった。信号体雑音比（平均Ｓ／Ｎ比）のこの低下は知覚し得ないものである。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＪＰ，ＵＳ

Claims

【特許請求の範囲】１．ＣＥＬＰスピーチコーダにおいて短時間分析の残差ベクトル信号又は残差ベクトル、即ち符号化すべき初期音声信号に存在する周期性情報を含む信号を予測する方法であって、前記音声信号を連続するサブフィールドに分割し、前記予測を前サブフィールドに対し予測された最適励起に基づいて行う予測方法において、当該方法は、各サブフィールドに対し、 (1) ステップサイズδの種々の値に対し、前記周期性情報を決定し、前記先サイズの対応する値を選択するために、δの各値に対し次のサブステップ： (a) フィルタリングサブステップと、 (b) フィルタ処理されたベクトルと残差ベクトルとの間の相関の項、フィルタ処理されたベクトルのエネルギーの項及びフィルタ処理されたベクトル間 _T（δ）_initを発生させるサブステップと、を直列に実施するステップと、になるチャネルに対応する前記ステップサイズδの最適値を選択し、このδのスカラ積のうち最大になる該テーブル内のベクトルである前記最適利得ベクト (3) 前記先に選択されたδの最適値に対応する前サブフィールドのフィルタ処理された励起ベクトルと、前記選択された最適利得ベクトルとに基づいて前記予測残差ベクトル信号又は予測残差ベクトルを計算するステップ、とを具えることを特徴とする予測方法。２．符号化すべき初期音声信号を受信し、該音声信号を連続するサブフィールド力する短時間分析フィルタと、この残差信号を予測する装置と、この残差ベク路とを具えるＣＥＬＰスピーチコーダにおいて、前記予測装置が、 (A) 前サブフィールドに対する予測最適励起ベクトルを記憶する、アダプティブディクショナリという記憶回路と、算する複数のチャネルであって、各チャネルが所定値のステップサイズδに対し前記周期性情報を決定し、各チャネルが、 (a) 前記分析フィルタに基づいて構成された合成フィルタのインパルス応答に等しいインパルス応答を有するインパルス応答フィルタと、 (b) 前記アダプティブディクショナリから到来するフィルタ処理されたベクトルと前記残差ベクトル又は目標ベクトルとの相関の項、フィルタ処理されたベクトルのエネルギーの項及びフィルタ処理されたベクトル間の相関の項を計算する回路と、（δ）_initを予め選択する回路と、を直列に具える複数のチャネルと、 (C) 前記ステップサイズの最適値を計算し、記憶するサブアセンブリと、 (D) 候補利得ベクトルの成分とそれらの二乗値及びそれらの交差積を含む、量子化テーブルというメモリと、 (E) 前記最適値のステップサイズと関連して、フィルタ処理されたベクトルと残差ベクトルとのスカラ積により与えられる相関項からなる対応する最適ベれるエネルギー項と、フィルタ処理されたベクトルのスカラ交差積により与えられる相関項とを選択するスイッチと、 (F) 前記量子化テーブル内の各候補利得ベクトルを選択する回路と、 (G) このように選択された利得ベクトルを記憶するメモリと、 (H) このメモリの出力側にあって、前記最適ステップサイズ値に従ってスイッチにより選択されたフィルタ出力信号を増幅する増幅器と、差により前記予測誤差を推定する減算器と、を具えることを特徴とするＣＥＬＰスピーチコーダ。