JPH09506182A

JPH09506182A - 符号駆動線形予測を備える適応音声符号化器

Info

Publication number: JPH09506182A
Application number: JP7507532A
Authority: JP
Inventors: チャットウォール，ハープリット・エス
Original assignee: パシフィック・コミュニケーション・サイエンシーズ・インコーポレイテッド
Priority date: 1993-08-27
Filing date: 1993-08-27
Publication date: 1997-06-17
Also published as: AU5095193A; WO1995006310A1; EP0803117A4; EP0803117A1

Abstract

(57)【要約】符号化されるべき音声は、バッファ（４０）に記憶されて、線形予測符号化（４２）を用いてスペクトル成分と、長期予測子（４６）を用いてピッチ駆動とに分けられる。駆動信号の符号化を実施するために３つのタイプの探索が行なわれる。バイパルス探索（５０）はピッチおよび雑音駆動を表わす。スクランブリングされる探索（５２）はピッチおよび雑音（バイパルス）駆動のアダマール変換を用いる。単一パルス探索（５４）はピッチ駆動を表わす。この３つの探索は各表現に対して最良の一致を見つけ、その３つすべてを比較して（１００）最小誤差を有するものをとる。スペクトル成分、ピッチ、および符号化された駆動は共にフォーマット化されて（４４）バッファ（１１０）を通して送信される。

Description

【発明の詳細な説明】符号駆動線形予測を備える適応音声符号化器発明の分野この発明は音声符号化の分野に関するものであり、より特定的には、符号駆動線形予測（ＣＥＬＰ）技術が利用される、音声信号の適応符号化の分野における改良に関するものである。発明の背景Ｔ１方式が導入されたのは１９６２年であるが、その頃から合衆国にはディジタル通信キャリア方式がある。この方式は、１．５４４Ｍｂ／ｓの全体速度で送信される２４音声チャネルディジタル信号を用いる。それまでのアナログ方式に対するコスト上の利点から、Ｔ１方式は広く展開された。Ｔ１方式における個々の音声チャネルは、通常は、約３００〜３４００Ｈｚの周波数範囲に音声信号を帯域制限し、制限された信号を８ｋＨｚのレートでサンプリングし、その後にそのサンプリングされた信号を８ビット対数量子化器で符号化することとによって発生された。結果として生じたディジタル音声信号は、６４ｋｂ／ｓの信号であった。Ｔ１方式では、２４の個々のディジタル音声信号は１つのデータストリームに多重化された。全体のデータ送信速度が１．５４４Ｍｂ／ｓに固定されるため、６４ｋｂ／ｓの音声信号が用いられる場合には、Ｔ１方式は２４の音声チャネルに制限される。音声信号またはチャネルの数を増加させる一方で約１．５４４Ｍｂ／ｓのシステム送信速度を維持するためには、個々の信号の送信速度が６４ｋｂ／ｓから幾分遅い速度に減じられなければならない。典型的なＴ１音声信号発生機構において、サンプリング速度の低減または量子化器のサイズの低減のいずれかによって送信速度を下げることに伴う問題は、元の音声の正確な再生に必要不可欠な音声信号のある部分が失われるという点である。より遅いビット速度での送信のためにアナログ音声信号をディジタル音声信号に変換するために、たとえば、変換符号化（ＴＣ）、適応変換符号化（ＡＴＣ）、線形予測符号化（ＬＰＣ）および符号駆動線形予測（ＣＥＬＰ）符号化等のいくつかの代替的方法が提案されてきた。ＡＴＣでは、１２〜１６ｋｂ／ｓ程度の低さのビット速度が可能であると推定される。ＣＥＬＰ符号化では、４．８ｋｂ／ｓ程度の低さのビット速度が可能であると推定される。事実上すべての音声信号符号化技術において、音声信号は音声サンプルのシーケンシャルなブロックに分けられる。ＴＣおよびＡＴＣでは、各ブロック内のサンプルは、ベクトル状に配列され、時間ドメインから周波数ドメインのような交代ドメインに変換される。ＬＰＣおよびＣＥＬＰ符号化では、音声サンプルの各ブロックは、そのブロックに対する線形予測係数および長期予測子（ＬＴＰ）のような他の情報を決定するために分析される。線形予測係数は、音声信号サンプルの特定のブロックに関連付けられるスペクトル包絡のある局面を反映する等式要素である。このようなスペクトル情報は、音声の動的特性、つまりホルマントを表わす。音声は、周期的（有声音）、非周期的（無声音）、または混合したもの（たとえば有声摩擦音）のいずれかである駆動信号を発生することによって生ずる。駆動信号の周期的成分はピッチとして知られる。発声中、駆動信号は、口、顎、唇、鼻孔等の位置によって決定される声道フィルタによってフィルタリングされる。このフィルタは、聞こえる音声の質を決定する共振またはホルマントを有する。声道フィルタは駆動信号に包絡を与える。この包絡はフィルタホルマントを含むため、それはホルマント包絡またはスペクトル包絡として知られる。線形予測係数に反映されるのはこのスペクトル包絡である。長期予測子は、音声信号の冗長ピッチ構造を反映するフィルタである。このような構造は、各ブロックに対してＬＴＰ値を評価してそれらの値を現在の信号値から減算することによって取り除かれる。このような情報を取り除くことによって、音声信号は、より少ないビットを用いて、ディジタル信号に変換できる。ＬＴＰ値は、別に送信されて、受信機で残りの音声信号に加え戻される。ＬＰＣ技術を用いて音声信号がどのようにディジタル形式に還元され変換されるかを理解するために、ＬＰＣボコーダによる合成または再生された音声信号の発生を考える。一般的な、先行技術のＬＰＣボコーダが図１に示される。図示される装置は、送信されるディジタル信号を合成された音声信号、つまり合成された音声サンプルのブロックに変換する。基本的に、サンプルの所与のブロックに対して決定されたＬＰＣを用いる合成フィルタは、そのＬＰＣに関して駆動信号をフィルタリングすることによって、合成された音声出力を生ずる。合成フィルタ係数（ＬＰＣ）および駆動信号の両方は、各サンプルブロックまたはフレームに対して（つまり２０〜３０ミリ秒毎に）更新される。図示されるように、駆動信号は、周期的駆動信号または雑音駆動信号のいずれかであり得る。ＬＰＣボコーダにより生ずる合成された音声は以下の３つの基本要素に分けられ得る。（１）たとえば、１つの母音を別の母音と区別し、合成フィルタ内のＬＰＣにより与えられるスペクトル情報。（２）有声音（たとえば母音およびｚ、ｒ、ｌ、ｗ、ｖ、ｎのような音）の場合、音声信号は明確なピッチ周期（または周期性）を有し、これは（ＬＴＰから決定される）ピッチ周期の間隔をあけたパルスから大部分構成される周期的駆動信号によって与えられる。（３）無声音（たとえばｔ、ｐ、ｓ、ｆ、ｈ）の場合、音声信号は、ランダムな雑音にはるかにより近く、周期性を全く有さず、これは雑音駆動信号によって与えられる。図１に示されるように、合成フィルタにどの形式の駆動信号が与えられるかをスイッチが制御する。利得が、出力音声の実際のボリュームレベルを制御する。駆動（２）および（３）の両方のタイプはしたがって時間ドメインにおいては非常に異なる（一方は等間隔のパルスからなり、他方は雑音のようである）が、両方とも周波数ドメインにおいては平坦なスペクトルという共通の特性を有する。正しいスペクトルの形状が、ＬＰＣによる合成の出力で与えられる。なお、ＬＰＣボコーダの使用によると、音声シンセサイザに対してＬＰＣおよび駆動情報、つまりスイッチが音声シンセサイザに周期的駆動を与えるか雑音のような駆動を与えるか、ということを伝送する必要があるのみである。この結果、低減されたビット速度を用いて、ＬＰＣボコーダにおいて処理される音声信号を送信することができる。しかしながら、一般的なＬＰＣボコーダのアプローチには、音声再生の品質、つまり電話機の受話器で聞こえる音声に影響するいくつかの欠点がある。１つの欠点は、パルスのような駆動または雑音のような駆動の間で選択を行なう必要性があり、その決定は、そのときの入力音声の特性に基づいてフレーム毎になされるということである。大きく発声しない音声（または多くのバックグラウンド雑音がある状態での音声）の場合、このことは、２つのタイプの駆動信号の間における切換を何度も生じさせて、音声の品質を深刻なほど劣化させ得る。ＣＥＬＰボコーダは、周期的信号および雑音のような信号の両方を同じときにＯＮのままにすることによってこの問題を克服する。これらの信号の各々が合成フィルタに与えるための駆動信号（ｅ（ｎ））をなす度合いは、２つの駆動の各々に割当てられる別々の利得によって決定される。したがって、 e(ｎ)＝β・p(ｎ)＋ｇ・c(ｎ) （1）であり、ここで、ｐ（ｎ）＝パルスのような周期的成分ｃ（ｎ）＝雑音のような成分 β＝周期的成分に対する利得ｇ＝雑音成分に対する利得である。ｇ＝０のとき、駆動信号は全くパルスのようになり、β＝０のとき、駆動信号は全く雑音のようになる。利得が両方とも０でないとき、駆動はこの２つを混合したものとなる。ＣＥＬＰボコーダと単純なＬＰＣボコーダとの間において、他の１つの違いが注目される。ＬＰＣボコーダにおける符号化動作中、入力音声はステップ毎の態様で分析されて、入力音声のそのピッチ周期に対する最もあり得そうな値が何であるかを決定する。注目すべき重要な点は、最良のピッチ周期についてのこの決定が最終的なものであるという点である。可能性のある他のピッチ周期に対する比較は全くなされない。ＣＥＬＰボコーダでは、周期的駆動成分またはピッチに対するアプローチははるかに厳密である。考えられ得るピッチ周期の集合（男性、女性または子供であれすべての話者に対して考えられ得るピッチの範囲をカバーする）から、すべての考えられ得る値が順に試され、その値を仮定して音声が合成される。実際の音声と合成された音声との間の誤差が計算されて、最小誤差を与えるピッチ周期が選択される。各選択に対して誤差が計算されて、最適ピッチ値を選択するプロセスの判断部に送り返されるため、この判断手順は閉ループアプローチである。対照的に、従来のＬＰＣボコーダは、誤差が明確には計算されず、可能性の集合からどのピッチ周期を選択するかについての判断が全くなされない、開ループアプローチを用いる。駆動信号の雑音成分についても考える。ＣＥＬＰボコーダは、その中に、各々が１フレーム長である数百の（または恐らくは数千の）雑音のような信号を記憶している。ＣＥＬＰボコーダは、これらの雑音のような信号の各々を順に用いて出力音声を合成して、入力と合成音声信号との間において最小誤差を生ずるものを選択するので、つまりこれは別の閉ループ手順である。この雑音のような信号の記憶された集合は符号帳として知られており、符号帳信号の各々を順に探索して最良のものを見つけるというプロセスは符号帳探索として知られている。閉ループＣＥＬＰアプローチの大きな利点は、探索の終りには、所与の入力音声信号に対して最良の考えられ得る値が選択されており、それが音声の品質における大きな改善をもたらすという点である。ＣＥＬＰ符号化技術の使用は、ＬＰＣ値、ＬＴＰ値および選択された符号帳信号のアドレスのみの送信を要するということが注目される。駆動信号を送信する必要はない。この結果、ＣＥＬＰ符号化技術は、Ｔ１方式において音声チャネル数を増加させるのに特に望ましい。現在のＣＥＬＰ符号化技術に伴なう主な不利な点は、必要とされる計算力の量である。ＣＥＬＰ符号化では、符号帳エントリおよび考えられ得るピッチ値の大きな集合を探索することが必要である。受信機が単に図２に示される単純な合成構造からなるため、従来のＣＥＬＰアプローチの非常な複雑さに影響されるのは送信機のみである。この発明は、従来の符号帳探索を行なう必要性を克服する。このような改良点の重要性を理解するために、従来のＣＥＬＰ符号化技術を再考することが役に立つ。一般的なＣＥＬＰ音声信号変換動作が図３に示される。図示されるように、変換プロセスの順序は以下のとおりである。（ｉ）ＬＰＣ係数を計算し、（ii）ＬＰＣ係数を用いてＬＴＰパラメータ（つまり、最良のピッチ周期と、対応する利得β）を決定し、（iii）符号帳探索においてＬＰＣ係数およびＬＴＰパラメータを用いて符号帳パラメータ（つまり、最良の符号語ｃ（ｎ）と、対応する利得ｇ）を決定する。この発明において、改良されているのはこの最終プロセスである。符号帳探索法は、各符号帳ベクトル（ｃ（ｎ））を順に採り、それを合成フィルタに通し、出力信号を入力音声信号と比較し、誤差を最小限にすることからなる。ある前処理ステップが必要とされる。任意の特定のフレームの開始で、ＬＴＰ（ｐ（ｎ））および符号帳（ｃ（ｎ））に関連付けられた駆動成分がさらに計算される。しかしながら、たとえそのフレーム全体に対してこれらの信号の両方が完全に０であったとしても、合成フィルタはそれでもそれに関連する何らかの記憶を有し、それによって、入力が全くなくても現在のフレームに対して出力を生ずる。合成フィルタの記憶によるこの出力のフレームはリンギングベクトルｒ（ｎ）として知られている。数学的には、このリンギングベクトルは以下のフィルタリング演算によって表わすことができ、ここで、｛α_i(i＝1〜ｐ)｝はＬＰＣ係数の集合である。これがたとえ駆動信号（ｅ（ｎ））が０であっても発生されるであろう出力合成音声信号（ｓ′（ｎ））の成分である。しかしながら、ｅ（ｎ）をＬＰＣ合成フィルタに通すことによって、以下のように表わされ得る信号ｙ（ｎ）が与えられ、したがって、このｅ（ｎ）に基づく信号は、リンギングベクトルと共に、合成された音声信号 s′(ｎ)＝r(ｎ)＋y(ｎ) （4）を生ずる。上の等式またはディジタルフィルタリングの式はやや煩雑と思われる。ＣＥＬＰ符号化では、種々の処理演算を行列形式で表わすことが望ましい。まず、合成フィルタについて考えられたい。フィルタのインパルス応答は、時間０での値＋１のパルスを有する入力信号から得られる出力として定義される。ここで、ＬＰＣ合成フィルタがインパルス応答ａ（ｎ）（ｎは０〜（Ｎ−１）の範囲における音声サンプルを表わし、Ｎはフレームまたはブロックの長さである。）を有する場合、ＬＰＣ合成フィルタのインパルス応答を表わす（Ｎ×Ｎ）行列を以下のように作成できる。符号帳信号ｃ（ｎ）は、行列形式で、（Ｎ×１）ベクトルｃで表わされ得る。このベクトルは、行列形式以外は、ｃ（ｎ）と全く同一の要素を有する。ＬＰＣ合成フィルタＡのインパルス応答によってｃをフィルタリングする演算は、行列積Ａcで表わされ得る。この積は、 βが０に等しいときの等式（３）の信号ｙ（ｎ）と同じ結果を生ずる。合成された出力音声ベクトルｓ′は、行列形式で、 s′＝ｒ＋Ａe として表わされ得、ここで、ｒおよびｅは、それぞれ、信号ｒ（ｎ）、ｅ（ｎ）（リンギング信号および駆動信号）の（Ｎ×１）ベクトル表現である。結果は等式（４）と同じであるが、ここでは行列形式である。等式（１）から、合成された音声信号は行列形式で、 s′＝ｒ＋Ａ(β.p＋ｇ.c) ＝ｒ＋βＡp＋ｇＡc （6）と書直すことができる。 s′は実際の入力音声ベクトルｓに対する近似値であるたと書直すことができる。上述の等式５、６および７の実現を示す、従来の、先行技術の符号帳探索が図４に示される。まず、入力音声信号はリンギングベクトルｒを取り除かれる。次に、ＬＴＰベクトルｐ（つまり、駆動のピッチまたは周期的成分ｐ（ｎ））がＬＰＣ合成フィルタによってフィルタリングされてＡpにより表わされ、次いで減算される。結果として生じた信号は、項ｇＡcにより近似される、いわゆる目標ベクトルｘである。実際の符号帳探索中、計算されなければならない２つの重要な変数（Ｃ_i，Ｇ_i ）がある。これらは行列で、Ｃ_i＝c^tＡ^tx Ｇ_i＝c^tＡ^tＡc （8）で与えられ、ここで、Ａ^tは、ＬＰＣ合成フィルタのインパルス応答行列Ａの転置である。等式（８）を解くと、Ｃ_i、Ｇ_iの両方がスカラー値である（つまり、単なる数であってベクトルではない）ことが明らかとなる。これらの２つの数は、共に、どれが最良の符号ベクトルでありさらには最良の利得ｇであるかを決定するので、重要である。前に述べたように、符号帳には何百もの考えられ得るベクトルｃがある。この結果、各考えられ得る符号帳ベクトルに対してＡcまたはc^tＡ^tを形成しないようにするのが望ましい。このような結果は、ｘを目標ベクトルとし、ＡをＬＰＣ合成フィルタのインパルス応答行列として、ｄ＝Ａ^tx およびＦ＝Ａ^tＡ（9）となるように、２つの変数、（Ｎ×１）ベクトルｄおよび（Ｎ×Ｎ）行列Ｆを符号帳探索前に予め計算することによって達成される。ｄを予め形成するプロセスは「後ろ向きフィルタリング」として知られている。このような後ろ向きフィルタリングの結果、符号帳探索中は、以下の演算が行なわれるだけでよい：Ｃ_i＝c^td Ｇ_i＝c^tＦc (10) 従来は、選択された符号帳ベクトルは、に対する最も大きな値に関連付けられるベクトルである。所与の符号帳ベクトルに対する正しい利得ｇは、によって与えられる。残念なことに、この簡略化された符号帳探索でさえ、過剰な量の時間または過剰な量の処理力のいずれかを必要とし得る。ＣＥＬＰボコーダの一例が、ジャーソン(Gerson)の米国特許第４，８１７，１５７号に示されている。駆動符号ベクトルを有する符号帳を用いる音声符号化器のための駆動ベクトル発生および探索技術が説明されている。基底ベクトルの集合が、駆動信号符号語と共に用いられて、駆動ベクトルの符号帳を発生するといわれる。符号帳は、符号ベクトルが基底ベクトルからどのように発生されるかについての知識を用いて探索される。この特許の技術を実施することによって、複雑さが約１０倍低減されるということが主張されている。しかしながら、この技術は符号帳ベクトルの記憶を依然として要する。加えて、符号帳探索は各ベクトルに対し、以下のステップを含む。すなわち、ベクトルをスケーリングするステップと、そのベクトルを長期予測子成分でフィルタリングしてピッチ情報をそのベクトルに加えるステップと、そのベクトルを短期予測子でフィルタリングしてスペクトル情報を加えるステップと、スケーリングされ二重にフィルタリングされたベクトルを元の音声信号から減算するステップと、その答を分析して最良の符号帳ベクトルが選択されているかどうかを判断するステップとを含む。したがって、相対的に大きな計算力を必要とすることなしに、適当な符号帳ベクトルｃを求めて符号帳を速やかに探索することのできるＣＥＬＰ符号化器が今も要求されている。発明の概要送信のためにアナログ音声信号がディジタル音声信号に変換される音声符号化のための装置および方法において、先行技術の問題は克服され、この発明の利点が達成される。ＣＥＬＰ技術を利用する音声符号化器は、音声信号からスペクトル情報をフィルタリングして出すための第１のフィルタを含む。スペクトル情報は伝送のために与えられる。第２のフィルタが音声信号からピッチ情報をフィルタリングして出すために設けられ、このようなピッチ情報も伝送のために与えられる。符号ベクトル発生器は、１つの実施例において、音声信号を表わすバイパルス符号ベクトルの特性を決定する。この実施例では、第１のフィルタのインパルス応答は符号ベクトル特性を決定するために先端が切捨てられる。この実施例では、符号ベクトルを決定するために用いられる従来の分数に関連した分子のみの検索を行なうことによって符号ベクトル特性を決定することがさらに好ましい。別の実施例では、符号ベクトル発生器は、符号ベクトルの可能性をパルスのような音声を表わすものから雑音のような音声を表わすものに変換するための変換器を含む。この変換はアダマール変換であることが特に好ましい。変換された符号ベクトルをスクランブルしてシーケンシ特性を変更することがさらに好ましい。さらに別の実施例では、バイパルス符号ベクトル発生器およびスクランブルされた符号ベクトル発生器が、１つのパルス符号ベクトル発生器と組合される。このような実施例では、３つの符号帳発生器によって決定された特性を評価し、最良の符号帳ベクトルを与えるものの出力を選択するための比較器を含むことが好ましい。図面の簡単な説明この発明のこれらのおよび他の目的ならびに利点は、以下の図面と関連させると、以下の詳細な説明からより明らかとなり、図１は、先行技術の、一般的なＬＰＣボコーダのブロック図であり、図２は、従来技術の、一般的なＣＥＬＰボコーダー受信機のブロック図であり、図３は、従来技術の、一般的なＣＥＬＰボコーダー送信機のブロック図であり、図４は、従来技術のＣＥＬＰ符号帳探索のフローチャートであり、図５は、この発明に従う適応音声符号化器の概略図であり、図６は、送信の前に、図５に示される適応符号化器において行なわれる演算の一般的なフローチャートであり、図７は、この発明に従う符号帳探索技術のフローチャートであり、図８は、この発明に従う別の符号帳探索技術のフローチャートであり、図９は、音声合成を行なうために、受信の後の、図５に示される適応変換符号化器において行なわれる動作のフローチャートである。好ましい実施例の詳細な説明図面と関連付けてより詳細に説明するように、この発明は速度が大幅に減じられている適応音声符号化のための新規な装置および方法として実施される。包括的には、この発明は符号帳探索を行なうためのより効率的な方法を提供することにより、低い伝送速度に対してＣＥＬＰ符号化を強化する。この発明に従って構成される適応ＣＥＬＰ符号化器は図５に示されており一般的に１０として参照する。符号化器１０の本体はディジタル信号プロセッサ１２であり、好ましい実施例ではテキサス州ヒューストン(Houston)のテキサスインスツルメント社（Texas Instruments Inc.）により製造および販売されているＴＭＳ３２０Ｃ５１ディジタル信号プロセッサである。こうしたプロセッサはワード長が１６ビットのパルス符号変調信号を処理することができる。プロセッサ１２は３つの主要なバスネットワーク、すなわち直列ポートバス１４、アドレスバス１６、およびデータバス１８に接続されている。この発明に従うＣＥＬＰ符号化方法を実施するためにプロセッサ１２が利用するプログラミングをストアするためのプログラムメモリ２０が設けられている。そうしたプログラミングについては図６から図９を参照してより詳細に説明する。プログラムメモリ２０はプロセッサ１２の仕様に見合う十分な速度を有するならば従来の設計による如何なるものでもよい。なお、好ましい実施例のプロセッサ（ＴＭＳ３２０Ｃ５１）は内部メモリを備える。プロセッサ１２の動作中必要かもしれないデータのストアのためにデータメモリ２２が設けられる。従来のクロック信号発生回路（図示せず）によってクロック信号がクロック入力２４に与えられる。好ましい実施例では、入力２４に与えられるクロック信号は２０ＭＨｚのクロック信号である。プロセッサ１２が最初に活性化されるときなど適切なときにプロセッサ１２をリセットするためにリセット入力２６もまた与えられる。選択したプロセッサが要求する仕様を信号が満たす限りは入力２６にそのような信号を与えるためにどのような従来の回路を使用してもよい。プロセッサ１２は２つの方法で送受信通信信号に接続される。第１に、本発明に従い構成されるＣＥＬＰ符号化器と通信するとき、プロセッサ１２は直列ポートバス１４を介して信号を送受信するように接続される。バス１４と圧縮された音声データストリームとにインタフェースをするためにチャネルインタフェース２８が設けられる。インタフェース２８は、予め定められた伝送速度で動作しているデータストリームとの関連でデータの送受信を行なうことができるインタフェースなら既知のどのようなものでもよい。第２に、既存の６４ｋｂ／ｓチャネルまたはアナログ装置と通信する場合、プロセッサ１２はデータバス１８を介して信号の送受信を行なうように接続される。入力３２に現れる個々の６４ｋｂ／ｓチャネルを、直列フォーマットから並列フォーマットに変換してバス１８に与えるためのコンバータ３０が設けられる。プロセッサ１２が利用するタイプの信号に対して用いることができる既知のコーデックおよび直列／並列装置を利用してこうした変換を行なうことができることが理解されるだろう。好ましい実施例では、プロセッサ１２はバス１８上で並列の１６ビット信号を送受信する。バス１８に与えられるデータをさらに同期化するために、割込信号が入力３４でプロセッサ１２に与えられる。アナログ信号を受取るときは、アナログインタフェース３６が予め定められた速度で係る信号をサンプリングすることによりアナログ信号を変換してコンバータ３０に与える役割を果たす。送信の際には、インタフェース３６はコンバータ３０からのサンプリングされた信号を連続信号に変換する。図６−９を参照して、図５に示される構成要素との関連で使用した場合に新規のＣＥＬＰ符号化器をもたらすプログラミングについて説明する。この発明のＣＥＬＰ技術に従い通信信号を伝送するための適応音声符号化が図６に示されている。符号化され送信されるべき通信信号がバス１８に現れ、入力バッファ４０に与えられる。このような通信信号は各サンプルを１６ビットＰＣＭで表わしたものからなるサンプリングされた信号であり、この場合サンプリングは８ｋＨｚの周波数で行なわれる。この発明を説明するために、８ｋＨｚでサンプリングされる音声信号が伝送のために符号化されるものと仮定する。バッファ４０は予め定められた数のサンプルをサンプルブロックに累積する。４２で音声サンプルの各ブロックに対するＬＰＣが決定される。ＬＰＣを決定する方法は、たとえば本明細書中に引用により援用するウィルソン(Wilson)らによる米国特許第5,012,517号において述べられるような如何なる所望の方法とすることもできる。なお、引用する米国特許は適応変換符号化に関するが、ＬＰＣを決定するためのものとして説明されている方法はこの発明にも適用可能である。決定されたＬＰＣは４４で補足的情報として伝送するためのフォーマットとされる。決定したＬＰＣはまた４６でのＬＴＰ処理、特にＬＰＣ合成フィルタを形成するために与えられる。ＬＴＰが４６で音声サンプルの各ブロックに対して決定される。前述したような既知の技術を用いて、周期性またはピッチに基づいた情報を決定できる。ＬＴＰフィルタを導入するための基本的な前提条件は、正確なピッチまたは基本的な周波数の評価の計算である。決定したＬＴＰもまた、補足的な情報としての伝送のためのフォーマットとされる。なお、ＬＴＰを４４で決定する際、等式（７）に従い、合成フィルタに関連するリンギングベクトルが音声信号から取り除かれ、ベクトルｐ（ＬＴＰピッチ情報を表わすもの）が音声信号から取り除かれ、そうすることによりターゲットベクトルｘを形成する。このようにして変更された音声信号はこの後、この発明に従う符号帳探索のために与えられる。本明細書中で述べるように、この発明では３つの形式の符号帳探索、すなわち５０でのバイパルス探索、５２でのスクランブル探索、および５４での単一パルス探索が行なわれる。初めに図７に示すバイパルス探索技術について考察する。符号帳には何百ものベクトルｃが存在することが可能であることが思い出されるであろう。可能な各ベクトルに対してＡcまたはc^tＡ^tを形成することは望ましくないため、符号帳探索の前に２つの変数、（Ｎ×１）ベクトルｄおよび（Ｎ×Ｎ）マトリクスＦが予め計算される（等式９）。後ろ向きフィルタ処理によりｄを予め形成するプロセスは６０で行なわれる。ＣＥＬＰ符号化の計算全体において符号帳探索は非常に重要部分を占めるため、効率的な探索の方策を用いて最良の符号語を計算することが大切である。しかしながら、効率的態様でＣ_i、Ｇ_iの計算をすることができるように符号帳を適所に有することが重要である。符号帳ベクトルｃについての２つの主要な要求は、（ｉ）平坦な周波数スペクトルを有すること（そうすれば合成フィルタによって特有の音声各々に対し正しい形に作られるため）、および（ii）各符号語が互いに十分な相違があるようにして、ほぼ等しいものをいくつも持つことによって符号帳のエントリを浪費しないようにすることである。この発明において、符号帳におけるすべてのエントリは実際上、それぞれ＋１および−１である２つのエントリを除きＮ個のサンプルすべてにおいて０である（Ｎ×１）ベクトルからなる。先に述べたように、Ｎの好ましい値は６４であるが、この発明の原理について説明するために、ベクトル当たりのサンプルの数がそれよりも少ないものを示す。各符号ベクトルｃは以下の形式である。この形式のベクトルは非０パルスを２つしか有さないためにバイパルスベクトルと呼ばれる。このベクトルはスペクトルとして平坦であるという符号帳ベクトルとして所望される特性を有する。＋１パルスが可能なＮの位置のいずれにあってもよく、−１パルスが（Ｎ−１）の位置のいずれにあってもよいため、可能な組合せの総数はＮ（Ｎ−１）である。Ｎは６４に等しいことが好ましいため、符号帳の起こり得る大きさは４０３２ベクトルである。なお、符号帳ベクトルの形式としてバイパルスベクトルを使用することにより、コードベクトルｃにおける＋１、−１パルスの位置がわかればすべての音声合成計算が可能である。必要なのは位置に関する情報のみであるので、符号帳をストアする必要はない。したがって、記憶容量が大きくなくても非常に大きな符号帳の効果を達成することができる。バイパルスベクトルの性質、すなわち＋１または−１いずれかを含む２つの位置を除いてすべての位置に０があるという性質のため、等式（１０）の算出のために必要であった計算は下記に還元される。Ｃ_i＝(d_i−d_j) Ｇi＝(F_ii＋F_jj−2F_ij) (11) ここでｄ_iはベクトルｄの要素ｉであり、ｄ_jはベクトルｄの要素ｊであり、Ｆ_ij はマトリクスＦのｉ行ｊ列の要素である。言い換えれば、１つの＋１および１つの−１要素を有するバイパルス符号語を用いることにより、最適符号語の探索は位置情報のみを決定することに還元され、さらに等式（１１）に従ってｄベクトルおよびＦマトリクスにおける値の操作に還元される。この効果的なバイパルス符号帳を用いる主な利点は、符号帳の大きさが実質上非常に大きい（４０３２ベクトル）ため音声の質が優れていること、記憶についての要求が非常に低いこと、つまり等式（１１）のように結果が計算できるため「符号帳」そのものをストアする必要がないこと、ために）Ｃ_i、Ｇ_iを計算するのは非常に簡単であるため要求される計算力が低いことである。従来の符号帳探索の間は、フィルタ処理されたベクトルＡcのうち現在のフレームにある部分のみが最適化され、次のフレームに進む部分は無視される。このように、Ｃ_i、Ｇ_iの値は、フレームの開始でパルスを有する符号帳ベクトルｃに対し、フレームにおいてそれよりも後にパルスを有する符号帳ベクトルｃに対するよりもより正確である。この発明では、ＬＰＣ合成フィルタのインパルス応答{a_n}の先端を切捨てて値の数を少なくする、すなわち以下のように定義される新しいインパルス応答{a′_n }を用いることにより、フィルタ処理されるベクトルの無視される部分の問題は克服される。 a′_n＝a_n′ ｎ＝０からＮＴＲＵＮＣ−１＝０ｎ＝ＮＴＲＵＮＣからＮ−１ (12) インパルス応答のこうした計算および切捨ては図７の６２で行なわれる。前述のように、合成フィルタのインパルス応答は６４の値を含む、すなわちＮ＝６４である。切捨てという変形では、元のインパルス応答は、いくつかのサンプルの後に切捨てられる。したがって、フィルタ処理されたベクトルＡcが生成するエネルギは、パルスがどこで発生するにせよ、このフレームに集中する。ＮＴＲＵＮＣの値は８であることが現在は好ましい。切捨てられたインパルス応答に基づく（Ｎ×Ｎ）マトリクスＦの計算は、６４で前もって行なわれる（等式９）。この切捨てはバイパルス符号帳探索手順、すなわち各符号帳ベクトルｃに対するＣ_i、Ｇ_iを計算するためにのみ行なわれることに注意することが大切である。Ｃ_i ²／Ｇ_iを最大化することにより最良の符号語ｃが発見された後、全インパルス応答{a_n}に基づいてこの特定の符号語に対するＣ_i、Ｇ_iの新しい組が計算され、この全応答計算を利用して新しいゲインｇ＝Ｃ_i／Ｇ_iを計算する。全応答計算をゲイン計算のために使用する理由は、切捨てられたインパルス応答により、特定的なフレームに対して選び出される機会がすべてのパルス位置にとって等しくなるが、バイパルスプロセスにより生成されるＣ_i、Ｇ_iの値は、ゲインがスケーリングされフィルタ処理された符号ベクトルｇＡcとターゲットベクトルｘとの誤差をもはや正しく最小化しないという意味において「正確」でないということである。したがって、切捨てられていない応答を用いて、実際にこの誤差を最小とするゲインｇの値を計算しなければならない。最適の符号語および適切なゲインを発見するために、従来の符号帳探索ではＣ_i ² ／Ｇ_iおよびＣ_i／Ｇ_iを用いたことが再考される。この発明を利用することにより、これらの値はより迅速に計算される。しかしながら、最良の符号帳ベクトルを計算するのに必要な時間およびこうした計算の効率性をさらに改良することが可能である。好ましい実施例ではＮ＝６４であることを思い出して頂きたい。その結果、上記のように簡素化された切捨てによる探索でさえＮ（Ｎ−１）すなわち４０３２個のベクトルに対するＣ_i、Ｇ_iの計算が必要であり、必要となる処理力という点においてはあまりにも高いであろう。この発明では、こうした可能な符号語のうち非常に少数のサブセットのみが探索される。こうして探索が減じられることによっても、全符号帳探索と略等しい性能がもたらされる。この概念を理解するために、Ｇ_iの構造をより詳細に考察する。フィルタ処理された符号ベクトルＡcをベクトルｙと表現するとすれば、ｙ＝Ａc (13) となり、この等式の両側を転置すると以下のようになる。ｙ^t＝c^tＡ^t (14) Ｇ_iに対する等式（１０）はしたがって次のようになる。ここで｛ｙ（ｎ｝ｎ＝０からＮ−１｝はベクトルｙを構成するサンプルの組である。この等式は、Ｇ_iは実際には、フィルタ処理された符号帳ベクトルｙとそれ自身との相関（すなわちこの信号における全エネルギ）であることを示す。もし符号帳ベクトルにおける２つのパルスの間隔が大きければ、＋１パルスへのフィルタ応答は−１パルスへの応答と相互作用しないであろうし、したがってフィルタ処理されたベクトルｙにおける全エネルギは非常に一貫しており、＋１、− １パルスがフレーム内で実際にどこにあるかに左右されないだろう。このことは、Ｇ_iが実際にはパルスの位置によって大きくは変化しないであろうことを示唆している。このように、符号帳探索の間にＣ_i ²／Ｇ_iを最大化することは、単にＣ_iを最大化することに略等しく、そうすれば符号帳探索がかなり簡略化される。こうした単にＣ_iを最大化するプロセスは、Ｃ_i ²／Ｇ_iという式のうち分子Ｃ_iの計算のみを含むために「分子のみの探索」と呼ばれる。なお、上記の切捨てられたインパルス応答を用いることについては既に述べたが、これより、＋１、−１パルス各々へのフィルタ応答が短くされるため、２つの応答が相互作用する機会がより少なくなる。このことから、Ｇ_iがパルスの位置から十分に独立したものであるという仮定がより有効になる。分子のみの探索を利用して等式（１１）をＣ_i＝（ｄ_i−ｄ_i）と修正することが可能である。したがって、Ｃ_iの値を最大化するために必要なのは、ｄ_iに対する可能な正の最大値、およびｄ_iに対する可能な負の値のみである。このように、符号帳探索手順は単に、ｉを明らかにする最大の正の要素（符号帳ベクトルｃにおける＋１の位置）およびｊを明らかにする最大の負の要素（符号帳ベクトルｃにおける−１の位置）を求めてｄベクトルをスキャンすることから構成される。分子のみの探索は、各符号ベクトルに対してＣ_i、Ｇ_iを計算するよりもはるかに簡単である。しかしながら、これはＧ_iがすべてのパルス位置に対して一定であるという仮定に基づくものであり、この仮定は、特に＋１、−１パルスが互いに近接しているならば略有効であるにすぎない。この条件を緩和するために、後ろ向きフィルタ処理が行なわれたベクトルｄにおいて１つの正の最大値および１つの負の最大値を発見する代わりに、（ＮＤＢＵＦ）という数の正の最大値（ＮＤＢＵＦは１よりも大きな数である）およびＮＤＢＵＦ個の負の最大値の探索が行なわれる。こうした複数の探索により、ｄ内でこれらの正の最大値および負の最大値、すなわち｛ｉｍａｘ_k ｋ＝１からＮＤＢＵＦ｝および｛ｊｍｉｎ_l ｌ＝１からＮＤＢＵＦ｝がそれぞれ発生するサンプル位置がもたらされる。実際の正の最大値および負の最大値はしたがって、｛ｄ（ｉｍａｘ_k）ｋ＝１からＮＤＢＵＦ｝および｛ｄ（ｊｍｉｎ_l）ｌ＝１からＮＤＢＵＦ｝により与えられる。パルスの位置に伴なうＧ_iの僅かな変化を許容するとしても、「最適な」符号語はなおも｛ｄ（ｉ＿ｍａｘ_k）｝、｛ｄ（ｊｍｉｎ_l）｝という２つの集合に相当するパルス位置から生じるであろうと仮定される。図７に示すように、ＮＤＢＵＦ個の正の最大要素およびＮＤＢＵＦ個の負の最大要素を選択するためのこの分子の０にセットされる。複数のＮＤＢＵＦ個の値各々に対し、等式（１１）の以下の変形から、７０、７２でＣ_i、Ｇ_iを計算することができる。Ｃ_i＝d(i max_k)−d(j min_l) Ｇ_i＝F(i max_k,i max_k)＋F(j min_l,j min_l) -2F(i max_k,j min_l) (16) ここでＦ（ｉ、ｊ）は、マトリクスＦのｉ行ｊ列の要素である。Ｃ_i、Ｇ_iの等式を用いると、最大のＣ_i ²／Ｇ_iは、７０、７２、７４、７６および７８を含むループで決の新しい値が７６で記録される。このループは、ｉおよびｊのすべてのＮＤＢＵＦ個の変数が計算されるときまで続き、これは７８で判断される。ｉｍａｘ_k 、ｊｍｉｎ_l双方に対する値はこのようにして、符号語ｃに対する最良のパルス位置について発見される。伝送されるのはｉおよびｊのこの値、すなわち符号ベクトルｃにおける＋１および−１の位置である。等式（１６）の計算の組は、可能なｉｍａｘ_k、ｊｍｉｎ_lの各々に対して行なわれることがわかる。各々についてＮＤＢＵＦ個であるということは、Ｃ_i 、Ｇ_iの評価は全部でＮＤＢＵＦ²となる。ＮＤＢＵＦの値が５であると、パルス位置の可能な各組に対するＣ_i ²／Ｇ_iの計算の全探索と同様の性能がもたらされることがわかっている。要約すれば、分子のみの探索を行なって複雑さを減少させるプロセスは、Ｇ_i が略一定であるという仮定に基づいてＣ_iの値の最大の組を計算することにより、探索すべき符号ベクトルの数を略４０００から約２５にふるい分けて減じるという効果を有する。こうした２５の各々に対し、Ｃ_i、Ｇ_iの双方が（切捨てられたインパルス応答を用いて）計算され、最良の符号語（＋１および−１の位置）が発見される。この１つの最良の符号語に対し、切捨てられていないインパルス応答を用いて、８０で符号帳のゲインｇを計算する。ｉおよびｊの位置もゲインｇも伝送のために与えられる。図６の５２で行なわれるスクランブル符号帳探索について考察する。有声音（すなわち明確な周期性を有する母音およびｚ、ｒ、ｌ、ｗ、ｎなどの音）に対し、図２におけるＬＰＣ合成フィルタへの駆動が、ＬＴＰによりかなりの程度まで与えられる、すなわち図２の用語では、Ｂは大きく、ｇは小さい。しかしながら、無声音には周期性がなく、符号帳によるモデル化が必要である。しかしながら、こうしたモデル化のために５０でのバイパルス探索技術を用いることは部分的に成功するにすぎない。無声音は、明確なタイプに分類可能である。破裂音（たとえばｔ、ｐ、ｋ）については、音声の波形は、すぐにほとんどゼロに減衰する鋭いパルスに似ている。上記のバイパルス符号帳は、そのものがパルスから構成されるためにこういった信号を表現するのに非常に効果的である。しかしながら、無声信号の他の種類のものは摩擦子音（たとえばｓ、ｓｈ、ｆ）であり、その音声の波形はランダム雑音に似ている。このタイプの信号は、バイパルス符号帳が生成するパルスのシーケンスによりうまくモデル化されず、こういった信号に対してバイパルスを用いることで、出力される音声に非常に耳障りな性質を導入することになる。この問題についての１つの解決策は、雑音のような波形に基づく従来のランダム符号帳をバイパルス符号帳と並列して用いて、その信号を最適にモデル化するときにバイパルス符号帳を用いるようにし、無声音声のあるタイプのモデル化にはそれに最適なランダム符号帳を用いることである。しかしながら、この方策の不利な点は前述のように、ランダム符号帳の探索はバイパルス符号帳の探索よりもはるかに困難であるという点である。理想的な解決法は、バイパルス符号帳ベクトルを採用し、それらが雑音のような波形を生成するように何らかの形でそれらベクトルを変換することである。各フレームにおいてこの計算が何度も行なわれるため、このような演算では変換の計算が簡単であることという制約がさらに課される。好ましい実施例の変換は、アダマール変換を利用して達成される。アダマール変換は既知であるが、以下の目的のために用いることは新規である。アダマール変換は、符号帳ベクトルｃに対して作用する（Ｎ×Ｎ）変換マトリクスＨと関連付けられる。アダマール変換は２のべき乗であるＮのすべてのサイズに対して存在し、たとえばＮ＝８に関連付けられた変換マトリクスは以下のようになる。Ｎのすべての値についても当てはまるが、この変換マトリクスについての２つの一般的な注意点は以下のとおりである。（ｉ）要素はすべて＋１、−１であり、それぞれがマトリクスの半分を構成する。（ii）変換マトリクスは対称、すなわち、Ｈ＝Ｈ^tである。バイパルス符号帳ベクトルｃに関連する（Ｎ×１）の変換された符号帳ベクトルc′は以下のようにして形成される。 c′＝Ｈc (18) 変換された符号ベクトルを等式（８）においてｃの代わりに用いてＧ_i、Ｃ_iを計算し、最適な符号ベクトルを発見することができる。ｃはｉ行の＋１およびｊ行の−１という２つの非０要素しか有さぬため、変換c′＝Ｈcを形成する効果は以下のようになる。 c′＝（Ｈの列ｉ）−（Ｈの列ｊ） (19) 変換された符号ベクトルc′の要素は、３つの値０、−２、＋２のうちの１つを有するであろう。c′内で発生するこれら３つの値の実際の比はそれぞれ、１／２、１／４、１／４であろう。この符号ベクトルの形式は（３つの明確な値を有するため）３値コードベクトルと呼ばれる。従来のランダムＣＥＬＰ符号帳でも３値ベクトルは用いられているが、この発明の３値ベクトル処理は新規である。しかしながら、この新しい方策には１つの問題がある。等式（１７）では、Ｈの列（または行）では、異なる頻度で符号が＋１から−１またはその逆に変わる。符号の変化の頻度は、以下のように規定される、シーケンシという項に定式化される。変換マトリクスＨの列のシーケンシは、非常に広範囲である。c′は等式（１９）のようにＨの列の組合せからなるため、ある音声フレームではc′内に符号の多くの変化があり、あるフレームでは変化が比較的少ない c′ベクトルがあるという点において、ベクトル c′はＨと同様のシーケンシ特性を有するだろう。実際のシーケンシは、ｃ内の＋１、−１のパルス位置次第であろう。シーケンシの高い c′ベクトルは、高周波数の大量のエネルギが支配的な周波数変換特性を有し、シーケンシの低い c′は主として周波数の低い要素を有する。この広範囲のシーケンシの効果は、１つのフレームから次のフレームへと、出力音声の周波数の内容に非常に早い変化があることである。このことには、合成された音声に、震えるような、水中効果に近いものを導入するという影響がある。したがって、３値符号語 c′といった雑音のような符号ベクトルを生成する一方で、１つのフレームから次のフレームへと符号語においてより一貫したシーケンシを生み出すようにこの方策を修正することが好ましい。好ましい実施例では、以下の形式の「スクランブルマトリクス」Ｓを導入することにより、より一貫したシーケンシという結果がもたらされる。主対角線に沿う要素は＋１または−１としてランダムに選択される。特に好ましい実施例では、時間と共にまたはフレームからフレームへと変化しない、予め定められた、固定された選択を＋１および−１について行なう。先に述べたように、好ましい実施例ではＮが６４である。スクランブルマトリクスＳに対する好ましい６４の対角の値は、以下のとおりである。新しい変換およびスクランブルされたコードベクトル c″は以下により与えられる。 c″＝ＳＨc (21) Ｓマトリクスの効果は、c′＝Ｈcにおける各要素を取り出し、ランダムにその符号を反転したりしなかったりすることである。その結果 c′のシーケンシ特性は「破壊され」、そのため結果として生じるベクトル c″は、バイパルスベクトルｃ内でのパルスの位置がどこであっても略同じシーケンシを有することになる。しかしながら、c″はなおも以前と同じ比の値（０、＋２、−２）から構成されるため、符号帳の雑音のような特性は保たれる。このスクランブルマトリクスを用いる正味の効果は、震えのような歪みを取り除き、ｓ、ｆといった音声入力に対しより自然な雑音のような出力を生成することである。これら２つのマトリクスＳ、Ｈを加えることにより、この方策の複雑さが大幅に増すように思われる。しかしながら、複雑さは増すにしても、それは望ましくないものでは決してない。図８を参照して、４６で以前に発生しているターゲットベクトルｘが再び後ろ向きフィルタ処理されて８２でベクトルｄを形成する。前のように各符号語 c″に対し計算される２つのパラメータは、Ｃ_i、Ｇ_iであり、等式（８）のｃを c″で置換えることにより形成される。Ｃ_i＝c″^tＡ^tx Ｇ_i＝c″^tＡ^tＡc″ (22) 等式（２１）よりc″^t＝c^tＨ^tＳ^tであり、Ｈ、Ｓ双方が対称である（すなわちＨ^t＝Ｈ、Ｓ^t＝Ｓである）という特性を用いると、以下が得られる。Ｃ_i＝c^tＨ^tＳ^tＡ^tx＝c^tＨＳＡ^tx Ｇ_i＝c^tＨ^tＳ^tＡ^tＡＳＨc＝c^tＨＳＡ^tＡＳＨc (23) 上記の後ろ向きフィルタ処理の技術について説明する場合、考えとしては各符号ベクトルｃについてc^tＡ^tを形成する必要性を回避するためにｄ＝Ａ^txを予め計算することであった。等式（２３）において同様の考え方を利用して、８４で以下のように d″を予め計算することができる。 d″＝ＨＳＡ^tx (24) この計算は３つの段からなる。すなわち、（ｉ）Ａ^txの計算は単に上記の後ろ向きフィルタ処理動作であり、（ii）何らかのエントリの符号の反転を含むだけであるためにスクランブルマトリクスＳマトリクスによる乗算は大きな意味を持たない。なお、全体の（Ｎ×Ｎ）マトリクス）ではなくＳ内の＋１、−１というエントリをストアする必要があるだけである。（iii）アダマール変換は高速アルゴリズムで効率的に計算可能である。一旦 d″が計算されれば、残りは以下よりＣ_iを計算することだけである。Ｃ_i＝c^td″ (25) 但しｃはまだバイパルスベクトルである。これは等式（１０）のｄをd″で置き換えたものと同じであり、バイパルス符号帳の探索を簡素化するために用いた同じ原理がこのスクランブルアダマール符号帳（ＳＨＣ）に対しても用いられる。特に、分子のみの探索を用いて、探索される符号帳のエントリの数をＮ（Ｎ−１）からＮＤＢＵＦ²に減じることができる。これらＮＤＢＵＦ²の可能性について、Ｃ_i、Ｇ_iの両方が計算され、Ｃ_i ²／Ｇ_iを最大化する符号語が発見される。ここでＧ_iの計算をより詳しく調べてみる。y″＝Ａ c″とすると、等式（２２）を以下のようにすることができる。Ｇ_i＝y″^ty″ (26) 上記は単にこのフィルタ処理された信号 y″とそれ自身との相関でしかない。しかしながら、この式をさらに簡略化することができないため、この方策を用いてＧ_iを計算しなければならない。このプロセスは計算上はやや費用がかかる（それほど大きくはないが）ため、この計算が必要とされる回数を最小とすることが望ましい。Ｃ_iはＮＤＢＵＦ²回のみ計算されるため、ＮＤＢＵＦ＝１という値が好ましくは選択される。このことは、８６でベクトル d″における正の最大エントリおよび負の最大エントリのみが探索され、これら極値の位置により８８で発生する符号ベクトルｃにおけるパルスの位置が与えられることを示している。スクランブルされた符号ベクトル c″は９０で形成され、９２でＬＰＣ合成フィルタを通してフィルタ処理された y″を形成する。９４で等式（２５）を用いて値Ｃ_i形成され、等式（２６）を用いて値Ｇ_iが形成され、とちらも切捨てられていないインパルス応答を有し、ゲインｇ＝Ｃ_i、Ｇ_iが最終的に評価できる。次に図６の５４で行なわれる単一パルス符号帳探索について考察する。この単一パルス符号帳は、＋１の値を有するひとつを除いてすべてのサンプルにおいて０であるベクトルからなる。この符号帳はバイパルス符号帳に形式の上で似ているのみでなく、計算の上での詳細についても似ている。したがって、図７に示すものと同様のフローチャートは示されていない。符号語ｃの行ｋで＋１の値が発生すれば、Ｃ_i、Ｇ_iの値は以下のようにして計算される。Ｃ_i＝ｄ_k Ｇ_i＝Ｆ_kk (27) その他ほとんどの点においては、この符号帳はバイパルス符号帳と等しいため、符号帳探索および分子のみの探索のための切捨てられたインパルス応答という概念が再び利用される。用いる符号帳探索方法は３つであるため、あるフレーム中にどの符号帳ベクトルを用いるかを決定する必要がある。図６の比較器１００で行なわれる決定は一般に、どの符号帳ベクトルが合成された音声と入力音声信号との間の誤差を最小限にするか、または等価的には、どの符号帳ベクトルがＣ_i ²／Ｇ_iに対して最大値を有するかという決定を含む。この方策は、バイパルス符号帳と単一パルス符号帳との間で選択を行なう場合に有効である。しかしながら、ＳＨＣはその他とは大きく異なるため、少し修正を行なうことが必要である。修正する理由は、ＳＨＣは摩擦無声音（たとえばｓ、ｆ、ｓｈ）に対してうまく作用するように設計されていることである。これらの音に関連する音声波形は、時折大きなスパイク／パルスを伴なう雑音のような波形からなるものとしてうまく説明される。バイパルス符号帳はこれらのスパイクをうまく表わすが雑音要素についてはそうでなく、一方ＳＨＣは雑音要素をモデル化するがスパイクに対する性能は比較的劣る。Ｃ_i ²／Ｇ_iの最大化が入力および合成された音声信号間の二乗誤差の最小化と関連付けされているため、スパイクでの誤差は全誤差において非常に大きく重み付けされ、そのためにＳＨＣはたとえ摩擦音声入力に対しても大きな二乗誤差を時折もたらすだろう。しかしながら、二乗誤差は必ずしも最良の誤差基準ではない、というのも耳そのものがｄＢ（すなわちｌｏｇ）スケールでの信号に敏感であり、そのことにより小さな信号が大きな信号と比べてもつ重みは、二乗誤差基準が示すよりも高いためである。これは、たとえＳＨＣの選択が概念的には最良の選択であったとしても、二乗誤差基準が同じ最終的な選択とはならないかもしれないことを意味する。したがって、図６の１０２において、ＳＨＣに有利なようにその決定に人工的に重み付けを行なうことが必要である。再び図８を参照して、このことを達成する方法は、各符号帳に対しＣ_i ²／Ｇ_iを計算し、次にその他の符号帳についての対応する値と比較する前に、１０４で重み係数γによりＳＨＣに対して乗算することである。γ＝１．２５という値を用いることが好ましい。この値により、ＳＨＣが最良の性能を発揮することのできる信号（たとえば無声摩擦音およびその他の雑音の多い信号）に対しＳＨＣが選択され、一方破裂音といった信号についてはバイパルスおよび単一パルス符号帳が用いられることが確実となる。よびゲインｇが形成されて４４（図６）でのフォーマット化のために提供される。フォーマット化された情報を、バス１４に与えるためにＴｘバッファ１１０に提供する。図９を参照して、本発明に従い形成される受信機が開示されている。なお、図９は図６と同様、図５に示す装置１０との関連で用いられるプログラミングを表わすものである。バス１８に現れる伝送された通信信号は、単一のブロックに関連するすべてのビットが相対的に同時に動作できるようにするために、１２０で最初にバッファされる。バッファされた信号はその後１２２で元の形に戻される。ＬＰＣ情報は合成フィルタ１２４に与えられる。ＬＴＰ情報は周期的駆動発生器１２６に与えられる。発生器１２６の出力は、乗算器１２８でゲインＢで乗算される。図５の１００で選択される特定的な探索方法の識別とともにｉおよびｊ情報が、符号ベクトル構成発生器１３０に与えられる。発生器１３０の出力は、乗算器１３２でゲインｇにより乗算される。乗算器１２８および１３２の出力は総和器１３４で合計される。合計された信号は駆動信号として合成フィルタ１２４に与えられる。前述のように、符号帳探索方法各々について異なる符号ベクトルｃが発生される。したがって、利用される符号帳探索方法の識別により、適切な符号ベクトルの構成が可能になる。たとえば、もしバイパルス探索を用いると、符号ベクトルはｉ行で＋１を有し、ｊ行で−１を有するバイパルスとなる。スクランブル探索技術を用いれば、パルスの位置がわかっているためＳＨＣに対する符号ベクトルｃを簡単に形成することができる。このベクトルは次に変換されスクランブルされる。その後１３２でゲインのスケーリングが行なわれ、１２４でフィルタ処理されて出力音声ベクトルgＡＳＨcを形成する。もし単一パルス方法を用いると、符号ベクトルｃを素早く構成することができる。本発明は特定的な実施例について説明されているが、以下の請求の範囲において本明細書中で述べるこの発明の原理から逸脱することなく、変形および修正が行なわれ得ることを当業者は理解するであろう。

Claims

【特許請求の範囲】１．音声信号を符号化する音声符号化器において符号語を決定するための装置であって、前記音声符号化器はリンギング情報およびピッチ情報を取り除くために前記音声信号をフィルタリングすることに応答して形成される目標信号を与え、前記音声符号化器は前記音声信号に応答して線形予測係数合成フィルタを与え、前記装置は、前記合成フィルタのインパルス応答を決定するためのインパルス応答手段と、前記インパルス応答で前記目標信号をフィルタリングし、それによって探索信号を形成するための第１のフィルタと、最大の正の値および最大の負の値の位置を求めて前記探索信号を探索するための探索手段と、一連の値を含む符号語を形成するための形成手段とを含み、符号語内のすべての値は第１の値および第２の値を除いて０であり、前記第１の値は前記正の最大値の位置に応答して前記符号語内に位置され、前記第２の値は前記負の最大値の位置に応答して位置される、音声信号を符号化する音声符号化器において符号語を決定するための装置。２．前記第１の値は＋１であり、前記第２の値は−１である、請求項１に記載の装置。３．前記インパルスは一連のインパルス応答値を含み、前記インパルス応答手段はインパルス応答値の数を切捨てるための切捨手段を含む、請求項１に記載の装置。４．前記符号語に関連して利得値を決定するための利得手段をさらに含み、前記利得手段は全インパルス応答に関連して前記利得値を計算する、請求項３に記載の装置。５．前記符号語を変換するための変換手段をさらに含み、前記符号語は変換されることに関連して決定される、請求項１に記載の装置。６．前記変換はアダマール変換である、請求項５に記載の装置。７．送信のためにアナログ音声信号をディジタル音声信号に変換するための音声符号化器であって、前記音声符号化器は、前記音声信号からスペクトル情報をフィルタリングして出し、送信のために前記スペクトル情報を与えるための第１のフィルタと、前記音声信号からピッチ情報をフィルタリングして出し、送信のために前記ピッチ情報を与えるための第２のフィルタと、前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に、音声信号を表わすバイパルス符号ベクトルの特性を決定し、送信のために前記特性を与えるための符号ベクトル発生器とを含む、音声符号化器。８．前記第１のフィルタはインパルス応答を有し、前記符号ベクトル発生器は、前記インパルス応答を切捨ててそのような切捨てられたインパルス応答を用いて前記特性を決定するためのトランケータを含む、請求項７に記載の符号化器。９．前記特性は、多数の符号ベクトルの可能性に関連して分子と分母とを有する分数の値を計算することにより決定されることができ、前記符号ベクトル発生器は、前記分子を計算して前記分子を検査するだけでどれが正の最大値であり負の最大値であるかを判断する、請求項７に記載の符号化器。１０．前記符号ベクトル発生器は、前記分子に対して、正の最大値の集合と負の最大値の集合とを決定する、請求項９に記載の符号化器。１１．送信のためにアナログ音声信号をディジタル音声信号に変換するための音声符号化器であって、前記音声符号化器は、前記音声信号からスペクトル情報をフィルタリングして出し、送信のために前記スペクトル情報を与えるための第１のフィルタと、前記音声信号からピッチ情報をフィルタリングして出し、送信のために前記ピッチ情報を与えるための第２のフィルタと、前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に、音声信号を表わすバイパルス符号ベクトルの特性を決定し、送信のために前記特性を与えるための符号ベクトル発生器とを含み、前記符号ベクトル発生器は符号ベクトルの可能性をパルス状音声を表わすものから雑音状音声を表わすものに変換する変換手段を含む、音声符号化器。１２．前記変換手段はアダマール変換を含む、請求項１１に記載の符号化器。１３．前記符号ベクトル発生器は、変換された符号ベクトルの可能性のシーケンシ特性を変更するためのスクランブラをさらに含む、請求項１２に記載の符号化器。１４．前記特性は、多数の符号ベクトルの可能性に関連して分子と分母とを有する分数の値を計算することにより決定されることができ、前記符号ベクトル発生器は、前記分子を計算して前記分子を検査するだけでどれが正の最大値であり負の最大値であるかを判断する、請求項１３に記載の符号化器。１５．送信のためにアナログ音声信号をディジタル音声信号に変換するための音声符号化器であって、前記音声符号化器は、前記音声信号からスペクトル情報をフィルタリングして出し、送信のために前記スペクトル情報を与えるための第１のフィルタと、前記音声信号からピッチ情報をフィルタリングして出し、送信のために前記ピッチ情報を与えるための第２のフィルタと、前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に、音声信号を表わすバイパルス符号ベクトルの第１の特性を決定し、送信のために前記第１の特性を与えるための第１の符号ベクトル発生器と、前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に、音声信号を表わすバイパルス符号ベクトルの第２の特性を決定し、送信のために前記第２の特性を与えるための第２の符号ベクトル発生器とを含み、前記符号ベクトル発生器は符号ベクトルの可能性をパルス状音声を表わすものから雑音状音声を表わすものに変換する変換手段を含み、前記音声符号化器はさらに、前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に、音声信号を表わす単一パルス符号ベクトルの第３の特性を決定し、送信のために前記第３の特性を与えるための第３の符号ベクトル発生器と、前記第１、第２および第３の符号帳発生器によって決定された特性を評価して、前記第１、第２または第３の特性の１つを選択するための比較器とを含む、音声符号化器。１６．前記第１、第２および第３の特性の１つに重み係数を与えるためのウェイタをさらに含む、請求項１５に記載の符号化器。１７．前記重み係数は前記第２の特性に与えられる、請求項１６に記載の符号化器。