JPH09506182A - 符号駆動線形予測を備える適応音声符号化器 - Google Patents

符号駆動線形予測を備える適応音声符号化器

Info

Publication number
JPH09506182A
JPH09506182A JP7507532A JP50753295A JPH09506182A JP H09506182 A JPH09506182 A JP H09506182A JP 7507532 A JP7507532 A JP 7507532A JP 50753295 A JP50753295 A JP 50753295A JP H09506182 A JPH09506182 A JP H09506182A
Authority
JP
Japan
Prior art keywords
speech
signal
value
code vector
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7507532A
Other languages
English (en)
Inventor
チャットウォール,ハープリット・エス
Original Assignee
パシフィック・コミュニケーション・サイエンシーズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パシフィック・コミュニケーション・サイエンシーズ・インコーポレイテッド filed Critical パシフィック・コミュニケーション・サイエンシーズ・インコーポレイテッド
Publication of JPH09506182A publication Critical patent/JPH09506182A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Abstract

(57)【要約】 符号化されるべき音声は、バッファ(40)に記憶されて、線形予測符号化(42)を用いてスペクトル成分と、長期予測子(46)を用いてピッチ駆動とに分けられる。駆動信号の符号化を実施するために3つのタイプの探索が行なわれる。バイパルス探索(50)はピッチおよび雑音駆動を表わす。スクランブリングされる探索(52)はピッチおよび雑音(バイパルス)駆動のアダマール変換を用いる。単一パルス探索(54)はピッチ駆動を表わす。この3つの探索は各表現に対して最良の一致を見つけ、その3つすべてを比較して(100)最小誤差を有するものをとる。スペクトル成分、ピッチ、および符号化された駆動は共にフォーマット化されて(44)バッファ(110)を通して送信される。

Description

【発明の詳細な説明】 符号駆動線形予測を備える適応音声符号化器 発明の分野 この発明は音声符号化の分野に関するものであり、より特定的には、符号駆動 線形予測(CELP)技術が利用される、音声信号の適応符号化の分野における 改良に関するものである。発明の背景 T1方式が導入されたのは1962年であるが、その頃から合衆国にはディジ タル通信キャリア方式がある。この方式は、1.544Mb/sの全体速度で送 信される24音声チャネルディジタル信号を用いる。それまでのアナログ方式に 対するコスト上の利点から、T1方式は広く展開された。T1方式における個々 の音声チャネルは、通常は、約300〜3400Hzの周波数範囲に音声信号を 帯域制限し、制限された信号を8kHzのレートでサンプリングし、その後にそ のサンプリングされた信号を8ビット対数量子化器で符号化することとによって 発生された。結果として生じたディジタル音声信号は、64kb/sの信号であ った。T1方式では、24の個々のディジタル音声信号は1つのデータストリー ムに多重化された。 全体のデータ送信速度が1.544Mb/sに固定されるため、64kb/s の音声信号が用いられる場合には、T1方式は24の音声チャネルに制限される 。音声信号またはチャネルの数を増加させる一方で約1.544Mb/ sのシステム送信速度を維持するためには、個々の信号の送信速度が64kb/ sから幾分遅い速度に減じられなければならない。典型的なT1音声信号発生機 構において、サンプリング速度の低減または量子化器のサイズの低減のいずれか によって送信速度を下げることに伴う問題は、元の音声の正確な再生に必要不可 欠な音声信号のある部分が失われるという点である。より遅いビット速度での送 信のためにアナログ音声信号をディジタル音声信号に変換するために、たとえば 、変換符号化(TC)、適応変換符号化(ATC)、線形予測符号化(LPC) および符号駆動線形予測(CELP)符号化等のいくつかの代替的方法が提案さ れてきた。ATCでは、12〜16kb/s程度の低さのビット速度が可能であ ると推定される。CELP符号化では、4.8kb/s程度の低さのビット速度 が可能であると推定される。 事実上すべての音声信号符号化技術において、音声信号は音声サンプルのシー ケンシャルなブロックに分けられる。TCおよびATCでは、各ブロック内のサ ンプルは、ベクトル状に配列され、時間ドメインから周波数ドメインのような交 代ドメインに変換される。LPCおよびCELP符号化では、音声サンプルの各 ブロックは、そのブロックに対する線形予測係数および長期予測子(LTP)の ような他の情報を決定するために分析される。線形予測係数は、音声信号サンプ ルの特定のブロックに関連付けられるスペ クトル包絡のある局面を反映する等式要素である。このようなスペクトル情報は 、音声の動的特性、つまりホルマントを表わす。 音声は、周期的(有声音)、非周期的(無声音)、または混合したもの(たと えば有声摩擦音)のいずれかである駆動信号を発生することによって生ずる。駆 動信号の周期的成分はピッチとして知られる。発声中、駆動信号は、口、顎、唇 、鼻孔等の位置によって決定される声道フィルタによってフィルタリングされる 。このフィルタは、聞こえる音声の質を決定する共振またはホルマントを有する 。声道フィルタは駆動信号に包絡を与える。この包絡はフィルタホルマントを含 むため、それはホルマント包絡またはスペクトル包絡として知られる。線形予測 係数に反映されるのはこのスペクトル包絡である。 長期予測子は、音声信号の冗長ピッチ構造を反映するフィルタである。このよ うな構造は、各ブロックに対してLTP値を評価してそれらの値を現在の信号値 から減算することによって取り除かれる。このような情報を取り除くことによっ て、音声信号は、より少ないビットを用いて、ディジタル信号に変換できる。L TP値は、別に送信されて、受信機で残りの音声信号に加え戻される。LPC技 術を用いて音声信号がどのようにディジタル形式に還元され変換されるかを理解 するために、LPCボコーダによる合成または再生された音声信号の発生を考え る。 一般的な、先行技術のLPCボコーダが図1に示される。図示される装置は、 送信されるディジタル信号を合成された音声信号、つまり合成された音声サンプ ルのブロックに変換する。基本的に、サンプルの所与のブロックに対して決定さ れたLPCを用いる合成フィルタは、そのLPCに関して駆動信号をフィルタリ ングすることによって、合成された音声出力を生ずる。合成フィルタ係数(LP C)および駆動信号の両方は、各サンプルブロックまたはフレームに対して(つ まり20〜30ミリ秒毎に)更新される。図示されるように、駆動信号は、周期 的駆動信号または雑音駆動信号のいずれかであり得る。 LPCボコーダにより生ずる合成された音声は以下の3つの基本要素に分けら れ得る。 (1) たとえば、1つの母音を別の母音と区別し、合成フィルタ内のLPC により与えられるスペクトル情報。 (2) 有声音(たとえば母音およびz、r、l、w、v、nのような音)の 場合、音声信号は明確なピッチ周期(または周期性)を有し、これは(LTPか ら決定される)ピッチ周期の間隔をあけたパルスから大部分構成される周期的駆 動信号によって与えられる。 (3) 無声音(たとえばt、p、s、f、h)の場合、音声信号は、ランダ ムな雑音にはるかにより近く、周期性を全く有さず、これは雑音駆動信号によっ て与えられる。 図1に示されるように、合成フィルタにどの形式の駆動 信号が与えられるかをスイッチが制御する。利得が、出力音声の実際のボリュー ムレベルを制御する。駆動(2)および(3)の両方のタイプはしたがって時間 ドメインにおいては非常に異なる(一方は等間隔のパルスからなり、他方は雑音 のようである)が、両方とも周波数ドメインにおいては平坦なスペクトルという 共通の特性を有する。正しいスペクトルの形状が、LPCによる合成の出力で与 えられる。 なお、LPCボコーダの使用によると、音声シンセサイザに対してLPCおよ び駆動情報、つまりスイッチが音声シンセサイザに周期的駆動を与えるか雑音の ような駆動を与えるか、ということを伝送する必要があるのみである。この結果 、低減されたビット速度を用いて、LPCボコーダにおいて処理される音声信号 を送信することができる。 しかしながら、一般的なLPCボコーダのアプローチには、音声再生の品質、 つまり電話機の受話器で聞こえる音声に影響するいくつかの欠点がある。1つの 欠点は、パルスのような駆動または雑音のような駆動の間で選択を行なう必要性 があり、その決定は、そのときの入力音声の特性に基づいてフレーム毎になされ るということである。大きく発声しない音声(または多くのバックグラウンド雑 音がある状態での音声)の場合、このことは、2つのタイプの駆動信号の間にお ける切換を何度も生じさせて、音声の品質を深刻なほど劣化させ得る。 CELPボコーダは、周期的信号および雑音のような信号の両方を同じときに ONのままにすることによってこの問題を克服する。これらの信号の各々が合成 フィルタに与えるための駆動信号(e(n))をなす度合いは、2つの駆動の各 々に割当てられる別々の利得によって決定される。 したがって、 e(n)=β・p(n)+g・c(n) (1) であり、ここで、 p(n)=パルスのような周期的成分 c(n)=雑音のような成分 β=周期的成分に対する利得 g=雑音成分に対する利得 である。 g=0のとき、駆動信号は全くパルスのようになり、β=0のとき、駆動信号 は全く雑音のようになる。利得が両方とも0でないとき、駆動はこの2つを混合 したものとなる。 CELPボコーダと単純なLPCボコーダとの間において、他の1つの違いが 注目される。LPCボコーダにおける符号化動作中、入力音声はステップ毎の態 様で分析されて、入力音声のそのピッチ周期に対する最もあり得そうな値が何で あるかを決定する。注目すべき重要な点は、最良のピッチ周期についてのこの決 定が最終的なものであるという点である。可能性のある他のピッチ周期に対する 比較 は全くなされない。 CELPボコーダでは、周期的駆動成分またはピッチに対するアプローチはは るかに厳密である。考えられ得るピッチ周期の集合(男性、女性または子供であ れすべての話者に対して考えられ得るピッチの範囲をカバーする)から、すべて の考えられ得る値が順に試され、その値を仮定して音声が合成される。実際の音 声と合成された音声との間の誤差が計算されて、最小誤差を与えるピッチ周期が 選択される。各選択に対して誤差が計算されて、最適ピッチ値を選択するプロセ スの判断部に送り返されるため、この判断手順は閉ループアプローチである。対 照的に、従来のLPCボコーダは、誤差が明確には計算されず、可能性の集合か らどのピッチ周期を選択するかについての判断が全くなされない、開ループアプ ローチを用いる。 駆動信号の雑音成分についても考える。CELPボコーダは、その中に、各々 が1フレーム長である数百の(または恐らくは数千の)雑音のような信号を記憶 している。CELPボコーダは、これらの雑音のような信号の各々を順に用いて 出力音声を合成して、入力と合成音声信号との間において最小誤差を生ずるもの を選択するので、つまりこれは別の閉ループ手順である。この雑音のような信号 の記憶された集合は符号帳として知られており、符号帳信号の各々を順に探索し て最良のものを見つけるというプロセスは符号帳探索として知られている。閉ル ープCELPアプ ローチの大きな利点は、探索の終りには、所与の入力音声信号に対して最良の考 えられ得る値が選択されており、それが音声の品質における大きな改善をもたら すという点である。 CELP符号化技術の使用は、LPC値、LTP値および選択された符号帳信 号のアドレスのみの送信を要するということが注目される。駆動信号を送信する 必要はない。この結果、CELP符号化技術は、T1方式において音声チャネル 数を増加させるのに特に望ましい。 現在のCELP符号化技術に伴なう主な不利な点は、必要とされる計算力の量 である。CELP符号化では、符号帳エントリおよび考えられ得るピッチ値の大 きな集合を探索することが必要である。受信機が単に図2に示される単純な合成 構造からなるため、従来のCELPアプローチの非常な複雑さに影響されるのは 送信機のみである。この発明は、従来の符号帳探索を行なう必要性を克服する。 このような改良点の重要性を理解するために、従来のCELP符号化技術を再考 することが役に立つ。 一般的なCELP音声信号変換動作が図3に示される。図示されるように、変 換プロセスの順序は以下のとおりである。(i)LPC係数を計算し、(ii)L PC係数を用いてLTPパラメータ(つまり、最良のピッチ周期と、対応する利 得β)を決定し、(iii)符号帳探索においてLPC係数およびLTPパラメー タを用いて符号帳パラメータ (つまり、最良の符号語c(n)と、対応する利得g)を決定する。この発明に おいて、改良されているのはこの最終プロセスである。 符号帳探索法は、各符号帳ベクトル(c(n))を順に採り、それを合成フィ ルタに通し、出力信号を入力音声信号と比較し、誤差を最小限にすることからな る。ある前処理ステップが必要とされる。任意の特定のフレームの開始で、LT P(p(n))および符号帳(c(n))に関連付けられた駆動成分がさらに計 算される。しかしながら、たとえそのフレーム全体に対してこれらの信号の両方 が完全に0であったとしても、合成フィルタはそれでもそれに関連する何らかの 記憶を有し、それによって、入力が全くなくても現在のフレームに対して出力を 生ずる。合成フィルタの記憶によるこの出力のフレームはリンギングベクトルr (n)として知られている。数学的には、このリンギングベクトルは以下のフィ ルタリング演算によって表わすことができ、 ここで、{αi(i=1〜p)}はLPC係数の集合である。これがたとえ駆動信号 (e(n))が0であっても発生されるであろう出力合成音声信号(s′(n) )の成分である。しかしながら、e(n)をLPC合成フィルタに通すことによ って、以下のように表わされ得る信号y(n)が与え られ、 したがって、このe(n)に基づく信号は、リンギングベクトルと共に、合成さ れた音声信号 s′(n)=r(n)+y(n) (4) を生ずる。 上の等式またはディジタルフィルタリングの式はやや煩雑と思われる。CEL P符号化では、種々の処理演算を行列形式で表わすことが望ましい。まず、合成 フィルタについて考えられたい。フィルタのインパルス応答は、時間0での値+ 1のパルスを有する入力信号から得られる出力として定義される。ここで、LP C合成フィルタがインパルス応答a(n)(nは0〜(N−1)の範囲における 音声サンプルを表わし、Nはフレームまたはブロックの長さである。)を有する 場合、LPC合成フィルタのインパルス応答を表わす(N×N)行列を以下のよ うに作成できる。 符号帳信号c(n)は、行列形式で、(N×1)ベクトルcで表わされ得る。 このベクトルは、行列形式以外は、 c(n)と全く同一の要素を有する。LPC合成フィルタAのインパルス応答に よってcをフィルタリングする演算は、行列積Acで表わされ得る。この積は、 βが0に等しいときの等式(3)の信号y(n)と同じ結果を生ずる。 合成された出力音声ベクトルs′は、行列形式で、 s′=r+Ae として表わされ得、ここで、rおよびeは、それぞれ、信号r(n)、e(n) (リンギング信号および駆動信号)の(N×1)ベクトル表現である。結果は等 式(4)と同じであるが、ここでは行列形式である。等式(1)から、合成され た音声信号は行列形式で、 s′=r+A(β.p+g.c) =r+βAp+gAc (6) と書直すことができる。 s′は実際の入力音声ベクトルsに対する近似値であるた と書直すことができる。 上述の等式5、6および7の実現を示す、従来の、先行技術の符号帳探索が図 4に示される。まず、入力音声信号はリンギングベクトルrを取り除かれる。次 に、LTPベクトルp(つまり、駆動のピッチまたは周期的成分p(n))がL PC合成フィルタによってフィルタリングされてApにより表わされ、次いで減 算される。結果として生 じた信号は、項g Acにより近似される、いわゆる目標ベクトルxである。 実際の符号帳探索中、計算されなければならない2つの重要な変数(Ci,Gi )がある。これらは行列で、 Ci=cttx Gi=cttAc (8) で与えられ、ここで、Atは、LPC合成フィルタのインパルス応答行列Aの転 置である。等式(8)を解くと、Ci、Giの両方がスカラー値である(つまり、 単なる数であってベクトルではない)ことが明らかとなる。これらの2つの数は 、共に、どれが最良の符号ベクトルでありさらには最良の利得gであるかを決定 するので、重要である。 前に述べたように、符号帳には何百もの考えられ得るベクトルcがある。この 結果、各考えられ得る符号帳ベクトルに対してAcまたはcttを形成しないよう にするのが望ましい。このような結果は、xを目標ベクトルとし、AをLPC合 成フィルタのインパルス応答行列として、 d=Atx および F=AtA (9) となるように、2つの変数、(N×1)ベクトルdおよび(N×N)行列Fを符 号帳探索前に予め計算することによって達成される。dを予め形成するプロセス は「後ろ向きフィルタリング」として知られている。このような後ろ向きフィル タリングの結果、符号帳探索中は、以下の演算が 行なわれるだけでよい: Ci=ctd Gi=ctFc (10) 従来は、選択された符号帳ベクトルは、 に対する最も大きな値に関連付けられるベクトルである。所与の符号帳ベクトル に対する正しい利得gは、 によって与えられる。 残念なことに、この簡略化された符号帳探索でさえ、過剰な量の時間または過 剰な量の処理力のいずれかを必要とし得る。 CELPボコーダの一例が、ジャーソン(Gerson)の米国特許第4,817,1 57号に示されている。駆動符号ベクトルを有する符号帳を用いる音声符号化器 のための駆動ベクトル発生および探索技術が説明されている。基底ベクトルの集 合が、駆動信号符号語と共に用いられて、駆動ベクトルの符号帳を発生するとい われる。符号帳は、符号ベクトルが基底ベクトルからどのように発生されるかに ついての知識を用いて探索される。この特許の技術を実施することによって、複 雑さが約10倍低減されるということが主張されている。しかしながら、この技 術は符号帳ベクト ルの記憶を依然として要する。加えて、符号帳探索は各ベクトルに対し、以下の ステップを含む。すなわち、ベクトルをスケーリングするステップと、そのベク トルを長期予測子成分でフィルタリングしてピッチ情報をそのベクトルに加える ステップと、そのベクトルを短期予測子でフィルタリングしてスペクトル情報を 加えるステップと、スケーリングされ二重にフィルタリングされたベクトルを元 の音声信号から減算するステップと、その答を分析して最良の符号帳ベクトルが 選択されているかどうかを判断するステップとを含む。 したがって、相対的に大きな計算力を必要とすることなしに、適当な符号帳ベ クトルcを求めて符号帳を速やかに探索することのできるCELP符号化器が今 も要求されている。発明の概要 送信のためにアナログ音声信号がディジタル音声信号に変換される音声符号化 のための装置および方法において、先行技術の問題は克服され、この発明の利点 が達成される。CELP技術を利用する音声符号化器は、音声信号からスペクト ル情報をフィルタリングして出すための第1のフィルタを含む。スペクトル情報 は伝送のために与えられる。第2のフィルタが音声信号からピッチ情報をフィル タリングして出すために設けられ、このようなピッチ情報も伝送のために与えら れる。符号ベクトル発生器は、1つの実施 例において、音声信号を表わすバイパルス符号ベクトルの特性を決定する。この 実施例では、第1のフィルタのインパルス応答は符号ベクトル特性を決定するた めに先端が切捨てられる。この実施例では、符号ベクトルを決定するために用い られる従来の分数に関連した分子のみの検索を行なうことによって符号ベクトル 特性を決定することがさらに好ましい。別の実施例では、符号ベクトル発生器は 、符号ベクトルの可能性をパルスのような音声を表わすものから雑音のような音 声を表わすものに変換するための変換器を含む。この変換はアダマール変換であ ることが特に好ましい。変換された符号ベクトルをスクランブルしてシーケンシ 特性を変更することがさらに好ましい。さらに別の実施例では、バイパルス符号 ベクトル発生器およびスクランブルされた符号ベクトル発生器が、1つのパルス 符号ベクトル発生器と組合される。このような実施例では、3つの符号帳発生器 によって決定された特性を評価し、最良の符号帳ベクトルを与えるものの出力を 選択するための比較器を含むことが好ましい。図面の簡単な説明 この発明のこれらのおよび他の目的ならびに利点は、以下の図面と関連させる と、以下の詳細な説明からより明らかとなり、 図1は、先行技術の、一般的なLPCボコーダのブロック図であり、 図2は、従来技術の、一般的なCELPボコーダー受信機のブロック図であり 、 図3は、従来技術の、一般的なCELPボコーダー送信機のブロック図であり 、 図4は、従来技術のCELP符号帳探索のフローチャートであり、 図5は、この発明に従う適応音声符号化器の概略図であり、 図6は、送信の前に、図5に示される適応符号化器において行なわれる演算の 一般的なフローチャートであり、 図7は、この発明に従う符号帳探索技術のフローチャートであり、 図8は、この発明に従う別の符号帳探索技術のフローチャートであり、 図9は、音声合成を行なうために、受信の後の、図5に示される適応変換符号 化器において行なわれる動作のフローチャートである。好ましい実施例の詳細な説明 図面と関連付けてより詳細に説明するように、この発明は速度が大幅に減じら れている適応音声符号化のための新規な装置および方法として実施される。包括 的には、この発明は符号帳探索を行なうためのより効率的な方法を提供すること により、低い伝送速度に対してCELP符号化を強化する。 この発明に従って構成される適応CELP符号化器は図5に示されており一般 的に10として参照する。符号化器10の本体はディジタル信号プロセッサ12 であり、好ましい実施例ではテキサス州ヒューストン(Houston)のテキサス イ ンスツルメント社(Texas Instruments Inc.)により製造および販売されている TMS320C51ディジタル信号プロセッサである。こうしたプロセッサはワ ード長が16ビットのパルス符号変調信号を処理することができる。 プロセッサ12は3つの主要なバスネットワーク、すなわち直列ポートバス1 4、アドレスバス16、およびデータバス18に接続されている。この発明に従 うCELP符号化方法を実施するためにプロセッサ12が利用するプログラミン グをストアするためのプログラムメモリ20が設けられている。そうしたプログ ラミングについては図6から図9を参照してより詳細に説明する。プログラムメ モリ20はプロセッサ12の仕様に見合う十分な速度を有する ならば従来の設計による如何なるものでもよい。なお、好ましい実施例のプロセ ッサ(TMS320C51)は内部メモリを備える。プロセッサ12の動作中必 要かもしれないデータのストアのためにデータメモリ22が設けられる。 従来のクロック信号発生回路(図示せず)によってクロック信号がクロック入 力24に与えられる。好ましい実施例では、入力24に与えられるクロック信号 は20MHzのクロック信号である。プロセッサ12が最初に活性化されるとき など適切なときにプロセッサ12をリセットするためにリセット入力26もまた 与えられる。選択したプロセッサが要求する仕様を信号が満たす限りは入力26 にそのような信号を与えるためにどのような従来の回路を使用してもよい。 プロセッサ12は2つの方法で送受信通信信号に接続される。第1に、本発明 に従い構成されるCELP符号化器と通信するとき、プロセッサ12は直列ポー トバス14を介して信号を送受信するように接続される。バス14と圧縮された 音声データストリームとにインタフェースをするためにチャネルインタフェース 28が設けられる。インタフェース28は、予め定められた伝送速度で動作して いるデータストリームとの関連でデータの送受信を行なうことができるインタフ ェースなら既知のどのようなものでもよい。 第2に、既存の64kb/sチャネルまたはアナログ装 置と通信する場合、プロセッサ12はデータバス18を介して信号の送受信を行 なうように接続される。入力32に現れる個々の64kb/sチャネルを、直列 フォーマットから並列フォーマットに変換してバス18に与えるためのコンバー タ30が設けられる。プロセッサ12が利用するタイプの信号に対して用いるこ とができる既知のコーデックおよび直列/並列装置を利用してこうした変換を行 なうことができることが理解されるだろう。好ましい実施例では、プロセッサ1 2はバス18上で並列の16ビット信号を送受信する。バス18に与えられるデ ータをさらに同期化するために、割込信号が入力34でプロセッサ12に与えら れる。アナログ信号を受取るときは、アナログインタフェース36が予め定めら れた速度で係る信号をサンプリングすることによりアナログ信号を変換してコン バータ30に与える役割を果たす。送信の際には、インタフェース36はコンバ ータ30からのサンプリングされた信号を連続信号に変換する。 図6−9を参照して、図5に示される構成要素との関連で使用した場合に新規 のCELP符号化器をもたらすプログラミングについて説明する。この発明のC ELP技術に従い通信信号を伝送するための適応音声符号化が図6に示されてい る。 符号化され送信されるべき通信信号がバス18に現れ、入力バッファ40に与 えられる。このような通信信号は各 サンプルを16ビットPCMで表わしたものからなるサンプリングされた信号で あり、この場合サンプリングは8kHzの周波数で行なわれる。この発明を説明 するために、8kHzでサンプリングされる音声信号が伝送のために符号化され るものと仮定する。バッファ40は予め定められた数のサンプルをサンプルブロ ックに累積する。 42で音声サンプルの各ブロックに対するLPCが決定される。LPCを決定 する方法は、たとえば本明細書中に引用により援用するウィルソン(Wilson)らに よる米国特許第5,012,517号において述べられるような如何なる所望の方法とす ることもできる。なお、引用する米国特許は適応変換符号化に関するが、LPC を決定するためのものとして説明されている方法はこの発明にも適用可能である 。決定されたLPCは44で補足的情報として伝送するためのフォーマットとさ れる。決定したLPCはまた46でのLTP処理、特にLPC合成フィルタを形 成するために与えられる。 LTPが46で音声サンプルの各ブロックに対して決定される。前述したよう な既知の技術を用いて、周期性またはピッチに基づいた情報を決定できる。LT Pフィルタを導入するための基本的な前提条件は、正確なピッチまたは基本的な 周波数の評価の計算である。決定したLTPもまた、補足的な情報としての伝送 のためのフォーマットとされる。 なお、LTPを44で決定する際、等式(7)に従い、合成フィルタに関連す るリンギングベクトルが音声信号から取り除かれ、ベクトルp(LTPピッチ情 報を表わすもの)が音声信号から取り除かれ、そうすることによりターゲットベ クトルxを形成する。このようにして変更された音声信号はこの後、この発明に 従う符号帳探索のために与えられる。 本明細書中で述べるように、この発明では3つの形式の符号帳探索、すなわち 50でのバイパルス探索、52でのスクランブル探索、および54での単一パル ス探索が行なわれる。初めに図7に示すバイパルス探索技術について考察する。 符号帳には何百ものベクトルcが存在することが可能であることが思い出される であろう。可能な各ベクトルに対してAcまたはcttを形成することは望ましく ないため、符号帳探索の前に2つの変数、(N×1)ベクトルdおよび(N×N )マトリクスFが予め計算される(等式9)。後ろ向きフィルタ処理によりdを 予め形成するプロセスは60で行なわれる。 CELP符号化の計算全体において符号帳探索は非常に重要部分を占めるため 、効率的な探索の方策を用いて最良の符号語を計算することが大切である。しか しながら、効率的態様でCi、Giの計算をすることができるように符号帳を適所 に有することが重要である。 符号帳ベクトルcについての2つの主要な要求は、( i)平坦な周波数スペクトルを有すること(そうすれば合成フィルタによって特 有の音声各々に対し正しい形に作られるため)、および(ii)各符号語が互いに 十分な相違があるようにして、ほぼ等しいものをいくつも持つことによって符号 帳のエントリを浪費しないようにすることである。 この発明において、符号帳におけるすべてのエントリは実際上、それぞれ+1 および−1である2つのエントリを除きN個のサンプルすべてにおいて0である (N×1)ベクトルからなる。先に述べたように、Nの好ましい値は64である が、この発明の原理について説明するために、ベクトル当たりのサンプルの数が それよりも少ないものを示す。 各符号ベクトルcは以下の形式である。 この形式のベクトルは非0パルスを2つしか有さないためにバイパルスベクト ルと呼ばれる。このベクトルはスペクトルとして平坦であるという符号帳ベクト ルとして所望される特性を有する。+1パルスが可能なNの位置のいずれにあっ てもよく、−1パルスが(N−1)の位置のいずれにあってもよいため、可能な 組合せの総数はN(N−1)である。Nは64に等しいことが好ましいため、符 号帳の起こり得る大きさは4032ベクトルである。なお、符号帳ベクトルの形 式としてバイパルスベクトルを使用することにより、コードベクトルcにおける +1、−1パルスの位置がわかればすべての音声合成計算が可能である。必要な のは位置に関する情報のみであるので、符号帳をストアする必要はない。したが って、記憶容量が大きくなくても非常に大きな符号帳の効果を達成することがで きる。 バイパルスベクトルの性質、すなわち+1または−1いずれかを含む2つの位 置を除いてすべての位置に0があるという性質のため、等式(10)の算出のた めに必要であった計算は下記に還元される。 Ci=(di−dj) Gi=(Fii+Fjj−2Fij) (11) ここでdiはベクトルdの要素iであり、djはベクトルdの要素jであり、Fij はマトリクスFのi行j列の要素である。言い換えれば、1つの+1および1つ の−1要素を有するバイパルス符号語を用いることにより、最適符号 語の探索は位置情報のみを決定することに還元され、さらに等式(11)に従っ てdベクトルおよびFマトリクスにおける値の操作に還元される。 この効果的なバイパルス符号帳を用いる主な利点は、符号帳の大きさが実質上 非常に大きい(4032ベクトル)ため音声の質が優れていること、記憶につい ての要求が非常に低いこと、つまり等式(11)のように結果が計算できるため 「符号帳」そのものをストアする必要がないこと、 ために)Ci、Giを計算するのは非常に簡単であるため要求される計算力が低い ことである。 従来の符号帳探索の間は、フィルタ処理されたベクトルAcのうち現在のフレ ームにある部分のみが最適化され、次のフレームに進む部分は無視される。この ように、Ci、Giの値は、フレームの開始でパルスを有する符号帳ベクトルcに 対し、フレームにおいてそれよりも後にパルスを有する符号帳ベクトルcに対す るよりもより正確である。 この発明では、LPC合成フィルタのインパルス応答{an}の先端を切捨てて値 の数を少なくする、すなわち以下のように定義される新しいインパルス応答{a′n }を用いることにより、フィルタ処理されるベクトルの無視される部分の問題は 克服される。 a′n=an′ n=0からNTRUNC−1 =0 n=NTRUNCからN−1 (12) インパルス応答のこうした計算および切捨ては図7の62で行なわれる。 前述のように、合成フィルタのインパルス応答は64の値を含む、すなわちN =64である。切捨てという変形では、元のインパルス応答は、いくつかのサン プルの後に切捨てられる。したがって、フィルタ処理されたベクトルAcが生成 するエネルギは、パルスがどこで発生するにせよ、このフレームに集中する。N TRUNCの値は8であることが現在は好ましい。切捨てられたインパルス応答 に基づく(N×N)マトリクスFの計算は、64で前もって行なわれる(等式9 )。 この切捨てはバイパルス符号帳探索手順、すなわち各符号帳ベクトルcに対す るCi、Giを計算するためにのみ行なわれることに注意することが大切である。 Ci 2/Giを最大化することにより最良の符号語cが発見された後、全インパル ス応答{an}に基づいてこの特定の符号語に対するCi、Giの新しい組が計算され 、この全応答計算を利用して新しいゲインg=Ci/Giを計算する。 全応答計算をゲイン計算のために使用する理由は、切捨てられたインパルス応 答により、特定的なフレームに対して選び出される機会がすべてのパルス位置に とって等しくなるが、バイパルスプロセスにより生成されるCi、Giの値は、ゲ インがスケーリングされフィルタ処理された符号ベクトルgAcとターゲットベ クトルxとの誤差をもはや 正しく最小化しないという意味において「正確」でないということである。した がって、切捨てられていない応答を用いて、実際にこの誤差を最小とするゲイン gの値を計算しなければならない。 最適の符号語および適切なゲインを発見するために、従来の符号帳探索ではCi 2 /GiおよびCi/Giを用いたことが再考される。この発明を利用することに より、これらの値はより迅速に計算される。しかしながら、最良の符号帳ベクト ルを計算するのに必要な時間およびこうした計算の効率性をさらに改良すること が可能である。 好ましい実施例ではN=64であることを思い出して頂きたい。その結果、上 記のように簡素化された切捨てによる探索でさえN(N−1)すなわち4032 個のベクトルに対するCi、Giの計算が必要であり、必要となる処理力という点 においてはあまりにも高いであろう。この発明では、こうした可能な符号語のう ち非常に少数のサブセットのみが探索される。こうして探索が減じられることに よっても、全符号帳探索と略等しい性能がもたらされる。 この概念を理解するために、Giの構造をより詳細に考察する。フィルタ処理 された符号ベクトルAcをベクトルyと表現するとすれば、 y=Ac (13) となり、この等式の両側を転置すると以下のようになる。 yt=ctt (14) Giに対する等式(10)はしたがって次のようになる。 ここで{y(n} n=0からN−1}はベクトルyを構成するサンプルの組で ある。この等式は、Giは実際には、フィルタ処理された符号帳ベクトルyとそ れ自身との相関(すなわちこの信号における全エネルギ)であることを示す。も し符号帳ベクトルにおける2つのパルスの間隔が大きければ、+1パルスへのフ ィルタ応答は−1パルスへの応答と相互作用しないであろうし、したがってフィ ルタ処理されたベクトルyにおける全エネルギは非常に一貫しており、+1、− 1パルスがフレーム内で実際にどこにあるかに左右されないだろう。 このことは、Giが実際にはパルスの位置によって大きくは変化しないであろ うことを示唆している。このように、符号帳探索の間にCi 2/Giを最大化する ことは、単にCiを最大化することに略等しく、そうすれば符号帳探索がかなり 簡略化される。こうした単にCiを最大化するプロセスは、Ci 2/Giという式の うち分子Ciの計算のみを含むために「分子のみの探索」と呼ばれる。なお、上 記の切捨てられたインパルス応答を用いることについては既に述べたが、これよ り、+1、−1パルス各々へのフィルタ応答が短くされるため、2つの応答が相 互作用する機会がより少なくなる。このことから、Giがパルスの位置 から十分に独立したものであるという仮定がより有効になる。 分子のみの探索を利用して等式(11)をCi=(di−di)と修正すること が可能である。したがって、Ciの値を最大化するために必要なのは、diに対す る可能な正の最大値、およびdiに対する可能な負の値のみである。このように 、符号帳探索手順は単に、iを明らかにする最大の正の要素(符号帳ベクトルc における+1の位置)およびjを明らかにする最大の負の要素(符号帳ベクトル cにおける−1の位置)を求めてdベクトルをスキャンすることから構成される 。 分子のみの探索は、各符号ベクトルに対してCi、Giを計算するよりもはるか に簡単である。しかしながら、これはGiがすべてのパルス位置に対して一定で あるという仮定に基づくものであり、この仮定は、特に+1、−1パルスが互い に近接しているならば略有効であるにすぎない。この条件を緩和するために、後 ろ向きフィルタ処理が行なわれたベクトルdにおいて1つの正の最大値および1 つの負の最大値を発見する代わりに、(NDBUF)という数の正の最大値(N DBUFは1よりも大きな数である)およびNDBUF個の負の最大値の探索が 行なわれる。 こうした複数の探索により、d内でこれらの正の最大値および負の最大値、す なわち{i maxk k=1からNDBUF}および{j minl l=1か らNDBU F}がそれぞれ発生するサンプル位置がもたらされる。実際の正の最大値および 負の最大値はしたがって、{d(i maxk)k=1からNDBUF}および {d(j minl)l=1からNDBUF}により与えられる。パルスの位置 に伴なうGiの僅かな変化を許容するとしても、「最適な」符号語はなおも{d (i_maxk)}、{d(j minl)}という2つの集合に相当するパルス 位置から生じるであろうと仮定される。 図7に示すように、NDBUF個の正の最大要素およびNDBUF個の負の最 大要素を選択するためのこの分子の 0にセットされる。 複数のNDBUF個の値各々に対し、等式(11)の以下の変形から、70、 72でCi、Giを計算することができる。 Ci=d(i maxk)−d(j minl) Gi=F(i maxk,i maxk)+F(j minl,j minl) -2F(i maxk,j minl) (16) ここでF(i、j)は、マトリクスFのi行j列の要素である。Ci、Giの等式 を用いると、最大のCi 2/Giは、70、72、74、76および78を含むル ープで決 の新しい値が76で記録される。このループは、iおよびjのすべてのNDBU F個の変数が計算されるときまで続き、これは78で判断される。i maxk 、j minl双方に対する値はこのようにして、符号語cに対する最良のパル ス位置について発見される。伝送されるのはiおよびjのこの値、すなわち符号 ベクトルcにおける+1および−1の位置である。 等式(16)の計算の組は、可能なi maxk、j minlの各々に対して 行なわれることがわかる。各々についてNDBUF個であるということは、Ci 、Giの評価は全部でNDBUF2となる。NDBUFの値が5であると、パルス 位置の可能な各組に対するCi 2/Giの計算の全探索と同様の性能がもたらされ ることがわかっている。 要約すれば、分子のみの探索を行なって複雑さを減少させるプロセスは、Gi が略一定であるという仮定に基づいてCiの値の最大の組を計算することにより 、探索すべき符号ベクトルの数を略4000から約25にふるい分けて減じると いう効果を有する。こうした25の各々に対し、Ci、Giの双方が(切捨てられ たインパルス応答を用いて)計算され、最良の符号語(+1および−1の位置) が発見される。この1つの最良の符号語に対し、切捨てられていないインパルス 応答を用いて、80で符号帳のゲインgを計算する。iおよびjの位置もゲイン gも伝送のため に与えられる。 図6の52で行なわれるスクランブル符号帳探索について考察する。有声音( すなわち明確な周期性を有する母音およびz、r、l、w、nなどの音)に対し 、図2におけるLPC合成フィルタへの駆動が、LTPによりかなりの程度まで 与えられる、すなわち図2の用語では、Bは大きく、gは小さい。しかしながら 、無声音には周期性がなく、符号帳によるモデル化が必要である。しかしながら 、こうしたモデル化のために50でのバイパルス探索技術を用いることは部分的 に成功するにすぎない。 無声音は、明確なタイプに分類可能である。破裂音(たとえばt、p、k)に ついては、音声の波形は、すぐにほとんどゼロに減衰する鋭いパルスに似ている 。上記のバイパルス符号帳は、そのものがパルスから構成されるためにこういっ た信号を表現するのに非常に効果的である。しかしながら、無声信号の他の種類 のものは摩擦子音(たとえばs、sh、f)であり、その音声の波形はランダム 雑音に似ている。このタイプの信号は、バイパルス符号帳が生成するパルスのシ ーケンスによりうまくモデル化されず、こういった信号に対してバイパルスを用 いることで、出力される音声に非常に耳障りな性質を導入することになる。 この問題についての1つの解決策は、雑音のような波形に基づく従来のランダ ム符号帳をバイパルス符号帳と並列して用いて、その信号を最適にモデル化する ときにバイパ ルス符号帳を用いるようにし、無声音声のあるタイプのモデル化にはそれに最適 なランダム符号帳を用いることである。しかしながら、この方策の不利な点は前 述のように、ランダム符号帳の探索はバイパルス符号帳の探索よりもはるかに困 難であるという点である。 理想的な解決法は、バイパルス符号帳ベクトルを採用し、それらが雑音のよう な波形を生成するように何らかの形でそれらベクトルを変換することである。各 フレームにおいてこの計算が何度も行なわれるため、このような演算では変換の 計算が簡単であることという制約がさらに課される。好ましい実施例の変換は、 アダマール変換を利用して達成される。アダマール変換は既知であるが、以下の 目的のために用いることは新規である。 アダマール変換は、符号帳ベクトルcに対して作用する(N×N)変換マトリ クスHと関連付けられる。アダマール変換は2のべき乗であるNのすべてのサイ ズに対して存在し、たとえばN=8に関連付けられた変換マトリクスは以下のよ うになる。 Nのすべての値についても当てはまるが、この変換マトリクスについての2つ の一般的な注意点は以下のとおりである。 (i) 要素はすべて+1、−1であり、それぞれがマトリクスの半分を構成す る。 (ii) 変換マトリクスは対称、すなわち、H=Htである。 バイパルス符号帳ベクトルcに関連する(N×1)の変換された符号帳ベクト ルc′は以下のようにして形成される。 c′=Hc (18) 変換された符号ベクトルを等式(8)においてcの代わりに用いてGi、Ciを 計算し、最適な符号ベクトルを発見することができる。cはi行の+1およびj 行の−1という2つの非0要素しか有さぬため、変換c′=Hcを形成する効果は 以下のようになる。 c′=(Hの列i)−(Hの列j) (19) 変換された符号ベクトルc′の要素は、3つの値0、−2、+2のうちの1つ を有するであろう。c′内で発生するこれら3つの値の実際の比はそれぞれ、1 /2、1/4、1/4であろう。この符号ベクトルの形式は(3つの明確な値を 有するため)3値コードベクトルと呼ばれる。従来のランダムCELP符号帳で も3値ベクトルは用いられているが、この発明の3値ベクトル処理は新規である 。 しかしながら、この新しい方策には1つの問題がある。 等式(17)では、Hの列(または行)では、異なる頻度で符号が+1から−1 またはその逆に変わる。符号の変化の頻度は、以下のように規定される、シーケ ンシという項に定式化される。 変換マトリクスHの列のシーケンシは、非常に広範囲である。c′は等式(1 9)のようにHの列の組合せからなるため、ある音声フレームではc′内に符号 の多くの変化があり、あるフレームでは変化が比較的少ない c′ベクトルがある という点において、ベクトル c′はHと同様のシーケンシ特性を有するだろう。 実際のシーケンシは、c内の+1、−1のパルス位置次第であろう。 シーケンシの高い c′ベクトルは、高周波数の大量のエネルギが支配的な周波 数変換特性を有し、シーケンシの低い c′は主として周波数の低い要素を有する 。この広範囲のシーケンシの効果は、1つのフレームから次のフレームへと、出 力音声の周波数の内容に非常に早い変化があることである。このことには、合成 された音声に、震えるような、水中効果に近いものを導入するという影響がある 。 したがって、3値符号語 c′といった雑音のような符号ベクトルを生成する一 方で、1つのフレームから次のフレームへと符号語においてより一貫したシーケ ンシを生み出すようにこの方策を修正することが好ましい。好ましい実施 例では、以下の形式の「スクランブルマトリクス」Sを導入することにより、よ り一貫したシーケンシという結果がもたらされる。 主対角線に沿う要素は+1または−1としてランダムに選択される。特に好まし い実施例では、時間と共にまたはフレームからフレームへと変化しない、予め定 められた、固定された選択を+1および−1について行なう。先に述べたように 、好ましい実施例ではNが64である。スクランブルマトリクスSに対する好ま しい64の対角の値は、以下のとおりである。 新しい変換およびスクランブルされたコードベクトル c″は以下により与えら れる。 c″=SHc (21) Sマトリクスの効果は、c′=Hcにおける各要素を取り出し、ランダムにその 符号を反転したりしなかったり することである。その結果 c′のシーケンシ特性は「破壊され」、そのため結果 として生じるベクトル c″は、バイパルスベクトルc内でのパルスの位置がどこ であっても略同じシーケンシを有することになる。しかしながら、c″はなおも 以前と同じ比の値(0、+2、−2)から構成されるため、符号帳の雑音のよう な特性は保たれる。このスクランブルマトリクスを用いる正味の効果は、震えの ような歪みを取り除き、s、fといった音声入力に対しより自然な雑音のような 出力を生成することである。 これら2つのマトリクスS、Hを加えることにより、この方策の複雑さが大幅 に増すように思われる。しかしながら、複雑さは増すにしても、それは望ましく ないものでは決してない。 図8を参照して、46で以前に発生しているターゲットベクトルxが再び後ろ 向きフィルタ処理されて82でベクトルdを形成する。 前のように各符号語 c″に対し計算される2つのパラメータは、Ci、Giであ り、等式(8)のcを c″で置換えることにより形成される。 Ci=c″ttx Gi=c″ttAc″ (22) 等式(21)よりc″t=ctttであり、H、S双方が対称である(すなわち Ht=H、St=Sである)という特性を用いると、以下が得られる。 Ci=cttttx=ctHSAtx Gi=cttttASHc=ctHSAtASHc (23) 上記の後ろ向きフィルタ処理の技術について説明する場合、考えとしては各符 号ベクトルcについてcttを形成する必要性を回避するためにd=Atxを予め 計算することであった。等式(23)において同様の考え方を利用して、84で 以下のように d″を予め計算することができる。 d″=HSAtx (24) この計算は3つの段からなる。すなわち、(i)Atxの計算は単に上記の後ろ 向きフィルタ処理動作であり、(ii)何らかのエントリの符号の反転を含むだけ であるためにスクランブルマトリクスSマトリクスによる乗算は大きな意味を持 たない。なお、全体の(N×N)マトリクス)ではなくS内の+1、−1という エントリをストアする必要があるだけである。(iii)アダマール変換は高速ア ルゴリズムで効率的に計算可能である。 一旦 d″が計算されれば、残りは以下よりCiを計算することだけである。 Ci=ctd″ (25) 但しcはまだバイパルスベクトルである。これは等式(10)のdをd″で置き 換えたものと同じであり、バイパルス符号帳の探索を簡素化するために用いた同 じ原理がこのスクランブルアダマール符号帳(SHC)に対しても用いられる。 特に、分子のみの探索を用いて、探索される符号 帳のエントリの数をN(N−1)からNDBUF2に減じることができる。これ らNDBUF2の可能性について、Ci、Giの両方が計算され、Ci 2/Giを最大 化する符号語が発見される。ここでGiの計算をより詳しく調べてみる。y″=A c″とすると、等式(22)を以下のようにすることができる。 Gi=y″ty″ (26) 上記は単にこのフィルタ処理された信号 y″とそれ自身との相関でしかない。し かしながら、この式をさらに簡略化することができないため、この方策を用いて Giを計算しなければならない。このプロセスは計算上はやや費用がかかる(そ れほど大きくはないが)ため、この計算が必要とされる回数を最小とすることが 望ましい。CiはNDBUF2回のみ計算されるため、NDBUF=1という値が 好ましくは選択される。このことは、86でベクトル d″における正の最大エン トリおよび負の最大エントリのみが探索され、これら極値の位置により88で発 生する符号ベクトルcにおけるパルスの位置が与えられることを示している。ス クランブルされた符号ベクトル c″は90で形成され、92でLPC合成フィル タを通してフィルタ処理された y″を形成する。94で等式(25)を用いて値 Ci形成され、等式(26)を用いて値Giが形成され、とちらも切捨てられてい ないインパルス応答を有し、ゲインg=Ci、Giが最終的に評価できる。 次に図6の54で行なわれる単一パルス符号帳探索について考察する。この単 一パルス符号帳は、+1の値を有するひとつを除いてすべてのサンプルにおいて 0であるベクトルからなる。この符号帳はバイパルス符号帳に形式の上で似てい るのみでなく、計算の上での詳細についても似ている。したがって、図7に示す ものと同様のフローチャートは示されていない。符号語cの行kで+1の値が発 生すれば、Ci、Giの値は以下のようにして計算される。 Ci=dk i=Fkk (27) その他ほとんどの点においては、この符号帳はバイパルス符号帳と等しいため 、符号帳探索および分子のみの探索のための切捨てられたインパルス応答という 概念が再び利用される。 用いる符号帳探索方法は3つであるため、あるフレーム中にどの符号帳ベクト ルを用いるかを決定する必要がある。図6の比較器100で行なわれる決定は一 般に、どの符号帳ベクトルが合成された音声と入力音声信号との間の誤差を最小 限にするか、または等価的には、どの符号帳ベクトルがCi 2/Giに対して最大 値を有するかという決定を含む。この方策は、バイパルス符号帳と単一パルス符 号帳との間で選択を行なう場合に有効である。しかしながら、SHCはその他と は大きく異なるため、少し修正を行なうことが必要である。 修正する理由は、SHCは摩擦無声音(たとえばs、f、sh)に対してうま く作用するように設計されていることである。これらの音に関連する音声波形は 、時折大きなスパイク/パルスを伴なう雑音のような波形からなるものとしてう まく説明される。バイパルス符号帳はこれらのスパイクをうまく表わすが雑音要 素についてはそうでなく、一方SHCは雑音要素をモデル化するがスパイクに対 する性能は比較的劣る。 Ci 2/Giの最大化が入力および合成された音声信号間の二乗誤差の最小化と 関連付けされているため、スパイクでの誤差は全誤差において非常に大きく重み 付けされ、そのためにSHCはたとえ摩擦音声入力に対しても大きな二乗誤差を 時折もたらすだろう。しかしながら、二乗誤差は必ずしも最良の誤差基準ではな い、というのも耳そのものがdB(すなわちlog)スケールでの信号に敏感で あり、そのことにより小さな信号が大きな信号と比べてもつ重みは、二乗誤差基 準が示すよりも高いためである。これは、たとえSHCの選択が概念的には最良 の選択であったとしても、二乗誤差基準が同じ最終的な選択とはならないかもし れないことを意味する。 したがって、図6の102において、SHCに有利なようにその決定に人工的 に重み付けを行なうことが必要である。再び図8を参照して、このことを達成す る方法は、各符号帳に対しCi 2/Giを計算し、次にその他の符号帳 についての対応する値と比較する前に、104で重み係数γによりSHCに対し て乗算することである。γ=1.25という値を用いることが好ましい。この値 により、SHCが最良の性能を発揮することのできる信号(たとえば無声摩擦音 およびその他の雑音の多い信号)に対しSHCが選択され、一方破裂音といった 信号についてはバイパルスおよび単一パルス符号帳が用いられることが確実とな る。 よびゲインgが形成されて44(図6)でのフォーマット化のために提供される 。フォーマット化された情報を、バス14に与えるためにTxバッファ110に 提供する。 図9を参照して、本発明に従い形成される受信機が開示されている。なお、図 9は図6と同様、図5に示す装置10との関連で用いられるプログラミングを表 わすものである。バス18に現れる伝送された通信信号は、単一のブロックに関 連するすべてのビットが相対的に同時に動作できるようにするために、120で 最初にバッファされる。バッファされた信号はその後122で元の形に戻される 。LPC情報は合成フィルタ124に与えられる。LTP情報は周期的駆動発生 器126に与えられる。発生器126の出力は、乗算器128でゲインBで乗算 される。図5の100で選択される特定的な探索方法の識別とともにiおよびj 情報が、符号ベクトル構成発生器130に与えられる。発生器130の出力は、 乗算器132でゲインgにより乗 算される。乗算器128および132の出力は総和器134で合計される。合計 された信号は駆動信号として合成フィルタ124に与えられる。 前述のように、符号帳探索方法各々について異なる符号ベクトルcが発生され る。したがって、利用される符号帳探索方法の識別により、適切な符号ベクトル の構成が可能になる。たとえば、もしバイパルス探索を用いると、符号ベクトル はi行で+1を有し、j行で−1を有するバイパルスとなる。スクランブル探索 技術を用いれば、パルスの位置がわかっているためSHCに対する符号ベクトル cを簡単に形成することができる。このベクトルは次に変換されスクランブルさ れる。その後132でゲインのスケーリングが行なわれ、124でフィルタ処理 されて出力音声ベクトルgASHcを形成する。もし単一パルス方法を用いると、 符号ベクトルcを素早く構成することができる。 本発明は特定的な実施例について説明されているが、以下の請求の範囲におい て本明細書中で述べるこの発明の原理から逸脱することなく、変形および修正が 行なわれ得ることを当業者は理解するであろう。

Claims (1)

  1. 【特許請求の範囲】 1.音声信号を符号化する音声符号化器において符号語を決定するための装置で あって、前記音声符号化器はリンギング情報およびピッチ情報を取り除くために 前記音声信号をフィルタリングすることに応答して形成される目標信号を与え、 前記音声符号化器は前記音声信号に応答して線形予測係数合成フィルタを与え、 前記装置は、 前記合成フィルタのインパルス応答を決定するためのインパルス応答手段と、 前記インパルス応答で前記目標信号をフィルタリングし、 それによって探索信号を形成するための第1のフィルタと、 最大の正の値および最大の負の値の位置を求めて前記探索信号を探索するため の探索手段と、 一連の値を含む符号語を形成するための形成手段とを含み、符号語内のすべて の値は第1の値および第2の値を除いて0であり、前記第1の値は前記正の最大 値の位置に応答して前記符号語内に位置され、前記第2の値は前記負の最大値の 位置に応答して位置される、音声信号を符号化する音声符号化器において符号語 を決定するための装置。 2.前記第1の値は+1であり、前記第2の値は−1である、請求項1に記載の 装置。 3.前記インパルスは一連のインパルス応答値を含み、前記インパルス応答手段 はインパルス応答値の数を切捨てるための切捨手段を含む、請求項1に記載の装 置。 4.前記符号語に関連して利得値を決定するための利得手段をさらに含み、前記 利得手段は全インパルス応答に関連して前記利得値を計算する、請求項3に記載 の装置。 5.前記符号語を変換するための変換手段をさらに含み、前記符号語は変換され ることに関連して決定される、請求項1に記載の装置。 6.前記変換はアダマール変換である、請求項5に記載の装置。 7.送信のためにアナログ音声信号をディジタル音声信号に変換するための音声 符号化器であって、前記音声符号化器は、 前記音声信号からスペクトル情報をフィルタリングして出し、送信のために前 記スペクトル情報を与えるための第1のフィルタと、 前記音声信号からピッチ情報をフィルタリングして出し、送信のために前記ピ ッチ情報を与えるための第2のフィルタと、 前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に 、音声信号を表わすバイパルス符号ベクトルの特性を決定し、送信のために前記 特性を与えるための符号ベクトル発生器とを含む、音声符号化器。 8.前記第1のフィルタはインパルス応答を有し、前記符号ベクトル発生器は、 前記インパルス応答を切捨ててそのような切捨てられたインパルス応答を用いて 前記特性を決 定するためのトランケータを含む、請求項7に記載の符号化器。 9.前記特性は、多数の符号ベクトルの可能性に関連して分子と分母とを有する 分数の値を計算することにより決定されることができ、前記符号ベクトル発生器 は、前記分子を計算して前記分子を検査するだけでどれが正の最大値であり負の 最大値であるかを判断する、請求項7に記載の符号化器。 10.前記符号ベクトル発生器は、前記分子に対して、正の最大値の集合と負の 最大値の集合とを決定する、請求項9に記載の符号化器。 11.送信のためにアナログ音声信号をディジタル音声信号に変換するための音 声符号化器であって、前記音声符号化器は、 前記音声信号からスペクトル情報をフィルタリングして出し、送信のために前 記スペクトル情報を与えるための第1のフィルタと、 前記音声信号からピッチ情報をフィルタリングして出し、送信のために前記ピ ッチ情報を与えるための第2のフィルタと、 前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に 、音声信号を表わすバイパルス符号ベクトルの特性を決定し、送信のために前記 特性を与えるための符号ベクトル発生器とを含み、前記符号ベクトル発 生器は符号ベクトルの可能性をパルス状音声を表わすものから雑音状音声を表わ すものに変換する変換手段を含む、音声符号化器。 12.前記変換手段はアダマール変換を含む、請求項11に記載の符号化器。 13.前記符号ベクトル発生器は、変換された符号ベクトルの可能性のシーケン シ特性を変更するためのスクランブラをさらに含む、請求項12に記載の符号化 器。 14.前記特性は、多数の符号ベクトルの可能性に関連して分子と分母とを有す る分数の値を計算することにより決定されることができ、前記符号ベクトル発生 器は、前記分子を計算して前記分子を検査するだけでどれが正の最大値であり負 の最大値であるかを判断する、請求項13に記載の符号化器。 15.送信のためにアナログ音声信号をディジタル音声信号に変換するための音 声符号化器であって、前記音声符号化器は、 前記音声信号からスペクトル情報をフィルタリングして出し、送信のために前 記スペクトル情報を与えるための第1のフィルタと、 前記音声信号からピッチ情報をフィルタリングして出し、送信のために前記ピ ッチ情報を与えるための第2のフィルタと、 前記スペクトル情報と前記ピッチ情報とがフィルタリン グされて出された後に、音声信号を表わすバイパルス符号ベクトルの第1の特性 を決定し、送信のために前記第1の特性を与えるための第1の符号ベクトル発生 器と、 前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に 、音声信号を表わすバイパルス符号ベクトルの第2の特性を決定し、送信のため に前記第2の特性を与えるための第2の符号ベクトル発生器とを含み、前記符号 ベクトル発生器は符号ベクトルの可能性をパルス状音声を表わすものから雑音状 音声を表わすものに変換する変換手段を含み、前記音声符号化器はさらに、 前記スペクトル情報と前記ピッチ情報とがフィルタリングされて出された後に 、音声信号を表わす単一パルス符号ベクトルの第3の特性を決定し、送信のため に前記第3の特性を与えるための第3の符号ベクトル発生器と、 前記第1、第2および第3の符号帳発生器によって決定された特性を評価して 、前記第1、第2または第3の特性の1つを選択するための比較器とを含む、音 声符号化器。 16.前記第1、第2および第3の特性の1つに重み係数を与えるためのウェイ タをさらに含む、請求項15に記載の符号化器。 17.前記重み係数は前記第2の特性に与えられる、請求項16に記載の符号化 器。
JP7507532A 1993-08-27 1993-08-27 符号駆動線形予測を備える適応音声符号化器 Pending JPH09506182A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1993/008095 WO1995006310A1 (en) 1993-08-27 1993-08-27 Adaptive speech coder having code excited linear prediction

Publications (1)

Publication Number Publication Date
JPH09506182A true JPH09506182A (ja) 1997-06-17

Family

ID=22236901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7507532A Pending JPH09506182A (ja) 1993-08-27 1993-08-27 符号駆動線形予測を備える適応音声符号化器

Country Status (4)

Country Link
EP (1) EP0803117A1 (ja)
JP (1) JPH09506182A (ja)
AU (1) AU5095193A (ja)
WO (1) WO1995006310A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100510399B1 (ko) * 1998-02-17 2005-08-30 모토로라 인코포레이티드 고정 코드북내의 최적 벡터의 고속 결정 방법 및 장치
CN101609677B (zh) 2009-03-13 2012-01-04 华为技术有限公司 一种预处理方法、装置及编码设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02250100A (ja) * 1989-03-24 1990-10-05 Mitsubishi Electric Corp 音声符合化装置
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
JPH0398318A (ja) * 1989-09-11 1991-04-23 Fujitsu Ltd 音声符号化方式
JPH0451200A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化方式
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction

Also Published As

Publication number Publication date
AU5095193A (en) 1995-03-21
WO1995006310A1 (en) 1995-03-02
EP0803117A4 (ja) 1997-10-29
EP0803117A1 (en) 1997-10-29

Similar Documents

Publication Publication Date Title
US5717824A (en) Adaptive speech coder having code excited linear predictor with multiple codebook searches
US5457783A (en) Adaptive speech coder having code excited linear prediction
US6098041A (en) Speech synthesis system
KR100615113B1 (ko) 주기적 음성 코딩
CN100369112C (zh) 可变速率语音编码
US5903866A (en) Waveform interpolation speech coding using splines
JP4005359B2 (ja) 音声符号化及び音声復号化装置
US6006174A (en) Multiple impulse excitation speech encoder and decoder
JP3446764B2 (ja) 音声合成システム及び音声合成サーバ
US5235670A (en) Multiple impulse excitation speech encoder and decoder
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JPH09506182A (ja) 符号駆動線形予測を備える適応音声符号化器
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH11259098A (ja) 音声符号化/復号化方法
JP2003323200A (ja) 音声符号化のための線形予測係数の勾配降下最適化
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
US20050154585A1 (en) Multi-pulse speech coding/decoding with reduced convolution processing
JP3035960B2 (ja) 音声符号化復号化方法及びその装置
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置
JP2003202884A (ja) 音声合成システム
Kwong et al. Design and implementation of a parametric speech coder
JPH09297597A (ja) 高能率音声伝送方法及び高能率音声伝送装置
Gardner et al. Survey of speech-coding techniques for digital cellular communication systems
Ould-cheikh WIDE BAND SPEECH CODER AT 13 K bit/s
JPH02100100A (ja) 音声符号化・復号化方法及び音声符号化装置並びに音声復号化装置