JPH11504438A - 分析合成線形予測音声符号化における利得量子化方法 - Google Patents

分析合成線形予測音声符号化における利得量子化方法

Info

Publication number
JPH11504438A
JPH11504438A JP8533222A JP53322296A JPH11504438A JP H11504438 A JPH11504438 A JP H11504438A JP 8533222 A JP8533222 A JP 8533222A JP 53322296 A JP53322296 A JP 53322296A JP H11504438 A JPH11504438 A JP H11504438A
Authority
JP
Japan
Prior art keywords
codebook
gain
optimal
vector
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8533222A
Other languages
English (en)
Other versions
JP4059350B2 (ja
Inventor
ティムネル,イルバ
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Publication of JPH11504438A publication Critical patent/JPH11504438A/ja
Application granted granted Critical
Publication of JP4059350B2 publication Critical patent/JP4059350B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 分析合成線形予測音声符号化における利得量子化方法であって、第1コードブックからの最適励起ベクトルのための第1利得(GAINI)を決定し、第1利得(GAINI)を量子化し、第2コードブックからの最適励起ベクトルのために最適第2利得(GAIN2)を決定し、量子化された第1利得(GAINI)から第2利得(GAIN2)の対数の線形予測を決定し、第2利得の対数と線形予測の間の差(δ)を定量化することを含む。

Description

【発明の詳細な説明】 分析合成線形予測音声符号化における利得量子化方法 技術分野 この発明は、分析合成線形予測音声符号化における利得量子化方法に関し、特 に移動電話方式のためのものに関する。 発明の背景 分析合成線形予測音声符号器は、通常、長期予測器すなわち適応型コードブッ クと、これに続く一つまたはいくつかの固定コードブックを有する。そうした音 声符号器は、例えば[1]に記述されている。そうした音声符号器における全励 起ベクトルは、複数のコードブックベクトルV1の線形結合として記述でき、各 コードブックベクトルV1は、対応する利得G1により乗算されるようになってい る。これらのコードブックは、順次的に探索される。通常、第1コードブックか らの励起は、次のコードブックがサーチされる以前に、目的信号(音声信号)か ら差し引かれる。他の方法は直交探索であって、ここではその後のコードブック 内の全ベクトルは、選択されたコードブックベクトルにより直交される。こうし て、複数のコードブックが独立にされ、全てが、同一の目的信号へ向けて探索さ れ得る。 任意の数のコードブックを有する一般化されたCELP符号器のための探索方 法と利得量子化は、[2]の中で説明されている。 複数のコードブックの利得は、通常別々に量子化されるが、一緒に量子化した ベクトルでもあり得る。 [3]に記述された符号器において、二つの固定コードブックが一つの適応型 コードブックに結合されている。これらのコードブックは、直交させて探索され る。適当な領域への変換の後に、固定コードブックの利得は、適応型コードブッ クの利得と共にベクトル量子化される。最良の量子化器指数は、一つの新しい分 析合成ループ内の全ての可能性をテストとすることにより、発見される。類似の 量子化方法は、ACELP符号器[4]に使用されているが、この場合は標準コ ードブック探索法が使用されている。 選択されたLTPベクトルおよび、第2のコードブックのために、第1のコー トブックから選択されたベクトルを使用して、量子化境界を適応的に計算する方 法が[5、6]に記述されている。 一つの方法が[2]に示唆されており、これによればLTPコードブックの利 得は標準化されたコードブックのベクトルに関係して量子化される。適応型コー ドブックの利得はフレームエネルギに関係して定量化される。比率g2/g1、g3 /g2、...は、不平等量子化器内で定量化される。利得のベクトル量子化を 使用するためには、励起ベクトルが選択された後に利得が量子化されなければな らない。これは、最初に探索されたコードブックの正確な利得がその後のコード ブック探索の時には知られないと言うことを意味する。伝統的な探索方法を使用 した場合、正しい目的信号がその後のゴードブックのために計算できず、その後 の探索は従って最適ではない。 直交探索法を使用した場合コードブック探索は以前のコードブックの利得から 独立している。こうしてこの利得はコードブック探索の後に量子化され、ベクト ル量子化が使用可能である。しかしながらコードブックの直交化は、しばしば非 常に複雑であり、[3]でのように直交化を能率的にするようにコードブックが 特別に設計されなければ通常実用的でない。ベクトル量子化を使用する場合最良 の利得は通常一つの新しい分析合成ループ内で選択される。利得はスカラ量であ るので、フィルタリングプロセスの外へ移すことができ、これがコードブック探 索における分析合成ループに比較して計算を単純化するが、しかしこの方法はそ れでも独立の量子化に比べてはるかに複雑である。他の欠点はベクトル指数がチ ャネルエラーに非常に傷つきやすく、その理由は指数内の1ビットのエラーは全 く異なった利得のセットを与えるからである。この見地から独立の量子化がより 良い選択である。しかしながら、他の量子化方法と同一の効率を達成するために は、この方法のためにより多くのビットを使用しなければならない。 [5、6]に記述された適応した量子化限界(limit)を有する方法は複 雑な計算を含み、移動電話方式のような複雑度の低いシステムには利用できない 。また、最後のコードブックの利得の復号が全ての先行の利得とベクトルの正確 な 伝送に依存するので、この方法はチャネルエラーに対して非常に敏感であると予 想される。 利得比率の量子化が[2]に記述されたようにチャネルエラーに対して強く、 またあまり複雑でない。しかしながらこの方法は不平等量子化器の訓練を必要と し、この事が訓練に使用されない他の信号に対して符号器の強さを少なくする可 能性がある。この方法もまた非常に柔軟性が少ない。 発明の要約 この発明の一つの目的は、上記の諸問題の大部分を減少または除去する分析合 成線形予測音声符号化の改良された利得量子化方法である。特にこの方法は複雑 性が低く、チャネルエラーに敏感でない量子化された利得を与え、また独立利得 量子化法よりもより少ないビットを使うことである。 上記の諸目的は請求項1による方法により達成される。 図面の簡単な説明 この発明は、そのさらなる目的と長所と共に、添付の図面と共にする以下の説 明を参照することにより最もよく理解されるであろう。すなわち、 図1は、この発明の方法を使用し得る分析合成線形予測音声符号器の一実施例 のブロック図である。 図2は、この発明の方法を使用し得る分析合成線形予測音声符号器のもう一つ の実施例のブロック図である。 図3は、マルチパルス励起(MPE)の諸原則を図示する。 図4は、変換バイナリパルス励起(TBPE)の諸原則を図示する。 図5は、一つのコードブックからの最適利得および次のコードブックからの最 適利得の分布を図示する。 図6は、一つのコードブックからの量子化された利得と次のコードブックから の最適利得の間の分布を図示する。 図7は、一つのコードブックの最適利得のダイナミックレンジを示す。 図8は、この発明によるパラメータδのより小さなダイナミックレンジを示し 、図7の利得に置き換わるものである。 図9は、この発明による方法を図示するフローチャートである。 図10は、この発明による方法を使用する音声符号器の一実施例である。 図11は、この発明による方法を使用する音声符号器のもう一つの実施例であ る。 図12は、この発明による方法を使用する音声符号器のもう一つの実施例であ る。 好ましい実施例の詳細な説明 以下の説明における数値例は、ヨーロッパのGSMシステムを参照する。しか しながら、この発明の諸原則は、他のセルラシステムにも同様に適用し得ること を、理解すべきである。 複数の図面を通じて、同一の参照指定は、対応または類似の要素のために使用 される。 この発明による利得量子化方法を説明する前に、まずこの発明が使用され得る 音声符号器の例を説明することが助けになるであろう。これは、図1および図2 を参照して行われる。 図1は、典型的な分析合成線形予測音声符号器のブロック図を示す。この符号 器は、垂直なダッシュ記号の中心線の左に合成部を、また前記線の右に分析部を 含んでなる。合成部は本質的に二つの部分、すなわち、励起コード生成部10と LPC合成フィルタ12を含む。励起コード生成部10は、適合型コードブック 14、固定コードブック16、加算器18を含んでなる。適応型コードブック1 4から選ばれたベクトルaI(n)が、利得要素gIQ(Qは、量子化される値を 示す)により乗算されて、信号p(n)を形成する。同様に固定コードブック1 6からの励起ベクトルが利得要素gJQで乗算されて、信号f(n)を形成する。 信号p(n)と信号f(n)が加算器18で加算されて、励起ベクトルex(n ) (n)を形成する。 信号ベクトルs(n)から差し引かれて、誤差信号e(n)を形成する。この誤 差信号は、重みフィルタ22へ提出されて、重み付き誤差ベクトルeW(n)を 形成する。この重み付き誤差ベクトルの諸成分はユニット24内で平方され合計 されて、重み付き誤差ベクトルのエネルギーの測度を形成する。 最小化ユニット26は、最小エネルギー値を与えるような利得gIQと適応型コ ードブック12からのベクトルの組み合わせ、および利得gJQと固定コードブッ ク16からのベクトルの組み合わせを選択し、この値は、フィルタ12でフィル タリングの後に音声信号ベクトルs(n)に最も良く近似する。この最適化は二 つのステップに分けられる。第1ステップで、f(n)=0と仮定され、適応型 コードブック14からの最良のベクトルと対応するgIQが決定される。これらの パラメータを決定するためのアルゴリズムは、同封した付録で与えられる。これ らのパラメータが決定されると、同様にアルゴリズムにより、固定コードブック 16から選ばれたベクトルと対応する利得gJQが選ばれる。この場合は、適応型 コードブックの決定されたパラメータは、それらの決定された値にロックされる 。 フィルタ12のフィルタパラメータは、LPCアナライザ28内の音声信号フ レームを分析することにより、各音声信号フレーム(160サンプル)について 更新される。この更新は、アナライザ28とフィルタ12の間の破線の(das hed)接続で示されている。更に、加算器18の出力と適応型コードブック1 4の間に遅延素子30がある。この方法で、適応型コードブック14は、最終的 に選択された励起ベクトルex(n)により更新される。これはサブフレームに 基づいて行われ、ここで各フレームは4個のサブフレームに分割される(40サ ンプル)。 図2は、この発明の方法がその中で使用される音声符号器のもう一つの実施例 を示す。図1の音声符号器と図2の音声符号器の本質的な相違は、図1の固定コ ードブック16が、マルチパルス励起(MPE)発生器34と変換2進パルス励 起(TBPE)発生器36を含んでなる混合励起発生器32に置き換えられてい ることである。これら二つの励起を以下に簡単に説明する。対応するブロックの 利得は、それぞれ、gMQおよびgTQとして、図2に示されている。発生器34、 36からの励起は、加算器38内で加算され、この混合された励起は、加算機1 8内の適応型コードブック励起へ加算される。 マルチパルス励起は、図3に図示され、[7]に詳細に説明され、同封のC+ +プログラムリストにも記述されている。図2は、40サンプル(=5ms)の サブフレーム上に分配された6個のパルスを図示している。励起ベクトルはこれ らのパルスの位置(例では位置7、9、14、25、29、37)およびパルス の振幅(例ではAMP1からAMP6まで)により記述され得る。これらのパラ メータを発見する方法は[7]に記述されている。通常振幅は励起ベクトルの形 を表現するだけである。従ってブロックの利得gMQ(図2参照)がこれら基礎的 なベクトルの形の増幅を表現するために使用される。 図4は、[8]および同封のプログラムリストに詳細に記述された変換2進パ ルス励起の背後にある原則を図示する。この2進パルスコードブックはたとえば 10個の成分を含むベクトルを含んでなりうる。各ベクトル成分は図4に示すよ うにポイントアップ(+1)またはポイントダウン(−1)する。この2進パル スコードブックはこうしたベクトルの全ての可能な組み合わせを含む。このコー ドブックのベクトルは10次元「立方体」の「隅々」を指している全てのベクト ルのセットとして考え得る。こうして、ベクトルの先端は10次元の球体の表面 の上に一様に分布している。 その上TBPEは一つまたはいくつかの変換マトリクス(図4のマトリクス1 およびマトリクス2)を含む。これらはROM内の事前に計算されたマトリクス である。これらのマトリクスは2進パルスコードブック内に記憶されたベクトル 上で作動して、一組の変換ベクトルを生成する。最後に変換ベクトルは一組の励 起パルスグッド上に分配されている。この結果は各マトリックスについての規則 的に間隔をあけた「確率的」コードブックの異なった4つのバージョンである。 (グリット2に基づく)これらのコードブックの一つが、最終結果として図4に 示される。この探索手順の目的は、共に最小重み付き誤差を与える2進コードブ ックの2進パルスコードブック索引、変換マトリックス、励起パルスグリッドを 発見することである。これらのパラメータは利得gTQと結合される(図2を参照 )。 図1と図2に図示した音声符号器において、利得gIQ、gJQ、gMQ、gTQは、 互いに完全に独立して量子化された。しかしながら図5に見られるように、異な ったコードブックの利得の間には強い相関がある。図5において、MPEコード ブックに対応する利得g1の対数と、TBPEコードブックに対応する利得g2 の対数の間の分布が示される。図6は、類似の図表を示すが、しかしこの場合利 得g1は、量子化されている。その上、図6には線Lが示されている。この線は 回帰分析で発見されるものであり、gIQからg2を予測するために使用し得るも のであるが、以下にさらに説明する。図5および6内のデータの点は、8000 フレームから得られた。 図5と6が示すように、異なったコードブックに属する利得の間には強い相関 がある。第1のコードブックからの多数の量子化された利得gIQと、対応するフ レーム内の第2のコードブックのための対応する利得(量子化されてない)g2 を計算して、直線Lを決定することにより、この直線は線形予測子として使用可 能であり、これは下記の式によりgIQの対数からg2の対数を予測するものであ る。 ここでg2は、予測された利得g2を表す。この発明の一実施例によれば、g2を 量子化する代わりに、実際の利得g2の対数と予測される利得g2の対数の間の差 δが次の式によって計算される。 そしてその後は量子化される。 図7および8は、上記の方法によって得られる一つの利点を図示する。図7は 、8000フレームについて利得g2のダイナミックレンジを図示する。図8は 、同じフレーム内のδについての対応するダイナミックレンジを図示する。図7 および8からわかるようにδのダイナミックレンジはg2のダイナミックレンジ よりも遥かに小さい。これはg2のために必要とされる量子化レベルの数に比較 して、δのための量子化レベルの数を大きく減少させ得ることができることを意 味する。量子化の効率をよくするために、利得の量子化にしばしば16レベルが 使用される。この発明によるδ量子化を使用すれば、6量子化レベルだけを使用 して等価な効率を得ることができ、これは0.3kb/sのビット転送速度の節 約に等しい。 bおよびcの量は、符号器と復号器の内に記憶されたあらかじめ決められた固 定の量であるので、利得g2は下の式により複合機内に再構成され得る。 ここでgIQおよびδQは復号器において転送され受信されたものである。 コードブックの利得の間の相関は、コードブックのベクトル内のエネルギーレ ベルに高度に依存している。もしコードブック内のエネルギーが変化していれば 、ベクトルのエネルギーが予測の中に含まれていて、効率を改良できる。[2] に標準化されたコードブックのベクトルが使用され、この問題を除去する。しか しながら、コードブックが標準化されず、多くのゼロでない成分を有する場合は 、この方法は複雑になり得る。その代わりに、因数g1を修正して、予測に使用 する前に、先行のコードブックの励起エネルギーをより良く表現するようにでき る。こうして、δのための式は下記のように修正できる。 ここでEは、コードブック1から選択されたベクトルのエネルギーを表す。励起 エネルギーは、コードブックの探索の中で使用され計算されるので、特別な計算 は一切行う必要がない。 もし最初のコードが適応型コードブックのものであると、エネルギーが大きく 変動し、大部分の成分は通常ゼロでない。これらのベクトルを正常化することは 、複雑な計算の作業になるであろう。しかしながら、もし正常化無しにコードブ ックが使用されれば、上に指摘したように、量子化された利得がベクトルエネル ギーの平方根で乗算されて、次のコードブックの利得の予測のために、良い基礎 を形成するであろう。 MPEコードブックは、変化する振幅と符号を有する少数のゼロでないパルス を有する。ベクトルエネルギーは、パルスの振幅の平方の和で与えられる。次の コードブックの利得、例えばTBPEコードブックの利得を予測するには、適応 型コードブックの場合のように、MPEの利得はエネルギーの平方根により修正 されるであろう。しかしながら、もし代わりに平均パルス振幅(振幅は常に正で ある)を使用すれば、この作動は複雑さが少なくなる。図6の量子化された利得 gIQは、この方法を使用して修正された。 上に議論したエネルギーの修正は、復号器におけるg2のために次の式を与え る。 励起ベクトルは復号器においても利用できるので、エネルギーEは転送されなけ ればならないわけではないが、復号器において再計算できる。 アルゴリズムの一例として、第1の利得はMPE利得であり、第2の利得はT BPE利得であるものを、以下に要約する。 このアルゴリズムにおいて、LPC分析はフレームに基づいて実行され、一方 残りのステップのLTP分析、MPE励起、TBPE励起、状態更新は、サブフ レームに基づいてサブフレーム上で実行される。このアルゴリズムにおいて、M PEおよびTBPEの励起ステップは、この発明に関連するステップを例示する ために拡張されている。 この発明を説明するためのフローチャートが、図9に与えられている。 図10は、図1の音声符号器に対応するが、しかしこの発明を実行する手段を 備えた音声符号器を図示する。固定コードブック16からの最適ベクトルに対応 する利得g2がブロック50で決定される。利得g2、定量化利得gIQ、(ブロッ ク54で決定された)励起ベクトルエネルギーEが、ブロック52に提出され、 ブロック52はδQを計算し、利得g2Qを量子化する。この計算は、好ましくは 、マイクロプロセッサにより実行される。 図11は、この発明のもう一つの実施例で、前記のアルゴリズムに対応するも のを図示する。この例では、gIQは、エネルギーEを有するMPEコードブック 34からの最適ベクトルに対応し、一方、利得g2は、TBPEコードブック3 6からの最適励起ベクトルに対応する。 図12は、上記の方法の一般化をそこで使用した音声符号器のもう一つの実施 例を図示する。二つの異なったコードブックに対応する複数の利得の間には、強 い相関があることが示されてきたので、二つよりも多いコードブックがある場合 に、このアルゴリズムを反復して一般化することは当然である。図12において 、第1パラメータδ1は、上記の方法により、ブロック52で計算される。この 場合、第1コードブックは適応型コードブック14であり、第2コードブックは MPEコードブック34である。しかしながら、g2Qが第2コードブックのため に計算されるので、このプロセスは、MPEコードブックを”第1”コードブッ クとして考え、TBPEコードブックを第2”コードブックとして考えて、反復 される。こうして、上記と同じ原則により、ブロック52’がδ2とg3Qを計算 し得る。相違は、今度は二つの線形予測が必要なことであり、一つはg2のため 、もう一つはg3のためで、その相違は定数”a”および”b”である。 上記の説明において、線形予測がカレントサブフレームにおいてのみ行われる 、と仮定している。しかしながら、先行のサブフレームで決定された利得を記憶 し、これら先行して決定された利得を線形予測中に含むこともあり得るのは、カ レントサブフレーム中の利得と先行利得の間に相関があることは、ありそうなこ とだからである。線形予測の定数は、上に説明した実施例のように、経験的に得 られ て、符号器と復号器に記憶される。こうした方法は、予測の精度を更に増し、予 測の精度は更にδのダイナミックレンジを減少させるであろう。これは改良され た品質(δがより小さいダイナミックレンジをカバーするために利用できる量子 化レベル)をも、また量子化レベルの数の更なる減少をも、導くものである。 こうして、利得間の相関を考慮に入れることにより、この発明による量子化方 法は、独立利得量子化法に比較して、利得ビットレートを減少する。この発明に よる方法はまた、更に複雑さの少ない方法であり、それは、計算の複雑さの増加 が少ないからである。 更に、ベクトル量子化法に比較して、ビット誤差に対する強さが改造される。 独立量子化に比較して、第1コードブックの利得が増加するが、それは、それが 第2コードブックの利得にも影響するからである。しかしながら、δのビット誤 差感度は、独立量子化における第2利得g2のビット誤差感度よりも低い。チャ ネル符号化においてこれを考慮に入れるならば、独立量子化に比較して全体的な 強さを実際に改良できるのは、δ量子化における誤差感度が一層不均等なためで 、これは不均等な誤差感度を使用するときに好まれる。 利得のダイナミックレンジを減少させる一般的な方法は、量子化に先立って、 フレームエネルギーパラメータの利得を正常化することである。フレームエネル ギーパラメータは、それから各フレームに一度ずつ転送される。この方法は、こ の発明には必要でなく、他の理由のために、フレームエネルギーの正常化が使用 され得る。フレームエネルギーの正常化は、付録のプログラムリストに使用され ている。 この発明の精神と範囲は添付の請求の範囲に定義されるが、これから離れるこ となく、この発明のさまざまな修正と変更がなされ得ることは、当業者に容易に 理解できよう。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(KE,LS,MW,SD,S Z,UG),UA(AM,AZ,BY,KG,KZ,MD ,RU,TJ,TM),AL,AM,AT,AU,AZ ,BB,BG,BR,BY,CA,CH,CN,CZ, DE,DK,EE,ES,FI,GB,GE,HU,I S,JP,KE,KG,KP,KR,KZ,LK,LR ,LS,LT,LU,LV,MD,MG,MK,MN, MW,MX,NO,NZ,PL,PT,RO,RU,S D,SE,SG,SI,SK,TJ,TM,TR,TT ,UA,UG,US,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.分析合成線形予測音声符号化における利得量子化方法であって、 第1コードブックからの最適第1ベクトルのための最適第1ベクトルを決定し 、 前記最適第1利得を量子化し、 第2コードブックからの最適第2ベクトルのための最適第2ベクトルを決定し、 少なくとも前記量子化された最適第1利得から前記最適第2利得の対数の第1 線形予測を決定し、 前記最適第2利得の対数と前記第1線形予測の間の第1の差を量子化すること を含む利得量子化方法。 2.前記第1線形予測は、前記量子化された最適第一利得の積の対数と、前記 最適第1ベクトルのエネルギーの平方根の測度を含む第1項の方法。 3.前記第1コードブックは適応型コードブックであり、前記第2コードブッ クは固定コードブックである第2項の方法。 4.前記第1コードブックはマルチパルス励起コードブックであり、前記第2 コードブックは変換2進パルス励起コードブックである第2項の方法。 5.前記測度は、前記最適第1ベクトルの複数の成分の平方の和の平方根を含 む請求項3または4の方法。 6.前記測度は、前記最適第1ベクトルの平均パルス振幅を含む請求項4の方 法。 7.前記量子化された第1の差から前記最適第2利得を決定し量子化し、 第3コードブックから最適第3ベクトルのための最適第3利得を決定し、 少なくとも前記量子化された最適第2利得から、前記最適第3利得の対数の第 2線形予測を決定し、 前記最適第3利得の対数と前記第2線形予測の間の第2の差を定量化すること を更に含む請求項1の方法。 8.前記第1コードブックは適応型コードブックであり、前記第2コードブッ クはマルチパルス励起コードブックであり、前記第3コードブックは変換2進パ ルス励起コードブックである請求項7の方法。 9.前記第1線形予測は、また、あらかじめ決定された励起からの量子化され た利得を含む請求項1の方法。 10.前記第1および第2線形予測はまた、あらかじめ決定された励起からの量 子化された利得を含む請求項7の方法。
JP53322296A 1995-05-03 1996-04-12 分析合成線形予測音声符号化における利得量子化方法 Expired - Lifetime JP4059350B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9501640A SE504397C2 (sv) 1995-05-03 1995-05-03 Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
SE9501640-8 1995-05-03
PCT/SE1996/000481 WO1996035208A1 (en) 1995-05-03 1996-04-12 A gain quantization method in analysis-by-synthesis linear predictive speech coding

Publications (2)

Publication Number Publication Date
JPH11504438A true JPH11504438A (ja) 1999-04-20
JP4059350B2 JP4059350B2 (ja) 2008-03-12

Family

ID=20398181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53322296A Expired - Lifetime JP4059350B2 (ja) 1995-05-03 1996-04-12 分析合成線形予測音声符号化における利得量子化方法

Country Status (8)

Country Link
US (1) US5970442A (ja)
EP (1) EP0824750B1 (ja)
JP (1) JP4059350B2 (ja)
CN (1) CN1151492C (ja)
AU (1) AU5519696A (ja)
DE (1) DE69610915T2 (ja)
SE (1) SE504397C2 (ja)
WO (1) WO1996035208A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014007349A1 (ja) * 2012-07-05 2014-01-09 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266419B1 (en) * 1997-07-03 2001-07-24 At&T Corp. Custom character-coding compression for encoding and watermarking media content
JP3998330B2 (ja) * 1998-06-08 2007-10-24 沖電気工業株式会社 符号化装置
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6330531B1 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Comb codebook structure
SE519563C2 (sv) * 1998-09-16 2003-03-11 Ericsson Telefon Ab L M Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
US6397178B1 (en) 1998-09-18 2002-05-28 Conexant Systems, Inc. Data organizational scheme for enhanced selection of gain parameters for speech coding
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen
JP4390803B2 (ja) * 2003-05-01 2009-12-24 ノキア コーポレイション 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
DE102004036154B3 (de) * 2004-07-26 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
US20070174054A1 (en) * 2006-01-25 2007-07-26 Mediatek Inc. Communication apparatus with signal mode and voice mode
EP2227682A1 (en) * 2007-11-06 2010-09-15 Nokia Corporation An encoder
CA2704812C (en) * 2007-11-06 2016-05-17 Nokia Corporation An encoder for encoding an audio signal
CN101499281B (zh) * 2008-01-31 2011-04-27 华为技术有限公司 一种语音编码中的增益量化方法及装置
CN102057424B (zh) * 2008-06-13 2015-06-17 诺基亚公司 用于经编码的音频数据的错误隐藏的方法和装置
US9626982B2 (en) 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
WO2012109734A1 (en) * 2011-02-15 2012-08-23 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2776050B2 (ja) * 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
GB9118217D0 (en) * 1991-08-23 1991-10-09 British Telecomm Speech processing apparatus
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US5313554A (en) * 1992-06-16 1994-05-17 At&T Bell Laboratories Backward gain adaptation method in code excited linear prediction coders
EP0751496B1 (en) * 1992-06-29 2000-04-19 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014007349A1 (ja) * 2012-07-05 2014-01-09 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
JP5762636B2 (ja) * 2012-07-05 2015-08-12 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体

Also Published As

Publication number Publication date
WO1996035208A1 (en) 1996-11-07
DE69610915D1 (de) 2000-12-14
US5970442A (en) 1999-10-19
CN1188556A (zh) 1998-07-22
EP0824750B1 (en) 2000-11-08
CN1151492C (zh) 2004-05-26
DE69610915T2 (de) 2001-03-15
SE9501640L (sv) 1996-11-04
EP0824750A1 (en) 1998-02-25
AU5519696A (en) 1996-11-21
SE504397C2 (sv) 1997-01-27
SE9501640D0 (sv) 1995-05-03
JP4059350B2 (ja) 2008-03-12

Similar Documents

Publication Publication Date Title
JPH11504438A (ja) 分析合成線形予測音声符号化における利得量子化方法
CA2061832C (en) Speech parameter coding method and apparatus
US5208862A (en) Speech coder
AU668817B2 (en) Vector quantizer method and apparatus
US6122608A (en) Method for switched-predictive quantization
US7206739B2 (en) Excitation codebook search method in a speech coding system
US5694426A (en) Signal quantizer with reduced output fluctuation
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
CZ20031500A3 (cs) LPC vektorové kvantifikovací zařízení
KR19990088582A (ko) 신호의기본주파수를추정하기위한방법및장치
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
Shoham Vector predictive quantization of the spectral parameters for low rate speech coding
EP1114414B1 (en) An adaptive criterion for speech coding
US7027980B2 (en) Method for modeling speech harmonic magnitudes
EP0899720B1 (en) Quantization of linear prediction coefficients
Özaydın et al. Matrix quantization and mixed excitation based linear predictive speech coding at very low bit rates
US6192336B1 (en) Method and system for searching for an optimal codevector
EP0910064B1 (en) Speech parameter coding apparatus
CN101499281B (zh) 一种语音编码中的增益量化方法及装置
HEIKKINEN et al. On Improving the Performance of an ACELP Speech Coder
MXPA01002144A (es) Un criterio adaptable para codificacion de voz
JPH04271400A (ja) 音声符号化方式
JPH05341800A (ja) 音声符号化装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060411

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20060627

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061024

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071213

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111228

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131228

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term