JP2002503834A - System and method for split vector quantized data encoding - Google Patents

System and method for split vector quantized data encoding

Info

Publication number
JP2002503834A
JP2002503834A JP2000531838A JP2000531838A JP2002503834A JP 2002503834 A JP2002503834 A JP 2002503834A JP 2000531838 A JP2000531838 A JP 2000531838A JP 2000531838 A JP2000531838 A JP 2000531838A JP 2002503834 A JP2002503834 A JP 2002503834A
Authority
JP
Japan
Prior art keywords
parameters
vector
data
lsp
reconstructed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000531838A
Other languages
Japanese (ja)
Inventor
ジェームス・パトリック・アシュレー
ウェイミン・ペン
マーク・エー・ジャシウク
アーロン・エム・スミス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of JP2002503834A publication Critical patent/JP2002503834A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 データ圧縮システムにおいてスペクトル・パラメータを判定するために、線スペクトル・ペア・パラメータなどの束縛順序集合値を判定する際に用いられるスプリット・ベクトル量子化を行う方法およびシステムは、上限および下限に正規化されたデルタ符号化束縛順序集合値を収容する多重コードブック(22a〜22c)を利用する。LSP再構築器(34)は、スプリット・ベクトル再構築コードブック(22a〜22c)から取得された線スペクトル・ペア・パラメータの正規化デルタ量子化データに基づいて、スピーチなどのデータを復号するために、受信したスペクトル・パラメータを再構築する。LSP再構築器(34)は、正規化したデルタ量子化データに基づいて、線スペクトル・ペア・パラメータをダイナミックに生成する。別の実施例では、線スペクトル・ペア・パラメータの絶対値をセグメント化したコードブックに格納する代わりに、少なくとも2つの絶対値ベクトルと、少なくとも一つの正規化デルタ量子化ベクトルとの組合せがスペクトル量子化のために用いられる。 (57) A method and system for performing split vector quantization used in determining constrained ordered set values such as line spectrum pair parameters to determine spectral parameters in a data compression system comprises: Utilize multiple codebooks (22a-22c) that contain delta-encoded bounded ordered set values normalized to the upper and lower bounds. The LSP reconstructor (34) decodes data such as speech based on the normalized delta quantized data of the line spectrum pair parameters obtained from the split vector reconstruction codebook (22a to 22c). , The received spectral parameters are reconstructed. The LSP reconstructor (34) dynamically generates line spectrum pair parameters based on the normalized delta quantized data. In another embodiment, instead of storing the absolute values of the line spectrum pair parameters in a segmented codebook, the combination of at least two magnitude vectors and at least one normalized delta quantization vector is It is used for conversion.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

(産業上の利用分野) 本発明は、一般に、束縛順序集合(constrained ordered set)のスカラ量子化 またはベクトル量子化を利用するデータ符号化システムおよび方法に関し、さら
に詳しくは、音声または映像符号化システムで用いられるようなスペクトル・パ
ラメータまたは他のパラメータを判定するために、線スペクトル・ペア・パラメ
ータ(line spectrum pair parameters)などの順序パラメータ(ordered paramete
rs)の集合を判定する際に用いられるスプリット・ベクトル量子化(split vector
quantization)を行う方法に関する。
The present invention relates generally to data encoding systems and methods that utilize scalar or vector quantization of a constrained ordered set, and more particularly to audio or video encoding systems. Order parameters such as line spectrum pair parameters to determine spectral or other parameters as used in
rs) is used to determine the set of split vector quantization (split vector
quantization).

【0001】 (従来の技術) 束縛順序集合の量子化は、線スペクトル・ペア・パラメータなどの順序パラメ
ータの集合を符号化するために最近のスピーチおよび音声圧縮システムにおいて
一般に用いられる。線スペクトル・ペア・パラメータは、線形予測符号化(linea
r predictive coding)解析によって生成されるような粗スペクトル情報(coarse
spectral information)を表すために用いられる。適切な安定性束縛(stability
constraints)があれば、線スペクトル・ペア・パラメータ変換に対する線形予測
符号化解析は、一般に0.0〜0.5の範囲に及ぶ、挙動の良いランク順序集合
(rank ordered set)を生成する。線スペクトル・ペアの相関特性は、いくつかの
近年のスピーチ圧縮規格において用いられるさまざまなスカラおよびベクトル量
子化方法にとって魅力的なものにしている。
BACKGROUND OF THE INVENTION Quantization of constrained ordered sets is commonly used in modern speech and speech compression systems to encode sets of ordered parameters, such as line spectrum pair parameters. The line spectrum pair parameter is a linear predictive coding (linea
(r predictive coding) coarse spectral information (coarse
spectral information). Appropriate stability constraints
constraints), the linear predictive coding analysis for the line spectrum pair parameter transformation generally produces a rank ordered set with good behavior, ranging from 0.0 to 0.5.
(rank ordered set). The correlation properties of line spectrum pairs make them attractive for the various scalar and vector quantization methods used in some recent speech compression standards.

【0002】 例えば、1997年1月付け米国電気通信工業会(TIA:Telecommunicatio
ns Industry Association)からのIS−127規格 "Enhanced Variable Rate
Codec, Speech Service Option 3 For Wideband Spread Spectrum Digital Syst
ems"は、LSPパラメータを量子化するために用いられる「加重スプリット・ベ
クトル量子化(weighted split vector quantization)」と呼ばれる手法を利用す
る。10次元線スペクトル・ペア・ベクトルは、多重サブベクトル(multi-subve
ctors)またはセグメントに分割され、これらは、コードブック・メモリの観点、
およびコード検索(code search)の複雑さの観点の両方から、管理しやすい。例 えば、IS−127レート1/2コーデックは、22ビット3セグメントの加重
スプリット・ベクトル量子化方式を採用する。10次元LSPベクトルは、3つ
のセグメントに分割され、3+3+4要素になる。この方式は、各ベクトル・セ
グメント・コードブックについて7,7,8ビット指定を利用する。各セグメン
トに対して個別のコードブックが用いられる。従って、この方式は、3x27+ 3x27+4x28=1792ワードのコードブック・メモリ(ROM)を必要と
し、それぞれは加重二乗誤差(weighted squared error)計算を必要とする。この
方法は、42メガワードの格納および加重二乗誤差計算を必要とする強引(brute
force)な22ビット10要素コード・ベクトル設計に比べて、ベクトルをコー ドブック・セグメントに分割することにより、コードブック・メモリの量を低減
するが、加重スプリット・ベクトル量子化方式は、この強引な方法と同じ性能効
果を発揮しない。その理由の一つは、ベクトル・セグメント間に重複が生じ、そ
の結果、一部のコードブック・データの組合せがLSP順序特性を保持せず、そ
のため与えられた線形予測符号化係数に対して有効でなくなることである。この
影響は、コードブックにおけるコード・ベクトルが実質的に剪定(prune)され、 それによりベクトル量子化符号化利得を低減する。
For example, the American Telecommunications Industry Association (TIA) dated January 1997
IS-127 standard "Enhanced Variable Rate"
Codec, Speech Service Option 3 For Wideband Spread Spectrum Digital Syst
ems "utilizes a technique called" weighted split vector quantization "that is used to quantize LSP parameters. The 10-dimensional line spectrum pair vector is a multi-subve
ctors) or segments, which are the codebook memory perspective,
Easy to manage, both in terms of code search complexity and code search. For example, the IS-127 rate 1/2 codec employs a 22-bit, 3-segment weighted split vector quantization scheme. The 10-dimensional LSP vector is divided into three segments, resulting in 3 + 3 + 4 elements. This scheme utilizes a 7,7,8 bit designation for each vector segment codebook. A separate codebook is used for each segment. Therefore, this method requires a 3x2 7 + 3x2 7 + 4x2 8 = 1792 words of the codebook memory (ROM), each of which requires a weighted square error (weighted squared error) calculated. This method requires 42 megawords of storage and a brute force calculation that requires a weighted squared error calculation.
Although the amount of codebook memory is reduced by dividing the vector into codebook segments as compared to a force-based 22-bit 10-element code vector design, the weighted split vector quantization scheme does this brute force. Does not exhibit the same performance effects as the method. One reason is that there is overlap between vector segments, such that some codebook data combinations do not retain the LSP order property, and thus are not valid for a given linear predictive coding coefficient. It is not to be. The effect is that the code vectors in the codebook are substantially pruned, thereby reducing the vector quantization coding gain.

【0003】 例えば、図1は、LSPパラメータのサンプル分布図を示す。LSPは厳密に
昇順のランク順序集合となるように与えられるので、第2コード・ベクトルにお
ける最初の要素は、第1コード・ベクトルにおける最後の要素よりも大きくなけ
ればならない。3−3−4WSVQの第1セグメントの最適コード・ベクトルが
{ω1,ω2,ω3}:{0.10,0.15,0.20}であると判明すると、 第2コード・ベクトルの第1要素ω4は、0.20よりも大きくなければならな い(ω4>0.20)。しかし、LSPトレーニング・データベースにおける統 計および各セグメントのコードブックの独立したトレーニングのため、この条件
を満たさない非常に多くのベクトル(エントリ)がコードブックに存在すること
がある。この影響は、この条件を満たさないコードブック内のコード・ベクトル
は無効となり、エンコーダによって可能な候補として拒絶され、コードブックは
実質的に剪定される。
[0003] For example, FIG. 1 shows a sample distribution diagram of LSP parameters. Since the LSPs are given in a strictly ascending rank order set, the first element in the second code vector must be greater than the last element in the first code vector. 3-3-4 If the optimal code vector of the first segment of WSVQ is found to be {ω 1 , ω 2 , ω 3 }: {0.10,0.15,0.20}, the second code vector the first element ω 4 of the stomach, such must be greater than 0.20 (ω 4> 0.20). However, due to the statistics in the LSP training database and the independent training of the codebook for each segment, there may be too many vectors (entries) in the codebook that do not satisfy this condition. The effect is that code vectors in the codebook that do not satisfy this condition are invalidated, rejected as possible candidates by the encoder, and the codebook is substantially pruned.

【0004】 この問題に対処することを試みる既知の方法では、加重スプリット・ベクトル
量子化(weighted split vector quantization)方式を採用し、ここでコードブッ
ク値は、現行および以前の量子化線スペクトル・ペアの間の差に基づく。実際に
は、システムは、指定されたコードブック値(△ωiハット)を以前構築された線
スペクトル・ペアに追加することによって、現行の量子化線スペクトル・ペア値
を構築する:
[0004] A known method that attempts to address this problem employs a weighted split vector quantization scheme, where the codebook values are the current and previous quantized line spectral pairs. Based on the difference between In effect, the system constructs the current quantized line spectrum pair value by adding the specified codebook value (△ ω i hat) to the previously constructed line spectrum pair:

【0005】[0005]

【数1】 (Equation 1)

【0006】 デルタ符号化(delta decoding)として知られるこの方法は、(デルタ・オメガ
が厳密に正である限り)コードブック要素の重複を一般に除去するが、各デルタ
値が比較的大きい場合、同様な剪定効果(pruning effect)が生じることがある。
例えば、最後の量子化LSP値(ωi-1ハット)が0.3であり、現行のLSP デルタ・コードブック(△ωiハット)の値が(0.05,0.30)に及ぶ場合
、0.2より大きい任意のコードブック値は、LSP値が0.5以上になるので
、無効となる。さらに、0.2に近づくコードブック値は、この空間で生じる対
応するLSPの確率は大幅に低減されるので、実質的に「剪定(prune)」される 。ここでも、この剪定により、スピーチ符号化システムにおける全体的な量子化
性能の劣化が生じることがあり、これはプロセスのどの段階でも生じることがあ
る。また、フレーム間予測(interframe prediction)を利用して、線スペクトル ・ペア・パラメータから冗長性を除去することを試みる他の方法も存在するが、
一般にこれらの方法では、既存のワイヤレス通信システムにおいて固有のチャネ
ル・エラーに対して感受性が高くなる。
This method, known as delta decoding, generally removes codebook element duplication (as long as delta omega is strictly positive), but similarly if each delta value is relatively large, A severe pruning effect may occur.
For example, if the last quantized LSP value (ω i-1 hat) is 0.3 and the value of the current LSP delta codebook (△ ω i hat) extends to (0.05, 0.30) , 0.2 are invalid because the LSP value is greater than or equal to 0.5. Furthermore, codebook values approaching 0.2 are substantially "prune" because the probability of the corresponding LSP occurring in this space is greatly reduced. Again, this pruning may cause a degradation in the overall quantization performance in the speech coding system, which may occur at any stage of the process. There are also other methods that attempt to remove redundancy from line spectrum pair parameters using interframe prediction,
In general, these methods are more susceptible to inherent channel errors in existing wireless communication systems.

【0007】 格子量子化(lattice quantization)として知られる、スピーチ符号化における
LPC係数量子化の別のシステムについては、1995年音響学,スピーチおよ
び信号処理に関する国際会議(1995 International Conference on Acoustics, S
peech and Signal Processing)からのIEEE会報のMinjie Xieらによる論文 "
Fast and Low-Complexity LSF Quantization using Algebraic Vector Quantize
r" (1995)において開示されている。この手法では、最大セグメント長が3であ る4セグメント・スプリット・ベクトル量子化器を利用して、フレーム毎に10
個のLSPが量子化される。唯一一つのセグメントの成分(components)は絶対L
SP値を表し、残りのセグメントは、各セグメントについて、成分の和が1より
も大きくない値に追加するように正規化されたLSP差を表す。絶対LSP値を
表す一つのセグメントについてコードブック・エントリを与えるために、一つの
格納済みコードブックが用いられ、一方、残りのセグメントのコードブック・エ
ントリは、コードベクトル・インデクスおよび暗黙格子構造(implicit lattice
structure)を利用してリアルタイムで判定される。格子構造を利用することは、
格納済みコードブックのみを利用することに比べて、必要なメモリおよび検索複
雑さ(search complexity)は少なくてすむ。また、このようなシステムにおいて 正規化LSP差を利用することは、剪定の発生を防ぐことができる。しかし、正
規化は全てのコードブック・エントリが有効であることを保証することを助ける
が、正規化はデータを再整合(realign)することがあり、そのため元のパラメー タから特性の変化が生じることがある。
Another system of LPC coefficient quantization in speech coding, known as lattice quantization, is described in the 1995 International Conference on Acoustics, Speech and Signal Processing (1995).
Minjie Xie et al. in the IEEE bulletin from Peech and Signal Processing)
Fast and Low-Complexity LSF Quantization using Algebraic Vector Quantize
r "(1995). This technique utilizes a 4-segment split vector quantizer with a maximum segment length of 3 to provide 10 frames per frame.
LSPs are quantized. The components of one and only segment are absolute L
The remaining segments represent the LSP difference normalized to add to the value for which the sum of the components is not greater than 1 for each segment. One stored codebook is used to provide a codebook entry for one segment that represents an absolute LSP value, while the codebook entries for the remaining segments use a code vector index and an implicit grid structure (implicit grid structure). lattice
structure) in real time. Using a lattice structure
Less memory and search complexity is required compared to using only stored codebooks. Also, utilizing a normalized LSP difference in such a system can prevent pruning from occurring. However, while normalization helps ensure that all codebook entries are valid, normalization can realign data, resulting in property changes from the original parameters. Sometimes.

【0008】 例えば、正規化デルタ量子化値を利用することは、正規化デルタ量子化値の分
布および他の統計を変えることによって、量子化誤差に影響を及ぼし、そのため
これらの統計は、これらが導出された絶対値の統計とは異なる。正規化デルタ・
エントリを含むコードブックでは、正規化デルタLSP値は固定範囲にマッピン
グされる。正規化されるあるLSPの正規化下限および上限の値は、以前に量子
化したフレーム・データの関数なので、絶対LSP値から正規化範囲へのマッピ
ングは非線形となる。この非線形マッピング(ワーピング(warping))は、正規 化デルタ値の分布および他の統計を変える効果があり、そのためこれらの統計は
、これらが導出された絶対値の統計とは異なる。これらの差は、コードブック・
エントリの設計およびそれに起因する量子化誤差に影響を及ぼすことがある。こ
のワーピング効果によって、検討対象のデータの統計に応じて、性能の利得ある
いは損失が生じることがある。ワーピングによって損失が生じる場合、正規化デ
ルタ値を利用することが量子化誤差の全体的な低減を達成するためには、剪定の
阻止に起因する利得は、ワーピングに起因する損失よりも大きくなければならな
い。ワーピングに起因する損失が剪定の阻止に起因する利得を打ち消す場合、絶
対値を利用することを優先できる。従って、正規化ベクトルからLSPパラメー
タを判定することにより、符号化性能が低下することがある。
[0008] For example, utilizing the normalized delta quantization values affects the quantization error by changing the distribution of the normalized delta quantization values and other statistics, so that these statistics are This is different from the derived absolute value statistics. Normalized delta
In a codebook containing entries, the normalized delta LSP values are mapped to a fixed range. The mapping from absolute LSP values to the normalization range is non-linear because the values of the lower and upper normalization limits of a given LSP to be normalized are a function of previously quantized frame data. This non-linear mapping (warping) has the effect of altering the distribution of the normalized delta values and other statistics, so that these statistics are different from the statistics of the absolute values from which they were derived. These differences are
This may affect the design of the entry and the resulting quantization error. This warping effect may result in performance gains or losses depending on the statistics of the data under consideration. If the loss due to warping occurs, the gain due to pruning rejection must be greater than the loss due to warping in order to utilize the normalized delta value to achieve an overall reduction in quantization error. No. If the loss due to warping negates the gain due to pruning arrest, the use of absolute values can be prioritized. Therefore, judging the LSP parameter from the normalized vector may lower the coding performance.

【0009】 さらに、このようなシステムにおいて適用される正規化は、各セグメントにお
ける正規化された成分の和が1よりも大きくならないように一般に制限される。
この制限は、三角(triangular)および単向(simplex)格子構造の利用を可能にす るために必要となる。しかし、符号化システムをこの格子構造に制限することは
、符号化性能を無駄に制限することになりうる。
Furthermore, the normalization applied in such a system is generally restricted so that the sum of the normalized components in each segment cannot be greater than one.
This restriction is necessary to enable the use of triangular and simplex lattice structures. However, restricting the encoding system to this lattice structure can wastefully limit encoding performance.

【0010】 また、Xieらの格子構造に基づくコードブック・エントリの利用は、LSPデ ータの量子化にとって最適以下(suboptimal)になりうる。コードブック・エント
リを正規の格子構造上の点となるように制限することにより、コードブック・エ
ントリは量子化されるデータの統計分布に最適に適合せず、そのため平均量子化
誤差が増加する。対照的に、格納済みコードブックを利用することは、量子化さ
れるデータの統計分布に一致する統計分布を有するトレーニング・データの集合
に、コードブック・エントリを最適に適合させることができ、これは平均量子化
誤差を低減するのに役立つ。従って、与えられたコードブック・エントリ数につ
いて、トレーニングされ格納されたコードブックの性能は、厳しいメモリ条件を
有する極めて複雑な格子構造に基づくコードブックの性能に比べて一般に優れて
いる。
The use of a codebook entry based on the lattice structure of Xie et al. Can be suboptimal for quantization of LSP data. By restricting the codebook entries to points on a regular grid structure, the codebook entries do not optimally fit the statistical distribution of the data being quantized, thereby increasing the average quantization error. In contrast, utilizing a stored codebook can optimally fit a codebook entry to a set of training data having a statistical distribution that matches the statistical distribution of the data being quantized, Helps reduce the average quantization error. Thus, for a given number of codebook entries, the performance of the trained and stored codebook is generally superior to that of codebooks based on extremely complex lattice structures with stringent memory requirements.

【0011】 従って、処理時間の短縮を促進することを助け、剪定を低減することを助け、
束縛順序集合の量子化における符号化性能を改善できる、データ圧縮または符号
化システムにおいて改善されたスプリット・ベクトル量子化を行うための方法お
よびシステムが必要とされる。
[0011] Thus, helping to reduce processing time, helping to reduce pruning,
What is needed is a method and system for performing improved split vector quantization in a data compression or coding system that can improve coding performance in constrained ordered set quantization.

【0012】 (好適な実施例の説明) データ圧縮システムにけるスペクトル・パラメータを判定するために、線スペ
クトル・ペア・パラメータなどの束縛順序集合値を判定する際に用いられるスプ
リット・ベクトル量子化を行う方法およびシステムは、制約空間(constraint sp
ace)の有効ダイナミック範囲などの上限および下限に正規化された、線スペクト
ル・ペア値などのデルタ符号化束縛順序集合値を収容する多重コードブック(mul
tiple codebooks)を利用する。セグメント化されたコードブックにおいて量子化
された値は、線スペクトル・ペア値など、最後に量子化された束縛順序集合値と
、線スペクトル・ペア値など、別のより高い(あるいはできるだけ最高の)束縛
順序集合値との間の距離の割合(percentage)を表す。従って、コードブック・メ
モリに格納される全ての値は、有効なLSP値になり、そのためコードブック剪
定が防がれる。本明細書で用いられる、スプリット・ベクトル量子化は、ベクト
ル長が1であるスカラ量子化を含む。
Description of the Preferred Embodiment To determine the spectral parameters in a data compression system, a split vector quantization scheme used in determining constrained ordered set values, such as line spectral pair parameters, is used. The method and system for doing this are in the constraint space (constraint sp
ace), a multiplexed codebook (mul) containing delta-encoded binding order set values, such as line spectrum pair values, normalized to upper and lower limits, such as the effective dynamic range of
Use tiple codebooks). The quantized value in the segmented codebook is the last quantized bounded set value, such as a line spectrum pair value, and another higher (or highest possible), such as a line spectrum pair value. Represents the percentage of the distance from the bound order set value. Therefore, all values stored in codebook memory will be valid LSP values, thus preventing codebook pruning. As used herein, split vector quantization includes scalar quantization where the vector length is one.

【0013】 LSP再構築器(LSP reconstructor)は、セグメント化されたコードブック内 の正規化デルタ量子化データにアクセスし、このデータは、スピーチまたは他の
データを復号するために、線スペクトル・ペア・パラメータなどの束縛順序集合
値を判定するために用いられる。LSP再構築器は、再構築コード・データ、す
なわち、スプリット・ベクトル再構築コードブックから取得された線スペクトル
・ペア・パラメータの正規化デルタ量子化データ、に基づいて、受信したスペク
トル・パラメータを再構築する。LSP再構築器は、正規化デルタ量子化データ
に基づいて、線スペクトル・ペア・パラメータをダイナミックに生成する。次に
、再構築されたパラメータは、スピーチなどのデータを復号するために、短期合
成フィルタ(short term synthesis filter)に送られる。
[0013] The LSP reconstructor accesses the normalized delta quantized data in the segmented codebook, which is used to decode speech or other data by using a line spectrum pair. Used to determine the bound order set value of a parameter, etc. The LSP reconstructor reconstructs the received spectral parameters based on the reconstructed code data, i.e., the normalized delta quantized data of the line spectrum pair parameters obtained from the split vector reconstruction codebook. To construct. The LSP reconstructor dynamically generates line spectrum pair parameters based on the normalized delta quantized data. Next, the reconstructed parameters are sent to a short term synthesis filter to decode data such as speech.

【0014】 好適な実施例では、線スペクトル・ペア・パラメータの絶対値をセグメント化
コードブックに格納する代わりに、開示のシステムはおよび方法は、少なくとも
2つの絶対値ベクトルと、スペクトル量子化で用いるための正規化デルタ量子化
データの少なくとも一つのベクトルとの組合せを格納・利用する。
In a preferred embodiment, instead of storing the absolute values of line spectral pair parameters in a segmentation codebook, the disclosed system and method uses at least two magnitude vectors and spectral quantization. And combination of the normalized delta quantized data with at least one vector for use.

【0015】 図2は、エア・インタフェース(air interface)またはチャネル上で送信され たスピーチを再構築するために、スペクトル・パラメータなどのスピーチ・パラ
メータ14を介して符号化スピーチを表す符号化入力データ12を受信する、無
線電話通信システムなどの通信システムにおけるスピーチ・デコーダ10を示す
。スピーチ・パラメータ14は、パラメータ・デコーダによって、当技術分野で
周知なように復号される。スピーチ・デコーダ10は、例えば、当技術分野で周
知なような関連ベクトル付きの固定コードブックと、当技術分野で周知なような
長期予測ブロック(long term prediction block)18と、短期予測LPC合成フ
ィルタ(short term prediction LPC synthesis filter)20とを含む。短期予測
LPC合成フィルタ20は、スプリット・ベクトルLSP再構築コードブック2
2a〜22cを利用することで導出されたLSPデータに基づいて生成されたL
PC情報を利用する。
FIG. 2 shows an example of encoded input data representing encoded speech via a speech parameter 14 such as a spectral parameter to reconstruct speech transmitted on an air interface or channel. 1 illustrates a speech decoder 10 in a communication system, such as a wireless telephony communication system, for receiving a speech signal. Speech parameters 14 are decoded by a parameter decoder as is well known in the art. The speech decoder 10 includes, for example, a fixed codebook with associated vectors as known in the art, a long term prediction block 18 as known in the art, and a short term LPC synthesis filter. (short term prediction LPC synthesis filter) 20. The short-term prediction LPC synthesis filter 20 uses the split vector LSP reconstruction codebook 2
L generated based on LSP data derived by using 2a to 22c
Use PC information.

【0016】 スプリット・ベクトルLSP再構築コードブック22a〜22cは、線スペク
トル・ペア・パラメータまたは他の束縛順序集合パラメータを判定するための正
規化デルタ量子化データ表す再構築コード・データを収容するスプリット・ベク
トル再構築コード・ソースとして機能する。コードブック22a〜22cにおけ
る再構築コード・データの各エントリは、線スペクトル・ペア・パラメータなど
の束縛順序集合データを判定するための有効なデータに対応し、受信した符号化
入力データ12または他のスペクトル・パラメータの再構築を促進する。スピー
チ・パラメータ14は、とりわけ、固定コードブック・インデクス・パラメータ
24,固定コードブック利得パラメータ26,長期遅延パラメータ28,長期予
測利得パラメータ30および正規化デルタ量子化(NDQ:normalization delt
a quantization)コードブック・インデクス・パラメータ32を含んでもよい。
The split vector LSP reconstruction codebook 22 a-22 c is a split containing reconstruction code data representing normalized delta quantized data for determining line spectrum pair parameters or other constrained ordered set parameters. -Functions as a vector reconstruction code source. Each entry of the reconstructed code data in the codebooks 22a-22c corresponds to valid data for determining constrained ordered set data, such as line spectrum pair parameters, and receives received encoded input data 12 or other data. Facilitates reconstruction of spectral parameters. The speech parameters 14 include, among others, a fixed codebook index parameter 24, a fixed codebook gain parameter 26, a long-term delay parameter 28, a long-term prediction gain parameter 30, and a normalization delta quantization (NDQ).
a quantization) codebook index parameter 32.

【0017】 NDQコードブック・インデクス・パラメータ32は、スプリット・ベクトル
LSP再構築コードブック22a〜22cの一つまたはそれ以上においてベクト
ルをインデクスする。線スペクトル・ペア・パラメータは、スプリット・ベクト
ルLSP再構築コードブック22a〜22cにおけるインデクスされた正規化デ
ルタ量子化データに基づいて、LSP再構築器34によって再構築される。LS
P/LPC変換器(LSP to LPC transformer)36は、当技術分野で周知なように
、LSPパラメータをLPC情報に変換する。次に、LPC情報は、出力スピー
チを生成するために、長期予測情報とともに、従来の短期予測LPC合成フィル
タ20によって用いられる。
The NDQ codebook index parameter 32 indexes a vector in one or more of the split vector LSP reconstruction codebooks 22a-22c. The line spectrum pair parameters are reconstructed by the LSP reconstructor 34 based on the indexed normalized delta quantized data in the split vector LSP reconstruction codebooks 22a-22c. LS
A P / LPC transformer (LSP to LPC transformer) 36 converts LSP parameters into LPC information, as is well known in the art. The LPC information is then used by the conventional short-term prediction LPC synthesis filter 20, along with the long-term prediction information, to generate output speech.

【0018】 具体的には、固定コードブック・インデクス・パラメータ24は、符号化スピ
ーチ波形の確率成分(stochastic component)を判定するために、固定コードブッ
ク16における確率コード・ベクトル(stochastic code vectors)の集合に対す るアドレスをインデクスする。固定コードブック利得パラメータ26は、符号化
スピーチからのエネルギがどれだけ強いかを表す。固定コードブック利得パラメ
ータ26は、固定コードブック16からの出力ベクトルと、乗算器(ミキサ)2
7において乗算され、利得を固定コードブック・データに与える。当技術分野で
周知な長期予測ブロック18は、遅延パラメータ28を受信し、この遅延パラメ
ータは、スピーチ波形のピッチ期間(pitch period)を判定するために用いられる
。また、長期予測ブロック18は、当技術分野で周知なように、ピッチの量を判
定するために、利得パラメータ30を受信する。
Specifically, the fixed codebook index parameter 24 is used to determine the stochastic component of the coded speech waveform by determining the stochastic component of the stochastic code vectors in the fixed codebook 16. Index the address for the set. The fixed codebook gain parameter 26 indicates how strong the energy from the coded speech is. The fixed codebook gain parameter 26 includes an output vector from the fixed codebook 16 and a multiplier (mixer) 2.
Multiplied at 7 to provide gain to the fixed codebook data. The long-term prediction block 18, well known in the art, receives a delay parameter 28, which is used to determine the pitch period of the speech waveform. The long-term prediction block 18 also receives a gain parameter 30 to determine the amount of pitch, as is well known in the art.

【0019】 短期予測LPC合成フィルタ20は、線形予測符号化情報から取得された短期
パラメータを利用して、当技術分野で周知なように符号化スピーチのスペクトル
・エンベロープを判定するCELP(code excited linear predictor)でもよい 。線形予測符号化フィルタ係数は、LDQ LSP再構築コードブック22a〜
22cにおける正規化デルタ量子化データに基づいて、線スペクトル・ペア・パ
ラメータの束縛順序集合から変換され、この集合によって表される。ただし、開
示の発明は、非CELP方式のデコーダや、他の適切な符号化および/または復
号デバイスにも適用可能であることが理解される。
The short-term prediction LPC synthesis filter 20 utilizes the short-term parameters obtained from the linear prediction coding information to determine the spectral envelope of the coded speech, as is known in the art. predictor). The linear predictive coding filter coefficients are stored in the LDQ LSP reconstruction codebooks 22a to 22a.
Based on the normalized delta quantized data at 22c, it is transformed from the bound ordered set of line spectrum pair parameters and represented by this set. However, it is understood that the disclosed invention is also applicable to non-CELP decoders and other suitable encoding and / or decoding devices.

【0020】 セグメント化LSP再構築コードブック22a〜22cにおける正規化デルタ
量子化データは、短期予測LPC合成フィルタ20に必要な線スペクトル・ペア
・パラメータ値の絶対値を判定(再構築)するために用いられる。
The normalized delta quantized data in the segmented LSP reconstruction codebooks 22 a to 22 c is used to determine (reconstruct) the absolute value of the line spectrum pair parameter value required for the short-term prediction LPC synthesis filter 20. Used.

【0021】 図3および図4を参照して、適切な正規化デルタ量子化データ、△ωlエント リ(図5参照)は、ブロック50に示すように、各エントリが有効なLSPパラ
メータを判定するために利用できるように、スプリット・ベクトルLSP再構築
コードブック22a〜22cについて判定される。これは、トレーニング・スピ
ーチ・フレームや、復号される他の適切な情報に基づいて、コンピュータによっ
て実行される。剪定の影響を避けるために、デルタ符号化LSPは、有効ダイナ
ミック範囲など、制約空間の範囲に正規化される。すなわち、コードブック・エ
ントリは、下限(lower bound)と上限(upper bound)との間の距離の割合を表す。
下限は、同一スピーチ・フレームからのより小さなLSPの以前取得した量子化
値、あるいは可能な最小値である0.0に設定できる。同様に、上限は、同一ス
ピーチ・フレームからのより大きなLSPの以前取得した量子化値、あるいは可
能な最大値である0.5に設定できる。これは次のように表すことができる:
[0021] With reference to FIGS. 3 and 4, proper normalization delta quantized data, △ omega l (see FIG. 5) entry, as shown in block 50, determines a valid LSP parameters each entry Are determined for the split vector LSP reconstruction codebooks 22a-22c so that they can be used to This is performed by the computer based on the training speech frames and other suitable information to be decoded. To avoid the effect of pruning, the delta-encoded LSP is normalized to a range of the constrained space, such as the effective dynamic range. That is, the codebook entry represents the ratio of the distance between the lower bound and the upper bound.
The lower bound can be set to a previously obtained quantized value of a smaller LSP from the same speech frame, or 0.0, the lowest possible value. Similarly, the upper bound can be set to a previously acquired quantized value of a larger LSP from the same speech frame, or 0.5, the maximum possible. This can be expressed as:

【0022】[0022]

【数2】 (Equation 2)

【0023】 ここで、ωiはi番目の非量子化LSPであり、ωHは上限であり、ωLは下限で ある。Here, ω i is the ith non-quantized LSP, ω H is the upper limit, and ω L is the lower limit.

【0024】 ブロック52において、正規化デルタ量子化データは、デコーダ10のスプリ
ット・ベクトル・コードブック22a〜22cに格納される。これは、デコーダ
製造時に、現場における要求時に、あるいは任意の適切な時点で行うことができ
る。デコーダ10は、ブロック54に示すように、元のスピーチに関連するスペ
クトル情報についてスピーチ・パラメータ14を受信する。LSP再構築器34
は、NDQインデクス・パラメータ32に基づいて、スプリット・ベクトルLS
P再構築コードブック22a〜22cからコード・ベクトルを取り出す。スプリ
ット・ベクトルLSP再構築コードブック22a〜22cからのコード・ベクト
ルは、被推定LSPパラメータの表現を含む。これをブロック56に示す。LS
P再構築器34は、ブロック58に示すように、コードブック22a〜22cか
らの正規化デルタ量子化データに基づいて、LSPパラメータを再構築する。
At block 52, the normalized delta quantized data is stored in the split vector codebook 22 a-22 c of the decoder 10. This can be done at the time of decoder manufacture, on site request, or at any suitable time. Decoder 10 receives speech parameters 14 for the spectral information associated with the original speech, as shown in block 54. LSP Reconstructor 34
Is based on the NDQ index parameter 32 based on the split vector LS
Extract code vectors from the P reconstruction codebooks 22a to 22c. Code vectors from the split vector LSP reconstruction codebooks 22a-22c include a representation of the estimated LSP parameters. This is indicated by block 56. LS
P reconstructor 34 reconstructs the LSP parameters based on the normalized delta quantized data from codebooks 22a-22c, as shown in block 58.

【0025】 上記の関係を利用して、LSP(ωiハット)は、次式により、コードブック 値(△ωiハット)と、以前取得した下限および上限から再構築される:Utilizing the above relationship, the LSP (ω i hat) is reconstructed from the codebook value (△ ω i hat) and the previously obtained lower and upper bounds by:

【0026】[0026]

【数3】 [Equation 3]

【0027】 各フレームに対するLSPの再構築は、所望の下限値および上限値が各LSP
について利用可能となるような順序で行うべきである。この方法において暗黙的
な点は、再構築すべき少なくとも最初のLSPは、フレームLSPデータとは無
関係な固定下限値および上限値を割り当てなければならないという事実である。
例えば、再構築すべき最初のLSPに対するこれらの固定値は、可能な最小値で
ある0.0および可能な最大値である0.5に設定でき、これは絶対LSP値を
対応する正規化デルタLSP値に設定することに相当する。再構築の後、LSP
パラメータは、LSP/LPC変換器36によって、当技術分野で周知なように
、線形予測符号化係数を判定するために用いられる。次に、短期予測LPC合成
フィルタ20は、ブロック60に示すように、次のスピーチ・パラメータを評価
する。
The reconstruction of the LSP for each frame is such that the desired lower and upper limits are
Should be performed in the order in which they are available. An implicit point in this method is the fact that at least the first LSP to be reconstructed must be assigned fixed lower and upper limits independent of the frame LSP data.
For example, these fixed values for the first LSP to be reconstructed can be set to a minimum possible value of 0.0 and a maximum possible value of 0.5, which sets the absolute LSP value to the corresponding normalized delta This corresponds to setting to the LSP value. After reconstruction, LSP
The parameters are used by LSP / LPC converter 36 to determine linear predictive coding coefficients, as is well known in the art. Next, the short-term prediction LPC synthesis filter 20 evaluates the next speech parameter, as shown in block 60.

【0028】 図5は、スプリット・ベクトル・コードブック22a〜22cの正規化デルタ
量子化データを生成するための一つの方法を示す。ある解析済みフレーム数につ
いてLSP値ωiの分布を利用して、ユーザは、コンピュータを用いて、トレー ニング・セットについて△ωiの全ての可能な値を生成できる。例えば、エンコ ーダから予期される音声,ミュージックまたは他のデータのフレームのモデルを
利用して、各△ωiについて分布範囲を生成できる。これは、ブロック70に示 される。次に、コンピュータは、ブロック72に示すように、各量子化期間につ
いて等誤差確率分布(equal error probability distribution)を得るために値を
評価する。次に、コンピュータは、各量子化レベルについて分布平均を取り、こ
の平均を(△ωiハット)としてスプリット・ベクトル・コードブック22a〜2
2cに格納して、ブロック74に示すように、各スプリット・ベクトル・コード
ブックの有効なLSPパラメータにインデクスを与える。
FIG. 5 illustrates one method for generating normalized delta quantized data for split vector codebooks 22 a-22 c. For a parsed frame number by using the distribution of the LSP value omega i, the user uses the computer, can generate all possible values of △ omega i for training set. For example, audio to be expected from the encoders, using a model of a frame of music or other data, can be generated distribution range for each △ omega i. This is indicated by block 70. Next, the computer evaluates the values to obtain an equal error probability distribution for each quantization period, as shown in block 72. Next, the computer takes a distribution average for each quantization level, and sets this average as (△ ω i hat), thereby split vector codebooks 22a to 22a-2.
2c to index the valid LSP parameters of each split vector codebook, as shown in block 74.

【0029】 なお、好適なシステムおよび方法は、絶対および正規化デルタ量子化データの
両方を利用することを含むべきであることが判明している。上記の正規化は、ど
のターゲット・ベクトルに対しても、全てのコード・ベクトルが有効なことを保
証するが、別の実施例では、絶対LSP値は、さらに改善されたスペクトル量子
化を行うために、スプリット・ベクトルNDQ LSP再構築コードブック22
a〜22cに含まれる。
It has been found that the preferred system and method should include utilizing both absolute and normalized delta quantized data. Although the above normalization ensures that all code vectors are valid for any target vector, in another embodiment, the absolute LSP value is used to provide further improved spectral quantization. , The split vector NDQ LSP reconstruction codebook 22
a to 22c.

【0030】 図6を参照して、ハイブリッド再構築コードブック80a〜80cは、スプリ
ット・ベクトル・コードブックである。コードブック80aおよび80cは、絶
対LSP値などの絶対スプリット・ベクトル・コード・ソース・データを収容す
る少なくとも2つのスプリット・ベクトル・セグメント(グループ)を格納する
。コードブック80bは、LSPパラメータなどの順序パラメータの集合の正規
化デルタ量子化を表す再構築コード・データの少なくとも一つのセグメントを格
納する。順序パラメータの集合の正規化デルタ量子化を表す再構築コード・デー
タは、トレーニング・データの集合に基づいて最適化される。ハイブリッド再構
築コードブック80a〜80cは、少なくとも2つの絶対ベクトルを採用するこ
とにより、既知の格子コードブック構造および図2に示す構造に対して優位性を
提供できる。
Referring to FIG. 6, hybrid reconstructed codebooks 80 a to 80 c are split vector codebooks. Codebooks 80a and 80c store at least two split vector segments (groups) that contain absolute split vector code source data, such as absolute LSP values. Codebook 80b stores at least one segment of reconstructed code data representing a normalized delta quantization of a set of order parameters, such as LSP parameters. Reconstructed code data representing the normalized delta quantization of the set of order parameters is optimized based on the set of training data. Hybrid reconstructed codebooks 80a-80c can provide advantages over known lattice codebook structures and the structure shown in FIG. 2 by employing at least two absolute vectors.

【0031】 LSP再構築器82は、絶対スプリット・ベクトル・コード・ソース・データ
と、順序パラメータの集合の正規化デルタ量子化を表す再構築コード・データの
少なくとも2つの集合に基づいて、順序パラメータの集合を再構築する。LSP
再構築器は、絶対スプリット・ベクトル・コード・ソース・データの少なくとも
2つのセグメントと、正規化デルタ量子化データの少なくとも一つのセグメント
を利用して、LSP/LPC変換器36によって用いるために正規化量子化デー
タを絶対量子化データに変換する。前述のように、順序パラメータの集合の正規
化デルタ量子化を表す再構築コード・データは、2つの絶対量子化線スペクトル
・ペア・パラメータ値または他の以前に取得した上限および下限の間の距離パー
セントを表すべく量子化されたスプリット・ベクトル・コードブック値を含む。
[0031] The LSP reconstructor 82 may generate an order parameter based on the absolute split vector code source data and at least two sets of reconstructed code data representing a normalized delta quantization of the set of order parameters. Reconstruct the set of LSP
The reconstructor utilizes at least two segments of the absolute split vector code source data and at least one segment of the normalized delta quantized data to normalize for use by the LSP / LPC converter. Convert the quantized data to absolute quantized data. As described above, the reconstructed code data representing the normalized delta quantization of the set of ordinal parameters is the distance between the two absolute quantized line spectrum pair parameter values or other previously obtained upper and lower limits. Contains the split vector codebook value quantized to represent a percentage.

【0032】 一例として、コードブック80aは、LSP1〜3を収容する一つのセグメン
トまたはグループを量子化するためのコードブック・エントリを収容でき、コー
ドブック80cは、LSP7〜10を収容でき、コードブック80bは、LSP
4〜6を収容できる。そのため、コードブック80aおよび80cは絶対LSP
値を収容し、一方、コードブック80bは正規化デルタ量子化データを収容する
。さらに、コードブック80bについてコードブック値を導出する際に用いられ
る正規化デルタ量子化データを算出する際に、下限ωLは、LSP3の量子化値 に等しく設定され、上限ωHは、LSP7の量子化値に設定される。図1から、 LSP3とLSP7の分布にはほとんど重複がないことがわかる。従って、コー
ドブック80cを剪定することに起因する損失は小さい。下限をLSP3の量子
化値に設定し、かつ上限を可能な最大値である0.5に設定することによって決
定される、コードブック80cを量子化するための正規化デルタ量子化値を利用
することによって、この剪定損失を実質的に削除することは可能であるが、この
場合のワーピングに起因する損失は、剪定を阻止することに起因する利得よりも
大きくなり、そのためコードブック80cは絶対LSP値を収容する。
As an example, the codebook 80a can contain a codebook entry for quantizing one segment or group containing LSP1-3, the codebook 80c can contain LSP7-10, 80b is LSP
4 to 6 can be accommodated. Therefore, codebooks 80a and 80c are absolute LSPs.
Contains the value, while codebook 80b contains the normalized delta quantized data. Furthermore, when calculating the normalized delta quantized data used in deriving the codebook values for codebook 80b, the lower limit omega L is set equal to the quantization value of LSP3, upper omega H is the LSP7 Set to the quantization value. From FIG. 1, it can be seen that the distribution of LSP3 and LSP7 has little overlap. Therefore, the loss due to pruning the codebook 80c is small. Use the normalized delta quantization value for quantizing codebook 80c, determined by setting the lower limit to the LSP3 quantization value and the upper limit to the maximum possible value of 0.5. Thus, it is possible to substantially eliminate this pruning loss, but the loss due to warping in this case is greater than the gain due to blocking pruning, so that codebook 80c has an absolute LSP Contains the value.

【0033】 コードブック80bについて、LSP6およびLSP7の分布と、LSP3お
よびLSP4の分布においてかなりの重複があることが図1からわかる。従って
、コードブック80について絶対LSP値が用いられる場合、剪定に起因するか
なりの損失が生じる。コードブック80bにおいて正規化デルタ量子化データを
利用することにより、ワーピングに起因する損失よりも大きい、剪定損失を阻止
することに起因する符号化利得が得られる。
It can be seen from FIG. 1 that for codebook 80b, there is considerable overlap in the distribution of LSP6 and LSP7 and the distribution of LSP3 and LSP4. Thus, when absolute LSP values are used for codebook 80, there is considerable loss due to pruning. Utilizing the normalized delta quantized data in codebook 80b provides a coding gain due to blocking pruning loss that is greater than the loss due to warping.

【0034】 別の例では、粗スペクトル情報を表すために、フレーム毎に14個のLPCを
利用できる。この14個のLPCの集合は、0.0〜0.5の範囲の14個のL
SPの順序集合に変換される。3つのコードブックではなく、4つのコードブッ
クを有する4セグメント・スプリット・ベクトル量子化器が用いられる。第1コ
ードブックは、LSP1〜3までの絶対値を表すエントリを収容する。第2コー
ドブックは、LSP11〜14までの絶対値を表すエントリを収容する。第3コ
ードブックは、LSP7〜10から導出された正規化デルタLSP値を表すエン
トリを収容する。これらの正規化デルタ量子化値を算出する際に、下限はLSP
3の量子化値に等しく設定され、上限はLSP11の量子化値に等しく設定され
る。第4コードブックは、LSP4〜6から導出された正規化デルタLSP値を
表すエントリを収容する。これらの正規化デルタLSP値を算出する際に、下限
はLSP3の量子化値に等しく設定され、上限はLSP7の量子化値に設定され
る。
In another example, 14 LPCs per frame are available to represent coarse spectral information. The set of 14 LPCs has 14 LPCs in the range of 0.0 to 0.5.
It is converted to an ordered set of SPs. Instead of three codebooks, a four-segment split vector quantizer with four codebooks is used. The first codebook contains entries representing the absolute values of LSP1 to LSP1. The second codebook contains entries representing the absolute values of LSPs 11 to 14. The third codebook contains entries representing normalized delta LSP values derived from LSPs 7-10. When calculating these normalized delta quantization values, the lower limit is LSP
3 is set equal to the quantization value, and the upper limit is set equal to the quantization value of LSP11. The fourth codebook contains entries representing normalized delta LSP values derived from LSPs 4-6. When calculating these normalized delta LSP values, the lower limit is set equal to the quantized value of LSP3, and the upper limit is set to the quantized value of LSP7.

【0035】 なお、さまざまな態様における本発明の他の変形および修正の実施は当業者に
明白であり、本発明は説明した特定の実施例に限定されないことを理解されたい
。例えば、本システムおよび方法は、さまざまな次元およびセグメンテーション
を有するスカラ,ベクトル,マトリクスあるいは他の適切な量子化器に適用でき
る。さらに、コードブック剪定を阻止する効果を有し、故に順序集合のスプリッ
ト・ベクトル量子化の性能における同様な改善を達成するために利用できる、他
の同様な正規化方法もある。例えば、正規化LSPは次式に従って算出できる:
It should be understood that implementation of other variations and modifications of the invention in various aspects will be apparent to those skilled in the art, and that the invention is not limited to the particular embodiments described. For example, the present systems and methods can be applied to scalars, vectors, matrices or other suitable quantizers having various dimensions and segmentations. In addition, there are other similar normalization methods that have the effect of blocking codebook pruning and can therefore be used to achieve a similar improvement in the performance of split vector quantization of ordered sets. For example, the normalized LSP can be calculated according to the following equation:

【0036】[0036]

【数4】 (Equation 4)

【0037】 ここで、ωL<ωi<ωHであり、ωL≦ωr≦ωHであり、また△ωiは正規化LS P値であり、ωiは絶対LSP値であり、ωHおよびωLは上記の制約を満たす以 前取得した上限および下限であり、ωrは上記の制約を満たす以前取得した基準 値であり、符号(sign)は、エンコーダおよびデコーダの両方において、同じ極性
に演繹的に設定される。この場合、絶対量子化LSP値は、次式に従って△ωi (または(△ωiハット))の量子化値から得られる。
[0037] Here, a ω L <ω i <ω H , an ω L ≦ ω r ≦ ω H , also △ omega i is the normalized LS P values, omega i is the absolute LSP value, ω H and ω L are the upper and lower limits obtained before satisfying the above constraint, ω r is the previously obtained reference value satisfying the above constraint, and the sign (sign) is The same polarity is set a priori. In this case, the absolute quantized LSP value is obtained from the quantized value of △ ω i (or (△ ω i hat)) according to the following equation.

【0038】[0038]

【数5】 (Equation 5)

【0039】 また、絶対および正規化デルタ量子化値の組合せは、量子化されるデータの統
計に応じて異なるこことが理解される。従って、本発明は、本明細書で開示・請
求される基本原理の精神および範囲内のあらゆる修正,変形または同等を網羅す
るものとする。
It is also understood that the combination of absolute and normalized delta quantization values will vary depending on the statistics of the data being quantized. Accordingly, the present invention is intended to cover all modifications, variations, or equivalents, within the spirit and scope of the basic principles disclosed and claimed herein.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 多数の解析済みスピーチ・フレームの線スペクトル・ペア・パラ
メータ分布を示すグラフである。
FIG. 1 is a graph showing the line spectrum pair parameter distribution of a number of analyzed speech frames.

【図2】 ワイヤレス通信システムにおける本発明の一実施例を内蔵するス
ピーチ・デコーダを概略的に示すブロック図である。
FIG. 2 is a block diagram schematically illustrating a speech decoder incorporating one embodiment of the present invention in a wireless communication system.

【図3】 本発明の一実施例による正規化量子化を内蔵するコードブック構
造の一例を概略的に示す図である。
FIG. 3 is a diagram schematically illustrating an example of a codebook structure including a normalized quantization according to an embodiment of the present invention.

【図4】 本発明の一実施例により、スペクトル・パラメータを判定するた
めにスプリット・ベクトル量子化を行う方法を概略的に示すフロー図である。
FIG. 4 is a flow diagram that schematically illustrates a method for performing split vector quantization to determine spectral parameters, according to one embodiment of the present invention.

【図5】 本発明の一実施例により、スプリット・ベクトル線スペクトル・
ペア・コードブックについて正規化デルタ量子化データを判定する方法を概略的
に示すフロー図である。
FIG. 5 illustrates a split vector line spectrum according to one embodiment of the present invention.
FIG. 7 is a flowchart schematically illustrating a method of determining normalized delta quantized data for a pair codebook.

【図6】 ワイヤレス通信システムにおける本発明の別の実施例を内蔵する
スピーチ・デコーダを概略的に示すブロック図であり、ここでコードブック・メ
モリは、絶対LSP値と正規化デルタ量子化データの両方の組合せを収容する。
FIG. 6 is a block diagram schematically illustrating a speech decoder incorporating another embodiment of the present invention in a wireless communication system, wherein a codebook memory stores absolute LSP values and normalized delta quantized data. Accommodates both combinations.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 マーク・エー・ジャシウク アメリカ合衆国イリノイ州シカゴ、ノー ス・メルビナ・アベニュー6221 (72)発明者 アーロン・エム・スミス アメリカ合衆国イリノイ州ストリームウッ ド、ジャクソン・レーン64 Fターム(参考) 5D045 CA03 CC07 5J064 BA12 BA13 BB03 BC02 BC14 BC17 BD02 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Mark A. Jashiuk 6221, North Melvina Avenue, Chicago, Illinois, USA (72) Inventor Aaron M. Smith, Jackson Lane 64, Streamwood, Illinois, USA F term (reference) 5D045 CA03 CC07 5J064 BA12 BA13 BB03 BC02 BC14 BC17 BD02

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 符号化のための順序パラメータの集合を調べる際に用いられ
るスプリット・ベクトル量子化を行う方法であって: 順序パラメータの集合を調べるための正規化デルタ量子化データを表す再構築
コード・データを含むスプリット・ベクトル再構築コード・ソースを格納する段
階であって、再構築コード・データの各エントリは、前記順序パラメータの集合
を調べるための有効なデータに相当し、受信したスペクトル・パラメータの再構
築を促進する、段階;および 前記スプリット・ベクトル再構築コード・ソースからの前記順序パラメータの
集合の正規化デルタ量子化を表す再構築コード・データに基づいて、前記受信し
たスペクトル・パラメータを再構築する段階; によって構成されることを特徴とする方法。
1. A method for performing split vector quantization used in examining a set of order parameters for encoding, comprising: a reconstruction representing normalized delta quantized data for examining a set of order parameters. Storing a split vector reconstructed code source containing code data, wherein each entry of the reconstructed code data corresponds to valid data for examining the set of order parameters, and Facilitating parameter reconstruction; and the received spectrum based on reconstruction code data representing a normalized delta quantization of the set of ordinal parameters from the split vector reconstruction code source. Reconstructing the parameters.
【請求項2】 前記スプリット・ベクトル再構築コード・ソースは、スプリ
ット・ベクトル・コードブックであり、前記順序パラメータの集合は、前記正規
化デルタ量子化データから求められることを特徴とする請求項1記載の方法。
2. The split vector reconstructed code source is a split vector codebook, and the set of order parameters is obtained from the normalized delta quantized data. The described method.
【請求項3】 前記順序パラメータの集合の正規化デルタ量子化を表す前記
再構築コード・データは、下限値と上限値との間の距離パーセントを表すべく量
子化されたスプリット・ベクトル・コードブック値を含むことを特徴とする請求
項2記載の方法。
3. The reconstructed code data representing a normalized delta quantization of the set of order parameters, wherein the reconstructed code data is quantized to represent a percentage distance between a lower limit and an upper limit. 3. The method of claim 2, including a value.
【請求項4】 受信したパラメータを再構築する前記段階は、前記順序パラ
メータの集合の正規化デルタ量子化を表す前記再構築コード・データに基づいて
、線スペクトル・ペア(LSP)パラメータを動的に生成し、動的に生成された
LSPパラメータに基づく線形予測符号化係数を利用して、前記受信したパラメ
ータを再構築することを特徴とする請求項1記載の方法。
4. The step of reconstructing received parameters comprises dynamically reconstructing line spectrum pair (LSP) parameters based on the reconstructed code data representing a normalized delta quantization of the set of order parameters. The method of claim 1, wherein the received parameters are reconstructed using linear predictive coding coefficients based on dynamically generated LSP parameters.
【請求項5】 前記スプリット・ベクトル再構築コード・ソース内の異なる
スプリット・ベクトルからのベクトル・エントリの選択を促進するため、前記ス
プリット・ベクトル再構築コード・ソースの各ベクトル・エントリを指示する段
階を含んで構成されることを特徴とする請求項1記載の方法。
5. Pointing each vector entry of the split vector reconstructed code source to facilitate selection of a vector entry from a different split vector in the split vector reconstructed code source. The method of claim 1, further comprising:
【請求項6】 スピーチ・エンコーダから符号化スペクトル・パラメータを
動作可能に受信する段階を含んで構成されることを特徴とする請求項1記載の方
法。
6. The method of claim 1, further comprising the step of operatively receiving encoded spectral parameters from a speech encoder.
【請求項7】 前記順序パラメータの集合は、線スペクトル・ペア値からな
ることを特徴とする請求項1記載の方法。
7. The method of claim 1, wherein the set of order parameters comprises line spectrum pair values.
【請求項8】 絶対スプリット・ベクトル・コード・ソース・データの少な
くとも2つのグループを格納する段階をさらに含んで構成される請求項1記載の
方法であって、受信したパラメータを再構築する前記段階は、絶対スプリット・
ベクトル・コード・ソース・データと、前記順序パラメータの集合の正規化デル
タ量子化を表す前記再構築コード・データの2つの集合に基づいて、受信したパ
ラメータを再構築することを含むことを特徴とする請求項1記載の方法。
8. The method of claim 1, further comprising storing at least two groups of absolute split vector code source data, wherein reconstructing the received parameters. Is an absolute split
Reconstructing received parameters based on two sets of vector code source data and the reconstructed code data representing a normalized delta quantization of the set of order parameters. The method of claim 1, wherein
【請求項9】 前記順序パラメータの集合の正規化デルタ量子化を表す前記
再構築コード・データは、2つの量子化LSP値および絶対量子化値の間の距離
パーセントを表すべく量子化されたスプリット・ベクトル・コードブック値を含
むことを特徴とする請求項2記載の方法。
9. The reconstructed code data representing a normalized delta quantization of the set of order parameters, wherein the reconstructed code data is quantized to represent a distance percentage between two quantized LSP values and an absolute quantized value. 3. The method of claim 2 including a vector codebook value.
【請求項10】 順序パラメータの集合を判定する際に用いられるスプリッ
ト・ベクトル量子化を行う符号化システムであって: 前記順序パラメータの集合を判定するための正規化デルタ量子化データを表す
再構築コード・データを収容するスプリット・ベクトル再構築コード・ソースを
格納する手段であって、再構築コード・データの各エントリは、前記順序パラメ
ータの集合を判定するための有効なデータに相当し、受信したスペクトル・パラ
メータの再構築を促進する、格納する手段;および 前記格納する手段に動作可能に結合され、前記スプリット・ベクトル再構築コ
ード・ソースからの前記順序パラメータの集合の正規化デルタ量子化を表す再構
築コード・データに基づいて、前記受信したパラメータを再構築する手段; によって構成されることを特徴とするシステム。
10. An encoding system for performing split vector quantization for use in determining a set of order parameters, the reconstruction system representing normalized delta quantized data for determining the set of order parameters. Means for storing a split vector reconstructed code source containing code data, wherein each entry of the reconstructed code data corresponds to valid data for determining the set of order parameters, and Means for facilitating and storing the reconstructed spectral parameters; and operably coupled to the storing means for performing a normalized delta quantization of the set of ordinal parameters from the split vector reconstructed code source. Means for reconstructing the received parameters based on the represented reconstruction code data; A system characterized by being constituted.
JP2000531838A 1998-02-12 1999-02-04 System and method for split vector quantized data encoding Pending JP2002503834A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US2243798A 1998-02-12 1998-02-12
US09/022,437 1998-02-12
PCT/US1999/002431 WO1999041736A2 (en) 1998-02-12 1999-02-04 A system and method for providing split vector quantization data coding

Publications (1)

Publication Number Publication Date
JP2002503834A true JP2002503834A (en) 2002-02-05

Family

ID=21809582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000531838A Pending JP2002503834A (en) 1998-02-12 1999-02-04 System and method for split vector quantized data encoding

Country Status (4)

Country Link
EP (1) EP1062657A4 (en)
JP (1) JP2002503834A (en)
KR (1) KR20010040902A (en)
WO (1) WO1999041736A2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100324204B1 (en) * 1999-12-24 2002-02-16 오길록 A fast search method for LSP Quantization in Predictive Split VQ or Predictive Split MQ
EP1955319B1 (en) * 2005-11-15 2016-04-13 Samsung Electronics Co., Ltd. Methods to quantize and de-quantize a linear predictive coding coefficient

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3151874B2 (en) * 1991-02-26 2001-04-03 日本電気株式会社 Voice parameter coding method and apparatus
US5651026A (en) * 1992-06-01 1997-07-22 Hughes Electronics Robust vector quantization of line spectral frequencies
US5649051A (en) * 1995-06-01 1997-07-15 Rothweiler; Joseph Harvey Constant data rate speech encoder for limited bandwidth path
US5668925A (en) * 1995-06-01 1997-09-16 Martin Marietta Corporation Low data rate speech encoder with mixed excitation
US5636231A (en) * 1995-09-05 1997-06-03 Motorola, Inc. Method and apparatus for minimal redundancy error detection and correction of voice spectrum parameters
KR100322706B1 (en) * 1995-09-25 2002-06-20 윤종용 Encoding and decoding method of linear predictive coding coefficient

Also Published As

Publication number Publication date
KR20010040902A (en) 2001-05-15
EP1062657A4 (en) 2004-10-06
WO1999041736A3 (en) 1999-10-21
WO1999041736A2 (en) 1999-08-19
EP1062657A2 (en) 2000-12-27

Similar Documents

Publication Publication Date Title
US7680670B2 (en) Dimensional vector and variable resolution quantization
US7502734B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in sound signal coding
US6807526B2 (en) Method of and apparatus for processing at least one coded binary audio flux organized into frames
US7953595B2 (en) Dual-transform coding of audio signals
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
RU2509379C2 (en) Device and method for quantising and inverse quantising lpc filters in super-frame
JP6452759B2 (en) Advanced quantizer
US10504525B2 (en) Adaptive forward error correction redundant payload generation
KR20080025403A (en) Frequency segmentation to obtain bands for efficient coding of digital media
CN1097816C (en) Digital speech coder having optimized signal energy parameters
EP2697795B1 (en) Adaptive gain-shape rate sharing
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
US20070061137A1 (en) Method for recovering frame erasure at voice over internet protocol (VoIP) environment
JP3255022B2 (en) Adaptive transform coding and adaptive transform decoding
WO2011045926A1 (en) Encoding device, decoding device, and methods therefor
JP4359949B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
JP5337305B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
KR100467326B1 (en) Transmitter and receiver having for speech coding and decoding using additional bit allocation method
JP2002503834A (en) System and method for split vector quantized data encoding
JP4574320B2 (en) Speech coding method, wideband speech coding method, speech coding apparatus, wideband speech coding apparatus, speech coding program, wideband speech coding program, and recording medium on which these programs are recorded
CN103503065B (en) For method and the demoder of the signal area of the low accuracy reconstruct that decays
Bouzid et al. Channel optimized switched split vector quantization for wideband speech LSF parameters
JPH041800A (en) Voice frequency band signal coding system
Nanjundaswamy Advances in audio coding and networking by effective exploitation of long term correlations
JPH02148926A (en) Prediction coding system