JPH07212239A - Method and device for quantizing vector-wise line spectrum frequency - Google Patents

Method and device for quantizing vector-wise line spectrum frequency

Info

Publication number
JPH07212239A
JPH07212239A JP5333161A JP33316193A JPH07212239A JP H07212239 A JPH07212239 A JP H07212239A JP 5333161 A JP5333161 A JP 5333161A JP 33316193 A JP33316193 A JP 33316193A JP H07212239 A JPH07212239 A JP H07212239A
Authority
JP
Japan
Prior art keywords
vector
candidate
line spectrum
codebook
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5333161A
Other languages
Japanese (ja)
Inventor
Rin Daniel
ダニエル・リン
Swaminasan Kumar
クマー・スワミナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Co
Original Assignee
Hughes Aircraft Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hughes Aircraft Co filed Critical Hughes Aircraft Co
Priority to JP5333161A priority Critical patent/JPH07212239A/en
Publication of JPH07212239A publication Critical patent/JPH07212239A/en
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Dc Digital Transmission (AREA)

Abstract

PURPOSE: To provide a strong and consistent device to allow high-performance vector-quantization of a short term parameter expressed as a line spectrum frequency between various speakers and handsets. CONSTITUTION: This device is provided with plural specified code books 11-14 of quantized line spectrum frequency vectors, means for retrieving each specified code book for a candidate line spectrum frequency vector similar to the non- quantized line spectrum frequency vector of an input, means 15-18 for calculating distortion for each candidate vector by using the non-quantized vector of the input, and means 19 for selecting the quantized line spectrum frequency vector from among the candidate vectors from each code book by using the calculated distortion for each candidate vector.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明はデジタル音声通信システ
ム、特に使用ビットの効率がよく、話者とハンドセット
との間の性能に関して効果的で、複雑性に関して中程度
であり、効果的で簡単な組込み式伝送エラ−検出構造を
有するコ−ド励起線形予測(CELP)スピ−チエンコ
−ダ用の線形スペクトル周波数ベクトル量子化装置に関
する。
FIELD OF THE INVENTION The present invention relates to digital voice communication systems, particularly those which are efficient in the bits used, effective in performance between the speaker and handset, moderate in complexity, effective and simple. The present invention relates to a linear spectral frequency vector quantizer for code-excited linear prediction (CELP) speech coder with a built-in transmission error detection structure.

【0002】[0002]

【従来の技術】このような装置は通常コ−ダ兼デコ−ダ
として“コデック”と呼ばれている。本発明はデジタル
セルネットワ−クに特に適しているが、通話のためのス
ピ−チ圧縮を必要とする生産ラインで有効に使用され
る。北アメリカのセル通信システムは現在のアナログ周
波数変調(FM)形態からデジタルシステムまでを含
む。十分な速度8.0 Kbpsベクトル和の励起線形予測
(VSELP)スピ−チコ−ダ、エラ−保護用のコンボ
リュ−ションコ−ド化、差動直角位相シフトキ−(QP
SK)変調、時分割、多重アクセス(TDMA)方式を
使用する標準方式は通信産業協会(TIA)により適用
されている。これはセルシステムの通信伝送容量を三倍
にすると考えられる。2の要素により容量をさらに増加
するために、TIAは評価の処理と、実質上半分の速度
のコデックを選択する処理を開始する。TIA技術評価
の目的でエラ−保護と共に半分の速度のコデックは6.4
Kbpsの総合的なビット速度を有し、40msのフレ−
ムサイズに限定される。コデックは広範囲の状態にわた
って十分な速度標準に匹敵する音声品質を有するものと
考えられる。これらの状態は種々の話者、ハンドセット
の影響、背景雑音、チャンネル状態を含む。
2. Description of the Related Art Such a device is usually called a "codec" as a coder / decoder. The present invention is particularly suitable for digital cell networks, but is effectively used in production lines that require speech compression for speech. North American cell communication systems include current analog frequency modulation (FM) forms to digital systems. Excited linear prediction (VSELP) speech coder with sufficient speed 8.0 Kbps vector sum, convolutional coded for error protection, differential quadrature phase shift key (QP
Standard schemes using SK) modulation, time division, multiple access (TDMA) schemes have been applied by the Telecommunications Industry Association (TIA). This is thought to triple the communication capacity of the cell system. To further increase capacity by a factor of two, the TIA begins the process of evaluation and the process of selecting a codec of substantially half speed. Half-speed codec with error protection for TIA technology evaluation is 6.4
It has an overall bit rate of Kbps and a frame rate of 40 ms.
Limited to small size. Codec is believed to have a voice quality comparable to a sufficient speed standard over a wide range of conditions. These conditions include various speakers, handset effects, background noise, and channel conditions.

【0003】コ−ドブック励起線形予測(CELP)は
低速度スピ−チコ−ド化の技術である。基本的な技術は
ランダムに分配された励起ベクトルのコ−ドブックの検
索からなり、そのベクトルは(ピッチと線形予測コ−ド
化(LPC)短期間合成フィルタを通ってフィルタ処理
されるとき)入力シ−ケンスと最も近い出力シ−ケンス
を生成する。これを行うために、コ−ドブックの全ての
候補励起ベクトルは入力シ−ケンスと比較されることが
できる候補出力シ−ケンスを生成するためにピッチおよ
びLPC合成フィルタの両者によってフィルタ処理され
なければならない。これはCELPを非常に計算的に強
化したアルゴリズムにし、典型的なコ−ドブックは1024
のエントリィとそれぞれ40のサンプル長を有する。さら
に知覚的エラ−加重フィルタが通常使用され、これは計
算的負荷に加えられる。高速のデジタル信号プロセッサ
は実時間でCELPのような非常に複雑なアルゴリズム
を実行することを助けるが、低いビット速度での低品質
の問題が存続する。通信装置中にコデックを内臓するた
めに音声品質は8.0 Kbpsデジタルセル標準に匹敵さ
れる必要がある。
Codebook Excited Linear Prediction (CELP) is a technique for low speed speech coding. The basic technique consists of searching a codebook of randomly distributed excitation vectors, which are input (when filtered through a pitch and linear predictive coding (LPC) short term synthesis filter). Generate an output sequence that is closest to the sequence. To do this, all candidate excitation vectors in the codebook have to be filtered by both the pitch and LPC synthesis filters to produce a candidate output sequence that can be compared to the input sequence. I won't. This makes CELP a very computationally robust algorithm, with a typical codebook of 1024.
With 40 entries each. Furthermore, a perceptual error weighting filter is usually used, which adds to the computational load. Although high speed digital signal processors help to execute very complex algorithms such as CELP in real time, the low quality problem at low bit rates persists. Voice quality must be comparable to the 8.0 Kbps digital cell standard in order to have a codec built into the communication device.

【0004】[0004]

【発明が解決しようとする課題】短期間の予測装置のパ
ラメ−タの多数の表示が存在する。共通して使用される
のはライン周波数スペクトルのセットである。ラインス
ペクトル周波数の量子化は幾つかの研究の主題である。
スカラおよびベクトル量子化装置の両者がこの目的のた
めに設計されている。典型的にスカラ量子化装置は話者
とハンドセットの間の良好な強固な性能、適度の複雑
性、組み込み式エラ−検出能力等の他の目的を満たすた
めに10のラインスペクトル周波数をエンコ−ドするため
に36〜40ビットを必要とする。必要なビットに関する効
率はそれ故犠牲にされる。一方、ベクトル量子化装置は
ビットに関して効率性を達成するが、組み込み式エラ−
検出能力がなく、話者またはハンドセットに依存する性
能のための費用がかかり、しばしば高い複雑性を犠牲に
する。
There are numerous displays of short term predictor parameters. Commonly used is a set of line frequency spectra. Quantization of line spectral frequencies has been the subject of some research.
Both scalar and vector quantizers are designed for this purpose. Scalar quantizers typically encode 10 line spectral frequencies to meet other objectives such as good robust performance between the speaker and handset, moderate complexity, built-in error detection capability. You need 36-40 bits to do. Efficiency on the required bits is therefore sacrificed. Vector quantizers, on the other hand, achieve efficiency in terms of bits, but with built-in error
Lack of detection capability, costly for speaker or handset dependent performance, often at the expense of high complexity.

【0005】それ故、本発明の目的は、頑丈で、一貫
し、種々の話者およびハンドセット間のラインスペクト
ル周波数として表される短期間のパラメ−タの良好な量
子化性能を提供するラインスペクトル周波数ベクトル量
子化装置を提供することである。
Therefore, it is an object of the present invention to provide a robust, consistent line spectrum that provides good quantization performance of short term parameters expressed as line spectrum frequencies between different speakers and handsets. A frequency vector quantizer is provided.

【0006】本発明の別の目的は最少の数のビットを使
用し、中程度の複雑性で伝送エラ−を克服するために組
込み式エラ−検出能力を備えている効率なラインスペク
トル周波数ベクトル量子化装置を提供することである。
Another object of the present invention is to use a minimal number of bits and to provide an efficient line spectrum frequency vector quantum with built-in error detection capability to overcome transmission errors with moderate complexity. It is to provide an oxidization device.

【0007】[0007]

【課題を解決するための手段】本発明によると各カテゴ
リ−に対して異なったベクトル量子化テ−ブルを使用し
て量子化されていないラインスペクトル周波数を4つの
カテゴリ−にクラス分類するラインスペクトル周波数ベ
クトル量子化装置と、話者およびハンドセットの間の頑
丈な性能を達成するために最適のカテゴリ−の最終選択
が設けられている。本発明は各カテゴリ−内で中程度の
複雑性の量子化されていないセットに“近接する”量子
化ラインスペクトル周波数の整列されたセットを生じる
2つの段の制限された検索処理が後続する分割ベクトル
量子化を使用する。受信機における効率的で簡単な送信
エラ−検出方式はベクトル量子化の分割特性と制限され
た検索処理により可能にされる。本発明は10のライン
スペクトル周波数をエンコ−ドするため僅か26のビット
を使用して全て所望の目的を達成することができる。
SUMMARY OF THE INVENTION According to the present invention, a line spectrum that classifies unquantized line spectrum frequencies into four categories using different vector quantization tables for each category. A final choice of frequency vector quantizer and the optimal category to achieve robust performance between the speaker and the handset is provided. The present invention is a division followed by a two stage limited search process that results in an aligned set of quantized line spectral frequencies "close" to an unquantized set of medium complexity within each category. Use vector quantization. An efficient and simple transmission error detection scheme at the receiver is made possible by the partitioning properties of the vector quantization and the limited search process. The present invention uses only 26 bits to encode 10 line spectral frequencies, all capable of achieving the desired objective.

【0008】[0008]

【実施例】前述およびその他の目的、観点、利点は図面
を参照した本発明の好ましい実施例の後述の詳細な説明
から理解されるであろう。本発明の主題はスピ−チ信号
のベクトル量子化の改良である。文献(例えばShannon
の初期の“A MathematicalTheory of Communicatio
n”、Bell System Technical Journal 、27巻、1948
年)には情報の最も経済的なコ−ド化はソ−スのエント
ロピ−よりも大きくないビット速度を必要とし、この速
度は個々のサンプルをコ−ド化するよりもサンプルの大
きなグル−プまたはベクトルをコ−ド化することにより
達成されることを示している。このことはコ−ドブック
を使用して行われた。ベクトル送信のためコ−ドブック
のエントリィの指数(即ちアドレス)のみを送信する。
受信機はコ−ドブックの自分のコピ−を有し、送信ベク
トルを回復するためアドレスを使用する。コ−ドブック
のベクトル量子化は完全ではないが、エンコ−ドされる
べきデ−タで実際に遭遇する小さいが表示的なベクトル
のサンプルを含む。それ故、サンプルのシ−ケンスを送
信するために最も近接して一致するコ−ドブックエント
リィが選択され、アドレスが送信される。ベクトルの量
子化方法はビット速度を減少する利点を有するが、実際
のベクトルとコ−ドブック内の選択されたエントリィと
の間の不整合のために信号の歪みが起こる。
The foregoing and other objects, aspects and advantages will be understood from the following detailed description of a preferred embodiment of the invention with reference to the drawings. The subject of the invention is an improvement of the vector quantization of the speech signal. Literature (eg Shannon
Early "A Mathematical Theory of Communicatio
n ”, Bell System Technical Journal, 27, 1948
Year), the most economical coding of information requires a bit rate no greater than the entropy of the source, which rate is larger than the coding of individual samples. It is shown that this is achieved by coding the code or vector. This was done using a codebook. Only the index (ie address) of the codebook entry is transmitted for vector transmission.
The receiver has its own copy of the codebook and uses the address to recover the transmit vector. The vector quantization of the codebook is not perfect, but contains the small but descriptive vector samples that are actually encountered in the data to be encoded. Therefore, the closest matching codebook entry is selected to send the sequence of samples and the address is sent. The vector quantization method has the advantage of reducing the bit rate, but it causes signal distortion due to the mismatch between the actual vector and the selected entry in the codebook.

【0009】コ−ドブックの構造では継続期間10〜30ミ
リ秒(ms)のスピ−チフレ−ムの短期間予測フィルタ
係数は通常の線形予測分析を使用して得られる。10次の
モデルが非常に一般的である。これらの短期間の10次の
モデルパラメ−タは10〜30msの間隔で更新される。こ
れらのパラメ−タの量子化は量子化処理により導入され
るスペクトルの歪みが所定の数のビットで最少であるこ
とを知覚するドメインで通常実行される。このようなド
メインの1つはラインスペクトル周波数ドメインであ
る。ラインスペクトル周波数の有効なセットは単調に増
加する周波数の必要に整列されたセットである。ライン
スペクトル周波数への短期間の予測装置のパラメ−タの
変換の複雑性は必要な解像度の程度による。性能の小さ
い損失は40Hzの解像度でこのベクトル量子化方式を使
用して観察される。10のラインスペクトル周波数は量子
化され、本発明の好ましい実施例によるベクトル量子化
装置により26のビットを使用してエンコ−ドされる。量
子化後、10の量子化されたラインスペクトル周波数が短
期間の予測装置のフィルタ係数に変換される。
In the codebook structure, the short term predictive filter coefficients of a speech frame of duration 10-30 milliseconds (ms) are obtained using conventional linear predictive analysis. The 10th order model is very common. These short term 10th order model parameters are updated at intervals of 10 to 30 ms. Quantization of these parameters is usually performed in the domain where it is perceived that the spectral distortion introduced by the quantization process is minimal for a given number of bits. One such domain is the line spectral frequency domain. A valid set of line spectral frequencies is a neatly aligned set of monotonically increasing frequencies. The complexity of converting short term predictor parameters to line spectral frequencies depends on the degree of resolution required. A small loss of performance is observed using this vector quantization scheme with a resolution of 40Hz. The 10 line spectral frequencies are quantized and encoded by the vector quantizer according to the preferred embodiment of the invention using 26 bits. After quantization, the 10 quantized line spectral frequencies are transformed into short term predictor filter coefficients.

【0010】分割ベクトル量子化はコ−ドブックの大き
さを減少するのに使用される。ベクトル量子化装置によ
り使用される26のビットはスペクトル周波数のエンコ−
ドのための24のビットと最適のカテゴリ−をエンコ−ド
するための2つのビットとを含む。10のスペクトル周波
数が最低値x1 から最高値x10の整列した素子x1 、x
2 、x3 、x4 、x5 、x6 、x7 、x8 、x9 、x10
を有するベクトルとして表されるならば、24のビットで
エンコ−ドされる全てのベクトルのセットを表すコ−ド
ブックは224のエントリィを有する。ここではそれぞれ
8つのビットでエンコ−ドされている3−3−4分割ベ
クトルと呼ばれている整列された3つのサブセット、す
なわち(x1 、x2 、x3 )、(x4 、x5 、x6 )、
(x7 、x8 、x9 、x10)にベクトルを分離すること
により、それぞれ28 または256のエントリィを有する
3つのコ−ドブックが必要とされ、コ−ドブックの構成
に大きな費用がかかることになる。
Partition vector quantization is used to reduce the size of the codebook. The 26 bits used by the vector quantizer are spectral frequency encodes.
Includes 24 bits for encoding and 2 bits for encoding the optimal category. Aligned elements x 1 , x with 10 spectral frequencies from the lowest x 1 to the highest x 10
2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 8 , x 9 , x 10
, The codebook representing the set of all vectors encoded in 24 bits has 2 24 entries. Three aligned subsets, referred to herein as 3-3-4 split vectors, each encoded with 8 bits, namely (x 1 , x 2 , x 3 ), (x 4 , x 5 , X 6 ),
By separating the vector into (x 7 , x 8 , x 9 , x 10 ), three codebooks with 2 8 or 256 entries respectively are required, which makes the construction of the codebook very expensive. It will be.

【0011】基本的な形態では、本発明により使用され
るベクトル量子化方式は量子化されていないラインスペ
クトル周波数(LSF)の以下のカテゴリ−に対する4
つの分離したベクトル量子化テ−ブルを使用する。
In basic form, the vector quantization scheme used by the present invention is 4 for the following categories of unquantized line spectral frequencies (LSF):
Two separate vector quantization tables are used.

【0012】 1.IRSフィルタされた音声LSFベクトル 2.IRSフィルタされた非音声LSFベクトル 3.IRSフィルタされない音声LSFベクトル 4.IRSフィルタされない非音声LSFベクトル IRSフィルタは線形位相FIR(有限期間のインパル
ス応答)フィルタであり、これはハンドセットトランス
デュ−サの高域通過フィルタ効果をモデル化するために
使用され、その大きさの応答がCCITTの勧告に適応
する。第1および第3のカテゴリ−では3−4−3の分
割ベクトル量子化は8−、10−、6−ビットのコ−ド
ブックを使用して行われる。第2、第4のカテゴリ−で
は3−3−4の分割ベクトル量子化が7−、8−、9−
ビットのコ−ドブックを使用して行われる。2つのビッ
トは最適のカテゴリ−をエンコ−ドするために使用され
る。従って全体で26ビットは10のラインスペクトル周波
数のエンコ−ドに使用される。
1. IRS filtered speech LSF vector 1. 2. IRS filtered non-speech LSF vector Speech LSF vector not IRS filtered 4. Non-IRS Unvoiced LSF Vector The IRS filter is a linear phase FIR (Finite Period Impulse Response) filter, which is used to model the high pass filter effect of a handset transducer and is of its magnitude. The response complies with CCITT recommendations. In the first and third categories, 3-4-3 split vector quantization is performed using 8-, 10-, and 6-bit codebooks. In the second and fourth categories, 3-3-4 division vector quantization is 7-, 8-, and 9-.
It is done using a bit codebook. Two bits are used to encode the optimal category. Thus a total of 26 bits are used to encode 10 line spectrum frequencies.

【0013】図面を参照するとベクトル量子化は量子化
されていないラインスペクトル周波数に“最も近接す
る”各カテゴリ−に対応するベクトル量子化テ−ブルか
ら整列されたラインスペクトル周波数のセットを決定す
ることにより開始される。これは2段階の方法で達成さ
れる。図1で示されている第1の段では加重された平均
二乗として最も近い対応するベクトル量子化テ−ブルか
ら量子化されていないラインスペクトル周波数へ第1の
分割ベクトルエントリィが決定される。特に、ここでは
(/x1 )として示されている第1の分割ベクトルはI
RSフィルタされた音声LSFベクトル、IRSフィル
タされた非音声LSFベクトル、IRSフィルタされな
い音声LSFベクトル、IRSフィルタされない非音声
LSFベクトルの各コ−ドブックの各コ−ドブック11,1
2,13,14 に供給される。各コ−ドブックの出力はそれぞ
れブロック15,16,17,18 の歪み計算を受ける。歪みdの
計算は平均二乗計算であり、
With reference to the drawings, vector quantization is the determination of a set of aligned line spectral frequencies from the vector quantization table corresponding to each category "closest" to the unquantized line spectral frequencies. Be started by. This is accomplished in a two step process. In the first stage, shown in FIG. 1, the first split vector entry is determined from the closest corresponding vector quantization table as the weighted mean square to the unquantized line spectrum frequencies. In particular, the first split vector, shown here as (/ x 1 ), is I
Each codebook 11,1 of each codebook of RS filtered speech LSF vector, IRS filtered non-speech LSF vector, IRS unfiltered speech LSF vector, IRS unfiltered non-speech LSF vector
It will be supplied to 2,13,14. The output of each codebook is subjected to the distortion calculation of blocks 15,16,17,18, respectively. The calculation of the strain d is a mean square calculation,

【数1】 ここでj=1,…,Nであり、Nはコ−ドブック中の素
子数である。従って各コ−ドブック検索と歪みの計算は
歪みdの測定を生成し、これは選択装置19に供給され
る。最低の歪みを生成する、即ち最も近接した選択を表
している指数とコ−ドブックは第1の分割ベクトル(/
X)に記憶される。第2、第3の近接した選択も記憶さ
れる。
[Equation 1] Here, j = 1, ..., N, and N is the number of elements in the codebook. Thus, each codebook search and distortion calculation produces a measure of distortion d, which is provided to selector 19. The index and codebook that produces the lowest distortion, ie, the closest selection, is the first partition vector (/
X). The second and third adjacent selections are also stored.

【0014】第2の分割ベクトルのエントリィは最良の
3つの候補を生成するために類似の方法で検索される。
しかしながら候補の9の組合わせのうちの少なくとも1
つが整列された順序のセットであるように検索に制限が
ある。これは性能または複雑性の両者に関してペナルテ
ィ−が小さい非常にゆるやかな制限である。第3の分割
ベクトルのエントリィは同一の制限を受ける類似の方法
で検索される。この検索からの3つの最良の候補も記憶
される。3つの分割候補をそれぞれ有する3つの分割ベ
クトルの特定の例では全部で27の候補の組合わせが存在
するが、候補の少なくとも1つの組合わせが整列される
セットである設けられた制限は候補のM個の組合わせで
あり、Mは27よりも小さい。
The entries of the second partition vector are searched in a similar manner to produce the best three candidates.
However, at least 1 in 9 combinations of candidates
The search is restricted so that one is an ordered set of two. This is a very loose limitation with a small penalty in terms of both performance or complexity. The entries of the third partition vector are retrieved in a similar way subject to the same restrictions. The three best candidates from this search are also stored. There are a total of 27 candidate combinations in the particular example of 3 partition vectors, each with 3 partition candidates, but the restriction provided is that at least one combination of candidates is an aligned set. There are M combinations, where M is less than 27.

【0015】図2で示されている第2段では、完全な量
子化されたラインスペクトル周波数ベクトルのMの組合
わせはセプストラル歪み測定を使用して量子化されない
ラインスペクトル周波数と比較され、最適の量子化され
たラインスペクトル周波数ベクトルが決定される。前述
したようにラインスペクトル周波数の整列されたセット
を生じる組合わせのみが第2段で考慮される。第2、第
3の分割ベクトルの検索期間中に設けられた制限のため
に少なくとも1つのこのような組合わせが存在する。第
1の段で使用される平均二乗エラ−歪み測定は計算上簡
単であり、それ故、第2段でより効率的ではあるがより
計算上複雑なセプストラル歪み測定を使用して検索され
る候補の量子化LSFベクトルのリストを簡潔にするの
に適切である。図2ではブロック21,22,23,24 により表
される候補のMの組合わせがセプストラル歪み計算25に
入力される。
In the second stage, shown in FIG. 2, the M combinations of the fully quantized line spectrum frequency vectors are compared to the unquantized line spectrum frequencies using the Cepstral distortion measurement and the optimal A quantized line spectrum frequency vector is determined. Only combinations that result in an aligned set of line spectral frequencies are considered in the second stage, as described above. There is at least one such combination due to the restrictions placed during the search of the second and third split vectors. The mean square error distortion measurement used in the first stage is computationally simple and therefore candidates searched using the more efficient but more computationally complex Cepstral distortion measurement in the second stage. Is appropriate to simplify the list of quantized LSF vectors of In FIG. 2, the candidate M combinations represented by blocks 21, 22, 23, 24 are input to the Cepstral distortion calculator 25.

【0016】時には、計算は二重フ−リエ変換を使用し
て行われる。特にスピ−チスペクトルは励起スペクトル
の積であり、これは音声スピ−チに対しては一連の調波
から構成され、比較的スム−スな周波数関数である音声
区域伝達関数の変換である。スペクトルの対数が取られ
るならば、励起および伝達関数要素を付加し、対数にさ
れたスペクトルを再度変換するため次式が得られる。
Occasionally, the calculations are done using a double Fourier transform. In particular, the speech spectrum is the product of the excitation spectra, which for speech speech is a transformation of the speech area transfer function, which consists of a series of harmonics and is a relatively smooth frequency function. If the logarithm of the spectrum is taken, adding the excitation and transfer function elements and retransforming the logarithmized spectrum gives:

【0017】[0017]

【数2】 このような変換は文献(D. P. Bogertによる“The quef
rency alanysis of time series for echoes:ceptrum,
pseudo-autocovariance,cross-cepstrum,and saphe cra
cking ”、Proc. Symp. 、Time Series Analysis、209
〜243 頁、1963年)により(“spectrum”の最初の4文
字を反転することによる)“セプストラム(cepstru
m)”と名付けられている。
[Equation 2] Such transformations are described in the literature (“The quef by DP Bogert
rency alanysis of time series for echoes: ceptrum,
pseudo-autocovariance, cross-cepstrum, and saphe cra
cking ”, Proc. Symp., Time Series Analysis, 209
Pp. 243, 1963) (by reversing the first four letters of "spectrum").
m) ”.

【0018】セプストラムの二重フ−リエ変換の計算は
計算的に複雑である。本発明の好ましい実施例はそれ
故、図1の歪み計算により行われるものと類似してセプ
ストラム距離dcep と、平均二乗計算の形態の計算を使
用する。特に、セプストラム歪み計算器25は以下の計算
を行う。
The calculation of the double Fourier transform of the cepstrum is computationally complex. The preferred embodiment of the present invention therefore uses a calculation in the form of a cepstrum distance d cep and a mean square calculation similar to that performed by the distortion calculation of FIG. In particular, septum strain calculator 25 performs the following calculations.

【0019】[0019]

【数3】 ここでci は文献(A. H. Gray, Jr. とJ. D. Markelに
よる“Distance Measures for Speech Processing ”、
IEEE Transactions on Acoustics , Speech, andSignal
Processing、ASSP-24 巻、No.5、1976年10月、380
頁)に説明されているようにセプストラム係数である。
ブロック25の出力はここでは指数I、指数J、指数Kと
して表されている最小の歪みを有する候補の組合わせで
ある。従って図2で示される最終段では、最適のカテゴ
リ−はその最適の量子化されたLSFベクトルがもとの
量子化されていないLSFベクトルと比較するとき最低
のセプストラル歪みを有するように決定される。良好な
性能と中程度の複雑性との2つの目的はこの2段の方法
により満たされる。
[Equation 3] Where c i is the reference (“Distance Measures for Speech Processing” by AH Gray, Jr. and JD Markel,
IEEE Transactions on Acoustics, Speech, and Signal
Processing, ASSP-24 Volume, No.5, October 1976, 380
The cepstrum coefficient, as described in (Page).
The output of block 25 is the combination of candidates with the least distortion, represented here as index I, index J, index K. Therefore, in the final stage shown in FIG. 2, the optimal category-is determined such that the optimal quantized LSF vector has the lowest cepstral distortion when compared to the original unquantized LSF vector. . The two goals of good performance and medium complexity are met by this two-stage method.

【0020】完全な量子化されたLSFベクトルは対応
するベクトルエントリィを連結することにより各3つの
分割した各ベクトルに対応する最適の指数から得られ
る。このようなベクトルは順序が整列されることが保証
されている。受信機で再構成された量子化されたLSF
ベクトルが整列されないならば3つの最適のベクトル量
子化指数の伝送のエラ−が検出される。このベクトル量
子化方式のこの簡単なエラ−検出能力は検索期間中に設
けられる制限のために可能にされ、3つに分離した性質
のために効果的にされる。
The fully quantized LSF vector is obtained from the optimal index corresponding to each of the three divided vectors by concatenating the corresponding vector entries. Such vectors are guaranteed to be ordered. Quantized LSF reconstructed at receiver
If the vectors are not aligned, three optimal vector quantization index transmission errors are detected. This simple error detection capability of this vector quantization scheme is enabled due to the limitations placed during the search period, and is made effective due to its three-part nature.

【0021】本発明の好ましい実施例では、ベクトル量
子化テ−ブルは50人以上の話者の大量のデ−タベ−スを
使用して標準的なLBGアルゴリズムの変化を使用して
設計される。このベクトル量子化方式を使用して測定さ
れた0〜4Khzからの全ての周波数にわたる平均的な
対数スペクトル歪みはIRSフィルタされたスピ−チデ
−タベ−スとIRSフィルタされていないスピ−チデ−
タベ−スの両者にわたって1.3 Dbである。
In the preferred embodiment of the invention, the vector quantization table is designed using a variation of the standard LBG algorithm using a large database of 50 or more speakers. . The average logarithmic spectral distortion over all frequencies from 0-4 Khz measured using this vector quantisation method is the IRS filtered and unirs filtered speech database. −
It is 1.3 Db over both tabes.

【0022】図3は本発明の好ましい実施例による特定
の設定を示したブロック図である。3−4−3の分割ベ
クトル量子化としてのLSFの分割したバンド部分31は
音声スピ−チ、即ちIRSフィルタされた、およびIR
Sフィルタされていない音声LSFベクトル用に使用さ
れる。3−3−4分割ベクトル量子化としてのLSFの
分割したバンド部分32は非音声スピ−チ即ちIRAフィ
ルタされた、およびIRSフィルタされていない非音声
LSFベクトル用に使用される。
FIG. 3 is a block diagram showing specific settings according to the preferred embodiment of the present invention. 3-4-3 Split Band Quantization of LSF as Split Vector Quantization 31 Speech Speech, IRS Filtered, and IR
Used for unfiltered speech LSF vectors. The LSF split band portion 32 as a 3-3-4 split vector quantisation is used for non-speech speech or IRA filtered and non-IRS filtered non-speech LSF vectors.

【0023】分割バンド部分31は図4のAで示されてい
るコ−ドブック検索処理を受け、一方分割バンド部分32
は図4のBで示されているコ−ドブック検索を受ける。
最初に図4のAを参照すると第1の分割ベクトルw1
2 、w3 は組合わせ候補w1 * 、w2 * 、w3 * を生
成するためコ−ドブック41で検索され、第2の分割ベク
トルw4 、w5 、w6 、w7 は組合わせ候補w4 * 、w
5 * 、w6 * 、w7 *を生成するためにコ−ドブック42
で検索され、第3の分割ベクトルw8 、w9 、w10は図
1を参照して通常説明されているように組合わせ候補w
8 * 、w9 * 、w10 * を生成するためにコ−ドブック43
で検索される。組合わせ候補は音声部分に対してセプス
トラル距離δcep を生成するためにブロック44でセプス
トラル距離計算を受ける。同様に、図4Bでは第の分割
ベクトルw1 、w2 、w3 は組合わせ候補w1 **、w2
**、*w3 **(上付きの**はコ−ドブック41により生
成される組合わせ候補と区別するために使用される)を
生成するためコ−ドブック45で検索され、第2の分割ベ
クトルw4 、w5 、w6 は組合わせ候補w4 **
5 **、w6 **を生成するためコ−ドブック46で検索さ
れ、第3の分割ベクトルw7 、w8 、w9 、w10は組合
わせ候補w7 **、w8 **、w9 **、w10 **を生成するた
めコ−ドブック47で検索される。組合わせ候補は非音声
部分のセプストラル距離*δcep を生成するためブロッ
ク48でセプストラル距離計算を受ける。
The split band portion 31 undergoes the codebook search process shown in FIG. 4A, while the split band portion 32
Undergoes the codebook search shown at B in FIG.
First, referring to FIG. 4A, the first division vector w 1 ,
w 2 and w 3 are searched in the codebook 41 to generate the combination candidates w 1 * , w 2 * and w 3 * , and the second division vectors w 4 , w 5 , w 6 and w 7 are set. Matching candidate w 4 * , w
5 *, w 6 *, co to produce a w 7 * - codebooks 42
, And the third partition vectors w 8 , w 9 , w 10 are combined candidate w as described normally with reference to FIG.
8 *, w 9 *, co-in order to generate the w 10 * - codebook 43
It is searched by. The combinatorial candidates undergo a cepstral distance calculation at block 44 to generate a cepstral distance δ cep for the speech portion. Similarly, in FIG. 4B, the first division vectors w 1 , w 2 , w 3 are combination candidates w 1 ** , w 2
** , * w 3 ** (the superscript ** is used to distinguish from the combination candidates generated by the codebook 41) are searched in the codebook 45 and the second The division vectors w 4 , w 5 , and w 6 are combination candidates w 4 ** ,
w 5 **, for co generating a w 6 ** - is searched codebook 46, a third split vector w 7, w 8, w 9 , w 10 are combinatorial candidates w 7 **, w 8 ** , W 9 ** , w 10 ** are searched in codebook 47. The combinatorial candidates are subjected to a cepstral distance calculation at block 48 to produce a cepstral distance * δ cep for the non-voice portion.

【0024】本発明は単一の好ましい実施例に関して説
明されたが、本発明が特許請求の範囲の技術的範囲内で
変形が実行されることが当業者により理解できよう。
Although the present invention has been described with respect to a single preferred embodiment, it will be appreciated by those skilled in the art that the present invention may be modified within the scope of the appended claims.

【図面の簡単な説明】[Brief description of drawings]

【図1】送信される分割ベクトルの候補指数を選択する
ための送信機におけるコ−ドブック検索処理を示す機能
的ブロック図。
FIG. 1 is a functional block diagram illustrating a codebook search process at a transmitter for selecting a candidate index for a transmitted split vector.

【図2】伝送のための最低の歪みの分割ベクトルシ−ケ
ンスを選択する制限された選択処理を示す機能的ブロッ
ク図。
FIG. 2 is a functional block diagram illustrating a limited selection process for selecting the lowest distortion split vector sequence for transmission.

【図3】音声スピ−チおよび音声ではないスピ−チ部分
の3−4−3と3−3−4分割ベクトル量子化を使用す
る本発明の好ましい構成を示しているブロック図。
FIG. 3 is a block diagram showing a preferred configuration of the invention using 3-4-3 and 3-3-4 split vector quantization of speech and non-speech speech portions.

【図4】3−4−3音声スピ−チ部分検索の検索処理を
示したブロック図と、3−3−4の音声ではないスピ−
チ部分の検索処理を示したブロック図。
FIG. 4 is a block diagram showing a search process of 3-4-3 voice speech partial search, and 3-3-4 non-voice speech.
The block diagram which showed the search process of the H part.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 クマー・スワミナサン アメリカ合衆国、メリーランド州 20879、 ゲイザースバーグ、ナンバー202、ロス ト・ナイフ・サークル 18211 ─────────────────────────────────────────────────── --Continued Front Page (72) Inventor Kumar Swaminathan, State of Maryland, USA 20879, Gaithersburg, No. 202, Lost Knife Circle 18211

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 量子化されていないラインスペクトル周
波数ベクトルを受信し、 量子化されていないベクトルと類似する候補の量子化さ
れたラインスペクトル周波数ベクトルに対する複数の特
定の各コ−ドブックを検索し、 量子化されていないベクトルを用いて各候補ベクトルに
対する歪み測定を計算し、 各候補ベクトルに対する計算された歪み測定を用いて各
コ−ドブックからの候補ベクトルの中から量子化された
ラインスペクトル周波数ベクトルを選択することを特徴
とするデジタル通信システムにおけるラインスペクトル
周波数ベクトルの量子化方法。
1. Receiving an unquantized line spectral frequency vector and searching a plurality of specific respective codebooks for candidate quantized line spectral frequency vectors similar to the unquantized vector, Compute the distortion measure for each candidate vector using the unquantized vector and the quantized line spectrum frequency vector from among the candidate vectors from each codebook using the calculated distortion measure for each candidate vector. A method for quantizing a line spectrum frequency vector in a digital communication system, characterized in that.
【請求項2】 量子化されたラインスペクトル周波数ベ
クトルの複数の特定化されたコ−ドブックと、 入力の量子化されていないラインスペクトル周波数ベク
トルと類似した候補ラインスペクトル周波数ベクトルに
対する各特定化されたコ−ドブックを検索する手段と、 入力の量子化されていないベクトルを用いて各候補ベク
トルに対する歪み測定を計算する手段と、 各候補ベクトルに対する計算された歪み測定を用いて各
コ−ドブックからの候補ベクトルの中から量子化された
ラインスペクトル周波数ベクトルを選択する手段とを具
備することを特徴とするライン周波数ベクトル量子化装
置。
2. A plurality of specialized codebooks of quantized line spectral frequency vectors and each specialized line spectral frequency vector similar to the input unquantized line spectral frequency vector. Means for searching the codebook, means for calculating the distortion measure for each candidate vector using the unquantized vector of the input, and means for calculating the distortion measure for each candidate vector from each codebook. And a means for selecting a quantized line spectrum frequency vector from the candidate vectors.
JP5333161A 1993-12-27 1993-12-27 Method and device for quantizing vector-wise line spectrum frequency Pending JPH07212239A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5333161A JPH07212239A (en) 1993-12-27 1993-12-27 Method and device for quantizing vector-wise line spectrum frequency

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5333161A JPH07212239A (en) 1993-12-27 1993-12-27 Method and device for quantizing vector-wise line spectrum frequency

Publications (1)

Publication Number Publication Date
JPH07212239A true JPH07212239A (en) 1995-08-11

Family

ID=18262977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5333161A Pending JPH07212239A (en) 1993-12-27 1993-12-27 Method and device for quantizing vector-wise line spectrum frequency

Country Status (1)

Country Link
JP (1) JPH07212239A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007506986A (en) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 Multi-resolution vector quantization audio CODEC method and apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6032100A (en) * 1983-08-03 1985-02-19 日本電気株式会社 Lsp type pattern matching vocoder
JPS61252600A (en) * 1985-05-02 1986-11-10 日本電気株式会社 Lsp type pattern matching vocoder

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6032100A (en) * 1983-08-03 1985-02-19 日本電気株式会社 Lsp type pattern matching vocoder
JPS61252600A (en) * 1985-05-02 1986-11-10 日本電気株式会社 Lsp type pattern matching vocoder

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007506986A (en) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 Multi-resolution vector quantization audio CODEC method and apparatus

Similar Documents

Publication Publication Date Title
JP3680380B2 (en) Speech coding method and apparatus
JP4005154B2 (en) Speech decoding method and apparatus
JP3707153B2 (en) Vector quantization method, speech coding method and apparatus
JP3707154B2 (en) Speech coding method and apparatus
US5495555A (en) High quality low bit rate celp-based speech codec
KR100304092B1 (en) Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus
CN101971253B (en) Encoding device, decoding device, and method thereof
JPH09127991A (en) Voice coding method, device therefor, voice decoding method, and device therefor
JPH08179796A (en) Voice coding method
US5651026A (en) Robust vector quantization of line spectral frequencies
JP3344962B2 (en) Audio signal encoding device and audio signal decoding device
JPH10124092A (en) Method and device for encoding speech and method and device for encoding audible signal
JPH10214100A (en) Voice synthesizing method
JPH05265499A (en) High-efficiency encoding method
JP3237178B2 (en) Encoding method and decoding method
EP0658873A1 (en) Robust vector quantization of line spectral frequencies
KR960015861B1 (en) Quantizer & quantizing method of linear spectrum frequency vector
JPH09127987A (en) Signal coding method and device therefor
JPH07212239A (en) Method and device for quantizing vector-wise line spectrum frequency
JPH05113799A (en) Code driving linear prediction coding system
JPH08237136A (en) Coder for broad frequency band signal
Ubale et al. A low-delay wideband speech coder at 24-kbps
JP3252285B2 (en) Audio band signal encoding method
Ozaydin et al. A 1200 bps speech coder with LSF matrix quantization
JP2002221998A (en) Method, device and program for encoding and decoding acoustic parameter and voice