WO1994007239A1 - Speech encoding method and apparatus - Google Patents

Speech encoding method and apparatus Download PDF

Info

Publication number
WO1994007239A1
WO1994007239A1 PCT/JP1993/001323 JP9301323W WO9407239A1 WO 1994007239 A1 WO1994007239 A1 WO 1994007239A1 JP 9301323 W JP9301323 W JP 9301323W WO 9407239 A1 WO9407239 A1 WO 9407239A1
Authority
WO
WIPO (PCT)
Prior art keywords
vector
code
vectors
correlation
distance
Prior art date
Application number
PCT/JP1993/001323
Other languages
French (fr)
Japanese (ja)
Inventor
Tomohiko Taniguchi
Yoshinori Tanaka
Yasuji Ohta
Hideaki Kurihara
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to JP50796994A priority Critical patent/JP3531935B2/en
Publication of WO1994007239A1 publication Critical patent/WO1994007239A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Definitions

  • the present invention relates to an audio encoding method and apparatus for compressing information of an audio signal, and more particularly to an analysis by-synthesis (A—b—S) vector for encoding at a transmission rate of 4 to 16 Kbps.
  • the present invention relates to a speech encoding method and apparatus using torque quantization.
  • a _ b Speech encoders that use S-vector quantization, such as Code-Excited Linear Prediction (CELP) encoders, have recently been used to convert speech signals in in-house communication systems and digital mobile radio systems. It is regarded as a promising speech coder that compresses information while maintaining its quality.
  • CELP Code-Excited Linear Prediction
  • a prediction signal is applied to each code vector of a codebook to generate a reproduction signal, and the reproduction signal and the input speech signal are combined with each other. It evaluates the error power between the two and determines the code vector number (index) with the least error and transmits it to the receiving side.
  • the encoder using the A—b—S-type vector quantization method described above performs linear prediction synthesis on each of the approximately 1000 patterns of the source signal vectors stored in the codebook.
  • a process in which filtering is performed, and a pattern that minimizes the error between each reproduced audio signal and the input audio signal to be encoded is searched from among the approximately 1,000 patterns. Shore.
  • the encoder since the encoder is required to have a prompt call, Processing must be done in real time. In that case, the search process must be performed continuously during a call at a short time interval, for example, 5 ms.
  • Japanese Patent Application No. 3-127669 Japanese Patent Application Laid-Open No. 4-352200
  • Japanese Patent Application Laid-Open No. 4-352200 Japanese Patent Application Laid-Open No. 4-352200
  • a tree-structured delta code that generates a code vector having a tree structure by sequentially adding and subtracting delta vectors using a codebook that stores the delta vector that is the difference between signal vectors He suggested using a book.
  • the memory capacity required for the codebook is greatly reduced, and the filter operation and the correlation operation for each code vector are performed for the delta vector. And by performing a correlation operation, and sequentially adding and subtracting the results, a large reduction in the amount of operation is realized.
  • each code vector is generated as a linear combination of the delta vector as a smaller number of base vectors, and thus the delta vector is generated as a component. It has no components other than the vector. That is, of the space where the vector to be encoded is distributed (usually 40 to 64 dimensions), only the subspace of the dimension corresponding to the number of delta vectors at most (usually 8 to 10). The distribution of the code vector cannot be given. Therefore, in the tree-structured delta codebook, even if the base vector (delta vector) is designed sufficiently based on the statistical distribution of the speech signal to be encoded, the conventional structural constraints There was a problem that the quantization characteristics deteriorated compared to a codebook without one.
  • each delta vector contributes to the code vector, and the contribution to the delta vector can be changed by changing the order of the delta vector. Focusing on, the filter operation is performed on each delta vector each time the coefficient of the linear prediction synthesis filter is determined, and the power (vector length) is compared.
  • this method is not different from the conventional method in that a code vector is generated from only a limited number of delta vectors, so there is a limit to the improvement of characteristics, and further improvement is required. Have been.
  • variable bit rate coding refers to the overall efficiency by changing the bit rate of the code as appropriate according to conditions such as the margin of the transmission path and the importance of the sound source. It is a coding method that can change the bit rate to achieve good coding.
  • the vector quantization method for variable-rate speech coding When using the vector quantization method for variable-rate speech coding, prepare a codebook with the number of patterns corresponding to each transmission rate, and use them according to the desired transmission rate. It is necessary to perform encoding while switching. At this time, in the case of a conventional codebook in which code vectors are simply arranged, the maintenance of each codebook is equivalent to the product of (vector dimension: N) and (number of patterns: M). NXM word memory is required.
  • the number of patterns M is proportional to the power of 2 of the number of bits of the index of the code vector, so that the variable width of the transmission rate can be increased or the transmission rate can be increased. There is a problem in that controlling the rate in small steps requires a large amount of memory.
  • variable rate transmission it may be necessary to forcibly reduce the transmission rate of the encoded transmission signal in response to a request from the transmission network side.
  • the audio signal has to be reproduced from the bit-dropped information in the encoded information generated by the encoder.
  • the quantizer of (1) includes the quantization level of a low-rate quantizer (embedded coding).
  • the first object of the present invention is a further improvement over the above-mentioned method.
  • a speech encoding method and apparatus using the extracted tree-structured data codebook is provided.
  • a second object of the present invention is to provide a voice coding method and apparatus using vector quantization which does not require a huge amount of memory for a codebook and can take measures against bit-up. It is here.
  • the input speech signal vector is determined by the index assigned to the code vector having the shortest distance from the input speech signal vector among the code vectors given in advance.
  • An encoding device for encoding the input audio signal vector comprising: Means for storing a plurality of difference code vectors;
  • a speech coding apparatus comprising: means for estimating a distance to a vector; and means for determining a code vector having the smallest estimated distance.
  • the input speech signal is represented by a code having a variable bit length added to a code vector having a minimum distance from the input speech signal vector in a predetermined code vector.
  • a variable length speech coding method for performing variable length coding on a signal vector comprising:
  • a provided variable length speech coding method is also provided.
  • an input speech signal is provided in a predetermined code vector.
  • a variable-length speech coding method for performing variable-length coding on the input speech signal vector using a variable-bit-length code attached to a code vector having a minimum distance from the signal vector.
  • a variable-length speech encoding device comprising: a code determining unit.
  • Figure 1 is a block diagram showing the concept of the speech generation system
  • Fig. 2 is a block diagram showing the principle of general CELP speech coding
  • Fig. 3 is a conventional technology that uses A—b—S-type vector quantization for noise codes. Block diagram showing the configuration
  • Figure 4 is a block diagram that models the algorithm of the random codebook search process
  • Fig. 5 is a block diagram for explaining the principle of the delta codebook
  • Figs. 6A and 6B are diagrams for explaining the adaptation method of the tree-structured delta codebook
  • FIG. 7A, 7B and 7C are diagrams for explaining the principle of the present invention.
  • FIG. 8 is a block diagram of the speech encoder of the present invention.
  • FIG. 9A and FIG. 9B are diagrams for explaining the variable rate coding method of the present invention.
  • Speech includes voiced and unvoiced sounds.
  • Voiced sound is generated based on a pulse sound source caused by vibration of the vocal cords, and becomes a voice with the vocal tract characteristics of the individual's nodule and mouth added.
  • An unvoiced sound is a sound produced without shaking the vocal cords, and a mere Gaussian noise sequence becomes a sound source and becomes a voice through the vocal tract. Therefore, as shown in Fig. 1, the speech generation mechanism adds a vocal tract characteristic to the signal output from each sound source, a pulse sound source P SG that is a source of voiced sound, a noise source N SG that is a source of unvoiced sound. It can be modeled by a linear prediction synthesis filter LPCF. It should be noted that a human voice has a pitch periodicity, and the periodicity corresponds to a periodicity of a pulse output from a pulse sound source, and differs depending on a person or the content of a talk.
  • the period of the pulse source corresponding to the input speech and the noise sequence of the noise source can be specified, a code (index) that identifies the pulse period and the noise sequence of the noise source can be obtained.
  • the input speech can be encoded.
  • the vector P obtained by delaying the past value (b P + g C) by a different number of samples is stored in the adaptive codebook 11, and is stored in the adaptive codebook 11.
  • the vector b P obtained by multiplying the vector P by the gain b is input to the linear prediction synthesis filter 12 and subjected to filter operation processing, and the obtained filter operation result bAP is input to the input audio signal.
  • the cycle is determined by selecting the vector P of the adaptive codebook 11 in which the difference power is minimized in the error power evaluation unit 13 from the error signal after subtraction from X.
  • each noise sequence is represented by an N-dimensional code vector
  • each code vector C Is a code that minimizes the error between the reproduced signal vector g AC and the input signal vector X (N-dimensional vector) obtained by multiplying the gain by g and multiplying by the linear prediction synthesis filter 3.
  • Evaluate the vector for error power If the unit 5 determines, the speech can be encoded by the data (index) specifying the cycle and the code vector. Note that the example described above with reference to FIG. 2 is an example where the vector AC and the vector AP are orthogonalized, and otherwise, the input signal vector X The vector X minus the vector bAP is determined from the vector X — the code vector that minimizes the error from bAP.
  • Figure 3 is a block diagram of the audio transmission (encoding) method using vector quantization by the A-b-S method, which corresponds to the lower half of Fig. 2.
  • 1 is a noise codebook that stores only the size M of the N-dimensional code vector C
  • 2 is the gain section of the gain g
  • 3 is determined by linear prediction analysis from the input signal X.
  • a linear prediction synthesis filter having coefficients and performing a linear prediction filter operation on the output of the amplification unit 2
  • 4 is a reproduction signal vector and an input signal vector output from the linear prediction synthesis filter 3;
  • An error generator 5 for outputting a vector error is an error power evaluator for evaluating the error and obtaining a code vector that minimizes the error.
  • the filter processing is performed by the linear prediction synthesis filter 3, and the error between the reproduced signal vector (g AC) and the input signal vector (X) obtained by the filter processing is obtained.
  • the signal (E) is obtained by the error generator 4, and the error power evaluator 5 searches the noise codebook 1 using the power of the error signal as an evaluation function (distance scale).
  • a vector is obtained, and the input signal is encoded using a code (index) that specifies the code vector and transmitted.
  • An error power evaluator 5 is provided for determining a code and outputting a code specifying the code vector, but is equivalent to FIG.
  • Japanese Patent Application No. 3-127669 Japanese Unexamined Patent Application Publication No. 4-352200
  • the amount of computation required for searching for a noise codebook can be reduced and the memorandum required for storage of the noise codebook can be reduced.
  • a tree-structured delta codebook as shown in Fig. 5 instead of the conventional noise codebook.
  • Each layer in addition registration and subtracting this and by sequential tree structure on the (2 10 - 1) types of noise sequences of code base-vector (codeword) C. ⁇ C 1022 can be expressed. Or these codes base-vector - Co base-vector (or no base-vector) was added 2 of 10 noise sequences co one de base-vector (codeword) (:. -C 1023 As can represent the I do.
  • L-N the storage capacity of the conventional random codebook
  • R cc (2k + z> R cc (k) + ( ⁇ i) T (AA i) ⁇ 2 (A m i) T (AC k ) (13)
  • the cross-correlation R xc if the calculation of the cross-correlation X T (AAi) for each delta vector ⁇ (i 0 to L 1; By sequentially adding or subtracting them according to Eq. (11), that is, according to the tree structure in FIG. 5, the cross-correlation R xc (j >) for all code vectors C j is calculated immediately. In the conventional codebook, it is necessary to calculate the cross-correlation of the entire noise sequence with respect to the code vector.
  • the components of the delta vectors are delta vectors. No other components. That is, of the space in which the vector to be encoded is distributed (usually 40 to 64 dimensions), the part of the dimension corresponding to the number of delta vectors at most (usually 8 to 10). Only the space can be given the distribution of the code vector.
  • the vector quantization is different from the normal vector quantization, and the code vector is filtered.
  • the distance is evaluated in the space of the signal vector that has been subjected to the linear prediction synthesis filter having the transfer function Az, and the optimal vector!
  • the directional components of each axis are not uniform, and amplification with a certain distortion is performed.
  • the characteristic (A) of the linear predictive synthesis filter shows different amplitude amplification characteristics for each delta vector that is a component of the codebook, and the resulting vector is uniform over the entire space. Does not distribute.
  • each delta vector to the code vector differs depending on the position where the delta vector is placed in the delta codebook 10.
  • base delta placed in the second-vector ⁇ whereas that help to all code base-vector follows the second layer
  • the third delta base-vector delta 2 below the third layer contribute to the code base click preparative Le of Te to Baie
  • delta 9 contributes only to the code base click preparative Le tenth hierarchy. That is, by changing the order of the delta vectors, the contribution of each delta vector to the sign vector can be changed.
  • the applicant of the present application has disclosed in Japanese Patent Application No. 3-515016 that the filter characteristics (A) are first applied to each delta vector ⁇ i.
  • the number of delta vectors is the same as the number actually used, and encoding is performed using the rearranged delta vectors. There are restrictions.
  • the delta vector (L-initial vector tens L—1 Delta vector) More delta vector candidates (L 'book: L'> L) are given, and these candidates are sorted by performing the same operation as above. After that, the desired number (L) of delta vectors are selected from those with the highest amplitude amplification rate. And configure the codebook. By doing so, a codebook with a high degree of freedom can be obtained, and the quantization characteristics are improved.
  • the above description is about the encoder.
  • the decoder opposite to this encoder also has the same delta vector candidates as the encoder side, and performs the same control as the encoder side.
  • the above description is about the encoder.
  • the decoder opposite to this encoder also has the same delta vector candidates as the encoder side, and performs the same control as the encoder side.
  • FIG. 8 is a block diagram showing an embodiment of the speech coding method according to the present invention based on the above idea.
  • the initial vector and the delta vector are two-dimensional vectors in which the amplitudes of the noises of the ⁇ ⁇ samples generated in time series are encoded.
  • the linear predictive synthesis filter 3 is a filter composed of an IIR filter of order ⁇ , a square matrix of ⁇ X ⁇ ⁇ ⁇ generated from the impulse response of this filter, and a delta matrix.
  • the vector multiplication is performed, and the delta vector A i is subjected to the final processing A, and the vector ⁇ ⁇ is output.
  • the Np coefficients of the IIR filter are changed based on the input audio signal, and are determined each time by a well-known method. That is, since there is a correlation between adjacent samples of the input speech signal, a phase coefficient between samples is calculated, a partial autocorrelation coefficient called a Percoll coefficient is calculated from the correlation coefficient, and 11 R is calculated from the Percoll coefficient.
  • the alpha coefficient of the type filter is determined, an NXN square matrix A is created using the impulse response sequence of the filter, and the vector ⁇ i is filtered.
  • the details of the encoding unit 48 that finds the index of the file C will be described.
  • the encoding unit 48 calculates a cross-correlation ⁇ ⁇ ( ⁇ ) between the input signal vector X and each delta vector, and computes the delta vector A i by itself.
  • the cross-correlation term ( ⁇ ⁇ (Calculation unit 55 for calculating ACJ) and the cross-correlation of each delta vector from the calculation unit 50 are accumulated to calculate the cross-correlation between the input signal vector X and the sign vector C.
  • the parameter i representing the hierarchy being operated on is set to zero.
  • the calculation units 50 and 52 calculate and output ⁇ ⁇ ( ⁇ .) And ( ⁇ ) ⁇ ( ⁇ . :), respectively.
  • the arithmetic units 54 and 55 output 0.
  • Calculating unit 50, 52 is output chi T (Alpha ⁇ .), (Alpha ⁇ .) Tau (Alpha ⁇ .) Cross-correlation R xc in the first hierarchy, respectively (.>, And autocorrelation R cc (°)
  • the signals are stored and output to the calculation units 56 and 58.
  • the calculation unit 60 outputs these values from R xc (0) and R cc (0) to F (X, C). The value of R cc is calculated and output.
  • the error minimum noise sequence determination unit 62 compares the calculated F (X, C) with the maximum value F max (the initial value is 0) of the previous F (X, C), and obtains F (X, C)> F If it is max, F (X, C) ⁇ F max is updated and F max is updated, and a code specifying a noise sequence (code vector) that gives F max is replaced by a code up to that. Update.
  • parameter i is updated from 0 to 1.
  • arithmetic units 50 and 52 calculate and output X T (Aum ( ⁇ )) ⁇ ( ⁇ ⁇ i), respectively, and arithmetic unit 54 calculates ( ⁇ ) ⁇ ( ⁇ ⁇ .).
  • the calculation unit 55 outputs the value as the cross term ( ⁇ ,) ⁇ (ACo)
  • the calculation unit 56 outputs the stored R xc ⁇ ()) and the output from the calculation unit 50 X T (Am,) From the values of (10) and (11), the values of the cross correlations R xc (1) and R xc (2> in the second hierarchy are calculated, output, and stored.
  • the arithmetic unit 58 stores the stored R cc From the values of (Aum ( ⁇ ,), ( ⁇ ,) T (ACo)) output from the arithmetic units 52 and 55, respectively, the autocorrelation R cc in the second layer is calculated according to the equations (12) and (13). Calculate, output, and store the values of (1) and R cc (2)
  • parameter i is updated from 1 to 2.
  • the arithmetic units 50 and 52 calculate and output ⁇ ⁇ ( ⁇ ⁇ 2 )> ( ⁇ ⁇ ⁇ ) ⁇ ( ⁇ ⁇ 2 ), respectively.
  • the cross-correlation ( ⁇ ⁇ 2 ) ⁇ ( ⁇ ,,) and ( ⁇ ⁇ 2 ) ⁇ (room) are calculated and output.
  • the arithmetic unit 55 from those values, calculates and outputs the term crosspoint according (14) ( ⁇ ⁇ ⁇ ) ⁇ (AC ).
  • the arithmetic unit 56 divides the stored R xc (1> , R xc (2)) and the value of X T (Am 2 ) input from the arithmetic unit 50 into the third layer according to equations (10) and (11). Calculates, outputs, and stores the value of the cross-correlation R xc (3 to 6> in the calculation unit.
  • the arithmetic unit 58 stores the stored R cc (1> , R cc (2> and the values from the arithmetic units 52 and 55).
  • the voice coding unit 64 converts the latest code stored in the minimum error noise sequence determination unit 62 into the input signal vector X It is output as the index of the code vector whose distance to is the smallest.
  • a tree-structured delta codebook ⁇ having the structure shown in FIG. 9A.
  • Delta it may be stored the ⁇ 2 ..., the first layer of the base click preparative Le ⁇ Chi These sac as shown in FIG. 9 beta.
  • C is obtained as index data.
  • 1-bit encoding is achieved by 1-bit information indicating whether or not to select.
  • C is used as the index data.
  • a two-bit encoding is achieved with two bits of information specifying whether or not to select and / or one Ad.
  • the vector ⁇ up to the i-th stage. , Mm, ... i-bit encoding is achieved by using ⁇ i. Therefore, the bit length of the generated index data can be set to 1 to just by using a set of tree-structured delta codebooks including L delta vectors ⁇ 0, ⁇ ,... ⁇ L—,. It can be changed arbitrarily in the range of L.
  • variable bit rate encoding of ⁇ to L bits is performed. Assuming that the dimension of the vector is N, the number of required memory bits is
  • NX (2 ° + 2 1 ten ... ten 2 L) NX (2 L + 1 one 1)
  • the tree-structured delta codebook includes a tree-structured delta codebook that does not perform the above-described reordering, a tree-structured delta codebook in which delta vectors are rearranged according to the amplification factor of A, and L ′ Any of the tree-structured delta codebooks that can be used by selecting L out of these data vectors can be used.
  • the control for changing the bit rate can be easily achieved by terminating the processing in the encoding processing unit 48 of FIG. 8 at an intermediate layer in accordance with the desired number of bits.
  • the embedded coding that is, the coding system that can reproduce the sound at the decoder even if some bits are forcibly omitted in the transmission path, uses the above-mentioned tree structure delta code.
  • the coding system can be configured to be reproduced as a code vector of its parent or ancestor on a tree structure. Achieved.
  • a 4-bit code system [C. , C,... C, 4 ], if one bit is missing, C, 3 , C, and 4 are assumed to be 3-bit C 6, and C ⁇ .
  • Cu is a 3-bit C 5 It is configured to be played as. In this way, the parent-child code vectors are relatively close. Since it has a high value, it is possible to reproduce the sound without significant deterioration of sound quality.
  • Table 14 shows an example of such a coding system.
  • C 2 ⁇ . — ⁇ , has only two delta 'vector elements, and the signs are in the order (10,1).
  • the code in this case is regarded as (0, 0, ten, one) and is expressed as "0 0 1 0".
  • Table 5 shows the case where a bit drop of 1 bit from 4 bits to 3 bits occurs for the information encoded in this way.
  • Table 7-10 shows another example of the embedded code system of the present invention.
  • Table 7 Transmission bit 1 bit In the case of a packet

Abstract

L' delta vectors Δi (i = 0, 1, 2, ..., L'-1) greater than the necessary number L is multiplied by a matrix of a linear prediction synthesis filter (3) and power (AΔi)T(AΔi) is evaluated. These powers are rearranged in accordance with their magnitude (43), and L powers are selected from the greater side. Using these selected powers as a tree-structure data code table (41), A-b-S vector quantization is effected (48). In this way, freedom of expansion of the space defined by the delta vectors can be increased and quantization characteristics can be improved. Furthermore, variable rate encoding can be accomplished by making the most of the structure of the tree-structure data code table.

Description

明 細 書 音声符号化方法及び装置 技術分野  Description Speech coding method and device
本発明は音声信号の情報圧縮を行う ための音声符号化方法及び装 置に関し、 特に 4〜16Kbpsの伝送速度で符号化を行うための Ana lysis by-Synthesis ( A— b — S ) 形べク ト ル量子化を用いた音声符号化 方法及び装置に関する。 背景技術  The present invention relates to an audio encoding method and apparatus for compressing information of an audio signal, and more particularly to an analysis by-synthesis (A—b—S) vector for encoding at a transmission rate of 4 to 16 Kbps. The present invention relates to a speech encoding method and apparatus using torque quantization. Background art
A _ b — S形べク トル量子化を用いる音声符号器、 例えば Code- Excited Linear Prediction (CELP)符号器は、 近年、 企業内通信シ ステム、 ディ ジタル移動無線システムなどにおいて、 音声信号をそ の品質を保持しつつ情報圧縮する音声符号器として有望視されてい る。 このべク トル量子化音声符号器 (以下、 単に符号器) において は、 符号帳 (コー ドブック ) の各コー ドべク トルに予測重み付けを 施して再生信号を作り、 再生信号と入力音声信号との間の誤差電力 を評価して最も誤差の少ないコー ドべク ト ルの番号 (イ ンデ ッ ク ス) を決定して受信側に送信するものである。  A _ b — Speech encoders that use S-vector quantization, such as Code-Excited Linear Prediction (CELP) encoders, have recently been used to convert speech signals in in-house communication systems and digital mobile radio systems. It is regarded as a promising speech coder that compresses information while maintaining its quality. In this vector quantized speech coder (hereinafter simply referred to as a “coder”), a prediction signal is applied to each code vector of a codebook to generate a reproduction signal, and the reproduction signal and the input speech signal are combined with each other. It evaluates the error power between the two and determines the code vector number (index) with the least error and transmits it to the receiving side.
上記の A— b — S形べク トル量子化方式による符号器は、 前記符 号帳に格納された約 1000パタ一ンの音源信号のベク トルの 1 つ 1 つ に対して、 線形予測合成フ ィ ルタ処理を施し、 再生された各音声信 号と、 符号化すべき入力音声信号との間の誤差が最も小さ く なる 1 つのパター ンをその約 1000のパター ンの中から探索するという処理 を汀つ。  The encoder using the A—b—S-type vector quantization method described above performs linear prediction synthesis on each of the approximately 1000 patterns of the source signal vectors stored in the codebook. A process in which filtering is performed, and a pattern that minimizes the error between each reproduced audio signal and the input audio signal to be encoded is searched from among the approximately 1,000 patterns. Shore.
ところで符号器は通話の即時性が要求されるので、 上記の探索処 理をリ アルタ イ ムで行う必要がある。 そうすると、 その探索処理を 行う のに、 例えば 5 msという短い時間間隔で、 通話の間連続して行 わなければならない。 By the way, since the encoder is required to have a prompt call, Processing must be done in real time. In that case, the search process must be performed continuously during a call at a short time interval, for example, 5 ms.
しかしながら後述する如く 、 この探索処理の中にフ ィ ルタ演算や 相関演算という複雑な演算操作が舍まれていて、 これらの演算操作 に要する演算量は、 例えば数 lOOMops (メ ガオペレーショ ン/秒) と いう膨大なものになる。 これに対応するには、 現在、 最高速とされ る Digital Signal Processor ( DSP)をもってしても、 数チ ップを必 要と し、 例えば携帯電話に適用しょう とする場合、 その小形化なら びに低消費電力化が困難になる という問題がある。  However, as will be described later, complicated arithmetic operations such as filter operation and correlation operation are included in this search processing, and the amount of operation required for these arithmetic operations is, for example, several lOOMops (mega operation / second). It becomes a huge thing. To cope with this, even with the digital signal processor (DSP), which is currently the fastest, several chips are required. There is a problem that it is difficult to reduce power consumption.
上記の問題を解決する音声符号化方式と して、 本願出願人は、 特 願平 3 — 127669号 (特開平 4 — 352200号公報) において、 従来のよ うに符号べク トルそのものを格納する代わりに信号べク トルの差分 であるデルタべク トルを格納した符号帳を用い、 それらデルタべク トルを順次加算及び減算する こ とによって木構造を有する符号べク トルを生成する木構造デルタ符号帳を用いる こ とを提案した。  As a speech coding method that solves the above problem, the present applicant has disclosed in Japanese Patent Application No. 3-127669 (Japanese Patent Application Laid-Open No. 4-352200) an alternative to storing the code vector itself as in the prior art. A tree-structured delta code that generates a code vector having a tree structure by sequentially adding and subtracting delta vectors using a codebook that stores the delta vector that is the difference between signal vectors He suggested using a book.
この方式によれば、 符号帳に要するメ モ リ容量が大幅に削減され る とともに、 各符号べク トルに対する前記フ ィ ルタ演算及び相関演 算は、 デルタべク トルに対してフ ィ ルタ演算及び相関演算を行い、 その結果を順次加算及び減算するこ とによって達成されるので、 演 算量の大幅な削減が実現される。  According to this method, the memory capacity required for the codebook is greatly reduced, and the filter operation and the correlation operation for each code vector are performed for the delta vector. And by performing a correlation operation, and sequentially adding and subtracting the results, a large reduction in the amount of operation is realized.
しかし、 この方式においては、 各符号べク トルがそれより少ない 数の基底べク トルと してのデルタべク トルの線形結合と して生成さ れているため、 その成分と してデルタべク トル以外の成分は持たな い。 即ち符号化対象のべク トルが分布する空間 (通常、 40〜64次元) のう ち、 高々デルタべク トルの数 (通常、 8〜10本) に対応する次 元分の部分空間にしか符号べク トルの分布を与えられない。 そのため、 木構造デルタ符号帳では、 符号化対象である音声信号 の統計的分布に基づき充分に基底べク ト ル (デルタ べク ト ル) を設 計したとしても、 従来の構造上の制約の無い符号帳に比べて量子化 特性が劣化する という問題があつた。 However, in this method, each code vector is generated as a linear combination of the delta vector as a smaller number of base vectors, and thus the delta vector is generated as a component. It has no components other than the vector. That is, of the space where the vector to be encoded is distributed (usually 40 to 64 dimensions), only the subspace of the dimension corresponding to the number of delta vectors at most (usually 8 to 10). The distribution of the code vector cannot be given. Therefore, in the tree-structured delta codebook, even if the base vector (delta vector) is designed sufficiently based on the statistical distribution of the speech signal to be encoded, the conventional structural constraints There was a problem that the quantization characteristics deteriorated compared to a codebook without one.
そこで本願出願人は、 特願平 3 — 5 15016号において、 距離を評価 するために符号ベク ト ルに前記の線形予測合成フ ィ ルタ演算を施す とすべてのデルタ べク トル成分に対して均等に増幅されず或る偏り をもって増幅される こ と、 及び木構造デルタ符号帳において各デル タべク トルが符号べク トルへ.与える寄与はデルタべク ト ルの順番を 変えれば変えるこ とができる こ と、 に着目し、 線形予測合成フ ィ ル タの係数が決定される毎に各デルタベク トルにフ ィ ルタ演算を施し てパワー (べク トルの長さ) を比較し、 パワーの大きいデルタべク トルから順に並べ変えを行った木構造デルタ符号帳を用いて符号化 を行う ことにより、 特性を改善する こ とを提案した。  In Japanese Patent Application No. 3-515016, the applicant of the present application applied the above-described linear predictive synthesis filter operation to the code vector to evaluate the distance, and applied equally to all delta vector components. In the tree-structured delta codebook, each delta vector contributes to the code vector, and the contribution to the delta vector can be changed by changing the order of the delta vector. Focusing on, the filter operation is performed on each delta vector each time the coefficient of the linear prediction synthesis filter is determined, and the power (vector length) is compared. We proposed to improve the characteristics by performing encoding using a tree-structured delta codebook rearranged in order from the largest delta vector.
しかしながら、 この方法によっても限られた数のデルタべク トル のみから符号べク ト ルを生成する点において従来の方法と変わり力く ないので、 特性の改善に限界があり、 更なる改善が要望されている。  However, this method is not different from the conventional method in that a code vector is generated from only a limited number of delta vectors, so there is a limit to the improvement of characteristics, and further improvement is required. Have been.
A— b — S形べク ト ル量子化を用いる音声符号化器のもう 1 つの 課題は、 可変ビ ッ ト レー ト符号化を実現する こ とである。 可変ビ ッ ト レー ト符号化とは、 伝送路の余裕度、 音源の重要性等の状況に応 じて符号のビッ ト レー トを適宜変更するこ とによ って全体と して効 率の良い符号化を達成するため、 ビ ッ ト レ一 トを変更する こ とので きる符号化方式である。  A—b—Another challenge for speech encoders using S-vector quantization is to realize variable bit rate encoding. Variable bit rate coding refers to the overall efficiency by changing the bit rate of the code as appropriate according to conditions such as the margin of the transmission path and the importance of the sound source. It is a coding method that can change the bit rate to achieve good coding.
べク ト ル量子化方式を可変レー ト音声符号化に用いよう とした場 合、 個々の伝送レー ト に応じたパター ン数の符号帳を用意し、 それ らを所望の伝送レー 卜に応じて切り換えながら符号化を行う必要が ある。 こ の時、 符号べク ト ルを単に並べただけの従来の符号帳の場合、 各符号帳の保持に (ベク ト ルの次元 : N ) と (パター ン数 : M ) の 積に相当する N X Mワー ドのメ モ リ が必要である。 こ こで、 パター ン数 Mは、 符号べク トルのイ ンデ ッ ク スのビ ッ ト数の 2 の巾乗に比 例するので、 伝送レー ト の可変幅を大き く したり、 伝送レー トを細 かな "きざみ" で制御するには、 膨大なメ モ リ を要する という問題 力 ある。 When using the vector quantization method for variable-rate speech coding, prepare a codebook with the number of patterns corresponding to each transmission rate, and use them according to the desired transmission rate. It is necessary to perform encoding while switching. At this time, in the case of a conventional codebook in which code vectors are simply arranged, the maintenance of each codebook is equivalent to the product of (vector dimension: N) and (number of patterns: M). NXM word memory is required. Here, the number of patterns M is proportional to the power of 2 of the number of bits of the index of the code vector, so that the variable width of the transmission rate can be increased or the transmission rate can be increased. There is a problem in that controlling the rate in small steps requires a large amount of memory.
また、 可変レー ト伝送においては、 符号化後の伝送信号に対して 伝送網側からの要求で強制的に伝送レー トを低く 抑える必要が生じ る こ とがあり、 このよう な場合、 復号器では符号器が生成した符号 ' 化情報に対しビッ ト の欠落した (ビッ ト · ドロ ップ) 情報から、 音 声信号を再生せざるをえな く なる。  Also, in variable rate transmission, it may be necessary to forcibly reduce the transmission rate of the encoded transmission signal in response to a request from the transmission network side. In such a case, the audio signal has to be reproduced from the bit-dropped information in the encoded information generated by the encoder.
従来、 べク トル量子化に比べ効率の低いスカ ラ ー量子化において は、 ビッ ト · ドロ ップに対する対策として、 重要度の低い LSB から 順にビ ッ トを落とすよう制御したり、 高レー ト の量子化器が低レー トの量子化器の量子化レベルを包含するよう構成する (ェンべデッ ド符号化) 等の工夫がなされてきた。  Conventionally, in scalar quantization, which is less efficient than vector quantization, as a countermeasure against bit drop, control is performed by dropping bits in the order of least significant LSB or high rate. For example, a scheme has been devised such that the quantizer of (1) includes the quantization level of a low-rate quantizer (embedded coding).
ところが、 符号べク トルを単に並べただけの従来の符号帳を用い るべク トル量子化方式の場合、 符号帳自体に何らの構造化もなされ ていないため、 符号べク ト ルのィ ンデ ッ タ スのビ ッ ト間に重要度の 差がな く (LSB が落とされても MSB が落とされても全く異なるべク トルが呼び出されるこ とに変わり はない) 、 スカ ラー量子化の場合 と同様な対策が採れず、 ビッ ト · ドロ ップに対して大きな音質劣化 を引き起こすという問題がある。 発明の開示  However, in the case of a conventional vector quantization scheme using a codebook in which code vectors are simply arranged, the codebook itself is not structured at all, and therefore, the code vector inversion is performed. There is no difference in significance between the bits of data (although the LSB is dropped or the MSB is dropped, a completely different vector is called), and scalar quantization is performed. The same countermeasures as in case (1) cannot be taken, and there is a problem that bit-drop causes large deterioration of sound quality. Disclosure of the invention
したがって本発明の第 1 の目的は、 前述の方式より もさ らに改善 された木構造データ符号帳による音声符号化方法および装置を提供 3 る し と レし ¾) 。 Therefore, the first object of the present invention is a further improvement over the above-mentioned method. 3) A speech encoding method and apparatus using the extracted tree-structured data codebook is provided.
本発明の第 2 の目的は、 符号帳のために膨大なメ モ リ を必要とせ ず、 ビッ ト ド口 ップに対する対策が可能なべク トル量子化による音 声符号化方法及び装置を提供する こ とにある。  A second object of the present invention is to provide a voice coding method and apparatus using vector quantization which does not require a huge amount of memory for a codebook and can take measures against bit-up. It is here.
本発明によれば、 予め与えられた符号べク ト ルの中で入力音声信 号べク トルとの距離が最小である符号べク トルに付されたィ ンデッ クスにより該入力音声信号べク トルを符号化する音声符号化方法で あっ し、  According to the present invention, the input speech signal vector is determined by the index assigned to the code vector having the shortest distance from the input speech signal vector among the code vectors given in advance. Is a speech encoding method for encoding the
a ) 複数の差分符号べク トルを格納し、  a) Store multiple difference code vectors,
b ) 該差分符号べク トルの各々 に線形予測合成フ ィ ルタ のマ ト リ クスを乗じ、  b) Multiply each of the difference code vectors by the matrix of the linear prediction synthesis filter,
c ) 該マ ト リ ク スが乗じられた差分符号べク ト ルのパワーの増幅 率を評価し、  c) Evaluate the amplification factor of the power of the difference code vector multiplied by the matrix,
d ) 該評価されたパワーの増幅率の大きさの順に該マ ト リ ク ス力く 乗じられた差分符号べク トルを並べ替え、  d) rearranging the difference code vector multiplied by the matrix power in the order of the magnitude of the evaluated power amplification factor;
e ) 並べ替えられたべク ト ルの中から評価されたパワーの増幅率 の大きさの順に所定個数のべク ト ルを選択し、  e) From the rearranged vectors, select a predetermined number of vectors in the order of the magnitude of the power amplification rate evaluated,
f ) 該選択されたべク トルを木構造上で順次加算及び減算する こ とによ って生成されるべき、 線形予測合成フ ィ ルタ処理が施された 符号べク トルと、 前記入力音声信号べク トルとの距離を評価し、 g ) 該評価された距離が最小である符号べク トルを決定する各段 階を具備する音声符号化方法が提供される。  f) a code vector to be generated by sequentially adding and subtracting the selected vector on a tree structure and having been subjected to linear prediction synthesis filter processing, and the input audio signal G) estimating the distance to the vector, and g) providing a speech coding method comprising the steps of determining a code vector having the smallest estimated distance.
本発明によれば、 予め与えられた符号べク ト ルの中で入力音声信 号べク ト ルとの距離が最小である符号べク トルに付されたィ ンデ ッ ク スによ り該入力音声信号ベク ト ルを符号化する符号化装置であつ て、 複数の差分符号べク トルを格納する手段と、 According to the present invention, the index added to the code vector having the smallest distance from the input speech signal vector among the code vectors given in advance. An encoding device for encoding the input audio signal vector, comprising: Means for storing a plurality of difference code vectors;
該差分符号べク ト ルの各々 に線形予測合成フ ィ ルタ のマ ト リ ク ス を乗じる手段と、  Means for multiplying each of the difference code vectors by a matrix of a linear prediction synthesis filter;
該マ ト リ クスが乗じられた差分符号べク トルのパワーの増幅率を 評価する手段と、  Means for evaluating the amplification factor of the power of the difference code vector multiplied by the matrix;
該評価されたパワーの増幅率の大きさの順に該マ ト リ クスが乗じ られた差分符号べク トルを並べ替える手段と、 - 並べ替えられたベク ト ルの中から評価されたパワーの増幅率の大 きさの順に所定個数のべク ト ルを選択する手段と、  Means for rearranging the differential code vector multiplied by the matrix in the order of the magnitude of the estimated power amplification factor; and- power amplification evaluated from the rearranged vectors. Means for selecting a predetermined number of vectors in order of magnitude of rate,
該選択されたべク ト ルを木構造上で順次加算及び減算するこ とに よ って生成されるべき、 線形予測合成フ ィ ルタ処理が施された符号 べク ト ルと、 前記入力音声信号べク トルとの距離を評価する手段と、 該評価された距離が最小である符号べク トルを決定する手段とを 具備する音声符号化装置もまた提供される。  A code vector to be generated by sequentially adding and subtracting the selected vectors on a tree structure and having been subjected to a linear prediction synthesis filter process; and the input audio signal A speech coding apparatus is also provided, comprising: means for estimating a distance to a vector; and means for determining a code vector having the smallest estimated distance.
本発明によれば、 予め与えられた符号べク トルの中で入力音声信 号べク トルとの距離が最小である符号べク ト ルに付された可変ビッ ト長の符号により該入力音声信号べク トルを可変長符号化する可変 長音声符号化方法であって、  According to the present invention, the input speech signal is represented by a code having a variable bit length added to a code vector having a minimum distance from the input speech signal vector in a predetermined code vector. A variable length speech coding method for performing variable length coding on a signal vector, comprising:
a ) 複数の差分符号べク ト ルを格納し、  a) Store multiple difference code vectors,
b ) 先頭から所望の符号ビ ッ ト長に応じた数の差分符号べク ト ル を木構造上で順次加算及び減算するこ とによ って生成されるべき符 号べク ト ルと前記入力音声信号べク トルとの距離を評価し、  b) The code vector to be generated by sequentially adding and subtracting the number of difference code vectors according to the desired code bit length from the top on the tree structure, and Evaluate the distance from the input audio signal vector,
c ) 該評価された距離が最小である符号べク ト ルを決定し、 d ) 該決定された符号べク ト ルに付されるべき所望符号ビ ッ ト長 の符号を決定する各段階を具備する可変長音声符号化方法もまた提 供される。  c) determining the code vector with the smallest estimated distance; d) determining the code of the desired code bit length to be attached to the determined code vector. A provided variable length speech coding method is also provided.
本発明によれば、 予め与えられた符号べク ト ルの中で入力音声信 号べク トルとの距離が最小である符号べク トルに付された可変ビッ ト長の符号により該入力音声信号べク ト ルを可変長符号化する可変 長音声符号化方法であつて、 According to the present invention, an input speech signal is provided in a predetermined code vector. A variable-length speech coding method for performing variable-length coding on the input speech signal vector using a variable-bit-length code attached to a code vector having a minimum distance from the signal vector.
複数の差分符号べク ト ルを格納する手段と、  Means for storing a plurality of difference code vectors,
先頭から所望の符号ビ ッ ト長に応じた数の差分符号べク ト ルを木 構造上で順次加算及び減算する こ とによって生成されるべき符号べ ク トルと前記入力音声信号べク ト ルとの距離を評価する手段、と、 該評価された距離が最小である符号べク トルを決定する手段と、 該決定された符号べク ト ルに付されるべき所望符号ビ ッ ト長の符 号を决定する手段とを具備する可変長音声符号化装置もまた提供さ ' れる。 図面の簡単な説明  A code vector to be generated by sequentially adding and subtracting a number of difference code vectors according to a desired code bit length from the head on a tree structure and the input speech signal vector Means for estimating the distance between the determined code vector, a means for determining a code vector having the smallest estimated distance, and a desired code bit length to be added to the determined code vector. There is also provided a variable-length speech encoding device comprising: a code determining unit. BRIEF DESCRIPTION OF THE FIGURES
図 1 は音声生成系の概念を示したブロ ッ ク図 ;  Figure 1 is a block diagram showing the concept of the speech generation system;
図 2 は一般的な CEL P音声符号化の原理を示したプロ ッ ク図 ; 図 3 は従来技術と して、 A— b — S型べク ト ル量子化の雑音符号 ' 帳探索処理の構成を示したブロ ッ ク図 ;  Fig. 2 is a block diagram showing the principle of general CELP speech coding; Fig. 3 is a conventional technology that uses A—b—S-type vector quantization for noise codes. Block diagram showing the configuration;
図 4 は雑音雑符号帳探索処理のアルゴ リ ズムをモデル化したプロ ッ ク図 ;  Figure 4 is a block diagram that models the algorithm of the random codebook search process;
図 5 はデルタ符号帳の原理を説明するためのブロ ッ ク図 ; 図 6 A及び 6 B は木構造デルタ符号帳の適応化方式を説明するた めの図 ;  Fig. 5 is a block diagram for explaining the principle of the delta codebook; Figs. 6A and 6B are diagrams for explaining the adaptation method of the tree-structured delta codebook;
図 7 A , 7 B及び 7 Cは本発明の原理を説明するための図 ; 図 8 は本発明の音声符号化器のプロ ッ ク図 ; 及び  7A, 7B and 7C are diagrams for explaining the principle of the present invention; FIG. 8 is a block diagram of the speech encoder of the present invention;
図 9 A及び図 9 B は本発明の可変レー ト符号化方式を説明するた めの図である。 発明を実施するための最良の形態 FIG. 9A and FIG. 9B are diagrams for explaining the variable rate coding method of the present invention. BEST MODE FOR CARRYING OUT THE INVENTION
音声には有声音と無声音とがあり、 有声音は声帯の振動によるパ ルス音源が基となって発生し、 個人個人のノ ドゃ口の声道特性が付 加されて声になる。 また、 無声音は声帯を振るわせないで出す音で、 単なるガウ ス性の雑音列が音源となって声道を通って声となる。 従 つて、 音声発生メ カニズムは図 1 に示すように、 有声音の元となる パルス音源 P SG と無声音の元となる雑音源 N SG と、 各音源から出力 される信号に声道特性を付加する線形予測合成フ ィ ルタ L P CFによ り モデル化できる。 尚、 人の声はピッチ周期性を有し、 該周期性はパ ルス音源から出力されるパルスの周期性に対応しており、 人や話の 内容によって異なる。  Speech includes voiced and unvoiced sounds. Voiced sound is generated based on a pulse sound source caused by vibration of the vocal cords, and becomes a voice with the vocal tract characteristics of the individual's nodule and mouth added. An unvoiced sound is a sound produced without shaking the vocal cords, and a mere Gaussian noise sequence becomes a sound source and becomes a voice through the vocal tract. Therefore, as shown in Fig. 1, the speech generation mechanism adds a vocal tract characteristic to the signal output from each sound source, a pulse sound source P SG that is a source of voiced sound, a noise source N SG that is a source of unvoiced sound. It can be modeled by a linear prediction synthesis filter LPCF. It should be noted that a human voice has a pitch periodicity, and the periodicity corresponds to a periodicity of a pulse output from a pulse sound source, and differs depending on a person or the content of a talk.
以上のこ とから、 入力音声に対応するパルス音源の周期と雑音源 の雑音列を特定するこ とができれば、 これらパルス周期と雑音源の 雑音列を識別する符号 (イ ンデ ッ ク ス) によ り入力音声を符号化す る こ とができ る。  From the above, if the period of the pulse source corresponding to the input speech and the noise sequence of the noise source can be specified, a code (index) that identifies the pulse period and the noise sequence of the noise source can be obtained. Thus, the input speech can be encoded.
ここで、 図 2 に示すように、 過去の値 (b P + g C ) を異なるサンプ ル数遅延させて得られるべク トル Pを適応符号帳 1 1に格納し、 適応 符号帳 1 1内のべク トル Pにゲイ ン bを乗じたべク トル b Pを線形予測 合成フ ィ ルタ 12に入力してフ ィ ルタ演算処理を施し、 得られたフ ィ ルタ演算結果 bA P を入力音声信号 Xから減算してその誤差信号から 誤差電力評価部 13において該差電力が最小となる適応符号帳 1 1のべ ク トル Pを選択する こ とにより、 周期を決定する。  Here, as shown in FIG. 2, the vector P obtained by delaying the past value (b P + g C) by a different number of samples is stored in the adaptive codebook 11, and is stored in the adaptive codebook 11. The vector b P obtained by multiplying the vector P by the gain b is input to the linear prediction synthesis filter 12 and subjected to filter operation processing, and the obtained filter operation result bAP is input to the input audio signal. The cycle is determined by selecting the vector P of the adaptive codebook 11 in which the difference power is minimized in the error power evaluation unit 13 from the error signal after subtraction from X.
その後又はこれと同時に、 予め複数の雑音列 (各雑音列は N次元 のコー ドべク トルで表現されている) を雑音符号帳 1 に用意してお き、 各コー ドべク ト ル Cにゲイ ン gを乗じ線形予測合成フ ィ ルタ 3 の処理を施した再生信号べク トル g A C と入力信号べク ト ル X ( N次 元べク トル) との誤差が最小となるコー ドべク トルを誤差電力評価 部 5が決定すれば、 前記周期とコー ドべク ト ルを特定するデータ (イ ンデ ッ ク ス) によ り音声を符号化する こ とができ る。 なお、 図 2 を参照して上記に説明した例は、 べク ト ル ACとべク ト ル APが直交 化されている場合の例であり、 そうでない場合には、 入力信号べク ト ル Xからべク ト ル bAP を差し引いたべク ト ル X — bAP との誤差が 最小となるコー ドべク ト ルを決定する。 Thereafter or simultaneously with this, a plurality of noise sequences (each noise sequence is represented by an N-dimensional code vector) are prepared in the noise codebook 1, and each code vector C Is a code that minimizes the error between the reproduced signal vector g AC and the input signal vector X (N-dimensional vector) obtained by multiplying the gain by g and multiplying by the linear prediction synthesis filter 3. Evaluate the vector for error power If the unit 5 determines, the speech can be encoded by the data (index) specifying the cycle and the code vector. Note that the example described above with reference to FIG. 2 is an example where the vector AC and the vector AP are orthogonalized, and otherwise, the input signal vector X The vector X minus the vector bAP is determined from the vector X — the code vector that minimizes the error from bAP.
図 3 は A— b — S法によるべク トル量子化を用いた音声伝送 (符 号化) 方式の構成図で図 2 の下半分に相当している。 詳し く述べる と 1 は N次元コー ドべク ト ル Cをサイ ズ Mだけ記憶する雑音符号帳、 2 はゲイ ン gの増幅部、 3 は入力信号 Xから線形予測分析により決 '定された係数を有し、 増幅部 2 の出力に線形予測フ ィ ルタ演算処理 を施す線形予測合成フ ィ ルタ、 4 は線形予測合成フ ィ ルタ 3から出 力される再生信号べク トルと入力信号べク トルの誤差を出力する誤 差発生部、 5 は該誤差を評価し、 該誤差が最小となるコー ドべク ト ルを求める誤差電力評価部である。  Figure 3 is a block diagram of the audio transmission (encoding) method using vector quantization by the A-b-S method, which corresponds to the lower half of Fig. 2. In detail, 1 is a noise codebook that stores only the size M of the N-dimensional code vector C, 2 is the gain section of the gain g, and 3 is determined by linear prediction analysis from the input signal X. A linear prediction synthesis filter having coefficients and performing a linear prediction filter operation on the output of the amplification unit 2; 4 is a reproduction signal vector and an input signal vector output from the linear prediction synthesis filter 3; An error generator 5 for outputting a vector error is an error power evaluator for evaluating the error and obtaining a code vector that minimizes the error.
この A— b — S法による量子化では通常のべク ト ル量子化と異な り、 雑音符号帳 1 の各コー ドべク ト ル ( C ) に最適のゲイ ン ( g ) を掛けた後、 線形予測合成フ ィ ルタ 3 でフ ィ ルタ処理を施し、 こ の フ ィ ルタ処理で得られる再生信号べク ト ル (g AC) と入力信号べク ト ル ( X ) との間の誤差信号 ( E ) を誤差発生部 4で求め、 誤差電力 評価部 5 で誤差信号の電力を評価関数 (距離尺度) と して雑音符号 帳 1 の探索を行い、 誤差電力が最小となるコー ドべク トルを求め、 該コー ドべク ト ルを特定する符号 (イ ンデ ッ ク ス) によ り入力信号 を符号化して伝送する。  In the A—b—S quantization, unlike ordinary vector quantization, after applying the optimal gain (g) to each code vector (C) in the random codebook 1, The filter processing is performed by the linear prediction synthesis filter 3, and the error between the reproduced signal vector (g AC) and the input signal vector (X) obtained by the filter processing is obtained. The signal (E) is obtained by the error generator 4, and the error power evaluator 5 searches the noise codebook 1 using the power of the error signal as an evaluation function (distance scale). A vector is obtained, and the input signal is encoded using a code (index) that specifies the code vector and transmitted.
こ のときの誤差電力は次式  The error power at this time is
I E I 2 = | X - g AC | 2 ( 1 ) によ り与えられる。 最適なコー ドべク ト ル及びゲイ ン g は、 こ の ( 1 ) 式に示す誤差電力を最小化する ものとして決定される。 尚、 声の大きさによりパワーが異なるので、 ゲイ ン gを最適化して再生 信号パワーを入力信号のパワーに合わせる。 最適ゲイ ンは ( 1 ) 式 を gで偏微分して 0 と置く こ とにより求めるこ とができる。 即ち、 d I E I 2 / d g = 0 Given by IEI 2 = | X-g AC | 2 (1). The optimal code vector and gain g are It is determined as minimizing the error power shown in Eq. (1). Since the power varies depending on the volume of the voice, the gain g is optimized to match the reproduced signal power with the input signal power. The optimal gain can be obtained by partially differentiating equation (1) with g and setting it to 0. That is, d IEI 2 / dg = 0
より、 g は Thus, g is
g = ( X T AC)/ ((AC)T (AO) ( 2 ) で与えられる。 この gを ( 1 ) 式に代入すると、 g = (X T AC) / ((AC) T (AO) (2). Substituting this g into the equation (1) gives
I E = I X I 2 一 ( X T AC) z/ ((AC)T(AO) ( 3 ) となる。 入力信号 X と線形予測合成フ ィ ルタ 3 の出力 ACの相互相関 を R xc、 線形予測合成フ ィ ルタ 3 の出力 ACの自己相関を R c cとすれ ば、 相互相関及び自己相関は次式 IE = IXI 2 one (X T AC) z / ( (AC) T (AO) (3) and composed. Input signal X and the output AC of the cross-correlation of a linear prediction synthesis off I filter 3 R xc, linear prediction synthesis If the autocorrelation of the output AC of filter 3 is Rcc , then the cross-correlation and autocorrelation are
R xc = X T AC ( 4 )R xc = X T AC (4)
R cc= (AC)T (AC) ( 5 ) により表現される。 R cc = (AC) T (AC) (5)
( 3 ) 式の誤差電力を最小にするコー ドべク ト ル Cは ( 3 ) 式の 右辺第 2項を最大にするものであるから、 該コー ドべク ト ル Cは次 式  Since the code vector C that minimizes the error power in Eq. (3) maximizes the second term on the right side of Eq. (3), the code vector C is
し = argmax ( R xc 2 / R cc) ( り ;1 と表現でき、 最適のゲイ ンは ( 6 ) 式を満たす相互相関、 及び自己 相関を用いて ( 2 ) 式より= Argmax (R xc 2 / R cc) (r; 1 ), and the optimal gain is obtained from equation (2) using the cross-correlation and auto-correlation that satisfy equation (6).
Figure imgf000012_0001
Figure imgf000012_0001
で与えられる。  Given by
図 4 は以上の式により、 誤差電力が最小となるコー ドべク ト ルを 求めて入力信号を符号化する雑音符号帳探索処理アルゴリ ズムをモ デル化した構成図であり、 相互相関 R xc ( = X T AC) を演算する演 算部 6 と、 この相互相関 R x cの二乗を演算する演算部 7 と、 ACの自 己相関 R c cを演算する演算部 8 と、 R x c z Z R ccを演算する演算部 9 と、 R x c z Z R ccが最大となる、 換言すれば誤差電力が最小とな るコー ドべク ト ルを決定して該コー ドべク ト ルを特定する符号を出 力する誤差電力評価部 5 とが設けられているが、 等価的に図 3 と同 じものである。 Figure 4 is the above equation, a block diagram of the noise codebook search processing algorithms to encode the input signal in search of code base click preparative Le which error power is minimized and modeled, the cross-correlation R xc (= X T AC), a calculation unit 7 for calculating the square of the cross-correlation R xc , and an AC Yourself an arithmetic unit 8 for calculating a correlation R cc, R xc z and calculation unit 9 for calculating a ZR cc, R xc z ZR cc is maximum code base click preparative error power in other words the minimum and ing An error power evaluator 5 is provided for determining a code and outputting a code specifying the code vector, but is equivalent to FIG.
このような従来の符号帳探索処理の内で主なものは、 ①コー ドべ ク トル Cに対するフ ィ ルタ処理、 ②相互相関 R xcの算出処理、 及び ③自己相関 R c cの算出処理の 3つである。 LPC フ ィ ルタ 3 の次数を N P 、 ベク トル量子化 (コー ドべグト ル) の次元を Nとすると、 1 つのコー ドべク トルに対して、 ①〜③のそれぞれに要する演算量は N P · N , N , 及び Nである。 従って、 1 つのコー ドベク トル当た り の符号帳探索に要する演算量は ( N P + 2 ) · Νとなる。 Such mainly among conventional codebook search process, ① call Dobe click off I filter processing for Torr C, ② cross correlation R calculation processing of xc, and ③ autocorrelation R cc 3 calculation process One. Assuming that the order of the LPC filter 3 is N P and the dimension of vector quantization (code vector) is N, the amount of computation required for each of ① to ③ for one code vector is as follows. NP · N, N, and N. Therefore, the calculation amount required for the codebook search in Ri per one code Dobeku Torr becomes (N P + 2) · Ν .
通常用いられている雑音符号帳 1 は、 40次元 · 符号帳サイ ズ 1024 ( Ν =40, = 1024 ) 程度のものであり、 LPC フ ィ ルタ 3 の分折次 数 Ν Ρ が 10次程度であるため、 1 回の符号帳探索に Noise codebook commonly used 1, 40-D codebook size 1024 (Ν = 40, = 1024 ) are of the order, in minutes folding-degree New [rho of about 10 next LPC full I filter 3 Therefore, in one codebook search
(10+ 2 ) · 40 · 1024 = 480 X 103 (10+ 2) 40 1024 = 480 X 10 3
の積和算を要する。 Requires multiply-accumulate.
この様な符号帳探索を音声符号化のサブフ レーム ( 5 msec) 毎に 行うためには、 96MoPs (メ ガオペレーシ ョ ンノ秒) という膨大な処 理能力が必要となり、 現在最高速のディ ジタル · ジクナル . プロセ ッサ (許容演算量 20〜40Mops) を使用しても、 その実時間実現には 数チップを要してしまう。 In order to perform such a codebook search in each subframe of speech coding (5 msec) is, 96Mo P s (main Gaopereshi ® N'nobyo) enormous amount of processing power that is required, the current top speed of Di digital · Even if a signal processor is used (permissible operation amount: 20-40 Mops), several chips are required for real-time implementation.
また、 この様な雑音符号帳 1 をテーブルと して記憶 . 保持するた めには、 Ν · Μ ( =40 · 1024 = 40Kword)ものメ モ リ容量が必要にな つて しま う。  In addition, in order to store and maintain such a random codebook 1 as a table, Ν · Ν (= 40 · 1024 = 40 Kword) memory capacity is required.
更には、 A— b — S型べク トル量子化を用いた音声符号器の適用 分野と考えられる自動車電話 · 携帯電話においては、 装置の小型化. 低消費電力化が必須の条件であり、 膨大な演算量や膨大なメモ リ容 量は、 いずれも音声符号器実現上で重大な障害となっている。 Furthermore, for mobile phones and mobile phones, which are considered to be the application fields of speech encoders using A-b-S-type vector quantization, miniaturization of equipment. Low power consumption is an indispensable condition, and the enormous amount of computation and enormous memory capacity are all serious obstacles in implementing a speech encoder.
以上のこ とから本願の出願人は、 特願平 3 — 127669号 (特開平 4 - 352200号公報) において、 雑音符号帳探索に要する演算量を減少 でき、 しかも雑音符号帳の記憶に要するメモ リ容量を減少できる音 声符号化方式を提供するため、 従来の雑音符号帳の代わりに図 5 に 示す木構造デルタ符号帳を用いるこ とを提案した。  From the above, the applicant of the present application has disclosed in Japanese Patent Application No. 3-127669 (Japanese Unexamined Patent Application Publication No. 4-352200) that the amount of computation required for searching for a noise codebook can be reduced and the memorandum required for storage of the noise codebook can be reduced. In order to provide a voice coding method that can reduce the storage capacity, we proposed to use a tree-structured delta codebook as shown in Fig. 5 instead of the conventional noise codebook.
図 5において、 予め 1つの基準雑音列である初期べク トル (:。 ( =△。 ) と ( L一 1 ) 種類 (階層) のデルタ雑音列であるデルタ べク トル 〜A L— ! L -IO) をデルタ符号帳 10に格納しておき、 木構造に従ってデルタべク トル 〜厶 L— , をそれぞれ初期べク ト ル〇。 に階層毎に加え合わせ及び差し引く こ とにより順次木構造上 に ( 210— 1 ) 種類の雑音列のコー ドべク トル (符号語) C。 〜 C 1022を表現できるようにする。 またはこれらコー ドべク トルに - Co べク トル (又は零べク トル) を加えて 210の雑音列のコ一 ド べク トル (符号語) (:。 〜C 1023を表現できるようにする。 5, the initial base-vector in advance one reference noise sequences (:..! (= △ ) and (L one 1) Type (hierarchy) of delta noise sequences at a delta base-vector to A L - L -IO) and may be stored in the delta codebook 10, the delta base-vector-according tree厶L -, the initial base click preparative Le 〇 respectively. Each layer in addition registration and subtracting this and by sequential tree structure on the (2 10 - 1) types of noise sequences of code base-vector (codeword) C. ~ C 1022 can be expressed. Or these codes base-vector - Co base-vector (or no base-vector) was added 2 of 10 noise sequences co one de base-vector (codeword) (:. -C 1023 As can represent the I do.
このようにすれば、 デルタ符号帳 10に初期べク トル△。 と (L一 1 ) 種類のデル夕ベク トル Δ , 〜厶い ,(1^ = 10) を格納しておく だ けで、 次々 と 2 L — 1 (= 2 !。— 1 =M— 1 ) 種類のコー ドべク ト ル又は 2 L (= 2 10 = M) 種類のコー ドべク トルを生成することが でき、 デルタ符号帳 10の記憶容量を L - N ( = 10 · N) とするこ と ができ、 従来の雑音符号帳の記憶容量 M · N ( = 1024 · N) に比べ て著しく減少させるこ とができる。 In this way, the delta codebook 10 has the initial vector △. And (L-1) kinds of Dell vector Δ, ~ 1, (1 ^ = 10) are stored, and 2 L -1 (= 2!.-1 = M-1) ) Code vectors or 2 L (= 2 10 = M) code vectors, and the storage capacity of the delta codebook 10 is L-N (= 10N) Thus, the storage capacity of the conventional random codebook, M · N (= 1024 · N), can be significantly reduced.
この様な構成の木構造デルタ符号帳 10を用いれば、 コー ドべク ト ル C』( j = 0〜1022または 1023) に対する相互相関 R xc (j) と自己 栢関 Rcc ( は次の様な漸化式で表現するこ とができる。 すなわち、 各コー ドべク トルを C Zk + , = C K + Δ i i = 1 , 2 - L - 1 ( 8 ) With the tree structure delta codebook 10 in such a configuration, code base click preparative Le C "(j = 0 to 1022 or 1023) the cross-correlation R xc (j) self Kashiwa function R cc for (the next In other words, each code vector can be expressed by C Zk + , = CK + Δ ii = 1, 2-L-1 (8)
)  )
または C 2 k + 2 = C k - Δ i 2 1一 1≤ kぐ 2 ( 9 ) と表わすとき、 Or C 2 k + 2 = C k -Δ i 2 1 1 ≤ k, 2 (9)
RRxXc ( k ++ 1 n ) RRxXc ( k + + 1 n )
C (2Z k —— = R <k ) C ( 2 Z k —— = R <k)
X C + X T(AA i) (10) または R (2 K + 2 ) XC + X T (AA i) (10) or R (2 K + 2)
X c = R (k )  X c = R (k)
X c - X Τ(ΑΔ i) (11) 及び X c-X Τ (ΑΔ i) (11) and
R ( 2 k + 1 )  R (2 k + 1)
C C = R cc (k) + (ΑΔ τ(ΑΔ i) + 2 (ΑΔ i)T(ACk) (12) または CC = R cc ( k ) + (ΑΔ τ (ΑΔ i) + 2 (ΑΔ i) T (AC k ) (12) or
R cc (2k + z> = R cc (k) + (ΑΔ i)T(AA i) - 2 (A厶 i)T(ACk) (13) と表現する ことができる。 R cc (2k + z> = R cc (k) + (ΑΔi) T (AA i) −2 (A m i) T (AC k ) (13)
従って、 相互相関 R xcに関しては、 各デルタべク トル Δ ( i 0 〜 L一 1 ; 厶。 = C。)についての相互相関 X T(AAi) の演算を行 えば、 漸化式 (10) (11) 式に従って、 すなわち図 5 の木構造に従つ てこれらを順次加算又は減算する こ とにより、 すべてのコー ドべク トル C j に対する相互相関 R xc (j> が直ちに計算される。 従来の符 号帳では、 全雑音列のコー ドべク ト ルに対する相互相関を演算する のに Therefore, for the cross-correlation R xc , if the calculation of the cross-correlation X T (AAi) for each delta vector Δ (i 0 to L 1; By sequentially adding or subtracting them according to Eq. (11), that is, according to the tree structure in FIG. 5, the cross-correlation R xc (j >) for all code vectors C j is calculated immediately. In the conventional codebook, it is necessary to calculate the cross-correlation of the entire noise sequence with respect to the code vector.
M · N ( = 1024 · N )  MN (= 1024N)
回の積和算が必要であった。 これに対して、 木構造デルタ符号帳で は、 相互相関 R xc を各符号ベク トル C j ( j = 0 , 1 … 2 L— 1 ) から直接計算せず、 各デルタベク トル△ j ( j = 0 , 1 , … L一 1 ) との相互相関を計算し、 それらを順次加算又は減算する ことによつ て算出しているので、 Multiply-accumulate was required. On the other hand, in the tree-structured delta codebook, the cross-correlation R xc is not calculated directly from each code vector C j (j = 0, 1… 2 L — 1), and each delta vector △ j (j = 0, 1,..., L-1) are calculated by sequentially adding or subtracting them.
L · N ( = 10 · )  LN (= 10
回の積和算で済ますこ とが可能となり、 演算回数を著し く減少でき る。 It is possible to perform the multiply-accumulate operation twice, and the number of operations can be significantly reduced.
また自己相関の式 (12) (13) の第 3項の交さ項(ΑΔ i)T (ACk) に ついては、 In addition, the cross term (ΑΔ i) T (AC k ) of the third term in the autocorrelation equations (12) and (13) is About
C k = Δ 0 ±厶 , ±厶 2 …士厶 i-, C k = Δ 0 ± rum, ± rum 2…
と表わせば If you express
(A厶 i) T(ACk) = (A厶 i)T (ΑΔ o )士(A厶 i) τ (ΑΔ J ± (Am i) T (AC k ) = (A m i) T (ΑΔ o) (A m i) τ (ΑΔ J ±
…土(AAi)T (AAi—,) (14) と表わすことができるから、 厶 i と厶。 , …厶 , との相互相 関(ΑΔ i)T(AA。, ,, 2...i -,)の計算を行い、 図 5 の木構造に従って 順次加算又は減算を行えば第 3項が算出される。 さ らに第 2項の各 デルタべク トル の自己相関(ΑΔ;)Τ(ΑΔ^ を計算し、 これを (12) (13) 式に従って、 すなわち図 5 の木構造に従って順次加算又 は減算すれば、 すべてのコー ドべク トル C の自己相関 R c c ( j ) 力く 直ちに計算される。 … Sat (AAi) T (AAi—,) (14) Calculate the correlation (ΑΔ i) T (AA.,,, 2 ... i-,) with,…,,,,,,,,,,,,,,,,, 2 ... i-,). Is calculated. Further, the autocorrelation (ΑΔ;) Τ (ΑΔ ^) of each delta vector in the second term is calculated, and this is sequentially added or subtracted according to the equations (12) and (13), that is, according to the tree structure in FIG. Then, the autocorrelation R cc (j ) of all the code vectors C is calculated immediately.
すなわち、 従来の符号帳では、 自己相関を演算するのに  In other words, in the conventional codebook, to calculate the autocorrelation
M · N ( = 1024 · N )  MN (= 1024N)
回の積和算が必要であった。 これに対して、 木構造デルタ符号帳で は、 自己相関 R xc ("を各符号ベク トル Cパ j = 0 , 1 … 2い 1一 1 ) から直接計算せず、 各デルタ ベク ト ル Δパ j = 0 , 1 , … L一 1 ) の自己相関及び異なるデルタベク トルのすべての組み合わせにおけ る相互相関から計算しているので、 Multiply-accumulate was required. In contrast, in the tree structure delta codebook does not calculate directly from the autocorrelation R xc ( "each code vector C Pas j = 0, 1 ... 2 have 1 one 1), each delta vector preparative Le Δ J = 0, 1,… L1 1) and the cross-correlation of all combinations of different delta vectors,
L ( L + 1 ) · N / 2 ( =55 · N )  L (L + 1) N / 2 (= 55N)
回の積和算で済ますことが可能となり、 演算回数を著し く 減少でき る。 It is possible to perform the multiply-accumulate operation twice, and the number of operations can be significantly reduced.
と こ ろが、 こ の様な木構造デルタ符号帳の符号語 (コー ドべク ト ル) は全てデルタべク トルの線形結合として生成されているため、 その成分と してデルタべク トル以外の成分は持たない。 即ち、 符号 化対象のべク トルが分布する空間 (通常、 40〜64次元) のう ち、 高 々デルタべク トルの数 (通常、 8〜10本) に対応する次元分の部分 空間にしか符号ベク トルの分布を与えられない。 However, since the codewords (code vectors) of such a tree-structured delta codebook are all generated as linear combinations of the delta vectors, the components of the delta vectors are delta vectors. No other components. That is, of the space in which the vector to be encoded is distributed (usually 40 to 64 dimensions), the part of the dimension corresponding to the number of delta vectors at most (usually 8 to 10). Only the space can be given the distribution of the code vector.
従って、 木構造デルタ符号帳では、 符号化対象である音声信号の 統計的分布に基づき充分に基底べク ト ル (デルタ べク ト ル) を設計 したと しても、 従来の構造上の制約の無い符号帳に比べて量子化特 性が劣化する という問題があった。  Therefore, in the tree-structured delta codebook, even if the base vector (delta vector) is sufficiently designed based on the statistical distribution of the speech signal to be coded, the conventional structural constraints are imposed. There is a problem that the quantization characteristics are degraded as compared to a codebook without a codebook.
ところで、 本発明の適用の対象となる CEL P型音声符号器では、 上 述したよう にべク ト ル量子化は通常のべク ト ル量子化と異なり、 符 号ベク ト ルにフ ィ ルタの伝達関数 Azを有する線形予測合成フ ィ ルタ を施した信号べク ト ルの空間において距離評価を行い、 最適なべク !  By the way, in the CEL P-type speech encoder to which the present invention is applied, as described above, the vector quantization is different from the normal vector quantization, and the code vector is filtered. The distance is evaluated in the space of the signal vector that has been subjected to the linear prediction synthesis filter having the transfer function Az, and the optimal vector!
ト ルを決定するものである。 5  It determines the torque. Five
従って、 図 6 A及び 6 Bに示すよ う に、 線形予測合成フ ィ ルタ に よって残差信号の空間 ( L = 3 の場合図 6 Aの球体) は再生信号の 空間に変換されるが、 この時、 一般には図 6 Bに示すように各軸の 方向成分が均等ではな く、 或る歪みをもった増幅が行われる。  Therefore, as shown in Figs. 6A and 6B, the space of the residual signal (the sphere of Fig. 6A when L = 3) is transformed into the space of the reproduced signal by the linear prediction synthesis filter. At this time, generally, as shown in FIG. 6B, the directional components of each axis are not uniform, and amplification with a certain distortion is performed.
つまり、 線形予測合成フ ィ ルタの特性 ( A ) が符号帳の構成要素 である各デルタべク トルに対して異なる振幅増幅特性を示すもので、 結果のべク トルは全空間にわたつて均等に分布しない。  In other words, the characteristic (A) of the linear predictive synthesis filter shows different amplitude amplification characteristics for each delta vector that is a component of the codebook, and the resulting vector is uniform over the entire space. Does not distribute.
また、 図 5 に示される木構造デルタ符号帳においては、 各デルタ べク ト ルが符号べク ト ルに与える寄与はデルタ べク ト ルがデルタ符 号帳 10内で置かれる位置によって異なる。 例えば、 2番目に置かれ たデルタべク トル△ , は第 2階層以下のすべての符号べク トルに寄 与するのに対して、 第 3番目のデルタべク トル Δ 2 は第 3階層以下 のすベての符号べク ト ルに寄与し、 Δ 9 は第 10階層の符号べク ト ル のみに寄与する。 すなわち、 デルタ べク ト ルの順番を変えれば、 各 デルタべク トルの符号べク ト ルへの寄与を変える ことができる。 以上のこ とから、 本願出願人は特願平 3 —515016号において、 先 ず各デルタ べク ト ル Δ i にフ ィ ルタ特性 ( A ) を施したべク ト ル A Δ i についてパワー (の増幅率 : 各デルタ ベク トルが規格化され ていれば A△ i のパワーそのものが増幅率となる) I A Δ i I 2 = (AAi iAAi) を計算して相互に比較し、 パワーの大きいデルタべ ク トルから順に並べ替えを行ってできた符号帳を用いて符号化を行 う こ とで、 固定的にデルタべク トルを与えるこ とにより分布に偏り を有する従来の木構造デルタ符号帳に比して特性の改善を得る こ と ができた。 In the tree-structured delta codebook shown in FIG. 5, the contribution of each delta vector to the code vector differs depending on the position where the delta vector is placed in the delta codebook 10. For example, base delta placed in the second-vector △, whereas that help to all code base-vector follows the second layer, the third delta base-vector delta 2 below the third layer contribute to the code base click preparative Le of Te to Baie, delta 9 contributes only to the code base click preparative Le tenth hierarchy. That is, by changing the order of the delta vectors, the contribution of each delta vector to the sign vector can be changed. In view of the above, the applicant of the present application has disclosed in Japanese Patent Application No. 3-515016 that the filter characteristics (A) are first applied to each delta vector Δi. Power for A Δ i (Amplification factor: If each delta vector is standardized, the power of A △ i itself becomes the amplification factor) IA Δ i I 2 = (AAi iAAi) is calculated and compared with each other By using a codebook created by rearranging in order from the delta vector with the largest power, encoding is performed, and the distribution is biased by giving a fixed delta vector. The characteristics were improved compared to the tree-structured delta codebook.
しかしながら、 この場合にもデルタべク トルの数は実際に用いら れる数と同数であり、 それらの中での並べ替えたデルタべク トルに より符号化を行うので、 符号帳の自由度に制約がある。  However, in this case as well, the number of delta vectors is the same as the number actually used, and encoding is performed using the rearranged delta vectors. There are restrictions.
例えば議論を簡単にするため、 L = 2 の場合、 すなわちべク トル C 0 ( =厶。 ) とデルタ ベク ト ル△ , と力、ら符号べク トノレ C 0 , For the sake of simplicity, for example, in the case of L = 2, that is, the vector C 0 (= 厶), the delta vector △, and the power, the vector C 0 ,
C 2(=厶。 —△ ,)を生成する木構造デルタ符号 帳の場合を考える。 図 7Aに示すように厶。 , として使用するべ ク トルを単位べク トル e x , e y に限定すると、 順番を入れ替えた と しても生成される符号べク ト ルは斜線で表わす X — y平面内に限 定される。 一方、 三つの線形独立な単位べク トル e x , e y > e z の中から必要に応じて 2つを選んで Δ。 , と して使用する場合、 図 7A〜7Cに示されるように、 部分空間の選択の自由度が広がる。 木構造デルタ符号帳の改良 Consider the case of a tree-structured delta codebook that produces C 2 (= 厶. — △,). As shown in Figure 7A. If the vectors used as, and are limited to the unit vectors e x and e y , the generated code vector is limited to the X — y plane represented by the oblique lines even if the order is changed. You. On the other hand, if necessary, select two from the three linearly independent unit vectors e x , e y > e z and Δ. When used as,, as shown in Figs. 7A to 7C, the degree of freedom in selecting a subspace is increased. Improvement of tree structure delta codebook
そこで本発明では、 更なる改善を加えるために、 デルタべク トル 符号帳において実際に符号帳を構成する際に用いられるデルタ べク トル ( L本-初期べク ト ル十 L— 1 本のデルタべク ト ル) よ り多 く のデルタべク ト ルの候補 ( L ' 本 : L ' > L ) を与え、 これらの候 補に対して上記と同様の操作を行って並べ替えを施した後、 振幅増 幅率が上位のものから所望の数 ( L本) だけのデルタ べク トルを選 定して符号帳を構成する。 このよう にする こ とで、 自由度の高い符 号帳を得る こ とが可能になり、 量子化特性の改善が図られている。 Therefore, in the present invention, in order to further improve the delta vector codebook, the delta vector (L-initial vector tens L—1 Delta vector) More delta vector candidates (L 'book: L'> L) are given, and these candidates are sorted by performing the same operation as above. After that, the desired number (L) of delta vectors are selected from those with the highest amplitude amplification rate. And configure the codebook. By doing so, a codebook with a high degree of freedom can be obtained, and the quantization characteristics are improved.
尚、 上記は符号器についての ものであるカ^ この符号器に対向す る復号器においても、 符号器側と同じデルタべク トルの候補を備え、 符号器側と同様の制御を行う こ とによ り、 常に符号器側と同内容の 符号帳を生成して用いる こ とで、 符号器側との対向性を確保する こ とができ る。  The above description is about the encoder. The decoder opposite to this encoder also has the same delta vector candidates as the encoder side, and performs the same control as the encoder side. Thus, by always generating and using a codebook having the same contents as the encoder side, it is possible to ensure the opposition to the encoder side.
図 8 は上記思想に基づく 本発明に係る音声符号化方式の実施例を 表わすブロ ッ ク図である。 この実施例においてデルタべク トル符号 帳 10は、 1 つの基準雑音列を表現する初期ベク ト ル C。 ( =△。) と 実際に使用する ( L 一 1 ) 本より多い ( L ' 一 1 ) 本の N次元のデ ルタ雑音列を表現するデルタ ベク ト ル Δ , 〜厶 を記憶 · 保持す るように構成されており、 初期べク トル C。 及び各デルタべク トル 厶! 〜 Δい—,はそれぞれ N次元で表現されている。 すなわち、 初期 べク トル及びデルタ べク トルは時系列的に発生する Νサ ンプルの雑 音の振幅をそれぞれコ一ド化した Ν次元のべク ト ルである。  FIG. 8 is a block diagram showing an embodiment of the speech coding method according to the present invention based on the above idea. In this embodiment, the delta vector codebook 10 is an initial vector C representing one reference noise sequence. (= △.) And memorize and retain the delta vector Δ, which expresses more than (L'1) N-dimensional delta noise sequences than (L-1) The initial vector C. And each delta vector! ~ Δ are represented in N dimensions. In other words, the initial vector and the delta vector are two-dimensional vectors in which the amplitudes of the noises of the 発 生 samples generated in time series are encoded.
また、 こ の実施例では線形予測合成フ ィ ルタ 3 は次数 Νρの I I R 型 フ ィ ルタで構成される力 このフ ィ ルタのィ ンパルス応答から生成 される Ν X Νの正方行列 Αとデルタべク トル の乗算を行って、 デルタ べク トノレ A i にフ イ ノレタ処理 Aを施し、 べク ト ノレ Α Δ ι を出 力する。 I I R 型フ ィ ルタの Np個の係数は入力音声信号に基づいて変 化し、 その都度周知の方法で決定される。 すなわち、 入力音声信号 の隣接サンプルには相関が存在するから、 サンプル間の相閔係数を 求め、 該相関係数からパーコール係数と称せられる偏自己相関係数 を求め、 該パーコール係数から 1 1 R 型フ ィ ルタのアルフ ァ係数を決 定し、 当該フ ィ ルタのィ ンパルス応答列を用いて N X Nの正方行列 Aを作成してべク トル Δ i にフ ィ ルタ処理を施す。 フ ィ ルタ処理が施された L ' 本のベク ト ル A厶 i ( i = 0 , 1 ·'· L ' - 1 ) は記憶部 40に保持され、 パワー評価部 42においてパワー I ΑΔ i I 2 = ( A厶 i ) T ( A△ i ) が評価される。 なお、 各デルタべク ト ル A i は規格化 ( I I 2 == ( A i) T ( A i) - 1 ) されているので、 パワーの評価をするだけでフ ィ ルタ処理 Aによる増幅度が直接評価 される。 次に、 パワー評価部 42の評価結果に基づいてソーテイ ング 部 43においてパワーの大きい順に並べ替えられる。 例えば図 6 Bの 例では、 In this embodiment, the linear predictive synthesis filter 3 is a filter composed of an IIR filter of order Νρ, a square matrix of Ν X さ れ る generated from the impulse response of this filter, and a delta matrix. The vector multiplication is performed, and the delta vector A i is subjected to the final processing A, and the vector Δ ι is output. The Np coefficients of the IIR filter are changed based on the input audio signal, and are determined each time by a well-known method. That is, since there is a correlation between adjacent samples of the input speech signal, a phase coefficient between samples is calculated, a partial autocorrelation coefficient called a Percoll coefficient is calculated from the correlation coefficient, and 11 R is calculated from the Percoll coefficient. The alpha coefficient of the type filter is determined, an NXN square matrix A is created using the impulse response sequence of the filter, and the vector Δi is filtered. The L 'vectors A i (i = 0, 1 ·' · L '-1) on which the filtering process has been performed are stored in the storage unit 40, and the power I iΔ i I 2 = (Am i) T (A △ i) is evaluated. Since each delta vector A i is standardized (II 2 == (A i) T (A i) -1), the amplification degree by filter processing A can be obtained only by evaluating the power. Is directly evaluated. Next, sorting is performed in the sorting section 43 in descending order of power based on the evaluation result of the power evaluation section 42. For example, in the example of Figure 6B,
厶 o = e z , Δ 1 = e X , Δ 2 = e y O = e z , Δ 1 = e X, Δ 2 = e y
の順に並び替えられる。 In the order of
上記のようにして並べ替えられたべク トル A厶 i ( i = 0 , 1 - L ' 一 1 ) は全部で L ' 本有るが、 以降の符号化処理は、 実際に使 用する L本のベク トル A A i ( i - 0 , 1 〜 L — 1 ) により行われる。  The vector A i (i = 0, 1-L '1 1) rearranged as described above has a total of L' lines, but the subsequent encoding process uses the L lines that are actually used. This is performed by the vector AA i (i-0, 1 to L — 1).
そこで、 選定記憶部 41では振幅増幅率が大きいものから L本だけ べク トルを選定して記憶する。 例えば上記の例では、 上記のデルタ ベク トルの内、 Δ。 = e z , 及び = e x が選定される。 そして、 これらのべク トルによつて構成される木構成デルタ符号帳に基づい て前述した従来の木構造デルタ符号帳の場合と全く 同様に符号化処 理 ¾ 亍う。 符号化処理の詳細 Therefore, the selection storage unit 41 selects and stores only L vectors from those having the largest amplitude amplification factors. For example, in the above example, Δ of the above delta vectors. = E z, and = e x is selected. Then, based on the tree-structured delta codebook constituted by these vectors, the encoding process is performed in exactly the same manner as in the case of the conventional tree-structured delta codebook described above. Details of the encoding process
以下に、 選定記憶部 41に記憶されたべク トル Α Δ。 , Α Δ , , Α Δ 2 … A△ L— , からなる木構造デルタ符号帳と、 入力信号べク ト ル X とから、 入力信号べク トル X との距離が最小である符号べク ト ル Cのイ ンデ ッ ク スを見い出す符号化部 48の詳細について説明する。 符号化部 48は入力信号べク ト ル X と各デルタ べク ト ル の相互 相関 Χ τ(ΑΔ ί) を計算する演算部 50と、 各デルタ べク ト ル A i の自 己相関(ΑΔ Τ (AA i ) を計算する演算部 52と、 デルタべク トル間 の相互相関(ΑΔ ι)τ (ΑΔ ο, ,, を計算する演算部 54と、 演 算部 54の出力から交さ項(ΑΔ Τ (ACJ を計算する演算部 55と、 演 算部 50からの各デルタべク トルの相互相関を累積して入力信号べク トル X と符号ベク トル Cとの相互相関 R xcを算出する演算部 56と、 演算部 52が出力する各デルタべク トルの自己相関(ΑΔ ±)Τ (ΑΔ ι) と演算部 55が出力する交さ項(ΑΔ ί) τ (ACk) とを累積して各符号べ ク トル Cの自己相関を算出する演算部 58と、 R cx z Z R ccを計算す る演算部 60と、 誤差最小雑音列決定部 62、 および音声符号化部 64か ら成っている。 Hereinafter, the vector 記憶 Δ stored in the selection storage unit 41. , Α Δ,, Α Δ 2 … A △ L—, a tree-structured delta codebook and the input signal vector X, the code vector with the minimum distance from the input signal vector X The details of the encoding unit 48 that finds the index of the file C will be described. The encoding unit 48 calculates a cross-correlation τ τ (ΑΔί) between the input signal vector X and each delta vector, and computes the delta vector A i by itself. An arithmetic unit 52 for calculating the autocorrelation (ΑΔ Τ (AA i), the cross-correlation between the delta base-vector (ΑΔ ι) τ (ΑΔ ο , an arithmetic unit 54 for calculating a ,, the output of the arithmetic unit 54 The cross-correlation term (ΑΔ Τ (Calculation unit 55 for calculating ACJ) and the cross-correlation of each delta vector from the calculation unit 50 are accumulated to calculate the cross-correlation between the input signal vector X and the sign vector C. An arithmetic unit 56 for calculating R xc , an autocorrelation (ΑΔ ± ) Τ (ΑΔι) of each delta vector output from the arithmetic unit 52 and a cross term (ΑΔί) τ (AC k ) to calculate the autocorrelation of each code vector C, a calculation unit 60 to calculate R cx z ZR cc, a minimum error noise sequence determination unit 62, and speech coding It consists of 64 parts.
最初に、 演算中の階層を表すパラメ ータ i が 0 に設定される。 こ の状態で演算部 50, 52ではそれぞれ Χ Τ(ΑΔ。), (ΑΔ ο)τ (ΑΔ。:)が 計算され出力される。 演算部 54, 55からは 0が出力される。 演算部 50, 52が出力する Χ Τ(Α厶。), (Α厶。) τ (Α厶。)はそれぞれ第 1 階層 における相互相関 R xc (。> 、 自己相関 R c c (°) と して演算部 56, 58 に記憶され、 出力される。 演算部 60ではこれら. R xc (0) 、 R cc (0) から F (X, C)
Figure imgf000021_0001
R ccの値が計算され出力される。
First, the parameter i representing the hierarchy being operated on is set to zero. In this state, the calculation units 50 and 52 calculate and output Χ Τ (ΑΔ.) And (ΑΔο) τ (ΑΔ. :), respectively. The arithmetic units 54 and 55 output 0. Calculating unit 50, 52 is output chi T (Alpha厶.), (Alpha厶.) Tau (Alpha厶.) Cross-correlation R xc in the first hierarchy, respectively (.>, And autocorrelation R cc (°) The signals are stored and output to the calculation units 56 and 58. The calculation unit 60 outputs these values from R xc (0) and R cc (0) to F (X, C).
Figure imgf000021_0001
The value of R cc is calculated and output.
誤差最小雑音列決定部 62では演算された F (X, C) とそれ迄の F (X, C) の最大値 F max (初期値は 0 ) を比較し、 F (X, C) > F max であれば、 F (X, C) → F max と して F max を更新する と共 に、 F max を与える雑音列 (コー ドべク トル) を特定する符号でそ れ迄の符号を更新する。  The error minimum noise sequence determination unit 62 compares the calculated F (X, C) with the maximum value F max (the initial value is 0) of the previous F (X, C), and obtains F (X, C)> F If it is max, F (X, C) → F max is updated and F max is updated, and a code specifying a noise sequence (code vector) that gives F max is replaced by a code up to that. Update.
次にパラメ ータ i が 0 から 1 に更新される。 この状態で、 演算部 50, 52ではそれぞれ X T(A厶 (ΑΔ ,) τ (Α Δ i )が計算され出力さ れる。 演算部 54では(ΑΔ ,)τ (Α Δ。)が計算され出力される。 演算部 55ではその値を交さ項(ΑΔ ,) Τ (ACo) と して出力する。 演算部 56で は記憶している R xc <()) および演算部 50から出力される X T (A厶,) の値から、 (10) (11)式に従って第 2階層における相互相関 R x c ( 1 ) および R x c ( 2 > の値を計算し出力し記憶する。 演算部 58では、 記憶 している R c c および演算部 52, 55からそれぞれ出力される(A厶 (Α Δ , ) , (Α Δ , ) T (ACo) の値から、 (12) (13)式に従って、 第 2階層 における自己相関 R c c ( 1 ) および R c c ( 2 ) の値を計算し出力し記憶 する。 演算部 60および誤差最小雑音列決定部 62の動作は i = 0 の と き と同様である。 Next, parameter i is updated from 0 to 1. In this state, arithmetic units 50 and 52 calculate and output X T (Aum (ΑΔ)) τ (Α Δ i), respectively, and arithmetic unit 54 calculates (ΑΔ) τ (Α Δ.). The calculation unit 55 outputs the value as the cross term (ΑΔ,) Τ (ACo) The calculation unit 56 outputs the stored R xc <()) and the output from the calculation unit 50 X T (Am,) From the values of (10) and (11), the values of the cross correlations R xc (1) and R xc (2> in the second hierarchy are calculated, output, and stored. The arithmetic unit 58 stores the stored R cc From the values of (Aum (ΑΔ,), (ΑΔ,) T (ACo)) output from the arithmetic units 52 and 55, respectively, the autocorrelation R cc in the second layer is calculated according to the equations (12) and (13). Calculate, output, and store the values of (1) and R cc (2) The operations of the operation unit 60 and the minimum error noise sequence determination unit 62 are the same as when i = 0.
次にパラメ ータ i が 1 から 2 に更新される。 この状態で、 演算部 50, 52ではそれぞれ Χ Τ (Α Δ 2) > (Α Δ ζ) τ (Α Δ 2)が計算され出力さ れる。 演算部 54では Δ 2 と , 厶。 の相互相関(Α Δ 2) Τ (Α Α , )お よび(Α Δ 2) Τ (Α厶。)が計算され出力される。 演算部 55では、 それら の値から、 (14)式に従って交さ項(Α Δ Ζ) Τ (AC ) を計算し出力する。 演算部 56では記憶している R x c ( 1 > , R x c (2) および演算部 50から 入力される X T (A厶 2)の値から、 (10) (11)式に従って第 3階層にお ける相互相関 R x c (3~6> の値を計算し出力し記憶する。 演算部 58で は、 記憶している R c c ( 1 > , R cc (2> および演算部 52, 55からそれ ぞれ出力される(Α Δ 2) Τ (Α厶 2), (Α Δ Z) T (AC ) の値から、 (12) (13)式に従って、 第 3階層における自己相関 R c c (3~" の値を計算 し出力し記憶する。 演算部 60および誤差最小雑音列決定部 62の動作 は i = 0.1 のとき と同様である。 Next, parameter i is updated from 1 to 2. In this state, the arithmetic units 50 and 52 calculate and output Χ Τ (Α Δ 2 )> (Α Δ ζ ) τ (Α Δ 2 ), respectively. The arithmetic unit 54 and delta 2,厶. The cross-correlation (Α Δ 2 ) Τ (Α,,) and (Α Δ 2 ) Τ (room) are calculated and output. The arithmetic unit 55, from those values, calculates and outputs the term crosspoint according (14) (Α Δ Ζ) Τ (AC ). The arithmetic unit 56 divides the stored R xc (1> , R xc (2)) and the value of X T (Am 2 ) input from the arithmetic unit 50 into the third layer according to equations (10) and (11). Calculates, outputs, and stores the value of the cross-correlation R xc (3 to 6> in the calculation unit. The arithmetic unit 58 stores the stored R cc (1> , R cc (2> and the values from the arithmetic units 52 and 55). From the values of (Α Δ 2 ) Τ (room 2 ) and (Α Δ Z ) T (AC) output, the autocorrelation R cc (3 ~ The operation of the operation unit 60 and the minimum error noise sequence determination unit 62 is the same as when i = 0.1.
上記の処理を操り返して i = L 一 1 までの処理が終了したら、 音 声符号化部 64は誤差最小雑音列決定部 62に記憶されている最新の符 号を入力信号べク ト ル X との距離が最小である符号べク トルのイ ン デ ッ ク ス と して出力する。  When the above processing is repeated and the processing up to i = L-1 1 is completed, the voice coding unit 64 converts the latest code stored in the minimum error noise sequence determination unit 62 into the input signal vector X It is output as the index of the code vector whose distance to is the smallest.
なお、 演算部 52における(A厶 i) T (A厶 i) の演算において、 パヮ —評価部 42の計算結果がそのまま利用できる。 可変レー ト符号化 In the operation of (Am i) T (Am i) in the operation section 52, the calculation result of the power evaluation section 42 can be used as it is. Variable rate coding
前述の木構造デルタ符号帳及び本発明により改良された木構造帳 デルタ符号帳を使用すれば、 従来の符号帳で必要と した膨大なメ モ リ を必要とせず、 かつ、 ビ ッ ト ド ロ ッ プへの対策が可能な可変レー ト符号化が実現される。  By using the above-described tree-structured delta codebook and the tree-structured book delta codebook improved by the present invention, the huge memory required in the conventional codebook is not required, and the bit-drawing is not required. Variable rate coding that can take countermeasures against gaps is realized.
すなわち、 図 9 Aに示した構造を有する木構造デルタ符号帳 Δ。 , Δ , , 厶 2 …を格納しておき、 図 9 Βに示すよう にこれらのう ち第 1 階層のべク ト ル厶。 のみを使って、 That is, a tree-structured delta codebook Δ having the structure shown in FIG. 9A. , Delta,, it may be stored the厶2 ..., the first layer of the base click preparative Le厶Chi These sac as shown in FIG. 9 beta. Using only
C * = 0 (零ベク トル)  C * = 0 (zero vector)
C o = Δ 0  C o = Δ 0
の 2つの符号べク ト ルが生成されるようにして符号化を行えば、 ィ ンデックスデータ と して C。 を選択するか否かの 1 ビッ トの情報に よる 1 ビ ッ ト符号化が達成される。 If encoding is performed so that the two code vectors are generated, C is obtained as index data. 1-bit encoding is achieved by 1-bit information indicating whether or not to select.
第 2階層までのべク トル厶。 , 厶, を使って  Vector up to the second level. Using, um,
C * = 0  C * = 0
C 0 =厶。 C 0 = mu.
C , =厶 0 + Δ ,  C, = 0 + Δ,
C 2 == Δ 0 一△ 1  C 2 == Δ 0 1 △ 1
の 4 つの符号べク トルが生成されるよう にして符号化を行えば、 ィ ンデックスデータ と して C。 の選択の有無および 又は一 A d を指定する 2 ビ ッ トの情報による 2 ビ ッ ト符号化が達成される。 同様にして、 第 i 段階までのべク ト ル Δ。 , 厶, … Δ i を使えば i ビ ッ ト符号化が達成される。 したがって、 L個のデルタ ベク トル Δ 0 , Δ , …△ L— , を含む 1 組の木構造デルタ符号帳を使うだけで、 生成されるィ ンデ ッ ク スデータのビ ッ ト長を 1 〜 Lの範囲で任意に 可変する こ とができる。 If the encoding is performed so that the four code vectors are generated, C is used as the index data. A two-bit encoding is achieved with two bits of information specifying whether or not to select and / or one Ad. Similarly, the vector Δ up to the i-th stage. , Mm, ... i-bit encoding is achieved by using Δi. Therefore, the bit length of the generated index data can be set to 1 to just by using a set of tree-structured delta codebooks including L delta vectors Δ 0, Δ,… △ L—,. It can be changed arbitrarily in the range of L.
従来の符号帳を使って 〗 〜 L ビ ッ トの可変ビ ッ ト レ一 ト符号化を 行う とすれば、 べク トルの次元を Nとする と、 必要なメ モ リ のヮ一 ド数は Using a conventional codebook, variable bit rate encoding of〗 to L bits is performed. Assuming that the dimension of the vector is N, the number of required memory bits is
N X ( 2 ° + 2 1 十…十 2 L ) = N X ( 2 L + 1 一 1 ) NX (2 ° + 2 1 ten ... ten 2 L) = NX (2 L + 1 one 1)
である。 これに対して、 図 9 Aの木構造デルタ符号帳を図 9Bのように して使用すれば、 必要なメ モ リ のワー ド数は It is. On the other hand, if the tree-structured delta codebook of Fig. 9A is used as shown in Fig. 9B, the required number of memory words is
N X L  N X L
である。 It is.
木構造デルタ符号帳と しては、 前述の並べ替えを行わない木構造 デルタ符号帳、 Aによる増幅率の大きさによりデルタべク トルを並 ベ替えた木構造デルタ符号帳および、 L ' 本のデータべク トルの中 から L本選択して使用する木構造デルタ符号帳のいずれもが使用可 能である。  The tree-structured delta codebook includes a tree-structured delta codebook that does not perform the above-described reordering, a tree-structured delta codebook in which delta vectors are rearranged according to the amplification factor of A, and L ′ Any of the tree-structured delta codebooks that can be used by selecting L out of these data vectors can be used.
なお、 ビッ ト レー トを可変にする制御は、 図 8 の符号化処理部 48 における処理を、 所望ビ ッ ト数に応じて途中の階層で打ち切るよう にすれば容易に達成される。 例えば 4 ビ ッ ト符号化の場合、 i == 0 , 1 , 2 , 3 について、 前述の符号化処理部 48の処理を行うようにす れば良い。  The control for changing the bit rate can be easily achieved by terminating the processing in the encoding processing unit 48 of FIG. 8 at an intermediate layer in accordance with the desired number of bits. For example, in the case of 4-bit encoding, the above-described processing of the encoding processing unit 48 may be performed for i == 0, 1, 2, and 3.
ェ ンべデッ ド符号化 Embedded coding
ェ ンべデッ ド符号化、 すなわち伝送路中で一部のビッ トが強制的 に欠落させられても、 復号器において音声を再生するこ とのできる 符号化システムは、 上記の木構造デルタ符号帳による可変レ一 ト符 号化において、 一部のビ ッ 卜が欠落させられたら、 木構造上でその 親または先祖の符号べク トルと して再生されるよう に符号系を構成 すれば達成される。 例えば 4 ビッ トの符号系 〔 C。 , C , … C , 4〕 で 1 ビッ トが欠落させられたら、 C , 3 , C , 4は 3 ビッ ト系の C 6 と して、 C ^ . C uは 3 ビッ ト系の C 5 として再生されるように構成 する。 このよう にすれば、 親子関係にある符号べク ト ルは比較的近 い値を持つので、 大きな音質の劣化なしに音声を再生する とがで きる。 The embedded coding, that is, the coding system that can reproduce the sound at the decoder even if some bits are forcibly omitted in the transmission path, uses the above-mentioned tree structure delta code. In variable-rate encoding using books, if some bits are missing, the coding system can be configured to be reproduced as a code vector of its parent or ancestor on a tree structure. Achieved. For example, a 4-bit code system [C. , C,... C, 4 ], if one bit is missing, C, 3 , C, and 4 are assumed to be 3-bit C 6, and C ^. Cu is a 3-bit C 5 It is configured to be played as. In this way, the parent-child code vectors are relatively close. Since it has a high value, it is possible to reproduce the sound without significant deterioration of sound quality.
表 1 4 にはこの様な符号系の一例を示す。  Table 14 shows an example of such a coding system.
表 1 伝送ビッ ト : 1 ビッ トの場合  Table 1 Transmission bits: 1 bit
Figure imgf000025_0001
表 2 伝送ビッ ト : 2 ビ ッ ト の場合
Figure imgf000025_0001
Table 2 Transmission bits: 2 bits
Figure imgf000025_0002
Figure imgf000025_0002
表 3 伝送ビッ ト : 3 ビッ トの場合 符号べク ト ル fe;达符可  Table 3 Transmission bits: For 3 bits Code vector fe;
0 0 0  0 0 0
C 0 0 0 1  C 0 0 0 1
c 1 0 1 1 c 1 0 1 1
C 2 0 1 0 C 2 0 1 0
C 1 1 1  C 1 1 1
C 4 1 1 0  C 4 1 1 0
C 1 0 1  C 1 0 1
C 6 1 0 0 表 4 伝送ビ ッ ト : 4 ビ ッ ト の場合 符号べク トル 伝送符号 C 6 1 0 0 Table 4 Transmission bits: In case of 4 bits Code vector Transmission code
0 0 0 0  0 0 0 0
C 0 0 0 0 1  C 0 0 0 0 1
c , 0 0 1 1  c, 0 0 1 1
C 2 0 0 1 0  C 2 0 0 1 0
C 3 0 1 1 1  C 3 0 1 1 1
C 4 0 1 1 0  C 4 0 1 1 0
C 5 0 1 0 1 C 5 0 1 0 1
C 6 0 1 0 0  C 6 0 1 0 0
C 7 1 1 1 1  C 7 1 1 1 1
C 8 1 1 1 0 C 8 1 1 1 0
C , 1 1 0 1  C, 1 1 0 1
10 1 1 0 0  10 1 1 0 0
C H 1 0 1 1  C H 1 0 1 1
I 2 1 0 1 0  I 2 1 0 1 0
13 1 0 0 1  13 1 0 0 1
1 1 0 0 0 上記の符号系は、 例えば 4 ビッ トの場合、 次の例のようにして定 められている。  1 1 0 0 0 The above coding system, for example, in the case of 4 bits, is defined as in the following example.
C , , =厶。 一厶 , 十 Δ 2 +厶 3 は、 4個のデルタ ' ベク トルの要 素を持ち、 それぞれの符号が、 上位から順に ( 十, 一, 十, + ) と なるのでこれを " 1 0 1 1 " と表す。 C,, = mu. Ichi厶, ten delta 2 +厶3 has a element of the four delta 'vector, each code in order from the upper (ten, one, ten, +) and this since the "1 0 1 1 ".
C 2 = Δ。 —△ , は、 2個しかデルタ ' ベク トルの要素を持たず、 符号は ( 十, 一) の順である。 この場合の符号を ( 0 , 0 , 十, 一) とみなし、 " 0 0 1 0 " と表す。 このようにして符号化した情報に対して 4 ビッ ト→ 3 ビッ 卜の 1 ビ ッ トのビ ッ ト ドロ ップが生じた場合について表 5 に示す。 C 2 = Δ. — △, has only two delta 'vector elements, and the signs are in the order (10,1). The code in this case is regarded as (0, 0, ten, one) and is expressed as "0 0 1 0". Table 5 shows the case where a bit drop of 1 bit from 4 bits to 3 bits occurs for the information encoded in this way.
表 5 Table 5
Figure imgf000027_0001
また、 2 ビ ッ トの欠落が生じる と表 6 のように再生される。 表 6
Figure imgf000027_0001
If two bits are lost, the data is reproduced as shown in Table 6. Table 6
Figure imgf000028_0001
この場合、 2階層上位の先祖のべク ト ルと して再生される 表 7 1 0には本発明のェンべデッ ド符号系の他の例を示す 表 7 伝送ビ ッ ト : 1 ビ ッ ト の場合 符号べク ト ル fa送ィ 万
Figure imgf000028_0001
In this case, it is reproduced as a vector of the ancestor of the upper hierarchy two layers. Table 7-10 shows another example of the embedded code system of the present invention. Table 7 Transmission bit: 1 bit In the case of a packet
C * 0  C * 0
C 0 1 8 伝送ビッ ト : 2 ビッ 卜 の場合 C 0 1 8 transmission bits: 2 bits
Figure imgf000029_0001
Figure imgf000029_0001
9 伝送ビッ ト : 3 ビッ トの場合 9 transmission bits: 3 bits
2  Two
符号べク ト ル fc 7:达付万  Code vector fc 7:
0 0 0 0 0 0
C 0 0 0 1 c , 0 1 0C 0 0 0 1 c, 0 1 0
C 2 0 1 1C 2 0 1 1
C 3 1 0 0C 3 1 0 0
C 4 1 0 1C 4 1 0 1
C 5 1 1 0C 5 1 1 0
C b 1 1 1 C b 1 1 1
表 10 伝送ビッ ト : 4 ビ ッ ト の場合 Table 10 Transmission bits: 4 bits
Figure imgf000030_0001
Figure imgf000030_0001
この符号系においても、 1 ビッ ト欠落が生じたらその親のべク ト ルが、 2 ビッ ト欠落が生じたら、 2階層上位の先祖のベク トルが再 生される。  In this coding system, if one bit is missing, the vector of the parent is played. If two bits are missing, the vector of the ancestor two levels higher is played.

Claims

請 求 の 範 囲 The scope of the claims
1. 予め与えられた符号べク ト ルの中で入力音声信号べク ト ルと の距離が最小である符号べク トルに割り 当てられたィ ンデッ クスに より該入力音声信号べク トルを符号化する音声符号化方法であって、 a ) 複数の差分符号べク トルを格納し、 1. The input speech signal vector is determined by the index assigned to the code vector having the smallest distance from the input speech signal vector among the code vectors given in advance. A speech coding method to be coded, comprising: a) storing a plurality of differential code vectors,
b ) 該差分符号べク ト ルの各々 に線形予測合成フ ィ ルタのマ ト リ クスを乗じ、  b) Multiply each of the difference code vectors by the matrix of the linear prediction synthesis filter,
c ) 該マ ト リ ク スが乗じられた差分符号べク ト ルのパワーの増 幅率を評価し、  c) Evaluate the power gain of the differential code vector multiplied by the matrix,
d ) 該評価されたパワーの増幅率の大きさの順に該マ ト リ ク ス が乗じられた差分符号べク トルを並べ替え、  d) rearrange the difference code vector multiplied by the matrix in the order of the magnitude of the evaluated power amplification factor;
e ) 並べ替えられたべク トルの中から評価されたパワーの増幅 率の大きさの順に所定個数のべク トルを選択し、  e) From the sorted vectors, select a predetermined number of vectors in the order of the magnitude of the power amplification rate evaluated,
f ) 該選択されたべク トルを木構造上で順次加算及び減算する こ とによ って生成されるべき、 線形予測合成フ ィ ルタ処理が施され た符号べク トルと、 前記入力音声信号べク ト ルとの距離を評価し、 g ) 該評価された距離が最小である符号べク トルを決定する各 段階を具備する音声符号化方法。  f) a code vector to be generated by sequentially adding and subtracting the selected vector on a tree structure and having been subjected to a linear prediction synthesis filter process; and the input audio signal G) A speech coding method comprising the steps of: e) evaluating a distance from a vector, and g) determining a code vector having the smallest estimated distance.
2. 前記差分符号べク ト ルの各々 は正規化されている請求の範囲 第 1 項に記載の方法。  2. The method of claim 1, wherein each of the difference code vectors is normalized.
3. 前記段階 f ) は、 前記選択されたべク ト ルの各々 と前記入力 音声信号べク ト ルとの相互相関を計算して木構造上で順次加算及び 減算する こ とによ って該入力音声信号べク ト ルと前記線形予測合成 フ ィ ルタ処理が施された符号べク トルとの相互相関 R x cを計算し、 該選択されたべク ト ルの各々の自己相関及び異なるべク ト ルのす ベての組み合わせの相互相関を計算して木構造上で順次加算及び減 算する こ とによ って該線形予測合成フ ィ ルタ処理が施された符号べ ク トルの自己相関 R c cを計算し、 3. The step f) is performed by calculating a cross-correlation between each of the selected vectors and the input audio signal vector and sequentially adding and subtracting them on a tree structure. Calculate the cross-correlation Rxc between the input speech signal vector and the code vector that has been subjected to the linear prediction synthesis filter processing, and calculate the autocorrelation of each of the selected vectors and a different vector. Calculate the cross-correlation of all combinations of tolls and add and subtract them sequentially on the tree structure. To calculate the autocorrelation R cc of the code vector subjected to the linear prediction synthesis filter processing.
符号べク トルの各々について、 相互相関 R x cの 2乗を自己相関 R c cで除した R x c 2 / R c cを計算するこ とを含み、 For each of the code vectors , calculating R xc 2 / R cc by dividing the square of the cross-correlation R xc by the auto-correlation R cc ,
前記段階 g ) は、 最大の R x c z / R c cの値を与える符号べク トル を入力音声信号べク ト ルとの距離が最小である符号べク トルである と決定する こ とを舍む請求の範囲第 1 項に記載の方法。 Wherein step g) includes Complex that you determine the distance between the maximum R xc z / R cc input speech signal base click preparative Le code base-vector giving the value of a code base-vector is the minimum The method of claim 1.
4. 予め与えられた符号べク ト ルの中で入力音声信号べク トルと の距離が最小である符号べク トルに割り 当てられたィ ンデ ッ ク スに より該入力音声信号べク トルを符号化する符号化装置であって、 複数の差分符号べク トルを格納する手段と、  4. The index assigned to the code vector whose distance from the input speech signal vector is the smallest of the code vectors given in advance is determined by the index assigned to the input speech signal vector. An encoding device for encoding a plurality of differential code vectors, comprising:
該差分符号べク トルの各々に線形予測合成フ ィ ルタ のマ ト リ ク ス を乗じる手段と、  Means for multiplying each of the difference code vectors by a matrix of a linear prediction synthesis filter;
該マ ト リ ク スが乗じられた差分符号べク トルのパヮ一の増幅率を 評価する手段と、  Means for evaluating the gain of the phase of the differential code vector multiplied by the matrix;
該評価されたパワーの増幅率の大きさの順に該マ ト リ クスが乗じ られた差分符号べク トルを並べ替える手段と、  Means for rearranging the difference code vector multiplied by the matrix in the order of the magnitude of the evaluated power amplification factor;
並べ替えられたべク ト ルの中から評価されたパワーの増幅率の大 きさの順に所定個数のべク トルを選択する手段と、  Means for selecting a predetermined number of vectors in the order of the magnitude of the power amplification rate evaluated from the sorted vectors,
該選択されたべク トルを木構造上で順次加算及び減算する こ とに よって生成されるべき、 線形予測合成フ ィ ルタ処理が施された符号 べク トルと、 前記入力音声信号べク ト ルとの距離を評価する手段と、 該評価された距離が最小である符号べク ト ルを決定する手段とを 具備する音声符号化装置。  A code vector to be generated by sequentially adding and subtracting the selected vector on a tree structure, the code vector having been subjected to a linear prediction synthesis filter process, and the input audio signal vector A speech coding apparatus comprising: means for evaluating a distance to the speech signal; and means for determining a code vector having the smallest estimated distance.
5. 前記差分符号べク ト ルの各々 は正規化されている請求の範囲 第 4項に記載の装置。  5. The apparatus according to claim 4, wherein each of the difference code vectors is normalized.
6. 前記距離評価手段は、 前記選択されたベク ト ルの各々 と前記 入力音声信号べク トルとの相互相関を計算して木構造上で順次加算 及び減算する こ とによ って該入力音声信号べク ト ルと前記線形予測 合成フ ィ ルタ処理が施された符号べク トルとの相互相関 R xcを計算 する手段と、 6. The distance estimating means includes: each of the selected vectors; The cross-correlation with the input speech signal vector was calculated and sequentially added and subtracted on the tree structure, whereby the input speech signal vector and the linear prediction synthesis filter processing were performed. Means for calculating the cross-correlation R xc with the code vector,
前記選択されたべク ト ルの各々の自己相関及び異なるべク ト ルの すべての組み合わせの相互相関を計算して木構造上で順次加算及び 減算する こ とによ って該線形予測合成フ ィ ルタ処理が施された符号 べク ト ルの自己相関 R ccを計算する手段と、 The auto-correlation of each of the selected vectors and the cross-correlation of all combinations of the different vectors are calculated and sequentially added and subtracted on a tree structure, thereby obtaining the linear prediction synthesis filter. Means for calculating the autocorrelation R cc of the filtered code vector,
符号べク ト ルの各々について、 相互相関 R xcの 2乗を自己相関 R ccで除した Rxc 2 /R ccを計算する手段を舍み、 For each code vector, provide a means to calculate R xc 2 / R cc by dividing the square of the cross-correlation R xc by the auto-correlation R cc ,
前記符号べク ト ル決定手段は、 最大の R xc 2 / R ccの値を与える 符号べク トルを入力音声信号べク トルとの距離が最小である符号べ ク トルであると決定する手段を舍む請求の範囲第 4項に記載の装置。 The code base click preparative Le determining means maximum R xc 2 / R cc means the distance the code base-vector giving the value as the input speech signal base-vector is determined to be the code base-vector is the minimum of The apparatus according to claim 4, wherein the apparatus comprises:
7. 予め与えられた符号べク トルの中で入力音声信号べク ト ルと の距離が最小である符号べク トルに割り 当てられた可変ビ ッ ト長の 符号により該入力音声信号べク トルを可変長符号化する可変長音声 符号化方法であって、  7. The code of the variable bit length assigned to the code vector whose distance from the input speech signal vector is the smallest among the code vectors given in advance is determined by the code of the variable bit length. A variable length speech encoding method for variable length encoding
a ) 複数の差分符号べク トルを格納し、  a) Store multiple difference code vectors,
b ) 先頭から所望の符号ビ ッ ト長に応じた数の差分符号べク ト ルを木構造上で順次加算及び減算する こ とによって生成されるべき 符号べク ト ルと前記入力音声信号べク ト ルとの距離を評価し、  b) A code vector to be generated by sequentially adding and subtracting a number of difference code vectors according to a desired code bit length from the head on a tree structure and the input speech signal level. Evaluate the distance to the
c ) 該評価された距離が最小である符号べク ト ルを決定し、 d ) 該決定された符号べク ト ルに付されるべき所望符号ビ ッ ト 長の符号を決定する各段階を具備する可変長音声符号化方法。  c) determining the code vector with the smallest estimated distance; d) determining the code of the desired code bit length to be attached to the determined code vector. A variable length speech coding method provided.
8. 前記差分符号べク ト ルの各々に線形予測合成フ ィ ルタのマ ト リ クスを乗じる段階をさ らに具備し、  8. further comprising the step of multiplying each of the difference code vectors by a matrix of a linear prediction synthesis filter;
前記段階 b ) において、 該マ ト リ クスが乗じられた差分符号べク ト ルを木構造上で順次加算及び減算する こ とによ って生成されるべ き線形予測合成フ ィ ルタ処理が施された符号べク ト ルと前記入力音 声信号べク トルとの距離が評価される請求の範囲第 7項記載の方法。 In the step b), the differential code vector multiplied by the matrix is used. A linear prediction synthesis filter to be generated by sequentially adding and subtracting tolls on a tree structure, and a code vector subjected to the filtering process and the input voice signal vector. 8. The method according to claim 7, wherein the distance is evaluated.
9. 前記段階 b ) は、 前記マ ト リ クスが乗じられた差分符号べク トルの各々 と前記入力音声信号べク ト ルとの相互相関を計算して木 構造上で順次加算及び減算する こ とによって該入力音声信号べク ト ルと前記線形予測合成フ ィ ルタ処理が施された符号べク トルとの相 互相関 R xcを計算し、 9. The step b) calculates a cross-correlation between each of the difference code vectors multiplied by the matrix and the input speech signal vector, and sequentially adds and subtracts them on a tree structure. As a result, a cross-correlation R xc between the input speech signal vector and the code vector subjected to the linear prediction synthesis filter processing is calculated,
該マ ト リ クスが乗じられた差分符号べク トルの各々の自己相関及 び異なるベク トルのすべての組み合わせの相互相関を計算して木構 The tree structure is calculated by calculating the autocorrelation of each differential code vector multiplied by the matrix and the cross-correlation of all combinations of different vectors.
' 造上で順次加算及び減算する こ とによ って該線形予測合成フ ィ ルタ 処理が施された符号べク トルの自己相関 R を計算し、 自己 Calculate the autocorrelation R of the code vector subjected to the linear prediction synthesis filter processing by sequentially adding and subtracting on the structure.
符号べク ト ルの各々について、 相互相関 R xcの 2乗を自己相関 R ccで除した Rxc 2 ZR ccを評価する こ とを舍み、 For each code vector, we evaluate R xc 2 ZR cc by dividing the square of the cross-correlation R xc by the auto-correlation R cc ,
前記段階 c ) は、 最大の R xc 2 ccの値を与える符号べク トル を入力音声信号べク トルとの距離が最小である符号べク トルである と決定する こ とを舍む請求の範囲第 8項に記載の方法。 The step c) includes determining that the code vector giving the maximum value of R xc 2 cc is the code vector having the minimum distance from the input speech signal vector. The method according to paragraph 8 above.
10. 前記マ ト リ クスが乗じられた差分符号べク トルのパワーの増 幅率を評価し、  10. Evaluate the power gain of the differential code vector multiplied by the matrix,
該評価されたパワーの増幅率の大きさの順に該マ ト リ タスが乗じ られた差分符号べク トルを並べ替える段階をさ らに具備し、  Rearranging the difference code vector multiplied by the matrix in order of the magnitude of the evaluated power amplification factor;
前記段階 b ) において、 該並べ替えた順序に従って木構造上の加 算及び減算が行われる請求の範囲第 9項に記載の方法。  10. The method according to claim 9, wherein in the step b), addition and subtraction on a tree structure are performed according to the rearranged order.
11. 前記並べ替えられたべク ト ルの中から評価されたパワーの増 幅率の大きさの順に所定個数のべク ト ルを選択する段階をさ らに舍 み、  11. A further step of selecting a predetermined number of vectors in the order of the magnitudes of the power amplification rates evaluated from the sorted vectors,
前記段階 b ) において、 該選択されたべク トルを対象と して木構 造上の加算及び減算が行われる請求の範囲第 1 0項に記載の方法。In the step b), a tree structure is selected for the selected vector. 10. The method according to claim 10, wherein synthetic addition and subtraction are performed.
12 . 予め与えられた符号べク ト ルの中で入力音声信号べク トルと の距離が最小である符号べク トルに割り 当てられた可変ビッ ト長の 符号により該入力音声信号べク ト ルを可変長符号化する可変長音声 符号化装置であって、 12. A variable bit length code assigned to the code vector having the shortest distance from the input voice signal vector among the code vectors given in advance, and the input voice signal vector A variable-length speech encoding device for encoding a file with variable length,
複数の差分符号べク トルを格納する手段と、  Means for storing a plurality of difference code vectors;
先頭から所望の符号ビッ ト長に応じた数の差分符号べク ト ルを木 構造上で順次加算及び減算する こ とによって生成されるべき符号べ ク トルと前記入力音声信号べク トルとの距離を評価する手段と、 該評価された距離が最小である符号べク トルを決定する手段と、 該決定された符号べク ト ルに付されるべき所望符号ビッ ト長の符 号を決定する手段とを具備する可変長音声符号化装置。  The difference between the code vector to be generated by sequentially adding and subtracting the number of difference code vectors corresponding to the desired code bit length from the head on the tree structure and the input speech signal vector. Means for estimating the distance, means for determining the code vector having the smallest estimated distance, and determining the code of the desired code bit length to be added to the determined code vector Variable length speech coding apparatus comprising:
13 . 前記差分符号ベク トルの各々に線形予測合成フ ィ ルタのマ ト リ クスを乗じる手段をさ らに具備し、  13. The apparatus further comprises means for multiplying each of the difference code vectors by a matrix of a linear prediction synthesis filter,
前記距離評価手段は、 該マ ト リ クスが乗じられた差分符号べク ト ルを木構造上で順次加算及び減算する こ とによって生成されるべき 線形予測合成フ ィ ルタ処理が施された符号べク トルと前記入力音声 信号べク トルとの距離を評価する請求の範囲第 1 2項記載の装置。  The distance estimating means is a code that has been subjected to linear prediction synthesis filter processing to be generated by sequentially adding and subtracting the difference code vector multiplied by the matrix on a tree structure. 13. The apparatus according to claim 12, wherein a distance between the vector and the input voice signal vector is evaluated.
1 4 . 前記距離評価手段は、 前記マ ト リ クスが乗じられた差分符号 べク トルの各々 と前記入力音声信号べク トルとの相互相関を計算し て木構造上で順次加算及び減算するこ とによって該入力音声信号べ ク トルと前記線形予測合成フ ィ ルタ処理が施された符号べク トルと の相互相関 R x cを計算する手段と、 14. The distance evaluation means calculates a cross-correlation between each of the difference code vectors multiplied by the matrix and the input speech signal vector, and sequentially adds and subtracts them on a tree structure. Means for calculating a cross-correlation Rxc between the input speech signal vector and the code vector subjected to the linear prediction synthesis filter processing,
該マ ト リ クスが乗じられた差分符号べク トルの各々の自己相関及 び異なるべク ト ルのすべての組み合わせの相互相関を計算して木構 造上で順次加算及び減算する こ とによって該線形予測合成フ ィ ルタ 処理が施された符号べク トルの自己相関 R c cを計算する手段と、 符号べク トルの各々 について、 相互相関 R xcの 2乗を自己相関 R ccで除した R xc 2 /R ccを評価する手段を舍み、 By calculating the autocorrelation of each of the difference code vectors multiplied by the matrix and the cross-correlation of all combinations of different vectors, and sequentially adding and subtracting them on a tree structure. Means for calculating an autocorrelation R cc of the code vector subjected to the linear prediction synthesis filter processing; For each of the code vectors , provide a means to evaluate R xc 2 / R cc by dividing the square of the cross-correlation R xc by the auto-correlation R cc ,
前記符号べク ト ル決定手段は、 最大の R xc 2 / R ccの値を与える 符号べク トルを入力音声信号べク トルとの距離が最小である符号べ ク トルである と決定する手段を舍む請求の範囲第 1 3項に記載の装 置。 The code base click preparative Le determining means maximum R xc 2 / R cc means the distance the code base-vector giving the value as the input speech signal base-vector is determined to be the code base-vector is the minimum of 14. The device according to claim 13, wherein the device comprises:
15. 前記マ ト リ クスが乗じられた差分符号べク トルのパワーの増 幅率を評価する手段と、  15. means for evaluating the power gain of the differential code vector multiplied by the matrix;
該評価されたパワーの増幅率の大きさの順に該マ ト リ クスが乗じ られた差分符号べク トルを並べ替える手段をさ らに具備し、  Means for rearranging the difference code vector multiplied by the matrix in the order of the magnitude of the evaluated power amplification factor;
前記距離評価手段は、 該並べ替えた順序に従って木構造上の加算 及び減算を行う請求の範囲第 1 4項に記載の装置。  15. The apparatus according to claim 14, wherein said distance evaluation means performs addition and subtraction on a tree structure according to the rearranged order.
16. 前記並べ替えられたべク トルの中から評価されたパワーの増 幅率の大きさの順に所定個数のべク トルを選択する手段をさ らに舍 み、  16. There is further provided a means for selecting a predetermined number of vectors in the order of the magnitudes of the power amplification rates evaluated from the rearranged vectors,
前記距離評価手段は、 該選択されたべク トルを対象として木構造 上の加算及び減算を行う請求の範囲第 1 5項に記載の装置。  16. The apparatus according to claim 15, wherein the distance evaluation unit performs addition and subtraction on a tree structure with respect to the selected vector.
16. 前記符号べク ト ルの各々にはその 1 ビッ トが欠落したら木構 造上その親に相当する符号べク トルに対応するよう に符号が割り 当 てられる請求の範囲第 7項に記載の方法。  16. A claim according to claim 7, wherein a code is assigned to each of said code vectors so as to correspond to the code vector corresponding to its parent in the tree structure if one bit is missing. The described method.
17. 前記符号べク トルの各々にはその 1 ビッ トが欠落したら木構 造上その親に相当する符号べク トルに対応するよう に符号が割り 当 てられる請求の範囲第 1 2項に記載の装置。  17. A claim according to claim 12, wherein a code is assigned to each of said code vectors so as to correspond to a code vector corresponding to its parent in a tree structure if one bit is missing. The described device.
PCT/JP1993/001323 1992-09-16 1993-09-16 Speech encoding method and apparatus WO1994007239A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP50796994A JP3531935B2 (en) 1992-09-16 1993-09-16 Speech coding method and apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP24649192 1992-09-16
JP4/246491 1992-09-16

Publications (1)

Publication Number Publication Date
WO1994007239A1 true WO1994007239A1 (en) 1994-03-31

Family

ID=17149194

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1993/001323 WO1994007239A1 (en) 1992-09-16 1993-09-16 Speech encoding method and apparatus

Country Status (2)

Country Link
JP (1) JP3531935B2 (en)
WO (1) WO1994007239A1 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978758A (en) * 1996-07-10 1999-11-02 Nec Corporation Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output
WO2000016485A1 (en) * 1998-09-15 2000-03-23 Motorola Limited Speech coder for a communications system and method for operation thereof
DE10101121A1 (en) * 2001-01-05 2002-07-11 Deutsche Telekom Ag Message playback method for mailbox using telephone connected to mailbox and playing back message at different speeds controlled by program on computer
JP2010181889A (en) * 1998-08-24 2010-08-19 Mindspeed Technologies Inc Selection of scalar quantization (sq) and vector quantization (vq) for speech encoding
US10984441B2 (en) * 2013-03-13 2021-04-20 Eversight, Inc. Systems and methods for intelligent promotion design with promotion selection
US11734711B2 (en) 2013-03-13 2023-08-22 Eversight, Inc. Systems and methods for intelligent promotion design with promotion scoring
US11941659B2 (en) 2017-05-16 2024-03-26 Maplebear Inc. Systems and methods for intelligent promotion design with promotion scoring

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5912499A (en) * 1982-07-12 1984-01-23 松下電器産業株式会社 Voice encoder
JPS61184928A (en) * 1985-02-12 1986-08-18 Nippon Telegr & Teleph Corp <Ntt> Sound signal extracting system
JPH0255400A (en) * 1988-08-22 1990-02-23 Matsushita Electric Ind Co Ltd Voice coding method
JPH04344699A (en) * 1991-05-22 1992-12-01 Nippon Telegr & Teleph Corp <Ntt> Voice encoding and decoding method
JPH04352200A (en) * 1991-05-30 1992-12-07 Fujitsu Ltd Speech encoding system
JPH0588698A (en) * 1991-09-30 1993-04-09 Nec Corp Code drive lpc speech encoding device
JPH05158500A (en) * 1991-12-09 1993-06-25 Fujitsu Ltd Voice transmitting system
JPH05210399A (en) * 1991-05-20 1993-08-20 Nokia Mobile Phones Ltd Digital audio coder
JPH05232996A (en) * 1992-02-20 1993-09-10 Olympus Optical Co Ltd Voice coding device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5912499A (en) * 1982-07-12 1984-01-23 松下電器産業株式会社 Voice encoder
JPS61184928A (en) * 1985-02-12 1986-08-18 Nippon Telegr & Teleph Corp <Ntt> Sound signal extracting system
JPH0255400A (en) * 1988-08-22 1990-02-23 Matsushita Electric Ind Co Ltd Voice coding method
JPH05210399A (en) * 1991-05-20 1993-08-20 Nokia Mobile Phones Ltd Digital audio coder
JPH04344699A (en) * 1991-05-22 1992-12-01 Nippon Telegr & Teleph Corp <Ntt> Voice encoding and decoding method
JPH04352200A (en) * 1991-05-30 1992-12-07 Fujitsu Ltd Speech encoding system
JPH0588698A (en) * 1991-09-30 1993-04-09 Nec Corp Code drive lpc speech encoding device
JPH05158500A (en) * 1991-12-09 1993-06-25 Fujitsu Ltd Voice transmitting system
JPH05232996A (en) * 1992-02-20 1993-09-10 Olympus Optical Co Ltd Voice coding device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978758A (en) * 1996-07-10 1999-11-02 Nec Corporation Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output
JP2010181889A (en) * 1998-08-24 2010-08-19 Mindspeed Technologies Inc Selection of scalar quantization (sq) and vector quantization (vq) for speech encoding
WO2000016485A1 (en) * 1998-09-15 2000-03-23 Motorola Limited Speech coder for a communications system and method for operation thereof
DE10101121A1 (en) * 2001-01-05 2002-07-11 Deutsche Telekom Ag Message playback method for mailbox using telephone connected to mailbox and playing back message at different speeds controlled by program on computer
US10984441B2 (en) * 2013-03-13 2021-04-20 Eversight, Inc. Systems and methods for intelligent promotion design with promotion selection
US11699167B2 (en) 2013-03-13 2023-07-11 Maplebear Inc. Systems and methods for intelligent promotion design with promotion selection
US11734711B2 (en) 2013-03-13 2023-08-22 Eversight, Inc. Systems and methods for intelligent promotion design with promotion scoring
US11941659B2 (en) 2017-05-16 2024-03-26 Maplebear Inc. Systems and methods for intelligent promotion design with promotion scoring

Also Published As

Publication number Publication date
JP3531935B2 (en) 2004-05-31

Similar Documents

Publication Publication Date Title
JP3112681B2 (en) Audio coding method
JP4374448B2 (en) Multi-channel signal encoding method, decoding method thereof, apparatus, program and recording medium thereof
CA2430111C (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
JPH03211599A (en) Voice coder/decoder with 4.8 bps information transmitting speed
JP3435674B2 (en) Signal encoding and decoding methods, and encoder and decoder using the same
US9972325B2 (en) System and method for mixed codebook excitation for speech coding
JP3344962B2 (en) Audio signal encoding device and audio signal decoding device
EP0488803B1 (en) Signal encoding device
ES2145737T5 (en) DIGITAL VOICE ENCODER WITH LONG-TERM PREDICTOR IMPROVED BY SUBMISSION RESOLUTION.
US6397176B1 (en) Fixed codebook structure including sub-codebooks
JPWO2006075605A1 (en) Long-term predictive encoding method, long-term predictive decoding method, these devices, program thereof, and recording medium
WO1994007239A1 (en) Speech encoding method and apparatus
US5864650A (en) Speech encoding method and apparatus using tree-structure delta code book
KR100465316B1 (en) Speech encoder and speech encoding method thereof
JP2626492B2 (en) Vector quantizer
JP3285185B2 (en) Acoustic signal coding method
JP3579276B2 (en) Audio encoding / decoding method
JP2796408B2 (en) Audio information compression device
JP3071012B2 (en) Audio transmission method
JP3462958B2 (en) Audio encoding device and recording medium
JP2002221998A (en) Method, device and program for encoding and decoding acoustic parameter and voice
JP2897940B2 (en) Speech linear prediction parameter coding method
JP3010655B2 (en) Compression encoding apparatus and method, and decoding apparatus and method
JP3428595B2 (en) Audio coding method
JP4228630B2 (en) Speech coding apparatus and speech coding program

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

ENP Entry into the national phase

Ref country code: US

Ref document number: 1994 244068

Date of ref document: 19940516

Kind code of ref document: A

Format of ref document f/p: F