WO1996011468A1 - Procede de codage de vecteurs et codeur/decodeur associe - Google Patents

Procede de codage de vecteurs et codeur/decodeur associe Download PDF

Info

Publication number
WO1996011468A1
WO1996011468A1 PCT/JP1995/001989 JP9501989W WO9611468A1 WO 1996011468 A1 WO1996011468 A1 WO 1996011468A1 JP 9501989 W JP9501989 W JP 9501989W WO 9611468 A1 WO9611468 A1 WO 9611468A1
Authority
WO
WIPO (PCT)
Prior art keywords
vectors
vector
gain
weighted
representative
Prior art date
Application number
PCT/JP1995/001989
Other languages
English (en)
French (fr)
Inventor
Akitoshi Kataoka
Jotaro Ikedo
Original Assignee
Nippon Telegraph And Telephone Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph And Telephone Corporation filed Critical Nippon Telegraph And Telephone Corporation
Priority to US08/793,133 priority Critical patent/US5825311A/en
Priority to DE69527078T priority patent/DE69527078T2/de
Priority to US09/691,862 priority patent/USRE38279E1/en
Priority to KR1019970702269A priority patent/KR100215709B1/ko
Priority to AU35782/95A priority patent/AU682128B2/en
Priority to EP95932940A priority patent/EP0786762B1/en
Priority to CA 2201858 priority patent/CA2201858C/en
Publication of WO1996011468A1 publication Critical patent/WO1996011468A1/ja
Priority to FI971373A priority patent/FI118104B/fi
Priority to HK98100715A priority patent/HK1001636A1/xx

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/02Conversion to or from weighted codes, i.e. the weight given to a digit depending on the position of the digit within the block or code word
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances

Definitions

  • the present invention is used for encoding voice, image, and other various information, and is particularly suitable for encoding when information is transmitted using a transmission path in which a transmission code error is likely to occur, such as a mobile radio transmission path.
  • a vector coding method for coding a vector using a plurality of codebooks including a plurality of representative vectors, an encoder using the same, and decoding the vector-coded code It relates to a decoder.
  • I from CB 1 and one representative vector z 2j from codebook CB2 are taken out respectively, and these representative vectors Zi are added by the synthesis unit 3 to obtain a vector sum yu z i + z, the composite representative vector y! j and the input vector from input terminal 4
  • the distance d (X, yi i) from X is calculated by the distance calculation unit 5 as distortion.
  • the control unit 6 controls the representative vector selection switches 7 and 8 for the codebooks CB1 and CB2, respectively, so that the output d (X, yn) of the distance calculation unit 5 is minimized.
  • Search for vector i, z 2j The labels i and j of the representative vectors ⁇ 1; and zsj at the minimum distance are output to the output terminal 9 as encoded output.
  • the control unit 12 controls the representative vector selection switches 13 and 14 according to the labels i and j in the input code from the input terminal 11 to control the codebook CB3,
  • the codebooks CB3 and CB4 are the same as the codebooks CB1 and CB2.
  • the storage capacity of the codebook that stores the representative vector can be saved, and when applied to a transmission line with many transmission line code errors, two labels are used by the decoder.
  • This method has the advantage that it is less susceptible to code errors because it uses vector synthesis.
  • An object of the present invention is to provide a vector encoding method in which even if an error occurs in an input code to a decoder, a large distortion does not easily occur in a decoding result.
  • Another object of the present invention is to provide a vector coding method in which even if an error occurs in an input code, large distortion is hardly generated in a decoding result, and a calculation amount (processing amount) is small.
  • the representative vectors from the respective codebooks are added, and the distance between the added combined representative vector and the input vector is calculated. Is calculated by multiplying each representative vector to be added by a predetermined different weighting factor vector, and the weighting factor vectors are mutually different for each codebook. Each of the different element positions has a maximum coefficient.
  • the multiplication of the weight coefficient vector is performed on the representative vector extracted from the codebook, or the weighted representative vector preliminarily multiplied by the weight coefficient vector is stored in the codebook.
  • a set of weighted representative vectors obtained by multiplying the weighting factor vector for each codebook is represented by a straight line. Approximately, project the input vector onto each approximated straight line, select a plurality of weighted representative vectors around the projection for each codebook, and multiply these representative weighted coefficients by the selected multiple weighting coefficients. A synthetic representative vector is created from the vectors, and the vector with the smallest distance from the input vector is determined.
  • a decoder for a vector-encoded code according to any one of the first and second aspects, wherein the decoder includes a representative vector extracted from each codebook.
  • the weighting coefficient vector is multiplied by the multiplication means, and the multiplied weighted representative vector is added and synthesized to obtain a reproduction vector.
  • Fig. 1A is a block diagram showing the configuration of an encoder using the conventional vector coding method
  • Fig. 1B is a block diagram showing a conventional decoder for the encoder of Fig. 1A
  • Fig. 2A Is a block diagram showing an example of an encoder to which the present invention is applied
  • FIG. 2B is a block diagram showing an embodiment of a decoder according to the present invention.
  • FIG. 3A is a diagram showing each representative vector of codebook C B 1;
  • FIG. 3 B is a diagram showing a base-vector multiplied by the weighting factor base-vector Cao Representative base-vector
  • FIG. 3 C is a diagram showing each representative vector z 2 i codebooks CB 2
  • Figure 3D shows a vector obtained by multiplying each representative vector z 2 i by the weight coefficient vector first 2 .
  • FIG. 3E is a diagram showing an example of a synthesis vector and an error synthesis vector in the present invention
  • Fig. 3F is a diagram showing an example of a synthesis vector and an error synthesis vector in the conventional method
  • Fig. 4 is a diagram of the present invention.
  • FIG. 4 is a diagram showing a set of weighted representative vectors for explaining a vector coding method and an approximate straight line thereof;
  • Fig. 5 is a block diagram showing an example of an encoder in which the present invention is applied to CELP
  • Fig. 6A is a diagram showing a first codebook storing weighted gain vectors as a table
  • Fig. 6B is a weighted gain.
  • FIG. 7 is a diagram showing the second codebook storing the vectors as a table
  • FIG. 7 is a diagram showing the weighted gain vectors of FIGS. 6A and 6B on coordinates
  • FIG. 8 is a block diagram showing an encoder in which the present invention is applied to quantization of a noise excitation vector.
  • Fig. 9 is a block diagram showing an encoder in which the present invention is applied to quantization of a pitch excitation vector.
  • Figure 10 is proc diagram showing an encoder of this invention is applied VS ELP, 11 and when using the gain g P, g c Nobeku one gain codebook torr coding in FIG. 5, two gain A graph showing the segmental S / N of the decoded synthesized speech with respect to the channel error rate when using a codebook,
  • Fig. 12 is a graph showing the MOS of the decoded and synthesized speech with respect to the channel error rate for the two cases of Fig. 11 by the equivalent Q value,
  • Figure 13 is the gain g P in Fig. 5, g in the vector encoding the c, 2 two decoded synthetic speech for transmission channel error rate in the case of the present invention used to put weighted gain codebook segment barrel S / N FIG.
  • multipliers 21 and 22 are inserted between the representative vector selection switches 7 and 8 and the vector synthesis unit 3, respectively, and the codebooks CB1 and CB2 are inserted.
  • Multipliers are multiplied by multipliers 21 and 22 for each corresponding element.
  • At least one of the L elements constituting each weighting coefficient vector and Ca 2 is different from at least one of the other elements.
  • the weight coefficient vector adventure adventure 2 for each codebook CB 1, CB 2 are different from each other. More preferably the base each weight coefficient-vector and adventure 2, the values Wi 1 factor to be multiplied to each of the elements of the representative base-vector, Wi 2, ⁇ ⁇ ⁇ , WLL following
  • the weighting factor vector 2 is selected so as to be a constant multiple of the unit matrix as follows ( k is a predetermined constant. In this manner, each of the representative vectors ⁇ and Z2 has its own weighting factor.
  • the vector vectors iZlj and 2Z2i multiplied by the vector vectors 1 and 2 are vector-synthesized by the vector synthesis unit 3, and the distance between the synthesized vector and the input vector X is minimized. in such so that the representative vector Z codebooks CB1, CB2, z 2j are searched.
  • the distribution is off-axis.
  • the weighted representative vector Zi i may change to any other weighted representative vector ', but since the distribution of ZH is biased, the composite vector and y'
  • the value of the two-dimensional component of the error vector Ay yu—yu 'is relatively small no matter how i changes.
  • the weight coefficient is not multiplied
  • the composite vectors are y and yi j ′, respectively.
  • the representative vector can change to any representative vector in codebook CB1. Zu, z 12 ... are widely distributed, so the error vector between the combined vector yu and the changed combined vector y ′ is the first-dimensional component. Both two-dimensional components can be quite large.
  • FIG. 2B shows an embodiment of the decoder, in which labels i and j and weighting coefficient vectors in and W2 are given from the encoder of FIG. Codebooks CB3 and CB4, which are the same as codebooks CB1 and CB2 in Fig. 2A, respectively, are provided.
  • the representative vectors of the input code labels i and j are stored in codebooks CB3 and CB3.
  • multipliers 24 and 25 are inserted between the switches 13 and 14 and the vector combining unit 17, respectively, and are combined in the encoder of FIG. 2A.
  • the representative vector z 2j extracted from the codebooks CB3 and CB4 is multiplied by the same weighting coefficient vector W2 as that multiplied by the multipliers 21 and 22, respectively, and the multiplied representative vector ⁇ , w 2 z 2j is synthesized by the vector synthesizing unit 17 to obtain a reproduction vector yi j .
  • FIG. 2A sign-book CB 1 in 2B, CB3 and CB2, CB 4 weighting coefficient base click to advance each representative vector i and z 2j in torr adventure i and adventure 2 May be stored, and the multipliers 21, 22, 24, and 25 may be omitted.
  • To-vector X base input signal in the description of FIG. 2 A all representative vectors Zii codebooks CB1, the CB2, the combination of z 2 i asked for it it synthetic vector, computes the distortion, minimal
  • the case of determining the set of representative vectors i, Z 2 ) that gives distortion has been described.
  • the required number of operations increases rapidly as the size of the codebooks CB1 and CB2 increases. Therefore, in advance select few representative base-vector Zi "Z 2], and reduce the amount of calculation by determining a representative base-vector consisting among them the strain minimum, therefore, the operation time
  • the method for shortening will be described below.
  • codebook CB 1 has eight representative vectors
  • codebook CB 2 has sixteen representative vectors
  • each representative vector is represented by a two-dimensional vector.
  • the eight representative vectors obtained by multiplying them by X are shown in Fig. 4 with X marks
  • the input signal vector X is composed of a predetermined number of signal samples per frame, here two samples.
  • a set of weighted representative vectors (set of X marks) of codebook CB 1 is approximated by a straight line 27. That straight line 27 distance between this and each X mark (or the two-dimensional axis direction distance in direction) Du, D12, ..., are determined so that the sum of D 18 is minimized.
  • the weighted representative vector group of codebook CB2 (the set of triangles) is approximated by a straight line 28. The straight line 28 is determined such that the sum of the distance between the mark and each mark (or the distance in the first dimension axis direction) Dai, D 22 ,..., D 216 is minimized.
  • the input vector X is projected onto approximate straight lines 27 and 28, respectively, and a plurality of weighted representative vectors around the projection are selected. That is, the value of the horizontal axis of the intersection of the straight line 29 and the straight line 27 passing through the input signal vector X and parallel to the approximate straight line 28, that is, the value of the first dimension p, is obtained.
  • the first element (the first element) is compared with the first dimension value (the value of the first element) of the X-weighted representative vector having a wide distribution, and the difference is small. Select a subgroup of the three weighted representative vectors. In this way, the reserve selection for codebook CB1 is performed.
  • the value of the vertical axis of the intersection P2 of the straight line 31 passing through the input signal vector X and the straight line 31 parallel to the approximate straight line 27 and the approximate straight line 28, that is, the value of the second dimension p2y is obtained.
  • the value p 2y is compared with the 2D value (the value of the 2nd element) of the weighted representative vector marked with ⁇ , which has a wide distribution in the 2nd dimension (the 2nd element). from what is small, a predetermined number, for example three select a subgroup of H 2 weighted representative base-vector, the preliminary selection for codebook CB 2.
  • a set of weighted representative vectors that minimizes the distance between the combined vector and the input signal vector X is searched.
  • the number of dimensions of the representative vector is also M.
  • Each of the M weighting coefficient vectors has the largest coefficient at a different element position (ie, dimension), and its dimension is emphasized by multiplying with the representative vector compared to the other dimensions. .
  • FIG. 5 shows an embodiment in which the encoding method according to the present invention is applied to speech encoding of the Code-Excited Desir Prediction Coding (CEL P) method.
  • CELP Code-Excited Linear Prediction
  • the pitch excitation vector selected from the pitch excitation source codebook and the noise excitation vector selected from the noise excitation source codebook are combined by giving a gain, and the resultant vector is calculated.
  • the two vectors that minimize the distortion of the synthesized speech obtained by applying the synthesized speech to the synthesis filter as the excitation signal and the two gains for them are determined, and the labels of these vectors and the sign of the gain are determined by the synthesis filter. Output together with the filter coefficient as the encoding result of the input speech.
  • the input audio signal X from the input terminal 34 is sampled at a fixed It is represented as a vector given as a series of digital sample values consisting of a fixed number during a time period.
  • the input signal vector X for each frame is subjected to, for example, linear prediction analysis in the filter coefficient determination unit 35 to obtain a linear prediction coefficient.
  • a spectrum shape parameter is obtained from the linear prediction coefficient, and this is quantized, for example, by the filter coefficient quantization unit 36, and the quantized value is set as a filter coefficient of the synthesis filter 37.
  • the pitch excitation source code book 39 a series of sample values of waveforms each containing a different pitch period component are labeled and stored as pitch excitation vectors.
  • a series of sample values of various noise waveforms are labeled and stored as noise excitation vectors in the noise excitation source codebook 43, respectively.
  • Each pitch excitation vector and each noise excitation vector stored in the pitch excitation source codebook 39 and the noise excitation source codebook 43 consist of elements equal to the number of samples in one frame.
  • the control unit 6 controls the selection switch 38, selects one of a plurality of pitch excitation vectors from the pitch excitation source codebook 39, supplies it to the gain applying unit 41, and multiplies the gain by an arbitrary gain. , Provided to the synthesis filter 37.
  • This excitation signal vector E is applied to the synthesis filter 37 to calculate the distortion of the synthesized voice with respect to the input voice signal in the same manner. Similarly, the distortion is calculated for each of the other noise excitation vectors in the noise excitation source codebook 43, and the noise excitation vector with the minimum distortion is determined.
  • the pitch excitation vector g P Cp to which the gains g P and g c have been applied by the gain applying units 41 and 46 and the noise excitation vector g c C R are added by the adder 47 and excited to the synthesis filter 37.
  • the difference between the synthesized voice X and the input voice signal X from the input terminal 34 is obtained by a subtractor 48, and the difference is calculated by the distortion calculator 5 as the distortion of the synthesized voice X with respect to the input signal X.
  • D II X— i ll 2 is calculated.
  • the control unit 6 controls the selection Suitsuchi 7, 8 to control the selection of each gain vector of the gain codebook CB 1, CB2, each gain vector Z and the selected, z 2 j to multiplier 21, 22 , And multiplies by different weight coefficient vectors Wi and 2 respectively, and supplies the result to the vector combining unit 3.
  • the weight coefficient vector W2 is a two-dimensional vector that satisfies Equation (3), and the two elements of each vector are different from each other.
  • codebook CB1 Select the gain vectors of codebooks CB1 and CB2 so that the distortion calculated by distortion calculation unit 5 is minimized. If the gain vector that minimizes c distortion is obtained, codebook CB1, The gain label indicating the selected gain vector of CB2 and the pitch excitation vector and noise excitation vector of the previously determined pitch excitation source codebook 39 and noise excitation source codebook 43 are shown. The label and the label representing the filter coefficient set in the synthesis filter 37 are It is output from the code output unit 49 as a result of encoding the input audio signal X.
  • the distortion was calculated for all combinations of gain vectors selected from the gain codebooks CB 1 and CB 2 and the set of gain vectors that gave the minimum distortion was determined.
  • a plurality of candidates for the gain vectors Z and z2i are selected in advance, and the pitch excitation vector previously determined is determined only for all combinations of the preselected gain vectors.
  • the distortion in combination with the torque CP and the noise excitation vector CR may be calculated to determine the set of gain vectors that gives the minimum distortion.
  • the gain vectors ⁇ , z 2 i and the weight coefficient vectors of the gain codebooks CB 1 and CB 2 are the same as in the case of FIG. Ss .W) and the weighted gain vector
  • the weighted gain codebooks CB1 'and CB2' which are calculated in advance, are created, for example, as shown in Tables I and II shown in FIGS. 6A and 6B, and the gain codebooks CB1 and CB2 in FIG. Instead, multipliers 21 and 22 are omitted.
  • FIG. 7 respectively all two-dimensional weighted base click preparative Le y 2 i weighted gain codebook CB2 'as points on a two-dimensional coordinate circles, a group of those points determined in advance straight line closest L 2 in the least squares method.
  • the gains of the gain applying sections 41 and 46 are arbitrarily determined.
  • the pitch excitation vector with the minimum distortion is determined, and then the noise excitation vector with the minimum distortion is determined.
  • the speech synthesis output X of the synthesis filter 37 is So the synthesis at that time
  • the distortion D of audio X with respect to input audio signal X is
  • G P distortion D is minimum, for determining the g c, the above equation respectively g P, when partially differentiated by gc the following equation is obtained.
  • the gain set ⁇ g P , gc ⁇ obtained here is the combination that minimizes the distortion D.
  • the set was plotted as a point Po in Fig. 7 as the optimum gain vector, respectively the straight line L 2 from Po terms of this, the draw a straight line parallel, 'obtaining straight intersection Pi and L 2, a? 2 .
  • a plurality of weighted gain vectors yn ym.yi i2 ) whose values in the vertical axis are in the vicinity of the point Pi are selected from the codebook CB1 '(Table I in FIG. 6A) and set as a first subgroup.
  • the selection method (4 from Table I with respect to for example the points Pi, 8 one from Table II with respect to the point P 2), respectively in this order close to the point P 2 a predetermined number for selecting a weighted gain base-vector of.
  • the point Pi the distance was predetermined respectively around the P 2 ch, selects the weighted gain base-vector within the range of d 2.
  • the gain vector corresponding to a predetermined number is preliminarily selected from gain codebook CB1 from the smaller value, and preselection is similarly performed for gain codebook CB2.
  • the gain vector corresponding to a predetermined number, for example, three, from the smaller value is preliminarily selected from the gain codebook CB2. Only for each of these three preselected gain vectors, Zli and Z2j,
  • the distortion for the input audio signal X is minimized for all the pairs selected one by one from each group.
  • the optimal first and second gains g P and g c are determined, and the previously determined pitch excitation vector and noise excitation vector combination and the combined gain vector are determined.
  • G P , gc the label of the pitch excitation vector in the pitch excitation source code book 39 and the label of the noise excitation vector in the noise excitation source code book 43
  • the gain vector labels in the gain codebooks CB1 'and CB2' (or the gain codebooks CB1 and CB2) and the quantized labels of the filter coefficients are output as the encoding results for the input speech vector X.
  • the multiplier 21, 22 weighting coefficient vector adventure adventure 2 for multiplying a its those of the corresponding elements, for example, preparative ratio w 21 2: If increases from 1, transmission to the distortion of the decoded result The effect that the influence of the path error does not become relatively large starts to appear, but even if the ratio is 10: 1 or more, the effect of improving the distortion due to the transmission path error does not become significant. On the contrary, the distortion of the decoding result in the case where there is no transmission path error, that is, in the normal state, becomes large.
  • the noise excitation source codebook 43 is composed of a plurality of codebooks.
  • the vector coding method may be applied.
  • the noise excitation source codebook is composed of two codebooks 43a and 43b, and one noise excitation vector is selected from each of these codebooks 43a and 43b.
  • the selected noise excitation vector is multiplied by weight coefficient vectors w Re , and Rb by weight coefficient multipliers 51 a and 51 b, respectively.
  • These weight coefficient vectors Ra and w Rb are selected in the same relationship as the weight coefficient vector w 2 described in FIG. 2A.
  • the outputs of the multipliers 51 a and 5 lb are added in the noise vector synthesis unit 52 and supplied to the gain applying unit 46 as a noise excitation vector selected from the noise excitation source codebook 43 in FIG. .
  • the control of the control unit 6 deviates the synthesized speech signal X from the synthesis filter 37 from the noise excitation source codebooks 43a and 43b so that the distortion of the input speech signal X is minimized. Select the noise excitation vector.
  • the present invention can be applied to the coding of the pitch excitation vector in the configuration of FIG. 5 as well as the coding of the noise excitation vector. That is, as shown in FIG. 9, the pitch excitation source codebook is composed of two codebooks 39a and 39b, one pitch excitation vector is selected from each of these codebooks 39a and 39b, and a weight coefficient multiplier is selected. 53 a, 53 b Desolation respectively weighting coefficient vector adventure Pa, multiplied by w Pb, by adding these multiplied output with a pitch excitation downy click preparative Le synthesizing unit 54, the pitch excitation source base click in FIG It is supplied to the multiplier 41 as a pitch excitation vector selected from the torque codebook 43. Multiplier 51 a, 51 b to grant El weighting coefficient vector adventure Pa, w Pb is that has been determined in the same manner as the weighting coefficient adventure 2 in FIG. 2 A o
  • the filter coefficient quantization unit 36 may be configured in the same manner as in FIG. 2A.
  • the representative vector waveform vectors are stored in the codebooks CB1 and CB2, respectively, and the weighting factor vector and W2 are respectively stored in the representative vector waveform vector selected from these. Multiply and combine in the vector combining unit 3, and the distance between the combined representative spectrum waveform vector and the input spectrum waveform vector from the filter coefficient determination unit 35 (Fig. 5) is minimized.
  • the representative vector waveform vector selected from codebooks CB1 and CB2 may be searched.
  • FIG. 10 shows a main part of the embodiment.
  • a number of base vector codebooks 43! ⁇ 43-, and one noise vector is stored in each prescribed vector codebook.
  • Each of these noise excitation base-vector of all basis base vector codebook 43i ⁇ 43 n are, respectively Re polarity control unit 56 i ⁇ 56 n Desolation positive or negative polarity attached, these polarity controlled noise excitation
  • the vectors are multiplied by weighting factors by weighting factor multipliers 57 to 57n.
  • the outputs of these multipliers are added by an adding circuit 58, and the added output is supplied to the multiplier 46 in FIG.
  • Weighting factor multipliers 57 each weight coefficient base click of ⁇ 57n torr adventure R 1 to w R - weighting factor base-vector Wl described in FIG. 2 A, there is a similar relationship with the adventure 2.
  • the base vector codebooks 43 to 43n and the polarity control units 56i to 56 »in FIG. 10 can be used instead of the noise excitation source codebook 43 in FIG. Good.
  • the pitch excitation source codebook 39 in FIG. 5 generates a pitch excitation vector adaptively from the pitch period obtained by analyzing the input speech signal and the excitation signal vector E of the previous frame. It may be a codebook.
  • This adaptive codebook may be used as pitch excitation source codebook 39 even when the configuration shown in FIG. 8 or FIG. 10 is used instead of noise excitation source codebook 43 in FIG.
  • vector coding of speech signals, vector coding of spectrum waveform parameters, vector coding of pitch excitation source codebook, and vector coding of noise excitation source codebook The present invention can be applied to any combination at the same time.
  • Codebook CB 1 each of the representative base click preparative Le each weighting coefficient base-vector Wi in CB 2 in FIG. 2 A, as described above, pre-multiplying the weighted representative base-vector adventure the adventure 2>, adventure 2 Alternatively , z 2i may be stored, and the multipliers 21 and 22 may be omitted.
  • the codebooks CB3 and CB4 have weighted representative vectors iZ, The first 2 z 2 i may be stored, and the multipliers 24 and 25 may be omitted.
  • weighted gain vectors may be stored in advance in gain codebooks CB1 and CB2, and multipliers 21 and 22 may be omitted.
  • FIGS. 8 and 9 weighted vectors are stored in codebooks 43a, 43b and 39a, 39b, respectively, and multipliers 51a, 51b and 53a, 53b are omitted. May do it.
  • the representative vectors are extracted from the two codebooks and the vectors are synthesized, but the present invention is also applied to the case where the representative vectors are extracted from the three or more codebooks and the vectors are synthesized. be able to.
  • the present invention can be applied to encoding of general audio signals as well as audio signals.
  • each 7-bit label specifies one two-dimensional gain vector.
  • One element of the two-dimensional vector read from the gain codebook is used as the gain gp for the pitch excitation vector, and the other element is used as the gain gc for the noise excitation vector.
  • the codebook CB 1 is provided with 2 3 two-dimensional base-vector specified by label 3 bits Bok, 2 4 two-dimensional base click the codebook CB2 designated by the label of 4 bits torr is provided, respectively Rekara selected base-vector is the one two-dimensional synthetic base-vector are added, one of the elements of the composite base-vector is used as the gain g P, the other elements Used as gain.
  • Fig. 11 shows the case where the speech is coded by applying cases (A) and (B) in Fig. 5, and the segmentation of the received decoded speech with respect to the error rate when a transmission line error occurs in the gain label in the coded output.
  • S / N measurement results are shown by curves All and B11, respectively.
  • the segmental S / N is obtained by averaging the S / N of each frame over several minutes, for example.
  • Using two codebooks curve B11
  • Figure 12 shows the case where the subjective evaluation (MOS: mean opinion scores) of the decoded speech with respect to the transmission path error rate of the gain label in the case of Fig. 11 by the general public 24 is converted to the equivalent Q value, and each curve A12 , B12. From this figure, it can be seen that the use of two codebooks is superior to the channel error rate in terms of the transmission path error rate. The difference is large.
  • MOS mean opinion scores
  • Fig. 13 shows the measured segmental S / N of the decoded speech obtained for the channel error rate for the case (C) to which the present invention is applied in the same manner as in Fig. 11 as curve C13, and the curve for case). Shown in comparison with B11.
  • the S / N of the decoded synthesized speech with respect to the channel error rate is superior, and the difference in S / N shown in Figs. 11 and 12 greatly affects the equivalent Q value. From this fact, it is presumed that when the present invention that weights two codebooks is applied, the equivalent Q value can be greatly improved compared to the case where two codebooks are used without weighting.
  • each codebook vector approaches each of the L-dimensional coordinates with a different L-axis coordinate using L weighting factor vectors (ie, element values in other dimensions).
  • the signal is encoded so that the distortion is minimized by the set of vectors weighted for each codebook, and the weighting vector corresponds to each weighted vector.
  • a plurality of weighted vectors of each codebook are preliminarily selected, and distortion due to coding is obtained only for those selected weighted vectors.
  • the amount of calculation in the encoding process is significantly reduced, and encoding can be performed in a short time.
  • the present invention can also be applied to so-called CELP and VSELP speech coding methods, in which case, vector coding of spectrum waveform parameters, vector coding of vectors, and vector coding of each codebook. Each of them can be applied alone or in combination for encoding.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

明細書
べク トル符号化方法及びそれを使った
符号化器及び復号化器
技術分野
この発明は音声、 画像、 その他の各種情報の符号化に利用され、 特に移動無線 伝送路のように伝送符号誤りが生じ易い伝送路を用いて情報を伝送する場合の符 号化に適し、 入力べク トルを複数の代表べク トルからなる符号帳の複数を用いて 符号化するべク トル符号化方法及びそれを使った符号化器とそのべク トル符号化 された符号を復号化する復号化器に関する。
伝送路符号誤りの多い伝送路を通してべク トルを伝送する方法としては、 代表 べク トルを符号誤りを考慮して設定する方法や、 代表べク トルにラベルを付与す る際に符号誤りを考慮する方法等がある。 これらの方法は、 Kumazawa, asahara, Namekawa:"A Communication of Vector Quantizers for Noisy Channels "ヽ 信学 論、 Vol.J67-B, No.l, pp.1-8, 1984、 及び Zeger, Gersho: "Pseudo-Gray Coding ", IEEE Trans, on Comm. , Vol.38, No.12, pp.2147-2158, 1990、 その他の文献 で開示されている。 これらの方法は、 全ての代表ベク トルを 1つの符号帳に直接 持っため、 符号帳を記憶するために大きな記憶容量を必要とする。
大きな記憶容量を必要とせずに、 伝送路符号誤りの多い伝送路を用いてべク ト ルを伝送する方法として、 構造化された 2つの符号帳を用いてべク トルを量子化 して伝送する方法がある。 この方法は、 守谷、 "Two-channel Vector Quantizer Applied to Speech Coding\ 信学技法、 IT87-106, pp.25-30, 1987 その他の文 献に開示されている。 この方法は、 規模の小さな符号帳を 2つ持ち、 2つの代表 べク トルを組合わせて用いることで記憶容量の低減を計り、 かつそれら 2つの代 表べク トルを表す 2つのラベルを伝送することで符号誤りの影響を軽減するもの である。 この方法を図 1 A, 1 Bを参照して説明する。 符号帳の代表ベク トルは 例えば学習法により予め生成される。 図 1 Aに示す符号化器では、 符号帳 CB 1 から 1つの代表べク トル z!iを、 符号帳 CB2から 1つの代表べク トル z2jをそれ ぞれ取出し、 これら代表ベク トル Zi を合成部 3で加算してベク トル和 yu z i+z を作り、 この合成代表ベク トル y!j と入力端子 4からの入力ベク トル Xとの距離 d(X,yi i )を歪として距離算出部 5で算出する。 制御部 6は、 符号帳 C B 1, CB 2に対する各代表ベク トル選択スィ ッチ 7, 8をそれぞれ制御して、 距離算出部 5の出力 d(X,yn)が最小となるように代表べク トル i, z2jを探索す る。 距離最小のときの代表ベク トル ζ1 ;, zsjの各ラベル i , j を出力端子 9に符 号化出力として出力する。
図 1 Bに示す復号化器では入力端子 1 1からの入力符号中のラベル i , jに応 じて制御部 12は代表べク トル選択スィ ツチ 13, 14をそれぞれ制御して符号 帳 CB3, CB4から代表ベク トル Zii, をそれぞれ取出し、 これら取出した 代表べク トル Zi" z2iを合成部 17でべク トル合成して再生べク トル Υ =ΖΗ + z2iとして出力端子 18へ出力する。 なお符号帳 CB3, CB4は符号帳 CB 1, CB 2とそれぞれ同一のものが用いられている。
図 1A, 1 Bに示した方法によれば、 代表ベク トルを記憶する符号帳の記憶容 量を節約でき、 かつ伝送路符号誤りの多い伝送路に適用した場合、 復号化器で 2 つのラベルを用いてべク トル合成するため符号誤りの影響を受けにくいという利 点がある。
しかしこの方法によっても、 個々のべク トルの要素について見ると、 伝送路で ラベルが符号誤りを起した場合、 受信したべク トルの全ての要素に歪が生じるこ とになる。 またその誤り力 s'、 その状態によっては復号出力に異常に大きな歪みを 生じさせる問題があった。
また距離最小となる合成代表べク トルを探索する際に、 従来においては 2つの 符号帳の代表べク トルの全ての組合せについて距離 d(X,y )を計算しているため、 計算量が非常に多いという問題もあった。
この発明の目的は、 復号化器に対する入力符号に誤りが生じても、 復号結果に 大きな歪みが生じ難いべク トル符号化方法を提供することにある。
この発明のもう 1つの目的は、 入力符号に誤りが生じても復号結果に大きな歪 みが生じ難く、 かつ計算量 (処理量) が少ないべク トル符号化方法を提供するこ とにある。
この発明の他の目的は、 上述の目的を満足したべク トル符号化方法を使った符 号化器を提供することである。 この発明の更に他の目的は前記目的を満足したべク トル符号化方法により符号 化された符号を復号化するべク トル復号化器を提供することにある。
発明の開示
この発明の第 1の観点の符号化方法及び符号化器によれば、 各符号帳からの代 表べク トルが加算され、 その加算された合成代表べク トルと入力べク トルとの距 離が計算されるが、 前記加算されるそれぞれの代表べク トルに予め決めた互いに 異なる重み係数べク トルが乗算されたものであって、 それらの重み係数べク トル は符号帳ごとに互いに異なる要素位置にそれぞれ最大の係数を有している。 重み 係数べク トルの乗算は符号帳から取出した代表べク トルに対して行うか、 重み係 数べク トルを予め乗算した重み付き代表べク トルを符号帳に記憶しておく。
この発明の第 2の観点の符号化方法及び符号化器によれば、 第 1の観点におい て、 各符号帳ごとに重み係数べク トルを乗算した重み付き代表べク トルの集合を それぞれ直線近似し、 入力ベク トルを各近似直線に射影し、 その射影周辺に存在 する重み付き代表べク トルを符号帳ごとに複数個選択し、 これら選択した複数個 の重み係数が乗算された代表べク トルの中から合成代表べク トルを作り、 入力べ ク トルとの距離が最小のものを求める。
この発明の第 3の観点によれば、 第 1又は第 2の何れかの観点によりべク トル 符号化された符号の復号化器であって、 各符号帳から取出された代表べク トルに 対して乗算手段により重み係数べク トルが乗算され、 その乗算された重み付き代 表べク トルが加算合成されて再生べク トルとされるが、 これら重み係数べク トル は第 1の観点におけるそれと同様に選定されている。
図面の簡単な説明
図 1 Aは従来のべク トル符号化法を使った符号化器の構成を示すプロック図、 図 1 Bは図 1 Aの符号化器に対する従来の復号化器を示すプロック図、 図 2 Aはこの発明を適用した符号化器の例を示すプロック図、
図 2 Bはこの発明による復号化器の実施例を示すプロック図、
図 3 Aは符号帳 C B 1の各代表ベク トル を示す図、
図 3 Bは代表べク トル に重み係数べク トル曹 を乗算したべク トルを示す図、 図 3 Cは符号帳 C B 2の各代表ベク トル z2 i を示す図、 図 3Dは各代表ベク トル z2 i に重み係数ベク トル冒 2 を乗算したベク トルを示 す図、
図 3Eはこの発明における合成べク トルと誤り合成べク トルの例を示す図、 図 3Fは従来法における合成べク トルと誤り合成べク トルの例を示す図、 図 4はこの発明のべク トル符号化法を説明するための重み付き代表べク トルの 集合と、 その近似直線とを示す図、
図 5はこの発明を C E L Pに適用した符号化器の例を示すプロック図、 図 6 Aは重み付き利得べク トルを格納した第 1の符号帳を表として示す図、 図 6Bは重み付き利得べク トルを格納した第 2の符号帳を表として示す図、 図 7は図 6 Aと 6 Bの重み付き利得べク トルを座標上に示す図、
図 8はこの発明を雑音励振べク トルの量子化に適用した符号化器を示すプロッ ク図、
図 9はこの発明をピッチ励振べク トルの量子化に適用した符号化器を示すプロ ック図、
図 10はこの発明を V S ELP適用した符号化器を示すプロック図、 図 11は図 5における利得 gP、 gcのべク トル符号化に 1つの利得符号帳を使う 場合と、 2つの利得符号帳を使う場合の伝送路誤り率に対する復号合成音声のセ グメンタル S/N を示すグラフ、
図 12は図 11の 2つの場合について、 伝送路誤り率に対する復号合成音声の MO Sを等価 Q値で示すグラフ、
図 13は図 5における利得 gP、 gcのベク トル符号化に、 2つの利得符号帳に重 み付けして使うこの発明の場合の伝送路誤り率に対する復号合成音声のセグメン タル S/N を示すグラフである。
発明を実施するための最良の形態
図 2A, 2 Bにこの発明の実施例を示し、 図 1 A, 1 Bと対応する部分に同一 符号を付けてある。 図 2 Aの符号化器において、 この発明によれば代表ベク トル 選択スィ ッチ 7, 8とベク トル合成部 3との間にそれぞれ乗算器 21, 22が挿 入され、 符号帳 CB1, CB2からそれぞれ選択された各 L次元 (Lは 2以上の 整数) の代表べク トル ΖΙ' = (ΖΗ Ι ,Ζ" 2 , ···,ΖΙ ), Zzi izsu .Zsj S .' .ZaiL)に L次元の重み係数べク トノレ, l = (Wll ,Wl2, '",WlL), ,2= (W2 W22,"',W2L)力各対 応要素ごとに乗算器 21, 22でそれぞれ乗算されてべク トル合成部 3へ供給さ れる。 各重み係数べク トル , 曹 2を構成する L個の要素のうち、 少なくとも 1つ は他の要素の少なくとも 1つと異つた値とされている。' また符号帳 CB 1, CB 2毎に重み係数ベク トル冒 冒 2は互いに異なっている。 更に好ましくは各重み係 数べク トル 及び冒 2の、 代表べク トルのそれぞれの要素に乗算されるべき要素の 値 Wi 1 ,Wi 2 , ··· ,WlL 下記
r 0 ·· 0 π
0 Wl2 0 ·· 0
Wl = : 0 · (1 )
• 0
L 0 ·· ·· 0 WlL」
Γ W21 0 ·· 0つ
0 22 0 ■· 0
Wa = : 0 · (2)
• 0
し 0 0 W2L」
のように対角要素に持つ重み係数行列 Wi, W2で表わすと、 各符号帳 CB 1, C
B2の重み係数行列 Wi, W 2の和は下記
厂 Wi 1 0 · · 0 π Γ 0 0 π
0 W12 0 0 0 W22 0 0
: 0 - + : 0 ·
- 0 ■ 0
0 0 し
WlL」 0 0 W2L"
Figure imgf000007_0001
のように単位行列の定数倍となるように各重み係数べク トル冒 賈 2が選定される ( kは予め決めた定数である。 このように各代表ベク トル Ζ , Z2 こそれぞれ重み 係数べク トル冒 1, 冒 2が乗算されたべク トル冒 iZljと, 2Z2iとがべク トル合成部 3で べク トル合成され、 その合成べク トル と入力べク トル Xとの距離が最小とな るように、 符号帳 CB1, CB2の代表ベク トル Z , z2jが探索される。
このように構成されているため、 例えば L=2 の場合、 代表べク トル ZH, z2iを それぞれ 2次元べク トル Zl i = (Zlil, Zl i2)、 Z2j =(Z2j 1, Z2i2)と表す。 k=2 と し、 式(3)を満足する重み係数を例えば冒
Figure imgf000008_0001
W22=1.8)とする。 この時、 符号帳 CB 1の代表ベク トル zu, z12…が図 3Aに示 すように を第 1次元方向とし、 i 2を第 2次元方向として規定される 2次元 のある範囲の平面内にほぼ一様に分布していたとすると、 この各代表べク トル
■ = (ζΐϋ, zi i 2) にそれぞれ重み係数べク トル冒 = (1.8, 0.2)を乗算した重み付 き代表べク トル z ', z12 '…は図 3Bに示すように第 1次元軸に偏った分布とな る。 同様に符号帳 CB 2の代表ベク トル z21, Z22, …が図 3Cに示すように 2つ の軸により規定される 2次元のある範囲の平面内にほぼ一様に分布しているとす ると、 これらの代表ベク トル z21, Z22…に重み係数ベク トル w2=(0.2, 1.8)が乗 算されて図 3Dに示すように第 2次元軸に偏った分布となる。
例えば送信側において代表べク トル z2iと と重み付け合成したべク トル が入力信号 Xに対し最小歪となると判定された場合、 それらのラベルが送信され たものとし、 図 3Eに示すように、 一方の重み付け代表ベク トル のラベルが 伝送路誤りを受け重み付き代表べク トル Zii 'になったとする。 その結果、 受信側 において、 他方の重み付き代表べク トル z2jとの合成べク トルは y から yu 'に変 化する。 重み付き代表べク トル Zi i は他の何れの重み付き代表べク トル 'にも 変化する可能性があるが、 ZH が片寄った分布となっているため、 合成べク トル と y ' との誤差ベク トル Ay =yu— yu' の 2次元成分の値はどのように i が変化しても比較的小さい。 これに対し、 重み係数を乗算しない場合は、 図 3 Fに示すように、 一方の代表べク トル が代表べク トル に変化すると、 こ れら ZH, 'と他方の代表ベク トル との各合成ベク トルはそれぞれ y , yi j ' となる。 代表ベク トル は符号帳 CB 1のどの代表ベク トルにも変化する可 能性があり、 かつ代表ベク トル zu, z12…は広範囲に分布しているため、 合成べ ク トル yu と変化した合成べク トル y 'との誤差べク トノレ は第 1次元成分、 第 2次元成分とも可成り大きなものとなる可能性がある。
つまり図 3 Εの例では重み付き代表べク トル wiz iwuzm, w zu2)に誤 りが生じ、 冒 iZl i ' = (Wl lZl i l ', Wl2Zl i2 ' )となった場合に第 1次元目の要素 W Z m 'に歪を集中させ、 第 2次元目の要素 w12zl i2'の歪を小さく抑え、 全体として の歪を小さく しているとも云える。
図 2Bは復号化器の実施例であり、 図 2 Aの符号化器からラベル i, j と重み 係数ベク トル in, W2が与えられ符号 y を複合する。 図 2Aにおける符号帳 CB 1, CB 2とそれぞれ同じ符号帳 CB3, CB4が設けられており、 図 1 Bの場 合と同様に、 入力符号のラベル i , jの代表ベク トルを符号帳 CB3, CB4か らそれぞれ取出して合成するが、 この実施例ではスィ ッチ 13, 14とベク トル 合成部 17との間にそれぞれ乗算器 24, 25が挿入され、 図 2Aの符号化器で の対応する乗算器 21, 22でそれぞれ乗算したと同一の重み係数べク トル冒 W2を、 符号帳 CB3, CB4からそれぞれ取出した代表ベク トル z2jに乗算 し、 この乗算された代表ベク トル ΙΠΖΗ, w2z2jをベク トル合成部 17で合成して 再生ベク トル yi j とする。 上述の説明から明らかなように、 図 2A、 2B中の符 号帳 CB 1, CB3及び CB2, C B 4には予め各代表ベク トル i及び z2jに重 み係数べク トル冒 i及び冒 2をそれぞれ乗算して得た重み係数代表べク トルを格納し ておいて、 乗算器 21、 22、 24、 25を省略してもよい。
図 2 Aの説明では入力信号べク トル Xに対し、 符号帳 CB1, CB2内の全て の代表ベク トル Zii, z2 iの組み合わせについてそれそれ合成ベク トル を求め、 歪を計算し、 最小の歪を与える代表ベク トルの組 i, Z2)を決定する場合につい て説明した。 この方法は符号帳 CB 1, CB 2のサイズが大きくなると必要な演 算回数が急激に増加してしまう。 そこで、 少数の代表べク トル Zi" Z2】を予め選 択しておき、 それらの中から歪の最小となる代表べク トルを決定することにより 演算量を削減し、 従って、 演算時間を短縮する方法を次ぎに説明する。
図 2 Aにおいて例えば符号帳 CB 1は 8個の代表べク トルを有し、 符号帳 CB 2は 16個の代表ベク トルを有し、 各代表ベク トル をそれぞれ 2次元の べク トルとする。 符号帳 CB 1の 8個の代表べク トル に重み係数べク トル =
Figure imgf000010_0001
w12=0.2)をそれぞれ乗算して得られた 8個の重み付き代表べク トル を X印で図 4に示し、 同様に符号帳 CB2の 16個の代表ベク トル z2j に重み係 数べク トル冒 2=(w21=0.2, w22=l.8)をそれぞれ乗算して得た 16個の重み付き代 表べク トルを〇印で図 4に示し、 入力信号べク トルを Xで示している。 入力信号 べク トル Xはフレーム毎の予め決めた数の信号サンプル、 ここでは 2サンプルで 構成されている。
2次元ベク トル z , に対する 2次元重み係数ベク トル冒 菁 2は式(3)を満 足するように決められ、 この例では Wi i+W
Figure imgf000010_0002
となっている。 そのた め、 図 4に示すように、 〇印の重み付き代表ベク トルのグループと X印の重み付 き代表べク トルのグループは原点(0,0) を通る勾配 1の直線の互いに反対側にほ ぼ分布している。 以下では図 2 Aにおける符号帳 CB 1, CB2及び図 2Bにお ける CB3, CB4にはこの様な重み付き代表べク トルが格納されているものと し、 従って乗算器 21、 22、 24、 25は省略されるものとして説明する。 この方法では符号帳 CB 1の重み付き代表べク トルの集合 ( X印の集合) を直 線 27で近似する。 つまり直線 27はこれと各 X印との距離 (又は第 2次元軸方 向での距離) Du, D12, …, D18の和が最小となるように決定されている。 同 様に符号帳 CB 2の重み付き代表べク トルのグループ (〇印の集合) を直線 28 で近似する。 直線 28はこれと各〇印との距離 (又は第 1次元軸方向での距離) Dai, D22, ···, D216 の和が最小となるように決定される。
入力ベク トル Xを近似直線 27, 28にそれぞれ射影し、 その射影周辺に存在 する重み付き代表べク トルをそれぞれ複数個選択する。 つまり入力信号べク トル Xを通り、 近似直線 28と平行な直線 29と近似直線 27との交点 の横軸の 値、 即ち第 1次元の値 p を求め、 この値 p と、 第 1次元 (第 1番目の要素) に 広い分布を有する X印の重み付き代表べク トルの第 1次元値 (第 1番目の要素の 値) とを比較し、 その差が小さいものから、 所定数、 例えば 3つの重み付き代表 べク トルのサブグループ を選択する。 このようにして符号帳 CB 1に関する予 備選択を行う。 同様にして入力信号べク トル Xを通り近似直線 27と平行な直線 31と近似直線 28との交点 P2の縦軸の値、 即ち第 2次元の値 p2yを求め、 この 値 p2y と、 第 2次元 (第 2番目の要素) に広い分布を有する〇印の重み付き代表 べク トルの第 2次元値 (第 2番目の要素の値) とを比較し、 その差が小さいもの から、 所定数、 例えば 3つの重み付き代表べク トルのサブグループ H2を選択して、 符号帳 CB 2に関する予備選択を行う。
これら符号帳 CB 1, CB 2からそれぞれ予備選択されたものについてのみ、 その合成べク トルと入力信号べク トル Xとの距離が最小となる重み付き代表べク トルの組を探す。 この例では予備選択により重み付き代表べク トルが符号帳 CB 1, CB 2から 3つずつ取出されるから、 それらの組み合わせは 9組有り、 従つ て合成べク トルの数は 9つであるが、 このような予備選択を行わない場合は重み 付き代表べク トルの組合せ数 (合成代表べク トルの数) は 8X16= 128とな り、 入力信号べク トル Xとの距離計算が、 予備選択を行う場合は行わない場合の 9Z128に減少する。 この選択方法では、 一般に M個の符号帳を使う場合、 代 表べク トルの次元数も Mとする。 M個の重み係数べク トルは互いに異なる要素位 置 (即ち次元) にそれぞれ最大の係数を有し、 代表べク トルと乗算することによ りその次元が他の次元に比べて強調される。
この発明の符号化方法を CEL P (Code-Excited Linier Prediction Coding) 方式の音声符号化に適用した実施例を図 5に示す。 CELP方式では、 例えば M. R.Schroeder 及び B.S.Atalの文献" Code-Excited Linear Prediction (CELP) :Hig h-Quality Speech at Very Low Bits Tates" , Proc. ICASSP'85, pp.937- 940, 19 85に示されているように、 ピッチ励振源符号帳から選択したピッチ励振べク トル と雑音励振源符号帳から選択した雑音励振べク トルのそれぞれに利得を与えて合 成し、 その合成べク トルを励振信号として合成フィルタに与えて得た合成音声の 入力音声に対する歪が最小となる 2つのべク トル及びそれらに対する 2つの利得 を決定し、 これらべク トルのラベルと利得の符号を合成フィルタのフィルタ係数 と共に、 入力音声の符号化結果として出力する。 この様な CELP方式における 2つのべク トルに対する利得の符号化にこの発明のべク トル符号化方法を適用す ることにより、 利得を表す符号が伝送路誤りを生じても、 復号音声に異常に大き な歪が生じるのを軽減することができる。
入力端子 34からの入力音声信号 Xは一定周期でサンプリングされ、 各フレー ム期間に一定数からなる一連のディジタルサンプル値として与えられるべク トル として表されている。 このフレーム毎の入力信号べク トル Xはフィルタ係数決定 部 3 5で例えば線形予測分析され、 線形予測係数が求められる。 この線形予測係 数からスぺク トル形状パラメータが求められ、 これがフィルタ係数量子化部 3 6 で例えば量子化され、 その量子化値が合成フ ィルタ 3 7のフィルタ係数として設 定される。 ピッチ励振源符号帳 3 9には異なるピッチ周期成分をそれぞれ含む波 形の一連のサンプル値がそれぞれピツチ励振べク トルとしてラベル付けされ格納 されている。 雑音励振源符号帳 4 3には様々な雑音波形の一連のサンプル値がそ れぞれ雑音励振べク トルとしてラベル付けされ格納されている。 ピッチ励振源符 号帳 3 9及び雑音励振源符号帳 4 3に格納されている各ピッチ励振べク トル及び 各雑音励振べク トルはそれぞれ 1フ レームのサンプル数と等しい要素で構成され ている。 制御部 6により選択スィ ッチ 3 8が制御され、 ピッチ励振源符号帳 3 9 から複数のピッチ励振べク トルの 1つが選択されて利得付与部 4 1へ供給され、 任意の利得が乗算され、 合成フィルタ 3 7に与えられる。 これによつて合成され た音声 L>と入力音声信号 Xとの差分を減算器 4 8で求め、 その差分から歪み算出 部 5で歪 Dを例えば D= II X- XP II 2として計算する。 同様に、 スィツチ 3 8を制 御してピッチ励振源符号帳 3 9の他のピッチ励振べク トルについてもそれぞれ歪 を求め、 最小の歪を与えたピッチ励振べク トルを決定する。 次に、 その最小歪を 与えたピッチ励振べク トルを選択した状態で、 スィツチ 4 2により雑音励振源符 号帳 4 3から雑音励振べク トルを 1つ選択して利得付与部 4 6で任意の利得を与 えて加算器 4 7に与え、 既に決定されているピッチ励振べク トルを加算して励振 信号べク トル Eを生成する。 この励振信号べク トル Eを合成フィルタ 3 7に与え て合成した音声の入力音声信号に対する歪を同様に計算する。 同様に、 雑音励振 源符号帳 4 3の他の雑音励振べク トルについてもそれぞれ歪を計算し、 最小歪を 与えた雑音励振べク トルを決定する。
この様にして決定されたピッチ励振べク トルと雑音励振べク トルを選択した状 態で、 次ぎに利得付与部 4 1、 4 6の利得 gP, gcを、 歪が最小となるように以下 のように決定する。 利得符号帳 C B 1, C B 2にはそれぞれ利得べク トル ζ^ Π = l,— ,a), z2j(j=l,一,b)が格納されており、 各利得ベク トル ZH, z2 iはそれぞれ
2つの要素から成り、 それぞれ Zii = (Ziii,Zii2), Z2i = (Z2ii,Z2i2)と表す。 利得 符号帳 CB 1, CB2から選択された利得ベク トル ζ^, z2 iはそれぞれ乗算器 2 1、 22で重み係数ベク トル W U .W ),
Figure imgf000013_0001
と乗算され、 重み付き 利得ベク トル
Figure imgf000013_0002
(yi i,yj2)とされる。 ここで、
Vi l=Zl i lWl 1, yi 2 = Zl i 2Wl 2, yj 1=Z2 j lW21, yj 2 = Z2 j 2W22 、4·) である。 重み付き利得べク トル yi, は、 べク トル合成部 3で互いに加算され、
Figure imgf000013_0003
を要素とする合成利得べク トル G=(gP,gc) を得る。 合成利得べク トル Gのこれら の第 1及び第 2要素 gP, geはそれぞれ利得付与部 41、 46に第 1及び第 2利得 として与えられ、 ピッチ励振源符号帳 39及び雑音励振源符号帳 43からそれぞ れ先に決定されたピッチ励振べク トル CP及び雑音励振べク トル CRとそれぞれ乗算 される。
利得付与部 41, 46で利得 gP, gcが付与されたピッチ励振ベク トル gPCpと雑 音励振べク トル gcCRとが加算器 47で加算されて合成フィルタ 37へ励振べク ト ル£= 1> 11 として供給され、 合成フィルタ 37で音声 Xが合成される。 この 合成音声 Xと入力端子 34からの入力音声信号 Xとの差が減算器 48でとられ、 その差が歪算出部 5で合成音声 Xの入力信号 Xに対する歪として D= II X— i ll 2が 計算される。 制御部 6により選択スィツチ 7、 8を制御して利得符号帳 CB 1, CB2の各利得ベク トルの選択を制御し、 その選択した各利得ベク トル Z , z2 j に対し乗算器 21, 22で互いに異なる重み係数ベク トル Wi, 冒 2をそれぞれ乗算 してべク トル合成部 3へ供給する。 重み係数べク トル冒 W2は式(3)を満足する 2次元べク トルであり、 各べク トルの 2つの要素は互いに異なる。 歪算出部 5で の算出歪が最小となるように符号帳 CB 1, CB2の利得べク トルの選択を行う c 歪が最小となる利得ベク トルが得られると、 その時の符号帳 CB 1, CB2の選 択された利得べク トルを示す利得ラベルと、 先に決定したピッチ励振源符号帳 3 9及び雑音励振源符号帳 43のピッチ励振べク トル及び雑音励振べク トルをそれ それ示すラベルと、 合成フィルタ 37に設定したフィルタ係数を表すラベルとを 入力音声信号 Xに対する符号化結果として符号出力部 49から出力する。
上述では利得符号帳 CB 1 , CB 2から選択する利得べク トルの全ての組み合 わせについて歪を計算し、 最小の歪を与える利得べク トルの組を決定する場合を 説明したが、 図 4で説明したと同様に、 予め利得ベク トル Z , z2iの候補をそれ ぞれ複数選択し、 それら予備選択された利得べク トルの全ての組み合わせについ てのみ先に決定したピッチ励振べク トル CP及び雑音励振べク トル CRとの組合わせ での歪を計算し、 最小歪を与える利得ベク トルの組を決定してもよい。 この場合、 図 4の場合と同様に、 利得符号帳 CB 1 , CB 2のそれぞれの利得ベク トル Ζϋ, z2 i と重み係数べク トル
Figure imgf000014_0001
冒 ss .W )との積である重み付き利得 ベク トノレ
yi i=Zl i冒 l=(Zl i lWl l, Zl i 2Wl2)=(yi i l,yi i 2)
Y2 j=Z2 j冒 2 = (Z2 j lW21, Z2 j 2W22) = (y2 j 1, y2 i 2)
を予め計算して求めた重み付き利得符号帳 CB1', CB2'を例えば図 6A, 6 Bに示 す表 I 及び IIのように作成しておき、 図 5における利得符号帳 CB 1, CB2の 代わりに使い、 乗算器 2 1、 22は省略される。 前述と同様に、 重み付き利得符 号帳 CB1'の全ての 2次元重み付きべク トル y1 ; を図 7に黒丸で示す 2次元座標上 の点としてプロッ トし、 それらの点のグループに最も近い直線 を最小自乗法で 予め求めておく。 同様に重み付き利得符号帳 CB2'の全ての 2次元重み付きべク ト ル y2 i を 2次元座標上の点としてそれぞれ図 7に白丸で示すようにプロッ トし、 それらの点のグループに最も近い直線 L2を最小自乗法で予め決めておく。
前述と同様に利得付与部 41、 46の利得は任意として、 まず歪最小となるピ ツチ励振べク トルを決定し、 次に歪が最小となる雑音励振べク トルを決定する。 次に、 利得 gP=l, gC=0として先に決定したピッチ励振べク トル CPのみを励振信号 として合成フィルタ 37に与えた場合の合成フィルタ 37の出力 XPを求める。 更 に利得 gP=0, gc=lとして先に決定した雑音励振べク トル CRのみを励振信号として 合成フィルタ 37に与えた場合の合成フィルタの出力 XRを求める。 符号帳 39、 43からベク トル CP, CRが選択され、 それぞれ利得 gP, gcが与えられた場合の合 成フィルタ 37の音声合成出力 Xは
Figure imgf000014_0002
と表されるので、 その時の合成 音声 Xの、 入力音声信号 Xに対する歪 Dは次式
Figure imgf000015_0001
= XtX+gp2XptXp + gc2XR ,XR
-2gpXtXp-2gcXtXR-2gPgcXpt R ( 6 )
で表される。 ただし1 は転置を表す。 歪 Dが最小となる gP, gcを求めるため、 上 式をそれぞれ gP, gcで偏微分すると次式が得られる。
5
Figure imgf000015_0002
D/ d gc tXR-2XtXR-2gpXptL ( 8 ) 歪 Dは式(6 )から明らかなように gP, gcのそれぞれに関し下に凸な関数なので、 歪 Dを最小とする gP, gcはそれぞれ 3 D/ gP-0, <9 D/ 3
Figure imgf000015_0003
となる時の値である c したがって、 式(7),(8 ) からそれぞれ
gpXptXp-gcXptXR = XtXp ( 9 )
Figure imgf000015_0004
が得られる。 これらの式(9 ) , (10)を同時に満たす gP, gcは次式
(11)
Figure imgf000015_0006
から次のように表される,
(12)
Figure imgf000015_0007
式(12)を展開すると gP, gcはそれぞれ次式
gp = k{XR ,XR · X'XP + XP'XR, X'XR} (13) gc
Figure imgf000015_0005
. X'XR + XP'XR · X1XP} (14) ただし k=l/(XP lXp · XR ,XR-2XptXR)
で表される。 ここで得られた利得の組 {gP, gc}が、 歪み Dを最小とする組み合わ せである。 この組を最適利得ベク トルとして図 7中に点 Poとしてプロッ トし、 こ の点 Poからそれぞれ直線 L2, と平行な直線を引き、'直線 , L2との交点 Pi, ?2 を求める。 縦軸方向の値が点 Piの近傍にある重み付き利得べク トル yn ym.yi i2)を符号帳 CB1' (図 6A表 I ) から複数選択し、 第 1サブグループとする。 同様 に横軸方向の値が点 P2の近傍にある重み付き利得べク トル y2 i=(y2 i l,y2 i 2)を符号 帳 CB2' (図 6B表 II)から複数選択し、 第 2サブグループとする。
選択方法としては、 点 P2に近い順にそれぞれ所定数 (例えば点 Piに対して 表 I から 4つ、 点 P2に対して表 IIから 8つ) の重み付き利得べク トルを選択する。 あるいは、 点 Pi, P2を中心にそれぞれ予め決めた距離 ch, d2の範囲内にある重み 付き利得べク トルを選択する。 あるいは、 符号帳 CB1'のべク トルは 8個有るので、 利得要素 yi の i=n番目と n+4番目の平均値を n=l, 2,3,4のそれぞれに付いて 求め、 それらの値を閾値 Tlu.Ths.Tha.Tl とする。 交点 1^の縦軸方向の値 plc が ρκ^ΤΙ なら i=l,〜,4番目の重み付き利得べク トルを選び、 Th-く plc≤Thn + 1, n =1,2,3,4なら ί=η+1,···,η+4番目の 4個のべク トルを選択する。 同様に、 符号帳 CB 2'のベク トル y2 i は 16個有るので、 利得要素 y2ilの: m番目と j=m+8番目の平均 値を 10=1 ',8のそれぞれに付いて求め、 それらの値を閾値 Th …, Theとする。 交 点 P2の横軸方向の値 p2P
Figure imgf000016_0001
なら 1 ',8番目の重み付き利得べク トルを 選択し、 Thm<p2P≤Thn+1, 10=1,"ヽ8なら 111+1 ',111+8番目の8個のべク トルを選 択する。 その他様々な選択方法を考えることができる。
あるいは符号帳からのべク トル候補の予備選択の他の方法として、 前述の最小 自乗法による近似直線 , L2を使用せず、 次のように行ってもよい。 まず、 gP=l, gc=0としてピッチ励振源符号帳 39からのピッチ励振べク トル CPのみを励振信号 べク トル Eとして合成フ ィルタ 37に与えた場合の合成音声信号を XPとし、 次に gP=0, gc=lとして雑音励振源符号帳 43からの雑音励振べク トルのみを励振信号 べク トル Eとして合成フィルタ 37に与えた場合の合成音声信号を X。とする。 利 得符号帳 CB 1に関するべク トルの予備選択として、 すべての iについて、 II X-wiiZii iXp II 2 (15)
を求め、 この値の小さいものから所定数、 例えば 3個と対応する利得ベク トルを 利得符号帳 C B 1から予備選択し、 同様に利得符号帳 C B 2に関する予備選択と し、 すべての jについて、
Figure imgf000017_0001
を求め、 この値の小さいものから所定数、 例えば 3個と対応する利得べク トルを 利得符号帳 CB 2から予備選択する。 これら両予備選択された各 3つの利得べク トノレ Zli, Z2jについてのみ、
D U , j ) = II X— (,Wl lZl i 1 +W12Z1 i 2)Xp
- (Wl2Z2j 1 +WllZ2j 2)Xc It 2 (17) を求め、 これが最小となる i, jを符号化出力としてもよい。 このようにして計 算量を减少することもできる。
この様にして選択された第 1及び第 2サブグループの重み付き利得べク トルに ついてのみ、 それぞれのグループから 1つずつ選択される全ての組についてそれ ぞれ入力音声信号 Xに対する歪が最小となる組をそれぞれ探索して最適な第 1及 び第 2利得 gP, gcの組を決定し、 先に決定したピッチ励振ベク トルと雑音励振べ ク トルの組と、 合成利得ベク トル(gP, gc)をそれぞれ表すラベル、 即ち、 ピッチ 励振源符号帳 39中のピッチ励振べク トルのラベルと、 雑音励振源符号帳 43中 の雑音励振べク トルを表すラベルと、 重み付き利得符号帳 CB1', CB2' (又は利得 符号帳 CB 1 , CB2 ) 中の利得べク トルのラベル及びフィルタ係数を量子化し たラベルを入力音声べク トル Xに対する符号化結果として出力する。
いずれの場合も、 乗算器 21, 22で乗算する重み係数ベク トル冒 冒2は、 そ れらの対応要素、 例えば と w21 の比が 2 : 1から大きくなると、 復号結果の 歪への伝送路誤りによる影響が比較的大きくならない効果が現れはじめるが、 1 0 : 1以上にしても、 伝送路誤りによる歪の改善の効果は大とならない。 かえつ て伝送路誤りがない場合における、 つまり正常時における復号結果の歪が大きく なる。
図 5の構成において雑音励振源符号帳 43を複数の符号帳で構成し、 この発明 のべク トル符号化法を適用してもよい。 例えば、 図 8に示すように、 雑音励振源 符号帳を 2つの符号帳 43 a, 43 bで構成し、 これら符号帳 43a, 43bか らそれぞれ各 1つの雑音励振べク トルを選択し、 これら選択した雑音励振べク ト ルに対し、 重み係数乗算器 51 a, 51 bでそれぞれ重み係数ベク トル wRe, ,Rb を乗算する。 これら重み係数ベク トル冒 Ra, wRbは図 2 Aで説明した重み係数べク トル冒 w2と同様な関係に選定されている。 乗算器 51 a, 5 l bの各出力は雑 音べク トル合成部 52で加算され、 図 5中の雑音励振源符号帳 43から選択した 雑音励振べク トルとして利得付与部 46へ供給される。 図 5について説明したよ うに制御部 6の制御により、 合成フィルタ 37からの合成音声信号 Xの入力音声 信号 Xに対する歪が最小となるように、 雑音励振源符号帳 43 a, 43 bからそ れぞれ雑音励振べク トルを選択する。
雑音励振べク トルの符号化と同様に図 5の構成におけるピッチ励振べク トルの 符号化にもこの発明を適用できる。 即ち、 図 9に示すようにピッチ励振源符号帳 を 2つの符号帳 39a, 39bで構成し、 これら符号帳 39a, 39bからそれ それ各 1つのピッチ励振べク トルを選択し、 重み係数乗算器 53 a, 53 bでそ れぞれ重み係数ベク トル冒 Pa, wPbを乗算し、 これら乗算出力をピッチ励振べク ト ル合成部 54で加算して、 図 5中のピッチ励振源べク トル符号帳 43から選択し たピッチ励振べク トルとして乗算器 41へ供給する。 乗算器 51 a, 51 bに与 える重み係数ベク トル冒 Pa, wPbは図 2 Aの重み係数 冒 2と同様に決められてい る o
図 5中のフィルタ係数量子化部 36の量子化にこの発明を適用する場合は、 フ ィルタ係数量子化部 36を図 2 Aと同様に構成すればよいので図 2 Aを使って説 明すると、 符号帳 CB1, CB2にそれぞれ代表スぺク トル波形べク トルをそれ それ記憶しておき、 これらからそれぞれ 1つ選択した代表スぺク トル波形べク ト ルに重み係数ベク トル , W2を乗算してベク トル合成部 3で合成し、 その合成代 表スぺク トル波形べク トルとフィルタ係数決定部 35 (図 5 ) からの入カスペク トル波形べク トルとの距離が最小となるように符号帳 CB 1, CB 2から選択す る代表スぺク トル波形べク トルを探索すればよい。
この発明のべク トル符号化方法をいわゆる V S ELPに適用することもでき、 その実施例の要部を図 10に示す。 この場合は図 5における符号帳励振源 43と して多数の基底べク トル符号帳 43! 〜43- が設けられ、 各規定べク トル符号 帳には 1つの雑音べク トルが格納されている。 これら全ての基底べクトル符号帳 43i 〜43n のそれぞれの雑音励振べク トルは極性制御部 56 i 〜56n でそ れぞれ正または負の極性が付けられ、 これら極性制御された雑音励振べク トルは、 この発明では重み係数乗算器 57 〜57n で重み係数がそれぞれ乗算される。 これら乗算器の出力は加算回路 58で加算され、 この加算出力は雑音励振べク ト ルとして図 5中の乗算器 46へ供給される。 極性制御部 56 〜56n は図 5中 の制御部 6から合成音声信号の入力音声信号に対する歪が最小になるように各別 に選択制御される。 つまり、 各基底べク トル符号帳 43i (i=l, 2, ···,!!)と極性制 御部 56, との組は 1つの雑音励振源符号帳を構成し、 正、 負の 2つの雑音励振 べク トルの一方が制御部 6により選択されていると言える。 重み係数乗算器 57 〜57n の各重み係数べク トル冒 R 1〜wR-は図 2 Aで説明した重み係数べク トル Wl, 冒 2と同様な関係とされている。
この図 10の説明から理解されるように、 図 5の雑音励振源符号帳 43の代わ りに図 10中の基底べク トル符号帳 43 〜43n 及び極性制御部 56i 〜56 » を用いてもよい。 このことは図 8中の符号帳 43 a, 43bについても同様で ある。 また図 5中のピッチ励振源符号帳 39としては入力音声信号を分析して得 たピッチ周期と前フレームの励振信号べク トル Eとから適応的にピッチ励振べク トルを生成する、 いわゆる適応符号帳としてもよい。 この適応符号帳は、 図 5の 雑音励振源符号帳 43の代わりに図 8又は図 10に示した構成を使う場合におい ても、 ピッチ励振源符号帳 39として用いてもよい。 更に、 音声信号のパヮのべ ク トル符号化、 スぺク トル波形パラメータのべク トル符号化、 ピッチ励振源符号 帳のべク トル符号化、 雑音励振源符号帳のべク トル符号化の任意の組み合わせに ついて同時にこの発明を適用することもできる。
前述のように図 2 Aにおいて符号帳 CB 1, CB 2内のそれぞれの代表べク ト ルにそれぞれ重み係数べク トル Wi, 冒 2を予め乗算した重み付き代表べク トル冒 >, 冒 2z2iをそれぞれ記憶しておき、 乗算器 21, 22を省略してもよい。 同様に 図 2Bにおいて、 符号帳 CB3, CB4にそれぞれ重み付き代表ベク トル冒 iZ , 冒 2z2 i を記憶しておき、 乗算器 24, 25を省略してもよい。 同様に図 5の実施 例において、 利得符号帳 CB 1, CB2に予め重み付き利得べク トルを格納して おき、 乗算器 21、 22を省略してもよい。 更に図 8及び 9においても同様に符 号帳 43 a, 43 b及び 39 a, 39 bにそれぞれ重み付きベク トルを格納して おき、 乗算器 51 a, 51 b及び 53 a, 53 bを省略してよい。
更に上述では 2つの符号帳からそれぞれ代表べク トルを取出してべク トル合成 したが、 3以上の符号帳からそれぞれ代表べク トルを取出してべク トル合成する 場合にもこの発明を適応することができる。 また、 図 5の CELP方式の実施例 では、 入力音声信号の符号化の場合に付いて説明したが、 音声信号に限らず、 一 般の音響信号の符号化にも適用できることは言うまでもない。
次に、 図 5に示す CELPを使った音声符号化における利得 gP、 gcのベク トル 符号化に従来技術を適用した場合と、 この発明を適用した場合の特性に付いて説 明する。
(A) 適用する第 1の従来技術としては、 図 5中の 2つの利得符号帳 CB 1, C B 2の代わりに 7ビッ 卜の各ラベルが 1つの 2次元利得べク トルを指定し、 27=1 28個のラベルを有する 1つの利得符号帳を使用する場合である。 利得符号帳から 読み出された 2次元べク トルの一方の要素はピッチ励振べク トルに対する利得 gp として用い、 他方の要素は雑音励振べク トルに対する利得 gcとして用いる。
(B) 適用する第 2の従来技術として、 図 5と同様に 2つの利得符号帳 CB 1, CB 2を使用するが、 重み係数べク トルは使用しない。 符号帳 CB 1には 3ビッ 卜のラベルにより指定される 23個の 2次元べク トルが設けられ、 符号帳 CB2に は 4ビッ トのラベルにより指定される 24個の 2次元べク トルが設けられ、 それぞ れから選択されたべク トルが加算されて 1つの 2次元合成べク トルとされ、 その 合成べク トルの一方の要素が利得 gPとして使用され、 他方の要素が利得 として 使用される。
(0 図 5の利得のべク トル符号化に適用したこの発明の例では、 上記(B) のケ ースにおいてそれぞれ利得符号帳 CB1, CB2から読みだした利得べク トルに それぞれ重み係数ベク トル
Figure imgf000020_0001
1.8)を乗算してから加算し て合成ベク トルを得た場合である。 2つの符号帳 CB 1, CB2に対し予めこれ ら重み係数ベク トル Wi , 冒 2を乗算して得た重み付き利得符号帳 CB1 ' , CB2 'は図 6 A、 6 Bに示すものと同じである。
図 1 1は図 5においてケース(A) と(B) を適用して音声を符号化し、 その符号 化出力中の利得ラベルに伝送路誤りが生じた場合の誤り率に対する受信復号音声 のセグメンタル S/N の測定結果をそれぞれ曲線 All, B11で示す。 セグメンタル S/ N は、 フ レーム毎の S/N を例えば数分間に渡って求め、 それらを平均したもので ある。 利得符号帳を 1つ使う場合 (曲線 All ) より符号帳を 2つ使う方 (曲線 B1 1 ) が伝送路誤り率に対するセグメンタル S/N が優れている。
図 1 2は図 1 1の場合の、 利得ラベルの伝送路誤り率に対する復号合成音声の 一般人 2 4人による主観評価 (MO S : mean opinion scores ) を等価 Q値に変 換してそれぞれ曲線 A12, B12で示す。 この図から、 符号帳を 2つ使う方が伝送路 誤り率に対し優れており、 図 1 1で示した 2つのケースの S/N特性の差異がそれ ほど大きくなくても、 実際の聴感上の差異は大きい。
図 1 3はこの発明を適用したケース(C) に付いて図 1 1と同様に伝送路誤り率 に対して求めた復号音声の測定したセグメンタル S/N を曲線 C13 に、 ケース ) の曲線 B11 と比較して示す。 明らかに、 この発明を適用した場合の方が伝送路誤 り率に対する復号合成音声の S/N は優れており、 図 1 1と 1 2が示す S/N の差異 が等価 Q値に大きく影響する事実から、 2つの符号帳に重み付けするこの発明を 適用した場合、 重み付けしないで 2つの符号帳を使った場合より等価 Q値を大き く改善できることが推定される。
以上に説明したように、 この発明によれば、 L次元のベク トルをそれぞれ有す る複数(M個) の符号帳を使ってべク トル符号化を行う場合に、 それらの符号帳 に対する L次元の重み係数べク トル iri , "' ,wMを、 それらの重み係数べク トルの要 素 m s ^ w^を対角要素に持つ重み係数行列 Wi, ···, WMの和が単位行列の 定数倍となるように選ぶことにより、 それぞれの符号帳のべク トルを L個の重み 係数べク トルにより L次元座標のそれぞれに異なる座標軸に接近する (即ち他の 次元の要素値を圧縮する) よう分布を偏位させる。 このようにそれぞれの符号帳 毎に重み付けされたべク トルの組により歪が最小となるように信号を符号化して、 それぞれの重み付けべク トルに対応する M個の符号帳のラベルを送信した場合、 伝送路で例えば 1つのラベルに誤りが生じたとしても、 1つの次元の座標軸方向 において誤りが大きい可能性があるが、 他の全ての次元の座標軸方向の誤りは圧 縮されているため、 全体の合成べク トルの絶対値のエラーの大きさはそれほど大 きくならない。 従って、 この発明を音声信号の符号化に適用した場合、 伝送路誤 りにより生じる異常を緩和する効果がある。
また、 入力信号べク トルに対し、 各符号帳の重み付きべク トルを予め複数予備 選択しておき、 それらの選択された重み付きべク トルに付いてのみ符号化による 歪を求めることにより、 符号化処理における計算量を著しく減少し、 かつ短時間 で符号化することができる。
この発明はいわゆる C E L Pや V S E L P方式の音声符号化方法にも適用でき、 その場合は、 スぺク トル波形パラメータのべク トル符号化、 パヮのべク トル符号 化、 各符号帳のべク トル符号化にそれぞれ単独または複数同時に適用することが できる。

Claims

請求の範囲
1 . それぞれがラベル付けされた同じ次元数の複数の代表べク トルからなる M個, Mは 2以上の整数、 の符号帳を使って入力信号べク トルを符号化する方法であり、 以下のステップを含む:
(a) M個の上記符号帳からひとつずつ代表べク トルを選び、
(b) M個の上記符号帳から選択された上記代表べク トルに上記代表べク トルと 同じ次元数の M個の予め決めた重み係数べク トルをそれぞれ乗算して M個の重み 付き代表べク トルを生成し、 M個の上記重み係数べク トルは互いに異なる要素位 置にそれぞれ最大の係数を有しており、
(c) 上記 M個の重み付き代表べク トルを全て加算して合成代表べク トルを生成 し、
(d) 上記入力信号べク トルと上記合成代表べク トルとの間の距離を求め、
( e ) 上記ステップ(&),(13),((:),( を繰り返して上記入力信号べク トルとの間 の距離が最も小さい上記合成代表べク トルを探索し、
( f ) 上記最小の距離を与えた上記合成代表べク トルを作るために用いた各上記 符号帳の代表べク トルに与えられた各ラベルを符号化出力とする。
2. それぞれがラベル付けされた同じ次元数の複数の代表べク トルからなる M個、 Mは 2以上の整数、 の符号帳.を使って入力信号べク トルを符号化する方法であり、 以下のステップを含む:
(a) 上記 M個の符号帳のそれぞれの代表べク トルと、 上記 M個の符号帳に対し て予め決めた上記代表べク トルと同じ次元数の M個の重み係数べク トルを乗算し て M個のグループの重み付き代表べク トルを得て、 M個の上記グループの重み付 き代表べク トルをそれぞれ近似する M本の直線を決め、 M個の上記重み係数べク トルは互いに異なる要素位置にそれぞれ最大の係数を有しており、
(b) M次元座標上において入力信号べク トルを上記 M本の直線に射影し、 射影 近傍にそれぞれ存在する複数の重み付き代表べク トルをそれぞれ予備選択して M 個のサブグループを決め、
(c) 上記 M個のサブグループのそれぞれから重み付き代表べク トルを選択して 加算し、 それによつて合成代表ベク トルを得て、
(d) 上記合成代表べク トルと上記入力信号べク トルとの間の距離を求め、
(e) 上記ステップ(c) , (d) を上記 M個のサブグループの重み付き代表べク トル の全ての組み合わせに付いて繰り返してそれぞれの場合の距離を求め、
( f) 最小距離を与えた組の重み付き代表べク トルに対応する上記 M個の符号帳 におけるラベルをそれぞれ決定し、 上記入力信号べク トルに対する符号化結果と して出力する。
3. それぞれがラベル付けされた同じ次元数の複数の代表べク トルからなる M個、 Mは 2以上の整数、 の符号帳を使って入力信号べク トルを符号化する方法であり、 以下のステップを含む:
(a) 上記 M個の符号帳の代表べク トルに対し、 それぞれ予め決めた上記代表べ ク トルと同じ次元数の M個の重み係数べク トルを乗算して得た重み付き代表べク トルからなる M個の重み付き符号帳を予め生成し、 M個の上記重み係数べク トル は互いに異なっており、 各上記重み係数べク トルの少なく とも 1つの要素は他の 少なくとも 1つの要素と異なっており、
(b) M個の上記重み付き符号帳からひとつずつ代表べク トルを選び、
(c) 上記 M個の重み付き代表べク トルを全て加算して合成代表べク トルを生成 し、
(d) 上記入力信号べク トルと上記合成代表べク トルとの間の距離を求め、
(e) 上記ステップ (b),(c),(d) を繰り返して上記入力信号べク トルとの間の距 離が最も小さい上記合成代表べク トルを探索し、
(f) 上記最小の距離を与えた上記合成代表べク トルを作るために用いた各上記 符号帳の代表べク トルに与えられた各ラベルを符号化出力とする。
4. それぞれがラベル付けされた同じ次元数の複数の代表べク トルからなる M個、 Mは 2以上の整数、 の符号帳を使って入力信号べク トルを符号化する方法であり、 以下のステップを含む:
(a) 上記 M個の符号帳の代表べク トルに対し、 それぞれ予め決めた上記代表べ ク トルと同じ次元数の M個の重み係数べク トルを乗算して得た重み付き代表べク トルからなる M個のグループの重み付き代表べク トルを得て、 M個の上記重み係 数べク トルは互いに異なる要素位置にそれぞれ最大の係数を有しており、
(b) M個の上記グループの重み付き代表べク トルをそれぞれ近似する M本の直 線を決め、
(c) M次元座標上において入力信号べク トルを上記 M本の直線に射影し、 射影 近傍にそれぞれ存在する複数の重み付き代表べク トルをそれぞれ予備選択して M 個のサブグループを決め、
(d) 上記 M個のサブグループのそれぞれから重み付き代表べク トルを選択して 加算し、 それによつて合成代表ベク トルを得て、
(e) 上記合成代表べク トルと上記入力信号べク トルとの間の距離を求め、
( f ) 上記ステップ(d) , (e) を上記 M個のサブグループの重み付き代表ベク トル の全ての組み合わせに付いて繰り返してそれぞれの場合の距離を求め、
(g) 最小距離を与えた組の重み付き代表べク トルに対応する上記 M個の符号帳 におけるラベルをそれぞれ決定し、 上記入力信号べク トルに対する符号化結果と して出力する。 -
5. 請求項 1、 2、 3又は 4のいずれかの方法において、 上記代表ベク トルに乗 算されている各重み係数べク トルの要素を対角要素とする行列とした時、 上記各 符号帳ごとの上記重み係数行列の和が単位行列の定数倍になるように上記重み係 数が選定されている。
6. 請求項 2又は 4の方法において、 上記サブグループを決めるステップは、 上 記入力信号べクトルが上記 M本の直線上にそれぞれ射影された位置から最も近い 予め決めた数の上記重み付き代表べク トルを選択するステップを含む。
7. 請求項 2又は 4の方法において、 上記サブグループを決めるステップは、 上 記入力信号べク トルが上記 M本の直線上にそれぞれ射影された位置から予め決め た距離の範囲内にある上記重み付き代表べク トルを選択するステップを含む。
8. 請求項 2又は 4の方法において、 各上記代表ベク トル及び各上記重み係数べ ク トルは M次元べク トルであり、 上記 M個の重み係数べク トルは互いに異なる要 素位置に最大の係数を有することにより上記要素位置を強調次元とし、 各上記符 号帳に対応する全ての上記重み付き代表べク トルの上記強調次元の要素の最大値 と最小値の間において、 上記強調次元の要素の値に基づいて F個の閾値を予め決 定し、 それによつて強調次元の要素の値を F + 1個の領域に分割し、 それぞれの 上記領域に上記重み付き代表べク トルを複数ずつ帰属させ、 Fは 1以上の整数で あり、 上記サブグループを決めるステップは上記 M本の直線に射影された上記入 力信号べク トルの上記強調次元における値を上記閾値と比較することにより上記 位置が上記領域のいずれに入るか判定し、 上記判定した領域に帰属する上記重み 付き代表べク トルを上記サブグループとするステップである。
9 . ラベル付けされた複数の励振べク トルを有する M個の励振源符号帳を使って 入力音響信号をべク トル符号化する方法であり、 Mは 2以上の整数、 Nは 1以上 の整数であり、 以下のステップを含む:
(a) 上記入力音響信号のベク トルのスペク トル形状パラメータを求め、 このス ぺク トル形状パラメータを量子化し、 その量子化パラメータを合成フィルタのフ ィルタ係数として設定し、
(b) 上記合成フィルタによる合成音の上記入力音響信号に対する歪が最小とな るように上記 M個の励振源符号帳から M個の励振べク トルを決定し、
(c) それぞれがラベル付けされた複数の M次元の利得べク トルからなる M個の 利得符号帳から 1つずつ利得べク トルを選び、
(d) M個の上記利得符号帳から選択された上記利得べク トルに M個の予め決め た M次元重み係数べク トルをそれぞれ乗算して M個の重み付き利得べク トルを生 成し、 M個の上記重み係数べク トルは互いに異なる要素位置に最大の係数を有し、
(e) 上記 M個の重み付き利得べク トルを全て加算して合成利得べク トルを生成 し、 上記合成利得べク トルの第 1〜第 Mの要素をそれぞれ第 1〜第 M利得とし、
( f ) 上記決定した M個の励振べク トルに上記第 1〜第 M利得をそれぞれ与え、
(g) 上記利得が付与された M個の励振べク トルを加算し、 その加算出力で上記 合成フィルタを励振して合成音響信号を生成し、
(h) 上記合成フィルタからの上記合成音響信号の上記入力音響信号に対する歪 を求め、
( i ) 上記 M個の利得符号帳のそれぞれの利得べク トルの全ての組み合わせに付 いて上記ステップ(c)〜(h)を繰り返して最小の歪を与える M個の利得べク トルを 決定し、 それらに対応する M個の利得ラベルを求め、 (j ) 上記ステップ(i ) で求めた上記 M個の利得ラベル及び上記ステップ(b) で 求めた上記励振源符号帳のラベルを上記入力音響信号に対する符号化結果の少な くとも一部として出力する。
1 0. ラベル付けされた複数の励振べク トルを有する M個の励振源符号帳を使つ て入力音響信号をべク トル符号化する方法であり、 以下のステップを含む:
(a) 上記入力音響信号ベク トルのスペク トル形状パラメータを求め、 このスぺ ク トル形状パラメータを量子化し、 その量子化パラメータを合成フィルタのフィ ルタ係数として設定し、
(b) 上記合成フィルタによる合成音の上記入力音響信号に対する歪が最小とな るように上記 M個の励振源符号帳からそれぞれ 1つの励振べク トルを決定し、
(c) 上記決定された M個の励振べク トルにそれぞれ第 1〜第 M利得を与えて互 いに加算して励振信号べク トルを生成し、 上記合成フィルタに与えて合成した音 響信号の上記入力音響信号に対する歪が最小となるよう最適な上記第 1〜第 M利 得を求め、
(d) それぞれがラベル付けされた複数の M次元利得べク トルからなる M個の利 得符号帳のそれぞれの利得べク トルと、 上記 M個の利得符号帳に対して予め決め た M個の M次元重み係数べク トルを乗算して M個のグループの重み付き利得べク トルを得て、 M個の上記グループの重み付き利得べク トルをそれぞれ近似する M 本の直線を決め、 M個の上記重み係数べク トルは互いに異なる要素位置に最大の 係数をそれぞれ有し、
(e) M次元座標上において上記最適な第 1〜第 M利得を要素とするべク トルを 上記 M本の直線に射影し、 射影近傍にそれぞれ存在する複数の重み付き利得べク トルを上記 M個のグループからそれぞれ予備選択して M個のサブグループを決め、
( f ) 上記 M個のサブグループのそれぞれから重み付き代表べク トルを 1つずつ 選択して加算し、 それによつて M次元合成利得ベク トルを得て、 上記合成利得べ ク トルの第 1〜第 M利得要素を第 1〜第 M利得と規定し、
(g) 上記ステップ(b) で決定された上記 M個の励振べク トルに上記合成利得べ ク トルの第 1〜第 M利得要素をそれぞれ乗算し、 互いに加算して励振信号べク ト ルを生成し、 (h) 上記ステップ(g) で生成した励振信号べク トルを上記合成フ ィルタに与え て合成した音響信号の上記入力音響信号に対する歪を求め、
( i ) 上記ステップけ),(g),(h) を上記 M個のサブグループの重み付き代表べク トルの全ての組み合わせに付いて繰り返してそれぞれの場合の歪を求め、 最小歪 を与えた組の重み付き利得べク トルに対応する上記 M個の符号帳における利得ラ ベルをそれぞれ決定し、
(j ) 上記決定した M個の励振べク トルのラベルと上記決定した利得ラベルを上 記入力信号べク トルに対する符号化結果の少なく とも一部として出力する。
1 1 . ラベル付けされた複数の励振べク トルを有する M個の励振源符号帳を使つ て入力音響信号をべク トル符号化する方法であり、 以下のステップを含む:
(a) 上記入力音響信号べク トルのスぺク トル形状パラメータを求め、 このスぺ ク トル形状パラメータを量子化し、 その量子化パラメータを合成フィルタのフィ ルタ係数として設定し、
(b) 上記合成フィルタによる合成音の上記入力音響信号に対する歪が最小とな るように上記 M個の励振源符号帳からそれぞれ 1つの励振べク トルを決定し、
(c) M個の利得符号帳の M次元利得べク トルに対し、 それぞれ予め決めた M個 の M次元重み係数べク トルを乗算して得た M個のグループのラベル付けされた重 み付き利得べク トルからなる M個の重み付き符号帳を予め生成し、 Mは 2以上の 整数であり、 M個の上記重み係数べク トルは互いに異なる要素位置にそれぞれ最 大の係数を有しており、
(d) M個の上記重み付き符号帳から 1つずつ代表べク トルを選び、
(e) 選択された上記 M個の重み付き利得べク トルを全て加算して合成利得べク トルを生成し、 上記合成利得べク トルの第 1〜第 M要素をそれぞれ第 1〜第 M利 得とし、
(f ) 上記決定した M個の励振べク トルに上記第 1〜第 M利得をそれぞれ与え、
(g) 上記第 1〜第 M利得が付与された M個の励振べク トルを加算し、 その加算 出力で上記合成フィルタを励振して合成音響信号を生成し、
(h) 上記合成フ ィルタからの上記合成音響信号の上記入力音響信号に対する歪 を求め、 ( i ) M個の重み付き符号帳のそれぞれの重み付き利得べク トルの全ての組み合 わせに付いて上記ステップ(d)〜(h)を繰り返して最小の歪を与える M個の重み付 き利得べクトルを決定し、 それらに対応する M個のラベルを求め、
(j ) 上記ステップ(i ) で求めた M個の上記重み付き利得符号帳の M個のラベル と、 上記ステップ(b) で求めた上記 M個の励振源符号帳のラベルを上記入力音響 信号の符号化結果の少なくとも一部として出力する。
1 2 . ラベル付けされた複数の励振べク トルを有する M個の励振源符号帳を使つ て入力音響信号をべクトル符号化する方法であり、 以下のステップを含む:
(a) 上記入力音響信号べク トルのスぺク トル形状パラメータを求め、 このスぺ ク トル形状パラメータを量子化し、 その量子化パラメータを合成フィルタのフィ ルタ係数として設定し、
(b) 上記合成フィルタによる合成音の上記入力音響信号に対する歪が最小とな るように上記 M個の励振源符号帳からそれぞれ 1つの励振べク トルを決定し、
(c) 上記決定された M個の励振べクトルにそれぞれ第 1〜第 M利得を与えて互 いに加算して励振信号べク トルを生成し、 上記合成フィルタに与えて合成した音 響信号の上記入力音響信号に対する歪が最小となるよう最適な上記第 1〜第 M利 得を求め、
(d) M個の利得符号帳の M次元利得べク トルに対し、 それぞれ予め決めた M個 の M次元重み係数べク トルを乗算して得た M個のグループのラベル付けされた重 み付き利得べク トルからなる M個の重み付き符号帳を予め生成し、 Mは 2以上の 整数であり、 M個の上記重み係数べク トルは互いに異なる要素位置にそれぞれ最 大の係数を有しており、 M個の上記グループの重み付き利得べク トルをそれぞれ 近似する M本の直線を決め、
(e) M次元座標上において上記最適な第 1〜第 M利得を要素とするべク トルを 上記 M本の直線に射影し、 射影近傍にそれぞれ存在する複数の重み付き利得べク トルを上記 M個のグループからそれぞれ予備選択して M個のサブグループを決め、
( f ) 上記 M個のサブグループのそれぞれから重み付き利得べク トルを 1つずつ 選択して加算し、 それによつて M次元合成利得ベク トルを得て、 上記合成利得べ ク トルの第 1〜第 M利得要素を第 1〜第 M利得と規定し、 上記ステップ(b) で決定された上記 M個の励振べク トルに上記合成利得べ ク トルの第 1〜第 M利得要素をそれぞれ乗算し、 互いに加算して励振信号べク ト ルを生成し、
(h) 上記ステップ(g) で生成した励振信号べク トルを上記合成フ ィルタに与え て合成した音響信号の上記入力音響信号に対する歪を求め、
( i ) 上記ステップ ),(g) , (h) を上記 M個のサブグループの重み付き代表べク トルの全ての組み合わせに付いて繰り返してそれぞれの場合の歪を求め、 最小ひ ずみを与えた組の重み付き利得べク トルに対応する上記 M個の符号帳における利 得ラベルをそれぞれ決定し、
(j ) 上記決定した M個の励振べク トルのラベルと上記決定した利得ラベルを上 記入力信号べク トルに対する符号化結果の少なく とも一部として出力する。
1 3 . 請求項 9、 1 0、 1 1又は 1 2のいずれかの方法において、 上記利得べク トルに乗算されている各重み係数べク トルの要素を対角要素とする行列とした時、 上記各符号帳ごとの上記重み係数行列の和が単位行列の定数倍になるように上記 重み係数が選定されている。
1 4. 請求項 1 0又は 1 2の方法において、 上記サブグループを決めるステップ は、 上記第 1〜第 M利得を要素とするべク トルが上記 M本の直線上にそれぞれ射 影された位置から最も近い予め決めた数の上記重み付き利得べク トルを選択する ステップを含む。
1 5 . 請求項 1 0又は 1 2の方法において、 上記サブグループを決めるステップ は、 上記第 1〜第 M利得を要素とするべク トルが上記 M本の直線上にそれぞれ射 影された位置から予め決めた距離の範囲内にある上記重み付き利得べク トルを選 択するステップを含む。
1 6 . 請求項 1 0又は 1 2の方法において、 各上記重み係数ベク トルが最大の係 数を有する上記要素位置を強調次元と規定すると、 各上記利得符号帳に対応する 全ての上記重み付き利得べク トルの上記強調次元の要素の最大値と最小値の間に おいて、 上記強調次元の要素の値に基づいて F個の閾値を予め決定し、 それによ つて強調次元の要素の値を F + 1個の領域に分割し、 それぞれの上記領域に上記 重み付き利得べク トルを複数ずつ帰属させ、 Fは 1以上の整数であり、 上記サブ グループを決めるステップは、 上記 M本の直線に射影された上記最適な第 1〜第 M利得を要素とするべク トルの上記強調次元の位置を上記閑値と比較することに より上記位置が上記領域のいずれに入るか判定し、 上記判定した領域に帰属する 上記重み付き利得べク トルを上記サブグループとするステップである。
1 7 . 複数の符号帳を使って入力信号べク トルをべク トル符号化する符号化器で あり、 以下を含む:
それぞれがラベル付けされた複数の代表べク トルを有する M個の符号帳と、 上記 M個の符号帳からそれぞれ選択された代表べク トルに予め決めた M個の重 み係数べク トルをそれぞれ乗算して重み付き代表べク トルを生成する乗算手段と、 Mは 2以上の整数であり、 上記 M個の重み係数ベク トルは互いに異なり、 各上記 重み係数べク トルの少なくとも 1つの要素は他の少なく とも 1つの要素と異なつ ており、
上記 M個の重み付きべク トルを加算して合成代表べク トルを生成するべク トル 合成部と、
上記べク トル合成部からの上記合成代表べク トルと入力信号べク トルとの距離 を算出する距離算出部と、
上記 M個の重み付き符号帳からの重み付き代表べク トルの選択を変えて上記べ ク トル合成部及び上記距離算出部の動作を実行させ、 上記距離が最小となる上記 M個の符号帳の重み付き代表べク トルの組を決定し、 それぞれの対応するラベル を上記入力信号べク トルに対する符号化結果として出力する制御部。
1 8. 複数の符号帳を使って入力信号べク トルをべク トル符号化する符号化器で あり、 以下を含む:
M個のグループの代表べク トルにそれぞれ重み係数べク トルを乗算して生成し た M個のグループの重み付き代表べク トルを有する M個の重み付き代表符号帳と、 Mは 2以上の整数であり、 上記 M個の重み係数ベク トルは互いに異なり、 各上記 重み係数べク トルの少なく とも 1つの要素は他の少なく とも 1つの要素と異なつ ており、
上記 M個の重み付き符号帳からそれぞれ選択された M個の重み付きべク トルを 加算して合成代表べク トルを生成するべク トル合成部と、 上記べク トル合成部からの上記合成代表べク トルと入力信号べク トルとの距離 を算出する距離算出部と、
上記 M個の重み付き符号帳からの重み付き代表べク トルの選択を変えて上記べ ク トル合成部及び上記距離算出部の動作を実行させ、 上記距離が最小となる上記 M個の重み付き符号帳の重み付き代表べク トルの組を決定し、 それぞれの対応す るラベルを上記入力信号べク トルに対する符号化結果として出力する制御部。
1 9. 請求項 1 7又は 1 8の符号化器において、 上記 M個の重み係数ベク トルは、 それらの要素を対角要素とする M個の対角行列の和が単位行列の定数倍となるよ うに決められている。
2 0. 請求項 1 7又は 1 8の符号化器において、 上記制御部は上記 M個のグルー プの重み付き代表べク トルとそれぞれ最も近い M本の直線を決め、 上記入力信号 べク トルを上記 M本の直線上に射影した点の近傍の複数の重み付き代表べク トル をそれぞれサブグループとして上記 M個の重み付き代表符号帳から予備選択し、 上記 M個のサブグループからそれぞれ選択した M個の重み付き代表べク トルの全 ての組に付いて上記距離算出部により距離を算出させて上記最小の距離を与える 組の重み付き代表べク トルを決定する手段を含む。
2 1 . 複数の励振ベク トルを有する M個の励振源符号帳と、 Mは 2以上の整数で あり、
上記 M個の励振源符号帳からの上記 M個の励振べク トルにそれぞれ第 1〜第 M 利得を付与する第 1〜第 M利得付与部と、
上記第 1〜第 M利得付与部からの上記利得付与された M個の励振べク トルを加 算して励振信号べク トルを生成する加算部と、
入力音響信号を分析してスぺク トル形状を表すパラメータを得て、 上記パラメ 一タを量子化してフィルタ係数を生成するフィルタ係数生成手段と、
上記フ ィルタ係数が設定され、 上記励振信号べク トルにより励振されて音響信 号を合成する合成フ ィルタと、
上記入力音響信号と上記合成された音響信号の差分を求め、 その差分から上記 合成された音響信号の上記入力音響信号に対する歪を算出する歪算出手段と、 それぞれがラベル付けされた複数の M次元利得べク トルを有する M個の利得符 号帳と、
上記 M個の利得符号帳からそれぞれ選択された利得べク トルに予め決めた M個 の M次元重み係数べク トルをそれぞれ乗算して重み付き利得べク トルを生成する 乗算手段と、 上記 M個の重み係数べクトルは互いに異なる要素位置に最大の係数 をそれぞれ有し、
上記 M個の重み付き利得べク トルを加算して M次元の合成利得べク トルを生成 し、 上記合成利得べク トルの第 1〜第 M要素をそれぞれ第 1〜第 M利得として上 記第 1〜第 M利得付与部に設定するべク トル合成部と、
上記 M個の励振源符号帳からの上記 M個の励振べク トルの選択を制御して、 上 記合成音響信号の上記入力音響信号に対する歪を最小とする上記 M個の励振べク トルの組を決定し、 その状態で上記 M個の利得符号帳からそれぞれ選択する利得 べク トルの組毎に上記合成フィルタにより合成される音響信号の上記入力音響信 号に対する上記歪を算出手段により得て、 最小の歪を与えた組の M個の利得べク トルを決定し、 上記決定された M個の利得べク トルに対応する上記 M個の利得符 号帳のラベルと、 上記決定された M個の励振べク トルに対応するラベルとを上記 入力音響信号に対する符号化結果の少なくとも一部として出力する制御手段、 とを含む。
2 2 . 複数の励振べク トルを有する M個の励振源符号帳と、 Mは 2以上の整数で あり、
上記 M個の励振源符号帳からの上記 M個の励振べク トルにそれぞれ第 1〜第 M 利得を付与する第 1〜第 M利得付与部と、
上記第 1〜第 M利得付与部からの上記利得付与され'た M個の励振べク トルを加 算して励振信号べク トルを生成する加算部と、
入力音響信号を分析してスぺク トル形状を表すパラメータを得て、 上記パラメ ータを量子化してフィルタ係数を生成するフィルタ係数生成手段と、
上記フ ィルタ係数が設定され、 上記励振信号べク トルにより励振されて音響信 号を合成する合成フィルタと、
上記入力音響信号と上記合成された音響信号の差分を求め、 その差分から上記 合成された音響信号の上記入力音響信号に対する歪を算出する歪算出手段と、 M個のグループの M次元の利得べク トルにそれぞれ M次元の重み係数べク トル を乗算して生成した M個のグループの重み付き利得べク トルを有する M個の重み 付き利得符号帳と、 上記 M個の重み係数べク トルは互いに異なる要素位置にそれ それ最大の係数を有し、
上記 M個の重み付き符号帳からそれぞれ選択された M個の重み付きべク トルを 加算して合成代表べク トルを生成し、 上記合成利得べク トルの第 1〜第 M要素を それぞれ第 1〜第 M利得として上記第 1〜第 M利得付与部に設定するべク トル合 成部と、
上記 M個の励振源符号帳からの上記 M個の励振べク トルの選択を制御して、 上 記合成音響信号の上記入力音響信号に対する歪を最小とする上記 M個の励振べク トルの組を決定し、 その状態で上記 M個の重み付き利得符号帳からそれぞれ選択 する重み付き利得べク トルの組毎に上記合成フ ィルタにより合成される音響信号 の上記入力音響信号に対する上記歪を算出手段により得て、 最小の歪を与えた組 の M個の重み付き利得べク トルを決定し、 上記決定された M個の重み付き利得べ ク トルに対応する上記 M個の重み付き利得符号帳のラベルと、 上記決定された M 個の励振べク トルに対応するラベルとを上記入力音響信号に対する符号化結果の 少なくとも一部として出力する制御手段、
とを含む。
2 3. 請求項 2 1又は 2 2の符号化器において、 上記 M個の重み係数ベク トルは、 それらの要素を対角要素とする M個の対角行列の和が単位行列の定数倍となるよ うに決められている。
2 4. クレーム 2 1又は 2 2の符号化器において、 上記制御手段は上記 M個のグ ループの重み付き利得べク トルとそれぞれ最も近い M本の直線を決め、 上記 M個 の励振べク トルが決定されている状態で、 上記第 1〜第 M利得を制御して歪が最 小となる最適な第 1〜第 M利得を決定し、 上記最適な第 1〜第 M利得をべク トル として上記 M本の直線上に射影した点の近傍の複数の重み付き利得べク トルをそ れぞれサブグループとして上記 M個のグループの重み付き利得べク トルから予備 選択し、 上記 M個のサブグループからそれぞれ選択した M個の重み付き利得べク トルの全ての組に付いて上記歪算出手段により歪を算出させて上記最小の歪を与 える組の重み付き利得べク トルを決定する手段を含む。
2 5. 入力された符号を複数の符号帳を参照して復号する復号化器であり、 それぞれがラベル付けされた複数の代表べク トルを有する M個の符号帳と、 M は 2以上の整数であり、
入力符号中の各ラベルに応じた代表べク トルを対応する符号帳からそれぞれ取 出し、 それらに、 上記 M個の符号帳に対し予め決めた M個の重み係数ベク トルを 乗算して M個の重み付き代表べク トルを生成する乗算手段と、
上記 M個の重み付き代表べク トルを合成して再生べク トルを出力するべク トル 合成部、
とを含み、 上記 M個の重み係数ベク トルは互いに異なっており、 各上記重み係数 べク トル内の少なくとも 1つの要素は他の少なく とも 1つの要素と異なっている。
2 6 . 入力された符号を複数の符号帳を参照して復号する復号化器であり、 それぞれがラベル付けされた複数の重み付き代表べク トルを有する M個の重み 付き符号帳と、 Mは 2以上の整数であり、
入力符号中のそれぞれ M個のラベルに対応する重み付き代表べク トルを上記 M 個の重み付き符号帳からそれぞれ取出して合成し、 再生べク トルを得るべク トル 合成部、
とを含み、 上記 M個の重み係数べク トルは互いに異なっており、 各上記重み係数 べク トル内の少なく とも 1つの要素は他の少なく とも 1つの要素と異なっている。
2 7 . 請求項 2 5又は 2 6の復号化器において、 上記 M個の重み係数べク トルの それぞれの要素を対角要素とする M個の対角行列の和が単位行列の定数倍になる ように上記 M個の重み係数べク トルが選定されている。
PCT/JP1995/001989 1994-10-07 1995-09-29 Procede de codage de vecteurs et codeur/decodeur associe WO1996011468A1 (fr)

Priority Applications (9)

Application Number Priority Date Filing Date Title
US08/793,133 US5825311A (en) 1994-10-07 1995-09-29 Vector coding method, encoder using the same and decoder therefor
DE69527078T DE69527078T2 (de) 1994-10-07 1995-09-29 Verfahren zur vektorkodierung und entsprechender kodierer/dekodierer
US09/691,862 USRE38279E1 (en) 1994-10-07 1995-09-29 Vector coding method, encoder using the same and decoder therefor
KR1019970702269A KR100215709B1 (ko) 1994-10-07 1995-09-29 벡터부호화 방법 및 그것을 사용한 부호화기 및복호화기
AU35782/95A AU682128B2 (en) 1994-10-07 1995-09-29 Vector encoding method and encoder/decoder using the method
EP95932940A EP0786762B1 (en) 1994-10-07 1995-09-29 Vector encoding method and encoder/decoder using the method
CA 2201858 CA2201858C (en) 1994-10-07 1995-09-29 Vector coding method, encoder using the same and decoder therefor
FI971373A FI118104B (fi) 1994-10-07 1997-04-03 Vektorikoodausmenetelmä, sitä käyttävä kooderi ja dekooderi
HK98100715A HK1001636A1 (en) 1994-10-07 1998-01-27 Vector encoding method and encoder/decoder using the method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP24412894A JP3273455B2 (ja) 1994-10-07 1994-10-07 ベクトル量子化方法及びその復号化器
JP6/244128 1994-10-07

Publications (1)

Publication Number Publication Date
WO1996011468A1 true WO1996011468A1 (fr) 1996-04-18

Family

ID=17114186

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1995/001989 WO1996011468A1 (fr) 1994-10-07 1995-09-29 Procede de codage de vecteurs et codeur/decodeur associe

Country Status (12)

Country Link
US (2) USRE38279E1 (ja)
EP (1) EP0786762B1 (ja)
JP (1) JP3273455B2 (ja)
KR (1) KR100215709B1 (ja)
CN (1) CN1167046C (ja)
AU (1) AU682128B2 (ja)
DE (1) DE69527078T2 (ja)
FI (1) FI118104B (ja)
HK (1) HK1001636A1 (ja)
MY (1) MY116640A (ja)
TW (1) TW294870B (ja)
WO (1) WO1996011468A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998029953A1 (en) * 1996-12-31 1998-07-09 Iterated Systems, Inc. Method and apparatus for modeling discrete data sequences by multiple vector representation

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU727706B2 (en) * 1995-10-20 2000-12-21 Facebook, Inc. Repetitive sound compression system
JP3684751B2 (ja) * 1997-03-28 2005-08-17 ソニー株式会社 信号符号化方法及び装置
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
AU2002952079A0 (en) * 2002-10-16 2002-10-31 Darrell Ballantyne Copeman Winch
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
JP3887598B2 (ja) * 2002-11-14 2007-02-28 松下電器産業株式会社 確率的符号帳の音源の符号化方法及び復号化方法
DE102004041418A1 (de) * 2004-08-26 2006-03-09 Micronas Gmbh Verfahren zur Codierung eines ersten und zweiten Datenwortes und Verfahren zur Decodierung eines codierten Datenwortes
US20060080090A1 (en) * 2004-10-07 2006-04-13 Nokia Corporation Reusing codebooks in parameter quantization
JP2006295829A (ja) * 2005-04-14 2006-10-26 Nippon Hoso Kyokai <Nhk> 量子化装置、量子化プログラム、及び信号処理装置
US20100049508A1 (en) * 2006-12-14 2010-02-25 Panasonic Corporation Audio encoding device and audio encoding method
BRPI0818062A2 (pt) * 2007-10-12 2015-03-31 Panasonic Corp Quantizador vetorial, quantizador vetorial inverso, e métodos
WO2013185857A1 (en) * 2012-06-14 2013-12-19 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for scalable low-complexity coding/decoding
EP3069338B1 (en) 2013-11-13 2018-12-19 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder for encoding an audio signal, audio transmission system and method for determining correction values
AU2020340956A1 (en) * 2019-09-03 2022-03-24 Dolby Laboratories Licensing Corporation Audio filterbank with decorrelating components

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03101423A (ja) * 1989-06-13 1991-04-26 American Teleph & Telegr Co <Att> 多要素信号を符号化する方法および装置
JPH0458617A (ja) * 1990-06-28 1992-02-25 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH05232994A (ja) * 1992-02-25 1993-09-10 Oki Electric Ind Co Ltd 統計コードブック
JPH06130995A (ja) * 1992-10-16 1994-05-13 Oki Electric Ind Co Ltd 統計コードブック及びその作成方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63187376A (ja) * 1987-01-29 1988-08-02 Nec Corp パタ−ン認識装置
JPH02287399A (ja) * 1989-04-28 1990-11-27 Fujitsu Ltd ベクトル量子化制御方式
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5313552A (en) * 1991-03-27 1994-05-17 Unisys Corporation Apparatus for quantizing an input group of data samples into one of N quantized groups of data via a process on less than N/2 reference groups of data samples
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
JP3224955B2 (ja) * 1994-05-27 2001-11-05 株式会社東芝 ベクトル量子化装置およびベクトル量子化方法
IT1271182B (it) * 1994-06-20 1997-05-27 Alcatel Italia Metodo per migliorare le prestazioni dei codificatori vocali
JP2970407B2 (ja) * 1994-06-21 1999-11-02 日本電気株式会社 音声の励振信号符号化装置
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03101423A (ja) * 1989-06-13 1991-04-26 American Teleph & Telegr Co <Att> 多要素信号を符号化する方法および装置
JPH0458617A (ja) * 1990-06-28 1992-02-25 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH05232994A (ja) * 1992-02-25 1993-09-10 Oki Electric Ind Co Ltd 統計コードブック
JPH06130995A (ja) * 1992-10-16 1994-05-13 Oki Electric Ind Co Ltd 統計コードブック及びその作成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP0786762A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998029953A1 (en) * 1996-12-31 1998-07-09 Iterated Systems, Inc. Method and apparatus for modeling discrete data sequences by multiple vector representation
US5835037A (en) * 1996-12-31 1998-11-10 Iterated Systems, Inc. Method and apparatus for modeling discrete data sequences by multiple vector representation

Also Published As

Publication number Publication date
FI118104B (fi) 2007-06-29
AU3578295A (en) 1996-05-02
JP3273455B2 (ja) 2002-04-08
EP0786762A4 (en) 1999-03-03
AU682128B2 (en) 1997-09-18
MY116640A (en) 2004-03-31
KR100215709B1 (ko) 1999-09-01
EP0786762B1 (en) 2002-06-12
DE69527078D1 (de) 2002-07-18
CN1167046C (zh) 2004-09-15
EP0786762A1 (en) 1997-07-30
US5825311A (en) 1998-10-20
HK1001636A1 (en) 1998-07-03
JPH08110799A (ja) 1996-04-30
USRE38279E1 (en) 2003-10-21
TW294870B (ja) 1997-01-01
CN1158665A (zh) 1997-09-03
FI971373A (fi) 1997-04-03
FI971373A0 (fi) 1997-04-03
DE69527078T2 (de) 2002-12-19

Similar Documents

Publication Publication Date Title
WO1996011468A1 (fr) Procede de codage de vecteurs et codeur/decodeur associe
EP0405584B1 (en) Gain-shape vector quantization apparatus
US5819215A (en) Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
EP2200023B1 (en) Multichannel signal coding method and apparatus and program for the methods, and recording medium having program stored thereon.
US20110035226A1 (en) Complex-transform channel coding with extended-band frequency coding
US20080071548A1 (en) Multi-Channel Signal Encoding Method, Decoding Method, Device Thereof, Program, and Recording Medium Thereof
US20090228284A1 (en) Method and apparatus for encoding/decoding multi-channel audio signal by using a plurality of variable length code tables
EP0704836B1 (en) Vector quantization apparatus
US5799131A (en) Speech coding and decoding system
EP0462558A2 (en) Speech coding system
Skoglund et al. Predictive VQ for noisy channel spectrum coding: AR or MA?
US20050228652A1 (en) Fixed sound source vector generation method and fixed sound source codebook
JPH01205638A (ja) 多量ベクトル量子化方法及びその装置
JP3285185B2 (ja) 音響信号符号化方法
Yang et al. Adaptive Karhunen-Loeve transform for enhanced multichannel audio coding
Agrell Spectral coding by fast vector quantization
CA2201858C (en) Vector coding method, encoder using the same and decoder therefor
WO2023074800A1 (ja) 情報処理装置および方法、並びにプログラム
JP2853824B2 (ja) 音声のパラメータ情報符号化法
WO2023074009A1 (ja) 情報処理装置および方法、並びにプログラム
JPH08234797A (ja) 音声パラメータ量子化装置およびベクトル量子化装置
JPH08101700A (ja) ベクトル量子化装置
JPH04333900A (ja) 音声符号化装置
JP3267308B2 (ja) 統計励振コードベクトルの最適化方法、多段コード励振線形予測符号化器及び多段コード励振線形予測復号化器
JP3272214B2 (ja) 格子量子化器および入力ベクトルを格子量子化するための方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 95195265.X

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AU CA CN FI KR SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1995932940

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 971373

Country of ref document: FI

ENP Entry into the national phase

Ref document number: 2201858

Country of ref document: CA

Ref document number: 2201858

Country of ref document: CA

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 1019970702269

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 08793133

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1995932940

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1019970702269

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1019970702269

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1995932940

Country of ref document: EP