WO2012008330A1 - 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 - Google Patents

符号化装置、復号装置、これらの方法、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2012008330A1
WO2012008330A1 PCT/JP2011/065335 JP2011065335W WO2012008330A1 WO 2012008330 A1 WO2012008330 A1 WO 2012008330A1 JP 2011065335 W JP2011065335 W JP 2011065335W WO 2012008330 A1 WO2012008330 A1 WO 2012008330A1
Authority
WO
WIPO (PCT)
Prior art keywords
index
correspondence table
subframe
gain
encoding
Prior art date
Application number
PCT/JP2011/065335
Other languages
English (en)
French (fr)
Inventor
守谷 健弘
登 原田
優 鎌本
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2012524520A priority Critical patent/JP5320508B2/ja
Publication of WO2012008330A1 publication Critical patent/WO2012008330A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Definitions

  • the present invention relates to a technique for encoding or decoding sound signals such as voice and music.
  • the present invention relates to a technique for encoding or decoding a gain of a periodic component and a gain of a pulse component that are encoded by an encoding technique such as CELP.
  • the gain of the periodic component and the pulse component used in the coding and decoding of CELP is assigned with a fixed bit in order to increase the tolerance against the code error, and is encoded and decoded.
  • CELP Code Excited Linear Prediction
  • the amount of code can be reduced in consideration of the temporal continuity of the gain value by making the encoding target the ratio to the predicted value from the past subframe, not the gain itself. I was going.
  • Patent Document 1 it is determined whether or not there is temporal continuity of the gain value of the periodic component from the gain of the periodic component, and when it is predicted that there is temporal continuity, The amount of code is reduced by variable-length coding the difference between gain values.
  • Patent Document 1 discloses a technique for performing encoding and decoding in consideration of continuity and frequency of gain values of periodic components.
  • this technique cannot be applied to an index obtained by encoding a gain value. For this reason, it is possible to increase the efficiency of encoding and decoding in consideration of continuity and frequency with respect to the index corresponding to the gain obtained by the encoding device such as CELP described in Non-Patent Document 1. There wasn't.
  • An object of the present invention is to provide a more efficient encoding device, decoding device, and an index corresponding to a gain obtained by an encoding device such as CELP, in consideration of continuity and frequency of gain values corresponding to the index, It is to provide these methods, programs and recording media.
  • an index corresponding to a set of periodic component gain and pulsed component gain in the immediately preceding subframe and an index corresponding to a set of periodic component gain and pulsed component gain in the current subframe And calculate the difference value.
  • a variable length code is generated by encoding a difference value by a variable length encoding method in which a shorter code is assigned as the absolute value of the value is smaller.
  • an input code is decoded by a variable length decoding method to obtain a difference value.
  • the index is obtained by adding the difference value to the index of the immediately preceding subframe.
  • the functional block diagram of the example of an encoding apparatus and a decoding apparatus The functional block diagram of the example of a CELP encoding part.
  • the functional block diagram of the example of the gain encoding part of 1st embodiment The functional block diagram of the example of the gain decoding part of 1st embodiment.
  • the functional block diagram of the example of a CELP decoding part The functional block diagram of the example of the gain encoding part of 2nd embodiment.
  • the functional block diagram of the example of the gain encoding part of 3rd embodiment The functional block diagram of the example of the gain decoding part of 3rd embodiment.
  • the flowchart which shows the example of the gain decoding method of 4th embodiment. The figure which illustrates the set of gain which constitutes a gain codebook.
  • the figure which illustrates auxiliary information The figure which illustrates auxiliary information.
  • the encoding apparatus includes, for example, a CELP encoding unit 1 and a gain encoding unit 2 as shown in FIG.
  • the CELP encoding unit 1 calculates an index indicating a periodic component, an index indicating a pulse component, an index indicating a set of gains, and a linear prediction coefficient from the input sound signal by the following processing. (Step A, FIG. 13).
  • the input sound signal is input to the CELP encoding unit 1. As shown in FIG.
  • the CELP encoding unit 1 includes a linear prediction analysis unit 11, a subtraction unit 12, a linear prediction synthesis unit 13, an adaptive codebook storage unit 14, a noise codebook storage unit 15, and a gain codebook storage unit 16. , A first multiplication unit 17, an addition unit 18, a second multiplication unit 19, an auditory weighting filter unit 110, and a distortion minimization unit 111.
  • the linear prediction analysis unit 11 performs linear prediction analysis on the input sound signal, obtains a linear prediction coefficient, and quantizes it.
  • the quantized linear prediction coefficient is sent to the linear prediction synthesis unit 13. Also, an index corresponding to the quantized linear prediction coefficient is output and sent to the decoding device.
  • the adaptive codebook storage unit 14 stores an adaptive codebook
  • the noise codebook storage unit 15 stores a noise codebook
  • the gain codebook storage unit 16 stores a gain codebook. .
  • Gain codebook is the ratio of the gains g p applied to the periodicity components selected from the adaptive codebook, the gain g C applied to the pulse component selected from the noise codebook and the prediction gain g c ' ⁇ gc
  • An index is associated with a set of gains (g p , ⁇ gc ) composed of It referred to as a gain corresponding to the gain g p to the periodic component is referred to as a gain corresponding to gamma gc pulse component.
  • an index is defined for each of a plurality of gain sets.
  • FIG. 22 illustrates a set of gains constituting the gain codebook.
  • the horizontal axis in FIG. 22 represents the gain value corresponding to the periodic component, and the vertical axis in FIG. 22 represents the gain value corresponding to the pulse component.
  • the 128 points in FIG. 22 indicate a set of gains corresponding to indices from 0 to 127 from the left.
  • the first multiplication unit 17 multiplies the periodic component selected from the adaptive codebook by the gain corresponding to the periodic component constituting the gain set selected from the gain codebook.
  • the multiplied signal is sent to the adder 18.
  • the second multiplication unit 19 multiplies the pulse component selected from the noise codebook and the gain corresponding to the pulse component constituting the gain set selected from the gain codebook.
  • the multiplied signal is sent to the adder 18.
  • the adder 18 adds the signal from the first multiplier 17 and the signal from the second multiplier 19. The added signal is sent to the linear prediction synthesis unit 13.
  • the linear prediction synthesis unit 13 synthesizes a sound signal by applying a linear prediction synthesis filter determined by the linear prediction coefficient obtained by the linear prediction analysis unit 11 to the added signal.
  • the synthesized sound signal is sent to the subtracting unit 12.
  • the subtracting unit 12 obtains a residual signal between the input signal and the synthesized sound signal.
  • the residual signal is sent to the auditory weighting filter unit 110.
  • the auditory weighting filter unit 110 applies a perceptual weighting filter to the residual signal to generate a signal obtained by shaping the quantization noise of the residual signal.
  • the generated signal is sent to the distortion minimizing unit 111.
  • the distortion minimizing unit 111 appropriately selects a periodic component from the adaptive codebook, a pulse component from the noise codebook, and a gain set from the gain codebook so that the shaped signal becomes small. Take control.
  • One frame is composed of a plurality of subframes. For example, in CELP coding described in Non-Patent Document 1, a 20 ms (160 sample) frame is composed of four 5 ms (40 sample) subframes.
  • distortion minimizing section 111 selects a periodic component from the adaptive codebook, a pulse component from the noise codebook, and a gain set from the gain codebook.
  • the index indicating the selected periodic component and the index indicating the selected pulse component are sent to the decoding device.
  • the adaptive codebook storage unit 14 stores the excitation signal u (n) of the previous frame as an adaptive codebook, and a periodic component is generated from the adaptive codebook.
  • the distortion minimizing unit 111 calculates the excitation signal u (n) of the frame and sends it to the adaptive codebook storage unit 14.
  • an index corresponding to a subframe and an index of a subframe mean an index corresponding to a set of gains selected by the distortion minimizing unit 111 for the subframe.
  • the index corresponding to each subframe is sent to the rearrangement unit 21.
  • An index corresponding to each subframe is encoded by a gain encoding unit 2 described later (step B, FIG. 13).
  • the gain encoding unit 2 includes a rearrangement unit 21, a correspondence table storage unit 22, a difference calculation unit 23, and a variable length encoding unit 24, for example.
  • the correspondence table storage unit 22 stores a correspondence table in which the correspondence between the index indicating the gain set and the conversion index is shown.
  • the correspondence table is defined so that the index and the conversion index correspond one-to-one.
  • An example of another correspondence table is shown in FIG.
  • the correspondence table includes statistical data such that an average value of difference values calculated by the difference calculation unit 23 described later is small, that is, an average value of difference values of conversion indexes of consecutive subframes is small. Is predetermined.
  • the rearrangement unit 21 refers to the correspondence table stored in the correspondence table storage unit 22 and acquires a conversion index corresponding to the index sent from the CELP encoding unit 1 (step B1, FIG. 14).
  • the conversion index is sent to the difference calculation unit 23.
  • the difference calculation unit 23 calculates a difference value between the conversion index of the immediately preceding subframe and the conversion index of the current subframe (step B2).
  • the calculated difference value becomes a difference value corresponding to the current subframe.
  • the current subframe is a subframe to be encoded and decoded
  • the immediately preceding subframe is a subframe immediately before the current subframe.
  • the conversion index of the first subframe is transmitted as it is as a code, or is transmitted after being variable-length encoded by the variable-length encoding unit 24 described later together with the difference value.
  • the difference value may not be taken for the immediately preceding subframe, but may be taken for the index of the past subframe.
  • the past subframe may be a past subframe of a frame including the current subframe, or may be a subframe included in a frame earlier than that frame.
  • the conversion index is used as the index of the current subframe
  • an index that is not converted may be used as the index of the subframe immediately before or as a reference when calculating the difference value.
  • the correspondence table used for obtaining the conversion index is an average value of the difference values between the index of the immediately preceding or past subframe, which is a reference for calculating the difference value, and the conversion index of the current subframe. Is determined to be small.
  • variable length encoding unit 24 generates a variable length code by encoding the difference value calculated by the difference calculation unit 23 by a variable length encoding method that assigns a shorter code as the absolute value of the value is smaller (step B3). ).
  • variable length encoding is performed using a Rice code which is a relatively simple variable length code.
  • the generated variable length code is sent to the decoding device.
  • FIG. 27 illustrates the Rice code corresponding to each difference value. As described in the middle column of FIG. 27, the Rice code may be assigned after normalizing the difference value n to take a value of 0 or more.
  • the decoding device includes, for example, a gain decoding unit 3 and a CELP decoding unit 4.
  • the code from the encoding device is input to the gain decoding unit 3.
  • the gain decoding unit 3 decodes an index indicating a set of gains using the input code (step C, FIG. 13).
  • the gain decoding unit 3 includes, for example, a variable length decoding unit 31, an addition unit 32, an inverse correspondence table storage unit 33, and a rearrangement unit 34.
  • the variable length decoding unit 31 decodes the input code by a variable length decoding method to obtain a difference value (step C1, FIG. 15). This variable length decoding method corresponds to the variable length encoding method in the variable length encoding unit 24.
  • the acquired difference value is sent to the adding unit 32.
  • variable length encoding method of the encoding device when a rice code is assigned after normalizing the difference value n to take a value of 0 or more, the rice code is first decoded to obtain a normalized value. The difference value corresponding to the normalized value is then determined. The adder 32 adds the difference value to the conversion index of the immediately preceding subframe to obtain a conversion index (step C2). This conversion index becomes a conversion index corresponding to the current subframe. The conversion index corresponding to the acquired current subframe is sent to the rearrangement unit 34.
  • the reverse correspondence table storage unit 33 stores a reverse correspondence table in which the correspondence between the index and the conversion index is shown.
  • This reverse correspondence table has a reverse relationship with the correspondence table stored in the correspondence table storage unit 22 of the encoding device.
  • a reverse correspondence table corresponding to the correspondence table illustrated in FIG. 23 is illustrated in FIG.
  • FIG. 26 illustrates a reverse correspondence table corresponding to the correspondence table illustrated in FIG.
  • the rearrangement unit 21 refers to the reverse correspondence table stored in the reverse correspondence table storage unit 33, and acquires an index corresponding to the conversion index acquired by the addition unit 32 (step C3). The acquired index is sent to the CELP decoding unit 4.
  • the CELP decoding unit 4 synthesizes a sound signal using the acquired index (step D, FIG. 13).
  • the CELP decoding unit 4 includes a linear prediction synthesis unit 43, an adaptive codebook storage unit 44, a noise codebook storage unit 45, a gain codebook storage unit 46, a first multiplication unit 47, For example, an adder 48 and a second multiplier 49 are included.
  • the linear prediction synthesis unit 43, the adaptive codebook storage unit 44, the noise codebook storage unit 45, the gain codebook storage unit 46, the first multiplication unit 47, the addition unit 48, and the second multiplication unit 49 are respectively connected to the linear prediction synthesis unit 13 Since it is the same as the adaptive codebook storage unit 14, the noise codebook storage unit 15, the gain codebook storage unit 16, the first multiplication unit 17, the addition unit 18 and the second multiplication unit 19, detailed description thereof is omitted here. To do.
  • the CELP decoding unit 4 selects a gain set by referring to the gain codebook of the gain codebook storage unit 46 using the index of each subframe obtained by the adding unit 32.
  • the CELP decoding unit 4 refers to the adaptive codebook in the adaptive codebook storage unit 44 and selects a periodic component corresponding to the periodic component index selected by the CELP encoding unit 1 of the encoding device.
  • the CELP decoding unit 4 refers to the noise codebook in the noise codebook storage unit 45 and selects a pulse component corresponding to the index of the pulse component selected by the CELP encoding unit 1 of the encoding device.
  • the first multiplication unit 47 multiplies the periodic component selected from the adaptive codebook by the gain corresponding to the periodic component constituting the set of gains selected from the gain codebook.
  • the multiplied signal is sent to the adder 48.
  • the second multiplying unit 49 multiplies the pulse component selected from the noise codebook by the gain corresponding to the pulse component constituting the gain set selected from the gain codebook.
  • the multiplied signal is sent to the adder 48.
  • the adder 48 adds the signal from the first multiplier 47 and the signal from the second multiplier 49.
  • the added signal is sent to the linear prediction synthesis unit 43.
  • the linear prediction synthesis unit 43 synthesizes the sound signal by applying a linear prediction synthesis filter determined by the linear prediction coefficient output from the CELP coding unit 1 of the coding apparatus to the added signal.
  • the reordering is performed so that the difference between the indexes of two consecutive subframes becomes smaller, and the transformed index after the rearrangement is encoded by the variable length encoding method, thereby obtaining the average bit.
  • a conversion index is associated in advance as an index with each gain set of the gain codebook stored in the gain codebook storage unit 16 of FIG. 2 and the gain codebook storage unit 46 of FIG. Has been.
  • the rearrangement process performed in the first embodiment becomes unnecessary.
  • the rearrangement unit 21, the correspondence table storage unit 22, the rearrangement unit 34, the reverse correspondence table storage unit 33, the process of step B1, and the process of step C3 are not required.
  • FIG. 6 An example functional block of the gain encoding unit 2 of the second embodiment is shown in FIG. 6, and an example functional block of the gain decoding unit 3 is shown in FIG.
  • An example of Step B of the second embodiment is shown in FIG. 16, and an example of Step C is shown in FIG. About another point, since it is the same as that of 1st embodiment, duplication description is abbreviate
  • variable length coding is performed on the difference value of the transform index as in the first embodiment or the second embodiment, and the subframe Is included in an unsteady sound section, the index or the conversion index is output as a code as it is.
  • the gain encoding unit 2 of the third embodiment further includes a selection unit 25 in addition to the respective units of the gain encoding unit 2 of the first embodiment, for example.
  • the selection unit 25 determines whether the current subframe is included in a stationary sound section or an unsteady sound section (step B4, FIG. 18). If it is determined that the current subframe is included in a regular sound section, the variable length code generated by variable length coding the difference value of the transform index is used as the code corresponding to the current subframe, If the subframe is included in the non-stationary sound section, the index or conversion index of the current subframe is set as a code corresponding to the current subframe.
  • the determination of whether the current subframe is included in a stationary sound section or a non-stationary sound section can be made based on parameters other than gain for the current and / or past subframes.
  • the parameters other than the gain are, for example, the gain of the periodic component indicated by the index, the pitch period, and the coefficient of the linear prediction synthesis filter.
  • this determination may be made based on information available in the decoding device.
  • the following (1) to (3) are examples of judgments that can be made based on information available in the decoding device. In this way, when making a determination based on information available in the decoding device, it is not necessary to transmit auxiliary information described later.
  • the selection unit 25 determines that the current subframe is stationary It is judged that it is included in a typical sound section. Otherwise, it is determined that the current subframe is included in an unsteady sound section. Further, the gain of the periodic component of the past subframe of the frame including the current subframe is larger than the predetermined first threshold, and the gain of the pulse component of the past subframe is higher than the predetermined second threshold. May be determined that the current subframe is included in the stationary sound section, otherwise, it may be determined that the current subframe is included in the non-stationary sound section. .
  • the past subframe of the frame including the current subframe is, for example, the first frame of the frame including the current subframe or the subframe immediately before the current subframe.
  • the gain of the periodic component of the subframe is a gain corresponding to the periodic component constituting the gain set corresponding to the code of the subframe.
  • the gain of the periodic component of the subframe may be obtained from the acquired code, or the gain value corresponding to the code may be directly acquired from the CELP encoding unit 1.
  • a table describing the relationship between the index and which code is output is prepared, and the code corresponding to the index of the past subframe of the frame including the current subframe is selected with reference to the table. May be.
  • Second determination method When the absolute value of the difference between the pitch period of the immediately preceding subframe and the pitch period of the current subframe is smaller than a predetermined third threshold, the selection unit 25 Are determined to be included in a regular sound section. Otherwise, it is determined that the current subframe is included in an unsteady sound section.
  • CELP coding the waveform of the frequency component is determined after the waveform of the pitch period is determined.
  • the absolute value of the difference between the pitch periods of two consecutive frames is small, it means that the stationarity is high.
  • the absolute value of the difference value of the pitch periods is used as an index for determining continuity.
  • a table describing the relationship between the set of pitch periods of two consecutive sub-frames and which code is output is prepared, and past sub-frames of frames including the current sub-frame are referenced with reference to the table.
  • a code corresponding to the index of the frame may be selected.
  • the selection unit 25 has a predetermined gain calculated from a linear prediction coefficient corresponding to the index of the linear prediction coefficient of the current subframe and a coefficient equivalent to the linear prediction coefficient (PARCOR coefficient or the like). When it is larger than the four thresholds, it is determined that the current subframe is included in a steady sound section. Otherwise, it is determined that the current subframe is included in an unsteady sound section.
  • the prediction gain U can be calculated by the following equation using the m-th order PARCOR coefficient k (m), where m is an integer of 1 or more.
  • a table describing the relationship between the linear prediction coefficient index and which code is output is prepared, and corresponding to the past subframe index of the frame including the current subframe with reference to the table. A sign may be selected.
  • auxiliary information is added immediately before each Rice code.
  • the immediately preceding bit of the Rice code when the immediately preceding bit of the Rice code is 1, it means that the difference is taken, and when the immediately preceding bit of the Rice code is 0, it means that the difference is not taken.
  • “XXXXXXX” in the lower right column of FIG. 28 represents an index or converted index in binary.
  • the auxiliary information may be assigned to a predetermined code constituting the code book of the variable length coding method. For example, if the frequency of non-stationary frames is small, it means that one of the difference codes does not take a difference. In the example of FIG. 29, the meaning that the difference is not taken is given to the rice code “0010” originally corresponding to the difference value 2, and the rice code “0010” originally corresponding to the difference value 3 is assigned to the difference value 2. “00010”. Note that “XXXXXXX” after the rice code “0010” in FIG. 29 is an index or conversion index expressed in binary.
  • the selection unit 25 encodes the amount of code generated by variable length coding of the difference value and the index or conversion index for each frame as they are output.
  • the auxiliary information and the code may be generated by comparing the amount of the code and selecting the one with the smaller code amount.
  • the gain decoding unit 3 of the third embodiment is as shown in FIG.
  • the selection part 35 is further included.
  • the selection unit 35 determines whether or not the current subframe is included in a regular sound section in the same manner as the selection unit 25 (step C4, FIG. 19). If there is auxiliary information, a determination is made based on the auxiliary information. When there is no auxiliary information, a determination is made based on parameters other than the gain of the current subframe, as described in the selection unit 25. When it is determined that the current subframe is included in a regular sound section, decoding is performed in the same manner as in the first embodiment or the second embodiment, and the generated subframe corresponds to the current subframe. Index.
  • the input code is used as an index or conversion index as it is. If the input code is an index, that index becomes the index of the current subframe. If the input code is a conversion index, the conversion index is inversely converted into an index by the rearrangement unit 34. The inversely converted index becomes the index of the current subframe.
  • the selection unit 25 is arranged before the gain encoding unit 2, and the processing of the selection unit 25 (step B4) is performed before step B1 to step B3 as shown by the broken line in FIG. May be performed.
  • the processing of steps B1 to B3 is performed only when the selection unit 25 determines that the current subframe is included in a steady sound section.
  • the processing can be reduced by performing the processing from step B1 to B3 only when it is determined that the current subframe is included in the steady sound section.
  • the gain encoding unit 2 of the fourth embodiment further includes a correspondence table selection unit 26 in addition to the respective units of the gain encoding unit 2 of the first embodiment or the third embodiment, for example.
  • the correspondence table storage unit 22 of the fourth embodiment stores a plurality of correspondence tables. For example, in each correspondence table, the correspondence is optimized according to the degree of continuity. In this example, the correspondence table H (A) in the case of A having a high continuity, the correspondence table H (B) in the case of B having a medium continuity, and the correspondence table H (C in the case of C having a low continuity. ) Is stored in the correspondence table storage unit 22.
  • the correspondence table selection unit 26 selects one correspondence table from a plurality of correspondence tables (step B4, FIG. 20).
  • the correspondence table selection unit 26 selects an appropriate correspondence table based on parameters for the current and / or past subframes. Three examples of correspondence table selection methods by the correspondence table selection unit 26 will be described.
  • (1) First selection method For example, two positive thresholds ⁇ and ⁇ ( ⁇ > ⁇ ) are prepared, and the gain of the periodic component of the past subframe of the frame including the current subframe is greater than ⁇ .
  • the correspondence table H (A) may be selected if it is large, the correspondence table (B) if the gain is less than or equal to ⁇ , and the correspondence table H (C) if the gain is less than ⁇ .
  • Correspondence table when the gain of the periodic component of the past subframe of the frame including the current subframe is larger than the predetermined threshold and the gain of the pulse component of the past subframe is smaller than the predetermined threshold H (A) may be selected, and the correspondence table H (B) or H (C) may be selected in other cases.
  • the gain of the periodic component has a one-to-one correspondence with the index and the conversion index, for example, as shown in FIG. Therefore, selecting the correspondence table based on the gain of the periodic component of the past subframe of the frame including the current subframe, and based on the index or conversion index of the past subframe of the frame including the current subframe. Selecting a correspondence table is equivalent.
  • the correspondence table is selected based on the index or conversion index of the past subframe of the frame including the current subframe. It may be. For example, an appropriate correspondence table is prepared in advance for each index or conversion index of a past subframe of a frame including the current subframe, and an index of a past subframe of a frame including the input current subframe or A correspondence table corresponding to the conversion index may be selected.
  • an appropriate correspondence table is prepared in advance for each group based on a plurality of past subframe indexes or conversion indexes of a frame including the current subframe, and the past of the frame including the input current subframe is prepared.
  • a correspondence table corresponding to the group to which the subframe index or conversion index belongs may be selected. For example, an index or transformation index whose corresponding periodic component gain is greater than ⁇ is assigned to group A, and an index or transformation index whose corresponding periodic component gain is less than or equal to ⁇ and greater than or equal to ⁇ is assigned to group B. An index or a transformation index whose sex component gain is smaller than ⁇ is classified into group C in advance.
  • a correspondence table for each group that is, a correspondence table H (A) corresponding to group A, a correspondence table H (B) corresponding to group B, and a correspondence table H (C) corresponding to group C are prepared in advance. .
  • the correspondence table H (A) is selected, and the frame including the current subframe is selected.
  • the correspondence table H (B) is selected, and the index or conversion index of the past subframe of the frame including the current subframe is the group. If it is included in B, the correspondence table H (C) may be selected.
  • an appropriate correspondence table may be selected based on the absolute value of the difference value between the pitch period of the immediately preceding subframe and the pitch period of the current subframe.
  • three correspondence tables H (A), H (B), and H (C) are prepared in advance, and the absolute value of the difference between the pitch period of the immediately preceding subframe and the pitch period of the current subframe.
  • the correspondence table H (A) is selected, and the absolute value of the difference between the pitch period of the immediately preceding subframe and the pitch period of the current subframe is less than ⁇ and greater than or equal to ⁇ Is selected as the correspondence table H (B), and when the absolute value of the difference between the pitch period of the immediately preceding subframe and the pitch period of the current subframe is smaller than ⁇ , the correspondence table H (C) May be selected.
  • a plurality of correspondence tables and a table that describes the relationship between the pitch period pair of two consecutive subframes and which correspondence table to select are prepared in advance, and the table is continuous with reference to the table.
  • a correspondence table corresponding to a set of pitch periods of two subframes may be selected. Since the pitch period has a one-to-one correspondence with the index representing the pitch period, an index set representing the pitch period of two consecutive subframes is described in the table instead of the set of pitch periods of two consecutive subframes. You may keep it.
  • an appropriate correspondence table may be selected based on the prediction gain for the current and / or past subframes. That is, an appropriate correspondence table is prepared in advance for each prediction gain for the current and / or past subframes, and a correspondence table corresponding to the input prediction gain for the current and / or past subframes is selected. May be.
  • the prediction gain is a prediction gain calculated by, for example, the equation (1) from a linear prediction coefficient corresponding to the index of the linear prediction coefficient of the current subframe and a coefficient equivalent to the linear prediction coefficient (PARCOR coefficient or the like).
  • three correspondence tables H (A), H (B), and H (C) are prepared in advance.
  • the correspondence table H (A) When the prediction gain is larger than ⁇ , the correspondence table H (A) is selected and the prediction gain is selected. Is equal to or less than ⁇ and greater than or equal to ⁇ , the correspondence table H (B) may be selected, and if the prediction gain is smaller than ⁇ , the correspondence table H (C) may be selected. Also, a plurality of correspondence tables and a table describing the relationship between the prediction gain and which correspondence table to select are prepared in advance, and the correspondence table corresponding to the prediction gain is selected with reference to the table. Also good.
  • an appropriate correspondence table may be selected based on a selection method in which the third selection method is combined with the first selection method. That is, (1) the gain or index or transform index of the periodic component for the past subframe, (2) the absolute value of the difference between the pitch periods of two consecutive subframes, and (3) the current and / or Alternatively, an appropriate correspondence table is prepared in advance for each of one or a plurality of pairs with the prediction gain for the past subframe, and (1) the gain or index of the periodic component for the input past subframe or A combination of a transform index, (2) an absolute value of a difference between pitch periods of two input consecutive subframes, and (3) an input prediction gain for current and / or past subframes. A corresponding correspondence table may be selected.
  • first correspondence table For example, four correspondence tables of a first correspondence table, a second correspondence table, a third correspondence table, and a fourth correspondence table are prepared, and a prediction gain for a current and / or past subframe is predetermined first. If the gain of the periodic component for the current subframe is greater than a predetermined second value, the first correspondence table is selected and the current and / or past subframe is selected.
  • the second correspondence table is selected and the current and / or Or, when the predicted gain for the past subframe is less than or equal to the predetermined first value and the gain of the periodic component for the current subframe is greater than the predetermined second value, the third correspondence table is used. Select for current and / or past subframes If the gain of the periodic component of the current measurement gain is equal to or less than a predetermined first value subframe is equal to or less than a predetermined second value may be selected fourth correspondence table.
  • the plurality of correspondence tables stored in the correspondence table storage unit 22 may include correspondence tables having the same conversion index corresponding to the index.
  • the conversion process by the conversion unit 21 may not be performed.
  • the conversion process by the conversion unit 21 may not be performed.
  • the correspondence table information that is information about the selected correspondence table is sent to the rearrangement unit 21, and the rearrangement unit 21 converts the index of each subframe into a conversion index with reference to the selected correspondence table. Thereafter, variable length coding is performed in the same manner as in the first embodiment.
  • the gain encoding unit 2 may send the correspondence table information to the decoding device.
  • the gain decoding unit 3 of the fourth embodiment further includes, for example, an inverse correspondence table selection unit 36 in addition to the components of the gain decoding unit 3 of the first embodiment.
  • the reverse correspondence table storage unit 33 of the fourth embodiment stores a plurality of reverse correspondence tables. Each inverse correspondence table is optimized for correspondence according to the degree of stationarity.
  • the plurality of reverse correspondence tables have a reverse relationship with the plurality of correspondence tables stored in the correspondence table storage unit 22.
  • the reverse correspondence table selection unit 36 selects one correspondence table from a plurality of correspondence tables (step C4, FIG. 21).
  • the reverse correspondence table selection unit 36 selects the reverse correspondence table corresponding to the correspondence table by the correspondence table selection unit 26 of the gain encoding unit 2.
  • the reverse correspondence table selection unit 36 has acquired correspondence table information, the corresponding reverse correspondence table is selected using the correspondence table information.
  • the reverse correspondence table selection unit 36 selects the reverse correspondence table corresponding to the correspondence table in the same manner as the method in which the correspondence table selection unit 26 selects the correspondence table. .
  • the rearrangement unit 34 converts the conversion index into an index with reference to the selected inverse correspondence table. Since other parts are the same as those in the first embodiment, the same reference numerals are given and redundant description is omitted. In this way, a plurality of correspondence tables and reverse correspondence tables are prepared, and one correspondence table and reverse correspondence table that are estimated to have a small difference in index after conversion are selected, and the selected correspondence table and reverse correspondence table are selected. By performing variable length coding of the difference value using the correspondence table, it is possible to further reduce the average bit rate or provide higher quality coding and decoding with the same amount of information.
  • the conversion index may be encoded and transmitted as it is without calculating the difference value after conversion from the index to the conversion index.
  • the conversion index converted with reference to H (C) may be encoded and transmitted as it is.
  • the input code is used as a conversion index as it is.
  • the rearrangement unit 34 refers to the reverse correspondence table G (C) corresponding to the correspondence table H (C) and converts the conversion index into an index.
  • the conversion unit 21 may not perform the conversion process by the conversion unit 21 depending on the parameters for the current and / or past subframes.
  • Parameters for the current and / or past subframes are: (1) the gain, index or transform index of the periodic component for the past past subframes input; and (2) the pitch period of two consecutive subframes. At least one of the absolute value of the difference value and (3) the prediction gain for the input current and / or past subframes.
  • the encoding device and the decoding device can be realized by a computer.
  • each part of the encoding device and each part of the decoding device are described by a program.
  • each unit of the encoding device and each unit of the decoding device are realized on the computer.
  • This program can be recorded on a computer-readable recording medium.
  • these apparatuses are configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
  • the present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the gist of the present invention.
  • the above-described embodiments can be appropriately combined.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 対応表記憶部22には、周期性成分の利得とパルス性成分の利得の組を示すインデックスと変換インデックスとの対応関係が示された対応表が記憶されている。並替部21は、対応表記憶部22の対応表を参照して直前のサブフレーム及び現在のサブフレームのインデックスに対応する変換インデックスを取得する。差計算部23は、直前のサブフレームの変換インデックスと現在のサブフレームの変換インデックスとの差の値を計算する。可変長符号化部24は、値の絶対値が小さいほど短い符号を割り当てる可変長符号化方法により差の値を符号化して可変長符号を生成する。

Description

符号化装置、復号装置、これらの方法、プログラム及び記録媒体
 この発明は、音声、音楽等の音信号を符号化又は復号する技術に関する。特に、CELP等の符号化技術で符号化された周期性成分の利得及びパルス性成分の利得を符号化又は復号する技術に関する。
 従来は、CELP(Code Excited Linear Prediction)の符号化及び復号において用いられる周期性成分の利得及びパルス性成分の利得は、符号誤りに対する耐性を強くするために固定ビットが割り当てられて符号化及び復号されていた(例えば、非特許文献1参照)。パルス性成分の利得については、利得そのものではなく過去のサブフレームからの予測値に対する比を符号化の対象とすることにより、利得の値の時間的な連続性を考慮して符号量の削減を行っていた。
 また、特許文献1では、周期性成分の利得から周期性成分の利得の値の時間的な連続性の有無を判定し、時間的な連続性があると予測された場合には周期性成分の利得の値の差分を可変長符号化することにより符号量の削減を行っていた。
3rd Generation Partnership Project(3GPP), Technical Specification (TS) 26.090, "AMR speech codec; Transcoding functions", Version 4.0.0 (2001-03)
WO2006/075605国際公開公報
 パケット通信等の通信技術の発達により、CELPなどの圧縮符号の上位階層のシステムによって符号の正当性が保証されるため必ずしもCELP自体の符号誤りに対する耐性を強くする必要がない場合がある。しかしながら、従来はこのようなCELP自体の符号誤りに対する耐性を強くする必要がない場合においても、周期性成分の利得及びパルス性成分の利得の頻度に関する冗長性や周期性成分の利得の連続性について考慮することなく符号化及び復号されており、符号化及び復号の効率が良くないという問題があった。
 特許文献1には周期性成分の利得の値の連続性や頻度を考慮して符号化及び復号を行う技術が開示されている。しかし、この技術は利得の値を符号化して得られたインデックスに対して適用することはできない。このため、非特許文献1に記載されたCELPなどの符号化装置で得られた利得に対応するインデックスに対して、さらに連続性や頻度を考慮して符号化及び復号の効率を上げることはできなかった。
 この発明の課題は、CELPなどの符号化装置で得られた利得に対応するインデックスについて、インデックスに対応する利得の値の連続性や頻度を考慮した、より効率が良い符号化装置、復号装置、これらの方法、プログラム及び記録媒体を提供することである。
 符号化においては、直前のサブフレームの周期性成分の利得とパルス性成分の利得の組に対応するインデックスと現在のサブフレームの周期性成分の利得とパルス性成分の利得の組に対応するインデックスとの差の値を計算する。値の絶対値が小さいほど短い符号を割り当てる可変長符号化方法により差の値を符号化して可変長符号を生成する。
 復号においては、入力された符号を可変長復号化方法により復号して差の値を取得する。直前のサブフレームのインデックスに差の値を加算してインデックスを取得する。
 予め隣接するインデックスに対応する利得の組同士の距離が近くなるように割り当てられたインデックスを用いて、現サブフレームの利得の組について、直前のサブフレームとのインデックスの差の絶対値が小さいほど短い符号を割り当てる可変長符号化方法を行うことで、利得の組を表わすための情報量を少なくすることができることから、符号化及び復号の効率が従来よりも良くなる。
符号化装置及び復号装置の例の機能ブロック図。 CELP符号化部の例の機能ブロック図。 第一実施形態の利得符号化部の例の機能ブロック図。 第一実施形態の利得復号部の例の機能ブロック図。 CELP復号部の例の機能ブロック図。 第二実施形態の利得符号化部の例の機能ブロック図。 第二実施形態の利得復号部の例の機能ブロック図。 第三実施形態の利得符号化部の例の機能ブロック図。 第三実施形態の利得復号部の例の機能ブロック図。 第三実施形態の利得符号化部の変形例の機能ブロック図。 第四実施形態の利得符号化部の例の機能ブロック図。 第四実施形態の利得復号部の例の機能ブロック図。 符号化方法及び復号方法の例を示す流れ図。 第一実施形態の利得符号化方法の例を示す流れ図。 第一実施形態の利得復号方法の例を示す流れ図。 第二実施形態の利得符号化方法の例を示す流れ図。 第二実施形態の利得復号方法の例を示す流れ図。 第三実施形態の利得符号化方法の例を示す流れ図。 第三実施形態の利得復号方法の例を示す流れ図。 第四実施形態の利得符号化方法の例を示す流れ図。 第四実施形態の利得復号方法の例を示す流れ図。 ゲイン符号帳を構成する利得の組を例示する図。 対応表を例示する図。 逆対応表を例示する図。 対応表を例示する図。 逆対応表を例示する図。 各差の値に対応するライス符号を例示する図。 補助情報を例示する図。 補助情報を例示する図。
 以下、この発明の一実施形態について、詳細に説明する。
 [第一実施形態]
 符号化
 第一実施形態の符号化装置は、図1に示すように、CELP符号化部1及び利得符号化部2を例えば含む。
 まず、CELP符号化部1は、以下の処理により、入力された音信号から、周期性成分を示すインデックスと、パルス性成分を示すインデックスと、利得の組を示すインデックと、線形予測係数とを求める(ステップA、図13)。
 入力された音信号は、CELP符号化部1に入力される。CELP符号化部1は、図2に示すように、線形予測分析部11、減算部12、線形予測合成部13、適応符号帳記憶部14、雑音符号帳記憶部15、ゲイン符号帳記憶部16、第一乗算部17、加算部18、第二乗算部19、聴覚重付フィルタ部110、歪最小化部111を例えば含む。
 線形予測分析部11は、入力された音信号に対して線形予測分析を行い、線形予測係数を求めて量子化する。量子化された線形予測係数は、線形予測合成部13に送られる。また、量子化された線形予測係数に対応するインデックスが出力され、復号装置に送られる。
 適応符号帳記憶部14には適応符号帳が記憶されており、雑音符号帳記憶部15には雑音符号帳が記憶されており、ゲイン符号帳記憶部16にはゲイン符号帳が記憶されている。
 ゲイン符号帳は、適応符号帳から選択される周期性成分にかけられる利得gと、雑音符号帳から選択されるパルス性成分にかけられる利得gCと予測利得g’との比であるγgcとから構成される利得の組(g,γgc)にインデックスを対応付けしたものである。利得gを周期性成分に対応する利得と呼び、γgcをパルス性成分に対応する利得と呼ぶことにする。ゲイン符号帳には、複数の利得の組のそれぞれにインデックスが定められている。
 図22に、ゲイン符号帳を構成する利得の組を例示する。図22の横軸は周期性成分に対応する利得の値を表し、図22の縦軸はパルス性成分に対応する利得の値を表す。図22の128個の点は左からそれぞれ0から127までのインデックスに対応する利得の組を示す。
 第一乗算部17(図2)は、適応符号帳から選択された周期性成分と、ゲイン符号帳から選択された利得の組を構成する周期性成分に対応する利得とを乗算する。乗算された信号は、加算部18に送られる。
 第二乗算部19は、雑音符号帳から選択されたパルス性成分と、ゲイン符号帳から選択された利得の組を構成するパルス性成分に対応する利得とを乗算する。乗算された信号は、加算部18に送られる。
 加算部18は、第一乗算部17からの信号と第二乗算部19からの信号とを加算する。加算された信号は、線形予測合成部13に送られる。
 線形予測合成部13は、加算された信号に対して、線形予測分析部11が求めた線形予測係数により定まる線形予測合成フィルタを適用して音信号を合成する。合成された音信号は、減算部12に送られる。
 減算部12は、入力信号と合成された音信号との残差信号を求める。残差信号は、聴覚重付フィルタ部110に送られる。
 聴覚重付フィルタ部110は、残差信号に対して聴覚重み付けフィルタを適用して、残差信号の量子化雑音を整形した信号を生成する。生成された信号は、歪最小化部111に送られる。
 歪最小化部111は、整形された信号が小さくなるように、適応符号帳から周期性成分と、雑音符号帳からパルス性成分と、ゲイン符号帳から利得の組とを適切に選択するように制御を行う。1つのフレームは、複数のサブフレームから構成されている。例えば、非特許文献1に記載されているCELP符号化においては、20ms(160サンプル)のフレームは、4個の5ms(40サンプル)のサブフレームから構成されている。歪最小化部111は、サブフレーム毎に、適応符号帳から周期性成分と、雑音符号帳からパルス性成分と、ゲイン符号帳から利得の組とを選択する。選択された周期性成分を示すインデックスと、選択されたパルス性成分を示すインデックスとは、復号装置に送られる。
 なお、適応符号帳記憶部14には、適応符号帳として前のフレームの励振信号u(n)が記憶されており、この適応符号帳から周期性成分が生成される。歪最小化部111は、フレームの励振信号u(n)を計算して、適応符号帳記憶部14に送る。
 以下、サブフレームに対応するインデックス、サブフレームのインデックスと言った場合には、そのサブフレームについて歪最小化部111により選択された利得の組に対応するインデックスを意味する。各サブフレームに対応するインデックスは、並替部21に送られる。後述する利得符号化部2により、各サブフレームに対応するインデックスが符号化される(ステップB、図13)。
 利得符号化部2は、図3に示すように、並替部21と、対応表記憶部22と、差計算部23と、可変長符号化部24とを例えば含む。
 対応表記憶部22には、利得の組を示すインデックスと変換インデックスとの対応関係がそれぞれ示された対応表が記憶されている。例えば図23に示すように、インデックスと変換インデックスとが一対一に対応するように対応表は定められる。他の対応表の例を図25に示す。また、対応表は、後述する差計算部23が計算する差の値の平均値が小さくなるように、すなわち連続するサブフレームの変換インデックスの差の値の平均値が小さくなるように、統計データに基づいて予め定められる。
 並替部21は、対応表記憶部22に記憶されている対応表を参照して、CELP符号化部1から送られてきたインデックスに対応する変換インデックスを取得する(ステップB1、図14)。変換インデックスは、差計算部23に送られる。
 差計算部23は、直前のサブフレームの変換インデックスと現在のサブフレームの変換インデックスとの差の値を計算する(ステップB2)。この計算された差の値は、現在のサブフレームに対応する差の値となる。ここで、現在のサブフレームとは符号化、復号の対象となっているサブフレームであり、直前のサブフレームとはその現在のサブフレームの1つ前のサブフレームのことである。
 なお、この差の値の計算は、フレームを構成する複数のサブフレームの中の先頭以外のサブフレームについて行われるとする。先頭のサブフレームの変換インデックスは、そのまま符号として送信されるか、差の値と共に後述する可変長符号化部24により可変長符号化されて送信される。
また、差の値は直前のサブフレームに対して取らなくてもよく、過去のサブフレームのインデックスに対して差の値を取ってもよい。過去のサブフレームは、現在のサブフレームを含むフレームの過去のサブフレームであってもよいし、そのフレームよりも過去のフレームに含まれるサブフレームであってもよい。
 さらに、現在のサブフレームのインデックスとして変換インデックスを用いるが、差の値を計算する際の基準となる直前又は過去のサブフレームのインデックスとして、変換しないインデックスを用いてもよい。この場合、変換インデックスを求めるために用いる対応表は、差の値を計算する際の基準となる直前又は過去のサブフレームのインデックスと、現在のサブフレームの変換インデックスとの差の値の平均値が小さくなるように定められる。
 可変長符号化部24は、値の絶対値が小さいほど短い符号を割り当てる可変長符号化方法により、差計算部23により計算された差の値を符号化して可変長符号を生成する(ステップB3)。例えば比較的簡単な可変長符号であるライス符号を用いて、可変長符号化される。生成された可変長符号は、復号装置に送られる。
 各差の値に対応するライス符号を図27に例示する。図27の中央の列に記載されているように、差の値nを0以上の値を取るように正規化した後にライス符号を割り当ててもよい。
 復号
 第一実施形態の復号装置は、図1に示すように、利得復号部3及びCELP復号部4を例えば含む。
 符号化装置からの符号は、利得復号部3に入力される。利得復号部3は、入力された符号を用いて、利得の組を示すインデックスを復号する(ステップC、図13)。利得復号部3は、図4に示すように、可変長復号部31と、加算部32と、逆対応表記憶部33と、並替部34とを例えば含む。
 可変長復号部31は、入力された符号を可変長復号化方法により復号して差の値を取得する(ステップC1、図15)。この可変長復号化方法は、可変長符号化部24における可変長符号化方法に対応するものである。取得された差の値は、加算部32に送られる。
 符号化装置の可変長符号化方法において差の値nを0以上の値を取るように正規化した後にライス符号が割り当てられている場合には、まずライス符号を復号して正規化値が求められ、その後正規化値に対応する差の値が求められる。
 加算部32は、直前のサブフレームの変換インデックスに上記差の値を加算して変換インデックスを取得する(ステップC2)。この変換インデックスが、現在のサブフレームに対応する変換インデックスとなる。取得された現在のサブフレームに対応する変換インデックスは、並替部34に送られる。
 逆対応表記憶部33には、インデックスと変換インデックスとの対応関係が示された逆対応表が記憶されている。この逆対応表は、符号化装置の対応表記憶部22に記憶された対応表と逆の関係にある。図23に例示した対応表に対応する逆対応表を図24に例示する。また、図25に例示した対応表に対応する逆対応表を図26に例示する。
 並替部21は、逆対応表記憶部33に記憶されている逆対応表を参照して、加算部32により取得された変換インデックスに対応するインデックスを取得する(ステップC3)。取得されたインデックスは、CELP復号部4に送られる。
 CELP復号部4は、この取得されたインデックスを用いて、音信号を合成する(ステップD、図13)。
 CELP復号部4は、図5に示すように、線形予測合成部43と、適応符号帳記憶部44と、雑音符号帳記憶部45と、ゲイン符号帳記憶部46と、第一乗算部47と、加算部48と、第二乗算部49とを例えば含む。線形予測合成部43、適応符号帳記憶部44、雑音符号帳記憶部45、ゲイン符号帳記憶部46、第一乗算部47、加算部48及び第二乗算部49は、それぞれ線形予測合成部13、適応符号帳記憶部14、雑音符号帳記憶部15、ゲイン符号帳記憶部16、第一乗算部17、加算部18及び第二乗算部19と同様であるため、ここでは詳細な説明を省略する。
 CELP復号部4は、加算部32が求めた各サブフレームのインデックスを用いて、ゲイン符号帳記憶部46のゲイン符号帳を参照して利得の組を選択する。
 CELP復号部4は、適応符号帳記憶部44の適応符号帳を参照して符号化装置のCELP符号化部1が選択した周期性成分のインデックスに対応する周期性成分を選択する。
 CELP復号部4は、雑音符号帳記憶部45の雑音符号帳を参照して符号化装置のCELP符号化部1が選択したパルス性成分のインデックスに対応するパルス性成分を選択する。
 第一乗算部47は、適応符号帳から選択された周期性成分と、ゲイン符号帳から選択された利得の組を構成する周期性成分に対応する利得とを乗算する。乗算された信号は、加算部48に送られる。
 第二乗算部49は、雑音符号帳から選択されたパルス性成分と、ゲイン符号帳から選択された利得の組を構成するパルス性成分に対応する利得とを乗算する。乗算された信号は、加算部48に送られる。
 加算部48は、第一乗算部47からの信号と第二乗算部49からの信号とを加算する。加算された信号は、線形予測合成部43に送られる。
 線形予測合成部43は、加算された信号に対して、符号化装置のCELP符号化部1が出力した線形予測係数により定まる線形予測合成フィルタを適用して音信号を合成する。
 このように、連続する2つのサブフレームのインデックスの差の値が小さくなるように並び替えを行い、並び替えの後の変換インデックスに対して可変長符号化方法により符号化することにより、平均ビットレートを下げるか、削減した情報を他の情報に振替えることで、同じ平均情報量でも品質の高い符号化及び復号を提供することができる。
 [第二実施形態]
 第二実施形態においては、図2のゲイン符号帳記憶部16及び図5のゲイン符号帳記憶部46に記憶されているゲイン符号帳の各利得の組に対して変換インデックスがインデックスとして予め対応付けされている。
 これにより、第一実施形態で行っていた、並び替えの処理が不要となる。具体的には、並替部21、対応表記憶部22、並替部34、逆対応表記憶部33、ステップB1の処理、ステップC3の処理が不要となる。
 第二実施形態の利得符号化部2の例の機能ブロックを図6に示し、利得復号部3の例の機能ブロックを図7に示す。また、第二実施形態のステップBの例を図16に示し、ステップCの例を図17に示す。
 他の点については、第一実施形態と同様であるため重複説明を省略する。
 [第三実施形態]
 差の値の可変長符号化により符号量が減少するフレームが多いが、場合よっては符号量が増加するフレームもあり、すべてのフレームの符号量の平均値を必ずしも削減することができるとは限らない。それは、定常的ではない音区間では利得の組の連続性がなく、変換インデックスの差の値が小さくなるとは限らないためである。
 そこで、第三実施形態では、サブフレームが定常的な音区間に含まれれば第一実施形態又は第二実施形態と同様に変換インデックスの差の値に対して可変長符号化を行い、サブフレームが非定常的な音区間に含まれればインデックス又は変換インデックスをそのまま符号として出力する。
 以下、第一実施形態及び第二実施形態と異なる部分を中心に説明する。第一実施形態及び第二実施形態と同様の部分については同じ符号をつけて重複説明を省略する。
 第三実施形態の利得符号化部2は、図8に示すように、例えば第一実施形態の利得符号化部2の各部に加えて選択部25を更に含む。
 選択部25は、現在のサブフレームが定常的な音区間に含まれるか、非定常的な音区間に含まれるか判断する(ステップB4、図18)。現在のサブフレームが定常的な音区間に含まれると判断された場合には変換インデックスの差の値を可変長符号化して生成された可変長符号を現在のサブフレームに対応する符号とし、現在のサブフレームが非定常的な音区間に含まれる場合に現在のサブフレームのインデックス又は変換インデックスを現在のサブフレームに対応する符号とする。
 現在のサブフレームが定常的な音区間に含まれるか、非定常的な音区間に含まれるかの判断は、現在及び/又は過去のサブフレームについての利得以外のパラメータに基づいて行うことができる。利得以外のパラメータとは、例えば、インデックスが示す周期性成分の利得、ピッチ周期、線形予測合成フィルタの係数である。
 なお、この判断は、復号装置で入手可能な情報に基づいて行うことができるようにしてもよい。以下の(1)から(3)が、復号装置で入手可能な情報に基づいて行うことができる判断の例である。このように、復号装置で入手可能な情報に基づいて判断を行う場合には、後述する補助情報を送信する必要がなくなる。
 (1)第一の判断手法
 選択部25は、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得が所定の第一閾値よりも大きい場合に、その現在のサブフレームが定常的な音区間に含まれると判断する。そうでない場合には、その現在のサブフレームが非定常的な音区間に含まれると判断する。また、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得が所定の第一閾値よりも大きく、かつ、その過去のサブフレームのパルス性成分の利得が所定の第二閾値よりも小さい場合に、その現在のサブフレームが定常的な音区間に含まれると判断し、そうでない場合には、その現在のサブフレームが非定常的な音区間に含まれると判断してもよい。
 現在のサブフレームを含むフレームの過去のサブフレームとは、例えば現在のサブフレームを含むフレームの先頭フレーム、又は、現在のサブフレームの直前のサブフレームのことである。
 サブフレームの周期性成分の利得は、サブフレームの符号に対応する利得の組を構成する周期性成分に対応する利得のことである。サブフレームの周期性成分の利得は、取得された符号から求めてもよいし、CELP符号化部1から符号と対応する利得の値を直接取得してもよい。
 なお、インデックスと何れの符号を出力するかの関係を記載したテーブルを用意しておき、そのテーブルを参照して現在のサブフレームを含むフレームの過去のサブフレームのインデックスに対応する符号を選択してもよい。
 (2)第二の判断手法
 選択部25は、直前のサブフレームのピッチ周期と現在のサブフレームのピッチ周期との差の値の絶対値が所定の第三閾値よりも小さい場合に、その現在のサブフレームが定常的な音区間に含まれると判断する。そうでない場合には、その現在のサブフレームが非定常的な音区間に含まれると判断する。
 CELP符号化では、ピッチ周期の波形が決まった後に周波数成分の波形が決定される。ここで、連続する2つのフレームのピッチ周期の差の値の絶対値が小さい場合には、定常性が高いことを意味する。第二の判断手法は、このピッチ周期の差の値の絶対値を定常性を判断するための指標として用いる。
 なお、連続する2つのサブフレームのピッチ周期の組と何れの符号を出力するかの関係を記載したテーブルを用意しておき、そのテーブルを参照して現在のサブフレームを含むフレームの過去のサブフレームのインデックスに対応する符号を選択してもよい。
 (3)第三の判断手法
 選択部25は、現在のサブフレームの線形予測係数のインデックスと対応する線形予測係数やこれと等価な係数(PARCOR係数など)から計算された予測利得が所定の第四閾値よりも大きい場合に、その現在のサブフレームが定常的な音区間に含まれると判断する。そうでない場合には、その現在のサブフレームが非定常的な音区間に含まれると判断する。
 mを1以上の整数として、予測利得Uは、m次のPARCOR係数k(m)により次式により計算することができる。
Figure JPOXMLDOC01-appb-M000001
 なお、線形予測係数のインデックスと何れの符号を出力するかの関係を記載したテーブルを用意しておき、そのテーブルを参照して現在のサブフレームを含むフレームの過去のサブフレームのインデックスに対応する符号を選択してもよい。
 選択部25による選択の結果、換言すれば差分を取るかどうかについての情報は、補助情報として符号と共に出力される。
 例えば、図28のように、各ライス符号の直前に1ビットの補助情報を付ける。図28の例では、ライス符号の直前ビットが1である場合には差分を取ることを意味し、ライス符号の直前ビットが0である場合には差分を取らないことを意味する。図28の右下の欄の「XXXXXXX」は、インデックス又は変換インデックスを二進数で表現したものである。
 また、補助情報は、上記可変長符号化方法の符号帳を構成する所定の符号に割り当ててもよい。例えば、非定常的なフレームの頻度が小さい場合には、差分の符号の1つに差分を取らないという意味をもたせる。図29の例では、差の値2に本来対応するライス符号「0010」に差分を取らないという意味を持たせており、差の値2には、差の値3に本来対応するライス符号「00010」を割り当てている。なお、図29のライス符号「0010」の後の「XXXXXXX」は、インデックス又は変換インデックスを二進数で表現したものである。
 なお、このように補助情報を用いる場合には、選択部25は、フレーム毎に、差の値の可変長符号化により生成された符号の量と、インデックス又は変換インデックスをそのまま出力する場合の符号の量とを比較をして、符号の量が小さい方を選択することにより、補助情報及び符号を生成してもよい。
 第三実施形態の利得復号部3は、図9に示すように。例えば第一実施形態の利得復号部3の各部に加えて選択部35を更に含む。
 選択部35は、選択部25と同様にして、現在のサブフレームが定常的な音区間に含まれるかどうかを判断する(ステップC4、図19)。補助情報がある場合には、その補助情報に基づいて判断を行う。補助情報がない場合には、選択部25で説明したのと同様に、現在のサブフレームの利得以外のパラメータに基づいて判断を行う。
 現在のサブフレームが定常的な音区間に含まれると判断される場合には、第一実施形態又は第二実施形態と同様にして復号を行い、生成されたサブフレームを現在のサブフレームに対応するインデックスとする。
 サブフレームが非定常的な音区間に含まれると判断される場合には、入力された符号をそのままインデックス又は変換インデックスとする。入力された符号がインデックスである場合には、そのインデックスが現在のサブフレームのインデックスとなる。入力された符号が変換インデックスである場合には、その変換インデックスは並替部34によりインデックスに逆変換される。逆変換されたインデックスが、現在のサブフレームのインデックスとなる。
 なお、図10に示すように利得符号化部2の前段に選択部25を配置して、図18に破線で示すようにステップB1からステップB3の前に、選択部25の処理(ステップB4)を行ってもよい。この場合、ステップB1からB3の処理は、選択部25において現在のサブフレームが定常的な音区間に含まれると判断された場合のみ行われる。このように、現在のサブフレームが定常的な音区間に含まれると判断された場合のみステップB1からB3の処理を行うことにより、処理を軽減することができる。
 [第四実施形態]
 利得の組のインデックスの値の変遷には時間的連続性が直接反映される保証はない。そこで、インデックスの差の値ができるだけ小さくなるようにインデックスの対応関係を変える必要がある。
 第四実施形態では、対応表及び逆対応表を複数用意して、変換後のインデックスの差の値が小さくなると推測される対応表及び逆対応表を1つ選択し、その選択した対応表及び逆対応表を用いて差の値の可変長符号化及び復号を行う。
 以下、第一実施形態及び第三実施形態と異なる部分を中心に説明をする。第一実施形態及び第三実施形態と同様の部分については、重複説明を省略する。
 第四実施形態の利得符号化部2は、図11に示すように、例えば第一実施形態又は第三実施形態の利得符号化部2の各部に加えて対応表選択部26を更に含む。
 第四実施形態の対応表記憶部22には、複数の対応表が記憶されている。例えば、各対応表は、定常性の程度に応じて対応関係が最適化されている。この例では、定常性が高いAの場合の対応表H(A)、定常性が中度であるBの場合の対応表H(B)、定常性が低いCの場合の対応表H(C)の3つの対応表が対応表記憶部22に記憶されているとする。
 対応表選択部26は、複数の対応表から1つの対応表を選択する(ステップB4、図20)。対応表選択部26は、現在及び/又は過去のサブフレームについてのパラメータに基づいて適切な対応表の選択を行う。対応表選択部26による対応表の選択手法の例を3つ説明する。
 (1)第一の選択手法
 例えば、2つの正の閾値α,β(α>β)を用意しておき、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得がαより大であれば対応表H(A)を、その利得がα以下β以上であれば対応表(B)を、その利得がβより小であれば対応表H(C)を選択してもよい。
 現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得が所定の閾値よりも大きく、かつ、その過去のサブフレームのパルス性成分の利得が所定の閾値よりも小さい場合に対応表H(A)を選択し、他の場合に対応表H(B)又はH(C)を選択してもよい。
 周期性成分の利得は、例えば図22に示すように、インデックス及び変換インデックスと一対一に対応している。したがって、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得に基づいて対応表を選択することと、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスに基づいて対応表を選択することとは等価である。
 したがって、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得に代えて、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスに基づいて対応表を選択するようにしてもよい。例えば、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスごとに適切な対応表を予め用意しておき、入力された現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスに対応する対応表を選択してもよい。
 また、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスの複数個によるグループごとに適切な対応表を予め用意しておき、入力された現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスが属するグループに対応する対応表を選択してもよい。例えば、対応する周期性成分の利得がαより大であるインデックス又は変換インデックスをグループAに、対応する周期性成分の利得がα以下β以上であるインデックス又は変換インデックスをグループBに、対応する周期性成分の利得がβより小であるインデックス又は変換インデックスをグループCに予め分類しておく。グループごとの対応表、すなわち、グループAに対応する対応表H(A)とグループBに対応する対応表H(B)とグループCに対応する対応表H(C)とを予め用意しておく。この場合、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスがグループAに含まれるものである場合には対応表H(A)を選択し、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスがグループBに含まれるものである場合には対応表H(B)を選択し、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスがグループBに含まれるものである場合には対応表H(C)を選択してもよい。
 (2)第二の選択手法
 また、直前のサブフレームのピッチ周期と現在のサブフレームのピッチ周期との差の値の絶対値に基づいて適切な対応表を選択してもよい。例えば、予め3つの対応表H(A)、H(B)、H(C)を用意しておき、直前のサブフレームのピッチ周期と現在のサブフレームのピッチ周期との差の値の絶対値がαより大である場合には対応表H(A)を選択し、直前のサブフレームのピッチ周期と現在のサブフレームのピッチ周期との差の値の絶対値がα以下β以上である場合には対応表H(B)を選択し、直前のサブフレームのピッチ周期と現在のサブフレームのピッチ周期との差の値の絶対値がβより小である場合には対応表H(C)を選択してもよい。また、複数の対応表と、連続する2つのサブフレームのピッチ周期の組と何れの対応表を選択するかの関係を記載したテーブルとを予め用意しておき、そのテーブルを参照して連続する2つのサブフレームのピッチ周期の組に対応する対応表を選択してもよい。なお、ピッチ周期はピッチ周期を表すインデックスと一対一対応するので、連続する2つのサブフレームのピッチ周期の組の代わりに連続する2つのサブフレームのピッチ周期を表すインデックスの組をテーブルに記載しておいてもよい。
 (3)第三の選択手法
 また、現在及び/又は過去のサブフレームについての予測利得に基づいて適切な対応表を選択してもよい。すなわち、現在及び/又は過去のサブフレームについての予測利得ごとに適切な対応表を予め用意しておき、入力された現在及び/又は過去のサブフレームについての予測利得に対応する対応表を選択してもよい。予測利得とは、例えば現在のサブフレームの線形予測係数のインデックスと対応する線形予測係数やこれと等価な係数(PARCOR係数など)から式(1)等により計算された予測利得である。例えば、予め3つの対応表H(A)、H(B)、H(C)を用意しておき、予測利得がαより大である場合には対応表H(A)を選択し、予測利得がα以下β以上である場合には対応表H(B)を選択し、予測利得がβより小である場合には対応表H(C)を選択してもよい。また、複数の対応表と、予測利得と何れの対応表を選択するかの関係を記載したテーブルとを予め用意しておき、そのテーブルを参照して予測利得に対応する対応表を選択してもよい。
 さらに、上記第一の選択手法から上記第三の選択手法を組み合わせた選択手法に基づいて適切な対応表を選択してもよい。すなわち、(1)過去のサブフレームについての周期性成分の利得又はインデックス又は変換インデックスと、(2)連続する2つのサブフレームのピッチ周期の差の値の絶対値と、(3)現在及び/又は過去のサブフレームについての予測利得との組の1つまたは複数ごとに適切な対応表を予め用意しておき、(1)入力された過去のサブフレームについての周期性成分の利得又はインデックス又は変換インデックスと、(2)入力された連続する2つのサブフレームのピッチ周期の差の値の絶対値と、(3)入力された現在及び/又は過去のサブフレームについての予測利得との組に対応する対応表を選択してもよい。
 例えば、第一対応表、第二対応表、第三対応表、第四対応表の4個の対応表を用意しておき、現在及び/又は過去のサブフレームについての予測利得が所定の第一の値よりも大であり現在のサブフレームについての周期性成分の利得が所定の第二の値よりも大である場合には第一対応表を選択し、現在及び/又は過去のサブフレームについての予測利得が所定の第一の値よりも大であり現在のサブフレームについての周期性成分の利得が所定の第二の値以下である場合には第二対応表を選択し、現在及び/又は過去のサブフレームについての予測利得が所定の第一の値以下であり現在のサブフレームについての周期性成分の利得が所定の第二の値よりも大である場合には第三対応表を選択し、現在及び/又は過去のサブフレームについての予測利得が所定の第一の値以下であり現在のサブフレームについての周期性成分の利得が所定の第二の値以下である場合には第四対応表を選択してもよい。
 対応表記憶部22に記憶された複数の対応表には、インデックスと対応する変換インデックスが同じである対応表が含まれていてもよい。この対応表が選択された場合には、変換部21により変換された変換インデックス=インデックスとなる。すなわち、変換部21による変換処理が行われなかったのと同じ効果が得られる。
 また、選択された対応表によっては、変換部21による変換処理を行わなくてもよい。例えば、上記のインデックスと対応する変換インデックスが同じである対応表が選択された場合には、変換部21による変換処理を行わなくてもよい。
 選択された対応表についての情報である対応表情報は並替部21に送られ、並替部21は選択された対応表を参照して各サブフレームのインデックスを変換インデックスに変換する。その後、第一実施形態と同様にして可変長符号化が行われる。利得符号化部2は、対応表情報を復号装置に送ってもよい。
 第四実施形態の利得復号部3は、図12に示すように、例えば第一実施形態の利得復号部3の各部に加えて逆対応表選択部36を更に含む。
 第四実施形態の逆対応表記憶部33には、複数の逆対応表が記憶されている。各逆対応表は定常性の程度に応じて対応関係が最適化されている。また、複数の逆対応表はそれぞれ対応表記憶部22に記憶されている複数の対応表と逆の関係にある。
 逆対応表選択部36は、複数の対応表から1つの対応表を選択する(ステップC4、図21)。逆対応表選択部36は、利得符号化部2の対応表選択部26が対応表に対応する逆対応表を選択する。逆対応表選択部36が対応表情報を取得している場合には、その対応表情報を用いて対応する逆対応表を選択する。対応表情報を用いることができない場合には、逆対応表選択部36は、対応表選択部26が対応表を選択した方法と同様の方法で、その対応表に対応する逆対応表を選択する。
 並替部34は、選択された逆対応表を参照して変換インデックスをインデックスに変換する。
 他の部分については第一実施形態と同様であるため、同じ符号を付けて重複説明を省略する。
 このように、対応表及び逆対応表を複数用意して、変換後のインデックスの差の値が小さくなると推測される対応表及び逆対応表を1つ選択し、その選択された対応表及び逆対応表を用いて差の値の可変長符号化を行うことにより、更に平均ビットレートを下げるか、同じ情報量でも更に品質の高い符号化及び復号を提供することができる。
 なお、選択される対応表によっては、インデックスから変換インデックスへの変換を行った後に差の値を計算せずに、その変換インデックスをそのまま符号化して送信してもよい。上記の例では、例えば対応表H(C)が選択された場合のみ、H(C)を参照して変換した変換インデックスをそのまま符号化して送信してもよい。この場合には、入力された符号をそのまま変換インデックスとする。そして、並替部34は、対応表H(C)に対応する逆対応表G(C)を参照して、変換インデックスをインデックスに変換する。
 [変形例等]
 変換部21は、現在及び/又は過去のサブフレームについてのパラメータによっては、変換部21による変換処理を行わなくてもよい。現在及び/又は過去のサブフレームについてのパラメータとは、(1)入力された過去のサブフレームについての周期性成分の利得、インデックス又は変換インデックスと、(2)連続する2つのサブフレームのピッチ周期の差の値の絶対値と、(3)入力された現在及び/又は過去のサブフレームについての予測利得と、の少なくとも1つである。
 符号化装置、復号装置は、コンピュータによって実現することができる。この場合、符号化装置の各部、復号装置の各部はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、符号化装置の各部、復号装置の各部が、コンピュータ上で実現される。
 このプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、これらの装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
 この発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、上述の実施形態は適宜組み合わせることができる。
1     CELP符号化部
2     利得符号化部
21   並替部
22   対応表記憶部
23   差計算部
24   可変長符号化部
25   選択部
26   対応表選択部
3     利得復号部
31   可変長復号部
32   加算部
33   逆対応表記憶部
34   並替部
35   選択部
36   逆対応表選択部
4     CELP復号部

Claims (45)

  1.  過去のサブフレームの周期性成分の利得とパルス性成分の利得の組に対応するインデックスと現在のサブフレームの周期性成分の利得とパルス性成分の利得の組に対応するインデックスとの差の値を計算する差計算部と、
     値の絶対値が小さいほど短い符号を割り当てる可変長符号化方法により上記差の値を符号化して可変長符号を生成する可変長符号化部と、
     を含む符号化装置。
  2.  請求項1に記載の符号化装置において、
     インデックスと変換インデックスとの対応関係が示された対応表が記憶されている対応表記憶部と、
     上記対応表記憶部の対応表を参照して各上記インデックスに対応する変換インデックスを取得する並替部と、を更に含み、
     上記差計算部は、上記インデックスの差の値に代えて、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスと現在のサブフレームの変換インデックスとの差の値を計算する、
     ことを特徴とする符号化装置。
  3.  請求項2に記載の符号化装置において、
     上記対応表記憶部には、インデックスと変換インデックスとの対応関係が同一ではない複数の対応表が記憶されており、
     上記複数の対応表から1つの対応表を選択する対応表選択部を更に含み、
     上記並替部は、上記選択された対応表を参照して上記インデックスの変換インデックスを取得するものである
     ことを特徴とする符号化装置。
  4.  請求項3に記載の符号化装置において、
     上記対応表選択部は、現在及び/又は過去のサブフレームについてのパラメータに基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化装置。
  5.  請求項3に記載の符号化装置において、
     上記対応表選択部は、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得又はインデックス又は変換インデックスに基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化装置。
  6.  請求項3に記載の符号化装置において、
     上記対応表選択部は、連続する2つのサブフレームのピッチ周期又はこれらピッチ周期に対応するインデックスに基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化装置。
  7.  請求項3に記載の符号化装置において、
     上記対応表選択部は、現在及び/又は過去のサブフレームについての予測利得に基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化装置。
  8.  請求項1から7の何れかに記載の符号化装置において、
     上記現在のサブフレームが定常的な音区間に含まれる場合に上記可変長符号化方法により生成された可変長符号を上記現在のサブフレームに対応する符号とし、上記現在のサブフレームが非定常的な音区間に含まれる場合に上記現在のサブフレームのインデックス又は変換インデックスを上記現在のサブフレームに対応する符号とする選択部を更に含む、
     ことを特徴とする符号化装置。
  9.  請求項1から7の何れかに記載の符号化装置において、
     上記現在のサブフレームについての利得以外のパラメータに基づいて、上記可変長符号化方法により生成された可変長符号を上記現在のサブフレームに対応する符号とするか、上記現在のサブフレームのインデックス又は変換インデックスを上記現在のサブフレームに対応する符号とするかを選択する選択部を更に含む、
     ことを特徴とする符号化装置。
  10.  請求項8又は9に記載の符号化装置において、
     上記選択部は、上記現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得が所定の第一閾値よりも大きい場合に、上記可変長符号を上記現在のサブフレームに対応する符号とする、
     ことを特徴とする符号化装置。
  11.  請求項8又は9に記載の符号化装置において、
     上記選択部は、直前のサブフレームのピッチ周期と上記現在のサブフレームのピッチ周期との差分値の絶対値が所定の第三閾値よりも小さい場合に、上記可変長符号を上記現在のサブフレームに対応する符号とする、
     ことを特徴とする符号化装置。
  12.  請求項8又は9に記載の符号化装置において、
     上記選択部は、上記現在のサブフレームの線形予測係数またはこれと等価な係数から計算された予測利得が所定の第四閾値よりも大きい場合に、上記可変長符号を上記現在のサブフレームに対応する符号とする、
     ことを特徴とする符号化装置。
  13.  請求項8から12の何れかに記載の符号化装置において、
     上記選択部は、その選択の結果についての情報である補助情報を生成する、
     ことを特徴とする符号化装置。
  14.  請求項13に記載の符号化装置において、
     上記補助情報は、上記可変長符号化方法の符号帳を構成する所定の符号に割り当てられている、
     ことを特徴とする符号化装置。
  15.  入力された符号を可変長復号化方法により復号して差の値を取得する可変長復号部と、
     直前のサブフレームのインデックスに上記差の値を加算してインデックスを取得する加算部と、
     を含む復号装置。
  16.  請求項15に記載の復号装置において、
     上記加算部は、直前のサブフレームの変換インデックスに上記差の値を加算して変換インデックスを取得し、
     インデックスと変換インデックスとの対応関係が示された逆対応表が記憶されている逆対応表記憶部と、
     上記逆対応表記憶部の逆対応表を参照して上記取得された変換インデックスに対応するインデックスを取得する並替部と、を更に含む、
     ことを特徴とする復号装置。
  17.  請求項16に記載の復号装置において、
     上記対応表記憶部には、インデックスと変換インデックスとの対応関係が同一ではない複数の対応表が記憶されており、
     上記複数の逆対応表から1つの逆対応表を選択する逆対応表選択部を更に含み、
     上記並替部は、上記選択された対応表を参照して上記取得されたインデックスの変換インデックスを取得するものである、
     ことを特徴とする復号装置。
  18.  請求項17に記載の復号装置において、
     上記逆対応表選択部は、現在及び/又は過去のサブフレームについてのパラメータに基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号装置。
  19.  請求項17に記載の復号装置において、
     上記逆対応表選択部は、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得又はインデックス又は変換インデックスに基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号装置。
  20.  請求項17に記載の復号装置において、
     上記逆対応表選択部は、連続する2つのサブフレームのピッチ周期又はこれらピッチ周期に対応するインデックスに基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号装置。
  21.  請求項17に記載の復号装置において、
     上記逆対応表選択部は、現在及び/又は過去のサブフレームについての予測利得に基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号装置。
  22.  請求項15から21の何れかに記載の復号装置において、
     上記現在のサブフレームが定常的な音区間に含まれる場合には上記取得されたインデックスを現在のサブフレームのインデックスとし、上記現在のサブフレームが非定常的な音区間に含まれる場合には上記取得されたインデックスではなく上記入力された符号から得られたインデックス又は変換インデックスに対応するインデックスを現在のサブフレームのインデックスとする選択部を更に含む、
     ことを特徴とする復号装置。
  23.  請求項15から21の何れかに記載の復号装置において、
     上記現在のサブフレームについての利得以外のパラメータに基づいて、上記取得されたインデックスを現在のサブフレームのインデックスとするか、上記符号から得られたインデックス又は変換インデックスに対応するインデックスを現在のサブフレームのインデックスとするか選択する選択部を更に含む、
     ことを特徴とする復号装置。
  24.  請求項22又は請求項23に記載の復号装置において、
     上記選択部は、現在サブフレームを含むフレームの過去のサブフレームの周期性成分の利得が所定の第一閾値よりも大きい場合に、上記取得されたインデックスを現在のサブフレームのインデックスとする、
     ことを特徴とする復号装置。
  25.  請求項22又は請求項23に記載の復号装置において、
     上記選択部は、直前のサブフレームのピッチ周期と現在のサブフレームのピッチ周期との差分値の絶対値が所定の第三閾値よりも小さい場合に、上記取得されたインデックスを現在のサブフレームのインデックスとする、
     ことを特徴とする復号装置。
  26.  請求項22又は請求項23に記載の復号装置において、
     上記選択部は、上記現在のサブフレームの線形予測係数またはこれと等価な係数から計算された予測利得が所定の第四閾値よりも大きい場合に、上記取得されたインデックスを現在のサブフレームのインデックスとする、
     ことを特徴とする復号装置。
  27.  請求項22から26の何れかに記載の復号装置において、
     上記選択部は、入力された補助情報に基づいて、上記現在のサブフレームが定常的な音区間に含まれるか、非定常的な音区間に含まれるか判断する、
     ことを特徴とする復号装置。
  28.  請求項27に記載の復号装置において、
     上記補助情報は、上記可変長符号化方法の符号帳を構成する所定の符号に割り当てられている、
     ことを特徴とする復号装置。
  29.  過去のサブフレームの周期性成分の利得とパルス性成分の利得の組に対応するインデックスと現在のサブフレームの周期性成分の利得とパルス性成分の利得の組に対応するインデックスとの差の値を計算する差計算ステップと、
     値の絶対値が小さいほど短い符号を割り当てる可変長符号化方法により上記差の値を符号化して可変長符号を生成する可変長符号化ステップと、
     を含む符号化方法。
  30.  請求項29に記載の符号化方法において、
     インデックスと変換インデックスとの対応関係が示された対応表を参照して各上記インデックスに対応する変換インデックスを取得する並替ステップを更に含み、
     上記差計算ステップは、上記インデックスの差の値に代えて、現在のサブフレームを含むフレームの過去のサブフレームのインデックス又は変換インデックスと現在のサブフレームの変換インデックスとの差の値を計算する、
     ことを特徴とする符号化方法。
  31.  請求項30に記載の符号化方法において、
     インデックスと変換インデックスとの対応関係が同一ではない複数の対応表から1つの対応表を選択する対応表選択ステップを更に含み、
     上記並替ステップは、上記選択された対応表を参照して上記インデックスの変換インデックスを取得するものである、
     ことを特徴とする符号化方法。
  32.  請求項31に記載の符号化方法において、
     上記対応表選択部は、現在及び/又は過去のサブフレームについてのパラメータに基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化方法。
  33.  請求項31に記載の符号化方法において、
     上記対応表選択部は、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得又はインデックス又は変換インデックスに基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化方法。
  34.  請求項31に記載の符号化方法において、
     上記対応表選択部は、連続する2つのサブフレームのピッチ周期又はこれらピッチ周期に対応するインデックスに基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化方法。
  35.  請求項31に記載の符号化方法において、
     上記対応表選択部は、現在及び/又は過去のサブフレームについての予測利得に基づいて、上記複数の対応表から1つの対応表を選択する、
     ことを特徴とする符号化方法。
  36.  入力された符号を可変長復号化方法により復号して差の値を取得する可変長復号ステップと、
     直前のサブフレームのインデックスに上記差の値を加算してインデックスを取得する加算ステップと、
     を含む復号方法。
  37.  請求項36に記載の復号方法において、
     上記加算ステップは、直前のサブフレームの変換インデックスに上記差の値を加算して変換インデックスを取得し、
     インデックスと変換インデックスとの対応関係が示された逆対応表を参照して上記取得された変換インデックスに対応するインデックスを取得する並替ステップを更に含む、
     ことを特徴とする復号方法。
  38.  請求項37に記載の復号方法において、
     インデックスと変換インデックスとの対応関係が同一ではない複数の対応表から1つの逆対応表を選択する逆対応表選択ステップを更に含み、
     上記並替ステップは、上記選択された対応表を参照して上記取得されたインデックスの変換インデックスを取得するものである
     ことを特徴とする復号方法。
  39.  請求項38に記載の復号方法において、
     上記逆対応表選択部は、現在及び/又は過去のサブフレームについてのパラメータに基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号方法。
  40.  請求項38に記載の復号方法において、
     上記逆対応表選択部は、現在のサブフレームを含むフレームの過去のサブフレームの周期性成分の利得又はインデックス又は変換インデックスに基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号方法。
  41.  請求項38に記載の復号方法において、
     上記逆対応表選択部は、連続する2つのサブフレームのピッチ周期に基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号方法。
  42.  請求項38に記載の復号方法において、
     上記逆対応表選択部は、現在及び/又は過去のサブフレームについての予測利得に基づいて、上記複数の逆対応表から1つの逆対応表を選択する、
     ことを特徴とする復号方法。
  43.  請求項1から14に記載された符号化装置の各部をコンピュータに実行させるためのプログラム。
  44.  請求項15から28に記載された復号装置の各部をコンピュータに実行させるためのプログラム。
  45.  請求項43又は請求項44に記載されたプログラムが記録されたコンピュータ読み取り可能な記録媒体。
PCT/JP2011/065335 2010-07-16 2011-07-05 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 WO2012008330A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012524520A JP5320508B2 (ja) 2010-07-16 2011-07-05 符号化装置、復号装置、これらの方法、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-161663 2010-07-16
JP2010161663 2010-07-16

Publications (1)

Publication Number Publication Date
WO2012008330A1 true WO2012008330A1 (ja) 2012-01-19

Family

ID=45469333

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/065335 WO2012008330A1 (ja) 2010-07-16 2011-07-05 符号化装置、復号装置、これらの方法、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5320508B2 (ja)
WO (1) WO2012008330A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP2017227904A (ja) * 2014-03-24 2017-12-28 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195098A (ja) * 1992-12-25 1994-07-15 Hitachi Ltd 音声符号化方法
JPH1130996A (ja) * 1997-06-16 1999-02-02 Nec Corp インデックスによる信号生成型適応符号帳
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195098A (ja) * 1992-12-25 1994-07-15 Hitachi Ltd 音声符号化方法
JPH1130996A (ja) * 1997-06-16 1999-02-02 Nec Corp インデックスによる信号生成型適応符号帳
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP5893153B2 (ja) * 2012-10-01 2016-03-23 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP2017227904A (ja) * 2014-03-24 2017-12-28 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体

Also Published As

Publication number Publication date
JP5320508B2 (ja) 2013-10-23
JPWO2012008330A1 (ja) 2013-09-09

Similar Documents

Publication Publication Date Title
US8548801B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP6692948B2 (ja) 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
KR20120121928A (ko) 오디오 코덱 포스트 필터
KR102173422B1 (ko) 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
WO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
KR101350285B1 (ko) 신호를 부호화 및 복호화하는 방법, 장치 및 시스템
US8380495B2 (en) Transcoding method, transcoding device and communication apparatus used between discontinuous transmission
CN102844810B (zh) 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
KR20170127533A (ko) 선형 예측 부호화 장치, 선형 예측 복호 장치, 이들의 방법, 프로그램 및 기록 매체
JP6457552B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
JP5320508B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
KR101996307B1 (ko) 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체
JP5734519B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5800920B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11806660

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012524520

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11806660

Country of ref document: EP

Kind code of ref document: A1