WO2011083849A1 - 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 - Google Patents

符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
WO2011083849A1
WO2011083849A1 PCT/JP2011/050186 JP2011050186W WO2011083849A1 WO 2011083849 A1 WO2011083849 A1 WO 2011083849A1 JP 2011050186 W JP2011050186 W JP 2011050186W WO 2011083849 A1 WO2011083849 A1 WO 2011083849A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
code
pitch
quantized
pitch period
Prior art date
Application number
PCT/JP2011/050186
Other languages
English (en)
French (fr)
Inventor
守谷 健弘
登 原田
優 鎌本
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2011549035A priority Critical patent/JP5314771B2/ja
Priority to RU2012127132/08A priority patent/RU2510974C2/ru
Priority to EP11731847.7A priority patent/EP2523189B1/en
Priority to IN5235DEN2012 priority patent/IN2012DN05235A/en
Priority to US13/518,525 priority patent/US9812141B2/en
Priority to KR1020127016570A priority patent/KR101381272B1/ko
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to CN201180005221.2A priority patent/CN102687199B/zh
Priority to ES11731847.7T priority patent/ES2508590T3/es
Publication of WO2011083849A1 publication Critical patent/WO2011083849A1/ja
Priority to US15/725,626 priority patent/US10049679B2/en
Priority to US15/725,682 priority patent/US10056088B2/en
Priority to US15/725,653 priority patent/US10049680B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Definitions

  • the present invention relates to an encoding technique, and more particularly, to a pitch period encoding technique.
  • One of the conventional methods for encoding a time series signal such as a speech signal or an acoustic signal with low bits is a method of performing encoding by obtaining a pitch period to be encoded (see Non-Patent Document 1, for example).
  • the following is an example of a conventional method in which encoding is performed by obtaining a pitch period, taking the CELP (Code-Excited Linear Prediction) method used in a mobile phone or the like as an example.
  • FIG. 1 is a block diagram for explaining an example of a conventional CELP system.
  • LPC info for specifying the all-pole synthesis filter 915 in the current frame.
  • P and P are linear prediction orders that are positive integers)
  • Fixed codebook 914 is a signal component composed of one or more signals having a value composed of a combination of a non-zero unit pulse and its positive and negative values and one or more signals having a zero value in accordance with the control of search unit 913.
  • the adaptive codebook 912 stores excitation signals generated at each past time point.
  • the adaptive codebook 912 uses the excitation signal delayed according to the pitch period T obtained by the search unit 913.
  • the excitation parameters including and are output.
  • code indexes C f obtained in the first, second, third, and fourth subframes are respectively represented by C f1 and C f2. , C f3 , C f4 .
  • the pitch gains g p obtained in the first, second, third, and fourth subframes are expressed as g p1 , g p2 , g p3 , and g p4 , respectively, and the fixed codebook gain g c is expressed as g c1 , g c2 , They are expressed as g c3 and g c4, and the pitch gain and the fixed codebook gain are collectively referred to as excitation gain.
  • the pitch periods T obtained in the first , second , third , and fourth subframes are represented as T 1 , T 2 , T 3 , and T 4 , respectively.
  • the pitch period T is expressed not only when it is expressed by an integer multiple of the interval between sample points n (integer precision) but also by using an integer multiple of the interval between sample points n and a decimal value (fractional value). In some cases (decimal precision). For example, when the pitch period T is expressed with decimal precision that expresses a decimal value with 2 bits, the pitch period T is expressed as T int -1/4, T int , T int +1/4, T int +1/2 ( Tint is an integer). In addition, when the adaptive signal component v (n) is expressed using the pitch period T with decimal precision, an interpolation filter that performs a weighted average operation on a plurality of excitation signals delayed according to the pitch period T is used. .
  • Excitation parameters such as pitch period T, code index C f , pitch gain g p, and fixed codebook gain g c are input to the parameter encoding unit 917, and the parameter encoding unit 917 is a bit stream that is a code corresponding to them.
  • Pitch gain g p and the fixed codebook gain g c may also be encoded by a vector quantization for selecting an optimum code in the pair of the pitch gain and the fixed codebook gain.
  • FIG. 2A is a diagram for illustrating the configuration of the bitstream BS when a decimal precision pitch period T is used
  • FIG. 2B is a diagram for explaining a code corresponding to the decimal precision pitch period T. is there.
  • FIG. 3 is a diagram for explaining the accuracy (period accuracy) for expressing the pitch period T.
  • the pitch period T is expressed with decimal precision that expresses a decimal value with 2 bits (4 times decimal precision), and the pitch If the integer portion of the period T from T a to T B, represent the pitch period T in decimal precision to represent the fractional value by 1-bit (2-fold decimal accuracy), the integer part of the pitch period T from T B In the case of up to the maximum value T max , the pitch period T is expressed only by an integer multiple of the interval between the sample points n (integer accuracy).
  • the second, integral and first pitch period T 2, T 4 of the fourth subframe, pitch period T 1 of the third sub-frame , T 3 difference values are encoded with 4 bits each (difference integer part), and the values after the decimal point of the pitch periods T 2 , T 4 (decimal part) regardless of the value of the difference integer part
  • Each is encoded with 2 bits (4 times decimal precision).
  • the pitch periods T 2 and T 4 are searched within a range in which a difference value between each integer part and each integer part of the pitch periods T 1 and T 3 can be encoded with 4 bits. That is, the pitch period T 2, T 4 is such that each of the integer part, the range of values +7 integer part of the pitch period T 1, the pitch period from the value -8 integer portion of T 3 T 1, T 3 It was searched in a wide range.
  • the bitstream BS output from the parameter encoding unit 917 of the encoding device 91 (FIG. 1) is input to the parameter decoding unit 927 of the decoding device 92.
  • encoding is performed by assigning a fixed bit to the code of the pitch period of each frame. This is not limited to the CELP system, and the same applies to other conventional systems that perform encoding by obtaining a pitch period to be encoded.
  • the compression efficiency is improved by devising the coding method of the pitch period.
  • a pitch period corresponding to a time series signal included in a predetermined time interval is calculated, and a code corresponding to the pitch period is output.
  • the index representing the high periodicity and / or stationary property of the time series signal represents the condition indicating that the periodicity and / or stationary property is high, or the periodicity and / or stationary property is low.
  • the accuracy for expressing the pitch period and / or the coding method of the pitch period is switched.
  • a code corresponding to a predetermined time interval is input, and the index indicating the high periodicity and / or stationary property included in or obtained from the code has high periodicity and / or stationary property.
  • the code decoding method corresponding to the pitch period included in the code is switched to correspond to the pitch period.
  • the code is decoded to obtain a pitch period corresponding to a predetermined time interval.
  • the accuracy and / or the pitch period encoding method for expressing the pitch period according to the periodicity and continuity of the time-series signal are provided. Since switching is performed, it is possible to improve the compression efficiency of the pitch period.
  • FIG. 1 is a block diagram for explaining an example of a conventional CELP system.
  • FIG. 2A is a diagram for illustrating the configuration of the bit stream BS in the case where the pitch period T with decimal precision is used.
  • FIG. 2B is a diagram for explaining a code corresponding to the pitch period T with decimal precision.
  • FIG. 3 is a diagram for explaining a method of encoding the decimal part of the pitch period.
  • FIG. 4 is a block diagram for explaining the encoding device and the decoding device according to the embodiment.
  • FIG. 5 is a block diagram for explaining the parameter encoding unit of the embodiment.
  • FIG. 6 is a block diagram for explaining the parameter decoding unit of the embodiment.
  • FIG. 7A is a flowchart for explaining the encoding method of the embodiment.
  • FIG. 1 is a block diagram for explaining an example of a conventional CELP system.
  • FIG. 2A is a diagram for illustrating the configuration of the bit stream BS in the case where the pitch period T
  • FIG. 7B is a flowchart for explaining the decoding method according to the embodiment.
  • 8A and 8B are diagrams for explaining a configuration example of codes corresponding to the pitch period.
  • FIG. 9A is a diagram for explaining a configuration example of codes corresponding to pitch periods.
  • FIG. 9B is a diagram for explaining a variable-length code corresponding to the integer part of the pitch period of the second and fourth subframes.
  • FIG. 10A is a diagram for illustrating a pitch period encoding method according to the third embodiment when the time-series signal is stationary (periodic).
  • 10B and 10C are diagrams for illustrating the code X 1 of the pitch period of the third subframe.
  • FIG. 11 is a diagram illustrating the relationship between a frame and a super frame.
  • FIGS. 16A to 16C are diagrams for explaining a modification of the pitch period encoding method.
  • FIG. 17A is a diagram for explaining a modification of the pitch period encoding method.
  • FIG. 7B is a diagram for explaining a variable-length code corresponding to the integer part of the pitch period of the second and fourth subframes.
  • the contribution of the periodic component to the entire code is small. Therefore, even if the accuracy for expressing the pitch period T and the encoding frequency (frequency of frames to be encoded) are reduced, the encoding quality (quality of the synthesized signal after decoding with respect to the time-series signal before encoding) Does not decrease so much.
  • the accuracy for expressing the pitch period T and the encoding frequency are reduced in non-stationary (non-periodic) frames. This reduces the average code amount per frame.
  • the quality can be improved by reducing the average bit rate or assigning the saved information to an increase in the code length of the signal component code from the fixed codebook, for example.
  • FIG. 4 is a block diagram for explaining the encoding device and the decoding device according to the embodiment.
  • FIG. 5 is a block diagram for explaining the parameter encoding unit of the embodiment.
  • FIG. 6 is a block diagram for explaining the parameter decoding unit of the embodiment.
  • the difference between the encoding device 11 of the first embodiment and the conventional encoding device 91 is that the parameter encoding unit 917 is replaced with a parameter encoding unit 117. is there.
  • the difference between the decoding device 12 of the first embodiment and the conventional decoding device 92 is that the parameter decoding unit 927 is replaced with a parameter decoding unit 127.
  • FIG. 4 the difference between the encoding device 11 of the first embodiment and the conventional encoding device 91 is that the parameter encoding unit 917 is replaced with a parameter encoding unit 117. is there.
  • the difference between the decoding device 12 of the first embodiment and the conventional decoding device 92 is that the parameter decoding unit 927 is replaced with a parameter decoding unit
  • the parameter encoding unit 117 of the present embodiment includes a gain quantization unit 117a, a determination unit 117b, switch units 117c and 117f, pitch cycle encoding units 117d and 117e, and a combining unit 117g. And have.
  • the parameter decoding unit 127 of the present embodiment includes a determination unit 127b, switch units 127c and 127f, pitch period decoding units 127d and 127e, and a separation unit 127g.
  • the encoding device 11 and the decoding device 12 of this embodiment are, for example, a known computer or a dedicated computer having a CPU (central processing unit), a RAM (random-access memory), a ROM (read-only memory), and the like. It is a special device configured by reading programs and data. Further, at least part of the processing units of the encoding device 11 and the decoding device 12 may be configured by hardware such as an integrated circuit.
  • FIG. 7A is a flowchart for explaining the encoding method of the embodiment. Below, it demonstrates centering on difference with a prior art.
  • the combination of gain and fixed codebook gain may be vector quantized.
  • the quantized value of pitch gain (quantized pitch gain) and the quantized value of fixed codebook gain (quantized fixed codebook gain) A code such as an index is associated with each combination.
  • a set of quantized pitch gain and quantized fixed codebook gain obtained by such vector quantization is called a “quantized gain vector”, and a code obtained by vector quantization is called “vector quantized”. It is called “gain code (VQ gain code)”.
  • VQ gain code VQ gain code
  • one VQ gain code may be associated with each combination of a pitch gain quantization value and a fixed codebook gain quantization value corresponding to the same subframe.
  • one VQ gain code may be associated with each combination of a quantized value of pitch gain and a quantized value of fixed codebook gain corresponding to each of a plurality of subframes, or corresponding to the same frame
  • One VQ gain code may be associated with each combination of the pitch gain quantization value and the fixed codebook gain quantization value.
  • a table for specifying a VQ gain code corresponding to a combination of a quantized value of pitch gain and a quantized value of fixed codebook gain is used.
  • An example of the two-dimensional codebook is a table in which a combination of a quantized value of pitch gain and a quantized value of fixed codebook gain is associated with a VQ gain code.
  • Another example of the two-dimensional codebook is a table in which a combination of a quantized value of pitch gain and a quantized value of a fixed codebook gain corresponding value is associated with a VQ gain code.
  • An example of the fixed codebook gain corresponding value is the fixed codebook gain in the current subframe (or frame) predicted based on the energy of the signal component from the fixed codebook 914 in the past subframe (or frame). And a correction factor that represents the ratio of the estimated value of the fixed codebook gain in the current subframe (or frame). Examples of correction coefficients are given in “3.9 Quantization of ITU-T Recommendation G.729,“ Coding of Speech at 8 kbit / s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP) ”. ⁇ described in the “the gains” column.
  • the two-dimensional codebook may be composed of one table, or it may be composed of a plurality of tables, such as the two-stage conjugate structure codebook in Reference 1 (two-stage conjugate structured codebook). Good.
  • the VQ gain code corresponding to the combination of the quantized value of the pitch gain and the quantized value of the fixed codebook gain is, for example, the quantized value of the pitch gain.
  • a combination of indexes determined for each table constituting the two-dimensional codebook is used (step S111).
  • a specific determination method is illustrated below.
  • determining whether or not the index> the specified value is satisfied it may be determined whether the index is greater than the specified value, or whether or not the index ⁇ (the specified value + constant) is satisfied. By doing so, it may be determined whether or not the index is larger than a specified value.
  • a specified value may be set as a processing threshold, or (specified value + constant) may be set as a processing threshold. The same applies to the determination of “whether or not the index is larger than the specified value” described below.
  • the average value of quantized pitch gain in some subframes may be made using (for example, an average value of g p1 ′ and g p3 ′) or a quantized pitch gain (for example, g p1 ′) in any one subframe.
  • the determination using the quantized pitch gain of any one subframe is good when the determination is made using the smallest value of the quantized pitch gains of all the subframes included in the frame.
  • the ratio between the value corresponding to the quantized fixed codebook gain is used. Examples of criteria using this index are shown below. This criterion is based on the fact that the periodicity of the pitch period is high in a stationary frame, and the ratio of the value corresponding to the pitch gain to the value corresponding to the fixed codebook gain is large.
  • values corresponding to the quantized fixed codebook gain are the quantized fixed codebook gain itself, the quantized correction factor described above, and the like.
  • Examples of the value corresponding to the quantized pitch gain are the quantized pitch gain itself, the average value of the quantized pitch gain, and the broadly monotonically increasing function value of the quantized pitch gain.
  • the determination results using a set of a value corresponding to the quantized pitch gain of each subframe and a value corresponding to the quantized fixed codebook gain are all stationary (periodic).
  • a determination result using a set of a value corresponding to a quantized pitch gain of a predetermined number or more subframes and a value corresponding to a quantized fixed codebook gain is stationary (periodic)
  • Each of the values corresponding to the fixed codebook gains obtained is compared with the first specified value and the second specified value.
  • a regular frame has a high pitch period periodicity and a large pitch gain.
  • the periodicity of the pitch period from the previous frame is low and the pitch gain is small, but the periodicity of the pitch period is high in the frame.
  • the frame is stationary if the value corresponding to the quantized fixed codebook gain is a large value. In other words, if the value corresponding to the pitch gain is small and the value corresponding to the quantized fixed codebook gain is a small value, the frame is not stationary. Examples of criteria using these indices are given below.
  • Examples of the value corresponding to the quantized pitch gain are the quantized pitch gain itself, the average value of the quantized pitch gain, and the broadly monotonically increasing function value of the quantized pitch gain.
  • An example of the quantized pitch gain is g ⁇ p (quantified adaptive codebook gain) of Non-Patent Document 1.
  • Examples of values corresponding to the quantized fixed codebook gain are the quantized fixed codebook gain itself, the quantized correction coefficient ⁇ gc ⁇ , and the like.
  • An example of the quantized correction coefficient ⁇ gc ⁇ is ⁇ gc ⁇ (optimum value for ⁇ gc ) of Non-Patent Document 1.
  • a determination is made to determine whether the time series signal x (n) (n 0,..., L-1) is not stationary (periodic) (whether it is stationary (periodic)).
  • step S112 the combination of the pitch gain and the fixed codebook gain is vector-quantized in step S111, and the VQ gain code is added to the combination of the quantized pitch gain and the quantized fixed codebook gain.
  • the determination of specific example 2 or 3 or 4 of step S112 is performed.
  • a determination method using the VQ gain code as an index will be exemplified.
  • the VQ gain code is a combination of a pitch gain quantization value and a fixed codebook gain quantization value, or a pitch gain quantization value and a fixed codebook gain corresponding value quantization value.
  • the determination result in [Specific example 2-4 of step S112] described above can be associated with each VQ gain code.
  • the determination is made using the quantized pitch gain as an index. Therefore, the VQ gain code (quantized pitch gain) corresponding to the quantized pitch gain as the index is determined. The value corresponding to the gain) can be associated with the determination result.
  • step S112 since the determination is made using the ratio between the value corresponding to the quantized pitch gain and the value corresponding to the quantized fixed codebook gain as an index, The VQ gain code corresponding to the ratio can be associated with the determination result.
  • the determination since the determination is performed using the value corresponding to the quantized pitch gain and the value corresponding to the quantized fixed codebook gain as an index, the quantized pitch gain as an index is determined. And a determination result can be associated with a VQ gain code corresponding to a set of values corresponding to the quantized fixed codebook gain.
  • a determination result as to whether it is stationary or not stationary (unsteady) is obtained in advance, and such a determination result is determined.
  • a table in which the VQ gain code corresponding to the result is associated with each other can be stored in the determination unit 117b.
  • the determination unit 117b can obtain a determination result corresponding to the input VQ gain code by referring to such a table.
  • the accuracy and / or pitch period encoding method for expressing the pitch period is determined according to such a determination result, the accuracy and / or the pitch period for expressing each VQ gain code and the pitch period are determined.
  • a table associated with the encoding method can also be stored in the determination unit 117b.
  • the determination unit 117b can obtain the accuracy and / or the pitch period encoding method for expressing the pitch period corresponding to the input VQ gain code by referring to such a table. (End of description of [Specific example 1-5 of step S112]).
  • the pitch period encoding unit 117d outputs a code obtained by encoding the pitch period expressed with the first accuracy for each first time interval (step S113).
  • T 2 , T 3 , and T 4 are sent to the pitch period encoding unit 117e.
  • the pitch period encoding unit 117e outputs a code obtained by encoding the pitch period expressed with the second accuracy for each second time interval.
  • pitch period encoding unit 117e is the same as the conventional (see FIG. 2A and B), and generates and outputs a code C T corresponding to the pitch period T of the current frame (step S114).
  • step S113 non-stationary
  • FIG. 8A is a diagram for explaining a configuration example of the code C T corresponding to the pitch period T of the current frame generated in step S113. In the example of FIG.
  • T 4 are encoded with 6 bits each (integer part of pitch period).
  • step S114 the pitch period encoding unit 117e sets the precision for expressing the pitch periods T 1 and T 3 to decimal precision (second precision) or integer precision, and each subframe Each one is encoded independently.
  • the pitch period encoding unit 117e encodes the difference values between the integer part of the pitch periods T 2 and T 4 and the integer part of the pitch periods T 1 and T 3 expressed in decimal precision (second precision). To do. Further, the values after the decimal point (decimal part) of the pitch periods T 2 and T 4 are each encoded with 2 bits (see FIG. 2B).
  • step S113 the pitch period encoding unit 117d obtains a code corresponding to the pitch period for each time period (first time period) including a plurality of subframes, and the pitch of the current frame.
  • a code C T corresponding to the period T is generated. That is, a code is generated using a common pitch period T for a plurality of subframes (lowering the pitch period encoding frequency).
  • FIG. 8B is a diagram for explaining a configuration example of the code C T corresponding to the pitch period T of the current frame generated in step S113. In the example of FIG.
  • any one obtained by encoding the pitch periods T 1 and T 2 expressed in integer precision is used in common.
  • the code of the pitch period T of the 3 and 4 subframes any one obtained by encoding the pitch periods T 3 and T 4 expressed with integer precision is commonly used.
  • step S114 the pitch period encoding unit 117e encodes the pitch periods T 1 , T 2 , T 3 , and T 4 for each subframe (second time interval).
  • the values of the pitch periods T 1 and T 3 are independently encoded for each subframe, and the integer part of the pitch periods T 2 and T 4 and the integer part of the pitch periods T 1 and T 3
  • the difference value is encoded, and the values after the decimal point (decimal part) of the pitch periods T 2 and T 4 are each encoded with 2 bits (see FIG. 2B / [specific examples 1 and 2 of steps S113 and S114]). End of explanation).
  • An index such as a VQ gain code may be included in the bitstream BS instead of the code representing c3 ′, g c4 ′ (step S115).
  • FIG. 7B is a flowchart for explaining the decoding method according to the embodiment. Below, it demonstrates centering on difference with a prior art.
  • the bit stream BS is input to the parameter decoding unit 127 (FIG. 6) of the decoding device 12.
  • step S112 is used in the encoding device 11
  • step S112 when specific example 4 of step S112 is used in the encoding device 11]
  • the value and quantum corresponding to the pitch gain quantized as an index representing the high degree of continuity of the time series signal x (n) (n 0,..., L-1).
  • Each of the values corresponding to the fixed codebook gains obtained is compared with the first specified value and the second specified value.
  • Specific determination contents are as illustrated in specific example 4 of step S112.
  • Specific determination contents are as illustrated in specific example 5 of step S112.
  • a table in which the determination result described in the specific example 5 of step S112 and the VQ gain code corresponding to the determination result are associated with each other is stored in the determination unit 127b, and the determination unit 127b receives the input VQ gain code. The judgment result corresponding to is obtained by referring to such a table.
  • the accuracy and / or pitch period encoding method for expressing the pitch period is determined according to the determination result, and the corresponding decoding method is also determined. Therefore, a table in which each VQ gain code is associated with accuracy for expressing the pitch period and / or decoding of the pitch period can be stored in the determination unit 127b. In this case, the determination unit 127b can obtain the accuracy for expressing the pitch period and / or the decoding method of the pitch period corresponding to the input VQ gain code by referring to such a table ( End of description of the specific example of step S122).
  • step S122 the decoding method of code C T is switched.
  • the switch unit 127f performs the code C of the current frame based on the control of the determination unit 127b.
  • T is sent to pitch period decoding section 127d.
  • a specific example of the process in step S123 is shown below.
  • the pitch period decoding unit 127d uses the code C T to express the pitch periods T 1 ′, T 2 ′, T 3 ′, T 4 ′ of the first to fourth subframes expressed with integer precision (first precision). Are extracted and output.
  • the pitch period decoding unit 127d extracts a pitch period for each time interval (first time interval) including a plurality of subframes from the code C T and outputs them. That is, the code corresponding to the pitch period is decoded by a decoding method for obtaining the pitch period for each first time interval.
  • the same pitch period T 1 ′, T 2 ′ T for the first and second subframes.
  • the switch unit 127c determines the sign of the current frame based on the control of the determination unit 127b (FIG. 6).
  • C T is sent to the pitch period decoding unit 127e.
  • the pitch period decoding unit 127e decodes a code obtained by encoding the pitch period expressed with the second accuracy for each second time interval. That is, the code corresponding to the pitch period is decoded by a decoding method that obtains the pitch period expressed with the second accuracy for each second time interval.
  • a specific example of step S124 is shown below.
  • the pitch period decoding unit 127e extracts the pitch period T 1 ′ of the first subframe and the pitch period T 3 ′ of the third subframe from the code C T and outputs them. Moreover, pitch period decoding unit 127e includes, from the code C T, a difference value between the integer part of the pitch period in the first subframe of the integer part of the pitch period of the second sub-frame, the integer part of the pitch period of the fourth sub-frame The difference value from the integer part of the pitch period of the third subframe, the fractional part of the pitch period of the second subframe, and the decimal part of the pitch period of the fourth subframe are extracted.
  • pitch period decoding unit 127e includes an integer part of the pitch period in the first subframe obtained from pitch period T 1 'of the first subframe, the pitch of the first subframe of the integer part of the pitch period of the second sub-frame By adding the difference value from the integer part of the period and the decimal part of the pitch period of the second subframe, the pitch period T 2 ′ of the second subframe is obtained and output.
  • pitch period decoding unit 127e includes an integer part of the pitch period of the third sub-frame obtained from pitch period T 3 'of the third sub-frame, the pitch of the third sub-frame of the integer part of the pitch period of the fourth sub-frame By adding the difference value from the integer part of the period and the fractional part of the pitch period of the fourth subframe, the pitch period T 4 ′ of the fourth subframe is obtained and output (step S124 in detail).
  • the pitch period T ′ T 1 ′, T 2 ′, T 3 ′, T 4 ′ of the decoded current frame is output by the switch unit 127 c based on the control of the determination unit 127 b .
  • the search unit 913 (FIG. 4) of the encoding device 11 may be configured to change the search range of the pitch period T in a frame that is future than the current frame. For example, since the contribution of the adaptive signal component is small when it is determined to be non-stationary, the search range of the pitch period may be narrower than the search range when it is determined to be stationary.
  • the estimation value E of the prediction gain generated using the linear prediction information LPC info generated for the current frame is used for the current frame.
  • the structure which changes a search range may be sufficient.
  • the search range when determined to be non-stationary may be narrower than the search range when determined to be stationary.
  • the processing of the search unit 913 for the current frame may be performed again.
  • step S113 when the pitch period T is encoded for each time interval composed of a plurality of subframes when it is determined to be non-stationary (the encoding frequency is reduced).
  • the frequency of calculating the pitch period T by the search unit 913 may be reduced. That is, for example, if only one pitch period is encoded for a plurality of subframes, only one pitch period need be calculated for the plurality of subframes.
  • the pitch period T may be changed.
  • the pitch period T expressed with integer precision is calculated when it is determined to be non-stationary
  • the pitch period T expressed with decimal precision is calculated when it is determined to be stationary. It may be.
  • the estimation value E of the prediction gain generated using the linear prediction information LPC info generated for the current frame is used for the current frame.
  • Determine whether the sequence signal x (n) (n 0, ..., L-1) is stationary or non-stationary, and depending on the result, determine the pitch period T in the current frame. It may be configured to select whether to calculate with integer precision or decimal precision.
  • the pitch period T expressed with integer precision is calculated when it is determined to be non-stationary, and the pitch period T expressed with decimal precision is calculated when it is determined to be stationary. It may be.
  • the process of the search part 913 with respect to the present frame is performed. You may try again.
  • the number of bits allocated to the code index C f may be changed depending on whether it is determined to be stationary. For example, when it is determined that it is non-stationary, the code amount of the code C T corresponding to the pitch period T is smaller than when it is determined that it is stationary.
  • the coding quality is improved by allocating a larger number of bits to the code index C f corresponding to the code amount saving of the code C T corresponding to the pitch period T. It may be improved.
  • a difference value between a value corresponding to the pitch period of the section for example, a pitch period or an integer part of the pitch period
  • a value corresponding to the pitch period of the past time section from the time section included in the predetermined time section.
  • this difference value is smaller than a regulation value, it determines with it being stationary (periodic), and when that is not right, you may determine with non-stationary (non-periodic).
  • a specified value may be set as a threshold for processing, or (specified value ⁇ constant) may be set as a threshold for processing.
  • auxiliary information for specifying the items (pitch cycle accuracy, encoding method, etc.) that the encoding device 11 selects according to the determination result of continuity or periodicity is included in the bit stream BS.
  • the decoding device 12 can specify the items (pitch cycle accuracy, decoding method, etc.) to be selected according to the determination result of continuity or periodicity using the auxiliary information included in the bit stream BS.
  • the second embodiment is a modification of the first embodiment or its modifications 1-6.
  • the difference between the second embodiment and the first embodiment or its modifications 1-6 is that the pitch period coding method is switched according to whether the time-series signal is stationary (periodic) or not. And the contents of the decoding method.
  • a change in pitch period is small in a regular (periodic) frame, and the difference value between each pitch period of a subframe belonging to the frame may be 0 or a small value. large. Therefore, it is effective to perform variable length coding on the difference value between each pitch period of a subframe in a stationary frame.
  • a frame that is not stationary (periodic) such a variation in the difference value becomes large, so that variable length coding is often not effective.
  • the pitch period encoding process when the index representing the high periodicity and / or continuity of the time-series signal satisfies the condition representing that the periodicity and / or continuity is high.
  • the pitch period of the first predetermined time period included in the predetermined time period is encoded, and the value corresponding to the pitch period of the second predetermined time period other than the first predetermined time period included in the predetermined time period and the second
  • the difference value with the value corresponding to the pitch period of the time interval other than the predetermined time interval is variable length encoded.
  • the “predetermined time interval” is a frame
  • the “first predetermined time interval” is the first and third subframes
  • the “second predetermined time interval” is the second and fourth subframes
  • “ The case where the value corresponding to the pitch period is an integer part of the pitch period will be described as an example. However, this does not limit the invention.
  • the difference between the parameter encoding unit 217 of the second embodiment and the parameter encoding unit 117 of the first embodiment is that the pitch period encoding unit 117d is replaced with a pitch period encoding unit 217d.
  • the pitch cycle encoding unit 117e is replaced with the pitch cycle encoding unit 217e.
  • the difference between the parameter decoding unit 227 of the second embodiment and the parameter decoding unit 127 of the first embodiment is that the pitch period decoding unit 127d is replaced with a pitch period decoding unit 227d,
  • the pitch period decoding unit 127e is replaced with a pitch period decoding unit 227e.
  • step S213 is executed instead of step S113 of the first embodiment
  • step S214 is executed instead of step S114 of the first embodiment.
  • Others may be the same as those in the first embodiment and its modifications. Hereinafter, only the processing of step S213 and step S214 of this embodiment will be described.
  • the pitch period encoding unit 217d is, for example, a method similar to the conventional method (FIGS. 2A and B) (specific example 1 of step S213) or a method similar to step S113 (FIG. 8) of the first embodiment (step S213). in embodiment 2), and it generates and outputs a code C T corresponding to the pitch period T of the current frame (step S213).
  • the pitch period encoding unit 217e determines the pitch periods T 1 and T 3 (difference from the minimum value of the pitch period) of the first and third subframes (first predetermined time interval) in the same manner as in the past (FIG. 2A, 2B and 3), encoding is performed independently for each subframe.
  • pitch period encoding section 217e is other than the second sub-frame integral part of the pitch period T 2 of the (second predetermined time interval) (value corresponding to the pitch period) and the first sub-frame (second predetermined time interval variable-length coding the difference value TD (1, 2) of the integer part of the pitch period T 1 of the time interval), an integer part of the pitch period T 4 in the fourth sub-frame (second predetermined time interval) the third sub frame difference value between integral part of the pitch period T 3 (the second predetermined non-time section time period) TD (3, 4) for variable length coding.
  • the difference value TD (alpha, beta) are (integer part of the pitch period T alpha) - may be a (pitch integral part of the period T beta), (integer part of the pitch period T beta) - (pitch it may be an integer part) of the period T alpha, but to be adopted either in advance unified and decoding device and coding device.
  • the fractional parts of the pitch periods T 2 and T 4 of the second and fourth subframes are encoded with fixed bits (for example, 2 bits), respectively.
  • a variable length encoding method performed on the difference value TD (1, 2) and the difference value TD (3,4) in this embodiment will be exemplified.
  • the difference value TD (1,2) or the difference value TD (3,4) is ⁇ 1,0, + 1
  • the difference value TD (1,2) or the difference value TD (3,4 ) Is a variable-length encoded code, and in other cases, 1 bit (for example, “1”) indicating that and 4 bits indicating the difference value are used as codes.
  • the difference value TD (1, 2) and the difference value TD (3,4) are each variable-length encoded as follows. In the case of Table 1, the amount of information increases by 25% if the difference value is other than -1,0, + 1. Therefore, the number of bits is reduced when the frequency of the difference value is other than -1,0, + 1. Not.
  • Information obtained by integrating each difference value with a value corresponding to each pitch period is variable-length encoded.
  • the “predetermined time interval” is a frame
  • the “first predetermined time interval” is the first and third subframes
  • the “second predetermined time interval” is the second and fourth subframes.
  • a case where a frame is “a value corresponding to a pitch period” is an integer part of the pitch period will be described as an example.
  • a special 1-bit designation code (for example, “1”) is used as the difference value TD (1,2 ) And the difference value TD (3,4).
  • a 2-bit designation code (for example, “00”) indicating any one of the four states, and two bits (“00”, “01”, “10”, “11”) is a code corresponding to the difference value TD (1, 2) and the difference value TD (3,4).
  • a specified code of 2 bits (for example, “01”) for specifying it, 4 bits for representing the difference value TD (1,2), and a difference value TD (3,4) A total of 10 bits including 4 bits to represent is used as a code corresponding to the difference value TD (1, 2) and the difference value TD (3,4).
  • the difference value TD (1,2) and the difference value TD (3,4) are collectively variable length encoded as follows.
  • a 2-bit designation code (for example, “00”) indicating any one of these 6 states, and 2 or 3 bits (for example, “00”, “01”, 4 or 6 bits in total consisting of “100”, “101”, “110”, “111”) are used as codes corresponding to the difference value TD (1, 2) and the difference value TD (3,4).
  • a 1-bit (for example, “1”) designation code for identifying it, 4 bits for representing the difference value TD (1, 2), and a difference value TD (3,4)
  • a total of 9 bits including 4 bits to represent is used as a code corresponding to the difference value TD (1, 2) and the difference value TD (3,4). For example, as illustrated in FIGS.
  • the difference value TD (1,2) and the difference value TD (3,4) are collectively variable-length encoded.
  • Table 3 the sign (“00110") when the difference value TD (1,2) is +1 and the difference value TD (3,4) is -1 and the difference value TD (1,2) are
  • the difference value TD (3,4) is +1 and the code length of the code ("00111") is -1
  • the difference value TD (1,2) is 0
  • the difference value TD (3,4) is
  • the code length of the code (“0000", "0001") in the case of +1, -1 is longer than the code length of the difference value TD (1, 2) is +1 and the difference value TD (3,4 ) Is ⁇ 1, and the difference value TD (1, 2) is ⁇ 1 and the difference value TD (3,4) is +1 is less frequent.
  • the assumed frequency of each state is illustrated.
  • the expected code length of the code corresponding to the difference values TD (1,2), TD (3,4) is 5.35 bits on average
  • the difference values TD (1,2) and TD (3,4) are encoded with 4 bits, the total code length is 8 bits to 2.65 bits.
  • this assumed frequency is for frames with high stationarity (for example, 40% of the frames), and the difference values TD (1,2) and TD (3,4) are biased in frames with low stationarity. Smaller and wider distribution. Therefore, a high compression effect by variable length coding can be obtained by performing the coding only in the case where it is determined in step S112 that it is determined to be stationary.
  • step S112 condition when stationary
  • the frequency with which variable-length coding is applied decreases, and the information reduction effect is limited.
  • the conditions in step S112 condition when stationary
  • the conditions in step S112 are relaxed too much, a high compression effect by variable-length coding cannot be obtained, and in some cases, the average number of bits may increase as compared with the conventional case. There is also sex. Therefore, it is necessary to appropriately adjust the condition setting in step S112.
  • step S223 is executed instead of step S123 of the first embodiment
  • step S224 is executed instead of step S124 of the first embodiment.
  • Others may be the same as those in the first embodiment and its modifications. Below, only the process of step S223 and step S224 of this form is demonstrated.
  • the encoding device 21 executes the process of the specific example 1 in step S213 to generate the code C T of the current frame (see FIGS. 2A and B)
  • the code C T is used by a method similar to the conventional method.
  • the pitch period T ′ T 1 ′, T 2 ′, T 3 ′, T 4 ′ of the current frame is generated.
  • the encoding device 21 executes the process of specific example 2 of step S213 to generate the code C T of the current frame
  • the code is encoded by the corresponding process of step S123 of the first embodiment.
  • the pitch period T ′ T 1 ′, T 2 ′, T 3 ′, T 4 ′ of the current frame is generated from C T.
  • the third embodiment is a modification of the first embodiment or its modification 1-6 or the second embodiment.
  • the difference between the third embodiment and the first embodiment or its modifications 1-6 or the second embodiment is that the pitch is switched according to whether the time-series signal is stationary (periodic) or not. It is the content of the encoding system and decoding system of a period.
  • the pitch cycle encoding process of the third embodiment when the index indicating the periodicity and / or high continuity of the time-series signal satisfies the condition indicating that the periodicity and / or continuity is high.
  • the pitch period of the first predetermined time period included in the predetermined time period is encoded, and the value corresponding to the pitch period of the second predetermined time period other than the first predetermined time period included in the predetermined time period and the predetermined time
  • a variable length encoding is performed on a difference value from a value corresponding to a pitch period of a time interval other than the second predetermined time interval included in the interval.
  • the “predetermined time interval” is a frame
  • the “first predetermined time interval” is a first subframe
  • the “second predetermined time interval” is a third subframe
  • the “time period other than the time period” is the first subframe
  • the “value corresponding to the pitch period” is the integer part of the pitch period.
  • the difference between the parameter encoding unit 317 of the third embodiment and the parameter encoding unit 117 of the first embodiment is that the determining unit 117b is replaced with a determining unit 317b, and pitch period encoding is performed.
  • the point 117d is replaced with a pitch cycle encoding unit 317d
  • the pitch cycle encoding unit 117e is replaced with a pitch cycle encoding unit 317e.
  • the difference between the parameter decoding unit 327 of the third embodiment and the parameter decoding unit 127 of the first embodiment is that the determination unit 127b is replaced with a determination unit 327b, and the pitch period decoding unit 127d is replaced with the pitch period decoding unit 327d, and the pitch period decoding unit 127e is replaced with the pitch period decoding unit 327e.
  • step S312 is executed instead of step S112 of the first embodiment
  • step S313 is executed instead of step S113 of the first embodiment
  • step S314 is executed instead of step S114.
  • Others may be the same as those in the first embodiment and its modifications. Below, only the process of step S313 and step S314 of this form is demonstrated.
  • the determination in step S312 may be performed in the same manner as in step S112 of the first embodiment, but in the third embodiment, the value corresponding to the pitch period of any time interval included in the predetermined time interval and the predetermined The time series signal x (n) (n) is used when the magnitude of the difference value from the value corresponding to the pitch period of the previous time interval from the time interval included in the time interval is used as an index.
  • step S312 pitch periods T 1 and T 2 are input to determination unit 317b.
  • the determination unit 317b uses the magnitude of the difference value TD (1, 2) that is the difference between the integer parts of the pitch periods T 1 and T 2 as an index, and determines whether or not it is smaller than a specified value.
  • the index may be determined whether or not the index is smaller than the specified value by determining whether or not the index ⁇ specified value is satisfied, or whether or not the index ⁇ (specified value ⁇ constant) is satisfied. By doing so, it may be determined whether or not the index is smaller than a specified value.
  • a specified value may be set as a threshold for processing, or (specified value ⁇ constant) may be set as a threshold for processing. The same applies to the determination of “whether or not the index is smaller than the prescribed value” described below.
  • the difference value TD (1, 2) which is the difference between the integer parts of the pitch periods T 1 and T 2
  • the difference value TD (3,4) which is the difference between the integer parts of the pitch periods T 3 and T 4 May be used as an index.
  • step S312 pitch periods T 1 , T 2 , T 3 , and T 4 are input to determination unit 317b.
  • the pitch periods T 1 , T 2 , T 3 , and T 4 are input to the determination unit 317b.
  • the pitch periods T 1 , T 2 , T 3 , and T 4 are input to the determination unit 317b.
  • the pitch cycle encoding unit 317d is, for example, a method similar to the conventional method (FIGS. 2A and B) (specific example 1 of step S313) or a method similar to step S113 (FIG. 8B) of the first embodiment (step S313). in embodiment 2), and it generates and outputs a code C T corresponding to the pitch period T of the current frame (step S313).
  • FIGS. 10A to 10C are diagrams for illustrating a pitch period encoding method in the third embodiment in the case where the time-series signal is stationary (periodic).
  • pitch period encoding section 317e the difference value between the integer part of the pitch period T 1 of the integer part of the pitch period T 2 and the first sub-frame of the second sub-frame TD (1, 2 ) and, respectively coded difference value TD (3, 4) and the integer part of the pitch period T 3 of the integer part and the third sub-frame pitch period T 4 in the fourth sub-frame (the difference integral part), the pitch
  • the values after the decimal point (fractional part) of the periods T 2 and T 4 are encoded.
  • the pitch period encoding unit 317e encodes the pitch period T1 of the first subframe independently for each subframe.
  • Pitch period encoding section 317e is further according to the difference value TD (1, 3), the difference value between the integer part and an integer part of the pitch period T 1 of the first subframe pitch period T 3 of the third sub-frame Either TD (1,3) is variable-length encoded (FIG. 10B), or the pitch period T 3 of the third subframe is encoded independently for each subframe (FIG. 10C), and the pitch period of the third subframe is determined.
  • a code X 3 of T 3 is generated (FIG. 10A).
  • the code length expected value of the code for representing the pitch period T 3 may 3.2 bit savings compared to the conventional 7-bit.
  • the assumed frequency in Table 5 is steady only when the difference value TD (1, 2) is smaller than 1 in the above-described step S312 (when the difference value TD (1, 2) is 0) ( This is a case where it is determined that the operation is stationary. In this case, the frequency of the frame is determined to stationary (steady) at step S312 described above can assume that 25% of the total, the amount of saving code to represent the pitch period T 3 becomes 0.8 bits on average .
  • the difference value TD (1,3) is other than 0, + 1, -1 and can be expressed with 4 bits or less, a 3-bit designation code (for example, "010") indicating that and the difference value A total of 7 bits including 4 bits representing TD (1,3) is set as a code corresponding to the difference value TD (1,3).
  • the specified code 3 bits indicating that the (for example, "001") and a total of 10 bits consisting of 7 bits corresponding to the pitch period T 3 A code is generated.
  • the pitch period T 3 is encoded as illustrated below. If the assumption of this table 6, the code length expected value of the code for representing the pitch period T 3 may 2.4 bit savings compared to the conventional 7-bit.
  • the assumed frequency in Table 6 indicates that the difference value TD (1, 2) is smaller than 2 in the above step S312 (the difference value TD (1, 2) is either 0, -1, 1). In the case of ()). In this case, the frequency of the frame is determined to stationary (steady) at step S312 described above can assume that 50%, the amount of saving code to represent the pitch period T 3 becomes 1.2 bits on average.
  • the specified code 3 bits indicating that the (for example, "001") and a total of 10 bits consisting of 7 bits corresponding to the pitch period T 3 A code is generated.
  • the pitch period T 3 is encoded as illustrated below. If the assumption of this table 8, the code length expected value of the code for representing the pitch period T 3 may 3.75 bit savings compared to the conventional 7-bit.
  • the assumed frequencies in Table 8 are obtained when the difference values TD (1, 2) and TD (3,4) are both smaller than 2 in step S312 (difference values TD (1, 2) and TD Stationary (stationary) only when (3,4) is 0, -1, or 1) and stationary only when pitch gains T 2 and T 4 are both 0.7 or more (stationary) This is the case where it is decided that the In this case, the frequency of the frame is determined to stationary (steady) at step S312 described above can assume that 24%, the amount of saving code to represent the pitch period T 3 becomes 0.95 bits on average.
  • step S322 is executed instead of step S122 of the first embodiment
  • step S323 is executed instead of step S123 of the first embodiment
  • step S324 is executed instead of step S124.
  • Others may be the same as those in the first embodiment and its modifications. Below, only the process of step S322, S323, and S324 of this form is demonstrated.
  • step S312 information necessary for determination is input to the determination unit 327b output from the separation unit 127g, and the same method as step S312 performed in the encoding device 31 is performed. Done. Note that, when the difference values TD (1,2) and TD (3,4) are used as indicators for determination and these are variable-length encoded, they are decoded and then in step S312 It is necessary to make a judgment.
  • the integer part of the pitch period T 3 of the third sub-frames belonging to the current frame, the difference value between integral part of the pitch period T 2 of the second sub-frame TD (2,3), a variable length coding for You may decide to do it.
  • the pitch period T 2 as shown in FIG. 2B if it is encoded as the integer part of the difference value TD (1, 2), the difference value TD to the integer part of the pitch period T 1 (1, 2) the value obtained by adding the an integral part of the pitch period T 2.
  • the integer part of the difference value TD of (1,3) instead of variable length coding, and values except the lower 2 bits of the pitch period T 3 including the fractional part of the third sub-frame, a small number of first sub-frame parts and variable-length coding a difference value between the value excluding the lower two bits of the pitch period T 1 including, in the that it encodes the lower-order 2 bits of the pitch period T 3 in place of the fractional part of the pitch period T 3 Also good.
  • the integer part of the pitch period T 3 is T A is less than the minimum value T min or more, the fractional part 2 bits of the pitch period T 3 is coded as the integer part of the pitch period T 3 is T A To T B, the least significant 1 bit of the integer part of the pitch period T 3 and 1 bit of the decimal part are encoded as they are, and the integer part of the pitch period T 3 is from T B to the maximum value T max. in the case of the lower two bits of the integer part of the pitch period T 3 is directly encoded.
  • a code length of a code obtained by encoding the pitch period T 3 (the integer part and the fractional part) alone for each sub-frame may be selected as the code of the pitch period T 3 of the third subframe.
  • a code obtained by encoding the pitch period T 3 as a code of the pitch period T 3 of the third sub-frame (an integer part and a fractional part) alone for each sub-frame is selected, the first belonging to the current frame an integer part of the pitch period T 1 of the sub-frame, a third sub-frame difference value TD (3, 1) variable-length coding to code the pitch period T 1 of the fractional obtained with the integer part of the pitch period T 3 of
  • the code length of the code with a high compression effect is compared with the code length of the code obtained by encoding the pitch period T 1 (integer part and decimal part) independently for each subframe. it may be selected as the sign of the pitch period T 1 of the subframe.
  • the above-described comparison of code lengths may be performed by actually obtaining codes to be compared and using those code lengths, or by using code length prediction values.
  • the comparison is performed in consideration of the code length of the auxiliary bit.
  • a difference value of a value corresponding to a pitch period is obtained between subframes across frames, and the difference value is variable-length encoded.
  • some processing such as long-term prediction or short-term prediction
  • the stationarity and periodicity of the are high.
  • the stationarity between the superframes is high.
  • the difference value between the pitch period of the first frame of the current frame and the pitch period of the third subframe or the fourth subframe of the past frame is often smaller.
  • the difference value of the value corresponding to the pitch period is obtained between the subframes straddling the frame, and the code length is reduced by variable-length coding the difference value.
  • the pitch period encoding process of the fourth embodiment also satisfies the condition that the index indicating the high periodicity and / or continuity of the time series signal indicates that the periodicity and / or continuity is high.
  • the pitch period of the first predetermined time period included in the predetermined time period is encoded, and the value corresponding to the pitch period of the second predetermined time period other than the first predetermined time period included in the predetermined time period and the predetermined time
  • a variable length encoding is performed on a difference value from a value corresponding to a pitch period of a time interval other than the second predetermined time interval included in the interval.
  • the “predetermined time interval” is a frame
  • the “first predetermined time interval” is any subframe of a frame before the current frame
  • the “second predetermined time interval” is the first subframe of the current frame.
  • the “time period other than the second predetermined time period” is any subframe of the frame before the current frame
  • the “value corresponding to the pitch period” is the integer part of the pitch period.
  • the “first predetermined time interval” is the third subframe of the frame immediately before the current frame
  • the “second predetermined time interval” is the first subframe of the current frame
  • a case where “a time period other than 2 predetermined time periods” is the third subframe of the frame immediately before the current frame will be described.
  • this does not limit the present invention. Below, it demonstrates centering on difference with the form demonstrated so far.
  • the difference between the parameter encoding unit 417 of the fourth embodiment and the parameter encoding unit 117 of the first embodiment is that the determination unit 117b is replaced with a determination unit 317b, and pitch period encoding is performed.
  • the point 117d is replaced with a pitch period encoding unit 317d
  • the pitch period encoding unit 117e is replaced with a pitch period encoding unit 417e.
  • the difference between the parameter decoding unit 427 of the fourth embodiment and the parameter decoding unit 127 of the first embodiment is that the determination unit 127b is replaced with a determination unit 327b, and the pitch period decoding unit 127d is replaced with the pitch period decoding unit 427d, and the pitch period decoding unit 127e is replaced with the pitch period decoding unit 427e.
  • step S312 described above is executed instead of step S112 of the first embodiment
  • step S413 below is executed instead of step S113 of the first embodiment
  • step S414 is executed instead of step S114.
  • Others may be the same as those in the first embodiment and its modifications. Below, only the process of step S413 and step S414 of this form is demonstrated.
  • the pitch period encoding unit 417d is, for example, a method similar to the conventional method (FIG. 2A and B) (specific example 1 of step S313) or a method similar to step S113 (FIG. 8) of the first embodiment (step S313). in embodiment 2), and it generates and outputs a code C T corresponding to the pitch period T of the current frame (step S413).
  • Send to 417e. 12A and 12B are diagrams for illustrating a pitch period encoding method in the fourth embodiment in the case where the time-series signal is stationary (periodic). As illustrated in FIG. 12B, pitch period encoding section 417e includes the current frame and the integer part of the pitch period T 2 of the second subframe in (FIG.
  • pitch period encoding section 417e encodes alone pitch period T 3 of the third subframe in the current frame for each sub-frame. The encoding methods of these second, third, and fourth subframes may be performed in the same manner as in the past, for example.
  • Pitch period encoding unit 417e further includes an integer part of the pitch period T 1 of the first subframe in the current frame (FIG. 12B), the previous frame (Fig of the current frame input to pitch period encoding section 417e in the past The difference value TD (3 ′, 1) from the integer part of the pitch period T 3 ′ of the third subframe in 12A) is obtained. Then, the pitch period encoding unit 417e performs variable length encoding on the difference value TD (3 ', 1) according to the difference value TD (3', 1) or the pitch period of the first subframe of the current frame. T 1 is encoded independently for each subframe to generate a code X 1 of pitch period T 1 in the first subframe of the current frame (FIG. 12B).
  • This process is the same as that of the third embodiment except that the difference value TD (1,3) is replaced with the difference value TD (3 ′, 1). Also, instead of the difference value TD (3 ′, 1), the difference value TD (4 ′, 1) with the integer part of the pitch period T 4 ′ of the fourth subframe in the immediately preceding frame is used. Also good.
  • the pitch period T 4 ′ of the fourth subframe of the immediately preceding frame is the difference value TD (3 ′, 3), the integer part of the pitch periods T 3 ′, T 4 ′ of the third and fourth subframes of the immediately preceding frame.
  • the difference value TD (3 ′, 4 ′) is added to the pitch period T 3 ′ to obtain TD (4 ′, 1) as T 4 .
  • step S322 described above is executed instead of step S122 of the first embodiment
  • step S423 below is executed instead of step S123 of the first embodiment
  • step S424 is executed instead of step S124.
  • Others may be the same as those in the first embodiment and its modifications. Below, only the process of step S423 and S424 of this form is demonstrated.
  • the form which combined each above-mentioned embodiment may be sufficient.
  • the fifth embodiment is an example.
  • ⁇ Configuration> The configurations of the encoding device 51 and the decoding device 52 according to the fifth embodiment will be described with reference to FIGS.
  • the difference between the encoding device 51 of the fifth embodiment and the encoding device 11 of the first embodiment is that the parameter encoding unit 117 is replaced with a parameter encoding unit 517.
  • the difference between the decoding device 52 of the second embodiment and the decoding device 12 of the first embodiment is that the parameter decoding unit 127 is replaced with a parameter decoding unit 527.
  • the difference between the parameter encoding unit 517 of the fifth embodiment and the parameter encoding unit 117 of the first embodiment is that the determination unit 117b is replaced with a determination unit 517b, and pitch period encoding is performed.
  • the point 117d is replaced with a pitch cycle encoding unit 517d
  • the pitch cycle encoding unit 117e is replaced with a pitch cycle encoding unit 517e.
  • the difference between the parameter decoding unit 527 of the fifth embodiment and the parameter decoding unit 127 of the first embodiment is that the determination unit 127b is replaced with a determination unit 527b, and the pitch period decoding unit 127d is replaced with the pitch period decoding unit 527d, and the pitch period decoding unit 127e is replaced with the pitch period decoding unit 527e.
  • FIG. 13 is a flowchart for explaining the encoding method of the fifth embodiment.
  • the pitch period encoding unit 517d sets the precision for expressing each pitch period T 2 , T 4 to only integer precision, and encodes each subframe independently (step S513).
  • the pitch period encoding unit 517e encodes the difference value between the integer part of the pitch periods T 2 and T 4 and the integer part of the pitch periods T 1 and T 3 expressed with decimal precision, and the pitch periods T 2 and T 4 Each value after the decimal point is encoded with 2 bits (step S514).
  • the switch unit 117c sends the pitch periods T 1 and T 3 to the pitch period encoding unit 517d based on the control of the determination unit 517b.
  • the pitch period encoding unit 517d sets the precision for expressing each pitch period T 1 , T 3 to only the integer precision, and encodes each subframe independently (step S526).
  • the switch unit 117c sends the pitch periods T 1 and T 3 to the pitch period encoding unit 517e based on the control of the determination unit 517b.
  • the pitch period encoding unit 517e encodes the pitch periods T 1 and T 3 as in step S314 (or S414) of the third embodiment (or the fourth embodiment). Thereafter, the process of step S115 described in the first embodiment is executed.
  • FIG. 14 is a flowchart for explaining a decoding method according to the fifth embodiment.
  • the data is sent to the periodic decoding unit 527d.
  • the pitch period decoding unit 527d obtains the pitch periods T 2 ′ and T 4 ′ of the second and fourth subframes by the decoding process corresponding to step S513 (step S523).
  • the time series signal x (n) (n 0, ..., L-1) If the stationarity (periodic) is determined to satisfy the condition indicating a high that (constant / periodic), under control of the determining unit 527b, the switch portion 127f sign C T to a pitch period decoding unit 527e send.
  • the pitch period decoding unit 527e obtains the pitch periods T 2 ′ and T 4 ′ of the second and fourth subframes by the decoding process corresponding to step S514 (step S524).
  • the time series signal x (n) (n 0, ..., L-1) If the stationarity (periodic) is determined to satisfy the condition indicating a high that (constant / periodic), under control of the determining unit 527b, the switch portion 127f sign C T to a pitch period decoding unit 527e send.
  • the pitch period decoding unit 527e obtains the pitch periods T 1 ′ and T 3 ′ of the first and third subframes by the decoding process corresponding to step S314 (or S414).
  • variable length coding depending on other parameters is used in the above process, it is essential to have a bitstream configuration for uniquely decoding.
  • codes other than the pitch period can be decoded first, and the pitch periods T 2 ′, T 4 are based on the decoded quantized pitch gain and linear prediction information. 'Needs to be decrypted. Further, the pitch periods T 1 ′ and T 3 ′ are decoded depending on the pitch periods T 2 ′ and T 4 ′.
  • the configurations of the encoding device 61 and the decoding device 62 according to the sixth embodiment will be described with reference to FIGS.
  • the difference between the encoding device 61 of the sixth embodiment and the encoding device 11 of the first embodiment is that the search unit 913 is replaced with the search unit 613 and the fixed codebook 914 is fixed.
  • the code book 614 is replaced, the parameter encoding unit 117 is replaced with the parameter encoding unit 617, and the bit allocation unit 611 is added.
  • the difference between the decoding device 62 of the sixth embodiment and the decoding device 12 of the first embodiment is that the parameter decoding unit 127 is replaced with a parameter decoding unit 627.
  • Search unit 613 obtains pitch periods T 1 , T 2 , T 3 (integer part and decimal part) for the first to third subframes belonging to the current frame, as in the conventional case, and fixed codebook
  • a signal component c (n) composed of one or more signals having a value composed of a combination of a non-zero unit pulse from 614 and its positive and negative values and one or more signals having a zero value is determined and those signal components are determined.
  • the code indexes C f1 , C f2 and C f3 representing c (n) are specified, and the pitch gains g p1 , g p2 and g p3 and the fixed codebook gains g c1 , g c2 and g c3 are obtained.
  • the fixed codebook 614 the number of unit pulses for each subframe, the positions of unit pulses allowed in each subframe (position candidates), and the positive / negative codes allowed for each unit pulse (positive / negative code candidates) are set. (For example, see “5.7 Algebraic codebook” in Non-Patent Document 1).
  • Search unit 613 determines signal component c (n) within the range set in fixed codebook 614, and specifies code indexes C f1 , C f2 , and C f3 . That is, for each of the first to third subframes, the search unit 613 selects the position of the set number of unit pulses from the positions in the allowed subframes, and selects each position selected from the allowed signs. Are respectively selected, and code indexes C f1 , C f2 and C f3 representing the selection contents are specified. As the number of unit pulses for each subframe increases, the number of bits of the code index increases and the encoding accuracy increases. In the present embodiment, such a fixed codebook 614 setting for the first to third subframes is fixed. That is, in the first to third subframes, the number of unit pulses for each subframe, the position of the unit pulse allowed in each subframe, and the positive / negative sign allowed for each unit pulse are the same.
  • the pitch gains g p1 , g p2 and g p3 and the fixed codebook gains g c1 , g c2 and g c3 for the first to third subframes are input to the gain quantization unit 617a (FIG. 5) of the parameter encoding unit 617.
  • the Gain quantization section 617a performs vector quantization for each subframe, and generates a VQ gain code corresponding to a set of a pitch gain quantization value and a fixed codebook gain quantization value for each subframe.
  • VQ gain code bit number The greater the number of bits for expressing the VQ gain code (referred to as “VQ gain code bit number”), the smaller the quantization interval (quantization step), or the pitch gain or fixed codebook gain that can be vector quantized.
  • the number of VQ gain code bits for the first to third subframes is fixed in advance (for example, 7 bits (128 types of pitch gain quantized values and fixed codebook gain or fixed codebook gain corresponding values). Can be expressed))).
  • Gain quantization section 617a outputs a code (for example, a code obtained by compression-coding these VQ gain codes) corresponding to the VQ gain codes of the first to third subframes.
  • Search unit 613 obtains pitch period T 4 (integer part and decimal part) for the fourth subframe belonging to the current frame, as in the conventional case.
  • the pitch periods T 1 , T 2 , T 3 , and T 4 of the first to fourth subframes are input to the parameter encoding unit 617 (FIG. 5).
  • the parameter encoding unit 617 encodes each integer part of the pitch periods T 1 , T 2 , T 3 , T 4 as in the first to fifth embodiments.
  • the bit allocation unit 611 (FIG. 4), the code length of the linear prediction information LPC info of the current frame, the code length of the code corresponding to each integer part of the pitch periods T 1 , T 2 , T 3 , T 4 , the code index C a code length determined to be assigned in the current frame, such as a code length of f1 , C f2 and C f3 and a code length of a code corresponding to the VQ gain code of the first to third subframes; Using a fixed code length per frame, a code length allocation that is not determined in the current frame is determined.
  • the bit allocation unit 611 of the present embodiment includes the precision of the fractional part of the pitch periods T 1 , T 2 , T 3 , T 4 of the first to fourth subframes (see FIG. 3), and the number of unit pulses for the fourth subframe.
  • the number of VQ gain code bits for the fourth subframe is determined. However, some of these may be fixed values.
  • the higher the accuracy of the fractional part of the pitch period the longer the code length assigned to the code corresponding to the fractional part of the pitch period, thereby improving the encoding quality.
  • the code length assigned to the code index C f4 of the fourth subframe increases, and the coding quality of the fourth subframe improves.
  • the code length assigned to the code corresponding to the VQ gain code of the fourth subframe increases, and the encoding quality of the fourth subframe improves.
  • code length allocation as many bits as possible among the bits whose allocation is not determined in the current frame include a code corresponding to the decimal part of the pitch period, the code index C f4 of the fourth subframe, and the fourth It is performed so as to be assigned to a code corresponding to the VQ gain code of the subframe.
  • all bits whose assignment is not determined in the current frame are a code corresponding to the fractional part of the pitch period, a code index C f4 of the fourth subframe, and a code corresponding to the VQ gain code of the fourth subframe.
  • Such code length assignment is performed according to a predetermined rule.
  • the parameter encoding unit 617 encodes the fractional parts of the pitch periods T 1 , T 2 , T 3 , T 4 of the first to fourth subframes with the accuracy represented by this information, and the pitch periods T 1 , T 2 , T 3, generates a code corresponding to the decimal part of T 4.
  • the search unit 613 determines the signal component c (n) of the fourth subframe composed of a combination of the number of unit pulses represented by this information and its positive / negative by analyzing the fourth subframe belonging to the current frame (the unit pulse of the unit pulse).
  • a code index C f4 representing the position and its positive / negative combination is determined, and a pitch gain g p4 and a fixed codebook gain g c4 are obtained. This analysis, except that the pitch period T 4 in the fourth sub-frame obtained previously is performed is fixed, carried out in conventional manner way.
  • Gain quantization section 617a vector quantizes pitch gain g p4 and fixed codebook gain g c4 with the number of bits represented by the information representing the number of VQ gain code bits, and VQ gain for the fourth subframe with the number of VQ gain code bits.
  • a code is obtained, and a code corresponding to the VQ gain code of the fourth subframe (for example, a code obtained by compression-coding these VQ gain codes) is output.
  • the synthesizing unit 117g synthesizes them in a predetermined order to generate and output a bit stream BS in which the code length per frame is fixed. When the total code length per frame of the information input to the combining unit 117g is less than the fixed code length per frame, auxiliary bits and other bits may be added to the bit stream BS.
  • the bit stream BS is input to the parameter decoding unit 627 (FIG. 6) of the decoding device 62.
  • the parameter decoding unit 627 performs linear prediction information LPC info from the bitstream BS, code indexes C f1 , C f2 , C f3 of the first to third subframes, and a pitch period T of the first to fourth subframes.
  • a code corresponding to the integer part of 1 , T 2 , T 3 , and T 4 and a code corresponding to the VQ gain code of the first to third subframes are obtained.
  • the generalized fixed codebook gain g c ' g c1 ', g c2 ', g c3 ', g c4 'is obtained. Subsequent processing is the same as in the first to fifth embodiments.
  • the search unit 613 instead of the search unit 613 obtaining the pitch periods T 2 , T 3 , T 4 (integer part and decimal part) of the second to fourth subframes as in the prior art, the search unit 613 ′ (FIG. 4) searches for the pitch period (integer part and decimal part) of the current subframe by a search method according to the VQ gain code of the subframes past the current subframe, and the second to fourth subframes. Pitch periods T 2 , T 3 , T 4 (integer part and decimal part) may be obtained.
  • the search unit 613 ′ searches for the pitch period T 2 (integer part and decimal part) of the second subframe by a search method according to the VQ gain code of the first subframe, and VQ of the first and second subframes.
  • the pitch period T 2 (integer part and decimal part) of the third subframe is searched by a search method according to the gain code
  • the pitch of the fourth subframe is searched by the search method according to the VQ gain code of the 1-3 subframe.
  • the period T 2 (integer part and decimal part) may be searched.
  • the search unit 613 ′ applies the VQ gain code of the past subframe to the determination criterion 1 and the determination criterion 2 of [Specific example 3 of step S112], and the time series signal of the current subframe is stationary.
  • the pitch period search range in the current subframe is changed according to the result. For example, when the search unit 613 ′ determines that it is non-stationary (non-periodic), the contribution of the adaptive signal component is small.
  • the search range is narrowed or the search accuracy of the decimal part of the pitch period is lowered.
  • the bit allocation unit 611 ′ may determine the precision of the decimal part of the pitch period of the second and third subframes according to the past VQ gain codes of the subframes.
  • the bit allocation portion 611 ' as in the first-fifth embodiments and the prior art, define the accuracy of the fractional part of the pitch period T 1 of the first sub-frame, depending on the VQ gain code of the first sub-frame determine the accuracy of the fractional part of the pitch period T 2 of the second sub-frame Te, determine the accuracy of the fractional part of the pitch period T 3 of the third sub-frame in accordance with the VQ gain code of the first and second sub-frame.
  • the bit allocation unit 611 ′ applies the VQ gain code of the past subframe to the determination criterion 1 and the determination criterion 2 of [Specific example 3 of step S112], and the time series signal of the current subframe is obtained. It is determined whether it is stationary (periodic), and the precision of the decimal part of the pitch period in the second and third subframes is determined according to the result. Specifically, for example, when the bit allocation unit 611 ′ is determined to be non-stationary (non-periodic), it is determined to be stationary (periodic) because the contribution of the adaptive signal component is small. Decrease the precision of the fractional part of the pitch period.
  • bit allocation unit 611 ′ when it is determined that the bit allocation unit 611 ′ is stationary (periodic), the bit allocation unit 611 ′ encodes the decimal part of the pitch period with decimal precision, but determines that it is non-stationary (non-periodic). If so, encode with integer precision.
  • the bit allocation unit 611 ′ includes the code length of the linear prediction information LPC info of the current frame, the code length of the code corresponding to each integer part of the pitch periods T 1 , T 2 , T 3 , T 4 , the pitch period T 1 , The code length of the code corresponding to each fractional part of T 2 , T 3 , the code length of the code index C f1 , C f2 , C f3 , the code length of the code corresponding to the VQ gain code of the first to third subframes, etc. Using the code length determined to be assigned in the current frame and the predetermined fixed code length per frame, the code length assignment that is not assigned in the current frame is determined.
  • bit allocation unit 611 determines the accuracy of the fractional part of the pitch period T 4 in the fourth sub-frame, the number of unit pulses for the fourth sub-frame, the number of VQ gain code bits for the fourth subframe.
  • This code length assignment is made up of as many bits as possible among the bits whose assignment is not determined in the current frame, the code corresponding to the decimal part of the pitch period T 4 of the fourth subframe, and the code index C of the fourth subframe. f4 and the code corresponding to the VQ gain code of the fourth subframe.
  • all the bits not assigned is determined in the current frame, the code corresponding to the decimal part of the pitch period T 4 in the fourth sub-frame, code index C f4 fourth sub-frame, and the fourth sub-frame It is performed so as to be assigned to a code corresponding to the VQ gain code.
  • the bit allocation unit 611 ′′ may determine the number of VQ gain code bits of the second and third subframes according to the past VQ gain codes of the past subframes. For example, the bit allocation unit 611 ′′ fixes the number of VQ gain code bits of the first subframe, determines the number of VQ gain code bits of the second subframe according to the VQ gain code of the first subframe, , The number of VQ gain code bits of the third subframe is determined according to the VQ gain code of the 2 subframes.
  • the bit allocation unit 611 ′′ applies the VQ gain code of the past subframe to the determination criterion 1 and the determination criterion 2 of [Specific example 3 of step S112] and applies the time series signal of the current subframe. Is constant (periodic), and the number of VQ gain code bits in the second and third subframes is determined according to the result. Specifically, for example, when the bit allocation unit 611 ′′ is determined to be non-stationary (non-periodic), the adaptive signal component contributes little, and thus is determined to be stationary (periodic). The number of VQ gain code bits is made smaller than that in the case of.
  • the bit allocation unit 611 ′′ performs the code length of the linear prediction information LPC info of the current frame, the code length of the code corresponding to each integer part of the pitch periods T 1 , T 2 , T 3 , T 4 , and the code index C f1 , C f2 , C f3 , and the code length of the code corresponding to the VQ gain code of the first to third subframes, the code length determined to be assigned in the current frame, and a predetermined one frame
  • code length allocation that is not determined in the current frame such as the number of VQ gain code bits in the fourth subframe, is determined.
  • the code length of the linear prediction information LPC info of the current frame As a modification of the sixth embodiment, the code length of the linear prediction information LPC info of the current frame, the code length of the code corresponding to each integer part of the pitch periods T 1 , T 2 , T 3 , T 4 , the code index C f1 , The code lengths determined in the current frame such as the code lengths of C f2 and C f3 and the code lengths of the codes corresponding to the VQ gain codes of the first to third subframes, and a predetermined per frame Even if the number of updates of the pitch gain and fixed codebook gain (the number of updates of the VQ gain code) for the fourth subframe is changed according to the code length that is not determined in the current frame. Good.
  • the pitch gain and the fixed codebook gain are updated twice in the fourth subframe, and the quantization value of each pitch gain and A VQ gain code for a combination of fixed codebook gain quantization values may be generated.
  • the present invention is not limited to the above-described embodiment.
  • the second and fourth subframes A configuration in which the decimal part of the pitch period is encoded with any precision from quadruple decimal precision to integer precision depending on the value of the integer part of each pitch period, as in the first and third subframes. (For example, see FIGS. 15A and 15B).
  • the decimal value of the pitch period T 2 is encoded with 2 bits, and the integer part of the pitch period T 2 is derived from T A.
  • the decimal value of the pitch period T 2 is encoded by 1 bit, and when the integer part of the pitch period T 2 is from T B to the maximum value T max , the decimal value of the pitch period T 2 is may choose not coded (e.g., same applies to the pitch period T 3).
  • the average number of bits can be reduced almost without affecting the performance.
  • the unit may be encoded with any precision from quadruple decimal precision to integer precision depending on the value of the integer part of each pitch period.
  • the difference value TD ( ⁇ , ⁇ ) in each of the above embodiments is (integer part of pitch period T ⁇ ) ⁇ (integer part of pitch period T ⁇ ) or (integer part of pitch period T ⁇ ) ⁇ (pitch It was an integral part of the period T alpha).
  • the difference value TD ′ of the upper part of the pitch period is used instead of the difference value TD ( ⁇ , ⁇ ).
  • the upper part of the pitch period is the value of the fixed upper bit of the pitch period expressed in a fixed bit length
  • the lower part of the pitch period is the remaining fixed lower bits of the pitch period.
  • the upper part of the pitch period may be a bit composed of all bits of the integer part of the pitch period and a part of the bits included in the decimal part (for example, fixed upper bits and fixed lower bits of the decimal part).
  • some of the bits included in the integer part of the period may be used (for example, refer to FIG. 16C).
  • the difference value TD ′ ( ⁇ , ⁇ ) of the upper part of the pitch period is used instead of the difference value TD ( ⁇ , ⁇ ) of the integer part of the pitch period
  • the lower part of each pitch period is, for example, The numerical value is encoded as it is. 9A and 9B, when the difference value TD ′ ( ⁇ , ⁇ ) in the upper part of the pitch period is used instead of the difference value TD ( ⁇ , ⁇ ) in the integer part of the pitch period, the pitch period
  • the configuration of the symbols is, for example, as shown in FIGS.
  • the difference value TD (1,2) and the difference are determined according to the difference value TD (1,2) and the difference value TD (3,4) of the integer part of the pitch period.
  • a value obtained by integrating the difference value TD (4 ′, 1) and the difference value TD (2,3) may be variable-length encoded.
  • the difference value TD (4 ′, 1) is a difference value between the integer part of the pitch period of the fourth frame in the frame immediately before the current frame and the integer part of the pitch period of the first frame of the current frame.
  • the difference value TD ′ ( ⁇ , ⁇ ) in the upper part of the pitch cycle may be used instead of the difference value TD ( ⁇ , ⁇ ) in the integer part of the pitch period.
  • the search unit directly quantizes A value corresponding to the obtained pitch gain or a value corresponding to the quantized fixed codebook gain may be obtained.
  • the program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
  • a computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer.
  • the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good.
  • ASP Application Service Provider
  • the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
  • the present apparatus is configured by executing a predetermined program on a computer.
  • a predetermined program on a computer.
  • at least a part of these processing contents may be realized by hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 符号化処理では、所定時間区間に含まれる時系列信号に対応するピッチ周期を算出し、ピッチ周期に対応する符号を出力し、その際、時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、ピッチ周期を表現するための精度および/またはピッチ周期の符号化方式を切り替える。これに対する復号処理では、所定時間区間に対応する符号が入力され、符号に含まれるまたは前記符号から得られる周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件を満たすか否かに応じ、符号に含まれるピッチ周期に対応する符号の復号方式を切り替えて、ピッチ周期に対応する符号を復号して所定時間区間に対応するピッチ周期を得る。

Description

符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
 本発明は、符号化技術に関し、特に、ピッチ周期の符号化技術に関する。
 音声信号や音響信号などの時系列信号を低ビットで符号化する従来方式の一つに符号化対象のピッチ周期を求めて符号化を行う方式がある(例えば、非特許文献1参照)。以下に、携帯電話などで利用されるCELP(Code-Excited Linear Prediction:符号励振線形予測)方式を例にとって、ピッチ周期を求めて符号化を行う従来方式を例示する。
 図1は、従来のCELP方式の一例を説明するためのブロック図である。
 符号化装置91には、所定の時間区間であるフレーム単位で区分された音声信号や音響信号などの時系列信号x(n)(n=0,...,L-1、Lは2以上の整数)が入力される。線形予測分析部911は、現フレームに属する各時点n=0,...,L-1での時系列信号x(n)(n=0,...,L-1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ915を特定するための線形予測情報LPC infoを生成する。例えば、線形予測分析部911は、現フレームの時系列信号x(n)(n=0,...,L-1)での線形予測係数α(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数α(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、線スペクトル対係数LSPの量子化値を線形予測情報LPC infoとして出力する。
 固定符号帳914は、探索部913の制御に従い、零でない単位パルスとその正負との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される信号成分c(n)(n=0,...,L-1)を出力する。また、適応符号帳912には、過去の各時点で生成された励振信号が格納され、適応符号帳912は、探索部913で求められたピッチ周期Tに応じて遅延させた励振信号を用いて得られる適応信号成分v(n)(n=0,...,L-1)を出力する。固定符号帳914からの信号成分c(n)(n=0,...,L-1)と、適応符号帳912からの適応信号成分v(n)(n=0,...,L-1)とに対応する現フレームの励振信号は以下で表現できる。
  u(n)=gp・v(n)+gc・c(n)(n=0,...,L-1) …(1)
なお、gpは適応信号成分v(n)に与えられるピッチ利得であり、gcは信号成分c(n)に与えられる固定符号帳利得である。
 探索部913は、線形予測情報LPC infoによって特定される全極型の合成フィルタ915を励振信号u(n)(n=0,...,L-1)に適用して得られる合成信号x'(n)(n=0,...,L-1)と、入力された時系列信号x(n)(n=0,...,L-1、各nをサンプル点と呼ぶ)との差分に、聴覚重み付けフィルタ916を適用した値が最小となるように、ピッチ周期Tと信号成分c(n)(n=0,...,L-1)とピッチ利得gpと固定符号帳利得gcとを探索する。探索部913は、ピッチ周期Tと、信号成分c(n)(n=0,...,L-1)を特定するコードインデックスCfと、ピッチ利得gpと、固定符号帳利得gcとを含む励振パラメータを出力する。
 ここで、線形予測情報LPC infoは1フレームごとに更新され、ピッチ周期TとコードインデックスCfとピッチ利得gpと固定符号帳利得gcは、1フレームを区分したサブフレーム毎に更新される。フレームあたりのサブフレーム数が1つなら励振パラメータなどの情報量は少なくなるが、時系列信号x(n)(n=0,...,L-1)の時間変化に追随できないので符号化歪が大きくなる。フレームあたりのサブフレーム数が多いとその逆の効果となるが、多すぎても品質の改善は飽和し、情報量のみが増えてしまう。以下では、1フレームを4サブフレームに等区分する例を示す。また、クレームの先頭から数えて第1,2,3,4番目の各サブフレーム(第1,2,3,4サブフレームと呼ぶ)で求められたコードインデックスCfをそれぞれCf1,Cf2,Cf3,Cf4を表す。また、第1,2,3,4サブフレームで求められたピッチ利得gpをそれぞれgp1,gp2,gp3,gp4と表し、固定符号帳利得gcをそれぞれgc1,gc2,gc3,gc4と表し、ピッチ利得と固定符号帳利得とを総称して励振利得と呼ぶ。また、第1,2,3,4サブフレームで求められたピッチ周期TをそれぞれT1,T2,T3,T4と表す。また、ピッチ周期Tは、サンプル点nの間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点nの間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。例えば、2ビットで小数値を表現する小数精度でピッチ周期Tを表現する場合には、ピッチ周期TをTint-1/4, Tint, Tint+1/4, Tint+1/2(Tintは整数)の4種類で表現する。また、小数精度のピッチ周期Tを用いて適応信号成分v(n)を表現する場合には、ピッチ周期Tに応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。
 ピッチ周期TとコードインデックスCfとピッチ利得gpと固定符号帳利得gcなどの励振パラメータはパラメータ符号化部917に入力され、パラメータ符号化部917は、それらに対応する符号であるビットストリームBSを生成して出力する。ピッチ利得gpと固定符号帳利得gcは、ピッチ利得と固定符号帳利得との対にして最適な符号を選択するベクトル量子化によって符号化される場合もある。
 図2Aは、小数精度のピッチ周期Tが用いられる場合のビットストリームBSの構成を例示するための図であり、図2Bは、小数精度のピッチ周期Tに対応する符号を説明するための図である。図3は、ピッチ周期Tを表現するための精度(周期精度)を説明するための図である。
 図2A及びBに例示するように、小数精度のピッチ周期Tが用いられる場合、各ピッチ周期T=T1,T2,T3,T4の整数部と小数部とに対応する符号が生成される。図2A及びBの例の場合、第1、第3サブフレームでは、ピッチ周期用にそれぞれ9ビットが割り当てられ、第1、第3サブフレームのピッチ周期T1,T3の値(ピッチ周期の最低値からの差分)が、他のサブフレームのピッチ周期に依存しない符号化方式でそれぞれ独立に符号化される(ピッチ周期部)。このように、或るサブフレームのピッチ周期が、その他のサブフレームのピッチ周期に依存しない符号化方式で独立に符号化されることを、「サブフレームごとに単独」に符号化されると呼ぶ。一般に、短いピッチ周期Tほど小数精度で表現することが好ましい。図3の例では、ピッチ周期Tの整数部が最小値Tmin以上でTAより小さい場合、2ビットで小数値を表現する小数精度でピッチ周期Tを表現し(4倍小数精度)、ピッチ周期Tの整数部がTAからTBまでの場合に、1ビットで小数値を表現する小数精度でピッチ周期Tを表現し(2倍小数精度)、ピッチ周期Tの整数部がTBから最大値Tmaxまでの場合にはサンプル点nの間隔の整数倍のみでピッチ周期Tを表現する(整数精度)。
 一方、第2、第4サブフレーム(図2A及びB)では、それぞれ、第2、第4サブフレームのピッチ周期T2,T4の整数部と第1、第3サブフレームのピッチ周期T1,T3の整数部との差分値がそれぞれ4ビットで符号化され(差分整数部)、差分整数部の値にかかわりなく、ピッチ周期T2,T4の小数点以下の値(小数部)がそれぞれ2ビットで符号化される(4倍小数精度)。なお、ピッチ周期T2,T4は、それぞれの整数部とピッチ周期T1,T3それぞれの整数部との差分値が4ビットで符号化可能な範囲内で探索されたものである。すなわち、ピッチ周期T2,T4は、それぞれの整数部が、ピッチ周期T1,T3の整数部の値-8からピッチ周期T1,T3の整数部の値+7の範囲となるような範囲で探索されたものである。
 符号化装置91(図1)のパラメータ符号化部917から出力されたビットストリームBSは、復号装置92のパラメータ復号部927に入力される。パラメータ復号部927は、ビットストリームBSを復号し、それによって得られたコードインデックスCf=Cf1,Cf2,Cf3,Cf4と、ピッチ利得gp'=gp1',gp2',gp3',gp4'と、固定符号帳利得gc'=gc1',gc2',gc3',gc4'と、ピッチ周期T'=T1',T2',T3',T4'と、線形予測情報LPC infoを出力する。
 固定符号帳924は、コードインデックスCfで特定される信号成分c'(n)(n=0,...,L-1)を出力し、適応符号帳922は、ピッチ周期T'で特定される適応信号成分v'(n)(n=0,...,L-1)を出力する。そして、信号成分c'(n)(n=0,...,L-1)に固定符号帳利得gc'を乗じた値と、適応信号成分v'(n)(n=0,...,L-1)にピッチ利得gp'を乗じた値との和である励振信号u'(n)(n=0,...,L-1)が、適応符号帳922に追加される。また、励振信号u'(n)(n=0,...,L-1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ925が適用され、それによって生成された合成信号x'(n)(n=0,...,L-1)が出力される。
3rd Generation Partnership Project(3GPP), Technical Specification(TS) 26.090, "AMR speech codec; Transcoding functions", Version 4.0.0 (2001-03)
 従来のCELP方式では、各フレームのピッチ周期の符号用に固定ビットが割り当てられて符号化がなされていた。このようなことは、CELP方式に限定されるものではなく、符号化対象のピッチ周期を求めて符号化を行うその他の従来方式でも同様である。
 本発明では、ピッチ周期の符号化方法を工夫することで圧縮効率を向上させる。
 本発明の符号化処理では、所定時間区間に含まれる時系列信号に対応するピッチ周期を算出し、ピッチ周期に対応する符号を出力する。その際、時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、ピッチ周期を表現するための精度および/またはピッチ周期の符号化方式を切り替える。
 これに対する復号処理では、所定時間区間に対応する符号が入力され、符号に含まれるまたは符号から得られる周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、符号に含まれるピッチ周期に対応する符号の復号方式を切り替えて、ピッチ周期に対応する符号を復号して所定時間区間に対応するピッチ周期を得る。
 本発明では、符号化対象のピッチ周期を求めて符号化を行う方式において、時系列信号の周期性や定常性に応じ、ピッチ周期を表現するための精度および/またはピッチ周期の符号化方式を切り替えることとしたため、ピッチ周期の圧縮効率を向上させることができる。
図1は、従来のCELP方式の一例を説明するためのブロック図である。 図2Aは、小数精度のピッチ周期Tが用いられる場合のビットストリームBSの構成を例示するための図である。図2Bは、小数精度のピッチ周期Tに対応する符号を説明するための図である。 図3は、ピッチ周期の小数部の符号化方法を説明するための図である。 図4は、実施形態の符号化装置および復号装置を説明するためのブロック図である。 図5は、実施形態のパラメータ符号化部を説明するためのブロック図である。 図6は、実施形態のパラメータ復号部を説明するためのブロック図である。 図7Aは、実施形態の符号化方法を説明するためのフローチャートである。図7Bは、実施形態の復号方法を説明するためのフローチャートである。 図8A及びBは、ピッチ周期に対応する符号の構成例を説明するための図である。 図9Aは、ピッチ周期に対応する符号の構成例を説明するための図である。図9Bは、第2及び4サブフレームのピッチ周期の整数部に対応する可変長符号を説明するための図である。 図10Aは、時系列信号が定常的(周期的)である場合における、第3実施形態でのピッチ周期の符号化方法を例示するための図である。図10B及びCは、第3サブフレームのピッチ周期の符号X1を例示するための図である。 図11は、フレームとスーパーフレームとの関係を例示した図である。 図12A及びBは、時系列信号が定常的(周期的)である場合における、第4実施形態でのピッチ周期の符号化方法を例示するための図である。 図13は、第5実施形態の符号化方法を説明するためのフローチャートである。 図14は、第5実施形態の復号方法を説明するためのフローチャートである。 図15Aは、ピッチ周期の符号化方法の変形例を説明するための図である。図15Bは、第2及び4サブフレームのピッチ周期の整数部に対応する可変長符号を説明するための図である。 図16A-Cは、ピッチ周期の符号化方法の変形例を説明するための図である。 図17Aは、ピッチ周期の符号化方法の変形例を説明するための図である。図7Bは、第2及び4サブフレームのピッチ周期の整数部に対応する可変長符号を説明するための図である。
 以下、図面を参照して本発明の実施形態を説明する。なお、本発明は符号化対象のピッチ周期を求めて符号化を行う方式全般に適用可能なものであるが、以下では、CELP方式に本発明を適用する場合を例にとって説明する。また、以下では1フレームを4サブフレームに等区分する例を示すが、これは本発明を限定しない。また、以下では、既に説明した事項との相違点を中心に説明し、説明済みの事項については重複した説明を省略する。
 〔第1実施形態〕
 まず、本発明の第1実施形態を説明する。
 時系列信号x(n)(n=0,...,L-1)の定常性が低い(「非定常的」と呼ぶ)フレームでは、時系列信号x(n)(n=0,...,L-1)の周期性も低く(「非周期的」と呼ぶ)、符号全体に占める周期性成分の貢献が少ない。そのため、ピッチ周期Tを表現するための精度や、符号化頻度(符号化を行うフレームの頻度)を下げても、符号化品質(符号化前の時系列信号に対する復号後の合成信号の品質)は、さほど低下しない。そのため、第1実施形態では、非定常的(非周期的)なフレームにおいて、ピッチ周期Tを表現するための精度や、符号化頻度を下げる。これにより、フレーム当たりの平均符号量を削減する。その結果、例えば、平均ビットレートを下げたり、節約できた情報を例えば固定符号帳からの信号成分の符号の符号長の増加に割り当てることで品質を向上できたりできる。
 <構成>
 図4は、実施形態の符号化装置および復号装置を説明するためのブロック図である。図5は、実施形態のパラメータ符号化部を説明するためのブロック図である。また、図6は、実施形態のパラメータ復号部を説明するためのブロック図である。
 図4から図6に例示するように、第1実施形態の符号化装置11と従来の符号化装置91との相違点は、パラメータ符号化部917がパラメータ符号化部117に置換された点である。また、第1実施形態の復号装置12と従来の復号装置92との相違点は、パラメータ復号部927がパラメータ復号部127に置換された点である。
 図5に例示するように、本形態のパラメータ符号化部117は、利得量子化部117aと、判定部117bと、スイッチ部117c,117fと、ピッチ周期符号化部117d,117eと、合成部117gとを有する。また、図6に例示するように、本形態のパラメータ復号部127は、判定部127bと、スイッチ部127c,127fと、ピッチ周期復号部127d,127eと、分離部127gとを有する。
 なお、本形態の符号化装置11及び復号装置12は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータ又は専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置11及び復号装置12の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。
 <符号化方法>
 図7Aは、実施形態の符号化方法を説明するためのフローチャートである。以下では、従来技術との相違点を中心に説明する。
 線形予測分析部911が現フレームに対して生成した線形予測情報LPC infoと、探索部913が現フレームに属する第1-第4サブフレームに対して生成したコードインデックスCf=Cf1,Cf2,Cf3,Cf4と、ピッチ利得gp=gp1,gp2,gp3,gp4と、固定符号帳利得gc=gc1,gc2,gc3,gc4と、ピッチ周期T=T1,T2,T3,T4とが、パラメータ符号化部117(図5)に入力される。
 パラメータ符号化部117の利得量子化部117aは、ピッチ利得gp=gp1,gp2,gp3,gp4と固定符号帳利得gc=gc1,gc2,gc3,gc4とを量子化し、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'を特定するインデックスなどの符号と量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'を特定するインデックスなどの符号を出力する。
 なお、ピッチ利得gp=gp1,gp2,gp3,gp4と固定符号帳利得gc=gc1,gc2,gc3,gc4とは別個に量子化されてもよいが、ピッチ利得と固定符号帳利得との組み合わせがベクトル量子化されてもよい。ピッチ利得と固定符号帳利得との組み合わせがベクトル量子化される場合、ピッチ利得の量子化値(量子化済ピッチ利得)と固定符号帳利得の量子化値(量子化済固定符号帳利得)との組み合わせにインデックスなどの符号が対応付けられる。このようなベクトル量子化で得られる量子化されたピッチ利得と量子化された固定符号帳利得の組を「量子化済利得ベクトル」と呼び、ベクトル量子化で得られる符号を「ベクトル量子化済利得符号(VQ利得符号)」と呼ぶ。このようなベクトル量子化では、例えば、同一のサブフレームに対応するピッチ利得の量子化値と固定符号帳利得の量子化値との組み合わせごとに一つのVQ利得符号が対応付けられてもよいし、複数のサブフレームのそれぞれに対応するピッチ利得の量子化値と固定符号帳利得の量子化値との組み合わせごとに一つのVQ利得符号が対応付けられてもよいし、同一のフレームに対応するピッチ利得の量子化値と固定符号帳利得の量子化値との組み合わせごとに一つのVQ利得符号が対応付けられてもよい。
 このようなベクトル量子化には、例えば、ピッチ利得の量子化値と固定符号帳利得の量子化値との組み合わせに対応するVQ利得符号を特定するためのテーブル(2次元コードブック)が用いられる。2次元コードブックの例は、ピッチ利得の量子化値及び固定符号帳利得の量子化値の組み合わせとVQ利得符号とが対応付けられたテーブルである。2次元コードブックの他の例は、ピッチ利得の量子化値及び固定符号帳利得対応値の量子化値の組み合わせとVQ利得符号とが対応付けられたテーブルである。固定符号帳利得対応値の例は、過去のサブフレーム(又はフレーム)での固定符号帳914からの信号成分のエネルギーを基に予測された現在のサブフレーム(又はフレーム)での固定符号帳利得の推定値と、現在のサブフレーム(又はフレーム)での固定符号帳利得との比を表す補正係数(correction factor)などである。補正係数の例は、参考文献1「ITU-T Recommendation G.729, "Coding of Speech at 8kbit/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP)"」の「3.9 Quantization of the gains」の欄に記載されたγである。例えば、サブフレームj=1,...,4での固定符号帳利得gcj、補正係数γ、サブフレームj=1,...,4での固定符号帳利得の推定値pgcjとの間には以下の関係が成り立つ。
  gcj=γ×pgcj
 2次元コードブックは1個のテーブルから構成されたものでもよいし、参考文献1の2段の共役構造コードブック(two-stage conjugate structured codebook)のように複数個のテーブルから構成されたものでもよい。2次元コードブックが複数個のテーブルから構成される場合、ピッチ利得の量子化値と固定符号帳利得の量子化値との組み合わせに対応するVQ利得符号は、例えば、ピッチ利得の量子化値と固定符号帳利得の量子化値との組み合わせに対し、当該2次元コードブックを構成するテーブルごとに定まるインデックスの組み合わせなどである(ステップS111)。
 次に、判定部117bが現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であるか否かを判定する(ステップS112)。ステップS112の判定は、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標が、時系列信号の定常性が高いとみなされる条件を満たすか否かによって行われる。以下に具体的な判断方法を例示する。
 [ステップS112の具体例1]
 ステップS112の具体例1では、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として、時系列信号x(n)(n=0,...,L-1)を線形予測分析して得られる予測残差の大きさに対する当該時系列信号x(n)(n=0,...,L-1)の大きさの比を表す指標を用いる。また、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件として、時系列信号x(n)(n=0,...,L-1)を線形予測分析して得られる予測残差の大きさに対する当該時系列信号x(n)(n=0,...,L-1)の大きさの比を表す指標が規定値より大きいという条件を用いる。これは、定常的なフレームでは効果の高い線形予測が可能であるため予測残差が小さくなり、予測残差の大きさに対する時系列信号x(n)(n=0,...,L-1)の大きさの比が大きくなることに基づく。
 時系列信号x(n)(n=0,...,L-1)を線形予測分析して得られる予測残差の大きさに対する当該時系列信号x(n)(n=0,...,L-1)の大きさの比を表す指標の例は、予測残差のエネルギーに対する当該時系列信号x(n)(n=0,...,L-1)のエネルギーの比である予測利得の推定値
Figure JPOXMLDOC01-appb-M000001
である。ただし、式(2)のkmは、線形予測情報LPC infoから特定されるm次のPARCOR係数である。この場合、例えば、判定部117bには線形予測情報LPC infoが入力され、判定部117bは、線形予測情報LPC infoから求めた予測利得の推定値Eが規定値より大きいか否かを判定する。そして、予測利得の推定値Eが規定値より大きい場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であると判定し、そうでない場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(非定常的)でないと判定する。
 あるいは、予測利得の推定値Eの代わりに、予測利得や、予測残差の絶対値に対する時系列信号x(n)(n=0,...,L-1)の絶対値の比や、予測残差の絶対値に対する時系列信号x(n)(n=0,...,L-1)の絶対値の比の推定値などを用いて判定がなされてもよい。
 なお、指標>規定値を満たすか否かを判定することで、指標が規定値よりも大きいか否かが判定されてもよいし、指標≧(規定値+定数)を満たすか否かを判定することで、指標が規定値よりも大きいか否かが判定されてもよい。この場合、規定値が処理上の閾値として設定されていてもよいし、(規定値+定数)が処理上の閾値として設定されていてもよい。以後説明するその他の「指標が規定値よりも大きいか否か」の判定についても同様である。
 [ステップS112の具体例2]
 ステップS112の具体例2では、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として量子化されたピッチ利得を用いる。また、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件として、量子化されたピッチ利得が規定値より大きいという条件を用いる。これは、定常的なフレームではピッチ周期の周期性が高く、ピッチ利得が大きいことに基づく。
 この場合、例えば、判定部117bに量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'が入力され、判定部117bが量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'の平均値が規定値より大きいか否かを判定する。そして、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'の平均値が規定値より大きい場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であると判定し、そうでない場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的でない(非定常的)と判定する。あるいは、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'の平均値の代わりに、一部のサブフレームでの量子化されたピッチ利得の平均値(例えば、gp1'とgp3'との平均値)や、何れか1つのサブフレームでの量子化されたピッチ利得(例えば、gp1')を用いて判定がなされてもよい。何れか1つのサブフレームの量子化されたピッチ利得を用いた判定は、フレームに含まれる全サブフレームの量子化されたピッチ利得のうち値が最も小さなものを用いた判定とすると性能が良い。あるいは、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'のすべてが規定値より大きい場合に定常的であると判定し、少なくとも一部の量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'が規定値以下であった場合に定常的でない(非定常的)と判定してもよい。あるいは、所定個以上の量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'が規定値より大きい場合に定常的であると判定し、それ以外の場合に定常的でない(非定常的)と判定してもよい。
 [ステップS112の具体例3]
 ステップS112の具体例3では、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として、量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との間の比を用いる。以下にこの指標を用いた判断基準を例示する。この判断基準は、定常的なフレームではピッチ周期の周期性が高く、固定符号帳利得に対応する値に対するピッチ利得に対応する値の比が大きいことに基づく。
 判断基準:量子化された固定符号帳利得に対応する値に対する量子化されたピッチ利得に対応する値の比が規定値以上となる、又は、量子化されたピッチ利得に対応する値に対する量子化された固定符号帳利得に対応する値の比が規定値以下となる場合に、時系列信号x(n)(n=0,...,L-1)が定常的であると判断される。量子化された固定符号帳利得に対応する値の例は、量子化された固定符号帳利得そのもの、量子化された前述の補正係数(correction factor)などである。量子化されたピッチ利得に対応する値の例は、量子化されたピッチ利得そのもの、量子化されたピッチ利得の平均値、量子化されたピッチ利得の広義単調増加関数値などである。
 この場合、例えば、判定部117bに量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組が入力され、判定部117bが上記の判断基準に基づいて、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるかを判断する。例えば判定部117bは、何れかのサブフレーム(例えば先頭のサブフレーム)での量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組を用いてこの判断を行い、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるかを判断する。あるいは、例えば判定部117bは、同一のフレームに属する複数のサブフレームの量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組をそれぞれ用い、上記の判断基準に基づいた判断をそれぞれ行い、それらの結果に基づいて時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるかを判断してもよい。例えば、各サブフレームの量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組を用いた判断結果がすべて定常的(周期的)であることを表すものであった場合に、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であると判断してもよい。あるいは、所定個以上のサブフレームの量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組を用いた判断結果が定常的(周期的)であることを表すものであった場合に、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であると判断してもよい。なお、例えば上記の判断基準が満たされない場合には、時系列信号x(n)(n=0,...,L-1)が定常的でない(非定常的)と判断される。
 [ステップS112の具体例4]
 ステップS112の具体例4では、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として量子化されたピッチ利得に対応する値及び量子化された固定符号帳利得に対応する値を用い、それぞれを第1規定値及び第2規定値と比較する。
 通常、定常的なフレームではピッチ周期の周期性が高くピッチ利得が大きい。ただし、音声の立ち上がり部分にあるフレームでは、その前のフレームからのピッチ周期の周期性は低くピッチ利得は小さいものの、そのフレーム内ではピッチ周期の周期性が高い。また、音声の立ち上がり部分にあるフレームでは、その前のフレームを用いて予想される現フレームの固定符号帳利得の推定値pgcjは小さなものとなる。現フレームの量子化された固定符号帳利得gc'はgc'=γgc^×pgcj(γgc^は量子化された補正係数)によって定まるため、音声の立ち上がり部分にあるフレームではγ^gc(量子化された固定符号帳利得に対応する値)は大きな値となる。そのため、「ピッチ利得に対応する値が小さい場合であっても、量子化された固定符号帳利得に対応する値が大きな値である場合は、そのフレームは定常的である」と言える。逆に言えば「ピッチ利得に対応する値が小さい場合であって、量子化された固定符号帳利得に対応する値が小さな値である場合は、そのフレームは定常的でない」と言える。以下にこれらの指標を用いた判断基準を例示する。
 判断基準1:量子化されたピッチ利得に対応する値が第1規定値より小さく、かつ、量子化された固定符号帳利得に対応する値が第2規定値より小さい場合に、時系列信号x(n)(n=0,...,L-1)が定常的でない(非定常的)と判定される。
 判断基準2:量子化されたピッチ利得に対応する値が第1規定値より小さく、かつ、量子化された固定符号帳利得に対応する値が第2規定値より大きい場合に、時系列信号x(n)(n=0,...,L-1)が定常的であると判定される。
 量子化されたピッチ利得に対応する値の例は、量子化されたピッチ利得そのもの、量子化されたピッチ利得の平均値、量子化されたピッチ利得の広義単調増加関数値などである。量子化されたピッチ利得の例は、非特許文献1のg^p(quantified adaptive codebook gain)である。量子化された固定符号帳利得に対応する値の例は、量子化された固定符号帳利得そのもの、量子化された補正係数γgc^などである。量子化された補正係数γgc^の例は、非特許文献1のγgc^(optimum value for γgc)である。
 この場合、例えば、判定部117bに量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組が入力され、判定部117bが上記の判断基準1又は2に基づいて、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)でないか(定常的(周期的)であるか)を判断する。例えば判定部117bは、何れかのサブフレーム(例えば先頭のサブフレーム)での量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組を用いてこの判断を行い、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)でないか(定常的(周期的)であるか)を判断する。あるいは、例えば判定部117bは、同一のフレームに属する複数のサブフレームの量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組をそれぞれ用い、上記の判断基準1又は2に基づいた判断を行い、それらの結果に基づいて時系列信号x(n)(n=0,...,L-1)が定常的(周期的)でないか(定常的(周期的)であるか)を判断する。例えば、各サブフレームの量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組を用いた判断結果がすべて定常的(周期的)であることを表すものであった場合に、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であると判断してもよい。あるいは、所定個以上のサブフレームの量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との組を用いた判断結果が定常的(周期的)であることを表すものであった場合に、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であると判断してもよい。また、判断基準1又は2に別の条件が加えられてもよいし、さらに実際の差分値を判断基準に加えてもよい。
 [ステップS112の具体例5]
 ステップS112の具体例5は、ステップS111でピッチ利得と固定符号帳利得との組み合わせがベクトル量子化され、量子化されたピッチ利得と量子化された固定符号帳利得との組み合わせにVQ利得符号が対応付けられた場合の例である。この例では、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標としてVQ利得符号を用いる。例えば、VQ利得符号を指標として用い、ステップS112の具体例2又は3又は4の判断を行う。以下にVQ利得符号を指標として用いた判断手法を例示する。
 前述のように、VQ利得符号は、ピッチ利得の量子化値と固定符号帳利得の量子化値との組、又は、ピッチ利得の量子化値と固定符号帳利得対応値の量子化値との組、と一対一に対応している。そのため、上述の[ステップS112の具体例2-4]での判断結果をそれぞれVQ利得符号に対応付けることができる。具体的には、ステップS112の具体例2では、量子化されたピッチ利得を指標として判断がなされるため、指標とされた量子化されたピッチ利得に対応するVQ利得符号(量子化されたピッチ利得に対応する値)と判断結果とを対応付けることができる。ステップS112の具体例3では、量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との間の比を指標として判断がなされるため、指標とされた当該比に対応するVQ利得符号と判断結果とを対応付けることができる。ステップS112の具体例4では、量子化されたピッチ利得に対応する値及び量子化された固定符号帳利得に対応する値を指標として判断がなされるため、指標とされた量子化されたピッチ利得に対応する値及び量子化された固定符号帳利得に対応する値の組に対応するVQ利得符号と判断結果とを対応付けることができる。よって、上述の[ステップS112の具体例2-4]の何れかに基づいて定常的であるか定常的でないか(非定常的)の判断結果を予め得ておき、このような判断結果と判断結果に対応するVQ利得符号とをそれぞれ対応付けたテーブルを判定部117b内に格納しておくことができる。判定部117bは、入力されたVQ利得符号に対応する判断結果をこのようなテーブルを参照することで得ることができる。あるいは、このような判断結果に応じてピッチ周期を表現するための精度および/またはピッチ周期の符号化方式が定まるため、各VQ利得符号とピッチ周期を表現するための精度および/またはピッチ周期の符号化方式とが対応付けられたテーブルを判定部117b内に格納しておくこともできる。この場合、判定部117bは、入力されたVQ利得符号に対応する、ピッチ周期を表現するための精度および/またはピッチ周期の符号化方式を、このようなテーブルを参照することで得ることができる([ステップS112の具体例1-5]の説明終わり)。
 ステップS112の判定で、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たさないと判定された場合(非定常的)、判定部117bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部117dに送る。ピッチ周期符号化部117dは、後述のように、第1精度で表現されたピッチ周期を第1時間区間ごとに符号化して得られた符号を出力する(ステップS113)。一方、ステップS112の判定で、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たしたと判定された場合(定常的)、判定部117b(図5)の制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部117eに送る。ピッチ周期符号化部117eは、第2精度で表現されたピッチ周期を第2時間区間ごとに符号化して得られた符号を出力する。ここで、第2精度は第1精度よりも高い、および/または、第2時間区間は第1時間区間よりも短い。例えば、ピッチ周期符号化部117eは、従来と同様(図2A及びB参照)に、現フレームのピッチ周期Tに対応する符号CTを生成して出力する(ステップS114)。
 [ステップS113、S114の具体例1]
 この例のステップS113(非定常的)では、ピッチ周期符号化部117dが、各ピッチ周期T=T1,T2,T3,T4を表現するための精度を整数精度(第1精度)のみにし、サブフレームごとに単独にピッチ周期Tを符号化し、現フレームのピッチ周期Tに対応する符号CTを生成する。図8Aは、ステップS113で生成される現フレームのピッチ周期Tに対応する符号CTの構成例を説明するための図である。図8Aの例では、第1-4サブフレームの各ピッチ周期T=T1,T2,T3,T4がそれぞれ整数精度で表現され、各ピッチ周期T=T1,T2,T3,T4をそれぞれ6ビットで符号化する(ピッチ周期整数部)。
 一方、この例のステップS114(定常的)では、ピッチ周期符号化部117eが、ピッチ周期T1,T3を表現するための精度を小数精度(第2精度)または整数精度とし、それぞれサブフレームごとに単独に符号化する。また、ピッチ周期符号化部117eは、小数精度(第2精度)で表現されたピッチ周期T2,T4の整数部とピッチ周期T1,T3の整数部との差分値をそれぞれ符号化する。さらに、ピッチ周期T2,T4の小数点以下の値(小数部)をそれぞれ2ビットで符号化する(図2B参照)。
 [ステップS113、S114の具体例2]
 この例のステップS113(非定常的)では、ピッチ周期符号化部117dが、複数のサブフレームからなる時間区間(第1時間区間)ごとにピッチ周期に対応する符号を得て、現フレームのピッチ周期Tに対応する符号CTを生成する。すなわち、複数のサブフレームに対して共通のピッチ周期Tを用いて符号が生成される(ピッチ周期の符号化頻度を下げる)。図8Bは、ステップS113で生成される現フレームのピッチ周期Tに対応する符号CTの構成例を説明するための図である。図8Bの例では、第1,2サブフレームのピッチ周期Tの符号として、整数精度で表現されたピッチ周期T1,T2を符号化して得たものの何れか一方が共通に用いられ、第3,4サブフレームのピッチ周期Tの符号として、整数精度で表現されたピッチ周期T3,T4を符号化して得たものの何れか一方が共通に用いられる。
 一方、この例のステップS114(定常的)では、ピッチ周期符号化部117eが、サブフレーム(第2時間区間)ごとにピッチ周期T1,T2,T3,T4を符号化する。図2Bの例の場合、ピッチ周期T1,T3の値がサブフレームごとに単独に符号化され、ピッチ周期T2,T4の整数部とピッチ周期T1,T3の整数部との差分値が符号化され、ピッチ周期T2,T4の小数点以下の値(小数部)がそれぞれ2ビットで符号化される(図2B参照/[ステップS113、S114の具体例1,2]の説明終わり)。
 ピッチ周期符号化部117dまたは117eから出力された現フレームのピッチ周期Tに対応する符号CTは、判定部117bの制御に基づき、スイッチ部117fによって合成部117gに送られる。合成部117gは、線形予測情報LPC infoと、コードインデックスCf=Cf1,Cf2,Cf3,Cf4と、現フレームのピッチ周期Tに対応する符号CTと、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'を表す符号と、量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'を表す符号とを合成したビットストリームBSを生成して出力する。量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'を表す符号と量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'を表す符号の代わりにVQ利得符号などのインデックスがビットストリームBSに含まれてもよい(ステップS115)。
 <復号方法>
 図7Bは、実施形態の復号方法を説明するためのフローチャートである。以下では、従来技術との相違点を中心に説明する。
 ビットストリームBSは、復号装置12のパラメータ復号部127(図6)に入力される。パラメータ復号部127は、ビットストリームBSから、線形予測情報LPC infoと、コードインデックスCf=Cf1,Cf2,Cf3,Cf4と、現フレームのピッチ周期Tに対応する符号CTと、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'と、量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'とを分離又は復号して出力する。量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'と量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'は、ビットストリームBSに含まれる量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'を表す符号と量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'を表す符号、又は、ビットストリームBSに含まれるVQ利得符号を復号することにより得られる(ステップS121)。
 次に、符号CTの復号方式を特定するために、判定部127bが現フレームのビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)が定常的であったか否かを判定する(ステップS122)。ステップS122の判定は、当該時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標が、時系列信号の定常性が高いとみなされる条件を満たすか否かによって行われる。この判断には、符号化装置11で行われたステップS112と同じ方法を用いる。
 [符号化装置11でステップS112の具体例1が用いられる場合]
 この場合、判定部127bでも、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として、時系列信号x(n)(n=0,...,L-1)を線形予測分析して得られる予測残差の大きさに対する当該時系列信号x(n)(n=0,...,L-1)の大きさの比を表す指標(予測利得の推定値Eなど)を用いる。また、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件として、時系列信号x(n)(n=0,...,L-1)を線形予測分析して得られる予測残差の大きさに対する当該時系列信号x(n)(n=0,...,L-1)の大きさの比を表す指標が規定値より大きいという条件を用いる。具体的な判定内容は、ステップS112の具体例1で例示した通りである。
 [符号化装置11でステップS112の具体例2が用いられる場合]
 この場合、判定部127bでも、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として量子化されたピッチ利得を用いる。また、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件として、量子化されたピッチ利得が規定値より大きいという条件を用いる。具体的な判定内容は、ステップS112の具体例2で例示した通りである。
 [符号化装置11でステップS112の具体例3が用いられる場合]
 この場合、判定部127bでも、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として、量子化されたピッチ利得に対応する値と量子化された固定符号帳利得に対応する値との間の比を用いる。具体的な判定内容は、ステップS112の具体例3で例示した通りである。
 [符号化装置11でステップS112の具体例4が用いられる場合]
 この場合、判定部127bでも、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として量子化されたピッチ利得に対応する値及び量子化された固定符号帳利得に対応する値を用い、それぞれを第1規定値及び第2規定値と比較する。具体的な判定内容は、ステップS112の具体例4で例示した通りである。
 [符号化装置11でステップS112の具体例5が用いられる場合]
 この場合、判定部127bは、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標としてビットストリームBSが含むVQ利得符号を用いる。具体的な判定内容は、ステップS112の具体例5で例示した通りである。例えば、ステップS112の具体例5で説明した判断結果と判断結果に対応するVQ利得符号とをそれぞれ対応付けたテーブルを判定部127bに格納しておき、判定部127bが、入力されたVQ利得符号に対応する判断結果をこのようなテーブルを参照することで得る。また前述したように判断結果に応じてピッチ周期を表現するための精度および/またはピッチ周期の符号化方式が定まり、それに対応する復号方式も定まる。よって、各VQ利得符号とピッチ周期を表現するための精度および/またはピッチ周期の復号とが対応付けられたテーブルを判定部127b内に格納しておくこともできる。この場合、判定部127bは、入力されたVQ利得符号に対応する、ピッチ周期を表現するための精度および/またはピッチ周期の復号方式を、このようなテーブルを参照することで得ることができる(ステップS122の具体例の説明終わり)。
 ステップS122の判定結果に応じ、符号CTの復号方法が切り替えられる。
 ステップS122の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たさないと判定された場合(非定常的)、判定部127bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部127dに送る。ピッチ周期復号部127dは、ピッチ周期符号化部117d(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS123)。以下にステップS123の処理の具体例を示す。
 [符号化装置11でステップS113の具体例1が用いられる場合]
 この場合、ピッチ周期復号部127dは、符号CTから整数精度(第1精度)で表現された第1-第4サブフレームのピッチ周期T1',T2',T3',T4'を抽出し、これらを出力する。
 [符号化装置11でステップS113の具体例2が用いられる場合]
 この場合、ピッチ周期復号部127dは、符号CTから複数のサブフレームからなる時間区間(第1時間区間)ごとのピッチ周期を抽出し、それらを出力する。すなわち、ピッチ周期を第1時間区間ごとに得る復号方式でピッチ周期に対応する符号を復号する。第1,2サブフレーム、第3,4サブフレームをそれぞれの第1時間区間とする図8Bの例では、第1,2サブフレームに対して同一のピッチ周期T1',T2'=T1'が抽出され、第3,4サブフレームに対して同一のピッチ周期T3',T4'=T3'が抽出され、ピッチ周期T1',T2',T3',T4'が出力される([ステップS123の具体例の説明終わり)。
 一方、ステップS122の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たした場合(定常的)、判定部127b(図6)の制御に基づき、スイッチ部127cが現フレームの符号CTをピッチ周期復号部127eに送る。ピッチ周期復号部127eは、ピッチ周期符号化部117e(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS124)。ピッチ周期復号部127eは、第2精度で表現されたピッチ周期を第2時間区間ごとに符号化して得られた符号を復号する。すなわち、第2精度で表現されたピッチ周期を第2時間区間ごと得る復号方式でピッチ周期に対応する符号を復号する。例えば、ピッチ周期復号部127eは、従来と同様に、現フレームの符号CTを復号して、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する。以下にステップS124の具体例を示す。
 [符号化装置11でステップS114の具体例1,2が用いられる場合]
 この場合、ピッチ周期復号部127eは、符号CTから、第1サブフレームのピッチ周期T1'、第3サブフレームのピッチ周期T3'を抽出してこれらを出力する。また、ピッチ周期復号部127eは、符号CTから、第2サブフレームのピッチ周期の整数部の第1サブフレームのピッチ周期の整数部との差分値、第4サブフレームのピッチ周期の整数部の第3サブフレームのピッチ周期の整数部との差分値、第2サブフレームのピッチ周期の小数部、第4サブフレームのピッチ周期の小数部を抽出する。
 さらにピッチ周期復号部127eは、第1サブフレームのピッチ周期T1'から得られる第1サブフレームのピッチ周期の整数部と、第2サブフレームのピッチ周期の整数部の第1サブフレームのピッチ周期の整数部との差分値と、第2サブフレームのピッチ周期の小数部とを加算することにより、第2サブフレームのピッチ周期T2'を得て、これを出力する。
 さらにピッチ周期復号部127eは、第3サブフレームのピッチ周期T3'から得られる第3サブフレームのピッチ周期の整数部と、第4サブフレームのピッチ周期の整数部の第3サブフレームのピッチ周期の整数部との差分値と、第4サブフレームのピッチ周期の小数部とを加算することにより、第4サブフレームのピッチ周期T4'を得て、これを出力する(ステップS124の具体例の説明終わり)
 復号された現フレームのピッチ周期T'=T1',T2',T3',T4'は、判定部127bの制御に基づき、スイッチ部127cによって出力される。また、パラメータ復号部127は、線形予測情報LPC infoと、コードインデックスCf=Cf1,Cf2,Cf3,Cf4と、量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'と、量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'とを出力する。その後、従来と同様に、復号装置12で合成信号x'(n)(n=0,...,L-1)が生成され、出力される。
 〔第1実施形態の変形例1〕
 上述した第1実施形態の変形として、ステップS112で現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であると判定されるか、非定常的であると判定されるかに応じ、符号化装置11の探索部913(図4)が、現フレームよりも未来のフレームでのピッチ周期Tの探索範囲を変更する構成であってもよい。例えば、非定常的であると判断された場合は適応信号成分の貢献が少ないので、ピッチ周期の探索範囲を、定常的であると判定された場合の探索範囲よりも狭くしてもよい。
 また、探索部913が元フレームのピッチ周期Tの探索を行う前に、現フレームに対して生成した線形予測情報LPC infoを用いて生成された予測利得の推定値Eを用いて現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であるか、非定常的であるかを判定し、その結果に応じて、現フレームでのピッチ周期Tの探索範囲を変更する構成であってもよい。例えば、非定常的であると判断された場合の探索範囲を、定常的であると判定された場合の探索範囲よりも狭くしてもよい。
 また、ステップS112によって定常的であるか非定常的であるかを判定し、その結果に応じてピッチ周期Tの探索範囲を設定した後、現フレームに対する探索部913の処理をやり直してもよい。
 さらに、ステップS113の具体例2のように、非定常的であると判定された際に複数のサブフレームからなる時間区間ごとにピッチ周期Tを符号化する(符号化頻度を落とす)場合には、非定常的であると判定されたフレームについて、探索部913によるピッチ周期Tの算出頻度を落としてもよい。すなわち、例えば、複数のサブフレームに対して1つのピッチ周期のみしか符号化しないのであれば、当該複数のサブフレームに対して1つのピッチ周期のみしか算出しなくてもよい。
 〔第1実施形態の変形例2〕
 上述した第1実施形態の変形として、ステップS112で現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であると判定されるか、非定常的であると判定されるかに応じ、現フレームよりも未来のフレームで符号化装置11の探索部913(図4)が算出するピッチ周期Tの精度を変更する構成であってもよい。例えば、非定常的であると判断された場合に整数精度で表現されたピッチ周期Tが算出され、定常的であると判断された場合に小数精度で表現されたピッチ周期Tが算出される構成であってもよい。
 また、探索部913が元フレームのピッチ周期Tの算出を行う前に、現フレームに対して生成した線形予測情報LPC infoを用いて生成された予測利得の推定値Eを用いて現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であるか、非定常的であるかを判定し、その結果に応じて、現フレームでのピッチ周期Tを整数精度で算出するか、小数精度で算出するかが選択される構成であってもよい。例えば、非定常的であると判断された場合に整数精度で表現されたピッチ周期Tが算出され、定常的であると判断された場合に小数精度で表現されたピッチ周期Tが算出される構成であってもよい。
 また、ステップS112によって定常的であるか非定常的であるかを判定し、その結果に応じて探索部913で算出するピッチ周期Tの精度を設定した後、現フレームに対する探索部913の処理をやり直してもよい。
 〔第1実施形態の変形例3〕
 また、上述した第1実施形態の変形として、ステップS112で現フレームの時系列信号x(n)(n=0,...,L-1)が定常的であると判定されるか、非定常的であると判定されるかに応じ、コードインデックスCfに割り当てるビット数を変化させてもよい。例えば、非定常的であると判定された場合には、定常的であると判定された場合に比べて、ピッチ周期Tに対応する符号CTの符号量が小さくなるので、ビットレートを下げるより、同程度のビットレートでの品質改善を重視する場合には、ピッチ周期Tに対応する符号CTの符号量の節約分だけコードインデックスCfに多くのビット数を割り当てて、符号化品質を向上させてもよい。
 〔第1実施形態の変形例4〕
 また、時系列信号x(n)(n=0,...,L-1)が定常的であるか否かを判定し、その結果に応じてピッチ周期を表現するための精度やピッチ周期の符号化方式を切り替える代わりに、時系列信号x(n)(n=0,...,L-1)が周期的であるか否かを判定し、その結果に応じてピッチ周期を表現するための精度やピッチ周期の符号化方式を切り替えてもよい。この場合の処理は、上記の「定常的」を「周期的」に置換し、「非定常的」を「非周期的」に置換した処理になる。なお、時系列信号x(n)(n=0,...,L-1)が周期的であるか否かの判定も、予測利得や量子化されたピッチ利得が規定値よりも大きいか否かで判定できる。すなわち、時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件を満たすか否かに応じ、ピッチ周期を表現するための精度および/またはピッチ周期の符号化方式が切り替えられてもよい。
 〔第1実施形態の変形例5〕
 また、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるか否かを判断する指標として、所定時間区間に含まれる何れかの時間区間のピッチ周期に対応する値(例えば、ピッチ周期やピッチ周期の整数部)と当該所定時間区間に含まれる当該時間区間より過去の時間区間のピッチ周期に対応する値との差分値を用いてもよい。そして、この差分値が規定値よりも小さい場合に定常的(周期的)であると判定され、そうでない場合に非定常的(非周期的)であると判定されてもよい。また、指標<規定値を満たすか否かを判定することで指標が規定値よりも小さいか否かが判定されてもよいし、指標≦(規定値-定数)を満たすか否かを判定することで指標が規定値よりも小さいか否かが判定されてもよい。この場合、規定値が処理上の閾値として設定されていてもよいし、(規定値-定数)が処理上の閾値として設定されていてもよい。
 〔第1実施形態の変形例6〕
 また、符号化装置11が定常性や周期性の判断結果に応じて選択する事項(ピッチ周期の精度や符号化方式など)を特定するための補助情報がビットストリームBSに含まれることにしてもよい。この場合、復号装置12はビットストリームBSに含まれる補助情報を用いて、定常性や周期性の判断結果に応じて選択する事項(ピッチ周期の精度や復号方式など)を特定することができる。
 〔第2実施形態〕
 第2実施形態は、第1実施形態またはその変形例1-6に対する変形である。第2実施形態と、第1実施形態またはその変形例1-6との相違点は、時系列信号が定常的(周期的)であるか否かに応じて切り替えられる、ピッチ周期の符号化方式および復号方式の内容である。
 音声信号などの時系列信号の場合、定常的(周期的)なフレームではピッチ周期の変化が少なく、当該フレームに属するサブフレームの各ピッチ周期間の差分値が0または小さい値となる可能性が大きい。従って、定常的なフレームではサブフレームの各ピッチ周期間の差分値を可変長符号化することが有効である。逆に定常的(周期的)でないフレームでは、このような差分値のばらつきが大きくなるため、可変長符号化が有効でない場合が多い。
 そのため、第2実施形態のピッチ周期の符号化処理では、時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件を満たす場合に、所定時間区間に含まれる第1所定時間区間のピッチ周期を符号化し、当該所定時間区間に含まれる第1所定時間区間以外の第2所定時間区間のピッチ周期に対応する値と当該第2所定時間区間以外の時間区間のピッチ周期に対応する値との差分値を可変長符号化する。以下では、「所定時間区間」がフレームであり、「第1所定時間区間」が第1、第3サブフレームであり、「第2所定時間区間」が第2、第4サブフレームであり、「ピッチ周期に対応する値」がピッチ周期の整数部である場合を例にとって説明する。しかし、これは本発明を限定するものではない。
 <構成>
 図4から6を用いて、第2実施形態の符号化装置21および復号装置22の構成を説明する。
 図4に例示するように、第2実施形態の符号化装置21と第1実施形態の符号化装置11との相違点は、パラメータ符号化部117がパラメータ符号化部217に置換された点である。また、第2実施形態の復号装置22と第1実施形態の復号装置12との相違点は、パラメータ復号部127がパラメータ復号部227に置換された点である。
 図5に例示するように、第2実施形態のパラメータ符号化部217と第1実施形態のパラメータ符号化部117との相違点は、ピッチ周期符号化部117dがピッチ周期符号化部217dに置換され、ピッチ周期符号化部117eがピッチ周期符号化部217eに置換された点である。また、図6に例示するように、第2実施形態のパラメータ復号部227と第1実施形態のパラメータ復号部127との相違点は、ピッチ周期復号部127dがピッチ周期復号部227dに置換され、ピッチ周期復号部127eがピッチ周期復号部227eに置換された点である。
 <符号化方法>
 図7Aを用いて、第2実施形態の符号化方法を説明する。
 第2実施形態の符号化方法では、第1実施形態のステップS113の代わりに以下のステップS213が実行され、1実施形態のステップS114の代わりに以下のステップS214が実行される。その他は、第1実施形態やその変形例と同様でよい。以下では、本形態のステップS213およびステップS214の処理のみを説明する。
 [ステップS213の処理]
 ステップS112で非定常的(非周期的)であると判定されると、判定部117bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部217d(図5)に送る。ピッチ周期符号化部217dは、例えば、従来(図2A及びB)と同様な方法(ステップS213の具体例1)、または第1実施形態のステップS113(図8)と同様な方法(ステップS213の具体例2)で、現フレームのピッチ周期Tに対応する符号CTを生成して出力する(ステップS213)。
 [ステップS214の処理]
 ステップS112で定常的(周期的)であると判定されると、判定部117bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部217eに送る。ピッチ周期符号化部217eは、第1、第3サブフレーム(第1所定時間区間)のピッチ周期T1,T3(ピッチ周期の最低値からの差分)を、従来と同様に(図2A、図2B及び図3)、サブフレームごとに単独で符号化する。さらに、ピッチ周期符号化部217eは、第2サブフレーム(第2所定時間区間)のピッチ周期T2の整数部(ピッチ周期に対応する値)と第1サブフレーム(第2所定時間区間以外の時間区間)のピッチ周期T1の整数部との差分値TD(1,2)を可変長符号化し、第4サブフレーム(第2所定時間区間)のピッチ周期T4の整数部と第3サブフレーム(第2所定時間区間以外の時間区間)のピッチ周期T3の整数部との差分値TD(3,4)を可変長符号化する。なお、差分値TD(α,β)は、(ピッチ周期Tαの整数部)-(ピッチ周期Tβの整数部)であってもよいし、(ピッチ周期Tβの整数部)-(ピッチ周期Tαの整数部)であってもよいが、いずれを採用するかは符号化装置と復号装置とで統一しておく。また、第2、第4サブフレームのピッチ周期T2,T4の小数部は、それぞれ固定ビット(例えば2ビット)で符号化される。
 このように、ピッチ周期符号化部217eは、サブフレームごとに単独で第1、第3サブフレームのピッチ周期T1,T3を符号化し、差分値TD(1,2)及びTD(3,4)を可変長符号化し、ピッチ周期T2,T4の小数部を固定ビットで符号化することで、現フレームのピッチ周期T=T1,T2,T3,T4に対応する符号CTを生成して出力する(ステップS214)。以下に、本形態で差分値TD(1,2)および差分値TD(3,4)に対して行われる可変長符号化方法を例示する。
 [可変長符号化方法の具体例1]
 この例では、差分値TD(1,2)および差分値TD(3,4)の各大きさがともに0の場合に、特別な1ビット(例えば"0")を差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。それ以外の場合には、「それ以外の場合である」ことを示す1ビット(例えば"1")と差分値TD(1,2)を示す3ビットの計4ビットと、「それ以外の場合である」ことを示す1ビット(例えば"1")と差分値TD(3,4)を示す3ビットの計4ビットとを、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。
 [可変長符号化方法の具体例2]
 この例では、差分値TD(1,2)や差分値TD(3,4)が-1,0,+1の場合には、差分値TD(1,2)や差分値TD(3,4)をそれぞれ可変長符号化したものを符号とし、それ以外の場合には、そのことを示す1ビット(例えば"1")と差分値を示す4ビットとを符号とする。例えば、以下のように差分値TD(1,2)や差分値TD(3,4)がそれぞれ可変長符号化される。
Figure JPOXMLDOC01-appb-T000002
 なお、表1の例の場合、差分値が-1,0,+1以外ならかえって情報量が25%増えるので、差分値が-1,0,+1以外の頻度が大きいときにはビット数が削減されない。"1"+"XXXX"の場合のXXXXの16個の差分値のうち、0,+1, -1の3個は指定されることはないので、XXXXで13個の差分値を指定し、のこりの3個の符号を特別の処理のためのフラグなど別の目的に使うことができる。あるいは"1"+"XXXX"で指定する13個(16-3)の差分値を予め作った対応表を使って、頻度の高い差分値2個のみを3ビットで表現し、残りの11個を4ビットで表現することで平均符号量をさらに削減できる。
 [可変長符号化方法の具体例3]
 この例では、所定時間区間に含まれる第1所定時間区間以外複数の第2所定時間区間の各ピッチ周期に対応する値と当該所定時間区間に含まれる当該第2所定時間区間以外の時間区間の各ピッチ周期に対応する値との各差分値を統合した情報を可変長符号化する。前述のように、ここでは、「所定時間区間」がフレームであり、「第1所定時間区間」が第1、第3サブフレームであり、「第2所定時間区間」が第2、第4サブフレームであり、「ピッチ周期に対応する値」がピッチ周期の整数部である場合を例にとって説明する。
 この例では、差分値TD(1,2)および差分値TD(3,4)がともに0の場合に、特別な1ビットの指定符号(例えば"1")を、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。また、差分値TD(1,2)および差分値TD(3,4)の一方が0であり、他方が+1,-1のいずれかである状態は4状態存在する。この例では、当該4状態の何れかであることを示す2ビットの指定符号(例えば"00")と、各状態を識別するための2ビット("00","01","10","11")とからなる合計4ビットを、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。その他の場合には、それを特定するための2ビット(例えば"01")の指定符号と、差分値TD(1,2)を表すための4ビットと、差分値TD(3,4)を表すための4ビットとの合計10ビットを、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。例えば、以下のように差分値TD(1,2)および差分値TD(3,4)がまとめて可変長符号化される。
Figure JPOXMLDOC01-appb-T000003
 [可変長符号化方法の具体例4]
 この例では、前述の差分値TD(1,2)および差分値TD(3,4)がともに0の場合に、特別な2ビットの指定符号(例えば"01")を、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。また、差分値TD(1,2)および差分値TD(3,4)の一方が0であり、他方が+1,-1のいずれかである状態は4状態存在し、差分値TD(1,2)および差分値TD(3,4)の一方が-1であり、他方が+1である状態は2状態存在する。この例では、この合計6状態の何れかであることを示す2ビットの指定符号(例えば"00")と、各状態を識別するための2または3ビット(例えば"00","01","100","101","110","111")とからなる合計4または6ビットを、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。その他の場合には、それを特定するための1ビット(例えば"1")の指定符号と、差分値TD(1,2)を表すための4ビットと、差分値TD(3,4)を表すための4ビットとの合計9ビットを、差分値TD(1,2)および差分値TD(3,4)に対応する符号とする。例えば、図9A並びにB及び以下に例示するように、差分値TD(1,2)および差分値TD(3,4)がまとめて可変長符号化される。
Figure JPOXMLDOC01-appb-T000004
 なお、表3で、差分値TD(1,2)が+1で差分値TD(3,4)が-1である場合の符号("00110")、および差分値TD(1,2)が-1で差分値TD(3,4)が+1である場合の符号("00111")の符号長が、差分値TD(1,2)が0であり差分値TD(3,4)が+1,-1のいずれかである場合の符号("0000","0001")の符号長よりも長いのは、差分値TD(1,2)が+1で差分値TD(3,4)が-1となる頻度、および差分値TD(1,2)が-1で差分値TD(3,4)が+1となる頻度が小さいことに基づいている。
 以下に、各状態の想定頻度を例示する。
Figure JPOXMLDOC01-appb-T000005
 表4の想定頻度の場合に、表3の割り当てで符号化された場合、差分値TD(1,2),TD(3,4)に対応する符号の符号長期待値は平均5.35ビットとなり、差分値TD(1,2)およびTD(3,4)をそれぞれ4ビットで符号化した場合の合計符号長8ビットから2.65ビットの節約となる。ただし、この想定頻度は定常性が高いフレーム(例えば、全体の40%のフレーム)のものであり、定常性が低いフレームでは差分値TD(1,2)およびTD(3,4)の偏りが小さく分布が広くなる。よって、前述のステップS112の判定で、定常的であると判定された場合にのみに限定して当該符号化を行うことで、可変長符号化による高い圧縮効果を得ることができる。しかしながら、ステップS112での条件(定常的である場合の条件)を厳しくしすぎると、可変長符号化が適用される頻度が下がるので、情報削減効果が限られる。一方、ステップS112での条件(定常的である場合の条件)を緩和しすぎると、可変長符号化による高い圧縮効果を得ることができなくなり、場合によっては従来よりも平均ビット数が増加する可能性もある。従って、ステップS112での条件設定を適切に調整することが必要である。
 <復号方法>
 図7Bを用いて、第2実施形態の復号方法を説明する。
 第2実施形態の復号方法では、第1実施形態のステップS123の代わりに以下のステップS223が実行され、第1実施形態のステップS124の代わりに以下のステップS224が実行される。その他は、第1実施形態やその変形例と同様でよい。以下では、本形態のステップS223およびステップS224の処理のみを説明する。
 [ステップS223の処理]
 ステップS122の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たさないと判定された場合(非定常的)、判定部127bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部227dに送る。ピッチ周期復号部227dは、ピッチ周期符号化部217d(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS223)。例えば、符号化装置21でステップS213の具体例1の処理が実行されて現フレームの符号CTが生成されるのであれば(図2A及びB参照)、従来と同様な手法によって、符号CTから現フレームのピッチ周期T'=T1',T2',T3',T4'が生成される。また、例えば、符号化装置21でステップS213の具体例2の処理が実行されて現フレームの符号CTが生成されるのであれば、それに対応する第1実施形態のステップS123の処理によって、符号CTから現フレームのピッチ周期T'=T1',T2',T3',T4'が生成される。
 [ステップS224の処理]
 ステップS122の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たすと判定された場合(定常的)、判定部127bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部227eに送る。ピッチ周期復号部227eは、ピッチ周期符号化部217e(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS224)。
 〔第3実施形態〕
 第3実施形態は、第1実施形態あるいはその変形例1-6または第2実施形態に対する変形である。第3実施形態と、第1実施形態あるいはその変形例1-6または第2実施形態との相違点は、時系列信号が定常的(周期的)であるか否かに応じて切り替えられる、ピッチ周期の符号化方式および復号方式の内容である。
 定常性(周期性)が高い場合、すなわち量子化されたピッチ利得や予測利得が規定値より大きい場合や、差分値TD(1,2),TD(3,4)が規定値より小さい場合、第1サブフレームのピッチ周期T1と第3サブフレームのピッチ周期T3との差も小さい場合が多い。よって、本形態の符号化処理では、時系列信号x(n)(n=0,...,L-1)の定常性(周期性)が高い場合に、ピッチ周期T3に対応する値(例えば、ピッチ周期T3の整数部)とピッチ周期T1に対応する値(例えば、ピッチ周期T1の整数部)との差分値TD(1,3)を可変長符号化する。
 すなわち、第3実施形態のピッチ周期の符号化処理も、時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件を満たす場合に、所定時間区間に含まれる第1所定時間区間のピッチ周期を符号化し、当該所定時間区間に含まれる第1所定時間区間以外の第2所定時間区間のピッチ周期に対応する値と当該所定時間区間に含まれる当該第2所定時間区間以外の時間区間のピッチ周期に対応する値との差分値を可変長符号化する。ただし、本形態では、「所定時間区間」がフレームであり、「第1所定時間区間」が第1サブフレームであり、「第2所定時間区間」が第3サブフレームであり、「第2所定時間区間以外の時間区間」が第1サブフレームであり、「ピッチ周期に対応する値」がピッチ周期の整数部である。なお、これは本発明を限定するものではない。以下では、第1実施形態あるいはその変形例1-6または第2実施形態との相違点を中心に説明する。
 <構成>
 図4から6を用いて、第3実施形態の符号化装置31および復号装置32の構成を説明する。
 図4に例示するように、第3実施形態の符号化装置31と第1実施形態の符号化装置11との相違点は、パラメータ符号化部117がパラメータ符号化部317に置換された点である。また、第3実施形態の復号装置32と第1実施形態の復号装置12との相違点は、パラメータ復号部127がパラメータ復号部327に置換された点である。
 図5に例示するように、第3実施形態のパラメータ符号化部317と第1実施形態のパラメータ符号化部117との相違点は、判定部117bが判定部317bに置換され、ピッチ周期符号化部117dがピッチ周期符号化部317dに置換され、ピッチ周期符号化部117eがピッチ周期符号化部317eに置換された点である。また、図6に例示するように、第3実施形態のパラメータ復号部327と第1実施形態のパラメータ復号部127との相違点は、判定部127bが判定部327bに置換され、ピッチ周期復号部127dがピッチ周期復号部327dに置換され、ピッチ周期復号部127eがピッチ周期復号部327eに置換された点である。
 <符号化方法>
 図7Aを用いて、第3実施形態の符号化方法を説明する。
 第3実施形態の符号化方法では、第1実施形態のステップS112の代わりに以下のステップS312が実行され、第1実施形態のステップS113の代わりに以下のステップS313が実行され、第1実施形態のステップS114の代わりに以下のステップS314が実行される。その他は、第1実施形態やその変形例と同様でよい。以下では、本形態のステップS313およびステップS314の処理のみを説明する。
 [ステップS312の処理]
 ステップS312では、判定部317bが現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるか否かを判定する(ステップS312)。ステップS312の判定は、第1実施形態のステップS112と同様に行われてもよいが、第3実施形態では、所定時間区間に含まれる何れかの時間区間のピッチ周期に対応する値と当該所定時間区間に含まれる当該時間区間より過去の時間区間のピッチ周期に対応する値との差分値の大きさを指標とし、その指標が規定値より小さい場合に、時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であると判定し、そうでない場合に、時系列信号x(n)(n=0,...,L-1)が非定常的(非周期的)であると判定する例を説明する。以下では、差分値TD(1,2)の大きさ、および/または、TD(3,4)の大きさを指標とし、定常的(周期的)であるか否かを判定する例を説明する。
 [ステップS312の具体例1]
 ステップS312の具体例1では、判定部317bにピッチ周期T1,T2,が入力される。判定部317bは、ピッチ周期T1,T2の整数部の差分である差分値TD(1,2)の大きさを指標とし、それが規定値より小さいか否かを判定する。そして、差分値TD(1,2)の大きさが規定値より小さい場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(定常的)であると判定し、そうでない場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(非定常的)でないと判定する。
 なお、指標<規定値を満たすか否かを判定することで、指標が規定値よりも小さいか否かが判定されてもよいし、指標≦(規定値-定数)を満たすか否かを判定することで、指標が規定値よりも小さいか否かが判定されてもよい。この場合、規定値が処理上の閾値として設定されていてもよいし、(規定値-定数)が処理上の閾値として設定されていてもよい。以後説明するその他の「指標が規定値よりも小さいか否か」の判定についても同様である。また、ピッチ周期T1,T2の整数部の差分である差分値TD(1,2)の代わりに、ピッチ周期T3,T4の整数部の差分である差分値TD(3,4)を指標として用いてもよい。
 [ステップS312の具体例2]
 ステップS312の具体例2では、判定部317bにピッチ周期T1,T2,T3,T4が入力される。判定部317bは、差分値TD(1,2)の大きさとTD(3,4)の大きさとを指標とし、それらがともに規定値より小さいか否かを判定する。そして、差分値TD(1,2)の大きさとTD(3,4)の大きさとがともに規定値より小さい場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(定常的)であると判定し、そうでない場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(非定常的)でないと判定する。
 [ステップS312の具体例3]
 ステップS312の具体例3でも、判定部317bにピッチ周期T1,T2,T3,T4が入力される。判定部317bは、差分値TD(1,2)が規定値Aより小さく、かつ、差分値TD(3,4)が規定値Bより小さいか否かを判定する。そして、これらの条件が満たされる場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(定常的)であると判定し、そうでない場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(非定常的)でないと判定する。
 [ステップS312の具体例4]
 ステップS312の具体例4でも、判定部317bにピッチ周期T1,T2,T3,T4が入力される。判定部317bは、差分値TD(1,2)が規定値A1より大きく規定値A2よりも小さく、かつ、差分値TD(3,4)が規定値B1より大きく規定値B2よりも小さいか否かを判定する。そして、これらの条件が満たされる場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(定常的)であると判定し、そうでない場合には、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(非定常的)でないと判定する。
 [ステップS312の具体例5]
 その他、ステップS312の具体例1から4の何れかの判定と、第1実施形態のステップS112の何れかの判定との組み合わせで、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(定常的)であるか否かを判定してもよい。
 [ステップS313の処理]
 ステップS312で非定常的(非周期的)であると判定されると、判定部317bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部317d(図5)に送る。ピッチ周期符号化部317dは、例えば、従来(図2A及びB)と同様な方法(ステップS313の具体例1)、または第1実施形態のステップS113(図8B)と同様な方法(ステップS313の具体例2)で、現フレームのピッチ周期Tに対応する符号CTを生成して出力する(ステップS313)。
 [ステップS314の処理]
 ステップS312で定常的(周期的)であると判定されると、判定部317bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部317eに送る。図10A-Cは、時系列信号が定常的(周期的)である場合における、第3実施形態でのピッチ周期の符号化方法を例示するための図である。
 図10Aに例示するように、ピッチ周期符号化部317eは、第2サブフレームのピッチ周期T2の整数部と第1サブフレームのピッチ周期T1の整数部との差分値TD(1,2)と、第4サブフレームのピッチ周期T4の整数部と第3サブフレームのピッチ周期T3の整数部との差分値TD(3,4)とをそれぞれ符号化し(差分整数部)、ピッチ周期T2,T4の小数点以下の値(小数部)をそれぞれ符号化する。さらに、ピッチ周期符号化部317eは、第1サブフレームのピッチ周期T1をサブフレームごとに単独で符号化する。これらの第1,2,4サブフレームの符号化方法は、例えば、従来と同様に行えばよい。ピッチ周期符号化部317eは、さらに、差分値TD(1,3)に応じ、第3サブフレームのピッチ周期T3の整数部と第1サブフレームのピッチ周期T1の整数部との差分値TD(1,3)を可変長符号化するか(図10B)、または、第3サブフレームのピッチ周期T3をサブフレームごとに単独で符号化し(図10C)、第3サブフレームのピッチ周期T3の符号X3を生成する(図10A)。なお、差分値TD(1,3)を可変長符号化する場合、ピッチ周期T3の小数部はピッチ周期T3の整数部の大きさに応じたビットで符号化される。例えば、ピッチ周期符号化部317eは、ピッチ周期T3の整数部が最小値Tmin以上でTAより小さい場合には、2ビットで小数部を符号化し、ピッチ周期T3の整数部がTAからTBまでの場合には、1ビットで小数部を符号化し、ピッチ周期T3の整数部がTB以上で最大値Tmaxまでの場合には小数部を符号化しない(図10B)。以上の処理により、ピッチ周期符号化部317eは、ピッチ周期T=T1,T2,T3,T4に対応する符号CTを生成して出力する。以下に、ピッチ周期T3の符号化方法を例示する。
 [ピッチ周期T3の符号化方法の具体例1]
 この例では、前述の差分値TD(1,3)が0の場合に、1ビットの指定符号(例えば"1")を、差分値TD(1,3)に対応する符号とする。また、差分値TD(1,3)が+1,-1のいずれかである場合に、3ビットの指定符号(例えば"000","001")を、差分値TD(1,3)に対応する符号とする。さらに、差分値TD(1,3)がその他の値となる場合には、そのことを示す2ビットの指定符号(例えば"01")とピッチ周期T3に対応する7ビットとからなる合計9ビットの符号が生成される。例えば、以下に例示するように、ピッチ周期T3が符号化される。
Figure JPOXMLDOC01-appb-T000006
 表5の想定頻度の場合、ピッチ周期T3を表現するための符号の符号長期待値を従来の7ビットと比べて3.2ビット節約できる。また、表5の想定頻度は、上記のステップS312において、差分値TD(1,2)の大きさが1より小さい場合(差分値TD(1,2)が0の場合)にのみ定常的(定常的)であると判定することにした場合のものである。この場合、上記のステップS312で定常的(定常的)と判定されるフレームの頻度は全体の25%と想定でき、ピッチ周期T3を表現するための符号の節約量は平均では0.8ビットとなる。
 [ピッチ周期T3の符号化方法の具体例2]
 この例では、前述の差分値TD(1,3)が0の場合に、そのことを表す1ビットの指定符号(例えば"1")を、差分値TD(1,3)に対応する符号とする。また、差分値TD(1,3)が+1,-1のいずれかである場合に、3ビットの指定符号(例えば"000","001")を、差分値TD(1,3)に対応する符号とする。また、差分値TD(1,3)が0,+1,-1以外であって4ビット以下で表現できる場合には、そのことを表す3ビットの指定符号(例えば"010")と差分値TD(1,3)を表す4ビットとの合計7ビットを差分値TD(1,3)に対応する符号とする。差分値TD(1,3)がその他の値となる場合には、そのことを示す3ビットの指定符号(例えば"001")とピッチ周期T3に対応する7ビットとからなる合計10ビットの符号が生成される。例えば、以下に例示するように、ピッチ周期T3が符号化される。
Figure JPOXMLDOC01-appb-T000007
 表6の想定頻度の場合、ピッチ周期T3を表現するための符号の符号長期待値を従来の7ビットと比べて2.4ビット節約できる。また、表6の想定頻度は、上記のステップS312において、差分値TD(1,2)の大きさが2より小さい場合(差分値TD(1,2)が0,-1,1の何れかの場合)にのみ定常的(定常的)であると判定することにした場合のものである。この場合、上記のステップS312で定常的(定常的)と判定されるフレームの頻度は50%と想定でき、ピッチ周期T3を表現するための符号の節約量は平均では1.2ビットとなる。
 [ピッチ周期T3の符号化方法の具体例3]
 この例での符号の割り当て方はピッチ周期T3の符号化方法の具体例2と同じである。ただし、上記のステップS312において、差分値TD(1,2)およびTD(3,4)の大きさがともに2より小さい場合(差分値TD(1,2)およびTD(3,4)が0,-1,1の何れかの場合)にのみ定常的(定常的)であると判定する。この場合の想定頻度は以下のようになる。
Figure JPOXMLDOC01-appb-T000008
 表7の想定頻度では、ピッチ周期T3を表現するための符号の符号長期待値を従来の7ビットと比べて3.9ビット節約できる。ただし、この場合、上記のステップS312で定常的(定常的)と判定されるフレームの頻度は24%と想定でき、ピッチ周期T3を表現するための符号の節約量は平均では0.95ビットとなる。
 [ピッチ周期T3の符号化方法の具体例4]
 この例では、前述の差分値TD(1,3)が0の場合に、そのことを表す1ビットの指定符号(例えば"1")を、差分値TD(1,3)に対応する符号とする。また、差分値TD(1,3)が-1である場合に、2ビットの指定符号(例えば"01")を、差分値TD(1,3)に対応する符号とする。また、差分値TD(1,3)が+1である場合に、3ビットの指定符号(例えば"000")を、差分値TD(1,3)に対応する符号とする。差分値TD(1,3)がその他の値となる場合には、そのことを示す3ビットの指定符号(例えば"001")とピッチ周期T3に対応する7ビットとからなる合計10ビットの符号が生成される。例えば、以下に例示するように、ピッチ周期T3が符号化される。
Figure JPOXMLDOC01-appb-T000009
 表8の想定頻度の場合、ピッチ周期T3を表現するための符号の符号長期待値を従来の7ビットと比べて3.75ビット節約できる。また、表8の想定頻度は、上記のステップS312において、差分値TD(1,2)およびTD(3,4)の大きさがともに2より小さい場合(差分値TD(1,2)およびTD(3,4)が0,-1,1の何れかの場合)にのみ定常的(定常的)であり、かつ、ピッチ利得T2,T4がともに0.7以上の場合にのみ定常的(定常的)であると判定することにした場合のものである。この場合、上記のステップS312で定常的(定常的)と判定されるフレームの頻度は24%と想定でき、ピッチ周期T3を表現するための符号の節約量は平均では0.95ビットとなる。
 [ピッチ周期T3の符号化方法の具体例5]
 この例での符号の割り当て方はピッチ周期T3の符号化方法の具体例4と同じである。ただし、上記のステップS312において、差分値TD(1,2),TD(3,4)かかわらず、ピッチ利得T2,T4がともに0.7以上の場合にのみ定常的(定常的)であると判定する。この場合の想定頻度は以下のようになる。
Figure JPOXMLDOC01-appb-T000010
 表9の想定頻度では、ピッチ周期T3を表現するための符号の符号長期待値を従来の7ビットと比べて1.8ビット節約できる。ただし、この場合、上記のステップS312で定常的(定常的)と判定されるフレームの頻度は40%と想定でき、ピッチ周期T3を表現するための符号の節約量は平均では0.72ビットとなる。
 <復号方法>
 図7Bを用いて、第3実施形態の復号方法を説明する。
 第3実施形態の復号方法では、第1実施形態のステップS122の代わりに以下のステップS322が実行され、第1実施形態のステップS123の代わりに以下のステップS323が実行され、第1実施形態のステップS124の代わりに以下のステップS324が実行される。その他は、第1実施形態やその変形例と同様でよい。以下では、本形態のステップS322,S323およびS324の処理のみを説明する。
 [ステップS322の処理]
 ステップS322では、復号装置32(図4)の判定部327b(図6)が、現フレームのビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)が定常的であったか否かを判定する(ステップS322)。ステップS322の判定は、当該時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標が、時系列信号の定常性が高いとみなされる条件を満たすか否かによって行われる。この判定は、分離部127gから出力された判定部327bに判定に必要な情報(LPC info、CT、gp'など)が入力され、符号化装置31で行われたステップS312と同じ方法で行われる。なお、差分値TD(1,2), TD(3,4)を判定のための指標として用いる場合であって、これらが可変長符号化されている場合、これらを復号してからステップS312の判定を行う必要がある。
 [ステップS323の処理]
 ステップS322の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たさないと判定された場合(非定常的)、判定部327bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部327dに送る。ピッチ周期復号部327dは、ピッチ周期符号化部317d(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS323)。
 [ステップS324の処理]
 ステップS322の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たすと判定された場合(定常的)、判定部327bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部327eに送る。ピッチ周期復号部327eは、ピッチ周期符号化部317e(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS324)。
 〔第3実施形態の変形例1〕
 第3実施形態の符号化処理では、現フレームの時系列信号x(n)(n=0,...,L-1)の定常性が高いと判断された場合に、現フレームに属する第3サブフレームのピッチ周期T3の整数部と、第1サブフレームのピッチ周期T1の整数部との差分値TD(1,3)を可変長符号化した。しかし、現フレームの時系列信号x(n)(n=0,...,L-1)の定常性が高いと判断された場合に、差分値TD(1,3)を可変長符号化する代わりに、現フレームに属する第3サブフレームのピッチ周期T3の整数部と、第2サブフレームのピッチ周期T2の整数部との差分値TD(2,3)を、可変長符号化することにしてもよい。なお、図2Bのようにピッチ周期T2が、整数部の差分値TD(1,2)として符号化されている場合には、ピッチ周期T1の整数部に差分値TD(1,2)を加えた値をピッチ周期T2の整数部とする。
 〔第3実施形態の変形例2〕
 第3実施形態では、現フレームの時系列信号x(n)(n=0,...,L-1)の定常性が高いと判断された場合に、現フレームに属する第3サブフレームのピッチ周期T3の整数部と、第1サブフレームのピッチ周期T1の整数部との差分値TD(1,3)を可変長符号化した。しかし、整数部の差分値TD(1,3)を可変長符号化する代わりに、第3サブフレームの小数部を含むピッチ周期T3の下位2ビットを除く値と、第1サブフレームの小数部を含むピッチ周期T1の下位2ビットを除く値との差分値を可変長符号化し、ピッチ周期T3の小数部の代わりにピッチ周期T3の下位2ビットをそのまま符号化することにしてもよい。この場合、ピッチ周期T3の整数部が最小値Tmin以上でTAより小さい場合には、ピッチ周期T3の小数部2ビットがそのまま符号化され、ピッチ周期T3の整数部がTAからTBまでの場合には、ピッチ周期T3の整数部の最下位1ビットと小数部の1ビットとがそのまま符号化され、ピッチ周期T3の整数部がTBから最大値Tmaxまでの場合には、ピッチ周期T3の整数部の下位2ビットがそのまま符号化される。
 〔第3実施形態の変形例3〕
 第3実施形態では、現フレームの時系列信号x(n)(n=0,...,L-1)の定常性が高いと判断された場合に、現フレームに属する第3サブフレームのピッチ周期T3の整数部と、第1サブフレームのピッチ周期T1の整数部との差分値TD(1,3)を可変長符号化した。しかし、現フレームの時系列信号x(n)(n=0,...,L-1)の定常性が高いと判断された場合に、差分値TD(1,3)を可変長符号化して得られる符号とピッチ周期T3の小数部の符号との合計符号長と、ピッチ周期T3(整数部及び小数部)をサブフレームごとに単独に符号化して得られる符号の符号長とを比較し、圧縮効果が高い符号を第3サブフレームのピッチ周期T3の符号として選択してもよい。
 さらに、第3サブフレームのピッチ周期T3の符号としてピッチ周期T3(整数部及び小数部)をサブフレームごとに単独に符号化して得られる符号が選択された場合、現フレームに属する第1サブフレームのピッチ周期T1の整数部と、第3サブフレームのピッチ周期T3の整数部との差分値TD(3,1)を可変長符号化して得られる符号とピッチ周期T1の小数部の符号との合計符号長と、ピッチ周期T1(整数部及び小数部)をサブフレームごとに単独に符号化して得られる符号の符号長とを比較し、圧縮効果が高い符号を第1サブフレームのピッチ周期T1の符号として選択してもよい。
 なお、上述の符号長の比較は、実際に比較対象の符号を求めてそれらの符号長を用いて行われてもよいし、符号長の予測値を用いて行われてもよい。また、何れの符号が選択されたかを示す固定長の補助ビットが符号に付加される場合には、この補助ビットの符号長をも考慮して比較が行われる。
 〔第4実施形態〕
 第4実施形態では、フレームをまたがるサブフレーム間でピッチ周期に対応する値の差分値を求め、その差分値を可変長符号化する。図11に例示するように、複数のフレームからなるスーパーフレームごとに何らかの処理(長期予測や短期予測など)がなされる場合があり、このような場合には、同じスーパーフレームに属するサブフレーム間での定常性や周期性が高くなる場合がある。また、異なるスーパーフレームであってもスーパーフレーム間での定常性が高い場合もある。このような場合には、現フレームの第1フレームのピッチ周期と、それよりも過去のフレームの第3サブフレームまたは第4サブフレームのピッチ周期との差分値が小さくなる場合が多い。このように、本形態では、フレームをまたがるサブフレーム間でピッチ周期に対応する値の差分値を求め、その差分値を可変長符号化することで符号長を削減する。
 すなわち、第4実施形態のピッチ周期の符号化処理も、時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件を満たす場合に、所定時間区間に含まれる第1所定時間区間のピッチ周期を符号化し、当該所定時間区間に含まれる第1所定時間区間以外の第2所定時間区間のピッチ周期に対応する値と当該所定時間区間に含まれる当該第2所定時間区間以外の時間区間のピッチ周期に対応する値との差分値を可変長符号化する。ただし、「所定時間区間」がフレームであり、「第1所定時間区間」が現フレームより過去のフレームの何れかのサブフレームであり、「第2所定時間区間」が現フレームの第1サブフレームであり、「第2所定時間区間以外の時間区間」が現フレームより過去のフレームの何れかのサブフレームであり、「ピッチ周期に対応する値」がピッチ周期の整数部である。以下では説明の簡略化のため、「第1所定時間区間」が現フレームの直前フレームの第3サブフレームであり、「第2所定時間区間」が現フレームの第1サブフレームであり、「第2所定時間区間以外の時間区間」が現フレームの直前フレームの第3サブフレームである場合を説明する。ただし、これは本発明を限定するものではない。以下では、これまで説明した形態との相違点を中心に説明する。
 <構成>
 図4から6を用いて、第4実施形態の符号化装置41および復号装置42の構成を説明する。
 図4に例示するように、第4実施形態の符号化装置41と第1実施形態の符号化装置11との相違点は、パラメータ符号化部117がパラメータ符号化部417に置換された点である。また、第4実施形態の復号装置42と第1実施形態の復号装置12との相違点は、パラメータ復号部127がパラメータ復号部427に置換された点である。
 図5に例示するように、第4実施形態のパラメータ符号化部417と第1実施形態のパラメータ符号化部117との相違点は、判定部117bが判定部317bに置換され、ピッチ周期符号化部117dがピッチ周期符号化部317dに置換され、ピッチ周期符号化部117eがピッチ周期符号化部417eに置換された点である。また、図6に例示するように、第4実施形態のパラメータ復号部427と第1実施形態のパラメータ復号部127との相違点は、判定部127bが判定部327bに置換され、ピッチ周期復号部127dがピッチ周期復号部427dに置換され、ピッチ周期復号部127eがピッチ周期復号部427eに置換された点である。
 <符号化方法>
 図7Aを用いて、第4実施形態の符号化方法を説明する。
 第4実施形態の符号化方法では、第1実施形態のステップS112の代わりに前述のステップS312が実行され、第1実施形態のステップS113の代わりに以下のステップS413が実行され、第1実施形態のステップS114の代わりに以下のステップS414が実行される。その他は、第1実施形態やその変形例と同様でよい。以下では、本形態のステップS413およびステップS414の処理のみを説明する。
 [ステップS413の処理]
 ステップS312で非定常的(非周期的)であると判定されると、判定部317bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部417d(図5)に送る。ピッチ周期符号化部417dは、例えば、従来(図2A及びB)と同様な方法(ステップS313の具体例1)、または第1実施形態のステップS113(図8)と同様な方法(ステップS313の具体例2)で、現フレームのピッチ周期Tに対応する符号CTを生成して出力する(ステップS413)。
 [ステップS414の処理]
 ステップS312で定常的(周期的)であると判定されると、判定部317bの制御に基づき、スイッチ部117cがピッチ周期T=T1,T2,T3,T4をピッチ周期符号化部417eに送る。図12A及びBは、時系列信号が定常的(周期的)である場合における、第4実施形態でのピッチ周期の符号化方法を例示するための図である。
 図12Bに例示するように、ピッチ周期符号化部417eは、現フレーム(図12B)における第2サブフレームのピッチ周期T2の整数部と、現フレームにおける第1サブフレームのピッチ周期T1の整数部との差分値TD(1,2)と、現フレームにおける第4サブフレームのピッチ周期T4の整数部と、現フレームにおける第3サブフレームのピッチ周期T3の整数部との差分値TD(3,4)とをそれぞれ符号化し(差分整数部)、ピッチ周期T2,T4の小数点以下の値(小数部)をそれぞれ符号化する。さらに、ピッチ周期符号化部417eは、現フレームにおける第3サブフレームのピッチ周期T3をサブフレームごとに単独で符号化する。これらの第2,3,4サブフレームの符号化方法は、例えば、従来と同様に行えばよい。
 ピッチ周期符号化部417eは、さらに、現フレーム(図12B)における第1サブフレームのピッチ周期T1の整数部と、過去にピッチ周期符号化部417eに入力された現フレームの直前フレーム(図12A)における第3サブフレームのピッチ周期T3'の整数部との差分値TD(3',1)を求める。そして、ピッチ周期符号化部417eは、差分値TD(3',1)に応じ、差分値TD(3',1)を可変長符号化するか、または、現フレーム第1サブフレームのピッチ周期T1をサブフレームごとに単独で符号化し、現フレームの第1サブフレームでのピッチ周期T1の符号X1を生成する(図12B)。この処理は、差分値TD(1,3)が差分値TD(3',1)に置換される以外、第3実施形態と同様である。また、差分値TD(3',1)の代わりに、現フレームの直前フレームでの第4サブフレームのピッチ周期T4'の整数部との差分値TD(4',1)が用いられてもよい。この場合、当該直前フレームの第4サブフレームのピッチ周期T4'が、当該直前フレームの第3,4サブフレームのピッチ周期T3',T4'の整数部の差分値TD(3',4')で符号化されている場合には、ピッチ周期T3'に差分値TD(3',4')を加えてT4としてTD(4',1)を求める。
 <復号方法>
 図7Bを用いて、第4実施形態の復号方法を説明する。第4実施形態の復号方法では、第1実施形態のステップS122の代わりに前述のステップS322が実行され、第1実施形態のステップS123の代わりに以下のステップS423が実行され、第1実施形態のステップS124の代わりに以下のステップS424が実行される。その他は、第1実施形態やその変形例と同様でよい。以下では、本形態のステップS423およびS424の処理のみを説明する。
 [ステップS423の処理]
 ステップS322の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たさないと判定された場合(非定常的)、判定部327bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部427dに送る。ピッチ周期復号部427dは、ピッチ周期符号化部417d(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS423)。
 [ステップS424の処理]
 ステップS322の判定で、ビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性が高いことを表す条件を満たすと判定された場合(定常的)、判定部327bの制御に基づき、スイッチ部127fが現フレームの符号CTをピッチ周期復号部427eに送る。ピッチ周期復号部427eは、ピッチ周期符号化部417e(図5)で行われた符号化処理に対応する復号処理によって符号CTを復号し、現フレームのピッチ周期T'=T1',T2',T3',T4'を出力する(ステップS424)。
 〔第5実施形態〕
 上述の各実施形態を組み合わせた形態であってもよい。第5実施形態は、その一例である。
 <構成>
 図4から6を用いて、第5実施形態の符号化装置51および復号装置52の構成を説明する。
 図4に例示するように、第5実施形態の符号化装置51と第1実施形態の符号化装置11との相違点は、パラメータ符号化部117がパラメータ符号化部517に置換された点である。また、第2実施形態の復号装置52と第1実施形態の復号装置12との相違点は、パラメータ復号部127がパラメータ復号部527に置換された点である。
 図5に例示するように、第5実施形態のパラメータ符号化部517と第1実施形態のパラメータ符号化部117との相違点は、判定部117bが判定部517bに置換され、ピッチ周期符号化部117dがピッチ周期符号化部517dに置換され、ピッチ周期符号化部117eがピッチ周期符号化部517eに置換された点である。また、図6に例示するように、第5実施形態のパラメータ復号部527と第1実施形態のパラメータ復号部127との相違点は、判定部127bが判定部527bに置換され、ピッチ周期復号部127dがピッチ周期復号部527dに置換され、ピッチ周期復号部127eがピッチ周期復号部527eに置換された点である。
 <符号化方法>
 図13は、第5実施形態の符号化方法を説明するためのフローチャートである。
 ステップS111の処理が実行された後、パラメータ符号化部517(図5)の判定部517bは、前述のステップS112の判定処理により、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるか否かを判定する。
 この判定で、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性(周期的)が高いことを表す条件を満たさないと判定された場合(非定常的/非周期的)、判定部517bの制御に基づき、スイッチ部117cがピッチ周期T2,T4をピッチ周期符号化部517dに送る。ピッチ周期符号化部517dは、各ピッチ周期T2,T4を表現するための精度を整数精度のみにし、それぞれサブフレームごとに単独に符号化する(ステップS513)。
 一方、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性(周期的)が高いことを表す条件を満たすと判定された場合(定常的/周期的)、判定部517bの制御に基づき、スイッチ部117cがピッチ周期T1,T2,T3,T4をピッチ周期符号化部517eに送る。ピッチ周期符号化部517eは、小数精度で表現されたピッチ周期T2,T4の整数部とピッチ周期T1,T3の整数部との差分値を符号化し、ピッチ周期T2,T4の小数点以下の値がそれぞれ2ビットで符号化する(ステップS514)。
 次に、パラメータ符号化部517の判定部517bが、前述のステップS312の判定処理により、現フレームの時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるか否かを判定する。
 この判定で非定常的(非周期的)であると判定されると、判定部517bの制御に基づき、スイッチ部117cがピッチ周期T1,T3をピッチ周期符号化部517dに送る。ピッチ周期符号化部517dは、各ピッチ周期T1,T3を表現するための精度を整数精度のみにし、それぞれサブフレームごとに単独に符号化する(ステップS526)。
 一方、この判定で定常的(周期的)であると判定されると、判定部517bの制御に基づき、スイッチ部117cがピッチ周期T1,T3をピッチ周期符号化部517eに送る。ピッチ周期符号化部517eは、第3実施形態(または第4実施形態)のステップS314(またはS414)と同様に、ピッチ周期T1,T3を符号化する。
 その後、第1実施形態で説明したステップS115の処理が実行される。
 図14は、第5実施形態の復号方法を説明するためのフローチャートである。
 ステップS121の処理が実行された後、パラメータ復号部527(図6)の判定部527bは、前述のステップS122の判定処理により、現フレームのビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるか否かを判定する。
 この判定で、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性(周期的)が高いことを表す条件を満たさないと判定された場合(非定常的/非周期的)、判定部527bの制御に基づき、スイッチ部127fが符号CTをピッチ周期復号部527dに送る。ピッチ周期復号部527dは、ステップS513に対応する復号処理によって、第2、第4サブフレームの各ピッチ周期T2',T4'を得る(ステップS523)。
 一方、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性(周期的)が高いことを表す条件を満たすと判定された場合(定常的/周期的)、判定部527bの制御に基づき、スイッチ部127fが符号CTをピッチ周期復号部527eに送る。ピッチ周期復号部527eは、ステップS514に対応する復号処理によって、第2、第4サブフレームの各ピッチ周期T2',T4'を得る(ステップS524)。
 次に、判定部527bが、前述のステップS322の判定処理により、現フレームのビットストリームBSに対応する時系列信号x(n)(n=0,...,L-1)が定常的(周期的)であるか否かを判定する。
 この判定で、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性(周期的)が高いことを表す条件を満たさないと判定された場合(非定常的/非周期的)、判定部527bの制御に基づき、スイッチ部127fが符号CTをピッチ周期復号部527dに送る。ピッチ周期復号部527dは、ステップS516に対応する復号処理によって、第1、第3サブフレームの各ピッチ周期T1',T3'を得る(ステップS526)。
 一方、時系列信号x(n)(n=0,...,L-1)の定常性を表す指標が、時系列信号x(n)(n=0,...,L-1)の定常性(周期的)が高いことを表す条件を満たすと判定された場合(定常的/周期的)、判定部527bの制御に基づき、スイッチ部127fが符号CTをピッチ周期復号部527eに送る。ピッチ周期復号部527eは、ステップS314(またはS414)に対応する復号処理によって、第1、第3サブフレームの各ピッチ周期T1',T3'を得る。
 上記の処理過程では他のパラメータに依存した可変長符号化を使うので、一意に復号できるためのビットストリームの構成が必須である。図2Aに例示したビットストリームの要素のうち、まずピッチ周期以外の符号が先に復号できるようにし、復号された量子化されたピッチ利得や線形予測情報に基づいてピッチ周期T2',T4'を復号する必要がある。さらにピッチ周期T2',T4'にも依存して各ピッチ周期T1',T3'を復号する。
 〔第6実施形態〕
 各フレームのビットストリームBSをパケット伝送する場合、1フレームあたりの符号長(ビット長)は固定であることが望ましい。一方、パケット伝送ではフレーム内のビット構成についての制約はない。第6実施形態では、1フレームあたりの符号長を固定としつつ、フレーム内で余ったビットをそのフレーム内での符号化品質向上のために利用する。
 <構成>
 図4から6を用いて、第6実施形態の符号化装置61および復号装置62の構成を説明する。
 図4に例示するように、第6実施形態の符号化装置61と第1実施形態の符号化装置11との相違点は、探索部913が探索部613に置換され、固定符号帳914が固定符号帳614に置換され、パラメータ符号化部117がパラメータ符号化部617に置換され、ビット割当て部611が追加された点である。また、第6実施形態の復号装置62と第1実施形態の復号装置12との相違点は、パラメータ復号部127がパラメータ復号部627に置換された点である。
 <符号化方法>
 探索部613(図4)は、現フレームに属する第1-第3サブフレームに対し、従来と同様にピッチ周期T1,T2,T3(整数部及び小数部)を求め、固定符号帳614からの零でない単位パルスとその正負との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とからなる信号成分c(n)を決定してそれらの信号成分c(n)を表すコードインデックスCf1,Cf2,Cf3を特定し、ピッチ利得gp1,gp2,gp3及び固定符号帳利得gc1,gc2,gc3を得る。固定符号帳614には、各サブフレームに対する単位パルスの数、各サブフレーム内で許容される単位パルスの位置(位置候補)、及び各単位パルスに許容される正負符号(正負符号候補)が設定されている(例えば、非特許文献1の"5.7 Algebraic codebook"等参照)。探索部613は、固定符号帳614で設定された範囲内で信号成分c(n)を決定し、コードインデックスCf1,Cf2,Cf3を特定する。すなわち探索部613は、第1-第3サブフレームのそれぞれについて、許容されるサブフレーム内の位置から、設定された数の単位パルスの位置を選択し、許容される正負符号から選択した各位置の単位パルスの正負符号をそれぞれ選択し、それらの選択内容を表すコードインデックスCf1,Cf2,Cf3を特定する。各サブフレームに対する単位パルスの数が多いほどコードインデックスのビット数は大きくなり、符号化精度が高くなる。本形態では、第1-第3サブフレームに対するこのような固定符号帳614の設定が固定されている。すなわち、第1-第3サブフレームでは、各サブフレームに対する単位パルスの数、各サブフレーム内で許容される単位パルスの位置、及び各単位パルスに許容される正負符号が同一である。
 第1-第3サブフレームに対するピッチ利得gp1,gp2,gp3及び固定符号帳利得gc1,gc2,gc3はパラメータ符号化部617の利得量子化部617a(図5)に入力される。利得量子化部617aは、これらをサブフレームごとにベクトル量子化し、サブフレームごとにピッチ利得の量子化値と固定符号帳利得の量子化値との組に対応するVQ利得符号を生成する。VQ利得符号を表現するためのビット数(「VQ利得符号ビット数」と呼ぶ)が多いほど、量子化インターバル(量子化ステップ)を小さくしたり、ベクトル量子化可能なピッチ利得や固定符号帳利得の範囲(レンジ)を大きくしたりでき、符号化品質を向上できる。本形態では、第1-第3サブフレームに対するVQ利得符号ビット数が予め固定されている(例えば7ビット(128種類のピッチ利得の量子化値と固定符号帳利得又は固定符号帳利得対応値との組を表現可能))。利得量子化部617aは、第1-第3サブフレームのVQ利得符号に対応する符号(例えば、これらのVQ利得符号が圧縮符号化された符号)を出力する。
 探索部613(図4)は、現フレームに属する第4サブフレームに対し、従来と同様にピッチ周期T4(整数部及び小数部)を求める。第1-第4サブフレームのピッチ周期T1,T2,T3,T4は、パラメータ符号化部617(図5)に入力される。パラメータ符号化部617は、上述の第1-5実施形態と同様にピッチ周期T1,T2,T3,T4の各整数部を符号化する。例えば、パラメータ符号化部617は、時系列信号x(n)(n=0,...,L-1)の定常性の高さを表す指標として第1-第3サブフレームの何れか又はすべてのVQ利得符号などを用い、上述の実施形態やその変形例と同様にピッチ周期T1,T2,T3,T4の各整数部を符号化する。その他、従来技術と同様にピッチ周期T1,T2,T3,T4の各整数部が符号化されてもよい。
 ビット割当て部611(図4)は、現フレームの線形予測情報LPC infoの符号長、ピッチ周期T1,T2,T3,T4の各整数部に対応する符号の符号長、コードインデックスCf1,Cf2,Cf3の符号長、及び第1-第3サブフレームのVQ利得符号に対応する符号の符号長などの現フレームでの割当てが決定された符号長と、予め定められた1フレームあたりの固定符号長とを用い、現フレームで割当てが決定されていない符号長の割当てを決定する。本形態のビット割当て部611は、第1-第4サブフレームのピッチ周期T1,T2,T3,T4の小数部の精度(図3参照)、第4サブフレームに対する単位パルスの数、第4サブフレームに対するVQ利得符号ビット数を決定する。ただし、これらの一部が固定値であってもよい。
 なお、ピッチ周期の小数部の精度が高くなるほど、ピッチ周期の小数部に対応する符号に割り当てられる符号長は長くなり、符号化品質が向上する。第4サブフレームに対する単位パルスの数が多くなるほど、第4サブフレームのコードインデックスCf4に割り当てられる符号長は長くなり、第4サブフレームの符号化品質が向上する。第4サブフレームに対するVQ利得符号ビット数が多くなるほど、第4サブフレームのVQ利得符号に対応する符号に割り当てられる符号長は長くなり、第4サブフレームの符号化品質が向上する。このような符号長の割当ては、現フレームで割当てが決定されていないビットのうちできるだけ多くのビットが、ピッチ周期の小数部に対応する符号、第4サブフレームのコードインデックスCf4、及び第4サブフレームのVQ利得符号に対応する符号に割り当てられるように行われる。好ましくは、現フレームで割当てが決定されていないすべてのビットが、ピッチ周期の小数部に対応する符号、第4サブフレームのコードインデックスCf4、及び第4サブフレームのVQ利得符号に対応する符号に割り当てられるように行われる。このような符号長の割当ては、予め定められた規則に従って行われる。
 ビット割当て部611で決定された第1-第4サブフレームのピッチ周期T1,T2,T3,T4の小数部の精度を表す情報は、パラメータ符号化部617に入力される。パラメータ符号化部617は、この情報が表す精度で第1-第4サブフレームのピッチ周期T1,T2,T3,T4の小数部を符号化し、ピッチ周期T1,T2,T3,T4の小数部に対応する符号を生成する。
 ビット割当て部611で決定された第4サブフレームに対する単位パルスの数を表す情報は探索部613(図4)に入力される。探索部613は、現フレームに属する第4サブフレームに対する分析によって、この情報が表す数の単位パルスとその正負との組み合わせからなる第4サブフレームの信号成分c(n)を決定(単位パルスの位置とその正負との組み合わせを決定)してそれを表すコードインデックスCf4を特定し、ピッチ利得gp4及び固定符号帳利得gc4を得る。この分析は、先に求めた第4サブフレームのピッチ周期T4が固定されて行われる以外、従来と同様な方法で行われる。
 ビット割当て部611で決定された第4サブフレームに対するVQ利得符号ビット数を表す情報、探索部613で得られたピッチ利得gp4及び固定符号帳利得gc4は、パラメータ符号化部617(図5)の利得量子化部617aに入力される。利得量子化部617aは、VQ利得符号ビット数を表す情報が表すビット数でピッチ利得gp4及び固定符号帳利得gc4をベクトル量子化し、当該VQ利得符号ビット数の第4サブフレームに対するVQ利得符号を得、第4サブフレームのVQ利得符号に対応する符号(例えば、これらのVQ利得符号が圧縮符号化された符号)を出力する。
 現フレームの線形予測情報LPC info、コードインデックスCf=Cf1,Cf2,Cf3,Cf4、第1-第4サブフレームのピッチ周期T1,T2,T3,T4(整数部及び小数部)に対応する符号CT、及び第1-第4サブフレームのVQ利得符号に対応する符号は、合成部117gに入力される。合成部117gはこれらを予め定められた順序で合成し、1フレームあたりの符号長が固定されたビットストリームBSを生成して出力する。なお、合成部117gに入力された情報の1フレームあたりの合計符号長が1フレームあたりの固定符号長未満となる場合には、補助ビットその他のビットがビットストリームBSに追加されてもよい。
 <復号方法>
 ビットストリームBSは、復号装置62のパラメータ復号部627(図6)に入力される。パラメータ復号部627は、まず、ビットストリームBSから線形予測情報LPC infoと、第1-第3サブフレームのコードインデックスCf1,Cf2,Cf3と、第1-第4サブフレームのピッチ周期T1,T2,T3,T4の整数部に対応する符号と、第1-第3サブフレームのVQ利得符号に対応する符号とを得る。パラメータ復号部627はそれらの符号長の合計値から、ビット割当て部611で決定された符号長の割当てが特定でき、ビットストリームBSから第1-第4サブフレームのピッチ周期T1,T2,T3,T4の小数部に対応する符号と、第4サブフレームのコードインデックスCf4と、第4サブフレームのVQ利得符号に対応する符号とを得ることができる。さらにパラメータ復号部627は、第1-第4サブフレームのVQ利得符号に対応する符号から量子化されたピッチ利得gp'=gp1',gp2',gp3',gp4'と量子化された固定符号帳利得gc'=gc1',gc2',gc3',gc4'を得る。その後の処理は、第1-第5の実施形態と同様である。
 〔第6実施形態の変形例1〕
 第6実施形態の変形として、探索部613が従来と同様に第2-第4サブフレームのピッチ周期T2,T3,T4(整数部及び小数部)を求める代わりに、探索部613’(図4)が、現サブフレームのピッチ周期(整数部及び小数部)を当該現サブフレームよりも過去のサブフレームのVQ利得符号に応じた探索方法で探索し、第2-第4サブフレームのピッチ周期T2,T3,T4(整数部及び小数部)を求めてもよい。例えば、探索部613’が、第1サブフレームのVQ利得符号に応じた探索方法で第2サブフレームのピッチ周期T2(整数部及び小数部)を探索し、第1,2サブフレームのVQ利得符号に応じた探索方法で第3サブフレームのピッチ周期T2(整数部及び小数部)を探索し、第1-3サブフレームのVQ利得符号に応じた探索方法で第4サブフレームのピッチ周期T2(整数部及び小数部)を探索してもよい。具体的には、例えば探索部613’は、過去のサブフレームのVQ利得符号を[ステップS112の具体例3]の判断基準1や判断基準2に適用して現サブフレームの時系列信号が定常的(周期的)であるかを判断し、その結果に応じて現サブフレームでのピッチ周期の探索範囲を変更する。例えば探索部613’は、非定常的(非周期的)であると判断された場合は適応信号成分の貢献が少ないので、定常的(周期的)であると判定された場合よりもピッチ周期の探索範囲を狭くしたり、ピッチ周期の小数部の探索精度を低くしたりする。或いは、例えば、定常的(周期的)であると判定された場合にはピッチ周期の整数部及び小数部を探索するが、非定常的(非周期的)であると判断された場合にはピッチ周期の整数部のみを探索し、小数部は探索しない。
 〔第6実施形態の変形例2〕
 第6実施形態の変形として、ビット割当て部611’が過去の過去のサブフレームのVQ利得符号に応じ、第2及び第3サブフレームのピッチ周期の小数部の精度を定めてもよい。例えば、ビット割当て部611’は、第1-第5実施形態や従来技術と同様に、第1サブフレームのピッチ周期T1の小数部の精度を定め、第1サブフレームのVQ利得符号に応じて第2サブフレームのピッチ周期T2の小数部の精度を定め、第1,2サブフレームのVQ利得符号に応じて第3サブフレームのピッチ周期T3の小数部の精度を定める。具体的には、例えばビット割当て部611’は、過去のサブフレームのVQ利得符号を[ステップS112の具体例3]の判断基準1や判断基準2に適用して現サブフレームの時系列信号が定常的(周期的)であるかを判断し、その結果に応じて第2及び第3サブフレームでのピッチ周期の小数部の精度を定める。具体的には、例えばビット割当て部611’は、非定常的(非周期的)であると判断された場合は適応信号成分の貢献が少ないので、定常的(周期的)であると判定された場合よりもピッチ周期の小数部の精度を下げる。例えば、ビット割当て部611’は、定常的(周期的)であると判定された場合にはピッチ周期の小数部を小数精度で符号化するが、非定常的(非周期的)であると判断された場合には整数精度で符号化する。
 さらにビット割当て部611’は、現フレームの線形予測情報LPC infoの符号長、ピッチ周期T1,T2,T3,T4の各整数部に対応する符号の符号長、ピッチ周期T1,T2,T3の各小数部対応する符号の符号長、コードインデックスCf1,Cf2,Cf3の符号長、及び第1-第3サブフレームのVQ利得符号に対応する符号の符号長などの現フレームでの割当てが決定された符号長と、予め定められた1フレームあたりの固定符号長とを用い、現フレームで割当てが決定されていない符号長の割当てを決定する。例えばビット割当て部611’は、第4サブフレームのピッチ周期T4の小数部の精度、第4サブフレームに対する単位パルスの数、第4サブフレームに対するVQ利得符号ビット数を決定する。この符号長の割当ては、現フレームで割当てが決定されていないビットのうちできるだけ多くのビットが、第4サブフレームのピッチ周期T4の小数部に対応する符号、第4サブフレームのコードインデックスCf4、及び第4サブフレームのVQ利得符号に対応する符号に割り当てられるように行われる。好ましくは、現フレームで割当てが決定されていないすべてのビットが、第4サブフレームのピッチ周期T4の小数部に対応する符号、第4サブフレームのコードインデックスCf4、及び第4サブフレームのVQ利得符号に対応する符号に割り当てられるように行われる。
 〔第6実施形態の変形例3〕
 その他第6実施形態の変形として、ビット割当て部611’’が過去の過去のサブフレームのVQ利得符号に応じて第2及び第3サブフレームのVQ利得符号ビット数を定めてもよい。例えば、ビット割当て部611’’は、第1サブフレームのVQ利得符号ビット数を固定とし、第1サブフレームのVQ利得符号に応じて第2サブフレームのVQ利得符号ビット数を定め、第1,2サブフレームのVQ利得符号に応じて第3サブフレームのVQ利得符号ビット数を定める。具体的には、例えばビット割当て部611’’は、過去のサブフレームのVQ利得符号を[ステップS112の具体例3]の判断基準1や判断基準2に適用して現サブフレームの時系列信号が定常的(周期的)であるかを判断し、その結果に応じて第2及び第3サブフレームでのVQ利得符号ビット数を定める。具体的には、例えばビット割当て部611’’は、非定常的(非周期的)であると判断された場合は適応信号成分の貢献が少ないので、定常的(周期的)であると判定された場合よりもVQ利得符号ビット数を小さくする。
 その後ビット割当て部611’’は、現フレームの線形予測情報LPC infoの符号長、ピッチ周期T1,T2,T3,T4の各整数部に対応する符号の符号長、コードインデックスCf1,Cf2,Cf3の符号長、及び第1-第3サブフレームのVQ利得符号に対応する符号の符号長などの現フレームでの割当てが決定された符号長と、予め定められた1フレームあたりの固定符号長とを用い、第6実施形態と同様に、第4サブフレームのVQ利得符号ビット数など現フレームで割当てが決定されていない符号長の割当てを決定する。
 〔第6実施形態の変形例4〕
 第6実施形態の変形として、現フレームの線形予測情報LPC infoの符号長、ピッチ周期T1,T2,T3,T4の各整数部に対応する符号の符号長、コードインデックスCf1,Cf2,Cf3の符号長、及び第1-第3サブフレームのVQ利得符号に対応する符号の符号長などの現フレームでの割当てが決定された符号長と、予め定められた1フレームあたりの固定符号長とを用い、現フレームで割当てが決定されていない符号長に応じ、第4サブフレームに対するピッチ利得及び固定符号帳利得の更新回数(VQ利得符号の更新回数)が変更されてもよい。例えば、現フレームで割当てが決定されていない符号長が規定値以上となる場合には、第4サブフレームでピッチ利得及び固定符号帳利得が2回更新され、それぞれのピッチ利得の量子化値及び固定符号帳利得の量子化値の組み合わせに対するVQ利得符号が生成されてもよい。
 〔その他の変形例等〕
 本発明は上述の実施の形態に限定されるものではない。例えば、上記の各実施形態において、第2、第4サブフレームのピッチ周期の小数部が固定ビット長で符号化される(例えば図9A及びB参照)代わりに、第2、第4サブフレームのピッチ周期の小数部が、第1、第3サブフレームと同じように、それぞれのピッチ周期の整数部の値に依存する4倍小数精度から整数精度までの何れかの精度で符号化される構成でもよい(例えば、図15A及びB参照)。例えば、ピッチ周期T2の整数部が最小値Tmin以上でTAより小さい場合には、2ビットでピッチ周期T2の小数値が符号化され、ピッチ周期T2の整数部がTAからTBまでの場合には、1ビットでピッチ周期T2の小数値が符号化され、ピッチ周期T2の整数部がTBから最大値Tmaxまでの場合にピッチ周期T2の小数値が符号化されないことにしてもよい(例えば、ピッチ周期T3についても同様)。これにより、ほとんど性能に影響を与えることなく、平均ビット数を削減できる。また、図2A及びB等に示した構成において、第2、第4サブフレームのピッチ周期の小数部が固定ビット長で符号化される代わりに、第2、第4サブフレームのピッチ周期の小数部が、第1、第3サブフレームと同じように、それぞれのピッチ周期の整数部の値に依存する4倍小数精度から整数精度までの何れかの精度で符号化される構成でもよい。
 また、上記の各実施形態における差分値TD(α,β)は、(ピッチ周期Tαの整数部)-(ピッチ周期Tβの整数部)または(ピッチ周期Tβの整数部)-(ピッチ周期Tαの整数部)であった。しかし、図16Aのようにピッチ周期の整数部と小数部がそれぞれ固定ビット長で表現されている場合は、差分値TD(α,β)の代わりに、ピッチ周期の上位部の差分値TD'(α,β)〔(ピッチ周期Tαの上位部)-(ピッチ周期Tβの上位部)または(ピッチ周期Tβの上位部)-(ピッチ周期Tαの上位部)〕が用いられてもよい。なお、ピッチ周期の上位部とは、固定ビット長で表現されたピッチ周期の固定上位ビットの値であり、ピッチ周期の下位部とは、当該ピッチ周期の残りの固定下位ビットである。また、ピッチ周期の上位部は、ピッチ周期の整数部の全ビットと小数部が含む一部のビット(例えば、小数部の固定上位ビットや固定下位ビット)とからなるビットであってもよいし(例えば、図16B参照)、周期の整数部が含む一部のビット(例えば、整数部の固定上位ビットや固定下位ビット)であってもよい(例えば、図16C参照)。なお、ピッチ周期の整数部の差分値TD(α,β)の代わりに、ピッチ周期の上位部の差分値TD'(α,β)が用いられる場合、各ピッチ周期の下位部は、例えば、そのまま数値が符号化される。図9A及びBの構成において、ピッチ周期の整数部の差分値TD(α,β)の代わりに、ピッチ周期の上位部の差分値TD'(α,β)が用いられた場合、ピッチ周期の符号の構成は、例えば、図17A及びBのようになる。
 また、図9A及びBなどのように、ピッチ周期の整数部の差分値TD(1,2)および差分値TD(3,4)の値に応じて、差分値TD(1,2)および差分値TD(3,4)を統合した値を可変長符号化する代わりに、ピッチ周期の整数部の差分値TD(4',1)および差分値TD(2,3)の値に応じて、差分値TD(4',1)および差分値TD(2,3)を統合した値を可変長符号化してもよい。なお、差分値TD(4',1)は、現フレームの直前のフレームにおける第4フレームのピッチ周期の整数部と、現フレームの第1フレームのピッチ周期の整数部との差分値である。また、この場合に、ピッチ周期の整数部の差分値TD(α,β)の代わりに、ピッチ周期の上位部の差分値TD'(α,β)が用いられてもよい。
 探索部でピッチ利得や固定符号帳利得を求めてから量子化されたピッチ利得に対応する値や量子化された固定符号帳利得に対応する値を求めるのではなく、探索部で直接、量子化されたピッチ利得に対応する値や量子化された固定符号帳利得に対応する値を求めてもよい。
 さらにここまでは周期性および/または定常性が高いことを表す条件を満たすか否かの2種類の判断に基づく処理を説明したが、周期性および/または定常性の程度を3種以上に分類し、その分類に応じてピッチ周期を表現するための精度および/またはピッチ周期の符号化方式を切り替えることに拡張することも可能である。
 また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
 また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
 11,21,31,41,51 符号化装置
 12,22,32,42,52 復号装置
 117,217,317,417,517 パラメータ符号化部
 127,227,327,427,527 パラメータ復号部

Claims (32)

  1.  (A) 所定時間区間に含まれる時系列信号に対応するピッチ周期を得るステップと、
     (B) 前記ピッチ周期に対応する符号を出力するステップと、を有し、
     前記時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、前記ピッチ周期を表現するための精度および/または前記ピッチ周期の符号化方式が切り替えられる、符号化方法。
  2.  請求項1の符号化方法であって、
     前記ステップ(B)は、
     前記指標が前記周期性および/または定常性が高いことを表す条件を満たさない場合に、第1精度で表現された前記ピッチ周期を符号化して得られた符号を第1時間区間ごとに出力し、
     前記指標が前記周期性および/または定常性が高いことを表す条件を満たす場合に、第2精度で表現された前記ピッチ周期を符号化して得られた符号を第2時間区間ごとに出力する、ステップを含み、
     前記第2精度は前記第1精度よりも高い、および/または、前記第2時間区間は前記第1時間区間よりも短い。
  3.  請求項1の符号化方法であって、
     前記ステップ(B)は、前記指標が前記周期性および/または定常性が高いことを表す条件を満たす場合に、前記所定時間区間に含まれる第1所定時間区間のピッチ周期を符号化し、前記所定時間区間に含まれる前記第1所定時間区間以外の第2所定時間区間のピッチ周期に対応する値と当該第2所定時間区間以外の時間区間のピッチ周期に対応する値との差分値を可変長符号化して得られる、前記ピッチ周期に対応する符号を出力する、ステップを含む。
  4.  請求項1の符号化方法であって、
     前記ステップ(B)は、前記指標が前記周期性および/または定常性が高いことを表す条件を満たす場合に、前記所定時間区間に含まれる第1所定時間区間のピッチ周期を符号化し、前記所定時間区間に含まれる前記第1所定時間区間以外の複数の第2所定時間区間の各ピッチ周期に対応する値と当該第2所定時間区間以外の時間区間の各ピッチ周期に対応する値との各差分値を統合した情報を可変長符号化して得られる、前記ピッチ周期に対応する符号を出力する、ステップを含む。
  5.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得を得るステップを含み、
     前記指標は、前記量子化済ピッチ利得またはこれに対応する値を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記量子化済ピッチ利得またはこれに対応する値が規定値より大きいという条件を含む。
  6.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得またはこれに対応する値と前記時系列信号に対応する量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を得るステップを含み、
     前記指標は、前記ベクトル量子化済利得符号を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記ベクトル量子化済利得符号が、量子化済ピッチ利得またはこれに対応する値が規定値より大きくなる量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応するという条件を含む。
  7.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得と量子化済固定符号帳利得を得るステップを含み、
     前記指標は、前記量子化済ピッチ利得またはこれに対応する値と、前記量子化済固定符号帳利得またはこれに対応する値を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記量子化済固定符号帳利得またはこれに対応する値に対する、前記量子化済ピッチ利得またはこれに対応する値、の比が規定値以上であることを示す条件を含む。
  8.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得またはこれに対応する値と前記時系列信号に対応する量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を得るステップを含み、
     前記指標は、前記ベクトル量子化済利得符号を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記ベクトル量子化済利得符号が、前記量子化済固定符号帳利得またはこれに対応する値に対する、量子化済ピッチ利得またはこれに対応する値、の比が規定値以上となる、量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応するという条件を含む。
  9.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得と量子化済固定符号帳利得を得るステップを含み、
     前記指標は、前記量子化済ピッチ利得またはこれに対応する値と、前記量子化済固定符号帳利得またはこれに対応する値を含み、
     前記周期性および/または定常性が低いことを表す条件は、前記量子化済ピッチ利得またはこれに対応する値が第1規定値より小さく、かつ、前記量子化済固定符号帳利得またはこれに対応する値が第2規定値より小さい、ことを示す条件を含む。
  10.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得またはこれに対応する値と前記時系列信号に対応する量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を得るステップを含み、
     前記指標は、前記ベクトル量子化済利得符号を含み、
     前記周期性および/または定常性が低いことを表す条件は、前記ベクトル量子化済利得符号に対応する前記量子化済ピッチ利得またはこれに対応する値が第1規定値より小さく、かつ、前記ベクトル量子化済利得符号に対応する前記量子化済固定符号帳利得またはこれに対応する値が第2規定値より小さい、という条件を含む。
  11.  請求項1から4の何れかの符号化方法であって、
     前記ステップ(A)は、さらに、前記時系列信号に対応する量子化済ピッチ利得またはこれに対応する値と前記時系列信号に対応する量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を得るステップを含み、
     前記指標は、前記ベクトル量子化済利得符号を含み、
     各ベクトル量子化済利得符号とピッチ周期を表現するための精度および/またはピッチ周期の符号化方式とが対応付けられたテーブルが参照され、前記ベクトル量子化済利得符号に基づいて、前記符号化方式が切り替えられる。
  12.  請求項1から4の何れかの符号化方法であって、
     前記指標は、前記時系列信号を線形予測分析して得られる予測残差の大きさに対する当該時系列信号の大きさの比を表す指標を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記時系列信号を線形予測分析して得られる予測残差の大きさに対する当該時系列信号の大きさの比を表す指標が、規定値より大きいという条件を含む。
  13.  請求項1から4の何れかの符号化方法であって、
     前記指標は、前記所定時間区間に含まれる何れかの時間区間のピッチ周期に対応する値と前記所定時間区間に含まれる当該時間区間より過去の時間区間のピッチ周期に対応する値との差分値の大きさを含み、
     前記周期性および/または定常性が高いことを表す条件は、前記所定時間区間に含まれる何れかの時間区間のピッチ周期に対応する値と前記所定時間区間に含まれる当該時間区間より過去の時間区間のピッチ周期に対応する値との差分値の大きさが、規定値より小さいという条件を含む。
  14.  所定時間区間に対応する符号が入力され、前記符号に含まれるまたは前記符号から得られる周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、前記符号に含まれるピッチ周期に対応する符号の復号方式を切り替えて、前記ピッチ周期に対応する符号を復号して前記所定時間区間に対応するピッチ周期を得る、復号方法。
  15.  請求項14の復号方法であって、
     前記指標が前記周期性および/または定常性が高いことを表す条件を満たさない場合に、第1精度で表現された前記ピッチ周期を第1時間区間ごとに得る復号方式で前記ピッチ周期に対応する符号を復号し、
     前記指標が前記周期性および/または定常性が高いことを表す条件を満たす場合に、第2精度で表現された前記ピッチ周期を第2時間区間ごと得る復号方式で前記ピッチ周期に対応する符号を復号し、
     前記第2精度は前記第1精度よりも高い、および/または、前記第2時間区間は前記第1時間区間よりも短い。
  16.  請求項14の復号方法であって、
     前記指標が前記周期性および/または定常性が高いことを表す条件を満たす場合に、前記所定時間区間に含まれる第1所定時間区間については、前記符号に含まれる前記第1所定時間区間のピッチ周期に対応する符号を復号して前記第1所定時間区間のピッチ周期を得て、前記所定時間区間に含まれる前記第1所定時間区間以外の区間である第2所定時間区間については、前記符号に含まれる第2所定時間区間のピッチ周期に対応する値と当該第2所定時間区間以外の時間区間のピッチ周期に対応する値との差分値に対応する前記符号を復号して前記差分値を得て、前記差分値と前記第2所定時間区間以外の時間区間のピッチ周期に対応する値とを用いて前記第2所定時間区間のピッチ周期を得る。
  17.  請求項14の復号方法であって、
     前記指標が前記周期性および/または定常性が高いことを表す条件を満たす場合に、前記所定時間区間に含まれる第1所定時間区間については、前記符号に含まれる前記第1所定時間区間のピッチ周期に対応する符号を復号して前記第1所定時間区間のピッチ周期を得て、
     前記所定時間区間に含まれる前記第1所定時間区間以外の複数の区間である第2所定時間区間については、前記符号に含まれる各第2所定時間区間の各ピッチ周期に対応する値と当該第2所定時間区間以外の各時間区間の各ピッチ周期に対応する値との各差分値を統合した情報に対応する前記符号を復号して各差分値を得て、各差分値と前記第2所定時間区間以外の各時間区間のピッチ周期に対応する値とを用いて前記第2所定時間区間の各ピッチ周期を得る。
  18.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記量子化済ピッチ利得またはこれに対応する値が規定値より大きいという条件を含む。
  19.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記ベクトル量子化済利得符号が、量子化済ピッチ利得またはこれに対応する値が規定値より大きくなる量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応するという条件を含む。
  20.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値と、量子化済固定符号帳利得またはこれに対応する値を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記量子化済固定符号帳利得またはこれに対応する値に対する、前記量子化済ピッチ利得またはこれに対応する値、の比が規定値以上であることを示す条件を含む。
  21.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記ベクトル量子化済利得符号が、前記量子化済固定符号帳利得またはこれに対応する値に対する、量子化済ピッチ利得またはこれに対応する値、の比が規定値以上となる、量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応するという条件を含む。
  22.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値と、量子化済固定符号帳利得またはこれに対応する値を含み、
     前記周期性および/または定常性が低いことを表す条件は、前記量子化済ピッチ利得またはこれに対応する値が第1規定値より小さく、かつ、前記量子化済固定符号帳利得またはこれに対応する値が第2規定値より小さい、ことを示す条件を含む。
  23.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を含み、
     前記周期性および/または定常性が低いことを表す条件は、前記ベクトル量子化済利得符号に対応する前記量子化済ピッチ利得またはこれに対応する値が第1規定値より小さく、かつ、前記ベクトル量子化済利得符号に対応する前記量子化済固定符号帳利得またはこれに対応する値が第2規定値より小さい、という条件を含む。
  24.  請求項14から17の何れかの復号方法であって、
     前記指標は、量子化済ピッチ利得またはこれに対応する値と量子化済固定符号帳利得またはこれに対応する値との組み合わせに対応する符号であるベクトル量子化済利得符号を含み、
     各ベクトル量子化済利得符号とピッチ周期を表現するための精度および/またはピッチ周期の復号方式とが対応付けられたテーブルが参照され、前記ベクトル量子化済利得符号に基づいて、前記復号方式が切り替えられる。
  25.  請求項14から17の何れかの復号方法であって、
     前記指標は、前記符号から得られる線形予測係数またはこれに対応する係数を用いて算出される予測利得の推定値を含み、
     前記周期性および/または定常性が高いことを表す条件は、前記予測利得の推定値が、規定値より大きいという条件を含む。
  26.  請求項14から17の何れかの復号方法であって、
     前記指標は、前記所定時間区間に含まれる何れかの時間区間のピッチ周期に対応する値と前記所定時間区間に含まれる当該時間区間より過去の時間区間のピッチ周期に対応する値との差分値の大きさを含み、
     前記周期性および/または定常性が高いことを表す条件は、前記所定時間区間に含まれる何れかの時間区間のピッチ周期に対応する値と前記所定時間区間に含まれる当該時間区間より過去の時間区間のピッチ周期に対応する値との差分値の大きさが、規定値より小さいという条件を含む。
  27.  所定時間区間に含まれる時系列信号に対応するピッチ周期を得る探索部と、
     前記ピッチ周期に対応する符号を出力するパラメータ符号化部と、を有し、
     前記時系列信号の周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、前記ピッチ周期を表現するための精度および/または前記ピッチ周期の符号化方式が切り替えられる、符号化装置。
  28.  所定時間区間に対応する符号が入力され、前記符号に含まれるまたは前記符号から得られる周期性および/または定常性の高さを表す指標が、周期性および/または定常性が高いことを表す条件、または、周期性および/または定常性が低いことを表す条件を満たすか否かに応じ、前記符号に含まれるピッチ周期に対応する符号の復号方式を切り替えて、前記ピッチ周期に対応する符号を復号して前記所定時間区間に対応するピッチ周期を得る、復号装置。
  29.  請求項1の符号化方法の処理をコンピュータに実行させるためのプログラム。
  30.  請求項14の復号方法の処理をコンピュータに実行させるためのプログラム。
  31.  請求項1の符号化方法の処理をコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
  32.  請求項14の復号方法の処理をコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
PCT/JP2011/050186 2010-01-08 2011-01-07 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 WO2011083849A1 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
RU2012127132/08A RU2510974C2 (ru) 2010-01-08 2011-01-07 Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
EP11731847.7A EP2523189B1 (en) 2010-01-08 2011-01-07 Encoding method, decoding method, encoder apparatus, decoder apparatus, program and recording medium
IN5235DEN2012 IN2012DN05235A (ja) 2010-01-08 2011-01-07
US13/518,525 US9812141B2 (en) 2010-01-08 2011-01-07 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
KR1020127016570A KR101381272B1 (ko) 2010-01-08 2011-01-07 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
JP2011549035A JP5314771B2 (ja) 2010-01-08 2011-01-07 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
CN201180005221.2A CN102687199B (zh) 2010-01-08 2011-01-07 编码方法、解码方法、编码装置、解码装置
ES11731847.7T ES2508590T3 (es) 2010-01-08 2011-01-07 Método de codificación, método de decodificación, aparato codificador, aparato decodificador, programa y medio de grabación
US15/725,626 US10049679B2 (en) 2010-01-08 2017-10-05 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US15/725,682 US10056088B2 (en) 2010-01-08 2017-10-05 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US15/725,653 US10049680B2 (en) 2010-01-08 2017-10-05 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010002494 2010-01-08
JP2010-002494 2010-01-08

Related Child Applications (4)

Application Number Title Priority Date Filing Date
US13/518,525 A-371-Of-International US9812141B2 (en) 2010-01-08 2011-01-07 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US15/725,653 Continuation US10049680B2 (en) 2010-01-08 2017-10-05 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US15/725,682 Continuation US10056088B2 (en) 2010-01-08 2017-10-05 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US15/725,626 Continuation US10049679B2 (en) 2010-01-08 2017-10-05 Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals

Publications (1)

Publication Number Publication Date
WO2011083849A1 true WO2011083849A1 (ja) 2011-07-14

Family

ID=44305585

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/050186 WO2011083849A1 (ja) 2010-01-08 2011-01-07 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体

Country Status (9)

Country Link
US (4) US9812141B2 (ja)
EP (1) EP2523189B1 (ja)
JP (3) JP5314771B2 (ja)
KR (1) KR101381272B1 (ja)
CN (2) CN105374362B (ja)
ES (1) ES2508590T3 (ja)
IN (1) IN2012DN05235A (ja)
RU (1) RU2510974C2 (ja)
WO (1) WO2011083849A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014007349A1 (ja) * 2012-07-05 2014-01-09 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JPWO2013129439A1 (ja) * 2012-02-28 2015-07-30 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
JP2017227904A (ja) * 2014-03-24 2017-12-28 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP2021530723A (ja) * 2018-07-02 2021-11-11 ドルビー ラボラトリーズ ライセンシング コーポレイション 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105374362B (zh) 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
JP5613781B2 (ja) * 2011-02-16 2014-10-29 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
EP2696343B1 (en) 2011-04-05 2016-12-21 Nippon Telegraph And Telephone Corporation Encoding an acoustic signal
EP3301677B1 (en) * 2011-12-21 2019-08-28 Huawei Technologies Co., Ltd. Very short pitch detection and coding
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
KR101837153B1 (ko) * 2014-05-01 2018-03-09 니폰 덴신 덴와 가부시끼가이샤 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
JP6517924B2 (ja) * 2015-04-13 2019-05-22 日本電信電話株式会社 線形予測符号化装置、方法、プログラム及び記録媒体
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR102236682B1 (ko) * 2017-03-28 2021-04-06 가부시키가이샤 고베 세이코쇼 타이어 시험 방법 및 타이어 시험 장치
US11164621B2 (en) 2017-08-24 2021-11-02 Semiconductor Energy Laboratory Co., Ltd. Sense amplifier, semiconductor device, operation method thereof, and electronic device
WO2019107041A1 (ja) * 2017-12-01 2019-06-06 日本電信電話株式会社 ピッチ強調装置、その方法、およびプログラム
CN109309548B (zh) * 2018-05-11 2020-01-03 深圳市华星光电技术有限公司 编码方法、设备及可读存储介质
JP7311319B2 (ja) * 2019-06-19 2023-07-19 ファナック株式会社 時系列データ表示装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05289697A (ja) * 1992-04-09 1993-11-05 Nippon Telegr & Teleph Corp <Ntt> 音声のピッチ周期符号化法
JPH11184500A (ja) * 1997-12-24 1999-07-09 Fujitsu Ltd 音声符号化方式及び音声復号化方式
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3566035A (en) * 1969-07-17 1971-02-23 Bell Telephone Labor Inc Real time cepstrum analyzer
JPS6323200A (ja) * 1987-06-29 1988-01-30 日本電気株式会社 ピッチ抽出装置
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
JP3353852B2 (ja) * 1994-02-15 2002-12-03 日本電信電話株式会社 音声の符号化方法
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
JP3435310B2 (ja) * 1997-06-12 2003-08-11 株式会社東芝 音声符号化方法および装置
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US6493664B1 (en) * 1999-04-05 2002-12-10 Hughes Electronics Corporation Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6760698B2 (en) * 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
US7478042B2 (en) * 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
JP4622164B2 (ja) * 2001-06-15 2011-02-02 ソニー株式会社 音響信号符号化方法及び装置
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
GB2391440B (en) * 2002-07-31 2005-02-16 Motorola Inc Speech communication unit and method for error mitigation of speech frames
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US7146309B1 (en) * 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
US8024187B2 (en) * 2005-02-10 2011-09-20 Panasonic Corporation Pulse allocating method in voice coding
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US20070217579A1 (en) * 2006-03-20 2007-09-20 Arun Sobti System and method for enhanced voice mail
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
RU2462769C2 (ru) * 2006-10-24 2012-09-27 Войсэйдж Корпорейшн Способ и устройство кодирования кадров перехода в речевых сигналах
CN101197576A (zh) * 2006-12-07 2008-06-11 上海杰得微电子有限公司 一种音频信号编码、解码方法
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
US8718804B2 (en) * 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
EP2335522B1 (en) 2009-12-18 2012-02-29 Borghi S.P.A. Tufting tool for an apparatus for producing brushes or brooms
CN105374362B (zh) * 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
JP5613781B2 (ja) * 2011-02-16 2014-10-29 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05289697A (ja) * 1992-04-09 1993-11-05 Nippon Telegr & Teleph Corp <Ntt> 音声のピッチ周期符号化法
JPH11184500A (ja) * 1997-12-24 1999-07-09 Fujitsu Ltd 音声符号化方式及び音声復号化方式
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2523189A4 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013129439A1 (ja) * 2012-02-28 2015-07-30 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
WO2014007349A1 (ja) * 2012-07-05 2014-01-09 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
JP5762636B2 (ja) * 2012-07-05 2015-08-12 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP5893153B2 (ja) * 2012-10-01 2016-03-23 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP2017227904A (ja) * 2014-03-24 2017-12-28 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
JP2021530723A (ja) * 2018-07-02 2021-11-11 ドルビー ラボラトリーズ ライセンシング コーポレイション 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置

Also Published As

Publication number Publication date
US20180040330A1 (en) 2018-02-08
EP2523189B1 (en) 2014-09-03
US20180040329A1 (en) 2018-02-08
US20120265525A1 (en) 2012-10-18
US20180047402A1 (en) 2018-02-15
JPWO2011083849A1 (ja) 2013-05-16
RU2510974C2 (ru) 2014-04-10
IN2012DN05235A (ja) 2015-10-23
US10049680B2 (en) 2018-08-14
CN105374362A (zh) 2016-03-02
US10049679B2 (en) 2018-08-14
EP2523189A1 (en) 2012-11-14
US9812141B2 (en) 2017-11-07
JP2013156649A (ja) 2013-08-15
CN102687199B (zh) 2015-11-25
EP2523189A4 (en) 2013-08-14
KR101381272B1 (ko) 2014-04-07
US10056088B2 (en) 2018-08-21
RU2012127132A (ru) 2014-02-27
KR20120089349A (ko) 2012-08-09
JP5442887B2 (ja) 2014-03-12
ES2508590T3 (es) 2014-10-16
JP5627144B2 (ja) 2014-11-19
JP5314771B2 (ja) 2013-10-16
CN102687199A (zh) 2012-09-19
JP2013137574A (ja) 2013-07-11
CN105374362B (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
JP5627144B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
JP5085543B2 (ja) 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用
JP5613781B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
KR20160144978A (ko) 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
JP2019032551A (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP2020204771A (ja) 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム
JP5923517B2 (ja) 階層型符号器における改良ステージの改良符号化
JP5395649B2 (ja) 符号化方法、復号方法、符号化装置、復号装置及びプログラム
JP5320508B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
WO2013129439A1 (ja) 符号化装置、この方法、プログラム及び記録媒体
JPWO2014007349A1 (ja) 符号化装置、復号装置、これらの方法、プログラム、および記録媒体

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180005221.2

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11731847

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011549035

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 5235/DELNP/2012

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 13518525

Country of ref document: US

ENP Entry into the national phase

Ref document number: 20127016570

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2011731847

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2012127132

Country of ref document: RU