WO2019142514A1 - 復号装置、符号化装置、これらの方法及びプログラム - Google Patents

復号装置、符号化装置、これらの方法及びプログラム Download PDF

Info

Publication number
WO2019142514A1
WO2019142514A1 PCT/JP2018/044335 JP2018044335W WO2019142514A1 WO 2019142514 A1 WO2019142514 A1 WO 2019142514A1 JP 2018044335 W JP2018044335 W JP 2018044335W WO 2019142514 A1 WO2019142514 A1 WO 2019142514A1
Authority
WO
WIPO (PCT)
Prior art keywords
frequency
unit
band
frequency spectrum
sound
Prior art date
Application number
PCT/JP2018/044335
Other languages
English (en)
French (fr)
Inventor
亮介 杉浦
優 鎌本
守谷 健弘
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to CN201880086667.4A priority Critical patent/CN111602197B/zh
Priority to US16/962,060 priority patent/US11430464B2/en
Priority to CN202311162391.2A priority patent/CN117351969A/zh
Priority to JP2019565744A priority patent/JP6962386B2/ja
Priority to EP22179964.6A priority patent/EP4095855B1/en
Priority to PCT/JP2018/044335 priority patent/WO2019142514A1/ja
Priority to EP18900764.4A priority patent/EP3742443B1/en
Publication of WO2019142514A1 publication Critical patent/WO2019142514A1/ja
Priority to US17/856,221 priority patent/US11715484B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Definitions

  • the present invention relates to a technology for encoding or decoding a sample sequence derived from the frequency spectrum of a sound signal in signal processing technology such as a coding technology for sound signal.
  • the sound signal is represented by a frequency spectrum sequence, and bit allocation is performed in consideration of audio importance for the frequency spectrum sequence and encoding is performed. Is conventionally performed. Bit allocation in consideration of auditory importance is performed by, for example, allocating bits in preference to samples corresponding to low frequencies in a frequency spectrum sequence. As a result, a configuration is adopted in which no bit is allocated to samples corresponding to high frequencies in the frequency spectrum string, and direct information on sample strings corresponding to high frequencies is not coded at all by the coding device. There is.
  • the sample value corresponding to the high frequency in the frequency spectrum sequence is set to 0 to obtain the decoded sound, so the band extending technique as described in Non-Patent Document 1 That is, a technique may be used in which a decoding device adjusts the amplitude of a sample string corresponding to a low frequency and outputs the result as a decoding result of a sample string corresponding to a high frequency. This is based on the fact that when a person listens to a sound, the sensitivity to high frequencies is low, and if the low frequency overtones are heard, there is no discomfort. By assigning the number of bits saved in the high frequency band to the low frequency band, it is possible to accurately represent information more important to human auditory characteristics. As described above, the coding method of the sound signal is often designed so as to allocate more bits to the low frequency spectrum.
  • Non-Patent Document 1 it is possible to obtain a band extension sound with less deterioration in auditory quality from the decoded sound obtained by the decoding device for many sounds in natural sound.
  • natural sounds such as friction noise in human speech
  • energy is concentrated at high frequencies, and there is also a sound that has little energy at low frequencies, and such sounds
  • the main frequency components of the sound from the decoding device are greatly distorted especially under the condition of low bit rate If a decoded sound is obtained, and a band expanded sound is obtained from the decoded sound by the band expansion technology of Non-Patent Document 1, there is a problem that the band expanded sound is aurally degraded.
  • an encoding apparatus for performing compression encoding on the encoding side on the premise of band extension on the decoding side so that sound signals such as frictional noise are also less audibly degraded It is an object of the present invention to provide a decoding device that performs decoding with band extension, and methods and programs thereof.
  • a decoding apparatus decodes a frame-based spectrum code in a predetermined time interval, and a spectrum code in which a bit is not allocated to a part on the high frequency side, to obtain a sample sequence in the frequency domain.
  • a decoding device is a decoding device that decodes a frame-based spectrum code of a predetermined time interval to obtain a frequency spectrum sequence of a decoded sound signal, and is an input frictional sound or not If the information representing the sound indicates that it is a frictional sound, it is assumed that no bit is assigned to a part of the lower band side of the spectrum code, and the spectrum code is decoded to obtain a spectrum sequence in the frequency domain.
  • An encoding apparatus encodes a spectrum sample by encoding a sample sequence of a frequency corresponding to a sound signal of a frame unit in a predetermined time interval by an encoding process in which bits are not allocated to a part of high frequency side.
  • An encoding device including an encoding unit to be obtained, wherein the friction sound determination unit that determines whether the sound signal is a friction sound and the friction sound determination unit determine that the sound is a friction sound; All or a part of the lower frequency spectrum series lower than the predetermined frequency of the frequency spectrum series of the sound signal, and the higher frequency than the predetermined frequency of the same number of frequency spectrum series; An adjusted frequency spectrum series obtained by replacing all or a part of the high-frequency side frequency spectrum series on the side is obtained as an adjusted frequency spectrum series, and in the other cases, a frequency spectrum series corresponding to the sound signal And the encoding unit obtains the spectral code by encoding the adjusted frequency spectrum sequence obtained by the friction sound adjustment unit as a sample sequence of the frequency corresponding to the sound signal.
  • a plurality of codes and gain candidate vectors corresponding to the respective codes are stored, and each of the gain candidate vectors includes K (K is an integer of 2 or more) gain candidate values, K values of K values obtained by multiplying K adjusted frequency spectra to which bits are allocated by the encoding unit in the adjusted frequency spectrum sequence and K gain candidate values included in the gain candidate vector.
  • K is an integer of 2 or more
  • the error between the absolute value series and the absolute value series of the K adjusted frequency spectrums to which the encoding unit of the adjusted frequency spectrum series does not allocate a bit is minimal Further comprising a band extension gain coding section for outputting to give the sign as a band extension gain code corresponding to the gain candidate vector that.
  • the encoding device and the decoding device it is possible to perform encoding and decoding such that sound signals such as frictional noise are less aurally degraded.
  • FIG. 1 is a block diagram showing an example of a coding device according to a first embodiment.
  • the flowchart which shows the example of the encoding method of 1st embodiment.
  • FIG. 2 is a block diagram showing an example of a decoding device of the first embodiment.
  • the flowchart which shows the example of the decoding method of 1st embodiment.
  • the figure for demonstrating the example of a frictional noise adjustment process The figure for demonstrating the example of a frictional noise adjustment process.
  • the figure for demonstrating the example of a frictional noise adjustment process The figure for demonstrating the example of a frictional noise adjustment process.
  • FIG. 8 is a block diagram showing an example of a coding device according to a second embodiment.
  • the flowchart which shows the example of the encoding method of 2nd embodiment.
  • FIG. 8 is a block diagram showing an example of a decoding device according to a second embodiment.
  • the flowchart which shows the example of the decoding method of 2nd embodiment.
  • the first embodiment is a premise of the second embodiment which is an embodiment of the present invention.
  • the system of the first embodiment includes an encoding device and a decoding device.
  • the encoding apparatus encodes a sound signal in the time domain input in frame units of a predetermined time length, obtains a code, and outputs the code.
  • the code output from the encoding device is input to the decoding device.
  • the decoding apparatus decodes the input code and outputs a sound signal in the time domain in units of frames.
  • the sound signal input to the encoding device is, for example, a sound signal or an acoustic signal obtained by collecting a sound such as voice or music with a microphone and performing AD conversion.
  • the sound signal output from the decoding device is, for example, DA converted and reproduced by a speaker, thereby enabling listening.
  • the encoding device includes a frequency domain conversion unit 11, a frictional noise determination unit 12, a frictional noise adjustment unit 13, an encoding unit 14, and a multiplexing unit 15.
  • the sound signal in the time domain input to the encoding device is input to the frequency domain transform unit 11.
  • the encoding device performs processing in units of frames of a predetermined time length at each part.
  • the encoding method of the first embodiment is realized by each unit of the encoding apparatus performing the process of steps S11 to S15 illustrated below and in FIG.
  • the sound signal in the frequency domain may be input to the encoding apparatus instead of the sound signal in the time domain.
  • the encoding device may not include the frequency domain conversion unit 11, and a sound signal of a frequency domain in frame units of a predetermined time length may be input to the friction sound determination unit 12 and the friction sound adjustment unit 13. Good.
  • the frequency domain transform unit 11 receives the time domain sound signal input to the encoding device.
  • the frequency domain transform unit 11 converts the input time domain sound signal, for example, by a modified discrete cosine transform (MDCT) in frame units of a predetermined time length by N frequency spectrum sequences X 0 ,. Convert to N-1 and output (step S11).
  • a subscript suffixed to X is a number assigned in order from a low frequency spectrum.
  • various known conversion methods for example, discrete Fourier transform, short-time Fourier transform, etc.
  • MDCT discrete Fourier transform
  • the frequency domain conversion unit 11 outputs the frequency spectrum sequence obtained by the conversion to the friction sound determination unit 12 and the friction sound adjustment unit 13.
  • the frequency domain conversion unit 11 performs filter processing and companding processing for auditory weighting on the frequency spectrum sequence obtained by conversion, and the sequence after filter processing and companding processing is a frequency spectrum sequence X. It may be output as 0 ,..., X N ⁇ 1 .
  • the frequency spectrum series X 0 ,..., X N-1 output from the frequency domain conversion unit 11 is input to the frictional noise determination unit 12.
  • the frictional noise determination unit 12 determines whether or not the sound signal is a frictional noise like noise using the input frequency spectrum series X 0 ,..., X N-1 in frame units, and the determination result is a frictional noise.
  • the determination information is output to the frictional noise adjustment unit 13 and the multiplexing unit 15 (step S12). For example, 1-bit information may be used as the frictional noise determination information.
  • the friction sound determination unit 12 sets a bit "1" as information indicating that the sound is a friction sound and the sound signal of the frame is a friction sound. If it is not a natural sound, a bit "0" may be output as the frictional sound determination information as information indicating that it is not a frictional sound.
  • the frictional noise determination unit 12 may, for example, input the frequency spectrum sequence X 0 ,..., X N- to the average energy of the sample on the low frequency side among the input frequency spectrum sequences X 0 ,. An index that increases as the ratio of the average energy of the samples located on the high frequency side of 1 increases is determined as an index that the frame is a frictional noise.
  • the frictional noise determination unit 12 determines that the determined index sound is a frictional noise when the determined index is greater than or equal to a predetermined threshold value, and otherwise the threshold value is a predetermined threshold value or less. If it is smaller, it is determined that it is not a frictional noise.
  • the large N-1 is smaller than an integer value from 1 and MA, if the MB to greater than N integer smaller than values MA, fricative determining unit 12, for example, the frequency spectrum sequence X 0, ..., of the X N-1 X 0 sample number is less sample MA, ..., and samples in the X MA to the low frequency side, the frequency spectrum sequence X 0, ..., a sample sample number MB of of X N-1 X
  • MB , ..., X N-1 be the samples located on the high band side, and the average value of the sum of absolute values of the values of all or part of the samples of X 0 , ..., X MA
  • the average energy is taken as the average value of the sum of absolute values or the sum of squares of the values of all or part of X MB , ..., X N-1 as the average energy, and the average energy of the high region is low.
  • the value obtained by dividing by the area-side average energy is determined as an index of friction sound.
  • the integer value MA is set so that the low frequency side sample for which the low frequency side average energy is to be calculated by the friction sound determination unit 12 is included in the low frequency side frequency spectrum series in the friction sound adjustment unit 13 described later. It is good to do. That is, the integer value MA used by the frictional noise determination unit 12 is preferably set to a value less than the integral value M of the frictional noise adjustment unit 13 described later. Further, the integer value MB is set so that the high frequency side sample for which the high frequency side average energy is to be calculated by the friction sound determination unit 12 is included in the high frequency side frequency spectrum series in the friction sound adjustment unit 13 described later. It is good to do. That is, it is preferable to set the integer value MB used by the frictional noise determination unit 12 to a value equal to or larger than the integer value M of the frictional noise adjustment unit 13 described later.
  • the frequency of X 0 When the values of some of the samples X 0 ,..., X MA on the low frequency side are used to calculate the above index, the frequency of X 0 ,.
  • the values of one or more samples may be used to calculate the above indicator. That is, it is preferable to set the average value of the sum of absolute values of the values of samples of X 0 ,..., X ⁇ or the average value of the sum of squares as the lower average energy, where ⁇ is a positive integer less than MA.
  • the value of ⁇ may be determined in advance based on prior experiments or the like so that the frequency spectrum can normally be present if X 0 ,..., X ⁇ is a sound other than a frictional sound.
  • X MB the average value of the average value or the square sum of the absolute value sum of the values of samples of X N-1- ⁇ preferably set to the high frequency side average energy.
  • the value of ⁇ may be determined in advance in correspondence with the encoding process performed by the encoding unit 14 designed in advance and the adjustment process performed by the frictional noise adjustment unit 13.
  • X 0 ,..., X 19 in the frequency spectrum sequence are taken as the lower frequency spectrum sequence
  • X 20 ,.., X 31 in the frequency spectrum sequence are taken as the higher frequency spectrum sequence. Be done.
  • fricative determining unit 12 the MA and is for example 19 values of less than 20, as is for example 20 to 20 or more values of MB, X 0, ..., the absolute values of all or a portion of the sample of X 19 the average value of the average value or the sum of squares of Newa a low frequency band average energy, X 20, ..., a high average value of the average value or the square sum of the absolute value sum of all or values of some of the samples of X 31 It may be taken as the regional average energy.
  • fricative determining unit 12 X 20 the average value of the average value or the square sum of the absolute value sum of the values of samples of X 27 if the higher frequency side average energy Good.
  • the sound signal in the time domain may be used to determine whether the sound signal in the frame is a frictional sound. In this determination, for example, the number of zero crossings of the input time domain sound signal is obtained as an index that the frame is a frictional sound, and the obtained index is greater than or equal to a predetermined threshold. Otherwise, that is, if the determined index is less than or equal to a predetermined threshold value, it may be determined as not being a frictional sound.
  • Fricative adjusting unit 13 receives the frequency spectrum series X 0 ,..., X N-1 output from the frequency domain conversion unit 11 and the frictional noise determination information output from the frictional noise determination unit 12.
  • Fricative adjusting unit 13 a frame-by-frame basis, to indicate that fricative determining information entered is fricative sounds are inputted frequency spectrum sequence X 0, ..., it follows for X N-1 adjusted frequency spectrum sequence Y 0 performs adjustment processing of the frequency spectrum, ..., Y N-1 was obtained, and already adjusted the frequency spectrum obtained sequence Y 0, ..., output Y N-1 to the encoding unit 14 and, to indicate that fricative determination information is not fricative sounds, the frequency spectrum sequence X 0, ..., X N- 1 directly adjusted frequency spectrum sequence Y 0, ..., encoding unit as Y N-1 It outputs to 14 (step S13).
  • the frequency spectrum sequence X 0, ..., X 0 sample number of the X N-1 is a sample of less than M, ..., a sample by X M-1 the group was a low-frequency side frequency spectrum code
  • the frequency spectrum sequence X 0, ..., X sample number of N-1 is a sample of more than M X M, ..., the high frequency side of the sample group according to X N-1 when the frequency spectrum sequence
  • adjustment processing fricative adjusting unit 13 performs to indicate that fricative determination information is a fricative sounds, the low-frequency side frequency spectrum sequence X 0, ..., of all or X M-1 and part of the sample, the same number as this, the high-frequency side frequency spectrum sequence X M, ..., X N- 1 of all or part of the sample and, adjusted frequency spectrum sequence Y 0 those interchanged, ..., Y It is a process to obtain as N-1 .
  • Example 1 of Adjustment Process Performed by Friction Sound Adjustment Unit 13 When the frictional noise determination information indicates that the frictional noise determination information is a frictional noise, the frictional noise adjustment unit 13 performs, for example, the following Step 1-1 to Step 1-6 to adjust the frequency spectrum series Y 0 ,. , Y N-1 .
  • the following steps 1-1 to 1-6 are divided into six steps in order to clearly show the operation of the frictional noise adjusting unit 13, but the following steps 1-1 to 1-6 are performed. Dividing and performing is only an example to the last, and the frictional noise adjustment unit 13 performs processing equivalent to Step 1-1 to Step 1-6 in one step by replacing elements of the array or replacing indices. May be
  • Step 1-1 Frequency spectrum sequence X 0, ..., the sample number of sample groups by the sample of less than M low band side frequency spectrum sequence X 0 of X N-1, ..., and X M-1, the frequency spectrum sequence X 0, ..., the sample number of the sample group having the above samples M high frequency side frequency spectrum sequence of the X N-1 X M, ... , and X N-1.
  • Step 1-2 Step 1-1 low band side frequency spectrum sequence X 0 were obtained in, ..., adjusted samples Samples of the C contained in X M-1 (C is a positive integer) to the high frequency side Take out as.
  • Step 1-3 C samples included in the high-frequency spectrum series X M ,..., X N-1 obtained in Step 1-1 are extracted as low-pass adjustment samples.
  • Step 1-4 The low band side extracted from the high frequency band spectrum sequence in Step 1-3 at the sample position where the adjustment target sample to the high frequency side in the low frequency band spectrum sequence was extracted in Step 1-2
  • a low-range adjusted frequency spectrum sequence Y 0 ,..., Y M ⁇ 1 is obtained by arranging samples to be adjusted.
  • Step 1-5 At the sample position where the adjustment target sample to the low band side in the high band side frequency spectrum sequence is taken at Step 1-3, to the high band side taken from the low band side frequency spectrum sequence at Step 1-2 A high-frequency-side adjusted frequency spectrum sequence Y M ,..., Y N ⁇ 1 is obtained by arranging the adjustment target samples of
  • Step 1-6 The low-range adjusted frequency spectrum sequence Y 0 ,..., Y M-1 obtained in Step 1-4 and the high-range adjusted frequency spectrum sequence Y M , obtained in Step 1-5 , Y N ⁇ 1 , to obtain an adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1 .
  • Fricative adjusting unit 13 first frequency spectrum sequence X 0, ..., X 0 of X 31, ..., the X 19 and the low-frequency side frequency spectrum sequence, X 20, ..., the X 31 high band side frequency spectrum Make it a series (Step 1-1).
  • the frictional noise adjustment unit 13 takes out eight samples X 2 ,..., X 9 included in the low frequency side frequency spectrum sequence X 0 ,..., X 19 as samples to be adjusted to the high frequency side (Step 1-2) .
  • the frictional noise adjustment unit 13 takes out eight samples X 20 ,..., X 27 included in the high frequency band side frequency spectrum sequence X 20 ,..., X 31 as samples to be adjusted to the low frequency side (Step 1-3) .
  • the frictional noise adjusting unit 13 arranges X 20 ,..., X 27 at the sample positions where X 2 ,..., X 9 are in the low frequency side frequency spectrum sequence as the low frequency adjusted frequency spectrum sequence Y 0 , Obtained as ..., Y 19 (Step 1-4).
  • Fricative adjusting unit 13 X 20 in the high-frequency side frequency spectrum sequence, ..., X 2 to a sample position is X 27, ..., the high frequency side adjusting those arranged X 9 already frequency spectrum sequence Y 20, Obtained as ..., Y 31 (Step 1-5). Fricative adjusting unit 13, the low-frequency side adjusted frequency spectrum sequence Y 0, ..., Y 19 and the high band side adjusted frequency spectrum sequence Y 20, ..., adjusted by combining a Y 31 already frequency spectrum sequence Y 0, ..., Y 31 is obtained (Step 1-6).
  • the frictional noise adjusting unit 13 may perform the following Step 1-4 ′ instead of the above Step 1-4.
  • Step 1-4 ' In Step 1-2, the remaining samples from which the adjustment target samples in the high frequency range in the low frequency side frequency spectrum sequence have been taken are packed in the low frequency side, and the vacant high frequency region sample position What arranged the adjustment target samples to the low band side extracted from the high band side frequency spectrum series in Step 1-3 is obtained as low band side adjusted frequency spectrum series Y 0 ,..., Y M ⁇ 1 .
  • the frictional noise adjustment unit 13 performs Step 1-4 ′ in place of Step 1-4, so that the encoding unit 14 in the subsequent stage performs encoding by increasing the auditory importance as the sample has a lower corresponding frequency. Is possible.
  • the adjusted frequency spectrum sequence is the lower adjusted frequency spectrum sequence and the higher adjusted frequency spectrum.
  • a part of samples in the low frequency band spectrum sequence is included in the high frequency band adjusted frequency spectrum series, and the remaining samples in the low frequency band spectral sequence are low frequency adjusted frequencies Arranged on the low band side of the spectrum sequence, and arranged a part of the samples in the high band frequency spectrum series on the high band side in the low band adjusted frequency spectrum sequence, and the rest in the high band frequency spectrum series
  • the adjusted frequency spectrum sequence may be obtained by including the samples of ⁇ circumflex over (d) ⁇ in the high frequency side adjusted frequency spectrum sequence. [Example 3 of the adjustment process performed by the frictional noise adjustment unit 13] Similarly, the frictional noise adjustment unit 13 may perform the following Step 1-5 ′ instead of the above Step 1-5.
  • Step 1-5 ' The remaining samples from which the adjustment target samples in the low band side in the high band frequency spectrum series are taken in Step 1-3 are packed in the low band side, and the vacant high band side sample position A high-frequency side adjusted frequency spectrum sequence Y M ,..., Y N ⁇ 1 is obtained by arranging adjustment target samples to the high frequency side extracted from the low frequency side frequency spectrum sequence in Step 1-2.
  • Step 1-5 ′ the encoding unit 14 in the subsequent stage originally had a sample that was originally on the high frequency side on the low frequency side. It becomes possible to encode with higher audio importance than the sample.
  • Fricative adjusting unit 13 first frequency spectrum sequence X 0, ..., X 0 of X 31, ..., the X 19 and the low-frequency side frequency spectrum sequence, X 20, ..., the X 31 high band side frequency spectrum Make it a series (Step 1-1).
  • the frictional noise adjustment unit 13 takes out eight samples X 2 ,..., X 9 included in the low frequency side frequency spectrum sequence X 0 ,..., X 19 as samples to be adjusted to the high frequency side (Step 1-2) .
  • the frictional noise adjustment unit 13 takes out eight samples X 20 ,..., X 27 included in the high frequency band side frequency spectrum sequence X 20 ,..., X 31 as samples to be adjusted to the low frequency side (Step 1-3) .
  • Fricative adjusting unit 13, X 10 in the low-frequency side frequency spectrum sequence, ..., packed X 19 to the low frequency side, X 10 packed in the lower frequency side, ..., X 20 to the high frequency side of the X 19, ... , X 27 are obtained as the lower adjusted frequency spectrum sequence Y 0 ,..., Y 19 (Step 1-4 ').
  • Fricative adjusting unit 13 the high-frequency side frequency spectrum sequence in X 28, ..., packed X 31 to the low frequency side, X 28 packed in the lower frequency side, ..., X 2 to a higher frequency side of X 31, ... , X 9 are obtained as the high-frequency-side adjusted frequency spectrum sequence Y 20 ,..., Y 31 (Step 1-5 ′). Fricative adjusting unit 13, the low-frequency side adjusted frequency spectrum sequence Y 0, ..., Y 19 and the high band side adjusted frequency spectrum sequence Y 20, ..., adjusted by combining a Y 31 already frequency spectrum sequence Y 0, ..., Y 31 is obtained (Step 1-6).
  • the adjusted frequency spectrum sequence is the lower adjusted frequency spectrum sequence and the higher adjusted frequency. Assuming that the spectrum sequence is configured, a part of the samples in the low frequency band spectrum sequence is arranged on the high frequency side in the high frequency band adjusted frequency spectrum sequence, and the remaining samples in the low frequency band spectrum are Some of the samples in the higher-end frequency spectrum sequence are included in the lower adjusted frequency spectrum sequence, and the remaining samples in the higher-end frequency spectrum sequence are high.
  • the adjusted frequency spectrum sequence may be obtained by arranging it on the low band side in the region-side adjusted frequency spectrum sequence.
  • the frictional noise adjusting unit 13 does not include one or more samples from the lowest frequency in the sample to be adjusted to the high band side from the low band frequency spectrum series in Step 1-2 above. It is desirable to do so. This is because the low frequency samples are samples that contribute to the continuity of the signal waveform between frames, and the encoding unit 14 should perform encoding with more bits allocated. That is, when ⁇ is a positive integer, it is preferable to select C adjustment target samples from X ⁇ ,..., X M ⁇ 1 of the lower frequency spectrum series, for example, X ⁇ ,. , X ⁇ + C ⁇ 1 may be the adjustment target sample.
  • the value of ⁇ may be determined by prior experiments or the like in consideration of these matters.
  • the frictional noise adjustment unit 13 determines that the high frequency side part of the low frequency side frequency spectrum sequence has the same number of high tones. What replaced the whole or a part of the area side frequency spectrum series may be obtained as an adjusted frequency spectrum series.
  • Example 5 of the adjustment process performed by the frictional noise adjustment unit 13 In the encoding process in the encoding unit 14 described later, some of the samples from the highest frequency in the adjusted frequency spectrum sequence are bit-wise due to the restriction of the maximum value of the number of bits obtained in the encoding process. May not be assigned at all.
  • the high frequency band spectral sequence X M ,..., X N-1 is not subjected to encoding of one or more samples from the one with the highest frequency.
  • the remaining samples on the low frequency side of X M ,..., X N-1 should be encoded. Therefore, in this case, the frictional sound adjusting unit 13 detects the frequency of the high frequency band spectrum sequence as the adjustment target sample to the low frequency side from the high frequency band spectrum sequence in Step 1-3 above. Do not include the one or more samples from the highest one.
  • X 28 ,..., X 31 which are the four samples from the highest frequency of the high frequency band side spectrum sequence to the low frequency band from the high frequency side frequency spectrum series It is not included in the sample to be adjusted to the area side.
  • the frictional noise adjustment unit 13 determines that the frictional noise determination unit 12 is a frictional noise, all or a part of the lower frequency spectrum series and the same number of higher frequency spectra are obtained. What replaced the part in the low band side in the series may be obtained as an adjusted frequency spectrum series.
  • the adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1 output from the frictional noise adjustment unit 13 is input to the encoding unit 14.
  • the encoding unit 14 is a method of assigning bits in a frame unit preferentially to the input adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1 to a sample having a small sample number, for example, non-patent document
  • the spectrum code is obtained by encoding in the same manner as 1 and the obtained spectrum code is output to the multiplexing unit 15 (step S14).
  • the method of assigning bits in priority to a sample having a small sample number means, for example, dividing the adjusted frequency spectrum sequence Y 0 ,..., Y N-1 into a plurality of partial sequences and having a small sample number. Each sample included in the subsequence is divided by the gain of a smaller value as the subsequence of, and each integer value of the division result is encoded using a variable-length code or a fixed-length code, or vector quantization is performed.
  • a method of obtaining a spectral code which is a code corresponding to the adjusted frequency spectrum sequence. At this time, for a partial sequence of a larger sample number, a code corresponding to the partial sequence may not be obtained. That is, bits may not be allocated to a partial sequence of a larger sample number.
  • the frictional sound corresponding encoding unit 17 uses the frictional sound determination unit 12 as a frictional sound. If it is determined that there is, then the frequency spectrum sequence is encoded by the encoding processing in which bits are allocated preferentially to the high frequency side to obtain a spectrum code, and in the other cases, the frequency spectrum sequence is low frequency side. It can be said that a spectrum code is obtained by coding in a coding process in which bits are preferentially allocated.
  • Multiplexing unit 15 The frictional noise determination information output from the frictional noise determination unit 12 and the spectral code output from the encoding unit 14 are input to the multiplexing unit 15.
  • the multiplexing unit 15 outputs a code obtained by joining the code corresponding to the input frictional noise determination information and the spectral code in frame units (step S15).
  • the frictional noise determination information output from the frictional noise determination unit 12 is 1-bit information
  • the frictional noise determination information itself output from the frictional noise determination unit 12 and input to the multiplexing unit 15 is a code corresponding to the frictional noise determination information do it.
  • the decoding device includes a demultiplexing unit 21, a decoding unit 22, a frictional noise adjustment canceling unit 23, and a time domain conversion unit 24.
  • the code output from the coding device is input to the decoding device.
  • the code input to the decoding device is input to the demultiplexing unit 21.
  • the decoding device performs processing in units of frames of a predetermined time length at each part.
  • the decoding method of the first embodiment is realized by the respective units of the decoding apparatus performing the processes of step S21 to step S24 illustrated below and in FIG. 4.
  • the demultiplexing unit 21 receives the code output from the encoding device.
  • the demultiplexing unit 21 separates the input code into a code corresponding to the frictional noise determination information and a spectral code in frame units, and transmits the frictional noise determination information obtained from the code corresponding to the frictional noise determination information to the frictional noise adjustment canceling unit 23
  • the spectral code is output to the decoding unit 22 (step S21).
  • the code itself corresponding to the frictional noise determination information input to the demultiplexing unit 21 may be used as the frictional noise determination information.
  • the spectral code output from the demultiplexing unit 21 is input to the decoding unit 22.
  • the decoding unit 22 decodes the input spectrum code by the decoding method corresponding to the encoding method performed by the encoding unit 14 of the encoding apparatus on a frame basis, and the decoding adjusted frequency spectrum sequence ⁇ Y 0 , ... , Y Y N ⁇ 1 are obtained, and the obtained decoded adjusted frequency spectrum sequence Y Y 0 ,..., Y Y N ⁇ 1 is output to the frictional noise adjustment canceling unit 23 (step S22).
  • the decoding unit 22 decodes the spectral code to obtain an integer value sequence, Decode-adjusted frequency spectrum series ⁇ Y 0 , ..., ⁇ Y N-1 by combining a plurality of partial series of sample values obtained by multiplying an integer value by a small value gain for a partial series with a smaller sample number Get
  • the encoder does not allocate a bit for a partial sequence of the larger sample number, for example, the value of the decoding adjusted frequency spectrum corresponding to the partial sequence is set to 0.
  • the value obtained by multiplying the gain is also zero for a sample whose integer value is zero, the value of the decoded adjusted frequency spectrum is zero. That is, the integer value is often 0 for the partial sequence of the larger sample number, and the value of the decoded adjusted frequency spectrum is often 0.
  • the decoding unit 22 decodes the spectrum code in the frame unit of the predetermined time interval, and the spectrum code to which the bit is preferentially allocated on the low frequency side is supported to correspond to the decoded sound signal.
  • Sample sequence (decoded adjusted frequency spectrum sequence) in the frequency domain to be obtained.
  • the frictional noise adjustment cancellation unit 23 receives the frictional noise determination information output from the demultiplexing unit 21 and the decoded adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 output from the decoding unit 22.
  • the friction noise adjustment release unit 23 inputs the decoded and adjusted frequency spectrum sequence ⁇ Y 0 ,..., ⁇ Y N- when the inputted friction noise determination information indicates that the noise is frictional noise in frame units.
  • the following adjustment release processing is performed on 1 to obtain decoded frequency spectrum sequences ⁇ X 0 , ..., ⁇ X N-1, and the obtained decoded frequency spectrum sequences ⁇ X 0 , ⁇ X 1 , ..., ⁇ X
  • N-1 is output to the time domain conversion unit 24 and the frictional noise determination information indicates that it is not a frictional sound
  • the decoded and adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 is directly decoded frequency spectrum
  • the series ⁇ X 0 , ..., ⁇ X N-1 is output to the time domain conversion unit 24 (step S23).
  • the sample number of the decoded adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 is a sample less than M ⁇ Y 0 , ...
  • a sample group by ⁇ Y M-1 is a low-range side decoded adjusted frequency spectrum sequence
  • the sample number of the decoded adjusted frequency spectrum series ⁇ Y 0 , ..., ⁇ Y N-1 is a sample with M or more ⁇
  • the processing is performed on all or a part of all or part of samples of the low-side decoding adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 and the same number of high-side decoding adjustment frequency spectrum sequences ⁇ Y M , ... , ⁇ Y N-1 with all or part of the samples replaced by the decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ It is a process to obtain as X N ⁇ 1 .
  • the adjustment release process performed by the frictional sound adjustment release unit 23 may be various processes including those exemplified below, but the adjustment release process is performed so as to be the reverse process of the adjustment process performed by the frictional sound adjustment unit 13 of the corresponding encoding device. The process is predetermined.
  • the frictional noise adjustment canceling unit 23 indicates that the information indicating whether or not the input is the frictional sound is the frictional sound
  • Example 1 of the adjustment release process performed by the frictional noise adjustment release unit 23 When the frictional noise determination information indicates that the frictional noise determination information is frictional noise, the frictional noise adjustment cancel unit 23 performs, for example, Steps 2-1 to 2-6 described below to perform decoding frequency spectrum series ⁇ X 0 , ..., ⁇ X N-1 is obtained. The following two steps from Step 2-1 to Step 2-6 are divided into six steps in order to clearly show the operation of the frictional noise adjustment cancel unit 23. However, the frictional noise adjustment cancel unit 23 performs the following Step 2- Performing steps 1 to 2-6 separately is just one example, and the process equivalent to steps 2-1 to 2-6 is performed in one step by replacing the elements of the array or changing the index. You may go there.
  • Step 2-1 Decoding adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 Sample group by samples whose sample number is less than M Lower band decoded adjusted frequency spectrum sequence ⁇ Y 0 , ... , ⁇ Y M-1 and the decoding adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 with a sample number of M or more being a sample group of high band side decoding adjusted frequency spectrum ⁇ Y Let M , ..., ⁇ Y N-1 .
  • Step 2-2 lower range decoder adjustment obtained in Step 2-1 already frequency spectrum sequence ⁇ Y 0, ..., ⁇ Y C number included in M-1 (C is a positive integer) high frequency side of sample Take it out as an adjustment target sample.
  • Step 2-3 The C samples included in the high-frequency side decoded adjusted frequency spectrum sequence ⁇ Y M , ..., ⁇ Y N-1 obtained in Step 2-1 are extracted as samples to be adjusted to the low band side .
  • Step 2-4 The high frequency side decoding adjusted frequency spectrum sequence at Step 2-3 at the sample position where the adjustment target sample to the high frequency side in the low frequency side decoding adjusted frequency spectrum sequence is extracted at Step 2-2
  • the lower-side decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X M-1 is obtained by arranging the adjustment target samples to the lower side taken out from.
  • Step 2-5 At the sample position where the adjustment target sample to the low band side in the high band side decoding adjusted frequency spectrum sequence is extracted in Step 2-3, from the low band side decoding adjusted frequency spectrum sequence in Step 2-2 A high frequency side decoded frequency spectrum sequence ⁇ X M , ..., ⁇ X N-1 is obtained by arranging the extracted adjustment target samples toward the high frequency side.
  • Step 2-6 Low band side decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X M-1 obtained in Step 2-4 and high band side decoded frequency spectrum sequence ⁇ X M , obtained in Step 1-5 ..., ⁇ X N-1 and to obtain the decoded frequency spectrum series ⁇ X 0 , ..., ⁇ X N-1 .
  • the frictional noise adjustment release unit 23 first sets ⁇ Y 0 , ..., ⁇ Y 19 of the decoded adjusted frequency spectrum series ⁇ Y 0 , ..., ⁇ Y 31 as the low-range side decoded adjusted frequency spectrum series, ⁇ Y
  • 20 , ..., ⁇ Y 31 be the high frequency side decoded adjusted frequency spectrum sequence (Step 2-1).
  • the frictional noise adjustment release unit 23 adjusts the eight samples ⁇ Y 2 , ..., ⁇ Y 9 included in the low-range side decoded adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y 19 to be adjusted to the high frequency side Take out as (Step 2-2).
  • the frictional noise adjustment release unit 23 adjusts the eight samples ⁇ Y 20 , ..., ⁇ Y 27 included in the high-frequency side decoded adjusted frequency spectrum sequence ⁇ Y 20 , ..., ⁇ Y 31 to the low-pass side Take out as (Step 2-3).
  • the friction noise adjustment release unit 23 is a low-pass side in which ⁇ Y 20 , ..., ⁇ Y 27 is arranged at the sample position where ⁇ Y 2 , ..., ⁇ Y 9 is in the low-pass side decoded adjusted frequency spectrum sequence. Obtained as a decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X 19 (Step 2-4).
  • the frictional noise adjustment release unit 23 is configured such that a sample position where ⁇ Y 2 , ..., ⁇ Y 9 is arranged at a sample position where ⁇ Y 20 , ..., ⁇ Y 27 in the high frequency side decoded adjusted frequency spectrum sequence is located on the high frequency side Obtained as a decoded frequency spectrum sequence ⁇ X 20 , ..., ⁇ X 31 (Step 2-5).
  • the frictional noise adjustment release unit 23 combines the low frequency side decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X 19 and the high frequency side decoded frequency spectrum sequence ⁇ X 20 , ..., ⁇ X 31 to obtain a decoded frequency spectrum sequence ⁇ Obtain X 0 , ..., ⁇ X 31 (Step 2-6).
  • Example 2 of the adjustment release process performed by the frictional noise adjustment release unit 23 In the case where the frictional noise adjusting unit 13 of the encoding device performs Step 1-4 ′ instead of Step 1-4, the frictional noise adjustment canceling unit 23 replaces the above Step 2-4 and performs the following Step 2-4. 'I do.
  • Step 2-4 ' The remaining samples obtained by extracting the adjustment target sample to the high band side in the low band side decoding adjusted frequency spectrum sequence in Step 2-2 are padded to the low band side and the high band side
  • Step 2-5 ' The remaining samples obtained by extracting the adjustment target sample to the low band side in the high band side decoding adjusted frequency spectrum sequence in Step 2-3 are packed in the high band side, and the vacant low band side A high-frequency decoded frequency spectrum sequence ⁇ X M , ..., ⁇ X N- in which the sample to be adjusted to the high band side extracted from the low band side decoding adjusted frequency spectrum sequence in Step 2-2 is placed at the sample position. Get one .
  • the frictional noise adjustment release unit 23 first sets ⁇ Y 0 , ..., ⁇ Y 19 of the decoded adjusted frequency spectrum series ⁇ Y 0 , ..., ⁇ Y 31 as the low-range side decoded adjusted frequency spectrum series, ⁇ Y
  • 20 , ..., ⁇ Y 31 be the high frequency side decoded adjusted frequency spectrum sequence (Step 2-1).
  • Fricative adjustment releasing unit 23 the low-frequency side decoded adjusted frequency spectrum sequence ⁇ Y 0, ..., 8 samples ⁇ Y 12 included in the ⁇ Y 19, ..., ⁇ adjusted samples of Y 19 to the high frequency side Take it out as (Step 2-2). Fricative adjustment releasing unit 23, the high frequency side decoded adjusted frequency spectrum sequence ⁇ Y 20, ..., ⁇ 8 samples ⁇ Y 24 included in Y 31, ..., adjusted sample of ⁇ Y 31 to the low frequency side Take it out as (Step 2-3).
  • the frictional noise adjustment cancellation unit 23 vacates ⁇ Y 0 and ⁇ Y 1 in the low frequency side decoded adjusted frequency spectrum sequence to the low frequency side, squeezes ⁇ Y 2 , ..., ⁇ Y 11 to the high frequency side, and is freed.
  • the lower-side decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X 19 is obtained by arranging ⁇ Y 24 , ..., ⁇ Y 31 in between (Step 2-4 ').
  • the friction noise adjustment release unit 23 packs ⁇ Y 20 , ..., ⁇ Y 23 in the high frequency side decoded adjusted frequency spectrum sequence to the high band side and packs it to the high band side of ⁇ Y 20 , ..., ⁇ Y 23
  • a high frequency side decoded frequency spectrum sequence ⁇ X 20 , ..., ⁇ X 31 is obtained by arranging ⁇ Y 12 , ..., ⁇ Y 19 on the low frequency side (Step 2-5 ').
  • the frictional noise adjustment release unit 23 combines the low frequency side decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X 19 and the high frequency side decoded frequency spectrum sequence ⁇ X 20 , ..., ⁇ X 31 to obtain a decoded frequency spectrum sequence ⁇ Obtain X 0 , ..., ⁇ X 31 (Step 1-6).
  • the frictional noise adjustment cancel unit 23 is configured to adjust one or more samples from the lowest frequency to the adjustment target sample toward the high frequency side from the low frequency side frequency spectrum series in Step 1-2 in the frictional noise adjustment unit 13 of the encoding device.
  • Step 2-2 one or more samples from the lowest frequency sample to be adjusted to the high band side from the low band decoding adjusted frequency spectrum sequence Do not include
  • the frictional noise adjusting unit 13 of the encoding device performs one or more samples from the one with the highest frequency to the adjustment target sample to the low frequency side from the high frequency side frequency spectrum sequence in Step 1-3.
  • Step 2-3 one or more samples from the highest frequency target sample to be adjusted to the low band side from the high band side decoding adjusted frequency spectrum sequence Do not include
  • the frictional sound corresponding decoding unit 26 determines whether the input is a frictional sound.
  • the information represented is a frictional sound
  • bits are preferentially assigned to the high frequency band side of the spectrum code
  • the spectrum code is decoded and a frequency spectrum sequence (decoded frequency spectrum sequence)
  • the spectral code is decoded to obtain a frequency spectral sequence (decoded frequency spectral sequence), assuming that bits are preferentially allocated to the low frequency side of the spectral code. I can say that.
  • the time domain transform unit 24 receives the decoded frequency spectrum series ⁇ X 0 , ..., ⁇ X N-1 output from the frictional noise adjustment release unit 23.
  • the time domain transform unit 24 uses the time corresponding to the method of transforming the decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X N -1 to the frequency domain performed by the frequency domain transform unit 11 of the encoding device for each frame.
  • a sound signal (decoded sound signal) in units of frames is obtained and output by converting it into a time domain signal using an area conversion method, for example, inverse MDCT, (step S24).
  • the time domain conversion unit 24 performs these processings.
  • a decoded sound signal obtained by converting a signal obtained by performing inverse filter processing and reverse decompression processing on the decoded frequency spectrum sequence corresponding to the processing in (1) into a signal in the time domain is output.
  • the decoding device may output not the decoded sound signal in the time domain but the decoded sound signal in the frequency domain.
  • the decoding device does not have to include the time domain conversion unit 24, and the decoded frequency spectrum sequences in frame units obtained by the frictional noise adjustment cancel unit 23 are connected in time interval order to It may be output as a signal.
  • the encoding process designed to allocate more bits to the conventional low frequency spectrum and the corresponding decoding process are performed By adding frictional noise adjustment processing or frictional noise adjustment release processing corresponding to this to the configuration, it is possible to compress and encode even audio signals including frictional noise etc. so that audible deterioration is reduced. It becomes.
  • the modification of the first embodiment is different from the first embodiment only in the frictional noise determination unit 12 included in the encoding device.
  • the other configuration of the encoding device and the configuration of the decoding device are the same as in the first embodiment.
  • the operation of the frictional noise determination unit 12 different from that of the first embodiment and the operation and effect of the encoding device and the decoding device according to that will be described.
  • the frictional noise determination unit 12 of the modification of the first embodiment includes a comparison result storage unit (not shown).
  • Fricative determining unit 12 in units of frames, the input frequency spectrum sequence X 0 of the frame, ..., the frequency spectrum sequence X 0 input to the average energy of the samples in the low-frequency side of the X N-1, ..., an index which increases as the ratio of the average energy of the samples located on the higher side of X N-1 increases as an index that the frame is a frictional sound, and the determined index is a predetermined threshold
  • the comparison result information indicating whether it is larger or more than the threshold is obtained.
  • the comparison result storage unit stores the comparison result information for a predetermined number of past frames. That is, the frictional noise determination unit 12 newly stores, in the comparison result storage unit, the comparison result information calculated from the frequency spectrum sequence of the frame on a frame basis, and deletes the oldest stored comparison result information.
  • the frictional noise determination unit 12 uses the comparison result information calculated from the frequency spectrum sequence of the frame and the comparison result information of the predetermined number of past frames stored in the comparison result storage unit, and compares these comparison result information. If the comparison result information of more than half of the above or more than half of the comparison result information indicates that it is greater than a predetermined threshold value or greater than or equal to a predetermined threshold value, it is determined to be a frictional noise like sound; Is determined not to be a frictional noise, and the determination result is output to the frictional noise adjustment unit 13 and the multiplexing unit 15 as frictional noise determination information.
  • the frictional noise determination unit 12 has a large ratio of the average energy of the high frequency band spectrum to the average energy of the low frequency band spectrum in the frequency spectrum sequence of the sound signal. If the number of frames whose index is so large is greater than or equal to a predetermined threshold value is greater than or equal to the number of other frames, then the sound signal of the frame is a frictional sound. It may be determined that
  • 1-bit information may be used as the frictional noise determination information, and an average value of the sum of absolute values or an average value of the square sum of the values of all or part of the samples may be used as the average energy. It is the same as the frictional noise determination unit 12 of the embodiment.
  • the decoded sound of the high-frequency component with a small amount of coding distortion of the high-frequency component and a large amount of coding distortion of the low-frequency component The adjustment process and the adjustment cancellation process are obtained because a decoded sound having a large amount of encoding distortion of the high frequency component and a small amount of encoding distortion of the low frequency component is obtained for the frame in which the adjustment process and the adjustment release process are not performed. Discontinuities in the waveform of the decoded sound may occur at the boundary between the frame to be performed and the frame on which the adjustment process and the adjustment release process are not performed.
  • the encoding device of the modification of the first embodiment can suppress the switching of the determination result of the frictional noise determination unit 12 more frequently than the encoding device of the first embodiment, and the discontinuity of the waveform of the decoded sound
  • the frequency of occurrence of H. can be suppressed, and deterioration of auditory quality due to the perception of this discontinuity can be suppressed.
  • the number of pieces of comparison result information used for the determination is increased, frequent switching of the determination result of the frictional noise determination unit 12 can be suppressed, although it is possible to suppress the frequency of occurrence of waveform discontinuities, the number of pieces of comparison result information used for determination is a trade-off between deterioration of auditory quality due to perceived discontinuities and auditory quality of decoded sound for each frame It is necessary to decide in consideration of For example, when the frame length is 3 ms, the number of pieces of comparison result information used for determination may be sixteen.
  • the system of the second embodiment of the present invention includes an encoding device and a decoding device as in the system of the first embodiment.
  • the second embodiment is different from the first embodiment in that the decoding apparatus recovers the frequency spectrum to which no bit is allocated in the encoding apparatus, that is, the band is expanded in the decoding apparatus.
  • the decoding device of the second embodiment extends the band to the decoding adjusted frequency spectrum sequence which is the frequency spectrum after being replaced based on the frictional noise determination information.
  • the frequency spectrum to which bits are not allocated by the encoding device is included in the high region for time intervals that are not frictional noises, and in the low frequency range for friction noises.
  • the band is expanded by reproducing the high frequency spectrum by copying the low frequency spectrum, and for the time interval of frictional noise, the band is expanded by reproducing the low frequency spectrum by duplicating the high frequency spectrum.
  • the replication of the frequency spectrum in the second embodiment is performed by multiplying the frequency spectrum that is the source of replication by a gain. Therefore, in addition to what the encoding device of the first embodiment performs, the encoding device of the second embodiment determines the gain used by the decoding device of the second embodiment, and outputs a code corresponding to the determined gain. Do.
  • the encoding apparatus includes a frequency domain conversion unit 11, a frictional noise determination unit 12, a frictional noise adjustment unit 13, an encoding unit 14, a band expansion gain encoding unit 16, and a multiplexing unit Including 15.
  • the coding apparatus according to the second embodiment of FIG. 9 differs from the coding apparatus according to FIG. 1 in that the band extension gain coding unit 16 is provided, and the multiplexing unit 15 outputs the band output by the band extension gain coding unit 16.
  • the extended gain code is also included in the output code.
  • the other configuration of the encoding apparatus of the second embodiment that is, the operations of the frequency domain conversion unit 11, the frictional noise determination unit 12, the frictional noise adjustment unit 13, and the encoding unit 14 are the same as those of the encoding apparatus of the first embodiment. Therefore, only the main part of the operation will be described below.
  • a sound signal in the time domain is input to the encoding device in units of frames of a predetermined time length.
  • the sound signal in the time domain input to the encoding device is input to the frequency domain transform unit 11.
  • the encoding device performs processing in units of frames of a predetermined time length at each part.
  • the encoding method of the second embodiment is realized by the units of the encoding apparatus performing the processes of steps S11 to S16 illustrated below and in FIG.
  • Frequency domain converter 11 Frequency domain transform section 11, in units of frames, the frequency spectrum sequence X 0 N-point frequency domain sound signals of the input time domain to the coding apparatus, ..., is converted into X N-1 outputs (step S11).
  • the friction sound determination unit 12 uses the frequency spectrum sequence X 0 ,..., X N-1 obtained by the frequency domain conversion unit 11 or the sound signal in the time domain input to the encoding device in frame units. It is determined whether it is a frictional noise or not, and the determination result is output as frictional noise determination information (step S12).
  • the frictional noise determination unit 12 of the encoding device of the first embodiment outputs the frictional noise determination information to the frictional noise adjustment unit 13 and the multiplexing unit 15.
  • the frictional noise determination unit 12 of the encoding device of the second embodiment is the frictional noise determination information Are output to the band expansion gain encoding unit 16 in addition to the frictional noise adjustment unit 13 and the multiplexing unit 15.
  • the frictional sound determination unit 12 of the encoding device of the second embodiment may perform the same operation as the frictional sound determination unit 12 of the encoding device of the modification of the first embodiment.
  • the frictional noise determination unit 12 determines that the index that increases as the ratio of the average energy of the high frequency spectrum to the average energy of the low frequency spectrum in the frequency spectrum sequence of a certain frame is larger than a predetermined threshold
  • the sound signal may be determined to be a frictional sound if it is greater than or equal to a threshold.
  • the frictional noise determination unit 12 predetermines, in advance, an index that increases as the ratio of the average energy of the high frequency band spectrum to the average energy of the low frequency band spectrum in the frequency spectrum sequence increases in a plurality of frames including a certain frame.
  • the sound signal may be determined to be a frictional sound if the number of frames larger than or equal to the predetermined threshold is greater than or equal to the number of other frames.
  • Adjustment processing of the frequency spectrum fricative adjusting unit 13 performs the frequency spectrum sequence X 0, ..., X low band side frequency spectrum sequence X 0 of N-1, ..., all or part of the sample X M-1
  • the frequency spectrum sequence X 0, X ..., X high band side frequency spectrum sequence X M of the N-1, ..., replaced with all or part of the sample of X N-1 the It is a process to obtain one as the adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1 .
  • the friction sound determination unit 12 determines that the friction sound determination unit 12 determines that the friction sound is a frictional sound
  • the low frequency side frequency that is lower than a predetermined frequency in the frequency spectrum sequence of the sound signal Adjustments are made by replacing all or part of the spectrum sequence with all or part of the same high frequency band side spectrum sequence above the predetermined frequency of the frequency spectrum sequence. It is obtained as a frequency spectrum series, and in the case other than the above, a frequency spectrum series corresponding to a sound signal is obtained as it is as an adjusted frequency spectrum series.
  • the encoding unit 14 assigns bits in a frame unit in priority to the adjusted frequency spectrum sequence Y 0 ,..., Y N-1 obtained by the frictional noise adjustment unit 13 to a sample having a small sample number, A spectral code is obtained by encoding, and the obtained spectral code is output to the multiplexing unit 15 (step S14).
  • the method of assigning bits in preference to samples with small sample numbers is also the method of assigning bits to all samples of the adjusted frequency spectrum sequence. There was no problem in assigning some bits to some of the larger samples.
  • the method of assigning bits preferentially to samples with small sample numbers in the coding unit 14 of the coding device according to the second embodiment the method of assigning the bits with higher sample numbers in the adjusted frequency spectrum sequence It shall be limited to the method which does not allocate bits to some adjusted frequency spectrums. Note that the method of allocating the bits is determined in advance and stored in the encoding unit 14, and is also stored in the band expansion gain encoding unit 16 described later.
  • the encoding unit 14 adjusts, for example, K (K ⁇ N / 2) of the larger one of the N adjusted frequency spectra of the adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1. No bits are assigned to the finished frequency spectrum Y NK , ..., Y N-1, and bits are assigned to the NK adjusted frequency spectrums Y 0 , ..., Y NK-1 from the smaller sample number remaining already frequency spectrum sequence Y 0, ..., Y N- 1 to give a spectrum code by encoding, and outputs a spectrum code obtained to the multiplexing unit 15.
  • the encoding unit 14 substantially selects NK adjusted frequency spectra from the smaller sample number among N adjusted frequency spectra of the adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1. Only the Y 0 ,..., Y NK-1 are encoded to obtain a spectral code.
  • Band Extended Gain Coding Unit 16 At least the adjusted frequency spectrum sequence Y 0 ,..., Y N-1 output from the frictional noise adjusting unit 13 is input to the band expansion gain encoding unit 16.
  • Band extension gain coding section 16 a frame-by-frame basis, adjusted entered already frequency spectrum sequence Y 0, ..., to obtain a bandwidth extended gain code as follows based at least on Y N-1, obtained band expansion
  • the gain code is output to the multiplexing unit 15 (step S16).
  • the band expansion gain coding unit 16 may be, for example, as shown in Example 1 below. , Obtains a band expansion gain code based on the input adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1 in frame units, and outputs the obtained band expansion gain code to the multiplexing unit 15.
  • the frictional noise determination information output from the frictional noise determination unit 12 may be input to the band expansion gain encoding unit 16.
  • band extension gain coding section 16 a frame-by-frame basis
  • adjusted frequency spectrum sequence Y 0 is input, ..., Y N-1 and fricative determining
  • a band expansion gain code is obtained based on the information, and the obtained band expansion gain code is output to the multiplexing unit 15.
  • a plurality of sets of gain candidate vectors which are candidates for gain vectors and codes capable of specifying the gain candidate vectors are stored in advance in the storage unit 161 of the band extension gain encoding unit 16, and each gain candidate is stored.
  • the vector is composed of gain candidate values for a plurality of samples.
  • the band extension gain encoding unit 16 encodes the absolute value of the value obtained by multiplying the value of the adjusted frequency spectrum to which bits are allocated by the encoding unit 14 and the gain candidate value forming the gain candidate vector in units of frames, and encoding A code corresponding to a gain candidate vector that minimizes the sum of the absolute values of the differences between the absolute values of the adjusted frequency spectrum to which the unit 14 has not allocated bits is obtained as a band expansion gain code, and is output. Note that square values may be used instead of the absolute values.
  • the adjusted frequency spectrum to which bits are allocated by the encoding unit 14 has NK adjusted frequency spectra Y 0 , from the smaller sample number of the adjusted frequency spectrum sequence Y 0 ,..., Y N ⁇ 1 . ..., Y NK-1 , and adjusted frequency spectrums for which the encoding unit 14 has not allocated bits are K from the one with the larger sample number of the adjusted frequency spectrum sequence Y 0 , ..., Y N-1
  • An example in the case of the adjusted frequency spectrum Y NK ,..., Y N ⁇ 1 will be described.
  • Example 1 of the band extended gain coding unit 16 J sets of sets of gain candidate vectors and codes are stored in the storage unit 161, and each gain candidate vector is configured by gain candidate values for K samples.
  • the code C Gj corresponding to the candidate vector G j is output as a band extended gain code C G.
  • the band extension gain coding unit 16 selects K adjusted frequency spectra from the one with the largest sample number among the adjusted frequency spectra Y 0 , ..., Y NK-1 to which the coding unit 14 assigns bits.
  • a, adjusted frequency spectrum Y NK coding section 14 does not assign the bits, ..., Y N-1 respective absolute value
  • Y N The code corresponding to the gain candidate vector for
  • Example 2 of the band extended gain coding unit 16 J sets of pairs of gain candidate vectors and codes are stored in the storage unit 161 as in Example 1. However, unlike Example 1, gain candidate vectors for frictional noise and gains for non-frictional noise are used as gain candidate vectors. Assume that two types of candidate vectors are stored. That is, J sets of combinations of friction noise gain candidate vectors, non-friction noise gain candidate vectors, and signs are stored in the storage unit 161, and each friction noise gain candidate vector and each non-friction noise gain candidate vector are for K samples. It is assumed that it is composed of gain candidate values.
  • C Gj (j 0,..., J-1).
  • the non-frictional noise stored in the storage unit 161 is used.
  • gain candidate vectors G j (j 0,.
  • the band extension gain code C Gj corresponding to the gain candidate vector G j for which the E j obtained by the above equation (1) of the above becomes the smallest is output as the band extension gain code C G.
  • the band expansion gain encoding unit 16 sets the frictional sound gain candidate vector stored in the storage unit 161 as a gain candidate vector, and inputs When it is indicated that the determined frictional noise determination information is not frictional noise, the adjusted frequency spectrum Y to which bits are allocated by the encoding unit 14 with the non-frictional sound gain candidate vector stored in the storage unit 161 as the gain candidate vector.
  • adjusted frequency spectrum from more sample number is greater of K of Y NK-1 Y N-2K , ..., gain candidate value g j, 0 constituting the Y NK-1 and the gain candidate vector, ..., g j and K-1 , respectively, and the absolute value
  • sum E j is A code corresponding to the smallest gain candidate vector is obtained as a band expansion gain code and output.
  • the band expansion gain encoding unit 16 stores a plurality of codes, a friction sound gain candidate vector corresponding to each of the codes, and a non-friction sound gain candidate vector corresponding to each of the codes.
  • the band expansion gain encoding unit 16 uses the friction sound gain candidate vector as a gain candidate vector when the friction sound determination unit determines that the friction sound is a noise, and in the other cases, the non-friction sound
  • the gain candidate vector may be used as a gain candidate vector.
  • the adjusted frequency spectrum to be multiplied by the gain candidate value is a sample of the adjusted frequency spectrum Y 0 ,..., Y NK-1 to which the encoding unit 14 assigns bits.
  • the adjusted frequency spectra Y N-2 K ,..., Y NK-1 are set in order from the largest number.
  • the adjusted frequency spectrum to be multiplied by the gain candidate value is a predetermined K sample numbers of the adjusted frequency spectrum Y 0 , ..., Y NK-1 to which the encoding unit 14 assigns bits. It may be K adjusted frequency spectra corresponding to.
  • Example 1 and Example 2 of the Band Extended Gain Encoding Unit 16 [Modification 2 of Example 1 and Example 2 of the Band Extended Gain Encoding Unit 16]
  • YN-2K + k, gj, k, and YN -K + k in ascending order of the value of k are associated with each other in the equation (1). Any correspondence may be used as long as it is attached.
  • FIG. 13 shows an example of the case where the frictional noise determination information indicates that it is not a frictional noise.
  • the band expanding unit 25 of the decoding device takes the eighth to nineteenth decoded adjusted frequency spectra as the duplication source, and multiplies the values of the decoded adjusted frequency spectra of these duplication sources by the band extension gain. Processing is performed to obtain values as the 20th to 31st decoded expanded frequency spectra in order of sample number. Therefore, if the input frictional noise determination information indicates that the frictional noise determination information is not frictional noise, the band expansion gain encoding unit 16 uses the non-frictional sound gain candidate vector stored in the storage unit 161 as a gain candidate vector as a code.
  • FIG. 14 shows an example of the case where the frictional noise determination information indicates that the frictional noise is sound.
  • the band expanding unit 25 of the decoding device takes the eighth to nineteenth decoded adjusted frequency spectra as the duplication source, and multiplies the values of the decoded adjusted frequency spectra of these duplication sources by the band extension gain.
  • a process is performed to obtain values from the sixteenth to nineteenth sample number orders followed by the eighth to fifteenth sample number orders as the 20th to 31st decoded extension frequency spectra. Therefore, if the input frictional noise determination information indicates that the frictional noise determination sound is frictional noise, the band expansion gain encoding unit 16 sets the frictional noise gain candidate vector stored in the storage unit 161 as a gain candidate vector as a code.
  • band extension gain encoding section 16 stores a plurality of codes and gain candidate vectors corresponding to each of the codes, and each of K gain candidate vectors is K (K is 2 Assuming that the above-mentioned integer candidate gain values are included, the band extension gain coding unit 16 calculates the K adjusted frequency spectra to which the coding unit 14 allocates bits in the adjusted frequency spectrum sequence, and the gain. A sequence of absolute values of K values obtained by multiplying K gain candidate values included in the candidate vector, and K pieces of bits of the adjusted frequency spectrum sequence to which no bit is allocated A code corresponding to a gain candidate vector having a minimum error between a series of absolute frequencies of the adjusted frequency spectrum and the spectrum obtained is output as a band expansion gain code.
  • the operation of the band expansion gain encoding unit 16 corresponds to the operation of the band expansion unit 25 and the frictional noise adjustment cancel unit 23 of the decoding apparatus.
  • the frictional noise adjustment canceling unit 23 of the decoding device samples the 20th to 23rd decoded expanded frequency spectra on the smaller sample number side among the 20th to 31st decoded expanded frequency spectra. Let the decoded frequency spectrums numbered 28th to 31st, and the 24th to 31st decoded expanded frequency spectrums on the larger sample number side among the 20th to 31st decoded expanded frequency spectra, sample numbers Let the second to ninth decoded frequency spectra.
  • the band expanding unit 25 of the decoding device performs the operation of FIG. 14 in consideration of the magnitude of the frequency of the decoding frequency spectrum obtained by the operation of the frictional noise adjustment canceling unit 23.
  • the band expanding unit 25 of the decoding apparatus performs processing in which the frequency in the decoding frequency spectrum is matched whether the frictional noise determination information indicates frictional noise or not frictional noise. It is being done. Accordingly, the band expansion gain encoding unit 16 also operates in accordance with the band expansion unit 25.
  • the multiplexing unit 15 receives the frictional noise determination information output from the frictional noise determination unit 12, the spectrum code output from the encoding unit 14, and the band expansion gain code output from the band expansion gain encoding unit 16.
  • the multiplexing unit 15 outputs a code obtained by connecting the code corresponding to the input frictional noise determination information, the spectrum code, and the band gain code (step S15).
  • the decoding device includes a demultiplexing unit 21, a decoding unit 22, a band expanding unit 25, a frictional noise adjustment canceling unit 23, and a time domain conversion unit 24.
  • the decoding apparatus of the second embodiment of FIG. 11 differs from the decoding apparatus of the first embodiment of FIG. 3 in that it comprises a band expanding unit 25 and the demultiplexing unit 21 also obtains band expansion gain code from the input code. It is.
  • the rest of the configuration of the decoding apparatus of the second embodiment, that is, the operations of the decoding unit 22, the frictional noise adjustment canceling unit 23, and the time domain conversion unit 24 are the same as those of the decoding apparatus of the first embodiment. Only the main part of the
  • the code output from the coding device is input to the decoding device.
  • the code input to the decoding device is input to the demultiplexing unit 21.
  • the decoding device performs processing in units of frames of a predetermined time length at each part.
  • the decoding method of the second embodiment is realized by the respective units of the decoding apparatus performing the processes of step S21 to step S25 illustrated below and in FIG.
  • the demultiplexing unit 21 separates the input code into a code corresponding to the frictional sound determination information, a band expansion gain code, and a spectral code, and the frictional sound determination information obtained from the code corresponding to the frictional sound determination information is the frictional sound adjustment cancel unit 23 And the band expansion gain code to the band expansion unit 25 and the spectrum code to the decoding unit 22 (step S21).
  • the decoding unit 22 decodes the input spectrum code by the decoding process corresponding to the encoding process performed by the encoding unit 14 of the encoding apparatus on a frame basis to obtain and output a decoded adjusted frequency spectrum sequence (Step S22).
  • the encoding unit 14 of the encoding apparatus performs encoding processing in which bits are not allocated to some samples having a larger sample number, decoding adjustment of these sample numbers has been completed.
  • the value of the frequency spectrum can not be obtained by decoding the spectrum code.
  • the decoding unit 22 decodes the spectrum code, and NK decoding-adjusted frequency spectra ⁇ Y 0 , ..., ⁇ Y NK- from the smaller sample number. 1. Obtain a decoded adjusted frequency spectrum sequence by 1 .
  • the value of the decoded adjusted frequency spectrum of the sample number for which the encoding unit 14 has not allocated a bit may be set to 0. That is, in the case of the example of the encoding unit 14 described above, the decoding unit 22 decodes the spectrum code, and the K adjusted and adjusted frequency spectra ⁇ Y NK , ..., ⁇ Y in descending order of sample number. Decoding adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 may be obtained, with each value of N-1 being zero.
  • the decoding unit 22 decodes the frame-based spectrum code of the predetermined time interval, and the spectrum code for which the bit is not allocated to a part on the high frequency side, Obtain a decoded adjusted frequency spectrum sequence).
  • the band expanding unit 25 when the frictional noise adjustment canceling unit 23 indicates that the information indicating whether or not the input is a frictional noise is a frictional noise, the band expanding unit 25 described later obtains it.
  • the band expanding unit 25 obtains all or part of the lower frequency sample sequence lower than the predetermined frequency in the decoded expanded frequency spectrum sequence (spectral sequence based on the decoded adjusted frequency spectrum sequence) and
  • the frequency spectrum series of the decoded sound signal is obtained by replacing all or a part of the high frequency band sample series located higher than the predetermined frequency among the decoded expanded frequency spectrum series as the decoded sound signal.
  • the decoded expanded frequency spectrum sequence obtained by the band expansion unit 25 is obtained as it is as the frequency spectrum sequence of the decoded sound signal.
  • the decoding unit 22 indicates that the information indicating whether the input is a frictional sound or not is a frictional sound, a bit is allocated to a part of the low band side of the spectrum code. If not, the spectrum code is decoded to obtain a spectrum sequence in the frequency domain (decoded adjusted frequency spectrum sequence), and in the case other than the above, a bit is allocated to part of the high band side of the spectrum code. It is assumed that the spectrum code is decoded to obtain a spectrum sequence in the frequency domain (decoded adjusted frequency spectrum sequence).
  • the decoding unit 22 of the decoding apparatus of the first embodiment outputs the obtained decoded adjusted frequency spectrum sequence to the frictional noise adjustment canceling unit 23
  • the decoding unit 22 of the decoding apparatus of the second embodiment performs the acquired decoding adjustment
  • the frequency spectrum sequence is output to the band expansion unit 25.
  • the band expansion unit 25 receives at least the band expansion gain code output from the demultiplexing unit 21 and the decoding adjusted frequency spectrum sequence output from the decoding unit 22.
  • the band expanding unit 25 obtains the decoded expanded frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 as follows based on at least the input band expanded gain code and the decoded adjusted frequency spectrum sequence in frame units. Then, the obtained decoded extended frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 is output to the frictional noise adjustment canceling unit 23 (step S25).
  • band expansion unit 25 When only the band expansion gain code and the decoding adjusted frequency spectrum sequence are input to the band expansion unit 25, for example, the band expansion unit 25 is input in units of frames as in Example 1 below. band extension gain code and decoding the adjusted frequency spectrum sequence decoded extended frequency spectral sequence based on ⁇ Y 0, ..., ⁇ Y N-1 was obtained, and the decoded extended frequency spectral sequence ⁇ Y 0 obtained, ..., ⁇ Y N-1 is output to the frictional noise adjustment release unit 23.
  • the frictional noise determination information output from the demultiplexing unit 21 may be input to the band expanding unit 25.
  • the band expanding unit 25 performs decoding expansion based on the input band expansion gain code, decoding adjusted frequency spectrum sequence, and frictional noise determination information in frame units.
  • the frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 is obtained, and the obtained decoded extended frequency spectrum sequence ⁇ Y 0 , ... ⁇ Y N -1 is output to the frictional noise adjustment canceling unit 23.
  • the storage unit 251 of the band expansion unit 25 includes gain candidate vectors which are candidates for gain vectors and the gain candidate vectors thereof, which are the same as those stored in the storage unit 161 of the band expansion gain coding unit 16 of the encoding apparatus.
  • a plurality of sets of predeterminable codes are stored in advance, and each gain candidate vector is composed of gain candidate values for a plurality of samples.
  • the band expanding unit 25 is all or one of the decoded adjusted frequency spectrum (the decoded adjusted frequency spectrum corresponding to the adjusted frequency spectrum to which the bit is allocated by the encoding unit 14 of the coding apparatus) obtained by decoding the spectrum code.
  • the coding unit 14 is adjusted frequency spectrum adjusted frequency spectrum sequence assigned bits Y 0, ..., Y N- 1 NK pieces from more sample number is small among the adjusted frequency spectrum Y 0, ... , Y is a NK-1, the encoding unit 14 adjusted frequency spectrum was not assigned a bit adjusted frequency spectrum sequence Y 0, ..., better the K prepared from sample number is greater among Y N-1
  • An example in the case of the finished frequency spectrum Y NK , ..., Y N-1 will be described. That is, an example in the case where the decoded adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y NK-1 is obtained by the decoding of the spectrum code will be described.
  • Example 1 of the band expansion unit 25 J sets of pairs of gain candidate vectors and codes are stored in the storage unit 251, and each gain candidate vector is configured by gain candidate values for K samples.
  • G j 0, ..., J-1)
  • the band expanding unit 25 decodes the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y NK-1 as it is from the smaller sample number of the expanded frequency spectrum sequence to NK decoded expanded frequency spectra ⁇ Y 0 , ..., ⁇ Assume Y NK-1 .
  • the K gain candidate values included in the candidate vector are obtained as band expansion gains g 0 ,..., G K ⁇ 1 .
  • the band expanding unit 25 further adds K decoding adjusted frequency spectrums ⁇ Y N-2 K , ..., ⁇ from the sample number of the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y NK-1 that is larger.
  • Example 2 of the band expansion unit 25 J sets of pairs of gain candidate vectors and codes are stored in the storage unit 251 as in Example 1.
  • gain candidate vectors for frictional noise and gains for non-frictional noise are used as gain candidate vectors.
  • two types of candidate vectors are stored. That is, J sets of combinations of friction noise gain candidate vectors, non-friction noise gain candidate vectors, and codes are stored in the storage unit 251, and each friction noise gain candidate vector and each non-friction noise gain candidate vector are for K samples. It is assumed that it is composed of gain candidate values.
  • C Gj (j 0,..., J-1).
  • the band expanding unit 25 further adds K decoding adjusted frequency spectrums ⁇ Y N-2 K , ..., ⁇ from the sample number of the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y NK-1 that is larger.
  • the decoded adjusted frequency spectrum to be subjected to multiplication of the band expansion gain is the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y NK-1 obtained by decoding the spectral code.
  • the adjusted frequency spectrums ⁇ Y N -2 K , ..., ⁇ Y NK-1 are set in the order of the sample number of.
  • the decoded adjusted frequency spectrum to be subjected to multiplication of the band expansion gain is a predetermined K of the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y NK-1 obtained by decoding the spectral code. It may be K decoded adjusted frequency spectra corresponding to the sample numbers.
  • Example 1 and Example 2 of Band Expansion Unit 25 [Modification 2 of Example 1 and Example 2 of Band Expansion Unit 25]
  • the decoded adjusted frequency spectrum ⁇ Y N ⁇ 2 K + k in ascending order of the value of k is multiplied by the band expansion gain g k in ascending order of the value of k to obtain k
  • Decoding expansion frequency spectrum N Y N-K + k in order of small value of ⁇ is obtained, that is, correspondence is made in order of small value of k. Such correspondence may be sufficient.
  • FIG. 13 shows an example of the case where the frictional noise determination information indicates that it is not a frictional noise.
  • the band expanding unit 25 sets the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y 19 obtained by decoding the spectrum code as the decoded expanded frequency spectrum ⁇ Y 0 , ... ⁇ Y 19 as it is.
  • the band expanding unit 25 also obtains twelve gain candidate values included in a gain candidate vector equal to the band expanded gain code to which the corresponding code C Gj is input, as band expanded gains g 0 ,..., G 11 .
  • the band expanding unit 25 further divides the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y 19 into the 12 decoded adjusted frequency spectrum ⁇ Y 8 , ..., ⁇ Y 19 from the larger sample number.
  • the values ⁇ Y 8 g 0 ,..., ⁇ Y 19 g 11 respectively obtained by multiplying the extended gains g 0 , ..., g 11 are K decoded extended frequency spectrums in descending order of the sample number of the decoded extended frequency spectrum sequence ⁇ Y 20, ..., the ⁇ Y 31.
  • FIG. 14 shows an example of the case where the frictional noise determination information indicates that the frictional noise is sound.
  • the band expanding unit 25 sets the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y 19 obtained by decoding the spectrum code as the decoded expanded frequency spectrum ⁇ Y 0 , ... ⁇ Y 19 as it is.
  • the band expanding unit 25 also obtains twelve gain candidate values included in a gain candidate vector equal to the band expanded gain code to which the corresponding code C Gj is input, as band expanded gains g 0 ,..., G 11 .
  • the band expanding unit 25 further divides the decoded adjusted frequency spectrum ⁇ Y 0 , ..., ⁇ Y 19 into the 12 decoded adjusted frequency spectrum ⁇ Y 8 , ..., ⁇ Y 19 from the larger sample number.
  • the values ⁇ Y 8 g 0 ,..., ⁇ Y 19 g 11 respectively obtained by multiplying the extended gains g 0 , ..., g 11 are K decoded extended frequency spectrums in descending order of the sample number of the decoded extended frequency spectrum sequence ⁇ It is assumed that Y 24 , ..., ⁇ Y 31, ⁇ Y 20 , ..., ⁇ Y 23 .
  • the band expanding unit 25 uses the eighth to nineteenth decoded adjusted frequency spectra ⁇ Y 8 , ..., ⁇ Y 19 as the duplication sources, and the decoded adjusted frequency spectra ⁇ Y 8 , ..., ⁇ of these duplication sources.
  • the values ⁇ Y 8 g 0 , ..., ⁇ Y 19 g 11 obtained by multiplying the values of Y 19 and the band expansion gains g 0 , ..., g 11 are the sample numbers from the 16th to the 19th of the decoded adjusted frequency spectrum
  • the operation of the band expanding unit 25 corresponds to the operation of the frictional noise adjustment canceling unit 23.
  • the frictional noise adjustment cancel unit 23 decodes the twentieth to twenty-third decoding of the twentieth to thirty-first decoded extended frequency spectra ⁇ Y 20 , ..., ⁇ Y 31 on the smaller sample number side.
  • the extended frequency spectrum ⁇ Y 20 , ..., ⁇ Y 23 be the decoded frequency spectrum ⁇ X 28 , ..., ⁇ X 31 with sample numbers 28 to 31 and the decoded extended frequency spectrum from 20 th to 31 ⁇
  • the band expanding unit 25 performs the operation of FIG. 14 in consideration of the level of the frequency of the decoded frequency spectrum obtained by the operation of the frictional noise adjustment canceling unit 23. That is, the band expanding unit 25 of the decoding apparatus performs processing in which the frequency in the decoding frequency spectrum is matched whether the frictional noise determination information indicates frictional noise or not frictional noise. It is being done.
  • the decoding unit 22 performs spectrum coding on the higher frequency side of the sample sequence (decoding adjusted frequency spectrum sequence) in the frequency domain obtained by the decoding unit 22 decoding the spectrum code.
  • a decoded extended frequency spectrum sequence is obtained by arranging samples based on K (K is an integer of 2 or more) samples included in the frequency domain sample sequence (decoded adjusted frequency spectrum sequence) obtained by decoding.
  • the band expansion unit 25 decodes the band expansion gain code to obtain a set of K band expansion gains, and the frequency domain samples obtained by the decoding unit 22 decoding the spectrum code
  • the K samples included in the sample sequence in the frequency domain obtained by the decoding unit 22 by decoding the spectrum code are multiplied by K band expansion gains on the higher side than the column (decoded adjusted frequency spectrum sequence)
  • K band expansion gains on the higher side than the column decoded adjusted frequency spectrum sequence
  • the band expansion unit 25 stores a plurality of codes, a friction sound gain candidate vector corresponding to each of the codes, and a non-friction sound gain candidate vector corresponding to each of the codes. It is assumed that the band expansion unit 25 decodes the band expansion gain code to obtain a set of K band expansion gains, with each of the gain candidate vector for gain and the gain candidate vector for non-friction sound including K gain candidate values, If the information indicating whether the input is a frictional sound or not indicates that it is a frictional sound, the corresponding code among the plurality of frictional sound gain candidate vectors is the same as the band expansion gain code.
  • K gain candidate values included in a certain frictional sound gain candidate vector be a set of K band expansion gains, and in the case other than the above, the corresponding code of the plurality of non-frictional sound gain candidate vectors is band expanded.
  • the K gain candidate values included in the non-friction sound gain candidate vector which is the same as the tension gain code, may be processed as a set of K band extension gains.
  • the frictional noise adjustment release unit 23 receives the frictional noise determination information output from the demultiplexing unit 21 and the decoded extended frequency spectrum sequence ⁇ Y 0 to Y N-1 output from the band expanding unit 25.
  • the frictional noise adjustment cancel unit 23 sets the input decoded extended frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N -1 .
  • decoding frequency spectral sequence ⁇ X 0 make adjustments cancellation processing for, ..., ⁇ X N-1 was obtained, and the resulting decoded frequency spectrum sequence ⁇ X 0, ..., ⁇ X N-1 time domain converter , 24.
  • the decoded extended frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 is directly decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X It is output to the time domain conversion unit 24 as N-1 (step S23).
  • the adjustment release processing performed by the friction sound adjustment release unit 23 is the same as the processing performed by the friction sound adjustment release unit 23 of the decoding device of the first embodiment on the decoding adjusted frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 .
  • ⁇ Y M-1 by the sample group is set to a low frequency side decoded extended frequency spectral sequence, decoded extended frequency spectral sequence ⁇ Y 0, ..., ⁇ Y sample number of N-1 is a sample of more than M ⁇ Y
  • the adjustment cancellation processing performed by the friction sound adjustment cancellation unit 23 when the friction sound determination information indicates that it is a frictional sound is , Low-side decoded extended frequency spectrum sequence ⁇ Y 0 , ..., ⁇ Y N-1 all or part of samples and the same number of high-side decoded extended frequency spectrum sequence ⁇ Y M , ..., ⁇ Y Decoding frequency spectrum series ⁇ X 0 , ..., ⁇ by replacing all or part of N-1 samples with It is a process to obtain as X N ⁇ 1 .
  • the decoded expanded frequency spectrum obtained by the band expanding unit 25 All or a part of the lower frequency side sample sequence lower than the predetermined frequency in the sequence and a predetermined frequency of the decoded extended frequency spectrum sequence obtained by the band extending unit 25 and the same number of them
  • the frequency spectrum sequence (decoded frequency spectrum sequence) of the decoded sound signal is obtained by replacing all or a part of the high frequency band side sample sequence on the higher frequency side than the above, and in the case other than the above
  • the decoded extended frequency spectrum sequence obtained by the extension unit 25 may be obtained as it is as a frequency spectrum sequence (decoded frequency spectrum sequence) of the decoded sound signal.
  • the band expansion unit 25 and the frictional noise adjustment cancel unit 23 are the frictional noise corresponding zone expansion unit 27 as indicated by the alternate long and short dash line in FIG. 11, is the frictional noise corresponding band expansion unit 27 an input frictional noise?
  • the spectrum sequence of the frequency domain obtained by the decoding unit 22 (decoding adjusted frequency spectrum sequence) is subjected to band expansion to the low band side to perform decoding
  • the frequency spectrum series (decoded frequency spectrum series) of the sound signal is obtained, and in the case other than the above, the spectrum series of the frequency domain obtained by the decoding unit 22 is subjected to band expansion to the high band side to obtain the frequency spectrum of the decoded sound signal It can be said that a sequence (decoded frequency spectrum sequence) is obtained.
  • the time domain transform unit 24 uses the time corresponding to the method of transforming the decoded frequency spectrum sequence ⁇ X 0 , ..., ⁇ X N -1 to the frequency domain performed by the frequency domain transform unit 11 of the encoding device for each frame.
  • a sound signal (decoded sound signal) in units of frames is obtained and output by converting the signal into a time domain signal using the method of conversion to the domain (step S24).
  • the band extension gain is used to reproduce the low frequency spectrum by duplicating the high frequency spectrum in the time interval of the frictional sound.
  • the band By expanding the high frequency spectrum by copying the low frequency spectrum in a time interval that is not so, and expanding the band, even a sound signal including friction sounds etc. is further enhanced than in the first embodiment. Audible deterioration can be reduced.
  • the outline of the original frequency spectrum is reproduced as much as possible, and the auditory quality is enhanced, by performing duplication maintaining the frequency order by using a band expansion gain based on the amplitude of the frequency spectrum.
  • the frictional noise determination unit 12 of the modification of the first embodiment is used as the frictional noise determination unit 12 of the encoding device of the second embodiment
  • the first embodiment as the frictional noise determination unit 12 of the encoding device of the second embodiment
  • This configuration can suppress the switching result of the determination result of the friction sound determination unit 12 more frequently than the configuration using the friction sound determination unit 12 of the above, and can suppress the occurrence frequency of the discontinuity of the waveform of the decoded sound. It is possible to suppress the deterioration of auditory quality due to the perception of
  • Each of the encoding device, the decoding device, and the frictional noise determination device may be realized by a computer.
  • the processing content of the function that each of the encoding device, the decoding device, and the frictional noise determination device should have is described by a program. Then, by executing this program on a computer, each of the encoding device, the decoding device, and the frictional noise determination device is realized on the computer.
  • the program describing the processing content can be recorded in a computer readable recording medium.
  • a computer readable recording medium any medium such as a magnetic recording device, an optical disc, a magneto-optical recording medium, a semiconductor memory, etc. may be used.
  • each unit may be configured by executing a predetermined program on a computer, or at least a part of these processing may be realized as hardware.

Abstract

復号装置は、周波数領域のサンプル列よりも高域側に、復号により得られた周波数領域のサンプル列に含まれるK個のサンプルに基づくサンプルを配置することにより、復号拡張周波数スペクトル系列を得る帯域拡張部25と、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、復号拡張周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、復号拡張周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得る摩擦音調整解除部23と、を含む。

Description

復号装置、符号化装置、これらの方法及びプログラム
 この発明は、音信号の符号化技術などの信号処理技術において、音信号の周波数スペクトルに由来するサンプル列を符号化又は復号する技術に関連する。
 音信号を圧縮符号化する際、その圧縮の効率を高めるために、音信号を周波数スペクトル列で表現し、当該周波数スペクトル列について聴覚的な重要度を考慮したビット割り当てを行って符号化することが従来より行われている。聴覚的な重要度を考慮したビット割り当ては、周波数スペクトル列のうちの低周波数に対応するサンプルに優先してビットを割り当てることなどにより行われる。その結果、周波数スペクトル列のうちの高周波数に対応するサンプルについてはビットを全く割り当てず、高周波数に対応するサンプル列に関する直接的な情報は符号化装置では全く符号化しない構成が採用されることがある。この符号化装置に対応する復号装置では周波数スペクトル列のうちの高周波数に対応するサンプル値を0として復号音を得ることになることから、非特許文献1に記載されているような帯域拡張技術、すなわち、復号装置で低周波数に対応するサンプル列の振幅を調節しつつ複製したものを高周波数に対応するサンプル列の復号結果として出力する技術、が用いられることがある。これは、人間が音を受聴する際、高周波数に対する感度が低く、低周波数の倍音が聴こえていれば違和感がないことに基づいている。高周波数帯で節約したビット数を低周波数帯に割り当てることにより、人間の聴覚特性に対してより重要な情報を精度よく表現することができる。このように、音信号の符号化方式は、低周波数のスペクトルに対してよりビット数を割くように設計がなされていることが多い。
M. Arora, J. Lee, and S. Park, "High Quality Blind Bandwidth Extension of Audio for Portable Player Applications,"AES 120th Convention, Paris, France, 2006.
 非特許文献1の帯域拡張技術によれば、自然音の中の多くの音については復号装置が得た復号音から聴覚品質の劣化が少ない帯域拡張音を得ることができる。しかし、自然音の中には人間の発話音声中の摩擦音のように、高周波数にエネルギーが集中していて、低周波数にはほとんどエネルギーがないような音も存在しており、そのような音信号に対して符号化装置で上記のようなビット数の配分の符号化を行ってしまうと、特にビットレートの低い条件下では、復号装置からはその音の主となる周波数成分が大きく歪んだ復号音が得られてしまい、その復号音から非特許文献1の帯域拡張技術で帯域拡張音を得ると、帯域拡張音は聴感的にも劣化してしまうという課題がある。
 そこで、本発明は、摩擦音などの音信号も聴感的な劣化が少なくなるように、復号側での帯域拡張を前提とした符号化側での圧縮符号化を行う符号化装置、復号側での帯域拡張を伴う復号をする復号装置、これらの方法及びプログラムを提供することを目的とする。
 この発明の一態様による復号装置は、所定の時間区間のフレーム単位のスペクトル符号であって、高域側の一部にビットが割り当てられていないスペクトル符号、を復号して周波数領域のサンプル列を得る復号部と、復号部がスペクトル符号を復号して得た周波数領域のサンプル列よりも高域側に、復号部がスペクトル符号を復号して得た周波数領域のサンプル列に含まれるK個(Kは2以上の整数)のサンプルに基づくサンプルを配置することにより、復号拡張周波数スペクトル系列を得る帯域拡張部と、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、帯域拡張部が得た復号拡張周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、帯域拡張部が得た復号拡張周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得て、前記以外の場合には、帯域拡張部が得た復号拡張周波数スペクトル系列をそのまま復号音信号の周波数スペクトル系列として得る摩擦音調整解除部と、を含む。
 この発明の一態様による復号装置は、所定の時間区間のフレーム単位のスペクトル符号を復号して復号音信号の周波数スペクトル系列を得る復号装置であって、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、スペクトル符号には低域側の一部にビットが割り当てられていないとして、スペクトル符号を復号して周波数領域のスペクトル系列を得て、前記以外の場合には、スペクトル符号には高域側の一部にビットが割り当てられていないとして、スペクトル符号を復号して周波数領域のスペクトル系列を得る復号部と、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、復号部が得た周波数領域のスペクトル系列について低域側への帯域拡張を行って復号音信号の周波数スペクトル系列を得、前記以外の場合には、復号部が得た周波数領域のスペクトル系列について高域側への帯域拡張を行って復号音信号の周波数スペクトル系列を得る摩擦音対応帯域拡張部と、を含む。
 この発明の一態様による符号化装置は、所定の時間区間のフレーム単位の音信号に対応する周波数のサンプル列を高域側の一部にビットを割り当てない符号化処理で符号化してスペクトル符号を得る符号化部を含む符号化装置であって、音信号が摩擦音的な音であるか否かを判定する摩擦音判定部と、摩擦音判定部が摩擦音的な音であると判定した場合には、音信号の周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数スペクトル系列の全部または一部と、これと同数の、周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得て、前記以外の場合には、音信号に対応する周波数スペクトル系列をそのまま調整済周波数スペクトル系列として得る摩擦音調整部と、を含み、符号化部は、摩擦音調整部が得た調整済周波数スペクトル系列を音信号に対応する周波数のサンプル列として符号化してスペクトル符号を得るものであり、複数個の符号と、符号のそれぞれに対応する利得候補ベクトルと、が記憶されており、利得候補ベクトルのそれぞれはK個(Kは2以上の整数)の利得候補値を含み、調整済周波数スペクトル系列のうちの符号化部がビットを割り当てたK個の調整済周波数スペクトルと、利得候補ベクトルに含まれるK個の利得候補値と、を乗算して得たK個の値の絶対値による系列と、調整済周波数スペクトル系列のうちの符号化部がビットを割り当てなかったK個の調整済周波数スペクトルの絶対値による系列と、の誤差が最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する帯域拡張利得符号化部を更に含む。
 符号化装置及び復号装置によれば、摩擦音などの音信号も聴感的な劣化が少なくなるように符号化及び復号を行うことができる。
第一実施形態の符号化装置の例を示すブロック図。 第一実施形態の符号化方法の例を示す流れ図。 第一実施形態の復号装置の例を示すブロック図。 第一実施形態の復号方法の例を示す流れ図。 摩擦音調整処理の例を説明するための図。 摩擦音調整処理の例を説明するための図。 摩擦音調整処理の例を説明するための図。 摩擦音調整処理の例を説明するための図。 第二実施形態の符号化装置の例を示すブロック図。 第二実施形態の符号化方法の例を示す流れ図。 第二実施形態の復号装置の例を示すブロック図。 第二実施形態の復号方法の例を示す流れ図。 帯域拡張処理及び摩擦音調整解除処理の例を説明するための図。 帯域拡張処理及び摩擦音調整解除処理の例を説明するための図。
 <第一実施形態>
 第一実施形態は、この発明の一実施形態である第二実施形態の前提となる実施形態である。
 第一実施形態のシステムは、符号化装置および復号装置を含む。符号化装置は、所定の時間長のフレーム単位で入力された時間領域の音信号を符号化して符号を得て出力する。符号化装置が出力する符号は復号装置へ入力される。復号装置は入力された符号を復号してフレーム単位の時間領域の音信号を出力する。符号化装置に入力される音信号は、例えば、音声や音楽などの音をマイクロホンで収音し、AD変換して得られた音声信号又は音響信号である。また、復号装置が出力した音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。
 ≪符号化装置≫
 図1を参照して、第一実施形態の符号化装置の処理手続きを説明する。図1に例示するように、第一実施形態の符号化装置は、周波数領域変換部11、摩擦音判定部12、摩擦音調整部13、符号化部14、多重化部15を含む。符号化装置に入力された時間領域の音信号は周波数領域変換部11へ入力される。符号化装置は、各部で所定の時間長のフレーム単位での処理を行う。第一実施形態の符号化方法は、符号化装置の各部が、以下及び図2に例示するステップS11からステップS15の処理を行うことにより実現される。
 なお、時間領域の音信号ではなく周波数領域の音信号を符号化装置に入力する構成としてもよい。この構成とする場合には、符号化装置は周波数領域変換部11を含まないでよく、所定の時間長のフレーム単位の周波数領域の音信号を摩擦音判定部12と摩擦音調整部13に入力すればよい。
 [周波数領域変換部11]
 周波数領域変換部11には、符号化装置に入力された時間領域の音信号が入力される。周波数領域変換部11は、所定の時間長のフレーム単位で、入力された時間領域の音信号を例えば修正離散コサイン変換(MDCT)などで周波数領域のN点の周波数スペクトル系列X0,…,XN-1に変換して出力する(ステップS11)。Nは正の整数であり、例えばN=32などである。また、Xに下付きで付してある添え字は周波数の低いスペクトルから順に振られている番号である。周波数領域への変換方法として、MDCTではない様々な公知の変換方法等(例えば、離散フーリエ変換、短時間フーリエ変換等)を用いてもよい。
 周波数領域変換部11は、変換により得た周波数スペクトル系列を、摩擦音判定部12及び摩擦音調整部13に出力する。なお、周波数領域変換部11は、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためにフィルタ処理や圧伸処理を施し、フィルタ処理後や圧伸処理後の系列を周波数スペクトル系列X0,…,XN-1として出力してもよい。
 [摩擦音判定部12(摩擦音判定装置)]
 摩擦音判定部12には、例えば、周波数領域変換部11が出力した周波数スペクトル系列X0,…,XN-1が入力される。摩擦音判定部12は、フレーム単位で、入力された周波数スペクトル系列X0,…,XN-1を用いて、音信号が摩擦音的な音であるか否かを判定し、その判定結果を摩擦音判定情報として摩擦音調整部13及び多重化部15へ出力する(ステップS12)。摩擦音判定情報としては、例えば、1ビットの情報を用いればよい。すなわち、摩擦音判定部12は、フレーム単位で、音信号が摩擦音的な音である場合には、摩擦音的な音であることを示す情報としてビット"1"を、当該フレームの音信号が摩擦音的な音でない場合には、摩擦音的な音でないことを示す情報としてビット"0"を、摩擦音判定情報として出力すればよい。
 摩擦音判定部12は、例えば、入力された周波数スペクトル系列X0,…,XN-1のうちの低域側にあるサンプルの平均エネルギーに対する入力された周波数スペクトル系列X0,…,XN-1のうちの高域側にあるサンプルの平均エネルギーの比が大きいほど大きくなる指標を当該フレームが摩擦音的な音であることの指標として求める。摩擦音判定部12は、求めた指標が予め定めた閾値より大きいか閾値以上である場合に摩擦音的な音であると判定し、そうでない場合すなわち求めた指標が予め定めた閾値以下であるか閾値より小さい場合に摩擦音的な音でないと判定する。
 1より大きくN-1より小さい整数値をMAとし、MAより大きくNより小さい整数値をMBとすると、摩擦音判定部12は、例えば、周波数スペクトル系列X0,…,XN-1のうちのサンプル番号がMA以下のサンプルであるX0,…,XMAを低域側にあるサンプルとし、周波数スペクトル系列X0,…,XN-1のうちのサンプル番号がMB以上のサンプルであるXMB,…,XN-1を高域側にあるサンプルとして、X0,…,XMAの全てまたは一部のサンプルの値の絶対値和の平均値または二乗和の平均値を低域側平均エネルギーとし、XMB,…,XN-1の全てまたは一部のサンプルの値の絶対値和の平均値または二乗和の平均値を高域側平均エネルギーとし、高域側平均エネルギーを低域側平均エネルギーで除算して得られる値を摩擦音的な音であることの指標として求める。
 なお、整数値MAは、摩擦音判定部12で低域側平均エネルギーの算出対象となる低域側のサンプルが、後述する摩擦音調整部13での低域側周波数スペクトル系列に含まれるように、設定するのがよい。すなわち、摩擦音判定部12で用いる整数値MAは、後述する摩擦音調整部13の整数値M未満の値とするのがよい。また、整数値MBは、摩擦音判定部12で高域側平均エネルギーの算出対象となる高域側のサンプルが、後述する摩擦音調整部13での高域側周波数スペクトル系列に含まれるように、設定するのがよい。すなわち、摩擦音判定部12で用いる整数値MBは、後述する摩擦音調整部13の整数値M以上の値とするのがよい。
 低域側にあるサンプルX0,…,XMAのうちの一部のサンプルの値を上記の指標の算出に用いる場合には、X0,…,XMAのうちの周波数が最も低い側から1個または複数個のサンプルの値を上記の指標の算出に用いるのがよい。すなわち、αをMA未満の正の整数として、X0,…,Xαのサンプルの値の絶対値和の平均値または二乗和の平均値を低域側平均エネルギーとするのがよい。このαの値は、X0,…,Xαが摩擦音的な音以外の音であれば周波数スペクトルが通常存在し得る範囲になるように、事前の実験などに基づいて予め定めればよい。
 後述する符号化部14での符号化処理においては、符号化処理で得るビット数の最大値の制約から、調整済周波数スペクトル系列のうちの最も高い周波数から何個かのサンプルにはビットが全く割り当てられないことがある。この場合、後述する摩擦音調整部13での周波数スペクトルの調整処理を行ったとしても行わなかったとしても、周波数スペクトル系列のうちの最も高い周波数からβ個(βは正の整数)のサンプルにはビットが全く割り当てられないことがある。このような場合には、XMB,…,XN-1のうちの最も高い周波数からβ個のサンプルを除いたXMB,…,XN-1-βを上記の指標の算出に用いるとよい。すなわち、XMB,…,XN-1-βのサンプルの値の絶対値和の平均値または二乗和の平均値を高域側平均エネルギーとするのがよい。なお、このβの値は、事前に設計した符号化部14が行う符号化処理と摩擦音調整部13が行う調整処理に対応させて、予め定めればよい。
 図5と図6は、N=32、M=20の場合の後述する摩擦音調整部13の例である。これらの例においては、周波数スペクトル系列のうちのX0,…,X19が低域側周波数スペクトル系列とされ、周波数スペクトル系列のうちのX20,…,X31が高域側周波数スペクトル系列とされる。したがって、摩擦音判定部12は、MAを20未満の値である例えば19とし、MBを20以上の値である例えば20として、X0,…,X19の全てまたは一部のサンプルの値の絶対値和の平均値または二乗和の平均値を低域側平均エネルギーとし、X20,…,X31の全てまたは一部のサンプルの値の絶対値和の平均値または二乗和の平均値を高域側平均エネルギーとすればよい。ここでα=8とする場合には、摩擦音判定部12はX0,…,X8のサンプルの値の絶対値和の平均値または二乗和の平均値を低域側平均エネルギーとすればよい。またここでβ=4とする場合には、摩擦音判定部12はX20,…,X27のサンプルの値の絶対値和の平均値または二乗和の平均値を高域側平均エネルギーとすればよい。
 なお、図1に破線で示したように、摩擦音判定部12に周波数領域変換部11が出力した周波数スペクトル系列ではなく符号化装置に入力された時間領域の音信号を入力して、フレーム単位で、入力された時間領域の音信号を用いて、当該フレームの音信号が摩擦音的な音であるか否かを判定してもよい。この判定は、例えば、入力された時間領域の音信号の零交差点数を当該フレームが摩擦音的な音であることの指標として求め、求めた指標が予め定めた閾値より大きいか閾値以上である場合に摩擦音的な音であると判定し、そうでない場合すなわち求めた指標が予め定めた閾値以下であるか閾値より小さい場合に摩擦音的な音でないと判定することにより行えばよい。
 [摩擦音調整部13]
 摩擦音調整部13には、周波数領域変換部11が出力した周波数スペクトル系列X0,…,XN-1と、摩擦音判定部12が出力した摩擦音判定情報が入力される。摩擦音調整部13は、フレーム単位で、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、入力された周波数スペクトル系列X0,…,XN-1に対して以下の周波数スペクトルの調整処理を行って調整済周波数スペクトル系列Y0,…,YN-1を得て、得られた調整済周波数スペクトル系列Y0,…,YN-1を符号化部14へ出力し、摩擦音判定情報が摩擦音的な音でないことを示す場合には、周波数スペクトル系列X0,…,XN-1をそのまま調整済周波数スペクトル系列Y0,…,YN-1として符号化部14へ出力する(ステップS13)。
 1より大きくNより小さい整数値をMとすると、例えば、周波数スペクトル系列X0,…,XN-1のうちのサンプル番号がM未満のサンプルであるX0,…,XM-1によるサンプル群を低域側周波数スペクトル系列とし、周波数スペクトル系列X0,…,XN-1のうちのサンプル番号がM以上のサンプルであるXM,…,XN-1によるサンプル群を高域側周波数スペクトル系列とすると、摩擦音判定情報が摩擦音的な音であることを示す場合に摩擦音調整部13が行う調整処理は、低域側周波数スペクトル系列X0,…,XM-1の全部または一部のサンプルと、これと同数の、高域側周波数スペクトル系列XM,…,XN-1の全部または一部のサンプルと、を入れ替えたものを調整済周波数スペクトル系列Y0,…,YN-1として得る処理である。以下、摩擦音調整部13が行う調整処理を例示する。摩擦音調整部13が行う調整処理としては、以下に例示するものを含む様々な処理が有り得るが、何れの処理を行うかは予め定めておく。
 〔摩擦音調整部13が行う調整処理の例1〕
 摩擦音調整部13は、摩擦音判定情報が摩擦音的な音であることを示す場合には、例えば、下記のStep 1-1からStep 1-6までを行うことにより調整済周波数スペクトル系列Y0,…,YN-1を得る。なお、下記のStep 1-1からStep 1-6までは摩擦音調整部13の動作を分かり易く示すために6個のステップに分けてあるが、下記のStep 1-1からStep 1-6までを分けて行うのはあくまでも一例であり、摩擦音調整部13は、配列の要素の入れ替えやインデックスの付け替えを行う等によりStep 1-1からStep 1-6までと等価な処理を1回のステップで行ってもよい。
 Step 1-1:周波数スペクトル系列X0,…,XN-1のうちのサンプル番号がM未満のサンプルによるサンプル群を低域側周波数スペクトル系列X0,…,XM-1とし、周波数スペクトル系列X0,…,XN-1のうちのサンプル番号がM以上のサンプルによるサンプル群を高域側周波数スペクトル系列XM,…,XN-1とする。
 Step 1-2:Step 1-1で得た低域側周波数スペクトル系列X0,…,XM-1に含まれるC個(Cは正の整数)のサンプルを高域側への調整対象サンプルとして取り出す。
 Step 1-3:Step 1-1で得た高域側周波数スペクトル系列XM,…,XN-1に含まれるC個のサンプルを低域側への調整対象サンプルとして取り出す。
 Step 1-4:Step 1-2で低域側周波数スペクトル系列中の高域側への調整対象サンプルを取り出したサンプル位置に、Step 1-3で高域側周波数スペクトル系列から取り出した低域側への調整対象サンプルを配置したものを低域側調整済周波数スペクトル系列Y0,…,YM-1として得る。
 Step 1-5:Step 1-3で高域側周波数スペクトル系列中の低域側への調整対象サンプルを取り出したサンプル位置に、Step1-2で低域側周波数スペクトル系列から取り出した高域側への調整対象サンプルを配置したものを高域側調整済周波数スペクトル系列YM,…,YN-1として得る。
 Step 1-6:Step 1-4で得た低域側調整済周波数スペクトル系列Y0,…,YM-1と、Step 1-5で得た高域側調整済周波数スペクトル系列YM,…,YN-1と、を結合して、調整済周波数スペクトル系列Y0,…,YN-1を得る。
 N=32、M=20、C=8の場合のStep 1-1からStep 1-6までの例を図5に示す。摩擦音調整部13は、まず、周波数スペクトル系列X0,…,X31のうちのX0,…,X19を低域側周波数スペクトル系列とし、X20,…,X31を高域側周波数スペクトル系列とする (Step 1-1)。摩擦音調整部13は、低域側周波数スペクトル系列X0,…,X19に含まれる8個のサンプルX2,…,X9を高域側への調整対象サンプルとして取り出す(Step 1-2)。摩擦音調整部13は、高域側周波数スペクトル系列X20,…,X31に含まれる8個のサンプルX20,…,X27を低域側への調整対象サンプルとして取り出す(Step 1-3)。摩擦音調整部13は、低域側周波数スペクトル系列中のX2,…,X9があったサンプル位置にX20,…,X27を配置したものを低域側調整済周波数スペクトル系列Y0,…,Y19として得る(Step 1-4)。摩擦音調整部13は、高域側周波数スペクトル系列中のX20,…,X27があったサンプル位置にX2,…,X9を配置したものを高域側調整済周波数スペクトル系列Y20,…,Y31として得る(Step 1-5)。摩擦音調整部13は、低域側調整済周波数スペクトル系列Y0,…,Y19と高域側調整済周波数スペクトル系列Y20,…,Y31とを結合して調整済周波数スペクトル系列Y0,…,Y31を得る(Step 1-6)。
 〔摩擦音調整部13が行う調整処理の例2〕
 また、摩擦音調整部13は、上記のStep 1-4に代えて下記のStep 1-4'を行ってもよい。
 Step 1-4’:Step 1-2で低域側周波数スペクトル系列中の高域側への調整対象サンプルを取り出した残りのサンプルを低域側に詰めて、空いた高域側のサンプル位置にStep 1-3で高域側周波数スペクトル系列から取り出した低域側への調整対象サンプルを配置したもの、を低域側調整済周波数スペクトル系列Y0,…,YM-1として得る。
 摩擦音調整部13がStep 1-4に代えてStep 1-4'を行うことで、後段の符号化部14では、対応する周波数が低いサンプルほど聴覚的な重要度を高くして符号化することが可能となる。
 このように、摩擦音調整部13は、摩擦音判定部12が摩擦音的な音であると判定した場合には、調整済周波数スペクトル系列が低域側調整済周波数スペクトル系列と高域側調整済周波数スペクトル系列により構成されるとして、低域側周波数スペクトル系列中の一部のサンプルを高域側調整済周波数スペクトル系列中に含め、低域側周波数スペクトル系列中の残りのサンプルを低域側調整済周波数スペクトル系列中の低域側に配置し、高域側周波数スペクトル系列中の一部のサンプルを低域側調整済周波数スペクトル系列中の高域側に配置し、高域側周波数スペクトル系列中の残りのサンプルを高域側調整済周波数スペクトル系列中に含めることにより調整済周波数スペクトル系列を得てもよい。
〔摩擦音調整部13が行う調整処理の例3〕
 同様に、摩擦音調整部13は、上記のStep 1-5に代えて下記のStep 1-5'を行ってもよい。
 Step 1-5’:Step 1-3で高域側周波数スペクトル系列中の低域側への調整対象サンプルを取り出した残りのサンプルを低域側に詰めて、空いた高域側のサンプル位置にStep1-2で低域側周波数スペクトル系列から取り出した高域側への調整対象サンプルを配置したもの、を高域側調整済周波数スペクトル系列YM,…,YN-1を得る。
 摩擦音調整部13がStep 1-5に代えてStep 1-5'を行うことで、後段の符号化部14では、元は高域側にあったサンプルのほうを元は低域側にあったサンプルよりも聴覚的な重要度を高くして符号化することが可能となる。
 N=32、M=20、C=8の場合のStep 1-1からStep 1-6までのうちのStep 1-4に代えてStep 1-4'を行い、Step 1-5に代えてStep 1-5'を行う例を図6に示す。摩擦音調整部13は、まず、周波数スペクトル系列X0,…,X31のうちのX0,…,X19を低域側周波数スペクトル系列とし、X20,…,X31を高域側周波数スペクトル系列とする (Step 1-1)。摩擦音調整部13は、低域側周波数スペクトル系列X0,…,X19に含まれる8個のサンプルX2,…,X9を高域側への調整対象サンプルとして取り出す(Step 1-2) 。摩擦音調整部13は、高域側周波数スペクトル系列X20,…,X31に含まれる8個のサンプルX20,…,X27を低域側への調整対象サンプルとして取り出す(Step 1-3)。摩擦音調整部13は、低域側周波数スペクトル系列中のX10,…,X19を低域側に詰め、低域側に詰めたX10,…,X19の高域側にX20,…,X27を配置したものを低域側調整済周波数スペクトル系列Y0,…,Y19として得る(Step 1-4') 。摩擦音調整部13は、高域側周波数スペクトル系列中のX28,…,X31を低域側に詰め、低域側に詰めたX28,…,X31の高域側にX2,…,X9を配置したものを高域側調整済周波数スペクトル系列Y20,…,Y31として得る(Step 1-5')。摩擦音調整部13は、低域側調整済周波数スペクトル系列Y0,…,Y19と高域側調整済周波数スペクトル系列Y20,…,Y31とを結合して調整済周波数スペクトル系列Y0,…,Y31を得る(Step 1-6)。
 このようにして、摩擦音調整部13は、摩擦音判定部12が摩擦音的な音であると判定した場合には、調整済周波数スペクトル系列が低域側調整済周波数スペクトル系列と高域側調整済周波数スペクトル系列により構成されるとして、低域側周波数スペクトル系列中の一部のサンプルを高域側調整済周波数スペクトル系列中の高域側に配置し、低域側周波数スペクトル系列中の残りのサンプルを低域側調整済周波数スペクトル系列中に含め、高域側周波数スペクトル系列中の一部のサンプルを低域側調整済周波数スペクトル系列中に含め、高域側周波数スペクトル系列中の残りのサンプルを高域側調整済周波数スペクトル系列中の低域側に配置することにより調整済周波数スペクトル系列を得てもよい。
 〔摩擦音調整部13が行う調整処理の例4〕
 また、摩擦音調整部13は、上記のStep 1-2における低域側周波数スペクトル系列からの高域側への調整対象サンプルには、周波数が最も低いものから1個または複数個のサンプルを含めないようにするのが望ましい。これは、周波数が低いサンプルはフレーム間の信号波形の連続性に寄与するサンプルであり、符号化部14でより多くのビットを割り当てた符号化をするべきだからである。すなわち、γを正の整数としたとき、低域側周波数スペクトル系列のうちのXγ,…,XM-1からC個の調整対象サンプルを選ぶようにするのがよく、例えばXγ,…,Xγ+C-1を調整対象サンプルとすればよい。なお、γの値を大きくすればフレーム間の信号波形の連続性は高まるが、その他のサンプルに符号化部14で割り当てられるビット数は相対的に少なくなることから、フレーム内の復号音の聴覚品質が低くなる。従って、γの値は、これらのことを考慮して、事前の実験等により定めるとよい。
 上述した図5と図6の例では、γ=2とし、低域側周波数スペクトル系列のうちの周波数が最も低いものから2個のサンプルであるX0とX1を、低域側周波数スペクトル系列からの高域側への調整対象サンプルに含めないようにしている。
 言い換えれば、摩擦音調整部13は、摩擦音判定部12が摩擦音的な音であると判定した場合には、低域側周波数スペクトル系列中の高域側にある一部と、これと同数の、高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得てもよい。
 〔摩擦音調整部13が行う調整処理の例5〕
 後述する符号化部14での符号化処理においては、符号化処理で得るビット数の最大値の制約から、調整済周波数スペクトル系列のうちの周波数が最も高いものから何個かのサンプルにはビットが全く割り当てられないことがある。この場合は、高域側周波数スペクトル系列XM,…,XN-1のうちの周波数が最も高いものから1個または複数個のサンプルについては符号化対象とせずに、高域側周波数スペクトル系列XM,…,XN-1のうちの低域側にある残りのサンプルを符号化対象とするのがよい。従って、この場合には、摩擦音調整部13は、上記のStep 1-3における高域側周波数スペクトル系列からの低域側への調整対象サンプルには、高域側周波数スペクトル系列のうちの周波数が最も高いものから1個または複数個のサンプルは含めないようにする。
 上述した図5と図6の例では、高域側周波数スペクトル系列のうちの周波数が最も高いものから4個のサンプルであるX28,…,X31を、高域側周波数スペクトル系列からの低域側への調整対象サンプルに含めないようにしている。
 言い換えれば、摩擦音調整部13は、摩擦音判定部12が摩擦音的な音であると判定した場合には、低域側周波数スペクトル系列の全部または一部と、これと同数の、高域側周波数スペクトル系列中の低域側にある一部と、を入れ替えたものを調整済周波数スペクトル系列として得てもよい。
 [符号化部14]
 符号化部14には、摩擦音調整部13が出力した調整済周波数スペクトル系列Y0,…,YN-1が入力される。符号化部14は、フレーム単位で、入力された調整済周波数スペクトル系列Y0,…,YN-1を、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法で、例えば非特許文献1と同じ方法で、符号化してスペクトル符号を得て、得たスペクトル符号を多重化部15へ出力する(ステップS14)。
 ここで、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法とは、例えば、調整済周波数スペクトル系列Y0,…,YN-1を複数の部分系列に分け、サンプル番号が小さいほうの部分系列ほど小さな値の利得で部分系列に含まれる各サンプルを除算して、除算結果の整数値それぞれを可変長符号や固定長符号を用いて符号化したり、ベクトル量子化をしたりして、調整済周波数スペクトル系列に対応する符号であるスペクトル符号を得る方法などである。その際、サンプル番号が大きいほうの一部の部分系列については、当該部分系列に対応する符号を得ないようにしてもよい。すなわち、サンプル番号が大きいほうの一部の部分系列については、ビットを割り当てないようにしてもよい。
 調整済周波数スペクトル系列Y0,…,YN-1のうちのサンプル番号が小さいほうの部分系列については、部分系列に含まれるサンプルの値それぞれを小さな値の利得で除算して得た大きな値の整数値それぞれを符号化することになるため、各整数値は多くのビットを割り当てて符号化することになる。一方、調整済周波数スペクトル系列Y0,…,YN-1のうちのサンプル番号が大きいほうの部分系列については、部分系列に含まれるサンプルの値それぞれを大きな値の利得で除算して得た小さな値の整数値それぞれを符号化することになるため、各整数値は少ないビットを割り当てて符号化することになる。部分系列に含まれるサンプルの値それぞれを大きな値の利得で除算して得た整数値は0であることも多い。
 なお、図1に一点鎖線で示すように、摩擦音調整部13と符号化部14とを摩擦音対応符号化部17とすると、摩擦音対応符号化部17は、摩擦音判定部12が摩擦音的な音であると判定した場合には、周波数スペクトル系列を高域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得て、前記以外の場合には、周波数スペクトル系列を低域側に優先してビットを割り当てる符号化処理で符号化してスペクトル符号を得ていると言える。
 [多重化部15]
 多重化部15には、摩擦音判定部12が出力した摩擦音判定情報と符号化部14が出力したスペクトル符号が入力される。多重化部15は、フレーム単位で、入力された摩擦音判定情報に対応する符号とスペクトル符号とを繋ぎ合わせて得た符号を出力する(ステップS15)。摩擦音判定部12が出力した摩擦音判定情報が1ビットの情報である場合には、摩擦音判定部12が出力して多重化部15に入力された摩擦音判定情報そのものを摩擦音判定情報に対応する符号とすればよい。
 ≪復号装置≫
 図3を参照して、第一実施形態の復号装置の処理手続きを説明する。図3に例示するように、第一実施形態の復号装置は、多重分離部21、復号部22、摩擦音調整解除部23、時間領域変換部24を含む。復号装置には符号化装置が出力した符号が入力される。復号装置に入力された符号は多重分離部21へ入力される。復号装置は、各部で所定の時間長のフレーム単位での処理を行う。第一実施形態の復号方法は、復号装置の各部が、以下及び図4に例示するステップS21からステップS24の処理を行うことにより実現される。
 [多重分離部21]
 多重分離部21には、符号化装置が出力した符号が入力される。多重分離部21は、フレーム単位で、入力された符号を摩擦音判定情報に対応する符号とスペクトル符号に分離して、摩擦音判定情報に対応する符号から得た摩擦音判定情報を摩擦音調整解除部23へ、スペクトル符号を復号部22へそれぞれ出力する(ステップS21)。
 摩擦音判定情報を1ビットの情報とする場合には、多重分離部21に入力された摩擦音判定情報に対応する符号そのものを摩擦音判定情報とすればよい。
 [復号部22]
 復号部22には、多重分離部21の出力したスペクトル符号が入力される。復号部22は、フレーム単位で、符号化装置の符号化部14が行った符号化方法に対応する復号方法により、入力されたスペクトル符号を復号して復号調整済周波数スペクトル系列^Y0,…,^YN-1を得て、得た復号調整済周波数スペクトル系列^Y0,…,^YN-1を摩擦音調整解除部23へ出力する(ステップS22)。
 符号化装置の符号化部14の説明箇所に上述した符号化方法に対応する復号方法によりスペクトル符号を復号する場合には、復号部22は、スペクトル符号を復号して整数値列を得て、サンプル番号が小さいほうの部分系列ほど小さな値の利得を整数値に乗算して得たサンプル値の複数の部分系列を結合して復号調整済周波数スペクトル系列^Y0,…,^YN-1を得る。サンプル番号が大きいほうの一部の部分系列について符号化装置でビットの割り当てなかった場合には、例えば、その部分系列に対応する復号調整済周波数スペクトルの値は0とする。また、整数値が0であるサンプルについては利得を乗算して得た値も0であるので、復号調整済周波数スペクトルの値は0となる。すなわち、サンプル番号が大きいほうの一部の部分系列については整数値が0であることが多く、復号調整済周波数スペクトルの値は0であることが多い。
 このようにして、復号部22は、所定の時間区間のフレーム単位のスペクトル符号であって、低域側に優先してビットが割り当てられているスペクトル符号、を復号して、復号音信号に対応する周波数領域のサンプル列(復号調整済周波数スペクトル系列)を得る。
 [摩擦音調整解除部23]
 摩擦音調整解除部23には、多重分離部21が出力した摩擦音判定情報と復号部22が出力した復号調整済周波数スペクトル系列^Y0,…,^YN-1が入力される。摩擦音調整解除部23は、フレーム単位で、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、入力された復号調整済周波数スペクトル系列^Y0,…,^YN-1に対して以下の調整解除処理を行って復号周波数スペクトル系列^X0,…,^XN-1を得て、得られた復号周波数スペクトル系列^X0,^X1,…,^XN-1を時間領域変換部24へ出力し、摩擦音判定情報が摩擦音的な音でないと示す場合には、復号調整済周波数スペクトル系列^Y0,…,^YN-1をそのまま復号周波数スペクトル系列^X0,…,^XN-1として時間領域変換部24へ出力する(ステップS23)。
 1より大きくNより小さい整数値をMとすると、例えば、復号調整済周波数スペクトル系列^Y0,…,^YN-1のうちのサンプル番号がM未満のサンプルである^Y0,…,^YM-1によるサンプル群を低域側復号調整済周波数スペクトル系列とし、復号調整済周波数スペクトル系列^Y0,…,^YN-1のうちのサンプル番号がM以上のサンプルである^YM,…,^YN-1によるサンプル群を高域側復号調整済周波数スペクトル系列とすると、摩擦音判定情報が摩擦音的な音であることを示す場合に摩擦音調整解除部23が行う調整解除処理は、低域側復号調整済周波数スペクトル系列^Y0,…,^YN-1の全部または一部のサンプルと、これと同数の、高域側復号調整周波数スペクトル系列^YM,…,^YN-1の全部または一部のサンプルと、を入れ替えたものを復号周波数スペクトル系列^X0,…,^XN-1として得る処理である。摩擦音調整解除部23が行う調整解除処理としては、以下に例示するものを含む様々な処理が有り得るが、対応する符号化装置の摩擦音調整部13が行った調整処理の逆処理となるよう調整解除処理を予め定めておく。
 言い換えれば、摩擦音調整解除部23は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、復号部22が得た周波数領域のサンプル列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列(低域側復号調整済周波数スペクトル系列)の全部または一部と、これと同数の、復号部22が得た周波数領域のサンプル列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列(高域側復号調整済周波数スペクトル系列)の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列(復号周波数スペクトル系列)として得て、前記以外の場合には、復号部22が得た周波数領域のサンプル列(復号調整済周波数スペクトル系列)をそのまま復号音信号の周波数スペクトル系列(復号周波数スペクトル系列)として得る。
 〔摩擦音調整解除部23が行う調整解除処理の例1〕
 摩擦音調整解除部23は、摩擦音判定情報が摩擦音的な音であることを示す場合には、例えば、下記のStep 2-1からStep 2-6までを行うことにより復号周波数スペクトル系列^X0,…,^XN-1を得る。なお、下記のStep 2-1からStep 2-6までは摩擦音調整解除部23の動作を分かり易く示すために6個のステップに分けてあるが、摩擦音調整解除部23は、下記のStep 2-1からStep 2-6までを分けて行うのはあくまでも一例であり、配列の要素の入れ替えやインデックスの付け替えを行う等によりStep 2-1からStep 2-6までと等価な処理を1回のステップで行ってもよい。
 Step 2-1:復号調整済周波数スペクトル系列^Y0,…,^YN-1のうちのサンプル番号がM未満のサンプルによるサンプル群を低域側復号調整済周波数スペクトル系列^Y0,…,^YM-1とし、復号調整済周波数スペクトル系列^Y0,…,^YN-1のうちのサンプル番号がM以上のサンプルによるサンプル群を高域側復号調整済周波数スペクトル系列^YM,…,^YN-1とする。
 Step 2-2:Step 2-1で得た低域側復号調整済周波数スペクトル系列^Y0,…,^YM-1に含まれるC個(Cは正の整数)のサンプルを高域側への調整対象サンプルとして取り出す。
 Step 2-3:Step 2-1で得た高域側復号調整済周波数スペクトル系列^YM,…,^YN-1に含まれるC個のサンプルを低域側への調整対象サンプルとして取り出す。
 Step 2-4:Step 2-2で低域側復号調整済周波数スペクトル系列中の高域側への調整対象サンプルを取り出したサンプル位置に、Step 2-3で高域側復号調整済周波数スペクトル系列から取り出した低域側への調整対象サンプルを配置したものを低域側復号周波数スペクトル系列^X0,…,^XM-1として得る。
 Step 2-5:Step 2-3で高域側復号調整済周波数スペクトル系列中の低域側への調整対象サンプルを取り出したサンプル位置に、Step2-2で低域側復号調整済周波数スペクトル系列から取り出した高域側への調整対象サンプルを配置したものを高域側復号周波数スペクトル系列^XM,…,^XN-1として得る。
 Step 2-6:Step 2-4で得た低域側復号周波数スペクトル系列^X0,…,^XM-1と、Step 1-5で得た高域側復号周波数スペクトル系列^XM,…,^XN-1と、を結合して、復号周波数スペクトル系列^X0,…,^XN-1を得る。
 N=32、M=20、C=8の場合のStep 2-1からStep 2-6までの例を図7に示す。摩擦音調整解除部23は、まず、復号調整済周波数スペクトル系列^Y0,…,^Y31のうちの^Y0,…,^Y19を低域側復号調整済周波数スペクトル系列とし、^Y20,…,^Y31を高域側復号調整済周波数スペクトル系列とする(Step 2-1)。摩擦音調整解除部23は、低域側復号調整済周波数スペクトル系列^Y0,…,^Y19に含まれる8個のサンプル^Y2,…,^Y9を高域側への調整対象サンプルとして取り出す(Step 2-2)。摩擦音調整解除部23は、高域側復号調整済周波数スペクトル系列^Y20,…,^Y31に含まれる8個のサンプル^Y20,…,^Y27を低域側への調整対象サンプルとして取り出す(Step 2-3)。摩擦音調整解除部23は、低域側復号調整済周波数スペクトル系列中の^Y2,…,^Y9があったサンプル位置に^Y20,…,^Y27を配置したものを低域側復号周波数スペクトル系列^X0,…,^X19として得る(Step 2-4)。摩擦音調整解除部23は、高域側復号調整済周波数スペクトル系列中の^Y20,…,^Y27があったサンプル位置に^Y2,…,^Y9を配置したものを高域側復号周波数スペクトル系列^X20,…,^X31として得る(Step 2-5)。摩擦音調整解除部23は、低域側復号周波数スペクトル系列^X0,…,^X19と高域側復号周波数スペクトル系列^X20,…,^X31とを結合して復号周波数スペクトル系列^X0,…,^X31を得る(Step 2-6)。
 〔摩擦音調整解除部23が行う調整解除処理の例2〕
 摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-4に代えてStep 1-4'を行った場合には、上記のStep 2-4に代えて下記のStep 2-4'を行う。
 Step 2-4’:Step 2-2で低域側復号調整済周波数スペクトル系列中の高域側への調整対象サンプルを取り出した残りのサンプルを低域側と高域側に詰めて、空いた間のサンプル位置にStep 2-3で高域側復号調整済周波数スペクトル系列から取り出した低域側への調整対象サンプルを配置したもの、を低域側復号周波数スペクトル系列^X0,…,^XM-1として得る。
〔摩擦音調整部13が行う調整処理の例3〕
 摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-5に代えてStep 1-5'を行った場合には、上記のStep 2-5に代えて下記のStep 2-5'を行う。
 Step 2-5’:Step 2-3で高域側復号調整済周波数スペクトル系列中の低域側への調整対象サンプルを取り出した残りのサンプルを高域側に詰めて、空いた低域側のサンプル位置にStep2-2で低域側復号調整済周波数スペクトル系列から取り出した高域側への調整対象サンプルを配置したもの、を高域側復号周波数スペクトル系列^XM,…,^XN-1を得る。
 N=32、M=20、C=8の場合のStep 2-1からStep 2-6までのうちのStep 2-4に代えてStep 2-4'を行い、Step 2-5に代えてStep 2-5'を行う例を図8に示す。摩擦音調整解除部23は、まず、復号調整済周波数スペクトル系列^Y0,…,^Y31のうちの^Y0,…,^Y19を低域側復号調整済周波数スペクトル系列とし、^Y20,…,^Y31を高域側復号調整済周波数スペクトル系列とする(Step 2-1)。摩擦音調整解除部23は、低域側復号調整済周波数スペクトル系列^Y0,…,^Y19に含まれる8個のサンプル^Y12,…,^Y19を高域側への調整対象サンプルとして取り出す(Step 2-2) 。摩擦音調整解除部23は、高域側復号調整済周波数スペクトル系列^Y20,…,^Y31に含まれる8個のサンプル^Y24,…,^Y31を低域側への調整対象サンプルとして取り出す(Step 2-3) 。摩擦音調整解除部23は、低域側復号調整済周波数スペクトル系列中の^Y0,^Y1を低域側に詰め、^Y2,…,^Y11を高域側に詰め、空いた間に^Y24,…,^Y31を配置したものを低域側復号周波数スペクトル系列^X0,…,^X19として得る(Step 2-4')。摩擦音調整解除部23は、高域側復号調整済周波数スペクトル系列中の^Y20,…,^Y23を高域側に詰め、高域側に詰めた^Y20,…,^Y23の低域側に^Y12,…,^Y19を配置したものを高域側復号周波数スペクトル系列^X20,…,^X31として得る(Step 2-5') 。摩擦音調整解除部23は、低域側復号周波数スペクトル系列^X0,…,^X19と高域側復号周波数スペクトル系列^X20,…,^X31とを結合して復号周波数スペクトル系列^X0,…,^X31を得る(Step 1-6)。
 〔摩擦音調整解除部23が行う調整解除処理の例4〕
 摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-2において低域側周波数スペクトル系列からの高域側への調整対象サンプルに周波数が最も低いものから1個または複数個のサンプルを含めないようにした場合には、Step 2-2において、低域側復号調整済周波数スペクトル系列からの高域側への調整対象サンプルに周波数が最も低いものから1個または複数個のサンプルを含めないようにする。
 〔摩擦音調整解除部23が行う調整解除処理の例5〕
 摩擦音調整解除部23は、符号化装置の摩擦音調整部13がStep 1-3において高域側周波数スペクトル系列からの低域側への調整対象サンプルに周波数が最も高いものから1個または複数個のサンプルを含めないようにした場合には、Step 2-3において、高域側復号調整済周波数スペクトル系列からの低域側への調整対象サンプルに周波数が最も高いものから1個または複数個のサンプルを含めないようにする。
 なお、図3に一点鎖線で示すように、復号部22と摩擦音調整解除部23を摩擦音対応復号部26とすると、摩擦音対応復号部26は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、スペクトル符号には高域側に優先してビットが割り当てられているとして、スペクトル符号を復号して周波数スペクトル系列(復号周波数スペクトル系列)を得て、前記以外の場合には、スペクトル符号には低域側に優先してビットが割り当てられているとして、スペクトル符号を復号して周波数スペクトル系列(復号周波数スペクトル系列)を得ていると言える。
 [時間領域変換部24]
 時間領域変換部24には、摩擦音調整解除部23が出力した復号周波数スペクトル系列^X0,…,^XN-1が入力される。時間領域変換部24は、フレーム毎に、復号周波数スペクトル系列^X0,…,^XN-1を、符号化装置の周波数領域変換部11が行った周波数領域への変換方法に対応する時間領域への変換方法、例えば逆MDCT、を用いて時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得て出力する(ステップS24)。
 なお、符号化装置の周波数領域変換部11において、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理を施した場合は、時間領域変換部24は、これらの処理に対応する逆フィルタ処理や逆圧伸処理を復号周波数スペクトル系列に行ったものを時間領域の信号に変換して得た復号音信号を出力する。
 なお、時間領域の復号音信号ではなく周波数領域の復号音信号を復号装置が出力する構成としてもよい。この構成とする場合には、復号装置には時間領域変換部24を含まないでよく、摩擦音調整解除部23が得たフレーム単位の復号周波数スペクトル系列を時間区間順に連結して周波数領域の復号音信号として出力すればよい。
 ≪作用効果≫
 第一実施形態の符号化装置と復号装置によれば、従来のような低周波数のスペクトルに対してよりビット数を割くように設計がされた符号化処理やこれらに対応する復号処理が行われる構成に、摩擦音調整処理やこれに対応する摩擦音調整解除処理を付加した構成とすることで、摩擦音などを含む音信号であっても聴感的な劣化が少なくなるように圧縮符号化することが可能となる。
 摩擦音などを含む音信号であっても聴感的な劣化が少なくなるように圧縮符号化する従来技術としてはエネルギーが大きいサブバンドに優先的にビットを割り当てる符号化・復号技術も存在する。しかし、この技術では各サブバンドについてのビット割り当ての情報を符号化側から復号側に送る必要がある。これに対し、第一実施形態の符号化装置と復号装置によれば、1ビットの摩擦音判定情報を符号化側から復号側に送るだけで、摩擦音などを含む音信号であっても聴感的な劣化が少なくなるように圧縮符号化することが可能となる。
 <第一実施形態の変形例>
 第一実施形態の変形例は、符号化装置に含まれる摩擦音判定部12のみが第一実施形態と異なる。符号化装置のその他の構成や復号装置の構成は第一実施形態と同じである。以下では、第一実施形態と異なる摩擦音判定部12の動作と、それによる符号化装置と復号装置での作用効果について説明する。
 [摩擦音判定部12]
 第一実施形態の変形例の摩擦音判定部12は、図示しない比較結果記憶部を備える。
 摩擦音判定部12は、フレーム単位で、当該フレームの入力された周波数スペクトル系列X0,…,XN-1のうちの低域側にあるサンプルの平均エネルギーに対する入力された周波数スペクトル系列X0,…,XN-1のうちの高域側にあるサンプルの平均エネルギーの比が大きいほど大きくなる指標を当該フレームが摩擦音的な音であることの指標として求め、求めた指標が予め定めた閾値より大きいか閾値以上であるか否かを表す比較結果情報を得る。
 比較結果記憶部は、この比較結果情報を、予め定めた所定個数の過去のフレームの分だけ記憶しておくものである。すなわち、摩擦音判定部12は、フレーム単位で、当該フレームの周波数スペクトル系列から計算された比較結果情報を比較結果記憶部に新たに記憶するとともに、記憶された一番古い比較結果情報を削除する。
 摩擦音判定部12は、当該フレームの周波数スペクトル系列から計算された比較結果情報と、比較結果記憶部に記憶された所定個数の過去のフレームの比較結果情報と、を用いて、これらの比較結果情報のうちの半数以上の比較結果情報または半数より多くの比較結果情報が、予め定めた閾値より大きいか閾値以上であることを表す場合には摩擦音的な音であると判定し、そうでない場合には摩擦音的な音でないと判定し、その判定結果を摩擦音判定情報として摩擦音調整部13及び多重化部15へ出力する。
 このようにして、摩擦音判定部12は、当該フレームを含む複数のフレームにおいて、音信号の周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が予め定めた閾値より大きいか閾値以上であるフレーム数が、そうでないフレーム数より多いかまたはそうでないフレーム数以上である場合に、当該フレームについて音信号が摩擦音的な音であると判定してもよい。
 摩擦音判定情報として例えば1ビットの情報を用いればよいこと、平均エネルギーとして全てまたは一部のサンプルの値の絶対値和の平均値または二乗和の平均値を用いればよいこと、などは第一実施形態の摩擦音判定部12と同様である。
 ≪作用効果≫
 第一実施形態の符号化装置と復号装置での処理を行うと、調整処理と調整解除処理が行われるフレームについては高域成分の符号化歪が少なく低域成分の符号化歪が多い復号音が得られ、調整処理と調整解除処理が行われないフレームについては高域成分の符号化歪が多く低域成分の符号化歪が少ない復号音が得られることから、調整処理と調整解除処理が行われるフレームと調整処理と調整解除処理が行われないフレームとの境界では復号音の波形の不連続が発生する可能性がある。すなわち、摩擦音判定部12の判定結果が頻繁に切り替わると、復号音の波形の不連続が頻繁に発生することになり、この不連続が知覚されることにより聴覚品質が劣化してしまう可能性がある。第一実施形態の変形例の符号化装置は、第一実施形態の符号化装置よりも、摩擦音判定部12の判定結果が頻繁に切り替わることを抑制することができ、復号音の波形の不連続の発生頻度を抑制することができ、この不連続が知覚されることによる聴覚品質の劣化を抑えることができる。
 第一実施形態の変形例の摩擦音判定部12では、判定に用いる比較結果情報の個数を増やせば増やすほど、摩擦音判定部12の判定結果が頻繁に切り替わることを抑制することができ、復号音の波形の不連続の発生頻度を抑制することができるが、判定に用いる比較結果情報の個数は、不連続が知覚されることによる聴覚品質の劣化とフレーム毎の復号音の聴覚品質とのトレードオフを考慮して、決める必要がある。例えば、フレーム長が3 msである場合には判定に用いる比較結果情報の個数を16個とするとよい。
 <第二実施形態>
 この発明の第二実施形態のシステムは、第一実施形態のシステムと同様に、符号化装置と復号装置を含む。
 第二実施形態が第一実施形態と異なるのは、符号化装置でビットが割り当てられなかった周波数スペクトルを復号装置で復元すること、すなわち、復号装置で帯域を拡張することである。第二実施形態の復号装置は、摩擦音判定情報に基づいて入れ替わった後の周波数スペクトルである復号調整済周波数スペクトル系列に対して帯域を拡張する。符号化装置でビットが割り当てられない周波数スペクトルは、摩擦音的な音ではない時間区間については高域に、摩擦音的な音の時間区間については低域に、それぞれ含まれている。そこで、第二実施形態では、摩擦音的な音でない時間区間については、低域の周波数スペクトルの複製により高域の周波数スペクトルを再現することで帯域を拡張し、摩擦音的な音の時間区間については、高域の周波数スペクトルの複製により低域の周波数スペクトルを再現することで帯域を拡張する。
 第二実施形態における周波数スペクトルの複製は、複製の元となる周波数スペクトルに利得を乗算することにより行う。そこで、第二実施形態の符号化装置は、第一実施形態の符号化装置が行うことに加えて、第二実施形態の復号装置が用いる利得を求めて、求めた利得に対応する符号を出力する。
 ≪符号化装置≫
 図9を参照して、第二実施形態の符号化装置の処理手続きを説明する。図9に例示するように、第二実施形態の符号化装置は、周波数領域変換部11、摩擦音判定部12、摩擦音調整部13、符号化部14、帯域拡張利得符号化部16、多重化部15を含む。図9の第二実施形態の符号化装置が図1の符号化装置と異なるのは、帯域拡張利得符号化部16を備え、多重化部15が、帯域拡張利得符号化部16が出力した帯域拡張利得符号も出力する符号に含めることである。第二実施形態の符号化装置のその他の構成、すなわち、周波数領域変換部11、摩擦音判定部12、摩擦音調整部13、符号化部14の動作は第一実施形態の符号化装置のものと同じであるので、以下では動作の要部のみを説明する。
 符号化装置には、所定の時間長のフレーム単位で時間領域の音信号が入力される。符号化装置に入力された時間領域の音信号は周波数領域変換部11へ入力される。符号化装置は、各部で所定の時間長のフレーム単位での処理を行う。第二実施形態の符号化方法は、符号化装置の各部が、以下及び図10に例示するステップS11からステップS16の処理を行うことにより実現される。
 [周波数領域変換部11]
 周波数領域変換部11は、フレーム単位で、符号化装置に入力された時間領域の音信号を周波数領域のN点の周波数スペクトル系列X0,…,XN-1に変換して出力する(ステップS11)。
 [摩擦音判定部12]
 摩擦音判定部12は、フレーム単位で、周波数領域変換部11が得た周波数スペクトル系列X0,…,XN-1または符号化装置に入力された時間領域の音信号を用いて、音信号が摩擦音的な音であるか否かを判定し、その判定結果を摩擦音判定情報として出力する(ステップS12)。第一実施形態の符号化装置の摩擦音判定部12は摩擦音判定情報を摩擦音調整部13と多重化部15に出力したが、第二実施形態の符号化装置の摩擦音判定部12は、摩擦音判定情報を摩擦音調整部13と多重化部15に加えて帯域拡張利得符号化部16へも出力する。なお、第二実施形態の符号化装置の摩擦音判定部12は、第一実施形態の変形例の符号化装置の摩擦音判定部12と同じ動作をしてもよい。
 言い換えれば、摩擦音判定部12は、あるフレームの周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が、予め定めた閾値より大きいか閾値以上である場合に、音信号が摩擦音的な音であると判定してもよい。
 また、摩擦音判定部12は、あるフレームを含む複数のフレームにおいて、周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が予め定めた閾値より大きいか閾値以上であるフレーム数が、そうでないフレーム数より多いかまたはそうでないフレーム数以上である場合に、音信号が摩擦音的な音であると判定してもよい。
 [摩擦音調整部13]
 摩擦音調整部13は、フレーム単位で、摩擦音判定部12が得た摩擦音判定情報が摩擦音的な音であることを示す場合には、周波数領域変換部11が得た周波数スペクトル系列X0,…,XN-1に対して周波数スペクトルの調整処理を行って調整済周波数スペクトル系列Y0,…,YN-1を得て、得られた調整済周波数スペクトル系列Y0,…,YN-1を符号化部14へ出力し、摩擦音判定部12が得た摩擦音判定情報が摩擦音的な音でないことを示す場合には、周波数領域変換部11が得た周波数スペクトル系列X0,…,XN-1をそのまま調整済周波数スペクトル系列Y0,…,YN-1として符号化部14へ出力する(ステップS13)。
 摩擦音調整部13が行う周波数スペクトルの調整処理は、周波数スペクトル系列X0,…,XN-1のうちの低域側周波数スペクトル系列X0,…,XM-1の全部または一部のサンプルと、これと同数の、周波数スペクトル系列X0,X…,XN-1のうちの高域側周波数スペクトル系列XM,…,XN-1の全部または一部のサンプルと、を入れ替えたものを調整済周波数スペクトル系列Y0,…,YN-1として得る処理である。
 言い換えれば、摩擦音調整部13は、摩擦音判定部12が摩擦音的な音であると判定した場合には、音信号の周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数スペクトル系列の全部または一部と、これと同数の、周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得て、前記以外の場合には、音信号に対応する周波数スペクトル系列をそのまま調整済周波数スペクトル系列として得る。
 [符号化部14]
 符号化部14は、フレーム単位で、摩擦音調整部13が得た調整済周波数スペクトル系列Y0,…,YN-1を、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法で、符号化してスペクトル符号を得て、得たスペクトル符号を多重化部15へ出力する(ステップS14)。
 第一実施形態の符号化装置の符号化部14における、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法は、調整済周波数スペクトル系列の全てのサンプルにビットを割り当てる方法でも、サンプル番号が大きいほうの一部のサンプルにビットを割り当てない方法でもよかった。これに対し、第二実施形態の符号化装置の符号化部14における、サンプル番号が小さいサンプルに対して優先してビットを割り当てる方法は、調整済周波数スペクトル系列のうち、サンプル番号が大きいほうの一部の調整済周波数スペクトルにビットを割り当てない方法に限定されるものとする。なお、このビットを割り当てる方法は、予め定めて符号化部14に記憶しておくとともに、後述する帯域拡張利得符号化部16にも記憶しておく。
 符号化部14は、例えば、調整済周波数スペクトル系列Y0,…,YN-1のN個の調整済周波数スペクトルのうちのサンプル番号が大きいほうのK個(K≦N/2)の調整済周波数スペクトルYN-K,…,YN-1にはビットを割り当てず、残りのサンプル番号が小さいほうからN-K個の調整済周波数スペクトルY0,…,YN-K-1にビットを割り当てて、調整済周波数スペクトル系列Y0,…,YN-1を符号化してスペクトル符号を得て、得たスペクトル符号を多重化部15へ出力する。すなわち、符号化部14は、実質的には調整済周波数スペクトル系列Y0,…,YN-1のN個の調整済周波数スペクトルのうちのサンプル番号が小さいほうからN-K個の調整済周波数スペクトルY0,…,YN-K-1のみを符号化してスペクトル符号を得る。
 [帯域拡張利得符号化部16]
 帯域拡張利得符号化部16には、摩擦音調整部13が出力した調整済周波数スペクトル系列Y0,…,YN-1が少なくとも入力される。帯域拡張利得符号化部16は、フレーム単位で、入力された調整済周波数スペクトル系列Y0,…,YN-1に少なくとも基づいて下記のように帯域拡張利得符号を得て、得た帯域拡張利得符号を多重化部15へ出力する(ステップS16)。
 帯域拡張利得符号化部16に調整済周波数スペクトル系列Y0,…,YN-1のみが入力される構成とする場合には、例えば下記の例1のように、帯域拡張利得符号化部16は、フレーム単位で、入力された調整済周波数スペクトル系列Y0,…,YN-1に基づいて帯域拡張利得符号を得て、得た帯域拡張利得符号を多重化部15へ出力する。
 また、帯域拡張利得符号化部16には、調整済周波数スペクトル系列Y0,…,YN-1に加えて摩擦音判定部12が出力した摩擦音判定情報も入力される構成としてもよい。この構成とする場合には、例えば下記の例2のように、帯域拡張利得符号化部16は、フレーム単位で、入力された調整済周波数スペクトル系列Y0,…,YN-1と摩擦音判定情報に基づいて帯域拡張利得符号を得て、得た帯域拡張利得符号を多重化部15へ出力する。
 帯域拡張利得符号化部16の記憶部161には、利得ベクトルの候補である利得候補ベクトルとその利得候補ベクトルを特定可能な符号とが組にされて複数組予め格納されていて、各利得候補ベクトルは複数サンプル分の利得候補値により構成されている。帯域拡張利得符号化部16は、フレーム単位で、符号化部14がビットを割り当てた調整済周波数スペクトルの値と利得候補ベクトルを構成する利得候補値とを乗算した値の絶対値と、符号化部14がビットを割り当てなかった調整済周波数スペクトルの値の絶対値と、の差の絶対値の総和が最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する。なお、絶対値に代えて二乗値などを用いてもよい。
 以下、符号化部14がビットを割り当てた調整済周波数スペクトルは、調整済周波数スペクトル系列Y0,…,YN-1のうちのサンプル番号が小さいほうからN-K個の調整済周波数スペクトルY0,…,YN-K-1であり、符号化部14がビットを割り当てなかった調整済周波数スペクトルは、調整済周波数スペクトル系列Y0,…,YN-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトルYN-K,…,YN-1である場合の例を説明する。
 〔帯域拡張利得符号化部16の例1〕
 この例では、記憶部161には利得候補ベクトルと符号の組がJ組格納されていて、各利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の利得候補ベクトルそれぞれをGj (j=0,…,J-1)とし、利得候補ベクトルGj(j=0,…,J-1)のそれぞれに対応する符号をCGj(j=0,…,J-1)とし、それぞれの利得候補ベクトルGjはK個の利得候補値gj,k (k=0,…,K-1)により構成されているとして説明する。
 帯域拡張利得符号化部16は、記憶部161に記憶された利得候補ベクトルGj (j=0,…,J-1)のうちの下記の式(1)により求まるEjが最小となる利得候補ベクトルGjに対応する符号CGjを帯域拡張利得符号CGとして出力する。
Figure JPOXMLDOC01-appb-M000001
 言い換えると、帯域拡張利得符号化部16は、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,YN-K-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトルYN-2K,…,YN-K-1と利得候補ベクトルを構成する利得候補値gj,0,…,gj,K-1とをそれぞれ乗算した値の絶対値|YN-2K gj,0|,…,|YN-K-1 gj,K|と、符号化部14がビットを割り当てなかった調整済周波数スペクトルYN-K,…,YN-1それぞれの絶対値|YN-K|,…,|YN-1|と、の差の絶対値||YN-2K gj,0|-|YN-K||,…,||YN-K-1 gj,K|-|YN-1||の総和Ejが最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する。
 〔帯域拡張利得符号化部16の例2〕
 この例では、記憶部161には例1と同様に利得候補ベクトルと符号の組がJ組格納されているが、例1とは異なり、利得候補ベクトルとして摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルの2種類が格納されているとする。すなわち、記憶部161には摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルと符号の組がJ組格納されていて、各摩擦音用利得候補ベクトルと各非摩擦音用利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の摩擦音用利得候補ベクトルそれぞれをG1j (j=0,…,J-1)とし、J個の非摩擦音用利得候補ベクトルそれぞれをG2j (j=0,…,J-1)とし、摩擦音用利得候補ベクトルG1j (j=0,…,J-1)のそれぞれに対応しかつ非摩擦音用利得候補ベクトルG2j (j=0,…,J-1)のそれぞれに対応する符号をCGj (j=0,…,J-1)として説明する。また、それぞれの摩擦音用利得候補ベクトルG1jはKサンプル分すなわちK個の利得候補値g1j,k (k=0,…,K-1)により構成されていて、それぞれの非摩擦音用利得候補ベクトルG2jはKサンプル分すなわちK個の利得候補値g2j,k(k=0,…,K-1)により構成されているとして説明する。
 帯域拡張利得符号化部16は、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には記憶部161に記憶された摩擦音用利得候補ベクトルG1j (j=0,…,J-1)を利得候補ベクトルGj (j=0,…,J-1)として、入力された摩擦音判定情報が摩擦音的な音でないことを示す場合には記憶部161に記憶された非摩擦音用利得候補ベクトルG2j (j=0,…,J-1)を利得候補ベクトルGj (j=0,…,J-1)として、利得候補ベクトルGj (j=0,…,J-1)のうちの上記の式(1)により求まるEjが最小となる利得候補ベクトルGjに対応する帯域拡張利得符号CGjを帯域拡張利得符号CGとして出力する。
 言い換えると、帯域拡張利得符号化部16は、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には記憶部161に記憶された摩擦音用利得候補ベクトルを利得候補ベクトルとし、入力された摩擦音判定情報が摩擦音的な音でないことを示す場合には記憶部161に記憶された非摩擦音用利得候補ベクトルを利得候補ベクトルとして、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,YN-K-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトルYN-2K,…,YN-K-1と利得候補ベクトルを構成する利得候補値gj,0,…,gj,K-1とをそれぞれ乗算した値の絶対値|YN-2K gj,0|,…,|YN-K-1 gj,K-1|と、符号化部14がビットを割り当てなかった調整済周波数スペクトルYN-K,…,YN-1それぞれの絶対値|YN-K|,…,|YN-1|と、の差の絶対値||YN-2K gj,0|-|YN-K||,…,||YN-K-1 gj,K-1|-|YN-1||の総和Ejが最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する。
 このように、帯域拡張利得符号化部16には、複数個の符号と、符号のそれぞれに対応する摩擦音用利得候補ベクトルと、符号のそれぞれに対応する非摩擦音用利得候補ベクトルと、が記憶されており、帯域拡張利得符号化部16は、摩擦音判定部が摩擦音的な音であると判定した場合には、摩擦音用利得候補ベクトルを利得候補ベクトルとして用い、前記以外の場合には、非摩擦音用利得候補ベクトルを利得候補ベクトルとして用いてもよい。
 〔帯域拡張利得符号化部16の例1と例2の変形例1〕
 上述した例1と例2では、利得候補値の乗算の対象とする調整済周波数スペクトルは、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,YN-K-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトルYN-2K,…,YN-K-1とした。しかし、利得候補値の乗算の対象とする調整済周波数スペクトルは、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,YN-K-1のうちの予め定めたK個のサンプル番号に対応するK個の調整済周波数スペクトルであればよい。
 〔帯域拡張利得符号化部16の例1と例2の変形例2〕
 上述した例1と例2では、式(1)ではkの値が小さい順のYN-2K+k、gj,k、YN-K+kを対応付けているが、予め定めた対応付けであればどのような対応付けでもよい。
 〔帯域拡張利得符号化部16の具体例〕
 N=32, K=12の場合の帯域拡張利得符号化部16の具体例を説明する。この具体例は帯域拡張利得符号化部16の例2の変形例2に対応する。図13と図14は、N=32, K=12の場合の後述する復号装置の帯域拡張部25と摩擦音調整解除部23の例である。
 図13は摩擦音判定情報が摩擦音的な音でないことを示す場合の例である。復号装置の帯域拡張部25は、後述するように、8番目から19番目の復号調整済周波数スペクトルを複製元とし、これらの複製元の復号調整済周波数スペクトルの値と帯域拡張利得とを乗算した値をサンプル番号順に20番目から31番目の復号拡張周波数スペクトルとして得る処理を行う。そこで、帯域拡張利得符号化部16は、入力された摩擦音判定情報が摩擦音的な音でないことを示す場合には、記憶部161に記憶された非摩擦音用利得候補ベクトルを利得候補ベクトルとして、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,Y19のうちのサンプル番号が大きいほうから12個の調整済周波数スペクトルY8,…,Y19と利得候補ベクトルを構成する利得候補値gj,0,…,gj,11とをそれぞれ乗算した値の絶対値|Ygj,0|,…,|Y19 gj,11|と、符号化部14がビットを割り当てなかった調整済周波数スペクトルY20,…,Y31それぞれの絶対値|Y20|,…,|Y31|と、の差の絶対値||Ygj,0|-|Y20||,…,||Y19 gj,11|-|Y31||の総和Ejが最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得る。
 図14は摩擦音判定情報が摩擦音的な音であることを示す場合の例である。復号装置の帯域拡張部25は、後述するように、8番目から19番目の復号調整済周波数スペクトルを複製元とし、これらの複製元の復号調整済周波数スペクトルの値と帯域拡張利得とを乗算した値を、16番目から19番目までのサンプル番号順の後が8番目から15番目までのサンプル番号順となる順番としたものを、20番目から31番目の復号拡張周波数スペクトルとして得る処理を行う。そこで、帯域拡張利得符号化部16は、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、記憶部161に記憶された摩擦音用利得候補ベクトルを利得候補ベクトルとして、符号化部14がビットを割り当てた調整済周波数スペクトルY0,…,Y19のうちのサンプル番号が大きいほうから12個の調整済周波数スペクトルY8,…,Y19と利得候補ベクトルを構成する利得候補値gj,0,…,gj,11とをそれぞれ乗算した値の絶対値|Ygj,0|,…,|Y19 gj,11|と、符号化部14がビットを割り当てなかった調整済周波数スペクトルY24,…,Y31,Y20,…,Y23それぞれの絶対値|Y24|,…,|Y31|,|Y20|,…,|Y23|と、の差の絶対値||Ygj,0|-|Y24||,…,||Y15 gj,7|-|Y31||,||Y16 gj,8|-|Y20||,…,||Y19 gj,11|-|Y23||の総和Ejが最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得る。
 このようにして、帯域拡張利得符号化部16には、複数個の符号と、符号のそれぞれに対応する利得候補ベクトルと、が記憶されており、利得候補ベクトルのそれぞれはK個(Kは2以上の整数)の利得候補値を含んでいるとして、帯域拡張利得符号化部16は、調整済周波数スペクトル系列のうちの符号化部14がビットを割り当てたK個の調整済周波数スペクトルと、利得候補ベクトルに含まれるK個の利得候補値と、を乗算して得たK個の値の絶対値による系列と、調整済周波数スペクトル系列のうちの符号化部14がビットを割り当てなかったK個の調整済周波数スペクトルの絶対値による系列と、の誤差が最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する。
 この帯域拡張利得符号化部16の動作は、復号装置の帯域拡張部25と摩擦音調整解除部23の動作に対応させたものである。図8の例では、復号装置の摩擦音調整解除部23は、20番目から31番目までの復号拡張周波数スペクトルのうちのサンプル番号が小さい側の20番目から23番目までの復号拡張周波数スペクトルを、サンプル番号が28番目から31番目までの復号周波数スペクトルとし、20番目から31番目までの復号拡張周波数スペクトルのうちのサンプル番号が大きい側の24番目から31番目までの復号拡張周波数スペクトルを、サンプル番号が2番目から9番目までの復号周波数スペクトルとする。復号装置の帯域拡張部25は、この摩擦音調整解除部23の動作により得られる復号周波数スペクトルの周波数の高低を考慮して、図14の動作をする。
 すなわち、復号装置の帯域拡張部25は、摩擦音判定情報が摩擦音的な音であることを示す場合でも摩擦音的な音でないことを示す場合でも、復号周波数スペクトルにおける周波数の高低に整合した処理を行うようにされている。従って、帯域拡張利得符号化部16もこの帯域拡張部25に対応した動作をする。
 [多重化部15]
 多重化部15には、摩擦音判定部12が出力した摩擦音判定情報と、符号化部14が出力したスペクトル符号と、帯域拡張利得符号化部16が出力した帯域拡張利得符号が入力される。多重化部15は、入力された摩擦音判定情報に対応する符号とスペクトル符号と帯域利得符号とを繋ぎ合わせて得た符号を出力する(ステップS15)。
 ≪復号装置≫
 図11を参照して、第二実施形態の復号装置の処理手続きを説明する。図11に例示するように、第二実施形態の復号装置は、多重分離部21、復号部22、帯域拡張部25、摩擦音調整解除部23、時間領域変換部24を含む。図11の第二実施形態の復号装置が図3の第一実施形態の復号装置と異なるのは、帯域拡張部25を備え、多重分離部21が、入力された符号から帯域拡張利得符号も得ることである。第二実施形態の復号装置のその他の構成、すなわち、復号部22、摩擦音調整解除部23、時間領域変換部24の動作は第一実施形態の復号装置のものと同じであるので、以下では動作の要部のみを説明する。
 復号装置には符号化装置が出力した符号が入力される。復号装置に入力された符号は多重分離部21へ入力される。復号装置は、各部で所定の時間長のフレーム単位での処理を行う。第二実施形態の復号方法は、復号装置の各部が、以下及び図12に例示するステップS21からステップS25の処理を行うことにより実現される。
 [多重分離部21]
 多重分離部21は、入力された符号を摩擦音判定情報に対応する符号と帯域拡張利得符号とスペクトル符号に分離して、摩擦音判定情報に対応する符号から得た摩擦音判定情報を摩擦音調整解除部23と帯域拡張部25へ、帯域拡張利得符号を帯域拡張部25へ、スペクトル符号を復号部22へそれぞれ出力する(ステップS21)。
 [復号部22]
 復号部22は、フレーム単位で、符号化装置の符号化部14が行った符号化処理に対応する復号処理により、入力されたスペクトル符号を復号して復号調整済周波数スペクトル系列を得て出力する(ステップS22)。
 上述したように、第二実施形態の符号化装置の符号化部14はサンプル番号が大きいほうの一部のサンプルにビットを割り当てない符号化処理を行うことから、これらのサンプル番号の復号調整済周波数スペクトルの値はスペクトル符号を復号しても得られない。復号部22は、上述した符号化部14の例の場合であれば、スペクトル符号を復号して、サンプル番号が小さいほうからN-K個の復号調整済周波数スペクトル^Y0,…,^YN-K-1による復号調整済周波数スペクトル系列を得る。
 なお、符号化部14でビットを割り当てなかったサンプル番号の復号調整済周波数スペクトルの値を0としてもよい。すなわち、復号部22は、上述した符号化部14の例の場合であれば、スペクトル符号を復号して、サンプル番号が大きいほうからK個の復号調整済周波数スペクトル^YN-K,…,^YN-1それぞれの値を0として、復号調整済周波数スペクトル系列^Y0,…,^YN-1を得てもよい。
 このようにして、復号部22は、所定の時間区間のフレーム単位のスペクトル符号であって、高域側の一部にビットが割り当てられていないスペクトル符号、を復号して周波数領域のサンプル列(復号調整済周波数スペクトル系列)を得る。
 ただし、後述する通り摩擦音調整解除部23は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、後述する帯域拡張部25が得た復号拡張周波数スペクトル系列(復号調整済周波数スペクトル系列に基づくスペクトル系列)のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、帯域拡張部25が得た復号拡張周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得て、前記以外の場合には、帯域拡張部25が得た復号拡張周波数スペクトル系列をそのまま復号音信号の周波数スペクトル系列として得る。すなわち、復号部22は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、スペクトル符号には低域側の一部にビットが割り当てられていないとして、スペクトル符号を復号して周波数領域のスペクトル系列(復号調整済周波数スペクトル系列)を得て、前記以外の場合には、スペクトル符号には高域側の一部にビットが割り当てられていないとして、スペクトル符号を復号して周波数領域のスペクトル系列(復号調整済周波数スペクトル系列)を得ている。
 第一実施形態の復号装置の復号部22は、得た復号調整済周波数スペクトル系列を摩擦音調整解除部23に出力したが、第二実施形態の復号装置の復号部22は、得た復号調整済周波数スペクトル系列を帯域拡張部25へ出力する。
 [帯域拡張部25]
 帯域拡張部25には、多重分離部21が出力した帯域拡張利得符号と復号部22が出力した復号調整済周波数スペクトル系列が少なくとも入力される。帯域拡張部25は、フレーム単位で、入力された帯域拡張利得符号と復号調整済周波数スペクトル系列に少なくとも基づいて下記のように復号拡張周波数スペクトル系列~Y0,…,~YN-1を得て、得た復号拡張周波数スペクトル系列~Y0,…,~YN-1を摩擦音調整解除部23へ出力する(ステップS25)。
 帯域拡張部25に帯域拡張利得符号と復号調整済周波数スペクトル系列のみが入力される構成とする場合には、例えば下記の例1のように、帯域拡張部25には、フレーム単位で、入力された帯域拡張利得符号と復号調整済周波数スペクトル系列に基づいて復号拡張周波数スペクトル系列~Y0,…,~YN-1を得て、得た復号拡張周波数スペクトル系列~Y0,…,~YN-1を摩擦音調整解除部23へ出力する。
 また、帯域拡張部25には、帯域拡張利得符号と復号調整済周波数スペクトル系列に加えて多重分離部21が出力した摩擦音判定情報も入力される構成としてもよい。この構成とする場合には、例えば下記の例2のように、帯域拡張部25は、フレーム単位で、入力された帯域拡張利得符号と復号調整済周波数スペクトル系列と摩擦音判定情報に基づいて復号拡張周波数スペクトル系列~Y0,…,~YN-1を得て、得た復号拡張周波数スペクトル系列~Y0,…,~YN-1を摩擦音調整解除部23へ出力する。
 帯域拡張部25の記憶部251には、符号化装置の帯域拡張利得符号化部16の記憶部161に格納されているのと同じ、利得ベクトルの候補である利得候補ベクトルとその利得候補ベクトルを特定可能な符号とが組にされて複数組予め格納されていて、各利得候補ベクトルは複数サンプル分の利得候補値により構成されている。帯域拡張部25はスペクトル符号を復号して得られた復号調整済周波数スペクトル(符号化装置の符号化部14でビットを割り当てた調整済周波数スペクトルに対応する復号調整済周波数スペクトル)の全部または一部である複製元の各サンプル値と帯域拡張利得符号に対応する符号で特定される利得候補ベクトルに含まれる各帯域拡張利得とをそれぞれ乗算した値を、符号化装置の符号化部14でビットが割り当てなかった調整済周波数スペクトルに対応する復号拡張周波数スペクトルとしたものと、スペクトル符号を復号して得られた復号調整済周波数スペクトルをそのまま復号拡張周波数スペクトルとしたものと、による系列を復号拡張周波数スペクトル系列として得る。
 以下、符号化部14がビットを割り当てた調整済周波数スペクトルは調整済周波数スペクトル系列Y0,…,YN-1のうちのサンプル番号が小さいほうからN-K個の調整済周波数スペクトルY0,…,YN-K-1であり、符号化部14がビットを割り当てなかった調整済周波数スペクトルは調整済周波数スペクトル系列Y0,…,YN-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトルYN-K,…,YN-1である場合の例を説明する。すなわち、スペクトル符号の復号により復号調整済周波数スペクトル系列^Y0,…,^YN-K-1が得られた場合の例を説明する。
〔帯域拡張部25の例1〕
 この例では、記憶部251には利得候補ベクトルと符号の組がJ組格納されていて、各利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の利得候補ベクトルそれぞれをGj (j=0,…,J-1)とし、利得候補ベクトルGj(j=0,…,J-1)それぞれに対応する符号をCGj(j=0,…,J-1)とし、それぞれの利得候補ベクトルGjはKサンプル分すなわちK個の利得候補値gj,k(k=0,…,K-1)により構成されているとして説明する。
 帯域拡張部25は、復号調整済周波数スペクトル^Y0,…,^YN-K-1をそのまま復号拡張周波数スペクトル系列のサンプル番号が小さいほうからN-K個の復号拡張周波数スペクトル~Y0,…,~YN-K-1とする。帯域拡張部25は、また、記憶部251に記憶された利得候補ベクトルGj (j=0,…,J-1)のうち、対応する符号CGjが入力された帯域拡張利得符号と等しい利得候補ベクトルに含まれるK個の利得候補値を帯域拡張利得g0,…,gK-1として得る。帯域拡張部25は、さらに、復号調整済周波数スペクトル^Y0,…,^YN-K-1のうちのサンプル番号が大きいほうからK個の復号調整済周波数スペクトル^YN-2K,…,^YN-K-1と帯域拡張利得g0,…,gK-1とをそれぞれ乗算した値^YN-2K g0,…,^YN-K-1 gK-1を、復号拡張周波数スペクトル系列のサンプル番号が大きいほうからK個の復号拡張周波数スペクトル~YN-K,…,~YN-1とする。
 〔帯域拡張部25の例2〕
 この例では、記憶部251には例1と同様に利得候補ベクトルと符号の組がJ組格納されているが、例1とは異なり、利得候補ベクトルとして摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルの2種類が格納されているとする。すなわち、記憶部251には摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルと符号の組がJ組格納されていて、各摩擦音用利得候補ベクトルと各非摩擦音用利得候補ベクトルがKサンプル分の利得候補値により構成されているとする。以下、J個の摩擦音用利得候補ベクトルそれぞれをG1j (j=0,…,J-1)とし、J個の非摩擦音用利得候補ベクトルそれぞれをG2j (j=0,…,J-1)とし、摩擦音用利得候補ベクトルG1j (j=0,…,J-1)のそれぞれに対応しかつ非摩擦音用利得候補ベクトルG2j (j=0,…,J-1)のそれぞれに対応する符号をCGj (j=0,…,J-1)として説明する。また、それぞれの摩擦音用利得候補ベクトルG1jはKサンプル分すなわちK個の利得候補値g1j,k (k=0,…,K-1)により構成されていて、それぞれの非摩擦音用利得候補ベクトルG2jはKサンプル分すなわちK個の利得候補値g2j,k(k=0,…,K-1)により構成されているとして説明する。
 帯域拡張部25は、復号調整済周波数スペクトル^Y0,…,^YN-K-1をそのまま復号拡張周波数スペクトル系列のサンプル番号が小さいほうからN-K個の復号拡張周波数スペクトル~Y0,…,~YN-K-1とする。帯域拡張部25は、また、入力された摩擦音判定情報が摩擦音的な音であることを示す場合には記憶部251に記憶された摩擦音用利得候補ベクトルG1j (j=0,…,J-1)を利得候補ベクトルGj (j=0,…,J-1)として、入力された摩擦音判定情報が摩擦音的な音でないことを示す場合には記憶部251に記憶された非摩擦音用利得候補ベクトルG2j (j=0,…,J-1)を利得候補ベクトルGj (j=0,…,J-1)として、利得候補ベクトルGj (j=0,…,J-1)のうち、対応する符号CGjが入力された帯域拡張利得符号と等しい利得候補ベクトルに含まれるK個の利得候補値を帯域拡張利得g0,…,gK-1として得る。帯域拡張部25は、さらに、復号調整済周波数スペクトル^Y0,…,^YN-K-1のうちのサンプル番号が大きいほうからK個の復号調整済周波数スペクトル^YN-2K,…,^YN-K-1と帯域拡張利得g0,…,gK-1とをそれぞれ乗算した値^YN-2K g0,…,^YN-K-1 gK-1を、復号拡張周波数スペクトル系列のサンプル番号が大きいほうからK個の復号拡張周波数スペクトル~YN-K,…,~YN-1とする。
 〔帯域拡張部25の例1と例2の変形例1〕
 上述した例1と例2では、帯域拡張利得の乗算の対象とする復号調整済周波数スペクトルは、スペクトル符号を復号して得られた復号調整済周波数スペクトル^Y0,…,^YN-K-1のうちのサンプル番号が大きいほうからK個の調整済周波数スペクトル^YN-2K,…,^YN-K-1とした。しかし、帯域拡張利得の乗算の対象とする復号調整済周波数スペクトルは、スペクトル符号を復号して得られた復号調整済周波数スペクトル^Y0,…,^YN-K-1のうちの予め定めたK個のサンプル番号に対応するK個の復号調整済周波数スペクトルであればよい。
 〔帯域拡張部25の例1と例2の変形例2〕
 上述した例1と例2では、kの値が小さい順の復号調整済周波数スペクトル^YN-2K+kと、kの値が小さい順の帯域拡張利得gkと、を乗算して、kの値が小さい順の復号拡張周波数スペクトル~YN-K+kを得ているが、すなわち、kの値が小さい順での対応付けをしているが、予め定めた対応付けであればどのような対応付けでもよい。
 〔帯域拡張部25の具体例〕
 N=32, K=12の場合の帯域拡張部25の具体例を説明する。この具体例は帯域拡張部25の例2の変形例2に対応する。図13と図14は、N=32, K=12の場合の帯域拡張部25と摩擦音調整解除部23の処理の例である。
 図13は摩擦音判定情報が摩擦音的な音でないことを示す場合の例である。帯域拡張部25は、スペクトル符号の復号により得られた復号調整済周波数スペクトル^Y0,…,^Y19をそのまま復号拡張周波数スペクトル~Y0,…,~Y19とする。帯域拡張部25は、また、対応する符号CGjが入力された帯域拡張利得符号と等しい利得候補ベクトルに含まれる12個の利得候補値を帯域拡張利得g0,…,g11として得る。帯域拡張部25は、さらに、復号調整済周波数スペクトル^Y0,…,^Y19のうちのサンプル番号が大きいほうから12個の復号調整済周波数スペクトル^Y8,…,^Y19と帯域拡張利得g0,…,g11とをそれぞれ乗算した値^Yg0,…,^Y19 g11を、復号拡張周波数スペクトル系列のサンプル番号が大きいほうからK個の復号拡張周波数スペクトル~Y20,…,~Y31とする。
 図14は摩擦音判定情報が摩擦音的な音であることを示す場合の例である。帯域拡張部25は、スペクトル符号の復号により得られた復号調整済周波数スペクトル^Y0,…,^Y19をそのまま復号拡張周波数スペクトル~Y0,…,~Y19とする。帯域拡張部25は、また、対応する符号CGjが入力された帯域拡張利得符号と等しい利得候補ベクトルに含まれる12個の利得候補値を帯域拡張利得g0,…,g11として得る。帯域拡張部25は、さらに、復号調整済周波数スペクトル^Y0,…,^Y19のうちのサンプル番号が大きいほうから12個の復号調整済周波数スペクトル^Y8,…,^Y19と帯域拡張利得g0,…,g11とをそれぞれ乗算した値^Yg0,…,^Y19 g11を、復号拡張周波数スペクトル系列のサンプル番号が大きいほうからK個の復号拡張周波数スペクトル~Y24,…,~Y31,~Y20,…,~Y23とする。すなわち、帯域拡張部25は、8番目から19番目の復号調整済周波数スペクトル^Y8,…,^Y19を複製元とし、これらの複製元の復号調整済周波数スペクトル^Y8,…,^Y19の値と帯域拡張利得g0,…,g11とを乗算した値^Yg0,…,^Y19 g11を、復号調整済周波数スペクトルの16番目から19番目までのサンプル番号順に対応する復号拡張周波数スペクトル~Y20=^Y16 g8,…,~Y23=^Y19 g11の後が、復号調整済周波数スペクトルの8番目から15番目までのサンプル番号順に対応する復号拡張周波数スペクトル~Y24=^Yg0,…,~Y31=^Y15 g7となる順番で並べたものが、20番目から31番目の復号拡張周波数スペクトル~Y20,…,~Y31となるようにする処理を行う。
 この帯域拡張部25の動作は、摩擦音調整解除部23の動作に対応させたものである。図8の例では、摩擦音調整解除部23は、20番目から31番目までの復号拡張周波数スペクトル~Y20,…,~Y31のうちのサンプル番号が小さい側の20番目から23番目までの復号拡張周波数スペクトル~Y20,…,~Y23を、サンプル番号が28番目から31番目までの復号周波数スペクトル^X28,…,^X31とし、20番目から31番目までの復号拡張周波数スペクトル~Y20,…,~Y31のうちのサンプル番号が大きい側の24番目から31番目までの復号拡張周波数スペクトル~Y24,…,~Y31を、サンプル番号が2番目から9番目までの復号周波数スペクトル^X2,…,^X8とする。帯域拡張部25は、この摩擦音調整解除部23の動作により得られる復号周波数スペクトルの周波数の高低を考慮して、図14の動作をする。すなわち、復号装置の帯域拡張部25は、摩擦音判定情報が摩擦音的な音であることを示す場合でも摩擦音的な音でないことを示す場合でも、復号周波数スペクトルにおける周波数の高低に整合した処理を行うようにされている。
 このようにして、帯域拡張部25は、復号部22がスペクトル符号を復号して得た周波数領域のサンプル列(復号調整済周波数スペクトル系列)よりも高域側に、復号部22がスペクトル符号を復号して得た周波数領域のサンプル列(復号調整済周波数スペクトル系列)に含まれるK個(Kは2以上の整数)のサンプルに基づくサンプルを配置することにより、復号拡張周波数スペクトル系列を得る。
 より具体的には、例えば、帯域拡張部25は、帯域拡張利得符号を復号してK個の帯域拡張利得による組を得て、復号部22がスペクトル符号を復号して得た周波数領域のサンプル列(復号調整済周波数スペクトル系列)よりも高域側に、復号部22がスペクトル符号を復号して得た周波数領域のサンプル列に含まれるK個のサンプルとK個の帯域拡張利得とを乗算して得たK個のサンプルを配置することにより、復号拡張周波数スペクトル系列を得る。
 また、帯域拡張部25には、複数個の符号と、符号のそれぞれに対応する摩擦音用利得候補ベクトルと、符号のそれぞれに対応する非摩擦音用利得候補ベクトルと、が記憶されているとし、摩擦音用利得候補ベクトルと非摩擦音用利得候補ベクトルのそれぞれはK個の利得候補値を含むとして、帯域拡張部25が帯域拡張利得符号を復号してK個の帯域拡張利得による組を得る処理は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、複数個の摩擦音用利得候補ベクトルのうち対応する符号が帯域拡張利得符号と同じである摩擦音用利得候補ベクトルに含まれるK個の利得候補値をK個の帯域拡張利得の組とし、前記以外の場合には、複数個の非摩擦音用利得候補ベクトルのうち対応する符号が帯域拡張利得符号と同じである非摩擦音用利得候補ベクトルに含まれるK個の利得候補値をK個の帯域拡張利得の組とする処理であってもよい。
 [摩擦音調整解除部23]
 摩擦音調整解除部23には、多重分離部21が出力した摩擦音判定情報と帯域拡張部25が出力した復号拡張周波数スペクトル系列~Y0,…,~YN-1が入力される。摩擦音調整解除部23は、フレーム単位で入力された摩擦音判定情報が摩擦音的な音であることを示す場合には、入力された復号拡張周波数スペクトル系列~Y0,…,~YN-1に対して調整解除処理を行って復号周波数スペクトル系列^X0,…,^XN-1を得て、得られた復号周波数スペクトル系列^X0,…,^XN-1を時間領域変換部24へ出力し、摩擦音判定情報が摩擦音的な音でないと示す場合には、復号拡張周波数スペクトル系列~Y0,…,~YN-1をそのまま復号周波数スペクトル系列^X0,…,^XN-1として時間領域変換部24へ出力する(ステップS23)。
 摩擦音調整解除部23が行う調整解除処理は、第一実施形態の復号装置の摩擦音調整解除部23が復号調整済周波数スペクトル系列^Y0,…,^YN-1に対して行う処理と同様の処理を復号拡張周波数スペクトル系列~Y0,…,~YN-1に対して行う処理である。すなわち、1より大きくNより小さい整数値をMとすると、例えば、復号拡張周波数スペクトル系列~Y0,…,~YN-1のうちのサンプル番号がM未満のサンプルである~Y0,…,~YM-1によるサンプル群を低域側復号拡張周波数スペクトル系列とし、復号拡張周波数スペクトル系列~Y0,…,~YN-1のうちのサンプル番号がM以上のサンプルである~YM,…,~YN-1によるサンプル群を高域側復号拡張周波数スペクトル系列とすると、摩擦音判定情報が摩擦音的な音であることを示す場合に摩擦音調整解除部23が行う調整解除処理は、低域側復号拡張周波数スペクトル系列~Y0,…,~YN-1の全部または一部のサンプルと、これと同数の、高域側復号拡張周波数スペクトル系列~YM,…,~YN-1の全部または一部のサンプルと、を入れ替えたものを復号周波数スペクトル系列^X0,…,^XN-1として得る処理である。
 言い換えれば、摩擦音調整解除部23は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、帯域拡張部25が得た復号拡張周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、帯域拡張部25が得た復号拡張周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列(復号周波数スペクトル系列)として得て、前記以外の場合には、帯域拡張部25が得た復号拡張周波数スペクトル系列をそのまま復号音信号の周波数スペクトル系列(復号周波数スペクトル系列)として得てもよい。
 なお、図11に一点鎖線で示すように、帯域拡張部25と摩擦音調整解除部23を摩擦音対応帯域拡張部27とすると、摩擦音対応帯域拡張部27は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、復号部22が得た周波数領域のスペクトル系列(復号調整済周波数スペクトル系列)について低域側への帯域拡張を行って復号音信号の周波数スペクトル系列(復号周波数スペクトル系列)を得、前記以外の場合には、復号部22が得た周波数領域のスペクトル系列について高域側への帯域拡張を行って復号音信号の周波数スペクトル系列(復号周波数スペクトル系列)を得ていると言える。
 [時間領域変換部24]
 時間領域変換部24は、フレーム毎に、復号周波数スペクトル系列^X0,…,^XN-1を、符号化装置の周波数領域変換部11が行った周波数領域への変換方法に対応する時間領域への変換方法を用いて時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得て出力する(ステップS24)。
 ≪作用効果≫
 第二実施形態の符号化装置と復号装置によれば、第一実施形態の符号化装置と復号装置と同様に、摩擦音調整処理と摩擦音調整解除処理を行うことで、摩擦音的な音の時間区間では高域に優先してビットが割り当て、そうでない時間区間では低域に優先してビットを割り当てられるようにすることで、摩擦音などを含む音信号であっても聴感的な劣化を少なくすることができる。
 第二実施形態の符号化装置と復号装置によれば、更に、帯域拡張利得を用いて、摩擦音的な音の時間区間では高域の周波数スペクトルの複製により低域の周波数スペクトルを再現して帯域を拡張し、そうでない時間区間では低域の周波数スペクトルの複製により高域の周波数スペクトルを再現して帯域を拡張することで、摩擦音などを含む音信号であっても第一実施形態よりも更に聴感的な劣化を少なくすることができる。その際、周波数スペクトルの振幅に基づく帯域拡張利得を用いて周波数順を維持した複製をすることで、元の周波数スペクトルの概形をなるべく再現し、聴感品質を高めている。
 また、第二実施形態の符号化装置の摩擦音判定部12として第一実施形態の変形例の摩擦音判定部12を用いれば、第二実施形態の符号化装置の摩擦音判定部12として第一実施形態の摩擦音判定部12を用いる構成よりも、摩擦音判定部12の判定結果が頻繁に切り替わることを抑制することができ、復号音の波形の不連続の発生頻度を抑制することができ、この不連続が知覚されることによる聴覚品質の劣化を抑えることができる。
 [プログラム及び記録媒体]
 符号化装置、復号装置及び摩擦音判定装置のそれぞれを、コンピュータによって実現してもよい。この場合、符号化装置、復号装置及び摩擦音判定装置のそれぞれが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、符号化装置、復号装置及び摩擦音判定装置のそれぞれがコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、各部の処理は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理の少なくとも一部をハードウェア的に実現することとしてもよい。
 その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

Claims (13)

  1.  所定の時間区間のフレーム単位のスペクトル符号であって、高域側の一部にビットが割り当てられていないスペクトル符号、を復号して周波数領域のサンプル列を得る復号部と、
     前記復号部が前記スペクトル符号を復号して得た周波数領域のサンプル列よりも高域側に、前記復号部が前記スペクトル符号を復号して得た周波数領域のサンプル列に含まれるK個(Kは2以上の整数)のサンプルに基づくサンプルを配置することにより、復号拡張周波数スペクトル系列を得る帯域拡張部と、
     入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記帯域拡張部が得た前記復号拡張周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、前記帯域拡張部が得た前記復号拡張周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得て、前記以外の場合には、前記帯域拡張部が得た復号拡張周波数スペクトル系列をそのまま復号音信号の周波数スペクトル系列として得る摩擦音調整解除部と、を含む、
     復号装置。
  2.  請求項1に記載の復号装置であって、
     前記帯域拡張部は、帯域拡張利得符号を復号してK個の帯域拡張利得による組を得て、前記復号部が前記スペクトル符号を復号して得た前記周波数領域のサンプル列よりも高域側に、前記復号部が前記スペクトル符号を復号して得た前記周波数領域のサンプル列に含まれるK個のサンプルとK個の前記帯域拡張利得とを乗算して得たK個のサンプルを配置することにより、前記復号拡張周波数スペクトル系列を得る、
     復号装置。
  3.  請求項2に記載の復号装置であって、
     前記帯域拡張部には、複数個の符号と、前記符号のそれぞれに対応する摩擦音用利得候補ベクトルと、前記符号のそれぞれに対応する非摩擦音用利得候補ベクトルと、が記憶されており、
     前記摩擦音用利得候補ベクトルと前記非摩擦音用利得候補ベクトルのそれぞれはK個の利得候補値を含み、
     前記帯域拡張部が前記帯域拡張利得符号を復号してK個の前記帯域拡張利得による組を得る処理は、入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、複数個の前記摩擦音用利得候補ベクトルのうち対応する符号が前記帯域拡張利得符号と同じである摩擦音用利得候補ベクトルに含まれるK個の利得候補値をK個の前記帯域拡張利得の組とし、前記以外の場合には、複数個の前記非摩擦音用利得候補ベクトルのうち対応する符号が前記帯域拡張利得符号と同じである非摩擦音用利得候補ベクトルに含まれるK個の利得候補値をK個の前記帯域拡張利得の組とする処理である、
     復号装置。
  4.  所定の時間区間のフレーム単位のスペクトル符号を復号して復号音信号の周波数スペクトル系列を得る復号装置であって、
     入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記スペクトル符号には低域側の一部にビットが割り当てられていないとして、前記スペクトル符号を復号して周波数領域のスペクトル系列を得て、前記以外の場合には、前記スペクトル符号には高域側の一部にビットが割り当てられていないとして、前記スペクトル符号を復号して周波数領域のスペクトル系列を得る復号部と、
     入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記復号部が得た周波数領域のスペクトル系列について低域側への帯域拡張を行って前記復号音信号の前記周波数スペクトル系列を得、前記以外の場合には、前記復号部が得た周波数領域のスペクトル系列について高域側への帯域拡張を行って前記復号音信号の前記周波数スペクトル系列を得る摩擦音対応帯域拡張部と、を含む、
     復号装置。
  5.  所定の時間区間のフレーム単位の音信号に対応する周波数のサンプル列を高域側の一部にビットを割り当てない符号化処理で符号化してスペクトル符号を得る符号化部を含む符号化装置であって、
     前記音信号が摩擦音的な音であるか否かを判定する摩擦音判定部と、
     前記摩擦音判定部が摩擦音的な音であると判定した場合には、前記音信号の周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数スペクトル系列の全部または一部と、これと同数の、前記周波数スペクトル系列のうちの前記所定の周波数よりも高域側にある高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得て、前記以外の場合には、前記音信号に対応する周波数スペクトル系列をそのまま調整済周波数スペクトル系列として得る摩擦音調整部と、を含み、
     前記符号化部は、前記摩擦音調整部が得た調整済周波数スペクトル系列を前記音信号に対応する周波数のサンプル列として符号化してスペクトル符号を得るものであり、
     複数個の符号と、前記符号のそれぞれに対応する利得候補ベクトルと、が記憶されており、前記利得候補ベクトルのそれぞれはK個(Kは2以上の整数)の利得候補値を含み、前記調整済周波数スペクトル系列のうちの前記符号化部がビットを割り当てたK個の調整済周波数スペクトルと、前記利得候補ベクトルに含まれる前記K個の利得候補値と、を乗算して得たK個の値の絶対値による系列と、前記調整済周波数スペクトル系列のうちの前記符号化部がビットを割り当てなかったK個の調整済周波数スペクトルの絶対値による系列と、の誤差が最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する帯域拡張利得符号化部を更に含む、
     符号化装置。
  6.  請求項5に記載の符号化装置であって、
     前記帯域拡張利得符号化部には、複数個の符号と、前記符号のそれぞれに対応する摩擦音用利得候補ベクトルと、前記符号のそれぞれに対応する非摩擦音用利得候補ベクトルと、が記憶されており、
     前記帯域拡張利得符号化部は、前記摩擦音判定部が摩擦音的な音であると判定した場合には、摩擦音用利得候補ベクトルを前記利得候補ベクトルとして用い、前記以外の場合には、非摩擦音用利得候補ベクトルを前記利得候補ベクトルとして用いる、
     符号化装置。
  7.  請求項5または6の何れかに記載の符号化装置であって、
     前記摩擦音判定部は、当該フレームの前記周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が、予め定めた閾値より大きいか閾値以上である場合に、前記音信号が摩擦音的な音であると判定する、
     符号化装置。
  8.  請求項5または6に記載の符号化装置であって、
     前記摩擦音判定部は、当該フレームを含む複数のフレームにおいて、前記周波数スペクトル系列における低域側の周波数スペクトルの平均エネルギーに対する高域側の周波数スペクトルの平均エネルギーの比が大きいほど大きくなる指標が予め定めた閾値より大きいか閾値以上であるフレーム数が、そうでないフレーム数より多いかまたはそうでないフレーム数以上である場合に、前記音信号が摩擦音的な音であると判定する、
     符号化装置。
  9.  所定の時間区間のフレーム単位のスペクトル符号であって、高域側の一部にビットが割り当てられていないスペクトル符号、を復号して周波数領域のサンプル列を得る復号ステップと、
     前記復号ステップが前記スペクトル符号を復号して得た周波数領域のサンプル列よりも高域側に、前記復号ステップが前記スペクトル符号を復号して得た周波数領域のサンプル列に含まれるK個(Kは2以上の整数)のサンプルに基づくサンプルを配置することにより、復号拡張周波数スペクトル系列を得る帯域拡張ステップと、
     入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記帯域拡張ステップが得た前記復号拡張周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数サンプル列の全部または一部と、これと同数の、前記帯域拡張ステップが得た前記復号拡張周波数スペクトル系列のうちの所定の周波数よりも高域側にある高域側周波数サンプル列の全部または一部と、を入れ替えたものを復号音信号の周波数スペクトル系列として得て、前記以外の場合には、前記帯域拡張ステップが得た復号拡張周波数スペクトル系列をそのまま復号音信号の周波数スペクトル系列として得る摩擦音調整解除ステップと、を含む、
     復号方法。
  10.  所定の時間区間のフレーム単位のスペクトル符号を復号して復号音信号の周波数スペクトル系列を得る復号方法であって、
     入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記スペクトル符号には低域側の一部にビットが割り当てられていないとして、前記スペクトル符号を復号して周波数領域のスペクトル系列を得て、前記以外の場合には、前記スペクトル符号には高域側の一部にビットが割り当てられていないとして、前記スペクトル符号を復号して周波数領域のスペクトル系列を得る復号ステップと、
     入力された摩擦音的な音であるか否かを表す情報が摩擦音的な音であることを示す場合には、前記復号ステップが得た周波数領域のスペクトル系列について低域側への帯域拡張を行って前記復号音信号の前記周波数スペクトル系列を得、前記以外の場合には、前記復号ステップが得た周波数領域のスペクトル系列について高域側への帯域拡張を行って前記復号音信号の前記周波数スペクトル系列を得る摩擦音対応帯域拡張ステップと、を含む、
     復号方法。
  11.  所定の時間区間のフレーム単位の音信号に対応する周波数のサンプル列を高域側の一部にビットを割り当てない符号化処理で符号化してスペクトル符号を得る符号化ステップを含む符号化方法であって、
     前記音信号が摩擦音的な音であるか否かを判定する摩擦音判定ステップと、
     前記摩擦音判定ステップが摩擦音的な音であると判定した場合には、前記音信号の周波数スペクトル系列のうちの所定の周波数よりも低域側にある低域側周波数スペクトル系列の全部または一部と、これと同数の、前記周波数スペクトル系列のうちの前記所定の周波数よりも高域側にある高域側周波数スペクトル系列の全部または一部と、を入れ替えたものを調整済周波数スペクトル系列として得て、前記以外の場合には、前記音信号に対応する周波数スペクトル系列をそのまま調整済周波数スペクトル系列として得る摩擦音調整ステップと、を含み、
     前記符号化ステップは、前記摩擦音調整ステップが得た調整済周波数スペクトル系列を前記音信号に対応する周波数のサンプル列として符号化してスペクトル符号を得るものであり、
     複数個の符号と、前記符号のそれぞれに対応する利得候補ベクトルと、が記憶されており、前記利得候補ベクトルのそれぞれはK個(Kは2以上の整数)の利得候補値を含み、前記調整済周波数スペクトル系列のうちの前記符号化ステップがビットを割り当てたK個の調整済周波数スペクトルと、前記利得候補ベクトルに含まれる前記K個の利得候補値と、を乗算して得たK個の値の絶対値による系列と、前記調整済周波数スペクトル系列のうちの前記符号化ステップがビットを割り当てなかったK個の調整済周波数スペクトルの絶対値による系列と、の誤差が最小となる利得候補ベクトルに対応する符号を帯域拡張利得符号として得て出力する帯域拡張利得符号化ステップを更に含む、
     符号化方法。
  12.  請求項1から4の何れかの復号装置の各部としてコンピュータを機能させるためのプログラム。
  13.  請求項5から8の何れかの符号化装置の各部としてコンピュータを機能させるためのプログラム。
PCT/JP2018/044335 2018-01-17 2018-12-03 復号装置、符号化装置、これらの方法及びプログラム WO2019142514A1 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201880086667.4A CN111602197B (zh) 2018-01-17 2018-12-03 解码装置、编码装置、它们的方法以及计算机可读记录介质
US16/962,060 US11430464B2 (en) 2018-01-17 2018-12-03 Decoding apparatus, encoding apparatus, and methods and programs therefor
CN202311162391.2A CN117351969A (zh) 2018-01-17 2018-12-03 解码装置、解码方法、计算机可读记录介质以及程序
JP2019565744A JP6962386B2 (ja) 2018-01-17 2018-12-03 復号装置、符号化装置、これらの方法及びプログラム
EP22179964.6A EP4095855B1 (en) 2018-01-17 2018-12-03 Decoding apparatus, encoding apparatus, and methods and programs therefor
PCT/JP2018/044335 WO2019142514A1 (ja) 2018-01-17 2018-12-03 復号装置、符号化装置、これらの方法及びプログラム
EP18900764.4A EP3742443B1 (en) 2018-01-17 2018-12-03 Decoding device, method and program thereof
US17/856,221 US11715484B2 (en) 2018-01-17 2022-07-01 Decoding apparatus, encoding apparatus, and methods and programs therefor

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-005768 2018-01-17
JP2018005768 2018-01-17
PCT/JP2018/044335 WO2019142514A1 (ja) 2018-01-17 2018-12-03 復号装置、符号化装置、これらの方法及びプログラム

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US16/962,060 A-371-Of-International US11430464B2 (en) 2018-01-17 2018-12-03 Decoding apparatus, encoding apparatus, and methods and programs therefor
US17/856,221 Division US11715484B2 (en) 2018-01-17 2022-07-01 Decoding apparatus, encoding apparatus, and methods and programs therefor

Publications (1)

Publication Number Publication Date
WO2019142514A1 true WO2019142514A1 (ja) 2019-07-25

Family

ID=67301736

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/044335 WO2019142514A1 (ja) 2018-01-17 2018-12-03 復号装置、符号化装置、これらの方法及びプログラム

Country Status (5)

Country Link
US (2) US11430464B2 (ja)
EP (2) EP4095855B1 (ja)
JP (1) JP6962386B2 (ja)
CN (2) CN111602197B (ja)
WO (1) WO2019142514A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11417345B2 (en) * 2018-01-17 2022-08-16 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, fricative sound judgment apparatus, and methods and programs therefor
WO2020250371A1 (ja) * 2019-06-13 2020-12-17 日本電信電話株式会社 音信号符号化送信方法、音信号符号化方法、音信号送信側装置、符号化装置、プログラム及び記録媒体
WO2020250369A1 (ja) * 2019-06-13 2020-12-17 日本電信電話株式会社 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体
CN113518227B (zh) * 2020-04-09 2023-02-10 于江鸿 数据处理的方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US20020052734A1 (en) * 1999-02-04 2002-05-02 Takahiro Unno Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
JP2016085334A (ja) * 2014-10-24 2016-05-19 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JPH10124089A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
CN101656073B (zh) * 2004-05-14 2012-05-23 松下电器产业株式会社 解码装置、解码方法以及通信终端和基站装置
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8788276B2 (en) * 2008-07-11 2014-07-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
US8831958B2 (en) * 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
CN103733259B (zh) * 2011-06-23 2016-10-19 索诺瓦公司 用于运行听力设备的方法以及听力设备
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
EP3680899B1 (en) * 2013-01-29 2024-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method and computer program using an increased temporal resolution in temporal proximity of offsets of fricatives or affricates
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
US11417345B2 (en) * 2018-01-17 2022-08-16 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, fricative sound judgment apparatus, and methods and programs therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US20020052734A1 (en) * 1999-02-04 2002-05-02 Takahiro Unno Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
JP2016085334A (ja) * 2014-10-24 2016-05-19 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
M. ARORAJ. LEES. PARK: "High Quality Blind Bandwidth Extension of Audio for Portable Player Applications", AES 120TH CONVENTION, PARIS, FRANCE, 2006

Also Published As

Publication number Publication date
EP4095855B1 (en) 2023-10-04
CN111602197B (zh) 2023-09-05
US20220343936A1 (en) 2022-10-27
EP3742443A4 (en) 2021-10-27
US11715484B2 (en) 2023-08-01
CN117351969A (zh) 2024-01-05
US20200395034A1 (en) 2020-12-17
EP4095855A1 (en) 2022-11-30
EP3742443A1 (en) 2020-11-25
JP6962386B2 (ja) 2021-11-05
EP3742443B1 (en) 2022-08-03
CN111602197A (zh) 2020-08-28
US11430464B2 (en) 2022-08-30
JPWO2019142514A1 (ja) 2021-01-07

Similar Documents

Publication Publication Date Title
WO2019142514A1 (ja) 復号装置、符号化装置、これらの方法及びプログラム
WO2019142513A1 (ja) 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム
AU2018204110B2 (en) Signal processing apparatus and method, and program
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
EP1914724B1 (en) Dual-transform coding of audio signals
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2001343997A (ja) デジタル音響信号符号化装置、方法及び記録媒体
JP3519859B2 (ja) 符号器及び復号器
JP2004163696A (ja) 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
JP2004252068A (ja) デジタルオーディオ信号の符号化装置及び方法
KR20140037118A (ko) 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기
JP2002023798A (ja) 音声符号化方法
JPH0591062A (ja) オーデイオ信号処理方法
JP2011118215A (ja) 符号化装置、符号化方法、プログラムおよび電子機器

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18900764

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019565744

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018900764

Country of ref document: EP

Effective date: 20200817