WO2010150767A1 - 符号化方法、復号方法、それらの方法を用いた装置、プログラム - Google Patents

符号化方法、復号方法、それらの方法を用いた装置、プログラム Download PDF

Info

Publication number
WO2010150767A1
WO2010150767A1 PCT/JP2010/060522 JP2010060522W WO2010150767A1 WO 2010150767 A1 WO2010150767 A1 WO 2010150767A1 JP 2010060522 W JP2010060522 W JP 2010060522W WO 2010150767 A1 WO2010150767 A1 WO 2010150767A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal sequence
shift
duplication
unit
decoding
Prior art date
Application number
PCT/JP2010/060522
Other languages
English (en)
French (fr)
Inventor
公孝 堤
茂明 佐々木
祐介 日和▲崎▼
勝宏 福井
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to CN2010800265515A priority Critical patent/CN102804263A/zh
Priority to EP10792085A priority patent/EP2447943A4/en
Priority to CA2765523A priority patent/CA2765523A1/en
Priority to US13/377,983 priority patent/US20120123788A1/en
Priority to JP2011519899A priority patent/JP5400880B2/ja
Publication of WO2010150767A1 publication Critical patent/WO2010150767A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Definitions

  • the present invention relates to an encoding method and a decoding method for an acoustic signal such as a voice, an apparatus using the methods, and a program.
  • it is a technique for complementing information lost during encoding and transmission of information, and by adding a code obtained by using a part of lost information to a transmitted code
  • the present invention relates to a technique for restoring information lost during decoding.
  • FIG. 1 shows an example of the functional configuration of the audio signal transmitting apparatus 1 of Patent Document 1
  • FIG. 2 shows an example of the functional configuration of the audio signal receiving apparatus 2.
  • the input speech signal is stored in the input buffer 10, and the speech signal is divided at regular intervals called frames, that is, divided into frames and sent to the speech waveform encoding unit 30.
  • the voice waveform encoding unit 30 converts the input voice signal into a voice code.
  • the voice code is sent to the packet construction unit 70.
  • the voice feature amount calculation unit 40 uses the voice signal stored in the input buffer 10 to calculate the voice feature amount of the voice signal in the frame.
  • the audio feature amount refers to a pitch period (corresponding to a basic frequency of audio), power, and the like, and only one of these feature amounts may be used or all of them may be used.
  • the speech feature amount encoding unit 50 quantizes the speech feature amount so that it can be expressed by a predetermined number of bits, and then converts it into a code.
  • the encoded audio feature value is sent to the shift buffer 60.
  • the shift buffer 60 holds the sign of the audio feature amount over a predetermined number of frames.
  • the code (“auxiliary information”) of the speech feature amount of the speech signal of the previous frame that is, the speech frame of the past frame, that is, the number of frames specified by the delay amount control information.
  • the remaining buffer capacity is input, the remaining buffer capacity encoding unit 20 encodes the remaining buffer capacity.
  • the buffer remaining amount code is also sent to the packet configuration unit 70.
  • the packet construction unit 70 constructs a packet using a code obtained by encoding the voice signal waveform, a voice feature quantity code, delay amount control information, and a buffer remaining quantity code.
  • the packet sending unit 80 receives the packet information created by the packet construction unit 70 and sends it as a voice packet to the packet communication network.
  • the packet receiver 81 of the voice signal receiving device 2 receives voice packets from the packet communication network and accumulates them in the reception buffer 71.
  • the code obtained by encoding the voice signal waveform included in the received voice packet is sent to the voice packet decoding unit 31 and decoded into the voice signal waveform.
  • the output signal of the voice packet decoding unit 31 is output as an output voice signal through the changeover switch 32.
  • the buffer remaining capacity decoding unit 21 obtains delay amount control information for designating how many frames of auxiliary information are shifted and attached to the packet from the buffer remaining capacity code included in the received voice packet.
  • the obtained delay amount control information is sent to the shift buffer 60 and the packet configuration unit 70 in FIG.
  • the delay amount control information included in the received voice packet is used by the loss processing control unit.
  • the reception buffer remaining amount determination unit 22 detects the number of frames of packets stored in the reception buffer 71. This remaining buffer capacity is sent to the remaining buffer capacity encoding unit 20 in FIG.
  • the loss detection unit 90 detects packet loss (lost). Packets received by the packet receiving unit 81 are stored in the reception buffer 71 according to the packet number, that is, in the order of the frame number. The stored packet is read from the reception buffer 71, but if there is no packet to be read at the time of reading, the loss detection unit 90 determines that a packet loss (lost) has occurred immediately before the read operation.
  • the changeover switch 32 is switched to the output side of the loss processing control unit.
  • the invention of Patent Document 1 conceals noise when data loss occurs due to such processing.
  • the loss handling control unit operates as follows. Assume that packet loss occurs in frame n. When a packet loss occurs, the reception buffer search unit 100 searches for a reception packet stored in the reception buffer 71, and the time close to the lost frame n among the packets received from the frame n + 1 onward (time stamp) Search for the most recent packet. The code obtained by encoding the voice signal waveform included in the packet is decoded by the prefetch voice waveform decoding unit 32 to obtain a voice signal waveform. Further, the reception buffer search unit 100 searches the packet stored in the reception buffer 71 for a packet to which auxiliary information corresponding to the audio signal of the lost frame n is added.
  • the auxiliary information corresponding to the searched voice signal of the lost frame n is decoded into the pitch information and power information of the lost frame n by the voice feature amount decoding unit 51, and the lost signal generating unit 110.
  • the output audio signal is stored in the output audio buffer 130, and if it is not found by packet search, the pitch extraction unit 120 analyzes the pitch period of the output audio signal of the output audio buffer 130.
  • the pitch extracted by the pitch extraction unit 120 is a pitch corresponding to the audio signal of the frame n ⁇ 1 immediately before the lost frame.
  • the pitch corresponding to the audio signal of the immediately preceding frame n ⁇ 1 is sent to the lost signal generation unit 110.
  • the lost signal generation unit 110 extracts the speech waveform in the output speech buffer using the pitch information sent from the speech feature decoding unit 51 or the pitch extraction unit 120, and the speech waveform corresponding to the lost packet. And Rather than repeating the waveform in the pitch unit of the packet immediately before the lost packet, the waveform is repeated in the pitch unit of the voice waveform corresponding to the lost packet, so that more natural decoded speech can be obtained even if the packet is lost Can do.
  • the encoding method of the present invention includes an encoding target signal sequence generation step, a signal encoding step, a signal decoding step, a local decoding coefficient search step, and a code multiplexing step.
  • the encoding target signal sequence generation step generates a signal sequence consisting of a predetermined number of signals from the acoustic signal as an encoding target signal sequence and sets it as an encoding target signal sequence to be output.
  • the acoustic signal is divided into a predetermined number to form one frame, and a signal sequence constituting the frame is output as a signal sequence to be encoded.
  • a signal sequence constituting a subframe obtained by further dividing a frame may be output as a signal sequence to be encoded.
  • a frequency domain signal sequence that is frequency-converted in units of frames or in units of several neighboring frames is output as a signal sequence to be encoded. Further, the frequency domain signal sequence is divided into several subbands, and the frequency domain signals constituting the subbands are output as the encoding target signal sequence.
  • the signal encoding step the signal sequence is encoded for each encoding target signal sequence, and a code index is output.
  • the signal decoding step decodes the code index and outputs a decoded signal sequence.
  • the local decoding coefficient search step outputs duplication shift information from the encoding target signal sequence and the decoded signal sequence.
  • the code multiplexing step at least the code index and the duplicate shift information are multiplexed to generate a transmission signal.
  • the local decoding coefficient search step includes a duplication determination substep, a duplication shift candidate signal sequence generation substep, a distance calculation substep, and a distance minimum shift amount detection substep.
  • the duplication determination substep determines whether to generate a duplication shift candidate signal sequence from the decoded signal sequence for each encoding target signal sequence, and outputs a duplication determination flag.
  • the duplication determination substep may output a duplication determination flag indicating that a duplication shift candidate signal sequence is generated when the power of the decoded signal sequence is equal to or less than a threshold value.
  • the duplication determination substep may output a duplication determination flag indicating that a duplication shift candidate signal sequence is generated when the power of error between the encoding target signal sequence and the decoded signal sequence is larger than a threshold value.
  • the number of bits to be allocated for each encoding target signal sequence is calculated and output as allocation bit information, and when the number of bits to be allocated to the encoding target signal sequence is equal to or less than the threshold A duplication determination flag indicating that a duplication shift candidate signal sequence is generated may be output.
  • the duplicate shift candidate signal sequence generation sub-step generates duplicate shift candidate signal sequences for all predetermined signal shift amount candidates when the duplicate determination flag indicates that a duplicate shift candidate signal sequence is to be generated.
  • the duplicate shift candidate signal sequence generation substep is the duplicate shift candidate signal sequence S ⁇ tau and (w) [k], may be obtained by using a decoded signal for the sub-band frequency domain signal sequence which is divided from the same frequency-domain signal sequence sequence S ⁇ (w) [k] .
  • the distance calculation substep calculates a parameter indicating a distance between predetermined signal sequences.
  • the parameter indicating the distance between the predetermined signal sequences may be a parameter indicating the distance between the duplicate shift candidate signal sequence and the encoding target signal sequence, or complementary decoding in which the duplicate shift candidate signal sequence and the restored signal sequence are added. It may be a parameter indicating the distance between the candidate signal sequence and the encoding target signal sequence. Further, the parameter indicating the distance between the signal sequences may be a square sum (Euclidean distance) of the difference between the elements, considering the signal sequence as a vector, or an inner product between the two signal sequences.
  • a signal shift amount that minimizes the distance is obtained from the calculation result (parameter indicating distance) of the distance calculation substep.
  • the signal shift amount to be selected may be determined by the distance calculation substep calculation method (distance parameter). When the distance parameter is the Euclidean distance, the signal shift amount that minimizes the distance parameter is used. If the parameter indicating the distance is an inner product, the signal shift amount that maximizes the parameter indicating the distance may be selected.
  • the decoding method of the present invention includes a code separation step, a signal decoding step, a local decoding coefficient duplication step, and a restoration signal generation step.
  • the code separation step the code index and the copy shift information are read from the received signal and output. Note that if the received signal also includes a copy determination flag, the copy determination flag is also output.
  • the signal decoding step decodes the code index and outputs a decoded signal sequence.
  • the local decoding coefficient duplication step generates a complementary decoded signal sequence from the decoded signal sequence and the duplicate shift information.
  • the restored signal generation step generates a restored signal that is a signal indicating the original acoustic information from the complementary decoded signal sequence.
  • the complementary decoded signal sequence corresponds to the signal sequence to be encoded. That is, examples of the complementary decoded signal sequence include a signal sequence constituting a frame, a signal sequence constituting a subframe, a frequency domain signal sequence, a signal sequence constituting a subband, and the like.
  • the restoration signal generation step is a step of restoring these complementary decoded signal sequences to the original acoustic signal, and the process may be appropriately determined depending on what signal sequence the complementary decoded signal sequence is.
  • the local decoding coefficient duplication step includes a duplication determination substep, a duplication shift signal sequence generation substep, and a complementary decoding signal sequence generation substep.
  • the duplication determination substep determines whether to generate a duplication shift signal sequence from the result of bit allocation using the decoded signal sequence or the first decoded signal, and outputs a duplication determination flag. If the received signal also includes a copy determination flag, the copy determination substep is not necessary.
  • the duplicate shift signal sequence generation sub-step generates a duplicate shift signal sequence based on the shift amount indicated by the duplicate shift information when the duplicate determination flag indicates that a duplicate shift candidate signal sequence is to be generated.
  • the duplicate shift candidate signal sequence S ⁇ ⁇ [k] may be obtained from the decoded signal sequence S ⁇ [k] and the shift amount ⁇ indicated by the duplicate shift information.
  • the decoded signal sequence S (w) [k] is a signal sequence corresponding to the subband frequency domain signal sequence S (w) [k] obtained by dividing the frequency domain signal sequence by the frequency band, a replica shift is performed.
  • the duplicate shift signal sequence S ⁇ (w) [k] is converted into a decoded signal sequence S ⁇ (w) [k] for the subband frequency domain signal sequence divided from the same frequency domain signal sequence. Use it to find out.
  • the replication shift signal sequence is set as the complementary decoded signal sequence, and the replication determination flag does not generate the replication shift candidate signal sequence.
  • the decoded signal sequence is used as a complementary decoded signal sequence, and the complementary decoded signal sequence is output.
  • the duplication determination flag indicates that a duplication shift candidate signal sequence is generated, the sum of the decoded signal sequence and the duplication shift signal sequence may be used as a complementary decoded signal sequence.
  • a signal obtained by shifting a decoded signal in the time domain or the frequency domain is copied or added to the decoded signal to reduce encoding distortion, and audible noise. Reduce.
  • the following effect can be obtained by making the copy source signal a signal obtained by shifting the decoded signal in the time domain or the frequency domain. Since bits for sending a copy source signal are not required, the number of bits necessary for noise reduction can be saved.
  • a frequency band is divided into a plurality of equally spaced frequency bands (hereinafter referred to as “sub-bands”), there is a correlation between signals corresponding to each sub-band, so that the frequency band is particularly high as 4 to 14 kHz.
  • the noise on the perception can be reduced by copying or adding the signals of the neighboring subbands to obtain the signals of the subbands.
  • subframes For time domain signals, when a frame is divided at regular intervals (hereinafter referred to as “subframes”), there is a correlation between signals corresponding to each subframe. The noise on hearing can be reduced by copying or adding these signals to obtain the subframe signal.
  • a signal to be copied or added to the decoded signal is created by shifting the decoded signal in the time domain or the frequency domain, and a new decoded signal and an input signal that are made from the original decoded signal and the created signal are shortest. Since the shift amount when the distance is equal to the distance is encoded and transmitted with a small number of bits, a signal to be added or copied to the decoded signal can be designated with a small number of bits in order to reduce coding distortion.
  • the subjective quality of the decoded signal can be improved by reducing the auditory noise generated from the frequency band or time range where the coding distortion is large with a small number of bits.
  • FIG. 1 is a diagram illustrating a configuration example of a coding device and a configuration example of a decoding device according to Embodiment 1.
  • FIG. 3 is a diagram illustrating a configuration example of a local decode coefficient search unit and a configuration example of a local decode coefficient duplication unit according to the first embodiment.
  • FIG. 3 is a diagram illustrating a processing flow example of the encoding device and a processing flow example of the decoding device according to the first embodiment.
  • FIG. 6 is a diagram illustrating a configuration example of a coding apparatus and a configuration example of a decoding apparatus according to a second embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a local decode coefficient search unit and a configuration example of a local decode coefficient duplication unit according to the second embodiment.
  • FIG. 10 is a diagram illustrating a processing flow example of the encoding device and a processing flow example of the decoding device according to the second embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a local decode coefficient search unit and a configuration example of a local decode coefficient duplication unit according to the third embodiment.
  • FIG. 10 is a diagram illustrating a processing flow example of the encoding device and a processing flow example of the decoding device according to the third embodiment.
  • FIG. 6 is a diagram illustrating a configuration example of a coding apparatus and a configuration example of a decoding apparatus according to a fourth embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a local decode coefficient search unit and a configuration example of a local decode coefficient duplication unit according to the fourth embodiment.
  • FIG. 10 is a diagram illustrating a processing flow example of the encoding device and a processing flow example of the decoding device according to the fourth embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a signal encoding unit according to a fifth embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a signal decoding unit according to a fifth embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a signal encoding unit according to a first modification.
  • FIG. 10 is a diagram illustrating a configuration example of a signal decoding unit according to a first modification.
  • FIG. 10 is a diagram illustrating a configuration example of a signal encoding unit according to a second modification of the fifth embodiment.
  • FIG. 10 is a diagram illustrating a configuration example of a signal decoding unit according to a second modification example.
  • FIG. 20 is a diagram illustrating a processing flow example of an encoding device and a processing flow example of a decoding device according to a second modification example of the fifth embodiment.
  • the term “signal sequence” refers to a set of signals divided by a predetermined number for encoding and decoding.
  • the signal sequence can be considered as a vector having a predetermined number of elements. In this case, each signal is considered as a vector element.
  • the term “signal” simply refers to an array of signals that are not divided into a predetermined number or a single signal.
  • FIG. 3 to 7 are diagrams for explaining the first embodiment.
  • FIG. 3A shows a configuration example of the encoding device
  • FIG. 3B shows a configuration example of the decoding device.
  • 4A shows a configuration example of the local decode coefficient search unit
  • FIG. 4B shows a configuration example of the local decode coefficient duplication unit.
  • FIG. 5A shows an example of the processing flow of the encoding device
  • FIG. 5B shows an example of the processing flow of the decoding device.
  • FIG. 6 is a diagram illustrating an image when a time-domain signal sequence is converted into a frequency-domain signal sequence.
  • FIG. 7 is a diagram showing a method of generating a duplicate shift candidate signal sequence.
  • Encoding Device Encoding device 100 includes a frame configuration unit 1010, a signal encoding unit 1030, a signal decoding unit 1031, a local decoding coefficient search unit 1000, and a code multiplexing unit 1040.
  • the time-frequency transform discrete Fourier transform, discrete cosine transform, modified discrete cosine transform (hereinafter referred to as “MDCT”) or the like is used.
  • FIG. 6 shows an image of these time-frequency conversions.
  • the frequency domain signal sequence is a signal sequence to be encoded (hereinafter referred to as “encoding target signal sequence”). Therefore, in this embodiment, the frame configuration unit 1010 corresponds to the encoding target signal sequence generation unit 1012.
  • a code vector is selected according to Equation (2).
  • C (p) (C 0 (p) , C 1 (p) ,..., C L-1 (p) ).
  • C k (p) represents the k-th element of the p-th vector.
  • Read and output decoded signal sequence S ⁇ [k] (k 0,..., L ⁇ 1).
  • the local decoding coefficient search unit 1000 outputs the duplicate shift information ⁇ r from the frequency domain signal sequence S [k] corresponding to the encoding target signal sequence and the decoded signal sequence S ⁇ [k] (S1000).
  • the local decoding coefficient search unit 1000 includes a duplication determination unit 1001, a duplication shift candidate signal sequence generation unit 1002, a distance calculation unit 1003, and a minimum distance shift amount detection unit 1004.
  • the number of candidates for the signal shift amount ⁇ ) is generated, and the duplication determination flag Flag d is output (S1001).
  • the copy shift candidate signal sequence generation unit 1002 sets all the predetermined signal shift amounts.
  • the distance calculation unit 1003 calculates a parameter (hereinafter referred to as “distance parameter”) indicating the distance between the duplicate shift candidate signal sequence S ⁇ ⁇ [k] and the frequency domain signal sequence S [k] (S1003).
  • Formula (4) has shown the Euclidean distance
  • Formula (5) has shown the inner product, it is not necessary to limit to these formulas.
  • the distance minimum shift amount detection unit 1004 obtains the signal shift amount ⁇ that minimizes the distance parameter d [ ⁇ ] when the distance parameter is obtained by Expression (4), and outputs the signal shift amount ⁇ r (S1004). . That is, replication shift information ⁇ r is obtained according to equation (6).
  • the distance minimum shift amount detection unit 1004 obtains the signal shift amount ⁇ that maximizes the distance parameter d [ ⁇ ], and outputs it as the duplicate shift information ⁇ r ( S1004). That is, replication shift information ⁇ r is obtained according to equation (7).
  • the code multiplexing unit 1040 multiplexes the code index I c and the copy shift information ⁇ r to generate a transmission signal (S1040). Specifically, the code multiplexing unit 1040 receives the code index I c and the copy shift information ⁇ r as input and generates one data set arranged in a predetermined order. When transmission is performed using an IP network or the like, a packet is generated by adding necessary header information.
  • the decoding device 200 includes a code separation unit 2041, a signal decoding unit 2031, a local decoding coefficient duplication unit 2100, a frequency time conversion unit 2021, and a superposition addition unit 2011.
  • the frequency time conversion unit 2021 and the superposition addition unit 2011 are collectively referred to as a restoration signal generation unit 2012.
  • the code separation unit 2041 reads the code index I c and the copy shift information ⁇ r from the received signal and outputs them (S2041).
  • the local decoding coefficient duplication unit 2100 includes a duplication determination unit 2001, a duplication shift signal sequence generation unit 2002, and a complementary decoded signal sequence generation unit 2006.
  • the duplication determination unit 2001 determines whether to generate a duplication shift signal sequence S ⁇ ⁇ [k] from the decoded signal sequence S ⁇ [k], and outputs a duplication determination flag Flag d (S2001).
  • the process of the duplication determination unit 2001 is the same as that of the duplication determination unit 1001 of the encoding device 100.
  • the duplication shift signal sequence generation unit 2002 is based on the shift amount ⁇ indicated by the duplication shift information ⁇ r.
  • a duplicate shift signal sequence S ⁇ ⁇ [k] is generated (S2002).
  • the decoded signal sequence S ⁇ [k] is used as a complementary decoded signal sequence.
  • S ⁇ [k] is used, and the complementary decoded signal sequence S ⁇ [k] is output (S2006). That means
  • the complementary decoded signal sequence S 1- [k] is obtained as follows.
  • the restoration signal generation unit 2012 generates a restoration signal that is a signal indicating the original acoustic information from the complementary decoded signal sequence S 1 to [k] (S2012).
  • the signal sequence to be encoded is the frequency domain signal sequence S [k]. That is, the complementary decoded signal sequences S 1 to [k] are frequency domain signals. Therefore, the restoration signal generation unit 2012 includes a frequency time conversion unit 2021 and a superposition addition unit 2011.
  • the frequency time conversion unit 2021 converts the frequency domain signal sequence S [k] into an L sample time domain signal sequence (S2021).
  • the superimposing / adding unit 2011 calculates a restoration signal by adding signals obtained by multiplying a signal sequence in the time domain by a half of the frame length and adding the signals obtained by multiplying the signal by a window function (S2011).
  • FIGS. 8 and 9 show a functional configuration and a processing flow when the signal sequence to be encoded is a time domain signal sequence in units of frames.
  • 8A shows a functional configuration example of the encoding device
  • FIG. 8B shows a functional configuration example of the decoding device
  • FIG. 9A shows a processing flow example of the encoding device
  • FIG. 9B shows a processing flow example of the decoding device.
  • the encoding apparatus 100 ′ and the decoding apparatus 200 ′ differ only in the encoding target signal sequence from the encoding apparatus 100 and the decoding apparatus 200. Therefore, only the encoding target signal sequence generation unit 1012 ′ and the restoration signal generation unit 2012 ′ are different from each other in processing of the configuration unit.
  • the encoding target signal sequence generation unit 1012 ' includes a frame configuration unit 1010'.
  • the superposition addition unit 2011 calculates a restoration signal by superimposing and adding signals obtained by multiplying a signal sequence in the time domain by a half of the frame length, and uses this as a restoration signal (S2011).
  • the encoding device and the decoding device of the present modification can obtain the same effects as those of the first embodiment.
  • FIG. 10 to 13 are diagrams for explaining the second embodiment.
  • FIG. 10A shows a configuration example of the encoding device
  • FIG. 10B shows a configuration example of the decoding device.
  • FIG. 11A shows a configuration example of the local decode coefficient search unit
  • FIG. 11B shows a configuration example of the local decode coefficient duplication unit.
  • FIG. 12A shows an example of the processing flow of the encoding device
  • FIG. 12B shows an example of the processing flow of the decoding device.
  • FIG. 13 is a diagram illustrating a method for generating a complementary decoding candidate signal sequence.
  • the encoding target signal sequence in the second embodiment is a frequency domain signal sequence (same as that in the first embodiment).
  • Encoding apparatus Encoding apparatus 150 includes frame configuration section 1010, signal encoding section 1030, signal decoding section 1031, local decoding coefficient search section 1500, and code multiplexing section 1540.
  • the frame configuration unit 1010, the signal encoding unit 1030, and the signal decoding unit 1031 are the same as those of the encoding device 100 according to the first embodiment.
  • the local decoding coefficient search unit 1500 outputs the copy shift information ⁇ r and the copy determination flag Flag d from the frequency domain signal sequence S [k] and the decoded signal sequence S ⁇ [k] corresponding to the signal sequence to be encoded ( S1500).
  • the local decoding coefficient search unit 1500 includes a duplication determination unit 1501, a duplication shift candidate signal sequence generation unit 1002, a distance calculation unit 1503, and a minimum distance shift amount detection unit 1004.
  • the duplication determination unit 1501 duplicates when the power P of the error signal (S [k] ⁇ S ⁇ [k]) between the frequency domain signal sequence S [k] and the decoded signal sequence S ⁇ [k] exceeds a threshold value.
  • the duplicate shift candidate signal sequence generation unit 1002 is the same as that in the first embodiment.
  • the distance calculation unit 1503 adds the complementary decoded candidate signal sequence S to ⁇ [k] obtained by adding the duplicate shift candidate signal sequence S ⁇ ⁇ [k] and the decoded signal sequence S ⁇ [k], and the frequency domain signal sequence S [k. ] Is calculated (S1503).
  • Formula (10) has shown the Euclidean distance
  • Formula (11) has shown the inner product, it is not necessary to limit to these formulas.
  • the distance minimum shift amount detection unit 1004 is the same as that in the first embodiment.
  • the code multiplexing unit 1540 multiplexes the code index I c , the copy shift information ⁇ r, and the copy determination flag Flag d to generate a transmission signal (S1040). Specifically, the code multiplexing unit 1540 receives the code index I c , the copy shift information ⁇ r and the copy determination flag Flag d as input, and generates one data set arranged in a predetermined order. When transmission is performed using an IP network or the like, a packet is generated by adding necessary header information.
  • the decoding device decoding device 250 includes a code separation unit 2541, a signal decoding unit 2031, a local decoding coefficient duplication unit 2500, a frequency time conversion unit 2021, and a superposition addition unit 2011.
  • the frequency time conversion unit 2021 and the superposition addition unit 2011 are collectively referred to as a restoration signal generation unit 2012.
  • the code separation unit 2541 reads and outputs the code index I c , the copy shift information ⁇ r and the copy determination flag Flag d from the received signal (S2541).
  • the signal decoding unit 2031 is the same as that in the first embodiment.
  • the duplicate shift signal string generation unit 2002 is the same as that in the first embodiment.
  • the complementary decoded signal sequence generation unit 2506 adds the duplicate shift signal sequence S ⁇ ⁇ [k] and the decoded signal sequence S ⁇ [k], thereby completing the complementary decoded signal sequence S 1 to [k]. ] Is generated and output (S2006). That means
  • the complementary decoded signal sequence S 1- [k] is obtained as follows.
  • the restoration signal generation unit 2012 is the same as that in the first embodiment. With the configuration as described above, encoding distortion can be reduced when the error between the decoded signal sequence and the encoding target signal sequence is large.
  • FIG. 14A is a configuration example of an encoding device
  • FIG. 14B is a configuration example of a decoding device
  • FIG. 15A is a configuration example of a local decoding coefficient search unit
  • FIG. 15B is a configuration example of a local decoding coefficient duplication unit
  • FIG. 16B shows a processing flow example of the decoding apparatus.
  • FIG. 17A shows an image when a frequency domain signal sequence is converted into a subband frequency domain signal sequence
  • FIG. 17B shows an image when a subband complementary decoded signal sequence is converted into a complementary decoded signal sequence.
  • FIG. 17A shows an image when a frequency domain signal sequence is converted into a subband frequency domain signal sequence
  • FIG. 17B shows an image when a subband complementary decoded signal sequence is converted into a complementary decoded signal sequence.
  • FIG. 17A shows an image when a frequency domain signal sequence is converted into a subband frequency domain signal sequence
  • FIG. 17B shows an image when a subband complementary decoded
  • FIG. 18 is a diagram illustrating a relationship among a decoded signal sequence, a subband decoded signal sequence, and a subband duplication shift candidate signal sequence.
  • FIG. 19 is a diagram illustrating a method of generating a subband duplication shift signal sequence.
  • the present embodiment is different from the second embodiment in that a sub-band signal sequence obtained by dividing the frequency domain signal sequence into several frequency bands is used as the encoding target signal sequence.
  • Encoding apparatus Encoding apparatus 300 includes frame configuration section 1010, subband division section 3050, signal encoding section 3030, signal decoding section 3031, local decoding coefficient search section 3000, and code multiplexing section 1540.
  • the frame configuration unit 1010 and the code multiplexing unit 1540 are the same as the encoding device 150 of the second embodiment.
  • W represents the number to be divided
  • L ′ represents the number of signals included in the subband frequency domain signal sequence.
  • the signal encoding unit 3030 is the same as the signal encoding unit 1030 of the first embodiment, except that the encoding target signal sequence is changed from the frequency domain signal sequence to the subband frequency domain signal sequence. Then, the signal encoding unit 3030 outputs a code index I c (w) for the subband frequency domain signal sequence S (w) [k] (S3030).
  • the local decoding coefficient search unit 3000 uses the sub-band frequency domain signal sequence S (w) [k] and the decoded signal sequence S ⁇ (w) [k] to copy the copy shift information ⁇ r (w) and the copy determination flag Flag d ( w) is output (S3000).
  • the local decoding coefficient search unit 3000 includes a duplication determination unit 3001, a duplication shift candidate signal sequence generation unit 3002, a distance calculation unit 3003, and a minimum distance shift amount detection unit 3004.
  • a subband duplication shift candidate signal sequence S ⁇ ⁇ (w) [k] is generated from the decoded signal sequence of the neighboring subbands.
  • the duplicate shift candidate signal sequence S ⁇ ⁇ (w) [k] is generated as in the equation (14)
  • the duplicate shift candidate signal sequence S ⁇ ⁇ (w) [k] is originally derived from the same frequency domain signal sequence. It is generated from the decoded signal sequence for the divided subband frequency domain signal sequence.
  • a subband replication shift candidate signal sequence S ⁇ ⁇ (w) [k] having a short distance can be obtained.
  • FIG. 18 shows an example of generating S ⁇ ⁇ (2) [k].
  • the distance calculation unit 3003 and the minimum distance shift amount detection unit 3004 are the same as those in the first and second embodiments, except that the number of signals in the signal sequence is changed.
  • the code multiplexing unit 1540 is the same as that in the second embodiment.
  • the decoding apparatus decoding apparatus 400 includes a code separation unit 4041, a signal decoding unit 4031, a local decoding coefficient duplicating unit 4100, a subband combining unit 4051, a frequency time converting unit 2021, and a superposition adding unit 2011.
  • the subband combination unit 4051, the frequency time conversion unit 2021, and the superposition addition unit 2011 are collectively referred to as a restoration signal generation unit 4012.
  • the code separation unit 4041 reads and outputs the code index I c (w) , the copy shift information ⁇ r (w), and the copy determination flag Flag d (w) from the received signal (S4041).
  • the Local decoding coefficient copying unit 4100 includes a duplication shift signal sequence generation unit 4002 and a complementary decoding signal sequence generation unit 4005.
  • FIG. 19 shows the processing of the equation (15).
  • the complementary decoded signal sequence generation unit 4005 adds the subband duplication shift signal sequence S ⁇ (w) [k] and the decoded signal sequence S ⁇ (w) [k] to thereby obtain the subband complementary decoded signal sequence S 1 ⁇ (W) Generate and output [k] (S4005).
  • the subband combining unit 4051 combines a plurality of subband complementary decoded signal sequences to generate a complementary decoded signal sequence (S4051).
  • the frequency time conversion unit 2021 and the superposition addition unit 2011 are the same as those in the first and second embodiments.
  • the encoding device and the decoding device of the third embodiment can obtain the same effects as those of the first and second embodiments. Further, since errors in a frequency band having a large distortion due to encoding can be reduced, noise on hearing can be further reduced.
  • [Modification] 20 and 21 show a functional configuration and a processing flow when the signal sequence to be encoded is a signal sequence in the time domain in units of subframes.
  • 20A shows a functional configuration example of the encoding device
  • FIG. 21B shows a functional configuration example of the decoding device
  • FIG. 21A shows a processing flow example of the encoding device
  • FIG. 21B shows a processing flow example of the decoding device.
  • the encoding apparatus 300 ′ and the decoding apparatus 400 ′ are different only in the encoding target signal sequence from the encoding apparatus 300 and the decoding apparatus 400. Therefore, only the encoding target signal sequence generation unit 3012 ′ and the restoration signal generation unit 4012 ′ are different from each other in processing of the configuration unit.
  • the encoding target signal sequence generation unit 3012 ′ includes a frame configuration unit 1010 ′ and a subframe division unit 3050 ′.
  • the processing of the other components of the encoding device 300 ′ is the same as that of the encoding device 300.
  • the subframe combining unit 4051 ′ combines the subframe complementary decoded signal sequences s 1 to (w) [k] to generate complementary decoded signal sequences s 1 to [k] (S4051 ′).
  • the superposition addition unit 2011 calculates a restored signal by adding signals obtained by multiplying the complementary decoded signal sequence s 1 to [k] by a window function by half each frame length, and uses this as a restored signal (S2011). ).
  • the encoding device and the decoding device of the present modification can obtain the same effects as those of the third embodiment.
  • FIG. 22A shows a configuration example of the encoding device
  • FIG. 22B shows a configuration example of the decoding device
  • FIG. 23A shows a configuration example of the signal encoding unit
  • FIG. 23B shows a configuration example of the signal decoding unit
  • 24A shows a configuration example of the local decode coefficient search unit
  • FIG. 24B shows a configuration example of the local decode coefficient duplication unit
  • FIG. 25A shows an example of the processing flow of the encoding device
  • FIG. 25B shows an example of the processing flow of the decoding device.
  • 26 is a diagram illustrating a method for calculating subband allocation bit information
  • FIG. 27 is a diagram illustrating a relationship between a bit allocation table and a code book
  • FIG. 28 is a diagram illustrating a method for selecting a code index.
  • the signal sequence to be encoded in this embodiment is a subband frequency domain signal sequence (same as that in Embodiment 3).
  • Encoding apparatus Encoding apparatus 500 includes frame configuration section 1010, subband division section 3050, signal encoding section 5030, signal decoding section 5031, local decoding coefficient search section 5000, and code multiplexing section 5040.
  • the frame configuration unit 1010 and the subband division unit 3050 are the same as those of the encoding device 300 according to the third embodiment.
  • the signal encoding unit 5030 includes a parameter calculation unit 5032, a first encoding unit 5033, a first local decoding unit 5034, a dynamic bit allocation unit 5035, a second encoding unit 5036, a local code multiplexing A conversion unit 5037.
  • the w-th subband average amplitude index is calculated according to the following equation.
  • the w-th subband average amplitude A ′ [w] can be calculated by the following equation using the w-th subband average amplitude index.
  • the first parameter of the wth subband may be encoded for each subband by binary encoding or Huffman encoding.
  • the assigned bit information B [w] of the wth subband is output by the binary search method using the wth subband auditory importance degree ip [w] and the bit assignment table R.
  • “water Level” is selected by a binary search based on the following equation, and “water Level ⁇ ” and the w th subband auditory importance degree ip [w] are used.
  • Band allocation bit information B [w] is calculated.
  • the calculation may be performed by the method shown in FIG. First, parameters (maxIP, minIP, ⁇ , i) are set to initial values (S50351). Bt [w] is calculated as a temporary value of B [w], and the sum Sum_Bt with the already calculated Bt [w] is obtained (S50352). It is confirmed whether Sum_Bt exceeds the allocatable total number of bits (total_bit_budget) (S50353). If step S50353 is Yes, the parameter (minIP, ⁇ , i) is changed (S50354). When step S50353 is No, Bt [w] is set to B i [w], and the parameters (maxIP, ⁇ , i) are changed (S50355).
  • Step S50356 It is confirmed whether i is less than a predetermined constant (S50356). If step S50356 is Yes, the process returns to step S50352.
  • Step S50356 is No, B i [w] is output as allocated bit information B [w] of the w-th subband.
  • B [w] is evaluated.
  • the process may be ended by separately defining a convergence condition for ending the iterative process. For example, a method of ending the process when the total number of allocated bits is equal to the total number of bits that can be allocated (total_bit_budget) can be considered.
  • the final w-th subband allocation bit information is determined by adjusting so that the total number of allocated bits is smaller than the total number of total bits.
  • FIGS. 27A and 27B it is assumed that the number of bits in the bit allocation table and the search range of the codebook are associated one-to-one. Note that the search ranges may overlap each other.
  • FIG. 27A shows an example when search ranges do not overlap
  • FIG. 27B shows an example when search ranges do not overlap.
  • the second encoding unit 5036 quantizes the w-th subband frequency domain signal sequence S (w) [k] according to the procedure shown in FIG.
  • the range of codebook search in the second encoding unit 5036 is determined using the allocation bit information B [w].
  • B [w] is less than or equal to the threshold value, encoding is not performed.
  • a code vector that minimizes the distance from the w-th subband frequency domain signal vector in which the w-th subband frequency domain signal sequence S (w) [k] is regarded as a vector is assigned bit information B [w
  • the index of the selected code vector is output as the w-th subband second signal code index I B (w) .
  • a code vector is selected according to Expression (17).
  • C (p) (C 0 (p) , C 1 (p) ,..., C L′ ⁇ 1 (p) ).
  • C k (p) represents the k-th element of the p-th vector.
  • the local code multiplexing unit 5037 arranges the w-th subband first signal code index I A (w) and the w-th subband second signal code index I B (w) in a predetermined order to form a data set, Output as I C.
  • the signal decoding unit 5031 includes a local code separation unit 5038, a first local decoding unit 5034, a dynamic bit allocation unit 5035, a second decoding unit 5039, and a decoding parameter processing unit 5044.
  • the local code separation unit 5038 reads the number of bits at a predetermined position from the code index I C , so that the w-th subband first signal code index I A (w) and the w-th subband second signal code index I B (w) is output.
  • the first local decoding unit 5034 decodes the w-th subband first signal code index I A (w) and outputs the w-th subband first decoding parameter.
  • the operation of the first local decoding unit 5034 is the same as that of the first local decoding unit 5034 in the signal encoding unit 5030.
  • the dynamic bit allocation unit 5035 calculates the number of bits allocated to each subband from the first decoding parameter of the wth subband, and outputs it as allocated bit information of the wth subband.
  • the operation of the dynamic bit allocation unit 5035 is the same as that of the dynamic bit allocation unit 5035 in the signal encoding unit 5030.
  • the second decoding unit 5039 decodes the w-th subband second signal code index I B (w) using the allocated bit information B [w] of the w-th subband, and sets the w-th subband second decoding parameter. Output. Note that, like the second encoding unit 5036 in the signal encoding unit 5030, the number of bits in the bit allocation table and the search range of the codebook are associated with each other on a one-to-one basis.
  • the decoding procedure is as follows. First, the codebook search range is determined using the allocated bit information B [w] of the wth subband.
  • a code vector corresponding to the w-th subband second signal code index I B (w) is selected from a codebook search range determined from the assigned bit information B [w], and a code corresponding to the selected code vector is selected.
  • the vector C (p) (C 0 (p) , C 1 (p) ,..., C L′ ⁇ 1 (p) ) is output as the w-th subband second decoding parameter.
  • Decoding parameter processing section 5044 outputs a decoded signal sequence S ⁇ (w) [k] using the w-th subband first decoding parameter and the w-th subband second decoding parameter. For example, using the average amplitude index A 1 to [w] of the w-th subband as the first decoding parameter of the w-th subband and the code vector normalized so that the average amplitude becomes 1 as the second decoding parameter of the w-th subband. If there is, the processing such as multiplying each coefficient of the w-th subband second decoding parameter by the w-th subband average amplitude calculated from the w-th subband average amplitude index is performed, and the decoded signal sequence S ⁇ (w ) [K] is calculated.
  • the local decoding coefficient search unit 5000 outputs the copy shift information ⁇ r (w) from the subband frequency domain signal sequence S (w) [k] and the decoded signal sequence S ⁇ (w) [k] (S5000).
  • the local decoding coefficient search unit 5000 includes a duplication determination unit 5001, a duplication shift candidate signal sequence generation unit 3002, a distance calculation unit 3003, and a minimum distance shift amount detection unit 3004.
  • the duplication shift candidate signal sequence generation unit 3002, the distance calculation unit 3003, and the minimum distance shift amount detection unit 3004 are the same as those of the encoding device 300 of the third embodiment.
  • the code multiplexing unit 5040 multiplexes the code index I C and the copy shift information ⁇ r (w) to generate a transmission signal (S5040). Specifically, the code multiplexing unit 5040 receives the code index I C and the copy shift information ⁇ r (w) as input, and generates one data set arranged in a predetermined order. When transmission is performed using an IP network or the like, a packet is generated by adding necessary header information.
  • the decoding apparatus decoding apparatus 600 includes a code separation unit 6041, a signal decoding unit 6031, a local decoding coefficient duplication unit 6100, a subband combining unit 4051, a frequency time conversion unit 2021, and a superposition addition unit 2011.
  • the subband combination unit 4051, the frequency time conversion unit 2021, and the superposition addition unit 2011 are collectively referred to as a restoration signal generation unit 4012.
  • the code separation unit 6041 reads and outputs the code index I c and the copy shift information ⁇ r (w) from the received signal (S6041).
  • the processing procedure of the signal decoding unit 6031 is the same as that of the signal decoding unit 5031.
  • the copy determination flag Flag d (w) (for example, Flag ) indicating that the copy shift candidate signal sequence S ⁇ ⁇ [k] is not generated.
  • d (w) 0) is output (S6001).
  • the duplicate shift signal sequence generation unit 4002 and the complementary decoded signal sequence generation unit 4005 are the same as the decoding device 400 of the third embodiment.
  • the subband combining unit 4051, the frequency time converting unit 2021, and the superposition adding unit 2011 are also the same as the decoding device 400 of the third embodiment.
  • FIG. 29A is a functional configuration example of the encoding device
  • FIG. 29B is a functional configuration example of the decoding device
  • FIG. 30A is a processing flow example of the encoding device
  • FIG. 30B is a processing flow example of the decoding device.
  • the encoding device 500 ′ and the decoding device 600 ′ differ only in the encoding target signal sequence from the encoding device 500 and the decoding device 600. Therefore, only the encoding target signal sequence generation unit 3012 ′ and the restoration signal generation unit 4012 ′ are different from each other in processing of the configuration unit.
  • the encoding target signal sequence generation unit 3012 ' is the same as the encoding device 300' of the third embodiment, and the restored signal generation unit 4012 'is the same as the decoding device 400' of the third embodiment.
  • the encoding device and decoding device of the present modification can obtain the same effects as in the fourth embodiment.
  • FIG. 31 shows a configuration example of the encoding device
  • FIG. 32 shows a configuration example of the decoding device
  • FIG. 33 shows a configuration example of the signal encoding unit
  • FIG. 34A shows a configuration example of the signal decoding unit in the encoding device
  • FIG. 34B shows a configuration example of the signal decoding unit in the decoding device
  • FIG. 35A shows a processing flow example of the encoding device
  • FIG. 35B shows a processing flow example of the decoding device.
  • FIG. 36 is a diagram illustrating a code index generation method and a data set configuration. Note that the signal sequence to be encoded in the present embodiment is a subband frequency domain signal sequence (same as in the third and fourth embodiments).
  • Encoding apparatus Encoding apparatus 700 includes frame configuration section 1010, subband division section 3050, signal encoding section 7030, signal decoding section 7031, local decoding coefficient search section 5000, and code multiplexing section 7040.
  • the frame configuration unit 1010 and the subband splitting unit 3050 are the same as the encoding device 300 of the third embodiment and the encoding device 500 of the fourth embodiment.
  • the signal encoding unit 7030 includes a parameter calculation unit 5032, a first encoding unit 5033, a first local decoding unit 5034, a dynamic bit allocation unit 5035, and a second encoding unit 5036.
  • the difference from the signal encoding unit 5030 of the fourth embodiment is that there is no code multiplexing unit 5037.
  • the parameter calculation unit 5032, the first encoding unit 5033, the first local decoding unit 5034, the dynamic bit allocation unit 5035, and the second encoding unit 5036 are the same as the signal encoding unit 5030.
  • the signal decoding unit 7031 includes a first local decoding unit 5034, a dynamic bit allocation unit 5035, a second decoding unit 5039, and a decoding parameter processing unit 5044.
  • the first local decoding unit 5034, the dynamic bit allocation unit 5035, the second decoding unit 5039, and the decoding parameter processing unit 5044 are the same as those of the encoding device 500 of the fourth embodiment.
  • the local decoding coefficient search unit 5000 is the same as the encoding device 500 of the fourth embodiment.
  • the code multiplexing unit 7040 multiplexes the first signal code index I A , the second signal code index I B (w) , the allocation bit information B [w], and the duplicate shift information ⁇ r (w) to generate a transmission signal. (S7040). For example, as shown in FIG. 36, the code multiplexing unit 7040 outputs a first signal code index I A as a data set consisting of bit strings of a fixed number of bits (S7041).
  • the allocated bit information B [w] is compared with a threshold value (S7042), and if it is larger than the threshold value, the second signal code index I B (w) of the wth subband is set as a bit string of B [w] bits. (S7043).
  • the decoding apparatus 800 includes a code separation unit 8041, a signal decoding unit 8032, a local decoding coefficient duplicating unit 6100, a subband combining unit 4051, a frequency time converting unit 2021, and a superposition adding unit 2011.
  • the subband combination unit 4051, the frequency time conversion unit 2021, and the superposition addition unit 2011 are collectively referred to as a restoration signal generation unit 4012.
  • the code separation unit 8041 reads and outputs the first signal code index I A and the second signal code index I B (w) from the received signal (S8041).
  • the signal decoding unit 8032 includes a first local decoding unit 8043, a dynamic bit allocation unit 5035, a second decoding unit 8042, and a decoding parameter processing unit 5044. First, the first local decoding unit 8043 decodes the first signal code index I A, and outputs a first decoding parameter the w subband.
  • the dynamic bit allocation unit 5035 outputs allocation bit information from the subband first parameter.
  • the dynamic bit allocation unit 5035 is the same as the decoding device 600 of the fourth embodiment.
  • the second decoding unit 8042 decodes the wth subband second signal code index I B (w) using the allocated bit information B [w] of the wth subband, Duplicate shift information ⁇ r (w) is output.
  • the second sub-band second bit is read by decoding the bit string of B [w] bits from the second signal code index I B (w) .
  • the decoding parameter processing unit 5044 is the same as the decoding device 600 of the fourth embodiment.
  • the local decoding coefficient duplication unit 6100, the subband combining unit 4051, the frequency time conversion unit 2021, and the superposition addition unit 2011 are the same as the decoding device 600 of the fourth embodiment.
  • the encoding apparatus and decoding apparatus according to the present embodiment can achieve the same effects as those of the fourth embodiment.
  • FIG. 31 shows a configuration example of the encoding device
  • FIG. 32 shows a configuration example of the decoding device
  • FIG. 35A shows the processing flow of the encoding device
  • FIG. 35B shows the processing flow of the decoding device
  • FIG. 37 shows a configuration example of the signal encoding unit
  • FIG. 38A shows a configuration example of the signal decoding unit in the encoding device
  • FIG. 38B shows a configuration example of the signal decoding unit in the decoding device.
  • FIG. 39 is a diagram showing a processing procedure of the dynamic bit reallocation section 9060.
  • the signal encoding unit 9030 includes a parameter calculation unit 5032, a first encoding unit 5033, a first local decoding unit 5034, a dynamic bit allocation unit 5035, a dynamic bit reallocation unit 9060, a second An encoding unit 5036 is provided.
  • the parameter calculation unit 5032, the first encoding unit 5033, the first local decoding unit 5034, the dynamic bit allocation unit 5035, and the second encoding unit 5036 are the same as the signal encoding unit 7030 of the fifth embodiment.
  • the dynamic bit reallocation unit 9060 generates allocation bit information according to the following procedure.
  • the output of the dynamic bit allocation unit 5035 (referred to as “first allocation bit information B [w]” in the present modification) is compared with a threshold value.
  • w] b min .
  • the remaining bit b total is allocated to the remaining subbands by the same operation as that of the dynamic bit allocation unit 5035, and the value of the allocated bit information of the wth subband is determined for all w and output.
  • the encoding device and the decoding device of the present embodiment can obtain the same effects as those of the fifth embodiment. Also, since the number of bits allocated to the subband can be made more appropriate, the subjective quality can be further improved.
  • [Modification 2] 40 to 42 show functional configurations and processing flows when the encoding target signal sequence is a time domain signal sequence in subframe units.
  • 40 shows a functional configuration example of the encoding device
  • FIG. 41 shows a functional configuration example of the decoding device
  • FIG. 42A shows a processing flow example of the encoding device
  • FIG. 42B shows a processing flow example of the decoding device.
  • the encoding apparatus 700 ′ and the decoding apparatus 800 ′ are different only in the encoding target signal sequence from the encoding apparatus 700 and the decoding apparatus 800. Therefore, only the encoding target signal sequence generation unit 3012 ′ and the restoration signal generation unit 4012 ′ are different from each other in processing of the configuration unit.
  • the encoding target signal sequence generation unit 3012 ' is the same as the encoding device 300' of the third embodiment, and the restored signal generation unit 4012 'is the same as the decoding device 400' of the third embodiment.
  • the encoding device and the decoding device of the present modification can obtain the same effects as those of the fifth embodiment.
  • FIG. 43 shows a functional configuration example of the computer.
  • the encoding method and decoding method of the present invention causes the recording unit 2020 of the computer 2000 to read a program that causes the computer 2000 to execute each step of the present invention, and the processing unit 2010, the input unit 2030, the output unit 2040, and the like. It can be realized by operating.
  • the program is recorded on a computer-readable recording medium, and the program recorded on the server or the like is read into the computer through a telecommunication line or the like. There is a method to make it.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 復号信号を高品質に合成する。本発明の符号化方法は、ローカルデコード係数探索ステップを有す。ローカルデコード係数探索ステップは、複製判定サブステップ、複製シフト候補信号列生成サブステップ、距離計算サブステップ、距離最小シフト量検出サブステップを有す。複製判定サブステップは、符号化対象信号列ごとに、復号信号列から複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する。複製シフト候補信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する。距離計算サブステップは、あらかじめ定めた信号列同士の距離を示すパラメータを計算する。距離最小シフト量検出サブステップは、距離が最小となる信号シフト量を求める。

Description

符号化方法、復号方法、それらの方法を用いた装置、プログラム
 本発明は、音声などの音響信号の符号化方法、復号方法、それらの方法を用いた装置、プログラムに関する。特に、符号化および情報の伝送の際に失われる情報を補完するための技術であって、伝送する符号に対して、損失する情報の一部を利用して得られる符号を付加することにより、復号時に損失した情報を復元する技術に関する。
 少ないビットレートで入力信号を符号化する際や符号化したデータを伝送した際にデータの欠落が生じた場合に、ビット数の不足やビットの欠落により、入力信号と復号信号の誤差(符号化歪)が極端に大きくなる場合がある。符号化歪が大きい場合には、これが耳障りなノイズとして知覚される原因となる。伝送によりデータの欠落が生じた場合のノイズを隠蔽するための従来技術として、ある特徴量に着目し、復号信号の特徴量に近い値を持つ過去の復号信号をコピーする手法がある(特許文献1)。
 特許文献1の音声信号送信装置1の機能構成例を図1に、音声信号受信装置2の機能構成例を図2にそれぞれ示す。送信装置1において、入力音声信号は入力バッファ10に蓄えられ、音声信号をフレームと呼ばれる一定の時間ごとに区切って、つまりフレーム分割して音声波形符号化部30に送る。音声波形符号化部30では、入力音声信号を音声符号に変換する。音声符号はパケット構成部70に送られる。音声特徴量計算部40では、入力バッファ10に蓄えられた音声信号を用いて、当該フレームにおけるその音声信号の音声特徴量を計算する。音声特徴量とは、ピッチ周期(音声の基本周波数に相当)、パワなどを指し、これらの特徴量のいずれかのみを利用することもあるし、全部を利用することもある。
 音声特徴量符号化部50では、前記音声特徴量を決められたビット数で表すことができるように量子化した後、符号に変換する。符号化された音声特徴量は、シフトバッファ60に送られる。シフトバッファ60では、あらかじめ指定された数のフレームにわたって音声特徴量の符号を保持する。そして、シフトバッファ60では、後述する遅延量制御情報が入力されると、遅延量制御情報で指定されたフレーム数だけ前、つまり過去のフレームの音声信号の音声特徴量の符号(「補助情報」ともいう。)をパケット構成部70に送る。また、バッファ残量符号化部20は、バッファ残量が入力されると、バッファ残量を符号化する。そのバッファ残量符号もパケット構成部70に送られる。パケット構成部70では、前記音声信号波形を符号化した符号と、音声特徴量の符号と、遅延量制御情報と、バッファ残量符号を用いてパケットを構成する。パケット送出部80は、パケット構成部70で作成されたパケットの情報を受け取り、音声パケットとしてパケット通信網に送出する。
 音声信号受信装置2のパケット受信部81は、パケット通信網から音声パケットを受信し、受信バッファ71に蓄積する。受信した音声パケットに含まれる音声信号波形を符号化した符号は、音声パケット復号部31に送られ、音声信号波形に復号される。パケットロスが発生していないフレームでは、音声パケット復号部31の出力信号が切替スイッチ32を通じて出力音声信号として出力される。バッファ残量復号部21では、受信した音声パケットに含まれるバッファ残量符号から、補助情報を何フレームまでずらしてパケットにつけるかを指定する遅延量制御情報を求める。求められた遅延量制御情報は、図1中のシフトバッファ60とパケット構成部70に送られる。受信した音声パケットに含まれる遅延量制御情報は、紛失処理制御部で利用される。受信バッファ残量判定部22は、受信バッファ71に蓄積されているパケットのフレーム数を検出する。このバッファ残量は、図1中のバッファ残量符号化部20に送られる。
 紛失検出部90はパケットロス(紛失)を検出する。パケット受信部81で受信されたパケットはそのパケット番号にしたがって、つまりフレーム番号の順に受信バッファ71に格納される。受信バッファ71からは、格納されたパケットが読み出されるが、読み出される際に読み出すパケットがない場合には、その読み出し動作の直前に、パケットロス(紛失)が発生したと紛失検出部90が判定し、切替スイッチ32を紛失処理制御部の出力側に切替える。特許文献1の発明は、このような処理によって伝送によりデータの欠落が生じた場合のノイズを隠蔽する。
 なお、紛失処理制御部は、以下のように動作する。フレームnにおいて、パケットロスが発生したとする。パケットロスが発生した場合は、受信バッファ探索部100が受信バッファ71に蓄積された受信パケットを探索し、フレームn+1以降で受信されているパケットの中で、紛失フレームnに時間の近い(タイムスタンプが直近の)パケットを探索する。パケットに含まれる音声信号波形を符号化した符号は、先読み音声波形復号部32で復号され、音声信号波形が得られる。さらに受信バッファ探索部100において受信バッファ71に蓄積されたパケットの中から、紛失フレームnの音声信号に対応する補助情報が付加されたパケットを探索する。このパケット探索で見つかれば、探索された紛失フレームnの音声信号に対応する補助情報は、音声特徴量復号部51において紛失フレームnの音声信号のピッチ情報とパワ情報に復号され、紛失信号生成部110に送られる。一方、出力音声信号は出力音声バッファ130に蓄えられ、パケット検索により見つからなければ出力音声バッファ130の出力音声信号はピッチ抽出部120においてピッチ周期の分析が行われる。ピッチ抽出部120において抽出されるピッチは、紛失フレームの直前フレームn-1の音声信号に対応するピッチである。直前フレームn-1の音声信号に対応するピッチは、紛失信号生成部110に送られる。紛失信号生成部110は、音声特徴量復号部51あるいはピッチ抽出部120から送られたピッチ情報を用いて、出力音声バッファ中の音声波形をピッチ単位で抽出し、紛失したパケットに対応する音声波形とする。紛失したパケットの直前パケットのピッチ単位で波形を繰り返すのではなく、紛失したパケットに対応する音声波形のピッチ単位で波形を繰り返すことにより、パケットが紛失しても、より自然な復号音声を得ることができる。
国際公開第2005/109401号
 特許文献1の発明の場合、ピッチやパワーといった特徴量を符号化し、時間的にずらして伝送するため、復号対象のパケットが紛失しても、符号化された特徴量を復号し、この特徴量に近い値を持つ信号を受信側のバッファから求めることにより、紛失した信号に近い信号を合成することができる。しかし、何らかの特徴量を符号化して伝送する必要があること、受信側のバッファに関する情報について送り側との通信が必要となることなど、高品質な復号音声を生成するための演算を符号化器・復号器のみで行うことができないなどの課題がある。
 本発明の符号化方法は、符号化対象信号列生成ステップ、信号符号化ステップ、信号復号ステップ、ローカルデコード係数探索ステップ、符号多重化ステップを有す。符号化対象信号列生成ステップは、音響信号から、あらかじめ定められた数の信号からなる信号列を、符号化対象信号列として生成し、出力する符号化対象信号列とする。例えば、音響信号をあらかじめ定めた数ごとに分割して1つのフレームを形成し、フレームを構成する信号列を符号化対象信号列として出力する。もしくは、フレームをさらに細かく分割したサブフレームを構成する信号列を符号化対象信号列として出力してもよい。または、そのフレーム単位、あるいは近傍数フレーム単位で周波数変換した周波数領域信号列を符号化対象信号列として出力する。さらには、周波数領域信号列をいくつかのサブバンドに分割し、サブバンドを構成する周波数領域信号を符号化対象信号列として出力する。信号符号化ステップは、符号化対象信号列ごとに信号列を符号化し、符号インデクスを出力する。信号復号ステップは、符号インデクスを復号し、復号信号列を出力する。ローカルデコード係数探索ステップは、符号化対象信号列と復号信号列から、複製シフト情報を出力する。符号多重化ステップは、少なくとも符号インデクスと複製シフト情報を多重化して送信信号を生成する。
 ローカルデコード係数探索ステップは、複製判定サブステップ、複製シフト候補信号列生成サブステップ、距離計算サブステップ、距離最小シフト量検出サブステップを有す。複製判定サブステップは、符号化対象信号列ごとに、復号信号列から複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する。例えば、複製判定サブステップは、復号信号列のパワーが閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力すればよい。あるいは、複製判定サブステップは、符号化対象信号列と復号信号列の誤差のパワーが閾値より大きい場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力すればよい。もしくは、信号復号ステップで、符号化対象信号列ごとに割り当てるビット数を計算して割当ビット情報として出力しておき、複製判定サブステップが、符号化対象信号列に割り当てるビット数が閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力してもよい。
 複製シフト候補信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する。例えば、複製シフト候補信号列S τ[k](ただし、k=0,…,L-1、Lは符号化対象信号列の信号の数)を、復号信号列S^[k]から求めればよい。さらに、符号化対象信号列が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k](ただし、w=0,…,W-1、k=0,…,L’-1、Wは分割した数、L’は1つのサブバンド周波数領域信号列に含まれる信号の数)の場合は、複製シフト候補信号列生成サブステップは、複製シフト候補信号列S τ (w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する復号信号列S^(w)[k]を用いて求めればよい。 
 距離計算サブステップは、あらかじめ定めた信号列同士の距離を示すパラメータを計算する。あらかじめ定めた信号列同士の距離を示すパラメータとは、複製シフト候補信号列と符号化対象信号列との距離を示すパラメータでもよいし、複製シフト候補信号列と復元信号列とを加算した補完復号候補信号列と、符号化対象信号列との距離を示すパラメータでもよい。また、信号列同士の距離を示すパラメータは、信号列をベクトルと考え、各要素の差の2乗和(ユークリッド距離)としてもよいし、2つの信号列同士の内積としてもよい。距離最小シフト量検出サブステップは、距離計算サブステップの計算結果(距離を示すパラメータ)から、距離が最小となる信号シフト量を求める。どの信号シフト量を選択するかは、距離計算サブステップの計算方法(距離を示すパラメータ)によって決めればよく、距離を示すパラメータがユークリッド距離の場合には距離を示すパラメータが最小となる信号シフト量を選べばよく、距離を示すパラメータが内積の場合には距離を示すパラメータが最大となる信号シフト量を選べばよい。
 本発明の復号方法は、符号分離ステップ、信号復号ステップ、ローカルデコード係数複製ステップ、復元信号生成ステップを有す。符号分離ステップは、受信信号から符号インデクスと複製シフト情報とを読み出し、出力する。なお、受信信号に複製判定フラグも含まれている場合は、複製判定フラグも出力する。信号復号ステップは、符号インデクスを復号し、復号信号列を出力する。ローカルデコード係数複製ステップは、復号信号列と複製シフト情報から補完復号信号列を生成する。復元信号生成ステップは、補完復号信号列から元の音響情報を示す信号である復元信号を生成する。符号化方法の説明中で、符号化対象信号列の例を示したが、補完復号信号列は、符号化対象信号列に対応している。つまり、補完復号信号列としては、例えば、フレームを構成する信号列、サブフレームを構成する信号列、周波数領域信号列、サブバンドを構成する信号列などがある。復元信号生成ステップは、これらの補完復号信号列を元の音響信号に復元するステップであり、補完復号信号列がどのような信号列かによって適宜処理を決めればよい。
 ローカルデコード係数複製ステップは、複製判定サブステップ、複製シフト信号列生成サブステップ、補完復号信号列生成サブステップを有す。複製判定サブステップは、復号信号列、あるいは第一復号信号を用いてビット割当を行った結果から複製シフト信号列を生成するかを判定し、複製判定フラグを出力する。なお、受信信号に複製判定フラグも含まれている場合は、複製判定サブステップは不要である。
 複製シフト信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には、複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する。例えば、複製シフト候補信号列S τ[k]を、復号信号列S^[k]と複製シフト情報が示すシフト量τから求めればよい。さらに、復号信号列S^(w)[k]が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k]に対応する信号列の場合には、複製シフト信号列生成サブステップは、複製シフト信号列S・(w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する復号信号列S^(w)[k]を用いて求めればよい。
 補完復号信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には複製シフト信号列を補完復号信号列とし、複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には復号信号列を補完復号信号列とし、当該補完復号信号列を出力する。複製判定フラグが複製シフト候補信号列を生成することを示す場合に、復号信号列と複製シフト信号列の和を補完復号信号列としてもよい。
 本発明の符号化方法、復号方法によれば、復号信号を時間領域あるいは周波数領域でシフトして得られる信号を、復号信号にコピーあるいは加算することにより符号化歪を低減し、聴感的な雑音を低減する。
 まず、コピー元の信号を、復号信号を時間領域あるいは周波数領域でシフトさせて得られる信号としたことで、次の効果が得られる。コピー元の信号を送るためのビットが必要なくなるため、雑音低減のために必要なビット数を節約できる。特に、周波数帯域を等間隔な複数の周波数帯域(以下、「サブバンド」と呼ぶ。)に分割した際、各サブバンドに対応する信号同士には相関が存在するため、特に4~14kHzといった高域では近隣のサブバンドの信号をコピーあるいは加算して当該サブバンドの信号とすることにより、聴感上の雑音を低減することができる。また、時間領域の信号についても、フレームを一定の間隔(以下、「サブフレーム」と呼ぶ。)に分割した際、各サブフレームに対応する信号間には相関が存在するため、近傍のサブフレームの信号をコピーあるいは加算して当該サブフレームの信号とすることにより、聴感上の雑音を低減することができる。
 さらに、復号信号に対してコピーあるいは加算する信号を、復号信号を時間領域あるいは周波数領域でシフトさせて作成し、もとの復号信号と作成した信号からできる新たな復号信号と入力信号とが最短の距離となる際のシフト量を少ないビット数で符号化して伝送するので、符号化歪を低減させるために、復号信号に加算あるいはコピーする信号を少ないビット数で指定することができる。
 したがって、少ないビット数で、符号化歪が大きい周波数帯域あるいは時間的範囲から生じる聴覚的雑音の低減を行い復号信号の主観品質を向上できる。
従来の音声信号送信装置の機能構成例を示す図。 従来の音声信号受信装置の機能構成例を示す図。 実施例1の符号化装置の構成例と復号装置の構成例を示す図。 実施例1のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例1の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 時間領域信号列を周波数領域信号列に変換する場合のイメージを示す図。 複製シフト候補信号列を生成する方法を示す図。 実施例1変形例の符号化装置の構成例と復号装置の構成例を示す図。 実施例1変形例の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 実施例2の符号化装置の構成例と復号装置の構成例を示す図。 実施例2のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例2の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 補完復号候補信号列を生成する方法を示す図。 実施例3の符号化装置の構成例と復号装置の構成例を示す図。 実施例3のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例3の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 周波数領域信号列をサブバンド周波数領域信号列に変換する場合のイメージ、およびサブバンド補完復号信号列を補完復号信号列に変換する場合のイメージを示す図。 復号信号列とサブバンド復号信号列とサブバンド複製シフト候補信号列の関係を示す図。 サブバンド複製シフト信号列の生成方法を示す図。 実施例3変形例の符号化装置の構成例と復号装置の構成例を示す図。 実施例3変形例の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 実施例4の符号化装置の構成例と復号装置の構成例を示す図。 実施例4の信号符号化部の構成例と信号復号部の構成例を示す図。 実施例4のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例4の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 サブバンド割当ビット情報の算出方法を示す図。 ビット割当テーブルとコードブックの関係を示す図。 符号インデクスを選択する方法を示す図。 実施例4変形例の符号化装置の構成例と復号装置の構成例を示す図。 実施例4変形例の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 実施例5と実施例5変形例1の符号化装置の構成例を示す図。 実施例5と実施例5変形例1の復号装置の構成例を示す図。 実施例5の信号符号化部の構成例を示す図。 実施例5の信号復号部の構成例を示す図。 実施例5と実施例5変形例1の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 符号インデクスの生成方法とデータセットの構成を示す図。 実施例5変形例1の信号符号化部の構成例を示す図。 実施例5変形例1の信号復号部の構成例を示す図。 動的ビット再割当部9060の処理手順を示す図。 実施例5変形例2の信号符号化部の構成例を示す図。 実施例5変形例2の信号復号部の構成例を示す図。 実施例5変形例2の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 コンピュータの機能構成例を示す図。
 以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。また、以下の説明で「信号列」と言うときは、符号化や復号のために所定の数ごとに分割された信号の組を指している。信号列は所定の数の要素を持つベクトルと考えることもでき、この場合は個々の信号をベクトルの要素と考えることになる。また、単に「信号」と言うときは所定の数ごとに分割されていない信号の並びや単独の信号を指している。
 図3~図7は実施例1を説明するための図である。図3Aは符号化装置の構成例、図3Bは復号装置の構成例を示している。図4Aはローカルデコード係数探索部の構成例、図4Bはローカルデコード係数複製部の構成例を示している。図5Aは符号化装置の処理フロー例、図5Bは復号装置の処理フロー例を示している。図6は、時間領域信号列を周波数領域信号列に変換する場合のイメージを示す図である。図7は複製シフト候補信号列を生成する方法を示す図である。
符号化装置
 符号化装置100は、フレーム構成部1010、信号符号化部1030、信号復号部1031、ローカルデコード係数探索部1000、符号多重化部1040を備える。フレーム構成部1010は、マイクロフォンなどのセンサを用いて収録した音響信号を、デジタル形式にした音響信号サンプルにし、一定数Lの音響信号サンプルを纏めてフレームを構成する。そして、フレーム単位で時間周波数変換を行い、一定数Lの音響信号サンプルに対応する周波数領域信号列S[k](k=0,…,L-1)を出力する(S1010)。時間周波数変換として、離散フーリエ変換や離散コサイン変換、修正離散コサイン変換(以下、「MDCT」と呼ぶ。)などを用いる。図6はこれらの時間周波数変換のイメージを示している。本実施例では周波数領域信号列が、符号化の対象となる信号列(以下、「符号化対象信号列」と呼ぶ。)である。したがって、本実施例ではフレーム構成部1010が符号化対象信号列生成部1012に相当する。
 信号符号化部1030は、符号化対象信号列ごとに信号列を符号化し、符号インデクスを出力する(S1030)。例えば、信号符号化部1030は、周波数領域信号列S[k](k=0,…,L-1)をL次元ベクトルとみなした周波数領域信号ベクトルに対して、ベクトル量子化を行い、符号インデクスIを出力する。ベクトル量子化の際にはコードブック中から、周波数領域信号ベクトルとの距離が最小となるようなコードベクトルが選択され、選ばれたコードベクトルのインデクスが符号インデクスIとして出力される。距離を示すパラメータの定義としてユークリッド距離を用いた場合、次(1)に従いコードベクトルが選択される。
Figure JPOXMLDOC01-appb-M000001
距離を示すパラメータの定義としてベクトル間の内積を用いる場合は、式(2)に従い、コードベクトルが選択される。
Figure JPOXMLDOC01-appb-M000002
ここで、コードブックに格納されたp番目のコードベクトルをC(p)=(C (p),C (p),…,CL-1 (p))とする。C (p)はp番目のベクトルの第k次元の要素を表している。
 信号復号部1031は、符号インデクスを復号し、復号信号列を出力する(S1031)。例えば、信号復号部1031は、符号インデクスIに対応するコードベクトルC(c)=(C (c),C (c),…,CL-1 (c))をコードブック中から読み出し、復号信号列S^[k](k=0,…,L-1)を出力する。なお、復号信号列S^[k]はコードベクトルC(c)を用いて、S^[0]=C (c),S^[1]=C (c),…,S^[L-1]=CL-1 (c)のように求められる。
 ローカルデコード係数探索部1000は、符号化対象信号列に相当する周波数領域信号列S[k]と復号信号列S^[k]から、複製シフト情報τを出力する(S1000)。ローカルデコード係数探索部1000は、図4Aに示すように、複製判定部1001、複製シフト候補信号列生成部1002、距離計算部1003、距離最小シフト量検出部1004を具備する。複製判定部1001は、復号信号列S^[k](k=0,…,L-1)から複製シフト候補信号列S τ[k](τ=τ,…,τ、Mは信号シフト量τの候補の数)を生成するかを判定し、複製判定フラグFlagを出力する(S1001)。例えば、複製判定部1001は、復号信号列S^[k]のパワーPが閾値以下の場合に複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag(例えば、Flag=1)を出力し、閾値よりも大きい場合には複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag(例えば、Flag=0)を出力すればよい。なお、復号信号列S^[k](k=0,…,L-1)のパワーは、例えば式(3)に従って計算すればよい。
Figure JPOXMLDOC01-appb-M000003
 複製シフト候補信号列生成部1002は、複製判定フラグFlagが複製シフト候補信号列を生成しないことを示す場合(Flag=0の場合)には、処理を行わない。そして、複製シフト候補信号列生成部1002は、複製判定フラグFlagが複製シフト候補信号列を生成することを示す場合(Flag=1の場合)には、あらかじめ定めたすべての信号シフト量の候補τ=τ,…,τに対して、複製シフト候補信号列S τ[k]を生成する(S1002)。例えば、複製シフト候補信号列S τ[k]を、
 S τ[k]=S^[-L-τ+k]
のように求めればよい(図7参照)。
 距離計算部1003は、複製シフト候補信号列S τ[k]と周波数領域信号列S[k]との距離を示すパラメータ(以下、「距離パラメータ」という。)を計算する(S1003)。この距離パラメータは、各信号列をベクトルと考え、ベクトル間の距離パラメータd[τ](τ=τ,…,τ)を式(4)や式(5)に示す方法などで求めればよい。なお、式(4)はユークリッド距離を示しており、式(5)は内積を示しているが、これらの式に限定する必要はない。
Figure JPOXMLDOC01-appb-M000004
 距離最小シフト量検出部1004は、式(4)によって距離パラメータを求めた場合は、距離パラメータd[τ]が最小となる信号シフト量τを求め、複製シフト情報τとして出力する(S1004)。すなわち、式(6)にしたがって複製シフト情報τを求める。
Figure JPOXMLDOC01-appb-M000005
また、式(5)によって距離パラメータを求めた場合は、距離最小シフト量検出部1004は、距離パラメータd[τ]が最大となる信号シフト量τを求め、複製シフト情報τとして出力する(S1004)。すなわち、式(7)にしたがって複製シフト情報τを求める。
Figure JPOXMLDOC01-appb-M000006
 符号多重化部1040は、符号インデクスIと複製シフト情報τを多重化して送信信号を生成する(S1040)。具体的には、符号多重化部1040は、符号インデクスIと複製シフト情報τを入力として、所定の順序に並べて一つのデータセットを生成する。また、IP網などを利用して伝送を行う場合には、必要なヘッダ情報を付加してパケットを生成する。
復号装置
 復号装置200は、符号分離部2041、信号復号部2031、ローカルデコード係数複製部2100、周波数時間変換部2021、重畳加算部2011を備える。なお、周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部2012と呼ぶ。符号分離部2041は、受信信号から符号インデクスIと複製シフト情報τとを読み出し、出力する(S2041)。信号復号部2031は、符号インデクスIを復号し、復号信号列S^[k](k=0,…,L-1)を出力する(S2031)。
 ローカルデコード係数複製部2100は、復号信号列S^[k]と複製シフト情報τから補完復号信号列S[k](k=0,…,L-1)を生成する(S2100)。ローカルデコード係数複製部2100は、図4Bに示すように、複製判定部2001、複製シフト信号列生成部2002、補完復号信号列生成部2006を備える。複製判定部2001は、復号信号列S^[k]から複製シフト信号列S τ[k]を生成するかを判定し、複製判定フラグFlagを出力する(S2001)。複製判定部2001の処理は、符号化装置100の複製判定部1001と同じである。
 複製シフト信号列生成部2002は、複製判定フラグFlagが複製シフト候補信号列を生成することを示す場合(Flag=1の場合)には、複製シフト情報τが示すシフト量τに基づいて複製シフト信号列S τ[k]を生成する(S2002)。例えば、複製シフト候補信号列S τ[k]を、復号信号列S^[k]と複製シフト情報が示すシフト量τから、
 S τ[k]=S^[-L-τ+k]
のように求めればよい。
 補完復号信号列生成部2006は、複製判定フラグFlagが複製シフト候補信号列を生成することを示す場合(Flag=1の場合)には複製シフト信号列S τ[k]を補完復号信号列S[k]とし、複製判定フラグFlagが複製シフト候補信号列を生成しないことを示す場合(Flag=0の場合)には復号信号列S^[k]を補完復号信号列S[k]とし、補完復号信号列S[k]を出力する(S2006)。つまり、
Figure JPOXMLDOC01-appb-M000007
のように補完復号信号列S[k]を求める。
 復元信号生成部2012は、補完復号信号列S[k]から元の音響情報を示す信号である復元信号を生成する(S2012)。本実施例では、符号化対象信号列は周波数領域信号列S[k]である。つまり、補完復号信号列S[k]は、周波数領域の信号である。そこで、復元信号生成部2012は、周波数時間変換部2021と重畳加算部2011から構成されている。周波数時間変換部2021は、周波数領域信号列S[k]をLサンプルの時間領域の信号列に変換する(S2021)。そして、重畳加算部2011は、時間領域の信号列に窓関数を掛けて得られる信号をフレーム長の半分ずつ重ねて加算することにより復元信号を計算し、これを復元信号とする(S2011)。
 実施例1の符号化装置、復号装置によれば、復号信号を時間領域あるいは周波数領域でシフトして得られる信号を、復号信号にコピーあるいは加算することにより符号化歪を低減し、聴感的な雑音を低減する。したがって、少ないビット数で、聴覚的雑音の低減を行い復号信号の主観品質を向上できる。
[変形例]
 図8、9に、符号化対象信号列をフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図8Aは符号化装置の機能構成例、図8Bは復号装置の機能構成例、図9Aは符号化装置の処理フロー例、図9Bは復号装置の処理フロー例を示している。
 符号化装置100’と復号装置200’は、符号化対象信号列が符号化装置100と復号装置200と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部1012’と復元信号生成部2012’だけが異なる。
 符号化対象信号列生成部1012’は、フレーム構成部1010’から構成される。フレーム構成部1010’は、マイクロフォンなどのセンサを用いて収録した音響信号を、デジタル形式にした音響信号サンプルにし、一定数Lの音響信号サンプルを纏めてフレームを構成する。そして、フレーム単位の信号列(以下、「フレーム信号列」という。)s[k](k=0,…,L-1)を出力する(S1010’)。符号化装置100’のその他の構成部の処理は符号化装置100と同じである。
 復号装置200’においては、補完復号信号列s[k](k=0,…,L-1)はフレーム信号列s[k]に対応している。つまり、本変形例では、補完復号信号列s[k]は時間領域の信号列である。したがって、復元信号生成部2012’には周波数時間変換部は不要であり、重畳加算部2011のみで構成される。重畳加算部2011は、時間領域の信号列に窓関数を掛けて得られる信号をフレーム長の半分ずつ重ねて加算することにより復元信号を計算し、これを復元信号とする(S2011)。
 このような構成なので、本変形例の符号化装置、復号装置も実施例1と同様の効果が得られる。
 図10~図13は実施例2を説明するための図である。図10Aは符号化装置の構成例、図10Bは復号装置の構成例を示している。図11Aはローカルデコード係数探索部の構成例、図11Bはローカルデコード係数複製部の構成例を示している。図12Aは符号化装置の処理フロー例、図12Bは復号装置の処理フロー例を示している。図13は、補完復号候補信号列を生成する方法を示す図である。なお、実施例2の符号化対象信号列は、周波数領域信号列(実施例1と同じ)である。
符号化装置
 符号化装置150は、フレーム構成部1010、信号符号化部1030、信号復号部1031、ローカルデコード係数探索部1500、符号多重化部1540を備える。フレーム構成部1010、信号符号化部1030、信号復号部1031は、実施例1の符号化装置100と同じである。
 ローカルデコード係数探索部1500は、符号化対象信号列に相当する周波数領域信号列S[k]と復号信号列S^[k]から、複製シフト情報τと複製判定フラグFlagを出力する(S1500)。ローカルデコード係数探索部1500は、図11Aに示すように、複製判定部1501、複製シフト候補信号列生成部1002、距離計算部1503、距離最小シフト量検出部1004を具備する。複製判定部1501は、周波数領域信号列S[k](k=0,…,L-1)と復号信号列S^[k](k=0,…,L-1)との誤差信号のパワーから複製シフト候補信号列S τ[k](τ=τ,…,τ、Mは信号シフト量τの候補の数)を生成するかを判定し、複製判定フラグFlagを出力する(S1501)。例えば、複製判定部1501は、周波数領域信号列S[k]と復号信号列S^[k]の誤差信号(S[k]-S^[k])のパワーPが閾値を上回る場合に複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag(例えば、Flag=1)を出力し、閾値以下の場合には複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag(例えば、Flag=0)を出力すればよい。なお、誤差信号(S[k]-S^[k])のパワーは、例えば式(9)に従って計算すればよい。
Figure JPOXMLDOC01-appb-M000008
 複製シフト候補信号列生成部1002は、実施例1と同じである。距離計算部1503は、複製シフト候補信号列S τ[k]と復号信号列S^[k]とを加算した補完復号候補信号列S~τ[k]と、周波数領域信号列S[k]との距離パラメータを計算する(S1503)。この距離パラメータは、各信号列をベクトルと考え、ベクトル間の距離パラメータd[τ](τ=τ,…,τ)を式(10)や式(11)に示す方法などで求めればよい。なお、式(10)はユークリッド距離を示しており、式(11)は内積を示しているが、これらの式に限定する必要はない。
Figure JPOXMLDOC01-appb-M000009
距離最小シフト量検出部1004は、実施例1と同じである。
 符号多重化部1540は、符号インデクスIと複製シフト情報τと複製判定フラグFlagを多重化して送信信号を生成する(S1040)。具体的には、符号多重化部1540は、符号インデクスIと複製シフト情報τと複製判定フラグFlagを入力として、所定の順序に並べて一つのデータセットを生成する。また、IP網などを利用して伝送を行う場合には、必要なヘッダ情報を付加してパケットを生成する。
復号装置
 復号装置250は、符号分離部2541、信号復号部2031、ローカルデコード係数複製部2500、周波数時間変換部2021、重畳加算部2011を備える。なお、周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部2012と呼ぶ。符号分離部2541は、受信信号から符号インデクスIと複製シフト情報τと複製判定フラグFlagを読み出し、出力する(S2541)。信号復号部2031は、実施例1と同じである。
 ローカルデコード係数複製部2500は、復号信号列S^[k]と複製シフト情報τと複製判定フラグFlagから補完復号信号列S[k](k=0,…,L-1)を生成する(S2500)。ローカルデコード係数複製部2500は、図11Bに示すように、複製シフト信号列生成部2002、補完復号信号列生成部2506を備える。本実施例の場合、受信信号内に複製判定フラグFlagが含まれているので、複製判定部は必要ない。複製シフト信号列生成部2002は、実施例1と同じである。
 補完復号信号列生成部2506は、図13に示すように、複製シフト信号列S τ[k]と復号信号列S^[k]とを加算することにより、補完復号信号列S[k]を生成し、出力する(S2006)。つまり、
Figure JPOXMLDOC01-appb-M000010
のように補完復号信号列S[k]を求める。
 復元信号生成部2012は、実施例1と同じである。
 以上のような構成により、復号信号列と符号化対象信号列の誤差が大きい場合に符号化歪の低減を行うことができる。
 図14~図19は実施例3を説明するための図である。図14Aは符号化装置の構成例、図14Bは復号装置の構成例、図15Aはローカルデコード係数探索部の構成例、図15Bはローカルデコード係数複製部の構成例、図16Aは符号化装置の処理フロー例、図16Bは復号装置の処理フロー例を示している。図17Aは、周波数領域信号列をサブバンド周波数領域信号列に変換する場合のイメージ、図17Bはサブバンド補完復号信号列を補完復号信号列に変換する場合のイメージを示す図である。図18は復号信号列とサブバンド復号信号列とサブバンド複製シフト候補信号列の関係を示す図である。図19はサブバンド複製シフト信号列の生成方法を示す図である。本実施例では、周波数領域信号列をいくつかの周波数帯ごとに分割したサブバンドの信号列を、符号化対象信号列としている点が実施例2と異なる。
符号化装置
 符号化装置300は、フレーム構成部1010、サブバンド分割部3050、信号符号化部3030、信号復号部3031、ローカルデコード係数探索部3000、符号多重化部1540を備える。フレーム構成部1010、符号多重化部1540は、実施例2の符号化装置150と同じである。サブバンド分割部3050は、図17Aに示すように、周波数領域信号列S[k](k=0,…,L-1)を複数のサブバンド周波数領域信号列S(w)[k](w=0,…,W-1、k=0,…,L’-1)に分割する(S3050)。Wは分割する数、L’はサブバンド周波数領域信号列に含まれる信号の数を示している。図17Aは、W=4,L=4L’の例を示している。また、以下では、S(w)[k]を何番目のサブバンド周波数領域信号列であるかを示したいときには「第wサブバンド周波数領域信号列」と呼び、何番目なのかを特定する必要がないときには単に「サブバンド周波数領域信号列」と呼ぶ。本実施例では、サブバンド周波数領域信号列が符号化対象信号列である。
 信号符号化部3030は、符号化対象信号列を周波数領域信号列からサブバンド周波数領域信号列に変更しただけで、処理自体は実施例1の信号符号化部1030と同じである。そして、信号符号化部3030は、サブバンド周波数領域信号列S(w)[k]に対する符号インデクスI (w)を出力する(S3030)。
 信号復号部3031も、符号インデクスI (w)に対する符号化対象信号列が周波数領域信号列からサブバンド周波数領域信号列に変更しただけで、処理自体は実施例1の信号復号部1031と同じである。そして、信号復号部3031は、復号信号列S^(w)[k](w=0,…,W-1、k=0,…,L’-1)を出力する(S3031)。
 ローカルデコード係数探索部3000は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]から、複製シフト情報τ (w)と複製判定フラグFlag (w)を出力する(S3000)。ローカルデコード係数探索部3000は、図15Aに示すように、複製判定部3001、複製シフト候補信号列生成部3002、距離計算部3003、距離最小シフト量検出部3004を具備する。
 複製判定部3001は、符号化対象信号列に含まれる信号の数が変わっただけで、実施例2と同じである。つまり、複製判定部3001は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]との誤差信号のパワーから複製シフト候補信号列S τ (w)[k](τ=τ,…,τ、Mは信号シフト量τの候補の数)を生成するかを判定し、複製判定フラグFlag (w)を出力する(S3001)。例えば、複製判定部3001は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]の誤差信号(S(w)[k]-S^(w)[k])のパワーPが閾値を上回る場合に複製シフト候補信号列S τ (w)[k]を生成することを示す複製判定フラグFlag (w)(例えば、Flag (w)=1)を出力し、閾値以下の場合には複製シフト候補信号列S τ (w)[k]を生成しないことを示す複製判定フラグFlag (w)(例えば、Flag (w)=0)を出力すればよい。なお、誤差信号(S(w)[k]-S^(w)[k])のパワーは、例えば式(9)に従って計算すればよい。
Figure JPOXMLDOC01-appb-M000011
 複製シフト候補信号列生成部3002は、複製判定フラグFlag (w)が複製シフト候補信号列を生成しないことを示す場合(Flag (w)=0の場合)には、処理を行わない。そして、複製シフト候補信号列生成部3002は、複製判定フラグFlag (w)が複製シフト候補信号列を生成することを示す場合(Flag (w)=1の場合)には、あらかじめ定めたすべての信号シフト量の候補τ=τ,…,τに対して、複製シフト候補信号列S τ (w)[k]を生成する(S3002)。例えば、
Figure JPOXMLDOC01-appb-M000012
のように近傍サブバンドの復号信号列からサブバンド複製シフト候補信号列S τ (w)[k]を生成する。式(14)のように複製シフト候補信号列S τ (w)[k]を生成すれば、複製シフト候補信号列S τ (w)[k]は、もともと同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する復号信号列から生成される。通常、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列は互いに相関関係が強いため、距離の近いサブバンド複製シフト候補信号列S τ (w)[k]を得ることができる。図18は、S τ (2)[k]を生成する例を示している。
 距離計算部3003、距離最小シフト量検出部3004は、信号列内の信号の数が変わっただけで、実施例1や実施例2と同じである。また、符号多重化部1540は、実施例2と同じである。
復号装置
 復号装置400は、符号分離部4041、信号復号部4031、ローカルデコード係数複製部4100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011を備える。なお、サブバンド結合部4051と周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部4012と呼ぶ。符号分離部4041は、受信信号から符号インデクスI (w)と複製シフト情報τ (w)と複製判定フラグFlag (w)を読み出し、出力する(S4041)。信号復号部4031は、符号インデクスI (w)を復号し、サブバンド復号信号列S^(w)[k](k=0,…,L’-1)を出力する(S4031)。
 ローカルデコード係数複製部4100は、サブバンド復号信号列S^(w)[k]と複製シフト情報τ (w)と複製判定フラグFlag (w)からサブバンド補完復号信号列S~(w)[k](k=0,…,L-1)を生成する(S4100)。ローカルデコード係数複製部4100は、図15Bに示すように、複製シフト信号列生成部4002、補完復号信号列生成部4005を備える。
 複製シフト信号列生成部4002は、複製シフト候補信号列生成部3002の方法と同じ方法で、サブバンド複製シフト信号列S・(w)[k](w=0,…,W-1、k=0,…,L’-1)を出力する(S4002)。例えば、複製シフト候補信号列生成部3002が式(14)にしたがって複製シフト候補信号列S τ (w)[k]を生成したのであれば、複製シフト信号列生成部4002は、式(15)にしたがってサブバンド複製シフト信号列S・(w)[k]を生成すればよい。
Figure JPOXMLDOC01-appb-M000013
なお、図19は、式(15)の処理を表している。
 補完復号信号列生成部4005は、サブバンド複製シフト信号列S・(w)[k]と復号信号列S^(w)[k]とを加算することにより、サブバンド補完復号信号列S~(w)[k]を生成し、出力する(S4005)。
 サブバンド結合部4051は、図17Bに示すように、複数のサブバンド補完復号信号列を結合し、補完復号信号列を生成する(S4051)。周波数時間変換部2021と重畳加算部2011は、実施例1や実施例2と同じである。
 以上の構成により、実施例3の符号化装置、復号装置も実施例1や実施例2と同様の効果が得られる。また、符号化によるひずみの大きい周波数帯域の誤差を低減できるため、さらに聴感上の雑音を低減できる。
[変形例]
 図20、21に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図20Aは符号化装置の機能構成例、図21Bは復号装置の機能構成例、図21Aは符号化装置の処理フロー例、図21Bは復号装置の処理フロー例を示している。
 符号化装置300’と復号装置400’は、符号化対象信号列が符号化装置300と復号装置400と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部3012’と復元信号生成部4012’だけが異なる。
 符号化対象信号列生成部3012’は、フレーム構成部1010’とサブフレーム分割部3050’から構成される。フレーム構成部1010’は、マイクロフォンなどのセンサを用いて収録した音響信号を、デジタル形式にした音響信号サンプルにし、一定数Lの音響信号サンプルを纏めてフレームを構成する。そして、フレーム単位の信号列(以下、「フレーム信号列」という。)s[k](k=0,…,L-1)を出力する(S1010’)。サブフレーム分割部3050’は、フレーム信号列をいくつかに分割し、サブフレーム信号列s(w)[k](w=0,…,W-1、k=0,…,L’-1)を生成する(S3050’)。符号化装置300’のその他の構成部の処理は符号化装置300と同じである。
 復号装置400’においては、サブフレーム補完復号信号列s~(w)[k](w=0,…,W-1、k=0,…,L’-1)はサブフレーム信号列s(w)[k]に対応している。つまり、本変形例では、サブフレーム補完復号信号列s~(w)[k]は時間領域の信号列である。したがって、復元信号生成部4012’には周波数時間変換部は不要であり、サブフレーム結合部4051’と重畳加算部2011で構成される。サブフレーム結合部4051’は、サブフレーム補完復号信号列s~(w)[k]を結合し、補完復号信号列s[k]を生成する(S4051’)。重畳加算部2011は、補完復号信号列s[k]に窓関数を掛けて得られる信号をフレーム長の半分ずつ重ねて加算することにより復元信号を計算し、これを復元信号とする(S2011)。
 このような構成なので、本変形例の符号化装置、復号装置も実施例3と同様の効果が得られる。
 図22~図28は実施例4を説明するための図である。図22Aは符号化装置の構成例、図22Bは復号装置の構成例を示している。図23Aは信号符号化部の構成例、図23Bは信号復号部の構成例を示している。図24Aはローカルデコード係数探索部の構成例、図24Bはローカルデコード係数複製部の構成例を示している。図25Aは符号化装置の処理フロー例、図25Bは復号装置の処理フロー例を示している。図26は、サブバンド割当ビット情報の算出方法を示す図、図27は、ビット割当テーブルとコードブックの関係を示す図、図28は符号インデクスを選択する方法を示す図である。なお、本実施例の符号化対象信号列は、サブバンド周波数領域信号列(実施例3と同じ)である。
符号化装置
 符号化装置500は、フレーム構成部1010、サブバンド分割部3050、信号符号化部5030、信号復号部5031、ローカルデコード係数探索部5000、符号多重化部5040を備える。フレーム構成部1010とサブバンド分割部3050は、実施例3の符号化装置300と同じである。
 信号符号化部5030は、図23Aに示すように、パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036、ローカル符号多重化部5037を備える。パラメータ計算部5032は、サブバンド周波数領域信号列S(w)[k](w=0,…,W-1、k=0,…,L’-1)から、第wサブバンド第一パラメータを算出する。第wサブバンド第一パラメータとして、例えば、第wサブバンド周波数領域信号列S(w)[k]の平均振幅指標A[w](w=0,…,W-1)(以下、「第wサブバンド平均振幅指標」と呼ぶ。)などを利用することができる。第wサブバンド平均振幅指標は次式にしたがって算出する。
Figure JPOXMLDOC01-appb-M000014
なお、第wサブバンド平均振幅指標を用いて、次式により第wサブバンド平均振幅A’[w]を算出することができる。
Figure JPOXMLDOC01-appb-M000015
次に、第一符号化部5033が、第wサブバンド第一パラメータ(w=0,…,W-1)を量子化し、第一信号符号インデクスIを出力する。第wサブバンド第一パラメータとして第wサブバンド平均振幅指標A[w](w=0,…,W-1)を利用する場合には、例えば、第wサブバンド平均振幅指標A[w]をW次元ベクトルとみなしてベクトル量子化を行い、選ばれたコードベクトルのインデクスを第一信号符号インデクスIとして出力する。なお、第wサブバンド第一パラメータを、バイナリ符号化やハフマン符号化によりサブバンド毎に符号化してもよい。
第一ローカル復号部5034は、第一信号符号インデクスIを復号し、第wサブバンド第一復号パラメータ(w=0,…,W-1)を出力する。例えば、第一符号化部5033で第wサブバンド平均振幅指標A[w]を符号化した場合、第一ローカル復号部5034は、第wサブバンド第一復号パラメータとして第wサブバンド復号平均振幅指標A^[w](w=0,…,W-1)を出力する。
 動的ビット割当部5035は、第wサブバンド第一復号パラメータから各サブバンドに割り当てるビット数を計算し、第wサブバンド割当ビット情報を出力する。例えば、第wサブバンド第一復号パラメータとして第wサブバンド復号平均振幅指標A[w]を利用した場合、以下のような手順で第wサブバンドの割当ビット情報B[w](w=0,…,W-1)を算出する。まず、第wサブバンド平均振幅指標A[w]から次式で決まる第wサブバンド聴覚的重要度ip[w](w=0,…,W-1)を算出する。
 ip[w]=A^[w]/2
 次に第wサブバンド聴覚的重要度ip[w]とビット割当テーブルRを利用した二分探索法により、第wサブバンドの割当ビット情報B[w]を出力する。動的ビット割当では、“water Level”を以下の式に基づく二分探索により選択し、“water Level λ”と第wサブバンド聴覚的重要度ip[w]を利用して次式の第wサブバンド割当ビット情報B[w]を算出する。
Figure JPOXMLDOC01-appb-M000016
具体的には、例えば図26に示す方法で算出すればよい。まず、パラメータ(maxIP,minIP,λ,i)を初期値に設定する(S50351)。一時的なB[w]の値として、Bt[w]を計算し、既に計算済のBt[w]との合計Sum_Btを求める(S50352)。Sum_Btが割当可能な総ビット数(total_bit_budget)を越えるかを確認する(S50353)。ステップS50353がYesの場合、パラメータ(minIP,λ,i)を変更する(S50354)。ステップS50353がNoの場合、Bt[w]をB[w]とし、パラメータ(maxIP,λ,i)を変更する(S50355)。iが事前に定めた定数未満かを確認する(S50356)。ステップS50356がYesの場合、ステップS50352に戻る。ステップS50356がNoの場合、B[w]を、第wサブバンドの割当ビット情報B[w]として出力する。また、事前に決定した回数の反復探索が終了した時点で上記のB[w]の式の評価を行う。反復処理を終了する収束条件を別途定義して処理を終了してもよい。例えば、割当ビット数の合計が割当可能な総ビット数(total_bit_budget)に等しくなるような場合に処理を終了するなどの方法が考えられる。最終的なビット数の合計が割当可能な総ビット数を越える場合には、例えばip[w]が小さいサブバンドから順に、上式で選択したビット数よりテーブル一つ分小さいビットを割り当てることにより削減し、割当ビット数の合計が総ビット数の合計よりも小さくなるように調整し、最終的な第wサブバンド割当ビット情報を決定する。
 第二符号化部5036は、割当ビット情報B[w]を用いて、第wサブバンド周波数領域信号列S(w)[k]を量子化し、第wサブバンド第二信号符号インデクスI (w)(w=0,…,W-1)を出力する。ここで、図27Aと図27Bに示したように、ビット割当テーブル中のビット数とコードブックの探索範囲は1対1に対応付けられているものとする。なお、この探索範囲同士は重なりを持っていてもよい。図27Aは探索範囲同士が重なりを持っていない場合の例を示しており、図27Bは探索範囲同士が重なりを持っている場合の例を示している。第二符号化部5036は、図28に示した手順により、第wサブバンド周波数領域信号列S(w)[k]を量子化し、第wサブバンド第二信号符号インデクスI (w)を出力する。まず、割当ビット情報B[w]を用いて、第二符号化部5036におけるコードブック探索の範囲を決定する。ここで、B[w]が閾値以下のときには、符号化を行わない。次に、第wサブバンド周波数領域信号列S(w)[k]をベクトルとみなした第wサブバンド周波数領域信号ベクトルとの距離が最小となるようなコードベクトルを、割当ビット情報B[w]から決定したコードブック探索範囲から選択し、選ばれたコードベクトルのインデクスが第wサブバンド第二信号符号インデクスI (w)として出力される。距離を示すパラメータとしてユークリッド距離を用いた場合、式(17)にしたがってコードベクトルが選択される。
Figure JPOXMLDOC01-appb-M000017
また、距離を示すパラメータとしてベクトル間の内積を用いる場合は、式(18)にしたがってコードベクトルが選択される。
Figure JPOXMLDOC01-appb-M000018
ここで、コードブックに格納されたp番目のコードベクトルをC(p)=(C (p),C (p),…,CL’-1 (p))とする。C (p)はp番目のベクトルの第k次元の要素を表している。
 ローカル符号多重化部5037は、第wサブバンド第一信号符号インデクスI (w)と第wサブバンド第二信号符号インデクスI (w)とを所定の順番に並べてデータセットとし、符号インデクスIとして出力する。
 信号復号部5031は、符号インデクスIを復号し、復号信号列S^(w)[k](k=0,…,L’-1)と割当ビット情報B[w]を出力する(S5031)。信号復号部5031は、ローカル符号分離部5038、第一ローカル復号部5034、動的ビット割当部5035、第二復号部5039、復号パラメータ処理部5044を備える。ローカル符号分離部5038は、符号インデクスIから、所定の位置にあるビット数を読み出すことにより、第wサブバンド第一信号符号インデクスI (w)と第wサブバンド第二信号符号インデクスI (w)を出力する。
 第一ローカル復号部5034は、第wサブバンド第一信号符号インデクスI (w)を復号し、第wサブバンド第一復号パラメータを出力する。第一ローカル復号部5034の動作は、信号符号化部5030における第一ローカル復号部5034と同じである。動的ビット割当部5035は、第wサブバンド第一復号パラメータから、各サブバンドに割当てるビット数を計算し、第wサブバンドの割当ビット情報として出力する。動的ビット割当部5035の動作は、信号符号化部5030における動的ビット割当部5035と同一である。
 第二復号部5039は、第wサブバンドの割当ビット情報B[w]を用いて、第wサブバンド第二信号符号インデクスI (w)を復号し、第wサブバンド第二復号パラメータを出力する。なお、信号符号化部5030における第二符号化部5036と同じように、ビット割当テーブル中のビット数とコードブックの探索範囲は1対1に対応付けられているものとする。復号の手順は次のとおりである。まず、第wサブバンドの割当ビット情報B[w]を用いて、コードブック探索の範囲を決定する。次に、第wサブバンド第二信号符号インデクスI (w)に対応するコードベクトルを、割当ビット情報B[w]から決まるコードブック探索範囲から選択し、選ばれたコードベクトルに対応するコードベクトルC(p)=(C (p),C (p),…,CL’-1 (p))を第wサブバンド第二復号パラメータとして出力する。
 復号パラメータ処理部5044は、第wサブバンド第一復号パラメータと第wサブバンド第二復号パラメータを用いて、復号信号列S^(w)[k]を出力する。例えば、第wサブバンド第一復号パラメータとして第wサブバンドの平均振幅指標A[w]を、第wサブバンド第二復号パラメータとして平均振幅が1になるよう正規化したコードベクトルを用いている場合には、第wサブバンド平均振幅指標から算出される第wサブバンド平均振幅を第wサブバンド第二復号パラメータの各係数に乗算するなどの処理を行い、復号信号列S^(w)[k]を算出する。
 ローカルデコード係数探索部5000は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]から、複製シフト情報τ (w)を出力する(S5000)。ローカルデコード係数探索部5000は、図24Aに示すように、複製判定部5001、複製シフト候補信号列生成部3002、距離計算部3003、距離最小シフト量検出部3004を具備する。複製判定部5001は、第wサブバンドの割当ビット情報B[w]が閾値以下の場合は、複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag (w)(例えば、Flag (w)=1)を出力する。一方、第wサブバンドの割当ビット情報B[w]が閾値より大きい場合は、複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag (w)(例えば、Flag (w)=0)を出力する。
 複製シフト候補信号列生成部3002、距離計算部3003、距離最小シフト量検出部3004は、実施例3の符号化装置300と同じである。
 符号多重化部5040は、符号インデクスIと複製シフト情報τ (w)を多重化して送信信号を生成する(S5040)。具体的には、符号多重化部5040は、符号インデクスIと複製シフト情報τ (w)を入力として、所定の順序に並べて一つのデータセットを生成する。また、IP網などを利用して伝送を行う場合には、必要なヘッダ情報を付加してパケットを生成する。
復号装置
 復号装置600は、符号分離部6041、信号復号部6031、ローカルデコード係数複製部6100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011を備える。なお、サブバンド結合部4051と周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部4012と呼ぶ。符号分離部6041は、受信信号から符号インデクスIと複製シフト情報τ (w)を読み出し、出力する(S6041)。信号復号部6031は、符号インデクスIを復号し、復号信号列S^(w)[k](k=0,…,L’-1)と割当ビット情報B[w]を出力する(S6031)。信号復号部6031の処理手順は、信号復号部5031と同じである。
 ローカルデコード係数複製部6100は、復号信号列S^(w)[k]と複製シフト情報τ (w)からサブバンド補完復号信号列S~(w)[k](k=0,…,L-1)を生成する(S6100)。ローカルデコード係数複製部6100は、図24Bに示すように、複製判定部6001、複製シフト信号列生成部4002、補完復号信号列生成部4005を備える。複製判定部6001は、第wサブバンドの割当ビット情報B[w]が閾値以下の場合は、複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag (w)(例えば、Flag (w)=1)を出力する。一方、第wサブバンドの割当ビット情報B[w]が閾値より大きい場合は、複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag (w)(例えば、Flag (w)=0)を出力する(S6001)。
 複製シフト信号列生成部4002、補完復号信号列生成部4005は、実施例3の復号装置400と同じである。また、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011も、実施例3の復号装置400と同じである。
 以上の構成により、本本実施例の符号化装置、復号装置も実施例3と同様の効果が得られる。
[変形例]
 図29、30に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図29Aは符号化装置の機能構成例、図29Bは復号装置の機能構成例、図30Aは符号化装置の処理フロー例、図30Bは復号装置の処理フロー例を示している。
 符号化装置500’と復号装置600’は、符号化対象信号列が符号化装置500と復号装置600と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部3012’と復元信号生成部4012’だけが異なる。符号化対象信号列生成部3012’は実施例3変形例の符号化装置300’と同じであり、復元信号生成部4012’は実施例3変形例の復号装置400’と同じである。
 このような構成なので、本変形例の符号化装置、復号装置も実施例4と同様の効果が得られる。
 図31~図36を用いて、実施例5について説明する。図31は符号化装置の構成例、図32は復号装置の構成例を示している。図33は信号符号化部の構成例、図34Aは符号化装置内の信号復号部の構成例、図34Bは復号装置内の信号復号部の構成例を示している。図35Aは符号化装置の処理フロー例、図35Bは復号装置の処理フロー例を示している。図36は、符号インデクスの生成方法とデータセットの構成を示す図である。なお、本実施例の符号化対象信号列は、サブバンド周波数領域信号列(実施例3、4と同じ)である。
符号化装置
 符号化装置700は、フレーム構成部1010、サブバンド分割部3050、信号符号化部7030、信号復号部7031、ローカルデコード係数探索部5000、符号多重化部7040を備える。フレーム構成部1010とサブバンド分割部3050は、実施例3の符号化装置300や実施例4の符号化装置500と同じである。
 信号符号化部7030は、図33に示すように、パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036を備え、ローカル符号多重化部5037がない点が実施例4の信号符号化部5030と異なる。パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036は信号符号化部5030と同じである。信号符号化部7030は、サブバンド周波数領域信号列S(w)[k](w=0,…,W-1、k=0,…,L’-1)を入力とし、第一信号符号インデクスIと第二信号符号インデクスI (w)を出力する(S7030)。
 信号復号部7031は、第一信号符号インデクスIと第二信号符号インデクスI (w)を復号し、復号信号列S^(w)[k](k=0,…,L’-1)と割当ビット情報B[w]を出力する(S7031)。信号復号部7031は、図34(A)に示すように、第一ローカル復号部5034、動的ビット割当部5035、第二復号部5039、復号パラメータ処理部5044を備える。第一ローカル復号部5034、動的ビット割当部5035、第二復号部5039、復号パラメータ処理部5044は、実施例4の符号化装置500と同じである。
 ローカルデコード係数探索部5000は、実施例4の符号化装置500と同じである。符号多重化部7040は、第一信号符号インデクスIと第二信号符号インデクスI (w)と割当ビット情報B[w]と複製シフト情報τ (w)を多重化して送信信号を生成する(S7040)。例えば、図36に示すように、符号多重化部7040は、第一信号符号インデクスIを一定ビット数のビット列からなるデータセットとして出力する(S7041)。次に、割当ビット情報B[w]を閾値と比較し(S7042)、閾値より大きい場合は第wサブバンドの第二信号符号インデクスI (w)をB[w]ビットのビット列としてデータセットの最後に追加する(S7043)。一方、割当ビット情報B[w]が閾値以下の場合には、第wサブバンドの複製シフト情報τ (w)をB[w]ビットのビット列としてデータセットの最後に追加する(S7044)。ステップS7042~S7044の処理を、w=0,…,W-1に対しておこない(S7045,S7046)、送信信号を出力する。
復号装置
 復号装置800は、符号分離部8041、信号復号部8032、ローカルデコード係数複製部6100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011を備える。なお、サブバンド結合部4051と周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部4012と呼ぶ。符号分離部8041は、受信信号から第一信号符号インデクスIと第二信号符号インデクスI (w)を読み出し、出力する(S8041)。
 信号復号部8032は、第一信号符号インデクスIと第二信号符号インデクスI (w)を復号し、サブバンドの復号信号列S^(w)[k](k=0,…,L’-1)と割当ビット情報B[w]と複製シフト情報τ (w)を出力する(S8032)。信号復号部8032は、第一ローカル復号部8043、動的ビット割当部5035、第二復号部8042、復号パラメータ処理部5044を備える。まず、第一ローカル復号部8043は、第一信号符号インデクスIを復号し、第wサブバンド第一復号パラメータを出力する。動的ビット割当部5035はサブバンド第一パラメータから割当ビット情報を出力する。動的ビット割当部5035は、実施例4の復号装置600と同じである。第二復号部8042は、第wサブバンドの割当ビット情報B[w]を用いて、第wサブバンド第二信号符号インデクスI (w)を復号し、第wサブバンド第二復号パラメータと複製シフト情報τ (w)を出力する。例えば、第二復号部8042は、全てのw(w=0,…,W-1)について、第wサブバンドの割当ビット情報B[w]が閾値以下の場合は、第二信号符号インデクスI (w)から、B[w]ビットのビット列を読み出して復号することにより、サブバンド複製シフト情報τ (w)を出力する。第wサブバンドの割当ビット情報B[w]が閾値より大きい場合は、第二信号符号インデクスI (w)から、B[w]ビットのビット列を読み出して復号することにより、サブバンド第二復号パラメータを出力する。復号パラメータ処理部5044は、実施例4の復号装置600と同じである。
 ローカルデコード係数複製部6100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011は、実施例4の復号装置600と同じである。
 以上の構成により、本実施例の符号化装置、復号装置も実施例4と同様の効果が得られる。
[変形例1]
 本変形例では、動的ビット割当部5035に動的ビット再割当部9060を組合せる。符号化装置の構成例を図31、復号装置の構成例を図32、符号化装置の処理フローを図35A、復号装置の処理フローを図35Bに示す。図37は信号符号化部の構成例、図38Aは符号化装置内の信号復号部の構成例、図38Bは復号装置内の信号復号部の構成例を示している。図39は動的ビット再割当部9060の処理手順を示す図である。
 信号符号化部9030は、図37に示すように、パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、動的ビット再割当部9060、第二符号化部5036を備える。パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036は、実施例5の信号符号化部7030と同じである。
 動的ビット再割当部9060は、図39に示すように、以下の手順で割当ビット情報を生成する。動的ビット割当部5035の出力(本変形例内では、「第一割当ビット情報B[w]」と呼ぶ。)と閾値を比較し、閾値以下の場合、サブバンドの割当ビット情報をB[w]=bminとする。閾値以下のサブバンドに対してビットを与えた残りのビット数をbtotalとする。残りのサブバンドに対して、動的ビット割当部5035と同様の動作によって残ったビットbtotalを割当て、第wサブバンドの割当ビット情報の値を全てのwについて決定し、出力する。
 このような構成なので、本本実施例の符号化装置、復号装置も実施例5と同様の効果が得られる。また、サブバンドに割り当てられるビット数をさらに適切なものにできるので、さらに主観品質を向上できる。
[変形例2]
 図40~図42に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図40は符号化装置の機能構成例、図41は復号装置の機能構成例、図42Aは符号化装置の処理フロー例、図42Bは復号装置の処理フロー例を示している。
 符号化装置700’と復号装置800’は、符号化対象信号列が符号化装置700と復号装置800と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部3012’と復元信号生成部4012’だけが異なる。符号化対象信号列生成部3012’は実施例3変形例の符号化装置300’と同じであり、復元信号生成部4012’は実施例3変形例の復号装置400’と同じである。
 このような構成なので、本変形例の符号化装置、復号装置も実施例5と同様の効果が得られる。
 図43に、コンピュータの機能構成例を示す。なお、本発明の符号化方法や復号方法は、コンピュータ2000の記録部2020に、本発明の各ステップをコンピュータ2000に実行させるプログラムを読み込ませ、処理部2010、入力部2030、出力部2040などを動作させることで実現できる。また、コンピュータに読み込ませる方法としては、プログラムをコンピュータ読み取り可能な記録媒体に記録しておき、記録媒体からコンピュータに読み込ませる方法、サーバ等に記録されたプログラムを、電気通信回線等を通じてコンピュータに読み込ませる方法などがある。
100、150、300、500、700、900 符号化装置
200、250、400、600、800、950 復号装置
1000、1500、3000、5000 ローカルデコード係数探索部
1001、1501、2001、3001、5001、6001 複製判定部
1002、3002 複製シフト候補信号列生成部
1003、1503、3003 距離計算部
1004、3004 距離最小シフト量検出部
1010 フレーム構成部
1012、3012 符号化対象信号列生成部
1030、3030、5030、7030、9030 信号符号化部
1031、2031、3031、4031、5031、6031、7031、8032 信号復号部
1040、1540、5040、7040 符号多重化部
2002、4002 複製シフト信号列生成部
2006、2506、4005 補完復号信号列生成部
2011 重畳加算部
2012、4012 復元信号生成部
2021 周波数時間変換部
2041、2541、4041、6041、8041 符号分離部
2100、2500、4100、6100 ローカルデコード係数複製部
3050 サブバンド分割部        4051 サブバンド結合部
5032 パラメータ計算部        5033 第一符号化部
5034、8043 第一ローカル復号部  5035 動的ビット割当部
5036 第二符号化部          5037 ローカル符号多重化部
5038 ローカル符号分離部       5039、8042 第二復号部
5044 復号パラメータ処理部      9060 動的ビット再割当部

Claims (15)

  1.  音響信号から、あらかじめ定められた数の信号からなる信号列を、符号化対象信号列として生成し、出力する符号化対象信号列とする符号化対象信号列生成ステップと、
     前記符号化対象信号列ごとに該符号化対象信号列に対応する符号インデクスを出力する信号符号化ステップと、
     前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
     前記符号化対象信号列と前記復号信号列から、複製シフト情報を出力するローカルデコード係数探索ステップと、
     少なくとも前記符号インデクスと前記複製シフト情報を多重化して送信信号を生成する符号多重化ステップと
     を有し、
     前記ローカルデコード係数探索ステップは、
     前記符号化対象信号列ごとに、前記復号信号列を用いて複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する複製判定サブステップと、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する複製シフト候補信号列生成サブステップと、
     各複製シフト候補信号列もしくは各複製シフト候補信号列を用いて生成した信号列と前記符号化対象信号列との距離を示すパラメータを計算する距離計算サブステップと、
     前記距離計算サブステップの計算結果から距離が最小となる信号シフト量を求める距離最小シフト量検出サブステップと
     を有する
     ことを特徴とする符号化方法。
  2.  請求項1記載の符号化方法であって、
     前記複製判定サブステップは、前記復号信号列のパワーが閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
     前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
     前記距離計算サブステップで計算する距離を示すパラメータとは、前記複製シフト候補信号列と前記符号化対象信号列との距離を示すパラメータである
     ことを特徴とする符号化方法。
  3.  請求項1記載の符号化方法であって、
     前記複製判定サブステップは、前記符号化対象信号列と前記復号信号列の誤差のパワーが閾値より大きい場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
     前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
     前記距離計算サブステップで計算する距離を示すパラメータは、前記複製シフト候補信号列と前記復元信号列とを加算した補完復号候補信号列と、前記符号化対象信号列との距離を示すパラメータである
     ことを特徴とする符号化方法。
  4.  請求項1記載の符号化方法であって、
     前記信号復号ステップは、さらに、符号化対象信号列ごとに割り当てるビット数を計算して割当ビット情報として出力し、
     前記複製判定サブステップは、前記符号化対象信号列に割り当てるビット数が閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
     前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
     前記距離計算サブステップで計算する距離を示すパラメータとは、前記複製シフト候補信号列と前記符号化対象信号列との距離を示すパラメータである
     ことを特徴とする符号化方法。
  5.  請求項1記載の符号化方法であって、
     前記信号復号ステップは、さらに、符号化対象信号列ごとに割り当てるビット数を計算して割当ビット情報として出力し、
     前記複製判定サブステップは、前記符号化対象信号列に割り当てるビット数が閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
     前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
     前記距離計算サブステップで計算する距離を示すパラメータは、前記複製シフト候補信号列と前記復元信号列とを加算した補完復号候補信号列と、前記符号化対象信号列との距離を示すパラメータである
     ことを特徴とする符号化方法。
  6.  請求項2から5のいずれかに記載の符号化方法であって、
     前記符号化対象信号列が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k](ただし、w=0,…,W-1、k=0,…,L’-1、Wは分割した数、L’は1つのサブバンド周波数領域信号列に含まれる信号の数)であり、
     前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列S τ (w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する前記復号信号列S^(w)[k]を用いて求める
     ことを特徴とする符号化方法。
  7.  受信信号から符号インデクスと複製シフト情報とを読み出し、出力する符号分離ステップと、
     前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
     前記復号信号列と前記複製シフト情報から補完復号信号列を生成するローカルデコード係数複製ステップと、
     前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
     を有し、
     前記ローカルデコード係数複製ステップは、
     前記復号信号列を用いて複製シフト信号列を生成するかを判定し、複製判定フラグを出力する複製判定サブステップと、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
     を有する
     ことを特徴とする復号方法。
  8.  受信信号から符号インデクスと複製シフト情報と複製判定フラグを読み出し、出力する符号分離ステップと、
     前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
     前記復号信号列と前記複製シフト情報と複製判定フラグから補完復号信号列を生成するローカルデコード係数複製ステップと、
     前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
     を有し、
     前記ローカルデコード係数複製ステップは、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
     を有する
     ことを特徴とする復号方法。
  9.  受信信号から符号インデクスと複製シフト情報とを読み出し、出力する符号分離ステップと、
     前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
     前記復号信号列と前記複製シフト情報から補完復号信号列を生成するローカルデコード係数複製ステップと、
     前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
     を有し、
     前記ローカルデコード係数複製ステップは、
     前記復号信号列から複製シフト信号列を生成するかを判定し、複製判定フラグを出力する複製判定サブステップと、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
     前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
     を有する
     ことを特徴とする復号方法。
  10.  受信信号から符号インデクスと複製シフト情報と複製判定フラグを読み出し、出力する符号分離ステップと、
     前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
     前記復号信号列と前記複製シフト情報と複製判定フラグから補完復号信号列を生成するローカルデコード係数複製ステップと、
     前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
     を有し、
     前記ローカルデコード係数複製ステップは、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
     前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
     を有する
     ことを特徴とする復号方法。
  11.  請求項7から10のいずれかに記載の復号方法であって、
     前記復号信号列S^(w)[k]が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k](ただし、w=0,…,W-1、k=0,…,L’-1、Wは分割した数、L’は1つのサブバンド周波数領域信号列に含まれる信号の数)に対応する信号列であり、
     前記複製シフト信号列生成サブステップは、複製シフト信号列S・(w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する前記復号信号列S^(w)[k]を用いて求める
     ことを特徴とする復号方法。
  12.  音響信号から、あらかじめ定められた数の信号からなる信号列を、符号化対象信号列として生成し、出力する符号化対象信号列する符号化対象信号列生成部と、
     前記符号化対象信号列ごとに該符号化対象信号列に対応する符号インデクスを出力する信号符号化部と、
     前記符号インデクスを復号し、復号信号列を出力する信号復号部と、
     前記符号化対象信号列と前記復号信号列から、複製シフト情報を出力するローカルデコード係数探索部と、
     少なくとも前記符号インデクスと前記複製シフト情報を多重化して送信信号を生成する符号多重化部と
     を備え、
     前記ローカルデコード係数探索部は、
     前記符号化対象信号列ごとに、前記復号信号列を用いて複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する複製判定手段と、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する複製シフト候補信号列生成手段と、
     各複製シフト候補信号列もしくは各複製シフト候補信号列を用いて生成した信号列と前記符号化対象信号列との距離を示すパラメータを計算する距離計算手段と、
     前記距離計算手段の計算結果から距離が最小となる信号シフト量を求める距離最小シフト量検出手段と
     を有する
     ことを特徴とする符号化装置。
  13.  受信信号から少なくとも符号インデクスと複製シフト情報とを読み出し、出力する符号分離部と、
     前記符号インデクスを復号し、復号信号列を出力する信号復号部と、
     前記復号信号列と前記複製シフト情報から補完復号信号列を生成するローカルデコード係数複製部と、
     前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成部と
     を備え、
     前記ローカルデコード係数複製部は、
     前記復号信号列を用いて複製シフト信号列を生成するかを判定し、複製判定フラグを出力する複製判定手段と、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成手段と、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する、または、前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成手段と
     を有する
     ことを特徴とする復号装置。
  14.  受信信号から少なくとも符号インデクスと複製シフト情報と複製判定フラグを読み出し、出力する符号分離部と、
     前記符号インデクスを復号し、復号信号列を出力する信号復号部と、
     前記復号信号列と前記複製シフト情報と複製判定フラグから補完復号信号列を生成するローカルデコード係数複製部と、
     前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成部と
     を備え、
     前記ローカルデコード係数複製部は、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成手段と、
     前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する、または、前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成手段と
     を有する
     ことを特徴とする復号装置。
  15.  請求項1から11のいずれかに記載の方法の各ステップをコンピュータに実行させるプログラム。 
PCT/JP2010/060522 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム WO2010150767A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN2010800265515A CN102804263A (zh) 2009-06-23 2010-06-22 编码方法、解码方法、利用了这些方法的装置、程序
EP10792085A EP2447943A4 (en) 2009-06-23 2010-06-22 ENCODING METHOD, DECODING METHOD, AND DEVICE AND PROGRAM USING THE METHODS
CA2765523A CA2765523A1 (en) 2009-06-23 2010-06-22 Coding method, decoding method, and device and recording medium using the methods
US13/377,983 US20120123788A1 (en) 2009-06-23 2010-06-22 Coding method, decoding method, and device and program using the methods
JP2011519899A JP5400880B2 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009148793 2009-06-23
JP2009-148793 2009-06-23

Publications (1)

Publication Number Publication Date
WO2010150767A1 true WO2010150767A1 (ja) 2010-12-29

Family

ID=43386536

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/060522 WO2010150767A1 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム

Country Status (6)

Country Link
US (1) US20120123788A1 (ja)
EP (1) EP2447943A4 (ja)
JP (1) JP5400880B2 (ja)
CN (1) CN102804263A (ja)
CA (1) CA2765523A1 (ja)
WO (1) WO2010150767A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104012018A (zh) * 2011-11-07 2014-08-27 高通股份有限公司 用于灵活带宽系统的语音服务解决方案
US9220101B2 (en) 2011-11-07 2015-12-22 Qualcomm Incorporated Signaling and traffic carrier splitting for wireless communications systems
US9516531B2 (en) 2011-11-07 2016-12-06 Qualcomm Incorporated Assistance information for flexible bandwidth carrier mobility methods, systems, and devices

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10951292B2 (en) * 2018-01-26 2021-03-16 California Institute Of Technology Systems and methods for random access communication

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
JP2004080625A (ja) * 2002-08-21 2004-03-11 Matsushita Electric Ind Co Ltd パケット型音声通信端末
WO2005109401A1 (ja) 2004-05-10 2005-11-17 Nippon Telegraph And Telephone Corporation 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3153075B2 (ja) * 1994-08-02 2001-04-03 日本電気株式会社 音声符号化装置
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JPH08179795A (ja) * 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
BRPI0617447A2 (pt) * 2005-10-14 2012-04-17 Matsushita Electric Ind Co Ltd codificador de transformada e método de codificação de transformada
CN101308659B (zh) * 2007-05-16 2011-11-30 中兴通讯股份有限公司 一种基于先进音频编码器的心理声学模型的处理方法
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
JP2004080625A (ja) * 2002-08-21 2004-03-11 Matsushita Electric Ind Co Ltd パケット型音声通信端末
WO2005109401A1 (ja) 2004-05-10 2005-11-17 Nippon Telegraph And Telephone Corporation 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2447943A4

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104012018A (zh) * 2011-11-07 2014-08-27 高通股份有限公司 用于灵活带宽系统的语音服务解决方案
JP2015504630A (ja) * 2011-11-07 2015-02-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated フレキシブル帯域幅システムのためのボイスサービスソリューション
US9220101B2 (en) 2011-11-07 2015-12-22 Qualcomm Incorporated Signaling and traffic carrier splitting for wireless communications systems
US9516531B2 (en) 2011-11-07 2016-12-06 Qualcomm Incorporated Assistance information for flexible bandwidth carrier mobility methods, systems, and devices
US9532251B2 (en) 2011-11-07 2016-12-27 Qualcomm Incorporated Bandwidth information determination for flexible bandwidth carriers
CN104012018B (zh) * 2011-11-07 2017-05-31 高通股份有限公司 用于灵活带宽系统的语音服务解决方案
US9848339B2 (en) 2011-11-07 2017-12-19 Qualcomm Incorporated Voice service solutions for flexible bandwidth systems
US10111125B2 (en) 2011-11-07 2018-10-23 Qualcomm Incorporated Bandwidth information determination for flexible bandwidth carriers
US10667162B2 (en) 2011-11-07 2020-05-26 Qualcomm Incorporated Bandwidth information determination for flexible bandwidth carriers

Also Published As

Publication number Publication date
US20120123788A1 (en) 2012-05-17
EP2447943A1 (en) 2012-05-02
JPWO2010150767A1 (ja) 2012-12-10
JP5400880B2 (ja) 2014-01-29
EP2447943A4 (en) 2013-01-09
CN102804263A (zh) 2012-11-28
CA2765523A1 (en) 2010-12-29

Similar Documents

Publication Publication Date Title
US8321229B2 (en) Apparatus, medium and method to encode and decode high frequency signal
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
AU2016202800B2 (en) Signal processing apparatus and method, and program
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
JP4781153B2 (ja) オーディオデータ符号化及び復号化装置、並びにオーディオデータ符号化及び復号化方法
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算
KR101180202B1 (ko) 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
Hwang Multimedia networking: From theory to practice
EP2382622A1 (en) Method and apparatus for generating an enhancement layer within a multiple-channel audio coding system
KR100832144B1 (ko) 지각적으로 개선된 음향신호의 엔코딩
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP5400880B2 (ja) 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
US20090006081A1 (en) Method, medium and apparatus for encoding and/or decoding signal

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080026551.5

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10792085

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011519899

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2765523

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2010792085

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13377983

Country of ref document: US