WO2015037961A1 - 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 - Google Patents

에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 Download PDF

Info

Publication number
WO2015037961A1
WO2015037961A1 PCT/KR2014/008586 KR2014008586W WO2015037961A1 WO 2015037961 A1 WO2015037961 A1 WO 2015037961A1 KR 2014008586 W KR2014008586 W KR 2014008586W WO 2015037961 A1 WO2015037961 A1 WO 2015037961A1
Authority
WO
WIPO (PCT)
Prior art keywords
encoding
mode
decoding
quantization index
bits
Prior art date
Application number
PCT/KR2014/008586
Other languages
English (en)
French (fr)
Inventor
주기현
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to EP22197860.4A priority Critical patent/EP4134951A1/en
Priority to JP2016542648A priority patent/JP6302071B2/ja
Priority to CN202010005273.0A priority patent/CN111179946B/zh
Priority to EP14844584.4A priority patent/EP3046105B1/en
Priority to US15/021,833 priority patent/US10468033B2/en
Priority to EP19212262.0A priority patent/EP3660843B1/en
Priority to CN201480062275.6A priority patent/CN105723454B/zh
Publication of WO2015037961A1 publication Critical patent/WO2015037961A1/ko
Priority to US16/673,237 priority patent/US10699720B2/en
Priority to US16/887,021 priority patent/US10909992B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Definitions

  • the present invention relates to the encoding and decoding of audio signals or speech signals, and more particularly, by reducing the number of bits required to encode energy information of a spectrum in a limited bit range without increasing the complexity and degrading the restored sound quality.
  • the present invention relates to an energy lossless encoding method and apparatus, a signal encoding method and apparatus, an energy lossless decoding method and apparatus, a signal decoding method and apparatus, and a multimedia apparatus employing the same. .
  • additional information such as energy or envelope may be included in the bitstream in addition to the actual frequency component of the spectrum.
  • additional information such as energy or envelope may be included in the bitstream in addition to the actual frequency component of the spectrum.
  • the problem to be solved by the present invention is to reduce the number of bits required to encode the energy or envelope of the spectrum in a limited bit range, without increasing the complexity and deterioration of the restored sound quality, while the bits required to encode the actual frequency components of the spectrum.
  • Another problem to be solved by the present invention is that the number of bits required to encode the actual frequency components of the spectrum while reducing the number of bits required to encode the energy of the spectrum in a limited bit range, without increasing the complexity and deterioration of the restored sound quality
  • the present invention provides an energy lossless encoding apparatus, a signal encoding apparatus, an energy lossless decoding apparatus, and a signal decoding apparatus capable of increasing.
  • Another object of the present invention is to provide a computer-readable recording medium having a program for executing an energy lossless encoding method, a signal encoding method, an energy lossless decoding method, or a signal decoding method on a computer.
  • Another object of the present invention is to provide a multimedia apparatus employing an energy lossless encoding apparatus, a signal encoding apparatus, an energy lossless decoding apparatus, or a signal decoding apparatus.
  • a signal encoding method comprising: quantizing energy obtained in band units from spectral coefficients generated from an audio signal in a time domain; Lossless coding is performed by selecting a coding method of the quantization index in consideration of the number of bits representing the quantization index of energy and the number of bits generated as a result of encoding the quantization index of the energy by a large symbol coding method and a small symbol coding method. step; Allocating bits for encoding in units of bands based on reconstructed energy; And quantizing and lossless encoding the spectral coefficients based on the allocated bits.
  • a symbol having a large representation range can be encoded in one of a pulse mode and a scale mode, thereby reducing the number of bits used for energy encoding and assigning more bits to spectral coding.
  • FIG. 1 is a block diagram illustrating a configuration of an audio encoding apparatus according to an embodiment.
  • FIG. 2 is a block diagram illustrating a configuration of an audio decoding apparatus according to an embodiment.
  • FIG. 3 is a block diagram illustrating a configuration of an energy lossless encoding apparatus according to an embodiment.
  • FIG. 4 is a block block diagram showing a detailed configuration of a first lossless encoder shown in FIG. 3.
  • FIG. 5 is a table illustrating an encoding method and an encoding mode according to an embodiment.
  • FIG. 6 is a diagram illustrating an example of a Huffman coding table used in a large symbol coding method.
  • FIG. 7 is a diagram illustrating an example of bit allocation for a pulse mode.
  • FIG. 8 is a block block diagram illustrating a detailed configuration of a second lossless encoder illustrated in FIG. 3.
  • FIG. 9 is a block block diagram illustrating a detailed configuration of an upper bit encoder illustrated in FIG. 8.
  • FIG. 10 is an example of grouping of contexts used in the first Huffman mode encoder shown in FIG. 9.
  • 11 is a flowchart illustrating a bit calculation process for determining an encoding scheme according to an embodiment.
  • FIG. 12 is a block diagram illustrating a configuration of an energy lossless decoding apparatus according to an embodiment.
  • FIG. 13 is a block block diagram illustrating a detailed configuration of a first lossless decoding unit illustrated in FIG. 12.
  • FIG. 14 is a block block diagram illustrating a detailed configuration of a second lossless decoding unit illustrated in FIG. 12.
  • FIG. 15 is a block block diagram illustrating a detailed configuration of an upper bit decoder illustrated in FIG. 13.
  • 16 is a diagram for explaining a small symbol coding method.
  • FIG. 17 is a block diagram showing the configuration of a multimedia device according to an embodiment of the present invention.
  • FIG. 18 is a block diagram showing a configuration of a multimedia device according to another embodiment of the present invention.
  • FIG. 19 is a block diagram illustrating a configuration of a multimedia device according to another embodiment of the present invention.
  • first and second may be used to describe various components, but the components are not limited by the terms. The terms are only used to distinguish one component from another.
  • FIG. 1 is a block diagram showing the configuration of a signal encoding apparatus according to an embodiment of the present invention.
  • the signal encoding apparatus 100 illustrated in FIG. 1 includes a transform unit 110, an energy quantization unit 120, an energy lossless encoding unit 130, a bit allocation unit 140, a spectral quantization unit 150, and a spectral lossless encoding.
  • the unit 160 and the multiplexer 170 may be included.
  • the multiplexer 170 may be included as an option and may be replaced by another component that performs a bit packing function.
  • lossless coded energy data and lossless coded spectral data may be stored and transmitted by forming a separate bitstream.
  • it may further include a normalization unit (not shown) for performing the normalization (normalization) using the energy value.
  • the signal may mean a media signal such as audio, music or speech, or a sound representing a mixed signal thereof.
  • the signal will be referred to as an audio signal for convenience of description.
  • the audio signal of the time domain input to the signal encoding apparatus 100 may have various sampling rates, and the band configuration of energy used to quantize the spectrum for each sampling rate may vary. Accordingly, the number of quantized energy for which lossless coding is performed may vary. Examples of the sampling rate include 7.2 kHz, 8 kHz, 13.2 kHz, 16.4 kHz, 32 kHZ, 48 kHz, and the like, but are not limited thereto.
  • the audio signal of the time domain in which the sampling rate and the target bit rate are determined may be provided to the converter 110.
  • the converter 110 may generate an audio spectrum by converting an audio signal of a time domain, for example, a pulse code modulation (PCM) signal, into a frequency domain.
  • a time domain for example, a pulse code modulation (PCM) signal
  • PCM pulse code modulation
  • the time / frequency domain transformation may be performed using various known methods such as Modified Discrete Cosine Transform (MDCT).
  • MDCT Modified Discrete Cosine Transform
  • Transform coefficients of the audio spectrum obtained from the transform unit 110 for example, MDCT coefficients, may be provided to the energy quantization unit 120 and the spectral quantization unit 150.
  • the energy quantization unit 120 may obtain energy in units of bands from the conversion coefficients provided from the conversion unit 110.
  • the band is a grouping of samples of the audio spectrum, and may have a uniform or nonuniform length reflecting a critical band. In the case of non-uniformity, the band may be set such that the number of samples included in one band is gradually increased for one frame from the start sample to the last sample. In addition, when supporting multiple bit rates, the number of samples included in each band corresponding to different bit rates may be set to be the same. The number of bands included in one frame or the number of samples included in the band may be predetermined.
  • the energy value may represent an envelope of the conversion coefficients included in the band, and may mean an average amplitude, average energy, power, or norm value.
  • the band may mean a parameter band or a scale factor band.
  • the energy E M (b) of the band b may be calculated by, for example, Equation 1 below.
  • X M (k) means spectral coefficients
  • k start (b) and k end (b) means the start sample and the last sample of the band, respectively.
  • the energy quantization unit 120 may generate an index by performing quantization on the obtained energy.
  • the energy can be scalar quantized to a quantization step size, eg, a uniform scalar quantizer value qint. qint is variable and can be selected based on bandwidth and mode, for example.
  • the quantization index I M (b) of energy may be calculated by, for example, Equation 2 below.
  • the quantization index of the subvector energies may be differentially coded.
  • a difference between the quantization index of the current band and the quantization index of the previous band, that is, the differential index is determined for the current band. You can get it.
  • the difference index since there is no previous band in the first band in the frame, the difference index may be obtained by subtracting a predetermined value from the quantization index of the first band.
  • the difference index ⁇ I M (0) of the first band and the difference index ⁇ I M (b) of the remaining bands may be calculated by, for example, Equation 3 below.
  • I ref corresponds to the reference band energy and may be set to 24.
  • the differential index ⁇ I M (b) may be limited to a predetermined range, for example, [-256, 256]. This may be achieved by first adjusting the negative difference index and then adjusting the positive difference index as in Equation 4 below.
  • the energy lossless encoder 130 may perform lossless encoding on an index, a difference index, or a limited difference index provided from the energy quantizer 120. According to an embodiment, the energy lossless encoder 130 may select one of the first encoding scheme and the second encoding scheme according to a capability or range and bit conmsumption for expressing a difference index. Lossless coding may be performed on a frame-by-frame basis.
  • the first coding scheme is a large symbol coding method, and is applied when the number of symbols that can represent an index is relatively larger than that of the second coding scheme, and the second coding scheme is a small symbol coding method.
  • the band energy may be encoded in one of a pulse mode and a scale mode.
  • encoding is performed by dividing the upper bits into the lower bits, and the upper bits are encoded in one of the context-based Huffman encoding mode and the resized Huffman encoding mode, and the lower bits are processed by bit packing. Can be.
  • a coding scheme index indicating a coding scheme that is, a flag bit (DENG_CMODE) and a coding mode index indicating the coding mode in each coding scheme, that is, a flag bit (LC_MODE)
  • DENG_CMODE a flag bit
  • LC_MODE a flag bit
  • Such energy or envelope encoding mode may be represented as shown in FIG. 5.
  • the energy lossless encoding unit 130 may select an encoding mode based on an estimate of the amount of bits consumed in the context-based Huffman encoding mode and the reduced Huffman encoding mode in the small symbol encoding scheme.
  • the bit allocation unit 140 may restore energy by performing inverse quantization on the quantization index provided from the energy quantization unit 120.
  • the bit allocator 140 calculates a masking threshold value for the total number of bits according to the target bit rate using energy reconstructed in each band unit, and uses the masking threshold value to calculate the number of bits allocated for perceptual encoding of each band. Can be determined in integer units or decimal units.
  • the bit allocator 140 may allocate bits by estimating the number of allowed bits using the energy recovered in units of bands and limit the number of allocated bits not to exceed the number of allowed bits. In this case, bits may be sequentially allocated from a band having a large energy.
  • Perceptual importance can be determined, for example, by psychoacoustic weighting as in ITU-T G.719.
  • the spectral quantization unit 150 may perform quantization on the transform coefficients provided from the transform unit 110 by using the number of bits allocated for each band, and generate a quantization index of the spectrum.
  • the spectral lossless encoder 160 may perform lossless encoding on the quantization index of the spectrum provided from the spectral quantizer 150.
  • a lossless coding algorithm a known algorithm such as Huffman coding or factorial pulse coding (FPC) may be used.
  • Data obtained as a result of lossless encoding may be included in a bitstream and stored or transmitted.
  • the multiplexer 170 may generate the energy data provided from the energy lossless encoder 130 and the spectral data provided from the spectrum lossless encoder 160 as a bitstream.
  • FIG. 2 is a block diagram showing the configuration of an audio decoding apparatus according to an embodiment of the present invention.
  • the audio decoding apparatus 200 illustrated in FIG. 2 includes a demultiplexer 210, an energy lossless decoder 220, an energy dequantizer 230, a bit allocator 240, a spectrum lossless decoder 250, It may include a spectral inverse quantizer 260 and an inverse transform unit 270. Each component may be integrated into at least one or more modules and implemented as at least one or more processors (not shown). As in the audio encoding apparatus 100, the demultiplexer 210 is provided as an option and may be replaced by another component that performs a bit unpacking function. On the other hand, after or before the spectral dequantization process, it may further include a denormalization unit (not shown) for performing the normalization (normalization) using the energy value.
  • the demultiplexer 210 parses the bitstream and provides the encoded energy data to the energy lossless decoder 220 and the encoded spectral data to the spectrum lossless decoder 250, respectively.
  • the energy lossless decoder 220 may perform lossless decoding on the encoded energy data to obtain a quantization index of energy.
  • a differential quantization index may be obtained.
  • the quantization index of each band can be restored by the following equation (5).
  • the energy dequantization unit 230 may restore energy by performing inverse quantization on the quantization index of energy provided from the energy lossless decoding unit 220.
  • the energy dequantization unit 230 may restore energy by multiplying a quantization index of energy by a quantization step size, for example, a uniform scalar quantizer value qint.
  • the bit allocator 240 may perform bit allocation on an integer or decimal point basis in units of frequency bands by using the restored energy provided from the energy dequantization unit 230. Specifically, bits are allocated for each sample sequentially from a band with a high energy. That is, first, bits per sample are allocated to a band having the maximum energy, and the priority is changed to reduce the energy of the corresponding band by a predetermined unit so that bits can be allocated to other bands. This process is repeated until the total number of bits available in a given frame is exhausted.
  • the operation of the bit allocator 240 is substantially the same as the bit allocator 140 of the audio encoding apparatus 100.
  • the spectrum lossless decoding unit 250 may perform lossless decoding on the encoded spectrum data to obtain a spectrum quantization index.
  • the spectral inverse quantization unit 260 may perform inverse quantization on the spectral quantization index provided from the spectrum lossless decoding unit 250 using the number of bits allocated for each band and restore the spectral transform coefficient.
  • the inverse transformer 250 may perform inverse transform on the spectral transform coefficient provided from the spectral inverse quantizer 260 to restore an audio signal in the time domain.
  • FIG. 3 is a block diagram illustrating a configuration of an energy lossless encoding apparatus according to an embodiment of the present invention.
  • the energy lossless encoding apparatus 300 illustrated in FIG. 3 may include an encoding scheme determiner 310, a first lossless encoder 330, and a second lossless encoder 350. Each component may be integrated into at least one or more modules and implemented as at least one or more processors (not shown).
  • the input of the lossless coding may be either a quantization index or a differential quantization index. Here, an example of using a differential quantization index will be used.
  • the encoding method determiner 310 may determine one of a first encoding method and a second encoding method as an encoding method for a differential quantization index.
  • the differential quantization index may be provided to the first lossless encoder 330.
  • the differential quantization index may be provided to the second lossless encoder 350.
  • the encoding method determination unit 310 cannot express any one quantization index present in all bands of one frame in a predetermined range, for example, [-32,31] ([46,17] for the first index). In this case, the coding scheme of the quantization index may be determined as the first coding scheme.
  • the first encoding method may encode data that can be represented by more than 256 or 512 symbols
  • the second encoding method may encode data limited to 64 symbols.
  • an encoding method having a low bit consumption may be selected between the first encoding method and the second encoding method.
  • the quantization index is encoded in a plurality of modes of the second encoding scheme for all bands in the current frame, and the least bits used as a result of the encoding are compared with the bits used as a result of performing the first encoding scheme. Therefore, it may be determined again as one of the first encoding method and the second encoding method.
  • one bit of additional information D0 indicating the encoding method of the differential quantization index may be generated and included in the bitstream.
  • the encoding method determiner 310 divides the N bits into upper bits of N0 bits and lower bits of N1 bits and provides them to the second lossless encoder 350. can do.
  • N0 may be represented by N-N1 and N1 may be represented by N-N0.
  • N may be set to 6
  • N0 may be set to 5
  • N1 may be set to 1.
  • the first lossless encoding unit 330 may select one of a pulse mode and a scale mode to encode a quantization index.
  • the pulse mode may be suitable when no quantization index exists beyond the [-4, 3] range. If this range is exceeded, the pulse mode cannot be used, and instead the scale mode can always be used. In addition, the scale mode can always be used when the first index exceeds the [-64, 63] range.
  • the Huffman coding mode according to the Huffman coding table having eight symbols as shown in FIG. 6 may be used.
  • first indicator ind Io
  • second indicator ind pls indicating whether there is a quantization index, i.e., a pulse exceeding the range [-4, 3].
  • first indicator may be set to 0, and the first index may be Huffman coded using the Huffman table shown in FIG. 6 together with another index.
  • the first indicator may be set to 1, and 64 may be added to the first index and then packed using 7 bits.
  • the second indicator when a pulse is present in the current frame, the second indicator is set to 1, and the pulse position pls pos and the pulse size pls amp may be transmitted using 5 bits and 7 bits, respectively. After that, all other indices may be encoded using the Huffman table as shown in FIG. 6. An example of bit allocation in the pulse mode is shown in FIG. In FIG. 7, cmd 0 represents an encoding method, cmd 1 represents a pulse mode or a scale mode, and ⁇ I M (0) represents a first index.
  • the indexes can be split into three upper bits and several lower bits according to the maximum and minimum of all indexes.
  • the three upper bits may be encoded using the Huffman table as shown in FIG. 6, and the lower bits may be packed.
  • the number of lower bits may be defined as bit shift .
  • Bit shift can be calculated such that all quantization indices fall within the range [-4, 3] by scaling the quantization index. As a result of scaling, all quantization indices can be represented by 3 bits.
  • the second lossless encoding unit 350 may separate the upper and lower bits with respect to the differential quantization index, apply the Huffman encoding mode to the upper bits, and process the bit bits with respect to the lower bits.
  • FIG. 4 is a block block diagram showing a detailed configuration of a first lossless encoder shown in FIG. 3.
  • the first lossless encoder 400 illustrated in FIG. 4 may include a pulse mode encoder 410 and a scale mode encoder 430.
  • the pulse mode encoder 410 is a mode that can be efficiently utilized when a part of data in an input differential quantization index vector is out of a finite region representation range. Is encoded differently, and the remaining data is encoded in Huffman encoding mode. Specifically, the pulse mode is determined to transmit with information on whether to separate and transmit the first quantization index.
  • the first quantization index ⁇ I M (0), information on the presence or absence of a pulse, and information on the position and magnitude of the pulse, if present, are transmitted as additional information.
  • the remaining quantization indexes not transmitted in this manner are transmitted based on the Huffman coding scheme.
  • the scale mode encoder 430 is a mode that can be utilized when the differential quantization index vector has a plurality of large values.
  • the scale mode encoder 430 decreases the value to a range that can be expressed in the Huffman coding mode and allocates the higher bits to the higher bits. It consists of the bits that are removed.
  • the scale mode scales all values of the input differential quantization index vector to a range that can be transmitted by Huffman coding, transmits the number of light-shifted bits as scale information for scaling, and removes the lower bits when scaling. For example, the least significant bit is transmitted through bit packing, and values reduced through scaling are transmitted based on the Huffman coding scheme.
  • FIG. 8 is a block block diagram illustrating a detailed configuration of a second lossless encoder illustrated in FIG. 3.
  • the second lossless encoder 800 illustrated in FIG. 8 may be configured of an upper bit encoder 810 and a lower bit encoder 830.
  • the higher bit encoder 810 may encode upper bits of the differential quantization index, and the lower bit encoder 830 may pack the lower bits of the differential quantization index.
  • the differential quantization index may be adjusted to have a positive value by adding 46 to the first band and 32 to the other band before splitting into the upper and lower bits.
  • the differential quantization index obtained by Equation 4 may be limited to the range of [0, 63] by adding an offset of 46 for the first band and an offset of 32 for the other band. If the limited differential quantization index exceeds the range of [0, 63] if the current frame is not a transient frame, and if the limited differential quantization index exceeds the range of [0, 31] if the current frame is a transient frame, Use symbol coding.
  • the higher bit encoder 810 may configure 2 N0 symbols with respect to the higher bits represented by the N0 bits, and may encode a mode in which a small bit is required among the plurality of Huffman encoding modes.
  • the higher bit encoder 810 may have two Huffman coding modes, for example. In this case, one bit of additional information D1 indicating an encoding mode of an upper bit may be generated and included in the bitstream together with one bit of additional information D0 indicating an encoding method.
  • the lower bit encoder 830 may perform encoding by applying a bit packing scheme to the lower bit represented by N1 bits.
  • a lower bit may be encoded using all N1 ⁇ N b bits.
  • FIG. 9 is a block block diagram illustrating a detailed configuration of an upper bit encoder illustrated in FIG. 8.
  • the higher bit encoder 900 illustrated in FIG. 9 may include a first Huffman mode encoder 910 and a second Huffman mode encoder 930.
  • the first Huffman mode encoder 910 may encode the higher bits of the differential quantization index based on the context-based Huffman encoding, and the second Huffman mode encoder 930 based on the resize Huffman encoding. have.
  • the first Huffman mode encoder 910 divides the range of the difference quantization index of the previous band used as a context into a plurality of groups, and the difference of the current band based on a predetermined Huffman coding table for each group.
  • Huffman coding may be performed on a quantization index.
  • the Huffman coding table may be generated through, for example, a training process using a large database, and may collect data based on a predetermined criterion and generate the data based on the collected data.
  • data about the frequency of the differential quantization index of the current band may be collected to generate a Huffman table for each group.
  • group index 0 may use the same Huffman table as group index 2. Accordingly, the Huffman coding table 1 for the group index 1, that is, the probability model 1, and the Huffman table 0 shared by the group indexes 0 and 2, that is, the probability model 0, may be used. In this case, the index of the code for the group index 0 may be expressed in reverse with respect to the group index 2.
  • the A value may be set to a value that makes the probability distributions of the group indexes 0 and 2 symmetric.
  • the A value is not extracted in the encoding and decoding process, and may be set to an optimum value in advance.
  • the Huffman coding table of Group 0 may be used instead of the Huffman coding table of Group Index 2, and the differential quantization index may be changed in Group Index 2.
  • the A value may use 31.
  • the context-based Huffman coding mode uses two Huffman coding tables determined by probability distributions of three groups of differential quantization indices.
  • the Huffman table 1 and the group of the group index 1 are used as the context, and the differential quantization index (d (i-1)) of the previous band is used as the context.
  • the Huffman table 0 for index 2 is used.
  • the differential quantization index d (i-1) of the previous band belongs to group index 1. If the differential quantization index d (i-1) of the previous band belongs to group index 1, the code for the differential quantization index d (i) of the current band is selected from Huffman Table 1. If the differential quantization index d (i-1) of the previous band does not belong to the group index 1, it is determined whether the differential quantization index d (i-1) of the previous band belongs to the group index 0.
  • the differential quantization index d (i-1) of the previous band does not belong to group index 0, that is, belongs to group index 2
  • the code for the differential quantization index d (i) of the current band from Huffman table 0 Select. If the differential quantization index d (i-1) of the previous band belongs to group index 0, the differential quantization index d (i) of the current band is inverted, and the difference of the current band inverted from Huffman table 0 is obtained. Select the code for the quantization index d '(i).
  • Huffman coding is performed on the differential quantization index d (i) of the current band using each selected code.
  • the second Huffman mode encoder 930 performs Huffman encoding without a context, and may configure the Huffman encoding table with fewer symbols than the conventional Huffman encoding.
  • the second Huffman mode encoder 930 may obtain a new differential quantization index ⁇ I ′ M (b) by reducing the span of the differential quantization index while enabling full reconstruction of the differential quantization index.
  • the span of the differential quantization index of the current band may be modified based on the differential quantization index of the previous band and a predetermined threshold.
  • the range difference Range Diff may be calculated as in Equation 6 below.
  • Resized Huffman coding performed by the second Huffman mode encoder 930 may be used for a new differential quantization index when the range difference Range Diff is a predetermined value, for example, 11 or less. If the range difference Range Diff is larger than a predetermined value, Resized Huffman coding cannot be used.
  • FIG. 11 is a flowchart illustrating a process of calculating bits to determine a coding scheme and a coding mode for lossless coding, and may be operated in units of frames.
  • an optimal bit of each of coding scheme 0, that is, large symbol coding scheme and coding scheme 1, that is, small symbol coding scheme is calculated and determined by a method having a smaller value.
  • step 1151 the controller checks whether the pulse mode is possible, and if the pulse mode is enabled, performs the pulse mode in step 1153 to calculate the use bit (ebit0), and then performs the scale mode to calculate the use bit (ebit1).
  • step 1155 if the pulse mode is not possible, the scale mode is performed to calculate the use bit ebit1.
  • step 1157 a smaller value of ebit0 and ebit1 is assigned as ebit, and a coding mode corresponding to the small value is determined as an encoding mode of coding method 0.
  • step 1135 a smaller value of hbit0 and hbit1 is assigned to hbit, and the encoding mode corresponding to the smaller value is determined as the encoding mode of the encoding method 1.
  • the encoding mode corresponding to the smaller value is determined as the encoding mode of the encoding method 1.
  • one bit indicating an encoding mode a bit used for lower bit encoding, and 20 bits when Nb is 20 may be further considered.
  • step 1173 an encoding method using less bits of the hbit calculated in step 1135 and the ebit calculated in step 1157 is determined, and the encoding method bits are set correspondingly.
  • FIG. 12 is a block diagram showing the configuration of an energy lossless decoding apparatus according to an embodiment of the present invention.
  • the energy lossless decoding apparatus 1200 illustrated in FIG. 12 may include a decoding method determiner 1210, a first lossless decoder 1230, and a second lossless decoder 1250. Each component may be integrated into at least one or more modules and implemented as at least one or more processors (not shown).
  • the decoding method determiner 1210 may parse the bitstream to obtain information about an encoding method and an encoding mode from additional information. That is, one of a large symbol decoding method and a small symbol decoding method may be determined from flag bits associated with an encoding method. If it is determined by the large symbol decoding method, the transmitted differential quantization index is transmitted to the first lossless decoder 1230, and when it is determined by the small symbol decoding method, the transmitted differential quantization index is transmitted to the second lossless decoder 1250. Can provide.
  • the first lossless decoder 1230 may perform decoding on the differential quantization index provided from the decoding method determiner 1210 based on the large symbol decoding method. For lossless decoding based on the large symbol decoding method, the inverse processing of the pulse mode or the scale mode in lossless coding can be used.
  • the differential quantization index provided from the decoding method determiner 1210 may be decoded based on the small symbol decoding method. To this end, lossless decoding may be separately performed on the upper bits and the lower bits of the differential quantization index.
  • FIG. 13 is a block block diagram illustrating a detailed configuration of a first lossless decoding unit illustrated in FIG. 12.
  • the first lossless decoder 1300 illustrated in FIG. 13 may include a pulse mode decoder 1310 and a scale mode decoder 1330.
  • the pulse mode decoder 1310 decodes a differential quantization index when it is determined as a pulse mode from a flag bit associated with an encoding mode included in a bitstream, and inverses the pulse mode encoder 410 of FIG. 4. The process can be performed.
  • the scale mode decoder 1330 may decode the differential quantization index when the scale mode is determined from the flag bits associated with the encoding mode included in the bitstream, and perform the reverse process of the scale mode encoder 430 of FIG. 4. .
  • FIG. 14 is a block block diagram illustrating a detailed configuration of a second lossless decoding unit illustrated in FIG. 12.
  • the second lossless decoder 1400 illustrated in FIG. 14 may include an upper bit decoder 1410 and a lower bit decoder 1430.
  • the upper bit decoder 1410 may decode the upper bits of the differential quantization index, and the lower bit decoder 1430 may unpack the lower bits of the differential quantization index to obtain a restored lower bit. Can be.
  • FIG. 15 is a block block diagram illustrating a detailed configuration of an upper bit decoder illustrated in FIG. 14.
  • the upper bit decoder illustrated in FIG. 15 may be configured of a first Huffman mode decoder 1510 and a second Huffman mode decoder 1530.
  • the first Huffman mode decoder 1510 may decode the higher bits of the differential quantization index based on the context-based Huffman decoding, and the second Huffman mode decoder 1530 based on the resize Huffman decoding. have.
  • flag bits associated with an encoding mode may be extracted.
  • the encoding mode may be one of a context based Huffman encoding mode and a resized Huffman encoding mode.
  • the first Huffman mode decoder 1510 performs two Huffman decoding tables determined by probability distributions of three groups of differential quantization indices, as in the first Huffman mode encoder 910 of FIG. 9. I use it.
  • the differential quantization index d (i) of the current band the differential quantization index d (i-1) of the previous band is used as the context, and the Huffman decoding table 1 for the group index 1 is used.
  • Huffman decoding table 0 for group 2 is used.
  • the differential quantization index d (i-1) of the previous band belongs to group index 1.
  • a code for the differential quantization index d (i) of the current band is selected from the Huffman decoding table 1.
  • the differential quantization index d (i-1) of the previous band does not belong to the group index 1
  • the differential quantization index d (i-1) of the previous band does not belong to the group index 0, that is, belongs to the group index 2, from the Huffman decoding table 0 to the differential quantization index d (i) of the current band. Select the code.
  • the differential quantization index d (i-1) of the previous band belongs to the group index 0
  • the current quantized index inversion d (i) of the current band is inverted and inverted from the Huffman decoding table 0.
  • the code for the differential quantization index d '(i) of the band is selected.
  • Huffman decoding is performed on the differential quantization index d (i) of the current band using each selected code.
  • the second Huffman mode decoder 1530 performs a Huffman with respect to the differential quantization index according to whether the current frame is a transient frame or not. Decryption can be performed.
  • FIG. 16 is a diagram for explaining an energy quantization index encoded by a first coding scheme, that is, a small symbol coding scheme, in which N is 6, N0 is 5, and N1 is 1.
  • a first coding scheme that is, a small symbol coding scheme, in which N is 6, N0 is 5, and N1 is 1.
  • FIG. 16 the upper 5 bits use the Huffman coding mode, and the lower 1 bit may simply pack the bits.
  • FIG. 17 is a block diagram showing a configuration of a multimedia apparatus including an encoding module according to an embodiment of the present invention.
  • the multimedia device 1700 illustrated in FIG. 17 may include a communication unit 1710 and an encoding module 1730.
  • the storage unit 1750 may further include a storage unit 1750 for storing the audio bitstream according to the use of the audio bitstream obtained as the encoding result.
  • the multimedia device 1700 may further include a microphone 1770. That is, the storage 1750 and the microphone 1770 may be provided as an option.
  • the multimedia device 1700 illustrated in FIG. 17 may further include any decryption module (not shown), for example, a decryption module for performing a general decryption function or a decryption module according to an embodiment of the present invention.
  • the encoding module 1730 may be integrated with other components (not shown) included in the multimedia device 1700 and implemented as at least one processor (not shown).
  • the communication unit 1710 may receive at least one of audio and an encoded bitstream provided from the outside, or may transmit at least one of reconstructed audio and an audio bitstream obtained as a result of encoding of the encoding module 1730. Can be.
  • the communication unit 1710 includes wireless Internet, wireless intranet, wireless telephone network, wireless LAN (LAN), Wi-Fi, Wi-Fi Direct (WFD), 3G (Generation), 4G (4 Generation), and Bluetooth.
  • Wireless networks such as Bluetooth, Infrared Data Association (IrDA), Radio Frequency Identification (RFID), Ultra WideBand (UWB), Zigbee, Near Field Communication (NFC), wired telephone networks, wired Internet It is configured to send and receive data with external multimedia device through wired network.
  • the encoding module 1730 converts an audio signal of a time domain provided through the communication unit 1710 or the microphone 1770 into an audio spectrum of a frequency domain, and obtains an energy quantization index obtained from the audio spectrum of the frequency domain.
  • the encoding method may be determined by one of a large symbol coding method and a small symbol coding method, and the energy quantization index may be encoded according to the encoding method determination result. Specifically, when differential coding is applied in determining a coding method, one of the large symbol coding method and the small symbol coding method may be determined according to whether differential quantization indexes of all bands included in the current frame are represented by predetermined bits. .
  • the large symbol coding method and the large symbol coding method are determined according to the result of encoding the differential quantization index by the large symbol coding method and the small symbol coding method.
  • the small symbol coding methods a method with less bit consumption may be selected.
  • the large symbol coding method may include a pulse mode and a scale mode.
  • encoding is performed by dividing a differential quantization index into upper bits and lower bits, and upper bits may include a plurality of Huffman coding modes, and lower bits may use bit packing.
  • the encoding method and the encoding mode determined for the differential quantization index may be generated as side information.
  • the storage unit 1750 may store the encoded bitstream generated by the encoding module 1730.
  • the storage unit 1750 may store various programs required for the operation of the multimedia device 1700.
  • the microphone 1770 may provide a user or an external audio signal to the encoding module 1730.
  • FIG. 18 is a block diagram showing a configuration of a multimedia apparatus including a decoding module according to an embodiment of the present invention.
  • the multimedia device 1800 illustrated in FIG. 18 may include a communication unit 1810 and a decoding module 1830.
  • the storage unit 1850 may further include a storage unit 1850 for storing the restored audio signal according to the use of the restored audio signal obtained as a result of decoding.
  • the multimedia device 1800 may further include a speaker 1870. That is, the storage 1850 and the speaker 1870 may be provided as an option.
  • the multimedia device 1800 illustrated in FIG. 18 may further include an arbitrary encoding module (not shown), for example, an encoding module for performing a general encoding function or an encoding module according to an embodiment of the present invention.
  • the decoding module 1830 may be integrated with other components (not shown) included in the multimedia device 1800 and implemented as at least one or more processors (not shown).
  • the communication unit 1810 receives at least one of an encoded bitstream and an audio signal provided from the outside, or at least one of a reconstructed audio signal obtained as a result of decoding of the decoding module 1830 and an audio bitstream obtained as a result of encoding. You can send one. Meanwhile, the communication unit 1810 may be implemented substantially similar to the communication unit 1710 of FIG. 17.
  • the decoding module 1830 receives a bitstream provided through the communication unit 1810, and determines an encoding method and an encoding mode of the differential quantization index of energy based on additional information included in the bitstream.
  • the differential quantization index may be decoded.
  • the large symbol decoding scheme may include a pulse mode and a scale mode.
  • the small symbol decoding method decodes the differential quantization index into upper bits and lower bits, and the upper bits may include a plurality of Huffman decoding modes, and the lower bits may use bit unpacking.
  • the storage unit 1850 may store the restored audio signal generated by the decoding module 1830.
  • the storage unit 1850 may store various programs required for the operation of the multimedia device 1800.
  • the speaker 1870 may output the restored audio signal generated by the decoding module 1830 to the outside.
  • FIG. 19 is a block diagram illustrating a configuration of a multimedia apparatus including an encoding module and a decoding module according to an embodiment of the present invention.
  • the multimedia device 1900 illustrated in FIG. 19 may include a communication unit 1910, an encoding module 1920, and a decoding module 1930.
  • the storage unit 1940 may further include an audio bitstream or a reconstructed audio signal according to the use of the audio bitstream obtained as a result of encoding or the reconstructed audio signal obtained as a result of decoding.
  • the multimedia device 1900 may further include a microphone 1950 or a speaker 1960.
  • the encoding module 1920 and the decoding module 1930 may be integrated with other components (not shown) included in the multimedia device 1900 and may be implemented with at least one processor (not shown).
  • FIG. 19 overlaps with a component of the multimedia apparatus 1700 illustrated in FIG. 17 or a component of the multimedia apparatus 1800 illustrated in FIG. 18, and thus a detailed description thereof will be omitted.
  • a broadcasting or music dedicated device including a voice communication terminal including a telephone, a mobile phone, a TV, an MP3 player, or the like, or a dedicated voice communication.
  • the terminal may include a fusion terminal device of a broadcasting or music dedicated device, but is not limited thereto.
  • the multimedia devices 1700, 1800, 1900 may be used as clients, servers, or transducers disposed between the clients and servers.
  • the multimedia devices 1700, 1800, and 1900 are mobile phones, for example, a user input unit such as a keypad is not shown, a display unit displaying a user interface or information processed by the mobile phone, and controls the overall functions of the mobile phone. It may further include a processor.
  • the mobile phone may further include a camera unit having an imaging function and at least one component that performs a function required by the mobile phone.
  • the multimedia apparatuses 1700, 1800, and 1900 are TVs
  • the multimedia apparatuses 1700, 1800, and 1900 may further include a user input unit such as a keypad, a display unit displaying received broadcast information, and a processor controlling overall functions of the TV.
  • the TV may further include at least one or more components that perform a function required by the TV.
  • the above embodiments can be written in a computer executable program and can be implemented in a general-purpose digital computer for operating the program using a computer readable recording medium.
  • data structures, program instructions, or data files that can be used in the above-described embodiments of the present invention can be recorded on a computer-readable recording medium through various means.
  • the computer-readable recording medium may include all kinds of storage devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include magnetic media, such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, floppy disks, and the like.
  • Such as magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like.
  • the computer-readable recording medium may also be a transmission medium for transmitting a signal specifying a program command, a data structure, or the like.
  • Examples of program instructions may include high-level language code that can be executed by a computer using an interpreter as well as machine code such as produced by a compiler.

Abstract

무손실 부호화방법은, 에너지의 양자화 인덱스가 표현되는 범위에 근거하여 제1부호화방식과 제2부호화방식 중 하나를 선택하는 단계, 및 선택된 부호화방식을 이용하여 양자화 인덱스를 부호화하는 단계를 포함할 수 있다. 무손실 복호화방법은 비트스트림에 포함된 에너지의 차분 양자화 인덱스의 부호화 방식을 결정하는 단계, 및 결정된 부호화 방식에 대응하여 차분 양자화 인덱스를 에너지의 양자화 인덱스가 표현되는 범위에 근거한 제1복호화방식과 제2복호화방식 중 하나로 복호화하는 단계를 포함할 수 있다.

Description

에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
본 발명은 오디오 신호 혹은 스피치 신호 부호화 및 복호화에 관한 것으로서, 보다 구체적으로는, 복잡도의 증가 및 복원된 음질의 열화없이, 한정된 비트 범위에서 스펙트럼의 에너지 정보를 부호화하는데 소요되는 비트수를 감소시킴으로써 스펙트럼의 실제 주파수 성분을 부호화하는데 소요되는 비트수를 증가시킬 수 있는 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 신호 복호화방법 및 장치와 이를 채용한 멀티미디어 기기에 관한 것이다.
오디오 신호 혹은 스피치 신호 신호의 부호화시 스펙트럼의 실제 주파수 성분 이외에 에너지 혹은 엔벨로프와 같은 부가정보가 비트스트림에 포함될 수 있다. 이때, 손실을 최소화하면서 부가정보의 부호화에 할당되는 비트수를 감소시킴으로써, 스펙트럼의 주파수 성분의 부호화에 할당되는 비트수를 증가시킬 수 있다.
즉, 오디오 신호 혹은 스피치 신호를 부호화하거나 복호화하는 경우, 특히 낮은 비트율에서 한정된 비트를 효율적으로 이용함으로써, 해당 비트 범위에서 최상의 음질을 갖는 오디오 신호 혹은 스피치 신호를 복원하는 것이 요구된다.
본 발명이 해결하고자 하는 과제는 복잡도의 증가 및 복원된 음질의 열화없이, 한정된 비트 범위에서 스펙트럼의 에너지 혹은 엔벨로프를 부호화하는데 소요되는 비트수를 감소시키는 반면 스펙트럼의 실제 주파수 성분을 부호화하는데 소요되는 비트수를 증가시킬 수 있는 에너지 무손실 부호화방법, 신호 부호화방법, 에너지 무손실 복호화방법 및 신호 복호화방법을 제공하는데 있다.
본 발명이 해결하고자 하는 다른 과제는 복잡도의 증가 및 복원된 음질의 열화없이, 한정된 비트 범위에서 스펙트럼의 에너지를 부호화하는데 소요되는 비트수를 감소시키는 반면 스펙트럼의 실제 주파수 성분을 부호화하는데 소요되는 비트수를 증가시킬 수 있는 에너지 무손실 부호화장치, 신호 부호화장치, 에너지 무손실 복호화장치 및 신호 복호화장치를 제공하는데 있다.
본 발명이 해결하고자 하는 다른 과제는 에너지 무손실 부호화방법, 신호 부호화방법, 에너지 무손실 복호화방법 혹은 신호 복호화방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
본 발명이 해결하고자 하는 다른 과제는 에너지 무손실 부호화장치, 신호 부호화장치, 에너지 무손실 복호화장치 혹은 신호 복호화장치를 채용하는 멀티미디어 기기를 제공하는데 있다.
상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 무손실 부호화방법은, 에너지의 양자화 인덱스가 표현되는 범위에 근거하여 제1 부호화방식과 제2 부호화방식 중 하나를 선택하는 단계; 및 상기 선택된 부호화방식을 이용하여 상기 양자화 인덱스를 부호화하는 단계를 포함할 수 있다.
상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 신호 부호화방법은, 시간영역의 오디오신호로부터 생성되는 스펙트럼 계수로부터 밴드 단위로 얻어지는 에너지를 양자화하는 단계; 에너지의 양자화 인덱스를 표현하는 비트수와 상기 에너지의 양자화 인덱스를 라아지 심볼 부호화방식과 스몰 심볼 부호화방식으로 부호화한 결과 발생하는 비트수를 고려하여, 상기 양자화 인덱스의 부호화방식을 선택하여 무손실 부호화하는 단계; 복원된 에너지에 근거하여 상기 밴드 단위로 부호화를 위한 비트를 할당하는 단계; 및 상기 할당된 비트에 근거하여 상기 스펙트럼 계수를 양자화 및 무손실 부호화하는 단계를 포함할 수 있다.
상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 무손실 복호화방법은, 비트스트림에 포함된 에너지의 차분 양자화 인덱스의 부호화 방식을 결정하는 단계; 및 상기 결정된 부호화 방식에 대응하여, 상기 차분 양자화 인덱스를 에너지의 양자화 인덱스가 표현되는 범위에 근거한 제1 복호화방식과 제2 복호화방식 중 하나로 복호화하는 단계를 포함할 수 있다.
상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 무손실 복호화방법은, 비트스트림으로부터 얻어지는 에너지의 부호화된 차분 양자화 인덱스의 부호화방식을 결정하고, 결정된 부호화방식에 대응하여, 상기 부호화된 차분 양자화 인덱스를 라아지 심볼 복호화방식과 스몰 심볼 복호화방식 중 하나로 복호화하는 단계; 상기 복호화된 차분 양자화 인덱스를 역양자화하고, 복원된 에너에 근거하여 상기 밴드 단위로 복호화를 위한 비트를 할당하는 단계; 상기 비트스트림으로부터 얻어지는 스펙트럼 계수를 무손실 복호화하는 단계; 및 상기 무손실 복호화된 스펙트럼 계수를 상기 할당된 비트에 근거하여 역양자화하는 단계를 포함할 수 있다.
에너지를 나타내는 양자화 인덱스 중, 표현 범위가 큰 심볼을 펄스모드와 스케일모드 중 하나로 부호화할 수 있도록 함으로써, 에너지 부호화에 사용되는 비트수를 절감하여 스펙트럼 부호화에 더 많은 비트수를 할당할 수 있다.
도 1은 일실시예에 따른 오디오 부호화장치의 구성을 나타낸 블록도이다.
도 2는 일실시예에 따른 오디오 복호화장치의 구성을 나타낸 블록도이다.
도 3은 일실시예에 따른 에너지 무손실 부호화장치의 구성을 나타낸 블록도이다.
도 4는 도 3에 도시된 제1 무손실 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 5는 실시예에 따른 부호화방식 및 부호화모드를 나타내는 테이블이다.
도 6은 라아지 심볼 부호화방식에서 사용되는 허프만 부호화 테이블의 일예를 나타내는 도면이다.
도 7은 펄스모드에 대한 비트할당의 일예를 나타내는 도면이다.
도 8은 도 3에 도시된 제2 무손실 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 9는 도 8에 도시된 상위비트 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 10은 도 9에 도시된 제1 허프만 모드 부호화부에서 사용되는 컨텍스트들의 그루핑의 일예이다.
도 11은 실시예에 따른 부호화방식을 결정하기 위한 비트 계산 과정을 설명하는 플로우챠트이다.
도 12는 일실시예 따른 에너지 무손실 복호화장치의 구성을 나타낸 블록도이다.
도 13은 도 12에 도시된 제1 무손실 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 14는 도 12에 도시된 제2 무손실 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 15는 도 13에 도시된 상위비트 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 16은 스몰 심볼 부호화방식을 설명하는 도면이다.
도 17은 본 발명의 일실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 18은 본 발명의 다른 실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 19는 본 발명의 다른 실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.
본 발명은 다양한 변환을 가할 수 있고 여러가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 구체적으로 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 기술적 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해될 수 있다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들이 용어들에 의해 한정되는 것은 아니다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 본 발명에서 사용한 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나 이는 당 분야에 종사하는 기술자의 의도, 판례, 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 발명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 본 발명의 실시예들을 첨부 도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은 본 발명의 일실시예에 따른 신호 부호화장치의 구성을 나타낸 블록도이다.
도 1에 도시된 신호 부호화장치(100)는 변환부(110), 에너지 양자화부(120), 에너지 무손실 부호화부(130), 비트할당부(140), 스펙트럼 양자화부(150), 스펙트럼 무손실 부호화부(160) 및 다중화부(170)를 포함할 수 있다. 다중화부(170)는 옵션으로 포함될 수 있으며, 비트 패킹 기능을 수행하는 다른 구성요소로 대체될 수 있다. 또는, 무손실 부호화된 에너지 데이터와 무손실 부호화된 스펙트럼 데이터가 별도의 비트스트림을 형성하여 저장 혹은 전송될 수 있다. 한편, 스펙트럼 양자화 과정 이후 혹은 이전, 에너지값을 이용하여 정규화(normalization)를 수행하는 정규화부(미도시)를 더 구비할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 여기서, 신호는 오디오, 뮤직 혹은 스피치, 혹은 이들의 혼합신호를 나타내는 사운드 등의 미디어 신호를 의미할 수 있으나, 이하에서는 설명의 편의를 위하여 오디오 신호로서 지칭하기로 한다. 신호 부호화장치(100)로 입력되는 시간 도메인의 오디오 신호는 다양한 샘플링 레이트를 가질 수 있고, 샘플링 레이트별로 스펙트럼을 양자화하는데 사용되는 에너지의 밴드 구성이 달라질 수 있다. 이에 따라서, 무손실 부호화가 수행되는 양자화된 에너지의 개수가 변동될 수 있다. 샘플링 레이트의 예로는, 7.2kHz, 8kHz, 13.2kHz, 16.4kHz, 32kHZ, 48kHz 등이 있으며, 이에 한정되는 것은 아니다. 샘플링 레이트 및 타겟 비트율이 결정된 시간 도메인의 오디오 신호는 변환부(110)로 제공될 수 있다.
도 1에 있어서, 변환부(110)는 시간 도메인의 오디오 신호, 예를 들면 PCM(Pulse Code Modulation) 신호를 주파수 도메인으로 변환하여 오디오 스펙트럼을 생성할 수 있다. 이때, 시간/주파수 도메인 변환은 MDCT(Modified Discrete Cosine Transform) 등과 같은 공지된 다양한 방법을 사용하여 수행할 수 있다. 변환부(110)로부터 얻어지는 오디오 스펙트럼의 변환계수들, 예를 들면 MDCT 계수들은 에너지 양자화부(120) 및 스펙트럼 양자화부(150)로 제공될 수 있다.
에너지 양자화부(120)는 변환부(110)로부터 제공되는 변환계수들로부터, 밴드 단위로 에너지를 획득할 수 있다. 밴드는 오디오 스펙트럼의 샘플들을 그루핑한 단위로서, 임계대역을 반영하여 균일 혹은 비균일 길이를 가질 수 있다. 비균일한 경우, 한 프레임에 대하여 시작 샘플에서부터 마지막 샘플에 이르기까지 하나의 밴드에 포함되는 샘플의 개수가 점점 증가하도록 밴드를 설정할 수 있다. 또한 다중 비트율을 지원하는 경우, 서로 다른 비트율에서 대응하는 각 밴드에 포함되는 샘플의 갯수가 동일해지도록 설정할 수 있다. 한 프레임에 포함되는 밴드의 개수 혹은 밴드에 포함되는 샘플의 개수는 미리 결정될 수 있다. 에너지값은 밴드에 포함되는 변환계수들의 엔벨로프를 나타낼 수 있으며, 평균 진폭, 평균 에너지, 파워 혹은 norm 값 등을 의미할 수 있다. 여기서, 밴드는 파라미터 밴드 혹은 스케일 팩터 밴드를 의미할 수 있다.
밴드 b의 에너지 EM(b)는 예를 들어 하기의 수학식 1에 의해 산출될 수 있다.
수학식 1
Figure PCTKR2014008586-appb-M000001
여기서, XM(k)은 스펙트럼 계수를 의미하며, kstart(b) 및 kend(b)는 각각 밴드의 시작 샘플 및 마지막 샘플을 의미한다.
에너지 양자화부(120)는 획득된 에너지에 대하여 양자화를 수행하여 인덱스를 생성할 수 있다. 일실시예에 따르면, 양자화에 앞서, 트랜지언트 모드에서는, 양자화될 에너지를 리오더링함으로써, 예를 들어 우수 서브프레임(인덱스 m=0, 2)에 대응하는 에너지는 주파수가 증가하는 순서가, 기수 서브프레임(인덱스 m=1, 3)에 대응하는 에너지는 주파수가 감소하는 순서가 되도록 리오더링함으로써, 효율적인 차분 에너지 부호화가 가능하도록 한다. 각 프레임에서, 에너지는 양자화 스텝 사이즈, 예를 들면 유니폼 스칼라 양자화기값 qint로 스칼라 양자화될 수 있다. qint는 가변적이며, 예를 들어, 대역폭 및 모드에 근거하여 선택될 수 있다.
에너지의 양자화 인덱스 IM(b)는 예를 들어 하기의 수학식 2에 의해 산출될 수 있다.
수학식 2
Figure PCTKR2014008586-appb-M000002
일실시예에 따르면, 서브 벡터 에너지들의 양자화 인덱스는 차분적으로 부호화될 수 있는데, 이를 위하여 현재 밴드에 대하여 현재 밴드의 양자화 인덱스와 이전 밴드의 양자화 인덱스와의 차이 즉, 차분 인덱스(differential index)를 얻을 수 있다. 이때, 프레임에서 첫번째 밴드는 이전 밴드가 존재하지 않기 때문에 첫번째 밴드의 양자화 인덱스로부터 소정 값을 빼서 차분 인덱스를 얻을 수 있다. 이와 같은 첫번째 밴드의 차분 인덱스 △IM(0), 나머지 밴드의 차분 인덱스 △IM(b)는 예를 들어 하기의 수학식 3에 의해 산출될 수 있다.
수학식 3
Figure PCTKR2014008586-appb-M000003
여기서, Iref 는 기준 밴드 에너지에 해당하며, 24로 설정될 수 있다.
일실시예에 따르면, 차분 인덱스 △IM(b)는 소정 범위, 예를 들어 [-256, 256]의 범위로 제한될 수 있다. 이는 하기의 수학식 4에서와 같이 우선 음수의 차분 인덱스를 조정한 후 양수의 차분 인덱스를 조정함으로써 달성할 수 있다.
수학식 4
Figure PCTKR2014008586-appb-M000004
에너지 무손실 부호화부(130)는 에너지 양자화부(120)로부터 제공되는 인덱스, 차분 인덱스 혹은 제한된 차분 인덱스에 대하여 무손실 부호화를 수행할 수 있다. 일실시예에 따르면, 에너지 무손실 부호화부(130)는 차분 인덱스를 표현할 수 있는 능력(capability) 혹은 범위(range)와 비트 소비(bit conmsumption)에 따라서 제1 부호화방식과 제2 부호화방식 중 하나를 이용하여 프레임 단위로 무손실 부호화를 수행할 수 있다. 여기서, 제1 부호화 방식은 라아지 심볼 부호화방식(large symbol coding method)으로서, 제2 부호화 방식에서보다 인덱스를 표현할 수 있는 심볼의 갯수가 상대적으로 많은 경우 적용하며, 제2 부호화 방식은 스몰 심볼 부호화방식(small symbol coding method)으로서, 제1 부호화 방식에서보다 인덱스를 표현할 수 있는 심볼의 갯수가 상대적으로 적은 경우 적용될 수 있다. 부호화 방식으로서 라아지 심볼 부호화방식이 선택된 경우, 밴드 에너지는 펄스 모드와 스케일 모드 중 하나로 부호화될 수 있다. 부호화 방식으로서 스몰 심볼 부호화방식이 선택된 경우, 상위비트와 하위비트로 구분하여 부호화를 수행하며, 상위비트는 컨텍스트 기반 허프만 부호화 모드와 리사이즈드 허프만 부호화 모드 중 하나로 부호화되고, 하위비트는 비트패킹에 의해 처리될 수 있다. 부호화 방식을 나타내는 부호화 방식 인덱스 즉, 플래그 비트(DENG_CMODE)와, 각 부호화 방식에서 부호화 모드를 나타내는 부호화 모드 인덱스, 즉 플래그 비트(LC_MODE)는 비트스트림에 부가정보로서 포함되어 디코더단으로 전송될 수 있다. 이와 같은 에너지 혹은 엔벨로프 부호화 모드는 도 5에서와 같이 나타낼 수 있다.
일실시예에 따르면, 에너지 무손실 부호화부(130)는 스몰 심볼 부호화방식에서 컨텍스트 기반 허프만 부호화 모드와 리사이즈드 허프만 부호화 모드 각각의 경우 소비되는 비트량의 추정치에 근거하여 부호화 모드를 선택할 수 있다.
비트할당부(140)는 에너지 양자화부(120)로부터 제공되는 양자화 인덱스에 대하여 역양자화를 수행하여 에너지를 복원할 수 있다. 비트할당부(140)는 타겟 비트율에 따른 전체 비트수에 대하여, 각 밴드 단위로 복원된 에너지를 이용하여 마스킹 임계치를 계산하고, 마스킹 임계치를 이용하여 각 밴드의 지각적 부호화에 필요한 할당 비트수를 정수단위 혹은 소수점 단위로 결정할 수 있다. 구체적으로, 비트할당부(140)는 각 밴드 단위로 복원된 에너지를 이용하여 허용 비트수를 추정하여 비트를 할당하고, 할당 비트수가 허용 비트수를 초과하지 않도록 제한할 수 있다. 이때, 에너지가 큰 밴드에서부터 순차적으로 비트를 할당할 수 있다. 또한, 각 밴드의 에너지에 대하여 각 밴드의 지각적 중요도에 따라서 가중치를 부여함으로써 지각적으로 중요한 밴드에 더 많은 비트가 할당되도록 조정할 수 있다. 지각적 중요도는 일예로 ITU-T G.719 에서와 같은 심리음향 가중을 통하여 결정할 수 있다.
스펙트럼 양자화부(150)는 변환부(110)로부터 제공되는 변환계수들에 대하여, 각 밴드 단위로 결정된 할당 비트수를 이용하여 양자화를 수행하고, 스펙트럼의 양자화 인덱스를 생성할 수 있다.
스펙트럼 무손실 부호화부(160)는 스펙트럼 양자화부(150)로부터 제공되는 스펙트럼의 양자화 인덱스에 대하여 무손실 부호화를 수행할 수 있다. 무손실 부호화 알고리즘의 일예로서, 허프만 부호화 혹은 팩토리얼 펄스 코딩(Factorial Pulse Coding, 이하 FPC라 약함)와 같이 공지된 알고리즘을 사용할 수 있다. 무손실 부호화 결과 얻어지는 데이터는 비트스트림에 포함되어 저장 혹은 전송될 수 있다.
다중화부(170)는 에너지 무손실 부호화부(130)로부터 제공되는 에너지 데이터와 스펙트럼 무손실 부호화부(160)로부터 제공되는 스펙트럼 데이터를 비트스트림으로 생성할 수 있다.
도 2는 본 발명의 일실시예에 따른 오디오 복호화장치의 구성을 나타낸 블록도이다.
도 2에 도시된 오디오 복호화장치(200)는 역다중화부(210), 에너지 무손실 복호화부(220), 에너지 역양자화부(230), 비트 할당부(240), 스펙트럼 무손실 복호화부(250), 스펙트럼 역양자화부(260) 및 역변환부(270)를 포함할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 오디오 부호화장치(100)에서와 마찬가지로 역다중화부(210)옵션으로 구비되며, 비트 언패킹 기능을 수행하는 다른 구성요소로 대체될 수 있다. 한편, 스펙트럼 역양자화 과정 이후 혹은 이전, 에너지값을 이용하여 역정규화(normalization)를 수행하는 역정규화부(미도시)를 더 구비할 수 있다.
도 2에 있어서, 역다중화부(210)는 비트스트림을 파싱하여 부호화된 에너지 데이터는 에너지 무손실 복호화부(220)로, 부호화된 스펙트럼 데이터는 스펙트럼 무손실 복호화부(250)로 각각 제공할 수 있다.
에너지 무손실 복호화부(220)는 부호화된 에너지 데이터에 대하여 무손실 복호화를 수행하여 에너지의 양자화 인덱스를 얻을 수 있다. 일실시예에 따르면, 부호화단에서 차분 부호화가 수행된 경우 차분 양자화 인덱스를 얻을 수 있다. 이와 같이 차분 양자화 인덱스가 얻어진 경우, 하기의 수학식 5에 의해 각 밴드의 양자화 인덱스를 복원할 수 있다.
수학식 5
Figure PCTKR2014008586-appb-M000005
에너지 역양자화부(230)는 에너지 무손실 복호화부(220)로부터 제공되는 에너지의 양자화 인덱스에 대하여 역양자화를 수행하여 에너지를 복원할 수 있다. 구체적으로, 에너지 역양자화부(230)는 에너지의 양자화 인덱스에 양자화 스텝 사이즈, 예를 들면 유니폼 스칼라 양자화기값 qint를 곱하여 에너지를 복원할 수 있다.
비트 할당부(240)는 에너지 역양자화부(230)로부터 제공되는 복원된 에너지를 이용하여, 각 주파수 밴드 단위로, 정수 혹은 소수점 단위의 비트 할당을 수행할 수 있다. 구체적으로, 에너지가 큰 밴드에서부터 순차적으로 샘플별로 비트를 할당한다. 즉, 우선적으로 최대 에너지를 갖는 밴드에 대하여 샘플당 비트를 할당하고, 해당 밴드의 에너지를 소정 단위만큼 감소시켜 다른 밴드에 비트를 할당할 수 있도록 우선순위를 변경한다. 이와 같은 과정은 주어진 프레임에서 사용가능한 전체 비트수가 모두 소진할 때까지 반복적으로 수행된다. 비트할당부(240)의 동작은 오디오 부호화장치(100)의 비트할당부(140)와 실질적으로 동일하다.
스펙트럼 무손실 복호화부(250)는 부호화된 스펙트럼 데이터에 대하여 무손실 복호화를 수행하여 스펙트럼 양자화 인덱스를 얻을 수 있다.
스펙트럼 역양자화부(260)는 스펙트럼 무손실 복호화부(250)로부터 제공되는 스펙트럼 양자화 인덱스에 대하여 각 밴드 단위로 결정된 할당 비트수를 이용하여 역양자화를 수행하고, 스펙트럼 변환계수를 복원할 수 있다.
역변환부(250)는 스펙트럼 역양자화부(260)로부터 제공되는 스펙트럼 변환계수에 대하여 역변환을 수행하여 시간 도메인의 오디오 신호를 복원할 수 있다.
도 3은 본 발명의 일실시예 따른 에너지 무손실 부호화장치의 구성을 나타낸 블록도이다.
도 3에 도시된 에너지 무손실 부호화장치(300)는 부호화방식 결정부(310), 제1 무손실 부호화부(330) 및 제2 무손실 부호화부(350)를 포함할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 무손실 부호화의 입력은 양자화 인덱스 혹은 차분 양자화 인덱스 어느 것이라도 무방하나, 여기서는 차분 양자화 인덱스를 사용하는 것을 예로 들기로 한다.
도 3에 있어서, 부호화방식 결정부(310)는 차분 양자화 인덱스에 대한 부호화 방식을 제1 부호화방식과 제2 부호화방식 중 하나를 결정할 수 있다. 제1 부호화방식으로 선택된 경우 차분 양자화 인덱스를 제1 무손실 부호화부(330)로 제공할 수 있다. 제2 부호화방식으로 선택된 경우 차분 양자화 인덱스를 제2 무손실 부호화부(350)로 제공할 수 있다. 부호화방식 결정부(310)는 한 프레임의 모든 밴드에 존재하는 어느 하나의 양자화 인덱스라도 소정 범위, 예를 들면 [-32,31] (첫번째 인덱스의 경우 [46,17])로 표현될 수 없는 경우, 양자화 인덱스의 부호화방식을 제1 부호화방식으로 결정할 수 있다. 구체적으로, 제1 부호화방식은 64개보다 더 많은 256 혹은 512 심볼로 표현할 수 있는 데이터를 부호화할 수 있고, 제2 부호화방식은 64개 심볼로 한정되는 데이터를 부호화할 수 있다. 제1 부호화방식을 필요로 하지 않는 경우, 제1 부호화방식과 제2 부호화방식 중 비트 소비가 적은 부호화방식을 선택할 수 있다. 구체적으로, 현재 프레임에서 모든 밴드에 대하여 양자화 인덱스를 제2 부호화방식의 복수개의 모드로 부호화하고, 부호화 결과 사용된 가장 적은 비트와 제1 부호화방식의 수행 결과 사용된 비트를 비교하여, 비교 결과에 따라서 재차 제1 부호화방식과 제2 부호화방식 중 하나로 결정할 수 있다. 부호화방식 결정 결과에 대응하여, 차분 양자화 인덱스의 부호화방식을 나타내는 1 비트의 부가정보(D0)가 생성되어 비트스트림에 포함될 수 있다. 부호화방식 결정부(310)는 부호화방식이 제2 부호화방식으로 결정된 경우, N 비트의 차분 양자화 인덱스에 대하여 N0 비트의 상위비트와 N1 비트의 하위비트로 분리하여 제2 무손실 부호화부(350)로 제공할 수 있다. 여기서, N0는 N-N1으로, N1은 N-N0로 나타낼 수 있다. 일실시예에 따르면, N은 6, N0는 5, N1은 1로 설정할 수 있다.
제1 무손실 부호화부(330)는 부호화방식 결정부(310)에서 제1 부호화방식 즉, 라아지 심볼 부호화방식으로 결정된 경우, 펄스 모드와 스케일 모드 중 하나를 선택하여 양자화 인덱스를 부호화할 수 있다. 펄스 모드는 [-4, 3] 범위를 초과하는 양자화 인덱스가 존재하지 않는 경우 적합할 수 있다. 만약, 이 범위를 초과하는 경우, 펄스 모드는 사용될 수 없고, 대신 스케일 모드가 항상 사용될 수 있다. 또한, 첫번째 인덱스가 [-64, 63] 범위를 초과하는 경우 스케일 모드가 항상 사용될 수 있다. 한편, 라아지 심볼 부호화방식에서는 도 6에서와 같은 8개의 심볼을 갖는 허프만 부호화 테이블에 의한 허프만 부호화 모드가 사용될 수 있다.
펄스 모드에서는 두가지 지시자가 존재할 수 있다. 하나는 첫번째 인덱스가 독립적으로 전송되는지를 나타내는 제1 지시자(indIo)이고, 다른 하나는 범위 [-4, 3]을 초과하는 양자화 인덱스 즉, 펄스가 존재하는지를 나타내는 제2 지시자(indpls)이다. 만약, 첫번째 인덱스가 범위 [-4, 3]내에 존재하는 경우 제1 지시자는 0으로 설정되고, 첫번째 인덱스는 다른 인덱스와 함께 도 6에 도시된 허프만 테이블을 이용하여 허프만 부호화될 수 있다. 한편, 첫번째 인덱스가 범위 [-4, 3]를 벗어나는 경우 제1 지시자는 1로 설정되고, 첫번째 인덱스에 64를 가산한 다음 7 비트를 이용하여 패킹될 수 있다.
한편, 현재 프레임에 펄스가 존재하는 경우, 제2 지시자는 1로 설정되고, 펄스 위치(plspos) 및 펄스 크기(plsamp)는 각각 5비트와 7비트를 이용하여 전송될 수 있다. 이후, 다른 모든 인덱스들은 도 6에서와 같은 허프만 테이블을 이용하여 부호화될 수 있다. 펄스모드에서의 비트할당의 일예는 도 7에 도시된 바와 같다. 도 7에 있어서, cmd0는 부호화방법을 나타내고, cmd1는 펄스모드 혹은 스케일모드를 나타내고, △IM(0)는 첫번째 인덱스를 나타낸다.
스케일 모드에서는 모든 인덱스들의 최대 및 최소에 따라서 인덱스들을 3개의 상위비트와 몇개의 하위비트로 스플릿될 수 있다. 3개의 상위비트는 도 6에서와 같은 허프만 테이블을 이용하여 부호화될 수 있고, 하위비트는 패킹될 수 있다. 하위비트의 갯수는 bitshift로 정의될 수 있다. bitshift는 양자화 인덱스를 스케일함으로써 모든 양자화 인덱스가 범위 [-4, 3]내에 들어가도록 산출될 수 있다. 스케일링 결과, 모든 양자화 인덱스는 3비트로 표현될 수 있다.
제2 무손실 부호화부(350)는 차분 양자화 인덱스에 대하여 상위비트와 하위비트로 분리하여, 상위비트에 대해서는 허프만 부호화모드를 적용하고, 하위비트에 대해서는 비트패킹으로 처리할 수 있다.
도 4는 도 3에 도시된 제1 무손실 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 4에 도시된 제1 무손실 부호화부(400)는 펄스모드 부호화부(410)와 스케일 모드 부호화부(430)로 구성될 수 있다.
도 4를 참조하면, 펄스모드 부호화부(410)는 입력되는 차분 양자화 인덱스 벡터 중에 일부분의 데이터가 유한 영역의 표현 범위를 벗어나게 될 때 효율적으로 활용될 수 있는 모드로서, 그 일부분의 데이터 즉, 펄스를 다르게 부호화하고, 나머지 데이터는 허프만 부호화모드로 부호화하는 것이다. 구체적으로, 펄스 모드는 첫번째 양자화 인덱스를 분리하여 전송할지 여부에 대한 정보와 전송하도록 결
정된 경우 첫번째 양자화 인덱스 △IM(0), 펄스의 유무에 대한 정보, 펄스가 존재하는 경우 펄스의 위치 및 크기에 대한 정보를 부가정보로 전송하게 된다. 이러한 방식으로 전송되지 않는 나머지 양자화 인덱스는 허프만 부호화 방식에 근거하여 전송되게 된다.
스케일 모드 부호화부(430)는 차분 양자화 인덱스 벡터가 다수개의 큰 값을 가지게 될 때 활용될 수 있는 모드로서, 모든 벡터들을 허프만 부호화 모드로 표현 가능한 범위로 값을 줄여서 상위비트로 할당하고, 줄이는 과정에서 제거된 비트들로 하위비트를 구성하는 것이다. 구체적으로, 스케일 모드는 입력되는 차분 양자화 인덱스 벡터의 모든 값들을 스케일링하여 허프만 부호화방식으로 전송 가능한 범위로 줄이고, 스케일링을 위하여 라이트 쉬프트된 비트 갯수를 스케일 정보로 전송하고, 스케일링시 제거되는 하위비트들, 예를 들면 최하위비트는 비트 패킹을 통해 전송되고, 스케일링을 통하여 감소된 값들은 허프만 부호화 방식에 근거하여 전송되게 된다.
도 8은 도 3에 도시된 제2 무손실 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 8에 도시된 제2 무손실 부호화부(800)는 상위비트 부호화부(810)와 하위비트 부호화부(830)로 구성될 수 있다.
도 8을 참조하면, 상위비트 부호화부(810)는 차분 양자화 인덱스의 상위비트를 부호화할 수 있고, 하위비트 부호화부(830)는 차분 양자화 인덱스의 하위비트를 패킹 처리할 수 있다.
여기서, 차분 양자화 인덱스는 상위비트와 하위비트로 스플릿되기 이전에, 첫번째 밴드에는 46를, 다른 밴드에는 32를 더하여 양수의 값을 갖도록 조정될 수 있다. 구체적으로, 수학식 4에 의해 얻어진 차분 양자화 인덱스는 첫번째 밴드에 대해서는 46의 옵셋을, 다른 밴드에는 32의 옵셋을 더하여 [0, 63]의 범위로 제한시킬 수 있다. 현재 프레임이 트랜지언트 프레임이 아닌 경우 제한된 차분 양자화 인덱스가 [0, 63]의 범위를 초과하고, 현재 프레임이 트랜지언트 프레임인 경우 제한된 차분 양자화 인덱스가 [0, 31]의 범위를 초과할 경우, 라아지 심볼 부호화방식을 이용하도록 한다.
구체적으로, 상위비트 부호화부(810)는 N0 비트로 표현되는 상위비트에 대하여 2N0개의 심볼을 구성하고, 복수개의 허프만 부호화 모드 중 적은 비트가 소요되는 모드로 부호화할 수 있다. 상위비트 부호화부(810)는 예를 들면 2가지의 허프만 부호화 모드를 가질 수 있다. 이 경우, 상위비트의 부호화모드를 나타내는 1 비트의 부가정보(D1)가 생성되어 부호화방식을 나타내는 1 비트의 부가정보(D0)와 함께 비트스트림에 포함될 수 있다.
한편, 하위비트 부호화부(830)는 N1 비트로 표현되는 하위비트에 대하여 비트패킹방식을 적용하여 부호화를 수행할 수 있다. 하나의 프레임이 Nb개의 밴드로 이루어지는 경우, 전체 N1×Nb개의 비트를 사용하여 하위비트를 부호화할 수 있다.
도 9는 도 8에 도시된 상위비트 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 9에 도시된 상위비트 부호화부(900)는 제1 허프만 모드 부호화부(910)와 제2 허프만 모드 부호화부(930)로 구성될 수 있다.
도 9를 참조하면, 제1 허프만 모드 부호화부(910)는 컨텍스트 기반 허프만 부호화에 기반하여, 제2 허프만 모드 부호화부(930)는 리사이즈 허프만 부호화에 기반하여 차분 양자화 인덱스의 상위비트를 부호화할 수 있다.
제1 허프만 모드 부호화부(910)는 일실시예에 따르면 컨텍스트로 사용되는 이전 밴드의 차분 양자화 인덱스의 범위를 복수개의 그룹으로 나누고, 각 그룹별로 미리 정해진 허프만 부호화 테이블을 기준으로 하여 현재 밴드의 차분 양자화 인덱스에 대한 허프만 부호화를 수행할 수 있다. 여기서, 허프만 부호화 테이블은 예를 들어 대형 데이터베이스를 이용한 트레이닝 프로세스를 통하여 생성할 수 있으며, 소정의 기준에 의거하여 데이터를 수집하고, 수집된 데이터에 근거하여 생성할 수 있다. 일실시예에 따르면, 이전 밴드의 차분 양자화 인덱스의 범위에 의거하여 현재 밴드의 차분 양자화 인덱스의 빈도수에 대한 데이터를 수집하여 각 그룹별로 허프만 테이블을 생성할 수 있다.
이전 밴드의 차분 양자화 인덱스를 컨텍스트로 사용하여 얻어진 현재 밴드의 차분 양자화 인덱스의 확률 분포에 대한 분석결과를 이용하여, 다양한 분포 모델을 선택할 수 있고, 따라서 유사한 분포모델을 갖는 양자화 레벨의 그룹핑이 수행될 수 있다. 각 그룹 인덱스 0 내지 2의 파라미터는 도 10에 도시된 바와 같이 되어 있다.
한편, 각 그룹에서의 확률 분포를 살펴보면, 그룹 인덱스 0 및 2의 확률 분포가 유사하며, x축에 의해 실질적으로 반전(혹은 플립)됨을 알 수 있다. 이는 부호화 효율에 대한 손실없이, 두개의 그룹 인덱스 0 및 2에 대해서는 동일한 확률 모델을 사용해도 무방함을 의미한다. 즉, 그룹 인덱그 0은 그룹 인덱스 2와 동일한 허프만 테이블을 사용할 수 있다. 이에 따르면, 그룹 인덱스 1에 대한 허프만 부호화 테이블 1 즉, 확률모델 1과, 그룹 인덱스 0 및 2가 공유하는 허프만 테이블 0 즉, 확률 모델 0이 사용될 수 있다. 이때, 그룹 인덱스 0에 대한 코드의 인덱스는 그룹 인덱스 2에 대하여 반대로 표현하면 된다. 즉, 컨텍스트인 이전 밴드의 차분 양자화 인덱스에 의하여 현재 밴드의 차분 양자화 인덱스에 대한 허프만 부호화 테이블이 그룹 인덱스 0으로 결정된 경우, 부호화단에서 현재 밴드의 차분 양자화 인덱스(d(i))는 반전처리 과정 즉, d'(i)=A-d(i)의 값으로 변경되어 그룹 인덱스 2의 허프만 부호화 테이블을 참조하여 허프만 부호화를 수행할 수 있다. 한편, 복호화단에서는 그룹 인덱스 2의 허프만 복호화 테이블을 참조하여 허프만 복호화를 수행한 다음, d'(i)는 d(i)=A-d'(i) 의 변환과정을 거쳐 최종 d(i) 값을 추출하게 된다. 여기서, A 값은 그룹 인덱스 0과 2의 확률 분포가 대칭되도록 만드는 값으로 설정될 수 있다. A 값은 부호화 및 복호화 과정에서 추출되는 것이 아니고, 미리 사전에 최적 값으로 설정될 있다. 한편, 그룹 인덱스 2의 허프만 부호화 테이블 대신에 그룹 0의 허프만 부호화 테이블을 활용하고, 그룹 인덱스 2에서 차분 양자화 인덱스를 변경시켜서 수행할 수도 있다. 일실시예에 따르면, d(i)가 범위 [0,31] 의 값을 가지는 경우, A 값은 31을 사용할 수 있다.
컨텍스트 기반 허프만 부호화 모드를 좀 더 구체적으로 설명하면, 3개 그룹의 차분 양자화 인덱스의 확률분포에 의해 결정된 2가지 허프만 부호화 테이블을 이용한다. 여기서, 현재 밴드의 차분 양자화 인덱스(d(i))를 허프만 부호화함에 있어서, 이전 밴드의 차분 양자화 인덱스(d(i-1))를 컨텍스트로 활용하며, 그룹 인덱스 1에 대한 허프만 테이블 1과 그룹 인덱스 2에 대한 허프만 테이블 0이 사용되는 것을 예로 들기로 한다.
먼저, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는지를 판단한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는 경우, 허프만 테이블 1로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하지 않는 경우, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하는지를 판단한다.
이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하지 않는 경우 즉, 그룹 인덱스 2에 속하는 경우, 허프만 테이블 0로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))이 그룹 인덱스 0에 속하는 경우, 현재 밴드의 차분 양자화 인덱스(d(i))을 반전처리하고, 허프만 테이블 0로부터 반전처리된 현재 밴드의 차분 양자화 인덱스(d'(i))에 대한 코드를 선택한다.
각 선택된 코드를 이용하여 현재 밴드의 차분 양자화 인덱스(d(i))에 대하여 허프만 부호화를 수행한다.
제2 허프만 모드 부호화부(930)는 컨텍스트없이 허프만 부호화를 수행하며, 통상적인 허프만 부호화에 비하여 좀 더 적은 갯수의 심볼로 허프만 부호화 테이블을 구성할 수 있다. 제2 허프만 모드 부호화부(930)는 차분 양자화 인덱스의 완전 복원을 가능하게 하면서 차분 양자화 인덱스의 스팬을 감소시킴으로써 새로운 차분 양자화 인덱스 △I'M(b)를 얻을 수 있다. 현재 밴드의 차분 양자화 인덱스의 스팬은 이전 밴드(preceding band)의 차분 양자화 인덱스와 소정의 임계치에 근거하여 수정될 수 있다. 허프만 부호화를 위한 새로운 차분 양자화 인덱스 △I'M(b)의 범위는 Range = [RangeMin, RangeMax] = [Min (△I'M(b)), Max(I'M(b))], (기서, b는 1,... Nbands-1 이다)와 같이 얻어질 수 있다
이와 같이 얻어진 범위에 근거하여, 범위 차이 RangeDiff는 하기의 수학식 6에서와 같이 산출될 수 있다.
수학식 6
Figure PCTKR2014008586-appb-M000006
제2 허프만 모드 부호화부(930)에서 수행되는 리사이즈드 허프만 부호화는 범위 차이 RangeDiff가 소정 값, 예를 들면 11 이하인 경우 새로운 차분 양자화 인덱스에 대하여 사용될 수 있다. 만약, 범위 차이 RangeDiff가 소정 값보다 큰 경우에는 리사이즈드 허프만 부호화는 사용될 수 없다.
도 11은 무손실 부호화를 위한 코딩 방식 및 코딩 모드를 결정하기 위하여 비트를 계산하는 과정을 나타내는 흐름도로서, 프레임 단위로 동작될 수 있다. 요약하면, 부호화방식 0 즉, 라아지 심볼 부호화방식과 부호화방식 1 즉, 스몰 심볼 부호화방식 각각의 최적 비트를 계산하고, 그 중 적은 값을 갖는 방식으로 결정한다.
도 11에 있어서, 먼저 부호화방식 0 즉, 라아지 심볼 부호화방식에 대하여 설명하면 다음과 같다.
1151 단계에서는 펄스 모드가 가능한지 여부를 확인하고, 펄스 모드가 가능하다면 1153 단계에서 펄스 모드를 수행하여 사용 비트(ebit0)을 계산한 다음, 이어 스케일 모드를 수행하여 사용 비트(ebit1)을 계산한다. 한편, 1155 단계에서는 펄스 모드가 가능하지 않다면 스케일 모드를 수행하여 사용 비트(ebit1)을 계산한다. 1157 단계에서는 ebit0와 ebit1 중 적은 값을 ebit로 할당하여, 적은 값에 대응하는 부호화 모드를 부호화방식 0의 부호화 모드로서 결정한다.
다음, 부호화방식 1 즉, 스몰 심볼 부호화방식에 대하여 설명하면 다음과 같다.
1110 단계에서는 부호화방식 1이 가능한지 여부를 확인하고, 차분 양자화 인덱스가 부호화방식 1이 가능한 입력으로 구성되어 있는 경우 필요 비트를 계산하게 된다. 예를 들어, N=6 (N0=5, N1=1)비트로 표현 가능한 값인지를 확인하여, 6비트로 표현 가능하지 않은 값인 경우에는 라아지 심볼 부호화방식으로 결정하여 사용사용비트를 구하고(1171 단계), 부호화방식 비트를 0으로 설정한 후 ebit에 대응하는 정보를 비트스트림에 저장한다. 한편, 6비트로 표현 가능한 값인 경우, 1131 및 1133 단계에서는 허프만 부호화 모드 0과 허프만 부호화 모드 1을 각각 수행하여 사용 비트(hbit0, hbit1)를 계산한다. 1135 단계에서는 hbit0와 hbit1 중 적은 값을 hbit로 할당하여, 적은 값에 대응하는 부호화 모드를 부호화방식 1의 부호화 모드로서 결정한다. 여기서, hbit 산출시 부호화모드를 나타내는 1 비트와 하위 비트 부호화에 사용되는 비트, Nb가 20인 경우 20비트를 더 고려할 수 있다.
1173 단계에서는 1135 단계에서 계산된 hbit와 1157 단계에서 계산된 ebit 중 적은 비트를 사용하는 부호화방식을 결정하고 이에 대응하여 부호화방식 비트를 설정하게 된다.
도 12는 본 발명의 일실시예 따른 에너지 무손실 복호화장치의 구성을 나타낸 블록도이다.
도 12에 도시된 에너지 무손실 복호화장치(1200)는 복호화방식 결정부(1210), 제1 무손실 복호화부(1230) 및 제2 무손실 복호화부(1250)를 포함할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다.
도 12에 있어서, 복호화방식 결정부(1210)는 비트스트림을 파싱하여 부가정보로부터 부호화방식과 부호화모드에 대한 정보를 얻을 수 있다. 즉, 부호화방식과 관련된 플래그 비트로부터 라아지 심볼 복호화방식과 스몰 심볼 복호화방식 중 하나를 결정할 수 있다. 만약, 라아지 심볼 복호화방식으로 결정된 경우, 전송된 차분 양자화 인덱스는 제1 무손실 복호화부(1230)로, 스몰 심볼 복호화방식으로 결정된 경우, 전송된 차분 양자화 인덱스는 제2 무손실 복호화부(1250)로 제공할 수 있다.
제1 무손실 복호화부(1230)는 복호화방식 결정부(1210)로부터 제공된 차분 양자화 인덱스를 라아지 심볼 복호화방식에 근거하여 복호화를 수행할 수 있다. 라아지 심볼 복호화방식에 근거한 무손실 복호화를 위하여, 무손실 부호화시의 펄스모드 혹은 스케일모드의 역처리를 사용할 수 있다.
제2 무손실 복호화부(1250)에 있어서 복호화방식 결정부(1210)로부터 제공된 차분 양자화 인덱스를 스몰 심볼 복호화방식에 근거하여 복호화를 수행할 수 있다. 이를 위하여, 차분 양자화 인덱스의 상위비트와 하위비트에 대하여 별도로 무손실 복호화를 수행할 수 있다.
도 13은 도 12에 도시된 제1 무손실 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 13에 도시된 제1 무손실 복호화부(1300)는 펄스모드 복호화부(1310)와 스케일 모드 복호화부(1330)로 구성될 수 있다.
도 13을 참조하면, 펄스모드 복호화부(1310)는 비트스트림에 포함된 부호화모드와 관련된 플래그 비트로부터 펄스모드로 결정된 경우 차분 양자화 인덱스를 복호화하며, 도 4의 펄스모드 부호화부(410)의 역과정을 수행할 수 있다.
스케일 모드 복호화부(1330)는 비트스트림에 포함된 부호화모드와 관련된 플래그 비트로부터 스케일모드로 결정된 경우 차분 양자화 인덱스를 복호화하며, 도 4의 스케일모드 부호화부(430)의 역과정을 수행할 수 있다.
도 14는 도 12에 도시된 제2 무손실 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 14에 도시된 제2 무손실 복호화부(1400)는 상위비트 복호화부(1410)와 하위비트 복호화부(1430)로 구성될 수 있다.
도 14를 참조하면, 상위비트 복호화부(1410)는 차분 양자화 인덱스의 상위비트를 복호화할 수 있고, 하위비트 복호화부(1430)는 차분 양자화 인덱스의 하위비트를 언패킹하여 복원된 하위비트를 얻을 수 있다.
도 15는 도 14에 도시된 상위비트 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.
도 15에 도시된 상위비트 복호화부는 제1 허프만 모드 복호화부(1510)와 제2 허프만 모드 복호화부(1530)로 구성될 수 있다.
도 15를 참조하면, 제1 허프만 모드 복호화부(1510)는 컨텍스트 기반 허프만 복호화에 기반하여, 제2 허프만 모드 복호화부(1530)는 리사이즈 허프만 복호화에 기반하여 차분 양자화 인덱스의 상위비트를 복호화할 수 있다.
구체적으로, 비트스트림에 포함된 부호화방식과 관련된 플래그 비트가 스몰 부호화방식을 나타내는 경우, 부호화모드와 관련된 플래그 비트를 추출할 수 있다. 부호화모드는 컨텍스트 기반 허프만 부호화모드와 리사이즈드 허프만 부호화모드 중 하나일 수 있다.
제1 허프만 모드 복호화부(1510)는 일실시예에 따르면 도 9의 제1 허프만 모드 부호화부(910)에서와 마찬가지로, 3개 그룹의 차분 양자화 인덱스의 확률분포에 의해 결정된 2가지 허프만 복호화 테이블을 이용한다. 여기서, 현재 밴드의 차분 양자화 인덱스(d(i))를 허프만 복호화함에 있어서, 이전 밴드의 차분 양자화 인덱스(d(i-1))를 컨텍스트로 활용하며, 그룹 인덱스 1에 대한 허프만 복호화 테이블 1과 그룹 2에 대한 허프만 복호화 테이블 0이 사용되는 것을 예로 들기로 한다.
먼저, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는지를 판단한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는 경우, 허프만 복호화 테이블 1로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 한편, 이전 밴드의 차분 양자화 인덱스d(i-1))이 그룹 인덱스 1에 속하지 않는 경우, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하는지를 판단한다.
이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하지 않는 경우 즉, 그룹 인덱스 2에 속하는 경우, 허프만 복호화 테이블 0로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 한편, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하는 경우, 현재 밴드의 차분 양자화 인덱스(d(i))을 반전처리하고, 허프만 복호화 테이블 0로부터 반전처리된 현재 밴드의 차분 양자화 인덱스(d'(i))에 대한 코드를 선택한다.
각 선택된 코드를 이용하여 현재 밴드의 차분 양자화 인덱스(d(i))에 대하여 허프만 복호화를 수행한다.
제2 허프만 모드 복호화부(1530)는 일실시예에 따르면 도 9의 제2 허프만 모드 부호화부(930)에서와 마찬가지로, 현재 프레임이 트랜지언트 프레임인지 여부에 따라서 서로 다른 방식으로 차분 양자화 인덱스에 대하여 허프만 복호화를 수행할 수 있다.
도 16은 제1 부호화방식 즉, 스몰 심볼 부호화방식에 의해 부호화되는 에너지 양자화 인덱스를 설명하는 도면으로서, N은 6, N0는 5, N1은 1인 경우를 예로 든 것이다. 도 16을 참조하면, 상위 5 비트는 허프만 부호화 모드를 사용하고, 하위 1 비트는 단순히 비트를 패킹할 수 있다.
도 17은 본 발명의 일실시예에 따른 부호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 17에 도시된 멀티미디어 기기(1700)는 통신부(1710)와 부호화모듈(1730)을 포함할 수 있다. 또한, 부호화 결과 얻어지는 오디오 비트스트림의 용도에 따라서, 오디오 비트스트림을 저장하는 저장부(1750)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1700)는 마이크로폰(1770)을 더 포함할 수 있다. 즉, 저장부(1750)와 마이크로폰(1770)은 옵션으로 구비될 수 있다. 한편, 도 17에 도시된 멀티미디어 기기(1700)는 임의의 복호화모듈(미도시), 예를 들면 일반적인 복호화 기능을 수행하는 복호화모듈 혹은 본 발명의 일실시예에 따른 복호화모듈을 더 포함할 수 있다. 여기서, 부호화모듈(1730)은 멀티미디어 기기(1700)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다.
도 17을 참조하면, 통신부(1710)는 외부로부터 제공되는 오디오와 부호화된비트스트림 중 적어도 하나를 수신하거나, 복원된 오디오와 부호화모듈(1730)의 부호화결과 얻어지는 오디오 비트스트림 중 적어도 하나를 송신할 수 있다.
통신부(1710)는 무선 인터넷, 무선 인트라넷, 무선 전화망, 무선 랜(LAN), 와이파이(Wi-Fi), 와이파이 다이렉트(WFD, Wi-Fi Direct), 3G(Generation), 4G(4 Generation), 블루투스(Bluetooth), 적외선 통신(IrDA, Infrared Data Association), RFID(Radio Frequency Identification), UWB(Ultra WideBand), 지그비(Zigbee), NFC(Near Field Communication)와 같은 무선 네트워크 또는 유선 전화망, 유선 인터넷과 같은 유선 네트워크를 통해 외부의 멀티미디어 기기와 데이터를 송수신할 수 있도록 구성된다.
부호화모듈(1730)은 일실시예에 따르면, 통신부(1710) 혹은 마이크로폰(1770)을 통하여 제공되는 시간 도메인의 오디오 신호를 주파수 도메인의 오디오 스펙트럼으로 변환하고, 주파수 도메인의 오디오 스펙트럼으로부터 얻어지는 에너지 양자화 인덱스의 부호화 방법을 라아지 심볼 부호화방식과 스몰 심볼 부호화방식 중 하나로 결정하고, 부호화방식 결정 결과에 대응하여, 에너지 양자화 인덱스를 부호화할 수 있다. 구체적으로, 부호화방식을 결정함에 있어서 차분 코딩이 적용되는 경우, 현재 프레임에 포함된 모든 밴드의 차분 양자화 인덱스가 소정 비트로 표현되는지에 따라서, 라아지 심볼 부호화방식과 스몰 심볼 부호화방식 중 하나로 결정할 수 있다. 한편, 현재 프레임에 포함된 모든 밴드의 차분 양자화 인덱스가 소정 비트로 표현되더라도, 차분 양자화 인덱스를 라아지 심볼 부호화방식으로 부호화한 결과와 스몰 심볼 부호화방식으로 부호화한 결과에 따라서, 라아지 심볼 부호화방식과 스몰 심볼 부호화방식 중 비트소비가 적은 방식을 선택할 수 있다. 여기서, 라아지 심볼 부호화방식은 펄스모드와 스케일 모드를 포함할 수 있다. 스몰 심볼 부호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 분리하여 부호화를 수행하며, 상위비트는 복수의 허프만 부호화 모드를 포함할 수 있고, 하위비트는 비트패킹을 사용할 수 있다. 차분 양자화 인덱스에 대하여 결정된 부호화 방식과 부호화 모드는 부가정보로 생성할 수 있다.
저장부(1750)는 부호화 모듈(1730)에서 생성되는 부호화된 비트스트림을 저장할 수 있다. 한편, 저장부(1750)는 멀티미디어 기기(1700)의 운용에 필요한 다양한 프로그램을 저장할 수 있다.
마이크로폰(1770)은 사용자 혹은 외부의 오디오신호를 부호화모듈(1730)로 제공할 수 있다.
도 18은 본 발명의 일실시예에 따른 복호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 18에 도시된 멀티미디어 기기(1800)는 통신부(1810)와 복호화모듈(1830)을 포함할 수 있다. 또한, 복호화 결과 얻어지는 복원된 오디오신호의 용도에 따라서, 복원된 오디오신호를 저장하는 저장부(1850)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1800)는 스피커(1870)를 더 포함할 수 있다. 즉, 저장부(1850)와 스피커(1870)는 옵션으로 구비될 수 있다. 한편, 도 18에 도시된 멀티미디어 기기(1800)는 임의의 부호화모듈(미도시), 예를 들면 일반적인 부호화 기능을 수행하는 부호화모듈 혹은 본 발명의 일실시예에 따른 부호화모듈을 더 포함할 수 있다. 여기서, 복호화모듈(1830)은 멀티미디어 기기(1800)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나의 이상의 프로세서(미도시)로 구현될 수 있다.
도 18을 참조하면, 통신부(1810)는 외부로부터 제공되는 부호화된 비트스트림과 오디오 신호 중 적어도 하나를 수신하거나 복호화 모듈(1830)의 복호화결과 얻어지는 복원된 오디오 신호와 부호화결과 얻어지는 오디오 비트스트림 중 적어도 하나를 송신할 수 있다. 한편, 통신부(1810)는 도 17의 통신부(1710)와 실질적으로 유사하게 구현될 수 있다.
복호화 모듈(1830)은 일실시예에 따르면, 통신부(1810)를 통하여 제공되는 비트스트림을 수신하고, 비트스트림에 포함된 부가정보에 근거하여 에너지의 차분 양자화 인덱스의 부호화 방식 및 부호화 모드를 판단하고, 부호화 방식 및 부호화 모드 판단 결과에 대응하여, 차분 양자화 인덱스를 복호화할 수 있다. 라아지 심볼 복호화 방식은 펄스모드와 스케일 모드를 포함할 수 있다. 스몰 심볼 복호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 분리하여 복호화를 수행하며, 상위비트는 복수의 허프만 복호화 모드를 포함할 수 있고, 하위비트는 비트언패킹을 사용할 수 있다.
저장부(1850)는 복호화 모듈(1830)에서 생성되는 복원된 오디오신호를 저장할 수 있다. 한편, 저장부(1850)는 멀티미디어 기기(1800)의 운용에 필요한 다양한 프로그램을 저장할 수 있다.
스피커(1870)는 복호화 모듈(1830)에서 생성되는 복원된 오디오신호를 외부로 출력할 수 있다.
도 19는 본 발명의 일실시예에 따른 부호화모듈과 복호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.
도 19에 도시된 멀티미디어 기기(1900)는 통신부(1910), 부호화모듈(1920)과 복호화모듈(1930)을 포함할 수 있다. 또한, 부호화 결과 얻어지는 오디오 비트스트림 혹은 복호화 결과 얻어지는 복원된 오디오신호의 용도에 따라서, 오디오 비트스트림 혹은 복원된 오디오신호를 저장하는 저장부(1940)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1900)는 마이크로폰(1950) 혹은 스피커(1960)를 더 포함할 수 있다. 여기서, 부호화모듈(1920)과 복호화모듈(1930)은 멀티미디어 기기(1900)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다.
도 19에 도시된 각 구성요소는 도 17에 도시된 멀티미디어 기기(1700)의 구성요소 혹은 도 18에 도시된 멀티미디어 기기(1800)의 구성요소와 중복되므로, 그 상세한 설명은 생략하기로 한다.
도 17 내지 도 19에 도시된 멀티미디어 기기(1700, 1800, 1900)에는, 전화, 모바일 폰 등을 포함하는 음성통신 전용단말, TV, MP3 플레이어 등을 포함하는 방송 혹은 음악 전용장치, 혹은 음성통신 전용단말과 방송 혹은 음악 전용장치의 융합 단말장치가 포함될 수 있으나, 이에 한정되는 것은 아니다. 또한, 멀티미디어 기기(1700, 1800, 1900)는 클라이언트, 서버 혹은 클라이언트와 서버 사이에 배치되는 변환기로서 사용될 수 있다.
한편, 멀티미디어 기기(1700, 1800, 1900)가 예를 들어 모바일 폰인 경우, 도시되지 않았지만 키패드 등과 같은 유저 입력부, 유저 인터페이스 혹은 모바일 폰에서 처리되는 정보를 디스플레이하는 디스플레이부, 모바일 폰의 전반적인 기능을 제어하는 프로세서를 더 포함할 수 있다. 또한, 모바일 폰은 촬상 기능을 갖는 카메라부와 모바일 폰에서 필요로 하는 기능을 수행하는 적어도 하나 이상의 구성요소를 더 포함할 수 있다.
한편, 멀티미디어 기기(1700, 1800, 1900)가 예를 들어 TV인 경우, 도시되지 않았지만 키패드 등과 같은 유저 입력부, 수신된 방송정보를 디스플레이하는 디스플레이부, TV의 전반적인 기능을 제어하는 프로세서를 더 포함할 수 있다. 또한, TV는 TV에서 필요로 하는 기능을 수행하는 적어도 하나 이상의 구성요소를 더 포함할 수 있다.
상기 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예들에서 사용될 수 있는 데이터 구조, 프로그램 명령, 혹은 데이터 파일은 컴퓨터로 읽을 수 있는 기록매체에 다양한 수단을 통하여 기록될 수 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함할 수 있다. 컴퓨터로 읽을 수 있는 기록매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 또한, 컴퓨터로 읽을 수 있는 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 전송 매체일 수도 있다. 프로그램 명령의 예로는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
이상과 같이 본 발명의 일실시예는 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명의 일실시예는 상기 설명된 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 스코프는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 이의 균등 또는 등가적 변형 모두는 본 발명 기술적 사상의 범주에 속한다고 할 것이다.

Claims (17)

  1. 에너지의 양자화 인덱스가 표현되는 범위에 근거하여 제1 부호화방식과 제2 부호화방식 중 하나를 선택하는 단계; 및
    상기 선택된 부호화방식을 이용하여 상기 양자화 인덱스를 부호화하는 단계를 포함하는 무손실 부호화방법.
  2. 제1 항에 있어서, 상기 방법은 프레임 단위로 수행되는 무손실 부호화방법.
  3. 제1 항에 있어서, 상기 부호화 방식 선택단계는 차분 부호화가 적용되는 경우,
    현재 프레임에 포함된 모든 밴드의 적어도 하나의 차분 양자화 인덱스가 소정 비트로 표현되지 않는 경우, 상기 제1 부호화방식을 선택하는 단계;
    상기 현재 프레임에 포함된 모든 밴드의 차분 양자화 인덱스가 소정 비트로 표현되는 경우, 상기 제1 부호화방식과 상기 제2 부호화방식 중 적은 비트 소비에 해당하는 방식을 선택하는 단계; 및
    상기 선택된 부호화방식을 나타내는 부가정보를 생성하는 단계를 포함하는 무손실 부호화방법.
  4. 제1 항에 있어서, 상기 제1 부호화방식은 펄스 모드와 스케일 모드를 포함하는 무손실 부호화방법.
  5. 제1 항에 있어서, 상기 펄스 모드와 상기 스케일 모드는 허프만 부호화에 의해 수행되는 무손실 부호화방법.
  6. 제1 항에 있어서, 상기 제2 부호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 나누어 부호화를 수행하는 무손실 부호화방법.
  7. 제6 항에 있어서, 상기 상위비트는 복수개의 허프만 부호화 모드 중 하나를 사용하여 부호화를 수행하고, 상위비트의 부호화모드를 나타내는 부가정보를 생성하는 무손실 부호화방법.
  8. 제7 항에 있어서, 상기 상위비트는 복수개의 허프만 부호화 모드는 컨텍스트를 사용하는 모드와 사용하지 않은 모드를 포함하는 무손실 부호화방법.
  9. 제6 항에 있어서, 상기 하위비트는 비트패킹에 의해 부호화가 수행되는 무손실 부호화방법.
  10. 비트스트림에 포함된 에너지의 차분 양자화 인덱스의 부호화 방식을 결정하는 단계; 및
    상기 결정된 부호화 방식에 대응하여, 상기 차분 양자화 인덱스를 에너지의 양자화 인덱스가 표현되는 범위에 근거한 제1 복호화방식과 제2 복호화방식 중 하나로 복호화하는 단계를 포함하는 무손실 복호화방법.
  11. 제10 항에 있어서, 상기 방법은 프레임 단위로 수행되는 무손실 복호화방법.
  12. 제10 항에 있어서, 상기 제1 복호화방식은 펄스 모드와 스케일 모드를 포함하며, 상기 비트스트림에 포함된 부호화모드에 대응하여 선택되는 무손실 복호화방법.
  13. 제12 항에 있어서, 상기 펄스 모드와 상기 스케일 모드는 허프만 복호화에 의해 수행되는 무손실 복호화방법.
  14. 제10 항에 있어서, 상기 제2 복호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 나누어 복호화를 수행하는 무손실 복호화방법.
  15. 제14 항에 있어서, 상기 상위비트는 상기 비트스트림에 포함된 부호화모드에 대응하여 복수개의 허프만 복호화 모드 중 하나를 사용하여 복호화를 수행하는 무손실 부호화방법.
  16. 제15 항에 있어서, 상기 복수개의 허프만 복호화 모드는 컨텍스트를 사용하는 모드와 사용하지 않은 모드를 포함하는 무손실 복호화방법.
  17. 제14 항에 있어서, 상기 하위비트는 비트언패킹에 의해 복호화가 수행되는 무손실 복호화방법.
PCT/KR2014/008586 2013-09-13 2014-09-15 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 WO2015037961A1 (ko)

Priority Applications (9)

Application Number Priority Date Filing Date Title
EP22197860.4A EP4134951A1 (en) 2013-09-13 2014-09-15 Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
JP2016542648A JP6302071B2 (ja) 2013-09-13 2014-09-15 無損失符号化方法及び無損失復号化方法
CN202010005273.0A CN111179946B (zh) 2013-09-13 2014-09-15 无损编码方法和无损解码方法
EP14844584.4A EP3046105B1 (en) 2013-09-13 2014-09-15 Lossless coding method
US15/021,833 US10468033B2 (en) 2013-09-13 2014-09-15 Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
EP19212262.0A EP3660843B1 (en) 2013-09-13 2014-09-15 Lossless coding method
CN201480062275.6A CN105723454B (zh) 2013-09-13 2014-09-15 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
US16/673,237 US10699720B2 (en) 2013-09-13 2019-11-04 Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
US16/887,021 US10909992B2 (en) 2013-09-13 2020-05-29 Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361877540P 2013-09-13 2013-09-13
US61/877,540 2013-09-13
US201462029736P 2014-07-28 2014-07-28
US62/029,736 2014-07-28

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US15/021,833 A-371-Of-International US10468033B2 (en) 2013-09-13 2014-09-15 Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
US16/673,237 Continuation US10699720B2 (en) 2013-09-13 2019-11-04 Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus

Publications (1)

Publication Number Publication Date
WO2015037961A1 true WO2015037961A1 (ko) 2015-03-19

Family

ID=52665979

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/008586 WO2015037961A1 (ko) 2013-09-13 2014-09-15 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치

Country Status (3)

Country Link
US (1) US10468033B2 (ko)
KR (3) KR102270106B1 (ko)
WO (1) WO2015037961A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10468033B2 (en) 2013-09-13 2019-11-05 Samsung Electronics Co., Ltd. Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
ES2934591T3 (es) 2013-09-13 2023-02-23 Samsung Electronics Co Ltd Procedimiento de codificación sin pérdidas
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US10074378B2 (en) * 2016-12-09 2018-09-11 Cirrus Logic, Inc. Data encoding detection

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080112632A1 (en) * 2006-11-13 2008-05-15 Global Ip Sound Inc Lossless encoding and decoding of digital data
US20090030678A1 (en) * 2006-02-24 2009-01-29 France Telecom Method for Binary Coding of Quantization Indices of a Signal Envelope, Method for Decoding a Signal Envelope and Corresponding Coding and Decoding Modules
KR100903109B1 (ko) * 2006-12-13 2009-06-16 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
KR20120135118A (ko) * 2011-06-01 2012-12-12 삼성전자주식회사 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기
KR20130044193A (ko) * 2011-10-21 2013-05-02 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100354531B1 (ko) 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
IL138230A (en) 1999-01-07 2005-06-19 Koninkl Philips Electronics Nv Efficient coding of side information in a lossless encoder
KR100561869B1 (ko) 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
EP1883067A1 (en) 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101671005B1 (ko) 2007-12-27 2016-11-01 삼성전자주식회사 트렐리스를 이용한 양자화 부호화 및 역양자화 복호화 방법및 장치
JP5097217B2 (ja) 2008-01-24 2012-12-12 日本電信電話株式会社 符号化方法、符号化装置、及びそのプログラムと記録媒体
KR101485339B1 (ko) * 2008-09-29 2015-01-26 삼성전자주식회사 무손실 부호화/복호화 장치 및 방법
CN101615910B (zh) 2009-05-31 2010-12-22 华为技术有限公司 压缩编码的方法、装置和设备以及压缩解码方法
KR101995694B1 (ko) 2011-04-20 2019-07-02 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 허프만 부호화를 실행하기 위한 장치 및 방법
US10468033B2 (en) 2013-09-13 2019-11-05 Samsung Electronics Co., Ltd. Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
ES2934591T3 (es) 2013-09-13 2023-02-23 Samsung Electronics Co Ltd Procedimiento de codificación sin pérdidas
EP3614381A1 (en) 2013-09-16 2020-02-26 Samsung Electronics Co., Ltd. Signal encoding method and device and signal decoding method and device
US10194151B2 (en) 2014-07-28 2019-01-29 Samsung Electronics Co., Ltd. Signal encoding method and apparatus and signal decoding method and apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090030678A1 (en) * 2006-02-24 2009-01-29 France Telecom Method for Binary Coding of Quantization Indices of a Signal Envelope, Method for Decoding a Signal Envelope and Corresponding Coding and Decoding Modules
US20080112632A1 (en) * 2006-11-13 2008-05-15 Global Ip Sound Inc Lossless encoding and decoding of digital data
KR100903109B1 (ko) * 2006-12-13 2009-06-16 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
KR20120135118A (ko) * 2011-06-01 2012-12-12 삼성전자주식회사 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기
KR20130044193A (ko) * 2011-10-21 2013-05-02 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치

Also Published As

Publication number Publication date
KR102401002B1 (ko) 2022-05-23
US20160232903A1 (en) 2016-08-11
KR20210083225A (ko) 2021-07-06
KR20220071162A (ko) 2022-05-31
KR20150031215A (ko) 2015-03-23
US10468033B2 (en) 2019-11-05
KR102270106B1 (ko) 2021-06-28
KR102512359B1 (ko) 2023-03-21

Similar Documents

Publication Publication Date Title
WO2013058634A2 (ko) 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
WO2012165910A2 (ko) 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기
JP6585753B2 (ja) 無損失符号化装置及び無損失復号化装置
WO2013141638A1 (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
KR102401002B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
WO2013115625A1 (ko) 낮은 복잡도로 오디오 신호를 처리하는 방법 및 장치
WO2010090427A2 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
WO2015037969A1 (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
WO2015133795A1 (ko) 대역폭 확장을 위한 고주파 복호화 방법 및 장치
WO2015034115A1 (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
WO2014030938A1 (ko) 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14844584

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016542648

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 15021833

Country of ref document: US

WPC Withdrawal of priority claims after completion of the technical preparations for international publication

Ref document number: 62/029,736

Country of ref document: US

Date of ref document: 20160310

Free format text: WITHDRAWN AFTER TECHNICAL PREPARATION FINISHED

REEP Request for entry into the european phase

Ref document number: 2014844584

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2014844584

Country of ref document: EP