WO2015009040A1 - Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal - Google Patents

Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal Download PDF

Info

Publication number
WO2015009040A1
WO2015009040A1 PCT/KR2014/006406 KR2014006406W WO2015009040A1 WO 2015009040 A1 WO2015009040 A1 WO 2015009040A1 KR 2014006406 W KR2014006406 W KR 2014006406W WO 2015009040 A1 WO2015009040 A1 WO 2015009040A1
Authority
WO
WIPO (PCT)
Prior art keywords
channel signal
signal
lfe
encoding
downmix
Prior art date
Application number
PCT/KR2014/006406
Other languages
French (fr)
Korean (ko)
Inventor
백승권
성종모
이태진
강경옥
서정일
김진웅
이용주
장대영
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to EP14826617.4A priority Critical patent/EP3023984A4/en
Publication of WO2015009040A1 publication Critical patent/WO2015009040A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Definitions

  • the following embodiments relate to an encoder and an encoding method for a multichannel signal, a decoder and a decoding method for a multichannel signal, and more particularly, to a codec for efficiently processing a multichannel signal composed of a plurality of channel signals. .
  • a new technique for compressing / transmitting AV media is needed.
  • ultra-high quality audio content it is important to accurately represent the audio quality and the multi-channel sound field rather than the requirement for backward compatibility.
  • a 22.2 channel audio signal is intended for ultra-high quality audio sound field reproduction, rather than being compressed / transmitted for backwards compatibility, it is a high quality multichannel that can express the inherent sound quality and effect of the content as it is. Audio coding technology is required.
  • the present invention provides an apparatus and method for encoding or decoding a multichannel signal comprising an Lfe channel signal.
  • the present invention provides an apparatus and method for performing a process of performing two steps of encoding / decoding or applying a time delay to one step of encoding / decoding.
  • a method of encoding a multichannel signal includes the steps of: encoding a first general channel signal and a first Lfe channel signal included in a multichannel signal to output a first downmix signal and a first spatial cue; ; Encoding a second general channel signal and a second Lfe channel signal included in the multichannel signal to output a second downmix signal and a second spatial cue; Encoding the first downmix signal and the second downmix signal together; And generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue.
  • the outputting of the first spatial cue may include outputting a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to an Lfe mode.
  • the outputting of the second spatial cue may include outputting a second downmix signal and a second spatial cue by applying parametric coding to the second general channel signal and the second Lfe channel signal according to an Lfe mode, and outputting the first spatial cue.
  • the cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of the first Lfe channel signal or the second Lfe channel signal.
  • CLD channel level difference
  • a method of encoding a multichannel signal includes the steps of: encoding a first general channel signal and a first Lfe channel signal included in a multichannel signal to output a first downmix signal and a first spatial cue; ; Encoding a second general channel signal and a second Lfe channel signal included in the multichannel signal to output a second downmix signal and a second spatial cue; Encoding the first downmix signal; Encoding a second downmix signal separately from the first downmix signal; The method may include generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue.
  • the outputting of the first spatial cue may include outputting a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to an Lfe mode.
  • the outputting of the second spatial cue may include outputting a second downmix signal and a second spatial cue by applying parametric coding to the second general channel signal and the second Lfe channel signal according to an Lfe mode, and outputting the first spatial cue.
  • the cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of the first Lfe channel signal or the second Lfe channel signal.
  • CLD channel level difference
  • a method of encoding a multichannel signal includes: encoding a first Lfe channel signal and a second Lfe channel signal included in a multichannel signal to output a downmix signal and a spatial cue; Encoding the downmix signal; The method may include generating a bitstream including the encoded downmix signal and a spatial cue.
  • the outputting may include outputting a downmix signal and a spatial cue by applying parametric coding to the first Lfe channel signal and the second Lfe channel signal according to an Lfe mode, wherein the spatial cue is a first Lfe channel signal or It may include a CLD (Channel Level Diffenece) output from the Lfe band of the second Lfe channel signal.
  • CLD Chip Level Diffenece
  • a method of encoding a multichannel signal includes applying a time delay to a first Lfe channel signal included in a multichannel signal; Applying a time delay to a second Lfe channel signal included in the multichannel signal; Encoding a first Lfe channel signal to which the time delay is applied; Encoding a second Lfe channel signal to which the time delay is applied; And generating a bitstream including the encoded first Lfe channel signal and a second Lfe channel signal.
  • the time delay may include a time delay generated during encoding of a general channel signal included in the multichannel signal.
  • a method of encoding a multichannel signal includes applying a time delay to a general channel signal included in a multichannel signal; Encoding the normal channel signal to which the time delay has been applied; Outputting a downmix signal and a spatial cue by encoding the Lfe channel signal included in the multichannel signal; And encoding the encoded Lfe channel signal, wherein the time delay may include a time delay generated during the encoding of the Lfe channel signal.
  • the outputting may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
  • a method of decoding a multichannel signal comprising: generating a first downmix signal and a second downmix signal by decoding an encoding result extracted from a bitstream; Decoding the first downmix signal and outputting a first general channel signal and a first Lfe channel signal; And decoding the second downmix signal to output a second general channel signal and a second Lfe channel signal.
  • the outputting of the first general channel signal and the first Lfe channel signal may include applying a first spatial cue to parametric coding to output the first general channel signal and the first Lfe channel signal from the first downmix signal
  • the outputting of the second general channel signal and the second Lfe channel signal may include applying a second spatial cue to parametric coding to output a second general channel signal and a second Lfe channel signal from a second downmix signal
  • the first spatial cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  • CLD channel level difference
  • a method of decoding a multichannel signal comprising: generating a first downmix signal by decoding an encoding result extracted from a bitstream; Decoding another encoding result extracted from the bitstream to generate a second downmix signal; Decoding the first downmix signal and outputting a first general channel signal and a first Lfe channel signal; And outputting a second general channel signal and a second Lfe channel signal by decoding the second downmix signal.
  • the outputting of the first general channel signal and the first Lfe channel signal may include outputting a first general channel signal and a first Lfe channel signal to the first downmix signal using parametric coding based on a first spatial cue.
  • the outputting of the second general channel signal and the second Lfe channel signal may include a second general channel signal and a second Lfe channel signal using parametric coding based on a second spatial cue on the second downmix signal.
  • the first spatial cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  • CLD channel level difference
  • a method of decoding a multichannel signal comprising: generating a downmix signal by decoding an encoding result extracted from a bitstream; And decoding the downmix signal to output a first Lfe channel signal and a second Lfe channel signal.
  • the outputting may include applying a parametric coding based on a spatial cue to the downmix signal to output a first Lfe channel signal and a second Lfe channel signal, and the spatial cue is a first Lfe channel signal or a second Lfe channel signal. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
  • a parametric coding based on a spatial cue to the downmix signal to output a first Lfe channel signal and a second Lfe channel signal
  • the spatial cue is a first Lfe channel signal or a second Lfe channel signal. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
  • CLD channel level difference
  • a decoding method of a multi-channel signal includes: decoding a result of encoding extracted from a bitstream and outputting a first Lfe channel signal; Decoding another encoding result extracted from the bitstream and outputting a second Lfe channel signal; Applying a time delay to the first Lfe channel signal; And applying a time delay to the second Lfe channel signal.
  • the time delay may include a time delay generated in the decoding process of the general channel signal.
  • a decoding method of a multichannel signal includes decoding a general channel signal from a bitstream; Applying a time delay to the decoded general channel signal; Decoding an Lfe channel signal from the bitstream; And decoding the decoded Lfe channel signal.
  • the time delay may include a time delay generated during the decoding of the Lfe channel signal.
  • the decoding of the Lfe channel signal may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
  • the encoder of the multichannel signal encodes the first general channel signal and the first Lfe channel signal included in the multichannel signal, and outputs a first downmix signal and a first spatial cue.
  • a bitstream formatter for generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue.
  • the first encoder outputs a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to Lfe mode, and the first encoder Parametric coding is applied to the second general channel signal and the second Lfe channel signal according to Lfe mode to output a second downmix signal and a second spatial cue, and the first spatial cue and the second spatial cue are first Lfe.
  • CLD Channel Level Diffenece
  • the encoder of the multichannel signal encodes a first general channel signal and a first Lfe channel signal included in the multichannel signal, and outputs a first downmix signal and a first spatial cue.
  • a bitstream formatter for generating a bitstream including the second spatial queue.
  • the first encoder outputs a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to Lfe mode, and the first encoder Parametric coding is applied to the second general channel signal and the second Lfe channel signal according to Lfe mode to output a second downmix signal and a second spatial cue, and the first spatial cue and the second spatial cue are first Lfe.
  • CLD Channel Level Diffenece
  • An encoder of a multichannel signal includes: a first encoding unit for encoding a first Lfe channel signal and a second Lfe channel signal included in a multichannel signal to output a downmix signal and a spatial cue; A second encoding unit encoding the downmix signal; And a bitstream formatter for generating a bitstream including the encoded downmix signal and a spatial cue.
  • the first encoder outputs a downmix signal and a spatial cue by applying parametric coding to the first Lfe channel signal and the second Lfe channel signal according to an Lfe mode, and the spatial cue is a first Lfe channel signal or It may include a CLD (Channel Level Diffenece) output from the Lfe band of the second Lfe channel signal.
  • CLD Chip Level Diffenece
  • the encoder of the multichannel signal applies a time delay to the first Lfe channel signal included in the multichannel signal, and applies a time delay to the second Lfe channel signal included in the multichannel signal.
  • a second encoding unit encoding the first Lfe channel signal to which the time delay is applied and encoding the second Lfe channel signal to which the time delay is applied;
  • a bitstream formatter for generating a bitstream including the encoded first Lfe channel signal and the second Lfe channel signal.
  • the time delay may include a time delay generated during encoding of a general channel signal included in the multichannel signal.
  • An encoder of a multichannel signal includes a delay unit for applying a time delay to a general channel signal included in a multichannel signal; A first encoding unit encoding the general channel signal to which the time delay is applied; A second encoder for encoding an Lfe channel signal included in the multichannel signal and outputting a downmix signal and a spatial cue; And a third encoding unit encoding the encoded Lfe channel signal, wherein the time delay may include a time delay generated during the encoding of the Lfe channel signal.
  • the second encoder may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
  • a decoder of a multi-channel signal includes: a first decoding unit which decodes an encoding result extracted from a bitstream to generate a first downmix signal and a second downmix signal; A second decoding decoding the first downmix signal to output a first general channel signal and a first Lfe channel signal, and decoding the second downmix signal to output a second general channel signal and a second Lfe channel signal It may include wealth.
  • the second decoding unit applies a first spatial cue to parametric coding to output a first general channel signal and a first Lfe channel signal from a first downmix signal, and the second decoding unit may convert a second spatial cue into a parametric coding.
  • the second common channel signal and the second Lfe channel signal are output from the second downmix signal by applying to metric coding, and the first spatial cue and the second spatial cue are Lfe of the first Lfe channel signal or the second Lfe channel signal.
  • Channel Level Diffenece (CLD) output from the band may be included.
  • the decoder of the multi-channel signal decodes an encoding result extracted from a bitstream to generate a first downmix signal, and decodes another encoding result extracted from the bitstream to generate a second downmix signal.
  • a first decoding unit to generate;
  • a second decoding decoding the first downmix signal to output a first general channel signal and a first Lfe channel signal, and decoding the second downmix signal to output a second general channel signal and a second Lfe channel signal It may include wealth.
  • the second decoding unit outputs a first general channel signal and a first Lfe channel signal to the first downmix signal using parametric coding based on a first spatial cue, and the second decoding unit outputs the second down channel.
  • a second normal channel signal and a second Lfe channel signal are output to the mixed signal by using parametric coding based on a second spatial cue, wherein the first spatial cue and the second spatial cue are a first Lfe channel signal or a second Lfe channel signal. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
  • CLD channel level difference
  • a decoder of a multi-channel signal includes: a first decoding unit for decoding a result of encoding extracted from a bitstream to generate a downmix signal; And a second decoder configured to decode the downmix signal to output a first Lfe channel signal and a second Lfe channel signal.
  • the second decoding unit applies a parametric coding based on a spatial cue to the downmix signal to output a first Lfe channel signal and a second Lfe channel signal, and the spatial cue is a first Lfe channel signal or a second Lfe. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
  • CLD channel level difference
  • the decoder of the multi-channel signal decodes an encoding result extracted from the bitstream to output a first Lfe channel signal, and decodes another encoding result extracted from the bitstream to output a second Lfe channel signal.
  • a first decoding unit And a delay unit applying a time delay to the first Lfe channel signal and applying a time delay to the second Lfe channel signal.
  • the time delay may include a time delay generated in the decoding process of the general channel signal.
  • a decoder of a multichannel signal includes a first decoding unit decoding a general channel signal from a bitstream; A delay unit for applying a time delay to the decoded general channel signal; A second decoder to decode an Lfe channel signal from the bitstream; It may include a third decoding unit for decoding the decoded Lfe channel signal.
  • the time delay may include a time delay generated during the decoding of the Lfe channel signal.
  • the second decoding unit may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
  • a multi-channel signal to which synchronization is applied may be output by performing encoding / decoding in two steps or applying a time delay to encoding / decoding in one step.
  • FIG. 1 is a diagram illustrating an encoder and a decoder, according to an exemplary embodiment.
  • FIG. 2 is a diagram illustrating an encoder for encoding a multi-channel signal including an Lfe channel signal according to the first embodiment.
  • FIG. 3 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the second embodiment.
  • FIG. 4 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the third embodiment.
  • FIG. 5 illustrates an encoder for encoding a multichannel signal including an Lfe channel signal according to the fourth embodiment.
  • FIG. 6 illustrates a decoder for decoding the encoded result of FIG. 2.
  • FIG. 7 illustrates a decoder for decoding the encoded result of FIG. 3.
  • FIG. 8 is a diagram illustrating a decoder to decode the encoded result of FIG. 4.
  • FIG. 9 is a diagram illustrating a decoder for decoding the encoded result of FIG. 5.
  • FIG. 10 is a diagram illustrating a process of encoding a multi-channel signal using the encoder of FIG. 2.
  • FIG. 11 is a diagram illustrating a decoder for decoding the encoded result of FIG. 10.
  • FIG. 12 is a diagram illustrating a process of encoding a multichannel signal when sufficient encoding bits are shown in FIG. 10.
  • FIG. 13 is a diagram illustrating a decoder for decoding the encoded result of FIG. 12.
  • FIG. 14 illustrates an example of encoding a multi-channel signal using the encoder of FIG. 4.
  • FIG. 15 illustrates another example of encoding a multichannel signal using the encoder of FIG. 4.
  • FIG. 16 illustrates another example of encoding a multichannel signal using the encoder of FIG. 5.
  • 17 is a diagram illustrating another example of decoding a multichannel signal using the decoder of FIG. 9.
  • FIG. 18 is a diagram illustrating an encoder for encoding a multichannel signal when an Lfe channel signal is odd in a multichannel signal according to an embodiment.
  • FIG. 19 illustrates an encoder for encoding a general audio signal instead of an Lfe channel signal according to an embodiment.
  • FIG. 20 illustrates a decoder for decoding the encoded result of FIG. 19.
  • 21 is a diagram illustrating an encoding process and a decoding process, according to an embodiment.
  • FIG. 22 is a diagram illustrating a USAC encoder and a USAC decoder according to the first embodiment.
  • FIG. 23 is a diagram illustrating a USAC encoder and a USAC decoder according to a second embodiment.
  • FIG. 23 is a diagram illustrating a USAC encoder and a USAC decoder according to a second embodiment.
  • FIG. 1 is a diagram illustrating an encoder and a decoder, according to an exemplary embodiment.
  • the encoder 101 may generate a bitstream by encoding a multichannel signal including a plurality of channel signals.
  • the decoder 101 may then decode the multichannel signal from the bitstream received from the encoder 101 or stored in the medium at the encoder 101.
  • the multi-channel signal may include an Lfe channel signal.
  • the Lfe channel signal refers to a channel signal for selective limited low frequency effects (LFE).
  • LFE low frequency effects
  • the low range may mean a low frequency region up to 20-120 Hz.
  • the Lfe channel signal can be used to supplement the low band information of the main channel signal by carrying additional low band information.
  • FIG. 2 is a diagram illustrating an encoder for encoding a multi-channel signal including an Lfe channel signal according to the first embodiment.
  • FIGS. 2 through 5 illustrate a process of encoding a multi-channel signal including two Lfe channel signals
  • FIGS. 6 through 9 illustrate a process of decoding the encoding results of FIGS. 2 through 5.
  • the encoder may include a first encoding unit 201, a first encoding unit 202, a second encoding unit 203, and a bitstream formatter 204.
  • the first encoding unit 201 and the first encoding unit 202 may perform the same operation.
  • the first encoding unit 201 may generate the downmix signal dmx 1 using the Lfe channel signal Lfe 1 and the general channel signal x i .
  • the general channel signal may mean a channel signal that does not exhibit a low range effect.
  • the first encoding unit 202 may generate the downmix signal dmx 2 using the Lfe channel signal Lfe 2 and the general channel signal x i + 1 . i means the index of the normal channel signal. That is, the encoder of FIG. 2 may encode a multichannel signal in which a general channel signal and an Lfe channel signal are coupled.
  • the first encoding unit 201 and the first encoding unit 202 may output a spatial cue and a downmix signal by performing parametric coding.
  • the first encoding unit 201 and the first encoding unit 202 perform parametric coding using the Lfe channel signal.
  • a spatial cue CLD Choannel Level Difference
  • the spatial cue output through the parametric coding using the Lfe channel signal may output a relatively smaller amount of data than the spatial cue output through the parametric coding that is generally applied.
  • the spatial cues output from the first encoding unit 201 and the first encoding unit 202 are bit1 and bit2, respectively.
  • the second encoding unit 203 may encode using the downmix signal dmx 1 output from the first encoding unit 201 and the downmix signal dmx 2 output from the first encoding unit 202.
  • the downmix signal dmx 1 and the downmix signal dmx 2 may be input to the second encoding unit 203 as a stereo signal.
  • the second encoding unit 203 may be AAC, MP3, or the like.
  • the encoding result of the second encoding unit 203 is output as bit3, and bit3 is input to the bitstream formatter 204.
  • the bitstream formatter 204 can convert bit3 into a bitstream.
  • FIG. 3 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the second embodiment.
  • the encoder of FIG. 3 may include a first encoding unit 301, a second encoding unit 302, a first encoding unit 303, a second encoding unit 304, and a bitstream formatter 305.
  • the first encoding unit 301 and the first encoding unit 303 may operate in the same manner as the first encoding unit 201 and the first encoding unit 202 of FIG. 2. That is, the first encoding unit 301 and the first encoding unit 303 may extract channel level difference (CLD), which is a spatial cue, in the Lfe band by performing parametric coding using the Lfe channel signal.
  • CLD channel level difference
  • the first encoding unit 301 may generate the downmix signal dmx 1 using the Lfe channel signal Lfe 1 and the general channel signal x i .
  • the first encoder 303 may generate the downmix signal dmx 2 using the Lfe channel signal Lfe 2 and the general channel signal x i + 1 .
  • the second encoder 302 may output bit3 using the downmix signal dmx 1 .
  • the downmix signal dmx 2 which is an encoding result of the first encoding unit 303 is input to the second encoding unit 302 as a mono signal.
  • the second encoding unit 304 may output bit4 by using the downmix signal dmx 2 .
  • FIG. 4 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the third embodiment.
  • the encoder may include a first encoding unit 401, a second encoding unit 402, and a bitstream formatter 403.
  • the Lfe channel signals Lfe 1 and Lfe 2 may be coupled to each other and input to the first encoding unit 401.
  • the first encoding unit 401 may output the downmix signal dmx 3 , which is a mono signal, for the Lfe channel signals Lfe 1 and Lfe 2 .
  • bit1 means a spatial cue derived through parametric coding in the first encoding unit 401.
  • the downmix signal dmx 3 may be input to the second encoding unit 402.
  • the second encoding unit 402 may code the Lfe band in the downmix signal dmx 3 .
  • USAC Unified Speech And Audio Codec
  • AAC Advanced Audio Codec
  • Bit2 output from the second encoding unit 402 and bit1 output from the first encoding unit 401 may be output as a bitstream through the bitstream formatter 403.
  • FIG. 5 illustrates an encoder for encoding a multichannel signal including an Lfe channel signal according to the fourth embodiment.
  • the encoder may include a delay unit 501, a second encoding unit 502, a delay unit 503, a second encoding unit 504, and a bitstream formatter 505.
  • 5 illustrates a process of encoding an Lfe channel signal using the second encoding unit 502 and the second encoding unit 504 without passing through the first encoding unit described above.
  • the second encoder 502 and the second encoder 504 may perform parametric coding on the Lfe band.
  • the input signals for the second encoding unit 502 and the second encoding unit 504 need to be delayed corresponding to the case where the first encoding unit is present. If the general channel signals have two encoding processes and the Lfe channel signal has one encoding process, the normal channel signals have one more encoding process, which may cause a time delay due to the encoding process. Because there is. This time delay must be taken into account to generate a synchronized bitstream between the Lfe channel signal and the normal channel signal.
  • delay unit 501 and delay unit 503 are time delays that may occur when encoding is actually performed. ) Can be applied to the Lfe channel signal Lfe 1 and the Lfe channel signal Lfe 2 , respectively. Then, Lfe channel signal Lfe 1 (n- with time delay) ) And Lfe 2 (n- ) May be input to the second encoding unit 502 and the second encoding unit 504, respectively. Bits 1 and 2, which are encoding results of the second encoding unit 502 and the second encoding unit 504, may be output as bitstreams through the bitstream formatter 505, respectively.
  • FIG. 6 illustrates a decoder for decoding the encoded result of FIG. 2.
  • the decoder may include a bitstream formatter 601, a first decoding unit 602, a second decoding unit 603, and a second decoding unit 604.
  • FIG. 6 may operate in an inverse manner to FIG. 2.
  • the bitstream input to the bitstream formatter 601 may be a bitstream generated in FIG. 2.
  • the bitstream formatter 601 may output bit 1, bit 2, and bit 3 from the bitstream.
  • bit 1, bit 2 and bit 3 are the same as described in FIG.
  • bit3 may be input to the first decoding unit 602. Then, the first decoding unit 602 may generate the downmix signals dmx 1 and dmx 2 using bit3. Thereafter, the second decoding unit 603 may parametric code bit1, which is a spatial cue, and the downmix signal dmx 1 , and output the general channel signal x i and the Lfe channel signal Lfe 1 . Similarly, the second decoding unit 604 may output the general channel signal x i + 1 and the Lfe channel signal Lfe 2 by parametric coding the bit2 and the downmix signal dmx 2 which are spatial cues.
  • FIG. 7 illustrates a decoder for decoding the encoded result of FIG. 3.
  • the decoder includes a bitstream formatter 701, a first decoding unit 702, a second decoding unit 703, a first decoding unit 704, and a second decoding unit 705. can do.
  • FIG. 7 may operate in an inverse manner to FIG. 3.
  • the bitstream input to the bitstream formatter 701 may be a bitstream generated in FIG. 3.
  • the bitstream formatter 601 may output bit 1, bit 2, bit 3, and bit 4 from the bitstream.
  • bit 1, bit 2, bit 3, and bit 4 are the same as described in FIG.
  • bit3 may be input to the first decoding unit 702 and bit4 may be input to the first decoding unit 704. Then, the first decoding unit 702 may generate the downmix signal dmx 1 using bit3. The first decoder 704 may generate the downmix signal dmx 2 using bit4.
  • the second decoding unit 703 may output the general channel signal x i and the Lfe channel signal Lfe 1 by parametric coding bit1, which is a spatial cue, and the downmix signal dmx 1 .
  • the second decoding unit 604 may output the general channel signal x i + 1 and the Lfe channel signal Lfe 2 by parametric coding the bit2 and the downmix signal dmx 2 which are spatial cues.
  • FIG. 8 is a diagram illustrating a decoder to decode the encoded result of FIG. 4.
  • the decoder may include a bitstream formatter 801, a first decoding unit 802, and a second decoding unit 803.
  • FIG. 8 may operate in an inverse manner to FIG. 4.
  • the bitstream input to the bitstream formatter 801 may be a bitstream generated in FIG. 4.
  • the bitstream formatter 601 may output bit 1, bit 2, from the bitstream.
  • bit 1 and bit 2 are the same as described in FIG.
  • bit1 may be input to the first decoding unit 802, and bit2 may be input to the second decoding unit 803. Then, the first decoding unit 802 may generate the downmix signal dmx 3 using bit3.
  • the second decoding unit 803 may output Lfe channel signals Lfe 1 and Lfe 2 by parametric coding the spatial cue bit 2 and the downmix signal dmx 3 .
  • the first decoding unit 802 and the second decoding unit 803 may include the input downmix signal dmx 3 . Parametric coding can be performed for the Lfe band.
  • FIG. 9 is a diagram illustrating a decoder for decoding the encoded result of FIG. 5.
  • the decoder may include a bitstream formatter 901, a first decoding unit 902, a delay unit 903, a first decoding unit 904, and a delay unit 905.
  • FIG. 9 may operate in an inverse manner to FIG. 5.
  • the bitstream input to the bitstream formatter 901 may be a bitstream generated in FIG. 5.
  • the bitstream formatter 601 may output bit 1 and bit 2 from the bitstream. bit 1 and bit 2 are the same as described in FIG.
  • bit1 may be input to the first decoding unit 902 and bit2 may be input to the first decoding unit 904.
  • the first decoding unit 902 uses Lfe 1 as the Lfe channel signal (n ⁇ ) using bit1. ), And the second decoding unit 904 generates Lfe 2 (n ⁇ ), which is an Lfe channel signal using bit2. ) Can be created.
  • the delay unit 903 is Lfe 1 (n ⁇ ) which is an Lfe channel signal. Time delay for Lfe 1 (n- - ) Can be printed. Similarly, the delay unit 905 is a Lfe channel signal Lfe 2 (n- Time delay for Lfe 2 (n- - ) Can be printed.
  • FIG. 10 is a diagram illustrating a process of encoding a multi-channel signal using the encoder of FIG. 2.
  • FIG. 10 means an encoder for a multi-channel signal to which an encoder of Type 1 described in FIG. 2 is applied.
  • Two To One (TTO) 1001, 1002, 1004, and 1005 represented in FIG. 10 may encode an input signal according to a parametric coding scheme for a stereo signal of MPEG Surround. That is, the TTO may correspond to the first encoding unit described with reference to FIG. 2, and the USAC Encoder may correspond to the second encoding unit.
  • the TTO 1001 and the TTO 1002 perform parametric coding according to a normal mode
  • the TTO 1004 and TTO 1005 may perform parametric coding according to the Lfe mode.
  • the general channel signal (x i ) can be analyzed to extract the spatial cues, Channel Level Difference (CLD), Inter-Channel Coherence (ICC), and Interchannel Phase Difference (IPD). have.
  • CLD Channel Level Difference
  • ICC Inter-Channel Coherence
  • IPD Interchannel Phase Difference
  • the N multichannel signals may be parametrically encoded through TTO in one step and may be converted into M downmix signals dmx 1 to dmx M.
  • M downmix signals may be input in stereo form and encoded through USAC core coding.
  • the Lfe channel signals Lfe 1 and Lfe 2 may be coupled to the general channel signal and input to the TTO 1004 and the TTO 1005.
  • the general channel signal is downmixed by two channels, and the downmixed result may be stereo coded according to the USAC encoder.
  • two general channel signals x 2M-1 and x 2M among the general channel signals included in the multi-channel signal may be coupled to Lfe1 and Lfe2, which are Lfe channel signals, and input to TTO (Lfe).
  • FIG. 11 is a diagram illustrating a decoder for decoding the encoded result of FIG. 10.
  • FIG. 11 means a decoder for a multi-channel signal to which a type 1 decoder shown in FIG. 6 is applied.
  • One to two (OTT) 1103, 1104, 1106, and 1107 represented in FIG. 11 may decode an input signal according to a parametric coding scheme for a stereo signal of MPEG surround. That is, the OTT may correspond to the second decoding unit described with reference to FIG. 6, and the USAC decoder may correspond to the first decoding unit.
  • the OTT 1103 and the OTT 1104 may perform parametric coding according to the normal mode, and the OTT 1006 and the OTT 1107 may perform parametric coding according to the Lfe mode.
  • N multichannel audio signals may be output by being decoded in an encoded result.
  • M downmix signals may be output through the USAC decoder in one step as a result output through the bitstream.
  • M downmix signals may be input to the OTT in two steps to output stereo signals.
  • the OTT 1103 and the OTT 1104 may output two general channel signals, and the OTT 1006 and the OTT 1107 may output a result of combining the general channel signal and the Lfe channel signal.
  • FIG. 12 is a diagram illustrating a process of encoding a multichannel signal when sufficient encoding bits are shown in FIG. 10.
  • an encoding process may be performed as shown in FIG. 12. That is, general channel signals x 1 to x 2M-2 may be encoded by USAC Encoder 1203 and 1206.
  • the general channel signals x 1 to x 2M-2 are time delays when encoding is performed through the delay units 1201, 1201, 1204, and 1205. ) May be applied. The result with time delay applied can then be encoded by USAC Encoder 1203, 1206.
  • the time delay occurs at OTT 1207, 1208. It can be configured as time delay by QMF analysis, Hybrid Analysis and QMF synthesis. If the signal input to USAC Encoder 1209 is a QMF (Quadrature Mirror Filterbank) signal, When calculating, the time delay caused by QMF synthesis can be excluded.
  • QMF Quadrature Mirror Filterbank
  • FIG. 13 is a diagram illustrating a decoder for decoding the encoded result of FIG. 12.
  • FIG. 13 may be reversed from the process of FIG. 12.
  • the general channel signal may be decoded through the USAC decoders 1302 and 1305 and then output through the delay units 1303, 1304, 1306, and 1307.
  • the result obtained through the bitstream formatter 1301 is decoded by the USAC Decoder 1308 to generate a downmix signal.
  • the downmix signal is input to the OTTs 1309 and 1310, respectively, to provide a general channel signal x 2M.
  • the result of coupling -1 , x 2M and Lfe channel signals Lfe 1 and Lfe 2 can be output.
  • the time outputted through the USAC Decoders 1302 and 1305 is generated by one decoding process by the delay units 1303, 1304, 1306, and 1307.
  • Delay person Can be applied. here, Consists of QMF analysis, Hybrid Analysis, QMF synthesis and filtering delay, Is different from If the signal output from USAC Decoder (1302, 1305) is a QMF signal, The time delay incurred in the QMF analysis can be excluded when determining.
  • the filtering delay refers to a time delay caused by the filtering operation performed by the OTTs 1309 and 1310 regardless of the QMF conversion process.
  • the filtering delay may be a time delay occurring during a decorrelator operation performed by the OTTs 1309 and 1310.
  • FIG. 14 illustrates an example of encoding a multi-channel signal using the encoder of FIG. 4.
  • the type 3 encoder described in FIG. 4 may be used.
  • general channel signals x 1 to x 2M may be coupled to each other and input to the TTOs 1401 and 1402.
  • the TTOs 1401 and 1402 may parametric-code the general channel signals coupled by two to output downmix signals dmx 1 and dmx 2 together with spatial cues.
  • the output downmix signals dmx 1 and dmx 2 may be input to the USAC Encoder 1403 in a stereo form.
  • two Lfe channel signals Lfe 1 and Lfe 2 included in the multichannel signal may be coupled to each other and input to the TTO 1404.
  • the TTO 1404 may output a mono downmix signal dmx 3 by performing parametric coding using two Lfe channel signals Lfe 1 and Lfe 2 .
  • the USAC Encoder 1405 may encode according to the Lfe mode in the downmix signal dmx 3 .
  • FIG. 15 illustrates another example of encoding a multichannel signal using the encoder of FIG. 4.
  • an encoder of Type 3 described in FIG. 4 may be used.
  • the general channel signal is not parametrically encoded by the TTOs 1401 and 1402, but may be encoded by the USAC Encoders 1503 and 1506.
  • the delay units 1501, 1502, 1504, and the like are delayed by the time delay generated by the TTO 1507.
  • 1505 may apply a time delay to the normal channel signal.
  • the Lfe channel signals Lfe 1 and Lfe 2 are encoded according to the Lfe mode in the TTO 1507 and output as the downmix signal dmx 3 , and the downmix signal dmx 3 may be encoded by the USAC Encoder.
  • a general channel signal may be output from the bitstream derived from FIG. 14 via USAC decoder and OTT.
  • Lfe channel signals Lfe 1 and Lfe 2 may be output from the bitstream derived from FIG. 14 via USAC decoder and OTT.
  • a general channel signal may be output from the bitstream derived from FIG. 15 via a USAC decoder and a delay unit.
  • the Lfe channel signals Lfe 1 and Lfe 2 may be output from the bitstream derived from FIG. 15 via USAC decoder and OTT.
  • FIG. 16 illustrates another example of encoding a multichannel signal using the encoder of FIG. 5.
  • FIG. 16 an encoder for a multichannel signal to which an encoder of Type 4 of FIG. 5 is applied is shown.
  • the general channel signals may be converted into downmix signals through the TTOs 1601 and 1602, and the converted downmix signals may be output as bitstreams through the USAC Encoder 1603.
  • the Lfe channel signals are delayed by the time delays generated by the TTOs 1601 and 1602 through the delay units 1604 and 1606. ) And the time delay applied result may be encoded according to Lfe mode by USAC Encoder 1605 and 1607, respectively. That is, the Lfe channel signal undergoes one encoding process, unlike the general channel signal which undergoes two-step encoding. Therefore, the time delay caused by the encoding performed by the TTO. It needs to be applied to this generic channel.
  • 17 is a diagram illustrating another example of decoding a multichannel signal using the decoder of FIG. 9.
  • FIG. 17 illustrates a result of applying the type 4 decoder of FIG. 9.
  • a general channel signal may be output through the USAC Decoder 1702 and the TTO 1703.
  • the Lfe channel signal may be output through the USAC decoders 1705 and 1707 and the delay units 1706 and 1708.
  • the Lfe channel signal since only one step of decoding is performed, a time delay generated during decoding of the TTOs 1703 and 1704 is performed. Needs to be applied through delay units 1706 and 1708. Thus, the Lfe channel signal can be synchronized with the normal channel signal output through the decoder.
  • FIG. 18 is a diagram illustrating an encoder for encoding a multichannel signal when an Lfe channel signal is odd in a multichannel signal according to an embodiment.
  • FIG. 18 illustrates the case where the Lfe channel signal is odd.
  • one Lfe channel signal Lfe 2n + 1 is input to the delay unit 1801 to delay time. This can be applied.
  • the Lfe channel signal to which the time delay is applied is encoded according to the Lfe mode through the second encoding unit 1802, so that bit1 may be output.
  • the Lfe channel signal may be processed through an encoder indicating Type 4 of FIG. 5 or a decoder indicating Type 4 of FIG. 9.
  • the Lfe channel signal is generated by the first encoding unit for synchronization with the general channel signal.
  • the time delay needs to be applied through the delay unit 1801.
  • FIG. 19 illustrates an encoder for encoding a general audio signal instead of an Lfe channel signal according to an embodiment.
  • parametric coding may be applied to the general channel signals x 1 and x 2 through the first encoding unit 1901 and converted into a downmix signal dmx 1 together with the spatial cue bit 1.
  • the general channel signals x 3 and x 4 may be converted into a downmix signal dmx 2 with spatial cue bit 2 by applying parametric coding through the first encoding unit 1902.
  • bit3 may be converted into a bitstream by the bitstream formatter 1904.
  • FIG. 20 illustrates a decoder for decoding the encoded result of FIG. 19.
  • bits 1 and bit 2 which are spatial cues, and encoded bit 3 may be output by the bitstream formatter 2001.
  • the first decoder 2002 may decode bit3 to output downmix signals dmx 1 and dmx 2 .
  • the second decoder 2003 may decode the downmix signal dmx 1 to output general channel signals x 1 and x 2 .
  • the second decoding unit 2004 may output the normal channel signals x 1 and x 2 by decoding the downmix signal dmx 2 .
  • 21 is a diagram illustrating an encoding process and a decoding process, according to an embodiment.
  • the first encoding unit described above may correspond to the TTOs 2101 and 2102 in FIG. 21, and the second encoding unit may correspond to the USAC Encoder 2103 in FIG. 21. Meanwhile, the first decoding unit described above may correspond to the USAC decoder 2104, and the second decoding unit may correspond to the OTTs 2105 and 2106.
  • the results of (i) four general channel signals or (ii) one general channel signal and one Lfe channel signal may be input to the TTOs 2101 and 2102. Then, the TTOs 2101 and 2102 may generate the downmix signal together with the spatial cues through parametric coding. USAC Encoder 2103 may encode the downmix signal.
  • USAC Decoder 2104 can output two downmix signals from the bitstream.
  • the OTTs 2105 and 2106 may output (i) four general channel signals or (ii) one general channel signal and one Lfe channel signal from the downmix signal.
  • FIG. 22 is a diagram illustrating a USAC encoder and a USAC decoder according to the first embodiment.
  • USAC Encoder is configured separately from the TTO or the USAC Encoder is configured separately from the OTT.
  • the USAC Encoder may be implemented as an extended USAC Encoder 2201 including the TTOs 2203 and 2204.
  • USAC Decoder may be implemented with an extended USAC Decoder 2202 including OTTs 2211 and 2212.
  • (i) four general channel signals or (ii) one general channel signal and one Lfe channel signals may be parametric coded by the TTOs 2203 and 2204 and output as a downmix signal.
  • the downmix signal output from the TTOs 2203 and 2204 may be parametric coded once more by being input to the TTO 2205 in stereo form.
  • the parametric coded result is frequency extended by the SBR 2206 and can be encoded by the Core Encoder 2207 for the unbanded core band.
  • bitstream generated by the extended USAC Encoder 2201 is decoded by the Core Decoder 2208, which is not extended by the core band, and the decoded result is input by the SBR 2209 to be extended by the original frequency. Can be restored. Then, the result of the frequency extension by the SBR 2209 is parametric coded by the OTT 2210 to generate two downmix signals, and the generated downmix signal is parametric coded by the OTTs 2211 and 2212. It can be output as (i) four general channel signals or (ii) one general channel signal and one Lfe channel signals.
  • FIG. 23 is a diagram illustrating a USAC encoder and a USAC decoder according to a second embodiment.
  • FIG. 23 is a diagram illustrating a USAC encoder and a USAC decoder according to a second embodiment.
  • FIG. 23 illustrates that the positions of the SBR 2305 and the TTO 2306 are changed in the expanded USAC Encoder 2301 and the positions of the OTT 2309 and the SBR 2310 are extended in the extended USAC Decoder 2302. You can see the change.
  • the remaining components may be applied in the same manner as described with reference to FIG. 22.
  • the apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components.
  • the devices and components described in the embodiments may be, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable arrays (FPAs), It may be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions.
  • the processing device may execute an operating system (OS) and one or more software applications running on the operating system.
  • the processing device may also access, store, manipulate, process, and generate data in response to the execution of the software.
  • OS operating system
  • the processing device may also access, store, manipulate, process, and generate data in response to the execution of the software.
  • processing device includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include.
  • the processing device may include a plurality of processors or one processor and one controller.
  • other processing configurations are possible, such as parallel processors.
  • the software may include a computer program, code, instructions, or a combination of one or more of the above, and configure the processing device to operate as desired, or process it independently or collectively. You can command the device.
  • Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. Or may be permanently or temporarily embodied in a signal wave to be transmitted.
  • the software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner.
  • Software and data may be stored on one or more computer readable recording media.
  • the method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • the program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks.
  • Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
  • the hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Disclosed are an encoder and an encoding method for a multichannel signal, and a decoder and a decoding method for a multichannel signal. The present invention can code a general channel signal and an Lfe channel signal included in a multichannel signal through a two-step coding process or a one-step coding process to which a time delay is applied, so as to efficiently code the multichannel signal.

Description

다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법Encoder and Encoding Method for Multichannel Signals, Decoder and Decoding Method for Multichannel Signals
이하의 실시예들은 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법에 관한 것으로, 구체적으로는 복수의 채널 신호로 구성된 다채널 신호를 효율적으로 처리하기 위한 코덱에 관한 것이다.The following embodiments relate to an encoder and an encoding method for a multichannel signal, a decoder and a decoding method for a multichannel signal, and more particularly, to a codec for efficiently processing a multichannel signal composed of a plurality of channel signals. .
AV 매체의 초고품질에 대한 요구가 발생하면서, AV 매체를 압축/전송하기 위한 새로운 기술이 필요하다. 초고품질의 오디오 콘텐츠의 경우, 하위 호환에 대한 요구사항보다는 오디오 음질 및 다채널이 가지는 음장을 정확하게 표현하는 것이 중요하다. 예를 들어, 22.2 채널 오디오 신호는 초고품질의 오디오 음장 재현을 위한 것으로, 하위 호환성을 위해 압축/전송 되기보다는, 콘텐츠가 가지고 있는 고유의 음질 및 음장의 효과를 있는 그대로 표현해 줄 수 있는 고품질 다채널 오디오 코딩 기술을 요구하고 있다.As the demand for ultra-high quality of AV media arises, a new technique for compressing / transmitting AV media is needed. For ultra-high quality audio content, it is important to accurately represent the audio quality and the multi-channel sound field rather than the requirement for backward compatibility. For example, a 22.2 channel audio signal is intended for ultra-high quality audio sound field reproduction, rather than being compressed / transmitted for backwards compatibility, it is a high quality multichannel that can express the inherent sound quality and effect of the content as it is. Audio coding technology is required.
따라서, 기존에 알려진 5.1 채널 또는 7.1 채널 이상의 다채널 신호를 부/복호화 하기 위해서는 새로운 코덱 구조가 필요하다.Therefore, a new codec structure is required to encode / decode multichannel signals of 5.1 channels or 7.1 channels or more known in the art.
본 발명은 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하거나 디코딩하는 장치 및 방법을 제공한다.The present invention provides an apparatus and method for encoding or decoding a multichannel signal comprising an Lfe channel signal.
본 발명은 2단계의 인코딩/디코딩을 수행하거나 또는 1단계의 인코딩/디코딩에 시간 지연을 적용하는 과정을 수행하는 장치 및 방법을 제공한다.The present invention provides an apparatus and method for performing a process of performing two steps of encoding / decoding or applying a time delay to one step of encoding / decoding.
본 발명의 제1 실시예에 따른 다채널 신호의 인코딩 방법은 다채널 신호에 포함된 제1 일반 채널 신호와 제1 Lfe 채널 신호를 인코딩하여 제1 다운믹스 신호 및 제1 공간큐를 출력하는 단계; 다채널 신호에 포함된 제2 일반 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 제2 다운믹스 신호 및 제2 공간큐를 출력하는 단계; 상기 제1 다운믹스 신호와 제2 다운믹스 신호를 함께 인코딩하는 단계; 및 상기 인코딩된 제1 다운믹스 신호와 제2 다운믹스 신호 및 제1 공간큐와 제2 공간큐를 포함하는 비트스트림을 생성하는 단계를 포함할 수 있다.A method of encoding a multichannel signal according to a first embodiment of the present invention includes the steps of: encoding a first general channel signal and a first Lfe channel signal included in a multichannel signal to output a first downmix signal and a first spatial cue; ; Encoding a second general channel signal and a second Lfe channel signal included in the multichannel signal to output a second downmix signal and a second spatial cue; Encoding the first downmix signal and the second downmix signal together; And generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue.
상기 제1 공간큐를 출력하는 단계는, 상기 제1 일반 채널 신호와 제1 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제1 다운믹스 신호와 제1 공간큐를 출력하고, 상기 제2 공간큐를 출력하는 단계는, 상기 제2 일반 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제2 다운믹스 신호와 제2 공간큐를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The outputting of the first spatial cue may include outputting a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to an Lfe mode. The outputting of the second spatial cue may include outputting a second downmix signal and a second spatial cue by applying parametric coding to the second general channel signal and the second Lfe channel signal according to an Lfe mode, and outputting the first spatial cue. The cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of the first Lfe channel signal or the second Lfe channel signal.
본 발명의 제2 실시예에 따른 다채널 신호의 인코딩 방법은 다채널 신호에 포함된 제1 일반 채널 신호와 제1 Lfe 채널 신호를 인코딩하여 제1 다운믹스 신호 및 제1 공간큐를 출력하는 단계; 다채널 신호에 포함된 제2 일반 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 제2 다운믹스 신호 및 제2 공간큐를 출력하는 단계; 상기 제1 다운믹스 신호를 인코딩하는 단계; 상기 제1 다운믹스 신호와 별도로 제2 다운믹스 신호를 인코딩하는 단계; 상기 인코딩된 제1 다운믹스 신호와 제2 다운믹스 신호 및 제1 공간큐와 제2 공간큐를 포함하는 비트스트림을 생성하는 단계를 포함할 수 있다.A method of encoding a multichannel signal according to a second embodiment of the present invention includes the steps of: encoding a first general channel signal and a first Lfe channel signal included in a multichannel signal to output a first downmix signal and a first spatial cue; ; Encoding a second general channel signal and a second Lfe channel signal included in the multichannel signal to output a second downmix signal and a second spatial cue; Encoding the first downmix signal; Encoding a second downmix signal separately from the first downmix signal; The method may include generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue.
상기 제1 공간큐를 출력하는 단계는, 상기 제1 일반 채널 신호와 제1 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제1 다운믹스 신호와 제1 공간큐를 출력하고, 상기 제2 공간큐를 출력하는 단계는, 상기 제2 일반 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제2 다운믹스 신호와 제2 공간큐를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The outputting of the first spatial cue may include outputting a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to an Lfe mode. The outputting of the second spatial cue may include outputting a second downmix signal and a second spatial cue by applying parametric coding to the second general channel signal and the second Lfe channel signal according to an Lfe mode, and outputting the first spatial cue. The cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of the first Lfe channel signal or the second Lfe channel signal.
본 발명의 제3 실시예에 따른 다채널 신호의 인코딩 방법은 다채널 신호에 포함된 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 다운믹스 신호와 공간큐를 출력하는 단계; 상기 다운믹스 신호를 인코딩하는 단계; 상기 인코딩된 다운믹스 신호와 공간큐를 포함하는 비트스트림을 생성하는 단계를 포함할 수 있다.A method of encoding a multichannel signal according to a third embodiment of the present invention includes: encoding a first Lfe channel signal and a second Lfe channel signal included in a multichannel signal to output a downmix signal and a spatial cue; Encoding the downmix signal; The method may include generating a bitstream including the encoded downmix signal and a spatial cue.
상기 출력하는 단계는, 상기 제1 Lfe 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 다운믹스 신호와 공간큐를 출력하고, 상기 공간큐는, 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The outputting may include outputting a downmix signal and a spatial cue by applying parametric coding to the first Lfe channel signal and the second Lfe channel signal according to an Lfe mode, wherein the spatial cue is a first Lfe channel signal or It may include a CLD (Channel Level Diffenece) output from the Lfe band of the second Lfe channel signal.
본 발명의 제4 실시예에 따른 다채널 신호의 인코딩 방법은 다채널 신호에 포함된 제1 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계; 다채널 신호에 포함된 제2 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계; 상기 시간 지연이 적용된 제1 Lfe 채널 신호를 인코딩하는 단계; 상기 시간 지연이 적용된 제2 Lfe 채널 신호를 인코딩하는 단계; 및 상기 인코딩된 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 포함하는 비트스트림을 생성하는 단계를 포함할 수 있다.A method of encoding a multichannel signal according to a fourth embodiment of the present invention includes applying a time delay to a first Lfe channel signal included in a multichannel signal; Applying a time delay to a second Lfe channel signal included in the multichannel signal; Encoding a first Lfe channel signal to which the time delay is applied; Encoding a second Lfe channel signal to which the time delay is applied; And generating a bitstream including the encoded first Lfe channel signal and a second Lfe channel signal.
상기 시간 지연은, 다채널 신호에 포함된 일반 채널 신호의 인코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.The time delay may include a time delay generated during encoding of a general channel signal included in the multichannel signal.
본 발명의 제5 실시예에 따른 다채널 신호의 인코딩 방법은 다채널 신호에 포함된 일반 채널 신호에 대해 시간 지연을 적용하는 단계; 상기 시간 지연이 적용된 일반 채널 신호를 인코딩하는 단계; 다채널 신호에 포함된 Lfe 채널 신호를 인코딩하여 다운믹스 신호와 공간큐를 출력하는 단계; 및 상기 인코딩된 Lfe 채널 신호를 인코딩하는 단계를 포함하고, 상기 시간 지연은 Lfe 채널 신호의 인코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.A method of encoding a multichannel signal according to a fifth embodiment of the present invention includes applying a time delay to a general channel signal included in a multichannel signal; Encoding the normal channel signal to which the time delay has been applied; Outputting a downmix signal and a spatial cue by encoding the Lfe channel signal included in the multichannel signal; And encoding the encoded Lfe channel signal, wherein the time delay may include a time delay generated during the encoding of the Lfe channel signal.
상기 출력하는 단계는, 상기 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩하여 다운믹스 신호와 공간큐를 출력할 수 있다.The outputting may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
본 발명의 제1 실시예에 따른 다채널 신호의 디코딩 방법은 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 다운믹스 신호와 제2 다운믹스 신호를 생성하는 단계; 상기 제1 다운믹스 신호를 디코딩하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계; 상기 제2 다운믹스 신호를 디코딩하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계를 포함할 수 있다.In accordance with another aspect of the present invention, there is provided a method of decoding a multichannel signal, the method comprising: generating a first downmix signal and a second downmix signal by decoding an encoding result extracted from a bitstream; Decoding the first downmix signal and outputting a first general channel signal and a first Lfe channel signal; And decoding the second downmix signal to output a second general channel signal and a second Lfe channel signal.
상기 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계는, 제1 공간큐를 파라메트릭 코딩에 적용하여 제1 다운믹스 신호로부터 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고, 상기 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계는, 제2 공간큐를 파라메트릭 코딩에 적용하여 제2 다운믹스 신호로부터 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The outputting of the first general channel signal and the first Lfe channel signal may include applying a first spatial cue to parametric coding to output the first general channel signal and the first Lfe channel signal from the first downmix signal, The outputting of the second general channel signal and the second Lfe channel signal may include applying a second spatial cue to parametric coding to output a second general channel signal and a second Lfe channel signal from a second downmix signal, The first spatial cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
본 발명의 제2 실시예에 따른 다채널 신호의 디코딩 방법은 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 다운믹스 신호를 생성하는 단계; 상기 비트스트림으로부터 추출한 다른 인코딩 결과를 디코딩하여 제2 다운믹스 신호를 생성하는 단계; 상기 제1 다운믹스 신호를 디코딩하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계; 및 상기 제2 다운믹스 신호를 디코딩하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계를 포함할 수 있다.In accordance with another aspect of the present invention, there is provided a method of decoding a multichannel signal, the method comprising: generating a first downmix signal by decoding an encoding result extracted from a bitstream; Decoding another encoding result extracted from the bitstream to generate a second downmix signal; Decoding the first downmix signal and outputting a first general channel signal and a first Lfe channel signal; And outputting a second general channel signal and a second Lfe channel signal by decoding the second downmix signal.
상기 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계는, 상기 제1 다운믹스 신호에 제1 공간큐에 기초한 파라메트릭 코딩을 이용하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고, 상기 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계는, 상기 제2 다운믹스 신호에 제2 공간큐에 기초한 파라메트릭 코딩을 이용하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The outputting of the first general channel signal and the first Lfe channel signal may include outputting a first general channel signal and a first Lfe channel signal to the first downmix signal using parametric coding based on a first spatial cue. The outputting of the second general channel signal and the second Lfe channel signal may include a second general channel signal and a second Lfe channel signal using parametric coding based on a second spatial cue on the second downmix signal. The first spatial cue and the second spatial cue may include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
본 발명의 제3 실시예에 따른 다채널 신호의 디코딩 방법은 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 다운믹스 신호를 생성하는 단계; 및 상기 다운믹스 신호를 디코딩하여 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계를 포함할 수 있다.In accordance with another aspect of the present invention, there is provided a method of decoding a multichannel signal, the method comprising: generating a downmix signal by decoding an encoding result extracted from a bitstream; And decoding the downmix signal to output a first Lfe channel signal and a second Lfe channel signal.
상기 출력하는 단계는, 상기 다운믹스 신호에 공간큐에 기초한 파라메트릭 코딩을 적용하여 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 출력하고, 상기 공간큐는, 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The outputting may include applying a parametric coding based on a spatial cue to the downmix signal to output a first Lfe channel signal and a second Lfe channel signal, and the spatial cue is a first Lfe channel signal or a second Lfe channel signal. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
본 발명의 제4 실시예에 따른 다채널 신호의 디코딩 방법은 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 Lfe 채널 신호를 출력하는 단계; 비트스트림으로부터 추출한 다른 인코딩 결과를 디코딩하여 제2 Lfe 채널 신호를 출력하는 단계; 상기 제1 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계; 및 상기 제2 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계를 포함할 수 있다.A decoding method of a multi-channel signal according to a fourth embodiment of the present invention includes: decoding a result of encoding extracted from a bitstream and outputting a first Lfe channel signal; Decoding another encoding result extracted from the bitstream and outputting a second Lfe channel signal; Applying a time delay to the first Lfe channel signal; And applying a time delay to the second Lfe channel signal.
상기 시간 지연은, 일반 채널 신호의 디코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.The time delay may include a time delay generated in the decoding process of the general channel signal.
본 발명의 제5 실시예에 따른 다채널 신호의 디코딩 방법은 비트스트림으로부터 일반 채널 신호에 대해 디코딩하는 단계; 상기 디코딩된 일반 채널 신호에 대해 시간 지연을 적용하는 단계; 상기 비트스트림으로부터 Lfe 채널 신호에 대해 디코딩하는 단계; 상기 디코딩된 Lfe 채널 신호를 디코딩하는 단계를 포함할 수 있다.A decoding method of a multichannel signal according to a fifth exemplary embodiment of the present invention includes decoding a general channel signal from a bitstream; Applying a time delay to the decoded general channel signal; Decoding an Lfe channel signal from the bitstream; And decoding the decoded Lfe channel signal.
상기 시간 지연은 Lfe 채널 신호의 디코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.The time delay may include a time delay generated during the decoding of the Lfe channel signal.
상기 Lfe 채널 신호에 대해 디코딩하는 단계는, 상기 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩하여 다운믹스 신호와 공간큐를 출력할 수 있다.The decoding of the Lfe channel signal may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
본 발명의 제1 실시예에 따른 다채널 신호의 인코더는 다채널 신호에 포함된 제1 일반 채널 신호와 제1 Lfe 채널 신호를 인코딩하여 제1 다운믹스 신호 및 제1 공간큐를 출력하고, 다채널 신호에 포함된 제2 일반 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 제2 다운믹스 신호 및 제2 공간큐를 출력하는 제1 인코딩부; 상기 제1 다운믹스 신호와 제2 다운믹스 신호를 함께 인코딩하는 제3 인코딩부; 및 상기 인코딩된 제1 다운믹스 신호와 제2 다운믹스 신호 및 제1 공간큐와 제2 공간큐를 포함하는 비트스트림을 생성하는 비트스트림 포멧터를 포함할 수 있다.The encoder of the multichannel signal according to the first embodiment of the present invention encodes the first general channel signal and the first Lfe channel signal included in the multichannel signal, and outputs a first downmix signal and a first spatial cue. A first encoder for encoding a second general channel signal and a second Lfe channel signal included in the channel signal to output a second downmix signal and a second spatial cue; A third encoder which encodes the first downmix signal and the second downmix signal together; And a bitstream formatter for generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue.
상기 제1 인코딩부는, 상기 제1 일반 채널 신호와 제1 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제1 다운믹스 신호와 제1 공간큐를 출력하고, 상기 제1 인코딩부는, 상기 제2 일반 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제2 다운믹스 신호와 제2 공간큐를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The first encoder outputs a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to Lfe mode, and the first encoder Parametric coding is applied to the second general channel signal and the second Lfe channel signal according to Lfe mode to output a second downmix signal and a second spatial cue, and the first spatial cue and the second spatial cue are first Lfe. Channel Level Diffenece (CLD) output from the Lfe band of the channel signal or the second Lfe channel signal.
본 발명의 제2 실시예에 따른 다채널 신호의 인코더는 다채널 신호에 포함된 제1 일반 채널 신호와 제1 Lfe 채널 신호를 인코딩하여 제1 다운믹스 신호 및 제1 공간큐를 출력하고, 다채널 신호에 포함된 제2 일반 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 제2 다운믹스 신호 및 제2 공간큐를 출력하는 제1 인코딩부; 상기 제1 다운믹스 신호를 인코딩하고, 상기 제1 다운믹스 신호와 별도로 제2 다운믹스 신호를 인코딩하는 제2 인코딩부 상기 인코딩된 제1 다운믹스 신호와 제2 다운믹스 신호 및 제1 공간큐와 제2 공간큐를 포함하는 비트스트림을 생성하는 비트스트림 포멧터를 포함할 수 있다.The encoder of the multichannel signal according to the second embodiment of the present invention encodes a first general channel signal and a first Lfe channel signal included in the multichannel signal, and outputs a first downmix signal and a first spatial cue. A first encoder for encoding a second general channel signal and a second Lfe channel signal included in the channel signal to output a second downmix signal and a second spatial cue; A second encoding unit encoding the first downmix signal and encoding a second downmix signal separately from the first downmix signal; the encoded first downmix signal, the second downmix signal, and a first spatial cue; And a bitstream formatter for generating a bitstream including the second spatial queue.
상기 제1 인코딩부는, 상기 제1 일반 채널 신호와 제1 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제1 다운믹스 신호와 제1 공간큐를 출력하고, 상기 제1 인코딩부는, 상기 제2 일반 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제2 다운믹스 신호와 제2 공간큐를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The first encoder outputs a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to Lfe mode, and the first encoder Parametric coding is applied to the second general channel signal and the second Lfe channel signal according to Lfe mode to output a second downmix signal and a second spatial cue, and the first spatial cue and the second spatial cue are first Lfe. Channel Level Diffenece (CLD) output from the Lfe band of the channel signal or the second Lfe channel signal.
본 발명의 제3 실시예에 따른 다채널 신호의 인코더는 다채널 신호에 포함된 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 다운믹스 신호와 공간큐를 출력하는 제1 인코딩부; 상기 다운믹스 신호를 인코딩하는 제2 인코딩부; 상기 인코딩된 다운믹스 신호와 공간큐를 포함하는 비트스트림을 생성하는 비트스트림 포멧터를 포함할 수 있다.An encoder of a multichannel signal according to a third embodiment of the present invention includes: a first encoding unit for encoding a first Lfe channel signal and a second Lfe channel signal included in a multichannel signal to output a downmix signal and a spatial cue; A second encoding unit encoding the downmix signal; And a bitstream formatter for generating a bitstream including the encoded downmix signal and a spatial cue.
상기 제1 인코딩부는, 상기 제1 Lfe 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 다운믹스 신호와 공간큐를 출력하고, 상기 공간큐는, 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The first encoder outputs a downmix signal and a spatial cue by applying parametric coding to the first Lfe channel signal and the second Lfe channel signal according to an Lfe mode, and the spatial cue is a first Lfe channel signal or It may include a CLD (Channel Level Diffenece) output from the Lfe band of the second Lfe channel signal.
본 발명의 제4 실시예에 따른 다채널 신호의 인코더는 다채널 신호에 포함된 제1 Lfe 채널 신호에 대해 시간 지연을 적용하고, 다채널 신호에 포함된 제2 Lfe 채널 신호에 대해 시간 지연을 적용하는 지연부; 상기 시간 지연이 적용된 제1 Lfe 채널 신호를 인코딩하고, 상기 시간 지연이 적용된 제2 Lfe 채널 신호를 인코딩하는 제2 인코딩부; 및 상기 인코딩된 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 포함하는 비트스트림을 생성하는 비트스트림 포멧터를 포함할 수 있다.The encoder of the multichannel signal according to the fourth embodiment of the present invention applies a time delay to the first Lfe channel signal included in the multichannel signal, and applies a time delay to the second Lfe channel signal included in the multichannel signal. A delay unit to be applied; A second encoding unit encoding the first Lfe channel signal to which the time delay is applied and encoding the second Lfe channel signal to which the time delay is applied; And a bitstream formatter for generating a bitstream including the encoded first Lfe channel signal and the second Lfe channel signal.
상기 시간 지연은, 다채널 신호에 포함된 일반 채널 신호의 인코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.The time delay may include a time delay generated during encoding of a general channel signal included in the multichannel signal.
본 발명의 제5 실시예에 따른 다채널 신호의 인코더는 다채널 신호에 포함된 일반 채널 신호에 대해 시간 지연을 적용하는 지연부; 상기 시간 지연이 적용된 일반 채널 신호를 인코딩하는 제1 인코딩부; 다채널 신호에 포함된 Lfe 채널 신호를 인코딩하여 다운믹스 신호와 공간큐를 출력하는 제2 인코딩부; 및 상기 인코딩된 Lfe 채널 신호를 인코딩하는 제3 인코딩부를 포함하고, 상기 시간 지연은 Lfe 채널 신호의 인코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.An encoder of a multichannel signal according to a fifth embodiment of the present invention includes a delay unit for applying a time delay to a general channel signal included in a multichannel signal; A first encoding unit encoding the general channel signal to which the time delay is applied; A second encoder for encoding an Lfe channel signal included in the multichannel signal and outputting a downmix signal and a spatial cue; And a third encoding unit encoding the encoded Lfe channel signal, wherein the time delay may include a time delay generated during the encoding of the Lfe channel signal.
상기 제2 인코딩부는, 상기 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩하여 다운믹스 신호와 공간큐를 출력할 수 있다.The second encoder may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
본 발명의 제1 실시예에 따른 다채널 신호의 디코더는 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 다운믹스 신호와 제2 다운믹스 신호를 생성하는 제1 디코딩부; 상기 제1 다운믹스 신호를 디코딩하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고, 상기 제2 다운믹스 신호를 디코딩하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 제2 디코딩부를 포함할 수 있다.A decoder of a multi-channel signal according to a first embodiment of the present invention includes: a first decoding unit which decodes an encoding result extracted from a bitstream to generate a first downmix signal and a second downmix signal; A second decoding decoding the first downmix signal to output a first general channel signal and a first Lfe channel signal, and decoding the second downmix signal to output a second general channel signal and a second Lfe channel signal It may include wealth.
상기 제2 디코딩부는, 제1 공간큐를 파라메트릭 코딩에 적용하여 제1 다운믹스 신호로부터 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고, 상기 제2 디코딩부는, 제2 공간큐를 파라메트릭 코딩에 적용하여 제2 다운믹스 신호로부터 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The second decoding unit applies a first spatial cue to parametric coding to output a first general channel signal and a first Lfe channel signal from a first downmix signal, and the second decoding unit may convert a second spatial cue into a parametric coding. The second common channel signal and the second Lfe channel signal are output from the second downmix signal by applying to metric coding, and the first spatial cue and the second spatial cue are Lfe of the first Lfe channel signal or the second Lfe channel signal. Channel Level Diffenece (CLD) output from the band may be included.
본 발명의 제2 실시예에 따른 다채널 신호의 디코더는 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 다운믹스 신호를 생성하고, 상기 비트스트림으로부터 추출한 다른 인코딩 결과를 디코딩하여 제2 다운믹스 신호를 생성하는 제1 디코딩부; 상기 제1 다운믹스 신호를 디코딩하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고, 상기 제2 다운믹스 신호를 디코딩하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 제2 디코딩부를 포함할 수 있다.The decoder of the multi-channel signal according to the second embodiment of the present invention decodes an encoding result extracted from a bitstream to generate a first downmix signal, and decodes another encoding result extracted from the bitstream to generate a second downmix signal. A first decoding unit to generate; A second decoding decoding the first downmix signal to output a first general channel signal and a first Lfe channel signal, and decoding the second downmix signal to output a second general channel signal and a second Lfe channel signal It may include wealth.
상기 제2 디코딩부는, 상기 제1 다운믹스 신호에 제1 공간큐에 기초한 파라메트릭 코딩을 이용하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고, 상기 제2 디코딩부는, 상기 제2 다운믹스 신호에 제2 공간큐에 기초한 파라메트릭 코딩을 이용하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하고, 상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The second decoding unit outputs a first general channel signal and a first Lfe channel signal to the first downmix signal using parametric coding based on a first spatial cue, and the second decoding unit outputs the second down channel. A second normal channel signal and a second Lfe channel signal are output to the mixed signal by using parametric coding based on a second spatial cue, wherein the first spatial cue and the second spatial cue are a first Lfe channel signal or a second Lfe channel signal. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
본 발명의 제3 실시예에 따른 다채널 신호의 디코더는 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 다운믹스 신호를 생성하는 제1 디코딩부; 및 상기 다운믹스 신호를 디코딩하여 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 출력하는 제2 디코딩부를 포함할 수 있다.A decoder of a multi-channel signal according to a third embodiment of the present invention includes: a first decoding unit for decoding a result of encoding extracted from a bitstream to generate a downmix signal; And a second decoder configured to decode the downmix signal to output a first Lfe channel signal and a second Lfe channel signal.
상기 제2 디코딩부는, 상기 다운믹스 신호에 공간큐에 기초한 파라메트릭 코딩을 적용하여 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 출력하고, 상기 공간큐는, 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함할 수 있다.The second decoding unit applies a parametric coding based on a spatial cue to the downmix signal to output a first Lfe channel signal and a second Lfe channel signal, and the spatial cue is a first Lfe channel signal or a second Lfe. It may include a channel level difference (CLD) output from the Lfe band of the channel signal.
본 발명의 제4 실시예에 따른 다채널 신호의 디코더는 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 Lfe 채널 신호를 출력하고, 비트스트림으로부터 추출한 다른 인코딩 결과를 디코딩하여 제2 Lfe 채널 신호를 출력하는 제1 디코딩부; 상기 제1 Lfe 채널 신호에 대해 시간 지연을 적용하고, 상기 제2 Lfe 채널 신호에 대해 시간 지연을 적용하는 지연부를 포함할 수 있다.The decoder of the multi-channel signal according to the fourth embodiment of the present invention decodes an encoding result extracted from the bitstream to output a first Lfe channel signal, and decodes another encoding result extracted from the bitstream to output a second Lfe channel signal. A first decoding unit; And a delay unit applying a time delay to the first Lfe channel signal and applying a time delay to the second Lfe channel signal.
상기 시간 지연은, 일반 채널 신호의 디코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.The time delay may include a time delay generated in the decoding process of the general channel signal.
본 발명의 제5 실시예에 따른 다채널 신호의 디코더는 비트스트림으로부터 일반 채널 신호에 대해 디코딩하는 제1 디코딩부; 상기 디코딩된 일반 채널 신호에 대해 시간 지연을 적용하는 지연부; 상기 비트스트림으로부터 Lfe 채널 신호에 대해 디코딩하는 제2 디코딩부; 상기 디코딩된 Lfe 채널 신호를 디코딩하는 제3 디코딩부를 포함할 수 있다.A decoder of a multichannel signal according to a fifth embodiment of the present invention includes a first decoding unit decoding a general channel signal from a bitstream; A delay unit for applying a time delay to the decoded general channel signal; A second decoder to decode an Lfe channel signal from the bitstream; It may include a third decoding unit for decoding the decoded Lfe channel signal.
상기 시간 지연은 Lfe 채널 신호의 디코딩 과정에서 발생되는 시간 지연을 포함할 수 있다.The time delay may include a time delay generated during the decoding of the Lfe channel signal.
상기 제2 디코딩부는, 상기 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩하여 다운믹스 신호와 공간큐를 출력할 수 있다.The second decoding unit may output a downmix signal and a spatial cue by parametric coding the Lfe channel signal according to an Lfe mode.
본 발명의 일실시예에 따르면, 일반 채널 신호 이외에 Lfe 채널 신호를 포함하는 다채널 신호를 효과적으로 인코딩하거나 디코딩할 수 있다.According to an embodiment of the present invention, it is possible to effectively encode or decode a multichannel signal including an Lfe channel signal in addition to the normal channel signal.
본 발명의 일실시예에 따르면, 2단계의 인코딩/디코딩을 수행하거나 또는 1단계의 인코딩/디코딩에 시간 지연을 적용함으로써 동기화가 적용된 다채널 신호를 출력할 수 있다.According to an embodiment of the present invention, a multi-channel signal to which synchronization is applied may be output by performing encoding / decoding in two steps or applying a time delay to encoding / decoding in one step.
도 1은 일실시예에 따른 인코더와 디코더를 도시한 도면이다.1 is a diagram illustrating an encoder and a decoder, according to an exemplary embodiment.
도 2는 제1 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.2 is a diagram illustrating an encoder for encoding a multi-channel signal including an Lfe channel signal according to the first embodiment.
도 3은 제2 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.3 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the second embodiment.
도 4는 제3 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.4 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the third embodiment.
도 5는 제4 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.FIG. 5 illustrates an encoder for encoding a multichannel signal including an Lfe channel signal according to the fourth embodiment.
도 6은 도 2의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.FIG. 6 illustrates a decoder for decoding the encoded result of FIG. 2.
도 7은 도 3의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.7 illustrates a decoder for decoding the encoded result of FIG. 3.
도 8은 도 4의 인코딩된 결과를 디코딩하는 디코딩하는 디코더를 도시한 도면이다.8 is a diagram illustrating a decoder to decode the encoded result of FIG. 4.
도 9는 도 5의 인코딩된 결과를 디코딩하는 디코딩하는 디코더를 도시한 도면이다.9 is a diagram illustrating a decoder for decoding the encoded result of FIG. 5.
도 10은 도 2의 인코더를 이용하여 다채널 신호를 인코딩하는 과정을 도시한 도면이다.FIG. 10 is a diagram illustrating a process of encoding a multi-channel signal using the encoder of FIG. 2.
도 11은 도 10의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.FIG. 11 is a diagram illustrating a decoder for decoding the encoded result of FIG. 10.
도 12는 도 10에서 인코딩 비트가 충분한 경우, 다채널 신호를 인코딩하는 과정을 도시한 도면이다.FIG. 12 is a diagram illustrating a process of encoding a multichannel signal when sufficient encoding bits are shown in FIG. 10.
도 13은 도 12의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.13 is a diagram illustrating a decoder for decoding the encoded result of FIG. 12.
도 14는 도 4의 인코더를 이용하여 다채널 신호를 인코딩하는 일례를 도시한 도면이다.FIG. 14 illustrates an example of encoding a multi-channel signal using the encoder of FIG. 4.
도 15는 도 4의 인코더를 이용하여 다채널 신호를 인코딩하는 다른 예를 도시한 도면이다.FIG. 15 illustrates another example of encoding a multichannel signal using the encoder of FIG. 4.
도 16은 도 5의 인코더를 이용하여 다채널 신호를 인코딩하는 다른 예를 도시한 도면이다.FIG. 16 illustrates another example of encoding a multichannel signal using the encoder of FIG. 5.
도 17은 도 9의 디코더를 이용하여 다채널 신호를 디코딩하는 다른 예를 도시한 도면이다.17 is a diagram illustrating another example of decoding a multichannel signal using the decoder of FIG. 9.
도 18은 일실시예에 따른 다채널 신호에 Lfe 채널 신호가 홀수인 경우, 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.18 is a diagram illustrating an encoder for encoding a multichannel signal when an Lfe channel signal is odd in a multichannel signal according to an embodiment.
도 19는 일실시예에 따른 Lfe 채널 신호가 아닌 일반 오디오 신호를 인코딩하는 인코더를 도시한 도면이다.19 illustrates an encoder for encoding a general audio signal instead of an Lfe channel signal according to an embodiment.
도 20은 도 19의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.20 illustrates a decoder for decoding the encoded result of FIG. 19.
도 21은 일실시예에 따른 인코딩 과정과 디코딩 과정을 설명하는 도면이다.21 is a diagram illustrating an encoding process and a decoding process, according to an embodiment.
도 22는 제1 실시예에 따른 USAC 인코더와 USAC 디코더를 도시한 도면이다.22 is a diagram illustrating a USAC encoder and a USAC decoder according to the first embodiment.
도 23은 제2 실시예에 따른 USAC 인코더와 USAC 디코더를 도시한 도면이다.FIG. 23 is a diagram illustrating a USAC encoder and a USAC decoder according to a second embodiment. FIG.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 일실시예에 따른 인코더와 디코더를 도시한 도면이다.1 is a diagram illustrating an encoder and a decoder, according to an exemplary embodiment.
도 1을 참고하면, 인코더(101)와 디코더(102)가 도시된다. 인코더(101)는 복수의 채널 신호들을 포함하는 다채널 신호를 인코딩하여 비트스트림을 생성할 수 있다. 그러면, 디코더(101)는 인코더(101)로부터 수신하거나 또는 인코더(101)에서 매체에 저장된 비트스트림으로부터 다채널 신호를 디코딩할 수 있다.Referring to FIG. 1, an encoder 101 and a decoder 102 are shown. The encoder 101 may generate a bitstream by encoding a multichannel signal including a plurality of channel signals. The decoder 101 may then decode the multichannel signal from the bitstream received from the encoder 101 or stored in the medium at the encoder 101.
이 때, 일실시예에 따르면, 다채널 신호는 Lfe 채널 신호를 포함할 수 있다. 여기서, Lfe 채널 신호는 선택적인 제한된 음역의 저음역 효과(LFE: Low Frequency Effects)을 위한 채널 신호를 의미한다. 여기서, 저음역은 20-120 Hz 까지의 저주파수 영역을 의미할 수 있다. Lfe 채널 신호는 추가의 저대역 정보를 전달함으로써, 메인 채널 신호의 저대역 정보를 보충할 때 이용될 수 있다.At this time, according to an embodiment, the multi-channel signal may include an Lfe channel signal. Here, the Lfe channel signal refers to a channel signal for selective limited low frequency effects (LFE). Here, the low range may mean a low frequency region up to 20-120 Hz. The Lfe channel signal can be used to supplement the low band information of the main channel signal by carrying additional low band information.
이하에서는 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하거나 디코딩하는 과정을 구체적으로 설명하기로 한다.Hereinafter, a process of encoding or decoding a multichannel signal including an Lfe channel signal will be described in detail.
도 2는 제1 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.2 is a diagram illustrating an encoder for encoding a multi-channel signal including an Lfe channel signal according to the first embodiment.
도 2 내지 도 5는 Lfe 채널 신호가 2개를 포함하는 다채널 신호를 인코딩하는 과정을 나타내고, 도 6 내지 도 9는 도 2 내지 도 5의 인코딩 결과를 디코딩하는 과정을 나타낸다.2 through 5 illustrate a process of encoding a multi-channel signal including two Lfe channel signals, and FIGS. 6 through 9 illustrate a process of decoding the encoding results of FIGS. 2 through 5.
도 2를 참고하면, 인코더는 제1 인코딩부(201), 제1 인코딩부(202), 제2 인코딩부(203) 및 비트스트림 포멧터(204)를 포함할 수 있다. 여기서, 제1 인코딩부(201)와 제1 인코딩부(202)는 동일한 동작을 수행할 수 있다.Referring to FIG. 2, the encoder may include a first encoding unit 201, a first encoding unit 202, a second encoding unit 203, and a bitstream formatter 204. Here, the first encoding unit 201 and the first encoding unit 202 may perform the same operation.
구체적으로, 제1 인코딩부(201)는 Lfe 채널 신호 Lfe1과 일반 채널 신호 xi를 이용하여 다운믹스 신호 dmx1을 생성할 수 있다. 여기서, 일반 채널 신호는 저음역 효과를 나타내지 않는 채널 신호를 의미할 수 있다. 그리고, 제1 인코딩부(202)는 Lfe 채널 신호 Lfe2과 일반 채널 신호 xi+1를 이용하여 다운믹스 신호 dmx2을 생성할 수 있다. i는 일반 채널 신호의 인덱스를 의미한다. 즉, 도 2의 인코더는 일반 채널 신호와 Lfe 채널 신호가 커플링되는 다채널 신호를 인코딩할 수 있다.In detail, the first encoding unit 201 may generate the downmix signal dmx 1 using the Lfe channel signal Lfe 1 and the general channel signal x i . Here, the general channel signal may mean a channel signal that does not exhibit a low range effect. The first encoding unit 202 may generate the downmix signal dmx 2 using the Lfe channel signal Lfe 2 and the general channel signal x i + 1 . i means the index of the normal channel signal. That is, the encoder of FIG. 2 may encode a multichannel signal in which a general channel signal and an Lfe channel signal are coupled.
이 때, 제1 인코딩부(201)와 제1 인코딩부(202)는 파라메트릭 코딩을 수행함으로써 공간큐와 다운믹스 신호를 출력할 수 있다. 다만, 제1 인코딩부(201)와 제1 인코딩부(202)는 Lfe 채널 신호를 이용하여 파라메트릭 코딩을 수행한다. In this case, the first encoding unit 201 and the first encoding unit 202 may output a spatial cue and a downmix signal by performing parametric coding. However, the first encoding unit 201 and the first encoding unit 202 perform parametric coding using the Lfe channel signal.
이 때, Lfe 채널 신호를 이용하여 파라메트릭 코딩을 수행하는 경우, Lfe 대역에서 공간큐인 CLD(Channel Level Difference)를 추출할 수 있다. 그러면, Lfe 채널 신호를 이용하는 파라메트릭 코딩을 통해 출력되는 공간큐는 일반적으로 적용되는 파라메트릭 코딩을 통해 출력되는 공간큐보다 상대적은 적은 량의 데이터를 출력할 수 있다. 여기서, 제1 인코딩부(201)와 제1 인코딩부(202)에서 출력되는 공간큐는 각각 bit1과 bit2이다.At this time, when performing parametric coding using the Lfe channel signal, a spatial cue CLD (Channel Level Difference) may be extracted from the Lfe band. Then, the spatial cue output through the parametric coding using the Lfe channel signal may output a relatively smaller amount of data than the spatial cue output through the parametric coding that is generally applied. Here, the spatial cues output from the first encoding unit 201 and the first encoding unit 202 are bit1 and bit2, respectively.
제2 인코딩부(203)는 제1 인코딩부(201)에서 출력된 다운믹스 신호 dmx1과 제1 인코딩부(202)에서 출력된 다운믹스 신호 dmx2를 이용하여 인코딩할 수 있다. 여기서, 다운믹스 신호 dmx1와 다운믹스 신호 dmx2는 제2 인코딩부(203)에 스테레오 신호로 입력될 수 있다. 예를 들어, 제2 인코딩부(203)는 AAC, MP3 등이 될 수 있다. 제2 인코딩부(203)의 인코딩 결과는 bit3로 출력되고, bit3는 비트스트림 포멧터(204)로 입력된다. 비트스트림 포멧터(204)는 bit3를 비트스트림으로 변환할 수 있다.The second encoding unit 203 may encode using the downmix signal dmx 1 output from the first encoding unit 201 and the downmix signal dmx 2 output from the first encoding unit 202. Here, the downmix signal dmx 1 and the downmix signal dmx 2 may be input to the second encoding unit 203 as a stereo signal. For example, the second encoding unit 203 may be AAC, MP3, or the like. The encoding result of the second encoding unit 203 is output as bit3, and bit3 is input to the bitstream formatter 204. The bitstream formatter 204 can convert bit3 into a bitstream.
도 3은 제2 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.3 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the second embodiment.
도 3의 인코더는 제1 인코딩부(301), 제2 인코딩부(302), 제1 인코딩부(303), 제2 인코딩부(304) 및 비트스트림 포멧터(305)를 포함할 수 있다.The encoder of FIG. 3 may include a first encoding unit 301, a second encoding unit 302, a first encoding unit 303, a second encoding unit 304, and a bitstream formatter 305.
도 3에서 제1 인코딩부(301)와 제1 인코딩부(303)는 도 2의 제1 인코딩부(201) 및 제1 인코딩부(202)와 동일하게 동작할 수 있다. 즉, 제1 인코딩부(301)와 제1 인코딩부(303)는 Lfe 채널 신호를 이용하여 파라메트릭 코딩을 수행함으로써, Lfe 대역에서 공간큐인 CLD(Channel Level Difference)를 추출할 수 있다. 구체적으로, 제1 인코딩부(301)는 Lfe 채널 신호 Lfe1과 일반 채널 신호 xi를 이용하여 다운믹스 신호 dmx1을 생성할 수 있다. 그리고, 제1 인코딩부(303)는 Lfe 채널 신호 Lfe2과 일반 채널 신호 xi+1를 이용하여 다운믹스 신호 dmx2을 생성할 수 있다.In FIG. 3, the first encoding unit 301 and the first encoding unit 303 may operate in the same manner as the first encoding unit 201 and the first encoding unit 202 of FIG. 2. That is, the first encoding unit 301 and the first encoding unit 303 may extract channel level difference (CLD), which is a spatial cue, in the Lfe band by performing parametric coding using the Lfe channel signal. In detail, the first encoding unit 301 may generate the downmix signal dmx 1 using the Lfe channel signal Lfe 1 and the general channel signal x i . The first encoder 303 may generate the downmix signal dmx 2 using the Lfe channel signal Lfe 2 and the general channel signal x i + 1 .
그리고, 제1 인코딩부(301)의 인코딩 결과인 다운믹스 신호 dmx1은 모노 신호로서 제2 인코딩부(302)에 입력된다. 제2 인코딩부(302)는 다운믹스 신호 dmx1를 이용하여 bit3을 출력할 수 있다. 또한, 그리고, 제1 인코딩부(303)의 인코딩 결과인 다운믹스 신호 dmx2은 모노 신호로서 제2 인코딩부(302)에 입력된다. 제2 인코딩부(304)는 다운믹스 신호 dmx2를 이용하여 bit4를 출력할 수 있다.The downmix signal dmx 1, which is an encoding result of the first encoding unit 301, is input to the second encoding unit 302 as a mono signal. The second encoder 302 may output bit3 using the downmix signal dmx 1 . In addition, the downmix signal dmx 2 which is an encoding result of the first encoding unit 303 is input to the second encoding unit 302 as a mono signal. The second encoding unit 304 may output bit4 by using the downmix signal dmx 2 .
도 4는 제3 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.4 is a diagram illustrating an encoder for encoding a multichannel signal including an Lfe channel signal according to the third embodiment.
도 4를 참고하면, 인코더는 제1 인코딩부(401), 제2 인코딩부(402) 및 비트스트림 포멧터(403)를 포함할 수 있다. Lfe 채널 신호 Lfe1과 Lfe2는 서로 커플링되어 제1 인코딩부(401)에 입력될 수 있다. 그러면, 제1 인코딩부(401)는 Lfe 채널 신호 Lfe1과 Lfe2를 모노 신호인 다운믹스 신호 dmx3을 출력할 수 있다. 이 때, bit1은 제1 인코딩부(401)에서 파라메트릭 코딩을 통해 도출된 공간큐를 의미한다.Referring to FIG. 4, the encoder may include a first encoding unit 401, a second encoding unit 402, and a bitstream formatter 403. The Lfe channel signals Lfe 1 and Lfe 2 may be coupled to each other and input to the first encoding unit 401. Then, the first encoding unit 401 may output the downmix signal dmx 3 , which is a mono signal, for the Lfe channel signals Lfe 1 and Lfe 2 . In this case, bit1 means a spatial cue derived through parametric coding in the first encoding unit 401.
다운믹스 신호 dmx3은 제2 인코딩부(402)에 입력될 수 있다. 이 때, 제2 인코딩부(402)는 다운믹스 신호 dmx3에서 Lfe 대역을 코딩할 수 있다. USAC(Unified Speech And Audio Codec) 및 AAC(Advanced Audio Codec)은 Lfe 대역을 코딩할 수 있는 코딩 모드가 별도로 존재할 수 있다. 그러면, 제2 인코딩부(402)는 USAC 또는 AAC에서 제공하는 코딩 모드를 이용할 수 있다. 제2 인코딩부(402)에서 출력된 bit2와 제1 인코딩부(401)에서 출력된 bit1은 비트스트림 포멧터(403)를 통해 비트스트림으로 출력될 수 있다.The downmix signal dmx 3 may be input to the second encoding unit 402. In this case, the second encoding unit 402 may code the Lfe band in the downmix signal dmx 3 . USAC (Unified Speech And Audio Codec) and AAC (Advanced Audio Codec) may have a separate coding mode capable of coding the Lfe band. Then, the second encoding unit 402 may use a coding mode provided by USAC or AAC. Bit2 output from the second encoding unit 402 and bit1 output from the first encoding unit 401 may be output as a bitstream through the bitstream formatter 403.
도 5는 제4 실시예에 따라 Lfe 채널 신호를 포함하는 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.FIG. 5 illustrates an encoder for encoding a multichannel signal including an Lfe channel signal according to the fourth embodiment.
도 5를 참고하면, 인코더는 지연부(501), 제2 인코딩부(502), 지연부(503), 제2 인코딩부(504) 및 비트스트림 포멧터(505)를 포함할 수 있다. 도 5는 앞서 설명한 제1 인코딩부를 거치지 않고, 제2 인코딩부(502)와 제2 인코딩부(504)를 이용하여 Lfe 채널 신호를 인코딩하는 과정을 나타낸다.Referring to FIG. 5, the encoder may include a delay unit 501, a second encoding unit 502, a delay unit 503, a second encoding unit 504, and a bitstream formatter 505. 5 illustrates a process of encoding an Lfe channel signal using the second encoding unit 502 and the second encoding unit 504 without passing through the first encoding unit described above.
도 5에서 제2 인코딩부(502)와 제2 인코딩부(504)는 Lfe 대역에 대해 파라메트릭 코딩을 수행할 수 있다. 제2 인코딩부(502)와 제2 인코딩부(504)을 위한 입력 신호는 제1 인코딩부가 존재한 경우에 대응하여 지연될 필요가 있다. 왜냐하면, 일반 채널 신호들이 2번의 인코딩 과정이 적용되고, Lfe 채널 신호가 1번의 인코딩 과정이 적용되는 경우, 일반 채널 신호들은 1번 더 인코딩 과정을 더 적용됨으로써 인코딩 과정으로 인한 시간 지연이 발생될 수 있기 때문이다. 이와 같은 시간 지연이 고려되어야만 Lfe 채널 신호 및 일반 채널 신호 간에 동기화된 비트스트림이 생성될 수 있다.In FIG. 5, the second encoder 502 and the second encoder 504 may perform parametric coding on the Lfe band. The input signals for the second encoding unit 502 and the second encoding unit 504 need to be delayed corresponding to the case where the first encoding unit is present. If the general channel signals have two encoding processes and the Lfe channel signal has one encoding process, the normal channel signals have one more encoding process, which may cause a time delay due to the encoding process. Because there is. This time delay must be taken into account to generate a synchronized bitstream between the Lfe channel signal and the normal channel signal.
그래서, 지연부(501)와 지연부(503)는 실제로 인코딩이 수행될 때 발생될 수 있는 시간 지연(
Figure PCTKR2014006406-appb-I000001
)을 Lfe 채널 신호 Lfe1과 Lfe 채널 신호 Lfe2에 각각 적용할 수 있다. 그러면, 시간 지연이 적용된 Lfe 채널 신호 Lfe1(n-
Figure PCTKR2014006406-appb-I000002
)와 Lfe2(n-
Figure PCTKR2014006406-appb-I000003
)는 각각 제2 인코딩부(502)와 제2 인코딩부(504)에 입력될 수 있다. 제2 인코딩부(502)와 제2 인코딩부(504)의 인코딩 결과인 bit 1 및 bit 2는 각각 비트스트림 포멧터(505)를 거쳐 비트스트림으로 출력될 수 있다.
Thus, delay unit 501 and delay unit 503 are time delays that may occur when encoding is actually performed.
Figure PCTKR2014006406-appb-I000001
) Can be applied to the Lfe channel signal Lfe 1 and the Lfe channel signal Lfe 2 , respectively. Then, Lfe channel signal Lfe 1 (n- with time delay)
Figure PCTKR2014006406-appb-I000002
) And Lfe 2 (n-
Figure PCTKR2014006406-appb-I000003
) May be input to the second encoding unit 502 and the second encoding unit 504, respectively. Bits 1 and 2, which are encoding results of the second encoding unit 502 and the second encoding unit 504, may be output as bitstreams through the bitstream formatter 505, respectively.
도 6은 도 2의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.FIG. 6 illustrates a decoder for decoding the encoded result of FIG. 2.
도 6을 참고하면, 디코더는 비트스트림 디포멧터(601), 제1 디코딩부(602), 제2 디코딩부(603) 및 제2 디코딩부(604)를 포함할 수 있다. 도 6은 도 2과 반대로 동작할 수 있다.Referring to FIG. 6, the decoder may include a bitstream formatter 601, a first decoding unit 602, a second decoding unit 603, and a second decoding unit 604. FIG. 6 may operate in an inverse manner to FIG. 2.
비트스트림 디포멧터(601)에 입력되는 비트스트림은 도 2에서 생성된 비트스트림일 수 있다. 비트스트림 디포멧터(601)는 비트스트림으로부터 bit 1, bit 2 및 bit 3를 출력할 수 있다. bit 1, bit 2 및 bit 3은 도 2에서 설명된 것과 동일하다.The bitstream input to the bitstream formatter 601 may be a bitstream generated in FIG. 2. The bitstream formatter 601 may output bit 1, bit 2, and bit 3 from the bitstream. bit 1, bit 2 and bit 3 are the same as described in FIG.
bit3는 제1 디코딩부(602)에 입력될 수 있다. 그러면, 제1 디코딩부(602)는 bit3을 이용하여 다운믹스 신호 dmx1과 dmx2를 생성할 수 있다. 이 후, 제2 디코딩부(603)는 공간큐인 bit1과 다운믹스 신호 dmx1을 파라메트릭 코딩하여 일반 채널 신호 xi과 Lfe 채널 신호 Lfe1을 출력할 수 있다. 마찬가지로, 제2 디코딩부(604)는 공간큐인 bit2과 다운믹스 신호 dmx2을 파라메트릭 코딩하여 일반 채널 신호 xi+1과 Lfe 채널 신호 Lfe2를 출력할 수 있다.bit3 may be input to the first decoding unit 602. Then, the first decoding unit 602 may generate the downmix signals dmx 1 and dmx 2 using bit3. Thereafter, the second decoding unit 603 may parametric code bit1, which is a spatial cue, and the downmix signal dmx 1 , and output the general channel signal x i and the Lfe channel signal Lfe 1 . Similarly, the second decoding unit 604 may output the general channel signal x i + 1 and the Lfe channel signal Lfe 2 by parametric coding the bit2 and the downmix signal dmx 2 which are spatial cues.
도 7은 도 3의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.7 illustrates a decoder for decoding the encoded result of FIG. 3.
도 7을 참고하면, 디코더는 비트스트림 디포멧터(701), 제1 디코딩부(702), 제2 디코딩부(703), 제1 디코딩부(704) 및 제2 디코딩부(705)를 포함할 수 있다. 도 7은 도 3과 반대로 동작할 수 있다.Referring to FIG. 7, the decoder includes a bitstream formatter 701, a first decoding unit 702, a second decoding unit 703, a first decoding unit 704, and a second decoding unit 705. can do. FIG. 7 may operate in an inverse manner to FIG. 3.
비트스트림 디포멧터(701)에 입력되는 비트스트림은 도 3에서 생성된 비트스트림일 수 있다. 비트스트림 디포멧터(601)는 비트스트림으로부터 bit 1, bit 2, bit 3, bit 4를 출력할 수 있다. bit 1, bit 2, bit 3, bit 4는 도 3에서 설명된 것과 동일하다.The bitstream input to the bitstream formatter 701 may be a bitstream generated in FIG. 3. The bitstream formatter 601 may output bit 1, bit 2, bit 3, and bit 4 from the bitstream. bit 1, bit 2, bit 3, and bit 4 are the same as described in FIG.
bit3은 제1 디코딩부(702)에 입력되고, bit4는 제1 디코딩부(704)에 입력될 수 있다. 그러면, 제1 디코딩부(702)는 bit3을 이용하여 다운믹스 신호 dmx1을 생성할 수 있다. 그리고, 제1 디코딩부(704)는 bit4를 이용하여 다운믹스 신호 dmx2를 생성할 수 있다. bit3 may be input to the first decoding unit 702 and bit4 may be input to the first decoding unit 704. Then, the first decoding unit 702 may generate the downmix signal dmx 1 using bit3. The first decoder 704 may generate the downmix signal dmx 2 using bit4.
이 후, 제2 디코딩부(703)는 공간큐인 bit1과 다운믹스 신호 dmx1을 파라메트릭 코딩하여 일반 채널 신호 xi과 Lfe 채널 신호 Lfe1을 출력할 수 있다. 마찬가지로, 제2 디코딩부(604)는 공간큐인 bit2과 다운믹스 신호 dmx2을 파라메트릭 코딩하여 일반 채널 신호 xi+1과 Lfe 채널 신호 Lfe2를 출력할 수 있다.Thereafter, the second decoding unit 703 may output the general channel signal x i and the Lfe channel signal Lfe 1 by parametric coding bit1, which is a spatial cue, and the downmix signal dmx 1 . Similarly, the second decoding unit 604 may output the general channel signal x i + 1 and the Lfe channel signal Lfe 2 by parametric coding the bit2 and the downmix signal dmx 2 which are spatial cues.
도 8은 도 4의 인코딩된 결과를 디코딩하는 디코딩하는 디코더를 도시한 도면이다.8 is a diagram illustrating a decoder to decode the encoded result of FIG. 4.
도 8을 참고하면, 디코더는 비트스트림 디포멧터(801), 제1 디코딩부(802), 제2 디코딩부(803)를 포함할 수 있다. 도 8은 도 4와 반대로 동작할 수 있다.Referring to FIG. 8, the decoder may include a bitstream formatter 801, a first decoding unit 802, and a second decoding unit 803. FIG. 8 may operate in an inverse manner to FIG. 4.
비트스트림 디포멧터(801)에 입력되는 비트스트림은 도 4에서 생성된 비트스트림일 수 있다. 비트스트림 디포멧터(601)는 비트스트림으로부터 bit 1, bit 2, 를 출력할 수 있다. bit 1, bit 2는 도 4에서 설명된 것과 동일하다.The bitstream input to the bitstream formatter 801 may be a bitstream generated in FIG. 4. The bitstream formatter 601 may output bit 1, bit 2, from the bitstream. bit 1 and bit 2 are the same as described in FIG.
bit1은 제1 디코딩부(802)에 입력되고, bit2는 제2 디코딩부(803)에 입력될 수 있다. 그러면, 제1 디코딩부(802)는 bit3을 이용하여 다운믹스 신호 dmx3을 생성할 수 있다. 제2 디코딩부(803)는 공간큐인 bit2과 다운믹스 신호 dmx3을 파라메트릭 코딩하여 Lfe 채널 신호 Lfe1와 Lfe2을 출력할 수 있다. 도 8에서 제1 디코딩부(802)와 제2 디코딩부(803)는 입력된 다운믹스 신호 dmx3 Lfe 대역에 대해 파라메트릭 코딩할 수 있다.bit1 may be input to the first decoding unit 802, and bit2 may be input to the second decoding unit 803. Then, the first decoding unit 802 may generate the downmix signal dmx 3 using bit3. The second decoding unit 803 may output Lfe channel signals Lfe 1 and Lfe 2 by parametric coding the spatial cue bit 2 and the downmix signal dmx 3 . In FIG. 8, the first decoding unit 802 and the second decoding unit 803 may include the input downmix signal dmx 3 . Parametric coding can be performed for the Lfe band.
도 9는 도 5의 인코딩된 결과를 디코딩하는 디코딩하는 디코더를 도시한 도면이다.9 is a diagram illustrating a decoder for decoding the encoded result of FIG. 5.
도 9를 참고하면, 디코더는 비트스트림 디포멧터(901), 제1 디코딩부(902), 지연부(903), 제1 디코딩부(904) 및 지연부(905)를 포함할 수 있다. 도 9는 도 5와 반대로 동작할 수 있다.Referring to FIG. 9, the decoder may include a bitstream formatter 901, a first decoding unit 902, a delay unit 903, a first decoding unit 904, and a delay unit 905. FIG. 9 may operate in an inverse manner to FIG. 5.
비트스트림 디포멧터(901)에 입력되는 비트스트림은 도 5에서 생성된 비트스트림일 수 있다. 비트스트림 디포멧터(601)는 비트스트림으로부터 bit 1, bit 2 를 출력할 수 있다. bit 1, bit 2는 도 5에서 설명된 것과 동일하다.The bitstream input to the bitstream formatter 901 may be a bitstream generated in FIG. 5. The bitstream formatter 601 may output bit 1 and bit 2 from the bitstream. bit 1 and bit 2 are the same as described in FIG.
bit1은 제1 디코딩부(902)에 입력되고, bit2는 제1 디코딩부(904)에 입력될 수 있다. 제1 디코딩부(902)는 bit1을 이용하여 Lfe 채널 신호인 Lfe1(n-
Figure PCTKR2014006406-appb-I000004
)를 생성하고, 제2 디코딩부(904)는 bit2를 이용하여 Lfe 채널 신호인 Lfe2(n-
Figure PCTKR2014006406-appb-I000005
)를 생성할 수 있다.
bit1 may be input to the first decoding unit 902 and bit2 may be input to the first decoding unit 904. The first decoding unit 902 uses Lfe 1 as the Lfe channel signal (n−) using bit1.
Figure PCTKR2014006406-appb-I000004
), And the second decoding unit 904 generates Lfe 2 (n−), which is an Lfe channel signal using bit2.
Figure PCTKR2014006406-appb-I000005
) Can be created.
그러면, 지연부(903)는 Lfe 채널 신호인 Lfe1(n-
Figure PCTKR2014006406-appb-I000006
)에 대해 시간 지연하여 Lfe1(n-
Figure PCTKR2014006406-appb-I000007
-
Figure PCTKR2014006406-appb-I000008
)를 출력할 수 있다. 마찬가지로, 지연부(905)는 Lfe 채널 신호인 Lfe2(n-
Figure PCTKR2014006406-appb-I000009
)에 대해 시간 지연하여 Lfe2(n-
Figure PCTKR2014006406-appb-I000010
-
Figure PCTKR2014006406-appb-I000011
)를 출력할 수 있다.
Then, the delay unit 903 is Lfe 1 (n−) which is an Lfe channel signal.
Figure PCTKR2014006406-appb-I000006
Time delay for Lfe 1 (n-
Figure PCTKR2014006406-appb-I000007
-
Figure PCTKR2014006406-appb-I000008
) Can be printed. Similarly, the delay unit 905 is a Lfe channel signal Lfe 2 (n-
Figure PCTKR2014006406-appb-I000009
Time delay for Lfe 2 (n-
Figure PCTKR2014006406-appb-I000010
-
Figure PCTKR2014006406-appb-I000011
) Can be printed.
즉, 도 9에 의하면, 도 6 내지 도 8과 달리 1번의 디코딩 과정만 거치기 때문에, 2번의 디코딩 과정을 거치는 경우와 동기화될 수 있도록 지연부(903)와 지연부(905)에 의해 1번의 디코딩이 수행될 때의 시간 지연(
Figure PCTKR2014006406-appb-I000012
)이 적용될 수 있다.
That is, according to FIG. 9, unlike FIG. 6 to FIG. 8, since only one decoding process is performed, one decoding is performed by the delay unit 903 and the delay unit 905 to be synchronized with the case where the two decoding processes are performed. Time delay when
Figure PCTKR2014006406-appb-I000012
) May be applied.
도 10은 도 2의 인코더를 이용하여 다채널 신호를 인코딩하는 과정을 도시한 도면이다.FIG. 10 is a diagram illustrating a process of encoding a multi-channel signal using the encoder of FIG. 2.
도 10은 도 2에서 설명된 Type1의 인코더가 적용된 다채널 신호를 위한 인코더를 의미한다. 도 10에 표현된 TTO(Two To One)(1001, 1002, 1004, 1005)는)는 MPEG Surround의 스테레오 신호에 대한 파라메트릭 코딩 방식에 따라 입력 신호를 인코딩할 수 있다. 즉, TTO는 도 2에서 설명한 제1 인코딩부에 대응하며, USAC Encoder는 제2 인코딩부에 대응할 수 있다.FIG. 10 means an encoder for a multi-channel signal to which an encoder of Type 1 described in FIG. 2 is applied. Two To One (TTO) 1001, 1002, 1004, and 1005 represented in FIG. 10 may encode an input signal according to a parametric coding scheme for a stereo signal of MPEG Surround. That is, the TTO may correspond to the first encoding unit described with reference to FIG. 2, and the USAC Encoder may correspond to the second encoding unit.
도 10에서, TTO(1001), TTO(1002)는 일반 모드에 따라 파라메트릭 코딩을 수행하고, TTO(1004) 및 TTO(1005)는 Lfe 모드에 따라 파라메트릭 코딩을 수행할 수 있다. 일반 모드에 따라 파라메트릭 코딩을 수행하는 경우, 일반 채널 신호(xi)를 분석하여 공간큐인 CLD(Channel Level Difference), ICC(Inter-Channel Coherence), IPD(Interchannel Phase Difference)를 추출할 수 있다. 그리고, Lfe 모드에 따라 파라메트릭 코딩을 수행하는 경우, 입력된 Lfe 채널 신호의 Lfe 대역에서 CLD만 추출할 수 있다.In FIG. 10, the TTO 1001 and the TTO 1002 perform parametric coding according to a normal mode, and the TTO 1004 and TTO 1005 may perform parametric coding according to the Lfe mode. When performing parametric coding according to the general mode, the general channel signal (x i ) can be analyzed to extract the spatial cues, Channel Level Difference (CLD), Inter-Channel Coherence (ICC), and Interchannel Phase Difference (IPD). have. When parametric coding is performed according to the Lfe mode, only the CLD may be extracted from the Lfe band of the input Lfe channel signal.
도 10의 경우, N개의 다채널 신호가 입력된 경우에 인코딩하는 과정을 나타낸다. 구체적으로, N개의 다채널 신호는 1단계로, TTO를 거쳐서 파라메트릭 부호화가 되어 M개의 다운믹스 신호(dmx1~dmxM)로 변환될 수 있다. 그리고, 2단계로 M개의 다운믹스 신호는 스테레오 형태로 입력받아 USAC 코어 코딩을 통해 인코딩될 수 있다. 도 10에서, Lfe 채널 신호 Lfe1 및 Lfe2는 일반 채널 신호와 커플링되어 TTO(1004) 및 TTO(1005)에 입력될 수 있다.10 illustrates a process of encoding when N multi-channel signals are input. In detail, the N multichannel signals may be parametrically encoded through TTO in one step and may be converted into M downmix signals dmx 1 to dmx M. In the second step, M downmix signals may be input in stereo form and encoded through USAC core coding. In FIG. 10, the Lfe channel signals Lfe 1 and Lfe 2 may be coupled to the general channel signal and input to the TTO 1004 and the TTO 1005.
즉, 도 10을 참고하면, 다채널 신호에서 일반 채널 신호는 2채널씩 커플링되어 다운믹스되고, 다운믹스된 결과는 USAC 인코더에 따라 스테레오 코딩이 수행될 수 있다. 한편, 다채널 신호에 포함된 일반 채널 신호들 중 2개의 일반 채널 신호 x2M-1과 x2M는 Lfe 채널 신호인 Lfe1, Lfe2와 각각 커플링되어 TTO(Lfe)에 입력될 수 있다. That is, referring to FIG. 10, in the multi-channel signal, the general channel signal is downmixed by two channels, and the downmixed result may be stereo coded according to the USAC encoder. Meanwhile, two general channel signals x 2M-1 and x 2M among the general channel signals included in the multi-channel signal may be coupled to Lfe1 and Lfe2, which are Lfe channel signals, and input to TTO (Lfe).
도 10의 경우, 도 2에 설명된 Type 1의 인코더가 적용된 결과를 설명하고 있으나, Type 1의 인코더 대신 도 3에 설명된 Type 2의 인코더도 적용될 수 있다.In FIG. 10, the result of applying the type 1 encoder described in FIG. 2 is described. However, the type 2 encoder described in FIG. 3 may also be applied instead of the type 1 encoder.
도 11은 도 10의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.FIG. 11 is a diagram illustrating a decoder for decoding the encoded result of FIG. 10.
도 11은 도 6에 도시된 Type 1의 디코더가 적용된 다채널 신호를 위한 디코더를 의미한다. 도 11에 표현된 OTT(One To Two)(1103, 1104, 1106, 1107)는 MPEG Surround의 스테레오 신호에 대한 파라메트릭 코딩 방식에 따라 입력 신호를 디코딩할 수 있다. 즉, OTT는 도 6에서 설명한 제2 디코딩부에 대응하며, USAC Decoder는 제1 디코딩부에 대응할 수 있다.FIG. 11 means a decoder for a multi-channel signal to which a type 1 decoder shown in FIG. 6 is applied. One to two (OTT) 1103, 1104, 1106, and 1107 represented in FIG. 11 may decode an input signal according to a parametric coding scheme for a stereo signal of MPEG surround. That is, the OTT may correspond to the second decoding unit described with reference to FIG. 6, and the USAC decoder may correspond to the first decoding unit.
도 11에서, OTT(1103), OTT(1104)는 일반 모드에 따라 파라메트릭 코딩을 수행하고, OTT(1006) 및 OTT(1107)는 Lfe 모드에 따라 파라메트릭 코딩을 수행할 수 있다. 도 11의 경우, 인코딩된 결과에 디코딩됨으로써 N개의 다채널 오디오 신호가 출력될 수 있다. In FIG. 11, the OTT 1103 and the OTT 1104 may perform parametric coding according to the normal mode, and the OTT 1006 and the OTT 1107 may perform parametric coding according to the Lfe mode. In the case of FIG. 11, N multichannel audio signals may be output by being decoded in an encoded result.
구체적으로, 비트스트림을 통해 출력된 결과는 1단계로 USAC Decoder를 거쳐서 M개의 다운믹스 신호가 출력될 수 있다. 그리고, 2단계로 M개의 다운믹스 신호는 OTT에 각각 입력되어 스테레오 신호를 출력할 수 있다. OTT(1103), OTT(1104)는 2개의 일반 채널 신호를 출력하고, OTT(1006) 및 OTT(1107)는 일반 채널 신호와 Lfe 채널 신호가 커플링된 결과를 출력할 수 있다.In detail, M downmix signals may be output through the USAC decoder in one step as a result output through the bitstream. In addition, M downmix signals may be input to the OTT in two steps to output stereo signals. The OTT 1103 and the OTT 1104 may output two general channel signals, and the OTT 1006 and the OTT 1107 may output a result of combining the general channel signal and the Lfe channel signal.
도 12는 도 10에서 인코딩 비트가 충분한 경우, 다채널 신호를 인코딩하는 과정을 도시한 도면이다.FIG. 12 is a diagram illustrating a process of encoding a multichannel signal when sufficient encoding bits are shown in FIG. 10.
다채널 신호에 포함된 일반 채널 신호의 인코딩 비트가 충분한 경우, 도 12와 같이 인코딩 과정이 수행될 수 있다. 즉, 일반 채널 신호인 x1 내지 x2M-2는 USAC Encoder(1203, 1206)에 의해 인코딩될 수 있다. 이 때, 일반 채널 신호인 x1 내지 x2M-2는 지연부(1201, 1201, 1204, 1205)를 거쳐 인코딩이 수행될 때의 시간 지연(
Figure PCTKR2014006406-appb-I000013
)이 적용될 수 있다. 그러면, 시간 지연이 적용된 결과가 USAC Encoder(1203, 1206)에 의해 인코딩될 수 있다.
If the encoding bits of the general channel signal included in the multichannel signal are sufficient, an encoding process may be performed as shown in FIG. 12. That is, general channel signals x 1 to x 2M-2 may be encoded by USAC Encoder 1203 and 1206. In this case, the general channel signals x 1 to x 2M-2 are time delays when encoding is performed through the delay units 1201, 1201, 1204, and 1205.
Figure PCTKR2014006406-appb-I000013
) May be applied. The result with time delay applied can then be encoded by USAC Encoder 1203, 1206.
여기서, 시간 지연은 OTT(1207, 1208)에서 발생하는
Figure PCTKR2014006406-appb-I000014
로서, QMF analysis , Hybrid Analysis 및 QMF synthesis에 의한 시간 지연으로 구성될 수 있다. 만일에 USAC Encoder(1209)에 입력되는 신호가 QMF (Quadrature Mirror Filterbank) 신호인 경우,
Figure PCTKR2014006406-appb-I000015
를 계산할 때, QMF synthesis에 의해 발생되는 시간 지연은 제외될 수 있다.
Here, the time delay occurs at OTT 1207, 1208.
Figure PCTKR2014006406-appb-I000014
It can be configured as time delay by QMF analysis, Hybrid Analysis and QMF synthesis. If the signal input to USAC Encoder 1209 is a QMF (Quadrature Mirror Filterbank) signal,
Figure PCTKR2014006406-appb-I000015
When calculating, the time delay caused by QMF synthesis can be excluded.
도 13은 도 12의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.13 is a diagram illustrating a decoder for decoding the encoded result of FIG. 12.
도 13은 도 12의 과정의 반대로 진행될 수 있다. 도 13을 참고하면, 일반 채널 신호는 USAC Decoder(1302, 1305)를 통해 디코딩된 후, 지연부(1303, 1304, 1306, 1307)를 거쳐 출력될 수 있다. 그리고, 비트스트림 포멧터(1301)를 통해 도출된 결과는 USAC Decoder(1308)을 통해 디코딩되어 다운믹스 신호가 생성되며, 다운믹스 신호는 OTT(1309, 1310)에 각각 입력되어 일반 채널 신호 x2M-1, x2M과 Lfe 채널 신호 Lfe1, Lfe2가 커플링된 결과가 출력될 수 있다.FIG. 13 may be reversed from the process of FIG. 12. Referring to FIG. 13, the general channel signal may be decoded through the USAC decoders 1302 and 1305 and then output through the delay units 1303, 1304, 1306, and 1307. The result obtained through the bitstream formatter 1301 is decoded by the USAC Decoder 1308 to generate a downmix signal. The downmix signal is input to the OTTs 1309 and 1310, respectively, to provide a general channel signal x 2M. The result of coupling -1 , x 2M and Lfe channel signals Lfe 1 and Lfe 2 can be output.
이 때, Lfe 채널 신호는 2번의 디코딩 과정을 거치기 때문에, USAC Decoder(1302, 1305)를 통해 출력된 결과는 지연부(1303, 1304, 1306, 1307)에 의해 1번의 디코딩 과정을 통해 발생되는 시간 지연인
Figure PCTKR2014006406-appb-I000016
가 적용될 수 있다. 여기서,
Figure PCTKR2014006406-appb-I000017
는 QMF analysis, Hybrid Analysis, QMF synthesis 및 filtering delay로 구성되며,
Figure PCTKR2014006406-appb-I000018
와 다르다. 만일에 USAC Decoder(1302, 1305)에서 출력된 신호가 QMF신호인 경우,
Figure PCTKR2014006406-appb-I000019
를 결정할 때 QMF analysis에서 발생하는 시간 지연은 제외될 수 있다. Filtering delay는 QMF 변환과정과 상관없이 OTT(1309, 1310)에서 수행하는 필터링 연산으로 인해 발생하는 시간 지연을 의미한다. 예를 들어, Filtering delay는 OTT(1309, 1310)에서 수행되는 디코릴레이터(decorrelator) 연산 과정에서 발생하는 시간 지연일 수 있다.
In this case, since the Lfe channel signal undergoes two decoding processes, the time outputted through the USAC Decoders 1302 and 1305 is generated by one decoding process by the delay units 1303, 1304, 1306, and 1307. Delay person
Figure PCTKR2014006406-appb-I000016
Can be applied. here,
Figure PCTKR2014006406-appb-I000017
Consists of QMF analysis, Hybrid Analysis, QMF synthesis and filtering delay,
Figure PCTKR2014006406-appb-I000018
Is different from If the signal output from USAC Decoder (1302, 1305) is a QMF signal,
Figure PCTKR2014006406-appb-I000019
The time delay incurred in the QMF analysis can be excluded when determining. The filtering delay refers to a time delay caused by the filtering operation performed by the OTTs 1309 and 1310 regardless of the QMF conversion process. For example, the filtering delay may be a time delay occurring during a decorrelator operation performed by the OTTs 1309 and 1310.
도 14는 도 4의 인코더를 이용하여 다채널 신호를 인코딩하는 일례를 도시한 도면이다.FIG. 14 illustrates an example of encoding a multi-channel signal using the encoder of FIG. 4.
도 14를 참고하면, 도 4에서 설명된 Type 3의 인코더가 이용될 수 있다. 다채널 신호에서 일반 채널 신호인 x1 내지 x2M은 2개씩 커플링되어 TTO(1401, 1402)에 입력될 수 있다. TTO(1401, 1402)는 2개씩 커플링된 일반 채널 신호를 파라메트릭 코딩하여 공간큐와 함께 다운믹스 신호 dmx1, dmx2를 출력할 수 있다. 출력된 다운믹스 신호 dmx1, dmx2는 스테레오 형태로 USAC Encoder(1403)에 입력될 수 있다.Referring to FIG. 14, the type 3 encoder described in FIG. 4 may be used. In the multi-channel signal, general channel signals x 1 to x 2M may be coupled to each other and input to the TTOs 1401 and 1402. The TTOs 1401 and 1402 may parametric-code the general channel signals coupled by two to output downmix signals dmx 1 and dmx 2 together with spatial cues. The output downmix signals dmx 1 and dmx 2 may be input to the USAC Encoder 1403 in a stereo form.
한편, 다채널 신호에 포함된 Lfe 채널 신호 Lfe1과 Lfe2는 2개씩 커플링되어 TTO(1404)에 입력될 수 있다. TTO(1404)는 2개의 Lfe 채널 신호 Lfe1과 Lfe2를 이용하여 파라메트릭 코딩을 수행하여 모노 형태의 다운믹스 신호 dmx3를 출력할 수 있다. 그러면, USAC Encoder(1405)는 다운믹스 신호 dmx3에서 Lfe 모드에 따라 인코딩할 수 있다.Meanwhile, two Lfe channel signals Lfe 1 and Lfe 2 included in the multichannel signal may be coupled to each other and input to the TTO 1404. The TTO 1404 may output a mono downmix signal dmx 3 by performing parametric coding using two Lfe channel signals Lfe 1 and Lfe 2 . Then, the USAC Encoder 1405 may encode according to the Lfe mode in the downmix signal dmx 3 .
도 15는 도 4의 인코더를 이용하여 다채널 신호를 인코딩하는 다른 예를 도시한 도면이다.FIG. 15 illustrates another example of encoding a multichannel signal using the encoder of FIG. 4.
도 15를 참고하면, 도 4에서 설명된 Type 3의 인코더가 이용될 수 있다. 다만, 도 15는 도 14와 달리 일반 채널 신호는 TTO(1401, 1402)에 의해 파라메트릭 인코딩되지 않고, USAC Encoder(1503, 1506)에 의해 인코딩될 수 있다. 이하에서 설명되는 것과 같이 Lfe 채널 신호는 TTO(1507)과 USAC Encoder(1508)를 통해 2번의 인코딩 과정을 거치기 때문에, TTO(1507)에 의해 발생된 시간 지연만큼 지연부(1501, 1502, 1504, 1505)가 일반 채널 신호에 대해 시간 지연을 적용할 수 있다.Referring to FIG. 15, an encoder of Type 3 described in FIG. 4 may be used. However, in FIG. 15, unlike in FIG. 14, the general channel signal is not parametrically encoded by the TTOs 1401 and 1402, but may be encoded by the USAC Encoders 1503 and 1506. As described below, since the Lfe channel signal undergoes two encoding processes through the TTO 1507 and the USAC Encoder 1508, the delay units 1501, 1502, 1504, and the like are delayed by the time delay generated by the TTO 1507. 1505 may apply a time delay to the normal channel signal.
한편, Lfe 채널 신호 Lfe1, Lfe2는 TTO(1507)에서 Lfe 모드에 따라 인코딩되어 다운믹스 신호 dmx3로 출력되고, 다운믹스 신호 dmx3는 USAC Encoder에 의해 인코딩될 수 있다.Meanwhile, the Lfe channel signals Lfe 1 and Lfe 2 are encoded according to the Lfe mode in the TTO 1507 and output as the downmix signal dmx 3 , and the downmix signal dmx 3 may be encoded by the USAC Encoder.
도 14 내지 도 15는 인코더에 대한 설명이나, 이에 대응하는 디코더도 반대 과정으로 설명될 수 있다. 구체적으로, 도 14에서 도출된 비트스트림으로부터 USAC Decoder와 OTT를 거쳐 일반 채널 신호가 출력될 수 있다. 그리고, 도 14에서 도출된 비트스트림으로부터 USAC Decoder와 OTT를 거쳐 Lfe 채널 신호 Lfe1 및 Lfe2가 출력될 수 있다.14 to 15 illustrate an encoder, but a corresponding decoder may also be described in a reverse process. Specifically, a general channel signal may be output from the bitstream derived from FIG. 14 via USAC decoder and OTT. In addition, Lfe channel signals Lfe 1 and Lfe 2 may be output from the bitstream derived from FIG. 14 via USAC decoder and OTT.
그리고, 도 15에서 도출된 비트스트림으로부터 USAC Decoder와 지연부를 거쳐 일반 채널 신호가 출력될 수 있다. 또한, 도 15에서 도출된 비트스트림으로부터 USAC Decoder와 OTT를 거쳐 Lfe 채널 신호 Lfe1 및 Lfe2가 출력될 수 있다.In addition, a general channel signal may be output from the bitstream derived from FIG. 15 via a USAC decoder and a delay unit. In addition, the Lfe channel signals Lfe 1 and Lfe 2 may be output from the bitstream derived from FIG. 15 via USAC decoder and OTT.
도 16은 도 5의 인코더를 이용하여 다채널 신호를 인코딩하는 다른 예를 도시한 도면이다.FIG. 16 illustrates another example of encoding a multichannel signal using the encoder of FIG. 5.
도 16을 참고하면, 도 5의 Type 4의 인코더가 적용된 다채널 신호를 위한 인코더가 도시된다.Referring to FIG. 16, an encoder for a multichannel signal to which an encoder of Type 4 of FIG. 5 is applied is shown.
일반 채널 신호들은 TTO(1601, 1602)를 통해 다운믹스 신호로 변환되고, 변환된 다운믹스 신호는 USAC Encoder(1603)를 통해 비트스트림으로 출력될 수 있다.The general channel signals may be converted into downmix signals through the TTOs 1601 and 1602, and the converted downmix signals may be output as bitstreams through the USAC Encoder 1603.
한편, Lfe 채널 신호들은 지연부(1604, 1606)를 통해 TTO(1601, 1602)에서 발생된 시간 지연(
Figure PCTKR2014006406-appb-I000020
)가 적용되고, 시간 지연이 적용된 결과는 각각 USAC Encoder(1605, 1607)에 의해 Lfe 모드에 따라 인코딩될 수 있다. 즉, Lfe 채널 신호는 2단계의 인코딩 과정을 거치는 일반 채널 신호와 달리 1번의 인코딩 과정을 거치기 때문에 TTO에서 수행되는 인코딩을 통해 발생된 시간 지연
Figure PCTKR2014006406-appb-I000021
이 일반 채널에 적용될 필요가 있다.
On the other hand, the Lfe channel signals are delayed by the time delays generated by the TTOs 1601 and 1602 through the delay units 1604 and 1606.
Figure PCTKR2014006406-appb-I000020
) And the time delay applied result may be encoded according to Lfe mode by USAC Encoder 1605 and 1607, respectively. That is, the Lfe channel signal undergoes one encoding process, unlike the general channel signal which undergoes two-step encoding. Therefore, the time delay caused by the encoding performed by the TTO.
Figure PCTKR2014006406-appb-I000021
It needs to be applied to this generic channel.
도 17은 도 9의 디코더를 이용하여 다채널 신호를 디코딩하는 다른 예를 도시한 도면이다.17 is a diagram illustrating another example of decoding a multichannel signal using the decoder of FIG. 9.
도 17은 도 9의 Type 4의 디코더가 적용된 결과를 도시한다. 도 17에 의하면, USAC Decoder(1702)와 TTO(1703)를 통해 일반 채널 신호가 출력될 수 있다. 그리고, USAC Decoder(1705, 1707)과 지연부(1706, 1708)를 통해 Lfe 채널 신호가 출력될 수 있다.FIG. 17 illustrates a result of applying the type 4 decoder of FIG. 9. Referring to FIG. 17, a general channel signal may be output through the USAC Decoder 1702 and the TTO 1703. The Lfe channel signal may be output through the USAC decoders 1705 and 1707 and the delay units 1706 and 1708.
Lfe 채널 신호의 경우 1단계의 디코딩 과정만 거치기 때문에, TTO(1703, 1704)의 디코딩 과정에서 발생되는 시간 지연
Figure PCTKR2014006406-appb-I000022
가 지연부(1706, 1708)를 통해 적용될 필요가 있다. 그래야, 디코더를 통해 출력된 일반 채널 신호와 Lfe 채널 신호 간에 동기화가 될 수 있다.
In the case of the Lfe channel signal, since only one step of decoding is performed, a time delay generated during decoding of the TTOs 1703 and 1704 is performed.
Figure PCTKR2014006406-appb-I000022
Needs to be applied through delay units 1706 and 1708. Thus, the Lfe channel signal can be synchronized with the normal channel signal output through the decoder.
도 18은 일실시예에 따른 다채널 신호에 Lfe 채널 신호가 홀수인 경우, 다채널 신호를 인코딩하는 인코더를 도시한 도면이다.18 is a diagram illustrating an encoder for encoding a multichannel signal when an Lfe channel signal is odd in a multichannel signal according to an embodiment.
도 2 내지 도 17은 Lfe 채널 신호가 짝수인 경우를 설명하였으나, 도 18은 Lfe 채널 신호가 홀수인 경우를 설명하기로 한다.2 to 17 illustrate the case where the Lfe channel signal is even, but FIG. 18 illustrates the case where the Lfe channel signal is odd.
도 18을 참고하면, 1개의 Lfe 채널 신호 Lfe 2n+1는 지연부(1801)에 입력되어 시간 지연
Figure PCTKR2014006406-appb-I000023
이 적용될 수 있다. 그리고, 시간 지연이 적용된 Lfe 채널 신호는 제2 인코딩부(1802)를 통해 Lfe 모드에 따라 인코딩됨으로써, bit1이 출력될 수 있다. 결국, Lfe 채널 신호가 홀수인 경우, 도 5의 Type 4를 나타내는 인코더나 또는 도 9의 Type 4를 나타내는 디코더를 통해 처리될 수 있다.
Referring to FIG. 18, one Lfe channel signal Lfe 2n + 1 is input to the delay unit 1801 to delay time.
Figure PCTKR2014006406-appb-I000023
This can be applied. In addition, the Lfe channel signal to which the time delay is applied is encoded according to the Lfe mode through the second encoding unit 1802, so that bit1 may be output. As a result, when the Lfe channel signal is odd, the Lfe channel signal may be processed through an encoder indicating Type 4 of FIG. 5 or a decoder indicating Type 4 of FIG. 9.
도 18에서 도시되지 않았지만, Lfe 채널 신호와 달리 일반 채널 신호는 제1 인코딩부와 제2 인코딩부를 통해 인코딩되기 때문에, Lfe 채널 신호는 일반 채널 신호와의 동기화를 위해 제1 인코딩부에 의해 발생되는 시간 지연이 지연부(1801)를 통해 적용될 필요가 있다.Although not shown in FIG. 18, unlike the Lfe channel signal, since the normal channel signal is encoded through the first encoding unit and the second encoding unit, the Lfe channel signal is generated by the first encoding unit for synchronization with the general channel signal. The time delay needs to be applied through the delay unit 1801.
도 19는 일실시예에 따른 Lfe 채널 신호가 아닌 일반 오디오 신호를 인코딩하는 인코더를 도시한 도면이다.19 illustrates an encoder for encoding a general audio signal instead of an Lfe channel signal according to an embodiment.
도 19를 참고하면, 일반 채널 신호 x1, x2는 제1 인코딩부(1901)를 통해 파라메트릭 코딩이 적용되어 공간큐 bit 1과 함께 다운믹스 신호 dmx1로 변환될 수 있다. 비슷한 방식으로, 일반 채널 신호 x3, x4는 제1 인코딩부(1902)를 통해 파라메트릭 코딩이 적용되어 공간큐 bit 2과 함께 다운믹스 신호 dmx2로 변환될 수 있다.Referring to FIG. 19, parametric coding may be applied to the general channel signals x 1 and x 2 through the first encoding unit 1901 and converted into a downmix signal dmx 1 together with the spatial cue bit 1. In a similar manner, the general channel signals x 3 and x 4 may be converted into a downmix signal dmx 2 with spatial cue bit 2 by applying parametric coding through the first encoding unit 1902.
앞서 설명하였듯이, 일반 채널 신호에 적용되는 파라메트릭 코딩은 CLD 이외에 ICC, IPD와 같은 공간큐가 추출될 수 있다. 그러면, 다운믹스 신호 dmx1 및 dmx2는 스테레오 형태로 제2 인코딩부(1903)에 입력되어 인코딩됨으로써 bit3가 출력될 수 있다. bit3는 비트스트림 포멧터(1904)에 의해 비트스트림으로 변환될 수 있다.As described above, in the parametric coding applied to the general channel signal, spatial cues such as ICC and IPD may be extracted in addition to the CLD. Then, the downmix signals dmx 1 and dmx 2 may be input to the second encoding unit 1903 in stereo form and encoded to output bit3. bit3 may be converted into a bitstream by the bitstream formatter 1904.
도 20은 도 19의 인코딩된 결과를 디코딩하는 디코더를 도시한 도면이다.20 illustrates a decoder for decoding the encoded result of FIG. 19.
도 20을 참고하면, 도 19에서 생성된 비트스트림은 비트스트림 디포멧터(2001)에 의해 공간큐인 bit 1, bit2와 인코딩된 bit3가 출력될 수 있다. Referring to FIG. 20, in the bitstream generated in FIG. 19, bits 1 and bit 2, which are spatial cues, and encoded bit 3 may be output by the bitstream formatter 2001.
제1 디코딩부(2002)는 bit3를 디코딩하여 다운믹스 신호 dmx1 및 dmx2를 출력할 수 있다. 그리고, 제2 디코딩부(2003)는 다운믹스 신호 dmx1을 디코딩하여 일반 채널 신호 x1 및 x2를 출력할 수 있다. 마찬가지로, 제2 디코딩부(2004)는 다운믹스 신호 dmx2를 디코딩하여 일반 채널 신호 x1 및 x2를 출력할 수 있다.The first decoder 2002 may decode bit3 to output downmix signals dmx 1 and dmx 2 . The second decoder 2003 may decode the downmix signal dmx 1 to output general channel signals x 1 and x 2 . Similarly, the second decoding unit 2004 may output the normal channel signals x 1 and x 2 by decoding the downmix signal dmx 2 .
도 21은 일실시예에 따른 인코딩 과정과 디코딩 과정을 설명하는 도면이다.21 is a diagram illustrating an encoding process and a decoding process, according to an embodiment.
앞서 설명한 제1 인코딩부는 도 21에서 TTO(2101, 2102)에 대응하고, 제2 인코딩부는 도 21에서 USAC Encoder(2103)에 대응할 수 있다. 한편, 앞서 설명한 제1 디코딩부는 USAC Decoder(2104)에 대응하고, 제2 디코딩부는 OTT(2105, 2106)에 대응할 수 있다.The first encoding unit described above may correspond to the TTOs 2101 and 2102 in FIG. 21, and the second encoding unit may correspond to the USAC Encoder 2103 in FIG. 21. Meanwhile, the first decoding unit described above may correspond to the USAC decoder 2104, and the second decoding unit may correspond to the OTTs 2105 and 2106.
(i) 4개의 일반 채널 신호 또는 (ii) 1개의 일반 채널 신호와 1개의 Lfe 채널 신호가 커플링된 결과들은 TTO(2101, 2102)에 입력될 수 있다. 그러면, TTO(2101, 2102)는 파라메트릭 코딩을 통해 공간큐와 함께 다운믹스 신호를 생성할 수 있다. USAC Encoder(2103)는 다운믹스 신호를 인코딩할 수 있다.The results of (i) four general channel signals or (ii) one general channel signal and one Lfe channel signal may be input to the TTOs 2101 and 2102. Then, the TTOs 2101 and 2102 may generate the downmix signal together with the spatial cues through parametric coding. USAC Encoder 2103 may encode the downmix signal.
반대로, USAC Decoder(2104)는 비트스트림으로부터 2개의 다운믹스 신호를 출력할 수 있다. 그리고, OTT(2105, 2106)는 다운믹스 신호로부터 (i) 4개의 일반 채널 신호 또는 (ii) 1개의 일반 채널 신호와 1개의 Lfe 채널 신호가 커플링된 결과들을 출력할 수 있다.Conversely, USAC Decoder 2104 can output two downmix signals from the bitstream. The OTTs 2105 and 2106 may output (i) four general channel signals or (ii) one general channel signal and one Lfe channel signal from the downmix signal.
도 22는 제1 실시예에 따른 USAC 인코더와 USAC 디코더를 도시한 도면이다.22 is a diagram illustrating a USAC encoder and a USAC decoder according to the first embodiment.
앞서 설명한 실시예들은 USAC Encoder가 TTO와 별개로 구성되는 경우 또는 USAC Decoder가 OTT와 별개로 구성되는 경우를 설명하고 있다. 하지만, 도 22와 같이 USAC Encoder가 TTO(2203, 2204)를 포함하여 확장된 USAC Encoder(2201)로 구현될 수 있다. 마찬가지로, USAC Decoder가 OTT(2211, 2212)를 포함하여 확장된 USAC Decoder(2202)로 구현될 수 있다.The above-described embodiments describe a case where the USAC Encoder is configured separately from the TTO or the USAC Encoder is configured separately from the OTT. However, as shown in FIG. 22, the USAC Encoder may be implemented as an extended USAC Encoder 2201 including the TTOs 2203 and 2204. Similarly, USAC Decoder may be implemented with an extended USAC Decoder 2202 including OTTs 2211 and 2212.
(i) 4개의 일반 채널 신호 또는 (ii) 1개의 일반 채널 신호와 1개의 Lfe 채널 신호들은 TTO(2203, 2204)에 의해 파라메트릭 코딩되어 다운믹스 신호로 출력될 수 있다. TTO(2203, 2204)로부터 출력된 다운믹스 신호는 스테레오 형태로 TTO(2205)에 입력됨으로써 1번 더 파라메트릭 코딩될 수 있다. 파라메트릭 코딩된 결과는 SBR(2206)에 의해 주파수 확장되고, 주파수 확장되지 않은 코어 대역에 대해 Core Encoder(2207)가 인코딩할 수 있다.(i) four general channel signals or (ii) one general channel signal and one Lfe channel signals may be parametric coded by the TTOs 2203 and 2204 and output as a downmix signal. The downmix signal output from the TTOs 2203 and 2204 may be parametric coded once more by being input to the TTO 2205 in stereo form. The parametric coded result is frequency extended by the SBR 2206 and can be encoded by the Core Encoder 2207 for the unbanded core band.
그리고, 확장된 USAC Encoder(2201)에 의해 생성된 비트스트림은 Core Decoder(2208)에 의해 주파수 확장되지 않은 코어 대역이 디코딩되고, 디코딩된 결과는 SBR(2209)에 의해 입력되어 주파수 확장되어 원래 신호로 복원될 수 있다. 그러면, SBR(2209)에 의해 주파수 확장된 결과는 OTT(2210)에 의해 파라메트릭 코딩되어 2개의 다운믹스 신호가 생성되며, 생성된 다운믹스 신호는 OTT(2211, 2212)에 의해 파라메트릭 코딩되어 (i) 4개의 일반 채널 신호 또는 (ii) 1개의 일반 채널 신호와 1개의 Lfe 채널 신호들로 출력될 수 있다.In addition, the bitstream generated by the extended USAC Encoder 2201 is decoded by the Core Decoder 2208, which is not extended by the core band, and the decoded result is input by the SBR 2209 to be extended by the original frequency. Can be restored. Then, the result of the frequency extension by the SBR 2209 is parametric coded by the OTT 2210 to generate two downmix signals, and the generated downmix signal is parametric coded by the OTTs 2211 and 2212. It can be output as (i) four general channel signals or (ii) one general channel signal and one Lfe channel signals.
도 23은 제2 실시예에 따른 USAC 인코더와 USAC 디코더를 도시한 도면이다.FIG. 23 is a diagram illustrating a USAC encoder and a USAC decoder according to a second embodiment. FIG.
도 23은 도 22와 달리 확장된 USAC Encoder(2301)에서 SBR(2305)와 TTO(2306)의 위치가 변경되었고, 확장된 USAC Decoder(2302)에서 OTT(2309)와 SBR(2310)의 위치가 변경된 것을 알 수 있다. 이외에 나머지 구성들은 도 22에서 설명한 사항과 동일하게 적용될 수 있다.FIG. 23 illustrates that the positions of the SBR 2305 and the TTO 2306 are changed in the expanded USAC Encoder 2301 and the positions of the OTT 2309 and the SBR 2310 are extended in the extended USAC Decoder 2302. You can see the change. In addition, the remaining components may be applied in the same manner as described with reference to FIG. 22.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the devices and components described in the embodiments may be, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable arrays (FPAs), It may be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to the execution of the software. For convenience of explanation, one processing device may be described as being used, but one of ordinary skill in the art will appreciate that the processing device includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as parallel processors.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the above, and configure the processing device to operate as desired, or process it independently or collectively. You can command the device. Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. Or may be permanently or temporarily embodied in a signal wave to be transmitted. The software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner. Software and data may be stored on one or more computer readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Although the embodiments have been described by the limited embodiments and the drawings as described above, various modifications and variations are possible to those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and / or components of the described systems, structures, devices, circuits, etc. may be combined or combined in a different form than the described method, or other components. Or even if replaced or substituted by equivalents, an appropriate result can be achieved. Therefore, other implementations, other embodiments, and equivalents to the claims are within the scope of the claims that follow.

Claims (20)

  1. 다채널 신호에 포함된 제1 일반 채널 신호와 제1 Lfe 채널 신호를 인코딩하여 제1 다운믹스 신호 및 제1 공간큐를 출력하는 단계;Encoding a first general channel signal and a first Lfe channel signal included in the multichannel signal to output a first downmix signal and a first spatial cue;
    다채널 신호에 포함된 제2 일반 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 제2 다운믹스 신호 및 제2 공간큐를 출력하는 단계;Encoding a second general channel signal and a second Lfe channel signal included in the multichannel signal to output a second downmix signal and a second spatial cue;
    상기 제1 다운믹스 신호와 제2 다운믹스 신호를 함께 인코딩하는 단계; 및Encoding the first downmix signal and the second downmix signal together; And
    상기 인코딩된 제1 다운믹스 신호와 제2 다운믹스 신호 및 제1 공간큐와 제2 공간큐를 포함하는 비트스트림을 생성하는 단계Generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue
    를 포함하는 다채널 신호의 인코딩 방법.Encoding method of a multi-channel signal comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 제1 공간큐를 출력하는 단계는,The outputting of the first spatial cue may include:
    상기 제1 일반 채널 신호와 제1 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제1 다운믹스 신호와 제1 공간큐를 출력하고,Outputting a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to an Lfe mode,
    상기 제2 공간큐를 출력하는 단계는,The outputting of the second spatial cue may include:
    상기 제2 일반 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제2 다운믹스 신호와 제2 공간큐를 출력하고,Outputs a second downmix signal and a second spatial cue by applying parametric coding to the second general channel signal and the second Lfe channel signal according to an Lfe mode,
    상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함하는 다채널 신호의 인코딩 방법.And the first spatial cue and the second spatial cue include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  3. 다채널 신호에 포함된 제1 일반 채널 신호와 제1 Lfe 채널 신호를 인코딩하여 제1 다운믹스 신호 및 제1 공간큐를 출력하는 단계;Encoding a first general channel signal and a first Lfe channel signal included in the multichannel signal to output a first downmix signal and a first spatial cue;
    다채널 신호에 포함된 제2 일반 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 제2 다운믹스 신호 및 제2 공간큐를 출력하는 단계;Encoding a second general channel signal and a second Lfe channel signal included in the multichannel signal to output a second downmix signal and a second spatial cue;
    상기 제1 다운믹스 신호를 인코딩하는 단계;Encoding the first downmix signal;
    상기 제1 다운믹스 신호와 별도로 제2 다운믹스 신호를 인코딩하는 단계; 및Encoding a second downmix signal separately from the first downmix signal; And
    상기 인코딩된 제1 다운믹스 신호와 제2 다운믹스 신호 및 제1 공간큐와 제2 공간큐를 포함하는 비트스트림을 생성하는 단계Generating a bitstream including the encoded first downmix signal and the second downmix signal, and a first spatial cue and a second spatial cue
    를 포함하는 다채널 신호의 인코딩 방법.Encoding method of a multi-channel signal comprising a.
  4. 제3항에 있어서,The method of claim 3,
    상기 제1 공간큐를 출력하는 단계는,The outputting of the first spatial cue may include:
    상기 제1 일반 채널 신호와 제1 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제1 다운믹스 신호와 제1 공간큐를 출력하고,Outputting a first downmix signal and a first spatial cue by applying parametric coding to the first general channel signal and the first Lfe channel signal according to an Lfe mode,
    상기 제2 공간큐를 출력하는 단계는,The outputting of the second spatial cue may include:
    상기 제2 일반 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 제2 다운믹스 신호와 제2 공간큐를 출력하고,Outputs a second downmix signal and a second spatial cue by applying parametric coding to the second general channel signal and the second Lfe channel signal according to an Lfe mode,
    상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함하는 다채널 신호의 인코딩 방법.And the first spatial cue and the second spatial cue include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  5. 다채널 신호에 포함된 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 인코딩하여 다운믹스 신호와 공간큐를 출력하는 단계;Outputting a downmix signal and a spatial cue by encoding the first Lfe channel signal and the second Lfe channel signal included in the multichannel signal;
    상기 다운믹스 신호를 인코딩하는 단계; 및Encoding the downmix signal; And
    상기 인코딩된 다운믹스 신호와 공간큐를 포함하는 비트스트림을 생성하는 단계Generating a bitstream comprising the encoded downmix signal and a spatial cue
    를 포함하는 다채널 신호의 인코딩 방법.Encoding method of a multi-channel signal comprising a.
  6. 제5항에 있어서,The method of claim 5,
    상기 출력하는 단계는,The outputting step,
    상기 제1 Lfe 채널 신호와 제2 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩을 적용하여 다운믹스 신호와 공간큐를 출력하고,Outputs a downmix signal and a spatial cue by applying parametric coding to the first Lfe channel signal and the second Lfe channel signal according to an Lfe mode,
    상기 공간큐는, 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함하는 다채널 신호의 인코딩 방법.The spatial cue includes a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  7. 다채널 신호에 포함된 제1 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계;Applying a time delay to the first Lfe channel signal included in the multichannel signal;
    다채널 신호에 포함된 제2 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계;Applying a time delay to a second Lfe channel signal included in the multichannel signal;
    상기 시간 지연이 적용된 제1 Lfe 채널 신호를 인코딩하는 단계;Encoding a first Lfe channel signal to which the time delay is applied;
    상기 시간 지연이 적용된 제2 Lfe 채널 신호를 인코딩하는 단계; 및Encoding a second Lfe channel signal to which the time delay is applied; And
    상기 인코딩된 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 포함하는 비트스트림을 생성하는 단계Generating a bitstream including the encoded first Lfe channel signal and a second Lfe channel signal
    를 포함하는 다채널 신호의 인코딩 방법.Encoding method of a multi-channel signal comprising a.
  8. 제7항에 있어서,The method of claim 7, wherein
    상기 시간 지연은,The time delay is,
    다채널 신호에 포함된 일반 채널 신호의 인코딩 과정에서 발생되는 시간 지연을 포함하는 다채널 신호의 인코딩 방법.A method for encoding a multichannel signal comprising a time delay generated during encoding of a general channel signal included in the multichannel signal.
  9. 다채널 신호에 포함된 일반 채널 신호에 대해 시간 지연을 적용하는 단계;Applying a time delay to a general channel signal included in the multichannel signal;
    상기 시간 지연이 적용된 일반 채널 신호를 인코딩하는 단계;Encoding the normal channel signal to which the time delay has been applied;
    다채널 신호에 포함된 Lfe 채널 신호를 인코딩하여 다운믹스 신호와 공간큐를 출력하는 단계; 및Outputting a downmix signal and a spatial cue by encoding the Lfe channel signal included in the multichannel signal; And
    상기 인코딩된 Lfe 채널 신호를 인코딩하는 단계Encoding the encoded Lfe channel signal
    를 포함하고,Including,
    상기 시간 지연은 Lfe 채널 신호의 인코딩 과정에서 발생되는 시간 지연을 포함하는 다채널 신호의 인코딩 방법.The time delay is a method of encoding a multi-channel signal comprising a time delay generated during the encoding process of the Lfe channel signal.
  10. 제9항에 있어서,The method of claim 9,
    상기 출력하는 단계는,The outputting step,
    상기 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩하여 다운믹스 신호와 공간큐를 출력하는 다채널 신호의 인코딩 방법.And a parametric coding on the Lfe channel signal according to an Lfe mode to output a downmix signal and a spatial cue.
  11. 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 다운믹스 신호와 제2 다운믹스 신호를 생성하는 단계;Decoding the encoding result extracted from the bitstream to generate a first downmix signal and a second downmix signal;
    상기 제1 다운믹스 신호를 디코딩하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계; 및Decoding the first downmix signal and outputting a first general channel signal and a first Lfe channel signal; And
    상기 제2 다운믹스 신호를 디코딩하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계Decoding the second downmix signal and outputting a second general channel signal and a second Lfe channel signal;
    를 포함하는 다채널 신호의 디코딩 방법.Decoding method of a multi-channel signal comprising a.
  12. 제11항에 있어서,The method of claim 11,
    상기 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계는,The outputting of the first general channel signal and the first Lfe channel signal may include:
    제1 공간큐를 파라메트릭 코딩에 적용하여 제1 다운믹스 신호로부터 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고,Applying a first spatial cue to parametric coding to output a first general channel signal and a first Lfe channel signal from the first downmix signal,
    상기 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계는,The outputting of the second general channel signal and the second Lfe channel signal may include:
    제2 공간큐를 파라메트릭 코딩에 적용하여 제2 다운믹스 신호로부터 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하고,Applying a second spatial cue to parametric coding to output a second general channel signal and a second Lfe channel signal from the second downmix signal,
    상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함하는 다채널 신호의 디코딩 방법.Wherein the first spatial cue and the second spatial cue include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  13. 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 다운믹스 신호를 생성하는 단계;Decoding the encoding result extracted from the bitstream to generate a first downmix signal;
    상기 비트스트림으로부터 추출한 다른 인코딩 결과를 디코딩하여 제2 다운믹스 신호를 생성하는 단계;Decoding another encoding result extracted from the bitstream to generate a second downmix signal;
    상기 제1 다운믹스 신호를 디코딩하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계; 및Decoding the first downmix signal and outputting a first general channel signal and a first Lfe channel signal; And
    상기 제2 다운믹스 신호를 디코딩하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계Decoding the second downmix signal and outputting a second general channel signal and a second Lfe channel signal;
    를 포함하는 다채널 신호의 디코딩 방법.Decoding method of a multi-channel signal comprising a.
  14. 제13항에 있어서,The method of claim 13,
    상기 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하는 단계는,The outputting of the first general channel signal and the first Lfe channel signal may include:
    상기 제1 다운믹스 신호에 제1 공간큐에 기초한 파라메트릭 코딩을 이용하여 제1 일반 채널 신호와 제1 Lfe 채널 신호를 출력하고,Outputting a first general channel signal and a first Lfe channel signal to the first downmix signal using parametric coding based on a first spatial cue,
    상기 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계는,The outputting of the second general channel signal and the second Lfe channel signal may include:
    상기 제2 다운믹스 신호에 제2 공간큐에 기초한 파라메트릭 코딩을 이용하여 제2 일반 채널 신호와 제2 Lfe 채널 신호를 출력하고,Outputting a second general channel signal and a second Lfe channel signal to the second downmix signal using parametric coding based on a second spatial cue;
    상기 제1 공간큐 및 제2 공간큐는 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함하는 다채널 신호의 디코딩 방법.Wherein the first spatial cue and the second spatial cue include a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  15. 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 다운믹스 신호를 생성하는 단계; 및Generating a downmix signal by decoding the encoding result extracted from the bitstream; And
    상기 다운믹스 신호를 디코딩하여 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 출력하는 단계 Decoding the downmix signal and outputting a first Lfe channel signal and a second Lfe channel signal
    를 포함하는 다채널 신호의 디코딩 방법.Decoding method of a multi-channel signal comprising a.
  16. 제15항에 있어서,The method of claim 15,
    상기 출력하는 단계는,The outputting step,
    상기 다운믹스 신호에 공간큐에 기초한 파라메트릭 코딩을 적용하여 제1 Lfe 채널 신호와 제2 Lfe 채널 신호를 출력하고,Outputting a first Lfe channel signal and a second Lfe channel signal by applying parametric coding based on spatial cues to the downmix signal,
    상기 공간큐는, 제1 Lfe 채널 신호 또는 제2 Lfe 채널 신호의 Lfe 대역으로부터 출력된 CLD(Channel Level Diffenece)를 포함하는 다채널 신호의 디코딩 방법.The spatial cue includes a channel level difference (CLD) output from an Lfe band of a first Lfe channel signal or a second Lfe channel signal.
  17. 비트스트림으로부터 추출한 인코딩 결과를 디코딩하여 제1 Lfe 채널 신호를 출력하는 단계;Decoding the encoding result extracted from the bitstream and outputting a first Lfe channel signal;
    비트스트림으로부터 추출한 다른 인코딩 결과를 디코딩하여 제2 Lfe 채널 신호를 출력하는 단계;Decoding another encoding result extracted from the bitstream and outputting a second Lfe channel signal;
    상기 제1 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계; 및Applying a time delay to the first Lfe channel signal; And
    상기 제2 Lfe 채널 신호에 대해 시간 지연을 적용하는 단계Applying a time delay to the second Lfe channel signal
    를 포함하는 다채널 신호의 디코딩 방법.Decoding method of a multi-channel signal comprising a.
  18. 제17항에 있어서,The method of claim 17,
    상기 시간 지연은,The time delay is,
    일반 채널 신호의 디코딩 과정에서 발생되는 시간 지연을 포함하는 다채널 신호의 디코딩 방법.A method of decoding a multichannel signal comprising a time delay generated during the decoding of a general channel signal.
  19. 비트스트림으로부터 일반 채널 신호에 대해 디코딩하는 단계;Decoding for the normal channel signal from the bitstream;
    상기 디코딩된 일반 채널 신호에 대해 시간 지연을 적용하는 단계;Applying a time delay to the decoded general channel signal;
    상기 비트스트림으로부터 Lfe 채널 신호에 대해 디코딩하는 단계; 및Decoding an Lfe channel signal from the bitstream; And
    상기 디코딩된 Lfe 채널 신호를 디코딩하는 단계Decoding the decoded Lfe channel signal
    를 포함하고,Including,
    상기 시간 지연은 Lfe 채널 신호의 디코딩 과정에서 발생되는 시간 지연을 포함하는 다채널 신호의 디코딩 방법.The time delay is a method of decoding a multi-channel signal comprising a time delay generated during the decoding process of the Lfe channel signal.
  20. 제19항에 있어서,The method of claim 19,
    상기 Lfe 채널 신호에 대해 디코딩하는 단계는,Decoding the Lfe channel signal,
    상기 Lfe 채널 신호에 Lfe 모드에 따라 파라메트릭 코딩하여 다운믹스 신호와 공간큐를 출력하는 다채널 신호의 디코딩 방법.And a parametric coding on the Lfe channel signal according to Lfe mode to output a downmix signal and a spatial cue.
PCT/KR2014/006406 2013-07-15 2014-07-15 Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal WO2015009040A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP14826617.4A EP3023984A4 (en) 2013-07-15 2014-07-15 Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR20130083073 2013-07-15
KR10-2013-0083073 2013-07-15
KR20130123416 2013-10-16
KR10-2013-0123416 2013-10-16
KR10-2014-0089269 2014-07-15
KR20140089269A KR20150009474A (en) 2013-07-15 2014-07-15 Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal

Publications (1)

Publication Number Publication Date
WO2015009040A1 true WO2015009040A1 (en) 2015-01-22

Family

ID=52572683

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/006406 WO2015009040A1 (en) 2013-07-15 2014-07-15 Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal

Country Status (3)

Country Link
EP (1) EP3023984A4 (en)
KR (1) KR20150009474A (en)
WO (1) WO2015009040A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022247651A1 (en) * 2021-05-28 2022-12-01 华为技术有限公司 Encoding method and apparatus for multi-channel audio signals

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016133366A1 (en) * 2015-02-17 2016-08-25 한국전자통신연구원 Multichannel signal processing method, and multichannel signal processing apparatus for performing same
KR20160101692A (en) 2015-02-17 2016-08-25 한국전자통신연구원 Method for processing multichannel signal and apparatus for performing the method
WO2018128457A2 (en) * 2017-01-05 2018-07-12 엘지전자 주식회사 Method for performing channel-coding of information on basis of polar code

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050195981A1 (en) * 2004-03-04 2005-09-08 Christof Faller Frequency-based coding of channels in parametric multi-channel coding systems
KR20070120527A (en) * 2005-04-15 2007-12-24 코딩 테크놀러지스 에이비 Adaptive residual audio coding
KR20080049746A (en) * 2005-08-30 2008-06-04 엘지전자 주식회사 Apparatus for encoding and decoding audio signal and method thereof
KR20090057131A (en) * 2006-10-16 2009-06-03 돌비 스웨덴 에이비 Enhanced coding and parameter representation of multichannel downmixed object coding
US20100153097A1 (en) * 2005-03-30 2010-06-17 Koninklijke Philips Electronics, N.V. Multi-channel audio coding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050195981A1 (en) * 2004-03-04 2005-09-08 Christof Faller Frequency-based coding of channels in parametric multi-channel coding systems
US20100153097A1 (en) * 2005-03-30 2010-06-17 Koninklijke Philips Electronics, N.V. Multi-channel audio coding
KR20070120527A (en) * 2005-04-15 2007-12-24 코딩 테크놀러지스 에이비 Adaptive residual audio coding
KR20080049746A (en) * 2005-08-30 2008-06-04 엘지전자 주식회사 Apparatus for encoding and decoding audio signal and method thereof
KR20090057131A (en) * 2006-10-16 2009-06-03 돌비 스웨덴 에이비 Enhanced coding and parameter representation of multichannel downmixed object coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022247651A1 (en) * 2021-05-28 2022-12-01 华为技术有限公司 Encoding method and apparatus for multi-channel audio signals

Also Published As

Publication number Publication date
KR20150009474A (en) 2015-01-26
EP3023984A1 (en) 2016-05-25
EP3023984A4 (en) 2017-03-08

Similar Documents

Publication Publication Date Title
WO2010087614A2 (en) Method for encoding and decoding an audio signal and apparatus for same
WO2014088328A1 (en) Audio providing apparatus and audio providing method
WO2015009040A1 (en) Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal
EP2502421A2 (en) Apparatus and method encoding/decoding with phase information and residual information
WO2014175669A1 (en) Audio signal processing method for sound image localization
WO2014021588A1 (en) Method and device for processing audio signal
WO2018056780A1 (en) Binaural audio signal processing method and apparatus
WO2015060652A1 (en) Method and apparatus for processing audio signal
WO2015099424A1 (en) Method for generating filter for audio signal, and parameterization device for same
WO2015152665A1 (en) Audio signal processing method and device
WO2016089180A1 (en) Audio signal processing apparatus and method for binaural rendering
WO2010143907A2 (en) Encoding method and encoding device, decoding method and decoding device and transcoding method and transcoder for multi-object audio signals
WO2010087630A2 (en) A method and an apparatus for decoding an audio signal
EP2313888A2 (en) Method and apparatus to encode and decode an audio/speech signal
WO2010008175A2 (en) Apparatus for encoding and decoding of integrated speech and audio
EP2467850A2 (en) Method and apparatus for encoding multi-channel audio signal and method and apparatus for decoding multi-channel audio signal
WO2012050382A2 (en) Method and apparatus for downmixing multi-channel audio signals
WO2013115625A1 (en) Method and apparatus for processing audio signals with low complexity
JP2016536625A (en) Render multi-channel audio using interpolated matrices
WO2015102452A1 (en) Method and apparatus for improved ambisonic decoding
WO2015093742A1 (en) Method and apparatus for encoding/decoding an audio signal
WO2016204581A1 (en) Method and device for processing internal channels for low complexity format conversion
WO2014168439A1 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
WO2010032992A2 (en) Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder
WO2019098499A1 (en) Electronic device, external electronic device, and audio system comprising same

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14826617

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2014826617

Country of ref document: EP