KR101783967B1 - Apparatus for encoding/decoding multichannel signal and method thereof - Google Patents

Apparatus for encoding/decoding multichannel signal and method thereof Download PDF

Info

Publication number
KR101783967B1
KR101783967B1 KR1020170057373A KR20170057373A KR101783967B1 KR 101783967 B1 KR101783967 B1 KR 101783967B1 KR 1020170057373 A KR1020170057373 A KR 1020170057373A KR 20170057373 A KR20170057373 A KR 20170057373A KR 101783967 B1 KR101783967 B1 KR 101783967B1
Authority
KR
South Korea
Prior art keywords
parameter
phase
parameters
signal
encoding
Prior art date
Application number
KR1020170057373A
Other languages
Korean (ko)
Other versions
KR20170054363A (en
Inventor
김중회
오은미
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020170057373A priority Critical patent/KR101783967B1/en
Publication of KR20170054363A publication Critical patent/KR20170054363A/en
Application granted granted Critical
Publication of KR101783967B1 publication Critical patent/KR101783967B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

멀티 채널 신호의 부호화/복호화 장치 및 방법이 개시된다. 멀티 채널 신호의 부호화 장치 및 방법은 양자화(quantization) 및 무손실 부호화(lossless encoding)를 통해 멀티 채널 신호의 위상 정보를 부호화하고, 멀티 채널 신호의 복호화 장치 및 방법은 역양자화(inverse quantization) 및 무손실 복호화(lossless decoding)를 통해 위상 정보를 복호화한다. An apparatus and method for encoding / decoding multi-channel signals are disclosed. An apparatus and method for encoding a multi-channel signal encodes phase information of a multi-channel signal through quantization and lossless encoding, and an apparatus and method for decoding a multi-channel signal are provided with inverse quantization and lossless decoding and decodes the phase information through lossless decoding.

Figure R1020170057373
Figure R1020170057373

Description

멀티 채널 신호의 부호화/복호화 장치 및 방법{APPARATUS FOR ENCODING/DECODING MULTICHANNEL SIGNAL AND METHOD THEREOF}BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to an apparatus and a method for encoding / decoding multi-channel signals,

본 발명의 실시예들은 멀티 채널 신호의 부호화/복호화 장치 및 방법에 관한 것으로서, 더욱 상세하게는 양자화(quantization) 및 무손실 부호화(lossless encoding)를 통해 위상 정보를 부호화하는 멀티 채널 신호의 부호화 장치/방법과, 역양자화(inverse quantization) 및 무손실 복호화(lossless decoding)를 통해 위상 정보를 복호화하는 멀티 채널 신호의 복호화 장치/방법에 관한 것이다. Embodiments of the present invention relate to an apparatus and method for encoding / decoding multi-channel signals, and more particularly, to a multi-channel signal encoding apparatus / method for encoding phase information through quantization and lossless encoding And a device / method for decoding a multi-channel signal that decodes phase information through inverse quantization and lossless decoding.

스테레오 신호를 부호화하는데 이용되는 방법으로 파라메트릭 스테레오(PS, Parametric Stereo) 기술이 있다. 파라메트릭 스테레오 기술은 입력되는 스테레오 신호를 다운 믹싱하여 모노 신호를 생성하고, 스테레오 신호에 대한 부가 정보(side information)를 나타내는 스테레오 파라미터를 추출하고, 생성된 모노 신호와 추출된 스테레오 파라미터를 부호화하여 스테레오 신호를 부호화한다. A method used to encode a stereo signal is parametric stereo (PS) technology. The parametric stereo technique generates a mono signal by downmixing an input stereo signal, extracts a stereo parameter indicating side information on the stereo signal, codes the generated mono signal and the extracted stereo parameter, And encodes the signal.

이 경우 이용되는 스테레오 파라미터에는, 스테레오 신호에 포함된 적어도 두 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), 스테레오 신호에 포함된 적어도 두 채널 신호의 파형의 유사성에 따른 두 채널 신호 사이의 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차가 모노 신호를 기준으로 두 채널 사이에 어떻게 분포하는지를 나타내는 OPD(Overall Phase Difference) 등이 있다.In this case, the stereo parameters used include Inter-channel Intensity Difference (IID) or Channel Level Differences (CLD) indicating intensity differences according to energy levels of at least two channel signals included in the stereo signal, at least two channels (Inter-channel Coherence or Inter-channel Correlation) indicating the correlation between two channel signals according to the similarity of the waveform of the signal, an inter-channel coherence or inter-channel correlation And OPD (Overall Phase Difference) indicating how the phase difference between at least two channel signals included in the stereo signal is distributed between the two channels based on the mono signal.

본 발명의 일실시예들은 위상 파라미터를 효율적으로 부호화/복호화하기 위한 멀티 채널 신호의 부호화/복호화 장치 및 방법을 제공할 수 있다.Embodiments of the present invention can provide an apparatus and method for encoding / decoding multi-channel signals for efficiently encoding / decoding phase parameters.

본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 상기 복수의 파라미터를 양자화하는 파라미터 양자화부, 상기 양자화된 복수의 파라미터를 부호화하는 파라미터 부호화부, 상기 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화하는 모노 신호 부호화부, 및 상기 부호화된 복수의 파라미터 및 상기 부호화된 모노 신호를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 비트스트림 생성부를 포함하고, 상기 복수의 파라미터는 위상 파라미터를 포함하고, 상기 파라미터 부호화부는 허프만 코딩 기법을 이용하여 상기 양자화된 위상 파라미터를 부호화한다. An apparatus for encoding a multi-channel signal according to an embodiment of the present invention includes a parameter extraction unit that extracts a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal, a parameter quantization unit that quantizes the plurality of parameters, A parameter encoding unit for encoding a plurality of quantized parameters, a mono signal encoding unit for encoding a mono signal obtained by downmixing the multi-channel signal, and a multi-channel signal encoding unit for encoding the multi-channel signal using the plurality of encoded parameters and the encoded mono signal. And the parameter encoding unit encodes the quantized phase parameters using a Huffman coding scheme. The parameter encoding unit may encode the quantized phase parameters using a Huffman coding scheme.

또한, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치는 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원하는 모노 신호 복호화부, 상기 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 파라미터 복호화부, 상기 복원된 복수의 파라미터를 이용하여 상기 복원된 모노 신호와 상기 멀티 채널 신호간의 위상 차에 관한 파라미터(OPD: Overall Phase Difference)를 추정하는 파라미터 추정부, 상기 복원된 파라미터 및 상기 추정된 OPD를 역양자화하는 파라미터 역양자화부, 및 상기 역양자화된 복수의 파라미터 및 상기 역양자화된 OPD를 이용하여 상기 모노 신호를 업 믹싱하는 업 믹싱부를 포함한다. Also, an apparatus for decoding a multi-channel signal according to an embodiment of the present invention includes a mono signal decoding unit for decoding a mono signal, which is a downmix signal of the multi-channel signal, from a bitstream of a multi- A parameter decoding unit for restoring a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal; a parameter decoding unit for decoding a parameter (OPD) related to a phase difference between the restored monaural signal and the multi- : A parameter estimator for estimating an overall phase difference, an inverse quantization unit for inversely quantizing the reconstructed parameter and the estimated OPD, and a parameter inverse quantization unit for inversely quantizing the monaural signal using the inversely quantized parameter and the inversely quantized OPD. Upmixing unit.

본 발명의 일실시예에 따른 멀티 채널 신호의 부호화/복호화 장치에 따르면 위상 파라미터를 효율적으로 부호화/복호화하여 위상 파라미터의 표현에 사용되는 비트의 수를 감소시킬 수 있다. According to the apparatus for encoding / decoding a multi-channel signal according to an embodiment of the present invention, the number of bits used for expressing a phase parameter can be reduced by efficiently encoding / decoding a phase parameter.

도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다.
도 2는 wrapping property를 갖지 않는 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다.
도 3은 wrapping property를 갖는 위상 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다.
도 5는 USAC(Unified Speech and Audio Coding)에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부의 동작을 설명하기 위한 흐름도이다.
도 6 및 도 7은 MPS(MPEG Surround) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부의 동작을 설명하기 위한 흐름도이다.
도 8은 PS(Parametric Stereo) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부의 동작을 설명하기 위한 흐름도이다.
1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining a concept of encoding a parameter by applying 2D Huffman coding to parameter pairs constituted by parameters having no wrapping property. FIG.
3 is a diagram for explaining a concept of coding a parameter by applying 2D Huffman coding to parameter pairs constituted by phase parameters having a wrapping property.
4 is a block diagram illustrating a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
FIG. 5 is a flowchart for explaining the operation of a parameter dequantizer for dequantizing a parameter based on USAC (Unified Speech and Audio Coding).
FIGS. 6 and 7 are flowcharts for explaining the operation of a parameter de-quantization unit for dequantizing a parameter based on an MPS (MPEG Surround) lossless coding scheme.
8 is a flowchart for explaining an operation of a parameter de-quantization unit for dequantizing a parameter based on a PS (Parametric Stereo) lossless coding scheme.

이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. However, the present invention is not limited to or limited by the embodiments. Like reference symbols in the drawings denote like elements.

도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다. 1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.

본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 파라미터 추출부(110), 파라미터 양자화부(120), 파라미터 부호화부(130), 다운믹싱부(140), 모노 신호 부호화부(150), 및 비트스트림 생성부(160)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.The apparatus 100 for encoding a multi-channel signal according to an exemplary embodiment of the present invention includes a parameter extracting unit 110, a parameter quantizing unit 120, a parameter encoding unit 130, a downmixing unit 140, A bitstream generation unit 150, and a bitstream generation unit 160. Hereinafter, the function of each component will be described in detail.

여기서, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.Here, the multi-channel signal means a signal of a plurality of channels. In the present specification, each of a plurality of channels included in the multi-channel signal is referred to as a channel signal.

또한, 이하에서는, 설명의 편의상 멀티 채널 신호의 부호화 장치(100)에 입력되는 멀티 채널 신호는 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화에도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. Hereinafter, for convenience of description, it is assumed that a multi-channel signal input to the multi-channel signal encoding apparatus 100 is a stereo signal including a left channel signal and a right channel signal. However, the apparatus 100 for encoding a multi-channel signal according to an exemplary embodiment of the present invention can be used not only for a stereo signal but also for encoding a multi-channel signal. .

파라미터 추출부(110)는 스테레오 신호를 구성하는 좌채널 신호와 우채널 신호 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 복수의 파라미터에는 상기에서 언급한 CLD, ICC, IPD, OPD 등이 포함될 수 있다. 여기서, IPD 및 OPD는 좌채널 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다. The parameter extracting unit 110 extracts a plurality of parameters indicating the characteristic relationship between the left channel signal and the right channel signal constituting the stereo signal. The plurality of parameters may include the above-mentioned CLD, ICC, IPD, OPD, and the like. Here, IPD and OPD are examples of phase parameters related to the phase information between the left channel signal and the right channel signal.

파라미터 양자화부(120)는 추출된 복수의 파라미터를 양자화하고, 파라미터 부호화부(130)는 양자화된 복수의 파라미터를 부호화한다.The parameter quantization unit 120 quantizes the extracted plurality of parameters, and the parameter encoding unit 130 encodes the plurality of quantized parameters.

이 때, OPD는 다른 파라미터들로부터 추정될 수 있으므로, 본 발명의 일실시예에 따르면, 파라미터 부호화부(120)는 추출된 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하고, OPD는 부호화하지 않을 수 있다. 즉, 멀티 채널 신호의 부호화 장치(100)는 OPD를 부호화하여 전송하지 않음으로써 전송되는 비트스트림의 비트 수를 줄일 수 있다. OPD의 추정에 대한 보다 상세한 설명은 도 4의 멀티 채널 신호의 복호화 장치(400)에 관한 설명을 참고하기로 한다. In this case, since OPD can be estimated from other parameters, according to an embodiment of the present invention, the parameter encoding unit 120 encodes only CLD, ICC, and IPD among the extracted parameters, OPD does not encode . That is, the multi-channel signal encoding apparatus 100 can reduce the number of bits of the bitstream to be transmitted by not encoding and transmitting the OPD. A more detailed description of the OPD estimation will be made with reference to the description of the multi-channel signal decoding apparatus 400 of FIG.

본 발명의 일실시예에 따르면, 파라미터 양자화부(120)는 CLD 또는 ICC를 양자화할 수 있다. 이 경우, CLD는 8 레벨(level) 또는 16 레벨로 양자화될 수 있고, ICC는 8레벨로 양자화될 수 있다. According to an embodiment of the present invention, the parameter quantization unit 120 may quantize CLD or ICC. In this case, CLD can be quantized to 8 levels or 16 levels, and ICC can be quantized to 8 levels.

또한, 본 발명의 일실시예에 따르면, 파라미터 양자화부(120)는 CLD 및 ICC 외에 IPD 또는 OPD와 같은 위상 파라미터를 양자화할 수 있다. 이 경우, 위상 파라미터는 8 레벨 또는 16 레벨로 양자화될 수 있다. Further, according to an embodiment of the present invention, the parameter quantization unit 120 can quantize phase parameters such as IPD or OPD in addition to CLD and ICC. In this case, the phase parameter may be quantized to 8 levels or 16 levels.

파라미터 양자화부(120)에서 CLD 또는 ICC를 양자화한 경우, 파라미터 부호화부(130)는 현재 프레임과 이전 프레임 간의 양자화된 CLD 또는 양자화된 ICC의 변화량(차분; differential value)을 부호화할 수 있다. 즉 파라미터 부호화부는 차분 코딩(differential coding) 기법을 이용하여 CLD 또는 ICC를 부호화할 수 있다. When the parameter quantization unit 120 quantizes CLD or ICC, the parameter encoding unit 130 can encode the quantized CLD or the differential value of the quantized ICC between the current frame and the previous frame. That is, the parameter encoding unit can encode CLD or ICC using a differential coding technique.

일례로, 파라미터 양자화부(120)에서 CLD 또는 ICC를 8레벨로 양자화한 경우, CLD 또는 ICC는 -7로부터 7까지의 15단계의 차분 범위(difference range)를 갖고, 파라미터 부호화부(130)는 15단계의 차분 범위를 갖는 CLD 또는 ICC를 부호화할 수 있다. 다른 일례로, 파라미터 양자화부(120)에서 CLD를 16레벨로 양자화한 경우, CLD 또는 ICC는 -15로부터 15까지의 31단계의 차분 범위를 갖고, 파라미터 부호화부(130)는 31단계의 차분 범위를 갖는 CLD를 부호화할 수 있다. For example, when CLD or ICC is quantized to 8 levels in the parameter quantization unit 120, CLD or ICC has a 15-step difference range from -7 to 7, and the parameter encoding unit 130 It is possible to encode CLD or ICC having a differential range of 15 steps. In another example, when the CLD is quantized to 16 levels in the parameter quantization unit 120, CLD or ICC has a differential range of 31 steps from -15 to 15, and the parameter coding unit 130 calculates the differential range CLD < / RTI >

파라미터 양자화부(120)에서 위상 파라미터를 양자화한 경우, 파라미터 부호화부(130)는 현재 프레임과 이전 프레임 간의 양자화된 위상 파라미터의 변화량(차분)을 부호화할 수 있다. When the parameter quantization unit 120 quantizes the phase parameter, the parameter encoding unit 130 can encode the change amount (difference) of the quantized phase parameter between the current frame and the previous frame.

일례로, 파라미터 양자화부(120)에서 위상 파라미터를 8 레벨로 양자화한 경우, 파라미터 부호화부(130)는 15단계의 차분 범위를 갖는 위상 파라미터를 부호화할 수 있다. 다른 일례로, 파라미터 양자화부(120)에서 위상 파라미터를 16 레벨로 양자화한 경우, 파라미터 부호화부(13)는 31단계의 차분 범위를 갖는 위상 파라미터를 부호화할 수 있다For example, when the parameter quantization unit 120 quantizes the phase parameter to 8 levels, the parameter encoding unit 130 can encode the phase parameter having the differential range of 15 steps. As another example, when the parameter quantization unit 120 quantizes the phase parameter to 16 levels, the parameter encoding unit 13 can encode the phase parameter having the difference range of 31 steps

위상은 360°를 기준으로 주기성을 갖는 특징(wrapping property)이 있으므로(일례로, 370°는 10°와 동일함), wrapping property를 이용하여 위상 파라미터를 양자화한다면, 위상 정보의 표현에 할당되는 비트 수를 감소시킬 수 있다.Since the phase has a wrapping property with respect to 360 degrees (for example, 370 is equal to 10 degrees), if the phase parameter is quantized using the wrapping property, the bit allocated to the representation of the phase information It is possible to reduce the number.

본 발명의 일실시예에 따르면, 파라미터 부호화부(130)는 wrapping property를 갖는 위상 파라미터의 차분에 대해 모듈러(Modulo) 연산을 적용하여 위상 파라미터의 차분이 향상 양의 값을 갖도록 할 수 있다. 이에 따라, 파라미터 부호화부(130)는 위상 파라미터에 부여되는 부호 값(sign bit)을 전송하지 않게 되어, 위상 파라미터를 표현하는데 사용되는 비트 수를 감소시킬 수 있다. 또한, 모듈러 연산을 적용하는 경우, wrapping property로 인해 위상 파라미터 간에 불연속(discontinuity)이 발생하여 위상 파라미터 분포의 엔트로피(entropy)가 증가하게 되는 문제점을 해결할 수 있게 된다. According to an embodiment of the present invention, the parameter encoding unit 130 may apply a modulo operation to the difference of the phase parameter having the wrapping property so that the difference of the phase parameter has the enhancement positive value. Accordingly, the parameter encoding unit 130 does not transmit the sign bit assigned to the phase parameter, so that it is possible to reduce the number of bits used for expressing the phase parameter. In addition, when the modular operation is applied, discontinuity occurs between the phase parameters due to the wrapping property, thereby solving the problem that the entropy of the phase parameter distribution increases.

파라미터 양자화부(120)에서 8 레벨로 위상 파라미터를 양자화하는 경우, 위상 파라미터는 0으로부터 7까지의 차분 범위를 갖고, 파라미터 양자화부(130)에서 16 레벨로 위상 파라미터를 양자화하는 경우, 위상 파라미터는 0으로부터 15까지의 차분 범위를 갖는다. 표 1은 8 레벨로 양자화된 위상 파라미터의 양자화 값의 일례를 표시하고 있고, 표 2는 16 레벨로 양자화된 위상 파라미터의 양자화 값의 일례를 표시하고 있다. When the phase parameter is quantized to 8 levels in the parameter quantization unit 120, the phase parameter has a differential range from 0 to 7. When quantizing the phase parameter at 16 levels in the parameter quantization unit 130, And has a difference range of 0 to 15. Table 1 shows an example of quantization values of phase parameters quantized at 8 levels, and Table 2 shows an example of quantization values of phase parameters quantized at 16 levels.

Figure 112017043768561-pat00001
Figure 112017043768561-pat00001

Figure 112017043768561-pat00002
Figure 112017043768561-pat00002

일례로서, 위상 파라미터가 8 레벨로 양자화된 IPD인 경우, 파라미터 부호화부(130)는 모듈러-8 연산을 적용하여 위상 파라미터의 차분 값을 연산할 수 있다. 이는 수학식 1과 같이 표현될 수 있다. As an example, when the phase parameter is the IPD quantized to 8 levels, the parameter encoding unit 130 can calculate the difference value of the phase parameter by applying the modulo-8 operation. This can be expressed as Equation (1).

Figure 112017043768561-pat00003
Figure 112017043768561-pat00003

여기서, '

Figure 112017043768561-pat00004
'는 현재 프레임에서의 IPD 값, '
Figure 112017043768561-pat00005
'는 이전 프레임에서의 IPD 값, '%8'은 Module-8 연산을, '
Figure 112017043768561-pat00006
'는 Module?8 연산을 통해 도출된 IPD의 차분 값을 각각 의미한다. here, '
Figure 112017043768561-pat00004
'Is the IPD value in the current frame,'
Figure 112017043768561-pat00005
'Is the IPD value in the previous frame,'% 8 'is the Module-8 operation,
Figure 112017043768561-pat00006
'Means the difference value of the IPD derived from the Module? 8 operation.

표 3은 Module-8 연산을 통해 도출된

Figure 112017043768561-pat00007
값의 일례들을 나타내고 있다. 표 3에서, 'Previous'는
Figure 112017043768561-pat00008
과, 'Current'는
Figure 112017043768561-pat00009
와, 'Diff.'은
Figure 112017043768561-pat00010
과, 'Diff with 모듈러'는
Figure 112017043768561-pat00011
와 각각 대응된다. Table 3 shows the results of Module-8 computation.
Figure 112017043768561-pat00007
Values. ≪ / RTI > In Table 3, 'Previous'
Figure 112017043768561-pat00008
And 'Current'
Figure 112017043768561-pat00009
And 'Diff.'
Figure 112017043768561-pat00010
And 'Diff with modular'
Figure 112017043768561-pat00011
Respectively.

Figure 112017043768561-pat00012
Figure 112017043768561-pat00012

일반적으로, 'Diff.'가 '0'인 경우, 가장 낮은 비트수를 보이며, 'Diff.'가 '0' 또는 '7'에 가까울수록 비트수가 적어진다. 위상이 변화가 이전 데이터가 천천히 변하므로, 0은 이전 프레임과의 차이가 없음을, 7은 이전 프레임과의 차이가 -1임을, 1은 이전 프레임과의 차이가 1이기 때문에 가장 높은 빈도를 보이며 비트를 적게 할당할 수 있다. Generally, when 'Diff.' Is '0', it shows the lowest number of bits. As 'Diff.' Is closer to '0' or '7', the number of bits decreases. 0 is the difference from the previous frame, 7 is the difference from the previous frame is -1, 1 is the highest frequency because the difference from the previous frame is 1 You can allocate fewer bits.

파라미터 부호화부(130)는 무손실 부호화(lossless encoding)를 통해 양자화된 파라미터의 차분을 부화할 수 있다. 일례로 파라미터 부호화부(130)는 허프만 코딩(Huffman coding)을 이용하여 양자화된 파라미터를 부호화할 수 있다. The parameter encoding unit 130 may hatch the difference of the quantized parameter through lossless encoding. For example, the parameter encoding unit 130 may encode quantized parameters using Huffman coding.

허프만 코딩은 무손실 부호화에 사용되는 엔트로피 코딩(entropy)의 일 종류로서, 각각의 데이터와 대응되는 심볼(symbol)의 발생 빈도에 따라서 다른 길이의 부호를 사용하는 코딩 알고리즘이다. Huffman coding is a type of entropy coding used for lossless coding and is a coding algorithm that uses codes of different lengths depending on the occurrence frequency of a symbol corresponding to each data.

허프만 코딩 기법으로는 1D 허프만 코딩 및 2D 허프만 코딩이 있다. 1D 허프만 코딩은 각각의 데이터를 하나의 심볼로 간주하여 부호화하는 방법을 의미하고, 2D 허프만 코딩은 복수의 데이터를 2개의 데이터를 포함하는 복수의 데이터 그룹으로 그룹화하고, 복수의 데이터 그룹(즉 2개의 데이터로 구성된 데이터 쌍(pair))을 하나의 심볼로 간주하여 부호화하는 방법을 의미한다. Huffman coding schemes include 1D Huffman coding and 2D Huffman coding. 1D Huffman coding refers to a method of coding each data as one symbol, and 2D Huffman coding groups a plurality of data into a plurality of data groups including two data, and a plurality of data groups A pair of data consisting of a plurality of data) is regarded as one symbol and encoded.

다시 말해, 1D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 부호화부(130)는 허프만 코딩 기법에 따라 각각의 파라미터를 직접 부호화한다. In other words, when 1D Huffman coding is applied to parameters, the parameter coding unit 130 directly codes each parameter according to the Huffman coding scheme.

일례로, CLD 또는 ICC를 부호화하고자 하는 경우, 파라미터 부호화부(130)는 복수의 CLD 값 또는 복수의 ICC 값을 각각 하나의 심볼로 간주하여 허프만 코딩을 수행한다. For example, when CLD or ICC is to be encoded, the parameter encoding unit 130 performs Huffman coding by considering a plurality of CLD values or a plurality of ICC values as one symbol.

다른 일례로, 위상 파라미터를 부호화하고자 하는 경우, 파라미터 부호화부(130)는 복수의 위상 파라미터 값을 각각 하나의 심볼로 간주하여 허프만 코딩을 수행한다. In another example, when it is desired to encode a phase parameter, the parameter encoding unit 130 regards a plurality of phase parameter values as one symbol, and performs Huffman coding.

또한, 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 부호화부(130)는 2개의 파라미터로 구성되는 파라미터 쌍을 허프만 코딩 기법에 따라 부호화한다. In addition, when parameters are encoded by applying 2D Huffman coding, the parameter encoding unit 130 encodes parameter pairs constituted by two parameters according to the Huffman coding scheme.

2D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 쌍을 구성하는 2개의 파라미터 간의 상관(correlation)이 감소된다. 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 쌍을 구성하는 2개의 파라미터 간의 두개의 심볼의 조합 확률 (Joint Probability)을 고려하기 때문에 비트율이 감소된다. When coding a parameter by applying 2D Huffman coding, the correlation between the two parameters constituting the parameter pair is reduced. When a parameter is encoded by applying 2D Huffman coding, the bit rate is reduced because the joint probability of two symbols between two parameters constituting the parameter pair is considered.

이하에서는 도 2 및 도 3을 참고하여 2D 허프만 코딩에 따라 파라미터를 부호화하는 파라미터 부호화부(130)의 동작을 상세히 설명하기로 한다. Hereinafter, the operation of the parameter encoding unit 130 for encoding a parameter according to 2D Huffman coding will be described in detail with reference to FIG. 2 and FIG.

도 2 및 도 3은 파라미터 쌍을 부호화하는 2D 허프만 코딩의 개념을 설명하기 위한 도면이다. FIGS. 2 and 3 are diagrams for explaining the concept of 2D Huffman coding for coding parameter pairs.

도 2는 CLD 또는 ICC와 같은 wrapping property를 갖지 않는 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다. 2 is a diagram for explaining a concept of coding parameters by applying 2D Huffman coding to parameter pairs constituted by parameters having no wrapping property such as CLD or ICC.

여기서, 파라미터 쌍은 (X, Y)로 표현된다. X와 Y는 각각 하나의 파라미터와 대응된다. 예를 들어, 파라미터 타입이 CLD인 경우, X와 Y는 각각 하나의 CLD 값과 대응된다. Here, the parameter pair is represented by (X, Y). X and Y correspond to one parameter, respectively. For example, when the parameter type is CLD, X and Y correspond to one CLD value, respectively.

파라미터 부호화부(130)는 아래의 3 단계에 따라 2D 허프만 코딩을 수행한다. The parameter encoding unit 130 performs 2D Huffman coding according to the following three steps.

우선, 파라미터 부호화부(130)는 X의 절대값(absolute value)이 Y의 절대값보다 큰 값을 갖도록, 즉, '│X│〉│Y│'의 관계가 성립하도록 X 또는 Y의 값을 변경한다. '│X│〉│Y│' 관계가 만족하는 경우, X/Y의 심볼 쌍(pair)이 X축에 더 큰 값을 가지게 되므로 데이터가 스큐(skew)되는 정도가 높아지고, 이에 따라 비트률이 감소될 수 있다. 이에 따라, 제2 영역에 존재하는 파라미터들은 제1 영역으로, 제3 영역에 존재하는 파라미터들은 제4 영역으로, 제6 영역에 존재하는 파라미터들은 제5 영역으로, 제7 영역에 존재하는 파라미터들은 제8 영역으로 각각 이동한다. 이 경우, 영역을 이동하는 파라미터 쌍들에 대해 각각 1 비트의 추가 정보가 부여된다. First, the parameter encoding unit 130 sets the value of X or Y so that the absolute value of X has a value larger than the absolute value of Y, that is, the relation of 'X |> Y' Change it. If the relation is satisfied, the pair of X / Y symbols has a larger value on the X axis, so that the degree of skew of the data increases, Can be reduced. Accordingly, the parameters existing in the second region are the first region, the parameters existing in the third region are the fourth region, the parameters existing in the sixth region are the fifth region, the parameters existing in the seventh region are Respectively. In this case, 1-bit additional information is assigned to each of the parameter pairs moving in the region.

다음 단계에서, 파라미터 부호화부(130)는 X와 Y의 합이 '0'보다 작은 값을 갖도록, 즉, '(X+Y)〈 0'의 관계를 갖도록 X 또는 Y 값을 변경한다. '(X+Y)〈 0 '인 경우, X 및 Y의 부호(sign)를 바꿈으로써, 생성되는 심볼의 값이 양의 값을 갖는다. In the next step, the parameter encoding unit 130 changes the X or Y value so that the sum of X and Y has a value smaller than '0', that is, a relation of '(X + Y) <0'. '(X + Y) <0', by changing the sign of X and Y, the value of the generated symbol has a positive value.

이에 따라, 제4 영역에 존재하는 파라미터들은 제1 영역으로, 제5 영역에 존재하는 파라미터들은 제8 영역으로 각각 이동한다. 이 경우에도 역시, 영역을 이동하는 파라미터 쌍들에 대해 각각 1 비트의 추가 정보가 부여된다. 제2 단계에서 영역이 이동된 (X, Y)의 쌍을 (X', Y')이라고 한다. Accordingly, parameters existing in the fourth region move to the first region and parameters existing in the fifth region move to the eighth region, respectively. In this case as well, 1-bit additional information is given to each of the parameter pairs moving in the region. The pair of (X, Y) in which the region is shifted in the second step is referred to as (X ', Y').

그 다음 단계에서, 파라미터 부호화부(130)는 복수의 파라미터 중에서 최대 절대값(LAV: Largest Absolute Value)을 갖는 파라미터를 이용한 LAV 코딩을 통해 최종적으로 부호화된 파라미터 쌍을 도출한다. LAV는 2D 허프만 코딩을 위한 부가정보로서, 이 또한 허프만 코딩을 통해서 전송된다. LAV는 현재 부호화될 프레임에 해당하는 심볼 중에 가장 큰 절대값을 가지는 값을 의미하며, 이를 통해 2D 허프만 코딩의 코드북을 결정할 수 있다.In the next step, the parameter encoding unit 130 derives a parameter pair finally encoded through LAV coding using a parameter having a maximum absolute value (LAV) among a plurality of parameters. LAV is additional information for 2D Huffman coding, which is also transmitted via Huffman coding. LAV means a value having the largest absolute value among the symbols corresponding to the current frame to be coded, and thus the codebook of 2D Huffman coding can be determined.

LAV는 2D 허프만 코딩을 위한 부가정보로서, LAV 역시 허프만 코딩을 통해서 부호화되어 전송된다. LAV는 현재 부호화될 프레임에 해당하는 심볼 중에 가장 큰 절대값을 가지는 심볼 값을 의미한다. 파라미터 부호화부(130)는 LAV를 통해 2D 허프만 코딩의 코드북을 결정한다.LAV is additional information for 2D Huffman coding, and LAV is encoded and transmitted through Huffman coding. LAV denotes a symbol value having the largest absolute value among the symbols corresponding to the current frame to be encoded. The parameter encoding unit 130 determines the codebook of 2D Huffman coding through the LAV.

LAV를 이용한 LAV 코딩은 2D 허프만 코딩에 이용되는 테이블(table)의 크기(size)를 줄이기 위한 코딩 방법으로서, 각각의 파라미터를 '1', '3', '5', '7'로 구성되는 4개의 심볼로 표현한다.LAV coding using LAV is a coding method for reducing the size of a table used for 2D Huffman coding and is a coding method in which each parameter is composed of '1', '3', '5', and '7' It is represented by four symbols.

CLD 또는 ICC의 경우, 이전 프레임의 CLD 값 또는 ICC 값과 현재 프레임의 CLD 값 또는 ICC 값의 차이가 클수록 발생 빈도가 적어지므로, LAV가 '7'인 경우가 가장 적게 발생한다. CLD 및 ICC는 동일한 허프만 코드북(Huffman codebook)을 적용할 수 있다. 허프만 코드북에 관한 구문(syntax)은 표 4와 같다. In case of CLD or ICC, the frequency of occurrence of LAV is '7' is the least since the frequency of occurrence of CLD or ICC of the previous frame is larger than the difference of CLD value or ICC value of the current frame. CLD and ICC can apply the same Huffman codebook. The syntax for the Huffman codebook is shown in Table 4.

Figure 112017043768561-pat00013
Figure 112017043768561-pat00013

여기서, {0x0, 0x2, 0x6, 0x7}는 코드북을, {1, 2, 3, 3}는 코드북의 길이를, {1, 3, 5, 7}는 LAV를 각각 의미한다. Here, {0x0, 0x2, 0x6, 0x7} denotes a codebook, {1, 2, 3, 3} denotes a length of a codebook, and {1, 3, 5, 7} denotes a LAV.

LAV 코딩에 따라 최종적으로 부호화된 파라미터 쌍 (X", Y")은 표 5에 표시된 알고리즘에 따라 도출될 수 있다. The parameter pair (X ", Y") finally encoded according to LAV coding can be derived according to the algorithm shown in Table 5. [

Figure 112017043768561-pat00014
Figure 112017043768561-pat00014

여기서, 'LAV'는 최대 절대값을, '% 2'는 모듈러-2 연산을 각각 의미한다. Here, 'LAV' denotes the maximum absolute value, and '% 2' denotes the modulo-2 operation.

도 3은 IPD 또는 OPD와 같은 wrapping property를 갖는 위상 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다. 3 is a diagram for explaining a concept of coding parameters by applying 2D Huffman coding to parameter pairs constituted by phase parameters having wrapping properties such as IPD or OPD.

이 경우, 2D 허프만 코딩은 앞서 도 2에서 설명한 2D 허프만 코딩과는 달리 아래의 2 단계를 거쳐 수행될 수 있다. In this case, 2D Huffman coding can be performed through the following two steps, unlike the 2D Huffman coding described above with reference to FIG.

우선, 파라미터 부호화부(130)는 X의 절대값(absolute value)이 Y의 절대값보다 큰 값을 갖도록, 즉, '│X│〉│Y│'의 관계가 성립하도록 X 또는 Y의 값을 변경한다. First, the parameter encoding unit 130 sets the value of X or Y so that the absolute value of X has a value larger than the absolute value of Y, that is, the relation of 'X |> Y' Change it.

상기 언급한 바와 같이, 양자화된 위상 파라미터의 차분에 대해 모듈러(Modulo) 연산을 적용하면 위상 파라미터의 차분이 항상 양의 값을 갖게 되므로, 위상 파라미터는 제1 영역과 제2 영역에만 존재한다. 따라서, 제1 단계에서는 제2 영역에 존재하는 위상 파라미터가 제1 영역으로 이동한다. 이 경우, 영역을 이동하는 파라미터 쌍들에 대해 각각 1 비트의 추가 정보가 부여된다.As described above, when the modulo operation is applied to the difference of the quantized phase parameters, the phase parameter always exists in a positive value, so that the phase parameter exists only in the first and second areas. Therefore, in the first step, the phase parameter existing in the second region moves to the first region. In this case, 1-bit additional information is assigned to each of the parameter pairs moving in the region.

상기 단계에서 영역이 이동된 (X, Y)의 쌍을 (X', Y')이라고 하면, X'과 Y'은 하기 수학식 2에 따라 도출될 수 있다. If the pair of (X, Y) in which the region is shifted in the above step is (X ', Y'), X 'and Y' can be derived according to the following equation (2).

Figure 112017043768561-pat00015
Figure 112017043768561-pat00015

다음 단계에서, 파라미터 부호화부(130)는 복수의 파라미터 중에서 최대 절대값(LAV: Largest Absolute Value)을 갖는 파라미터를 이용한 LAV 코딩을 통해 최종적으로 부호화된 파라미터 쌍을 도출한다. In the next step, the parameter encoding unit 130 derives a parameter pair finally encoded through LAV coding using a parameter having a maximum absolute value (LAV) among a plurality of parameters.

LAV 코딩에 따라 최종적으로 부호화된 파라미터 쌍 (X", Y")은 앞서 설명한 표 5에 표시된 알고리즘에 따라 도출될 수 있다. The parameter pair (X ", Y") finally encoded according to LAV coding can be derived according to the algorithm shown in Table 5 described above.

파라미터 부호화부(130)가 위상 파라미터를 부호화하는 경우, CLD 또는 ICC와 같은 파라미터를 부호화하는 경우와 달리 1회의 영역 이동이 발생한다. 따라서, 파라미터 부호화부(130)가 위상 파라미터를 부호화하는 경우, 전송되는 비트의 수가 CLD 또는 ICC와 같은 파라미터를 부호화하는 경우 보다 더 적다. When the parameter encoding unit 130 encodes the phase parameter, unlike in the case of encoding a parameter such as CLD or ICC, one region shift occurs. Therefore, when the parameter encoding unit 130 encodes the phase parameter, the number of transmitted bits is smaller than that in the case of encoding a parameter such as CLD or ICC.

IPD는 CLD 또는 ICC와 LAV의 분포가 상이하다. IPD는 차분이 '7'인 경우, 발생 빈도가 가장 높다. 일례로, IPD는 표 6과 같은 LAV 분포를 가질 수 있다. IPD has a different distribution of CLD or ICC and LAV. IPD has the highest frequency when the difference is '7'. For example, the IPD may have a LAV distribution as shown in Table 6. [

Figure 112017043768561-pat00016
Figure 112017043768561-pat00016

허프만 코딩의 특성인, 확률 분포에 따른 코드북 길이 할당은 실제 심볼과 코드북의 길이가 반영이 되어야 한다. 만일 심볼의 실제 분포와 허프만 코드북의 길이가 매칭되지 않을 경우 최적의 성능을 나타낼 수 없다. 따라서, 파라미터 부호화부(130)는 심볼을 리매핑(remapping)하고, 리매핑된 심볼을 부호화함으로써 심볼 분포의 미스매치(distribution mismatching) 문제를 해결할 수 있다. 이 경우, 파라미터 부호화부(130)는 수학식 3에 따라 심볼을 리매핑할 수 있다. The codebook length allocation according to the probability distribution, which is a characteristic of Huffman coding, must reflect the length of the actual symbols and the codebook. If the actual distribution of the symbol and the length of the Huffman codebook are not matched, then optimal performance can not be achieved. Therefore, the parameter encoding unit 130 can solve the problem of distribution mismatching of the symbol distribution by remapping the symbols and encoding the remapped symbols. In this case, the parameter encoding unit 130 can remap symbols according to Equation (3).

Figure 112017043768561-pat00017
Figure 112017043768561-pat00017

여기서,'sym'은 심볼을, '%4'는 모듈러-4 연산을 각각 의미한다. Here, 'sym' denotes a symbol and '% 4' denotes a modulo-4 operation.

심볼 리매핑 후의 심볼과 허프만 코드북과의 관계는 표 7과 같이 나타낼 수 있다. The relationship between the symbol after symbol remapping and the Huffman codebook can be expressed as shown in Table 7.

Figure 112017043768561-pat00018
Figure 112017043768561-pat00018

표 8 내지 표 10은 본 발명의 일실시예에 따라서, 위상 파라미터를 부호화하는 1D 허프만 코딩과 2D 허프만 코딩에 대한 구문(syntax)을 보여준다. Tables 8 through 10 illustrate the syntax for 1D Huffman coding and 2D Huffman coding for coding phase parameters, according to one embodiment of the present invention.

Figure 112017043768561-pat00019
Figure 112017043768561-pat00019

Figure 112017043768561-pat00020
Figure 112017043768561-pat00020

Figure 112017043768561-pat00021
Figure 112017043768561-pat00021

또는, 다음과 같이 LavIdx를 매핑(mapping)하는 테이블을 정의하는 방법이 있다. LavIdx는 실제 허프만 디코딩을 통해 출력된 심볼을 의미하며, lavTabIPD는 상기 심볼의 실제 LAV를 의미한다. 이 경우, 상기 심볼의 리매핑(remapping)은 표 11의 테이블에 기초하여 수행될 수 있다. Alternatively, there is a method of defining a table that maps LavIdx as follows. LavIdx denotes a symbol output through actual Huffman decoding, and lavTabIPD denotes an actual LAV of the symbol. In this case, the remapping of the symbols can be performed based on the table in Table 11. [

LavIdxLavIdx lavTabIPD[lavTabIPD [ LavIdxLavIdx ]] 00 77 1One 1One 22 33 33 55

다시 도 1을 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)에 대해 설명한다. Referring again to FIG. 1, an apparatus 100 for encoding a multi-channel signal according to an embodiment of the present invention will be described.

다운 믹싱부(140)는 스테레오 신호를 다운 믹싱하여 모노 신호를 출력한다. The downmixing unit 140 downmixes a stereo signal and outputs a mono signal.

다운 믹싱(Down-Mixing)은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운 믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트 수를 줄일 수 있다. 이 때, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 멀티 채널 신호의 부호화 장치(100)에서는 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다. Down-mixing is to generate a mono signal of one channel from a stereo signal of two or more channels, and it is possible to reduce the number of bits of the bit stream generated in the encoding process through downmixing. At this time, the mono signal may be a signal representative of the stereo signal. In other words, in the multi-channel signal encoding apparatus 100, only the mono signal can be coded and transmitted without encoding each of the left channel signal and the right channel signal included in the stereo signal.

예를 들어, 모노 신호의 크기는 좌채널 신호 및 우채널 신호의 크기의 평균 값으로 구할 수 있고, 모노 신호의 위상은 좌채널 신호 및 우채널 신호의 위상의 평균 값으로 구할 수 있다.For example, the magnitude of the mono signal can be obtained as an average value of the magnitudes of the left channel signal and the right channel signal, and the phase of the mono signal can be obtained as an average value of the phases of the left channel signal and the right channel signal.

모노 신호 부호화부(150)는 다운 믹싱부(140)에서 출력된 모노 신호를 부호화한다. The mono signal encoding unit 150 encodes the mono signal output from the downmixing unit 140.

일례로서, 스테레오 신호가 음성(voice) 신호인 경우, 모노 신호 부호화부(120)는 모노 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화할 수 있다.As an example, when the stereo signal is a voice signal, the mono signal encoding unit 120 may encode the mono signal in a CELP (Code Excited Linear Prediction) method.

또한, 다른 일례로서, 스테레오 신호가 음악(music) 신호인 경우, 모노 신호 부호화부(120)는 기존의 MPEG-2/4 AAC나 mp3와 유사한 방법을 사용하여 모노 신호를 부호화할 수 있다. As another example, when the stereo signal is a music signal, the mono signal encoding unit 120 may encode a mono signal using a method similar to the conventional MPEG-2/4 AAC or mp3.

비트스트림 생성부(160)는 부호화된 복수의 파라미터 및 부호화된 모노 신호를 이용하여 스테레오 신호에 대한 부호화된 비트스트림을 생성한다. The bitstream generator 160 generates an encoded bitstream for a stereo signal using a plurality of encoded parameters and an encoded monaural signal.

이상에서는 양자화 및 무손실 부호화를 통해 멀티 채널 신호의 위상 정보를 부호화하고, 부호화된 위상 정보를 포함하는 비트스트림을 생성하는 멀티 채널 신호의 부호화 장치(100)에 대해 설명하였다. 이하에서는 도 4를 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치에 대해 상세히 설명하기로 한다. In the above description, the multi-channel signal encoding apparatus 100 for encoding the phase information of the multi-channel signal through the quantization and lossless encoding and generating the bit stream including the encoded phase information has been described. Hereinafter, an apparatus for decoding a multi-channel signal according to an embodiment of the present invention will be described in detail with reference to FIG.

도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다. 4 is a block diagram illustrating a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.

본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(400)는 모노 신호 복호화부(410), 파라미터 복호화부(420), 파라미터 역양자화부(430), 파라미터 추정부(440), 및 업 믹싱부(450)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.The apparatus 400 for decoding a multi-channel signal according to an exemplary embodiment of the present invention includes a mono signal decoding unit 410, a parameter decoding unit 420, a parameter dequantization unit 430, a parameter estimating unit 440, And a mixing unit 450. Hereinafter, the function of each component will be described in detail.

이하에서도, 설명의 편의상, 멀티 채널 신호의 복호화 장치(300)에 입력되는 비트스트림은 스테레오 신호의 부호화된 비트스트림인 것으로 가정한다. Hereinafter, for the sake of convenience, it is assumed that the bit stream input to the multi-channel signal decoding apparatus 300 is a coded bit stream of a stereo signal.

모노 신호 복호화부(410)는 스테레오 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원한다. 구체적으로, 모노 신호 복호화부(410)는 모노 신호가 시간 도메인에서 부호화된 경우에는 부호화된 모노 신호를 시간 도메인에서 복호화하고, 모노 신호가 주파수 도메인에서 부호화된 경우에는 부호화된 모노 신호를 주파수 도메인에서 복호화할 수 있다.The mono signal decoding unit 410 restores the mono signal, which is a downmix signal of the multi-channel signal, from the encoded bit stream of the stereo signal. Specifically, when the mono signal is coded in the time domain, the mono signal decoding unit 410 decodes the coded mono signal in the time domain, and when the mono signal is coded in the frequency domain, It can be decoded.

파라미터 복호화부(420)는 스테레오 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널간의 특성 관계를 나타내는 복수의 파라미터를 복원한다. 이 때, 복수의 파라미터는 CLD, ICC, 및 IPD를 포함할 수는 있으나, OPD는 포함하지 않을 수 있다. The parameter decoding unit 420 restores a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting the multi-channel signal from the encoded bit stream of the stereo signal. At this time, a plurality of parameters may include CLD, ICC, and IPD, but may not include OPD.

파라미터 추정부(430)는 복수의 파라미터에 OPD가 포함되지 않은 경우, 복원된 복수의 파라미터를 이용하여 OPD를 추정한다. The parameter estimator 430 estimates the OPD using a plurality of restored parameters when the OPD is not included in the plurality of parameters.

이하에서는 OPD를 추정하는 파라미터 추정부(430)의 동작을 상세히 설명하기로 한다. 여기서, 후술된 수학식들은 본 발명의 일실시예에 불과하고, 후술된 수학식들은 변형이 가능함은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. Hereinafter, the operation of the parameter estimator 430 for estimating OPD will be described in detail. Hereinafter, the formulas described below are only examples of the present invention, and it will be apparent to those skilled in the art that the formulas described below can be modified.

먼저, 파라미터 추정부(430)는 수학식 4에 따라서, CLD를 이용하여 제1 중간 변수 c를 구한다. First, the parameter estimator 430 calculates the first intermediate variable c using the CLD according to Equation (4).

Figure 112017043768561-pat00022
Figure 112017043768561-pat00022

여기서, b는 주파수 밴드의 인덱스를 나타낸다. 수학식 4와 같이, 제1 중간 변수 c는 특정 주파수 밴드에서의 IID 값을 20으로 나눈 수를 10의 지수 형태로 표현함으로써 구할 수 있다. 이 때, 제1 중간 변수 c를 이용하여 다음 수학식 5 및 6과 같이 제2 중간 변수 c1 및 제3 중간 변수 c2를 구할 수 있다.Here, b represents an index of a frequency band. As shown in Equation (4), the first intermediate variable c can be obtained by expressing the number obtained by dividing the IID value in the specific frequency band by 20 in an exponential form of 10. At this time, the second intermediate variable c 1 and the third intermediate variable c 2 can be obtained by using the first intermediate variable c as shown in the following equations (5) and (6).

Figure 112017043768561-pat00023
Figure 112017043768561-pat00023

Figure 112017043768561-pat00024
Figure 112017043768561-pat00024

즉, 제3 중간 변수 c2는 제2 중간 변수 c1의 값에 c를 곱한 값으로 구할 수 있다.That is, the third intermediate variable c 2 can be obtained by multiplying the value of the second intermediate variable c 1 by c.

다음으로, 파라미터 추정부(430)는 복원된 모노 신호와, 수학식 5 및 수학식 6에서 구한 제2 중간 변수 및 제3 중간 변수를 이용하여 제1 우채널 신호와 제1 좌채널 신호를 구한다. 제1 우채널 신호 및 제1 좌채널 신호는 하기 수학식 7 및 수학식 8과 같이 나타낼 수 있다.Next, the parameter estimator 430 obtains the first right channel signal and the first left channel signal using the restored mono signal and the second intermediate variable and the third intermediate variable obtained from Equations (5) and (6) . The first right channel signal and the first left channel signal can be expressed by the following equations (7) and (8).

Figure 112017043768561-pat00025
Figure 112017043768561-pat00025

여기서, n은 시간 슬롯 인덱스이며, k는 파라미터 밴드 인덱스를 나타낸다. 제1 우채널 신호

Figure 112017043768561-pat00026
는 제2 중간 변수 c1과 복원된 모노 신호 M의 곱으로 나타낼 수 있다.Where n is the time slot index and k is the parameter band index. The first right channel signal
Figure 112017043768561-pat00026
Can be expressed as the product of the second intermediate variable c 1 and the restored mono signal M.

Figure 112017043768561-pat00027
Figure 112017043768561-pat00027

제1 좌채널 신호

Figure 112017043768561-pat00028
는 제2 중간 변수 c2와 복원된 모노 신호 M의 곱으로 나타낼 수 있다.The first left channel signal
Figure 112017043768561-pat00028
Can be expressed as the product of the second intermediate variable c 2 and the restored mono signal M.

이 때, IPD를

Figure 112017043768561-pat00029
라고 하면, 제1 모노 신호
Figure 112017043768561-pat00030
는 제1 우채널 신호
Figure 112017043768561-pat00031
및 제2 좌채널 신호
Figure 112017043768561-pat00032
를 이용하여 다음 수학식 9와 같이 나타낼 수 있다. At this time,
Figure 112017043768561-pat00029
, The first mono signal
Figure 112017043768561-pat00030
Lt; RTI ID = 0.0 &gt;
Figure 112017043768561-pat00031
And the second left channel signal
Figure 112017043768561-pat00032
The following equation (9) can be used.

Figure 112017043768561-pat00033
Figure 112017043768561-pat00033

또한, 수학식 6 내지 9를 이용하여, 시간 슬롯과 파라미터 밴드에 따른 제4 중간 변수 p는 다음 수학식 10과 같이 구할 수 있다.Further, using Equations (6) to (9), the fourth intermediate variable p according to the time slot and the parameter band can be obtained as shown in Equation (10).

Figure 112017043768561-pat00034
Figure 112017043768561-pat00034

여기서, 제4 중간 변수 p는 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호의 크기의 합을 2로 나눈 값으로 한다. 이 때, OPD의 값을

Figure 112017043768561-pat00035
라 할 때, OPD는 다음 수학식 11과 같이 구할 수 있다.Here, the fourth intermediate variable p is a value obtained by dividing the sum of the sizes of the first left channel signal, the first right channel signal, and the first mono signal by two. At this time, the value of OPD
Figure 112017043768561-pat00035
, The OPD can be obtained by the following equation (11).

Figure 112017043768561-pat00036
Figure 112017043768561-pat00036

또한, OPD와 IPD의 차에 해당하는 값을

Figure 112017043768561-pat00037
라 할 때,
Figure 112017043768561-pat00038
은 다음 수학식 12와 같이 구할 수 있다.Also, the value corresponding to the difference between OPD and IPD
Figure 112017043768561-pat00037
In other words,
Figure 112017043768561-pat00038
Can be obtained by the following equation (12).

Figure 112017043768561-pat00039
Figure 112017043768561-pat00039

수학식 11에서 구한 OPD의 값인

Figure 112017043768561-pat00040
은 복호화된 모노 신호와 업믹싱될 좌채널 신호 사이의 위상 차이고, 수학식 12에서 구한 값인
Figure 112017043768561-pat00041
는 복호화된 모노 신호와 업믹싱될 우채널 신호 사이의 위상 차를 나타낸다. The value of OPD obtained from the equation (11)
Figure 112017043768561-pat00040
Is the phase difference between the decoded mono signal and the left channel signal to be upmixed,
Figure 112017043768561-pat00041
Represents the phase difference between the decoded mono signal and the right channel signal to be upmixed.

수학식 11 및 수학식 12는 수학식 13과 같이 등가적으로 구현될 수 있다. Equation (11) and Equation (12) can be equivalently implemented as Equation (13).

Figure 112017043768561-pat00042
Figure 112017043768561-pat00042

withwith

Figure 112017043768561-pat00043
Figure 112017043768561-pat00043

여기에서 l, m은 각 서브밴드 인덱스와 파라미터 셋을 의미한다.Here, l and m denote each subband index and parameter set.

이와 같이, 파라미터 추정부(430)는 스테레오 신호의 채널 간 크기 차를 나타내는 IID를 이용하여 복원된 모노 신호로부터 좌채널 신호 및 우채널 신호에 대한 제1 좌채널 신호 및 제1 우채널 신호를 생성하고, 스테레오 신호의 채널 간 위상 차를 나타내는 IPD를 이용하여 제1 좌채널 신호 및 제1 우채널 신호로부터 제1 모노 신호를 생성하며, 생성된 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호를 이용하여 복원된 모노 신호와 스테레오 신호의 위상 차를 나타내는 OPD의 값을 추정할 수 있다.In this manner, the parameter estimator 430 generates the first left channel signal and the first right channel signal for the left channel signal and the right channel signal from the restored mono signal using the IID indicating the difference between channels of the stereo signal And generates a first mono signal from the first left channel signal and the first right channel signal using the IPD representing the phase difference between channels of the stereo signal, and outputs the generated first left channel signal, the first right channel signal, The value of the OPD indicating the phase difference between the restored mono signal and the stereo signal using the first mono signal can be estimated.

파라미터 역양자화부(440)는 복호화된 파라미터 및 복호화된 파라미터들로부터 추정된 파라미터를 역양자화한다. The parameter de-quantization unit 440 dequantizes the parameters estimated from the decoded parameters and the decoded parameters.

이하에서는 도 5 내지 도 8을 참고하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 상세히 설명하기로 한다. Hereinafter, the operation of the parameter de-quantization unit 440 for dequantizing the parameters will be described in detail with reference to FIGS. 5 to 8. FIG.

도 5는 USAC(Unified Speech and Audio Coding)에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 설명하기 위한 흐름도이다. 5 is a flowchart illustrating an operation of a parameter de-quantization unit 440 for dequantizing parameters based on USAC (Unified Speech and Audio Coding).

먼저, 단계(501)에서는 파라미터의 타입(type)이 위상 파라미터인지를 판단한다. First, in step 501, it is determined whether the type of the parameter is a phase parameter.

만약, 단계(501)에서 파라미터 타입이 위상 파라미터가 아닌 것으로 판단한 경우, 단계(502)에서는 MPS(MPEG Surround) 무손실 코딩 방법에 기초하여 위상 파라미터 이외의 파라미터인 제2 파라미터를 역양자화한다. If it is determined at step 501 that the parameter type is not a phase parameter, at step 502, the second parameter, which is a parameter other than the phase parameter, is inverse-quantized based on an MPS (MPEG Surround) lossless coding method.

만약, 단계(501)에서 파라미터 타입이 위상 파라미터인 것으로 판단한 경우, 단계(503)에서는 위상 파라미터의 부호화 모드를 판단한다. 보다 상세하게는, 단계(503)에서는 위상 파라미터의 부호화 모드가 1D 허프만 코딩인지, 2D 허프만 코딩인지를 판단한다. If it is determined in step 501 that the parameter type is a phase parameter, in step 503, the encoding mode of the phase parameter is determined. More specifically, in step 503, it is determined whether the coding mode of the phase parameter is 1D Huffman coding or 2D Huffman coding.

단계(503)에서 위상 파라미터의 부호화 모드가 1D 허프만 코딩이라고 판단한 경우, 단계(504)에서는 dT 또는 dF를 결정한다. dT는 이전 프레임에서 같은 밴드의 양자화된 위상정보를 기준으로 차이를 계산하는 것을 의미하고, dF는 현재 프레임의 이전 밴드의 양자화된 위상정보를 기준으로 차이를 계산하는 것을 의미한다 If it is determined in step 503 that the coding mode of the phase parameter is 1D Huffman coding, then in step 504, dT or dF is determined. dT means calculating the difference based on the quantized phase information of the same band in the previous frame and dF means calculating the difference based on the quantized phase information of the previous band of the current frame

이 후, 단계(505)에서는 단계(504)에서 결정된 dT 또는 dF에 따라서 허프만 코드북을 결정하고, 결정된 호프만 코드북에 따라 위상 파라미터에 대해 1D 허프만 디코딩을 수행한다. Thereafter, in step 505, a Huffman codebook is determined according to the dT or dF determined in step 504, and a 1D Huffman decoding is performed on the phase parameter according to the determined Hoffman codebook.

단계(506)에서는 이전 위상 파라미터와 현재 위상 파라미터를 dT 또는 dF에 따라 모듈러 연산하여 양자화된 위상 파라미터를 복원한다. Step 506 modulates the previous phase parameter and the current phase parameter according to dT or dF to recover the quantized phase parameter.

만약, 단계(503)에서, 위상 파라미터의 부호화 모드가 2D 허프만 코딩이라고 판단한 경우, 단계(507)에서는 LAV 디코딩을 수행한다. If it is determined in step 503 that the coding mode of the phase parameter is 2D Huffman coding, step 507 performs LAV decoding.

이 후, 단계(508)에서는 LAV에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 위상 파라미터에 대해 2D 허프만 디코딩을 수행한다. Thereafter, in step 508, a Huffman codebook is determined according to the LAV and a 2D Huffman decoding is performed on the phase parameters according to the determined Huffman codebook.

단계(509)에서는 2D 허프만 디코딩에 의해 복호화된 X 및 Y의 크기의 대소관계에 대한 정보를 복원하고, 복원된 대소 관계에 대한 정보에 기초하여 X 및 Y의 순서를 조절한다. In step 509, information on the magnitude of X and Y decoded by 2D Huffman decoding is restored, and the order of X and Y is adjusted on the basis of information on the restored magnitude relation.

단계(510)에서는 순서가 조절된 X 및 Y를 모듈러 연산하여 양자화된 위상 파라미터를 복원한다. In step 510, the quantized phase parameters are recovered by modulatively computing the regulated X and Y.

단계(511)에서는 단계(506) 또는 단계(508)에서 복원된 양자화된 위상 파라미터를 역양자화하여 위상 파라미터를 복원한다. In step 511, the quantized phase parameters reconstructed in step 506 or 508 are inversely quantized to reconstruct the phase parameters.

도 6 및 도 7은 MPS(MPEG Surround) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 설명하기 위한 흐름도이다. FIGS. 6 and 7 are flowcharts for explaining the operation of the parameter dequantizer 440 for dequantizing a parameter based on an MPS (MPEG Surround) lossless coding scheme.

먼저, 단계(601)에서는 파라미터의 타입(type)이 위상 파라미터인지를 판단한다. First, in step 601, it is determined whether the type of the parameter is a phase parameter.

만약, 단계(601)에서 파라미터 타입이 위상 파라미터인 것으로 판단한 경우, 단계(603)에서는 위상 파라미터의 부호화 모드를 판단한다. 즉, 단계(603)에서는 위상 파라미터의 부호화 모드가 1D 허프만 코딩인지, 2D 허프만 코딩인지를 판단한다. If it is determined in step 601 that the parameter type is a phase parameter, in step 603, the encoding mode of the phase parameter is determined. That is, in step 603, it is determined whether the coding mode of the phase parameter is 1D Huffman coding or 2D Huffman coding.

단계(603)에서 위상 파라미터의 부호화 모드가 1D 허프만 코딩이라고 판단한 경우, 단계(604)에서는 dT1 또는 dF1를 결정한다. If it is determined in step 603 that the coding mode of the phase parameter is 1D Huffman coding, then in step 604 dT 1 or dF 1 is determined.

이 후, 단계(605)에서는 단계(604)에서 결정된 dT1 또는 dF1에 따라서 허프만 코드북을 결정하고, 결정된 호프만 코드북에 따라 위상 파라미터에 대해 1D 허프만 디코딩을 수행한다. Thereafter, in step 605, a Huffman codebook is determined according to dT 1 or dF 1 determined in step 604, and 1D Huffman decoding is performed on the phase parameters according to the determined Hoffman codebook.

단계(606)에서는 dT1 또는 dF1에 기초하여 역 차분 복호화 및 모듈러 연산을 통해 이전 위상 파라미터와 현재 위상 파라미터로부터 양자화된 위상 파라미터를 복원한다. Step 606 reconstructs the quantized phase parameters from the previous phase parameters and the current phase parameters through inverse differential decoding and modular operations based on dT 1 or dF 1 .

만약, 단계(603)에서, 위상 파라미터의 부호화 모드가 2D 허프만 코딩이라고 판단한 경우, 단계(607)에서는 LAV 디코딩을 수행한다. If it is determined in step 603 that the coding mode of the phase parameter is 2D Huffman coding, step 607 performs LAV decoding.

이 후, 단계(608)에서는 LAV에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 위상 파라미터에 대해 2D 허프만 디코딩을 수행한다. Thereafter, in step 608, a Huffman codebook is determined according to the LAV and a 2D Huffman decoding is performed on the phase parameters according to the determined Huffman codebook.

단계(609)에서는 2D 허프만 디코딩에 의해 복호화된 X 및 Y의 크기의 대소관계에 대한 정보를 복원하고, 복원된 대소 관계에 대한 정보에 기초하여 X 및 Y의 순서를 조절한다. In step 609, information on the magnitude of X and Y decoded by 2D Huffman decoding is restored, and the order of X and Y is adjusted based on information on the restored magnitude relation.

단계(610)에서는 역 차분 복호화 및 모듈러 연산을 통해 순서가 조절된 X 및 Y로부터 양자화된 위상 파라미터를 복원한다. In step 610, the quantized phase parameters are recovered from the adjusted X and Y through inverse differential decoding and modular operations.

단계(611)에서는 단계(606) 또는 단계(610)에서 복원된 양자화된 위상 파라미터를 역양자화하여 위상 파라미터를 복원한다. In step 611, the quantized phase parameters reconstructed in step 606 or step 610 are inversely quantized to reconstruct the phase parameters.

처음으로 돌아가서, 만약 단계(601)에서 파라미터 타입이 위상 파라미터가 아닌 것으로 판단한 경우, 단계(602)에서는 위상 파라미터 이외의 파라미터인 제2 파라미터를 역양자화한다. Returning to the beginning, if it is determined at step 601 that the parameter type is not a phase parameter, at step 602, the second parameter, which is a parameter other than the phase parameter, is inverse-quantized.

도 7을 참고하여 단계(602)에 대해 상세히 설명하면 아래와 같다. Referring to FIG. 7, step 602 will be described in detail as follows.

단계(60201)에서는 제2 파라미터의 부호화 모드를 판단한다. 보다 상세하게는, 단계(6021)에서는 제2 파라미터의 부호화 모드가 1D 허프만 코딩인지, 2D 허프만 코딩인지를 판단한다. In step 60201, the encoding mode of the second parameter is determined. More specifically, in step 6021, it is determined whether the coding mode of the second parameter is 1D Huffman coding or 2D Huffman coding.

단계(60201)에서 제2 파라미터의 부호화 모드가 1D 허프만 코딩이라고 판단한 경우, 단계(60202)에서는 dT2 또는 dF2를 결정한다. If it is determined in step 60201 that the encoding mode of the second parameter is 1D Huffman coding, then in step 60202, dT 2 or dF 2 is determined.

이 후, 단계(60203)에서는 dT2 또는 dF2에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 제2 파라미터에 대하 1D 허프만 디코딩을 수행한다. Thereafter, in step 60203, Huffman codebook is determined according to dT 2 or dF 2 , and 1D Huffman decoding is performed on the second parameter according to the determined Huffman codebook.

단계(60204)에서는 현재 제2 파라미터와 이전 제2 파라미터 간의 차의 부호(sign)를 복호화한다. In step 60204, the sign of the difference between the current second parameter and the previous second parameter is decoded.

단계(60205)에서는 dT2 또는 dF2에 기초하여 역차분 복호화를 통해 이전 제2 파라미터 및 현재 제2 파라미터로부터 양자화된 제2 파라미터를 복원한다. Step 60205 restores the second parameter quantized from the previous second parameter and the current second parameter through inverse differential decoding based on dT 2 or dF 2 .

만약, 단계(60201)에서 제2 파라미터의 부호화 모드가 2D 허프만 코딩이라고 판단한 경우, 단계(60206)에서는 LAV 디코딩을 수행한다. If it is determined in step 60201 that the encoding mode of the second parameter is 2D Huffman coding, LAV decoding is performed in step 60206.

이 후, 단계(60207)에서는 LAV에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 위상 파라미터에 대해 2D 허프만 디코딩을 수행한다. Thereafter, in step 60207, a Huffman codebook is determined according to the LAV, and 2D Huffman decoding is performed on the phase parameter according to the determined Huffman codebook.

단계(60208)에서는 2D 허프만 디코딩에 의해 복호화된 X 및 Y의 크기의 대소 관계에 대한 정보를 복원하고, 복원된 대소 관계에 대한 정보에 기초하여 X 및 Y의 순서를 조절한다. In step 60208, information on the magnitude of X and Y decoded by 2D Huffman decoding is restored, and the order of X and Y is adjusted based on the information on the restored magnitude relation.

단계(60209)에서는 순서가 조절된 X 및 Y의 부호(sign)을 복호화한다. In step 60209, decoded X and Y signs are decoded.

단계(60210)에서는 역 차분 복호화를 통해 순서가 조절된 X 및 Y로부터 양자화된 제2 파라미터를 복원한다. In step 60210, the second parameter quantized from the order-adjusted X and Y is restored through inverse differential decoding.

이 후, 단계(60211)에서는 단계(60205) 또는 단계(60210)에서 복원된 양자화된 제2 파라미터를 역양자화하여 제2 파라미터를 복원한다. Thereafter, in step 60211, the quantized second parameter restored in step 60205 or 60210 is dequantized to restore the second parameter.

단계(611)에서는 단계(606) 또는 단계(608)에서 복원된 양자화된 위상 파라미터를 역양자화하여 위상 파라미터를 복원한다.In step 611, the quantized phase parameters reconstructed in step 606 or step 608 are inversely quantized to reconstruct the phase parameters.

도 8은 PS(Parametric Stereo) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 설명하기 위한 흐름도이다. 8 is a flowchart for explaining the operation of the parameter de-quantization unit 440 for dequantizing a parameter based on a PS (Parametric Stereo) lossless coding scheme.

먼저, 단계(801)에서는 파라미터의 타입이 IPD인지를 판단한다. First, in step 801, it is determined whether the parameter type is IPD.

만약, 단계(801)에서 파라미터의 타입이 IPD인 것으로 판단한 경우, 단계(802)에서는 dT1 또는 dF1를 결정한다. If it is determined in step 801 that the type of the parameter is IPD, step 802 determines dT 1 or dF 1 .

이후, 단계(803)에서는 결정된 dT1 또는 dF1에 따라서 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 IPD에 대해 허프만 디코딩을 수행한다. Thereafter, in step 803, a Huffman codebook is determined according to the determined dT 1 or dF 1 , and Huffman decoding is performed on the IPD according to the determined Huffman codebook.

단계(804)에서는 dT1 또는 dF1에 기초하여 역 차분 복호화 및 모듈러 연산을 통해 이전 IPD 및 현재 IPD로부터 양자화된 IPD를 복원한다. Step 804 reconstructs the IPD quantized from the current IPD and the previous IPD through inverse differential decoding and modular operations based on dT 1 or dF 1 .

단계(805)에서는 양자화된 IPD를 역양자화하여 IPD를 복원한다. In step 805, the quantized IPD is dequantized to restore the IPD.

처음으로 돌아가서, 단계(801)에서 파라미터의 타입이 IPD가 아닌 것으로 판단한 경우, 단계(806)에서는 dT2 또는 dF2를 결정한다. Returning to the beginning, if it is determined at step 801 that the type of the parameter is not IPD, step 806 determines dT 2 or dF 2 .

이 후, 단계(807)에서는 dT2 또는 dF2에 따라서 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 IPD 이외의 파라미터인 제2 파라미터에 대해 허프만 디코딩을 수행한다. Thereafter, in step 807, a Huffman codebook is determined according to dT 2 or dF 2 , and Huffman decoding is performed on the second parameter, which is a parameter other than the IPD, according to the determined Huffman codebook.

단계(808)에서는 현재 제2 파라미터와 이전 제2 파라미터 간의 차의 부호(sign)를 복호화한다. In step 808, the sign of the difference between the current second parameter and the previous second parameter is decoded.

단계(809)에서는 dT2 또는 dF2에 기초하여 역 차분 복호화를 통해 이전 제2 파라미터 및 현재 제2 파라미터로부터 양자화된 제2 파라미터를 복원한다. Step 809 reconstructs the second parameter quantized from the previous second parameter and the current second parameter through inverse differential decoding based on dT 2 or dF 2 .

단계(810)에서는 양자화된 제2 파라미터를 역양자화하여 제2 파라미터를 복원한다. In step 810, the quantized second parameter is dequantized to restore the second parameter.

다시, 도 4를 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(400)에 대해 상세히 설명하기로 한다. Referring again to FIG. 4, an apparatus 400 for decoding a multi-channel signal according to an embodiment of the present invention will be described in detail.

업 믹싱부(450)는 복원된 파라미터 및 추정된 파라미터(OPD)를 이용하여 모노 신호를 업 믹싱한다.The upmixing unit 450 upmixes the mono signal using the restored parameter and the estimated parameter OPD.

업 믹싱은 한 채널의 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것으로 다운 믹싱과 대응된다. 이하에서는 CLD, ICC, IPD 및 OPD를 이용하여 모노 신호를 업 믹싱하는 업 믹싱부(450)의 구체적인 동작에 대해 설명하기로 한다. Upmixing corresponds to downmixing by generating more than two channels of stereo signals from a mono signal of one channel. Hereinafter, the specific operation of the upmixing unit 450 upmixing the mono signal using CLD, ICC, IPD, and OPD will be described.

먼저, 업 믹싱부(450)는 ICC의 값이

Figure 112017043768561-pat00044
일 때, 제2 및 제3 중간 변수 c1 및 c2를 이용하여 제1 위상
Figure 112017043768561-pat00045
및 제2 위상
Figure 112017043768561-pat00046
을 다음 수학식 14 및 15과 같이 구할 수 있다.First, the upmixing unit 450 receives the value of ICC
Figure 112017043768561-pat00044
, The second and third intermediate variables c 1 and c 2 are used to determine the first phase
Figure 112017043768561-pat00045
And the second phase
Figure 112017043768561-pat00046
Can be obtained by the following equations (14) and (15).

Figure 112017043768561-pat00047
Figure 112017043768561-pat00047

Figure 112017043768561-pat00048
Figure 112017043768561-pat00048

다음으로, 업 믹싱부(450)는 복원된 모노 신호가 M이고, 디코릴레이션된 신호가 D일 때, 수학식 14 및 수학식 15를 통해 구한 제1 및 제2 위상, 제2 및 제3 중간 변수 c1 및 c2 및 수학식 11에서 구한 OPD의 값인

Figure 112017043768561-pat00049
, 수학식 12에서 구한 값인
Figure 112017043768561-pat00050
을 이용하여 아래의 수학식 16 및 수학식 17과 같이 업 믹싱된 좌채널 신호 및 우채널 신호를 구할 수 있다.Next, the upmixing unit 450 multiplies the first and second phases, the second and third intermediate values obtained through Equations (14) and (15) when the restored mono signal is M and the decorrelated signal is D, The variables c 1 and c 2 And the value of OPD obtained from the equation (11)
Figure 112017043768561-pat00049
, The value obtained from the equation (12)
Figure 112017043768561-pat00050
The left channel signal and the right channel signal upmixed as shown in Equation (16) and Equation (17) below can be obtained.

Figure 112017043768561-pat00051
Figure 112017043768561-pat00051

Figure 112017043768561-pat00052
Figure 112017043768561-pat00052

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described with reference to particular embodiments, such as specific elements, and specific embodiments and drawings. However, it should be understood that the present invention is not limited to the above- And various modifications and changes may be made thereto by those skilled in the art to which the present invention pertains. Accordingly, the spirit of the present invention should not be construed as being limited to the embodiments described, and all of the equivalents or equivalents of the claims, as well as the following claims, belong to the scope of the present invention .

410 ... 모노신호 복호화부 420 ... 파라미터 복호화부
430 ... 파라미터 추정부 440 ... 파라미터 역양자화부
450 ... 업믹싱부
410 ... Mono signal decoding unit 420 ... Parameter decoding unit
430 ... parameter estimation unit 440 ... parameter inverse quantization unit
450 ... Up Mixer

Claims (8)

적어도 하나의 프로세서를 포함하며,
상기 프로세서는
비트스트림으로부터 모노 다운믹스 신호를 복호화하고,
상기 비트스트림으로부터 채널들 간의 특성 관계를 나타내는 복수의 파라미터를 복호화하고,
상기 복호화된 복수의 파라미터에 근거하여 상기 모노 다운믹스 신호를 스테레오 신호로 업믹싱하고,
상기 복호화된 복수의 파라미터는 위상 파라미터를 포함하고,
상기 프로세서는 상기 비트스트림으로부터 상기 위상 파라미터의 LAV(Largest Absolute Value)에 대한 인덱스를 획득하고, 상기 인덱스로부터 상기 위상 파라미터의 LAV를 획득하고, 상기 LAV에 근거하여 허프만 코드북을 결정하고, 상기 결정된 허프만 코드북에 근거하여 상기 위상 파라미터의 심볼들을 복호화하고, 상기 복호화된 심볼로부터 양자화된 위상 파라미터를 획득함으로써 상기 복수의 파라미터 중 상기 위상 파라미터를 복호화하는 복호화장치.
At least one processor,
The processor
Decodes the mono downmix signal from the bit stream,
Decodes a plurality of parameters indicating a characteristic relationship between channels from the bitstream,
Mixes the mono down-mix signal into a stereo signal based on the decoded parameters,
Wherein the plurality of decoded parameters include phase parameters,
Wherein the processor is configured to: obtain an index for a LAV (Largest Absolute Value) of the phase parameter from the bitstream, obtain a LAV of the phase parameter from the index, determine a Huffman codebook based on the LAV, Decodes symbols of the phase parameter based on a codebook, and obtains a quantized phase parameter from the decoded symbol to decode the phase parameter among the plurality of parameters.
제1 항에 있어서, 상기 프로세서는 복호화된 복수의 파라미터를 이용하여, 좌측신호와 우측신호 중 하나와 상기 모노 다운믹스 신호간의 위상차에 관한 파라미터를 추정하고, 상기 복호화된 복수의 파라미터 및 상기 추정된 파라미터에 근거하여 상기 모노 다운믹스 신호를 업믹싱하는 복호화장치. 2. The apparatus of claim 1, wherein the processor estimates a parameter relating to a phase difference between one of a left signal and a right signal and the mono downmix signal using a plurality of decoded parameters, Mixes the mono down-mix signal based on the parameter. 제1 항에 있어서, 상기 프로세서는 인접한 양자화된 위상 파라미터들의 차이에 대하여 모듈로 연산을 수행하는 복호화장치.The apparatus of claim 1, wherein the processor performs modulo arithmetic on a difference between adjacent quantized phase parameters. 제1 항에 있어서, 상기 위상 파라미터는 IPD(Inter-channel Phase Difference)인 복호화장치.2. The decoding apparatus according to claim 1, wherein the phase parameter is Inter-channel Phase Difference (IPD). 제1 항에 있어서, 상기 허프만 코드북은 데이터세트(LavIdx, LavTabIPD)를 포함하고, 상기 데이터세트는 (0,7), (1,1), (2,3), 및 (3,5)을 포함하는 복호화장치.2. The method of claim 1, wherein the Huffman codebook comprises a data set (LavIdx, LavTabIPD) and the data set comprises (0,7), (1,1), (2,3) The decoding apparatus comprising: 적어도 하나의 프로세서를 포함하며,
상기 프로세서는
비트스트림으로부터 IPD(Inter-channel Phase Difference) 파라미터의 LAV(Largest Absolute Value)에 대한 인덱스를 획득하고,
상기 인덱스로부터 상기 IPD 파라미터의 LAV를 획득하고,
상기 LAV에 근거하여 허프만 코드북을 결정하고,
상기 결정된 허프만 코드북에 근거하여 상기 IPD 파라미터의 심볼들을 복호화하고,
상기 복호화된 심볼로부터 양자화된 IPD 파라미터를 획득하는 위상 파라미터 복호화장치.
At least one processor,
The processor
Obtains an index for a LAV (Largest Absolute Value) of an Inter-channel Phase Difference (IPD) parameter from a bitstream,
Obtaining an LAV of the IPD parameter from the index,
Determines a Huffman codebook based on the LAV,
Decodes the symbols of the IPD parameter based on the determined Huffman codebook,
And obtains a quantized IPD parameter from the decoded symbol.
제6 항에 있어서, 상기 프로세서는 인접한 양자화된 IPD 파라미터들의 차이에 대하여 모듈로 연산을 수행하는 위상 파라미터 복호화장치.7. The apparatus of claim 6, wherein the processor performs a modulo operation on a difference of adjacent quantized IPD parameters. 제6 항에 있어서, 상기 허프만 코드북은 데이터세트(LavIdx, LavTabIPD)를 포함하고, 상기 데이터세트는 (0,7), (1,1), (2,3), 및 (3,5)을 포함하는 위상 파라미터 복호화장치.7. The method of claim 6, wherein the Huffman codebook comprises a data set (LavIdx, LavTabIPD) and the data set comprises (0,7), (1,1), (2,3) And decodes the phase parameters.
KR1020170057373A 2017-05-08 2017-05-08 Apparatus for encoding/decoding multichannel signal and method thereof KR101783967B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170057373A KR101783967B1 (en) 2017-05-08 2017-05-08 Apparatus for encoding/decoding multichannel signal and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170057373A KR101783967B1 (en) 2017-05-08 2017-05-08 Apparatus for encoding/decoding multichannel signal and method thereof

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020160079289A Division KR101735619B1 (en) 2016-06-24 2016-06-24 Apparatus for encoding/decoding multichannel signal and method thereof

Publications (2)

Publication Number Publication Date
KR20170054363A KR20170054363A (en) 2017-05-17
KR101783967B1 true KR101783967B1 (en) 2017-11-06

Family

ID=59048535

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170057373A KR101783967B1 (en) 2017-05-08 2017-05-08 Apparatus for encoding/decoding multichannel signal and method thereof

Country Status (1)

Country Link
KR (1) KR101783967B1 (en)

Also Published As

Publication number Publication date
KR20170054363A (en) 2017-05-17

Similar Documents

Publication Publication Date Title
KR101253699B1 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Wiener Filtering
RU2368074C2 (en) Adaptive grouping of parametres for improved efficiency of coding
KR101823278B1 (en) Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
US9685168B2 (en) Apparatus for encoding/decoding multichannel signal and method thereof
JP6133422B2 (en) Generalized spatial audio object coding parametric concept decoder and method for downmix / upmix multichannel applications
RU2367087C2 (en) Coding information without loss with guaranteed maximum bit speed
KR20090043921A (en) Method and apparatus of encoding/decoding multi-channel signal
KR102033985B1 (en) Apparatus and methods for adapting audio information in spatial audio object coding
JP4892184B2 (en) Acoustic signal encoding apparatus and acoustic signal decoding apparatus
KR101783967B1 (en) Apparatus for encoding/decoding multichannel signal and method thereof
KR101735619B1 (en) Apparatus for encoding/decoding multichannel signal and method thereof
KR101635099B1 (en) Apparatus for encoding/decoding multichannel signal and method thereof
KR101500972B1 (en) Method and Apparatus of Encoding/Decoding Multi-Channel Signal

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant