KR101783967B1 - Apparatus for encoding/decoding multichannel signal and method thereof - Google Patents
Apparatus for encoding/decoding multichannel signal and method thereof Download PDFInfo
- Publication number
- KR101783967B1 KR101783967B1 KR1020170057373A KR20170057373A KR101783967B1 KR 101783967 B1 KR101783967 B1 KR 101783967B1 KR 1020170057373 A KR1020170057373 A KR 1020170057373A KR 20170057373 A KR20170057373 A KR 20170057373A KR 101783967 B1 KR101783967 B1 KR 101783967B1
- Authority
- KR
- South Korea
- Prior art keywords
- parameter
- phase
- parameters
- signal
- encoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000013139 quantization Methods 0.000 abstract description 28
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 3
- TVEXGJYMHHTVKP-UHFFFAOYSA-N 6-oxabicyclo[3.2.1]oct-3-en-7-one Chemical compound C1C2C(=O)OC1C=CC2 TVEXGJYMHHTVKP-UHFFFAOYSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
멀티 채널 신호의 부호화/복호화 장치 및 방법이 개시된다. 멀티 채널 신호의 부호화 장치 및 방법은 양자화(quantization) 및 무손실 부호화(lossless encoding)를 통해 멀티 채널 신호의 위상 정보를 부호화하고, 멀티 채널 신호의 복호화 장치 및 방법은 역양자화(inverse quantization) 및 무손실 복호화(lossless decoding)를 통해 위상 정보를 복호화한다. An apparatus and method for encoding / decoding multi-channel signals are disclosed. An apparatus and method for encoding a multi-channel signal encodes phase information of a multi-channel signal through quantization and lossless encoding, and an apparatus and method for decoding a multi-channel signal are provided with inverse quantization and lossless decoding and decodes the phase information through lossless decoding.
Description
본 발명의 실시예들은 멀티 채널 신호의 부호화/복호화 장치 및 방법에 관한 것으로서, 더욱 상세하게는 양자화(quantization) 및 무손실 부호화(lossless encoding)를 통해 위상 정보를 부호화하는 멀티 채널 신호의 부호화 장치/방법과, 역양자화(inverse quantization) 및 무손실 복호화(lossless decoding)를 통해 위상 정보를 복호화하는 멀티 채널 신호의 복호화 장치/방법에 관한 것이다. Embodiments of the present invention relate to an apparatus and method for encoding / decoding multi-channel signals, and more particularly, to a multi-channel signal encoding apparatus / method for encoding phase information through quantization and lossless encoding And a device / method for decoding a multi-channel signal that decodes phase information through inverse quantization and lossless decoding.
스테레오 신호를 부호화하는데 이용되는 방법으로 파라메트릭 스테레오(PS, Parametric Stereo) 기술이 있다. 파라메트릭 스테레오 기술은 입력되는 스테레오 신호를 다운 믹싱하여 모노 신호를 생성하고, 스테레오 신호에 대한 부가 정보(side information)를 나타내는 스테레오 파라미터를 추출하고, 생성된 모노 신호와 추출된 스테레오 파라미터를 부호화하여 스테레오 신호를 부호화한다. A method used to encode a stereo signal is parametric stereo (PS) technology. The parametric stereo technique generates a mono signal by downmixing an input stereo signal, extracts a stereo parameter indicating side information on the stereo signal, codes the generated mono signal and the extracted stereo parameter, And encodes the signal.
이 경우 이용되는 스테레오 파라미터에는, 스테레오 신호에 포함된 적어도 두 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), 스테레오 신호에 포함된 적어도 두 채널 신호의 파형의 유사성에 따른 두 채널 신호 사이의 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차가 모노 신호를 기준으로 두 채널 사이에 어떻게 분포하는지를 나타내는 OPD(Overall Phase Difference) 등이 있다.In this case, the stereo parameters used include Inter-channel Intensity Difference (IID) or Channel Level Differences (CLD) indicating intensity differences according to energy levels of at least two channel signals included in the stereo signal, at least two channels (Inter-channel Coherence or Inter-channel Correlation) indicating the correlation between two channel signals according to the similarity of the waveform of the signal, an inter-channel coherence or inter-channel correlation And OPD (Overall Phase Difference) indicating how the phase difference between at least two channel signals included in the stereo signal is distributed between the two channels based on the mono signal.
본 발명의 일실시예들은 위상 파라미터를 효율적으로 부호화/복호화하기 위한 멀티 채널 신호의 부호화/복호화 장치 및 방법을 제공할 수 있다.Embodiments of the present invention can provide an apparatus and method for encoding / decoding multi-channel signals for efficiently encoding / decoding phase parameters.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 상기 복수의 파라미터를 양자화하는 파라미터 양자화부, 상기 양자화된 복수의 파라미터를 부호화하는 파라미터 부호화부, 상기 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화하는 모노 신호 부호화부, 및 상기 부호화된 복수의 파라미터 및 상기 부호화된 모노 신호를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 비트스트림 생성부를 포함하고, 상기 복수의 파라미터는 위상 파라미터를 포함하고, 상기 파라미터 부호화부는 허프만 코딩 기법을 이용하여 상기 양자화된 위상 파라미터를 부호화한다. An apparatus for encoding a multi-channel signal according to an embodiment of the present invention includes a parameter extraction unit that extracts a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal, a parameter quantization unit that quantizes the plurality of parameters, A parameter encoding unit for encoding a plurality of quantized parameters, a mono signal encoding unit for encoding a mono signal obtained by downmixing the multi-channel signal, and a multi-channel signal encoding unit for encoding the multi-channel signal using the plurality of encoded parameters and the encoded mono signal. And the parameter encoding unit encodes the quantized phase parameters using a Huffman coding scheme. The parameter encoding unit may encode the quantized phase parameters using a Huffman coding scheme.
또한, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치는 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원하는 모노 신호 복호화부, 상기 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 파라미터 복호화부, 상기 복원된 복수의 파라미터를 이용하여 상기 복원된 모노 신호와 상기 멀티 채널 신호간의 위상 차에 관한 파라미터(OPD: Overall Phase Difference)를 추정하는 파라미터 추정부, 상기 복원된 파라미터 및 상기 추정된 OPD를 역양자화하는 파라미터 역양자화부, 및 상기 역양자화된 복수의 파라미터 및 상기 역양자화된 OPD를 이용하여 상기 모노 신호를 업 믹싱하는 업 믹싱부를 포함한다. Also, an apparatus for decoding a multi-channel signal according to an embodiment of the present invention includes a mono signal decoding unit for decoding a mono signal, which is a downmix signal of the multi-channel signal, from a bitstream of a multi- A parameter decoding unit for restoring a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal; a parameter decoding unit for decoding a parameter (OPD) related to a phase difference between the restored monaural signal and the multi- : A parameter estimator for estimating an overall phase difference, an inverse quantization unit for inversely quantizing the reconstructed parameter and the estimated OPD, and a parameter inverse quantization unit for inversely quantizing the monaural signal using the inversely quantized parameter and the inversely quantized OPD. Upmixing unit.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화/복호화 장치에 따르면 위상 파라미터를 효율적으로 부호화/복호화하여 위상 파라미터의 표현에 사용되는 비트의 수를 감소시킬 수 있다. According to the apparatus for encoding / decoding a multi-channel signal according to an embodiment of the present invention, the number of bits used for expressing a phase parameter can be reduced by efficiently encoding / decoding a phase parameter.
도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다.
도 2는 wrapping property를 갖지 않는 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다.
도 3은 wrapping property를 갖는 위상 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다.
도 5는 USAC(Unified Speech and Audio Coding)에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부의 동작을 설명하기 위한 흐름도이다.
도 6 및 도 7은 MPS(MPEG Surround) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부의 동작을 설명하기 위한 흐름도이다.
도 8은 PS(Parametric Stereo) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부의 동작을 설명하기 위한 흐름도이다. 1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining a concept of encoding a parameter by applying 2D Huffman coding to parameter pairs constituted by parameters having no wrapping property. FIG.
3 is a diagram for explaining a concept of coding a parameter by applying 2D Huffman coding to parameter pairs constituted by phase parameters having a wrapping property.
4 is a block diagram illustrating a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
FIG. 5 is a flowchart for explaining the operation of a parameter dequantizer for dequantizing a parameter based on USAC (Unified Speech and Audio Coding).
FIGS. 6 and 7 are flowcharts for explaining the operation of a parameter de-quantization unit for dequantizing a parameter based on an MPS (MPEG Surround) lossless coding scheme.
8 is a flowchart for explaining an operation of a parameter de-quantization unit for dequantizing a parameter based on a PS (Parametric Stereo) lossless coding scheme.
이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. However, the present invention is not limited to or limited by the embodiments. Like reference symbols in the drawings denote like elements.
도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다. 1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 파라미터 추출부(110), 파라미터 양자화부(120), 파라미터 부호화부(130), 다운믹싱부(140), 모노 신호 부호화부(150), 및 비트스트림 생성부(160)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.The
여기서, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.Here, the multi-channel signal means a signal of a plurality of channels. In the present specification, each of a plurality of channels included in the multi-channel signal is referred to as a channel signal.
또한, 이하에서는, 설명의 편의상 멀티 채널 신호의 부호화 장치(100)에 입력되는 멀티 채널 신호는 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화에도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. Hereinafter, for convenience of description, it is assumed that a multi-channel signal input to the multi-channel signal encoding
파라미터 추출부(110)는 스테레오 신호를 구성하는 좌채널 신호와 우채널 신호 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 복수의 파라미터에는 상기에서 언급한 CLD, ICC, IPD, OPD 등이 포함될 수 있다. 여기서, IPD 및 OPD는 좌채널 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다. The
파라미터 양자화부(120)는 추출된 복수의 파라미터를 양자화하고, 파라미터 부호화부(130)는 양자화된 복수의 파라미터를 부호화한다.The
이 때, OPD는 다른 파라미터들로부터 추정될 수 있으므로, 본 발명의 일실시예에 따르면, 파라미터 부호화부(120)는 추출된 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하고, OPD는 부호화하지 않을 수 있다. 즉, 멀티 채널 신호의 부호화 장치(100)는 OPD를 부호화하여 전송하지 않음으로써 전송되는 비트스트림의 비트 수를 줄일 수 있다. OPD의 추정에 대한 보다 상세한 설명은 도 4의 멀티 채널 신호의 복호화 장치(400)에 관한 설명을 참고하기로 한다. In this case, since OPD can be estimated from other parameters, according to an embodiment of the present invention, the
본 발명의 일실시예에 따르면, 파라미터 양자화부(120)는 CLD 또는 ICC를 양자화할 수 있다. 이 경우, CLD는 8 레벨(level) 또는 16 레벨로 양자화될 수 있고, ICC는 8레벨로 양자화될 수 있다. According to an embodiment of the present invention, the
또한, 본 발명의 일실시예에 따르면, 파라미터 양자화부(120)는 CLD 및 ICC 외에 IPD 또는 OPD와 같은 위상 파라미터를 양자화할 수 있다. 이 경우, 위상 파라미터는 8 레벨 또는 16 레벨로 양자화될 수 있다. Further, according to an embodiment of the present invention, the
파라미터 양자화부(120)에서 CLD 또는 ICC를 양자화한 경우, 파라미터 부호화부(130)는 현재 프레임과 이전 프레임 간의 양자화된 CLD 또는 양자화된 ICC의 변화량(차분; differential value)을 부호화할 수 있다. 즉 파라미터 부호화부는 차분 코딩(differential coding) 기법을 이용하여 CLD 또는 ICC를 부호화할 수 있다. When the
일례로, 파라미터 양자화부(120)에서 CLD 또는 ICC를 8레벨로 양자화한 경우, CLD 또는 ICC는 -7로부터 7까지의 15단계의 차분 범위(difference range)를 갖고, 파라미터 부호화부(130)는 15단계의 차분 범위를 갖는 CLD 또는 ICC를 부호화할 수 있다. 다른 일례로, 파라미터 양자화부(120)에서 CLD를 16레벨로 양자화한 경우, CLD 또는 ICC는 -15로부터 15까지의 31단계의 차분 범위를 갖고, 파라미터 부호화부(130)는 31단계의 차분 범위를 갖는 CLD를 부호화할 수 있다. For example, when CLD or ICC is quantized to 8 levels in the
파라미터 양자화부(120)에서 위상 파라미터를 양자화한 경우, 파라미터 부호화부(130)는 현재 프레임과 이전 프레임 간의 양자화된 위상 파라미터의 변화량(차분)을 부호화할 수 있다. When the
일례로, 파라미터 양자화부(120)에서 위상 파라미터를 8 레벨로 양자화한 경우, 파라미터 부호화부(130)는 15단계의 차분 범위를 갖는 위상 파라미터를 부호화할 수 있다. 다른 일례로, 파라미터 양자화부(120)에서 위상 파라미터를 16 레벨로 양자화한 경우, 파라미터 부호화부(13)는 31단계의 차분 범위를 갖는 위상 파라미터를 부호화할 수 있다For example, when the
위상은 360°를 기준으로 주기성을 갖는 특징(wrapping property)이 있으므로(일례로, 370°는 10°와 동일함), wrapping property를 이용하여 위상 파라미터를 양자화한다면, 위상 정보의 표현에 할당되는 비트 수를 감소시킬 수 있다.Since the phase has a wrapping property with respect to 360 degrees (for example, 370 is equal to 10 degrees), if the phase parameter is quantized using the wrapping property, the bit allocated to the representation of the phase information It is possible to reduce the number.
본 발명의 일실시예에 따르면, 파라미터 부호화부(130)는 wrapping property를 갖는 위상 파라미터의 차분에 대해 모듈러(Modulo) 연산을 적용하여 위상 파라미터의 차분이 향상 양의 값을 갖도록 할 수 있다. 이에 따라, 파라미터 부호화부(130)는 위상 파라미터에 부여되는 부호 값(sign bit)을 전송하지 않게 되어, 위상 파라미터를 표현하는데 사용되는 비트 수를 감소시킬 수 있다. 또한, 모듈러 연산을 적용하는 경우, wrapping property로 인해 위상 파라미터 간에 불연속(discontinuity)이 발생하여 위상 파라미터 분포의 엔트로피(entropy)가 증가하게 되는 문제점을 해결할 수 있게 된다. According to an embodiment of the present invention, the
파라미터 양자화부(120)에서 8 레벨로 위상 파라미터를 양자화하는 경우, 위상 파라미터는 0으로부터 7까지의 차분 범위를 갖고, 파라미터 양자화부(130)에서 16 레벨로 위상 파라미터를 양자화하는 경우, 위상 파라미터는 0으로부터 15까지의 차분 범위를 갖는다. 표 1은 8 레벨로 양자화된 위상 파라미터의 양자화 값의 일례를 표시하고 있고, 표 2는 16 레벨로 양자화된 위상 파라미터의 양자화 값의 일례를 표시하고 있다. When the phase parameter is quantized to 8 levels in the
일례로서, 위상 파라미터가 8 레벨로 양자화된 IPD인 경우, 파라미터 부호화부(130)는 모듈러-8 연산을 적용하여 위상 파라미터의 차분 값을 연산할 수 있다. 이는 수학식 1과 같이 표현될 수 있다. As an example, when the phase parameter is the IPD quantized to 8 levels, the
여기서, ''는 현재 프레임에서의 IPD 값, ''는 이전 프레임에서의 IPD 값, '%8'은 Module-8 연산을, ''는 Module?8 연산을 통해 도출된 IPD의 차분 값을 각각 의미한다. here, ' 'Is the IPD value in the current frame,' 'Is the IPD value in the previous frame,'% 8 'is the Module-8 operation, 'Means the difference value of the IPD derived from the Module? 8 operation.
표 3은 Module-8 연산을 통해 도출된 값의 일례들을 나타내고 있다. 표 3에서, 'Previous'는 과, 'Current'는 와, 'Diff.'은 과, 'Diff with 모듈러'는 와 각각 대응된다. Table 3 shows the results of Module-8 computation. Values. ≪ / RTI > In Table 3, 'Previous' And 'Current' And 'Diff.' And 'Diff with modular' Respectively.
일반적으로, 'Diff.'가 '0'인 경우, 가장 낮은 비트수를 보이며, 'Diff.'가 '0' 또는 '7'에 가까울수록 비트수가 적어진다. 위상이 변화가 이전 데이터가 천천히 변하므로, 0은 이전 프레임과의 차이가 없음을, 7은 이전 프레임과의 차이가 -1임을, 1은 이전 프레임과의 차이가 1이기 때문에 가장 높은 빈도를 보이며 비트를 적게 할당할 수 있다. Generally, when 'Diff.' Is '0', it shows the lowest number of bits. As 'Diff.' Is closer to '0' or '7', the number of bits decreases. 0 is the difference from the previous frame, 7 is the difference from the previous frame is -1, 1 is the highest frequency because the difference from the previous frame is 1 You can allocate fewer bits.
파라미터 부호화부(130)는 무손실 부호화(lossless encoding)를 통해 양자화된 파라미터의 차분을 부화할 수 있다. 일례로 파라미터 부호화부(130)는 허프만 코딩(Huffman coding)을 이용하여 양자화된 파라미터를 부호화할 수 있다. The
허프만 코딩은 무손실 부호화에 사용되는 엔트로피 코딩(entropy)의 일 종류로서, 각각의 데이터와 대응되는 심볼(symbol)의 발생 빈도에 따라서 다른 길이의 부호를 사용하는 코딩 알고리즘이다. Huffman coding is a type of entropy coding used for lossless coding and is a coding algorithm that uses codes of different lengths depending on the occurrence frequency of a symbol corresponding to each data.
허프만 코딩 기법으로는 1D 허프만 코딩 및 2D 허프만 코딩이 있다. 1D 허프만 코딩은 각각의 데이터를 하나의 심볼로 간주하여 부호화하는 방법을 의미하고, 2D 허프만 코딩은 복수의 데이터를 2개의 데이터를 포함하는 복수의 데이터 그룹으로 그룹화하고, 복수의 데이터 그룹(즉 2개의 데이터로 구성된 데이터 쌍(pair))을 하나의 심볼로 간주하여 부호화하는 방법을 의미한다. Huffman coding schemes include 1D Huffman coding and 2D Huffman coding. 1D Huffman coding refers to a method of coding each data as one symbol, and 2D Huffman coding groups a plurality of data into a plurality of data groups including two data, and a plurality of data groups A pair of data consisting of a plurality of data) is regarded as one symbol and encoded.
다시 말해, 1D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 부호화부(130)는 허프만 코딩 기법에 따라 각각의 파라미터를 직접 부호화한다. In other words, when 1D Huffman coding is applied to parameters, the
일례로, CLD 또는 ICC를 부호화하고자 하는 경우, 파라미터 부호화부(130)는 복수의 CLD 값 또는 복수의 ICC 값을 각각 하나의 심볼로 간주하여 허프만 코딩을 수행한다. For example, when CLD or ICC is to be encoded, the
다른 일례로, 위상 파라미터를 부호화하고자 하는 경우, 파라미터 부호화부(130)는 복수의 위상 파라미터 값을 각각 하나의 심볼로 간주하여 허프만 코딩을 수행한다. In another example, when it is desired to encode a phase parameter, the
또한, 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 부호화부(130)는 2개의 파라미터로 구성되는 파라미터 쌍을 허프만 코딩 기법에 따라 부호화한다. In addition, when parameters are encoded by applying 2D Huffman coding, the
2D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 쌍을 구성하는 2개의 파라미터 간의 상관(correlation)이 감소된다. 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 경우, 파라미터 쌍을 구성하는 2개의 파라미터 간의 두개의 심볼의 조합 확률 (Joint Probability)을 고려하기 때문에 비트율이 감소된다. When coding a parameter by applying 2D Huffman coding, the correlation between the two parameters constituting the parameter pair is reduced. When a parameter is encoded by applying 2D Huffman coding, the bit rate is reduced because the joint probability of two symbols between two parameters constituting the parameter pair is considered.
이하에서는 도 2 및 도 3을 참고하여 2D 허프만 코딩에 따라 파라미터를 부호화하는 파라미터 부호화부(130)의 동작을 상세히 설명하기로 한다. Hereinafter, the operation of the
도 2 및 도 3은 파라미터 쌍을 부호화하는 2D 허프만 코딩의 개념을 설명하기 위한 도면이다. FIGS. 2 and 3 are diagrams for explaining the concept of 2D Huffman coding for coding parameter pairs.
도 2는 CLD 또는 ICC와 같은 wrapping property를 갖지 않는 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다. 2 is a diagram for explaining a concept of coding parameters by applying 2D Huffman coding to parameter pairs constituted by parameters having no wrapping property such as CLD or ICC.
여기서, 파라미터 쌍은 (X, Y)로 표현된다. X와 Y는 각각 하나의 파라미터와 대응된다. 예를 들어, 파라미터 타입이 CLD인 경우, X와 Y는 각각 하나의 CLD 값과 대응된다. Here, the parameter pair is represented by (X, Y). X and Y correspond to one parameter, respectively. For example, when the parameter type is CLD, X and Y correspond to one CLD value, respectively.
파라미터 부호화부(130)는 아래의 3 단계에 따라 2D 허프만 코딩을 수행한다. The
우선, 파라미터 부호화부(130)는 X의 절대값(absolute value)이 Y의 절대값보다 큰 값을 갖도록, 즉, '│X│〉│Y│'의 관계가 성립하도록 X 또는 Y의 값을 변경한다. '│X│〉│Y│' 관계가 만족하는 경우, X/Y의 심볼 쌍(pair)이 X축에 더 큰 값을 가지게 되므로 데이터가 스큐(skew)되는 정도가 높아지고, 이에 따라 비트률이 감소될 수 있다. 이에 따라, 제2 영역에 존재하는 파라미터들은 제1 영역으로, 제3 영역에 존재하는 파라미터들은 제4 영역으로, 제6 영역에 존재하는 파라미터들은 제5 영역으로, 제7 영역에 존재하는 파라미터들은 제8 영역으로 각각 이동한다. 이 경우, 영역을 이동하는 파라미터 쌍들에 대해 각각 1 비트의 추가 정보가 부여된다. First, the
다음 단계에서, 파라미터 부호화부(130)는 X와 Y의 합이 '0'보다 작은 값을 갖도록, 즉, '(X+Y)〈 0'의 관계를 갖도록 X 또는 Y 값을 변경한다. '(X+Y)〈 0 '인 경우, X 및 Y의 부호(sign)를 바꿈으로써, 생성되는 심볼의 값이 양의 값을 갖는다. In the next step, the
이에 따라, 제4 영역에 존재하는 파라미터들은 제1 영역으로, 제5 영역에 존재하는 파라미터들은 제8 영역으로 각각 이동한다. 이 경우에도 역시, 영역을 이동하는 파라미터 쌍들에 대해 각각 1 비트의 추가 정보가 부여된다. 제2 단계에서 영역이 이동된 (X, Y)의 쌍을 (X', Y')이라고 한다. Accordingly, parameters existing in the fourth region move to the first region and parameters existing in the fifth region move to the eighth region, respectively. In this case as well, 1-bit additional information is given to each of the parameter pairs moving in the region. The pair of (X, Y) in which the region is shifted in the second step is referred to as (X ', Y').
그 다음 단계에서, 파라미터 부호화부(130)는 복수의 파라미터 중에서 최대 절대값(LAV: Largest Absolute Value)을 갖는 파라미터를 이용한 LAV 코딩을 통해 최종적으로 부호화된 파라미터 쌍을 도출한다. LAV는 2D 허프만 코딩을 위한 부가정보로서, 이 또한 허프만 코딩을 통해서 전송된다. LAV는 현재 부호화될 프레임에 해당하는 심볼 중에 가장 큰 절대값을 가지는 값을 의미하며, 이를 통해 2D 허프만 코딩의 코드북을 결정할 수 있다.In the next step, the
LAV는 2D 허프만 코딩을 위한 부가정보로서, LAV 역시 허프만 코딩을 통해서 부호화되어 전송된다. LAV는 현재 부호화될 프레임에 해당하는 심볼 중에 가장 큰 절대값을 가지는 심볼 값을 의미한다. 파라미터 부호화부(130)는 LAV를 통해 2D 허프만 코딩의 코드북을 결정한다.LAV is additional information for 2D Huffman coding, and LAV is encoded and transmitted through Huffman coding. LAV denotes a symbol value having the largest absolute value among the symbols corresponding to the current frame to be encoded. The
LAV를 이용한 LAV 코딩은 2D 허프만 코딩에 이용되는 테이블(table)의 크기(size)를 줄이기 위한 코딩 방법으로서, 각각의 파라미터를 '1', '3', '5', '7'로 구성되는 4개의 심볼로 표현한다.LAV coding using LAV is a coding method for reducing the size of a table used for 2D Huffman coding and is a coding method in which each parameter is composed of '1', '3', '5', and '7' It is represented by four symbols.
CLD 또는 ICC의 경우, 이전 프레임의 CLD 값 또는 ICC 값과 현재 프레임의 CLD 값 또는 ICC 값의 차이가 클수록 발생 빈도가 적어지므로, LAV가 '7'인 경우가 가장 적게 발생한다. CLD 및 ICC는 동일한 허프만 코드북(Huffman codebook)을 적용할 수 있다. 허프만 코드북에 관한 구문(syntax)은 표 4와 같다. In case of CLD or ICC, the frequency of occurrence of LAV is '7' is the least since the frequency of occurrence of CLD or ICC of the previous frame is larger than the difference of CLD value or ICC value of the current frame. CLD and ICC can apply the same Huffman codebook. The syntax for the Huffman codebook is shown in Table 4.
여기서, {0x0, 0x2, 0x6, 0x7}는 코드북을, {1, 2, 3, 3}는 코드북의 길이를, {1, 3, 5, 7}는 LAV를 각각 의미한다. Here, {0x0, 0x2, 0x6, 0x7} denotes a codebook, {1, 2, 3, 3} denotes a length of a codebook, and {1, 3, 5, 7} denotes a LAV.
LAV 코딩에 따라 최종적으로 부호화된 파라미터 쌍 (X", Y")은 표 5에 표시된 알고리즘에 따라 도출될 수 있다. The parameter pair (X ", Y") finally encoded according to LAV coding can be derived according to the algorithm shown in Table 5. [
여기서, 'LAV'는 최대 절대값을, '% 2'는 모듈러-2 연산을 각각 의미한다. Here, 'LAV' denotes the maximum absolute value, and '% 2' denotes the modulo-2 operation.
도 3은 IPD 또는 OPD와 같은 wrapping property를 갖는 위상 파라미터로 구성된 파라미터 쌍들에 대해 2D 허프만 코딩을 적용하여 파라미터를 부호화하는 개념을 설명하기 위한 도면이다. 3 is a diagram for explaining a concept of coding parameters by applying 2D Huffman coding to parameter pairs constituted by phase parameters having wrapping properties such as IPD or OPD.
이 경우, 2D 허프만 코딩은 앞서 도 2에서 설명한 2D 허프만 코딩과는 달리 아래의 2 단계를 거쳐 수행될 수 있다. In this case, 2D Huffman coding can be performed through the following two steps, unlike the 2D Huffman coding described above with reference to FIG.
우선, 파라미터 부호화부(130)는 X의 절대값(absolute value)이 Y의 절대값보다 큰 값을 갖도록, 즉, '│X│〉│Y│'의 관계가 성립하도록 X 또는 Y의 값을 변경한다. First, the
상기 언급한 바와 같이, 양자화된 위상 파라미터의 차분에 대해 모듈러(Modulo) 연산을 적용하면 위상 파라미터의 차분이 항상 양의 값을 갖게 되므로, 위상 파라미터는 제1 영역과 제2 영역에만 존재한다. 따라서, 제1 단계에서는 제2 영역에 존재하는 위상 파라미터가 제1 영역으로 이동한다. 이 경우, 영역을 이동하는 파라미터 쌍들에 대해 각각 1 비트의 추가 정보가 부여된다.As described above, when the modulo operation is applied to the difference of the quantized phase parameters, the phase parameter always exists in a positive value, so that the phase parameter exists only in the first and second areas. Therefore, in the first step, the phase parameter existing in the second region moves to the first region. In this case, 1-bit additional information is assigned to each of the parameter pairs moving in the region.
상기 단계에서 영역이 이동된 (X, Y)의 쌍을 (X', Y')이라고 하면, X'과 Y'은 하기 수학식 2에 따라 도출될 수 있다. If the pair of (X, Y) in which the region is shifted in the above step is (X ', Y'), X 'and Y' can be derived according to the following equation (2).
다음 단계에서, 파라미터 부호화부(130)는 복수의 파라미터 중에서 최대 절대값(LAV: Largest Absolute Value)을 갖는 파라미터를 이용한 LAV 코딩을 통해 최종적으로 부호화된 파라미터 쌍을 도출한다. In the next step, the
LAV 코딩에 따라 최종적으로 부호화된 파라미터 쌍 (X", Y")은 앞서 설명한 표 5에 표시된 알고리즘에 따라 도출될 수 있다. The parameter pair (X ", Y") finally encoded according to LAV coding can be derived according to the algorithm shown in Table 5 described above.
파라미터 부호화부(130)가 위상 파라미터를 부호화하는 경우, CLD 또는 ICC와 같은 파라미터를 부호화하는 경우와 달리 1회의 영역 이동이 발생한다. 따라서, 파라미터 부호화부(130)가 위상 파라미터를 부호화하는 경우, 전송되는 비트의 수가 CLD 또는 ICC와 같은 파라미터를 부호화하는 경우 보다 더 적다. When the
IPD는 CLD 또는 ICC와 LAV의 분포가 상이하다. IPD는 차분이 '7'인 경우, 발생 빈도가 가장 높다. 일례로, IPD는 표 6과 같은 LAV 분포를 가질 수 있다. IPD has a different distribution of CLD or ICC and LAV. IPD has the highest frequency when the difference is '7'. For example, the IPD may have a LAV distribution as shown in Table 6. [
허프만 코딩의 특성인, 확률 분포에 따른 코드북 길이 할당은 실제 심볼과 코드북의 길이가 반영이 되어야 한다. 만일 심볼의 실제 분포와 허프만 코드북의 길이가 매칭되지 않을 경우 최적의 성능을 나타낼 수 없다. 따라서, 파라미터 부호화부(130)는 심볼을 리매핑(remapping)하고, 리매핑된 심볼을 부호화함으로써 심볼 분포의 미스매치(distribution mismatching) 문제를 해결할 수 있다. 이 경우, 파라미터 부호화부(130)는 수학식 3에 따라 심볼을 리매핑할 수 있다. The codebook length allocation according to the probability distribution, which is a characteristic of Huffman coding, must reflect the length of the actual symbols and the codebook. If the actual distribution of the symbol and the length of the Huffman codebook are not matched, then optimal performance can not be achieved. Therefore, the
여기서,'sym'은 심볼을, '%4'는 모듈러-4 연산을 각각 의미한다. Here, 'sym' denotes a symbol and '% 4' denotes a modulo-4 operation.
심볼 리매핑 후의 심볼과 허프만 코드북과의 관계는 표 7과 같이 나타낼 수 있다. The relationship between the symbol after symbol remapping and the Huffman codebook can be expressed as shown in Table 7.
표 8 내지 표 10은 본 발명의 일실시예에 따라서, 위상 파라미터를 부호화하는 1D 허프만 코딩과 2D 허프만 코딩에 대한 구문(syntax)을 보여준다. Tables 8 through 10 illustrate the syntax for 1D Huffman coding and 2D Huffman coding for coding phase parameters, according to one embodiment of the present invention.
또는, 다음과 같이 LavIdx를 매핑(mapping)하는 테이블을 정의하는 방법이 있다. LavIdx는 실제 허프만 디코딩을 통해 출력된 심볼을 의미하며, lavTabIPD는 상기 심볼의 실제 LAV를 의미한다. 이 경우, 상기 심볼의 리매핑(remapping)은 표 11의 테이블에 기초하여 수행될 수 있다. Alternatively, there is a method of defining a table that maps LavIdx as follows. LavIdx denotes a symbol output through actual Huffman decoding, and lavTabIPD denotes an actual LAV of the symbol. In this case, the remapping of the symbols can be performed based on the table in Table 11. [
다시 도 1을 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)에 대해 설명한다. Referring again to FIG. 1, an
다운 믹싱부(140)는 스테레오 신호를 다운 믹싱하여 모노 신호를 출력한다. The
다운 믹싱(Down-Mixing)은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운 믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트 수를 줄일 수 있다. 이 때, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 멀티 채널 신호의 부호화 장치(100)에서는 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다. Down-mixing is to generate a mono signal of one channel from a stereo signal of two or more channels, and it is possible to reduce the number of bits of the bit stream generated in the encoding process through downmixing. At this time, the mono signal may be a signal representative of the stereo signal. In other words, in the multi-channel
예를 들어, 모노 신호의 크기는 좌채널 신호 및 우채널 신호의 크기의 평균 값으로 구할 수 있고, 모노 신호의 위상은 좌채널 신호 및 우채널 신호의 위상의 평균 값으로 구할 수 있다.For example, the magnitude of the mono signal can be obtained as an average value of the magnitudes of the left channel signal and the right channel signal, and the phase of the mono signal can be obtained as an average value of the phases of the left channel signal and the right channel signal.
모노 신호 부호화부(150)는 다운 믹싱부(140)에서 출력된 모노 신호를 부호화한다. The mono
일례로서, 스테레오 신호가 음성(voice) 신호인 경우, 모노 신호 부호화부(120)는 모노 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화할 수 있다.As an example, when the stereo signal is a voice signal, the mono
또한, 다른 일례로서, 스테레오 신호가 음악(music) 신호인 경우, 모노 신호 부호화부(120)는 기존의 MPEG-2/4 AAC나 mp3와 유사한 방법을 사용하여 모노 신호를 부호화할 수 있다. As another example, when the stereo signal is a music signal, the mono
비트스트림 생성부(160)는 부호화된 복수의 파라미터 및 부호화된 모노 신호를 이용하여 스테레오 신호에 대한 부호화된 비트스트림을 생성한다. The
이상에서는 양자화 및 무손실 부호화를 통해 멀티 채널 신호의 위상 정보를 부호화하고, 부호화된 위상 정보를 포함하는 비트스트림을 생성하는 멀티 채널 신호의 부호화 장치(100)에 대해 설명하였다. 이하에서는 도 4를 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치에 대해 상세히 설명하기로 한다. In the above description, the multi-channel
도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다. 4 is a block diagram illustrating a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(400)는 모노 신호 복호화부(410), 파라미터 복호화부(420), 파라미터 역양자화부(430), 파라미터 추정부(440), 및 업 믹싱부(450)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.The
이하에서도, 설명의 편의상, 멀티 채널 신호의 복호화 장치(300)에 입력되는 비트스트림은 스테레오 신호의 부호화된 비트스트림인 것으로 가정한다. Hereinafter, for the sake of convenience, it is assumed that the bit stream input to the multi-channel signal decoding apparatus 300 is a coded bit stream of a stereo signal.
모노 신호 복호화부(410)는 스테레오 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원한다. 구체적으로, 모노 신호 복호화부(410)는 모노 신호가 시간 도메인에서 부호화된 경우에는 부호화된 모노 신호를 시간 도메인에서 복호화하고, 모노 신호가 주파수 도메인에서 부호화된 경우에는 부호화된 모노 신호를 주파수 도메인에서 복호화할 수 있다.The mono
파라미터 복호화부(420)는 스테레오 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널간의 특성 관계를 나타내는 복수의 파라미터를 복원한다. 이 때, 복수의 파라미터는 CLD, ICC, 및 IPD를 포함할 수는 있으나, OPD는 포함하지 않을 수 있다. The
파라미터 추정부(430)는 복수의 파라미터에 OPD가 포함되지 않은 경우, 복원된 복수의 파라미터를 이용하여 OPD를 추정한다. The
이하에서는 OPD를 추정하는 파라미터 추정부(430)의 동작을 상세히 설명하기로 한다. 여기서, 후술된 수학식들은 본 발명의 일실시예에 불과하고, 후술된 수학식들은 변형이 가능함은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. Hereinafter, the operation of the
먼저, 파라미터 추정부(430)는 수학식 4에 따라서, CLD를 이용하여 제1 중간 변수 c를 구한다. First, the
여기서, b는 주파수 밴드의 인덱스를 나타낸다. 수학식 4와 같이, 제1 중간 변수 c는 특정 주파수 밴드에서의 IID 값을 20으로 나눈 수를 10의 지수 형태로 표현함으로써 구할 수 있다. 이 때, 제1 중간 변수 c를 이용하여 다음 수학식 5 및 6과 같이 제2 중간 변수 c1 및 제3 중간 변수 c2를 구할 수 있다.Here, b represents an index of a frequency band. As shown in Equation (4), the first intermediate variable c can be obtained by expressing the number obtained by dividing the IID value in the specific frequency band by 20 in an exponential form of 10. At this time, the second intermediate variable c 1 and the third intermediate variable c 2 can be obtained by using the first intermediate variable c as shown in the following equations (5) and (6).
즉, 제3 중간 변수 c2는 제2 중간 변수 c1의 값에 c를 곱한 값으로 구할 수 있다.That is, the third intermediate variable c 2 can be obtained by multiplying the value of the second intermediate variable c 1 by c.
다음으로, 파라미터 추정부(430)는 복원된 모노 신호와, 수학식 5 및 수학식 6에서 구한 제2 중간 변수 및 제3 중간 변수를 이용하여 제1 우채널 신호와 제1 좌채널 신호를 구한다. 제1 우채널 신호 및 제1 좌채널 신호는 하기 수학식 7 및 수학식 8과 같이 나타낼 수 있다.Next, the
여기서, n은 시간 슬롯 인덱스이며, k는 파라미터 밴드 인덱스를 나타낸다. 제1 우채널 신호 는 제2 중간 변수 c1과 복원된 모노 신호 M의 곱으로 나타낼 수 있다.Where n is the time slot index and k is the parameter band index. The first right channel signal Can be expressed as the product of the second intermediate variable c 1 and the restored mono signal M.
제1 좌채널 신호 는 제2 중간 변수 c2와 복원된 모노 신호 M의 곱으로 나타낼 수 있다.The first left channel signal Can be expressed as the product of the second intermediate variable c 2 and the restored mono signal M.
이 때, IPD를 라고 하면, 제1 모노 신호 는 제1 우채널 신호 및 제2 좌채널 신호 를 이용하여 다음 수학식 9와 같이 나타낼 수 있다. At this time, , The first mono signal Lt; RTI ID = 0.0 > And the second left channel signal The following equation (9) can be used.
또한, 수학식 6 내지 9를 이용하여, 시간 슬롯과 파라미터 밴드에 따른 제4 중간 변수 p는 다음 수학식 10과 같이 구할 수 있다.Further, using Equations (6) to (9), the fourth intermediate variable p according to the time slot and the parameter band can be obtained as shown in Equation (10).
여기서, 제4 중간 변수 p는 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호의 크기의 합을 2로 나눈 값으로 한다. 이 때, OPD의 값을 라 할 때, OPD는 다음 수학식 11과 같이 구할 수 있다.Here, the fourth intermediate variable p is a value obtained by dividing the sum of the sizes of the first left channel signal, the first right channel signal, and the first mono signal by two. At this time, the value of OPD , The OPD can be obtained by the following equation (11).
또한, OPD와 IPD의 차에 해당하는 값을 라 할 때, 은 다음 수학식 12와 같이 구할 수 있다.Also, the value corresponding to the difference between OPD and IPD In other words, Can be obtained by the following equation (12).
수학식 11에서 구한 OPD의 값인 은 복호화된 모노 신호와 업믹싱될 좌채널 신호 사이의 위상 차이고, 수학식 12에서 구한 값인 는 복호화된 모노 신호와 업믹싱될 우채널 신호 사이의 위상 차를 나타낸다. The value of OPD obtained from the equation (11) Is the phase difference between the decoded mono signal and the left channel signal to be upmixed, Represents the phase difference between the decoded mono signal and the right channel signal to be upmixed.
수학식 11 및 수학식 12는 수학식 13과 같이 등가적으로 구현될 수 있다. Equation (11) and Equation (12) can be equivalently implemented as Equation (13).
withwith
여기에서 l, m은 각 서브밴드 인덱스와 파라미터 셋을 의미한다.Here, l and m denote each subband index and parameter set.
이와 같이, 파라미터 추정부(430)는 스테레오 신호의 채널 간 크기 차를 나타내는 IID를 이용하여 복원된 모노 신호로부터 좌채널 신호 및 우채널 신호에 대한 제1 좌채널 신호 및 제1 우채널 신호를 생성하고, 스테레오 신호의 채널 간 위상 차를 나타내는 IPD를 이용하여 제1 좌채널 신호 및 제1 우채널 신호로부터 제1 모노 신호를 생성하며, 생성된 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호를 이용하여 복원된 모노 신호와 스테레오 신호의 위상 차를 나타내는 OPD의 값을 추정할 수 있다.In this manner, the
파라미터 역양자화부(440)는 복호화된 파라미터 및 복호화된 파라미터들로부터 추정된 파라미터를 역양자화한다. The
이하에서는 도 5 내지 도 8을 참고하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 상세히 설명하기로 한다. Hereinafter, the operation of the
도 5는 USAC(Unified Speech and Audio Coding)에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 설명하기 위한 흐름도이다. 5 is a flowchart illustrating an operation of a
먼저, 단계(501)에서는 파라미터의 타입(type)이 위상 파라미터인지를 판단한다. First, in step 501, it is determined whether the type of the parameter is a phase parameter.
만약, 단계(501)에서 파라미터 타입이 위상 파라미터가 아닌 것으로 판단한 경우, 단계(502)에서는 MPS(MPEG Surround) 무손실 코딩 방법에 기초하여 위상 파라미터 이외의 파라미터인 제2 파라미터를 역양자화한다. If it is determined at step 501 that the parameter type is not a phase parameter, at step 502, the second parameter, which is a parameter other than the phase parameter, is inverse-quantized based on an MPS (MPEG Surround) lossless coding method.
만약, 단계(501)에서 파라미터 타입이 위상 파라미터인 것으로 판단한 경우, 단계(503)에서는 위상 파라미터의 부호화 모드를 판단한다. 보다 상세하게는, 단계(503)에서는 위상 파라미터의 부호화 모드가 1D 허프만 코딩인지, 2D 허프만 코딩인지를 판단한다. If it is determined in step 501 that the parameter type is a phase parameter, in step 503, the encoding mode of the phase parameter is determined. More specifically, in step 503, it is determined whether the coding mode of the phase parameter is 1D Huffman coding or 2D Huffman coding.
단계(503)에서 위상 파라미터의 부호화 모드가 1D 허프만 코딩이라고 판단한 경우, 단계(504)에서는 dT 또는 dF를 결정한다. dT는 이전 프레임에서 같은 밴드의 양자화된 위상정보를 기준으로 차이를 계산하는 것을 의미하고, dF는 현재 프레임의 이전 밴드의 양자화된 위상정보를 기준으로 차이를 계산하는 것을 의미한다 If it is determined in step 503 that the coding mode of the phase parameter is 1D Huffman coding, then in step 504, dT or dF is determined. dT means calculating the difference based on the quantized phase information of the same band in the previous frame and dF means calculating the difference based on the quantized phase information of the previous band of the current frame
이 후, 단계(505)에서는 단계(504)에서 결정된 dT 또는 dF에 따라서 허프만 코드북을 결정하고, 결정된 호프만 코드북에 따라 위상 파라미터에 대해 1D 허프만 디코딩을 수행한다. Thereafter, in step 505, a Huffman codebook is determined according to the dT or dF determined in step 504, and a 1D Huffman decoding is performed on the phase parameter according to the determined Hoffman codebook.
단계(506)에서는 이전 위상 파라미터와 현재 위상 파라미터를 dT 또는 dF에 따라 모듈러 연산하여 양자화된 위상 파라미터를 복원한다. Step 506 modulates the previous phase parameter and the current phase parameter according to dT or dF to recover the quantized phase parameter.
만약, 단계(503)에서, 위상 파라미터의 부호화 모드가 2D 허프만 코딩이라고 판단한 경우, 단계(507)에서는 LAV 디코딩을 수행한다. If it is determined in step 503 that the coding mode of the phase parameter is 2D Huffman coding, step 507 performs LAV decoding.
이 후, 단계(508)에서는 LAV에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 위상 파라미터에 대해 2D 허프만 디코딩을 수행한다. Thereafter, in step 508, a Huffman codebook is determined according to the LAV and a 2D Huffman decoding is performed on the phase parameters according to the determined Huffman codebook.
단계(509)에서는 2D 허프만 디코딩에 의해 복호화된 X 및 Y의 크기의 대소관계에 대한 정보를 복원하고, 복원된 대소 관계에 대한 정보에 기초하여 X 및 Y의 순서를 조절한다. In step 509, information on the magnitude of X and Y decoded by 2D Huffman decoding is restored, and the order of X and Y is adjusted on the basis of information on the restored magnitude relation.
단계(510)에서는 순서가 조절된 X 및 Y를 모듈러 연산하여 양자화된 위상 파라미터를 복원한다. In step 510, the quantized phase parameters are recovered by modulatively computing the regulated X and Y.
단계(511)에서는 단계(506) 또는 단계(508)에서 복원된 양자화된 위상 파라미터를 역양자화하여 위상 파라미터를 복원한다. In step 511, the quantized phase parameters reconstructed in step 506 or 508 are inversely quantized to reconstruct the phase parameters.
도 6 및 도 7은 MPS(MPEG Surround) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 설명하기 위한 흐름도이다. FIGS. 6 and 7 are flowcharts for explaining the operation of the
먼저, 단계(601)에서는 파라미터의 타입(type)이 위상 파라미터인지를 판단한다. First, in
만약, 단계(601)에서 파라미터 타입이 위상 파라미터인 것으로 판단한 경우, 단계(603)에서는 위상 파라미터의 부호화 모드를 판단한다. 즉, 단계(603)에서는 위상 파라미터의 부호화 모드가 1D 허프만 코딩인지, 2D 허프만 코딩인지를 판단한다. If it is determined in
단계(603)에서 위상 파라미터의 부호화 모드가 1D 허프만 코딩이라고 판단한 경우, 단계(604)에서는 dT1 또는 dF1를 결정한다. If it is determined in
이 후, 단계(605)에서는 단계(604)에서 결정된 dT1 또는 dF1에 따라서 허프만 코드북을 결정하고, 결정된 호프만 코드북에 따라 위상 파라미터에 대해 1D 허프만 디코딩을 수행한다. Thereafter, in
단계(606)에서는 dT1 또는 dF1에 기초하여 역 차분 복호화 및 모듈러 연산을 통해 이전 위상 파라미터와 현재 위상 파라미터로부터 양자화된 위상 파라미터를 복원한다. Step 606 reconstructs the quantized phase parameters from the previous phase parameters and the current phase parameters through inverse differential decoding and modular operations based on dT 1 or dF 1 .
만약, 단계(603)에서, 위상 파라미터의 부호화 모드가 2D 허프만 코딩이라고 판단한 경우, 단계(607)에서는 LAV 디코딩을 수행한다. If it is determined in
이 후, 단계(608)에서는 LAV에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 위상 파라미터에 대해 2D 허프만 디코딩을 수행한다. Thereafter, in
단계(609)에서는 2D 허프만 디코딩에 의해 복호화된 X 및 Y의 크기의 대소관계에 대한 정보를 복원하고, 복원된 대소 관계에 대한 정보에 기초하여 X 및 Y의 순서를 조절한다. In
단계(610)에서는 역 차분 복호화 및 모듈러 연산을 통해 순서가 조절된 X 및 Y로부터 양자화된 위상 파라미터를 복원한다. In
단계(611)에서는 단계(606) 또는 단계(610)에서 복원된 양자화된 위상 파라미터를 역양자화하여 위상 파라미터를 복원한다. In
처음으로 돌아가서, 만약 단계(601)에서 파라미터 타입이 위상 파라미터가 아닌 것으로 판단한 경우, 단계(602)에서는 위상 파라미터 이외의 파라미터인 제2 파라미터를 역양자화한다. Returning to the beginning, if it is determined at
도 7을 참고하여 단계(602)에 대해 상세히 설명하면 아래와 같다. Referring to FIG. 7, step 602 will be described in detail as follows.
단계(60201)에서는 제2 파라미터의 부호화 모드를 판단한다. 보다 상세하게는, 단계(6021)에서는 제2 파라미터의 부호화 모드가 1D 허프만 코딩인지, 2D 허프만 코딩인지를 판단한다. In
단계(60201)에서 제2 파라미터의 부호화 모드가 1D 허프만 코딩이라고 판단한 경우, 단계(60202)에서는 dT2 또는 dF2를 결정한다. If it is determined in
이 후, 단계(60203)에서는 dT2 또는 dF2에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 제2 파라미터에 대하 1D 허프만 디코딩을 수행한다. Thereafter, in
단계(60204)에서는 현재 제2 파라미터와 이전 제2 파라미터 간의 차의 부호(sign)를 복호화한다. In
단계(60205)에서는 dT2 또는 dF2에 기초하여 역차분 복호화를 통해 이전 제2 파라미터 및 현재 제2 파라미터로부터 양자화된 제2 파라미터를 복원한다.
만약, 단계(60201)에서 제2 파라미터의 부호화 모드가 2D 허프만 코딩이라고 판단한 경우, 단계(60206)에서는 LAV 디코딩을 수행한다. If it is determined in
이 후, 단계(60207)에서는 LAV에 따라 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 위상 파라미터에 대해 2D 허프만 디코딩을 수행한다. Thereafter, in
단계(60208)에서는 2D 허프만 디코딩에 의해 복호화된 X 및 Y의 크기의 대소 관계에 대한 정보를 복원하고, 복원된 대소 관계에 대한 정보에 기초하여 X 및 Y의 순서를 조절한다. In
단계(60209)에서는 순서가 조절된 X 및 Y의 부호(sign)을 복호화한다. In
단계(60210)에서는 역 차분 복호화를 통해 순서가 조절된 X 및 Y로부터 양자화된 제2 파라미터를 복원한다. In
이 후, 단계(60211)에서는 단계(60205) 또는 단계(60210)에서 복원된 양자화된 제2 파라미터를 역양자화하여 제2 파라미터를 복원한다. Thereafter, in
단계(611)에서는 단계(606) 또는 단계(608)에서 복원된 양자화된 위상 파라미터를 역양자화하여 위상 파라미터를 복원한다.In
도 8은 PS(Parametric Stereo) 무손실 부호화 방식에 기반하여 파라미터를 역양자화하는 파라미터 역양자화부(440)의 동작을 설명하기 위한 흐름도이다. 8 is a flowchart for explaining the operation of the
먼저, 단계(801)에서는 파라미터의 타입이 IPD인지를 판단한다. First, in
만약, 단계(801)에서 파라미터의 타입이 IPD인 것으로 판단한 경우, 단계(802)에서는 dT1 또는 dF1를 결정한다. If it is determined in
이후, 단계(803)에서는 결정된 dT1 또는 dF1에 따라서 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 IPD에 대해 허프만 디코딩을 수행한다. Thereafter, in
단계(804)에서는 dT1 또는 dF1에 기초하여 역 차분 복호화 및 모듈러 연산을 통해 이전 IPD 및 현재 IPD로부터 양자화된 IPD를 복원한다. Step 804 reconstructs the IPD quantized from the current IPD and the previous IPD through inverse differential decoding and modular operations based on dT 1 or dF 1 .
단계(805)에서는 양자화된 IPD를 역양자화하여 IPD를 복원한다. In
처음으로 돌아가서, 단계(801)에서 파라미터의 타입이 IPD가 아닌 것으로 판단한 경우, 단계(806)에서는 dT2 또는 dF2를 결정한다. Returning to the beginning, if it is determined at
이 후, 단계(807)에서는 dT2 또는 dF2에 따라서 허프만 코드북을 결정하고, 결정된 허프만 코드북에 따라 IPD 이외의 파라미터인 제2 파라미터에 대해 허프만 디코딩을 수행한다. Thereafter, in
단계(808)에서는 현재 제2 파라미터와 이전 제2 파라미터 간의 차의 부호(sign)를 복호화한다. In
단계(809)에서는 dT2 또는 dF2에 기초하여 역 차분 복호화를 통해 이전 제2 파라미터 및 현재 제2 파라미터로부터 양자화된 제2 파라미터를 복원한다. Step 809 reconstructs the second parameter quantized from the previous second parameter and the current second parameter through inverse differential decoding based on dT 2 or dF 2 .
단계(810)에서는 양자화된 제2 파라미터를 역양자화하여 제2 파라미터를 복원한다. In
다시, 도 4를 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(400)에 대해 상세히 설명하기로 한다. Referring again to FIG. 4, an
업 믹싱부(450)는 복원된 파라미터 및 추정된 파라미터(OPD)를 이용하여 모노 신호를 업 믹싱한다.The
업 믹싱은 한 채널의 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것으로 다운 믹싱과 대응된다. 이하에서는 CLD, ICC, IPD 및 OPD를 이용하여 모노 신호를 업 믹싱하는 업 믹싱부(450)의 구체적인 동작에 대해 설명하기로 한다. Upmixing corresponds to downmixing by generating more than two channels of stereo signals from a mono signal of one channel. Hereinafter, the specific operation of the
먼저, 업 믹싱부(450)는 ICC의 값이 일 때, 제2 및 제3 중간 변수 c1 및 c2를 이용하여 제1 위상 및 제2 위상 을 다음 수학식 14 및 15과 같이 구할 수 있다.First, the
다음으로, 업 믹싱부(450)는 복원된 모노 신호가 M이고, 디코릴레이션된 신호가 D일 때, 수학식 14 및 수학식 15를 통해 구한 제1 및 제2 위상, 제2 및 제3 중간 변수 c1 및 c2 및 수학식 11에서 구한 OPD의 값인 , 수학식 12에서 구한 값인 을 이용하여 아래의 수학식 16 및 수학식 17과 같이 업 믹싱된 좌채널 신호 및 우채널 신호를 구할 수 있다.Next, the
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described with reference to particular embodiments, such as specific elements, and specific embodiments and drawings. However, it should be understood that the present invention is not limited to the above- And various modifications and changes may be made thereto by those skilled in the art to which the present invention pertains. Accordingly, the spirit of the present invention should not be construed as being limited to the embodiments described, and all of the equivalents or equivalents of the claims, as well as the following claims, belong to the scope of the present invention .
410 ... 모노신호 복호화부 420 ... 파라미터 복호화부
430 ... 파라미터 추정부 440 ... 파라미터 역양자화부
450 ... 업믹싱부410 ... Mono
430 ...
450 ... Up Mixer
Claims (8)
상기 프로세서는
비트스트림으로부터 모노 다운믹스 신호를 복호화하고,
상기 비트스트림으로부터 채널들 간의 특성 관계를 나타내는 복수의 파라미터를 복호화하고,
상기 복호화된 복수의 파라미터에 근거하여 상기 모노 다운믹스 신호를 스테레오 신호로 업믹싱하고,
상기 복호화된 복수의 파라미터는 위상 파라미터를 포함하고,
상기 프로세서는 상기 비트스트림으로부터 상기 위상 파라미터의 LAV(Largest Absolute Value)에 대한 인덱스를 획득하고, 상기 인덱스로부터 상기 위상 파라미터의 LAV를 획득하고, 상기 LAV에 근거하여 허프만 코드북을 결정하고, 상기 결정된 허프만 코드북에 근거하여 상기 위상 파라미터의 심볼들을 복호화하고, 상기 복호화된 심볼로부터 양자화된 위상 파라미터를 획득함으로써 상기 복수의 파라미터 중 상기 위상 파라미터를 복호화하는 복호화장치.At least one processor,
The processor
Decodes the mono downmix signal from the bit stream,
Decodes a plurality of parameters indicating a characteristic relationship between channels from the bitstream,
Mixes the mono down-mix signal into a stereo signal based on the decoded parameters,
Wherein the plurality of decoded parameters include phase parameters,
Wherein the processor is configured to: obtain an index for a LAV (Largest Absolute Value) of the phase parameter from the bitstream, obtain a LAV of the phase parameter from the index, determine a Huffman codebook based on the LAV, Decodes symbols of the phase parameter based on a codebook, and obtains a quantized phase parameter from the decoded symbol to decode the phase parameter among the plurality of parameters.
상기 프로세서는
비트스트림으로부터 IPD(Inter-channel Phase Difference) 파라미터의 LAV(Largest Absolute Value)에 대한 인덱스를 획득하고,
상기 인덱스로부터 상기 IPD 파라미터의 LAV를 획득하고,
상기 LAV에 근거하여 허프만 코드북을 결정하고,
상기 결정된 허프만 코드북에 근거하여 상기 IPD 파라미터의 심볼들을 복호화하고,
상기 복호화된 심볼로부터 양자화된 IPD 파라미터를 획득하는 위상 파라미터 복호화장치.At least one processor,
The processor
Obtains an index for a LAV (Largest Absolute Value) of an Inter-channel Phase Difference (IPD) parameter from a bitstream,
Obtaining an LAV of the IPD parameter from the index,
Determines a Huffman codebook based on the LAV,
Decodes the symbols of the IPD parameter based on the determined Huffman codebook,
And obtains a quantized IPD parameter from the decoded symbol.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170057373A KR101783967B1 (en) | 2017-05-08 | 2017-05-08 | Apparatus for encoding/decoding multichannel signal and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170057373A KR101783967B1 (en) | 2017-05-08 | 2017-05-08 | Apparatus for encoding/decoding multichannel signal and method thereof |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160079289A Division KR101735619B1 (en) | 2016-06-24 | 2016-06-24 | Apparatus for encoding/decoding multichannel signal and method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170054363A KR20170054363A (en) | 2017-05-17 |
KR101783967B1 true KR101783967B1 (en) | 2017-11-06 |
Family
ID=59048535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170057373A KR101783967B1 (en) | 2017-05-08 | 2017-05-08 | Apparatus for encoding/decoding multichannel signal and method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101783967B1 (en) |
-
2017
- 2017-05-08 KR KR1020170057373A patent/KR101783967B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20170054363A (en) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101253699B1 (en) | Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Wiener Filtering | |
RU2368074C2 (en) | Adaptive grouping of parametres for improved efficiency of coding | |
KR101823278B1 (en) | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals | |
US9685168B2 (en) | Apparatus for encoding/decoding multichannel signal and method thereof | |
JP6133422B2 (en) | Generalized spatial audio object coding parametric concept decoder and method for downmix / upmix multichannel applications | |
RU2367087C2 (en) | Coding information without loss with guaranteed maximum bit speed | |
KR20090043921A (en) | Method and apparatus of encoding/decoding multi-channel signal | |
KR102033985B1 (en) | Apparatus and methods for adapting audio information in spatial audio object coding | |
JP4892184B2 (en) | Acoustic signal encoding apparatus and acoustic signal decoding apparatus | |
KR101783967B1 (en) | Apparatus for encoding/decoding multichannel signal and method thereof | |
KR101735619B1 (en) | Apparatus for encoding/decoding multichannel signal and method thereof | |
KR101635099B1 (en) | Apparatus for encoding/decoding multichannel signal and method thereof | |
KR101500972B1 (en) | Method and Apparatus of Encoding/Decoding Multi-Channel Signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |