KR101747307B1 - Apparatus for encoding/decoding multichannel signal and method thereof - Google Patents
Apparatus for encoding/decoding multichannel signal and method thereof Download PDFInfo
- Publication number
- KR101747307B1 KR101747307B1 KR1020160103757A KR20160103757A KR101747307B1 KR 101747307 B1 KR101747307 B1 KR 101747307B1 KR 1020160103757 A KR1020160103757 A KR 1020160103757A KR 20160103757 A KR20160103757 A KR 20160103757A KR 101747307 B1 KR101747307 B1 KR 101747307B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- channel signal
- opd
- phase
- parameters
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000008859 change Effects 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 6
- 238000013139 quantization Methods 0.000 description 61
- 239000003607 modifier Substances 0.000 description 16
- 230000006866 deterioration Effects 0.000 description 15
- 239000000284 extract Substances 0.000 description 15
- 238000000605 extraction Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
멀티 채널 신호의 부호화/복호화 장치가 개시된다. 멀티 채널 신호의 부호화 장치는 멀티 채널 신호의 특성을 고려하여 멀티 채널 신호를 구성하는 복수의 채널 간의 위상 정보에 대한 위상 파라미터를 처리한다. 처리된 위상 파라미터 및 멀티 채널 신호로부터 추출된 모노 신호를 이용하여 멀티 채널 신호에 대한 부호화된 비트스트림을 생성한다. An apparatus for encoding / decoding a multi-channel signal is disclosed. A multi-channel signal encoding apparatus processes a phase parameter for phase information between a plurality of channels constituting a multi-channel signal in consideration of characteristics of a multi-channel signal. And generates an encoded bit stream for the multi-channel signal using the processed phase parameter and the mono signal extracted from the multi-channel signal.
Description
본 발명의 실시예들은 멀티 채널 신호의 부호화/복호화 장치 및 방법에 관한 것으로서, 더욱 상세하게는 위상 정보를 이용한 멀티 채널 신호의 부호화/복호화 장치 및 방법과 관련한 것이다. Embodiments of the present invention relate to an apparatus and method for encoding / decoding a multi-channel signal, and more particularly to an apparatus and method for encoding / decoding a multi-channel signal using phase information.
스테레오 신호를 부호화하는데 이용되는 방법으로 파라메트릭 스테레오(PS, Parametric Stereo) 기술이 있다. 파라메트릭 스테레오 기술은 입력되는 스테레오 신호를 다운믹싱하여 모노 신호를 생성하고, 스테레오 신호에 대한 부가 정보(side information)를 나타내는 스테레오 파라미터를 추출하고, 생성된 모노 신호와 추출된 스테레오 파라미터를 부호화하여 스테레오 신호를 부호화한다. A method used to encode a stereo signal is parametric stereo (PS) technology. The parametric stereo technique generates a mono signal by downmixing an input stereo signal, extracts a stereo parameter indicating side information on the stereo signal, codes the generated mono signal and the extracted stereo parameter, And encodes the signal.
이 경우 이용되는 스테레오 파라미터에는, 스테레오 신호에 포함된 적어도 두 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), 스테레오 신호에 포함된 적어도 두 채널 신호의 파형의 유사성에 따른 두 채널 신호 사이의 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차가 모노 신호를 기준으로 두 채널 사이에 어떻게 분포하는지를 나타내는 OPD(Overall Phase Difference) 등이 있다.In this case, the stereo parameters used include Inter-channel Intensity Difference (IID) or Channel Level Differences (CLD) indicating intensity differences according to energy levels of at least two channel signals included in the stereo signal, at least two channels (Inter-channel Coherence or Inter-channel Correlation) indicating the correlation between two channel signals according to the similarity of the waveform of the signal, an inter-channel coherence or inter-channel correlation And OPD (Overall Phase Difference) indicating how the phase difference between at least two channel signals included in the stereo signal is distributed between the two channels based on the mono signal.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 상기 복수의 파라미터 중 상기 복수 채널 간의 위상 정보에 관한 위상 파라미터를 수정하는 파라미터 수정부, 상기 수정된 위상 파라미터를 포함하는 상기 복수의 파라미터를 부호화하는 파라미터 부호화부, 상기 멀티 채널 신호를 다운믹싱한 모노 신호를 부호화하는 모노 신호 부호화부, 및 상기 부호화된 복수의 파라미터 및 상기 부호화된 모노 신호를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 비트스트림 생성부를 포함한다. An apparatus for encoding a multi-channel signal according to an embodiment of the present invention includes a parameter extraction unit that extracts a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal, A parameter coding unit for coding the plurality of parameters including the modified phase parameter, a mono signal coding unit for coding a mono signal obtained by downmixing the multi-channel signal, And a bitstream generator for generating an encoded bitstream for the multi-channel signal using the plurality of parameters and the encoded mono signal.
이 때, 상기 복수의 파라미터는 상기 복수 채널 간의 에너지 차 파라미터(CLD: Channel Level Differences)를 포함하고, 상기 파라미터 수정부는 상기 CLD가 0이고, 상기 IPD가 180°인 경우, 상기 IPD를 0°로 수정한다. In this case, the plurality of parameters include energy level difference (CLD) between the plurality of channels, and when the CLD is 0 and the IPD is 180, the parameter modifying unit adjusts the IPD to 0 degrees Modify it.
또한, 본 발명의 다른 일실시예에 따른 멀티 채널 신호의 부호화 장치는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 및 상기 복수의 파라미터 중 상기 복수 채널 간의 위상 정보에 관한 위상 파라미터의 부호화 여부를 결정하고, 상기 위상 파라미터의 부호화가 결정된 경우 상기 위상 파라미터를 포함하는 상기 복수의 파라미터를 부호화하는 파라미터 부호화부를 포함한다. According to another aspect of the present invention, there is provided an apparatus for encoding a multi-channel signal, the apparatus comprising: a parameter extraction unit that extracts a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal; And a parameter encoding unit which encodes the plurality of parameters including the phase parameter when encoding of the phase parameter is determined.
또한, 본 발명의 다른 일실시예에 따른 멀티 채널 신호의 부호화 장치는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 상기 복수의 파라미터를 양자화하고, 상기 양자화된 복수의 파라미터를 부호화하는 파라미터 부호화부, 상기 멀티 채널 신호를 다운믹싱한 모노 신호를 부호화하는 모노 신호 부호화부, 및 상기 부호화된 복수의 파라미터 및 상기 부호화된 모노 신호를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 비트스트림 생성부를 포함하고, 상기 파라미터 부호화부는 상기 멀티 채널 신호에 포함된 복수의 프레임 간의 위상 정보의 연속성에 기초하여 상기 위상 파라미터의 양자화 레벨을 결정한다. According to another aspect of the present invention, there is provided an apparatus for encoding a multi-channel signal, the apparatus comprising: a parameter extraction unit that extracts a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal; A parameter encoding unit for encoding a plurality of quantized parameters, a mono signal encoding unit for encoding a mono signal obtained by downmixing the multi-channel signal, and a multi-channel signal encoding unit for encoding the multi-channel signal using the plurality of encoded parameters and the encoded mono signal. The parameter encoding unit determines a quantization level of the phase parameter based on continuity of phase information between a plurality of frames included in the multi-channel signal.
또한, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치는 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운믹스 신호인 모노 신호를 복원하는 모노 신호 복호화부, 상기 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 파라미터 복호화부, 상기 복원된 복수의 파라미터를 이용하여 상기 복원된 모노 신호와 상기 멀티 채널 신호간의 위상 차에 관한 파라미터(OPD: Overall Phase Difference)를 추정하는 파라미터 추정부, 상기 추정된 OPD를 수정하는 파라미터 수정부, 및 상기 복원된 적어도 하나의 파라미터 및 상기 수정된 OPD를 이용하여 상기 모노 신호를 업믹싱하는 업믹싱부를 포함한다. Also, an apparatus for decoding a multi-channel signal according to an embodiment of the present invention includes a mono signal decoding unit for decoding a mono signal, which is a downmix signal of the multi-channel signal, from a bitstream of a multi- A parameter decoding unit for restoring a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal; a parameter decoding unit for decoding a parameter (OPD) related to a phase difference between the restored monaural signal and the multi- A parameter estimator for estimating an overall phase difference, a parameter modifying unit for modifying the estimated OPD, and an upmixing unit for upmixing the mono signal using the restored at least one parameter and the modified OPD do.
이 때, 상기 복수의 파라미터는 CLD 및 IPD를 포함하고, 상기 파라미터 수정부는 상기 CLD 및 상기 IPD에 기초하여 상기 OPD를 수정할 수 있다. At this time, the plurality of parameters include CLD and IPD, and the parameter modifying unit can modify the OPD based on the CLD and the IPD.
또한, 멀티 채널 신호의 다운믹스 신호인 모노 신호와 멀티 채널 신호간의 위상 차에 관한 파라미터를 수정하는 파라미터 수정부 및 수정된 위상 차에 관한 파라미터를 이용하여 상기 모노 신호를 업믹싱하는 업믹싱부를 포함하는 복호화 장치가 제공된다.Also, an upmixing unit for upmixing the mono signal using a parameter correcting unit for correcting a parameter related to a phase difference between a mono signal and a multi-channel signal, which is a downmix signal of the multi-channel signal, Is provided.
또한, 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 복수의 파라미터 중 복수 채널 간의 위상 정보에 관한 위상 파라미터를 수정하는 파라미터 수정부, 수정된 위상 파라미터를 통해 멀티 채널 신호를 다운믹싱하여 모노 신호를 생성하는 다운믹싱부 및 수정된 위상 파라미터를 제외한 상기 복수의 파라미터 및 상기 생성된 모노 신호를 부호화하여 비트스트림을 생성하는 비트스트림 생성부를 포함하는 부호화 장치가 제공된다.A parameter extracting unit for extracting a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a multi-channel signal; a parameter correcting unit for correcting a phase parameter relating to phase information between a plurality of channels among the plurality of parameters; A downmixing unit for downmixing a multi-channel signal to generate a mono signal, and a bitstream generator for encoding the plurality of parameters and the generated mono signal except for the modified phase parameter to generate a bitstream / RTI >
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화/복호화 장치 및 방법은 데이터 전송시 필요한 데이터의 양을 줄일 수 있다.An apparatus and method for encoding / decoding a multi-channel signal according to an embodiment of the present invention can reduce the amount of data required for data transmission.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화/복호화 장치 및 방법은 음질이 향상된 멀티 채널 오디오 신호를 제공할 수 있다. An apparatus and method for encoding / decoding a multi-channel signal according to an embodiment of the present invention can provide a multi-channel audio signal with improved sound quality.
도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다.
도 2는 스테레오 신호에 포함된 연속되는 프레임에서의 위상 파라미터의 변화를 설명하기 위한 개념도이다.
도 3은 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다.
도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법의 흐름도를 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법의 흐름도를 도시한 도면이다.
도 6은 OPD 추정 및 CLD 오프셋을 이용하여 스테레오 신호를 다운믹싱하여 모노 신호를 생성하는 일례이다.
도 7은 OPD 값의 위상을 변형하는 일례를 나타낸 도면이다.
도 8은 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 방법을 도시한 흐름도이다.
도 9는 본 발명의 다른 실시예에 따른 멀티 채널 신호의 복호화 방법을 도시한 흐름도이다.1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
Fig. 2 is a conceptual diagram for explaining a change in a phase parameter in successive frames included in a stereo signal. Fig.
3 is a block diagram illustrating a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
4 is a flowchart illustrating a method of encoding a multi-channel signal according to an embodiment of the present invention.
FIG. 5 is a flowchart illustrating a method of decoding a multi-channel signal according to an embodiment of the present invention. Referring to FIG.
6 is an example of generating a mono signal by downmixing a stereo signal using an OPD estimation and a CLD offset.
7 is a view showing an example of modifying the phase of the OPD value.
8 is a flowchart illustrating a method of encoding a multi-channel signal according to another embodiment of the present invention.
9 is a flowchart illustrating a method of decoding a multi-channel signal according to another embodiment of the present invention.
이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. However, the present invention is not limited to or limited by the embodiments. Like reference symbols in the drawings denote like elements.
도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다. 1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 파라미터 추출부(110), 파라미터 부호화부(120), 다운믹싱부(130), 모노 신호 부호화부(140), 및 비트스트림 생성부(150)를 포함한다. 여기서, 본 발명의 일실시예에 따르면, 멀티 채널 신호의 부호화 장치(100)는 파라미터 수정부(160)를 더 포함할 수 있다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.The
여기서, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.Here, the multi-channel signal means a signal of a plurality of channels. In the present specification, each of a plurality of channels included in the multi-channel signal is referred to as a channel signal.
또한, 이하에서는, 설명의 편의상 멀티 채널 신호의 부호화 장치(100)에 입력되는 멀티 채널 신호는 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화에도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. Hereinafter, for convenience of description, it is assumed that a multi-channel signal input to the multi-channel signal encoding
파라미터 추출부(110)는 스테레오 신호를 구성하는 좌채널 신호와 우채널 신호 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 복수의 파라미터에는 상기에서 언급한 CLD, ICC, IPD, OPD 등이 포함될 수 있다. 여기서, IPD 및 OPD는 좌채널 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다. The
파라미터 부호화부(120)는 추출된 복수의 파라미터를 부호화한다. The
이 때, OPD는 다른 파라미터들로부터 추정될 수 있으므로, 본 발명의 일실시예에 따르면, 파라미터 부호화부(120)는 추출된 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하고, OPD는 부호화하지 않을 수 있다. 즉, 멀티 채널 신호의 부호화 장치(100)는 OPD를 부호화하여 전송하지 않음으로써 전송되는 비트스트림의 비트양을 감소시킬 수 있다. OPD의 추정에 대한 보다 상세한 설명은 도 3의 멀티 채널 신호의 복호화 장치(300)에 관한 설명을 참고하기로 한다. In this case, since OPD can be estimated from other parameters, according to an embodiment of the present invention, the
또한, 파라미터 부호화부(120)는 복수의 파라미터의 부호화에 할당되는 비트양을 감소시키기 위해 추출된 복수의 파라미터를 양자화하고, 양자화된 복수의 파라미터를 부호화할 수 있다. 만약, 파라미터 부호화부(120)가 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하는 경우, 파라미터 부호화부(120)는 CLD, ICC, 및 IPD 만을 양자화하고, 양자화된 CLD, ICC, 및 IPD를 부호화할 수 있다. In addition, the
다운믹싱부(130)는 스테레오 신호를 다운믹싱하여 모노 신호를 출력한다. The
다운믹싱(Down-Mixing)은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 이 때, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 멀티 채널 신호의 부호화 장치(100)에서는 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다. Down-mixing is to generate a mono signal of one channel from a stereo signal of two or more channels. By down-mixing, the bit amount of the bit stream generated in the encoding process can be reduced. At this time, the mono signal may be a signal representative of the stereo signal. In other words, in the multi-channel signal encoding
예를 들어, 모노 신호의 크기는 좌채널 신호 및 우채널 신호의 크기의 평균 값으로 구할 수 있고, 모노 신호의 위상은 좌채널 신호 및 우채널 신호의 위상의 평균 값으로 구할 수 있다.For example, the magnitude of the mono signal can be obtained as an average value of the magnitudes of the left channel signal and the right channel signal, and the phase of the mono signal can be obtained as an average value of the phases of the left channel signal and the right channel signal.
모노 신호 부호화부(140)는 다운믹싱부(130)에서 출력된 모노 신호를 부호화한다. The mono
일례로서, 스테레오 신호가 음성(voice) 신호인 경우, 모노 신호 부호화부(120)는 모노 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화할 수 있다.As an example, when the stereo signal is a voice signal, the mono
또한, 다른 일례로서, 스테레오 신호가 음악(music) 신호인 경우, 모노 신호 부호화부(120)는 기존의 MPEG-2/4 AAC나 mp3와 유사한 방법을 사용하여 모노 신호를 부호화할 수 있다. As another example, when the stereo signal is a music signal, the mono
비트스트림 생성부(150)는 부호화된 복수의 파라미터 및 부호화된 모노 신호를 이용하여 스테레오 신호에 대한 부호화된 비트스트림을 생성한다. The
상기에서 언급한 바와 같이, 멀티 채널 신호의 부호화 장치(100)는 전송되는 비트양을 줄이기 위해 스테레오 신호로부터 모노 신호 및 복수의 파라미터를 추출하고, 추출된 모노 신호 및 추출된 복수의 파라미터를 부호화하여 전송한다. 또한, 상기의 경우에 있어서도, 복수의 파라미터의 전송에 사용되는 비트양을 더욱 줄이기 위해, 멀티 채널 신호의 부호화 장치(100)는 복수의 파라미터 중에서 OPD를 제외한 CLD, ICC, 및 IPD만을 부호화하여 전송할 수 있다. As described above, the
그러나 이러한 경우는 스테레오 신호 자체가 부호화되어 전송되는 것이 아니므로, 스테레오 신호의 재생시 음질의 열화가 발생할 수 있다. 따라서, 음질의 열화를 최소화하면서 전송되는 비트양을 줄일 수 있는 방안이 요구된다. 이하에서는 음질의 열화를 감소시키기 위한 멀티 채널 신호의 부호화 장치(100)의 동작의 실시예들을 살펴보기로 한다. 도 1에서 점선 화살표는 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)를 설명할 때 이용될 수 있다. 본 발명의 다른 실시예에 따른 채널 신호의 부호화 장치(100)에 대해서는 이후 자세히 설명한다.However, in this case, since the stereo signal itself is not encoded and transmitted, deterioration of sound quality may occur when reproducing the stereo signal. Therefore, there is a need for a method capable of reducing the amount of bits transmitted while minimizing deterioration of sound quality. Hereinafter, embodiments of the operation of the multi-channel signal encoding
좌채널 신호와 우채널 신호 간의 위상 정보를 나타내는 위상 파라미터의 수정Modification of the phase parameters indicating the phase information between the left channel signal and the right channel signal
상기에서 언급한 바와 같이, 멀티 채널 신호의 부호화 장치(100)에서 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하여 복호화단으로 전송하는 경우, 복호화단에서는 CLD 및 IPD를 이용하여 OPD를 추정할 수 있다. 이 경우, 추정된 OPD가 연속되는 프레임에서 급격하게 변화한다면, 원하지 않는 노이즈가 발생될 수 있다. 이하에서는 도 2를 참고하여 위상 파라미터의 변화에 따른 노이즈 발생의 개념을 상세히 설명하기로 한다. As described above, when only the CLD, ICC, and IPD among a plurality of parameters are encoded and transmitted to the decoding end in the multi-channel
도 2는 스테레오 신호에 포함된 연속되는 프레임에서의 위상 파라미터의 변화를 설명하기 위한 개념도이다. Fig. 2 is a conceptual diagram for explaining a change in a phase parameter in successive frames included in a stereo signal. Fig.
도 2의 (a)에서는 위상 파라미터(IPD 및 OPD)와 좌채널 신호, 우채널 신호, 및 모노 신호 간의 관계를 도시하고 있다. 여기서, "L"은 주파수 도메인 상에서 좌채널 신호를, "R"은 주파수 도메인 상에서의 우채널 신호를, "M"은 다운믹싱된 모노 신호를 각각 의미한다. 이 때, IPD 및 OPD는 하기의 수학식 1 및 2를 통해 연산될 수 있다. 2 (a) shows the relationship between the phase parameters IPD and OPD, the left channel signal, the right channel signal, and the mono signal. Here, "L" represents a left channel signal on the frequency domain, "R " represents a right channel signal on the frequency domain, and" M " represents a downmixed mono signal. At this time, IPD and OPD can be calculated through the following equations (1) and (2).
여기서, L·R은 좌채널 신호와 우채널 신호의 내적(dot product), IPD는 좌채널 신호와 우채널 신호가 이루는 각도, *는 복소 공액(complex conjugate)을 각각 의미한다. Here, L · R denotes the dot product of the left channel signal and the right channel signal, IPD denotes an angle formed between the left channel signal and the right channel signal, and * denotes a complex conjugate.
여기서, L·M은 좌채널 신호와 모노 신호의 내적, OPD는 좌채널 신호와 모노 신호가 이루는 각도, *는 복소 공액(complex conjugate)을 각각 의미한다.L denotes an inner product of a left channel signal and a mono signal, OPD denotes an angle between a left channel signal and a mono signal, and * denotes a complex conjugate.
도 2의 (b)에서는 연속되는 프레임에서 위상 파라미터(IPD 및 OPD)가 급격하게 변화하는 일례를 도시하고 있다. FIG. 2B shows an example in which the phase parameters IPD and OPD change abruptly in successive frames.
도 2의 (b)에서, "Frame"은 현재 프레임을, "Frame-1"은 현재 프레임의 1프레임 이전의 프레임(이하 "이전 프레임"이라고 함)을 각각 의미한다. 2B, "Frame" denotes a current frame, and "Frame-1" denotes a frame one frame before the current frame (hereinafter referred to as "previous frame").
도 2의 (b)에 도시된 바와 같이, 이전 프레임 및 현재 프레임에서 IPD가 180°전후에서 변경되는 경우, IPD는 좌채널 신호를 기준으로 180°에서 -180°로 크게 변화하고, 이에 따라 OPD는 좌채널 신호를 기준으로 90°에서 -90°로 급격히 변화한다. 이와 같은 IPD 및 OPD의 급격한 변화로 인하여 스테레오 신호 재생시 원하지 않는 노이즈가 발생하게 된다. 따라서, 스테레오 신호의 재생시 발생하는 노이즈를 줄이고 스테레오 신호의 음질을 향상시키기 위해서는 좌채널 신호화 우채널 신호 간의 위상 정보에 관한 위상 파라미터를 수정하여야 한다. As shown in FIG. 2 (b), when the IPD is changed around 180 ° in the previous frame and the current frame, the IPD greatly changes from 180 ° to -180 ° on the basis of the left channel signal, Changes rapidly from 90 DEG to -90 DEG based on the left channel signal. Such a sudden change of the IPD and OPD causes undesired noise in the reproduction of the stereo signal. Therefore, in order to reduce the noise generated during reproduction of the stereo signal and to improve the sound quality of the stereo signal, the phase parameter related to the phase information between the left channel signalized right channel signals should be corrected.
이를 위해, 멀티 채널 신호의 부호화 장치(100)는 파라미터 추출부(110)에서 추출된 위상 파라미터를 수정하여 연속되는 프레임에서의 위상 파라미터의 변화 정도를 조절함으로써, 스테레오 신호의 재생시 발생하는 노이즈를 감소시킨다. 이 때, 파라미터의 수정은 멀티 채널 신호의 부호화 장치(100)에 포함된 파라미터 수정부(160)에서 수행될 수 있다. To this end, the multi-channel
일례로, 파라미터 수정부(160)는 CLD가 0이고, IPD가 180°인 경우, IPD를 0°로 수정할 수 있다. 다시 말해, 좌채널 신호와 우채널 신호 간에 에너지 차이가 없고, 좌채널 신호와 우채널 신호 간의 각도가 180°인 경우, IPD를 강제로 0°로 설정한다. In one example, the
즉, 멀티 채널 신호의 부호화 장치(100)는, 도 2의 (b)에 도시된 바와 같이 IPD가 180° 부근에서 연속적으로 변화하는 경우, IPD가 180°가 되는 시점에서 IPD를 0°로 수정하고 수정된 IPD를 부호화하여 복호화단으로 전송한다. 이 경우, 복호화단에서 추정되는 OPD는 90°에서 -90°로 변화하지 않고, 90°, 0°, -90°의 순서로 단계적으로 변화되므로, 스테레오 신호의 복호화 단계에서 발생하는 위상 정보의 급격한 변화를 방지할 수 있게 된다. In other words, when the IPD continuously changes near 180 degrees as shown in FIG. 2 (b), the multi-channel
위상 파라미터의 선택적 부호화Selective encoding of phase parameters
상기에서 언급한 바와 같이, 멀티 채널 신호의 부호화 장치(100)는 복수의 파라미터의 부호화에 할당되는 비트양을 감소시키기 위해 추출된 복수의 파라미터(특히, 위상 파라미터)를 양자화하고, 양자화된 복수의 파라미터를 부호화하여 복호화단으로 전송할 수 있다. As described above, the multi-channel
그러나, 만약 스테레오 신호에 포함된 연속되는 프레임에서 위상 정보가 연속적으로 변화하는 경우(즉, 위상 파라미터의 변화 정도가 작은 경우)에, 복호화단에서 위상 파라미터를 이용하여 스테레오 신호를 복원하여 재생한다면 위상 파라미터의 양자화 및 이로 인한 불연속적인 위상 값으로 인해 음질의 열화가 발생할 수 있다. However, if the stereo signal is reconstructed and reproduced using the phase parameters at the decoding end when the phase information continuously changes in successive frames included in the stereo signal (i.e., when the degree of change of the phase parameter is small) Quantization of the parameters and resulting discontinuous phase values can cause deterioration of sound quality.
따라서, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 스테레오 신호에 포함된 복수의 프레임 간의 위상 정보의 변화 정도(연속성)에 기초하여 위상 파라미터의 부호화 여부를 결정할 수 있다. 즉, 스테레오 신호에 포함된 복수의 프레임 간의 위상 정보가 연속된 것으로 판단한 경우, 위상 정보를 부호화하지 않고, 위상 정보가 연속되지 않은 것으로 판단한 경우, 위상 정보를 부호화할 수 있다. 이 때, 위상 파라미터의 부호화 여부의 결정은 파라미터 부호화부(120)에서 수행될 수 있다. Therefore, the
이 경우, 본 발명의 일실시예에 따르면, 파라미터 부호화부(120)는 현재 프레임의 위상 정보 값과 현재 프레임의 1프레임 이전의 프레임의 위상 정보 값과 현재 프레임의 2프레임 이전의 프레임의 위상 정보 값을 이용하여 위상 정보의 연속성을 판단할 수 있다. 즉, 파라미터 부호화부(110)는 n번째 프레임의 위상 정보 값, n-1번째 프레임의 위상 정보 값, 및 n-2번째 프레임의 위상 정보 값을 이용하여 n번째 프레임에서의 위상 정보의 연속성을 판단할 수 있다. In this case, according to an embodiment of the present invention, the
일례로서, 파라미터 부호화부(120)는 현재 프레임의 1프레임 이전의 프레임의 위상 정보 값의 2배수 값과 상기 현재 프레임의 2프레임 이전의 프레임의 위상 정보 값 간의 차인 제1 위상 차이 값을 연산하고, 현재 프레임의 위상 정보 값과 상기 제1 위상 차이 값 간의 차인 제2 위상 차이 값을 연산하고, 제2 위상 차이 값이 기 설정된 값보다 큰 경우, 위상 정보가 연속되지 않은 것으로 판단(즉, 위상 정보가 천천히 변화하지 않는 것으로 판단)하여 위상 파라미터의 부호화를 결정할 수 있다. 이는 하기 수학식 3과 같이 표현될 수 있다. As an example, the
여기서, Phase[]는 현재 프레임의 위상 정보 값, PhasePrev[]는 현재 프레임의 1프레임 이전의 프레임의 위상 정보 값, PhasePrev2[]는 현재 프레임의 2프레임 이전 프레임의 위상 정보 값, PhaseError[]는 제2 위상 차이 값, band는 위상 정보가 적용되는 주파수 대역을 각각 의미한다. PhasePrev [] is the phase information value of the frame one frame before the current frame, PhasePrev2 [] is the phase information value of the frame two frames before the current frame, PhaseError [] is the phase information value of the current frame, The second phase difference value, band, means a frequency band to which the phase information is applied.
따라서, 파라미터 부호화부(120)는 PhaseError[band]가 기 설정된 값보다 큰 경우, 위상 정보의 부호화를 결정하고, PhaseError[band]가 기 설정된 값보다 작거나 같은 경우, 위상 정보의 비부호화를 결정한다. Therefore, when the PhaseError [band] is larger than a preset value, the
또한, 본 발명의 다른 일실시예에 따르면, 파라미터 부호화부(120)는 1프레임 이전의 프레임의 위상 정보 값 및 현재 프레임의 위상 정보 값의 차를 이용하여 위상 정보가 연속되는지 여부를 판단하고, 이에 기초하여 위상 파라미터의 부호화 여부를 결정할 수 있다. According to another embodiment of the present invention, the
일례로서, 파라미터 부호화부는 이는 하기 수학식 4와 같이 현재 프레임의 위상 정보와 1프레임 이전의 프레임의 위상 정보 값의 차를 계산하고, 이의 기울기를 연산하여 위상 정보가 연속되는지 여부를 판단할 수 있다. As an example, the parameter encoding unit may calculate the difference between the phase information of the current frame and the phase information of the previous frame, and calculate the slope thereof to determine whether the phase information is continuous or not .
여기서, Slope[]는 현재 프레임의 위상 정보 값과 1프레임 이전의 프레임의 위상 정보 값의 차, band는 위상 정보가 적용되는 주파수 대역을 각각 의미한다. Here, Slope [] denotes a difference between a phase information value of a current frame and a phase information value of a frame one frame before, and a band denotes a frequency band to which phase information is applied.
Slope[band]가 일정 기울기 이상을 가지고 변하는 경우에 양자화로 인한 위상 정보의 불연속성에 의해 노이즈가 발생할 수 있으므로, 파라미터 부호화부(120)는 slope[band]의 기울기가 기 설정된 값보다 큰 경우, 위상 정보의 비부호화를 결정하고, slope[band]의 기울기가 기 설정된 값보다 작거나 같은 경우, 위상 정보의 부호화를 결정한다. When the slope [band] varies with a certain slope or more, noise may be generated due to discontinuity of phase information due to quantization. Therefore, when the slope of slope [band] And decides the coding of the phase information when the slope of the slope [band] is smaller than or equal to a predetermined value.
상기의 수학식 3 및 수학식 4의 연산에 있어서, 파라미터 부호화부(120)는 위상 정보가 360°를 기준으로 연속적(Wrapping property)으로 변한다는 점을 고려하여 제1 위상 차이 값, 제2 위상 차이 값, 및 현재 프레임과 1프레임 이전의 프레임의 위상 차이 값을 연산한다. 예를 들어 위상 차이 값이 370°인 경우 파라미터 부호화부(120)는 360°의 주기를 고려하여 위상 차이 값을 -10°로 연산한다. In the calculations of Equations (3) and (4), the
또 다른 일례로서, 파라미터 부호화부(120) PhaseError[band]와 slope[band]를 조합하여 위상 정보의 부호화 여부를 결정할 수 도 있다.As another example, it is possible to determine whether or not the phase information is encoded by combining the
본 발명의 다른 일실시예에 따르면, 파라미터 부호화부(120)는 PhaseError[band]와 slope[band]를 조합하여 위상 정보의 부호화 여부를 결정할 수 도 있다. According to another embodiment of the present invention, the
또한, 파라미터 부호화부(120)는 위상 정보의 연속성 이외에, 파라미터 추출부(110)에서 추출된 ICC값에 기초하여 위상 파라미터(보다 정확히는 위상 파라미터에 포함되는 IPD)의 부호화 여부를 결정할 수 있다. In addition to the continuity of the phase information, the
파라미터 추출부(110)에서는 IPD를 이용하여 ICC를 추출할 수도 있고, IPD를 이용하지 않고 ICC를 추출할 수도 있는데, 만약, IPD를 이용하지 않고 추출된 ICC와 IPD를 이용하여 추출된 ICC 간의 차가 기 설정된 값보다 크다면, 스테레오 신호의 복호화 단계에 있어 IPD가 ICC보다 중요한 의미를 지니는 것으로 해석할 수 있고, 반대로 IPD를 이용하지 않고 추출된 ICC와 IPD를 이용하여 추출된 ICC 간의 차가 기 설정된 값보다 작다면, ICC가 IPD보다 중요한 의미를 지니는 것으로 해석할 수 있다. The
따라서, 본 발명의 일실시예에 따르면, 파라미터 부호화부(120)는 IPD를 고려하여 추출된 ICC와 IPD를 고려하지 않고 추출된 ICC 간의 차가 기 설정된 값보다 큰 경우, IPD의 부호화를 결정할 수 있다. Therefore, according to the embodiment of the present invention, the
이 경우, 멀티 채널 신호의 부호화 장치(100)는 IPD 및 IPD가 고려된 ICC를 부호화하여 복호화단으로 전송할 수 있는데, 복호화단에서는 IPD 및 IPD가 고려된 ICC를 이용하여 스테레오 신호를 복원함으로써, 원음에 근접한 스테레오 신호를 복원할 수 있다. In this case, the multi-channel
즉, 복호화단에서는 스테레오 신호를 복원함에 있어, ICC를 이용하여 복원된 모노 신호의 수직 벡터 성분에 해당하는 디코릴레이트(decorrelate)된 신호와 복원된 모노 신호와의 믹싱 정도를 조절한다. 따라서, 복호화단에서 IPD가 고려된 ICC를 이용하여 스테레오 신호를 복원하는 경우, 위상 정보 차이로 인하여 디코릴레이트된 신호화 복원된 모노 신호가 과도하게 믹싱되는 것을 방지하여 원음에 근접한 스테레오 신호를 복원할 수 있게 된다.That is, in restoring the stereo signal, the decoding unit adjusts the degree of mixing of the decorrelated signal and the restored mono signal corresponding to the vertical vector component of the restored mono signal using the ICC. Therefore, when the stereo signal is restored by using the ICC considering the IPD at the decoding end, it is possible to prevent the decorrelated signal restored mono signal from being excessively mixed due to the difference in phase information, thereby restoring the stereo signal close to the original sound .
일례로서, 파라미터 추출부(120)는 하기 수학식 5에 따라서 IPD가 고려된 ICC를 추출할 수 있다. As an example, the
즉, 위상 정보를 보상하여 좌채널 신호와 우채널 신호 간의 상관성을 계산하고, 상기 계산된 상관성의 실수값 만을 취하여 IPD가 고려된 ICC를 연산할 수 있다. That is, the correlation between the left channel signal and the right channel signal is calculated by compensating the phase information, and the ICC considering the IPD can be calculated by taking only the real value of the calculated correlation.
다른 일례로써, 파라미터 추출부(120)는 하기 수학식 6에 따라서 IPD가 고려된 ICC를 추출할 수 있다.As another example, the
여기서, Q는 양자화를, Q-1은 역양자화를 각각 의미한다. Here, Q means quantization and Q -1 means inverse quantization, respectively.
즉, 수학식 6에 따라 추출된 ICC를 이용하여 복호화단에서 스테레오 신호를 복원하는 경우, 상기에서 언급한 위상 파라미터의 양자화 의해 발생할 수 있는 에러를 보상할 수 있게 된다. That is, when a stereo signal is reconstructed at a decoding end using the ICC extracted according to Equation (6), it is possible to compensate for an error that may be caused by the quantization of the above-mentioned phase parameter.
또 다른 일례로서, 파라미터 추출부(120)는 하기 수학식 7에 따라서 IPD가 고려된 ICC를 추출할 수 있다.As another example, the
위상 파라미터의 양자화 방식의 선택적 변경Optional change of phase parameter quantization method
상기에서 언급한 바와 같이, 멀티 채널 신호의 부호화 장치(100)는 양자화된 위상 파라미터를 부호화하여 복호화단으로 전송할 수 있다. 따라서, 만약 위상 파라미터가 선택적이 아닌 일률적으로 부호화되어 복호화단으로 전송되는 경우, 멀티 채널 신호의 부호화 장치(100)는 양자화된 위상 파라미터로 인한 음질의 열화를 방지하기 위해 양자화 방식을 선택적으로 변경할 수 있다. As described above, the multi-channel
다시 말해, 위상 정보의 변화 정도가 작음(즉 위상 정보가 연속적으로 변경됨)에도 불구하고 넓은 간격으로 위상 파라미터가 양자화된다면, 불연속적인 위상 값으로 인해 복호화단에서 재생되는 스테레오 신호의 음질에 열화가 발생할 수 있으므로, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 위상 정보의 연속성에 기초하여 위상 파라미터의 양자화 타입(type)을 결정할 수 있다. 이 때, 양자화 타입의 결정은 파라미터 부호화부(120)에서 수행될 수 있다. In other words, if the phase parameters are quantized at wide intervals despite the small degree of change in the phase information (i.e., the phase information is continuously changed), deterioration in the sound quality of the stereo signal reproduced at the decoding end due to discontinuous phase values Therefore, the
즉, 파라미터 부호화부(120)는 위상 정보가 연속되지 않은 것으로 판단한 경우, 위상 파라미터를 제1 양자화 타입에 따라 양자화하고, 위상 정보가 연속된 것으로 판단한 경우, 위상 파라미터를 제2 양자화 타입에 따라 양자화할 수 있다. That is, when it is determined that the phase information is not continuous, the
이 경우, 제1 양자화 타입에 따른 양자화 레벨의 수와 제2 양자화 타입에 따른 양자화 레벨의 수는 서로 다를 수 있다. In this case, the number of quantization levels according to the first quantization type and the number of quantization levels according to the second quantization type may be different from each other.
또한, 제1 양자화 타입에 따른 양자화 레벨에서의 대표값(즉 양자화 레벨에서 양자화되는 값)과 제2 양자화 타입에 따른 양자화 레벨에서의 대표값은 서로 다를 수 있다. In addition, the representative value at the quantization level according to the first quantization type (i.e., the value quantized at the quantization level) and the representative value at the quantization level according to the second quantization type may be different from each other.
따라서, 상기의 경우에 있어, 제1 양자화 타입에 따른 양자화 에러(quantization error)와 제2 양자화 타입에 따른 양자화 에러는 서로 다를 수 있다. 여기서, 양자화 에러는 양자화된 값과 양자화되지 않은 값 간의 차이 값을 의미한다. Therefore, in the above case, the quantization error according to the first quantization type and the quantization error according to the second quantization type may be different from each other. Here, the quantization error means a difference value between a quantized value and a non-quantized value.
일례로서, 파라미터 부호화부(120)는 위상 정보가 연속된 경우에는 그렇지 않은 경우보다 세밀한 간격으로 위상 파라미터를 양자화하여 복호화단에서 발생하는 스테레오 신호의 음질 열화를 최소화시킬 수 있다. 이 경우, 제1 양자화 타입의 양자화 레벨 수는 제2 양자화 타입의 양자화 레벨 수보다 적다. As an example, when the phase information is continuous, the
상기의 경우에 있어서, 위상 정보가 연속되는지 여부는 상기의 수학식 3내지 수학식 4에 기초하여 결정될 수 있다. In this case, whether or not the phase information is continuous can be determined based on Equations (3) to (4) above.
파라미터 부호화부(120)가 양자화 타입을 선택적으로 적용하여 위상 파라미터를 부호화하는 경우, 비트스트림 생성부(150)는 결정된 양자화 타입 정보 더 이용하여 비트스트림을 생성할 수 있다. 이 경우, 비스트스림을 전송받은 복호화단에서는 양자화 타입 정보를 참고하여 역양자화를 수행할 수 있다. 만약, 멀티 채널 신호의 부호화 장치(100)에서 위상 정보를 복호화단으로 전송하지 않는 경우, 비트스트림 생성부(150)는 양자화 타입 정보를 비트스트림에 포함시키지 않고, 양자화 타입 정보가 포함되지 않은 비트스트림을 전송받은 복호화단은 양자화 타입 정보를 참고하지 않고 역양자화를 수행할 수 있다. 복화화단에서 수행되는 역양자화에 대한 보다 상세한 설명은 도 3의 멀티 채널 신호의 복호화 장치(300)에 대한 설명을 참고하기로 한다. When the
하기의 [표 1] 및 [표 2]는 제1 양자화 타입의 양자화 레벨 수가 8개이고, 제2 양자화 타입의 양자화 레벨 수가 16개인 경우의 양자화 각도 정보를 나타내고 있다.The following [Table 1] and [Table 2] show quantization angle information when the number of quantization levels of the first quantization type is eight and the number of quantization levels of the second quantization type is sixteen.
이상에서는 전송되는 비트스트림의 비트양을 줄이고 음질의 열화를 감소시키기 위한 멀티 채널 신호의 부호화 장치(100)의 동작의 실시예들에 대해 설명하였다. 이하에서는 도 3을 참고하여 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치에 대해 상세히 설명하기로 한다. Embodiments of the operation of the
도 3은 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다. 3 is a block diagram illustrating a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 모노 신호 복호화부(310), 파라미터 복호화부(320), 파라미터 추정부(330), 업믹싱부(340), 및 파라미터 수정부(350)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.The
이하에서도, 설명의 편의상, 멀티 채널 신호의 복호화 장치(300)에 입력되는 비트스트림은 스테레오 신호의 부호화된 비트스트림인 것으로 가정한다. Hereinafter, for the sake of convenience, it is assumed that the bit stream input to the multi-channel
또한, 입력되는 비트스트림은 부호화된 모노 신호 및 부호화된 복수의 파라미터로 역다중화 된 것으로 가정한다. It is also assumed that the input bitstream is demultiplexed with a coded mono signal and a plurality of coded parameters.
모노 신호 복호화부(310)는 스테레오 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운믹스 신호인 모노 신호를 복원한다. 구체적으로, 모노 신호 복호화부(310)는 모노 신호가 시간 도메인에서 부호화된 경우에는 부호화된 모노 신호를 시간 도메인에서 복호화하고, 모노 신호가 주파수 도메인에서 부호화된 경우에는 부호화된 모노 신호를 주파수 도메인에서 복호화할 수 있다.The mono
파라미터 복호화부(320)는 스테레오 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널간의 특성 관계를 나타내는 복수의 파라미터를 복원한다. 이 때, 복수의 파라미터는 CLD, ICC, 및 IPD를 포함할 수는 있으나, OPD는 포함하지 않는다. The
파라미터 추정부(330)는 복원된 복수의 파라미터를 이용하여 OPD를 추정한다. The
이하에서는 OPD를 추정하는 파라미터 추정부(330)의 동작을 상세히 설명하기로 한다. . 여기서, 후술된 수학식들은 본 발명의 일실시예에 불과하고, 후술된 수학식들은 변형이 가능함은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. Hereinafter, the operation of the
먼저, 파라미터 추정부(330)는 하기 수학식 8에 따라서, CLD를 이용하여 제1 중간 변수 c를 구한다. First, the
여기서, b는 주파수 밴드의 인덱스를 나타낸다. 수학식 8과 같이, 제1 중간 변수 c는 특정 주파수 밴드에서의 IID 값을 20으로 나눈 수를 10의 지수 형태로 표현함으로써 구할 수 있다. 이 때, 제1 중간 변수 c를 이용하여 다음 수학식 9 및 10과 같이 제2 중간 변수 c1 및 제3 중간 변수 c2를 구할 수 있다.Here, b represents an index of a frequency band. As shown in Equation (8), the first intermediate variable c can be obtained by expressing the number obtained by dividing the IID value in the specific frequency band by 20 in an exponential form of 10. At this time, the second intermediate variable c 1 and the third intermediate variable c 2 can be obtained by using the first intermediate variable c as shown in the following equations (9) and (10).
즉, 제3 중간 변수 c2는 제2 중간 변수 c1의 값에 c를 곱한 값으로 구할 수 있다.That is, the third intermediate variable c 2 can be obtained by multiplying the value of the second intermediate variable c 1 by c.
다음으로, 파라미터 추정부(330)는 복원된 모노 신호와, 수학식 9 및 수학식 10에서 구한 제2 중간 변수 및 제3 중간 변수를 이용하여 제1 우채널 신호와 제1 좌채널 신호를 구한다. 제1 우채널 신호 및 제1 좌채널 신호는 하기 수학식 11 및 수학식 12과 같이 나타낼 수 있다.Next, the
여기서, n은 시간 슬롯 인덱스이며, k는 파라미터 밴드 인덱스를 나타낸다. 제1 우채널 신호 는 제2 중간 변수 c1과 복원된 모노 신호 M의 곱으로 나타낼 수 있다.Where n is the time slot index and k is the parameter band index. The first right channel signal Can be expressed as the product of the second intermediate variable c 1 and the restored mono signal M.
제1 좌채널 신호 는 제2 중간 변수 c2와 복원된 모노 신호 M의 곱으로 나타낼 수 있다.The first left channel signal Can be expressed as the product of the second intermediate variable c 2 and the restored mono signal M.
이 때, IPD를 라고 하면, 제1 모노 신호 는 제1 우채널 신호 및 제2 좌채널 신호 를 이용하여 다음 수학식 13과 같이 나타낼 수 있다. At this time, , The first mono signal Lt; RTI ID = 0.0 > And the second left channel signal The following equation (13) can be used.
또한, 수학식 10 내지 13을 이용하여, 시간 슬롯과 파라미터 밴드에 따른 제4 중간 변수 p는 다음 수학식 14와 같이 구할 수 있다.Further, using Equations (10) to (13), the fourth intermediate variable p according to the time slot and the parameter band can be obtained by the following Equation (14).
여기서, 제4 중간 변수 p는 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호의 크기의 합을 2로 나눈 값으로 한다. 이 때, OPD의 값을 라 할 때, OPD는 다음 수학식 15와 같이 구할 수 있다.Here, the fourth intermediate variable p is a value obtained by dividing the sum of the sizes of the first left channel signal, the first right channel signal, and the first mono signal by two. At this time, the value of OPD , The OPD can be obtained by the following equation (15).
또한, OPD와 IPD의 차에 해당하는 값을 라 할 때, 은 다음 수학식 16과 같이 구할 수 있다.Also, the value corresponding to the difference between OPD and IPD In other words, Can be obtained by the following equation (16).
수학식 15에서 구한 OPD의 값인 은 복호화된 모노 신호와 업믹싱될 좌채널 신호 사이의 위상 차이고, 수학식 16에서 구한 값인 는 복호화된 모노 신호와 업믹싱될 우채널 신호 사이의 위상 차를 나타낸다.The value of OPD obtained from the equation (15) Is the phase difference between the decoded mono signal and the left channel signal to be upmixed, Represents the phase difference between the decoded mono signal and the right channel signal to be upmixed.
이와 같이, 파라미터 추정부(330)는 스테레오 신호의 채널 간 크기 차를 나타내는 IID를 이용하여 복원된 모노 신호로부터 좌채널 신호 및 우채널 신호에 대한 제1 좌채널 신호 및 제1 우채널 신호를 생성하고, 스테레오 신호의 채널 간 위상 차를 나타내는 IPD를 이용하여 제1 좌채널 신호 및 제1 우채널 신호로부터 제1 모노 신호를 생성하며, 생성된 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호를 이용하여 복원된 모노 신호와 스테레오 신호의 위상 차를 나타내는 OPD의 값을 추정할 수 있다.As described above, the
업믹싱부(340)는 복원된 적어도 하나의 파라미터 및 추정된 OPD를 이용하여 모노 신호를 업믹싱한다. The
업믹싱은 한 채널의 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것으로 다운믹싱과 대응된다. 이하에서는 CLD, ICC, IPD 및 OPD를 이용하여 모노 신호를 업믹싱하는 업믹싱부(340)의 구체적인 동작에 대해 설명하기로 한다. Upmixing corresponds to downmixing by generating more than two channels of stereo signals from a mono signal of one channel. Hereinafter, the specific operation of the
먼저, 업믹싱부(340)는 ICC의 값이 일 때, 제2 및 제3 중간 변수 c1 및 c2를 이용하여 제1 위상 및 제2 위상 을 다음 수학식 17 및 18과 같이 구할 수 있다.First, the
다음으로, 업믹싱부(340)는 복원된 모노 신호가 M이고, 디코릴레이션된 신호가 D일 때, 수학식 18 및 수학식 19를 통해 구한 제1 및 제2 위상, 제2 및 제3 중간 변수 c1 및 c2 및 수학식 15에서 구한 OPD의 값인 , 수학식 16에서 구한 값인 을 이용하여 아래의 수학식 19 및 수학식 20과 같이 업믹싱된 좌채널 신호 및 우채널 신호를 구할 수 있다.Next, the
이와 같이, 본 발명의 일 실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 전송된 파라미터들을 이용하여 OPD 값을 추정하고, 추정된 OPD 파라미터와 전송된 다른 파라미터들은 이용하여 스테레오 신호를 복원할 수 있다. As described above, the
그러나 상기 도 2에 대한 설명에서 언급한 바와 같이, 전송된 파라미터를 이용하여 추정된 OPD가 연속되는 프레임에서 급격하게 변화하는 경우, 노이즈가 발생되어 음질이 열화 될 수 있으므로, 부호화단에서 위상 파라미터에 대해 수정을 하지 아니하고 위상 파라미터를 전송한 경우에는 멀티 채널 신호의 복호화 장치(300)에서 위상 파라미터에 대하여 수정을 하여 노이즈를 감소시켜야 한다. However, as mentioned in the description of FIG. 2, when the OPD estimated using the transmitted parameters is abruptly changed in successive frames, noise may be generated and sound quality may deteriorate. Therefore, When the phase parameter is transmitted without modifying the phase parameter, the phase parameter is corrected in the multi-channel
이를 위해, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 추정된 OPD를 수정하고, 수정된 OPD 및 복원된 복수의 파라미터를 이용하여 스테레오 신호를 복원한다. To this end, the
만약, 복원된 복수의 파라미터가 CLD 및 IPD를 포함한다면, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 CLD 및 IPD에 기초하여 OPD를 수정할 수 있다. 이 경우, 파라미터의 수정은 파라미터 수정부(350)에 의해 수행된다.If the recovered plurality of parameters includes CLD and IPD, the
일례로, 파라미터 수정부(350)는 복원된 IPD가 180°인 경우, 추정된 OPD를 0°로 수정할 수 있다. In one example, the
다른 일례로, 파라미터 수정부(350)는 복원된 IPD가 180°가 아닌 경우, 상기 CLD를 이용하여 추정된 OPD를 수정할 수 있는데, 이 경우, 수정된 OPD는 복원된 OPD와 0° 사이의 값 또는 복원된 OPD와 -180° 사이의 값 중에서 어느 하나와 대응될 수 있다. In another example, the
다시 말해, 복원된 IPD가 180° 부근에서 변경되는 경우, 추정된 OPD는 90° 부근에서 -90° 부근으로 급격하게 변경될 수 있는데, 파라미터 수정부(330)는 이러한 OPD의 급격한 변화를 방지하기 위해, IPD가 180°인 경우 OPD를 0°로 설정하고, IPD가 180°부근의 값인 경우 OPD를 90°와 0° 사이의 값 또는 -90°와 0° 사이의 값 중 어느 하나의 값, 예를 들어 67.5° 또는 -67.5°로 설정할 수 있다. 이에 따라, OPD는 90°에서 -90°로 변화하지 않고, 67.5°, 0°, -67.5°의 순서로 단계적으로 변화되어 위상 정보의 급격한 변화가 방지될 수 있다. In other words, when the restored IPD is changed near 180 °, the estimated OPD can be abruptly changed from about 90 ° to around -90 °, and the
상기에서 설명한 OPD의 수정은 하기 수학식 21에 따라 수행될 수 있다. The modification of the OPD described above can be performed according to the following expression (21).
또한, 본 발명의 다른 일실시예에 따르면, 파라미터 수정부(350)는 추정된 OPD를 필터링하여 추정된 OPD의 변화량이 감소되도록 OPD를 수정할 수 있다. Further, according to another embodiment of the present invention, the
일례로, 파라미터 수정부(350)는 무한 충격 응답 필터(IIR: Infinite Impulse Response)를 이용하여 추정된 OPD를 수정할 수 있다. For example, the
또한, 파라미터 수정부(350)는 하기 수학식 22에 기초하여 추정된 OPD를 필터링 할 수 있다. Further, the
여기서, 는 현재 프레임에서의 특정 주파수 대역에 포함되는 신호에 대한 위상 정보, 는 현재 프레임의 1프레임 이전의 프레임에서의 특정 주파수 대역에 포함되는 신호에 대한 위상 정보, 는 0보다 크고 1보다 작은 임의의 실수, 는 현재 프레임에서의 특정 주파수 대역에 포함되는 신호의 필터링된 위상 정보를 각각 의미한다. here, The phase information of the signal included in the specific frequency band in the current frame, The phase information of the signal included in the specific frequency band in the frame one frame before the current frame, Is an arbitrary real number greater than 0 and less than 1, Represents the filtered phase information of a signal included in a specific frequency band in the current frame, respectively.
즉, 파라미터 수정부(360)는 에 제1 가중치()를 부여하고, 에 제2 가중치()를 부여하고 가중치가 부여된 와 가중치가 부여된 를 더하여 추정된 OPD의 변화량이 감소되도록 OPD를 수정할 수 있다.That is, the parameter correction unit 360 The first weight ( ), The second weight ( ) And the weighted And weighted The OPD can be modified so that the estimated amount of change in OPD is reduced.
또한, 상기의 경우에 있어, 추정된 OPD에 대한 필터링 적용 여부는 부호화단에서 결정될 수 있다. 부호화단에서는 필터링 수행에 대한 정보를 비트스트림에 포함시켜 멀티 채널 신호의 복호화 장치(300)로 전송하고, 파라미터 수정부(350)는 상기 필터링 수행에 대한 정보에 따라 필터링 수행 여부를 결정할 수 있다. Also, in the above case, whether to apply filtering on the estimated OPD can be determined at the encoding end. The encoding unit may include information on performing filtering in the bitstream and may transmit the information to the
상기 도 1에 대한 설명에서 언급한 바와 같이, 부호화단에서는 위상 정보의 연속성에 기초하여 양자화 타입을 선택하고, 선택된 양자화 타입에 따라 양자화된 위상 파라미터 및 양자화 타입 정보를 포함하는 비트스트림을 생성할 수 있다. As described in the description of FIG. 1, at the encoding end, it is possible to select a quantization type based on continuity of phase information, and generate a bitstream including quantized phase parameters and quantization type information according to the selected quantization type have.
만약 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(300)가 양자화된 위상 파라미터 및 양자화 타입 정보를 포함하는 비트스트림을 수신하는 경우, 파라미터 복호화부(320)는 비트스트림으로부터 양자화된 위상 파라미터(이하 제1 위상 파라미터라고 한다) 및 양자화 타입 정보를 복원하고, 복원된 양자화 타입 정보에 기초하여 제1 위상 파라미터를 역양자화하여 제2 위상 파라미터를 연산할 수 있다. If the
이 경우, 업믹싱부(340)는 제2 위상 파라미터와 제2 위상 파라미터를 제외한 나머지 파라미터를 이용하여 모노 신호를 업믹싱할 수 있다. In this case, the
이에 따라, 멀티 채널 신호의 복호화 장치(300)는 위상 파라미터의 양자화 및 이로 인한 불연속적인 위상 값에 따른 음질의 열화를 감소시킬 수 있다.Accordingly, the multi-channel
도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법의 흐름도를 도시한 도면이다. 4 is a flowchart illustrating a method of encoding a multi-channel signal according to an embodiment of the present invention.
도 4를 참고하면, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법은 도 1에 도시된 멀티 채널 신호의 부호화 장치(100)에서 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 1에 도시된 멀티 채널 신호의 부호화 장치(100)에 관하여 이상에서 기술된 내용은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법에도 적용된다.Referring to FIG. 4, a method of encoding a multi-channel signal according to an embodiment of the present invention includes steps processed in the
먼저, 단계(S410)에서는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 정보를 나타내는 복수의 파라미터를 추출한다. First, in step S410, a plurality of parameters representing characteristic information between a plurality of channels constituting the multi-channel signal are extracted.
단계(S420)에서는 복수의 파라미터 중 복수 채널 간의 위상 정보에 관한 위상 정보를 수정한다. In step S420, the phase information regarding the phase information between a plurality of channels among the plurality of parameters is corrected.
본 발명의 일실시예에 따르면, 위상 파라미터는 IPD를 포함할 수 있다. According to one embodiment of the present invention, the phase parameter may comprise an IPD.
또한, 본 발명의 일실시예에 따르면, 복수의 파라미터는 CLD를 포함하고, 단계(S410)에서는 CLD가 0이고, IPD가 180°인 경우, IPD를 0°로 수정할 수 있다. Further, according to an embodiment of the present invention, the plurality of parameters include CLD, and in step S410, when CLD is 0 and IPD is 180, IPD can be modified to 0 deg.
단계(S430)에서는 수정된 위상 파라미터를 포함하는 복수의 파라미터를 부호화한다. In step S430, a plurality of parameters including the corrected phase parameters are encoded.
단계(S440)에서는 멀티 채널 신호를 다운믹싱한 모노 신호를 부호화한다. In step S440, a mono signal obtained by downmixing the multi-channel signal is encoded.
단계(S450)에서는 부호화된 복수의 파라미터 및 부호화된 모노 신호를 이용하여 멀티 채널 신호에 대한 부호화된 비트스트림을 생성한다. In step S450, an encoded bit stream for the multi-channel signal is generated using the plurality of encoded parameters and the encoded mono signal.
도 5는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법의 흐름도를 도시한 도면이다. FIG. 5 is a flowchart illustrating a method of decoding a multi-channel signal according to an embodiment of the present invention. Referring to FIG.
도 5를 참고하면, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법은 도 3에 도시된 멀티 채널 신호의 복호화 장치(300)에서 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 3에 도시된 멀티 채널 신호의 복호화 장치(300)에 관하여 이상에서 기술된 내용은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법에도 적용된다.Referring to FIG. 5, a method for decoding a multi-channel signal according to an embodiment of the present invention includes steps performed in an
먼저, 단계(S510)에서는 멀티 채널 신호의 부호화된 비트스트림으로부터 멀티채널 신호의 다운믹스 신호인 모노 신호를 복원한다. First, in step S510, a mono signal, which is a downmix signal of the multi-channel signal, is recovered from the coded bit stream of the multi-channel signal.
단계(S520)에서는 비트스트림으로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원한다. In step S520, a plurality of parameters indicating characteristic relationships between a plurality of channels constituting the multi-channel signal are restored from the bit stream.
단계(S530)에서는 복원된 복수의 파라미터를 이용하여 OPD를 추정한다. In step S530, OPD is estimated using the plurality of reconstructed parameters.
단계(S540)에서는 추정된 OPD를 수정한다. In step S540, the estimated OPD is corrected.
본 발명의 일실시예에 따르면, 복수의 파라미터는 CLD 및 IPD를 포함하고, 단계(S540)에서는 CLD 및 IPD에 기초하여 OPD를 수정할 수 있다. According to one embodiment of the present invention, the plurality of parameters include CLD and IPD, and in step S540 OPD can be modified based on CLD and IPD.
이 경우, 단계(S540)에서는 IPD가 180°인 경우, OPD를 0°로 수정할 수 있다. 또한, 단계(S540)에서는 IPD가 180°가 아닌 경우, CLD를 이용하여 OPD를 수정하고, 수정된 OPD는 상기 복원된 OPD와 0° 사이의 값 또는 상기 복원된 OPD와 -180° 사이의 값 중에서 어느 하나와 대응될 수 있다. In this case, in the step S540, when the IPD is 180 degrees, the OPD can be modified to 0 degrees. If the IPD is not 180 °, the OPD is corrected using the CLD, and the modified OPD is set to a value between the restored OPD and 0 ° or a value between the restored OPD and -180 ° Or the like.
또한, 본 발명의 다른 일실시예에 따르면, 단계(S540)에서는 추정된 OPD를 필터링하여 추정된 OPD의 변화량이 감소되도록 OPD를 수정할 수 있다. 이 경우, 단계(S540)에서는 IIR 필터를 이용하여 추정된 OPD를 필터링 할 수 있다. According to another embodiment of the present invention, in step S540, the estimated OPD may be filtered to modify the OPD so that the estimated amount of change of the OPD is reduced. In this case, the OPD estimated using the IIR filter may be filtered in step S540.
단계(S550)에서는 복원된 적어도 하나의 파라미터 및 수정된 OPD를 이용하여 모노 신호를 업믹싱한다. In step S550, the mono signal is upmixed using the restored at least one parameter and the modified OPD.
다시 도 1을 참조하면, 상술한 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 도 1에서 파라미터 추출부(110), 다운믹싱부(130), 비트스트림 생성부(150) 및 파라미터 수정부(160)만을 포함할 수 있다.1, the
여기서도, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.Here, the multi-channel signal means a signal of a plurality of channels. In the present specification, each of a plurality of channels included in the multi-channel signal is referred to as a channel signal.
또한, 설명의 편의상 멀티 채널 신호의 부호화 장치(100)에 입력되는 멀티 채널 신호는 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화에도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. For convenience of explanation, it is assumed that the multi-channel signal input to the multi-channel
파라미터 추출부(110)는 스테레오 신호를 구성하는 좌채널 신호와 우채널 신호 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 복수의 파라미터에는 상기에서 언급한 CLD, ICC, IPD, OPD 등이 포함될 수 있다. 여기서, IPD는 좌채널 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다. 또한, OPD는 이후 설명될 모노 신호와 좌채널 신호 또는 모노 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다.The
파라미터 수정부(160)는 상기 복수의 파라미터 중 상기 복수 채널 간의 위상 정보에 관한 위상 파라미터를 수정한다. 이때, 상기 복수의 파라미터는 상기 복수 채널 간의 에너지 차 파라미터(CLD: Channel Level Differences)를 포함할 수 있고, 파라미터 수정부(160)는 CLD의 값에 CLD 오프셋(offset)을 부가하여 이후 설명될 모노 신호와 상기 복수 채널 간의 위상 차에 관한 파라미터(OPD: Overall Phase Difference)를 수정할 수 있다.A parameter modifier (160) modifies a phase parameter relating to phase information between the plurality of channels among the plurality of parameters. In this case, the plurality of parameters may include channel level differences (CLD) between the plurality of channels, and the
예를 들어, 상술한 수학식 21에서, CLD의 값에 따라 결정될 수 있는 제2 중간변수 c1 또는 제3 중간 변수 c2의 값에 CLD 오프셋의 값을 곱함으로써, OPD가 수정될 수 있다. 이러한 CLD 오프셋을 추가함으로써, 스테레오 신호의 다운믹스 신호인 모노 신호의 위상을 결정할 수 있다. 즉, OPD의 계산 시에만 좌채널 신호 또는 우채널 신호의 크기를 키워줄 수 있다. 이러한 예는 아래 수학식 23과 같이 표현될 수 있다. 도 6은 OPD 추정 및 CLD 오프셋을 이용하여 스테레오 신호를 다운믹싱하여 모노 신호를 생성하는 일례이다. 즉, 점선박스(600)에는 좌채널 신호의 크기를 키워 모노 신호를 생성한 모습을 나타낸다. 이때, 모노 신호의 생성에 대해서는 이후 더욱 자세히 설명한다.For example, in the above-mentioned equation (21), the OPD can be modified by multiplying the value of the CLD offset by the value of the second intermediate variable c 1 or the third intermediate variable c 2 which can be determined according to the value of CLD. By adding this CLD offset, the phase of the mono signal, which is the downmix signal of the stereo signal, can be determined. That is, it is possible to increase the size of the left channel signal or the right channel signal only in the calculation of the OPD. This example can be expressed as Equation 23 below. 6 is an example of generating a mono signal by downmixing a stereo signal using an OPD estimation and a CLD offset. That is, the dotted
이때, CLD 오프셋을 추가해도 IPD는 항상 유지될 수 있고, 위상 궤적의 기울기는 CLD 오프셋의 값에 따라 결정될 수 있다. 따라서, CLD 오프셋을 이용하여 위상 불연속성(phase discontinuity)을 제거할 수 있고, 다운믹싱 결과를 왜곡(distortion) 없이 복원하는 것이 가능해진다. 이때, 복호화시에도 CLD 오프셋을 부가하여 다운믹싱된 모노 신호를 없이 업믹싱함으로써, 위상 불연속성을 제거할 수 있다. 복호화에 대해서는 이후 더욱 자세히 설명한다.At this time, even if the CLD offset is added, the IPD can always be maintained and the slope of the phase trajectory can be determined according to the value of the CLD offset. Therefore, the phase discontinuity can be eliminated by using the CLD offset, and the downmixing result can be restored without distortion. At this time, the phase discontinuity can be removed by upmixing the downmixed mono signal by adding the CLD offset even in decoding. Decoding will be described in more detail later.
이러한 CLD 오프셋의 값은 일례로, 가장 큰 차이를 나타내는 IPD 180°를 기준으로, 서로 인접한 프레임간의 차이가 위상 양자화 빈(phase quantization bin)보다 작도록 설정될 수 있다. 코스 양자화(coarse quantization)에서 서로 인접한 프레임간의 차이가 위상 양자화 빈 45°보다 작도록 하기 위해, CLD의 값을 1이라 가정하면 CLD 오프셋은 2의 제곱근을 값으로 가질 수 있다. 또한, 파인 양자화(fine quantization)에서 서로 인접한 프레임간의 차이가 위상 양자화 빈 22.5°보다 작도록 하기 위해, CLD 값을 1이라 가정하면 CLD 오프셋은 1.8477의 값을 가질 수 있다. 이러한 각각의 예는 아래 수학식 23을 이용하여 아래 수학식 24 및 수학식 25와 같이 표현될 수 있다.The value of this CLD offset can be set, for example, so that the difference between adjacent frames is smaller than the phase quantization bin, based on IPD 180 °, which represents the largest difference. Assuming that the value of CLD is 1, the CLD offset can have a square root of 2 so that the difference between adjacent frames in the coarse quantization is less than 45 degrees of phase quantization bin. Also, assuming that the CLD value is 1, the CLD offset may have a value of 1.8477 so that the difference between adjacent frames in fine quantization is smaller than the phase quantization bin 22.5 DEG. Each of these examples can be expressed by the following equations (24) and (25) using the following Equation (23).
여기서, opdipd =180°는 0의 값을 가질 수 있다. Here, opd ipd = 180 may have a value of zero.
또한, 다른 실시예로, 파라미터 수정부(160)는 위상 불연속성이 나타나는 순간 OPD의 값을 수정하여 위상을 변형함으로써, 위상 불연속성을 제거할 수도 있다. 이때, 파라미터 수정부(160)는 현재 프레임의 1프레임 이전 프레임의 OPD 값과 현재 프레임의 OPD 값의 차이가 기선정된 값 이상인 경우, 상기 현재 프레임의 OPD 값을 수정할 수 있다. 예를 들어, 파라미터 수정부(160)는 현재 프레임의 1프레임 이전 프레임의 OPD 값과 현재 프레임의 OPD 값의 차이가 90° 이상인 경우, OPD의 값을 180°만큼 수정함으로써, 위상 불연속성을 제거할 수 있다. 도 7은 OPD 값의 위상을 변형하는 일례를 나타낸 도면이다. 이때, 제1 그래프(710)와 제2 그래프(720)에서 x축은 시간을, y축은 위상 값을 각각 나타낸다. 즉, 제2 그래프(720)에서와 같이 OPD의 위상 불연속성이 나타나는 순간, OPD의 값을 180°만큼 수정함으로써, 위상 불연속성을 제거할 수 있다. 제1 화살표(721) 및 제2 화살표(722)는 OPD의 값을 180°만큼 수정함으로써, OPD의 값이 변경되어 위상 불연속성이 제거된 모습을 나타낸다. 이때, OPD의 값을 180°만큼 수정하기 위해, OPD의 값에 180° (π)를 더해주거나 빼줄 수 있다. 이러한 OPD 값의 수정은 아래 수학식 26과 같이 표현될 수 있다.Further, in another embodiment, the
다운믹싱부(130)는 수정된 위상 파라미터를 통해 상기 멀티 채널 신호를 다운믹싱하여 모노 신호를 생성한다. 즉, 도 1의 파라미터 수정부(160)에서 다운믹싱부(130)로 연결된 점선 화살표와 같이, 수정된 위상 파라미터는 다운믹싱부(130)로 전송될 수 있고, 다운믹싱부(130)는 파라미터 수정부(160)를 통해 전달된 위상 파라미터를 통해 멀티 채널 신호를 다운믹싱하여 모노 신호를 생성할 수 있다. 여기서, 다운믹싱(Down-Mixing)은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 이 때, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 멀티 채널 신호의 부호화 장치(100)에서는 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다. 예를 들어, 모노 신호의 크기는 좌채널 신호 및 우채널 신호의 크기의 평균 값으로 구할 수 있고, 모노 신호의 위상은 좌채널 신호 및 우채널 신호의 위상의 평균 값으로 구할 수 있다. 이때, 파라미터 수정부(160)에 의해 파라미터가 수정됨으로써, 좌채널 신호 및 우채널 신호의 크기 또는 좌채널 신호 및 우채널 신호의 위상이 변화될 수 있고, 이러한 크기 또는 위상이 달라짐에 따라 모노 신호의 크기 및 위상 역시 변화될 수 있다. 또한 다른 실시예로, 다운믹싱부(130)는 상기 IPD 및 상기 OPD에 기초하여 좌채널 신호 및 우채널 신호 각각의 위상을 이동(shift)시킨 뒤 두 채널 신호의 합으로 표현할 수 있다. 이때 모노 신호의 크기를 조정하기 위해 CLD, ICC 에 기초한 gain값이 사용될 수 있다. 이러한 예는 수학식 27과 같이 표현될 수 있다. 이 경우, 도 1의 파라미터 추출부(110)에서 다운믹싱부(130)로 연결된 점선 화살표와 같이 다운믹싱부(130)는 파라미터 추출부(110)로부터 IPD, CLD 및 ICC를 전달받을 수 있다. 즉, IPD, CLD 및 ICC는 파라미터 추출부(110)에서 추출한 복수의 파라미터에 포함될 수 있다.The
비트스트림 생성부(150)는 상기 수정된 위상 파라미터를 제외한 상기 복수의 파라미터 및 상기 생성된 모노 신호를 부호화하여 비트스트림을 생성한다. 이때, 모노 신호는 일례로, 스테레오 신호가 음성(voice) 신호인 경우, CELP(Code Excited Linear Prediction) 방식으로 부호화될 수 있다. 또한, 다른 일례로서, 스테레오 신호가 음악(music) 신호인 경우, 모노 신호는 기존의 MPEG-2/4 AAC나 mp3와 유사한 방법을 사용하여 부호화될 수 있다. The
이때, 수정된 위상 파라미터는 모노 신호와 복수 채널 간의 위상 차에 관한 파라미터인 OPD를 포함할 수 있다. OPD는 다른 파라미터들로부터 추정될 수 있으므로, 본 발명의 다른 실시예에 따르면, 비트스트림 생성부(150)는 추출된 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하고, OPD는 부호화하지 않을 수 있다. 즉, 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 OPD를 부호화하여 전송하지 않음으로써 전송되는 비트스트림의 비트양을 감소시킬 수 있다. OPD의 추정에 대한 보다 상세한 설명은 도 3의 멀티 채널 신호의 복호화 장치(300)에 관한 설명을 참고하기로 한다.At this time, the modified phase parameters may include OPD, which is a parameter related to the phase difference between the mono signal and the plurality of channels. Since OPD can be estimated from other parameters, according to another embodiment of the present invention, the
또한, 비트스트림 생성부(150)는 복수의 파라미터의 부호화에 할당되는 비트양을 감소시키기 위해 추출된 복수의 파라미터를 양자화하고, 양자화된 복수의 파라미터를 부호화할 수 있다. 만약, 비트스트림 생성부(150)가 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하는 경우, 비트스트림 생성부(150)는 CLD, ICC, 및 IPD 만을 양자화하고, 양자화된 CLD, ICC, 및 IPD를 부호화할 수 있다. In addition, the
상기에서 언급한 바와 같이, 멀티 채널 신호의 부호화 장치(100)는 전송되는 비트양을 줄이기 위해 스테레오 신호로부터 모노 신호 및 복수의 파라미터를 추출하고, 추출된 모노 신호 및 추출된 복수의 파라미터를 부호화하여 전송한다. 또한, 상기의 경우에 있어서도, 복수의 파라미터의 전송에 사용되는 비트양을 더욱 줄이기 위해, 멀티 채널 신호의 부호화 장치(100)는 복수의 파라미터 중에서 OPD를 제외한 CLD, ICC, 및 IPD만을 부호화하여 전송할 수 있다. 이때, 스테레오 신호 자체가 부호화되어 전송되는 것이 아니므로, 스테레오 신호의 재생시 음질의 열화가 발생할 수 있다. 따라서, OPD 계산 시 CLD 오프셋을 부가하거나 OPD 값을 수정하여 모노 신호를 생성함으로써, 비트양을 줄임과 동시에 위상 불연속성을 제거하여 음질의 열화를 최소화할 수 있다.As described above, the
다시 도 3을 참조하여, 본 발명의 다른 실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 업믹싱부(340), 및 파라미터 수정부(350)만을 포함할 수 있다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.Referring again to FIG. 3, an
파라미터 수정부(350)는 멀티 채널 신호의 다운믹스 신호인 모노 신호와 멀티 채널 신호간의 위상 차에 관한 파라미터를 수정한다. 여기서, 위상 차에 관한 파라미터는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 통해 추정된 OPD를 포함할 수 있다. 이때, 복수의 파라미터는 복수 채널 간의 에너지 차 파라미터(CLD: Channel Level Differences)를 포함할 수 있고, 파라미터 수정부(350)는 CLD의 값에 CLD 오프셋(offset)을 부가하여 추정된 OPD를 수정할 수 있다.The
또한, 멀티 채널 신호는 복수의 프레임을 포함할 수 있고, 파라미터 수정부(350)는 현재 프레임의 1프레임 이전 프레임의 추정된 OPD 값과 현재 프레임의 추정된 OPD 값의 차이가 기선정된 값 이상인 경우, 현재 프레임의 추정된 OPD 값 수정할 수 있다. 예를 들어, 기선정된 값은 90°를 포함할 수 있고, 이 경우, 파라미터 수정부(350)는 현재 프레임의 1프레임 이전 프레임의 추정된 OPD 값과 현재 프레임의 추정된 OPD 값의 차이가 90° 이상인 경우, 현재 프레임의 OPD 값을 180°만큼 수정할 수 있다.In addition, the multi-channel signal may include a plurality of frames, and the
CLD 오프셋을 부가하거나 인접한 프레임간의 OPD 값의 차이를 통해 OPD를 수정하는 방법에 대해서는 상술하였기에 중복된 설명은 생략한다.The method of adding the CLD offset or modifying the OPD through the difference of the OPD values between adjacent frames has been described above, and a duplicate description will be omitted.
업믹싱부(340)는 수정된 위상 차에 관한 파라미터를 이용하여 모노 신호를 업믹싱한다. 즉, 업믹싱부(340)는 수정된 OPD를 이용하여 모노 신호를 업믹싱하여 위상 불연속성을 제거함으로써, 음질의 열화를 최소화할 수 있다. 모노 신호를 업믹싱하는 방법에 대해서는 이미 자세히 설명하였기에 반복적인 설명은 생략한다.The
이때, 멀티 채널 신호는 도 1을 통해 설명한 멀티 채널 신호의 부호화 장치(100)로부터 부호화된 비트스트림으로서 수신될 수 있고, 다른 실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 이러한 비트스트림에서 모노 신호와 복수의 파라미터를 복원할 수 있다. 이때, 상술한 바와 같이 위상 차에 관한 파라미터 OPD는 복수의 파라미터를 통해 추정될 수 있다. 이와 같이, 비트스트림으로부터 모노 신호를 얻고 OPD를 추정하기 위해, 멀티 채널 신호의 복호화 장치(300)는 멀티 채널 신호의 부호화된 비트스트림으로부터 모노 신호를 복원하는 모노 신호 복호화부(310), 비트스트림으로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 파라미터 복호화부(320) 및 복원된 복수의 파라미터를 이용하여 상기 위상 차에 관한 파라미터로서 OPD(Overall Phase Difference)를 추정하는 파라미터 추정부(330)를 더 포함할 수 있다. In this case, the multi-channel signal may be received as an encoded bit stream from the multi-channel
도 8은 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 방법을 도시한 흐름도이다. 본 실시예에 따른 멀티 채널 신호의 부호화 방법은 상술한 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)에 의해 수행될 수 있다. 도 8에서는 멀티 채널 신호의 부호화 장치(100)에 의해 각각의 단계가 수행되는 과정을 설명함으로써, 멀티 채널 신호의 부호화 방법을 설명한다.8 is a flowchart illustrating a method of encoding a multi-channel signal according to another embodiment of the present invention. The method of encoding a multi-channel signal according to the present embodiment can be performed by the
여기서도, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.Here, the multi-channel signal means a signal of a plurality of channels. In the present specification, each of a plurality of channels included in the multi-channel signal is referred to as a channel signal.
또한, 설명의 편의상 멀티 채널 신호의 부호화 장치(100)에 입력되는 멀티 채널 신호는 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화에도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다. For convenience of explanation, it is assumed that the multi-channel signal input to the multi-channel
단계(810)에서 멀티 채널 신호의 부호화 장치(100)는 스테레오 신호를 구성하는 좌채널 신호와 우채널 신호 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 복수의 파라미터에는 상기에서 언급한 CLD, ICC, IPD, OPD 등이 포함될 수 있다. 여기서, IPD는 좌채널 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다. 또한, OPD는 이후 설명될 모노 신호와 좌채널 신호 또는 모노 신호와 우채널 신호 간의 위상 정보에 관한 위상 파라미터의 일례이다.In
단계(820)에서 멀티 채널 신호의 부호화 장치(100)는 상기 복수의 파라미터 중 상기 복수 채널 간의 위상 정보에 관한 위상 파라미터를 수정한다. 이때, 상기 복수의 파라미터는 상기 복수 채널 간의 에너지 차 파라미터(CLD: Channel Level Differences)를 포함할 수 있고, 멀티 채널 신호의 부호화 장치(100)는 CLD의 값에 CLD 오프셋(offset)을 부가하여 이후 설명될 모노 신호와 상기 복수 채널 간의 위상 차에 관한 파라미터(OPD: Overall Phase Difference)를 수정할 수 있다.In
예를 들어, 상술한 수학식 21에서, CLD의 값에 따라 결정될 수 있는 제2 중간변수 c1 또는 제3 중간 변수 c2의 값에 CLD 오프셋의 값을 곱함으로써, OPD가 수정될 수 있다. 이러한 CLD 오프셋을 추가함으로써, 스테레오 신호의 다운믹스 신호인 모노 신호의 위상을 결정할 수 있다. 즉, OPD의 계산 시에만 좌채널 신호 또는 우채널 신호의 크기를 키워줄 수 있다. 이러한 예는 수학식 23과 같이 표현될 수 있다. OPD 추정 및 CLD 오프셋을 이용하여 스테레오 신호를 다운믹싱하여 모노 신호를 생성하는 방법에 대해서는 도 6을 통한 설명을 참조할 수 있다. 이때, 모노 신호의 생성에 대해서는 이후 더욱 자세히 설명한다.For example, in the above-mentioned equation (21), the OPD can be modified by multiplying the value of the CLD offset by the value of the second intermediate variable c 1 or the third intermediate variable c 2 which can be determined according to the value of CLD. By adding this CLD offset, the phase of the mono signal, which is the downmix signal of the stereo signal, can be determined. That is, it is possible to increase the size of the left channel signal or the right channel signal only in the calculation of the OPD. This example can be expressed as Equation (23). A method for generating a mono signal by downmixing a stereo signal using an OPD estimation and a CLD offset can be described with reference to FIG. Here, the generation of the mono signal will be described in more detail later.
이때, CLD 오프셋을 추가해도 IPD는 항상 유지될 수 있고, 위상 궤적의 기울기는 CLD 오프셋의 값에 따라 결정될 수 있다. 따라서, CLD 오프셋을 이용하여 위상 불연속성(phase discontinuity)을 제거할 수 있고, 다운믹싱 결과를 왜곡(distortion) 없이 복원하는 것이 가능해진다. 이때, 복호화시에도 CLD 오프셋을 부가하여 다운믹싱된 모노 신호를 없이 업믹싱함으로써, 위상 불연속성을 제거할 수 있다. 복호화 방법에 대해서는 이후 더욱 자세히 설명한다. At this time, even if the CLD offset is added, the IPD can always be maintained and the slope of the phase trajectory can be determined according to the value of the CLD offset. Therefore, the phase discontinuity can be eliminated by using the CLD offset, and the downmixing result can be restored without distortion. At this time, the phase discontinuity can be removed by upmixing the downmixed mono signal by adding the CLD offset even in decoding. The decoding method will be described in more detail later.
이러한 CLD 오프셋의 값은 일례로, 가장 큰 차이를 나타내는 IPD 180°를 기준으로, 서로 인접한 프레임간의 차이가 위상 양자화 빈(phase quantization bin)보다 작도록 설정될 수 있다. 코스 양자화(coarse quantization)에서 서로 인접한 프레임간의 차이가 위상 양자화 빈 45°보다 작도록 하기 위해, CLD의 값을 1이라 가정하면 CLD 오프셋은 2의 제곱근을 값으로 가질 수 있다. 또한, 파인 양자화(fine quantization)에서 서로 인접한 프레임간의 차이가 위상 양자화 빈 22.5°보다 작도록 하기 위해, CLD 값을 1이라 가정하면 CLD 오프셋은 1.8477의 값을 가질 수 있다. 이러한 각각의 예는 상술한 수학식 24 및 수학식 25와 같이 표현될 수 있다. The value of this CLD offset can be set, for example, so that the difference between adjacent frames is smaller than the phase quantization bin, based on IPD 180 °, which represents the largest difference. Assuming that the value of CLD is 1, the CLD offset can have a square root of 2 so that the difference between adjacent frames in the coarse quantization is less than 45 degrees of phase quantization bin. Also, assuming that the CLD value is 1, the CLD offset may have a value of 1.8477 so that the difference between adjacent frames in fine quantization is smaller than the phase quantization bin 22.5 DEG. Each of these examples can be expressed as Equations (24) and (25).
또한, 다른 실시예로, 멀티 채널 신호의 부호화 장치(100)는 위상 불연속성이 나타나는 순간 OPD의 값을 수정하여 위상을 변형함으로써, 위상 불연속성을 제거할 수도 있다. 이때, 멀티 채널 신호의 부호화 장치(100)는 현재 프레임의 1프레임 이전 프레임의 OPD 값과 현재 프레임의 OPD 값의 차이가 기선정된 값 이상인 경우, 현재 프레임의 OPD 값을 수정할 수 있다. 예를 들어, 멀티 채널 신호의 부호화 장치(100)는 현재 프레임의 1프레임 이전 프레임의 OPD 값과 현재 프레임의 OPD 값의 차이가 90° 이상인 경우, OPD의 값을 180°만큼 수정함으로써, 위상 불연속성을 제거할 수 있다. 위상을 변형하는 일례는 상술한 도 7의 설명 및 상술한 수학식 26을 참조할 수 있다. Further, in another embodiment, the
단계(830)에서 멀티 채널 신호의 부호화 장치(100)는 수정된 위상 파라미터를 통해 상기 멀티 채널 신호를 다운믹싱하여 모노 신호를 생성한다. 여기서, 다운믹싱(Down-Mixing)은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 이 때, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 멀티 채널 신호의 부호화 장치(100)에서는 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다. 예를 들어, 모노 신호의 크기는 좌채널 신호 및 우채널 신호의 크기의 평균 값으로 구할 수 있고, 모노 신호의 위상은 좌채널 신호 및 우채널 신호의 위상의 평균 값으로 구할 수 있다. 이때, 멀티 채널 신호의 부호화 장치(100)에 의해 파라미터가 수정됨으로써, 좌채널 신호 및 우채널 신호의 크기 또는 좌채널 신호 및 우채널 신호의 위상이 변화될 수 있고, 이러한 크기 또는 위상이 달라짐에 따라 모노 신호의 크기 및 위상 역시 변화될 수 있다. 또한 다른 실시예로, 멀티 채널 신호의 부호화 장치(100)는 IPD 및 OPD에 기초하여 좌채널 신호 및 우채널 신호 각각의 위상을 이동(shift)시킨 뒤 두 채널 신호의 합으로 표현할 수 있다. 이때 모노 신호의 크기를 조정하기 위해 CLD, ICC 에 기초한 gain값이 사용될 수 있다. 이러한 예는 상술한 수학식 27과 같이 표현될 수 있다.In
단계(840)에서 멀티 채널 신호의 부호화 장치(100)는 상기 수정된 위상 파라미터를 제외한 상기 복수의 파라미터 및 상기 생성된 모노 신호를 부호화하여 비트스트림을 생성한다. 이때, 모노 신호는 일례로, 스테레오 신호가 음성(voice) 신호인 경우, CELP(Code Excited Linear Prediction) 방식으로 부호화될 수 있다. 또한, 다른 일례로서, 스테레오 신호가 음악(music) 신호인 경우, 모노 신호는 기존의 MPEG-2/4 AAC나 mp3와 유사한 방법을 사용하여 부호화될 수 있다. In
이때, 수정된 위상 파라미터는 모노 신호와 복수 채널 간의 위상 차에 관한 파라미터인 OPD를 포함할 수 있다. OPD는 다른 파라미터들로부터 추정될 수 있으므로, 본 발명의 다른 실시예에 따르면, 멀티 채널 신호의 부호화 장치(100)는 추출된 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하고, OPD는 부호화하지 않을 수 있다. 즉, 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 OPD를 부호화하여 전송하지 않음으로써 전송되는 비트스트림의 비트양을 감소시킬 수 있다. OPD의 추정에 대한 보다 상세한 설명은 도 3의 멀티 채널 신호의 복호화 장치(300)에 관한 설명을 참고할 수 있다.At this time, the modified phase parameters may include OPD, which is a parameter related to the phase difference between the mono signal and the plurality of channels. OPD can be estimated from other parameters. Therefore, according to another embodiment of the present invention, the multi-channel
또한, 멀티 채널 신호의 부호화 장치(100)는 복수의 파라미터의 부호화에 할당되는 비트양을 감소시키기 위해 추출된 복수의 파라미터를 양자화하고, 양자화된 복수의 파라미터를 부호화할 수 있다. 만약, 멀티 채널 신호의 부호화 장치(100)는 복수의 파라미터 중에서 CLD, ICC, 및 IPD 만을 부호화하는 경우, 멀티 채널 신호의 부호화 장치(100)는 CLD, ICC, 및 IPD 만을 양자화하고, 양자화된 CLD, ICC, 및 IPD를 부호화할 수 있다. In addition, the multi-channel
상기에서 언급한 바와 같이, 멀티 채널 신호의 부호화 장치(100)는 전송되는 비트양을 줄이기 위해 스테레오 신호로부터 모노 신호 및 복수의 파라미터를 추출하고, 추출된 모노 신호 및 추출된 복수의 파라미터를 부호화하여 전송한다. 또한, 상기의 경우에 있어서도, 복수의 파라미터의 전송에 사용되는 비트양을 더욱 줄이기 위해, 멀티 채널 신호의 부호화 장치(100)는 복수의 파라미터 중에서 OPD를 제외한 CLD, ICC, 및 IPD만을 부호화하여 전송할 수 있다. 이때, 스테레오 신호 자체가 부호화되어 전송되는 것이 아니므로, 스테레오 신호의 재생시 음질의 열화가 발생할 수 있다. 따라서, OPD 계산 시 CLD 오프셋을 부가하거나 OPD 값을 수정하여 모노 신호를 생성함으로써, 비트양을 줄임과 동시에 위상 불연속성을 제거하여 음질의 열화를 최소화할 수 있다.As described above, the
도 9는 본 발명의 다른 실시예에 따른 멀티 채널 신호의 복호화 방법을 도시한 흐름도이다. 본 실시예에 따른 멀티 채널 신호의 복호화 방법은 상술한 본 발명의 다른 실시예에 따른 멀티 채널 신호의 복호화 장치(300)에 의해 수행될 수 있다. 도 9에서는 멀티 채널 신호의 복호화 장치(300)에 의해 각각의 단계가 수행되는 과정을 설명함으로써, 멀티 채널 신호의 복호화 방법을 설명한다.9 is a flowchart illustrating a method of decoding a multi-channel signal according to another embodiment of the present invention. The method of decoding a multi-channel signal according to the present embodiment may be performed by the
단계(910)에서 멀티 채널 신호의 복호화 장치(300)는 멀티 채널 신호의 다운믹스 신호인 모노 신호와 멀티 채널 신호간의 위상 차에 관한 파라미터를 수정한다. 여기서, 위상 차에 관한 파라미터는 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 통해 추정된 OPD를 포함할 수 있다. 이때, 복수의 파라미터는 복수 채널 간의 에너지 차 파라미터(CLD: Channel Level Differences)를 포함할 수 있고, 멀티 채널 신호의 복호화 장치(300)는 CLD의 값에 CLD 오프셋(offset)을 부가하여 추정된 OPD를 수정할 수 있다.In
또한, 멀티 채널 신호는 복수의 프레임을 포함할 수 있고, 파라미터 수정부(350)는 현재 프레임의 1프레임 이전 프레임의 추정된 OPD 값과 현재 프레임의 추정된 OPD 값의 차이가 기선정된 값 이상인 경우, 현재 프레임의 추정된 OPD 값 수정할 수 있다. 예를 들어, 기선정된 값은 90°를 포함할 수 있고, 이 경우, 멀티 채널 신호의 복호화 장치(300)는 현재 프레임의 1프레임 이전 프레임의 추정된 OPD 값과 현재 프레임의 추정된 OPD 값의 차이가 90° 이상인 경우, 현재 프레임의 OPD 값을 180°만큼 수정할 수 있다.In addition, the multi-channel signal may include a plurality of frames, and the
CLD 오프셋을 부가하거나 인접한 프레임간의 OPD 값의 차이를 통해 OPD를 수정하는 방법에 대해서는 상술하였기에 중복된 설명은 생략한다.The method of adding the CLD offset or modifying the OPD through the difference of the OPD values between adjacent frames has been described above, and a duplicate description will be omitted.
멀티 채널 신호의 복호화 장치(300)는 수정된 위상 차에 관한 파라미터를 이용하여 모노 신호를 업믹싱한다. 즉, 멀티 채널 신호의 복호화 장치(300)는 수정된 OPD를 이용하여 모노 신호를 업믹싱하여 위상 불연속성을 제거함으로써, 음질의 열화를 최소화할 수 있다. 모노 신호를 업믹싱하는 방법에 대해서는 이미 자세히 설명하였기에 반복적인 설명은 생략한다.The multi-channel
이때, 멀티 채널 신호는 도 1을 통해 설명한 본 발명의 다른 실시예에 따른 멀티 채널 신호의 부호화 장치(100)로부터 부호화된 비트스트림으로서 수신될 수 있고, 다른 실시예에 따른 멀티 채널 신호의 복호화 장치(300)는 이러한 비트스트림에서 모노 신호와 복수의 파라미터를 복원할 수 있다. 이때, 상술한 바와 같이 위상 차에 관한 파라미터 OPD는 복수의 파라미터를 통해 추정될 수 있다. 이와 같이, 비트스트림으로부터 모노 신호를 얻고 OPD를 추정하기 위해, 멀티 채널 신호의 복호화 장치(300)는 멀티 채널 신호의 부호화된 비트스트림으로부터 모노 신호를 복원하는 단계(미도시), 비트스트림으로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 단계(미도시) 및 복원된 복수의 파라미터를 이용하여 위상 차에 관한 파라미터로서 OPD(Overall Phase Difference)를 추정하는 단계(미도시)를 더 포함할 수 있다. In this case, the multi-channel signal may be received as an encoded bit stream from the multi-channel
이와 같이, 본 발명의 실시예들에 따르면, 데이터 전송시 필요한 데이터의 양을 줄일 수 있고, 음질이 향상된 멀티 채널 오디오 신호를 제공할 수 있다.As described above, according to the embodiments of the present invention, it is possible to reduce the amount of data required for data transmission and to provide a multi-channel audio signal with improved sound quality.
또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. In addition, embodiments of the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions recorded on the medium may be those specially designed and configured for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Examples of program instructions, such as magneto-optical and ROM, RAM, flash memory and the like, can be executed by a computer using an interpreter or the like, as well as machine code, Includes a high-level language code. The hardware devices described above may be configured to operate as one or more software modules to perform operations of one embodiment of the present invention, and vice versa.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described with reference to particular embodiments, such as specific elements, and specific embodiments and drawings. However, it should be understood that the present invention is not limited to the above- And various modifications and changes may be made thereto by those skilled in the art to which the present invention pertains. Accordingly, the spirit of the present invention should not be construed as being limited to the embodiments described, and all of the equivalents or equivalents of the claims, as well as the following claims, belong to the scope of the present invention .
300: 복호화 장치
340: 업믹싱부
350: 파라미터 수정부300: Decryption device
340: up mixer
350: parameter modifier
Claims (7)
상기 복원된 복수의 파라미터를 이용하여, 좌채널 신호 및 우채널 신호 중 하나와 상기 스테레오 신호의 다운믹스 신호인 모노 신호 간의 위상 차에 관한 파라미터인 OPD(Overall Phase Difference)를 추정하는 단계; 및
상기 복원된 복수의 파라미터 및 상기 추정된 OPD를 이용하여 상기 모노 신호를 업믹싱하는 단계를 포함하고,
상기 복수의 파라미터는 CLD 및 IPD를 포함하고,
상기 OPD를 추정하는 단계는,
상기 IPD가 180°이고 상기 CLD가 0이면, 상기 OPD를 0으로 추정하는 단계를 포함하는 복호화 방법. Restoring a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting a stereo signal;
Estimating an overall phase difference (OPD), which is a parameter related to a phase difference between one of a left channel signal and a right channel signal and a mono signal as a downmix signal of the stereo signal, using the restored plurality of parameters; And
Upmixing the mono signal using the recovered plurality of parameters and the estimated OPD,
The plurality of parameters including CLD and IPD,
Wherein estimating the OPD comprises:
And estimating the OPD to be 0 if the IPD is 180 and the CLD is zero.
상기 스테레오 신호의 부호화된 비트스트림으로부터 상기 모노 신호를 복원하는 단계를 더 포함하고,
상기 복수의 파라미터를 복원하는 단계는,
상기 비트스트림으로부터 상기 스테레오 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 단계를 포함하는 복호화 방법. The method according to claim 1,
Further comprising restoring the mono signal from an encoded bit stream of the stereo signal,
Wherein the step of restoring the plurality of parameters comprises:
And reconstructing a plurality of parameters indicating a characteristic relationship between a plurality of channels constituting the stereo signal from the bitstream.
상기 OPD를 추정하는 단계는,
상기 IPD가 180°가 아닌 경우, 상기 CLD 및 상기 IPD를 이용하여 상기 추정된 OPD를 수정하는 단계를 포함하고,
상기 수정된 OPD는 상기 추정된 OPD와 0° 사이의 값 또는 상기 추정된 OPD와 -180° 사이의 값 중에서 어느 하나와 대응되는 복호화 방법. The method according to claim 1,
Wherein estimating the OPD comprises:
Modifying the estimated OPD using the CLD and the IPD if the IPD is not 180 [deg.],
Wherein the modified OPD corresponds to one of a value between the estimated OPD and 0 [deg.] Or a value between the estimated OPD and -180 [deg.].
상기 OPD를 추정하는 단계는,
상기 추정된 OPD를 필터링하여 상기 추정된 OPD의 변화량이 감소되도록 상기 추정된 OPD를 수정하는 단계를 포함하는 복호화 방법.The method according to claim 1,
Wherein estimating the OPD comprises:
And modifying the estimated OPD so that the estimated amount of change of the OPD is reduced by filtering the estimated OPD.
상기 추정된 OPD를 수정하는 단계는,
무한 충격 응답 필터(IIR: Infinite Impulse Response)을 이용하여 상기 추정된 OPD를 필터링하는 단계를 포함하는 복호화 방법.The method according to claim 6,
Wherein the modifying the estimated OPD comprises:
And filtering the estimated OPD using an Infinite Impulse Response (IIR).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090023158 | 2009-03-18 | ||
KR20090023158 | 2009-03-18 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100024481A Division KR101650055B1 (en) | 2009-03-18 | 2010-03-18 | Apparatus for encoding/decoding multichannel signal and method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160102364A KR20160102364A (en) | 2016-08-30 |
KR101747307B1 true KR101747307B1 (en) | 2017-06-14 |
Family
ID=42738402
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100024481A KR101650055B1 (en) | 2009-03-18 | 2010-03-18 | Apparatus for encoding/decoding multichannel signal and method thereof |
KR1020160103757A KR101747307B1 (en) | 2009-03-18 | 2016-08-16 | Apparatus for encoding/decoding multichannel signal and method thereof |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100024481A KR101650055B1 (en) | 2009-03-18 | 2010-03-18 | Apparatus for encoding/decoding multichannel signal and method thereof |
Country Status (5)
Country | Link |
---|---|
US (4) | US8666752B2 (en) |
EP (1) | EP2410515B1 (en) |
KR (2) | KR101650055B1 (en) |
CN (2) | CN102428513B (en) |
WO (1) | WO2010107269A2 (en) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101453732B1 (en) * | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | Method and apparatus for encoding and decoding stereo signal and multi-channel signal |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
WO2011039668A1 (en) * | 2009-09-29 | 2011-04-07 | Koninklijke Philips Electronics N.V. | Apparatus for mixing a digital audio |
KR20110116079A (en) * | 2010-04-17 | 2011-10-25 | 삼성전자주식회사 | Apparatus for encoding/decoding multichannel signal and method thereof |
EP2612322B1 (en) * | 2010-10-05 | 2016-05-11 | Huawei Technologies Co., Ltd. | Method and device for decoding a multichannel audio signal |
JP6051621B2 (en) * | 2012-06-29 | 2016-12-27 | 富士通株式会社 | Audio encoding apparatus, audio encoding method, audio encoding computer program, and audio decoding apparatus |
KR20140016780A (en) * | 2012-07-31 | 2014-02-10 | 인텔렉추얼디스커버리 주식회사 | A method for processing an audio signal and an apparatus for processing an audio signal |
AU2013355504C1 (en) * | 2012-12-04 | 2016-12-15 | Samsung Electronics Co., Ltd. | Audio providing apparatus and audio providing method |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
WO2015036350A1 (en) | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
WO2015059153A1 (en) | 2013-10-21 | 2015-04-30 | Dolby International Ab | Parametric reconstruction of audio signals |
CN104240712B (en) * | 2014-09-30 | 2018-02-02 | 武汉大学深圳研究院 | A kind of three-dimensional audio multichannel grouping and clustering coding method and system |
CN104347077B (en) * | 2014-10-23 | 2018-01-16 | 清华大学 | A kind of stereo coding/decoding method |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
JP6804528B2 (en) | 2015-09-25 | 2020-12-23 | ヴォイスエイジ・コーポレーション | Methods and systems that use the long-term correlation difference between the left and right channels to time domain downmix the stereo audio signal to the primary and secondary channels. |
CN107452387B (en) * | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | A kind of extracting method and device of interchannel phase differences parameter |
CN107731238B (en) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | Coding method and coder for multi-channel signal |
CN108182947B (en) * | 2016-12-08 | 2020-12-15 | 武汉斗鱼网络科技有限公司 | Sound channel mixing processing method and device |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
US10224045B2 (en) * | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
CN108877815B (en) * | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | Stereo signal processing method and device |
CN109215668B (en) * | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | Method and device for encoding inter-channel phase difference parameters |
CN109859766B (en) * | 2017-11-30 | 2021-08-20 | 华为技术有限公司 | Audio coding and decoding method and related product |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
US6181394B1 (en) * | 1999-01-22 | 2001-01-30 | White Electronic Designs, Corp. | Super bright low reflection liquid crystal display |
WO2003019820A1 (en) * | 2001-08-31 | 2003-03-06 | Samsung Electronics Co., Ltd | Apparatus and method for transmitting and receiving forward channel quality information in a mobile communication system |
US20050228648A1 (en) * | 2002-04-22 | 2005-10-13 | Ari Heikkinen | Method and device for obtaining parameters for parametric speech coding of frames |
EP1500083B1 (en) * | 2002-04-22 | 2006-06-28 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
JP4431568B2 (en) * | 2003-02-11 | 2010-03-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Speech coding |
EP1914722B1 (en) * | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
KR100561869B1 (en) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | Lossless audio decoding/encoding method and apparatus |
EP1768107B1 (en) | 2004-07-02 | 2016-03-09 | Panasonic Intellectual Property Corporation of America | Audio signal decoding device |
JP4794448B2 (en) * | 2004-08-27 | 2011-10-19 | パナソニック株式会社 | Audio encoder |
JP4936894B2 (en) * | 2004-08-27 | 2012-05-23 | パナソニック株式会社 | Audio decoder, method and program |
SE0402650D0 (en) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding or spatial audio |
EP2138999A1 (en) * | 2004-12-28 | 2009-12-30 | Panasonic Corporation | Audio encoding device and audio encoding method |
WO2007043388A1 (en) * | 2005-10-07 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | Acoustic signal processing device and acoustic signal processing method |
WO2007106553A1 (en) | 2006-03-15 | 2007-09-20 | Dolby Laboratories Licensing Corporation | Binaural rendering using subband filters |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
WO2008002098A1 (en) * | 2006-06-29 | 2008-01-03 | Lg Electronics, Inc. | Method and apparatus for an audio signal processing |
RU2551797C2 (en) * | 2006-09-29 | 2015-05-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Method and device for encoding and decoding object-oriented audio signals |
JP4838361B2 (en) * | 2006-11-15 | 2011-12-14 | エルジー エレクトロニクス インコーポレイティド | Audio signal decoding method and apparatus |
FR2911020B1 (en) | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | AUDIO CODING METHOD AND DEVICE |
EP2111616B1 (en) * | 2007-02-14 | 2011-09-28 | LG Electronics Inc. | Method and apparatus for encoding an audio signal |
JP5220840B2 (en) | 2007-03-30 | 2013-06-26 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | Multi-object audio signal encoding and decoding apparatus and method for multi-channel |
KR101453732B1 (en) | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | Method and apparatus for encoding and decoding stereo signal and multi-channel signal |
KR101505831B1 (en) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | Method and Apparatus of Encoding/Decoding Multi-Channel Signal |
US8346379B2 (en) | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
KR101600352B1 (en) * | 2008-10-30 | 2016-03-07 | 삼성전자주식회사 | / method and apparatus for encoding/decoding multichannel signal |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
PL2394268T3 (en) * | 2009-04-08 | 2014-06-30 | Fraunhofer Ges Forschung | Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing |
KR101710113B1 (en) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | Apparatus and method for encoding/decoding using phase information and residual signal |
US9112591B2 (en) * | 2010-04-16 | 2015-08-18 | Samsung Electronics Co., Ltd. | Apparatus for encoding/decoding multichannel signal and method thereof |
-
2010
- 2010-03-17 US US12/659,696 patent/US8666752B2/en active Active
- 2010-03-18 US US13/257,229 patent/US8537913B2/en active Active
- 2010-03-18 CN CN2010800220317A patent/CN102428513B/en active Active
- 2010-03-18 WO PCT/KR2010/001698 patent/WO2010107269A2/en active Application Filing
- 2010-03-18 CN CN201310465155.8A patent/CN103559884B/en active Active
- 2010-03-18 EP EP10753719.3A patent/EP2410515B1/en active Active
- 2010-03-18 KR KR1020100024481A patent/KR101650055B1/en active IP Right Grant
-
2012
- 2012-05-04 US US13/464,509 patent/US8767850B2/en active Active
-
2014
- 2014-03-03 US US14/195,045 patent/US9384740B2/en active Active
-
2016
- 2016-08-16 KR KR1020160103757A patent/KR101747307B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
CN102428513A (en) | 2012-04-25 |
WO2010107269A2 (en) | 2010-09-23 |
US20120069921A1 (en) | 2012-03-22 |
US20120221343A1 (en) | 2012-08-30 |
KR20100105496A (en) | 2010-09-29 |
CN102428513B (en) | 2013-11-06 |
EP2410515A2 (en) | 2012-01-25 |
KR101650055B1 (en) | 2016-08-23 |
CN103559884A (en) | 2014-02-05 |
US8537913B2 (en) | 2013-09-17 |
US20140177849A1 (en) | 2014-06-26 |
US8767850B2 (en) | 2014-07-01 |
EP2410515A4 (en) | 2013-11-27 |
KR20160102364A (en) | 2016-08-30 |
US8666752B2 (en) | 2014-03-04 |
WO2010107269A3 (en) | 2010-12-29 |
US20100241436A1 (en) | 2010-09-23 |
CN103559884B (en) | 2016-06-22 |
US9384740B2 (en) | 2016-07-05 |
EP2410515B1 (en) | 2018-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101747307B1 (en) | Apparatus for encoding/decoding multichannel signal and method thereof | |
JP6740496B2 (en) | Apparatus and method for outputting stereo audio signal | |
JP6407928B2 (en) | Audio processing system | |
EP3279893B1 (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
US7328161B2 (en) | Audio decoding method and apparatus which recover high frequency component with small computation | |
KR20090083070A (en) | Method and apparatus for encoding/decoding audio signal using adaptive lpc coefficient interpolation | |
KR102426965B1 (en) | Decoding method and decoder for dialog enhancement | |
KR20170017873A (en) | Audio signal processing apparatus and method, encoding apparatus and method, and program | |
JP6179122B2 (en) | Audio encoding apparatus, audio encoding method, and audio encoding program | |
RU2799737C2 (en) | Audio upmixing device with the possibility of operating in the mode with/without prediction | |
KR101873771B1 (en) | Apparatus for encoding/decoding multichannel signal and method thereof | |
KR101709690B1 (en) | Method for decoding multichannel signal | |
KR101613979B1 (en) | Method for decoding multichannel signal | |
KR101567665B1 (en) | Pesrsonal audio studio system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |