KR20160042104A - 조인트 멀티채널 코딩을 위한 방법들 및 장치들 - Google Patents
조인트 멀티채널 코딩을 위한 방법들 및 장치들 Download PDFInfo
- Publication number
- KR20160042104A KR20160042104A KR1020167006428A KR20167006428A KR20160042104A KR 20160042104 A KR20160042104 A KR 20160042104A KR 1020167006428 A KR1020167006428 A KR 1020167006428A KR 20167006428 A KR20167006428 A KR 20167006428A KR 20160042104 A KR20160042104 A KR 20160042104A
- Authority
- KR
- South Korea
- Prior art keywords
- channel
- stereo
- channels
- pair
- decoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 68
- 230000011664 signaling Effects 0.000 claims description 12
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 description 27
- 239000011159 matrix material Substances 0.000 description 20
- 238000001228 spectrum Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Quality & Reliability (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
적어도 네 개의 채널들을 갖는 오디오 시스템의 채널들을 인코딩하기 위한 인코딩 및 디코딩 장치들이 개시된다. 디코딩 장치는 제 1 쌍의 입력 채널들을 제 1 스테레오 디코딩하는 제 1 스테레오 디코딩 구성요소, 및 제 2 쌍의 입력 채널들을 제 2 스테레오 디코딩하는 제 2 스테레오 디코딩 구성요소를 갖는다. 상기 제 1 및 제 2 스테레오 디코딩 구성요소들의 결과들은 제 3 및 제 4 스테레오 디코딩 구성요소와 교차형식으로 결합되고, 제 3 및 제 4 스테레오 디코딩 구성요소 각각은 상기 제 1 스테레오 디코딩 구성요소로 인한 한 채널에 대한 스테레오 디코딩 및 상기 제 2 스테레오 디코딩 구성요소로 인한 한 채널에 대한 스테레오 디코딩을 수행한다.
Description
관련 출원들에 대한 상호 참조
본 출원은 2013년 9월 12일에 출원된 미국 가 특허 출원 제 61/877,189에 대한 우선권을 주장하며, 그 전체가 참조로 본 명세서에 구비되어 있다.
본 명세서에 개시된 본 발명은 오디오 인코딩 및 디코딩에 관한 것이다. 특히, 본 발명은 복수의 스테레오 변환을 수행함으로써 멀티채널 오디오 시스템의 채널들을 인코딩 및 디코딩하도록 적응된 오디오 인코더 및 오디오 디코더에 관한 것이다.
멀티채널 오디오 시스템의 채널들을 인코딩하기 위한 종래 기술들이 있다. 멀티채널 오디오 시스템의 예는 센터 채널(C), 좌측 전방 채널(Lf), 우측 전방 채널(Rf), 좌측 서라운드 채널(Ls), 우측 서라운드 채널(Rs) 및 저주파수 효과(LfE) 채널을 구비하는 5.1 채널 시스템이 있다. 이러한 시스템을 코딩하는 기존 방식은 센터 채널 C를 별도로 코딩하고, 전방 채널들(Lf 및 Rf)의 조인트 스테레오 코딩 및 서라운드 채널들(Ls 및 Rs)의 조인트 스테레오 코딩을 수행하는 것이다. Lfe 채널이 또한 별도로 코딩되고, 이하에서 항상 별도로 코딩되는 것으로 가정할 것이다.
기존의 접근 방식에는 몇 가지의 단점들이 있다. 예를 들어, Lf 및 Ls 채널이 유사한 볼륨의 유사한 오디오 신호를 구비하는 상황을 가정한다. 그러한 오디오 시호는 마치 Lf 및 Ls 스피커들 사이에 위치되는 가상 음원에서 오는 경우와 같은 들리게 될 것이다. 하지만 상기 기술한 접근 방식은, Lf 및 Ls 채널의 조인트 코딩을 수행하는 대신에 Lf 채널이 Rf 채널로 코딩되도록 규정하고 있기 때문에, 그러한 오디오 신호를 효과적으로 코딩할 수 없다. 따라서, 효율적인 코딩을 달성하기 위해, Lf 및 Ls 스피커들의 오디오 신호 간의 유사성이 활용될 수 없다.
따라서, 멀티채널 코딩 시스템에 있어서는 증가된 유연성을 갖는 인코딩/디코딩 구조에 대한 필요성이 있다.
이러한 관점에서, 본 발명의 목적은 멀티채널 오디오 시스템의 채널들의 유연하고 효율적인 코딩을 제공하는 인코딩 장치 및 디코딩 장치 및 그 연관 방법들을 제공하는 것을 목적으로 한다.
본 발명은 상기한 필요성을 위해 청구범위에 제시된 바와 같은 구성 및/또는 방법을 제공하며, 본 발명은 또한 청구범위에 구비되는 다양한 수정 및/또는 변경들을 포괄한다.
다음으로, 예시적인 실시예들이 첨부된 도면들을 참조하여 보다 상세히 설명될 것이다.
도 1a는 예시적인 2-채널 셋업을 도시한 도면.
도 1b 및 1c는 예에 따른 스테레오 인코딩 및 디코딩 구성요소들을 도시하는 도면.
도 2a는 예시적인 3-채널 셋업을 도시한 도면.
도 2b 및 도 2c는 예에 따른 3-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 3a는 예시적인 4-채널 셋업을 도시한 도면.
도 3b 및 도 3c는 예시적인 실시예에 따라 4-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 4a는 예시적인 5-채널 셋업을 도시한 도면.
도 4b 및 도 4c는 예시적인 실시예에 따라 5-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 5a는 예시적인 멀티-채널 셋업을 도시한 도면.
도 5b 및 도 5c는 예시적인 실시예에 따라 멀티-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 6a, 도 6b, 도 6c, 도 6d 및 도 6e는 예에 따라 5-채널 오디오 시스템의 코딩 구성을 도시한 도면.
도 7은 실시예에 따른 디코딩 장치를 도시한 도면.
도 1a는 예시적인 2-채널 셋업을 도시한 도면.
도 1b 및 1c는 예에 따른 스테레오 인코딩 및 디코딩 구성요소들을 도시하는 도면.
도 2a는 예시적인 3-채널 셋업을 도시한 도면.
도 2b 및 도 2c는 예에 따른 3-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 3a는 예시적인 4-채널 셋업을 도시한 도면.
도 3b 및 도 3c는 예시적인 실시예에 따라 4-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 4a는 예시적인 5-채널 셋업을 도시한 도면.
도 4b 및 도 4c는 예시적인 실시예에 따라 5-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 5a는 예시적인 멀티-채널 셋업을 도시한 도면.
도 5b 및 도 5c는 예시적인 실시예에 따라 멀티-채널 셋업에 대한 인코딩 장치 및 디코딩 장치를 각각 도시한 도면.
도 6a, 도 6b, 도 6c, 도 6d 및 도 6e는 예에 따라 5-채널 오디오 시스템의 코딩 구성을 도시한 도면.
도 7은 실시예에 따른 디코딩 장치를 도시한 도면.
I. 개요 - 인코더
제 1 양태에 따르면, 멀티채널 오디오 시스템의 인코딩 방법, 인코딩 장치 및 컴퓨터 프로그램 제품이 제공된다.
예시적인 실시예들에 따르면, 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 인코딩 방법이 제공되며, 상기 인코딩 방법은: 제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하는 단계; 상기 제 1 쌍의 입력 채널들을 제 1 스테레오 인코딩하는 단계; 상기 제 2 쌍의 입력 채널들을 제 2 스테레오 인코딩하는 단계; 제 1 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널을 제 3 스테레오 인코딩하는 단계; 제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 2 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 2 채널을 제 4 스테레오 인코딩하는 단계; 및 상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하는 단계를 구비한다.
상기 제 1 쌍 및 상기 제 2 쌍의 입력 채널들은 인코딩될 채널들에 대응한다. 상기 제 1 쌍 및 상기 제 2 쌍의 출력 채널들은 인코딩된 채널들에 대응한다.
Lf 채널, Rf 채널, Ls 채널 및 Rs 채널을 구비하는 예시적인 오디오 시스템을 고려한다. Lf 채널 및 Ls 채널이 제 1 쌍의 입력 채널들과 연관되고, Rf 채널 및 Rs 채널이 제 2 쌍의 입력 채널들과 연관되는 경우, 상술한 예시적인 실시예는, 상기 Lf 및 Ls 채널들이 공동으로 코딩되고, 상기 Rf 및 Rs 채널들이 공동으로 코딩된다는 것을 내포하고 있다. 즉, 상기 채널들은 먼저 전-후 방향(a front-back direction)으로 코딩된다. 상기 제 1(전-후) 코딩의 결과는 이후 다시 코딩되며, 이는 코딩이 좌-우 방향(left-right direction)으로 적용된다는 것을 의미한다.
또 다른 옵션은 상기 Lf 채널 및 상기 Rf 채널을 상기 제 1 쌍의 입력 채널들과 연관시키고, 상기 Ls 채널 및 상기 Rs 채널을 상기 제 2 쌍의 입력 채널들과 연관시키는 것이다. 이러한 채널들의 매핑(mapping)은, 먼저 상기 좌-우 방향의 코딩이 상기 전-후 방향의 코딩에 앞서 실행된다는 것을 내포하고 있다.
다시 말해서, 상기 인코딩 방법은 멀티채널 시스템의 채널들을 공동으로 코딩하는 방법에 대한 유연성을 증가시킨다.
예시적인 실시예들에 따르면, 상기 제 2 스테레오 인코딩으로 인한 상기 제 1 채널과 연관된 오디오 채널은 상기 제 2 스테레오 인코딩으로 인한 제 1 채널이 된다. 이러한 실시예는 4-채널 셋업에 대한 코딩을 수행할 때 효과적이다.
다른 예시적인 실시예들에 따라, 상기 제 1 스테레오 인코딩으로 인한 제 2 채널은 또한 상기 제 4 스테레오 인코딩에 적용되기 전에 코딩된다. 예를 들어, 상기 인코딩 방법은: 제 5 입력 채널을 수신하는 단계; 및 상기 제 5 입력 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 1 채널을 제 5 스테레오 인코딩하는 단계를 더 구비하며; 상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널은 상기 제 5 스테레오 인코딩으로 인한 제 1 채널이고; 상기 제 5 스테레오 인코딩으로 인한 제 2 채널은 제 5 출력 채널로서 출력된다.
이러한 방식으로, 상기 제 5 입력 채널은 그에 따라 상기 제 1 스테레오 인코딩으로 인한 제 2 채널 코딩과 공동으로 코딩된다. 예를 들어, 상기 제 5 입력 채널은 센터 채널에 대응할 수 있고, 상기 제 1 스테레오 인코딩으로 인한 제 2 채널은 상기 Rf 및 Rs 채널들의 조인트 코딩 또는 Lf 및 Ls 채널들의 조인트 코딩에 대응할 수 있다. 즉, 실시예들에 따라서, 상기 센터 채널 C는 상기 채널 셋업의 좌측 또는 우측에 대하여 공동으로 코딩될 수 있다.
상기 개시된 예시적인 실시예들은 네 개 또는 다섯 개의 채널들을 구비하는 오디오 시스템들에 관한 것이다. 그러나, 여기에 개시된 원리는 여섯 개의 채널들, 일곱 개의 채널들 등으로 확장될 수 있다. 특히, 추가 쌍의 입력 채널들이 6 채널 셋업에 도달하도록 4 채널 셋업에 추가될 수 있다. 마찬가지로, 추가 쌍의 입력 채널들이 7 채널 셋업 등에 도달하도록 5 채널 셋업에 추가 될 수 있다.
특히, 예시적인 실시예들에 따라, 상기 인코딩 방법은: 제 3 쌍의 입력 채널들을 수신하는 단계; 상기 제 1 쌍의 입력 채널들의 제 2 채널 및 상기 제 3 쌍의 입력 채널들 제 1 채널을 제 6 스테레오 인코딩하는 단계; 상기 제 2 쌍의 입력 채널들의 제 2 채널 및 상기 제 3 쌍의 입력 채널들 제 2 채널을 제 7 스테레오 인코딩하는 단계; 상기 제 6 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 1 쌍의 입력 채널들의 제 1 채널이 상기 제 1 스테레오 인코딩에 적용되고, 상기 제 7 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 2 쌍의 입력 채널들의 제 1 채널이 상기 제 2 스테레오 인코딩에 적용되며; 및 제 3 쌍의 출력 채널들을 획득하기 위해 상기 제 6 스테레오 인코딩으로 인한 제 2 채널 및 상기 제 7 스테레오 인코딩으로 인한 제 2 채널을 제 8 스테레오 인코딩하는 단계를 더 구비할 수 있다.
상기한 구성은 채널 셋업에 추가적인 채널 쌍들을 추가하는데 있어 유연한 접근 방법을 제공한다.
예시적인 실시예들에 따라, 상기 제 1, 제 2, 제 3 및 제 4 스테레오 인코딩 및 상기 제 5, 제 6, 제 7 및 제 8 스테레오 인코딩은 적용 가능할 때, 좌-우 코딩(LR-코딩), 합-차 코딩(또는 중간-측(mid-side) 코딩, MS-코딩), 및 향상된 합-차 코딩(또는, 를 구비하는 코딩 방식에 따른 스테레오 인코딩을 수행 구비 요컨대 차분 인코딩(또는 향상된 중간-측 코딩, 향상된 MS-코딩)을 포함하는 코딩 방식에 따른 스테레오 인코딩을 수행하는 단계를 구비한다.
이러한 것은 상기한 바가 상기 시스템의 유연성에 더 추가한다는 점에서 유익하다. 특히, 상이한 유형들의 코딩 방식들을 선택함으로써, 상기 코딩이 상기 오디오 신호들에 대한 코딩을 거의 최적화하도록 적응될 수 있다.
다른 코딩 방식은 아래에서 보다 상세하게 설명한다. 그러나, 간략하게, 좌-우 코딩은 입력 신호들이 통과되는 것(출력 신호들이 입력 신호들과 동일)을 의미한다. 합-차 코딩은 상기 출력 신호들 중 하나가 상기 입력 신호들의 합을 의미하고, 다른 출력 신호가 입력 신호들의 차인 것을 의미한다. 향상된 MS-코딩은 출력 신호들 중 하나가 상기 입력 신호들의 가중 합이고, 다른 출력 신호가 상기 입력 신호들의 가중된 차인 것을 의미한다.
상기 제 1, 제 2, 제 3 및 제 4 스테레오 인코딩과 상기 제 5, 제 6, 제 7 및 제 8 스테레오 인코딩은 적용 가능할 때, 모두 동일한은 스테레오 코딩 방식을 적용할 수 있다. 그러나, 상기 제 1, 제 2, 제 3 및 제 4 스테레오 인코딩과 상기 제 5, 제 6, 제 7 및 제 8 스테레오 인코딩 적용 가능할 때, 다른 스테레오 코딩 방식을 역시 적용할 수 있다.
예시적인 실시예에 따라, 상이한 코딩 방식들이 상이한 주파수 대역들에 대해 사용될 수 있다. 이러한 방식으로, 코딩은 상이한 주파수 대역들에서의 오디오 콘텐츠에 대하여 최적화될 수 있다. 예를 들어,(코딩에 소요되는 비트 수의 관점에서) 더 정교한 코딩이 귀에 가장 민감한 저주파수 대역들에 적용될 수 있다.
예시적인 실시예에 따라, 상이한 코딩 방식들이 상이한 시간의 프레임들에 대해 사용될 수 있다. 따라서, 상기 코딩은 상이한 시간 프레임들에서의 오디오 콘텐츠에 대하여 적응되고 최적화될 수 있다.
상기 제 1, 상기 제 2, 상기 제 3, 상기 제 4 및 상기 제 5, 상기 제 6, 상기 제 7, 상기 제 8 스테레오 인코딩은 적용 가능할 경우, 임계적으로 샘플링된 수정 이산 코사인 변환(MDCT) 도메인에서 수행된다. 임계적으로 샘플링된다(critically sampled)는 것은 상기 코딩된 신호들의 샘플들의 수가 원래 신호들의 샘플들의 수와 동일하다는 것을 의미한다.
MDCT는 윈도우 시퀀스에 기초하여 신호를 시간 도메인으로부터 MDCT 도메인으로 변환한다. 일부 특별한 경우들을 제외하고, 입력 채널들은 윈도우 크기 및 변환 길이 양쪽 모두와 관련하여 동일한 윈도우를 사용하여 MDCT 도메인으로 변환된다. 이러한 것은 스테레오 코딩이 신호들의 중간-측 및 향상된 MS-코딩을 적용할 수 있게 한다.
예시적인 실시예들은 또한 상기 개시된 인코딩 방법을 수행하기 위한 지시들을 갖는 컴퓨터 판독 가능 매체를 구비하는 컴퓨터 프로그램 제품에 관한 것이다. 상기 컴퓨터 판독 가능 매체는 비-일시적 컴퓨터 판독 가능 매체일 수 있다.
예시적인 실시예들에 따라, 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 인코딩 장치가 제공되며, 상기 인코딩 장치는: 제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하도록 구성된 수신 구성요소; 상기 제 1 쌍의 입력 채널들을 제 1 스테레오 인코딩하도록 구성된 제 1 스테레오 인코딩 구성요소; 상기 제 2 쌍의 입력 채널들을 제 2 스테레오 인코딩하도록 구성된 제 2 스테레오 인코딩 구성요소; 제 1 쌍의 출력 채널들을 제공하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널을 제 3 스테레오 인코딩하도록 구성된 제 3 스테레오 인코딩 구성요소; 제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 2 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 2 채널을 제 4 스테레오 인코딩하도록 구성된 제 4 스테레오 인코딩 구성요소; 및 상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하도록 구성된 출력 구성요소를 구비한다.
예시적인 실시예들은 또한 상술한 바에 따른 인코딩 장치를 구비하는 오디오 시스템을 제공한다.
II. 개요 - 디코더
제 2 양태에 따라, 멀티채널 오디오 시스템에서의 디코딩 방법, 디코딩 장치 및 컴퓨터 프로그램 제품이 제공된다.
제 2 양태는 일반적으로 제 1 태양과 동일한 특징들 및 효과들을 가질 수 있다.
예시적인 실시예에 따라, 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 디코딩 방법이 제공되며, 상기 디코딩 방법은: 제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하는 단계; 상기 제 1 쌍의 입력 채널들을 제 1 스테레오 디코딩하는 단계; 상기 제 2 쌍의 입력 채널들을 제 2 스테레오 디코딩하는 단계; 제 1 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 1 채널을 제 3 스테레오 디코딩하는 단계; 제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 2 채널을 제 4 스테레오 디코딩하는 단계; 및 상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하는 단계를 구비한다.
상기 제 1 및 상기 제 2 쌍의 입력 채널들은 디코딩될 인코딩된 채널들에 대응한다. 상기 제 1 및 상기 제 2 쌍의 출력 채널들은 디코딩된 채널들에 대응한다.
예시적인 실시예들에 따라, 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널은 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 동일 할 수 있다.
예를 들어, 상기 방법은: 제 5 입력 채널을 수신하는 단계; 및 상기 제 5 입력 채널 및 상기 제 1 스테레오 디코딩으로 인한 제 2 채널을 제 5 스테레오 디코딩하는 단계를 더 구비하며; 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널은 상기 제 5 스테레오 디코딩으로 인한 제 1 채널과 동일하고; 상기 제 5 스테레오 디코딩으로 인한 제 2 채널은 제 5 출력 채널로서 출력된다.
상기 디코딩 방법은: 제 3 쌍의 입력 채널들을 수신하는 단계; 상기 제 3 쌍 또는 입력 채널들을 제 6 스테레오 디코딩하는 단계; 상기 제 1 쌍의 출력 채널들의 제 2 채널 및 제 6 스테레오 디코딩으로 인한 제 1 채널을 제 7 스테레오 디코딩하는 단계; 상기 제 2 쌍의 출력 채널들의 제 2 채널 및 상기 제 6 디코딩으로 인한 제 2 채널을 제 8 스테레오 디코딩하는 단계; 및 상기 제 1 쌍의 출력 채널들의 제 1 채널, 제 7 스테레오 디코딩으로 인한 채널들의 쌍, 상기 제 2 쌍의 출력 채널들의 제 1 채널 및 상기 제 8 스테레오 디코딩으로 인한 채널들의 쌍을 출력하는 단계를 더 구비한다.
예시적인 실시예들에 따라, 상기 제 1, 제 2, 제 3 및 제 4 스테레오 디코딩 및 상기 제 5, 제 6, 제 7 및 제 8 스테레오 디코딩은 적용 가능할 때, 좌-우 코딩, 합-차 코딩 및 향상된 합-차 코딩을 포함하는 코딩 방식에 따른 스테레오 디코딩을 수행하는 단계를 구비한다.
상이한 코딩 방식들이 상이한 주파수 대역들에 대해 사용된다. 상이한 코딩 방식들은 상이한 시간 프레임들에 대해 사용될 수 있다.
상기 제 1, 상기 제 2, 상기 제 3, 상기 제 4 및 상기 제 5, 상기 제 6, 상기 제 7, 상기 제 8 스테레오 디코딩은 적용 가능할 경우, 임계적으로 샘플링된 수정 이산 코사인 변환(MDCT) 도메인에서 바람직하게 수행된다. 바람직하게, 모든 입력 채널들은 윈도우 형태 및 변환 길이 양쪽 모두와 관련하여 동일한 윈도우를 사용하여 MDCT 도메인으로 변환된다.
상기 제 2 쌍의 입력 채널들은 제 1 주파수 임계값까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 가질 수 있으며, 그에 따라 제 2 스테레오 디코딩으로 인한 채널들의 쌍은 상기 제 1 주파수 임계값 이상의 주파수 대역들에 대해 0과 같게 된다. 예를 들어, 상기 제 2 쌍의 입력 채널들의 스펙트럼 콘텐트는 디코더로 전송될 데이터의 양을 감소하기 위해 상기 인코더 측에서 0으로 설정될 수도 있다.
상기 제 2 쌍의 입력 채널들이 제 1 주파수 임계값까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트만을 갖고, 상기 제 1 쌍의 입력 채널들이 상기 제 1 주파수 임계값보다 큰 제 2 주파수 임계값까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 갖는 경우에, 상기 방법은 상기 제 2 쌍의 입력 채널들의 주파수 한계를 보상하기 위해 상기 제 1 주파수 이상의 주파수들에 대한 파라메트릭 업-믹싱 기술(parametric upmixing techniques)을 적용할 수 있다. 특히, 상기 방법은: 상기 제 1 쌍의 출력 채널들을 제 1 합 신호 및 제 1 차 신호로서 나타내고, 상기 제 2 쌍의 출력 채널들을 제 2 합 신호 및 제 2 차 신호로서 나타내는 단계; 고 주파수 재구성을 수행함으로써 상기 제 2 주파수 임계값 이상의 주파수 범위까지 상기 제 1 합 신호 및 상기 제 2 합 신호를 확장하는 단계; 상기 제 1 합 신호와 상기 제 1 차 신호를 믹싱하는 단계로서, 상기 제 1 주파수 임계값 아래의 주파수들에 대해 상기 믹싱 단계는 상기 제 1 합 및 상기 제 1 차 신호의 역의 합-및-차 변환을 수행하는 단계를 구비하고, 상기 제 1 주파수 임계값 이상의 주파수들에 대해 상기 믹싱 단계는 상기 제 1 주파수 임계값 이상의 주파수 대역들에 대응하는 제 1 합 신호의 일부의 파라메트릭 업-믹싱을 수행하는 단계를 구비하는, 상기 믹싱 단계; 및 상기 제 2 합 신호와 상기 제 2 차 신호를 믹싱하는 단계로서, 상기 제 1 주파수 임계값 아래의 주파수들에 대해 상기 믹싱 단계는 상기 제 2 합 및 상기 제 2 차 신호의 역의 합-및-차 변환을 수행하는 단계를 구비하고, 상기 제 1 주파수 임계값 이상의 주파수들에 대해 상기 믹싱 단계는 상기 제 1 주파수 임계값 이상의 주파수 대역들에 대응하는 제 2 합 신호의 일부의 파라메트릭 업-믹싱을 수행하는 단계를 구비하는, 상기 믹싱 단계를 구비할 수 있다.
상기 제 2 주파수 임계값 이상의 주파수 범위까지 상기 제 1 합 신호 및 상기 제 2 합 신호를 확장하는 단계, 상기 제 1 합 신호와 상기 제 1 차 신호를 믹싱하는 단계, 및 상기 제 2 합 신호와 상기 제 2 차 신호를 믹싱하는 단계는 바람직하게 QMF(quadrature mirror filter) 도메인에서 수행된다. 이러한 것은 일반적으로 MDCT 도메인에서 수행되는 상기 제 1, 제 2, 제 3 및 제 4 스테레오 디코딩과는 대조적이다. 예시적인 실시예들에 따라, 상기한 본 실시예들 중 어느 한 실시예의 방법을 수행하기 위한 지시들을 구비하는 컴퓨터 판독 가능 매체를 구비하는 컴퓨터 프로그램 제품이 제공된다. 컴퓨터 판독 가능 매체는, 비-일시적 컴퓨터 판독 가능 매체일 수 있다.
예시적인 실시예들에 따라, 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 디코딩 장치가 제공되며, 상기 디코딩 장치는: 제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하도록 구성된 수신 구성요소; 상기 제 1 쌍의 입력 채널들을 제 1 스테레오 디코딩하도록 구성된 제 1 스테레오 디코딩 구성요소; 상기 제 2 쌍의 입력 채널들을 제 2 스테레오 디코딩하도록 구성된 제 2 스테레오 디코딩 구성요소; 제 1 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 1 채널을 제 3 스테레오 디코딩하도록 구성된 제 3 스테레오 디코딩 구성요소; 제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 2 채널을 제 4 스테레오 디코딩하도록 구성된 제 4 스테레오 디코딩 구성요소; 및 상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하도록 구성된 출력 구성요소를 구비한다.
예시적인 실시예들에 따라, 상기한 바에 따른 디코딩 장치를 구비하는 오디오 시스템이 제공된다.
III. 개요 - 시그널링 포맷
제 3 양태에 따라, 멀티채널 오디오 시스템의 오디오 콘텐트를 나타내는 신호를 디코딩할 때 사용하는 코딩 구성을 인코더에 의해 디코더에 나타내기 위한 시그널링 포맷(signaling format)이 제공되며, 상기 멀티채널 오디오 시스템은 적어도 네 개의 채널들을 구비하며, 상기 적어도 네 개의 오디오 채널들은 복수의 구성들에 따라 상이한 그룹들로 분할 가능하고, 각각의 그룹은 공동으로 인코딩되는 채널들에 대응하며, 상기 시그널링 포맷은 상기 디코더에 의해 적용될 상기 복수의 구성들 중 하나를 나타내는 적어도 두 개의 비트들을 구비한다.
이러한 것은 디코딩할 때 복수의 가능한 코딩 구성들 중에서 어떠한 코딩 구성을 사용하는지를 상기 디코더에 시그널링하는 효과적인 방식을 제공한다는 점에서 유익하다.
코딩 구성들은 식별 번호와 연관될 수 있다. 이 때문에, 적어도 두 개의 비트들이 상기 복수의 구성들 중 하나의 식별 번호를 나타냄으로써 상기 복수의 구성들 중 상기 하나를 나타낸다.
예시적인 실시예들에 따라, 상기 멀티채널 오디오 시스템은 다섯 개의 채널들을 구비하고, 상기 코딩 구성들은: 다섯 채널들의 조인트 코딩; 네 개의 채널들의 조인트 코딩 및 마지막 채널의 별도의 코딩; 세 개의 채널들의 조인트 코딩 및 두 개의 다른 채널들의 별도의 조인트 코딩; 및 두 개의 채널들의 조인트 코딩, 두 개의 다른 채널들의 별도의 조인트 코딩 및 마지막 채널의 별도의 코딩에 대응한다.
상기 적어도 두 개의 비트들이 두 개의 채널들의 조인트 코딩, 두 개의 다른 채널들의 별도의 조인트 코딩 및 마지막 채널의 별도의 코딩을 나타내는 경우, 상기 적어도 두 개의 비트는 어떠한 두 개의 채널들이 공동으로 코딩될지를 나타내고 어떠한 두 개의 다른 채널들이 공동으로 코딩되는지를 나타내는 비트를 포함할 수 있다.
IV. 예시적 실시예들
도 1a는 본 경우에 좌측 스피커 L에 대응하는 제 1 채널(102) 및 본 경우에 우측 스피커 R에 대응하는 제 2 채널(104)을 구비하는 오디오 시스템의 채널 셋업(100)을 도시한다. 상기 제 1 채널(102) 및 상기 제 2 채널(104)은 공동으로 스테레오 인코딩 및 디코딩될 수 있다.
도 1b는 도 1a의 상기 제 1 채널(102) 및 상기 제 2 채널(104)의 조인트 스테레오 인코딩을 수행하는데 사용될 수 있는 스테레오 인코딩 구성요소(110)를 도시한다. 일반적으로, 스테레오 인코딩 구성요소(110)는 여기서 Ln으로 표시하는 (도 1a의 제 1 채널(102)과 같은) 제 1 채널(112), 여기서 Rn으로 표시되는 (도 1a의 제 2 채널(104)과 같은) 제 2 채널(114)을 여기서 An으로 표시되는 제 1 출력 채널(116) 및 여기서 Bn으로 표시되는 제 2 출력 채널(118)로 변환한다. 인코딩 프로세스 동안, 상기 스테레오 인코딩 구성요소(110)는 이후 상세히 설명될 파라미터를 포함한 사이드 정보(115)를 추출할 수 있다. 상기 파라미터는 상이한 주파수 대역들에 대해 다르게 될 수 있다.
상기 인코딩 구성요소(110)는 상기 제 1 출력 채널(116), 상기 제 2 출력 채널(118) 및 상기 사이드 정보(115)를 양자화하며, 대응하는 디코더로 보내지는 비트 스트림의 형태로 코딩한다.
도 1c는 대응하는 스테레오 디코딩 구성요소(120)를 도시한다. 상기 스테레오 디코딩 구성요소(120)는 상기 인코딩 장치(110)로부터 비트 스트림을 수신하여 디코딩하고, 제 1 채널(116') An(인코더 측의 제 1 출력 채널(116)에 대응), 제 2 채널(118') Bn(인코더 측의 제 2 출력 채널(118)에 대응) 및 사이드 정보(115')를 양자화한다. 상기 스테레오 디코딩 구성요소(120)는 제 1 출력 채널(112') Ln 및 제 2 출력 채널(114') Rn을 출력한다. 상기 스테레오 디코딩 구성요소(120)는 또한 상기 사이드 정보(115')를 상기 인코더 측에서 추출된 사이드 정보(115)에 대응하는 입력으로서 취할 수 있다.
상기 스테레오 인코딩/디코딩 구성요소(110,120)는 상이한 코딩 방식들을 적용할 수 있다. 어떠한 코딩 방식을 적용하는지가 상기 사이드 정보(115)에서 상기 인코딩 구성요소(110)에 의해 상기 디코딩 구성요소(120)에 시그널링될 수 있다. 상기 인코딩 구성요소(110)는 하기에 기술되는 세 가지 상이한 코딩 방식들 중 어떤 것이 사용되는지를 결정한다. 이러한 결정은 신호 적응적(signal adaptive)이며 따라서 프레임마다 시간에 따라 변화할 수 있다. 더욱이, 상이한 주파수 대역들 사이에서 조차도 다를 수 있다. 인코더에서의 실제 결정 프로세스는 매우 복잡하며, 일반적으로 MDCT 도메인에서의 양자화/코딩뿐만 아니라 인지적 측면의 효과 및 사이드 정보의 비용을 고려한다.
여기서 좌-우 코딩 "LR-코딩"으로 참조되는 제 1코딩 방식에 따라, 스테레오 변환 구성요소들(110, 120)의 입력 및 출력 채널들은 다음의 식에 따라 관련된다:
Ln = An; Rn = Bn
다시 말하면, LR 코딩은 단순히 입력 채널들의 통과(path-through)를 의미한다. 그러한 코딩은 상기 입력 채널들이 매우 상이한 경우에 유용할 수 있다.
여기서 중간-측 코딩(또는 합-및-차 코딩) "MS-코딩"으로 참조되는 제 2 코딩 방식에 따라, 스테레오 인코딩/디코딩 구성요소들(110, 120)의 입력 및 출력 채널들은 다음의 식에 따라 관련된다:
Ln =(An + Bn); Rn =(An - Bn)
인코더의 관점에서 대응하는 식은 다음과 같다:
An = 0.5(Ln + Rn); Bn = 0.5(Ln - Rn)
즉, MS-코딩은 입력 채널들의 합 및 차를 계산하는 것을 수반한다. 이러한 이유로, 채널 An(인코더 측에서 제 1 출력 채널(116) 및 디코더 측에서 제 1 입력 채널(116'))이 제 1 및 제 2 채널들 Ln 및 Rn의 중간-신호(합-신호)로서 간주될 수 있으며, 채널 Bn은 상기 제 1 및 제 2 채널들 Ln 및 Rn의 사이드-신호(차-신호)로서 간주될 수 있다. MS 코딩은 상기 입력 채널들 Ln 및 Rn이 신호의 형상과 볼륨에 대해 유사할 경우 유용하게 될 수 있으며, 그 후로 상기 사이드-신호 Bn은 0에 가깝게 될 것이다. 그러한 상황에서, 사운드 소스는 도 1a의 제 1 채널(102)과 제 2 채널(104) 사이의 중간에 위치된 것처럼 들리게 된다.
상기 중간 측 코딩 방식은 여기서 "향상된 MS-코딩"(또는 향상된 합-차 코딩)으로 참조되는 제 3 코딩 방식으로 일반화될 수 있다. 향상된 MS-코딩에서, 스테레오 인코딩/디코딩 구성요소들(110, 120)의 입력 및 출력 채널들은 다음의 식에 따라 관련된다:
여기서, 는 상기 사이드 정보(115, 115')의 부분을 형성할 수 있는 파라미터이다. 상기한 식은 디코더 관점으로부터의 프로세스, 즉 An, Bn으로부터 Ln, Rn으로 진행하는 것을 기술한다. 또한, 이 경우에 있어서, 상기 신호 An은 중간-신호(mid-signal)로서 생각될 수 있으며, 상기 신호 Bn은 수정된 사이드-신호로서 생각될 수 있다. 특히, =0에 대해, 상기 향상된 MS-코딩 방식은 중간 측 코딩으로 퇴보(degenerate)된다. 향상된 MS-코딩은 볼륨이 상이한 것을 제외하고는 유사한 신호들을 코딩하는데 유용할 수 있다. 예를 들어, 도 1a의 좌측 채널(102) 및 우측 채널(104)이 상기 좌측 채널(102)에서 볼륨이 더 높은 것을 제외하고 동일한 신호를 구비하는 경우, 상기 사운드 소스는 도 1a의 항목(105)에 의해 도시된 바와 같이 좌측으로 가깝게 위치된 것처럼 들리게 될 것이다. 이러한 상황에서, 상기 중간-측 코딩은 비-제로 사이드 신호를 발생할 것이다. 하지만, 0과 1 사이의 적절한 값 를 선택함으로써, 상기 수정된 사이드-신호 Bn은 0과 같거나 근접하게 될 것이다. 유사하게, 0과 -1 사이의 값 는 상기 우측 채널에서의 볼륨이 더 높게 되는 경우들에 대응한다.
상기한 바에 따라, 상기 스테레오 인코딩/디코딩 구성요소들(110, 120)은 그에 따라 상이한 스테레오 코딩 방식들을 적용하도록 구성될 수 있다. 상기 스테레오 인코딩/디코딩 구성요소들(110, 120)은 또한 상이한 주파수 대역들에 대해 상이한 스테레오 코딩 방식들을 적용할 수 있다. 예를 들면, 제 1 스테레오 코딩 방식이 제 1 주파수까지의 주파수들에 적용될 수 있으며, 제 2 스테레오 코딩 방식이 상기 제 1 주파수보다 높은 주파수 대역들에 대해 적용될 수 있다. 또한, 상기 파라미터 는 주파수에 의존적이 될 수 있다.
상기 스테레오 인코딩/디코딩 구성요소들(110, 120)은, 중첩되는 윈도우 시퀀스 도메인이 되는, 임계적으로 샘플링된 수정 이산 코사인 변환(MDCT) 도메인에서 신호들에 대해 동작하도록 구성된다. 임계적으로 샘플링된다는 것은 상기 상기 주파수 도메인 신호에서의 샘플들의 수가 시간 도메인 신호에서의 샘플들의 수와 동일하다는 것을 의미한다. 상기 스테레오 인코딩/디코딩 구성요소들(110, 120)이 LR-코딩 방식을 적용하도록 구성된 경우, 상기 입력 채널들(112, 114)은 상이한 윈도우들을 사용하여 코딩될 수 있다. 하지만, 상기 스테레오 인코딩/디코딩 구성요소들(110, 120)이 상기 MS-코딩 또는 상기 향상된 MS 코딩 중 하나를 적용하도록 구성된다면, 상기 입력 채널들은 윈도우의 형상은 물론 변환 길이에 대해 동일한 윈도우를 사용하여 코딩되어야 한다.
상기 스테레오 인코딩/디코딩 구성요소들(110, 120)은 두 개의 채널보다 많은 채널들을 구비하는 오디오 시스템들에 대한 유연한 인코딩/디코딩 방식들을 구현하기 위해 빌딩 블록(building block)들로서 사용될 수 있다. 원리를 설명하기 위해, 멀티채널 오디오 시스템의 3-채널 셋업(200)이 도 2a에 도시된다. 상기 오디오 시스템은 제 1 오디오 채널(202)(여기서는 좌측 채널 L), 제 2 오디오 채널(204)(여기서는 우측 채널 R), 및 제 3 채널(206)(여기서는 센터 채널 C)을 구비한다.
도 2b는 도 2a의 세 개의 채널들(202, 204, 206)을 인코딩하는 인코딩 장치(210)를 도시한다. 상기 인코딩 장치(210)는 제 1 스테레오 인코딩 구성요소(210a)와 제 2 스테레오 인코딩 구성요소(210b)를 구비하며, 이들은 직렬로(in cascade) 연결되어 있다.
인코딩 장치(210)는 제 1 입력 채널(212)(예를 들면, 도 2a의 제 1 채널(202)에 대응), 제 2 입력 채널(214)(예를 들면, 도 2a의 제 2 채널(204)에 대응), 및 제 3 입력 채널(216)(예를 들면, 도 2a의 제 3 채널(206)에 대응)을 수신한다. 상기 제 1 채널(212) 및 상기 제 3 입력 채널(216)은 전술한 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩을 수행하는 제 1 스테레오 인코딩 구성요소(210a)에 입력된다. 그 결과, 상기 제 1 스테레오 인코딩 구성요소(210a)는 제 1 중간 출력 채널(213) 및 제 2 중간 출력 채널(215)을 출력한다. 여기에서 사용된 바와 같이, 중간 출력 채널은 스테레오 인코딩 또는 스테레오 디코딩의 결과를 의미한다. 중간 출력 채널은 필연적으로 발생되거나 또는 실제 구현에서 측정될 수 있다는 의미에서 일반적으로 물리적 신호는 아니다. 오히려, 여기에서는, 상기 중간 출력 채널들은 상이한 스테레오 인코딩 또는 디코딩 구성요소들이 어떻게 서로에 대해 조합되거나 및/또는 배치될 것인지를 설명하는데 사용된다. 중간이라는 것은 출력 채널들(213, 215)이, 인코딩된 채널들을 나타내는 출력 채널들과는 대조적으로, 인코딩 장치(210)의 중간 스테이지들을 나타내는 것을 의미한다. 예를 들면, 상기 제 1 중간 출력 채널(213)은 중간 신호가 될 수 있고, 상기 제 2 중간 출력 채널(215)은 수정된 사이드 신호가 될 수 있다.
도 1a의 예시적인 채널 셋업(200)을 참조하면, 제 1 스테레오 인코딩 구성요소(210a)에 의해 수행되는 프로세스는 예를 들면 좌측 채널(202) 및 센터 채널(206)의 조인트 스테레오 코딩(207)에 대응할 수 있다. 상이한 볼륨들로 이루어진 좌측 채널(202) 및 센터 채널(206)에 있어서 유사한 신호들인 경우, 이러한 조인트 스테레오 코딩은 상기 좌측 채널(202)과 상기 센터 채널(206) 사이에 위치되는 가상의 사운드 소스(205)를 캡처하는데 효과적일 수 있다.
제 1 중간 출력 채널(213) 및 제 2 입력 채널(214)은 이후 상기 기술한 스테레오 코딩 방식들 중 하나에 따른 스테레오 코딩을 수행하는 제 2 스테레오 인코딩 구성요소(210b)에 입력된다. 상기 제 2 스테레오 인코딩 구성요소(210b)는 제 1 출력 채널(217) 및 제 2 출력 채널(218)을 출력한다. 도 1a의 예시적인 채널 셋업을 참조하면, 상기 제 2 스테레오 인코딩 구성요소(210b)에 의해 수행되는 프로세스는 예를 들면 상기 제 1 스테레오 인코딩 구성요소(210a)에 의해 발생된 좌측 채널(202)과 센터 채널(206)의 중간 신호 및 우측 채널(204)의 조인트 스테레오 코딩(208)에 대응할 수 있다.
인코딩 장치(210)는 제 1 출력 채널(217), 제 2 출력 채널(218) 및 제 3 출력 채널로서 제 2 중간 채널(215)을 출력한다. 예를 들면, 상기 제 1 출력 채널(217)은 중간 신호에 대응할 수 있고, 상기 제 2 및 제 3 출력 채널들(218, 215)은 각각 수정된 사이드 신호들에 대응할 수 있다.
상기 인코딩 장치(210)는 상기 출력 신호들을 사이드 정보와 함께 양자화하여, 디코더로 전송될 비트 스트림으로 코딩한다.
대응하는 디코딩 장치(220)가 도 2c에 도시된다. 상기 디코딩 장치(220)는 제 1 스테레오 디코딩 구성요소(220b) 및 제 2 스테레오 디코딩 구성요소(220a)를 구비한다. 상기 디코딩 장치(220) 내의 제 1 스테레오 디코딩 구성요소(220b)는 상기 인코더 측에서의 제 2 스테레오 인코딩 구성요소(210b)의 코딩 방식의 역이 되는 코딩 방식을 적용하도록 구성된다. 유사하게, 상기 디코딩 장치(220) 내의 제 2 스테레오 디코딩 구성요소(220a)는 상기 인코더 측에서의 제 1 스테레오 인코딩 구성요소(210a)의 코딩 방식의 역이 되는 코딩 방식을 적용하도록 구성된다. 디코더 측에서 적용하는 코딩 방식들은 상기 인코딩 장치(210)로부터 상기 디코딩 장치(220)로 전송되는 비트 스트림에서의 시그널링에 의해 나타내질 수 있다. 이것은 예를 들면, 스테레오 디코더 구성요소들(220b, 220a)이 적용해야 하는 것이 LR-코딩, MS-코딩 또는 향상된 MS-코딩 중 어느 것인지를 나타내는 것을 포함할 수 있다. 상기 센터 채널이 상기 좌측 채널 또는 상기 우측 채널과 함께 코딩되어야 하는지의 여부를 나타내는 하나 이상의 비트들이 또한 있을 수 있다.
상기 디코딩 장치(220)는 상기 인코딩 장치(210)로부터 전송되는 비트 스트림을 수신, 디코딩 및 역양자화(dequantize)한다. 이러한 방식으로, 상기 디코딩 장치(220)는 제 1 입력 채널(217')(인코딩 장치(210)의 제 1 출력 채널에 대응), 제 2 입력 채널(218')(인코딩 장치(210)의 제 2 출력 채널에 대응), 및 제 3 입력 채널(215')(인코딩 장치(210)의 제 3 출력 채널에 대응)을 수신한다. 상기 제 1 및 상기 제 2 입력 채널들(217', 218')은 제 1 스테레오 디코딩 구성요소(220b)에 입력된다. 상기 제 1 스테레오 디코딩 구성요소(220b)는 인코더 측에서 제 2 스테레오 인코딩 구성요소(210b)에서 적용된 것의 역 코딩 방식에 따라 스테레오 디코딩을 수행한다. 그 결과, 제 1 중간 출력 채널(213') 및 제 2 중간 출력 채널(214')이 제 1 스테레오 디코딩 구성요소(220b)의 출력이 된다. 다음에, 상기 제 1 중간 출력 채널(213') 및 제 3 입력 채널(215')이 제 2 스테레오 디코딩 구성요소(220a)에 입력된다. 상기 제 2 스테레오 디코딩 구성요소(220a)는 인코더 측에서 제 1 스테레오 인코딩 구성요소(210a)에서 적용된 코딩 방식의 역이 되는 코딩 방식에 따라 그 입력 신호들의 스테레오 디코딩을 수행한다. 상기 제 2 스테레오 디코딩 구성요소(220a)는 제 1 출력 채널(212')(인코딩 측의 제 1 입력 신호(212)에 대응), 제 2 출력 채널(214')(인코딩 측의 제 2 입력 신호(214)에 대응), 및 제 3 출력 채널(216')로서 제 2 중간 출력 채널(214')(인코더 측에 제 3 입력 신호(216)에 대응)를 출력한다.
상기 주어진 예들에 있어서, 상기 제 1 입력 채널(212)은 좌측 채널(202)에 대응할 수 있고, 상기 제 2 입력 채널(214)은 우측 채널(202)에 대응할 수 있으며, 상기 제 3 입력 채널(216)은 센터 채널(206)에 대응할 수 있다. 하지만, 상기 제 1, 제 2 및 제 3 입력 채널들(212, 214, 216)은 어떠한 순열에 따라서도 도 2a의 채널들(202, 204, 206)에 대응할 수 있다는 것을 유의하여야한다. 이러한 방식으로, 인코딩 및 디코딩 장치들(210, 220)은 도 2a의 상기 세 개의 채널들(202, 204, 206)을 인코딩/디코딩하는 방법에 대한 매우 유연한 방식을 제공한다. 더욱이, 스테레오 인코딩 구성요소들(210a, 210b)의 코딩 방식들이 어떠한 방식들로도 선택될 수 있다는 점에서 상기 유연성은 더욱 증가된다. 예를 들어, 상기 스테레오 인코딩 구성요소들(210a, 210b) 모두는 향상된 MS-코딩과 같은 동일한 코딩 방식 또는 다른 코딩 방식들을 적용할 수 있다. 또한, 코딩 방식들은 코딩될 주파주 대역들에 의존하여 및/또는 코딩될 시간 프레임에 의존하여 달라질 수 있다. 적용하는 코딩 방식은 사이드 정보로서 인코딩 장치(210)로부터 디코딩 장치(220)로의 비트 스트림에서 시그널링될 수 있다.
이제 예시적인 실시예가 도 3a 내지 3c를 참조하여 설명된다. 도 3a는 멀티채널 오디오 시스템의 4 채널 셋업(300)을 도시한다. 상기 오디오 시스템은 여기서 좌측 전방 스피커 Lf에 대응하는 제 1 채널(302), 여기서 우측 스피커 Rf에 대응하는 제 2 채널(304), 여기서 좌측 서라운드 스피커 Ls에 대응하는 제 3 채널(306), 및 우측 서라운드 스피커 Rs에 대응하는 제 4 채널(308)을 구비한다.
도 3b 및 도 3c는 도 3a의 네 개의 채널들(302, 304, 306, 308)을 인코딩/디코딩하는데 사용될 수 있는, 인코딩 장치(310) 및 디코딩 장치(320)를 각각 도시한다.
상기 인코딩 장치(310)는 제 1 스테레오 인코딩 구성요소(310a), 제 2 스테레오 인코딩 구성요소(310b), 제 3 스테레오 인코딩 구성요소(310c), 및 제 4 스테레오 인코딩 구성요소(310d)를 구비한다. 이제, 상기 인코딩 장치(310)의 동작이 설명될 것이다.
상기 인코딩 장치(310)는 제 1 쌍의 입력 채널들을 수신한다. 제 1 쌍의 입력 채널들은 제 1 입력 채널(312)(예를 들면, 도 3a의 Lf 채널(302)에 대응할 수 있음) 및 제 2 입력 채널(316)(예를 들면, 도 3a의 Ls 채널(306)에 대응할 수 있음)을 구비한다. 상기 인코딩 장치(310)는 또한 제 2 쌍의 입력 채널들을 수신한다. 제 2 쌍의 입력 채널들은 제 1 입력 채널(314)(예를 들면, 도 3a의 Rf 채널(304)에 대응할 수 있음) 및 제 2 입력 채널(318)(예를 들면, 도 3a의 Rs 채널(308)에 대응할 수 있음)을 구비한다. 상기 제 1 및 제 2 쌍의 입력 채널들(312, 316, 314, 318)은 일반적으로 MDCT 스펙트럼의 형태로 표현된다.
상기 제 1 쌍의 입력 채널들(312, 316)은 제 1 스테레오 인코딩 구성요소(310a)에 입력되며, 여기서 상기 제 1 쌍의 입력 채널들(312, 316)은 이전에 기술된 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩된다. 상기 제 1 스테레오 인코딩 구성요소(310a)는 제 1 채널(313) 및 제 2 채널(317)을 구비하는 제 1 쌍의 중간 출력 채널들을 출력한다. 예로서, MS 코딩 또는 향상된 MS 코딩이 적용된다면, 상기 제 1 채널(313)은 중간 신호에 대응할 수 있고, 상기 제 2 채널(317)은 수정된 사이드 신호에 대응할 수 있다.
유사하게, 상기 제 2 쌍의 입력 채널들(314, 318)은 제 2 스테레오 인코딩 구성요소(310b)에 입력되며, 여기서 상기 제 2 쌍의 입력 채널들(314, 318)은 이전에 기술된 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩된다. 상기 제 2 스테레오 인코딩 구성요소(310b)는 제 1 채널(315) 및 제 2 채널(319)을 구비하는 제 2 쌍의 중간 출력 채널들을 출력한다. 예로서, MS 코딩 또는 향상된 MS 코딩이 적용된다면, 상기 제 1 채널(315)은 중간 신호에 대응할 수 있고, 상기 제 2 채널(319)은 수정된 사이드 신호에 대응할 수 있다.
도 3a의 채널 셋업을 고려하면, 제 1 스테레오 인코딩 구성요소(310a)에 의해 적용된 프로세스는 Lf 채널(302) 및 Ls 채널(306)의 조인트 스테레오 코딩(303)을 수행하는 것에 대응할 수 있다. 마찬가지로, 제 2 스테레오 인코딩 구성요소(310b)에 의해 적용된 프로세스는 Rf 채널(304) 및 Rs 채널(308)의 조인트 스테레오 코딩(305)을 수행하는 것에 대응할 수 있다.
상기 제 1 쌍의 중간 출력 채널들의 제 1 채널(313) 및 상기 제 2 쌍의 중간 출력 채널들의 제 1 채널(315)은 이후 제 3 스테레오 인코딩 구성요소(310c)에 입력된다. 상기 제 3 스테레오 인코딩 구성요소(310c)는 상기 채널들(313, 315)을 상기한 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩한다. 상기 제 3 스테레오 인코딩 구성요소(310c)는 제 1 출력 채널(322) 및 제 2 출력 채널(324)로 이루어진 제 1 쌍의 출력 채널들을 출력한다.
유사하게, 상기 제 1 쌍의 중간 출력 채널들의 제 2 채널(317) 및 상기 제 2 쌍의 중간 출력 채널들의 제 2 채널(319)은 제 4 스테레오 인코딩 구성요소(310d)에 입력된다. 상기 제 4 스테레오 인코딩 구성요소(310d)는 상기 채널들(317, 319)을 상기한 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩한다. 상기 제 4 스테레오 인코딩 구성요소(310d)는 제 1 출력 채널(326) 및 제 2 출력 채널(328)로 이루어진 제 2 쌍의 출력 채널들을 출력한다.
다시, 도 3a의 채널 셋업을 고려하면, 상기 제 3 및 제 4 스테레오 인코딩 구성요소(310c, 310d)는 상기 채널 셋업의 좌측 및 우측의 조인트 스테레오 코딩(307)과 유사하게 될 수 있다. 예로서, 상기 제 1 및 제 2 쌍의 중간 출력 채널들의 제 1 채널들(313, 315)이 각각 중간 신호들이라면, 제 3 스테레오 인코딩 구성요소(310c)는 상기 중간 신호들의 조인트 스테레오 코딩을 수행한다. 마찬가지로, 상기 제 1 및 제 2 쌍의 중간 출력 채널들의 제 2 채널들(317, 319)이 각각 (수정된) 사이드 신호들이라면, 상기 제 3 스테레오 인코딩 구성요소(310c)는 상기 (수정된) 사이드 신호들의 조인트 스테레오 코딩을 수행한다. 예시적인 실시예들에 따라, 상기 (수정된) 사이드 신호들(317, 319)은 어떠한 주파수 임계값 이상의 주파수들에 대한 것과 같이 (상기 중간 신호들(313, 315)에 대해 요구된 에너지 보상을 갖는) 높은 주파수 범위들에 대해 0으로 설정될 수 있다. 예로서, 상기 주파수 임계값은 10 kHz로 될 수 있다.
상기 인코딩 장치(310)는 디코딩 장치로 전송되는 비트 스트림을 발생하도록 상기 출력 신호들(322, 324, 326, 328)을 양자화하여 코딩한다.
이제 도 3c를 참조하면, 대응하는 디코딩 장치(320)가 도시된다. 상기 디코딩 장치(320)는 제 1 스테레오 디코딩 구성요소(320c), 제 2 스테레오 디코딩 구성요소(320d), 제 3 스테레오 디코딩 구성요소(320a) 및 제 4 스테레오 디코딩 구성요소(320b)를 구비한다. 이제, 상기 디코딩 장치(320)의 동작이 설명된다.
상기 디코딩 장치(320)는 상기 인코딩 장치(310)로부터 수신된 비트 스트림을 수신하여 디코딩하고 역양자화한다. 이러한 방식으로, 상기 디코딩 장치(320)는 제 1 채널(322')(도 3b의 출력 채널(322)에 대응) 및 제 2 채널(324')(도 3b의 출력 채널(324)에 대응)로 이루어진 제 1 쌍의 입력 채널들을 수신한다. 상기 디코딩 장치(320)는 또한 제 1 채널(326')(도 3b의 출력 채널(326)에 대응) 및 제 2 채널(328')(도 3b의 출력 채널(328)에 대응)로 이루어진 제 2 쌍의 입력 채널들을 수신한다. 상기 제 1 및 제 2 쌍의 입력 채널들은 일반적으로 MDCT 스펙트럼의 형태로 있다.
상기 제 1 쌍의 입력 채널들(322', 324')은 제 1 스테레오 디코딩 구성요소(320c)로 입력되며, 여기서 인코더 측에서 제 3 스테레오 인코딩 구성요소(310c)에 의해 적용된 스테레오 코딩 방식의 역이 되는 스테레오 코딩 방식에 따라 스테레오 디코딩된다. 상기 제 1 스테레오 디코딩 구성요소(320c)는 제 1 채널(313') 및 제 2 채널(315')로 이루어진 제 1 쌍의 중간 채널들을 출력한다.
유사한 방식으로, 상기 제 2 쌍의 입력 채널들(326', 328')은 제 2 스테레오 디코딩 구성요소(320d)로 입력되며, 여기서 인코더 측에서 제 4 스테레오 인코딩 구성요소(310d)에 의해 적용된 스테레오 코딩 방식의 역이 되는 스테레오 코딩 방식을 적용한다. 상기 제 2 스테레오 디코딩 구성요소(320d)는 제 1 채널(317') 및 제 2 채널(319')로 이루어진 제 2 쌍의 중간 채널들을 출력한다.
상기 제 1 및 제 2 쌍들의 중간 출력 채널들의 제 1 채널들(313', 317')은 제 3 스테레오 디코딩 구성요소(320a)로 입력되며, 여기서 인코더 측에서 제 1 스테레오 인코딩 구성요소(310a)에 의해 적용된 스테레오 코딩 방식의 역이 되는 스테레오 코딩 방식을 적용한다. 그에 따라 상기 제 3 스테레오 디코딩 구성요소(320a)는 출력 채널(312')(인코더 측에서 입력 채널(312)에 대응) 및 출력 채널(316')(인코더 측에서 입력 채널(316)에 대응)를 구비하는 제 1 쌍의 출력 채널들을 발생한다.
유사한 방식으로, 상기 제 1 및 제 2 쌍들의 중간 출력 채널들의 제 2 채널들(315', 319')은 제 4 스테레오 디코딩 구성요소(320b)로 입력되며, 여기서 인코더 측에서 제 2 스테레오 인코딩 구성요소(310b)에 의해 적용된 스테레오 코딩 방식의 역이 되는 스테레오 코딩 방식을 적용한다. 이러한 방식으로, 상기 제 3 스테레오 디코딩 구성요소(320a)는 출력 채널(312')(인코더 측에서 입력 채널(312)에 대응) 및 출력 채널(316')(인코더 측에서 입력 채널(316)에 대응)를 구비하는 제 2 쌍의 출력 채널들을 발생한다.
상기 주어진 예들에 있어서, 상기 제 1 입력 채널(312)은 Lf 채널(302)에 대응하고, 상기 제 2 입력 채널(316)은 Ls 채널(306)에 대응하고, 상기 제 3 입력 채널(314)는 Rf 채널(304)에 대응하고, 상기 제 4 채널은 Rs 채널(308)에 대응한다. 하지만, 도 3b의 입력 채널들(312, 314, 316, 318)에 대한 도 3a의 채널들(302, 304, 306, 308)의 어떠한 순열도 동일하게 가능하다. 이러한 방식으로, 상기 인코딩/디코딩 장치들(310, 320)은 쌍으로 인코딩하기 위한 채널들 및 순서를 선택하기 위한 유연한 프레임워크를 구성한다. 실례로, 상기 선택은 상기 채널들 사이의 유사성들에 관한 고려에 기초할 수 있다.
상기 스테레오 인코딩 구성요소들(310a, 310b, 310c, 310d)에 의해 적용된 코딩 방식들이 선택될 수 있기 때문에 추가의 유연성이 부가된다. 상기 코딩 방식들은 인코더로부터 디코더로 전송될 데이터의 전체량이 최소화되도록 바람직하게 선택된다. 디코더 측 상에서 상이한 스테레오 디코딩 구성요소들(320a-d)에 의해 사용될 상기 코딩 방식의 선택은 사이드 정보(도 1b 및 도 1c의 참조 항목들 115, 115')로서 인코더 장치(310)에 의해 디코더 장치(320)로 시그널링될 수 있다. 상기 스테레오 변환 구성요소들(310a, 310b, 310c, 31Od)은 따라서 상이한 스테레오 코딩 방식들을 적용할 수 있다. 하지만, 일부 실시예들에서, 모든 스테레오 변환 구성요소들(310a, 310b, 310c, 31Od)은 동일한 스테레오 변환 방식, 예를 들면 향상된 MS-코딩 방식을 적용한다.
스테레오 인코딩 구성요소들(310a, 310b, 310c, 310d)은 또한 상이한 주파수 대역들에 대해 상이한 스테레오 코딩 방식들을 적용할 수 있다. 또한, 상이한 스테레오 코딩 방식들은 상이한 시간 프레임들에 대해 적용될 수 있다.
상술한 바와 같이, 스테레오 인코딩/디코딩 구성요소들(310a-d 및 320a-d)은 임계적으로 샘플링된 MDCT 도메인에서 동작한다. 윈도우의 선택은 적용되는 스테레오 코딩 방식에 의해 제한될 것이다. 더욱 자세하게는, 스테레오 인코딩 구성요소(310a-d)가 MS-코딩 또는 향상된 MS-코딩을 적용하는 경우, 그 입력 신호들은 윈도우 형상 및 변환 길이 모양에 대해 동일한 윈도우를 사용하여 코딩될 필요가 있다. 따라서, 일부 실시예들에서, 모든 입력 신호들(312, 314, 316, 318)은 동일한 윈도우를 사용하여 코딩된다.
이제, 예시적인 실시예가 4a 내지 4c를 참조하여 설명된다. 도 4a는 오디오 시스템의 5-채널 셋업(400)을 도시한다. 도 3a를 참조하여 설명된 4-채널 셋업(300)과 유사하게, 상기 5-채널 셋업은 제 1 채널(402), 제 2 채널(404), 제 3 채널(406), 및 제 4 채널(408)을 구비하며, 여기에서 이들은 Lf 스피커, Rf 스피커, Ls 스피커 및 Rs 스피커에 각각 대응한다. 또한, 상기 5-채널 셋업(400)은 센터 스피커 C에 대응하는 제 5 채널(409)을 구비한다.
도 4b는 예를 들어 도 4a의 5-채널 셋업의 다섯 개의 채널들을 인코딩하는 데 사용될 수 있는 인코딩 장치(410)를 도시한다. 도 4b의 인코딩 장치(410)는, 제 5 스테레오 인코딩 구성요소(410e)를 더 구비한다는 점에서, 도 3a의 인코딩 장치(310)와 다르다. 또한 동작시, 상기 인코딩 장치(410)는 (예를 들면, 도 4a의 센터 채널(409)에 대응할 수 있는) 제 5 입력 채널(419)을 수신한다. 상기 제 5 입력 채널(419) 및 제 2 쌍의 중간 출력 채널들의 제 1 채널(317)은 상기 제 5 스테레오 인코딩 구성요소(410e)에 입력되며, 여기서 상기 기술된 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩를 수행한다. 상기 제 5 스테레오 인코딩 구성요소(410e)는 제 1 채널(417) 및 제 2 채널(421)로 이루어지는 제 3 쌍의 중간 출력 채널들을 출력한다. 상기 제 3 쌍의 중간 출력 채널들의 제 1 채널(417) 및 제 1 쌍의 중간 채널들의 제 1 채널(313)은 이후 제 1 쌍의 출력 채널들(422, 424)을 발생하기 위해 제 3 스테레오 인코딩 구성요소(310c)에 입력된다. 상기 인코더 장치(410)는 다섯 개의 출력 채널들, 즉 제 1 쌍의 출력 채널들(422, 424), 제 5 스테레오 인코딩 구성요소(410e)의 출력이 되는 제 3 중간 쌍의 출력 채널들의 제 2 채널(421), 및 제 4 스테레오 인코딩 구성요소(310d)의 출력이 되는 제 2 쌍의 출력 채널들(326, 328)을 출력한다.
상기 출력 채널들(422, 424, 421, 326, 328)은 대응하는 디코딩 장치에 전송될 비트 스트림을 발생하기 위해 양자화되어 코딩된다.
도 4a의 5-채널 셋업을 고려하여 입력 채널(312) 상에 Lf 채널(402)을 매핑하고, 입력 채널(316) 상에 Ls 채널(406)을 매핑하고, 입력 채널(419) 상에 C 채널을 매핑하고, 입력 채널(314) 상에 Rf 채널을 매핑하고, 입력 채널(318) 상에 Rs 채널을 매핑하면, 다음의 구현이 얻어진다: 첫 번째로, 제 1 및 제 2 스테레오 인코딩 구성요소들(310a, 310b)은 Lf와 Ls 채널의 조인트 스테레오 코딩 및 Rf와 Rs 채널의 조인트 스테레오 코딩을 각각 수행한다. 두 번째로, 제 5 스테레오 인코딩 구성요소(410e)는 Rf와 Rs 채널들의 조인트 코딩의 결과와 센터 채널 C의 조인트 스테레오 코딩을 수행한다. 세 번째로, 제 3 및 제 4 스테레오 인코딩 구성요소들(310c, 310d)은 채널 셋업(400)의 좌측과 우측 사이의 조인트 스테레오 코딩을 수행한다. 한 예에 따라서, 스테레오 인코딩 구성요소들(310a, 310b)이 통과하도록, 즉 LR 코딩을 적용하도록 설정된다면, 인코딩 장치(410)는 세 개의 전방 채널들(C, Lf, Rf)을 공동으로 인코딩하고, 두 개의 서라운드 채널들(Ls, Rs)이 공동으로 코딩된다. 하지만, 이전의 실시예들과 관련하여 설명된 바와 같이, 입력 채널들(312, 314, 316, 318, 419)에 대한 채널 셋업(400)에서의 다섯 채널들의 매핑은 임의의 순열에 따라 수행될 수 있다. 예를 들면, 센터 채널(409)은 상기 채널 셋업의 우측 대신에 상기 채널 셋업의 좌측과 공동으로 코딩될 수 있다. 또한, 제 5 스테레오 인코딩 구성요소(410e)가 LR 코딩 즉, 그 입력 신호들의 통과(pass-through)를 수행하면, 인코딩 장치(410)는 인코딩 장치(310)와 유사하게 입력 채널들(312, 314, 316, 318)의 조인트 코딩을 수행하고, 입력 채널(419)의 별도의 코딩을 수행한다는 것을 유의해야한다.
도 4c는 인코딩 장치(410)에 대응하는 디코딩 장치(420)를 도시한다. 도 3c의 디코딩 장치(320)와 비교하면, 디코딩 장치(420)는 제 5 스테레오 디코딩 구성요소(420e)를 구비한다. 제 1 쌍의 입력 채널들(422', 424') 및 제 2 쌍의 입력 채널들(326', 328')에 부가하여, 상기 디코딩 장치(420)는 인코더 측 상의 출력 채널(421)에 대응하는 제 5 입력 채널(421')을 수신한다. 상기 제 1 쌍의 입력 채널들(422', 424')을 제 1 스테레오 디코딩 구성요소(320a)에서 스테레오 디코딩한 후, 상기 제 1 스테레오 디코딩 구성요소(320a)의 제 2 출력 채널(417') 및 상기 제 5 입력 채널(421)이 상기 제 5 스테레오 디코딩 구성요소(420e)에 입력된다. 상기 제 5 스테레오 디코딩 구성요소(420e)는 인코더 측 상에서 제 5 스테레오 인코딩 구성요소(410e)에 의해 적용된 스테레오 코딩 방식의 역이 되는 스테레오 코딩 방식을 적용한다. 제 5 스테레오 디코딩 구성요소(420e)는 제 1 채널(315') 및 제 2 채널(419')로 이루어진 제 3 쌍의 중간 출력 채널들을 출력한다. 이후, 상기 제 1 채널(315')은 제 2 쌍의 중간 출력 채널들의 제 2 채널(319')과 함께 제 4 스테레오 디코딩 구성요소(320d)에 입력된다. 디코딩 장치(420)는 제 3 스테레오 디코딩 구성요소(320c)의 출력 채널들(312', 316'), 제 3 쌍의 중간 출력 채널들의 제 2 채널(419'), 및 제 4 스테레오 디코딩 구성요소(320d)의 출력 채널들(314', 318')을 출력한다.
상기한 바에서, 중간 출력 채널의 개념은 스테레오 인코딩/디코딩 구성요소들이 서로에 대해 조합되거나 배치될 수 있는 방법을 설명하기 위해 사용되었다. 하지만, 상기 전술한 바와 같이, 중간 출력 채널은 단지 스테레오 인코딩 또는 스테레오 디코딩의 결과를 나타낼 뿐이다. 특히, 중간 출력 채널은 실제 구현에서 필연적으로 발생되거나 측정될 수 있다는 의미에서 일반적으로 물리적 신호는 아니다. 이제는 행렬 연산에 기초한 구현의 예들이 설명될 것이다.
도 3a-c(4-채널의 경우) 및 도 4a-c(5-채널의 경우)을 참조하여 설명된 인코딩/디코딩 방식들은 행렬 연산들을 수행하는 수단에 의해 구현될 수 있다. 예를 들어, 제 1 디코딩 구성요소(320c)는 제 1의 2×2 행렬 Al과 연관될 수 있고, 제 2 디코딩 구성요소(320d)는 제 2의 2×2 행렬 Bl과 연관될 수 있고, 제 3 디코딩 구성요소(320a)는 제 3의 2×2 행렬 A2와 연관될 수 있고, 제 4 디코딩 구성요소(320b)는 제 4의 2×2 행렬 B2와 연관될 수 있고, 제 5 디코딩 구성요소(420e)는 제 5의 2×2 행렬 A와 연관될 수 있다. 대응하는 인코딩 구성요소들(310a, 310b, 410e, 310c, 31Od)은 디코더 측 상의 대응하는 행렬들의 역들이 되는 2×2 행렬들과 유사한 방식으로 연관될 수 있다.
일반적인 경우, 상기 행렬들은 다음과 같이 정의된다:
상기 행렬의 엔트리는 적용되는 코딩 방식(LR-코딩, MS-코딩, 향상된 MS-코딩)에 의존한다. 예를 들면, LR-코딩에 대해서는, 대응하는 2×2 행렬은 항등 행렬(identity matrix), 즉
과 동일하다.
MS-코딩에 대해서는, 대응하는 2×2 행렬은,
의 행렬을 따른다.
향상된 MS-코딩에 대해서는, 대응하는 2×2 행렬은,
의 행렬을 따른다.
적용될 코딩 방식은 사이드 정보로서 인코더로부터 디코더로 시그널링된다.
이제, 복수의 상이한 예들이 개시될 것이다. 이 예들의 목적을 위해, 채널들(312, 312')은 Lf 채널(402)로 식별되고, 채널(316, 316')은 Ls 채널(406)로 식별되고, 채널(419)은 C 채널(409)로 식별되고, 채널들(314, 314')은 Rf 채널(404)로 식별되고, 채널(318, 318')은 Rs 채널(408)로 식별된다. 또한, 채널들(422', 424', 421', 326', 328')은 x1, x2, x3, x4, x5로 각각 표기될 것이다.
예 1 : 네 개의 채널들의 조인트 코딩 및 센터 채널의 별도의 코딩
이 예에 따르면, Lf, Ls, Rf 및 Rs 채널들은 공동으로 코딩되고, C 채널은 별도로 코딩된다. 이러한 코딩 구성의 실례에 대해서는 도 6d를 참조하라. Lf, Ls, Rf 및 Rs 채널들을 공동으로 코딩하기 위해, 이들 채널들을 나타내는 MDCT 스펙트럼은 윈도우 형상 및 변환 길이와 관련하여 공통의 윈도우로 코딩되어야 한다.
상기 센터 채널의 별도의 코딩을 달성하기 위해, 디코딩 구성요소(420e)는 상기 행렬 A가 항등 행렬과 동일하다는 것을 의미하는 통과(LR-코딩)로 설정된다.
상기 Lf, Ls, Rf 및 Rs 채널들은 다음의 행렬 연산에 따라 공동으로 디코딩될 수 있다:
예 2 : 네 개의 채널들의 쌍별(pairwise) 코딩 및 센터 채널의 별도의 코딩
이 예에 따르면, Lf 및 Ls 채널들이 공동으로 코딩된다. 또한, (Rf 및 Rs 채널들과는 별도로) 상기 Rf 및 Rs 채널들이 공동으로 코딩되고 C 채널이 별도로 코딩된다. 이러한 코딩 구성의 실례에 대해서는 도 6b를 참조하라. (도 6a의 경우는 채널들의 순열에 의해 달성될 수 있다.)
상기 센터 채널의 별도의 코딩을 달성하기 위해, 상기 센터 채널의 별도의 코딩을 달성하기 위해, 디코딩 구성요소(420e)는 상기 행렬 A가 항등 행렬과 동일하다는 것을 의미하는 통과(LR-코딩)로 설정된다.
또한, Lf/Ls 및 Rf/Rs의 별도의 코딩을 달성하기 위해, 디코딩 구성요소들(320c, 320d)이 상기 행렬들 A1 및 B1이 항등 행렬과 동일하다는 것을 의미하는 통과(LR-코딩)로 설정된다. 또한, Lf 및 Ls 채널들을 나타내는 MDCT 스펙트럼이 윈도우 형상 및 변환 길이에 대해 공통의 윈도우로 코딩되어야 한다. 또한, Rf 및 Rs 채널들을 나타내는 MDCT 스펙트럼이 윈도우 형상 및 변환 길이에 대해 공통의 윈도우로 코딩되어야 한다. 하지만, 상기 Lf/Ls에 대한 윈도우는 상기 Rf/Rs에 대한 윈도우와는 다를 수 있다. 상기 Lf, Ls, Rf 및 Rs 채널들은 다음의 행렬 연산들에 따라 디코딩될 수 있다:
예 3 : 다섯 개의 채널들의 조인트 코딩
이 예에 따르면, Lf, Ls, Rf, Rs 및 C 채널들이 공동으로 코딩된다. 이러한 코딩 구성의 실례에 대해서는 도 6e를 참조하라. 상기 Lf, Ls, Rf, Rs 및 C 채널들을 공동으로 코딩하기 위해, 이 채널들을 나타내는 MDCT 스펙트럼이 윈도우 형상 및 변환 길이에 대해 공통의 윈도우로 코딩되어야 한다. 상기 Lf, Ls, Rf 및 Rs 채널들은 다음의 행렬 연산들에 따라 디코딩될 수 있다:
여기서 M은 상기 예 1의 행렬 M과 유사한 라인들을 따라 행렬 Al, Bl, A, A2, B2에 의해 정의된다.
예 4 : 전방 채널들의 조인트 코딩 및 서라운드 채널들의 조인트 코딩
이 예에 따르면, C, Lf 및 Rf 채널들이 공동으로 코딩되고, Rs 및 Ls 채널들이 공동으로 코딩된다. 이러한 코딩 구성의 실례에 대해서는 도 6c를 참조하라. 상기 C, Lf 및 Rf 채널들을 공동으로 코딩하기 위해, 이 채널들을 나타내는 MDCT 스펙트럼이 윈도우 형상 및 변환 길이에 대해 공통의 윈도우로 코딩되어야 한다. 또한, 상기 Rs 및 Ls 채널들을 나타내는 MDCT 스펙트럼이 윈도우 형상 및 변환 길이에 대해 공통의 윈도우로 코딩되어야 한다. 하지만, 상기 C/Lf/Rf에 대한 윈도우는 Rs/Ls에 대한 윈도우와 다를 수 있다. 상기 전방 채널들 및 상기 서라운드 채널들의 별도의 코딩을 달상하기 위해, 행렬들 A2 및 B2는 항등 행렬로 설정되어야 한다. 상기 전방 채널들은,
에 따라서 디코딩 될 수 있으며, 여기서 M은 A1 및 A에 의해 정의된다. 상기 서라운드 채널들은,
에 따라 코딩될 수 있다.
일부 경우에 있어서, 인코딩 장치(310, 410)는 여기서 (제 1 쌍 또는 출력 채널들(322, 324 또는 422, 424)에 대한 요구된 에너지 보상을 갖는) 제 1 주파수로서 참조되는 어떠한 주파수 이상에서 상기 제 2 쌍의 출력 채널들(326, 328)을 0로 설정할 수 있다. 그 이유는 인코딩 장치(310, 410)로부터 대응하는 디코딩 장치(320, 420)로 전송되는 데이터의 양을 감소시키는 것이다. 이러한 경우, 디코더 측에서의 제 2 쌍의 입력 채널들(326', 328')은 상기 제 1 주파수보다 높은 주파수 대역들에 대해 0와 동일하게 될 것이다. 이는 제 2 쌍의 중간 채널들(317', 319')이 또한 상기 제 1 주파수보다 높은 스펙트럼에는 컨텐트를 갖지 않는다는 것을 의미한다. 예시적인 실시예들에 따라, 상기 제 2 쌍의 입력 채널들(326', 328')은 (수정된) 사이드 신호들이 존재하는 해석을 갖는다. 상술한 상황은 따라서 상기 제 1 주파수보다 높은 주파수들에 대해 제 3 및 제 4 디코딩 구성요소들(320a, 320b)에 입력되는 (수정된) 사이드 신호들은 없다는 것을 의미한다.
도 7은 디코딩 장치(320, 420)의 변형인 디코딩 장치(720)를 도시한다. 상기 디코딩 장치(720)는 도 3c 및 도 4c의 제 2 쌍의 입력 채널들(326', 328')의 제한된 스펙트럼 콘텐트를 보상한다. 특히, 상기 제 2 쌍의 입력 채널들(326', 328')이 제 1 주파수까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 갖고, 제 1 쌍의 입력 채널들(322', 324' 또는 422', 424')이 상기 제 1 주파수보다 큰 제 2 주파수까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 갖는 것으로 추정한다.
디코딩 장치(720)는 디코딩 장치들(320 또는 420) 중 하나에 대응하는 제 1 디코딩 구성요소를 구비한다. 상기 디코딩 장치(720)는 제 1 쌍의 출력 채널들(312', 316')을 제 1 합 신호(712) 및 제 1 차 신호(716)로 나타내도록 구성된 레프리젠테이션 구성요소(representation component)(722)를 더 구비한다. 특히, 상기 제 1 주파수보다 아래의 주파수 대역들에 대해, 상기 레프리젠테이션 구성요소(722)는 도 3c 또는 도 4c의 상기 제 1 쌍의 출력 채널들(312', 316')을 앞서 기술된 설명들에 따라 좌-우 포맷으로부터 중간-측 포맷으로 변환한다. 상기 제 1 주파수보다 높은 주파수 대역들에 대해, 상기 레프리젠테이션 구성요소(722)는 도 3c 또는 도 4c의 채널(313')의 스펙트럼 콘텐트를 상기 제 1 합 신호로 매핑한다(상기 제 1 차 신호는 상기 제 1 주파수보다 높은 주파수 대역들에 대해 0과 같다).
유사하게, 상기 레프리젠테이션 구성요소(722)는 제 2 쌍의 출력 채널들(314', 318')을 제 2 합 신호(714) 및 제 2 차 신호(718)로 나타낸다. 특히, 상기 제 1 주파수보다 아래의 주파수 대역들에 대해, 상기 레프리젠테이션 구성요소(722)는 도 3c 또는 도 4c의 상기 제 2 쌍의 출력 채널들(314', 318')을 앞서 기술된 설명들에 따라 좌-우 포맷으로부터 중간-측 포맷으로 변환한다. 상기 제 1 주파수보다 높은 주파수 대역들에 대해, 상기 레프리젠테이션 구성요소(722)는 도 3c 또는 도 4c의 채널(315')의 스펙트럼 콘텐트를 상기 제 2 합 신호로 매핑한다(상기 제 2 차 신호는 상기 제 1 주파수보다 높은 주파수 대역들에 대해 0과 같다).
상기 디코딩 장치(720)는 또한 주파수 확장 구성요소(724)를 구비한다. 상기 주파수 확장 구성요소(724)는 고주파수 재구성을 수행함으로써 상기 제 1 합 신호 및 상기 제 2 합 신호를 제 2 주파수 임계값보다 높은 주파수 범위까지 확장하도록 구성된다. 상기 주파수 확장된 제 1 및 제 2 합 신호들은 728 및 730으로 표기된다. 예를 들면, 상기 주파수 확장 구성요소(724)는 상기 제 1 및 제 2 합 신호들을 보다 높은 주파수들로 확장하도록 스펙트럼 대역 복제 기술들을 적용할 수 있다(EP1285436B1 참조).
디코딩 장치(720)는 또한 믹싱 구성요소(726)를 구비한다. 상기 믹싱 구성요소(726)는 상기 주파수 확장된 합 신호(728)와 제 1 차 신호(716)의 믹싱(mixing)을 수행한다. 상기 제 1 주파수보다 아래의 주파수들에 대해, 상기 믹싱은 상기 주파수 확장된 제 1 합과 상기 제 1 차 신호의 역의 합-및-차 변환을 수행한다. 결과적으로, 상기 믹싱 구성요소(726)의 출력 채널들(732, 734)은 상기 제 1 주파수보다 아래의 주파수 대역들에 대해 도 3c 및 도 4c의 제 1 쌍의 출력 채널들(312', 316')과 같다.
제 1 주파수 임계값보다 높은 주파수들에 대해, 상기 믹싱은 상기 제 1 주파수 임계값보다 높은 주파수 대역들에 대응하는 주파수 확장된 제 1 합 신호의 일부의 파라메트릭 업믹싱(한 신호에서 두 신호들(732, 734)로)을 수행한다. 적용가능한 파라메트릭 업믹싱 절차는 예를 들면 EP1410687Bl에 기술된다. 상기 파라메트릭 업믹싱은 상기 주파수 확장된 제 1 합 신호(728)의 역상관된 버전을 발생하는 것을 포함할 수 있으며, 상기 역상관된 버전은 상기 믹싱 구성요소(726)에 입력되는 (인코더 측에서 추출된) 파라미터들에 따라 상기 주파수 확장된 제 1 합 신호(728)와 이후 믹싱된다. 그에 따라, 상기 제 1 주파수보다 높은 주파수들에 대해, 상기 믹싱 구성요소(726)의 출력 채널들(732, 734)은 상기 주파수 확장된 제 1 합 신호(728)의 업믹스에 대응한다.
유사한 방식으로, 상기 믹싱 구성요소는 주파수 확장된 제 2 합 신호(730) 및 제 2 차 신호(718)를 처리한다.
5-채널 시스템의 경우(디코딩 장치(720)가 디코딩 장치(420)를 구비할 때)에, 상기 주파수 확장 구성요소(724)는 주파수 확장된 제 5 출력 채널(740)을 발생하기 위해 제 5 출력 채널(419)을 주파수 확장에 적용할 수 있다.
제 2 주파수보다 높은 주파수 범위까지 제 1 합 신호(712)와 제 2 합 신호(714)를 확장하고, 제 1 합 신호(728)와 제 1 차 신호(716)를 믹싱하고, 제 2 합 신호(730)와 제 2 차 신호(718)를 믹싱하는 동작은 일반적으로 QMF(quadrature mirror filter) 도메인에서 수행된다. 따라서, 디코딩 장치(720)는 상기 합 및 차 신호들(712, 716, 714, 718)(및 제 5 출력 채널(410))을 상기 주파수 확장 및 상기 믹싱을 수행하기 전에 QMF 도메인으로 변환하는 QMF 변환 구성요소를 구비할 수 있다. 또한, 상기 디코딩 장치(720)는 출력 신호들(732, 734, 736, 738 (및 740))을 시간 도메인으로 변환하는 역 QMF 변환 구성요소를 구비할 수 있다.
도 5a,도 5b 및 도 5c는 도 1a-c, 도 2a-c, 도 3a-c 및 도 4a-c와 관련하여 기술된 인코딩/디코딩 프레임워크에 추가 채널 쌍들이 포함될 수 있는 방법을 도시한다. 도 5a는 제 1 채널 셋업(502) 및 두 개의 추가 채널들(506, 508)을 구비하는 멀티채널 셋업(500)을 도시한다. 상기 제 1 채널 셋업(502)은 적어도 두 개의 채널들(502a, 502b)을 구비하고, 예를 들면 도 1a, 도 2a, 도 3a 및 도 4a에서 설명된 채널 셋업들 중 하나에 대응할 수 있다. 도시된 예에 있어서, 상기 제 1 채널 셋업(502)은 다섯 개의 채널들을 구비하고, 따라서 도 4의 채널 셋업에 대응한다. 도시된 예에 있어서, 상기 두 개의 추가 채널들(506, 508)은 예를 들면 좌측 후방 서라운드 스피커 Lbs 및 우측 후방 서라운드 스피커 Rbs에 대응할 수 있다.
도 5b는 채널 셋업(500)을 인코딩하는 데 사용될 수 있는 인코딩 장치(510)를 도시한다.
상기 인코딩 장치(510)는 제 1 인코딩 구성요소(510a), 제 2 인코딩 구성요소(510b), 제 3 인코딩 구성요소(510c), 및 제 4 인코딩 구성요소(510d)를 구비한다. 제 1 인코딩 구성요소(510a), 제 2 인코딩 구성요소(510b), 및 제 4 인코딩 구성요소(510d)는 도 1b에 도시된 것과 같은 스테레오 인코딩 구성요소이다.
제 3 인코딩 구성요소(510c)는 적어도 두 개의 입력 채널들을 수신하고, 이들을 동일한 수의 출력 채널들로 변환하도록 구성된다. 예를 들면, 제 3 인코딩 구성요소(510c)는 도 1b, 도 2b, 도 3b 및 도 4b의 인코딩 장치들(110, 210, 310, 410) 중 하나에 대응할 수 있다. 하지만, 더욱 일반적으로는, 상기 제 3 인코딩 구성요소(510c)는 적어도 두 개의 입력 채널들을 수신하고, 이들을 동일한 수의 출력 채널들로 변환하도록 구성된 임의의 인코딩 구성요소가 될 수 있다.
상기 인코딩 장치(510)는 제 1 채널 셋업(502)의 채널들의 수에 대응하는 제 1 수의 입력 채널들을 수신한다. 상기한 바에 따라서, 상기 제 1 수는 그에 따라 적어도 2개와 동일하고, 상기 제 1 수의 입력 채널들은 제 1 입력 채널(512a) 및 제 2 입력 채널(512b) (및 가능하다면 또한 일부 남아있는 채널들(512c))을 포함한다. 도시된 예에 있어서, 상기 제 1 및 제 2 입력 채널들(512a, 512b)은 도 5a의 채널들(502a, 502b)에 대응할 수 있다.
상기 인코딩 장치(510)는 또한 두 개의 추가 입력 채널들로서, 제 1 추가 입력 채널(516) 및 제 2 추가 입력 채널(518)을 수신한다. 상기 입력 채널들(512a-c, 516, 518)은 일반적으로 MDCT 스펙트럼으로 표현된다.
제 1 입력 채널(512a) 및 제 1 추가 채널(516)은 제 1 스테레오 인코딩 구성요소(510a)에 입력된다. 상기 제 1 스테레오 인코딩 구성요소(510a)는 상술한 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩을 수행한다. 상기 제 1 스테레오 인코딩 구성요소(510a)는 제 1 채널(513) 및 제 2 채널(517)을 포함하는 제 1 쌍의 중간 출력 채널들을 출력한다.
마찬가지로, 제 2 입력 채널(512b) 및 제 2 추가 입력 채널(518)은 제 2 스테레오 인코딩 구성요소(510b)에 입력된다. 상기 제 2 스테레오 인코딩 구성요소(510b)는 상술한 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩을 수행한다. 상기 제 2 스테레오 인코딩 구성요소(510a)는 제 1 채널(515) 및 제 2 채널(519)을 포함하는 제 2 쌍의 중간 출력 채널들을 출력한다.
도 5a의 예시적인 채널 셋업(500)을 고려하면, 제 1 및 제 2 스테레오 인코딩 구성요소들(510a, 510b)에 의해 실행되는 프로세스는 Ls 채널(502a)과의 Lbs 채널(506)의 스테레오 코딩 및 Rbs 채널(508) 및 Rs 채널(502b)의 스테레오 코딩에 각각 대응한다. 하지만, 다른 예시적인 채널 셋업들에 의해 다른 해석들이 얻어지게 된다는 것을 이해해야한다.
제 1 쌍의 중간 출력 채널들의 제 1 채널(513) 및 제 2 쌍의 중간 출력 채널들의 제 1 채널(515)이 이후, 상기 제 1 입력 채널(512a) 및 상기 제 2 입력 채널(512b)을 제외한 상기 제 1 수의 입력 채널들(512c)과 함께 제 3 인코딩 구성요소(510c)에 입력된다. 상기 제 3 인코딩 구성요소(510c)는 제 1 쌍의 출력 채널들(522, 524)과 적용가능하다면 추가로 출력 채널들(521)을 포함하는 동일한 양의 출력 채널들을 발생하도록 그 입력 채널들(513, 515, 512c)을 변환한다. 상기 제 3 인코딩 구성요소는 예컨대 도 1b, 도 2b, 도 3b 및 도 4b와 관련하여 개시된 것과 유사하게 그 입력 채널들(513, 515, 512c)을 변환할 수 있다.
유사하게, 제 1 쌍의 중간 출력 채널들의 제 2 채널(517) 및 제 2 쌍의 중간 출력 채널들의 제 2 채널(519)이 상술한 스테레오 코딩 방식들 중 하나에 따라 스테레오 인코딩을 수행하는 제 4 스테레오 인코딩 구성요소(510d)에 입력된다. 상기 제 4 스테레오 인코딩 구성요소(510d)는 제 2 쌍의 출력 채널들(526, 528)을 출력한다.
상기 출력 채널들(521, 522, 524, 526, 528)은 대응하는 디코딩 장치에 전송될 비트 스트림을 형성하도록 양자화 및 코딩된다.
도 5c는 대응하는 디코딩 장치(520)를 도시한다. 상기 디코딩 장치(520)는 제 1 디코딩 구성요소(520c), 제 2 디코딩 구성요소(520d), 제 3 디코딩 구성요소(520a), 및 제 4 디코딩 구성요소(520b)를 구비한다. 상기 제 2 디코딩 구성요소(520d), 상기 제 3 디코딩 구성요소(520a) 및 상기 제 4 디코딩 구성요소(520b)는 도 1c에 도시된 것과 같은 스테레오 디코딩 구성요소들이다.
제 1 디코딩 구성요소(520a)는 적어도 두 개의 입력 채널들을 수신하고, 이들을 동일한 수의 출력 채널들로 변환하도록 구성된다. 예를 들어, 제 1 디코딩 구성요소(520c)는 도 1b, 도 2b, 도 3b 및 도 4b의 디코딩 장치들(120, 220, 320, 420) 중 하나에 대응할 수 있다. 하지만, 보다 일반적으로, 제 1 디코딩 구성요소(520c)는 적어도 두 개의 입력 채널들을 수신하고, 이들을 동일한 수의 출력 채널들로 변환하도록 구성되는 임의의 디코딩 구성요소가 될 수 있다.
상기 디코딩 장치(520)는 인코딩 장치(510)에 의해 전송된 비트 스트림을 수신하고 디코딩하고 역양자화한다. 이러한 방식으로, 상기 디코딩 장치(520)는 상기 인코딩 장치(510)의 출력 채널들(521, 522, 524)에 대응하는 제 1 수의 입력 채널들(521', 522', 524')을 수신한다. 상기한 바에 따라서, 상기 제 1 수의 입력 채널들은 제 1 입력 채널(522'), 제 2 입력 채널(524') (및 가능하다면 또한 일부 남아있는 채널들(521'))을 포함한다.
상기 디코딩 장치(520)는 또한 두 개의 추가 입력 채널들로서, 제 1 추가 입력 채널(526') 및 제 2 추가 입력 채널(528')(인코더 측 상의 출력 채널들(526, 528)에 대응)을 수신한다.
상기 제 1 수의 입력 채널들(521', 522', 524')은 제 1 디코딩 구성요소(520c)에 입력된다. 상기 제 1 디코딩 구성요소(520c)는 제 1 쌍의 중간 출력 채널들(513', 515') 및 가능하다면 추가의 출력 채널들(512c')을 포함하는 동일한 양의 출력 채널들을 발생하도록 그 입력 채널들(521', 522', 524')을 변환한다. 상기 제 1 디코딩 구성요소(520c)는 예를 들면 도 1c, 도 2c, 도 3c 및 도 4c와 관련하여 개시된 것과 유사하게 그 입력 채널들(521', 522', 524')을 변환한다. 특히, 제 1 디코딩 구성요소(520c)는 인코더 측 상기 제 3 인코딩 구성요소(510c)에 의해 수행되는 인코딩의 역이 되는 디코딩을 수행하도록 구성된다.
상기 제 1 추가 입력 채널(526) 및 상기 제 2 추가 입력 채널(528)은 제 2 스테레오 디코딩 구성요소(520d)에 입력되며, 여기에서 인코더 측 상의 제 4 스테레오 인코딩 구성요소(510d)에 의해 수행되는 인코딩의 역에 대응하는 스테레오 디코딩을 수행한다. 상기 제 2 스테레오 디코딩 구성요소(520d)는 제 2 쌍의 중간 출력 채널들(517', 519')을 출력한다.
상기 제 1 쌍의 중간 출력 채널들의 제 1 채널(513') 및 상기 제 2 쌍의 중간 출력 채널들의 제 1 채널(517')은 제 3 스테레오 디코딩 구성요소(520a)에 입력된다. 상기 제 3 스테레오 디코딩 구성요소(520a)는 인코더 측 상의 제 1 스테레오 인코딩 구성요소(510a)에 의해 수행되는 인코딩의 역에 대응하는 스테레오 디코딩을 수행한다. 상기 제 3 스테레오 디코딩 구성요소(520a)는 제 1 채널(512a') 및 제 2 채널(516')을 포함하는 제 1 쌍의 출력 채널들을 출력한다.
유사하게, 상기 제 1 쌍의 중간 출력 채널들의 제 2 채널(515') 및 상기 제 2 쌍의 중간 출력 채널들의 제 2 채널(519')은 제 4 스테레오 디코딩 구성요소(520b)에 입력된다. 상기 제 4 스테레오 디코딩 구성요소(520b)는 인코더 측 상의 제 2 스테레오 인코딩 구성요소(510b)에 의해 수행되는 인코딩의 역에 대응하는 스테레오 디코딩을 수행한다. 상기 제 4 스테레오 디코딩 구성요소(520a)는 제 1 채널(512b') 및 제 2 채널(518')을 포함하는 제 2 쌍의 출력 채널들을 출력한다.
도 6a, 도 6b, 도 6c, 도 6d 및 도 6e는 5-채널 시스템의 다섯 개의 채널들을 도시한다. 다섯 개의 채널들은 상이한 코딩 구성들을 형성하도록 상이한 그룹들로 분할될 수 있다. 각각의 그룹은 상기한 바에 따라서 인코딩 장치들을 사용하여 공동으로 인코딩되는 채널들에 대응한다.
제 1 코딩 구성(610)이 도 6a에 도시된다. 제 1 코딩 구성(610)은 하나의 채널(여기에서는 센터 채널 C)로 이루어진 제 1 그룹(612), 두 개의 채널들(여기에서는, Lf 및 Rf 채널들)로 이루어진 제 2 그룹(614), 및 두 개의 채널들(여기에서는 Ls 및 Rs)로 이루어진 제 3 그룹(616)을 구비한다. 제 1 그룹(612)의 채널은 별도로 코딩될 것이고, 제 2 그룹(614)의 채널들은 공동으로 코딩될 것이며, 제 3 그룹(616)의 채널들은 공동으로 코딩될 것이다. 이러한 인코딩은 예를 들어, 입력 채널(312)에 Lf 채널을 매핑하고, 입력 채널(316)에 Ls 채널을 매핑하고, 입력 채널(419)에 C 채널을 매핑하고, 입력 채널(314)에 Rf 채널을 매핑하고, 입력 채널(318)에 Rs 채널을 매핑함으로써, 도 4b의 인코딩 장치(410)에 의해 달성될 수 있다. 또한, 제 1 스테레오 인코딩 구성요소(310a), 제 2 스테레오 인코딩 구성요소(310b) 및 제 5 스테레오 인코딩 구성요소(410e)의 코딩 방식들은 LR-코딩(입력 신호들의 통과)으로 설정되어야한다. 도 6b는 제 1 코딩 구성(610)의 변형(610')을 도시한다. 제 1 코딩 구성의 변형(610')에서, 제 2 그룹(614')은 Lf 및 Ls 채널들에 대응하고, 제 3 그룹(616')은 Rf 및 Rs 채널들에 대응한다. 도 6a 및 도 6b의 코딩 구성들은 다음에 있어서 1-2-2 코딩 구성들로서 참조된다.
제 2 코딩 구성(620)이 도 6c에 도시된다. 제 2 코딩 구성(620)은 세 개의 채널들(여기에서는 센터 채널 C, Lf 채널 및 Rf 채널)로 이루어진 제 1 그룹(622) 및 두 개의 채널들(여기에서는 Ls 및 Rs 채널들)로 이루어진 제 2 그룹(624)을 구비한다. 도 6c의 코딩 구성은 다음에 있어서 2-3 코딩 구성으로서 참조된다. 제 1 그룹(622)의 채널들은 공동으로 코딩될 것이고, 제 2 그룹(624)의 채널들은 상기 제 1 그룹(622)과는 별도로 공동으로 코딩될 것이다. 이러한 인코딩은 예를 들면, 입력 채널(312)에 Lf 채널을 매핑하고, 입력 채널(316)에 Ls 채널을 매핑하고, 입력 채널(419)에 C 채널을 매핑하고, 입력 채널(314)에 Rf 채널을 매핑하고, 입력 채널(318)에 Rs 채널을 매핑함으로써, 도 4b의 인코딩 장치(410)에 의해 달성될 수 있다. 또한, 제 1 스테레오 인코딩 구성요소(310a), 제 2 스테레오 인코딩 구성요소(310b)의 코딩 방식들은 LR-코딩(입력 신호들의 통과)으로 설정되어야한다.
제 3 코딩 구성(630)이 도 6d에 도시된다. 제 3 코딩 구성(620)은 하나의 채널(여기에서는 센터 채널 C)로 이루어진 제 1 그룹(632) 및 네 개의 채널(여기에서는 Ls 및 Rs 채널들)로 이루어진 제 2 그룹(634)을 구비한다. 도 6d의 코딩 구성은 다음에 있어서 1-4 코딩 구성으로서 참조된다. 제 1 그룹(632)의 채널을 별도로 코딩될 것이고, 제 2 그룹(634)의 채널들은 공동으로 코딩될 것이다. 이러한 코딩은 예를 들면, 입력 채널(312)에 Lf 채널을 매핑하고, 입력 채널(316)에 Ls 채널을 매핑하고, 입력 채널(419)에 C 채널을 매핑하고, 입력 채널(314)에 Rf 채널을 매핑하고, 입력 채널(318)에 Rs 채널을 매핑함으로써, 도 4b의 인코딩 장치(410)에 의해 달성될 수 있다. 또한, 제 5 스테레오 인코딩 구성요소(410e)의 코딩 방식들은 LR-코딩(입력 신호들의 통과)으로 설정되어야한다.
제 4 코딩 구성(640)이 도 6e에 도시된다. 제 4 코딩 구성(640)은, 모든 채널들이 공동으로 코딩되는 것을 의미하는, 다섯 채널들로 이루어진 단일의 그룹(642)을 구비한다. 도 6e는 코딩 구성은 다음에 있어서 0-5 코딩 구성으로서 참조된다. 예를 들면, 상기 채널들은 입력 채널(312)에 Lf 채널을 매핑하고, 입력 채널(316)에 Ls 채널을 매핑하고, 입력 채널(419)에 C 채널을 매핑하고, 입력 채널(314)에 Rf 채널을 매핑하고, 입력 채널(318)에 Rs 채널을 매핑함으로써, 도 4b의 인코딩 장치(410)에 의해 공동으로 인코딩될 수 있다.
상기 코딩 구성들은 5-채널 시스템과 관련하여 설명되었지만, 네 개 이상의 더 많은 채널들을 갖는 시스템들에 동일하게 적용 가능하다.
인코딩 장치는, 따라서, 상이한 코딩 구성들(610, 610', 620, 630, 640)에 따라 멀티채널 시스템의 오디오 콘텐트를 코딩할 수 있다. 인코더 측에서 사용되는 코딩 구성은 디코더로 전달되어야 한다. 이러한 목적을 위해, 특정 시그널링 포맷이 사용될 수 있다. 적어도 네 개의 채널들을 구비하는 오디오 시스템에 대해, 상기 시그널링 포맷은 디코더 측에 적용될 상기 복수의 구성들(610, 610', 620, 630, 640)들 중 하나를 나타내는 적어도 두 개의 비트들을 구비한다. 예를 들면, 각각의 코딩 구성은 식별 번호와 연관될 수 있으며, 상기 적어도 두 개의 비트들은 디코더에서 적용하도록 상기 코딩 구성의 식별 번호를 나타낼 수 있다.
도 6a 내지 도 6e에 도시된 5-채널 시스템에 대해, 두 비트들이 1-2-2 구성, 2-3 구성, 1-4 구성 또는 0-5 구성 사이에서 선택하는데 사용될 수 있다. 상기 두 비트들이 1-2-2 구성을 나타내는 경우, 상기 시그널링 포맷은 상기 1-2-2 구성의 변형이 선택되는지, 즉 도 6a의 좌-우 코딩 구성 또는 도 6b의 전방-후방 구성이 적용될 지의 여부를 나타내는 제 3 비트를 구비할 수 있다. 다음의 의사-코드(pseudo-code)는 구현될 수 있는 방법의 예를 제공한다:
등가물, 확장, 대체물 및 기타
본 개시의 추가적인 실시예들은 상기한 명세서를 학습한 후라면 당 기술분야에 숙련된 사람들에게는 명백할 것이다. 비록 본 명세서 및 도면들이 실시예들 및 예들을 개시하고는 있지만, 이러한 개시는 이들 특정 예들에 제한되지 않는다. 다양한 수정과 변경들이 첨부된 청구범위에 의해 정의된 본 개시의 범위를 벗어나지 않고서 이루어질 수 있다. 청구범위에 나타나있는 어떠한 참조 부호들도 그 범위를 제한하는 것으로 이해되어서는 안 된다.
부가적으로, 개시된 실시예들에 대한 변형들은 도면들, 개시된 내용 및 첨부된 청구범위를 학습하여, 본 개시를 실천함으로써 당업자에 의해 이해될 수 있으며 그 결과가 얻어질 수 있다. 청구범위에 있어서, 용어 "구비하다"는 다른 요소들 또는 단계들을 배제하지 않으며, 복수의 표현이 아닌 것도 복수를 배제하지 않는다. 임의의 측정치들이 상호 상이한 종속 청구항들에서 인용되는 단순한 사실은 이들 측정된 것들의 결합이 유익하게 사용될 수 없다는 것을 나타내는 것은 아니다.
본 명세서에서 개시된 시스템들 및 방법들은 소프트웨어, 펌웨어, 하드웨어 또는 이들의 조합으로 구현될 수 있다. 하드웨어 구현에 있어서, 상기한 설명에서 참조되는 기능 유닛들 간의 작업의 분할은 물리적 유닛들로의 분할에 반드시 대응하는 것은 아니며; 대조적으로, 하나의 물리적 성분은 복수의 기능들을 가질 수 있고, 하나의 작업은 몇몇의 물리적 성분들이 협력하여 실행될 수 있다. 임의의 성분들 또는 모든 성분들은 디지털 신호 프로세서 또는 마이크로프로세서에 의해 실행되는 소프트웨어로서 구현될 수 있으며, 하드웨어로서 또는 어플리케이션 특정의 집적 회로로서 구현될 수 있다. 그러한 소프트웨어는, 컴퓨터 저장 매체(또는 비-일시적 매체) 및 통신 매체(또는 일시적 매체)를 구비할 수 있는, 컴퓨터 판독가능 매체 상에 분포될 수 있다. 당 기술분야에 숙련된 사람에게 공지된 바와 같이, 용어 "컴퓨터 저장 매체"는, 컴퓨터 판독 가능한 지시들, 데이터 구조들, 프로그램 모듈들 또는 다른 데이터와 같은 정보 저장을 위한 어떠한 방법 또는 기술로 구현될 수 있는 휘발성과 비휘발성, 제거와 제거 불가능한 양쪽 모두의 매체를 포함한다. 컴퓨터 저장 매체는, 이에 제한되지는 않지만, RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기술, CD-ROM, 디지털 다기능 디스크(DVD) 또는 다른 광학 디스크 저장장치, 자기 카세트, 자기 테입, 자기 디스크 저장장치 또는 다른 자기 저장 디바이스, 또는 원하는 정보를 저장할 수 있으며 컴퓨터에 의해 액세스될 수 있는 어떠한 다른 매체도 포함한다. 또한, 통신 매체는 통상 컴퓨터 판독가능한 지시들, 데이터 구조들, 프로그램 모듈들 또는 반송파 또는 다른 전달 메카니즘과 같은 변조된 데이터 신호 내의 다른 데이터를 포함하며, 어떠한 정보 전달 매체도 포함한다는 것은 당업자에게는 널리 알려진 것이다.
Claims (31)
- 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 디코딩 방법에 있어서:
제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하는 단계;
상기 제 1 쌍의 입력 채널들을 제 1 스테레오 디코딩하는 단계;
상기 제 2 쌍의 입력 채널들을 제 2 스테레오 디코딩하는 단계;
제 1 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 1 채널을 제 3 스테레오 디코딩하는 단계;
제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 2 채널을 제 4 스테레오 디코딩하는 단계; 및
상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하는 단계를 구비하는, 디코딩 방법. - 제 1 항에 있어서,
상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널은 상기 제 1 스테레오 디코딩으로 인한 제 2 채널인, 디코딩 방법. - 제 1 항에 있어서,
제 5 입력 채널을 수신하는 단계; 및
상기 제 5 입력 채널 및 상기 제 1 스테레오 디코딩으로 인한 제 2 채널을 제 5 스테레오 디코딩하는 단계를 더 구비하며,
상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널은 상기 제 5 스테레오 디코딩으로 인한 제 1 채널과 동일하고,
상기 제 5 스테레오 디코딩으로 인한 제 2 채널은 제 5 출력 채널로서 출력되는, 디코딩 방법. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
제 3 쌍의 입력 채널들을 수신하는 단계;
상기 제 3 쌍의 입력 채널들을 제 6 스테레오 디코딩하는 단계;
상기 제 1 쌍의 출력 채널들의 제 2 채널 및 상기 제 6 스테레오 디코딩으로 인한 제 1 채널을 제 7 스테레오 디코딩하는 단계;
상기 제 2 쌍의 출력 채널들의 제 2 채널 및 상기 제 6 스테레오 디코딩으로 인한 제 2 채널을 제 8 스테레오 디코딩하는 단계; 및
상기 제 1 쌍의 출력 채널들의 제 1 채널, 제 7 스테레오 디코딩으로 인한 채널들의 쌍, 상기 제 2 쌍의 출력 채널들의 제 1 채널 및 상기 제 8 스테레오 디코딩으로 인한 채널들의 쌍을 출력하는 단계를 더 구비하는, 디코딩 방법. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 제 1, 제 2, 제 3 및 제 4 스테레오 디코딩 및 상기 제 5, 제 6, 제 7 및 제 8 스테레오 디코딩은 적용 가능할 때, 좌-우 코딩, 합-차 코딩 및 향상된 합-차 코딩을 포함하는 코딩 방식에 따른 스테레오 디코딩을 수행하는 단계를 구비하는, 디코딩 방법. - 제 5 항에 있어서,
상이한 코딩 방식들이 상이한 주파수 대역들에 대해 사용되는, 디코딩 방법. - 제 5 항 또는 제 6 항에 있어서,
상이한 코딩 방식들이 상이한 시간 프레임들에 대해 사용되는, 디코딩 방법. - 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
상기 제 1, 상기 제 2, 상기 제 3, 상기 제 4 및 상기 제 5, 상기 제 6, 상기 제 7, 상기 제 8 스테레오 디코딩은 적용 가능할 경우, 임계적으로 샘플링된(critically sampled) 수정 이산 코사인 변환(MDCT) 도메인에서 수행되는, 디코딩 방법. - 제 8 항에 있어서,
모든 입력 채널들은 동일한 윈도우를 사용하여 MDCT 도메인으로 변환되는, 디코딩 방법. - 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 제 2 쌍의 입력 채널들은 제 1 주파수 임계값까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 갖고, 그에 따라 상기 제 2 스테레오 디코딩으로 인한 채널들의 쌍은 상기 제 1 주파수 임계값 이상의 주파수 대역들에 대해 0과 같게 되는, 디코딩 방법. - 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
상기 제 2 쌍의 입력 채널들은 제 1 주파수 임계값까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 갖고, 상기 제 1 쌍의 입력 채널들은 상기 제 1 주파수 임계값보다 큰 제 2 주파수 임계값까지의 주파수 대역들에 대응하는 스펙트럼 콘텐트를 가지며,
상기 방법은:
상기 제 1 쌍의 출력 채널들을 제 1 합 신호 및 제 1 차 신호로서 나타내고, 상기 제 2 쌍의 출력 채널들을 제 2 합 신호 및 제 2 차 신호로서 나타내는 단계;
고 주파수 재구성을 수행함으로써 상기 제 2 주파수 임계값 이상의 주파수 범위까지 상기 제 1 합 신호 및 상기 제 2 합 신호를 확장하는 단계;
상기 제 1 합 신호와 상기 제 1 차 신호를 믹싱하는 단계로서, 상기 제 1 주파수 임계값 아래의 주파수들에 대해 상기 제 1 합 및 상기 제 1 차 신호의 역의 합-및-차 변환을 수행하는 단계를 구비하고, 상기 제 1 주파수 임계값 이상의 주파수들에 대해 상기 제 1 주파수 임계값 이상의 주파수 대역들에 대응하는 상기 제 1 합 신호의 일부의 파라메트릭 업-믹싱을 수행하는 단계를 구비하는, 상기 믹싱 단계; 및
상기 제 2 합 신호와 상기 제 2 차 신호를 믹싱하는 단계로서, 상기 제 1 주파수 임계값 아래의 주파수들에 대해 상기 제 2 합 및 상기 제 2 차 신호의 역의 합-및-차 변환을 수행하는 단계를 구비하고, 상기 제 1 주파수 임계값 이상의 주파수들에 대해 상기 제 1 주파수 임계값 이상의 주파수 대역들에 대응하는 제 2 합 신호의 일부의 파라메트릭 업-믹싱을 수행하는 단계를 구비하는, 상기 믹싱 단계를 더 구비하는, 디코딩 방법. - 제 11 항에 있어서,
상기 제 2 주파수 임계값 이상의 주파수 범위까지 상기 제 1 합 신호 및 상기 제 2 합 신호를 확장하는 단계, 상기 제 1 합 신호와 상기 제 1 차 신호를 믹싱하는 단계, 및 상기 제 2 합 신호와 상기 제 2 차 신호를 믹싱하는 단계는 QMF(quadrature mirror filter) 도메인에서 수행되는, 디코딩 방법. - 제 1 항 내지 제 12 항 중 어느 한 항의 방법을 수행하기 위한 지시들을 갖는 컴퓨터 판독 가능 매체를 구비하는 컴퓨터 프로그램 제품.
- 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 디코딩 장치에 있어서:
제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하도록 구성된 수신 구성요소;
상기 제 1 쌍의 입력 채널들을 제 1 스테레오 디코딩하도록 구성된 제 1 스테레오 디코딩 구성요소;
상기 제 2 쌍의 입력 채널들을 제 2 스테레오 디코딩하도록 구성된 제 2 스테레오 디코딩 구성요소;
제 1 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 1 채널을 제 3 스테레오 디코딩하도록 구성된 제 3 스테레오 디코딩 구성요소;
제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 디코딩으로 인한 제 2 채널과 연관된 오디오 채널 및 상기 제 2 스테레오 디코딩으로 인한 제 2 채널을 제 4 스테레오 디코딩하도록 구성된 제 4 스테레오 디코딩 구성요소; 및
상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하도록 구성된 출력 구성요소를 구비하는, 디코딩 장치. - 제 14 항에 따른 디코딩 장치를 구비하는 오디오 시스템.
- 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 인코딩 방법에 있어서:
제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하는 단계;
상기 제 1 쌍의 입력 채널들을 제 1 스테레오 인코딩하는 단계;
상기 제 2 쌍의 입력 채널들을 제 2 스테레오 인코딩하는 단계;
제 1 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널을 제 3 스테레오 인코딩하는 단계;
제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 2 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 2 채널을 제 4 스테레오 인코딩하는 단계; 및
상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하는 단계를 구비하는, 인코딩 방법. - 제 16 항에 있어서,
상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널은 상기 제 2 스테레오 인코딩으로 인한 제 1 채널인, 인코딩 방법. - 제 16 항에 있어서,
제 5 입력 채널을 수신하는 단계; 및
상기 제 5 입력 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 1 채널을 제 5 스테레오 인코딩하는 단계를 더 구비하며,
상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널은 상기 제 5 스테레오 인코딩으로 인한 제 1 채널이고,
상기 제 5 스테레오 인코딩으로 인한 제 2 채널은 제 5 출력 채널로서 출력되는, 인코딩 방법. - 제 16 항 내지 제 18 항 중 어느 한 항에 있어서,
제 3 쌍의 입력 채널들을 수신하는 단계;
상기 제 1 쌍의 입력 채널들의 제 2 채널 및 상기 제 3 쌍의 입력 채널들의 제 1 채널을 제 6 스테레오 인코딩하는 단계;
상기 제 2 쌍의 입력 채널들의 제 2 채널 및 상기 제 3 쌍의 입력 채널들의 제 2 채널을 제 7 스테레오 인코딩하는 단계로서, 상기 제 6 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 1 쌍의 입력 채널들의 제 1 채널이 상기 제 1 스테레오 인코딩에 적용되고, 상기 제 7 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 2 쌍의 입력 채널들의 제 1 채널이 상기 제 2 스테레오 인코딩에 적용되는, 상기 제 7 스테레오 인코딩하는 단계; 및
제 3 쌍의 출력 채널들을 획득하기 위해 상기 제 6 스테레오 인코딩으로 인한 제 2 채널 및 상기 제 7 스테레오 인코딩으로 인한 제 2 채널을 제 8 스테레오 인코딩하는 단계를 더 구비하는, 인코딩 방법. - 제 16 항 내지 제 19 항 중 어느 한 항에 있어서,
상기 제 1, 제 2, 제 3 및 제 4 스테레오 인코딩 및 상기 제 5, 제 6, 제 7 및 제 8 스테레오 인코딩은 적용 가능할 때, 좌-우 코딩, 합-차 코딩 및 향상된 합-차 코딩을 포함하는 코딩 방식에 따른 스테레오 인코딩을 수행하는 단계를 구비하는, 인코딩 방법. - 제 20 항에 있어서,
상이한 코딩 방식들이 상이한 주파수 대역들에 대해 사용되는, 인코딩 방법. - 제 20 항 또는 제 21 항에 있어서,
상이한 코딩 방식들이 상이한 시간의 프레임들에 대해 사용되는, 인코딩 방법. - 제 16 항 내지 제 22 항 중 어느 한 항에 있어서,
상기 제 1, 상기 제 2, 상기 제 3, 상기 제 4 및 상기 제 5, 상기 제 6, 상기 제 7, 상기 제 8 스테레오 인코딩은 적용 가능할 경우, 임계적으로 샘플링된 수정 이산 코사인 변환(MDCT) 도메인에서 수행되는, 인코딩 방법. - 제 23 항에 있어서,
모든 입력 채널들은 동일한 윈도우를 사용하여 MDCT 도메인으로 변환되는, 인코딩 방법. - 제 16 항 내지 제 24 항 중 어느 한 항의 방법을 수행하기 위한 지시들을 갖는 컴퓨터 판독 가능 매체를 구비하는 컴퓨터 프로그램 제품.
- 적어도 네 개의 채널들을 구비하는 멀티채널 오디오 시스템에서의 인코딩 장치에 있어서:
제 1 쌍의 입력 채널들 및 제 2 쌍의 입력 채널들을 수신하도록 구성된 수신 구성요소;
상기 제 1 쌍의 입력 채널들을 제 1 스테레오 인코딩하도록 구성된 제 1 스테레오 인코딩 구성요소;
상기 제 2 쌍의 입력 채널들을 제 2 스테레오 인코딩하도록 구성된 제 2 스테레오 인코딩 구성요소;
제 1 쌍의 출력 채널들을 제공하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 1 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 1 채널과 연관된 오디오 채널을 제 3 스테레오 인코딩하도록 구성된 제 3 스테레오 인코딩 구성요소;
제 2 쌍의 출력 채널들을 획득하기 위해 상기 제 1 스테레오 인코딩으로 인한 제 2 채널 및 상기 제 2 스테레오 인코딩으로 인한 제 2 채널을 제 4 스테레오 인코딩하도록 구성된 제 4 스테레오 인코딩 구성요소; 및
상기 제 1 및 상기 제 2 쌍의 출력 채널들을 출력하도록 구성된 출력 구성요소를 구비하는, 인코딩 장치. - 제 26 항에 따른 인코딩 장치를 구비하는 오디오 시스템.
- 멀티채널 오디오 시스템의 오디오 콘텐트를 나타내는 신호를 디코딩할 때 사용하는 코딩 구성을 인코더에 의해 디코더에 나타내기 위한 시그널링 포맷(signaling format)에 있어서,
상기 멀티채널 오디오 시스템은 적어도 네 개의 채널들을 구비하고, 상기 적어도 네 개의 채널들은 복수의 구성들에 따라 상이한 그룹들로 분할 가능하고, 각각의 그룹은 공동으로 인코딩되는 채널들에 대응하며, 상기 시그널링 포맷은 상기 디코더에 의해 적용될 상기 복수의 구성들 중 하나를 나타내는 적어도 두 개의 비트들을 구비하는, 시그널링 포맷. - 제 28 항에 있어서,
상기 적어도 두 개의 비트들은 상기 복수의 구성들 중 하나의 식별 번호를 나타냄으로써 상기 복수의 구성들 중 상기 하나를 나타내는, 시그널링 포맷. - 제 28 항 또는 제 29 항에 있어서,
상기 멀티채널 오디오 시스템은 다섯 개의 채널들을 구비하고,
상기 코딩 구성들은:
다섯 채널들의 조인트 코딩;
네 개의 채널들의 조인트 코딩 및 마지막 채널의 별도의 코딩;
세 개의 채널들의 조인트 코딩 및 두 개의 다른 채널들의 별도의 조인트 코딩; 및
두 개의 채널들의 조인트 코딩, 두 개의 다른 채널들의 별도의 조인트 코딩 및 마지막 채널의 별도의 코딩에 대응하는, 시그널링 포맷. - 제 30 항에 있어서,
상기 적어도 두 개의 비트들이 두 개의 채널들의 조인트 코딩, 두 개의 다른 채널들의 별도의 조인트 코딩 및 마지막 채널의 별도의 코딩을 나타내는 경우, 상기 적어도 두 개의 비트는 어떠한 두 개의 채널들이 공동으로 코딩되는지를 나타내고 어떠한 두 개의 다른 채널들이 공동으로 코딩되는지를 나타내는 비트를 포함하는, 시그널링 포맷.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877189P | 2013-09-12 | 2013-09-12 | |
US61/877,189 | 2013-09-12 | ||
PCT/EP2014/069043 WO2015036351A1 (en) | 2013-09-12 | 2014-09-08 | Methods and devices for joint multichannel coding |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160042104A true KR20160042104A (ko) | 2016-04-18 |
KR101777626B1 KR101777626B1 (ko) | 2017-09-13 |
Family
ID=51492966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167006428A KR101777626B1 (ko) | 2013-09-12 | 2014-09-08 | 조인트 멀티채널 코딩을 위한 방법들 및 장치들 |
Country Status (23)
Country | Link |
---|---|
US (6) | US9761231B2 (ko) |
EP (4) | EP3330963B1 (ko) |
JP (1) | JP6219527B2 (ko) |
KR (1) | KR101777626B1 (ko) |
CN (7) | CN117636886A (ko) |
AR (2) | AR097627A1 (ko) |
AU (1) | AU2014320540B2 (ko) |
BR (1) | BR112016004674B1 (ko) |
CA (1) | CA2920963C (ko) |
DK (1) | DK3044785T3 (ko) |
ES (1) | ES2657316T3 (ko) |
HK (3) | HK1217565A1 (ko) |
HU (1) | HUE035582T2 (ko) |
IL (1) | IL243959A (ko) |
MX (1) | MX354658B (ko) |
MY (1) | MY179475A (ko) |
NO (1) | NO2993357T3 (ko) |
PL (1) | PL3044785T3 (ko) |
RU (1) | RU2653285C2 (ko) |
SG (2) | SG11201600827VA (ko) |
TW (5) | TWI774136B (ko) |
UA (1) | UA115928C2 (ko) |
WO (1) | WO2015036351A1 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117037810A (zh) | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
ES2904275T3 (es) | 2015-09-25 | 2022-04-04 | Voiceage Corp | Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo |
US12125492B2 (en) | 2015-09-25 | 2024-10-22 | Voiceage Coproration | Method and system for decoding left and right channels of a stereo sound signal |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
CN109219847B (zh) * | 2016-06-01 | 2023-07-25 | 杜比国际公司 | 将多声道音频内容转换成基于对象的音频内容的方法及用于处理具有空间位置的音频内容的方法 |
CN106710600B (zh) * | 2016-12-16 | 2020-02-04 | 广州广晟数码技术有限公司 | 多声道音频信号的去相关编码方法和装置 |
TWI634549B (zh) * | 2017-08-24 | 2018-09-01 | 瑞昱半導體股份有限公司 | 音訊強化裝置及方法 |
KR102606259B1 (ko) * | 2018-07-04 | 2023-11-29 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 신호 화이트닝 또는 신호 후처리를 이용하는 다중신호 인코더, 다중신호 디코더, 및 관련 방법들 |
US11172477B2 (en) * | 2018-11-02 | 2021-11-09 | Qualcomm Incorproated | Multi-transport block scheduling |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN113948095A (zh) | 2020-07-17 | 2022-01-18 | 华为技术有限公司 | 多声道音频信号的编解码方法和装置 |
CN114023338A (zh) | 2020-07-17 | 2022-02-08 | 华为技术有限公司 | 多声道音频信号的编码方法和装置 |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19721487A1 (de) * | 1997-05-23 | 1998-11-26 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
RU2363116C2 (ru) * | 2002-07-12 | 2009-07-27 | Конинклейке Филипс Электроникс Н.В. | Аудиокодирование |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
EP2665294A2 (en) * | 2003-03-04 | 2013-11-20 | Core Wireless Licensing S.a.r.l. | Support of a multichannel audio extension |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
EP1719115A1 (en) * | 2004-02-17 | 2006-11-08 | Koninklijke Philips Electronics N.V. | Parametric multi-channel coding with improved backwards compatibility |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
DE102005010057A1 (de) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2007007623A2 (en) | 2005-07-08 | 2007-01-18 | Matsushita Electric Industrial Co., Ltd. | Electronic component mounting apparatus, height detection method for electronic component, and optical-axis adjustment method for component height detection unit |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
ES2433316T3 (es) * | 2005-07-19 | 2013-12-10 | Koninklijke Philips N.V. | Generación de señales de audio de multiples canales |
JP5111375B2 (ja) * | 2005-08-30 | 2013-01-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
ES2339888T3 (es) * | 2006-02-21 | 2010-05-26 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de audio. |
JP4875142B2 (ja) | 2006-03-28 | 2012-02-15 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置 |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
KR100829560B1 (ko) * | 2006-08-09 | 2008-05-14 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치 |
JP5270557B2 (ja) * | 2006-10-16 | 2013-08-21 | ドルビー・インターナショナル・アクチボラゲット | 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現 |
EP2082397B1 (en) | 2006-10-16 | 2011-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
DE102007017254B4 (de) | 2006-11-16 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Kodieren und Dekodieren |
JP5270566B2 (ja) | 2006-12-07 | 2013-08-21 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
EP2201566B1 (en) | 2007-09-19 | 2015-11-11 | Telefonaktiebolaget LM Ericsson (publ) | Joint multi-channel audio encoding/decoding |
CN101821799B (zh) | 2007-10-17 | 2012-11-07 | 弗劳恩霍夫应用研究促进协会 | 使用上混合的音频编码 |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
CN101582259B (zh) * | 2008-05-13 | 2012-05-09 | 华为技术有限公司 | 立体声信号编解码方法、装置及编解码系统 |
JP5366104B2 (ja) * | 2008-06-26 | 2013-12-11 | オランジュ | マルチチャネル・オーディオ信号の空間合成 |
RU2509442C2 (ru) | 2008-12-19 | 2014-03-10 | Долби Интернэшнл Аб | Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток |
AU2013206557B2 (en) * | 2009-03-17 | 2015-11-12 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
MY154078A (en) | 2009-06-24 | 2015-04-30 | Fraunhofer Ges Forschung | Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages |
TWI433137B (zh) * | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
US9584235B2 (en) | 2009-12-16 | 2017-02-28 | Nokia Technologies Oy | Multi-channel audio processing |
US9313598B2 (en) * | 2010-03-02 | 2016-04-12 | Nokia Technologies Oy | Method and apparatus for stereo to five channel upmix |
BR122020024855B1 (pt) * | 2010-04-13 | 2021-03-30 | Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de áudio ou vídeo, decodificador de áudio ou vídeo e métodos relacionados para o processamento do sinal de áudio ou vídeo de múltiplos canais usando uma direção de previsão variável |
TWI516138B (zh) * | 2010-08-24 | 2016-01-01 | 杜比國際公司 | 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品 |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
MX2013009304A (es) * | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. |
KR101748756B1 (ko) * | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
KR101842257B1 (ko) * | 2011-09-14 | 2018-05-15 | 삼성전자주식회사 | 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 |
US9537306B2 (en) | 2015-02-12 | 2017-01-03 | Taiwan Semiconductor Manufacturing Company Limited | ESD protection system utilizing gate-floating scheme and control circuit thereof |
-
2014
- 2014-08-15 TW TW109141399A patent/TWI774136B/zh active
- 2014-08-15 TW TW103128103A patent/TWI634547B/zh active
- 2014-08-15 TW TW107118781A patent/TWI671734B/zh active
- 2014-08-15 TW TW108121329A patent/TWI713018B/zh active
- 2014-08-15 TW TW111129105A patent/TWI847206B/zh active
- 2014-09-08 CN CN202311577858.XA patent/CN117636886A/zh active Pending
- 2014-09-08 SG SG11201600827VA patent/SG11201600827VA/en unknown
- 2014-09-08 RU RU2016113712A patent/RU2653285C2/ru active
- 2014-09-08 CN CN202311575471.0A patent/CN117612541A/zh active Pending
- 2014-09-08 JP JP2016541902A patent/JP6219527B2/ja active Active
- 2014-09-08 AU AU2014320540A patent/AU2014320540B2/en active Active
- 2014-09-08 HU HUE14761364A patent/HUE035582T2/en unknown
- 2014-09-08 ES ES14761364.0T patent/ES2657316T3/es active Active
- 2014-09-08 BR BR112016004674-9A patent/BR112016004674B1/pt active IP Right Grant
- 2014-09-08 CA CA2920963A patent/CA2920963C/en active Active
- 2014-09-08 PL PL14761364T patent/PL3044785T3/pl unknown
- 2014-09-08 MY MYPI2016700611A patent/MY179475A/en unknown
- 2014-09-08 SG SG10201807851YA patent/SG10201807851YA/en unknown
- 2014-09-08 CN CN201910513492.7A patent/CN110176240B/zh active Active
- 2014-09-08 CN CN202311494321.7A patent/CN117558282A/zh active Pending
- 2014-09-08 MX MX2016002885A patent/MX354658B/es active IP Right Grant
- 2014-09-08 EP EP17200485.5A patent/EP3330963B1/en active Active
- 2014-09-08 US US14/916,415 patent/US9761231B2/en active Active
- 2014-09-08 CN CN201480050053.2A patent/CN105531760B/zh active Active
- 2014-09-08 CN CN201910513493.1A patent/CN110189759B/zh active Active
- 2014-09-08 UA UAA201603810A patent/UA115928C2/uk unknown
- 2014-09-08 EP EP21205201.3A patent/EP3989221B1/en active Active
- 2014-09-08 EP EP14761364.0A patent/EP3044785B1/en active Active
- 2014-09-08 CN CN201910513484.2A patent/CN110189758B/zh active Active
- 2014-09-08 EP EP23212276.2A patent/EP4339944A3/en active Pending
- 2014-09-08 WO PCT/EP2014/069043 patent/WO2015036351A1/en active Application Filing
- 2014-09-08 KR KR1020167006428A patent/KR101777626B1/ko active IP Right Grant
- 2014-09-08 DK DK14761364.0T patent/DK3044785T3/en active
- 2014-09-11 AR ARP140103388A patent/AR097627A1/es active IP Right Grant
-
2015
- 2015-07-31 NO NO15179255A patent/NO2993357T3/no unknown
-
2016
- 2016-02-04 IL IL243959A patent/IL243959A/en active IP Right Grant
- 2016-05-16 HK HK16105588.9A patent/HK1217565A1/zh unknown
- 2016-07-28 HK HK16109041.2A patent/HK1221063A1/zh unknown
-
2017
- 2017-07-11 US US15/647,076 patent/US10083701B2/en active Active
-
2018
- 2018-06-26 HK HK18108210.7A patent/HK1248911A1/zh unknown
- 2018-08-28 US US16/115,354 patent/US10497377B2/en active Active
-
2019
- 2019-07-16 AR ARP190102007A patent/AR115788A2/es active IP Right Grant
- 2019-11-04 US US16/673,042 patent/US11380336B2/en active Active
-
2022
- 2022-06-30 US US17/854,947 patent/US11749288B2/en active Active
-
2023
- 2023-09-01 US US18/459,907 patent/US20240062765A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101777626B1 (ko) | 조인트 멀티채널 코딩을 위한 방법들 및 장치들 | |
CN110648674B (zh) | 多声道音频内容的编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |