KR101106026B1

KR101106026B1 - 오디오 신호 인코딩 또는 디코딩

Info

Publication number: KR101106026B1
Application number: KR1020067008373A
Authority: KR
Inventors: 라스 에프. 빌레모에스; 페르 엑스트랜드; 헤이코 푸른하겐; 에릭 지. 피. 스츄이저스; 프랜시스커스 엠. 제이. 드 본트
Original assignee: 돌비 인터네셔널 에이비; 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2003-10-30
Filing date: 2004-10-28
Publication date: 2012-01-17
Also published as: US20090216544A1; JP2011128649A; JP2007514962A; US8260607B2; WO2005043511A1; EP1683133B1; BR122018007834B1; RU2374703C2; JP2013167908A; ES2282899T3; KR20110113765A; JP4966013B2; US8073685B2; US20070067162A1; RU2006118682A; DE602004004818T2; US7519538B2; CN101540171B; CN101540171A; BRPI0415951A8

Abstract

오디오 신호를 인코딩하는 것이 제공되고, 오디오 신호는 제 1 오디오 채널과 제 2 오디오 채널을 포함하고, 인코딩은 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들 및 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 복합 모듈화 필터 뱅크의 제 1 오디오 채널 및 제 2 오디오 채널들 각각을 서브대역 필터링하는 단계; 다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하도록 각각의 서브대역 신호들을 다운샘플링하는 단계; 복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크의 적어도 하나의 다운샘플링된 서브대역 신호들에서 추가의 서브대역 필터링하는 단계; 추가의 서브대역 필터링이 없는 다운샘플링된 서브대역 신호들 및 서브-서브대역 신호들로부터 공간 파라미터들을 유도하는 단계; 다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 유도 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함한다. 또한, 디코딩이 제공되고, 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호를 포함하고, 공간 파라미터들의 세트는 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 인코딩된 단일 채널 오디오 채널에 의해 디코딩되고, 또한, 복수의 서브-서브대역 신호들을 제공하기 위해 부가의 필터 뱅크에서 적어도 하나의 다운샘플링된 서브대역 신호들을 부가 서브대역 필터링하고, 공간 매개변수들로부터 두개의 오디오 채널들을 유도하고, 서브-서브대역 신호들과 다운샘플링된 서브대역 신호들은 부가의 서브대역 필터링이 없다.

오디오 신호, 인코딩, 공간 파라미터, 필터 뱅크, 채널 오디오 신호

Description

오디오 신호 인코딩 또는 디코딩{Audio signal encoding or decoding}

본 발명은 오디오 신호를 인코딩하거나 또는 인코딩된 오디오 신호를 디코딩하는 것에 관한 것이다.

2003년 3월자 Erik Schuijers, Wemer Oomen, Bert den Brinker and JeroenBreebaart, "Advances in Parametric Coding for High-Quality Audio", Preprint5852, 114th AES Convention, Amsterdam, The Netherlands, 22-25에는 스테레오 이미지용의 효율적인 파라메트릭 표시를 이용하는 파라메트릭 코딩 체계가 개시된다. 두개의 입력 신호들은 하나 이상의 모노 오디오 신호로 합체된다. 지각 가능한 상응하는 공간적인 큐우(cue)들은 도1에 도시된 바와 같이 명백하게 모델링된다. 합체된 신호는 모노 파라메트릭 인코더를 이용하여 인코딩된다. 스테레오 파라미터들, 인터채널 강도차(Interchannel Intensity Difference)(IID), 인터채널 시간차(Interchannel Time Difference)(ITD) 및 인터채널 상호상관(Interchannel Cross-Correlation)(ICC)들은 양자화되고, 인코딩되고, 양자화되고 인코딩된 오디오 신호와 함께 비트 스트림으로 다중 송신(multiplexed)된다. 디코더측에서는, 비트 스트림은 인코딩된 모노 신호와 스테레오 파라미터들로 역다중화(de-multiplexed)된다. 인코딩된 모노 오디오 신호는 디코딩된 오디오 신호(m')를 얻기 위해 디코딩된다(도2 참조). 모노 시간 도메인 신호로부터, 역상관된 신호는 지각 가능한 역상관을 산출하는 필터(D)를 이용하여 계산된다. 모노 시간 도메인 신호(m')과 역상관된 신호(d)는 주파수 도메인으로 전송된다. 그 다음에, 주파수 도메인 스테레오 신호는 각각 디코딩된 스테레오 쌍(l', r')을 얻기 위해 파라미터 처리 유닛에서 스케일링, 위상 변조 및 혼합에 의해 IID, ITD 및 ICC 파라미터로 처리된다. 최종 주파수 도메인 표시들은 시간 도메인으로 다시 변환된다.

본 발명의 목적은 공간 파라미터들을 이용하여 오디오를 유리하게 인코딩 또는 디코딩을 제공하는 것이다. 그 결과, 본 발명은 독립항에서 한정된 바와 같이 인코딩 방법, 오디오 인코더, 전송 또는 저장 장치, 디코딩 방법, 오디오 디코더, 재생 장치 및 컴퓨터 프로그램 제품을 제공한다. 유리한 실시예들은 종속 청구항에서 한정된다.

본 발명의 제 1 양태에 따르면, 오디오 신호는 인코딩되고, 오디오신호는 제 1 오디오 채널과 제 2 오디오 채널을 포함하고, 인코딩은 제 1 오디오 채널용의 제 1 복수의 서브대역 신호들과 제 2 오디오 채널용의 제 2 복수의 서브대역 신호들을 제공하기 위해 복소 변조된 필터뱅크(filterbank)의 제 1 오디오 채널과 제 2 오디오 채널의 각각을 서브대역(subband) 필터링하는 단계와, 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들을 제공하도록 각각의 서브대역 신호들을 다운샘플링하는 단계와, 복수의 서브-서브대역 신호들을 제공하기 위해 다른 필터뱅크의 다운 샘플링된 서브대역 신호들 중 적어도 하나를 서브대역 필터링하는 단계와, 서브-서브대역 신호들로부터 그리고 부가의 서브대역 필터링되지 않은 다운샘플링된 서브대역로부터 공간 파라미터들을 유도하는 단계와, 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들로부터 유도된 유도 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함한다. 서브대역의 부가의 서브대역 필터링 단계를 제공함으로써, 서브대역의 주파수 분해능은 증가된다. 이러한 증가된 주파수 분해능은 (소수의 대역들만이 변환되기 때문에) 효율적인 실행에서 보다 높은 오디오 품질(단일 서브대역 신호의 대역폭이 통상적으로 인간 청각의 임계 대역들보다 통상적으로 높다)을 달성하기 위해 가능하기 때문에 이점이 있다. 파라메트릭 공간 코더(coder)는 비균일 주파수 스케일에서 인지된 두 귀를 모니터링하기 위해 수행되고, 평형 직각 대역(Equivalent Rectangular Bands)(ERB) 스케일과 유사하다. 단일 채널 오디오 신호는 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들로부터 직접적으로 유도될 수 있다. 그러나, 단일 채널 오디오 신호는 각각의 서브대역들용의 서브-서브대역 신호들이 새로운 서브대역 신호들로부터 유도되는 경우에 서브-서브대역 신호들이 부가로 서브대역 필터링되는 다운샘플링된 서브대역용의 서브-서브대역 신호들로부터 유리하게는 유도되고, 단일 채널 오디오 신호는 부가로 필터링되지 않는 제 1 및 제 2 복수의 서브대역들로부터의 서브대역들과 새로운 서브대역 신호들로부터 유도된다.

본 발명의 다른 주요한 양태에 따라, 인코딩된 오디오 신호의 오디오 디코딩이 제공되고, 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호와 공간 파라미터들의 세트를 포함하고, 오디오 디코딩은 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계와, 복수의 서브대역 신호들을 제공하기 위해 부가의 필터뱅크의 다운샘플링된 서브대역 신호들 중 적어도 하나를 부가의 서브대역 필터링하는 단계와, 공간 파라미터로부터 두개의 오디오 채널, 서브-서브대역 신호들 및 추가 서브대역 필터링되지 않는 이들 서브대역들용의 다운샘플링된 서브대역 신호들을 유도하는 단계를 포함한다. 서브대역의 추가의 서브대역 필터링을 제공함으로써, 서브대역의 주파수 분해능은 증가하고 따라서 보다 우수한 품질의 오디오 디코딩이 달성될 수 있다.

본 발명의 이들 양태들의 주요한 장점 중 하나는 파라메트릭 공간 코딩이 스펙트럼 대역 복제(Spectral Band Replication)(SBR) 기술과 쉽게 합체될 수 있다는 것이다. SBR은 Martin Dietz, Lars Liljeryd, KristoferKjorling 및 Oliver Kunz의 "Spectral Band Replication, a novel approach in audio coding", Preprint55 53, 112'AES Convention, Munich, Germany, 10-13 2002년 5월호와, Per Ekstrand의,"Bandwidth extension of audio signals by spectral band replication", Proc.1 st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp. 53-58, Leuven, Belgium, 2002년 11월 15일자에서 공지되었다. 또한, MPEG-4 standard ISO/IEC 14496-3:2001/FDAM1,JTC1/SC29/WGl l, Coding of Moving Pictures and Audio, Bandwidth Extension which describes an audio codec using SBR을 참조한다.

SBR은 통상적으로 오디오 신호의 낮고 높은 주파수들 사이에 큰 상관 관계가 있다는 개념에 기초한다. 이와 같이, SBR 프로세스는 스펙트럼 인벨로프(envelope)가 비트 스트림에 인코딩된 작은 정보를 이용하여 스펙트럼의 높은 부분(들)용으로 조정된 후에 높은 부분(들)에 대해 스펙트럼의 낮은 부분(들)을 복제하는 것으로 구성된다. 이러한 SBR 개선 디코더의 단순화된 블록도가 도3에 도시된다. 비트 스트림은 역다중화되고 코어 데이터(즉, MPEG-2/4 Advanced Audio Coding) 및 SBR 데이터로 디코딩된다. 코어 데이터를 이용하여, 신호는 전체 대역폭 신호의 샘플링 주파수의 절반으로 디코딩된다. 코어 디코더의 출력은 복소(모조) 격자구조 대칭 필터(Quadrature Mirror Filter)(QMF) 뱅크에 의해 분석된다. 이들 32개의 대역들은 예를 들어, 고주파(HF) 내용이 낮은 대역들의 복사부(들)에 의해 발생되는 64개의 대역들인 전체 대역으로 확장된다. HF 내용이 발생되는 대역의 인벨로프는 SBR 데이터에 따라 조정된다. 최종적으로 64개의 대역들의 복소 QMF 합성 뱅크에 의해, PCM 출력 신호는 재구성된다.

도3에 도시된 바와 같은 SBR 디코더는 소위 이중 비율 디코더이다. 이는 코어 디코더가 샘플링 주파수의 절반에서 작동하고 따라서 32개의 대역들의 분석 QMF 뱅크가 이용된다는 것을 의미한다. 코어 디코더가 전체 샘플링 주파수에서 작동하고, 분석 QMF 뱅크가 64개의 대역들로 구성된 단일 비율 디코더들이 가능하다. 실질적으로, 재구성은 (모조) 복소 QMF 뱅크에 의해 수행된다. 복소 QMF 필터 뱅크가 임계적으로 샘플링되지 않기 때문에, 위신호를 계수하기 위해 여분의 준비를 취할 필요가 없다. Ekstrand에 의해 개시된 바와 같은 SBR 디코더에서, 분석 QMF 대역은 32개로만 구성되지만, 코어 디코더가 전체 오디오 디코더에 비해 절반의 샘플링 주파수에서 작동함에 따라 합성 QMF 뱅크는 64개의 대역들로 구성된다. 그러나, 대응하는 인코더에서, 64개의 대역 분석 QMF 뱅크는 전체 주파수 범위를 커버하기 위해 이용된다.

본 발명은 특히 스테레오 오디오 코딩에 유리하지만, 본 발명은 또한 두개의 오디오 채널들 이상의 신호들을 코딩하는데 또한 유리하다.

본 발명의 이들 및 다른 양태들은 명백하고, 후술하는 실시예들을 참조하면 명료하게 될 것이다.

도 1은 파라메트릭 스테레오(PS) 인코더에 이용되는 스테레오 파라미터 추출을 위한 유닛의 블록도를 도시한 도면.

도 2는 PS 디코더에 이용되는 스테레오 신호의 재구성을 위한 유닛의 블록도를 도시한 도면.

도 3은 스펙트럼 대역 복제(SBR) 디코더의 블록도를 도시한 도면.

도 4는 본 발명의 실시예에 따른 합체된 PS 및 개선된 SBR 인코더의 블록도를 도시한 도면.

도 5는 본 발명의 실시예에 따른 합체된 PS 및 개선된 SBR 인코더의 블록도를 도시한 도면.

도 6은 M 대역들의 다운샘플링된 복소 QMF 분석(좌측)과 합성 뱅크(우측)를 도시한 도면.

도 7은 프로토타입 필터의 dB 크기 반응을 도시한 도면.

도 8은 64개의 다운샘플링되지 않은 복소 변조된 분석 필터들 중에서 처음 4개의 dB 크기 반응을 도시한 도면.

도 9는 사소한 합성을 갖는 Q 대역들의 필터 뱅크의 블록도를 도시한 도면.

도 10은 처음의 다운샘플링되지 않은 변조된 QMF 필터와 8개의 대역들의 복소 변조된 필터 뱅크의 합체된 dB 크기 반응을 도시한 도면.

도 11은 본 발명의 실시예에 따른 짝수를 적층된 필터 뱅크(상부)와 홀수로 적층된 필터 뱅크(저부)의 4개의 대역들의 정형화된 크기 반응을 도시한 도면.

도 12는 본 발명의 실시예에 따른 64개의 대역들의 복소 분석 QMF에 기초한 77개의 대역들의 비균일 하이브리드 분석 필터 뱅크를 도시한 도면.

도 13은 오디오 디코더에 이용하기 위한 64개의 대역들의 복소 분석 QMF에 기초한 71개의 대역들의 비균일 하이브리드 분석 필터 뱅크를 도시한 도면.

도 14는 복소 변조 분석 필터 뱅크의 효율적인 실행의 블록도를 도시한 도면.

이러한 도면들은 본 발명을 이해시키기 위해서 필수적인 이들 요소들만을 도시한다.

SBR과 PS의 합체는 잠재적으로는 매우 강력한 코덱을 산출한다. SBR과 PS는 상당히 유사한 구조, 예를 들어 주파수 변환에 대한 시간의 소정의 형상, 처리 및 최종적으로는 주파수의 시간에 대한 변환으로 구성된 디코더에서 후처리된 알고리즘이다. 두 알고리즘들을 합체할 때, 두 알고리즘들이 예를 들어, DSP 어플리케이 션에서 동시에 작동하는 것이 요구된다. 여기서, 하나의 코덱의 계산된 중간 결과들을 가능한 한 다른 것에 재사용하는 것이 유리하다. PS를 SBR에 합체하는 경우에, 이는 PS 처리를 위해 복소 (모조) QMF 서브대역 신호들을 재사용하도록 한다. 합체된 인코더(도 4 참조)에서, 스테레오 입력 신호는 두개의 64 대역들의 분석 필터 뱅크에 의해 분석된다. 복소 서브대역 도메인 표시를 이용하여, PS 계산 유닛은 스테레오 파라미터를 추정하고 모노 (서브대역) 다운 믹스를 생성한다. 이러한 모노 다운 믹스는 SBR 파라미터 추정 유닛으로 공급된다. 최종적으로, 모노 다운 믹스는 코어 디코더(코어 디코더는 대역폭의 절반만을 필요로 한다)에 의해 코딩될 수 있도록 32개의 대역 합성 필터 뱅크에 의해 시간 도메인으로 다시 변환된다.

도5에 도시된 바와 같은 합체된 디코더에서, 이중 비율 또는 단일 비율 시스템이 이용되는지 여부에 관계없이, 인벨로프 조정 후의 전체 대역폭(64 대역들) 서브대역 도메인 신호들은 스테레오 파라미터들에 따라 서브대역 도메인 신호들의 스테레오 세트로 변환된다. 이들 두 세트들의 서브대역 신호들은 최종적으로는 64 대역들의 합성 QMF 뱅크에 의해 시간 도메인으로 변환된다. PS가 SBR과 합체되면, QMF 필터들의 저주파 대역들의 대역폭은 고품질 스테레오 표시용으로 요구되는 것보다 크다. 그래서, 스테레오 이미지의 고품질 표시를 제공할 수 있도록 하기 위해, 낮은 서브대역 신호들의 부가의 서브디비전이 본 발명의 유리한 실시예들에 따라 수행된다.

본 발명의 양태들의 보다 용이한 이해를 위해, 복소 QMF 서브대역 필터들 기반의 이론이 우선 설명된다.

QMF 서브대역 필터들

QMF 분석 서브대역 필터는 이하와 같이 설명될 수 있다. 주어진 실수치의 선형 위상 프로토타입 필터 p(ν), M 대역 복소 변조 분석 필터 뱅크가 분석 필터에 의해 한정될 수 있다.

k = 0, 1,..., M-1이다. 위상 파라미터 θ는 이하의 분석에는 중요하지 않지만, 통상적인 선택은 (N+M)/2이고, 여기서 N은 프로토타입 필터 순서이다. 주어진 실수치의 개별 시간 신호 x(ν), 서브대역 신호들 ν_k(n)들은 x(ν)를 h_k(ν)로 필터링(회선)하고 계수 M(도6의 좌측 참조)에 의해 결과를 다운샘플링함으로써 얻어진다.

합성 작동은 QMF 서브대역 신호들을 계수 M으로 제 1 업샘플링하고, 그 다음에 [수학식 1]의 복소 변조된 필터들로 필터링하고, 결과들을 가산하고 최종적으로 실수 부분을 두 번 취하는 것(도6의 우측 참조)으로 구성된다. 실수치 신호들의 거의 완벽한 재구성이 실수치 선형 위상 프로토타입 필터 p(ν)의 적절한 설계에 의해 얻어질 수 있다. 64 대역들의 경우에 MPEG-4 표준(전술함)의 SBR 시스템에 이용되는 것과 같은 프로토타입 필터들의 크기 반응은 도7에 도시된다. 64 복소 변조 분석 필터들의 크기 반응들은 프로토타입 필터 p(ν)의 크기 반응을 π/M (k+1/2)만큼 시프트시킴에 의해 얻어진다. 이들 반등들의 일부는 도8에 도시된다. k = 0 및 k = M-1을 제외하고는 양의 주파수만이 필터링된다는 것에 주의한다. 그 결과, 다운샘플링 이전의 서브대역 신호들은 분석적인 것에 근접하고, 실수치 사인 곡선들의 증폭 및 위상 변조를 용이하게 한다. 위상 변조들은 또한 이들 대역들에 존재하는 사인 곡선들이 각각 π/2M 또는 π-π/2M 이상의 주파수를 가지는 한 최초 및 최종 대역용으로 가능하다. 이러한 영역 외의 주파수에서, 음의 주파수의 간섭 때문에 위상 변조의 성능은 빠르게 악화된다.

본 발명의 실시예들에서 전술한 바와 같이 QMF 분석 필터에서 시작하여, 보다 정교한 주파수 분해능이 각각의 다운샘플링된 서브대역 신호 ν_k(n)을 Q_K 서브-서브대역으로 부가 필터링함으로써 얻어진다.

복소 QMF 서브대역 도메인의 신호 변조

이하에서,

은 개별 시간 신호 z(n)의 개별 시간 푸리에 변환(Fourier transform)이 된다. 전술한 바와 같이 거의 근접한 재구성 특성과, 또한 전술한 바와 같은 프로토타입 필터(p(ν)의 경우에서 P(ω), p(ν)의 푸리에 변환이 기본적으로 주파수 간격[-π/M, π/M]의 외측으로 소멸된다고 가정하면, 여기서 다음 단계는 서브대역 신호들 ν_k(n)이 합성 전에 변조되는 시스템으로 고려된다. 이제, 각각의 서브대역 k는 필터 b_k(ω)로 필터링함으로써 변조된다. 확장식은,

여기서, *는 복소 공액을 지시하고, 필터 뱅크 합성을 포함하는 최종 시스템이 필터로 필터링하는 것에 대응되는 것으로 도시될 수 있다(전체 딜레이 무시, 실수치 입력 및 단일 비율 시스템 가정).

P(ω)의 특성에 대한 가설에 따라, [수학식 3]의 모든 k에서 B_k(ω) = 1을 삽입하여 B(ω) = 1이 되고 제곱의 합은 시프트된 프로토타입 필터 반응들을 야기한다. 실수치 상수 B_k(ω) = b_k ≥ 0를 선택함으로써, 시스템은 π(k+1/2)의 주파수에서 이득값들 b_k과 합체된 평형기로써 작동한다. 인력 특성은 즉, 다운샘플링 및 업샘플링 대신에 위신호 없이 시간 불변이다. 이는 물론 정해진 프로토타입의 필터 가정의 편차량만을 조정할 것이다.

모노 오디오 신호를 유도하기 위해, 복소 서브대역 신호들의 부가의 서브 필터링이 이들 특성을 보존할 뿐만 아니라 이들 특성을 필터링된 서브대역 신호들을 촉진하도록 하는 이들 특성을 확장시킬 것이다. 이들 특성들을 보존하는 서브 필터링은 P.P Vaidyanathan, "Multirate systems and filter banks", Prentice Hall Signal Processing Series, 1993, sections 4.6.1-4.6.2로부터 반복되는 바와 같이 소위 M 대역 필터들의 변조를 이용하여 수행될 수 있다.

자명한 합성을 갖는 변조된 필터 뱅크들

개별 시간 신호 ν(n)는 임펄스 반응들 g_q(n), q = 0, 1,...Q-1을 갖는 필터들의 뱅크에 의해 Q 상이 신호들로 분할될 수 있다. 이는 도9에 도시된다. 대응 분석 출력을 y_q(n)으로 놓고 자명한 합성 작용을 이하와 같이 가정하면,

완전한 재구성, y(n) = ν(n)이 필터를 선택함으로써 얻어지고, 이는,

여기서, n = 0일때 δ(n) = 1이고, n ≠ 0일 때 δ(n) = 0이다. 일반적인 필터들용으로, [수학식 5]의 우측은 δ(n-d)로 대체될 수 있고, 여기서, d는 정의 딜레이이지만, 이러한 간단한 변조는 설명을 명료하기 위해 생략된다.

필터들 g_q(n)은 이하의 식을 통해 프로토타입 필터 g(n)의 복소 변조로써 선택될 수 있다.

본 발명의 이러한 바람직한 실시예에서, 필터들은 홀수(계수 q+1/2)마다 적층된다. 이러한 바람직한 실시예의 이점은 후술된다. 완벽한 재구성 [수학식 5]는 이하에서만 얻어진다.

이것의 변형은 아래와 같은 실수치 코사인 변조이다.

여기서, 실수치 프로토타입 필터 g(m)는 이하를 만족한다.

(이는 [수학식 6]의 g_q(n) + g_Q _-1-q(n)을 고려함으로써 쉽게 얻어진다)

복소 지수 변조 필터 뱅크의 서브 필터링

전술한 바와 같은 QMF 분석 필터들로부터 시작하여, 미세한 주파수 해상력은 전술한 변조된 구조들인 [수학식 6] 또는 [수학식 8] 중 하나를 이용함으로써 각각의 다운샘플링된 서브대역 신호 ν_k(n)을 Q_k 서브-서브대역들로 부가 필터링함으로써 얻어진다. 최종 출력 신호들 y_q ^k(n)을 지시하고, g_q ^k(n)이 서브대역 k 내에 인가된 필터 뱅크를 설명하도록 한다. Q_k = 1이면, 필터링이 없고, g₀ ^k(n) = δ(n)이다. 통상적인 어플리케이션 예는 M = 64이고, Q₀ = 8이고, k = 1, 2일 때 Q_k = 4이고, k > 2일 때 Q_k = 1인 경우이다.

x(ν)로부터 y_q ^k(n)까지의 두개의 필터 뱅크들의 조합된 효과는 필터들 F_q ^k(ω)로 필터링함으로써 계수 M에 의해 다운샘플링되는 것으로 설명되고, 여기서,

프로토타입 필터 반응 P(ω)은 기본적으로 인터벌 [-π/M, π/M] 외측에서 영이고, 이는 SBR 분석 필터들(도7 참조)용의 경우이고, 필터 F_q ^k(ω)는 하기 [수학식 10]에 의해 복소 변조 경우에서 한정된 단일 공칭 중심 주파수를 갖는다.

여기서, s는 Q_k(k-1/2)≤2(q+Q_ks)+1≤Q_k(k+3/2)과 같이 선택된 정수이다. 예를 들어, 도 10에 도시된 바와 같이, k = 0이고, Q₀ = 8이면, ω_0,0, ω_0,1,...ω_0,7의 값은,

이다.

비균일 주파수 해상력을 갖는 신호 변조

전술한 바와 같은 서브-서브대역 필터 뱅크들은 부가의 다운샘플링을 도입하지 않아서, 복소 QMF만의 경우에서 도시된 바와 같은 신호 변조의 위신호가 없는 특성이 보존된다. M 서브대역 분석의 일반적인 합체 작동, Q_k 서브대역 k 내에서의 서브대역들 이용함으로써 부가의 서브대역 필터링, 필터 A_k,q(ω)에 의한 각각의 서브-서브대역 신호 y_q ^k(n)의 필터링, 합에 의한 각각의 서브대역 k 내의 합성 및 최종적으로 M 대역 합성 뱅크를 통한 합성을 고려한다. 이러한 시스템의 전체 전송 기능은 k ≥ 0일 때 [수학식 3]에 의해 주어진다.

ω > π/(2M)에서, 이는 아래와 같이 주어져서,

서브-서브대역 (k, q)의 처리량 반응은

으로 주어진다.

에서, [수학식 2] 때문에 소정의 주의가 필요하다. 이러한 주파수 범위 내에서, 아래와 같이 고정되고,

실수 서브-서브대역 프로토타입 필터 계수를 추정하면, 아래와 같이 고정되고,

변조 필터들은 아래와 같이 선택되고,

여기서, B₀(-Mω)^* = B₀(Mω)이고, [수학식 3]과 관련하여 전술한 제곱근 식별은 이하를 야기한다.

에서, 서브-서브대역(0, q)용으로 처리량 반응 G_q ⁿ(Mω)에 대응된다.

[수학식 15] 내지 [수학식 17]은 양 및 음의 주파수들 사이에서 식별하는데 바람직한 것을 나타낸다. 이는 홀수로 적층된 (복소) 필터들이 짝수로 적층된 (복 소) 필터들(도 11 참조) 대신에 QMF 서브대역 신호들을 서브 필터링하는데 이용되기 때문이다. 짝수로 적층된 필터들에서, 양 및 음의 주파수들 사이에서 구별이 불가능하기 때문에, 중심 필터, 즉, 0의 중심 주파수를 갖는 필터에 존재하는 사인 곡선의 위상 변조를 적용시킬 수 없다. 반응 G(ω) 대역을 갖는 프로토타입 필터가 대역들의 수가 Q인 [-2π/Q, 2π/Q]에 제한된다고 가정하면, 홀수로 적층된 경우, 위상 변조들이 적합하게 인가될 수 있는 하부 제한은 2π/Q이고, 이에 반해, 홀수로 적층된 경우에서 위상 변조가 적합하게 인가될 수 있는 하부 제한은 π/Q이다.

도입부에서 전술한 바와 같이, PS 합성에서, 전술한 중요한 특별 경우들은 평등화되고 위상 변조이다. 균등화에서, A_k _,q(ω) = a_k,q ≥ 0이고, [수학식 16]은 이하와 같이 줄어든다.

[수학식 16]의 상태인 경우의 A_k _,q(ω) = exp(iα_k,q)에 대응되는 위상 변조는,

이면, 만족된다.

스테레오 파라미터 추정

비균일 복소 필터 뱅크, 즉, 전술한 바와 같이 QMF 뱅크 이후의 부가의 서브대역 필터링은 후술하는 바와 같이, Inter-channel Differences(IID), Inter-channel Phase Differences(IPD) 및 Inter-channel Cross Correlation(ICC)의 스테레오 파라미터들을 추정하는데 적용될 수 있다. 이러한 실질적인 실시예에서, IPD는 Schuijers 등의 문서에서 이용된 바와 같이 ITD용의 실질적인 등가 치환으로써 이용된다. 합체된 PS 인코더(도4 참조)에서, 제 1 내지 제 3 복소 QMF 채널들은 서브 필터링되어 전체 77개의 복소치 신호들이 얻어진다(도 12 참조).

이러한 시점에서, 77개의 복소치 시간 정렬된 좌측 및 우측 서브대역 신호들은 각각 l_q ^k(n)과 r_q ^k(n)로 지시되고, 따라서, y_q ^k(n)의 지수이다.

소정의 서브대역 샘플 위치 n'에서 스테레오 파라미터들을 추정하기 위해, 좌측, 우측 및 비정규화된 크로스채널 여기는 이하와 같이 계산된다.

모든 스테레오 빈 b, h(n)은 길이 L. ε를 갖는 서브대역 도메인 윈도우이고, 0(예를 들어, ε=1e-10), 좌측 및 우측 서브대역 도메인 신호들인 l_q ^k(n)과 r_q ^k(n)으로 나누어지는 것을 방지하는 매우 작은 값이다. 20개의 스테레오 빈들의 경우에, 표에 도시된 바와 같이 k부터 k_l까지의 합은 최대 k_h이고, 이를 포함하고, q부터 q_l까지의 합은 최대 q_h이고, 이를 포함한다. "음"의 주파수들(예를 들어, k = 0이고, q = 4...7)은 [수학식 20]의 파라미터 추정에서 포함되지 않는다.

[표 1: k 및 q에 따른 합계의 개시 및 정지 인덱스들]

e_l(b), e_r(b) 및 e_R(b)를 계산하기 위한 합계는 합계 내의 이러한 신호들의 중간 지점이 파라미터 위치에 일치하도록 정렬되고, 따라서 시프트는

에 의한다. 표 1로부터 명확한 바와 같이, 양의 중심 주파수를 갖는 서브대역 신호 및 서브-서브대역 신호들만이 예측 스테레오 파라미터들을 위해 사용된다.

각각의 스테레오 빈(b)을 위한, I(b)로 표시되는 IID, C(b)로 표시되는 ICC 및 P(b)로 표시되는 IPD는 아래와 같이 계산된다.

에서의 각도는 -π와 π 사이에서의 값들을 사용하는 4개의 4분할 아크탄젠트 함수를 사용하여 계산된다. 타겟 비트 비율 및 어플리케이션에 따라, 이러한 파라미터들 또는 이러한 파라미터들의 부분집합이 비트 스트림의 PS 부분 내로 양자화되고 코딩된다.

스테레오 신호 합성

디코더의 (RAM 사용에 관한) 산정된 비용을 가능한 한 낮게 유지하기 위해, 유사한 분석 구조물이 사용된다. 그러나, 제 1 대역은 부분적으로만 합성된다(도 13 참조). 이는 중간 대역 쌍

,

및

의 합계에 의해 얻어진다. 또한, 제 2 및 제 3 대역은

및

의 출력의 합계에 의해 얻어지는 2개 대역 실제 값 필터 뱅크들 및,

와

의 출력의 합계이다(또한, 모듈화된 필터 뱅크들에 대한 부분의 설명 참조). 이러한 단순화된 디코더 필터 뱅크 구조물을 사용하여, 양의 주파수 및 음의 주파수 사이의 차별적인 특징은 제 1 서브대역 필터의 세분에 의해 여전히 유지된다. 디코더 분석 필터 뱅크는 도 13에 도시된다. QMF 필터링된 제 1 (서브) 서브대역 신호들의 인덱싱은 주파수에 따라 저장된다는 것을 인지한다.

단일 프레임의 스테레오 (서브) 서브대역 신호들은 아래와 같이 구성된다.

ICC 파라미터들 k=0, …, K-1, 서브대역 인덱스(K는 서브대역의 총 갯수, 즉 K=71), 프레임의 서브대역 샘플들의 갯수 N과 함께 QMF 서브대역 샘플 인덱스 n=0, …, N-1, 스케일 계수 조작 매트릭스들 Λ₁₁, Λ₁₂, Λ₂₁, Λ₂₂, 위상 회전 조작 매트릭스 P_rl을 합성하는 것을 설명하기 위해, 모노 (서브) 서브대역 신호들 s_k(n)과 함께 모노 디코렐레이티드 (서브) 서브대역 신호들 d_k(n)은 모노 (서브) 서브대역 신호 s_k(n)로부터 유도된다. 조작 매트릭스들은 시간 및 주파수의 함수로 정의되고, MPEG-4 표준 ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, 이동 사진 및 오디오의 코딩, 익스텐션 2에 설명된 바와 같이 조작 벡터들로부터 직접적으로 유도될 수 있다.

s_k(n)은 도 13의 결과에 의한 도 12에 따라 한정된다.

스테레오 파라미터들의 합성은 표 1의 인덱싱에 따라 발생한다.

[표 1: 파라미터 인덱싱 표]

따라서, 합성 방정식은 아래와 같다.

p_rl의 신호는 표에 *가 부가되면 위의 방정식에서 변화한다는 것을 인지한다. 이는 [수학식 19], 즉 반대 위상 회전은 음의 주파수를 위해 인가되어야 한다는 것이다.

자명한 합성으로 모듈화된 필터 뱅크들의 효과적인 실행

길이(L)의 원형 필터를 갖는 모듈화된 필터 뱅크를 줄 때, 직접적인 형태의 실행은 입력 샘플 당 QL 작업들을 요구하지만, [수학식 6]에서의 모듈화가 주기(Q)에 반주기라는 사실은, 각각의 입력 샘플을 위한 크기(Q)의 변형 후에 L 작업들의 다상 윈도윙(windowing)으로 필터링을 분할하는데 사용될 수 있다. 이와 같은 다 상 표현은 1993년에 발행된 P.P. Vaidyanathan의 "Multirate systems and filter banks", Prentice Hall Signal Processing Series의 섹션 4.3)에 공지되었다는 것을 인지하여야 한다. 이하는 본 발명의 양호한 실시예에 따른 이러한 다상 표현의 유리한 어플리케이션을 제공한다.

변형은 Q가 2개의 멱(power)일 때 Q log₂Q의 차수인 상 비틀림 이후의 DFT이다. 이러한 큰 세이빙은 L이 log₂Q보다 매우 큰 통상적인 경우에 얻어진다. 실제 모듈화 경우(8)에서, n=0 및 n=Q 주위의 짝수/홀수 대칭으로 합성된 주기(2Q)의 반주기는 다상 윈도윙을 위해 다시 사용될 수 있고, 변형 커널(kernel)은 타입III의 DCT이다. 복합 모듈화의 경우를 위한 상세한 설명은 이하에 기술된다.

FFT 코어 프로세스를 사용하는 서브-서브 필터링의 효과적인 실행은 모듈화 이후의 원형 필터의 다상 분해를 사용하여 구현될 수 있다. 차수 N의 원형 필터(g(n))가 N=mQ라고 가정하면, m은 양의 정수이다. 임의의 차수의 원형 필터가 제약을 충족시키도록 0으로 채워질 수 있기 때문에 이러한 조건은 한정적이지 않다. 복합 모듈화 시스템(6)에서 사용하기 위해 구성된 원형 필터의 Z 변형은 아래와 같다.

이는 아래와 같은 다상 기수법으로 표현될 수 있다.

여기서,

이다.

필터뱅크의 모든 필터들은 원형 필터의 주파수 모듈화된 상태이다. 필터(g_q(n))의 Z 변형은 아래와 같다.

여기서,

이다.

하나의 필터로부터의 출력의 표현은 아래와 같다.

마지막 합계의 성분을 인식함으로써, 입력 신호의 상태로 지연된 다상 성분 프로세스가 표시될 수 있고, 이어서 복합 지수에 의해 곱해진다. 결국, 모든 출력 신호들(Y_q(z), q=0…Q-1)은 (스케일링 계수없이) 역 FFT를 인가함으로써 얻어진다. 도 14는 필터 뱅크를 분석하기 위한 레이아웃을 도시한다. [수학식 29]의 다상 필터들이 인과관계가 아니기 때문에, 적절한 양의 지연이 모든 다상 성분들에 추가되어야 한다.

전술한 실시예들은 발명을 한정하지 않는 설명이며, 당해 분야의 숙련자들은 첨부된 특허청구의 범위에서 벗어남 없이 다양한 다른 실시예들을 구성할 수 있음을 인지해야 한다. 특허청구의 범위에서, 괄호 사이의 도면 부호는 청구범위를 한정하는 것이 아니다. "포함"이라는 용어는 청구범위에 기재된 것 이외의 다른 구성 요소 또는 단계의 존재를 배제하는 것이 아니다. 본 발명은 여러 가지의 명백한 구성 요소를 포함하는 하드웨어에 의해, 그리고 적절하게 프로그래밍된 컴퓨터에 의해 구현될 수 있다. 다양한 수단을 열거한 장치 청구항에서, 이러한 여러 가지 수단은 하나에 의해, 그리고 동일한 하드웨어의 아이템에 의해 실시될 수 있다. 임의의 수단들이 서로 다른 종속항에 기재된 것은 이러한 수단들의 조합이 이롭게 사용될 수 없음을 나타내는 것은 아니다.

Claims

제 1 오디오 채널 및 제 2 오디오 채널을 포함하는 오디오 신호의 인코딩 방법에 있어서,

상기 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들 및 상기 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 복합 모듈화 필터 뱅크에서 상기 제 1 오디오 채널 및 상기 제 2 오디오 채널 각각을 서브대역 필터링하는 단계;

다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하도록 상기 서브대역 신호들 각각을 다운샘플링하는 단계;

복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가의 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계;

추가로 서브대역 필터링되지 않는 상기 다운샘플링된 서브대역 신호들 및 상기 서브-서브대역 신호들로부터 공간 파라미터들을 유도하는 단계; 및

상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함하고,

추가로 서브대역 필터링된 각각의 서브대역에 대해, 상기 서브-서브대역 신호들은 새로운 서브대역 신호를 형성하도록 스케일링 및/또는 위상 회전 후에 함께 부가되고, 상기 단일 채널 오디오 신호는 이러한 새로운 서브대역 신호들 및 추가로 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 유도되는,

오디오 신호의 인코딩 방법.
삭제
제 1 항에 있어서,

상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 제 1 서브대역 신호들의 가장 낮은 주파수 서브대역 신호 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들의 가장 낮은 주파수 서브대역 신호에 대해 수행되는, 오디오 신호의 인코딩 방법.
제 3 항에 있어서,

상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 제 1 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호에 대해 더 수행되는, 오디오 신호의 인코딩 방법.
제 4 항에 있어서,

상기 가장 낮은 서브대역 신호들의 서브-서브대역들의 갯수는 상기 다음으로 가장 낮은 주파수 서브대역 신호들의 서브-서브대역들의 갯수보다 더 많은, 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 복합 모듈화된 필터 뱅크인, 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 실제 값 코사인 모듈화된 필터 뱅크인, 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 추가의 서브대역 필터 뱅크는 홀수로 적층된 필터 뱅크인, 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 서브-서브대역 신호들은 추가로 다운샘플링되지 않는, 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 단일 채널 오디오 신호는 대역폭이 한정되어 추가로 코딩되고, 스펙트럼 대역 복제 파라미터들은 상기 다운샘플링된 복수의 제 1 서브대역 신호들 및/또는 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도되는, 오디오 신호의 인코딩 방법.
오디오 신호를 인코딩하는 오디오 인코더로서, 상기 오디오 신호는 제 1 오디오 채널 및 제 2 오디오 채널을 포함하는, 상기 오디오 인코더에 있어서,

상기 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들을 제공하도록 상기 제 1 오디오 채널을 서브대역 필터링하는 제 1 복합 모듈화된 필터 뱅크;

상기 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 상기 제 2 오디오 채널을 서브대역 필터링하는 제 2 복합 모듈화된 필터 뱅크;

다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하기 위해 상기 서브대역 신호들 각각을 다운샘플링하는 수단;

복수의 서브-서브대역 신호들을 제공하기 위해 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 추가의 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 필터 뱅크;

상기 서브-서브대역 신호들로부터, 그리고 추가로 서브대역 필터링되지 않은 다운샘플링된 서브대역 신호들로부터 공간 파라미터들을 유도하는 수단; 및

상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 수단을 포함하고,

추가로 서브대역 필터링된 각각의 서브대역에 대해, 상기 서브-서브대역 신호들은 새로운 서브대역 신호를 형성하도록 스케일링 및/또는 위상 회전 후에 함께 부가되고, 상기 단일 채널 오디오 신호는 이러한 새로운 서브대역 신호들 및 추가로 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 유도되는,

오디오 인코더.
입력 오디오 신호를 기초로 인코딩된 오디오 신호를 전송하거나 저장하는 장치에 있어서,

입력 오디오 신호를 수용하는 입력 유닛;

인코딩된 오디오 신호를 얻기 위해 상기 입력 오디오 신호를 인코딩하는 제 11 항에서 청구된 오디오 인코더; 및

전송 또는 저장을 위한 포맷으로 상기 인코딩된 오디오 신호를 추가로 코딩하는 채널 코더를 포함하는, 인코딩된 오디오 신호를 전송하거나 저장하는 장치.
인코딩된 오디오 신호를 디코딩하는 방법으로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 인코딩된 오디오 신호를 디코딩하는 방법에 있어서,

다운샘플링된 복수의 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계;

복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가의 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계; 및

상기 공간 파라미터들, 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 2개의 오디오 채널들을 유도하는 단계를 포함하고,

가장 낮은 주파수 서브대역에서, 시간 도메인 내에 음의 중심 주파수를 갖는 상기 서브-서브대역 신호들의 위상 변화들은 상기 음의 중심 주파수에 가장 가까운 절대값에 있는 양의 중심 주파수를 갖는 서브-서브대역 신호에 인가된 음의 위상 변화를 취함으로써 결정되는,

인코딩된 오디오 신호를 디코딩하는 방법.
제 13 항에 있어서,

상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 서브대역 신호들의 가장 낮은 주파수 서브대역 신호에 대해 수행되는, 인코딩된 오디오 신호를 디코딩하는 방법.
제 14 항에 있어서,

상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호에 대해 더 수행되는, 인코딩된 오디오 신호를 디코딩하는 방법.
제 15 항에 있어서,

상기 가장 낮은 주파수 서브대역 신호들의 서브-서브대역의 갯수는 상기 다음으로 가장 낮은 주파수 서브대역 신호들의 서브-서브대역의 갯수보다 많은, 인코딩된 오디오 신호를 디코딩하는 방법.
제 13 항에 있어서,

상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 복합 모듈화된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
제 13 항에 있어서,

상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 실제값 코사인 모듈화된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
제 13 항에 있어서,

상기 추가의 서브대역 필터 뱅크는 홀수로 적층된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
삭제
제 13 항에 있어서,

상기 인코딩된 오디오 신호는 스펙트럼 대역 복제 파라미터들을 포함하고, 고주파수 성분은 상기 다운샘플링된 복수의 서브대역 신호들 및 상기 스펙트럼 대역 복제 파라미터들로부터 유도되고, 상기 2개의 오디오 채널들은 상기 공간 파라미터들, 상기 서브-서브대역 신호들, 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들 및 상기 고주파수 성분으로부터 유도되는, 인코딩된 오디오 신호를 디코딩하는 방법.
인코딩된 오디오 신호를 디코딩하기 위한 오디오 디코더로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 오디오 디코더에 있어서,

복수의 다운샘플링된 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 디코더;

복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 추가의 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 필터 뱅크; 및

상기 공간 파라미터들, 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 2개의 오디오 채널들을 유도하는 수단을 포함하고,

가장 낮은 주파수 서브대역에서, 시간 도메인 내에 음의 중심 주파수를 갖는 상기 서브-서브대역 신호들의 위상 변화들은 상기 음의 중심 주파수에 가장 가까운 절대값에 있는 양의 중심 주파수를 갖는 서브-서브대역 신호에 인가된 음의 위상 변화를 취함으로써 결정되는,

오디오 디코더.
출력 오디오 신호를 재생하는 장치에 있어서,

인코딩된 오디오 신호를 얻기 위한 입력 유닛;

상기 출력 오디오 신호를 얻기 위해 상기 인코딩된 오디오 신호를 디코딩하는, 제 22 항에서 청구된 오디오 디코더; 및

상기 출력 오디오 신호를 재생하기 위한 스피커 또는 헤드폰 출력과 같은 재생 유닛을 포함하는, 출력 오디오 신호를 재생하는 장치.
제 1 항에서 청구된 방법의 단계들을 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
제 13 항에서 청구된 방법을 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.