KR20070001208A

KR20070001208A - 복수-채널 인코더

Info

Publication number: KR20070001208A
Application number: KR1020067020276A
Authority: KR
Inventors: 디르크 제이. 브리바트; 에릭 지. 피. 슈이저스; 제라르드 에이치. 호토; 마시엘 더블유. 반 룬
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2004-04-05
Filing date: 2005-03-25
Publication date: 2007-01-03
Also published as: BRPI0509113B8; CN102122509B; RU2390857C2; DE602005006777D1; BRPI0509113A; US7602922B2; MXPA06011361A; CN102122509A; KR101158698B1; ES2307160T3; BRPI0509113B1; WO2005098821A2; TWI393119B; PL1735774T3; JP2012191625A; JP5032977B2; EP1735774B1; JP2007531913A; US20070194952A1; RU2006139048A

Abstract

상보적인 파라미터 데이터(370,430,450)와 함께 M개의 출력 채널로 전송된 대응 출력 신호(480,490)를 생성하기 위해 N개의 입력 채널로 전송된 입력 신호(300,310,320,330,340)를 처리하기 위한 복수-채널 인코더(10)가 설명된다(M과 N은 정수이며, N>M). 인코더(10)는 대응 출력 신호(480,490)를 생성하기 위해 입력 신호(300,310,320,330,340)를 다운-믹싱하기 위한 다운-믹서를 포함하며, 상기 인코더는 또한 파라미터 데이터(370,430,450)를 생성하기 위해 입력 신호(300,310,320,330,340)를 처리하기 위한 분석기를 포함하며, 상기 파라미터 데이터는 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널 중 하나 이상을 디코딩하는 동안 재생성을 허용하기 위해 입력 신호의 N개의 채널 사이의 상호 차이를 설명한다. 이러한 인코더(10)는 매우 효율적인 데이터 인코딩을 제공할 수 있으며 또한 N개 미만의 디코딩 출력 채널을 구비한 비교적 더 단순한 디코더를 가진 후방 호환성일 수 있다. 본 발명은 또한 이러한 복수-채널과 호환가능한 디코더에 관한 것이다.

Description

복수-채널 인코더{MULTI-CHANNEL ENCODER}

본 발명은 공간 오디오의 파라미터 설명을 이용한 복수-채널 오디오 인코더와 같은, 복수-채널 인코더에 관한 것이다. 게다가, 본 발명은 또한 이러한 복수-채널 인코더 내의 공간 오디오 신호와 같은 신호를 처리하는 방법에 관한 것이다. 더욱이, 본 발명은 이러한 복수-채널 인코더로 생성된 신호를 디코딩하기 위해 작동하는 디코더에 관한 것이다.

오디오 기록 및 재생은 최근 수년동안 모노럴(monaural) 단일-채널 포맷에서 이중-채널 스테레오 포맷으로 진보되어 왔으며 더욱 최근에는, 예를 들어 가정용 영화 시스템에서 종종 사용되는 것과 같은 5개 채널 오디오 포맷과 같은 복수-채널 포맷으로 진보되었다. 수퍼 오디오 컴팩트 디스크(SACD)와 디지털 다용도 디스크(DVD) 데이터 캐리어의 도입은 이러한 5개 채널 오디오 재생이 현대의 관심의 대상이 되는 결과를 가져왔다. 많은 사용자들은 현재 그들의 가정에서 5개 채널의 오디오 재생을 제공할 수 있는 장비를 가지고 있으며; 이에 따라, 적절한 데이터 캐리어 상의 5개 채널의 오디오 프로그램 컨텐츠는, 예를 들어 전술한 SACD 및 DVD 유형의 데이터 캐리어와 같이, 더욱 이용가능하게 되고 있다. 복수-채널 프로그램 컨텐츠에 대한 증가하는 관심으로 인해, 복수-채널 오디오 프로그램 컨텐츠의 더욱 효율적인 코딩은, 예를 들어, 개선된 품질, 더욱 길어진 재생 시간 또는 심지어 추가된 채널 중 한 가지 이상을 제공하기 위해, 중요한 사안이 되고 있다.

파라미터 설명기에 의한 오디오 프로그램 컨텐츠에 대한 공간 오디오 정보를 나타낼 수 있는 인코더는 알려져 있다. 예를 들어, 공개된 국제 PCT 특허 출원 PCT/IB2003/002858(재2004/008805)에서, 적어도 제 1 신호 성분(LF), 제 2 신호 성분(LR) 및 제 3 신호 성분(RF)을 포함하는 복수-채널 오디오 신호의 인코딩은 설명된다. 이러한 코딩은:

(a) 제 1 인코딩된 신호(L) 및 제 1 인코딩 파라미터(P2) 집합을 생성하기 위한 제 1 파라미터 인코더를 사용함으로써 제 1 및 제 2 신호 성분을 인코딩하는 단계;

(b) 제 2 인코딩된 신호(T)와 제 2 인코딩 파라미터(P1) 집합을 생성하기 위해 제 2 파라미터 인코더를 사용함으로써 제 1 인코딩된 신호(L)와 추가적 신호(R)를 인코딩하는 단계로서, 추가 신호(R)는 적어도 제 3 신호 성분(RF)으로부터 유도된, 제 1 인코딩된 신호(L)와 추가적 신호(R)를 인코딩하는 단계

(c) 적어도 제 2 인코딩된 신호(T), 제 1 인코딩 파라미터(P2) 집합 및 제 2 인코딩 파라미터(P1) 집합으로부터 유도된 결과 인코딩된 신호(T)에 의해 적어도 복수-채널 오디오 신호를 나타내는 단계

를 포함하는 방법을 사용한다.

오디오 신호의 파라미터 설명은 수년동안 관심을 받아 왔으며, 이는 오디오 신호를 설명하는 양자화된 파라미터를 전송하는 단계는 비교적 작은 전송 용량을 필요로 하는 것으로 나타났기 때문이다. 이들 양자화된 파라미터는 그들의 대응하는 원래 오디오 신호와 상당히 다르지 않은 오디오 신호를 지각적으로 재생성하기 위해 디코더 내에 수신되고 처리될 수 있다.

현대의 복수-채널 인코더는 출력 인코딩된 데이터로 전송된 다수의 오디오 채널로 실질적으로 선형으로 스케일링되는 비트율에서 출력 인코딩된 데이터를 생성한다. 이러한 특성은 문제가 되는 추가적 채널의 포함을 제공하는데, 이는 주어진 데이터 캐리어 저장 용량 또는 오디오 표현의 품질에 대한 재생 지속 기간이 더 많은 채널을 수용하도록 이에 따라 희생되어야 하기 때문이다.

본 발명의 목적은 예를 들어, 복수-채널 오디오 데이터 컨텐츠와 같은, 복수-채널 데이터 컨텐츠의 더욱 효율적인 인코딩을 제공하기 위해 작동하는 복수-채널 인코더를 제공하는 것이다.

발명자는, 적절한 인코딩 방법의 사용을 통해, 출력 인코딩된 데이터는, 예를 들어, 5개 채널의 오디오 프로그램 컨텐츠에 대응하는 정보를 전달하면서, 2개 채널의 오디오 프로그램 컨텐츠, 즉, 스테레오를 전달하는데 통상 필요한 비트율을 사용할 수 있다는 것을 이해했다.

따라서, 본 발명의 제 1 양상에 따라, 파라미터 데이터와 함께 M개의 출력 채널로 전송된 대응 출력 신호를 생성하기 위해 N개의 입력 채널로 전송된 입력 신호를 처리하기 위해 배열된 복수-채널 인코더가 제공되며, 이 때 M과 N은 정수이며 N은 M보다 크고, 상기 인코더는:

(a) 대응하는 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱하는 다운-믹서; 및

(b) 다운-믹싱동안 또는 별도의 프로세스로서 입력 신호를 처리하기 위한 분석기로서, 상기 분석기는 출력 신호에 상보적인 상기 파라미터 데이터를 생성하도록 작동하며, 상기 파라미터 데이터는 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널 중 하나 이상을 디코딩하는 동안 실질적인 재생성을 허용하기 위해 입력 신호의 N개의 채널 사이에 상호 차이를 설명하며, 상기 출력 신호는 후방 호환성을 가능케 하는 N개 또는 N개 미만의 출력 신호를 제공하는 디코더 내의 재생을 위해 호환가능한 형태인, 입력 신호를 처리하기 위한 분석기

를 포함한다.

본 발명의 이점은 복수-채널 인코더가, 예를 들어, 2개 채널의 스테레오 재생 장치와 호환가능하도록 렌더링될 수 있는 출력 스트림으로 복수-채널 입력 신호를 더 효율적으로 인코딩할 수 있다는 점이다.

이전 유형의 대응 디코더를 구비한 인코더의 이러한 후방 호환성은 세 가지 방법으로 제공된다:

(a) 인코더로부터의 출력 다운-믹싱된 신호는 이들 신호의 재생이, 즉, 추가적 처리 또는 디코딩없이, 대응하는 제한된 수의 고성 스피커의 제한이 주어진 경우, 예컨대, 5개 채널의 공간 이미지의 양호한 근사인 공간 이미지를 초래하는 방식으로 생성된다. 이러한 속성은 후방 재생 호환성을 보장한다;

(b) 다운-믹싱된 신호와 연관된 공간 파라미터는 비트 스트림의 보조적 데이터 부분에 배치된다. 보조적 데이터 부분을 디코딩할 수 없는 디코더는 여전히 전송된 신호를 디코딩할 수 있을 것이다. 이러한 속성은 후방 디코딩 호환성을 보장한다; 및

(c) 비트-스트림의 보조 부분과 디코더 구조에 저장된 파라미터는 파라미터 디코더가 적절한 2개, 3개 및 4개 채널의 신호를 재생성할 수 있는 방법으로 제조된다. 이러한 속성은 이용된 재생 시스템에 대한 융통성을 제공하며, 따라서 2개, 3개 및 4개 채널의 시스템과의 후방 호환성을 제공한다.

바람직하게, 인코더에서, 분석기는 시간 도메인에서 주파수 도메인으로 변환에 의해 입력 신호를 변환하고 파라미터 데이터를 생성하기 위해 이들 변환된 입력 신호를 처리하기 위한 처리 수단을 포함한다. 주파수 도메인 내의 입력 신호의 처리는 인코더 내의 효율적인 인코딩을 제공하는 이점이 있다. 더 바람직하게, 인코더에서, 다운-믹서 및 분석기 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 입력 신호를 처리하기 위해 배열된다.

바람직하게, 인코더에서, 타일들은 서로 중첩하는 분석 윈도우의 변환에 의해 얻어진다. 이러한 중첩은 더 나은 연속성을 허용하며 이에 따라 출력 신호가 입력 신호의 표시를 재생성하기 위해 이후 디코딩될 때 인코딩 결함을 감소시킨다.

바람직하게, 인코더는 M개의 출력 신호에의 포함을 위한 M개의 중간 오디오 데이터 채널을 생성하기 위해 입력 신호를 처리하기 위한 코더를 포함하며, 분석기는:

(a) 인터-채널 입력 신호 제곱 비율 또는 대수의 레벨 차이;

(b) 입력 신호 사이의 인터-채널 통일성;

(c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합 사이의 제곱 비율; 및

(d) 신호 쌍 사이의 위상차 또는 시간차

중 적어도 하나와 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된다.

더 바람직하게, (d) 내의 위상차는 평균 위상차이다.

바람직하게, 인코더에서, 위상차, 통일성 데이터 및 제곱 비율 중 적어도 하나의 계산은 출력 신호를 생성하기 위해 주요 성분 분석(PCA) 및/또는 인터-채널 위상 정렬이 후속된다.

바람직하게, 입력 데이터가 재생성될 때 원래 입력 신호와의 더 가까운 근접성(resemblance)을 제공하기 위해, 인코더에서, N개 채널로 전송된 입력 신호들 중 적어도 하나는 효과 채널에 대응한다.

바람직하게, 인코더는 종래의 재생 시스템을 사용하여 재생에 적합한 형태로 출력 신호를 생성하기 위해 적응된다.

본 발명의 제 2 양상에 따라서, 파라미터 데이터와 함께 M개의 출력 채널로 전송된 대응 출력 신호를 생성하기 위해 복수-채널 인코더 내에 N개의 입력 채널로 전송된 입력 신호 인코딩 방법이 제공되며(M과 N은 정수이며 N은 M보다 큼), 상기 방법은:

(a) 상기 대응 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱하는 단계; 및

(b) 분석기에서 다운-믹싱되거나 분리될 때 입력 신호를 처리하는 단계로서, 상기 처리 단계는 출력 신호에 상보적인 상기 파라미터 데이터를 제공하며, 상기 파라미터 데이터는 디코딩 동안 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널의 재생성을 실질적으로 허용하기 위해 입력 데이터의 N개의 채널 사이의 상호 차이를 설명하며, 상기 출력 신호는 N개 또는 N개 미만의 출력 신호를 제공하는 디코더에서 재생을 위해 호환가능한 형태인, 입력 신호를 처리하는 단계

를 포함한다.

바람직하게, 상기 방법은 5개 채널에 대응하는 입력 신호를 인코딩하고 대응하는 2개 채널의 스테레오 디코더, 3개 채널의 디코더 및 4개 채널의 디코더 중 하나 이상과 호환가능한 형태로 출력 신호와 파라미터 데이터를 생성하기 위해 적응된다.

바람직하게, 상기 방법에서, 상기 처리 단계는 시간 도메인에서 주파수 도메인으로의 변환에 의해 입력 신호를 변환하는 단계를 포함한다.

바람직하게, 상기 방법에서, 입력 신호들 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 처리된다.

바람직하게, 상기 방법에서, 타일들은 상호 중첩하는 분석 윈도우에 대응한다.

바람직하게, 상기 방법은 출력 신호에 포함하기 위한 M개의 중간 오디오 데이터 채널을 생성하도록 입력 신호를 처리하기 위한 코더를 사용하는 단계를 포함하며, 상기 코더는

(a) 인터-채널 입력 신호 제곱 비율 또는 대수의 레벨 차이;

(b) 입력 신호 사이의 인터-채널 통일성;

(d) 신호 쌍 사이의 위상차 또는 시간차

더 바람직하게, (d)에서의 위상차는 평균 위상차이다.

바람직하게, 상기 방법에서, 레벨차, 통일성 데이터 및 제곱 비율 중 적어도 하나는 출력 신호를 생성하기 위해 주요 성분 분석 및/또는 위상 정렬이 후속된다.

바람직하게, 상기 방법에서, N개의 채널로 전송된 입력 신호들 중 적어도 하나는 효과 채널에 대응한다.

본 발명의 제 3 양상에 따라, 데이터 캐리어 상에 저장된 인코딩된 데이터 컨텐츠가 제공되며, 상기 데이터 컨텐츠는 본 발명의 제 2 양상에 따라 방법을 사용하여 생성된다.

본 발명의 제 4 양상에 따라, 본 발명의 제 1 양상에 따른 인코더에 의해 생성된 것과 같은 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더가 제공되며, 상기 인코딩된 출력 데이터는 M개의 채널과 N개의 채널의 입력 신호로부터 생성된 관련 파라미터 데이터를 포함하며, 이 때 M<N이고, M과 N은 정수이며, 상기 디코더는:

(a) 인코딩된 출력 데이터를 수신하고 이를 시간 도메인에서 주파수 도메인으로 변환하고;

(b) 인코딩된 출력 데이터에 직접 포함되지 않거나 이로부터 생략된 하나 이상의 N개의 채널의 입력 신호에 대응하는 재생성된 데이터 컨텐츠를 M개의 채널로부터 재생성하기 위해 M개의 채널로부터 컨텐츠를 추출하기 위해 주파수 도메인 내의 파라미터 데이터를 적용하며; 그리고

(c) 디코더의 하나 이상의 출력에서 N개의 채널의 하나 이상의 재생성된 입력 신호를 출력하기 위해 재생성된 데이터 컨텐츠를 처리하기 위한 프로세서를 포함한다.

바람직하게, 디코더에서, 프로세서는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하는데 사용하기 위한 신호의 비상관된 버전을 얻기 위해 모든-통과 비상관 필터를 적용하도록 작동한다.

바람직하게, 디코더에서, 프로세서는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하기 위해 그들의 구성 성분으로 M개의 채널의 신호와 그 비상관된 버전을 분할하기 위해 역 인코더 회전을 적용하도록 작동한다.

본 발명의 특성은 본 발명의 범위를 이탈하지 않고 임의의 결합으로 조합될 수 있다.

본 발명의 실시예는 이제, 다음 도면을 참조하여, 예로써만 설명될 것이다.

도 1은 본 발명에 따른 제 1 복수-채널 인코더의 개략도.

도 2는 예를 들어 저주파 효과와 같은 효과의 제공을 포함하는 본 발명에 따른 제 2 복수-채널 인코더의 개략도.

도 3은 복수-채널 디코더가 도 1 및 도 2의 인코더에 상보적이며 이러한 인코더로부터 제공된 출력 데이터를 디코딩할 수 있는, 본 발명에 따른 복수-채널 디코더의 개략도.

입력 데이터의 N개의 채널이 제공되고 대응하는 인코딩된 출력 데이터 스트림을 생성하도록 입력 데이터를 인코딩하기 위해 배열된 복수-채널 인코더 내에서 실행된 인코딩을 개선하기 위해, 발명자는 인코더가 유리하게:

(a) N개의 채널의 입력 데이터를 M개의 채널로 다운-믹싱하고(M<N); 및

(b) 출력 데이터 스트림을 생성할 때 M개의 채널의 데이터와 결합하도록 비교적 소량의 파라미터 오버헤드 데이터를 생성하도록, 작동하는 것을 생각하였으며, 상기 파라미터 데이터는 출력 데이터 스트림이 공급된 후속 디코더에서 N개의 채널에 대응하는 데이터의 재구성을 가능케 하도록 배열된다.

예컨대, 복수-채널 인코더는 바람직하게 5개 채널 인코더, 즉 N=5이다. 5개 채널의 인코더는 2개 채널의 중간 데이터(즉, M=2)를 생성하기 위해 5개의 입력 채널에 대응하는 데이터를 다운-믹싱하기 위해 구성된다. 게다가, 5개 채널의 인코더는 출력 데이터 스트림을 생성하기 위해 2개의 채널의 데이터와 결합하도록 연관된 파라미터 오버헤드 데이터를 생성하도록 작동하며, 파라미터 데이터는 디코더가 5 개의 입력 채널의 표시를 구성할 수 있게 하기에 충분하다. 디코더의 장점은 N=2,3,4인, 즉, 2-채널, 3-채널 및 4-채널 출력 상황과 후방 호환가능한 상황을 지원하기 위해 후방 호환가능하다는 것이다.

본 발명의 바람직한 실시예에서, 인코더는 N개의 입력 데이터 채널을 처리하도록 작동한다. N개의 입력 채널은 중앙 오디오 데이터 채널, 왼쪽-전방 오디오 데이터 채널, 왼쪽-후방 오디오 데이터 채널, 오른쪽-전방 오디오 데이터 채널 및 오른쪽 후방 오디오 데이터 채널에 해당하며; 이러한 5개의 채널은 가정용 영화형 프로그램 컨텐츠 재생에 적합한 음향의 명백한 3차원 분산을 생성할 수 있다. N개의 입력 데이터 채널은, 예를 들어, 현대의 스테레오 오디오 코더를 사용하여 인코딩되는 것과 같이, 2개의 중간 오디오 데이터 채널로 다운-믹싱된다. 코더는 유리하게 왼쪽-전방 및 왼쪽-후방 데이터 채널의 주요 성분 분석 및/또는 위상 정렬을 이용한다. 인코더는 또한 오른쪽-전방 및 오른쪽-후방 입력 채널 상의 분리된 주요 성분 분석 및/또는 위상 정렬을 이용하기 위해 배열된다. 게다가, 인코더는 다음과 관련된 정보를 포함하는 파라미터 오버헤드 데이터를 생성하도록 작동한다.

(a) 왼쪽-전방 및 왼쪽-후방 데이터 채널 사이의 인터-채널 레벨 차이;

(b) 오른쪽-전방 및 오른쪽-후방 데이터 채널 사이의 인터-채널 레벨 차이;

(c) 왼쪽-전방 및 왼쪽-후방 채널과 관련된 인터-채널 통일성 데이터;

(d) 오른쪽-전방 및 오른쪽-후방 데이터 채널과 관련된 인터-채널 통일성 데이터; 및

(e) 중앙 데이터 채널과 왼쪽-전방, 왼쪽-후방, 오른쪽-전방 및 오른쪽-후방 데이터 채널의 제곱의 합 사이의 제곱 비율.

2개의 중간 데이터 채널과 파라미터 오버헤드 데이터는 인코더로부터 인코딩된 출력 데이터를 생성하기 위해 결합된다. 선택적으로, 인터-채널 위상차와 한 편으로 왼쪽-전방 및 왼쪽-후방 데이터 채널, 다른 한편으로는 오른쪽-전방 및 오른쪽-후방 데이터 채널 사이의 바람직하게는 전체 위상차이에 관한 데이터는 인코더로부터 인코딩된 출력 데이터에 포함된다. 본 발명의 이러한 예시적인 실시예에 관한 (a) 내지 (e)에서 행해진 파라미터 분석은 시간 및 주파수 분석을 수반하는 것이 바람직하며; 더 바람직하게는, 분석은 이후 더 설명되는 것처럼, 시간-주파수 타일에 의해 수행된다.

본 발명의 바람직한 실시예에서의 인코더 작동은 이제, 그 부분과 신호가 표 1에 제공된 것과 같이 정의된 도 1을 참조하여 관련된 수학적 함수의 관점에서 더 자세히 설명될 것이다.

10	인코더	320	중앙 신호, S_C
20	제 1 채널	330	오른쪽-전방 신호, S_rf
30	제 2 채널	340	오른쪽-후방 신호, S_rr
40	제 3 채널	350	왼쪽 전방 변환된 신호, TS_lf
100	세그먼트 및 변환 유닛	360	왼쪽 후방 변환된 신호, TS_lr
110	파라미터 분석 유닛	370	제 1 파라미터 세트, PS1
120	파라미터/다운믹스 벡터 유닛	380	왼쪽 중간 신호, L1
130	다운-믹스 유닛	400	중앙 중간 신호, C1
140	세그먼트 및 변환 유닛	410	오른쪽 전방 변환된 신호, TS_rf
150	세그먼트 및 변환 유닛	420	오른쪽 후방 변환된 신호, TS_rr
160	파라미터 분석 유닛	430	제 2 파라미터 세트, PS2
170	파라미터/다운믹스 벡터 유닛	440	오른쪽 중간 신호, R1
180	다운-믹스 유닛	450	제 3 파라미터 세트, PS3
200	믹싱 및 파라미터 추출 유닛	460	오른쪽 사전-출력 신호, PR_out
210	역변환 및 OLA 유닛	470	왼쪽 사전-출력 신호, PL_out
300	왼쪽 전방 입력 신호, S_lf	480	오른쪽 출력 신호, R_out
310	왼쪽 후방 입력 신호, S_lr	490	왼쪽 출력 신호, L_out

도 1에서, 전체적으로 10으로 표시된 인코더가 도시된다. 인코더(10)는 제 1, 제 2 및 제 3 입력 채널(20,30,40)을 각각 포함한다. 이들 세 개의 채널(20,30,40)로부터의 출력 신호(380,400,440), 즉 LI,CI,RI 각각은 믹싱 및 파라미터 추출 유닛(200)과 연결된다. 추출 유닛(200)은 연관된 오른쪽 및 왼쪽 사전-출력 신호(460,470), 즉 PR_out, PL_out를 포함하며, 이들은 인코딩된 오른쪽 및 왼쪽 출력 신호(480,490), 즉 R_out,L_out 각각을 생성하기 위해 역 변환 및 OLA 유닛(210)과 연결된다.

제 1 채널(20)은, 왼쪽 전방 및 왼쪽 후방 입력 신호(300,310), 즉 S_lf,S_lr 각각을 수신하기 위한 세그먼트 및 변환 유닛(100)을 포함한다. 대응하는 왼쪽 전방 및 왼쪽 후방 변환된 신호(350,360), 즉 TS_lf,TS_lr는 채널(20)의 다운-믹스 유닛(130), 그리고 또한 채널(20)의 파라미터 분석 유닛(110)에 연결된다. 제 1 파라미터 세트 신호(370), 즉, PS1은 그 대응 출력이 다운-믹스 유닛(130)에 연결된 파라미터/다운믹스 벡터 변환 유닛(120)의 입력에 연결된다.

제 2 채널(30)은 중앙 입력 신호(320), 즉 S_c을 수신하기 위해 배열된 세그먼트 및 변환 유닛(140)을 포함한다. 중앙 중간 신호(400), 즉 CI는 전술한 것처럼 변환 유닛(140)으로부터 파라미터 추출 유닛(200)으로 연결된다.

제 3 채널(40)은 오른쪽 전방 및 오른쪽 입력 신호(330,340), 즉 S_rf,S_rr 각각을 수신하기 위한 세그먼트 및 변환 유닛(150)을 포함한다. 대응하는 오른쪽 전방 및 오른쪽 후방 변환된 신호(410,420), 즉 TS_rf,TS_rr는 채널(40)의 다운-믹스 유닛(180), 및 또한 채널(40)의 파라미터 분석 유닛(160)에 연결된다. 제 2 파라미터 세트 신호(430), 즉 PS2는, 그 대응 출력이 다운-믹스 유닛(180)에 연결된 파라미터/다운믹스 벡터 변환 유닛(170)의 입력에 연결된다.

파라미터 추출 유닛(200)은 OLA 유닛(210)을 위한 사전-출력 신호(470,460), 즉, PR_out,PL_out뿐만 아니라, 제 3 파리미터 세트 출력(450), 즉 PS3를 생성하기 위해 채널(20,30,40)로부터 신호(380,400,440)를 수신하기 위해 배열된다.

인코더(10)는 전용 하드웨어로 구현될 수 있다. 대안적으로, 인코더(10)는 인코더(10)의 처리 함수를 구현하기 위한 소프트웨어를 실행하기 위해 배열된 컴퓨터 하드웨어에 기초할 수 있다. 추가적 대안으로서, 인코더(10)는 소프트웨어 제어하에서 작동하는 컴퓨터 하드웨어에 연결된 전용 하드웨어의 결합으로 구현될 수 있다.

인코더(10)의 작동은 도 1을 참조하여 이제 설명될 것이다. 신호(S_lf[n], S_lr[n],S_rf[n],S_rr[n],S_c[n])는 왼쪽-전방, 왼쪽-후방, 오른쪽-전방, 오른쪽-후방 및 중앙 오디오 신호 각각에 대한 이산 시간 파형을 설명한다. 채널(20,30,40)에서, 이들 5개의 신호들은 공통 분할(segmentation)을 사용하여, 바람직하게는, 중첩된 분석 윈도우를 사용하여 분할된다. 이후, 각 세그먼트는 예를 들어, 푸리에 변환(Fourier transform) 또는 동등한 유형의 변환과 같은 복잡한 변환을 사용하여 시간 도메인에서 주파수 도메인으로 변환되며; 대안적으로, 예를 들어, 적어도 하나의 하드웨어를 사용하여 구현되거나 소프트웨어에 시뮬레이팅된 복잡한 필터-뱅크 구조는, 시간/주파수 타일을 얻기 위해 이용될 수 있다. 이러한 신호 처리는 L_f[k],L_r[k],R_f[k],R_r[k],C[k]로 표시된 주파수 도메인 내의 입력 신호의 세그멘트된 서브-대역 표시를 초래하며, 파라미터(k)는 주파수 색인을 표시하며, L은 왼쪽을 나타내며, R은 오른쪽을 나타내며, f는 전방, r은 후방을 나타내며 C는 중앙을 나타낸다.

파라미터 추출 유닛(200)에서, 데이터 처리는 왼쪽-전방 및 왼쪽-후방 신호 사이의 관련된 파라미터를 평가하기 위한 제 1 단계에서 실행된다. 이들 파라미터들은 레벨 차이(IID_L), 위상차(IPD_L) 및 통일성(ICC_L)을 포함한다. 바람직하게, 위상차(IPD_L)는 평균 위상차에 대응한다. 게다가, 이들 파라미터(IID_L,IPD_L 및 ICC_L)는 수학식 1 내지 수학식 3에 제공된 것처럼 계산된다.

이 때 기호(*)는 켤레 복소수를 나타낸다.

수학식 1 내지 수학식 3으로 설명된 이 프로세스는 또한 오른쪽-전방 및 오른쪽-후방 신호에 대해 반복되며, 이러한 처리는 레벨차, 위상차 및 통일성 각각과 관련된 대응 파라미터(IID_R,IPD_R 및 ICC_R)를 야기한다.

파라미터/다운믹스 벡터 변환 유닛(120)에서, 데이터 처리는 2개의 신호 왼쪽-전방(L_f) 및 왼쪽-후방(L_r)의 다운-믹싱을 위한 복소수 가중치를 계산하기 위해 제 2 단계에서 실행된다. 바람직한 실시예에서, 다운-믹스 유닛(130)으로 전송된 다운-믹스 벡터는 입력 신호 공간의 회전(α) 및/또는 복소 위상 정렬을 적용함으로써 다운-믹스 신호(Y[k])의 에너지를 최대화하기 위해 배열된다.

다운-믹스는 다음과 같이 적용된다. 두 개의 신호(L_f 및 L_r)는 수학식 4로 표시된 것과 같은 주 신호(Y[k])의 에너지를 최대화하는 회전각(α)을 사용하여 주 신호(Y[k])와 대응 잔여 신호(Q[k])를 얻기 위해 회전된다.

이 때 각(OPD_L)은 전체 위상 회전각을 표시하는 반면, 위상차(IPD_L)는 두 개의 신호(L_f 및 L_r)의 최대 위상-정렬을 보장하기 위해 계산된다. 회전각(α)은 수학식 5와 수학식 6을 사용하여 추출된 파라미터로부터 계산가능하다.

수학식 4로부터의 신호(Q[k])는 이후 파라미터 추출 유닛(200)에서 버려지며, 신호(Y[k])는 신호(L[k])가 신호(Q[k])의 제곱과 유사한 제곱에 신호(Y[k])의 제곱을 더한 값을 갖도록 신호(L[k])를 얻기 위해 스칼라(β)만큼 스케일링되는데; 다시 말해, 신호(Q[k])는 버려지는 한편 발생한 신호 제곱 내의 대응하는 손실은 신호(Y[k])를 스케일링함으로써 보상된다. 스칼라(β)는 수학식 7과 수학식 8을 사 용하여 계산가능하다.

여기서

제 1 및 제 2 단계는 또한 오른쪽-전방 및 오른쪽-후방 신호 쌍에 대해 반복되며, 대응하는 신호(R[k])의 생성을 초래한다. PCA 회전의 사용은 회전각(α)에 대해 고정된 값을 사용함으로써 우회될 수 있다는 것이 주목되어야 한다.

인코더(10) 내에서 실행된 제 3 처리 단계는 신호(L[k] 및 R[k]) 양자로 중앙 신호(C[k])를 믹싱하는 단계를 포함하며, 이는 사전-출력 신호(470,460), 즉 PL_out, PR_out 각각의 생성을 초래한다. 이러한 믹싱 단계는 수학식 9에 따라 실행된다.

파라미터(ε)는 예컨대, 일반적으로 ε=0.707인, 수학식 9와 연관된 믹싱에 서 신호(C[k])의 강도를 결정하는 가중치를 나타낸다. 바람직하게, L,C 및 R의 각 조합은 위상에 대해 정렬되며, 그렇지 않으면 위상 취소가 발생한다.

신호(L 및 R)의 제곱에 대한 신호(C)의 제곱을 설명하는 파라미터(IID_C)는 수학식 10에서 계산가능하다.

전술한 제 1, 제 2 및 제 3 단계를 포함하는 전술한 프로세스는 각 시간/주파수 타일에 대해 인코더(10)에서 반복된다.

신호(PL_out[k] 및 PR_out[k])는 이후 인코더에서 임시 도메인으로 변환되며 전술한 출력 신호(490,480), 즉 L_out,R_out를 각각 생성하기 위해 합계의 중복-추가 유형을 사용하여 이전 세그먼트와 결합된다.

인코더(10)로부터의 출력 데이터는, 예컨대 인터넷 또는 다른 유사한 방송 네트워크를 통해, 통신 네트워크에 의해 통신될 수 있다. 대안적으로, 또는 추가적으로, 출력 데이터는, 예를 들어 DVD 광 데이터 디스크 또는 다른 유사한 유형의 데이터 전송 매체와 같은, 데이터 캐리어에 의해 전송될 수 있다.

인코더(10)로부터의 출력 데이터는, 예를 들어, 도 3에서 800으로 표시된 디코더에서, 인코더(10)와 호환가능한 디코더 내에 디코딩될 수 있다. 디코더(800)는 대응 디코딩된 출력 신호(DOP)를 생성하기 위해, 출력 신호(480,490)와 인코 더(10,600)로부터 수신된 연관된 파라미터 데이터(370,430,450,690)의 다양한 수학적 연산을 위한 데이터 처리 유닛(810)을 포함한다.

후방 호환성을 제공하기 위해, 이러한 디코더는 스테레오, 3-채널 및 5-채널 장치 중 적어도 하나가 될 수 있다. 인코더(10)와 호환가능한, 즉, 디코더(800)가 DOP를 위해 오직 2개의 디코딩된 출력을 포함하는, 스테레오-형 디코더에서, 2개의 재생 채널, 즉, 인코더(10)로부터 제공된 신호(R_out,L_out)를 구비한 스테레오-형 디코더는 처리가 추가적으로 행해지는 것 없이 2개의 재생 채널에 대해 스테레오-형 디코더에서 재생된다.

인코더(10)와 호환가능한 3-채널 디코더에서, 3개의 재생 채널을 구비한, 즉 디코더(800)가 DOP에 대해 3개의 디코딩된 출력을 포함하는, 디코더는, DVD 광디스크와 같이, 예컨대, 데이터 캐리어로부터 판독되는, 2개의 신호(R_out,L_out)는 세그멘트된 다음 전술한 주파수 도메인으로 변환된다. 대응하는 재생성된 신호(L[k],R[k] 및 C[k])는 이후 수학식 11 내지 수학식 16을 사용하여 유도된다.

사용자-애플리케이션을 위한 3-채널 오디오 신호는 이후 전술한 것과 유사한 방법으로 신호(L[k],R[k] 및 C[k])로부터 유도된다.

인코더(10)와 호환가능한 5-채널 디코더에서, 즉, 디코더(800)가 5개의 디코딩된 출력을 제공하는 경우, 전술한 것과 같은 3-채널 재생 구조가 이용되며 디코더에서 신호(L[k],R[k] 및 C[k])의 재생성을 야기한다. 5-채널 디코더에서, 추가적 단계가 실행되며, 이는 구성 성분, 즉 전방 왼쪽 성분(L_f[k]) 및 후방 왼쪽 성분(L_r[k])으로 신호(L[k])를 분할하는 단계를 포함하며; 유사하게, 신호(R[k])는 또한 구성 성분, 즉, 전방 오른쪽 성분(R_f[k]) 및 후방 오른쪽 성분(R_r[k])으로 분할 된다. 이러한 신호 분할은 전술한 것처럼, 인코더(10)에서 수행된 회전에 상보적인 역 인코더 회전 작동을 이용한다. 역회전에 필요한 주 신호(Y[k])와 잔여 신호(Q[k])는 수학식 17 및 수학식 18을 사용하여 5가지 디코더에서 유도된다.

여기서

파라미터(μ)는 전술한 수학식 8에서 이전에 정의된다. 수학식 17에서, H[k]는 신호 L[k]의 비상관 버전을 얻기 위해 모든-통과 비상관 필터를 표시한다. 이후, 신호(L_f[k] 및 L_r[k])는 수학식 19에서 설명된 역 인코더 회전 함수를 사용하여 생성된다.

유사한 처리는 또한 오른쪽 채널 성분에 대해 응용된다.

인코더(10)와 호환가능한 4-채널 디코더에서, 4-채널 디코더는 5개의 오디오 신호(S_lf,S_lr,S_rf,S_rr 및 S_c)를 생성하기 위해 전술한 5-채널 디코더에서 이용된 것과 유사한 방법으로 우선 5개 채널을 디코딩하도록 작동한다. 이후, 단순한 믹싱은 사용자의 이해를 위해 왼쪽-전방 및 오른쪽-전방 오디오 신호(S_lf,playback,S_rf,playback)를 생성하기 위해 수학식 20 및 수학식 21에 따라 발생한다.

여기서 계수 q=0.707이다.

계수(q)는 4-채널 디코더에 대해, 중앙 신호 성분의 전체 제곱이, 단일한 중앙 고성 스피커를 통한 재생과 무관하게 또는 4-채널 디코더에 연결된 왼쪽 전방 및 오른쪽 전방 고성 스피커에 의해 생성된 사용자에 대한 음향의 환영 추정 소스(phantom apprent source)로서 실질적으로 일정하다는 것을 보장한다.

전술한 내용에서 설명된 본 발명의 실시예는 첨부된 청구항에 의해 한정된 것처럼 본 발명의 범위를 이탈하지 않고 변경할 수 있다는 것이 이해될 것이다.

발명자는, 인코더(10)가 예를 들어 저주파수 효과 채널과 같은, 효과 채널(LFE)의 코딩을 지원하지 않는다는 것을 확인하였다. 이러한 LFE 채널은 예를 들어, 가정용 영화 시스템에서 사용자에게 동시에 제공된 시각 정보를 유리하게 수반 하는 천둥 소리 정보 또는 폭파음 정보와 같은 음향 효과를 전달하기 위해 유리하다. 따라서, 발명자는 본 발명의 실시예에서, 제 2 채널(30)을 강화하고 이에 따라 도 2에 도시되고 일반적으로 600으로 표시된 것과 같이 인코더를 생성하기 위해 인코더(10)를 변경하는 것이 유리하다는 것을 이해하였다. 선택적으로, LFE 채널은, 선택적인 비교적 더 큰 대역폭이 또한 수용될 수 있다고 해도 거의 120Hz의 비교적 제한된 주파수 대역폭을 가진다.

인코더(600)는, 일반적으로 인코더(10)와 유사한데, 단, 인코더(600)의 제 2 채널(30)이 파라미터 분석 유닛(630) 및 제 1 및 제 3 채널(20,40) 각각의 대응 성분과 유사한 방법으로 연결된 다운-믹스 벡터 유닛(640)과 다운-믹스 유닛(650)에 대한 파라미터가 제공되며; 인코더(600)의 채널(30)이 제 4 파라미터 세트(690), 즉 PS4을 출력하도록 작동한다는 점은 제외한다. 게다가, 인코더(600)의 제 2 채널(30)은 저주파 효과 채널(S_lfe)을 수신하기 위한 저주파 효과(lfe) 입력(610) 및 또한 전술한 중앙 신호(S_c)를 수신하기 위한 입력(620)을 포함한다. 바람직하게, 신호(S_lfe)의 처리는 서브-오디오 주파수 상향에서 120Hz의 주파수 대역폭으로 제한되며 그러므로 잠재적으로 현대의 서브-우퍼형 고성 스피커를 구동하기에 적합하다. 그러나, 본 발명의 실시예들은, 예를 들어, 충격-유사 음향에 해당하는 고주파 신호 정보를 제공하기 위해, 120Hz보다 훨씬 큰 대역폭을 지니는 제 2 채널(30)로 구현될 수 있다.

인코더(600)로부터의 입력 내의 저주파 효과 정보의 포함은 인코더(10)에 비 해 추가적 파라미터의 사용을 요구한다. 입력(610)에 제공된 신호는 인코더(10)를 통해 처리된 다른 전술한 오디오 신호와 유사한 방법으로 시간/주파수 타일에 기초하여 분석된 대응 대표 파라미터를 결정하기 위해 인코더(600)에서 분석된다. 대응 디코더들은, 가정용 영화 시스템 내에서 오디오 서브-우퍼 고성 스피커를 구동하기 위해 증폭에 적합한 신호를 재생성하기 위해 저주파 정보를 디코딩하기 위한 추가적 특성을 포함하도록 바람직하게 배열된다.

첨부된 청구항에서, 괄호 내에 포함된 숫자 및 다른 기호들은 청구항의 이해를 돕기 위해 포함되며 어떠한 방법으로도 청구항의 범위를 제한하는 것으로 의도되지 않는다.

"포함하다", "포괄하다", "결합하다", "함유하다", "한다/이다" 및 "지니다"라는 표현은 설명 및 관련 청구항을 해석할 때 배타적이지 않은 방법으로 해석되는데, 즉, 또한 제공되는 것으로 명시적으로 한정되지 않는 다른 항목 또는 성분을 허용하도록 해석된다. 단수에 대한 참조는 또한 복수에 대한 참조로 해석되며, 반대의 경우 그 역이 적용된다.

본 발명은 공간 오디오의 파라미터 설명을 이용한 복수-채널 오디오 인코더와 같은, 복수-채널 인코더에 관한 것으로서, 복수-채널 인코더 등에 이용가능하다.

Claims

복수-채널 인코더(10;600)로서, M과 N이 정수이고 N이 M보다 크도록, 파라미터 데이터(450)와 함께 M개의 출력 채널로 전송된 대응 출력 신호(480,490)를 생성하도록 N개의 입력 채널로 전송된 입력 신호(300,310,320,330,340;300,310,610, 620,330,340)를 처리하기 위해 배열된, 복수-채널 인코더(10;600)로서,

(a) 대응 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱(down-mixing)하기 위한 다운-믹서; 및

(b) 다운-믹싱동안 또는 별도의 프로세스로서 입력 신호를 처리하기 위한 분석기로서, 상기 분석기는 출력 신호에 상보적인 상기 파라미터 데이터를 생성하도록 작동하며, 상기 파라미터 데이터는 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널 중 하나 이상을 디코딩하는 동안 실질적으로 재생성을 허용하기 위해 입력 신호의 N개의 채널 사이의 상호 차이를 설명하며, 상기 출력 신호는 후방 호환성을 가능케하기 위해 N개 또는 N개 미만의 출력 채널을 제공하는 디코더 내의 재생을 위해 호환가능한 형태인, 분석기

를 포함하는, 복수-채널 인코더.
제 1항에 있어서, 인코더는 대응하는 2개-채널의 스테레오 디코더, 3개-채널 디코더 및 4개-채널 디코더 중 적어도 하나와 호환가능한 형태로 출력 신호와 파라미터 데이터를 생성하기 위해 배열된 5개 채널 인코더인, 복수-채널 인코더.
제 1항에 있어서, 분석기는 시간 도메인으로부터 주파수 도메인으로의 변환에 의한 입력 신호의 변환 및 파라미터 데이터 생성을 위한 이들 변환된 입력 신호를 처리하기 위한 처리 수단을 포함하는, 복수-채널 인코더.
제 3항에 있어서, 다운-믹서와 분석기 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 입력 신호를 처리하기 위해 배열된, 복수-채널 인코더.
제 4항에 있어서, 타일들은 서로 중첩된 분석 윈도우의 변환에 의해 얻어지는, 복수-채널 인코더.
제 1항에 있어서, M개의 출력 신호 내에 포함을 위한 M개의 중간 오디오 데이터 채널을 생성하기 위해 입력 신호를 처리하기 위한 코더를 포함하며, 상기 분석기는:

(a) 인터-채널 입력 신호의 제곱 비율 또는 대수 레벨차;

(b) 입력 신호 사이의 인터-채널 통일성;

(c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합계 간의 제곱 비율; 및

(d) 신호 쌍 간의 위상차 또는 시간차

중 적어도 하나의 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된, 복수-채널 인코더.
제 6항에 있어서, (d)에서 상기 위상차는 평균 위상차인, 복수-채널 인코더.
제 6항에 있어서, 위상차, 통일성 데이터, 제곱 비율 중 적어도 하나의 계산은 N개의 출력 신호를 생성하기 위해 주요 성분 분석(PCA) 및/또는 인터-채널 위상 정렬이 후속되는, 복수-채널 인코더.
제 1항에 있어서, N개의 채널로 전송된 입력 신호들 중 적어도 하나는 효과 채널에 대응하는, 복수-채널 인코더.
제 1항에 있어서, 통상의 재생 시스템을 사용하여 재생에 적합한 형태로 출력 신호를 생성하기 위해 적응된, 복수-채널 인코더.
입력 신호를 인코딩하는 방법으로서, 파라미터 데이터와 함께 M개의 출력 채널로 전송된 대응 출력 신호를 생성하기 위해 복수-채널 인코더 내의 N개의 입력 채널로 전송된 입력 신호를 인코딩하는 방법은(M과 N이 정수이고 N은 M보다 큼):

(a) 상기 대응 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱하는 단계; 및

(b) 다운-믹싱되거나 별도로 될 때 입력 신호를 분석기에서 처리하는 단계로서, 상기 처리 단계는 상기 출력 신호에 상보적인 상기 파라미터 데이터를 제공하며, 상기 파라미터 데이터는 디코딩동안 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널의 재생성을 실질적으로 허용하기 위해 입력 신호의 N개의 채널 사이의 상호 차이를 설명하며, 상기 출력 신호는 N개 또는 N개 미만의 채널을 제공하는 디코더 내의 재생을 위해 호환가능한 형태인, 입력 신호를 분석기에서 처리하는 단계

를 포함하는, 입력 신호를 인코딩하는 방법.
제 11항에 있어서, 5개의 채널에 대응하는 입력 신호를 인코딩하고, 대응하는 2개의 채널 스테레오 디코더, 3개의 채널 디코더 및 4개의 채널 디코더 중 하나 이상과 호환가능한 형태로 출력 신호 및 파라미터 데이터를 생성하기 위해 적응된, 입력 신호를 인코딩하는 방법.
제 11항에 있어서, 상기 처리 단계는 시간 도메인에서 주파수 도메인으로 변환에 의해 입력 신호를 변환하는 단계를 포함하는, 입력 신호를 인코딩하는 방법.
제 13항에 있어서, 입력 신호들 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 처리된, 입력 신호를 인코딩하는 방법.
제 14항에 있어서, 타일은 상호 중첩하는 분석 윈도우에 대응하는, 입력 신호를 인코딩하는 방법.
제 11항에 있어서, 상기 방법은 출력 신호에 포함하기 위한 M개의 중간 오디오 데이터를 생성하기 위해 입력 신호를 처리하기 위한 코더를 사용하는 단계를 포함하며, 코더는:

(a) 인터-채널 입력 제곱 비율 또는 대수 레벨 차;

(b) 입력 신호 사이의 인터-채널 통일성;

(c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합계 사이의 제곱 비율; 및

(d) 신호 쌍 사이의 제곱 차 또는 시간차

중 적어도 하나와 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된, 입력 신호를 인코딩하는 방법.
제 16항에 있어서, 제곱차는 평균 제곱차인, 입력 신호를 인코딩하는 방법.
제 16항에 있어서, 위상차, 통일성 데이터 및 제곱 비율 중 적어도 하나의 계산은 출력 신호를 생성하기 위해 주요 성분 분석(PCA) 및/또는 인터-채널 위상 정렬이 후속되는, 입력 신호를 인코딩하는 방법.
제 11항에 있어서, N개 채널로 전달된 입력 신호들 중 적어도 하나는 효과 채널에 대응하는, 입력 신호를 인코딩하는 방법.
제 11항의 방법을 사용하여 생성된 인코딩된 데이터 컨텐츠.
제 20항에 청구된 인코딩된 데이터가 저장된 데이터 캐리어.
제 1항에 따른 인코더(10;600)에 의해 생성된 것과 같은 인코딩된 출력 데이터(370,430,450,480,490,690)를 디코딩하도록 작동하는 디코더(800)로서, 상기 인코딩된 출력 데이터(370,430,450,480,490,690)는 N개의 채널의 입력 신호로부터 생성된 M개의 채널(480,490)과 관련 파라미터 데이터(370,430,450,690)를 포함하며(M<N이며 M과 N은 정수), 상기 디코더(800)는:

(a) 인코딩된 출력 데이터(370,430,450,460,490,690)를 수신하고 이를 시간 도메인에서 주파수 도메인으로 변환하고;

(b) 인코딩된 출력 데이터에 직접 포함되지 않거나 이로부터 생략된 하나 이상의 N개의 채널의 입력 신호에 대응하는 M개의 채널 재생성된 데이터 컨텐츠로부터 재생성하기 위해 M개의 채널로부터 컨텐츠를 추출하기 위한 주파수 도메인 내의 파라미터 데이터를 적용하며; 그리고

(c) 하나 이상의 디코더 출력에서 N개의 채널의 하나 이상의 재생성된 입력 신호를 출력하기 위해 재생성된 데이터 컨텐츠를 처리하기 위한 프로세서(810)를 포함하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
제 22항에 있어서, 상기 프로세서(810)는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하는데 사용하기 위한 비상관된 버전의 신호를 얻기 위해 모든-통과 비상관 필터를 적용하도록 작동하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
제 23항에 있어서, 프로세서는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하기 위해 그들의 구성 성분으로 M개의 채널 신호와 그 비상관된 버전을 분할하기 위해 역 인코더 회전을 적용하도록 작동하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
제 24항에 있어서, 상기 디코더(800)는 단지 디코더(800)에서 수신된 상기 인코딩된 출력 데이터(450,480,490)로부터 하나 이상의 디코더 출력(1300 내지 1340)을 생성하기 위해 작동하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.