KR20080032146A

KR20080032146A - 파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드멀티 채널 코딩 사이의 갭을 브릿징하는 개념

Info

Publication number: KR20080032146A
Application number: KR1020087002860A
Authority: KR
Inventors: 요하네스 힐퍼트; 크리스토프 팰러; 칼스턴 린즈메이어; 랄프 스페르슈네이더
Original assignee: 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.; 에이저 시스템즈 인크
Priority date: 2005-07-19
Filing date: 2006-06-21
Publication date: 2008-04-14
Also published as: HUE064455T2; TW200723712A; EP4307124B1; AU2006272127A1; PT3404656T; EP4307125A2; DK3404656T3; FI4307125T3; JP5265358B2; CA2614384C; FI4307126T3; ES2690278T3; MY149198A; CA2614384A1; MX2008000828A; US8180061B2; TWI339028B; BRPI0616019B1; PL3404656T3; EP3404656A1

Abstract

본 발명의 목적은 업 믹싱 신호의 사운드를 점차적으로 향상시키고, 0 내지 파라메트릭 방법의 비트율까지의 사이드 정보에 의해 소모된 비트율을 증가시킴으로써 파라메트릭 멀티 채널 오디오 코딩과 매트릭 서라운드 멀티 채널 코딩 사이의 갭을 브릿징하는 것이다. 더 구체적으로, 매트릭스 서라운드(사이드 정보 없는, 제한된 오디오 품질)와 완전한 파라메트릭 복원(완전한 사이드 정보율이 필요로 하고, 좋은 품질) 사이에서 "동작점"을 탄력적으로 선택하는 방법을 제공한다. 이 동작점은 동적으로(즉, 가변적으로), 그리고 개인 적용에 의해 지시된 바와 같이, 허용되는 사이드 정보율에 따라 선택될 수 있다.

멀티 채널 오디오 디코더, 멀티 채널 인코더, 트랜스코더

Description

파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드 멀티 채널 코딩 사이의 갭을 브릿징하는 개념{CONCEPT FOR BRIDGING THE GAP BETWEEN PARAMETRIC MULTI-CHANNEL AUDIO CODING AND MATRIXED-SURROUND MULTI-CHANNEL CODING}

본 발명은 멀티 채널 오디오 코딩 및 전송에 관한 것이고, 특히, 멀티 채널 오디오의 효과적인 코딩을 위한 스테레오 장치 및 형식과 완전히 백워드 호환되는 방법으로 멀티 채널 오디오를 인코딩하는 기술에 관한 것이다.

멀티 채널 오디오 신호의 파라메트릭 코딩은 계속되는 연구의 화제이다. 통상, 멀티 채널 오디오 신호를 인코딩하는 2개의 접근법이 분류될 수 있다. 동화상 전문가 그룹(MPEG), 국제 표준화 기구(ISO)의 서브그룹은 다운 믹싱 신호에 적은 양의 도움 정보를 추가함으로써 스테레오 또는 모노 다운 믹싱 신호로부터 멀티 채널 오디오 컨텐츠의 복원용 기술의 표준화에 현재 종사하고 있다.

원래의 멀티 채널 오디오 신호의 공간 화상을 복원하기 위해서 다운 믹싱 신호에 미리(무조건) 포함되지 않은 어느 추가적 사이드 정보를 필요로 하지 않는 병렬 스테레오 투 멀티 채널 업 믹싱 방법이 개발되고 있다.

실제 타당성을 얻었던 추가적 사이드 정보 없이 스테레오 호환적인 멀티 채널 전송을 위한 현행 방법은 http://dolby.com/assets/pdf/tech_library/209_Dolby_Surround_Pro_Logic_Ⅱ_Decoder_Principles_of_Operation.pdf의 "Dolby Surround Pro Logic Ⅱ Decoder - Principles of Operation" 및 Griesinger, D., 101st AES Convention, Los Angeles, USA, 1996, Preprint 4402의 "Multichannel Matrix Surround Decoders for Two-Eared Listeners", 에 더 상세히 설명된 바와 같이, Dolby Pro Logic Ⅱ(Dolby Pro Logic Ⅱ) 및 Logic-7과 같은 매트릭스 서라운드 방법으로서 대개 특징될 수 있다. 이 방법의 통상의 원리는 인코더가 스테레오 다운 믹싱 신호를 형성하기 위해 전 채널과 중앙 채널을 함께 믹싱하기 전에 서라운드 채널로 위상 시프트를 적용하는 멀티 채널 또는 스테레오 다운 믹싱의 전용 방법을 사용하는 것이다. 다운 믹싱 신호(Lt, Rt)의 발생은 이하 방정식에 나타난다:

레프트 다운 믹싱 신호(Lt)는 레프트 프런트 신호(Lf), 계수(q)가 곱해진 중앙 신호(C), 90도(j') 회전되고 계수(a)에 비례하는 위상인 레프트 서라운드 신호(Ls), 90도 회전되고 계수(b)에 비례하는 위상인 라이트 서라운드 신호(Rs)로 구성된다. 라이트 다운 믹싱 신호(Rt)가 마찬가지로 발생된다. 통상 다운 믹싱 계수는 q 및 a가 0.707이고, b가 0.408이다. 라이트 다운 믹싱 신호(Rt) 및 레프트 다운 믹싱 신호(Lt)에 대한 서라운드 채널의 다른 부호에 대한 근본적인 이유는 그것이 다운 믹싱 쌍(Lt, Rt)에서 역위상으로 서라운드 채널을 믹싱하는 것이 편리하기 때문이다. 이 특성은 디코더가 다운 믹싱 신호 쌍으로부터 앞뒤 사이에서 식별하는 것을 돕는다. 그러므로, 다운 믹싱 매트릭스는 디매트릭싱 동작을 적용함으로써 디코더 내의 스테레오 다운 믹싱으로부터 멀티 채널 출력 신호의 부분 복원을 하도록 한다. 재생산된 멀티 채널 신호가 원래의 인코더 입력 신호와 유사하지만 멀티 채널 오디오 컨텐츠의 구체적인 특성에 의존한다.

헬퍼(helper) 정보 또는 사이드 정보를 추가하는 코딩 방법의 예는 MPEG 서라운드 오디오 코딩이다. 파라메트릭 멀티 채널 오디오 코딩의 효과적인 방법은 예컨대, Herre, J., Purnhagen, H., Breebaart, J., Faller, C., Disch, S., Kjoerling, K., Schuijers, E., Hilpert, J., Myburg, F., Proc.의 "The Reference Model Architecture for MPEG Spatial Audio Coding" 및 ISO/IEC JTC1/SC29/WG11(MPEG), Document N7136, Busan, Korea, 2005의 "Text of Working Draft for Spatial Audio Coding(SAC)"에 기재되어 있다.

공간 오디오 코딩에 사용된 인코더의 개략적 개요는 도 6에 도시된다. 인코더는 쿼드러쳐 미러 필터(12)[QMF, Quadrature Mirror Filters]로서 분리된 시간-주파수 타일에 들어오는 신호(10)[입력1, … 입력N]를 분리한다. 결과 주파수 타일(대역) 그룹은 "파라미터 대역"로 칭한다. 모든 파라미터 대역에 대해, 많은 공간 파라미터(14)는 공간 화상의 특성, 예컨대, 여러 쌍의 채널 사이에 레벨차(CLD), 여러 쌍의 채널 사이의 상호 상관(ICC), 또는 신호 인벨럽(envelop)에 대한 정보(CPC)를 설명하는 파라미터 측정기(16)에 의해 결정된다. 이 파라미터는 공통으로 공간 데이터의 비트 스트림으로 연속적으로 양자화되며, 인코딩되고 수집된 다. 동작 모드에 의존하여, 이 비트 스트림은 양질의 멀티 채널 오디오에 대한 약간의 kBit/s로부터 근접 투명질에 대한 10분의 kBit/s까지의 넓은 비트율 범위를 커버할 수 있다.

파라미터의 추출 외에, 인코더는 멀티 채널 입력 신호로부터 모노 또는 스테레오 다운 믹싱을 발생한다. 또한, 스테레오 다운 믹싱의 경우에, 사용자는 종래(ITU-style) 스테레오 다운 믹싱을 선택하거나 매트릭스 서라운드 시스템과 호환가능한 다운 믹싱을 선택한다. 결국, 스테레오 다운 믹싱은 QMF 시스템 설계 뱅크(18)로서 타임 도메인으로 전송된다. 결과 다운 믹싱은 공간 파라미터 또는 공간 파라미터 비트 스트림(14)을 동반한 디코더로 전송될 수 있다. 바람직하게, 다운 믹싱은 전송(종래 모노 또는 스테레오 코어 코더를 사용한) 전에 인코딩되며, 코어 코더의 비트 스트림 및 공간 파라미터가 추가적으로 결합되어(곱해져서) 신호 출력 비트 스트림을 형성한다.

원칙적으로, 도 7에 도시된 바와 같이, 디코더는 인코더의 역처리를 행한다. 입력 스트림은 코어 코더 비트 스트림 및 파라미터 비트 스트림으로 분리된다. 이는 도 7에 도시되지 않는다. 결과적으로, 디코딩된 다운 믹싱(20)은 인코더에 적용된 바와 마찬가지인 파라미터 대역을 얻도록 QMF 분석 뱅크(22)에 의해 처리된다. 공간 시스템 설계 단계(24)는 제어 데이터(26)[즉, 전송된 공간 파라미터]로서 멀티 채널 신호를 복원한다. 결국, QMF 도메인 신호는 최종 멀티 채널 출력 신호(28)를 수신하는 QMF 시스템 설계 뱅크(27)로서 시간 도메인으로 전송된다.

도 8은 도 6의 이전 기술 인코더와 도 7의 이전 기술 디코더 내에 행해진 바 와 같은 QMF 분석의 간단한 예를 도시한다. 시간 도메인으로 샘플링되고 4개의 샘플 값을 갖는 오디오 샘플(30)은 필터 뱅크(32)로 입력된다. 필터 뱅크(32)는 4개의 샘플 값을 각각 갖는 3개의 출력 샘플(34a, 34b, 34c)을 얻는다. 이상적인 경우, 필터 뱅크(32)는 출력 샘플(34a 내지 34c)을 얻어서 출력 신호 내의 샘플이 근원적인 오디오 신호(30)의 이산적인 주파수 범위의 정보만을 포함한다. 도 8에 도시된 경우에서, 샘플(34a)은 f0 내지 f1의 주파수 간격 범위의 정보를 가지며, 샘플(34b)은 주파수 간격[f1, f2]의 정보를 갖고, 샘플(34c)은 주파수 간격[f2, f3]의 정보를 갖는다. 도 8에서 주파수 간격이 오버랩되지 않더라도, 더 일반적인 경우에, 필터 뱅크로부터 출력된 출력 샘플의 주파수 간격은 주파수 오버랩되는 것은 당연하다.

이전 기술 인코더는 이미 상술된 바와 같이, ITU-style 다운 믹싱 또는 매트릭스 서라운드 호환 다운 믹싱 중 하나를 2-채널 다운 믹싱이 소망될 때 전송한다. 매트릭스 서라운드 호환 다운 믹싱(예컨대, 방정식1에 주어진 매트릭싱 접근을 사용한)의 경우에, 인코더가 매트릭스 서라운드 호환 다운 믹싱을 직접 발생할 하나의 가능성이 있다.

도 9는 통상의 스테레오 다운 믹싱(32)에 작용하는 다운 믹싱 후처리 유닛(30)을 사용한 매트릭스 서라운드 호환 다운 믹싱을 발생시키는 대안적 접근을 도시한다. 매트릭스 서라운드 프로세서(30)[MTX 인코더]는 통상의 스테레오 다운 믹싱(32)이 파라미터 추출 단계(16)에 의해 추출된 공간 파라미터(14)에 의해 가이드된 매트릭스 서라운드를 호환가능하게 변경한다. 전송 동안, 매트릭스 서라운드 호환 다운 믹싱(34)은 QMF 시스템 설계 뱅크(18)를 사용한 QMF 시스템 설계에 의해 시간 도메인으로 전송된다.

통상의 스테레오 다운 믹싱을 후처리함으로써 매트릭스 서라운드 호환 신호를 수신하는 것은 매트릭스 서라운드 호환 처리가 공간 파라미터가 사용가능하면 디코더측에 완전히 리버스(reverse)될 수 있는 장점을 가진다.

2개의 접근이 멀티 채널 신호를 전송하기에 적합하더라도 기술 시스템의 상태의 구체적인 결점이 있다. 매트릭스 서라운드 방법은 아주 제한된 멀티 채널 복원 품질의 가격면에서 매우 효율적이다(추가적 파라미터가 요구되지 않으므로).

반면, 파라메트릭 멀티 채널 접근은 파라메트릭 표현용 최대 수용가능한 비트율로 제한이 설정될 때 문제가 되는 사이드 정보 때문에 높은 비트율을 필요로 한다. 인코딩된 파라미터가 상당히 많은 양의 비트율을 필요로 할 때 그러한 비트율 제한 내에 있을 수 있는 한가지 방법은 채널의 압축을 증가시킴으로써 인코딩된 다운 믹싱 채널의 질을 감소시키는 것이다. 그러므로, 높게 수용될 수 없는 오디오 품질의 통상적 손실을 기인한다. 다른 말로, 파라메트릭 멀티 채널 접근에 대해, 몇몇 경우에 높게 수용될 수 없는 공간 파라미터 층에 대해 필요되는 최소 비트율의 절대 제한이 종종 있다.

매트릭스 서라운드 방법과 공간 오디오 방법 사이에 원리 결점 호환이 도 9에 도시된 바와 같이, 이전 기술 인코더에 의해 달성될 수 있더라도 매트릭스에 의거한 디코딩만이 필요될 때 추가적 비트율은 이 접근으로 면하게 되지 않을 수 있다. 공간 파라미터의 풀 세트가 전송되어야만 하더라도 전송 대역 폭을 소모한다.

그러나, 파라메트릭 방법을 적용할 때 소모되는 비트율은 어떤 적용 개요의 경우, 아주 높을 수 있고, 사이드 정보의 전송이 없는 방법으로 행해진 오디오 품질은 불충분할 수 있다.

미국 특허 출원 제2005/157,883호는 입력 신호와 파라메트릭 사이드 정보를 사용한 멀티 채널 오디오 신호, 원래 멀티 채널 신호로부터 수신된 제 1 입력 채널과 제 2 입력 채널을 포함하는 입력 신호, 및 멀티 채널 원래 신호의 채널 사이에 코릴레이션을 설명하는 파라메트릭 사이드 정보를 구성하는 장치를 나타내고 있다.

본 발명의 목적은 매트릭스 기반 코딩 솔루션과 백워드 호환이능하며 멀티 채널 오디오 신호의 더 효과적인 코딩에 대한 개념을 제공하는 것이다.

본 발명의 제 1 실시예에 의하면, 상기 목적은 오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 멀티 채널 오디오 디코더로서, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 멀티 채널 오디오 디코더에 있어서: 상기 오디오 신호로부터 중간 신호를 유도하고, 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하고 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하고, 상기 중간 신호의 제 2 부분을 유도하고 파라메트릭 데이터를 사용하지 않거나 제 2 파라메트릭 데이터를 사용하는 제 2 유도 규칙을 사용하는 프로세서를 포함한다.

본 발명의 제 2 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 멀티 채널 인코더에 있어서, 공간 파라미터를 발생시키는 파라미터 제너레이터; 파라메트릭 표현을 발생시키는 출력 인터페이스를 포함하며, 상기 파라미터 제너레이터 또는 상기 출력 인터페이스는 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키고, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.

본 발명의 제 3 실시예에 의하면, 상기 목적은 오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법으로서, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 방법에 있어서, 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용한 다운 믹싱 신호로부터 중간 신호를 유도하는 단계; 및 제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함한다.

본 발명의 제 4 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법에 있어서, 공간 파라미터를 발생시키는 단계; 및 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 단계를 포함하며, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.

본 발명의 제 5 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현에 있어서, 상기 파라메트릭 표현은 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하며, 상기 파라메트릭 표현은 멀티 채널 신호의 제 2 부분의 파라메트릭 데이터가 포함되지 않거나 제 2 파라메트릭 데이터가 포함되고, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부의 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.

본 발명의 제 6 실시예에 의하면, 상기 목적은 컴퓨터를 실행할 때 오디오 신호를 처리하는 방법과 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법을 행하는 프로그램 코드를 갖는 컴퓨터 프로그램으로서, 상기 방법은, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 방법에 있어서, 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하는 다운 믹싱 신호로부터 중간 신호를 얻는 단계; 및 제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함한다.

본 발명의 제 7 실시예에 의하면, 상기 목적은 컴퓨터를 실행할 때 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램에 있어서, 상기 방법은, 공간 파라미터를 발생시키는 단계; 및 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 상기 파라메트릭 표현을 발생시키는 단계를 포함하며, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.

본 발명의 제 8 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 공간 파라미터를 사용하는 멀티 채널 오디오 신호의 파라메트릭 표현을 발생시키는 트랜스코더에 있어서, 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 공간 파라미터로부터 유도된 제 2 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 파라미터 제너레이터를 포함하며, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되고, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.

본 발명은 제 1 유도 규칙이 멀티 채널 신호의 제 1 부분을 나타내는 파라메트릭 표현의 제 1 파라메트릭 데이터를 얻기 위해 사용될 때와 멀티 채널 신호의 제 2 부분에 대해, 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되고 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않을 때 멀티 채널 오디오 신호가 파라메트릭 표현에 의해 효율적으로 표시될 수 있는 결과에 의거되지만, 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하고 있다.

그래서, 멀티 채널 신호의 제 1 부분은 멀티 채널 신호의 복원이 더 양질이 되게 하고 제 2 부분은 복원이 약간 낮은 품질이 되게 하는 제 2 파라미터에 의해 표시될 수 있다. 제 1 파라메트릭 데이터에 의해 소비된 비트율은 2개의 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 2 파라메트릭 데이터에 의해 소모된 비트율보다 결과적으로 더 크다. 다른 말로, 제 1 파라미터는 제 2 파라미터보다 신호부 당 더 큰 비트율을 필요로 한다.

본 발명의 목적은 업 믹싱 신호의 사운드를 점차적으로 향상시키고, 0 내지 파라메트릭 방법의 비트율까지의 사이드 정보에 의해 소모된 비트율을 증가시킴으로써 이전 기술 세계 사이의 갭을 브릿징하는 것이다. 즉, 본 발명의 목표는 완전히 파라메트릭 방법과 매트릭스 서라운드 방법 사이의 비트율과 인식된 품질에서의 갭을 브릿징하는 것에 있다. 더 구체적으로, 매트릭스 서라운드(사이드 정보 없는, 제한된 오디오 품질)와 완전히 파라메트릭 복원(완전한 사이드 정보율이 필요로 하고, 좋은 품질) 사이에서 "동작점"을 탄력적으로 선택하는 방법을 제공한다. 이 동작점은 동적으로(즉, 가변적으로), 그리고 개인 적용에 의해 지시된 바와 같이, 허용되는 사이드 정보율에 따라 선택될 수 있다.

공간 오디오 파라미터에 의해 표시되는 멀티 채널 오디오 신호의 일부인 멀티 채널 오디오 신호의 제 1 부분의 크기를 동적으로 선택함으로써, 요구되는 비트율은 넓은 범위 내에 가변될 수 있다. 공간 오디오 파라미터에 의해 멀티 채널 신호의 주요부를 나타내는 것은 인식된 양질의 이득에 비교적 큰 비트율을 소모할 것이다. 멀티 채널 오디오 신호의 제 2 부분에 대해, 적은 비트율을 소모하는 파라미터를 기인하도록 파라미터 유도 규칙이 선택되므로 결과된 전체 비트율은 멀티 채널 신호의 제 2 부분의 크기를 증가시킴으로써 감소될 수 있다. 본 발명의 바람직한 실시예에서, 파라메트릭 데이터는 당연히 가장 비트 절약하는 멀티 채널 신호의 제 2 부분을 위해 전혀 전송되지 않는다. 그러므로, 제 2 부분의 크기에 대해 제 1 부분의 크기를 동적으로 이동함으로써, 비트율(또는, 인식된 품질)은 필요에 동적으로 조정될 수 있다.

본 발명의 바람직한 실시예에서, 다운 믹싱 신호는 매트릭스 호환 방식으로 수신된다. 그러므로, 멀티 채널 오디오 신호의 제 1 부분은 공간 오디오 파라미터르 사용하는 고인식된 품질로 재생되고, 멀티 채널 신호의 제 2 부분은 매트릭스에 의거한 솔루션을 사용하여 재생될 수 있다. 이는 고품질을 필요로 하는 신호의 일부의 고품질 재생되게 한다. 동시에, 전체 비트율은 재생된 신호의 품질보다 덜 생생한 신호 부분의 매트릭스에 의거한 재생에 의존함으로써 감소된다.

본 발명의 다른 바람직한 실시예에서, 본 발명의 개념은 수신된 다운 믹싱 신호의 QMF 표시 내의 디코더측에 적용된다. 업 믹싱 프로세스는 원칙적으로 3개의 단계:

프리 디코릴레이터(pre-de-correlator) 매트릭스의 적용에 의해 입력 신호(QMF 도메인에 수신된 다운 믹싱 신호)를 미리 처리하는 단계;

미리 처리된 신호의 일부를 디코릴레이팅하는 단계; 및

믹스 매트릭스 내에 수신된 신호(미리 처리된 신호 및 디코릴레이팅된 신호)를 믹싱하고, 믹싱의 출력은 업 믹싱 신호의 채널이 되는 단계로 하위 분류될 수 있다.

프리 디코릴레이터뿐만 아니라 믹싱된 매트릭스는 차수, 한편으로 "시간 슬롯의 수"이고 다른 한편으로 "파라미터 대역"의 수로 2차 매트릭스이다. 디코딩 처리에서, 이 매트릭스의 요소는 고간 비트 스트림으로부터 판독된 파라미터로부터 얻어진 값, 즉 제 1 파라메트릭 데이터로 채워진다. 제 1 파라메트릭 데이터가 멀티 채널 신호의 제 1 부분에 대해서만 수신될 때 멀티 채널 신호의 복원의 부분은 종속된 제 1 파라메트릭 데이터를 사용하여 수신될 수 있다. 멀티 채널 신호의 복수의 제 2 부분을 유도하는 매트릭스 요소는 본 발명에 따라, 매트릭스 호환 코딩 설계를 사용하여 유도된다. 그러므로, 이 매트릭스 요소는 다운 믹싱 신호로부터 성취된 지식에만 의거하여 유도되거나 미리 규정된 값으로 대체될 수 있다.

바람직한 실시예에서, 본 발명에 따른 멀티 채널 오디오 디코더는 매트릭스의 일부 또는 멀티 채널 오디오 신호의 일부가 공간 파라미터에 의거한 규칙에 의해 처리되고, 일부가 매트릭스에 의거한 솔루션에 의해 처리되는 전송된 제 1 파라메트릭 데이터의 양에 의해 인식된다.

본 발명의 다른 실시예에서, 오디오 인코더는 멀티 채널 신호의 일부가 매트릭스에 의거한 솔루션 또는 공간 오디오 호환 접근에 의해 처리되고 있는 것을 나타내는 윈도우 정보를 발생시킨다. 윈도우 정보는 멀티 채널 신호의 파라메트릭 표현에 포함된다.

그러므로, 본 발명의 디코더는 윈도우 정보에 의해 나타낸 멀티 채널 오디오 신호의 부분에 적절한 업 믹싱 규칙을 적용하도록 발생된 윈도우 정보를 수신하여 처리할 수 있다.

본 발명의 바람직한 실시예에서, 본 발명의 개념은 신호 처리 동안 QMF 도메인, 즉, 신호가 어느 주파수 대역에 대한 각 표시 홀딩 정보를 다수의 표시에 의해 나타내는 도메인에 적용된다.

본 발명의 다른 바람직한 실시예에서, 사이드 정보 프리 방법(매트릭스에 의거한 접근)은 저주파수부의 적절한 재생을 위한 파라메트릭 정보(즉, 제 1 인코딩 및 디코딩 규칙)를 적용하며(명시적인), 고주파수부에만 적용된다. 이는 고주파수 에 대해서보다 저주파수에 대해서 훨씬 더 용이한 2개의 유사한 신호의 작은 편차(예컨대, 위상 편차)를 고지하는 것을 듣는 인간의 특성 때문에 이득이다.

본 발명의 큰 이득은 매트릭스에 의거한 솔루션으로 공간 오디오 인코딩과 디코딩 설계의 백워드 호환성이 공간 오디오 코더의 인코딩과 디코딩이 적절하게 선택될 때 추가적 하드웨어 또는 소프트웨어를 도입하지 않고 달성되는 것에 있다.

또한, 호환성은 다른 이전 기술 시도의 경우와 같이, 추가적 데이터를 전송하지 않고 달성된다. 본 발명에 따른 코딩 설계는 비트율 또는 품질의 고른 조정 즉, 주어진 신호의 완전한 매트릭스에 의거한 코딩과 완전한 공간 오디오 코딩 사이에 부드러운 변환을 하도록 하는 바와 같이, 매우 탄력적이다. 즉, 적용된 코딩 설계는 필요로 하는 비트율에 대하여 또는 원하는 품질에 대하여 실제의 필요로 조정될 수 있다.

본 발명의 바람직한 실시예는 동봉한 도면을 참조하여 이어서 설명된다.

도 1은 본 발명의 인코더를 도시한다.

도 2는 본 발명의 개념에 의해 생성된 파라미터 비트 스트림의 예를 도시하며, 도 2a는 본 발명의 트랜스코더를 도시한다.

도 3은 본 발명의 디코더를 도시한다.

도 4는 본 발명의 개념을 이행하는 공간 오디오 디코더의 예를 도시한다.

도 5는 디코더측에 다른 코딩 설계의 사용을 도시한다.

도 6은 이전 기술 인코더를 도시한다.

도 7은 이전 기술 디코더를 도시한다.

도 8은 필터 뱅크의 블록도를 도시한다.

도 9는 이전 기술 인코더의 다른 예를 도시한다.

도 1은 본 발명의 멀티 채널 인코더를 도시한다. 멀티 채널 인코더(100)는 파라미터 제너레이터(102) 및 출력 인터페이스(104)를 갖고 있다.

멀티 채널 오디오 신호(106)는 멀티 채널 신호(106)의 제 1 부분(108) 및 제 2 부분(110)이 처리되는 인코더(100)에 입력된다. 파라미터 제너레이터(102)는 제 1 부분(108) 및 제 2 부분(110)을 수신하고 멀티 채널 신호(106)의 공간 특성을 나타내는 공간 파라미터를 유도한다.

공간 파라미터는 멀티 채널 신호(106)의 파라메트릭 표현(112)를 얻는 출력 인터페이스(104)에 전송되어서 파라메트릭 표현(112)가 멀티 채널 신호의 제 1 부분(108)의 제 1 파라메트릭 데이터를 포함하며, 멀티 채널 신호(106)의 제 2 부분(110)에 대해 제 2 파라메트릭 데이터는 제 1 파라메트릭 데이터보다 더 적은 정보를 필요로 하고 또는 파라메트릭 데이터는 파라메트릭 표현(112)에 포함되지 않는다.

멀티 채널 인코더(100)의 몇 개의 변경은 동일한 목표를 달성할 수 있다. 예컨대, 파라미터 제너레이터(102)는 파라메트릭 표현(112)에 다른 파라미터 세트를 결합하는 출력 인터페이스(104)에 전송된 다른 파라미터 세트를 기인한 제 1 부분(108) 및 제 2 부분(110)에 2개의 다른 파라미터 유도 규칙을 적용할 수 있다. 특별하고 바람직한 경우는 디코더측에 디코더가 몇 개의 발견적 규칙에 의해 필요로 하는 디코딩 파라미터를 얻기 때문에, 제 2 부분(110)에 대해 파라미터가 파라 메트릭 표현에 포함되지 않는다[그러므로, 파라미터 제너레이터(102)에 의해 얻어지지 않는다]는 것이다.

다른 가능성은 파라미터 제너레이터(102)가 제 2 부분(110)에 대해서와 같이 제 1 부분(108)에 대해서도 공간 오디오 파라미터의 풀 세트를 얻는다는 것이다. 그러므로, 출력 인터페이스(104)는 제 2 파라메트릭 데이터는 제 1 파라메트릭 데이터보다 더 적은 비트를 필요로 하도록 공간 파라미터를 처리해야만 할 것이다.

또한, 출력 인터페이스(104)는 멀티 채널 신호(106)가 인코딩 동안 제 1 부분(108) 및 제 2 부분(110)으로 분리되는 방법을 디코더로 전송할 파라메트릭 표현(112)에 추가적 윈도우 신호를 추가할 수 있다. 멀티 채널 인코더(100)의 바람직한 실시예의 변경에서, 멀티 채널 인코더(100)는 결정하는 부분 결정기를 추가적으로 가질 수 있으며, 이는 멀티 채널 신호(106)의 일부가 제 1 부분(108)으로서 사용되고 일부가 제 2 부분(110)으로서 사용되며, 결정은 품질 기준에 의거한다.

품질 기준은 파라메트릭 표현(112)에 의거한 멀티 채널 신호(106)의 재생의 인식된 품질을 고려하여 파라메트릭 표현(112)의 결과된 전체 비트율에 대하여 또는 품질 양상에 대하여 얻어질 수 있다.

주요 장점은 품질 기준이 인코딩 동안 어느 때에 겸비되고 필요로 하는 비트율의 전체 재생이 이전 기술 방법과 비교되도록 하여, 파라메트릭 표현에 의해 소모된 비트율이 시간에 있어서 가변될 수 있다는 것이다.

도 2는 본 발명의 인코더에 의해 발생된 파라메트릭 표현(112)의 예를 도시한다.

상술한 바와 같이, 오디오 신호의 처리는 블록 방법으로 행해지며, 즉, 소위 프레임을 제작하는 시간 도메인에서 멀티 채널 신호의 많은 연속적인 샘플이 1단계에서 처리된다. 도 2는 파라미터 비트 스트림, 즉 2개의 연속적인 프레임에 대한 파라메트릭 표현을 도시한다. 파라미터 비트 스트림은 고품질 프레임(120)의 표시 및 저품질 프레임(122)의 표시를 갖고 있다. 고품질 프레임(120)의 인코딩 동안, 파라메트릭 데이터에 의해 나타내고 있는 제 1 부분(108)이 예컨대, 인코딩할 오디오 신(scene)이 다소 복잡할 수 있는 제 2 부분과 비교하여 큰 것이 결정된다. 또한, 도 2의 파라미터 비트 스트림은 멀티 채널 신호(106)의 제 2 부분(110)의 어느 파라메트릭 데이터를 얻지 않는 본 발명의 인코더의 바람직한 실시예가 사용된다는 가정 하에 발생된다. 도 2에 도시될 수 있는 바와 같이, 28개의 공간 파라미터(ICC 및 ICLD)는 고품질 프레임(120)을 설명하기 위해 파라메트릭 표현에 포함된다. 예컨대, 28개의 공간 파라미터는 멀티 채널 신호의 QMF 표시의 저주파수 대역을 설명한다.

저품질 프레임(122)은 원하는 인식된 품질에 충분함에 따라 ICC 및 ICLD를 갖는 21개의 공간 파라미터 세트만을 포함한다.

도 2a는 본 발명의 트랜스코더(150)를 도시한다. 본 발명의 트랜스코더는 멀티 채널 오디오 신호의 제 1 프레임(154) 및 제 2 프레임(156)을 나타내는 공간 파라미터의 풀 세트를 갖는 입력 비트 스트림(152)을 입력으로서 수신한다.

트랜스코더(150)는 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 유지하는 비트 스트림(158)을 발생한다. 도 2a에 도시된 예에서, 트랜스 코더(150)는 제 1 프레임에 대해, 파라미터(160)의 수가 약간 감소되도록 파라메트릭 표현을 얻는다. 입력 파라미터(156)에 대응하는 제 2 프레임을 설명하는 파라미터(162)의 수는 매우 감소되어, 결과된 파라메트릭 표현에 의해 필요한 비트율의 양을 상당히 감소시킨다. 그러므로, 그러한 본 발명의 트랜스코더(150)는 이미 존재하는 공간 파라미터의 비트 스트림이 전송 동안의 적은 비트율 또한 컴퓨터 판독가능한 매체에 저장될 때 적은 저장 공간을 필요로 하는 본 발명의 파라메트릭 표현을 얻도록 후처리하는데 사용될 수 있다. 다른 방향으로 트랜스코딩하며, 즉 공간 파라미터를 발생하기 위해 파라메트릭 표현을 사용하는 트랜스코더를 이행할 수 있다.

본 발명의 트랜스코더(150)는 예컨대, 주어진 규칙으로 파라미터의 양을 감소시키고 또는 수용가능한 제한을 넘어 인식된 품질을 교란시키지 않고 가능한 비트율의 감소를 분석할 멀티 채널 오디오 신호를 추가적으로 수신함으로써 각종 다른 방법으로 이행될 수 있다.

도 3은 프로세서(202)를 갖는 본 발명의 멀티 채널 오디오 디코더(200)를 도시한다.

프로세서는 멀티 채널 오디오 신호로부터 유도된 다운 믹싱 신호(204)를 입력 신호로서 수신하고 있으며, 제 1 파라메트릭 데이터(206)는 멀티 채널 신호의 제 1 부분을 나타내고 있고, 멀티 채널 신호의 제 2 부분에 대해, 임의의 제 2 파라메트릭 데이터(208)는 제 1 파라메트릭 데이터(206)보다 더 적은 비트를 필요로 한다. 프로세서(202)는 중간 신호의 고품질 부분(212)을 유도하는 제 1 유도 규칙 을 사용하는 다운 믹싱 신호(204)로부터 중간 신호(210)를 유도하고 있으며, 중간 신호(212)의 고품질 부분(212)은 멀티 채널 오디오 신호의 제 1 부분에 대응하고 있다. 프로세서(202)는 중간 신호(210)의 제 2 부분(214)의 제 2 유도 규칙을 사용하고 있으며, 제 2 유도 규칙은 제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않고, 제 1 유도 규칙은 제 1 파라메트릭 데이터(206)에 의거한다.

프로세서(202)에 의해 수신된 중간 신호(210)는 고품질 부분(212)과 제 2 부분(214)의 조합으로 구성된다.

멀티 채널 오디오 디코더(200)는 저절로 수신할 수 있으며, 다운 믹싱 신호(204)의 부분은 예컨대, 제 1 파라메트릭 데이터(206)에 포함된 공간 파라미터의 수를 산출하는 어떤 적절한 규칙을 적용함으로써 제 1 파라메트릭 데이터(206)와 함께 처리된다. 대안으로, 프로세서(202)는 인코더측에 수신되고 멀티 채널 오디오 디코더(200)로 추가적으로 전송된 몇개의 추가적 윈도우 정보에 의해 다운 믹싱 신호(204) 내의 조금의 고품질 부분(212)과 제 2 부분(214)을 전송할 수 있다.

바람직한 실시예에서, 제 2 파라메트릭 데이터(208)는 생략되고 프로세서(202)는 다운 믹싱 신호(204)에 이미 포함된 정보로부터 제 2 유도 규칙을 유도한다.

도 4는 공간 오디오 디코더에 본 발명의 매트릭스 호환성 특징을 결합한 본 발명의 다른 실시예를 도시한다. 멀티 채널 오디오 디코더(600)는 프리 디코릴레이터(601), 상관기(602), 및 믹스 매트릭스(603)를 포함한다.

멀티 채널 오디오 디코더(600)는 프리 디코릴레이터(601)로 입력된 입력 신호(605)의 구성에 의거한 다른 방식으로 동작하도록 하는 탄력성 있는 장치이다. 통상, 프리 디코릴레이터(601)는 디코릴레이터(602)에 대한 입력으로서 역할을 하고 디코릴레이터(602)에 의해 산출된 역상관 신호와 함께 입력 신호(608)를 형성하기 위해 변경되지 않으며 부분적으로 전송되는 중간 신호(607)를 수신한다.

1 내지 5 구성에서, 다운 믹싱 신호와 임의의 잔여 신호는 디코릴레이터의 입력으로서 사용되는 4개의 중간 신호(e1 내지 e4)를 유도하는 프리 디코릴레이터(601)에 제공되고, 상기 디코릴레이터는 입력 신호로부터 수신된 직접 전송된 신호(m)와 함께 입력 파라미터(608)를 형성하는 4개의 역상관 신호(d1 내지 d4)를 유도한다.

추가적 잔여 신호가 입력으로서 제공되는 경우, 하위 대역 도메인에서 통상 작용하는 디코릴레이터(602)는 역상관 신호를 유도하는 대신 잔여 신호를 간단히 전송하는데 효과적일 수 있다. 또한, 이는 어느 주파수 대역만에 대한 주파수 선택 방법으로 행해질 수 있다.

2 내지 5 구성에서, 입력 신호(605)는 레프트 채널, 라이트 채널, 및 임의의 잔여 신호를 포함한다. 그 구성에서, 프리 디코릴레이터 매트릭스(601)는 레프트, 라이트, 중앙 채널, 및 추가적으로, 2개의 매개 채널(e1, e2)을 수신한다. 그러므로, 믹스 매트릭스(603)로 입력된 신호는 레프트 채널, 라이트 채널, 중앙 채널, 및 2개의 역상관 신호(d1 내지 d2)로 형성된다.

다른 변경에서, 프리 디코릴레이터 매트릭스는 출력이 신호(e5)로부터 수신 된 역상관 신호(d5)와 역상관 신호(d1 내지 d2)의 조합인 디코릴레이터(D5)에 대한 입력으로서 사용되는 추가적 중간 신호(e5)를 유도할 수 있다. 이 경우에, 추가적 역상관은 중앙 채널과 왼쪽 및 오른쪽 채널 사이에 보장될 수 있다.

본 발명의 오디오 디코더(600)는 2 내지 5 구성에서 본 발명의 개념을 이행한다. 전송된 파라메트릭 표현은 이전 역상관 매트릭스(601) 및 믹스 매트릭스(603)에서 사용된다. 본 발명의 개념은 도 5에서 더 상세하게 도시된 바와 같이, 다른 방법으로 이행될 수 있다.

도 5는 원리 스케치에서, 프리 디코릴레이터 매트릭스(601) 및 믹스 매트릭스(603)로서 이행된 프리 디코릴레이터를 도시하고, 멀티 채널 오디오 디코더(600)의 다른 컴포넌트는 생략된다.

이전 역상관과 믹싱을 행하는데 사용된 매트릭스는 시간 슬롯, 즉, 신호의 각 시간 샘플을 나타내는 열과 다른 파라미터 대역, 즉, 오디오 신호의 1개의 파라미터 대역과 관련된 행을 가진다.

본 발명의 개념에 의하면, 매트릭스(601 및 603)의 매트릭스 구성 요소는 전송된 파라메트릭 데이터로부터 부분적으로만 유도되며, 잔여 매트릭스 구성 요소는 예컨대, 다운 믹싱 신호의 지식에 의거한 디코더에 의해 유도된다. 도 5는 주어진 주파수 경계선(622) 이하에서는 프리 디코릴레이터 매트릭스(601) 및 믹스 매트릭스(603)의 구성 요소가 비트 스트림으로부터 판독되는, 즉, 인코더로부터 전송된 정보에 의거하는 파라미터(620)로부터 유도된다. 주파수 경계선(622) 이상에서는 매트릭스 구성 요소는 다운 믹싱 신호만의 지식에 의거한 디코더에 유도된다.

경계 주파수(또는, 통상: 전송된 데이터로부터 유도된 매트릭스 구성 요소의 양)는 특별 적용 시나리오에 적용되는 품질 및/또는 비트율 제한에 따라 자유롭게 적합하게 될 수 있다.

사이드 정보 프리 업 믹싱 처리가 MPEG 공간 오디오 코딩 기준 모델(0)에 아웃라인된 동일한 구조로 행해질 수 있는 새로운 코딩 방법이 여기에 아웃라인되는 것이 바람직하다. 본 발명은 사이드 정보 프리 업 믹싱에 대한 방법을 설명하는 것으로 구성되지만, 바람직하게, 사이드 정보 보조 업 믹싱에 대한 방법과 함께 그러한 개념의 고르고 이익이 되는 결합에 대한 방법을 제공한다.

MPEG 공간 오디오 코딩 기준 모델(0)과 반대로, 사이드 정보 프리 업 믹싱 처리에서, 매트릭스[M1(601) 및 M2(603)]의 구성요소는 비트 스트림에 전송된 데이터로부터 바람직하게 수신되지 않고, 사이드 정보의 도움없이 다른 방법에 의해, 예컨대, 다운 믹싱 신호로부터 성취된 지식에만 의거한 발견적 규칙을 적용함으로써 수신된다.

이 방법으로, 전송된 파라미터에 의거한 매트릭스의 일부만을 얻고 잔여부를 채우는 사이드 정보 없이 방법의 규칙을 적용함으로써 2개의 기술 - 비트율에 의하여뿐만 아니라 음질 - 사이의 점차적 스케일링을 달성하는 것이 가능하다. 개념적으로 말하면, 이는 디코더에서 공간 파라미터를 발생시키는 매트릭스의 어느 부분에 대해서와 공간 파라미터를 발생시키는 다른 부분에 대해 전송하는 것에 대응한다.

하나 또는 다른 방법으로부터 수신된 매트릭스의 일부의 결정은 이하:

· 하나의 방법에 의해 주어진 수평 경계선 이하에서와 다른 방법에 의해 이 경계선 이상에서 매트릭스의 일부를 유도하는 방법;

· 하나의 방법에 의해 주어진 수직 경계선의 왼쪽과 다른 방법에 의해서 이 경계선의 오른쪽의 매트릭스의 일부를 유도하는 방법;

· 하나의 방법에 의해 수신된 구성 요소를 양쪽 매트릭스 내의 임의의 시간-주파수 타일을 임의로 결정하고 다른 방법으로 잔여 시간-주파수의 구성 요소를 유도하는 방법과 같은 많은 다른 방법으로 행해질 수 있다

공간 파라미터에 의해 어느 경계 주파수까지 멀티 채널 신호의 모든 주파수 부분을 설명하는 것이 이득이지만, 멀티 채널 신호의 잔여 주파수 부분이 공간 파라미터에 의해 나타나지 않음을 상기 문단에 설명되었다. 고주파수의 인식보다 저주파수의 인식이 좋은 사람의 귀의 특성을 고려하고 있다. 물론, 본 발명은 더 정확하게 신호의 고주파수 부분을 설명하는 것이 이득이거나 적절할 수 있는 바와 같이, 제 1 부분과 제 2 부분으로 멀티 채널 신호의 분리에 결코 제한되지 않는다. 이는 구체적으로 대부분의 에너지가 오디오 신호의 고주파수 도메인에 포함되므로 저주파수 영역에서 적은 에너지만 신호에 포함되는 경우일 수 있다. 마스킹 효과로 인하여, 저주파수부는 고주파수에 의해 거의 지배되고 신호의 고주파수부의 고품질 복원에 대한 가능성을 제공하는데 유리할 수 있다.

본 발명의 방법의 어느 이행 필요에 의거하여, 본 발명의 방법은 하드웨어 또는 소프트웨어로 이행될 수 있다. 본 발명의 방법이 행해지도록 프로그래머블 컴퓨터 시스템과 협력하는 디지털 저장 매체, 특히 저장된 전자적으로 판독가능한 제 어 신호를 갖는 디스크, DVD, 또는 CD를 사용하여 이행이 행해질 수 있다. 통상, 그러므로, 본 발명은 머신 판독가능 캐리어에 저장된 프로그램 코드의 컴퓨터 프로그램 제품이며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때 본 발명의 방법을 행하는데 효과적이다. 다른 말로, 그러므로, 본 발명의 방법은 컴퓨터 프로그램이 컴퓨터에서 실행될 때 본 발명의 방법 중 하나 이상을 행하는 프로그램 코드를 갖는 컴퓨터 프로그램이다.

상술한 것이 상세한 실시예를 참조하여 특히 도시되고 설명되었을 지라도, 당업자는 형상과 세부 사항의 각종 다른 변경이 본 발명의 정신과 범위를 벗어나지 않고 이루어질 수 있다는 것을 이해할 것이다. 각종 변경이 본원에 기재되고 이하 청구항에 의해 포함된 넓은 개념을 벗어나지 않고 다른 실시예에 개조될 수 있다는 것이 이해되어야 한다.

Claims

오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 멀티 채널 오디오 디코더로서, 상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 상기 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 멀티 채널 오디오 디코더에 있어서:

상기 오디오 신호로부터 중간 신호를 유도하고,

상기 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하고 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하고,

상기 중간 신호의 제 2 부분을 유도하고 파라메트릭 데이터를 사용하지 않거나 제 2 파라메트릭 데이터를 사용하는 제 2 유도 규칙을 사용하는 프로세서를 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

상기 멀티 채널 신호의 시간부 또는 주파수부를 나타내고 있는 제 1 파라메트릭 데이터를 처리하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

상기 멀티 채널 오디오 신호의 시간부의 설명을 포함하고 있는 제 1 파라메트릭 데이터를 처리하기 위해 동작되고, 상기 멀티 채널 오디오 신호의 소정 주파수 대역에 대한 정보만이 상기 설명 내에 포함되어 있는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

상기 프로세서는 저주파수 제한으로부터 고주파수 제한까지를 범위로 하는 상기 중간 신호의 주파수부를 유도하기 위한 제 1 유도 규칙을 사용하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 4 항에 있어서,

적어도 고주파수 제한을 시그널링하는 윈도우 정보를 추가적으로 처리하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 4 항에 있어서,

윈도우 평가 규칙을 사용하는 제 1 파라메트릭 데이터로부터 적어도 고주파수 제한을 유도하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 6 항에 있어서,

상기 윈도우 평가 규칙은 다운 믹싱 신호의 신호부에 종속된 파라메트릭 데이터의 양을 카운팅하는 것 및 카운팅된 양의 파라메트릭 데이터를 아주 적은 양의 파라메트릭 데이터와 비교하는 것을 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

상기 프로세서는 다운 믹싱 신호에 대한 정보 또는 상기 파라메트릭 데이터로부터 제 2 유도 규칙을 산출하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

상기 프로세서는 상기 제 2 유도 규칙으로서 미리 규정된 규칙을 사용하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

공간 오디오 파라미터의 이하 리스트:

ICC(인터 채널 코릴레이션)

CLD(채널 레벨 차이)

CPC(채널 예측 계수)

로부터 선택된 1개 이상의 공간 오디오 파라미터를 포함하고 있는 파라메트 릭 데이터를 처리하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

디코릴레이션 필터를 사용하는 상기 중간 신호로부터 디코릴레이팅된 신호를 유도하기 위해 디코릴레이터를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
제 1 항에 있어서,

상기 멀티 채널 신호의 복원을 산출하고,

상기 멀티 채널 신호의 제 1 부분에 대응하는 멀티 채널 신호의 복원의 제 1 부분을 산출하고 상기 제 1 파라메트릭 데이터에 의거하고 있는 제 1 업 믹싱 규칙을 사용하며,

상기 멀티 채널 신호의 복원의 제 2 부분을 산출하고 파라메트릭 데이터를 사용하지 않거나 제 2 파라메트릭 데이터를 사용하는 제 2 업 믹싱 규칙을 사용하는 업믹서를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 멀티 채널 인코더에 있어서:

공간 파라미터를 발생시키는 파라미터 제너레이터; 및

상기 파라메트릭 표현을 발생시키는 출력 인터페이스를 포함하며;

상기 파라미터 제너레이터 또는 상기 출력 인터페이스는 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키고;

상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 멀티 채널 인코더.
제 13 항에 있어서,

상기 출력 인터페이스는 상기 파라메트릭 표현에서 멀티 채널 오디오 신호의 제 1 부분을 나타내는 윈도우 정보를 더 포함하도록 된 것을 특징으로 하는 멀티 채널 인코더.
제 13 항에 있어서,

상기 멀티 채널 신호의 부분이 품질 기준을 이용하여 제 1 부분으로 사용되는 것을 결정하는 부분 결정기를 더 포함하는 것을 특징으로 하는 멀티 채널 인코더.
제 15 항에 있어서,

상기 부분 결정기는 파라메트릭 표현을 사용하는 멀티 채널 신호의 복원 품질이 품질 허용 범위 내에 있는 것을 결정하기 위해 동작되는 것을 특징으로 하는 멀티 채널 인코더.
제 15 항에 있어서,

상기 부분 결정기는 파라메트릭 표현에 의해 소모된 저장 공간의 최대량이 초과되지 않는 것을 결정하기 위해 동작되는 것을 특징으로 하는 멀티 채널 인코더.
제 13 항에 있어서,

상기 멀티 채널 신호로부터 다운 믹싱 신호를 유도하는 다운 믹서를 더 포함하며,

상기 출력 인터페이스는 다운 믹싱 신호를 더 출력하도록 된 것을 특징으로 하는 멀티 채널 인코더.
제 18 항에 있어서,

상기 파라미터 제너레이터는 멀티 채널 신호의 제 1 부분과 제 2 부분에 대한 풀 세트 공간 파라미터를 발생시키기 위해 동작되며,

상기 다운 믹서는 풀 세트 공간 파라미터에 의거하고 있는 풀 다운 믹싱 규 칙을 사용하는 다운 믹싱 신호를 유도하기 위해 동작되고,

상기 출력 인터페이스는 멀티 채널 신호의 제 1 부분에 대응하는 적어도 공간 파라미터를 사용하는 파라메트릭 표현을 발생시키기 위해 동작되는 것을 특징으로 하는 멀티 채널 인코더.
오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법으로서, 상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 오디오 신호 및 제 1 파라메트릭 데이터를 처리하는 방법에 있어서:

상기 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용한 다운 믹싱 신호로부터 중간 신호를 유도하는 단계; 및

제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 및 제 1 파라메트릭 데이터를 처리하는 방법.
멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법에 있어서:

공간 파라미터를 발생시키는 단계; 및

파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 단계를 포함하며:

상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 파라메트릭 표현을 발생시키는 방법.
멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현에 있어서:

상기 파라메트릭 표현은 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하며;

상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 포함되지 않거나 제 2 파라메트릭 데이터가 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부의 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 파라메트릭 표현.
제 23 항에 있어서,

컴퓨터 판독가능한 저장 매체에 저장되는 것을 특징으로 하는 파라메트릭 표현.
컴퓨터를 실행할 때 오디오 신호를 처리하는 방법과 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램으로서, 상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 프로그램 코드를 갖는 컴퓨터 프로그램에 있어서:

상기 방법은,

상기 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하는 다운 믹싱 신호로부터 중간 신호를 유도하는 단계; 및

제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함하는 것을 특징으로 하는 프로그램 코드를 갖는 컴퓨터 프로그램.
컴퓨터를 실행할 때 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램에 있어서:

상기 방법은,

상기 공간 파라미터를 발생시키는 단계; 및

상기 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 상기 파라메트릭 표현을 발생시키는 단계를 포함하며;

상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 프로그램 코드를 갖는 컴퓨터 프로그램.
멀티 채널 오디오 신호의 공간 특성을 나타내는 공간 파라미터를 사용하는 멀티 채널 오디오 신호의 파라메트릭 표현을 발생시키는 트랜스코더에 있어서:

상기 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 공간 파라미터로부터 유도된 제 2 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 파라미터 제너레이터를 포함하며;

상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되고, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 트랜스코더.