KR101666465B1

KR101666465B1 - 다채널 오디오 신호 부호화/복호화 장치 및 방법

Info

Publication number: KR101666465B1
Application number: KR1020100071040A
Authority: KR
Inventors: 김미영; 김중회; 성호상; 주기현; 오은미
Original assignee: 삼성전자주식회사
Priority date: 2010-07-22
Filing date: 2010-07-22
Publication date: 2016-10-17
Also published as: US9305556B2; EP2410518A1; KR20120009150A; US20160180855A1; US20120020482A1

Abstract

다채널 오디오 신호 부호화/복호화 장치가 개시된다. 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호의 채널을 그룹핑하고, 위상 정보를 포함하는 믹싱 매트릭스를 이용하여 채널간 중복 제거한 후 주파수 변환하여 부호화할 수 있다.

Description

다채널 오디오 신호 부호화/복호화 장치 및 방법{APPARATUS METHOD FOR ENCODING/DECODING MULTI-CHANNEL AUDIO SIGNAL}

본 발명은 다채널 오디오 신호를 압축 및 복원하는 방법에 관한 것이다.

최근 다채널 오디오 서비스가 발전하면서 10.2 채널, 22.2 채널 등 입력된 오디오 신호의 채널 수가 증가하는 추세에 있다. 채널 수가 증가함에 따라 전송해야 할 비트스트림의 양도 증가되어 기존의 인프라에서는 서비스가 불가능한 문제가 있다.

또한, 채널이 증가하면서 한번에 다운믹싱(downmixing)/업믹싱(upmixing) 할 때 필요한 매트릭스의 규모가 커지면서 연산이 복잡할 수 있다. 그리고, 실감성을 높이기 위해 채널이 증가하는 것에 대응하여 음질도 향상시키는 것이 필요하다.

본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 채널 그룹핑부; 그룹핑된 채널 간 중복 정보를 제거하여 상기 다채널 오디오 신호를 주파수 변환하는 신호 변환부; 상기 주파수 변환된 다채널 오디오 신호를 양자화하는 양자화부; 및 상기 양자화된 다채널 오디오 신호를 부호화하는 부호화부를 포함할 수 있다.

본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환하는 도메인 변환부; 및 상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 매트릭스 생성부를 더 포함할 수 있다.

본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 방법은 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 단계; 그룹핑된 채널 간 중복 정보를 제거하여 상기 다채널 오디오 신호를 주파수 변환하는 단계; 상기 주파수 변환된 다채널 오디오 신호를 양자화하는 단계; 및 상기 양자화된 다채널 오디오 신호를 부호화하는 단계를 포함할 수 있다.

본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 방법은 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환하는 단계; 및 상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 단계를 더 포함할 수 있다.

본 발명의 일실시예에 따르면, 다채널 오디오 신호의 채널을 미리 그룹핑한 후 채널간 중복 정보를 제거함으로써, 매트릭스의 부가 정보를 줄이고 복잡도를 낮출 수 있다.

본 발명의 일실시예에 따르면, 위상 정보를 포함하는 믹싱 매트릭스를 이용하여 채널간 중복 정보를 제거함으로써 다채널 오디오를 생성할 때의 공간감을 향상시킬 수 있다.

도 1은 본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치의 전체 구성을 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 다채널 오디오 신호를 생성하는 과정을 도시한 도면이다.
도 3은 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑하는 과정을 도시한 도면이다.
도 4는 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑한 후, 믹싱 매트릭스를 생성하는 과정을 도시한 도면이다.
도 5는 본 발명의 일실시예에 따라 룸 응답을 도시한 도면이다.
도 6은 본 발명의 일실시예에 따라 룸 응답을 시간에 따라 표현한 도면이다.
도 7은 본 발명의 일실시예에 따라 룸 응답의 위상 응답을 모델링하는 과정을 도시한 도면이다.
도 8은 본 발명의 일실시예에 따라 다채널 오디오 신호를 부호화하는 방법을 도시한 플로우차트이다.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 방법은 다채널 오디오 신호 부호화 장치에 의해 수행될 수 있다. 본 명세서에서 다채널 오디오 신호 복호화 장치는 도시되지 않았으나, 다채널 오디오 신호 복호화 장치는 다채널 오디오 신호 부호화 장치의 동작을 역으로 수행함으로써 원래 신호를 복원할 수 있다. 이하에서는, 다채널 오디오 신호 부호화 장치를 중심으로 설명하기로 한다.

도 1은 본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치의 전체 구성을 도시한 블록 다이어그램이다.

도 1을 참고하면, 다채널 오디오 신호 부호화 장치(100)는 채널 그룹핑부(101), 도메인 변환부(102), 믹싱 매트릭스 생성부(103), 신호 변환부(104), 양자화부(105) 및 부호화부(106)를 포함할 수 있다.

채널 그룹핑부(101)는 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑할 수 있다. 채널 그룹핑부(101)는 다채널 심리 음향 모델(multi-channel psychoacoustic model)을 이용하여 채널 그룹핑을 위한 그룹 기준을 결정할 수 있다.

일례로, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널을 그룹핑할 수 있다. 다른 일례로, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널 간 유사도를 이용하여 채널을 그룹핑할 수 있다. 채널을 그룹핑하는 과정에 대해서는 도 3과 도 4에서 구체적으로 설명하기로 한다.

도메인 변환부(102)는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환할 수 있다. 일례로, 도메인 변환부(102)는 다채널 오디오 신호를 Complex QMF 또는 MDCT(Modified Discrete Cosine Transform)&MDST(Modified Discrete Sine Transform) 중 어느 하나를 이용하여 도메인 변환을 할 수 있다.

매트릭스 생성부(103)는 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성할 수 있다. 일례로, 매트릭스 생성부(103)는 KLT(Karhunen-Transform)을 이용하여 주파수 대역별로 믹싱 매트릭스를 생성할 수 있다.

신호 변환부(104)는 믹싱 매트릭스를 이용하여 그룹핑된 채널 간 중복 정보를 제거하고, 다채널 오디오 신호를 주파수 변환할 수 있다.

양자화부(105)는 주파수 변화된 다채널 오디오 신호를 양자화할 수 있다.

부호화부(106)는 양자화된 다채널 오디오 신호를 부호화할 수 있다. 부호화부(106)는 믹싱 매트릭스도 함께 부호화할 수 있다. 이 때, 부호화부(106)는 믹싱 매트릭스의 계수를 위상(Phase)와 크기(Magnitude)로 분리하여 부호화할 수 있다. 구체적으로, 부호화부(106)는 밴드 간의 위상 정보에 따라 피크(peak)와 기울기(slope)로 표현된 룸 응답(room response)을 이용하여 위상을 부호화할 수 있다.

도 2는 본 발명의 일실시예에 따른 다채널 오디오 신호를 생성하는 과정을 도시한 도면이다.

도 2는 다채널 오디오 신호의 생성 과정에 대한 일예를 나타낸다. 복수의 마이크를 통해 수집한 오디오 신호를 이용하여 다채널 오디오 신호가 생성된다. 이 때, 복수의 마이크를 통해 수집한 오디오 신호에 적절한 localization, 공간감(ambience) 및 equalization filtering 이 적용됨으로써 다채널 오디오 신호가 생성된다. 이 때, localization은 에너지의 비율로 표현될 수 있다. 그리고, 공간감은 all-pass filtering을 통해 생성될 수 있다.

도 3은 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑하는 과정을 도시한 도면이다.

도 3을 참고하면, 다채널 오디오 신호가 입력되면 채널 그룹핑부(101)는 채널간 유사도를 계산하고, 유사도가 높은 채널끼리 그룹핑할 수 있다. 그러면, 채널 그룹핑부(101)는 그룹핑된 채널 신호와 그룹핑 정보를 생성할 수 있다. 그룹핑 정보는 그룹의 개수, 채널별 그룹 인덱스 정보를 포함할 수 있다. 채널 그룹핑부(101)는 입력된 다채널 오디오 신호를 미리 그룹핑하여 그룹별로 채널 처리함으로써 믹싱 매트릭스의 부가 정보를 줄이고, 연산 처리의 복잡도를 줄일 수 있다.

이 때, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 다채널 오디오 신호의 채널을 그룹핑할 수 있다. 이 때, 지오메트리 구조는 각 채널의 레이아웃(layout)을 의미한다. 그리고, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널 간 유사도를 이용하여 다채널 오디오 신호의 채널을 그룹핑할 수 있다.

도 4는 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑한 후, 믹싱 매트릭스를 생성하는 과정을 도시한 도면이다.

먼저, 다채널 오디오 신호가 입력되면 채널 그룹핑부(101)을 통해 채널이 그룹핑된다. 도 9에서 그룹핑된 결과는 g0, g1로 표현된다. 도메인 변환부(102)는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환할 수 있다. 이 때, 도메인 변환부(102)는 complex valued filterbank와 같은 변환을 통해 다채널 오디오 신호를 변환할 수 있다. complex valued filterbank는 complex valued QMF 또는 MDCT&MDST를 포함할 수 있다.

매트릭스 생성부(103)는 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성할 수 있다. 즉, 그룹에 믹싱 매트릭스가 적용되면 그룹 내에 포함된 채널들은 상관도가 낮게 된다. 이러한 과정은 inter-channel processing으로 불린다.

이 때, 믹싱 매트릭스는 그룹에 따라 생성된다. 일례로, 믹싱 매트릭스는 채널별로 오디오 신호를 다운믹싱하거나 업믹싱하기 위해 사용된다. 이 때, 믹싱 매트릭스는 KLT(Karhunen-Transform)을 통해 주파수 대역별로 생성될 수 있다.

믹싱 매트릭스의 각 계수는 복소수(complex number)이며, 고유 벡터(eigen vector)를 통해 계산될 수 있다. 믹싱 매트릭스의 계수는 크기와 위상으로 분리될 수 있다. 믹싱 매트릭스는 하기 수학식 1과 같다.

수학식 1에서 그룹 내에 포함된 채널 수는 N이며, j는 주파수 밴드의 인덱스를 나타낸다. 믹싱 매트릭스를 크기와 위상으로 분리하면 하기 수학식 2와 같다.

수학식 2와 같은 믹싱 매트릭스의 위상을 주파수 밴드 별로 표현하면 하기 수학식 3과 같다

여기서, J는 총 밴드 개수를 의미하며, 수학식 3은 믹싱 매트릭스의 (0,0)에 대응하는 위상 정보를 의미한다. 이러한 위상 정보는 룸 응답에 대응하며, 주파수 대역별로 기울기와 피크 정보를 통해 표현될 수 있다.

그러면, 신호 변환부(104)는 그룹별 다채널 오디오 신호를 부호화하기 위해 주파수 변환할 수 있다. 일례로, 도메인 변환부(102)에서 다채널 오디오 신호를 complex QMF 분석한 경우, 신호 변환부(104)는 다채널 오디오 신호를 inter-channel processing을 거친 다채널 오디오 신호를 complex QMF 합성(synthesis)를 통해 시간 도메인으로 변환하고, 다시 MDCT를 적용하여 주파수 변환할 수 있다.

다른 일례로, 도메인 변환부(102)에서 다채널 오디오 신호를 complex QMF 분석한 경우, 신호 변환부(104)는 complex QMF를 통해 inter-channel processing을 수행하고, complex-QMF의 서브 샘플에 MDCT를 적용하여 주파수 변환할 수 있다.

또 다른 일례로, 도메인 변환부(102)에서 다채널 오디오 신호에 MDCT와 MDST를 적용하고, 신호 변환부(104)는 다채널 오디오 신호를 inter-channel processing을 거친 다채널 오디오 신호에서 실수 부분인 MDCT만 선택하여 주파수 변환할 수 있다. 이 경우, 복호화 과정에서는 역 inter-channel processing을 위해 MDCT 계수로부터 MDST 계수가 추출되어야 한다.

양자화부(105)는 심리 음향 정보를 이용하여 믹싱 매트릭스, 룸 응답에 대응하는 위상 정보 및 inter-channel processing을 거친 다채널 오디오 신호를 양자화할 수 있다. 이 때, 채널 별로 양자화 정보가 믹싱 매트릭스의 계수와 동시에 양자화될 수 있다.

예를 들어, 특정 채널 i의 j번째 밴드의 양자화 계수가 100이며, 이에 대응하는 믹싱 매트릭스의 계수가 [0.1 0.3 0.5 0 -0.2]라고 가정한다. 그러면, 양자화 계수는 하기 수학식 4와 같이 표현된다.

믹싱 매트릭스의 계수와 양자화 계수는 독립적으로 부호화될 수 있다. 또는, 하기 수학식 5와 같이 양자화 계수가 믹싱 매트릭스의 계수에 포함되어 전송될 수 있다.

그러면, 복호화 장치에서는 전송된 믹싱 매트릭스의 계수를 이용하여 믹싱과 동시에 역양자화를 수행할 수 있다.

도 5는 본 발명의 일실시예에 따라 룸 응답을 도시한 도면이다.

특정 공간 내부에서 악기로부터 오디오 신호를 수집한 경우, 공간에 의한 반사 및 감쇠 정보(attenuation)을 고려하여 다채널 오디오 신호의 각 채널에 출력될 오디오 신호가 생성된다. 만일, 공간 정보를 미리 알고 룸에서 반사를 모델링할 수 있다면, 하나의 음원과 룸 정보로 렌더링을 통해 원음(original sound)와 같은 음질이 제공될 수 있다.

도 6은 본 발명의 일실시예에 따라 룸 응답을 시간에 따라 표현한 도면이다. 구체적으로, 도 6은 룸 응답의 임펄스 응답을 나타낸다. 초기 응답은 직접 수집한 오디오 신호에 관한 것이고, 이후 응답은 룸에서의 반사를 통해 수집한 오디오 신호에 관한 것이다.

도 7은 본 발명의 일실시예에 따라 룸 응답의 위상 응답을 모델링하는 과정을 도시한 도면이다.

그래프(701)은 룸 응답의 주파수 대역별 위상 정보를 나타낸다. 위상의 주기적 특성상 위상이 PI를 넘어가는 경우, 위상은 -PI로 표현된다. 그래프(701)을 참고하면, 각 주파수 대역별로 위상이 다르며, 타임 랙(time lag)이 존재하는 것을 알 수 있다.

이러한 위상 정보는 그래프(702)를 통해 피크와 기울기로 표현될 수 있다. 부호화 장치는 이러한 위상 정보를 예측하여 부가 정보로서 복호화 장치에 전달할 수 있다. 그러면, 복원된 신호는 다채널 오디오 신호의 공간감이 그대로 유지된다.

도 8은 본 발명의 일실시예에 따라 다채널 오디오 신호를 부호화하는 방법을 도시한 플로우차트이다. 다채널 오디오 신호를 복호화하는 방법은 도 8에 도시된 순서의 역이 된다.

다채널 오디오 신호 부호화 장치(100)는 다채널 오디오 신호의 채널 특성에 기초하여 다채널 오디오 신호의 채널을 그룹핑할 수 있다(S801).

일례로, 다채널 오디오 신호 부호화 장치(100)는 다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널 그룹핑할 수 있다. 다른 일례로, 다채널 오디오 신호 부호화 장치(100)는 다채널 오디오 신호의 채널 간 유사도를 이용하여 채널 그룹핑할 수 있다. 이 때, 다채널 오디오 신호 부호화 장치(100)는 다채널 심리 음향 모델을 이용하여 그룹 기준을 결정할 수 있다.

다채널 오디오 신호 부호화 장치(100)는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환할 수 있다(S802). 이 때, 다채널 오디오 신호 부호화 장치(100)는 Complex QMF 또는 MDCT&MDST 중 어느 하나를 이용하여 도메인 변환할 수 있다.

다채널 오디오 신호 부호화 장치(100)는 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성할 수 있다(S803). 이 때, 다채널 오디오 신호 부호화 장치(100)는 KLT를 이용하여 주파수 대역별로 믹싱 매트릭스를 생성할 수 있다.

다채널 오디오 신호 부호화 장치(100)는 그룹핑된 채널 간 중복 정보를 제거하여 다채널 오디오 신호를 주파수 변환할 수 있다(S804). 이 때, 다채널 오디오 신호 부호화 장치(100)는 믹싱 매트릭스를 적용하고 다채널 오디오 신호를 주파수 변환할 수 있다.

다채널 오디오 신호 부호화 장치(100)는 주파수 변환된 다채널 오디오 신호를 양자화할 수 있다(S805).

다채널 오디오 신호 부호화 장치(100)는 양자화된 다채널 오디오 신호를 부호화할 수 있다(S806). 다채널 오디오 신호 부호화 장치(100)는 밴드 간의 위상 정보에 따라 피크와 기울기로 표현된 룸 응답을 이용하여 위상을 부호화할 수 있다.

본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

100: 다채널 오디오 신호 부호화 장치
101: 채널 그룹핑부
102: 도메인 변환부
103: 매트릭스 생성부
104: 신호 변환부
105: 양자화부
106: 부호화부

Claims

다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 채널 그룹핑부;
믹싱 매트릭스를 이용하여 그룹핑된 채널 간 중복 정보를 제거하고, 상기 중복 정보가 제거된 그룹핑된 채널을 포함하는 다채널 오디오 신호를 주파수 변환하는 신호 변환부;
상기 주파수 변환된 다채널 오디오 신호를 양자화하는 양자화부; 및
상기 믹싱 매트릭스 및 상기 양자화된 다채널 오디오 신호를 부호화하는 부호화부
를 포함하고,
상기 믹싱 매트릭스는, 그룹별로 생성되는 다채널 오디오 신호 부호화 장치.
제1항에 있어서,
상기 채널 그룹핑부는,
다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 장치.
제1항에 있어서,
상기 채널 그룹핑부는,
다채널 오디오 신호의 채널 간 유사도를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 장치.
제1항에 있어서,
상기 채널 그룹핑부는,
다채널 심리 음향 모델을 이용하여 그룹 기준을 결정하는 것을 특징으로 하는 부호화 장치.
제1항에 있어서,
그룹별로 다채널 오디오 신호를 실수(real number)와 허수(imaginary number) 각각을 하나의 축으로 하는 도메인으로 변환하는 도메인 변환부; 및
상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 매트릭스 생성부
를 더 포함하고,
상기 신호 변환부는,
상기 믹싱 매트릭스를 적용하고 상기 다채널 오디오 신호를 주파수 변환하는 것을 특징으로 하는 부호화 장치.
제5항에 있어서,
상기 매트릭스 생성부는,
KLT(Karhunen-Transform)을 이용하여 주파수 대역별로 믹싱 매트릭스를 생성하는 것을 특징으로 하는 부호화 장치.
제5항에 있어서,
상기 부호화부는,
상기 믹싱 매트릭스의 계수를 위상과 크기로 분리하여 부호화하는 것을 특징으로 하는 부호화 장치.
제7항에 있어서,
상기 부호화부는,
밴드 간의 위상 정보에 따라 피크와 기울기로 표현된 룸 응답을 이용하여 상기 위상을 부호화하는 것을 특징으로 하는 부호화 장치.
제5항에 있어서,
상기 도메인 변환부는,
Complex QMF 또는 MDCT&MDST 중 어느 하나를 이용하여 도메인 변환하는 것을 특징으로 하는 부호화 장치.
제1항에 있어서,
상기 양자화부는,
양자화 계수에 믹싱 계수를 포함하여 동시에 양자화하는 것을 특징으로 하는 부호화 장치.
다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 단계;
믹싱 매트릭스를 이용하여 그룹핑된 채널 간 중복 정보를 제거하고, 상기 중복 정보가 제거된 그룹핑된 채널을 포함하는 다채널 오디오 신호를 주파수 변환하는 단계;
상기 주파수 변환된 다채널 오디오 신호를 양자화하는 단계; 및
상기 믹싱 매트릭스 및 상기 양자화된 다채널 오디오 신호를 부호화하는 단계
를 포함하고,
상기 믹싱 매트릭스는, 그룹별로 생성되는 다채널 오디오 신호 부호화 방법.
제11항에 있어서,
상기 채널을 그룹핑하는 단계는,
다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 방법.
제11항에 있어서,
상기 채널을 그룹핑하는 단계는,
다채널 오디오 신호의 채널 간 유사도를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 방법.
제11항에 있어서,
상기 채널을 그룹핑하는 단계는,
다채널 심리 음향 모델을 이용하여 그룹 기준을 결정하는 것을 특징으로 하는 부호화 방법.
제11항에 있어서,
그룹별로 다채널 오디오 신호를 실수와 허수 각각을 하나의 축으로 하는 도메인으로 변환하는 단계; 및
상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 단계
를 더 포함하고,
상기 다채널 오디오 신호를 주파수 변환하는 단계는,
상기 믹싱 매트릭스를 적용하여 상기 다채널 오디오 신호를 주파수 변환하는 것을 특징으로 하는 부호화 방법.
제15항에 있어서,
상기 믹싱 매트릭스를 생성하는 단계는,
KLT(Karhunen-Transform)을 이용하여 주파수 대역별로 믹싱 매트릭스를 생성하는 것을 특징으로 하는 부호화 방법.
제15항에 있어서,
상기 다채널 오디오 신호를 부호화하는 단계는,
상기 믹싱 매트릭스의 계수를 위상과 크기로 분리하여 부호화하는 것을 특징으로 하는 부호화 방법.
제17항에 있어서,
상기 다채널 오디오 신호를 부호화하는 단계는,
밴드 간의 위상 정보에 따라 피크와 기울기로 표현된 룸 응답을 이용하여 상기 위상을 부호화하는 것을 특징으로 하는 부호화 방법.
제15항에 있어서,
상기 그룹별로 다채널 오디오 신호를 도메인으로 변환하는 단계는,
Complex QMF 또는 MDCT&MDST 중 어느 하나를 이용하여 도메인 변환하는 것을 특징으로 하는 부호화 방법.
제11항 내지 제19항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.