KR20070003544A

KR20070003544A - 아비트러리다운믹스게인을 이용한 클리핑복원

Info

Publication number: KR20070003544A
Application number: KR1020060030653A
Authority: KR
Inventors: 방희석; 오현오; 김동수; 임재현; 정양원
Original assignee: 엘지전자 주식회사
Priority date: 2005-06-30
Filing date: 2006-04-04
Publication date: 2007-01-05
Also published as: KR20070003546A; KR20070003547A; KR20070003545A; KR20070003543A

Abstract

본 발명은 멀티채널 오디오 신호의 공간 정보에 대한 부호-복호화(encoding-decoding)방법에 관한 것으로서, 더욱 상세하게는 아비트러리다운믹스게인 값을 이용한 클리핑 복원방법을 갖는 멀티채널 오디오 신호의 부호화-복호화 방법에 대한 것이다. 본 발명은 외부에서 직접 입력되는 다운믹스 오디오신호와 멀티채널을 직접 다운믹스하여 생성된 다운믹스 오디오신호를 비교하여 생성된 아비트러리다운믹스게인 값에 클리핑복원정보를 포함시키고, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 클리핑복원정보를 이용하여 다운믹스 오디오신호의 클리핑된 부분을 복원함으로써 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있는 방법 및 장치를 제공한다. 또한, 본 발명은 상기 아비트러리다운믹스게인 값을 클리핑복원을 위한 정보로 구성하거나, 또는 다운믹스 오디오신호를 복원하기 위한 정보로 구성하고, 상기 아비트러리다운믹스게인 값의 데이터구조에 관한 정보를 상기 공간 정보 비트스트림내에 포함시킴으로써, 상기 아비트러리다운믹스게인 값을 효율적으로 이용할 수 있는 방법 및 장치를 제공한다.

공간 정보, 멀티채널, 클리핑.

Description

아비트러리다운믹스게인을 이용한 클리핑복원{CLIPPING RESTORATION BY ARBITRARY DOWNMIX GAIN}

도 1은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 나타내는 도면.

도 2는 클리핑 발생과정을 나타내는 도면.

도 3은 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 인코딩 방법에 대한 도면.

도 4는 본 발명에 따른 아비트러리다운믹스게인 값에 대한 데이터 구조를 선택할 수 있는 인코딩 방법에 대한 도면.

도 5는 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 디코딩 방법에 대한 도면.

도 6은 본 발명에 따른 아비트러리다운믹스게인 값에 대한 데이터 구조를 선택할 수 있는 디코딩 방법에 대한 도면.

도 7은 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 인코딩 방법에 대한 흐름도.

도 8은 본 발명에 따른 아비트러리다운믹스게인 값에 대한 데이터 구조를 선택할 수 있는 인코딩 방법에 대한 흐름도.

도 9는 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 디코딩 방법에 대한 흐름도.

도 10은 본 발명에 따른 아비트러리다운믹스게인 값에 대한 데이터 구조를 선택할 수 있는 디코딩 방법에 대한 흐름도.

*도면의 주요부분에 대한 부호의 설명

101.원거리 음원 102.직접적인 음파

104.반사된 음파 301.멀티채널 오디오 신호

302.다운믹스부 303.외부 다운믹스오디오신호입력부

304.공간정보발생부 305.아비트러리다운믹스게인생성부

306.클리핑복원정보삽입부 307.비트스트림포맷터

309.공간 인코더 406.클리핑복원정보삽입부

502.비트스트림수신부 503.아비트러리다운믹스게인추출부

504.클리핑복원부 505.멀티채널생성부

507.공간디코더 603.데이터구조정보독출부

604.아비트러리다운믹스게인적용부

본 발명은 멀티채널 오디오 신호의 공간 정보에 대한 부호-복호화(encoding-decoding)방법에 관한 것으로서, 더욱 상세하게는 아비트러리다운믹스게인 값를 이 용한 클리핑 복원방법을 갖는 멀티채널 오디오 신호의 부호화-복호화 방법에 대한 것이다.

최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 심리음향 모델(Psychoacoustic model)을 이용한 멀티채널 오디오 신호(multi-channel audio signal)의 코딩방법들이 개발되고 있으며, 이에 대한 표준화 작업이 진행되고 있다. 상기 심리음향 모델은 인간이 소리를 인식하는 방식, 예를 들면 큰 소리 다음에 오는 작은 소리는 들리지 않으며, 20Hz 내지 20000Hz의 주파수에 해당되는 소리만 들을 수 있다는 사실을 이용하여, 코딩과정에서 불필요한 부분에 대한 오디오 신호를 제거함으로써 필요한 데이터의 양을 효과적으로 줄일 수 있는 것이다.

현재 MPEG-1 오디오(MEPG-1 레이어 Ⅲ), MPEG-4 AAC(Advanced Audio Coding) 및 MPEG-4 HE-AAC(High-Efficiency AAC)와 같은 오디오 표준 기술이 개발되어 상용화되고 있다. 또한 공간 정보를 이용하는 멀티채널 오디오 신호의 코딩방법이 개발되고 있다. 상기 멀티채널 오디오 신호의 코딩방법은 압축된 오디오 신호(예를 들면, 모노 또는 스테레오 오디오 신호) 및 낮은 비트-레이트의 부가정보(low-rate side information)(예를 들면, 공간 정보) 채널을 이용하여 멀티채널 오디오 신호의 전송 효율을 매우 효과적으로 향상시키는 것이다.

그러나, 상기 멀티채널 오디오 신호의 비트스트림을 구성하는데 있어서, 종래에는 멀티채널을 모노 또는 스테레오 오디오 신호로 다운믹스하면 클리핑(Clipping) 문제가 발생하였었다. 특히 부호화된 신호는 16비트 등으로 크기가 제한되어야하므로, 상기 부호화된 신호는 코어 코덱 인코딩 이후에도 클리핑이 지속된다. 상기 클리핑은 오디오 신호의 출력에도 영향을 주며, 음질 저하의 원인이 되었었다.

따라서 상기와 같은 문제점을 해결하기 위해 제안된 본 발명은, 멀티채널 오디오 신호를 코딩하는데 있어서, 아비트러리다운믹스게인 값을 이용하여 클리핑된 부분을 복원함으로써, 멀티채널 오디오 신호에서 일어나는 클리핑 문제를 해결하는 방법 및 장치를 제공하는데 그 목적이 있다. 또한, 본 발명은 상기 아비트러리다운믹스게인 값을 클리핑복원 또는 외부에서 공급된 다운믹스 오디오신호의 복원에 선택적으로 이용할 수 있는 방법 및 장치를 제공하는데 그 목적이 있다.

상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 단계와; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 단계와; 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(Arbitrary Downmix Gain, ADG)정보를 생성하는 단계와; 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하되, 상기 아비트러리다운믹스게인 값에 클리핑이 일어나는 부분의 클리핑복원정보를 포함시키고, 상기 클리핑복원정보가 포함된 아비트러리다운믹스게인 값을 상기 공간 정보 비트스트림에 포함시키는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다.

상기 아비트러리다운믹스게인 값은 상기 제1 다운믹스 오디오신호와 상기 제2 다운믹스 오디오신호의 차이값을 이용하여 생성되거나, 또는 저주파 부분은 상기 제1 다운믹스 오디오신호의 저주파 부분을 이용하고, 고주파 부분은 상기 제1 다운믹스 오디오 신호와 상기 제2 다운믹스 오디오신호의 차이값을 이용하여 생성될 수 있다. 상기 저주파 부분은 상기 제1 다운믹스 오디오신호의 저주파 부분을 직접 레지듀얼 코딩하여 이용하거나, 또는 상기 제1 다운믹스 오디오신호 중 상기 제2 다운믹스 오디오신호와 차이에 해당되는 값을 레지듀얼 코딩하여 이용할 수 있다. 본 발명은 또한 상기 아비트러리다운믹스게인 값에 클리핑복원정보를 포함시키되, 상기 제2 다운믹스 오디오신호의 복원 및 클리핑복원을 모두 할 수 있는 클리핑복원정보를 포함시키는 것을 포함한다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 단계와; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 단계와; 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인 값을 생성하는 단계와; 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하되, 상기 공간 정보 비트스트림내에 상기 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 포함시키는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다. 상기 데이터 구조에 관한 정보는, 상기 아비트러리다운믹스게 인 값이 상기 제2 다운믹스 오디오신호의 복원을 위한 구조로 생성되었음을 나타내거나, 또는 상기 아비트러리다운믹스게인 값이 클리핑복원을 위한 구조로 생성되었음을 나타낼 수 있다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계와; 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값을 추출하고, 추출된 상기 아비트러리다운믹스게인 값을 디코딩하는 단계와; 상기 디코딩을 통해 얻어진 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다. 본 발명은 상기 공간 정보 비트스트림으로부터 상기 아비트러리다운믹스게인 값에 클리핑복원정보가 포함되었음을 나타내는 식별정보를 독출하는 단계를 포함할 수 있다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계와; 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 독출하는 단계와; 추출된 상기 데이터 구조에 관한 정보에 따라, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 정보를 상기 다운믹스 오디오 신호에 적용하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다. 상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 클리핑복원정보가 포함되었음을 나타내는 경우, 상기 아비트러리다 운믹스게인 값을 디코딩하여 얻은 클리핑복원정보를 이용하여 상기 외부에서 공급된 다운믹스 오디오신호의 클리핑복원을 수행할 수 있다. 상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 다운믹스오디오신호복원정보가 포함되었음을 나타내는 경우, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 다운믹스오디오신호복원정보를 이용하여 상기 외부에서 공급된 다운믹스오디오신호의 복원을 수행할 수 있다. 상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 클리핑복원정보 및 다운믹스오디오신호복원정보가 포함되었음을 나타내는 경우, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 클리핑복원정보 및 다운믹스 오디오신호 복원정보를 이용하여, 상기 외부에서 공급된 다운믹스 오디오신호의 클리핑복원 및 다운믹스오디오신호복원을 수행할 수 있다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 외부에서 공급되는 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 생성하되, 상기 공간 정보 비트스트림내에 포함되는 아비트레리다운믹스게인정보에 클리핑복원정보를 포함하도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 외부에서 공급되는 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 생성하되, 상기 공간 정보 비트스트림내에 상기 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 포함하도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 다운믹스부; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 공간정보발생부; 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(Arbitrary Downmix Gain, ADG)정보를 생성하는 아비트러리다운믹스게인생성부; 생성된 상기 아비트러리다운믹스게인 값에 클리핑복원정보를 포함시키는 클리핑복원정보삽입부; 및 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하는 비트스트림포맷터;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 장치를 제공한다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 다운믹스부; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 공간정보발생부; 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인 값을 생성하는 아비트러리다운믹스게인생성부; 상기 공간 정보 비트스트림내에 상기 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 포함시키는 데이터구조선택부; 및 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하는 비트스트림포맷터;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 장치를 제공한다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부; 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값을 추출하고, 추출된 상기 아비트러리다운믹스게인 값을 디코딩하는 아비트러리다운믹스게인추출부; 및 상기 디코딩을 통해 얻어진 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩 장치를 제공한다.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부; 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 독출하는 데이터구조독출부; 및 추출된 상기 데이터 구조에 관한 정보에 따라, 상기 아비트러리다운믹스게인 값을 디코딩하고, 상기 디코딩을 통해 얻은 정보를 상기 다운믹스 오디오 신호에 적용하는 아비트러리다운믹스게인적용부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 장치를 제공한다.

이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다.

도 1 은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 도시한다. 멀티채널 오디오 신호에 대한 코딩방법은 인간이 오디오 신호를 3차원적 공간으로 인지한다는 사실을 바탕으로, 복수의 파라미터 세트(parameter sets)를 통하여 상기 오디오 신호를 3차원적 공간 정보로 표현할 수 있다는 것을 이용한다. 멀티채널 오디오 신호의 공간 정보를 표시하기 위한 "공간 파라미터"라고 불리는 상기 파라미터에는 ICLD(Inter Channel level differences), ICC(Inter Channel Coherences) 및 ICTD(Inter Channel Time Difference)등이 있다. 상기 ICLD는 두 채널간의 에너지 차이를 의미하고, 상기 ICC는 두 채널 간의 상관관계(correlation)를 의미하며, ICTD는 두 채널간의 시간 차이를 의미한다.

인간이 오디오 신호를 어떻게 공간적으로 인식하며, 상기 공간 파라미터의 개념이 어떻게 생성되는지가 도 1에 도시된다. 원거리에 있는 음원(105)으로부터의 직접적인 음파(direct sound wave)(103)가 인간의 왼쪽 귀(107)에 도달하고, 또 다른 직접적인 음파(102)는 머리 주위에서 회절되어 오른쪽 귀(106)에 도달하게 된다. 상기 두 음파(102 및 103)는 도달시간 및 에너지 레벨에서 차이를 보이게 되며, 이와 같은 차이가 상기 CLD, CPC 및 CTD 파라미터를 생성하게 된다.

또한 만일 반사된 음파(104 및 105)가 양 귀에 도달되거나, 또는 상기 음원(105)이 분산되어 있다면, 서로 상관관계가 없는 음파가 양 귀에 도달될 것이고, 이것이 상기 ICC 파라미터를 생성하게 된다. 상기와 같이 원리로 생성된 공간 파라미터들은 멀티채널 오디오 신호를 모노 또는 스테레오 신호로 전송한 후 다시 멀티채널로 출력하는데 있어서, 강력한 비트 수 감소를 가능하게 한다는 것이 알려져 있다. 본 발명은 상기 공간 정보를 이용하는 멀티채널 오디오 신호에 있어서, 멀티채널을 다운믹스하여 코딩하는 과정에서 발생할 수 있는 클리핑(Clipping) 현상을 방지하기 위한 방법을 제시한다.

도 2는 클리핑 발생과정을 도시한다. 클리핑은 주로 두 가지 원인으로 발생한다. 첫 번째는 원래 신호(original signal)의 음량(sound level)이 높은 경우에 발생한다. 두 번째는 다운믹스 과정 중에 입력 채널(input channel)의 수가 많은 경우에 발생한다. 예를 들면, 3개의 채널을 1개의 채널로 다운믹스하는 경우보다, 7개의 채널을 1개의 채널로 다운믹스하는 경우에 클리핑이 더 자주 발생한다. 도 2의 클리핑 발생과정은 5개 채널을 1개의 채널로 다운믹스하는 경우를 도시하나, 본 발명은 이 경우에만 한정되지는 않는다.

도 2의 (a)는 5개의 채널로 구성된 원래 신호의 음량을 도시한다. 각각의 채널은 제한된 크기(예를 들면, 16비트)의 거의 전 범위를 사용할 수 있다. 도 2의 (b)는 상기 5개의 채널을 다운믹스하여 생성된 다운믹스 오디오 신호를 도시한다. 도시된 것처럼, 상기 다운믹스 오디오 신호는 많은 클리핑 지점들을 가질 수 있다. 도 2의 (c)는 상기 다운믹스 오디오 신호를 코어 코덱(예를 들면, AAC 코덱)을 이용하여 인코딩/디코딩한 오디오 신호를 도시한다. 상기 코어 코덱을 이용하여 인코딩/디코딩된 오디오 신호도 제한된 크기(예를 들면, 16비트)로 표현되므로, 클리핑이 지속될 수 있다. 상기 클리핑은 멀티채널 오디오 신호의 재생부에서의 출력에도 영향을 주며, 음질 저하의 원인이 될 수 있다.

도 3은 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 인코딩 방법을 도시한다. 도시된 것처럼, 멀티채널 오디오 신호(301)가 공간 인코더(309)에 입력된 후에, 다운믹스부(302)에서 다운믹스되어 다운믹스 오디오 신호(이하, "제1 다운믹스 오디오신호"라 한다)를 생성한다. 도면에서 n은 상기 공간 인코더(309)에 입력되는 입력 채널의 수를 의미한다. 또한, 공간정보발생부(304)에서 상기 멀티채널 오디오 신호(301)로부터 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 공간 정보 비트스트림을 생성한다. 그 다음에 외부에서 직접 입력되는 외부 다운믹스 오디오신호(이하, "제2 다운믹스 오디오신호"라 한다)가 외부다운믹스오디오신호입력부(303)에 입력되고, 아비트러리다운믹스게인생성부(305)에서 상기 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(Arbitrary Downmix Gain, ADG) 정보를 결정한다. 이때, 상기 아비트러리다운믹스게인 값은 상기 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오 신호의 차이정보을 이용하여 생성될 수 있다. 본 발명에서 "아비트러리다운믹스게인" 값은 외부에서 직접 입력되는 다운믹스 오디오신호를 다운믹스부에서 멀티채널을 다운믹스하여 생성되는 다운믹스 오디오신호와 근접하게 만들어주는 정보를 말한다.

또한, 본 발명은 상기 ADG 값을 생성함에 있어서, 보다 향상된 성능을 위해 저주파 부분은 게인(gain)이 아니고, 상기 제1 다운믹스 오디오 신호의 저주파 부분을 레지듀얼 코딩하여 생성하고, 고주파 부분은 기존과 마찬가지로 상기 ADG를 상기 제2 다운믹스 오디오신호의 고주파 부분에 적용하여 멀티채널 오디오신호의 복호화를 위한 다운믹스 오디오신호의 고주파 부분을 생성할 수 있다. 본 발명에서 "레지듀얼 코딩"이란 공간 인코더(309)에서 생성된 다운믹스 오디오신호의 일부를 그대로 코딩하는 것을 말한다. 이 경우에, 상기 제1 다운믹스 오디오 신호의 저주파 부분에 대한 레지듀얼 코딩을 수행할 때, 상기 제1 다운믹스 오디오신호의 저주 파 부분 값을 직접 레지듀얼 코딩하여 상기 ADG 값의 저주파 부분을 생성할 수도 있고, 또는 상기 제2 다운믹스 오디오신호와의 차이에 해당하는 값만을 레지듀얼 코딩하여 상기 ADG 값의 저주파 부분을 생성할 수 있다.

상기와 같이 생성된 ADG 및 제1 다운믹스 오디오 신호의 저주파 부분을 레지듀얼 코딩하여 생성된 ADG 값에 클리핑이 일어나는 지점의 클리핑복원정보를 포함하거나 덧붙여 보냄으로써 디코더에서 클리핑복원을 수행할 수 있다. 예를 들면, 클리핑이 일어나는 지점이 존재할 경우, 상기 지점에서의 위치와 크기정보를 상기 ADG 값에 포함하여 전송하거나, 상기 제1 다운믹스 오디오신호의 저주파 부분을 레지듀얼 코딩하여 생성된 ADG 값에 포함하여 전송할 수 있다. 또한, 본 발명에서는 상기 ADG 값들에 클리핑복원 및 다운믹스 오디오신호 복원을 동시에 할 수 있는 정보를 포함하여 전송할 수 있다. 상기와 같이 생성된 ADG값들은 공간 정보 비트스트림내에 포함될 수 있다. 이때, 상기 공간 정보 비트스트림내에 클리핑복원정보가 포함되었음을 나타내는 식별정보가 포함될 수 있다. 그 다음에 비트스트림포맷터(307)에서 상기 제2 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림(308)을 생성하여 전송한다.

도 4는 본 발명에 따른 아비트러리다운믹스게인 값의 데이터 구조를 선택할 수 있는 인코딩 방법을 도시한다. 도시된 것처럼, 멀티채널 오디오신호(401)가 공간 인코더(409)에 입력된 후에, 다운믹스부(402)에서 다운믹스 오디오신호를 생성한다. 또한, 공간정보발생부(404)에서 상기 멀티채널 오디오신호(401)로부터 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 공간 정보 비트스트림을 생성 한다. 그 다음에 외부에서 직접 입력되는 제2 다운믹스 오디오신호가 외부다운믹스오디오신호입력부(403)에 입력되고, 아비트러리다운믹스게인생성부(405)에서 상기 제2 다운믹스 오디오신호와 상기 다운믹스부(402)에서 생성된 제1 다운믹스 오디오 신호를 비교하여 아비트러리다운믹스게인 값을 결정한다.

상기 아비트러리다운믹스게인 값은 클리핑복원정보를 포함하는 구조로 생성되거나, 또는 상기 제2 다운믹스 오디오신호를 상기 제1 다운믹스 오디오신호에 근접하게 복원하는데 이용되는 다운믹스오디오신호복원정보를 포함하는 구조로 생성될 수 있다. 데이터구조선택부(406)는 각각의 경우에 대한 식별정보(즉, 데이터 구조에 관한 정보)를 상기 공간 정보 비트스트림내에 포함할 수 있다. 예를 들면, 만일 상기 ADG 값이 클리핑복원을 위한 정보로 생성된 경우, 상기 데이터 구조에 관한 정보는 상기 아비트러리다운믹스게인 값에 클리핑복원정보가 포함되었음을 나타낼 수 있다. 만일 상기 ADG 값이 다운믹스 오디오신호의 복원을 위한 정보로 생성된 경우, 상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 다운믹스오디오신호복원정보가 포함되었음을 나타낼 수 있다. 그 다음에 비트스트림포맷터(407)에서 상기 제2 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림(408)을 생성하여 전송한다. 상기 전체 비트스트림에는 상기 ADG 값의 데이터 구조에 대한 정보가 포함될 수 있다.

도 5는 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 디코딩 방법을 도시한다. 도시된 것처럼, 공간 디코더(507)를 구성하는 비트스트림수신부(502)는 아비트러리다운믹스게인 값을 포함하는 전체 비트스트 림(501)을 수신한다. 상기 전체 비트스트림에는 외부에서 직접 입력된 제2 다운믹스 오디오신호를 포함할 수 있다. 또한, 상기 전체 비트스트림에는 클리핑복원정보 및 상기 클리핑복원정보에 대한 식별정보 등이 포함될 수 있다. 상기 비트스트림수신부(502)는 상기 제2 다운믹스 오디오신호와 상기 공간 정보 비트스트림을 분리할 수 있다. 그 다음에 아비트러리다운믹스게인추출부(503)는 상기 공간 정보 비트스트림으로부터 상기 아비트러리다운믹스게인 값을 추출하고, 추출된 상기 아비트러리다운믹스게인 값을 디코딩하여 클리핑복원정보를 얻는다. 상기 클리핑복원정보는 다운믹스 오디오신호를 인코딩할 때 잘려진 클리핑된 신호에 해당될 수 있다. 클리핑복원부(504)는 상기 클리핑복원정보를 이용하여 상기 다운믹스 오디오신호의 클리핑된 부분을 복원할 수 있다.

또한, 상기 공간 디코더(507)는 클리핑이 일어난 부분에 상기 ADG 값을 적용하여 게인을 조절함으로써 클리핑이 발생한 부분을 복원하거나, 부호화된 저주파 부분의 정보만을 이용하여 상기 제2 다운믹스 오디오신호를 복원하거나, 또는 상기 두 정보를 동시에 이용하여 클리핑이 일어난 부분을 복원하고, 상기 제2 다운믹스 오디오신호를 상기 제1 다운믹스 오디오 신호에 근접하게 복원할 수 있다. 그 다음에, 멀티채널생성부(505)는 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여, 상기 클리핑된 부분이 복원된 다운믹스 오디오신호를 멀티채널 오디오 신호(506)로 변환할 수 있다.

도 6은 본 발명에 따른 아비트러리다운믹스게인 값의 데이터 구조를 선택할 수 있는 디코딩 방법을 도시한다. 도시된 것처럼, 공간 디코더(607)를 구성하는 비 트스트림수신부(502)는 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림(601)을 수신한다. 상기 전체 비트스트림에는 외부에서 직접 입력되는 제2 다운믹스 오디오신호를 포함할 수 있다. 또한, 상기 전체 비트스트림에는 아비트러리다운믹스게인(ADG) 값에 대한 데이터구조정보 등이 포함될 수 있다. 상기 비트스트림수신부(602)는 상기 다운믹스 오디오신호와 상기 공간 정보 비트스트림을 분리할 수 있다.

그 다음에 데이터구조정보독출부(603)는 상기 공간 정보 비트스트림으로부터 상기 ADG 값에 관한 데이터구조정보를 독출할 수 있다. 만일, 상기 데이터구조정보가 클리핑복원정보를 위해 상기 ADG 값이 생성되었다는 것을 표시하면, 상기 ADG 값을 디코딩하여 얻어진 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원할 수 있다. 만일, 상기 데이터구조정보가 외부에서 직접 입력된 제2 다운믹스 오디오신호의 복원을 위해 레지듀얼 신호가 생성되었다는 것을 표시하면, 상기 레지듀얼 신호를 디코딩하여 얻은 다운믹스오디오신호복원정보를 이용하여 상기 제2 다운믹스 오디오신호를 상기 제1 다운믹스 오디오신호와 근접하도록 복원할 수 있다. 그 다음에 멀티채널생성부(605)는 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 상기와 같이 복원된 다운믹스 오디오 신호를 멀티채널 오디오 신호(606)로 변환할 수 있다.

도 7은 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 인코딩 방법에 대한 흐름도이다. 먼저 멀티채널 오디오 신호(701)를 다운믹스하여 제1 다운믹스 오디오신호를 생성(702)하고, 상기 멀티채널 오디오신 호로부터 공간 정보를 추출(703)한다. 그 다음에 외부에서 직접 입력되는 제2 다운믹스 오디오신호(예를 들면, 아티스틱 다운믹스신호)와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(ADG) 값을 결정(704)한다. 상기 아비트러리다운믹스게인 값에 클리핑이 일어나는 부분에 대한 클리핑복원정보를 포함(705)시키고, 상기 아비트러리다운믹스게인 값을 포함하도록 공간 정보 비트스트림을 생성(706)한다. 이때, 상기 공간 정보 비트스트림내에 상기 ADG 값에 클리핑복원정보가 포함되었음을 표시하는 식별정보가 포함될 수 있다. 그 다음에 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 전송(707)한다.

도 8은 본 발명에 따른 아비트러리다운믹스게인 값의 데이터 구조를 선택할 수 있는 인코딩 방법에 대한 흐름도이다. 먼저 멀티채널 오디오 신호(801)를 다운믹스하여 제1 다운믹스 오디오신호를 생성(802)하고, 상기 멀티채널 오디오신호로부터 공간 정보를 추출(803)한다. 그 다음에 외부에서 직접 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(ADG) 값을 결정(804)한다. 상기 아비트러리다운믹스게인 값은 클리핑복원정보를 포함하거나, 또는 상기 제2 다운믹스 오디오신호를 상기 제1 다운믹스 오디오 신호에 근접하게 복원하는데 사용되는 다운믹스오디오신호복원정보를 포함할 수 있다. 상기 아비트러리다운믹스게인 값의 데이터 구조에 대한 데이터구조정보를 포함(805)하도록 공간 정보 비트스트림을 생성(806)한다. 그 다음에 상기 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 전송(807)한 다.

도 9는 본 발명에 따른 아비트러리다운믹스게인 값을 이용하여 클리핑을 방지하기 위한 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오 신호 및 공간 정보를 포함하는 전체 비트스트림을 수신(901)하고, 상기 전체 비트스트림으로부터 다운믹스 오디오 신호 및 공간 정보 비트스트림을 추출(902 및 903)한다. 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값을 추출하고, 추출된 상기 아비트러리다운믹스게인 값을 디코딩(904)한다. 상기 디코딩을 통해 클리핑복원정보를 추출(906)하고, 추출된 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원(905)할 수 있다. 그 다음에 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 클리핑된 부분이 복원된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환(907)한다.

도 10은 본 발명에 따른 아비트러리다운믹스게인 값의 데이터 구조를 선택할 수 있는 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 수신(1001)하고, 상기 전체 비트스트림으로부터 다운믹스 오디오신호 및 공간 정보 비트스트림을 추출(1002 및 1003)한다. 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값의 데이터구조에 관한 정보를 독출(1004)한다. 상기 데이터구조에 관한 정보는 상기 아비트러리다운믹스게인 값이 클리핑복원을 위한 구조로 생성되었는지, 또는 외부에서 직접 공급된 제2 다운믹스 오디오신호의 복원을 위한 구조로 생성되었는지에 관한 정보가 될 수 있다. 독출된 상기 데이터구조에 관한 정보에 따라 상기 아비트러리다운믹스게인 값을 디 코딩(1006)하고, 상기 디코딩을 통해 얻은 정보를 이용하여 상기 다운믹스 오디오신호의 클리핑된 부분의 복원 또는 제2 다운믹스 오디오신호를 상기 제1 다운믹스 오디오신호에 근접하도록 복원을 수행(1005)할 수 있다. 그 다음에 상기 공간 정보 비트스트림을 디코딩하여 얻어진 공간 정보를 이용하여 상기 다운믹스 오디오신호를 멀티채널 오디오 신호로 변환(1007)한다.

지금까지 본 발명에 대하여 몇몇 실시예들을 들어 구체적으로 설명하였으나, 상기 실시예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.

이상에서 기술된 것과 같이, 본 발명에 따른 멀티채널 오디오 신호를 코딩하는데 있어서, 외부에서 직접 입력되는 다운믹스 오디오신호와 멀티채널을 직접 다운믹스하여 생성된 다운믹스 오디오신호를 비교하여 생성된 아비트러리다운믹스게인 값에 클리핑복원정보를 포함시키고, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 클리핑복원정보를 이용하여 다운믹스 오디오신호의 클리핑된 부분을 복원함으로써 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있다.

또한, 상기 아비트러리다운믹스게인 값의 데이터구조에 관한 정보를 상기 공간 정보 비트스트림내에 포함시킴으로써, 상기 데이터구조에 관한 정보에 따라 상 기 아비트러리다운믹스게인 값을 클리핑복원을 위한 정보로 구성하거나, 또는 다운믹스 오디오신호를 복원하기 위한 정보로 구성함으로써 아비트러리다운믹스게인 값을 효율적으로 이용할 수 있다.

Claims

멀티채널 오디오 신호를 인코딩하는 방법에 있어서,

(a) 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 단계;

(b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 단계;

(c) 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(Arbitrary Downmix Gain, ADG)정보를 생성하는 단계; 및

(d) 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하되, 상기 아비트러리다운믹스게인 값에 클리핑이 일어나는 부분에 대한 클리핑복원정보를 포함시키고, 상기 클리핑복원정보가 포함된 아비트러리다운믹스게인 값을 상기 공간 정보 비트스트림에 포함시키는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 아비트러리다운믹스게인 값은 상기 제1 다운믹스 오디오신호와 상기 제2 다운믹스 오디오신호의 차이값을 이용하여 생성되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 아비트러리다운믹스게인 값은 저주파 부분은 상기 제1 다운믹스 오디오신호의 저주파 부분을 이용하고, 고주파 부분은 상기 제1 다운믹스 오디오 신호와 상기 제2 다운믹스 오디오신호의 차이값을 이용하여 생성되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 3 항에 있어서,

상기 저주파 부분은 상기 제1 다운믹스 오디오신호의 저주파 부분을 직접 레지듀얼 코딩하여 이용하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 3 항에 있어서,

상기 저주파 부분은 상기 제1 다운믹스 오디오신호 중 상기 제2 다운믹스 오디오신호와 차이에 해당되는 값을 레지듀얼 코딩하여 이용하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 (d)단계는,

상기 아비트러리다운믹스게인 값에 클리핑복원정보를 포함시키되, 상기 제2 다운믹스 오디오신호의 복원 및 클리핑복원을 모두 할 수 있는 클리핑복원정보를 포함시키는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 1 항에 있어서,

상기 (d)단계는,

클리핑복원정보가 상기 아비트러리다운믹스게인 값에 포함되었음을 나타내는 식별정보를 상기 공간 정보 비트스트림내에 포함시키는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
멀티채널 오디오 신호를 인코딩하는 방법에 있어서,

(a) 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 단계;

(b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 단계;

(c) 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인 값을 생성하는 단계; 및

(d) 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하되, 상기 공간 정보 비트스트림내에 상기 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 포함시키는 단계;를 포함하는 것을 특징으 로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 8 항에 있어서,

상기 데이터 구조에 관한 정보는, 상기 아비트러리다운믹스게인 값이 상기 제2 다운믹스 오디오신호의 복원을 위한 구조로 생성되었음을 나타내는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
제 8 항에 있어서,

상기 데이터 구조에 관한 정보는, 상기 아비트러리다운믹스게인 값이 클리핑복원을 위한 구조로 생성되었음을 나타내는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
멀티채널 오디오 신호로 디코딩하는 방법에 있어서,

(a) 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계;

(b) 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값을 추출하고, 추출된 상기 아비트러리다운믹스게인 값을 디코딩하는 단계; 및

(c) 상기 디코딩을 통해 얻어진 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
제 11 항에 있어서,

상기 (b)단계는,

상기 공간 정보 비트스트림으로부터 상기 아비트러리다운믹스게인 값에 클리핑복원정보가 포함되었음을 나타내는 식별정보를 독출하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
제 11 항에 있어서,

상기 (c)단계는,

상기 아비트러리다운믹스게인 값을 디코딩하여 얻어진 다운믹스 오디오신호 복원정보를 이용하여 상기 외부에서 입력된 다운믹스 오디오신호를 복원하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
멀티채널 오디오 신호로 디코딩하는 방법에 있어서,

(a) 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 단계;

(b) 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 독출하는 단계; 및

(c) 추출된 상기 데이터 구조에 관한 정보에 따라, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 정보를 상기 다운믹스 오디오 신호에 적용하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
제 14 항에 있어서,

상기 (c)단계는,

상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 클리핑복원정보가 포함되었음을 나타내는 경우, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 클리핑복원정보를 이용하여 상기 외부에서 공급된 다운믹스 오디오신호의 클리핑복원을 수행하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
제 14 항에 있어서,

상기 (c)단계는,

상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 다운믹스오디오신호복원정보가 포함되었음을 나타내는 경우, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 다운믹스오디오신호복원정보를 이용하여 상기 외부에서 공급된 다운믹스오디오신호의 복원을 수행하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
제 14 항에 있어서,

상기 (c)단계는,

상기 데이터 구조에 관한 정보가 상기 아비트러리다운믹스게인 값에 클리핑복원정보 및 다운믹스오디오신호복원정보가 포함되었음을 나타내는 경우, 상기 아비트러리다운믹스게인 값을 디코딩하여 얻은 클리핑복원정보 및 다운믹스 오디오신호 복원정보를 이용하여, 상기 외부에서 공급된 다운믹스 오디오신호의 클리핑복원 및 다운믹스오디오신호복원을 수행하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
오디오 신호의 생성방법에 있어서,

상기 오디오 신호는 외부에서 공급되는 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 생성하되,

상기 공간 정보 비트스트림내에 포함되는 아비트러리다운믹스게인정보에 클리핑복원정보를 포함하도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
오디오 신호의 생성방법에 있어서,

상기 오디오 신호는 외부에서 공급되는 다운믹스 오디오 신호 및 공간 정보 비트스트림을 포함하도록 생성하되,

상기 공간 정보 비트스트림내에 상기 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 포함하도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
멀티채널 오디오 신호의 인코딩 장치에 있어서,

(a) 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 다운믹스부;

(b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 공간정보발생부;

(c) 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인(Arbitrary Downmix Gain, ADG)정보를 생성하는 아비트러리다운믹스게인생성부;

(d) 생성된 상기 아비트러리다운믹스게인 값에 클리핑복원정보를 포함시키는 클리핑복원정보삽입부; 및

(e) 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하는 비트스트림포맷터;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 장치.
멀티채널 오디오 신호의 인코딩 장치에 있어서,

(a) 상기 멀티채널 오디오 신호를 다운믹스하여 제1 다운믹스 오디오신호를 생성하는 다운믹스부;

(b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하여 공간 정보 비트스트림을 생성하는 공간정보발생부;

(c) 외부에서 입력되는 제2 다운믹스 오디오신호와 상기 제1 다운믹스 오디오신호를 비교하여 아비트러리다운믹스게인 값을 생성하는 아비트러리다운믹스게인생성부;

(d) 상기 공간 정보 비트스트림내에 상기 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 포함시키는 데이터구조선택부; 및

(e) 상기 공간 정보 비트스트림 및 제2 다운믹스 오디오신호를 포함하는 전체 비트스트림을 생성하는 비트스트림포맷터;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 장치.
멀티채널 오디오 신호의 디코딩 장치에 있어서,

(a) 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부;

(b) 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값을 추출하고, 추출된 상기 아비트러리다운믹스게인 값을 디코딩하는 아비트러리다운믹스게인추출부; 및

(c) 상기 디코딩을 통해 얻어진 클리핑복원정보를 이용하여 상기 다운믹스 오디오 신호의 클리핑된 부분을 복원하는 클리핑복원부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.
멀티채널 오디오 신호의 디코딩 장치에 있어서,

(a) 외부에서 입력된 다운믹스 오디오신호 및 공간 정보 비트스트림을 포함하는 전체 비트스트림을 수신하는 비트스트림수신부;

(b) 상기 공간 정보 비트스트림으로부터 아비트러리다운믹스게인 값의 데이터 구조에 관한 정보를 독출하는 데이터구조독출부; 및

(c) 추출된 상기 데이터 구조에 관한 정보에 따라, 상기 아비트러리다운믹스게인 값을 디코딩하고, 상기 디코딩을 통해 얻은 정보를 상기 다운믹스 오디오 신호에 적용하는 아비트러리다운믹스게인적용부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.