KR20060109297A

KR20060109297A - 오디오 신호의 인코딩/디코딩 방법 및 장치

Info

Publication number: KR20060109297A
Application number: KR1020060013752A
Authority: KR
Inventors: 방희석; 김동수; 임재현
Original assignee: 엘지전자 주식회사
Priority date: 2005-04-14
Filing date: 2006-02-13
Publication date: 2006-10-19
Also published as: KR20060109296A; KR20060109298A; KR20060109299A

Abstract

본 발명은 효율적인 오디오 신호의 처리를 위한 오디오 신호의 인코딩/디코딩 방법 및 장치에 관한 것이다.

본 발명은 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; 상기 공간 정보 비트스트림에서 공간 정보를 해독하는 단계; 상기 공간 정보와 기 설정된 기준 공간 정보를 비교하여, 상기 공간 정보에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법을 제공한다.

따라서, 본 발명에 의하면, 디코딩 장치에서 수신한 공간 정보를 처리함에 있어서, 상기 수신한 공간 정보를 중 인터 채널 코히어런스를 선택적으로 디코럴레이션을 수행하여 효과적인 멀티채널 오디오 신호를 재생하는 것이 가능하다.

공간 정보, 디코럴레이션, 인터 채널 코히어런스

Description

오디오 신호의 인코딩/디코딩 방법 및 장치 {Method and Apparatus for encoding/decoding audio signal}

도 1은 본 발명에 따른 신호의 인코딩 장치와 디코딩 장치의 일 실시예를 나타낸 블록도

도 2는 본 발명에 따른 디코딩 장치의 제1 실시예를 나타낸 도면

도 3은 본 발명에 따른 디코딩 장치의 제2 실시예를 나타낸 도면

도 4는 본 발명에 따른 멀티채널을 생성하는 방법에 대한 제1 실시예를 설명하기 위한 흐름도

도 5는 본 발명에 따른 멀티채널을 생성하는 방법에 대한 제2 실시예를 설명하기 위한 흐름도

*도면의 주요부분에 대한 부호의 설명

10 : 인코딩 장치 20 : 디코딩 장치

100 : 공간 인코더 101 : 다운믹스 모듈

102 : 공간 파라미터 추출 모듈 120 : 오디오 인코더

130 : 오디오 디코더 140 : 공간 디코더

141 : 합성 모듈

200, 300 : 디코딩 장치 210, 310 : 공간 디코더

220, 320 : 공간 정보 해독 모듈 230, 330 : 선택 모듈

240, 340 : 디코럴레이션 모듈 241, 341 : 제1 디코럴레이션 모듈

242, 342 : 제2 디코럴레이션 모듈 250, 350 : 멀티채널 생성기

260, 360 : 오디오 디코더

본 발명은 오디오 신호의 인코딩/디코딩 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호를 처리함에 있어서, 전송해야할 오디오 신호를 다운믹스하고, 상기 다운믹스된 오디오 신호의 채널변화정보를 효과적으로 표현하기 위한 방법에 관한 것이다.

최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 심리음향 모델(psychoacoustic model)을 이용하여 멀티채널 오디오 신호의 코딩 방법들이 개발되고 있으며, 이에 대한 표준화 작업이 진행되고 있다.

상기 심리음향 모델은 인간이 소리를 인식하는 방식, 예를 들면 큰 소리 다음에 오는 적은 소리는 들리지 않으며, 20Hz 내지 20000Hz의 주파수에 해당되는 소리만 들을 수 있다는 사실을 이용하여, 코딩 과정에서 불필요한 부분에 대한 신호를 제거함으로써 필요한 데이터의 양을 효과적으로 줄일 수 있는 것이다.

또한, "MPEG 서라운드(surround)"라 불리는 멀티채널 오디오 신호의 코딩 방 법이 개발되고 있는데, 상기 MPEG 서라운드 방식은 압축된 스테레오(또는 모노) 오디오 신호 및 낮은 비트-레이트(bit-rate)의 공간 정보 채널을 이용하여 멀티채널 오디오 신호의 전송 효율을 매우 효과적으로 향상시키는 것이다.

그러나, 멀티채널 신호를 처리함에 있어서, 멀티채널 신호의 인코딩, 전송 및 디코딩 방법에 대한 구체적인 방법이 제시된 바 없어, 신호의 인코딩 및 디코딩 장치를 생산함에 있어서 문제점이 있었다.

본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 신호의 압축 및 전송효율을 향상시킬 수 있는 인코딩 및 디코딩 방법을 제공하는데 그 목적이 있다.

상기 목적을 달성하기 위하여, 본 발명은 (a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; (b) 상기 공간 정보 비트스트림에서 공간 정보를 해독하는 단계; (c) 상기 공간 정보와 기 설정된 기준 공간 정보를 비교하여, 상기 공간 정보에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법을 제공한다.

또한, 본 발명은 (a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; (b) 상기 공간 정보 비트스트림에서 공간 정보와 디코럴레이션 식별자(decorrelation flag)를 해독하는 단계; (c) 상기 디코럴레이션 식별자(decorrelation flag)에 따라 상기 공간 정보 에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법을 제공한다.

또한, 본 발명은 공간 정보 비트스트림을 수신하여 공간 정보를 해독하는 공간 정보 해독 모듈; 상기 공간 정보에 대해서 제1 디코럴레이션 모듈 및 제2 디코럴레이션 모듈 중 하나의 모듈을 선택적으로 동작하는 디코럴레이션 모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치를 제공한다.

또한, 본 발명은 공간 정보 비트스트림을 수신하여 공간 정보 및 디코럴레이션 식별자(decorrelation flag)를 해독하는 공간 정보 해독 모듈; 상기 디코럴레이션 식별자(decorrelation flag)에 따라 상기 공간 정보에 대해서 제1 디코럴레이션 모듈 및 제2 디코럴레이션 모듈 중 하나의 모듈을 선택적으로 동작하는 디코럴레이션 모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치를 제공한다.

또한, 본 발명은 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; 상기 공간 정보 비트스트림에서 공간 정보를 해독하는 단계; 상기 코어 코덱 비트스트림에서 다운믹스된 오디오 신호를 디코딩하는 단계; 상기 다운믹스된 오디오 신호를 분석하여, 상기 공간 정보에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방 법을 제공한다.

따라서, 본 발명에 의하면, 디코딩 장치에서 수신한 공간 정보를 처리함에 있어서, 상기 수신한 공간 정보를 디코딩 장치에 기 설정된 기준 공간 정보와 비교하여 인터 채널 코히어런스를 선택적으로 디코럴레이션을 수행하여 효과적인 멀티채널 오디오 신호를 재생하는 것이 가능하다. 또한, 디코딩 장치에서 수신한 공간 정보 중 인터 채널 코히어런스를 처리함에 있어서, 디코럴레이션 식별자를 확인하여 인터 채널 코히어런스를 선택적으로 디코럴레이션을 수행하여 효과적인 멀티채널 오디오 신호를 재생하는 것이 가능하다.

이하 상기의 목적으로 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다.

아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재하였으므로, 단순한 용어의 명칭이 아닌 용어가 가지는 의미로서 본 발명을 파악하여야 함을 밝혀두고자 한다.

본 발명에서 "공간 정보"란 인코딩 부에서 멀티채널을 다운믹스(down-mix)하고 송신한 신호를 디코딩 부에서 수신하여 업믹스(up-mix)를 수행하여 멀티채널을 생성하기 위해 필요한 정보를 의미한다. 상기 공간 정보로 공간 파라미터를 기준으로 설명하나, 본 발명은 이에 한정되지 않음은 자명한 사실임을 밝혀둔다.

또한, 상기 공간 파라미터는 두 채널간의 에너지 차이를 의미하는 채널 레벨 차이(Channel Level Difference: CLD, 이하 'CLD'라 한다.), 두 채널간의 상관관계(Correlation)를 의미하는 인터 채널 코히어런스(Inter Channel Coherence: ICC, 이하 'ICC'라 한다.) 및 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수인 채널 예측 계수(Channel Prediction Coefficient: CPC, 이하 'CPC'라 한다.) 등이 있다. 본 발명은 상기 공간 파라미터 종류에 한정되지 않고, 다른 종류의 공간 파라미터에도 적용가능하다.

본 발명에서 "디코럴레이션 식별자(decorrelation flag)"는 공간 정보 중 ICC를 재생하는 방법을 나타내는 정보를 의미한다. 상기 디코럴레이션 식별자를 인코딩 장치에서 송신하면, 디코딩 장치는 수신된 디코럴레이션 식별자에 따라서 디코럴레이션 방법을 선택하여, ICC를 재생한다.

도 1은 본 발명에 따른 오디오 신호 처리 장치의 개념적인 설명을 위한 실시예를 도시한 것이다. 다시말해, MPEG 서라운드(MPEG surround)에서 오디오 신호의 인코딩 장치와 디코딩 장치를 설명하기 위한 도면이다.

인코딩 장치(10)는 다운믹스 모듈(downmix module:101)과 공간 파라미터 추출 모듈(spatial parameter estimation module:102)을 포함하여 구성되는 공간 인코더(spatial encoder:100)와, 다운믹스 채널로부터 전송된 오디오 신호를 인코딩하는 오디오 인코더(audio encoder:120)를 포함하여 구성된다.

오디오 신호가 N개의 멀티채널(

,

,...,

)로 입력되면, 다운믹스 모듈(101)은 미리 정해진 다운믹스 정보 또는 외부 제어 명령에 따라 특정 개 수의 채널로 입력된 오디오 신호의 다운믹스를 수행하여 다운믹스 채널을 생성한다. 상기 다운믹스 채널로 다운믹스된 오디오 신호를 다운믹스 모듈(101)에서 출력하면, 상기 출력된 신호는 오디오 인코더(120)에 입력된다. 여기서, 상기 다운믹스 채널은 한 개의 채널 또는 두 개의 채널(

,

)을 가지거나, 또는 다운믹스 명령에 따라 특정 개수의 채널을 가질 수 있다. 이때, 다운믹스 채널의 개수는 설정가능하다.

선택적으로, 다운믹스된 오디오 신호는 외부에서 직접 제공되는 다운믹스된 오디오 신호, 즉 아티스틱 다운믹스 신호(artistic downmix signal)를 이용할 수 있음을 밝혀둔다.

오디오 인코더(audio encoder:120)는 다운믹스 채널을 통해서 전송된 다운믹스 오디오 신호를 수신하고, 상기 수신한 신호의 인코딩을 수행하여 압축된 오디오 신호(compressed audio signal)를 송신한다. 여기서, 상기 압축된 오디오 신호는 코어 코덱 비트스트림과 동일한 의미이다.

예를 들어, 상기 오디오 인코더(120)는 코어 코덱 코딩방법을 이용하여 다운믹스된 오디오 신호를 인코딩하여 생성된 코어 코덱 비트스트림을 송신한다. 여기서, 코어 코덱은 오디오 신호에서 추출한 공간 파라미터를 코딩 또는 인코딩하는 공간 코덱에 대응하는 개념으로, 공간 파라미터가 아닌 오디오 신호를 코딩 또는 인코딩하는 코덱을 지칭한다(예를 들면, MP3, AC-3, DTS 또는 AAA 등). 코어 코덱에 있어서, 상기 오디오 신호가 다운믹스 되었는지 여부는 관계가 없다. 코어 코덱 은 MP3, AC-3, DTS 또는 AAA에 한정되지 아니하며, 오디오 신호에 대하여 코덱 기능을 수행한다면 기존에 개발된 코덱뿐만 아니라, 향후 개발된 코덱을 포함할 수 있다.

공간 파라미터 추출 모듈(102)은 멀티채널로부터 공간 파라미터를 추출하여, 상기 추출된 공간 파라미터들을 디코딩 장치(20)로 송신한다. 상기 공간 파라미터 추출 모듈(102)은 디코딩 장치에서 ICC 재생방법에 대한 정보를 생성하는 기능도 수행한다. 상기 ICC 재생방법에 대한 정보는 디코럴레이션 식별자(decorrelation flag)가 포함한다.

디코딩 장치(20)의 오디오 디코더(130)는 압축된 오디오 신호(compressed audio signal)를 수신하고, 상기 수신한 압축된 오디오 신호의 오디오 디코딩을 수행하여 다운믹스 채널(예를 들어, 스테레오 채널(

,

))을 통해 오디오 신호를 출력한다. 이때, 상기 오디오 신호의 디코딩 장치(20)가 멀티채널을 디코딩하지 못하는 경우에는 압축된 오디오 신호의 디코딩을 수행하여 다운믹스 채널의 오디오 신호를 직접 출력할 수 있다. 이는 오디오 신호의 디코딩 장치들 간에 호환성을 위해서 필요한 것이다.

공간 디코더(spatial decoder:140)의 합성 모듈(synthesis module:141)은 오디오 디코더(130)로부터 오디오 신호를 수신하고, 인코딩 장치(10)의 공간 파라미터 추출 모듈(102)로부터 공간 파라미터들(spatial parameters)을 수신하여 서라운드 합성을 하여 멀티채널(

,

, ...,

)을 생성하고, 상기 생성된 멀 티채널을 통해서 멀티채널 오디오 신호를 출력한다.

이와 같이, 멀티채널로 오디오 신호를 직접 전송하는 대신에 상기 멀티채널을 다운믹스 채널로 다운믹스하여 상기 다운믹스 채널로 오디오 신호를 전송하고, 상기 멀티채널 오디오 신호의 공간 파라미터를 함께 전송하는 방식은 압축 및 전송 효율의 관점에서 매우 우수한 방식이다.

예를 들어, 공간 디코더(spatial decoder:140)에서 다운믹스 채널인 모노 또는 스테레오 채널을 멀티채널로 하는 경우 중 하나인 2채널에서 5.1채널로 변환하는 경우에 대해서 좀 더 상세히 살펴본다. 이때, 2채널에서 5.1채널로의 변환은 시간/주파수 영역(time/frequency domain)에서 이루어지는데, 그 과정은 다음과 같다. 다만, 본 발명에서 다운믹스 채널이 모노 또는 스테레오 채널에 한정되지 않음을 밝혀둔다.

먼저, 2채널 분석 필터뱅크(analysis filterbank)는 디코딩되어 전송된 스테레오 오디오 신호를 2채널의 시간/주파수 영역 오디오 신호로 변환하고, 상기 시간/주파수 영역 오디오 신호는 공간 정보, 즉 공간 파라미터를 이용하여 6채널 시간/주파수 오디오 신호로 업믹스(up-mix) 되며, 상기 6채널 시간/주파수 오디오 신호는 6채널 합성 필터뱅크(synthesis filterbank)에 의해 5.1채널 오디오 신호로 변환된다.

도 2는 본 발명에 따른 디코딩 장치의 제1 실시예를 나타낸 도면이다. 특히, 도 1의 공간 디코더(140)를 예를 들어 상세히 나타낸 도면이다.

도 2를 참조하면, 디코딩 장치(200)는 크게 나누어 공간 디코더(210)와 오디 오 디코더(260)를 포함하여 구성된다. 상기 공간 디코더(210)는 공간 정보 해독 모듈(220), 선택 모듈(230), 제1 디코럴레이션 모듈(241)과 제2 디코럴레이션 모듈(242)을 포함하여 구성되는 디코럴레이션 모듈(240), 멀티채널 생성기(multi-channel generator:250)을 포함하여 구성된다.

공간 정보 해독 모듈(220)은 공간 파라미터 비트 스트림(spatial parameter bit stream)을 수신하여 공간 정보를 해독하고, 상기 공간 정보를 선택 모듈(230)로 송신한다. 상기 해독된 공간 정보로는 CLD, ICC, CPC, CTD 등이 있다.

선택 모듈(230)은 수신한 공간 정보를 디코딩 장치(200)에 기 설정되어 있는 기준 공간 정보와 비교/판단하여, 공간 정보 중 ICC에 대한 디코럴레이션 방법을 선택한다. 이때, 공간 정보 중 ICC에 대한 디코럴레이션 방법의 선택은 오디오 디코더(260)에서 디코딩된 다운믹스된 오디오 신호를 분석하여 결정될 수 있음을 밝혀둔다.

또한, 디코딩 장치(200)는 수신한 오디오 신호의 모든 프레임(frame)에 대해서 하나의 디코럴레이션 모듈을 선택하여 디코럴레이션을 수행하는 것도 가능하며, 각각의 프레임(frame)별로 디코럴레이션 모듈을 선택하여 디코럴레이션을 수행하는 것도 가능하다. 이하 선택 모듈(230)에서 디코럴레이션 방법을 선택하는 방법에 대해서 상세히 살펴본다.

먼저, 선택 모듈(230)에서 디코럴레이션 방법을 선택하는 경우의 예를 들면, 오디오 신호 전 프레임에 대해서 한가지 디코럴레이션 모듈(240) 중 하나를 선택하여 공간 정보 중 ICC를 디코럴레이션하는 방법이 가능하다. 이는 디코딩 장치(200) 에서 디코딩 옵션을 설정하여 디코럴레이션 모듈(240) 중 어떤 모듈을 사용할 것인지 결정하는 방법을 의미한다. 상기 선택 모듈(230)에서의 선택의 기준이 되는 디코딩 옵션은 디코딩 후 오디오 신호의 음질이 우수하게 되는 디코럴레이션 방법을 선택할 수 있다. 다만, 디코딩 후 오디오 신호의 음질의 차이가 미미하다고 전제하면, 복잡도(complexity)의 차이가 있는 디코럴레이션 모듈(240)의 제1 디코럴레이션 모듈(241)과 제2 디코럴레이션 모듈(242) 중에서 복잡도가 낮은 디코럴레이션 모듈을 사용하여 공간 정보 중 ICC에 대한 디코럴레이션을 수행할 수 있다.

그리고, 선택 모듈(230)에서 디코럴레이션 방법을 선택하는 경우의 또 다른 예를 들면, 오디오 신호 각 프레임에 대해서 프레임별로 디코럴레이션 모듈(240) 중 하나를 선택하여 공간 정보 중 ICC를 디코럴레이션하는 방법이 가능하다. 이는 디코딩 장치(200)에서 수신한 공간 정보 비트스트림에서 해독한 CLD값 및/또는 ICC값 등이 특정 값 이상이거나 이하일 경우 디코럴레이션 모듈(240) 중 어떤 모듈을 사용할 것인지 결정하는 방법을 의미한다. 이는, 상기 CLD값 및/또는 ICC값 등이 특정 값 이상이거나 이하일 경우에 복잡도(complexity)의 차이가 있는 디코럴레이션 모듈(240)의 제1 디코럴레이션 모듈(241)과 제2 디코럴레이션 모듈(242) 중에서 복잡도가 낮은 디코럴레이션 모듈을 사용하여 공간 정보 중 ICC에 대한 디코럴레이션을 수행할 수 있다.

디코럴레이션 모듈(decorrelation module:240)은 상기 선택 모듈(230)의 선택에 따라서 공간 정보 중 ICC의 디코럴레이션을 수행한다. 선택 모듈(230)에서 디코럴레이션 방법으로 제1 디코럴레이션 방법을 선택한 경우, 디코럴레이션 모듈 (240)의 제1 디코럴레이션 모듈(241)이 동작하여 공간 정보 중 ICC의 디코럴레이션을 수행한다. 이와 달리, 선택 모듈(230)에서 디코럴레이션 방법으로 제2 디코럴레이션 방법을 선택한 경우, 디코럴레이션 모듈(240)의 제2 디코럴레이션 모듈(242)이 동작하여 공간 정보 중 ICC의 디코럴레이션을 수행한다. 관련하여, 상기 제2 디코럴레이션 모듈(242)은 ICC 조절 모듈이라 명명할 수 있음을 밝혀둔다.

예를 들어, 제2 디코럴레이션 모듈(242)로 FIR 필터 또는 IIR 필터로 구성될 수 있다. 상기 제2 디코럴레이션 모듈(242)이 FIR 필터 또는 IIR 필터로 구성된 경우에 상기 제2 디코럴레이션 모듈(242)의 디코럴레이션의 수행은 상기 FIR 필터 계수 또는 IIR 필터 계수를 공간 정보에 맞게 생성하는 방법으로 이루어진다. 또한, 공간 정보가 시간에 따라 변하므로 FIR 필터와 IIR 필터는 필터 계수를 시변(time-varying)으로 생성하여 ICC를 조절한다. 관련하여, 제2 디코럴레이션 모듈(242)로 FIR 필터 또는 IIR 필터를 사용하는 경우, 상기 FIR 필터 또는 IIR 필터는 초기 반향음(early reflection)의 시공간 특성 모사를 위해서만 사용하고 잔향음(reverberation) 모사를 위해서는 사용하지 않는 것을 특징으로 한다. 이는 상기 제2 디코럴레이션 모듈(242)에 의해 생성된 음의 잔향 시간이 원음의 잔향 시간과 차이가 없게 하는 특징이 있다. 상기 제2 디코럴레이션 모듈(242)로 FIR 필터 또는 IIR 필터를 예로 하여 설명하였으나, 본 발명은 이에 한정되지 아니한다.

오디오 디코더(audio decoder:260)는 수신한 코어 코덱 비트스트림을 수신하여 다운믹스된 오디오 신호를 생성하는 기능을 수행한다. 상기 생성된 다운믹스된 오디오 신호는 디코럴레이션 모듈(240)과 멀티채널 생성기(250)에 입력된다.

멀티채널 생성기(multi-channel generator:250)는 디코럴레이션 모듈(240)로부터 공간 정보를 수신하고, 오디오 디코더(260)로부터 다운믹스된 오디오 신호를 수신하여 멀티 채널을 생성한다. 예를 들어, 다운믹스된 오디오 신호인 모노 또는 스테레오 신호를 길쌈(convolution)을 통해 멀티채널 신호 전체를 생성하거나, 일부 채널의 신호를 재구성하게 된다.

도 3은 본 발명에 따른 디코딩 장치의 제2 실시예를 나타낸 도면이다. 특히, 도 1의 공간 디코더(140)를 예를 들어 상세히 나타낸 도면이다.

도 3을 참조하면, 디코딩 장치(300)는 크게 나누어 공간 디코더(310)와 오디오 디코더(360)를 포함하여 구성된다. 상기 공간 디코더(310)는 공간 정보 해독 모듈(320), 선택 모듈(330), 제1 디코럴레이션 모듈(341)과 제2 디코럴레이션 모듈(342)을 포함하여 구성되는 디코럴레이션 모듈(340), 멀티채널 생성기(multi-channel generator:350)을 포함하여 구성된다.

도 3의 디코딩 장치와 도 2의 디코딩 장치의 차이점을 공간 정보 해독 모듈(320)과 선택 모듈(330)의 기능이 상기 도 2의 공간 정보 해독 모듈(220)과 선택 모듈(230)의 기능과 차이가 있을 뿐, 다른 구성요소의 기능을 동일하므로 이하 공간 정보 해독 모듈(320)과 선택 모듈(330)에 대해서 살펴본다.

공간 정보 해독 모듈(220)은 공간 파라미터 비트 스트림(spatial parameter bit stream)을 수신하여 공간 정보와 디코럴레이션 식별자(decorrelation flag)를 해독하고, 상기 공간 정보와 디코럴레이션 식별자(decorrelation flag)를 선택 모듈(330)로 송신한다.

선택 모듈(330)은 수신한 디코럴레이션 식별자(decorrelation flag)를 확인하여, 공간 정보 중 ICC에 대한 디코럴레이션 방법을 선택한다. 관련하여, 도 3의 실시예에서도 공간 정보 중 ICC에 대한 디코럴레이션 방법의 선택은 오디오 디코더(360)에서 디코딩된 다운믹스된 오디오 신호를 분석하여 결정될 수 있음을 밝혀둔다.

이하, 도 4와 도 5를 참조하여, 본 발명에 따른 공간 정보의 디코럴레이션 방법을 선택하여 공간 정보를 디코럴레이션하는 실시예들에 대해서 살펴본다.

도 4는 본 발명에 따른 멀티채널을 생성하는 방법에 대한 제1 실시예를 설명하기 위한 흐름도이다. 이는, 공간 정보를 이용하여 멀티채널을 생성하는 경우, 상기 공간 정보의 디코럴레이션 방법을 상기 공간 정보에 따라 선택하여 공간 정보 중 ICC를 디코럴레이션 하는 방법에 관한 것이다.

디코딩 장치는 코어 코덱 비트스트림과 공간 정보 비트스트림을 수신한다(S10). 상기 공간 정보 비트스트림에서 공간 정보를 해독하는데, 상기 공간 정보에는 ICC를 포함한다(S20). 상기 코어 코덱 비트스트림에서 다운믹스된 오디오 신호를 생성한다(S30).

상기 단계(S20)에서 해독한 공간 정보와 디코딩 장치에 기 설정되어 있는 공간 정보를 비교하여 공간 정보 중 ICC에 대한 디코럴레이션 방법을 선택한다(S40). 상기 디코럴레이션 방법 중 제1 디코럴레이션 방법을 선택하면, ICC에 대한 제1 디코럴레이션 방법을 수행한다(S50). 상기 디코럴레이션 방법 중 제2 디코럴레이션 방법을 선택하면, ICC에 대한 제2 디코럴레이션을 수행한다(S60). 예를 들어, 상기 제2 디코럴레이션 방법은 FIR 필터링 또는 IIR 필터링을 수행하는 방법이 있다.

다운믹스된 오디오 신호와 디코럴레이션 수행된 공간 정보를 이용하여 멀티채널을 생성한다(S70).

도 5는 본 발명에 따른 멀티채널을 생성하는 방법에 대한 제2 실시예를 설명하기 위한 흐름도이다. 이는, 공간 정보를 이용하여 멀티채널을 생성하는 경우, 상기 공간 정보의 디코럴레이션 방법을 디코럴레이션 식별자(decorrelation flag)에 따라 선택하여 공간 정보 중 ICC를 디코럴레이션 하는 방법에 관한 것이다.

디코딩 장치는 코어 코덱 비트스트림과 공간 정보 비트스트림을 수신한다(S100). 상기 공간 정보 비트스트림에서 공간 정보와 디코럴레이션 식별자(decorrelation flag)를 해독하는데, 상기 공간 정보에는 ICC를 포함한다(S200). 상기 코어 코덱 비트스트림에서 다운믹스된 오디오 신호를 생성한다(S300).

상기 단계(S200)에서 해독한 디코럴레이션 식별자(decorrelation flag)에 따라 공간 정보 중 ICC에 대한 디코럴레이션 방법을 선택한다(S400). 상기 디코럴레이션 방법 중 제1 디코럴레이션 방법을 선택하면, ICC에 대한 제1 디코럴레이션 방법을 수행한다(S500). 상기 디코럴레이션 방법 중 제2 디코럴레이션 방법을 선택하면, ICC에 대한 제2 디코럴레이션을 수행한다(S600).

다운믹스된 오디오 신호와 디코럴레이션 수행된 공간 정보를 이용하여 멀티채널을 생성한다(S700).

본 발명을 상술한 실시예에 한정되지 않으며, 첨부된 청구범위에서 알 수 있는 바와 같이 본 발명이 속한 분야의 통상의 지식을 가진 자에 의해 변형이 가능하 고 이러한 변형은 본 발명의 범위에 속한다.

상기에서 설명한 본 발명에 따른 오디오 신호의 인코딩/디코딩 방법 및 장치 효과를 설명하면 다음과 같다.

첫째, 디코딩 장치에서 수신한 공간 정보 중 인터 채널 코히어런스를 처리함에 있어서, 상기 수신한 공간 정보를 디코딩 장치에 설정된 공간 정보와 비교하여 인터 채널 코히어런스를 선택적으로 디코럴레이션을 수행하여 효과적인 멀티채널 오디오 신호를 재생하는 것이 가능하다.

둘째, 디코딩 장치에서 수신한 공간 정보 중 인터 채널 코히어런스를 처리함에 있어서, 디코럴레이션 식별자를 확인하여 인터 채널 코히어런스를 선택적으로 디코럴레이션을 수행하여 효과적인 멀티채널 오디오 신호를 재생하는 것이 가능하다.

셋째, 디코딩 장치에서 수신한 공간 정보 중 인터 채널 코히어런스를 처리함에 있어서, 다운믹스된 오디오 신호를 확인하여 인터 채널 코히어런스를 선택적으로 디코럴레이션을 수행하여 효과적인 멀티채널 오디오 신호를 재생하는 것이 가능하다.

Claims

(a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계;

(b) 상기 공간 정보 비트스트림에서 공간 정보를 해독하는 단계;

(c) 상기 공간 정보와 기 설정된 기준 공간 정보를 비교하여, 상기 공간 정보에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
제 1 항에 있어서, 상기 (a) 단계는,

상기 코어 코덱 비트스트림을 디코딩하여 다운믹스된 오디오 신호를 생성하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
제 2 항에 있어서,

상기 다운믹스된 오디오 신호와 상기 공간 정보를 이용하여 멀티채널을 생성하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
제 1 항에 있어서,

상기 제2 디코럴레이션 방법은 인터 채널 코히어런스(inter channel coherence)를 조절하여 디코럴레이션을 수행하는 방법인 것을 특징으로 하는 오디오 신호의 디코딩 방법.
제 1 항에 있어서,

상기 제2 디코럴레이션 방법의 수행은 FIR 필터링 또는 IIR 필더링을 수행하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
(a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계;

(b) 상기 공간 정보 비트스트림에서 공간 정보와 디코럴레이션 식별자(decorrelation flag)를 해독하는 단계;

(c) 상기 디코럴레이션 식별자(decorrelation flag)에 따라 상기 공간 정보 에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
제 1 항 또는 제 6 항에 있어서,

상기 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선 택적으로 수행하는 공간 정보는 인터 채널 코히어런스(inter channel coherence)인 것을 특징으로 하는 오디오 신호의 디코딩 방법.
제 1 항 또는 제 6 항에 있어서,

상기 공간 정보는 채널 레벨 디퍼런스(channel level difference), 채널 예측 상수(channel prediction coefficient), 인터 채널 코히어런스(inter channel coherence)를 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
공간 정보 비트스트림을 수신하여 공간 정보를 해독하는 공간 정보 해독 모듈;

상기 공간 정보에 대해서 제1 디코럴레이션 모듈 및 제2 디코럴레이션 모듈 중 하나의 모듈을 선택적으로 동작하는 디코럴레이션 모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 9 항에 있어서,

상기 공간 정보 해독 모듈에서 해독한 공간 정보와 디코딩 장치에 기 설정된 기준 공간 정보를 비교하여 제1 디코럴레이션 모듈 및 제2 디코럴레이션 모듈 중 하나의 모듈을 선택하는 선택 모듈을 더 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 9 항에 있어서,

코어 코덱 비트스트림을 수신하여 다운믹스된 오디오 신호를 생성하는 오디오 디코더를 더 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 11 항에 있어서,

상기 디코럴레이션 모듈에서 디코럴레이션이 수행된 공간 정보와 상기 다운믹스된 오디오 신호를 이용하여 멀티채널을 생성하는 멀티채널 생성기를 더 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 9 항에 있어서,

상기 제2 디코럴레이션 모듈은 인터 채널 코히어런스(inter channel coherence) 조절 모듈인 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 9 항에 있어서,

상기 제2 디코럴레이션 모듈은 FIR 필터 및/또는 IIR 필터를 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 14 항에 있어서,

상기 FIR 필터와 IIR 필터는 시변(time-varying)으로 필터 계수들을 생성하 는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 14 항에 있어서,

상기 FIR 필터와 IIR 필터는 초기 반향음(early reflection)의 시공간 특성 모사를 위해서만 사용하고, 잔향음(reverberation) 모사를 위해서는 사용하지 않는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
공간 정보 비트스트림을 수신하여 공간 정보 및 디코럴레이션 식별자(decorrelation flag)를 해독하는 공간 정보 해독 모듈;

상기 디코럴레이션 식별자(decorrelation flag)에 따라 상기 공간 정보에 대해서 제1 디코럴레이션 모듈 및 제2 디코럴레이션 모듈 중 하나의 모듈을 선택적으로 동작하는 디코럴레이션 모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
제 17 항에 있어서,

상기 공간 정보 해독 모듈에서 해독한 디코럴레이션 식별자(decorrelation flag)에 따라 제1 디코럴레이션 모듈 및 제2 디코럴레이션 모듈 중 하나의 모듈을 선택하는 선택 모듈을 더 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계;

상기 공간 정보 비트스트림에서 공간 정보를 해독하는 단계;

상기 코어 코덱 비트스트림에서 다운믹스된 오디오 신호를 디코딩하는 단계;

상기 다운믹스된 오디오 신호를 분석하여, 상기 공간 정보에 대해서 제1 디코럴레이션 방법 및 제2 디코럴레이션 방법 중 하나의 방법을 선택적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.