KR20110022255A

KR20110022255A - 스테레오 오디오의 부호화, 복호화 방법 및 장치

Info

Publication number: KR20110022255A
Application number: KR1020090079773A
Authority: KR
Inventors: 문한길; 이철우
Original assignee: 삼성전자주식회사
Priority date: 2009-08-27
Filing date: 2009-08-27
Publication date: 2011-03-07
Also published as: US8781134B2; KR101692394B1; US20110051935A1

Abstract

본 발명의 일실시예는 스테레오 오디오를 부호화하는 방법에 관한 것으로, 본 발명의 일실시예는 수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오디오들을 가산하여 생성된 하나의 최초 모노 오디오를 분할하여 제1 최초 분할 오디오 및 제2 최초 분할 오디오를 생성하는 단계; 상기 분할 오디오들 각각에 나머지 입력 오디오들을 상기 분할 오디오들 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오 및 제2 최종 분할 오디오를 생성한 후 상호간에 가산함으로써 최종 모노 오디오를 생성하는 단계; 상기 오디오들 및 상기 분할 오디오들로부터 상기 최종 분할 오디오들을 생성하는 과정에서 상기 나머지 입력 오디오들이 하나씩 가산됨에 따라 생성되는 과도 분할 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함한다.

Description

스테레오 오디오의 부호화, 복호화 방법 및 장치{Method and apparatus for encoding/decoding stereo audio}

본 발명은 스테레오 오디오를 부호화, 복호화하는 방법 및 장치에 관한 것으로 보다 상세히는 스테레오 오디오의 부호화, 복호화 수행에 필요한 부가 정보의 개수를 최소화하여 스테레오 오디오를 파라메트릭 부호화, 복호화하는 방법 및 장치에 관한 것이다.

일반적으로 멀티 채널 오디오를 부호화하는 방법에는 웨이브폼(waveform) 오디오 코딩과 파라메트릭(parametric) 오디오 코딩이 있다. 웨이브폼 부호화에는

MPEG-2 MC 오디오 코딩, AAC MC 오디오 코딩 및 BSAC/AVS MC 오디오 코딩 등이 있다.

파라메트릭 오디오 코딩에서는 오디오 신호를 주파수, 진폭과 같은 성분으로 분해하고 이러한 주파수, 진폭 등에 대한 정보를 파라미터화하여 오디오 신호를 부호화한다. 파라메트릭 오디오 코딩을 이용해 스테레오 오디오를 부호화하는 경우를 예로 들면, 좌채널 오디오와 우채널 오디오를 다운믹스하여 모노 오디오를 생성하고, 생성된 모노 오디오를 부호화한다. 그런 다음, 모노 오디오를 다시 스테레오 오디오로 복원하는데 필요한 채널간 세기 차이(IID: Interchannel Intensity Difference), 채널간 상관도(ID: Interchannel Correlation), 전 위상 차이(OPD: Overall Phase Difference) 및 채널간 위상 차이(IPD: Interchannel Phase Difference)에 대한 파라미터를 부호화한다. 여기서, 파리미터는 부가 정보라고 명명될 수도 있다.

좌채널 오디오와 우채널 오디오의 세기를 결정하기 위한 정보로서 채널간 세

기 차이에 대한 파라미터 및 채널간 상관도에 대한 파라미터가 부호화되고, 좌채널

오디오와 우채널 오디오의 위상을 결정하기 위한 정보로서 전위상 차이에 대한 파

라미터 및 채널간 위상 차이에 대한 파라미터가 부호화된다.

본 발명의 목적은 부호화, 복호화 수행에 필요한 부가 정보의 개수를 최소화

하여 스테레오 오디오를 파라메트릭 부호화, 복호화하는 방법 및 장치를 제공하는

것이다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 오디오 부호화 방법은 수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오디오들을 가산하여 생성된 하나의 최초 모노 오디오를 분할하여 제1 최초 분할 오디오 및 제2 최초 분할 오디오를 생성하는 단계; 상기 분할 오디오들 각각에 나머지 입력 오디오들을 상기 분할 오디오들 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오 및 제2 최종 분할 오디오를 생성한 후 상호간에 가산함으로써 최종 모노 오디오를 생성하는 단계; 상기 오디오들 및 상기 분할 오디오들로부터 상기 최종 분할 오디오들을 생성하는 과정에서 상기 나머지 입력 오디오들이 하나씩 가산됨에 따라 생성되는 과도 분할 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함한다.

바람직하게는 본 발명의 일 실시예에 따른 오디오 부호화 방법은 상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하는 단계; 상기 부호화된 N개의 입력 오디오들을 복호화하는 단계; 및 상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 단계를 더 포함하고, 상기 부호화하는 단계는 상기 차이 값들에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화한다.

바람직하게는 상기 부가 정보들을 부호화하는 단계는 상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각의 세기(intentsity)를 결정하기 위한 정보를 부호화하는 단계; 및 상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각에서 상호간에 가산되는 2개의 오디오들간의 위상 차이에 대한 정보를 부호화하는 단계를 포함한다.

바람직하게는 상기 세기를 결정하기 위한 정보를 부호화하는 단계는 상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각에서 상호간에 가산되는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성하는 단계; 상기 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 제3 벡터를 생성하는 단계; 및 상기 벡터 공간에서 상기 제3 벡터와 상기 제1 벡터 사이의 각도 또는 상기 제3 벡터와 상기 제2 벡터 사이의 각도에 대한 정보를 부호화하는 단계를 포함한다.

바람직하게는 상기 세기를 결정하기 위한 정보를 부호화하는 단계는 상기 제1 최초 분할 오디오의 세기를 결정하기 위한 정보 및 상기 제2 최초 분할 오디오의 세기를 결정하기 위한 정보 중 하나를 택일적으로 부호화한다.

또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 오디오 복호화방법은 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 단계; 상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 단계; 상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에 복수회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들을 생성하는 단계; 및 상기 생성된 과도 복원 오디오들 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들을 상호간에 가산하여 결합 복원 오디오를 생성한 후, 상기 복호화된 부가 정보들에 기초하여 상기 결합 복원 오디오로부터 2개의 최종 복원 오디오들을 생성하는 단계를 포함한다.

바람직하게는 본 발명의 일실시예에 따른 오디오 복호화 방법은 상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 추출하는 단계를 더 포함하고, 상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성된다.

바람직하게는 상기 복호화된 부가 정보들은 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들의 세기를 결정하기 위한 정보들; 및 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 하나의 오디오로부터 복원되어지는 2개의 복원 오디오들 상호간의 위상 차이에 대한 정보들을 포함한다.

바람직하게는 상기 세기를 결정하기 위한 정보들은 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 상기 2개의 다음 복원 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 다음 복원 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 생성된 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 생성된 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보들을 포함한다.

바람직하게는 상기 최초 복원 오디오들을 복원하는 단계는 상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보를 이용하여 상기 2개의 최초 복원 오디오들 중 제1 최초 복원 오디오의 세기 또는 제2 최초 복원 오디오의 세기를 결정하는 단계; 상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제1 최초 복원 오디오의 위상 또는 상기 제2 최초 복원 오디오의 위상을 계산하는 단계; 및 상기 복호화된 모노 오디오의 위상, 상기 제2 최초 복원 오디오의 위상 및 상기 최초 복원 오디오들의 세기를 결정하기 위한 정보에 기초하여 상기 최초 복원 오디오들을 복원하는 단계를 포함한다.

바람직하게는 상기 2개의 최종 과도 복원 오디오들 중 제1 최종 과도 복원 오디오가 하나의 최종 복원 오디오와 함께 J-1번째 과도 복원 오디오로부터 복원되고, 상기 제1 최종 과도 복원 오디오와 동일한 세기 및 위상을 가지는 제2 최종 과도 복원 오디오가 다른 하나의 최종 복원 오디오와 함께 J번째 과도 복원 오디오로부터 복원될 때, 상기 J-1번째 과도 복원 오디오의 위상, 상기 하나의 최종 복원 오디오와 상기 제1 최종 과도 복원 오디오간의 위상 차이 및 상기 제1 최종 과도 복원 오디오의 세기를 결정하기 위한 정보에 기초하여 상기 제1 최종 과도 복원 오디오가 복원되면, 상기 다른 하나의 최종 복원 오디오는 상기 J번째 과도 복원 오디오에서 상기 제1 최종 과도 복원 오디오를 감산함으로써 복원된다.

또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 오디오 부호화 장치는 수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오디오들을 가산하여 생성된 하나의 최초 모노 오디오를 분할하여 제1 최초 분할 오디오 및 제2 최초 분할 오디오를 생성하고, 상기 분할 오디오들 각각에 나머지 입력 오디오들을 상기 분할 오디오들 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오 및 제2 최종 분할 오디오를 생성한 후 상호간에 가산함으로써 최종 모노 오디오를 생성하는 모노 오디오 생성부; 상기 오디오들 및 상기 분할 오디오들로부터 상기 최종 분할 오디오들을 생성하는 과정에서 상기 나머지 입력 오디오들이 하나씩 가산됨에 따라 생성되는 과도 분할 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 부가 정보 생성부; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 부호화부를 포함한다.

바람직하게는 상기 모노 오디오 생성부는 상기 입력 오디오들, 상기 최초 분 할 오디오들, 상기 과도 모노 오디오들 및 상기 최종 분할 오디오들 각각에서 입력되는 2개의 오디오들을 가산하는 복수 개의 다운 믹스부를 포함한다.

바람직하게는 본 발명의 일실시예에 따른 오디오 부호화 장치는 상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하고, 상기 부호화된 N개의 입력 오디오들을 복호화한 후, 상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 차이 값 정보 생성부를 더 포함하고, 상기 부호화하는 단계는 상기 차이 값들에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화한다.

또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 복호화 장치는 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 추출부; 상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 복호화부; 상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에 복수회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들을 생성하고, 상기 생성된 과도 복원 오디오들 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들을 상호간에 가산하여 결합 복원 오디오를 생성한 후, 상기 복호화된 부가 정보들에 기초하여 상기 결합 복원 오디오로부터 2개의 최종 복원 오디오들을 생성하는 오디오 복원부를 포함한다.

바람직하게는 상기 오디오 복원부는 상기 부가 정보들에 기초하여, 상기 복호화된 모노 오디오, 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 각각에서 하나의 오디오로부터 2개의 복원 오디오들을 생성하는 복수개의 업 믹스부를 포함한다.

또한, 본 발명의 일실시예는 상기 목적을 달성하기 위하여 수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오디오들을 가산하여 생성된 하나의 최초 모노 오디오를 분할하여 제1 최초 분할 오디오 및 제2 최초 분할 오디오를 생성하는 단계; 상기 분할 오디오들 각각에 나머지 입력 오디오들을 상기 분할 오디오들 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오 및 제2 최종 분할 오디오를 생성한 후 상호간에 가산함으로써 최종 모노 오디오를 생성하는 단계; 상기 오디오들 및 상기 분할 오디오들로부터 상기 최종 분할 오디오들을 생성하는 과정에서 상기 나머지 입력 오디오들이 하나씩 가산됨에 따라 생성되는 과도 분할 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및 상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함하는 오디오 부호화 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

또한, 본 발명의 다른 실시예는 상기 목적을 달성하기 위하여 수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 단계; 상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 단계; 상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에 복수회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들을 생성하는 단계; 및 상기 생성된 과도 복원 오디오들 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들을 상호간에 가산하여 결합 복원 오디오를 생성한 후, 상기 복호화된 부가 정보들에 기초하여 상기 결합 복원 오디오로부터 2개의 최종 복원 오디오들을 생성하는 단계를 포함하는 오디오 복호화 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다.

도 1은 본 발명에 따른 오디오 부호화 장치의 일실시예를 설명하기 위하여 도시한 도면이다.

도 1을 참조하면, 본 발명의 일실시예에 따른 오디오 부호화 장치는 모노 오디오 생성부(110), 부가 정보 생성부(120) 및 부호화부(120)를 포함한다.

모노 오디오 생성부(110)는 수신되는 N개의 입력 오디오들(Ic1, Ic2, I3 내지 In) 중에서 중앙에 위치하는 제1 중앙 입력 오디오(a first center input audio:Ic1) 및 제2 중앙 입력 오디오(a second center input audio:Ic2)를 가산하여 생성된 하나의 최초 모노 오디오(Beginning Mono Audio:BM)를 분할하여 제1 최 초 분할 오디오(a first beginning divided audio:BD1) 및 제2 최초 분할 오디오(a second beginning divided audio:BD2)를 생성하고, 그 분할 오디오들(BD1, BD2) 각각에 나머지 입력 오디오들(I3 내지 In)을 그 분할 오디오들(BD1, BD2) 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오(a first final divided audio:FD1) 및 제2 최종 분할 오디오(a second final divided audio:FD2)를 생성한 후 상호간에 가산함으로써 최종 모노 오디오(final mono audio:FM)를 생성한다.

이때, 모노 오디오 생성부(110)는 분할 오디오들(BD1, BD2)로부터 최종 모노 오디오(FM)를 생성하는 과정에서 복수개의 과도 분할 오디오들(transient divided audios:TD)을 생성하게 된다.

또한, 도 1에 도시된 것과 같이 모노 오디오 생성부(110)는 입력 오디오들(Ic1, Ic2, I3 내지 In), 최초 분할 오디오들(BD1, BD2), 과도 분할 오디오들(TD1 내지 TDm) 및 최종 분할 오디오들(FD1, FD2) 각각에서 입력되는 2개의 오디오들을 가산하는 복수 개의 다운 믹스부를 포함하고, 이와 같은 복수개의 다운 믹스부들을 통하여 최종 모노 오디오(FM)를 생성하게 된다.

예컨대, 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)를 입력받은 다운 믹스부는 그 입력된 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)를 가산하여 최초 모노 오디오(BM)를 생성한다. 이때, 후속하는 2개의 다운 믹스부들에 입력될 오디오의 개수가 3개로서 홀수이므로, 최초 모노 오디오를 생성한 다운 믹스부는 그 생성한 최초 모노 오디오(BM)를 분할하여 제1 최초 분할 오디오(BD1) 및 제2 최초 분할 오디오(BD2)를 생성한다. 이를 통하여 후속하는 다운 믹 스부들에게는 2개씩의 오디오들이 입력된다.

이와 같이 제1 최초 분할 오디오(BD1) 및 제2 최초 분할 오디오(BD2)가 생성되면, 제1 최초 분할 오디오(BD1)가 입력된 다운 믹스부는 나머지 입력 오디오들(I3 내지 In) 중에서 제1 중앙 입력 오디오(Ic1)와 가장 인접한 입력 오디오인 제3 입력 오디오(I3)를 제1 최초 분할 오디오(BD1)와 가산하여 제1 과도 분할 오디오(TD1)를 생성하고, 제2 최초 분할 오디오(BD2)가 입력된 다운 믹스부는 나머지 입력 오디오들(I3 내지 In) 중에서 제2 중앙 입력 오디오(Ic2)와 가장 인접한 입력 오디오인 제4 입력 오디오(I4)를 제2 최초 분할 오디오(BD2)와 가산하여 제2 과도 분할 오디오(TD2)를 생성한다.

즉, 본원 발명의 다운 믹스부는 이전 다운 믹스부에 의하여 생성된 오디오를 하나의 입력으로서 입력받고, 입력 오디오들(I3 내지 In) 중 하나를 또 다른 입력으로서 입력받은 후 그 2개의 입력을 상호간에 가산하는 방식으로 동작을 수행한다.

이때, 다운 믹스부들은 입력되는 2개의 오디오들을 가산할 때 2개의 오디오들을 그대로 가산하지 않고, 2개의 오디오들 중 하나의 오디오의 위상을 다른 하나의 오디오의 위상과 동일하게 조절한 후에 가산할 수 있다. 예컨대, 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)를 가산할 때, 제2 중앙 입력 오디오(Ic2)의 위상을 제1 중앙 입력 오디오(Ic1)의 위상과 동일하게 조절한 후에, 그와 같이 위상이 조절된 제2 중앙 입력 오디오(Ic2)를 제1 중앙 입력 오디오(Ic1)와 가산할 수 있다. 이에 대한 구체적인 내용은 후술한다.

한편, 본 실시예에서는 모노 오디오 생성부(110)에 입력되는 입력 오디오들(Ic1, Ic2, I3 내지 In)이 디지털 신호인 것으로 가정하였으나, 다른 실시예에서는 입력 오디오들(Ic1, Ic2, I3 내지 In)이 아날로그 신호인 경우에는 모노 오디오 생성부(110)에 입력되기 전에, N개 채널의 입력 오디오들(Ic1, Ic2, I3 내지 In)에 대하여 샘플링 및 양자화를 수행하여 디지털 신호로 변환하는 과정이 더 수행될 수 있다.

부가 정보 생성부(120)는 중앙 입력 오디오들(Ic1, Ic2), 하나씩 가산되는 나머지 입력 오디오들(I3 내지 In), 최초 분할 오디오들(BD1, BD2), 과도 분할 오디오들(TD1 내지 TDm) 및 최종 분할 오디오들(FD1, FD2) 각각을 복원하기 위해 필요한 부가 정보들을 생성한다.

이때, 부가 정보 생성부(120)는 모노 오디오 생성부(110)에 포함된 다운 믹스부들이 입력되는 2개의 오디오들을 가산할 때마다, 그 가산에 의하여 생성된 오디오로부터 그 2개의 오디오들을 복원하기 위하여 필요한 부가 정보들을 생성하게 된다. 다만, 도 1에서는 설명의 편의를 위하여 각각의 다운 믹스부로부터 부가 정보 생성부(120)에 입력되는 부가 정보들은 도시하지 않았다.

이때, 부가 정보들은 중앙 입력 오디오들(Ic1, Ic2), 하나씩 가산되는 나머지 입력 오디오들(I3 내지 In), 최초 분할 오디오들(BD1, BD2), 과도 분할 오디오들(TD1 내지 TDm) 및 최종 분할 오디오들(FD1, FD2) 각각의 세기(intentsity)를 결정하기 위한 정보와 그 오디오들 각각에서 상호간에 가산되는 2개의 오디오들간의 위상 차이에 대한 정보를 포함한다.

한편, 다른 실시예에서는 다운 믹스부들 각각에 부가 정보 생성부(120)가 탑재되어, 다운 믹스부들이 인접하는 2개의 오디오들을 가산함과 동시에 그 2개의 오디오들에 대한 부가 정보들을 생성할 수도 있다.

부가 정보 생성부(120)가 부가 정보들을 생성하는 방법에 대해서는 도 2 내지 도 4를 참조하여 상세히 설명한다.

부호화부(130)는 모노 오디오 생성부(110)를 통하여 생성된 최종 모노 오디오(FM)와 부가 정보 생성부(120)를 통하여 생성된 부가 정보들을 부호화한다.

이때, 최종 모노 오디오(FM)와 부가 정보들을 부호화하는 방법에는 제한이 없으며, 모노 오디오 및 부가 정보를 부호화하는데 사용되는 일반적인 부호화 방법에 의해 부호화할 수 있다.

한편, 다른 실시예에서는 본 발명의 일실시예에 따른 오디오 부호화 장치는 N개의 입력 오디오들(Ic1, Ic2, I3 내지 In)을 부호화하고, 그 부호화된 N개의 입력 오디오들(Ic1, Ic2, I3 내지 In)을 복호화한 후에 그 복호화된 N개의 입력 오디오들(Ic1, Ic2, I3 내지 In)과 수신되는 N개의 원본 입력 오디오들(Ic1, Ic2, I3 내지 In)의 차이 값들에 대한 정보를 생성하는 차이 값 정보 생성부(미도시)를 더 포함할 수 있다.

이와 같이 본 발명의 일실시예에 따른 오디오 부호화 장치가 차이 값 정보 생성부를 더 포함하는 경우에는, 부호화부(130)는 최종 모노 오디오(FM), 부가 정보들과 함께 차이 값 정보를 부호화할 수 있다. 이와 같은 차이 값 정보는 본 발명의 일실시예에 따른 오디오 부호화 장치에 의하여 생성된 부호화된 모노 오디오가 복호화되면, 그 복호화된 모노 오디오에 가산됨으로써 N개의 원본 입력 오디오들(Ic1, Ic2, I3 내지 In)에 보다 가까운 오디오들을 생성할 수 있게 해준다.

한편, 또 다른 실시예에서는 본 발명의 일실시예에 따른 오디오 부호화 장치는 부호화부(130)를 통하여 부호화된 최종 모노 오디오(FM)와 부가 정보들을 다중화하여 최종 비트 스트림을 생성하는 다중화부(미도시)를 더 포함할 수 있다.

이하에서는 부가 정보들을 생성하는 방법 및 그와 같이 생성된 부가 정보를 부호화하는 방법에 대하여 상세히 설명한다. 다만, 설명의 편의를 위하여 모노 오디오 생성부(110)에 포함된 다운 믹스부가 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)를 입력받아 최초 모노 오디오(BM)를 생성하는 과정에서 생성되는 부가 정보들에 대해서 설명하도록 한다. 또한, 이하에서는 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보를 생성하는 경우와 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보를 생성하는 경우에 대하여 나누어 설명하도록 한다.

(1) 세기를 결정하기 위한 정보

파라메트릭 오디오 코딩에서는 각각의 채널 오디오를 주파수 도메인으로 변

환하여 주파수 도메인에서 채널 오디오 각각의 세기 및 위상에 대한 정보를 부호화한다. 도 2를 참조하여 상세히 설명한다.

도 2는 파라메트릭 오디오 코딩에서의 서브 밴드들을 도시한다.

도 2는 오디오 신호를 주파수 도메인으로 변환한 주파수 스펙트럼을 도시한

다. 오디오 신호를 고속 퓨리에 변환(Fast Fourier Transform)하면, 오디오 신호

는 주파수 도메인에서 이산(discrete)된 값들에 의해 표현될 수 있다. 즉, 오디오

신호는 복수의 정현파들의 합으로 표현될 수 있다.

파라메트릭 오디오 코딩에서는 오디오 신호가 주파수 도메인으로 변환되면,

주파수 도메인을 복수의 서브 밴드들로 분할하고, 각각의 서브 밴드들에서의 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보 및 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보를 부호화한다. 이때, 서브 밴드 k에서의 세기 및 위상에 대한 부가 정보들을 부호화한 후에, 마찬가지로 서브 밴드 k+1에서의 세기 및 위상에 대한 부가 정보들을 부호화한다. 파라메트릭 오디오 코딩에서는 이와 같은 방식으로 전체 주파수 밴드를 복수의 서브 밴드들로 분할하고, 각각의 서브 밴드에 대하여 스테레오 오디오 부가 정보를 부호화한다.

이하에서는 N개 채널의 입력 오디오를 가진 스테레오 오디오의 부호화, 복호화와 관련하여 소정의 주파수 밴드 즉, 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)에 대한 부가 정보를 부호화하는 경우를 예로 들어 설명한다.

종래 기술에 따르면 파라메트릭 오디오 코딩에서 스테레오 오디오에 대한 부가 정보들을 부호화할 때에는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 정보로서 채널간 세기 차이(IID: Interchannel Intensity Difference) 및 채널간 상관도(IC: Interchannel Correlation)에 대한 정보를 부호화한다.

이때, 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 세기 및 제2 중앙 입력 오디오(Ic2)의 세기를 각각 계산하고, 제1 중앙 입력 오디오(Ic1)의 세기와 제2 중앙 입력 오디오(Ic2)의 세기 사이의 비율을 채널간 세기 차이(IID)에 대한 정보로서 부호화한다. 그러나 두 채널 오디오의 세기 사이의 비율만으로는 복호화하는 측에서 제1 중앙 입력 오디오(Ic1)의 세기 및 제2 중앙 입력 오디오(Ic2)의 세기를 결정할 수 없으므로, 부가 정보로써 채널간 상관도(IC)에 대한 정보도 함께 부호화하여 비트스트림에 삽입한다.

본 발명의 일실시예에 따른 오디오 부호화 방법은 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보로서 부호화되는 부가 정보들의 개수를 최소화하기 위하여 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 세기에 대한 벡터 및 제2 중앙 입력 오디오(Ic2)의 세기에 대한 벡터를 이용한다. 여기서 제1 중앙 입력 오디오(Ic1)를 주파수 도메인으로 변환한 주파수 스펙트럼에서 주파수 f1, f2, ... , fn에서 세기들의 평균값이 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 세기이고, 후술하는 벡터 Ic1의 크기이다.

마찬가지로, 제2 중앙 입력 오디오(Ic2)를 주파수 도메인으로 변환한 주파수 스펙트럼의 주파수 f1, f2, ... , fn에서 세기들의 평균값이 서브 밴드 k에서 제2 중앙 입력 오디오(Ic2)의 세기이고, 후술하는 벡터 Ic2의 크기이다. 도 3a 및 3b를 참조하여 상세히 설명한다.

도 3a는 본 발명에 따라 제1 중앙 입력 오디오 및 제2 중앙 입력 오디오의 세기에 대한 정보를 생성하는 방법의 일실시예를 설명하기 위하여 도시한 도면이 다.

도 3a를 참조하면, 본 발명의 일실시예에 따른 부가 정보 생성부(120)는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 세기에 대한 벡터인 Ic1 벡터와 제2 중앙 입력 오디오(Ic2)의 세기에 대한 벡터인 Ic2 벡터가 소정의 각도를 이루도록 2차원 벡터 공간을 생성한다. 만일, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)가 좌측 오디오 및 우측 오디오라고 가정하면, 스테레오 오디오의 청취자가 좌측 음원 방향과 우측 음원 방향이 60도의 각도를 이루는 위치에서 스테레오 오디오를 청취하는 것을 가정하고 스테레오 오디오를 부호화하는 것이 일반적이므로, 2차원 벡터 공간에서 Ic1 벡터와 Ic2 벡터 사이의 각도(θ0)를 60 도로 설정할 수 있다. 하지만, 본 실시예에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)는 좌측 오디오 및 우측 오디오가 아니므로, Ic1 벡터와 Ic2 벡터는 임의의 각도(θ0)를 가질 것이다.

도 3a에서는 Ic1 벡터와 Ic2 벡터가 가산되어 생성된 최초 모노 오디오(BM)의 세기에 대한 벡터인 BM 벡터가 도시되어 있다. 이때, 전술한 바와 같이 만일 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)가 각각 좌측 오디오와 우측 오디오에 대응된다면, 좌측 음원 방향과 우측 음원 방향이 60도의 각도를 이루는 위치에서 스테레오 오디오를 청취하는 청취자는 BM 벡터의 방향으로 BM 벡터의 크기에 해당하는 세기의 모노 오디오를 청취하게 된다.

본 발명의 일실시예에 따른 부가 정보 생성부(120)는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보 로써 채널간 세기 차이(IID)에 대한 정보와 채널간 상관도(IC)에 대한 정보 대신에 BM 벡터와 Ic1 벡터 사이의 각도(θq) 또는 BM 벡터와 Ic2 벡터 사이의 각도(θp)에 대한 정보를 생성한다.

또한, 부가 정보 생성부(120)는 BM 벡터와 Ic1 벡터 사이의 각도(θq) 또는 BM 벡터와 Ic2 벡터 사이의 각도(θp)를 생성하는 대신에 cos θq 또는 cos θp와 같이 코사인 값을 생성할 수 있다. 이는, 각도에 대한 정보를 생성하고 그 생성된 각도에 대한 정보를 부호화하려면, 양자화 과정을 거쳐야 하는데 양자화 과정에서 발생하는 손실을 최소화하기 위해 각도의 코사인 값을 생성하여 부호화하기 위한 것이다.

도 3b는 본 발명에 따른 제1 중앙 입력 오디오 및 제2 중앙 입력 오디오의 세기에 대한 정보를 생성하는 방법의 제2 실시예를 설명하기 위하여 도시한 도면이다.

도 3b는 도 3a에서의 벡터 각도를 정규화하는 과정을 도시한 도면이다.

도 3a에서와 같이 Ic1 벡터와 Ic2 벡터 사이의 각도(θ0)가 90 도가 아닌 경우 θ0을 90 도로 정규화할 수 있고, 이때 θp 또는 θq도 정규화된다. 도 3b에서 BM 벡터와 Ic2 벡터 사이의 각도(θp)에 대한 정보를 정규화해서 나타내면, θ0이 90 도로 정규화되면 이에 대응하여 θp도 정규화되어 θm=(θp×90)/θ0가 계산된다. 부가 정보 생성부(120)는 정규화되지 않은 θp 또는 정규화된 θm을 제1 중앙 입력 오디오(Ic1)의 세기 및 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보로서 생성할 수 있다. 또한, 부가 정보 생성부(120)는 θp 또는 θm 대신에, cos θp 또는 cos θm을 제1 중앙 입력 오디오(Ic1)의 세기 및 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보로서 생성할 수 있다.

(2) 위상을 결정하기 위한 정보

종래 기술에 따르면 파라메트릭 오디오 코딩에서는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보로서 전 위상 차이(OPD: Overall Phase Difference) 및 채널간 위상 차이(Interchannel Phase Difference)에 대한 정보를 부호화한다.

즉, 종래에는 도 2에 도시된 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)를 가산하여 생성된 최초 모노 오디오(BM)와 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 위상 차이를 계산하여 전 위상 차이에 대한 정보를 생성하여 부호화하고, 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상 차이를 계산하여 채널간 위상 차이에 대한 정보를 생성하고 부호화하였다. 위상 차이는 서브 밴드에 포함된 주파수 f1, f2, ... , fn 에서의 위상 차이들을 각각 계산한 후에 계산된 위상 차이들의 평균을 계산함으로써 구할 수 있다.

그러나, 본 발명의 일실시예에 따른 오디오 부호화 방법에서 부가 정보 생성부(120)는 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보로서 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2) 사이의 위상 차이에 대한 정보만을 생성한다.

본 발명의 일실시예에서는 다운믹스부가 제1 중앙 입력 오디오(Ic1)의 위상 과 동일해지도록 제2 중앙 입력 오디오(Ic2)의 위상을 조절하여 위상 조절된 제2 중앙 입력 오디오(Ic2)를 생성하고, 그 위상 조절된 제2 중앙 입력 오디오(Ic2)를 제1 중앙 입력 오디오(Ic1)와 가산하기 때문에, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2) 사이의 위상 차이에 대한 정보만 가지고도 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2) 각각의 위상을 계산할 수 있게 된다.

서브 밴드 k의 오디오를 예로 들어 설명하면, 주파수 f1, f2, ... , fn에서 제2 중앙 입력 오디오(Ic2)의 위상을 주파수 f1, f2, ... , fn에서 제1 중앙 입력 오디오(Ic1)의 위상과 동일해지도록 각각 조절한다. 주파수 f1에서 제1 중앙 입력 오디오(Ic1)의 위상을 조절하는 경우를 예로 들어 설명하면, 주파수 f1에서 제1 중앙 입력 오디오(Ic1)가 |Ic1|e^{i(2πf1t+θ1)}로 표시되고, 제2 중앙 입력 오디오(Ic2)가 |Ic2|e^{i(2πf1t+θ2)}로 표시되면, 주파수 f1에서 위상 조절된 제2 중앙 입력 오디오(Ic2')는 다음 수학식 1에 의해 구해질 수 있다. 여기서, θ1은 주파수 f1에서 제1 중앙 입력 오디오(Ic1)의 위상이고, θ2는 주파수 f1에서 제2 중앙 입력 오디오(Ic2)의 위상이다.

Ic2' = Ic2×e^i(θ1-θ2) = |Ic2|e^{i(2πf1t+θ1)}

수학식 1에 의해 주파수 f1에서 제2 중앙 입력 오디오(Ic2)는 위상이 조절되어 제1 중앙 입력 오디오(Ic1)의 위상과 동일해진다. 이와 같은 위상 조절은 서브 밴드 k의 다른 주파수들 즉, f2, f3, ... , fn에서 제2 중앙 입력 오디오(Ic2)에 대해 반복하여 서브 밴드 k에서 위상 조절된 제2 중앙 입력 오디오(Ic2)를 생성한다.

서브 밴드 k에서 위상 조절된 제2 중앙 입력 오디오(Ic2)는 제1 중앙 입력 오디오(Ic1)의 위상과 동일하므로, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상 차이만 부호화하면 최초 모노 오디오(BM₁)를 복호화하는 측에서 제2 중앙 입력 오디오(Ic2)의 위상을 구할 수 있다. 또한, 제1 중앙 입력 오디오(Ic1)의 위상과 다운믹스부에서 생성된 최초 모노 오디오(BM)의 위상은 동일하므로, 별도로 제1 중앙 입력 오디오(Ic1)의 위상에 대한 정보를 부호화할 필요가 없다.

따라서, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상 차이에 대한 정보만을 부호화하면, 복호화하는 측에서는 그 부호화된 정보를 이용하여 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 계산할 수 있게 된다.

한편, 전술한 서브 밴드 k에서 채널 오디오들의 세기 벡터를 이용해 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보를 부호화하는 방법과, 위상 조절을 이용해 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보를 부호화하는 방법은 각각 독립적으로 이용될 수도 있고 조합되어 이용될 수 있다. 다시 말해, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보는 본 발명에 따라 벡터를 이용해 부호화하고, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보는 종래 기술과 같이 전 위상 차이(OPD: Overall Phase Difference) 및 채널간 위상 차이(Interchannel Phase Difference)를 부호화할 수 있다. 반대로, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보는 종래 기술에 따라 채널간 세기 차이(IID: Interchannel Intensity Difference) 및 채널간 상관도(IC: Interchannel Correlation)를 이용해 부호화하고, 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보만 본 발명과 같이 위상 조절을 이용해 부호화할 수도 있다. 물론, 본 발명에 따른 두 가지 방법을 모두 사용하여 부가 정보들을 부호화할 수도 있다.

도 4는 본 발명에 따라 부가 정보들을 부호화하는 방법에 대한 일실시예를 설명하기 위하여 도시한 흐름도이다.

도 4는 본 발명에 따라 소정의 주파수 밴드 즉, 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)의 세기 및 위상에 대한 정보를 부호화하는 방법을 설명한다.

단계 410에서, 부가 정보 생성부(120)는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 세기에 대한 제1 벡터 및 제2 중앙 입력 오디오(Ic2)의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성한다.

부가 정보 생성부(120)는 서브 밴드 k에서의 제1 중앙 입력 오디오(Ic1)의 세기 및 제2 중앙 입력 오디오(Ic2)의 세기에 기초하여 도 3a에 도시된 벡터 공간 을 생성한다.

단계 420에서, 부가 정보 생성부(120)는 단계 410에서 생성된 벡터 공간에서 제1 벡터와 제2 벡터를 가산하여 생성된 최초 모노 오디오(BM)의 세기에 대한 벡터인 제3 벡터와 제1 벡터 사이의 각도 또는 제3 벡터와 제2 벡터 사이의 각도에 대한 정보를 생성한다.

여기서, 각도에 대한 정보는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보이다. 또한, 각도에 대한 정보는 각도 자체가 아닌 각도의 코사인 값에 대한 정보일 수 있다.

이때, 최초 모노 오디오(BM)는 제1 중앙 입력 오디오(Ic1)와 원본 제2 중앙 입력 오디오(Ic2)를 가산한 오디오일 수도 있고, 제1 중앙 입력 오디오(Ic1)와 위상 조절된 제2 중앙 입력 오디오(Ic2)를 가산한 오디오일 수도 있다. 여기서 위상 조절된 제2 중앙 입력 오디오(Ic2)의 위상은 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)의 위상과 동일하다.

단계 430에서, 부호화부(130)는 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2) 사이의 위상 차이에 대한 정보를 생성한다.

단계 440에서는, 부호화부(130)는 제3 벡터와 제1 벡터 사이의 각도 또는 제3 벡터와 제2 벡터 사이의 각도에 대한 정보와 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2) 사이의 위상 차이에 대한 정보를 부호화한다.

지금까지 도 2 내지 도 4에서 설명한 부가 정보 생성 방법 및 부호화 방법은, 도 1에 도시된 입력 오디오들(Ic1, Ic2, I3 내지 In), 최초 분할 오디오 들(BD1, BD2), 과도 분할 오디오들(TD1 내지 TDm) 및 최종 분할 오디오들(FD1, FD2) 각각에서 상호간에 가산되는 2개의 오디오들을 복원하기 위한 부가 정보들을 생성할 때 동일하게 적용될 수 있다.

도 5는 본 발명에 따른 오디오 부호화 방법의 일실시예를 설명하기 위하여 도시한 흐름도이다.

단계 510에서는, 수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오디오들(Ic1, Ic2)을 가산하여 생성된 하나의 최초 모노 오디오(BM)를 분할하여 제1 최초 분할 오디오(BD1) 및 제2 최초 분할 오디오(BD2)를 생성한다.

단계 520에서는, 그 분할 오디오들(BD1, BD2) 각각에 나머지 입력 오디오들(I3 내지 In)을 그 분할 오디오들(BD1, BD2) 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오(FD1) 및 제2 최종 분할 오디오(FD2)를 생성한 후 상호간에 가산함으로써 최종 모노 오디오(FM)를 생성한다.

단계 530에서는, 그 중앙 입력 오디오들(Ic1, Ic2), 하나씩 가산되는 나머지 입력 오디오들(I3 내지 In), 최초 분할 오디오들(BD1, BD2), 과도 분할 오디오들(TD1 내지 TDm) 및 최종 분할 오디오들(FD1, FD2) 각각을 복원하기 위해 필요한 부가 정보들을 생성한다.

이때, 나머지 입력 오디오들(I3 내지 In)은 전체 입력 오디오들(Ic1, Ic2, I3 내지 In) 중에서 중앙 입력 오디오들(Ic1, Ic2)을 제외한 입력 오디오들을 말한다.

단계 540에서는, 최종 모노 오디오(FM)와 부가 정보들을 부호화한다.

도 6은 본 발명에 따른 오디오 복호화 장치의 일실시예를 설명하기 위하여 도시한 도면이다.

도 6을 참조하면, 본 발명의 일실시예에 따른 오디오 복호화 장치는 추출부(610), 복호화부(620) 및 오디오 복원부(630)를 포함한다.

추출부(610)는 수신된 오디오 데이터로부터 부호화된 모노 오디오(Encoded Mono Audio:EM)와 부호화된 부가 정보들(Encoded Side Information:ES)을 추출한다. 이때, 추출부(610)는 역다중화부로 명명될 수도 있다.

다만, 다른 실시예에서는 오디오 데이터 대신 부호화된 모노 오디오(EM) 및 부호화된 부가 정보들(ES)이 수신될 수 있는데, 이 경우에는 추출부(610)가 생략될 수 있다.

복호화부(620)는 추출부(610)를 통하여 추출된 부호화된 모노 오디오(EM)와 부호화된 부가 정보들(ES)을 복호화한다.

오디오 복원부(630)는 복호화된 모노 오디오(DM)로부터 2개의 최초 복원 오디오들(Beginning Restored Audio:BR)을 복원하고, 그 2개의 최초 복원 오디오들(BR1, BR2) 각각에 복수회에 걸쳐 그 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들(I3 내지 In)을 생성하고, 그 생성된 과도 복원 오디오들(Transient Restored Audio:TR) 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들(FR1,FR2)을 상호간에 가산하여 결합 복원 오 디오(Combination Restored Audio:CR)를 생성한 후, 그 복호화된 부가 정보들에 기초하여 그 결합 복원 오디오(CR)로부터 2개의 최종 복원 오디오들(Ic1, Ic2)을 생성한다.

또한, 도 6에 도시된 것과 같이 오디오 복원부(630)는 최초 복원 오디오들(BR1, BR2) 및 과도 복원 오디오들(TR1 내지 TRj) 각각에서 하나의 오디오로부터 2개의 복원 오디오들을 생성하는 복수개의 업 믹스부를 포함하고, 이와 같은 복수개의 업 믹스부들을 통하여 최종 복원 오디오들(Ic1, Ic2, I3 내지 In)을 생성하게 된다.

도 6에서는 복호화부(620)를 통하여 복호화된 부가 정보들(DS)이 오디오 복원부(630)에 포함된 모든 업 믹스부에 전송되지만, 설명의 편의를 위하여 각각의 업믹스부에 전송되는 복호화된 부가 정보들(DS)에 대해서는 도시하지 않았다. 한편, 다른 실시예에서 추출부(610)가 오디오 데이터로부터 N개의 최종 복원 오디오들(Ic1, Ic2, I3 내지 In)을 통해 복원하고자 하는 N개의 원본 오디오들(Ic1, Ic2, I3 내지 In)에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들(Ic1, Ic2, I3 내지 In)과 그 N개의 원본 오디오들(Ic1, Ic2, I3 내지 In)간의 차이 값들에 대한 정보를 더 추출한 경우에는, 복호화부(620)를 통하여 그 차이 값들에 대한 정보를 복호화한 후에, 그 복호화된 차이 값들에 대한 정보를 오디오 복원부(630)를 통하여 생성된 최종 복원 오디오들(Ic1, Ic2, I3 내지 In) 각각에 가산할 수 있다. 이를 통하여, 보다 N개의 원본 입력 오디오들(Ic1, Ic2, I3 내지 In)에 가까운 오디오를 얻을 수 있게 된다.

이하에서는 보다 구체적으로 업 믹스부의 동작을 설명한다. 다만, 설명의 편의를 위하여 결합 복원 오디오(CR)를 입력받아 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)를 최종 복원 오디오들로서 복원하는 업 믹스부의 동작에 대하여 설명하도록 한다.

도 3a에 도시된 벡터 공간을 예로 들어 설명하면, 업 믹스부는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보로서 결합 복원 오디오(CR)의 세기에 대한 벡터인 벡터 BM과 제1 중앙 입력 오디오(Ic1)의 세기에 대한 벡터인 Ic1 벡터가 이루는 각도 또는 벡터 BM과 제2 중앙 입력 오디오(Ic2)의 세기에 대한 벡터인 Ic2 벡터가 이루는 각도에 대한 정보를 이용한다. 바람직하게는 BM 벡터와 Ic1 벡터 사이의 각도의 코사인 값 또는 BM 벡터와 Ic2 벡터 사이의 각도의 코사인 값에 대한 정보를 이용할 수 있다.

도 3b의 예에서는 Ic1 벡터와 Ic2 벡터 사이의 각도(θ0)가 60도라고 가정하면 제1 중앙 입력 오디오(Ic1)의 세기 즉, Ic1 벡터의 크기는 |Ic1|=|BM|×sin θm/cos(π/12)에 의해 계산될 수 있다. 마찬가지로 Ic1 벡터와 Ic2 벡터 사이의 각도(θ0)가 60도라고 가정하면 제2 중앙 입력 오디오(Ic2)의 세기 즉, Ic2 벡터의 크기는 |Ic2|=|BM|×cos θm/cos(π/12)에 의해 계산될 수 있음은 당업자에게 자명하다. 여기서, |BM|은 결합 복원 오디오(CR)의 세기 즉, BM 벡터의 크기이고, Ic1 벡터와 Ic1' 벡터간의 각도(θn) 및 Ic2 벡터와 Ic2' 벡터간의 각도(θn)는 15도 이다.

또한, 업 믹스부는 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보로서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상 차이에 대한 정보를 이용할 수 있다. 결합 복원 오디오(CR)를 부호화할 때에 제1 중앙 입력 오디오(Ic1)의 위상과 동일해지도록 제2 중앙 입력 오디오(Ic2)의 위상을 이미 조절한 경우에는 업 믹스부가 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상 차이에 대한 정보만을 이용해서 제1 중앙 입력 오디오(Ic1)의 위상 및 제2 중앙 입력 오디오(Ic2)의 위상을 계산할 수 있다.

한편, 전술한 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 세기를 결정하기 위한 정보를 벡터를 이용해 복호화하는 방법과, 서브 밴드 k에서 제1 중앙 입력 오디오(Ic1)와 제2 중앙 입력 오디오(Ic2)의 위상을 결정하기 위한 정보를 위상 조절을 이용해 복호화하는 방법은 각각 독립적으로 이용될 수도 있고 조합되어 함께 이용될 수도 있다.

도 7은 본 발명에 따른 오디오 복호화 방법의 일실시예를 설명하기 위하여 도시한 흐름도이다.

단계 710에서, 수신된 오디오 데이터로부터 부호화된 모노 오디오(EM)와 부호화된 부가 정보들(ES)을 추출한다.

단계 720에서, 추출된 부호화된 모노 오디오(EM)와 부호화된 부가 정보들(ES)을 복호화한다.

단계 730에서, 그 복호화된 부가 정보들(DS)에 기초하여, 그 복호화된 모노 오디오(DM)로부터 2개의 최초 복원 오디오들(BR1, BR2)을 복원하고, 그 2개의 최초 복원 오디오들(BR1, BR2) 각각에 복수회에 걸쳐 그 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들(I3 내지 In)을 생성한다.

단계 740에서는, 그 생성된 과도 복원 오디오들(TR1 내지 TRj) 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들(FR1, FR2)을 상호간에 가산하여 결합 복원 오디오(CR)를 생성한 후, 복호화된 부가 정보들(DS)에 기초하여 그 결합 복원 오디오(CR)로부터 2개의 최종 복원 오디오들(Ic1, Ic2)을 생성한다.

도 8은 본 발명의 일실시예에 따른 오디오 부호화 방법을 5.1채널 스테레오 오디오에 적용한 경우에 대한 실시예이다.

도 8을 참조하면, 입력 오디오들은 좌채널 전방 오디오(L), 좌채널 후방 오디오(Ls), 중앙 오디오(C), 서브 우퍼 오디오(Sw), 우채널 전방 오디오(R) 및 우채널 후방 오디오(Rs)로 구성된다. 이때, 중앙 오디오(C) 및 서브 우퍼 오디오(Sw)가 전술한 제1 중앙 입력 오디오(Ic1) 및 제2 중앙 입력 오디오(Ic2)에 대응된다.

모노 오디오 생성부(810)의 동작은 다음과 같다.

제1 다운 믹스부(811)는 C와 Sw를 가산하여 CSw를 생성한다. 다음으로, 제1 다운 믹스부(811)는 CSw를 Cl과 Cr로 분할하여 제2 다운 믹스부(812)와 제3 다운 믹스부(813)에 입력한다. 이때, Cl과 Cr은 CSw의 크기에 0.5를 곱한 크기를 가지게 된다. 하지만, Cl과 Cr의 크기는 이에 한정되지 않고 다른 값으로 결정될 수 있다.

이때, 제1 다운 믹스부(811)를 포함하는 다운 믹스부들들(811 내지 816)은 입력되는 2개의 오디오들을 가산할 때, 2개의 오디오들의 위상이 동일해지도록 위상을 조절한 후에 가산할 수 있다.

제2 다운 믹스부(812)는 Cl과 Ls를 가산하여 LV1을 생성하고, 제3 다운 믹스부(813)는 Cr과 Rs를 가산하여 RV1을 생성한다.

제4 다운 믹스부(814)는 LV1과 L을 가산하여 LV2를 생성하고, 제5 다운 믹스부(815)는 RV1과 R을 가산하여 RV2를 생성한다.

제6 다운 믹스부(816)는 LV2와 RV2를 가산하여 최종 모노 오디오(Final Mono Audio:FM)를 생성한다.

여기서, Cl과 Cr은 전술한 최초 분할 오디오들(BD1, BD2)에 대응되고, LV1 및 RV1은 전술한 과도 분할 오디오들(TD)에 대응되고, LV2 및 RV2는 전술한 최종 분할 오디오들(FD1, FD2)에 대응되고, Ls, L, Rs 및 R은 전술한 나머지 입력 오디오들(I3 내지 In)에 대응된다.

부가 정보 생성부(820)는 다운 믹스부들(811 내지 816)로부터 부가 정보들(SI1 내지 SI6)을 수신하거나, 그 부가 정보들(SI1 내지 SI6)을 다운 믹스부들(811 내지 816)로부터 독출한 후 그 부가 정보들(SI1 내지 SI6)을 부호화부(830)에 출력한다. 여기서, 도 8에서 점선으로 표시된 부분은 부가 정보들이 다운 믹스부들(811 내지 816)로부터 부가 정보 생성부(820)에 전송되는 것을 나타낸다.

부호화부(830)는 최종 모노 오디오(FM) 및 부가 정보들(SI1 내지 SI6)을 부호화한다.

도 9는 본 발명의 일실시예에 따른 오디오 복호화 방법을 이용하여 5.1채널 스테레오 오디오를 복호화하는 경우에 대한 실시예이다.

도 9에서 추출부(910) 및 복호화부(920)의 동작은 도 6의 추출부(610) 및 복호화부(620)의 동작과 동일하므로 설명을 생략하고, 오디오 복원부(930)의 동작에 대하여 상세히 설명한다.

제1 업 믹스부(931)는 복호화된 모노 오디오(DM)로부터 LV2 및 RV2를 복원한다.

이때, 제1 업 믹스부(931)를 포함하는 업 믹스부들(931 내지 936)은 복호화부(920)로부터 입력받은 복호화된 부가 정보들(SI1 내지 SI6)에 기초하여 복원을 수행한다.

제2 업 믹스부(932)는 LV2로부터 LV1과 L을 복원하고, 제3 업 믹스부(933)는 RV2로부터 RV1과 R을 복원한다.

제4 업 믹스부(934)는 LV1으로부터 Ls와 Cl을 복원하고, 제5업 믹스부(935)는 RV1으로부터 Rs와 Cr을 복원한다.

제6 업 믹스부(936)는 Cl과 Cr을 입력받아 CSw를 생성한 후, 그 CSw로부터 C와 Sw를 복원한다.

전술한 업 믹스부들(931 내지 936)의 동작을 보면 제1 업 믹스부(931) 및 제6 업 믹스부(936)를 제외한 업 믹스부들(932 내지 935)은 하나의 과도 복원 오디오와 하나의 최종 복원 오디오를 생성한다.

여기서, LV2 및 RV2는 전술한 최초 복원 오디오들(BR1,BR2)에 대응되고, LV1 및 RV1은 전술한 과도 복원 오디오들(TR)에 대응되고, Cl 및 CR은 전술한 최종 과 도 복원 오디오들(FR1, FR2)에 대응되고, CSw는 전술한 결합 복원 오디오(CR)에 대응된다.

이하에서는 도 9에 도시된 업 믹스부들(931 내지 936)이 오디오를 복원하는 방법에 대하여 상세히 설명한다. 다만, 설명의 편의를 위하여 제4 업 믹스부(934)의 동작에 대하여 도 10을 참조하여 상세히 설명하도록 한다.

도 10은 본 발명에 따른 업 믹스부의 동작의 일실시예를 설명하기 위하여 도시한 도면이다.

이하에서는 최종 과도 복원 오디오(Cl)와 좌채널 전방 오디오(Ls)를 복원하는데 사용될 수 있는 다양한 방법들을 설명한다.

첫 번째 방법은, 전술한 방법에 따라 LV1 벡터와 Ls 벡터간의 각도(θp)를 정규화한 각도(θm)를 이용하여 최종 과도 복원 오디오(Cl)와 좌채널 전방 오디오(Ls)를 복원하는 방법이다. 도 3b를 참조하면 θ0이 90 도로 정규화될 때 θp도 정규화되어 정규화된 θm=(θp×90)/θ0이 계산된다. 이와 같이 θm이 계산되면 벡터 Cl의 크기를 |LV1|sinθm/cosθn으로 계산하고, 벡터 Ls의 크기를 |LV1|cosθm/cosθn으로 계산함으로써 최종 과도 복원 오디오(Cl)와 좌채널 전방 오디오(Ls)의 세기를 결정한 후에, 부가 정보에 기초하여 최종 과도 복원 오디오(Cl)와 좌채널 전방 오디오(Ls)의 위상을 계산하여 최종 과도 복원 오디오(Cl)와 좌채널 전방 오디오(Ls)를 복원하는 방법이다.

두 번째 방법은, 첫 번째 방법에 의하여 최종 과도 복원 오디오(Cl) 또는 좌채널 전방 오디오(Ls)가 복원되면, 과도 모노 오디오(LV1)에서 좌채널 후방 오디 오(Ls)를 감산하여 최종 과도 복원 오디오(Cl)를 복원하고, 과도 모노 오디오(LV1)에서 최종 과도 복원 오디오(Cl)를 감산하여 좌채널 후방 오디오(Ls)를 복원한다.

세 번째 방법은, 첫 번째 방법을 이용하여 복원된 오디오들과 두 번째 방법을 이용하여 복원된 오디오들을 소정의 비율로 조합하여 오디오들을 복원하는 방법이다.

즉, 첫 번째 방법을 이용하여 복원된 최종 과도 복원 오디오(Cl) 및 좌채널 전방 오디오(Ls)를 각각 Cly 및 Lsy로 명명하고, 두 번째 방법을 이용하여 복원된 최종 과도 복원 오디오(Cl) 및 좌채널 전방 오디오(Ls)를 Clz 및 Lsz로 명명하면, 최종 과도 복원 오디오(Cl) 및 좌채널 전방 오디오(Ls) 각각의 세기는 |Cl|= a×|Cly| + (1-a)×|Clz|와 |Ls|= a×|Lsy| + (1-a)×|Lsz|로서 결정하고, 부가 정보에 기초하여 최종 과도 복원 오디오(Cl) 및 좌채널 전방 오디오(Ls)의 위상을 계산하여 최종 과도 복원 오디오(Cl) 및 좌채널 전방 오디오(Ls)를 복원하는 방법이다. 여기서, a는 0에서 1 사이의 값이다.

한편, 다른 실시예에서는 상기 방법들에 의하여 제4 업 믹스부(934)에서 Cl이 복원되면, 제5 업 믹스부(935)에서 출력되는 Rs는 별도의 부가 정보 없이도 복원될 수 있다. 즉, Cl과 Cr은 CSw에서 분할된 오디오들로서, Cl과 Cr의 세기 및 위상이 동일하므로, 제5 업 믹스부(935)는 벡터 RV1에서 벡터 Cl을 감산함으로써 벡터 Rs를 복원할 수 있게 된다.

이와 같은 방법을 도 6에 적용하게 되면, 업 믹스부가 TRj-1로부터 FR1을 복원하게 되면, TRj에서 그 복원된 FR1을 감산함으로써 벡터 I4를 복원할 수 있게 된 다.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.

상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

도 3a는 본 발명에 따라 제1 중앙 입력 오디오 및 제2 중앙 입력 오디오의 세기에 대한 정보를 생성하는 방법의 일실시예를 설명하기 위하여 도시한 도면이다.

도 3b는 본 발명에 따른 제1중앙 입력 오디오 및 제2중앙 입력 오디오의 세기에 대한 정보를 생성하는 방법의 제2 실시예를 설명하기 위하여 도시한 도면이다.

Claims

수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오디오들을 가산하여 생성된 하나의 최초 모노 오디오를 분할하여 제1 최초 분할 오디오 및 제2 최초 분할 오디오를 생성하는 단계;

상기 분할 오디오들 각각에 나머지 입력 오디오들을 상기 분할 오디오들 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오 및 제2 최종 분할 오디오를 생성한 후 상호간에 가산함으로써 최종 모노 오디오를 생성하는 단계;

상기 오디오들 및 상기 분할 오디오들로부터 상기 최종 분할 오디오들을 생성하는 과정에서 상기 나머지 입력 오디오들이 하나씩 가산됨에 따라 생성되는 과도 분할 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 단계; 및

상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
제1항에 있어서,

상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하는 단계;

상기 부호화된 N개의 입력 오디오들을 복호화하는 단계; 및

상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 단계를 더 포함하고,

상기 부호화하는 단계는 상기 차이 값들에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화하는 것을 특징으로 하는 오디오 부호화 방법.
제1항에 있어서,

상기 부가 정보들을 부호화하는 단계는

상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각의 세기(intentsity)를 결정하기 위한 정보를 부호화하는 단계; 및

상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각에서 상호간에 가산되는 2개의 오디오들간의 위상 차이에 대한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
제3항에 있어서,

상기 세기를 결정하기 위한 정보를 부호화하는 단계는

상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각에서 상호간에 가산되는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도 록 벡터 공간을 생성하는 단계;

상기 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 제3 벡터를 생성하는 단계; 및

상기 벡터 공간에서 상기 제3 벡터와 상기 제1 벡터 사이의 각도 또는 상기

제3 벡터와 상기 제2 벡터 사이의 각도에 대한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
제3항에 있어서,

상기 세기를 결정하기 위한 정보를 부호화하는 단계는

상기 제1 최초 분할 오디오의 세기를 결정하기 위한 정보 및 상기 제2 최초 분할 오디오의 세기를 결정하기 위한 정보 중 하나를 택일적으로 부호화하는 것을 특징으로 하는 오디오 부호화 방법.
수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 단계;

상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 단계;

상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에 복수회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적 으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들을 생성하는 단계; 및

상기 생성된 과도 복원 오디오들 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들을 상호간에 가산하여 결합 복원 오디오를 생성한 후, 상기 복호화된 부가 정보들에 기초하여 상기 결합 복원 오디오로부터 2개의 최종 복원 오디오들을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
제6항에 있어서,

상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 추출하는 단계를 더 포함하고,

상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성되는 것을 특징으로 하는 오디오 복호화 방법.
제6항에 있어서,

상기 복호화된 부가 정보들은

상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들의 세기를 결정하기 위한 정보들; 및

상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디 오들 각각에서 하나의 오디오로부터 복원되어지는 2개의 복원 오디오들 상호간의 위상 차이에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 방법.
제8항에 있어서,

상기 세기를 결정하기 위한 정보들은

상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 상기 2개의 다음 복원 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 다음 복원 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 생성된 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 생성된 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 방법.
제9항에 있어서,

상기 최초 복원 오디오들을 복원하는 단계는

상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보를 이용하여 상기 2개의 최초 복원 오디오들 중 제1 최초 복원 오디오의 세기 또는 제2 최초 복원 오디오의 세기를 결정하는 단계;

상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제 2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제1 최초 복원 오디오의 위상 또는 상기 제2 최초 복원 오디오의 위상을 계산하는 단계; 및

상기 복호화된 모노 오디오의 위상, 상기 제2 최초 복원 오디오의 위상 및 상기 최초 복원 오디오들의 세기를 결정하기 위한 정보에 기초하여 상기 최초 복원 오디오들을 복원하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
제9항에 있어서,

상기 2개의 최종 과도 복원 오디오들 중 제1 최종 과도 복원 오디오가 하나의 최종 복원 오디오와 함께 J-1번째 과도 복원 오디오로부터 복원되고, 상기 제1 최종 과도 복원 오디오와 동일한 세기 및 위상을 가지는 제2 최종 과도 복원 오디오가 다른 하나의 최종 복원 오디오와 함께 J번째 과도 복원 오디오로부터 복원될 때,

상기 J-1번째 과도 복원 오디오의 위상, 상기 하나의 최종 복원 오디오와 상기 제1 최종 과도 복원 오디오간의 위상 차이 및 상기 제1 최종 과도 복원 오디오의 세기를 결정하기 위한 정보에 기초하여 상기 제1 최종 과도 복원 오디오가 복원되면, 상기 다른 하나의 최종 복원 오디오는 상기 J번째 과도 복원 오디오에서 상기 제1 최종 과도 복원 오디오를 감산함으로써 복원되는 것을 특징으로 하는 오디오 복호화 방법.
수신되는 N개의 입력 오디오들 중에서 중앙에 위치하는 2개의 중앙 입력 오 디오들을 가산하여 생성된 하나의 최초 모노 오디오를 분할하여 제1 최초 분할 오디오 및 제2 최초 분할 오디오를 생성하고, 상기 분할 오디오들 각각에 나머지 입력 오디오들을 상기 분할 오디오들 각각에 인접한 순서대로 하나씩 가산함으로써 제1 최종 분할 오디오 및 제2 최종 분할 오디오를 생성한 후 상호간에 가산함으로써 최종 모노 오디오를 생성하는 모노 오디오 생성부;

상기 오디오들 및 상기 분할 오디오들로부터 상기 최종 분할 오디오들을 생성하는 과정에서 상기 나머지 입력 오디오들이 하나씩 가산됨에 따라 생성되는 과도 분할 오디오들 각각을 복원하기 위해 필요한 부가 정보들을 생성하는 부가 정보 생성부; 및

상기 최종 모노 오디오와 상기 부가 정보들을 부호화하는 부호화부를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
제12항에 있어서,

상기 모노 오디오 생성부는

상기 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 모노 오디오들 및 상기 최종 분할 오디오들 각각에서 입력되는 2개의 오디오들을 가산하는 복수 개의 다운 믹스부를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
제12항에 있어서,

상기 N개의 입력 오디오들을 상기 부호화 방법과 동일한 방법으로 부호화하 고, 상기 부호화된 N개의 입력 오디오들을 복호화한 후, 상기 복호화된 N개의 입력 오디오들과 상기 수신되는 N개의 입력 오디오들의 차이 값들에 대한 정보를 생성하는 차이 값 정보 생성부를 더 포함하고,

상기 부호화하는 단계는 상기 차이 값들에 대한 정보를 상기 최종 모노 오디오 및 상기 부가 정보들과 함께 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
제12항에 있어서,

상기 부호화부는

상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각의 세기(intentsity)를 결정하기 위한 정보를 부호화하고, 상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각에서 상호간에 가산되는 2개의 오디오들간의 위상 차이에 대한 정보를 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
제14항에 있어서,

상기 부호화부는

상기 세기를 결정하기 위한 정보를 부호화할 때, 상기 중앙 입력 오디오들, 상기 하나씩 가산되는 나머지 입력 오디오들, 상기 최초 분할 오디오들, 상기 과도 분할 오디오들 및 상기 최종 분할 오디오들 각각에서 상호간에 가산되는 2개의 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 벡터 공간을 생성하고, 상기 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 제3 벡터를 생성한 후, 상기 벡터 공간에서 상기 제3 벡터와 상기 제1 벡터 사이의 각도 또는 상기 제3 벡터와 상기 제2 벡터 사이의 각도에 대한 정보를 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
제14항에 있어서,

상기 부호화부는

상기 제1 최초 분할 오디오의 세기를 결정하기 위한 정보 및 상기 제2 최초 분할 오디오의 세기를 결정하기 위한 정보 중 하나를 택일적으로 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
수신된 오디오 데이터로부터 부호화된 모노 오디오와 부호화된 부가 정보들을 추출하는 추출부;

상기 추출된 부호화된 모노 오디오와 부호화된 부가 정보들을 복호화하는 복호화부;

상기 복호화된 부가 정보들에 기초하여, 상기 복호화된 모노 오디오로부터 2 개의 최초 복원 오디오들을 복원하고, 상기 2개의 최초 복원 오디오들 각각에 복수회에 걸쳐 상기 복원 방법과 동일한 복원 방법을 연쇄적으로 적용함에 따라 순차적으로 하나씩의 최종 복원 오디오와 하나씩의 과도 복원 오디오를 생성함으로써 N-2개의 최종 복원 오디오들을 생성하고, 상기 생성된 과도 복원 오디오들 중에서 가장 마지막에 생성된 2개의 최종 과도 복원 오디오들을 상호간에 가산하여 결합 복원 오디오를 생성한 후, 상기 복호화된 부가 정보들에 기초하여 상기 결합 복원 오디오로부터 2개의 최종 복원 오디오들을 생성하는 오디오 복원부를 포함하는 것을 특징으로 하는 오디오 복호화 장치.
제18항에 있어서,

상기 오디오 복원부는

상기 부가 정보들에 기초하여, 상기 복호화된 모노 오디오, 상기 최초 복원 오디오들, 상기 과도 복원 오디오들 각각에서 하나의 오디오로부터 2개의 복원 오디오들을 생성하는 복수개의 업 믹스부를 포함하는 것을 특징으로 하는 오디오 복호화 장치.
제18항에 있어서,

상기 추출부는

상기 N개의 최종 복원 오디오들을 통해 복원하고자 하는 N개의 원본 오디오들에 대하여 부호화 및 복호화가 수행되어 생성된 복호화된 N개의 오디오들과 상기 N개의 원본 오디오들의 차이 값들에 대한 정보를 상기 오디오 데이터로부터 더 추출하고,

상기 최종 복원 오디오들은 상기 복호화된 부가 정보들 및 상기 차이 값들에 대한 정보에 기초하여 생성되는 것을 특징으로 하는 오디오 복호화 장치.
제18항에 있어서,

상기 복호화된 부가 정보들은

상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들의 세기를 결정하기 위한 정보들; 및

상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 하나의 오디오로부터 복원되어지는 2개의 복원 오디오들 상호간의 위상 차이에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 장치.
제21항에 있어서,

상기 세기를 결정하기 위한 정보들은

상기 최초 복원 오디오들, 상기 과도 복원 오디오들 및 상기 최종 복원 오디오들 각각에서 상기 2개의 다음 복원 오디오들 중 하나의 세기에 대한 제1 벡터 및 상기 2개의 다음 복원 오디오들 중 다른 하나의 세기에 대한 제2 벡터가 소정의 각도를 이루도록 생성된 벡터 공간에서 상기 제1 벡터와 상기 제2 벡터를 가산하여 생성된 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보들을 포함하는 것을 특징으로 하는 오디오 복호화 장치.
제22항에 있어서,

상기 오디오 복원부는

상기 최초 복원 오디오들을 복원할 때, 상기 제3 벡터가 상기 제1 벡터와 이루는 각도 또는 상기 제3 벡터가 상기 제2 벡터와 이루는 각도에 대한 정보를 이용하여 상기 2개의 최초 복원 오디오들 중 제1 최초 복원 오디오의 세기 또는 제2 최초 복원 오디오의 세기를 결정하고, 상기 복호화된 모노 오디오의 위상 및 상기 제1 최초 복원 오디오와 상기 제2 최초 복원 오디오간의 위상 차이에 대한 정보에 기초하여 상기 제1 최초 복원 오디오의 위상 또는 상기 제2 최초 복원 오디오의 위상을 계산한 후, 상기 복호화된 모노 오디오의 위상, 상기 제2 최초 복원 오디오의 위상 및 상기 최초 복원 오디오들의 세기를 결정하기 위한 정보에 기초하여 상기 최초 복원 오디오들을 복원하는 것을 특징으로 하는 오디오 복호화 장치.
제22항에 있어서,

상기 오디오 복원부는

상기 과도 복원 오디오들 중에서 J-1번째 과도 복원 오디오로부터 하나의 최종 복원 오디오 및 상기 2개의 최종 과도 복원 오디오들 중 제1 최종 과도 복원 오디오를 복원하고, J번째 과도 복원 오디오로부터 상기 제1 최종 과도 복원 오디오 와 동일한 세기 및 위상을 가지는 제2 최종 과도 복원 오디오 및 다른 하나의 최종 복원 오디오를 복원하고,

상기 제1 최종 과도 복원 오디오는 상기 J-1번째 과도 복원 오디오의 위상, 상기 하나의 최종 복원 오디오와 상기 제1 최종 과도 복원 오디오 상호간의 위상 차이 및 상기 제1 최종 과도 복원 오디오의 세기를 결정하기 위한 정보에 기초하여 복원하고,

상기 다른 하나의 최종 복원 오디오는 상기 J번째 과도 복원 오디오에서 상기 제1 최종 과도 복원 오디오를 감산함으로써 복원하는 것을 특징으로 하는 오디오 복호화 장치.
제1항 내지 제11항 중 어느 한 항의 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.