KR100829560B1

KR100829560B1 - 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치

Info

Publication number: KR100829560B1
Application number: KR1020060075390A
Authority: KR
Inventors: 김영태
Original assignee: 삼성전자주식회사
Priority date: 2006-08-09
Filing date: 2006-08-09
Publication date: 2008-05-14
Also published as: KR20080013628A; WO2008018689A1; US20080037809A1; US8867751B2

Abstract

본 발명은 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치, 멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법 및 장치에 관한 것으로, 본 발명에 따른 오디오 신호의 부호화 방법은 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하고, 상기 복수의 채널 신호들을 다운믹스하며, 본 발명에 따른 오디오 신호의 복호화 방법은 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들 및 복수의 채널 신호들이 다운믹스된 신호를 입력받고, 다운믹스된 신호를 공간 정보들을 이용하여 복수의 채널 신호들로 복원한다. 본 발명에 따르면 주파수 영역에 관계 없이 멀티채널 오디오 신호를 정확도 있게 부호화하고, 복호화할 수 있다.

Description

멀티채널 오디오 신호의 부호화/복호화 방법 및 장치, 멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법 및 장치{Method and apparatus for encoding/decoding multi-channel audio signal, Method and apparatus for decoding downmixed singal to 2 channel signal}

도 1은 본 발명의 일 실시예에 따라 멀티채널 신호를 모노 신호로 부호화하고, 모노 신호를 2 채널로 출력하는 시스템의 구성을 나타낸 도면이다.

도 2a는 본 발명의 일 실시예에 따라 복수의 채널들에 의해 형성되는 가상 음원들의 방향 정보를 나타내는 공간 정보들을 생성하는 과정을 설명하기 위한 도면이다.

도 2b는 두 채널을 입력으로 하여 CDD와 가상 음원의 에너지 및 방향 정보를 출력하는 OTT(one to two) 인코더를 나타내는 그림이다.

도 3a는 본 발명의 일 실시예에 따른 5-1-2 트리 구조를 이용한 멀티채널 오디오 신호 부호화 장치의 구성도이다.

도 3b는 도 3a에 도시된 멀티채널 오디오 신호 부호화 장치를 사용하여 부호화하는 과정을 설명하기 위한 채널 레이아웃을 도시한 것이다.

도 4는 본 발명의 일 실시예에 따라 5.1 채널을 부호화하는 방법의 흐름도이다.

도 5는 본 발명의 일 실시예에 따른 5-1-2 트리 구조를 이용한 멀티채널 오디오 신호 복호화 장치의 구성도이다.

도 6은 본 발명의 일 실시예에 따라 5.1 채널이 다운믹스된 모노 신호를 복호화하는 방법의 흐름도이다.

도 7은 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 장치의 구성도이다.

도 8은 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법의 흐름도이다.

본 발명은 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것으로, 특히 복수의 채널들의 방향 정보를 이용하여 생성된 공간 파라미터를 이용하여 멀티채널 오디오 신호를 부호화/복호화하는 방법, 멀티 채널이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법 및 장치에 관한 것이다.

종래의 멀티채널 오디오 신호의 부호화/복호화 기술에서는 음향공간에서 사람이 느낄 수 있는 공간감이 주로 양귀효과(Binaural Effect) 때문인 것에 착안하여 멀티채널 오디오 신호를 부호화/복호화하는데, 사람은 양귀에 도달하는 소리의 크기 차이(Interaural Level Difference, ILD)와 시간 지연차이(Interaural Time Difference)를 이용하여 특정 음원의 위치를 인지한다는 점을 이용한다. 따라서, 종래에 멀티채널 오디오 신호를 부호화할 때 멀티채널 오디오 신호를 모노 신호로 다운믹스하고, 채널에 대한 정보는 채널간의 신호 크기차이(Interchannel Level Difference: ICLD) 및 시간지연(Inter-channel Time Difference: ICTD) 등의 공간 정보들(spatial cues)로 표현하는 것이 통상적이다. 또한 다운믹스된 멀티채널 오디오 신호를 ICLD 및 ICTD 등의 공간 정보들을 이용하여 복호화하게 된다.

그러나, ICLD에 의한 음원의 위치 인지는 소리의 파장이 머리의 지름보다 적은 고주파 영역의 경우에 한하여 가능하며, 보다 낮은 주파수 영역에서는 그 정확도가 떨어지는 문제점이 있다. 또한 ICTD는 ICLD와는 반대로 소리의 파장이 머리의 지름보다 큰 저주파 영역의 경우에 한하여 음원의 위치 인지가 가능하며, 보다 높은 주파수 영역에서는 그 정확도가 떨어지는 문제점이 있다.

한편, 멀티채널이 다운믹스된 모노 신호를 2 채널의 가상 입체 음향으로 출력하기 위해서는 상기 모노 신호를 ICLD 및 ICTD 등의 공간 정보(spatial cue)를 이용하여 멀티채널 신호로 복원하고 복원된 멀티채널 신호를 2개의 채널 신호로 단순 합성하거나 머리 전달 함수(Head Related Transfer Function, HRTF)를 이용하여 2 채널로 합성한다. 머리 전달 함수란 자유 공간에서 정위된 음원으로부터 사람의 귀로 전달되는 음향적 과정을 표현하며, 사람이 음원의 위치를 판단하는 중요한 정보를 포함한다. 이러한 머리 전달 함수(Head Related Transfer Function, HRTF)는 두 귀간의 시간차와 두 귀간의 레벨차 귓바퀴의 형상을 포함하여 소리가 전달되어 온 공간의 특성을 나타내는 많은 정보를 포함한다

멀티채널 신호를 머리 전달 함수를 이용하여 2채널로 합성하기 위해서는 멀 티채널의 각 채널 별로 우측 귀와 좌측 귀에 해당하는 머리 전달 함수가 필요하며, 따라서 필요한 머리 전달 함수의 수는 멀티채널 수의 2배가 된다. 예를 들면, 5.1 채널 신호를 2 채널로 출력하기 위해서는 모두 10개의 머리 전달 함수가 필요하게 된다. 머리 전달 함수는 시스템 내의 머리 전달 함수 데이터베이스에 저장되어 있는데, 종래와 같이 다수의 머리 전달 함수를 저장하는 데에는 데이터베이스의 저장용량이 많이 필요하게 되는 문제점이 있다.

본 발명이 이루고자 하는 기술적 과제는 멀티채널 오디오 신호의 부호화/복호화 방법에 있어서, 주파수 영역에 관계 없이 정확도 있게 부호화/복호화하는 방법을 제공하는 데 있다. 또한, 상기된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 데 있다.

본 발명이 이루고자 하는 다른 기술적 과제는 멀티 채널이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법 및 장치에 있어서, 머리 전달 함수를 저장하는 데이터베이스의 용량을 줄일 수 있는 방법 및 장치를 제공하는 데 있다.

상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 부호화 방법은, 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하는 단계; 상기 복수의 채널 신호들을 다운믹스하는 단계; 및 상기 다운믹스된 신호 및 상기 공간 정보들을 출력하는 단계를 포함하는 것을 특징으로 한다.

상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 복호화 방법은, 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들 및 상기 복수의 채널 신호들이 다운믹스된 신호를 입력받는 단계; 및 상기 입력받은 다운믹스된 신호를 상기 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계를 포함하는 것을 특징으로 한다.

상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 부호화 장치는, 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성되는 제1 가상 음원의 방향 정보를 나타내는 제1 공간 정보를 생성하고, 상기 제1 공간 정보 및 상기 소정 두 채널의 방향 정보를 이용하여 상기 제1 가상 음원의 방향 정보를 산출하는 제1 인코더; 및 상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성되는 제2 가상 음원의 방향 정보를 나타내는 제2 공간 정보를 생성하고, 상기 제2 공간 정보 및 상기 다른 두 채널의 방향 정보를 이용하여 상기 제2 가상 음원의 방향 정보를 산출하는 제2 인코더를 포함하는 것을 특징으로 한다.

상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 복호화 장치는, 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성된 제1 가상 음원을 입력받아, 제1 공간 정보를 이용하여 상기 소정 두 채널 신호로 복원하는 제1 디코더; 및 상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성된 제2 가상 음원을 입력받아, 제2 공간 정 보를 이용하여 상기 다른 두 채널로 복원하는 제2 디코더를 포함하고, 상기 제1 공간 정보는 상기 제1 가상 음원의 방향 정보를 나타내고, 상기 제2 공간 정보는 상기 제2 가상 음원의 방향 정보를 나타내는 것을 특징으로 한다.

상기 다른 기술적 과제를 해결하기 위한 본 발명에 따른 복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법은, 상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계; 상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 단계; 및 상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 단계를 포함하는 것을 특징으로 한다.

상기 다른 기술적 과제를 해결하기 위한 본 발명에 따른 복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 장치는, 상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 업믹스부; 상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 머리전달함수 생성부; 및 상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 2채널 합성부를 포함하는 것을 특징으로 한다.

이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따라 멀티채널 신호를 모노 신호로 부호화하고, 모노 신호를 2 채널로 출력하는 시스템의 구성을 나타낸 도면이다. 본 발명의 일 실시예에 따라 멀티채널 신호를 모노 신호로 부호화하고, 모노 신호를 2 채널로 출력하는 시스템은 부호화부(110) 및 바이노럴 디코더(binaural decoder)(120)를 포함하여 이루어지며, 바이노럴 디코더(120)는 업믹스(upmix)부(130) 및 2채널 합성부(140)를 포함하여 이루어진다.

부호화부(110)에는 복수의 채널 신호들이 입력된다. 도 1에서 상기 복수의 채널 신호들의 예로서 5.1 채널, 즉 전방센터(C) 채널, 전방우측(Rf) 채널, 전방좌측(Lf) 채널, 후방우측(Rs) 채널, 후방좌측(Ls) 채널 및 저음역 효과(LFE) 채널이 입력되고 있으나 본 발명은 이에 국한되지 않으며, 7.1 채널 등에도 적용될 수 있다.

부호화부(110)는 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하고, 상기 복수의 채널 신호들을 다운믹스하여, 모노 신호를 출력한다.

본 명세서에서 편의상 상기 공간 정보를 CDD(Channel Directivity Difference)라 하기로 한다.

바이노럴 디코더(120)는 상기 공간 정보(CDD)들 및 상기 모노 신호를 입력받고, 상기 공간 정보(CDD)들을 이용하여 상기 모노 신호를 2채널 신호로 출력한다.

업믹스부(130)는 상기 공간 정보(CDD)들 및 상기 모노 신호를 입력받고, 상기 공간 정보(CDD)들을 이용하여 상기 모노 신호를 복수의 채널 신호들로 복원한다.

2채널 합성부(140)는 상기 공간 정보(CDD)들 및 머리 전달 함수(Head Related Transfer Function, HRTF)를 이용하여 상기 복원된 복수의 채널 신호들을 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력한다.

도 2a는 본 발명의 일 실시예에 따라 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보(CDD)들을 생성하는 과정을 설명하기 위한 도면이다. 도 2a에 편의상 채널 i(11)와 채널 j(12)만이 도시되어 있으나, 청취자(23)를 중심으로 다른 채널들(미도시)이 분포되어 있는 것으로 가정한다.

멀티채널 오디오 신호를 부호화할 때 어떤 시점에서 각 채널(채널 i, 채널 j, 및 미도시된 다른 채널들)에 서로 다른 에너지가 분배된다. 이 경우에 채널 i와 채널 j 이외의 채널을 고려하지 않고, 채널 i의 음원과 채널 j의 음원에 의해서 가상 음원 x(14)가 형성된다고 하면 수학식 1과 같이 가상 음원 x(14)의 에너지는 채널 i(11)의 에너지와 채널 j(12)의 에너지의 합과 같게 된다.

W_i ² + W_j ² = W_x ²

삭제

여기서 W_i ²은 채널 i의 에너지, W_j ²은 채널 j의 에너지, W_x ²은 채널 j의 에너지니다.

수학식 1의 양변을 W_x ²으로 나누면 수학식 2와 같다.

CDD_xi ² + CDD_xj ² = 1

삭제

여기서 CDD_xi =

, CDD_xj =

이다.

한편, CDD_xi 및 CDD_xj와 채널 i(21), 채널 j(22) 및 가상 음원 x(24)의 방향 정보는 수학식 3의 관계를 가진다.

삭제

여기서, θ는 채널의 방향 정보로서, 두 채널 사이의 이등분면과 각 채널 사이의 각도이다. 채널 레이아웃은 멀티채널 오디오 신호의 부호화시에 이미 정해져 있으므로, 채널의 방향 정보는 역시 이미 정해져 있는 값이다. φ는 가상 음원의 방향 정보로서, 상기 이등분면으로부터 가상 음원 x(14)까지의 각도이다. 수학식 3에서 알 수 있듯이, CDD_xi, CDD_xj 는 두 채널 i, j에 의해 형성되는 가상 음원 x의 방향 정보를 나타내게 된다.

본 발명의 일 실시예에 따라 CDD를 생성하는 과정에서, 수학식 1 및 수학식 2로부터 가상 음원 x(24)의 에너지 W_x ²과 CDD_xi 및 CDD_xj를 구하고, 수학식 3으로부터 가상 음원 x(24)의 방향 정보를 구한다.

또한, 도 2a에서 채널 i와 채널 j는 각각 가상 음원이 될 수도 있다. 예를 들면, 채널 i와 채널 j이외의 다른 두 채널들로부터 가상 음원 y(미도시)가 생성되었다고 하면, 가상 음원 x(14)와 가상 음원 y(미도시)로부터 또 다른 가상 음원 z(미도시)가 형성되고, 이 경우에 CDD_zx, CDD_zy를 구하고 가상 음원 z(미도시)의 에너지 및 방향 정보 φ를 구한다. 물론 도 2a에서 채널 i와 채널 j 중 둘 중의 하나가 가상 음원이 되는 경우에도 마찬가지이다.

도 2b를 참조하면, OTT 인코더(17)는 두 채널 i, j의 신호를 입력받아서 CDD_xi, CDD_xj,가상 음원의 에너지 W_x및 방향 정보 φ를 출력한다. 물론 OTT 인코더(17)의 입력은 가상 음원이 될 수도 있다.

도 3a는 본 발명의 일 실시예에 따른 5-1-2 트리 구조를 이용한 멀티채널 오디오 신호 부호화 장치의 구성도이다. 도 3b는 도 3a에 도시된 멀티채널 오디오 신호 부호화 장치를 사용하여 부호화하는 과정을 설명하기 위한 채널 레이아웃을 도시한 것이다. 도 4는 본 발명의 일 실시예에 따라 5.1 채널을 부호화하는 방법의 흐름도로서, 도 3a 및 도 3b와 결부시켜 설명하기로 한다.

310단계에서, 제1 OTT 인코더(250)는 Lf 채널과 Ls 채널을 입력받아, CDD_1Lf, CDD_1Ls를 생성하고, 제1 가상 음원(210)의 에너지 및 방향 정보를 산출한다. CDD_1Lf, CDD_1Ls에서 아래 첨자 1은 가상 음원을 나타내며 Lf, Ls는 각각 전방좌측(Lf) 채널, 후방좌측(Ls) 채널을 나타낸다. 보다 구체적으로 설명하면, Lf 채널과 Ls 채널의 에너지를 이용하여 제1 가상 음원(210)의 에너지 및 공간 정보 CDD_1Lf, CDD_1Ls를 생성하고, CDD_1Lf, CDD_1Ls 및 Lf 채널과 Ls 채널의 방향 정보를 이용하여 제1 가상 음원(210)의 방향 정보를 산출한다.

320단계에서, 제2 OTT 인코더(255)는 Rf 채널과 Rs 채널을 입력받아, CDD_2Rf, CDD_2Rs를 생성하고 제2 가상 음원(220)의 에너지 및 방향 정보를 산출한다.

330단계에서, 제3 OTT 인코더(260)는 C 채널과 LFE 채널을 입력받아, CDD_3C, CDD_3LFE를 생성하고 제3 가상 음원(230)의 에너지 및 방향 정보를 산출한다.

340단계에서, 제4 OTT 인코더(265)는 상기 제1 가상 음원과 상기 제2 가상 음원을 입력받는다. 여기서, 다시 도 2a 및 도 2b를 참조하면, 340단계는 도 2a 및 도 2b의 채널 i(11)와 채널 j(12)가 각각 상기 제1 가상 음원과 상기 제2 가상 음원으로 대체된 경우에 해당한다. 340단계에서는, 제1 가상 음원과 제2 가상 음원의 에너지를 이용하여 제4 가상 음원(240)의 에너지 및 공간 정보 CDD₄₁, CDD₄₂를 생성하고, CDD₄₁, CDD₄₂ 및 제1 가상 음원과 제2 가상 음원의 방향 정보를 이용하여 제4 가상 음원(240)의 방향 정보를 산출한다.

350단계에서, 제5 OTT 인코더(270)는 상기 제3 가상음원과 상기 제4 가상음원을 입력받아, CDD_m4, CDD_m3를 생성하고, 5.1 채널 신호들이 다운믹스된 모노 신호를 출력한다. 도 4에 도시된 본 발명의 일 실시예에 따라 5.1 채널을 부호화하는 방법에서, 310단계 내지 350단계를 통하여 5.1 채널 신호들을 다운믹스한다.

360단계에서, 다중화부(미도시)는 CDD들 및 상기 다운믹스된 모노 신호를 포함하는 비트스트림을 생성하여 출력한다.

도 5는 본 발명의 일 실시예에 따른 5-1-5 2 트리 구조를 이용한 멀티채널 오디오 신호 복호화 장치의 구성도이다. 도 6은 본 발명의 일 실시예에 따라 5.1 채널이 다운믹스된 모노 신호를 복호화하는 방법의 흐름도로서, 도 5와 결부시켜 설명하기로 한다.

505단계에서, 역다중화부(미도시)는 복수의 채널들이 다운믹스된 모노 신호 및 CDD들이 포함된 비트스트림을 입력받아, 상기 비트스트림을 상기 다운믹스된 모노 신호와 CDD들로 분리한다.

510단계에서, 제5 OTT 디코더(410)는 상기 다운믹스된 모노 신호를 CDD_m4, CDD_m3을 이용하여 제3 가상음원과 제4 가상음원으로 복원한다.

520단계에서, 제4 OTT 디코더(420)는 제4 가상 음원을 CDD₄₁, CDD₄₂를 이용하여 제1 가상음원과 제2 가상음원으로 복원한다.

530단계에서, 제1 OTT 디코더(430)는 제1 가상 음원을 CDD_1Lf, CDD_1Ls를 이용하여 Lf 채널과 Ls 채널로 복원한다.

540단계에서, 제2 OTT 디코더(440)는 제2 가상 음원을 CDD_2Rf, CDD_2Rs를 이용하여 Rf 채널과 Rs 채널로 복원한다.

550단계에서, 제3 OTT 디코더(450)는 제3 가상 음원을 CDD_3C, CDD_3LFE를 이용하여 C 채널과 LFE 채널로 복원한다.

도 5에 도시된 멀티채널 오디오 신호 복호화 장치에서 출력되는 전방좌측(Lf) 채널, 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널, 및 저음역 효과(LFE) 채널 신호는 수학식 4-9와 같다.

Lf=CDD_m4CDD₄₁CDD_1Lfm

Ls=CDD_m4CDD₄₁CDD_1Lsm

Rf=CDD_m4CDD₄₂CDD_2Rfm

Rs=CDD_m4CDD₄₂CDD_2Rsm

C=CDD_m3CDD_3Cm

LFE=CDD_m3CDD_3LFEm

삭제

도 7은 본 발명의 일 실시예에 따른, 복수의 채널 신호들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 장치의 구성도이다.

도 7에서 상기 복수의 채널 신호들의 예로서 5.1 채널, 즉 전방센터(C) 채널, 전방우측(Rf) 채널, 전방좌측(Lf) 채널, 후방우측(Rs) 채널, 후방좌측(Ls) 채널 및 저음역 효과(LFE) 채널이 나타나 있으나 본 발명은 이에 국한되지 않으며, 7.1 채널 등에도 적용될 수 있다. 이 경우 도 5에 따른 5-1-2 트리 구조는 7-1-2 트리 구조로 변경되어야 할 것이다.

도 7을 참조하면, 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 장치는 시간/주파수 변환부(710), 업믹스부(720), 2채널 합성부(730), 머리전달함수 생성부(750), 기준 머리전달함수 DB(760), 제1 주파수/시간 변환부(770), 제2 주파수/시간 변환부(780)을 포함하여 이루어진다. 또한 2채널 합성부(730)은 음상 정위부(731-740), 우측 채널 혼합부(742), 좌측 채널 혼합부(743)을 포함하여 이루어진다.

시간/주파수 변환부(710)는 복수의 채널 신호들이 다운믹스된 모노 신호를 입력받아 주파수 영역의 신호로 변환하여 출력한다.

업믹스부(720)는 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보(CDD)들 및 시간/주파수 변환부(710)에서 주파수 영역의 신호로 변환된 모노 신호를 입력받아, 상기 모노 신호를 상기 공간정보(CDD)들을 이용하여 전방좌측(Lf) 채널, 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널, 및 저음역 효과(LFE) 채널 신호로 복원한다.

기준 머리전달함수 DB(760)는 전방좌측(Lf) 채널, 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널 중 어느 한 채널에 해당하는 머리전달함수의 세트를 저장하고 있다. 여기서 기준 머리전달함수 DB(760)에 저장된 머리전달함수를 기준 머리전달함수라 하기로 한다. 도 7에서는 기준 머리전달함수 DB(760)가 전방좌측(Lf) 채널에 해당하는 머리전달함수의 세트를 저장하고 있는데 이 경우, 우측 머리전달함수(HRTF_R,Lf) 및 좌측 머리전달함수(HRTF_L,Lf)를 저장하고 있다.

머리전달함수 생성부(750)는 상기 공간정보(CDD)들 및 기준 머리전달함수 DB(760)에 저장된 기준 머리전달함수를 입력받고, 상기 공간정보(CDD)들과 기준 머리전달함수를 이용하여 다른 채널, 즉 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널에 해당하는 머리전달함수를 생성한다.

머리전달함수 생성부(750)를 이하 수학식 4-9을 참조하여 보다 구체적으로 설명한다. 복호화부(72)에서 출력되는 각 채널 신호의 형태는 수학식 4-9에서 알 수 있듯이, 모노 신호 m에 공간정보(CDD)들이 곱해져 있는 형태이다. 머리전달함수 생성부(750)는 수학식 4-9에서 모노 신호 m에 곱해져 있는 공간정보(CDD)들의 곱 중 기준 머리전달함수에 해당하는 채널에 대응하는 공간정보(CDD)들의 곱과 생성하 고자 하는 채널의 머리전달함수에 해당하는 채널에 대응하는 공간정보(CDD)들의 곱의 비율만큼 기준 머리전달함수에 가중치를 부여하여, 기준 머리전달함수 외의 다른 채널에 대응하는 머리전달함수를 생성한다. 즉, 상기 공간정보(CDD)들의 곱의 비율과 기준 머리전달함수를 컨벌루션하여 기준 머리전달함수 외의 다른 채널에 대응하는 머리전달함수를 생성한다. 예를 들어, 수학식-4에서 기준 머리전달함수에 대응하는 채널인 전방좌측(Lf) 채널 신호는 모노 신호 m에 CDD_m4CDD₄₁CDD_1Lf가 곱해져 있는 형태이다. 한편, 수학식-7에서 후방우측(Rs) 채널 신호는 모노 신호 m에 CDD_m4CDD₄₂CDD_2Rs가 곱해져 있는 형태이다. 이 경우 후방우측(Rs) 채널에 해당하는 머리전달함수는 기준 머리전달함수인 전방좌측(Lf) 채널의 머리전달함수에

만큼 가중치를 부여하여, 후방우측(Rs) 채널에 해당하는 머리전달함수를 생성한다.

2채널 합성부(730)는 기준 머리전달함수 DB(760)와 머리전달함수 생성부(750)로부터 각 채널에 해당하는 머리전달함수를 입력받는다. 2채널 합성부(730)에 포함된 음상 정위부(731-740)들은 각 채널 신호를 머리전달함수를 이용하여 각 채널의 위치에 음상 정위하여 출력한다. 도 7에서 기준 머리전달함수가 전방좌측(Lf) 채널의 머리전달함수이므로, 전방좌측(Lf) 채널 음상 정위부(731, 732)는 기준 머리전달함수 DB로부터 머리전달함수를 입력받으며, 전방좌측(Lf) 채널 이외 채널의 음상 정위부(733-740)들은 머리전달함수 생성부(750)로부터 머리전달함수를 입력받는다.

우측 채널 혼합부(742)는 우측 채널 음상 정위부(731, 733, 735, 737, 739)로부터 출력된 신호들을 혼합한다. 좌측 채널 혼합부(743)는 좌측 채널 음상 정위부(732, 734, 736, 738, 740)로부터 출력된 좌측 채널 출력들을 혼합한다.

제1 주파수/시간 변환부(770)는 우측 채널 혼합부(742)에서 혼합된 신호를 입력받아 시간 영역의 신호로 변환하여 우측 채널 신호를 출력한다.

제2 주파수/시간 변환부(780)는 좌측 채널 혼합부(743)에서 혼합된 신호를 입력받아 시간 영역의 신호로 변환하여 좌측 채널 신호를 출력한다.

도 8은 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법의 흐름도이다. 본 실시예에 따른 복호화 방법은 도 7에 도시된 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 7에 도시된 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 복호화 방법에도 적용된다.

810단계에서, 시간/주파수 변환부(710)는 복수의 채널들이 다운믹스된 모노 신호를 입력받아 주파수 영역의 신호로 변환한다.

820단계에서, 복호화부(720) 및 머리전달함수 생성부(750)는 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보(CDD)들을 입력받는다.

830단계에서, 업믹스부(720)는 상기 공간 정보(CDD)들을 이용하여 상기 다운믹스된 모노 신호를 복수의 채널 신호로 복원한다.

840단계에서, 머리전달함수 생성부(750)는 기준 머리전달함수 DB(760)로부터 상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수를 입력받고, 상기 입력받은 머리전달함수 및 상기 공간 정보(CDD)들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성한다.

850단계에서, 2채널 합성부(730)는 상기 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2 채널 신호로 출력한다.

860단계에서, 제1 주파수/시간 변환부(770) 및 제2 주파수/시간 변환부(780)는 2채널 합성부(730)에서 출력된 신호를 시간 영역의 신호로 변환하여 출력한다.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다.

상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다.본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

본 발명에 따르면, 복수의 채널들에 의해 형성되는 가상 음원들의 방향 정보를 나타내는 공간 정보들을 생성하여 멀티채널 오디오 신호를 부호화/복호화하는데, 가상 음원들의 방향 정보는 채널 레이아웃의 정보에 따라 결정되고 주파수와 관계가 없기 때문에 주파수 영역에 관계 없이 멀티채널 오디오 신호를 정확도 있게 부호화/복호화할 수 있는 효과가 있다.

또한 본 발명에 따르면, 복수의 채널들에 의해 형성되는 가상 음원들의 방향 정보를 나타내는 공간 정보들 및 소정 채널에 해당하는 머리전달함수를 이용하여 다른 채널에 해당하는 머리전달함수를 생성함으로써 머리전달함수를 저장하는 데이터베이스의 저장 용량을 줄일 수 있는 효과가 있다.

Claims

(a) 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들 및 상기 복수의 채널 신호들이 다운믹스된 신호를 입력받는 단계; 및

(b) 상기 입력받은 다운믹스된 신호를 상기 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계를 포함하고,

상기 공간 정보들은 상기 복수의 채널들 각각의 음원의 에너지 및 상기 가상 음원의 에너지를 이용하여 생성된 정보인 것을 특징으로 하는 멀티채널 오디오 신호 복호화 방법.
삭제
제1항에 있어서,

상기 가상 음원의 방향 정보는 상기 공간 정보들 및 상기 적어도 두 채널의 방향 정보를 이용하여 산출된 정보인 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
제1항에 있어서,

상기 (b) 단계는,

(b1) 상기 입력받은 다운믹스된 신호를 상기 공간 정보들을 이용하여 제1 가상 음원 및 제2 가상 음원으로 복원하는 단계; 및

(b2) 상기 제1 가상 음원을 상기 공간 정보들을 이용하여 제3 가상 음원과 제 4 가상 음원으로 복원하는 단계를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 복호화 방법.
제4항에 있어서,

상기 (b) 단계는

(b3) 상기 공간 정보들을 이용하여 상기 제1 내지 제4 가상 음원 중 적어도 하나로부터 상기 복수의 채널 신호들 중 두 채널 신호를 복원하는 단계를 더 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 복호화 방법.
제1항에 있어서,

상기 (a) 단계는 상기 다운믹스된 신호 및 상기 공간 정보들이 포함된 비트스트림을 입력받는 것을 특징으로 하고,

상기 비트스트림을 상기 다운믹스된 신호와 상기 공간 정보들로 분리하는 단계를 더 포함하는 것을 특징을 하는 방법.
(a) 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하는 단계;

(b) 상기 복수의 채널 신호들을 다운믹스하는 단계; 및

(c) 상기 다운믹스된 신호 및 상기 공간 정보들을 출력하는 단계를 포함하고,

상기 (a) 단계는 상기 복수의 채널들 각각의 음원의 에너지 및 상기 가상 음원의 에너지를 이용하여 상기 공간 정보들을 생성하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
삭제
제7항에 있어서,

상기 가상 음원의 방향 정보는 상기 공간 정보들 및 상기 적어도 두 채널의 방향 정보를 이용하여 산출되는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
제7항에 있어서,

상기 (a) 단계는,

(a1) 상기 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성되는 제1 가상 음원의 방향 정보를 나타내는 제1 공간 정보를 생성하고, 상기 제1 공간 정보 및 상기 소정 두 채널의 방향 정보를 이용하여 상기 제1 가상 음원의 방 향 정보를 산출하는 단계; 및

(a2) 상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성되는 제2 가상 음원의 방향 정보를 나타내는 제2 공간 정보를 생성하고, 상기 제2 공간 정보 및 상기 다른 두 채널의 방향 정보를 이용하여 상기 제2 가상 음원의 방향 정보를 산출하는 단계를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
제10항에 있어서,

상기 (a) 단계는,

(a3) 상기 제1 가상 음원 및 상기 제2 가상 음원에 의해 형성되는 제3 가상 음원의 방향 정보를 나타내는 제3 공간 정보를 생성하고, 상기 제3 공간 정보 및 상기 제1 가상 음원과 상기 제2 가상 음원의 방향 정보를 이용하여 상기 제3 가상 음원의 방향 정보를 산출하는 단계를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
제7항에 있어서,

상기 (c) 단계는 상기 다운믹스된 신호 및 상기 공간 정보들을 포함하는 비트스트림을 생성하여 출력하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법에 있어서,

(a) 상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계; 및

(b) 상기 복원된 복수의 채널 신호들을 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 단계를 포함하고,

상기 (b) 단계는 머리전달함수(Head Related Transfer Function, HRTF)를 이용하여 음상 정위하는 것을 특징으로 하는 방법.
삭제
제13항에 있어서,

상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 단계를 더 포함하고,

상기 (b) 단계는, 상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 음상 정위하는 것을 특징으로 하는 방법.
제15항에 있어서,

상기 생성하는 단계는 상기 공간 정보들과 상기 소정 채널에 대응하는 머리전달함수를 컨벌루션하여 상기 다른 채널에 해당하는 머리전달함수를 생성하는 것을 특징으로 하는 방법.
제13항에 있어서,

상기 다운믹스된 신호를 주파수 영역의 신호로 변환하는 단계; 및

상기 2채널 신호를 시간 영역의 신호로 변환하여 출력하는 단계를 더 포함하는 것을 특징으로 하는 방법.
복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성된 제1 가상 음원을 입력받아, 제1 공간 정보를 이용하여 상기 소정 두 채널 신호로 복원하는 제1 디코더; 및

상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성된 제2 가상 음원을 입력받아, 제2 공간 정보를 이용하여 상기 다른 두 채널로 복원하는 제2 디코더를 포함하고,

상기 제1 공간 정보는 상기 제1 가상 음원의 방향 정보를 나타내고, 상기 제2 공간 정보는 상기 제2 가상 음원의 방향 정보를 나타내는 것을 특징으로 하는 멀티채널 오디오 신호 복호화 장치.
복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성되는 제1 가 상 음원의 방향 정보를 나타내는 제1 공간 정보를 생성하고, 상기 제1 공간 정보 및 상기 소정 두 채널의 방향 정보를 이용하여 상기 제1 가상 음원의 방향 정보를 산출하는 제1 인코더; 및

상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성되는 제2 가상 음원의 방향 정보를 나타내는 제2 공간 정보를 생성하고, 상기 제2 공간 정보 및 상기 다른 두 채널의 방향 정보를 이용하여 상기 제2 가상 음원의 방향 정보를 산출하는 제2 인코더를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 장치.
복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 장치에 있어서,

상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 업믹스부;

상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 머리전달함수 생성부; 및

상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 2채널 합성부를 포함하는 것을 특징으로 하는 장치.