KR100857103B1

KR100857103B1 - 오디오 신호 처리 방법

Info

Publication number: KR100857103B1
Application number: KR1020087004587A
Authority: KR
Inventors: 오현오; 방희석; 김동수; 임재현; 김효진; 정양원
Original assignee: 엘지전자 주식회사
Priority date: 2005-07-29
Filing date: 2006-07-28
Publication date: 2008-09-08
Also published as: CN101233567B; WO2007013775A1; WO2007013783A1; CA2617050C; KR20080033452A; CA2617050A1; EP1920437A4; KR20080030686A; CN101233571B; WO2007013780A1; CN101233568B; EP1915757A4; CN101233569B; KR100841332B1; EP1920437A1; EP1915756A4; WO2007013781A1; KR20080035656A; EP1920439A1; CN101233570B

Abstract

본 발명은 다채널 오디오 코딩에서 오디오 신호의 처리방법에 관한 것이다.

본 발명은 다운믹스 신호와 기본 매트릭스를 이용하여 고정출력 채널을 생성하는 단계; 및 상기 고정출력 채널과 포스트 매트릭스를 이용하여 임의출력 채널을 생성하는 단계를 포함하는 오디오 신호의 처리방법을 제공한다.

Description

오디오 신호 처리 방법{METHOD FOR PROCESSING AUDIO SIGNAL}

본 발명은 다채널 코딩에 관한 것으로, 특히 오디오 신호의 처리방법에 관한 것이다.

일반적으로 신호는 블록, 밴드 채널 등의 형태로 존재할 수 있는데, 이러한 신호들은 일정한 통계적 특성을 유지하는 스테셔너리(stationary) 구간에는 신호를 분할하지 않고 처리하는 것이 압축관점에서 유리하지만, 신호의 특성이 급격히 변화하는 트렌지언트(transient) 구간에서는 가급적 신호를 분할하여 처리하는 것이 신호의 왜곡 방지 차원에서 유리하다. 특히, 오디오 신호의 경우는 채널 구성 및 밴드 구성을 위해 신호를 분할하여 처리하는 경우가 있다.

그러나 상기의 신호들을 분할하여 처리하고자 할 경우, 이 분할된 정보를 표현하는 방법이 구체적으로 제시된 바 없어, 상기의 신호들을 효율적으로 처리하는데 문제점이 있었다.

본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 분할된 신호의 정보를 효율적으로 표현하는 방법 및 그 정보를 이용하여 신호처리를 하는 방법을 제공하는데 있다.

상기 목적을 달성하기 위해 본 발명은 다운믹스 신호와 기본 매트릭스를 이용하여 고정출력 채널을 생성하는 단계; 및 상기 고정출력 채널과 포스트 매트릭스를 이용하여 임의출력 채널을 생성하는 단계를 포함하는 하는 오디오 신호의 처리방법을 제공한다.

도 1은 본 발명의 일실시예에 의한 블록분할 정보의 시그널링 방법을 설명하기 위한 개념도,

도 2는 내지 도 3은 본 발명의 일실시예에 의한 밴드/채널 분할 정보의 시그널링 방법을 설명하기 위한 개념도,

도 4는 본 발명의 일실시예를 이용하여 다채널 신호를 생성하는 방법에 대한 개념도,

도 5는 본 발명의 일실시예에 의한 채널 분할 정보의 시그널링 방법을 설명하기 위한 개념도이다.

Best Mode for Carrying Out the Invention

이하, 상기와 같은 목적 달성을 위한 본 발명의 구체적인 실시예를 도면을 참조하여 설명하기로 한다.

본 발명의 일실시예에 의한 분할 정보의 시그널링 방법을 편의상 신호의 종류별로 나누어 설명하기로 한다. 상기 신호는 블록, 밴드, 채널 등의 형태로 존재 가능하다. 본 명세서에서 시그널링 방법이란 시그널링을 하거나, 시그널링된 신호를 인식하는 것을 포함한다.

한편, 본 명세서에 사용되는 용어인 "노드"는 신호의 분할여부가 표현되는 지점을 의미한다. 그리고 본 명세서에 사용되는 용어인 "공간정보" 라 함은 다채널을 다운믹스(Down-mix) 하거나 다채널 신호를 생성하기 위해 업믹스(Up-mix) 하는 과정에서 필요한 정보를 의미한다. 상기 공간 정보로 공간 파라미터를 기준으로 설명하나, 본 발명이 이에 한정되지 않음은 자명한 사실임을 밝혀둔다.

또한, 상기 공간 파라미터는 두 채널간의 에너지 차이를 의미하는CLD(channel level difference), 두 채널간의 상관관계(correlation)를 의미하는 ICC(inter channel coherences) 및 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수인 CPC(channel prediction coefficients) 등이 있다.

이하, 블록 분할, 밴드 분할, 채널 분할에 대해 살펴보기로 한다.

(1) 블록 분할

오디오 신호처럼 시간 축에서 연속적인 데이터에 대해 신호의 압축과 같은 처리를 하기 위해서는 블록 프로세싱(block processing)을 수행한다. 상기 블록 프로세싱(block processing)은 입력된 신호를 일정구간 또는 일정간격으로 나누어 처리하는 것을 의미한다. 이때 사용되는 구간을 블록이라 정의하며, 한개 혹은 복수 개의 블록이 모여 프레임(frame)을 구성할 수 있다. 상기 프레임은 데이터의 전송 및 저장을 위해 사용되는 단위를 말한다.

본 발명에서 "블록 분할(block splitting)"이란, 입력된 신호의 블록을 가변시키면서 신호를 처리할 때, 서로 다른 크기의 블록으로 변화하는 과정을 의미한다. 또한, 본 발명에서 "블록 크기 정보(block size information)"란 입력된 신호 의 블록 크기를 가변시키면서 신호를 처리하는 경우에 블록의 크기를 나타내는 정보이다.

일반적으로 신호가 블록형태로 존재하는 경우 장블록(long block)과 단블록(short block) 중 하나를 사용하여 신호처리를 수행한다. 이 때, 상기 단블록(short block)을 사용하는 경우, 복수 개의 단블록을 묶어 하나의 장블록 크기에 대응되도록 한다.

그러나 신호의 특성이 구간구간 마다 다양하기에 모든 신호에 대해 장블록에 의한 신호처리 또는 단블록 의한 신호처리로 이분하여 구분짓기는 어렵다.

따라서, 임의의 구간에서 신호 특성에 맞는 보다 다양한 블록 크기 가운데서 선택하여 블록 분할을 수행하는 것이 바람직하다. 즉, 두 개 이상의 다른 크기를 갖는 블록들이 존재하고, 이들 가운데 적절한 크기의 블록을 프레임내에서 다양한 조합으로 선택할 수 있도록 할 수 있다.

이를 위해서는 현재의 프레임이 어떠한 블록들의 조합에 의해 구성되었는지를 알려줄 필요가 있고, 이를 위한 시그널링(signaling) 방법이 필요하다.

상기 시그널링 방법에는 순차적 시그널링 방법과 계층적 시그널링 방법이 있다.

순차적 시그널링 방법은 프레임의 크기(길이, N)를 미리 정의하고, 최소 크기 블록 (M)의 개수로써 시그널링(signaling) 하는 방법이다. 이때, 상기 프레임의 길이 N은 특정 M의 배수이며, 상기 프레임의 크기는 고정된 값일 수도 있고, 별도의 정보로써 전송되는 값일 수도 있다.

예를 들어, N=2048, M=256이고, 프레임 내에 앞에서부터 256, 256, 1024, 512의 순서로 블록이 구성된다고 하면, 블록 크기 정보는 M*1, M*1, M*4, M*2 =＞ 1,1,4,2 =＞ 0,0,3,1로 시그널링 하는 방법이 있을 수 있다.

또한, 계층적 시그널링 방법은 계층의 깊이 정보를 보내는 방법과 계층의 깊이 정보를 보내지 않는 방법이 있는데, 이에 대해서는 도면을 통해 상세히 설명하도록 하겠다.

도 1은 본 발명의 일실시예에 의한 블록분할 정보의 시그널링 방법을 설명하기 위한 개념도이다.

이에 도시된 바와 같이, 각 계층은 레이어(layer)로 나타내고, 상기 레이어의 깊이(depth)는 5이다.

레이어 1(layer 1)은 블록 분할의 기본이 되는 가장 장블록이며, 그 길이는 N인 제1블록(210)을 포함한다. 또한, (1), (2), .., (a), (b), (c), (d)는 바이너리 시그널링(binary signaling) 순서의 일례를 나타낸다. 도시된 본 실시예에서 블록의 분할여부를 나타내는 블록 분할 정보를 분할 식별자와 미분할 식별자로 표현하는데, 분할 식별자로는 1을 사용하고, 미분할 식별자로는 0을 사용한다.

그리고 상기 분할 식별자와 상기 미분할 식별자는 각 계층의 노드에서 표현된다.

상기 분할 식별자는 상위 계층의 임의의 블록이 하위 계층에서 절반으로 분할됨과 아울러 하위 계층에 하위 대응 노드가 할당됨을 의미한다. 그리고 미분할 식별자는 상위 계층의 임의의 블록이 하위 계층에서 분할되지 않는 것을 의미함과 동시에 미분할 식별자가 표현된 노드에 대한 하위 대응 노드가 할당되지 않는 것을 의미한다. 하위 대응 노드가 할당되지 않는다는 것은 더 이상의 추가적인 시그널링을 수행하지 않는다는 것을 뜻한다.

최상위 계층인 레이어 1에서 제1블록(210)에 대한 블록 분할 정보(1)가 '1'이므로 제1블록(210)의 블록 분할을 수행한다. 상기 레이어 1의 하위 계층인 레이어 2는 N/2의 길이를 가지는 제2블록(220)과 제3블록(221)을 포함한 2개의 블록으로 구성된다.

레이어 2(layer 2)에서 제2-1블록(220)의 블록 분할 정보(2)가 '1'이고, 제2-2블록(221)의 블록 분할 정보(3)가 '1'이므로, 상기 레이어 2의 하위 계층인 레이어 3(layer 3)은 N/4의 길이를 가지는 제3-1블록(230), 제3-2블록(231), 제3-3블록(232), 제3-4블록(233)을 포함한 4개의 블록으로 구성된다.

레이어 3(layer 3)에서 제3-1블록(230)에 대한 블록 분할 정보(4)가 '0', 제3-2블록(231)에 대한 블록 분할 정보(5)가 '1', 제3-3블록(232)에 대한 블록 분할 정보(6)가 '1', 제3-4블록(233)에 대한 블록 분할 정보(7)가 '0'이다. 따라서, 상기 레이어 3의 블록 분할 정보에 따르면, 레이어 3의 제3-1블록(230)과 제3-4블록(233)은 블록 분할을 수행하지 않고, 레이어 3의 제3-2블록(231)과 제3-3블록(232)에 대해서만 블록 분할을 수행한다. 이 때, 레이어 3에서 블록 분할을 하지않은 제3-1블록(230)과 제3-4블록(233) 이후의 하위 계층(레이어 4)에서는 하위 대응 노드가 할당되지 않는다. 또한, 레이어 3에서 블록 분할을 수행한 제3-2블록(231)과 제3-3블록(232)은 이후의 하위 계층에 하위 대응 노드를 할당하여 상기 하위 대응 노 드에서 블록 분할여부가 표현된다.

레이어 4는 N/8의 길이를 가지고, 레이어 3의 제3-2블록(231)을 블록 분할한 제4-1블록(240)과 제4-2블록(241), 제3-3블록(232)을 블록 분할한 제4-3블록(242)과 제4-4블록(243)을 포함하여 구성된다. 상기 레이어 4에서 제4-1블록(240)에 대한 블록 분할 정보(8)는 '0', 제4-2블록(241)에 대한 블록 분할 정보(9)는 '1', 제4-3블록(242)에 대한 블록 분할 정보(a)는 '0', 제4-4블록(243)에 대한 블록 분할 정보(b)는 '0'이다. 따라서, 상기 레이어 4의 블록 분할 정보에 따르면, 레이어 4의 제4-1블록(240), 제4-3블록(242), 제4-4블록(243)은 블록 분할을 수행하지 않고, 레이어 4의 제4-2블록(241)은 블록 분할을 수행한다. 이 때, 레이어 4에서 블록 분할을 하지않은 제4-1블록(240), 제4-3블록(242), 제4-4블록(243) 이후의 하위 계층(레이어 5)에서는 하위 대응 노드를 할당하지 않으며, 레이어 4에서 블록 분할을 수행한 제4-2블록(241)은 이후의 하위 계층에서 하위 대응 노드를 할당하여, 상기 하위 대응 노드에서 불록 분할여부가 표현된다.

레이어 5는 N/16의 길이를 가지고, 레이어 4의 제4-2블록(241)을 블록 분할한 제5-1블록(250)과 제5-2블록(251)을 포함하여 구성된다. 상기 레이어 5에서 제5-1블록(250)에 대한 블록 분할 정보(c)는 '0', 제5-2블록(251)에 대한 블록 분할 정보(d)는 '0'이다. 그러므로, 레이어 5의 모든 블록 분할 정보가 '0'이므로 더 이상 계층적으로(hierarchically) 블록 분할을 하지 않게 되고, 블록의 블록 분할 깊이를 알 수 있다.

그러므로, 상기에서 계층적으로 블록 분할을 수행하여 구성될 수 있는 블록 의 구조(block layout)를 살펴보면, N/4 블록, N/8 블록, N/16 블록, N/16 블록, N/8 블록, N/8 블록, N/8 블록으로 구성된다.

신호의 길이가 N인 경우, 블록 분할된 복수 개의 블록 길이는 N/2, N/4, N/8, N/16, N/32... 중 하나의 길이를 가진다. 이를 수식으로 나타내면 N/

로 표현할 수 있다. 상기 수식에서 i = 1, 2, ..., p 중 어느 하나이며, 상기 p는 정수인 것을 특징으로 한다. 그리고 여기서 x는 2이다.

또한, 2진수로 표현되는 블록 분할 정보를 바이너리 시그널링 순서인 (1)(2)(3)(4)(5)(6)(7)(8)(9)(a)(b)(c)(d)로 나타내면, '1110110010000'의 13비트로 표현하는 것이 가능하다.

이상은 계층의 깊이정보는 별도로 표현하지 않고, 분할 식별자와 미분할 식별자로 표현되는 블록 분할 정보로 계층의 깊이를 파악 가능한 경우를 설명한 것이다.

그러나 계층의 깊이 정보를 별도로 표현하는 블록 분할 정보의 시그널링도 가능하다. 예를 들어 상기 계층의 깊이 정보는 분할 종료 식별자와 분할 계속 식별자로 표현한다. 상기 분할 종료 식별자라 함은 더 이상 블록 분할이 이루어지지 않는 최하위 계층을 의미하고, 분할 계속 식별자라 함은 최하위 계층이 아닌 계층을 의미한다. 이 경우에도 분할 계속 식별자는 '1'로, 분할 종료 식별자는 '0' 으로 표현할 수 있다. 도 1에 도시된 계층의 깊이는 5이고, 이를 상기와 같은 방식으로 표현하면 11110이 된다. 상술한 시그널링 방식에 의해 서브 블록의 크기를 인식할 수 있다. 이와 같이, 깊이 정보를 별도로 표현하는 경우는 최하위 계층에 할당된 노드에서는 결국 미분할 식별자만이 표현되기 때문에 최하위 계층의 이전 계층까지만 시그널링을 할 수 있다. 그 일례로 분할 식별자를 '1'로, 미분할 식별자를 '0'으로 표현하고, 분할 계속 식별자를 '1'로, 분할 종료 식별자를 '0'으로 표현한 경우는 최하위 계층에 할당된 노드의 분할여부 표현값이 분할 종료를 의미하는 '0' 으로 대표될 수 있다.

(2) 밴드 분할

밴드 분할에 대해 도 2 내지 도 3을 참조하여 살펴보면 다음과 같다.

도 2는 본 발명의 일실시예에 의한 밴드 분할 정보의 시그널링 방법을 설명하기 위한 개념도이다.

도 2를 참조하면, 서브밴드 필터뱅크(subband filterbank)에서 트리(tree) 구조를 가지는 계층적인 밴드 분할에 관한 것이다. 이하, 후술하는 방법에 의하면 서브밴드의 주파수 해상도를 자유롭게 정의할 수 있다.

도 2를 도 1와 비교하면, 도 1은 하나의 장블록이 최상의 계층을 이루는 반면, 도 2에 도시된 밴드 분할 방식은 최상위 계층에 복수 개의 밴드를 포함하는 경우를 예로 하였다.

도시된 본 실시예에서 밴드의 분할여부를 나타내는 밴드 분할 정보를 분할 식별자와 미분할 식별자로 표현하는데, 분할 식별자로는 1을 사용하고, 미분할 식별자로는 0을 사용한다. 그리고 상기 분할 식별자와 상기 미분할 식별자는 각 계층의 노드에서 표현된다. 상기 분할 식별자는 제 M 계층의 임의의 밴드가 제 M+1 계 층에서 절반으로 분할됨을 의미한다. 그리고 미분할 식별자는 제 M 계층의 임의의 밴드가 제 M+1 계층에서 분할되지 않는 것을 의미함과 동시에 미분할 식별자가 표현된 노드에 대한 하위 대응 노드가 할당되지 않는 것을 의미한다. 하위 대응 노드가 할당되지 않는다는 것은 더 이상의 추가적인 시그널링을 수행하지 않는다는 것을 뜻한다.

최상위 계층인 레이어 1(layer 1)은 제1-1밴드(310), 제1-2밴드(311), 제1-3밴드(312), 제1-4밴드(313), 제1-5밴드(314), 제1-6밴드(315)를 포함한 6개의 밴드로 구성된다. 제1-1밴드(310)의 밴드 분할 정보(1)는 '1', 제1-2밴드(311)의 밴드 분할 정보(2)는 '1', 제1-3밴드(312)의 밴드 분할 정보(3)는 '0', 제1-4밴드(313)의 밴드 분할 정보(4)는 '0', 제1-5밴드(314)의 밴드 분할 정보(5)는 '0', 제1-4밴드(315)의 밴드 분할 정보(6)는 '0'으로 표현된다.

상술한 밴드 분할 정보는 레이어 1에 할당된 노드에서 표현된다. 밴드 분할 정보(1,2)에 따라 제1-1밴드(310)와 제1-2밴드(311)는 신호 변환모듈(310T, 311T:본 실시예에서는 '밴드 변환모듈' 이라 부른다)을 생성하여 레이어 2에 하위밴드(320, 321, 322, 323)를 생성한다. 그리고 하위밴드(320, 321, 322, 323)에는 하위 대응 노드가 할당된다. 이에 반해, 밴드 분할을 수행하지 않는 제1-3밴드, 제1-4밴드, 제1-5밴드, 제1-6밴드는 밴드 변환모듈을 생성하지 않고, 이후 계층(레이어 2)에 대응하는 하위밴드도 생성되지 않는다. 따라서 하위 대응 노드 또한 할당되지 않는다.

레이어 2는 제1-1밴드(310)가 밴드 분할되어 형성된 제2-1밴드(320), 제2-2 밴드(321)와, 제1-2밴드(311)가 밴드 분할되어 형성된 제2-3밴드(322), 제2-4밴드(323)를 포함하여 구성된다. 제2-1밴드(320)의 밴드 분할 정보(7)는 '1', 제2-2밴드(321)의 밴드 분할 정보(8)는 '1', 제2-3밴드(322)의 밴드 분할 정보(9)는 '0', 제2-4밴드(323)의 밴드 분할 정보(10)는 '0'으로 표현된다.

밴드 분할 정보(7, 8)에 따라 제2-1밴드(320)와 제2-2밴드(321)는 밴드 변환모듈(320T, 32IT)을 생성하여 레이어 3에 하위밴드(330, 331, 332, 333)를 생성한다. 그리고 하위밴드(330, 331, 332, 333)에는 하위 대응 노드가 할당된다. 이에 반해, 밴드 분할을 수행하지 않는 제2-3밴드와 제2-4밴드는 밴드 변환모듈을 생성하지 않고, 이후 계층(레이어 3)에 대응하는 하위밴드도 생성되지 않는다. 따라서 하위 대응 노드 또한 할당되지 않는다.

레이어 3은 제2-1밴드(320)가 밴드 분할되어 형성된 제3-1밴드(330), 제3-2밴드(331)와, 제2-2밴드(321)가 밴드 분할되어 형성된 제3-3밴드(332), 제3-4밴드(333)을 포함하여 구성된다. 제3-1밴드(330)의 밴드 분할 정보(11)는 '1', 제3-2밴드(331)의 밴드 분할 정보(12)는 '0', 제3-3밴드(332)의 밴드 분할 정보(13)는 '0', 제3-4밴드(333)의 밴드 분할 정보(14)는 '0'으로 표현된다.

밴드 분할 정보(11)에 따라 제3-1밴드(330)는 신호 변환모듈(330T)을 생성하여 레이어 4에 하위밴드(340, 341)를 생성한다. 그리고 하위밴드(340, 341)에는 하위 대응 노드가 할당된다. 이에 반해, 밴드 분할을 수행하지 않는 제3-2밴드, 제3-3밴드, 제3-4밴드는 밴드 변환모듈을 생성하지 않고, 이후 계층(레이어 4)에 대응하는 하위밴드도 생성되지 않는다. 따라서 하위 대응 노드 또한 할당되지 않는다.

레어어 4는 제3-1밴드(330)가 밴드 분할되어 형성된 제4-1밴드(340)와 제4-2밴드(341)를 포함하여 구성된다. 상기 제4-1밴드(340)의 밴드 분할 정보(15)는 '0', 상기 제4-2밴드(341)의 밴드 분할 정보(16)는 '0'으로 표현된다. 따라서, 밴드 분할을 수행하는 하위 계층이 더 이상 존재하지 않고 시그널링도 종료하게 된다. 이 경우 최하위 계층은 레이어 4가 된다.

그리고, 2진수로 표현되는 밴드 분할 정보를 바이너리 시그널링 순서인 (1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)로 나타내면 '1100001100100000'의 16비트로 표현하는 것이 가능하다.

도 3은 본 발명의 또 다른 일실시예에 의한 밴드 분할 정보의 시그널링 방법을 설명하기 위한 개념도이다.

도 3은 도 2와 비교하여, 밴드 분할을 수행하는 과정 등이 모두 유사하다. 다만, 밴드 분할 정보를 바이너리 시그널링(binary signaling)하는 순서가 차이가 난다. 그 순서는 도면에 기재되어 있다.

따라서, 2진수로 표현되는 밴드 분할 정보를 바이너리 시그널링 순서인 (1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)으로 나타내면 '1110001001000000'의 16비트로 표현하는 것이 가능하다.

이상은 계층의 깊이정보는 별도로 표현하지 않고, 분할 식별자와 미분할 식별자로 표현되는 밴드 분할 정보로 계층의 깊이를 파악 가능한 경우를 설명한 것이다.

그러나 계층의 깊이 정보를 별도로 표현하는 밴드 분할 정보의 시그널링도 가능하다. 예를 들어 상기 계층의 깊이 정보는 분할 종료 식별자와 분할 계속 식별자로 표현한다. 상기 분할 종료 식별자라 함은 더 이상 밴드 분할이 이루어지지 않는 최하위 계층을 의미하고, 분할 계속 식별자라 함은 최하위 계층이 아닌 계층을 의미한다. 이 경우에도 분할 계속 식별자는 '1'로, 분할 종료 식별자는 '0'으로 표현할 수 있다. 도 2 내지 도 3에 도시된 계층의 깊이는 4이고, 이를 상기와 같은 방식으로 표현하면 1110이 된다. 상술한 시그널링 방식에 의해 서브 밴드의 크기를 인식할 수 있다. 이와 같이, 깊이 정보를 별도로 표현하는 경우는 최하위 계층에 할당된 노드에서는 결국 미분할 식별자만이 표현되기 때문에 최하위 계층의 이전 계층까지만 시그널링을 할 수 있다. 그 일례로 분할 식별자를 '1' 로, 미분할 식별자를 '0' 으로 표현하고, 분할 계속 식별자를 '1'로, 분할 종료 식별자를 '0' 으로 표현한 경우는 최하위 계층에 할당된 노드의 분할여부 표현값이 분할 종료를 의미하는 '0' 으로 대표될 수 있다.

(3) 채널 분할

채널 분할 정보는 채널을 구성할 때 이용되는 채널 구성 정보와 관련이 있으므로 채널 구성정보를 설명하면서 채널 분할에 대해 상세히 설명하도록 하겠다. 특히, 다채널 오디오 신호의 인코딩 및 디코딩 하는 경우의 채널구성에 대한 정보를 일례로 설명하겠다.

먼저, 다채널 오디오 코딩에서는 필수적으로 요구되는 기본 공간정보가 있다.

상기 기본 공간정보는 상기 기본 환경에 대한 구성정보를 나타내는 기본환경 설정정보와 그 기본환경 설정정보에 대응되는 기본 데이터로 구성된다. 또한, 다채널 오디오 코딩에서는 선택적으로 요구되는 확장 공간정보가 있다. 상기 확장 공간정보는 상기 확장 환경에 대한 구성정보를 나타내는 확장환경 설정정보와 그 확장환경 설정정보에 대응되는 확장 데이터로 구성된다. 그리고 상술한 확장 환경에 대한 구성정보는 적어도 하나 이상이 존재할 수 있고, 상술한 확장환경은 타입 식별자에 의해 식별 가능하다.

한편, 다채널 오디오 신호의 코딩에서 언급되는 채널구성은 크게 2가지 경우로 나누어 생각해 볼 수 있다. 그 하나는 기본 채널구성고, 또 다른 하나는 확장 채널구성이다.

기본 채널구성에 대한 정보는 적어도 하나의 채널구성에 대한 정보가 설정되어 있는데, 그 중에서 선택된 하나의 채널구성에 대한 정보를 말한다. 편의상 기본 채널구성 정보를 '고정 채널구성 정보'라 칭하고, 상기 고정 채널구성 정보에 따라 생성된 다채널을 '고정출력 채널' 이라고 부르기로 한다. 상술한 고정출력 채널을 생성하기 위해서는 고정 채널구성 정보와 이에 상응하는 고정 채널구성 데이터가 필요하다.

고정 채널구성에 대한 정보는 이미 설정된 채널구성에 대한 정보 중 선택된 하나의 채널구성에 대한 정보이다. 상기 설정된 채널구성은 다양한 경우를 상정할 수 있다. 그 예로 들 수 있는 채널구성은 5-1-5, 5-2-5, 7-2-7, 7-5-7 구성 등이 있다. 5-2-5 구성이라 함은 여섯 개의 입력채널을 두 개의 채널로 다운믹스하고, 상기 다운믹스된 채널을 여섯 개의 채널로 출력하는 채널구성을 말한다. 나머지 채 널구성도 마찬가지로 설명된다. 상술한 고정 채널구성 정보는 기본환경 설정정보 내에 포함되고, 상기 고정 채널구성 정보에 대응하는 데이터는 기본 데이터 내에 포함된다. 상술한 기본 데이터로는 두 채널간의 에너지 차이를 의미하는CLD, 두 채널간의 상관관계를 의미하는 ICC 및 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수인 CPC 등이 사용될 수 있다.

또한, 확장 채널 구성은 상술한 고정 채널구성 이후에 형성되는 채널구성을 말한다. 상술한 확장 채널구성은 인코딩된 신호에 따라 임의적으로 채널 구성이 형성된다. 따라서 편의상 확장 채널 구성에 대한 정보를 '임의 채널구성 정보'라 부르기로 한다. 그리고 상기 임의 채널구성 정보에 의해 생성된 다채널을 '임의출력 채널' 이라 부르기로 한다. 상술한 임의 채널구성 정보는 확장환경 설정정보 내에 포함되고, 이는 채널 식별자라는 타입 식별자에 의해 식별된다.

그리고 임의 채널구성 정보에 대응되는 임의 채널구성 데이터는 상기 확장 데이터 내에 포함된다. 상기 임의 채널구성 데이터는 연산량의 간소화를 위해 두 채널간의 에너지 차이를 의미하는CLD만을 사용할 수도 있다.

상기 임의 채널구성 정보는 분할 식별자와 미분할 식별자로 표현한다. 상기 임의 채널구성 정보의 구성요소인 분할 식별자는 채널 수 증가를 의미하고, 미분할 식별자는 채널 수의 변화가 없는 경우를 말한다. 예를 들어, 분할 식별자는 하나의 입력채널이 두 개의 채널로 변환되어 출력되는 것을 의미하고, 미분할 식별자는 입력채널이 그대로 출력되는 것을 의미한다. 그리고 상위 계층의 채널에 할당된 상위 노드에 분할 식별자가 표현된 경우는 하위 계층에 하위 채널을 생성하고, 생성된 채널에 대응되게 하위 대응 노드도 할당한다.

그러나 상위 계층의 채널에 할당된 상위 노드에 미분할 식별자가 표현된 경우는 하위 계층에 하위 채널을 생성하지 않는다. 따라서 하위 대응 노드 또한 할당되지 않는다. 상기 임의 채널구성 정보를 분할 식별자와 미분할 식별자로 표현하는 방법에 대해 도 2 내지 도 3을 참조하여 설명하기로 한다. 도 2 내지 도 3은 전술한 밴드 분할에 대한 설명뿐만 아니라 채널 분할에 대해서도 설명이 가능한 도면이기에 이를 이용하는 것이다.

먼저 도 2를 설명하면 다음과 같다.

최상위 계층인 레이어 1(layer 1)은 제1-1채널(310), 제1-2채널(311), 제1-3채널(312), 제1-4채널(313), 제1-5채널(314), 제1-6채널(315)로 구성된다.

상기 제1-1채널(310) 내지 제1-6채널(315)는 상술한 고정 다채널이 될 수 있다.

본 실시예에서 분할 식별자는 1로, 미분할 식별자는 0으로 표현한다. 도시된 방법에 의해 임의 채널구성 정보를 표현하는 방법은 레이어 1의 채널(310, 311, 312, 313, 314, 315)에 할당된 노드에 표현된 0 또는 1을 순차적으로 표현하고, 레이어 2의 채널(320, 321, 322, 323)에 할당된 노드에 표현된 0 또는 1을 순차적으로 표현한다. 그리고 레이어 3의 채널(330, 331, 332, 333)에 할당된 노드에 표현된 0 또는 1을 순차적으로 표현하고, 레이어 4의 채널(340, 341)에 할당된 노드에 표현된 0 또는 1을 순차적으로 표현한다. 즉, 상기 상위 게층의 노드에서 채널 수 증가여부를 순차적으로 표현한 후, 하위 계층의 노드에서 채널수 증가여부를 순차 적으로 표현하는 방법이다.

따라서 상기 방법에 의한 임의 채널구성 정보는 '1100001100100000'의 16비트로 표현된다. 도 2와 같이 임의 채널구성 정보를 표현하는 방식을 편의상 '계층우선 방식' 이라 부르기로 한다.

도 3에 도시된 상기 임의 채널구성 정보의 표현방법은 상기 상위 계층의 제 1 노드에서 시그널링한 결과, 상기 제 1 노드가 1로 표현된 경우는 상기 제 1 노드의 하위 대응 노드를 순차적으로 채널 수 증가여부를 표현하고 하고, 상기 제 1 노드가 미분할 식별자로 표현된 경우는 상기 상위 계층의 제 2 노드로 이동하여 채널 수 증가여부를 순차적으로 표현한다. 따라서 상기 방법에 의한 임의 채널구성 정보는 '1110001001000000'의 16비트로 표현된다. 도 3과 같이 임의 채널구성 정보를 표현하는 방식을 편의상 '가지우선 방식' 이라 부르기로 한다.

다음으로 고정출력 채널과 임의출력 채널을 생성하는 방법에 대해 살펴보기로 하겠다.

도 4는 본 발명의 일실시예를 이용하여 다채널 신호를 생성하는 방법에 대한 개념도이다.

도시된 바와 같이, 다운믹스 신호(x)와 기본 매트릭스(m1)의 연산을 통해 임의출력 채널(y)를 생성하고, 고정출력 채널(y)과 포스트 매트릭스(m2)의 연산을 통해 임의출력 채널(z)을 생성한다. 기본 매트릭스(m1)는 2개 이상으로 구성될 수도 있다. 기본 매트릭스(m2)의 구성요소는 CLD, ICC, CPC 중 적어도 하나와 상술한 고정 채널구성 정보를 이용하여 유도될 수 있다.

그리고 포스트 매트릭스(m2)의 구성요소는 CLD와 상기 임의 채널구성 정보를 이용하여 유도될 수 있다.

이하, 임의출력 채널을 생성하는 방법에 대해 좀 더 상세히 살펴보기로 한다.

먼저, 임의 채널구성 정보를 이용하여 임의 채널구성을 하는 방법을 살펴본다.

임의 채널구성 정보가 가지우선 방식에 의해 표현된 경우를 예로 설명하기로 하겠다.

상기 임의 채널구성 정보의 구성요소인 분할 식별자 또는 미분할 식별자를 순차적으로 인식하여 상기 식별자에 따른 신호처리를 한다. 상기 식별자가 분할 식별자인 경우는 하나의 입력채널이 채널 변환모듈과 연결되어 두 개의 하위채널을 생성한다. 한편, 상기 식별자가 미분할 식별자인 경우는 상기 입력채널이 그대로 상기 임의출력 채널이 된다.

좀 더 구체적으로 설명하면 다음과 같다.

먼저, 디코딩해야할 식별자 개수의 초기 값을 1로 하고, 상기 임의출력 채널의 수의 초기값을 0으로 하며, 상기 채널 변환모듈의 개수의 초기값은 0으로 하여 세팅한다(제1단계).

디코딩해야 할 식별자를 인식한다(제2단계).

그리고 상기 인식된할 식별자가 분할 식별자인 경우 상기 채널 변환모듈의 개수 및 상기 인식해야할 식별자의 개수를 1 증가시킨다.

만약, 상기 인식된 식별자가 미분할 식별자인 경우 상기 임의출력 채널의 개수를 1 증가시키며, 상기 인식해야할 식별자의 개수를 1 감소시킨다(제3단계).

그리고 디코딩해야 할 식별자의 개수가 0이 될 때가지 제2단계 및 제3단계를 반복 수행한다.

그리고 상술한 신호처리 방법은 고정출력 채널 수에 대응되게 반복 수행한다.

예를 들어, 임의 채널구성 정보가 '11100010010000' 일 때의 상기 임의 채널구성에 대한 개략도가 도 3에 도시되어 있다. 여기서 1은 분할 식별자를 의미하고, 0은 미분할 식별자를 의미한다. 또한, '1' 의 개수는 채널변환 모듈(도 3에는 신호 변환모듈을 의미함)의 개수를 말하고, 0은 상기 임의출력 채널의 개수를 의미한다.

한편, 고정출력 채널은 그 순서를 재배치(re-mapping)한 후, 임의출력 채널을 생성할 수도 있는데, 도 5가 이를 표현하고 있다.

도시된 바와 같이, 고정출력 채널(310, 311, 312, 313, 314, 315)은 리매핑 모듈(100)을 거쳐 재배치된다. 그리고 재배치된 고정출력 채널(310' ,311' ,312' ,313' ,314' ,315')이 최상의 계층의 채널로 되어 상기 임의출력 채널을 생성한다. 물론 임의출력 채널의 순서를 재배치할 수도 있다.

한편, 상기 임의 채널구성 정보 내에 채널을 스피커와 매칭시키는 채널매핑 정보가 포함된 경우는 상기 임의출력 채널을 스피커와 매핑시킬 수도 있다.

이상은 계층의 깊이정보는 별도로 표현하지 않고, 분할 식별자와 미분할 식별자로 표현되는 임의채널 구성정보로 계층의 깊이를 파악 가능한 경우를 설명한 것이다.

그러나 계층의 깊이 정보를 별도로 표현하는 임의채널 구성정보의 표현도 가능하다.

예를 들어 상기 계층의 깊이 정보는 분할 종료 식별자와 분할 계속 식별자로 표현한다. 상기 분할 종료 식별자라 함은 더 이상 채널 수 증가가 이루어지지 않는 최하위 계층을 의미하고, 분할 계속 식별자라 함은 최하위 계층이 아닌 계층을 의미한다. 이 경우에도 분할 계속 식별자는 '1' 로, 분할 종료 식별자는 '0' 으로 표현할 수 있다. 도 3에 도시된 계층의 깊이는 4이고, 이를 상기와 같은 방식으로 표현하면 1110이 된다. 이와 같이, 깊이 정보를 별도로 표현하는 경우는 최하위 계층에 할당된 노드에서는 결국 미분할 식별자만이 표현되기 때문에 최하위 계층의 이전 계층까지만 시그널링을 할 수 있다. 그 일례로 분할 식별자를 '1' 로, 미분할 식별자를 '0' 으로 표현하고, 분할 계속 식별자를 '1' 로, 분할 종료 식별자를 '0' 으로 표현한 경우는 최하위 계층에 할당된 노드의 분할여부 표현값이 분할 종료를 의미하는 '0' 으로 대표될 수 있다.

만약, 그렇게 표현된다 하더라도 상기 깊이 정보를 이용하여 최하위 계층을 알 수 있고, 생략된 0은 있는 것으로 간주하여 상기 임의출력 채널을 구성할 수 있다.

한편, 임의채널 구성정보가 디코더에 전송되더라도 디코더는 이를 이용하지 않을 수도 있다. 이는 임의채널 구성정보와 이에 대응되는 임의채널 구성 데이터의 크기를 디코더에서 인식하되, 그 크기만큼을 스킵하고 디코딩하는 경우이다.

본 발명은 상술한 실시예에 한정되지 않으며, 첨부된 청구범위에서 알 수 있는 바와 같이 본 발명이 속한 분야의 통상의 지식을 가진 자에 의해 변형이 가능하고 이러한 변형은 본 발명의 범위에 속한다.

이상에서 설명한 바와 같이, 본 발명에 의한 분할 정보의 시그널링 방법은 첫째, 특정 길이를 가지는 장 블록(long block)으로부터 서로 다른 복수 개의 길이를 가지는 단 블록(short block)으로 세분화할 때, 계층적인 구조를 갖는 블록 분할(block splitting) 과정에 대한 정보를 최소의 비트를 사용하여 시그널링하는 것이 가능하다.

둘째, 신호의 시그널링에 사용된 비트 수에 대한 정보를 별도로 전송할 필요없이, 시그널링 신호 자체만으로 분할이 수행된 계층의 깊이와 시그널링 신호의 끝을 파악하는 것이 가능하다.

셋째, 복수 개로 구성된 서브밴드로부터 서로 다른 크기(예를 들어, 주파수 폭)를 갖는 임의 개수의 복수 개 서브밴드로의 세분화 전개 과정을 최소의 비트를 사용하여 시그널링하는 것이 가능하다.

넷째, 입력채널보다 많은 수를 갖는 출력채널로의 업믹스(up-mix)과정에 대해 그 진행 과정의 정보를 최소의 비트를 사용하여 시그널링하는 것이 가능하다.

Claims

다운믹스 신호와 기본 매트릭스를 이용하여 고정출력 채널을 생성하는 단계; 및

상기 고정출력 채널과 포스트 매트릭스를 이용하여 임의출력 채널을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 처리방법.
제 1 항에 있어서,

상기 기본 매트릭스의 구성요소는 두 고정 채널간의 에너지 차이, 두 고정 채널간의 상관관계, 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수 중 적어도 하나와 고정채널 구성정보를 이용하여 유도되고,

상기 포스트 매트릭스의 구성요소는 두 임의 채널간의 에너지 차이와 임의채널 구성정보를 이용하여 유도되는 것을 특징으로 하는 오디오 신호의 처리방법.
제 2 항에 있어서, 상기 임의 채널구성 정보는

계층의 노드에서 채널 수 증가여부를 분할 식별자와 미분할 식별자로 표현하되, 상위 계층의 상위 노드가 분할 식별자로 표현된 경우는 하위 계층에 분할된 수에 대응되게 하위 대응 노드가 할당되고,

상위 계층의 상위 노드가 미분할 식별자로 표현된 경우는 하위 계층에 하위 대응 노드가 할당되지 않는 것을 특징으로 하는 오디오 신호의 처리방법.
제 3 항에 있어서, 상기 임의채널 구성정보는

상위 계층의 상위 노드에서 채널 수 증가여부가 순차적으로 표현된 후, 하위 계층의 하위 노드에서 채널 수 증가여부가 순차적으로 표현된 것을 특징으로 하는 오디오 신호의 처리방법.
제 3 항에 있어서, 상기 임의채널 구성정보는

상위 계층의 제 1 노드가 분할 식별자로 표현된 경우는 하위 계층에 할당된 상기 제 1 노드의 하위 대응 노드의 채널 수 증가여부가 표현되고,

상기 제 1 노드가 미분할 식별자로 표현된 경우는 상기 상위 계층의 제 2 노드의 채널 수 증가여부가 표현되는 것을 특징으로 하는 오디오 신호의 처리방법.
제 5 항에 있어서, 상기 임의출력 채널 생성 단계는

상기 임의채널 구성정보의 구성요소인 분할 식별자 또는 미분할 식별자를 순차적으로 인식하여 상기 식별자에 따른 신호처리를 하되,

상기 식별자가 분할 식별자인 경우는 하나의 입력채널이 채널변환 모듈과 연결되어 두 개의 하위 대응 채널을 생성하고, 상기 식별자가 미분할 식별자인 경우는 상기 입력채널이 그대로 상기 임의출력이 되는 것을 특징으로 하는 오디오 신호의 처리방법.
제 6 항에 있어서, 상기 임의출력 채널 생성 단계는

식별자 개수의 초기값, 상기 임의출력 개수의 초기값, 상기 채널변환 모듈의 개수의 초기값을 설정하는 제 1 단계;

상기 식별자를 인식하는 제 2 단계;

상기 인식된 식별자가 분할 식별자인 경우 식별자의 개수 및 채널변환 모듈을 미리 설정된 증가단위로 증가시키고,

상기 인식된 식별자가 미분할 식별자인 경우 상기 임의출력 채널의 개수를 미리 설정된 증가단위로 증가시키고, 식별자의 개수를 상기 미리 설정된 증가단위로 감소시키는 제 3 단계를 포함하되,

상기 식별자의 개수가 0이 될 때까지 상기 제 2 단계 및 상기 제 3 단계를 반복 수행하는 것을 특징으로 하는 오디오 신호의 처리방법.
제 3 항 내지 제 7 항 중 어느 한 항에 있어서, 상기 오디오 신호 처리방법은 상기 임의채널 구성정보와 상기 임의채널 구성정보에 대응되는 임의채널 구성 데이터의 크기는 인식하되, 상기 임의채널 구성정보와 상기 임의채널 구성 데이터에 따른 디코딩은 수행하지 않는 것을 특징으로 하는 오디오 신호의 처리방법.
다운믹스 신호와 기본 매트릭스를 이용하여 고정출력 채널을 생성하는 제1 채널 생성부; 및

상기 고정출력 채널과 포스트 매트릭스를 이용하여 임의출력 채널을 생성하는 제2 채널 생성부를 포함하는 것을 특징으로 하는 오디오 신호의 처리 장치.
제 9 항에 있어서,

상기 기본 매트릭스의 구성요소는 두 고정 채널간의 에너지 차이, 두 고정 채널간의 상관관계, 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수 중 적어도 하나와 고정채널 구성정보를 이용하여 유도되고,

상기 포스트 매트릭스의 구성요소는 두 임의 채널간의 에너지 차이와 임의채널 구성정보를 이용하여 유도되는 것을 특징으로 하는 오디오 신호의 처리 장치.
제 10 항에 있어서, 상기 임의채널 구성정보는

계층의 노드에서의 채널 수 증가여부를 분할 식별자와 미분할 식별자로 표현하되, 상위 계층의 상위 노드가 분할 식별자로 표현된 경우는 하위 계층에 분할된 수에 대응되게 하위 대응 노드가 할당되고,

상위 계층의 상위 노드가 미분할 식별자로 표현된 경우는 하위 계층에 하위 대응 노드가 할당되지 않는 것을 특징으로 하는 오디오 신호의 처리 장치.
제 11 항에 있어서, 상기 임의채널 구성정보는

상위 계층의 제 1 노드가 분할 식별자로 표현된 경우는 하위 계층에 할당된 상기 제 1 노드의 하위 대응 노드의 채널 수 증가여부가 표현되고,

상기 제 1 노드가 미분할 식별자로 표현된 경우는 상기 상위 계층의 제 2 노드의 채널 수 증가여부가 표현되는 것을 특징으로 하는 오디오 신호의 처리 장치.
제 12 항에 있어서, 상기 제2 채널 생성부는

상기 임의채널 구성정보의 구성요소인 분할 식별자 또는 미분할 식별자를 순차적으로 인식하여 상기 식별자에 따른 신호처리를 하되,

상기 식별자가 분할 식별자인 경우는 하나의 입력채널이 채널변환 모듈과 연결되어 두 개의 하위 대응 채널을 생성하고, 상기 식별자가 미분할 식별자인 경우는 상기 입력채널이 그대로 상기 임의출력이 되는 것을 특징으로 하는 오디오 신호의 처리 장치.