KR20080107669A

KR20080107669A - 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치

Info

Publication number: KR20080107669A
Application number: KR1020070055717A
Authority: KR
Inventors: 이남숙
Original assignee: 삼성전자주식회사
Priority date: 2007-06-07
Filing date: 2007-06-07
Publication date: 2008-12-11
Also published as: US20080305752A1; CN101772805A; CN101772805B; WO2008150061A1; KR101317269B1; US9076444B2

Abstract

신생 모드 정현파 성분의 효율적인 코딩 및 디코딩을 위한 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치가 개시된다. 본 발명에 따른 정현파 오디오 코딩 방법은, 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계, 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계, 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계, 신생 모드 정현파 성분의 진폭 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계, 및 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함한다. 신생 모드 정현파 신호의 진폭 값을 코딩함에 있어서, 신생 모드 정현파 신호와 연속 모드 정현파 신호 모두를 이용하여 가장 가까운 주파수 값을 가지는 정현파 신호를 찾고, 이들의 진폭 값의 차이를 구하여 코딩함에 의하여, 코딩된 진폭 값이 작은 비트 수를 가지도록 한다.

Description

정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치{Method and apparatus for sinusoidal audio coding, and method and apparatus for sinusoidal audio decoding}

도 1은 파라메트릭 코딩 방식을 설명하기 위한 도면이다.

도 2는 관련 기술에 따른 오디오 코딩 방법의 일 예를 나타낸 흐름도이다.

도 3은 도 2의 방법이 적용되는 일 예를 나타낸 도면이다.

도 4는 본 발명의 일 실시예에 따른 정현파 오디오 코딩 장치의 구성을 나타낸 블록도이다.

도 5는 본 발명의 일 실시예에 따른 정현파 오디오 코딩 방법을 나타낸 흐름도이다.

도 6은 본 발명의 일 실시예에 따른 정현파 오디오 디코딩 장치의 구성을 나타낸 블록도이다.

도 7은 본 발명에 따른 정현파 오디오 코딩 방법이 적용되는 일 예를 나타낸 도면이다.

도 8은 본 발명에 따른 정현파 오디오 코딩 방법이 적용되는 다른 일 예를 나타낸 도면이다.

도 9는 본 발명에 따른 정현파 오디오 코딩 방식을 적용하는 경우, 관련 기 술과 비교한 코딩의 이득(Gain)을 나타낸 테이블이다.

본 발명은 오디오 신호의 코딩 및 디코딩에 관한 것으로서, 특히 신생 모드(birth mode) 정현파 성분의 효율적인 코딩 및 디코딩을 위한 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치에 관한 것이다.

파라메트릭 코딩(parametric coding)은 특정한 파라미터로 오디오 신호를 표현하는 코딩 방식이다. 파라메트릭 코딩은 MPEG-4(Moving Picture Experts Group 4) 표준에서 이용되고 있다.

도 1은 파라메트릭 코딩 방식을 설명하기 위한 도면이다. 파라메트릭 코딩 방식에서는 입력 신호를 분석하여 파라미터화한다. 먼저 입력된 오디오 신호에 대하여 적절한 필터링을 수행한다(Audio reading and filtering). 입력된 오디오 신호에 대하여 트랜지언트(transient) 분석, 정현파(sinusoidal) 분석 및 노이즈(noise) 분석의 세 가지 분석을 수행하여 각각의 영역에서의 오디오 성분들에 대한 파라미터들을 추출한다. 트랜지언트 분석은 매우 역동적인(dynamic) 오디오의 변화에 대응한다. 정현파 분석은 결정적인(deterministic) 오디오의 변화에 대응한다. 노이즈 분석은 스토캐스틱(stochastic) 또는 비결정적인(non-deterministic) 오디오의 변화에 대응한다.

추출된 파라미터들은 비트 스트림으로 포맷팅한다(bit-stream formatting).

정현파 분석을 수행한 후에 정현파 성분들(sinusoids)에 대하여 ADPCM이나 DPCM 코딩을 하기 위하여 정현파 성분에 대한 트랙킹을 수행한다. 트랙킹이란 이전 프레임의 정현파 성분들과 연속되는 정현파 성분을 찾아내고 대응 관계를 설정하는 것을 의미한다. 이전 프레임의 정현파 성분에서 트랙킹이 가능한 현재 프레임의 전형파 성분을 연속 모드(continuation mode) 정현파 성분이라고 한다. 연속 모드 정현파 성분에 대하여는 대응하는 이전 프레임의 정현파 성분을 이용하여 효율적인 코딩이 가능하다.

반면, 이전 프레임의 정현파 성분들로부터 트랙킹이 가능하지 않은 현재 프레임의 정현파 성분을 신생 모드(birth mode) 정현파 성분이라고 한다. 신생 모드란 이전 프레임의 정현파 성분으로부터 연속되지 않고 현재 프레임에서 새로이 생겨난다는 의미를 가진다. 일반적으로 신생 모드 정현파 성분에 대하여는 이전 프레임의 정현파 성분을 이용하여 코딩할 수 없으며, 따라서 코딩을 위하여 많은 비트 수가 필요하게 된다.

따라서, 신생 모드 정현파 성분의 코딩에 필요한 비트 수를 줄이기 위한 방식이 요청되고 있다.

먼저, 정현파 분석을 수행하고, 추출된 정현파 신호들의 정보를 이용하여 정현파 성분 트랙킹(sinusoid tracking)을 수행한다(S100). 정현파 성분 트랙킹은 현재 프레임의 정현파 성분들 중에서 이전 프레임의 정현파 성분과 연결된 것들을 찾고 대응 관계를 설정하는 과정이다. 정현파 성분 트랙킹 과정에서 연속 모드 정현 파 성분에 대한 코딩을 수행한다.

현재 프레임의 정현파 성분들 중에서 신생 모드 정현파 성분들을 주파수의 오름 차순으로 정렬한다(S110). 이때 정현파 성분들(partial이라고도 한다)의 수를 n개라고 가정한다.

주파수가 낮은 정현파 성분들부터 차례로 다음 과정을 수행한다(S120). 이때 각 정현파 성분의 주파수 값을 f(i), 진폭 값을 a(i)라고 한다.

1. 진폭 값에 대하여 양자화(quantization)을 수행한다(S130). 양자화된 진폭 값을 q_a(i)라고 한다.

2. 가장 낮은 주파수에 해당하는 정현파 성분인지를 판단하고(S140), 가장 낮은 주파수인 경우 양자화된 진폭 값을 절대 코딩(absolute coding)한다(S150, S170).

3. 가장 낮은 주파수가 아닌 나머지 주파수에 해당하는 정현파 성분들에 대하여는, 현재 파셜의 양자화된 진폭 값 q_a(i)과 바로 이전에 양자화된 진폭 값 q_a(i-1)과의 차를 구하고(S160), 구한 차를 코딩한다(S170).

도 3은 도 2의 방법이 적용되는 일 예를 나타낸 도면이다.

현재 프레임의 정현파 성분 p30, p31, p32, p33, p34, p35 및 p36 중에서 연속 모드 정현파 성분은 p31, p32, p34 및 p36이다. p31은 p20으로부터 연속되고, p32는 p21로부터 연속되고, p34는 p22로부터 연속되고, p36은 p23으로부터 연속된다.

반면, 신생 모드 정현파 성분은 p30, p33 및 p35이다.

이때 관련 기술에 따른 방법을 적용하면, p30의 진폭 값 a30에 대하여는 절대 코딩을 하지만, p33의 진폭 값 a33에 대하여는 diff33 = a33 - a30을 취하여 diff33을 코딩한다. 또한 p35의 진폭 값 a35에 대하여는 diff35 = a35 - a33을 취하여 diff35를 코딩한다.

본 발명에서는 이러한 관련 기술에 따른 방법보다도 코딩에 필요한 비트 수를 더 줄일 수 있는 효율적인 정현파 오디오 코딩 및 디코딩 방식을 제안하고자 한다.

본 발명이 이루고자 하는 기술적 과제는 신생 모드(birth mode) 정현파 성분의 효율적인 코딩이 가능하도록 하는 정현파 오디오 코딩 방법 및 장치, 그리고 상기 정현파 오디오 코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.

본 발명이 이루고자 하는 다른 기술적 과제는 신생 모드(birth mode) 정현파 성분의 효율적인 디코딩이 가능하도록 하는 정현파 오디오 디코딩 방법 및 장치, 그리고 상기 정현파 오디오 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.

본 발명은 언급된 관련 기술에서 신생 모드 정현파 성분들 간에서만 차이값 코딩(difference coding)이 수행되는 것을 개선하여 더 효율적인 코딩이 가능하도록 한다.

오디오 신호에 있어서는 주파수 값이 가까운 정현파 신호들은 진폭 값이 유사한 특징을 가지고 있다. 따라서, 진폭 값에 대하여 차이 값 코딩(difference coding)을 수행할 때 주파수가 가까운 신호와의 차이값(difference)을 구하는 것이 유리하다. 그런데, 도 2의 관련 기술에서는 신생 모드 정현파 성분들(즉 birth partial들) 간에만 차이 값 코딩이 수행되므로, 주파수 간격이 큰 경우에는 차이값 코딩의 효율이 떨어지게 된다. 예를 들어 도 3에서 p33의 코딩의 경우, p30과 p33의 주파수 간격이 크므로 두 신호의 진폭 값은 차이가 클 수가 있다. 이 경우, 두 진폭 값의 차이를 코딩하면, 코딩된 값은 비트 수가 많아지게 된다. 예를 들어, a33은 크기가 3비트이고, a30은 크기가 10비트인 경우, 그 차이값은 a33보다 그 크기가 더 커지게 된다.

차이값 코딩을 하는 이유는 정현파 성분들의 진폭 값 간에 상관 관계가 있는 경우 이를 이용하면 절대 코딩(absolute coding)을 하는 경우보다 비트 수가 적기 때문이다. 그런데, 상기 언급한 예에서는 오히려 절대 코딩을 하는 경우가 더 효율적일 수도 있다.

본 발명에서는 신생 모드 정현파 신호를 코딩할 때 정현파 신호 간의 상관 관계가 큰 정현파 신호를 이용하여 차이값 코딩을 수행하여 비트 수를 줄이고자 한다.

이를 위하여 본 발명에 따른 정현파 오디오 코딩 방법은, 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계; 상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현 파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계; 상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계; 상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계; 및 상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함하는 것이 바람직하다.

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.

상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계는, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하는 단계; 상기 양자화된 진폭 값을 역양자화하는 단계; 상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하는 단계; 상기 구한 차이 값을 양자화하는 단계; 및 상기 양자화된 차이 값을 코딩하는 단계를 포함하는 것이 바람직하다.

상기 기술적 과제를 이루기 위한 정현파 오디오 코딩 장치는, 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 정현파 분석부; 상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 정현파 성분 트랙킹부; 상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾아서, 상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 신생 모드 진폭 코딩부; 및 상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 신생 모드 주파수 코딩부를 포함하는 것이 바람직하다.

상기 신생 모드 진폭 코딩부는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.

상기 신생 모드 진폭 코딩부는, 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.

상기 신생 모드 진폭 코딩부는, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하고, 상기 양자화된 진폭 값을 역양자화하고, 상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하고 양자화하여, 상기 양자화된 차이 값을 코딩하는 것이 바람직하다.

상기 다른 기술적 과제를 이루기 위한 정현파 오디오 디코딩 방법은, 현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 단계; 상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 단계; 상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계; 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하는 단계; 및 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 단계를 포함하는 것이 바람직하다.

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.

상기 다른 기술적 과제를 이루기 위한 정현파 오디오 디코딩 장치는, 현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 연속 모드 성분 디코딩부; 상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 신생 모드 주파수 디코딩부; 및 상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾고, 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하고, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 신생 모드 진폭 디코딩부를 포함하는 것이 바람직하다.

상기 신생 모드 진폭 디코딩부는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.

상기 신생 모드 진폭 디코딩부는, 이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.

이하 첨부된 도면들을 참조하여 본 발명에 따른 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치에 대하여 상세히 설명한다.

도 4를 참조하면, 본 발명에 따른 정현파 오디오 코딩 장치(100)는 정현파 분석부(110), 정현파 성분 트랙킹부(120), 신생 모드 진폭 코딩부(130) 및 신생 모드 주파수 코딩부(140)를 포함하는 것이 바람직하다.

정현파 분석부(110)는 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출한다.

정현파 성분 트랙킹부(120)는 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연 속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩한다.

신생 모드 진폭 코딩부(130)는, 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾아서, 상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩한다.

신생 모드 주파수 코딩부(140)는 신생 모드 정현파 성분의 주파수 값을 코딩한다.

먼저 정현파 분석부(110)에서 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출한다(도시되지 않음).

정현파 성분 트랙킹부(120)는 연속 모드 정현파 성분에 대하여 정현파 성분 트랙킹(sinusoid tracking)을 수행하고 코딩한다(S200). 정현파 성분 트랙킹(sinusoid tracking)은 현재 프레임의 정현파 성분(파셜, partial)이 이전 프레임의 정현파 성분(파셜)과 연속되는지를 판단하는 과정이다.

이전 프레임의 정현파 성분과 트랙킹되지 않은 정현파 성분들은 현재 프레임에서 새로 생긴 정현파 성분들이다. 이들을 신생 모드 정현파 성분이라고 한다. 이러한 신생 모드 정현파 성분, 또는 신생 파셜(birth partial)을 주파수의 오름 차순으로 정렬한다(S210). 이때 신생 파셜의 수를 n개라고 가정한다.

주파수가 낮은 것부터 순서대로 각각의 정현파 성분에 대하여 다음의 과정을 수행한다(S220). 이때 각각의 정현파 성분은 p(i), 주파수 값은 f(i), 진폭 값은 a(i)라고 한다.

1. 먼저, 주파수 값 f(i)에 대하여 양자화를 수행한다(S230). 양자화된 주파수 값을 q_f(i)라고 한다.

2. 양자화된 주파수 값에 대하여 역양자화(inverse quantization)을 수행한다(S240). 역양자화된 값을 iq_f(i)라고 한다.

3. 정현파 성분들 중에서 p(i)의 주파수 값과 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는다(S250). S250 단계에서 찾은 가장 가까운 주파수 값을 가지는 정현파 성분을 pnf(i)라고 한다.

4. 현재 코딩하고자 하는 정현파 성분 p(i)의 진폭 값 a(i)와 pnf(i)의 진폭 값 b(i)와의 차이를 구하고 이를 코딩한다(S260).

상기 S230 단계 및 S240 단계를 수행하는 이유는, 주파수 값을 디코딩 측에서 사용하는 값과 동일한 값이 되도록 하기 위해서이다.

도 6을 참조하면, 본 발명에 따른 정현파 오디오 디코딩 장치(200)는 연속 모드 성분 디코딩부(210), 신생 모드 주파수 디코딩부(220) 및 신생 모드 진폭 디코딩부(230)를 포함하는 것이 바람직하다.

연속 모드 성분 디코딩부(210)는 현재 프레임의 코딩된 정현파 성분들 중 연 속 모드(continuation mode) 정현파 성분을 디코딩한다.

신생 모드 주파수 디코딩부(220)는 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩한다.

신생 모드 진폭 디코딩부(230)는 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾고, 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하고, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구한다.

반면, 신생 모드 정현파 성분은 p30, p33 및 p35이다.

도 3에 도시된 관련 기술에 따른 방법의 경우에는, p33의 진폭 값 a33을 코딩하기 위하여 신생 모드 정현파 신호들 중에서 가장 주파수 값이 가까운 p30을 찾고, 진폭 값의 차이 diff33_related = a33 - a30을 구하여 코딩하였다.

반면 본 발명에 따른 오디오 코딩 방법에서는 신생 모드 정현파 신호뿐만 아니라 연속 모드 정현파 신호들을 포함하는 모든 정현파 신호들 중에서 가장 주파수 값이 가까운 p32를 찾아서, 진폭 값의 차이 diff33_present = a33 - a32를 구하여 코딩한다(10).

p33과 p30은 주파수 차이가 크므로 diff33_related는 큰 값을 가지게 된다. 반면 p33과 p32는 주파수 차이가 작으므로 diff33_present는 작은 값을 가지게 된다. 따라서, 본 발명에 따른 정현파 오디오 코딩 방식을 적용하면, 신생 모드 정현파 신호의 진폭 값을 코딩하는데 필요한 비트 수가 줄어들게 된다.

도 5의 S250 단계에서 가장 가까운 주파수 값을 가지는 정현파 성분 pnf(i)를 찾는 방식에는 다음과 같은 여러 방식이 가능하다.

1. 바로 이전 프레임과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

2. 이전에 코딩되어 저장부에 저장되어 있는 정현파 성분들, 즉 이전의 모든 프레임들과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

3. 이전에 코딩된 정현파 성분들 중에서 현재 프레임의 정현파 성분들을 제외한 것들 중에서, 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

4. 현재 프레임에서 이미 코딩된 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

5. 바로 이전 프레임과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

6. 이전에 코딩되어 저장부에 저장되어 있는 정현파 성분들, 즉 이전의 모든 프레임들과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

7. 이전에 코딩된 정현파 성분들 중 현재 프레임의 정현파 성분들을 제외하고, 그것들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중, 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

8. 현재 프레임에서 이미 코딩된 정현파 성분들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.

현재 프레임의 정현파 성분들뿐만 아니라 이전 프레임의 정현파 성분들을 더 이용하는 것은 다음과 같은 장점이 있다. 도 8을 참조하여 이를 설명한다.

도 8을 참조하면, p33'를 코딩하는 경우에 있어서, 현재 프레임에서 가장 가까운 주파수 값을 가지는 정현파 신호는 p32'이지만, 이전 프레임의 정현파 성분들을 포함하는 모든 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 신호는 p21'이다. 따라서, 현재 프레임의 정현파 신호들만을 사용하는 경우에는 p33'은 p32'를 이용하여 진폭 값을 코딩하지만(21), 이전 프레임의 정현파 신호들도 사용하는 경우에 p33'은 p21'을 이용하여 진폭 값을 코딩한다(20).

또한 도 5의 S260 단계에서 진폭 값의 차이를 구하는 방식은 다음과 같은 여러 방식이 가능하다.

1. 코딩하고자 하는 정현파 성분의 진폭 값 a(i)과 가장 가까운 주파수 값을 가지는 정현파 성분의 진폭 값 b(i)를 각각 양자화한 후(양자화된 값을 각각 qa 및 qb라고 한다) 양자화된 진폭 값들의 차이(y = qa - qb)를 구하여 코딩하는 방식.

이때 디코더에서는 qb와 y를 알고 있으며, 이로부터 qa = qb + y를 구할 수 있다.

2. 가장 가까운 주파수 값을 가지는 정현파 성분의 진폭 값 b(i)을 양자화한 후(양자화된 값을 qb라고 한다), 코딩하고자 하는 정현파 성분의 진폭 값 a(i)와 상기 양자화된 값 b의 차이(d = a(i) - qb)를 구하고, 구한 차이 값(d)을 양자화하여 코딩하는 방식.

이때 디코더에서는 양자화된 차이 값을 역양자화하여 d를 구하고, 이로부터 정현파 성분의 진폭 값 a(i) = d + qb를 구할 수 있다.

본 발명에 따른 정현파 오디오 코딩 방식과 관련 기술에 따른 정현파 오디오 코딩 방식에서의 코딩의 효율성을 실험 결과를 통하여 살펴본다.

도 9는 본 발명에 따른 정현파 오디오 코딩 방식을 적용하는 경우, 관련 기술과 비교한 코딩의 이득(Gain)을 나타낸 테이블이다.

도 9에서 이득(gain)이란 코딩 후의 비트 수가 줄어든 비율을 나타낸다. 예를 들어, 15.89 퍼센트의 이익이란 비트 수가 15.89 퍼센트 줄어듦을 의미한다.

도 9를 참조하면, 8개의 테스트 시퀀스(Bass, Brahms, Dongwoo, Dust, Harp, Horn, Hotel 및 Trilogy)를 이용하여 테스트를 수행하였다.

첫번째 항목인 birth에서 amplitude의 gain이란, 신생 모드(birth mode) 정현파 신호의 진폭 값을 코딩하기 위하여 사용된 비트 수의 감소를 나타낸다. 도 9를 참조하면 관련 기술과 비교하여 평균적으로 15.89 퍼센트의 이득이 있음을 알 수 있다.

두번째 항목인 birth에서 Gain이란, 신생 모드 정현파 신호의 진폭 값, 주파수 값 및 위상 값을 코딩하기 위하여 사용된 비트 수의 감소를 나타낸다. 도 9를 참조하면, 신생 모드 정현파 신호 전체를 코딩하기 위하여 사용되는 비트 수가 평균적으로 4.28 퍼센트 감소하였음을 알 수 있다.

세번째 항목인 전체 bit rate에서 gain이란, 신생 모드 및 연속 모드 정현파 신호 모두를 코딩하기 위하여 사용된 비트 수의 감소를 나타낸다. 도 9를 참조하면, 전체 코딩된 비트 수가 관련 기술과 비교하여 2.11 퍼센트 감소하였음을 알 수 있다.

본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.

비록 상기 설명이 다양한 실시예들에 적용되는 본 발명의 신규한 특징들에 초점을 맞추어 설명되었지만, 본 기술 분야에 숙달된 기술을 가진 사람은 본 발명의 범위를 벗어나지 않으면서도 상기 설명된 장치 및 방법의 형태 및 세부 사항에서 다양한 삭제, 대체, 및 변경이 가능함을 이해할 것이다. 따라서, 본 발명의 범위는 상기 설명에서보다는 첨부된 특허청구범위에 의해 정의된다. 특허청구범위의 균등 범위 안의 모든 변형은 본 발명의 범위에 포섭된다.

본 발명에 따른 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치에 의하면, 신생 모드 정현파 신호의 진폭 값을 코딩함에 있어서, 신생 모드 정현파 신호뿐만 아니라 연속 모드 정현파 신호 모두를 포함한 정현파 신호들 중에서 가장 가까운 주파수 값을 가지는 정현파 신호를 찾고, 이들의 진폭 값의 차이를 구하여 코딩함에 의하여, 코딩된 진폭 값이 낮은 비트 레이트를 가지도록 한다. 따라서, 효율적인 오디오 신호의 코딩이 가능하게 된다.

Claims

입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계;

상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계;

상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계;

상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계; 및

상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
제1항에 있어서,

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,

상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
제1항에 있어서,

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,

이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
제3항에 있어서,

상기 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계는,

상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분인 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
제3항에 있어서,

상기 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계는,

상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분이 아닌 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
제1항에 있어서,

상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계는,

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하는 단계;

상기 양자화된 진폭 값을 역양자화하는 단계;

상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하는 단계;

상기 구한 차이 값을 양자화하는 단계; 및

상기 양자화된 차이 값을 코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 정현파 분석부;

상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 정현파 성분 트랙킹부;

상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾아서, 상기 신생 모드 정현파 성분의 진폭 값과 상기 가 장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 신생 모드 진폭 코딩부; 및

상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 신생 모드 주파수 코딩부를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 장치.
제7항에 있어서,

상기 신생 모드 진폭 코딩부는,

상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
제7항에 있어서,

상기 신생 모드 진폭 코딩부는,

이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
제9항에 있어서,

상기 신생 모드 진폭 코딩부는,

상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분인 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
제9항에 있어서,

상기 신생 모드 진폭 코딩부는,

상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분이 아닌 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
제7항에 있어서,

상기 신생 모드 진폭 코딩부는,

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하고, 상기 양자화된 진폭 값을 역양자화하고, 상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하고 양자화하여, 상기 양자화된 차이 값을 코딩하는 것을 특징으로 하는 정현파 오디오 코딩 장치.
현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 단계;

상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 단계;

상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성 분을 찾는 단계;

상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하는 단계; 및

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 방법.
제13항에 있어서,

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,

상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 방법.
제13항에 있어서,

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,

이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 방법.
현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 연속 모드 성분 디코딩부;

상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 신생 모드 주파수 디코딩부; 및

상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾고, 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하고, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 신생 모드 진폭 디코딩부를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 장치.
제16항에 있어서,

상기 신생 모드 진폭 디코딩부는,

상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 디코딩 장치.
제16항에 있어서,

상기 신생 모드 진폭 디코딩부는,

이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 디코딩 장치.
정현파 오디오 코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,

상기 정현파 오디오 코딩 방법은,

입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계;

상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계;

상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계;

상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계; 및

상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
정현파 오디오 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,

상기 정현파 오디오 디코딩 방법은,

현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 단계;

상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 단계;

상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계;

상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하는 단계; 및

상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.