KR20080062705A

KR20080062705A - 오디오 부호화 및 복호화 장치와 그 방법

Info

Publication number: KR20080062705A
Application number: KR1020060138785A
Authority: KR
Inventors: 이건형; 오재원; 이철우; 정종훈; 이남숙
Original assignee: 삼성전자주식회사
Priority date: 2006-12-29
Filing date: 2006-12-29
Publication date: 2008-07-03
Also published as: US8725519B2; CN101563848B; CN101563848A; US20080162149A1; EP2100379A1; WO2008082165A1; KR101299155B1; EP2100379A4

Abstract

본 발명은 저 비트율로 고음질의 오디오 표현이 가능하여 MDCT 부호화 방식과 파라메트릭 부호화 방식에서의 문제점을 해결할 수 있는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 본 발명의 한 유형에 따른 방법은, 오디오 부호화 방법에 있어서, 입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계; 나머지 오디오 신호와 정현파의 추가 기저벡터를 이용하여 추가 기저벡터 성분을 계산하는 단계; 상기 추가 기저벡터 성분 전송 여부를 결정하는 단계; 및 상기 추가 기저벡터 성분에 대한 전송이 결정되면, 상기 정현파의 주파수 및/또는 위상과 진폭 및 상기 추가 기저 벡터 성분을 부호화하는 단계를 포함하고, 상기 나머지 오디오 신호는 상기 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 한다.

Description

오디오 부호화 및 복호화 장치와 그 방법{Audio encoding and decoding apparatus and method thereof}

도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.

도 2는 도 1에 도시된 추가 기저벡터 성분 전송 결정부의 상세한 기능 블록도의 일 예이다.

도 3은 도 1에 도시된 추가 기저벡터 성분 전송 결정부의 상세한 기능 블록도의 다른 예이다.

도 4는 본 발명의 일 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.

도 5는 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.

도 6은 도 5의 오디오 부호화 방법에 대응되는 오디오 복호화 방법의 동작 흐름도이다.

도 7은 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.

도 8은 도 7에 도시된 추가 기저벡터 성분 전송 여부를 결정하는 과정의 상 세한 동작 흐름도이다.

도 9는 도 7의 오디오 부호화 방법에 대응되는 오디오 복호화 방법의 동작 흐름도이다.

본 발명은 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 특히, 저 비트율(Low bit rate)로 고음질(High-quality)의 오디오 신호를 표현할 수 있는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것이다.

기존의 고음질의 오디오 부호화 장치는 대부분 시간-주파수 변환(Time-Frequency Transform) 부호화 방식을 사용하고 있다. 이 방식은 MDCT(Modified Discrete Cosine Transform)와 같은 변환을 이용하여 입력되는 오디오 신호를 주파수 공간으로 변환하여 얻은 계수를 부호화하는 방식이다. 그러나, 이 부호화 방식은 타겟 비트율(target bit rate)이 낮아질수록 표현되는 음질이 저하되는 단점을 갖고 있다.

저 비트율로 오디오 신호를 부호화 방식으로 파라메트릭(Parametric) 부호화 방식이 알려져 있다. 이 파라메트릭 부호화 방식은 입력되는 오디오 신호로부터 정현파(partial)를 검출하고, 검출된 정현파의 주파수(frequency), 위상(phase) 및 진폭(amplitude)을 부호화하는 방식이다. 특히, 이 파라메트릭 부호화 방식은 입력되는 오디오 신호로부터 진폭이 큰 몇 개의 정현파를 검출하여 부호화 하여도 많은 MDCT계수를 부호화하는 효과를 얻을 수 있기 때문에 입력되는 오디오 신호를 저비트율로 부호화하는 것이 가능하다.

그러나 파라메트릭 부호화 방식으로 고음질의 오디오 신호를 표현하기 위해서는 입력되는 오디오 신호로부터 많은 개수의 정현파를 검출하여 부호화하여야 한다. 즉, 입력되는 오디오 신호의 주파수와 진폭이 고정된 하나의 정현파로 구성된 경우에, 파라메트릭 부호화 방식은 하나의 진폭, 하나의 주파수, 및 하나의 위상을 부호화하는 것으로 오디오 신호를 충분히 표현할 수 있다.

반면에 입력되는 오디오 신호의 주파수와 진폭이 다수개의 정현파로 구성된 경우에, 고음질의 오디오 신호를 표현하기 위해서, 파라메트릭 부호화 방식은 입력되는 오디오 신호로부터 다수개의 정현파를 검출하고, 검출되는 각 정현파들의 진폭, 주파수 및 위상을 부호화하여야 하므로, 부호화 효율이 저하된다.

또한, 파라메트릭 부호화 방식은 오디오 신호로부터 검출되는 정현파의 주파수가 시간에 따라 변하지 않는 안정된 주파수를 갖는 경우에 유리하다. 그러나 잡음 등의 이유로 인하여 정현파의 주파수나 진폭이 시간에 따라 변하면 검출해야 할 정현파의 수가 증가하므로, 파라메트릭 부호화 방식은 매우 비효율적이다.

상술한 경우에 파라메트릭 부호화 방식이 비효율적인 것은 파라메트릭 부호화 방식의 경우에 검출되는 정현파의 개수가 많을수록 부호화하여야 하는 진폭, 주파수 및 위상이 많기 때문이다. 따라서, 파라메트릭 부호화 방식은 타겟 비트율이 낮은 오디오 부호화 및 복호화 장치(또는 오디오 코덱(codec))에 적합하나 고음질 또는 타겟 비트율이 높은 오디오 부호화 및 복호화 장치에는 부적합하다.

본 발명이 이루고자 하는 기술적 과제는 저 비트율로 고음질의 오디오 표현이 가능하여 MDCT 부호화 방식과 파라메트릭 부호화 방식에서의 문제점을 해결할 수 있는 오디오 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 부호화 방법에 있어서, 입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계; 나머지 오디오 신호와 정현파의 추가 기저벡터를 이용하여 추가 기저벡터 성분을 계산하는 단계; 상기 추가 기저벡터 성분 전송 여부를 결정하는 단계; 및 상기 추가 기저벡터 성분에 대한 전송이 결정되면, 상기 정현파의 주파수 및/또는 위상과 진폭 및 상기 추가 기저 벡터 성분을 부호화하는 단계를 포함하고, 상기 나머지 오디오 신호는 상기 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 복호화 방법에 있어서, 부호화된 오디오 신호를 파싱하는 단계; 상기 파싱에 의해 얻어진 부호화된 주파수 및/또는 위상과 진폭을 복호화하여 정현파를 복원하는 단계; 상기 파싱에 의해 얻어진 추가 기저벡터 성분을 복호화하여 나머지 오디오 신호를 복원하는 단계; 및 상기 복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 생성하는 단계를 포함하고, 상기 나머지 오디오 신호는 오디오 신호를 부호화할 때 오디오 신호로부터 검출된 정현파를 제외 한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 부호화 방법에 있어서, 입력되는 오디오 신호를 특정 길이로 세그먼트 하는 단계; 상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계; 상기 검출된 정현파의 주파수 및/또는 위상과 진폭을 양자화 하는 단계; 상기 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 단계; 상기 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전에 설정된 참조 값을 토대로 상기 검출된 각 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계; 및 상기 양자화된 주파수 및/또는 위상과 진폭 및 상기 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호를 부호화하는 단계를 포함하고, 상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중에서 상기 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 복호화 방법에 있어서, 부호화된 오디오 신호를 파싱하는 단계; 상기 파싱에 따라 얻어진 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 단계; 상기 파싱에 따라 얻어진 제어 파라미터를 복호화 하는 단계; 상기 파싱에 따라 얻어진 추가 기저벡터 성분을 복호화 하는 단계; 상기 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 단계; 상기 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 단계; 상기 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신 호를 복원하는 단계; 및 복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 오디오 신호를 복원하는 단계를 포함하고, 상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는,오디오 부호화 장치에 있어서, 입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부; 상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 정현파 검출부; 상기 정현파 검출부에 의해 검출된 상기 정현파의 주파수 및 /또는 위상과 진폭을 양자화 하는 양자화부; 상기 양자화부에서 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 역양자화부; 상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전에 설정된 참조 값을 토대로 상기 검출된 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 추가 기저벡터 성분 전송 결정부; 및 상기 양자화부로부터 출력되는 양자화된 주파수 또는/ 및 위상과 진폭, 상기 추가 기저벡터 성분 전송 결정부로부터 출력되는 신호를 부호화하는 부호화부를 포함하고, 상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중 상기 정현파 검출부에서 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 장치를 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는, 오디오 복호화 장치에 있어서, 부호화된 오디오 신호를 파싱하는 파싱부; 상기 파싱부로부터 출력되는 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 역양자 화부; 상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 정현파 복원부; 상기 파싱부로부터 출력되는 제어 파라미터를 복호화 하는 제어 파라미터 복호화부; 상기 역양자화부에서 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 추가 기저벡터 유도부; 상기 파싱부로부터 출력되는 추가 기저벡터 성분을 복호화 하는 추가 기저벡터 성분 복호화부; 상기 추가 기저벡터 유도부에서 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원하는 나머지 오디오 신호 복원부; 및 정현파 복원부로부터 복원된 정현파와 상기 나머지 오디오 신호 복원부에서 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 출력하는 혼합부를 포함하고, 상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 장치를 제공한다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치(100)의 기능 블록도이다. 도 1을 참조하면, 오디오 부호화 장치(100)는 세그먼테이션(segmentation) 부(110), 정현파 검출부(120), 양자화부(130), 역양자화부(140), 추가 기저벡터(basis vector) 성분 전송 결정부(150), 및 부호화부(160)를 포함한다.

세그먼테이션부(110)는 입력되는 오디오 신호를 시간에 따라 특정 길이 L로 세그먼트한다. 따라서, 세그먼테이션부(110)로부터 출력되는 오디오 신호가 S(n)이 면, 상기 n은 시간에 따른 인덱스로서, n=1∼L로 정의될 수 있다. 입력되는 오디오 신호를 특정 길이 L로 세그먼트할 때, 세그먼트된 오디오 신호들은 L/2 또는 특정 길이만큼 이전 세그먼트와 겹칠 수 있다.

정현파 검출부(120)는 매칭 추적 방식으로 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출한다. 즉, 정현파 검출부(120)는 우선 세그먼트된 오디오 신호로부터 가장 큰 진폭(amplitude)을 갖는 정현파를 검출한다. 다음, 정현파 검출부(120)는 상기 검출된 정현파를 제외한 세그먼트된 오디오 신호로부터 그 다음으로 큰 진폭을 갖는 정현파를 검출한다. 검출하려는 정현파의 진폭이 타겟 비트율(target bit rate)에 따라 사전에 설정된 정현파의 진폭(amplitude)에 도달할 때까지 정현파 검출부(120)는 세그먼트된 오디오 신호로부터 정현파를 검출하는 과정을 반복적으로 수행한다.

따라서, 정현파 검출부(120)는 고음질의 오디오 신호를 표현할 경우에도 사전에 설정된 정현파의 진폭 보다 작은 진폭을 갖는 정현파를 세그먼트된 오디오 신호로부터 검출하지 않는다.

정현파 검출부(120)에서 검출되는 각 정현파는 수학식 1과 같이 정의할 수 있다.

수학식 1에서

는 검출된 정현파의 진폭으로, 정현파의 기저 벡 터(basis vector)의 성분(component)이고,

는 하기 수학식 2와 같이 주파수가

이고, 위상이

인 정현파의 기저 벡터(basis vector)이다.

수학식 2에서 A는

의 크기를 1로 만들기 위한 규격화 상수이다. 여기서 i는 검출된 정현파의 개수와 대응되는 것으로, 서로 다른 정현파를 지칭하는 인덱스이다. 정현파 검출부(110)에서 검출된 정현파의 개수가 K개이면, i는 i=1∼K의 값을 갖는다.

양자화부(130)는 정현파 검출부(120)에서 검출된 각 정현파의 주파수

및/또는 위상

과 진폭

을 각각 양자화한다.

역양자화부(140)는 양자화부(130)에서 양자화된 주파수

및/또는 위상

과 진폭

을 역양자화한다.

추가 기저 벡터 성분 전송 결정부(150)는 각 검출된 정현파의 추가 기저 벡터(basis vector) 성분(component)을 전송할지 여부를 결정한다. 즉, 역양자화부(140)로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭, 정현파 검출부(120)로부터 제공되는 나머지 오디오 신호(residual audio signal)(

), 및 사 전에 설정된 참조 값을 토대로 검출된 각 정현파의 추가 기저 벡터(basis vector) 성분(component)을 전송할지 여부를 결정한다.

상기 나머지 오디오 신호

는 세그먼트된 오디오 신호중 정현파 검출부(120)에서 검출된 정현파를 제외한 오디오 신호이다. 따라서 나머지 오디오 신호

는 수학식 3과 같이 정의된다.

수학식 3에서

는 세그먼트된 오디오 신호로부터 K개의 정현파가 검출된 것을 의미한다.

사전에 설정된 참조 값은 유도할 기저 벡터의 수(F)와 유도할 기저 벡터의 수(F)에 따라 결정되는 주파수 변동분(k0), 및 추가 기저벡터 성분을 사용하는 것이 효율적인지를 판단하기 위한 기준 값을 포함한다. 만약 추가 기저벡터 성분이 전송되는 것으로 판단되면, 추가 기저 벡터 성분 전송 결정부(150)로부터 출력되는 신호는 제어 파라미터(control parameter)와 추가 기저 벡터 성분을 포함한다. 제어 파라미터는 추가 기저 벡터 성분 전송 여부를 나타내는 파라미터를 포함하거나 추가 기저 벡터 성분 전송여부를 나타내는 파라미터와 추가 기저벡터 유도 방식을 나타내는 파라미터를 포함할 수 있다.

추가 기저 벡터 성분 전송 결정부(150)는 도 2에 도시된 바와 같이 구성될 수 있다. 도 2를 참조하면, 추가 기저 벡터 성분 전송 결정부(150)는 추가 기저 벡터 유도기(210), 추가 기저벡터 성분 계산기(220), 부호화 효율(efficiency) 계산기(230), 및 추가 기저 벡터 성분 전송 결정기(240)를 포함한다.

추가 기저 벡터 유도기(210)는 정현파 검출부(120)에서 검출된 각 정현파의 추가 기저 벡터를 유도한다. 즉, 추가 기저 벡터 유도기(210)는 사전에 설정된 유도할 기저 벡터의 수(F)와 유도할 기저 벡터의 수(F)에 따라 결정되는 주파수 변동분(k0)과 역양자화된 주파수

및/또는 위상

을 이용하여 각 정현파에 대한 추가 기저 벡터를 유도한다. 하나의 정현파에 대해 기저 벡터는 다수개가 유도될 수 있다. 만약 유도할 기저 벡터의 수(F)가 2로 설정된 경우에 추가 기저벡터 유도기(210)는 수학식 4와 같은 추가 기저 벡터

를 유도할 수 있다.

에서

는 유도된 추가 기저벡터의 인덱스이다.

수학식 4의 경우에 추가 기저 벡터의 수 F가 2로 설정됨에 따라 유도할 기저 벡터의 수에 따라 결정되는 주파수 변동분(k0)이 ±1/2로 설정된 경우이다. 수학식 4에서 위상

는 수학식 5의 조건을 만족하도록 오디오 부호화 장치와 오디오 복호화 장치에서 각각 결정된다.

수학식 5에서

은 추가 기저 벡터로서, 수학식 5를 통해 추가 기저 벡터가 정현파에 수직이 되며, 수학식 4와 5를 토대로 유도된 기저 벡터는 검출된 정현파와 약간 다른 주파수를 가지면서 검출된 정현파에 수직인 벡터임을 알 수 있다.

또한, 추가 기저벡터 유도기(210)는 상기 유도할 추가 기저벡터의 수 F가 4로 설정된 경우에, 하기 수학식 6과 같이 추가 기저벡터를 유도할 수 있다.

수학식 6에서 주파수 변동분 k0가 1이면, 검출된 정현파에 대해 주파수가 1만큼 크고 작은 사인파와 코사인파가 추가 기저벡터로서 유도된 것이다.

추가 기저벡터 성분 계산기(220)는 나머지 오디오 신호

과 추가 기저벡터 유도기(210)에서 유도된 추가 기저 벡터

를 수학식 7과 같이 연산하여 추가 기저벡터 성분

을 계산한다.

수학식 7에서

는 상기 추가 기저벡터 성분

이 특정 길이 L로 세그먼트된 오디오 신호의 추가 기저벡터

에 대한 성분(component)임을 의미한다. 즉, 추가 기저벡터 성분

은 유도된 추가 기저벡터당 하나의 추가 기저벡터 성분이 계산된다. 예를 들어, 유도된 추가 기저벡터가 수학식 4와 같이 2개인 경우에 추가 기저벡터 성분

은 2개(즉,

,

)가 계산된다. 유도된 추가 기저벡터가 수학식 6과 같이 4개인 경우에 추가 기저벡터 성분

은 4개(즉,

,

)가 계산된다.

추가 기저 벡터 성분 계산기(220)는 계산된 추가 기저 벡터 성분을 우선, 효율 계산기(230)로 전송하고, 추가 기저 벡터 성분 전송 결정기(240)로부터 추가 기저 벡터 성분이 전송되는 것으로 결정되면, 계산된 추가 기저벡터 성분을 부호화부(160)로 전송한다.

부호화 효율 계산기(230)는 추가 기저벡터 성분 계산기(220)에서 계산된 추가 기저벡터 성분

과 역양자화된 진폭

, 사전에 설정된 유도된 기저 벡터의 수 F를 이용하여 수학식 8과 같이 각 정현파에 대한 부호화 효율(efficiency)을 계산한다.

추가 기저벡터 성분 전송 결정기(240)는 사전에 설정된 기준 값과 부호화 효율 계산기(230)에서 계산된 부호화 효율을 비교한다. 상기 기준 값은 추가 기저벡터 성분을 사용하는 것이 효율적인지를 판단할 수 있는 것으로 사전에 설정된다.

비교결과, 계산된 부호화 효율이 상기 기준 값보다 크면, 추가 기저벡터 성분 전송 결정기(240)는 해당되는 추가 기저벡터 성분을 전송하는 것이 효율적이라고 판단한다. 이에 따라 추가 기저벡터 성분 전송 결정기(240)는 추가 기저벡터 성분 계산기(220)로 계산된 추가 기저벡터 성분을 출력하도록 제어하면서 추가 기저벡터 성분이 전송됨을 나타내는 파라미터를 포함하는 제어 파라미터를 부호화부(160)로 전송한다.

만약 추가 기저벡터 성분 전송 결정기(240)에서 추가 기저벡터 성분을 전송하지 않는 것이 효율적이라고 판단되면, 추가 기저벡터 성분 전송 결정기(240)는 추가 기저벡터 성분 계산기(220)에서 계산된 추가 기저벡터 성분을 부호화부(160)로 전송시키지 않는다. 이 때, 추가 기저벡터 성분 전송 결정기(240)로부터 출력되는 제어 파라미터는 추가 기저벡터 성분이 전송되지 않음을 나타내는 파라미터를 포함한다.

한편, 추가 기저벡터 성분 전송 결정부(150)는 도 3에 도시된 바와 같이 구성될 수 있다. 도 3을 참조하면, 추가 기저 벡터 성분 전송 결정부(150)는 제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J), 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J), 제 1 내지 제 J 부호화 효율(efficiency) 계산기(330_1∼330_J), 및 추가 기저 벡터 성분 전송 결정기(340)를 포함한다.

제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J)는 도 2의 추가 기저벡터 유도기(210)와 유사하게 구성되어 동작한다. 그러나, 제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J)는 추가 기저 벡터 수(F)와 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0)이 다르게 설정되어 운영된다. 예를 들어, 제 1 추가 기저 벡터 유도기(310_1)는 추가 기저 벡터 수 F가 2로 설정되고, 주파수 변동분 k0가 ±1/2로 설정되어 수학식 4와 같이 추가 기저벡터를 유도할 수 있다. 반면에 제 J 추가 기저 벡터 유도기(310_J)는 추가 기저벡터 수 F가 4로 설정되고, 주파수 변동분 k0가 ±1로 설정되어 수학식 6과 같이 추가 기저벡터를 유도할 수 있다. 제 1 추가 기저벡터 유도기(310_1)와 제 J 추가 기저벡터 유도기(310_J) 사이에 존재하는 미 도시된 추가 기저벡터 유도기들은 제 1 및 제 J 추가 기저벡터 유도기(310_1, 310_J)에 설정된 추가 기저벡터 수 F 및 주파수 변동분 k0과 다른 추가 기저벡터 수 F와 주파수 변동분 k0이 설정되어 운영된다.

제 1 내지 제 J 추가 기저 벡터 성분 계산기(320_1∼320_J)는 도 2의 추가 기저벡터 성분 계산기(220)와 유사하게 나머지 오디오 신호

과 제 1 내지 제 J 추가 기저벡터 유도기(310_1∼310_J)중 해당되는 추가 기저벡터 유도기에서 유도된 추가 기저 벡터

을 수학식 7과 같이 연산하여 추가 기저벡터 성분

을 계산한다. 예를 들어, 제 1 추가 기저 벡터 성분 계산기(320_1)의 경우에 상기 해당되는 추가 기저 벡터 유도기는 제 1 추가 기저 벡터 유도기(310_1)이다.

제 1 내지 제 J 부호화 효율 계산기(330_1∼330_J)는 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J)중 해당되는 추가 기저벡터 성분 계산기에서 계산된 추가 기저벡터 성분

과 역양자화된 진폭

, 사전에 설정된 유도된 기저 벡터의 수 F를 이용하여 수학식 8과 같이 각 정현파에 대한 부호화 효율(efficiency)을 계산한다. 제 1 부호화 효율 계산기(330_1)의 경우에 상기 해당되는 추가 기저벡터 성분 계산기는 제 1 추가 기저벡터 성분 계산기(320_1)이다.

추가 기저벡터 성분 전송 결정기(340)는 제 1 내지 제 J 부호화 효율 계산기(330_1∼330_J)에서 계산된 부호화 효율을 각각 비교하여 가장 높은 부호화 효율을 검출한다. 그 다음, 추가 기저벡터 성분 전송 결정기(340)는 검출된 가장 높은 부호화 효율과 사전에 설정된 기준 값을 비교한다. 사전에 설정된 기준 값은 추가 기저벡터 성분을 사용하는 것이 효율적인지를 판단할 수 있는 것으로 사전에 설정된다.

비교결과, 가장 높은 부호화 효율이 상기 기준 값보다 크면, 추가 기저벡터 성분 전송 결정기(340)는 해당되는 정현파에 대한 추가 기저벡터 성분을 전송하는 것이 효율적이라고 판단한다. 이에 따라 추가 기저벡터 성분 전송 결정기(340)는 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J)중 상기 가장 높은 부호화 효율이 검출된 부호화 효율 계산기에 대응되는 추가 기저벡터 성분 계산기에서 계산된 추가 기저벡터 성분이 출력되도록 제어한다.

이 때, 추가 기저벡터 성분 전송 결정기(340)로부터 출력되는 제어 파라미터는 추가 기저벡터 성분이 전송됨을 나타내는 파라미터와 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터를 포함한다. 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터는 제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J)중 상기 가장 높은 부호화 효율이 검출된 부호화 효율 계산기에 대응되는 추가 기저 벡터 유도기에 대한 식별 정보를 포함한다. 예를 들어, 제 1 추가 기저 벡터 유도기(310_1)에 대응되는 제 1 부호화 효율 계산기(330_1)에서 계산된 부호화 효율이 가장 높은 부호화 효율을 가지면, 상기 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터는 제 1 추가 기저벡터 유도기(310_1)의 식별 정보를 포함한다.

만약 추가 기저벡터 성분 전송 결정기(340)에서 추가 기저벡터 성분을 전송하지 않는 것이 효율적이라고 판단되면, 추가 기저벡터 성분 전송 결정기(340)는 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J)에서 계산된 추가 기저벡터 성분을 부호화부(160)로 전송시키지 않는다. 이 때, 추가 기저벡터 성분 전송 결정기(340)로부터 출력되는 제어 파라미터는 추가 기저벡터 성분이 전송되지 않음을 나타내는 파라미터를 포함한다.

도 1의 부호화부(160)는 양자화부(130)로부터 출력되는 양자화된 주파수 또는/ 및 위상과 진폭, 상기 추가 기저벡터 성분 전송 결정부(150)로부터 출력되는 신호를 부호화하여 부호화된 오디오 신호로서 출력한다. 추가 기저벡터 성분이 전송될 때, 추가 기저벡터 성분 전송 결정부(150)로부터 출력되는 신호는 상술한 바와 같이 추가 기저벡터 성분 및 제어 파라미터를 포함한다. 추가 기저벡터 성분 전송 결정부(150)가 도 2와 같이 구성될 때, 상기 제어 파라미터는 추가 기저벡터 성분 전송을 나타내는 파라미터를 포함한다. 반면에 추가 기저벡터 성분 전송 결정부(150)가 도 3과 같이 구성될 때, 상기 제어 파라미터는 추가 기저벡터 성분 전송을 나타내는 파라미터 및 추가 기저 벡터 유도 방식을 나타내는 파라미터를 포함한다.

한편, 추가 기저벡터 성분이 전송되지 않을 때, 추가 기저벡터 성분 전송 결정부(150)로부터 출력되는 신호는 제어 파라미터를 포함하나 추가 기저벡터 성분을 포함하지 않는다. 이 때, 제어 파라미터는 추가 기저벡터 성분이 전송되지 않음을 나타내는 파라미터를 포함한다.

도 4는 본 발명의 실시 예에 따른 오디오 복호화 장치(400)의 기능 블록도이다. 도 4를 참조하면, 오디오 복호화 장치(400)는 파싱부(410), 역 양자화부(420), 정현파 복원부(430), 제어 파라미터 복호화부(440), 추가 기저벡터 유도부(450), 추가 기저벡터 성분 복호화부(460), 나머지 오디오 신호 복원부(470), 및 혼합부(480)를 포함한다.

파싱부(410)는 부호화된 오디오 신호가 입력되면, 이를 파싱하여 양자화된 주파수 및/또는 위상과 진폭을 역양자화부(420)로 전송하고, 제어 파라미터를 제어 파라미터 복호화부(440)로 전송하고, 추가 기저벡터 성분을 추가 기저벡터 성분 복 호화부(460)로 전송한다.

역양자화부(420)는 양자화된 주파수 및/또는 위상과 진폭을 역양자화한다. 제어 파라미터 복호화부(440)는 제어 파라미터를 복호화 한다. 정현파 복원부(430)는 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원한다. 만약 오디오 부호화시 K개의 정현파가 검출되었으면, K개의 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원한다.

추가 기저벡터 유도부(450)는 역양자화부(420)로부터 제공되는 역양자화된 주파수 및/또는 위상과 진폭 및 제어 파라미터 복호화부(440)로부터 제공되는 제어 파라미터를 토대로 추가 기저벡터를 유도한다. 오디오 부호화 장치가 도 2에 도시된 추가 기저벡터 성분 전송 결정부(150)와 같이 구성되면, 추가 기저벡터 유도부(450)는 도 2의 추가 기저벡터 유도기(210)와 같이 구성되어 추가 기저벡터를 유도한다.

반면에 오디오 부호화 장치가 도 3에 도시된 추가 기저벡터 성분 전송 결정부(150)와 같이 구성되면, 추가 기저벡터 유도부(450)는 도 3의 제 1 내지 제 J 추가 기저벡터 유도기(310_1∼310_J)와 같이 구성되고, 복호화된 제어 파라미터에 의해 제 1 내지 제 J 추가 기저벡터 유도기(310_1∼310_J)중 하나를 선택하여 추가 기저벡터를 유도한다. 추가 기저벡터 유도는 수학식 4 및 6과 같이 유도된다. 이를 위하여 추가 기저벡터 유도부(450)는 추가 기저벡터 수(F)와 상기 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0)이 사전에 설정될 수 있다. 그러나, 오디오 부호화 장치(100)가 사용된 추가 기저벡터 수(F)와 상기 주파수 변동분(k0)을 제어 파라미터에 포함시켜 전송할 경우에, 추가 기저벡터 유도부(450)는 제어 파라미터 복호화부(440)로부터 제공되는 추가 기저벡터 수(F)와 주파수 변동분(k0)을 이용하도록 구현할 수 있다. 추가 기저벡터 유도부(450)에서 유도된 추가 기저 벡터는 나머지 오디오 신호 복원부(470)로 전송된다.

추가 기저벡터 성분 복호화부(460)는 파싱부(410)로부터 제공되는 추가 기저벡터 성분을 복호화 한다.

나머지 오디오 신호 복원부(470)는 추가 기저벡터 성분 복호화부(460)로부터 전송되는 추가 기저벡터 성분과 추가 기저벡터 유도부(450)로부터 유도된 추가 기저벡터를 토대로 나머지 오디오 신호

을 복원한다.

혼합부(480)는 정현파 복원부(430)에서 복원된 정현파와 나머지 오디오 신호 복원부(470)에서 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 출력한다.

오디오 부호화 방법은 우선, 입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출한다(501). 정현파 검출은 타겟 비트율에 따라 결정된 진폭 이상의 진폭을 갖는 정현파를 검출한다. 정현파 검출 방식은 도 1의 정현파 검출부(120)와 유사하게 수행될 수 있다.

다음, 오디오 부호화방법은 나머지 오디오 신호와 각 정현파의 추가 기저벡 터를 이용하여 추가 기저벡터 성분을 계산한다(502). 즉, 제 501 단계에서 검출된 각 정현파의 추가 기저벡터를 유도한다. 추가 기저벡터는 도 2의 추가 기저벡터 유도기(210)에서 설명한 것과 유사하게 유도될 수 있다. 각 정현파의 추가 기저벡터가 유도되면, 나머지 오디오 신호를 이용하여 유도된 추가 기저벡터의 성분을 계산한다. 나머지 오디오 신호는 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호이다. 추가 기저벡터의 성분은 도 2의 추가 기저벡터 성분 계산기(220)에서 설명한 것과 유사하게 계산될 수 있다.

다음, 오디오 부호화 방법은 추가 기저벡터 성분에 대한 전송 여부를 결정한다(503). 즉, 제 502 단계에서 계산된 추가 기저벡터 성분을 토대로 각 정현파의 부호화 효율을 계산한다. 부호화 효율은 도 2의 부호화 효율 계산기(230)에서 설명한 바와 유사하게 계산될 수 있다. 그리고, 계산된 부호화 효율이 사전에 설정된 기준치보다 높으면, 상기 오디오 부호화 방법은 추가 기저벡터 성분을 전송하는 것으로 결정한다. 상기 기준치는 도 2의 추가 기저벡터 성분 전송 결정기(240)에서 설명한 바와 유사한 기준치이다.

추가 기저벡터 성분이 전송되는 것으로 결정되면, 오디오 부호화 방법은 검출된 정현파의 주파수 및/또는 위상과 진폭, 및 제 502 단계에서 계산된 추가 기저벡터 성분을 부호화하여 부호화된 오디오 신호를 생성한다(504).

한편, 도 5의 오디오 부호화 방법에 대응되는 오디오 복호화 방법은 도 6에 도시된 바와 같다. 도 6은 본 발명의 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.

도 6을 참조하면, 오디오 복호화 방법은 우선, 부호화된 오디오 신호가 입력되면, 이를 파싱한다(601). 파싱에 의해 부호화된 주파수 및/또는 위상과 진폭이 얻어지면, 오디오 복호화 방법은 이를 복호화하여 정현파를 복원하면서(602), 파싱에 의해 추가 기저벡터 성분이 얻어지면, 오디오 복호화 방법은 이를 복호화하여 나머지 오디오 신호를 복원한다(603). 여기서 나머지 오디오 신호는 오디오 신호를 부호화할 때 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호이다.

다음, 오디오 복호화 방법은 복원된 정현파와 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 생성한다(604).

도 7은 본 발명의 다른 오디오 부호화 방법의 동작 흐름도이다. 도 1을 참조하여 도 7의 동작 흐름도를 설명하면 다음과 같다.

우선, 상기 오디오 부호화 방법은 입력되는 오디오 신호를 도 1의 세그먼테이션부(110)에서 설명한 바와 같이 특정 길이로 세그먼트한다(701). 다음, 오디오 부호화 방법은, 도 1의 정현파 검출부(120)에서 설명한 바와 같이 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출한다(702).

오디오 부호화 방법은, 도 1의 양자화부(130)에서 설명한 바와 같이 검출된 정현파의 주파수 및/또는 위상과 진폭을 양자화 한다(703). 상기 오디오 부호화 방법은, 도 1의 역양자화부(140)와 같이 양자화된 주파수 및/또는 위상과 진폭을 역양자화 한다(704).

다음, 오디오 부호화 방법은 도 1의 추가 기저벡터 성분 전송 결정부(150)에서 설명한 바와 같이 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신 호, 및 사전에 설정된 참조 값을 토대로 검출된 각 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정한다(705).

제 705 단계는 도 8에 도시된 바와 같이 수행될 수 있다. 도 8은 제 705 단계의 추가 기저벡터 성분을 전송할지 여부를 결정하는 프로세스에 대한 상세한 동작 흐름도이다. 도 8을 참조하면, 추가 기저벡터 성분을 전송할지 여부를 결정하는 프로세스는, 우선, 검출된 각 정현파에 대해 도 2의 추가 기저벡터 유도기(210)와 같이 복수의 추가 기저벡터를 유도한다(801).

다음, 상기 프로세스는 도 2의 추가 기저벡터 성분 계산기(220)와 같이 유도된 각 추가 기저벡터의 성분을 계산한다(802). 상기 프로세스는 도 2의 부호화 효율 계산기(230)에서 설명한 바와 같이 검출된 각 정현파에 대해 상기 계산된 추가 기저벡터 성분을 사용함에 따른 부호화 효율을 계산한다(803).

다음, 상기 프로세스는 도 2의 추가 기저벡터 성분 전송 결정기(240)에서 설명한 바와 같이 각 정현파에 대해 계산된 부호화 효율을 토대로 추가 기저벡터 성분의 전송 여부를 결정한다(804).

도 8의 제 801 단계는 도 3의 제 1 내지 제 J 추가 기저벡터 성분 유도기(310_1∼310_J)에서 설명한 바와 같이 추가 기저벡터를 유도하도록 변형될 수 있다. 따라서 제 801 단계는 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 복수의 추가 기저벡터를 유도하는 단계로 정의될 수 있다.

도 8의 제 802 단계는 도 3의 제 1 내지 제 J 기저벡터 성분 계산기(320_1∼ 320_J)에서 설명한 바와 같이 추가 기저벡터 성분을 계산하도록 변형될 수 있다. 따라서, 도 8의 제 802 단계는, 상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 유도된 복수의 추가 기저벡터의 성분을 계산하는 단계로 정의될 수 있다.

도 8의 제 803 단계는 도 3의 제 1 내지 제 J 부호화 효율 계산기(330_1∼330_J)에서 설명한 바와 같이 각 정현파에 대한 부호화 효율을 계산하도록 변형될 수 있다. 따라서 제 803 단계는 상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 상기 검출된 정현파에 대해 상기 추가 기저벡터 성분을 사용함에 따른 부호화 효율을 계산하는 단계로 정의될 수 있다.

도 8의 제 804 단계는 도 3의 추가 기저벡터 성분 전송 결정기(340)에서 설명한 바와 같이 추가 기저벡터 성분에 대한 전송 여부를 결정하도록 변형될 수 있다. 따라서, 제 804 단계는 상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 계산된 부호화 효율중 가장 부호화 효율이 높은 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 단계로 정의될 수 있다.

상술한 바와 같이 추가 기저벡터 성분 전송 여부가 결정되면, 도 7의 오디오 부호화 방법은, 양자화된 주파수 및/또는 위상과 진폭 및 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호를 부호화한다(706). 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호는 도 1 내지 도 3에서 설명한 제어 파라미터와 추가 기저벡터 성분을 포함한다.

도 9는 도 7의 오디오 부호화 방법에 대응되는 오디오 복호화 방법의 동작 흐름도이다. 도 4를 참조하여 도 9의 동작 흐름도를 설명하면 다음과 같다.

먼저, 상기 오디오 복호화 방법은, 부호화된 오디오 신호를 도 4의 파싱부(410)와 같이 파싱한다(701). 다음, 상기 오디오 복호화 방법은, 파싱에 따라 얻어진 양자화된 주파수 및/또는 위상과 진폭을 도 4의 역양자화부(420)와 유사하게 역양자화하고(702), 파싱에 따라 얻어진 제어 파라미터를 도 4의 제어 파라미터 복호화부(440)와 유사하게 복호화하고(703), 상기 파싱에 따라 얻어진 추가 기저벡터 성분을 도 4의 추가 기저벡터 성분 복호화부(406)와 유사하게 복호화한다(904).

다음 오디오 복호화 방법은, 도 4의 정현파 복원부(430)와 유사하게 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원한다(905). 다음 오디오 복호화 방법은 도 4의 추가 기저벡터 유도부(450)와 유사하게 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도한다(906). 그리고, 오디오 복호화 방법은 도 4의 나머지 오디오 신호 복원부(470)와 유사하게 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원한다(907). 오디오 복호화 방법은 도 4의 혼합부(480)와 같이 복원된 정현파와 복원된 나머지 오디오 신호를 혼합하여 오디오 신호를 복원하여(908), 복원된 오디오 신호를 출력한다.

본원 발명에 따른 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

상술한 바와 같이 본 발명은 세그먼트된 오디오 신호로부터 타겟 비트율에 따라 결정된 진폭 이상의 진폭을 갖는 정현파를 검출하여 부호화하고, 검출된 각 정현파에 대해 유도된 추가 기저벡터와 나머지 오디오 신호를 토대로 추가 기저벡터의 성분을 계산하고, 계산된 추가 기저벡터 성분을 이용한 각 정현파의 부호화 효율을 토대로 추가 기저벡터 성분의 전송 여부를 결정하여 추가 기저벡터 성분을 부호화하는 오디오 부호화 기술과 그에 대응되는 오디오 복호화 기술을 제공함으로써, 낮은 비트율로 고음질의 오디오 신호를 표현할 수 있는 오디오 부호화 및 복호화 기술(또는 오디오 코덱)을 제공할 수 있다.

Claims

오디오 부호화 방법에 있어서,

입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계;

나머지 오디오 신호와 상기 정현파의 추가 기저벡터를 이용하여 추가 기저벡터 성분을 계산하는 단계;

상기 추가 기저벡터 성분 전송 여부를 결정하는 단계; 및

상기 추가 기저벡터 성분에 대한 전송이 결정되면, 상기 정현파의 주파수 및/또는 위상과 진폭 및 상기 추가 기저 벡터 성분을 부호화하는 단계를 포함하고,

상기 나머지 오디오 신호는 상기 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법.
제 1 항에 있어서, 상기 추가 기저벡터 성분 계산 단계는,

상기 검출된 정현파의 추가 기저벡터를 유도하는 단계; 및

상기 나머지 오디오 신호를 이용하여 상기 유도된 추가 기저벡터의 성분을 계산하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
제 2 항에 있어서, 상기 추가 기저벡터 성분 전송 여부를 결정하는 단계는,

상기 추가 기저벡터의 성분을 토대로 각 정현파의 부호화 효율을 계산하는 단계; 및

상기 계산된 부호화 효율이 사전에 설정된 기준치보다 높으면, 상기 추가 기저벡터 성분을 전송하는 것으로 결정하는 단계를 포함하는 오디오 부호화 방법.
오디오 복호화 방법에 있어서,

부호화된 오디오 신호를 파싱하는 단계;

상기 파싱에 의해 얻어진 부호화된 주파수 및/또는 위상과 진폭을 복호화하여 정현파를 복원하는 단계;

상기 파싱에 의해 얻어진 추가 기저벡터 성분을 복호화하여 나머지 오디오 신호를 복원하는 단계; 및

상기 복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 생성하는 단계를 포함하고,

상기 나머지 오디오 신호는 오디오 신호를 부호화할 때 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법.
오디오 부호화 방법에 있어서,

입력되는 오디오 신호를 특정 길이로 세그먼트 하는 단계;

상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계;

상기 검출된 정현파의 주파수 및/또는 위상과 진폭을 양자화 하는 단계;

상기 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 단계;

상기 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전 에 설정된 참조 값을 토대로 상기 검출된 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계; 및

상기 양자화된 주파수 및/또는 위상과 진폭 및 상기 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호를 부호화하는 단계를 포함하고,

상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중에서 상기 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법.
제 5 항에 있어서, 상기 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계는,

상기 검출된 정현파에 대해 복수의 추가 기저벡터를 유도하는 단계;

상기 유도된 추가 기저벡터의 성분을 계산하는 단계;

상기 추가 기저벡터 성분을 토대로 상기 정현파에 대한 부호화 효율을 계산하는 단계; 및

상기 계산된 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 단계를 포함하는 오디오 부호화 방법.
제 6 항에 있어서, 상기 추가 기저벡터를 유도하는 단계는 사전에 설정된 추가 기저벡터 수(F)와 상기 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0)을 토대로 상기 복수의 추가 기저벡터를 유도하는 것을 특징으로 하는 오디오 부호화 방법.
제 7 항에 있어서, 상기 추가 기저벡터를 유도하는 단계는 상기 검출된 정현파에 수직인 위상을 갖는 추가 기저 벡터를 유도하는 것을 특징으로 하는 오디오 부호화 방법.
제 6 항에 있어서, 상기 추가 기저벡터 성분을 계산하는 단계는 상기 나머지 오디오 신호와 상기 복수의 추가 기저벡터를 승산한 결과를 추가 기저벡터 성분으로서 계산하는 것을 특징으로 하는 오디오 부호화 방법.
제 6 항에 있어서, 상기 부호화 효율을 계산하는 단계는, 상기 추가 기저 벡터 성분
과 사전에 설정된 추가 기저 벡터 수(F) 및 역양자화된 진폭
을 하기 식과 같이 연산하여 상기 부호화 효율을 계산하는 것을 특징으로 하는 오디오 부호화 방법.
제 6 항에 있어서, 상기 추가 기저벡터 성분의 전송여부를 결정하는 단계는, 상기 계산된 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 추가 기저벡터 성분을 전송하는 것으로 결정하는 것을 특징으로 하는 오디오 부호화 방법.
제 5 항에 있어서, 상기 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계는,

적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 복수의 추가 기저벡터를 유도하는 단계;

상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 유도된 복수의 추가 기저벡터의 성분을 계산하는 단계;

상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 상기 검출된 정현파에 대해 상기 추가 기저벡터 성분을 사용함에 따른 부호화 효율을 계산하는 단계; 및

상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 계산된 부호화 효율중 가장 부호화 효율이 높은 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 단계를 포함하는 오디오 부호화 방법.
제 12 항에 있어서, 상기 추가 기저 벡터 성분의 전송 여부를 결정하는 단계는, 상기 가장 높은 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 추가 기 저벡터 성분을 전송하는 것으로 결정하는 것을 특징으로 하는 오디오 부호화 방법.
오디오 복호화 방법에 있어서,

부호화된 오디오 신호를 파싱하는 단계;

상기 파싱에 따라 얻어진 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 단계;

상기 파싱에 따라 얻어진 제어 파라미터를 복호화 하는 단계;

상기 파싱에 따라 얻어진 추가 기저벡터 성분을 복호화 하는 단계;

상기 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 단계;

상기 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 단계;

상기 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원하는 단계; 및

복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 오디오 신호를 복원하는 단계를 포함하고,

상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법.
제 14 항에 있어서, 상기 추가 기저벡터를 유도하는 단계는 적어도 2개의 추 가 기저벡터 수(F)와 상기 적어도 2개의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 복수의 추가 기저벡터를 유도하는 경우에, 상기 복호화된 제어 파라미터를 토대로 상기 적어도 2개의 추가 기저벡터 수(F)중 하나를 선택하여 추가 기저벡터를 유도하는 것을 특징으로 하는 오디오 복호화 방법.
오디오 부호화 장치에 있어서,

입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부;

상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 정현파 검출부;

상기 정현파 검출부에 의해 검출된 정현파의 주파수 및 /또는 위상과 진폭을 양자화 하는 양자화부;

상기 양자화부에서 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 역양자화부;

상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전에 설정된 참조 값을 토대로 상기 검출된 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 추가 기저벡터 성분 전송 결정부; 및

상기 양자화부로부터 출력되는 양자화된 주파수 또는/ 및 위상과 진폭, 상기 추가 기저벡터 성분 전송 결정부로부터 출력되는 신호를 부호화하는 부호화부를 포함하고,

상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중 상기 정현파 검출부에서 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 장치.
제 16 항에 있어서, 상기 추가 기저벡터 성분이 전송되는 것으로 결정되면, 상기 추가 기저벡터 성분 전송 결정부로부터 출력되는 신호는 제어 파라미터, 및 상기 추가 기저벡터 성분을 포함하고,

상기 제어 파라미터는 상기 추가 기저 벡터 성분 전송 여부를 나타내는 파라미터를 포함하거나

상기 추가 기저벡터 성분 전송 여부를 나타내는 파라미터 및 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
제 16 항에 있어서, 상기 정현파 검출부는 매칭 추적 방식에 의해 상기 정현파를 검출하는 것을 특징으로 하는 오디오 부호화 장치.
제 16 항에 있어서, 상기 추가 기저벡터 성분 전송 결정부는

상기 정현파 검출부에서 검출된 정현파에 대해 복수의 추가 기저 벡터를 유도하는 추가 기저 벡터 유도기;

상기 정현파에 대해 상기 추가 기저 벡터 유도기에서 유도된 추가 기저 벡터 의 성분을 계산하는 추가 기저 벡터 성분 계산기;

상기 정현파에 대해 상기 계산된 추가 기저 벡터 성분을 사용함에 따른 부호화 효율을 계산하는 부호화 효율 계산기; 및

상기 계산된 부호화 효율을 토대로 상기 추가 기저 벡터 성분의 전송 여부를 결정하는 추가 기저벡터 성분 전송 결정기를 포함하는 오디오 부호화 장치.
제 19 항에 있어서, 상기 추가 기저 벡터 유도기는 사전에 설정된 추가 기저 벡터 수(F)와 상기 추가 기저 벡터 수(F)에 따라 결정된 주파수 변동분(k0)을 토대로 상기 복수의 추가 기저 벡터를 유도하는 것을 특징으로 하는 오디오 부호화 장치.
제 20 항에 있어서, 상기 추가 기저 벡터 유도기는 상기 검출된 정현파에 수직인 위상을 갖는 추가 기저 벡터를 유도하는 것을 특징으로 하는 오디오 부호화 장치
제 19 항에 있어서, 상기 추가 기저 벡터 성분 계산기는 상기 나머지 오디오 신호와 상기 유도된 추가 기저 벡터를 승산한 결과를 추가 기저 벡터 성분으로서 계산하는 것을 특징으로 하는 오디오 부호화 장치.
제 19 항에 있어서, 상기 부호화 효율 계산기는 상기 추가 기저 벡터 성분
과 사전에 설정된 추가 기저 벡터 수(F) 및 역양자화된 진폭
을 하기 식과 같이 연산하여 상기 부호화 효율을 계산하는 것을 특징으로 하는 오디오 부호화 장치.
제 19 항에 있어서, 상기 추가 기저벡터 성분 전송 결정기는 상기 계산된 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 추가 기저벡터 성분을 전송하는 것으로 결정하는 것을 특징으로 하는 오디오 부호화 장치.
제 16 항에 있어서, 상기 추가 기저벡터 성분 전송 결정부는

상기 정현파 검출부에서 검출된 정현파에 대해 복수의 추가 기저 벡터를 유도하는 적어도 2개의 추가 기저벡터 유도기;

상기 적어도 2개의 추가 기저벡터 유도기에 대응되어 상기 유도된 추가 기저 벡터의 성분을 계산하는 적어도 2개의 추가 기저벡터 성분 계산기;

상기 적어도 2개의 추가 기저벡터 성분 계산기에 대응되어 상기 검출된 정현파에 대해 상기 계산된 추가 기저벡터의 성분을 사용함에 따른 부호화 효율을 계산하는 적어도 2개의 부호화 효율 계산기; 및

상기 적어도 2개의 부호화 효율 계산기에서 계산된 부호화 효율중 가장 높은 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 추가 기저벡터 성분 전송 결정기를 포함하는 오디오 부호화 장치.
제 25 항에 있어서, 상기 추가 기저 벡터 성분 전송 결정기는 상기 가장 높은 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 가장 높은 부호화 효율을 검출한 부호화 효율 계산기에 대응되는 추가 기저벡터 성분 계산기에서 계산된 추가 기저벡터 성분이 전송되도록 결정하는 것을 특징으로 하는 오디오 부호화 장치.
오디오 복호화 장치에 있어서,

부호화된 오디오 신호를 파싱하는 파싱부;

상기 파싱부로부터 출력되는 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 역양자화부;

상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 정현파 복원부;

상기 파싱부로부터 출력되는 제어 파라미터를 복호화 하는 제어 파라미터 복호화부;

상기 역양자화부에서 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 추가 기저벡터 유도부;

상기 파싱부로부터 출력되는 추가 기저벡터 성분을 복호화 하는 추가 기저벡 터 성분 복호화부;

상기 추가 기저벡터 유도부에서 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원하는 나머지 오디오 신호 복원부; 및

정현파 복원부로부터 복원된 정현파와 상기 나머지 오디오 신호 복원부에서 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 출력하는 혼합부를 포함하고,

상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 장치.
제 27 항에 있어서, 상기 추가 기저벡터 유도부에 복수개의 추가 기저벡터 유도기가 포함되면, 상기 복호화된 제어 파라미터를 토대로 상기 복수개의 추가 기저벡터 유도기중 하나를 선택하여 추가 기저벡터를 유도하는 것을 특징으로 하는 오디오 복호화 장치.