KR20080075409A

KR20080075409A - 오디오 부호화 및 복호화 장치와 그 방법

Info

Publication number: KR20080075409A
Application number: KR1020070014558A
Authority: KR
Inventors: 이건형; 오재원; 이철우; 정종훈; 이남숙
Original assignee: 삼성전자주식회사
Priority date: 2007-02-12
Filing date: 2007-02-12
Publication date: 2008-08-18
Also published as: US8055506B2; EP2115738A4; KR101149448B1; CN101606193A; EP2115738A1; US20080195398A1; WO2008100034A1; CN101606193B

Abstract

본 발명은 오디오 신호에 대한 정현파를 연결하여 부호화할 때, 음질을 유지하면서 압축율을 향상시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 본 발명의 한 유형에 따른 오디오 부호화 방법은, 입력되는 오디오 신호의 정현파를 연결하는 단계;상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 단계; 상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 단계; 상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화 단계; 및 상기 제 1 부호화 단계에서 부호화된 결과와 상기 제 2 부호화 단계에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 단계를 포함한다.

Description

오디오 부호화 및 복호화 장치와 그 방법{Audio encoding and decoding apparatus and method thereof}

도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.

도 2는 도 1의 주파수 변환부에 정의된 정현파의 주파수와 심리 음향적인 주파수간의 관계 예시도이다.

도 3은 본 발명의 다른 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.

도 4는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.

도 5는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.

도 6은 본 발명의 일 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.

도 7은 본 발명이 다른 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.

도 8은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치의 기능 블록 도이다.

도 9는 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.

도 10은 본 발명의 일 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.

도 11은 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.

도 12는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.

도 13은 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.

도 14는 본 발명의 일 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.

도 15는 본 발명이 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.

도 16은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.

도 17은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.

본 발명은 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 특히, 오디오 신호에 대한 정현파(sinusoidal)를 연결하여 부호화하는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것이다.

파라메트릭 부호화(parametric coding)는 입력되는 오디오 신호를 시간적으로 특정 길이만큼 세그먼트(segment)하고, 세그먼트된 오디오 신호에 대한 정현파(sinusoidal)를 추출한다. 정현파를 추출한 결과, 주파수가 유사한 정현파가 시간적으로 여러 세그먼트에 지속되는 경우에, 파라메트릭 부호화는 주파수가 유사한 정현파를 연결하여 부호화한다.

주파수가 유사한 정현파를 연결하여 부호화할 때, 파라메트릭 부호화는 처음 정현파에 대해 주파수, 위상 및 진폭을 각각 부호화하고, 그 다음에 연결된 정현파에 대해 위상값과 진폭차를 부호화한다.

위상값을 부호화하는 경우에, 기존의 파라메트릭 부호화는 이전 세그먼트(또는 이전 프레임)의 주파수와 위상으로부터 현재 세그먼트의 위상을 예측하고, 예측된 위상과 현재 세그먼트의 위상간의 오차를 ADPCM(Adaptive Differential Pulse Code Modulation)한다. 그러나 ADPCM은 오차가 작은 경우에 오차 신호 측정 스케일을 작게 조정함으로써, 같은 비트를 이용하여 다음 세그먼트에 대해 더욱 정밀하게 부호화하는 방식이다.

따라서 입력되는 오디오 신호의 주파수가 급격하게 변하고, 주파수가 변하기 직전의 오차 신호 측정 스케일이 매우 작은 경우에, 검출된 오차가 ADPCM의 비트로 표현할 수 있는 범위를 넘어 잘못된 부호화 결과를 얻게 됨으로써, 음질이 저하될 수 있다.

본 발명이 이루고자 하는 기술적 과제는 오디오 신호에 대한 정현파를 연결하여 부호화할 때, 음질을 유지하면서 압축율을 향상시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.

본 발명이 이루고자 하는 다른 기술적 과제는 복수의 세그먼트에 대해 연결된 정현파와 연결되지 않는 정현파를 분리하여 부호화 및 복호화 할 수 있는 오디오 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은,오디오 부호화 방법에 있어서, 입력되는 오디오 신호의 정현파를 연결하는 단계; 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 단계; 상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 단계; 상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화 단계; 및 상기 제 1 부호화 단계에서 부호화된 결과와 상기 제 2 부호화 단계에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 단계를 포함하는 오디오 부호화 방법을 제공한다.

상기 오디오 부호화 방법은, 상기 심리 음향적인 주파수와 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된 주파수간의 차를 검출하는 단계를 더 포함 하고, 상기 제 1 부호화 단계는 상기 심리 음향적인 주파수 대신 상기 차를 부호화하는 것이 바람직하다.

상기 오디오 부호화 방법은, 상기 입력되는 오디오 신호에 대한 심리 음향 모델을 이용하여 계산된 마스킹 레벨과 상기 연결된 정현파의 진폭을 토대로 양자화 스텝 사이즈를 설정하는 단계; 및 상기 설정된 양자화 스텝 사이즈로 상기 차를 양자화하는 단계를 더 포함하고, 상기 제 1 부호화 단계는 상기 차 대신 상기 양자화된 차를 부호화하는 것이 바람직하고, 상기 부호화된 오디오 신호 출력 단계는 상기 설정된 양자화 스텝 사이즈에 대한 정보를 제어 파라미터로서 혼합하여 출력하는 것이 바람직하다.

상기 오디오 부호화 방법은, 상기 입력되는 오디오 신호를 특정 길이로 세그먼트하는 단계; 상기 세그먼트된 오디오 신호의 정현파를 추출하는 단계; 상기 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교하는 단계; 상기 비교결과, 상기 추출된 정현파중에서 적어도 하나의 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 상기 추출된 정현파를 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화하는 단계를 더 포함하고, 상기 연결된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하고, 상기 비교결과, 상기 추출된 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 가지면, 상기 추출된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하는 것이 바람직하다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 신호 복호화 방법에 있어서, 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수와 부호화된 정현파의 진폭을 각각 검출하는 단계; 상기 검출된 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화 단계; 상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 단계; 상기 검출된 부호화된 정현파의 진폭을 복호화하는 제 2 복호화 단계; 상기 복호화된 정현파의 진폭과 상기 정현파의 주파수를 토대로 정현파의 위상을 검출하는 단계; 및 상기 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원하는 단계를 포함하는 오디오 복호화 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는, 오디오 부호화 장치에 있어서, 입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부; 상기 세그먼테이션부로부터 출력되는 오디오 신호로부터 적어도 하나의 정현파를 추출하는 정현파 추출부; 상기 정현파 추출부에서 추출된 정현파를 연결하는 정현파 연결부; 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 주파수 변환부; 상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 부; 상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화부; 및 상기 제 1 부호화부에서 부호화된 결과와 상기 제 2 부호화부에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 혼합부를 포함하는 오디오 신호 부호화 장치를 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는, 오디오 복호화 장치에 있어서, 부호화된 오디오 신호를 파싱하는 파싱부; 상기 파싱부로부터 출력되는 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화부;상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 주파수 역변환부; 상기 파싱부로부터 출력되는 부호화된 정현파의 진폭을 복호화하는 제 2 복호화부; 상기 정현파 주파수와 상기 복호화된 정현파의 진폭을 토대로 정현파의 위상을 검출하는 위상 검출부; 및 상기 위상 검출부에서 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고 상기 복원된 정현파를 이용하여 오디오 신호를 복원하는 오디오 복원부를 포함하는 오디오 복호화 장치를 제공한다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치(100)의 기능 블록도이다. 도 1을 참조하면, 오디오 부호화 장치(100)는 세그먼테이션(segmentation)부(101), 정현파 추출부(102), 정현파 연결부(103), 주파수 변환부(104), 제 1 부호화부(105), 제 2 부호화부(106), 및 혼합부(107)를 포함한다.

세그먼테이션부(101)는 입력되는 오디오 신호를 시간에 따라 특정 길이 L로 세그먼트한다. 상기 특정 길이 L은 정수이다. 따라서, 세그먼테이션부(101)로부터 출력되는 오디오 신호가 S(n)이면, 상기 n은 시간에 따른 인덱스로서, n=1∼L로 정의될 수 있다. 입력되는 오디오 신호를 특정 길이 L로 세그먼트할 때, 세그먼트된 오디오 신호들은 L/2 또는 특정 길이만큼 이전 세그먼트와 겹칠 수 있다.

정현파 추출부(102)는 매칭 추적 방식으로 세그먼테이션부(101)로부터 출력되는 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 추출한다. 즉, 정현파 추출부(102)는 우선, 세그먼트된 오디오 신호 S(n)으로부터 가장 큰 진폭(amplitude)을 갖는 정현파를 추출한다. 다음, 정현파 추출부(102)는 상기 추출된 정현파를 제외한 세그먼트된 오디오 신호로부터 그 다음으로 큰 진폭을 갖는 정현파를 추출한다. 정현파 추출부(102)는 사전에 설정된 정현파의 진폭(amplitude)에 도달할 때까지 세그먼트된 오디오 신호로부터 정현파를 추출하는 과정을 반복적으로 수행할 수 있다. 상기 사전에 설정된 정현파의 진폭은 타겟 비트율(target bit rate)에 따라 결정될 수 있다. 그러나, 정현파 추출부(102)는 정현파의 진폭에 사전에 설정하지 않고, 세그먼트된 오디오 신호로부터 정현파를 추출할 수 있다. `

정현파 추출부(102)에서 추출되는 정현파는 수학식 1과 같이 정의할 수 있다.

수학식 1에서

는 검출된 정현파의 진폭이고,

는 하기 수학식 2와 같이 주파수가

이고, 위상이

인 정현파이다.

수학식 2에서 A는

의 크기를 1로 만들기 위한 규격화 상수이다. 여기서 i는 검출된 정현파의 개수와 대응되는 것으로, 서로 다른 정현파를 지칭하는 인덱스이다. 정현파 추출부(102)에서 하나의 세그먼트에 대해 추출된 정현파의 개수가 K개이면, i는 i=1∼K의 값을 갖는다.

정현파 연결부(103)는 현재 세그먼트된 오디오 신호로부터 추출된 정현파의 주파수와 이전 세그먼트된 오디오 신호로부터 추출된 정현파의 주파수를 토대로 현재 세그먼트된 오디오 신호로부터 추출된 정현파를 이전 세그먼트된 오디오 신호로부터 추출된 정현파에 연결한다. 이러한 정현파의 연결은 주파수 트랙킹이라고 정의할 수 있다.

주파수 변환부(104)는 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환한다. 주파수가 높은 경우에 심리 음향의 특성상 정확한 주파수를 들을 수 없을 뿐 아니라 위상도 느끼지 못한다. 따라서, 낮은 주파수는 정밀하게 부호화하고, 높은 주파수는 정밀하게 부호화하지 않기 위하여, 주파수 변환부(104)는 도 2에 도시된 바와 같이 정현파의 주파수와 심리 음향적인 주파수간의 관계를 정의하 고, 이를 토대로 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환시킨다. 도 2에 도시된 바와 같이 정현파의 주파수가 높을수록, 심리 음향적인 주파수의 변화 폭은 작다.

또한, 주파수 변환부(104)는 ERB(Equivalent Rectangular Band) 스케일(Scale), 바크 밴드 스케일(Bark Band Scale), 크리티컬 밴드(Critical Band) 등을 이용하여 주파수를 변환할 수 있다. ERB 스케일을 사용할 경우에, 주파수 변환부(104)는 정현파 주파수 f를 수학식 3에 의해 변환시켜 심리 음향적인 주파수 S(f)를 출력할 수 있다.

S(f)=log(0.00437×f+1)

정현파 연결부(303)로부터 출력되는 정현파가 K개인 경우에, 주파수 변환부(104)는 K개의 정현파 각각의 주파수를 심리 음향적인 주파수로 변환시킨다.

제 1 부호화부(105)는 심리 음향적인 주파수를 부호화한다. 제 2 부호화부(106)는 정현파 연결부(103)로부터 출력되는 연결된 정현파의 진폭(

)을 부호화한다. 제 1 부호화부(105) 및 제 2 부호화부(106)는 허프만 부호화 방식을 이용하여 부호화를 수행할 수 있다.

혼합부(107)는 제 1 부호화부(105)로부터 출력된 부호화된 심리 음향적인 주파수와 제 2 부호화부(106)로부터 출력되는 부호화된 진폭을 혼합하여 부호화된 오디오 신호로서 출력한다. 부호화된 오디오 신호는 비트스트림 형태를 가질 수 있 다.

도 3은 본 발명의 다른 실시 예에 따른 오디오 부호화 장치(300)의 기능 블록도이다. 도 3의 오디오 부호화 장치(300)는 세그먼테이션부(301), 정현파 추출부(302), 정현파 연결부(303), 주파수 변환부(304), 차 검출기(305), 제 1 부호화부(306), 예측부(307), 제 2 부호화부(308), 및 혼합부(309)를 포함한다.

도 3의 오디오 부호화 장치(300)는 도 1의 오디오 부호화 장치(100)에 예측 기능을 더 부가한 실시 예이다. 따라서, 오디오 부호화 장치(300)에 포함되는 세그먼테이션부(301), 정현파 추출부(302), 정현파 연결부(303), 주파수 변환부(304), 제 2 부호화부(308) 및 혼합부(309)는 도 1의 오디오 부호화 장치(100)에 포함되는 세그먼테이션부(101), 정현파 추출부(102), 정현파 연결부(103), 주파수 변환부(104), 제 2 부호화부(106) 및 혼합부(107)와 유사하게 구성 및 동작한다.

도 3의 차 검출기(305)는 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된 주파수와 주파수 변환부(304)로부터 출력되는 심리 음향적인 주파수간의 차를 검출하고, 검출된 차를 제 1 부호화부(306)로 전송한다. 예측된 주파수가 K개인 경우에, 차 검출기(305)는 주파수 변환부(304)로부터 출력되는 심리 음향적인 주파수에 대응되는 예측된 주파수를 이용하여 상기 차를 검출한다.

제 1 부호화부(306)는 차 검출기(305)로부터 출력되는 차를 부호화한다. 제 1 부호화부(306)는 허프만 부호화 방식을 이용하여 입력되는 차를 부호화할 수 있다. 제 1 부호화부(306)에서 부호화된 결과는 혼합부(309)로 전송된다.

예측부(307)는 제 1 부호화부(306)로부터 전송되는 부호화되기 전의 심리 음 향적인 주파수를 토대로 현재 세그먼트에서의 심리 음향적인 주파수를 예측한다. 예를 들어, 이후의 심리 음향적인 주파수는 이전 값과 유사할 확률이 가장 크므로 이전 값을 예측치로 사용할 수 있다. 예측된 심리 음향적인 주파수를 상기 예측된 주파수로서 차 검출기(205)로 제공된다.

도 4는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치(400)의 기능 블록도이다. 도 4에 도시된 오디오 부호화 장치(400)는 세그먼테이션부(401), 정현파 추출부(402), 정현파 연결부(403), 주파수 변환부(404), 차 검출기(405), 양자화부(406), 예측부(407), 마스킹 레벨 제공부(408), 제 1 부호화부(409), 제 2 부호화부(410), 및 혼합부(411)를 포함한다.

도 4의 오디오 부호화 장치(400)는 도 3의 오디오 부호화 장치(300)에 양자화 기능을 더 부가한 실시 예이다. 따라서, 도 4의 오디오 부호화 장치(400)에 포함되는 세그먼테이션부(401), 정현파 추출부(402), 정현파 연결부(403), 주파수 변환부(404), 차 검출기(405), 제 2 부호화부(410)는 도 3의 오디오 부호화 장치(300)에 포함되는 세그먼테이션부(301), 정현파 추출부(302), 정현파 연결부(303), 주파수 변환부(304), 차 검출기(305), 제 2 부호화부(308)와 유사하게 구성 및 동작한다.

도 4의 마스킹 레벨 제공부(408)는 세그먼테이션부(401)로부터 출력되는 현재 세그먼트된 오디오 신호에 대한 심리음향 모델을 토대로 마스킹 레벨을 계산하고, 계산된 마스킹 레벨을 현재 세그먼트된 오디오 신호의 마스킹 레벨로서 제공한다.

양자화부(406)는 마스킹 레벨 제공부(408)로부터 제공되는 마스킹 레벨과 정현파 연결부(404)로부터 출력되는 연결된 정현파의 진폭(

)을 토대로 양자화 스텝 사이즈(step size)를 설정한다. 즉, 양자화부(406)는 상기 연결된 정현파의 진폭(

)이 상기 마스킹 레벨 이상이면, 양자화 스텝 사이즈를 작게 설정하고, 상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이 아니면, 양자화 스텝 사이즈를 크게 설정한다. 양자화부(406)는 설정된 양자화 스텝 사이즈를 이용하여 차 검출기(405)로부터 출력되는 차를 양자화 한다. 또한, 양자화부(406)는 양자화 하기전의 차를 이전 세그먼트의 심리 음향적인 주파수로서 예측부(407)로 전송하고, 설정된 양자화 스텝 사이즈를 혼합부(411)로 전송한다.

예측부(407)는 차를 토대로 현재 세그먼트의 심리 음향적인 주파수를 예측하고, 예측된 주파수를 차 검출기(405)로 제공한다.

제 1 부호화부(409)는 양자화부(406)로부터 출력되는 양자화된 차 신호를 부호화한다. 혼합부(411)는 제 1 부호화부(409)와 제 2 부호화부(410)로부터 출력되는 부호화된 결과와 양자화부(406)로부터 출력되는 양자화 스텝 사이즈를 혼합하고, 혼합된 결과를 부호화된 오디오 신호로서 출력한다. 상기 양자화 스텝 사이즈는 부호화된 오디오 신호의 제어 파라미터(control parameter)로서 혼합된다.

도 5는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치(500)의 기능 블록도이다. 도 5에 도시된 오디오 부호화 장치(500)는 세그먼테이션부(501), 정현파 추출부(502), 정현파 연결부(503), 주파수 변환부(504), 차 검출기(505), 양자 화부(506), 예측부(507), 마스킹 레벨 제공부(508), 제 1 부호화부(509), 제 2 부호화부(510), 제 3 부호화부(511), 및 혼합부(512)를 포함한다.

도 5의 오디오 부호화 장치(500)는 도 4의 오디오 부호화 장치(400)에 연결된 정현파와 연결되지 않은 정현파를 구분하여 부호화하는 기능을 더 부가한 실시 예이다. 따라서, 도 5의 오디오 부호화 장치(500)에 포함되는 세그먼테이션부(501), 정현파 추출부(502), 주파수 변환부(504), 차 검출기(505), 양자화부(506), 예측부(507), 마스킹 레벨 제공부(508), 제 1 부호화부(509), 제 2 부호화부(510)는 도 4에 도시된 오디오 부호화 장치(400)에 포함되는 세그먼테이션부(401), 정현파 추출부(402), 주파수 변환부(404), 차 검출기(405), 양자화부(406), 예측부(407), 마스킹 레벨 제공부(408), 제 1 부호화부(409), 제 2 부호화부(410)와 유사하게 구성 및 동작한다.

도 5의 정현파 연결부(503)는 정현파 추출부(502)에서 현재 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교한다. 비교결과, 현재 추출된 정현파의 주파수중에서 적어도 하나의 정현파가 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 정현파 연결부(503)는 주파수가 유사하지 않은 정현파의 주파수, 위상, 및 진폭을 제 3 부호화부(511)로 전송한다. 반면에 현재 추출된 정현파중에서 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 갖는 정현파에 대해 정현파 연결부(503)는 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결하고, 연결된 정현파의 주파수를 주파수 변환부(504)로 전송하고, 연결된 정현파의 진폭을 제 2 부호화부(510)로 전송한다.

제 3 부호화부(511)는 정현파 연결부(503)로부터 전송되는 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않는 정현파의 주파수, 위상 및 진폭을 각각 부호화한다.

혼합부(512)는 제 1 부호화부(509), 제 2 부호화부(510), 및 제 3 부호화부(511)로부터 각각 출력되는 부호화 결과와 양자화부(506)로부터 출력되는 양자화 스텝 사이즈를 혼합하고, 혼합된 결과를 부호화된 오디오 신호로서 출력한다.

도 5의 오디오 부호화 장치(500)에서 정의한 연결된 정현파와 연결되지 않은 정현파를 구분하여 부호화하는 기능은 도 1의 오디오 부호화 장치(100) 및 도 3의 오디오 부호화 장치(300)에도 각각 추가되도록 구현할 수 있다. 이에 따라 오디오 부호화 장치(100)의 정현파 연결부(103)와 도 3의 정현파 연결부(303)는 각각 도 5의 정현파 연결부(503)와 유사하게 구성 및 동작하도록 구현할 수 있고, 도 1의 오디오 부호화 장치(100)와 도 3의 오디오 부호화 장치(300)는 도 5의 제 3 부호화 부(511)를 더 포함하도록 구현할 수 있다.

도 6은 본 발명의 일 실시 예에 따른 오디오 복호화 장치(600)의 기능 블록도이다. 도 6의 오디오 복호화 장치(600)는 파싱부(601), 제 1 복호화부(602), 주파수 역변환부(603), 제 2 복호화부(604), 위상 검출부(605), 및 오디오 신호 복원부(606)를 포함한다. 도 6의 오디오 복호화 장치(600)는 도 1의 오디오 부호화 장치(100)에 대응되는 장치이다.

부호화된 오디오 신호가 입력되면, 파싱부(601)는 입력되는 부호화된 오디오 신호를 파싱한다. 입력되는 부호화된 오디오 신호는 비트스트림 형태를 가질 수 있다. 이에 따라 파싱부(601)는 부호화된 심리 음향적인 주파수를 제 1 복호화부(602)로 전송하고, 부호화된 정현파의 진폭을 제 2 복호화부(604)로 전송한다.

제 1 복호화부(602)는 파싱부(601)로부터 전송되는 부호화된 심리 음향적인 주파수를 복호화한다. 제 1 복호화부(602)는 도 1의 제 1 부호화부(105)에서 수행되는 부호화에 대응되는 복호화 방식으로 주파수를 복호화한다.

주파수 역변환부(603)는 제 1 복호화부(602)로부터 전송되는 복호화된 심리 음향적인 주파수를 정현파의 주파수로 역변환한다. 주파수 역변환부(603)는 도 1의 주파수 변환부(104)에서 수행되는 변환에 대응되는 역변환방식을 사용하여 상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 역변환한다.

제 2 복호화부(604)는 파싱부(601)로부터 전송되는 부호화된 정현파의 진폭을 복호화한다. 제 2 복호화부(604)는 도 1의 제 2 부호화부(106)에서 수행되는 부호화에 대응되는 복호화 방식으로 주파수를 복호화한다.

위상 검출부(605)는 주파수 역변환부(603)로부터 출력되는 정현파의 주파수와 제 2 복호화부(604)로부터 출력되는 복호화된 정현파의 진폭을 토대로 정현파의 위상을 검출한다. 즉, 위상 검출부(605)는 수학식 4에 의해 정현파의 위상을 검출할 수 있다.

정현파의 위상 =

수학식 4에서

는 이전 연결된 정현파의 위상이며,

은 각각 이전 연결된 정현파의 주파수(bin으로 정의된 주파수)와 현재 정현파의 주파수(bin으로 정의된 주파수)이다.

오디오 신호 복원부(606)는 위상 검출부(605)에서 검출된 정현파의 위상, 위상 검출부(605)를 통해 전송되는 정현파의 주파수 및 정현파의 진폭을 이용하여 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원한다.

도 7은 본 발명의 다른 실시 예에 따른 오디오 복호화 장치(700)의 기능 블록도이다. 도 7의 오디오 복호화 장치(700)는 파싱부(701), 제 1 복호화부(702), 가산기(703), 예측부(704), 주파수 역변환부(705), 제 2 복호화부(706), 위상 검출부(707), 및 오디오 신호 복원부(708)를 포함한다. 도 7의 오디오 복호화 장치(700)는 도 3의 오디오 부호화 장치(300)에 대응되는 장치로서, 도 6의 오디오 복호화 장치(600)에 예측 기능을 더 부가한 실시 예이다.

따라서, 도 7에 도시된 파싱부(701), 제 1 복호화부(702), 제 2 복호화부(706), 위상 검출부(707) 및 오디오 신호 복원부(708)는 도 6에 도시된 파싱부(601), 제 1 복호화부(602), 제 2 복호화부(606), 위상 검출부(607) 및 오디오 신호 복원부(608)와 유사하게 구성 및 동작한다.

도 7의 가산기(703)는 제 1 복호화부(702)로부터 출력되는 복호화된 심리 음 향적인 주파수에 예측된 주파수를 가산하고, 가산된 결과를 주파수 역변환부(705)로 전송한다. 주파수 역변환부(705)는 가산기(703)로부터 전송되는 가산된 주파수를 정현파의 주파수로 역변환한다. 주파수 역변환부(705)로부터 출력되는 정현파 주파수는 위상 검출부(707)로 전송된다.

주파수 역변환부(705)에서 주파수 역변환되기 전의 주파수가 전송되면, 예측부(704)는 주파수 역변환부(705)로부터 전송되는 주파수를 이전 세그먼트의 복호화된 심리 음향적인 주파수로 하여 현재 세그먼트의 심리 음향적인 주파수를 예측한다. 예측 방식은 도 3의 예측부(307)와 유사한 방식으로 수행될 수 있다.

도 8은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치(800)의 기능 블록도이다. 도 8의 오디오 복호화 장치(800)는 파싱부(801), 제 1 복호화부(802), 역양자화부(803), 가산기(804), 예측부(805), 주파수 역변환부(806), 제 2 복호화부(807), 위상 검출부(808), 및 오디오 신호 복원부(809)를 포함한다. 도 8의 오디오 복호화 장치(800)는 도 4의 오디오 부호화 장치(400)에 대응되는 장치로서, 도 7의 오디오 복호화 장치(700)에 역양자화 기능을 더 부가한 실시 예이다.

따라서, 도 8에 도시된 제 1 복호화부(802), 예측부(805), 주파수 역변환부(806), 제 2 복호화부(807), 위상 검출부(808) 및 오디오 신호 복원부(809)는 도 7에 도시된 제 1 복호화부(702), 예측부(705), 주파수 역변환부(706), 제 2 복호화부(707), 위상 검출부(708) 및 오디오 신호 복원부(709)와 유사하게 구성 및 동작한다.

도 8의 파싱부(801)는 입력되는 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수를 제 1 복호화부(802)로 전송하고, 부호화된 정현파의 진폭을 제 2 복호화부(807)로 전송하고, 상기 부호화된 오디오 신호의 제어 파라미터로 포함된 양자화 스텝 사이즈 정보를 역양자화부(803)로 전송한다.

도 8의 역양자화부(803)는 제 1 복호화부(802)로부터 전송되는 복호화된 심리 음향적인 주파수를 양자화 스텝 사이즈에 따라 역양자화 한다. 가산기(804)는 역양자화부(803)로부터 출력되는 역양자화된 심리 음향적인 주파수와 예측부(805)로부터 전송되는 예측된 주파수를 가산하여 출력한다.

도 9는 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치(900)의 기능 블록도이다. 도 9의 오디오 복호화 장치(900)는 파싱부(901), 제 1 복호화부(902), 역양자화부(903), 가산기(904), 예측부(905), 주파수 역변환부(906), 제 2 복호화부(907), 위상 검출부(908), 제 3 복호화부(909) 및 오디오 신호 복원부(910)를 포함한다. 도 9의 오디오 복호화 장치(900)는 도 5의 오디오 부호화 장치(500)에 대응되는 장치로서, 도 8의 오디오 복호화 장치(800)에 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파를 구분하여 복호화하는 기능을 더 부가한 실시 예이다.

따라서, 도 9에 도시된 제 1 복호화부(902), 역양자화부(903), 가산기(904), 예측부(905), 주파수 역변환부(906), 제 2 복호화부(907), 위상 검출부(908)는 도 8에 도시된 제 1 복호화부(802), 역양자화부(803), 가산기(804), 예측부(805), 주파수 역변환부(806), 제 2 복호화부(807), 위상 검출부(808)와 유사하게 구성 및 동작한다.

도 9의 파싱부(901)는 입력되는 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수를 제 1 복호화부(902)로 전송하고, 부호화된 정현파의 진폭을 제 2 복호화부(907)로 전송하고, 상기 부호화된 오디오 신호의 제어 파라미터로 포함된 양자화 스텝 사이즈 정보를 역양자화부(903)로 전송한다. 또한, 파싱부(901)는 입력되는 부호화된 오디오 신호에 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파의 부호화된 주파수, 진폭 및 위상이 포함되어 있으면, 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않는 정현파의 부호화된 주파수, 진폭 및 위상을 제 3 복호화부(909)로 전송한다.

제 3 복호화부(909)는 도 5의 제 3 부호화부(511)에 대응되는 복호화 방식으로 상기 부호화된 정현파의 주파수, 진폭, 및 위상을 복호화한다. 제 3 복호화부(909)에서 복호화된 정현파의 주파수, 진폭 및 위상은 오디오 신호 복원부(910)로 전송된다.

오디오 신호 복원부(910)는 위상 검출부(908)로부터 전송되는 이전 세그먼트와 연결된 정현파의 주파수, 진폭, 및 위상으로 정현파를 복원하고, 제 3 복호화부(909)로부터 전송되는 이전 세그먼트와 연결되지 않은 정현파의 주파수, 진폭, 및 위상으로 정현파를 복원한다. 그 다음, 오디오 신호 복원부(910)는 복원된 정현파들을 이용하여 오디오 신호를 복원한다. 즉, 오디오 신호 복원부(910)는 복원된 정현파들을 결합하여 오디오 신호를 복원한다.

도 6 및 도 7에 도시된 오디오 복호화 장치는 도 9에 도시된 제 3 복호화 부(909)를 더 포함하도록 변형할 수 있다. 만약 도 6 및 도 7에 도시된 오디오 복호화 장치가 제 3 복호화부(909)를 포함할 경우에, 도 6 및 도 8의 파싱부(601, 701)는 각각 도 9의 파싱부(901)와 같이 입력되는 부호화된 오디오 신호에 이전 세그먼트와 연결되지 않은 정현파의 주파수, 진폭 및 위상이 포함되어 있는지 체크하여 파싱하도록 구현된다.

도 10은 본 발명의 일 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 1을 참조하여 도 10의 오디오 부호화 방법의 동작을 설명하면 다음과 같다.

우선, 상기 방법은, 입력되는 오디오 신호로부터 추출된 정현파를 연결한다(1001). 정현파 연결은 도 1의 정현파 연결부(103)에서 설명한 바와 같이 수행된다.

그 다음, 상기 방법은 도 1의 주파수 변환부(104)에서와 같이 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환한다(1002). 상기 방법은 심리 음향적인 주파수를 도 1의 제 1 부호화부(105)에서와 같이 부호화한다(1003). 제 1001 단계에서 연결된 정현파의 진폭을 도 1의 제 2 부호화부(106)에서와 같이 부호화한다(1004). 상기 방법은, 제 1003 단계에서 부호화된 주파수와 제 1004 단계에서 부호화된 진폭을 혼합하여 부호화된 오디오 신호로서 출력한다(1005).

도 11은 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 11은 도 10의 오디오 부호화 방법에 예측 기능을 더 부가한 실시 예이다. 따라서, 도 11의 제 1101, 1102, 및 1105 단계는 도 10의 제 1001, 1002, 및 1004 단계와 각각 유사하게 동작된다.

도 11의 제 1103 단계에서 상기 오디오 부호화 방법은 심리 음향적인 주파수와 예측된 주파수간의 차를 검출한다. 예측된 주파수는 도 3의 예측부(307)에서와 같이 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된다.

상기 차가 검출되면, 상기 오디오 부호화 방법은, 제 1104 단계에서 검출된 차를 도 3의 제 1 부호화부(306)에서와 같이 부호화한다. 이에 따라 상기 오디오 부호화 방법은 제 1106 단계에서 부호화된 차와 부호화된 정현파의 진폭을 혼합하여 부호화된 오디오 신호를 출력한다.

도 12는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 12는 도 11의 오디오 부호화 방법에 양자화 기능을 더 부가한 실시 예이다. 따라서, 도 12의 제 1201, 1202, 1203, 및 1207 단계는 도 11의 1101, 1102, 1103, 및 1105 단계와 각각 유사하게 동작된다.

도 12의 제 1204 단계에서 상기 오디오 부호화 방법은 양자화 스텝 사이즈를 설정한다. 양자화 스텝 사이즈는 도 4의 마스킹 레벨 제공부(408)와 양자화부(406)에서 설명한 바와 같은 방식으로 설정된다.

양자화 스텝 사이즈가 설정되면, 제 1205 단계에서 상기 오디오 부호화 방법은 상기 양자화 스텝 사이즈를 이용하여 제 1203 단계에서 검출된 차를 양자화한다. 다음, 상기 오디오 부호화 방법은 제 1206 단계에서 양자화된 차를 부호화한다.

제 1208 단계에서 상기 오디오 부호화 방법은 부호화된 차와 부호화된 진폭을 혼합할 때, 양자화 스텝 사이즈 정보를 부호화된 오디오 신호의 제어 파라미터 로서 혼합한다. 이에 따라 부호화된 오디오 신호는 양자화 스텝 사이즈 정보를 제어 파라미터로서 포함하게 된다.

도 13은 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 13은 입력되는 오디오 신호를 특정 길이로 세그먼트하여 정현파를 추출할 때, 추출된 정현파가 이전 세그먼트로부터 추출된 정현파와 연결 가능한 정현파인지를 체크하여 오디오 신호를 부호화하는 실시 예이다.

도 13을 참조하면, 상기 오디오 부호화 방법은, 입력되는 오디오 신호를 도 1의 세그먼테이션부(101)에서와 같이 특정 길이로 세그먼트한다(1301). 다음, 상기 오디오 부호화 방법은, 세그먼트된 오디오 신호의 정현파를 추출한다(1302). 정현파는 도 1의 정현파 추출부(102)에서와 같이 추출된다.

상기 오디오 부호화 방법은, 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교한다(1303). 이 때, 현재 세그먼트의 오디오 신호로부터 추출된 정현파의 수와 이전 세그먼트의 오디오 신호로부터 추출되는 정현파의 수는 상이할 수 있다.

비교결과, 현재 세그먼트의 오디오 신호로부터 추출된 정현파중에서 적어도 하나의 정현파가 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 상기 오디오 부호화 방법은 제 1302 단계에서 추출된 정현파를 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화한다(1304, 1305).

정현파 주파수의 유사 여부는, 예를 들어, 현재 세그먼트의 오디오 신호로부터 추출된 정현파가 20Hz, 30Hz, 35Hz이고, 사전에 설정된 오차 범위가 ±0.2일 때, 이전 세그먼트로부터 추출된 정현파의 주파수중 (20±0.2)Hz, (30±0.2)Hz, (35±0.2)Hz범위에 포함되는 주파수가 모두 존재하면, 현재 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수는 모두 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 경우이다. 반면에, 이전 세그먼트로부터 추출된 정현파의 주파수중 (20±0.2)Hz에 포함되는 주파수가 존재하지 않으면, 현재 세그먼트의 오디오 신호로부터 추출된 정현파중 20Hz의 정현파의 주파수는 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 경우이다. 따라서, 현재 세그먼트의 오디오 신호로부터 추출된 20Hz의 주파수를 갖는 정현파는 이전 세그먼트와 연결되지 않은 정현파로 분리되고, 30Hz와 35Hz의 주파수를 갖는 정현파는 이전 세그먼트와 연결된 정현파로 분리된다.

상기 오디오 부호화 방법은, 도 10의 제 1001 내지 1004 단계 또는 도 11의 제 1101 내지 1105 단계 또는 도 12의 제 1201 내지 1207 단계를 순차적으로 수행하여 상기 이전 세그먼트와 연결된 정현파를 부호화하고, 상기 이전 세그먼트와 연결되지 않은 정현파를 도 5의 제 3 부호화부(511)와 같이 부호화한다. 그리고, 상기 오디오 부호화 방법은, 상기 이전 세그먼트와 연결된 정현파를 부호화한 결과와 상기 이전 세그먼트와 연결되지 않은 정현파를 부호화한 결과를 혼합한 결과를 부호화된 오디오 신호로서 출력한다.

한편, 현재 세그먼트의 오디오 신호로부터 추출된 정현파가 모두 이전 세그 먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 가지면, 상기 오디오 신호 부호화 방법은, 현재 세그먼트로부터 추출된 정현파에 대해 도 10의 제 1001 내지 1005 단계 또는 도 11의 제 1101 내지 1106 단계 또는 도 12의 제 1201 내지 1208 단계를 순차적으로 수행하여 상기 이전 세그먼트와 연결된 정현파를 부호화한다(1304, 1306).

도 14는 본 발명의 일 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 상기 오디오 복호화 방법은, 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수와 부호화된 정현파의 진폭을 각각 검출한다(1401). 다음, 오디오 복호화 방법은, 검출된 부호화된 심리 음향적인 주파수를 복호화하고(1402), 도 6의 주파수 역변환부(603)와 같이 상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환한다(1403).

상기 오디오 복호화 방법은, 검출된 부호화된 정현파의 진폭을 복호화하고(1404), 복호화된 정현파의 진폭과 정현파의 주파수를 토대로 정현파의 위상을 검출한다(1405). 상기 상기 오디오 복호화 방법은 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 정현파의 주파수를 토대로 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원한다(1406).

도 15는 본 발명의 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도 15는 도 14의 오디오 복호화 방법에 예측 기능을 더 부가한 예이다. 따라서, 도 15의 제 1501, 1502, 1505 1506, 1507 단계는 도 14의 1401, 1402, 1404, 1405, 1406 단계와 유사하게 동작된다.

상기 오디오 복호화 방법은 도 15의 제 1503 단계에서 이전 세그먼트의 복호화된 심리 음향적인 주파수를 토대로 예측된 주파수와 제 1502 단계에서 복호화된 심리 음향적인 주파수를 가산한다. 다음, 상기 오디오 복호화 방법은 제 1504 단계에서 가산된 결과를 정현파의 주파수로 변환한다.

도 16은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도 16은 도 15의 오디오 복호화 방법에 역양자화 기능을 더 부가한 예이다. 따라서, 도 16의 제 1601, 1602, 1605, 1606, 1607, 1608 단계는 도 15의 1501, 1502, 1504, 1505, 1506, 1507 단계와 유사하게 동작된다.

상기 오디오 복호화 방법은 제 1603 단계에서 양자화 스텝 사이즈를 이용하여 복호화된 심리 음향적인 주파수를 역양자화한다. 양자화 스텝 사이즈는 제 1601 단계에서 부호화된 오디오 신호를 파싱할 때, 상기 부호화된 오디오 신호로부터 검출된다. 다음 상기 오디오 복호화 방법은 제 1604 단계에서 예측된 주파수와 상기 역양자화된 결과를 가산한다.

도 17은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도 17의 오디오 복호화 방법은 부호화된 오디오 신호를 복호화할 때, 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파를 분리하여 복호화하는 실시 예이다.

도 17을 참조하면, 상기 오디오 복호화 방법은, 부호화된 오디오 신호를 파싱하여 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현 파(이하 연결되지 않은 정현파라고 약함)가 존재하는지 체크한다(1701, 1702). 즉, 부호화된 오디오 신호에 상기 연결되지 않은 정현파의 주파수, 진폭 및 위상이 존재하면, 상기 오디오 복호화 방법은 부호화된 오디오 신호에 상기 연결되지 않은 정현파가 존재하는 것으로 판단한다.

상기 부호화된 오디오 신호에 상기 연결되지 않은 정현파가 존재하면, 상기 부호화된 오디오 신호를 상기 연결되지 않은 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파(이하 연결된 정현파라고 약함)로 분리하여 복호화한다(1703).

즉, 오디오 복호화 방법은 제 1703 단계에서 상기 부호화된 오디오 신호를 파싱하여 상기 연결된 정현파와 상기 연결되지 않은 정현파를 분리하고, 상기 연결된 정현파에 대해 도 14의 제 1402, 1403, 1404, 및 1405 단계, 또는 도 15의 제 1502 내지 1506 단계 또는 도 16의 제 1602 내지 1607 단계를 순차적으로 수행하여 정현파의 주파수, 진폭 및 위상을 각각 검출하고, 상기 연결되지 않은 정현파에 대해 도 9의 제 3 복호화부(909)에서와 같이 복호화하여 정현파의 주파수, 진폭 및 위상을 각각 검출한다. 다음 상기 오디오 복호화 방법은, 검출된 상기 연결된 정현파의 주파수, 진폭, 및 위상을 토대로 상기 연결된 정현파를 복원하고, 상기 연결되지 않은 정현파의 주파수, 진폭 및 위상을 토대로 상기 연결되지 않은 정현파를 복원하고, 상기 복원된 연결된 정현파와 상기 복원된 연결되지 않는 정현파를 결합하여 오디오 신호를 복원한다.

한편, 오디오 복호화 방법은, 부호화된 오디오 신호를 파싱한 결과, 상기 부 호화된 오디오 신호에 상기 연결되지 않은 정현파가 존재하지 않으면, 제 1704 단계에서 연결된 정현파를 복호화한다. 상기 연결된 정현파에 대한 복호화는 상술한 제 1703 단계에서 연결된 정현파에 대한 복호화와 유사한 방식으로 수행된다.

본원 발명에 따른 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

상술한 바와 같이 본 발명은 오디오 신호에 대한 정현파를 연결하여 부호화할 때, 연결된 정현파의 주파수를 심리음향 주파수로 변환시켜 부호화함으로써, 오디오 신호의 음질을 유지하면서 오디오 신호에 대한 압축율을 향상시킬 수 있다.

또한, 상기 심리 음향 주파수와 예측된 주파수간의 차를 부호화함으로써, 오디오 신호에 대한 압축율을 더 향상시킬 수 있고, 심리 음향 모델을 이용하여 계산된 마스킹 레벨과 연결된 정현파의 진폭을 이용하여 양자화 스텝 사이즈를 설정하고, 설정된 양자화 스텝 사이즈를 이용하여 상기 차를 부호화함으로써, 오디오 신호에 대한 압축율을 더 향상시킬 수 있다.

그리고, 현재 세그먼트된 오디오 신호로부터 추출된 정현파중에서 이전 세그먼트된 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 갖는 정현파가 존재할 경우에, 현재 세그먼트된 오디오 신호로부터 추출된 정현파를 이전의 세그먼트된 오디오 신호로부터 추출된 정현파와 연결된 정현파와 이전의 세그먼트된 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화함으로써, 잘못된 부호화로 음질이 저하되는 것을 방지할 수 있다.

Claims

오디오 부호화 방법에 있어서,

입력되는 오디오 신호의 정현파를 연결하는 단계;

상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 단계;

상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 단계;

상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화 단계; 및

상기 제 1 부호화 단계에서 부호화된 결과와 상기 제 2 부호화 단계에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 단계를 포함하는 오디오 부호화 방법.
제 1 항에 있어서, 상기 오디오 부호화 방법은,

상기 심리 음향적인 주파수와 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된 주파수간의 차를 검출하는 단계를 더 포함하고,

상기 제 1 부호화 단계는 상기 심리 음향적인 주파수 대신 상기 차를 부호화하는 것을 특징으로 하는 오디오 부호화 방법.
제 2 항에 있어서, 상기 오디오 부호화 방법은,

상기 입력되는 오디오 신호에 대한 심리 음향 모델을 이용하여 계산된 마스킹 레벨과 상기 연결된 정현파의 진폭을 토대로 양자화 스텝 사이즈를 설정하는 단 계; 및

상기 설정된 양자화 스텝 사이즈로 상기 차를 양자화하는 단계를 더 포함하고,

상기 제 1 부호화 단계는 상기 차 대신 상기 양자화된 차를 부호화하는 것을 특징으로 하고,

상기 부호화된 오디오 신호 출력 단계는 상기 설정된 양자화 스텝 사이즈에 대한 정보를 제어 파라미터로서 혼합하여 출력하는 것을 특징으로 하는 오디오 부호화 방법.
제 3 항에 있어서, 상기 양자화 스텝 사이즈를 설정하는 단계는,

상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이면, 상기 양자화 스텝 사이즈를 작게 설정하고,

상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이 아니면, 상기 양자화 스텝 사이즈를 크게 설정하는 것을 특징으로 하는 오디오 부호화 방법.
제 1 항 내지 제 4 항중 어느 한 항에 있어서, 상기 오디오 부호화 방법은,

상기 입력되는 오디오 신호를 특정 길이로 세그먼트하는 단계;

상기 세그먼트된 오디오 신호의 정현파를 추출하는 단계;

상기 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교하는 단계;

상기 비교결과, 상기 추출된 정현파중에서 적어도 하나의 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 상기 추출된 정현파를 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화하는 단계를 더 포함하고,

상기 연결된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하고,

상기 비교결과, 상기 추출된 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 가지면, 상기 추출된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하는 것을 특징으로 하는 오디오 부호화 방법.
오디오 신호 복호화 방법에 있어서,

부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수와 부호화된 정현파의 진폭을 각각 검출하는 단계;

상기 검출된 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화 단계;

상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 단계;

상기 검출된 부호화된 정현파의 진폭을 복호화하는 제 2 복호화 단계;

상기 복호화된 정현파의 진폭과 상기 정현파의 주파수를 토대로 정현파의 위상을 검출하는 단계; 및

상기 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원하는 단계를 포함하는 오디오 복호화 방법.
제 6 항에 있어서, 상기 오디오 복호화 방법은,

상기 복호화된 심리 음향적인 주파수와 이전 세그먼트의 복호화된 심리 음향적인 주파수를 토대로 예측된 주파수를 가산하는 단계를 더 포함하고,

상기 정현파의 주파수로 변환하는 단계는, 상기 복호화된 심리 음향적인 주파수 대신 상기 가산된 결과를 상기 정현파의 주파수로 변환하는 것을 특징으로 하는 오디오 복호화 방법.
제 7 항에 있어서, 상기 오디오 복호화 방법은,

상기 부호화된 오디오 신호를 파싱하여 양자화 스텝 사이즈가 검출되면, 상기 검출된 양자화 스텝 사이즈를 이용하여 상기 복호화된 심리 음향적인 주파수를 역 양자화 하는 단계를 더 포함하고,

상기 가산 단계는 상기 복호화된 심리 음향적인 주파수 대신 상기 역 양자화된 결과와 상기 예측된 주파수를 가산하는 것을 특징으로 하는 오디오 복호화 방 법.
제 6 항 내지 제 8 항중 어느 한 항에 있어서, 상기 오디오 복호화 방법은,

상기 부호화된 오디오 신호를 파싱한 결과, 상기 부호화된 오디오 신호에 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파가 존재하면, 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파를 분리하는 단계;

상기 연결된 정현파에 대해 상기 검출 단계, 상기 제 1 복호화 단계, 상기 변환 단계, 제 2 복호화 단계, 및 상기 위상 검출 단계를 순차적으로 수행하여 상기 연결된 정현파의 진폭, 주파수 및 위상을 각각 검출하는 제 1 검출 단계;

상기 연결되지 않는 정현파를 복호화하여 상기 연결되지 않은 정현파의 진폭, 주파수 및 위상을 각각 검출하는 제 2 검출 단계; 및

상기 오디오 신호 복원 단계는, 상기 제 1 검출 단계와 상기 제 2 검출단계에서 각각 검출된 정현파의 진폭, 주파수 및 위상을 토대로 정현파를 복원하고, 상기 복원된 정현파를 이용하여 오디오 신호를 복원하는 것을 특징으로 하는 오디오 복호화 방법.
오디오 부호화 장치에 있어서,

입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부;

상기 세그먼테이션부로부터 출력되는 오디오 신호로부터 적어도 하나의 정현파를 추출하는 정현파 추출부;

상기 정현파 추출부에서 추출된 정현파를 연결하는 정현파 연결부;

상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 주파수 변환부;

상기 심리 음향적인 주파수를 부호화하는 제 1 부호화부;

상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화부; 및

상기 제 1 부호화부에서 부호화된 결과와 상기 제 2 부호화부에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 혼합부를 포함하는 오디오 신호 부호화 장치.
제 10 항에 있어서, 상기 오디오 부호화 장치는,

이전 세그먼트의 심리 음향적인 주파수를 토대로 주파수를 예측하는 예측부;

상기 예측부에서 예측된 주파수와 상기 주파수 변환부로부터 출력되는 심리 음향적인 주파수간의 차를 검출하는 차 검출기를 더 포함하고,

상기 제 1 부호화부는 상기 심리 음향적인 주파수 대신 상기 차를 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
제 11 항에 있어서, 상기 오디오 부호화 장치는,

상기 세그먼테이션부로부터 출력되는 오디오 신호에 대한 심리 음향 모델을 이용하여 계산된 마스킹 레벨을 제공하는 마스킹 레벨 제공부;

상기 정현파 연결부로부터 출력되는 상기 연결된 정현파의 진폭과 상기 마스킹 레벨을 토대로 양자화 스텝 사이즈를 설정하고, 상기 설정된 양자화 스텝 사이즈를 이용하여 상기 차 검출기로부터 출력되는 신호를 양자화하면서, 상기 차 검출기로부터 출력되는 신호를 상기 이전 세그먼트의 심리 음향적인 주파수로서 상기 예측부로 전송하는 양자화부를 더 포함하고,

상기 제 1 부호화부는 상기 차 대신 상기 양자화부로부터 출력되는 양자화된 신호를 부호화하고,

상기 혼합부는 상기 양자화부로부터 출력되는 상기 양자화 스텝 사이즈를 상기 부호화된 오디오 신호의 제어 파라미터로서 혼합하는 것을 특징으로 하는 오디오 부호화 장치.
제 12 항에 있어서, 상기 양자화부는 상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이면, 상기 양자화 스텝 사이즈를 작게 설정하고, 상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이 아니면, 상기 양자화 스텝 사이즈를 크게 설정하는 것을 특징으로 하는 오디오 부호화 장치.
제 10 항 내지 제 13 항중 어느 한 항에 있어서,

상기 정현파 연결부는 상기 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교하여 상기 추출된 정현파중에서 적어 도 하나의 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않으면, 상기 주파수가 유사하지 않은 정현파의 주파수, 진폭 및 위상을 부호화하는 제 3 부호화부를 더 포함하는 오디오 부호화 장치.
오디오 복호화 장치에 있어서,

부호화된 오디오 신호를 파싱하는 파싱부;

상기 파싱부로부터 출력되는 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화부;

상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 주파수 역변환부;

상기 파싱부로부터 출력되는 부호화된 정현파의 진폭을 복호화하는 제 2 복호화부;

상기 정현파 주파수와 상기 복호화된 정현파의 진폭을 토대로 정현파의 위상을 검출하는 위상 검출부; 및

상기 위상 검출부에서 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고 상기 복원된 정현파를 이용하여 오디오 신호를 복원하는 오디오 복원부를 포함하는 오디오 복호화 장치.
제 15 항에 있어서, 상기 오디오 복호화 장치는,

이전 세그먼트의 복호화된 심리 음향적인 주파수를 토대로 주파수를 예측하 는 예측부;

상기 제 1 복호화부에서 복호화된 심리 음향적인 주파수와 상기 예측부로부터 출력되는 예측된 주파수를 가산하는 가산기를 더 포함하고,

상기 주파수 역변환부는 상기 복호화된 심리 음향적인 주파수 대신 상기 가산기로부터 출력되는 가산 결과를 상기 정현파의 주파수로 변환하는 것을 특징으로 하는 오디오 복호화 장치.
제 16 항에 있어서, 상기 오디오 복호화 장치는,

상기 파싱부로부터 양자화 스텝 사이즈 정보가 출력되면, 상기 양자화 스텝 사이즈에 따라 상기 제 1 복호화부로부터 출력되는 복호화된 심리 음향적인 주파수를 역양자화 하는 역양자화부를 더 포함하고,

상기 가산기는 상기 역양자화로부터 출력되는 역양자화된 결과와 상기 예측된 주파수를 가산하는 것을 특징으로 오디오 복호화 장치.
제 15 항 내지 제 17 항중 어느 한 항에 있어서, 상기 오디오 복호화 장치는

상기 파싱부로부터 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파의 부호화된 주파수, 진폭 및 위상이 출력되면, 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파의 부호화된 주파수, 진폭 및 위상을 복호화하는 제 3 복호화부를 더 포함하고,

상기 오디오 신호 복원부는 상기 제 3 복호화부에서 복호화된 정현파의 주파 수, 진폭 및 위상으로 정현파를 복원하여 상기 오디오 신호를 복원하는데 이용하는 것을 특징으로 하는 오디오 복호화 장치.