KR20070008211A

KR20070008211A - 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치

Info

Publication number: KR20070008211A
Application number: KR1020050063268A
Authority: KR
Inventors: 김상욱; 라케쉬 타오리; 성호상; 이강은; 이시화
Original assignee: 삼성전자주식회사
Priority date: 2005-07-13
Filing date: 2005-07-13
Publication date: 2007-01-17

Abstract

본 발명은 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치를 제공한다. 본 발명에 따른 스케일러블 대역 확장 음성 부호화방법은 기본 음질 계층과 음질 향상 계층으로 이루어진 음성 신호를 부호화하는 방법에 있어서, 기본 음질 계층의 선형 예측 부호화 파라메터들을 구하는 단계; 기본 음질 계층의 선형 예측 파라메터를 이용한 합성된 값과 원신호와의 차이 값인 표현오차 값에 대하여, 선형 예측 해석을 수행해 광대역 신호에 대한 선형 예측 부호화를 위한 정보를 얻는 단계; 및 하모닉스 신호에 대한 정보를 얻는 단계들로 구성된 것을 특징으로 한다.

Description

스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치{Scalable bandwidth extension speech coding/decoding method and apparatus}

도 1은 기존의 대역 확장 음성 부호화 장치의 블록도의 일 예이다(US PAT 5455888).

도 2는 기존의 대역 확장 음성 부호화 장치의 블록도의 다른 예이다(US PAT 6895375).

도 3은 본 발명에 따른 스케일러블 대역 확장 부호화 장치의 기능 블록도이다.

도 4는 본 발명에 따른 스케일러블한 비트스트림 구조의 일 예이다.

도 5는 본 발명에 따른 대역 확장 음성 복호화 장치의 기능 블록도이다.

도 6은 본 발명에 따른 스케일러블 대역 확장 부호화 장치의 상세 블록도이다.

도 7은 본 발명에 따른 광대역 LPC 계수 합성 단계를 나타내는 흐름도.

도 8은 본 발명에 따른 대역 확장 음성 복호화 장치의 상세 블록도이다.

본 발명은 음성 부호화 및 복호화에 관한 것으로서, 특히 스케일러블 광대역 음성 부호화 및 복호화에 있어서 고대역 음성 부호화 및 복호화 장치와 그 방법에 관한 것이다.

음성 통신의 응용 분야가 다양해지고 네트워크의 전송속도가 향상됨으로 인해 고품질의 음성 통신에 대한 필요성이 부각되고 있다. 이에 따라 기존의 음성 통신 대역인 0.3kHz∼3.4kHz에 비해 자연성과 명료도 등 다양한 측면에서 우수한 성능을 갖는 0.3kHz∼7kHz의 대역폭을 갖는 광대역 음성 신호의 전달이 요구되고 있다.

또한 네트워크 측면에서, 데이터를 패킷 단위로 전송하는 패킷 스위칭 네트워크(packet switching network)는 채널의 정체 현상을 초래할 수 있고, 이로 인한 패킷 손실과 음질 저하가 발생될 수 있다. 이를 해결하기 위하여 손상된 패킷을 은닉하는 기술이 사용되고 있지만 이는 근본적인 처방이 될 수 없다.

따라서 상기 광대역 음성 신호를 효과적으로 압축하면서 채널의 정체 현상을 해결할 수 있는 스케일러블한 광대역 음성 부호화 및 복호화 기술이 제안되고 있다.

현재 제안되고 있는 광대역 음성 부호화 및 복호화는 0.3kHz∼7kHz 대역의 음성신호를 한꺼번에 압축하고 이를 복원하는 방식과 0.3kHz∼4kHz 대역과 4kHz∼7kHz 대역으로 나누어 계층적으로 압축하고, 이를 복원하는 방식으로 구분될 수 있다. 후자의 경우는 정체 현상의 정도에 따라 전달하는 계층의 양을 조절하여 주어진 채널 환경에서 최적의 통신이 가능하도록 하는 대역폭 확장 기능을 이용한 광대 역 음성 부호화 및 복호화 방식이다.

대역폭 확장 방법에 의한 음성 부호화는 계층적(hierarchical) 코딩방식으로 음성신호를 부호화하고 복호화 한다. 즉, 음성신호를 기본 음질 계층(core layer)과 음질 향상 계층(speech enhancement layer)으로 나누어 음성신호를 부호화한다. 기본 계층은 최소한의 음질을 복원할 수 있는 정보만을 전송한다. 음질 향상 계층에서는 음질을 향상시킬 수 있는 추가 정보를 전송한다. 음질향상을 위하여, 대역폭 확장을 제공하기 위한 방식은 US PAT 5455888, US PAT 6895375등에서 연구가 되어 왔다. 종래의 기술은 Spectrum shape와 Power gain정보를 가지고서, Spectrum shape로 표현되는 스펙트럼 포락선 아래에 Power gain 값을 이용해, 파워 레벨을 맞추어 주고 있다. 도 1은 기존의 대역 확장 음성 부호화 장치의 블록도의 일 예이다(US PAT 5455888). 도 2는 기존의 대역 확장 음성 부호화 장치의 블록도의 다른 예이다(US PAT 6895375).

그러나 위와 같은 기존의 방식에 의해 고대역 음성 신호를 부호화하는 것은 낮은 비트율로 음성 신호를 전송할 때, 고음질의 복원이 어렵고, 비트율이 낮아 질수록 음질 복원 성능의 저하가 두드러진다. 그리고, 상기 방식들은 채널의 정체 현상을 해결할 수 있는 스케일러블한 광대역 음성 재생을 제공하지 못하고 있다.

본 발명이 이루고자 하는 기술적 과제는 대역폭 확장 기능을 갖는 광대역 음성 부호화 및 복호화에 있어서 고대역 음성신호가 하모닉(harmonic) 성분으로 표현되는 스케일러블 대역 확장 음성 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.

본 발명이 이루고자 하는 다른 기술적 과제는 대역폭 확장 기능을 갖는 광대역 음성 부호화 및 복호화에 있어서 주파수 해상도와 복잡도에 의존하지 않고 정확한 하모닉 크기와 위상을 얻을 수 있는 고대역 음성 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.

본 발명이 이루고자 하는 또 다른 기술적 과제는 음성 신호의 하모닉스 정보를 최소한의 정보로 표현하게 하는 음성 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.

상기 기술적 과제들을 달성하기 위하여 본 발명은, 선형 예측 부호화를 사용하여 입력 음성신호를 필터링하고, 고정 코드북 탐색 및 적응 코드북 탐색에 의해 상기 필터링된 음성신호의 여기 신호를 생성하는 기본 계층; 및 상기 기본 계층에서의 음성 신호의 여기 신호를 사용해 합성한 신호와 원 신호간의 차이인 표현오차 신호를 구하는 단계 및 표현오차신호를 선형 예측 해석을 통해, 광대역 신호를 표현하는 단계, 선형 예측 해석 후 남는 잔차 신호를 하모닉 분석을 통해 압축해 주는 음질향상 계층을 적어도 하나 이상 포함하고, 상기 기본 계층에서 생성되는 신호와 상기 음질 향상 계층에서 생성되는 신호를 다중화하고, 상기 다중화된 신호를 출력하는 다중화기를 포함하는 음성신호 부호화 장치를 제공한다.

상기 기술적 과제들을 달성하기 위하여 본 발명은, 선형 예측 부호화를 사용하여 입력 음성신호를 필터링하고, 고정 코드북 탐색 및 적응 코드북 탐색에 의해 상기 필터링된 음성신호의 여기 신호를 생성하는 기본 계층; 및 상기 기본 계층에서의 음성 신호의 여기 신호를 사용해 합성한 신호와 원 신호간의 차이인 표현오차 신호를 구하는 단계 및 표현오차신호를 선형 예측 해석을 통해, 광대역 신호를 표현하는 단계, 광대역 신호에 대한 선형 예측 해석 후 남는 residual 신호를 Harmonics분석을 통해 압축하여 음질 향상 계층에서 표현하고자 하는 신호를 구하는 대역폭 확장 음성 부호화 및 복호화 장치와 그 방법을 제공한다.

상기 기술적 과제들을 달성하기 위하여 본 발명은, 음성 신호의 하모닉스 정보를 표현하는데 사용되는 주파수 정보와 위상(phase)정보들을 압축하는 처리를 수행해 최소한의 비트들을 사용해 표현하게 하는 음성 부호화 및 복호화 장치와 그 방법을 제공한다.

이하, 첨부 도면을 참조하여 본 발명의 실시예에 따른 스케일러블 광대역 음성 부호화 및 복호화 장치와 그 방법을 살펴보면 다음과 같다.

도 3은 본 발명에 따른 스케일러블 광대역 음성 부호화 시스템의 전체 구조도이다. 스케일러블 광대역 음성 부호화 시스템은, 기본 음질 계층 부호화부(300)과 음질 향상 계층 부호화부(500), 및 비트스트림 형성부(700)을 포함한다.

도 4는 본 발명에 따른 스케일러블한 비트스트림 구조의 일 예를 보인다.

도 5는 본 발명에 따른 스케일러블 광대역 음성 복호화 시스템의 전체 구조도이다. 스케일러블 광대역 음성 복호화 시스템은, 비트스트림 해제부(200), 기본 음질 계층 복호화부(400)과 음질 향상 계층 복호화부(600), 및 출력 음성 합성부(800)을 포함한다.

도 6은 본 발명의 바람직한 실시 예에 따른 스케일러블한 대역 확장 음성 부호화 시스템의 부호화기 블록도이다.

기본 음질 부호화부(300)은 저역 통과 필터(320)와 데시메이션부(340), 및 선형 예측 부호화 파라메터 해석 및 압축부(360)를 포함한다.

음질 향상 부호화부(500)은 선형 예측 부호화 파라메터 해석 및 압축부(360)에서 구해준 선형 예측 부호화 계수들을 복호화 하는 선형 예측 부호화 복호화부(520), 샘플링 주파수를 높혀주는 효과를 제공하는 인터폴레이션부(540), 기본 음질 부호화부에서 표현되는 신호와 원 신호간의 차이인 표현오차 신호를 구하는 가산기부(560), 가산기부(560)의 출력인 표현오차 값과 기본 음질 부호화(300)의 선형 예측 부호화 파라메터 해석 및 압축부(360)에서 구해 준 선형 예측 부호화 양자화 계수 정보를 가지고 고대역 신호를 포함하여 선형 예측 분석을 수행하는 선형 예측 해석부(580), 선형 예측 해석에 의해 표현되고 남은 잔차 신호에 대하여 시간/주파수 변환을 해주는 시간/주파수 변환부(620), 및 시간/주파수 변환부(620) 결과 신호에 대하여 선형 예측 해석부(580) 결과를 이용하여 하모닉 해석 및 압축을 해 주는 하모닉 해석 및 압축부(640)를 포함한다.

비트스트림 형성부(700)은 기본 음질 부호화부(300)에서 구한 선형 예측 부호화 파라메터들과 음질 향상 부호화부(500)에서 광대역 신호를 대상으로 구해준 선형 예측 부호화 정보 및 음질 향상 부호화부(500)에서 구한 하모닉스 신호의 진폭 정보와 위상 정보, 그리고 이득 값을 이용해 스케일러블한 비트스트림을 만든다.

도 6를 참조하여 본 발명의 부호화기의 바람직한 동작 과정을 살펴 본다.

먼저 16kHz로 샘플링된 음성 신호를 입력으로 받는다. 음성 신호를 입력으로 받아, 기본 음질 계층 부호화기(300)에서는 처리의 대상으로 하는 주파수 영역을 고려하여 LPF(320)부를 사용하여, 신호를 분리해 주는 처리를 한다. 일 예로, 입력신호가 16kHz로 샘플링된 0~8kHz까지의 주파수 성분들을 가지고 있는 신호이고, 선형 예측 부호화 파라메터 해석 및 압축부(360)에서 처리의 대상으로 하는 신호는 0~3.4kHz의 협대역 음성 신호인 경우, LPF(320)에서는 4kHz 정도를 차단주파수로 갖는 저역 통과 필터를 통과시켜 협대역 신호 영역 신호만을 골라내 주는 처리를 한다. LPF(320)을 통과하여, 포함된 신호의 성분들이 0~8kHz에서 0~4kHz로 줄어들었으므로, 데시메이션부(340)에서 다운샘플링해 주어 샘플링 주파수를 8kHz로 맞추어 주어 신호의 효율적인 표현을 해준다. 데시메이션부(340)에서 다운샘플링 한 0~4kHz까지의 성분들을 가지고 있는 신호를 받아 선형 예측 부호화 파라메터 해석 및 압축부(360)부에서는 선형 예측 부호화 해석을 수행 한다. 선형 예측 부호화 해석을 통하여, 주파수 신호의 포락선을 10차 계수로 표현되는 방정식으로 모델링 해 주는 처리를 한다.

10차 선형 예측 부호화 계수는

로 표현되고, 다음과 같은 안정된 all-pole 필터의 전달함수인 H(z)에서 전달함수의 분모로부터 온 값들이다.

음질 향상 계층 부호화부(500)에서는 기본 음질 계층 부호화부(300)에서 나오는 출력 선형 예측 부호화 파라메터들과 16kHz로 샘플링된 원 신호를 입력으로 하여 처리를 수행한다. 기본 음질 계층 부호화부(300)에서 만들어진 선형 예측 부호화 파라메터들을 이용하여, 그 값이 재생되었을 때의 신호를 구해 준다. 기본 음질 계층 부호화부(300)에서 선형 예측 부호화 파라메터 해석 및 압축부(360)시에 표현에 사용되었던 신호는 0~4kHz대역의 신호이고, 샘플링 주파수는 8kHz였는데, 원 신호와 기본 음질 계층 부호화 부에서 표현되는 신호간의 차이인 표현오차 값을 구하기 위하여 업샘플링을 해 주어 샘플링 주파수를 16kHz로 맞추어 준다. 인터폴레이션부(540)에서 업샘플링된 기본 음질 계층에서 표현되는 신호와 원래의 입력신호간의 차이인 표현오차 값은 가산기(560)에서 구해 준다. 가산기(560)에서 구해진 표현오차 값과 기본 음질 계층 부호화부(300)에서 구해진 선형 예측 부호화 파라메터 값들을 이용하여, 고음질 대역(4kHz~8kHz)을 포함하는 표현오차 값의 영역(0~8kHz)의 신호에 대하여, 선형 예측 해석부(580)을 수행한다. 이 때에, 기본 음질 계층 부호화부(300)에서 구해진 선형 예측 부호화 계수를 이용하여, 음질 향상 계층 부호화부에서 표현에 사용되는 선형 예측 부호화 계수를 구하는 것을 특징으로 한다. 기본 음질 계층 부호화부에서는 협대역 신호(0~3.4kHz) 신호에 대하여, 10차로 구하고, 음질 향상 계층부에서는 표현오차 신호를 이용하여 전대역 신호 (0~8kHz)에 대하여, 16차로 계수를 구하는 데, 최종 광대역 선형 예측 부호화 계수를 구한다.

도 7은 본 발명에 따른 광대역 LPC 계수 합성 단계를 나타내는 흐름도이다.

단계 1: 기본 음질 계층과 음질 향상 계층의 LPC 계수를 받는다.

단계 2: 각 LPC 계수에 대응하는 LSP(Line Spectral Pair)를 구한다.

단계 3: 각 LSP 계수에 대응하는 LSF(Line Spectral Frequency)를 구한다.

단계 4: 각 LSF에 대하여, QLSF(Quantized Line Spectral Frequency)를 구한다.

단계 5: 각 QLSF를 가지고 QLSP(Quantized Line Spectral Pair)를 구한다.

단계 6: 광대역을 표현하는데 사용될 QLSP를 기본 음질 계층과 음질 향상 계층의 QLSP를 가지고 만들어 낸다.

단계 7: 광대역용 QLSP를 가지고, 광대역용 QLPC(Quantized Linear Predictive Coding) 계수를 구한다.

이 때, 단계 6에서, 기본 음질 계층의 QLSP 일부와 음질 향상 계층의QLSP가운데 일부를 사용하여, 광대역 신호를 표현하는데 사용되는 QSLP 신호를 만들어 낸다. 일 예로, 기본 음질 계층의 QSLP 10개 가운데, 하위 주파수8개를 취하고, 음질 향상 계층의 QLSP 16개 가운데, 상위 주파수 8개에 대한 값을 취하여, 광대역 표현을 위한 전체 QSLP 16개를 만들어 준다. 처리 과정을 도7에 보인다.

선형 예측 부호화는 파라메터에 의해 표현해 주는 방식으로, 표현되지 못하고 남는 잔차신호가 발생한다. 선형 예측 해석부(580) 결과 발생하는 잔차 신호에 대하여, 시간/주파수 변환(620) 단계를 거친다. 시간/주파수 변환(620) 단계를 수행하여 주파수 성분 별로 신호의 진폭과 위상 값들을 구해 준다. 시간/주파수 변환(620) 단계에서 구해준 주파수 성분 별 신호의 진폭과 위상 값들과 다음, 선형 예측 해석부(580) 결과를 고려하여, 하모닉 분석 단계(640)를 수행한다. 하모닉 ㅂ분석 단계(640)에 있어서, 중요한 위치에 해당하는 신호를 골라내 처리를 수행한다. 중요한 신호를 구하는 방법의 일 예로는 주파수 대역에서 상대적으로 낮은 주파수 위치에 있는 하모닉 성분, 전체 주파수 대역에서 에너지의 크기가 상대적으로 큰 값을 갖는 하모닉 성분, 선형 예측 부호화 계수를 통해 복원할 때에 Formant의 주파수 위치에 해당하는 하모닉 성분 값들이 있다.

도 8은 본 발명의 바람직한 실시 예에 따른 스케일러블한 대역 확장 음성 복호화 시스템의 복호화기 기능 블록도이다. 저장매체나 전송 매체를 통해 전달된, 부호화된 스케일러블한 비트스트림을 입력으로 받는다. 입력된 비트스트림은 비트스트림 해체부(200)에서 구문에 맞추어 해체되는 단계를 수행한다. 해체시 재생에 사용될 주파수 대역이 협대역(0~4kHz)인지, 고대역(4kHz~8kHz)을 포함하는 광대역(0~8kHz)인지에 따라, 해당하는 비트스트림의 부분들을 분리해 주는 처리를 한다. 기본 음질 계층 재생부(400)에서는 분리된 비트스트림의 부분들 가운데, 협대역(0~4kHz)의 신호들을 포함하는 부분을 복호화 한다. 음질 향상 계층 재생부(600)에서는 분리된 비트스트림 가운데, 고대역(4kHz~8kHz) 신호를 포함하는 광대역(0~8kHz)에 해당하는 신호들을 복호화하는 처리를 한다. 복호화된 재생 신호들은 출력 파형 합성부(800)에서, 합성되어 출력되는 신호를 거친다.

도 8을 사용하여 보다 자세하게 설명한다. 전달된 비트스트림은 비트스트림 해체부(200)에서 해체되어, 하모닉 합성부를 위한 입력과 기본음질 재생을 위한 입력과 확장 음질 재생을 위한 입력을 구해준다. 이 때, 외부 제어 신호에 따라서 협대역 신호를 재생에만 사용할 것인지 또는 광대역 신호를 재생에 사용할 것인지를 제어 할 수도 있다. 재생용 LSP 합성부(630)에서는 협대역 신호만을 재생하는 경우에는 기본 음질 재생을 위한 입력 신호만을 가지고서 재생용 LSP 합성부(630)의 출력을 만들고, 광대역 신호를 재생하는 경우에는 기본 음질 재생을 위한 입력과 확장 음질 재생을 위한 입력을 결합하여, 재생용 LSP 합성부(630)의 출력을 만든다. 이 때 LSP 합성에 있어서는 앞의 부호화 기에서 밟았던 단계를 활용한다. 재생용 LSP 합성부(630)의 출력 값을 받아 LSP/LPC 변환부(670)를 거친 신호는 LPC합성부(820)의 입력으로 전달된다. LPC 합성부(820)에서는 하모닉 합성부(690)로부터 전달된 여기신호(excitation signal)와 LSP/LPC 변환부(670)에서 전달된 포락선 신호 정보(envelope signal)을 이용하여, 음성 신호를 만들어 낸다. 만들어 준 음성 신호는 필요에 따라 후처리부(840)를 거쳐 최종 사용되는 신호를 만들어 준다.

본원 발명에 따른 스케일러블한 대역 확장 음성 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인 터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.

또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

본 발명은 스케일러블한 음성 서비스를 가능하게 하고, 고 대역 신호를 대역 확장 기법에 의하여 효과적으로 압축 표현이 가능하게 한다.

기존의 협대역 신호에 대한 음성 부호화 방식과 결합하여 사용이 가능하다.

협대역과 고대역간의 스케일러블한 재생이 가능하기 위하여, LSP(line Spectral Pair)영역에서 저대역 신호의 LSP와 잔차 신호에 대한 LSP를 이용해, 광대역 LSP를 만들어 내는 방법을 제안하여 효과적으로 합성이 될 수 있도록 하였다.

음성 신호의 하모닉스 정보의 압축을 해주는 방법을 제안하여, 적은 비용의 추가로 음질 개선을 가져 올 수 있는 방식을 제시하였다.

Claims

기본 음질 계층과 음질 향상 계층으로 이루어진 음성 신호를 부호화하는 스케일러블 대역 확장 음성 부호화방법에 있어서,

기본 음질 계층의 선형 예측 부호화 파라메터들을 구하는 단계;

기본 음질 계층의 선형 예측 파라메터를 이용한 합성된 값과 원신호와의 차이 값인 표현오차 값에 대하여, 선형 예측 해석을 수행해 광대역 신호에 대한 선형 예측 부호화를 위한 정보를 얻는 단계; 및

하모닉스 신호에 대한 정보를 얻는 단계들로 구성된 것을 특징으로 하는 스케일러블 대역 확장 음성 부호화방법.
제1항에 있어서, 상기 하모닉스 신호에 대한 정보는,

시간 주파수 변환을 통하여, 크기 및 위상 정보와 해당 프레임의 크기정보를 고려한 게인을 사용하는 것을 특징으로 하는 스케일러블 대역 확장 음성 부호화방법.
기본 음질 계층과 음질 향상 계층으로 이루어진 음성 신호를 부호화하는 스케일러블 대역 확장 음성 부호화방법에 있어서,

기본 음질 계층의 협대역 선형 예측 부호화 파라메터 들을 구하는 단계;

기본 음질 계층의 선형 예측 파라메터를 이용한 합성된 값과 원신호와의 차 이 값인 표현오차 값에 대하여, 선형 예측 해석을 수행해 광대역 신호에 대한 선형 예측 부호화를 위한 정보를 얻는 단계를 포함하는 것을 특징으로 하는 스케일러블 대역 확장 음성 부호화방법.
비트스트림을 복호화하여, 기본 음질 계층의 파라메터와 음질 향상 계층의 파라메터, 하모닉스 정보를 추출하는 단계;

협대역 재생의 경우인지 아닌지에 대한 외부 입력 신호를 받아, 출력 신호를 만드는데 필요한 선형 예측 부호화 계수 합성을 위한 파라메터를 형성하는 단계;

하모닉스 신호에 대한 복호화를 하는 단계; 및

선형 예측 부호화 합성을 위한 파라메터와 하모닉스 신호 복호화된 결과를 이용하여, 선형 예측 부호 합성을 하는 단계를 포함하는 것을 특징으로 하는 스케일러블 대역 확장 음성 복호화방법.