KR100612889B1

KR100612889B1 - 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치

Info

Publication number: KR100612889B1
Application number: KR1020050010992A
Authority: KR
Inventors: 성호상; 최승호; 주기현
Original assignee: 삼성전자주식회사
Priority date: 2005-02-05
Filing date: 2005-02-05
Publication date: 2006-08-14
Also published as: KR20060090457A; US8214203B2; US7765100B2; US20060178872A1; JP2006215569A; EP1688916A3; US20100191523A1; EP1688916A2

Abstract

본 발명은 음성 복호화에서 프레임 손실 시, 스펙트럼 영역에서 선스펙트럼 쌍(Line Spectrum Pair) 파라미터를 복원하는 방법 및 장치와 그 음성 복호화 장치에 관한 것으로, 본 발명에 따른 방법은, 음성 복호화 시, 소거된 프레임이 존재하는 것으로 판단되면, 소거된 프레임의 이전 또는 이전과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환 단계; 제 1 변환 단계에 의해 얻어진 스펙트럼 포락선들을 이용하여 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 및 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함함으로써, 음성 복호화 시, 복원된 음성신호의 질을 향상시키면서 다양한 기술에 적용이 가능하고, 알고리즘 개발이 용이한 선스펙트럼 쌍 파라미터 복원 기술을 제공할 수 있다.

Description

선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성 복호화 장치{Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus thereof}

도 1은 기존의 선스펙트럼 쌍 파라미터 복원 방법의 일 예이다.

도 2는 기존의 선스펙트럼 쌍 파라미터 복원 방법의 다른 예이다.

도 3은 본 발명의 바람직한 일 실시 예에 따른 선스펙트럼 쌍 파라미터 복원 장치를 포함하는 음성 복호화 장치의 기능 블록 도이다.

도 4는 도 3에 도시된 프레임 소거 은닉 유니트의 일 실시 예이다.

도 5는 도 3에 도시된 프레임 소거 은닉 유니트의 다른 실시 예이다.

도 6은 도 5에서의 본 발명에 따른 선스펙트럼 쌍 파라미터 복원 장치의 동작 개념도이다.

도 7은 도 3에 도시된 프레임 소거 은닉 유니트의 또 다른 실시 예이다.

도 8은 도 7의 복원 유니트에서 수행되는 DFW에 의한 워핑경로와 워핑 범위에 대한 예시도이다.

도 9는 본 발명의 바람직한 또 다른 실시 예에 따른 선스펙트럼 쌍 파라미터 복원 방법의 동작 흐름도이다.

도 10은 본 발명의 바람직한 또 다른 실시 예에 따른 선스펙트럼 쌍 파라미 터 복원 방법의 동작 흐름도이다.

본 발명은 음성 복호화(speech decoding) 시 선스펙트럼 쌍(Line Spectrum Pair, 이하 LSP라고 약함) 파라미터 복원 방법 및 장치에 관한 것으로, 더욱 상세하게는 프레임 손실 시 LSP 파라미터를 복원하는 방법 및 장치과 그 음성 복호화 장치에 관한 것이다.

대역폭이 제한된 전송 환경에서도 데이터 전송을 가능하게 하기 위하여, 최근의 음성 부호화 장치는 음성 신호를 직접 전송하는 대신 음성신호를 대표하는 파라미터들을 추출하고, 추출된 파라미터를 부호화하고, 부호화된 파라미터를 포함하는 음성 패킷을 생성한다. 이에 따라 음성 복호화 장치는 수신된 음성 패킷에 포함되어 있는 파라미터를 복호화하고, 복호화 된 파라미터를 이용하여 복원된 음성 신호를 생성한다.

LSP 파라미터는 상기 음성신호를 대표하는 파라미터들중 하나이다. LSP 파라미터는 음성의 주파수 특성과 밀접하게 연관되기 때문에, 부호화 특성이 좋은 파라미터이다. 따라서 최근에 개발된 음성 부호화 및 복호화 장치들은 대부분 LSP 파라미터를 생성하고, 생성된 LSP 파라미터를 부호화하고, 이를 복호화 하는 방법을 사용하고 있다.

그러나, 수신되는 과정에서 발생되는 음성 패킷 오류를 제거하기 위하여, 대 부분의 음성 부호화 및 복호화 장치들은 수신되는 음성 패킷을 검사하고, 패킷 오류가 발생된 것으로 판단되면, 해당 패킷을 소거하는 기능을 갖고 있다. 이 패킷 소거 기능으로 인하여 LSP와 같은 파라미터가 손실되어 복원되는 음성 신호가 단절(breaking)되는 현상이 발생된다.

이러한 문제를 해결하기 위하여, 음성 복호화 시 손실된 LSP 파라미터를 복원하기 위한 기술이 제안되었다.

도 1은 ITU(International Telecommunication Union) G.729 표준에 제안된 LSP 파라미터 복원 방법이다. 도 1은 이전의 정상 프레임(Previous Good Frame, 이하 PGF라고 약함)에서의 LSP 파라미터(LSP(m))(또는 LSP 벡터)를 수정하지 않고 L개의 소거 프레임의 LSP 파라미터로 사용하는 외삽(extrapolation) 방법이다.

그러나, 이 방법은 L개의 프레임기간동안 동일한 음성 신호가 복원되므로, L개의 소거 프레임을 토대로 복원된 음성신호와 다음 정상 프레임(Next Good Frame, 이하 NGF라고 약함)을 토대로 복원된 음성신호간의 연속성이 떨어진다.

도 2는 기존의 LSP 파라미터 복원 방법의 다른 예이다. 도 2는 PGF와 L개의 프레임 소거 후 처음으로 수신되는 다음 정상 프레임(Next Good Frame, 이하 NGF라고 약함)의 LSP 파라미터를 모두 사용하는 내삽(interpolation) 방식으로 LSP 파라미터를 복원한다.

도 2에서 w는 가중치이다. 가중치 w는 소거된 프레임 개수 및 소거된 프레임의 전송 위치가 PGF에 근접한지 NGF에 근접한 지에 따라 0부터 1사이의 값 중 하나로 정의된다. 따라서, PGF와 NGF의 LSP 파라미터를 이용하여 생성된 L개의 소거 프 레임의 LSP 파라미터는 서로 다른 값(LSP(m+1),..., LSP(m+x), ..., LSP(m+L))을 갖는다.

그러나, 도 2와 같은 복원 방식은 LSP 파라미터 영역에서 처리됨으로 스펙트럼을 정의하기 어렵다. 따라서 다양한 기술 개발에 적용할 수 없고, 알고리즘 개발이 어렵다.

본 발명이 이루고자 하는 기술적 과제는 음성 복호화에서 프레임 손실 시, 스펙트럼 영역에서 선스펙트럼 쌍(Line Spectrum Pair) 파라미터를 복원하는 방법 및 장치와 그 음성 복호화 장치를 제공하는데 있다.

상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서, 소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환 단계; 상기 제 1 변환 단계에 의해 얻어진 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 및 상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서, 소거된 프레임이 존재하는 것으로 판단되 면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터와 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 스펙트럼 영역으로 변환하는 제 1 변환 단계; 상기 제 1 변환단계에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선과 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법을 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서, 소거된 프레임이 존재하는 것으로 판단되어 이전 정상 프레임의 선스펙트럼 쌍 파라미터가 입력되면, 상기 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부; 상기 제 1 변환부에서 출력되는 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 스펙트럼 복원부; 및 상기 스펙트럼 복원부에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터로 변환하는 제 2 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치를 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서, 소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부; 상기 소거된 프레임이 소거된 것으로 판단되면, 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 2 변환부; 상기 제 1 변환부에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선과 상기 제 2 변환부에서 얻어진 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 복원 유니트; 상기 복원 유니트에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 3 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치를 제공한다.

상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 장치에 있어서, 현재 프레임의 파라미터들을 디코딩하여 여기 신호를 출력하는 여기신호 디코딩부; 상기 현재 프레임의 선스펙트럼 쌍 파라미터를 디코딩하는 선스펙트럼 쌍 파라미터 디코딩부; 수신되는 부호화된 음성 패킷에 소거된 프레임이 존재하면, 상기 소거된 프레임의 소거를 은닉할 수 있도록, 상기 소거된 프레임의 이전 정상 프레임의 파라미터들 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 이용하여 상기 소거된 프레임의 선스펙트럼 쌍 파라미터와 여기 신호를 복원하는 프레임 소거 은닉 유니트; 상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하지 않으면, 현재 프레임의 파라미터들을 상기 여기 신호 디코딩부와 상기 선스펙트럼 쌍 파라미터 디코딩부로 각각 전송하고, 상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하면, 상기 이전 정상 프레임 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 상기 프레임 소거 은닉 유니트로 전송하는 파라미터 전송 부; 상기 선스펙트럼 쌍 파라미터 디코딩부로부터 전송되는 디코딩된 선스펙트럼 쌍 파라미터와 상기 프레임 소거 은닉 유니트로부터 출력되는 선스펙트럼 쌍 파라미터중 하나를 선형 예측 계수(LPC)로 변환하는 변환부; 및 상기 여기신호 디코딩부로부터 출력되는 여기신호와 상기 프레임 소거 은닉 유니트로부터 출력되는 여기신호중 한 신호가 입력되면, 상기 변환부로부터 출력되는 선형 예측 계수를 이용하여 합성된 음성신호를 출력하는 합성 필터를 포함하는 음성 복호화 장치.

이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세히 설명하기로 한다.

도 3은 본 발명의 바람직한 일 실시 예에 따른 선스펙트럼 쌍 파라미터 복원 장치를 포함하는 음성 복호화 장치의 기능 블록 도이다. 도 3을 참조하면, 상기 음성 복호화 장치는, 파라미터 전송부(310), 여기 신호(excitation signal) 디코딩부(320), 선스펙트럼 쌍(Line Spectrum Pair, 이하 LSP라고 약함) 디코딩부(330), LSP/LPC(Linear Prediction Coefficient, 이하 LPC라고 약함) 변환부(340), 합성 필터(350), 및 프레임 소거 은닉(frame erasure concealment) 유니트(360)를 포함한다.

파라미터 전송부(310)로 입력되는 부호화된 음성 패킷은 오류 검사가 수행된 패킷이다. 따라서, 상기 입력되는 부호화된 음성 패킷은 오류가 발생된 프레임이 소거된 상태이다.

파라미터 전송부(310)는 입력되는 부호화된 음성 패킷을 프레임단위로 체크하여 프레임 소거(또는 손실) 여부를 판단한 결과에 따라 음성 패킷에 포함되어 있 는 파라미터들을 전송한다. 비트열 오류로 인해 패킷이 소거된 것으로 판단되거나 일정 시간동안 패킷이 수신되지 않으면, 파라미터 전송부(310)는 수신되지 않는 구간의 프레임이 소거된 것으로 판단할 수 있다.

입력되는 부호화된 음성 패킷이 정상 프레임이면, 파라미터 전송부(310)는 수신된 음성 패킷에 포함되어 있는 파라미터들중 여기신호를 디코딩하기 위해 필요한 파라미터들을 여기 신호 디코딩부(320)로 전송하고, 10개의 근(roots)을 갖는 LSP 파라미터(또는 LSP 계수)를 LSP 디코딩부(330)로 전송한다.

상기 음성 복호화 장치가 CELP(Code-Excited Linear Predicton) 형이면, 상기 여기 신호를 디코딩하기 위해 필요한 파라미터들은 적응 코드북(adative codebook)에서 이용되는 피치(pitch), 고정 코드북(fixed codebook)에서 이용되는 코드북 인덱스, 적응 코드북의 이득값(g_p), 고정 코드북의 이득값(g_c)을 포함할 수 있다.

여기 신호 디코딩부(320)는 입력되는 파라미터들을 디코딩하여 여기 신호를 출력한다. 출력되는 여기신호는 합성 필터(350)로 전송된다. LSP 디코딩부(330)는 입력되는 LSP 파라미터를 디코딩한다. 디코딩된 LSP 파라미터는 LSP/LPC변환부(340)로 전송된다. LSP/LPC 변환부(340)는 디코딩된 LSP 파라미터를 LPC 파라미터로 변환한다. 변환된 LPC 파라미터는 합성 필터(350)로 전송된다.

합성 필터(350)는 LPC 파라미터를 이용하여 여기 신호를 합성 필터링하고, 합성된 음성신호(synthesis speech)를 출력한다. 상기 합성된 음성신호는 복원된 음성신호이다.

그러나, 프레임이 소거된 것으로 판단되면, 소거된 프레임(또는 손실된 프레임)의 LSP 파라미터를 복원하기 위하여 파라미터 전송부(310)는 이전 정상 프레임(Previous Good Frame, 이하 PGF라고 약함)의 LSP 파라미터 또는 PGF의 LSP 파라미터와 다음 정상 프레임(Next Good Frame, 이하 NGF라고 약함)의 LSP 파라미터, 및 여기 신호를 복원할 수 있는 파라미터들을 프레임 소거 은닉 유니트(360)로 전송한다.

프레임 소거 은닉 유니트(360)는 여기 신호를 복원하면서 외삽 방식과 내삽 방식중 어느 한 방식에 의해 소거된 프레임의 LSP 파라미터를 복원할 수 있다.

외삽방식에 의해 소거된 프레임의 LSP 파라미터를 복원할 경우에, 프레임 소거 은닉 유니트(360)는 도 4에 도시된 바와 같이 구성될 수 있다. 도 4를 참조하면, 프레임 소거 은닉 유니트(360)는 여기 신호 복원부(401), LSP/스펙트럼 변환부(402), 스펙트럼 복원부(403), 및 스펙트럼/LSP 변환부(404)를 포함한다.

여기신호 복원부(401)는 파라미터 전송부(310)로부터 전송되는 PGF의 여기신호 생성을 위한 파라미터들을 수신하고, 수신된 파라미터들을 이용하여 소거된 프레임의 여기 신호를 복원한다. 여기신호 복원부(401)는 예를 들어, ITU G.729 표준에 의거하여 여기 신호를 복원할 수 있다. 복원된 여기 신호는 합성 필터(350)로 전송된다.

LSP/스펙트럼 변환부(402)는 파라미터 전송부(310)로부터 PGF의 10개의 근을 갖는 LSP 파라미터가 수신되면, 수신된 LSP 파라미터를 스펙트럼 영역으로 변환하 여 PGF의 스펙트럼 포락선(spectrum envelope)을 얻는다. PGF의 스펙트럼 포락선은 스펙트럼 복원부(403)로 전송된다.

스펙트럼 복원부(403)는 상기 PGF들의 스펙트럼 포락선을 사전에 설정된 방식에 의해 변형하여 소거된 프레임의 스펙트럼 포락선을 복원한다. 상기 소거된 프레임은 현재 프레임으로 정의될 수 있다. 상기 사전에 설정된 방식은, 예를 들어, 사전에 설정된 영역으로 스펙트럼 포락선을 스펙트럴 시프팅(spectral shifting)하도록 정의될 수 있다. 상기 사전에 설정된 영역은 저주파 또는 고주파 영역으로 점차적으로 시프트할 수 있는 영역이다.

스펙트럼 복원부(403)는 상기 PGF의 스펙트럼 포락선을 부드럽게 변화시키는(spectrum smoothing) 방식으로 소거된 프레임의 스펙트럼 포락선을 복원할 수 있다.

또는 스펙트럼 복원부(403)는 소거된 프레임과 PGF간의 상관관계를 토대로 결정된 가중치를 이용하여 상기 PGF의 스펙트럼 포락선을 변형시키고, 변형된 스펙트럼 포락선을 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 출력할 수 있다.

상기 소거된 프레임의 스펙트럼 포락선이 입력되면, 스펙트럼/LSP 변환부(404)는 상기 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터로 변환한다. 스펙트럼/LSP 변환부(404)로부터 출력되는 LSP 파라미터는 LSP/LPC변환부(340)로 전송한다.

LSP/스펙트럼 변환부(402)는 입력되는 PGF의 LSP 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 켑스트럼(Cepstrum)으로 변환하고, 변환된 켑스트럼을 스펙트럼 영역으로 변환하도록 구성될 수 있다. 만약 LSP/스펙트럼 변환부(402)가 이와 같이 구성되면, 스펙트럼/LSP 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 켑스트럼으로 변환하고, 켑스트럼을 LPC 파라미터로 변환하고, LPC 파라미터를 LSP 파라미터로 변환하도록 구성된다.

또한, LSP/스펙트럼 변환부(402)는 입력된 PGF의 LSP 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 스펙트럼 영역으로 변환하도록 구성될 수 있다. 이에 대해 스펙트럼/LSP 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 ACC(Auto-Correlation Coefficients, 이하 ACC라고 약함) 파라미터로 변환하고, ACC 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 LSP 파라미터로 변환하도록 구성된다.

LSP/스펙트럼 변환부(402)는 입력된 PGF의 LSP 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 켑스트럼으로 변환하고, 켑스트럼을 스펙트럼 영역으로 변환하도록 구성할 수 있다. 이에 대해 스펙트럼/LPC 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 ACC 파라미터로 변환하고, ACC 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 LSP 파라미터로 변환하도록 구성된다.

LSP/스펙트럼 변환부(402)는 입력되는 PGF의 LSP 파라미터를 의사 켑스트럼(Pseudo_cepstrum, PCEP)으로 변환하고, 이를 스펙트럼 영역으로 변환하도록 구성할 수 있다. 이에 대해 스펙트럼/LSP 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 PCEP로 변환하고, PCEP를 LSP 파라미터로 변환하도록 구성된다.

도 4에서 본원 발명에 따른 소거된 프레임의 LSP 파라미터 복원 장치는 LSP/ 스펙트럼 변환부(402), 스펙트럼 복원부(403), 및 스펙트럼/LSP 변환부(404)를 포함하는 것으로 정의할 수 있다.

한편, 여기 신호를 복원하면서 내삽방식으로 손실된 프레임의 LSP 파라미터를 복원할 경우에, 프레임 소거 은닉 유니트(360)는 도 5에 도시된 바와 같이 구성될 수 있다.

도 5를 참조하면, 프레임 소거 은닉 유니트(360)는 여기신호 복원부(501), 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503), 복원 유니트(504), 및 스펙트럼/LSP 변환부(505)를 포함한다.

도 5에서 본원 발명에 따른 소거된 프레임의 LSP 파라미터 복원 장치는 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503), 복원 유니트(504), 및 스펙트럼/LSP 변환부(505)를 포함할 수 있다.

여기신호 복원부(501)는 파라미터 전송부(310)로부터 전송되는 PGF와 NGF의 여기신호 생성을 위한 파라미터들을 각각 수신하고, 수신된 파라미터들을 이용하여 소거된 프레임의 여기 신호를 복원한다. 여기신호 복원부(501)는 예를 들어, ITU G.729 표준에 의거하여 여기 신호를 복원할 수 있다. 복원된 여기 신호는 합성 필터(350)로 전송된다.

제 1 LSP/스펙트럼 변환부(502)는 파라미터 전송부(310)로부터 PGF의 10개의 근을 갖는 LSP 파라미터가 수신되면, 수신된 PGF의 LSP 파라미터를 스펙트럼 영역으로 변환하여 PGF의 스펙트럼 포락선(spectrum envelope)을 얻는다. 이 때, 제 1 LSP/스펙트럼 변환부(502)는 도 4의 LSP/스펙트럼 변환부(402)에서 설명한 바와 같 은 4가지 변환 방식중 하나의 방식으로 LSP 파라미터를 스펙트럼 영역으로 변환시킬 수 있다. 얻어진 PGF의 스펙트럼 포락선은 복원 유니트(504)로 전송된다.

제 2 LSP/스펙트럼 변환부(503)는 파라미터 전송부(310)로부터 NGF의 10개의 근을 갖는 LSP 파라미터가 수신되면, 수신된 NGF의 LSP 파라미터를 스펙트럼 영역으로 변환하여 NGF의 스펙트럼 포락선(spectrum envelope)을 얻는다. 이 때, 제 2 LSP/스펙트럼 변환부(503)는 도 4의 LSP/스펙트럼 변환부(402)에서 설명한 바와 같은 4가지 변환 방식중 하나의 방식으로 LSP 파라미터를 스펙트럼 영역으로 변환시킬 수 있다. 그러나 제 1 LSP/스펙트럼 변환부(502)와 제 2 LSP/스펙트럼 변환부(503)의 변환 방식은 동일하게 정의된다. 제 2 LSP/스펙트럼 변환부(503)에 의해 얻어진 NGF의 스펙트럼 포락선은 복원 유니트(504)로 전송된다.

복원 유니트(504)는 제 1 스펙트럼 포락선 변형부(506), 제 2 스펙트럼 포락선 변형부(507), 및 혼합부(508)를 포함한다.

제 1 스펙트럼 포락선 변형부(506)는 PGF와 소거된 프레임간의 상관 관계와 소거된 프레임과 NGF 간의 상관관계 및 소거된 프레임의 수를 토대로 결정된 가중치를 이용하여 PGF의 스펙트럼 포락선을 변형시킨다.

상기 상관관계는 상기 소거된 프레임의 전송 위치가 PGF에 근접한지 NGT에 근접한지를 토대로 한 것이고, 상기 가중치는 0부터 1사이의 값을 갖는다. 소거된 프레임이 PGF에 근접하면, 제 1 스펙트럼 포락선 변형부(506)로 입력되는 가중치가 제 2 스펙트럼 포락선 변형부(507)로 입력되는 가중치보다 큰 값을 갖는다. 제 1 스펙트럼 포락선 변형부(506)로 입력되는 가중치가 w이면, 제 2 스펙트럼 포락선 변형부(507)로 입력되는 가중치는 1-w로 정의된다.

제 2 스펙트럼 포락선 변형부(507)는 상기 가중치를 이용하여 NGF의 스펙트럼을 변형시킨다.

혼합부(508)는 제 1 스펙트럼 변형부(506)로부터 출력되는 변형된 PGF의 스펙트럼 포락선과 제 2 스펙트럼 변형부(507)로부터 출력되는 변형된 NGF의 스펙트럼 포락선을 혼합한다. 상기 혼합은 두 스펙트럼 포락선의 가중된 합을 얻는 방식으로 수행될 수 있다. 혼합부(508)에서 출력되는 스펙트럼 포락선은 해당되는 소거된 프레임의 복원된 스펙트럼 포락선이다.

상기 소거된 프레임의 스펙트럼 포락선이 입력되면, 스펙트럼/LSP 변환부(505)는 상기 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터로 변환한다. 스펙트럼/LSP 변환부(505)로부터 출력되는 LSP 파라미터는 LSP/LPC 변환부(340)로 전송한다. 스펙트럼/LSP 변환부(505)는 도 4의 스펙트럼/LSP 변환부(404)와 같이 제 1 LSP/스펙트럼 변환부(502) 및 제 2 LSP/스펙트럼 변환부(503)의 변환 구성에 대응되는 역 변환 구성을 갖는다.

도 6은 도 5에 도시된 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503), 복원 유니트(504), 및 스펙트럼/LSP 변환부(505)를 포함하는 본 발명에 따른 LSP 파라미터 복원 장치의 동작 개념 도이다.

도 6을 참조하면, PGF와 NGF간에 L개의 소거된 프레임이 존재할 때, PGF의 LSP 파라미터를 스펙트럼 영역으로 변환시키고(601), NGF의 LSP 파라미터를 스펙트럼 영역으로 변환시키고(602), PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 각각 변형시켜 혼합함으로써, 소거된 프레임의 스펙트럼 포락선을 복원하고(603), 복원된 스펙트럼 포락선을 LSP 파라미터로 변환하여 이를 소거된 프레임의 LSP 파라미터로 제공한다. 이 때, PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선은 소거된 프레임이 PGF에 근접한지 NGF에 근접한지에 대한 상관관계와 소거된 프레임의 수를 토대로 결정된 각각의 가중치로 상기 PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 변형시킨다.

도 7은 여기 신호를 복원하면서 내삽방식으로 손실된 프레임의 LSP 파라미터를 복원할 경우에, 프레임 소거 은닉 유니트(360)는 다른 실시 예이다. 도 7의 여기신호 복원부(701), 제 1 LSP/스펙트럼 변환부(702), 제 2 LSP/스펙트럼 변환부(703), 및 스펙트럼/LPS 변환부(705)는 도 5의 여기신호 복원부(501), 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503) 및 스펙트럼/LSP 변환부(505)와 동일하게 구성되므로 이에 대한 설명은 생략한다.

복원 유니트(704)는 동적 프로그램(Dynamic Programming) 기법을 사용하여 제 1 LSP/스펙트럼 변환부(702)로부터 출력되는 PGF의 스펙트럼 포락선의 밴드와 제 2 LSP/스펙트럼 변환부(703)로부터 출력되는 NGF의 스펙트럼 포락선의 밴드를 비선형적으로 정합하여 소거된 프레임의 스펙트럼 포락선을 복원한다.

즉, 복원 유니트(704)는 DFW(Dynamic Frequency Warping)기법을 이용하여 PGF와 NGF의 스펙트럼 밴드를 도 8에 도시된 바와 같이 비선형적으로 정합하여 워핑경로(warping path)를 얻고, 이 워핑 경로를 기반으로 소거된 프레임의 스펙트럼을 복원한다. 도 8에서 알 수 있는 바와 같이 상기 워핑 경로를 얻을 때, 워핑 범 위가 설정되어 운영된다.

도 9는 본 발명의 바람직한 또 다른 실시 예에 따른 LSP 파라미터 복원 방법의 동작 흐름도이다.

음성 복호화 시, 수신된 음성 패킷에 소거된 프레임이 존재하는 것으로 판단되면, PGF의 LSP 파라미터를 스펙트럼 영역으로 변환하여 PGF의 스펙트럼 포락선을 얻는다(901, 902).

PGF의 스펙트럼 포락선을 도 4의 스펙트럼 복원부(403)에서 설명한 바와 같은 방식들중 하나의 방식으로 변형시켜 소거된 프레임의 스펙트럼 포락선을 복원시킨다(903).

복원된 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터 영역으로 변환시키고, 이에 따라 얻어진 LSP 파라미터를 소거된 프레임의 복원된 LSP 파라미터로 제공한다(904, 905).

상기 제 902 단계는 도 4의 LSP/스펙트럼 변환부(402)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있고, 제 904 단계는 도 4의 스펙트럼/LSP 변환부(404)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있다. 그러나, 제 902 단계에서 수행되는 방식에 의해 제 904 단계에서 수행되는 방식은 결정된다.

한편, 수신된 음성 패킷에 소거된 프레임이 존재하지 않으면, 현재 프레임의 LSP 파라미터를 디코딩하고, 디코딩된 LSP 파라미터를 현재 프레임의 LSP 파라미터로 제공한다(901, 906, 907).

도 10은 본 발명의 바람직한 또 다른 실시 예에 따른 LSP 파라미터 복원 방법의 동작 흐름도이다.

음성 복호화 시, 수신된 음성 패킷에 소거된 프레임이 존재하는 것으로 판단되면, PGF의 LSP 파라미터와 NGF의 LSP 파라미터를 각각 스펙트럼 영역으로 변환하여 PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 각각 얻는다(1001, 1002).

PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 이용하여 소거된 프레임의 스펙트럼 포락선을 복원시킨다(1003). 즉, 도 5의 복원 유니트(504) 또는 도 7의 복원 유니트(704)에서 정의된 방식중 하나의 방식으로 소거된 프레임의 스펙트럼 포락선을 복원시킬 수 있다.

복원된 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터 영역으로 변환시키고, 이에 따라 얻어진 LSP 파라미터를 소거된 프레임의 복원된 LSP 파라미터로 제공한다(1004, 1005).

상기 제 1002 단계는 도 4의 LSP/스펙트럼 변환부(402)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있고, 제 1004 단계는 도 4의 스펙트럼/LSP 변환부(404)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있다. 그러나, 제 1002 단계에서 수행되는 방식에 의해 제 1004 단계에서 수행되는 방식은 결정된다.

한편, 수신된 음성 패킷에 소거된 프레임이 존재하지 않으면, 현재 프레임의 LSP 파라미터를 디코딩하고, 디코딩된 LSP 파라미터를 현재 프레임의 LSP 파라미터로 제공한다(1001, 1006, 1007).

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

상술한 바에 의해 본 발명은 음성 복호화 시, 복원된 음성신호의 질을 향상시키면서 다양한 기술에 적용이 가능하고, 알고리즘 개발이 용이한 선스펙트럼 쌍 파라미터 복원 기술을 제공할 수 있다.

Claims

음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서,

소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환 단계;

상기 제 1 변환 단계에 의해 얻어진 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 및

상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영 역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 1 항에 있어서, 상기 복원 단계는, 상기 제 1 변환 단계에서 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 사전에 설정된 영역으로 스펙트럴 시프팅하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 방법.
제 1 항에 있어서, 상기 복원 단계는 상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계를 토대로 결정된 가중치를 이용하여 상기 제 1 변환 단계에서 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 변형시키고, 상기 변형된 스펙트럼 포락선을 상기 소거된 프레임의 복원된 스펙트럼 포락선으로서 얻는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 방법.
제 1 항 내지 제 3 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 켑스트럼으로 변환하는 단계;

상기 켑스트럼을 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 켑스트럼으로 변환하는 단계;

상기 켑스트럼을 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 1 항 내지 제 3 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;

상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 1 항 내지 제 3 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 켑스트럼으로 변환하는 단계;

상기 켑스트럼을 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임이 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;

상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 1 항 내지 제 3 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 의사 켑스트럼으로 변환하는 단계;

상기 의사 켑스트럼을 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 의사 켑스트럼으로 변환하는 단계;

상기 의사 켑스트럼을 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서,

소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터와 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 스펙트럼 영역으로 변환하는 제 1 변환 단계;

상기 제 1 변환단계에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선과 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계;

상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 8 항에 있어서, 상기 스펙트럼 포락선 복원 단계는,

상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계 및 상기 소거된 프레임과 다음 정상 프레임간의 상관관계를 토대로 결정된 제 1 가중치를 이용하여 상기 이전 정상 프레임의 스펙트럼 포락선을 변형하는 단계;

상기 상관관계를 토대로 결정된 제 2 가중치를 이용하여 상기 다음 정상 프레임의 스펙트럼 포락선을 변형하는 단계;

상기 변형된 이전 정상 프레임의 스펙트럼 포락선과 상기 변형된 다음 정상 프레임의 스펙트럼 포락선을 혼합하고, 혼합된 결과를 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 생성하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 8 항에 있어서, 상기 스펙트럼 포락선 복원 단계는,

동적 프로그램 기법을 사용하여 상기 이전 정상 프레임의 스펙트럼 밴드와 상기 다음 정상 프레임의 스펙트럼 밴드를 비선형적으로 정합하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 방법.
제 8 항 내지 제 10 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 선형 예측 계수로 변환하는 단계;

상기 이전 정상 프레임과 다음 정상 프레임의 선형 예측 계수를 각각 켑스트럼으로 변환하는 단계;

상기 이전 영상 프레임과 다음 정상 프레임의 선형 예측 계수의 켑스트럼을 각각 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 켑스트럼으로 변환하는 단계;

상기 켑스트럼을 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 8 항 내지 제 10 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 선형 예측 계수로 변환하는 단계;

상기 이전 정상 프레임과 다음 정상 프레임의 선형 예측 계수를 각각 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;

상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 8 항 내지 제 10 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 선형 예측 계수로 변환하는 단계;

상기 이전 정상 프레임과 다음 정상 프레임의 선형 예측 계수를 각각 켑스트럼으로 변환하는 단계;

상기 이전 정상 프레임과 다음 정상 프레임의 켑스트럼을 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;

상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;

상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
제 8 항 내지 제 10 항중 어느 한 항에 있어서,

상기 제 1 변환 단계는,

상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 의사 켑스트럼으로 변환하는 단계;

상기 이전 정상 프레임과 다음 정상 프레임의 의사 켑스트럼을 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,

상기 제 2 변환 단계는,

상기 소거된 프레임의 스펙트럼 포락선을 의사 켑스트럼으로 변환하는 단계;

상기 의사 켑스트럼을 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서,

소거된 프레임이 존재하는 것으로 판단되어 이전 정상 프레임의 선스펙트럼 쌍 파라미터가 입력되면, 상기 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부;

상기 제 1 변환부에서 출력되는 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 스펙트럼 복원부; 및

상기 스펙트럼 복원부에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터로 변환하는 제 2 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치.
제 15 항에 있어서, 상기 스펙트럼 복원부는,

상기 제 1 변환부에 의해 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 사전에 설정된 영역으로 스펙트럴 시프팅하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 장치.
제 15 항에 있어서, 상기 스펙트럼 복원부는,

상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계를 토대로 결정된 가중치를 이용하여 상기 제 1 변환부에 의해 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 변형시키고, 상기 변형된 스펙트럼 포락선을 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 출력하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 장치.
음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서,

소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부;

상기 소거된 프레임이 소거된 것으로 판단되면, 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 2 변환부;

상기 제 1 변환부에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선과 상기 제 2 변환부에서 얻어진 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 복원 유니트;

상기 복원 유니트에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 3 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치.
제 18 항에 있어서, 상기 복원 유니트는,

상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계 및 상기 소거된 프레임과 상기 다음 정상 프레임간의 상관관계를 토대로 결정된 제 1 가중치를 이 용하여 상기 이전 정상 프레임의 스펙트럼 포락선을 변형하는 제 1 변형부;

상기 상관관계를 토대로 결정된 제 2 가중치를 이용하여 상기 다음 정상 프레임의 스펙트럼 포락선을 변형하는 제 2 변형부; 및

상기 변형된 이전 정상 프레임의 스펙트럼 포락선과 상기 변형된 다음 정상 프레임의 스펙트럼 포락선을 혼합하고, 상기 혼합 결과를 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 생성하는 혼합부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치.
제 18 항에 있어서, 상기 복원 유니트는,

동적 프로그램 기법을 사용하여 상기 이전 정상 프레임의 스펙트럼 밴드와 상기 다음 정상 프레임의 스펙트럼 밴드를 비선형적으로 정합하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 장치.
음성 복호화 장치에 있어서,

현재 프레임의 파라미터들을 디코딩하여 여기 신호를 출력하는 여기신호 디코딩부;

상기 현재 프레임의 선스펙트럼 쌍 파라미터를 디코딩하는 선스펙트럼 쌍 파라미터 디코딩부;

수신되는 부호화된 음성 패킷에 소거된 프레임이 존재하면, 상기 소거된 프 레임의 소거를 은닉할 수 있도록, 상기 소거된 프레임의 이전 정상 프레임의 파라미터들 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 이용하여 상기 소거된 프레임의 선스펙트럼 쌍 파라미터와 여기 신호를 복원하는 프레임 소거 은닉 유니트;

상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하지 않으면, 현재 프레임의 파라미터들을 상기 여기 신호 디코딩부와 상기 선스펙트럼 쌍 파라미터 디코딩부로 각각 전송하고, 상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하면, 상기 이전 정상 프레임 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 상기 프레임 소거 은닉 유니트로 전송하는 파라미터 전송부;

상기 선스펙트럼 쌍 파라미터 디코딩부로부터 전송되는 디코딩된 선스펙트럼 쌍 파라미터와 상기 프레임 소거 은닉 유니트로부터 출력되는 선스펙트럼 쌍 파라미터중 하나를 선형 예측 계수(LPC)로 변환하는 변환부; 및

상기 여기신호 디코딩부로부터 출력되는 여기신호와 상기 프레임 소거 은닉 유니트로부터 출력되는 여기신호중 한 신호가 입력되면, 상기 변환부로부터 출력되는 선형 예측 계수를 이용하여 합성된 음성신호를 출력하는 합성 필터를 포함하는 음성 복호화 장치.