KR20010033539A

KR20010033539A - 음성 부호화 방법 및 음성 복호화 방법 및, 음성 부호화장치 및 음성 복호화 장치

Info

Publication number: KR20010033539A
Application number: KR1020007007047A
Authority: KR
Inventors: 야마우라타다시
Original assignee: 다니구찌 이찌로오, 기타오카 다카시; 미쓰비시덴키 가부시키가이샤
Priority date: 1997-12-24
Filing date: 1998-12-07
Publication date: 2001-04-25
Also published as: EP1596368A2; CN1790485A; EP1596367A2; JP4916521B2; US8352255B2; CN1143268C; EP2154679B1; JP2009134303A; AU1352699A; DE69825180T2; DE69837822T2; US20050171770A1; US20110172995A1; US20090094025A1; US20080071524A1; CA2722196A1; NO20035109L; NO20003321D0; EP2154681A2; US20120150535A1

Abstract

본 발명은 음성 신호를 디지털 신호로 압축 부호화하는 음성 부호화 및 복호화에 있어서, 적은 정보량으로 품질이 높은 음성을 재생하는 방법 및 장치에 관한 것으로,

부호 구동 선형 예측(CELP) 음성 부호화에 있어서, 스펙트럼 정보, 파워 정보 및 피치 정보 중 1개 이상의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에 있어서의 음성의 잡음성 정도를 평가하고, 평가 결과에 따라서 다른 구동 부호장(19, 20)을 사용하도록 하였다.

Description

음성 부호화 방법 및 음성 복호화 방법 및, 음성 부호화 장치 및 음성 복호화 장치{Sound encoding method and sound decoding method, and sound encoding device and sound decoding device}

종래, 고능률 음성 부호화 방법로서는 부호 구동 선형 예측(Code-Excited Linear Prediction: CELP) 부호화가 대표적이고, 그 기술에 대해서는 「Code- excited linear prediction(CELP): High-quality speech at very low bit rates」(M.R.Shroeder and B.S.Atal저, ICASSP '85, pp.937-940, 1985)에 기술되어 있다.

도 6은 CELP 음성 부호화 및 복호화 방법의 전체 구성의 일례를 도시한 것이고, 도면 중 참조번호 101은 부호화부, 102는 복호화부, 103은 다중화 수단, 104는 분리 수단이다. 부호화부(101)는 선형 예측 파라미터 분석 수단(105), 선형 예측 파라미터 부호화 수단(106), 합성 필터(107), 적응 부호장(108), 구동 부호장(109), 게인 부호화 수단(110), 거리 계산 수단(111), 가중 가산 수단(138)으로 구성되어 있다. 또한, 복호화부(102)는 선형 예측 파라미터 복호화 수단(112), 합성 필터(113), 적응 부호장(114), 구동 부호장(115), 게인 복호화 수단(116), 가중 가산 수단(139)으로 구성되어 있다.

CELP 음성 부호화에서는 5 내지 50 ms 정도를 1프레임으로 하여, 그 프레임의 음성을 스펙트럼 정보와 음원 정보로 나누어 부호화한다. 우선, CELP 음성 부호화 방법의 동작에 대해서 설명한다. 부호화부(101)에 있어서, 선형 예측 파라미터 분석 수단(105)은 입력 음성(S101)을 분석하고, 음성의 스펙트럼 정보인 선형 예측 파라미터를 추출한다. 선형 예측 파라미터 부호화 수단(106)은 그 선형 예측 파라미터를 부호화하고, 부호화한 선형 예측 파라미터를 합성 필터(107)의 계수로서 설정한다.

다음에 음원 정보의 부호화에 대해 설명한다. 적응 부호장(108)에는 과거의 구동 음원 신호가 기억되어 있고, 거리 계산 수단(111)으로부터 입력되는 적응 부호에 대응하여 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 구동 부호장(109)에는 예를 들면, 학습용 음성과 그 부호화 음성과의 왜곡이 작게 되도록 학습하여 구성된 복수의 시계열 벡터가 기억되어 있고, 거리 계산 수단(111)으로부터 입력되는 구동 부호에 대응한 시계열 벡터를 출력한다. 적응 부호장(108), 구동 부호장(109)으로부터의 각 시계열 벡터는 게인 부호화 수단(110;gain coding means)으로부터 주어지는 각각의 게인에 따라서 가중 가산 수단(138)에서 가중 가산되고, 그 가산 결과를 구동 음원 신호로서 합성 필터(107)로 공급하여 부호화 음성을 얻는다. 거리 계산 수단(111)은 부호화 음성과 입력 신호(S101)와의 거리를 구하고, 거리가 최소가 되는 적응 부호, 구동 부호, 게인을 탐색한다. 상기 부호화가 종료한 후, 선형 예측 파라미터의 부호, 입력 음성과 부호화 음성과의 왜곡을 최소로 하는 적응 부호, 구동 부호, 게인의 부호를 부호화 결과로서 출력한다.

다음에 CPEL 음성 복호화 방법의 동작에 대해서 설명한다.

한편, 복호화부(102)에 있어서, 선형 예측 파라미터 복호화 수단(112)은 선형 예측 파라미터의 부호로부터 선형 예측 파라미터를 복호화하고, 합성 필터(113)의 계수로서 설정한다. 다음에, 적응 부호장(114)은 적응 부호에 대응하여, 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력하며, 또한 구동 부호장(115)은 구동 부호에 대응한 시계열 벡터를 출력한다. 이들 시계열 벡터는 게인 복호화 수단(116)에서 게인의 부호로부터 복호화한 각각의 게인에 따라서 가중 가산 수단(139)에서 가중 가산되고, 그 가산 결과가 구동 음원 신호로서 합성 필터(113)로 공급되어 출력 음성(S103)이 얻어진다.

또한 CELP 음성 부호화 및 복호화 방법에서 재생 음성 품질의 향상을 목적으로 개량된 종래의 음성 부호화 및 복호화 방법으로서, 「Phonetically-based vector excitation coding of speech at 3.6kbps」(S.Wang and A. Gersho저, ICASSP'89, pp.49-52, 1989)에 예시된 것이 있다. 도 6과의 대응 수단에 동일 부호를 붙인 도 7은 종래의 음성 부호화 및 복호화 방법의 전체 구성의 일례를 도시하고, 도면 중 부호화부(101)에 있어서, 참조번호 117은 음성 상태 판정 수단, 118은 구동 부호장 전환 수단, 119는 제 1 구동 부호장, 120은 제 2 구동 부호장이다. 또한 도면 중 복호화 수단(102)에 있어서 참조번호 121은 구동 부호장 전환 수단, 122는 제 1 구동 부호장, 123은 제 2 구동 부호장이다. 이러한 구성에 의한 부호화 및 복호화 방법의 동작을 설명한다. 우선 부호화 수단(101)에 있어서, 음성 상태 판정 수단(117)은 입력 음성(S101)을 분석하고, 음성의 상태를 예를 들면 유성/무성의 2개의 상태 중 어느 쪽인가를 판정한다. 구동 부호장 전환 수단(118)은 그 음성 상태 판정 결과에 따라서, 예를 들면 유성이면 제 1 구동 부호장(119)을, 무성이면 제 2 구동 부호장(120)을 사용하는 것으로 부호화에 사용하는 구동 부호장을 전환하고, 또한, 어느쪽의 구동 부호장을 사용하였는가를 부호화한다.

다음에 복호화 수단(102)에 있어서, 구동 부호장 전환 수단(121)은 부호화 수단(101)에서 어느쪽의 구동 부호장을 사용하였는가의 부호에 따라서, 부호화 수단(101)에서 사용한 것과 동일한 구동 부호장을 사용하는 것으로서 제 1 구동 부호장(122)과 제 2 구동 부호장(123)을 전환한다. 이와 같이 구성함으로써, 음성의 각 상태마다 부호화에 알맞은 구동 부호장을 준비하고, 입력된 음성의 상태에 따라서 구동 부호장을 전환하여 사용함으로써 재생 음성의 품질을 향상할 수 있다.

또한 송출 비트수를 증가하지 않고, 복수의 구동 부호장을 전환하는 종래의 음성 부호화 및 복호화 방법으로서 특개평8-185198호 공보에 개시된 것이 있다. 이것은 적응 부호장에서 선택한 피치 주기에 따라서, 복수개의 구동 부호장을 전환하여 사용하는 것이다. 이로 인해, 전송 정보를 늘리지 않고 입력 음성 특징에 적응한 구동 부호장을 사용할 수 있다.

상술한 바와 같이 도 6에 도시하는 종래의 음성 부호화 및 복호화 방법에서는 단일의 구동 부호장을 사용하여 합성 음성을 생성하고 있다. 저 비트율로도 품질이 높은 부호화 음성을 얻기 위해서는 구동 부호장에 격납하는 시계열 벡터는 펄스를 많이 포함하는 비잡음적인 것이 된다. 이로 인해, 배경 잡음이나 마찰성 잡음 등 잡음적인 음성을 부호화, 합성한 경우, 부호화 음성은 지리지리, 치리치리와 같은 부자연한 소리를 발하게 되는 문제가 있었다. 구동 부호장을 잡음적인 시계열 벡터로만 구성하면 이러한 문제는 해결하지만, 부호화 음성 전체로서의 품질이 열화한다.

또한 개량된 도 7에 도시하는 종래의 음성 부호화 및 복호화 방법에서는 입력 음성의 상태에 따라서 복수의 구동 부호장을 전환하여 부호화 음성을 생성하고 있다. 이로 인해 예를 들면 입력 음성이 잡음적인 무성 부분에서는 잡음적인 시계열 벡터로 구성된 구동 부호장을, 또한 그 이외의 유성 부분에서는 비잡음적인 시계열 벡터로 구성된 구동 부호장을 사용할 수 있고, 잡음적인 음성을 부호화, 합성하여도 부자연한 지리지리한 소리를 발하지 않게 된다. 그러나, 복호화측에서도 부호화측과 동일한 구동 부호장을 사용하기 위해서, 새로이 어느 구동 부호장을 사용하었는가의 정보를 부호화, 전송할 필요가 생기고, 이것이 저 비트율화가 방해되는 문제가 있었다.

또한 송출 비트수를 증가하지 않고, 복수의 구동 부호장을 전환하는 종래의 음성 부호화 및 복호화 방법에서는 적응 부호장에서 선택되는 피치 주기에 따라서 구동 부호장을 전환하고 있다. 그러나, 적응 부호장에서 선택되는 피치 주기는 실제의 음성 피치 주기와는 달리, 그 값에서만 입력 음성의 상태가 잡음적인가 비잡음적인가를 판정할 수 없으므로, 음성의 잡음적인 부분의 부호화 음성이 부자연하다고 하는 과제는 해결되지 않는다.

본 발명은 이러한 과제를 해결하기 위해서 이루어진 것으로, 저 비트율로도 품질이 높은 음성을 재생하는 음성 부호화 및 복호화 방법 및, 장치를 제공하는 것이다.

본 발명은 음성 신호를 디지털 신호로 압축 부호화 및 복호화할 때에 사용하는 음성 부호화 및 복호화 방법 및, 음성 부호화 및 복호화 장치에 관한 것으로, 특히 저 비트율로 품질이 높은 음성을 재생하기 위한 음성 부호화 방법 및 음성 복호화 방법 및, 음성 부호화 장치 및 음성 복호화 장치에 관한 것이다.

도 1은 본 발명에 의한 음성 부호화 및 음성 복호화 장치의 실시예 1의 전체구성을 도시하는 블록도.

도 2는 도 1의 실시예 1에 있어서의 잡음 정도의 평가에 대한 설명을 제공하는 표.

도 3은 본 발명에 의한 음성 부호화 및 음성 복호화 장치의 실시예 3의 전체구성을 도시하는 블록도.

도 4는 본 발명에 의한 음성 부호화 및 음성 복호화 장치의 실시예 5의 전체구성을 도시하는 블록도.

도 5는 도 4의 실시예 5에 있어서의 가중 결정 처리의 설명을 제공하는 노선도.

도 6은 종래의 CELP 음성 부호화 및 복호화 장치의 전체 구성을 도시하는 블록도.

도 7은 종래의 개량된 CELP 음성 부호화 및 복호화 장치의 전체 구성을 도시하는 블록도.

상술한 과제를 해결하기 위해서 본 발명의 음성 부호화 방법은 스펙트럼 정보, 파워 정보, 피치 정보 중 적어도 1개의 부호 또는 부호화 결과를 사용하여 상기 부호화 구간에서의 음성의 잡음성의 정도를 평가하고, 평가 결과에 따라서 복수의 구동 부호장 중 1개를 선택하도록 하였다.

또한, 다음 발명의 음성 부호화 방법은 격납하고 있는 시계열 벡터의 잡음성정도가 다른 복수의 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 복수의 구동 부호장을 전환하도록 하였다.

또한, 다음 발명의 음성 부호화 방법은 음성의 잡음성 정도의 평가 결과에 따라서, 구동 부호장에 격납하고 있는 시계열 벡터의 잡음성 정도를 변화시키도록 하였다.

또한, 다음 발명의 음성 부호화 방법은 잡음적인 시계열 벡터를 격납하여 하고 있는 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 구동음원의 신호 샘플을 샘플링함으로써 잡음성 정도가 낮은, 시계열 벡터를 생성하도록 하였다.

또한, 다음 발명의 음성 부호화 방법은 잡음적일 시계열 벡터를 격납하고 있는 제 1 구동 부호장과, 비잡음적인 시계열 벡터를 격납하고 있는 제 2 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 제 1 구동 부호장의 시계열 벡터와 제 2 구동 부호장의 시계열 벡터를 가중 가산한 시계열 벡터를 생성하도록 하였다.

또한 다음 발명의 음성 복호화 방법은 스펙트럼 정보, 파워 정보, 피치 정보중 적어도 1개의 부호 또는 복호화 결과를 사용하여 해당 복호화 구간에 있어서의 음성의 잡음성 정도를 평가하고, 평가 결과에 따라서 복수의 구동 부호장 중의 1개를 선택하도록 한다.

또한, 다음 발명의 음성 복호화 방법은 격납하고 있는 시계열 벡터의 잡음성 정도가 다른 복수의 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 복수의 구동 부호장을 전환하도록 하였다.

또한, 다음 발명의 음성 복호화 방법은 음성의 잡음성 정도의 평가 결과에 따라서, 구동 부호장에 격납하고 있는 시계열 벡터의 잡음성 정도를 변화시키도록 하였다.

또한, 다음 발명의 음성 복호화 방법은 잡음적인 시계열 벡터를 격납하고 있는 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 구동 음원의 신호 샘플을 샘플링함으로써 잡음성 정도가 낮은 시계열 벡터를 생성하도록 하였다.

또한, 다음 발명의 음성 복호화 방법은 잡음적인 시계열 벡터를 격납하고 있는 제 1 구동 부호장과, 비잡음적인 시계열 벡터를 격납하고 있는 제 2 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 제 1 구동 부호장의 시계열 벡터와 제 2 구동 부호장의 시계열 벡터를 가중 가산한 시계열 벡터를 생성하도록 하였다.

또한, 다음 발명의 음성 부호화 장치는 입력 음성의 스펙트럼 정보를 부호화하고, 부호화 결과의 1요소로서 출력하는 스펙트럼 정보 부호화부와, 이 스펙트럼 정보 부호화부로부터의 부호화된 스펙트럼 정보로부터 얻어지는 스펙트럼 정보, 파워 정보 중 적어도 1개의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에 있어서의 음성의 잡음성 정도를 평가하여, 평가 결과를 출력하는 잡음도 평가부와, 비잡음적인 복수의 시계열 벡터가 기억된 제 1 구동 부호장과, 잡음적인 복수의 시계열 벡터가 기억된 제 2 구동 부호장과, 상기 잡음도 평가부의 평가 결과에 의해, 제 1 구동 부호장과 제 2 구동 부호장을 전환하는 구동 부호장 전환부와, 상기 제 1 구동 부호장 또는 제 2 구동 부호장으로부터의 시계열 벡터를 각각의 시계열 벡터의 게인에 따라서 가중 가산하는 가중 가산부와, 이 가중된 시계열 벡터를 구동 음원 신호로 하여, 이 구동 음원 신호와 상기 스펙트럼 정보 부호화부로부터의 부호화된 스펙트럼 정보에 의거하여 부호화 음성을 얻는 합성 필터와, 이 부호화 음성과 상기 입력 음성과의 거리를 구하고, 거리가 최소가 되는 구동 부호, 게인을 탐색하여, 그 결과를 구동 부호, 게인의 부호를 부호화 결과로서 출력하는 거리 계산부를 구비하였다.

또한, 다음 발명의 음성 복호화 장치는 스펙트럼 정보의 부호로부터 스펙트럼 정보를 복호화하는 스펙트럼 정보 복호화부와, 이 스펙트럼 정보 복호화부로부터의 복호화된 스펙트럼 정보로부터 얻어지는 스펙트럼 정보, 파워 정보중 적어도 1개의 복호화 결과 또는 상기 스펙트럼 정보의 부호를 사용하여 해당 복호화 구간에 있어서의 음성의 잡음성 정도를 평가하고, 평가 결과를 출력하는 잡음도 평가부와, 비잡음적인 복수의 시계열 벡터가 기억된 제 1 구동 부호장과, 잡음적인 복수의 시계열 벡터가 기억된 제 2 구동 부호장과, 시계열 잡음도 평가부의 평가 결과에 의해, 제 1 구동 부호장과 제 2 구동 부호장을 전환하는 구동 부호장 전환부와, 상기 제 1 구동 부호장 또는 제 2 구동 부호장으로부터의 시계열 벡터를 각각의 시계열 벡터의 게인에 따라서 가중 가산하는 가중 가산부와, 이 가중된 시계열 벡터를 구동 음원 신호로 하고, 이 구동 음원 신호와 상기 스펙트럼 정보 복호화부로부터의 복호화된 스펙트럼 정보에 의거하여 복호화 음성을 얻는 합성 필터를 구비하였다.

본 발명에 따른 음성 부호화 장치는 부호 구동 선형 예측(CELP) 음성 부호화 장치에 있어서, 스펙트럼 정보, 파워 정보, 피치 정보 중 적어도 1개의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에서의 음성의 잡음성 정도를 평가하는 잡음도 평가부와, 상기 잡음도 평가부의 평가 결과에 따라서 복수의 구동 부호장을 전환하는 구동 부호장 전환부를 구비한 것을 특징으로 한다.

본 발명에 따른 음성 복호화 장치는 부호 구동 선형 예측(CELP) 음성 복호화 장치에 있어서, 스펙트럼 정보, 파워 정보, 피치 정보 중 적어도 1개의 부호 또는 복호화 결과를 사용하여 해당 복호화 구간에 있어서의 음성의 잡음성 정도를 평가하는 잡음도 평가부와, 상기 잡음도 평가부의 평가 결과에 따라서 복수의 구동 부호장을 전환하는 구동 부호장 전환부를 구비한 것을 특징으로 한다.

이하 도면을 참조하면서, 본 발명의 실시예에 대해서 설명한다.

실시예 1

도 1은 본 발명에 의한 음성 부호화 방법 및 음성 복호화 방법의 실시예 1의 전체 구성을 도시한다. 도면 중, 참조번호 1은 부호화부, 2는 복호화부, 3은 다중화부, 4는 분리부이다. 부호화부(1)는 선형 예측 파라미터 분석부(5), 선형 예측 파라미터 부호화부(6), 합성 필터(7), 적응 부호장(8), 게인 부호화부(10), 거리계산부(11),제 1 구동 부호장(19), 제 2 구동 부호장(20), 잡음도 평가부(24), 구동 부호장 전환부(25), 가중 가산부(38)로 구성된다. 또한, 복호화부(2)는 선형 예측 파라미터 복호화부(12), 합성 필터(13), 적응 부호장(14), 제 1 구동 부호장(22), 제 2 구동 부호장(23), 잡음도 평가부(26), 구동 부호장 전환부(27), 게인 복호화부(16), 가중 가산부(39)로 구성되어 있다. 도면 1중 참조번호 5는 입력 음성(S1)을 분석하고, 음성의 스펙트럼 정보인 선형 예측 파라미터를 추출하는 스펙트럼 정보 분석부로서의 선형 예측 파라미터 분석부, 6은 스펙트럼 정보인 그 선형 예측 파라미터를 부호화하고, 부호화한 선형 예측 파라미터를 합성 필터(7)의 계수로서 설정하는 스펙트럼 정보부호화부로서의 선형 예측 파라미터 부호화부, 19, 22는 비잡음적인 복수의 시계열 벡터가 기억된 제 1 구동 부호장, 20, 23은 잡음적인 복수의 시계열 벡터가 기억된 제 2 구동 부호장, 24, 26은 잡음의 정도를 평가하는 잡음도 평가부, 25, 27은 잡음 정도에 의해 구동 부호장을 전환하는 구동 부호장 전환부이다.

이하, 동작을 설명한다. 우선, 부호화부(1)에 있어서, 선형 예측 파라미터 분석부(5)는 입력 음성(S1)을 분석하고, 음성 스펙트럼 정보인 선형 예측 파라미터를 추출한다. 선형 예측 파라미터 부호화부(6)는 그 선형 예측 파라미터를 부호화하고, 부호화한 선형 예측 파라미터를 합성 필터(7)의 계수로서 설정함과 동시에, 잡음도 평가부(24)로 출력한다. 다음에, 음원 정보의 부호화에 대해서 설명한다. 적응 부호장(8)에는 과거의 구동 음원 신호가 기억되어 있고, 거리 계산부(11)로부터 입력되는 적응 부호에 대응하여 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 잡음도 평가부(24)는 상기 선형 예측 파라미터 부호화부(6)로부터 입력된 부호화한 선형 예측 파라미터와 적응 부호로부터 예를 들면 도 2에 도시하는 바와 같이 스펙트럼의 경사, 단기 예측 이득, 피치 변동으로부터 해당 부호화 구간의 잡음의 정도를 평가하고, 평가 결과를 구동 부호장 전환부(25)에 출력한다. 구동 부호장 전환부(25)는 상기 잡음도의 평가 결과에 따라서, 예를 들면 잡음도가 낮으면 제 1 구동 부호장(19)을, 잡음도가 높으면 제 2 구동 부호장(20)을 사용하는 것으로 하여 부호화에 사용되는 구동 부호장을 전환한다.

제 1 구동 부호장(19)에는 비잡음적인 복수의 시계열 벡터, 예를 들면 학습용 음성과 그 부호화 음성과의 왜곡이 작아지도록 학습하여 구성된 복수의 시계열 벡터가 기억되어 있다. 또한, 제 2 구동 부호장(20)에는 잡음적인 복수의 시계열 벡터, 예를 들면 랜덤 잡음으로부터 생성한 복수의 시계열 벡터가 기억되어 있고, 거리 계산부(11)로부터 입력되는 각각 구동 부호에 대응한 시계열 벡터를 출력한다. 적응 부호장(8), 제 1 구동 음원 부호장(19) 또는 제 2 구동 부호장(20)으로부터의 각 시계열 벡터는 게인 부호화부(10)로부터 주어지는 각각의 게인에 따라서 가중 가산부(38)에서 가중 가산되고, 그 가산 결과를 구동 음원 신호로서 합성 필터(7)로 공급되어 부호화 음성을 얻는다. 거리 계산부(11)는 부호화 음성과 입력 음성(S1)과의 거리를 구하고, 거리가 최소가 되는 적응 부호, 구동 부호, 게인을 탐색한다. 이상 부호화가 종료한 후, 선형 예측 파라미터의 부호, 입력 음성과 부호화 음성과의 왜곡을 최소로 하는 적응 부호, 구동 부호, 게인의 부호를 부호화 결과(S2)로서 출력한다. 이상이 실시예 1의 음성 부호화 방법에 특징적인 동작이다.

다음에 복호화부(2)에 대해 설명한다. 복호화부(2)에서는 선형 예측 파라미터 복호화부(12)는 선형 예측 파라미터의 부호로부터 선형 예측 파라미터를 복호화 하고, 합성 필터(13)의 계수로서 설정함과 동시에, 잡음도 평가부(26)로 출력한다. 다음에, 음원 정보의 복호화에 대해 설명한다. 적응 부호장(14)은 적응 부호에 대응하여, 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 잡음도 평가부(26)는 상기 선형 예측 파라미터 복호화부(12)로부터 입력된 복호화 한 선형 예측 파라미터와 적응 부호로부터 부호화부(1)의 잡음도 평가부(24)와 같은 방법으로 잡음 정도를 평가하고, 평가 결과를 구동 부호장 전환부(27)에 출력한다. 구동 부호장 전환부(27)는 상기 잡음도의 평가 결과에 따라서, 부호화부(1)의 구동 부호장 전환부(25)와 동일하게 제 1 구동 부호장(22)과 제 2 구동 부호장(23)을 전환한다.

제 1 구동 부호장(22)에는 비잡음적인 복수의 시계열 벡터, 예를 들면, 학습용 음성과 그 부호화 음성과의 왜곡이 작아지도록 학습하여 구성된 복수의 시계열 벡터가, 제 2 구동 부호장(23)에는 잡음적인 복수의 시계열 벡터, 예를 들면 랜덤잡음으로부터 생성한 복수의 시계열 벡터가 기억되어 있고, 각각 구동 부호에 대응한 시계열 벡터를 출력한다. 적응 부호장(14)과 제 1 구동 부호장(22) 또는 제 2 구동 부호장(23)으로부터의 시계열 벡터는 게인 복호화부(16)에서 게인의 부호로부터 복호화한 각각의 게인에 따라서 가중 가산부(39)에서 가중 가산되고, 그 가산 결과를 구동 음원 신호로서 합성 필터(13)로 공급되어 출력 음성(S3)이 얻어진다. 이상이 실시예 1의 음성 복호화 방법에 특징적인 동작이다.

실시예 1에 의하면, 입력 음성의 잡음 정도를 부호 및 부호화 결과로부터 평가하고, 평가 결과에 따라서 다른 구동 부호장을 사용함으로써, 적은 정보량으로, 품질이 높은 음성을 재생할 수 있다.

또한, 상기 실시예에서는 구동 부호장(19, 20, 22, 23)에는 복수의 시계열 벡터가 기억되어 있는 경우를 설명하였지만, 적어도 1개의 시계열 벡터가 기억되어 있으면, 실시가능하다.

실시예 2

상술의 실시예 1에서는 2개의 구동 부호장을 전환하여 사용하고 있지만, 이것을 대신하여, 3개 이상의 구동 부호장을 구비하고, 잡음 정도에 따라서 전환하여 사용하여도 된다. 실시예 2에 의하면, 음성을 잡음/비잡음의 2가지만이 아니고, 약간 잡음적인 등의 중간적인 음성에 대하여도 또한 알맞은 구동 부호장을 사용할 수 있으므로, 품질이 높은 음성을 재생할 수 있다.

실시예 3

도 1과의 대응 부분에 동일 부호를 붙인 도 3은 본 발명의 음성 부호화 방법 및 음성 복호화 방법의 실시예 3의 전체 구성을 도시하고, 도면 중 참조번호 28, 30은 잡음적인 시계열 벡터를 격납한 구동 부호장, 29, 31은 시계열 벡터의 저진폭 샘플의 진폭치를 영으로 하는 샘플러이다.

이하, 동작을 설명한다. 우선, 부호화부(1)에 있어서, 선형 예측 파라미터 분석부(5)는 입력 음성(S1)을 분석하고, 음성의 스펙트럼 정보인 선형 예측 파라미터를 추출한다. 선형 예측 파라미터 부호화부(6)는 그 선형 예측 파라미터를 부호화하고, 부호화한 선형 예측 파라미터를 합성 필터(7)의 계수로서 설정함과 동시에, 잡음도 평가부(24)로 출력한다. 다음에, 음원 정보의 부호화에 대해서 설명한다. 적응 부호장(8)에는 과거의 구동 음원 신호가 기억되어 있고, 거리계산부(11)로부터 입력되는 적응 부호에 대응하여 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 잡음도 평가부(24)는 상기 선형 예측 파라미터 부호화부(6)로부터 입력된 부호화한 선형 예측 파라미터와 적응 부호로부터, 예를 들면 스펙트럼의 경사, 단기 예측 이득, 피치 변동으로부터 해당 부호화 구간의 잡음 정도를 평가하고, 평가 결과를 샘플러(29)에 출력한다.

구동 부호장(28)에는 예를 들면 랜덤 잡음으로부터 생성한 복수의 시계열 벡터가 기억되어 있고, 거리계산부(11)로부터 입력되는 구동 부호에 대응한 시계열 벡터를 출력한다. 샘플러(29)는 상기 잡음도의 평가 결과에 따라서, 잡음도가 낮으면 상기 구동 부호장(28)으로부터 입력된 시계열 벡터에 대하여, 예를 들면 소정의 진폭치에 만족하지 않은 샘플의 진폭치를 영으로 한 시계열 벡터를 출력하고, 또한, 잡음도가 높으면 상기 구동 부호장(28)으로부터 입력된 시계열 벡터를 그대로 출력한다. 적응 부호장(8), 샘플러(29)로부터의 각 시계열 벡터는 게인 부호화부(10)로부터 주어지는 각각의 게인에 따라서 가중 가산부(38)에서 가중 가산되고, 그 가산 결과를 구동 음원 신호로서 합성 필터(7)로 공급되어 부호화 음성을 얻는다. 거리계산부(11)는 부호화 음성과 입력 음성(S1)과의 거리를 구하고, 거리가 최소가 되는 적응 부호, 구동 부호, 게인을 탐색한다. 이상 부호화가 종료한 후, 선형 예측 파라미터의 부호, 입력 음성과 부호화 음성의 왜곡을 최소로 하는 적응 부호, 구동 부호, 게인의 부호를 부호화 결과(S2)로서 출력한다. 이상이 실시예 3의 음성 부호화 방법에 특징적인 동작이다.

다음에 복호화부(2)에 대해 설명한다. 복호화부(2)에서는 선형 예측 파라미터 복호화부(12)는 선형 예측 파라미터의 부호로부터 선형 예측 파라미터를 복호화 하고, 합성 필터(13)의 계수로서 설정함과 동시에, 잡음도 평가부(26)로 출력한다. 다음에, 음원 정보의 복호화에 대해 설명한다. 적응 부호장(14)은 적응 부호에 대응하여, 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 잡음도 평가부(26)는 상기 선형 예측 파라미터 복호화부(12)로부터 입력된 복호화 한 선형 예측 파라미터와 적응 부호로부터 부호화부(1)의 잡음도 평가부(24)와 동일한 방법으로 잡음의 정도를 평가하고, 평가 결과를 샘플러(31)에 출력한다.

구동 부호장(30)은 구동 부호에 대응한 시계열 벡터를 출력한다. 샘플러(31)는 상기 잡음도 평가 결과에 따라서, 상기 부호화부(1)의 샘플러(29)와 동일한 처리에 의해 시계열 벡터를 출력한다. 적응 부호장(14), 샘플러(31)로부터의 각 시계열 벡터는 게인 복호화부(16)로부터 주어지는 각각의 게인에 따라서 가중 가산부(39)에서 가중하여 가산되고, 그 가산 결과를 구동 음원 신호로서 합성 필터(13)로 공급되어 출력 음성(S3)이 얻어진다.

실시예 3에 의하면, 잡음적인 시계열 벡터를 격납하고 있는 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 구동 음원의 신호 샘플을 샘플링함으로써 잡음성 정도가 낮은 구동 음원을 생성함으로써, 적은 정보량으로, 품질이 높은 음성을 재생할 수 있다. 또한, 복수의 구동 부호장을 구비할 필요가 없기 때문에, 구동 부호장의 기억용 메모리량을 적게 하는 효과도 있다.

실시예 4

상술의 실시예 3에서는 시계열 벡터의 샘플을 샘플링/샘플링하지 않음의 2가지로 하고 있지만, 이것을 대신하여, 잡음의 정도에 따라서 샘플을 샘플링할 때의 진폭임계치를 변경해도 된다. 실시예 4에 의하면, 음성을 잡음/비잡음의 2가지만이 아니라, 약간 잡음적인 등의 중간적인 음성에 대하여도 또한 알맞은 시계열 벡터를 생성하고, 사용할 수 있으므로, 품질이 높은 음성을 재생할 수 있다.

실시예 5

도 1과의 대응 부분에 동일 부호를 붙인 도 4는 본 발명의 음성 부호화 방법 및 음성 복호화 방법의 실시예 5의 전체 구성을 도시하고, 도면 중 참조번호 32, 35는 잡음적인 시계열 벡터를 기억하고 있는 제 1 구동 부호장, 33, 36은 비잡음적인 시계열 벡터를 기억하고 있는 제 2 구동 부호장, 34, 37은 무게 결정부이다.

이하, 동작을 설명한다. 우선, 부호화부(1)에 있어서, 선형 예측 파라미터 분석부(5)는 입력 음성(S1)을 분석하고, 음성의 스펙트럼 정보인 선형 예측 파라미터를 추출한다. 선형 예측 파라미터 부호화부(6)는 그 선형 예측 파라미터를 부호화하고, 부호화한 선형 예측 파라미터를 합성 필터(7)의 계수로서 설정함과 동시에, 잡음도 평가부(24)로 출력한다. 다음에, 음원 정보의 부호화에 대하여 설명한다. 적응 부호장(8)에는 과거의구동 음원 신호가 기억되어 있고, 거리계산부(11)로부터 입력되는 적응 부호에 대응하여 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 잡음도 평가부(24)는 상기 선형 예측 파라미터 부호화부(6)로부터 입력된 부호화한 선형 예측 파라미터와 적응 부호로부터, 예를 들면 스펙트럼의 경사, 단기 예측 이득, 피치 변동으로부터 해당 부호화 구간의 잡음의 정도를 평가하여, 평가 결과를 무게 결정부(34)에 출력한다.

제 1 구동 부호장(32)에는 예를 들면 랜덤 잡음으로부터 생성한 복수의 잡음적인 시계열 벡터가 기억되어 있고, 구동 부호에 대응한 시계열 벡터를 출력한다. 제 2 구동 부호장(33)에는 예를 들면 학습용 음성과 그 부호화 음성과의 왜곡이 작게 되도록 학습하여 구성된 복수의 시계열 벡터가 기억되어 있고, 거리 계산부(11)로부터 입력되는 구동 부호에 대응한 시계열 벡터를 출력한다. 무게 결정부(34)는 상기 잡음도 평가부(24)로부터 입력된 잡음도의 평가 결과에 따라서, 예를 들면 도 5에 따라서, 제 1 구동 부호장(32)으로부터의 시계열 벡터와 제 2 구동 부호장(33)으로부터의 시계열 벡터에 주어지는 무게를 결정한다. 제 1 구동 부호장(32), 제 2 구동 부호장(33)으로부터의 각 시계열 벡터는 상기 무게 결정부(34)로부터 주어지는 무게에 따라서 가중하여 가산된다. 적응 부호장(8)으로부터 출력된 시계열 벡터와, 상기 가중 가산하여 생성된 시계열 벡터는 게인 부호화부(10)로부터 주어지는 각각의 게인에 따라서 가중 가산부(38)에서 가중하여 가산되고, 그 가산 결과를 구동 음원 신호로서 합성 필터(7)로 공급하여 부호화 음성을 얻는다. 거리 계산부(11)는 부호화 음성과 입력 음성(S1)과의 거리를 구하고, 거리가 최소가 되는 적응 부호, 구동 부호, 게인을 탐색한다. 이 부호화가 종료한 후, 선형 예측 파라미터의 부호, 입력 음성과 부호화 음성과의 왜곡을 최소로 하는 적응 부호, 구동 부호, 게인의 부호를 부호화 결과로서 출력한다.

다음에 복호화부(2)에 대해서 설명한다. 복호화부(2)에서는 선형 예측 파라미터 복호화부(12)는 선형 예측 파라미터의 부호로부터 선형 예측 파라미터를 복호화하고, 합성 필터(13)의 계수로서 설정함과 동시에, 잡음도 평가부(26)로 출력한다. 다음에, 음원 정보의 복호화 에 대해서 설명한다. 적응 부호장(14)은 적응 부호에 대응하여, 과거의 구동 음원 신호를 주기적으로 되풀이한 시계열 벡터를 출력한다. 잡음도 평가부(26)는 상기 선형 예측 파라미터 복호화부(12)로부터 입력된 복호화한 선형 예측 파라미터와 적응 부호로부터 부호화부(1)의 잡음도 평가부(24)와 동일한 방법으로 잡음의 정도를 평가하여, 평가 결과를 무게 결정부(37)에 출력한다.

제 1 구동 부호장(35) 및 제 2 구동 부호장(36)은 구동 부호에 대응한 시계열 벡터를 출력한다. 무게 결정부(37)는 상기 잡음도 평가부(26)로부터 입력된 잡음도 평가 결과에 따라서, 부호화부(1)의 무게 결정부(34)와 동일하게 무게를 부여하기로 한다. 제 1 구동 부호장(35), 제 2 구동 부호장(36)으로부터의 각 시계열 벡터는 상기 무게 결정부(37)로부터 주어지는 각각의 무게에 따라서 가중 가산된다. 적응 부호장(14)으로부터 출력된 시계열 벡터와, 상기 가중 가산하여 생성된 시계열 벡터는 게인 복호화부(16)에서 게인의 부호로부터 복호화한 각각의 게인에 따라서 가중 가산부(39)에서 가중 가산되고, 그 가산 결과가 구동 음원 신호로서 합성 필터(13)로 공급되어 출력 음성(S3)이 얻어진다.

실시예 5에 의하면, 음성의 잡음 정도를 부호 및 부호화 결과로부터 평가하고, 평가 결과에 따라서 잡음적인 시계열 벡터와 비잡음적인 시계열 벡터를 가중 가산하여 사용함으로써, 적은 정보량으로, 품질이 높은 음성을 재생할 수 있다. 실시예 6

상술의 실시예 1 내지 5에서 또한, 잡음 정도의 평가 결과에 따라서 게인의 부호장을 변경하여도 된다. 실시예 6에 의하면, 구동 부호장에 따라서 알맞은 게인의 부호장을 사용할 수 있으므로, 품질이 높은 음성을 재생할 수 있다.

실시예 7

상술의 실시예 1 내지 6에서는 음성의 잡음 정도를 평가하고, 그 평가 결과에 따라서 구동 부호장을 전환하고 있지만, 유성의 올라감이나 파열성의 자음 등을 각각 판정, 평가하고, 그 평가 결과에 따라서 구동 부호장을 전환하여도 된다. 이 실시예 7에 의하면, 음성의 잡음적인 상태 뿐만 아니라, 유성의 올라감이나 파열성자음 등 더욱, 미세하게 분류하여, 각각 알맞은 구동 부호장을 사용할 수 있으므로, 품질이 높은 음성을 재생할 수 있다.

실시예 8

상술의 실시예 1 내지 6에서는 도 2에 도시하는 스펙트럼 경사, 단기 예측이득, 피치 변동으로부터, 부호화 구간의 잡음의 정도를 평가하고 있지만, 적응 부호장 출력에 대한 게인치의 대소를 사용하여 평가하여도 된다.

본 발명에 따른 음성 부호화 방법 및 음성 복호화 방법 및 음성 부호화 장치 및 음성 복호화 장치에 의하면, 스펙트럼 정보, 파워 정보, 피치 정보 중 적어도 1개의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에 있어서의 음성의 잡음성 정도를 평가하고, 평가 결과에 따라서 다른 구동 부호장을 사용하기 때문에, 적은 정보량으로 품질이 높은 음성을 재생할 수 있다.

또한 본 발명에 의하면, 음성 부호화 방법 및 음성 복호화 방법에서, 격납하고 있는 구동 음원의 잡음성 정도가 다른 복수의 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 복수의 구동 부호장을 전환하여 사용하므로, 적은 정보량으로 품질이 높은 음성을 재생할 수 있다.

또한 본 발명에 의하면, 음성 부호화 방법 및 음성 복호화 방법에서, 음성의 잡음성 정도의 평가 결과에 따라서, 구동 부호장에 격납하고 있는 시계열 벡터의 잡음성 정도를 변화시킨 것으로, 적은 정보량으로 품질이 높은 음성을 재생할 수 있다.

또한 본 발명에 의하면, 음성 부호화 방법 및 음성 복호화 방법에서, 잡음적인 시계열 벡터를 격납하고 있는 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 시계열 벡터의 신호 샘플을 샘플링함으로써 잡음성 정도가 낮은 시계열 벡터를 생성하였으므로, 적은 정보량으로 품질이 높은 음성을 재생할 수 있다.

또한 본 발명에 의하면, 음성 부호화 방법 및 음성 복호화 방법에서, 잡음적인 시계열 벡터를 격납하고 있는 제 1 구동 부호장과, 비잡음적인 시계열 벡터를 격납하고 있는 제 2 구동 부호장을 구비하고, 음성의 잡음성 정도의 평가 결과에 따라서, 제 1 구동 부호장의 시계열 벡터와 제 2 구동 부호장의 시계열 벡터를 가중 가산한 시계열 벡터를 생성하였기 때문에, 적은 정보량으로 품질이 높은 음성을 재생할 수 있다.

Claims

부호 구동 선형 예측(Code-Excited Linear Prediction: CELP) 음성 부호화 방법에 있어서,

스펙트럼 정보, 파워 정보 및 피치 정보 중 1개 이상의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에 있어서의 음성의 잡음성 정도를 평가하는 단계 및,

평가 결과에 따라서 복수의 구동 부호장 중 1개를 선택하는 단계를 포함하는 것을 특징으로 하는 음성 부호화 방법.
제 1 항에 있어서,

격납하고 있는 시계열 벡터의 잡음성 정도가 다른 복수의 구동 부호장을 구비하는 단계 및,

음성의 잡음성 정도의 평가 결과에 따라서, 상기 복수의 구동 부호장을 전환하여 사용하는 단계를 더 포함하는 것을 특징으로 하는 음성 부호화 방법.
제 1 항에 있어서,

음성의 잡음성 정도의 평가 결과에 따라서, 구동 부호장에 격납하고 있는 시계열 벡터의 잡음성 정도를 변화시키는 단계를 더 포함하는 것을 특징으로 하는 음성 부호화 방법.
제 3 항에 있어서,

잡음적인 시계열 벡터를 격납하고 있는 구동 부호장을 구비하는 단계 및,

음성의 잡음성 정도의 평가 결과에 따라서, 상기 시계열 벡터의 신호 샘플을 샘플링함으로써 잡음성 정도가 낮은 시계열 벡터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 부호화 방법.
제 3 항에 있어서,

잡음적인 시계열 벡터를 격납하고 있는 제 1 구동 부호장과, 비잡음적인 시계열 벡터를 격납하고 있는 제 2 구동 부호장을 구비하는 단계 및,

음성의 잡음성 정도의 평가결과에 따라서, 상기 제 1 구동 부호장의 시계열 벡터와 상기 제 2 구동 부호장의 시계열 벡터를 가중 가산한 시계열 벡터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 부호화 방법.
부호 구동 선형 예측(CELP)음성 복호화 방법에 있어서,

스펙트럼 정보, 파워 정보 및 피치 정보 중 1개 이상의 부호 또는 복호화 결과를 사용하여 해당 복호화 구간에 있어서의 음성의 잡음성 정도를 평가하는 단계 및,

평가 결과에 따라서 복수의 구동 부호장 중 1개의 부호장을 선택하는 단계를 포함하는 것을 특징으로 하는 음성 복호화 방법.
제 6 항에 있어서,

격납하고 있는 시계열 벡터의 잡음성 정도가 다른 복수의 구동 부호장을 구비하는 단계 및,

음성의 잡음성 정도의 평가 결과에 따라서, 상기 복수의 구동 부호장을 전환하여 사용하는 단계를 더 포함하는 것을 특징으로 하는 음성 복호화 방법.
제 6 항에 있어서,

음성의 잡음성 정도의 평가 결과에 따라서, 구동 부호장에 격납하고 있는 시계열 벡터의 잡음성 정도를 변화시키는 단계를 더 포함하는 것을 특징으로 하는 음성 복호화 방법.
제 8 항에 있어서,

잡음적인 시계열 벡터를 격납하고 있는 구동 부호장을 구비하는 단계 및,

음성의 잡음성 정도의 평가 결과에 따라서, 상기시계열 벡터의 신호 샘플을 샘플링함으로써 잡음성 정도가 낮은 시계열 벡터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 복호화 방법.
제 8 항에 있어서,

잡음적인 시계열 벡터를 격납하고 있는 제 1 구동 부호장과, 비잡음적인 시계열 벡터를 격납하고 있는 제 2 구동 부호장을 구비하는 단계 및,

음성의 잡음성 정도의 평가 결과에 따라서, 상기 제 1 구동 부호장의 시계열 벡터와 상기 제 2 구동 부호장의 시계열 벡터를 가중 가산한 시계열 벡터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성 복호화 방법.
입력 음성의 스펙트럼 정보를 부호화하고, 부호화 결과의 1요소로서 출력하는 스펙트럼 정보 부호화부,

상기 스펙트럼 정보 부호화부로부터의 부호화된 스펙트럼 정보로부터 얻어지는 스펙트럼 정보 및 파워 정보 중 1 개 이상의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에 있어서의 음성의 잡음성 정도를 평가하고, 평가 결과를 출력하는 잡음도 평가부,

비잡음적인 복수의 시계열 벡터가 기억된 제 1 구동 부호장,

잡음적인 복수의 시계열 벡터가 기억된 제 2 구동 부호장과, 상기 잡음도 평가부의 평가 결과에 의해, 제 1 구동 부호장과 제 2 구동 부호장을 전환하는 구동 부호장 전환부,

상기 제 1 구동 부호장 또는 제 2 구동 부호장으로부터의 시계열 벡터를 각각의 시계열 벡터의 게인에 따라서 가중 가산하는 가중 가산부,

상기 가중된 시계열 벡터를 구동 음원 신호로 하고, 이 구동 음원 신호와 상기 스펙트럼 정보 부호화부에서의 부호화된 스펙트럼 정보에 근거하여 부호화 음성을 얻는 합성 필터 및,

상기 부호화 음성과 상기 입력 음성과의 거리를 구하고, 거리가 최소가 되는 구동 부호, 게인을 탐색하고, 그 결과를 구동 부호, 게인의 부호를 부호화 결과로서 출력하는 거리 계산부를 구비한 것을 특징으로 하는 음성 부호화 장치.
스펙트럼 정보의 부호로부터 스펙트럼 정보를 복호화하는 스펙트럼 정보 복호화부,

상기 스펙트럼 정보 복호화부로부터의 복호화된 스펙트럼 정보로부터 얻어지는 스펙트럼 정보 및 파워 정보 중 1개 이상의 복호화 결과 또는 상기 스펙트럼 정보의 부호를 사용하여 해당 복호화 구간에 있어서의 음성의 잡음성 정도를 평가하여, 평가 결과를 출력하는 잡음도 평가부,

비잡음적인 복수의 시계열 벡터가 기억된 제 1 구동 부호장,

잡음적인 복수의 시계열 벡터가 기억된 제 2 구동 부호장과 상기 잡음도 평가부의 평가 결과에 의해, 제 1 구동 부호장과 제 2 구동 부호장을 전환하는 구동 부호장 전환부,

상기 제 1 구동 부호장 또는 제 2 구동 부호장으로부터의 시계열 벡터를 각각의 시계열 벡터의 게인에 따라서 가중 가산하는 가중 가산부 및,

상기 가중 시계열 벡터를 구동 음원 신호로 하고, 이 구동 음원 신호와 상기 스펙트럼 정보 복호화부로부터의 복호화 된 스펙트럼 정보에 의거하여 복호화 음성 을 얻는 합성 필터를 구비한 것을 특징으로 하는 음성 복호화 장치.
부호 구동 선형 예측(CELP)음성 부호화 장치에 있어서,

스펙트럼 정보, 파워 정보 및 피치 정보중 1개 이상의 부호 또는 부호화 결과를 사용하여 해당 부호화 구간에 있어서의 음성의 잡음성 정도를 평가하는 잡음도 평가부 및,

상기 잡음 평가부의 평가 결과에 따라서 복수의 구동 부호장을 전환하는 구동 부호 전환부를 구비한 것을 특징으로 하는 음성 부호화 장치.
부호 구동 선형 예측(CELP)음성 복호화 장치에 있어서,

스펙트럼 정보, 파워 정보 및 피치 정보 중 1개 이상의 부호 또는 복호화 결과를 사용하여 해당 복호화 구간에 있어서의 음성의 잡음성 정도를 평가하는 잡음도 평가부 및,

상기 잡음도 평가부의 평가 결과에 따라서 복수의 구동 부호장을 전환하는 구동 부호장 전환부를 구비한 것을 특징으로 하는 음성 복호화 장치.