KR0175248B1 - Lsp 보코더 - Google Patents

Lsp 보코더 Download PDF

Info

Publication number
KR0175248B1
KR0175248B1 KR1019920009166A KR920009166A KR0175248B1 KR 0175248 B1 KR0175248 B1 KR 0175248B1 KR 1019920009166 A KR1019920009166 A KR 1019920009166A KR 920009166 A KR920009166 A KR 920009166A KR 0175248 B1 KR0175248 B1 KR 0175248B1
Authority
KR
South Korea
Prior art keywords
signal
voice
lsp
tone
kbps
Prior art date
Application number
KR1019920009166A
Other languages
English (en)
Other versions
KR930024408A (ko
Inventor
조용덕
김홍국
공병구
Original Assignee
정용문
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정용문, 삼성전자주식회사 filed Critical 정용문
Priority to KR1019920009166A priority Critical patent/KR0175248B1/ko
Publication of KR930024408A publication Critical patent/KR930024408A/ko
Application granted granted Critical
Publication of KR0175248B1 publication Critical patent/KR0175248B1/ko

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

음성전송 시스템에 있어서, 보코더에 관한 것으로 특히 LSP 음성 부호화 기법을 사용하여 전송캐넌을 확장하여 전송하는 LSP 보코더에 관한 것이다.
64 kbps의 μ-law PCM 신호를 8 kbps 이하의 데이타로 압축하는 부호화기(100)와, 상기 부호화기(100)에서 압축된 8 kbps 이하의 데이타를 64 kbps의 μ-law신호로 신장하는 복조화기(200)로 구성하여 채널당 전송률은 감소시켜 트렁크 증설없이 트렁크당 채널수를 증가시키고 채널 사용료를 줄인다.

Description

LSP 보코더
제1도는 종래의 음성전송 시스템의 블럭 구성도.
제2도는 본 발명에 따른 음성전송 시스템의 블럭 구성도.
제3도는 본 발명에 따른 LSP 보코더의 블럭 구성도.
제4도는 제2도중 음성 분석부(101)에서 음성을 분석하고 소프트웨어 모듈 구성도.
제5도는 제2도중 톤검출부(102)내의 DTMF 신호 검출 흐름도.
제6도는 제2도중 톤검출부(102)내의 토출 톤신호 검출 흐름도.
제7도는 제2도중 패킷화부(104)내의 패킷화된 데이타 전송비트맵도.
제8도는 제2도중 음성합성부(203)내의 LSP 합성 필터 구조도.
* 도면의 주요부분에 대한 부호의 설명
100 : 부호화기 101 : 음성분석부
102 : 톤검출 103 : 양자화부
104 : 패킷화부 200 : 복호화기
201 : 언패킷화부 202 : 역양자화부
203 : 음성합성부 204 : 톤 생성부
본 발명은 음성전송 시스템에 있어서, 보코더에 관한 것으로 특히 LSP 음성 부호화 기법을 사용하여 전송채널을 확장하여 전송하는 LSP 보코더에 관한 것이다.
일반적으로 음성전송 시스템은 음성 데이타를 전송하기 위해 전화국(A)과 전화국(B)간에 음성 데이타를 압축하여 음성전송 서비스를 하고 있다.
제1도는 종래의 음성전송 시스템의 블럭 구성도로서, 전화기를 이용하여 음성을 전송하고자 할때 전화국(A)과 전화국(B)간의 교환에 의해 음성이 전송된다.
예를들어 전화국(A)의 가입자가 전화기를 이용하여 음성을 전송하게 되면 가입자 인터페이스(31)을 통해 코덱(32)에서 아날로그 음성신호를 U-law 혹은 A-law신호로 변환된다. 상기 코덱(32)에서 변환된 U-law 혹은 A-law 신호는 하이웨이 인터페이스(33)를 통해 트렁크(34)로 인가되면 상기 트렁크(34)에서는 전송채널을 할당하여 전화국(B)으로 음성신호를 전송하게 된다. 그러면 상기 전화국(B)에서 상술한 전화국(A)의 역과정을 취하여 상대측 가입자로 음성신호를 전송하게 된다.
여기서 전화국간 선로의 기본단위를 트렁크라 한다.
현재 표준화된 트렁크는 유럽의 경우(E1) 하나의 트렁크가 32채널이고 미국의 경우(T1) 하나의 트렁크가 24채널의 음성전송 서비스를 하고 있다. 이때 하나의 채널은 초당 64k bits(64kbps)로 전송을 한다.
상기와 같은 음성전송 시스템은 1개의 채널 전송이 64kbps이므로 채널 사용료가 비싸게 되어 채널당 전송률을 낮게하여 채널 사용료를 줄일 수 있는 음성전송 시스템이 요구 되었다.
그래서 채널 전송률을 낮추기 위해 음성 데이타 전송시 음성신호를 부호화 하는 방식이 대두 되었다.
음성을 부호화하는 방식으로 크게 파형부호화방식과 파원부호화 방식으로 나눌 수 있다. 파형부호화 방식은 음성파형을 일정 주기로 양자화하고 다시 원래 파형을 복원하는 것으로 현재 32 kbps 전송속도 이하에서 널리 사용되나 그 이하가 되면 성능이 급격히 감소하여 장거리 통화 품질을 양호하게(toll quality) 유지하지 못한다.
파원부호화 방식은 파라메터코더(parameter coder) 또는 보코더(vocoder)라 불리는데 이는 인간의 발성과정을 모델링하고, 그 모델을 특징짓는 파라메타들로 부화하는 것으로 저비트율로 부호화가 가능하나 복원 음성이 양호하지 못하다는 단점이 있다.
따라서 본 발명의 목적은 음성전송 시스템에서 채널당 전송률을 감소시켜 새로운 트렁크 증식없이 트렁크당 채널수를 증가시킬 수 있는 LSP 보코더를 제공함에 있다.
본 발명의 다른 목적은 음성전송 시스템에 있어서 채널당 전송률을 감소시켜 채널 사용료를 줄일 수 있는 LSP 보코더를 제공함에 있다.
이하 본 발명을 첨부한 도면을 참조하여 상세히 설명한다.
제2도는 본 발명에 따른 음성전송 시스템의 블럭 구성도로서, 제1도의 구성과 동일하나 코덱(52,59)과 하이웨이, 인터페이스(54,57) 사이에 LSP 보코더(53,58)를 더 구비하고 있다.
제2도에서 전화국(A)내의 보코더(11-18)인 8개의 DSP(11-18), 전화국(B)내의 보코더 8개의 DSP(21-28)중 각각은 하나의 채널을 담당한다.
하나의 DSP는 64kbps의 μ-law(혹은 A-law) PCM의 음성신호를 받아 8kbps로 압축하여 부호화된 데이타 신호로 바꿔주며, 역으로 8kbps의 데이타 신호를 받아 64 kbps의 μ-law(혹은 A-law) PCM 음성신호로 신장시킨다.
상기 DSP는 외부와 통신하기 위해 2개의 시리얼포트(SPORT0, SPORT1)를 갖고 있다. 상기 시리얼포트(SPORT)는 RFS(Receive Frame Sync), TFS(Transmit Frame Sync), DR(Date Receive), DT(Data Transmit), SCLK(Serial Clock)로 구성되어 있다. 시리얼포트가 2개 이므로 양방향 통신이 가능하다. 음성부호화기에서 시리얼포트(SPORT0)는 μ-law(혹은 A-law) PCM의 음성신호 I/O를 담당하고, 시리얼포트(SPORT1)은 LSP(Line spectrum pair; 이하 LSP라 함)로 부호화된 데이타의 입력 또는 출력(I/O)을 담당한다.
제3도는 본 발명에 따른 LSP 보코더의 블럭 구성도로서, 64kbps의 PCM 음성신호를 입력하여 8kbps 이하의 데이타로 부호화하는 부호화부(100)와, 상기 부호화부(100)에서 부호화된 8kbps 음성신호를 64kbps 음성신호로 복호화하는 복호화부(200)로 구성되어 있다.
입력단자(P1)을 통해 입력된 음성신호를 입력하여 PCM 신호로 부터 LSP 계수 피치 유/무성을 판별, 프레임의 평균진폭을 계산하는 음성분석부(101)과, 입력단자(P1)을 통해 입력된 톤신호를 입력하려 톤신호의 종류를 검출하는 톤 검출부(102)와, 상기 음성 분석부(101)에서 음성 분석된 신호와 상기 톤검출부(102)에서 검출된 톤신호를 양자화 하는 양자화부(103)와, 상기 양자화부(103)에서 양자화된 신호를 패킷화 하는 패킷화부(104)로 구성된 부분이 부호화부(100)가 된다.
상기 패킷화부(104)에서 패킷화된 신호를 입력하여 진폭, 피치, DTMF 정보 LSP계수를 분석하여 패킷을 풀기위한 언 패킷화부(201)와, 상기 언 패킷화부(201)에서 언 패킷화된 신호를 입력하여 역양자화를 수행하는 역양자화부(202)와, 상기 역양자화부(202)에서 역양자화된 음성신호를 입력하여 음성을 합성하는 음성합성부(203)과, 상기 역양자화부(202)에서 역양자화된 톤신호를 분석하여 톤신호를 재생하는 톤생성부(204)로 구성되어 있다.
상기와 같은 LSP 보코더의 구성은 제2도에 도시한 DSP내의 구성되어 있으며 상기 DSP는 원칩(one-chip)으로 2k word의 프로그램 롬과 1k word의 데이타 램을 구비하고 있다.
제4도는 제3도중 음성분석부(101)에서 음성을 분석하는 소프트웨어 모듈 구성도이고 제5도는 제3도중 톤검출부(102)내의 DTMF신호 검출 흐름도이며 제6도는 제3도중 톤검출부(102)내의 호출진행 톤 신호 검출 흐름도 이고 제7도는 제3도중 패킷화부(104)에서 패킷화된 데이타 전송 비트 맵도며 제8도는 제3도중 음성합성부(203)내의 LSP 합성필터의 구조도이다.
상술한 제2-8도를 참조하여 본 발명의 일실시예를 상세히 설명한다.
본 발명에 따른 LSP 보코더는 DSP내에 펌웨어(firmware)한 4개의 인터럽트 루틴에 의하여 원하는 기능을 제공한다. 상기 인터럽트는 PCM 음성이 시리얼포트(SPORT0)의 DRØ를 통해 입력된 후 입력버퍼에 채워져 풀(full)이 될 때, PCM 음성을 시리얼포트(SPORT0)의 DTØ를 통해 전송하고자 할 때, 부호된 음성이 시리얼포트(SPORT1)의 DR1을 통해 입력되고 버퍼에 채워져 풀(full)이 될 때, 부호화된 음성이 시리얼포트(SPORT1)의 DT1을 통해 전송하고자 할 때 발생한다. 입력버퍼에 PCM 음성이 채워지면 시리올포트(SPORT0)Rx 인터럽트를 발생한다.
제3도는 음성이 입력된 후 부호화 과정을 거쳐 전송된 후 복호화 과정을 거쳐 합성되는 과정을 나타낸 것이다. 음성부호화기는 먼저 입력이 음성인지(Tone) 신호인지를 결정한다. 톤(Tone)신호는 전화기의 버튼(button)을 누름으로써 생성되는 DTMF(Dual Tone Multi Frequency)와 전화선로의 상태를 알려주는 NCPT(Normal Call Progress Tone)이 있다. DTMF의 종류는 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, *, #, A, B, C, D가 있고 NCPT에는 다이얼트(Dial Tone) 링백톤(Ring Back Tone), 비지톤(Busy Tone)등이 있다.
입력단자(P1)을 통해 입력되는 64 kbps의 음성신호를 10㎳마다 자르면 80포인트의 음성 샘플을 얻는다.
입력된 μ-law/A-law 음성신호는 압신기(compander)에 의하여 최대가 14 bit인 리니어(linear) PCM신호로 변환된다. 입력 버퍼가 채워져서 풀(full)이 되면 음성분석, 양자화 및 패킷화를 하기 위한 인터럽트를 발생한다. 음성분석은 PCM 음성신호를 부호화하기 위하여 인간의 성도를 모델링하고 이로부터 소수의 계수를 추출하는 기법들 중의 하나인 LSP 부호화 방식을 사용한다. 분석결과글 10차의 LSP 계수, 피치(pitch), 진폭(amplitude), 유/무성 판별 결과를 얻는다.
제3도의 상기 음성 분석부(101)의 상세동작을 제4도를 참조하여 상세히 설명하면, 음성분석은 PCM 신호로 부터 LSP계수, 피치, 유/무성음 판별, 프레임의 평균진폭(Amplitude)을 계산하는 과정이다. 음성 분석을 위한 PCM신호는 프레임 진폭 결정부(41)에서 현재의 프레임(10 ㎳)에서 시간적으로 전후의 10㎳씩을 취하여 3개의 프레임들로 부터 행한다. 한개의 프레임은 PCM 신호 80 포인트에 해당한다. LPC 계수들을 구하기 위해 전과정으로 해밍윈도우부(42)에서 음성신호에 해밍윈도우(Hamming Window)를 씌우고, 자기 상관 데이타 검출부(43)에서 0부터 150 까지 구한다. LPC 계수들은 상관도 0부터 10까지의 자기상관 계수들로부터 레비슨 두빈(Revison-Durvin) 방법에 의하여 LPC 추출부(44)에서 10차까지 구한다. 10차의 LSP 파라메타는 LSP 추출부(45)에서 10차의 LPC 계수들로 부터 Arc 코싸인(Cosine) 방법에 의하여 구한다.
피치는 변형상관법에 의하여 변형상관 데이타 검출부(16)에서 잔차(residual)의 상관치를 구한다.
피치는 피치추출부(47)에서 20 부터 140 사이의 상관범위에서 상관치가 최대인 상관범위의 값이다.
유ㆍ무성음의 판별은 유/무성음 판별부(48)에서 1차의 PARCOR 계수(K1)와 covariance maximum 값(covmax)에 의하여 행한다. 1차의 PARCOR 계수 K1은 PCM의 상관관계가 1인 경우를 0인 경우로 나눈 값이다 (K1=Ø1/Ø0). covmax는 피치에서의 잔차의 상관값에서 전차의 상관관계가 0일 때의 상관값으로 나누어 구한다 (covmax = Φpitch/Φ0).
유ㆍ무성의 판별식은 다음과 같다.
프레임의 평균진폭(Amplitude)은 현재의 프레임의 80포인트(point) 각각에 절대값을 취한후 더한값을 프레임의 크기 80로 나누어 구한다.
그리고 상기 입력단자(P1)을 통해 입력된 신호가 톤신호이면 톤검출부(102)에서는 톤신호를 검출하게 되는데 DTMF 신호와 호출진행 톤신호를 검출한다. 상기 DTMF 신호를 검출하는 동작을 제5도의 흐름도를 살펴본다.
입력단자(P1)를 통해 입력된 톤신호를 분석한다. 이때 DTMF신호는 하기 표1과 같은 주파수에 의해 발생되므로 (4a)단계에서 각 주파수에서의 스펙트럼의 크기를 DFT를 사용하여 DTMF 신호 상태를 판별하기 위한 8가지의 주파수에 의해 대해 구한다.
그리고 (4b)단계에서는 상기 DTMF상태를 구하기 위한 8가지의 주파수의 값을 RK {k=697, 770, 852, 941}, C(k) {k=1209, 1336, 1477, 1633}이라 하고 각 R(k), C(k)에 대해 최대크기를 갖는 k를 하기식(1)과 같이 선택하고 (4c)단계를 수행한다.
상기 (4c)단계에서는 상기 Krmax, Kcmax에 해당하는 값을 각각 R(Krmax), C(Kcmax)라 하고 이 값은 DTMF 신호가 아닌것으로 판단하고 (4d)단계를 수행한다.
상기 (4d)단계에서는 모든 R(k), C(k)에 대해 다른 임계치(R-min-no-tone, C-min-no-tone)과 비교해서 이값 이상인 주파수가 2개 이상 존재하지 않을 경우 DTMF신호라 판단하고 상기 주파수가 2개 이상 존재할 경우에 DTMF가 아니라고 판단하고 (4e)단계를 수행한다. 상기 (4e)단계에서는 트위스트(Twistests)가 되어야 하는데 상기 트위스트(Twistests)는 하나의 DTMF 디지트(digit)에 대해 로우주파수(row frequency)와 컬럼주파수(column frequency)에서의 스팩트럼(spectrum) 크기의 차가 포워드트위스트(forword twist)는 4㏈ 이하, 리버스 트위스트(reverse twist)는 8㏈ 이상이어야 한다. 이 조건을 만족해야 한다. 그리고 (4f)단계에서 2번째 하모닉스(harmonics)에 대한 값의 크기를 비교한다. 마찬가지로 DFT를 사용하여 해당 주파수에서 크기를 구한다. 즉, R2(Krmax), C2(Kcmax)를 구한 후 |R(Krmax) - R2(Krmax)| max-2nd-harm, |C(Kcmax) - C2(Kcmax)| max-2nd-harm 이어야 DTMF의 후보로 인식한다.
호출진행 톤(Call Progress Tone)은 DTMF와 마찬가지로 하기 표2와 같은 두개의 주파수의 합신호로 발생된다. 그러나 DTMF의 신호 주파수와는 다르게 톤에서는 두 주파수의 차가 적기 때문에 제6도와 같은 방법으로 검출된다.
(5a)단계에서 120㎐ 이하에서 또는 1600㎐ 이상에서의 스펙트럼(spectrum)의 크기가 40㏈이상 인가 판단한다. 이때 40㏈ 이상이면 (5e)단계에서 호출톤(call Tone)이 아니라고 결정하고 (5b)단계를 수행한다.
상기 (5b)단계에서는 DTMF와 마찬가지로 최대 크기를 갖는 로우(row)와 컬럼(column) 주파수를 찾는다.
그리고 (5c)단계에서 해당 주파수와 하기 표2에서 보인 카덴스(cadence)로 부터 호출톤 디코딩(Call Tone Decoding)을 하고 (5d)단계에서 디코드톤을 검출한다.
그리고 제1도의 음성분석부(101)에서 분석된 음성 및 톤검출부(102)에서 검출된 톤신호의 분석 파라메타들은 8 kbps로 전송토록 양자화부(103)에서 양자화하기 위해 상기 음성분석부(101)와 톤검출부(102)에서 얻어진 전송 파라메타 - 진폭 (AMP), 피치(T), 10차 LSP 계수의 코싸인(cosine)을 위한 값(cos ω1), 유/무성음 플래그(V/U), DTMF-로 부터 8 kbps의 전송을 위해 80bits를 만든다.
상기 양자화부(103)에서 양자화하는 동작을 보면 상기 진폭은 음성분석시 입력 음성이 선형 14bit 이므로 구해진 진폭은 최대 13bit가 된다. 진폭은 CCITT 권고안 G.711에 의해 μ-law 7bit로 변환한다.
상기 피치는 유성음인 경우의 피치는 20 ~ 146의 범위로 분석된다. 피치는 7bit로 양자화 하면 충분하다. 즉 양자화 된 값은 QT = T - 19이 되며 유/무성음을 구별하는 플래그인 V/U는 1bit로 할당한다.
그리고 상기 LSP 계수의 존재 범위는 0 ~ 4㎑이고 LSP 합성 필터에서는 ω1보다는 cosω1을 사용한다. 따라서 ω1를 전송하는데 비해 본 발명의 보코더(vocoder)에서는 cosω1를 양자화함으로써 엔코더(encoder)와 디코더(decoder)에서 cos (ㆍ)나 cos(ㆍ)의 연산을 피함으로서 계산량을 줄인다. 양자화 레벨(level)은 64로 각 ω1당 6bits 씩 할당한다. 양자화 방법은 주파수 전범위에 대해 하기 식 (2)에서와 같이 로그 스케일(log scale)로 레벨(level)의 중간값을 구한후 제일 가까운 레벨(level)을 찾아 bit를 할당한다.
이값에 cosine을 취하면 △k = cos(△ㆍπ/4000) (k = 0,....,127)
기호로는 C1로 표기한다. 이 C1(i = 1,....,10)는 C1을 제외한 나머지 9개에 대해서는 그 차로 양자화 된다. 즉, 하기 식(3)과 같다.
DTMF와 정상 호출 진행톤(Normal Call Progress Tone)의 양자화를 보면 DTMF와 Tone에 대해서는 6bit를 할당한다. 하기 표(3)은 각각의 DTMF의 디지트(digit)와 톤(tone)에 대한 코드(code)를 보여준다.
DF5 는 DF4 ~ DF0에 대해 우수 캐패시터(even parity)로 할당된다.
이상에서 설명한 각 파라메타에 대한 bit 할당은 다음과 같다.
상기 양자화부(103)에서 양자화를 한후 패킷화부(104)에서는 양자화된 파라메타들을 전송하기 위해 80bit로 패킷화를 한다. 상기 패킷화부(104)에서 패킷화하는 동작을 보면 전술한 68bits는 3가지 데이타 형태(data type)로 분류된다. Type I의 12bits로 부터 19bits의 CRC(Cyclic Redundancy Check) 코드(code)를 만들고 ((19,12) code), type II에 대해서는 (15,10) 코드 code를 생성한다. 표4은 각 파라메타에 대한 코드(code) 분류를 보여준다.
상기 표(3)의 Type I에 대한 (19,12) 코드(code)의 생성 다항식(polynomial)은 하기 식(4)와 같다.
또한 type II의 생성 다항식(generator polynomial)은 하기식(5) 같이 주어진다.
그리고 (19,12) CRC코드와 (15,10)CRC코드, (code)의 생성 매트릭스(generator matrix)를 보여 준다.
이때 상기 패킷화된 80비트에 대한 데이타는 제6와 같은 전송 비트맵 형태로 출력 버퍼에 저장되며 제2도의 하이웨이 인터페이스(54) 및 트렁크(55)를 통해 8kbps로 전송된다. 상기 트렁크(55)에서 전송된 8kbps 데이타는 하이웨이 인터페이스(57)을 통해 언패킷화부(201)로 인가된다.
상기 패킷화부(104)에서 전송된 상기 제7도와 같은 전송데이타는 언패킷화부(201)에서 진폭, 피치, 무유성/유음성, DTMF정보 LSP계수값을 분리해 낸다. 또한 3가지 데이타 형태에 따른 CRC 코드를 다시 생성하고 전송된 CRC와 그 차이를 비교한다. 이때 DTMF인 경우는 역양자화(dequantization)의 필요없이 싸인파 발생기(sine wave generator)에 의해 해당 신호를 만들어 낸다. CRC코드(code)에 에러(error)가 생긴 경우는 그 에러(error)의 형태에 따라 처리를 행한다.
상기 언패킷화부(201)에서 분리 처리된 신호는 역양자화부(202)에 인가된다.
상기 역양자화 과정에서 진폭은 역연산에 해당하는 기능(operation)으로 CCITT 권고안 G.711에 의해 μ-law to 리니어(linear) 변환을 하여 13bits를 만든다.
그리고 피치 T6 ~ T0의 7bits 데이터에서 대해 19를 더하여 피치를 복원한다. 즉, T + QT + 19가 된다.
그리고 DTMF와 정상호출 진행톤(Normal Call Progress Tone)은 전송된 패킷 중 해당하는 6bits를 얻어 내어 30(16진수)이 아닌 경우는 하기 표5를 이용하여 해당 디지트(digit)를 알아 낸다. 이 경우 다음에 설명할 DTMF와 정상호출 진행톤(normal call progress tone) 생성부에서 80샘플(samples)을 만든다.
상기 역양자화부(202)에서 역양자화를 거친 신호가 톤(Tone)인가 음성인가를 결정한 후(Tone)이면 톤(Tone) 신호를 생성하고 음성이면 음성부호화 할 때의 양자화 전의 파라메타와 같은 값으로 복원한다.
그런데 상기 역양자화부(202)에서 역양자화된 신호가 톤신호이면 톤생성부(204)에서 DTMF와 정상 호출진행톤(Normal Call Progress Tone) 생성한다.
이때 톤생성은 DTMF나 NCPT로 분석되어 전송되어온 경우는 DTMF와 NCPT에 대해 각각 표 1과 표 2를 이용해서 2개의 주파수를 찾는다. 그리고나서 그 주파수에 해당하는 싸인(sine) 함수를 호출(call)하여 합해 줌으로서 톤 신호를 생성한다.
그러나 상기 역양자화부(202)에서 역양자화된 신호가 음성신호이면 음성합성부(203)에서 음성합성하여 제2도의 가입자 인터페이스(60)를 통해 가입자라인으로 수신된다. 상기 음성합성부(203)에서 음성합성을 위해 전송된 LSP계수는 음성 발생의 성도 모델을 표현하며 진폭(amplitude)과 피치(pitch) 그리고 유/무성음 bit는 성도에 대한 음원을 나타낸다.
상기 유/무성음에 따라 음원으로 피치주기에 맞는 펄스와 랜덤 노이즈로 각각 모델링되며 여기에 진폭(amplitude)에 곱해져 음원으로 사용된다. 상기 음원은 식 (6)과 같은 합성필터를 거쳐 합성음을 만들어 낸다.
여기서 P = 10이다.
상기 식(6)의 합성 필터를 도식화 하면 제7도와 같다. 본 코덱(codec)에서는 10㎳ 당 80 샘플(sample)의 음성신호를 만든다.
실제의 음성 합성시에는 각각 10㎳마다 만들어 지는 합성음성에서의 연속성과 합성필터의 제로 입력 응답(zero input response)을 제거하기 위해 LSP 합성 파라메타와 진폭(amplitude)는 그 전 10㎳ 프레임(frame)과 보간하여 사용되어야 하며 여기서 보간 방법은 선형 보간을 따랐다. 즉 각 LSP 계수에 대해 변화하는 양을 먼저 구한후 각 샘플포인트(sample point)마다 그 차이를 더하여 사용한다.
여기서 t는 현재의 fram을, t-1은 전 프레임(frame)을 나타낸다. 각 샘플(sample)에 대해 새로운 Ci는 하기식 8과 같다.
이와같이 복원된 파라메타로는 LSP 파라메타 10차, 피치(pitch), 진폭(amplitude)이 있으며, 음성합성기가 복원된 파라메타들로 부터 음성신호를 생성하여 제1도의 ADSP 2102의 시리얼포트(SPORT1)으로 출력한다. 음성신호 내용은 시리얼포트(SPORT1)Tx 인터럽트에 의하여 64 kbps로 전송된다.
전송되기전에 리니어(linear) PCM은 μ-law(혹은 A-law) PCM으로 변형한다.
상술한 바와같이 음성전송 시스템에 있어서 채널당 전송률을 감소시켜 새로운 트렁크 증설없이 트렁크당 채널수를 증가시킬 수 있으며 채널 사용료를 줄일 수 있는 이점이 있다.

Claims (3)

  1. 음성전송 시스템의 LSP 보코더에 있어서, 64 kbps의 μ-law PCM 신호를 8 kbps 이하의 데이타로 압축하는 부호화부(100)와, 상기 부호화기(100)에서 압축된 8 kbps 이하의 데이타를 64 kbps의 μ-law신호로 신장하는 복호화부(200)로 구성함을 특징으로 하는 음성전송 시스템의 LSP 보코더.
  2. 제1항에 있어서, 상기 부호화부(100)는 64 kbps μ-law PCM신호부터 LSP 계수 피치, 유/무성을 판별, 프레임의 평균진폭을 계산하여 음성을 분석하는 음성분석부(101)와, 상기 64kbps μ-law PCM신호로 부터 DTMF 또는 호출진행 톤신호의 종류를 검출하는 톤검출부(102)와, 상기 음성분석부(101)에서 계산된 진폭, 피치, LSP계수, 유/무성음 플래그와 상기 톤검출부(102)에서 판별된 DTMF 또는 호출진행 톤 신호를 80비트로 만들어 양자화 하는 양자화부(103)와, 상기 양자화부(103)에서 양자화된 신호를 3가지 형태의 코드로 분류하여 각각 CRC 코드를 만들어 패킷화를 하는 패킷화부(104)로 구성함을 특징으로 하는 음성전송 시스템의 LSP 보코더.
  3. 제1항에 있어서, 상기 복호화부(200)는 상기 패킷화부(104)에서 패킷화된 신호를 입력하여 진폭, 피치, DTMF정보, LSP계수를 분리한후 3가지 데이타 형태에 따른 CRC 코드를 생성한다음 2차값을 비교하여 패킷을 풀기 위한 언패킷화부(201)와, 상기 언패킷화부(201)에서 언패킷화된 신호를 입력하여 진폭, 피치 LSP계수, DTMF 또는 호출진행 톤 신호를 역양자화하는 역양자화부(202)와, 상기 역양자화부(202)에서 역양자화된 음성신호를 입력하여 유/무성음에 따라 음원이 피치 주기에 맞는 펄스와 랜덤 노이즈로 각각 모델링되며 여기에 진폭을 곱하여 음원으로 사용되고 상기 음원에 의해 음성합성을 생성하는 음성 합성부(203)와, 상기 역양자화부(202)에서 역양자화된 톤신호를 입력하여 DTMF나 호출 진행 톤으로 분석되어진 해당 주파수를 찾아 상기 주파수에 해당하는 싸인 함수를 호출하여 톤신호를 생성하는 톤생성부(204)로 구성함을 특징으로 하는 음성전송 시스템의 LSP 보코더.
KR1019920009166A 1992-05-28 1992-05-28 Lsp 보코더 KR0175248B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019920009166A KR0175248B1 (ko) 1992-05-28 1992-05-28 Lsp 보코더

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019920009166A KR0175248B1 (ko) 1992-05-28 1992-05-28 Lsp 보코더

Publications (2)

Publication Number Publication Date
KR930024408A KR930024408A (ko) 1993-12-22
KR0175248B1 true KR0175248B1 (ko) 1999-04-01

Family

ID=19333772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019920009166A KR0175248B1 (ko) 1992-05-28 1992-05-28 Lsp 보코더

Country Status (1)

Country Link
KR (1) KR0175248B1 (ko)

Also Published As

Publication number Publication date
KR930024408A (ko) 1993-12-22

Similar Documents

Publication Publication Date Title
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
EP1204969B1 (en) Spectral magnitude quantization for a speech coder
EP1222659B1 (en) Lpc-harmonic vocoder with superframe structure
US4672669A (en) Voice activity detection process and means for implementing said process
US7496505B2 (en) Variable rate speech coding
EP0523979A2 (en) Low bit rate vocoder means and method
KR100798668B1 (ko) 무성 음성의 코딩 방법 및 장치
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
US6397175B1 (en) Method and apparatus for subsampling phase spectrum information
JP2006171751A (ja) 音声符号化装置及び方法
KR0175248B1 (ko) Lsp 보코더
KR20040050811A (ko) 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기
KR0175250B1 (ko) 보코더의 톤 검출회로 및 방법
Boyd Speech coding for telecommunications
Markovic Speech compression-recent advances and standardization
CN109215670B (zh) 音频数据的传输方法、装置、计算机设备和存储介质
Drygajilo Speech Coding Techniques and Standards
JP3330178B2 (ja) 音声符号化装置および音声復号化装置
WO2009022884A1 (en) Apparatus and method for encoding and decoding enhancement layer
Hayashi et al. 8 kbit/s short and medium delay speech codecs based on CELP coding
Goldberg 2400/16,000 Bps Multirate voice processor
Cox 2000 CRC Press LLC.< http://www. engnetbase. com>.
Edwards Advanced signal processing techniques for pitch synchronous sinusoidal speech coders
Dimolitsas Speech Coding
KR20070063729A (ko) 음성 부호화장치, 음성 부호화 방법, 이를 이용한 이동통신단말기

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111028

Year of fee payment: 14

EXPY Expiration of term