KR940008741B1 - 음성부호/복호화 방법 - Google Patents

음성부호/복호화 방법 Download PDF

Info

Publication number
KR940008741B1
KR940008741B1 KR1019900021954A KR900021954A KR940008741B1 KR 940008741 B1 KR940008741 B1 KR 940008741B1 KR 1019900021954 A KR1019900021954 A KR 1019900021954A KR 900021954 A KR900021954 A KR 900021954A KR 940008741 B1 KR940008741 B1 KR 940008741B1
Authority
KR
South Korea
Prior art keywords
coefficient
data
signal
sub
restoring
Prior art date
Application number
KR1019900021954A
Other languages
English (en)
Other versions
KR920013943A (ko
Inventor
백준엽
Original Assignee
삼성전자 주식회사
정용문
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사, 정용문 filed Critical 삼성전자 주식회사
Priority to KR1019900021954A priority Critical patent/KR940008741B1/ko
Publication of KR920013943A publication Critical patent/KR920013943A/ko
Application granted granted Critical
Publication of KR940008741B1 publication Critical patent/KR940008741B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

내용 없음.

Description

음성부호/복호화 방법
제1도는 본 발명에 의한 음성부호/복호화 방법을 수행하는 장치의 구성도.
제2도는 제1도에 따른 음성부호화 방법의 흐름도.
제3도는 제1도에 따른 음성복호화 방법의 흐름도.
* 도면의 주요부분에 대한 부호의 설명
10 : 마이크 20 : 아날로그증폭기
30 : PCM부/복호기 40 : 디지틀신호처리부
50 : 오디오증폭기 60 : 스피커
본 발명은 음성부호/복호화 방법에 관한 것으로, 특허 9.6kbps 데이타 전송율을 갖는 유선전화기 모뎀에 있어서 RPE-LTP(Regular Pulse Excitation-Long Term Prediction-Linear Predictive Coder)에 위해서 디지틀화 된 음성신호정보를 송수신하기 위한 음성부호/복호화 방법에 관한 것이다.
현재 사용중에 있는 유ㆍ무선 전화기는 아날로그방식으로 음성신호가 처리되기 때문에 전송도중에 도청될 우려가 있으며 비화기(Security phone)를 사용한 전화기도비화하는 일정한 법칙을 알면 도청이 가능하다는 문제점이 있었다.
따라서 본 발명은 상기 문제점을 해결하기 위하여 창출한 것으로서 디지틀신호 처리기술을 이용하여전송 음성 데이타의 합성 및 복원에 필요한 계수 및 압축음성데이타를 추출한 뒤 부호화하여 전송하고 수신시 부호화되는 과정의 역순으로 복호화하여 전송 도중에 도청될 우려가 없는 음성부호/복호화 방법을 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위하여 본 발명에 의한 음성부호화 방법은, 소정속도의 음성데이타를 블록화하여 오프셋을 보상하고 이 오프셋 보상된 데이타의 에너지를 증감하여 계수를 양자화하는 과정과, 상기 과정을 수행하고나서 샘플링된 데이타를 자기상관 처리하여 예측필터의 극점을 추출하여 일정 반사계수를 구하는 과정과, 상기 반사계수를 구하는 과정을 수행한 후에 추출된 계수를 복원하여 축소항 분석계수로 하여 샘플링 데이타를 필터링하는 과정과, 상기 필터링과정에서 발생한 잔차신호를 부블럭으로 세스멘트하여 연산하고 확대항을 예측하여 계수연산 및 부호화 처리하는 과정과, 상기 부호화 처리과정에서 생긴 오차에 대한 음폐효과를 얻기 위하여 디엠파시스하여 가중처리하고 최대 에너지를 갖는 펄스열을 선택하여 그리드계수를 구하는 과정과, 상기 그리드계수를 구하는 과정을 수행하고 나서 그리드계수의 펄스열을 양자화하고 역변환하여 그리드위치를 선정하고 확대항을 예측하는 과정으로 복귀하는 과정과, 상기 과정들을 반복처리하여 소정 부블럭 횟수에 도달하면 추출된 데이타의 전송비트를 순서열로 전송하고 인터럽트신호를 기다리는 과정으로 이루어진 것을 특징으로 하며, 본 발명에 의한 음속복호화 방법은 수신된 데이타와 그 데이타에 따른 각 계수들 및 부열을 분해하여 메모리에 저장하는 과정과, 상기 과정을 수행한 후에 부열을 역변환하여 정규펄스열을 만들고 그리드 위치값을 재구성하여 부블럭을 만드는 과정과, 상기 부블럭을 만드는 과정에서 재구성된 확대항 잔차신호를 축소항 잔차신호들로 만드는 과정과, 상기 축소항 잔차신호를 만드는 과정을 수행한 후에 부블럭을 만드는 과정으로 복귀하여 소정회수 반복수행하고 계수들을 복원하는 과정과, 상기 계수복원과정에서 계산된 합성필터계수를 통하여 복원된 샘플신호를 필터링하여 합성음성을 복원하는 과정과, 상기 합성은성을 복원하는 과정을 수행한 후에 합성된 음성데이타를 출력하고 인터럽트신호의 유무에 따라 메모리에 저장하는 과정으로 복귀하거나 역변환시켜 아날로그데이타의 전송바트를 순서열로 정리하여 전송하고 인터럽트 신호를 기다리는 과정으로 이루어진 것을 특정으로 한다.
이하 첨부한 도면을 참조하여 본 발명을 상세하게 기술하기로 한다.
제1도는 본 발명에 의한 음성부호/복호화 방법을 수행하는 장치의 구성도이다.
제1도에 의하면, 음성정보를 송신할때 송화자의 아날로그 음성신호는 마이크(10)를 통하여 입력되어 아날로그증폭기(20)를 거치게 된다. 이때 아날로그증폭기(20)는 입력신호레벨이 증폭되지만 최대신호 크기가 왜곡이 되지 않도록 조정하는 것이 가능하다. 아날로그증폭기(20)를 거친 음성신호는 PCM부/복호기(30)에서 아날로그 음성신호를 로그(Logarithm) 코딩방식으로 8kHz 샘플링주파수 및 64Kbps 비트율로 음성신호를 양자화시킨다. 디지틀신호부(40)는 PCM부/복호기(30)에서 출력된 음성데이타를 받아 RPE-LTP방식의 9.6Kbps 음성부호 신호를 추출하여 하기 <표>에 도시된 순서대로 모뎀에 전송된다.
[표]
서브-프레임 No. 1
서브-프레임 No. 2
서브-프레임 No. 3
서브-프레임 No. 4
제1도의 디지틀신호처리부(40)는 RPE-LTP부호화 과정을 소프트웨어(Software)로 처리하며, 수신시에는 이 디지틀신호처리부(40)에서 수신저장된 데이타들을 분해하여 다시 합성음성으로 복원한다. 복원된 음성데이타는 PCM부/복호기(30)로 전송되어 역변환 로그코팅상태에서 오디오증폭기(50)로 출력된다. 오디오증폭기(50)는 스피커(60)의 출력신호레벨에 맞도록 레벨크기를 조정하여 신호의 왜곡을 방지한다.
제2도는 RPE-LTP방식의 9.6Kbps 음성부호신호를 추출하여 압축하는 과정을 나타내는 음성부호화 방법의 흐름도이다.
제2도에 의하면 PCM부/복호기(30)는 아날로그 음성신호를 로그(Logarithm) 코딩방식으로 8kHz 샘플링 주파수 및 64Kbps 비트율로 음성신호를 양자화한다(1단계), 제1단계를 수행한 후에 디지틀신호처리부(40)는 PCM부/복호기(30)에서 처리된 640Kbps의 음성데이타를 20ms단위로 매 160개 샘플데이타를 받아서 처리한다(2단계), 이때 20ms의 160개 샘플을 받아 처리하는 동안에 디지틀신호처리부(40)는 계속 음성 데이타를 저장하고 있으며 160개 샘플이 모두 저장되면 인터랩트(interrupt)를 걸어 저장된 샘플데이타를 받아 들여 처리한다.
상기 제2단계를 수행하고 나서 입력신호레벨에 실려 있는 DC바이어스 성분을 제거하기 위하여 하기 <식1>을 시뮬레이션(Simulation)한 1차 FIR(Finite Impulse Response Function) 고역통과 여파기를 통과시켜 오프셋을 보상한다(3단계).
Sof(K)=S0(K)-S0(K-1)+αSof(K-1)………………………………<식1>
(α=32735×2-15, S0(K)는 PCM부/복호기(30)의 출력신호)
한편 제4단계의 프리엠파시스(Pre-emplhasis) 루틴은 저주파 대역에서 Sof의 에너지를 6dB/액티브 만큼 감소시키고 고주파대역에서는 증가시키는 역할을 함으로써 스펙트럼의 다이내믹 레인지(Dynamic Range)가 감소하게 되어 LPC(Linear Prediction Coding) 계수를 부호화함에 있어 보다 정확하게 양자화 할 수 있는 기능을 갖고 있다.
하기 <식2>는 프리엠파시스식이다.
S(K)=Sof(K)-βSof(K-1)……………………………………………<식2>
(β=28180×2-15)
상기 제4단계를 수행하고나서 제5단계의 LPC분석부는 다음과 같은 동작연산을 수행한다. 먼저 20ms당 160개 샘플을 가지고 자기상관(Auto correlation) 처리하여 예츠필터의 극점(pole)을 추출하는데, 이 예측필터는 인간의 성도와 같은 포먼트(Formmat)를 나타내는 것이다.
하기 <식3>은 자기상관처리식이다.
……………………………………………………………<식3>
(K=0,1,2,…,10. *는 콘볼루션(Convolution) 연산자이다)
상기 <식3>에서 구한 계수 11개는 "Schur Recursion" 알고리즘을 통하여 반사계수를 구하는데(6단계), 이 반사계수를 구하는 이유는 예측계수보다는 반사계수를 전송할때 비트수를 감소시킬 수 있으며 합성필터의 안정도를 쉽게 따질 수 있는 장점이 있는 바, 10개의 반사계수를 구한 다음 반사계수{ri} 가 -1≤ri≤+1사이에 존재하도록 하여 양자화를 수행한다.
양자화방식은 "로그지역비(Log-Area Ratio)"이고, 그 근사식은 하기 <식4>에 나타나 있다.
r(i) ; │r(i)│<0.675
LAR(i)= Sing[r(i)]×[2│r(i)│-0.675] ; 0.675≤│r(i)│<0.950………………………………………………………………………………………………<식4>
Sing[r(i)]×[8│r(i)│-6.375] ; 0.950≤│r(i)│≤1.000
상기 <식4>를 통하여 구해진 LAR(i)는 다른 다이내믹 레인지와 비대칭적인 분포를 가지고 있으며, LAR(i)를 양자화하여 LARc(i)를 추출한다. 제7단계의 축소항 분석필터링 루틴은 제5단계의 LPC 분석부에서 추출된 계수인 LAR(i)를 보간법(interpolation)을 통하여 복원한 다음 축소항 분석필터의 계수로 하여 메모리에 저장된 S(K)신호를 필터링한다. 제7단계의 루틴에서 출력되는 축소항 잔차신호는 확대항 예측부에 입력되어(13단계) 지연계수와 이득계수를 추출하는데(14단계) 그 연산과정은 다음과 같다. 제8단계의 부블럭화 과정은 제7단계에서 수행된 축소항 잔차신호를 5ms의 부블럭으로 세크먼트하는 바, 4개의 40개 샘플로 구성된 부블럭은 하나씩 연산되어진다(9, 10단계). 제13단계의 확대항 예측부에서 LTP 계수연산 및 부호화 처리를 행하는데, 각 부블럭에 해당하는 상관지연계수(Nj)과 이득계수(bj)는 축소항잔차신호 d(Kj+i)(i=0,1,2,…, 39)의 현재 구성제어부블럭과 축소항전차신호 d'(Kj+)의 이전샘플과의 교차상관(Cross-Correlation)을 연산한다.
하기 <식 5>는 그연산식이다.
상기 <식 5>에서 구한 81개의 Rj값중 최대치의 위치를 찾음으로서 지연계수(Nj)를 구한다.
Rj(Nj)=Max{Rj(r) : =40,…, 120}…………………………………<식 6>
상기 <식 6>에서 구해진 Nj를 통하여 이득계수 bj의 연산은 하기 <식 7,8>과 같다.
bj= Rj(Nj)/Sj(Nj)………………………………………………………<식 7>
j=0,…,3
여기에서…………………………………<식 8>
상기 <식 8>을 구하고 난뒤 <식 6>에서 구한 Rj(Nj)를 <식 8>의 결과값으로 나누면 bj를 구할 수 있다. 이와 같이 구해진 지연계수(Nj)는 40에서 120사이의 값을 가지므로써 7비트로 부호화되며 이득계수는 2비트로 부호화된다.
제15단계의 가중처리 필터링부는 오차스펙트럼에서 생긴 오차에 대한 옴페효과를 얻기 위한 포먼트(Formant) 영역을 디엠파시스(Demphsis)하는 부분으로 일반식으로 하기 <식 9>와 같다.
αk: 예측계수, P : 필터의 차수
상기 <식 9>에서 r는 0.8~0.9 사이의 값으로 본 발명에서는 0.8로 정하였다. 상기 제15단계의 루틴을 통과한 신호X(K)는 하기 <식 10>과 같다.
K =0,…,39e(K) : 확대항 예측부의 출력신호
제16단계의 RPE 그리드선택부에서는 X(K)신호중 정규펄스열을 구하는데 최대에너지를 가진 열을 선택하는 바,
상기 <식 11>를 이용하여 정규펄스열을 만들고, 상기 <식 12>에서는 정규펄스열중 최대 에너지를 가진 열을 구하여 그리드계수(M)를 구한다(17단계). 즉 가중처리필터링된 신호(X)는 6의 비율로 샘플율을 낮추어 길이 6인 데시메이션(Decimation)된 열을 만든다. 6개의 데시메이션된 열의 평균제곱 에러판정으로 가장 큰 에너지를 가진 정규 펄스열을 선택하여 그리드계수(M)를 선택한다.
한편, 제18단계의 APCM양자화 루틴은 XM의 6개 정규펄스신호를 APCM양자화하여 부열을 추출한다(19단계).
제20,21단계의 루틴은 양자화된 Xmc신호를 역변화하고 다시 RPE그리드위치를 선정을 하여 40개 샘플의 확대항 잔차신호를 구성한다(22단계). 제22단계를 수행한 후에 제10단계로 복귀하여 상기 과정들을 반복 처리한다. 이때 반복처리되는 횟수(N)는 4번으로, 이 4번이 모두 처리되면 추출된 데이타를 상기 <표>에 입각하여 전송비트의 순서열로 정리하여 전송하고 다시 인터럽트신호를 기다린다(11단계). 제11단계에서 인터럽신호가 전송되면 제2단계로 복귀하고 인터럽트신호가 전송되지 않으면 제12단계를 수행한다.
제6, 14, 17, 19단계에서 추출된 LPC계수, 지연계수, 이득계수, 그리드계수, 그리고 부열은 제23단계의 전송비트순서 정리부를 거쳐 모뎀으로 전송된다.
제3도는 수신기쪽에서 수신된 음성데이타를 분해하여 합성음성신호로 변환시키는 음성복호화 방법의 흐름도인 바, 제1단계는 수신된 데이타로 20ms당 192비트로 메모리에 저장하는 단계이다.
제1단계를 수행한 후에 전송된 각 계수들과 Xm부열을 분해하여 음성신호 합성을 위하여 각각의 메모리 영역에 wo저장되도록 디멀티플렉싱시킨다(2단계). 제5단계의 루틴는 Xmc부열신호를 역변환 APCM하여 Xm신호로 복원시킨다. 또한 제6단계의 루틴에서는 RPE 그리드위치(M)값에 의해서 "0"이 삽입되어 40개 샘플로 재구성된 부블럭이 만들어진다. 제6단계에서 재구성된 확대항 잔차신호(e')는 제7단계에서 확대항 합성필터를 거치고 축소항 합성기를 위하여 재구성된 축소항 잔차신호(dr')를 만든다. 제5단계에서는 인버스 APCM부는 지연, 이득계수에 의한 LTP디코딩루틴인 제7단계를 4회 반복하고 나서 LPC계수를 복원시킨다(9단계). 제9단계에서는 수신된 LARc(i)계수를 LAR(i)로 전환한 뒤 다시 예측계수로 역변환하여 메모리에 저장시켜 놓는다. 이때 역변환식은 <식 4>의 역변환이다.
제10단계에서는 제9단계에서 계산된 합성필터계수를 통하여 구성된 합성필터는 제5, 6, 7단계의 루틴을 거쳐 복원된 160개 샘플을 통과시켜 합성음성을 복원한다. 이 합성음성신호는 디엠파시스필터를 거치는데 (11단계), 하기 <식 13>과 같다.
Sr0(K)=Sr(K)+βSr0(K-1)………………………………………<식13>
β=28180×12-15, Sr(K) ; 디엠파시스필터의 입력신호
상기 <식 13>에서 합성된 16개의 음성데이타는 출력하여(12단계) PCM부/복호기(30)로 전송되고 다시 인터럽트신호를 기다린다(13단계).
제13단계에서 인터럽트신호가 전송되면 제2단계로 복귀하고 인터럽트신호가 전송되지 않으면 PCM부/복호기(30)로 전송되어(14단계) PCM역변환과정을 수행한 다음 아날로그음성신호로 변환된다.
상술한 바와 같이 본 발명은 기존의 유선모뎀을 사용하여 RPE-LTP에 의해서 디지틀화된 음성정보를 송ㆍ수신함으로써 전화통화자간의 비밀을 유지할 수 있으며 수신음질을 향상시킬 수 있는 이점이 있다.

Claims (2)

  1. 소정속도의 음성데이타를 블록화하여 오프셋을 보상하고 이 오프셋 보상된 데이타의 에너지를 증감하여 계수를 양자화하는 과정과, 상기 과정을 수행하고 나서 샘플링된 데이타를 자기상관 처리하여 예측필터의 극점을 추출하여 일정 반사계수를 구하는 과정과, 상기 반사계수를 구하는 과정을 수행한 후에 추출된 계수를 복원하여 축소항 분석계수로 하여 샘플링테이타를 필터링 하는 과정과, 상기 필터링과정에서 발생한 전차신호를 부블럭으로 세크먼트하여 연산하고 확대항을 예측하여 계수연산 및 부호화 처리하는 과정과, 상기 부호화 처리과정에서 생긴 오차에 대한 음폐효과를 얻기 위하여 디엠파시스하여 가중처리하고 최대 에너지를 갖는 펄스열을 선택하여 그리드계수를 구하는 과정과, 상기 그리드계수를 구하는 과정을 수행하고 나서 그리드계수의 펄스열을 양자화하고 역변환하여 그리드위치를 선정하고 확대항을 예측하는 과정으로 복귀하는 과정과, 상기 과정들을 반복처리하여 소정 부블럭 횟수에 도달하면 추출된 데이타의 전송비트를 순서열로 정리하여 전송하여 인터럽트신호를 기다리는 과정으로 이루어진 것을 특징으로 하는 음성부호화 방법.
  2. 수신된 데이타와 그 데이타에 따라 각 계수들 및 부열을 분해하여 메모리에 저장하는 과정과, 상기 과정을 수행한 후에 부열을 역변화하여 정규펄스열을 만들고 그리드 위치값을 재구성하여 부블럭을 만드는 과정과, 상기 부블럭을 만드는 과정에서 재구성된 확대항 잔차신호를 축소항 잔차신호들로 만드는 과정과, 상기 축소항 전차신호를 만드는 과정을 수행한 후에 부블럭을 만드는 과정으로 복귀하여 소정횟수 반복수행하고 계수들을 복원하는 과정과, 상기 계수복원과정에서 계산된 합성필터계수를 통하여 복원된 샘플신호를 필터링하여 삽성음성을 복원하는 과정과, 상기 합성음성을 복원하는 과정을 수행한 후에 합성된 음성데이타를 출력하고 인터럽트신호의 유무에 따라 메모리에 저장하는 과정으로 복귀하거나 역변환시켜 아날로그 데이타의 전송비트를 순서열로 정리하여 전송하고 인터럽트신호를 기다리는 과정으로 이루어진 것을 특징으로 하는 음성복호화 방법.
KR1019900021954A 1990-12-27 1990-12-27 음성부호/복호화 방법 KR940008741B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019900021954A KR940008741B1 (ko) 1990-12-27 1990-12-27 음성부호/복호화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019900021954A KR940008741B1 (ko) 1990-12-27 1990-12-27 음성부호/복호화 방법

Publications (2)

Publication Number Publication Date
KR920013943A KR920013943A (ko) 1992-07-30
KR940008741B1 true KR940008741B1 (ko) 1994-09-26

Family

ID=19308590

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019900021954A KR940008741B1 (ko) 1990-12-27 1990-12-27 음성부호/복호화 방법

Country Status (1)

Country Link
KR (1) KR940008741B1 (ko)

Also Published As

Publication number Publication date
KR920013943A (ko) 1992-07-30

Similar Documents

Publication Publication Date Title
RU2214048C2 (ru) Способ кодирования речи (варианты), кодирующее и декодирующее устройство
US4672670A (en) Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
JPS6161305B2 (ko)
EP2360682A1 (en) Audio packet loss concealment by transform interpolation
WO2001059757A2 (en) Method and apparatus for compression of speech encoded parameters
CN101006495A (zh) 语音编码装置、语音解码装置、通信装置以及语音编码方法
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
JPH04506574A (ja) 量子化されない適応変換ボイス信号を再構成する方法および装置
JPH09204199A (ja) 非活性音声の効率的符号化のための方法および装置
JP3144009B2 (ja) 音声符号復号化装置
CN1132327C (zh) 产生舒适噪声的设备和包括其部件的语音编解码器
CA2293165A1 (en) Method for transmitting data in wireless speech channels
WO2002023532A2 (en) System of dynamic pulse position tracks for pulse-like excitation in speech coding
US6141639A (en) Method and apparatus for coding of signals containing speech and background noise
KR940008741B1 (ko) 음성부호/복호화 방법
Bhatt Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4618823B2 (ja) 信号符号化装置及び方法
Talbi et al. New Speech Compression Technique based on Filter Bank Design and Psychoacoustic Model
Viswanathan et al. Baseband LPC coders for speech transmission over 9.6 kb/s noisy channels
Chittala et al. Speech Bandwidth Extension using DWT+ DCT steganography technique
JPH11145846A (ja) 信号圧縮伸張装置及び方法
KR100731300B1 (ko) 인터넷전화의 음악 음질 개선 시스템 및 그 방법
Bhatt et al. Proposed modification in ETSI GSM 06.10 full rate speech codec for high rate data hiding and its objective evaluation of performance using Simulink

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20020826

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee