KR100263296B1 - G.729 음성 부호화기를 위한 음성 활성도 측정 방법 - Google Patents

G.729 음성 부호화기를 위한 음성 활성도 측정 방법 Download PDF

Info

Publication number
KR100263296B1
KR100263296B1 KR1019970059520A KR19970059520A KR100263296B1 KR 100263296 B1 KR100263296 B1 KR 100263296B1 KR 1019970059520 A KR1019970059520 A KR 1019970059520A KR 19970059520 A KR19970059520 A KR 19970059520A KR 100263296 B1 KR100263296 B1 KR 100263296B1
Authority
KR
South Korea
Prior art keywords
rate
frame
voice
speech
transmission rate
Prior art date
Application number
KR1019970059520A
Other languages
English (en)
Inventor
최송인
강상원
김재원
정우성
한기철
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019970059520A priority Critical patent/KR100263296B1/ko
Application granted granted Critical
Publication of KR100263296B1 publication Critical patent/KR100263296B1/ko

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에 관한 것이다.
IMT-2000에 응용할 목적으로 표준화된 G.729는 8kbps의 전송 속도로 유선망에서의 음성 품질을 제공한다. 그러나 현재 개발된 CS-ACELP는 고정율 방식을 사용한 것으로, 이동통신 시스템의 음성 부호화기로 사용되기 위해서는 그에 적합한 가변율 알고리즘의 개발이 필수적이다.
따라서, 본 발명은 입력되는 음성 프레임들을 화자의 음성정보가 포함된 실음성 구간과 묵음 구간으로 구분하고 실음성 구간을 다시 유성음과 무성음으로 구분하여 각각을 8, 4, 1kbps의 전송률로 부호화한다. 또한, LPC 파라메터 추출 과정에서 얻어진 음성 프레임의 에너지를 몇 개의 적응 문턱값과 비교하여 음성의 활성도를 측정한 후 그에 상응하는 부전송률로 부호화할 것을 가정하고, 가정된 부전송률에 대하여 분석 과정에서 얻어진 각종 특성 파라메터들을 종합하여 음성학적 구분을 수행하며, 결정된 부전송률로 부호화할 경우 음성 끝단에서의 음질 저하 가능성을 최소화하기 위하여 SNR값과 가변 행오버 방식을 도입한다.

Description

G.729 음성 부호화기를 위한 음성 활성도 측정 방법
본 발명은 디지털 통신망에서 쓰이는 음성 부호화기의 하나인 G.729(CS-ACELP-Conjugate Structure Algebraic CELP)를 본래의 고정율 방식에서 가변율 음성 부호화기로 개발하는데 사용되는 음성 활성도 측정(Voice Activity Detection; VAD) 방법에 관한 것이다.
IMT-2000에 응용할 목적으로 표준화된 G.729는 8 kbps의 전송 속도로 유선망에서의 음성 품질(Toll quality)을 제공한다. 그러나 현재 개발된 CS-ACELP는 고정율 방식을 사용한 것으로, 이동통신 시스템의 음성 부호화기로 사용되기 위해서는 그에 적합한 가변율 알고리즘의 개발이 필수적이다.
따라서, 본 발명은 G.729에 적합한 가변율 음성 부호화기의 구현 과정으로서 입력 프레임마다 최적의 전송률 결정을 위한 음성 활성도 측정 방법을 제공하는데 그 목적이 있다.
상술한 목적을 달성하기 위한 본 발명은 선형 예측 계수 추출 과정에서 얻어진 음성 프레임 에너지 값을 몇 개의 적응 문턱값과 비교하여 음성의 활성도를 측정하고, 그에 상응하는 부전송률을 가정하는 제 1 단계와, 상기 제 1 단계에서 가정된 부전송률에 대하여 그 타당성을 검증하고 조정하기 위해 분석 과정에서 얻어진 각종 특성 파라메터들을 종합하여 음성학적 구분을 수행하는 제 2 단계와, 상기 제 1, 제 2 단계를 통해 결정된 부전송률로 부호화할 경우 음성 끝단에서의 음질 저하 가능성을 최소화하기 위하여 신호대 잡음비값과 특성 파라메터들에 근거한 가변 행오버 알고리즘을 실행하는 제 3 단계와, 상기 제 1, 제 2 및 제 3 단계에서 결정된 부전송률로 부호화할 경우 전송률 1에서 전송률 1/8로의 전환시 부음성 부호화기간의 본질적인 성능 차이에 의한 음질 저하 방지를 위해 전송률 1/2의 변환 구간을 두는 제 4 단계를 포함하여 이루어진 것을 특징으로 한다.
도 1은 본 발명에 따른 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에서 음성 프레임의 에너지 R(0)를 이용한 에너지 비교 방식을 설명하기 위한 흐름도.
도 2는 본 발명에 따른 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에서 분석 과정에서 얻어진 각종 특성 파라메터들을 종합하여 음성학적 구분을 수행하는 방법을 설명하기 위한 흐름도.
도 3은 본 발명에 따른 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에서 음성의 끝단에서 발생할 수 있는 음질의 저하를 방지하기 위한 가변 행오버(hangover) 구간 방법을 설명하기 위한 흐름도.
가변율 방식의 음성 부호화기를 위해서는 두가지 면에서의 설계가 수행되어야 한다. 첫째 전송률 결정을 위한 음성 활성도 측정 알고리즘의 개발이며, 둘째는 서로 다른 전송률을 갖는 부음성 부호화기의 설계이다. 본 발명은 언급된 두가지 연구 과제중 전자에 해당한다.
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명에 따른 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에서 음성 프레임의 에너지 R(0)를 몇 개의 적응 문턱값과 비교하여 음성의 활성도를 측정하고 상응하는 부전송률을 가정하는 에너지 비교 방법을 설명하기 위한 흐름도이다.
먼저, 본 방법은 선형 예측 계수(Linear Prediction Coefficients; LPC) 추출 과정에서 총 크기 240 샘플의 비대칭 창을 사용하여 얻어진 R(0)값을 이용한다. R(0)값과의 비교판단 기준으로 사용된 적응 문턱값 결정 함수는 변화하는 주변소음 레벨에 따라 각 전송률로의 결정을 위한 문턱값들을 적절하게 변화시키므로써 안정된 합성 음질과 평균 전송률을 실현할 수 있게 한다.
사용된 문턱값들은 [수학식 1]에 의해 구해진 주변소음 레벨값의 조합으로 얻어지며 각 프레임마다 적응적으로 변화한다.
B=min(R(0)prev,3794733,max(1.00547×Bprev,Bprev+1)
결정된 문턱값 결정 함수는 주변소음 레벨값 B를 네 개의 구간으로 나누고 각 구간에서 서로 다른 2차 곡선들을 사용한다. 주변소음 레벨값의 범위에 따라 적용되는 문턱값 결정함수는 [수학식 2] 내지 [수학식 5]와 같다.
Figure 1019970059520_B1_M0001
Figure 1019970059520_B1_M0002
Figure 1019970059520_B1_M0003
Figure 1019970059520_B1_M0004
도면에 관해 설명하면 다음과 같다. LPC 파라메터 추출과정에서 얻어진 R(0)를 주변소음 레벨값 B와 적응 문턱값 결정 함수들을 위해 부호화기 내에 저장한다(101). 저장된 음성 프레임의 에너지 R(0)와 과거 음성 프레임의 에너지 R(0) 값으로부터 주변소음 레벨값 B을 계산한다(102). 주변소음 레벨값 B의 범위 구분에 따른 서로다른 문턱값 결정 함수에 적용한다. 주변소음 레벨값 B의 경계 구간 {b1, b2, b3}는 문턱값 경계 함수를 산출하기 위해 사용된 {25000, 112251, 470000}에 각각 대응한다. 주변소음 레벨값 B가 b1보다 작을 경우(103), R(0)가 T11(B)보다 작은지를 검사한다(107). 검사 결과 R(0)가 T11(B)보다 작을 경우 묵음 구간으로 처리하여 1kbps의 전송률로 부호화하고, R(0)가 T11(B)보다 크거나 같을 경우 R(0)가 T12(B)보다 작은지를 검사한다(111). 검사 결과 R(0)가 T12(B)보다 작을 경우 무성음으로 구분하여 4kbps의 전송률로 부호화하고, R(0)가 T12(B)보다 크거나 같을 경우 유성음으로 구분하여 8kbps의 전송률로 부호화한다.
주변소음 레벨값 B가 b1보다 크거나 같고 b2보다 작을 경우(104), R(0)가 T21(B)보다 작은지를 검사한다(108). 검사 결과 R(0)가 T21(B)보다 작을 경우 묵음 구간으로 처리하여 1kbps의 전송률로 부호화하고, R(0)가 T21(B)보다 크거나 같을 경우 R(0)가 T22(B)보다 작은지를 검사한다(112). 검사 결과 R(0)가 T22(B)보다 작을 경우 무성음으로 구분하여 4kbps의 전송률로 부호화하고, R(0)가 T22(B)보다 크거나 같을 경우 유성음으로 구분하여 8kbps의 전송률로 부호화한다.
주변소음 레벨값 B가 b2보다 크거나 같고 b3보다 작을 경우(105), R(0)가 T31(B)보다 작은지를 검사한다(109). 검사 결과 R(0)가 T31(B)보다 작을 경우 묵음 구간으로 처리하여 1kbps의 전송률로 부호화하고, R(0)가 T31(B)보다 크거나 같을 경우 R(0)가 T32(B)보다 작은지를 검사한다(113). 검사 결과 R(0)가 T32(B)보다 작을 경우 무성음으로 구분하여 4kbps의 전송률로 부호화하고, R(0)가 T32(B)보다 크거나 같을 경우 유성음으로 구분하여 8kbps의 전송률로 부호화한다.
주변소음 레벨값 B가 b3보다 크거나 같을 경우(106), R(0)가 T41(B)보다 작은지를 검사한다(108). 검사 결과 R(0)가 T41(B)보다 작을 경우 묵음 구간으로 처리하여 1kbps의 전송률로 부호화하고, R(0)가 T41(B)보다 크거나 같을 경우 R(0)가 T42(B)보다 작은지를 검사한다(114). 검사 결과 R(0)가 T42(B)보다 작을 경우 무성음으로 구분하여 4kbps의 전송률로 부호화하고, R(0)가 T42(B)보다 크거나 같을 경우 유성음으로 구분하여 8kbps의 전송률로 부호화한다.
도 2(a) 내지 도 2(c)는 본 발명에 따른 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에서 분석 과정에서 얻어진 각종 특성 파라메터들을 종합하여 음성학적 구분을 수행하는 절차를 설명하기 위해 도시한 흐름도로서, 분석 과정에서 가정된 각 부전송률에 대하여 그 타당성을 검증하고 조정하기 위한 것이다.
특성 파라메터에 의한 구분은 입력 음성의 분석을 통하여 얻어진 영교차율과 피치 지연 변화값을 근거로 수행된다.
먼저 영교차율은 무성음 구간에서 비교적 높은 값을 가지며 다음의 절차를 통해 얻어진다.
zero_cross = 0;
for( i=0 ; i〈L_FRAME ; i++)
if( s(i)*s(i+1) 〈= 0 ) then zero_cross++;
여기서, L_FRAME은 프레임 크기로 80에 해당하며, s(i)는 전프로세싱(pre-processing)을 거친 입력 음성 샘플이다.
다음으로 이전 프레임과 현재 프레임간의 개루프 피치 지연값의 차이는 다음의 [수학식 6]과 같이 정의된다.
Pitch(delta)=Pitch(current)-Pitch(prev)
도 2(a)는 입력 프레임이 에너지 비교방식에 의하여 묵음 구간(rate 1/8)으로 결정된 경우를 위한 부가적인 전송률 결정 알고리즘으로, 판단 기준으로서 영교차율(zero_cross)을 사용하였다. 영교차율이 35보다 크거나 같은지를 검사하여(21)35보다 크거나 같을 경우 rate 1/2(무성음)로 처리하고, 영교차율이 35보다 작을 경우 rate 1/8(묵음 구간)로 처리한다.
도 2(b)는 입력 프레임이 에너지 비교방식에 의하여 rate 1/2(무성음 구간)로 결정된 경우를 위한 알고리즘으로, 판단 기준으로는 영교차율과 피치 지연 변화값을 함께 사용하였다. 알고리즘을 살펴보면, 먼저 영교차율이 17보다 크거나 같은지를 검사하여(22) 17보다 크거나 같을 경우 rate 1/2(무성음)로 처리하고, 영교차율이 17보다 작을 경우 피치 지연 변화값을 통해 rate 1(유성음)을 구분해 낸다. 즉, 피치 지연 변화값이 5보다 크거나 같은지를 검사하여(23) 5보다 작을 경우 rate 1(유성음)으로 처리한다. 여기에서 피치 지연 변화값이 일정값 이상인 경우를 모두 묵음구간으로 결정하게 되면 무성음이 묵음으로 판별되는 경우가 발생하여 음질의 저하를 초래할 수 있으므로, 피치 지연 변화값이 5보다 크거나 같을 경우 다시 영교차율의 제약조건을 두어 전송률 결정의 정밀도를 높였다. 즉, 영교차율이 7보다 크거나 같은지를 검사하여(24) 7보다 크거나 같을 경우 rate 1/2(무성음)로 처리하고, 7보다 작을 경우 rate 1/8(묵음 구간)로 처리한다.
도 2(c)는 입력 프레임이 에너지 비교방식에 의하여 rate 1(유성음)으로 결정된 경우를 위한 알고리즘으로서 전송률 감소 모드로 사용할 수 있다. 즉, 에너지 비교 방식에 의해 rate 1(유성음)으로 결정된 프레임들 중에서 영교차율과 피치 지연 변화값의 통계적 특성을 이용하여 rate 1/2(무성음) 구간을 추가적으로 검출해 낸다. 알고리즘을 살펴보면, 영교차율이 35보다 크거나 같은지를 검사하여(25) 35보다 작을 경우 rate 1(유성음)으로 처리하고, 35보다 크거나 같을 경우 피치 지연 변화값이 5보다 크거나 같은지를 검사한다(26). 5보다 크거나 같을 경우 rate 1/2(무성음)로 처리하고, 5보다 작을 경우 rate 1(유성음)로 처리한다. 그러나 설계된 rate 1/2 부호화기의 성능이 좋지 않은 경우에는 전송률 감소 모드를 동작시키므로 평균 전송률면에서의 감소를 얻는 반면에 음질 측면에서의 손실을 초래할 수 있다. 이러한 경우에는 음질 감쇄를 막기 위해 전송률 감소 모드가 동작되지 않도록 한다.
도 3은 본 발명에 따른 G.729 음성 부호화기를 위한 음성 활성도 측정 방법에서 분석 과정 및 음성학적 구분을 통하여 결정된 부전송률로 음성 프레임들을 부호화 하는 경우, 주로 음성의 끝단에서 발생할 수 있는 음질의 저하를 방지하기 위한 가변 행오버(hangover) 구간 방법을 설명하기 위한 흐름도이다.
먼저, 주변소음 레벨에 대한 음성의 상대적 크기를 나타내는 파라메터로서 [수학식 7]과 같이 신호대 잡음비(signal to noise ratio) 값을 정의한다.
Figure 1019970059520_B1_M0005
신호대 잡음비의 값이 작은 경우는 주변소음 레벨값이 음성의 에너지에 비해 비교적 크다는 것을 나타내므로, rate 1에서 rate 1/8로 전송률이 변하더라도 일정 프레임을 rate 1로 유지하도록 하여 음성 구간이 묵음 구간으로 잘못 판단되므로써 생길 수 있는 음질의 저하를 방지할 수 있다.
기존의 가변 행오버(hangover) 방식들은 일반적으로 신호대 잡음비 값에 따라 최소한의 행오버(hangover) 갯수로 단절음 효과를 제거할 수 있도록 청취 실험을 통해 가변 행오버(hangover) 프레임의 개수를 결정하였다. 본 발명에서는, 이러한 기존의 방식들과는 달리 신호대 잡음비값이 일정 수준 이하인 경우에 rate 1에서 rate 1/8로 전송률이 결정되더라도 일정 프레임 동안은 rate 1을 유지하도록 한 후, 위에서 언급한 영교차율과 피치 지연 변화값에 근거하여 묵음구간임이 확실해 질때까지 유성음(rate 1)을 계속 유지하도록 하는 방법을 사용하였다. 또한 가변 행오버(hangover) 프레임의 최대 허용 개수를 두어 발생할 수 있는 전송률상의 낭비를 방지하였다.
도 1 및 도 2에서 설명된 에너지 비교 방법 및 부가적인 전송률 알고리즘을 수행한 후 결정된 전송률이 rate 1/8(묵음 구간)로 판별되면, 현재 행오버 구간중인가를 검사한다(301). 검사 결과 현재 행오버 구간중이 아닐 경우 현재 프레임을 8kbps로 하고 행오버 프레임수를 5로 한다(302). 검사 결과 현재 행오버 구간중일 경우 이전 프레임이 8kbps이고 현재 프레임의 신호대 잡음비가 15dB보다 작은지를 검사한다(303). 검사 결과 이전 프레임이 8kbps이고 현재 프레임의 신호대 잡음비가 15dB보다 작을 경우 현재 프레임을 8kbps로 하고 행오버 프레임 수를 5로 한다(304). 검사 결과 이전 프레임이 8kbps이 아니고 현재 프레임의 신호대 잡음비가 15dB보다 작지 않을 경우 이전 기본 계수가 0이 아니고 이전 프레임의 신호대 잡음비가 8dB보다 작은지를 검사한다(305). 검사 결과 이전 기본 계수가 0이 아니고 이전 프레임의 신호대 잡음비가 8dB보다 작을 경우 실음성 구간의 유성음 구간이 아닌지를 검사한다(306). 검사 결과 실음성 구간의 유성음 구간이 아닐 경우 현재 프레임을 1kbps로 하고 행오버 계수를 클리어한다(307). 검사 결과 이전 기본 계수가 0이고 이전 프레임의 신호대 잡음비가 8dB보다 작지 않을 경우 현재 프레임을 8kbps로 행오버 계수를 7로 설정한다(308). 단계 (305)의 검사 결과 이전 기본 계수가 0이고 프레임의 신호대 잡음비가 8dB보다 클 경우 현재 행오버 구간중인지를 검사한다(309). 행오버 구간중이 아닐 경우 현재 프레임을 1kbps로 한다(310). 현재 행오버 구간중일 경우 실음성 구간의 유성음 구간이 아닌지를 검사한다(311). 검사 결과 실음성 구간의 유성음 구간이 아닐 경우 현재 프레임을 1kbps로 하고, 행오버 계수를 클리어한다(312). 실음성 구간의 유성음 구간일 경우 현재 프레임을 8kbps로 하고 행오버 계수를 감소시킨다(313). 이러한 모든 과정을 수행한 후 다음 프레임을 위한 변수를 증가시킨다(314).
마지막으로 상기 분석 과정, 음성학적 구분 및 가변 행오버 구간 방식에 의해 결정된 전송률이 rate 1에서 rate 1/8로 결정되는 경우에는 부음성 부호화기간의 본질적인 성능 차이로 인하여 단절음 효과가 발생할 수 있다. 따라서, rate 1에서 rate 1/8로의 전송률 변화시에는 2프레임 동안 rate 1/2로의 천이 구간을 두어 이러한 단절음 발생을 억제하도록 하였다.
상술한 바와 같이 본 발명에 의하면 입력 음성의 활성도를 측정하고 해당하는 부전송률을 결정하므로써 가변율 음성 부호화기의 핵심부분을 담당할 뿐만 아니라 4단계의 전송률 결정단계를 통하여 스펙트럼 효율과 합성음의 품질면에서 기존의 방식들과 비교하여 보다 나은 성능을 기대할 수 있다.

Claims (6)

  1. 선형 예측 계수 추출 과정에서 얻어진 음성 프레임 에너지 값을 몇 개의 적응 문턱값과 비교하여 음성의 활성도를 측정하고, 그에 상응하는 부전송률을 가정하는 제 1 단계와,
    상기 제 1 단계에서 가정된 부전송률에 대하여 그 타당성을 검증하고 조정하기 위해 분석 과정에서 얻어진 각종 특성 파라메터들을 종합하여 음성학적 구분을 수행하는 제 2 단계와,
    상기 제 1, 제 2 단계를 통해 결정된 부전송률로 부호화할 경우 음성 끝단에서의 음질 저하 가능성을 최소화하기 위하여 신호대 잡음비값과 특성 파라메터들에 근거한 가변 행오버 알고리즘을 실행하는 제 3 단계와,
    상기 제 1, 제 2 및 제 3 단계에서 결정된 부전송률로 부호화할 경우 전송률 1에서 전송률 1/8로의 전환시 부음성 부호화기간의 본질적인 성능 차이에 의한 음질 저하 방지를 위해 전송률 1/2의 변환 구간을 두는 제 4 단계를 포함하여 이루어진 것을 특징으로 하는 G.729 음성 부호화기를 위한 음성 활성도 측정 방법.
  2. 제 1 항에 있어서, 상기 제 1 단계는 선형 예측 계수 추출과정에서 얻어진 음성 프레임의 에너지를 부호화기내에 저장하는 단계와,
    상기 음성 프레임의 에너지와 과거 음성 프레임의 에너지로부터 주변소음 레벨값을 계산하는 단계와,
    상기 주변소음 레벨값 B의 범위 구분에 따른 서로다른 문턱값 결정 함수에 적용하는 단계와,
    상기 문턱값 결정 함수에 따라 상기 주변소음 레벨값을 구분하여 각각의 구분값에 따라 전송률 1/8, 전송률 1/2 및 전송률 1로 부전송률을 가정하는 단계를 포함하여 이루어진 것을 특징으로 하는 G.729 음성 부호화기를 위한 음성 활성도 측정 방법.
  3. 제 1 항에 있어서, 상기 제 2 단계는 입력 프레임이 상기 제 1 단계에 의하여 전송률 1/8로 결정된 경우 상기 입력 프레임의 영교차율이 35보다 큰거나 같은지를 검사하여 상기 영교차율이 35보다 크거나 같을 경우 전송률 1/2로 처리하고, 영교차율이 35보다 작을 경우 전송률 1/8로 처리하는 것을 특징으로 하는 G.729 음성 부호화기를 위한 음성 활성도 측정 방법.
  4. 제 1 항에 있어서, 상기 제 2 단계는 입력 프레임이 상기 제 1 단계에 의하여 전송률 1/2로 결정된 경우 영교차율이 17보다 크거나 같은지를 검사하여 17보다 크거나 같을 경우 전송률 1/2로 처리하고, 피치 지연 변화값이 5보다 크거나 같은지를 검사하는 단계와,
    상기 피치 지연 변화값의 검사 결과 상기 피치 지연 변화값이 5보다 작을 경우 전송률 1로 처리하고, 피치 지연 변화값이 5보다 크거나 같을 경우 영교차율이 7보다 크거나 같은지를 검사하는 단계와,
    상기 피치 지연 변화값이 7보다 크거나 같은지의 검사 결과 상기 피치 지연 변화값이 7보다 크거나 같을 경우 전송률 1/2로 처리하고, 7보다 작을 경우 전송률 1/8로 처리하는 단계를 포함하여 이루어진 것을 특징으로 하는 G.729 음성 부호화기를 위한 음성 활성도 측정 방법.
  5. 제 1 항에 있어서, 상기 제 2 단계는 입력 프레임이 상기 제 1 단계에 의하여 전송률 1로 결정된 경우 영교차율이 35보다 크거나 같은지를 검사하여 35보다 작을 경우 전송률 1로 처리하고, 35보다 크거나 같을 경우 피치 지연 변화값이 5보다 크거나 같은지를 검사하는 단계와,
    상기 피치 지연 변화값의 검사 결과 상기 피치 지연 변화값이 5보다 크거나 같을 경우 전송률 1/2로 처리하고, 5보다 작을 경우 전송률 1로 처리하는 단계를 포함하여 이루어진 것을 특징으로 하는 G.729 음성 부호화기를 위한 음성 활성도 측정 방법.
  6. 제 1 항에 있어서, 상기 제 3 단계는 상기 제 1 및 제 2 단계를 수행한 후 결정된 전송률이 1kbps로 판별될 경우 현재 행오버 구간중인지를 검사하는 제 1 검사를 수행하는 단계와,
    상기 제 1 검사의 수행 결과 현재 행오버 구간중이 아닐 경우 현재 프레임을 8kbps로 한 후 행오버 프레임수를 5로 하고, 현재 행오버 구간중일 경우 이전 프레임이 8kbps이고 현재 프레임의 신호대 잡음비가 15dB보다 작은지를 검사하는 제 2 검사를 수행하는 단계와,
    상기 제 2 검사의 수행 결과 이전 프레임이 8kbps이고 현재 프레임의 신호대 잡음비가 15dB보다 작을 경우 현재 프레임을 8kbps로 하고 행오버 프레임 수를 5로 하는 단계와,
    상기 제 2 검사의 수행 결과 이전 프레임이 8kbps이 아니고 현재 프레임의 신호대 잡음비가 15dB보다 작지 않을 경우 이전 기본 계수가 0이 아니고 이전 프레임의 신호대 잡음비가 8dB보다 작은지를 검사하는 제 3 검사를 수행하는 단계와,
    상기 제 3 검사의 수행 결과 이전 기본 계수가 0이 아니고 이전 프레임의 신호대 잡음비가 8dB보다 작을 경우 실음성 구간의 유성음 구간이 아닌지를 검사하는 제 4 검사를 수행하는 단계와,
    상기 제 4 검사의 수행 결과 실음성 구간의 유성음 구간이 아닐 경우 현재 프레임을 1kbps로 하고 행오버 계수를 클리어하고, 이전 기본 계수가 0이고 이전 프레임의 신호대 잡음비가 8dB보다 작지 않을 경우 현재 프레임을 8kbps로 행오버 계수를 7로 설정하는 단계와,
    상기 제 3 검사의 수행 결과 이전 기본 계수가 0이고 프레임의 신호대 잡음비가 8dB보다 클 경우 현재 행오버 구간중인지를 검사하는 제 5 검사를 수행하는 단계와,
    상기 제 5 검사의 수행 결과 현재 행오버 구간중이 아닐 경우 현재 프레임을 1kbps로 하고, 현재 행오버 구간중일 경우 실음성 구간의 유성음 구간이 아닌지를 검사하는 제 6 검사를 수행하는 단계와,
    상기 제 6 검사의 수행 결과 실음성 구간의 유성음 구간이 아닐 경우 현재 프레임을 1kbps로 한 후 행오버 계수를 클리어하고, 실음성 구간의 유성음 구간일 경우 현재 프레임을 8kbps로 한 후 행오버 계수를 감소시키는 단계와,
    상기 모든 단계를 수핸한 후 다음 프레임을 위한 변수를 증가시키는 단계를 포함하여 이루어진 것을 특징으로 하는 G.729 음성 부호화기를 위한 음성 활성도 측정 방법.
KR1019970059520A 1997-11-12 1997-11-12 G.729 음성 부호화기를 위한 음성 활성도 측정 방법 KR100263296B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970059520A KR100263296B1 (ko) 1997-11-12 1997-11-12 G.729 음성 부호화기를 위한 음성 활성도 측정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970059520A KR100263296B1 (ko) 1997-11-12 1997-11-12 G.729 음성 부호화기를 위한 음성 활성도 측정 방법

Publications (1)

Publication Number Publication Date
KR100263296B1 true KR100263296B1 (ko) 2000-08-01

Family

ID=19524600

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970059520A KR100263296B1 (ko) 1997-11-12 1997-11-12 G.729 음성 부호화기를 위한 음성 활성도 측정 방법

Country Status (1)

Country Link
KR (1) KR100263296B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681675A (zh) * 2020-06-03 2020-09-18 西安Tcl软件开发有限公司 数据动态传输方法、装置、设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681675A (zh) * 2020-06-03 2020-09-18 西安Tcl软件开发有限公司 数据动态传输方法、装置、设备和存储介质
CN111681675B (zh) * 2020-06-03 2024-06-07 西安通立软件开发有限公司 数据动态传输方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
RU2441286C2 (ru) Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов
RU2325707C2 (ru) Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания
KR100742443B1 (ko) 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법
FI120327B (fi) Menetelmä ja laite alennetun nopeuden muuttuvanopeuksisen vokoodauksen suorittamiseksi
US9401160B2 (en) Methods and voice activity detectors for speech encoders
US6202046B1 (en) Background noise/speech classification method
EP1340223B1 (en) Method and apparatus for robust speech classification
FI119085B (fi) Menetelmä ja laite koodausnopeuden valitsemiseksi muuttuvanopeuksisessa vokooderissa
KR101060533B1 (ko) 신호 변화 검출을 위한 시스템, 방법 및 장치
US6898566B1 (en) Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
EP0848374B1 (en) A method and a device for speech encoding
US5579435A (en) Discriminating between stationary and non-stationary signals
EP1724758A2 (en) Delay reduction for a combination of a speech preprocessor and speech encoder
JP2007534020A (ja) 信号符号化
KR20080093074A (ko) 오디오신호들의 분류
JP2010540990A (ja) 埋め込み話声およびオーディオコーデックにおける変換情報の効率的量子化のための方法および装置
Soong et al. Optimal quantization of LSP parameters using delayed decisions
US5632004A (en) Method and apparatus for encoding/decoding of background sounds
KR100315692B1 (ko) 가변 비율 음성부호화기의 음성 부호화 비율 결정장치 및방법
Cellario et al. CELP coding at variable rate
KR100263296B1 (ko) G.729 음성 부호화기를 위한 음성 활성도 측정 방법
Zhang et al. A CELP variable rate speech codec with low average rate
JPH08305388A (ja) 音声区間検出装置
Taddei et al. Noise reduction on speech codec parameters
Oh et al. Output Recursively Adaptive (ORA) Tree Coding of Speech with VAD/CNG

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110511

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee