KR19980046880A - 음성 부호화기의 전송률 결정방법 - Google Patents

음성 부호화기의 전송률 결정방법 Download PDF

Info

Publication number
KR19980046880A
KR19980046880A KR1019960065296A KR19960065296A KR19980046880A KR 19980046880 A KR19980046880 A KR 19980046880A KR 1019960065296 A KR1019960065296 A KR 1019960065296A KR 19960065296 A KR19960065296 A KR 19960065296A KR 19980046880 A KR19980046880 A KR 19980046880A
Authority
KR
South Korea
Prior art keywords
rate
hangover
transmission rate
frame
determined
Prior art date
Application number
KR1019960065296A
Other languages
English (en)
Inventor
김재원
최송인
Original Assignee
양승택
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양승택, 한국전자통신연구원 filed Critical 양승택
Priority to KR1019960065296A priority Critical patent/KR19980046880A/ko
Publication of KR19980046880A publication Critical patent/KR19980046880A/ko

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 차세대 이동통신 시스템에 이용될 가변 전송률 음성 부호화기의 전송률 결정방법에 관한 것이다. 그 목적은 현재 제안되고 있는 10msec 프레임을 가지는 고정 전송률 저지연 음성 부호화기를 음성 프레임의 에너지와 행오버(Hangover) 알고리듬에 근거한 가변 전송률 방식으로 변환하여 디지털 이동통신 시스템에서 음성 통화시 고정 전송률 방식에 비해 평균 전송 데이터 양을 약 50% 감소시켜 이동통신 시스템의 가입자 용량의 증대를 꾀하는 데에 있다. 그 특징은 현재 프레임이 에너지에 의한 전송률을 결정할 때에 최대 전송률이 아니고 이전 n개의 프레임이 최대 전송률로 결정된 경우의 음성 부호화기의 전송률 결정방법에 있어서, 이전 프레임의 주변소음과 신호에 근거한 정규화된 신호 대 잡음 비를 계산하는 단계와, 상기 정규화된 신호 대 잡음 비의 값이 3보다 크면 행오버를 수행하지 않는 단계와, 상기 정규화된 신호 대 잡음 비의 값이 3이면 행오버 수를 3으로 설정하는 단계 및 상기 정규화된 신호 대 잡음 비의 값이 3보다 작으면 행오버 수를 7로 설정하는 단계로 이루어지는 데에 있다.

Description

음성 부호화기의 전송률 결정방법
본 발명은 차세대 이동통신 시스템에 이용될 가변 전송률 음성 부호화기의 전송률 결정방법에 관한 것으로서, 특히 10msec 프레임 크기를 갖는 음성 부호화기의 전송률 결정방법에 관한 것이다.
일반적으로, 차세대 이동통신 시스템은 높은 주파수 효율을 요구하고 있는데, 음성 서비스인 경우에 이 효율은 음성 부호화기의 데이터 전송속도와 직접 관련되며, FPLMTS와 같은 차세대 시스템은 고품질 음성과 낮은 전송률 그리고 적은 알고리듬 지연시간이 요구된다. 현재까지 제안된 대부분의 가변 전송률 음성 부호화기는 20msec 프레임에 근거하고 있어 큰 지연시간을 가지며, FPLMTS용으로 제안된 방식은 고정 전송률의 단점이 있다. 고정 전송률 방식은 음성의 voice activity 즉 음성의 유무에 상관없이 동일 데이터 전송률이 요구되어 많은 가입자 용량을 요구하는 디지털 이동통신 시스템에서는 적합하지 못하다.
무선 자원을 이용하는 이동통신 시스템에서는 주파수 자원의 효율적인 이용이 필수적이다. 이의 일환으로 음성압축을 위한 음성 부호화기 기술이 디지털 이동통신 시스템에 이용되어 전송측에서는 음성 파라미터를 추출하여 전송하고 수신측에서는 이 파라미터를 이용하여 음성을 재생하게 되는데, 실제 양방향 음성통화의 경우 한쪽의 음성 활성도는 약 40%에 불과하다. 그러므로 평균 데이터 전송률 감소를 위하여 음성이 존재하는 구간은 많은 비트를 할당하고 묵음구간에는 적은 비트를 할당하는 가변 전송률 방식의 음성 부호화기가 제안 되었으며, 특히 CDMA 방식과 같이 가변 패킷의 전송이 용이한 시스템의 등장으로 가변을 음성 부호화기의 개발이 활기를 띄었다. 지금까지의 가변 전송률 음성 부호화기에 관한 연구는 20msec의 프레임 크기를 갖는 방식에 근거하였다. 하지만 차세대 이동통신 시스템인 PCS, FPLMTS 등에서는 양호한 음성 품질, 저 전송률, 그리고 적은 알고리듬 지연시간 등의 성능의 요구되어 기존의 20msec 프레임 방식에서 야기되는 큰 지연 시간 때문에 10msec의 프레임 크기를 가지는 음성 부호화기의 연구가 추진되고 있다. 하지만 현재 제안된 10msec 프레임의 음성 부호화기의 방식은 고정율 전송 방식을 취하고 있기 때문에 이동통신 시스템의 성능 향상을 위하여 가변 전송률 방식이 개발이 절실이 요구되고 있다.
또한, 디지털 이동통신 시스템에서 음성압축을 목적으로 이용되는 음성 부호화기는 전송측에서 입력음성 프레임으로부터 음성 파라미터를 추출하여 전송하고 수신측에서는 이 파라미터를 이용하여 음성을 재생한다. 하지만 실제 양방향 음성 통화시 음성이 존재하는 구간이 전체 구간의 약 40%에 불과하여 이동통신 시스템의 성능증대를 위하여 가변전송률 방식의 음성 부호화기가 요구되어 QCELP(Qualcomm Code Excited Linear Prediction)와 EVRC(Enhanced Variable Rate Coder) 등이 제안 되었다. 이 두 방식은 프레임의 크기가 20msec이다. 하지만 PCS, FPLMTS 등과 같은 차후의 이동통신 시스템에서는 높은 음성 품질 뿐만 아니라 적은 알고리듬 지연시간 등이 요구되어 10msec의 프레임 크기를 가지는 음성 부호화기의 연구가 추진되었으나 현재 제안된 방식들은 고정을 전송방식이어서 음성의 유무에 관계없이 일정한 데이터의 양을 전송하여야 하는 문제점이 있었다.
상기 문제점을 해결하기 위하여 안출된 본 발명은 현재 제안되고 있는 10msec 프레임을 가지는 고정 전송률 저지연 음성 부호화기를 음성 프레임의 에너지와 행오버(Hangover) 알고리듬에 근거한 가변 전송률 방식으로 변환하여 디지털 이동통신 시스템에서 음성 통화시 고정 전송률 방식에 비해 평균 전송 데이터 양을 약 50% 감소시켜 이동통신 시스템의 가입자 용량의 증대를 꾀하는 데에 그 목적이 있다.
또한, 본 발명의 전송률 결정 알고리듬은 차세대 이동통신을 위하여 제안된 고정 전송률 방식의 음성 부호화기와 결합하여 저전송 고음질의 가변 전송률 음성 부호화기를 구현하는 데에 또 다른 목적이 있다.
상기 목적들을 달성하기 위한 본 발명의 특징은 현재 프레임이 에너지에 의한 전송률을 결정한 후의 최대 전송률이 아니라 이전 n개의 프레임이 최대 전송률로 결정된 경우의 음성 부호화기의 전송률 결정방법에 있어서, 이전 프레임의 주변소음과 신호에 근거한 정규화된 신호 대 잡음 비를 계산하는 단계와, 상기 정규화된 신호 대 잡음 비의 값이 3보다 크면 행오버를 수행하지 않는 단계와, 상기 정규화된 신호 대 잡음 비의 값이 3이면 행오버 수를 3으로 설정하는 단계 및 상기 정규화된 신호 대 잡음 비의 값이 3보다 작으면 행오버 수를 7로 설정하는 단계로 이루어지는 데에 있다.
상기 목적들을 달성하기 위한 본 발명의 또 다른 특징은 현재 프레임의 에너지에 의한 전송률이 최대 전송률인지를 판단하는 단계와, 상기 현재 프레임의 에너지에 의한 상기 전송률이 최대 전송률이면 행오버 수를 0으로 설정하고 전송률은 변경하지 않는 단계 및 상기 현재 프레임의 에너지에 의한 상기 전송률이 최대 전송률이 아니면 이미 결정된 행오버 수를 근거하여 동작하는 단계로 이루어지는 데에 있다.
현재까지 수행되어 온 분석/합성 방법에 의한 음성 부호화기의 연구는 20msec의 긴 프레임을 위한 알고리듬 및 가변전송률 방식에 관한 연구로 이루어져 왔으며, 최근에 차세대 이동통신 시스템을 위해 제안되는 방식들은 적은 지연시간을 위하여 10msec의 짧은 프레임 방식을 채택하였다. 10msec 프레임을 갖는 음성 부호화기의 가변 전송률 방식의 연구는 현재 초기단계에 있으며, 이의 구현을 위해서는 짧은 프레임(적은 샘플)의 분석을 통한 효율적인 전송률 결정방법이 이루어져야 한다. 이를 위하여 음성 프레임의 에너지 계산과 순간적인 전송률 감소를 방지하기 위한 효율적인 행오버 기술이 요구되고 있다.
도 1은 음성 프레임의 에너지에 근거하여 전송률을 결정하는 방법의 흐름도,
도 2는 행오버 프레임의 수를 결정하는 방법의 흐름도,
도 3은 행오버 방법을 통한 개선된 전송률 결정방법의 흐름도.
본 발명에 이용된 10msec 프레임의 음성 부호화기의 전송률 결정방법의 구성은 먼저 음성 프레임의 에너지에 근거하여 전송률을 결정하고, 결정된 전송률이 최대 전송률(full rate)이 아닌 경우 실제 음성이 없는 묵음 구간일 수도 있지만 순간적인 주변소음(Background Noise)의 증가와 /f/와 /th/ 등과 같은 발음은 매우 적은 에너지를 가지고 있어 실제는 활성음성(active speech)이더라도 주변소음으로 처리되어 음성품질의 저하를 초래할 수 있다. 이를 방지하기 위하여 현재 프레임이 최대 전송률이 아닌 경우 이전 프레임의 정규화된 SNR(신호 대 잡음비)을 기준으로 하여 행오버 프레임을 설정하여 몇개의 프레임을 최대 전송률로 결정함으로서 음성 품질을 개선하는 역할을 수행한다. 이렇게 구성된 전송률 결정방법을 10msec 고정 전송률 음성 부호화기와 결합하여 가변 전송률 음성 부호화기를 구성하여 이를 디지털 이동통신망에 적용하는 경우에 시스템의 성능을 향상시킬 수 있다.
도 1은 음성 프레임의 에너지에 근거한 전송률 결정방법을 나타내고 있다. 먼저 도면상의 약자를 간단히 설명한다. T1와 T2은 전송률 결정을 위한 임계치이다. Ei는 자기상관 관계(Autocorrelation)에 의해 계산된 프레임 에너지이며, Bi는 프레임의 주변소음값(Background Noise)이다. NSNR은 행오버 프레임 수를 결정하기 위한 정규화된 신호 대 잡음 비(Normalized Signal-to-Noise Ratio)이다.
주변소음과 프레임 에너지를 계산 한후, 주변소음 임계값에 따라 전송률 결정을 위한 임계값을 실험적으로 구하여, 주변소음값에 따라 각각 전송률 결정을 수행하게 된다. 여기에서는 음성 프레임을 활성음성과 묵음 구간만으로 분류하여 최대 전송률과 낮은 전송률로 구성한다.
도 2는 행오버 프레임 수를 결정하는 과정을 나타내고 있다. 현재 프레임이 도 1의 에너지에 의한 전송률 결정단계에서 최대 전송률이 아니고 이전 n개의 프레임이 최대 전송률로 결정된 경우, 이전 프레임의 주변소음과 신호에 근거한 정규화된 SNR(Normalized SNR, 이하 NSNR이라고 약칭함)의 값을 계산하여 이 값이 3보다 큰 경우에는 행오버를 수행하지 않고, NSNR이 3인 경우에는 행오버 수를 3으로 설정하고, NSNR이 3보다 적은 경우에는 행오버 수를 7로 설정하게 된다.
도 3은 행오버 방법을 가미한 개선된 전송률 결정 알고리듬을 나타내고 있다. 현재 프레임의 에너지에 의한 전송률이 최대인 경우는 행오버 수를 0으로 설정하고 전송률은 변경되지 않는다. 하지만, 최대가 아닌 경우에는 도 2에 의하여 결정된 행오버 수에 근거하여 동작하게 되는데, 이때의 행오버 수가 0이 아니면 현재 프레임의 전송률을 최대로 결정하고 행오버 수를 1만큼 감소시키며, 행오버 수가 0인 경우에도 도 2의 방법에 의하여 행오버 수를 다시 결정하게 된다. 그리고 행오버 수가 0이 아니더라도 현재 프레임의 에너지에 의한 전송률이 최대이면 행오버 수는 초기화되어 0으로 설정된다.
상술한 바와 같은 본 발명은 가변 전송률 음성 부호화기는 고 품질 음성을 얻을 수 있을 뿐 아니라 평균 데이터 전송률을 감소시켜 디지털 이동통신의 성능을 개선할 수 있다는 데에 그 효과가 있다. 또한, 본 발명은 전송률 결정방법 또한 음성 프레임의 에너지를 구하여 적응 임계값과 비교하는 방식과 아울러 신호 대 잡음 비에 근거한 행오버 알고리듬만을 이용하여 계산량 또한 적어 가변 전송률 음성 부호화기의 실시간 구현 입장에서도 장점을 지닌다.

Claims (3)

  1. 현재 프레임의 에너지에 의한 전송률을 결정한 후의 최대 전송률이 아니라 이전 n개의 프레임이 최대 전송률로 결정된 경우의 음성 부호화기의 전송률 결정방법에 있어서,
    이전 프레임의 주변소음과 신호에 근거한 정규화된 신호 대 잡음 비를 계산하는 단계;
    상기 이전 프레임의 정규화된 신호 대 잡음 비의 값에 따라 행오버 알고리듬을 수행하는 단계; 및
    상기 정규화된 신호 대 잡음 비의 값에 따라 행오버 수를 설정하는 단계로 이루어지는 것을 특징으로 하는 음성 부호화기의 전송률 결정방법.
  2. 현재 프레임의 에너지에 의한 전송률이 최대 전송률인지 판단하는 단계;
    상기 현재 프레임의 에너지에 의한 상기 전송률이 최대 전송률이면, 행오버 수를 0으로 설정하고 전송률은 변경하지 않는 단계; 및
    상기 현재 프레임의 에너지에 의한 상기 전송률이 최대 전송률이 아니면,
    이미 결정된 행오버 수를 근거하여 동작하는 단계로 이루어지는 것을 특징으로 하는 음성 부호화기의 전송률 결정방법.
  3. 제2항에 있어서,
    상기 행오버 수행단계가,
    이미 결정된 상기 행오버 수를 판단하는 단계;
    이미 결정된 상기 행오버 수가 0이 아니면, 현재 프레임의 전송률을 최대로 결정하고 행오버 수를 1만큼 감소시키는 단계; 및
    이미 결정된 상기 행오버 수가 0이면, 행오버 수를 다시 결정하여 상기 행오버 수 판단단계부터 다시 수행하는 단계로 이루어지는 것을 특징으로 하는 음성 부호화기의 전송률 결정방법.
KR1019960065296A 1996-12-13 1996-12-13 음성 부호화기의 전송률 결정방법 KR19980046880A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960065296A KR19980046880A (ko) 1996-12-13 1996-12-13 음성 부호화기의 전송률 결정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960065296A KR19980046880A (ko) 1996-12-13 1996-12-13 음성 부호화기의 전송률 결정방법

Publications (1)

Publication Number Publication Date
KR19980046880A true KR19980046880A (ko) 1998-09-15

Family

ID=66522768

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960065296A KR19980046880A (ko) 1996-12-13 1996-12-13 음성 부호화기의 전송률 결정방법

Country Status (1)

Country Link
KR (1) KR19980046880A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100389480B1 (ko) * 1999-12-28 2003-06-27 엔티티 도꼬모 인코퍼레이티드 트래픽과 송신전력에 의거한 전송속도의 변화를 포함하는이동통신 제어
KR100401186B1 (ko) * 2000-10-20 2003-10-10 삼성전자주식회사 이동 통신시스템의 패킷 데이터 전송율 결정 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100389480B1 (ko) * 1999-12-28 2003-06-27 엔티티 도꼬모 인코퍼레이티드 트래픽과 송신전력에 의거한 전송속도의 변화를 포함하는이동통신 제어
KR100401186B1 (ko) * 2000-10-20 2003-10-10 삼성전자주식회사 이동 통신시스템의 패킷 데이터 전송율 결정 장치 및 방법

Similar Documents

Publication Publication Date Title
FI116180B (fi) Menetelmä ja laite signaalien ryhmäkoodauksen suorittamiseksi
US7362811B2 (en) Audio enhancement communication techniques
US5978760A (en) Method and system for improved discontinuous speech transmission
KR100912030B1 (ko) 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치
US8019599B2 (en) Speech codecs
JP4842472B2 (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
US20020101844A1 (en) Method and apparatus for interoperability between voice transmission systems during speech inactivity
JP2011199875A (ja) 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
US6393394B1 (en) Method and apparatus for interleaving line spectral information quantization methods in a speech coder
US7386327B2 (en) Apparatus and method for controlling noise in a mobile communication terminal
EP1595249B1 (en) Class quantization for distributed speech recognition
US7542897B2 (en) Condensed voice buffering, transmission and playback
Uvliden et al. Adaptive multi-rate. A speech service adapted to cellular radio network quality
KR19980046880A (ko) 음성 부호화기의 전송률 결정방법
Gersho et al. Variable rate speech coding for cellular networks
Beritelli et al. Performance comparison between VBR speech coders for adaptive VoIP applications
JP2001308919A (ja) 通信装置
KR100927289B1 (ko) 음성 패킷을 송수신하기 위한 이동 통신 시스템 및 방법
JPH0832526A (ja) 音声検出器
CN1400828A (zh) 一种在移动通信系统中实现基站语音压缩的方法
Yao et al. Energy efficient implementation of G. 729 for wireless VoIP application
CHEN et al. Performance Analysis of AMR Voice Activity Detection Algorithm for Mandarin Based on Objective Test Method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application