KR100653783B1 - 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법 - Google Patents

음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법 Download PDF

Info

Publication number
KR100653783B1
KR100653783B1 KR1020050047739A KR20050047739A KR100653783B1 KR 100653783 B1 KR100653783 B1 KR 100653783B1 KR 1020050047739 A KR1020050047739 A KR 1020050047739A KR 20050047739 A KR20050047739 A KR 20050047739A KR 100653783 B1 KR100653783 B1 KR 100653783B1
Authority
KR
South Korea
Prior art keywords
voice
voice data
data
noise
speech
Prior art date
Application number
KR1020050047739A
Other languages
English (en)
Inventor
박기우
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020050047739A priority Critical patent/KR100653783B1/ko
Priority to CN2006100749434A priority patent/CN1873777B/zh
Application granted granted Critical
Publication of KR100653783B1 publication Critical patent/KR100653783B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Abstract

본 발명은 음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법에 관한 것으로서, 샘플링 된 음성데이터를 복원하는 음성디코딩부와, 상기 음성데이터의 음성파라미터와, 입력되는 노이즈를 이용하여 가상의 음성데이터를 생성하는 음성생성부와, 상기 음성디코딩부를 통해 복원되는 음성데이터와, 상기 음성생성부로부터 출력되는 가상의 음성데이터를 가산하여 음성을 출력하는 음성합성부를 포함하여 구성되어, 수신되는 음성데이터의 저대역과 고대역을 독립적으로 모델링하여 광대역 음성을 출력하고, 저대역에서 사용되는 파라미터를 고대역 음성의 모델링에 사용하며, 고대역 음성의 특징에 따라 노이즈를 입력 신호로 사용함으로써, 별도의 전송데이터가 요구되지 않으며 적은 연산량 만으로도 넓은 대역의 고음질의 음성 출력이 가능하여, 통화품질이 크게 향상되고, 제품의 품질향상 및 신뢰성이 크게 증가되는 효과가 있다.
광대역, 복호화, 음성, LPC, QCELP

Description

음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법{Mobile communication terminal enable to decode broadband speech and its operating method}
도 1 은 종래 발명에 따른 일반적인 이동통신 단말기의 음성 부호화 및 복호화에 따른 흐름이 도시된 블록도,
도 2 는 본 발명에 따른 주기적 임펄스 열에 대한 시간 및 주파수축 상의 청각적 마스킹 현상이 도시된 도,
도 3 은 본 발명에 따른 음성 복호화 기능이 구비된 이동통신 단말기의 구성이 도시된 블록도,
도 4 는 본 발명에 따른 이동통신 단말기의 음성 복호화 방법이 도시된 순서도이다.
<도면의 주요 부분에 관한 부호의 설명>
110: 언팩킹부 120: 음성디코딩부
121: 디코더 122: 샘플링부
123: 로우패스필터(LPF) 130: 음성생성부
131: LPC합성필터(LPC Synthesis filter) 132: 하이패스필터(HPF)
133: 게인매칭부(Gain Matching) 140: 음성합성부
본 발명은 음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법에 관한 것으로서, 특히 사람의 청각적 특성을 이용하여, 음성 파라미터를 통한 가상의 광대역 음성을 생성하는 음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법에 관한 것이다.
현재, 이동 통신 단말기에서 사용되는 음성 압축 기법으로는 IS-95의 QCELP(Qualcomm Code Excited Linear Prediction), EVRC(Enhanced Variable Rate Coding), GSM의 VSELP(Vector-Sum Excited Linear Prediction), PRE-LTP(Regular-Pulse Excited LPC with a Long-Term Predictor), ACELP(Algebraic Code Excited Linear Prediction) 등이 있는데, 모두 LPC(Linear Prediction Coding: 선형 예측 부호화) 분석 방법을 기반으로 한다.
이때, LPC 계열의 음성 압축 기법은 사람의 발성 구조에 최적화된 모델을 사용하고 있어서 사람의 음성을 중전송률이나 저전송률로 압축하는데 매우 효율적이다. 또한, 스펙트럼의 효율을 높이고 시스템의 소비전력을 줄이기 위해서 사람이 말을 할 때만 신호를 압축하여 전달하고 사람이 말을 하지 않을 때는 신호를 전달하지 않는 방법을 사용한다.
도 1 은 종래 발명에 따른 이동통신 단말기의 음성 부호화 및 복호화에 따른 흐름이 도시된 블록도이다.
일반적으로 이동통신 단말기는 QCELP(Qualcomm Code Excited Linear Prediction)라는 협대역(8kHz sampling rate) 음성을 이용하여 통화품질에 만족하도록 음성을 부호화/복호화 한다.
상기와 같은 이동통신 단말기는 송신단에서 아날로그 형태의 음성을 8kHz로 샘플링하고 이렇게 이산 시간 영역(discrete time domain)의 음성을 여기(excitation) 성분과, 공명(formant) 성분으로 분리한다.
그리고, 상기 이동통신 단말기는 여기(excitation) 성분에 대해 코드북(codebook)으로부터 가장 유사한 정보를, 그리고 공명(formant)성분은 LPC(Linear Prediction Coefficient)를 사용하여 나타내게 되며, 상기 코드북(codebook) 정보와 LPC(Linear Prediction Coefficients, 선형 예측 부호화, 이하 LPC)를 전송한다.
또한, 상기 이동통신 단말기는 수신단에서 전송받은 데이터들을 이용하여 상기와 같이 송신단에서 음성을 분석한 방법의 역순으로 음성을 복원해내게 된다.
도 1에 도시된 바와 같이, 상기 이동통신 단말기는 샘플링 된 음성에 대하여 샘플링시 손실된 고주파 성분을 복원해 주기 위해 하이패스필터(high pass filter, HPF)를 통과 시킨다. 이때, 상기와 같은 과정을 프리엠퍼시스(pre-emphasis)라고 한다.
여기서, 상기 프리엠퍼시스(pre-emphasis)는 송수신되는 신호 주파수의 특정 부분을 강조하는 것으로서, 신호 변조 전, 신호의 고대역을 강조해 복호후 역특성 회로를 통해서 원신호로 복원하여 신호대 잡음비(S/N)를 개선하는 경우가 프리엠퍼시스이다.
그리고 상기 이동통신 단말기는 상기와 같이 프리엠퍼시스 된 음성 신호를 여기(excitation) 성분과, 공명(formant) 성분으로 분리한다.
이때, 상기 이동통신 단말기는 순차적으로 들어오는 음성을 앨리어싱(aliasing)이 가장 작은 프레임 단위로 나누기 위해 윈도윙(windowing)을 수행하고, 각 신호들 간의 자기상관성(autocorrelation)을 구해준다.
여기서, 상기 이동통신 단말기는 산출되는 음성의 자기상관성(autocorrelation)을 통해 정보의 중요성을 판단하고, 비트 레이트(bit rate)를 결정한다. 또한, 자기상관성 매트릭스(autocorrelation matrix)로부터 LPC를 산출한다.
상기 산출된 LPC를 양자화 에러(quantization error)를 최소화 할 수 있는 LSP로 변환하여, 상기 변환된 LSP로 양자화(quantization)를 수행한다.
한편, 상기 이동통신 단말기는 여기 성분(Excitation part)에 대해 피치(pitch)와 게인(gain)을 연산한다. 이때, 피치(Pitch)의 경우 피치 검색 알고리즘(pitch searching algorithm)을 구하여 코드북(codebook)으로부터 가장 유사한 값을 구해주고, 게인(gain)은 각 서브프레임(sub-frame)의 게인(gain)을 구한 후 양 자화(quantization)를 수행한다. 상기와 같이 산출된 각 파라미터들은 프레임 단위로 비트 팩킹(bit-packing) 되어 전송된다.
상기 이동통신 단말기의 수신단에서는 상기 송신단에서 수행한 과정을 역순으로 수행함으로써 음성을 복원해 낸다.
그러나, 상기 이동통신 단말기는 송수신되는 음성데이터가 낮은 비트 전송률을 나타내므로 데이터 송수신에 따른 통신효율은 좋으나, 낮은 비트 전송률에 따른 음질저하가 커서 통화 시 고음질을 제공하기 어렵다는 문제점이 있다.
본 발명은 상기한 종래 기술의 문제점을 해결하기 위하여 안출된 것으로서, 수신되는 음성 데이터로부터 저대역과 고대역의 음성을 독립적으로 출력하여 합성함으로서, 가상의 광대역 음성을 구현하여 고음질의 음성을 제공하는 음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법을 제공하는데 그 목적이 있다.
상기한 과제를 해결하기 위한 본 발명에 따른 음성 복호화 기능이 구비된 이동통신 단말기는 샘플링 된 음성데이터를 복원하는 음성디코딩부와, 상기 음성데이터의 음성파라미터와, 입력되는 노이즈를 이용하여 가상의 음성데이터를 생성하는 음성생성부와, 상기 음성디코딩부를 통해 복원되는 음성데이터와, 상기 음성생성부로부터 출력되는 가상의 음성데이터를 가산하여 음성을 출력하는 음성합성부를 포 함하여 구성되는 것을 특징으로 한다.
또한, 본 발명 에 따른 음성 복호화 기능이 구비된 이동통신 단말기의 동작방법은 수신되는 음성데이터를 언팩킹(Un-packing)하여 음성파라미터를 분석하는 제 1 단계와, 상기 음성파라미터를 이용하여 음성데이터를 디코딩하는 제 2 단계와, 상기 음성파라미터와 입력되는 노이즈를 이용하여 가상의 음성데이터를 생성하는 제 3단계와, 상기 디코딩된 음성데이터와, 생성된 가상의 음성데이터를 가산하여 합성된 음성을 출력하는 제 4단계를 포함하여 이루어지는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 설명하면 다음과 같다. 도 2는 본 발명에 따른 주기적 임펄스 열에 대한 시간 및 주파수축 상의 청각적 마스킹 현상이 도시된 도이고, 도 3은 본 발명에 따른 음성 복호화 기능이 구비된 이동통신 단말기의 구성이 도시된 블록도이다.
본 발명에 따른 음성 복호화 기능이 구비된 이동통신 단말기는 입력되는 음성데이터를 변환하여 구비되는 통신모듈(미도시)을 통해 송출하고, 상기 통신모듈을 통해 수신되는 음성데이터를 변환하여 스피커(미도시)를 통해 출력함으로서 음성 통화가 가능하도록 한다.
이때, 상기 이동통신 단말기는 전술한 바와 같이, 음성 송신에 따른 음성데이터의 부호화를 수행하고, 음성데이터를 비트 팩킹(bit-packing)하여 상기 통신모듈을 통해 송출하게 된다.
여기서, 이하 본 명세서는 음성데이터를 송수신하는 통신모듈 및 신호 송수 신에 따른 제어부, 메모리, 입출력에 따른 키패드, 스피커, 마이크에 대한 상세한 설명과, 전술한 음성의 부호화 및 복호화에 따른 상세한 설명은 하기에서 생략함을 명시한다.
본 발명에 따른 이동통신 단말기는 부호화 되어 송출된 음성데이터를 수신하여 복호화 하고, 가상의 광대역 음성을 구현하여 고음질의 음성데이터를 스피커를 통해 출력한다.
상기 이동통신 단말기는 다음 표 1에 도시된 바와 같이 분포되는 사람의 청각 특성과 인간의 청각 마스킹 특성에 기초하여, 가상의 광대역 음성을 출력한다.
Figure 112005029698711-pat00001
여기서, 사람의 청각 자체의 분해능력 및 청각 마스킹 특성에 대해 설명하면 다음과 같다.
소리는 사람이 들을 수 있는 24개의 임계 대역으로 구분될 수 있으며, 상기 표 1과 같이 사람 청각의 임계 대역(Critical band)에 따른 특징이 나타나게 되는데, 이때 동일한 임계 대역 내에 서로 다른 주파수를 갖는 2개 이상의 소리가 있는 경우, 사람은 그 소리들을 정확하게 구분해 낼 수 없으며, 이 임계 대역은 주파수가 높아짐에 따라 그 대역폭이 넓어진다.
이는 사람이 높은 주파수의 소리를 들을 때 주파수 축 상에서의 분해능력이 좋지 않음을 나타낸다. 즉, 상기 표 1 과 같이 광대역 음성에 있어서, 협대역 음성에 비해 늘어난 임계대역은 5개뿐이며, 이것은 작은 정보량으로 넓은 주파수 대역을 묘사 할 수 있다는 것을 의미하게 된다.
한편, 사람의 청각 마스킹 특성을 도 2를 참조하여 설명하면 다음과 같다. 도 3에 도시된 바와 같이, 본 발명에 따른 이동통신 단말기의 가상의 광대역 음성 생성은 어떤 오디오 신호가 독립적으로 존재할 때는 지각이 가능하더라도 동시에 발생할 때는 지각하지 못할 수도 있는 청각 마스킹 특성에 기초한다.
즉, 도 2는 이러한 청각 마스킹 특성을 나타내기 위한 것으로 주기적인 임펄스 열에 대하여 사람의 청각이 느낄 수 없는 영역을 나타낸 것으로서, 낮은 주파수 대역에서는 시간 축 상에서는 대부분이 마스킹 영역에 속하는 반면 주파수 축 상에서는 마스킹 되지 않는 영역이 크게 존재함을 나타낸다. 역으로 높은 주파수 대역에서는 주파수 축 상에서는 대부분이 마스킹 영역에 속하지만 또 시간 축 상에서는 마스킹 영역이 매우 작아지게 된다.
이는 전술한 임계 대역의 분포에서와 같이 높은 주파수 대역을 제대로 묘사하기 위해서는 주파수 축 상에서의 묘사보다는 시간 축 상에서의 묘사가 중요함을 나타내며, 상기 이동통신 단말기는 상기와 같은 청각 특성에 따라 수신되는 음성데이터의 파라미터를 이용하여 후술하는 바와 같이 가상의 광대역 음성을 생성하게 된다.
상기 이동통신 단말기는 도 3에 도시된 바와 같이, 수신된 음성데이터를 언팩킹(un-packing)하는 언팩킹부(110)와, 수신된 음성데이터를 복호화 하는 음성디코딩부(120)와, 상기 음성데이터의 파라미터와 입력되는 노이즈로부터 가상의 음성데이터를 생성하는 음성생성부(130)와, 상기 음성디코딩부(120)에 의해 복호화된 음성데이터와, 상기 음성생성부(130)에 의해 생성되는 가성의 음성데이터를 합성하여 음성을 출력하는 음성합성부(140)를 포함하여 구성된다.
상기 언팩킹부(110)는 이동통신 망을 통해 상기 통신모듈로 수신되는 음성데이터를 언팩킹(un-packing)하여 판독 가능하도록 한다. 즉, 상기 언팩킹부(110)는 이동통신 망을 통해 음성데이터를 전송하기 위해 비트 패킹된 음성데이터를 언팩킹하여 부호화(암호화)된 음성데이터의 복호화가 가능하도록 한다.
상기 언팩킹부(110)는 상기 통신모듈을 통해 수신되어 연속적으로 입력되는 비트 스트림(Bit-stream)을 언팩킹(un-packing)하며, 언팩킹된 음성데이터로의 음성파라미터가 상기 음성 디코딩부(120) 및 상기 음성생성부(130)로 입력되도록 한다.
상기 음성디코딩부(120)는 상기 언 팩킹된 음성데이터를 상기 음성 파라미터를 통해 복호화한다.
상기 음성디코딩부(120)는 상기 언팩킹부(110)로부터 입력되는 음성데이터를 복호화하는 디코더(Decoder, 121)와, 상기 디코더(121)에 의해 복호화된 음성데이터를 업 샘플링(up-sampling)하는 샘플링부(122)와, 상기 샘플링부(122)를 통해 업 샘플링된 음성데이터를 필터링하는 로우패스필터(LPF)를 포함하여 구성된다.
상기 디코더(121)는 입력되는 비트 스트림의 음성파라미터를 이용하여 협대역의 음성데이터를 복호화한다. 이때, 상기 디코더(121)는 상기 언팩킹부(110)로부터 입력되는 음성데이터의 피치(Pitch), 게인(Gain), LSP 등의 음성파라미터를 이용하여 음성데이터의 복호화를 수행한다. 이때, 상기 디코더(121)는 QCELP 방식의 디코더(decoder)이다.
상기 샘플링부(122)는 상기 디코더(121)를 통해 복호화된 음성데이터를 2배 업 샘플링(up-sampling)하여 상기 음성데이터의 샘플링 비율을 증가시킨다. 이때, 상기 샘플링부(122)는 상기 복호화된 음성데이터로부터 광대역의 음성을 생성하기 위해 2배 업샘플링을 수행하게 된다.
즉, 상기 샘플링부(122)는 상기 디코더(121)에 의해 복호화되는 샘플링비율이 8kHz인 음성데이터를 16kHz 샘플링된 음성데이터로 변환하기 위해, 상기 디코더(121)로부터 출력되는 음성데이터의 각 샘플 데이터 사이에 0을 삽입하여 샘플링 비율이 2배가 되도록 2배 업샘플링을 수행하게 된다.
상기 로우패스필터(LPF, 123)는 상기 샘플링부(122)에 의해 두배 업샘플링된 음성데이터의 앨리어싱(Aliasing)을 제거하기 위해 상기 음성데이터를 저대역으로 필터링하여 음성데이터를 출력한다.
이때, 상기 로우패스필터(LPF, 123)는 컷오프 주파수(Cut-off frequency)가 PI/2 인 로우패스 필터이다.
따라서, 상기 음성디코딩부(120)는 상기 디코더(121)와, 샘플링부(122)와, 로우패스필터(LPF, 123)을 통해 4kHz 대역의 음성데이터를 8kHz대역의 음성데이터로 변환하여 출력하게 된다.
이때, 상기 음성생성부(130)는 상기 음성디코딩부(120)에 의해 출력되는 음성데이터의 음질 개선을 위해 가상의 광대역 음성을 생성하게 된다.
상기 음성생성부(130)는 입력되는 노이즈를 고대역으로 필터링하는 하이패스필터(High pass filter, HPF, 132)와, 상기 언팩킹부(110)의 음성파라미터와 상기 하이패스필터(HPF, 132)로부터 출력되는 노이즈신호를 이용하여 음성신호를 생성하는 LPC합성필터(LPC Synthesis Filter, 131)와, 상기 LPC합성필터(131)로부터 출력되는 음성신호 상기 음성데이터의 게인(gain)과 매칭(matching)하는 게인매칭부(Gain Matching, 133)를 포함하여 구성된다.
이때, 상기 노이즈는 16kHz로 샘플링되고, 평균이 0이며, 단위 분산(unit variance)인 가우시안 노이즈(Gaussian noise)이다.
상기 하이패스필터(HPF, 132)는 가상의 광대역 음성을 생성하기 위해 상기 입력되는 가우시안 노이즈(Gaussian noise)를 4kHz 내지 8kHz 대역으로 필터링한다.
상기 LPC합성필터(131)는 상기 언팩킹부(110)로부터 입력되는 게인(Gain), LSP 등의 음성파라미터를 이용하여 상기 하이패스필터(HPF, 132)로부터 입력되는 노이즈 신호로부터 음성신호를 출력한다.
즉, 상기 LPC합성필터(131)는 저대역신호인 상기 음성데이터의 LSP를 이용하여, 상기 하이패스필터(HPF)를 통해 필터링된 가우시안 노이즈 즉, 상기 노이즈 신호로부터 LPC 계수를 생성하게 된다.
상기 게인매칭부(133)는 상기 LPC합성필터(131)로부터 출력되는 음성신호를 상기 음성데이터의 게인(Gain)과 매칭(Matching)하여 가상의 음성데이터를 출력한다.
상기 음성합성부(140)는 상기 음성디코딩부(120)로부터 출력되는 16kHz샘플링된 음성데이터와, 상기 음성생성부(130)로부터 출력되는 가상의 음성데이터를 가산하여 음성을 합성함으로서, 가상의 광대역 음성을 출력한다.
따라서, 상기 이동통신 단말기는 상기 음성디코딩부(120)와, 상기 음성생성부(130)를 통해 고대역과 저대역의 음성을 독립적으로 모델링하여 합성하고, 저대역의 음성파라미터와, 가우시안 노이즈(Gaussian noise)를 이용하여 광대역의 음성을 구현함으로서, 별도의 추가 전송데이터 없이도 적은 계산량으로 기존의 수신되는 음성데이터를 이용하여 고음질의 음성을 제공할 수 있게 된다.
상기와 같이 구성된 본 발명의 동작을 살펴보면 다음과 같다. 도 4는 본 발명에 따른 이동통신 단말기의 음성 복호화 방법이 도시된 순서도이다.
타 이동통신 단말기와 음성통화시, 상대방 이동통신 단말기로부터 음성데이터가 수신되면, 수신된 음성데이터를 언팩킹(un-packing)하여 음성데이터를 분석한다. (S1, S2)
언팩킹된 음성데이터로부터 음성 파라미터를 분석하고, 상기 음성파라미터를 이용하여 음성 데이터를 디코딩한다. 이때, 상기 음성데이터의 파라미터중 피치(Pitch), 게인(Gain), LSP 를 이용하여 음성데이터를 디코딩한다. (S3a)
디코딩되어 출력되는 음성데이터의 샘플에 0을 삽입하여 상기 음성데이터를 2배 업 샘플링 한다. 여기서, 상기와 같이 2배 샘플링하는 것은 8kHz 샘플링 비율로 샘플링된 음성데이터를 16kHz 샘플링 비율로 샘플링하기 위한 것이다. (S4a)
업 샘플링된 음성데이터를 저대역으로 필터링하여 상기 업샘플된 음성데이터의 앨리어싱(Aliasing)을 제거한다.(S5a)
한편, 광대역 음성 생성을 위해 노이즈를 입력받아 필터링한다. (S3b)
이때, 상기 입력되는 노이즈를 4kHz 내지 8kHz 대역의 고대역으로 필터링한다.
여기서, 상기 입력되는 노이즈는 평균이 0이고, 16kHz의 샘플링 비율로 샘플링되며, 단위 분산인 가우시안 노이즈(Gaussian noise) 이다.
상기 언팩킹된 음성데이터로부터 입력되는 음성파라미터를 이용하여 상기 고대역 필터링된 가우시안 노이즈로 부터 음성신호를 생성한다. (S4b)
이때, 상기 음성파라미터는 상기 음성데이터의 게인(Gain)과, LSP가 사용되며, 상기 음성파라미터를 통해 상기 필터링된 가우시안 노이즈(Gaussian noise)로부터 LPC 계수를 산출한다.
상기 출력되는 음성신호를 상기 음성데이터의 저대역의 게인(Gain)과 매칭하여 가상의 음성데이터를 출력한다. (S5b)
상기 디코딩 되어 업샘플링된 음성데이터와, 가우시안 노이즈로부터 생성되는 가상의 음성데이터를 가산하여 합성한다. (S6)
구비되는 스피커를 통해 합성된 음성데이터를 출력하여 음성통화가 가능하도록 한다. (S7)
이상과 같이 본 발명에 의한 음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법을 예시된 도면을 참조로 설명하였으나, 본 명세서에 개시된 실시예와 도면에 의해 본 발명은 한정되지 않고, 기술사상이 보호되는 범위 이내에서 응용될 수 있다.
상기와 같이 구성되는 본 발명에 따른 음성 복호화 기능이 구비된 이동통신 단말기 및 그 동작방법은 수신되는 음성데이터의 저대역과 고대역을 독립적으로 모델링하여 광대역 음성을 출력하고, 저대역에서 사용되는 파라미터를 고대역 음성의 모델링에 사용하며, 고대역 음성의 특징에 따라 노이즈를 입력 신호로 사용함으로써, 별도의 전송데이터가 요구되지 않으며 적은 연산량 만으로도 넓은 대역의 고음질의 음성 출력이 가능하여, 통화품질이 크게 향상되고, 제품의 품질향상 및 신뢰 성이 크게 증가되는 효과가 있다.

Claims (12)

  1. 샘플링 된 음성데이터를 복원하는 음성디코딩부와;
    상기 음성데이터의 음성파라미터와, 입력되는 노이즈를 이용하여 가상의 음성데이터를 생성하는 음성생성부와;
    상기 음성디코딩부를 통해 복원되는 음성데이터와, 상기 음성생성부로부터 출력되는 가상의 음성데이터를 가산하여 음성을 출력하는 음성합성부를 포함하여 구성되는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기.
  2. 청구항 1 에 있어서,
    상기 음성생성부는 입력되는 노이즈를 필터링하는 하이패스필터(High Pass Filter, HPF)와;
    상기 하이패스필터(HPF)로부터 출력되는 노이즈신호를 상기 음성데이터의 파라미터를 통해 필터링하여 음성신호를 생성하는 LPC 합성필터(LPC Synthesis Filter)와;
    상기 LPC합성필터를 통해 출력되는 음성신호를 상기 음성데이터의 게인(Gain)과 매칭(Matching)하는 게인매칭부(Gain Matching)를 포함하여 구성되는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기.
  3. 청구항 2 에 있어서,
    상기 하이패스필터(HPF)는 평균이 0이고, 샘플링 비율(Sampling rate)이 16kHz인 가우시안 노이즈(Gaussian noise)를 입력받아 필터링 하는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기.
  4. 청구항 3 에 있어서,
    상기 하이패스필터(HPF)는 입력되는 가우시안 노이즈(Gaussian noise)를 4kHz 내지 8kHz 대역으로 필터링하는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기.
  5. 청구항 2 에 있어서,
    상기 LPC합성필터는 상기 음성 데이터의 게인(Gain), LSP 를 입력받아, 상기 하이패스필터(HPF)로부터 입력되는 필터링된 가우시안 노이즈로 부터 음성신호를 생성하는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기.
  6. 청구항 1 에 있어서,
    상기 음성디코딩부는 입력되는 음성데이터의 파라미터를 이용하여 음성을 복호화하는 디코더(Decoder)와;
    상기 디코딩된 음성데이터를 2배 업샘플링(Up-Sampling)하는 샘플링부와;
    상기 업샘플링 된 음성데이터를 필터링하는 로우패스필터(Low Pass Filter, LPF)를 포함하여 구성되는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통 신 단말기.
  7. 수신되는 음성데이터를 언팩킹(Un-packing)하여 음성파라미터를 분석하는 제 1 단계와;
    상기 음성파라미터를 이용하여 음성데이터를 디코딩하는 제 2 단계와;
    상기 음성파라미터와 입력되는 노이즈를 이용하여 가상의 음성데이터를 생성하는 제 3단계와;
    상기 디코딩된 음성데이터와, 생성된 가상의 음성데이터를 가산하여 합성된 음성을 출력하는 제 4단계를 포함하여 이루어지는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기의 동작방법.
  8. 청구항 7 에 있어서,
    상기 제 2 단계는 상기 음성파라미터를 이용하여 음성데이터를 복호화 하는 제 1 과정과;
    출력되는 음성데이터를 2배 업 샘플링(Up-sampling)하는 제 2 과정과;
    업샘플된 음성데이터를 필터링하여 앨리어싱(Aliasing)을 제거하는 제 3 과정을 포함하여 이루어지는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기의 동작방법.
  9. 청구항 7 에 있어서,
    제 3 단계는 입력되는 노이즈를 필터링하는 제 4과정과;
    상기 음성 파라미터를 이용하여 필터링된 노이즈로부터 음성신호를 생성하고, LPC 계수를 생성하는 제 5 과정과;
    출력되는 음성신호를 상기 음성데이터의 게인(Gain)과 매칭(Matching)하여 가상의 음성데이터를 출력하는 제 6과정을 포함하여 이루어지는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기의 동작방법.
  10. 청구항 7 에 있어서,
    상기 노이즈는 평균이 0 이고, 샘플링 비율이 16kHz인 가우시안 노이즈(Gaussian noise)인 것을 특징으로 하는 음성복호화 기능이 구비된 이동통신 단말기의 동작방법.
  11. 청구항 9 에 있어서,
    상기 제 4 과정은 입력되는 가우시안 노이즈(Gaussian noise)를 4kHz 내지 8kHz 대역으로 필터링하는 것을 특징으로 하는 음성 복호화 기능이 구비된 이동통신 단말기의 동작방법.
  12. 청구항 9 에 있어서,
    상기 제 5 과정은 상기 음성 파라미터가 상기 음성데이터의 게인(Gain)과, LSP인 것을 특징으로 음성 복호화 기능이 구비된 이동통신 단말기의 동작방법.
KR1020050047739A 2005-06-03 2005-06-03 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법 KR100653783B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050047739A KR100653783B1 (ko) 2005-06-03 2005-06-03 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법
CN2006100749434A CN1873777B (zh) 2005-06-03 2006-04-25 具有语音解码功能的移动通信终端及其动作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050047739A KR100653783B1 (ko) 2005-06-03 2005-06-03 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법

Publications (1)

Publication Number Publication Date
KR100653783B1 true KR100653783B1 (ko) 2006-12-06

Family

ID=37484220

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050047739A KR100653783B1 (ko) 2005-06-03 2005-06-03 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법

Country Status (2)

Country Link
KR (1) KR100653783B1 (ko)
CN (1) CN1873777B (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105764002B (zh) 2014-12-17 2019-10-01 南宁富桂精密工业有限公司 音频信号处理电路
CN113257261A (zh) * 2021-05-13 2021-08-13 柒星通信科技(北京)有限公司 一种利用语音信道传输数据的方法

Also Published As

Publication number Publication date
CN1873777A (zh) 2006-12-06
CN1873777B (zh) 2011-03-09

Similar Documents

Publication Publication Date Title
AU2005234181B2 (en) Coding of audio signals
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
CN100365706C (zh) 解码语音的音调增强的方法和装置
JP4063670B2 (ja) 広帯域信号伝送システム
EP1423847B1 (en) Reconstruction of high frequency components
JP4777918B2 (ja) 音声処理装置及び音声を処理する方法
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
US20080249766A1 (en) Scalable Decoder And Expanded Layer Disappearance Hiding Method
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
JP2007532963A5 (ko)
JP2000305599A (ja) 音声合成装置及び方法、電話装置並びにプログラム提供媒体
TWI597721B (zh) 使用多個子頻帶之高頻帶信號寫碼
JP5457171B2 (ja) オーディオデコーダ内で信号を後処理する方法
KR100653783B1 (ko) 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP2000134162A (ja) 帯域幅拡張方法及び装置
JP3230790B2 (ja) 広帯域音声信号復元方法
JP3598111B2 (ja) 広帯域音声復元装置
Nishimura Steganographic band width extension for the AMR codec of low-bit-rate modes
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3598112B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
Herre et al. 18. Perceptual Perceptual Audio Coding of Speech Signals
JP2000181495A (ja) 受信装置及び方法、通信装置及び方法
JP2004046238A (ja) 広帯域音声復元装置及び広帯域音声復元方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121026

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131024

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141024

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151023

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee