KR100587953B1 - 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 - Google Patents

대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 Download PDF

Info

Publication number
KR100587953B1
KR100587953B1 KR1020030097824A KR20030097824A KR100587953B1 KR 100587953 B1 KR100587953 B1 KR 100587953B1 KR 1020030097824 A KR1020030097824 A KR 1020030097824A KR 20030097824 A KR20030097824 A KR 20030097824A KR 100587953 B1 KR100587953 B1 KR 100587953B1
Authority
KR
South Korea
Prior art keywords
band
low
speech
excitation signal
lpc
Prior art date
Application number
KR1020030097824A
Other languages
English (en)
Other versions
KR20050066525A (ko
Inventor
성종모
김도영
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020030097824A priority Critical patent/KR100587953B1/ko
Priority to US10/943,118 priority patent/US7596492B2/en
Publication of KR20050066525A publication Critical patent/KR20050066525A/ko
Application granted granted Critical
Publication of KR100587953B1 publication Critical patent/KR100587953B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/18Phase-modulated carrier systems, i.e. using phase-shift keying
    • H04L27/22Demodulator circuits; Receiver circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 대역-분할 방식의 광대역 코덱에서 고대역에 대한 패킷 분실 및 프레임 오류를 효과적으로 은닉함으로써, 고품질의 음성 통화를 가능하게 하기 위한 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템을 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치에 있어서, 고대역 오류 검출에 따라, 외부의 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출수단; 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성수단; 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성수단; 상기 고대역 여기신호 생성 수단에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성수단에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성수단; 및 상기 고대역 음성 합성수단을 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링 수단을 포함하되, 상기 고대역 여기신호 생성수단은, 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 저대역 여기신호 추출수단; 상기 저대역 여기신호 추출수단으로부터 출력되는 저대역 여기신호의 거울 이미지를 고대역에 생성하기 위해 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 주파수 변환수단; 및 상기 주파수 변환수단을 통해 샘플링 주파수를 변환한 여기신호에서 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 여기신호 추출수단을 포함함.
4. 발명의 중요한 용도
본 발명은 대역-분할 광대역 음성 코덱 등에 이용됨.
고대역, 저대역, 고대역 오류 은닉, 광대역 합성 음성

Description

대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템{Packet loss concealment apparatus for high-band in split-band wideband speech codec, and system for decoding bit-stream using the same}
도 1 은 일반적인 대역-분할 음성 코덱 시스템의 전송 블록도.
도 2 는 본 발명에 따른 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템의 일실시예 구성도.
도 3 은 본 발명에 따른 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치의 일실시예 구성도.
도 4a 및 도 4b 는 본 발명에 따른 고대역 오류 은닉 장치 중 고대역 여기신호 생성기의 일실시예 설명도.
도 5 는 본 발명에 따른 고대역 오류 은닉 장치 중 고대역 LPC 계수 생성기의 일실시예 설명도.
* 도면의 주요 부분에 대한 부호의 설명
210 : 패킷 분실 검출부 220 : 역-다중화부
230 : 저대역 복호화부 240 : 고대역 복호화부
250 : 덧셈부
본 발명은 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템에 관한 것으로, 더욱 상세하게는 오류 패킷 및 손실 패킷 발생시에 대역-분할 방식 광대역 음성 코덱의 고대역에 해당하는 자연스러운 음성을 복원하기 위한 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템에 관한 것이다.
음성을 디지털로 전송하는 기술은 기존 전화망을 비롯한 유선 통신뿐만 아니라 무선 통신을 비롯하여 최근에 많은 관심을 끌고 있는 VoIP(Voice over IP) 망에서도 널리 사용되고 있다. 이러한 광대역 음성 코덱 중 음성을 단순하게 샘플링한 후 디지털화하여 전송한다면 64kbps(8kHz로 샘플링하고 각 샘플을 8bit로 코딩하는 경우) 정도의 데이터 전송율을 필요로 하게 된다. 그러나 음성 분석과 적절한 코딩을 이용한다면 훨씬 더 낮은 데이터 전송율로 음성을 전송할 수 있게 된다.
이와 같이, 음성을 디지털로 전송하는 장치를 음성 코덱이라고 한다. 기존의 대부분의 음성 코덱은 소위 협대역 음성 코덱으로 음성의 300Hz~3400Hz의 대역만을 대상으로 부호화 과정을 거친다. 그러나 최근에는 기존 협대역 음성 부호화 방식에 비해 더 나은 음질을 제공하기 위해 50Hz~7000Hz에 해당하는 대역을 부호화하는 광대역 음성 코덱이 대두되고 있으며, ITU-T(International Telecommunication Union-Telecommunication)를 비롯하여 3GPP(3rd Generation Partnership Project), 3GPP2(3rd Generation Partnership Project 2) 등의 표준화 단체를 통해 광대역 음성 코덱에 대한 표준이 제정되고 있는 실정이다. 대역-분할 광대역 음성 코덱은 이러한 광대역 음성 코덱의 한 종류로, 50Hz~7000Hz에 해당하는 음성의 전체 대역을 두 개의 대역으로 나누어 각 대역을 각각의 방식으로 부호화하는 방법을 이용한다.
도 1 은 일반적인 대역-분할 음성 코덱 시스템의 전송 블록도이다.
도 1에 도시된 바와 같이, 먼저 송신측에서는 16kHz로 샘플링된 입력 음성(100)을 각각 저대역 통과 필터(111)와 고대역 통과 필터(121)를 거쳐 입력 음성(100)과 동일한 샘플링 주파수를 갖는 저대역 음성 신호와 고대역 음성 신호로 분리한다. 이후, 16kHz의 저대역 음성 신호는 다운-샘플러(112)를 거쳐 8kHz의 샘플링 주파수를 갖는 저대역 음성 신호로 변환되고, 동일하게 16kHz의 고대역 음성 신호는 다운-샘플러(122)를 거쳐 8kHz의 샘플링 주파수를 갖는 고대역 음성 신호로 변환된다. 이후, 8KHz의 저대역 음성 신호는 저대역 부호화기(113)를 통해 저대역 음성에 해당하는 비트스트림으로 부호화되고, 8KHz의 고대역 음성 신호는 고대역 부호화기(123)를 통해서 고대역에 해당하는 비트스트림으로 부호화된다. 각각의 저대역/고대역 부호화기(113, 123)를 거쳐 부호화된 두 비트스트림은 다중화기(150)를 통해 광대역 음성에 대한 비트스트림(101)으로 패킹되어 채널(160)로 전송된다.
이렇게, 채널(160)을 통해서 전송된 광대역 음성에 대한 비트스트림(102)은 수신단에서 역-다중화기(170)를 통해서 저대역에 해당하는 비트스트림과 고대역에 해당하는 비트스트림으로 나누어져 각 대역에 대한 복호화기(131, 141)로 보내진다. 즉, 저대역에 해당하는 비트스트림은 저대역 복호화기(131)를 통해서 8KHz의 샘플링 주파수를 갖는 저대역 음성 신호로 복호화되고, 고대역에 해당하는 비트스트림은 고대역 복호화기(141)를 통해서 8KHz의 샘플링 주파수를 갖는 고대역 음성 신호로 복호화된다. 이후, 복호화된 저대역 음성 신호는 업-샘플러(132)를 거쳐 16KHz의 저대역 음성 신호로 변환되고, 복호화된 고대역 음성 신호는 동일하게 업-샘플러(142)를 거쳐 16KHz의 고대역 음성 신호로 변환된다. 이후, 16KHz의 저대역 음성 신호는 불필요한 고대역 성분을 제거하기 위해 저대역 통과 필터(133)를 통과시키고, 16KHz의 고대역 음성 신호는 불필요한 저대역 성분을 제거하기 위해 고대역 통과 필터(143)를 통과시킨다. 최종적으로, 두 신호를 덧셈기(180)를 통해 더함으로써 합성 음성(103)을 얻을 수 있다.
상기 대역-분할 방식의 광대역 음성 코덱은 저대역 부호화 방식과 고대역 부호화 방식으로 기존에 널리 사용되고 있는 PCM(Pulse Coded Modulaton), CELP(Code-Excited Linear Prediction), 트랜스폼 코딩(Transform Coding) 등의 음성 부호화 방식을 이용해서 독립적으로 적용 가능하다. 예를 들어, 저대역 부호화 방식으로 CELP(Code-Excited Linear Prediction)를 채용하고, 고대역 부호화 방식으로 CELP 혹은 트랜스폼 코딩(Transform Coding)을 채용하는 대역-분할 방식 광대역 음성 코덱이 대표적이다.
현존하는 대부분의 음성 코덱은 채널에서 발생할 수 있는 패킷 분실 및 오류에 강인하게 대처할 수 있도록 패킷 분실 은닉(Packet Loss Concealment) 알고리즘 혹은 프레임 삭제 은닉(Frame Erasure Concealment) 알고리즘을 채용하고 있다.
그러나 이러한 알고리즘들은 대부분 협대역 음성 코덱에 한정되어 있으며, 또한 채용하고 있는 음성 부호화 방식에 종속되어 있다. 상기 대역-분할 방식의 광대역 음성 코덱에서는 일반적으로 서로 다른 저대역 음성 부호화 방식과 고대역 음성 부호화 방식을 채용하고 있으며 이로 인해 고대역 부호화 방식에 따라 별도의 오류 은닉부를 설계해야 하는 문제점을 가진다.
본 발명은, 상기한 바와 같은 문제점을 해결하기 위하여 제안된 것으로, 대역-분할 방식의 광대역 코덱에서 고대역에 대한 패킷 분실 및 프레임 오류를 효과적으로 은닉함으로써, 고품질의 음성 통화를 가능하게 하기 위한 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템을 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명의 장치는, 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치에 있어서, 고대역 오류 검출에 따라, 외부의 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출수단; 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성수단; 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성수단; 상기 고대역 여기신호 생성 수단에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성수단에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성수단; 및 상기 고대역 음성 합성수단을 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링 수단을 포함하되, 상기 고대역 여기신호 생성수단은, 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 저대역 여기신호 추출수단; 상기 저대역 여기신호 추출수단으로부터 출력되는 저대역 여기신호의 거울 이미지를 고대역에 생성하기 위해 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 주파수 변환수단; 및 상기 주파수 변환수단을 통해 샘플링 주파수를 변환한 여기신호에서 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 여기신호 추출수단을 포함한다.
또한, 본 발명은, 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치에 있어서, 고대역 오류 검출에 따라, 외부의 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출수단; 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성수단; 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성수단; 상기 고대역 여기신호 생성 수단에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성수단에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성수단; 및 상기 고대역 음성 합성수단을 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링 수단을 포함하되, 상기 고대역 여기신호 생성수단은, 상기 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 저대역 여기신호 추출수단; 상기 저대역 여기신호 추출수단으로부터 출력되는 저대역 여기신호를 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 주파수 변환수단; 상기 주파수 변환수단을 통해 샘플링 주파수를 변환한 여기신호에서 불필요한 고대역 성분(고대역에 존재하는 저대역의 거울 이미지)을 제거하기 위한 저대역 통과 필터링 수단; 상기 저대역 통과 필터링 수단을 통해 불필요한 고대역 성분을 제거한 여기신호에 비선형 왜곡을 가해 고대역 성분을 생성하기 위한 비선형 왜곡 수단; 및 상기 비선형 왜곡 수단을 통해 왜곡시킨 여기신호에서 불필요한 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 여기신호 추출수단을 포함한다.
또한, 본 발명은, 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템에 있어서, 입력 패킷의 분실 여부를 판단하기 위한 패킷 분실 검출수단; 상기 입력 패킷을 분석하여 각 프레임별로 저대역 비트스트림과 고대역 비트스트림으로 분리하기 위한 분리수단; 상기 분리수단으로부터의 저대역 비트스트림의 오류 여부와 상기 패킷 분실 검출수단의 출력값에 따라 상기 분리수단으로부터의 저대역 비트스트림에서 저대역 음성을 합성하기 위한 저대역 복호화수단; 상기 분리수단으로부터 전달받은 고대역 비트스트림을 검사하여 프레임 오류 여부를 판단하여 고대역 오류를 검출하기 위한 고대역 오류 검출수단; 상기 패킷 분실 검출수단의 출력값과 상기 고대역 오류 검출수단의 출력값에 따라, 고대역 음성을 합성할 장치를 선택하기 위한 제1 선택수단; 상기 제1 선택수단에 의해 선택되어 분실 또는 오류 고대역 프레임에 대해서 상기 저대역 복호화수단으로부터의 제1 저대역 합성 음성을 이용하여 오류를 은닉하여 고대역 음성을 합성하기 위한 고대역 오류 은닉수단; 상기 제1 선택수단에 의해 선택되어 정상 고대역 프레임에 대해서 고대역 음성을 합성하기 위한 고대역 음성 합성 수단; 상기 패킷 분실 검출수단의 출력과 상기 고대역 오류 검출수단의 출력에 따라, 고대역 합성 음성을 출력할 장치를 선택하기 위한 제2 선택수단; 및 상기 저대역 복호화수단으로부터의 제2 저대역 합성 음성과 상기 제2 선택수단에 의하여 선택된 수단으로부터의 고대역 합성 음성을 더하여 광대역 합성 음성을 출력하기 위한 출력수단을 포함한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 2 는 본 발명에 따른 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템의 일실시예 구성도이다.
도 2에 도시된 바와 같이, 본 발명에 따른 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템은, 입력 패킷(입력 비트스트림)의 분실 여부를 판단하기 위한 패킷 분실 검출부(210)와, 입력 패킷을 분석하여 각 프레임 별로 저대역 비트스트림과 고대역 비트스트림으로 분리하기 위한 역-다중화부(220)와, 역-다중화부(220)로부터의 저대역 비트스트림의 오류 여부와 패킷 분실 검출부(210)의 출력값에 따라 상기 역-다중화부(220)로부터의 저대역 비트스트림에서 저대역 음성을 합성하고 그 결과를 고대역 복호화부(240)의 고대역 오류 은닉기(247)로 전달하기 위한 저대역 복호화부(230)와, 역-다중화부(220)로부터 전달받은 고대역 비트스트림을 검사하여 프레임 오류 여부를 판단하여 고대역 오류를 검출하기 위한 고대역 오류 검출기(241), 패킷 분실 검출부(210)의 출력값과 고대역 오류 검출기(241)의 출력값에 따라, 고대역 음성을 합성할 장치(복호화할 장치)를 선택하기 위한 스위치3(242), 스위치3(242)에 의해 선택되어 분실된 고대역 프레임 혹은 오류가 발생한 고대역 프레임에 대해서 저대역 복호화부(230)로부터의 저대역 합성 음성(206)을 이용하여 오류를 은닉하여 고대역 음성을 합성하기 위한 고대역 오류 은닉기(247), 스위치3(242)에 의해 선택되어 정상 고대역 프레임에 대해서 고대역 음성을 합성하기 위한 고대역 복호화기(243)와 업 샘플러(245)와 고대역 통과 필터(246), 패킷 분실 검출부(210)의 출력과 고대역 오류 검출기(241)의 출력에 따라, 고대역 합성 음성을 출력할 장치를 선택하기 위한 스위치4(244)를 포함하는 고대역 복호화부(240), 및 저대역 복호화부(230)로부터의 저대역 합성 음성(203)과 고대역 복호화부(240)로부터의 고대역 합성 음성(204)을 더하여 광대역 합성 음성(205)을 출력하기 위한 덧셈부(250)를 구비한다.
도 2에 도시된 바와 같이, 패킷 분실 검출부(210)는 채널을 통해 패킷이 전달되는 과정에서 채널의 상태에 의해 분실되었는지 여부를 판단한다. 만약, 패킷이 분실되었다면 BFI_PL(Bad Frame Indicator for Packet Loss, 260A)을 1로 세팅하고, 분실되지 않았다면 BFI_PL(260A)을 0으로 세팅한다.
역-다중화부(220)는 송신단에서 다중화된 입력 비트스트림(200)을 저대역 비트스트림(201)과 고대역 비트스트림(202)으로 나누어 각각을 저대역 복호화부(230)와 고대역 복호화부(240)로 전달하는 과정을 수행한다. 여기서, 저대역 복호화부(230)는 저대역 비트스트림(201)으로부터 저대역 합성 음성(203)을 복호화하고, 고대역 복호화부(240)는 고대역 비트스트림(202)으로부터 고대역 합성 음성(204)을 복호화한다. 덧셈부(250)는 저대역 합성 음성(203)과 고대역 합성 음성(204)을 더하여 광대역 합성 음성(205)을 출력한다.
한편, 저대역 복호화부(230)는 저대역 오류 검출기(231), 스위치1(232), 저대역 복호화기(233), 저대역 오류 은닉기(237), 스위치2(234), 업-샘플러(235) 및 저대역 통과 필터(236)를 포함한다.
여기서, 저대역 오류 검출기(231)는 저대역 비트스트림(201)을 분석하여 비트스트림에 오류가 있는지 여부를 판단한다. 만약, 오류가 있다면 BFI_LE(Bad Frame Indicator for Lowband Error, 260B)를 1로 세팅하고, 오류가 없다면 BFI_LE(260B)를 0으로 세팅한다.
스위치1(232)은 패킷 분실 검출부(210)의 출력인 BFI_PL(260A)과 저대역 오류 검출기(231)의 출력인 BFI_LE(260B)를 검사하여 두 값 모두 0인 경우(즉, 분실이나 오류가 발생하지 않은 정상 프레임)에는 저대역 비트스트림(201)을 저대역 복호화기(233)로 전달하고, 나머지 경우(즉, 분실이나 오류가 발생한 오류 프레임)에는 저대역 오류 은닉기(237)로 저대역 비트스트림(201)을 전달한다.
저대역 복호화기(233)는 스위치1(232)로부터 전달된 저대역 비트스트림(201)으로부터 지정된 복호화 방식에 따라 정상적으로 복호화 과정을 수행하고, 고대역 오류 은닉을 위해서 합성된 저대역 합성 음성(206)을 저장한다.
저대역 오류 은닉기(237)는 정상적인 이전 프레임의 저대역 복호화 과정에서 얻어진 정보를 이용하여 분실 및 오류가 발생한 현재 프레임의 저대역에 대한 음성을 복원하고, 고대역 오류 은닉을 위해서 복원된 저대역 합성 음성(206)을 저장한다.
스위치2(234)는 스위치1(232)과 동일하게 패킷 분실 검출부(210)로부터 얻어지는 BFI_PL(260A)과 저대역 오류 검출기(231)로부터 얻어지는 BFI_LE(260B)의 값에 따라 저대역 복호화기(233)의 출력과 저대역 오류 은닉기(237)의 출력을 선택한다. 만약, BFI_PL(260A)과 BFI_LE(260B) 두 값이 모두 0인 경우(즉, 정상 프레임)에는 저대역 복호화기(233)의 출력을 선택하여 업-샘플러(235)로 전달하고, 나머지 경우(즉, 오류 프레임)에는 저대역 오류 은닉기(237)의 출력을 선택하여 업-샘플러(235)로 전달한다.
업-샘플러(235)는 저대역 복호화기(233)로부터 복호화된 음성 혹은 저대역 오류 은닉기(237)로부터 복원된 음성을 16KHz의 샘플링 주파수를 갖는 음성으로 변환한다.
저대역 통과 필터(236)는 16KHz로 샘플링 주파수 변환된 음성에서 고대역 성분을 제거하는 필터링 과정을 통해 저대역 합성 음성(203)을 출력한다.
한편, 고대역 복호화부(240)는 고대역 오류 검출기(241), 스위치3(242), 고대역 복호화기(243), 스위치4(244), 업-샘플러(245), 고대역 통과 필터(246), 및 고대역 오류 은닉기(247)를 포함한다.
여기서, 고대역 오류 검출기(241)는 고대역 비트스트림(202)을 분석하여 비트스트림에 오류가 있는지 여부를 판단한다. 만약, 오류가 있다면 BFI_HE(Bad Frame Indicator for Highband Error, 260C)를 1로 세팅하고, 오류가 없다면 BFI_HE(260C)를 0으로 세팅한다.
스위치3(242)은 패킷 분실 검출부(210)의 출력인 BFI_PL(260A)과 고대역 오류 검출기(241)의 출력인 BFI_HE(260C)를 검사하여 두 값 모두 0인 경우(즉, 분실이나 오류가 발생하지 않은 정상 프레임)에는 고대역 비트스트림(202)을 고대역 복호화기(243)로 전달하고, 나머지 경우(즉, 분실이나 오류가 발생한 오류 프레임)에는 고대역 오류 은닉기(247)로 구동제어신호를 전달한다.
고대역 복호화기(243)는 스위치3(242)을 통하여 전달된 고대역 비트스트림(202)으로부터 지정된 복호화 방식에 따라 정상적으로 복호화 과정을 수행한다. 고대역 오류 은닉기(247)는 스위치3(242)으로부터의 구동제어신호에 따라 구동되어, 현재 프레임의 저대역 복호화 혹은 은닉 과정에서 얻어진 저대역 합성 음성(206)을 이용하여 분실 및 오류가 발생한 고대역 프레임에 대한 음성을 복원한다.
스위치4(244)는 스위치3(242)과 유사하게 패킷 분실 검출부(210)로부터 얻어지는 BFI_PL(260A)과 고대역 오류 검출기(241)로부터 얻어지는 BFI_HE(260C)의 값에 따라 고대역 복호화기(243)의 출력과 고대역 오류 은닉기(247)의 출력을 선택한다. 만약, BFI_PL(260A)과 BFI_HE(260C) 두 값이 모두 0인 경우(즉, 정상 프레임)에는 고대역 통과 필터(246)의 출력을 선택하여 덧셈부(250)로 전달하고, 나머지 경우(즉, 오류 프레임)에는 고대역 오류 은닉기(247)의 출력을 선택하여 덧셈부(250)로 전달한다.
업-샘플러(245)는 정상 프레임에 대해서 고대역 복호화기(243)를 거쳐 복호 화된 8KHz 고대역 음성을 16KHz의 샘플링 주파수를 갖는 음성으로 변환한다.
고대역 통과 필터(246)는 16KHz의 샘플링 주파수로 변환된 음성에서 필터링 과정을 통해 저대역 성분을 제거한 후, 스위치4(244)를 통해 고대역 합성 음성(204)을 출력한다.
도 3 은 본 발명에 따른 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치의 일실시예 구성도로서, 스위치3(242)으로부터의 구동제어신호에 따라 구동된다.
도 3에 도시된 바와 같이, 본 발명에 따른 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치(고대역 오류 은닉기(247))는, 저대역 복호화부(230)로부터 전달받은 저대역 합성 음성(206)에 대해서 선형 예측 코딩(LPC : Linear Predictive Coding) 분석을 통해 저대역 LPC 계수(311)를 추출하기 위한 저대역 LPC 계수 추출기(360)와, 상기 저대역 복호화부(230)로부터 전달받은 저대역 합성 음성(206)과 저대역 LPC 계수 추출기(360)에서 추출한 저대역 LPC 계수(311)를 이용하여 고대역에 해당하는 16KHz 여기신호를 생성하기 위한 고대역 여기신호 생성기(320)와, 저대역 LPC 계수 추출기(360)에서 추출한 저대역 LPC 계수(311)로부터 고대역에 해당하는 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성기(330)와, 고대역 여기신호 생성기(320)에서 생성한 고대역 여기신호와 고대역 LPC 계수 생성기(330)에서 생성한 고대역 LPC 계수를 이용해서 16KHz 고대역 음성(312)을 합성하기 위한 LPC 합성 필터(340)와, LPC 합성 필터(340)를 통해 합성된 고대역 음성에 포함되어 있는 불필요한 저대역 성분을 제거하여 고대역 합성 음성(312)을 생성하기 위한 고대역 통과 필터(350)를 구비한다.
여기서, LPC 합성 필터(340)는 하기의 [수학식 1]과 같은 형태로 표현된다.
Figure 112006005273456-pat00001
여기서, {a i }는 고대역 LPC 계수이고, p는 LPC 차수이다.
도 4a 및 도 4b 는 본 발명에 따른 고대역 오류 은닉 장치 중 고대역 여기신호 생성기의 일실시예 설명도로서, 고대역 여기신호 생성기(320)에서 저대역 음성 신호로부터 고대역 여기신호를 생성하는 구성도를 스펙트럼 폴딩(Spectral Folding), 비선형 왜곡(Nonlinear Distortion) 과정에 대해서 나타낸 것이다.
여기서, 두 가지 방법은 모두 저대역 음성과 고대역 음성이 서로 상관관계를 가진다는 점을 이용한 것으로, 블록간에 존재하는 그림은 각 신호의 스펙트럼의 대표적인 형태를 나타낸 것이다. 또한, 가로축(f)는 주파수를 의미한다.
도 4a는 스펙트럼 폴딩을 이용한 고대역 여기신호 생성기(320)로서, 도 4a에 도시된 바와 같이 고대역 여기신호 생성기(320)는, 저대역 복호화부(230)로부터 전달받은 저대역 합성 음성(206)에 대해 저대역 LPC 계수 추출기(360)에서 추출한 저대역 LPC 계수(311)를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 LPC 분석 필터(410)와, LPC 분석 필터(410)로부터 출력되는 저대역 여기신호의 거울 이미지를 고대역에 생성하기 위해 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 업-샘플러(420) 및 업-샘플러(420)를 통해 샘플링 주파수를 변환한 여기신호에서 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 통과 필터(430)를 포함한다.
상기한 바와 같은 구조를 갖는 스펙트럼 폴딩을 이용한 고대역 여기신호 생성기의 동작을 상세하게 설명하면 다음과 같다.
LPC 분석 필터(410)는 저대역 LPC 계수(311)를 이용해서 만들어지는 필터로 8KHz의 저대역 합성 음성(206)을 통과시켜 8KHz의 샘플링 주파수를 갖는 저대역 음성의 여기신호를 추출하는 과정을 수행하며, 상기 [수학식 1]의 역-필터 형태를 갖는다. 이 과정을 거쳐 추출된 여기신호는 랜덤 잡음과 유사하게 주파수 도메인에서 평탄한 특징을 가지게 된다.
업-샘플러(420)는 추출된 저대역 여기신호의 샘플링 주파수를 16KHz로 증가시킴으로써 저대역 스펙트럼의 거울 이미지를 고대역에 생성한다.
마지막으로, 고대역 통과 필터(430)를 통과시킴으로써 고대역 성분만을 가지는 16KHz의 샘플링 주파수를 갖는 고대역 여기신호(402)를 얻는다.
도 4b는 비선형 왜곡을 이용한 고대역 여기신호 생성기(320)로서, 도 4b에 도시된 바와 같이 고대역 여기신호 생성기(320)는, 저대역 복호화부(230)로부터 전달받은 저대역 합성 음성(206)에 대해 저대역 LPC 계수 추출기(360)에서 추출한 저대역 LPC 계수(311)를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 LPC 분석 필터(440)와, LPC 분석 필터(440)로부터 출력되는 저대역 여기신호를 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 업-샘플러(450)와, 업-샘플러(450)를 통해 샘플링 주파수를 변환한 여기신호에서 불필요한 고대역 성분(고대역에 존재하는 저대역의 거울 이미지)을 제거하기 위한 저대역 통과 필터(460)와, 저대역 통과 필터(460)를 통해 불필요한 고대역 성분을 제거한 여기신호에 절대값 함수와 같은 비선형 왜곡을 가해 고대역 성분을 생성하기 위한 비선형 왜곡기(470) 및 비선형 왜곡기(470)를 통해 왜곡시킨 여기신호에서 불필요한 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 통과 필터(480)를 포함한다.
상기한 바와 같은 구조를 갖는 비선형 왜곡을 이용한 고대역 여기신호 생성기(320)의 동작을 상세하게 설명하면 다음과 같다.
LPC 분석 필터(440)는 저대역 LPC 계수(311)를 이용해서 만들어지는 필터로 8KHz의 저대역 합성 음성(403)을 통과시켜 8KHz의 샘플링 주파수를 갖는 저대역 음성의 여기신호를 추출하는 과정을 수행한다.
업-샘플러(450)는 추출된 여기신호의 샘플링 주파수를 16KHz로 증가시키는 과정을 수행한다. 업-샘플러(450)의 출력 신호는 16KHz의 샘플링 주파수를 가지며, 고대역에 저대역의 거울 이미지가 존재하는데 이 거울 이미지를 제거하기 위해 저대역 통과 필터(460)를 거친다.
저대역 통과 필터(460)를 거친 여기신호는 고대역에 왜곡이 없는 16KHz의 샘플링 주파수를 갖는 신호가 된다.
비선형 왜곡기(470)는 저대역 통과 필터(460)의 출력 여기신호를 제곱 함수 및 절대값 함수과 같은 비선형 함수를 통과시킴으로써 고대역 여기신호를 얻는다. 이렇게 얻어진 여기신호는 저대역 여기신호와 위상이 일치하면서 스펙트럼 왜곡 없는 하모닉 구조를 유지하게 된다.
고대역 통과 필터(480)는 비선형 왜곡을 거친 여기신호에서 저대역 성분을 제거한다.
도 5 는 본 발명에 따른 고대역 오류 은닉 장치 중 고대역 LPC 계수 생성기(330)의 일실시예 설명도로서, 저대역 LPC 계수(311)로부터 고대역 LPC 계수 를 생성하는 과정을 나타낸 것이다.
도 5에 도시된 바와 같이, 고대역 LPC 계수 생성기(330)는, 저대역 LPC 계수 추출기(360)로부터의 저대역 LPC 계수(311)를 코드북 검색을 위한 LSP(Line Spectral Pair) 타입으로 변환하기 위한 타입 변환기A(510)와, 타입 변환기A(510)에서 변환한 저대역 LSP 계수 벡터와 가장 유사한 코드워드 벡터를 저대역 코드북(567)에서 검색하여 해당 인덱스를 출력하기 위한 저대역 코드북 검색기(520)와, 저대역 코드북 검색기(520)에서 검색한 인덱스에 해당하는 고대역 LSP 코드워드를 고대역 코드북(577)에서 검색하기 위한 고대역 코드북 검색기(530)와, 고대역 코드북 검색기(530)에서 검색한 고대역 LSP 코드워드를 고대역 LPC 계수로 변환하기 위한 타입 변환기B(540)와, 코드북 훈련부(590)를 통해 훈련된 저대역 LSP 코드워드 벡터를 저장하고 있는 저대역 코드북(567) 및 코드북 훈련부(590)를 통해 훈련된 고대역 LSP 코드워드 벡터를 저장하고 있는 고대역 코드북(577)을 포함한다.
상기한 바와 같은 구조를 갖는 고대역 LPC 계수 생성기(330)의 동작을 상세하게 설명하면 다음과 같다.
타입 변환기A(510)는 저대역 LPC 계수(311)를 코드북 검색을 위해 코드북 내의 코드워드와 동일한 타입으로 변환하는 기능을 수행한다. 일실시예에는 각 코드워드로 LSP를 사용하므로 저대역 LPC 계수(311)를 저대역 LSP 계수로 변환한다.
저대역 코드북 검색기(520)는 변환된 저대역 LSP 계수와 가장 가까운 코드워드를 미리 훈련된 저대역 코드북(567)에서 검색한 후, 코드워드의 인덱스(501)를 출력한다. 코드북 검색은 코드북에 존재하는 모든 코드워드에 대해 하기의 [수학식 2]와 같은 거리 측정 방법을 통해서 거리가 가장 작은 값을 갖는 코드워드를 선택한다.
Figure 112006005273456-pat00002
여기서, l in p차의 입력 LSP 계수 벡터이고, l cw p차의 코드북의 코드워드 벡터이며, p는 벡터의 차수이다.
고대역 코드북 검색기(530)는 저대역 코드북 검색기(520)로부터 전달받은 인덱스(501)를 이용하여 미리 훈련된 고대역 코드북(577)을 검색하고, 그 결과로 고대역 LSP 계수에 해당하는 코드워드를 출력한다.
타입 변환기B(540)는 고대역 LSP 계수를 고대역 LPC 계수(502)로 변환한다.
저대역 코드북(567)과 고대역 코드북(577) 쌍은 고대역 LPC 계수 생성 과정에 앞서 코드북 훈련부(590)에서 오프-라인으로 미리 훈련된다.
코드북 훈련부(590)는 광대역 음성 데이터베이스(550)에 수집된 모든 음성 샘플들에 대해서 고대역 성분을 제거하고 저대역 성분만을 가지는 저대역 음성 신호를 얻기 위한 저대역 통과 필터(560)와, 저대역 통과 필터(560)를 통과한 음성 신호의 샘플링 주파수를 16KHz에서 8KHz로 변환하여 저대역 음성을 출력하는 다운-샘플러(561)와, 광대역 음성 데이터베이스(550)에 수집된 모든 음성 샘플들에 대해서 저대역 성분을 제거하고 고대역 성분만을 가지는 고대역 음성 신호를 얻기 위한 고대역 통과 필터(570)와, 다운-샘플러(561)를 통해서 주파수 변환된 저대역 음성 데이터베이스(562)의 모든 음성 샘플에 대해서 LPC 분석을 통해 저대역 LPC 계수를 추출하는 저대역 LPC 분석기(563)와, 저대역 LPC 분석기(563)로부터의 저대역 LPC 계수를 벡터 양자화에 적합한 타입인 LSP 벡터로 변환하는 저대역 타입 변환기(564)와, 저대역 타입 변환기(564)를 통해서 LSP 벡터로 변환된 저대역 LSP 데이터베이스(565)의 모든 LSP 벡터들의 대표값들을 찾아 저대역 코드북(567)을 생성하고 각 LSP 벡터들에 대한 클래스 정보를 출력하는 저대역 벡터 양자화기(566)와, 고대역 통과 필터(570)를 통해서 저대역 성분이 제거된 고대역 음성 데이터베이스(572)의 모든 음성 샘플에 대해서 LPC 분석을 통해 고대역 LPC 계수를 추출하는 고대역 LPC 분석기(573)와, 고대역 LPC 분석기(573)를 통해 출력된 고대역 LPC 계수를 벡터 양자화에 적합한 타입인 LSP 벡터로 변환하는 고대역 타입 변환기(574) 및 고대역 타입 변환기(574)를 통해서 LSP 벡터로 변환된 고대역 LSP 데이터베이스(575)의 모든 LSP 벡터들과 저대역 벡터 양자화기(566)의 출력인 저대역 LSP 벡터들에 대한 클래스 정보를 이용하여 고대역 코드북을 생성하는 고대역 벡터 양자화기(576)를 포함한다.
상기한 바와 같은 구조를 갖는 코드북 훈련부(590)의 동작을 상세하게 설명하면 다음과 같다.
먼저, 미리 준비된 16KHz로 샘플링된 음성 샘플들의 집합인 광대역 음성 데이터베이스(DB)(550)를 저대역 통과 필터(560)와 다운-샘플러(561)에 통과시킴으로 해서 광대역 음성의 저대역 정보를 가지면서 8KHz의 샘플링 주파수를 갖는 저대역 음성 데이터베이스(562)로 변환한다.
이와 유사하게, 광대역 음성 데이터베이스(550)를 고대역 통과 필터(570)에 통과시킴으로 해서 광대역 음성의 고대역 정보를 가지면서 16KHz의 샘플링 주파수 를 갖는 고대역 음성 데이터베이스(572)를 생성한다.
저대역 LPC 분석기(563)는 저대역 음성 데이터베이스(562)에 있는 모든 음성 샘플을 프레임 단위로 나누어 LPC 분석 작업을 수행하여 LPC 계수를 구한다.
저대역 타입 변환기(564)는 저대역 LPC 분석기(563)를 통해 얻어진 LPC 계수를 벡터 양자화에 적합한 파라미터 타입으로 변환한다. 일실시예에서는 LSP 타입으로 변환한다. 이 과정을 저대역 음성 데이터베이스(562)에 있는 모든 음성 샘플의 각 프레임에 대해서 반복함으로써 저대역 LSP 데이터베이스(565)를 생성한다.
고대역 LSP 데이터베이스(575)는 고대역 음성 데이터베이스(572)에 있는 모든 음성 샘플의 각 프레임에 대해서 고대역 LPC 분석기(573)와 고대역 타입 변환기(574)를 거침으로써 얻어진다. 저대역 LSP 데이터베이스(565)의 각 LSP 계수 벡터들은 고대역 LSP 데이터베이스(575)의 각 LSP 계수 벡터들과 일대일로 대응된다.
저대역 벡터 양자화기(566)는 생성된 저대역 LSP 데이터베이스(565)를 이용해서 벡터 양자화를 수행한다. 벡터 양자화는 정해진 개수의 대표값을 구하는 과정으로, 일반적으로 널리 알려진 LBG(Linde, Buzo, Gray) 알고리즘 혹은 일반화된 "Lloyd" 알고리즘 등이 사용될 수 있다. 저대역 벡터 양자화의 결과로 저대역 코드북(567)과 저대역 LSP 데이터베이스(565)내에 각 LSP 계수 벡터들에 대한 클래스 정보(503)가 얻어진다.
고대역 벡터 양자화기(576)는 저대역 벡터 양자화기(566)에서 얻어진 클래스 정보(503)를 이용해서 각 클래스 별로 고대역 LSP 데이터베이스(575)의 LSP 계수 벡터들의 평균을 대표값으로 취함으로써 고대역 코드북(577)을 생성한다. 이와 같은 과정을 통해서 얻어진 두 개의 코드북 쌍(567, 577)은 동일한 인덱스를 통해서 참조될 수 있다. 상기 고대역 LPC 계수 생성 과정은 음성의 저대역 정보와 고대역 정보가 서로 밀접한 상관관계를 갖는 성질을 이용한 것이다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, 대역-분할 방식 음성 코덱에서 고대역에 해당하는 패킷 분실 및 프레임 오류로 인해 발생하는 음질 저하를 경감시킴으로써, 고품질의 광대역 음성 통신을 가능하게 하고, 고대역 음성 부호화 방법에 독립적으로 적용 가능한 효과가 있다.

Claims (10)

  1. 삭제
  2. 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치에 있어서,
    고대역 오류 검출에 따라, 외부의 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출수단;
    상기 저대역 복호화부로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성수단;
    상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성수단;
    상기 고대역 여기신호 생성 수단에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성수단에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성수단; 및
    상기 고대역 음성 합성수단을 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링 수단을 포함하되,
    상기 고대역 여기신호 생성수단은,
    상기 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 저대역 여기신호 추출수단;
    상기 저대역 여기신호 추출수단으로부터 출력되는 저대역 여기신호의 거울 이미지를 고대역에 생성하기 위해 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 주파수 변환수단; 및
    상기 주파수 변환수단을 통해 샘플링 주파수를 변환한 여기신호에서 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 여기신호 추출수단
    을 포함하는 것을 특징으로 하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치.
  3. 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치에 있어서,
    고대역 오류 검출에 따라, 외부의 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출수단;
    상기 저대역 복호화부로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성수단;
    상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성수단;
    상기 고대역 여기신호 생성 수단에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성수단에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성수단; 및
    상기 고대역 음성 합성수단을 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링 수단을 포함하되,
    상기 고대역 여기신호 생성수단은,
    상기 저대역 복호화부로부터 전달받은 저대역 합성 음성에 대해 상기 저대역 LPC 계수 추출수단에서 추출한 저대역 LPC 계수를 이용한 LPC 분석 과정을 적용하여 저대역 여기신호를 출력하기 위한 저대역 여기신호 추출수단;
    상기 저대역 여기신호 추출수단으로부터 출력되는 저대역 여기신호를 고대역 합성 음성의 샘플링 주파수에 맞도록 샘플링 주파수를 변환하기 위한 주파수 변환수단;
    상기 주파수 변환수단을 통해 샘플링 주파수를 변환한 여기신호에서 불필요한 고대역 성분(고대역에 존재하는 저대역의 거울 이미지)을 제거하기 위한 저대역 통과 필터링 수단;
    상기 저대역 통과 필터링 수단을 통해 불필요한 고대역 성분을 제거한 여기신호에 비선형 왜곡을 가해 고대역 성분을 생성하기 위한 비선형 왜곡 수단; 및
    상기 비선형 왜곡 수단을 통해 왜곡시킨 여기신호에서 불필요한 저대역 성분을 제거하여 고대역 여기신호를 출력하기 위한 고대역 여기신호 추출수단
    을 포함하는 것을 특징으로 하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치.
  4. 제 2 항 또는 제 3 항에 있어서,
    상기 고대역 LPC 계수 생성수단은,
    상기 저대역 LPC 계수 추출수단으로부터의 저대역 LPC 계수를 코드북 검색을 위한 LSP(Line Spectral Pair) 타입으로 변환하기 위한 제1 타입 변환기;
    상기 타입 변환기에서 변환한 저대역 LSP 계수 벡터와 가장 유사한 코드워드 벡터를 저대역 코드북에서 검색하여 해당 인덱스를 출력하기 위한 저대역 코드북 검색기;
    상기 저대역 코드북 검색기에서 검색한 인덱스에 해당하는 고대역 LSP 코드워드를 고대역 코드북에서 검색하기 위한 고대역 코드북 검색기;
    상기 고대역 코드북 검색기에서 검색한 고대역 LSP 코드워드를 고대역 LPC 계수로 변환하기 위한 제2 타입 변환기;
    코드북 훈련부를 통해 훈련된 저대역 LSP 코드워드 벡터를 저장하고 있는 상기 저대역 코드북; 및
    상기 코드북 훈련부를 통해 훈련된 고대역 LSP 코드워드 벡터를 저장하고 있는 상기 고대역 코드북
    을 포함하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치.
  5. 제 4 항에 있어서,
    상기 코드북 훈련부는,
    광대역 음성 데이터베이스에 수집된 음성 샘플들에 대해서 고대역 성분을 제거하고 저대역 성분만을 가지는 저대역 음성 신호를 얻기 위한 저대역 통과 필터;
    상기 저대역 통과 필터를 통과한 음성 신호의 샘플링 주파수를 다운 변환하여 저대역 음성을 출력하기 위한 다운-샘플러;
    상기 광대역 음성 데이터베이스에 수집된 음성 샘플들에 대해서 저대역 성분을 제거하고 고대역 성분만을 가지는 고대역 음성 신호를 얻기 위한 고대역 통과 필터;
    상기 다운-샘플러를 통해서 주파수를 변환한 저대역 음성 데이터베이스의 음성 샘플에 대해서 LPC 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 분석기;
    상기 저대역 LPC 분석기로부터의 저대역 LPC 계수를 벡터 양자화에 적합한 타입인 LSP 벡터로 변환하기 위한 저대역 타입 변환기;
    상기 저대역 타입 변환기를 통해서 LSP 벡터로 변환한 저대역 LSP 데이터베이스의 LSP 벡터들의 대표값들을 찾아 상기 저대역 코드북을 생성하고 각 LSP 벡터들에 대한 클래스 정보를 출력하기 위한 저대역 벡터 양자화기;
    상기 고대역 통과 필터를 통해서 저대역 성분을 제거한 고대역 음성 데이터베이스의 음성 샘플에 대해서 LPC 분석을 통해 고대역 LPC 계수를 추출하기 위한 고대역 LPC 분석기;
    상기 고대역 LPC 분석기로부터의 고대역 LPC 계수를 벡터 양자화에 적합한 타입인 LSP 벡터로 변환하기 위한 고대역 타입 변환기; 및
    상기 고대역 타입 변환기에서 LSP 벡터로 변환한 고대역 LSP 데이터베이스의 LSP 벡터들과 상기 저대역 벡터 양자화기로부터의 저대역 LSP 벡터들에 대한 클래스 정보를 이용하여 상기 고대역 코드북을 생성하기 위한 고대역 벡터 양자화기
    를 포함하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치.
  6. 삭제
  7. 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템에 있어서,
    입력 패킷의 분실 여부를 판단하기 위한 패킷 분실 검출수단;
    상기 입력 패킷을 분석하여 각 프레임별로 저대역 비트스트림과 고대역 비트스트림으로 분리하기 위한 분리수단;
    상기 분리수단으로부터의 저대역 비트스트림의 오류 여부와 상기 패킷 분실 검출수단의 출력값에 따라 상기 분리수단으로부터의 저대역 비트스트림에서 저대역 음성을 합성하기 위한 저대역 복호화수단;
    상기 분리수단으로부터 전달받은 고대역 비트스트림을 검사하여 프레임 오류 여부를 판단하여 고대역 오류를 검출하기 위한 고대역 오류 검출수단;
    상기 패킷 분실 검출수단의 출력값과 상기 고대역 오류 검출수단의 출력값에 따라, 고대역 음성을 합성할 장치를 선택하기 위한 제1 선택수단;
    상기 제1 선택수단에 의해 선택되어 분실 또는 오류 고대역 프레임에 대해서 상기 저대역 복호화수단으로부터의 제1 저대역 합성 음성을 이용하여 오류를 은닉하여 고대역 음성을 합성하기 위한 고대역 오류 은닉수단;
    상기 제1 선택수단에 의해 선택되어 정상 고대역 프레임에 대해서 고대역 음성을 합성하기 위한 고대역 음성 합성 수단;
    상기 패킷 분실 검출수단의 출력과 상기 고대역 오류 검출수단의 출력에 따라, 고대역 합성 음성을 출력할 장치를 선택하기 위한 제2 선택수단; 및
    상기 저대역 복호화수단으로부터의 제2 저대역 합성 음성과 상기 제2 선택수단에 의하여 선택된 수단으로부터의 고대역 합성 음성을 더하여 광대역 합성 음성을 출력하기 위한 출력수단
    을 포함하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템.
  8. 제 7 항에 있어서,
    상기 제1 선택수단은,
    상기 패킷 분실 검출수단의 출력값과 상기 고대역 오류 검출수단의 출력값에 분실이나 오류가 없는 정상 프레임이면 상기 고대역 음성 합성 수단을 선택하여 구동시키고,
    상기 패킷 분실 검출수단의 출력값과 상기 고대역 오류 검출수단의 출력값에 분실 또는 오류가 있는 분실 또는 오류 프레임이면 상기 고대역 오류 은닉수단을 선택하여 구동시키는 것을 특징으로 하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템.
  9. 제 7 항 또는 제 8 항에 있어서,
    상기 고대역 오류 은닉수단은,
    고대역 오류 검출에 따라, 상기 저대역 복호화수단으로부터 전달받은 저대역 합성 음성에 대해서 LPC(Linear Predictive Coding) 분석을 통해 저대역 LPC 계수를 추출하기 위한 저대역 LPC 계수 추출부;
    상기 저대역 복호화수단으로부터 전달받은 저대역 합성 음성과 상기 저대역 LPC 계수 추출부에서 추출한 저대역 LPC 계수를 이용하여 고대역 여기신호를 생성하기 위한 고대역 여기신호 생성부;
    상기 저대역 LPC 계수 추출부에서 추출한 저대역 LPC 계수로부터 고대역 LPC 계수를 생성하기 위한 고대역 LPC 계수 생성부;
    상기 고대역 여기신호 생성부에서 생성한 고대역 여기신호와 상기 고대역 LPC 계수 생성부에서 생성한 고대역 LPC 계수를 이용하여 고대역 음성을 합성하기 위한 고대역 음성 합성부; 및
    상기 고대역 음성 합성부를 통해 합성한 고대역 음성에 포함되어 있는 저대역 성분을 제거하여 고대역 합성 음성을 출력하기 위한 고대역 통과 필터링부
    를 포함하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템.
  10. 제 9 항에 있어서,
    상기 제2 선택수단은,
    상기 패킷 분실 검출수단의 출력값과 상기 고대역 오류 검출수단의 출력값에 분실이나 오류가 없는 정상 프레임이면 상기 고대역 음성 합성 수단을 선택하여 고대역 합성 음성이 전달되도록 하고,
    상기 패킷 분실 검출수단의 출력값과 상기 고대역 오류 검출수단의 출력값에 분실 또는 오류가 있는 분실 또는 오류 프레임이면 상기 고대역 오류 은닉수단을 선택하여 고대역 합성 음성이 전달되도록 하는 것을 특징으로 하는 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치를 이용한 비트스트림 복호화 시스템.
KR1020030097824A 2003-12-26 2003-12-26 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 KR100587953B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020030097824A KR100587953B1 (ko) 2003-12-26 2003-12-26 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
US10/943,118 US7596492B2 (en) 2003-12-26 2004-09-15 Apparatus and method for concealing highband error in split-band wideband voice codec and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030097824A KR100587953B1 (ko) 2003-12-26 2003-12-26 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템

Publications (2)

Publication Number Publication Date
KR20050066525A KR20050066525A (ko) 2005-06-30
KR100587953B1 true KR100587953B1 (ko) 2006-06-08

Family

ID=34698555

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030097824A KR100587953B1 (ko) 2003-12-26 2003-12-26 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템

Country Status (2)

Country Link
US (1) US7596492B2 (ko)
KR (1) KR100587953B1 (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
WO2006103488A1 (en) * 2005-03-30 2006-10-05 Nokia Corporation Source coding and/or decoding
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8280728B2 (en) 2006-08-11 2012-10-02 Broadcom Corporation Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
DK3998607T3 (da) * 2011-02-18 2024-04-15 Ntt Docomo Inc Taleafkoder
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5447628B1 (ja) * 2012-09-28 2014-03-19 パナソニック株式会社 無線通信装置及び通信端末
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
PL3285254T3 (pl) 2013-10-31 2019-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału wzbudzenia w dziedzinie czasu
CA2984017C (en) 2013-10-31 2019-12-31 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US11488613B2 (en) 2019-11-13 2022-11-01 Electronics And Telecommunications Research Institute Residual coding method of linear prediction coding coefficient based on collaborative quantization, and computing device for performing the method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
WO2000063883A1 (en) 1999-04-19 2000-10-26 At & T Corp. Method and apparatus for performing packet loss or frame erasure concealment
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6615169B1 (en) 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding

Also Published As

Publication number Publication date
US20050143985A1 (en) 2005-06-30
US7596492B2 (en) 2009-09-29
KR20050066525A (ko) 2005-06-30

Similar Documents

Publication Publication Date Title
KR100587953B1 (ko) 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
JP4731775B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR100873836B1 (ko) Celp 트랜스코딩
KR100798668B1 (ko) 무성 음성의 코딩 방법 및 장치
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
JP5457171B2 (ja) オーディオデコーダ内で信号を後処理する方法
KR100499047B1 (ko) 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
JP5255575B2 (ja) レイヤード・コーデックのためのポストフィルタ
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
Drygajilo Speech Coding Techniques and Standards
JP2002169595A (ja) 固定音源符号帳及び音声符号化/復号化装置
KR100221186B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
JP3770900B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770899B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321828A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321827A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321824A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321822A (ja) 広帯域音声復元方法及び広帯域音声復元装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130527

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150527

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee