KR100703325B1 - 음성패킷 전송율 변환 장치 및 방법 - Google Patents

음성패킷 전송율 변환 장치 및 방법 Download PDF

Info

Publication number
KR100703325B1
KR100703325B1 KR1020050003595A KR20050003595A KR100703325B1 KR 100703325 B1 KR100703325 B1 KR 100703325B1 KR 1020050003595 A KR1020050003595 A KR 1020050003595A KR 20050003595 A KR20050003595 A KR 20050003595A KR 100703325 B1 KR100703325 B1 KR 100703325B1
Authority
KR
South Korea
Prior art keywords
rate
codebook
parameter
filter parameter
lpc
Prior art date
Application number
KR1020050003595A
Other languages
English (en)
Other versions
KR20060082985A (ko
Inventor
송근배
박호종
김재범
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050003595A priority Critical patent/KR100703325B1/ko
Priority to US11/331,363 priority patent/US20060212289A1/en
Publication of KR20060082985A publication Critical patent/KR20060082985A/ko
Application granted granted Critical
Publication of KR100703325B1 publication Critical patent/KR100703325B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성패킷의 전송율을 변환하는 방법 및 장치에 관한 것이다. 음성패킷의 전송율을 변환하는 방법은, 제1 전송율로 압축된 입력 음성패킷의 적어도 하나의 제1 구성요소를 파라미터 레벨에서 제2 전송율로 변환하고, 상기 제1 전송율로 압축된 입력 음성패킷의 제2 구성요소를 PCM 레벨에서 상기 제2 전송율로 변환하고, 상기 제2 전송율로 변환된 제1 구성요소와 상기 제2 전송율로 변환된 제2 구성요소를 결합하여 상기 제2 전송율로 압축된 출력 음성패킷을 생성하는 과정으로 구성된다. 이러한 본 발명은, 음성 패킷의 전송율을 변환함에 있어서 좋은 음질과 낮은 복잡도를 유지하면서 패킷 변환으로 인한 지연을 최소화하는 효과가 있다.
CELP, LPC FILTER PARAMETER, PITCH FILTER PARAMETER, CODEBOOK PARAMETER

Description

음성패킷 전송율 변환 장치 및 방법{APPARATUS AND METHOD FOR CONVERTING RATE OF SPEECH PACKET}
도 1은 종래 기술에 따른 PCM(Pulse Code Modulation) 레벨 패킷 전송율 변환기를 나타낸 도면.
도 2는 종래의 다른 기술에 따른 파라미터 레벨 패킷 전송율 변환기를 나타낸 도면.
도 3은 본 발명에 적용되는 음성패킷의 구조도.
도 4는 본 발명의 바람직한 실시예에 따른 합성 패킷 전송율 변환기를 나타낸 도면.
도 5는 본 발명의 바람직한 실시예에 따른 LPC 전송율 변환기를 나타낸 도면.
도 6은 본 발명의 바람직한 실시예에 따른 피치 전송율 변환기를 나타낸 도면.
도 7은 본 발명의 바람직한 실시예에 따른 코드북 파라미터 전송율 변환기를 나타낸 도면.
도 8은 본 발명의 바람직한 실시예에 따른 음성패킷의 전송율 변환 동작을 나타낸 흐름도.
도 9는 본 발명의 바람직한 실시예에 따른 코드북 파라미터의 전송율 변환 동작을 나타낸 흐름도.
본 발명은 부호여기 선형예측(Code-Excited Linear Prediction: 이하 CELP라 칭함) 음성 신호처리에 관한 것으로서, 특히 디지털 음성패킷의 전송율을 변환하는 장치 및 방법에 대한 것이다.
가변 전송율(variable rate) 음성 부호화기는 다양한 전송율의 음성 패킷을 생성하도록 지원하며, 대표적인 가변 전송율 음성 부호화기는 부호분할 다중접속(Code Division Multiple Access: 이하 CDMA라 칭함) 시스템에 사용되는 퀄컴-CELP(QCELP)와 EVRC(Enhanced Variable Rate Codec)가 있다. 가변 전송율 음성 부호화기는 입력 음성 신호의 특성 또는 통신 시스템에서 요구하는 전송율에 따라 음성 패킷의 전송율을 선택하여 음성 신호를 압축하거나 복원할 수 있다. QCELP와 EVRC는 최대 전송율(Full Rate)을 기준으로 하여 1/2, 1/4 또는 1/8 전송율을 가지는 음성 패킷을 생성할 수 있다.
QCELP나 EVRC와 같은 CELP 기반 음성 부호화기는 오늘날 사용 중인 음성 부호화기 중 가장 인기 있는 부호화기이다. 이 기술은 현재의 입력 음성신호를 과거 의 입력 음성신호와 비교하여 중복되는 정보는 버리고 중복되지 않는 정보만을 취하여 부호화하는데, 이때 부호화 정보로서 선형 예측 계수(Linear Prediction Coefficients: 이하 LPC라 칭함) 필터 파라미터, 피치(pitch) 필터 파라미터, 코드북(codebook) 파라미터 등이 있다. 상기 LPC 필터는 포만트(Formant) 필터라고도 알려져 있다.
디지털 통신 시스템에서, 특정 전송율로 압축된 음성패킷을 전송하는 과정에서 통신 시스템의 요구에 의해 전송율을 낮추어야 하는 경우, 통상 높은 전송율로 압축된 음성패킷을 보다 낮은 패킷으로 변환해 주는 패킷 전송율 변환기가 필요하다. 낮은 전송율로 압축된 음성패킷은 높은 전송율을 지원하는 통신로를 통해 전송 가능하므로, 이 경우 패킷 전송율 변환기는 사용될 필요가 없다.
도 1은 종래 기술에 따른 PCM(Pulse Code Modulation) 레벨 패킷 전송율 변환기(110)를 나타낸 것이다. 도시한 바와 같이, 복호기(Decoder)(112)는 제1 전송율(높은 전송율)로 압축된 음성패킷을 PCM 신호로 복호하며 부호화기(Encoder)(114)는 상기 PCM 신호를 적절한 제2 전송율(낮은 전송율)로 다시 부호화하여 제2 전송율로 압축된 음성패킷을 생성한다.
도 2는 종래의 다른 기술에 따른 파라미터 레벨 패킷 전송율 변환기(120)를 나타낸 것이다. 상기 파라미터 레벨 패킷 전송율 변환기(120)는 PCM 신호를 사용하지 않고 파라미터 레벨에서 직접 전송율 변환을 수행한다. 도시한 바와 같이, 역양자화기(Dequantizer)(122)는 제1 전송율(높은 전송율)로 압축된 음성패킷을 실수 형태의 LPC 필터 파라미터, 피치 필터 파라미터, 코드북 파라미터로 역양자화하며, 양자화기(124)는 상기 역양자화된 파라미터들을 제2 전송율(낮은 전송율)로 양자화하여 제2 전송율로 압축된 음성패킷을 생성한다.
패킷 전송율 변환기로서 상기 도 1의 PCM 레벨 패킷 전송율 변환기(110)는 가장 좋은 음질(quality)을 보장하나 긴 지연시간(algorithmic delay)과 높은 복잡도(complexity)를 요한다. 상기 도 2의 파라미터 레벨 패킷 전송율 변환기(120)는 지연시간이 짧고 복잡도가 낮지만 음질 면에서 심각한 성능 열화를 초래한다.
따라서 상기한 바와 같이 동작되는 종래 기술의 문제점을 해결하기 위하여 창안된 본 발명은, 좋은 음질과 상대적으로 낮은 복잡도를 취하면서도 알고리즘적 지연시간을 발생시키지 않는 패킷 전송율 변환장치 및 방법을 제공한다.
본 발명의 바람직한 실시예는, 음성패킷의 전송율을 변환하는 방법에 있어서,
제1 전송율로 압축된 입력 음성패킷의 적어도 하나의 제1 구성요소를 파라미터 레벨에서 제2 전송율로 변환하는 과정과,
상기 제1 전송율로 압축된 입력 음성패킷의 제2 구성요소를 PCM 레벨에서 상기 제2 전송율로 변환하는 과정과,
상기 제2 전송율로 변환된 제1 구성요소와 상기 제2 전송율로 변환된 제2 구성요소를 결합하여 상기 제2 전송율로 압축된 출력 음성패킷을 생성하는 과정으로 구성됨을 특징으로 한다.
본 발명의 다른 실시예는, 부호여기 선형 예측(CELP) 음성패킷의 전송율을 변환하는 방법에 있어서,
제1 전송율로 압축된 입력 음성패킷의 선형예측계수(LPC) 필터 파라미터를 역양자화하고, 상기 역양자화된 LPC 필터 파라미터를 제2 전송율로 양자화하여 상기 제2 전송율의 LPC 필터 파라미터를 출력하는 과정과,
상기 입력 음성패킷의 피치 필터 파라미터를 역양자화하고, 상기 역양자화된 피치 필터 파라미터를 상기 제2 전송율로 양자화하여 상기 제2 전송율의 피치 필터 파라미터를 출력하는 과정과,
상기 입력 음성패킷의 코드북 파라미터를 복호하고, 상기 복호된 코드북 파라미터를 상기 제2 전송율로 압축하여 제2 전송율의 코드북 파라미터를 출력하는 과정을 포함하며,
상기 제2 전송율의 출력 음성패킷은, 상기 제2 전송율의 LPC 필터 파라미터와 상기 제2 전송율의 피치 필터 파라미터 및 상기 제2 전송율의 코드북 파라미터로 구성되는 것을 특징으로 한다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대한 동작 원리를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 3은 본 발명에 적용되는 음성패킷의 구조를 나타낸 것이다. 도시한 바와 같이, 음성패킷은 각각 비트스트림 형태를 가지는 LPC 필터 파라미터(10)와 피치 필터 파라미터(12) 및 코드북 파라미터(14)로 구성된다. 상기 코드북 파라미터(14)는 음성 신호를 직접적으로 나타내는 코드북 인덱스와 코드북 이득을 포함하는데, 통상 상기 코드북 파라미터(14)는 LPC 필터 파라미터(10)와 피치 필터 파라미터(12)에 비해 많은 비트 수를 가지며 패킷 전송율의 변화에 직접적으로 영향을 받는다. 한편 상기 LPC 필터 파라미터(10)와 피치 필터 파라미터(12)는 과거의 입력 음성신호에 의한 영향을 나타내기 때문에, 복호화 및 부호화를 위해서는 메모리를 필요로 한다.
패킷 전송율의 변화에 대해서는, 상기 LPC 필터 파라미터(10)와 피치 필터 파라미터(12)는 상기 코드북 파라미터(14)와 달리 복호화 및 부호화의 방식에 있어서 기본적으로 차이가 없으며 단지 양자화 비트 수 혹은 프레임 당 전송율에 있어서만 차이가 있을 뿐이다. 따라서 상기 LPC 필터 파라미터(10)와 피치 필터 파라미터(12)에 대해서 전송율을 바꾸고자 할 경우, 도 1의 종래기술과 같이 입력 음성패킷을 PCM 신호로 완전히 복호한 뒤 다시 원하는 전송율로 부호화하는 과정을 거치지 않고 직접 파라미터 레벨에서 역양자화 양자화 과정만 거쳐 변환하더라도 성능에 영향을 미치지 않는다.
따라서 본 발명의 바람직한 실시예에서는 LPC 필터 파라미터와 피치 필터 파라미터는 파라미터 레벨에서 변환하고 코드북 파라미터는 PCM 레벨에서 변환한다. 즉 본 발명은 파라미터 레벨 패킷 변환과 PCM 레벨 패킷 변환을 복합적으로서 사용함으로써, 지연시간과 복잡도, 음성 품질 등의 요구조건을 모두 만족할 수 있다.
도 4는 본 발명의 바람직한 실시예에 따른 합성(Hybrid) 패킷 전송율 변환기(210)를 나타낸 것이다.
도 4를 참조하면, 합성 패킷 전송율 변환기(210)는 역양자화기(214)와 양자화기(218)로 이루어진 LPC/피치 전송율 변환부와, 코드북 복호기(212)와 코드북 부호화기(216)로 이루어진 코드북 전송율 변환부로 구성된다. 역양자화기(214)는 제1 전송율로 압축된 입력 음성패킷의 필터 파라미터들(10, 12)을 실수 형태의 LPC 필터 파라미터와 피치 필터 파라미터로 역양자화하며, 양자화기(218)는 상기 역양자화된 파라미터들을 제2 전송율로 양자화한다. 코드북 복호기(212)는 제1 전송율로 압축된 입력 음성패킷의 코드북 파라미터(14)를 복호하여 코드북 타겟 신호를 생성하며, 코드북 부호화기(216)는 상기 코드북 타겟 신호를 제2 전송율로 다시 부호화한다. 상기 양자화된 필터 파라미터들과 상기 부호화된 코드북 신호는 제2 전송율로 압축된 출력 음성패킷을 형성한다.
상기 도 4의 각 구성요소들을 살펴보면 다음과 같다.
도 5는 본 발명의 바람직한 실시예에 따른 LPC 전송율 변환기(310)를 나타낸 것이다. 도시한 바와 같이 LPC 전송율 변환기(310)는 제1 전송율 방식의 역양자화기(512)와 제2 전송율 방식의 양자화기(314)로 구성된다. 역양자화기(312)는 제1 전송율로 압축된 입력 음성패킷의 LPC 비트스트림을 역양자화하여 LPC 필터 파라미터 값들을 출력하며, 양자화기(314)는 상기 LPC 필터 파라미터 값들을 제2 전송율 로 양자화하여 제2 전송율의 LPC 비트스트림을 출력한다.
도 6은 본 발명의 바람직한 실시예에 따른 피치 전송율 변환기(410)를 나타낸 것이다. 도시한 바와 같이 피치 전송율 변환기(410)는 제1 전송율 방식의 역양자화기(412)와 시간기반 변환기(Time-based converter)(414), 제2 전송율 방식의 양자화기(416)로 구성된다.
역양자화기(412)는 제1 전송율로 압축된 입력 음성패킷의 피치 비트스트림을 역양자화하여 피치 필터 파라미터 값들을 출력한다. 시간기반 변환기(414)는 프레임당 피치 필터 파라미터 값들의 개수를 제1 전송율 방식에서 제2 전송율 방식으로 바꾸는 기능을 수행한다. 만약 제1 전송율 방식과 제2 전송율 방식이 같은 수의 프레임당 피치 필터 파라미터 값들을 사용할 경우 시간기반 변환기(414)는 피치 필터 파라미터 값들을 바이패스(bypass)(402)를 통해 통과시키며, 제1 전송율 방식이 제2 전송율 방식보다 많은 수의 프레임당 피치 필터 파라미터 값들을 사용할 경우 데시메이터(Decimator)(404)에 의해 피치 필터 파라미터 값들을 추림(decimation)한다. 양자화기(416)는 상기 시간기반 변환된 피치 필터 파라미터 값들을 제2 전송율로 양자화하여 제2 전송율의 피치 비트스트림을 출력한다.
도 7은 본 발명의 바람직한 실시예에 따른 코드북 파라미터 전송율 변환기(510)를 나타낸 것이다. 도시한 바와 같이 코드북 파라미터 전송율 변환기(510)는 코드북 타겟신호 S1(n)을 생성하기 위한 코드북 타겟신호 합성기(Codebook Target Signal Synthesizer)(560)와 제2 전송율의 코드북 파라미터를 탐색하기 위한 코드 북 파라미터 탐색기(Codebook Parameter Searcher)(530)로 구성된다. 상기 코드북 타겟신호 합성기(560)는 제1 전송율의 코드북(522), 코드북 이득 곱셈기(524), LPC 필터(526)를 포함한다. 상기 코드북 파라미터 탐색기(530)는 추정 신호(guess signal) S2(n)를 생성하기 위한 제2 전송율의 코드북(512), 코드북 이득 곱셈기(514), LPC 필터(516), 그리고 오차 신호 e(n)를 생성하기 위한 결합기 (520), 상기 오차 신호를 최소화하기 위해 추정 코드북 파라미터(guess codebook parameter)를 변화시키는 최소오차 검출기(518)로 구성된다. 여기서 코드북들(522, 512)은 코드북 인덱스에 대응하는 코드벡터들을 저장하는 룩업 테이블로 구성된다.
코드북 타겟신호 합성기(560)는 제1 전송율로 압축된 음성패킷의 코드북 파라미터인 코드북 인덱스 CBi1과 코드북 이득 CBg1을 입력받는다. 제1 전송율의 코드북(522)은 상기 코드북 인덱스 CBi1에 대응하는 제1 코드벡터를 출력하며, 곱셈기(524)는 상기 제1 코드벡터에 상기 코드북 이득 CBg1을 곱한다. LPC 필터(526)는 상기 곱셈기(524)의 출력으로부터 제2 전송율 방식으로 변환된 LPC 필터 파라미터(ao1 - aoN)를 사용하여 코드북 타겟신호 S1(n)을 생성한다. 여기서 n은 프레임 인덱스이다.
다음으로, 제2 전송율 방식의 코드북(512)은 최소오차 검출기(518)의 제어하에 제2 전송율의 코드북 인덱스 CBi2에 대응하는 제2 코드벡터를 출력하며, 곱셈기(514)는 마찬가지로 최소오차 검출기(518)의 제어하에 상기 제2 코드벡터에 제2 전 송율의 코드북 이득 CBg2를 곱한다. LPC 필터(516)는 상기 곱셈기(514)의 출력으로부터 제2 전송율 방식으로 변환된 LPC 필터 파라미터(ao1 - aoN)를 사용하여 추정신호(Candidate signal) S2(n)를 생성한다.
최종적으로, 결합기(520)는 상기 타겟 신호 S1(n)에서 상기 추정신호 S2(n)를 감산하여 오차신호 e(n)를 생성한다. 최소오차 검출기(518)는 상기 동작을 제어하여 제2 전송율 코드북 중에서 오차신호 e(n)을 최소화하는 CBi2 CBg2의 조합을 검색한다. 그러면 상기 제2 전송율의 코드북 인덱스 CBi2와 코드북 이득 CBg2는 제2 전송율로 압축된 코드북 파라미터가 된다.
도 8은 본 발명의 바람직한 실시예에 따른 음성패킷의 전송율 변환 동작을 나타낸 흐름도이다.
도시한 바와 같이, 과정 110에서 제1 전송율로 압축된 입력 음성패킷의 LPC 필터 파라미터는 도 5에 나타낸 바와 같은 역양자화 및 양자화를 거쳐 제2 전송율의 LPC 필터 파라미터로 변환된다. 과정 120에서 상기 입력 음성패킷의 피치 필터 파라미터는 도 6에 나타낸 바와 같은 역양자화 및 양자화를 거쳐 제2 전송율의 피치 필터 파라미터로 변환된다. 과정 130에서 상기 입력 음성패킷의 코드북 파라미터는 도 7에 나타낸 바와 같은 복호화 및 부호화를 거쳐 제2 전송율의 코드북 파라미터로 변환된다.
도 9는 본 발명의 바람직한 실시예에 따른 코드북 파라미터의 전송율 변환 동작을 나타낸 흐름도이다.
도시한 바와 같이, 과정 132에서 입력 코드북 파라미터는 상기 과정 110에서 변환된 LPC 필터 파라미터의 필터 계수들에 따라 코드북 타겟 신호로 변환된다. 과정 134에서는 제2 전송율에 대한 가능한 코드북 파라미터들에 대해 상기 변환된 필터 계수들을 적용하여 추정 신호가 생성된다. 과정 136에서 상기 코드북 타겟 신호와 상기 추정 신호의 차이를 나타내는 오차 신호가 발생된다. 과정 138에서 상기 오차 신호를 최소화하는 제2 전송율의 코드북 파라미터들이 결정된다.
한편 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되지 않으며, 후술되는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
이상에서 설명한 본 발명의 효과를 간단히 설명하면 다음과 같다.
본 발명은, 압축된 음성 패킷의 구성요소들을 파라미터 레벨과 PCM 레벨로 구분하여 전송율-변환함으로써 좋은 음질과 상대적으로 낮은 복잡도를 유지하면서 지연시간을 단축하는 효과가 있다.

Claims (18)

  1. 부호여기 선형 예측(CELP) 음성패킷의 전송율을 변환하는 장치에 있어서,
    제1 전송율로 압축된 입력 음성패킷의 선형예측계수(LPC) 필터 파라미터를 역양자화하고, 상기 역양자화된 LPC 필터 파라미터를 제2 전송율로 양자화하여 상기 제2 전송율의 LPC 필터 파라미터를 출력하는 LPC 전송율 변환기와,
    상기 입력 음성패킷의 피치 필터 파라미터를 역양자화하고, 상기 역양자화된 피치 필터 파라미터를 상기 제2 전송율로 양자화하여 상기 제2 전송율의 피치 필터 파라미터를 출력하는 피치 전송율 변환부와,
    상기 입력 음성패킷의 코드북 파라미터를 복호하고, 상기 복호된 코드북 파라미터를 상기 제2 전송율로 압축하여 상기 제2 전송율의 코드북 파라미터를 출력하는 코드북 전송율 변환기를 포함하며,
    상기 제2 전송율의 출력 음성패킷은, 상기 제2 전송율의 LPC 필터 파라미터와 상기 제2 전송율의 피치 필터 파라미터 및 상기 제2 전송율의 코드북 파라미터로 구성되는 것을 특징으로 하는 상기 장치.
  2. 제 1 항에 있어서, 상기 피치 전송율 변환부는,
    상기 입력 음성패킷의 피치 필터 파라미터를 역양자화하여 피치 필터 파라미터 값들을 출력하는 역양자화기와,
    상기 피치 필터 파라미터 값들을 상기 제2 전송율의 시간기반으로 변환하는 시간기반 변환기와,
    상기 시간기반 변환된 피치 필터 파라미터 값들을 상기 제2 전송율에 따라 양자화하는 양자화기로 구성되는 것을 특징으로 하는 상기 장치.
  3. 제 2 항에 있어서, 상기 시간기반 변환기는,
    상기 제1 전송율과 상기 제2 전송율이 같은 수의 프레임당 피치 필터 파라미터 값들을 사용할 경우 상기 피치 필터 파라미터 값들을 바이패스시키며, 상기 제1 전송율이 상기 제2 전송율보다 많은 수의 프레임당 피치 필터 파라미터 값들을 사용할 경우 상기 피치 필터 파라미터 값들을 데시메이션하는 것을 특징으로 하는 상기 장치.
  4. 제 1 항에 있어서, 상기 코드북 전송율 변환기는,
    상기 입력 음성패킷의 코드북 파라미터를 복호하여 코드북 타겟신호를 생성하는 코드북 타겟신호 합성기와,
    상기 제2 전송율의 코드북을 탐색하여 상기 코드북 타겟신호에 대응하는 상기 제2 전송율의 코드북 파라미터를 결정하는 코드북 파라미터 탐색기로 구성되는 것을 특징으로 하는 상기 장치.
  5. 제 4 항에 있어서, 상기 코드북 타겟신호 합성기는,
    상기 제1 전송율의 코드벡터들을 저장하며 상기 제2 전송율의 코드북 파라미터에 포함된 코드북 인덱스에 대응하는 코드벡터를 출력하는 코드북과,
    상기 코드북 파라미터에 포함된 코드북 이득을 상기 출력된 코드벡터에 곱하는 코드북 이득 곱셈기와,
    상기 코드북 이득 곱셈기의 출력을 상기 제2 전송율의 LPC 필터 파라미터에 따라 필터링하여 상기 코드북 타겟신호를 출력하는 LPC 필터로 구성되는 것을 특징으로 하는 상기 장치.
  6. 제 4 항에 있어서, 상기 코드북 파라미터 탐색기는,
    상기 제2 전송율의 코드북 인덱스에 대응하는 코드벡터들을 저장하며 후보 코드벡터들을 출력하는 코드북과,
    상기 후보 코드벡터들에 상기 제2 전송율의 코드북 이득들을 곱하는 코드북 이득 곱셈기와,
    상기 코드북 이득 곱셈기의 출력들을 상기 제2 전송율의 LPC 필터 파라미터에 따라 필터링하여 추정신호들을 출력하는 LPC 필터와,
    상기 코드북 타겟신호로부터 상기 추정신호들을 감산하여 오차신호들을 생성하는 결합기와,
    상기 오차신호들 중 최소의 오차신호에 관련된 제2 전송율의 코드북 인덱스와 코드북 이득을 포함하는 상기 제2 전송율의 코드북 파라미터를 결정하는 최소오 차 검출기로 구성되는 것을 특징으로 하는 상기 장치.
  7. 부호여기 선형 예측(CELP) 음성패킷의 전송율을 변환하는 방법에 있어서,
    제1 전송율로 압축된 입력 음성패킷의 선형예측계수(LPC) 필터 파라미터를 역양자화하고, 상기 역양자화된 LPC 필터 파라미터를 제2 전송율로 양자화하여 상기 제2 전송율의 LPC 필터 파라미터를 출력하는 과정과,
    상기 입력 음성패킷의 피치 필터 파라미터를 역양자화하고, 상기 역양자화된 피치 필터 파라미터를 상기 제2 전송율로 양자화하여 상기 제2 전송율의 피치 필터 파라미터를 출력하는 과정과,
    상기 입력 음성패킷의 코드북 파라미터를 복호하고, 상기 복호된 코드북 파라미터를 상기 제2 전송율로 압축하여 상기 제2 전송율의 코드북 파라미터를 출력하는 과정을 포함하며,
    상기 제2 전송율의 출력 음성패킷은, 상기 제2 전송율의 LPC 필터 파라미터와 상기 제2 전송율의 피치 필터 파라미터 및 상기 제2 전송율의 코드북 파라미터로 구성되는 것을 특징으로 하는 상기 방법.
  8. 제 7 항에 있어서, 상기 제2 전송율의 피치 필터 파라미터를 출력하는 과정은,
    상기 입력 음성패킷의 피치 필터 파라미터를 역양자화하여 피치 필터 파라미터 값들을 출력하는 과정과,
    상기 피치 필터 파라미터 값들을 상기 제2 전송율의 시간기반으로 변환하는 과정과,
    상기 시간기반 변환된 피치 필터 파라미터 값들을 상기 제2 전송율에 따라 양자화하는 과정으로 구성되는 것을 특징으로 하는 상기 방법.
  9. 제 8 항에 있어서, 상기 시간기반으로 변환하는 과정은,
    상기 제1 전송율과 상기 제2 전송율이 같은 수의 프레임당 피치 필터 파라미터 값들을 사용할 경우 상기 피치 필터 파라미터 값들을 바이패스시키며, 상기 제1 전송율이 상기 제2 전송율보다 많은 수의 프레임당 피치 필터 파라미터 값들을 사용할 경우 상기 피치 필터 파라미터 값들을 데시메이션하는 것을 특징으로 하는 상기 방법.
  10. 제 7 항에 있어서, 상기 제2 전송율의 코드북 파라미터를 출력하는 과정은,
    상기 입력 음성패킷의 코드북 파라미터를 복호하여 코드북 타겟신호를 생성하는 과정과,
    상기 제2 전송율의 코드북을 탐색하여 상기 코드북 타겟신호에 대응하는 상기 제2 전송율의 코드북 파라미터를 결정하는 과정으로 구성되는 것을 특징으로 하는 상기 방법.
  11. 제 10 항에 있어서, 상기 코드북 타겟신호를 생성하는 과정은,
    상기 제1 전송율의 코드벡터들을 저장하는 코드북으로부터 상기 코드북 파라미터에 포함된 코드북 인덱스에 대응하는 코드벡터를 출력하는 과정과,
    상기 코드북 파라미터에 포함된 코드북 이득을 상기 출력된 코드벡터에 곱하는 과정과,
    상기 코드북 이득 곱셈기의 출력을 상기 제2 전송율의 LPC 필터 파라미터에 따라 필터링하여 상기 코드북 타겟신호를 출력하는 과정으로 구성되는 것을 특징으로 하는 상기 방법.
  12. 제 10 항에 있어서, 상기 코드북 파라미터를 결정하는 과정은,
    상기 제2 전송율의 코드북 인덱스에 대응하는 코드벡터들을 저장하는 코드북으로부터 후보 코드벡터들을 출력하는 과정과,
    상기 후보 코드벡터들에 상기 제2 전송율의 코드북 이득들을 곱하는 과정과,
    상기 코드북 이득 곱셈기의 출력들을 상기 제2 전송율의 LPC 필터 파라미터에 따라 필터링하여 추정신호들을 출력하는 과정과,
    상기 코드북 타겟신호로부터 상기 추정신호들을 감산하여 오차신호들을 생성하는 과정과,
    상기 오차신호들 중 최소의 오차신호에 관련된 제2 전송율의 코드북 인덱스와 코드북 이득을 포함하는 상기 제2 전송율의 코드북 파라미터를 결정하는 과정으로 구성되는 것을 특징으로 하는 상기 방법.
  13. 음성패킷의 전송율을 변환하는 방법에 있어서,
    제1 전송율로 압축된 입력 음성패킷의 적어도 하나의 제1 구성요소를 파라미터 레벨에서 제2 전송율로 변환하는 과정과,
    상기 제1 전송율로 압축된 입력 음성패킷의 제2 구성요소를 PCM(Pulse Code Modulation) 레벨에서 상기 제2 전송율로 변환하는 과정과,
    상기 제2 전송율로 변환된 제1 구성요소와 상기 제2 전송율로 변환된 제2 구성요소를 결합하여 상기 제2 전송율로 압축된 출력 음성패킷을 생성하는 과정으로 구성됨을 특징으로 하는 상기 방법.
  14. 제 13 항에 있어서, 상기 제1 구성요소는 피치 필터 파라미터임을 특징으로 하는 상기 방법.
  15. 제 13 항에 있어서, 상기 제1 구성요소는 선형 예측 계수(Linear Prediction Coefficients: 이하 LPC라 칭함) 필터 파라미터임을 특징으로 하는 상기 방법.
  16. 제 13 항에 있어서, 상기 제2 구성요소는 코드북 파라미터임을 특징으로 하는 상기 방법.
  17. 제 16 항에 있어서, 상기 PCM 레벨에서 변환하는 과정은,
    상기 제1 전송율의 코드북 파라미터를 이용하여 코드북 타겟 신호를 생성하는 과정과,
    상기 제2 전송율의 가능한 코드북 파라미터들에 대응하는 추정 신호들을 생성하는 과정과,
    상기 코드북 타겟 신호와 상기 추정 신호들을 비교하여 오차 신호들을 생성하는 과정과,
    상기 오차 신호들 중 최소의 오차 신호에 대응하는 코드북 파라미터를 상기 제2 전송율의 코드북 파라미터로 결정하는 과정으로 구성됨을 특징으로 하는 상기 방법.
  18. 제 15 항에 있어서, 상기 파라미터 레벨에서 변환하는 과정은,
    상기 제1 전송율로 압축된 입력 음성패킷의 LPC 비트스트림을 역양자화하여 LPC 필터 파라미터를 출력하는 과정과,
    상기 LPC 필터 파라미터를 상기 제2 전송율로 양자화하여 상기 제2 전송율의 LPC 비트스트림을 출력하는 과정으로 구성됨을 특징으로 하는 상기 방법.
KR1020050003595A 2005-01-14 2005-01-14 음성패킷 전송율 변환 장치 및 방법 KR100703325B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050003595A KR100703325B1 (ko) 2005-01-14 2005-01-14 음성패킷 전송율 변환 장치 및 방법
US11/331,363 US20060212289A1 (en) 2005-01-14 2006-01-13 Apparatus and method for converting voice packet rate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050003595A KR100703325B1 (ko) 2005-01-14 2005-01-14 음성패킷 전송율 변환 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20060082985A KR20060082985A (ko) 2006-07-20
KR100703325B1 true KR100703325B1 (ko) 2007-04-03

Family

ID=37011486

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050003595A KR100703325B1 (ko) 2005-01-14 2005-01-14 음성패킷 전송율 변환 장치 및 방법

Country Status (2)

Country Link
US (1) US20060212289A1 (ko)
KR (1) KR100703325B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306577B1 (en) * 2009-05-28 2012-11-06 Sprint Spectrum L.P. System and method for adjusting the volume of an earpiece using reverse frame data rate

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05276051A (ja) * 1992-03-27 1993-10-22 Oki Electric Ind Co Ltd 音声・音響可変レート伝送装置
JPH0750586A (ja) * 1991-09-10 1995-02-21 At & T Corp 低遅延celp符号化方法
JPH09179592A (ja) * 1995-12-21 1997-07-11 Kokusai Electric Co Ltd 可変レート音声符号化方式とその装置
KR20000016318A (ko) * 1997-04-07 2000-03-25 요트.게.아. 롤페즈 가변 비트레이트 음성 전송 시스템
US6282248B1 (en) 1998-07-14 2001-08-28 Agere Systems Guardian Corp. Variable baud rate demodulator
KR20010102004A (ko) * 1999-02-12 2001-11-15 밀러 럿셀 비 Celp 트랜스코딩

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19544367A1 (de) * 1995-11-29 1997-06-05 Bosch Gmbh Robert Verfahren zum Übertragen von Daten, insbesondere von GSM-Daten
GB2320166A (en) * 1996-12-09 1998-06-10 Motorola Ltd method of reverting to tandem operation between transcoders of a communication system
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
JP2004069963A (ja) * 2002-08-06 2004-03-04 Fujitsu Ltd 音声符号変換装置及び音声符号化装置
US20040243404A1 (en) * 2003-05-30 2004-12-02 Juergen Cezanne Method and apparatus for improving voice quality of encoded speech signals in a network
US7433815B2 (en) * 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750586A (ja) * 1991-09-10 1995-02-21 At & T Corp 低遅延celp符号化方法
JPH05276051A (ja) * 1992-03-27 1993-10-22 Oki Electric Ind Co Ltd 音声・音響可変レート伝送装置
JPH09179592A (ja) * 1995-12-21 1997-07-11 Kokusai Electric Co Ltd 可変レート音声符号化方式とその装置
KR20000016318A (ko) * 1997-04-07 2000-03-25 요트.게.아. 롤페즈 가변 비트레이트 음성 전송 시스템
US6282248B1 (en) 1998-07-14 2001-08-28 Agere Systems Guardian Corp. Variable baud rate demodulator
KR20010102004A (ko) * 1999-02-12 2001-11-15 밀러 럿셀 비 Celp 트랜스코딩

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1020010102004 *

Also Published As

Publication number Publication date
KR20060082985A (ko) 2006-07-20
US20060212289A1 (en) 2006-09-21

Similar Documents

Publication Publication Date Title
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
KR100956877B1 (ko) 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
US6829579B2 (en) Transcoding method and system between CELP-based speech codes
US4969192A (en) Vector adaptive predictive coder for speech and audio
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US8271272B2 (en) Scalable encoding device, scalable decoding device, and method thereof
EP1317753B1 (en) Codebook structure and search method for speech coding
EP1991986B1 (en) Methods and arrangements for audio coding
JP5978218B2 (ja) 低ビットレート低遅延の一般オーディオ信号の符号化
US20050053130A1 (en) Method and apparatus for voice transcoding between variable rate coders
KR102222838B1 (ko) 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
JPH08263099A (ja) 符号化装置
JP2007537494A (ja) 遠隔通信のためのマルチレート音声コーダにおける音声レート変換の方法及び装置
JPH08263098A (ja) 音響信号符号化方法、音響信号復号化方法
JP2005515486A (ja) Celpによる音声符号間のトランスコーディング・スキーム
KR20010112480A (ko) 전환 스피치 프레임의 멀티펄스 보간 코딩
JP2645465B2 (ja) 低遅延低ビツトレート音声コーダ
KR100480341B1 (ko) 광대역 저전송률 음성 신호의 부호화기
KR100703325B1 (ko) 음성패킷 전송율 변환 장치 및 방법
JPH08139688A (ja) 音声符号化装置
JPH09185396A (ja) 音声符号化装置
JPH08254999A (ja) ゲイン量子化装置および音声符号化/復号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130227

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140227

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150226

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160226

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee