KR100713566B1 - 씨이엘피 스피치 부호화를 위한 성형 고정 코드북 탐색 방법 - Google Patents

씨이엘피 스피치 부호화를 위한 성형 고정 코드북 탐색 방법 Download PDF

Info

Publication number
KR100713566B1
KR100713566B1 KR1020000022493A KR20000022493A KR100713566B1 KR 100713566 B1 KR100713566 B1 KR 100713566B1 KR 1020000022493 A KR1020000022493 A KR 1020000022493A KR 20000022493 A KR20000022493 A KR 20000022493A KR 100713566 B1 KR100713566 B1 KR 100713566B1
Authority
KR
South Korea
Prior art keywords
fixed codebook
signal
vocoder
bits
response
Prior art date
Application number
KR1020000022493A
Other languages
English (en)
Other versions
KR20000077100A (ko
Inventor
어진엔진
레시온마이클찰스
Original Assignee
루센트 테크놀러지스 인크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 루센트 테크놀러지스 인크 filed Critical 루센트 테크놀러지스 인크
Publication of KR20000077100A publication Critical patent/KR20000077100A/ko
Application granted granted Critical
Publication of KR100713566B1 publication Critical patent/KR100713566B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본 발명에 따라, 고정 코드북의 엔트리는 처리되고 있는 입력 신호에 맞추어지기 때문에 고정 코드북 응답은 보코더의 입력 신호를 보다 잘 특성화시킬 수 있다. 균일하게 분포된 랜덤 노이즈 신호는 송신하는 보코더에 저장된다. 송신하는 보코더에 의해 부호화하는 동안, 노이즈 신호는 가중 필터 및 피치 첨예화 필터에 의해 성형되고, 이들은 선형 예측 부호화, 부호화되고 있는 입력 신호의 피치 및 이득 특성에 의해 제어된 상태에 있다. 성형 노이즈 신호는 주어진 스파시티(sparcity)를 가진 펄스열로 도달하도록 임계 필터를 통해 통과된다. 고정 코드북 응답은 입력 신호의 잔류 신호와 가장 잘 정합되는 펄스열의 부분으로서 선택된다. 펄스열에 따른 부분의 인덱스된 위치는 비트 프레임에 포함된 고정 코드북 비트로서 지정된다. 동일한 랜덤 노이즈 신호는 수신하는 보코더에 저장된다. 선형 예측 부호화, 피치 및 피치 이득 특성은 비트 프레임의 일부이며, 다시 동일한 펄스열를 내도록 사용된다. 비트 프레임의 고정 코드북 비트는 가장 잘 정합되는 부분으로 펄스열 및 그에 따른 비트 프레임에 대한 고정 코드북 응답을 인덱스하기 위해 사용된다.
고정 코드북, 랜덤 노이즈 신호, 보코더, 선형 예측 부호화, 펄스열

Description

씨이엘피 스피치 부호화를 위한 성형 고정 코드북 탐색 방법{Shaped fixed codebook search for CELP speech coding}
도 1은 배경 기술에 따른 송신 보코더를 예시한 도면.
도 2는 배경 기술에 따른 보코더의 복호화 부분을 예시한 도면.
도 3은 배경 기술에 따른 고정 코드북 응답에 관련된 여러 가지 신호들을 예시한 도면.
도 4는 본 발명에 따른 송신 보코더를 예시한 도면.
도 5는 고정 코드북 응답을 결정하기 위해 여러 가지 펄스열에 대한 제 2 잔류 신호의 비교값을 예시한 도면.
도 6은 가능한 고정 코드북 응답의 도달에 사용된 고정 코드 코드북 성형 유닛을 예시한 도면.
도 7은 고정 코드북 성형 유닛에 관련된 여러 가지 신호들을 예시한 도면.
도 8은 본 발명에 따른 보코더의 복호화 부분을 예시한 도면.
* 도면의 주요 부분에 대한 부호의 설명
1, 11, 50, 64 : 보코더 2 : LPC 필터
3 : 지각형 가중 필터 4, 10 : 연결부
5 : 오류 최소화 필터 6 : 제 1 적응 코드북
7, 52 : 제 1 고정 코드북 8 : 제 1 적응 코드북 이득 유닛
9 : 제 1 고정 코드북 이득 유닛
본 발명은 보코더들(vocoders)에 관한 것으로, 특히 보코더들에 의해 발생된 고정 코드북 응답의 표현에 관한 것이다.
도 1 및 도 2는 배경 기술에 따른 코드 여기된 선형 예측(CELP: code excited linear prediction) 보코더의 송수신 유닛을 예시한다. 도 1에서, 송신 유닛은 제 1 보코더(1)이다. 제 1 보코더(1)는 선형 예측 부호화(LPC: linear predictive coding) 필터(2)를 포함한다. 이 LPC 필터(2)는 연결부(junction; 4)를 통해 지각형 가중 필터(perceptual weighing filter)(3)에 접속된다. 지각형 가중 필터(3)는 오류 최소화 필터(5)에 접속된다. 오류 최소화 필터(5)는 제 1 적응 코드북(6) 및 제 1 고정 코드북(7)에 접속된다. 제 1 적응 코드북(6)은 제 1 적응 코드북 이득 유닛(8)에 접속된다. 제 1 고정 코드북(7)은 제 1 고정 코드북 이득 유닛(9)에 접속된다. 제 1 적응 코드북 이득 유닛(8) 및 제 1 고정 코드북 이득 유닛(9)의 출력들은 연결부(10)에 접속된다. 연결부(10)는 연결부(4)에 접속된다.
일반적으로, 제 1 보코더(1)는 디지털 스피치(digital speech) 입력의 타임 세그먼트들(segments)을 순차로 분석한다. 각각의 타임 세그먼트는 신호 프레임이라 칭한다. 보코더(1)는 각각의 신호 프레임을 특성화(characterizing)하는 파라미터들을 추정한다. 이 파라미터들은 하나의 비트 프레임으로 어셈블되는 비트 패턴들에 의해 표현된다. 비트 프레임들은 이들이 나타내는 신호 프레임들보다 빠르게 전송될 수 있거나 적은 메모리에 저장될 수 있다.
이하, 도 1을 참조하면, 공지된 IS127 EVRC CDMA형 코더(보코더 1)의 동작에 대한 일반적인 설명이 제공된다. 보코더(1)의 동작을 보다 상세한 설명을 위해, 디지털 스피치 부호화에 관한 텍스트북을 참조할 수 있다. 보코더(1)는 다중 속도 보코더이고, 1초당 8킬로비트(kbps)에 대응하는 풀(full) 동작 속도를 가지고 있고, 4kbps에 대응하는 절반의 동작 속도를 가지고 있다. 디지털 스피치 입력은 20msec의 신호 프레임들로 분할된다. 각각의 신호 프레임은 약 6.6msec의 제 1, 제 2 및 제 3 서브 프레임들로 추가로 분할된다.
보코더(1)가 풀 속도로 동작할 때, 신호 프레임은 전체 신호 프레임을 특성화하는 LPC 파라미터들을 추출하는 LPC 필터(2)를 통해 통과하고 28 LPC 비트의 형태로 LPC 파라미터들을 출력한다. 신호 프레임은 LPC 필터를 출발하여, 연결부(4), 지각형 가중 필터(3) 및 오류 최소화부(5)를 통해 통과한다. 지각형 가중 필터(3) 및 오류 최소화 필터(5)는 신호 프레임으로부터 파라미터 비트들을 추출하지 않고, 이후의 프로세싱을 위해 그것을 준비한다.
다음에, 신호 프레임은 제 1 적응 코드북(6)에 의해 수신된다. 제 1 적응 코드북(6)은 전체 프레임에 대한 피치를 추정하고, 전체 프레임의 피치를 특성화하 는 7개의 ACB 비트들을 출력한다. 이어서, 제 1 적응 코드북 이득 유닛(8)는 제 1 서브 프레임, 제 2 서브 프레임 및 제 3 서브 프레임의 적응 코드북 이득을 추정한다. 3개의 ACBG 비트들은 제 1 서브 프레임의 적응 코드북 이득을 추정한다. 3개 이상의 ACBG, 비트들은 제 2 서브 프레임의 적응 코드북 이득을 추정한다. 그리고, 여전히 3개 이상의 ACBG 비트들은 제 3 서브 프레임의 적응 코드북 이득을 추정한다.
다음에, 신호는 연결부(10), 연결부(4), 지각형 가중 필터(3) 및 오류 최소화 필터(5)를 통해 통과하고, 제 1 고정 코드북(7)에 의해 수신된다. 제 1 고정 코드북(7)은 제 1 서브 프레임, 제 2 서브 프레임, 및 제 3 서브 프레임의 랜덤 무성음 특성을 추정한다. 35 FCB 비트들은 제 1 서브 프레임에 대한 고정 코드북 응답을 나타낸다. 35개 이상의 FCB 비트들은 제 2 서브 프레임에 대한 고정 코드북 응답을 나타낸다. 그리고, 여전히 35개 이상의 FCB 비트들은 제 3 서브 프레임에 대한 고정 코드북 응답을 나타낸다.
다음에, 제 1 고정 코드북 이득 유닛(9)은 제 1 서브 프레임, 제 2 서브 프레임 및 제 3 서브 프레임의 고정 코드북 이득을 추정한다. 5개의 FCBG 비트들은 제 1 서브 프레임의 고정 코드북 이득을 추정한다. 5개 이상의 FCBG 비트들은 제 2 서브 프레임의 고정 코드북 이득을 추정한다. 그리고, 여전히 5개 이상의 FCBG 비트들은 제 3 서브 프레임의 고정 코드북 이득을 추정한다.
이 점에서, 모든 비트 패턴(LPC, ADC, ADCG, FCB, FCBG)은 비트 프레임으로 어셈블된다. 신호 프레임을 나타내는 비트 프레임이 완료되면 합성을 위해 제 2 보코더(11)로 전송될 수 있거나, 또는 이후의 검색을 위해 메모리에 저장될 수 있다. 상기 공정은 디지털 스피치 입력의 각각의 신호 프레임을 위해 순차로 자체 반복된다.
도 2는 비트 프레임들을 합성하기 위해 제 2 보코더(11)의 복호화 부분을 예시한다. 제 2 보코더(11)는 제 2 적응 코드북(12), 제 2 고정 코드북(13), 제 2 적응 코드북 이득 유닛(14), 제 2 고정 코드북 이득 유닛(15), 및 합성 필터(16)를 포함한다. 제 2 보코더(11)는 LPC 비트, ACBG 비트, ACB 비트, FCB 비트, 및 FCBG 비트를 수신한다. 이들 비트는 당업계에 잘 공지된 방식으로 원시 신호 프레임의 추정치를 재구축하도록 제 2 보코더(11)에 의해 사용된다.
위에서 주어진 바와 같이, 여러 가지 파라미터에 할당된 비트 프레임 내의 비트 위치의 전체수는 8kbps의 풀 속도로 동작하는 보코더(1)(IS127 EVRC CDMA 코더)에 관련한다. 요컨대, 비트 프레임은 28 LPC 비트; 7 ADC 비트; 3+3+3=9 ACBG 비트; 35+35+35=105 FCB 비트; 및 5+5+5=15 FCBG 비트를 포함할 수 있다. 따라서, 비트 프레임 내의 비트들의 전체수는 164비트일 수 있다.
상기한 바와 같이, 보코더(1)는 다중 속도 보코더이고, 보코더(1)의 반 속도는 4kbps이다. 보코더(1)가 반 속도로 동작할 때, 164 비트 위치 크기를 가진 비트 프레임을 더 이상 전송할 수 없는 한편, 유입하는 디지털 스피치 입력을 여전히 실시간으로 계속할 수 있다. 또한, 비트 프레임 크기는 약 80 비트 위치로 축소되어야 한다.
보코더(1)(IS127 EVRC CDMA 코더)가 그의 반 속도(4kbps)로 동작될 때, 비트 위치는 다음 순서: 즉, 22 LPC 비트; 7 ACB 비트; 3+3+3=9 ACBG 비트; 10+10+10=30 FCB 비트; 및 4+4+4=12 FCBG 비트로 배급된다. 따라서, 비트 프레임 내의 전체 비트수는 80비트일 수 있다. FCB 비트는 비트 프레임의 크기 축소의 우세한 공유를 겪는 것을 알 수 있다.
본 발명은 고정 코드북에 관련하기 때문에, 보코더(1)의 고정 코드북 연산의 동작에 대한 간단한 설명은 그대로이다. 풀 속도(8kbps)에서, 프레임에 대한 고정 코드북 응답을 나타내는 쪽으로 할당된 105 비트 위치는 3개의 서브 프레임 각각에 8개의 추정 펄스를 놓는 능력을 가진다. 이를 그래프로 도 3에 나타낸다.
도 3에서, 제 1 신호 라인(17)은 추정을 위해 고정 코드북(7)에 제공된 제 2 잔류 신호를 예시한다. 제 1 서브 프레임(18)은 53개의 샘플점으로 분할되고, 제 2 서브 프레임(19) 역시 53개의 샘플점으로 분할되고, 제 3 서브 프레임(20)은 54개의 샘플점으로 분할된다.
신호 라인(17) 상의 제 2 잔류 신호의 특성을 잘 추정하기 위해, 양의 펄스 및(또는) 음의 펄스(21)는 샘플점들 중의 선택된 것들에 위치한다. 예를 들면, 제 2 신호 라인(22)은 제 1 신호 라인(17)의 제 2 잔류 신호를 추정하는 데 있어서 펄스(21)의 극성 및 배치를 예시한다. 배치 및 극성은 서브 프레임(18, 19, 20) 각각에 대해 FCB 비트에 의해 특성화된 데이터이다. 다시 말해, 각각의 서브 프레임에 대해, 고정 코드북(7)은 제 1 신호 라인(17)의 제 2 잔류 신호를 나타내기 위해 8 내지 10 펄스(21)의 최상의 배치를 추정하고, 그러한 서브 프레임에 대한 FCB 비트는 펄스(21)의 배치 및 극성을 식별한다.
제 2 보코더(11)가 FCB 비트를 수신할 때, 엔벌로프(23)는 제 1 신호 라인(17)의 제 2 잔류 신호에 대한 추정치를 제공하기 위해 양의 펄스 및 음의 펄스(21)의 배치에 기초하여 수학적으로 구축될 수 있다. 이는 제 3 신호 라인(24) 상에 예시된다. 물론, 서브 프레임들 각각의 FCBG 비트는 각각의 서브 프레임들 내의 엔벌로프(23)의 피크 및 밸리의 크기에 영향을 미칠 수 있으므로, 엔벌로프(23)의 피크 및 밸리의 크기는 제 2 잔류 신호 내의 실제 피크 및 밸리의 평균 크기와 정합된다.
보코더(1)는 풀 속도(8 kbps)에서 동작할 때, 고정된 코드북 응답에 할당된 비트 프레임 내의 105비트는 제 2 및 제 3 신호 라인들(22 및 24)에 의해 예시된 바와 같이 서브 프레임당 8개의 펄스의 위치 및 극성을 나타낼 수 있다. 보코더(1)가 반속도(4kbps)로 동작할 때, 고정 코드북 응답에 할당된 프레임 내의 30비트 위치는 서브 프레임당 3개의 펄스의 위치 및 극성을 유일하게 나타낼 수 있다.
제4 신호(25)는 보코더(1)가 반 속도로 동작할 때 양의 펄스 및 음의 펄스(21')의 배치 및 펄스(21')의 배치에 따라 수학적으로 구축된 엔벌로프(23')를 예시한다. 동작의 반속도 동안 발전된 엔벌로프(23') 뿐만 아니라 보코더(1)가 그의 풀 속도에서 동작할 때 발전된 엔벌로프(23)는 제 1 신호 라인(17)의 제 2 잔류 신호에 근사하지 않음을 분명히 알 수 있다.
제 1 및 제 2 보코더(1, 11)는 고속 비트율에 이르는 매체가 비트 프레임의 전송 동안 사용될 때(예, 4.8kbps 내지 16kbps) 충분한 재생 질에 따라 디지털 스피치를 처리한다. 그러나, 비트율이 4.8kbps이하 일 때(반 속도에 대응하는 4kbps 등), 합성된 음질은 크게 손상된다. 불량한 음질은 주로 도 3에서 제4 신호 라인(25)으로 예시된 바와 같이 서브 프레임들의 고정 코드북 응답의 부정확한 표시에 기인한다.
불량한 표현은 모든 서브 프레임들의 고정 코드북 응답을 나타내기 위해 비트 프레임 내에 할당된 제한된 수의 비트들(예, 30비트)의 결과이다. 비트 프레임 크기는 비트율이 낮을 때 증가될 수 없기 때문에, 단일 프레임 또는 서브 프레임들의 고정 코드북 응답을 보다 정확하게 나타낼 수 있으면서, 비트 프레임 내의 비트 위치들의 제한된 수를 다루는 보코더, 및 보코더 동작 방법에 대한 필요성이 당업계에 존재한다.
본 발명에 따라, 단일 프레임 또는 서브 프레임의 잔류 신호에 대한 비교를 위해 펄스열의 복수의 엔트리를 가진 고정 코드북을 포함하고 있다. 고정 코드북의 엔트리는 부호화되고 있는 단일 프레임 또는 서브 프레임에 맞추어진다. 노이즈 신호는 전송하는 보코더에 저장된다. 부호화하는 동안, 노이즈 신호는 단일 프레임 또는 서브 프레임을 특성화하는 결정된 파라미터들에 의존하여 여과함으로써 성형된다. 성형된 노이즈 신호는 펄스열에 도달하도록 임계 필터를 통해 통과된다. 고정 코드북 응답은 단일 프레임 또는 서브 프레임의 잔류 신호와 가장 잘 정 합하는 펄스열의 그러한 부분(즉, 엔트리)으로서 선택된다. 그러한 부분의 인덱스된 위치는 비트 프레임 내에 포함된 고정 코드북 비트로서 지정된다. 동일한 노이즈 신호 역시 복호화 보코더에 저장된다. 동일한 활성의 필터링 및 임계 필터링이 동일한 펄스열로 도달하도록 동일한 노이즈 신호에 적용된다. 따라서, 비트 프레임의 고정된 코드북 비트는 합성 동안에 사용될 고정 코드북 응답을 나타내는 펄스열의 적당한 위치를 인덱스하게 된다.
본 발명을 아래 주어진 상세한 설명 및 예시의 목적으로만 주어진 것으로 본 발명을 제한하지 않는 수반된 도면으로부터 완전히 이해하게 될 것이다. 도면에서, 동일한 요소들에는 동일한 참조 번호가 할당된다.
도 4는 본 발명에 따라 송신하는 제 1 보코더(50)를 예시한다. 보코더(50)는 LPC 필터(2); 지각형 가중 필터(3); 오류 최소화 필터(5); 제 1 적응 코드북(6); 제 1 적응 코드북 이득 유닛(8); 및 제 1 고정 코드북 이득 유닛(9)을 포함하고 있다. 특히 관심을 끄는 것은 제 1 고정 코드북 성형 유닛(51) 및 본 발명에 따라 변형된 제 1 고정 코드북(52)이다. 제 1 고정 코드북 성형 유닛(51)는 제 1 고정 코드북(52)에 접속되고, LPC 비트, ACB 비트 및 ACBG 비트를 포함하는 입력을 수신한다.
제 1 보코더(50)의 동작 방법은 고정 코드북 응답 추정과 관련된 것을 제외하고는 상기 방법에 대응한다. 제 1 서브 프레임(18)이 추정될 때, 3개의 펄스(21')의 최상의 배치를 결정하는 대신에, 제 2 잔류 신호(신호 라인 17)는 펄스열들중 어느 것이 제 2 잔류 신호와 가장 잘 정합되는지를 결정하기 위해 복수개 의 가능한 펄스열과 비교된다.
이러한 비교는 도 5에 그래프로 예시되어 있다. 10가지 비트 위치가 주어진 서브 프레임의 고정 코드북 응답의 표시 쪽으로 할당되기 때문에, 제 1 고정 코드북(52)은 제 2 잔류 신호와 비교하기 위해 1024(210 = 1024)개의 가능한 펄스열를 가질 것이다. 비교가 이루어지고 최상의 정합이 결정되고, 이어서 최상 정합 시퀀스의 어드레스가 아래 보다 상세히 기재되는 바와 같이 서브 프레임에 대한 FCB 비트로 고려된다.
1024개의 여러 가지 펄스열만이 제 1 고정 코드북(52)과 비교되기 때문에, 시퀀스들이 주의 깊게 선택됨으로써, 가능한 한 치밀한 정합이 발견될 수 있는 것이 중요하다. 본 발명에 의해, 주어진 서브 프레임의 고정 코드북 응답은 서브 프레임을 특성화시키는 LPG 비트, ACB 비트 및 ACBG 비트와 상응 또는 관계를 낳는 것이 발견되었다. 이러한 발견에 기초하여, 본 발명은 서브 프레임에 대한 고정 코드북 응답의 추정 이전에 제 1 고정 코드북(52)의 가능한 시퀀스를 발생시키는 제 1 고정 코드북 성형 유닛(51)를 제공한다.
이제, 제 1 고정 코드북 성형 유닛(51)의 동작을 도 6 및 도 7을 참조하여 기재할 것이다. 제 1 고정 코드북 성형 유닛(51)는 신호선(53) 상에 예시된 바와 같이 내부에 저장된 균일하게 분포된 랜덤 노이즈 f(n)을 가진다. 가우스 분포된 랜덤 노이즈과 같은 랜덤 노이즈 f(n)은 평탄한 스펙트럼을 가진다. 랜덤 노이즈 f(n)은 선형 예측(LP) 가중 필터(54) 및 피치 첨예화 필터(55)를 통해 통과된다. 필터(54 및 55)는 액티브 필터이고, 신호에 따른 이들의 동작은 입력에 의해 제어되는 것을 의미한다. 필터(54 및 55)는 신호 라인(56) 상에 예시된 바와 같이 출력 신호 fs(n)를 생성하기 위해 랜덤 노이즈 f(n)을 변형시킨다. 출력 신호 fs(n)는 경감된 피크를 가진다. 다시 말해, 랜덤 노이즈 f(n)은 LPC 필터(2), 제 1 적응 코드북(6) 및 제 1 적응 코드북 이득 유닛(8)에 의해 결정된 파라미터들에 따라 필터(54 및 55)에 의해 스펙트럼으로 성형된다.
LP 가중 필터(54) 및 피치 첨예화 필터(55)의 동작은 LPC 비트, ACB 비트 및 ACBG 비트를 포함하는 식에 의해 통제된다. 이 식은 도 6에 예시되어 있고, 여기서, A(z)는 LPC 필터(2)의 출력을 나타내고; ga는 양자화된 ACB 이득이며; P는 피치 래그이다(적응 코드북(6)에 의해 결정됨). 본질적으로, LP 가중 필터(54)는 71 및 72 인자에 의해 폴을 확대시킨다.
LP 가중 필터(54) 및 피치 첨예화 필터(55)는 통상적으로 사용되는 필터이다. 필터의 식 및 동작 특성은 공지되어 있다. 그러나, 본 발명에 개시된 바와 같이 LP 가중 필터(54) 및 피치 첨예화 필터(55)를 조합하여 사용하는 것은 당업계에 알려져 있지 않다. LP 가중 필터(54) 및 피치 첨예화 필터(55)에 대한 보다 상세한 정보를 원하면, W.B. Kleijn 등의 "스피치 부호화 및 합성(Speech Coding and Synthesis)"(Elsevier Press, 1995, 제89-90페이지)과 같은 주제에 관한 문헌을 참조할 수 있다.
상기 피치 첨예화 필터(55)의 출력 fs(n)은 신호 라인(58) 상에 예시된 바와 같이 펄스열 P(n)에 도달하도록 비선형 임계 필터(57)를 통과된다. 임계 필터(57) 는 조정 가능한 상위 임계값 및 하위 임계값을 가진다. 임계값들 간의 신호 fs(n)의 모든 발생은 0과 동일하게 설정된다. 소정의 기간에 대한 상위 임계값 이상의 신호 fs(n)의 발생은 양의 펄스(21n)를 획득하고, 마찬가지로 소정의 기간에 대한 하위 임계값 이하의 신호 fs(n)의 발생은 음의 펄스(21n)를 획득한다.
펄스(21n)의 스파시티는 임계 필터(57)의 상위 임계값 및 하위 임계값을 설정함으로써 조절될 수 있다. 예를 들면, 임계값들이 함께 근접하는 경우, 즉, 0에 근접하는 경우, 많은 펄스들(21n)이 펄스열 P(n)에서 발생할 것이다. 본 발명에 의해, 스파시티는 85% 내지 93%의 대략적인 범위로 설정되는 것이 바람직하고, 이는 샘플의 85% 내지 90%가 0과 동일하고, 서브 프레임당 일부 4 내지 7개의 펄스를 남긴다.
본 발명이 도 3에 예시된 바와 같이 서브 프레임당 53 내지 54 샘플을 유지하는 경우, 고정 코드북 성형 유닛(51)에 저장된 랜덤 노이즈 f(n)은 이것이 대략적으로 133 msec 타임 지속으로 해석될 수 있는 6.7 msec 서브 프레임에 따라 54+1024=1078 샘플 동안 지속된다. 고정 코드북 응답 가능성은 펄스열 P(n) 상으로 이동되는 54개 샘플 폭의 윈도우(벡터라 칭하기도 함)에 의해 결정된다.
윈도우의 제로 배치는 참조 번호(60)에 의해 예시된다. 윈도우(60) 바로 위의 펄스열은 제 1 고정 코드북(52)에 의해 인덱스된 엔트리(0)로 나타낸다(도 5 참조). 윈도우의 제 1 시프트된 배치는 참조 번호(61)로 예시된다. 윈도우(61) 바 로 위의 펄스열은 제 1 고정 코드북(52)에 의해 인덱스된 엔트리(1)로 표시된다. 윈도우의 제 2 시프트된 배치는 참조 번호(62)로 예시된다. 윈도우(62) 바로 위의 펄스열은 제 1 고정 코드북(52)에 의해 인덱스된 엔트리(2)로 나타낸다. 시프팅 윈도우 프로세스는 인덱스된 엔트리(1023)를 나타내는 최종 시프트된 윈도우(63)가 제 1 고정 코드북(52)에 의해 결정될 때까지 반복된다.
2156개의 샘플 지속에 의해 랜덤 노이즈 f(n)을 가질 수도 있다. 이러한 경우에, 윈도우 또는 벡터는 고정 코드북에 대해 1024개의 가능한 시퀀스에 도달하도록 2개의 샘플의 증분으로 시프트될 수 있다. 사실상, 랜덤 노이즈의 기간을 확장시키고, 윈도우의 증가하는 스테핑을 증가시킴으로써 이러한 패턴을 전할 수 있다.
제 1 서브 프레임(18)에 대한 고정 코드북 응답은 제 1 서브 프레임의 제 2 잔류 신호와 가장 잘 정합되는 펄스열인 것으로 결정된다. 그러한 엔트리의 인덱스(펄스열 P(n)에 따른 윈도우의 시프트된 위치의 수와 동일함)는 제 1 서브 프레임에 대한 FCB 비트일 것이다. 다음에, 제 1 고정 코드북(52)에 대한 새로운 펄스열이 공식화될 수 있고 제 2 서브 프레임(19)은 결정된 그의 고정 코드북 응답을 가질 것이다. 이어서, 제 1 고정 코드북(52)에 대한 새로운 펄스열이 다시 공식화될 수 있고 제 3 서브 프레임(20)이 결정된 고정 코드북 응답을 가지게 된다.
본 발명의 변동은 제 1 고정 코드북(52)에 대한 새로운 펄스열들을 주기적으로 결정하기 위한 것일 수 있음에 주의해야 한다. 예를 들면, 새로운 펄스열들은 각각의 새로운 서브 프레임과 반대로 각각의 새로운 신호 프레임에 대해서만 공식화될 수 있고, 이는 사실상 본 발명의 바람직한 실시예이다. 또한, 새로운 엔트리 가 모든 다른 신호 프레임 등에 대해 공식화될 수 있다. 모든 신호 프레임 또는 모든 다른 신호 프레임으로 고정 코드북의 펄스열의 재공식화를 제한함으로써, 연루된 연산이 단순화된다. 더욱이, 고정 코드북의 펄스열들을 재사용하는 것은 스피치가 연루된 잠깐의 타임 지속 중에 현저하게 변화하려는 경향이 없기 때문에 고정 코드북 응답을 추정하는 데 있어서 보편적으로 충분히 정확하다.
도 8은 수신하는 제 2 보코더(64)의 복호화 부분을 예시한다. 제 2 보코더(64)는 제 2 적응 코드북(12), 제 2 적응 코드북 이득 유닛(14), 제 2 고정 코드북 이득 유닛(15) 및 합성 필터(16)를 포함한다. 특히 관심을 끄는 것은 제 2 고정 코드북 성형 유닛(65) 및 본 발명에 따라 변형된 제 2 고정 코드북(66)이다.
제 2 고정 코드북 성형 유닛(65)의 동작은 제 1 보코더(50)의 제 1 고정 코드북 성형 유닛(51)와 동일하다. 제 2 고정 코드북 성형 유닛(65) 내부에는 도 7의 신호 라인(53) 상에 예시된 랜덤 노이즈 f(n)의 동일한 사본이 저장된다. 제 2 고정 코드북 성형 유닛(65)은 동일한 적응 필터(54 및 55)뿐만 아니라 동일한 임계 필터(57)를 포함하고, 단 상위 임계값 및 하위 임계값은 제 1 고정 코드북 성형 유닛(51)에 위치하는 임계 필터(57)의 상위 임계값 및 하위 임계값과 동일하게 설정된다. 따라서, 제 2 고정 코드북 성형 유닛(65)은 도 7의 신호 라인(58) 상에 예시된 바와 같이 제 1 고정 코드북 성형 유닛(51)에서 이미 발생된 펄스열 P(n)와 동일한 1,078개 샘플의 샘플 기간을 가진 펄스열 P(n)를 발생시킬 수 있다.
일단 펄스열 P(n)가 발생되면, 제 2 고정 코드북(66)은 FCB 비트로 나타낸 인덱스와 동일한 펄스열 P(n)에 따른 위치의 수를 54개의 샘플 길이 윈도우를 시프 트함으로써 고정 코드북 응답을 결정할 수 있다. 시프트된 윈도우 바로 위에 놓인 펄스열 P(n) 부분은 제 1 보코더(50)에 의해 결정된 고정 코드북 응답의 적절한 추정일 것이다. 신호 프레임의 제 2 보코더의 합성의 모든 다른 국면은 도 2에 예시된 배경 기술의 복호화 보코더(11)에 따른 것이다.
제 2 잔류 신호를 추정하는 데 이용될 수 있는 제 1 고정 코드북(52)에서 펄스열 엔트리들은 각각 일부 4 내지 7개의 펄스를 포함하는 것에 주의해야 한다. 이는 제 2 잔류 신호의 서브 프레임 추정치 당 배경 기술의 3개의 펄스 이상의 상당한 개선점이다. 이러한 개선은 재생된 음질에서 인식할 수 있는 개선점으로 해석된다.
제 1 고정 코드북(52)에서 시퀀스당 4 내지 7개의 펄스의 배치를 허용하는 본 발명의 한가지 중요한 특징은 엔트리가 취해지는 펄스열 P(n)가 모델링되고 있는 신호의 다른 결정된 파라미터들에 따라 구축된다는 사실이다. 본 발명에 의해, LPC 파라미터, ACB 파라미터 및 ACBG 파라미터 등의 기타 결정된 파라미터들이 예기된 고정 코드북 응답과의 관계 또는 상관 관계를 낳은 것이 발견되었다. 따라서, 이들 파라미터는 제한된 크기, 고정 코드북에 이용될 수 있는 펄스열를 성형하기 위해 사용될 수 있으므로, 가능한 펄스열들은 분석이 수행될 때 제 2 잔류 신호와 비교적 크게 정합될 것이다.
4 내지 7개의 펄스를 가진 펄스열들이 단순히 랜덤하게 발생되는 경우, 고정 코드북의 제한된 크기(1024개의 가능한 시퀀스)는 제 2 잔류 신호들을 연속적으로 변화시키는 대다수에 적절한 정합 펄스열를 제공하기에 통계학적으로 불충분할 수 있다. 즉, 1024개의 가능한 펄스열 각각이 그 열을 따라 랜덤하게 놓인 4 내지 7개의 펄스를 가진 경우, 고정 코드북에 의해 결정된 바와 같이 제 2 잔류 신호에 대한 최상의 정합 펄스열은 불량한 정합이 되기 쉽고, 그 프레임 또는 서브 프레임에 대해 재생된 스피치는 부정확해지기 쉽다.
제 2 보코더(64)는 제 1 고정 코드북(52)에 의해 사용된 펄스열 P(n)를 재구축하기 위해 임의의 여분의 데이터를 수신할 필요가 없다는 장점이 있음에 주의해야 한다. 펄스열 P(n)의 재구축에 사용된 LPC 비트, ACB 비트 및 ACBG 비트는 스피치 신호를 재구축하기 위해 제 2 보코더(64)에 의해 이미 필요하므로, 비트 프레임 내에 어떠한 여분의 데이터도 포함되지 않는다.
개시 내용 및 도면 도처에서 서브 프레임 내의 샘플점에 놓인 펄스들에 대한 참조가 이루어졌다. 그러한 예시는 단지 수학적 동작 및 식의 도식적 표시임을 용이하게 알 수 있다. 도식적인 표시는 배경 기술과 본 발명 간의 차이점을 나타내는 데 있어서 개시 내용을 단순화시킨다. 실제로, 고정 코드북(52 및 66), 고정 코드북 성형 유닛(51 및 65)는 도식적인 표시 밑에 놓인 수학적 동작 및 식을 처리할 수 있다.
또한, 본 발명은 제 1 및 제 2 고정 코드북(52 및 66)으로부터 별개의 요소들로서 제 1 및 제 2 고정 코드북 성형 유닛(51 및 65)를 예시하였다. 별개의 예시는 개시의 제공을 단순화시키기 위해 이루어졌다. 실제로, 고정 코드북 성형 유 닛 및 고정 코드북은 단일 물리적 요소에 포함될 수 있다. 더욱이, 보코더(50 및 64) 내의 다른 예시된 "블랙 박스" 요소들이 조합됨으로써 하나의 물리적 요소은 예시된 여러 가지 "블랙 박스" 요소과 관련된 1개 이상의 과업 또는 동작을 수행할 수 있다. 예를 들면, 가중 필터(54)는 피치 첨예화 필터(55) 및 임계 필터(57)와 조합되어 단일 요소을 형성할 수 있고, 설명할 목적으로 개별적으로 예시된 동작을 수행한다.
IS 127 EVRC C음 코드를 비교 목적으로 배경 기술에 기재하였지만, 본 발명은 보코더 및(또는) 보코더의 동작에 사용된 요소들과 무관하게 임의의 보코더의 성능을 개선시키기 위해 사용될 수 있음이 인식되어야 한다. 더욱이, 본 발명은 낮은 비트율로 동작될 때, 보코더의 성능을 개선시키는 데 특히 유용하지만, 본 발명은 중간 및 높은 비트율로 동작되는 보코더의 추정 정확도를 개선시키기 위해 사용될 수 있다.
상기 명세서에 사용된 특정 수치들은 본 발명을 제한하는 것으로 해석되지 않아야 한다. 특정 수치들은 단지 본 발명의 일 실시예의 완전한 이해를 돕기 위해 제공되었다. 본 발명은 명세서의 실시예에 특별히 사용된 것들 이외의 수치에서 보코더의 동작에 유리함을 인식해야 한다. 예를 들면, 신호 프레임들은 기간적으로 20 msec보다 길거나 짧을 수 있다. 신호 프레임들은 3개보다 많거나 적은 서브프레임들을 가질 수 있고, 또는 서브 프레임들은 전혀 없을 수도 있다. 33개 또는 34개 이외의 임의의 수의 샘플들이 서브 프레임으로 취해질 수 있다.
이와 같이 본 발명을 설명하였으나, 본 발명이 많은 방식으로 변화될 수 있음이 명백하다. 그러한 변화들은 본 발명의 사상 및 범위로부터 이탈하는 것으로서 간주되지 않아야 하고, 당업계의 숙련자에게 명백한 그러한 모든 변형은 하기 특허 청구 범위에 포함되는 것으로 의도된다.

Claims (20)

  1. 미리 결정된 신호를 제공하는 단계와;
    보코더(vocoder)에 의한 처리를 위해 입력 신호를 수신하는 단계와;
    상기 입력 신호를 특성화(characterizing)하는 적어도 하나의 파라미터를 추출하는 단계와;
    변경된 신호에 도달하도록 상기 추출된 적어도 하나의 파라미터에 관하여 상기 미리 결정된 신호를 변경하는 단계와;
    상기 입력 신호의 적어도 일부에 대한 고정 코드북(fixed codebook) 응답을 나타내기 위하여 상기 변경된 신호의 일부를 결정하는 단계를 포함하는, 보코더 동작 방법.
  2. 제 1 항에 있어서,
    상기 결정하는 단계는,
    상기 입력 신호의 적어도 일부의 잔류 신호를 상기 변경된 신호의 여러 부분들과 비교하는 단계와,
    상기 여러 부분들 중 어느 부분이 상기 잔류 신호와 가장 일치하는지를 결정하는 단계를 포함하는, 보코더 동작 방법.
  3. 제 1 항에 있어서,
    상기 미리 결정된 신호는 가우스 랜덤 노이즈 신호인, 보코더 동작 방법.
  4. 제 1 항에 있어서,
    상기 변경된 신호의 일부의 인덱스된 위치(indexed location)는 비트 패턴에 의해 특성화되어, 상기 입력 신호를 나타내는 비트 프레임 내에 포함되는, 보코더 동작 방법.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 제 1 항에 있어서,
    지각형 가중 필터(perceptual weighing filter), 피치 첨예화 필터(pitch sharpening filter), 및 임계 필터(thresholding filter) 중 적어도 하나를 제공하는 단계를 더 포함하고,
    상기 변경하는 단계는 상기 지각형 가중 필터, 상기 피치 첨예화 필터, 및 상기 임계 필터중 상기 제공된 적어도 하나를 통해 상기 미리 결정된 신호를 전달(passing)하는 단계를 포함하는, 보코더 동작 방법.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 제 1 항에 있어서,
    상기 적어도 하나의 파라미터는 선형 예측 부호화 비트들, 적응 코드북 비트들, 및 적응 코드북 이득 비트들에 의해 표현되는 적어도 하나의 파라미터를 포함하는 그룹으로부터 선택되는, 보코더 동작 방법.
  15. 보코더에 의한 처리를 위해 비트 프레임을 수신하는 단계와;
    변경된 신호에 도달하도록 상기 프레임 내의 제 1 비트들에 관하여 미리 결정된 신호를 변경하는 단계와;
    상기 프레임 내의 제 2 비트들을 이용하여 상기 변경된 신호의 일부를 인덱스하는 단계와;
    상기 비트 프레임의 적어도 일부에 대한 고정 코드북 응답을 나타내기 위해 상기 인덱스된 부분을 결정하는 단계를 포함하는, 보코더 동작 방법.
  16. 제 15 항에 있어서,
    상기 제 1 비트들은 상기 비트 프레임의 적어도 일부에 대한 선형 예측 부호화 응답을 나타내는, 보코더 동작 방법.
  17. 제 15 항에 있어서,
    상기 제 1 비트들은 상기 비트 프레임의 적어도 일부에 대한 적응 코드북 이득 응답, 선형 예측 부호화 응답, 및 적응 코드북 응답을 나타내는, 보코더 동작 방법.
  18. 제 15 항에 있어서,
    상기 인덱스된 부분은 펄스열인, 보코더 동작 방법.
  19. 삭제
  20. 삭제
KR1020000022493A 1999-04-28 2000-04-27 씨이엘피 스피치 부호화를 위한 성형 고정 코드북 탐색 방법 KR100713566B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/300,314 US6449313B1 (en) 1999-04-28 1999-04-28 Shaped fixed codebook search for celp speech coding
US09/300,314 1999-04-28
US9/300,314 1999-04-28

Publications (2)

Publication Number Publication Date
KR20000077100A KR20000077100A (ko) 2000-12-26
KR100713566B1 true KR100713566B1 (ko) 2007-05-03

Family

ID=23158589

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000022493A KR100713566B1 (ko) 1999-04-28 2000-04-27 씨이엘피 스피치 부호화를 위한 성형 고정 코드북 탐색 방법

Country Status (9)

Country Link
US (1) US6449313B1 (ko)
EP (1) EP1049073B1 (ko)
JP (2) JP2001034300A (ko)
KR (1) KR100713566B1 (ko)
CN (1) CN1271925A (ko)
AU (1) AU2893900A (ko)
BR (1) BR0009621A (ko)
CA (1) CA2305972A1 (ko)
DE (1) DE60016305T2 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
US20070136054A1 (en) * 2005-12-08 2007-06-14 Hyun Woo Kim Apparatus and method of searching for fixed codebook in speech codecs based on CELP
EP1994531B1 (fr) * 2006-02-22 2011-08-10 France Telecom Codage ou decodage perfectionnes d'un signal audionumerique, en technique celp
US8004436B2 (en) * 2008-10-09 2011-08-23 Analog Devices, Inc. Dithering technique for reducing digital interference
KR101847213B1 (ko) * 2010-09-28 2018-04-11 한국전자통신연구원 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06214599A (ja) * 1992-11-02 1994-08-05 Hughes Aircraft Co コードブック励起直線予測探索ループにおいて使用するための適応ピッチパルス強調装置および方法
EP0654909A1 (en) * 1993-06-10 1995-05-24 Oki Electric Industry Company, Limited Code excitation linear prediction encoder and decoder
EP0714089A2 (en) * 1994-11-22 1996-05-29 Oki Electric Industry Co., Ltd. Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulse excitation signals
WO1999012156A1 (en) * 1997-09-02 1999-03-11 Telefonaktiebolaget Lm Ericsson (Publ) Reducing sparseness in coded speech signals
US5903853A (en) * 1993-03-11 1999-05-11 Nec Corporation Radio transceiver including noise suppressor
US5950155A (en) * 1994-12-21 1999-09-07 Sony Corporation Apparatus and method for speech encoding based on short-term prediction valves
US5982817A (en) * 1994-10-06 1999-11-09 U.S. Philips Corporation Transmission system utilizing different coding principles
US6144935A (en) * 1992-02-18 2000-11-07 Lucent Technologies Inc. Tunable perceptual weighting filter for tandem coders
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0511799A (ja) * 1991-07-08 1993-01-22 Fujitsu Ltd 音声符号化方式
JP3338074B2 (ja) * 1991-12-06 2002-10-28 富士通株式会社 音声伝送方式
JP3232701B2 (ja) * 1992-10-15 2001-11-26 株式会社日立製作所 音声符号化方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144935A (en) * 1992-02-18 2000-11-07 Lucent Technologies Inc. Tunable perceptual weighting filter for tandem coders
JPH06214599A (ja) * 1992-11-02 1994-08-05 Hughes Aircraft Co コードブック励起直線予測探索ループにおいて使用するための適応ピッチパルス強調装置および方法
US5903853A (en) * 1993-03-11 1999-05-11 Nec Corporation Radio transceiver including noise suppressor
EP0654909A1 (en) * 1993-06-10 1995-05-24 Oki Electric Industry Company, Limited Code excitation linear prediction encoder and decoder
US5982817A (en) * 1994-10-06 1999-11-09 U.S. Philips Corporation Transmission system utilizing different coding principles
EP0714089A2 (en) * 1994-11-22 1996-05-29 Oki Electric Industry Co., Ltd. Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulse excitation signals
US5950155A (en) * 1994-12-21 1999-09-07 Sony Corporation Apparatus and method for speech encoding based on short-term prediction valves
WO1999012156A1 (en) * 1997-09-02 1999-03-11 Telefonaktiebolaget Lm Ericsson (Publ) Reducing sparseness in coded speech signals
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals

Also Published As

Publication number Publication date
CN1271925A (zh) 2000-11-01
JP2001034300A (ja) 2001-02-09
AU2893900A (en) 2000-11-02
KR20000077100A (ko) 2000-12-26
BR0009621A (pt) 2002-04-23
EP1049073A2 (en) 2000-11-02
DE60016305T2 (de) 2005-11-24
CA2305972A1 (en) 2000-10-28
JP4690356B2 (ja) 2011-06-01
JP2007226252A (ja) 2007-09-06
EP1049073B1 (en) 2004-12-01
DE60016305D1 (de) 2005-01-05
EP1049073A3 (en) 2003-03-26
US6449313B1 (en) 2002-09-10

Similar Documents

Publication Publication Date Title
JP4690356B2 (ja) ボコーダの動作方法
US8401843B2 (en) Method and device for coding transition frames in speech signals
CN100369112C (zh) 可变速率语音编码
CA1333425C (en) Communication system capable of improving a speech quality by classifying speech signals
CN1820306B (zh) 可变比特率宽带语音编码中增益量化的方法和装置
EP0422232A1 (en) Voice encoder
CA2202825C (en) Speech coder
EP0833305A2 (en) Low bit-rate pitch lag coder
CN1292914A (zh) 语音编码
KR100556831B1 (ko) 전역 펄스 교체를 통한 고정 코드북 검색 방법
JP2004163959A (ja) 汎用AbS音声符号化方法及びそのような方法を用いた符号化装置
US5963897A (en) Apparatus and method for hybrid excited linear prediction speech encoding
WO2004090864A2 (en) Method and apparatus for the encoding and decoding of speech
JPH0782360B2 (ja) 音声分析合成方法
EP0483882B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
US7472056B2 (en) Transcoder for speech codecs of different CELP type and method therefor
Kim et al. On a Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder
KR100389898B1 (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법
KR960011132B1 (ko) 씨이엘피(celp) 보코더에서의 피치검색방법
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置
Docampo et al. A deconvolution-based efficient method for generating the excitation in linear predictive speech coding
versus Block Model-Based Speech Coding
Popescu et al. A DIFFERENTIAL, ENCODING, METHOD FOR THE ITP DELAY IN CELP
JPH0830298A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130412

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140418

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150422

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180413

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190328

Year of fee payment: 13