KR20010029498A - 개선된 음향 엔코더 및 디코더를 갖는 송신기 - Google Patents

개선된 음향 엔코더 및 디코더를 갖는 송신기 Download PDF

Info

Publication number
KR20010029498A
KR20010029498A KR1019997002061A KR19997002061A KR20010029498A KR 20010029498 A KR20010029498 A KR 20010029498A KR 1019997002061 A KR1019997002061 A KR 1019997002061A KR 19997002061 A KR19997002061 A KR 19997002061A KR 20010029498 A KR20010029498 A KR 20010029498A
Authority
KR
South Korea
Prior art keywords
analysis
acoustic
voice
coefficients
segment
Prior art date
Application number
KR1019997002061A
Other languages
English (en)
Other versions
KR100568889B1 (ko
Inventor
타오리라케스
슬루이즈터로베르트요한네스
게르리트스안드레아스요한네스
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Publication of KR20010029498A publication Critical patent/KR20010029498A/ko
Application granted granted Critical
Publication of KR100568889B1 publication Critical patent/KR100568889B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

음향 엔코더(4)에 있어서, 음향신호는 음성 음향 엔코더(16) 및 비음성 음향 엔코더(14)를 사용하여 엔코더된다. 양 음향 엔코더(14, 16) 모두 음향신호를 나타내기 위하여 분석계수를 사용한다. 본 발명에 의하면, 분석계수는, 음성 음향에서 비음성 음향으로 또는 그와 반대로 일어나는 천이가 감지될 때, 보다 빈번하게 결정된다.

Description

개선된 음향 엔코더 및 디코더를 갖는 송신기{Transmitter with an improved speech encoder and decoder}
상술한 것에 따른 송신 시스템은 유럽 특허 제259 950호에서 알 수 있다.
이러한 송신 시스템 및 음향 엔코더는 음향 신호가 제한된 송신 용량을 가지는 송신 매체를 거쳐 송신되거나, 제한된 저장 용량을 가지는 저장 매체에 저장되는 것에 응용시 이용된다. 이러한 응용 예는 인터넷을 거쳐 음향 신호를 송신하고, 이동 전화에서 기지국 등으로 송신되며, CD-ROM 상에, 고상(solid state) 메모리 내에 또는 하드디스크 드라이브 상에 음향 신호를 송신하는 것이다.
음향 엔코더의 상이한 동작 원리는 적절한 음향질(speech quality)을 알맞은 비트 속도로 달성하게 한다. 이러한 동작 방법들 중 한가지 방법에 있어서, 음성 신호와 비음성 신호 사이의 구별이 행해진다. 이러한 2가지 종류의 음향 신호는 대응하는 형태의 음향 신호의 특성에 각각 최적화되는 상이한 음향 엔코더를 이용하여 엔코드된다.
다른 동작 형태는 음향 신호가 코드북(codebook)내에 저장된 다수의 여진 신호로부터 유도된 여진 신호에 의해 합성 필터를 여진시킴으로써 얻어지는 합성 음향 신호와 비교되는 소위 CELP 엔코더이다. 음향 신호와 같은 주기 신호를 처리하기 위해, 소위 적응 코드북이 이용된다.
양자 형태의 음향 엔코더에 있어서, 분석 파라메터는 음향 신호를 묘사하도록 결정될 수 있다. 음향 엔코더에 대한 유효 비트를 감소시에, 재구성 신호의 획득가능 음향질이 신속하게 저하한다.
본 발명은 분석 계수를 음향 신호(speech signal)에서 주기적으로 결정하기 위한 분석 수단을 포함하는 음향 엔코더를 가지는 송신기를 포함하는 송신 시스템에 관한 것인데, 송신기는 상기 분석 계수를 송신 매체를 경유하여 수신기로 송신하기 위한 송신 수단을 포함하고, 상기 수신기는 분석 계수에 기초하여 재구성 음향 신호를 유도하기 위한 재구성 수단을 가지는 음향 디코더를 포함한다.
또한, 본 발명은 송신기, 수신기, 음향 엔코더, 음향 디코더, 음향 엔코딩 방법, 음향 디코딩 방법, 및 상기 방법을 실시하는 컴퓨터 프로그램을 포함하는 유형 매체(tangible medium)에 관한 것이다.
지금부터 도면을 참조하여 본 발명을 설명하고자 한다.
도 1은 본 발명에 이용할 수 있는 송신 시스템이고,
도 2는 본 발명에 따른 음향 엔코더(4)이며,
도 3은 본 발명에 따른 음성 엔코더(16)이고,
도 4는 도 3에 따른 음성 엔코더(16)에 이용하기 위한 LPC 계산 수단(30)이며,
도 5는 도 3에 따른 음향 엔코더에 이용하기 위한 피치 터닝 수단(32)이고,
도 6은 도 2에 따른 음향 엔코더에 이용하기 위한 비음성용 음향 엔코더(14)이며,
도 7은 도 1에 따른 시스템이 이용하기 위한 음향 디코더(14)이고,
도 8은 음향 디코더(14)에 이용하기 위한 음성 디코더(94)이며,
도 9는 음성 디코더(94) 내의 다수의 지점에 제공된 신호의 그래프도이고,
도 10은 음향 디코더(14)에 이용하기 위한 비음성 디코더(96)이다.
본 발명의 목적은 감소된 비트 속도를 가지는 음향질의 저하가 감소되는 음향 신호에 송신 시스템을 제공하기 위한 것이다.
그러므로, 본 발명에 따른 송신 시스템은 분석 수단이 음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 결정하기 위해 배열되고, 재구성 수단이 보다 자주 결정된 분석 계수에 기초하여 재구성 음성 신호를 유도하기 위해 배열되는 것을 특징으로 한다.
본 발명은 음향 신호의 질의 저하에 관한 중요한 소오스가 음성에서 비음성 등으로의 천이중에 분석 파라메터의 변경의 불충분한 추적(tracking)인 것의 인식에 기초를 둔다. 이러한 천이 근처의 분석 파라메터의 갱신 속도를 증가시킴으로써 음향질은 후속적으로 개선된다. 천이가 매우 가끔 발생되지 않기 때문에, 분석 파라메터의 더 많은 주파수 갱신을 처리하는데 필요한 부수적인 비트 속도는 적당해진다. 분석 계수를 결정하는 주파수는 천이가 실제로 발생되기 전에 증가되지만, 분석 계수를 결정하는 주파수는 천이가 발생된 후에 증가되는 것이 가능하다는 것을 알 수 있다. 분석 계수를 결정하는 주파수를 증가시키는 상기 방법의 조합도 가능하다.
본 발명의 실시예는 음향 엔코더가 음성 세그먼트를 엔코딩시키기 위한 음성 엔코더를 포함하고, 음향 엔코더가 비음성 세그먼트를 엔코딩시키기 위한 비음성 엔코더를 포함하는 것을 특징으로 한다.
실험은 천이 근처에서 분석 파라메터의 갱신 속도를 증가시킴으로써 얻어질 수 있는 개량 조건은 특히 음성 및 비음성 디코더를 이용하는 음향 엔코더에 유리하다는 것을 나타낸다. 이러한 형태의 음향 엔코더에 있어서, 가능한 개선이 후속적으로 발생된다.
본 발명의 다른 실시예는 분석 수단이 천이에 뒤이어 2개의 세그먼트에 대해 보다 자주 일어나는 분석 계수를 결정하기 위해 배열되는 것을 특징으로 한다.
천이에 후속적으로 2개의 프레임이 보다 자주 일어나는 분석 계수를 결정하는 것으로 후속적으로 증가된 음향질이 이미 발생되었다는 것이다.
본 발명의 또 다른 실시예는 분석 수단이 음성과 비음성 세그먼트 사이의 천이시에 분석 계수의 결정에 관한 주파수를 배가시키도록 배열되는 것을 특징으로 한다.
분석 계수의 결정에 관한 주파수의 배가는 후속적으로 증가된 음향질을 얻기 위해 충분히 입증된다.
도 1에 따른 송신 시스템에 있어서, 음향 신호는 송신기(2)의 입력에 인가된다. 송신기(2)에 있어서, 음향 신호는 음향 엔코더(4)에서 엔코드된다. 음향 엔코더(4)의 출력에서 엔코드된 음향 신호는 송신 수단(6)을 통과한다. 송신 수단(6) 코드화 음향 신호의 채널 코딩, 간삽(interleaving) 및 변조를 수행하도록 배열된다.
송신 수단(6)의 출력 신호는 송신기의 출력을 통과하고, 송신 매체(8)를 경유하여 수신기(5)에 전달된다. 수신기(5)에 있어서, 채널의 출력 신호는 수신 수단(7)을 통과한다. 이러한 수신 수단(7)은 동조 및 변조, 비간삽(적용 가능한 경우) 및 채널 코딩과 같은 RF 처리를 제공한다. 수신 수단(7)의 출력 신호는 이것의 입력 신호를 재구성 음향 신호로 변환하는 음향 디코더(9)를 통과한다.
도 2에 따른 음향 엔코더(4)의 입력 신호 ss[n]는 입력으로부터의 바람직하지 못한 DC 오프셋(offset)을 제거하기 위해 DC 노치(notch) 필터(10)에 의해 필터된다. 상기 DC 노치 필터는 15 ㎐의 차단(cut-off) 주파수(-3 ㏈)를 가지고 있다. DC 노치 필터(10)의 출력 신호는 버퍼(11)의 입력에 인가된다. 버퍼(11)는 400 DC 필터된 음향 샘플 블록을 본 발명에 따른 음성 엔코더(16)에 제공한다. 상기 400 샘플 블록은 10 ㎳ 음향(각각 80개 샘플)의 5개 프레임을 포함한다. 이것은 현재 엔코드될 프레임, 2개의 선행 및 2개의 후속 프레임을 포함한다. 버퍼(11)는 각각의 프레임 기간에 가장 최근에 수신된 80개 샘플의 프레임을 200 ㎐ 고역 통과 필터(12)의 입력에 제공된다. 고역 통과 필터(12)의 출력은 비음성 엔코더(14)의 입력 및 음성/비음성 검출기(28)의 입력에 접속된다. 고역 통과 필터(12)는 360개 샘플 블록을 음성/비음성 검출기(28)에 제공하고, 160개 샘플 블록(음향 엔코더(4)가 5.2 kbit/sec 모드로 동작하는 경우) 또는 240개 샘플 블록(음향 엔코더(4)가 3.2 kbit/sec 모드로 동작하는 경우)을 비음성 엔코더(14)에 제공한다. 상기에 제공된 상이한 샘플 블록과 버퍼(11)의 출력 사이의 관계는 아래 테이블 내에 제공된다.
음성/비음성 검출기(28)는 현재 프레임이 음성 또는 비음성을 포함하는지 음성/비음성 플래그(flag)로서의 결과를 제공하는지를 결정한다. 이러한 플래그는 멀티플렉서(22), 비음성 엔코더(14) 및 음성 엔코더(16)를 통과한다. 음성/비음성 플래그의 값에 따라서 음성 엔코더(16) 또는 비음성 엔코더(15)가 작동된다.
음성 엔코더(16)에 있어서, 입력 신호는 다수의 고조파에 관련된 사인 신호로서 묘사된다. 음성 엔코더의 출력은 피치값, 이득값 및 16개 예상 파라메터의 묘사를 제공한다. 피치값 및 이득값은 멀티플렉서(22)의 대응하는 입력에 인가된다.
5.2 kbit/sec 모드에 있어서, LPC 계산은 10 ㎳마다 수행된다. 3.2 kbit/sec에 있어서, LPC 계산은 비음성에서 음성 등으로의 천이가 발생될 때를 제외하고 20 ㎳마다 수행된다. 이러한 천이가 발생할 경우, 3.2 kbit/sec 모드에 있어서 LPC 계산은 10 msec 마다 수행되기도 한다.
음성 엔코더의 출력에서의 LPC 계수는 호프만(Huffman) 엔코더(24)에 의해 엔코드된다. 호프만 엔코드된 시퀀스의 길이는 호프만 엔코더(24)내의 비교기에 의해 대응하는 입력 시퀀스의 길이와 비교된다. 호프만 엔코드된 시퀀스의 길이가 입력 시퀀스보다 긴 경우, 비코드화 시퀀스를 송신하는 것이 결정된다. 그렇지 않은 경우, 호프만 엔코드된 시퀀스를 송신하는 것이 결정된다. 상기 결정은 멀티플렉서(26) 및 멀티플렉서(22)에 인가되는 "호프만 비트"에 의해 묘사된다. 멀티플렉서(26)는 "호프만 비트"에 따라서 호프만 엔코드된 시퀀스 또는 입력 시퀀스를 멀티플렉서(22)로 통과시키도록 배열된다. 멀티플렉서(26)와 조합하여 "호프만 비트"를 이용하는 것은 예상 계수의 묘사에 관한 길이가 선정된 이용을 초과하지 않도록 된다는 장점을 가지고 있다. "호프만 비트" 및 멀티플렉서(26)의 이용 없이도, 호프만 엔코드된 시퀀스의 길이는 제한된 수의 비트가 LPC 계수의 송신으로 비축되는 송신 프레임 내에 엔코드된 시퀀스가 이제는 삽입되지 않는 크기와 같은 입력 시퀀스의 입력을 호프만 엔코드된 시퀀스의 길이가 초과하는 것이 발생될 수 있다.
비음성 엔코더(14)에 있어서, 이득차 및 6 예상 계수는 비음성 신호를 묘사하기 위해 결정된다. 6 LPC 계수는 호프만 엔코드된 시퀀스 및 "호프만 비트"를 이것의 출력에 제공하는 호프만 엔코더(18)에 의해 엔코드된다. 호프만 엔코더(18)의 호프만 엔코드된 시퀀스 및 입력 시퀀스는 "호프만 비트"에 의해 제어되는 멀티플렉서(20)에 인가된다. 호프만 엔코더(18)와 멀티플렉서(20)와의 조합에 따른 동작은 호프만 엔코더(24)와 멀티플렉서(20)의 동작과 동일하다.
멀티플렉서(20)의 출력 신호 및 "호프만 비트"는 멀티플렉서(22)의 대응하는 입력에 인가된다. 멀티플렉서(22)는 음성-비음성 검출기(28)의 결정에 따라서 엔코드된 음성 신호 또는 엔코드된 비음성 신호를 선택하도록 배열된다. 멀티플렉서(22)의 출력에서 엔코드된 음향 신호가 유효할 수 있다.
도 3에 따른 음성 엔코더(6)에 있어서, 본 발명에 따른 분석 수단은 LPC 파라메터 컴퓨터(30), 규정된 피치 컴퓨터(32) 및 피치 설정기(38)에 의해 구성된다. 음성 신호(s[n])는 LPC 파라메터 컴퓨터(30)의 입력에 인가된다. LPC 파라메터 컴퓨터(30)는 i 가 0-15의 값을 가지는 예상 계수(a[i]), 양자화, 코딩 및 디코딩 (a[i])후에 얻어진 양자화(quantized) 예상 계수(aq[i]), 및 LPC 코드(C[i])를 결정한다.
본 발명의 개념에 따른 피치 결정 수단은 여기에서 피치 설정기(38), 및 피치 동조 수단이고, 피치 범위 컴퓨터(34) 및 규정된 피치 컴퓨터(32)인 초기 피치 결정 수단을 포함한다. 피치 설정기(38)는 최종 피치값을 결정하기 위한 규정된 피치 컴퓨터(32)라고도 칭해지는 피치 동조 수단에서 시도될 수 있는 피치값을 결정하기 위한 피치 범위 컴퓨터(34)에 이용되는 거친 피치값을 결정한다. 피치 설정기(38)는 다수의 샘플로 표현된 거친 피치 기간을 제공한다. 규정된 피치 컴퓨터(32)에 이용될 피치값은 피치 범위 컴퓨터(34)에 의해 아래 테이블에 따른 거친 피치 기간으로부터 결정된다.
진폭 스펙트럼 컴퓨터(36)에 있어서, 윈도우(windowed) 음향 신호 (SHAM)는 다음 식에 따라서 신호(s[i])로부터 결정된다.
(1)
식(1)에서, WHAM[i]는 다음과 같다.
(2)
원도우 음향 신호 (SHAM[i])는 512 포인트 FFT를 이용하는 주파수 영역으로 변형된다.
(3)
규정된 피치 컴퓨터(32)에 이용될 진폭 스펙트럼은 다음 식에 따라서 계산된다.
(4)
규정된 피치 컴퓨터(32)는 식(4)에 따른 진폭 스펙트럼과 진폭이 상기 규정된 피치 기간만큼 LPC 스펙트럼을 샘플링함으로써 결정되는 다수의 고조파에 관련된 사인 신호를 포함하는 신호의 진폭 스펙트럼 사이의 최소 에러 신호를 발생시키는 규정된 피치값을 컴퓨터(30)에 의해 제공된 a-파라메터 및 LPC 파라메터 거친 피치값으로부터 결정한다.
이득 컴퓨터(40)에 있어서, 타겟 스펙트럼을 정확하게 정합시키기 위한 최적 이득은 규정된 피치 컴퓨터(12)에서 행해지는 비양자화 a-파라메터를 이용하는 대신에 양자화 a-파라메터를 이용하여 재합성 음향 신호의 스펙트럼에서 계산된다.
음성 엔코더(40)의 출력에서, 16개 LPC 코드, 규정된 피치 및 이득 컴퓨터(40)에 의해 계산된 이득이 유효화될 수 있다. LPC 파라메터 컴퓨터(30) 및 규정된 피치 컴퓨터(32)의 동작은 보다 상세하게 후술되어 있다.
도 4에 따른 LPC 컴퓨터(30)에 있어서, 윈도우 동작은 원도우 프로세서(50)에 의해 신호 (s[n])에 대해 수행된다. 본 발명의 한가지 특징에 따르면, 분석 길이는 음성/비음성 플래그의 값에 따라서 다르다. 5.2 kbit/sec 모드에 있어서, LPC 계산은 10 msec 마다 수행된다. 3.2 kbit/sec 모드에 있어서, LPC 계산은 음성에 비음성 등까지의 천이중의 것은 제외하고 20 msec 마다 수행된다. 이러한 천이가 제공되는 경우, LPC 계산이 10 msec 마다 수행된다.
다음 테이블에 있어서, 예상 계수의 결정에 포함된 샘플의 수는 다음과 같이 제공된다.
천이가 제공되는 5.2 kbit/sec의 경우 및 3.2 kbit/sec 경우의 윈도우에 대해서는 다음과 같이 쓸 수 있다.
(5)
윈도우 속도 신호에 대해 다음 식이 발견된다.
(6)
3.2 kbit/s의 경우에 천이가 전혀 제공되지 않는 경우, 80개 샘플의 평탄한 상부 부분이 윈도우의 중간에 도입되므로, 샘플(120)에서 시작하여 샘플(360) 전에 종료되는 240개 샘플을 확대시키기 위해 윈도우를 확장시킨다. 이러한 방식에 있어서, 윈도우(w'HAM)는 다음 식에 따라서 얻어진다.
(7)
윈도우 음향 신호에 대해 다음 식을 다시 쓸 수 있다.
(8)
자동 상관 함수(Autocorrelation Function) 컴퓨터(58)는 윈도우 음향 신호의 자동 상관 함수(Rss)를 결정한다. 계산될 상관 계수의 번호는 예상 계수(+1)의 번호와 동일하다. 음성 프레임이 제공되는 경우, 계산될 자동 상관 계수의 번호가 17이다. 비음성 프레임이 제공되는 경우, 계산될 자동 상관 계수 번호의 7이다. 음성 또는 비음성 프레임의 존재는 음성/비음성 플래그에 의해 자동 상관 함수 컴퓨터(58)에 신호를 발생한다.
자동 상관 계수는 상기 자동 상관 계수에 의해 묘사된 스펙트럼의 소정의 스펙트럼 평활화(spectral smoothing)를 얻기 위해서 소위 래그 윈도우(lag-window)로 윈도우된다. 평활 자동 상관 계수(ρ[i])는 다음 식에 따라서 계산된다.
(9)
식(9)에서, fμ는 46.4 ㎐의 값을 가지고 있는 스펙트럼 평활 상수이다. 윈도우 자동 상관치(ρ[i])는 재귀적(recursive) 방식으로 반사 계수(k[1] 내지 k[P])를 계산하는 숴(Schur) 재귀 모듈(62)로 통과한다.
변환기(66)에 있어서, P 반사 계수(ρ[i])는 도 3에 규정된 피치 컴퓨터에 이용하기 위한 a-파라메터로 변형된다. 양자화(64)에 있어서, 반사 계수는 로그 영역비(Log Area Ratio)로 변환되고, 로그 영역비는 후속적으로 균일하게 양자화된다. 최종 LPC 코드(C[I]....C[P])는 또 다른 송신을 위해 LPC 파라메터 컴퓨터의 출력으로 통과한다.
국부 디코더(54)에 있어서, LPC 코드(C[I]....C[P])는 반사 계수 재구성기(54)에 의해 재구성된 반사 계수(k[i])로 변환된다. 후속적으로, 재구성된 반사 계수(k(i))는 파라메터 변환기(56)에 대한 반사 계수에 의해(양자화) a-파라메터로 변환된다.
이러한 국부 디코딩은 음향 엔코더(4) 및 음향 디코더(14)에서 유효한 동일 a -파라메터를 갖도록 수행된다.
도 5에 따른 규정된 피치 컴퓨터(32)에 있어서, 피치 주파수 후보자 선택기(70)는 후보 번호에서 피치 범위 컴퓨터(34)로부터 규정된 피치 컴퓨터(32)에 이용될 후보 피치값을 수신하는 개시치 및 스텝 크기를 결정한다. 각각의 후보의 경우에, 피치 주파수 후보 선택기(70)는 기본 주파수(f0,i)를 결정한다.
후보 주파수(f0,i)를 이용하여 LPC 계수에 의해 표현된 스펙트럼 엔벨로프는 스펙트럼 엔벨로프 샘플러(Sampler : 72)에 의해 고조파 위치에서 표본화된다. ith중 kth번째 고조파의 진폭인 mi,k에 있어서, 후보(f0,i)는 다시 쓸 수 있다.
(10)
식(10)에서, A(z)는 다음 식과 같다.
(11)
z=ejθi,k= cosθi,k+ j·sinθi,k및 θi,k= 2πkfO,i에 있어서, 식(11)은 다음 식과 같이 변경된다.
(12)
식(12)을 실제 및 가상 부분으로 분리하여, 진폭(mj,k)은 다음 식에 따라서 얻어질 수 있다.
(13)
여기에서,
14)
(15)
후보 스펙트럼은 엔코더의 현재 동작 모드에 따라서 변하는 식(5) 또는 식(7)에 따라서 160 포인트 허밍 윈도우의 8192 포인트 FFT인 스펙트럼 윈도우 함수[W]로 스펙트럼 라인 mi,k(1≤k≤L)을 컨볼빙(convolving)함으로써 결정된다. 8192 포인트 FET는 먼저 계산되고, 결과는 ROM 내에 저장될 수 있다. 컨볼빙 처리에 있어서, 다운샘플링 동작은 후보 스펙트럼이 쓸모없는 256 포인트 이상의 계산을 행하는 기준 스펙트럼의 256 포인트와 비교될 수 있다. 따라서,의 경우에 대해서 다음과 식과 같이 다시 쓸 수 있다.
(16)
식(16)은 피치 후보(i)에 대한 진폭 스펙트럼의 일반적인 형태만을 제공하지만, 이것의 진폭은 제공하지 않는다. 따라서, 스펙트럼은 다음 식에 따라서 MSE-이득 계산기(78)에 의해 계산되는 이득 인자(gi)에 의해 정정될 수 있다.
(17)
승산기(82)는 이득 인자(gi)를 가지는 스펙트럼_을 척도하기 위해 배열된다. 감산기(84)는 진폭 스펙트럼 컴퓨터(36)에 의해 결정되는 타겟 스펙트럼의 계수와 승산기(82)의 출력 신호 사이의 차를 계산한다. 후속적으로, 합산 스쿼터는 다음 식에 따라서 제곱 에러(square error) 신호(Ei)를 계산한다.
(18)
최대치를 발생시키는 후보 기본 주파수(fo,i)는 규정된 기본 주파수 또는 규정된 피치로서 +택된다. 본 발명의 예에 따른 엔코더에 있어서, 총 368 피치 주기는 엔코딩하는데 9 비트를 필요로 할 수 있다. 피치는 음향 엔코더의 모드에 따라서 변하는 10 msec 마다 갱신된다. 도 3에 따른 이득 계산기(40)에 있어서, 디코더에 송신될 이득은 이득(gi)에 관련하여 상술한 것과 동일한 방식으로 계산되지만, 양자화된 파라메터는 이득(gi)을 계산시에 이용되는 비양자화된 a-파라메터 대신에 이용된다. 디코더에 송신될 이득 인자는 6 비트로 비선형 양자화되므로, gi의 작은 값에 대한 작은 양자화 단계가 이용되고, gi의 큰 값에 대한 큰 양자화 단계가 이용된다.
도 6에 따른 비음성 엔코더(14)에 있어서, LPC 파라메터 컴퓨터(82)의 동작은 도 4에 따른 LPC 파라메터 컴퓨터(30)의 동작과 유사하다. LPC 파라메터 컴퓨터(82)는 LPC 파라메터 컴퓨터(30)에 의해 행해지는 원래 음향 신호 대신에 고역 통과 필터된 신호로 동작한다. 더욱이, LPC 컴퓨터(82)의 예상 순서는 LPC 파라메터 피치 컴퓨터(30)에 이용되는 16 대신에 6이다.
시간 영역 원도우 프로세서(84)는 다음 식에 따른 허닝 원도우(Hanning Windowed) 음향 신호를 계산한다.
(19)
RMS 값 컴퓨터(86)에 있어서, 음향 프레임의 진폭에 관한 평균치(guv)는 다음 식에 따라서 계산된다.
(20)
디코더로 송신될 이득 인자(guv)는 5 비트로 비선형 양자화되므로, guv의 작은 값에 대해 양자화 단계가 이용되고, guv의 큰 값에 대해 양자화 단계가 이용된다. 여진 파라메터는 비음성 엔코더(14)에 의해 전혀 결정되지 않는다.
도 7에 따른 음향 디코더(14)에 있어서, 호프만 엔코드된 LPC 코드 및 음성/비음성 플래그는 호프만 디코더(90)에 인가된다. 호프만 디코더(90)는 음성/비음성 플래그가 비음성 신호를 나타내는 경우 호프만 엔코더(18)에 의해 이용된 호프만 테이블에 따라서 호프만 엔코드된 LPC 코드를 디코딩하기 위해 배열된다. 호프만 디코더(90)는 음성/비음성 플래그가 음성 신호를 나타내는 경우 호프만 엔코더(24)에 의해 이용된 호프만 테이블에 따라서 호프만 엔코드된 LPC 코드를 디코딩시키기 위해 배열된다. 호프만 비트값에 따라서 수신된 LPC 코드는 호프만 디코더(90)에 의해 디코드되거나 디멀티플렉서(92)를 직접 통과한다. 이득값 및 수신된 규정 피치값도 디멀티플렉서(92)로 통과한다.
음성/비음성 플래그가 음성 프레임을 나타내는 경우, 규정 피치, 이득 및 16개 LPC 코드는 고조파 음향 합성기(94)로 통과한다. 음향/비음향 플래그가 비음향 프레임을 나타내는 경우, 이득 및 6개 LPC 코드는 비음향 합성기(96)로 통과한다. 고조파 음향 합성기(94)의 출력에서 합성된 음성 신호및 비음성 합성기(96)의 출력에서 합성된 비음성 신호는 멀티플렉서(98)의 대응 입력에 인가된다.
음성 모드에 있어서, 멀티플렉서(98)는 고조파 음향 합성기(94)의 출력 신호를 중첩 및 가산 합성 블록(100)의 입력으로 통과시킨다. 비음성 모드에 있어서, 멀티플렉서(98)는 비음성 합성기(96)의 출력 신호_를 중첩 및 가산 합성 블록(100)의 입력으로 통과한다. 중첩 및 가산 합성 블록(100)에 있어서, 부분적으로 중첩된 음성 및 비음성 세그먼트가 가산된다. 중첩 및 가산 합성 블록(100)의 출력 신호에 대해서는 다음과 같이 다시 쓸 수 있다.
(21)
식(21)에 있어서, Ns는 음향 프레임의 길이이고, vk-1은 이전 음향 프레임의 음성/비음성 플래그이며, vk는 현재 음향 프레임의 음향/비음향 플래그이다.
중첩 및 블록의 출력 신호는 포스트필터(postfilter:102)에 인가된다. 포스트필터는 포먼트(formant) 영역 외부의 잡음을 억제함으로써 감지된 음향질을 향상시키기 위해 배열된다.
도 8에 따른 음성 디코더(94)에 있어서, 디멀티플렉서(92)로부터 수신된 엔코드된 피치는 피치 디코더(104)에 의해 피치 주기로 디코드 및 변환된다. 피치 디코더(104)에 의해 결정된 피치 주기는 위상 합성기의 입력, 고조파 오실레이터 뱅크(108)의 입력 및 LPC 스펙트럼 엔벨로프 샘플러(110)의 제 1 입력에 인가된다.
LPC 디코더는 디멀티플렉서(92)로부터 수신된 LPC 계수는 LPC 디코더(112)에 의해 디코드된다. LPC 계수를 디코딩하는 방식은 현재 음향 프레임이 음성 또는 비음향을 포함하는지의 여부에 따라 변한다. 그러므로, 음성/비음성 플래그는 LPC 디코더(112)의 제 2 입력에 인가된다. LPC 디코더는 양자화된 a-파라메터를 LPC 스펙트럼 엔벨로프 샘플러(110)의 제 2 입력으로 통과시킨다. LPC 스펙트럼 엔벨로프 샘플러(112)의 동작은 동일한 동작이 규정된 피치 컴퓨터(32)에서 수행되기 때문에 식(13), (14) 및 (15)에 의해 묘사된다.
위상 합성기(106)는 음향 신호를 나타내는 L 신호의 ith 번째 사인 신호의 위상(ψk[i])을 계산하기 위해 계산된다. 위상(ψk[i])은 ith번째 사인 신호가 하나의 프레임으로부터 다음 프레임으로의 연속성을 유지하도록 선택된다. 음향 신호는 160개 윈도우 샘플을 각각 포함하는 중첩 프레임을 조합함으로써 합성된다. 도 9에서 그래프(118) 및 그래프(122)에서 알 수 있는 바와 같이 2개의 인접한 프레임들 사이에는 50% 중첩된다. 그래프(118 및 122)에 있어서, 이용된 윈도우는 점선으로 도시되어 있다. 이 때, 위상 합성기는 중첩이 이것의 최대 충돌을 가지고 있는 위치에 연속 위상을 제공하도록 배열된다. 현재 프레임의 위상(φk[i])에 대해 지금부터 다시 쓰면 다음 식과 같다.
(22)
현재 기술된 음향 엔코더에 있어서, Ns의 값은 160과 같다. 제 1 음성 프레임에 대한 φk[i]의 값은 선정된 값으로 초기화된다. 위상(φk[i])는 비음성 프레임이 수신되는 경우일지라도 항상 갱신된다. 상기의 경우에,
f0,k는 50 Hz로 세트된다.
고조파 오실레이터 뱅크(108)는 음향 신호를 나타내는 다수의 고조파에 관련된 신호를 발생시킨다. 이러한 계산은 다음 식에 따라서 고조파 진폭, 주파수및 합성된 위상을 이용하여 수행된다.
(23)
신호는 시간 영역 윈도우잉 블록(114)내의 허닝 윈도우를 이용하여 윈도우된다. 이러한 윈도우 신호는 도 9의 그래프(120)로 도시되어 있다. 신호는 적시에 쉬프트된 Ns/2 샘플인 허닝 윈도우를 이용하여 윈도우된다. 이러한 윈도우 신호는 도 9의 그래프(124)에 도시되어 있다. 시간 영역 윈도우잉 블록(144)의 출력 신호는 상술한 윈도우 신호를 가산함으로써 얻어진다. 이러한 출력 신호는 도 9의 그래프(126)로 도시되어 있다. 이득 디코더(118)는 이것의 입력 신호로부터 이득값(gv)을 유도하고, 시간 영역 윈도우잉 블록(114)의 출력 신호는 재구성된 음성 신호를 얻기 위해서 신호 척도 블록(116)에 의해 상기 이득 인자(gv)에 의해 척도된다.
비음성 합성기(96)에 있어서, LPC 코드 및 음성 및 비음성 플래그는 LPC 디코더(130)에 인가된다. LPC 디코더(130)는 다수의 6개 a-파라메터를 LPC 합성 필터(134)에 제공한다. 가우스 백색 잡음 발생기(132)의 출력은 LPC 합성 필터(143)의 입력에 접속된다. LPC 합성 필터(134)의 출력 신호는 시간 영역 윈도우잉 블록(140)내의 허닝 윈도우에 의해 윈도우된다.
비음성 이득 디코더(136)는 제공된 비음성 프레임의 요구된 에너지를 나타내는 이득값을 유도하고, 윈도우 신호의 이러한 이득 및 에너지에 대해, 윈도우 음향 신호 이득에 대한 척도 인자는 정확한 에너지를 가지는 음향 신호를 얻기 위해 결정된다. 이러한 척도 인자에 대해 다시 쓰면 다음 식과 같다.
(24)
신호 척도 블록(142)은 척도 인자EE에 의해 시간 영역 윈도우 블록(140)의 출력 신호를 승산함으로써 출력 신호FF를 결정한다.
기술된 음향 엔코딩 시스템은 최저 비트 속도 또는 최고 음향질을 필요로 하는 것으로 변형될 수 있다. 최저 비트 속도를 필요로 하는 음향 엔코딩 시스템의 예는 2 kbit/sec 엔코딩 시스템이다. 이러한 시스템은 16에서 12까지의 음향에 이용된 예상 계수의 번호를 감소시키고, 예상 계수, 이득 및 정련된(refined) 피치의 차동 엔코딩을 이용함으로써 얻어질 수 있다. 엔코드될 데이터가 개별적으로 엔코드되지 않지만, 후속 프레임으로부터 대응하는 데이터 사이의 차가 송신되는 차동 코딩 수단이 제공된다. 제 1의 새로운 프레임에서의 음향에서 비음향까지의 천이에서, 모든 계수는 디코딩의 경우에 개시치를 제공하기 위해서 개별적으로 엔코드된다.
6 kbit/s의 비트 속도에서 증가된 음향질을 가지는 음향 코더를 얻는 것이 가능하기도 하다. 변형은 여기에서 다수의 고조파에 관련된 사인 신호의 제 1의 8개 고조파의 위상에 관한 결정이다. 위상(φ[i])은 다음 식에 따라서 계산된다.
(25)
여기에서, θi = 2πf0·i. R(θi)en I(θi)는 다음 식과 같다.
(26)
(27)
얻어진 8개 위상(φ[i])은 6비트로 균일하게 양자화되고, 출력 비트 스트림 내에 포함된다.
6 kbit/sec 엔코더의 또 다른 변형은 비음향 모드의 부수적인 이득치의 송신이다. 정상적으로 2 msec 마다 이득은 프레임당 하나 대신에 송신된다. 천이직후의 제 1 프레임에 있어서, 10 이득치는 송신되는데 이들 중에서 5는 현재의 비음향 프레임을 나타내고, 이들 중 5 이전 비음성 엔코더에 의해 제공되는 음성 프레임을 나타낸다. 이득은 4 msec 중첩 윈도우로부터 결정된다.
LPC 계수 번호는 12이고, 가능한 차동 엔코딩이 이용된다는 것을 알 수 있다.

Claims (14)

  1. 계수를 음향 신호에서 주기적으로 결정하기 위한 분석 수단을 포함하는 음향 엔코더를 가지는 송신기를 포함하고, 송신기가 상기 분석 계수를 송신 매체를 경유하여 수신기로 송신하기 위한 송신 수단을 포함하고, 상기 수신기가 분석 계수에 기초하여 재구성된 음향 신호를 유도하기 위한 재구성 수단을 가지는 음향 디코더를 포함하는 송신 시스템에 있어서,
    상기 분석 수단은 음성 세그먼트와 비음성 세그먼트 등의 사이에서의 천이에 근접하여 보다 자주 일어나는 분석 계수를 결정하기 위해 배열되고, 상기 재구성 수단은 보다 자주 결정된 분석 계수에 기초하여 재구성된 음향 신호를 유도하기 위해 배열되는 것을 특징으로 하는 송신 시스템.
  2. 제 1 항에 있어서,
    음향 엔코더가 음성 세그먼트를 엔코딩시키기 위한 음성 엔코더를 포함하고, 음향 엔코더가 비음성 세그멘트를 엔코딩시키기 위한 비음성 엔코더를 포함하는 것을 특징으로 하는 송신 시스템.
  3. 제 1 항 또는 제 2 항에 있어서,
    분석 수단이 천이에 후속하는 2개의 세그먼트에 대해 보다 자주 결정되는 분석 계수를 결정하기 위해 배열되는 것을 특징으로 하는 송신 시스템.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    분석 수단이 음성과 비음성 세그먼트 등의 사이의 천이에서의 분석 계수의 결정에 관한 주파수를 배가시키기 위해 배열되는 것을 특징으로 하는 송신 시스템.
  5. 제 4 항에 있어서,
    분석 수단은 천이가 전혀 발생되지 않을 경우 분석 계수를 20 msec 마다 결정하기 위해 배열되고, 분석 수단은 천이가 발생되는 경우 분석 계수를 10 msec를 결정하기 위해 배열되는 것을 특징으로 하는 송신 시스템.
  6. 분석 계수를 음향 신호로부터 주기적으로 결정하기 위한 분석 수단을 포함하는 음향 엔코더를 가지고 있고, 상기 분석 계수를 송신하기 위한 송신 수단을 포함하는 송신기에 있어서,
    분석 수단이 음성 세그먼트와 비음성 세그먼트 등의 사이에서의 천이 근처에서 보다 자주 발생하는 분석 계수를 결정하기 위해 배열되는 것을 특징으로 하는 송신기.
  7. 다수의 분석 계수를 포함하는 엔코드된 음향 신호를 수신하고, 수신된 신호에서 추출된 분석 계수에 기초하여 재구성된 음향 신호를 유도하기 위한 재구성 수단을 포함하는 음향 디코더를 포함하는 수신에 있어서,
    엔코드된 음향 신호가 음성 신호와 비음성 신호 등의 사이에서의 천이 근처에서 보다 자주 일어나는 분석 계수를 반송하고, 재구성 수단이 보다 자주 일어나는 유효 분석 계수에 기초하여 재구성된 음향 신호를 유도하기 위해 배열되는 것을 특징으로 하는 수신기.
  8. 분석 계수를 음향 신호에서 주기적으로 결정하기 위한 분석 수단을 포함하는 음향 엔코딩 장치에 있어서,
    분석 수단이 음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 결정하기 위해 배열되는 것을 특징으로 하는 음향 엔코딩 장치.
  9. 다수의 분석 계수를 포함하는 엔코드된 음향 신호를 디코딩시키고, 수신된 신호로부터 추출된 분석 계수에 기초하여 재구성된 음향 신호를 유도하기 위한 재구성 수단을 포함하는 음향 디코딩 장치에 있어서,
    엔코딩 음향 신호가 음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 반송하고, 재구성 수단이 보다 자주 일어나는 분석 계수에 기초하여 재구성된 음향 신호를 유도하기 위해 배열되는 것을 특징으로 하는 음향 디코딩 장치.
  10. 분석 계수를 음향 신호로부터 주기적으로 결정하는 것을 포함하는 음향 엔코딩 방법에 있어서,
    음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 결정하는 것을 포함하는 것을 특징으로 하는 음향 엔코딩 방법
  11. 다수의 분석 계수를 포함하는 엔코드된 음향 신호를 디코딩시키고, 수신된 신호로부터의 분석 계수에 기초하여 재구성된 음향 신호를 유도하는 것을 포함하는 음향 디코딩 방법에 있어서,
    엔코드된 음향 신호가 음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 반송하고, 재구성된 음향 신호의 유도가 보다 자주 일어나는 유효한 분석 계수에 기초하여 수행되는 것을 특징으로 하는 음향 디코딩 방법.
  12. 엔코드된 음향 신호에서 주기적으로 도입되는 다수의 분석 계수를 포함하는 엔코드된 음향 신호에 있어서,
    엔코드된 음향 신호가 음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 반송하는 것을 특징으로 하는 엔코드된 음향 신호.
  13. 분석 계수를 음향 신호로부터 주기적으로 결정하는 것을 포함하는 음향 엔코딩 방법을 실행하기 위한 컴퓨터 프로그램을 포함하는 유형 매체에 있어서,
    음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 결정하는 것을 포함하는 것을 특징으로 하는 유형 매체.
  14. 다수의 분석 계수를 포함하는 엔코드된 음향 신호를 디코딩시키기 위한 음향 디코딩 방법을 실행하기 위한 컴퓨터 프로그램을 포함하고, 수신된 신호로부터 추출된 분석 계수에 기초하여 재구성된 음향 신호를 유도하는 것을 포함하는 유형 방법에 있어서,
    엔코드된 음향 신호가 음성 세그먼트와 비음성 세그먼트 등의 사이의 천이 근처에서 보다 자주 일어나는 분석 계수를 반송하고, 재구성된 음향 신호의 유도가 보다 자주 일어나는 유효한 분석 계수에 기초하여 수행되는 것을 특징으로 하는 유형 방법.
KR1019997002061A 1997-07-11 1998-06-11 개선된 스피치 인코더 및 디코더를 갖는 송신기 KR100568889B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP97202166.1 1997-07-11
EP97202166 1997-07-11

Publications (2)

Publication Number Publication Date
KR20010029498A true KR20010029498A (ko) 2001-04-06
KR100568889B1 KR100568889B1 (ko) 2006-04-10

Family

ID=8228544

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019997002061A KR100568889B1 (ko) 1997-07-11 1998-06-11 개선된 스피치 인코더 및 디코더를 갖는 송신기

Country Status (7)

Country Link
US (1) US6128591A (ko)
EP (1) EP0925580B1 (ko)
JP (1) JP2001500285A (ko)
KR (1) KR100568889B1 (ko)
CN (1) CN1145925C (ko)
DE (1) DE69819460T2 (ko)
WO (1) WO1999003097A2 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2040253B1 (en) 2000-04-24 2012-04-11 Qualcomm Incorporated Predictive dequantization of voiced speech
CN1272911C (zh) * 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6958196B2 (en) * 2003-02-21 2005-10-25 Trustees Of The University Of Pennsylvania Porous electrode, solid oxide fuel cell, and method of producing the same
US20110057818A1 (en) * 2006-01-18 2011-03-10 Lg Electronics, Inc. Apparatus and Method for Encoding and Decoding Signal
CN101371295B (zh) * 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
US8364492B2 (en) * 2006-07-13 2013-01-29 Nec Corporation Apparatus, method and program for giving warning in connection with inputting of unvoiced speech
EP2458588A3 (en) 2006-10-10 2012-07-04 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
CN101261836B (zh) * 2008-04-25 2011-03-30 清华大学 基于过渡帧判决及处理的激励信号自然度提高方法
US9269366B2 (en) * 2009-08-03 2016-02-23 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
WO2012063185A1 (en) * 2010-11-10 2012-05-18 Koninklijke Philips Electronics N.V. Method and device for estimating a pattern in a signal
GB2524682B (en) * 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
US9542358B1 (en) * 2013-08-16 2017-01-10 Keysight Technologies, Inc. Overlapped fast fourier transform based measurements using flat-in-time windowing
CN108461088B (zh) * 2018-03-21 2019-11-19 山东省计算中心(国家超级计算济南中心) 基于支持向量机在语音解码端重构子带清浊音度参数的方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
JP2707564B2 (ja) * 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
IT1229725B (it) * 1989-05-15 1991-09-07 Face Standard Ind Metodo e disposizione strutturale per la differenziazione tra elementi sonori e sordi del parlato
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
CN1099663C (zh) * 1994-03-11 2003-01-22 皇家菲利浦电子有限公司 准周期信号的传输系统
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP2861889B2 (ja) * 1995-10-18 1999-02-24 日本電気株式会社 音声パケット伝送システム
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
US5696873A (en) * 1996-03-18 1997-12-09 Advanced Micro Devices, Inc. Vocoder system and method for performing pitch estimation using an adaptive correlation sample window
US5774836A (en) * 1996-04-01 1998-06-30 Advanced Micro Devices, Inc. System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator

Also Published As

Publication number Publication date
EP0925580A2 (en) 1999-06-30
WO1999003097A2 (en) 1999-01-21
JP2001500285A (ja) 2001-01-09
KR100568889B1 (ko) 2006-04-10
WO1999003097A3 (en) 1999-04-01
CN1234898A (zh) 1999-11-10
DE69819460D1 (de) 2003-12-11
DE69819460T2 (de) 2004-08-26
EP0925580B1 (en) 2003-11-05
US6128591A (en) 2000-10-03
CN1145925C (zh) 2004-04-14

Similar Documents

Publication Publication Date Title
US6813602B2 (en) Methods and systems for searching a low complexity random codebook structure
US6330533B2 (en) Speech encoder adaptively applying pitch preprocessing with warping of target signal
JP5412463B2 (ja) 音声信号内の雑音様信号の存在に基づく音声パラメータの平滑化
CA2031006C (en) Near-toll quality 4.8 kbps speech codec
US6260010B1 (en) Speech encoder using gain normalization that combines open and closed loop gains
US6449590B1 (en) Speech encoder using warping in long term preprocessing
EP1982329B1 (en) Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus
EP0770987A2 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
AU746342B2 (en) Method and apparatus for pitch estimation using perception based analysis by synthesis
KR100496670B1 (ko) 음성 분석 방법 및 음성 부호화 방법 및 장치
US20040243402A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH09127996A (ja) 音声復号化方法及び装置
US6047253A (en) Method and apparatus for encoding/decoding voiced speech based on pitch intensity of input speech signal
KR20010029498A (ko) 개선된 음향 엔코더 및 디코더를 갖는 송신기
Kleijn et al. A 5.85 kbits CELP algorithm for cellular applications
KR20010029497A (ko) 개선된 고조파 음향 엔코더를 갖는 송신기
CN117940994A (zh) 基于长期预测和/或谐波后置滤波生成预测频谱的处理器
Xydeas et al. Split matrix quantization of LPC parameters
McAulay et al. Sine-wave phase coding at low data rates
Strecha et al. Line cepstral quefrencies and their use for acoustic inventory coding
JP2001166800A (ja) 音声符号化方法及び音声復号化方法
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
EP1164577A2 (en) Method and apparatus for reproducing speech signals
KR960036345A (ko) 저지연 가변 전송률 다중여기 음성 부호화장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee