KR100615113B1 - 주기적 음성 코딩 - Google Patents
주기적 음성 코딩 Download PDFInfo
- Publication number
- KR100615113B1 KR100615113B1 KR1020017007887A KR20017007887A KR100615113B1 KR 100615113 B1 KR100615113 B1 KR 100615113B1 KR 1020017007887 A KR1020017007887 A KR 1020017007887A KR 20017007887 A KR20017007887 A KR 20017007887A KR 100615113 B1 KR100615113 B1 KR 100615113B1
- Authority
- KR
- South Korea
- Prior art keywords
- standard
- reproduced
- previous
- signal
- parameters
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/097—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Abstract
Description
Ⅴ. 활성 음성 프레임들의 분류
바람직한 실시예에 따르면, 상기 코드북 파라미터들은 효율적 전송을 위해 양자화된다. 상기 전송 코드(CBIj)(j=단계 번호 - 0,1 또는 2)는 바람직하게는 I* 으로 설정되고, 전송 코드들(CBGj 및 SIGNj)은 이득(G*)을 양자화함으로써 설정된다;
Claims (27)
- 전송 소스로부터 수신기로 전송되는 준-주기적 음성 신호를 코딩 및 디코딩하는 방법으로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 방법은,상기 잔류 신호의 현재 프레임으로부터 현재 표준(prototype)을 추출하는 단계;이전 표준을 수정하여 상기 수정된 이전 표준이 상기 현재 표준으로 근사화되도록 하는 방법을 기술하는 제1 파라미터들 셋을 계산하는 단계;합산되었을 때 상기 현재 표준 및 상기 수정된 이전 표준 사이의 오차로 근사화되고, 제2 파라미터들 셋에 의해 기술되는 하나 또는 그 이상의 코드벡터들을 제1 코드북으로부터 선택하는 단계;상기 제 1 파라미터들 셋 및 상기 제 2 파라미터들 셋을 상기 수신기에 전송하는 단계;상기 수신기에서 상기 제1 파라미터들 셋, 상기 제2 파라미터들 셋, 및 재현된 이전 표준에 기초하여 재현된 현재 표준을 형성하는 단계;상기 재현된 현재 표준 및 상기 재현된 이전 표준 사이의 영역에 상기 잔류 신호를 내삽하여 내삽된 잔류 신호를 형성하는 단계; 및상기 내삽된 잔류 신호에 기초하여 출력 음성 신호를 합성하는 단계를 포함하는 준-주기적 음성 신호 코딩 및 디코딩 방법.
- 제1항에 있어서,상기 현재 프레임은 피치 래그(pitch lag)를 가지고, 상기 현재 표준의 길이는 상기 피치 래그의 길이와 동일한 것을 특징으로 하는 준-주기적 음성 신호 코딩 및 디코딩 방법.
- 제1항에 있어서,상기 현재 표준을 추출하는 단계는 "컷-프리 영역"에 종속되는 것을 특징으로 하는 준-주기적 음성 신호 코딩 및 디코딩 방법.
- 제3항에 있어서,상기 현재 표준은 상기 컷-프리 영역에 종속되어 상기 현재 프레임의 끝단으로부터 추출되는 것을 특징으로 하는 준-주기적 음성 신호 코딩 및 디코딩 방법.
- 준-주기적 음성 신호를 코딩하는 방법으로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 코딩 방법은,상기 잔류 신호의 현재 프레임으로부터 현재 표준(prototype)을 추출하는 단계;이전 표준을 수정하여 상기 수정된 이전 표준이 상기 현재 표준으로 근사화되도록 하는 방법을 기술하는 제1 파라미터들 셋을 계산하는 단계;합산되었을 때 상기 현재 표준 및 상기 수정된 이전 표준 사이의 오차로 근사화되고, 제2 파라미터들 셋에 의해 기술되는 하나 또는 그 이상의 코드벡터들을 제1 코드북으로부터 선택하는 단계;상기 제1 및 제2 파라미터들 셋에 기초하여 현재 표준을 재현하는 단계;상기 재현된 현재 표준 및 재현된 이전 표준 사이의 영역에 상기 잔류 신호를 내삽하여 내삽된 잔류 신호를 형성하는 단계; 및상기 내삽된 잔류 신호에 기초하여 출력 음성 신호를 합성하는 단계를 포함하며, 상기 제1 파라미터들 셋을 계산하는 단계는,(i) 상기 현재 표준을 순환적으로 필터링하여, 타겟 신호를 형성하는 단계;(ii) 상기 이전 표준을 추출하는 단계;(iii) 상기 이전 표준의 길이가 상기 현재 표준의 길이와 동일하게 되도록 상기 이전 표준을 워핑(warping)하는 단계;(iv) 상기 워핑된 이전 표준을 순환적으로 필터링하는 단계; 및(v) 최적 회전 및 제1 최적 이득을 계산하는 단계를 포함하며, 상기 최적 회전에 의해 회전되고 상기 제1 최적 이득에 의해 스케일링된 상기 필터링 및 워핑된 이전 표준이 상기 타겟 신호에 최적으로 근사화되는 준-주기적 음성 신호 코딩 방법.
- 제5항에 있어서,상기 최적 회전 및 제1 최적 이득을 계산하는 단계는 피치 회전 검색 범위에 종속되어 수행되는 것을 특징으로 하는 준-주기적 음성 신호 코딩 방법.
- 제5항에 있어서,상기 최적 회전 및 제1 최적 이득을 계산하는 단계는 상기 필터링 및 워핑된 이전 표준 및 상기 타겟 신호 사이의 평균 제곱 오차를 최소화하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 방법.
- 제5항에 있어서,상기 제1 코드북은 하나 또는 그 이상의 스테이지들을 포함하고, 상기 하나 또는 그 이상의 코드벡터들을 선택하는 단계는,(i) 상기 최적 회전에 의해 회전되고 상기 제1 최적 이득에 의해 스케일링된 상기 필터링 및 워핑된 이전 표준을 감산함으로써 상기 타겟 신호를 업데이트하는 단계;(ii) 상기 제1 코드북을 그 각각이 코드 벡터를 형성하는 복수의 영역들로 분할하는 단계;(iii) 상기 코드벡터들 각각을 순환적으로 필터링하는 단계;(iv) 상기 필터링된 코드벡터들 중 상기 업데이트된 타겟 신호에 가장 근접하며 최적 인덱스에 의해 기술되는 코드벡터를 선택하는 단계;(v) 상기 업데이트된 타겟 신호 및 상기 선택된 필터링된 코드벡터 사이의 상관(correlation)에 기초하여 제2 최적 이득을 계산하는 단계;(vi) 상기 제2 최적 이득에 의해 스케일링된 상기 선택 및 필터링된 코드벡터를 감산함으로써 상기 타겟 신호를 업데이트 하는 단계; 및(vii) 상기 제1 코드북내의 상기 스테이지들 각각에 대해 상기 단계(iv)-(vi)를 반복하는 단계를 포함하며, 상기 제2 파라미터들 셋은 상기 스테이지들의 각각에 대해 상기 최적 인덱스 및 상기 제2 최적 이득을 가지는 것을 특징으로 하는 준-주기적 음성 신호 코딩 방법.
- 제8항에 있어서, 상기 현재 표준을 재현하는 단계는,(i) 재현된 이전 표준을 워핑하여 상기 재현된 이전 표준의 길이가 상기 재현된 현재 표준의 길이와 동일하도록 하는 단계;(ii) 상기 최적 회전에 의해 상기 워핑된 재현된 이전 표준을 회전시키고 상기 제1 최적 이득에 의해 상기 워핑된 재현된 이전 표준을 스케일링하여 상기 재현된 현재 표준을 형성하는 단계;(iii) 상기 제1 코드북과 동일한 수의 스테이지들을 가지는 제2 코드북으로부터 상기 최적 인덱스에 의해 식별되는 제2 코드벡터를 복원하는 단계;(iv) 상기 제2 최적 이득에 의해 상기 제2 코드벡터를 스케일링하는 단계;(v) 상기 재현된 현재 표준에 상기 스케일링된 제2 코드벡터를 더하는 단계; 및(vi) 상기 제2 코드북내의 상기 스테이지들 각각에 대하여 상기 단계(iii)-(v)를 반복하는 단계를 포함하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 방법.
- 제9항에 있어서, 상기 잔류 신호를 내삽하는 단계는,(i) 상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준 사이의 최적 정렬을 계산하는 단계;(ii) 상기 최적 정렬에 기초하여 상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준 사이의 평균 래그를 계산하는 단계; 및(iii) 상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준을 내삽하여, 상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준 사이의 영역에 상기 잔류 신호를 형성하는 단계를 포함하며, 상기 내삽된 잔류 신호는 상기 평균 래그를 가지는 것을 특징으로 하는 준-주기적 음성 신호 코딩 방법.
- 제10항에 있어서,상기 출력 음성 신호를 합성하는 단계는 LPC 합성 필터를 가지고 상기 내삽된 잔류 신호를 필터링하는 단계를 포함하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 방법.
- 전송 소스로부터 수신기로 전송되는 준-주기적 음성 신호를 코딩 및 디코딩하는 방법으로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 방법은,상기 잔류 신호의 현재 프레임으로부터 현재 표준을 추출하는 단계;이전 표준을 수정하여 상기 수정된 이전 표준이 상기 현재 표준으로 근사화되도록 하는 방법을 기술하는 제1 파라미터들 셋을 계산하는 단계;합산되었을 때 상기 현재 표준 및 상기 수정된 이전 표준 사이의 차이로 근사화되고, 제2 파라미터들 셋에 의해 기술되는 하나 또는 그 이상의 코드벡터들을 제1 코드북으로부터 선택하는 단계;상기 제1 파라미터들 셋 및 상기 제 2 파라미터들 셋을 상기 수신기에 전송하는 단계;상기 제1 파라미터들 셋, 상기 제2 파라미터들 셋, 및 재현된 이전 표준에 기초하여 현재 표준을 재현하는 단계;LPC 합성 필터로 상기 재현된 현재 표준을 필터링하는 단계;상기 LPC 합성 필터로 재현된 이전 표준을 필터링하는 단계; 및상기 필터링된 재현된 현재 표준 및 상기 필터링된 재현된 이전 표준 사이의 영역에 내삽하여 출력 음성 신호를 형성하는 단계를 포함하는 준-주기적 음성 신호 코딩 및 디코딩 방법.
- 전송 소스로부터 수신기로 전송되는 준-주기적 음성 신호를 코딩 및 디코딩하는 시스템으로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 시스템은,상기 잔류 신호의 현재 프레임으로부터 현재 표준을 추출하는 수단;이전 표준을 수정하여 상기 수정된 이전 표준이 상기 현재 표준으로 근사화되도록 하는 방법을 기술하는 제1 파라미터들 셋을 계산하는 수단;합산되었을 때 상기 현재 표준 및 상기 수정된 이전 표준 사이의 오차로 근사화되고, 제2 파라미터들 셋에 의해 기술되는 하나 또는 그 이상의 코드벡터들을 제1 코드북으로부터 선택하는 수단;상기 제1 파라미터들 셋 및 상기 제2 파라미터들 셋을 상기 수신기에 전송하는 수단;상기 제1 파라미터들 셋, 상기 제2 파라미터들 셋, 및 재현된 이전 표준에 기초하여 재현된 현재 표준을 형성하는 수단;상기 재현된 현재 표준 및 상기 재현된 이전 표준 사이의 영역에 상기 잔류 신호를 내삽하여 내삽된 잔류 신호를 형성하는 수단; 및상기 내삽된 잔류 신호에 기초하여 출력 음성 신호를 합성하는 수단을 포함하는 준-주기적 음성 신호 코딩 및 디코딩 시스템.
- 제13항에 있어서,상기 현재 프레임은 피치 래그를 가지고, 상기 현재 표준의 길이는 상기 피치 래그의 길이와 동일한 것을 특징으로 하는 준-주기적 음성 신호 코딩 및 디코딩 시스템.
- 제13항에 있어서,상기 추출 수단은 "컷 프리 영역"에 종속된 상기 현재 표준을 추출하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 및 디코딩 시스템.
- 제15항에 있어서,상기 추출 수단은 상기 컷 프리 영역에 종속되어 상기 현재 프레임의 끝단으로부터 상기 현재 표준을 추출하는 준-주기적 음성 신호 코딩 및 디코딩 시스템.
- 준-주기적 음성 신호를 코딩하는 시스템으로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 시스템은,상기 잔류 신호의 현재 프레임으로부터 현재 표준을 추출하는 수단;이전 표준을 수정하여 상기 수정된 이전 표준이 상기 현재 표준으로 근사화되도록 하는 방법을 기술하는 제1 파라미터들 셋을 계산하는 수단;합산되었을 때 상기 현재 표준 및 상기 수정된 이전 표준 사이의 오차로 근사화되고, 제2 파라미터들 셋에 의해 기술되는 하나 또는 그 이상의 코드벡터들을 제1 코드북으로부터 선택하는 수단;상기 제1 및 제2 파라미터들 셋에 기초하여 재현된 현재 표준을 재현하는 수단;상기 재현된 현재 표준 및 재현된 이전 표준 사이의 영역에 상기 잔류 신호를 내삽하는 수단; 및상기 내삽된 잔류 신호에 기초하여 출력 음성 신호를 합성하는 수단을 포함하며, 상기 제1 파라미터들 셋을 계산하는 수단은,상기 현재 표준을 수신하고 타겟 신호를 출력하기 위해 결합된 제1 회전 LPC 합성 필터;이전 프레임으로부터 상기 이전 표준을 추출하는 수단;상기 이전 표준을 수신하고 상기 현재 표준의 길이와 동일한 길이를 가지는 워핑된 이전 표준을 출력하기 위해 결합된 워핑 필터;상기 워핑된 이전 표준을 수신하고 필터링 및 워핑된 이전 표준을 출력하기 위해 결합된 제2 회전 LPC 합성 필터; 및최적 회전 및 제1 최적 이득을 계산하는 수단을 포함하며,상기 최적 회전에 의해 회전되고 상기 제1 최적 이득에 의해 스케일링된 상기 필터링 및 워핑된 이전 표준이 상기 타겟 신호에 최적으로 근사화되는 준-주기적 음성 신호 코딩 시스템.
- 제17항에 있어서,상기 계산 수단은 피치 회전 검색 범위에 종속되어 상기 최적 회전 및 상기 제1 최적 이득을 계산하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 시스템.
- 제17항에 있어서,상기 계산 수단은 상기 필터링 및 워핑된 이전 표준 및 상기 타겟 신호 사이의 평균 제곱 오차를 최소화하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 시스템.
- 제17항에 있어서,상기 제1 코드북은 하나 또는 그 이상의 스테이지들을 포함하고, 상기 하나 또는 그 이상의 코드벡터들을 선택하는 수단은,상기 최적 회전에 의해 회전되고 상기 제1 최적 이득에 의해 스케일링된 상기 필터링 및 워핑된 이전 표준을 감산함으로써 상기 타겟 신호를 업데이트하는 수단;상기 제1 코드북을 그 각각이 코드벡터를 형성하는 복수의 영역들로 분할하는 수단;상기 코드벡터들을 수신하기 위해 결합되어, 필터링된 코드벡터들을 출력하는 제3 회전 LPC 합성 필터; 및상기 제1 코드북의 각 스테이지에 대해 최적 인덱스 및 제2 최적 이득을 계산하는 수단을 포함하며, 상기 계산 수단은,상기 필터링된 코드벡터들 중 상기 타겟 신호에 가장 근접하고 최적 인덱스에 의해 기술되는 코드벡터를 선택하는 수단;상기 타겟 신호 및 상기 선택 및 필터링된 코드벡터 사이의 상관(correlation)에 기초하여 제2 최적 이득을 계산하는 수단; 및상기 제2 최적 이득에 의해 스케일링된 상기 선택 및 필터링된 코드벡터를 감산함으로써 상기 타겟 신호를 업데이트 하는 수단을 포함하며, 상기 제2 파라미터들 셋은 상기 스테이지들의 각각에 대해 상기 최적 인덱스 및 상기 제2 최적 이득을 가지는 것을 특징으로 하는 준-주기적 음성 신호 코딩 시스템.
- 제20항에 있어서, 상기 현재 표준을 재현하는 수단은,재현된 이전 표준을 수신하도록 결합되어, 상기 재현된 현재 표준의 길이와 동일한 길이를 가지는 워핑된 재현된 이전 표준을 출력하는 제2 워핑 필터;상기 최적 회전에 의해 상기 워핑된 재현된 이전 표준들을 회전시키고, 상기 제1 최적 이득에 의해 상기 워핑된 재현된 이전 표준들을 스케일링하여, 상기 재현된 현재 표준을 형성하는 수단; 및상기 제2 파라미터들 셋을 디코딩 하는 수단을 포함하며, 상기 제2 코드벡터는 상기 제1 코드북과 동일한 수의 스테이지를 가지는 제2 코드북의 각 스테이지에 대하여 디코딩되며, 상기 디코딩 수단은,상기 최적 인덱스에 의해 확인되는 상기 제2 코드벡터를 상기 제2 코드북으로부터 복원하는 수단;상기 제2 최적 이득에 의해 상기 제2 코드벡터를 스케일링하는 수단; 및상기 재현된 현재 표준에 상기 스케일링된 제2 코드벡터를 더하는 수단을 포함하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 시스템.
- 제21항에 있어서, 상기 잔류 신호를 내삽하는 수단은,상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준 사이의 최적 정렬을 계산하는 수단;상기 최적 정렬에 기초하여 상기 워핑된 재현된 이전 표준 및 재현된 현재 표준 사이의 평균 래그를 계산하는 수단; 및상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준을 내삽하여, 상기 워핑된 재현된 이전 표준 및 상기 재현된 현재 표준 사이의 영역에 상기 잔류 신호를 형성하는 수단을 포함하며, 상기 내삽된 잔류 신호는 상기 평균 래그를 가지는 것을 특징으로 하는 준-주기적 음성 신호 코딩 시스템.
- 제22항에 있어서, 상기 출력 음성 신호를 합성하는 수단은 LPC 합성 필터를 포함하는 것을 특징으로 하는 준-주기적 음성 신호 코딩 시스템.
- 전송 소스로부터 수신기로 전송되는 준-주기적 음성 신호를 코딩 및 디코딩하는 시스템으로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 시스템은,상기 잔류 신호의 현재 프레임으로부터 현재 표준을 추출하는 수단;이전 표준을 수정하여 상기 수정된 이전 표준이 상기 현재 표준으로 근사화되도록 하는 방법을 기술하는 제1 파라미터들 셋을 계산하는 수단;합산되었을 때 상기 현재 표준 및 상기 수정된 이전 표준 사이의 오차로 근사화되고, 제2 파라미터들 셋에 의해 기술되는 하나 또는 그 이상의 코드벡터들을 제1 코드북으로부터 선택하는 수단;상기 제1 파라미터들 셋 및 제2 파라미터들 셋을 상기 수신기에 전송하는 수단;상기 제1 파라미터들 셋, 상기 제2 파라미터들 셋, 및 재현된 이전 표준에 기초하여 재현된 현재 표준을 형성하는 수단;상기 재현된 현재 표준을 수신하기 위해 결합되어, 필터링된 재현된 현재 표준을 출력하는 제1 LPC 합성 필터;상기 재현된 이전 표준을 수신하기 위해 결합되어, 필터링된 재현된 이전 표준을 출력하는 제2 LPC 합성 필터; 및상기 필터링된 재현된 현재 표준 및 상기 필터링된 재현된 이전 표준 사이의 영역에 내삽하여 출력 음성 신호를 형성하는 수단을 포함하는 준-주기적 음성 신호 코딩 및 디코딩 시스템.
- 음성 신호의 전송 비트 레이트를 감소시키기 위한 방법으로서,상기 음성 신호의 현재 프레임으로부터 현재 표준 파형을 추출하는 단계;상기 현재 표준 파형을 상기 음성 신호의 이전 프레임으로부터의 이전 표준 파형과 비교하는 단계로서, 상기 이전 표준 파형이 상기 현재 표준 파형으로 근사화되도록 수정하는 회전 파라미터들 셋이 결정되고, 상기 수정된 이전 표준 파형 및 상기 현재 표준 파형 사이의 오차를 기술하는 오차 파라미터들 셋이 결정되는 비교 단계;상기 현재 표준 파형 대신에 상기 회전 파라미터들 셋과 상기 오차 파라미터들 셋을 수신기에 전송하는 단계; 및상기 수신된 회전 파라미터들 셋, 상기 오차 파라미터들 셋, 및 재현된 이전 이전 표준 파형으로부터 현재 표준 파형을 재현하는 단계를 포함하는 전송 비트 레이트 감소 방법.
- 전송 소스로부터 수신기로 전송된 준-주기적인 음성 신호를 디코딩하기 위한 장치로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 장치는,이전 표준을 수정하여 상기 수정된 이전 표준이 현재 표준으로 근사화하도록 하는 방법을 기술하는 제1 파라미터들 셋, 합산될 때 상기 현재 표준과 상기 수정된 이전 표준사이의 오차를 근사화하는 하나 또는 그이상의 코드벡터들을 기술하는 제2 파라미터들 셋, 및 재현된 이전 표준에 기초하여 재현된 현재 표준을 형성하기 위한 디코더; 및상기 재현된 현재 표준 및 상기 재현된 이전 표준 사이의 영역에 상기 잔류 신호를 내삽하여 내삽된 잔류 신호를 형성하고 상기 내삽된 잔류 신호에 기초하여 출력 음성 신호를 합성하기 위한 주기 내삽기를 포함하는 준-주기적 음성 신호 디코딩 장치.
- 준-주기적인 음성 신호를 코딩하기 위한 장치로서, 상기 음성 신호는 선형 예측 코딩(LPC) 분석 필터로 상기 음성 신호를 필터링함으로써 발생된 잔류 신호에 의해 표현되고, 상기 잔류 신호는 데이타 프레임들로 분할되며, 상기 장치는,상기 잔류 신호의 현재 프레임으로부터 현재 표준을 추출하고 이전 프레임으로부터 이전 표준을 추출하기 위한 추출 모듈;상기 현재 표준을 수신하고 타겟 신호를 출력하기 위해 결합된 제1 회전 LPC 합성 필터;상기 이전 표준을 수신하고 상기 현재 표준의 길이와 동일한 길이를 가지는 워핑된 이전 표준을 출력하기 위해 결합된 워핑 필터;상기 워핑된 이전 표준을 수신하고 필터링 및 워핑된 이전 표준을 출력하기 위해 결합된 제2 회전 LPC 합성 필터; 및최적 회전 및 제1 최적 이득을 계산하는 수단을 포함하며, 상기 최적 회전에 의해 회전되고 상기 제1 최적 이득에 의해 스케일링된 상기 필터링 및 워핑된 이전 표준이 상기 타겟 신호에 가장 근사화되는 준-주기적 음성 신호 코딩 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/217,494 US6456964B2 (en) | 1998-12-21 | 1998-12-21 | Encoding of periodic speech using prototype waveforms |
US09/217,494 | 1998-12-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010093208A KR20010093208A (ko) | 2001-10-27 |
KR100615113B1 true KR100615113B1 (ko) | 2006-08-23 |
Family
ID=22811325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020017007887A KR100615113B1 (ko) | 1998-12-21 | 1999-12-21 | 주기적 음성 코딩 |
Country Status (11)
Country | Link |
---|---|
US (1) | US6456964B2 (ko) |
EP (1) | EP1145228B1 (ko) |
JP (1) | JP4824167B2 (ko) |
KR (1) | KR100615113B1 (ko) |
CN (1) | CN1242380C (ko) |
AT (1) | ATE309601T1 (ko) |
AU (1) | AU2377600A (ko) |
DE (1) | DE69928288T2 (ko) |
ES (1) | ES2257098T3 (ko) |
HK (1) | HK1040806B (ko) |
WO (1) | WO2000038177A1 (ko) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6754630B2 (en) * | 1998-11-13 | 2004-06-22 | Qualcomm, Inc. | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation |
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6715125B1 (en) * | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
JP2001255882A (ja) * | 2000-03-09 | 2001-09-21 | Sony Corp | 音声信号処理装置及びその信号処理方法 |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
US6584438B1 (en) | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
EP1796083B1 (en) * | 2000-04-24 | 2009-01-07 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
US6937979B2 (en) * | 2000-09-15 | 2005-08-30 | Mindspeed Technologies, Inc. | Coding based on spectral content of a speech signal |
US7171357B2 (en) * | 2001-03-21 | 2007-01-30 | Avaya Technology Corp. | Voice-activity detection using energy ratios and periodicity |
US20020184009A1 (en) * | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
KR100487645B1 (ko) * | 2001-11-12 | 2005-05-03 | 인벤텍 베스타 컴파니 리미티드 | 유사주기 파형들을 이용한 음성 인코딩 방법 |
US7389275B2 (en) * | 2002-03-05 | 2008-06-17 | Visa U.S.A. Inc. | System for personal authorization control for card transactions |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US7738848B2 (en) | 2003-01-14 | 2010-06-15 | Interdigital Technology Corporation | Received signal to noise indicator |
US20040235423A1 (en) * | 2003-01-14 | 2004-11-25 | Interdigital Technology Corporation | Method and apparatus for network management using perceived signal to noise and interference indicator |
US7627091B2 (en) * | 2003-06-25 | 2009-12-01 | Avaya Inc. | Universal emergency number ELIN based on network address ranges |
KR100629997B1 (ko) * | 2004-02-26 | 2006-09-27 | 엘지전자 주식회사 | 오디오 신호의 인코딩 방법 |
US7130385B1 (en) | 2004-03-05 | 2006-10-31 | Avaya Technology Corp. | Advanced port-based E911 strategy for IP telephony |
US20050216260A1 (en) * | 2004-03-26 | 2005-09-29 | Intel Corporation | Method and apparatus for evaluating speech quality |
US7246746B2 (en) * | 2004-08-03 | 2007-07-24 | Avaya Technology Corp. | Integrated real-time automated location positioning asset management system |
CA2691959C (en) | 2004-08-30 | 2013-07-30 | Qualcomm Incorporated | Method and apparatus for an adaptive de-jitter buffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
KR100639968B1 (ko) * | 2004-11-04 | 2006-11-01 | 한국전자통신연구원 | 음성 인식 장치 및 그 방법 |
US7589616B2 (en) * | 2005-01-20 | 2009-09-15 | Avaya Inc. | Mobile devices including RFID tag readers |
WO2006079349A1 (en) | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for weighted overlap-add |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8107625B2 (en) | 2005-03-31 | 2012-01-31 | Avaya Inc. | IP phone intruder security monitoring system |
US20090210219A1 (en) * | 2005-05-30 | 2009-08-20 | Jong-Mo Sung | Apparatus and method for coding and decoding residual signal |
US7599833B2 (en) * | 2005-05-30 | 2009-10-06 | Electronics And Telecommunications Research Institute | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7184937B1 (en) * | 2005-07-14 | 2007-02-27 | The United States Of America As Represented By The Secretary Of The Army | Signal repetition-rate and frequency-drift estimator using proportional-delayed zero-crossing techniques |
US7821386B1 (en) | 2005-10-11 | 2010-10-26 | Avaya Inc. | Departure-based reminder systems |
US8259840B2 (en) * | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
CN101317218B (zh) * | 2005-12-02 | 2013-01-02 | 高通股份有限公司 | 用于频域波形对准的系统、方法和设备 |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP5205373B2 (ja) * | 2006-06-30 | 2013-06-05 | フラウンホーファーゲゼルシャフト・ツア・フェルデルング・デア・アンゲバンテン・フォルシュング・エー・ファウ | 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US20100030557A1 (en) | 2006-07-31 | 2010-02-04 | Stephen Molloy | Voice and text communication system, method and apparatus |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
CN101523486B (zh) * | 2006-10-10 | 2013-08-14 | 高通股份有限公司 | 用于编码和解码音频信号的方法和设备 |
SG166095A1 (en) * | 2006-11-10 | 2010-11-29 | Panasonic Corp | Parameter decoding device, parameter encoding device, and parameter decoding method |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
CN100483509C (zh) * | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US20100006527A1 (en) * | 2008-07-10 | 2010-01-14 | Interstate Container Reading Llc | Collapsible merchandising display |
US9232055B2 (en) * | 2008-12-23 | 2016-01-05 | Avaya Inc. | SIP presence based notifications |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466674B (en) * | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
IN2012DN05235A (ko) | 2010-01-08 | 2015-10-23 | Nippon Telegraph & Telephone | |
FR2961937A1 (fr) * | 2010-06-29 | 2011-12-30 | France Telecom | Codage/decodage predictif lineaire adaptatif |
EP2684190B1 (en) * | 2011-03-10 | 2015-11-18 | Telefonaktiebolaget L M Ericsson (PUBL) | Filling of non-coded sub-vectors in transform coded audio signals |
EP2830062B1 (en) | 2012-03-21 | 2019-11-20 | Samsung Electronics Co., Ltd. | Method and apparatus for high-frequency encoding/decoding for bandwidth extension |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
PL3011554T3 (pl) * | 2013-06-21 | 2019-12-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Szacowanie opóźnienia wysokości tonu |
CN110931025A (zh) | 2013-06-21 | 2020-03-27 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
RU2720357C2 (ru) * | 2013-12-19 | 2020-04-29 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ оценки фонового шума, блок оценки фонового шума и машиночитаемый носитель |
TWI688609B (zh) | 2014-11-13 | 2020-03-21 | 美商道康寧公司 | 含硫聚有機矽氧烷組成物及相關態樣 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62150399A (ja) * | 1985-12-25 | 1987-07-04 | 日本電気株式会社 | 音声合成用基本周期波形生成法 |
JP2650355B2 (ja) * | 1988-09-21 | 1997-09-03 | 三菱電機株式会社 | 音声分析合成装置 |
JPH02160300A (ja) * | 1988-12-13 | 1990-06-20 | Nec Corp | 音声符号化方式 |
US5884253A (en) | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
JPH06266395A (ja) * | 1993-03-10 | 1994-09-22 | Mitsubishi Electric Corp | 音声符号化装置および音声復号化装置 |
JPH07177031A (ja) * | 1993-12-20 | 1995-07-14 | Fujitsu Ltd | 音声符号化制御方式 |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
US5809459A (en) | 1996-05-21 | 1998-09-15 | Motorola, Inc. | Method and apparatus for speech excitation waveform coding using multiple error waveforms |
JP3531780B2 (ja) * | 1996-11-15 | 2004-05-31 | 日本電信電話株式会社 | 音声符号化方法および復号化方法 |
JP3296411B2 (ja) * | 1997-02-21 | 2002-07-02 | 日本電信電話株式会社 | 音声符号化方法および復号化方法 |
US5903866A (en) * | 1997-03-10 | 1999-05-11 | Lucent Technologies Inc. | Waveform interpolation speech coding using splines |
US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6092039A (en) * | 1997-10-31 | 2000-07-18 | International Business Machines Corporation | Symbiotic automatic speech recognition and vocoder |
JP3268750B2 (ja) * | 1998-01-30 | 2002-03-25 | 株式会社東芝 | 音声合成方法及びシステム |
US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
US6330532B1 (en) * | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
US6324505B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Amplitude quantization scheme for low-bit-rate speech coders |
-
1998
- 1998-12-21 US US09/217,494 patent/US6456964B2/en not_active Expired - Lifetime
-
1999
- 1999-12-21 EP EP99967508A patent/EP1145228B1/en not_active Expired - Lifetime
- 1999-12-21 AU AU23776/00A patent/AU2377600A/en not_active Abandoned
- 1999-12-21 KR KR1020017007887A patent/KR100615113B1/ko active IP Right Grant
- 1999-12-21 ES ES99967508T patent/ES2257098T3/es not_active Expired - Lifetime
- 1999-12-21 AT AT99967508T patent/ATE309601T1/de not_active IP Right Cessation
- 1999-12-21 CN CNB998148210A patent/CN1242380C/zh not_active Expired - Lifetime
- 1999-12-21 JP JP2000590162A patent/JP4824167B2/ja not_active Expired - Lifetime
- 1999-12-21 DE DE69928288T patent/DE69928288T2/de not_active Expired - Lifetime
- 1999-12-21 WO PCT/US1999/030588 patent/WO2000038177A1/en active IP Right Grant
-
2002
- 2002-03-19 HK HK02102093.0A patent/HK1040806B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1242380C (zh) | 2006-02-15 |
DE69928288T2 (de) | 2006-08-10 |
US20020016711A1 (en) | 2002-02-07 |
JP2003522965A (ja) | 2003-07-29 |
US6456964B2 (en) | 2002-09-24 |
EP1145228B1 (en) | 2005-11-09 |
ATE309601T1 (de) | 2005-11-15 |
AU2377600A (en) | 2000-07-12 |
WO2000038177A1 (en) | 2000-06-29 |
KR20010093208A (ko) | 2001-10-27 |
ES2257098T3 (es) | 2006-07-16 |
HK1040806B (zh) | 2006-10-06 |
HK1040806A1 (en) | 2002-06-21 |
DE69928288D1 (de) | 2005-12-15 |
EP1145228A1 (en) | 2001-10-17 |
CN1331825A (zh) | 2002-01-16 |
JP4824167B2 (ja) | 2011-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100615113B1 (ko) | 주기적 음성 코딩 | |
KR100679382B1 (ko) | 가변 속도 음성 코딩 | |
EP0409239B1 (en) | Speech coding/decoding method | |
US6081776A (en) | Speech coding system and method including adaptive finite impulse response filter | |
US6078880A (en) | Speech coding system and method including voicing cut off frequency analyzer | |
US6138092A (en) | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency | |
US20010016817A1 (en) | CELP-based to CELP-based vocoder packet translation | |
JP4270866B2 (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
EP0360265A2 (en) | Communication system capable of improving a speech quality by classifying speech signals | |
JP2003512654A (ja) | 音声の可変レートコーディングのための方法およびその装置 | |
JP4874464B2 (ja) | 遷移音声フレームのマルチパルス補間的符号化 | |
US20030004710A1 (en) | Short-term enhancement in celp speech coding | |
JP2003501675A (ja) | 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置 | |
EP1204968B1 (en) | Method and apparatus for subsampling phase spectrum information | |
EP1597721B1 (en) | 600 bps mixed excitation linear prediction transcoding | |
JPH09508479A (ja) | バースト励起線形予測 | |
US20030055633A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
Drygajilo | Speech Coding Techniques and Standards |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120727 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20130729 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140730 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190624 Year of fee payment: 14 |