KR100366700B1 - 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법 - Google Patents

코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법 Download PDF

Info

Publication number
KR100366700B1
KR100366700B1 KR1019960051450A KR19960051450A KR100366700B1 KR 100366700 B1 KR100366700 B1 KR 100366700B1 KR 1019960051450 A KR1019960051450 A KR 1019960051450A KR 19960051450 A KR19960051450 A KR 19960051450A KR 100366700 B1 KR100366700 B1 KR 100366700B1
Authority
KR
South Korea
Prior art keywords
adaptive codebook
equation
gain
code
linear prediction
Prior art date
Application number
KR1019960051450A
Other languages
English (en)
Other versions
KR19980031885A (ko
Inventor
김홍국
조용덕
김상룡
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1019960051450A priority Critical patent/KR100366700B1/ko
Publication of KR19980031885A publication Critical patent/KR19980031885A/ko
Application granted granted Critical
Publication of KR100366700B1 publication Critical patent/KR100366700B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 코드여기 선형 예측 (Code-Excited Linear Prediction) 부호화에 있어서의 적응 코드북 탐색 방법에 관한 것으로서 더욱 상세하게는 과거의 여기 신호로부터 이득 벡터를 추정하고, 이 추정된 값으로부터 3차의 이득 벡터를 스칼라로 표현할 수 있게하는 적응 코드북 탐색 방법에 관한 것이다.
본 발명에 따른 적응 코드북 탐색 방법은 여기 신호의 상관을 이용하여 multi-gain을 single-gain으로 모델링할 수 있다. 따라서, 본 발명에 따른 적응 코드북 탐색 방법을 통하여 CELP구조에서의 Multi-tap Multi-gain Adaptive Codebook(MMAC) 방식이 갖는 부호화 성능을 가지면서 부프레임당 2bits의 절감 효과를 가져올 수 있다.

Description

코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색 방법
본 발명은 코드여기 선형 예측 (Code-Excited Linear Prediction) 부호화에 있어서의 적응 코드북 탐색 방법에 관한 것으로서 더욱 상세하게는 과거의 여기 신호로부터 이득 벡터를 추정하고, 이 추정된 값으로부터 3차의 이득 벡터를 스칼라로 표현할 수 있게 하는 적응 코드북 탐색 방법에 관한 것이다.
코드여기 선형 예측 (이하 CELP라 함) 부호화기는 크게 피치 필터(pitch filter)와 잡음 코드북으로 구성되어있다. 피치 필터는 음성의 주기성을 모델링하기 위해 사용되며 이를 구현하는 하나의 방법으로 적응 코드북(adaptive codebook)이라는 구조를 사용하는 것이 일반적이다.
적응 코드북 탐색은 과거의 여기 신호를 가지고 현재 분석하고자 하는 음성에 가장 적당한 주기와 이득 값을 구하는 것이다. 음성의 피치를 샘플 간격으로 표시할 경우 적응 코드북은 피치 간격이 정확히 정수 값인 분석 음성에 대해서는 우수한 성능을 보인다. 반면 피치 간격이 샘플 간격의 정수배가 아닌 경우 적응 코드북은 급격히 떨어지는 성능을 보인다. 이러한 경우 성능을 유지하기 위하여 fractional pitch 방식과 multi-tap adaptive codebook 방식이 제안되어 왔다.
Fractional pitch(이하 FP라 함) 방식은 분석 음성의 피치를 정수가 아닌 소수로 가정한다. 일반적으로 부호화기의 전송 용량을 고려하여 0.25단위의 소수만을 피치로 가정한다. 우선 분석 음성으로부터 0.25단위의 분해능을 얻기 위해 음성을 오버샘플링(oversampling)한다. 또한 과거 여기 신호도 4배의 오버샘플링을 행한 후 상기에서 설명한 바와 같이 적응 코드북 탐색을 통해 주기와 이득 값을 구한다.
이러한 FP 방식은 피치의 변화가 정수가 아닌 경우에도 적응 코드북의 성능을 그대로 유지할 수 있는 반면 오버샘플링을 위한 계산 및 분석 음성과의 비교를 위한 임펄스 응답 필터링(impulse response filtering) 등을 위해 4배 이상의 계산이 요구된다. 이와 함께 FP를 전송하기 위한 부가 비트가 요구된다. 예를 들면 0.25단위의 FP방식을 위해서는 2bits가 추가되어야 한다.
정수형 적응 코드북은 지연과 이득 값이 각각 한 개로 구성되므로 Single-tap Single-gain Adaptive Codebook(이하 SSAC라 함)이라 할 수 있다. 적응 코드북은 임의의 수로 구성된 지연과 이득을 갖는 Multi-tap Multi-gain Adaptive Codebook(이하 MMAC라 함) 구조로 일반화될 수 있다. Multi-tap 구조는 전송 용량의 한계 때문에 tap-delay는 기준값(피치 지연)의 근처에 존재한다. 다시 말해서 피치 지연을 T, tap수를 (2M+1)이라 하면 tap-delay는 (T-M, T-M+1,,,,T-1,T,T+1,,,,T+M)으로 표현된다. 이때 이득 값은의 벡터가 된다.
FP방식이 FP를 위해 비트 증가가 필요한 반면 MMAC 방식은 SSAC 방식에 비해 이득 벡터에 추가 비트를 할당해야 한다는 문제점이 있다.
본 발명은 상기의 문제점을 해결하기 위하여 안출된 것으로서 SSAC 방식이 갖는 저전송률의 이점과 MMAC 방식에서의 성능 향상을 동시에 고려한 새로운 적응 코드북 탐색 방법을 제공하는 것을 그 목적으로 한다.
도 1은 종래의 CELP부호화 과정을 보이는 과정도이다.
도 2는 종래의 적응 코드북 탐색 과정을 보이는 과정도이다.
도 3은 종래의 잡음 코드북 탐색 과정을 보이는 과정도이다.
도 4는 MMAC 방식에서의 피치의 소수 부분 변화에 따른 이득값의 범위를 보이는 그래프이다.
도 5는 본 발명에 따른 적응 코드북 탐색 방법을 보이는 과정도이다.
상기의 목적을 달성하는 본 발명에 따른 적응 코드북 탐색 방법은
과거의 여기 신호를 하기의 식과 같이 이차 smoothing filter로 모델링하는 과정;
상기의 오차 신호의 제곱의 합을 최소화하는 계수,를 하기의 식에 의해 구하는 과정;
상기 계수,를 이용하여 하기의 식으로 보여지는 여기 신호를 얻는 과정;
상기로부터 하기의 식을 만족하는 피치 지연 T, 그리고 이득 값 α를 구하는
여기서,는 각각 적응 코드북 여기 신호 및 필터를 통과한 후의 신호로서
임.
과정을 포함함을 특징으로 한다.
본 발명에 따른 적응 코드북 탐색 방법은 여기 신호의 상관을 이용하여 multi-gain을 single-gain으로 모델링할 수 있다. 따라서, 본 발명에 따른 적응 코드북 탐색 방법을 통하여 CELP구조에서의 MMAC 방식이 갖는 부호화 성능을 가지면서 부프레임당 2bits의 절감 효과를 가져올 수 있다.
이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
도 1은 종래의 CELP 부호화기의 부호화 과정을 보이는 과정도이다.
도 1에 도시된 과정도에 있어서 제101단계에서는 분석하고자 하는 음성의 일정 구간(프레임)을 샘플링한다. 일반적으로 1프레임은 20-30ms 즉, 8KHz 샘플링의 경우 160-240개의 샘플 값에 해당한다.
제102단계에서는 샘플링된 1프레임의 음성 데이터에 대해 직류 성분을 제거하기 위한 고역 여파 처리(high pass filtering)를 행한다.
제103단계에서는 선형 예측 기법을 사용하여 음성의 특징 파라메터를 구한다. 이들 특징 파라메터(이하 LPC계수라 함)는 수학식 1과 같이 창함수(window function)로 가중된 음성신호에 대해 이를 p차의 선형 다항식으로 근사화시키는 경우에 있어서 구해지는 다항식의 계수에 해당한다.
[수학식 1]
여기서,이고, 수학식 2의 값을 최소화하는 계수에 해당한다.
[수학식 2]
여기서,이다.
이렇게 얻어진 LPC계수는 양자화되어 전송되기에 앞서 제104단계에서 전송 시 효율을 좋게 하고 부프레임 보간(subframe interpolation)특성이 좋은 선스펙트럼쌍(Line Spectrum Pairs; 이하 LSP)계수로 변환된다.
이 LSP계수는 제105단계에서 양자화된다.
제106단계에서는 부호화기와 복호화기의 동기를 맞추기 위해 LSP계수를 역양자화시킨다.
이렇게 분석된 음성 파라메터로부터 음성의 주기성을 제거하고, 잡응 코드북으로 모델링하기 위해 음성 구간을 4개의 부프레임으로 자세히 나눈다. 즉, 각 부프레임의 음성 구간 길이는가 된다.
s번째 부프레임에 대한 i번째 음성에 대한 LSP계수는 다음의 수학식 3과 같이 얻을 수 있다.
[수학식 3]
여기서,는 각각 바로 전 프레임과 현재 프레임의 i번째 LSP계수를 나타낸다.
제108단계에서는 LSP계수를 LPC계수로 변환시킨다. 그리고 제109단계, 제110단계, 제111단계에서는 부프레임 LPC계수로부터 음성 합성 필터와 오차 가중 필터를 구성한다.
음성합성 필터와 오차 가중 필터는 다음의 수학식 4 및 수학식 5로 나타내어진다.
[수학식 4]
[수학식 5]
여기서,는 LSP계수로부터 변환된 LPC계수이다.
제109단계는 바로 전 부프레임의 합성 필터의 영향을 제거해 준다. Zero-Input-Response(ZIR),는 다음의 수학식 6과 같이 구할 수 있다.
[수학식 6]
여기서,는 바로 전 프레임에서의 합성 신호를 의미한다.
이 ZIR의 결과를 원 음성신호 S(n)에서 뺀다. 이를라 한다.
제113단계와 제114단계는 각각 적응 코드북과 잡음 코드북 중에서에 가장 근사한 코드북을 찾는 과정에 해당한다.
도 2는 종래의 적응 코드북의 탐색 과정을 보이는 과정도이다. 수학식 5에 해당하는 오차 가중 필터는 신호과 음성합성 필터에 각각 적용된다.에 오차 가중 필터를 적용한 신호를라 한다. 먼저 SSAC 방식의 경우에 대해 기술한다.
적응 코드북을 이용하여 L의 지연을 갖고 만들어지는 값을이라 하면 제202단계에서 필터링된 신호는이고 두 신호의 차를 최소화하는을 제203단계에서 다음의 수학식 7 내지 수학식 9에 의해 찾는다.
[수학식 7]
[수학식 8]
[수학식 9]
이렇게 구해진로부터 구해진 오차 신호를이라 한다. 이 값은 수학식 10과 같다.
[수학식 10]
그러므로 SSAC 방식의 탐색 결과는 수학식 8과 수학식 9의이 된다.
MMAC 방식의 탐색은 SSAC 방식과 유사하다. 여기서는, MMAC 방식의 multi-tap의 수가 3인 경우 즉, M=1인 경우에 한정하여 기술하기로 한다. L의 지연을 가지고 만들어지는 여기 신호를이라 하면 MMAC를 위한 여기 신호는,, 그리고의 세 가지가 사용된다.
제202단계의 필터를 통과한 후의 신호를 각각,, 그리고으로 표현된다. 따라서 target 신호와의 차는 다음의 수학식 11과 같이 표현된다.
[수학식 11]
수학식 11의 제곱의 합을 최소화하는,는 다음의 수학식 12 및 수학식 13과 같이 주어진다.
[수학식 12]
[수학식 14]
오차 신호은 다음 수학식 14와 같다.
[수학식 13]
MMAC 방식이 SSAC 방식에 비해 우수한 성능을 보이는 반면 이득 값이 벡터로 주어지므로 스칼라 양자화기보다 2bits이상이 요구되는 벡터 양자화기로 양자화하여야 한다.
도 3은 종래의 잡음 코드북의 탐색 과정을 보이는 과정도이다. M개로 구성된 잡음 코드북 중의 i번째 코드어를라 하면 제301단계에서 필터링된 신호는이 된다. 최적의 코드어와 코드북 이득은 다음의 수학식 15 내지 수학식 17과 같다.
[수학식 15]
[수학식 16]
[수학식 17]
최종적으로 얻어지는 음성 필터의 여기 신호는 SSAC방식의 경우 수학식 18과 같이 나타내어지고,
[수학식 18]
MMAC방식의 경우 수학식 19와 같이 나타내어진다.
[수학식 19]
수학식 19의 결과는 다음 부프레임의 분석을 위한 적응 코드북을 갱신하는 데 이용된다.
도 4는 MMAC 방식에서의 정수 피치 T와 소수 피치 P에 따른 이득 값의 분포를 보이는 그래프이다. 우선 음성의 스펙트럼 특성이 피치간격의 변화에 관계없이 일정하다고 가정한다.
예를 들어, T=30, P=30.25인 경우는는 0.0에서 1.0사이의 값을 갖는다. 또한,은 0.0이 된다. 반대로, T=30, P=29.75인 경우는이 0.0이 되고,은 0.0에서 1.0사이의 값을 갖는다. 그리고, T=P인 경우에는이 되고,로 FP방식과 MMAC 방식, 그리고 SSAC 방식이 동일하게 된다.
본 발명에서는 과거의 여기 신호로부터 이득 벡터를 추정한다. 이 추정된 값으로부터 3차의 이득 벡터를 스칼라로 표현할 수 있게 된다. 결국 multi-tap의 구조를 가지면서 scalar gain으로 적응 코드북을 설계할 수 있다.
다음은 본 발명을 통하여 안출된 MSAC 방식의 동작을 기술한다.
적응 코드북의 여기 신호는 도 4와 전술한 바와 같이 다음의 수학식 20과 같이 변형될 수 있다.
[수학식 20]
즉, MMAC 방식의 이득 값들은 다음의 수학식 21로 보여지는 조건을 만족한다.
[수학식 21]
세 가지 이득 값간의 관계는 수학식 22와 같다.
[수학식 22]
도 5는 본 발명에 따른 MSAC의 탐색 과정을 보이는 과정도이다.
본 발명에서는,,대신에,를 과거 여기 신호로 추정하고 적응 코드북 탐색 과정에서는 전체 이득 α만을 계산해 낸다.
여기서,,는 과거 여기 신호에 대해 다음의 수학식 23과 같이 이차 smoothing filter의 계수로 모델링할 수 있다.
[수학식 23]
수학식 23의 오차 신호의 제곱의 합을 최소화하는 계수,는 다음의 수학식 24와 같이 구할 수 있다.
[수학식 24]
수학식 24로부터 얻은 계수,를 수학식 20에 대합하고 SSAC와 같이 피치 지연 T, 그리고 이득 값 α를 다음의 수학식 25와 같이 구한다.
[수학식 25]
여기서,는 각각 수학식 20의 적응 코드북 여기 신호 및 제 202단계의 필터를 통과한 후의 신호에 해당하며 수학식 26과 같이 표현된다.
[수학식 26]
최종적인 오차 신호은 다음의 수학식 26과 같이 되며, 제403단계에서 구해진다.
[수학식 27]
상술한 바와 같이 본 발명에 따른 적응 코드북의 탐색 방법은 과거의 여기 신호로부터 이득 벡터를 추정하고, 이 추정된 값으로부터 3차의 이득 벡터를 스칼라로 표현할 수 있게 하여 multi-tap 의 구조를 가지면서 scalar gain으로 적응 코드북을 설계할 수 있게 하는 효과를 갖는다.

Claims (1)

  1. 코드여기 선형 예측 (Code-Excited Linear Prediction) 부호화의 적응 코드북 탐색 방법에 있어서,
    과거의 여기 신호를 하기의 식과 같이 이차 smoothing filter로 모델링하는 과정;
    상기의 오차 신호의 제곱의 합을 최소화하는 계수,를 하기의 식에 의해 구하는 과정;
    상기 계수,를 이용하여 하기의 식으로 보여지는 여기 신호를 얻는 과정; 및
    상기로부터 하기의 식을 만족하는 피치 지연 T, 그리고 이득 값 α를 구하는 과정
    (여기서,는 각각 적응 코드북 여기 신호 및 필터를 통과한 후의 신호로서
    임)
    을 포함하는 적응 코드북 탐색 방법.
KR1019960051450A 1996-10-31 1996-10-31 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법 KR100366700B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960051450A KR100366700B1 (ko) 1996-10-31 1996-10-31 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960051450A KR100366700B1 (ko) 1996-10-31 1996-10-31 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법

Publications (2)

Publication Number Publication Date
KR19980031885A KR19980031885A (ko) 1998-07-25
KR100366700B1 true KR100366700B1 (ko) 2003-02-19

Family

ID=37491132

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960051450A KR100366700B1 (ko) 1996-10-31 1996-10-31 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법

Country Status (1)

Country Link
KR (1) KR100366700B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
US5195137A (en) * 1991-01-28 1993-03-16 At&T Bell Laboratories Method of and apparatus for generating auxiliary information for expediting sparse codebook search
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
JPH06186998A (ja) * 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式
US5426718A (en) * 1991-02-26 1995-06-20 Nec Corporation Speech signal coding using correlation valves between subframes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5195137A (en) * 1991-01-28 1993-03-16 At&T Bell Laboratories Method of and apparatus for generating auxiliary information for expediting sparse codebook search
US5426718A (en) * 1991-02-26 1995-06-20 Nec Corporation Speech signal coding using correlation valves between subframes
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
JPH06186998A (ja) * 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式

Also Published As

Publication number Publication date
KR19980031885A (ko) 1998-07-25

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
US6980951B2 (en) Noise feedback coding method and system for performing general searching of vector quantization codevectors used for coding a speech signal
JP3392412B2 (ja) 音声コーディング装置及び音声エンコーディング方法
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JP6316398B2 (ja) Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法
JP5400701B2 (ja) 音声符号化のための方法と装置
JP3073017B2 (ja) 音声コーディングにおけるダブルモード長期予測
WO2008049221A1 (en) Method and device for coding transition frames in speech signals
US5884251A (en) Voice coding and decoding method and device therefor
US5598504A (en) Speech coding system to reduce distortion through signal overlap
US6101464A (en) Coding and decoding system for speech and musical sound
JP2970407B2 (ja) 音声の励振信号符号化装置
KR100366700B1 (ko) 코드여기 선형 예측 부호화에 있어서 상관함수에 기초한 적응 코드북 탐색방법
EP1114415B1 (en) Linear predictive analysis-by-synthesis encoding method and encoder
US5826223A (en) Method for generating random code book of code-excited linear predictive coding
KR100389898B1 (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법
KR100346732B1 (ko) 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
CA2118986C (en) Speech coding system
Qian et al. Pseudo-multi-tap pitch filters in a low bit-rate CELP speech coder
JP3353252B2 (ja) 音声符号化方法
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
KR970009747B1 (ko) Qcelp 음성부호화기의 복잡도 감소 알고리즘
JP2000305597A (ja) 音声圧縮のコード化
JPH10293599A (ja) 音響信号符号化法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20081127

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee