KR100474833B1 - 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치 - Google Patents

예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치 Download PDF

Info

Publication number
KR100474833B1
KR100474833B1 KR10-1999-0051066A KR19990051066A KR100474833B1 KR 100474833 B1 KR100474833 B1 KR 100474833B1 KR 19990051066 A KR19990051066 A KR 19990051066A KR 100474833 B1 KR100474833 B1 KR 100474833B1
Authority
KR
South Korea
Prior art keywords
spectral envelope
residual
quantized
vector
residual spectral
Prior art date
Application number
KR10-1999-0051066A
Other languages
English (en)
Other versions
KR20010047039A (ko
Inventor
조용덕
김무영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-1999-0051066A priority Critical patent/KR100474833B1/ko
Priority to US09/584,107 priority patent/US6606592B1/en
Publication of KR20010047039A publication Critical patent/KR20010047039A/ko
Application granted granted Critical
Publication of KR100474833B1 publication Critical patent/KR100474833B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Abstract

본 발명은 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원 스펙트럼 진폭 양자화 장치 및 그 방법을 개시한다. 저차 선형 예측 모델링과 잔차 스펙트럼 모델링을 이용한 선형 예측 스펙트럼 포락선 및 잔차 스펙트럼 포락선 양자화 방식에 따른 본 발명에 의한 가변 차원 스펙트럼 진폭 양자화 장치는, 양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 예측 양자화부, 멜 스케일 이진 벡터 코드북을 이용하여 선형 스케일 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 구하는 멜 스케일 이진 벡터 양자화부 및 예측 양자화부의 출력과 멜 스케일 이진 벡터 양자화부의 출력을 합하여 양자화된 잔차 스펙트럼 포락선을 발생하고, 그에 해당하는 양자화된 선형 예측 스펙트럼 포락선을 곱하여 합성 스펙트럼 포락선을 생성하는 합성 스펙트럼 포락선 생성부, 합성 스펙트럼 포락선을 본래의 스펙트럼 포락선과 비교하는 비교부 및 비교부로 부터 순차 얻어진 비교값들중에 최소치를 검출하는 최소치 검출부를 포함하는 것을 특징으로 한다.

Description

예측 및 멜-스케일 이진 벡터를 이용한 가변 차원 스펙트럼 진폭 양자화 방법 및 그 장치{Predictive and Mel-scale binary vector quantization apparatus and method for variable dimension spectral magnitude}
본 발명은 음성 부호화에 관한 것이며, 특히 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원 스펙트럼 진폭 양자화 방법 및 그 장치에 관한 것이다.
정현 음성 부호화기에 있어서, 스펙트럼 진폭의 양자화는 저비트율에서 고음질을 얻는데 중요한 문제이다. 스펙트럼 진폭의 양자화 방식은 크게 고차 선형 예측(LP:Linear Prediction) 모델링을 이용한 LP 스펙트럼 포락선의 양자화 방식과, 저차 LP 모델링 및 잔차 스펙트럼 모델링을 이용한 LP 스펙트럼 포락선 및 잔차 스펙트럼 포락선의 양자화 방식이 있다. 첫번째 방식은 차수와 양자화 비트의 증가에도 성능 개선이 일정량으로 수렴하며, 계산량이나 메모리 요구량이 상당하다. 따라서, 두번째 방식을 적용하여 음질 개선 및 적은 계산량이나 적은 메모리 요구량을 만족시키는 양자화 방법이 요구된다.
스펙트럼 진폭의 차원은 피치 하모닉에서 샘플링되고 평가될 때에 가변적이다. 종래에 가변 차원의 스펙트럼 진폭을 양자화하는 몇가지 방법들이 제시되었다. 다중밴드 여기신호 보코더(MBE)는 스펙트럼 진폭을 이산 코사인 변환의 계수로 변환하고, 그 계수를 스칼라 및 벡터 양자화기들의 조합을 이용하여 양자화한다. 밴드 제한 보간법(BLI)은 스펙트럼의 가변 차원을 샘플링 레이트 변환 및 신호 보간법에 근거하여 고정 차원으로 변환한다. 가변 차원 벡터 양자화(VDVQ) 방법은 스펙트럼 벡터를 고정 차원의 범용 코드북을 이용하여 직접 양자화한다. 비정방형 변형 벡터 양자화(NSTVQ) 방법은 입력 벡터를 선형 변형 매트릭스를 이용하여 고정 차원으로 변형한다.
그러나, 이들 종래의 방법들은 고 스펙트럼 정확성을 얻기 위해서 벡터 코드북을 유지하고 얻는데 막대한 메모리와 훈련 과정을 요구하고, 뿐만 아니라 최적 코드 벡터를 검색하는데 상당한 검색 시간을 요구한다.
본 발명이 이루고자 하는 기술적 과제는, 예측 및 멜 스케일 이진 벡터 양자화기를 이용하여 잔차 스펙트럼 포락선을 효율적으로 양자화함으로써, 매우 적은 계산량으로 스펙트럼 진폭을 양자화하고, 고 스펙트럼 정확성을 달성하는, 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원 스펙트럼 진폭 양자화 장치를 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 가변 차원 스펙트럼 진폭 양자화 장치에서 잔차 스펙트럼 포락선을 효율적으로 양자화하는 장치를 제공하는데 있다.
본 발명이 이루고자 하는 또다른 기술적 과제는, 가변 차원 스펙트럼 진폭 양자화 과정에서 예측 및 멜 스케일 이진 벡터 양자화를 통해 잔차 스펙트럼 포락선을 효율적으로 양자화하는 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또다른 기술적 과제는, 상기 스펙트럼 진폭 양자화 장치가 수행하는 가변 차원 스펙트럼 진폭 양자화 방법을 제공하는데 있다.
상기 과제를 이루기 위하여, 본 발명에 의한 가변 차원 스펙트럼 진폭 양자화 장치는,
양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 예측 양자화부, 멜 스케일 이진 벡터 코드북을 이용하여 선형 스케일 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 구하는 멜 스케일 이진 벡터 양자화부, 예측 양자화부의 출력과 멜 스케일 이진 벡터 양자화부의 출력을 합하여 양자화된 잔차 스펙트럼 포락선을 발생하고, 그에 해당하는 선형 예측 양자화된 스펙트럼 포락선을 곱하여 합성 스펙트럼 포락선을 생성하는 합성 스펙트럼 포락선 생성부, 합성 스펙트럼 포락선을 본래의 스펙트럼 포락선과 비교하는 비교부 및 비교부로 부터 순차 얻어진 비교값들중에 최소치를 검출하는 최소치 검출부를 포함하는 것을 특징으로 한다.
상기 다른 과제를 이루기 위하여, 가변 차원 스펙트럼 진폭 양자화 장치에서의 진폭 스펙트럼 양자화 장치는,
양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 예측 양자화부, 멜 스케일 이진 벡터 코드북을 이용하여 선형 스케일 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 구하는 멜 스케일 이진 벡터 양자화부 및 예측 양자화부의 출력과 멜 스케일 이진 벡터 양자화부의 출력을 합하여 양자화된 잔차 스펙트럼 포락선을 발생하는 잔차 스펙트럼 포락선 양자화부를 포함하며, 멜 스케일 이진 벡터 코드북은 가변 고 차원의 잔차 스펙트럼 포락선을 고정된 저 차원의 코드 벡터로 나타내는 것을 특징으로 한다.
상기 또다른 과제를 이루기 위하여, 본 발명에 의한 잔차 스펙트럼 포락선 양자화 방법은,
(a) 양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 단계, (b) 멜 스케일 이진 벡터 코드북을 이용하여 선형 스케일 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 구하는 단계 및 (c) 제1 잔차 스펙트럼 포락선과 제2 잔차 스펙트럼 포락선을 합하여 양자화된 잔차 스펙트럼 포락선을 생성하는 단계를 포함하며, 멜 스케일 이진 벡터 코드북은 가변 고 차원의 잔차 스펙트럼 포락선을 고정된 저 차원의 코드 벡터로 나타내는 것을 특징으로 한다.
상기 또다른 과제를 이루기 위하여, 본 발명에 의한 가변 차원 스펙트럼 진폭 양자화 방법은,
(a) 양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 단계, (b) 멜 스케일 이진 벡터 코드북을 이용하여 선형 스케일 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 구하는 단계, (c) 제1 잔차 스펙트럼 포락선과 제2 잔차 스펙트럼 포락선을 합하여 양자화된 잔차 스펙트럼 포락선을 생성하고, 그에 해당하는 양자화된 선형 예측 스펙트럼 포락선을 곱하여 합성 스펙트럼 포락선을 생성하는 단계, (d) 합성 스펙트럼 포락선을 본래의 스펙트럼 포락선과 비교하는 단계 및 (e) (d) 단계로 부터 순차 얻어진 비교값들중에 최소치를 검출하는 단계를 포함하는 것을 특징으로 한다.
이하, 본 발명에 의한 예측 및 멜 스케일 이진 벡터를 이용한 가변 차원 스펙트럼 진폭 양자화 장치 및 그 방법을 첨부한 도면을 참조하여 다음과 같이 설명한다.
정현 음성 부호화기에서, 스펙트럼 진폭을 양자화할 경우에 LP 스펙트럼 포락선만 양자화하면 성능을 개선시키는데 충분하지 않다. 따라서, 이를 보상하는 알고리즘이 필수적으로 필요하다. 본 발명은 저차 LP 모델링 및 잔차 스펙트럼 모델링을 이용한 LP 스펙트럼 포락선 및 잔차 스펙트럼의 양자화 방식에 관한 것이다. 특징적으로, 본 발명은 과거 프레임의 정보를 이용하여 잔차 스펙트럼 포락선을 예측 양자화하고, 가변하는 스펙트럼의 차원을 해결하기 위해 멜 스케일 이진 벡터 양자화한다.
도 1은 본 발명에 의한 가변차원 스펙트럼 진폭 양자화 장치의 블럭도로서, 합성 스펙트럼 포락선 생성부(100), 비교부(110), 최소치 검출부(120), 예측 양자화부(130) 및 멜 스케일 이진 벡터 양자화부(140)를 포함한다.
스펙트럼 포락선(y)은 LP 스펙트럼 포락선(H) 및 잔차 스펙트럼 포락선(x)의 곱으로 모델링된다. y = Hx으로 나타내며, 여기서 H의 대각성분은 선형 예측 계수(LPC) 합성 필터의 주파수 응답 크기이며, H, y 및 x의 차원은 각각 K×K, K×1 및 K×1이다. K는 기본 주파수(ω0)에 의해 결정된다(K =π/ω0).
도 1을 참조하면, 합성 스펙트럼 포락선 생성부(100)는 본 발명에 따른 잔차 스펙트럼 포락선 양자화 과정을 거쳐 얻은 합성 스펙트럼 포락선()을 출력한다. 구체적으로, 제1 가산기(102)는 이후에 설명될 예측 양자화부(130)의 출력과 멜 스케일 이진 벡터 양자화부(140)의 출력을 가산하여 양자화된 잔차 스펙트럼 포락선()을 출력한다. 제1 곱셈기(104)는 제1 가산기(102)의 출력과 양자화된 LP 스펙트럼 포락선(H)을 곱하여 합성 스펙트럼 포락선()을 모델링한다().
비교부(110)는 양자화 과정을 거쳐 실제 얻은 합성 스펙트럼 포락선()과, 본래의 스펙트럼 포락선(y) 즉, 최종 목표치를 비교한다. 구체적으로, 제2 곱셈기(112) 및 제3 곱셈기(114)는 합성 스펙트럼 포락선()과 본래의 스펙트럼 포락선(y)에 각각 가중치(W)를 곱한다. 여기서, 가중치(W)는 공지된 지각 가중치법(perceptual weighting)에 의해 결정되는 값이다. 제2 가산기(116)는 가중치가 적용된 합성 스펙트럼 포락선()과 본래의 스펙트럼 포락선(y)의 차()를 구한다.
최소치 검출부(120)는 비교부(110)로 부터 순차적으로 얻어진 차들을 저장하고, 그들중에 최소치를 검출하여 그 최소치에 대응하는 코드북의 인덱스를 음성 복호화기로 전송한다. 실질적으로 최소치는 로 나타낼때, 다음 수학식 1을 이용하여 얻어진다.
여기서, 는 각각 예측 양자화부(130) 및 멜 스케일 이진 벡터 양자화부(140)의 출력을 나타낸다.
예측 양자화부(130)는 양자화된 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구한다. 구체적으로, 버퍼(132)는 합성 스펙트럼 포락선 생성부(100)로 부터 양자화된 잔차 스펙트럼 포락선을 입력하여 저장한다. 스펙트럼 와핑(warping)부(134)는 버퍼(132)에 저장된 이전 잔차 스펙트럼 포락선()의 합성된 잔차 벡터를 선형으로 와핑하여 예측 벡터()를 얻는다. 제4곱셈기(136)는 예측 벡터()와 예측 이득()을 곱하여 제1가산기(102)로 출력한다.
멜 스케일 이진 벡터 양자화부(140)는 양자화할 잔차 스펙트럼 포락선을 멜 스케일 이진 벡터 코드북(144)를 이용하여 선형 스케일 코드 벡터로 표현한다. 구체적으로, 멜 스케일-선형 변환기(142)는 잔차 스펙트럼 포락선에 대한 멜 스케일-선형 변환을 수행하여 선형 스케일 코드 벡터()를 얻는다. 제5곱셈기(146)는 선형 스케일 코드 벡터()와 코드 벡터의 이득()를 곱하여 제1가산기(102)로 출력한다.
도 2는 본 발명에 의한 가변차원 스펙트럼 진폭 양자화 방법을 설명하기 위한 플로우챠트이다. 도 2를 참조하여 도 1에 도시된 장치의 동작을 구체적으로 설명한다.
잔차 스펙트럼 포락선을 관찰해 보면, 스펙트럼은 프레임에서 프레임으로 천천히 변화한다. 즉, 과거 스펙트럼과 현재 스펙트럼이 천천히 전개하는 특성이 있으므로, 과거 스펙트럼으로 부터 현재 스펙트럼의 일정 부분을 예측할 수 있다. 잔차 스펙트럼 포락선 코딩과 관련한 예측 코딩은 LP 모델의 차수를 증가시키거나 잔차 스펙트럼 포락선을 직접 양자화하는 것보다 스펙트럼 진폭을 표현하는데 비트수를 감소시키는데 유용하다.
이러한 특성에 따라, 본 발명의 방법은 먼저, 양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구한다(제200단계). 다음 수학식 2을 이용하여 예측 벡터()를 구한다.
여기서, 의 k번째 요소를 나타내며,는 이전 잔차 스펙트럼 포락선을 나타낸다. k는 실제로 양자화할 잔차 스펙트럼 벡터의 해당 차원을, K는 벡터의 전체 차원을, 즉, 현재 하모닉 갯수를, 는 이전 하모닉 갯수를 각각 나타낸다. 하모닉 갯수가 이전 및 현재 프레임에서 서로 다르므로, 이전 하모닉을 현재 하모닉 갯수로 변환시키는 과정이 필요하다. 즉, K 차원의 예측 벡터()는 차원의 이전 잔차 스펙트럼 포락선의 합성된 잔차 벡터를 선형으로 와핑함으로서 얻어진다.
또한, 다음 수학식 3을 이용하여 예측 이득()을 구한다.
수학식 3은 를 최소로 즉, 를 0으로 설정하였을때 얻어진다. 이와 같이 구해진 예측 벡터()와 예측 이득()를 곱하여 최종적인 예측 양자화된 제1 잔차 스펙트럼 포락선을 얻는다.
다음에, 멜 스케일 이진 벡터 코드북을 이용하여 선형 스케일 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 구한다(제202단계). 본래의 스펙트럼 포락선과 LP 및 예측 포락선간의 차로서 정의된 잔차 스펙트럼 포락선은 스펙트럼 보상을 위해 고려된다. 본 발명은 가변 고 차원의 잔차 스펙트럼 포락선을 고정된 저 차원의 코드 벡터로 표현하는 멜 스케일 이진 벡터 코드북(Mel-scale binary codebook)을 제안한다. 멜 스케일은 음성 청각 특성에 따라 저주파수의 하모닉 성분이 고주파수의 그것보다 지각적으로 보다 중요하다는 점을 고려한 주파수축에 대한 비선형 주파수 스케일이다. 또한, 하모닉 성분을 멜 스케일 밴드로 나눈 다음에, 해당 밴드의 양자화를 위해서 이진 벡터를 이용한다.
멜-선형 변환에 의해 멜 스케일 코드 벡터(c)의 m번째 요소(c(m))로 부터 선형 스케일 코드 벡터()의 k번째 요소()가 얻어진다. 다음 수학식 4와 같이 나타낼 수 있다.
여기서, M은 멜 스케일 코드 벡터(c)의 차원을, k는 실제로 양자화할 잔차 스펙트럼 벡터의 해당 차원을, K는 벡터의 전체 차원을, 즉 현재 하모닉 갯수를 각각 나타낸다. K는 피치에 따라 가변한다. 예컨대, k가 1이면 은 c(0)이 되고, k가 K이면 는 c(M-1)이 된다. 코드 벡터(c)의 각 요소 c(0),c(1),...,c(M-1)는 이진수이다. m=0,1,...,M-1은 코드북에 대해 인덱스가 되며, 해당 값을 코드북에서 찾는다.
이러한 변환은 고정된 차원 코드 벡터로 부터 가변 차원 벡터를 발생한다. 코드 벡터의 고정 차원은 일반적으로 10 부터 70인 하모닉 수와 비교하여 예컨대, 10,12 또는 14로 비교적 작다. 따라서, 멜-선형 변환에 의해 M 차원의 고정된 코드 벡터(c)로 부터 가변하는 K 차원의 코드 벡터()가 발생할 수 있다.
수학식 4로 부터 구해진 c(0),...또는 c(M-1)에 대한 최적의 코드 벡터(c*)는 다음 수학식 5를 이용하여 구할 수 있다.
여기서, Ω는 멜 스케일 이진 벡터 코드북에서의 코드 벡터들의 집합을 나타내며, 2M개의 코드 벡터들로 구성된다. 또한, 최적의 코드 벡터의 최적 이득()은 다음 수학식 6과 같이 나타낼 수 있다. 수학식 4를 통해 얻은 선형 스케일 코드 벡터()와 코드 벡터의 이득()를 곱하여 최종적인 멜 스케일 이진 벡터 양자화된 잔차 스펙트럼 포락선을 얻는다.
다시 도 2를 참조하여, 제200단계와 제202단계로 부터 얻은 예측 양자화된 제1 잔차 스펙트럼 포락선과 코드 벡터로 표현된 제2 잔차 스펙트럼 포락선을 합하여 양자화된 잔차 스펙트럼 포락선을 생성한다(제204단계). 다음에, 양자화된 잔차 스펙트럼 포락선과 소정 방식으로 구해진 양자화된 LP 스펙트럼 포락선을 합하여 합성 스펙트럼 포락선을 구한다(제206단계). 여기서, LP 스펙트럼 포락선에 대한 양자화는 본 발명에서 고려하지 않는다.
다음에, 합성 스펙트럼 포락선을 본래의 스펙트럼 포락선과 비교한다(제208단계). 이러한 비교 과정이 양자화할 소정의 벡터수만큼 모두 수행되면, 소정의 벡터수를 단위로 얻어진 비교값들중에서 최소치를 검출한다(제210단계).
끝으로, 최소치에 대응하는 코드북의 인덱스를 부호화기로 전송한다(제212단계).
지금까지 설명한 본 발명의 방법에 따른 양자화에 있어서, 대부분의 계산량은 최적의 코드 벡터(c*)를 계산하는데 있다. 수학식 5를 이용하여 최적의 코드 벡터를 계산하고, 그 코드 벡터를 이진 코드북에서 찾는 폐쇄 루프 서치 방법은 실험적으로 대략 500wMOPS의 계산량을 요구하였다. 표준 음성 부호화기가 실용성이 있으려면, 20~30wMOPS가 되어야 한다. 따라서, 계산량을 현저히 줄일 수 있는 방법이 요구된다. 본 발명은 1wMOPS 이하로 계산량을 감소하는 이진 코드북에 대한 개방 루프 서치 방법을 다음과 같이 제시한다.
에 대해 이진 벡터 코드북에서 찾은 이진 코드값이 +1 또는 -1이면, 수학식 5는 다음 수학식 7과 같이 나타낼 수 있다.
여기서, 1≤k≤K에 대해 이고, 결국 는 일정하게 된다. 이로 부터 다음 수학식 8과 같이 다시 나타낼 수 있다.
수학식 8에서, 최대값은 다음 수학식 9에서와 같이 찾을 수 있다.
여기서, c(m)=±1이며, d(k)는 벡터 d의 k번째 요소이며, lm과 um은 멜 스케일 코드 벡터(c)의 m번째 요소에 대한 서브밴드의 상한 하모닉 및 하한 하모닉을 각각 나타낸다. 따라서, 수학식 9를 만족시키는 최적의 코드 벡터(c*)는 다시 다음 수학식 10과 같이 나타낼 수 있다.
여기서, c*(m)은 최적의 코드 벡터(c*)의 m번째 요소이다.
본 발명은 코드북을 훈련시키지 않고 수학식 10을 이용한 개방 루프 서치 방법에 의해 최적의 코드 벡터(c*)를 구함으로써 적은 메모리 용량과 매우 적은 계산량으로 스펙트럼 진폭 양자화를 수행한다.
도 3(a) 및 (b)는 본 발명과 종래의 방법에 따른 성능을 비교한 도면들이다. 성능 평가는 다음 수학식 11과 같이 정의된 스펙트럼 영역에서의 가중된 신호 대 잡음비(WSNR:Weighted Signal to noise ratio)에 근거하여 이루어졌다.
도 3(a)에서, LPC 차수에 따른 본 발명이 제안한 양자화 방식 (PMBVQ:Predictive and Mel-scale Binary Vector Quantization)은 종래의 LP 스펙트럼 모델링만을 이용한 양자화에 비해 높은 WSNR을 나타내었다.
여기서, 멜 스케일 코드 벡터의 차원은 M=12로 설정하였다. 또한, 도 3(b)에서, 피치에 대해 본 발명에 따른 양자화는 종래의 고차 LP 스펙트럼 모델링을 이용한 양자화에 비해 높은 WSNR을 나타내었다.
이상에서 설명한 바와 같이, 본 발명에 의한 스펙트럼 진폭 양자화 장치 및 그 방법은, 가변하는 스펙트럼의 차원을 예측 코드북을 이용하여 해결하고, 하모닉 성분을 멜 스케일 밴드로 나누어 예측 코드북 및 이진 코드북에 적용하여 잔차 스펙트럼 포락선을 효율적으로 양자화함으로써, 음질뿐만 아니라 계산량이나 메모리 요구량 측면에서 탁월한 성능을 보인다.
도 1은 본 발명에 의한 스펙트럼 진폭 양자화 장치의 블럭도이다.
도 2는 본 발명에 의한 스펙트럼 진폭 양자화 방법을 설명하기 위한 플로우챠트이다.
도 3(a) 및 (b)는 본 발명과 종래의 방법에 따른 성능을 비교한 도면들이다.

Claims (11)

  1. 저차 선형 예측 모델링과 잔차 스펙트럼 모델링을 이용한 선형 예측 스펙트럼 포락선 및 잔차 스펙트럼 포락선 양자화 방식에 따른 가변 차원 스펙트럼 진폭 양자화 장치에 있어서,
    양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 예측 양자화부;
    멜 스케일 이진 벡터 코드북으로부터 제공되는 양자화할 잔차 스펙트럼에 대한 멜 스케일 이진 벡터를 선형 스케일 코드 벡터로 표현하여 제2 잔차 스펙트럼 포락선을 구하는 멜 스케일 이진 벡터 양자화부;
    상기 예측 양자화부로부터 제공되는 제1 잔차 스펙트럼 포락선과 상기 멜 스케일 이진 벡터 양자화부로부터 제공되는 제2 잔차 스펙트럼 포락선을 합하여 양자화된 잔차 스펙트럼 포락선을 발생하고, 상기 양자화된 잔차 스펙트럼 포락선에 그에 대응하는 양자화된 선형 예측 스펙트럼 포락선을 곱하여 합성 스펙트럼 포락선을 모델링하는 합성 스펙트럼 포락선 생성부;
    상기 합성 스펙트럼 포락선을 본래의 스펙트럼 포락선과 비교하는 비교부; 및
    상기 비교부로 부터 순차 얻어진 비교값들중에 최소치를 검출하는 최소치 검출부를 포함하는 것을 특징으로 하는 스펙트럼 진폭 양자화 장치.
  2. 제1항에 있어서, 상기 예측 양자화부는,
    상기 합성 스펙트럼 포락선 생성부로 부터 제공되는 양자화된 잔차 스펙트럼 포락선을 입력하여 저장하는 버퍼;
    상기 버퍼에 저장된 이전 잔차 스펙트럼 포락선의 합성된 잔차 벡터를 선형으로 와핑하여 예측 벡터를 얻는 와핑부; 및
    상기 예측 벡터에 상기 제1 잔차 스펙트럼 포락선과 상기 본래의 스펙트럼 포락선간의 차이를 미분하고, 이 미분값을 '0'으로 설정하여 얻어지는 제1 예측이득을 곱하는 곱셈기를 포함하는 것을 특징으로 하는 스펙트럼 진폭 양자화 장치.
  3. 제1항에 있어서, 상기 멜 스케일 이진 벡터 양자화부는,
    상기 멜 스케일 이진 벡터 코드북으로부터 제공되는 상기 양자화할 잔차 스펙트럼에 대한 멜 스케일 이진 벡터를 멜-선형 변환하여 선형 스케일 코드 벡터를 얻는 멜-선형 변환기; 및
    상기 선형 스케일 코드 벡터에 상기 합성 스펙트럼 포락선과 상기 본래의 스펙트럼 포락선간의 차이를 미분하고, 이 미분값을 '0'으로 설정하여 얻어지는 제2 예측이득을 곱하는 곱셈기를 포함하며,
    상기 멜 스케일 이진 벡터 코드북은 가변 고 차원의 잔차 스펙트럼 포락선을 고정된 저 차원의 코드 벡터로 나타내는 것을 특징으로 하는 스펙트럼 진폭 양자화 장치.
  4. 가변 차원 스펙트럼 진폭 양자화 장치에 있어서 잔차 스펙트럼 포락선을 양자화하기 위하여,
    양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 예측 양자화부;
    멜 스케일 이진 벡터 코드북으로부터 제공되는 양자화할 잔차 스펙트럼에 대한 멜 스케일 이진 벡터를 선형 스케일 코드 벡터로 표현하여 제2 잔차 스펙트럼 포락선을 구하는 멜 스케일 이진 벡터 양자화부; 및
    상기 예측 양자화부의 출력과 상기 멜 스케일 이진 벡터 양자화부의 출력을 합하여 양자화된 잔차 스펙트럼 포락선을 발생하는 잔차 스펙트럼 포락선 양자화부를 포함하며,
    상기 멜 스케일 이진 벡터 코드북은 가변 고 차원의 잔차 스펙트럼 포락선을 고정된 저 차원의 코드 벡터로 나타내는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 장치.
  5. 가변 차원 스펙트럼 진폭 양자화 과정에 있어서 잔차 스펙트럼 포락선을 양자화하기 위하여,
    양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 제1 단계;
    멜 스케일 이진 벡터 코드북으로부터 제공되는 양자화할 잔차 스펙트럼에 대한 멜 스케일 이진 벡터를 선형 스케일 코드 벡터로 표현하여 제2 잔차 스펙트럼 포락선을 구하는 제2 단계; 및
    상기 제1 잔차 스펙트럼 포락선과 상기 제2 잔차 스펙트럼 포락선을 합하여 양자화된 잔차 스펙트럼 포락선을 생성하는 제3 단계를 포함하며,
    상기 멜 스케일 이진 벡터 코드북은 가변 고 차원의 잔차 스펙트럼 포락선을 고정된 저 차원의 코드 벡터로 나타내는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 방법.
  6. 제5항에 있어서, 상기 제1 단계는 다음 수학식을 이용하여 예측 벡터()를 구하며,
    [수학식]
    여기서, 의 k번째 요소를 나타내며,는 이전 잔차 스펙트럼 포락선을 나타내며, k는 실제로 양자화할 잔차 스펙트럼 벡터의 해당 차원을, K는 현재 하모닉 갯수를, 는 이전 하모닉 갯수를 각각 나타내는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 방법.
  7. 제6항에 있어서, 상기 제1 단계는 다음 수학식을 이용하여 예측 이득을 구하며,
    [수학식]
    여기서, H는 상기 제3 단계에서 생성된 양자화된 잔차 스펙트럼 포락선에 대응한 스펙트럼 포락선을, W는 가중치를 각각 나타내며, 상기 예측 벡터와 상기 예측 이득을 곱하여 최종적인 상기 예측 양자화된 제1 잔차 스펙트럼 포락선()을 구하는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 방법.
  8. 제5항에 있어서, 상기 제2 단계는 다음 수학식을 이용하여 상기 멜 스케일 이진 벡터 코드북을 참조하는 멜 스케일 코드 벡터(c)의 m번째 요소(c(m))로 부터 선형 스케일 코드 벡터(xc)의 k번째 요소()를 구하며,
    [수학식]
    여기서, M은 멜 스케일 코드 벡터(c)의 차원을, k는 실제로 양자화할 잔차 스펙트럼 벡터의 해당 차원을, K는 현재 하모닉 갯수를 각각 나타내는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 방법.
  9. 제8항에 있어서, 상기 제2 단계는 다음 수학식을 이용하여 상기 선형 스케일 코드 벡터의 이득()을 구하며,
    [수학식]
    여기서, 는 상기 제1 단계에서 구한 예측 양자화된 제1 잔차 스펙트럼 포락선이며, H는 상기 제3 단계에서 생성된 양자화된 잔차 스펙트럼 포락선에 대응한 선형 예측 스펙트럼 포락선을, W는 가중치를 각각 나타내며, 상기 선형 스케일 코드 벡터와 상기 코드 벡터의 이득을 곱하여 최종적인 상기 멜 스케일 이진 벡터 양자화된 잔차 스펙트럼 포락선()을 구하는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 방법.
  10. 제8항에 있어서, 상기 제2 단계에서 선형 스케일 코드 벡터(xc)의 k번째 요소()에 대해 상기 멜 스케일 이진 벡터 코드북에서 찾은 이진 코드값이 +1 또는 -1이면, 상기 멜 스케일 코드 벡터(c)에 대한 최적의 코드 벡터(c*)의 m번째 요소(c*(m))는 다음 수학식과 같이 나타내며,
    [수학식]
    여기서, M은 멜 스케일 코드 벡터(c)의 차원을, d(k)는 벡터 d의 k번째 요소로서, 벡터 로 정의되고, lm과 um은 멜 스케일 코드 벡터(c)의 m번째 요소에 대한 서브밴드의 상한 하모닉 및 하한 하모닉을 각각 나타내는 것을 특징으로 하는 잔차 스펙트럼 포락선 양자화 방법.
  11. 저차 선형 예측 모델링과 잔차 스펙트럼 모델링을 이용한 선형 예측 스펙트럼 포락선 및 잔차 스펙트럼 포락선 양자화 방식에 따른 가변 차원 스펙트럼 진폭 양자화 방법에 있어서,
    양자화된 이전 잔차 스펙트럼 포락선으로 부터 예측 양자화된 제1 잔차 스펙트럼 포락선을 구하는 제1 단계;
    멜 스케일 이진 벡터 코드북으로부터 제공되는 양자화할 잔차 스펙트럼에 대한 멜 스케일 이진 벡터를 선형 스케일 코드 벡터로 표현하여 제2 잔차 스펙트럼 포락선을 구하는 제2 단계;
    상기 제1 잔차 스펙트럼 포락선과 상기 제2 잔차 스펙트럼 포락선을 합하여 양자화된 잔차 스펙트럼 포락선을 생성하고, 상기 양자화된 잔차 스펙트럼 포락선에 그에 해당하는 양자화된 선형 예측 스펙트럼 포락선을 곱하여 합성 스펙트럼 포락선을 모델링하는 제3 단계;
    상기 합성 스펙트럼 포락선을 본래의 스펙트럼 포락선과 비교하는 제4 단계; 및
    상기 제4 단계로 부터 순차 얻어진 비교값들중에 최소치를 검출하는 단계를 포함하는 것을 특징으로 하는 스펙트럼 진폭 양자화 방법.
KR10-1999-0051066A 1999-11-17 1999-11-17 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치 KR100474833B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR10-1999-0051066A KR100474833B1 (ko) 1999-11-17 1999-11-17 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치
US09/584,107 US6606592B1 (en) 1999-11-17 2000-05-31 Variable dimension spectral magnitude quantization apparatus and method using predictive and mel-scale binary vector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-1999-0051066A KR100474833B1 (ko) 1999-11-17 1999-11-17 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20010047039A KR20010047039A (ko) 2001-06-15
KR100474833B1 true KR100474833B1 (ko) 2005-03-08

Family

ID=19620486

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-0051066A KR100474833B1 (ko) 1999-11-17 1999-11-17 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치

Country Status (2)

Country Link
US (1) US6606592B1 (ko)
KR (1) KR100474833B1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243295B2 (en) * 2001-06-12 2007-07-10 Intel Corporation Low complexity channel decoders
US7200561B2 (en) * 2001-08-23 2007-04-03 Nippon Telegraph And Telephone Corporation Digital signal coding and decoding methods and apparatuses and programs therefor
BRPI0517246A (pt) * 2004-10-28 2008-10-07 Matsushita Electric Ind Co Ltd aparelho de codificação escalável, aparelho de decodificação escalável e métodos para os mesmos
US20060172705A1 (en) * 2005-02-01 2006-08-03 Honeywell International Inc. Predictive modeling system for spectrum use
US7684784B2 (en) * 2005-03-24 2010-03-23 Honeywell International Inc. System for secure communications
US20070076001A1 (en) * 2005-09-30 2007-04-05 Brand Matthew E Method for selecting a low dimensional model from a set of low dimensional models representing high dimensional data based on the high dimensional data
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
GB2464447B (en) 2008-07-01 2011-02-23 Toshiba Res Europ Ltd Wireless communications apparatus

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
JP3707154B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 音声符号化方法及び装置

Also Published As

Publication number Publication date
KR20010047039A (ko) 2001-06-15
US6606592B1 (en) 2003-08-12

Similar Documents

Publication Publication Date Title
US10026411B2 (en) Speech encoding utilizing independent manipulation of signal and noise spectrum
US6721700B1 (en) Audio coding method and apparatus
US7171355B1 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
KR100889399B1 (ko) 스위치식예측양자화방법
JP3680380B2 (ja) 音声符号化方法及び装置
US7392179B2 (en) LPC vector quantization apparatus
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
EP0673014A2 (en) Acoustic signal transform coding method and decoding method
EP0772186A2 (en) Speech encoding method and apparatus
US6532443B1 (en) Reduced length infinite impulse response weighting
RU2002134175A (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
JPH08179796A (ja) 音声符号化方法
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
JP2003050600A (ja) 線スペクトル平方根を発生し符号化するための方法と装置
JP2645465B2 (ja) 低遅延低ビツトレート音声コーダ
KR100474833B1 (ko) 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치
EP0899720B1 (en) Quantization of linear prediction coefficients
US6377914B1 (en) Efficient quantization of speech spectral amplitudes based on optimal interpolation technique
US6098037A (en) Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP2808841B2 (ja) 音声符号化方式
Cho et al. Predictive and mel-scale binary vector quantization of variable dimension spectral magnitude
JPH0455899A (ja) 音声信号符号化方式
JPH09127997A (ja) 音声符号化方法及び装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080115

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee