KR100446595B1 - Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion - Google Patents

Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion Download PDF

Info

Publication number
KR100446595B1
KR100446595B1 KR1019970016087A KR19970016087A KR100446595B1 KR 100446595 B1 KR100446595 B1 KR 100446595B1 KR 1019970016087 A KR1019970016087 A KR 1019970016087A KR 19970016087 A KR19970016087 A KR 19970016087A KR 100446595 B1 KR100446595 B1 KR 100446595B1
Authority
KR
South Korea
Prior art keywords
line spectrum
index
spectrum frequency
distortion
codebook
Prior art date
Application number
KR1019970016087A
Other languages
Korean (ko)
Other versions
KR19980078533A (en
Inventor
조용덕
김홍국
김무영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1019970016087A priority Critical patent/KR100446595B1/en
Publication of KR19980078533A publication Critical patent/KR19980078533A/en
Application granted granted Critical
Publication of KR100446595B1 publication Critical patent/KR100446595B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE: A vector quantization method of a line spectrum frequency(LSF) using localization characteristics is provided, which adopts a spectral distortion measurement considering the localization characteristics of LSFs in order to provide further improved sound quality. CONSTITUTION: According to the method, a line spectrum frequency vector of P dimension is converted into a line spectrum frequency vector of (P-1) dimension, and minimum distortion and optimum code book index and code book index are initialized(300). A quantized line spectrum frequency vector of index k is searched in the code book using the code book index k(320). Localization restriction rate is determined(330), and distortion of the quantized line spectrum frequency of index k is measured. And minimum distortion is updated by replacing the minimum distortion with the distortion and replacing the optimum code book index with the index k(360). If the code book index k is larger than the size of the code book M, the optimum code book index is output(370), and otherwise, the code book index k is replaced with (k+1)(380).

Description

국소화 특성을 이용한 선스펙트럼 주파수의 벡터 양자화 방법Vector Quantization Method of Line Spectrum Frequency Using Localization Characteristics

본 발명은 선스펙트럼주파수(line spectrum frequencies, 이하 LSFs라 한다)를 양자화하는 벡터양자화 방법에 관한 것으로서, 특히 LSFs의 국소화(localization) 특성을 고려하여 스펙트럴 왜곡도(spectral distortion)를 측정하는 방식을 채택한 벡터양자화(vector quantization, VQ) 방법에 관한 것이다.The present invention relates to a vector quantization method for quantizing line spectrum frequencies (hereinafter referred to as LSFs), and in particular, a method of measuring spectral distortion in consideration of localization characteristics of LSFs. The vector quantization (VQ) method adopted.

디지탈음성통신 기술이 발전함에 따라, 음성을 보다 효율적으로 압축하는 기법이 요구되고 있다. 음성의 고압축을 위해서는 그 발생기관을 모델링하는 기법이 널리 쓰이는데, 음성통신에서는 그 모델의 파라메터들을 전송함으로써 음성통화를 한다. 음성발생기관은 성도(vocal track)와 성문(vocal cord)으로 구성되며, 성문에서 진동이 발생하여, 성도를 통과하면서 음이 발생한다. 일반적으로 성도는 주기적인 임펄스(impulse) 또는 랜덤(random) 신호로 표현되고, 성문은 선형예측(linear prediction)기법에 의한 예측 계수로서 표현된다. LSFs는 음성의 선형예측코딩(linear predictive coding, 이하에서 LPC라 한다)에 근거하여 얻을 수 있는데, 양자화를 위한 특성이 우수하여 음성코딩에서 널리 쓰이고 있다.As digital voice communication technology develops, a technique for compressing voices more efficiently is required. For high compression of voice, a technique of modeling the generator is widely used. In voice communication, a voice call is made by transmitting parameters of the model. The voice generating organ is composed of a vocal track and a vocal cord, and vibration occurs in the gate, so that sound is generated while passing through the vocal cord. In general, the saints are represented by periodic impulse or random signals, and the gates are represented as prediction coefficients by a linear prediction technique. LSFs can be obtained based on linear predictive coding (LPC), which is widely used in voice coding because of their excellent quantization characteristics.

LSFs 스펙트럴 모델 파라메터(spectral model parameter)의 양자화 과정에서는 스펙트럴 왜곡도에 대한 측정이 필요하다. 종래에는 상기 스펙트럴 왜곡도를 아래와 같은 유클리디안(Euclidean) 방식으로 측정하였다.Quantization of LSFs spectral model parameters requires measurement of spectral distortion. Conventionally, the spectral distortion was measured by the following Euclidean method.

[수학식 1][Equation 1]

Figure pat00002
Figure pat00002

여기서 ωip

Figure pat00021
는 각각 P차수의 i번째 LSF의 원래값과 양자화된 값이다.Where ωi p and
Figure pat00021
Are the quantized and original values of the i th LSF of P order, respectively.

음성신호는 스펙트럴 엔벨로프(spectral envelop) 상에서 스펙트럴 밸리(vally)부보다는 피크(peak) 또는 포만트(formant) 쪽에 중요한 정보가 있다고 널리 알려져 있다. 이에 근거하여, 가중화된(weighted) 유클리디안 측정방식이 도입되었으며, 인지적으로 이 방식에 의하여 음질이 개선된다는 것은 공지의 사실이다. 가중화된 유클리디안 측정 방식은 아래와 같다.It is widely known that voice signals have important information on the peak or formant rather than the spectral valley portion on the spectral envelope. On this basis, it is well known that weighted Euclidean measurement schemes have been introduced, and that the sound quality is improved cognitively by this approach. The weighted Euclidean measurement method is as follows.

[수학식 2][Equation 2]

Figure pat00003
Figure pat00003

여기서 wi는 i번째 LSF의 가중치이다.Where wi is the weight of the i th LSF.

음성코딩에서 스펙트럴 엔벨로프를 표현할 때, LPC, PARCOR(PARtial CORrelation), LAR(Log Area Ratio)에 비하여 LSF를 주로 사용하는 이유는 LSF의 안터레이싱(interlacing) 특성때문이다. 즉, P차의 LSFs들 간에는 다음과 같은 특성이 있다.When expressing the spectral envelope in voice coding, the reason for using LSF as compared to LPC, PARCOR (PARtial CORrelation) and LAR (Log Area Ratio) is because of the interlacing characteristics of LSF. That is, PSF LSFs have the following characteristics.

[수학식 3][Equation 3]

Figure pat00004
Figure pat00004

최근에는 LSFs의 국소화라는 새로운 특성이 발견되었다. 이는 P차와 P-1차 간의 LSFs간에도 인터레이싱 특성이 존재한다는 것이다. 즉,Recently, a new property has been discovered called localization of LSFs. This means that there is an interlacing characteristic between LSFs between P and P-1 orders. In other words,

[수학식 4][Equation 4]

Figure pat00005
Figure pat00005

그런데, 기존의 유클리디안 방식 또는 가중화된 유클리디안 방식에서는 상기한 바와 같은 LSFs의 국소화 특성을 고려하지 못한 문제점이 있다.However, in the existing Euclidean or weighted Euclidean method, there is a problem that the localization characteristics of the LSFs as described above are not considered.

본 발명은 상기의 문제점을 해결하기 위하여 창작된 것으로서, 보다 개선된 음질을 제공하기 위하여 LSFs를 양자할 때 LSFs의 국소화 특성을 고려한 스펙트럴왜곡도 측정방식을 채택한 벡터양자화 방법을 제공함을 그 목적으로 한다.The present invention was made to solve the above problems, and to provide a vector quantization method adopting the spectral distortion measurement method in consideration of the localization characteristics of LSFs when quantizing the LSFs to provide more improved sound quality do.

도 1은 본 발명에 의한 음성신호의 처리과정을 도시한 것이다.1 shows a process of processing a voice signal according to the present invention.

도 2는 도 1에 도시된 선스펙트럼 주파수 벡터 양자화 과정에 대한 블록도이다.FIG. 2 is a block diagram illustrating the line spectrum frequency vector quantization process shown in FIG. 1.

도 3은 본 발명에 의한 선스펙트럼 주파수의 벡터 양자화 과정을 도시한 흐름도이다.3 is a flowchart illustrating a vector quantization process of line spectrum frequencies according to the present invention.

도 4a 내지 도 4c는 종래방식과 본 발명의 스펙트랄 엔벨로프 비교에 대한 실험결과를 도시한 것이다.4A to 4C show experimental results for comparing the spectral envelope of the conventional method and the present invention.

상기의 목적을 달성하기 위한 본 발명의 구성은 다음과 같다.The configuration of the present invention for achieving the above object is as follows.

P차원의 선스펙트럼 주파수 벡터 ωP=(ω1 P2 P,…,ωP P)를 코드북을 사용하여 벡터양자화하는 방법은 상기 P차원의 선스펙트럼 주파수 벡터를 P-1차원의 선스펙트럼 주파수 벡터ωP-1=(ω1 P-12 P-1,…ωP-1 P-1)로 변환하고, 최소 왜곡도Dw,1 *, 최적 코드북 색인 k*및 코드북 색인 K를 초기화하는 초기화단계: 상기 코드북 색인 k 를 사용하여 상기 코드북에서 색인이 k인 양자화된 선스펙트럼 주파수 벡터

Figure pat00022
Figure pat00023
를 찾는 코드북 탐색단계; 상기 P-1차원의 선스펙트럼 주파수 벡터와 상기 색인이 K인 양자화된 선스펙트럼 주파수 벡터 내의 모든 원소 ωi P-1과 ωi P(k) (여기에서 i의 값은 1에서 P까지의 값)간에 ,A method of vector quantizing a P-dimensional line spectrum frequency vector ω P = (ω 1 P , ω 2 P ,..., Ω P P ) using a codebook includes a P-dimensional line spectrum frequency vector. Convert to a spectral frequency vector ω P-1 = (ω 1 P-1 , ω 2 P-1 ,… ω P-1 P-1 ), with minimum distortion D w, 1 * , optimal codebook index k * and codebook Initialization step of initializing index K: Quantized line spectrum frequency vector having index k in the codebook using the codebook index k
Figure pat00022
Figure pat00023
Codebook searching step of finding; All elements ω i P-1 and ω i P (k) in the P-1 dimensional line spectrum frequency vector and the indexed K quantized line spectrum frequency vector, where i is a value from 1 to P )

Figure pat00006
Figure pat00006

에 따른 국소화 특성을 만족하는 경우에는 국소화 제약률 α에 1보다 작고 0보다 큰 소정의 값을 할당하고, 만족하지 않는 경우에는 국소화 제약률 α에 1을 할당하는 국소화 제약률 결정단계; 상기 색인이 k인 양자화된 선스펙트럼 주파수의왜곡도를 Dw,l k이라 할 때,A localization constraint determining step of allocating a predetermined value smaller than 1 and greater than 0 to the localization constraint α when the localization characteristic is satisfied, and assigning 1 to the localization constraint α if not satisfied; When the distortion of the quantized line spectrum frequency whose index is k is D w, l k ,

Figure pat00007
Figure pat00007

(여기에서 P는 선스펙트럼 주파수의 차원수, α는 선스펙트럼 주파수의 국소화 제약률, wi는 i번째 선스펙트럼 주파수의 가중치, ωi P는 P차원 선스펙트럼 주파수의 i번째 원소,

Figure pat00024
는 색인이 k인 양자화된 선스펙트럼 주파수 벡터의 i번째 원소)에 의해 Dw,l k를 구하는 왜곡도 측정단계; 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도 Dw,l k가 상기 최소 왜곡도 Dw,l *보다 작은 경우에는 상기 Dw,l *를 상기 Dw,l k로 치환하고, 상기 최적 코드북 색인 k*를 상기 k로 치환하는 최소 왜곡도 갱신 단계, 상기 코드북 색인 k가 코드북의 크기 M보다 큰 경우에는 상기 최적 코드북 색인 k*를 출력하고, 같거나 작은 경우에는 상기 코드북 색인 k를 k+1로 치환하고 상기 코드북 탐색단계를 반복하는 반복 여부 결정단계를 포함하는 것을 특징으로 한다.Where P is the number of dimensions of the line spectrum frequency, α is the localization constraint of the line spectrum frequency, w i is the weight of the i-th line spectrum frequency, ω i P is the i-th element of the P-dimensional line spectrum frequency,
Figure pat00024
Is a distortion measurement step of obtaining D w, l k by the i th element of the quantized line spectrum frequency vector whose index is k; The case where the index is a distortion of the quantized line spectral frequency is also D w, l k the minimum distortion is less than D w, l * k is the substitution of the D w, l * in the D w, l k, If the optimum codebook index k * a minimum skewness updating step, the codebook index k which is substituted by the k is greater than the size M of the code book is equal to output the optimal codebook index k *, and or small, the codebook index k and repeating the codebook search step by substituting with k + 1.

본 발명은 LSFs의 국소화 특성을 이용하여 스펙트럴 엔벨로프의 양자화시 왜곡도 측정에 이용하는 것이다. 즉, 원음성의 P차와 P-1차 LSFs간에 인터레이싱 특성이 존재하듯이, 양자화한 P차의 LSFs와 원음성의 P-1차 LSFs간에도 인터레이싱특성이 유지되도록 LSFs 양자화 과정에 추가하는 것이다. 즉,The present invention uses the localization characteristics of LSFs to measure distortion in quantization of spectral envelope. That is, as the interlacing characteristic exists between the P-order LSFs of the original sound and the P-1 order LSFs, the interlacing characteristic is maintained between the quantized P-order LSFs and the P-1 order LSFs of the original sound. will be. In other words,

[수학식 5][Equation 5]

Figure pat00008
Figure pat00008

이를 적용하기 위하여 다음과 같은 왜곡도 측정 방식을 도입하였다.To apply this, the following distortion measurement method was introduced.

[수학식 6][Equation 6]

Figure pat00009
Figure pat00009

α는 ωi P

Figure pat00025
간에 수학식 5에 따른 국소화 특성 만족여부에 따라 다른 값을 갖는데, 국소화된 경우에는 1보다 작고 0보다 큰 소정의 값(0.8 정도의 값이 적절하다)을, 그렇지 않은 경우에는 1의 값을 갖는다.α is equal to ω i P
Figure pat00025
It has a different value depending on whether localization characteristics are satisfied according to Equation 5, and if it is localized, it has a predetermined value smaller than 1 and larger than 0 (a value of about 0.8 is appropriate). .

본 방식을 사용하여 LSFs의 벡터양자화를 할 수 있다. 벡터양자화는 LSFs 후보들 중에서 수학식 6을 최소화하는 LSF의 VQ 색인 k*를 찾는 과정으로서 다음과 같이 표현된다.This method allows vector quantization of LSFs. Vector quantization is a process of finding the VQ index k * of the LSF that minimizes Equation 6 among the LSFs candidates.

[수학식 7][Equation 7]

Figure pat00010
Figure pat00010

여기서

Figure pat00026
(k)는 P차 LSF코드북의 k번째 코드 원소의 i번째 값이고, M은 코드북 크기이다.here
Figure pat00026
(k) is the i th value of the k th code element of the P th order LSF codebook, and M is the codebook size.

이하에서 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 의한 음성신호의 처리과정을 도시한 것이다.1 shows a process of processing a voice signal according to the present invention.

먼저 입력음성은 LPC 계수로 유도되고(100단계), LSF는 LPC로부터 변환된다(110단계). 상기한 바와 같이 변환된 LSF에 의해 국소화 특성을 이용한 벡터양자화기를 사용하여 최적 코드북 색인이 색출되고(120단계), 상기 색출된 색인이 전송 과정을 통해 전송된다.First, the input voice is derived from the LPC coefficient (step 100), and the LSF is converted from the LPC (step 110). The optimal codebook index is retrieved using the vector quantizer using the localization characteristic by the transformed LSF as described above (step 120), and the retrieved index is transmitted through a transmission process.

도 2는 도 1에 도시된 선스펙트럼 주파수 벡터 양자화 과정에 대한 블록도이다. 입력 LSF ωP(P차원의 LSFs)를 LSF 벡터 코드북(220) 내의 각 양자화된 LSF와의 왜곡도를 차례로 측정하여(200), 가장 작은 왜곡도를 가진 양자화된 LSF의 색인을 찾아(210) 복호화단계로 전달하게 된다.FIG. 2 is a block diagram illustrating the line spectrum frequency vector quantization process shown in FIG. 1. The input LSF ω P (P-dimensional LSFs) is sequentially measured in a distortion degree with each quantized LSF in the LSF vector codebook 220 (200), and the index of the quantized LSF having the smallest distortion is found (210). Will pass to the stage.

도 3은 본 발명에 의한 선스펙트럼 주파수의 벡터 양자화 과정을 도시한 흐름도이다.3 is a flowchart illustrating a vector quantization process of line spectrum frequencies according to the present invention.

국소화 특성을 이용한 벡터 양자화 과정은 LSFs를 벡터코드북 색인으로 변환하는 과정이다. 먼저 최소왜곡도, 최적 코드북 색인 k*및 코드북 색인 k를 각각 ∞, 1, 1로서 초기화한다(300단계). 그리고, 원 음성의 P차의 LSF를 P-1차의 LSF로 변환한다(310단계).The vector quantization process using localization is a process of converting LSFs into vector codebook indexes. First, the minimum distortion degree, the optimal codebook index k * and the codebook index k are initialized as ∞, 1, and 1, respectively (step 300). In step 310, the LSF of the P-order of the original audio is converted into the L-SF of the P-1 order.

그 다음, 코드북 색인 k를 사용하여 코드북(220)에서 색인이 k인 양자화된 LSF를 찾는다(320단계).Next, the codebook index k is used to find a quantized LSF whose index is k in the codebook 220 (step 320).

그 다음, 310단계에서 변환된 상기 P-1차원의 선스펙트럼 주파수 벡터와 320단계에서 찾은 상기 색인이 K인 양자화된 선스펙트럼 주파수 벡터 내의 모든 원소ωi P-1

Figure pat00027
(k) (여기에서 i의 값은 1에서 P까지의 값)간에Then, all elements ω i P-1 in the P-1-dimensional line spectrum frequency vector transformed in step 310 and the quantized line spectrum frequency vector whose index is found in step 320 are k and
Figure pat00027
(k) (where i is a value from 1 to P)

Figure pat00011
Figure pat00011

에 따른 국소화 특성을 만족하는 경우에는 국소화 제약률 α에 1보다 작고 0보다 큰 소정의 값을 할당하고, 만족하지 않는 경우에는 국소화 제약률 α에 1을 할당한다(330단계). 즉, 종래의 벡터양자화 과정에서는 LSFs의 국소화특성을 고려하지 않기 때문에 수학식 6에 있어서 국소화제약율 α의 값이 '1'이 된다. 그러나, 본원 발명에서는 LSFs의 국소화특성을 고려하기 때문에 수학식 6에 있어서 LSFs의 국소화특성 만족여부에 따라서 국소화제약율 α의 값이 서로 다른 값을 가지게 된다. 즉, 본원 발명에서는 왜곡도 측정시 국소화 제약율을 수학식 5와 같은 국소화특성을 만족하지 않는 경우 1로, 국소화특성을 만족하는 경우 1보다 작고 0보다 큰 소정의 값, 예를 들면 0.8로 설정하게 된다.If the localization characteristic is satisfied, a predetermined value smaller than 1 and greater than 0 is assigned to the localization constraint α, and if it is not satisfied, 1 is assigned to the localization constraint α (step 330). That is, in the conventional vector quantization process, since the localization characteristics of the LSFs are not taken into consideration, the value of the localization drug rate α in Equation 6 becomes '1'. However, in the present invention, since the localization characteristics of the LSFs are taken into consideration, the values of the localizing agent ratio α are different according to whether localization characteristics of the LSFs are satisfied in Equation 6. That is, in the present invention, when the distortion is measured, the localization constraint is set to 1 when not satisfying the localization characteristic as shown in Equation 5, and to a predetermined value smaller than 1 and greater than 0, for example, 0.8 when the localization characteristic is satisfied. Done.

그 다음, 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도를Then, the distortion degree of the quantized line spectrum frequency whose index is k

Figure pat00012
Figure pat00012

에 의해 구한다(340단계). 즉, 색인이 k인 양자화된 LSF의 왜곡도는 국소화특성을 만족하는 경우가 국소화특성을 만족하지 않는 경우보다 상대적으로 낮은 값으로 측정된다.Obtained by (step 340). That is, the distortion of the quantized LSF whose index is k is measured to be relatively lower than the case where the localization characteristic does not satisfy the localization characteristic.

350 단계에서는 상기 340 단계에서 측정된 왜곡도(Dw,l k)를 300 단계에서 초기화시킨 최소 왜곡도(Dw,l *)와 비교한다. 350 단계의 비교결과, 측정된 왜곡도(Dw,l k)가 최소 왜곡도(Dw,l *)보다 작은 경우에는 360 단계에서 상기 최소 왜곡도(Dw,l *)를 상기 측정된 왜곡도(Dw,l k)로 치환한 다음, 상기 최적 코드북 색인 k*를 상기 현재의 색인 k로 치환한다. 350 단계의 비교결과, 측정된 왜곡도(Dw,l k)가 최소 왜곡도(Dw,l *)보다 크거나 같은 경우에는 370 단계로 바로 이행한다.In step 350, the distortion degree D w, l k measured in step 340 is compared with the minimum distortion degree D w, l * initialized in step 300. The in step 350 the result of comparison, the measured distortion (D w, l k) is the minimum distortion (D w, l *) is smaller than is the measurement of the minimum distortion (D w, l *) in step 360 Substitute the distortion degree D w, l k and then replace the optimal codebook index k * with the current index k. As a result of the comparison in step 350, if the measured distortion degree D w, l k is greater than or equal to the minimum distortion degree D w, l * , the process immediately proceeds to step 370.

코드북 색인 k가 코드북의 크기 M과 같거나 M보다 작은 경우에는 상기 코드북 색인 k를 k+l로 치환하고 320단계에서 360단계의 과정을 반복하고, M보다 큰 경우에는 상기 최적 코드북 색인 k*를 복호기에 전달하게 된다(370-380단계).If the codebook index k is less than or equal to the size M of the codebook, replace the codebook index k with k + l and repeat the process from step 320 to step 360.If the codebook index k is larger than M, the optimal codebook index k * is substituted. It is delivered to the decoder (steps 370-380).

도 4a 내지 도 4c는 종래방식과 본 발명의 스펙트랄 엔벨로프 비교에 대한 실험결과를 도시한 것이다. 도 4a는 원 음성파형을 나타내고, 도 4b는 종래의 양자화 방법에 의한 스펙트럴 엔벨로프의 비교를 나타내고, 도 4c는 본 발명의 양자화 방법에 의한 스펙트럴 엔벨로프 비교를 나타낸다. 상기 도면을 비교하여 보면, 종래방식의 스펙트럼은 음성의 중요정보를 갖고 있다고 알려진 첫번째 포만트(F1)와 두 번째 포만트(F2)에서 스펙트럼의 매칭이 잘 되지 않음을 확인할 수 있다. 이에 반하여, 본 발명의 방식을 이용할 경우 스펙트럼의 매칭이 기존 방식에 비하여 개선됨을 알 수 있다.4A to 4C show experimental results for comparing the spectral envelope of the conventional method and the present invention. 4A shows the original speech waveform, FIG. 4B shows the comparison of the spectral envelope by the conventional quantization method, and FIG. 4C shows the comparison of the spectral envelope by the quantization method of the present invention. Comparing the drawings, it can be seen that the spectrum of the conventional method is not well matched in the first formant F1 and the second formant F2 known to have important information of speech. On the contrary, it can be seen that when the method of the present invention is used, the matching of the spectrum is improved compared to the existing method.

본 발명에 의하면, LSFs를 양자화할 때 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도를 LSFs의 국소화 특성을 반족하는 경우와 만족하지 않는 경우로 구분하여 산출하고, 산출된 왜곡도를 이용하여 최적 코드북 색인을 탐색함으로써, 스펙트럼의 매칭이 기존의 방식에 의한 것에 비하여 개선되어 더욱 양질의 음질을 제공할 수 있다.According to the present invention, when quantizing the LSFs, the distortion of the quantized line spectrum frequency whose index is k is calculated by dividing it into a case where the localization characteristic of the LSFs is not satisfied and a case where it is not satisfied. By searching the codebook index, the matching of the spectrum can be improved as compared to conventional methods to provide better sound quality.

Claims (1)

P차원의 선스펙트럼 주파수 벡터 ωP=(ω1 P2 P,…,ωP P)를 코드북을 사용하여 벡터양자화하는 방법에 있어서,In the method of vector quantizing a line spectral frequency vector ω P = (ω 1 P , ω 2 P ,..., Ω P P ) in a P-dimensional manner, 상기 P차원의 선스펙트럼 주파수 벡터를 P-1차원의 선스펙트럼 주파수 벡터 ωP-1=(ω1 P-12 P-1,…,ωP-1 P-1)로 변환하고, 최소 왜곡도Dw,l *, 최적 코드북 색인 k*및 코드북 색인 K를 초기화하는 초기화단계;Convert the P-dimensional line spectrum frequency vector into a P-1-dimensional line spectrum frequency vector ω P-1 = (ω 1 P-1 , ω 2 P-1 , ..., ω P-1 P-1 ), An initialization step of initializing the minimum distortion degree D w, l * , the optimal codebook index k * and the codebook index K; 상기 코드북 색인 k를 사용하여 상기 코드북에서 색인이 k인 양자화된 선스펙트럼 주파수 벡터
Figure pat00028
를 찾는 코드북 탐색단계;
Quantized line spectrum frequency vector with index k in the codebook using the codebook index k
Figure pat00028
Codebook searching step of finding;
상기 P-1차원의 선스펙트럼 주파수 벡터와 상기 색인이 K인 양자화된 선스펙트럼 주파수 벡터 내의 모든 원소 ωi P-1
Figure pat00029
(여기에서 i의 값은 1에서 P까지의 값)간에 ,
All elements ω i P-1 in the spectralized line spectrum frequency vector of the P-1 dimension and the quantized line spectrum frequency vector whose index is K;
Figure pat00029
(Where i is a value from 1 to P),
Figure pat00013
Figure pat00013
에 따른 국소화 특성을 만족하는 경우에는 국소화 제약률 α에 1보다 작고 0보다 큰 소정의 값을 할당하고, 만족하지 않는 경우에는 국소화 제약률 α에 1을 할당하는 국소화 제약률 결정단계;A localization constraint determining step of allocating a predetermined value smaller than 1 and greater than 0 to the localization constraint α when the localization characteristic is satisfied, and assigning 1 to the localization constraint α if not satisfied; 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도를 Dw,l k이라 할 때,When the distortion of the quantized line spectrum frequency whose index is k is D w, l k ,
Figure pat00014
Figure pat00014
(여기에서 P는 선스펙트럼 주파수의 차원수, α는 선스펙트럼 주파수의 국소화 제약률, Wi는 i번째 선스펙트럼 주파수의 가중치, ωi P는 P차원 선스펙트럼 주파수의 i번째 원소,
Figure pat00030
는 색인이 k인 양자화된 선스펙트럼 주파수 벡터의 i번째 원소)에 의해 Dw,l k를 구하는 왜곡도 측정단계;
Where P is the number of dimensions of the line spectrum frequency, α is the localization constraint of the line spectrum frequency, W i is the weight of the i-th line spectrum frequency, ω i P is the i-th element of the P-dimensional line spectrum frequency,
Figure pat00030
Is a distortion measurement step of obtaining D w, l k by the i th element of the quantized line spectrum frequency vector whose index is k;
상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도 Dw,l k가 상기 최소 왜곡도 Dw,l *보다 작은 경우에는 상기 Dw,l *를 상기 Dw,l k로 치환하고, 상기 최적 코드북 색인 k*를 상기 k로 치환하는 최소 왜곡도 갱신단계;The case where the index is a distortion of the quantized line spectral frequency is also D w, l k the minimum distortion is less than D w, l * k is the substitution of the D w, l * in the D w, l k, A minimum distortion updating step of replacing an optimal codebook index k * with the k; 상기 코드북 색인 k가 코드북의 크기 M보다 큰 경우에는 상기 최적 코드북 색인 k*를 출력하고, 같거나 작은 경우에는 상기 코드북 색인 k를 k+l로 치환하고 상기 코드북 탐색단계를 반복하는 반복 여부 결정단계를 포함하는 것을 특징으로 하는 국소화 특성을 이용한 선스펙트럼 주파수의 벡터양자화 방법.If the codebook index k is larger than the size M of the codebook, the optimal codebook index k * is output. If the codebook index k is the same or smaller, the codebook index k is replaced with k + l, and the codebook search step is repeated. Vector quantization method of the line spectrum frequency using a localization characteristic comprising a.
KR1019970016087A 1997-04-29 1997-04-29 Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion KR100446595B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970016087A KR100446595B1 (en) 1997-04-29 1997-04-29 Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970016087A KR100446595B1 (en) 1997-04-29 1997-04-29 Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion

Publications (2)

Publication Number Publication Date
KR19980078533A KR19980078533A (en) 1998-11-16
KR100446595B1 true KR100446595B1 (en) 2005-02-07

Family

ID=37362393

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970016087A KR100446595B1 (en) 1997-04-29 1997-04-29 Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion

Country Status (1)

Country Link
KR (1) KR100446595B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100712409B1 (en) * 2005-07-28 2007-04-27 한국전자통신연구원 Method for dimension conversion of vector
WO2011087333A2 (en) * 2010-01-15 2011-07-21 엘지전자 주식회사 Method and apparatus for processing an audio signal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61262378A (en) * 1985-05-16 1986-11-20 Mitsubishi Electric Corp Vector quantization device
KR950022304A (en) * 1993-12-18 1995-07-28 완다 케이. 덴슨-로우 Quantization Method and Quantizer of Line Spectrum Frequency Vector
JPH08101700A (en) * 1994-09-30 1996-04-16 Toshiba Corp Vector quantization device
KR960036756A (en) * 1995-03-28 1996-10-28 배순훈 Image signal coding apparatus using vector quantization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61262378A (en) * 1985-05-16 1986-11-20 Mitsubishi Electric Corp Vector quantization device
KR950022304A (en) * 1993-12-18 1995-07-28 완다 케이. 덴슨-로우 Quantization Method and Quantizer of Line Spectrum Frequency Vector
JPH08101700A (en) * 1994-09-30 1996-04-16 Toshiba Corp Vector quantization device
KR960036756A (en) * 1995-03-28 1996-10-28 배순훈 Image signal coding apparatus using vector quantization

Also Published As

Publication number Publication date
KR19980078533A (en) 1998-11-16

Similar Documents

Publication Publication Date Title
Buzo et al. Speech coding based upon vector quantization
US6704705B1 (en) Perceptual audio coding
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US6269333B1 (en) Codebook population using centroid pairs
KR100566713B1 (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
EP0747882A2 (en) Pitch delay modification during frame erasures
JP3446764B2 (en) Speech synthesis system and speech synthesis server
JPH0869299A (en) Voice coding method, voice decoding method and voice coding/decoding method
EP0186763B1 (en) Method of and device for speech signal coding and decoding by vector quantization techniques
KR100322706B1 (en) Encoding and decoding method of linear predictive coding coefficient
US5651026A (en) Robust vector quantization of line spectral frequencies
Soong et al. Optimal quantization of LSP parameters using delayed decisions
Chamberlain A 600 bps MELP vocoder for use on HF channels
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
Gibson et al. Fractional rate multitree speech coding
US5806027A (en) Variable framerate parameter encoding
US5822721A (en) Method and apparatus for fractal-excited linear predictive coding of digital signals
Hagen Spectral quantization of cepstral coefficients
KR100446595B1 (en) Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
Bouzid et al. Optimized trellis coded vector quantization of LSF parameters, application to the 4.8 kbps FS1016 speech coder
KR960015861B1 (en) Quantizer & quantizing method of linear spectrum frequency vector
Ozaydin et al. A 1200 bps speech coder with LSF matrix quantization
KR100327476B1 (en) Vector quantization method of split linear spectrum pair
Srinonchat New technique to reduce bit rate of LPC-10 speech coder

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080731

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee