KR19980078533A - Vector Quantization Method of Line Spectrum Frequency Using Localization Characteristics - Google Patents
Vector Quantization Method of Line Spectrum Frequency Using Localization Characteristics Download PDFInfo
- Publication number
- KR19980078533A KR19980078533A KR1019970016087A KR19970016087A KR19980078533A KR 19980078533 A KR19980078533 A KR 19980078533A KR 1019970016087 A KR1019970016087 A KR 1019970016087A KR 19970016087 A KR19970016087 A KR 19970016087A KR 19980078533 A KR19980078533 A KR 19980078533A
- Authority
- KR
- South Korea
- Prior art keywords
- codebook
- line spectrum
- spectrum frequency
- index
- codebook index
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000004807 localization Effects 0.000 title claims abstract description 29
- 238000013139 quantization Methods 0.000 title claims abstract description 19
- 230000003595 spectral effect Effects 0.000 claims abstract description 16
- 238000005259 measurement Methods 0.000 claims description 3
- 238000007796 conventional method Methods 0.000 abstract description 5
- 238000000691 measurement method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 LSFs의 국소화 특성을 고려하여 스펙트럴 왜곡도를 측정하는 방식을 채택한 벡터양자화 방법에 관한 것으로서, P차원의 LSF 벡터를 코드북을 사용하여 벡터양자화하는 방법은 P차원의 LSF 벡터를 P-1차원의 LSF 벡터로 변환하고, 최소 왜곡도, 최적 코드북 색인 및 코드북 색인을 초기화하는 초기화단계; 코드북 색인을 사용하여 코드북에서 양자화된 LSF 벡터를 찾는 코드북 탐색단계; P-1차원의 LSF 벡터와 양자화된 LSF 벡터 내의 모든 원소간에 국소화 특성에 따른 국소화 제약률 α를 구하는 국소화 제약률 결정단계; 양자화된 LSF의 왜곡도를The present invention relates to a vector quantization method adopting a method of measuring spectral distortion in consideration of localization characteristics of LSFs. Convert to one-dimensional LSF vector, minimum distortion, optimal codebook index And an initialization step of initializing the codebook index. Codebook searching for finding quantized LSF vectors in the codebook using the codebook index; A localization constraint determining step of obtaining a localization constraint α according to localization characteristics between the P-dimensional LSF vector and all elements in the quantized LSF vector; The distortion of the quantized LSF
에 의해 구하는 왜곡도 측정단계; 양자화된 LSF의 왜곡도가 최소 왜곡도보다 작은 경우에는 최소 왜곡도를 양자화된 LSF의 왜곡도로 치환하고, 최적 코드북 색인을 코드북 색인으로 치환하는 최소 왜곡도 갱신단계; 코드북 색인이 코드북의 크기보다 큰 경우에는 최적 코드북 색인을 출력하고, 같거나 작은 경우에는 코드북 색인을 그 값에 1을 더한 값으로 두고 코드북 탐색단계 이하를 반복하는 반복 여부 결정단계를 포함하는 것을 특징으로 한다.A distortion degree measuring step obtained by; If the distortion of the quantized LSF is less than the minimum distortion, then the minimum distortion A minimum distortion updating step of substituting with a distortion degree of quantized LSF and substituting an optimal codebook index with a codebook index; And outputting an optimal codebook index when the codebook index is larger than the size of the codebook, and determining whether to repeat the codebook search step or less, if the codebook index is equal to or smaller than 1 and adds 1 to the value. It is done.
본 발명에 의하면, LSFs를 양자할 때 LSFs의 국소화 특성을 고려함으로써 스펙트럼의 매칭이 기존의 방식에 의한 것에 비하여 개선되어 더욱 양질의 음질을 제공할 수 있다.According to the present invention, when the LSFs are quantized, the localization characteristics of the LSFs are taken into consideration, so that the matching of the spectrum can be improved as compared with the conventional method, thereby providing a higher quality sound.
Description
본 발명은 선스펙트럼주파수(line spectrum frequencies, 이하 LSFs라 한다)를 양자화하는 벡터양자화 방법에 관한 것으로서, 특히 LSFs의 국소화(localization) 특성을 고려하여 스펙트럴 왜곡도(spectral distortion)를 측정하는 방식을 채택한 벡터양자화(vector quantization, VQ) 방법에 관한 것이다.The present invention relates to a vector quantization method for quantizing line spectrum frequencies (hereinafter referred to as LSFs), and in particular, a method of measuring spectral distortion in consideration of localization characteristics of LSFs. The vector quantization (VQ) method adopted.
디지탈음성통신 기술이 발전함에 따라, 음성을 보다 효율적으로 압축하는 기법이 요구되고 있다. 음성의 고압축을 위해서는 그 발생기관을 모델링하는 기법이 널리 쓰이는데, 음성통신에서는 그 모델의 파라메터들을 전송함으로써 음성통화를 한다. 음성발생기관은 성도(vocal track)와 성문(vocal cord)으로 구성되며. 성문에서 진동이 발생하여, 성도를 통과하면서 음이 발생한다. 일반적으로 성도는 주기적인 임펄스(impulse) 또는 랜덤(random) 신호로 표현되고, 성문은 선형예측(linear prediction)기법에 의한 예측 계수로서 표현된다. LSFs는 음성의 선형예측코딩(linear predictive coding, 이하에서 LPC라 한다)에 근거하여 얻을 수 있는데, 양자화를 위한 특성이 우수하여 음성코딩에서 널리 쓰이고 있다.As digital voice communication technology develops, a technique for compressing voices more efficiently is required. For high compression of voice, a technique of modeling the generator is widely used. In voice communication, a voice call is made by transmitting parameters of the model. Voice generator consists of vocal track and vocal cord. Vibration occurs at the gate, and sound is generated as it passes through the saint. In general, the saints are represented by periodic impulse or random signals, and the gates are represented as prediction coefficients by a linear prediction technique. LSFs can be obtained based on linear predictive coding (LPC), which is widely used in voice coding because of their excellent quantization characteristics.
LSFs 스펙트럴 모델 파라메터(spectral model parameter)의 양자화 과정에서는 스펙트럴 왜곡도에 대한 측정이 필요하다. 종래에는 상기 스펙트럴 왜곡도를 아래와 같은 유클리디안(Euclidean) 방식으로 측정하였다.Quantization of LSFs spectral model parameters requires measurement of spectral distortion. Conventionally, the spectral distortion was measured by the following Euclidean method.
여기서 ωi P와i P는 각각 P차수의 i번째 LSF의 원래값과 양자화된 값이다.Where ω i P and i P are the original and quantized values of the i th LSF of P order, respectively.
음성신호는 스펙트럴 엔벨로프(spectral envelop) 상에서 스펙트럴 밸리(vally)부보다는 피크(peak) 또는 포만트(formant) 쪽에 중요한 정보가 있다고 널리 알려져 있다. 이에 근거하여, 가중화된(weighted) 유클리디안 측정방식이 도입되었으며, 인지적으로 이 방식에 의하여 음질이 개선된다는 것은 공지의 사실이다. 가중화된 유클리디안 측정 방식은 아래와 같다.It is widely known that voice signals have important information on the peak or formant rather than the spectral valley portion on the spectral envelope. On this basis, it is well known that weighted Euclidean measurement schemes have been introduced, and that the sound quality is improved cognitively by this approach. The weighted Euclidean measurement method is as follows.
여기서 wi는 i번째 LSF의 가중치이다.Where w i is the weight of the i th LSF.
음성코딩에서 스펙트럴 엔벨로프를 표현할 때, LPC, PARCOR(PARtial CORrelation), LAR(Log Area Ratio)에 비하여 LSF를 주로 사용하는 이유는 LSF의 인터레이싱(interlacing) 특성때문이다. 즉, P차의 LSFs들 간에는 다음과 같은 특성이 있다.When expressing the spectral envelope in voice coding, the reason for using LSF as compared to LPC, PARCOR (PARtial CORrelation) and LAR (Log Area Ratio) is due to the interlacing characteristics of LSF. That is, PSF LSFs have the following characteristics.
최근에는 LSFs의 국소화라는 새로운 특성이 발견되었다. 이는 P차와 P-1차간의 LSFs간에도 인터레이싱 특성이 존재한다는 것이다. 즉,Recently, a new property has been discovered called localization of LSFs. This means that there is an interlacing characteristic between LSFs between P and P-1 orders. In other words,
그런데, 기존의 유클리디안 방식 또는 가중화된 유클리디안 방식에서는 상기한 바와 같은 LSFs의 국소화 특성을 고려하지 못한 문제점이 있다.However, in the existing Euclidean or weighted Euclidean method, there is a problem that the localization characteristics of the LSFs as described above are not considered.
본 발명은 상기의 문제점을 해결하기 위하여 창작된 것으로서, 보다 개선된 음질을 제공하기 위하여 LSFs를 양자할 때 LSFs의 국소화 특성을 고려한 스펙트럴 왜곡도 측정방식을 채택한 벡터양자화 방법을 제공함을 그 목적으로 한다.The present invention has been made to solve the above problems, and to provide a vector quantization method that adopts a spectral distortion measurement method considering the localization characteristics of LSFs when quantizing LSFs to provide more improved sound quality. do.
도 1은 본 발명에 의한 음성신호의 처리과정을 도시한 것이다.1 shows a process of processing a voice signal according to the present invention.
도 2는 도 1에 도시된 선스펙트럼 주파수 벡터 양자화 과정에 대한 블록도이다.FIG. 2 is a block diagram illustrating the line spectrum frequency vector quantization process shown in FIG. 1.
도 3은 본 발명에 의한 선스펙트럼 주파수의 벡터 양자화 과정을 도시한 흐름도이다.3 is a flowchart illustrating a vector quantization process of line spectrum frequencies according to the present invention.
도 4a 내지 도 4c는 종래방식과 본 발명의 스펙트랄 엔벨로프 비교에 대한 실험결과를 도시한 것이다.4A to 4C show experimental results for comparing the spectral envelope of the conventional method and the present invention.
상기의 목적을 달성하기 위한 본 발명의 구성은 다음과 같다.The configuration of the present invention for achieving the above object is as follows.
P차원의 선스펙트럼 주파수 벡터 ωP=(ω1 P,ω2 P,…,ωP P)를 코드북을 사용하여 벡터양자화하는 방법은 상기 P차원의 선스펙트럼 주파수 벡터를 P-1차원의 선스펙트럼 주파수 벡터ωP-1=(ω1 P-1,ω2 P-1,…,ωP-1 P-1)로 변환하고, 최소 왜곡도Dw,l *, 최적 코드북 색인 k*및 코드북 색인 K를 초기화하는 초기화단계; 상기 코드북 색인 k를 사용하여 상기 코드북에서 색인이 k인 양자화된 선스펙트럼 주파수 벡터P(k)=(1 P(k),2 P(k),…,P P(k))를 찾는 코드북 탐색단계; 상기 P-1차원의 선스펙트럼 주파수 벡터와 상기 색인이 K인 양자화된 선스펙트럼 주파수 벡터 내의 모든 원소 ωi P-1과i P(k) (여기에서 i의 값은 1에서 P까지의 값)간에 ,A method of vector quantizing a P-dimensional line spectrum frequency vector ω P = (ω 1 P , ω 2 P ,..., Ω P P ) using a codebook includes a P-dimensional line spectrum frequency vector. Transform into a spectral frequency vector ω P-1 = (ω 1 P-1 , ω 2 P-1 ,…, ω P-1 P-1 ), and have a minimum distortion degree D w, l * , an optimal codebook index k * and An initialization step of initializing the codebook index K; Codebook search using the codebook index k to find a quantized line spectrum frequency vector P (k) = ( 1 P (k), 2 P (k), ..., P P (k)) with index k in the codebook step; All elements ω i P-1 and i P (k) in the P-1 dimensional line spectrum frequency vector and the indexed K quantized line spectrum frequency vector, where i is a value from 1 to P However,
01 Pω1 P-1 2 Pω2 P-1… ωP-1 P-1 P Pπ0 1 P ω 1 P-1 2 P ω 2 P-1 ... ω P-1 P-1 P P π
에 따른 국소화 특성을 만족하는 경우에는 국소화 제약률 α에 1보다 작고 0보다 큰 소정의 값을 할당하고, 만족하지 않는 경우에는 국소화 제약률 α에 1을 할당하는 국소화 제약률 결정단계; 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도를 Dw,l k이라 할 때,A localization constraint determining step of allocating a predetermined value smaller than 1 and greater than 0 to the localization constraint α when the localization characteristic is satisfied, and assigning 1 to the localization constraint α if not satisfied; When the distortion of the quantized line spectrum frequency whose index is k is D w, l k ,
(여기에서 P는 선스펙트럼 주파수의 차원수, α는 선스펙트럼 주파수의 국소화 제약률, wi는 i번째 선스펙트럼 주파수의 가중치, ωi P는 P차원 선스펙트럼 주파수의 i번째 원소,i P(k)는 색인이 k인 양자화된 선스펙트럼 주파수 벡터의 i번째 원소)에 의해 Dw,l k를 구하는 왜곡도 측정단계; 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도 Dw,l k가 상기 최소 왜곡도 Dw,l *보다 작은 경우에는 상기 Dw,l *를 상기 Dw,l k로 치환하고, 상기 최적 코드북 색인 k*를 상기 k로 치환하는 최소 왜곡도 갱신단계; 상기 코드북 색인 k가 코드북의 크기 M보다 큰 경우에는 상기 최적 코드북 색인 k*를 출력하고, 같거나 작은 경우에는 상기 코드북 색인 k를 k+1로 치환하고 상기 코드북 탐색단계를 반복하는 반복 여부 결정단계를 포함하는 것을 특징으로 한다.Where P is the number of dimensions of the line spectrum frequency, α is the localization constraint of the line spectrum frequency, wiIs the weight of the i th line spectrum frequency, ωi PIs the i th element of the P-dimensional line spectrum frequency,i P(k) is the i th element of the quantized line spectrum frequency vector with index k)w, l kA distortion degree measuring step of obtaining; Distortion degree D of the quantized line spectrum frequency whose index is kw, l kIs the minimum distortion degree Dw, l *If less than Dw, l *To D abovew, l kAnd replace the best codebook index k*A minimum distortion updating step of substituting for k; If the codebook index k is larger than the size M of the codebook, then the optimal codebook index k*And outputting the same or smaller, and substituting the codebook index k by k + 1 and repeating the codebook search.
본 발명은 LSFs의 국소화 특성을 이용하여 스펙트럴 엔벨로프의 양자화시 왜곡도 측정에 이용하는 것이다. 즉, 원음성의 P차와 P-1차 LSFs간에 인터레이싱 특성이 존재하듯이, 양자화한 P차의 LSFs와 원음성의 P-1차 LSFs간에도 인터레이싱 특성이 유지되도록 LSFs 양자화 과정에 추가하는 것이다. 즉,The present invention uses the localization characteristics of LSFs to measure distortion in quantization of spectral envelope. That is, as the interlacing characteristic exists between the P-order LSFs of the original sound and the P-1 order LSFs, the interlacing property is maintained between the quantized P-order LSFs and the P-1 order LSFs of the original sound, and thus added to the LSFs quantization process. will be. In other words,
이를 적용하기 위하여 다음과 같은 왜곡도 측정 방식을 도입하였다.To apply this, the following distortion measurement method was introduced.
α는 ωi P와i P간에 수학식 5에 따른 국소화 특성 만족여부에 따라 다른 값을 갖는데, 국소화된 경우에는 1보다 작고 0보다 큰 소정의 값(0.8 정도의 값이 적절하다)을, 그렇지 않은 경우에는 1의 값을 갖는다.α has a different value between ω i P and i P according to whether localization characteristic is satisfied according to Equation 5, and when localized, a predetermined value smaller than 1 and larger than 0 (a value of about 0.8 is appropriate) is not. If not, it has a value of 1.
본 방식을 사용하여 LSFs의 벡터양자화를 할 수 있다. 벡터양자화는 LSFs 후보들 중에서 수학식 6을 최소화하는 LSF의 VQ 색인 k*를 찾는 과정으로서 다음과 같이 표현된다.This method allows vector quantization of LSFs. Vector quantization is a process of finding the VQ index k * of the LSF that minimizes Equation 6 among the LSFs candidates.
여기서i P(k)는 P차 LSF 코드북의 k번째 코드 원소의 i번째 값이고, M은 코드북 크기이다.Where i P (k) is the i th value of the k th code element of the P th order LSF codebook, and M is the codebook size.
이하에서 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명에 의한 음성신호의 처리과정을 도시한 것이다.1 shows a process of processing a voice signal according to the present invention.
먼저 입력음성은 LPC 계수로 유도되고(100단계), LSF는 LPC로부터 변환된다(110단계). 상기한 바와 같이 변환된 LSF에 의해 국소화 특성을 이용한 벡터양자화기를 사용하여 최적 코드북 색인이 색출되고(120단계), 상기 색출된 색인이 전송과정을 통해 전송된다.First, the input voice is derived from the LPC coefficient (step 100), and the LSF is converted from the LPC (step 110). The optimal codebook index is retrieved using the vector quantizer using the localization characteristic by the transformed LSF as described above (step 120), and the retrieved index is transmitted through a transmission process.
도 2는 도 1에 도시된 선스펙트럼 주파수 벡터 양자화 과정에 대한 블록도이다. 입력 LSF ωP(P차원의 LSFs)를 LSF 벡터 코드북(220) 내의 각 양자화된 LSF와의 왜곡도를 차례로 측정하여(200), 가장 작은 왜곡도를 가진 양자화된 LSF의 색인을 찾아(210) 복호화단계로 전달하게 된다.FIG. 2 is a block diagram illustrating the line spectrum frequency vector quantization process shown in FIG. 1. The input LSF ω P (P-dimensional LSFs) is sequentially measured in a distortion degree with each quantized LSF in the LSF vector codebook 220 (200) to find and decode (210) the index of the quantized LSF having the smallest distortion. Will pass to the stage.
도 3은 본 발명에 의한 선스펙트럼 주파수의 벡터 양자화 과정을 도시한 흐름도이다.3 is a flowchart illustrating a vector quantization process of line spectrum frequencies according to the present invention.
국소화 특성을 이용한 벡터 양자화 과정은 LSFs를 벡터코드북 색인으로 변환하는 과정이다. 먼저 최소왜곡도, 최적 코드북 색인 k*및 코드북 색인 k를 각각 ∞, 1, 1로서 초기화한다(300단계). 그리고, 원 음성의 P차의 LSF를 P-1차의 LSF로 변환한다(310단계).The vector quantization process using localization is a process of converting LSFs into vector codebook indexes. First, the minimum distortion degree, the optimal codebook index k * and the codebook index k are initialized as ∞, 1, and 1, respectively (step 300). In step 310, the LSF of the P-order of the original audio is converted into the L-SF of the P-1 order.
그 다음, 코드북 색인 k를 사용하여 코드북(220)에서 색인이 k인 양자화된 LSF를 찾는다(320단계).Next, the codebook index k is used to find a quantized LSF whose index is k in the codebook 220 (step 320).
그 다음, 310단계에서 변환된 상기 P-1차원의 선스펙트럼 주파수 벡터와 320단계에서 찾은 상기 색인이 K인 양자화된 선스펙트럼 주파수 벡터 내의 모든 원소 ωi P-1과i P(k) (여기에서 i의 값은 1에서 P까지의 값)간에Then, all elements ω i P-1 and i P (k) in the P-1 dimensional line spectrum frequency vector transformed in step 310 and the quantized line spectrum frequency vector whose index is found in step 320 are The value of i is between 1 and P)
01 Pω1 P-1 2 Pω2 P-1… ωP-1 P-1 P Pπ0 1 P ω 1 P-1 2 P ω 2 P-1 ... ω P-1 P-1 P P π
에 따른 국소화 특성을 만족하는 경우에는 국소화 제약률 α에 1보다 작고 0보다 큰 소정의 값을 할당하고, 만족하지 않는 경우에는 국소화 제약률 α에 1을 할당한다(330단계).If the localization characteristic is satisfied, a predetermined value smaller than 1 and greater than 0 is assigned to the localization constraint α, and if it is not satisfied, 1 is assigned to the localization constraint α (step 330).
그 다음, 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도를Then, the distortion degree of the quantized line spectrum frequency whose index is k
에 의해 구한다(340단계).Obtained by (step 340).
다음, 상기 색인이 k인 양자화된 선스펙트럼 주파수의 왜곡도가 상기 최소 왜곡도 Dw,l *보다 작은 경우에는 상기 Dw,l *를 상기 Dw,l k로 치환하고, 상기 최적 코드북 색인 k*를 상기 k로 치환한다(350-360단계).Next, the distortion degree of the quantized line spectrum frequency whose index is k is the minimum distortion degree D.w, l *If less than Dw, l *To D abovew, l kAnd replace the best codebook index k*Is replaced by k (steps 350-360).
코드북 색인 k가 코드북의 크기 M과 같거나 M보다 작은 경우에는 상기 코드북 색인 k를 k+1로 치환하고 320단계에서 360단계의 과정을 반복하고, M보다 큰 경우에는 상기 최적 코드북 색인 k*를 복호기에 전달하게 된다(370-380단계).If the codebook index k is less than or equal to the size M of the codebook, replace the codebook index k with k + 1 and repeat the process of step 360 in step 320. If the codebook index k is larger than M, the optimal codebook index k * is substituted. It is delivered to the decoder (steps 370-380).
도 4a 내지 도 4c는 종래방식과 본 발명의 스펙트랄 엔벨로프 비교에 대한 실험결과를 도시한 것이다. 도 4a는 원 음성파형을 나타내고, 도 4b는 종래의 양자화 방법에 의한 스펙트럴 엔벨로프의 비교를 나타내고, 도 4c는 본 발명의 양자화 방법에 의한 스펙트럴 엔벨로프 비교를 나타낸다. 상기 도면을 비교하여 보면, 종래방식의 스펙트럼은 음성의 중요정보를 갖고 있다고 알려진 첫번째 포만트(F1)와 두 번째 포만트(F2)에서 스펙트럼의 매칭이 잘 되지 않음을 확인할 수 있다. 이에 반하여, 본 발명의 방식을 이용할 경우 스펙트럼의 매칭이 기존 방식에 비하여 개선됨을 알 수 있다.4A to 4C show experimental results for comparing the spectral envelope of the conventional method and the present invention. 4A shows the original speech waveform, FIG. 4B shows the comparison of the spectral envelope by the conventional quantization method, and FIG. 4C shows the comparison of the spectral envelope by the quantization method of the present invention. Comparing the drawings, it can be seen that the spectrum of the conventional method is not well matched in the first formant F1 and the second formant F2 known to have important information of speech. On the contrary, it can be seen that when the method of the present invention is used, the matching of the spectrum is improved compared to the existing method.
본 발명에 의하면, LSFs를 양자할 때 LSFs의 국소화 특성을 고려함으로써 스펙트럼의 매칭이 기존의 방식에 의한 것에 비하여 개선되어 더욱 양질의 음질을 제공할 수 있다.According to the present invention, when the LSFs are quantized, the localization characteristics of the LSFs are taken into consideration, so that the matching of the spectrum can be improved as compared with the conventional method, thereby providing a higher quality sound.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970016087A KR100446595B1 (en) | 1997-04-29 | 1997-04-29 | Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970016087A KR100446595B1 (en) | 1997-04-29 | 1997-04-29 | Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19980078533A true KR19980078533A (en) | 1998-11-16 |
KR100446595B1 KR100446595B1 (en) | 2005-02-07 |
Family
ID=37362393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970016087A KR100446595B1 (en) | 1997-04-29 | 1997-04-29 | Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100446595B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100712409B1 (en) * | 2005-07-28 | 2007-04-27 | 한국전자통신연구원 | Method for dimension conversion of vector |
WO2011087333A2 (en) * | 2010-01-15 | 2011-07-21 | 엘지전자 주식회사 | Method and apparatus for processing an audio signal |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61262378A (en) * | 1985-05-16 | 1986-11-20 | Mitsubishi Electric Corp | Vector quantization device |
KR960015861B1 (en) * | 1993-12-18 | 1996-11-22 | 휴우즈 에어크라프트 캄파니 | Quantizer & quantizing method of linear spectrum frequency vector |
JPH08101700A (en) * | 1994-09-30 | 1996-04-16 | Toshiba Corp | Vector quantization device |
KR0178195B1 (en) * | 1995-03-28 | 1999-05-01 | 배순훈 | Apparatus for encoding an image signal using vector quantization technique |
-
1997
- 1997-04-29 KR KR1019970016087A patent/KR100446595B1/en not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100712409B1 (en) * | 2005-07-28 | 2007-04-27 | 한국전자통신연구원 | Method for dimension conversion of vector |
WO2011087333A2 (en) * | 2010-01-15 | 2011-07-21 | 엘지전자 주식회사 | Method and apparatus for processing an audio signal |
WO2011087333A3 (en) * | 2010-01-15 | 2011-11-10 | 엘지전자 주식회사 | Method and apparatus for processing an audio signal |
Also Published As
Publication number | Publication date |
---|---|
KR100446595B1 (en) | 2005-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5765127A (en) | High efficiency encoding method | |
US6269333B1 (en) | Codebook population using centroid pairs | |
US5751903A (en) | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset | |
EP1353323B1 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
JP2005533272A (en) | Audio coding | |
US5890110A (en) | Variable dimension vector quantization | |
JPH0869299A (en) | Voice coding method, voice decoding method and voice coding/decoding method | |
KR100322706B1 (en) | Encoding and decoding method of linear predictive coding coefficient | |
US5651026A (en) | Robust vector quantization of line spectral frequencies | |
JPH0563000B2 (en) | ||
Chamberlain | A 600 bps MELP vocoder for use on HF channels | |
EP1597721B1 (en) | 600 bps mixed excitation linear prediction transcoding | |
JPH07261800A (en) | Transformation encoding method, decoding method | |
US6131083A (en) | Method of encoding and decoding speech using modified logarithmic transformation with offset of line spectral frequency | |
US5806027A (en) | Variable framerate parameter encoding | |
EP0919989A1 (en) | Audio signal encoder, audio signal decoder, and method for encoding and decoding audio signal | |
US5822721A (en) | Method and apparatus for fractal-excited linear predictive coding of digital signals | |
Hagen | Spectral quantization of cepstral coefficients | |
KR100446595B1 (en) | Vector quantization method of line spectrum frequency using localization characteristics, especially searching optimum code book index using calculated distortion | |
JPH05265487A (en) | High-efficiency encoding method | |
US6356213B1 (en) | System and method for prediction-based lossless encoding | |
KR100474969B1 (en) | Vector quantization method of line spectral coefficients for coding voice singals and method for calculating masking critical valule therefor | |
KR0155798B1 (en) | Vocoder and the method thereof | |
Koishida et al. | Spectral representation of speech based on mel‐generalized cepstral coefficients and its properties | |
KR960015861B1 (en) | Quantizer & quantizing method of linear spectrum frequency vector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20080731 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |