KR19990055873A - A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function - Google Patents

A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function Download PDF

Info

Publication number
KR19990055873A
KR19990055873A KR1019970075841A KR19970075841A KR19990055873A KR 19990055873 A KR19990055873 A KR 19990055873A KR 1019970075841 A KR1019970075841 A KR 1019970075841A KR 19970075841 A KR19970075841 A KR 19970075841A KR 19990055873 A KR19990055873 A KR 19990055873A
Authority
KR
South Korea
Prior art keywords
pitch
waveform
autocorrelation function
positive
correlation value
Prior art date
Application number
KR1019970075841A
Other languages
Korean (ko)
Inventor
박영호
이정준
손상목
배명진
Original Assignee
이봉훈
서울이동통신 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이봉훈, 서울이동통신 주식회사 filed Critical 이봉훈
Priority to KR1019970075841A priority Critical patent/KR19990055873A/en
Publication of KR19990055873A publication Critical patent/KR19990055873A/en

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은, 음성부호화에 있어서 피치검색시간을 단축하기 위한 것으로서, 최대의 상관관계없이 얻어지는 피치지연에 의거하여 음성신호를 부호화하는 방법에 있어서, 피치검색에서 양의 상관관계값이 나타나는 구간을 구하고, 상기 양의 상관관계값이 나타나는 기간만큼 다음의 구간을 건너뛰어 피치를 검색하는 것을 특징으로 하는 자기상관함수의 음의 파형 건너뜀에 의한 G.723.1 음성부호화기의 계산량 감소 방법이다.The present invention is to shorten the pitch search time in speech encoding. In the method of encoding a speech signal based on a pitch delay obtained without maximum correlation, a section in which a positive correlation value appears in pitch search is obtained. The method of reducing the calculation amount of the G.723.1 speech encoder by skipping the negative waveform of the autocorrelation function, skipping the next section by the period in which the positive correlation value appears.

Description

자기상관함수의 음의 파형 건너뜀에 의한 G.723.1 음성부호화기의 계산량 감소 방법A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function

본 발명은 음성의 부호화에 관한 것으로서, 특히 피치지연에 의한 부호화방법에 관한 것이다.The present invention relates to speech encoding, and more particularly, to an encoding method by pitch delay.

최근 표준화되고, 주목받고 있는 부호화법중의 하나가 G.723.1이다. G.723.1은 5.3/6.3 kbps ACELP/MP-MLQ(Algebraic Code-Excited Linear Predictive/Multi-Pulse-Maximum Likelyhood Quantinization)의 2중 레이트(Dual rate) 음성부호화기로 구성된다. 2중 레이트 음성부호화기의 부호화시 입력신호는 8kHz로 샘플링되고 16 비트 선형 PCM으로 양자화되어 240샘플을 갖는 30ms 프레임 길이를 갖는다. 그리고 DC성분을 제거하기 위해 고역필터를 거치게 되는데 고역필터의 전달함수는 식1과 같다.One of the coding methods that have recently been standardized and attracted attention is G.723.1. G.723.1 consists of a dual rate voice encoder of 5.3 / 6.3 kbps ACELP / MP-MLQ (Algebraic Code-Excited Linear Predictive / Multi-Pulse-Maximum Likelyhood Quantinization). In encoding a double rate speech coder, the input signal is sampled at 8 kHz and quantized with 16 bit linear PCM to have a 30 ms frame length with 240 samples. And a high pass filter is passed to remove the DC component. The transfer function of the high pass filter is shown in Equation 1.

240샘플의 한 프레임은 다시 4개의 부프레임으로 나누어 부프레임에 대해 자기상관함수 방법을 이용하여 10차 LP(Linear Prediction) 계수가 계산되고, 이 때 4번째 부프레임의 LP계수는 LSP(Line spectrum pair)값으로 변환한 후 PSVQ(Predictive Split Vector Quantinization)를 이용하여 벡터양자화한다. 그리고 두 개의 부프레임(120샘플)에 대해 18에서 142범위의 개루프(open loop)방식으로 추정 피치(기본주파수의 역수로서, 화자의 개성정보, 감정을 가지고 있다) 지연값을 찾게 된다.One frame of 240 samples is divided into four subframes, and the 10th linear prediction (LP) coefficient is calculated using the autocorrelation method for the subframe, and the LP coefficient of the fourth subframe is LSP (Line spectrum). After converting to a pair) value and vector quantization using Predictive Split Vector Quantinization (PSVQ). Then, the estimated pitch (inverse of the fundamental frequency, which has the speaker's personality information and emotion) is found in the open loop method of 18 to 142 for two subframes (120 samples).

추정된 피치지연값을 이용하여 폐루프(closed loop) 피치예측을 수행하게 되는데, 여기에 사용된 예측기의 차수는 5차이다. 마지막으로 여기 신호는 모델로는 5.3kbps에서는 ACELP방식과 6.3kbps에서는 MP-MLQ방식이 사용된다. 도1과 도2는 G.723.1의 부호화와 복호화 블럭도를 나타낸다.The closed loop pitch prediction is performed using the estimated pitch delay value, and the order of the predictor used here is 5th order. Finally, the excitation signal is modeled using ACELP at 5.3kbps and MP-MLQ at 6.3kbps. 1 and 2 show a coding and decoding block diagram of G.723.1.

피치지연검색시간이 전체계산량에서 코드북 검색시간 다음으로 많은 계산량을 요구한다. 이런 피치지연검색과정을 자세히 살펴보면, 피치지연검색시 음성신호 f(n)에 대해 시간지연에 따른 자기상관함수를 이용하여 계산한다. 피치검색법에서 가장 바람직한 피치지연을 구하기 위해서는 식2와 같은 상관관계식을 가능한 모든 피치지연에 대해 반복적으로 수행해야 한다.The pitch delay search time requires the largest amount of computation after the codebook search time. Looking at the pitch delay search process in detail, the pitch delay search is calculated using the autocorrelation function according to the time delay for the speech signal f (n). In order to find the most desirable pitch delay in the pitch search method, the correlation equation (2) must be repeated for all possible pitch delays.

여기에서 f[n]은 적응 가중필터를 통과한 음성신호, j는 피치지연값이다. 이것은 매 피치지연 j에 대해 (j의 범위는 18에서 142표본까지) 곱셈과 덧셈을 j번씩 수행해야 하는 많은 계산량이 된다. 따라서 피치검색 오차는 변동되지 않는 상황에서 피치검색시간만 단축시킬 수 있어야 한다.Where f [n] is the speech signal passing through the adaptive weighting filter, and j is the pitch delay value. This is a large amount of computation that requires multiplying and adding j times for every pitch delay j (the range of j from 18 to 142 samples). Therefore, the pitch search error should be able to shorten the pitch search time only when the pitch does not change.

따라서 본 발명은, 피치검색시간을 단축시키기 위한 방법을 제안하기 위한 것이다.Accordingly, the present invention is to propose a method for shortening the pitch search time.

도1은, G.723.1의 부호기의 블럭도,1 is a block diagram of an encoder of G.723.1;

도2는 G.723.1의 복호기의 블록도.Fig. 2 is a block diagram of a decoder of G.723.1.

도3은 종래의 파형과 본 발명에 의한 파형의 예를 나타내는 도면으로서, (a)는 원음성파형을, (b)는 자기상관함수파형을, (c)는 제안한 발명의 파형을 각각 나타낸다.3 shows examples of conventional waveforms and waveforms according to the present invention, (a) shows an original sound waveform, (b) shows an autocorrelation waveform, and (c) shows a waveform of the proposed invention.

피치지연값을 구하기 위해서 자기상관함수를 이용한다. 이 피치지연검색블럭에서 양의 파형 봉우리를 기준으로 하여 자기상관함수를 취하면 양의 파형 봉우리마다 양의 값이 얻어지며, 음의 파형 봉우리마다 음의 값이 얻어진다. 따라서 상관관계 파형도 시간지연에 따라 음과 양의 봉우리가 반복적으로 나타나는 구조를 이루게 된다.The autocorrelation function is used to find the pitch delay value. In this pitch delay search block, if the autocorrelation function is taken based on the positive waveform peaks, a positive value is obtained for each positive waveform peak, and a negative value is obtained for each negative waveform peak. Therefore, the correlation waveform also has a structure in which negative and positive peaks appear repeatedly over time.

피치 검색과정에서 최대의 상관값이 얻어지는 피치지연을 피치주기로 고려하기 때문에 피치검색에 적용되는 상관관계값은 양의 봉우리를 이루는 경우만을 필요로 한다. 또한 상관관계 값의 양의 봉우리가 나타나면 그 봉우리가 끝나는 부분에서부터 양의 봉우리폭 만큼은 음의 봉우리가 존재하는 구간이기 때문에 이 구간은 상관관계값을 계산할 필요가 없어진다. 본 발명에서는 자기상관함수의 음의 파형 건너뜀에 의한 성질을 이용하여 불필요한 피치 검색시간을 줄이게 된다.Since the pitch delay that obtains the maximum correlation value in the pitch search process is considered as the pitch period, the correlation value applied to the pitch search needs only the case of forming positive peaks. In addition, if a positive peak of the correlation value appears, the interval does not need to calculate the correlation value since the positive peak width is the interval of the positive peak from the end of the peak. In the present invention, unnecessary pitch search time is reduced by using the property of the negative waveform skipping of the autocorrelation function.

이하 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail.

최적피치지연값을 찾기 위한 절차는 다음과 같다. 먼저 개루프를 통한 피치검색은 적응 가중필터를 통과한 음성신호에 대하여 프레임당 2번씩 즉 4개의 부프레임(부프레임 0, 1, 2, 3)중 부프레임(0, 2)에서 한번씩 수행된다. 개루프를 통한 피치검색은 식 2와 같이 자기상관함수를 이용한다. 이때 COL이 최대가 되는 피치지연값, 즉 인덱스 j를 전송한다. 이때 상관관계치는 피치주기마다 100%에 근접한 값이 얻어지며, 유사한 정도가 어느정도인지는 피치검색구간내에 있는 파형의 주기성과 파형 진폭의 변화에 따라 다르다. 그러나 피치의 주기성이 강한 유성음일 경우에는 보통 70%이상이 얻어지며, 상관관계값은 시간지연에 대해 그 변화가 느리게 나타난다.The procedure for finding the optimum pitch delay value is as follows. First, a pitch search through an open loop is performed twice per frame, that is, once in a subframe (0, 2) of four subframes (subframes 0, 1, 2, and 3) for a speech signal passing through an adaptive weighting filter. . Pitch search through open loop uses autocorrelation function as in Equation 2. At this time, the pitch delay value at which C OL is maximum, that is, index j is transmitted. At this time, a correlation value is obtained close to 100% for each pitch period, and the degree of similarity depends on the periodicity of the waveform within the pitch search interval and the change in the waveform amplitude. However, in the case of voiced sound with strong pitch periodicity, more than 70% is usually obtained, and the correlation value shows a slow change with time delay.

식2를 통해 음성파형의 상관관계를 계산해 보면 도3(b)에서 볼 수 있듯이 그 파형은 다음과 같은 특징이 있다.Calculation of the correlation of the speech waveform through Equation 2 As shown in Figure 3 (b), the waveform has the following characteristics.

a)느린변화: 음성파형에서 인근 표본간의 상관관계가 높기 때문에 이러한 상관관계를 나타내는 상관관계 파형봉우리도 느리게 변화된다.a) Slow change: Because of the high correlation between neighboring samples in the speech waveform, the correlation waveform peak representing this correlation also changes slowly.

b)봉우리 폭 : 유성음의 파형에서 제1포만트(가장 낮은 공명봉우리)의 에너지가 가장 크기 때문에 한 피치주기내의 파형변화는 제1포만트의 구조로 감쇄 진동을 하게 된다. 이에 대한 자기 상관관계 파형도 제1포만트의 주기를 그대로 유지하는 파형이 구성된다. 따라서 상관관계 파형은 피치주기 사이에서 일정한 폭을 이루게 된다.b) Peak width: Since the energy of the first formant (lowest resonance peak) is the highest in the waveform of the voiced sound, the waveform change in one pitch period causes the damping oscillation to the structure of the first formant. The autocorrelation waveform for this also constitutes a waveform which maintains the period of the first formant as it is. Thus, the correlation waveforms have a constant width between pitch periods.

c)상관관계값 : 음성파형은 양과 음의 파형이 교대로 반복하여 한 피치주기를 이루고 있다. 양의 파형을 기준으로 하여 상관관계를 구하여 양의 파형마다 양의 값이 얻어지며, 음의 파형마다 음의 값이 얻어진다. 반대로, 음의 파형을 기준으로 하면 음의 파형마다 양의 값이 얻어지게 되고 양의 파형마다 음의 값이 얻어지게 된다. 따라서 상관관계 파형도 시간지연에 따라 음과 양의 파형이 반복적으로 나타나는 구조를 이루게 된다.c) Correlation value: Voice waveform forms one pitch period by repeating alternating positive and negative waveforms. The correlation is obtained based on the positive waveform, and a positive value is obtained for each positive waveform, and a negative value is obtained for each negative waveform. On the contrary, on the basis of the negative waveform, a positive value is obtained for each negative waveform and a negative value is obtained for each positive waveform. Therefore, the correlation waveform also has a structure in which negative and positive waveforms appear repeatedly with time delay.

피치 검색과정에서 최대의 상관값이 얻어지는 피치지연을 피치주기로 고려하기 때문에 피치검색에 적용되는 상관관계값은 양의 값을 이루는 경우만을 필요로 한다. 또한 상관관계의 특성과 양의 구간이 나타나기 시작하면 그 양의 구간이 끝나는 부분에서부터 양의 구간폭 만큼은 음의 값이 존재하는 구간이기 때문에 이 구간은 상관관계값을 계산할 필요가 없어진다. 즉 도3의 (c)와 같이 양의 상관관게 값이 찾아질 때 그 음의 상관관계를 갖는 구간이 나타날 것으로 가정하여 이 구간에 대해 피치검색을 하지 않고, 양의 구간만큼 건너뛰어 양의 구간의 개수를 음의 구간이 나올 때까지 다시 카운트하여 앞의 방법과 같이 양의 구간만큼을 건너뛰어 수행하고, 그 건너뛴 구간은 상관관계값을 영으로 나타내어 피치를 검색한다. 그래서 본 발명에서는 자기상관함수의 음의 파형 건너뜀에 의하여 불필요한 피치 검색시간을 줄이게 된다.Since the pitch delay that obtains the maximum correlation value in the pitch search process is considered as the pitch period, the correlation value applied to the pitch search needs only a positive value. In addition, when the characteristics of the correlation and the positive interval starts to appear, the interval does not need to calculate the correlation value because the width of the positive interval exists from the portion where the positive interval ends. That is, when a positive correlation value is found as shown in FIG. 3 (c), a section having a negative correlation is assumed and a pitch section is skipped for this section without a pitch search. The number of times is counted again until a negative interval is obtained, and the number of times is skipped by the positive interval as in the previous method. The skipped interval is a correlation value of zero and the pitch is searched. Therefore, in the present invention, unnecessary pitch search time is reduced by skipping the negative waveform of the autocorrelation function.

본 발명에서는 G.723.1의 피치검색시간을 줄이기 위하여 자기상관함수의 파형특성을 이용하는 새로운 피치검색법을 제안하였다. 표1에는 두 처리과정의 피치검색 시간차를 구하기 위해 발성시료들에 대해서 전체 부호화의 처리시간을 나타내었다. 본 발명에서 제안한 방법으로는 기존의 방법에 비하여 음질의 열하가 거의 없었고, 약 31.3%의 시간절약이 이루어 졌다. 여기서 시간 측정치는 컴퓨터의 기종에 따라 다르기 때문에 상대적인 시간 단축율만을 평가에 고려하였다.In order to reduce the pitch search time of G.723.1, a new pitch search method using waveform characteristics of autocorrelation function is proposed. Table 1 shows the processing time of the entire encoding for the speech samples to find the pitch search time difference between the two processes. In the method proposed in the present invention, there was almost no deterioration in sound quality compared to the existing method, and time saving of about 31.3% was achieved. In this case, since the time measurement value is different depending on the computer type, only the relative time reduction rate is considered in the evaluation.

따라서, 음질의 열화없이 계산시간을 대폭 줄일 수 있게 되었으므로 이동통신분야 및 그외의 음성압축을 이용한 응용분야에서 배터리 수명 연장 및 실시간 처리의 구현에 이용이 가능하게 된다.Therefore, it is possible to significantly reduce the calculation time without deterioration of the sound quality, so that it can be used to extend battery life and to implement real-time processing in mobile communication fields and other applications using voice compression.

표 1. 기존의 방법과 제안한 발명의 결과 비교Table 1. Comparison of results of the proposed method with the existing method

Claims (1)

최대의 상관관계값이 얻어지는 피치지연에 의거하여 음성신호를 부호화하는 방법에 있어서,In a method of encoding a speech signal based on a pitch delay at which a maximum correlation value is obtained, 피치검색에서 양의 상관관계값이 나타나는 구간을 구하고,Find the interval where the positive correlation value appears in the pitch search. 상기 양의 상관관계값이 나타나는 기간만큼 다음의 구간을 건너뛰어 피치를 검색하는Search for the pitch by skipping the next section by the period in which the positive correlation value appears 것을 특징으로 하는 자기상관함수의 음의 파형 건너뜀에 의한 G.723.1 음성부호화기의 계산량 감소 방법.A method for reducing the calculation amount of a G.723.1 speech encoder by skipping negative waveforms of an autocorrelation function.
KR1019970075841A 1997-12-29 1997-12-29 A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function KR19990055873A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970075841A KR19990055873A (en) 1997-12-29 1997-12-29 A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970075841A KR19990055873A (en) 1997-12-29 1997-12-29 A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function

Publications (1)

Publication Number Publication Date
KR19990055873A true KR19990055873A (en) 1999-07-15

Family

ID=66172269

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970075841A KR19990055873A (en) 1997-12-29 1997-12-29 A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function

Country Status (1)

Country Link
KR (1) KR19990055873A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100318336B1 (en) * 2000-01-14 2001-12-22 대표이사 서승모 Method of reducing G.723.1 MP-MLQ code-book search time

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100318336B1 (en) * 2000-01-14 2001-12-22 대표이사 서승모 Method of reducing G.723.1 MP-MLQ code-book search time

Similar Documents

Publication Publication Date Title
Kleijn et al. Improved speech quality and efficient vector quantization in SELP
US5751903A (en) Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
EP0926660B1 (en) Speech encoding/decoding method
US6978235B1 (en) Speech coding apparatus and speech decoding apparatus
EP1420389A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
US5659659A (en) Speech compressor using trellis encoding and linear prediction
CN1751338B (en) Method and apparatus for speech coding
JP3070955B2 (en) Method of generating a spectral noise weighting filter for use in a speech coder
EP1005022A1 (en) Speech encoding method and speech encoding system
JP3558031B2 (en) Speech decoding device
JP2000112498A (en) Audio coding method
KR19990055873A (en) A Method for Reducing the Computation of G.723.1 Speech Coder by Negative Waveform Skip of Autocorrelation Function
Hwang Computational improvement for G. 729 standard
KR100291584B1 (en) Speech waveform compressing method by similarity of fundamental frequency/first formant frequency ratio per pitch interval
KR19990055874A (en) Computation Reduction Method of G.723.1 Speech Encoder Using Finite Characteristic in Positive Waveform of Autocorrelation Function
JP2613503B2 (en) Speech excitation signal encoding / decoding method
Ahmed et al. Fast methods for code search in CELP
JPH113098A (en) Method and device of encoding speech
Akamine et al. CELP coding with an adaptive density pulse excitation model
EP0713208A2 (en) Pitch lag estimation system
KR100263298B1 (en) Pitch search method with correlation characteristic of quantization error in vocoder
JP3468862B2 (en) Audio coding device
JPH0844398A (en) Voice encoding device
Kleijn et al. Analysis and improvement of the vector quantization in SELP (Stochastically Excited Linear Prediction)
Taniguchi et al. Principal axis extracting vector excitation coding: high quality speech at 8 kb/s

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application