KR20050008357A - CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same - Google Patents
CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same Download PDFInfo
- Publication number
- KR20050008357A KR20050008357A KR1020030048425A KR20030048425A KR20050008357A KR 20050008357 A KR20050008357 A KR 20050008357A KR 1020030048425 A KR1020030048425 A KR 1020030048425A KR 20030048425 A KR20030048425 A KR 20030048425A KR 20050008357 A KR20050008357 A KR 20050008357A
- Authority
- KR
- South Korea
- Prior art keywords
- delay value
- pitch delay
- pitch
- value
- previous
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000000694 effects Effects 0.000 title claims abstract description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
본 발명은 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 관한 것으로, 보다 상세하게는, 실제의 피치 지연값에 대한 정수배의 피치 지연값에 의한 음질의 저하를 방지할 수 있는 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 관한 것이다.The present invention relates to a CELP-based speech coder capable of removing the influence of multiple pitch delay values and a method of removing the influence of multiple pitch delay values. The present invention relates to a CELP-based speech coder capable of preventing degradation of sound quality and a method for removing the influence by multiples of a pitch delay value.
CELP(Code Excited Linear Prediction) 구조의 음성부호화기는 음성을 임의의 여기 신호들을 선형 예측 필터(linear prediction filter)에 통과시켜 도식화한다. 선형 예측 필터는 선형 예측 분석(linear prediction analysis)에 의해 만들어 지고, 여기 신호들은 합성을 통한 분석(analysis by synthesis)을 통해서 생성된다. 여기 신호는 적응 코드북(adaptive codebook)과 고정 코드북(fixed codebook)으로 분류된다.A speech encoder of a Code Excited Linear Prediction (CELP) structure plots speech by passing arbitrary excitation signals through a linear prediction filter. The linear prediction filter is made by linear prediction analysis, and the excitation signals are generated through analysis by synthesis. The excitation signal is classified into an adaptive codebook and a fixed codebook.
적응 코드북은 적응 코드북 이득(adaptive codebook gain)과 피치 지연값으로 구성된다. CELP 구조의 음성부호화기에서 피치 지연값은 음성의 주기적 특성을 표현하는 값이다. 음성부호화기는 표준화된 상관값(normalized correlation)을 이용해서 피치 지연값을 구한다. 피치 지연값은 주로 정수값 + 소수값의 형태로 표현되며, 피치 지연값은 음성부호화기에 따라 서로 다른 정수 범위를 가지며, 소수의 표현범위도 상이하다.The adaptive codebook consists of adaptive codebook gain and pitch delay value. In the CELP-structured speech encoder, the pitch delay value represents a periodic characteristic of speech. The speech encoder obtains a pitch delay using a normalized correlation. The pitch delay value is mainly expressed in the form of an integer value + a decimal value. The pitch delay value has a different integer range according to the voice encoder, and the range of the decimal number is also different.
CELP 기반의 음성부호화기들 중에서 일부의 음성부호화기는 실제의 피치 지연값을 찾지 못하고, 실제 피치 지연값의 정수배가 된 피치 지연값을 찾는다. 이러한 실제 피치 지연값의 정수배인 피치 지연값이 나타나는 현상을 피치 더블링 또는 피치 트리플링이라 한다. 도 1에는 실제 피치 지연값(100)과 실제 피치 지연값의정수배가 된 피치 지연값(110)이 도시되어 있다. 실제의 피치 지연값에 비해서 정수배된 피치 지연값은 일정한 음질의 저하를 야기한다.Some of the CELP-based speech encoders do not find an actual pitch delay value, but find a pitch delay value that is an integer multiple of the actual pitch delay value. The phenomenon in which the pitch delay value that is an integer multiple of the actual pitch delay value appears is called pitch doubling or pitch triple ring. 1 illustrates a pitch delay value 110 that is an integer multiple of an actual pitch delay value 100 and an actual pitch delay value. An integer multiple of the pitch delay value compared to the actual pitch delay value causes a constant deterioration in sound quality.
본 발명이 이루고자 하는 기술적 과제는, 음성부호화기에서 나타나는 실제 피치 지연값의 정수배에 해당하는 피치 지연값에 의한 음질의 저하를 방지할 수 있는 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법을 제공하는 데 있다.The technical problem to be achieved by the present invention is a CELP-based speech coder capable of preventing the degradation of sound quality due to a pitch delay value corresponding to an integer multiple of the actual pitch delay value shown in the speech coder and a method for removing the influence by multiples of the pitch delay value. To provide.
도 1은 실제 피치 지연값의 정수배가 된 피치 지연값을 도시한 도면,1 is a diagram showing a pitch delay value that is an integer multiple of an actual pitch delay value,
도 2는 동일한 음성 입력을 G.729A 음성부호화기를 통해서 부호화했을 때 결정되는 피치 지연값의 정수값과 SMV 음성부호화기를 통해서 부호화했을 때 중간 과정에서 결정되는 피치 지연값의 정수값만을 비교한 도면,2 is a diagram comparing only the integer value of the pitch delay value determined when the same voice input is encoded through the G.729A speech encoder and the integer value of the pitch delay value determined in the intermediate process when the SMV speech encoder is encoded.
도 3은 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기에 대한 바람직한 일 실시예의 구성을 도시한 블록도,3 is a block diagram showing the configuration of a preferred embodiment of a CELP-based speech coder capable of removing the influence of multiples of a pitch delay value according to the present invention;
도 4는 동일한 음성에 대해서 피치 더블링 또는 피치 트리플링 효과가 제거된 결과를 도시한 도면, 그리고,4 is a diagram illustrating a result of removing a pitch doubling or pitch triple effect for the same voice; and
도 5는 본 발명에 따른 음성부호화기에서 피치 지연값의 배수에 의한 영향의 제거 방법에 대한 일 실시예의 수행과정을 도시한 흐름도이다.FIG. 5 is a flowchart illustrating an embodiment of a method of canceling an influence caused by a multiple of a pitch delay value in a voice encoder according to the present invention.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기는, 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 제1피치지연결정부; 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n(단, n은 정수)값이 저장되는 저장부; 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 비교부; 및 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 제2피치지연결정부;를 구비한다.In order to achieve the above technical problem, the CELP-based speech coder capable of removing the influence of multiples of the pitch delay value according to the present invention calculates a first pitch delay value corresponding to a current pitch delay value from an input speech signal. A first pitch connection; A storage unit storing the first pitch delay value and 1 / n (where n is an integer) of the first pitch delay value; A comparison unit comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And setting the first pitch delay value to a previous pitch delay value if the at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, and setting the first pitch delay value and the first pitch delay value. And a second pitch connection unit configured to set the first pitch delay value to a current pitch delay value if all of 1 / n values of the pitch delay values are not equal to each other.
상기의 다른 기술적 과제를 달성하기 위한, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거 방법은, CELP 기반의 음성부호화기 또는 상호부호화기에서 피치 지연값의 배수에 의한 영향을 제거하는 방법에 있어서, (a) 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 단계; (b) 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n값(단, n은 정수)을 메모리에 저장하는 단계; (c) 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 단계; 및 (d) 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 단계;를 포함한다.In order to achieve the above another object of the present invention, the method for removing the influence by the multiple of the pitch delay value in accordance with the present invention, in the method of eliminating the effect of the multiple of the pitch delay value in the CELP-based speech coder or mutual encoder, (a) calculating a first pitch delay value corresponding to a current pitch delay value from the input voice signal; (b) storing the first pitch delay value and the 1 / n value of the first pitch delay value (where n is an integer) in a memory; (c) comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And (d) if at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, set the first pitch delay value to a previous pitch delay value, and And setting the first pitch delay value to a current pitch delay value if all of 1 / n values of the first pitch delay value are not equal to each other.
이에 의해, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.Thereby, the sound quality can be improved by eliminating the influence of the integer multiple of the pitch delay value during speech encoding by the speech encoder or during mutual encoding of the speech encoding period.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법의 바람직한 실시예에 대해 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a preferred embodiment of a CELP-based speech coder capable of canceling the influence of the pitch delay value by a multiple of the pitch delay value and the method of removing the influence of the pitch delay value according to the present invention will be described in detail.
도 2는 동일한 음성 입력을 G.729A 음성부호화기를 통해서 부호화했을 때 결정되는 피치 지연값의 정수값과 SMV 음성부호화기를 통해서 부호화했을 때 중간 과정에서 결정되는 피치 지연값의 정수값만을 비교한 도면이다. 원으로 표시된 영역(200)에는 G.729A에 대한 피치 지연값이 상당히 크게 나타난다. 이는 G.729A 음성부호화기의 피치 지연값 검색이 제대로 이루어지지 않아서 피치 더블링 또는 피치 트리플링이 발생한 것이다.FIG. 2 is a diagram comparing only integer values of pitch delay values determined when encoding the same voice input through a G.729A voice encoder and integer values of pitch delay values determined in an intermediate process when encoding through an SMV voice encoder. . In the area 200 indicated by the circle, the pitch delay value for G.729A appears to be quite large. This is because pitch doubling of the G.729A voice encoder is not properly performed, resulting in pitch doubling or pitch triple ringing.
피치 더블링 또는 피치 트리플링은 피치 지연값이 일정하게 유지될 때, 즉유성음 구간이 일정하게 계속될 때 주로 일어난다. 피치 지연값을 구하는 과정은 음성의 주기적 특성을 구하는 과정으로서, 피치 더블링 또는 피치 트리플링은 주기가 일정한 신호가 지속될 때 음성부호화기가 실제 입력된 음성의 주기와는 상이한 주기를 구함으로써 발생한다. 즉, 주기의 특성상 T가 주기이면 2T도 주기일 수 있기 때문에, 음성부호화기가 주기를 구하는 과정에서 T가 아니라, 2T를 입력된 음성의 주기로 결정하는 현상이 피치 더블링 또는 피치 트리플링이라 할 수 있다.Pitch doubling or pitch tripling occurs mainly when the pitch delay value is kept constant, i.e. when the voiced sound interval continues. The process of obtaining the pitch delay value is a process of determining the periodic characteristics of the voice. The pitch doubling or the pitch triple occurs when the voice encoder obtains a period different from the period of the voice actually input when the signal has a constant period. That is, since T may be a period of 2T if the period is a characteristic of the period, the phenomenon in which the voice encoder determines 2T as the period of the input voice in the process of obtaining the period may be referred to as pitch doubling or pitch tripleling. .
이러한 이유로 피치 더블링 또는 피치 트리플링 현상이 발생하므로, 피치 지연값이 일정하게 나오다가 갑자기 기존의 피치 지연값의 두 배 또는 세 배라면 이것은 피치 지연값이 잘못 결정된 것이라고 판단할 수 있다. 이론적으로는 4배, 5배의 값들도 나올 수 있으나, 이러한 값들은 실제적으로 잘 나오지 않는다.For this reason, the pitch doubling or pitch triple phenomena occur, so if the pitch delay value is constant and suddenly doubles or triples the existing pitch delay value, it may be determined that the pitch delay value is incorrectly determined. Theoretically, four or five times the values may come out, but these values are not really good.
도 3은 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기에 대한 바람직한 일 실시예의 구성을 도시한 블록도이다.3 is a block diagram showing the configuration of a preferred embodiment of a CELP-based speech coder capable of removing the influence of multiples of the pitch delay value according to the present invention.
도 3을 참조하면, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기는, 프레이머(310), 고역통과필터(320), 선형예측계수추출부(330), 선형예측필터(340), 저역통과필터(350), 및 피치지연산출부(360)를 구비한다.Referring to FIG. 3, the CELP-based speech coder capable of removing the influence of a multiple of the pitch delay value according to the present invention includes a framer 310, a high pass filter 320, a linear predictive coefficient extractor 330, and a linear predictor. A filter 340, a low pass filter 350, and a pitch delay calculation unit 360 are provided.
프레이머(310)는 입력된 음성신호의 분석을 위한 프레이밍을 수행한다. 프레이머(310)는 PCM 라인을 통해 연속적으로 들어오는 음성신호를 음성부호화기에 정의되어 있는 분석구간으로 분할한다. 고역통과필터(320)는 프레이머(311)의 출력신호중 음성신호에 포함되어 있는 원하지 않는 저주파 성분을 제거한다. 선형예측계수추출부(330)는 고역통과필터링된 된 신호로부터 선형예측계수(Linear Prediction Coefficient : LPC)를 추출한다. 선형예측필터(340)는 선형예측계수추출부(330)에 의해 추출된 LPC를 이용하여 음성신호의 포르만트(Formant) 성분을 제거한다. 저역통과필터(350)는 선형예측필터링된 신호에서 피치이외의 성분을 필터링한다. 피치지연산출부(360)는 저역통과필터링된 신호로부터 피치지연값을 산출하고, 산출된 피치지연값을 기초로 정수배의 피치지연값을 제거하여 최종적인 피치지연값을 결정한다.The framer 310 performs framing to analyze the input voice signal. The framer 310 divides the voice signal continuously received through the PCM line into an analysis section defined in the voice encoder. The high pass filter 320 removes unwanted low frequency components included in the audio signal from the output signal of the framer 311. The linear prediction coefficient extracting unit 330 extracts a linear prediction coefficient (LPC) from the high pass filtered signal. The linear prediction filter 340 removes the formant component of the voice signal by using the LPC extracted by the linear prediction coefficient extractor 330. The low pass filter 350 filters components other than the pitch in the linear predictive filtered signal. The pitch delay calculation unit 360 calculates a pitch delay value from the low pass filtered signal, and determines a final pitch delay value by removing an integer multiple of the pitch delay value based on the calculated pitch delay value.
피치지연산출부(360)는 제1피치지연결정부(362), 저장부(364), 비교부(366), 및 제2피치지연결정부(368)를 구비한다. 제1피치지연결정부(362)는 저역통과필터링된 신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다. 저장부(364)에는 산출된 제1피치 지연값, 제1피치 지연값의 ½값, 및 제1피치 지연값의 ⅓값이 저장된다. 비교부(366)는 이전 피치 지연값과 제1피치 지연값의 ½값을 비교하고, 이전 피치 지연값과 제1피치 지연값의 ⅓값을 비교한다. 제2피치지연결정부(368)는 비교부(366)의 비교결과를 기초로 피치 지연값을 재설정한다. 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 또는 ⅓값이 동일하면, 제1피치 지연값을 이전 피치 지연값으로 설정한다. 이와 달리, 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 및 제1피치 지연값의 ⅓값이 동일하지 않으면, 제1피치 지연값을 현재 피치 지연값으로 설정한다.The pitch delay calculation unit 360 includes a first pitch connection unit 362, a storage unit 364, a comparison unit 366, and a second pitch connection unit 368. The first pitch connection unit 362 calculates a first pitch delay value corresponding to the current pitch delay value from the low pass filtered signal. The storage unit 364 stores the calculated first pitch delay value, ½ value of the first pitch delay value, and the? Value of the first pitch delay value. The comparator 366 compares the 1/2 value of the previous pitch delay value and the first pitch delay value, and compares the? Value of the previous pitch delay value and the first pitch delay value. The second pitch connection unit 368 resets the pitch delay value based on the comparison result of the comparison unit 366. The second pitch connection unit 368 sets the first pitch delay value to the previous pitch delay value when the ½ or ⅓ value of the previous pitch delay value and the first pitch delay value are the same. On the contrary, if the pitch value of the first pitch delay value and the first pitch delay value are not equal to each other, the second pitch connection unit 368 replaces the first pitch delay value with the current pitch delay value. Set to.
한편, 상호부호화기에서 피치 지연값을 변환할 때, 개회로 피치 검색(open loop pitch detection)을 수행하지 않는 대신에 상호부호화기의 입력의 피치 지연값을 기준으로 폐회로 피치 검색(closed loop pitch detection) 과정을 수행한다. 본 발명을 이용하면, 이러한 폐회로 검색 과정에서 피치 지연값이 잘못 결정되는 문제점을 방지할 수 있다. 본 발명이 상호부호화기에 적용되는 경우에, 폐회로피치검색부(370)가 구비되며, 도 3에서 폐회로피치검색부(370)는 점선으로 표시되어 있다. 폐회로피치검색부(370)는 제1피치지연결정부(362)에 의해 결정된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 제1피치 지연값을 변경하고, 변경된 제1피치 지연값, 변경된 제1피치 지연값의 ½값, 및 변경된 제1피치 지연값의 ⅓값을 저장부(364)에 저장한다. 이 경우, 프레이머(310), 고역통과필터(320), 선형예측계수추출부(330), 선형예측필터(340), 저역통과필터(350), 및 제1피치지연결정부(362)는 전단의 음성 복호화기를 구성한다. 그리고, 폐회로피치검색부(370), 저장부(364), 비교부(366), 및 제2피치지연결정부(368)는 후단의 음성 부호화기에 구비되어 음성의 상호부호화시 피치지연값을 결정한다.On the other hand, when converting the pitch delay value in the inter encoder, instead of performing open loop pitch detection, a closed loop pitch detection process based on the pitch delay value of the input of the inter encoder. Do this. By using the present invention, it is possible to prevent the problem that the pitch delay value is incorrectly determined in the closed loop search process. In the case where the present invention is applied to the mutual encoder, the closed loop pitch search unit 370 is provided, and the closed loop pitch search unit 370 is indicated by a dotted line in FIG. 3. The closed loop pitch search unit 370 performs a closed loop pitch search based on the first pitch delay value determined by the first pitch connection unit 362, changes the first pitch delay value, changes the first pitch delay value, The ½ value of the changed first pitch delay value and the ⅓ value of the changed first pitch delay value are stored in the storage unit 364. In this case, the framer 310, the high pass filter 320, the linear predictive coefficient extractor 330, the linear predictive filter 340, the low pass filter 350, and the first pitch connection unit 362 are sheared. Configure a voice decoder. The closed-loop pitch search unit 370, the storage unit 364, the comparison unit 366, and the second pitch connection unit 368 are provided in a speech encoder at a later stage to determine a pitch delay value when mutually encoding the speech. do.
도 4는 동일한 음성에 대해서 피치 더블링 또는 피치 트리플링 효과가 제거된 결과를 도시한 도면으로, 원으로 표시된 영역(400)에 피치 지연값의 정수배에 해당하는 값들이 제거됨을 알 수 있다.4 is a diagram illustrating a result of removing a pitch doubling or pitch triple effect for the same voice, and it can be seen that values corresponding to integer multiples of the pitch delay value are removed in the region 400 indicated by the circle.
도 5는 본 발명에 따른 음성부호화기에서 피치 지연값의 배수에 의한 영향의 제거 방법에 대한 일 실시예의 수행과정을 도시한 흐름도이다.FIG. 5 is a flowchart illustrating an embodiment of a method of canceling an influence caused by a multiple of a pitch delay value in a voice encoder according to the present invention.
도 5를 참조하면, 제1피치지연결정부(362)는 저역통과필터링된 신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다(S500). 산출된 제1피치 지연값, 제1피치 지연값의 ½값, 및 제1피치 지연값의 ⅓값은 저장부(364)에 저장된다(S510). 한편, 음성의 상호부호화기에서는 S500단계는 전단의 음성복호화기에 의해 수행되며, 후단의 음성부호화기는 산출된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 S500단계에서 산출된 제1피치지연값을 변경하고, 변경된 제1피치지연값을 저장부(364)에 저장한다(S520). 음성의 상호부호화기에서만 수행되는 S520단계는 점선으로 도시되어 있다. 비교부(366)는 이전 피치 지연값과 제1피치 지연값의 ½값을 비교하고(S530), 이전 피치 지연값과 제1피치 지연값의 ⅓값을 비교한다(S540). 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 또는 ⅓값이 동일하면, 제1피치 지연값을 이전 피치 지연값으로 설정한다(S550). 이와 달리, 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 및 ⅓값이 동일하지 않으면, 제1피치 지연값을 현재 피치 지연값으로 설정한다(S560).Referring to FIG. 5, the first pitch connection unit 362 calculates a first pitch delay value corresponding to a current pitch delay value from the low pass filtered signal (S500). The calculated first pitch delay value, the half value of the first pitch delay value, and the value of the first pitch delay value are stored in the storage unit 364 (S510). On the other hand, in the speech inter coder, step S500 is performed by the voice decoder of the front stage, and the voice encoder of the rear stage performs the closed loop pitch search based on the calculated first pitch delay value to calculate the first pitch delay value calculated in step S500. In operation S520, the changed first pitch delay value is stored in the storage unit 364. The step S520, which is performed only in the voice encoder, is shown by a dotted line. The comparator 366 compares the ½ value of the previous pitch delay value and the first pitch delay value (S530), and compares the value of the previous pitch delay value and the first pitch delay value (S540). The second pitch connection unit 368 sets the first pitch delay value to the previous pitch delay value if the previous pitch delay value and the ½ or ⅓ value of the first pitch delay value are the same (S550). On the contrary, if the second pitch connection unit 368 does not have the same value as ½ and ⅓ of the previous pitch delay value and the first pitch delay value, the second pitch connection unit 368 sets the first pitch delay value as the current pitch delay value (S560). .
본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법은 상호부호화기가 아닌 일반 음성부호화기에도 적용될 수 있다. 그리고, 본 발명은 음성부호화기에서 복호화기나 부호화기에서 다 적용될 수 있겠지만, 부호화기에 적용됨이 일반적이다. 따라서, 부호화기에서 개회로 검색을 통해서 피치 지연값의 범위를 정한 후에, 상술한 바와 같은 피치 지연값의 배수에 의한 영향을 제거하여 피치 지연값을 보정한다.The CELP-based speech coder capable of removing the influence of multiple pitch delay values and the method of removing the influence of multiple pitch delay values according to the present invention may be applied to a general voice encoder, not a mutual encoder. In addition, although the present invention can be applied to both a decoder and an encoder in a speech encoder, the present invention is generally applied to an encoder. Therefore, after the encoder determines the range of the pitch delay value through the open circuit search, the pitch delay value is corrected by removing the influence of the multiple of the pitch delay value as described above.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 장치에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 장치에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer device is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer devices so that the computer readable code is stored and executed in a distributed fashion.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.Although the preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the specific preferred embodiments described above, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the claims. Various modifications can be made by those skilled in the art, and such changes are within the scope of the claims.
본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 의하면, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.According to the present invention, a CELP-based speech coder capable of removing the influence of multiple pitch delay values and a method for removing the influence of multiple pitch delay values may include a pitch delay during speech encoding by a speech encoder or mutual encoding of a speech encoding period. The sound quality can be improved by removing the influence of the integer multiple of the value.
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048425A KR100554165B1 (en) | 2003-07-15 | 2003-07-15 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048425A KR100554165B1 (en) | 2003-07-15 | 2003-07-15 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050008357A true KR20050008357A (en) | 2005-01-21 |
KR100554165B1 KR100554165B1 (en) | 2006-02-22 |
Family
ID=37221617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030048425A KR100554165B1 (en) | 2003-07-15 | 2003-07-15 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100554165B1 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
JPH04149600A (en) * | 1990-10-12 | 1992-05-22 | Fujitsu Ltd | Voice decoding system |
KR970012285A (en) * | 1995-08-26 | 1997-03-29 | 김광호 | Pitch detection method of voice signal |
JP3358139B2 (en) * | 1995-12-22 | 2002-12-16 | 沖電気工業株式会社 | Voice pitch mark setting method |
KR20010113780A (en) * | 2000-02-10 | 2001-12-28 | 요트.게.아. 롤페즈 | Error correction method with pitch change detection |
KR100446739B1 (en) * | 2001-10-31 | 2004-09-01 | 엘지전자 주식회사 | Delay pitch extraction apparatus |
-
2003
- 2003-07-15 KR KR1020030048425A patent/KR100554165B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100554165B1 (en) | 2006-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6202046B1 (en) | Background noise/speech classification method | |
US6134518A (en) | Digital audio signal coding using a CELP coder and a transform coder | |
US8630863B2 (en) | Method and apparatus for encoding and decoding audio/speech signal | |
RU2441286C2 (en) | Method and apparatus for detecting sound activity and classifying sound signals | |
KR100269216B1 (en) | Pitch determination method with spectro-temporal auto correlation | |
KR20020052191A (en) | Variable bit-rate celp coding of speech with phonetic classification | |
JPH08328588A (en) | System for evaluation of pitch lag, voice coding device, method for evaluation of pitch lag and voice coding method | |
KR20150127041A (en) | Device and method for reducing quantization noise in a time-domain decoder | |
JP3254687B2 (en) | Audio coding method | |
JP3478209B2 (en) | Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium | |
JPH01155400A (en) | Voice encoding system | |
KR20040042903A (en) | Generalized analysis-by-synthesis speech coding method, and coder implementing such method | |
JPH1055199A (en) | Voice coding and decoding method and its device | |
US20090299737A1 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
KR20040032586A (en) | The pitch estimation algorithm by using the ratio of the maximum peak to candidates for the maximum of the autocorrelation function | |
RU2682851C2 (en) | Improved frame loss correction with voice information | |
JP2000112498A (en) | Audio coding method | |
KR100554165B1 (en) | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same | |
JP2003058186A (en) | Method and device for suppressing noise | |
Hwang | Computational improvement for G. 729 standard | |
Giacobello et al. | Joint estimation of short-term and long-term predictors in speech coders | |
KR20040076661A (en) | Apparatus and method of that consider energy distribution characteristic of speech signal | |
Liu et al. | LPCSE: Neural Speech Enhancement through Linear Predictive Coding | |
JP2001147700A (en) | Method and device for sound signal postprocessing and recording medium with program recorded | |
JP2003029798A (en) | Methods, devices, programs and recording media for encoding and decoding acoustic signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20090202 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |