KR100554165B1 - CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same - Google Patents
CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same Download PDFInfo
- Publication number
- KR100554165B1 KR100554165B1 KR1020030048425A KR20030048425A KR100554165B1 KR 100554165 B1 KR100554165 B1 KR 100554165B1 KR 1020030048425 A KR1020030048425 A KR 1020030048425A KR 20030048425 A KR20030048425 A KR 20030048425A KR 100554165 B1 KR100554165 B1 KR 100554165B1
- Authority
- KR
- South Korea
- Prior art keywords
- delay value
- pitch delay
- pitch
- value
- previous
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000000694 effects Effects 0.000 title claims abstract description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법이 개시된다. 제1피치지연결정부는 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다. 저장부에는 제1피치 지연값 및 제1피치 지연값의 1/n(단, n=2,3)값이 저장된다. 비교부는 이전 피치 지연값과 제1피치 지연값의 1/n값을 비교한다. 제2피치지연결정부는 이전 피치 지연값과 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 제1피치 지연값을 이전 피치 지연값으로 설정하고, 이전 피치 지연값과 제1피치 지연값의 1/n값이 모두 동일하지 않으면 제1피치 지연값을 현재 피치 지연값으로 설정한다. 본 발명에 따르면, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.Disclosed are a CELP-based speech coder capable of eliminating the effects of multiple pitch delay values and a method of eliminating the effects of multiple pitch delay values. The first pitch connection unit calculates a first pitch delay value corresponding to the current pitch delay value from the input voice signal. The storage unit stores the first pitch delay value and 1 / n (n = 2,3) of the first pitch delay value. The comparison unit compares the previous pitch delay value with the 1 / n value of the first pitch delay value. The second pitch connection unit sets the first pitch delay value to the previous pitch delay value if the at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, and the previous pitch delay value and the first pitch value. If the 1 / n values of the pitch delay values are not all the same, the first pitch delay value is set as the current pitch delay value. According to the present invention, the sound quality can be improved by eliminating the influence of the integer multiple of the pitch delay value during speech encoding by the speech encoder or during mutual encoding of the speech encoding period.
CELP, 음성 부호화기, 피치 지연값, multiple effectCELP, speech coder, pitch delay value, multiple effect
Description
도 1은 실제 피치 지연값의 정수배가 된 피치 지연값을 도시한 도면,1 is a diagram showing a pitch delay value that is an integer multiple of an actual pitch delay value,
도 2는 동일한 음성 입력을 G.729A 음성부호화기를 통해서 부호화했을 때 결정되는 피치 지연값의 정수값과 SMV 음성부호화기를 통해서 부호화했을 때 중간 과정에서 결정되는 피치 지연값의 정수값만을 비교한 도면,2 is a diagram comparing only the integer value of the pitch delay value determined when the same voice input is encoded through the G.729A speech encoder and the integer value of the pitch delay value determined in the intermediate process when the SMV speech encoder is encoded.
도 3은 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기에 대한 바람직한 일 실시예의 구성을 도시한 블록도,3 is a block diagram showing the configuration of a preferred embodiment of a CELP-based speech coder capable of removing the influence of multiples of a pitch delay value according to the present invention;
도 4는 동일한 음성에 대해서 피치 더블링 또는 피치 트리플링 효과가 제거된 결과를 도시한 도면, 그리고,4 is a diagram illustrating a result of removing a pitch doubling or pitch triple effect for the same voice; and
도 5는 본 발명에 따른 음성부호화기에서 피치 지연값의 배수에 의한 영향의 제거 방법에 대한 일 실시예의 수행과정을 도시한 흐름도이다.FIG. 5 is a flowchart illustrating an embodiment of a method of canceling an influence caused by a multiple of a pitch delay value in a voice encoder according to the present invention.
본 발명은 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부 호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 관한 것으로, 보다 상세하게는, 실제의 피치 지연값에 대한 정수배의 피치 지연값에 의한 음질의 저하를 방지할 수 있는 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 관한 것이다. The present invention relates to a CELP-based speech coder capable of removing the effects of multiple pitch delay values and a method of removing the effects of multiple pitch delay values. More particularly, the present invention relates to a pitch of an integer multiple of an actual pitch delay value. The present invention relates to a CELP-based speech encoder capable of preventing degradation of sound quality due to a delay value and a method for removing the influence by multiples of a pitch delay value.
CELP(Code Excited Linear Prediction) 구조의 음성부호화기는 음성을 임의의 여기 신호들을 선형 예측 필터(linear prediction filter)에 통과시켜 도식화한다. 선형 예측 필터는 선형 예측 분석(linear prediction analysis)에 의해 만들어 지고, 여기 신호들은 합성을 통한 분석(analysis by synthesis)을 통해서 생성된다. 여기 신호는 적응 코드북(adaptive codebook)과 고정 코드북(fixed codebook)으로 분류된다. A speech encoder of a Code Excited Linear Prediction (CELP) structure plots speech by passing arbitrary excitation signals through a linear prediction filter. The linear prediction filter is made by linear prediction analysis, and the excitation signals are generated through analysis by synthesis. The excitation signal is classified into an adaptive codebook and a fixed codebook.
적응 코드북은 적응 코드북 이득(adaptive codebook gain)과 피치 지연값으로 구성된다. CELP 구조의 음성부호화기에서 피치 지연값은 음성의 주기적 특성을 표현하는 값이다. 음성부호화기는 표준화된 상관값(normalized correlation)을 이용해서 피치 지연값을 구한다. 피치 지연값은 주로 정수값 + 소수값의 형태로 표현되며, 피치 지연값은 음성부호화기에 따라 서로 다른 정수 범위를 가지며, 소수의 표현범위도 상이하다.The adaptive codebook consists of adaptive codebook gain and pitch delay value. In the CELP-structured speech encoder, the pitch delay value represents a periodic characteristic of speech. The speech encoder obtains a pitch delay using a normalized correlation. The pitch delay value is mainly expressed in the form of an integer value + a decimal value. The pitch delay value has a different integer range according to the voice encoder, and the range of the decimal number is also different.
CELP 기반의 음성부호화기들 중에서 일부의 음성부호화기는 실제의 피치 지연값을 찾지 못하고, 실제 피치 지연값의 정수배가 된 피치 지연값을 찾는다. 이러한 실제 피치 지연값의 정수배인 피치 지연값이 나타나는 현상을 피치 더블링 또는 피치 트리플링이라 한다. 도 1에는 실제 피치 지연값(100)과 실제 피치 지연값의 정수배가 된 피치 지연값(110)이 도시되어 있다. 실제의 피치 지연값에 비해서 정수배된 피치 지연값은 일정한 음질의 저하를 야기한다. Some of the CELP-based speech encoders do not find an actual pitch delay value, but find a pitch delay value that is an integer multiple of the actual pitch delay value. The phenomenon in which the pitch delay value that is an integer multiple of the actual pitch delay value appears is called pitch doubling or pitch triple ring. 1 illustrates a
본 발명이 이루고자 하는 기술적 과제는, 음성부호화기에서 나타나는 실제 피치 지연값의 정수배에 해당하는 피치 지연값에 의한 음질의 저하를 방지할 수 있는 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법을 제공하는 데 있다.The technical problem to be achieved by the present invention is a CELP-based speech coder capable of preventing the degradation of sound quality due to a pitch delay value corresponding to an integer multiple of the actual pitch delay value shown in the speech coder and a method for removing the influence by multiples of the pitch delay value. To provide.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기는, 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 제1피치지연결정부; 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n(단, n=2,3)값이 저장되는 저장부; 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 비교부; 및 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 제2피치지연결정부;를 구비한다. In order to achieve the above technical problem, the CELP-based speech coder capable of removing the influence of multiples of the pitch delay value according to the present invention calculates a first pitch delay value corresponding to a current pitch delay value from an input speech signal. A first pitch connection; A storage unit for storing the first pitch delay value and 1 / n (where n = 2,3) of the first pitch delay value; A comparison unit comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And setting the first pitch delay value to a previous pitch delay value if the at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, and setting the first pitch delay value and the first pitch delay value. And a second pitch connection unit configured to set the first pitch delay value to a current pitch delay value if all of 1 / n values of the pitch delay values are not equal to each other.
상기의 다른 기술적 과제를 달성하기 위한, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거 방법은, CELP 기반의 음성부호화기 또는 상호부호화기에서 피치 지연값의 배수에 의한 영향을 제거하는 방법에 있어서, (a) 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 단계; (b) 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n값(단, n=2,3)을 메모리에 저장하는 단계; (c) 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 단계; 및 (d) 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 단계;를 포함한다. In order to achieve the above another object of the present invention, the method for removing the influence by the multiple of the pitch delay value in accordance with the present invention, in the method of eliminating the effect of the multiple of the pitch delay value in the CELP-based speech coder or mutual encoder, (a) calculating a first pitch delay value corresponding to a current pitch delay value from the input voice signal; (b) storing the first pitch delay value and the 1 / n value (n = 2,3) of the first pitch delay value in a memory; (c) comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And (d) if at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, set the first pitch delay value to a previous pitch delay value, and And setting the first pitch delay value to a current pitch delay value if all of 1 / n values of the first pitch delay value are not equal to each other.
이에 의해, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.Thereby, the sound quality can be improved by eliminating the influence of the integer multiple of the pitch delay value during speech encoding by the speech encoder or during mutual encoding of the speech encoding period.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법의 바람직한 실시예에 대해 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a preferred embodiment of a CELP-based speech coder capable of canceling the influence of the pitch delay value by a multiple of the pitch delay value and the method of removing the influence of the pitch delay value according to the present invention will be described in detail.
도 2는 동일한 음성 입력을 G.729A 음성부호화기를 통해서 부호화했을 때 결정되는 피치 지연값의 정수값과 SMV 음성부호화기를 통해서 부호화했을 때 중간 과정에서 결정되는 피치 지연값의 정수값만을 비교한 도면이다. 원으로 표시된 영역(200)에는 G.729A에 대한 피치 지연값이 상당히 크게 나타난다. 이는 G.729A 음성부호화기의 피치 지연값 검색이 제대로 이루어지지 않아서 피치 더블링 또는 피치 트리플링이 발생한 것이다.FIG. 2 is a diagram comparing only integer values of pitch delay values determined when encoding the same voice input through a G.729A voice encoder and integer values of pitch delay values determined in an intermediate process when encoding through an SMV voice encoder. . In the
피치 더블링 또는 피치 트리플링은 피치 지연값이 일정하게 유지될 때, 즉 유성음 구간이 일정하게 계속될 때 주로 일어난다. 피치 지연값을 구하는 과정은 음성의 주기적 특성을 구하는 과정으로서, 피치 더블링 또는 피치 트리플링은 주기가 일정한 신호가 지속될 때 음성부호화기가 실제 입력된 음성의 주기와는 상이한 주기를 구함으로써 발생한다. 즉, 주기의 특성상 T가 주기이면 2T도 주기일 수 있기 때문에, 음성부호화기가 주기를 구하는 과정에서 T가 아니라, 2T를 입력된 음성의 주기로 결정하는 현상이 피치 더블링 또는 피치 트리플링이라 할 수 있다.Pitch doubling or pitch triplering occurs mainly when the pitch delay value is kept constant, i.e. when the voiced sound section continues constant. The process of obtaining the pitch delay value is a process of determining the periodic characteristics of the voice. The pitch doubling or the pitch triple occurs when the voice encoder obtains a period different from the period of the voice actually input when the signal has a constant period. That is, since T may be a period of 2T if the period is a characteristic of the period, the phenomenon in which the voice encoder determines 2T as the period of the input voice in the process of obtaining the period may be referred to as pitch doubling or pitch tripleling. .
이러한 이유로 피치 더블링 또는 피치 트리플링 현상이 발생하므로, 피치 지연값이 일정하게 나오다가 갑자기 기존의 피치 지연값의 두 배 또는 세 배라면 이것은 피치 지연값이 잘못 결정된 것이라고 판단할 수 있다. 이론적으로는 4배, 5배의 값들도 나올 수 있으나, 이러한 값들은 실제적으로 잘 나오지 않는다.For this reason, the pitch doubling or pitch triple phenomena occur, so if the pitch delay value is constant and suddenly doubles or triples the existing pitch delay value, it may be determined that the pitch delay value is incorrectly determined. Theoretically, four or five times the values may come out, but these values are not really good.
도 3은 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기에 대한 바람직한 일 실시예의 구성을 도시한 블록도이다.3 is a block diagram showing the configuration of a preferred embodiment of a CELP-based speech coder capable of removing the influence of multiples of the pitch delay value according to the present invention.
도 3을 참조하면, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기는, 프레이머(310), 고역통과필터(320), 선형예측계수추출부(330), 선형예측필터(340), 저역통과필터(350), 및 피치지연산출부(360)를 구비한다. Referring to FIG. 3, the CELP-based speech coder capable of removing the influence of a multiple of the pitch delay value according to the present invention includes a
프레이머(310)는 입력된 음성신호의 분석을 위한 프레이밍을 수행한다. 프레이머(310)는 PCM 라인을 통해 연속적으로 들어오는 음성신호를 음성부호화기에 정의되어 있는 분석구간으로 분할한다. 고역통과필터(320)는 프레이머(311)의 출력신호중 음성신호에 포함되어 있는 원하지 않는 저주파 성분을 제거한다. 선형예측계 수추출부(330)는 고역통과필터링된 된 신호로부터 선형예측계수(Linear Prediction Coefficient : LPC)를 추출한다. 선형예측필터(340)는 선형예측계수추출부(330)에 의해 추출된 LPC를 이용하여 음성신호의 포르만트(Formant) 성분을 제거한다. 저역통과필터(350)는 선형예측필터링된 신호에서 피치이외의 성분을 필터링한다. 피치지연산출부(360)는 저역통과필터링된 신호로부터 피치지연값을 산출하고, 산출된 피치지연값을 기초로 정수배의 피치지연값을 제거하여 최종적인 피치지연값을 결정한다. The
피치지연산출부(360)는 제1피치지연결정부(362), 저장부(364), 비교부(366), 및 제2피치지연결정부(368)를 구비한다. 제1피치지연결정부(362)는 저역통과필터링된 신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다. 저장부(364)에는 산출된 제1피치 지연값, 제1피치 지연값의 ½값, 및 제1피치 지연값의 ⅓값이 저장된다. 비교부(366)는 이전 피치 지연값과 제1피치 지연값의 ½값을 비교하고, 이전 피치 지연값과 제1피치 지연값의 ⅓값을 비교한다. 제2피치지연결정부(368)는 비교부(366)의 비교결과를 기초로 피치 지연값을 재설정한다. 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 또는 ⅓값이 동일하면, 제1피치 지연값을 이전 피치 지연값으로 설정한다. 이와 달리, 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 및 제1피치 지연값의 ⅓값이 동일하지 않으면, 제1피치 지연값을 현재 피치 지연값으로 설정한다.The pitch
한편, 상호부호화기에서 피치 지연값을 변환할 때, 개회로 피치 검색(open loop pitch detection)을 수행하지 않는 대신에 상호부호화기의 입력의 피치 지연 값을 기준으로 폐회로 피치 검색(closed loop pitch detection) 과정을 수행한다. 본 발명을 이용하면, 이러한 폐회로 검색 과정에서 피치 지연값이 잘못 결정되는 문제점을 방지할 수 있다. 본 발명이 상호부호화기에 적용되는 경우에, 폐회로피치검색부(370)가 구비되며, 도 3에서 폐회로피치검색부(370)는 점선으로 표시되어 있다. 폐회로피치검색부(370)는 제1피치지연결정부(362)에 의해 결정된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 제1피치 지연값을 변경하고, 변경된 제1피치 지연값, 변경된 제1피치 지연값의 ½값, 및 변경된 제1피치 지연값의 ⅓값을 저장부(364)에 저장한다. 이 경우, 프레이머(310), 고역통과필터(320), 선형예측계수추출부(330), 선형예측필터(340), 저역통과필터(350), 및 제1피치지연결정부(362)는 전단의 음성 복호화기를 구성한다. 그리고, 폐회로피치검색부(370), 저장부(364), 비교부(366), 및 제2피치지연결정부(368)는 후단의 음성 부호화기에 구비되어 음성의 상호부호화시 피치지연값을 결정한다. On the other hand, when converting the pitch delay value in the inter encoder, instead of performing open loop pitch detection, a closed loop pitch detection process based on the pitch delay value of the input of the inter encoder. Do this. By using the present invention, it is possible to prevent the problem that the pitch delay value is incorrectly determined in the closed loop search process. In the case where the present invention is applied to the mutual encoder, the closed loop
도 4는 동일한 음성에 대해서 피치 더블링 또는 피치 트리플링 효과가 제거된 결과를 도시한 도면으로, 원으로 표시된 영역(400)에 피치 지연값의 정수배에 해당하는 값들이 제거됨을 알 수 있다. 4 is a diagram illustrating a result of removing a pitch doubling or pitch triple effect for the same voice, and it can be seen that values corresponding to integer multiples of the pitch delay value are removed in the
도 5는 본 발명에 따른 음성부호화기에서 피치 지연값의 배수에 의한 영향의 제거 방법에 대한 일 실시예의 수행과정을 도시한 흐름도이다.FIG. 5 is a flowchart illustrating an embodiment of a method of canceling an influence caused by a multiple of a pitch delay value in a voice encoder according to the present invention.
도 5를 참조하면, 제1피치지연결정부(362)는 저역통과필터링된 신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다(S500). 산출된 제1피치 지연값, 제1피치 지연값의 ½값, 및 제1피치 지연값의 ⅓값은 저장부(364)에 저장 된다(S510). 한편, 음성의 상호부호화기에서는 S500단계는 전단의 음성복호화기에 의해 수행되며, 후단의 음성부호화기는 산출된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 S500단계에서 산출된 제1피치지연값을 변경하고, 변경된 제1피치지연값을 저장부(364)에 저장한다(S520). 음성의 상호부호화기에서만 수행되는 S520단계는 점선으로 도시되어 있다. 비교부(366)는 이전 피치 지연값과 제1피치 지연값의 ½값을 비교하고(S530), 이전 피치 지연값과 제1피치 지연값의 ⅓값을 비교한다(S540). 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 또는 ⅓값이 동일하면, 제1피치 지연값을 이전 피치 지연값으로 설정한다(S550). 이와 달리, 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 및 ⅓값이 동일하지 않으면, 제1피치 지연값을 현재 피치 지연값으로 설정한다(S560).Referring to FIG. 5, the first
본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법은 상호부호화기가 아닌 일반 음성부호화기에도 적용될 수 있다. 그리고, 본 발명은 음성부호화기에서 복호화기나 부호화기에서 다 적용될 수 있겠지만, 부호화기에 적용됨이 일반적이다. 따라서, 부호화기에서 개회로 검색을 통해서 피치 지연값의 범위를 정한 후에, 상술한 바와 같은 피치 지연값의 배수에 의한 영향을 제거하여 피치 지연값을 보정한다.The CELP-based speech coder capable of removing the influence of multiple pitch delay values and the method of removing the influence of multiple pitch delay values according to the present invention may be applied to a general voice encoder, not a mutual encoder. In addition, although the present invention can be applied to both a decoder and an encoder in a speech encoder, the present invention is generally applied to an encoder. Therefore, after the encoder determines the range of the pitch delay value through the open circuit search, the pitch delay value is corrected by removing the influence of the multiple of the pitch delay value as described above.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 장치 에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 장치에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer device. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer devices so that the computer readable code is stored and executed in a distributed fashion.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.Although the preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the specific preferred embodiments described above, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the claims. Various modifications can be made by those skilled in the art, and such changes are within the scope of the claims.
본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 의하면, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.According to the present invention, a CELP-based speech coder capable of removing the influence of multiple pitch delay values and a method for removing the influence of multiple pitch delay values may include a pitch delay during speech encoding by a speech encoder or mutual encoding of a speech encoding period. The sound quality can be improved by removing the influence of the integer multiple of the value.
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048425A KR100554165B1 (en) | 2003-07-15 | 2003-07-15 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048425A KR100554165B1 (en) | 2003-07-15 | 2003-07-15 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050008357A KR20050008357A (en) | 2005-01-21 |
KR100554165B1 true KR100554165B1 (en) | 2006-02-22 |
Family
ID=37221617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030048425A KR100554165B1 (en) | 2003-07-15 | 2003-07-15 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100554165B1 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
JPH04149600A (en) * | 1990-10-12 | 1992-05-22 | Fujitsu Ltd | Voice decoding system |
KR970012285A (en) * | 1995-08-26 | 1997-03-29 | 김광호 | Pitch detection method of voice signal |
JPH09179586A (en) * | 1995-12-22 | 1997-07-11 | Oki Electric Ind Co Ltd | Setting method for voice pitch mark |
KR20010113780A (en) * | 2000-02-10 | 2001-12-28 | 요트.게.아. 롤페즈 | Error correction method with pitch change detection |
KR20030035443A (en) * | 2001-10-31 | 2003-05-09 | 엘지전자 주식회사 | Delay pitch extraction apparatus and method |
-
2003
- 2003-07-15 KR KR1020030048425A patent/KR100554165B1/en not_active IP Right Cessation
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
JPH04149600A (en) * | 1990-10-12 | 1992-05-22 | Fujitsu Ltd | Voice decoding system |
KR970012285A (en) * | 1995-08-26 | 1997-03-29 | 김광호 | Pitch detection method of voice signal |
JPH09179586A (en) * | 1995-12-22 | 1997-07-11 | Oki Electric Ind Co Ltd | Setting method for voice pitch mark |
KR20010113780A (en) * | 2000-02-10 | 2001-12-28 | 요트.게.아. 롤페즈 | Error correction method with pitch change detection |
KR20030035443A (en) * | 2001-10-31 | 2003-05-09 | 엘지전자 주식회사 | Delay pitch extraction apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
KR20050008357A (en) | 2005-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7191120B2 (en) | Speech encoding method, apparatus and program | |
US9418666B2 (en) | Method and apparatus for encoding and decoding audio/speech signal | |
US6134518A (en) | Digital audio signal coding using a CELP coder and a transform coder | |
JP2964879B2 (en) | Post filter | |
KR20020052191A (en) | Variable bit-rate celp coding of speech with phonetic classification | |
JPH08328588A (en) | System for evaluation of pitch lag, voice coding device, method for evaluation of pitch lag and voice coding method | |
TWI582758B (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
KR20150127041A (en) | Device and method for reducing quantization noise in a time-domain decoder | |
CN107248411B (en) | Lost frame compensation processing method and device | |
JP3478209B2 (en) | Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium | |
JPH04270398A (en) | Voice encoding system | |
JPH01155400A (en) | Voice encoding system | |
KR20040042903A (en) | Generalized analysis-by-synthesis speech coding method, and coder implementing such method | |
JPH1055199A (en) | Voice coding and decoding method and its device | |
US20090299737A1 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
KR20040032586A (en) | The pitch estimation algorithm by using the ratio of the maximum peak to candidates for the maximum of the autocorrelation function | |
KR20230129581A (en) | Improved frame loss correction with voice information | |
KR100554165B1 (en) | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same | |
Hwang | Computational improvement for G. 729 standard | |
Giacobello et al. | Joint estimation of short-term and long-term predictors in speech coders | |
JP3089967B2 (en) | Audio coding device | |
JP2001147700A (en) | Method and device for sound signal postprocessing and recording medium with program recorded | |
US20220180884A1 (en) | Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack | |
JPH08211895A (en) | System and method for evaluation of pitch lag as well as apparatus and method for coding of sound | |
JP2003029798A (en) | Methods, devices, programs and recording media for encoding and decoding acoustic signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20090202 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |