KR100554165B1 - CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same - Google Patents

CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same Download PDF

Info

Publication number
KR100554165B1
KR100554165B1 KR1020030048425A KR20030048425A KR100554165B1 KR 100554165 B1 KR100554165 B1 KR 100554165B1 KR 1020030048425 A KR1020030048425 A KR 1020030048425A KR 20030048425 A KR20030048425 A KR 20030048425A KR 100554165 B1 KR100554165 B1 KR 100554165B1
Authority
KR
South Korea
Prior art keywords
delay value
pitch delay
pitch
value
previous
Prior art date
Application number
KR1020030048425A
Other languages
Korean (ko)
Other versions
KR20050008357A (en
Inventor
이응돈
김현우
김도영
유창동
서성호
장달원
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020030048425A priority Critical patent/KR100554165B1/en
Publication of KR20050008357A publication Critical patent/KR20050008357A/en
Application granted granted Critical
Publication of KR100554165B1 publication Critical patent/KR100554165B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법이 개시된다. 제1피치지연결정부는 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다. 저장부에는 제1피치 지연값 및 제1피치 지연값의 1/n(단, n=2,3)값이 저장된다. 비교부는 이전 피치 지연값과 제1피치 지연값의 1/n값을 비교한다. 제2피치지연결정부는 이전 피치 지연값과 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 제1피치 지연값을 이전 피치 지연값으로 설정하고, 이전 피치 지연값과 제1피치 지연값의 1/n값이 모두 동일하지 않으면 제1피치 지연값을 현재 피치 지연값으로 설정한다. 본 발명에 따르면, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.Disclosed are a CELP-based speech coder capable of eliminating the effects of multiple pitch delay values and a method of eliminating the effects of multiple pitch delay values. The first pitch connection unit calculates a first pitch delay value corresponding to the current pitch delay value from the input voice signal. The storage unit stores the first pitch delay value and 1 / n (n = 2,3) of the first pitch delay value. The comparison unit compares the previous pitch delay value with the 1 / n value of the first pitch delay value. The second pitch connection unit sets the first pitch delay value to the previous pitch delay value if the at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, and the previous pitch delay value and the first pitch value. If the 1 / n values of the pitch delay values are not all the same, the first pitch delay value is set as the current pitch delay value. According to the present invention, the sound quality can be improved by eliminating the influence of the integer multiple of the pitch delay value during speech encoding by the speech encoder or during mutual encoding of the speech encoding period.

CELP, 음성 부호화기, 피치 지연값, multiple effectCELP, speech coder, pitch delay value, multiple effect

Description

피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법{CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same}CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same}

도 1은 실제 피치 지연값의 정수배가 된 피치 지연값을 도시한 도면,1 is a diagram showing a pitch delay value that is an integer multiple of an actual pitch delay value,

도 2는 동일한 음성 입력을 G.729A 음성부호화기를 통해서 부호화했을 때 결정되는 피치 지연값의 정수값과 SMV 음성부호화기를 통해서 부호화했을 때 중간 과정에서 결정되는 피치 지연값의 정수값만을 비교한 도면,2 is a diagram comparing only the integer value of the pitch delay value determined when the same voice input is encoded through the G.729A speech encoder and the integer value of the pitch delay value determined in the intermediate process when the SMV speech encoder is encoded.

도 3은 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기에 대한 바람직한 일 실시예의 구성을 도시한 블록도,3 is a block diagram showing the configuration of a preferred embodiment of a CELP-based speech coder capable of removing the influence of multiples of a pitch delay value according to the present invention;

도 4는 동일한 음성에 대해서 피치 더블링 또는 피치 트리플링 효과가 제거된 결과를 도시한 도면, 그리고,4 is a diagram illustrating a result of removing a pitch doubling or pitch triple effect for the same voice; and

도 5는 본 발명에 따른 음성부호화기에서 피치 지연값의 배수에 의한 영향의 제거 방법에 대한 일 실시예의 수행과정을 도시한 흐름도이다.FIG. 5 is a flowchart illustrating an embodiment of a method of canceling an influence caused by a multiple of a pitch delay value in a voice encoder according to the present invention.

본 발명은 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부 호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 관한 것으로, 보다 상세하게는, 실제의 피치 지연값에 대한 정수배의 피치 지연값에 의한 음질의 저하를 방지할 수 있는 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 관한 것이다. The present invention relates to a CELP-based speech coder capable of removing the effects of multiple pitch delay values and a method of removing the effects of multiple pitch delay values. More particularly, the present invention relates to a pitch of an integer multiple of an actual pitch delay value. The present invention relates to a CELP-based speech encoder capable of preventing degradation of sound quality due to a delay value and a method for removing the influence by multiples of a pitch delay value.

CELP(Code Excited Linear Prediction) 구조의 음성부호화기는 음성을 임의의 여기 신호들을 선형 예측 필터(linear prediction filter)에 통과시켜 도식화한다. 선형 예측 필터는 선형 예측 분석(linear prediction analysis)에 의해 만들어 지고, 여기 신호들은 합성을 통한 분석(analysis by synthesis)을 통해서 생성된다. 여기 신호는 적응 코드북(adaptive codebook)과 고정 코드북(fixed codebook)으로 분류된다. A speech encoder of a Code Excited Linear Prediction (CELP) structure plots speech by passing arbitrary excitation signals through a linear prediction filter. The linear prediction filter is made by linear prediction analysis, and the excitation signals are generated through analysis by synthesis. The excitation signal is classified into an adaptive codebook and a fixed codebook.

적응 코드북은 적응 코드북 이득(adaptive codebook gain)과 피치 지연값으로 구성된다. CELP 구조의 음성부호화기에서 피치 지연값은 음성의 주기적 특성을 표현하는 값이다. 음성부호화기는 표준화된 상관값(normalized correlation)을 이용해서 피치 지연값을 구한다. 피치 지연값은 주로 정수값 + 소수값의 형태로 표현되며, 피치 지연값은 음성부호화기에 따라 서로 다른 정수 범위를 가지며, 소수의 표현범위도 상이하다.The adaptive codebook consists of adaptive codebook gain and pitch delay value. In the CELP-structured speech encoder, the pitch delay value represents a periodic characteristic of speech. The speech encoder obtains a pitch delay using a normalized correlation. The pitch delay value is mainly expressed in the form of an integer value + a decimal value. The pitch delay value has a different integer range according to the voice encoder, and the range of the decimal number is also different.

CELP 기반의 음성부호화기들 중에서 일부의 음성부호화기는 실제의 피치 지연값을 찾지 못하고, 실제 피치 지연값의 정수배가 된 피치 지연값을 찾는다. 이러한 실제 피치 지연값의 정수배인 피치 지연값이 나타나는 현상을 피치 더블링 또는 피치 트리플링이라 한다. 도 1에는 실제 피치 지연값(100)과 실제 피치 지연값의 정수배가 된 피치 지연값(110)이 도시되어 있다. 실제의 피치 지연값에 비해서 정수배된 피치 지연값은 일정한 음질의 저하를 야기한다. Some of the CELP-based speech encoders do not find an actual pitch delay value, but find a pitch delay value that is an integer multiple of the actual pitch delay value. The phenomenon in which the pitch delay value that is an integer multiple of the actual pitch delay value appears is called pitch doubling or pitch triple ring. 1 illustrates a pitch delay value 110 that is an integer multiple of an actual pitch delay value 100 and an actual pitch delay value. An integer multiple of the pitch delay value compared to the actual pitch delay value causes a constant deterioration in sound quality.

본 발명이 이루고자 하는 기술적 과제는, 음성부호화기에서 나타나는 실제 피치 지연값의 정수배에 해당하는 피치 지연값에 의한 음질의 저하를 방지할 수 있는 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법을 제공하는 데 있다.The technical problem to be achieved by the present invention is a CELP-based speech coder capable of preventing the degradation of sound quality due to a pitch delay value corresponding to an integer multiple of the actual pitch delay value shown in the speech coder and a method for removing the influence by multiples of the pitch delay value. To provide.

상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기는, 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 제1피치지연결정부; 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n(단, n=2,3)값이 저장되는 저장부; 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 비교부; 및 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 제2피치지연결정부;를 구비한다. In order to achieve the above technical problem, the CELP-based speech coder capable of removing the influence of multiples of the pitch delay value according to the present invention calculates a first pitch delay value corresponding to a current pitch delay value from an input speech signal. A first pitch connection; A storage unit for storing the first pitch delay value and 1 / n (where n = 2,3) of the first pitch delay value; A comparison unit comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And setting the first pitch delay value to a previous pitch delay value if the at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, and setting the first pitch delay value and the first pitch delay value. And a second pitch connection unit configured to set the first pitch delay value to a current pitch delay value if all of 1 / n values of the pitch delay values are not equal to each other.

상기의 다른 기술적 과제를 달성하기 위한, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거 방법은, CELP 기반의 음성부호화기 또는 상호부호화기에서 피치 지연값의 배수에 의한 영향을 제거하는 방법에 있어서, (a) 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 단계; (b) 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n값(단, n=2,3)을 메모리에 저장하는 단계; (c) 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 단계; 및 (d) 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 단계;를 포함한다. In order to achieve the above another object of the present invention, the method for removing the influence by the multiple of the pitch delay value in accordance with the present invention, in the method of eliminating the effect of the multiple of the pitch delay value in the CELP-based speech coder or mutual encoder, (a) calculating a first pitch delay value corresponding to a current pitch delay value from the input voice signal; (b) storing the first pitch delay value and the 1 / n value (n = 2,3) of the first pitch delay value in a memory; (c) comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And (d) if at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, set the first pitch delay value to a previous pitch delay value, and And setting the first pitch delay value to a current pitch delay value if all of 1 / n values of the first pitch delay value are not equal to each other.

이에 의해, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.Thereby, the sound quality can be improved by eliminating the influence of the integer multiple of the pitch delay value during speech encoding by the speech encoder or during mutual encoding of the speech encoding period.

이하에서 첨부된 도면들을 참조하여 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법의 바람직한 실시예에 대해 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a preferred embodiment of a CELP-based speech coder capable of canceling the influence of the pitch delay value by a multiple of the pitch delay value and the method of removing the influence of the pitch delay value according to the present invention will be described in detail.

도 2는 동일한 음성 입력을 G.729A 음성부호화기를 통해서 부호화했을 때 결정되는 피치 지연값의 정수값과 SMV 음성부호화기를 통해서 부호화했을 때 중간 과정에서 결정되는 피치 지연값의 정수값만을 비교한 도면이다. 원으로 표시된 영역(200)에는 G.729A에 대한 피치 지연값이 상당히 크게 나타난다. 이는 G.729A 음성부호화기의 피치 지연값 검색이 제대로 이루어지지 않아서 피치 더블링 또는 피치 트리플링이 발생한 것이다.FIG. 2 is a diagram comparing only integer values of pitch delay values determined when encoding the same voice input through a G.729A voice encoder and integer values of pitch delay values determined in an intermediate process when encoding through an SMV voice encoder. . In the area 200 indicated by the circle, the pitch delay value for G.729A appears to be quite large. This is because pitch doubling of the G.729A voice encoder is not properly performed, resulting in pitch doubling or pitch triple ringing.

피치 더블링 또는 피치 트리플링은 피치 지연값이 일정하게 유지될 때, 즉 유성음 구간이 일정하게 계속될 때 주로 일어난다. 피치 지연값을 구하는 과정은 음성의 주기적 특성을 구하는 과정으로서, 피치 더블링 또는 피치 트리플링은 주기가 일정한 신호가 지속될 때 음성부호화기가 실제 입력된 음성의 주기와는 상이한 주기를 구함으로써 발생한다. 즉, 주기의 특성상 T가 주기이면 2T도 주기일 수 있기 때문에, 음성부호화기가 주기를 구하는 과정에서 T가 아니라, 2T를 입력된 음성의 주기로 결정하는 현상이 피치 더블링 또는 피치 트리플링이라 할 수 있다.Pitch doubling or pitch triplering occurs mainly when the pitch delay value is kept constant, i.e. when the voiced sound section continues constant. The process of obtaining the pitch delay value is a process of determining the periodic characteristics of the voice. The pitch doubling or the pitch triple occurs when the voice encoder obtains a period different from the period of the voice actually input when the signal has a constant period. That is, since T may be a period of 2T if the period is a characteristic of the period, the phenomenon in which the voice encoder determines 2T as the period of the input voice in the process of obtaining the period may be referred to as pitch doubling or pitch tripleling. .

이러한 이유로 피치 더블링 또는 피치 트리플링 현상이 발생하므로, 피치 지연값이 일정하게 나오다가 갑자기 기존의 피치 지연값의 두 배 또는 세 배라면 이것은 피치 지연값이 잘못 결정된 것이라고 판단할 수 있다. 이론적으로는 4배, 5배의 값들도 나올 수 있으나, 이러한 값들은 실제적으로 잘 나오지 않는다.For this reason, the pitch doubling or pitch triple phenomena occur, so if the pitch delay value is constant and suddenly doubles or triples the existing pitch delay value, it may be determined that the pitch delay value is incorrectly determined. Theoretically, four or five times the values may come out, but these values are not really good.

도 3은 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기에 대한 바람직한 일 실시예의 구성을 도시한 블록도이다.3 is a block diagram showing the configuration of a preferred embodiment of a CELP-based speech coder capable of removing the influence of multiples of the pitch delay value according to the present invention.

도 3을 참조하면, 본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기는, 프레이머(310), 고역통과필터(320), 선형예측계수추출부(330), 선형예측필터(340), 저역통과필터(350), 및 피치지연산출부(360)를 구비한다. Referring to FIG. 3, the CELP-based speech coder capable of removing the influence of a multiple of the pitch delay value according to the present invention includes a framer 310, a high pass filter 320, a linear predictive coefficient extractor 330, and a linear predictor. A filter 340, a low pass filter 350, and a pitch delay calculation unit 360 are provided.

프레이머(310)는 입력된 음성신호의 분석을 위한 프레이밍을 수행한다. 프레이머(310)는 PCM 라인을 통해 연속적으로 들어오는 음성신호를 음성부호화기에 정의되어 있는 분석구간으로 분할한다. 고역통과필터(320)는 프레이머(311)의 출력신호중 음성신호에 포함되어 있는 원하지 않는 저주파 성분을 제거한다. 선형예측계 수추출부(330)는 고역통과필터링된 된 신호로부터 선형예측계수(Linear Prediction Coefficient : LPC)를 추출한다. 선형예측필터(340)는 선형예측계수추출부(330)에 의해 추출된 LPC를 이용하여 음성신호의 포르만트(Formant) 성분을 제거한다. 저역통과필터(350)는 선형예측필터링된 신호에서 피치이외의 성분을 필터링한다. 피치지연산출부(360)는 저역통과필터링된 신호로부터 피치지연값을 산출하고, 산출된 피치지연값을 기초로 정수배의 피치지연값을 제거하여 최종적인 피치지연값을 결정한다. The framer 310 performs framing to analyze the input voice signal. The framer 310 divides the voice signal continuously received through the PCM line into an analysis section defined in the voice encoder. The high pass filter 320 removes unwanted low frequency components included in the audio signal from the output signal of the framer 311. The linear prediction coefficient extractor 330 extracts a linear prediction coefficient (LPC) from the high pass filtered signal. The linear prediction filter 340 removes the formant component of the voice signal by using the LPC extracted by the linear prediction coefficient extractor 330. The low pass filter 350 filters components other than the pitch in the linear predictive filtered signal. The pitch delay calculation unit 360 calculates a pitch delay value from the low pass filtered signal, and determines a final pitch delay value by removing an integer multiple of the pitch delay value based on the calculated pitch delay value.

피치지연산출부(360)는 제1피치지연결정부(362), 저장부(364), 비교부(366), 및 제2피치지연결정부(368)를 구비한다. 제1피치지연결정부(362)는 저역통과필터링된 신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다. 저장부(364)에는 산출된 제1피치 지연값, 제1피치 지연값의 ½값, 및 제1피치 지연값의 ⅓값이 저장된다. 비교부(366)는 이전 피치 지연값과 제1피치 지연값의 ½값을 비교하고, 이전 피치 지연값과 제1피치 지연값의 ⅓값을 비교한다. 제2피치지연결정부(368)는 비교부(366)의 비교결과를 기초로 피치 지연값을 재설정한다. 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 또는 ⅓값이 동일하면, 제1피치 지연값을 이전 피치 지연값으로 설정한다. 이와 달리, 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 및 제1피치 지연값의 ⅓값이 동일하지 않으면, 제1피치 지연값을 현재 피치 지연값으로 설정한다.The pitch delay calculation unit 360 includes a first pitch connection unit 362, a storage unit 364, a comparison unit 366, and a second pitch connection unit 368. The first pitch connection unit 362 calculates a first pitch delay value corresponding to the current pitch delay value from the low pass filtered signal. The storage unit 364 stores the calculated first pitch delay value, ½ value of the first pitch delay value, and the? Value of the first pitch delay value. The comparator 366 compares the 1/2 value of the previous pitch delay value and the first pitch delay value, and compares the? Value of the previous pitch delay value and the first pitch delay value. The second pitch connection unit 368 resets the pitch delay value based on the comparison result of the comparison unit 366. The second pitch connection unit 368 sets the first pitch delay value to the previous pitch delay value when the ½ or ⅓ value of the previous pitch delay value and the first pitch delay value are the same. On the contrary, if the pitch value of the first pitch delay value and the first pitch delay value are not equal to each other, the second pitch connection unit 368 replaces the first pitch delay value with the current pitch delay value. Set to.

한편, 상호부호화기에서 피치 지연값을 변환할 때, 개회로 피치 검색(open loop pitch detection)을 수행하지 않는 대신에 상호부호화기의 입력의 피치 지연 값을 기준으로 폐회로 피치 검색(closed loop pitch detection) 과정을 수행한다. 본 발명을 이용하면, 이러한 폐회로 검색 과정에서 피치 지연값이 잘못 결정되는 문제점을 방지할 수 있다. 본 발명이 상호부호화기에 적용되는 경우에, 폐회로피치검색부(370)가 구비되며, 도 3에서 폐회로피치검색부(370)는 점선으로 표시되어 있다. 폐회로피치검색부(370)는 제1피치지연결정부(362)에 의해 결정된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 제1피치 지연값을 변경하고, 변경된 제1피치 지연값, 변경된 제1피치 지연값의 ½값, 및 변경된 제1피치 지연값의 ⅓값을 저장부(364)에 저장한다. 이 경우, 프레이머(310), 고역통과필터(320), 선형예측계수추출부(330), 선형예측필터(340), 저역통과필터(350), 및 제1피치지연결정부(362)는 전단의 음성 복호화기를 구성한다. 그리고, 폐회로피치검색부(370), 저장부(364), 비교부(366), 및 제2피치지연결정부(368)는 후단의 음성 부호화기에 구비되어 음성의 상호부호화시 피치지연값을 결정한다. On the other hand, when converting the pitch delay value in the inter encoder, instead of performing open loop pitch detection, a closed loop pitch detection process based on the pitch delay value of the input of the inter encoder. Do this. By using the present invention, it is possible to prevent the problem that the pitch delay value is incorrectly determined in the closed loop search process. In the case where the present invention is applied to the mutual encoder, the closed loop pitch search unit 370 is provided, and the closed loop pitch search unit 370 is indicated by a dotted line in FIG. 3. The closed loop pitch search unit 370 performs a closed loop pitch search based on the first pitch delay value determined by the first pitch connection unit 362, changes the first pitch delay value, changes the first pitch delay value, The ½ value of the changed first pitch delay value and the ⅓ value of the changed first pitch delay value are stored in the storage unit 364. In this case, the framer 310, the high pass filter 320, the linear predictive coefficient extractor 330, the linear predictive filter 340, the low pass filter 350, and the first pitch connection unit 362 are sheared. Configure a voice decoder. The closed-loop pitch search unit 370, the storage unit 364, the comparison unit 366, and the second pitch connection unit 368 are provided in a speech encoder at a later stage to determine a pitch delay value when mutually encoding the speech. do.

도 4는 동일한 음성에 대해서 피치 더블링 또는 피치 트리플링 효과가 제거된 결과를 도시한 도면으로, 원으로 표시된 영역(400)에 피치 지연값의 정수배에 해당하는 값들이 제거됨을 알 수 있다. 4 is a diagram illustrating a result of removing a pitch doubling or pitch triple effect for the same voice, and it can be seen that values corresponding to integer multiples of the pitch delay value are removed in the region 400 indicated by the circle.

도 5는 본 발명에 따른 음성부호화기에서 피치 지연값의 배수에 의한 영향의 제거 방법에 대한 일 실시예의 수행과정을 도시한 흐름도이다.FIG. 5 is a flowchart illustrating an embodiment of a method of canceling an influence caused by a multiple of a pitch delay value in a voice encoder according to the present invention.

도 5를 참조하면, 제1피치지연결정부(362)는 저역통과필터링된 신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출한다(S500). 산출된 제1피치 지연값, 제1피치 지연값의 ½값, 및 제1피치 지연값의 ⅓값은 저장부(364)에 저장 된다(S510). 한편, 음성의 상호부호화기에서는 S500단계는 전단의 음성복호화기에 의해 수행되며, 후단의 음성부호화기는 산출된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 S500단계에서 산출된 제1피치지연값을 변경하고, 변경된 제1피치지연값을 저장부(364)에 저장한다(S520). 음성의 상호부호화기에서만 수행되는 S520단계는 점선으로 도시되어 있다. 비교부(366)는 이전 피치 지연값과 제1피치 지연값의 ½값을 비교하고(S530), 이전 피치 지연값과 제1피치 지연값의 ⅓값을 비교한다(S540). 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 또는 ⅓값이 동일하면, 제1피치 지연값을 이전 피치 지연값으로 설정한다(S550). 이와 달리, 제2피치지연결정부(368)는 이전 피치 지연값과 제1피치 지연값의 ½값 및 ⅓값이 동일하지 않으면, 제1피치 지연값을 현재 피치 지연값으로 설정한다(S560).Referring to FIG. 5, the first pitch connection unit 362 calculates a first pitch delay value corresponding to a current pitch delay value from the low pass filtered signal (S500). The calculated first pitch delay value, the half value of the first pitch delay value, and the value of the first pitch delay value are stored in the storage unit 364 (S510). On the other hand, in the speech inter coder, step S500 is performed by the voice decoder of the front stage, and the voice encoder of the rear stage performs the closed loop pitch search based on the calculated first pitch delay value to calculate the first pitch delay value calculated in step S500. In operation S520, the changed first pitch delay value is stored in the storage unit 364. The step S520, which is performed only in the voice encoder, is shown by a dotted line. The comparator 366 compares the ½ value of the previous pitch delay value and the first pitch delay value (S530), and compares the value of the previous pitch delay value and the first pitch delay value (S540). The second pitch connection unit 368 sets the first pitch delay value to the previous pitch delay value if the previous pitch delay value and the ½ or ⅓ value of the first pitch delay value are the same (S550). On the contrary, if the second pitch connection unit 368 does not have the same value as ½ and ⅓ of the previous pitch delay value and the first pitch delay value, the second pitch connection unit 368 sets the first pitch delay value as the current pitch delay value (S560). .

본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법은 상호부호화기가 아닌 일반 음성부호화기에도 적용될 수 있다. 그리고, 본 발명은 음성부호화기에서 복호화기나 부호화기에서 다 적용될 수 있겠지만, 부호화기에 적용됨이 일반적이다. 따라서, 부호화기에서 개회로 검색을 통해서 피치 지연값의 범위를 정한 후에, 상술한 바와 같은 피치 지연값의 배수에 의한 영향을 제거하여 피치 지연값을 보정한다.The CELP-based speech coder capable of removing the influence of multiple pitch delay values and the method of removing the influence of multiple pitch delay values according to the present invention may be applied to a general voice encoder, not a mutual encoder. In addition, although the present invention can be applied to both a decoder and an encoder in a speech encoder, the present invention is generally applied to an encoder. Therefore, after the encoder determines the range of the pitch delay value through the open circuit search, the pitch delay value is corrected by removing the influence of the multiple of the pitch delay value as described above.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 장치 에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 장치에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer device. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer devices so that the computer readable code is stored and executed in a distributed fashion.

이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.Although the preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the specific preferred embodiments described above, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the claims. Various modifications can be made by those skilled in the art, and such changes are within the scope of the claims.

본 발명에 따른 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기 및 피치 지연값의 배수에 의한 영향 제거 방법에 의하면, 음성부호화기에 의한 음성부호화시 또는 음성부호화기간의 상호부호화시 피치 지연값의 정수배에 의한 영향을 제거함으로써 음질을 향상시킬 수 있다.According to the present invention, a CELP-based speech coder capable of removing the influence of multiple pitch delay values and a method for removing the influence of multiple pitch delay values may include a pitch delay during speech encoding by a speech encoder or mutual encoding of a speech encoding period. The sound quality can be improved by removing the influence of the integer multiple of the value.

Claims (4)

입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 제1피치지연결정부;A first pitch connection unit for calculating a first pitch delay value corresponding to a current pitch delay value from the input voice signal; 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n(단, n=2,3)값이 저장되는 저장부;A storage unit for storing the first pitch delay value and 1 / n (where n = 2,3) of the first pitch delay value; 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 비교부; 및A comparison unit comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 제2피치지연결정부;를 포함하는 것을 특징으로 하는 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기.If at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, the first pitch delay value is set as a previous pitch delay value, and the previous pitch delay value and the first pitch If the 1 / n value of the delay value is not all the same, the second pitch connection unit for setting the first pitch delay value to the current pitch delay value; comprising: CELP-based speech coder available. 제 1항에 있어서,The method of claim 1, 상기 제1피치지연결정부에 의해 결정된 상기 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 상기 제1피치 지연값을 변경하고, 상기 변경된 제1피치 지연값 및 상기 변경된 제1피치 지연값의 1/n값을 상기 저장부에 저장하는 폐회로피치검색부;를 더 포함하는 것을 특징으로 하는 피치 지연값의 배수에 의한 영향 제거가 가능한 CELP 기반 음성부호화기.The first pitch delay value is changed by performing a closed loop pitch search based on the first pitch delay value determined by the first pitch connection unit, and the changed first pitch delay value and the changed first pitch delay value are determined. A closed loop pitch search unit for storing the 1 / n value of the storage unit; CELP-based speech coder that can remove the effect of multiple times the pitch delay value further comprises. CELP 기반의 음성부호화기 또는 상호부호화기에서 피치 지연값의 배수에 의한 영향을 제거하는 방법에 있어서,In the method of eliminating the effect of multiples of the pitch delay value in the CELP-based speech coder or mutual encoder, (a) 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 단계;(a) calculating a first pitch delay value corresponding to a current pitch delay value from the input voice signal; (b) 상기 제1피치 지연값 및 상기 제1피치 지연값의 1/n값(단, n=2,3)을 메모리에 저장하는 단계;(b) storing the first pitch delay value and the 1 / n value (n = 2,3) of the first pitch delay value in a memory; (c) 이전 피치 지연값과 상기 제1피치 지연값의 1/n값을 비교하는 단계; 및(c) comparing a previous pitch delay value with a 1 / n value of the first pitch delay value; And (d) 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값 중에서 적어도 하나의 값이 동일하면 상기 제1피치 지연값을 이전 피치 지연값으로 설정하고, 상기 이전 피치 지연값과 상기 제1피치 지연값의 1/n값이 모두 동일하지 않으면 상기 제1피치 지연값을 현재 피치 지연값으로 설정하는 단계;를 포함하는 것을 특징으로 하는 피치 지연값의 배수에 의한 영향 제거 방법.(d) if at least one of the previous pitch delay value and the 1 / n value of the first pitch delay value is the same, set the first pitch delay value to a previous pitch delay value, and the previous pitch delay value and the And setting the first pitch delay value as a current pitch delay value if all of 1 / n values of the first pitch delay value are not equal to each other. 제 3항에 있어서,The method of claim 3, wherein 상기 (a)단계는,In step (a), (a1) 입력된 음성신호로부터 현재의 피치 지연값에 해당하는 제1피치 지연값을 산출하는 단계; (a1) calculating a first pitch delay value corresponding to a current pitch delay value from the input voice signal; (a2) 상기 산출된 제1피치 지연값을 기준으로 폐회로 피치 검색을 수행하여 상기 제1피치지연값을 변경하는 단계; 및(a2) changing the first pitch delay value by performing a closed loop pitch search based on the calculated first pitch delay value; And (a3) 상기 변경된 제1피치 지연값 및 상기 변경된 제1피치 지연값의 1/n값을 상기 메모리에 저장하는 단계;를 포함하는 것을 특징으로 하는 피치 지연값의 배수에 의한 영향 제거 방법.(a3) storing the changed first pitch delay value and the 1 / n value of the changed first pitch delay value in the memory.
KR1020030048425A 2003-07-15 2003-07-15 CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same KR100554165B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030048425A KR100554165B1 (en) 2003-07-15 2003-07-15 CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030048425A KR100554165B1 (en) 2003-07-15 2003-07-15 CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same

Publications (2)

Publication Number Publication Date
KR20050008357A KR20050008357A (en) 2005-01-21
KR100554165B1 true KR100554165B1 (en) 2006-02-22

Family

ID=37221617

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030048425A KR100554165B1 (en) 2003-07-15 2003-07-15 CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same

Country Status (1)

Country Link
KR (1) KR100554165B1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5003604A (en) * 1988-03-14 1991-03-26 Fujitsu Limited Voice coding apparatus
JPH04149600A (en) * 1990-10-12 1992-05-22 Fujitsu Ltd Voice decoding system
KR970012285A (en) * 1995-08-26 1997-03-29 김광호 Pitch detection method of voice signal
JPH09179586A (en) * 1995-12-22 1997-07-11 Oki Electric Ind Co Ltd Setting method for voice pitch mark
KR20010113780A (en) * 2000-02-10 2001-12-28 요트.게.아. 롤페즈 Error correction method with pitch change detection
KR20030035443A (en) * 2001-10-31 2003-05-09 엘지전자 주식회사 Delay pitch extraction apparatus and method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5003604A (en) * 1988-03-14 1991-03-26 Fujitsu Limited Voice coding apparatus
JPH04149600A (en) * 1990-10-12 1992-05-22 Fujitsu Ltd Voice decoding system
KR970012285A (en) * 1995-08-26 1997-03-29 김광호 Pitch detection method of voice signal
JPH09179586A (en) * 1995-12-22 1997-07-11 Oki Electric Ind Co Ltd Setting method for voice pitch mark
KR20010113780A (en) * 2000-02-10 2001-12-28 요트.게.아. 롤페즈 Error correction method with pitch change detection
KR20030035443A (en) * 2001-10-31 2003-05-09 엘지전자 주식회사 Delay pitch extraction apparatus and method

Also Published As

Publication number Publication date
KR20050008357A (en) 2005-01-21

Similar Documents

Publication Publication Date Title
US7191120B2 (en) Speech encoding method, apparatus and program
US9418666B2 (en) Method and apparatus for encoding and decoding audio/speech signal
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
JP2964879B2 (en) Post filter
KR20020052191A (en) Variable bit-rate celp coding of speech with phonetic classification
JPH08328588A (en) System for evaluation of pitch lag, voice coding device, method for evaluation of pitch lag and voice coding method
TWI582758B (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
KR20150127041A (en) Device and method for reducing quantization noise in a time-domain decoder
CN107248411B (en) Lost frame compensation processing method and device
JP3478209B2 (en) Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium
JPH04270398A (en) Voice encoding system
JPH01155400A (en) Voice encoding system
KR20040042903A (en) Generalized analysis-by-synthesis speech coding method, and coder implementing such method
JPH1055199A (en) Voice coding and decoding method and its device
US20090299737A1 (en) Method for adapting for an interoperability between short-term correlation models of digital signals
KR20040032586A (en) The pitch estimation algorithm by using the ratio of the maximum peak to candidates for the maximum of the autocorrelation function
KR20230129581A (en) Improved frame loss correction with voice information
KR100554165B1 (en) CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same
Hwang Computational improvement for G. 729 standard
Giacobello et al. Joint estimation of short-term and long-term predictors in speech coders
JP3089967B2 (en) Audio coding device
JP2001147700A (en) Method and device for sound signal postprocessing and recording medium with program recorded
US20220180884A1 (en) Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
JPH08211895A (en) System and method for evaluation of pitch lag as well as apparatus and method for coding of sound
JP2003029798A (en) Methods, devices, programs and recording media for encoding and decoding acoustic signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090202

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee