WO2013062370A1 - 통신 시스템에서 신호 코덱 장치 및 방법 - Google Patents

통신 시스템에서 신호 코덱 장치 및 방법 Download PDF

Info

Publication number
WO2013062370A1
WO2013062370A1 PCT/KR2012/008893 KR2012008893W WO2013062370A1 WO 2013062370 A1 WO2013062370 A1 WO 2013062370A1 KR 2012008893 W KR2012008893 W KR 2012008893W WO 2013062370 A1 WO2013062370 A1 WO 2013062370A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
adaptive codebook
codebook
voice
codec
Prior art date
Application number
PCT/KR2012/008893
Other languages
English (en)
French (fr)
Other versions
WO2013062370A9 (ko
Inventor
이미숙
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120119152A external-priority patent/KR102138320B1/ko
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US14/354,881 priority Critical patent/US9704501B2/en
Publication of WO2013062370A1 publication Critical patent/WO2013062370A1/ko
Publication of WO2013062370A9 publication Critical patent/WO2013062370A9/ko
Priority to US15/645,630 priority patent/US10199050B2/en
Priority to US16/267,062 priority patent/US10607624B2/en
Priority to US16/834,930 priority patent/US20200227061A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Definitions

  • the present invention relates to communication systems, and more particularly, to a codec apparatus and method for encoding / decoding audio and audio signals in a communication system.
  • QoS quality of service
  • an encoder for compressing a voice and audio signal converted into a digital signal and a decoder for recovering a voice and audio signal from the compressed data are essential.
  • an encoder and a decoder are collectively referred to as a codec or a coder.
  • a codec or a coder As an example of the currently proposed codec, one of the most widely used voice / audio codec technologies is a code excited linear prediction (CELP) codec, and the CELP codec is a voice codec.
  • CELP codec code excited linear prediction
  • synthesis filter representing the saints of the audio signal and an excitation signal corresponding to the input of the synthesis filter.
  • the CELP codec includes an AMR (Adaptive Multi-Rate) codec, which is a narrowband codec, and an AMR-WB (Adaptive Multi-Rate WideBand) codec, which is a wideband codec, and such a narrowband AMR codec and a wideband AMR-WB codec.
  • AMR Adaptive Multi-Rate
  • AMR-WB Adaptive Multi-Rate WideBand
  • the coefficient of the synthesis filter is extracted from an input signal of one frame corresponding to 20 msec, and the frame is further divided into subframes of 5 msec to obtain a pitch index and a gain of the adaptive codebook, and a fixed codebook.
  • the pulse index and the gain are respectively calculated, and the calculated parameters are quantized and transmitted to the decoder.
  • the narrowband AMR codec and the wideband AMR-WB codec generate, at the decoder, an excitation signal using the pitch index and the gain of the adaptive codebook and the pulse index and the gain of the fixed codebook.
  • the signal is filtered with a synthesis filter to restore the voice and audio signals.
  • the narrowband AMR codec and the wideband AMR-WB codec further transmit information about a Voice Activity Detection (VAD) flag and a Long Term Predictor (LTP) filter flag in the wideband AMR-WB codec as transmission parameters.
  • VAD Voice Activity Detection
  • LTP Long Term Predictor
  • the VAD flag indicates whether the VAD function is operating
  • the LTP filter flag applies a low pass filter (LPF) to the adaptive codebook excitation signal.
  • the LTP filter flag is transmitted in the remaining modes except for the lower two modes having a smaller bit rate among the nine bit rate modes of the wideband AMR-WB codec.
  • the narrowband AMR codec that is, the narrowband codec
  • the wideband AMR-WB codec that is, the wideband codec
  • the LPF is used to extract adaptive codebook parameters in order to represent a weak signal in the high frequency band. That is, in the narrowband codec and the wideband codec, especially the wideband codec, when the harmonic component in the spectrum of the voice and audio signal appears over the entire frequency band, the adaptive codebook excitation signal is used as it is, and the harmonic component in the high frequency band. In this weak case, the adaptive codebook excitation signal is filtered using LPF.
  • the adaptive codebook excitation signal is used by filtering the LPF when the harmonic component in the high frequency band is weak.
  • Information about the LTP filter flag described above should be transmitted to the decoder. In order to transmit information to the LTP filter flag, 1 bit per subframe, that is, 4 bits per frame, is required. There is a problem.
  • the voice and audio signals are encoded / decoded without transmitting additional information, such as information on the LTP filter flag, in narrowband codecs and wideband codecs, particularly the wideband codecs. You need a codec to do that.
  • an object of the present invention is to provide a codec apparatus and method for encoding / decoding a signal in a communication system.
  • the speech and audio signals are encoded / decoded in a narrowband codec and a wideband codec, high-quality speech And a codec device and method for providing an audio service.
  • CELP Code Excited Linear Prediction
  • Another object of the present invention is to provide a codec apparatus and method for encoding / decoding a voice and audio signal without additional information transmission in a narrowband codec and a wideband codec in a communication system.
  • another object of the present invention is to provide a codec for encoding / decoding a speech and audio signal in a narrowband codec and a wideband codec, particularly in the wideband codec, without transmitting additional information, such as information about an LTP filter flag.
  • a codec device for encoding / decoding a signal in a communication system, the apparatus comprising: a first generator configured to generate a fixed codebook excitation signal using a pulse index of a speech signal; ; A second generator configured to generate a first adaptive codebook excitation signal using a pitch index of the speech signal; A first multiplier for generating a fixed codebook signal by multiplying the fixed codebook excitation signal by a fixed codebook gain; A second multiplier for generating a first adaptive codebook signal by multiplying the first adaptive codebook excitation signal by a first adaptive codebook gain; And an adder configured to add the fixed codebook signal and the first adaptive codebook signal to generate a synthesis filter excitation signal.
  • a codec method of encoding / decoding a signal in a communication system comprising: generating a fixed codebook excitation signal using a pulse index of a speech signal; Generating a first adaptive codebook excitation signal using the pitch index for the speech signal; Generating a fixed codebook signal by multiplying the fixed codebook excitation signal by a fixed codebook gain; Generating a first adaptive codebook signal by multiplying the first adaptive codebook excitation signal by a first adaptive codebook gain; And summing the fixed codebook signal and the first adaptive codebook signal to generate a synthesis filter excitation signal.
  • the voice and audio signals are encoded / decoded without additional information transmission in the narrowband codec and the wideband codec.
  • the harmonic component of the adaptive codebook excitation signal according to the frequency band without transmitting additional information, for example, information about an LTP filter flag, in the wideband codec, voice and audio signals are normally encoded / It can decode and thus provide high quality voice and audio services.
  • FIG. 1 and 6 schematically illustrate the structure of a codec device in a communication system according to an embodiment of the present invention.
  • FIGS. 2 and 4 schematically illustrate waveforms of voice and audio signals in a communication system according to an exemplary embodiment of the present invention.
  • 3 and 5 schematically illustrate spectrums of voice and audio signals in a communication system according to an embodiment of the present invention.
  • FIG. 7 is a diagram schematically illustrating a codec process of a codec device in a communication system according to an embodiment of the present invention.
  • the present invention proposes a signal codec apparatus and method in a communication system.
  • a voice and audio signal for encoding services of various quality of service (QoS: hereinafter referred to as 'QoS') in a communication system, for example, voice and audio service, are encoded.
  • QoS quality of service
  • 'QoS' quality of service
  • a codec device and a method for decoding / decoding are described as an example, the codec proposed in the present invention can be equally applied to a case of encoding / decoding a signal corresponding to other services.
  • an embodiment of the present invention proposes a codec apparatus and method for encoding / decoding audio and audio signals in a communication system.
  • the voice and audio signals are encoded / encoded by a narrowband codec and a wideband codec. Decoded to provide high quality voice and audio services.
  • CELP code excitation linear prediction
  • the narrowband codec and the wideband codec of the CELP codec may extract, at an encoder, coefficients of a synthesis filter from an input signal of one frame, that is, an audio and audio signal.
  • the frame is subdivided into sub-frames to calculate the pitch index and gain of the adaptive codebook and the pulse index and gain of the fixed codebook, respectively, and quantize each of the calculated parameters to be transmitted to the decoder.
  • the excitation signal is generated using the pitch index and the gain and the pulse index and the gain of the fixed codebook, the excitation signal is filtered by a synthesis filter to restore the voice and audio signals.
  • a low pass filter (LPF) for an adaptive codebook excitation signal No additional information is transmitted, e.g., information on the Long Term Predictor (LTP) filter flag, and the harmonic component of the adaptive codebook excitation signal according to the frequency band is transmitted without transmitting such additional information.
  • LPF low pass filter
  • the speech and audio signals are normally encoded / decoded through the narrowband codec and the wideband codec, thereby providing high quality voice and audio services.
  • 1 is a diagram schematically illustrating a structure of a codec device in a communication system according to an exemplary embodiment of the present invention.
  • 1 is a diagram schematically illustrating a structure of a narrowband codec and a wideband codec of the CELP codec described above, such as an adaptive multi-rate (AMR) codec device of the CELP codec.
  • AMR adaptive multi-rate
  • the narrowband codec device may include a first generator 110 generating a fixed codebook excitation signal using the pulse index, and a second generation generating an adaptive codebook excitation signal using the pitch index.
  • a multiplier 140, and an adder 150 that adds the fixed codebook signal and the adaptive codebook signal to generate a synthesis filter excitation signal.
  • the encoder extracts a coefficient of a synthesis filter from an input signal of one frame, that is, a voice and an audio signal, and divides the one frame into subframes.
  • a pitch index and a gain of a codebook and a pulse index and a gain of the fixed codebook are respectively calculated, and at the decoder, an excitation signal is generated using the pitch index and the gain of the adaptive codebook and the pulse index and the gain of the fixed codebook.
  • the excitation signal is then filtered by a synthesis filter to restore the voice and audio signals.
  • the first generator 110 receives the pulse index, that is, the pulse index of the fixed codebook, and generates the fixed codebook excitation signal through the fixed codebook using the pulse index.
  • the first multiplier 130 generates the fixed codebook signal by multiplying the fixed codebook excitation signal by the fixed codebook gain, that is, the gain of the fixed codebook.
  • the second generator 120 receives the pitch index, that is, the pitch index of the adaptive codebook, and generates the adaptive codebook excitation signal through the adaptive codebook using the pitch index.
  • the second multiplier 140 generates the adaptive codebook signal by multiplying the adaptive codebook excitation signal by the adaptive codebook gain, that is, the gain of the adaptive codebook.
  • the adder 150 generates the synthesis filter excitation signal by summing the fixed codebook signal and the adaptive codebook signal.
  • the pulse index, the fixed codebook gain, and the pitch index and the adaptive codebook gain, as described above, have a minimum error with an input signal preprocessed by the encoder.
  • the wideband codec encodes a signal of about 50 to 7,000 Hz band which is about twice as wide as that of the narrowband codec that codes a signal of 300 to 3,400 Hz band.
  • harmonic components appear in the spectrum of stable voiced sound and audio signals up to 7,000 Hz, but the voice and audio signals of the voiced sound are not voiced, i.e., voiceless sound
  • harmonic components may appear weaker in the higher frequency bands than in the lower frequency bands. That is, for the audio and audio signals as shown in Figs. 2 and 4, the spectrum of the audio and audio signals as shown in Figs.
  • FIGS. 2 and 4 are diagrams schematically illustrating waveforms of a voice and an audio signal in a communication system according to an exemplary embodiment of the present invention
  • FIGS. 3 and 5 are diagrams illustrating voice and audio signals in a communication system according to an exemplary embodiment of the present invention.
  • the wideband codec for example, the adaptive multi-rate wideband (AMR-WB) codec
  • AMR-WB adaptive multi-rate wideband
  • LPF low pass filter
  • the information corresponding to the determination that is, information indicating whether the LPF is applied is information on the LTP filter flag as described above.
  • the communication system according to the embodiment of the present invention instead of transmitting the information on the LTP filter flag, it is checked whether the LPF is applied by using a voice factor calculated by the encoder and decoder of the wideband codec, that is, the AMR-WB codec.
  • the voice factor is a value representing the probability that the input signal is a voice and audio signal of a voiced sound.
  • the larger the voice factor the more the input signal becomes a voice and audio signal of voiced sound.
  • the LPF is not applied. That is, in the wideband codec of the communication system according to the embodiment of the present invention, when the voice factor is smaller than a preset threshold without transmitting information on the LTP filter flag, the voice code is not voiced or an audio signal, that is, voiceless voice. And in the case of an audio signal, the adaptive codebook excitation signal is filtered using the LPF to reduce the harmonic characteristics of a high frequency band.
  • the broadband codec device in the communication system according to the embodiment of the present invention will be described in more detail with reference to FIG. 6.
  • 6 is a diagram schematically illustrating a structure of a codec device in a communication system according to an exemplary embodiment of the present invention.
  • 6 is a diagram schematically illustrating a structure of a wideband codec of the CELP codec, for example, an AMR-WB codec device, in the above-described narrowband codec and wideband codec of the CELP codec.
  • the wideband codec device includes a first generator 610 for generating a fixed codebook excitation signal using the pulse index, and a second generator for generating an adaptive codebook excitation signal using the pitch index.
  • a first multiplier 630 for generating a fixed codebook signal by multiplying the fixed codebook excitation signal by the fixed codebook gain, and generating a first adaptive codebook signal by multiplying the adaptive codebook excitation signal by an adaptive codebook gain
  • the encoder extracts coefficients of a synthesis filter from an input signal of one frame, that is, an audio and audio signal, and divides the one frame into subframes again. Calculate a pitch index and a gain of the fixed codebook and a pulse index and a gain of the fixed codebook, and generate an excitation signal using the pitch index and the gain of the adaptive codebook and the pulse index and the gain of the fixed codebook. After that, the excitation signal is filtered by a synthesis filter to restore the voice and audio signals.
  • the wideband codec device does not transmit information on the LTP filter flag, and determines whether to apply the LPF using a voice factor calculated by an encoder and a decoder of the wideband codec, that is, the AMR-WB codec.
  • the selector 680 selects one adaptive codebook signal of the first adaptive codebook signal and the second adaptive codebook signal as the final adaptive codebook signal.
  • the voice factor is a value representing the probability that the input signal is a voice and audio signal of voiced sound.
  • the voice factor is larger, that is, the voice factor is larger than a preset threshold, the input signal is voice and audio of voiced sound.
  • the selector 680 selects the first adaptive codebook signal as the final adaptive codebook signal.
  • the voice factor is smaller, that is, when the voice factor is smaller than the threshold value, the voice factor is an unvoiced voice and audio signal, and accordingly, the LPF is applied, and the selection unit 680 determines that the second voice factor is the second voice factor.
  • An adaptive codebook signal is selected as the final adaptive codebook signal.
  • the first generator 610 receives the pulse index, that is, the pulse index of the fixed codebook, and generates the fixed codebook excitation signal through the fixed codebook using the pulse index.
  • the second multiplier 630 generates the fixed codebook signal by multiplying the fixed codebook excitation signal by the fixed codebook gain, that is, the gain of the fixed codebook.
  • the second generator 620 receives the pitch index, that is, the pitch index of the adaptive codebook, and generates the adaptive codebook excitation signal through the adaptive codebook using the pitch index.
  • the second multiplier 640 multiplies the adaptive codebook excitation signal by the adaptive codebook gain, that is, the gain of the adaptive codebook, to generate the first adaptive codebook signal.
  • the filter 660 filters the adaptive codebook excitation signal with the LPF to generate a filtered adaptive codebook excitation signal, that is, a second adaptive codebook excitation signal.
  • the third multiplier 670 multiplies the second adaptive codebook excitation signal by the filtering adaptive codebook gain, that is, the second adaptive codebook gain to generate the second codebook signal.
  • the second adaptive codebook gain is calculated using the second adaptive codebook excitation signal.
  • the selector 680 selects one codebook signal from the first adaptive codebook signal and the second adaptive codebook signal as the final codebook signal in correspondence with the voice factor.
  • the selector 680 selects the first adaptive codebook signal as the final codebook signal when the voice factor is larger than a threshold value, and selects the first adaptive codebook signal as the final codebook signal, and when the voice factor is smaller than a threshold value, the second adaptive codebook. Select a signal as the final codebook signal.
  • the adder 650 generates the synthesis filter excitation signal by summing the fixed codebook signal and the final adaptive codebook signal.
  • the pulse index, the fixed codebook gain, and the pitch index and the adaptive codebook gain have a minimum error with an input signal preprocessed by the encoder.
  • the selector 680 may select an adaptive codebook signal having a minimum error between the first precoded input signal and the final codebook among the first adaptive codebook signal and the second adaptive codebook signal according to the voice factor. Select by signal.
  • 7 is a diagram schematically illustrating a codec process of a codec device in a communication system according to an exemplary embodiment of the present invention.
  • 7 is a diagram schematically illustrating an operation process of a codec device to which a CELP codec is applied in a communication system according to an exemplary embodiment of the present invention.
  • the codec device generates a codebook excitation signal, that is, a fixed codebook excitation signal and an adaptive codebook excitation signal, using a pulse index and a patch index.
  • a codebook signal is generated by multiplying the codebook excitation signal by a codebook gain, that is, by generating a static codebook signal by multiplying the fixed codebook excitation signal by a fixed codebook gain, and multiplying the adaptive codebook excitation signal by an adaptive codebook gain. Generate an adaptive codebook signal.
  • the filtering adaptive codebook gain that is, the second adaptive codebook gain, is applied to the adaptive codebook excitation signal filtered through the LPF, that is, the second adaptive codebook excitation signal.
  • the speech factor and the final adaptive codebook signal selection according to the speech factor have been described in detail above, detailed description thereof will be omitted.
  • a synthesis filter excitation signal is generated using the codebook signal, that is, the fixed codebook signal and the adaptive codebook signal or the final codebook signal are summed to generate the synthesis filter excitation signal.
  • the CELP codec is a narrowband codec, for example, an AMR codec of the CELP codec
  • the fixed codebook signal and the adaptive codebook signal are summed to generate the synthesis filter excitation signal
  • the CELP codec is a wideband codec such as AMR codec.
  • the synthesized filter excitation signal is generated by adding the fixed codebook signal and the final adaptive codebook signal according to whether the adaptive codebook excitation signal is filtered to the LPF.
  • the narrowband codec and the wideband codec do not transmit information indicating whether the excitation signal is filtered to the LPF, in particular, the wideband codec, i.e., without transmitting information on the LTP filter flag.
  • Encode / decode normally to provide high quality voice and audio services.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은. 통신 시스템에서 음성 및 오디오 신호를 부호화/복호화하는 코덱(codec) 장치 및 방법에 관한 것으로, 음성 신호에 대한 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하고, 상기 음성 신호에 대한 피치 인덱스를 이용하여 제1적응 코드북 여기 신호를 생성하고, 상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여, 고정 코드북 신호를 생성하고, 상기 제1적응 코드북 여기 신호에 제1적응 코드북 이득을 곱하여, 제1적응 코드북 신호를 생성하며, 상기 고정 코드북 신호와 상기 제1적응 코드북 신호를 합산하여, 합성 필터 여기 신호를 생성한다.

Description

통신 시스템에서 신호 코덱 장치 및 방법
본 발명은, 통신 시스템에 관한 것으로, 특히 통신 시스템에서 음성 및 오디오 신호를 부호화/복호화하는 코덱(codec) 장치 및 방법에 관한 것이다.
통신 시스템에서는 고속의 전송 속도를 가지는 다양한 서비스 품질(QoS: Quality of Service, 이하 'QoS'라 칭하기로 함)의 서비스들을 사용자들에게 제공하기 위한 활발한 연구가 진행되고 있다. 이러한 통신 시스템은, 다양한 형태의 QoS를 가지는 데이터를 한정된 자원을 통해 빠르게 전송하기 위한 방안들이 제안되고 있으며, 최근 네트워크의 발달과 고품질 서비스에 대한 사용자 요구가 증가함에 따라 네트워크에서 음성 및 오디오 신호를 압축 전송하기 위한 방안으로 음성/오디오 코덱(codec)들이 개발되었다.
한편, 통신 시스템에서는, 음성 및 오디오 신호를 디지털 통신망을 통해 송수신하기 위해, 디지털 신호로 변환된 음성 및 오디오 신호를 압축하는 인코더와, 압축된 데이터로부터 음성 및 오디오 신호를 복원하는 디코더가 필수적으로 필요하다. 여기서, 일반적으로 인코더와 디코더를 합하여 코덱 또는 코더라고 한다. 현재 제안된 코덱의 일 예로, 가장 널리 사용되고 있는 음성/오디오 코덱 기술 중 하나는 코드 여기 선형 예측(CELP: Code Excited Linear Prediction, 이하 'CELP'라 칭하기로 함) 코덱이며, 상기 CELP 코덱은, 음성 및 오디오 신호의 성도를 나타내는 합성 필터와, 상기 합성 필터의 입력에 해당하는 여기 신호로 표현한다.
또한, 상기 CELP 코덱은, 협대역 코덱인 AMR(Adaptive Multi-Rate) 코덱과, 광대역 코덱인 AMR-WB(Adaptive Multi-Rate WideBand) 코덱을 포함하며, 이러한 협대역 AMR 코덱과 광대역 AMR-WB 코덱은, 인코더에서, 20 msec에 해당하는 한 프레임의 입력 신호로부터 합성 필터의 계수를 추출하고, 상기 한 프레임을 다시 5 msec의 서브 프레임으로 분할하여, 적응 코드북의 피치 인덱스와 이득, 및 고정 코드북의 펄스 인덱스와 이득을 각각 산출하고, 이렇게 산출한 각 파라미터들을 양자화하여 디코더로 전송한다. 그리고, 상기 협대역 AMR 코덱과 상기 광대역 AMR-WB 코덱은, 디코더에서, 상기 적응 코드북의 피치 인덱스와 이득, 및 상기 고정 코드북의 펄스 인덱스와 이득을 이용하여, 여기 신호를 생성한 후, 상기 여기 신호를 합성 필터로 필터링하여 음성 및 오디오 신호를 복원한다.
그리고, 상기 협대역 AMR 코덱과 상기 광대역 AMR-WB 코덱은, 전송 파라미터로, 상기 광대역 AMR-WB 코덱에서 VAD(Voice Activity Detection) 플래그와 LTP(Long Term Predictor) 필터 플래그에 대한 정보를 추가로 전송한다. 여기서, 상기 VAD 플래그는, VAD 함수의 동작 여부를 지시하고, 상기 LTP 필터 플래그는, 적응 코드북 여기 신호에 저대역 통과 필터(LPF: Low-Pass Filter, 이하 'LPF'라 칭하기로 함)를 적용할 것인지에 대한 여부를 지시하며, 이때 상기 LTP 필터 플래그는, 상기 광대역 AMR-WB 코덱의 9개 비트율 모드 중에서 비트율이 작은 하위 2개의 모드를 제외한 나머지 모드에서 전송된다.
한편, 상기 협대역 AMR 코덱, 다시 말해 협대역 코덱에서는 300 ~ 3400Hz 대역의 신호를 코딩하지만, 상기 광대역 AMR-WB 코덱, 다시 말해 광대역 코덱에서는 50 ~ 7,000Hz 대역의 신호를 코딩한다. 즉, 상기 광대역 코덱은 협대역 코덱에 비해 약 2배 정도 넓은 주파수 대역의 신호를 처리한다. 그러므로, 광대역 신호의 경우, 적응 코드북 파라미터로 표현되는 신호의 스펙트럼 상에서의 하모닉 성분이 50 ~ 7,000Hz의 전체 주파수 대역에서 나타날 수도 있지만, 상대적으로 낮은 주파수 대역에서만 하모닉 성분이 나타나고 높은 주파수 대역에는 하모닉 성분이 약하거나 나타나지 않는 신호도 존재한다. 이러한 높은 주파수 대역에서 하모닉 성분이 약한 신호를 표현하기 위해 상기 광대역 AMR-WB 코덱에서는, LPF를 이용하여 적응 코드북 파라미터를 추출한다. 즉, 상기 협대역 코덱 및 상기 광대역 코덱, 특히 광대역 코덱에서는, 음성 및 오디오 신호의 스펙트럼 상에서의 하모닉 성분이 전체 주파수 대역에 걸쳐 나타날 경우에는 적응 코드북 여기 신호를 그대로 사용하고, 높은 주파수 대역에서 하모닉 성분이 약한 경우에는 적응 코드북 여기 신호를 LPF로 필터링하여 사용한다.
그러나, 전술한 바와 같이, 상기 협대역 코덱 및 상기 광대역 코덱, 특히 광대역 코덱에서, 높은 주파수 대역에서의 하모닉 성분이 약한 경우에 적응 코드북 여기 신호를 LPF로 필터링하여 사용함으로, 상기 LPF의 사용 여부에 대한 정보를 디코더로 전송, 다시 말해 전술한 상기 LTP 필터 플래그에 대한 정보를 상기 디코더로 전송하여야 하며, 상기 LTP 필터 플래그에 정보를 전송하기 위해서는, 서브 프레임당 1비트, 즉 프레임당 4비트가 필요하게 되는 문제점이 있다.
따라서, 통신 시스템에서 고품질의 음성 및 오디오 서비스를 제공하기 위해, 협대역 코덱 및 광대역 코덱, 특히 상기 광대역 코덱에서 추가적인 정보, 예컨대 상기 LTP 필터 플래그에 대한 정보 전송 없이, 음성 및 오디오 신호를 부호화/복호화하는 코덱이 필요하다.
따라서, 본 발명의 목적은, 통신 시스템에서 신호를 부호화/복호화하는 코덱(codec) 장치 및 방법을 제공함에 있다.
또한, 본 발명의 다른 목적은, 통신 시스템에서 코드 여기 선형 예측(CELP: Code Excited Linear Prediction) 코덱을 적용할 경우, 협대역 코덱 및 광대역 코덱에서 음성 및 오디오 신호를 부호화/복호화하여, 고품질의 음성 및 오디오 서비스를 제공하는 코덱 장치 및 방법을 제공함에 있다.
그리고, 본 발명의 다른 목적은, 통신 시스템에서의, 협대역 코덱 및 광대역 코덱에서 추가적인 정보 전송 없이, 음성 및 오디오 신호를 부호화/복호화하는 코덱 장치 및 방법을 제공함에 있다.
아울러, 본 발명의 또 다른 목적은, 통신 시스템에서의 협대역 코덱 및 광대역 코덱에서, 특히 상기 광대역 코덱에서 추가적인 정보, 예컨대 LTP 필터 플래그에 대한 정보 전송 없이, 음성 및 오디오 신호를 부호화/복호화하는 코덱 장치 및 방법을 제공함에 있다.
상기한 목적들을 달성하기 위한 본 발명의 장치는, 통신 시스템에서 신호를 부호화/복호화하는 코덱(codec) 장치에 있어서, 음성 신호에 대한 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하는 제1생성부; 상기 음성 신호에 대한 피치 인덱스를 이용하여 제1적응 코드북 여기 신호를 생성하는 제2생성부; 상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여, 고정 코드북 신호를 생성하는 제1곱셈부; 상기 제1적응 코드북 여기 신호에 제1적응 코드북 이득을 곱하여, 제1적응 코드북 신호를 생성하는 제2곱셈부; 및 상기 고정 코드북 신호와 상기 제1적응 코드북 신호를 합산하여, 합성 필터 여기 신호를 생성하는 합산부;를 포함한다.
상기한 목적들을 달성하기 위한 본 발명의 방법은, 통신 시스템에서 신호를 부호화/복호화하는 코덱(codec) 방법에 있어서, 음성 신호에 대한 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하는 단계; 상기 음성 신호에 대한 피치 인덱스를 이용하여 제1적응 코드북 여기 신호를 생성하는 단계; 상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여, 고정 코드북 신호를 생성하는 단계; 상기 제1적응 코드북 여기 신호에 제1적응 코드북 이득을 곱하여, 제1적응 코드북 신호를 생성하는 단계; 및 상기 고정 코드북 신호와 상기 제1적응 코드북 신호를 합산하여, 합성 필터 여기 신호를 생성하는 단계;를 포함한다.
본 발명의 통신 시스템에서, 통신 시스템에서 코드 여기 선형 예측(CELP: Code Excited Linear Prediction) 코덱을 적용할 경우, 협대역 코덱 및 광대역 코덱에서 추가적인 정보 전송 없이, 음성 및 오디오 신호를 부호화/복호화하며, 특히 상기 광대역 코덱에서 추가적인 정보, 예컨대 LTP 필터 플래그에 대한 정보 전송 없이, 주파수 대역에 따른 적응 코드북 여기 신호의 하모닉 성분을 조정함으로써, 상기 협대역 코덱 및 광대역 코덱을 통해 음성 및 오디오 신호를 정상적으로 부호화/복호화하며, 그에 따라 고품질의 음성 및 오디오 서비스를 제공할 수 있다.
도 1 및 도 6은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 구조를 개략적으로 도시한 도면.
도 2 및 도 4는 본 발명의 실시 예에 따른 통신 시스템에서 음성 및 오디오 신호의 파형을 개략적으로 도시한 도면.
도 3 및 도 5는 본 발명의 실시 예에 따른 통신 시스템에서 음성 및 오디오 신호의 스펙트럼을 개략적으로 도시한 도면.
도 7은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 코덱 과정을 개략적으로 도시한 도면.
이하, 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기의 설명에서는 본 발명에 따른 동작을 이해하는데 필요한 부분만이 설명되며 그 이외 부분의 설명은 본 발명의 요지를 흩뜨리지 않도록 생략될 것이라는 것을 유의하여야 한다.
본 발명은, 통신 시스템에서 신호 코덱(codec) 장치 및 방법을 제안한다. 여기서, 본 발명의 실시 예에서는, 통신 시스템에서 다양한 서비스 품질(QoS: Quality of Service, 이하 'QoS'라 칭하기로 함)의 서비스들, 예컨대 음성 및 오디오 서비스를 제공하기 위한 음성 및 오디오 신호를 부호화/복호화하는 코덱 장치 및 방법을 일 예로 하여 설명하지만, 본 발명에서 제안하는 코덱은, 다른 서비스들에 해당하는 신호를 부호화/복호화하는 경우에도 동일하게 적용될 수 있다.
또한, 본 발명의 실시 예에서는, 통신 시스템에서 음성 및 오디오 신호를 부호화/복호화하는 코덱 장치 및 방법을 제안한다. 여기서, 본 발명의 실시 예에서는, 코드 여기 선형 예측(CELP: Code Excited Linear Prediction, 이하 'CELP'라 칭하기로 함) 코덱을 적용할 경우, 협대역 코덱 및 광대역 코덱에서 음성 및 오디오 신호를 부호화/복호화하여, 고품질의 음성 및 오디오 서비스를 제공한다.
그리고, 본 발명의 실시 예에 따른 통신 시스템에서, 상기 CELP 코덱의 협대역 코덱 및 광대역 코덱은, 인코더에서, 한 프레임의 입력 신호, 즉 음성 및 오디오 신호로부터 합성 필터의 계수를 추출하고, 상기 한 프레임을 다시 서브 프레임으로 분할하여, 적응 코드북의 피치 인덱스와 이득, 및 고정 코드북의 펄스 인덱스와 이득을 각각 산출하고, 이렇게 산출한 각 파라미터들을 양자화하여 디코더로 전송하며, 디코더에서, 상기 적응 코드북의 피치 인덱스와 이득, 및 상기 고정 코드북의 펄스 인덱스와 이득을 이용하여, 여기 신호를 생성한 후, 상기 여기 신호를 합성 필터로 필터링하여 음성 및 오디오 신호를 복원한다.
이때, 본 발명의 실시 예에 따른 통신 시스템에서는, 상기 CELP 코덱의 협대역 코덱 및 광대역 코덱에서, 특시 상기 광대역 코덱에서, 적응 코드북 여기 신호에 저대역 통과 필터(LPF: Low-Pass Filter, 이하 'LPF'라 칭하기로 함)를 적용 여부를 지시하는 정보, 예컨대 LTP(Long Term Predictor) 필터 플래그에 대한 정보를 추가적으로 전송하지 않으며, 이러한 추가적인 정보 전송 없이 주파수 대역에 따른 적응 코드북 여기 신호의 하모닉 성분을 조정함으로써, 상기 협대역 코덱 및 광대역 코덱을 통해 음성 및 오디오 신호를 정상적으로 부호화/복호화하며, 그에 따라 고품질의 음성 및 오디오 서비스를 제공한다. 그러면 여기서, 도 1 및 도 6을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치에 대해 보다 구체적으로 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 구조를 개략적으로 도시한 도면이다. 여기서, 도 1은 전술한 CELP 코덱의 협대역 코덱 및 광대역 코덱에서, 상기 CELP 코덱의 협대역 코덱, 예컨대 AMR(Adaptive Multi-Rate) 코덱 장치의 구조를 개략적으로 도시한 도면이다.
도 1을 참조하면, 상기 협대역 코덱 장치는, 상기 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하는 제1생성부(110), 상기 피치 인덱스를 이용하여 적응 코드북 여기 신호를 생성하는 제2생성부(120), 상기 고정 코드북 여기 신호에 상기 고정 코드북 이득을 곱하여 고정 코드북 신호를 생성하는 제1곱셈부(130), 상기 적응 코드북 여기 신호에 적응 코드북 이득을 곱하여 적응 코드북 신호를 생성하는 제2곱셈부(140), 및 상기 고정 코드북 신호와 상기 적응 코드북 신호를 합산하여 합성 필터 여기 신호를 생성하는 합산부(150)를 포함한다.
여기서, 상기 협대역 코덱 장치는, 전술한 바와 같이, 인코더에서, 한 프레임의 입력 신호, 즉 음성 및 오디오 신호로부터 합성 필터의 계수를 추출하고, 상기 한 프레임을 다시 서브 프레임으로 분할하여, 상기 적응 코드북의 피치 인덱스와 이득, 및 상기 고정 코드북의 펄스 인덱스와 이득을 각각 산출하며, 디코더에서, 상기 적응 코드북의 피치 인덱스와 이득, 및 상기 고정 코드북의 펄스 인덱스와 이득을 이용하여, 여기 신호를 생성한 후, 상기 여기 신호를 합성 필터로 필터링하여 음성 및 오디오 신호를 복원한다.
즉, 상기 제1생성부(110)는, 상기 펄스 인덱스, 즉 상기 고정 코드북의 펄스 인덱스를 수신하고, 상기 펄스 인덱스를 이용하여 상기 고정 코드북을 통해 상기 고정 코드북 여기 신호를 생성한다.
상기 제1곱셈부(130)는, 상기 고정 코드북 여기 신호에, 상기 고정 코드북 이득, 즉 상기 고정 코드북의 이득을 곱하여, 상기 고정 코드북 신호를 생성한다.
상기 제2생성부(120)는, 상기 피치 인덱스, 즉 상기 적응 코드북의 피치 인덱스를 수신하고, 상기 피치 인덱스를 이용하여 상기 적응 코드북을 통해 상기 적응 코드북 여기 신호를 생성한다.
상기 제2곱셈부(140)는, 상기 적응 코드북 여기 신호에, 상기 적응 코드북 이득, 즉 상기 적응 코드북의 이득을 곱하여, 상기 적응 코드북 신호를 생성한다.
상기 합산부(150)는, 상기 고정 코드북 신호와 상기 적응 코드북 신호를 합산하여 상기 합성 필터 여기 신호를 생성한다.
여기서, 상기 펄스 인덱스와 상기 고정 코드북 이득, 및 상기 피치 인덱스와 상기 적응 코드북 이득은, 전술한 바와 같이, 상기 인코더에서 전처리된 입력 신호와의 오차가 최소인 값이 된다.
한편, 본 발명의 실시 예에 따른 통신 시스템에서, 상기 광대역 코덱에서는, 300 ~ 3,400Hz 대역의 신호를 코딩하는 상기 협대역 코덱과 비교하여 약 2배 정도 넓은 50 ~ 7,000Hz대역의 신호를 코딩한다. 특히, 음성 및 오디오 신호의 경우, 안정적인 유성음(voiced sound)의 음성 및 오디오 신호의 스펙트럼에서는 7,000Hz 대역까지 하모닉 성분이 나타나지만, 상기 유성음의 음성 및 오디오 신호가 아닌 경우, 즉 무성음(voiceless sound)의 음성 및 오디오 신호에서는, 낮은 주파수 대역에 비해 높은 주파수 대역에서 하모닉 성분이 약하게 나타날 수 있다. 즉, 도 2 및 도 4에 도시한 바와 같은, 음성 및 오디오 신호에 대해서, 도 3 및 도 5에 도시한 바와 같은 상기 음성 및 오디오 신호의 스펙트럼이 나타난다. 여기서, 도 2 및 도 4는 본 발명의 실시 예에 따른 통신 시스템에서 음성 및 오디오 신호의 파형을 개략적으로 도시한 도면이고, 도 3 및 도 5는 본 발명의 실시 예에 따른 통신 시스템에서 음성 및 오디오 신호의 스펙트럼을 개략적으로 도시한 도면이다.
즉, 본 발명의 실시 예에 따른 통신 시스템에서는, 상기 광대역 코덱, 예컨대 AMR-WB(Adaptive Multi-Rate WideBand) 코덱일 경우, 12.65kbps ~ 23.85kbps 모드에서 동작할 때 상대적으로 높은 주파수 대역에서의 하모닉 성분을 조정하기 위해 적응 코드북 여기 신호에 저대역 통과 필터(LPF: Low-Pass Filter, 이하 'LPF'라 칭하기로 함)를 선택적으로 적용한다. 즉, 본 발명의 실시 예에 따른 통신 시스템의 광대역 코덱은, 12.65kbps ~ 23.85kbps 모드에서 동작할 경우, 인코더에서 적응 코드북 여기 신호를 그대로 사용할 지, 또는 LPF로 필터링하여 높은 주파수 대역의 하모닉 특성을 감소시켜 사용할지는 결정하고, 상기 결정에 상응하는 정보를 디코더로 전송한다.
이때, 상기 결정에 상응하는 정보, 즉 상기 LPF의 적용 여부를 알려주는 정보는, 전술한 바와 같이, LTP 필터 플래그에 대한 정보이며, 본 발명의 실시 예에 따른 통신 시스템에서는, 앞서 설명한 바와 같이, 상기 LTP 필터 플래그에 대한 정보를 전송하지 않고, 상기 광대역 코덱, 다시 말해 상기 AMR-WB 코덱의 인코더와 디코더에서 계산되는 음성 팩터(voice factor)를 이용하여, 상기 LPF의 적용 여부를 확인한다.
여기서, 상기 음성 팩터는, 입력 신호가 유성음의 음성 및 오디오 신호일 확률을 나타내는 값으로, 상기 음성 팩터가 클수록 상기 입력 신호는 유성음의 음성 및 오디오 신호가 되며, 그에 따라 유성음의 음성 및 오디오 신호일 경우에는, 상기 LPF를 적용하지 않는 것으로 확인된다. 즉, 본 발명의 실시 예에 따른 통신 시스템의 광대역 코덱에서는, 상기 LTP 필터 플래그에 대한 정보 전송 없이, 음성 팩터가 기 설정된 임계값보다 작을 경우에는 유성음의 음성 및 오디오 신호가 아님, 즉 무성음의 음성 및 오디오 신호일 경우에는, 상기 적응 코드북 여기 신호를 상기 LPF로 필터링하여 높은 주파수 대역의 하모닉 특성을 감소시켜 사용한다. 그러면 여기서, 도 6을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 광대역 코덱 장치에 대해 보다 구체적으로 설명하기로 한다.
도 6은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 구조를 개략적으로 도시한 도면이다. 여기서, 도 6은 전술한 CELP 코덱의 협대역 코덱 및 광대역 코덱에서, 상기 CELP 코덱의 광대역 코덱, 예컨대 AMR-WB 코덱 장치 구조를 개략적으로 도시한 도면이다.
도 6을 참조하면, 상기 광대역 코덱 장치는, 상기 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하는 제1생성부(610), 상기 피치 인덱스를 이용하여 적응 코드북 여기 신호를 생성하는 제2생성부(620), 상기 고정 코드북 여기 신호에 상기 고정 코드북 이득을 곱하여 고정 코드북 신호를 생성하는 제1곱셈부(630), 상기 적응 코드북 여기 신호에 적응 코드북 이득을 곱하여 제1적응 코드북 신호를 생성하는 제2곱셈부(640), 상기 적응 코드북 여기 신호를 LPF로 필터링하는 필터(660), 상기 필터링된 적응 코드북 여기 신호에 필터링 적응 코드북 이득을 곱하여 제2적응 코드북 신호를 생성하는 제3곱셈부(670), 상기 음석 팩터에 따라 상기 제1적응 코드북 신호와 상기 제2적응 코드북 신호 중 하나의 적응 코드북 신호를 최종 적응 코드북 신호로 선택하는 선택부(680), 및 상기 고정 코드북 신호와 상기 최종 적응 코드북 신호를 합산하여 합성 필터 여기 신호를 생성하는 합산부(650)를 포함한다.
여기서, 상기 광대역 코덱 장치는, 전술한 바와 같이, 인코더에서, 한 프레임의 입력 신호, 즉 음성 및 오디오 신호로부터 합성 필터의 계수를 추출하고, 상기 한 프레임을 다시 서브 프레임으로 분할하여, 상기 적응 코드북의 피치 인덱스와 이득, 및 상기 고정 코드북의 펄스 인덱스와 이득을 각각 산출하며, 디코더에서, 상기 적응 코드북의 피치 인덱스와 이득, 및 상기 고정 코드북의 펄스 인덱스와 이득을 이용하여, 여기 신호를 생성한 후, 상기 여기 신호를 합성 필터로 필터링하여 음성 및 오디오 신호를 복원한다.
또한, 상기 광대역 코덱 장치는, 상기 LTP 필터 플래그에 대한 정보를 전송하지 않고, 상기 광대역 코덱, 다시 말해 상기 AMR-WB 코덱의 인코더와 디코더에서 계산되는 음성 팩터를 이용하여, 상기 LPF의 적용 여부를 확인하며, 이러한 확인 결과에 따라 상기 선택부(680)가 상기 제1적응 코드북 신호와 상기 제2적응 코드북 신호 중 하나의 적응 코드북 신호를 최종 적응 코드북 신호로 선택한다.
여기서, 상기 음성 팩터는, 입력 신호가 유성음의 음성 및 오디오 신호일 확률을 나타내는 값으로, 상기 음성 팩터가 클수록, 즉 상기 음성 팩터가 기 설정된 임계값보다 클 경우, 상기 입력 신호는 유성음의 음성 및 오디오 신호가 되며, 그에 따라 유성음의 음성 및 오디오 신호일 경우에는, 상기 LPF를 적용하지 않는 것으로 확인하여, 상기 선택부(680)가 상기 제1적응 코드북 신호를 상기 최종 적응 코드북 신호로 선택한다. 그리고, 상기 음성 팩터가 작을 수록, 즉 상기 음성 팩터가 상기 임계값보다 작을 경우에는 무성음의 음성 및 오디오 신호가 되며, 그에 따라 상기 LPF를 적용한 것으로 확인하여, 상기 선택부(680)가 상기 제2적응 코드북 신호를 상기 최종 적응 코드북 신호로 선택한다.
즉, 상기 제1생성부(610)는, 상기 펄스 인덱스, 즉 상기 고정 코드북의 펄스 인덱스를 수신하고, 상기 펄스 인덱스를 이용하여 상기 고정 코드북을 통해 상기 고정 코드북 여기 신호를 생성한다.
상기 제2곱셈부(630)는, 상기 고정 코드북 여기 신호에, 상기 고정 코드북 이득, 즉 상기 고정 코드북의 이득을 곱하여, 상기 고정 코드북 신호를 생성한다.
상기 제2생성부(620)는, 상기 피치 인덱스, 즉 상기 적응 코드북의 피치 인덱스를 수신하고, 상기 피치 인덱스를 이용하여 상기 적응 코드북을 통해 상기 적응 코드북 여기 신호를 생성한다.
상기 제2곱셈부(640)는, 상기 적응 코드북 여기 신호에, 상기 적응 코드북 이득, 즉 상기 적응 코드북의 이득을 곱하여, 상기 제1적응 코드북 신호를 생성한다.
상기 필터(660)는, 상기 적응 코드북 여기 신호를 상기 LPF로 필터링하여, 필터링된 적응 코드북 여기 신호, 다시 말해 제2적응 코드북 여기 신호를 생성한다.
상기 제3곱셈부(670)는, 상기 제2적응 코드북 여기 신호에, 상기 필터링 적응 코드북 이득, 다시 말해 제2적응 코드북 이득을 곱하여, 상기 제2코드북 신호를 생성한다. 여기서, 상기 제2적응 코드북 이득은, 상기 제2적응 코드북 여기 신호를 이용하여 산출된다.
상기 선택부(680)는, 전술한 바와 같이, 상기 음성 팩터에 상응하여 상기 제1적응 코드북 신호와 상기 제2적응 코드북 신호 중, 하나의 코드북 신호를 최종 코드북 신호로 선택한다. 여기서, 상기 선택부(680)는, 상기 음성 팩터가 임계값 보다 클 경우에는 상기 제1적응 코드북 신호를 상기 최종 코드북 신호로 선택하고, 상기 음성 팩터가 임계값보다 작을 경우에는 상기 제2적응 코드북 신호를 상기 최종 코드북 신호로 선택한다.
상기 합산부(650)는, 상기 고정 코드북 신호와 상기 최종 적응 코드북 신호를 합산하여 상기 합성 필터 여기 신호를 생성한다.
여기서, 상기 펄스 인덱스와 상기 고정 코드북 이득, 및 상기 피치 인덱스와 상기 적응 코드북 이득은, 전술한 바와 같이, 상기 인코더에서 전처리된 입력 신호와의 오차가 최소인 값이 된다. 특히, 상기 선택부(680)는, 상기 음성 팩터에 따라, 상기 제1적응 코드북 신호와 상기 제2적응 코드북 신호 중, 상기 제 전처리된 입력 신호와의 오차가 최소인 적응 코드북 신호를 상기 최종 코드북 신호로 선택한다. 그러면 여기서, 도 7을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 코덱 동작에 대해 보다 구체적으로 설명하기로 한다.
도 7은 본 발명의 실시 예에 따른 통신 시스템에서 코덱 장치의 코덱 과정을 개략적으로 도시한 도면이다. 여기서, 도 7은, 본 발명의 실시 예에 따른 통신 시스템에서 CELP 코덱을 적용하는 코덱 장치의 동작 과정을 개략적으로 도시한 도면이다.
도 7을 참조하면, 710단계에서, 상기 코덱 장치는, 전술한 바와 같이, 펄스 인덱스 및 패치 인덱스를 이용하여 코드북 여기 신호, 즉 고정 코드북 여기 신호와 적응 코드북 여기 신호를 생성한다.
그리고, 720단계에서, 상기 코드북 여기 신호에 코드북 이득을 곱하여 코드북 신호를 생성, 즉 상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여 고적 코드북 신호를 생성하고, 상기 적응 코드북 여기 신호에 적응 코드북 이득을 곱하여 적응 코드북 신호를 생성한다. 여기서, 전술한 바와 같이, 상기 적응 코드북 여기 신호를 LPF로의 필터링에 따라, 상기 LPF로 필터링된 적응 코드북 여기 신호, 즉 제2적응 코드북 여기 신호에, 필터링 적응 코드북 이득, 즉 제2적응 코드북 이득을 곱하여 제2적응 코드북 신호를 생성하며, 음성 팩터의 크기에 따라, 다시 말해 상기 음성 팩터가 임계값보다 클 경우에는 상기 적응 코드북 신호를 최종 적응 코드북 신호로 선택하고, 상기 음성 팩터가 상기 임계값보다 작을 경우에는 상기 제2적응 코드북 신호를 최종 적응 코드북 신호로 선택한다. 여기서, 상기 음성 팩터 및 상기 음성 팩터에 따른 최종 적응 코드북 신호 선택에 대해서는, 앞서 구체적으로 설명하였음으로, 여기서는 그에 관한 구체적인 설명을 생략하기로 한다.
다음으로, 730 단계에서, 상기 코드북 신호를 이용하여 합성 필터 여기 신호를 생성, 다시 말해 상기 고정 코드북 신호와, 상기 적응 코드북 신호 또는 상기 최종 코드북 신호를 합산하여 상기 합성 필터 여기 신호를 생성한다. 여기서, 상기 CELP 코덱이 협대역 코덱, 예컨대 상기 CELP 코덱의 AMR 코덱일 경우에는, 고정 코드북 신호와 상기 적응 코드북 신호를 합산하여 상기 합성 필터 여기 신호를 생성하고, 상기 CELP 코덱이 광대역 코덱, 예컨대 AMR-WB일 경우에는, 상기 고정 코드북 신호와, 상기 적응 코드북 여기 신호의 LPF로의 필터링 여부에 따른 최종 적응 코드북 신호를 합산하여, 상기 합성 필터 여기 신호를 생성한다.
이렇게 본 발명의 실시 예에 따른 통신 시스템에서는, 협대역 코덱 및 광대역 코덱에서, 특히 광대역 코덱에서 여기 신호의 LPF로의 필터링 여부를 나타내는 정보를 전송하지 않고, 즉 LTP 필터 플래그에 대한 정보를 전송하지 않고, 음성 팩터를 통해 상기 여기 신호의 LPF로의 필터링 여부를 확인, 다시 말해 적응 코드북 여기 신호의 LPF로의 필터링 여부를 확인하여, 합성 필터 여기 신호를 생성하며, 그에 따라 추가적인 정보 전송 없이, 음성 및 오디오 신호를 정상적으로 부호화/복호화하여, 고품질의 음성 및 오디오 서비스를 제공한다.
한편, 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로, 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

Claims (16)

  1. 통신 시스템에서 신호를 부호화/복호화하는 코덱(codec) 장치에 있어서,
    음성 신호에 대한 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하는 제1생성부;
    상기 음성 신호에 대한 피치 인덱스를 이용하여 제1적응 코드북 여기 신호를 생성하는 제2생성부;
    상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여, 고정 코드북 신호를 생성하는 제1곱셈부;
    상기 제1적응 코드북 여기 신호에 제1적응 코드북 이득을 곱하여, 제1적응 코드북 신호를 생성하는 제2곱셈부; 및
    상기 고정 코드북 신호와 상기 제1적응 코드북 신호를 합산하여, 합성 필터 여기 신호를 생성하는 합산부;를 포함하는 것을 특징으로 하는 코덱 장치.
  2. 제1항에 있어서,
    상기 제1적응 코드북 여기 신호를 저대역 통과 필터(LPF: Low-Pass Filter)를 통해 필터링하여, 제2적응 코드북 여기 신호를 생성하는 필터;를 더 포함하는 것을 특징으로 하는 코덱 장치.
  3. 제2항에 있어서,
    상기 제2적응 코드북 여기 신호에 상기 저대역 통과 필터의 필터링에 상응하는 제2적응 코드북 이득을 곱하여, 제2적응 코드북 신호를 생성하는 제3곱셈부;를 더 포함하는 것을 특징으로 하는 코덱 장치.
  4. 제3항에 있어서,
    상기 음성 신호의 음성 팩터(voice factor)에 따라, 상기 제1적응 코드북 신호와 상기 제2적응 코드북 신호 중, 하나의 적응 코드북 신호를 최종 적응 코드북 신호로 선택하는 선택부;를 더 포함하는 것을 특징으로 하는 코덱 장치.
  5. 제4항에 있어서,
    상기 합산부는, 상기 고정 코드북 신호와 상기 최종 적응 코드북 신호를 합산하여, 상기 합성 필터 여기 신호를 생성하는 것을 특징으로 하는 코덱 장치.
  6. 제4항에 있어서,
    상기 음성 팩터는, 상기 음성 신호가 유성음(voiced sound)의 음성 신호일 확률을 나타내는 값인 것을 특징으로 하는 코덱 장치.
  7. 제6항에 있어서,
    상기 선택부는, 상기 음성 신호가 유성음의 음성 신호일 경우에, 상기 제1적응 코드북 신호를 상기 최종 적응 코드북 신호로 선택하는 것을 특징으로 하는 코덱 장치.
  8. 제6항에 있어서,
    상기 선택부는, 상기 음성 신호가 무성음(voiceless sound)의 음성 신호일 경우에, 상기 제2적응 코드북 신호를 상기 최종 적응 코드북 신호로 선택하는 것을 특징으로 하는 코덱 장치.
  9. 통신 시스템에서 신호를 부호화/복호화하는 코덱(codec) 방법에 있어서,
    음성 신호에 대한 펄스 인덱스를 이용하여 고정 코드북 여기 신호를 생성하는 단계;
    상기 음성 신호에 대한 피치 인덱스를 이용하여 제1적응 코드북 여기 신호를 생성하는 단계;
    상기 고정 코드북 여기 신호에 고정 코드북 이득을 곱하여, 고정 코드북 신호를 생성하는 단계;
    상기 제1적응 코드북 여기 신호에 제1적응 코드북 이득을 곱하여, 제1적응 코드북 신호를 생성하는 단계; 및
    상기 고정 코드북 신호와 상기 제1적응 코드북 신호를 합산하여, 합성 필터 여기 신호를 생성하는 단계;를 포함하는 것을 특징으로 하는 코덱 방법.
  10. 제9항에 있어서,
    상기 제1적응 코드북 여기 신호를 저대역 통과 필터(LPF: Low-Pass Filter)를 통해 필터링하여, 제2적응 코드북 여기 신호를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 코덱 방법.
  11. 제10항에 있어서,
    상기 제2적응 코드북 여기 신호에 상기 저대역 통과 필터의 필터링에 상응하는 제2적응 코드북 이득을 곱하여, 제2적응 코드북 신호를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 코덱 방법.
  12. 제11항에 있어서,
    상기 음성 신호의 음성 팩터(voice factor)에 따라, 상기 제1적응 코드북 신호와 상기 제2적응 코드북 신호 중, 하나의 적응 코드북 신호를 최종 적응 코드북 신호로 선택하는 단계;를 더 포함하는 것을 특징으로 하는 코덱 방법.
  13. 제12항에 있어서,
    상기 합성 필터 여기 신호를 생성하는 단계는, 상기 고정 코드북 신호와 상기 최종 적응 코드북 신호를 합산하여, 상기 합성 필터 여기 신호를 생성하는 것을 특징으로 하는 코덱 방법.
  14. 제4항에 있어서,
    상기 음성 팩터는, 상기 음성 신호가 유성음(voiced sound)의 음성 신호일 확률을 나타내는 값인 것을 특징으로 하는 코덱 방법.
  15. 제14항에 있어서,
    상기 최종 적응 코드북 신호로 선택하는 단계는, 상기 음성 신호가 유성음의 음성 신호일 경우에, 상기 제1적응 코드북 신호를 상기 최종 적응 코드북 신호로 선택하는 것을 특징으로 하는 코덱 방법.
  16. 제14항에 있어서,
    상기 최종 적응 코드북 신호로 선택하는 단계는, 상기 음성 신호가 무성음(voiceless sound)의 음성 신호일 경우에, 상기 제2적응 코드북 신호를 상기 최종 적응 코드북 신호로 선택하는 것을 특징으로 하는 코덱 방법.
PCT/KR2012/008893 2011-10-28 2012-10-26 통신 시스템에서 신호 코덱 장치 및 방법 WO2013062370A1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US14/354,881 US9704501B2 (en) 2011-10-28 2012-10-26 Signal codec device and method in communication system
US15/645,630 US10199050B2 (en) 2011-10-28 2017-07-10 Signal codec device and method in communication system
US16/267,062 US10607624B2 (en) 2011-10-28 2019-02-04 Signal codec device and method in communication system
US16/834,930 US20200227061A1 (en) 2011-10-28 2020-03-30 Signal codec device and method in communication system

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20110111557 2011-10-28
KR10-2011-0111557 2011-10-28
KR1020120119152A KR102138320B1 (ko) 2011-10-28 2012-10-25 통신 시스템에서 신호 코덱 장치 및 방법
KR10-2012-0119152 2012-10-25

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US14/354,881 A-371-Of-International US9704501B2 (en) 2011-10-28 2012-10-26 Signal codec device and method in communication system
US15/645,630 Continuation US10199050B2 (en) 2011-10-28 2017-07-10 Signal codec device and method in communication system

Publications (2)

Publication Number Publication Date
WO2013062370A1 true WO2013062370A1 (ko) 2013-05-02
WO2013062370A9 WO2013062370A9 (ko) 2013-09-19

Family

ID=48168105

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2012/008893 WO2013062370A1 (ko) 2011-10-28 2012-10-26 통신 시스템에서 신호 코덱 장치 및 방법

Country Status (1)

Country Link
WO (1) WO2013062370A1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
KR20030001523A (ko) * 2000-05-19 2003-01-06 코넥스안트 시스템스, 인코퍼레이티드 씨이엘피 음성코더를 위한 이득양자화
KR20050007117A (ko) * 2003-07-09 2005-01-17 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
KR20060030012A (ko) * 2003-12-19 2006-04-07 모토로라 인코포레이티드 스피치 코딩 방법 및 장치
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
KR20110086919A (ko) * 2010-01-25 2011-08-02 충북대학교 산학협력단 에스엠브이 및 에이엠알 음성 부호화 기법을 위한 상호부호화 방법 및 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
KR20030001523A (ko) * 2000-05-19 2003-01-06 코넥스안트 시스템스, 인코퍼레이티드 씨이엘피 음성코더를 위한 이득양자화
KR20050007117A (ko) * 2003-07-09 2005-01-17 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
KR20060030012A (ko) * 2003-12-19 2006-04-07 모토로라 인코포레이티드 스피치 코딩 방법 및 장치
KR20110086919A (ko) * 2010-01-25 2011-08-02 충북대학교 산학협력단 에스엠브이 및 에이엠알 음성 부호화 기법을 위한 상호부호화 방법 및 장치

Also Published As

Publication number Publication date
WO2013062370A9 (ko) 2013-09-19

Similar Documents

Publication Publication Date Title
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
JP4583093B2 (ja) ビット率拡張音声符号化及び復号化装置とその方法
CN101395661B (zh) 音频编码和解码的方法和设备
CN108352163A (zh) 用于解码立体声声音信号的左和右声道的方法和系统
KR20080093450A (ko) 오디오 인코딩/디코딩에서의 인지 가중 장치
EP1222659A1 (en) Lpc-harmonic vocoder with superframe structure
JPH05197400A (ja) 低ビット・レート・ボコーダ手段および方法
US10607624B2 (en) Signal codec device and method in communication system
CN1470052A (zh) 宽带语音编解码器中的高频增强层编码
US20100174547A1 (en) Speech coding
CN101494055A (zh) 用于码分多址无线系统的方法和装置
WO2006001218A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
US6728669B1 (en) Relative pulse position in celp vocoding
CN112614495A (zh) 一种软件无线电多制式语音编解码器
JP5457171B2 (ja) オーディオデコーダ内で信号を後処理する方法
US6980948B2 (en) System of dynamic pulse position tracks for pulse-like excitation in speech coding
JP5313967B2 (ja) ビット率拡張音声符号化及び復号化装置とその方法
US6539349B1 (en) Constraining pulse positions in CELP vocoding
WO2013062370A9 (ko) 통신 시스템에서 신호 코덱 장치 및 방법
KR20100084632A (ko) 복잡성 분배를 이용하는 디지털 신호에서의 전송 에러 위장
KR20040050811A (ko) 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
US6385574B1 (en) Reusing invalid pulse positions in CELP vocoding

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12843768

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14354881

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 12843768

Country of ref document: EP

Kind code of ref document: A1