KR20080045047A - Method and apparatus for bandwidth extension encoding and decoding - Google Patents

Method and apparatus for bandwidth extension encoding and decoding Download PDF

Info

Publication number
KR20080045047A
KR20080045047A KR1020070046203A KR20070046203A KR20080045047A KR 20080045047 A KR20080045047 A KR 20080045047A KR 1020070046203 A KR1020070046203 A KR 1020070046203A KR 20070046203 A KR20070046203 A KR 20070046203A KR 20080045047 A KR20080045047 A KR 20080045047A
Authority
KR
South Korea
Prior art keywords
spectrum
tonality
gain value
signal
frequency signal
Prior art date
Application number
KR1020070046203A
Other languages
Korean (ko)
Other versions
KR101375582B1 (en
Inventor
주기현
오은미
레이 미아오
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US11/980,643 priority Critical patent/US8639500B2/en
Priority to PCT/KR2007/005626 priority patent/WO2008060068A1/en
Priority to CN200780048069XA priority patent/CN101568959B/en
Publication of KR20080045047A publication Critical patent/KR20080045047A/en
Application granted granted Critical
Publication of KR101375582B1 publication Critical patent/KR101375582B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

A band-width extension encoding and decoding method and an apparatus thereof are provided to prevent the lowering of the speech quality in spite of the use of the small amount of bits in the encoding and decoding processes. An excited signal extraction member(105) removes an envelope line at the lower frequency signal corresponding to the area smaller than that of the predetermined frequency, extracts the excited signal, and converts the domain of the extracted excited signal into the frequency domain. A spectrum producing member(115) produces a spectrum to be arranged at the area larger than that of the predetermined frequency by means of spectrum of the converted excited signal. The produced spectrum and the spectrum of the high frequency signal are compared by a gain value calculating member. The gain value calculating member(125) calculates the gain value.

Description

대역폭 확장 부호화 및 복호화 방법 및 장치{Method and apparatus for bandwidth extension encoding and decoding}Method and apparatus for bandwidth extension encoding and decoding

도 1은 본 발명에 의한 대역폭 확장 부호화 장치의 일 실시예를 블록도로 도시한 것이다.1 is a block diagram illustrating an embodiment of a bandwidth extension coding apparatus according to the present invention.

도 2는 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.2 is a flowchart illustrating an embodiment of a bandwidth extension coding method according to the present invention.

도 3은 본 발명에 의한 대역폭 확장 복호화 장치의 일 실시예를 블록도로 도시한 것이다.3 is a block diagram illustrating an embodiment of a bandwidth extension decoding apparatus according to the present invention.

도 4는 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.4 is a flowchart illustrating an embodiment of a bandwidth extension decoding method according to the present invention.

도 5는 본 발명에 의한 대역폭 확장 복호화 장치 및 방법에 의해 4개의 서브 밴드에 대하여 이득값을 스무딩(smoothing)하는 일 실시예를 그래프로 도시한 것이다.FIG. 5 is a graph illustrating an embodiment of smoothing a gain value for four subbands by the apparatus and method for bandwidth extension decoding according to the present invention.

도 6은 본 발명에 의한 대역폭 확장 복호화 장치 및 방법에서 오버랩(overlap)하는 일 실시예를 그래프로 도시한 것이다.6 is a graph illustrating an embodiment of overlapping in the apparatus and method for bandwidth extension decoding according to the present invention.

〈도면의 주요 부호에 대한 간단한 설명><Brief description of the major symbols in the drawings>

100: 영역 분할부 105: 여기신호 추출부100: region division unit 105: excitation signal extraction unit

110: 제1 변환부 115: 스펙트럼 생성부110: first conversion unit 115: spectrum generation unit

120: 제2 변환부 125: 이득값 계산부120: second conversion unit 125: gain value calculation unit

128: 제1 토널리티 계산부 130: 제2 토널리티 계산부128: first tonality calculator 130: second tonality calculator

135: 토널리티 비교부 140: 이득값 감소부135: tonality comparison unit 140: gain value reduction unit

145: 이득값 양자화부 150: 토널리티 양자화부145: gain value quantizer 150: tonality quantizer

155: 다중화부155: multiplexer

본 발명은 음성 신호 또는 음악 신호와 같은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호 가운데 고주파수 영역에 해당하는 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for encoding or decoding an audio signal such as a voice signal or a music signal, and more particularly, to a method and apparatus for encoding or decoding a signal corresponding to a high frequency region of an audio signal.

고주파수 영역에 해당하는 신호는 저주파수 영역에 해당하는 신호에 비하여 인간이 소리로서 인식하는 데 중요성이 떨어지는 것이 일반적이다. 그러므로 오디오 신호를 부호화함에 있어서 가용한 비트에 대한 제약이 있어 코딩의 효율을 높여야 할 경우 저주파수 영역에 해당하는 신호에는 많은 비트를 할당하여 부호화하지만 이에 비하여 고주파수 영역에 해당하는 신호에는 적은 비트를 할당하여 부호화한다.Signals in the high frequency region are generally less important for humans to recognize them as sounds than signals in the low frequency region. Therefore, if there is a restriction on the available bits in encoding an audio signal, when coding efficiency needs to be improved, a large number of bits are allocated to a signal corresponding to a low frequency region and encoded, whereas a small bit is allocated to a signal corresponding to a high frequency region. Encode

그러므로 고주파수 영역에 해당하는 신호를 부호화함에 있어서 적은 비트를 이용하고도 인간이 인식하는 음질을 최대한 향상시킬 수 있는 방법 및 장치가 요구된다.Therefore, there is a need for a method and apparatus capable of maximally improving sound quality perceived by human beings even when using fewer bits in encoding a signal corresponding to a high frequency region.

본 발명이 이루고자 하는 기술적 과제는, 저주파수 신호의 여기 신호를 이용하여 고주파수 신호를 부호화하거나 복호화하는 방법 및 장치를 제공하는 것이다.An object of the present invention is to provide a method and apparatus for encoding or decoding a high frequency signal using an excitation signal of a low frequency signal.

상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 부호화 방법는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 단계를 포함하는 것을 특징으로 한다.In accordance with another aspect of the present invention, there is provided a bandwidth extension encoding method, extracting an excitation signal from a low frequency signal corresponding to a region smaller than a predetermined frequency, extracting an excitation signal, and converting the excitation signal into a frequency domain. Generating a spectrum to be provided in an area greater than a preset frequency using the method; and calculating a gain value by comparing the generated spectrum with a spectrum of a high frequency signal corresponding to an area greater than a predetermined frequency; It is done.

상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 방법는, 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것을 특징으로 한다.In accordance with another aspect of the present invention, there is provided a bandwidth extension decoding method including extracting an excitation signal and converting an excitation signal to a frequency domain by removing an envelope from a low frequency signal provided in a region smaller than a preset frequency, and converting the spectrum of the converted excitation signal. Generating a spectrum to be provided in an area larger than a predetermined frequency by using the method; and decoding and applying a gain value to the generated spectrum.

상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 부호화 장치는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 여기신호 추출부, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 스펙트럼 생성부 및 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 이득값 계산부를 포함하는 것을 특징으로 한다.The bandwidth extension encoding apparatus according to the present invention for achieving the above object is an excitation signal extraction unit for extracting the excitation signal by removing the envelope from a low frequency signal corresponding to a region smaller than a predetermined frequency, and converting the excitation signal into a frequency domain, the converted A spectrum generator for generating a spectrum to be provided in an area greater than a preset frequency using a spectrum of an excitation signal, and comparing the generated spectrum with a spectrum of a high frequency signal corresponding to an area greater than a predetermined frequency to calculate a gain value And a gain calculator.

상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 장치는, 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 여기신호 추출부, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 스펙트럼 생성부 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 스펙트럼 적용부를 포함하는 것을 특징으로 한다.The bandwidth extension decoding apparatus according to the present invention for achieving the above object is, an excitation signal extractor for extracting an excitation signal and converting the excitation signal to a frequency domain by removing an envelope from a low frequency signal provided in a region smaller than a predetermined frequency, the converted excitation It characterized in that it comprises a spectrum generator for generating a spectrum to be provided in a region greater than a predetermined frequency by using the spectrum of the signal and a spectrum applying unit for decoding the gain value and apply to the generated spectrum.

상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.According to an aspect of the present invention, a recording medium extracts an excitation signal from a low frequency signal corresponding to a region smaller than a predetermined frequency, extracts an excitation signal, and converts the excitation signal into a frequency domain. Generating a spectrum to be provided in an area larger than a preset frequency using the same; and calculating a gain value by comparing the generated spectrum with a spectrum of a high frequency signal corresponding to an area larger than a preset frequency. You can read the program to run on the computer.

상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.The recording medium according to the present invention for achieving the above object, the step of extracting the excitation signal from the low-frequency signal provided in the region smaller than the predetermined frequency and converting the excitation signal to the frequency domain, using the spectrum of the converted excitation signal A computer program having a program for executing the invention including a step of generating a spectrum to be provided in an area larger than a preset frequency and decoding a gain value and applying the generated value to the generated spectrum can be read by a computer.

이하, 첨부된 도면들을 참조하여 본 발명에 따른 대역폭 확장 부호화 및 복호화 방법 및 장치에 대해 상세히 설명한다.Hereinafter, a bandwidth extension encoding and decoding method and apparatus according to the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 의한 대역폭 확장 부호화 장치의 일 실시예를 블록도로 도시한 것으로서 영역 분할부(100), 여기신호 추출부(105), 제1 변환부(110), 스펙트럼 생성부(115), 제2 변환부(120), 이득값 계산부(125), 제1 토널리티 계산부(128), 제2 토널리티 계산부(130), 토널리티 비교부(135), 이득값 감소부(140), 이득값 양자화부(145), 토널리티 양자화부(150) 및 다중화부(155)를 포함하여 이루어진다.FIG. 1 is a block diagram illustrating an embodiment of a bandwidth extension encoding apparatus according to the present invention, and includes a region dividing unit 100, an excitation signal extracting unit 105, a first transforming unit 110, and a spectrum generating unit 115. , The second converter 120, the gain value calculator 125, the first tonality calculator 128, the second tonality calculator 130, the tonality comparator 135, and the gain value It includes a reduction unit 140, a gain value quantization unit 145, a tonality quantization unit 150 and a multiplexer 155.

영역 분할부(100)는 입력단자 IN을 통하여 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.The region dividing unit 100 divides a signal input through the input terminal IN into a low frequency signal and a high frequency signal based on a preset frequency. Here, the low frequency signal corresponds to a signal corresponding to a region smaller than the preset first frequency, and the high frequency signal refers to a signal corresponding to a region larger than the preset second frequency. Although the first frequency and the second frequency are preferably set to the same value, they are not necessarily set to the same value.

여기신호 추출부(105)는 영역 분할부(100)에서 분할된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다. 포락선 제거부(105)에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. The excitation signal extractor 105 removes an envelope from the low frequency signal divided by the region divider 100 and extracts an excitation signal remaining. As an embodiment of removing the envelope from the envelope removing unit 105, an excitation signal may be extracted by removing the envelope by performing LPC (Linear Predictive Coding) analysis.

제1 변환부(110)는 여기신호 추출부(105)에서 추출한 저주파수 신호에 대한 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 예를 들어, 제1 변환부(110)에서 변환하는 방식으로 FFT(Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제1 변환부(110)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제1 변환부(110)는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼(transform)에 반드시 한정되어 실시하여야 하는 것은 아니다. 제1 변환부(110)는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The first converter 110 converts the excitation signal for the low frequency signal extracted by the excitation signal extractor 105 from the time domain to the frequency domain. For example, the first transform unit 110 has a fast fourier transform (FFT), and it is preferable to use 288-point including 32 samples of overlap among 288, 576 and 1152-point FFTs. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing the overlap in the first transform unit 110 determines a window so that the decoder can use the low frequency signal completely restored. It is desirable to determine how to make overlap. However, the first transform unit 110 is not necessarily limited to a transform that transforms from the time domain to the frequency domain, such as an FFT. The first conversion unit 110 may also convert in the same manner as the Quadrature Mirror Filterbank (QMF) indicated by the time domain for each predetermined frequency band.

스펙트럼 생성부(115)는 제1 변환부(110)에서 변환된 여기 신호의 스펙트럼을 이용하여 제2 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다. 예를 들어, 스펙트럼 생성부(115)는 제1 변환부(110)에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 대칭적으 로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.The spectrum generator 115 generates a spectrum in a high frequency region that is larger than the second frequency by using the spectrum of the excitation signal converted by the first converter 110. For example, the spectrum generator 115 patches the spectrum of the excitation signal converted by the first converter 110 in a high frequency region or folds the spectrum symmetrically based on a preset frequency. Can be generated.

제2 변환부(120)는 영역 분할부(100)에서 분할된 고주파수 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 예를 들어, 제2 변환부(120)에서 변환하는 방식으로 FFT이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제2 변환부(120)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제2 변환부(120)는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 제2 변환부(120)는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The second converter 120 converts the high frequency signal divided by the area divider 100 from the time domain to the frequency domain. For example, the second transform unit 120 converts the FFT, and it is preferable to use 288-point including 32 samples of overlap among 288, 576 and 1152-point FFTs. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing the overlap in the second converter 120 determines a window so that the decoder can use the low frequency signal completely restored. It is desirable to determine how to make overlap. However, the second converter 120 is not necessarily limited to a transform that transforms the time domain from the time domain to the frequency domain like the FFT. The second converter 120 may also convert the QMF (Quadrature Mirror Filterbank) indicated by the time domain for each predetermined frequency band.

이득값 계산부(125)는 스펙트럼 생성부(115)에서 생성된 스펙트럼과 제2 변환부(120)에서 변환된 고주파수 신호의 스펙트럼에 대한 소정의 밴드 별 에너지의 비율을 계산함으로써 이득값을 계산한다.The gain value calculator 125 calculates a gain value by calculating a ratio of energy of each band to a spectrum generated by the spectrum generator 115 and a spectrum of the high frequency signal converted by the second converter 120. .

제1 토널리티 계산부(128)는 스펙트럼 생성부(115)에서 생성된 스펙트럼에 대한 토널리티(tonality)를 소정의 밴드 단위로 계산한다. 제1 토널리티 계산부(128)는 토널리티를 계산함에 있어서 SFM(Spectral Flatness Measure)를 이용할 수 있다. SFM를 이용하여 토널리티를 계산할 경우 토널리티는 1에서 SFM 값을 감산한 결과 값을 말한다.The first tonality calculator 128 calculates tonality for the spectrum generated by the spectrum generator 115 in a predetermined band unit. The first tonality calculator 128 may use SFM (Spectral Flatness Measure) in calculating tonality. When calculating tonality using SFM, tonality is the result of subtracting the SFM value from 1.

제2 토널리티 계산부(130)는 제2 변환부(120)에서 변환된 고주파수 신호의 스펙트럼에 대한 토널리티를 소정의 밴드 단위로 계산한다.The second tonality calculator 130 calculates the tonality of the spectrum of the high frequency signal converted by the second converter 120 in a predetermined band unit.

토널리티 비교부(135)는 제1 토널리티 계산부(128)에서 계산된 토널리티와 제2 토널리티 계산부(130)에서 계산된 토널리티를 비교한다.The tonality comparison unit 135 compares the tonality calculated by the first tonality calculator 128 and the tonality calculated by the second tonality calculator 130.

이득값 감소부(140)는 제2 토널리티 계산부(130)에서 계산된 토널리티가 제1 토널리티 계산부(128)에서 계산된 토널리티 보다 크다고 토널리티 비교부(135)에서 판단된 밴드(들)에 대하여 제1 토널리티 계산부(128)에서 계산된 토널리티와 제2 토널리티 계산부(130)에서 계산된 토널리티의 비율만큼 이득값 계산부(125)에서 계산된 이득값을 감소시킨다. 이득값 감소부(140)에서 소정의 밴드(들)에 대하여 이득값을 감소시키는 이유는 복호화기에서 생성된 고주파수 신호의 노이즈 양을 목표 고주파수 신호의 노이즈 양과 비슷하게 하기 위함이다.The gain value reduction unit 140 determines that the tonality calculated by the second tonality calculator 130 is greater than the tonality calculated by the first tonality calculator 128. For the band (s) determined by the gain value calculation unit by the ratio of the tonality calculated by the first tonality calculator 128 and the tonality calculated by the second tonality calculator 130 Reduce the gain value calculated at 125. The reason why the gain value reduction unit 140 reduces the gain value for the predetermined band (s) is to make the noise amount of the high frequency signal generated by the decoder similar to the noise amount of the target high frequency signal.

이득값 감소부(140)에서는 다음 기재된 수학식 1 및 2에 의해 이득값을 감소시킬 수 있다.The gain value reduction unit 140 may decrease the gain value by Equations 1 and 2 described below.

[수학식 1][Equation 1]

Figure 112007035172032-PAT00001
Figure 112007035172032-PAT00001

여기서, Tonality(HB)는 제2 토널리티 계산부(130)에서 계산된 토널리티이고, 제1 토널리티 계산부(128)에서 계산된 토널리티이며, SFM(HB)는 고주파수 신호의 스펙트럼에 대한 SFM이고, SFM(LB)는 스펙트럼 생성부(115)에서 생성된 스펙트럼에 대한 SFM이다.Here, Tonality (HB) is the tonality calculated by the second tonality calculator 130, the tonality calculated by the first tonality calculator 128, SFM (HB) is a high frequency signal SFM for the spectrum of SFM (LB) is the SFM for the spectrum generated by the spectrum generator 115.

[수학식 2][Equation 2]

Figure 112007035172032-PAT00002
Figure 112007035172032-PAT00002

여기서, gain'은 이득값 감소부(140)에서 감소된 소정 밴드의 이득값이고, 수학식 1에 의해 구해진 제1 토널리티 계산부(128)에서 계산된 토널리티와 제2 토널리티 계산부(130)에서 계산된 토널리티의 비율의 비율이며, gain은 이득값 계산부(125)에서 계산된 소정 밴드의 이득값이다.Herein, gain 'is a gain value of a predetermined band reduced by the gain reduction unit 140, and the tonality and the second tonality calculated by the first tonality calculator 128 obtained by Equation (1). It is a ratio of the ratio of tonalities calculated by the calculator 130, and gain is a gain value of a predetermined band calculated by the gain value calculator 125.

이득값 양자화부(145)는 이득값이 감소된 밴드(들)에 대하여 이득값 감소부(140)에서 감소된 이득값을 양자화한다.The gain value quantization unit 145 quantizes the gain value reduced in the gain value reduction unit 140 with respect to the band (s) in which the gain value is reduced.

이득값 양자화부(145)는 제2 토널리티 계산부(130)에서 계산된 토널리티가 제1 토널리티 계산부(128)에서 계산된 토널리티 보다 작다고 토널리티 비교부(135)에서 판단된 밴드(들), 다시 말해서 이득값 감소부(140)에서 이득값이 감소되지 않은 밴드(들),에 대하여 이득값 계산부(125)에서 계산된 이득값을 양자화한다.The gain quantization unit 145 determines that the tonality calculated by the second tonality calculator 130 is smaller than the tonality calculated by the first tonality calculator 128. The gain value calculated by the gain value calculating unit 125 is quantized with respect to the band (s) determined in the step S, that is, the band (s) whose gain value is not reduced by the gain value reducing unit 140.

토널리티 양자화부(150)는 제2 토널리티 계산부(130)에서 계산된 고주파수 신호의 스펙트럼 각 밴드에 대한 토널리티를 양자화한다.The tonality quantization unit 150 quantizes the tonality for each band of the spectrum of the high frequency signal calculated by the second tonality calculator 130.

다중화부(155)는 이득값 양자화부(145)에서 양자화된 이득값 및 토널리티 양자화부(150)에서 양자화된 토널리티를 포함하여 다중화함으로써 비트스트림을 생성하여 출력단자 OUT을 통해 출력한다.The multiplexer 155 generates a bitstream by multiplexing the gain value quantized by the gain value quantizer 145 and the tonality quantized by the tonality quantizer 150 and outputs the bitstream through the output terminal OUT. .

도 2는 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.2 is a flowchart illustrating an embodiment of a bandwidth extension coding method according to the present invention.

먼저, 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다(제200단계). 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.First, the input signal is divided into a low frequency signal and a high frequency signal based on the preset frequency (step 200). Here, the low frequency signal corresponds to a signal corresponding to a region smaller than the preset first frequency, and the high frequency signal refers to a signal corresponding to a region larger than the preset second frequency. Although the first frequency and the second frequency are preferably set to the same value, they are not necessarily set to the same value.

제200단계에서 분할된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다(제205단계). 제205단계에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. The envelope is removed from the low frequency signal divided in operation 200 and the remaining excitation signal is extracted (operation 205). In an embodiment of removing an envelope in operation 205, an excitation signal may be extracted by removing an envelope by performing an LPC (Linear Predictive Coding) analysis.

제205단계에서 추출한 저주파수 신호에 대한 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다(제210단계). 예를 들어, 제210단계에서 변환하는 방식으로 FFT(Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제210단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제210단계에서는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼(transform)에 반드시 한정되어 실시하여야 하는 것은 아니다. 제210단계에서는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The excitation signal for the low frequency signal extracted in step 205 is converted from the time domain to the frequency domain (step 210). For example, there is a Fast Fourier Transform (FFT) as a transformation method in operation 210, and it is preferable to use 288-point including an overlap of 32 samples among 288, 576, and 1152-point FFTs. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing overlap in step 210 may be performed by determining a window so that the decoder can use the low frequency signal completely restored in the decoder. It is desirable to determine. However, step 210 is not necessarily limited to a transform that transforms from the time domain to the frequency domain like the FFT. In operation 210, the conversion may be performed in the same manner as the Quadrature Mirror Filterbank (QMF) indicated by the time domain for each predetermined frequency band.

제210단계에서 변환된 여기 신호의 스펙트럼을 이용하여 제2 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다(제215단계). 예를 들어, 제215단계에서는 제210단계에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 대칭적으로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.In operation 215, a spectrum is generated in a high frequency region that is greater than the second frequency by using the spectrum of the excitation signal converted in operation 210. For example, in operation 215, the spectrum of the excitation signal converted in operation 210 may be patched to a high frequency region or symmetrically folded based on a preset frequency to generate a spectrum.

제200단계에서 분할된 고주파수 신호를 시간 도메인에서 주파수 도메인으로 변환한다(제220단계). 예를 들어, 제220단계에서 변환하는 방식으로 FFT(Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제220단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제220단계에서는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 제220단계에서는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The high frequency signal divided in operation 200 is converted from the time domain to the frequency domain (operation 220). For example, there is a fast fourier transform (FFT) as a transform method in step 220, and it is preferable to use 288-point including 32 samples of overlap among 288, 576, and 1152-point FFTs. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing an overlap in step 220 may be performed by determining a window so that the decoder can use the low frequency signal completely restored in the decoder. It is desirable to determine. However, step 220 is not necessarily limited to the transform that is transformed from the time domain to the frequency domain like the FFT. In operation 220, the conversion may be performed in the same manner as the Quadrature Mirror Filterbank (QMF) indicated by the time domain for each predetermined frequency band.

제220단계에서 변환된 고주파수 신호의 스펙트럼에 대한 토널리티(tonality)를 소정의 밴드 단위로 계산한다(제223단계). 제223단계에서 토널리티를 계산함에 있어서 SFM(Spectral Flatness Measure)를 이용할 수 있다. SFM를 이용하여 토널 리티를 계산할 경우 토널리티는 1에서 SFM 값을 감산한 결과 값을 말한다.The tonality of the spectrum of the high frequency signal converted in operation 220 is calculated in a predetermined band unit (operation 223). In operation 223, SFM (Spectral Flatness Measure) may be used to calculate tonality. When calculating tonality using SFM, tonality is the result of subtracting the SFM value from 1.

제215단계에서 생성된 스펙트럼과 제220단계에서 변환된 고주파수 신호의 스펙트럼에 대한 소정의 밴드 별 에너지의 비율을 계산함으로써 이득값을 계산한다(제225단계).The gain value is calculated by calculating the ratio of the energy of each band to the spectrum of the spectrum generated in step 215 and the spectrum of the high frequency signal converted in step 220 (step 225).

제215단계에서 생성된 스펙트럼에 대한 토널리티를 소정의 밴드 단위로 계산한다(제228단계). The tonality of the spectrum generated in step 215 is calculated in a predetermined band unit (step 228).

제228단계에서 계산된 토널리티와 제223단계에서 계산된 고주파수 신호에 대한 토널리티를 비교한다(제235단계).The tonality calculated in operation 228 is compared with the tonality of the high frequency signal calculated in operation 223 (operation 235).

만일 제223단계에서 계산된 고주파수 신호에 대한 토널리티가 제228단계에서 계산된 토널리티 보다 크다고 제235단계에서 판단된 밴드(들)라면, 제228단계에서 계산된 토널리티와 제223단계에서 계산된 고주파수 신호의 스펙트럼에 대한 토널리티의 비율만큼 제225단계에서 계산된 이득값을 감소시킨다(제240단계). 제240단계에서 소정의 밴드(들)에 대하여 이득값을 감소시키는 이유는 복호화기에서 생성된 고주파수 신호의 노이즈 양을 목표 고주파수 신호의 노이즈 양과 비슷하게 하기 위함이다.If the tonality for the high frequency signal calculated in step 223 is greater than the tonality calculated in step 228, the band (s) determined in step 235, the tonality calculated in step 228 and step 223. The gain value calculated in step 225 is reduced by the ratio of the tonality to the spectrum of the high frequency signal calculated in step 240 (step 240). The reason for reducing the gain value for the predetermined band (s) in operation 240 is to make the amount of noise of the high frequency signal generated by the decoder similar to the amount of noise of the target high frequency signal.

제240단계에서는 다음 기재된 수학식 3 및 4에 의해 이득값을 감소시킬 수 있다.In operation 240, the gain value may be reduced by Equations 3 and 4 described below.

[수학식 3][Equation 3]

Figure 112007035172032-PAT00003
Figure 112007035172032-PAT00003

여기서, Tonality(HB)는 제223단계에서 계산된 토널리티이고, 제228단계에서 계산된 토널리티이며, SFM(HB)는 고주파수 신호의 스펙트럼에 대한 SFM이고, SFM(LB)는 제215단계에서 생성된 스펙트럼에 대한 SFM이다.Here, Tonality (HB) is the tonality calculated in step 223, tonality calculated in step 228, SFM (HB) is the SFM for the spectrum of the high frequency signal, SFM (LB) is the 215th SFM for the spectrum generated in the step.

[수학식 4][Equation 4]

Figure 112007035172032-PAT00004
Figure 112007035172032-PAT00004

여기서, gain'은 제240단계에서 감소된 소정 밴드의 이득값이고, 수학식 3에 의해 구해진 제228단계에서 계산된 토널리티와 제223단계에서 계산된 토널리티의 비율의 비율이며, gain은 제225단계에서 계산된 소정 밴드의 이득값이다.Here, the gain 'is a gain value of the predetermined band reduced in step 240, the ratio of the tonality calculated in step 228 and the tonality calculated in step 223 obtained by Equation 3, and the gain Is a gain value of the predetermined band calculated in step 225.

이득값이 감소된 밴드(들)에 대하여 제240단계에서 감소된 이득값을 양자화한다(제245단계).The gain value reduced in step 240 is quantized with respect to the band (s) in which the gain value is reduced (step 245).

만일 제223단계에서 계산된 고주파수 신호에 대한 토널리티가 제228단계에서 계산된 토널리티 보다 크다고 제235단계에서 판단된 밴드(들)라면, 제245단계에서는 제225단계에서 계산된 이득값을 양자화한다.If the tonality for the high frequency signal calculated in step 223 is greater than the tonality calculated in step 228, the band (s) determined in step 235, the gain value calculated in step 225 is performed in step 245. Quantize

제223단계에서 계산된 고주파수 신호의 스펙트럼 각 밴드에 대한 토널리티를 양자화한다(제250단계).The tonality for each band of the spectrum of the high frequency signal calculated in step 223 is quantized (step 250).

제245단계에서 양자화된 이득값 및 제250단계에서 양자화된 토널리티를 포함하여 다중화함으로써 비트스트림을 생성한다(제255단계).The bitstream is generated by multiplexing the gain value quantized in operation 245 and the tonality quantized in operation 250 (operation 255).

도 3은 본 발명에 의한 대역폭 확장 복호화 장치의 일 실시예를 블록도로 도시한 것으로서, 역다중화부(300), 여기신호 추출부(305), 변환부(310), 스펙트럼 폴딩부(315), 이득값 복호화부(320), 이득값 스무딩부(325), 이득값 적용부(330), 토널리티 계산부(335), 토널리티 복호화부(338), 토널리티 비교부(340), 노이즈 계산부(345), 노이즈 부가부(350), 역변환부(355) 및 영역 합성부(360)를 포함하여 이루어진다.3 is a block diagram illustrating an embodiment of a bandwidth extension decoding apparatus according to the present invention. The demultiplexer 300, the excitation signal extractor 305, the converter 310, the spectral folding unit 315, Gain value decoding unit 320, gain value smoothing unit 325, gain value applying unit 330, tonality calculator 335, tonality decoder 338, and tonality comparison unit 340 And a noise calculator 345, a noise adder 350, an inverse transformer 355, and an area synthesizer 360.

역다중화부(300)는 입력단자 IN을 통해서 부호화단으로부터 비트스트림을 전송받아 역다중화한다. 여기서, 역다중화부(300)는 기 설정된 제1 주파수 보다 큰 영역의 각 밴드에 대한 이득값, 제2 주파수 보다 큰 영역의 각 밴드에 대한 토널리티 및 부호화단에서 부호화된 저주파수 신호가 포함된 비트스트림을 역다중화한다. 여기서, 저주파수 신호는 기 설정된 제2 주파수 보다 작은 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.The demultiplexer 300 receives the bitstream from the encoder through the input terminal IN and demultiplexes the bitstream. Here, the demultiplexer 300 includes a gain value for each band in a region larger than a first frequency, a tonality for each band in a region larger than a second frequency, and a low frequency signal encoded by an encoding stage. Demultiplex the bitstream. Here, the low frequency signal refers to a signal corresponding to a region smaller than the preset second frequency. Although the first frequency and the second frequency are preferably set to the same value, they are not necessarily set to the same value.

여기신호 추출부(305)는 부호화단에서 부호화된 저주파수 신호를 역다중화부(300)로부터 입력받아 저주파수 신호를 복호화하고, 여기서 복호화된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다. 여기신호 추출부(305)에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. 단, 여기신호 추출부(305)에서 여기 신호를 추출함에 있어서, 부호화기에서 여기 신호를 추출하는 방법과 동일하게 실시하는 것이 바람직하다. 여기서, 여기신호 추출부(305)는 복호화된 저주파수 신호를 영역 합성부(355)로 출력하고, 추출한 여기 신호를 변환부(310)로 출력한다.The excitation signal extractor 305 receives the low frequency signal encoded by the encoder from the demultiplexer 300, decodes the low frequency signal, and removes an envelope from the decoded low frequency signal. ). In an exemplary embodiment in which the excitation signal extractor 305 removes an envelope, an excitation signal may be extracted by removing an envelope by performing an LPC (Linear Predictive Coding) analysis. However, in extracting the excitation signal from the excitation signal extractor 305, it is preferable to perform the same method as the method of extracting the excitation signal from the encoder. Here, the excitation signal extractor 305 outputs the decoded low frequency signal to the region synthesizer 355, and outputs the extracted excitation signal to the converter 310.

변환부(310)는 여기신호 추출부(305)에서 추출된 저주파수 신호의 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 예를 들어, 변환부(310)에서 변환하는 방식으로 FFT(Fast Fourier Transform)가 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 변환부(310)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 변환부(310)는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 변환부(310)는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The converter 310 converts the excitation signal of the low frequency signal extracted by the excitation signal extractor 305 from the time domain to the frequency domain. For example, there is a fast fourier transform (FFT) as a method of transforming the transform unit 310, and it is preferable to use 288-point including 32 samples of overlap among 288, 576 and 1152-point FFTs. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing the overlap in the transformer 310 determines the window so that the decoder can use the low frequency signal completely restored in the decoder to generate the overlap. It is desirable to determine how. However, the transform unit 310 is not necessarily limited to the transform transformed from the time domain to the frequency domain like the FFT. The conversion unit 310 may convert the same way as the QMF (Quadrature Mirror Filterbank) represented by the time domain for each predetermined frequency band.

스펙트럼 생성부(315)는 변환부(310)에서 변환된 여기 신호의 스펙트럼을 이용하여 제1 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다. 예를 들어, 스펙트럼 생성부(315)는 변환부(310)에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.The spectrum generator 315 generates a spectrum in a high frequency region that is larger than the first frequency by using the spectrum of the excitation signal converted by the transformer 310. For example, the spectrum generator 315 may patch the spectrum of the excitation signal converted by the converter 310 in the high frequency region or symmetrically fold the spectrum in the high frequency region based on a preset frequency. Can be generated.

이득값 복호화부(320)는 부호화기에서 부호화된 이득값을 역다중화부(300)으로부터 입력받아 이득값을 복호화한다.The gain value decoder 320 receives the gain value encoded by the encoder from the demultiplexer 300 and decodes the gain value.

이득값 스무딩부(325, gain smoothing unit)는 밴드 간 이득값이 급격하게 변화되는 것을 방지하기 위하여 이득값을 스무딩한다. 여기서, 이득값 스무딩 부(325)에서 이득값을 조절하는 일 예로 각 밴드의 중심을 기준으로 밴드간 프리퀀시 빈 인덱스(frequency bin index)에 따라서 보간을 수행하는 방법이 있다. The gain smoothing unit 325 smoothes the gain value in order to prevent the gain value between the bands from changing rapidly. Here, as an example of adjusting the gain value in the gain smoothing unit 325, there is a method of performing interpolation according to the frequency bin index between bands based on the center of each band.

예를 들어, 이득값 스무딩부(325)가 4개의 밴드들에 대하여 이득값을 스무딩하는 실시예를 도 5에 도시하였다. 도 5에 도시된 점은 각 밴드 별 이득값이고, 도 5에 도시된 선분은 스무딩된 이득값이다. 그러나 이득값 스무딩부(325)는 본 발명인 대역폭 확장 부호화 장치에서 반드시 포함하여 실시해야 하는 것은 아니다.For example, FIG. 5 illustrates an embodiment in which the gain smoothing unit 325 smoothes gain values for four bands. The points shown in FIG. 5 are gain values for each band, and the line segments shown in FIG. 5 are smoothed gain values. However, the gain smoothing unit 325 is not necessarily included in the bandwidth extension coding apparatus of the present invention.

이득값 적용부(330)는 스펙트럼 생성부(315)에서 생성된 스펙트럼에 이득값 스무딩부(325)에서 스무딩된 이득값을 적용한다.The gain value applying unit 330 applies the gain value smoothed by the gain value smoothing unit 325 to the spectrum generated by the spectrum generator 315.

토널리티 계산부(335)는 이득값 적용부(330)에서 이득값이 적용된 스펙트럼에 대한 토널리티를 계산한다.The tonality calculator 335 calculates tonality for the spectrum to which the gain value is applied by the gain value applying unit 330.

토널리티 복호화부(338)는 부호화기에서 부호화된 제1 주파수 보다 큰 영역에 해당하는 고주파수 영역의 각 밴드에 대한 토널리티를 역다중화부(300)로부터 입력받아 토널리티(들)을 복호화한다.The tonality decoder 338 receives the tonality for each band of the high frequency region corresponding to the region greater than the first frequency encoded by the encoder from the demultiplexer 300 to decode the tonality (s). do.

토널리티 비교부(340)는 토널리티 계산부(335)에서 계산된 각 밴드의 토널리티와 토널리티 복호화부(338)에서 복호화된 각 밴드의 토널리티를 비교한다.The tonality comparison unit 340 compares the tonality of each band calculated by the tonality calculator 335 and the tonality of each band decoded by the tonality decoder 338.

노이즈 계산부(345)는 토널리티 계산부(335)에서 계산된 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티 보다 큰 밴드(들)에 대하여 고주파수 신호의 스펙트럼에 대한 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티에 유사해질 수 있는 노이즈를 계산한다. 예를 들어, 노이즈 계산부(345)에서는 다음 기재된 수학식 5 내지 7에 의해 노이즈를 계산할 수 있다.The noise calculator 345 may determine the spectrum of the high frequency signal for the band (s) whose tonality calculated by the tonality calculator 335 is larger than the tonality decoded by the tonality decoder 338. The tonality calculates noise that may be similar to the tonality decoded by the tonality decoder 338. For example, the noise calculator 345 may calculate noise by the following Equations 5 to 7 described below.

[수학식 5][Equation 5]

Figure 112007035172032-PAT00005
Figure 112007035172032-PAT00005

[수학식 6][Equation 6]

Figure 112007035172032-PAT00006
Figure 112007035172032-PAT00006

[수학식 7][Equation 7]

Figure 112007035172032-PAT00007
Figure 112007035172032-PAT00007

여기서, i는 밴드 인덱스(band index)이고, j는 스펙트럴 라인 인덱스(spectral line index)이다.Where i is a band index and j is a spectral line index.

노이즈 부가부(350)는 이득값 적용부(330)에서 이득값이 적용된 스펙트럼에 노이즈 계산부(345)에서 계산된 노이즈를 부가한다.The noise adding unit 350 adds the noise calculated by the noise calculating unit 345 to the spectrum to which the gain value is applied by the gain value applying unit 330.

역변환부(353)는 토널리티 계산부(335)에서 계산된 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티 보다 큰 밴드(들)에 대하여 노이즈 부가부(350)에서 노이즈가 부가된 스펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다. 예를 들어, 역변환부(353)에서 변환하는 방식으로 IFFT(Inverse Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 IFFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 역변환부(353)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호 를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 역변환부(353)는 IFFT와 같이 주파수 도메인에서 시간 도메인으로 변환하는 트랜스폼(transform)에 반드시 한정되어 실시하여야 하는 것은 아니며 QMF(Quadrature Mirror Filterbank)와 같은 트랜스폼에서도 실시할 수 있다.The inverse transformer 353 may perform the noise adding unit 350 on the band (s) whose tonality calculated by the tonality calculator 335 is larger than the tonality decoded by the tonality decoder 338. Inversely transforms the noisy spectrum from the frequency domain to the time domain. For example, an inverse fast fourier transform (IFFT) may be used as the inverse transform unit 353, and it is preferable to use 288-point including an overlap of 32 samples among 288, 576, and 1152-point IFFTs. For example, if the transform using the overlap is used in the process of encoding the low frequency signal, the method of performing the overlap in the inverse transformer 353 determines the window so that the decoder can use the low frequency signal that is completely restored by the decoder. It is desirable to determine how. However, the inverse transform unit 353 is not necessarily limited to a transform that transforms the frequency domain from the time domain, such as IFFT, but may also be performed in a transform such as a quadrature mirror filterbank (QMF).

여기서, 역변환부(353)는 도 6에 도시된 바와 같이 오버랩(overlap)을 수행할 수 있다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 역변환부(353)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다.Here, the inverse transform unit 353 may perform an overlap as shown in FIG. 6. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing the overlap in the inverse transformer 353 determines the window so that the decoder can use the low frequency signal that is completely restored by the decoder. It is desirable to determine how.

또한, 역변환부(353)는 토널리티 계산부(335)에서 계산된 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티 보다 작은 밴드(들)에 대하여 이득값 적용부(330)에서 이득값이 적용된 스펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다.In addition, the inverse transformer 353 may apply the gain value applying unit to the band (s) whose tonality calculated by the tonality calculator 335 is smaller than the tonality decoded by the tonality decoder 338. In 330, the gain-applied spectrum is inversely transformed from the frequency domain to the time domain.

영역 합성부(355)는 기 설정된 주파수 보다 작은 영역에 여기신호 추출부(305)에서 복호화된 저주파수 신호를 마련하고, 기 설정된 주파수 보다 큰 영역에 역변환부(353)에서 역변환된 고주파수 신호를 마련함으로써 저주파수 신호와 저주파수 신호를 합성하여 출력단자 OUT을 통해 출력한다.The region synthesizing unit 355 provides a low frequency signal decoded by the excitation signal extractor 305 in a region smaller than a preset frequency, and prepares a high frequency signal inversely transformed by the inverse transformer 353 in a region larger than the preset frequency. The low frequency signal and the low frequency signal are synthesized and output through the output terminal OUT.

도 4는 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.4 is a flowchart illustrating an embodiment of a bandwidth extension decoding method according to the present invention.

먼저, 부호화단으로부터 비트스트림을 전송받아 역다중화한다(제400단계). 제400단계에서는 기 설정된 제1 주파수 보다 큰 영역의 각 밴드에 대한 이득값, 제2 주파수 보다 큰 영역의 각 밴드에 대한 토널리티 및 부호화단에서 부호화된 저주파수 신호가 포함된 비트스트림을 역다중화한다. 여기서, 저주파수 신호는 기 설정된 제2 주파수 보다 작은 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.First, the bitstream is received from the encoder and demultiplexed (operation 400). In operation 400, the multiplexing bitstream including a gain value for each band in a region greater than a first frequency, a tonality for each band in a region greater than a second frequency, and a low frequency signal encoded by an encoding stage are demultiplexed. do. Here, the low frequency signal refers to a signal corresponding to a region smaller than the preset second frequency. Although the first frequency and the second frequency are preferably set to the same value, they are not necessarily set to the same value.

부호화단에서 부호화된 저주파수 신호를 복호화하고, 여기서 복호화된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다(제405단계). 제405단계에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. 단, 제405단계에서 여기 신호를 추출함에 있어서, 부호화기에서 여기 신호를 추출하는 방법과 동일하게 실시하는 것이 바람직하다. The encoder encodes the low frequency signal encoded by the encoder, and removes an envelope from the decoded low frequency signal and extracts the remaining excitation signal (step 405). As an example of removing an envelope in operation 405, an excitation signal may be extracted by performing an envelope prediction (LPC) analysis. However, in extracting the excitation signal in step 405, it is preferable to perform the same method as the method of extracting the excitation signal from the encoder.

제405단계에서 추출된 저주파수 신호의 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다(제410단계). 예를 들어, 제410단계에서 변환하는 방식으로 FFT(Fast Fourier Transform)가 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제410단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제410단계에서는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변 환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 제410단계에서는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The excitation signal of the low frequency signal extracted in operation 405 is converted from the time domain to the frequency domain (operation 410). For example, there is a Fast Fourier Transform (FFT) as a transformation method in step 410, and it is preferable to use 288-point including an overlap of 32 samples among 288, 576, and 1152-point FFTs. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing an overlap in step 410 is a method of overlapping by determining a window so that the decoder can use a completely restored low frequency signal. It is desirable to determine. However, step 410 is not necessarily limited to the transform that is transformed from the time domain to the frequency domain like the FFT. In operation 410, the conversion may be performed in the same manner as the Quadrature Mirror Filterbank (QMF) indicated by the time domain for each predetermined frequency band.

제410단계에서 변환된 여기 신호의 스펙트럼을 이용하여 제1 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다(제415단계). 예를 들어, 제415단계에서는 제410단계에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.A spectrum is generated in a high frequency region that is greater than the first frequency by using the spectrum of the excitation signal converted in operation 410 (operation 415). For example, in operation 415, the spectrum of the excitation signal converted in operation 410 may be patched to a high frequency region or symmetrically folded in the high frequency region based on a preset frequency to generate a spectrum. .

부호화기에서 부호화된 이득값을 복호화한다(제420단계).In operation 420, the gain value encoded by the encoder is decoded.

밴드 간 이득값이 급격하게 변화되는 것을 방지하기 위하여 이득값을 스무딩(smoothing)한다(제425단계). 제425단계에서 이득값을 조절하는 일 예로 각 밴드의 중심을 기준으로 밴드간 프리퀀시 빈 인덱스(frequency bin index)에 따라서 보간을 수행하는 방법이 있다. In order to prevent the gain between bands from changing rapidly, the gain is smoothed (step 425). As an example of adjusting the gain value in operation 425, there is a method of performing interpolation according to a frequency bin index between bands based on the center of each band.

예를 들어, 제425단계에서 4개의 밴드들에 대하여 이득값을 스무딩하는 실시예를 도 5에 도시하였다. 도 5에 도시된 점은 각 밴드 별 이득값이고, 도 5에 도시된 선분은 스무딩된 이득값이다. 그러나 제425단계는 본 발명인 대역폭 확장 부호화 방법에서 반드시 포함하여 실시해야 하는 것은 아니다.For example, an exemplary embodiment of smoothing gain values for four bands in operation 425 is illustrated in FIG. 5. The points shown in FIG. 5 are gain values for each band, and the line segments shown in FIG. 5 are smoothed gain values. However, step 425 is not necessarily included in the bandwidth extension coding method of the present invention.

제415단계에서 생성된 스펙트럼에 제425단계에서 스무딩된 이득값을 적용한다(제430단계).The smoothed gain value is applied to the spectrum generated in operation 415 (operation 430).

제430단계에서 이득값이 적용된 스펙트럼에 대한 토널리티를 계산한다(제435 단계).In operation 430, the tonality of the spectrum to which the gain is applied is calculated (operation 435).

부호화기에서 부호화된 제1 주파수 보다 큰 영역에 해당하는 고주파수 영역의 각 밴드에 대한 토널리티를 복호화한다(제438단계).In operation 438, the encoder decodes the tonality for each band of the high frequency region corresponding to the region larger than the encoded first frequency.

제435단계에서 계산된 각 밴드의 토널리티와 제438단계에서 복호화된 각 밴드의 토널리티를 비교한다(제440단계).The tonality of each band calculated in step 435 is compared with the tonality of each band decoded in step 438 (step 440).

제435단계에서 계산된 토널리티가 제438단계에서 복호화된 토널리티 보다 크다고 제440단계에서 판단된 밴드(들)일 경우, 고주파수 신호의 스펙트럼에 대한 토널리티가 제438단계에서 복호화된 토널리티에 유사해질 수 있는 노이즈를 계산한다(제445단계). 예를 들어, 제445단계에서는 다음 기재된 수학식 8 내지 10에 의해 노이즈를 계산할 수 있다.If the tonality calculated in step 435 is the band (s) determined in step 440 that the tonality calculated in step 438 is greater than that, the tonality for the spectrum of the high frequency signal is decoded in step 438. A noise that may be similar to the tonality is calculated (operation 445). For example, in operation 445, noise may be calculated by using Equations 8 to 10 described below.

[수학식 8][Equation 8]

Figure 112007035172032-PAT00008
Figure 112007035172032-PAT00008

[수학식 9][Equation 9]

Figure 112007035172032-PAT00009
Figure 112007035172032-PAT00009

[수학식 10][Equation 10]

Figure 112007035172032-PAT00010
Figure 112007035172032-PAT00010

여기서, i는 밴드 인덱스(band index)이고, j는 스펙트럴 라인 인덱스(spectral line index)이다.Where i is a band index and j is a spectral line index.

제430단계에서 이득값이 적용된 스펙트럼에 제445단계에서 계산된 노이즈를 부가한다(제450단계).In operation 430, the noise calculated in operation 445 is added to the spectrum to which the gain value is applied (operation 450).

제435단계에서 계산된 토널리티가 제438단계에서 복호화된 토널리티 보다 큰 밴드(들)에 대하여 제450단계에서 노이즈가 부가된 스펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다(제453단계). 예를 들어, 제453단계에서 변환하는 방식으로 IFFT(Inverse Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 IFFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제453단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제453단계에서는 IFFT와 같이 주파수 도메인에서 시간 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니며 QMF(Quadrature Mirror Filterbank)와 같은 트랜스폼에서도 실시할 수 있다.In operation 450, the spectrum to which the noise is added in which the tonality calculated in operation 435 is greater than the tonality decoded in operation 438 is transformed from the frequency domain to the time domain (operation 453). . For example, there is an Inverse Fast Fourier Transform (IFFT) as a transformation method in step 453, and it is preferable to use 288-point including 32 samples of overlap among 288, 576 and 1152-point IFFT. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing an overlap in step 453 is a method of overlapping by determining a window so that the decoder can use a completely restored low frequency signal. It is desirable to determine. However, in step 453, the transformation is not necessarily limited to the transform in the frequency domain to the time domain, such as IFFT, and may also be performed in a transform such as a quadrature mirror filterbank (QMF).

제453단계에서는 도 6에 도시된 바와 같이 오버랩(overlap)을 수행할 수 있다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제453단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다.In operation 453, as illustrated in FIG. 6, an overlap may be performed. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing an overlap in step 453 is a method of overlapping by determining a window so that the decoder can use a completely restored low frequency signal. It is desirable to determine.

또한, 제453단계에서는 제435단계에서 계산된 토널리티가 제438단계에서 복호화된 토널리티 보다 작은 밴드(들)에 대하여 제430단계에서 이득값이 적용된 스 펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다.Further, in step 453, the spectrum in which the gain is applied in step 430 for the band (s) whose tonality calculated in step 435 is smaller than the tonality decoded in step 438 is transmitted from the frequency domain to the time domain. Invert

기 설정된 주파수 보다 작은 영역에 제405단계에서 복호화된 저주파수 신호를 마련하고, 기 설정된 주파수 보다 큰 영역에 제453단계에서 역변환된 고주파수 신호를 마련함으로써 저주파수 신호와 저주파수 신호를 합성한다(제455단계).The low frequency signal decoded in operation 405 is provided in a region smaller than the preset frequency, and the low frequency signal and the low frequency signal are synthesized by providing a high frequency signal inversely transformed in operation 453 in an area larger than the preset frequency (operation 455). .

이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.Although described with reference to the embodiment shown in the drawings to aid in understanding of the present invention, this is merely exemplary, those skilled in the art that various modifications and equivalent other embodiments are possible from this. Will understand. Therefore, the true technical protection scope of the present invention will be defined by the appended claims.

또한, 본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.In addition, the present invention can be embodied as computer readable codes on a computer readable recording medium, including all devices having an information processing function. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording devices include ROM, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like.

본 발명에 의한 대역폭 확장 부호화 및 복호화 방법 및 장치에 의하면, 저주파수 신호의 여기 신호를 이용하여 고주파수 신호를 부호화하거나 복호화한다.According to the bandwidth extension encoding and decoding method and apparatus according to the present invention, a high frequency signal is encoded or decoded using an excitation signal of a low frequency signal.

이렇게 함으로써 적은 비트를 이용하여 오디오 신호를 부호화하거나 복호화함에도 불구하고 고주파수 영역에 해당하는 신호의 음질을 저하시키지 않으므로 코 딩 효율을 극대화할 수 있는 효과를 거둘 수 있다.In this way, even though the audio signal is encoded or decoded using fewer bits, the sound quality of the signal corresponding to the high frequency region is not degraded, thereby achieving the effect of maximizing the coding efficiency.

Claims (28)

기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계;Extracting an excitation signal from a low frequency signal corresponding to a region smaller than a preset frequency, and converting the excitation signal into a frequency domain; 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계; 및Generating a spectrum to be provided in an area larger than a preset frequency using the converted spectrum of the excitation signal; And 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 단계를 포함하는 것을 특징으로 하는 대역폭 확장 부호화 방법.And calculating a gain value by comparing the generated spectrum with a spectrum of a high frequency signal corresponding to a region larger than a predetermined frequency. 제1항에 있어서, The method of claim 1, 상기 생성된 스펙트럼에 대한 토널리티와 상기 고주파수 신호의 스펙트럼에 대한 토널리티를 계산하여 비교하는 단계; 및Calculating and comparing the tonality for the generated spectrum with the tonality for the spectrum of the high frequency signal; And 상기 비교된 결과에 따라 상기 계산된 이득값을 조절하는 단계를 더 포함하는 것을 특징으로 하는 대역폭 확장 부호화 방법.And adjusting the calculated gain according to the compared result. 제1항에 있어서, 상기 변환하는 단계는The method of claim 1, wherein the converting step 상기 저주파수 신호에 대하여 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출하는 것을 특징으로 하는 대역폭 확장 부호화 방법.And extracting an excitation signal by removing an envelope by performing linear predictive coding (LPC) analysis on the low frequency signal. 제1항에 있어서, 상기 생성하는 단계는The method of claim 1, wherein the generating step 상기 저주파수 신호를 기 설정된 주파수 보다 큰 영역에 폴딩(folding)하거나 대칭적으로 기 설정된 주파수 보다 큰 영역에 패치(patch)하여 스펙트럼을 생성하는 것을 특징으로 하는 대역폭 확장 부호화 방법.And generating a spectrum by folding the low-frequency signal in a region larger than a preset frequency or patching the low frequency signal in a region symmetrically larger than a preset frequency. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2, 상기 이득값 또는 상기 고주파수 신호의 스펙트럼에 대한 토널리티를 부호화하는 단계를 더 포함하는 것을 특징으로 하는 대역폭 확장 부호화 방법.And encoding the tonality of the gain value or the spectrum of the high frequency signal. 제1항에 있어서, 상기 계산하는 단계는The method of claim 1 wherein the calculating step 상기 생성된 스펙트럼에 대한 에너지 값과 상기 마련된 고주파수 신호의 스펙트럼에 대한 에너지 값의 비율을 계산하여 이득값을 계산하는 것을 특징으로 하는 대역폭 확장 부호화 방법.And a gain value is calculated by calculating a ratio of an energy value for the generated spectrum and an energy value for the spectrum of the prepared high frequency signal. 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계;Extracting an excitation signal from the low frequency signal provided in a region smaller than a predetermined frequency, and converting the excitation signal into a frequency domain; 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계; 및Generating a spectrum to be provided in an area larger than a preset frequency using the converted spectrum of the excitation signal; And 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것 을 특징으로 하는 대역폭 확장 복호화 방법.And decoding a gain value and applying the gain value to the generated spectrum. 제7항에 있어서,The method of claim 7, wherein 상기 이득값을 스무딩하는 단계를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 방법.And smoothing the gain value. 제7항 또는 제8항에 있어서,The method according to claim 7 or 8, 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 토널리티를 복호하하는 단계;Decoding the tonality of a high frequency signal corresponding to a region larger than a preset frequency; 상기 이득값이 적용된 스펙트럼의 토널리티를 계산하는 단계;Calculating tonality of the spectrum to which the gain value is applied; 상기 복호화된 토널리티와 상기 계산된 토널리티를 비교하여 상기 이득값이 적용된 스펙트럼에 부가할 노이즈를 계산하는 단계; 및Calculating noise to be added to the spectrum to which the gain value is applied by comparing the decoded tonality and the calculated tonality; And 상기 계산된 노이즈를 상기 이득값이 적용된 스펙트럼에 부가하는 단계를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 방법.And adding the calculated noise to a spectrum to which the gain value is applied. 제7항에 있어서, 상기 변환하는 단계는The method of claim 7, wherein the converting step 상기 저주파수 신호에 대하여 LPC 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출하는 것을 특징으로 하는 대역폭 확장 복호화 방법.And extracting an excitation signal by removing an envelope by performing LPC analysis on the low frequency signal. 제7항에 있어서, 상기 생성하는 단계는The method of claim 7, wherein the generating step 상기 저주파수 신호를 기 설정된 주파수 보다 큰 영역에 폴딩하거나 대칭적으로 기 설정된 주파수 보다 큰 영역에 패치하여 스펙트럼을 생성하는 것을 특징으로 하는 대역폭 확장 복호화 방법.And generating a spectrum by folding the low frequency signal in a region larger than a predetermined frequency or symmetrically patching a region in a region larger than a predetermined frequency. 제7항에 있어서,The method of claim 7, wherein 상기 저주파수 신호를 복호화하는 단계를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 방법.And decoding the low frequency signal. 제12항에 있어서,The method of claim 12, 상기 이득값이 적용된 스펙트럼을 시간 도메인으로 역변환하는 단계; 및Inversely converting the gain-applied spectrum into a time domain; And 상기 복호화된 저주파수 신호와 상기 역변환된 스펙트럼을 합성하는 단계를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 방법.And synthesizing the decoded low frequency signal and the inverse transformed spectrum. 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 여기신호 추출부;An excitation signal extracting unit extracting an excitation signal from the low frequency signal corresponding to a region smaller than a preset frequency, extracting an excitation signal, and converting the excitation signal into a frequency domain; 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 스펙트럼 생성부; 및A spectrum generator for generating a spectrum to be provided in a region larger than a preset frequency by using the converted spectrum of the excitation signal; And 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 이득값 계산부를 포함하는 것을 특징으로 하는 대역폭 확장 부호화 장치.And a gain value calculator for comparing the generated spectrum with a spectrum of a high frequency signal corresponding to a region larger than a preset frequency to calculate a gain value. 제14항에 있어서, The method of claim 14, 상기 생성된 스펙트럼에 대한 토널리티와 상기 고주파수 신호의 스펙트럼에 대한 토널리티를 계산하여 비교하는 토널리티 비교부; 및A tonality comparison unit configured to calculate and compare the tonality of the generated spectrum with the tonality of the spectrum of the high frequency signal; And 상기 비교된 결과에 따라 상기 계산된 이득값을 조절하는 이득값 조절부를 더 포함하는 것을 특징으로 하는 대역폭 확장 부호화 장치.And a gain value adjusting unit for adjusting the calculated gain value according to the compared result. 제14항에 있어서, 상기 여기신호 추출부는15. The method of claim 14, wherein the excitation signal extractor 상기 저주파수 신호에 대하여 LPC 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출하는 것을 특징으로 하는 대역폭 확장 부호화 장치.And an excitation signal is extracted by removing an envelope by performing LPC analysis on the low frequency signal. 제14항에 있어서, 상기 스펙트럼 생성부는The method of claim 14, wherein the spectrum generating unit 상기 저주파수 신호를 기 설정된 주파수 보다 큰 영역에 폴딩하거나 대칭적으로 기 설정된 주파수 보다 큰 영역에 패치하여 스펙트럼을 생성하는 것을 특징으로 하는 대역폭 확장 부호화 장치.And generating a spectrum by folding the low frequency signal in an area larger than a preset frequency or patching the low frequency signal in an area symmetrically larger than a preset frequency. 제14항 또는 제15항에 있어서,The method according to claim 14 or 15, 상기 이득값 또는 상기 고주파수 신호의 스펙트럼에 대한 토널리티를 부호화하는 부호화부를 더 포함하는 것을 특징으로 하는 대역폭 확장 부호화 장치.And an encoder which encodes tonality for the gain value or the spectrum of the high frequency signal. 제14항에 있어서, 상기 이득값 계산부는15. The apparatus of claim 14, wherein the gain calculator 상기 생성된 스펙트럼에 대한 에너지 값과 상기 마련된 고주파수 신호의 스펙트럼에 대한 에너지 값의 비율을 계산하여 이득값을 계산하는 것을 특징으로 하는 대역폭 확장 부호화 장치.And a gain value is calculated by calculating a ratio of an energy value for the generated spectrum and an energy value for the spectrum of the prepared high frequency signal. 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 여기신호 추출부;An excitation signal extracting unit extracting an excitation signal by removing an envelope from a low frequency signal provided in a region smaller than a preset frequency and converting the excitation signal into a frequency domain; 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 스펙트럼 생성부; 및A spectrum generator for generating a spectrum to be provided in a region larger than a preset frequency by using the converted spectrum of the excitation signal; And 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 스펙트럼 적용부를 포함하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And a spectrum application unit for decoding a gain value and applying the same to the generated spectrum. 제20항에 있어서,The method of claim 20, 상기 이득값을 스무딩하는 이득값 스무딩부를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And a gain value smoothing unit for smoothing the gain value. 제20항 또는 제21항에 있어서,The method of claim 20 or 21, 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 토널리티를 복호하하는 토널리티 복호화부;A tonality decoder which decodes the tonality of a high frequency signal corresponding to a region larger than a preset frequency; 상기 이득값이 적용된 스펙트럼의 토널리티를 계산하는 토널리티 계산부;A tonality calculator for calculating tonality of a spectrum to which the gain value is applied; 상기 복호화된 토널리티와 상기 계산된 토널리티를 비교하여 상기 이득값이 적용된 스펙트럼에 부가할 노이즈를 계산하는 노이즈 계산부; 및A noise calculator which compares the decoded tonality and the calculated tonality and calculates noise to be added to a spectrum to which the gain value is applied; And 상기 계산된 노이즈를 상기 이득값이 적용된 스펙트럼에 부가하는 노이즈 부가부를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And a noise adding unit for adding the calculated noise to the spectrum to which the gain value is applied. 제20항에 있어서, 상기 여기신호 추출부는The method of claim 20, wherein the excitation signal extractor 상기 저주파수 신호에 대하여 LPC 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And an excitation signal is extracted by removing an envelope by performing LPC analysis on the low frequency signal. 제20항에 있어서, 상기 스펙트럼 생성부는The method of claim 20, wherein the spectrum generating unit 상기 저주파수 신호를 기 설정된 주파수 보다 큰 영역에 폴딩하거나 대칭적으로 기 설정된 주파수 보다 큰 영역에 패치하여 스펙트럼을 생성하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And generating a spectrum by folding the low frequency signal in a region larger than a preset frequency or symmetrically patching a region in a region larger than a preset frequency. 제20항에 있어서,The method of claim 20, 상기 저주파수 신호를 복호화하는 저주파수신호 복호화부를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And a low frequency signal decoder which decodes the low frequency signal. 제20항에 있어서,The method of claim 20, 상기 이득값이 적용된 스펙트럼을 시간 도메인으로 역변환하는 역변환부; 및An inverse transformer for inversely converting the spectrum to which the gain value is applied; And 상기 복호화된 저주파수 신호와 상기 역변환된 스펙트럼을 합성하는 영역 합성부를 더 포함하는 것을 특징으로 하는 대역폭 확장 복호화 장치.And an area synthesizer for synthesizing the decoded low frequency signal and the inverse transformed spectrum. 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계;Extracting an excitation signal from a low frequency signal corresponding to a region smaller than a preset frequency, and converting the excitation signal into a frequency domain; 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계; 및Generating a spectrum to be provided in an area larger than a preset frequency using the converted spectrum of the excitation signal; And 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.And calculating a gain value by comparing the generated spectrum with a spectrum of a high frequency signal corresponding to a region larger than a predetermined frequency, the computer readable recording medium having recorded thereon a program for executing the invention. 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계;Extracting an excitation signal from the low frequency signal provided in a region smaller than a predetermined frequency, and converting the excitation signal into a frequency domain; 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계; 및Generating a spectrum to be provided in an area larger than a preset frequency using the converted spectrum of the excitation signal; And 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the invention on a computer, the method comprising decoding a gain value and applying it to the generated spectrum.
KR1020070046203A 2006-11-17 2007-05-11 Method and apparatus for bandwidth extension encoding and decoding KR101375582B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US11/980,643 US8639500B2 (en) 2006-11-17 2007-10-31 Method, medium, and apparatus with bandwidth extension encoding and/or decoding
PCT/KR2007/005626 WO2008060068A1 (en) 2006-11-17 2007-11-08 Method, medium, and apparatus with bandwidth extension encoding and/or decoding
CN200780048069XA CN101568959B (en) 2006-11-17 2007-11-08 Method, medium, and apparatus with bandwidth extension encoding and/or decoding

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20060114101 2006-11-17
KR1020060114101 2006-11-17

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020130106344A Division KR101376098B1 (en) 2006-11-17 2013-09-04 Method and apparatus for bandwidth extension decoding

Publications (2)

Publication Number Publication Date
KR20080045047A true KR20080045047A (en) 2008-05-22
KR101375582B1 KR101375582B1 (en) 2014-03-20

Family

ID=39662686

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070046203A KR101375582B1 (en) 2006-11-17 2007-05-11 Method and apparatus for bandwidth extension encoding and decoding
KR1020130106344A KR101376098B1 (en) 2006-11-17 2013-09-04 Method and apparatus for bandwidth extension decoding

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020130106344A KR101376098B1 (en) 2006-11-17 2013-09-04 Method and apparatus for bandwidth extension decoding

Country Status (2)

Country Link
KR (2) KR101375582B1 (en)
CN (1) CN101568959B (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130007485A (en) * 2011-06-30 2013-01-18 삼성전자주식회사 Apparatus and method for generating a bandwidth extended signal
KR20130107257A (en) * 2012-03-21 2013-10-01 삼성전자주식회사 Method and apparatus for encoding and decoding high frequency for bandwidth extension
KR101461774B1 (en) * 2010-05-25 2014-12-02 노키아 코포레이션 A bandwidth extender
KR20150103643A (en) * 2014-03-03 2015-09-11 삼성전자주식회사 Method and apparatus for decoding high frequency for bandwidth extension
US9183847B2 (en) 2010-09-15 2015-11-10 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
KR20160098285A (en) * 2013-12-16 2016-08-18 퀄컴 인코포레이티드 High-band signal modeling
US11676614B2 (en) 2014-03-03 2023-06-13 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
US11688406B2 (en) 2014-03-24 2023-06-27 Samsung Electronics Co., Ltd. High-band encoding method and device, and high-band decoding method and device

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP6075743B2 (en) * 2010-08-03 2017-02-08 ソニー株式会社 Signal processing apparatus and method, and program
CN103971694B (en) 2013-01-29 2016-12-28 华为技术有限公司 The Forecasting Methodology of bandwidth expansion band signal, decoding device
CN104517611B (en) * 2013-09-26 2016-05-25 华为技术有限公司 A kind of high-frequency excitation signal Forecasting Methodology and device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
SG161223A1 (en) * 2005-04-01 2010-05-27 Qualcomm Inc Method and apparatus for vector quantizing of a spectral envelope representation

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101461774B1 (en) * 2010-05-25 2014-12-02 노키아 코포레이션 A bandwidth extender
US10418043B2 (en) 2010-09-15 2019-09-17 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
US9183847B2 (en) 2010-09-15 2015-11-10 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
US9837090B2 (en) 2010-09-15 2017-12-05 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
KR20200143665A (en) * 2011-06-30 2020-12-24 삼성전자주식회사 Apparatus and method for generating a bandwidth extended signal
KR20200019164A (en) * 2011-06-30 2020-02-21 삼성전자주식회사 Apparatus and method for generating a bandwidth extended signal
KR20130007485A (en) * 2011-06-30 2013-01-18 삼성전자주식회사 Apparatus and method for generating a bandwidth extended signal
KR20200010540A (en) * 2012-03-21 2020-01-30 삼성전자주식회사 Method and apparatus for encoding and decoding high frequency for bandwidth extension
KR20130107257A (en) * 2012-03-21 2013-10-01 삼성전자주식회사 Method and apparatus for encoding and decoding high frequency for bandwidth extension
KR20200144086A (en) * 2012-03-21 2020-12-28 삼성전자주식회사 Method and apparatus for encoding and decoding high frequency for bandwidth extension
KR20160098285A (en) * 2013-12-16 2016-08-18 퀄컴 인코포레이티드 High-band signal modeling
KR20210116698A (en) * 2013-12-16 2021-09-27 퀄컴 인코포레이티드 High-band signal modeling
KR20150103643A (en) * 2014-03-03 2015-09-11 삼성전자주식회사 Method and apparatus for decoding high frequency for bandwidth extension
KR20220051317A (en) * 2014-03-03 2022-04-26 삼성전자주식회사 Method and apparatus for decoding high frequency for bandwidth extension
US11676614B2 (en) 2014-03-03 2023-06-13 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
US11688406B2 (en) 2014-03-24 2023-06-27 Samsung Electronics Co., Ltd. High-band encoding method and device, and high-band decoding method and device

Also Published As

Publication number Publication date
CN101568959B (en) 2013-10-23
KR101376098B1 (en) 2014-03-31
KR101375582B1 (en) 2014-03-20
CN101568959A (en) 2009-10-28
KR20130112817A (en) 2013-10-14

Similar Documents

Publication Publication Date Title
KR101375582B1 (en) Method and apparatus for bandwidth extension encoding and decoding
KR101376100B1 (en) Method and apparatus for bandwidth extension decoding
KR101747918B1 (en) Method and apparatus for decoding high frequency signal
US8639500B2 (en) Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101373004B1 (en) Apparatus and method for encoding and decoding high frequency signal
CN106847295B (en) Encoding device and encoding method
KR101435893B1 (en) Method and apparatus for encoding and decoding audio signal using band width extension technique and stereo encoding technique
JP6170520B2 (en) Audio and / or speech signal encoding and / or decoding method and apparatus
JP5970014B2 (en) Audio encoder and bandwidth extension decoder
KR101379263B1 (en) Method and apparatus for decoding bandwidth extension
KR101213840B1 (en) Decoding device and method thereof, and communication terminal apparatus and base station apparatus comprising decoding device
KR101411900B1 (en) Method and apparatus for encoding and decoding audio signal
KR101390188B1 (en) Method and apparatus for encoding and decoding adaptive high frequency band
KR20080005325A (en) Method and apparatus for adaptive encoding/decoding
KR20070121254A (en) Method and apparatus for wideband encoding and decoding
KR101441312B1 (en) Method and Apparatus for encoding audio/speech signal
KR101393300B1 (en) Method and Apparatus for decoding audio/speech signal
JP4354561B2 (en) Audio signal encoding apparatus and decoding apparatus
AU2015203736B2 (en) Audio encoder and bandwidth extension decoder
KR101352608B1 (en) A method for extending bandwidth of vocal signal and an apparatus using it
KR20130012972A (en) Method of encoding audio/speech signal
KR20120089230A (en) Apparatus for decoding a signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190227

Year of fee payment: 6