KR20080045047A - Method and apparatus for bandwidth extension encoding and decoding - Google Patents
Method and apparatus for bandwidth extension encoding and decoding Download PDFInfo
- Publication number
- KR20080045047A KR20080045047A KR1020070046203A KR20070046203A KR20080045047A KR 20080045047 A KR20080045047 A KR 20080045047A KR 1020070046203 A KR1020070046203 A KR 1020070046203A KR 20070046203 A KR20070046203 A KR 20070046203A KR 20080045047 A KR20080045047 A KR 20080045047A
- Authority
- KR
- South Korea
- Prior art keywords
- spectrum
- tonality
- gain value
- signal
- frequency signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000001228 spectrum Methods 0.000 claims abstract description 131
- 230000005284 excitation Effects 0.000 claims description 84
- 238000009499 grossing Methods 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 5
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 1은 본 발명에 의한 대역폭 확장 부호화 장치의 일 실시예를 블록도로 도시한 것이다.1 is a block diagram illustrating an embodiment of a bandwidth extension coding apparatus according to the present invention.
도 2는 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.2 is a flowchart illustrating an embodiment of a bandwidth extension coding method according to the present invention.
도 3은 본 발명에 의한 대역폭 확장 복호화 장치의 일 실시예를 블록도로 도시한 것이다.3 is a block diagram illustrating an embodiment of a bandwidth extension decoding apparatus according to the present invention.
도 4는 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.4 is a flowchart illustrating an embodiment of a bandwidth extension decoding method according to the present invention.
도 5는 본 발명에 의한 대역폭 확장 복호화 장치 및 방법에 의해 4개의 서브 밴드에 대하여 이득값을 스무딩(smoothing)하는 일 실시예를 그래프로 도시한 것이다.FIG. 5 is a graph illustrating an embodiment of smoothing a gain value for four subbands by the apparatus and method for bandwidth extension decoding according to the present invention.
도 6은 본 발명에 의한 대역폭 확장 복호화 장치 및 방법에서 오버랩(overlap)하는 일 실시예를 그래프로 도시한 것이다.6 is a graph illustrating an embodiment of overlapping in the apparatus and method for bandwidth extension decoding according to the present invention.
〈도면의 주요 부호에 대한 간단한 설명><Brief description of the major symbols in the drawings>
100: 영역 분할부 105: 여기신호 추출부100: region division unit 105: excitation signal extraction unit
110: 제1 변환부 115: 스펙트럼 생성부110: first conversion unit 115: spectrum generation unit
120: 제2 변환부 125: 이득값 계산부120: second conversion unit 125: gain value calculation unit
128: 제1 토널리티 계산부 130: 제2 토널리티 계산부128: first tonality calculator 130: second tonality calculator
135: 토널리티 비교부 140: 이득값 감소부135: tonality comparison unit 140: gain value reduction unit
145: 이득값 양자화부 150: 토널리티 양자화부145: gain value quantizer 150: tonality quantizer
155: 다중화부155: multiplexer
본 발명은 음성 신호 또는 음악 신호와 같은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호 가운데 고주파수 영역에 해당하는 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for encoding or decoding an audio signal such as a voice signal or a music signal, and more particularly, to a method and apparatus for encoding or decoding a signal corresponding to a high frequency region of an audio signal.
고주파수 영역에 해당하는 신호는 저주파수 영역에 해당하는 신호에 비하여 인간이 소리로서 인식하는 데 중요성이 떨어지는 것이 일반적이다. 그러므로 오디오 신호를 부호화함에 있어서 가용한 비트에 대한 제약이 있어 코딩의 효율을 높여야 할 경우 저주파수 영역에 해당하는 신호에는 많은 비트를 할당하여 부호화하지만 이에 비하여 고주파수 영역에 해당하는 신호에는 적은 비트를 할당하여 부호화한다.Signals in the high frequency region are generally less important for humans to recognize them as sounds than signals in the low frequency region. Therefore, if there is a restriction on the available bits in encoding an audio signal, when coding efficiency needs to be improved, a large number of bits are allocated to a signal corresponding to a low frequency region and encoded, whereas a small bit is allocated to a signal corresponding to a high frequency region. Encode
그러므로 고주파수 영역에 해당하는 신호를 부호화함에 있어서 적은 비트를 이용하고도 인간이 인식하는 음질을 최대한 향상시킬 수 있는 방법 및 장치가 요구된다.Therefore, there is a need for a method and apparatus capable of maximally improving sound quality perceived by human beings even when using fewer bits in encoding a signal corresponding to a high frequency region.
본 발명이 이루고자 하는 기술적 과제는, 저주파수 신호의 여기 신호를 이용하여 고주파수 신호를 부호화하거나 복호화하는 방법 및 장치를 제공하는 것이다.An object of the present invention is to provide a method and apparatus for encoding or decoding a high frequency signal using an excitation signal of a low frequency signal.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 부호화 방법는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 단계를 포함하는 것을 특징으로 한다.In accordance with another aspect of the present invention, there is provided a bandwidth extension encoding method, extracting an excitation signal from a low frequency signal corresponding to a region smaller than a predetermined frequency, extracting an excitation signal, and converting the excitation signal into a frequency domain. Generating a spectrum to be provided in an area greater than a preset frequency using the method; and calculating a gain value by comparing the generated spectrum with a spectrum of a high frequency signal corresponding to an area greater than a predetermined frequency; It is done.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 방법는, 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것을 특징으로 한다.In accordance with another aspect of the present invention, there is provided a bandwidth extension decoding method including extracting an excitation signal and converting an excitation signal to a frequency domain by removing an envelope from a low frequency signal provided in a region smaller than a preset frequency, and converting the spectrum of the converted excitation signal. Generating a spectrum to be provided in an area larger than a predetermined frequency by using the method; and decoding and applying a gain value to the generated spectrum.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 부호화 장치는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 여기신호 추출부, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 스펙트럼 생성부 및 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 이득값 계산부를 포함하는 것을 특징으로 한다.The bandwidth extension encoding apparatus according to the present invention for achieving the above object is an excitation signal extraction unit for extracting the excitation signal by removing the envelope from a low frequency signal corresponding to a region smaller than a predetermined frequency, and converting the excitation signal into a frequency domain, the converted A spectrum generator for generating a spectrum to be provided in an area greater than a preset frequency using a spectrum of an excitation signal, and comparing the generated spectrum with a spectrum of a high frequency signal corresponding to an area greater than a predetermined frequency to calculate a gain value And a gain calculator.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 장치는, 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 여기신호 추출부, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 스펙트럼 생성부 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 스펙트럼 적용부를 포함하는 것을 특징으로 한다.The bandwidth extension decoding apparatus according to the present invention for achieving the above object is, an excitation signal extractor for extracting an excitation signal and converting the excitation signal to a frequency domain by removing an envelope from a low frequency signal provided in a region smaller than a predetermined frequency, the converted excitation It characterized in that it comprises a spectrum generator for generating a spectrum to be provided in a region greater than a predetermined frequency by using the spectrum of the signal and a spectrum applying unit for decoding the gain value and apply to the generated spectrum.
상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 상기 생성된 스펙트럼과 기 설정된 주파수 보다 큰 영역에 해당하는 고주파수 신호의 스펙트럼을 비교하여 이득값을 계산하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.According to an aspect of the present invention, a recording medium extracts an excitation signal from a low frequency signal corresponding to a region smaller than a predetermined frequency, extracts an excitation signal, and converts the excitation signal into a frequency domain. Generating a spectrum to be provided in an area larger than a preset frequency using the same; and calculating a gain value by comparing the generated spectrum with a spectrum of a high frequency signal corresponding to an area larger than a preset frequency. You can read the program to run on the computer.
상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 기 설정된 주파수 보다 작은 영역에 마련된 저주파수 신호에서 포락선을 제거하여 여기 신호를 추출하고 주파수 도메인으로 변환하는 단계, 상기 변환된 여기 신호의 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 마련될 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.The recording medium according to the present invention for achieving the above object, the step of extracting the excitation signal from the low-frequency signal provided in the region smaller than the predetermined frequency and converting the excitation signal to the frequency domain, using the spectrum of the converted excitation signal A computer program having a program for executing the invention including a step of generating a spectrum to be provided in an area larger than a preset frequency and decoding a gain value and applying the generated value to the generated spectrum can be read by a computer.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 대역폭 확장 부호화 및 복호화 방법 및 장치에 대해 상세히 설명한다.Hereinafter, a bandwidth extension encoding and decoding method and apparatus according to the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명에 의한 대역폭 확장 부호화 장치의 일 실시예를 블록도로 도시한 것으로서 영역 분할부(100), 여기신호 추출부(105), 제1 변환부(110), 스펙트럼 생성부(115), 제2 변환부(120), 이득값 계산부(125), 제1 토널리티 계산부(128), 제2 토널리티 계산부(130), 토널리티 비교부(135), 이득값 감소부(140), 이득값 양자화부(145), 토널리티 양자화부(150) 및 다중화부(155)를 포함하여 이루어진다.FIG. 1 is a block diagram illustrating an embodiment of a bandwidth extension encoding apparatus according to the present invention, and includes a
영역 분할부(100)는 입력단자 IN을 통하여 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.The
여기신호 추출부(105)는 영역 분할부(100)에서 분할된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다. 포락선 제거부(105)에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. The
제1 변환부(110)는 여기신호 추출부(105)에서 추출한 저주파수 신호에 대한 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 예를 들어, 제1 변환부(110)에서 변환하는 방식으로 FFT(Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제1 변환부(110)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제1 변환부(110)는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼(transform)에 반드시 한정되어 실시하여야 하는 것은 아니다. 제1 변환부(110)는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The
스펙트럼 생성부(115)는 제1 변환부(110)에서 변환된 여기 신호의 스펙트럼을 이용하여 제2 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다. 예를 들어, 스펙트럼 생성부(115)는 제1 변환부(110)에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 대칭적으 로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.The
제2 변환부(120)는 영역 분할부(100)에서 분할된 고주파수 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 예를 들어, 제2 변환부(120)에서 변환하는 방식으로 FFT이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제2 변환부(120)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제2 변환부(120)는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 제2 변환부(120)는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The
이득값 계산부(125)는 스펙트럼 생성부(115)에서 생성된 스펙트럼과 제2 변환부(120)에서 변환된 고주파수 신호의 스펙트럼에 대한 소정의 밴드 별 에너지의 비율을 계산함으로써 이득값을 계산한다.The
제1 토널리티 계산부(128)는 스펙트럼 생성부(115)에서 생성된 스펙트럼에 대한 토널리티(tonality)를 소정의 밴드 단위로 계산한다. 제1 토널리티 계산부(128)는 토널리티를 계산함에 있어서 SFM(Spectral Flatness Measure)를 이용할 수 있다. SFM를 이용하여 토널리티를 계산할 경우 토널리티는 1에서 SFM 값을 감산한 결과 값을 말한다.The
제2 토널리티 계산부(130)는 제2 변환부(120)에서 변환된 고주파수 신호의 스펙트럼에 대한 토널리티를 소정의 밴드 단위로 계산한다.The
토널리티 비교부(135)는 제1 토널리티 계산부(128)에서 계산된 토널리티와 제2 토널리티 계산부(130)에서 계산된 토널리티를 비교한다.The
이득값 감소부(140)는 제2 토널리티 계산부(130)에서 계산된 토널리티가 제1 토널리티 계산부(128)에서 계산된 토널리티 보다 크다고 토널리티 비교부(135)에서 판단된 밴드(들)에 대하여 제1 토널리티 계산부(128)에서 계산된 토널리티와 제2 토널리티 계산부(130)에서 계산된 토널리티의 비율만큼 이득값 계산부(125)에서 계산된 이득값을 감소시킨다. 이득값 감소부(140)에서 소정의 밴드(들)에 대하여 이득값을 감소시키는 이유는 복호화기에서 생성된 고주파수 신호의 노이즈 양을 목표 고주파수 신호의 노이즈 양과 비슷하게 하기 위함이다.The gain
이득값 감소부(140)에서는 다음 기재된 수학식 1 및 2에 의해 이득값을 감소시킬 수 있다.The gain
[수학식 1][Equation 1]
여기서, Tonality(HB)는 제2 토널리티 계산부(130)에서 계산된 토널리티이고, 제1 토널리티 계산부(128)에서 계산된 토널리티이며, SFM(HB)는 고주파수 신호의 스펙트럼에 대한 SFM이고, SFM(LB)는 스펙트럼 생성부(115)에서 생성된 스펙트럼에 대한 SFM이다.Here, Tonality (HB) is the tonality calculated by the
[수학식 2][Equation 2]
여기서, gain'은 이득값 감소부(140)에서 감소된 소정 밴드의 이득값이고, 수학식 1에 의해 구해진 제1 토널리티 계산부(128)에서 계산된 토널리티와 제2 토널리티 계산부(130)에서 계산된 토널리티의 비율의 비율이며, gain은 이득값 계산부(125)에서 계산된 소정 밴드의 이득값이다.Herein, gain 'is a gain value of a predetermined band reduced by the
이득값 양자화부(145)는 이득값이 감소된 밴드(들)에 대하여 이득값 감소부(140)에서 감소된 이득값을 양자화한다.The gain
이득값 양자화부(145)는 제2 토널리티 계산부(130)에서 계산된 토널리티가 제1 토널리티 계산부(128)에서 계산된 토널리티 보다 작다고 토널리티 비교부(135)에서 판단된 밴드(들), 다시 말해서 이득값 감소부(140)에서 이득값이 감소되지 않은 밴드(들),에 대하여 이득값 계산부(125)에서 계산된 이득값을 양자화한다.The
토널리티 양자화부(150)는 제2 토널리티 계산부(130)에서 계산된 고주파수 신호의 스펙트럼 각 밴드에 대한 토널리티를 양자화한다.The
다중화부(155)는 이득값 양자화부(145)에서 양자화된 이득값 및 토널리티 양자화부(150)에서 양자화된 토널리티를 포함하여 다중화함으로써 비트스트림을 생성하여 출력단자 OUT을 통해 출력한다.The
도 2는 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.2 is a flowchart illustrating an embodiment of a bandwidth extension coding method according to the present invention.
먼저, 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다(제200단계). 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.First, the input signal is divided into a low frequency signal and a high frequency signal based on the preset frequency (step 200). Here, the low frequency signal corresponds to a signal corresponding to a region smaller than the preset first frequency, and the high frequency signal refers to a signal corresponding to a region larger than the preset second frequency. Although the first frequency and the second frequency are preferably set to the same value, they are not necessarily set to the same value.
제200단계에서 분할된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다(제205단계). 제205단계에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. The envelope is removed from the low frequency signal divided in
제205단계에서 추출한 저주파수 신호에 대한 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다(제210단계). 예를 들어, 제210단계에서 변환하는 방식으로 FFT(Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제210단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제210단계에서는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼(transform)에 반드시 한정되어 실시하여야 하는 것은 아니다. 제210단계에서는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The excitation signal for the low frequency signal extracted in
제210단계에서 변환된 여기 신호의 스펙트럼을 이용하여 제2 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다(제215단계). 예를 들어, 제215단계에서는 제210단계에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 대칭적으로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.In
제200단계에서 분할된 고주파수 신호를 시간 도메인에서 주파수 도메인으로 변환한다(제220단계). 예를 들어, 제220단계에서 변환하는 방식으로 FFT(Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제220단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제220단계에서는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 제220단계에서는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The high frequency signal divided in
제220단계에서 변환된 고주파수 신호의 스펙트럼에 대한 토널리티(tonality)를 소정의 밴드 단위로 계산한다(제223단계). 제223단계에서 토널리티를 계산함에 있어서 SFM(Spectral Flatness Measure)를 이용할 수 있다. SFM를 이용하여 토널 리티를 계산할 경우 토널리티는 1에서 SFM 값을 감산한 결과 값을 말한다.The tonality of the spectrum of the high frequency signal converted in
제215단계에서 생성된 스펙트럼과 제220단계에서 변환된 고주파수 신호의 스펙트럼에 대한 소정의 밴드 별 에너지의 비율을 계산함으로써 이득값을 계산한다(제225단계).The gain value is calculated by calculating the ratio of the energy of each band to the spectrum of the spectrum generated in
제215단계에서 생성된 스펙트럼에 대한 토널리티를 소정의 밴드 단위로 계산한다(제228단계). The tonality of the spectrum generated in
제228단계에서 계산된 토널리티와 제223단계에서 계산된 고주파수 신호에 대한 토널리티를 비교한다(제235단계).The tonality calculated in operation 228 is compared with the tonality of the high frequency signal calculated in operation 223 (operation 235).
만일 제223단계에서 계산된 고주파수 신호에 대한 토널리티가 제228단계에서 계산된 토널리티 보다 크다고 제235단계에서 판단된 밴드(들)라면, 제228단계에서 계산된 토널리티와 제223단계에서 계산된 고주파수 신호의 스펙트럼에 대한 토널리티의 비율만큼 제225단계에서 계산된 이득값을 감소시킨다(제240단계). 제240단계에서 소정의 밴드(들)에 대하여 이득값을 감소시키는 이유는 복호화기에서 생성된 고주파수 신호의 노이즈 양을 목표 고주파수 신호의 노이즈 양과 비슷하게 하기 위함이다.If the tonality for the high frequency signal calculated in
제240단계에서는 다음 기재된 수학식 3 및 4에 의해 이득값을 감소시킬 수 있다.In
[수학식 3][Equation 3]
여기서, Tonality(HB)는 제223단계에서 계산된 토널리티이고, 제228단계에서 계산된 토널리티이며, SFM(HB)는 고주파수 신호의 스펙트럼에 대한 SFM이고, SFM(LB)는 제215단계에서 생성된 스펙트럼에 대한 SFM이다.Here, Tonality (HB) is the tonality calculated in
[수학식 4][Equation 4]
여기서, gain'은 제240단계에서 감소된 소정 밴드의 이득값이고, 수학식 3에 의해 구해진 제228단계에서 계산된 토널리티와 제223단계에서 계산된 토널리티의 비율의 비율이며, gain은 제225단계에서 계산된 소정 밴드의 이득값이다.Here, the gain 'is a gain value of the predetermined band reduced in
이득값이 감소된 밴드(들)에 대하여 제240단계에서 감소된 이득값을 양자화한다(제245단계).The gain value reduced in
만일 제223단계에서 계산된 고주파수 신호에 대한 토널리티가 제228단계에서 계산된 토널리티 보다 크다고 제235단계에서 판단된 밴드(들)라면, 제245단계에서는 제225단계에서 계산된 이득값을 양자화한다.If the tonality for the high frequency signal calculated in
제223단계에서 계산된 고주파수 신호의 스펙트럼 각 밴드에 대한 토널리티를 양자화한다(제250단계).The tonality for each band of the spectrum of the high frequency signal calculated in
제245단계에서 양자화된 이득값 및 제250단계에서 양자화된 토널리티를 포함하여 다중화함으로써 비트스트림을 생성한다(제255단계).The bitstream is generated by multiplexing the gain value quantized in
도 3은 본 발명에 의한 대역폭 확장 복호화 장치의 일 실시예를 블록도로 도시한 것으로서, 역다중화부(300), 여기신호 추출부(305), 변환부(310), 스펙트럼 폴딩부(315), 이득값 복호화부(320), 이득값 스무딩부(325), 이득값 적용부(330), 토널리티 계산부(335), 토널리티 복호화부(338), 토널리티 비교부(340), 노이즈 계산부(345), 노이즈 부가부(350), 역변환부(355) 및 영역 합성부(360)를 포함하여 이루어진다.3 is a block diagram illustrating an embodiment of a bandwidth extension decoding apparatus according to the present invention. The
역다중화부(300)는 입력단자 IN을 통해서 부호화단으로부터 비트스트림을 전송받아 역다중화한다. 여기서, 역다중화부(300)는 기 설정된 제1 주파수 보다 큰 영역의 각 밴드에 대한 이득값, 제2 주파수 보다 큰 영역의 각 밴드에 대한 토널리티 및 부호화단에서 부호화된 저주파수 신호가 포함된 비트스트림을 역다중화한다. 여기서, 저주파수 신호는 기 설정된 제2 주파수 보다 작은 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.The
여기신호 추출부(305)는 부호화단에서 부호화된 저주파수 신호를 역다중화부(300)로부터 입력받아 저주파수 신호를 복호화하고, 여기서 복호화된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다. 여기신호 추출부(305)에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. 단, 여기신호 추출부(305)에서 여기 신호를 추출함에 있어서, 부호화기에서 여기 신호를 추출하는 방법과 동일하게 실시하는 것이 바람직하다. 여기서, 여기신호 추출부(305)는 복호화된 저주파수 신호를 영역 합성부(355)로 출력하고, 추출한 여기 신호를 변환부(310)로 출력한다.The
변환부(310)는 여기신호 추출부(305)에서 추출된 저주파수 신호의 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 예를 들어, 변환부(310)에서 변환하는 방식으로 FFT(Fast Fourier Transform)가 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 변환부(310)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 변환부(310)는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 변환부(310)는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The
스펙트럼 생성부(315)는 변환부(310)에서 변환된 여기 신호의 스펙트럼을 이용하여 제1 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다. 예를 들어, 스펙트럼 생성부(315)는 변환부(310)에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.The
이득값 복호화부(320)는 부호화기에서 부호화된 이득값을 역다중화부(300)으로부터 입력받아 이득값을 복호화한다.The
이득값 스무딩부(325, gain smoothing unit)는 밴드 간 이득값이 급격하게 변화되는 것을 방지하기 위하여 이득값을 스무딩한다. 여기서, 이득값 스무딩 부(325)에서 이득값을 조절하는 일 예로 각 밴드의 중심을 기준으로 밴드간 프리퀀시 빈 인덱스(frequency bin index)에 따라서 보간을 수행하는 방법이 있다. The
예를 들어, 이득값 스무딩부(325)가 4개의 밴드들에 대하여 이득값을 스무딩하는 실시예를 도 5에 도시하였다. 도 5에 도시된 점은 각 밴드 별 이득값이고, 도 5에 도시된 선분은 스무딩된 이득값이다. 그러나 이득값 스무딩부(325)는 본 발명인 대역폭 확장 부호화 장치에서 반드시 포함하여 실시해야 하는 것은 아니다.For example, FIG. 5 illustrates an embodiment in which the
이득값 적용부(330)는 스펙트럼 생성부(315)에서 생성된 스펙트럼에 이득값 스무딩부(325)에서 스무딩된 이득값을 적용한다.The gain
토널리티 계산부(335)는 이득값 적용부(330)에서 이득값이 적용된 스펙트럼에 대한 토널리티를 계산한다.The
토널리티 복호화부(338)는 부호화기에서 부호화된 제1 주파수 보다 큰 영역에 해당하는 고주파수 영역의 각 밴드에 대한 토널리티를 역다중화부(300)로부터 입력받아 토널리티(들)을 복호화한다.The
토널리티 비교부(340)는 토널리티 계산부(335)에서 계산된 각 밴드의 토널리티와 토널리티 복호화부(338)에서 복호화된 각 밴드의 토널리티를 비교한다.The
노이즈 계산부(345)는 토널리티 계산부(335)에서 계산된 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티 보다 큰 밴드(들)에 대하여 고주파수 신호의 스펙트럼에 대한 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티에 유사해질 수 있는 노이즈를 계산한다. 예를 들어, 노이즈 계산부(345)에서는 다음 기재된 수학식 5 내지 7에 의해 노이즈를 계산할 수 있다.The
[수학식 5][Equation 5]
[수학식 6][Equation 6]
[수학식 7][Equation 7]
여기서, i는 밴드 인덱스(band index)이고, j는 스펙트럴 라인 인덱스(spectral line index)이다.Where i is a band index and j is a spectral line index.
노이즈 부가부(350)는 이득값 적용부(330)에서 이득값이 적용된 스펙트럼에 노이즈 계산부(345)에서 계산된 노이즈를 부가한다.The
역변환부(353)는 토널리티 계산부(335)에서 계산된 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티 보다 큰 밴드(들)에 대하여 노이즈 부가부(350)에서 노이즈가 부가된 스펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다. 예를 들어, 역변환부(353)에서 변환하는 방식으로 IFFT(Inverse Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 IFFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 역변환부(353)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호 를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 역변환부(353)는 IFFT와 같이 주파수 도메인에서 시간 도메인으로 변환하는 트랜스폼(transform)에 반드시 한정되어 실시하여야 하는 것은 아니며 QMF(Quadrature Mirror Filterbank)와 같은 트랜스폼에서도 실시할 수 있다.The inverse transformer 353 may perform the
여기서, 역변환부(353)는 도 6에 도시된 바와 같이 오버랩(overlap)을 수행할 수 있다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 역변환부(353)에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다.Here, the inverse transform unit 353 may perform an overlap as shown in FIG. 6. For example, if a transform using an overlap is used in the process of encoding a low frequency signal, the method of performing the overlap in the inverse transformer 353 determines the window so that the decoder can use the low frequency signal that is completely restored by the decoder. It is desirable to determine how.
또한, 역변환부(353)는 토널리티 계산부(335)에서 계산된 토널리티가 토널리티 복호화부(338)에서 복호화된 토널리티 보다 작은 밴드(들)에 대하여 이득값 적용부(330)에서 이득값이 적용된 스펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다.In addition, the inverse transformer 353 may apply the gain value applying unit to the band (s) whose tonality calculated by the
영역 합성부(355)는 기 설정된 주파수 보다 작은 영역에 여기신호 추출부(305)에서 복호화된 저주파수 신호를 마련하고, 기 설정된 주파수 보다 큰 영역에 역변환부(353)에서 역변환된 고주파수 신호를 마련함으로써 저주파수 신호와 저주파수 신호를 합성하여 출력단자 OUT을 통해 출력한다.The
도 4는 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.4 is a flowchart illustrating an embodiment of a bandwidth extension decoding method according to the present invention.
먼저, 부호화단으로부터 비트스트림을 전송받아 역다중화한다(제400단계). 제400단계에서는 기 설정된 제1 주파수 보다 큰 영역의 각 밴드에 대한 이득값, 제2 주파수 보다 큰 영역의 각 밴드에 대한 토널리티 및 부호화단에서 부호화된 저주파수 신호가 포함된 비트스트림을 역다중화한다. 여기서, 저주파수 신호는 기 설정된 제2 주파수 보다 작은 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.First, the bitstream is received from the encoder and demultiplexed (operation 400). In
부호화단에서 부호화된 저주파수 신호를 복호화하고, 여기서 복호화된 저주파수 신호에서 포락선(envelope)을 제거하고 남은 여기 신호(excitation signal)를 추출한다(제405단계). 제405단계에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다. 단, 제405단계에서 여기 신호를 추출함에 있어서, 부호화기에서 여기 신호를 추출하는 방법과 동일하게 실시하는 것이 바람직하다. The encoder encodes the low frequency signal encoded by the encoder, and removes an envelope from the decoded low frequency signal and extracts the remaining excitation signal (step 405). As an example of removing an envelope in
제405단계에서 추출된 저주파수 신호의 여기 신호를 시간 도메인에서 주파수 도메인으로 변환한다(제410단계). 예를 들어, 제410단계에서 변환하는 방식으로 FFT(Fast Fourier Transform)가 있으며, 288, 576 및 1152-포인트 FFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제410단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제410단계에서는 FFT와 같이 시간 도메인에서 주파수 도메인으로 변 환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니다. 제410단계에서는 소정의 주파수 밴드 별로 시간 도메인에 의해 나타내는 QMF(Quadrature Mirror Filterbank)와 같은 방식으로도 변환할 수 있다.The excitation signal of the low frequency signal extracted in
제410단계에서 변환된 여기 신호의 스펙트럼을 이용하여 제1 주파수 보다 큰 영역인 고주파수 영역에 스펙트럼을 생성한다(제415단계). 예를 들어, 제415단계에서는 제410단계에서 변환된 여기 신호의 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 스펙트럼을 생성할 수 있다.A spectrum is generated in a high frequency region that is greater than the first frequency by using the spectrum of the excitation signal converted in operation 410 (operation 415). For example, in
부호화기에서 부호화된 이득값을 복호화한다(제420단계).In
밴드 간 이득값이 급격하게 변화되는 것을 방지하기 위하여 이득값을 스무딩(smoothing)한다(제425단계). 제425단계에서 이득값을 조절하는 일 예로 각 밴드의 중심을 기준으로 밴드간 프리퀀시 빈 인덱스(frequency bin index)에 따라서 보간을 수행하는 방법이 있다. In order to prevent the gain between bands from changing rapidly, the gain is smoothed (step 425). As an example of adjusting the gain value in
예를 들어, 제425단계에서 4개의 밴드들에 대하여 이득값을 스무딩하는 실시예를 도 5에 도시하였다. 도 5에 도시된 점은 각 밴드 별 이득값이고, 도 5에 도시된 선분은 스무딩된 이득값이다. 그러나 제425단계는 본 발명인 대역폭 확장 부호화 방법에서 반드시 포함하여 실시해야 하는 것은 아니다.For example, an exemplary embodiment of smoothing gain values for four bands in
제415단계에서 생성된 스펙트럼에 제425단계에서 스무딩된 이득값을 적용한다(제430단계).The smoothed gain value is applied to the spectrum generated in operation 415 (operation 430).
제430단계에서 이득값이 적용된 스펙트럼에 대한 토널리티를 계산한다(제435 단계).In
부호화기에서 부호화된 제1 주파수 보다 큰 영역에 해당하는 고주파수 영역의 각 밴드에 대한 토널리티를 복호화한다(제438단계).In
제435단계에서 계산된 각 밴드의 토널리티와 제438단계에서 복호화된 각 밴드의 토널리티를 비교한다(제440단계).The tonality of each band calculated in
제435단계에서 계산된 토널리티가 제438단계에서 복호화된 토널리티 보다 크다고 제440단계에서 판단된 밴드(들)일 경우, 고주파수 신호의 스펙트럼에 대한 토널리티가 제438단계에서 복호화된 토널리티에 유사해질 수 있는 노이즈를 계산한다(제445단계). 예를 들어, 제445단계에서는 다음 기재된 수학식 8 내지 10에 의해 노이즈를 계산할 수 있다.If the tonality calculated in
[수학식 8][Equation 8]
[수학식 9][Equation 9]
[수학식 10][Equation 10]
여기서, i는 밴드 인덱스(band index)이고, j는 스펙트럴 라인 인덱스(spectral line index)이다.Where i is a band index and j is a spectral line index.
제430단계에서 이득값이 적용된 스펙트럼에 제445단계에서 계산된 노이즈를 부가한다(제450단계).In
제435단계에서 계산된 토널리티가 제438단계에서 복호화된 토널리티 보다 큰 밴드(들)에 대하여 제450단계에서 노이즈가 부가된 스펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다(제453단계). 예를 들어, 제453단계에서 변환하는 방식으로 IFFT(Inverse Fast Fourier Transform)이 있으며, 288, 576 및 1152-포인트 IFFT 가운데 32 샘플의 오버랩을 포함하여 288-포인트를 이용하는 것이 바람직하다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제453단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다. 그러나 제453단계에서는 IFFT와 같이 주파수 도메인에서 시간 도메인으로 변환하는 트랜스폼에 반드시 한정되어 실시하여야 하는 것은 아니며 QMF(Quadrature Mirror Filterbank)와 같은 트랜스폼에서도 실시할 수 있다.In
제453단계에서는 도 6에 도시된 바와 같이 오버랩(overlap)을 수행할 수 있다. 예를 들어 저주파수 신호를 부호화하는 과정에서 오버랩을 사용하는 트랜스폼을 이용한다면, 제453단계에서 오버랩을 수행하는 방법은 복호화기에서 완벽히 복원된 저주파수 신호를 이용할 수 있도록 윈도우를 결정하여 오버랩을 하는 방법을 정하는 것이 바람직하다.In
또한, 제453단계에서는 제435단계에서 계산된 토널리티가 제438단계에서 복호화된 토널리티 보다 작은 밴드(들)에 대하여 제430단계에서 이득값이 적용된 스 펙트럼을 주파수 도메인에서 시간 도메인으로 역변환한다.Further, in
기 설정된 주파수 보다 작은 영역에 제405단계에서 복호화된 저주파수 신호를 마련하고, 기 설정된 주파수 보다 큰 영역에 제453단계에서 역변환된 고주파수 신호를 마련함으로써 저주파수 신호와 저주파수 신호를 합성한다(제455단계).The low frequency signal decoded in
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.Although described with reference to the embodiment shown in the drawings to aid in understanding of the present invention, this is merely exemplary, those skilled in the art that various modifications and equivalent other embodiments are possible from this. Will understand. Therefore, the true technical protection scope of the present invention will be defined by the appended claims.
또한, 본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.In addition, the present invention can be embodied as computer readable codes on a computer readable recording medium, including all devices having an information processing function. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording devices include ROM, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like.
본 발명에 의한 대역폭 확장 부호화 및 복호화 방법 및 장치에 의하면, 저주파수 신호의 여기 신호를 이용하여 고주파수 신호를 부호화하거나 복호화한다.According to the bandwidth extension encoding and decoding method and apparatus according to the present invention, a high frequency signal is encoded or decoded using an excitation signal of a low frequency signal.
이렇게 함으로써 적은 비트를 이용하여 오디오 신호를 부호화하거나 복호화함에도 불구하고 고주파수 영역에 해당하는 신호의 음질을 저하시키지 않으므로 코 딩 효율을 극대화할 수 있는 효과를 거둘 수 있다.In this way, even though the audio signal is encoded or decoded using fewer bits, the sound quality of the signal corresponding to the high frequency region is not degraded, thereby achieving the effect of maximizing the coding efficiency.
Claims (28)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/980,643 US8639500B2 (en) | 2006-11-17 | 2007-10-31 | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
PCT/KR2007/005626 WO2008060068A1 (en) | 2006-11-17 | 2007-11-08 | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
CN200780048069XA CN101568959B (en) | 2006-11-17 | 2007-11-08 | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20060114101 | 2006-11-17 | ||
KR1020060114101 | 2006-11-17 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130106344A Division KR101376098B1 (en) | 2006-11-17 | 2013-09-04 | Method and apparatus for bandwidth extension decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080045047A true KR20080045047A (en) | 2008-05-22 |
KR101375582B1 KR101375582B1 (en) | 2014-03-20 |
Family
ID=39662686
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070046203A KR101375582B1 (en) | 2006-11-17 | 2007-05-11 | Method and apparatus for bandwidth extension encoding and decoding |
KR1020130106344A KR101376098B1 (en) | 2006-11-17 | 2013-09-04 | Method and apparatus for bandwidth extension decoding |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130106344A KR101376098B1 (en) | 2006-11-17 | 2013-09-04 | Method and apparatus for bandwidth extension decoding |
Country Status (2)
Country | Link |
---|---|
KR (2) | KR101375582B1 (en) |
CN (1) | CN101568959B (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130007485A (en) * | 2011-06-30 | 2013-01-18 | 삼성전자주식회사 | Apparatus and method for generating a bandwidth extended signal |
KR20130107257A (en) * | 2012-03-21 | 2013-10-01 | 삼성전자주식회사 | Method and apparatus for encoding and decoding high frequency for bandwidth extension |
KR101461774B1 (en) * | 2010-05-25 | 2014-12-02 | 노키아 코포레이션 | A bandwidth extender |
KR20150103643A (en) * | 2014-03-03 | 2015-09-11 | 삼성전자주식회사 | Method and apparatus for decoding high frequency for bandwidth extension |
US9183847B2 (en) | 2010-09-15 | 2015-11-10 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
KR20160098285A (en) * | 2013-12-16 | 2016-08-18 | 퀄컴 인코포레이티드 | High-band signal modeling |
US11676614B2 (en) | 2014-03-03 | 2023-06-13 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
US11688406B2 (en) | 2014-03-24 | 2023-06-27 | Samsung Electronics Co., Ltd. | High-band encoding method and device, and high-band decoding method and device |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
JP6075743B2 (en) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | Signal processing apparatus and method, and program |
CN103971694B (en) | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | The Forecasting Methodology of bandwidth expansion band signal, decoding device |
CN104517611B (en) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | A kind of high-frequency excitation signal Forecasting Methodology and device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
SG161223A1 (en) * | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for vector quantizing of a spectral envelope representation |
-
2007
- 2007-05-11 KR KR1020070046203A patent/KR101375582B1/en active IP Right Grant
- 2007-11-08 CN CN200780048069XA patent/CN101568959B/en not_active Expired - Fee Related
-
2013
- 2013-09-04 KR KR1020130106344A patent/KR101376098B1/en active IP Right Grant
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101461774B1 (en) * | 2010-05-25 | 2014-12-02 | 노키아 코포레이션 | A bandwidth extender |
US10418043B2 (en) | 2010-09-15 | 2019-09-17 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
US9183847B2 (en) | 2010-09-15 | 2015-11-10 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
US9837090B2 (en) | 2010-09-15 | 2017-12-05 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
KR20200143665A (en) * | 2011-06-30 | 2020-12-24 | 삼성전자주식회사 | Apparatus and method for generating a bandwidth extended signal |
KR20200019164A (en) * | 2011-06-30 | 2020-02-21 | 삼성전자주식회사 | Apparatus and method for generating a bandwidth extended signal |
KR20130007485A (en) * | 2011-06-30 | 2013-01-18 | 삼성전자주식회사 | Apparatus and method for generating a bandwidth extended signal |
KR20200010540A (en) * | 2012-03-21 | 2020-01-30 | 삼성전자주식회사 | Method and apparatus for encoding and decoding high frequency for bandwidth extension |
KR20130107257A (en) * | 2012-03-21 | 2013-10-01 | 삼성전자주식회사 | Method and apparatus for encoding and decoding high frequency for bandwidth extension |
KR20200144086A (en) * | 2012-03-21 | 2020-12-28 | 삼성전자주식회사 | Method and apparatus for encoding and decoding high frequency for bandwidth extension |
KR20160098285A (en) * | 2013-12-16 | 2016-08-18 | 퀄컴 인코포레이티드 | High-band signal modeling |
KR20210116698A (en) * | 2013-12-16 | 2021-09-27 | 퀄컴 인코포레이티드 | High-band signal modeling |
KR20150103643A (en) * | 2014-03-03 | 2015-09-11 | 삼성전자주식회사 | Method and apparatus for decoding high frequency for bandwidth extension |
KR20220051317A (en) * | 2014-03-03 | 2022-04-26 | 삼성전자주식회사 | Method and apparatus for decoding high frequency for bandwidth extension |
US11676614B2 (en) | 2014-03-03 | 2023-06-13 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
US11688406B2 (en) | 2014-03-24 | 2023-06-27 | Samsung Electronics Co., Ltd. | High-band encoding method and device, and high-band decoding method and device |
Also Published As
Publication number | Publication date |
---|---|
CN101568959B (en) | 2013-10-23 |
KR101376098B1 (en) | 2014-03-31 |
KR101375582B1 (en) | 2014-03-20 |
CN101568959A (en) | 2009-10-28 |
KR20130112817A (en) | 2013-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101375582B1 (en) | Method and apparatus for bandwidth extension encoding and decoding | |
KR101376100B1 (en) | Method and apparatus for bandwidth extension decoding | |
KR101747918B1 (en) | Method and apparatus for decoding high frequency signal | |
US8639500B2 (en) | Method, medium, and apparatus with bandwidth extension encoding and/or decoding | |
KR101373004B1 (en) | Apparatus and method for encoding and decoding high frequency signal | |
CN106847295B (en) | Encoding device and encoding method | |
KR101435893B1 (en) | Method and apparatus for encoding and decoding audio signal using band width extension technique and stereo encoding technique | |
JP6170520B2 (en) | Audio and / or speech signal encoding and / or decoding method and apparatus | |
JP5970014B2 (en) | Audio encoder and bandwidth extension decoder | |
KR101379263B1 (en) | Method and apparatus for decoding bandwidth extension | |
KR101213840B1 (en) | Decoding device and method thereof, and communication terminal apparatus and base station apparatus comprising decoding device | |
KR101411900B1 (en) | Method and apparatus for encoding and decoding audio signal | |
KR101390188B1 (en) | Method and apparatus for encoding and decoding adaptive high frequency band | |
KR20080005325A (en) | Method and apparatus for adaptive encoding/decoding | |
KR20070121254A (en) | Method and apparatus for wideband encoding and decoding | |
KR101441312B1 (en) | Method and Apparatus for encoding audio/speech signal | |
KR101393300B1 (en) | Method and Apparatus for decoding audio/speech signal | |
JP4354561B2 (en) | Audio signal encoding apparatus and decoding apparatus | |
AU2015203736B2 (en) | Audio encoder and bandwidth extension decoder | |
KR101352608B1 (en) | A method for extending bandwidth of vocal signal and an apparatus using it | |
KR20130012972A (en) | Method of encoding audio/speech signal | |
KR20120089230A (en) | Apparatus for decoding a signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190227 Year of fee payment: 6 |