KR20080025636A - Method and apparatus for encoding and decoding audio signal using band width extension technique - Google Patents
Method and apparatus for encoding and decoding audio signal using band width extension technique Download PDFInfo
- Publication number
- KR20080025636A KR20080025636A KR1020070079781A KR20070079781A KR20080025636A KR 20080025636 A KR20080025636 A KR 20080025636A KR 1020070079781 A KR1020070079781 A KR 1020070079781A KR 20070079781 A KR20070079781 A KR 20070079781A KR 20080025636 A KR20080025636 A KR 20080025636A
- Authority
- KR
- South Korea
- Prior art keywords
- frequency band
- signal
- band signal
- low frequency
- encoding
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Abstract
Description
본 발명은 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것으로, 보다 상세하게는 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for encoding / decoding an audio signal, and more particularly, to a method and apparatus for encoding / decoding an audio signal using a bandwidth extension technique.
오디오 신호를 부호화하거나 복호화함에 있어서 한정된 비트율을 이용하여 최대한 음질을 향상시키는 것이 요구된다. 저비트율에서는 가용 비트가 적으므로 부호화되는 오디오 신호의 주파수 대역을 줄여서 부호화해야 하므로, 음질이 저하될 수 있다. In encoding or decoding an audio signal, it is required to improve sound quality as much as possible using a limited bit rate. At low bit rates, since the available bits are small, the frequency band of the audio signal to be encoded must be reduced so that the sound quality can be degraded.
일반적으로, 저주파수 성분은 고주파수 성분에 비하여 인간이 지각하는데 중요하게 영향을 미친다. 따라서, 저주파수 성분을 부호화하는데 할당되는 비트를 늘리고, 고주파수 성분을 부호화하는데 할당되는 비트를 줄이면서 음질을 향상시킬 수 있는 방법이 요구된다. In general, low frequency components have a significant effect on human perception compared to high frequency components. Therefore, there is a need for a method capable of improving sound quality while increasing the bits allocated for encoding low frequency components and reducing the bits allocated for encoding high frequency components.
본 발명이 해결하고자 하는 과제는 한정된 비트율에서 고주파수 성분을 효율적으로 부호화하여 음질을 향상시킬 수 있는 오디오 신호의 부호화 방법 및 장치를 제공하는데 있다.SUMMARY OF THE INVENTION An object of the present invention is to provide a method and apparatus for encoding an audio signal capable of improving sound quality by efficiently encoding high frequency components at a limited bit rate.
본 발명이 해결하고자 하는 다른 과제는 한정된 비트율에서 부호화된 비트스트림으로부터 고주파수 성분을 효율적으로 복호화하는 오디오 신호의 복호화 방법 및 장치를 제공하는데 있다.Another object of the present invention is to provide a method and apparatus for decoding an audio signal which efficiently decodes high frequency components from a bitstream encoded at a limited bit rate.
상기 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 방법은 (a) 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 단계; (b) 상기 고주파수 밴드 신호 및 상기 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인으로 변환하는 단계; (c) 상기 변환된 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 단계; (d) 상기 변환된 저주파수 밴드 신호를 이용하여 상기 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 단계; 및 (e) 상기 부호화된 비트플레인 및 상기 부호화된 대역폭 확장 정보를 상기 입력 신호에 대한 부호화 결과로써 출력하는 단계를 포함한다.According to an aspect of the present invention, there is provided a method of encoding an audio signal, the method including: (a) dividing an input signal into a high frequency band signal and a low frequency band signal; (b) converting the high frequency band signal and the low frequency band signal from the time domain to the frequency domain, respectively; (c) quantizing the converted low frequency band signal and encoding the bitplane based on a context; (d) generating and encoding bandwidth extension information indicating a characteristic of the converted high frequency band signal using the converted low frequency band signal; And (e) outputting the encoded bitplane and the encoded bandwidth extension information as an encoding result of the input signal.
또한, 상기 과제는 (a) 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 단계; (b) 상기 고주파수 밴드 신호 및 상기 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인으로 변환하는 단계; (c) 상기 변환된 저주 파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 단계; (d) 상기 변환된 저주파수 밴드 신호를 이용하여 상기 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 단계; 및 (e) 상기 부호화된 비트플레인 및 상기 부호화된 대역폭 확장 정보를 상기 입력 신호에 대한 부호화 결과로써 출력하는 단계를 포함하는 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.In addition, the object is (a) dividing the input signal into a high frequency band signal and a low frequency band signal; (b) converting the high frequency band signal and the low frequency band signal from the time domain to the frequency domain, respectively; (c) quantizing the transformed low frequency band signal and encoding the bitplane based on a context; (d) generating and encoding bandwidth extension information indicating a characteristic of the converted high frequency band signal using the converted low frequency band signal; And (e) outputting the encoded bitplane and the encoded bandwidth extension information as an encoding result of the input signal. A computer-readable recording medium having recorded thereon a program for executing an encoding method of an audio signal. Is achieved by.
또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 방법은 (a) 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 단계; (b) 상기 저주파수 밴드 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환하는 단계; (c) 상기 MDCT가 수행된 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 단계; (d) 상기 고주파수 밴드 신호 및 상기 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환하는 단계; (e) 상기 변환된 저주파수 밴드 신호를 이용하여 상기 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 단계; 및 (f) 상기 부호화된 비트플레인 및 상기 부호화된 대역폭 확장 정보를 상기 입력 신호에 대한 부호화 결과로써 출력하는 단계를 포함한다.In addition, the method for encoding an audio signal according to the present invention for solving the other problem comprises the steps of: (a) dividing an input signal into a high frequency band signal and a low frequency band signal; (b) performing MDCT on the low frequency band signal and converting from the time domain to the frequency domain; (c) quantizing the signal on which the MDCT is performed and encoding the bitplane based on a context; (d) converting the high frequency band signal and the low frequency band signal from time domain to frequency domain or time / frequency domain, respectively; (e) generating and encoding bandwidth extension information representing a characteristic of the converted high frequency band signal using the converted low frequency band signal; And (f) outputting the encoded bitplane and the encoded bandwidth extension information as an encoding result of the input signal.
또한, 상기 다른 과제는 (a) 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 단계; (b) 상기 저주파수 밴드 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환하는 단계; (c) 상기 MDCT가 수행된 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 단계; (d) 상기 고주 파수 밴드 신호 및 상기 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환하는 단계; (e) 상기 변환된 저주파수 밴드 신호를 이용하여 상기 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 단계; 및 (f) 상기 부호화된 비트플레인 및 상기 부호화된 대역폭 확장 정보를 상기 입력 신호에 대한 부호화 결과로써 출력하는 단계를 포함하는 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.In addition, the other problem is (a) dividing the input signal into a high frequency band signal and a low frequency band signal; (b) performing MDCT on the low frequency band signal and converting from the time domain to the frequency domain; (c) quantizing the signal on which the MDCT is performed and encoding the bitplane based on a context; (d) converting the high frequency band signal and the low frequency band signal from time domain to frequency domain or time / frequency domain, respectively; (e) generating and encoding bandwidth extension information representing a characteristic of the converted high frequency band signal using the converted low frequency band signal; And (f) outputting the encoded bitplane and the encoded bandwidth extension information as an encoding result of the input signal. A computer-readable recording medium having recorded thereon a program for executing an encoding method of an audio signal. Is achieved by.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 방법은 (a) 입력 신호를 시간 도메인에서 주파수 도메인으로 변환하는 단계; (b) 상기 변환된 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 단계; (c) 상기 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 단계; (d) 상기 저주파수 밴드 신호를 이용하여 상기 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 단계; 및 (e) 상기 부호화된 비트플레인 및 상기 부호화된 대역폭 확장 정보를 상기 입력 신호에 대한 부호화 결과로써 출력하는 단계를 포함한다.In addition, the method for encoding an audio signal according to the present invention for solving the another problem comprises the steps of (a) converting the input signal from the time domain to the frequency domain; (b) dividing the converted input signal into a high frequency band signal and a low frequency band signal; (c) quantizing the low frequency band signal and encoding the bitplane based on a context; (d) generating and encoding bandwidth extension information representing the characteristics of the high frequency band signal using the low frequency band signal; And (e) outputting the encoded bitplane and the encoded bandwidth extension information as an encoding result of the input signal.
또한, 상기 또 다른 과제는 (a) 입력 신호를 시간 도메인에서 주파수 도메인으로 변환하는 단계; (b) 상기 변환된 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 단계; (c) 상기 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 단계; (d) 상기 저주파수 밴드 신호를 이용하여 상기 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호 화하는 단계; 및 (e) 상기 부호화된 비트플레인 및 상기 부호화된 대역폭 확장 정보를 상기 입력 신호에 대한 부호화 결과로써 출력하는 단계를 포함하는 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.In addition, the further object is (a) converting the input signal from the time domain to the frequency domain; (b) dividing the converted input signal into a high frequency band signal and a low frequency band signal; (c) quantizing the low frequency band signal and encoding the bitplane based on a context; (d) generating and encoding bandwidth extension information representing the characteristics of the high frequency band signal using the low frequency band signal; And (e) outputting the encoded bitplane and the encoded bandwidth extension information as an encoding result of the input signal. A computer-readable recording medium having recorded thereon a program for executing an encoding method of an audio signal. Is achieved by.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 방법은 (a) 오디오 신호의 부호화 결과를 입력받는 단계, (b) 상기 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 단계; (c) 상기 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 단계; (d) 상기 저주파수 밴드 신호 및 상기 고주파수 밴드 신호 각각에 대하여 역 MDCT(Inverse Modified Discrete Cosine Transform)를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 단계; 및 (e) 상기 변환된 저주파수 밴드 신호 및 상기 변환된 고주파수 밴드 신호를 합성하는 단계를 포함한다.In addition, according to another aspect of the present invention, there is provided a method of decoding an audio signal, the method comprising: (a) receiving an encoding result of an audio signal; Decoding and inverse quantizing to generate a low frequency band signal; (c) decoding the encoded bandwidth extension information included in the encoding result and generating a high frequency band signal from the low frequency band signal using the decoded bandwidth extension information; (d) performing an Inverse Modified Discrete Cosine Transform (MDCT) on each of the low frequency band signal and the high frequency band signal to convert from the frequency domain to the time domain; And (e) synthesizing the converted low frequency band signal and the converted high frequency band signal.
또한, 상기 또 다른 과제는 (a) 오디오 신호의 부호화 결과를 입력받는 단계; (b) 상기 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 단계; (c) 상기 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 단계; (d) 상기 저주파수 밴드 신호 및 상기 고주파수 밴드 신호 각각에 대하여 역 MDCT(Inverse Modified Discrete Cosine Transform)를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 단계; 및 (e) 상기 변환된 저주파수 밴드 신호 및 상기 변환된 고주파수 밴드 신호를 합성하는 단계를 포함하는 오디오 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.In addition, the another object is (a) receiving an encoding result of the audio signal; (b) generating a low frequency band signal by decoding and inverse quantizing the encoded bitplane included in the encoding result based on a context; (c) decoding the encoded bandwidth extension information included in the encoding result and generating a high frequency band signal from the low frequency band signal using the decoded bandwidth extension information; (d) performing an Inverse Modified Discrete Cosine Transform (MDCT) on each of the low frequency band signal and the high frequency band signal to convert from the frequency domain to the time domain; And (e) synthesizing the converted low frequency band signal and the converted high frequency band signal, by a computer readable recording medium having recorded thereon a program for executing a method of decoding an audio signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 방법은 (a) 오디오 신호의 부호화 결과를 입력받는 단계; (b) 상기 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 단계; (c) 상기 저주파수 밴드 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 단계; (d) 상기 역 MDCT가 수행된 저주파수 밴드 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환하는 단계; (e) 상기 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 정보를 이용하여 상기 주파수 도메인 또는 시간/주파수 도메인으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 단계; (f) 상기 고주파수 밴드 신호를 시간 도메인으로 역변환하는 단계; 및 (g) 상기 역변환된 고주파수 밴드 신호 및 상기 변환된 저주파수 밴드 신호를 합성하는 단계를 포함한다.In addition, the decoding method of an audio signal according to the present invention for solving the another problem comprises the steps of: (a) receiving an encoding result of the audio signal; (b) generating a low frequency band signal by decoding and inverse quantizing the encoded bitplane included in the encoding result based on a context; (c) performing inverse MDCT on the low frequency band signal and converting from the frequency domain to the time domain; (d) converting the low frequency band signal subjected to the inverse MDCT into a frequency domain or a time / frequency domain; (e) decoding the encoded bandwidth extension information included in the encoding result and generating a high frequency band signal from the low frequency band signal converted into the frequency domain or the time / frequency domain using the decoded bandwidth information; (f) inversely converting the high frequency band signal into a time domain; And (g) synthesizing the inverse transformed high frequency band signal and the converted low frequency band signal.
또한, 상기 또 다른 과제는 (a) 오디오 신호의 부호화 결과를 입력받는 단계; (b) 상기 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 단계; (c) 상기 저주파수 밴 드 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 단계; (d) 상기 역 MDCT가 수행된 저주파수 밴드 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환하는 단계; (e) 상기 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 주파수 도메인 또는 시간/주파수 도메인으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 단계; (f) 상기 고주파수 밴드 신호를 시간 도메인으로 역변환하는 단계; 및 (g) 상기 역변환된 고주파수 밴드 신호 및 상기 변환된 저주파수 밴드 신호를 합성하는 단계를 포함하는 오디오 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.In addition, the another object is (a) receiving an encoding result of the audio signal; (b) generating a low frequency band signal by decoding and inverse quantizing the encoded bitplane included in the encoding result based on a context; (c) performing inverse MDCT on the low frequency band signal to convert from frequency domain to time domain; (d) converting the low frequency band signal subjected to the inverse MDCT into a frequency domain or a time / frequency domain; (e) decoding the encoded bandwidth extension information included in the encoding result and generating a high frequency band signal from the low frequency band signal converted into the frequency domain or the time / frequency domain using the decoded bandwidth extension information; (f) inversely converting the high frequency band signal into a time domain; And (g) synthesizing the inversely transformed high frequency band signal and the converted low frequency band signal, by a computer readable recording medium having recorded thereon a program for executing a method for decoding an audio signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 방법은 (a) 오디오 신호의 부호화 결과를 입력받는 단계; (b) 상기 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 단계; (c) 상기 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 단계; (d) 상기 저주파수 밴드 신호 및 상기 고주파수 밴드 신호를 합성하는 단계; 및 (d) 상기 합성된 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 단계를 포함한다.In addition, the decoding method of an audio signal according to the present invention for solving the another problem comprises the steps of: (a) receiving an encoding result of the audio signal; (b) generating a low frequency band signal by decoding and inverse quantizing the encoded bitplane included in the encoding result based on a context; (c) decoding the encoded bandwidth extension information included in the encoding result and generating a high frequency band signal from the low frequency band signal using the decoded bandwidth extension information; (d) synthesizing the low frequency band signal and the high frequency band signal; And (d) performing inverse MDCT on the synthesized signal to convert from the frequency domain to the time domain.
또한, 상기 또 다른 과제는 (a) 오디오 신호의 부호화 결과를 입력받는 단계; (b) 상기 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호 화하고 역양자화하여 저주파수 밴드 신호를 생성하는 단계; (c) 상기 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 정보를 이용하여 상기 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 단계; (d) 상기 저주파수 밴드 신호 및 상기 고주파수 밴드 신호를 합성하는 단계; 및 (d) 상기 합성된 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 단계를 포함하는 오디오 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.In addition, the another object is (a) receiving an encoding result of the audio signal; (b) generating a low frequency band signal by decoding and inverse quantizing the encoded bitplane included in the encoding result based on a context; (c) decoding the encoded bandwidth extension information included in the encoding result and generating a high frequency band signal from the low frequency band signal using the decoded bandwidth information; (d) synthesizing the low frequency band signal and the high frequency band signal; And (d) performing inverse MDCT on the synthesized signal and converting the frequency signal from the frequency domain to the time domain, by means of a computer-readable recording medium having recorded thereon a program for executing a method of decoding an audio signal. .
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 장치는 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 밴드 분할부; 상기 고주파수 밴드 신호 및 상기 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인으로 변환하는 변환부; 상기 변환된 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 저주파수 밴드 부호화부; 및 상기 변환된 저주파수 밴드 신호를 이용하여 상기 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 대역폭 확장 부호화부를 포함한다.In addition, an apparatus for encoding an audio signal according to the present invention for solving the above another problem comprises: a band dividing unit for dividing an input signal into a high frequency band signal and a low frequency band signal; A converter for converting the high frequency band signal and the low frequency band signal from a time domain to a frequency domain, respectively; A low frequency band encoder which quantizes the converted low frequency band signal and encodes the bit frequency into a bit plane based on a context; And a bandwidth extension encoder for generating and encoding bandwidth extension information indicating a characteristic of the converted high frequency band signal by using the converted low frequency band signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 장치는 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 밴드 분할부; 상기 저주파수 밴드 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환하는 MDCT 적용부; 상기 MDCT 적용부의 출력을 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 저주파수 밴드 부호화부; 상기 고주파 수 밴드 신호 및 상기 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환하는 변환부; 및 상기 변환된 저주파수 밴드 신호를 이용하여 상기 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 대역폭 확장 부호화부를 포함한다.In addition, an apparatus for encoding an audio signal according to the present invention for solving the above another problem comprises: a band dividing unit for dividing an input signal into a high frequency band signal and a low frequency band signal; An MDCT application unit performing an MDCT on the low frequency band signal and converting the time domain from the time domain to the frequency domain; A low frequency band encoder for quantizing the output of the MDCT applier and encoding the bitplane based on a context; A converter for converting the high frequency band signal and the low frequency band signal from a time domain into a frequency domain or a time / frequency domain; And a bandwidth extension encoder for generating and encoding bandwidth extension information indicating a characteristic of the converted high frequency band signal by using the converted low frequency band signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 장치는 입력 신호를 시간 도메인에서 주파수 도메인으로 변환하는 변환부; 상기 변환된 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하는 밴드 분할부; 상기 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하는 저주파수 밴드 부호화부; 및 상기 저주파수 밴드 신호를 이용하여 상기 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하는 대역폭 확장 부호화부를 포함한다.In addition, an apparatus for encoding an audio signal according to an embodiment of the present invention for solving the another problem includes a converter for converting the input signal from the time domain to the frequency domain; A band dividing unit dividing the converted input signal into a high frequency band signal and a low frequency band signal; A low frequency band encoder for quantizing the low frequency band signal and encoding the bit frequency based on a context; And a bandwidth extension encoder for generating and encoding bandwidth extension information indicating a characteristic of the high frequency band signal by using the low frequency band signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 장치는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 저주파수 밴드 복호화부; 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 대역폭 확장 복호화부; 상기 저주파수 밴드 신호 및 상기 고주파수 밴드 신호 각각에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 역 MDCT 수행부; 및 상기 변환된 저주파수 밴드 신호 및 상기 변환된 고주파수 밴드 신호를 합성하는 밴드 합성부를 포함한다.In addition, an apparatus for decoding an audio signal according to the present invention for solving the another object is a low frequency band decoder for generating a low frequency band signal by decoding and inverse quantization of the encoded bit plane based on the context; A bandwidth extension decoder for decoding encoded bandwidth extension information and generating a high frequency band signal from the low frequency band signal using the decoded bandwidth extension information; An inverse MDCT performing unit performing inverse MDCT on each of the low frequency band signal and the high frequency band signal and converting from the frequency domain to the time domain; And a band synthesizer for synthesizing the converted low frequency band signal and the converted high frequency band signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 장치는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 저주파수 밴드 복호화부; 상기 저주파수 밴드 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 역 MDCT 적용부; 상기 역 MDCT가 수행된 저주파수 밴드 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환하는 변환부; 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 주파수 도메인 또는 시간/주파수 도메인으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 대역폭 확장 복호화부; 상기 복호화된 고주파수 밴드 신호를 시간 도메인으로 역변환하는 역변환부; 및 상기 역변환된 고주파수 밴드 신호 및 상기 변환된 저주파수 밴드 신호를 합성하는 밴드 합성부를 포함한다.In addition, an apparatus for decoding an audio signal according to the present invention for solving the another object is a low frequency band decoder for generating a low frequency band signal by decoding and inverse quantization of the encoded bit plane based on the context; An inverse MDCT application unit performing inverse MDCT on the low frequency band signal and converting from the frequency domain to the time domain; A converter for converting the low frequency band signal subjected to the inverse MDCT to a frequency domain or a time / frequency domain; A bandwidth extension decoder for decoding encoded bandwidth extension information and generating a high frequency band signal from the low frequency band signal converted into the frequency domain or the time / frequency domain using the decoded bandwidth extension information; An inverse transformer for inversely transforming the decoded high frequency band signal into a time domain; And a band synthesizer configured to synthesize the inverse transformed high frequency band signal and the converted low frequency band signal.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 장치는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하는 저주파수 밴드 복호화부; 부호화된 대역폭 확장 정보를 복호화하고, 상기 복호화된 대역폭 확장 정보를 이용하여 상기 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하는 대역폭 확장 복호화부; 상기 저주파수 밴드 신호 및 상기 고주파수 밴드 신호를 합성하는 밴드 합성부; 및 상기 합성된 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하는 역 MDCT 적용부를 포함한다.In addition, an apparatus for decoding an audio signal according to the present invention for solving the another object is a low frequency band decoder for generating a low frequency band signal by decoding and inverse quantization of the encoded bit plane based on the context; A bandwidth extension decoder for decoding encoded bandwidth extension information and generating a high frequency band signal from the low frequency band signal using the decoded bandwidth extension information; A band synthesizer for synthesizing the low frequency band signal and the high frequency band signal; And an inverse MDCT application unit performing inverse MDCT on the synthesized signal and converting from the frequency domain to the time domain.
본 발명에 따르면, 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할하고, 고주파수 밴드 신호 및 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인으로 변환하며, 변환된 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화하고, 변환된 저주파수 밴드 신호를 이용하여 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화하며, 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 입력 신호에 대한 부호화 결과로써 출력함으로써, 한정된 비트율에서 고주파수 성분을 효율적으로 부호화하여 음질을 향상시킬 수 있다.According to the present invention, the input signal is divided into a high frequency band signal and a low frequency band signal, the high frequency band signal and the low frequency band signal are respectively converted from the time domain to the frequency domain, and the converted low frequency band signal is quantized to perform bit based on context. And encoding and generating bandwidth extension information representing the characteristics of the transformed high frequency band signal using the transformed low frequency band signal, and outputting the encoded bitplane and the encoded bandwidth extension information as the encoding result of the input signal. As a result, the sound quality can be improved by efficiently encoding the high frequency components at a limited bit rate.
또한, 본 발명에 따르면, 오디오 신호의 부호화 결과를 입력받고, 부호화 결과에 포함된 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성하며, 부호화 결과에 포함된 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성하고, 저주파수 밴드 신호 및 고주파수 밴드 신호 각각에 대하여 역 MDCT(Inverse Modified Discrete Cosine Transform)를 수행하여 주파수 도메인에서 시간 도메인으로 변환하며, 변환된 저주파수 밴드 신호 및 변환된 고주파수 밴드 신호를 합성함으로써, 한정된 비트율에서 부호화된 비트스트림으로부터 고주파수 성분을 효율적으로 복호화할 수 있다.In addition, according to the present invention, the encoding result of the audio signal is input, the encoded bitplane included in the encoding result is decoded and dequantized based on a context to generate a low frequency band signal, and the encoded bandwidth included in the encoding result. Decode the extension information, generate a high frequency band signal from the low frequency band signal using the decoded bandwidth extension information, and perform an Inverse Modified Discrete Cosine Transform (Inverse MDCT) on each of the low frequency band signal and the high frequency band signal in the frequency domain By converting to the time domain and synthesizing the converted low frequency band signal and the converted high frequency band signal, it is possible to efficiently decode the high frequency component from the bitstream encoded at the limited bit rate.
본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다. With respect to the embodiments of the present invention disclosed in the text, specific structural to functional descriptions are merely illustrated for the purpose of describing embodiments of the present invention, embodiments of the present invention may be implemented in various forms and It should not be construed as limited to the embodiments described in.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다. As the inventive concept allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the text. However, this is not intended to limit the present invention to the specific disclosed form, it should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. In describing the drawings, similar reference numerals are used for the components.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in the commonly used dictionaries should be construed as having meanings consistent with the meanings in the context of the related art and shall not be construed in ideal or excessively formal meanings unless expressly defined in this application. Do not.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다. Hereinafter, with reference to the accompanying drawings, it will be described in detail a preferred embodiment of the present invention. The same reference numerals are used for the same elements in the drawings, and duplicate descriptions of the same elements are omitted.
도 1은 본 발명의 일 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.1 is a block diagram illustrating an apparatus for encoding an audio signal according to an embodiment of the present invention.
도 1을 참조하면, 오디오 신호의 부호화 장치는 밴드 분할부(100), 제1 MDCT 적용부(110), 주파수 선형 예측 수행부(120), 멀티-레졸류션 분석부(130), 양자화 부(140), PQ-SPSC 모듈(150), 문맥-기반 비트플레인 부호화부(160), 제2 MDCT 적용부(170), 대역폭 확장 부호화부(180), 및 다중화부(190)를 포함한다.Referring to FIG. 1, an apparatus for encoding an audio signal includes a
밴드 분할부(100, band splitting unit)는 입력 신호(IN)를 저주파수 밴드 신호(LB, Low Band signal) 및 고주파수 밴드 신호(HB, high band signal)로 분할한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM(Pulse Code Modulation) 신호일 수 있다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.The
제1 MDCT 적용부(110)는 밴드 분할부(100)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT(Modified Discrete Cosine Transform)를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다.The first
주파수 선형 예측 수행부(120, frequency linear prediction performing unit)은 제1 MDCT 적용부(110)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측(frequency linear prediction)을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합(linear combination)으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(120)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류(prediction error)가 최소가 되도록 선형 예측 필터의 계수(coefficient)를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(120)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.The frequency linear
구체적으로, 주파수 선형 예측 수행부(120)는 제1 MDCT 적용부(110)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(120)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the frequency linear
멀티-레졸루션 분석부(130, multi-resolution analysis unit)는 제1 MDCT 적용부(110)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(120)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(Multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(130)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(120)에서 필터링된 신호를 두 가지 유형(예를 들어, 스테이빌(stabile) 유형과 숏(short) 유형)으로 나누어 분석할 수 있다. The
구체적으로, 멀티-레졸루션 분석부(130)는 제1 MDCT 적용부(110)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(120)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(130)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.Specifically, the
양자화부(140)는 주파수 선형 예측 수행부(120) 또는 멀티-레졸류션 분석 부(130)에서 출력된 결과를 양자화한다.The
PQ-SPSC 모듈(150, Post-quantization Square Polar Stereo Coding module)은 양자화부(140)에서 출력된 결과에 대하여 주파수 스펙트럼의 side-polar coordination stereo encoding을 수행한다.The PQ-
문맥-기반 비트플레인 부호화부(160, Context-dependent Bit plane Coding unit)는 문맥을 기반으로 하여 PQ-SPSC 모듈(150)의 출력을 비트플레인으로 부호화한다. 여기서, 문맥-기반 비트플레인 부호화부(160)는 허프만 코딩(Huffman Coding)을 이용하여 PQ-SPSC 모듈(150)에서 출력된 결과를 비트플레인으로 부호화할 수 있다.The context-based
제2 MDCT 적용부(170)는 밴드 분할부(100)에서 분할된 고주파수 밴드 신호(HB)에 대하여 MDCT를 수행하여, 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인으로 변환한다.The second
대역폭 확장 부호화부(180)는 제2 MDCT 적용부(170)에서 주파수 영역으로 변환된 고주파수 밴드 신호의 성분을 전달하기 위하여, 제1 MDCT 적용부(110)에서 주파수 영역으로 변환된 저주파수 밴드 신호를 이용하여 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(180)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파 수 밴드 신호를 이용하여 대역폭 확장 정보를 생성할 수 있다. The
다중화부(190)는 주파수 선형 예측 수행부(120), PQ-SPSC 모듈(150), 문맥-기반 비트플레인 부호화부(160) 및 대역폭 확장 부호화부(180)에서 부호화를 수행한 결과를 다중화하여 비트 스트림(bit stream)을 생성하고 출력단자 OUT을 통해 출력한다.The
도 2는 본 발명의 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.2 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 2를 참조하면, 오디오 신호의 부호화 장치는 밴드 분할부(200), MDCT 적용부(210), 주파수 선형 예측 수행부(220), 멀티-레졸류션 분석부(230), 양자화부(240), PQ-SPSC 모듈(250), 문맥-기반 비트플레인 부호화부(260), 저주파수 밴드 변환부(270), 고주파수 밴드 변환부(275), 대역폭 확장 부호화부(280) 및 다중화부(290)를 포함한다.Referring to FIG. 2, the apparatus for encoding an audio signal includes a
밴드 분할부(200)는 입력 신호(IN)를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.The
MDCT 적용부(210)는 밴드 분할부(200)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT(Modified Discrete Cosine Transform)를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다.The
주파수 선형 예측 수행부(220)는 MDCT 적용부(210)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(220)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(520)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.The frequency linear
구체적으로, 주파수 선형 예측 수행부(220)는 MDCT 적용부(210)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(220)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.Specifically, the frequency linear
멀티-레졸루션 분석부(230)는 주파수 선형 예측 수행부(220)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(230)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(220)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.The
구체적으로, 멀티-레졸루션 분석부(230)는 MDCT 적용부(210)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(220)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(230)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.Specifically, the
양자화부(240)는 주파수 선형 예측 수행부(220)에서 필터링된 신호 또는 멀티-레졸루션 분석부(230)에서 출력된 결과를 양자화한다.The
PQ-SPSC 모듈(250)은 양자화부(240)에서 출력된 결과에 대하여 주파수 스펙트럼의 side-polar coordination stereo encoding을 수행한다.The PQ-
문맥-기반 비트플레인 부호화부(260)는 문맥을 기반으로 하여 PQ-SPSC 모듈(250)의 출력을 비트플레인으로 부호화한다. 여기서, 문맥-기반 비트플레인 부호화부(260)는 허프만 코딩(Huffman Coding)을 이용하여 PQ-SPSC 모듈(250)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.The context-based
저주파수 밴드 변환부(270)는 밴드 분할부(200)에서 분할된 저주파수 밴드 신호(LB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 예를 들어, 저주파수 밴드 변환부(270)는 MDST(Modified Discrete Sine Transform), FFT(Fast Fourier Transform), 및 QMF(Quadrature Mirror Filters) 등을 이용하여 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다.The low
고주파수 밴드 변환부(275)는 밴드 분할부(200)에서 분할된 고주파수 밴드 신호(HB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 여기서, 고주파수 밴드 변환부(275)는 저주파수 밴드 변환부(270)과 동일한 변환 기법을 이용한다. 예를 들어, 고주파수 밴드 변환부(275)는 MDST, FFT, 및 QMF 등을 이용하여 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다.The high
대역폭 확장 부호화부(280)는 저주파수 밴드 변환부(270)에서 주파수 도메인으로 변환된 저주파수 밴드 신호를 이용하여, 고주파수 밴드 변환부(275)에서 주파수 도메인으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(280)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드 신호를 이용하여 대역폭 확장 정보를 생성할 수 있다.The
다중화부(290)는 주파수 선형 예측 수행부(220), PQ-SPSC 모듈(250), 문맥-기반 비트플레인 부호화부(260), 및 대역폭 확장 부호화부(280)에서 부호화를 수행한 결과를 다중화하여 비트 스트림(bit stream)을 생성하고 출력단자 OUT을 통해 출력한다.The
도 3은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.3 is a block diagram showing an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 3을 참조하면, 오디오 신호의 부호화 장치는 MDCT 적용부(300), 밴드 분할부(310), 주파수 선형 예측 수행부(320), 멀티-레졸루션 분석부(330), 양자화부(340), PQ-SPSC 모듈(350), 문맥-기반 비트플레인 부호화부(360), 대역폭 확장 부호화부(370) 및 다중화부(380)를 포함한다.Referring to FIG. 3, the apparatus for encoding an audio signal includes an
MDCT 적용부(300)는 입력 신호(IN)에 대하여 MDCT를 수행하여, 입력 신호(IN)를 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다.The
밴드 분할부(310)는 MDCT 적용부(300)에서 주파수 도메인으로 변환된 신호를 저주파수 밴드 신호(LB)와 고주파수 밴드 신호(HB)로 분할한다.The
주파수 선형 예측 수행부(320)는 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB)에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(320)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(320)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.The frequency
구체적으로, 주파수 선형 예측 수행부(320)는 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB)가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(320)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the frequency linear
멀티-레졸루션 분석부(330)는 주파수 선형 예측 수행부(320)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도로 분석한다. 구체적으로, 멀티-레졸루션 분석부(330)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(320)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다. The
구체적으로, 멀티-레졸루션 분석부(330)는 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB) 또는 주파수 선형 예측 수행부(320)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(330)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the
양자화부(340)는 주파수 선형 예측 수행부(320)에서 필터링된 신호 또는 멀티-레졸루션 분석부(330)에서 출력된 결과를 양자화한다.The
PQ-SPSC 모듈(350)은 양자화부(340)에서 출력된 결과에 대하여 주파수 스펙트럼의 side-polar coordination stereo encoding을 수행한다.The PQ-
문맥-기반 비트플레인 부호화부(360)는 문맥을 기반으로 하여 PQ-SPSC 모듈(350)에서 출력된 결과를 비트플레인으로 부호화한다. 여기서, 문맥-기반 비트플 레인 부호화부(360)는 허프먼 코딩(Huffman coding)을 이용하여 PQ-SPSC 모듈(350)에서 출력된 결과를 비트플레인으로 부호화할 수 있다.The context-based
대역폭 확장 부호화부(370)는 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB)를 이용하여, 밴드 분할부(310)에서 분할된 고주파수 밴드 신호(HB)의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(370)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드 신호를 이용하여 대역폭 확장 정보를 생성할 수 있다.The
다중화부(380)는 주파수 선형 예측 수행부(320), PQ-SPSC 모듈(350), 문맥-기반 비트플레인 부호화부(360) 및 대역폭 확장 부호화부(370)에서 부호화를 수행한 결과를 다중화하여 비트 스트림(bit stream)을 생성하고 출력단자 OUT을 통해 출력한다.The
도 4는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다. 4 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 4를 참조하면, 오디오 신호의 부호화 장치는 밴드 분할부(400), 제1 MDCT 적용부(410), 주파수 선형 예측 수행부(420), 멀티-레졸루션 분석부(430), 양자화부(440), 문맥-기반 비트플레인 부호화부(450), 제2 MDCT 적용부(460), 대역폭 확장 부호화부(470) 및 다중화부(480)를 포함한다. Referring to FIG. 4, the apparatus for encoding an audio signal includes a
밴드 분할부(400)는 입력 신호(IN)를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.The
제1 MDCT 적용부(410)는 밴드 분할부(400)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, 시간 도메인은 시간의 경과에 따라 입력 신호(IN)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이고, 주파수 도메인은 주파수의 변화에 따라 입력 신호(IN)의 크기를 나타내는 도메인이다.The first
주파수 선형 예측 수행부(420)는 제1 MDCT 적용부(410)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합(linear combination)으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(420)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류(prediction error)가 최소가 되도록 선형 예측 필터의 계수(coefficient)를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(420)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.The frequency linear
구체적으로, 주파수 선형 예측 수행부(420)는 제1 MDCT 적용부(410)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(420)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the frequency linear
멀티-레졸루션 분석부(430)는 주파수 선형 예측 수행부(420)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(430)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(420)에서 필터링된 신호를 두 가지 유형(예를 들어, 스테이빌(stabile) 유형과 숏(short) 유형)으로 나누어 분석할 수 있다. The
구체적으로, 멀티-레졸루션 분석부(430)는 제1 MDCT 적용부(410)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(420)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(430)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.Specifically, the
양자화부(440)는 주파수 선형 예측 수행부(420)에서 필터링된 신호 또는 멀티-레졸루션 분석부(430)에서 출력된 결과를 양자화한다.The
문맥-기반 비트플레인 부호화부(450)는 문맥을 기반으로 하여 양자화부(440)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플 레인 부호화부(450)는 허프만 코딩(Huffman Coding)을 이용하여 양자화부(440)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.The context-based
이와 같이, 주파수 선형 예측 수행부(420), 멀티-레졸루션 분석부(430), 양자화부(440) 및 문맥-기반 비트플레인 부호화부(450)는 MDCT 적용부(410)에서 출력된 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.As such, the frequency linear
제2 MDCT 적용부(460)는 밴드 분할부(400)에서 분할된 고주파수 밴드 신호(HB)에 대하여 MDCT를 수행하여 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인으로 변환한다.The second
대역폭 확장 부호화부(470)는 제1 MDCT 적용부(410)에서 주파수 도메인으로 변환된 저주파수 밴드 신호를 이용하여, 제2 MDCT 적용부(460)에서 주파수 도메인으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(470)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드 신호를 이용하여 대역폭 확장 정보를 생성할 수 있다.The
다중화부(480)는 주파수 선형 예측 수행부(420), 문맥-기반 비트플레인 부호화부(450) 및 대역폭 확장 부호화부(470)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.The
도 5는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다. 5 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 5를 참조하면, 오디오 신호의 부호화 장치는 밴드 분할부(500), MDCT 적용부(510), 주파수 선형 예측 수행부(520), 멀티-레졸루션 분석부(530), 양자화부(540), 문맥-기반 비트플레인 부호화부(550), 저주파수 밴드 변환부(560), 고주파수 밴드 변환부(570), 대역폭 확장 부호화부(580) 및 다중화부(590)를 포함한다.Referring to FIG. 5, the apparatus for encoding an audio signal includes a
밴드 분할부(500)는 입력 신호(IN)를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.The
MDCT 적용부(510)는 밴드 분할부(400)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다.The
주파수 선형 예측 수행부(520)는 MDCT 적용부(510)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(520)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(520)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.The frequency linear
구체적으로, 주파수 선형 예측 수행부(520)는 MDCT 적용부(510)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(520)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the frequency linear
멀티-레졸루션 분석부(530)는 주파수 선형 예측 수행부(520)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(530)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(420)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.The
구체적으로, 멀티-레졸루션 분석부(530)는 MDCT 적용부(510)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(520)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(530)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the
양자화부(540)는 주파수 선형 예측 수행부(520)에서 필터링된 신호 또는 멀티-레졸루션 분석부(530)에서 출력된 결과를 양자화한다.The
문맥-기반 비트플레인 부호화부(550)는 문맥을 기반으로 하여 양자화부(540)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(550)는 허프만 코딩(Huffman Coding)을 이용하여 양자화부(540)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.The context-based
이와 같이, 주파수 선형 예측 수행부(520), 멀티-레졸루션 분석부(530), 양자화부(540) 및 문맥-기반 비트플레인 부호화부(550)는 MDCT 적용부(510)에서 출력된 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.As such, the frequency linear
저주파수 밴드 변환부(560)는 밴드 분할부(500)에서 분할된 저주파수 밴드 신호(LB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 예를 들어, 저주파수 밴드 변환부(560)는 MDST, FFT, 및 QMF 등을 이용하여 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다. 여기서, 시간 도메인은 시간의 경과에 따라 저주파수 밴드 신호(LB)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이다. 이에 비해, 주파수 도메인은 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다. 시간/주파수 도메인은 시간의 경과 및 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다.The low
고주파수 밴드 변환부(570)는 밴드 분할부(500)에서 분할된 고주파수 밴드 신호(HB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 여기서, 고주파밴드 변환부(570)는 저주파밴드 변환부(560)에서 이용하는 동일한 변환 기법을 이용한다. 예를 들어, 고주파수 밴드 변환부(570)는 MDST, FFT, 및 QMF 등을 이용하여 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다.The high
대역폭 확장 부호화부(580)는 저주파수 밴드 변환부(560)에서 주파수 도메인으로 변환된 저주파수 밴드 신호를 이용하여, 고주파수 밴드 변환부(570)에서 주파수 도메인으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(580)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드 신호를 이용하여 대역폭 확장 정보를 생성할 수 있다.The
다중화부(590)는 주파수 선형 예측 수행부(520), 문맥-기반 비트플레인 부호화부(550) 및 대역폭 확장 부호화부(580)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.The
도 6은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다. 6 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 6을 참조하면, 오디오 신호의 부호화 장치는 MDCT 적용부(600), 밴드 분할부(610), 주파수 선형 예측 수행부(620), 멀티-레졸루션 분석부(630), 양자화부(640), 문맥-기반 비트플레인 부호화부(650), 대역폭 확장 부호화부(660) 및 다중화부(670)를 포함한다.Referring to FIG. 6, the apparatus for encoding an audio signal includes an
MDCT 적용부(600)는 입력 신호(IN)에 대하여 MDCT를 수행하여, 입력 신호(IN)를 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다.The
밴드 분할부(610)는 MDCT 적용부(600)에서 주파수 도메인으로 변환된 신호를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.The
주파수 선형 예측 수행부(620)는 밴드 분할부(610)에서 분할된 저주파수 밴드 신호(LB)에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(620)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(620)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하 여 부호화의 효율을 향상시킬 수 있다.The frequency
구체적으로, 주파수 선형 예측 수행부(620)는 밴드 분할부(610)에서 분할된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(620)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the frequency linear
멀티-레졸루션 분석부(630)는 주파수 선형 예측 수행부(620)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도로 분석한다. 구체적으로, 멀티-레졸루션 분석부(630)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(620)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다. The
구체적으로, 멀티-레졸루션 분석부(630)는 밴드 분할부(610)에서 분할된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(620)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(630)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.In detail, the
양자화부(640)는 주파수 선형 예측 수행부(620)에서 필터링된 신호 또는 멀티-레졸루션 분석부(630)에서 출력된 결과를 양자화한다.The
문맥-기반 비트플레인 부호화부(650)는 문맥을 기반으로 하여 양자화부(640)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플 레인 부호화부(650)는 허프만 코딩(Huffman Coding)을 이용하여 양자화부(640)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.The context-based
이와 같이, 주파수 선형 예측 수행부(620), 멀티-레졸루션 분석부(630), 양자화부(640) 및 문맥-기반 비트플레인 부호화부(650)는 MDCT 적용부(610)에서 출력된 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.As such, the frequency linear
대역폭 확장 부호화부(660)는 저주파수 밴드 신호(LB)를 이용하여, 고주파수 밴드 신호(HB)의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(660)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드 신호를 이용하여 대역폭 확장 정보를 생성할 수 있다. The
다중화부(670)는 주파수 선형 예측 수행부(620), 문맥-기반 비트플레인 부호화부(650) 및 대역폭 확장 부호화부(660)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.The
도 7은 본 발명의 일 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다. 7 is a block diagram illustrating an apparatus for decoding an audio signal according to an embodiment of the present invention.
도 7을 참조하면, 오디오 신호의 복호화 장치는 역다중화부(700), 문맥-기반 비트플레인 복호화부(710), PQ-SPSC 모듈(720), 역양자화부(730), 멀티-레졸루션 합성부(740), 역 주파수 선형 예측 수행부(750), 제1 역 MDCT 적용부(760), 대역폭 확장 복호화부(770), 제2 역 MDCT 적용부(780) 및 밴드 합성부(790)를 포함하여 이루어진다.Referring to FIG. 7, an apparatus for decoding an audio signal includes a
역다중화부(700)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 구체적으로, 역다중화부(700)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(700)가 출력하는 정보는 PQ-SPSC 모듈(720)에서 이용할 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, Quantization wide-polar coordination stereo decoding의 정보, 신호 타입 정보(Signal type information), 주파수 선형 예측 및 벡터 양자화(Frequency-domain linear prediction and vector quantization)의 정보, 및 부호화된 대역폭 확장 정보 등이 있다.The
문맥-기반 비트플레인 복호화부(710, Context-dependent Bit plane decoding unit)는 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(710)는 역다중화부(700)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보 및 스케일 팩터(scale factor)를 복원한다. 문맥-기반 비트플레인 복호화부(710)는 Prejudice coding band mode 정보, Prejudice coding의 스케일 팩터, 및 Prejudice coding의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스 케일 팩터의 decoding cosmetic 표시, 주파수 스펙트럼의 양자화 값을 출력한다.The context-based
PQ-SPSC 모듈(720, Post-quantization Square Polar Stereo Coding module)은 문맥-기반 비트플레인 복호화부(710)에서 출력된 결과를 수신하고, 주파수 스펙트럼의 side-polar coordination stereo decoding을 수행한다. 여기서, PQ-SPSC 모듈(720)은 주파수 스펙트럼의 side-polar coordination stereo와 연결(coupling)의 정보를 입력받아 side-polar coordination stereo decoding을 수행한 후 양자화 주파수 스펙트럼을 출력한다.The PQ-
역양자화부(730)는 PQ-SPSC 모듈(720)에서 출력된 결과를 역양자화한다.The
멀티-레졸루션 합성부(740, Multi-resolution synthesis unit)는 역양자화부(730)의 출력을 수신하여, 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션(Multi-resolution)으로 합성한다. 구체적으로, 멀티-레졸루션 합성부(740)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(730)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(740)는 reserve quantization spectrum/difference spectrum을 입력받아 reconstruction spectrum/difference spectrum을 출력한다.The
역 주파수 선형 예측 수행부(750, inverse frequency linear prediction performing unit)은 역양자화부(730)의 출력 또는 멀티-레졸루션 합성부(740)의 출력과 역다중화부(700)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성한다. 구체적으로, 역 주파수 선형 예측 수행부(750)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결 과를 역양자화부(730)의 출력 또는 멀티-레졸루션 합성부(740)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(750)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(750)은 difference spectrum 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.An inverse frequency linear prediction performing unit (750) is a frequency output from an
제1 역 MDCT 적용부(760)는 부호화단에 대한 역변환 과정으로서 멀티-레졸루션 합성부(740) 또는 역 주파수 선형 예측 수행부(750)에서 출력된 저주파수 밴드 신호에 대하여 역 MDCT(inverse MDCT)를 수행하여 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 제1 역 MDCT 적용부(760)는 멀티-레졸루션 합성부(740) 또는 역 주파수 선형 예측 수행부(750)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.The first inverse
대역폭 확장 복호화부(770)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 멀티-레졸루션 합성부(740) 또는 역 주파수 선형 예측 수행부(750)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(770)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.The
제2 역 MDCT 적용부(780)는 대역폭 확장 복호화부(770)에서 복호화된 고주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다.The second inverse
밴드 합성부(790)는 제1 역 MDCT 적용부(760)에서 시간 도메인으로 변환된 저주파수 밴드 신호와 제2 역 MDCT 적용부(780)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성하여 출력단자 OUT을 통해 출력한다.The
도 8은 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다. 8 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 8을 참조하면, 오디오 데이터 복호화 장치는 역다중화부(800), 문맥-기반 비트플레인 복호화부(810), PQ-SPSC 모듈(820), 역양자화부(830), 멀티-레졸루션 합성부(840), 역 주파수 선형 예측 수행부(850), 역 MDCT 적용부(860), 변환부(865), 대역폭 확장 복호화부(870), 역변환부(880) 및 밴드 합성부(890)를 포함하여 이루어진다.Referring to FIG. 8, the audio data decoding apparatus includes a
역다중화부(800)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 역다중화부(800)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(800)가 출력하는 정보는 PQ-SPSC 모듈(820)에서 이용할 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화(Context-dependent Bit plane decoding without decoding)의 정보, Quantization wide-polar coordination stereo decoding의 정보, Signal type information, Frequency-domain linear prediction and vector quantization의 정보, 및 부호화된 대역폭 확장 정보 등이 있다.The
문맥-기반 비트플레인 복호화부(810)는 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(810)는 역다중화부(800)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보, 및 스케일 팩터(scale factor)를 복원한다. 문맥-기반 비트플레인 복호화부(810)는 Prejudice coding band mode 정보, Prejudice coding의 스케일 팩터, 및 Prejudice coding의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 decoding cosmetic 표시, 주파수 스펙트럼의 양자화 값을 출력한다.The context-based
PQ-SPSC 모듈(820)은 문맥-기반 비트플레인 복호화부(810)의 출력을 수신하고, 주파수 스펙트럼의 side-polar coordination stereo decoding을 수행한다. 여기서, PQ-SPSC 모듈(820)은 주파수 스펙트럼의 side-polar coordination stereo와 연결(coupling)의 정보를 입력받아 side-polar coordination stereo decoding을 수행한 후 양자화 주파수 스펙트럼을 출력한다.The PQ-
역양자화부(830)는 PQ-SPSC 모듈(820)에서 출력된 결과를 역양자화한다.The
멀티-레졸루션 합성부(840)는 역양자화부(830)의 출력을 수신하고, 순간적으로 변하는 신호의 오디오 스펙트럼 계수에 대하여 멀티-레졸루션(Multi-resolution)을 처리한다. 구체적으로, 멀티-레졸루션 합성부(840)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(830)의 출력을 멀티-레 졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(840)는 reserve quantization spectrum/difference spectrum을 입력받아 reconstruction spectrum/difference spectrum을 출력한다.The
역 주파수 선형 예측 수행부(850)는 멀티-레졸루션 합성부(840)의 출력과 역다중화부(800)로부터 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(850)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(830)의 출력 또는 멀티-레졸루션 합성부(840)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(850)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(850)은 difference spectrum 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.The inverse frequency linear
역 MDCT 적용부(860)는 부호화단에 대한 역변환 과정으로서 멀티-레졸루션 합성부(840) 또는 역 주파수 선형예측 수행부(850)에서 출력된 저주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역 MDCT 적용부(860)는 멀티-레졸루션 합성부(840) 또는 역 주파수 선형 예측 수행부(850)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.The inverse
변환부(865)는 역 MDCT 적용부(860)에서 시간 도메인으로 변환된 저주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또 는 시간-주파수 도메인으로 변환한다. 변환부(865)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다. 변환부(865)에서 MDCT를 적용하여 실시할 수 없는 것은 아니지만 MDCT를 사용할 경우에는 도 7에 도시된 실시예가 보다 효율적이다.The
대역폭 확장 복호화부(870)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 변환부(865)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(870)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.The
역변환부(880)는 대역폭 확장 복호화부(870)에서 복호화된 고주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 주파수 도메인 또는 시간-주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역변환부(880)는 변환부(865)에서 이용하는 동일한 변환 기법을 이용한다. 역변환부(880)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다.The
밴드 합성부(890)는 역 MDCT 적용부(860)에서 시간 도메인으로 변환된 저주파수 밴드 신호와 역변환부(880)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성하여 출력단자 OUT을 통해 출력한다.The
도 9는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타 내는 블록도이다. 9 is a block diagram showing an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 9를 참조하면, 오디오 데이터 복호화 장치는 역다중화부(900), 문맥-기반 비트플레인 복호화부(910), PQ-SPSC 모듈(920), 역양자화부(930), 멀티-레졸루션 합성부(940), 역 주파수 선형 예측 수행부(950), 대역폭 확장 복호화부(960), 밴드 합성부(970) 및 역 MDCT 적용부(980)를 포함한다.Referring to FIG. 9, an audio data decoding apparatus includes a
역다중화부(900)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 역다중화부(900)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(900)가 출력하는 정보는 PQ-SPSC 모듈(920)에서 이용할 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화(Context-dependent Bit plane decoding without decoding)의 정보, Quantization wide-polar coordination stereo decoding의 정보, Signal type information, Frequency-domain linear prediction and vector quantization의 정보, 및 부호화된 대역폭 확장 정보 등이 있다.The
문맥-기반 비트플레인 복호화부(910)는 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(910)는 역다중화부(900)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보, 및 스케일 팩터(scale factor)를 복원한다. 문맥-기반 비트플레인 복호화부(910)는 Prejudice coding band mode 정보, Prejudice coding의 스케일 팩터, 및 Prejudice coding의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 decoding cosmetic 표시, 주파수 스펙트럼의 양자화 값을 출력한다.The context-based
PQ-SPSC 모듈(920)은 문맥-기반 비트플레인 복호화부(910)의 출력을 수신하고, 주파수 스펙트럼의 side-polar coordination stereo decoding을 수행한다. 여기서, PQ-SPSC 모듈(920)은 주파수 스펙트럼의 side-polar coordination stereo와 연결(coupling)의 정보를 입력받아 side-polar coordination stereo decoding을 수행한 후 양자화 주파수 스펙트럼을 출력한다.The PQ-
역양자화부(930)는 PQ-SPSC 모듈(920)에서 출력된 결과를 역양자화한다.The
멀티-레졸루션 합성부(940)는 역양자화부(930)의 출력을 수신하여, 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션(Multi-resolution)을 처리한다. 구체적으로, 멀티-레졸루션 합성부(90)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(930)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(940)는 reserve quantization spectrum/difference spectrum을 입력받아 reconstruction spectrum/difference spectrum을 출력한다.The
역 주파수 선형 예측 수행부(950)는 멀티-레졸루션 합성부(940)의 출력과 역다중화부(900)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(950)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선 형 예측이 수행된 결과를 역양자화부(930)의 출력 또는 멀티-레졸루션 합성부(940)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(950)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(950)은 difference spectrum 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.The inverse frequency linear
대역폭 확장 복호화부(960)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 멀티-레졸루션 합성부(940) 또는 역 주파수 선형 예측 수행부(950)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(960)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.The
밴드 합성부(970)는 멀티-레졸루션 합성부(940) 또는 역 주파수 선형 예측 수행부(950)에서 출력된 저주파수 밴드 신호와 대역폭 확장 복호화부(960)에서 복호화된 고주파수 밴드 신호를 합성한다.The
역 MDCT 적용부(980)는 밴드 합성부(970)에서 출력된 신호를 역 MDCT(inverse MDCT)에 의해 주파수 도메인에서 시간 도메인으로 역변환하여 출력단자 OUT을 통해 출력한다. 여기서, 역 MDCT 적용부(980)는 역 주파수 선형 예측 수 행부(950)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.The inverse
도 10은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.10 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 10을 참조하면, 오디오 신호의 복호화 장치는 역다중화부(1000), 문맥-기반 비트플레인 복호화부(1010), 역양자화부(1020), 멀티-레졸루션 합성부(1030), 역 주파수 선형 예측 수행부(1040), 대역폭 확장 복호화부(1050), 제1 역 MDCT 적용부(1060), 제2 역 MDCT 적용부(1070) 및 밴드 합성부(1080)를 포함한다.Referring to FIG. 10, an apparatus for decoding an audio signal includes a
역다중화부(1000)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 구체적으로, 역다중화부(1000)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(1000)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화(Context-dependent Bit plane decoding without decoding)의 정보, 신호 타입 정보(Signal type information), 주파수 선형 예측 및 벡터 양자화(Frequency-domain linear prediction and vector quantization)의 정보, 및 부호화된 대역폭 확장 정보 등이 있다.The
문맥-기반 비트플레인 복호화부(1010)는 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(1010)는 역다중화 부(1000)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보 및 스케일 팩터(scale factor)를 복원한다. 문맥-기반 비트플레인 복호화부(1010)는 Prejudice coding band mode 정보, Prejudice coding의 스케일 팩터(scale factor), 및 Prejudice coding의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 decoding cosmetic 표시, 주파수 스펙트럼의 양자화 값을 출력한다.The context-based
역양자화부(1020)는 문맥-기반 비트플레인 복호화부(1010)에서 출력된 결과를 역양자화한다.The
멀티-레졸루션 합성부(1030)는 역양자화부(1020)에서 역양자화된 신호를 수신하여 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션(Multi-resolution)을 처리한다. 구체적으로, 멀티-레졸루션 합성부(1030)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(1020)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(1030)는 reserve quantization spectrum/difference spectrum을 입력받아 reconstruction spectrum/difference spectrum을 출력한다.The
역 주파수 선형 예측 수행부(1040)은 멀티-레졸루션 합성부(1030)의 출력과 역다중화부(1000)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성한다. 구체적으로, 역 주파수 선형 예측 수행부(1040)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(1020)의 출력 또는 멀티-레졸루션 합성부(1030)의 출력과 합성하여 복 호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(1040)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(1040)은 difference spectrum 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.The inverse frequency linear
이와 같이, 문맥-기반 비트플레인 복호화부(1010), 역양자화부(1020), 멀티-레졸루션 합성부(1030) 및 역 주파수 선형 예측 수행부(1040)는 부호화된 저주파수 밴드 신호에 대해서 복호화를 수행하므로, 저주파수 밴드 복호화부라고 할 수 있다.As such, the context-based
대역폭 확장 복호화부(1050)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 멀티-레졸루션 합성부(1030) 또는 역 주파수 선형 예측 수행부(1040)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(1050)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.The
제1 역 MDCT 적용부(1060)는 부호화단에 대한 역변환 과정으로서 멀티-레졸루션 합성부(1030) 또는 역 주파수 선형 예측 수행부(1040)에서 출력된 저주파수 밴드 신호에 대하여 역 MDCT(inverse MDCT)를 수행하여 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 제1 역 MDCT 적용부(1060)는 멀티-레졸루션 합성 부(1030) 또는 역 주파수 선형 예측 수행부(1040)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.The first inverse
제2 역 MDCT 적용부(1070)는 대역폭 확장 복호화부(1050)에서 생성된 고주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다.The second inverse
밴드 합성부(1080)는 제1 역 MDCT 적용부(1060)에서 시간 도메인으로 변환된 저주파수 밴드 신호와 제2 역 MDCT 적용부(1070)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성하여 출력단자 OUT을 통해 출력한다.The
도 11은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.11 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 11을 참조하면, 오디오 데이터 복호화 장치는 역다중화부(1100), 문맥-기반 비트플레인 복호화부(1110), 역양자화부(1120), 멀티-레졸루션 합성부(1130), 역 주파수 선형 예측 수행부(1140), 역 MDCT 적용부(1150), 변환부(1160), 대역폭 확장 복호화부(1170), 역변환부(1180) 및 밴드 합성부(1190)를 포함한다.Referring to FIG. 11, the audio data decoding apparatus performs
역다중화부(1100)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 역다중화부(1100)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(1100)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화(Context-dependent Bit plane decoding without decoding)의 정보, 신호 타입 정보(Signal type information), 주파수 선형 예측 및 벡터 양자화(Frequency-domain linear prediction and vector quantization)의 정보, 및 부호화된 대역폭 확장 정보 등이 있다.The
문맥-기반 비트플레인 복호화부(1110)는 문맥을 기반으로 부호화된 비트플레인을 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(1110)는 역다중화부(1100)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보, 및 스케일 팩터(scale factor)를 복원한다. 문맥-기반 비트플레인 복호화부(1110)는 Prejudice coding band mode 정보, Prejudice coding의 스케일 팩터, 및 Prejudice coding의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 decoding cosmetic 표시, 주파수 스펙트럼의 양자화 값을 출력한다.The context-based
역양자화부(1120)는 문맥-기반 비트플레인 복호화부(1110)에서 출력된 결과를 역양자화한다.The
멀티-레졸루션 합성부(1130)는 역양자화부(1120)에서 역양자화된 신호를 수신하여, 순간적으로 변하는 신호의 오디오 스펙트럼 계수에 대하여 멀티-레졸루션(Multi-resolution)을 처리한다. 구체적으로, 멀티-레졸루션 합성부(1130)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(1120)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(1130)는 reserve quantization spectrum/difference spectrum을 입력받아 reconstruction spectrum/difference spectrum을 출력한다.The
역 주파수 선형 예측 수행부(1140)는 멀티-레졸루션 합성부(1130)에서 출력된 결과와 역다중화부(1100)로부터 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(1140)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(1120)의 출력 또는 멀티-레졸루션 합성부(1130)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(1140)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(1140)은 difference spectrum 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.The inverse frequency linear
이와 같이, 문맥-기반 비트플레인 복호화부(1110), 역양자화부(1120), 멀티-레졸루션 합성부(1130) 및 역 주파수 선형 예측 수행부(1140)는 부호화된 저주파수 밴드 신호에 대해서 복호화를 수행하므로, 저주파수 밴드 복호화부라고 할 수 있다.As such, the context-based
역 MDCT 적용부(1150)는 부호화단에 대한 역변환 과정으로서 멀티-레졸루션 합성부(1130) 또는 역 주파수 선형예측 수행부(1140)에서 출력된 저주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역 MDCT 적용부(1150)는 멀티-레졸루션 합성부(1130) 또는 역 주파수 선형 예측 수행부(1140)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.The inverse
변환부(1160)는 역 MDCT 적용부(1150)에서 시간 도메인으로 변환된 저주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 변환부(1160)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다. 변환부(1160)에서 MDCT를 적용하여 실시할 수 없는 것은 아니지만 MDCT를 사용할 경우에는 도 10에 도시된 실시예가 보다 효율적이다.The
대역폭 확장 복호화부(1170)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 변환부(1160)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(1170)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.The
역변환부(1180)는 대역폭 확장 복호화부(1170)에서 복호화된 고주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 주파수 도메인 또는 시간-주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역변환부(1180)는 변환부(1160)에서 이용하는 동일한 변환 기법을 이용한다. 역변환부(1180)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다.The
밴드 합성부(1190)는 역 MDCT 적용부(1150)에서 시간 도메인으로 변환된 저 주파수 밴드 신호와 역변환부(1180)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성하여 출력단자 OUT을 통해 출력한다.The
도 12는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다. 12 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 12를 참조하면, 오디오 데이터 복호화 장치는 역다중화부(1200), 문맥-기반 비트플레인 복호화부(1210), 역양자화부(1220), 멀티-레졸루션 합성부(1230), 역 주파수 선형 예측 수행부(1240), 대역폭 확장 복호화부(1250), 밴드 합성부(1260) 및 역 MDCT 적용부(1270)를 포함한다.Referring to FIG. 12, the audio data decoding apparatus performs
역다중화부(1200)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 역다중화부(1200)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(1200)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화(Context-dependent Bit plane decoding without decoding)의 정보, 신호 타입 정보(Signal type information), 주파수 선형 예측 및 벡터 양자화(Frequency-domain linear prediction and vector quantization)의 정보, 및 부호화된 대역폭 확장 정보 등이 있다.The
문맥-기반 비트플레인 복호화부(1210)는 문맥을 기반으로 부호화된 비트플레인을 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(1210)는 역다중화부(1200)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행 하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보, 및 스케일 팩터(scale factor)를 복원한다. 문맥-기반 비트플레인 복호화부(1210)는 Prejudice coding band mode 정보, Prejudice coding의 스케일 팩터, 및 Prejudice coding의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 decoding cosmetic 표시, 주파수 스펙트럼의 양자화 값을 출력한다.The context-based
역양자화부(1220)는 문맥-기반 비트플레인 복호화부(1210)에서 출력된 결과를 역양자화한다.The
멀티-레졸루션 합성부(1230)는 역양자화부(1220)에서 역양자화된 결과를 수신하여, 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션(Multi-resolution)을 처리한다. 구체적으로, 멀티-레졸루션 합성부(1230)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(1220)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(1230)는 reserve quantization spectrum/difference spectrum을 입력받아 reconstruction spectrum/difference spectrum을 출력한다.The
역 주파수 선형 예측 수행부(1240)는 멀티-레졸루션 합성부(1230)에서 출력된 결과와 역다중화부(1200)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(1240)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(1220)의 출력 또는 멀티-레졸루션 합성부(1230)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(1240)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(1240)은 difference spectrum 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.The inverse frequency linear
이와 같이, 문맥-기반 비트플레인 복호화부(1210), 역양자화부(1220), 멀티-레졸루션 합성부(1230) 및 역 주파수 선형 예측 수행부(1240)는 부호화된 저주파수 밴드 신호에 대해서 복호화를 수행하므로, 저주파수 밴드 복호화부라고 할 수 있다.As such, the context-based
대역폭 확장 복호화부(1250)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 멀티-레졸루션 합성부(1230) 또는 역 주파수 선형 예측 수행부(1240)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(1250)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.The
밴드 합성부(1260)는 멀티-레졸루션 합성부(1230) 또는 역 주파수 선형 예측 수행부(1240)에서 출력된 저주파수 밴드 신호와 대역폭 확장 복호화부(1250)에서 생성된 고주파수 밴드 신호를 합성한다.The
역 MDCT 적용부(1270)는 밴드 합성부(1260)에서 출력된 신호를 역 MDCT(inverse MDCT)에 의해 주파수 도메인에서 시간 도메인으로 역변환하여 출력단자 OUT을 통해 출력한다. 여기서, 역 MDCT 적용부(1270)는 역 주파수 선형 예측 수행부(1240)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.The inverse
도 13은 본 발명의 일 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다. 13 is a flowchart illustrating a method of encoding an audio signal according to an embodiment of the present invention.
도 13을 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 4에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 4에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.Referring to FIG. 13, the audio signal encoding method according to the present embodiment includes steps that are processed in time series in the audio signal encoding apparatus shown in FIG. 4. Therefore, even if omitted below, the above description of the audio signal encoding apparatus shown in FIG. 4 is also applied to the audio signal encoding method according to the present embodiment.
1300 단계에서 밴드 분할부(400)는 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할한다.In
1310 단계에서 제1 및 제2 MDCT 적용부(410, 460)는 고주파수 밴드 신호 및 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, 상기 제1 및 제2 MDCT 적용부(410, 460)는 고주파수 밴드 신호 및 저주파수 밴드 신호에 대하여 MDCT(Modified Discrete Cosine Transform)를 수행하여 각각 시간 도메인에서 주파수 도메인으로 변환할 수 있다.In
1320 단계에서 저주파수 밴드 부호화부는 변환된 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다. 여기서, 저주파수 밴드 부호 화부는 주파수 선형 예측 수행부(420), 멀티-레졸루션 분석부(430), 양자화부(440) 및 문맥-기반 비트플레인 부호화부(450)를 포함할 수 있다. 구체적으로, 주파수 선형 예측 수행부(420)는 변환된 저주파수 밴드 신호의 특성에 따라 주파수 선형 예측을 수행하여 필터링하고, 멀티-레졸루션 분석부(430)는 변환된 저주파수 밴드 신호 또는 필터링된 신호의 특성에 따라 멀티-레졸루션(multi-resolution)으로 분석한다. 또한, 양자화부(440)는 멀티-레졸루션으로 분석된 신호를 양자화하고, 문맥-기반 비트플레인 부호화부(450)는 양자화된 신호를 문맥을 기반으로 하여 비트플레인으로 부호화한다.In
1330 단계에서 대역폭 확장 부호화부(470)는 변환된 저주파수 밴드 신호를 이용하여 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다.In
1340 단계에서 다중화부(480)는 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.In
도 14는 본 발명의 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.14 is a flowchart illustrating a method of encoding an audio signal according to another embodiment of the present invention.
도 14를 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 5에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 5에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.Referring to FIG. 14, the method of encoding an audio signal according to the present embodiment includes the steps of time-series processing in the apparatus for encoding an audio signal illustrated in FIG. 5. Therefore, even if omitted below, the above description of the audio signal encoding apparatus shown in FIG. 5 is also applied to the audio signal encoding method according to the present embodiment.
1400 단계에서 밴드 분할부(500)는 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할한다.In
1410 단계에서 MDCT 적용부(510)는 저주파수 밴드 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환한다.In
1420 단계에서 저주파수 밴드 부호화부는 MDCT가 수행된 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다. 여기서, 저주파수 밴드 부호화부는 주파수 선형 예측 수행부(520), 멀티-레졸루션 분석부(530), 양자화부(540) 및 문맥-기반 비트플레인 부호화부(550)를 포함할 수 있다. 구체적으로, 주파수 선형 예측 수행부(520)는 변환된 저주파수 밴드 신호의 특성에 따라 주파수 선형 예측을 수행하여 필터링하고, 멀티-레졸루션 분석부(530)는 변환된 저주파수 밴드 신호 또는 필터링된 신호의 특성에 따라 멀티-레졸루션(multi-resolution)으로 분석한다. 또한, 양자화부(540)는 멀티-레졸루션으로 분석된 신호를 양자화하고, 문맥-기반 비트플레인 부호화부(550)는 양자화된 신호를 문맥을 기반으로 하여 비트플레인으로 부호화한다.In
1430 단계에서 저주파수 밴드 변환부(560) 및 고주파수 밴드 변환부(570)는 고주파수 밴드 신호 및 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다.In
1440 단계에서 대역폭 확장 부호화부(580)는 변환된 저주파수 밴드 신호를 이용하여 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다.In
1450 단계에서 다중화부(590)는 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.In
도 15는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.15 is a flowchart illustrating a method of encoding an audio signal according to another embodiment of the present invention.
도 15를 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 6에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 6에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.Referring to FIG. 15, an audio signal encoding method according to the present embodiment includes steps that are processed in time series in an audio signal encoding apparatus of FIG. 6. Therefore, even if omitted below, the above description of the audio signal encoding apparatus shown in FIG. 6 is also applied to the audio signal encoding method according to the present embodiment.
1500 단계에서 MDCT 적용부(600)는 입력 신호를 시간 도메인에서 주파수 도메인으로 변환한다. 구체적으로, MDCT 적용부(600)는 입력 신호에 대하여 MDCT를 수행하여 입력 신호를 시간 도메인에서 주파수 도메인으로 변환할 수 있다.In
1510 단계에서 밴드 분할부(610)는 변환된 입력 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할한다.In
1520 단계에서 저주파수 밴드 부호화부는 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다. 여기서, 저주파수 밴드 부호화부는 주파수 선형 예측 수행부(620), 멀티-레졸루션 분석부(630), 양자화부(640) 및 문맥-기반 비트플레인 부호화부(650)를 포함할 수 있다. 구체적으로, 주파수 선형 예측 수행부(620)는 변환된 저주파수 밴드 신호의 특성에 따라 주파수 선형 예측을 수행하여 필터링하고, 멀티-레졸루션 분석부(630)는 변환된 저주파수 밴드 신호 또 는 필터링된 신호의 특성에 따라 멀티-레졸루션(multi-resolution)으로 분석한다. 또한, 양자화부(640)는 멀티-레졸루션으로 분석된 신호를 양자화하고, 문맥-기반 비트플레인 부호화부(650)는 양자화된 신호를 문맥을 기반으로 하여 비트플레인으로 부호화한다.In
1530 단계에서 대역폭 확장 부호화부(660)는 저주파수 밴드 신호를 이용하여 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다.In
1540 단계에서 다중화부(670)는 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.In
도 16은 본 발명의 일 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.16 is a flowchart illustrating a method of decoding an audio signal according to an embodiment of the present invention.
도 16을 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 10에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 10에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.Referring to FIG. 16, an audio signal decoding method according to the present embodiment includes steps processed in time series in an audio signal decoding apparatus illustrated in FIG. 10. Therefore, even if omitted below, the above description of the audio signal decoding apparatus shown in FIG. 10 is also applied to the audio signal decoding method according to the present embodiment.
1600 단계에서 역다중화부(1000)는 오디오 신호가 부호화된 결과를 입력받는다. 여기서, 부호화된 결과는 저주파수 밴드에 대하여 문맥을 기반으로 부호화된 비트플레인 및 부호화된 대역폭 확장 정보 등을 포함한다.In
1610 단계에서 저주파수 밴드 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역다중화하여 저주파수 밴드 신호를 생성한다. 여기서, 저주파 수 밴드 복호화부는 문맥-기반 비트플레인 복호화부(1010), 역양자화부(1020), 멀티-레졸루션 합성부(1030) 및 역 주파수 선형 예측 수행부(1040)를 포함할 수 있다. 구체적으로, 문맥-기반 비트플레인 복호화부(1010)는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인을 복호화하고, 역양자화부(1020)는 복호화된 신호를 역양자화한다. 또한, 멀티-레졸루션 합성부(1030)는 부호화단에서 멀티-레졸루션 분석이 수행된 경우 역양자화된 신호를 멀티-레졸루션으로 합성하고, 역 주파수 선형 예측 수행부(1040)는 부호화단에서 주파수 선형 예측이 수행된 경우 벡터 인덱스를 이용하여 부호화단에서 주파수 선형 예측이 수행된 결과를 양자화된 신호 또는 멀티-레졸루션 합성된 신호에 합성한다.In
1620 단계에서 대역폭 확장 복호화부(1050)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다.In
1630 단계에서 제1 및 제2 역 MDCT 적용부(1060, 1070)는 저주파수 밴드 신호 및 고주파수 밴드 신호 각각에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환한다.In
1640 단계에서 밴드 합성부(1080)는 변환된 저주파수 밴드 신호 및 변환된 고주파수 밴드 신호를 합성한다.In
도 17은 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.17 is a flowchart illustrating a method of decoding an audio signal according to another embodiment of the present invention.
도 17을 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 11에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 11에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.Referring to FIG. 17, an audio signal decoding method according to the present embodiment includes steps that are processed in time series in an audio signal decoding apparatus illustrated in FIG. 11. Therefore, even if omitted below, the above description of the audio signal decoding apparatus shown in FIG. 11 is also applied to the audio signal decoding method according to the present embodiment.
1700 단계에서 역다중화부(1100)는 오디오 신호가 부호화된 결과를 입력받는다. 여기서, 부호화된 결과는 저주파수 밴드에 대하여 문맥을 기반으로 부호화된 비트플레인 및 부호화된 대역폭 확장 정보 등을 포함한다.In
1710 단계에서 저주파수 밴드 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성한다. 여기서, 저주파수 밴드 복호화부는 문맥-기반 비트플레인 복호화부(1110), 역양자화부(1120), 멀티-레졸루션 합성부(1130) 및 역 주파수 선형 예측 수행부(1140)를 포함할 수 있다. 구체적으로, 문맥-기반 비트플레인 복호화부(1110)는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인을 복호화하고, 역양자화부(1120)는 복호화된 신호를 역양자화한다. 또한, 멀티-레졸루션 합성부(1130)는 부호화단에서 멀티-레졸루션 분석이 수행된 경우 역양자화된 신호를 멀티-레졸루션으로 합성한다. 그리고, 역 주파수 선형 예측 수행부(1140)는 부호화단에서 주파수 선형 예측이 수행된 경우 벡터 인덱스를 이용하여 부호화단에서 주파수 선형 예측이 수행된 결과를 역양자화된 신호 또는 멀티-레졸루션 합성된 신호에 합성한다.In
1720 단계에서 역 MDCT 적용부(1150)는 저주파수 밴드 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환한다.In
1730 단계에서 변환부(1160)는 역 MDCT가 수행된 저주파수 밴드 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환한다.In
1740 단계에서 대역폭 확장 복호화부(1170)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 주파수 도메인 또는 시간/주파수 도메인으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다.In
1750 단계에서 역변환부(1180)는 고주파수 밴드 신호를 시간 도메인으로 역변환한다.In
1760 단계에서 밴드 합성부(1190)는 역변환된 고주파수 밴드 신호 및 변환된 저주파수 밴드 신호를 합성한다.In
도 18은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.18 is a flowchart illustrating a method of decoding an audio signal according to another embodiment of the present invention.
도 18을 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 12에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 12에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.Referring to FIG. 18, an audio signal decoding method according to the present embodiment includes steps processed in time series in an audio signal decoding apparatus shown in FIG. 12. Therefore, even if omitted below, the above description of the audio signal decoding apparatus shown in FIG. 12 is also applied to the audio signal decoding method according to the present embodiment.
1800 단계에서 역다중화부(1200)는 오디오 신호가 부호화된 결과를 입력받는다. 여기서, 부호화된 결과는 저주파수 밴드에 대하여 문맥을 기반으로 부호화된 비트플레인 및 부호화된 대역폭 확장 정보 등을 포함한다.In
1810 단계에서 저주파수 밴드 복호화부는 부호화된 비트플레인을 문맥을 기 반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성한다. 여기서, 저주파수 밴드 복호화부는 문맥-기반 비트플레인 복호화부(1210), 역양자화부(1220), 멀티-레졸루션 합성부(1230) 및 역 주파수 선형 예측 수행부(1240)를 포함할 수 있다. 구체적으로, 문맥-기반 비트플레인 복호화부(1210)는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인을 복호화하고, 역양자화부(1220)는 복호화된 신호를 역양자화한다. 또한, 멀티-레졸루션 합성부(1230)는 부호화단에서 멀티-레졸루션 분석이 수행된 경우 역양자화된 신호를 멀티-레졸루션으로 합성한다. 그리고, 역 주파수 선형 예측 수행부(1240)는 부호화단에서 주파수 선형 예측이 수행된 경우 벡터 인덱스를 이용하여 부호화단에서 주파수 선형 예측이 수행된 결과를 역양자화된 신호 또는 멀티-레졸루션 합성된 신호에 합성한다.In
1820 단계에서 대역폭 확장 복호화부(1250)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다.In
1830 단계에서 밴드 합성부(1260)는 저주파수 밴드 신호 및 고주파수 밴드 신호를 합성한다.In
1840 단계에서 역 MDCT 적용부(1270)는 합성된 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환한다.In
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.The present invention is not limited to the above-described embodiment, and of course, modifications may be made by those skilled in the art within the spirit of the present invention.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, hard disk, floppy disk, flash memory, optical data storage device, and also carrier waves (for example, transmission over the Internet). It also includes the implementation in the form of. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
도 1은 본 발명의 일 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다. 1 is a block diagram illustrating an apparatus for encoding an audio signal according to an embodiment of the present invention.
도 2는 본 발명의 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.2 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 3은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.3 is a block diagram showing an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 4는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다. 4 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 5는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.5 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 6은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.6 is a block diagram illustrating an apparatus for encoding an audio signal according to another embodiment of the present invention.
도 7은 본 발명의 일 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.7 is a block diagram illustrating an apparatus for decoding an audio signal according to an embodiment of the present invention.
도 8은 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.8 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 9는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.9 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 10은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나 타내는 블록도이다.10 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 11은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.11 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 12는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.12 is a block diagram illustrating an apparatus for decoding an audio signal according to another embodiment of the present invention.
도 13는 본 발명의 일 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다. 13 is a flowchart illustrating a method of encoding an audio signal according to an embodiment of the present invention.
도 14는 본 발명의 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.14 is a flowchart illustrating a method of encoding an audio signal according to another embodiment of the present invention.
도 15는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.15 is a flowchart illustrating a method of encoding an audio signal according to another embodiment of the present invention.
도 16은 본 발명의 일 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.16 is a flowchart illustrating a method of decoding an audio signal according to an embodiment of the present invention.
도 17은 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.17 is a flowchart illustrating a method of decoding an audio signal according to another embodiment of the present invention.
도 18은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.18 is a flowchart illustrating a method of decoding an audio signal according to another embodiment of the present invention.
Claims (43)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/856,221 US20080071550A1 (en) | 2006-09-18 | 2007-09-17 | Method and apparatus to encode and decode audio signal by using bandwidth extension technique |
PCT/KR2007/004484 WO2008035886A1 (en) | 2006-09-18 | 2007-09-18 | Method and apparatus to encode and decode audio signal by using bandwidth extension technique |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20060090152 | 2006-09-18 | ||
KR1020060090152 | 2006-09-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080025636A true KR20080025636A (en) | 2008-03-21 |
KR101346358B1 KR101346358B1 (en) | 2013-12-31 |
Family
ID=39297493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070079781A KR101346358B1 (en) | 2006-09-18 | 2007-08-08 | Method and apparatus for encoding and decoding audio signal using band width extension technique |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101346358B1 (en) |
CN (1) | CN101162584A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112086102A (en) * | 2020-08-31 | 2020-12-15 | 腾讯音乐娱乐科技(深圳)有限公司 | Method, apparatus, device and storage medium for extending audio frequency band |
CN112309408A (en) * | 2020-11-10 | 2021-02-02 | 北京百瑞互联技术有限公司 | Method, device and storage medium for expanding LC3 audio encoding and decoding bandwidth |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3300076B1 (en) * | 2008-07-11 | 2019-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and audio decoder |
AU2011287747B2 (en) * | 2010-07-20 | 2015-02-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an optimized hash table |
KR101826331B1 (en) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | Apparatus and method for encoding and decoding for high frequency bandwidth extension |
RU2464649C1 (en) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Audio signal processing method |
CN104025190B (en) | 2011-10-21 | 2017-06-09 | 三星电子株式会社 | Energy lossless coding method and equipment, audio coding method and equipment, energy losslessly encoding method and equipment and audio-frequency decoding method and equipment |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
CN111312278B (en) | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | Method and apparatus for high frequency decoding of bandwidth extension |
US10468035B2 (en) | 2014-03-24 | 2019-11-05 | Samsung Electronics Co., Ltd. | High-band encoding method and device, and high-band decoding method and device |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
CN104715756A (en) * | 2015-02-10 | 2015-06-17 | 百度在线网络技术(北京)有限公司 | Audio data processing method and device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2388502A (en) | 2002-05-10 | 2003-11-12 | Chris Dunn | Compression of frequency domain audio signals |
KR100561869B1 (en) | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | Lossless audio decoding/encoding method and apparatus |
-
2007
- 2007-08-08 KR KR1020070079781A patent/KR101346358B1/en not_active IP Right Cessation
- 2007-09-18 CN CNA2007101533639A patent/CN101162584A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112086102A (en) * | 2020-08-31 | 2020-12-15 | 腾讯音乐娱乐科技(深圳)有限公司 | Method, apparatus, device and storage medium for extending audio frequency band |
CN112086102B (en) * | 2020-08-31 | 2024-04-16 | 腾讯音乐娱乐科技(深圳)有限公司 | Method, apparatus, device and storage medium for expanding audio frequency band |
CN112309408A (en) * | 2020-11-10 | 2021-02-02 | 北京百瑞互联技术有限公司 | Method, device and storage medium for expanding LC3 audio encoding and decoding bandwidth |
Also Published As
Publication number | Publication date |
---|---|
CN101162584A (en) | 2008-04-16 |
KR101346358B1 (en) | 2013-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101346358B1 (en) | Method and apparatus for encoding and decoding audio signal using band width extension technique | |
KR101435893B1 (en) | Method and apparatus for encoding and decoding audio signal using band width extension technique and stereo encoding technique | |
JP6208725B2 (en) | Bandwidth extension decoding device | |
US9728196B2 (en) | Method and apparatus to encode and decode an audio/speech signal | |
KR101393298B1 (en) | Method and Apparatus for Adaptive Encoding/Decoding | |
KR100721537B1 (en) | Apparatus and Method for Highband Coding of Splitband Wideband Speech Coder | |
KR20140120286A (en) | Method and apparatus for decoding high frequency signal | |
KR20080044707A (en) | Method and apparatus for encoding and decoding audio/speech signal | |
KR101837083B1 (en) | Method for decoding of audio signal and apparatus for decoding thereof | |
KR20070012194A (en) | Scalable speech coding/decoding methods and apparatus using mixed structure | |
US20080077412A1 (en) | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding | |
KR20090043983A (en) | Apparatus and method for encoding and decoding high frequency signal | |
US20080140393A1 (en) | Speech coding apparatus and method | |
US20080071550A1 (en) | Method and apparatus to encode and decode audio signal by using bandwidth extension technique | |
KR20070121558A (en) | Method and apparatus for encoding and decoding adaptive high frequency band | |
KR20080053739A (en) | Apparatus and method for encoding and decoding by applying to adaptive window size | |
KR101403340B1 (en) | Method and apparatus for transcoding | |
KR101457897B1 (en) | Method and apparatus for encoding and decoding bandwidth extension | |
KR101449432B1 (en) | Method and apparatus for encoding and decoding signal | |
US20090006081A1 (en) | Method, medium and apparatus for encoding and/or decoding signal | |
KR20120089230A (en) | Apparatus for decoding a signal | |
KR20130012972A (en) | Method of encoding audio/speech signal | |
KR20080046089A (en) | Method and system of scalable encoding/decoding audio/speech signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |