KR20080023618A - Audio encoding and decoding apparatus and method using warped linear prediction coding - Google Patents
Audio encoding and decoding apparatus and method using warped linear prediction coding Download PDFInfo
- Publication number
- KR20080023618A KR20080023618A KR1020070026820A KR20070026820A KR20080023618A KR 20080023618 A KR20080023618 A KR 20080023618A KR 1020070026820 A KR1020070026820 A KR 1020070026820A KR 20070026820 A KR20070026820 A KR 20070026820A KR 20080023618 A KR20080023618 A KR 20080023618A
- Authority
- KR
- South Korea
- Prior art keywords
- error
- masking threshold
- encoding
- signal
- error signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000000873 masking effect Effects 0.000 claims abstract description 173
- 230000005236 sound signal Effects 0.000 claims abstract description 25
- 238000005192 partition Methods 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000012856 packing Methods 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims 2
- 230000008569 process Effects 0.000 abstract description 23
- 230000006835 compression Effects 0.000 abstract description 4
- 238000007906 compression Methods 0.000 abstract description 4
- 230000002123 temporal effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 1 은 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 부호화 장치의 일실시예 구성도,1 is a configuration diagram of an audio encoding apparatus using modified linear prediction encoding according to the present invention;
도 2 는 본 발명에 적용되는 변형 선형예측 부호화를 이용한 오디오 부호화 방법 중에서 원 신호에 대한 마스킹 임계치에서 오차 신호에 대한 마스킹 임계치를 추출하는 과정에 대한 일실시예 설명도,FIG. 2 is a diagram for explaining a process of extracting a masking threshold for an error signal from a masking threshold for an original signal in an audio encoding method using modified linear prediction coding according to the present invention;
도 3 은 본 발명에 적용되는 변형 이산코사인 변환 과정과 심리음향 모델 과정에서의 입력 프레임에 대한 일실시예 설명도,3 is a diagram illustrating an embodiment of an input frame in a modified discrete cosine transform process and a psychoacoustic model process applied to the present invention;
도 4 는 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 복호화 장치의 일실시예 구성도이다.4 is a configuration diagram of an audio decoding apparatus using modified linear prediction encoding according to the present invention.
* 도면의 주요 부분에 대한 부호 설명* Explanation of symbols on the main parts of the drawing
110: 변형 선형예측 부호화부 120: 변형 이산코사인 변환부110: modified linear prediction encoder 120: modified discrete cosine transform unit
130: 심리음향 모델부 131: 제 1 마스킹 임계치 계산부130: psychoacoustic model unit 131: first masking threshold calculation unit
132: 제 2 마스킹 임계치 계산부 140: 지각적 부호화부132: second masking threshold calculator 140: perceptual encoder
150: 비트스트림 패킹부 410: 비트스트림 추출부150: bitstream packing unit 410: bitstream extracting unit
420: 지각적 복호화부 430: 역 변형 이산코사인 변환부420: perceptual decoding unit 430: inverse transform discrete cosine transform unit
440: 변형 선형예측 복호화부440: modified linear prediction decoder
본 발명은 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 입력된 오디오 신호를 선형예측 부호화해서 구한 오차 신호를 그 오차 신호의 마스킹 임계치(이하, 오차 마스킹 임계치)를 이용하여 부호화하고, 부호화된 비트열을 복호화해서 구한 오차 신호를 선형예측 부호화정보(선형 예측 분석 계수)를 이용하여 선형예측 복호화함으로써, 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는, 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법에 관한 것이다.The present invention relates to an audio encoding and decoding apparatus using modified linear predictive encoding, and more particularly, to an error signal obtained by linear predictive encoding of an input audio signal and a masking threshold of the error signal (hereinafter, referred to as an error masking threshold). ), And the linearly predictive decoding of the error signal obtained by decoding the encoded bit stream using linear predictive encoding information (linear prediction analysis coefficient), thereby improving the compression efficiency of audio encoding. The present invention relates to an audio encoding and decoding apparatus using predictive encoding and a method thereof.
오디오 코덱을 위한 표준화 기구인 ISO(International Organization for Standardization)/IEC(International Electrotechnical Commission)의 MPEG(Moving Picture Experts Group)은 'MPEG-1/2 Layer III', 'MPEG-2/4 AAC', 'MPEG-4 HE-AAC', 및 'BSAC'와 같은 표준안을 개발하였다. 이러한 표준안들은 공통으로 주파수 영역에서 심리음향 모델(PAM: Psychoacoustics Model)을 적용하여 신호의 중복성을 최소화하고 엔트로피(Entropy) 부호화를 포함한다.The Moving Picture Experts Group (MPEG) of the International Organization for Standardization (ISO) / International Electrotechnical Commission (IEC), a standardization body for audio codecs, is known as the 'MPEG-1 / 2 Layer III', Standards such as MPEG-4 HE-AAC ', and' BSAC 'have been developed. These standards commonly apply a psychoacoustic model (PAM) in the frequency domain to minimize signal redundancy and include entropy coding.
예외적으로, 예측을 통한 코덱 기술은 일부 프레임의 신호를 시간 영역에서 부호화할 경우에 예측을 통하여 신호의 중복성을 제거할 때의 이득을 고려하여 예측을 통한 부호화를 수행할지 여부를 결정한 후 부호화를 수행하게 된다. In exceptional cases, the codec technique through prediction determines whether to perform encoding through prediction in consideration of a gain when removing signal redundancy through prediction when encoding a signal of some frames in the time domain. Done.
한편, 일반적인 오디오 신호의 경우 다양한 음원이 서로 혼합되어 존재한다. 그래서 단일 음원 신호(주기적인 신호)에 적합한 시간 영역에서의 예측을 통한 부호화는 주로 사용되지 않고 있다. 시간 영역에서의 예측을 통한 코덱 기술은 일부 특정한 프레임의 예측 이득이 높을 때 대하여 제한적으로 사용되고 있다. 이에 반하여, 종래의 주파수 영역에서의 코덱 방법은 대부분 주파수 영역에서 특히 저주파수 영역에서의 신호의 집중성(Compactness)이 높으므로 주파수 영역에서의 코덱 방법을 통하여 높은 코덱 이득을 얻을 수가 있다.Meanwhile, in the case of a general audio signal, various sound sources are mixed with each other. Therefore, encoding through prediction in the time domain suitable for a single sound source signal (periodic signal) is not mainly used. Codec technology through prediction in the time domain is used in a limited way when the prediction gain of some specific frames is high. In contrast, the conventional codec method in the frequency domain has a high compaction of signals in the frequency domain, particularly in the low frequency domain, so that a high codec gain can be obtained through the codec method in the frequency domain.
하지만, 종래의 주파수 영역에서의 코덱 기술은 심리음향 모델에서 마스킹 임계치를 계산하기 위해서, 주파수 영역으로 변환을 위한 고속 푸리에 변환(FFT: Fast Fourier Transform), 마스킹 특성을 적용하는 스프레딩(Spreading) 함수의 처리, 프레임 간 선형 예측을 통한 토널리티(Tonality) 처리 등이 수행되어 많은 계산 과정이 요구된다. 그리고 심리음향 모델에서의 고속 푸리에 변환 과정과는 별도로 주파수 영역에서의 신호 처리를 위해 시간 영역 신호에 대하여 변환 이산코사인 변환과정을 수행한다. 이러한 종래의 코덱 기술은 심리음향 모델을 통해 고품질로 오디오 압축을 수행할 수 있지만, 데이터의 복잡한 처리 과정과 연산량이 증가한다는 문제점이 있다.However, the conventional codec technique in the frequency domain has a Fast Fourier Transform (FFT) for transforming into the frequency domain and a spreading function that applies masking characteristics to calculate the masking threshold in the psychoacoustic model. Processing, tonality processing through linear inter-frame prediction, etc. are performed, requiring a lot of calculation processes. In addition to the fast Fourier transform in the psychoacoustic model, transform discrete cosine transform is performed on the time-domain signal for signal processing in the frequency domain. Such a conventional codec technology can perform audio compression at high quality through a psychoacoustic model, but there is a problem in that a complicated processing process and a calculation amount of data are increased.
본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 입력된 오디오 신호를 선형예측 부호화해서 구한 오차 신호를 그 오차 신호의 마스킹 임계치(이하, 오차 마스킹 임계치)를 이용하여 부호화하고, 부호화된 비트열을 복호화해서 구한 오차 신호를 선형예측 부호화정보(선형 예측 분석 계수)를 이용하여 선형예측 복호화함으로써, 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는, 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화 장치 및 그 방법을 제공하는데 그 목적이 있다.The present invention has been proposed to solve the above problems, and an error signal obtained by linear predictive encoding of an input audio signal is encoded using a masking threshold of the error signal (hereinafter, referred to as an error masking threshold), and the encoded bit string is encoded. An apparatus and method for audio encoding and decoding using modified linear prediction encoding, by which linear prediction decoding of the error signal obtained by decoding is performed using linear prediction encoding information (linear prediction analysis coefficient), thereby improving the compression efficiency of audio encoding. The purpose is to provide.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.Other objects and advantages of the present invention can be understood by the following description, and will be more clearly understood by the embodiments of the present invention. It will also be appreciated that the objects and advantages of the present invention may be realized by the means and combinations thereof indicated in the claims.
상기 목적을 달성하기 위한 본 발명은, 변형 선형예측 부호화를 이용한 오디오 부호화 장치에 있어서, 외부로부터 입력된 오디오 신호(원신호)를 시간 영역에서 선형예측 부호화하여 오차 신호를 구하기 위한 오차 신호 계산 수단; 상기 오차 신호 계산 수단에서 구한 오차 신호를 주파수 영역 신호로 변환하기 위한 주파수 영역 변환 수단; 상기 원신호와 상기 원신호의 선형예측 부호화에 사용된 부호화 정보를 이용해서, 상기 오차 신호의 부호화에 사용되는 마스킹 임계치를 구하기 위한 마스킹 임계치 계산 수단; 및 상기 주파수 영역 변환 수단에서 변환된 오차 신호를 상기 구한 마스킹 임계치를 이용하여 지각적 부호화하기 위한 지각적 부호화 수단을 포함한다.According to an aspect of the present invention, there is provided an audio encoding apparatus using modified linear predictive encoding, comprising: error signal calculating means for obtaining an error signal by linearly predicting an audio signal (original signal) input from the outside in a time domain; Frequency domain conversion means for converting the error signal obtained by the error signal calculation means into a frequency domain signal; Masking threshold calculation means for obtaining a masking threshold value used for encoding the error signal using the original signal and encoding information used for linear prediction encoding of the original signal; And perceptual encoding means for perceptually encoding the error signal converted by the frequency domain transforming means using the obtained masking threshold.
한편, 본 발명은, 변형 선형예측 부호화를 이용한 오디오 복호화 장치에 있어서, 외부로부터 전달된 전체 비트스트림 중에서 현재 프레임에 해당하는 비트열을 추출하기 위한 비트스트림 추출 수단; 상기 비트 스트림 추출 수단에서 추출된 비트열을 지각적 복호화하여 현재 프레임의 오차 신호와 선형예측 부호화에 사용된 부호화 정보를 구하기 위한 지각적 복호화 수단; 상기 복호화 수단에서 구해진 오차 신호를 시간 영역의 오차 신호로 변환하기 위한 오차신호 변환 수단; 및 상기 오차신호 변환 수단에서 변환된 오차 신호를 상기 지각적 복호화 수단에서 구해진 선형예측 부호화에 사용된 부호화 정보를 이용해 복원하여 오디오 신호를 생성하기 위한 변형 선형예측 복호화 수단을 포함한다.On the other hand, the present invention provides an audio decoding apparatus using modified linear prediction encoding, comprising: bitstream extracting means for extracting a bit string corresponding to a current frame from all bitstreams transmitted from the outside; Perceptual decoding means for perceptually decoding the bit stream extracted by the bit stream extracting means to obtain the error signal of the current frame and the encoding information used for the linear prediction encoding; Error signal conversion means for converting the error signal obtained by the decoding means into an error signal in a time domain; And modified linear predictive decoding means for generating an audio signal by reconstructing the error signal converted by the error signal converting means using the encoding information used in the linear predictive encoding obtained by the perceptual decoding means.
한편, 본 발명은, 변형 선형예측 부호화를 이용한 오디오 부호화 방법에 있어서, 외부로부터 입력된 오디오 신호(원신호)를 시간 영역에서 선형예측 부호화하여 오차 신호를 구하는 오차 신호 계산 단계; 상기 오차 신호 계산 단계에서 구한 오차 신호를 주파수 영역 신호로 변환하는 주파수 영역 변환 단계; 상기 원신호와 상기 원신호의 선형예측 부호화에 사용된 부호화 정보를 이용해서, 상기 오차 신호의 부호화에 사용되는 마스킹 임계치를 구하는 마스킹 임계치 계산 단계; 및 상기 주파수 영역 변환 단계에서 변환된 오차 신호를 상기 구한 마스킹 임계치를 이용하 여 지각적 부호화하는 지각적 부호화 단계를 포함한다.On the other hand, the present invention is an audio encoding method using modified linear prediction encoding, comprising: an error signal calculation step of obtaining an error signal by linearly predicting and encoding an audio signal (original signal) input from the outside in a time domain; A frequency domain conversion step of converting the error signal obtained in the error signal calculation step into a frequency domain signal; A masking threshold calculation step of calculating a masking threshold value used for encoding the error signal using the original signal and encoding information used for linear prediction encoding of the original signal; And a perceptual encoding step of perceptually encoding the error signal converted in the frequency domain transforming step using the masking threshold value obtained.
한편, 본 발명은, 변형 선형예측 부호화를 이용한 오디오 복호화 방법에 있어서, 외부로부터 전달된 전체 비트스트림 중에서 현재 프레임에 해당하는 비트열을 추출하는 비트스트림 추출 단계; 상기 비트 스트림 추출 단계에서 추출된 비트열을 지각적 복호화하여 현재 프레임의 오차 신호와 선형예측 부호화에 사용된 부호화 정보를 구하는 지각적 복호화 단계; 상기 복호화 단계에서 구해진 오차 신호를 시간 영역의 오차 신호로 변환하는 오차신호 변환 단계; 및 상기 오차신호 변환 단계에서 변환된 오차 신호를 상기 지각적 복호화 단계에서 구해진 선형예측 부호화에 사용된 부호화 정보를 이용해 복원하여 오디오 신호를 생성하는 변형 선형예측 복호화 단계를 포함한다.On the other hand, the present invention, in the audio decoding method using the modified linear prediction coding, Bitstream extraction step of extracting a bit string corresponding to the current frame from the entire bitstream transmitted from the outside; A perceptual decoding step of perceptually decoding the bit stream extracted in the bit stream extraction step to obtain the error signal of the current frame and the encoding information used for the linear prediction encoding; An error signal conversion step of converting the error signal obtained in the decoding step into an error signal in a time domain; And a modified linear prediction decoding step of generating an audio signal by reconstructing the error signal converted in the error signal conversion step using the encoding information used in the linear prediction encoding obtained in the perceptual decoding step.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings, whereby those skilled in the art may easily implement the technical idea of the present invention. There will be. In addition, in describing the present invention, when it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1 은 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 부호화 장치의 일실시예 구성도이다. 1 is a configuration diagram of an audio encoding apparatus using modified linear prediction encoding according to the present invention.
도 1에 도시된 바와 같이, 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 부호화 장치는 변형 선형예측 부호화부(110), 변형 이산코사인 변환부(120), 심리음향 모델부(130), 지각적 부호화부(140) 및 비트스트림 패킹부(150)를 포함한다. 여기서, 심리음향 모델부(130)는 제 1 마스킹 임계치 계산부(131)와 제 2 마스킹 임계치 계산부(132)를 포함한다.As shown in FIG. 1, an audio encoding apparatus using modified linear prediction encoding according to the present invention includes a modified linear
상기 변형 선형예측 부호화부(110)는 현재 프레임에서 소정크기의 한 블록을 부호화하기 위해, 현재 블록에 대하여 변형 선형예측 부호화(Warped Linear Prediction Coding) 필터를 통과시켜서 추정치를 뺀 잔여 성분을 구한다. 여기서, 잔여 성분은 추정치와 비교하여 PCM 오디오 신호의 오차 신호를 의미한다. 즉, 변형 선형예측 부호화부(110)는 외부로부터 입력된 PCM(Pulse Code Modulation) 오디오 신호(원신호)를 시간 영역에서 변형 선형예측 부호화하여 오차 신호를 구한다. 변형 선형예측 부호화부(110)는 이러한 오차 신호를 변형 이산코사인 변환부(120)로 전달한다.In order to encode a block of a predetermined size in the current frame, the modified
상기 변형 선형예측 부호화부(110)는 부호화 정보(변형 선형예측 부호화의 분석 계수(Analysis Coefficients))를 구하고, 이 분석 계수들을 심리음향 모델부(130)로 전달한다. 변형 선형예측 부호화의 분석 계수는 변형 선형예측 부호화의 합성 필터의 분석 계수가 될 수 있다. 이러한 분석 계수는 심리음향 모델부(130)에서 마스킹 임계치의 정규화에 이용된다. The modified
상기 변형 이산코사인 변환부(120)는 변형 선형예측 부호화부(110)로부터 전달된 오차 신호에 대해 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform)을 수행한다. 이는 시간 영역의 오차 신호를 주파수 영역으로 변환하기 위함이다. The modified discrete
상기 제 1 마스킹 임계치 계산부(131)는 인간의 주파수 영역에 대한 청각 특성을 반영하기 위해, 전달된 PCM 오디오 신호를 고속 푸리에 변환(FFT: Fast Fourier Transform) 연산, 부분합(Partial sum) 연산, 미예측 측정(Unpredictability Measure), 스프레딩(Spreading) 과정을 수행하여 PCM 오디오 신호에 대한 마스킹 임계치(이하, 원신호 마스킹 임계치)를 구한다. The first
상기 제 2 마스킹 임계치 계산부(132)는 변형 선형예측 부호화부(110)로부터 변형 선형예측 부호화의 분석 계수(부호화 정보)와 제 1 마스킹 임계치 계산부(131)로부터 원신호 마스킹 임계치를 전달받는다. 그리고 제 2 마스킹 임계치 계산부(132)는 원신호 마스킹 임계치와 변형 선형예측 부호화의 분석 계수를 이용하여 오디오 신호의 지각적 특성이 반영된 오차 신호에 대한 마스킹 임계치(이하, 오차 마스킹 임계치)를 구한다. 제 2 마스킹 임계치 계산부(132)는 오차 마스킹 임계치를 이용하여 오차 마스킹 임계치에 대한 신호대 마스킹 비(SMR: Signal-to-Masking Ratio)(이하, 오차 마스킹 SMR)를 계산한다. 그리고 심리음향 모델부(130)는 계산된 오차 마스킹 SMR을 지각적 부호화부(140)로 전달한다. The second
이후, 오차 마스킹 임계치의 계산 과정은 도 2를 참조하여 상세하게 후술하기로 한다.After that, the calculation of the error masking threshold will be described in detail with reference to FIG. 2.
상기 지각적 부호화부(140)는 변형 이산코사인 변환 영역(주파수 영역)에서 심리음향 모델부(130)로부터 전달받은 오차 마스킹 SMR을 이용하여 오차 신호에 대해 지각적 부호화를 수행한다. 즉, 지각적 부호화부(140)는 오차 마스킹 SMR을 이 용하여 오차 신호를 양자화한다. 오차 마스킹 임계치는 오차 신호를 양자화하는 양자화 잡음의 기준으로 사용된다. The
상기 비트스트림 패킹부(150)는 지각적 부호화부(140)로부터 전달된 오차 신호를 엔트로피 코딩하여 비트열로 패킹한다.The
도 2 는 본 발명에 적용되는 변형 선형예측 부호화를 이용한 오디오 부호화 방법 중에서 원 신호에 대한 마스킹 임계치에서 오차 마스킹 임계치를 추출하는 과정에 대한 일실시예 설명도이다.FIG. 2 is a diagram illustrating an example of a process of extracting an error masking threshold value from a masking threshold value of an original signal in an audio encoding method using modified linear predictive encoding according to the present invention.
제 1 마스킹 임계치 계산부(131)는 선형 밴드(Linear Band)에서 마스킹 임계치(Masking Threshhold)를 구하지 않고 지각적 특성이 반영된 파티션 밴드(Partition Band)에서 원신호 마스킹 임계치를 구한다(210). 여기서, 선형 밴드는 주파수 대역이 세밀하고 모든 밴드의 주파수 대역 간격이 동일하여 선형 주파수 해상도를 가진다. 이에 비하여, 파티션 밴드는 저주파수 영역에서의 주파수 대역이 고주파수 영역에서의 주파수 대역보다 세밀하여 비선형 주파수 해상도를 가진다. 즉, 파티션 밴드는 사람의 지각적 특성을 반영한 주파수 해상도를 가진다. The first
그리고 제 2 마스킹 임계치 계산부(132)는 파티션 밴드에서 구한 원신호 마스킹 임계치를 다시 선형 밴드로 맵핑시켜 선형 밴드에서 원신호 마스킹 임계치를 구한다(220). 이때, 임의의 파티션 밴드에 속한 선형 밴드 안의 성분들은 그 파티션 밴드의 임계치를 선형 밴드의 주파수 빈 수로 나눈 값으로 모두 같은 값을 가지게 된다. 하기의 [수학식 1]은 파티션 밴드에서 선형 밴드로 대응시키는 과정을 나타내고 있다.The second
여기서, 는 선형 밴드에서의 원신호 마스킹 임계치, 는 파티션 밴드에서의 원신호 마스킹 임계치, 와 는 각 파티션 밴드에 해당되는 선형 밴드의 주파수 경계값을 나타낸다. here, Is the original signal masking threshold in the linear band, Is the original signal masking threshold in the partition band, Wow Denotes a frequency boundary value of the linear band corresponding to each partition band.
상기 [수학식 1]과 같이 선형 밴드에서의 원신호 마스킹 임계치가 구해진다. 원신호 마스킹 임계치가 이면, 오차 마스킹 임계치는 하기의 [수학식 2]와 같이 변형 선형예측 부호화의 분석 계수의 에너지로 정규화된다. 즉, 오차 마스킹 임계치는 변형 선형예측 부호화의 전달함수(H(z))의 에너지로 정규화되면 선형 밴드에서의 오차 마스킹 임계치가 구해진다. 여기서, 변형 선형예측 부호화의 전달함수(H(z))는 변형 선형예측 부호화의 분석 계수와 대응 관계에 있다. As shown in Equation 1, the original signal masking threshold in the linear band is obtained. If the original signal masking threshold is, the error masking threshold is normalized to the energy of the analysis coefficients of the modified linear prediction coding as shown in Equation 2 below. That is, when the error masking threshold is normalized by the energy of the transfer function H (z) of the modified linear prediction coding, the error masking threshold in the linear band is obtained. Here, the transfer function H (z) of the modified linear prediction coding corresponds to the analysis coefficient of the modified linear prediction coding.
여기서, 는 오차 마스킹 임계치, 는 원신호 마스킹 임계치, 는 분석 계수의 에너지를 나타낸다. here, Is the error masking threshold, Is the original signal masking threshold, Represents the energy of the analysis coefficient.
상기 [수학식 2]과 같이, 구해진 선형 밴드의 오차 마스킹 임계치는 다시 파티션 밴드로 대응되고, 파티션 밴드에서 오차 마스킹 임계치가 구해진다(230). 이를 바탕으로 임계 밴드(Critical Band)에서의 오차 마스킹 임계치가 구해지면(240), 임계 밴드에서의 오차 마스킹 임계치는 지각적 부호화부(140)에서 양자화하는데 사용하게 된다. As shown in Equation 2, the obtained error masking threshold of the linear band corresponds to the partition band again, and the error masking threshold is obtained in the partition band (230). Based on this, if an error masking threshold in a critical band is obtained (240), the error masking threshold in the critical band is used for quantization in the
선형 밴드에서 파티션 밴드로 대응하는 과정은 하기의 [수학식 3]에 나타나 있다. The corresponding process from the linear band to the partition band is shown in Equation 3 below.
여기서, 는 선형 밴드에서의 오차 마스킹 임계치, 는 파티션 밴드에서의 오차 마스킹 임계치를 나타낸다. here, Is the error masking threshold in the linear band, Denotes an error masking threshold in the partition band.
파티션 밴드에서의 오차 마스킹 임계치()는 동일한 파티션 밴드에 있는 선형 밴드에서의 오차 마스킹 임계치() 성분들끼리 합해서 구해진다. Error masking threshold in partition band ( ) Is the error masking threshold (in linear bands in the same partition band) ) Are obtained by combining the components.
다음으로, 파티션 밴드에서 구해진 오차 마스킹 임계치()는 심리음향 모델에서와 마찬가지로 임계 밴드로 대응된다. 임계 밴드도 파티션 밴드와 마찬가지로 지각적 특성을 반영한 비선형 밴드이지만, 파티션 밴드보다 전체 밴드의 개수가 적 다. 그러므로 임계 밴드로 대응시키기 위해서는 임계 밴드에 속한 해당 파티션 밴드의 오차 마스킹 임계치 중 최소값이 선택되어 밴드 수가 곱해지고, 그 임계 밴드의 오차 마스킹 임계치로 정해진다. 하기의 [수학식 4]에는 파티션 밴드에서 임계 밴드로의 대응되는 관계를 나타낸다.Next, the error masking threshold? Obtained in the partition band corresponds to the threshold band as in the psychoacoustic model. Like the partition band, the critical band is a nonlinear band that reflects perceptual characteristics, but has fewer total bands than the partition band. Therefore, in order to correspond to the threshold band, the minimum value of the error masking thresholds of the partition bands belonging to the threshold band is selected to be multiplied by the number of bands, and is determined as the error masking threshold of the threshold band. Equation 4 below shows a corresponding relationship from a partition band to a critical band.
여기서, 는 임계 밴드에서의 오차 마스킹 임계치, 는 파티션 밴드에서의 오차 마스킹 임계치, 와 는 각 임계 밴드에 해당되는 파티션 밴드의 주파수 경계값을 나타낸다.here, Is the error masking threshold in the critical band, Is the error masking threshold in the partition band, Wow Denotes a frequency boundary value of a partition band corresponding to each threshold band.
도 3 은 본 발명에 적용되는 변형 이산코사인 변환 과정과 심리음향 모델 과정에서의 입력 프레임에 대한 일실시예 설명도이다.3 is a diagram illustrating an embodiment of an input frame in a modified discrete cosine transform process and a psychoacoustic model process applied to the present invention.
변형 선형예측 부호화부(110)에서 현재 입력 프레임은 변형 이산코사인 변환(MDCT)의 특성상 이전 입력 프레임의 절반과 다음 입력 프레임의 절반이 겹치는 형태로 입력되고 있다(310). 이는 역 변형 이산코사인 변환(IMDCT)에서 완벽한 복원을 가능하게 하기 위함이다. 즉, 변형 선형예측 부호화부(110)에 입력되는 현재 입력 신호(Present Signal)는 항상 변형 이산코사인 변환의 50%에 해당하는 구간만 입력되고 있다. 또한, 심리음향 모델을 위한 FFT 프레임도 50%에 해당하는 구간만 입력되고 있다.In the modified
하지만, 변형 선형예측 부호화부(110)는 변형 선형예측 부호화의 훈련구간을 현재 입력 프레임의 앞과 뒤의 일정 구간이 더 포함되도록 윈도(Window)를 씌운다(320). 이는 주파수 상에 나타날 수 있는 간섭 작용을 최소화하기 위함이다.However, the modified linear
이처럼, 변형 선형예측 부호화부(110)는 이러한 훈련 구간을 이용하여 현재 입력 프레임의 오차 신호를 구한다(330).As described above, the modified
한편, 전술한 대로 심리음향 모델부(130)는 오차 마스킹 임계치를 구할 때 원신호 마스킹 임계치를 오차 신호의 분석 필터 전달함수의 에너지로 정규화한다. 이때, 오차 신호를 구하는 훈련 구간과 심리음향 모델을 위한 FFT 구간 사이에 지연이 발생한다. 따라서 이러한 지연을 보상하기 위해, 심리음향 모델부(130)는 이전 입력 프레임에서 구해진 전달 함수와 현재 입력 프레임에서 구해진 전달 함수의 평균을 구하여(340) 선형 밴드에서의 원신호 마스킹 임계치를 정규화한다. On the other hand, as described above, the psychoacoustic model unit 130 normalizes the original signal masking threshold to the energy of the analysis filter transfer function of the error signal when obtaining the error masking threshold. At this time, a delay occurs between the training interval for obtaining the error signal and the FFT interval for the psychoacoustic model. Therefore, to compensate for this delay, the psychoacoustic model unit 130 normalizes the original signal masking threshold in the linear band by obtaining an average of the transfer function obtained in the previous input frame and the transfer function obtained in the current input frame (340).
하기의 [수학식 5]는 이전 입력 프레임에서 구해진 분석필터 계수와 현재 입력 프레임에서 구해진 분석필터의 계수의 평균()을 취하는 과정이 나타나 있다.Equation 5 below is an average of coefficients of analysis filter coefficients obtained from the previous input frame and analysis filter coefficients obtained from the current input frame. The process of taking) is shown.
여기서, 는 이전 입력 프레임에서의 분석필터 계수, 는 현재 입력 프레임에서의 분석필터 계수를 나타낸다.here, Is the analysis filter coefficients from the previous input frame, Denotes the analysis filter coefficients in the current input frame.
도 4 는 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 복호화 장치의 일실시예 구성도이다. 4 is a configuration diagram of an audio decoding apparatus using modified linear prediction encoding according to the present invention.
도 4에 도시된 바와 같이, 본 발명에 따른 오디오 복호화 장치는 비트스트림 추출부(410), 지각적 복호화부(420), 역 변형 이산코사인 변환부(430) 및 변형 선형예측 복호화부(440)를 포함한다. As shown in FIG. 4, the audio decoding apparatus according to the present invention includes a
비트 스트림 추출부(410)는 오디오 부호화 장치로부터 전체 비트스트림을 전송받고 전송된 전체 비트스트림으로부터 현재 프레임에 해당하는 비트열을 추출한다. 비트스트림 추출부(410)는 추출된 비트열을 복호화부(420)로 전달한다.The
그리고 지각적 복호화부(420)는 비트 스트림 추출부(410)에서 추출된 비트열을 분석해 역 양자화 과정을 수행한다. 즉, 지각적 복호화부(420)는 비트열을 지각적 복호화하여 현재 프레임의 오차 신호와 변형 선형예측 부호화의 분석 계수를 구한다. 지각적 복호화부(420)는 구한 현재 프레임의 오차 신호를 역 변형 이산 코사인 변환부(430)로 전달한다. The
그리고 역 변형 이산 코사인 변환부(430)는 주파수 영역의 오차 신호를 역 변형 이산 코사인 변환하여 시간 영역의 오차 신호로 변환한다. 역 변형 이산 코사인 변환부(430)는 변환된 오차 신호를 변형 선형예측 복호화부(440)로 전달한다. The inverse modified discrete
그리고 상기 변형 선형예측 복호화부(440)는 시간 영역의 오차 신호를 복호화부(420)에서 복원된 변형 선형예측 부호화의 분석 계수를 이용하여 변형 선형예측 복호화 과정을 수행한다. 이 복호화 과정은 변형 선형 예측 부호화부(110)의 역과정에 해당한다. 즉, 변형 선형예측 복호화부(440)는 변형 선형예측 부호화의 분 석 계수(합성 필터의 계수(Synthesis Coefficients))를 이용해 오차 신호를 합성하여 최종 출력인 시간 영역의 PCM 오디오 신호를 생성한다. The modified
이하, 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 부호화 방법을 살펴보기로 한다.Hereinafter, an audio encoding method using modified linear prediction coding according to the present invention will be described.
변형 선형예측 부호화부(110)는 현재 프레임에서 소정크기의 한 블록을 부호화하기 위해, 외부로부터 입력된 PCM(Pulse Code Modulation) 오디오 신호(원신호)를 시간 영역에서 변형 선형예측 부호화하여 오차 신호를 구한다. 또한, 변형 선형예측 부호화부(110)는 변형 선형예측 부호화의 분석 계수(Analysis Coefficients)를 구한다. In order to encode a block of a predetermined size in the current frame, the modified
그리고 변형 이산코사인 변환부(120)는 변형 선형예측 부호화부(110)에서 구해진 오차 신호에 대해 변형 이산코사인 변환을 수행한다. 이는 시간 영역의 오차 신호를 주파수 영역으로 변환하기 위함이다. The modified discrete
그리고 제 1 마스킹 임계치 계산부(131)는 인간의 주파수 영역에 대한 청각 특성을 반영하기 위해, PCM 오디오 신호를 심리음향 모델을 이용하여 PCM 오디오 신호에 대한 마스킹 임계치(이하, 원신호 마스킹 임계치)를 구한다. In addition, the first
그리고 제 2 마스킹 임계치 계산부(132)는 변형 선형예측 부호화의 분석 계수와 제 1 마스킹 임계치 계산부(131)에서 구해진 원신호 마스킹 임계치를 이용하여 오디오 신호의 지각적 특성이 반영된 오차 신호에 대한 마스킹 임계치(이하, 오차 마스킹 임계치)를 구한다. 이어서, 제 2 마스킹 임계치 계산부(132)는 오차 마스킹 임계치를 이용하여 오차 마스킹 임계치에 대한 신호대 마스킹 비(이하, 오차 마스킹 SMR)를 계산한다. The second
지각적 부호화부(140)는 변형 이산코사인 변환 영역(주파수 영역)에서 심리음향 모델부(130)에서 구해진 오차 마스킹 SMR을 이용하여 오차 신호에 대해 지각적 부호화를 수행한다. The
비트스트림 패킹부(150)는 지각적 부호화부(140)에서 지각적 부호화된 오차 신호를 엔트로피 코딩하여 비트열로 패킹한다.The
여기서, 본 발명에 적용되는 변형 선형예측 부호화를 이용한 오디오 부호화 방법 중에서 원 신호에 대한 마스킹 임계치에서 오차 마스킹 임계치를 추출하는 과정에 대해 살펴보기로 한다.Herein, a process of extracting an error masking threshold value from a masking threshold value of an original signal in an audio encoding method using modified linear prediction coding according to the present invention will be described.
제 1 마스킹 임계치 계산부(131)는 선형 밴드(Linear Band)에서 마스킹 임계치(Masking Threshhold)를 구하지 않고 지각적 특성이 반영된 파티션 밴드(Partition Band)에서 원신호 마스킹 임계치를 구한다.The first
그리고 제 2 마스킹 임계치 계산부(132)는 파티션 밴드에서 구한 원신호 마스킹 임계치를 전술한 [수학식 1]과 같이 다시 선형 밴드로 맵핑시켜 선형 밴드에서 원신호 마스킹 임계치를 구한다. The second
그리고 제 2 마스킹 임계치 계산부(132)는 구한 원신호 마스킹 임계치를 이용하여 전술한 [수학식 2]와 같이 변형 선형예측 부호화의 분석 계수의 에너지로 정규화하여 선형 밴드에서의 오차 마스킹 임계치를 구한다.The second
그리고 제 2 마스킹 임계치 계산부(132)는 구해진 선형 밴드에서의 오차 마스킹 임계치를 전술한 [수학식 3]과 같이 동일한 파티션 밴드에 있는 성분을 각각 합하여 파티션 밴드로 대응시켜 파티션 밴드에서의 임계치를 구한다. The second
그리고 제 2 마스킹 임계치 계산부(132)는 전술한 [수학식 4]와 같이 파티션 밴드에서의 오차 마스킹 임계치 중 최소값을 선택해 밴드 수를 곱하여 임계 밴드에서의 오차 마스킹 임계치를 구한다. 그리고 제 2 마스킹 임계치 계산부(132)는 구해진 임계 밴드에서의 오차 마스킹 임계치로부터 오차 마스킹 SMR을 산출한다.The second masking
이하, 본 발명에 따른 변형 선형예측 부호화를 이용한 오디오 복호화 방법에 대해 살펴보기로 한다.Hereinafter, an audio decoding method using modified linear prediction coding according to the present invention will be described.
비트 스트림 추출부(410)는 오디오 부호화 장치로부터 전체 비트스트림을 전송받고 전송된 전체 비트스트림으로부터 현재 프레임에 해당하는 비트열을 추출한다. The
그리고 지각적 복호화부(420)는 비트 스트림 추출부(410)에서 추출된 비트열을 분석해 역 양자화 과정을 수행한다. 즉, 지각적 복호화부(420)는 비트열을 지각적 복호화하여 현재 프레임의 오차 신호와 변형 선형예측 부호화의 분석 계수를 구한다.The
이어서, 역 변형 이산 코사인 변환부(430)는 주파수 영역의 오차 신호를 역 변형 이산 코사인 변환하여 시간 영역의 오차 신호로 변환한다.Subsequently, the inverse modified discrete
이후, 상기 변형 선형예측 복호화부(440)는 시간 영역의 오차 신호를 복호화부(420)에서 복원된 변형 선형예측 부호화의 분석 계수를 이용하여 변형 선형예측 복호화 과정을 수행한다. 이 복호화 과정은 변형 선형 예측 부호화부(110)의 역과정에 해당한다. 즉, 변형 선형예측 복호화부(440)는 변형 선형예측 부호화의 분석 계수(합성 필터의 계수(Synthesis Coefficients))를 이용해 오차 신호를 합성하여 최종 출력인 시간 영역의 PCM 오디오 신호를 생성한다. Thereafter, the modified
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.As described above, the method of the present invention may be implemented as a program and stored in a recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.) in a computer-readable form. Since this process can be easily implemented by those skilled in the art will not be described in more detail.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.The present invention described above is capable of various substitutions, modifications, and changes without departing from the technical spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited by the drawings.
상기와 같은 본 발명은, 시간 영역에서의 예측을 통한 부호화 기술과 주파수 영역에서의 지각적 부호화가 합성된 형태의 오디오 부호화 구조를 이용함으로써, 고급 오디오 부호화기의 성능을 개선할 수 있으며 오디오 부호화의 압축 효율을 향상시킬 수 있게 하는 효과가 있다. As described above, the present invention can improve the performance of an advanced audio encoder by using an audio encoding structure in which a coding technique through prediction in a time domain and a perceptual encoding in a frequency domain are synthesized, thereby compressing audio encoding. There is an effect that can improve the efficiency.
즉, 본 발명은, 오디오 부호화 과정에서 변형 선형예측 부호화를 이용하여 원 신호의 중복성을 제거하고 오차 신호를 오디오 부호화기에 입력으로 제공하고 이 오차 신호에 적합하도록 심리음향 모델을 변형함으로써, 신호의 압축 효율을 높 여 부호화할 수 있게 하는 효과가 있다. That is, the present invention compresses a signal by removing the redundancy of an original signal by using modified linear prediction coding, providing an error signal to an audio encoder, and modifying a psychoacoustic model to fit the error signal. There is an effect that the efficiency can be encoded.
또한, 본 발명은, 비선형의 주파수 해상도를 가지는 변형 선형예측 부호화를 이용하여 저주파수 영역의 신호를 더욱 세밀하게 분석하여 오차 신호를 구함으로써, 시간 영역에서의 예측을 통한 부호화 효율을 극대화할 수 있는 효과가 있다.In addition, the present invention, by using the modified linear prediction coding having a non-linear frequency resolution in detail to analyze the signal in the low frequency domain in detail to obtain an error signal, the effect of maximizing the coding efficiency through prediction in the time domain There is.
Claims (20)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20060087646 | 2006-09-11 | ||
KR1020060087646 | 2006-09-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080023618A true KR20080023618A (en) | 2008-03-14 |
KR100902332B1 KR100902332B1 (en) | 2009-06-12 |
Family
ID=39397121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070026820A KR100902332B1 (en) | 2006-09-11 | 2007-03-19 | Audio Encoding and Decoding Apparatus and Method using Warped Linear Prediction Coding |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100902332B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101008264B1 (en) * | 2009-02-27 | 2011-01-13 | 전자부품연구원 | Method for selecting optimal linear prediction coefficient and signal processing device using the same |
US9311926B2 (en) | 2010-10-18 | 2016-04-12 | Samsung Electronics Co., Ltd. | Apparatus and method for determining weighting function having for associating linear predictive coding (LPC) coefficients with line spectral frequency coefficients and immittance spectral frequency coefficients |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100355033B1 (en) * | 2000-12-30 | 2002-10-19 | 주식회사 실트로닉 테크놀로지 | Apparatus and Method for Watermark Embedding and Detection using the Linear Prediction Analysis |
KR100378796B1 (en) * | 2001-04-03 | 2003-04-03 | 엘지전자 주식회사 | Digital audio encoder and decoding method |
US7050965B2 (en) * | 2002-06-03 | 2006-05-23 | Intel Corporation | Perceptual normalization of digital audio signals |
KR100707173B1 (en) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | Low bitrate encoding/decoding method and apparatus |
-
2007
- 2007-03-19 KR KR1020070026820A patent/KR100902332B1/en not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101008264B1 (en) * | 2009-02-27 | 2011-01-13 | 전자부품연구원 | Method for selecting optimal linear prediction coefficient and signal processing device using the same |
US9311926B2 (en) | 2010-10-18 | 2016-04-12 | Samsung Electronics Co., Ltd. | Apparatus and method for determining weighting function having for associating linear predictive coding (LPC) coefficients with line spectral frequency coefficients and immittance spectral frequency coefficients |
US9773507B2 (en) | 2010-10-18 | 2017-09-26 | Samsung Electronics Co., Ltd. | Apparatus and method for determining weighting function having for associating linear predictive coding (LPC) coefficients with line spectral frequency coefficients and immittance spectral frequency coefficients |
US10580425B2 (en) | 2010-10-18 | 2020-03-03 | Samsung Electronics Co., Ltd. | Determining weighting functions for line spectral frequency coefficients |
Also Published As
Publication number | Publication date |
---|---|
KR100902332B1 (en) | 2009-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5539203B2 (en) | Improved transform coding of speech and audio signals | |
EP2207170B1 (en) | System for audio decoding with filling of spectral holes | |
KR101428487B1 (en) | Method and apparatus for encoding and decoding multi-channel | |
US8370133B2 (en) | Method and device for noise filling | |
KR100608062B1 (en) | Method and apparatus for decoding high frequency of audio data | |
KR101413968B1 (en) | Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal | |
US8532982B2 (en) | Method and apparatus to encode and decode an audio/speech signal | |
KR100721537B1 (en) | Apparatus and Method for Highband Coding of Splitband Wideband Speech Coder | |
JP2003140697A (en) | Method and device for encoding audio signal | |
JP2001500640A (en) | Audio signal encoding method | |
AU2003243441A1 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
US7197454B2 (en) | Audio coding | |
KR100707173B1 (en) | Low bitrate encoding/decoding method and apparatus | |
KR102052144B1 (en) | Method and device for quantizing voice signals in a band-selective manner | |
KR100902332B1 (en) | Audio Encoding and Decoding Apparatus and Method using Warped Linear Prediction Coding | |
US10593342B2 (en) | Method and apparatus for sinusoidal encoding and decoding | |
KR101413969B1 (en) | Method and apparatus for decoding audio signal | |
KR100928966B1 (en) | Low bitrate encoding/decoding method and apparatus | |
CN1898722B (en) | Improved frequency-domain error concealment | |
JP2008026372A (en) | Encoding rule conversion method and device for encoded data | |
KR101449432B1 (en) | Method and apparatus for encoding and decoding signal | |
KR100940532B1 (en) | Low bitrate decoding method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |