KR20110110044A - 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 - Google Patents
부호화 방법 및 장치, 그리고 복호화 방법 및 장치 Download PDFInfo
- Publication number
- KR20110110044A KR20110110044A KR1020110029340A KR20110029340A KR20110110044A KR 20110110044 A KR20110110044 A KR 20110110044A KR 1020110029340 A KR1020110029340 A KR 1020110029340A KR 20110029340 A KR20110029340 A KR 20110029340A KR 20110110044 A KR20110110044 A KR 20110110044A
- Authority
- KR
- South Korea
- Prior art keywords
- mdct
- index
- error
- gain
- coefficient
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000013139 quantization Methods 0.000 description 42
- 239000010410 layer Substances 0.000 description 26
- 239000012792 core layer Substances 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- FGRBYDKOBBBPOI-UHFFFAOYSA-N 10,10-dioxo-2-[4-(N-phenylanilino)phenyl]thioxanthen-9-one Chemical compound O=C1c2ccccc2S(=O)(=O)c2ccc(cc12)-c1ccc(cc1)N(c1ccccc1)c1ccccc1 FGRBYDKOBBBPOI-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
부호화기의 부호화 방법이 제공된다. 부호화기는 입력 신호를 변환하여 제1 MDCT 계수를 생성하고, 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성한다. 부호화기는 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 제1 MDCT 계수와 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산한다. 다음 부호화기는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 제1 MDCT 계수와 제2 MDCT 계수로부터 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성한다.
Description
본 발명은 부호화/복호화 방법 및 장치, 그리고 복호화 방법 및 장치에 관한 것으로, 특히 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 부호화/복호화 방법 및 장치에 관한 것이다.
음성 및 오디오를 디지털로 전송 및 저장하는 기술은 기존 전화망을 비롯한 유선 통신뿐만 아니라 이동 통신 및 VoIP(Voice over IP) 서비스에서도 널리 사용되고 있다. 음성 및 오디오 신호를 단순히 샘플링 후 디지털화하여 전송한다면 예를 들면 64kbps (8kHz로 샘플링하고 각 샘플을 8 비트로 코딩하는 경우) 정도의 데이터 전송률을 필요로 한다. 그러나 입력 신호 분석과 적절한 코딩 방법을 이용한다면 훨씬 더 낮은 데이터 전송률로 음성을 전송할 수 있다. 이러한 음성 및 오디오 압축 방법으로 파형 부호화 방법, CELP(code-Excited Linear Prediction) 부호화 및 변환 부호화 방법 등이 주로 사용되고 있다. 파형 부호화 방법은 샘플링된 각 샘플 혹은 이전 샘플과의 차이를 일정한 비트로 표현하는 것으로 가장 간단한 방법이나 상대적으로 높은 전송 비트율을 필요로 한다. CELP 부호화 방법은 음성 생성 모델에 기반한 것으로 음성을 여기 신호와 선형 예측 필터로 모델링하는 방법으로, 상대적으로 낮은 전송률로 음성을 압축할 수 있는 장점을 가지는 반면 오디오 신호에 대해서 성능이 떨어지는 단점을 갖는다. 변환 부호화 방법은 시간 영역의 음성 신호를 주파수 영역으로 변환한 후 각 주파수 성분에 해당하는 계수를 부호화하는 것으로, 사람의 청각 특성에 따라 각 주파수 성분을 부호화할 수 있는 장점을 갖는다.
최근의 통신용 음성 부호화기는 기존 전화망 대역에 해당하는 협대역 음성을 부호화하는 데서 벗어나 더 나은 자연성과 명료성을 제공할 수 있는 광대역 혹은 슈퍼 광대역 음성을 부호화하는 쪽으로 발전하고 있다. 다양한 형태의 네트워크 환경을 수용하기 위해서 하나의 부호화기에서 여러 가지 전송률을 지원하는 다중 비트율 부호화기가 주종을 이루고 있다. 이러한 추세를 반영하면서 동시에 여러 대역폭을 가진 신호를 수용하기 위한 대역폭 확장성과 각 전송률 간의 호환성을 가지는 비트율 확장성을 제공하는 임베디드 가변 비트율 음성 부호화기도 개발되고 있다. 이러한 임베디드 가변 비트율 부호화기는 높은 전송률의 비트 스트림이 낮은 전송률의 비트 스트림을 포함하는 형태로 구성되어 있으며, 이를 위해 대부분 계층형 부호화 방법을 사용하고 있다. 또한 신호 대역폭이 늘어남에 따라 음악과 같은 오디오 신호에 대한 성능도 중요하게 고려되고 있다. 이를 위해 전체 신호 대역을 나누어 저대역 신호에는 기존 파형 부호화 및 CELP 부호화를 적용하고, 고대역에 대해서는 변환 부호화를 채용하는 형태의 하이브리드 부호화가 사용되고 있다. 이와 같이, 기존의 오디오 전용 코덱 뿐만 아니라 최근에 개발되고 있는 광대역 혹은 슈퍼 광대역을 지원하는 통신용 음성 코덱에서도 변환 부호화가 널리 적용되고 있다.
이러한 변환 부호화를 위해서는 시간 영역 신호를 주파수 영역 신호로 변환이 필요한데, 많은 경우에 MDCT를 사용하고 있다. 변환된 MDCT 계수는 코덱이 갖는 제한된 비트율로 인해 발생하는 양자화 오류를 겪게 되며, 이로 인해 음성 및 오디오 품질이 저하된다. 이를 극복하기 위해 상대적으로 적은 비트율을 갖는 향상 계층을 추가하여 MDCT 양자화 오류를 보상하는 방법이 사용되고 있다.
이 경우 MDCT 계수에 동적으로 할당되는 비트 수가 양자화된 MDCT 계수의 절대값 크기에만 종속되기 때문에, 핵심 및 향상 계층의 전체 양자화 성능은 핵심 계층 MDCT 양자화 성능에 의해 결정된다. 그런데 특정 MDCT 계수에 큰 양자화 오류가 발생하는 동시에 양자화된 MDCT 계수의 크기가 다른 계수에 비해 상대적으로 작은 경우, 이러한 MDCT 계수에 적은 수의 비트가 할당되어 큰 양자화 오류를 적절하게 보상하지 못할 수 있다.
본 발명이 해결하려는 과제는 양자화 오류를 효과적으로 보상할 수 있는 부호화/복호화 방법 및 장치를 제공하는 것이다.
본 발명의 한 특징에 따르면, 부호화기의 부호화 방법이 제공된다. 상기 부호화 방법은, 입력 신호를 변환하여 제1 MDCT 계수를 생성하는 단계, 상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성하는 단계, 상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하는 단계, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산하는 단계, 상기 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하는 단계, 그리고 상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 상기 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성하는 단계를 포함한다.
상기 부호화 방법은, 상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 생성하는 단계를 더 포함할 수 있다.
상기 오류 인덱스를 생성하는 단계는, 복수의 부대역 중에서 상기 MDCT 오류 계수의 에너지가 가장 큰 부대역의 인덱스를 검색하는 단계, 그리고 상기 인덱스를 부호화하여 부대역 인덱스를 생성하는 단계를 포함할 수 있다. 그리고 상기 오류 인덱스는 상기 부대역 인덱스를 포함할 수 있다.
j번째 부대역의 상기 MDCT 오류 계수의 에너지는 로 결정될 수 있다. 이때, uj와 lj는 각각 j번째 부대역의 하위 및 상위 경계 인덱스이고, E(k)는 k번째 상기 MDCT 오류 계수이다.
상기 오류 인덱스를 생성하는 단계는, 상기 검색한 부대역의 상기 MDCT 오류 계수를 부호화하는 단계를 더 포함할 수 있다.
상기 MDCT 오류 계수를 부호화하는 단계는, 상기 검색한 부대역의 MDCT 오류 계수에 대한 복수의 트랙을 구성하는 단계, 각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 가지는 미리 정해진 개수의 MDCT 오류 계수에 해당하는 펄스를 검색하는 단계, 그리고 상기 펄스를 부호화하는 단계를 더 포함할 수 있다. 이때, 상기 오류 인덱스는 상기 펄스를 부호화한 값을 더 포함할 수 있다.
상기 펄스를 부호화하는 단계는, 상기 펄스의 위치를 부호화하는 단계, 상기 펄스의 부호(sign)를 부호화하는 단계, 그리고 상기 펄스의 크기를 부호화하는 단계를 포함할 수 있다. 이때, 상기 펄스를 부호화한 값은 상기 위치, 부호 및 크기를 각각 부호화한 값을 포함할 수 있다.
상기 위치는 상기 검색한 부대역의 하위 경계 인덱스를 기준으로 한 상기 펄스의 상대적 위치일 수 있다.
상기 MDCT 오류 계수를 부호화하는 단계는, 상기 검색한 부대역의 MDCT 오류 계수의 제곱 평균 제곱근(Root Mean Square, RMS) 값을 계산하는 단계, 그리고 상기 RMS 값을 양자화하여 RMS 인덱스를 생성하는 단계를 포함할 수 있다. 이때, 상기 오류 인덱스는 상기 RMS 인덱스를 더 포함할 수 있다.
상기 펄스의 크기를 부호화하는 단계는, 상기 RMS 인덱스를 역 양자화하여 양자화된 RMS 값을 생성하는 단계, 그리고 상기 펄스의 크기를 상기 양자화된 RMS 값으로 나눈 값을 이용하여 상기 펄스의 크기를 부호화하는 단계를 포함할 수 있다.
상기 이득 인덱스를 생성하는 단계는, 상기 펄스의 위치를 제외한 위치에서 상기 제2 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계, 그리고 상기 지수 값에 기초하여 상기 이득 인덱스를 위한 비트를 할당하는 단계를 포함할 수 있다.
상기 이득 인덱스를 생성하는 단계는, 상기 할당한 비트, 상기 제1 MDCT 계수 및 상기 제2 MDCT 계수로부터 상기 이득 인덱스를 결정하는 단계를 더 포함할 수 있다.
상기 이득 인덱스는 를 최대로 하는 i로 결정될 수 있다. 이때, 상기 는 m 비트에 해당하는 코드북의 i번째 코드워드이고, 상기 i는 0부터 (2m-1)까지의 정수이며, 상기 X(k)는 상기 k번째 제1 MDCT 오류 계수이고, 상기 는 k번째 제2 MDCT 오류 계수이다.
본 발명의 다른 특징에 따르면, 복호화기의 복호화 방법이 제공된다. 상기 복호화 방법은, MDCT 인덱스, 오류 인덱스 및 이득 인덱스를 수신하는 단계, 상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성하는 단계, 상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하는 단계, 상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하는 단계, 복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하는 단계, 그리고 상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상하는 단계를 포함한다.
상기 오류를 보상하는 단계는 상기 제2 MDCT 계수에 상기 MDCT 오류 계수를 더하는 단계를 포함할 수 있다.
상기 MDCT 오류 계수는 상기 펄스의 위치 이외의 위치에서는 0의 값을 가질 수 있다.
상기 오류 인덱스는 부대역 인덱스를 포함하며, 상기 MDCT 오류 계수를 복원하는 단계는 상기 부대역 인덱스를 복호화하여 상기 MDCT 오류 계수의 부대역을 결정하는 단계를 포함할 수 있다.
상기 오류 인덱스는 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 포함할 수 있다.
상기 MDCT 오류 계수를 복원하는 단계는, 상기 펄스의 크기를 부호화한 값을 복호화하여 상기 펄스의 크기를 복원하는 단계, 상기 펄스의 위치를 부호화한 값을 복호화하여 상기 펄스의 위치를 복원하는 단계, 상기 펄스의 부호를 부호화한 값을 복호화하여 상기 펄스의 부호를 복원하는 단계, 그리고 상기 펄스의 위치, 부호 및 크기로 상기 MDCT 오류 계수를 복원하는 단계를 포함할 수 있다.
상기 오류 인덱스는 제곱 평균 제곱근(Root Mean Square, RMS) 인덱스를 더 포함할 수 있다. 이때, 상기 펄스의 크기를 복원하는 단계는, 상기 RMS 인덱스로부터 양자화된 RMS 값을 생성하는 단계, 그리고 복호화한 펄스의 크기에 상기 양자화된 RMS 값을 곱하여 상기 펄스의 크기를 복원하는 단계를 포함할 수 있다.
상기 이득을 복원하는 단계는, 상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계, 그리고 상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하는 단계를 포함할 수 있다.
상기 이득을 복원하는 단계는, 상기 비트 할당표를 이용하여 상기 이득 인덱스로부터 상기 이득을 복원하는 단계를 더 포함할 수 있다.
상기 복호화 방법은, 상기 제2 MDCT 계수의 오류가 보상되어 생성된 MDCT 계수를 MDCT 역 변환하여 신호를 복원하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, MDCT, MDCT 양자화기, 향상 계층 부호화기 및 다중화기를 포함하는 부호화 장치를 제공한다. 상기 MDCT는 입력 신호를 변환하여 제1 MDCT 계수를 생성하고, 상기 MDCT 양자화기는 상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성한다. 상기 향상 계층 부호화기는 상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차에 해당하는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 상기 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성한다. 상기 다중화기는 상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 출력한다.
본 발명의 또 다른 특징에 따르면, 역 다중화기, MDCT 역 양자화기 및 향상 계층 복호화기를 포함하는 복호화 장치가 제공된다. 상기 역 다중화기는 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스, 오류 인덱스 및 이득 인덱스를 출력하고, 상기 MDCT 역 양자화기는 상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성한다. 상기 향상 계층 복호화기는 상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하며, 상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하고, 복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하고, 상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상한다.
본 발명의 한 실시예에 따르면, 이득 보상 방식과 오류 보상 방식을 결합하여 사용함으로써 이득 보상 방식이 갖는 비트 할당과 실제 오류 계수 간의 불일치로 인한 스펙트럼 왜곡에 의해 발생할 수 있는 음질 저하를 극복할 수 있다.
도 1은 계층형 MDCT 양자화 시스템의 한 예를 나타내는 블록도이다.
도 2는 도 1에 도시한 이득 보상 부호화기와 이득 보상 복호화기를 나타내는 블록도이다.
도 3은 도 1에 도시한 MDCT 양자화 시스템의 성능을 나타내는 도면이다.
도 4는 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템을 나타내는 블록도이다.
도 5는 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법을 나타내는 흐름도이다.
도 6은 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법에서의 부대역 MDCT 오류 계수 부호화 과정을 나타내는 흐름도이다.
도 7은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법을 나타내는 흐름도이다.
도 8은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법에서의 MDCT 오류 계수 복호화 과정을 나타내는 흐름도이다.
도 2는 도 1에 도시한 이득 보상 부호화기와 이득 보상 복호화기를 나타내는 블록도이다.
도 3은 도 1에 도시한 MDCT 양자화 시스템의 성능을 나타내는 도면이다.
도 4는 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템을 나타내는 블록도이다.
도 5는 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법을 나타내는 흐름도이다.
도 6은 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법에서의 부대역 MDCT 오류 계수 부호화 과정을 나타내는 흐름도이다.
도 7은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법을 나타내는 흐름도이다.
도 8은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법에서의 MDCT 오류 계수 복호화 과정을 나타내는 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 계층형 MDCT 양자화 시스템의 한 예를 나타내는 블록도이며, 도 2는 도 1에 도시한 이득 보상 부호화기와 이득 보상 복호화기를 나타내는 블록도이고, 도 3은 도 1에 도시한 MDCT 양자화 장치의 성능을 나타내는 도면이다.
도 1을 참고하면, 계층형 MDCT 양자화 시스템은 입력 신호를 부호화하여 비트 스트림을 출력하는 부호화기(110)와 비트 스트림을 복호화하여 복원한 신호를 출력하는 복호화기(120)를 포함한다.
부호화기(110)는 MDCT(111), 핵심 계층 MDCT 양자화기(112), 향상 계층 부호화기(113) 및 다중화기(114)를 포함하며, 향상 계층 부호화기(113)는 로컬 MDCT 역 양자화기(115)와 이득 보상 부호화기(116)를 포함한다.
MDCT(111)는 입력 신호를 수학식 1처럼 MDCT 변환하여 MDCT 계수를 출력한다.
여기서, N은 시간 영역 입력 신호를 블록 단위로 처리하기 위한 프레임의 길이, w(n)은 윈도 함수, x(n)은 입력 신호, X(k)는 MDCT 계수이다. n은 시간 영역 인덱스이며, k는 주파수 영역 인덱스이다.
핵심 계층 MDCT 양자화기(112)는 MDCT 계수를 양자화하여 MDCT 인덱스를 출력한다. 핵심 계층 MDCT 양자화기(112)는 셰이프 게인(shape-gain) 벡터 양자화(vector quantization, VQ), 격자형 벡터 양자화(lattice VQ), 구형 벡터 양자화(spherical VQ) 및 대수 벡터 양자화(algebraic VQ) 등의 모든 방식의 MDCT 양자화 방식이 사용될 수 있다.
MDCT 로컬 역 양자화기(115)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다. 이득 보상 부호화기(116)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수로부터 이득을 계산한 후, 그 이득을 양자화하여 이득 인덱스를 출력한다.
다중화기(114)는 MDCT 인덱스와 이득 인덱스를 다중화하여 비트 스트림을 출력한다.
복호화기(120)는 역 다중화기(121), 핵심 계층 MDCT 역 양자화기(122), 향상 계층 복호화기(123) 및 역 MDCT(inverse MDCT, IMDCT)(124)를 포함하며, 향상 계층 복호화기(123)는 이득 보상 복호화기(125)와 이득 보상기(126)를 포함한다.
역 다중화기(121)는 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스와 이득 인덱스를 각각 출력한다.
핵심 계층 MDCT 역 양자화기(122)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다.
이득 보상 복호화기(125)는 양자화된 MDCT 계수를 이용하여 이득 인덱스를 복호화하여 양자화된 이득을 출력한다. 이득 보상기(126)는 양자화된 MDCT 계수를 양자화된 이득으로 스케일링(scaling)하여 최종적으로 복원된 MDCT 계수를 출력한다. 복원된 MDCT 계수는 수학식 2처럼 주어질 수 있다.
IMDCT(124)는 복원된 MDCT 계수를 수학식 3처럼 역 변환하여 복원된 신호를 출력한다.
도 2를 참고하면, 이득 보상 부호화기(116)는 지수(exponent) 계산기(211), 비트 할당 계산기(212), 이득 계산기(213), 이득 양자화기(214) 및 다중화기(215)를 포함한다. 지수 계산기(211)는 양자화된 각 MDCT 계수의 절대값 크기를 미리 정해진 간격으로 나누어 지수를 계산한다. 예를 들어, 간격을 밑이 2인 로그 단위로 설정한다면, 지수 계산기(211)는 수학식 4와 같이 양자화된 MDCT 계수의 로그 함수 값으로 지수를 계산할 수 있다. 따라서, 계산된 지수는 양자화된 MDCT 계수의 절대 크기에 지수적으로 비례한다.
비트 할당 계산기(212)는 프레임 내 모든 MDCT 계수에 대한 지수 값과 미리 정해진 가용 비트 수를 이용하여 각 MDCT 계수의 이득 양자화를 위한 비트 수를 동적으로 계산하여 비트 할당표를 출력한다. 여기서, 비트 할당표는 가용 비트 수 한도 내에서 각 MDCT 계수의 보상 이득에 할당된 양자화 비트 수를 저장한 것이다. 이때, 비트 할당 계산기(212)는 수학식 5처럼 각 MDCT 계수당 허용 가능한 최소 및 최대 이득 비트 수를 제한할 수도 있다.
여기서, b(k)는 k번째 MDCT 계수에 할당된 이득 비트 수이며, MIN_BITS와 MAX_BITS는 각각 최소 이득 비트 수와 최대 이득 비트 수이고, Benh는 향상 계층에 할당된 총 비트 수이다.
이득 계산기(213)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수 간의 이득을 계산하여 각 MDCT 계수에 대한 이득을 출력한다. 이득 계산기(213)는 수학식 5와 같이 이득 오차 에너지를 최소화하도록 이득을 계산할 수 있다.
여기서, Err(k)는 k번째 MDCT 계수에 대한 이득 오차 에너지이고, g(k)는 k번째 MDCT 계수에 대한 이득이다.
이득 양자화기(214)는 이득을 비트 할당표의 각 MDCT 계수에 해당하는 양자화 비트 수에 따라 양자화하여 이득 인덱스를 출력한다. 이득 양자화를 위해 별도의 이득 양자화 코드북을 이용하는 경우, 이득 계산기(213)와 이득 양자화기(214)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수를 이용하여 이득 양자화 코드북 검색을 통해 이득 인덱스를 구할 수도 있다. 이때, 이득 인덱스는 수학식 7처럼 주어질 수 있다.
여기서, 는 m 비트에 해당하는 코드북으로 2m개의 코드워드를 갖는다. 는 m 비트에 해당하는 코드북의 i번째 코드워드이고, Iopt(k)는 k번째 MDCT 계수에 해당하는 최적의 이득 인덱스이다.
다중화기(215)는 복수의 MDCT 계수에 대한 이득 인덱스를 다중화하여 이득 비트 스트림을 출력한다.
이득 보상 복호화기(125)는 역 다중화기(221), 지수 계산기(222), 비트 할당 계산기(223) 및 이득 역 양자화기(224)를 포함한다.
지수 계산기(222)와 비트 할당 계산기(223)는 각각 이득 보상 부호화기(116)의 지수 계산기(211)와 비트 할당 계산기(212)와 동일하게 동작하여 비트 할당표를 출력한다. 역 다중화기(221)는 비트 할당표에 따라 이득 비트 스트림을 역 다중화하여 복수의 MDCT 계수에 대한 이득 인덱스를 추출한다. 이득 역 양자화기(224)는 각 이득 인덱스와 비트 할당표를 이용하여 각 MDCT 계수에 대한 양자화된 이득을 복원한다.
도 1 및 도 2를 참고로 하여 설명한 주파수 대역 계수, 즉 MDCT 계수 보상 방법은 상대적으로 간단하고 우수한 성능을 제공할 수 있다. 그러나 각 MDCT 계수에 동적으로 할당되는 비트 수가 전적으로 양자화된 MDCT 계수의 절대값 크기에만 종속되기 때문에, 핵심 및 향상 계층의 전체 양자화 성능은 핵심 계층 MDCT 양자화기(112)의 성능에 따라 보상 성능이 저하될 수 있다. 즉, 핵심 계층 MDCT 양자화기(112)가 특정 MDCT 계수를 잘 표현하지 못하여 큰 양자화 오류를 초래하고 동시에 양자화된 MDCT 계수의 크기가 다른 계수에 비해 상대적으로 작은 경우에는, 동적 비트 할당기에 의해서 이러한 MDCT 계수에 적은 수의 비트가 할당되어 핵심 계층으로 인한 큰 양자화 오류에 대한 보상이 효과적으로 이루어지지 못한다.
도 3을 참고하면, 입력 음성 신호의 특정 프레임에 대해서 도 1 및 도 2에서 설명한 방식으로 얻어진 비트 할당표와 MDCT 오류 계수(residual coefficient)의 크기를 알 수 있다. 도 3에서 프레임 길이(N)는 40이고, MDCT 계수당 최소 비트 수와 최대 비트 수는 각각 0과 3 비트이다. 이 경우, 처음 여섯 개의 MDCT 계수의 오류 계수가 나머지 오류 계수들에 비해 상당히 큼에도 불구하고 모두 0 비트가 할당된 것을 알 수 있다.
아래에서는 비트 할당표와 MDCT 오류 계수 사이의 불일치를 완화시킬 수 있는 주파수 대역 계수 보상 양자화 장치 및 방법에 대해서 설명한다.
도 4는 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템을 나타내는 블록도이다.
도 4를 참고하면, 계층형 MDCT 양자화 시스템은 계층형 MDCT 양자화 방식을 이용한 음성 및 오디오 부호화기(410)와 복호화기(420)를 포함한다.
부호화기(410)는 MDCT(411), 핵심 계층 MDCT 양자화기(412), 향상 계층 부호화기(413) 및 다중화기(414)를 포함하며, 향상 계층 부호화기(413)는 로컬 MDCT 역 양자화기(415), 이득 보상 부호화기(416) 및 오류 보상 부호화기(417)를 포함한다.
MDCT(411)는 입력 신호를 MDCT 변환하여 MDCT 계수를 출력한다. 여기서, 입력 신호는 전체 신호 대역을 포함하는 전대역 음성 및/또는 오디오 신호이거나, 대역 분할 코덱의 일부 대역만을 갖는 신호 또는 스케일러블 코덱의 잔차 신호 등이 될 수 있다. 핵심 계층 MDCT 양자화기(412)는 MDCT 계수를 양자화하여 MDCT 인덱스를 출력한다. MDCT 로컬 역 양자화기(415)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다. MDCT(411), 핵심 계층 MDCT 양자화기(412) 및 MDCT 로컬 역 양자화기(415)는 도 1을 참고로 하여 설명한 MDCT(111), 핵심 계층 MDCT 양자화기(112) 및 MDCT 로컬 역 양자화기(115)와 동일하게 동작할 수 있다.
수학식 8과 같이, 향상 계층을 위해 할당된 총 비트 수가 이득 보상 부호화기(416)의 이득 보상 부호화와 오류 보상 부호화기(417)의 오류 보상 부호화에 나누어 할당된다.
여기서, Benh는 향상 계층 전체에 할당된 총 비트 수이고, Bgc와 Bec는 각각 이득 보상 부호화기(416)에 할당된 비트 수와 오류 보상 부호화기(417)에 할당된 비트 수이다. 이때, 향상 계층 전체에 할당된 총 비트 수(Benh)는 도 2의 가용 비트 수와 동일할 수 있다.
오류 보상 부호화기(417)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수로부터 MDCT 오류 계수를 계산한다. 이때, MDCT 오류 계수는 예를 들면 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수의 차로 계산될 수 있다. 오류 보상 부호화기(417)는 전체 MDCT 오류 계수 중 미리 정해진 개수의 MDCT 오류 계수를 선택하고, 선택한 MDCT 오류 계수를 양자화하여 오류 인덱스를 출력한다. 또한 오류 보상 부호화기(417)는 선택한 MDCT 오류 계수의 위치 정보, 즉 펄스 위치 정보를 이득 보상 부호화기(416)의 지수 계산기(416a)로 전달한다.
이득 보상 부호화기(416)는 양자화되지 않은 MDCT 계수, 양자화된 MDCT 계수 및 펄스 위치 정보를 이용하여 이득을 계산하고, 각 이득을 양자화하여 이득 인덱스를 출력한다. 이득 보상 부호화기(416)의 지수 계산기(416a)는 오류 보상 부호화기(417)로부터 전달된 펄스 위치 정보에 해당하는 MDCT 계수의 지수를 모두 최소값(MIN_EXP)으로 설정하고, 나머지 MDCT 계수에 대해서는 도 1 및 도 2를 참고로 하여 설명한 것처럼 지수 값을 계산한다. 이때, 이득 보상 부호화기(416)는 도 2의 지수 계산기(211)의 지수 계산 과정에서 가용 비트 수를 Benh에서 Bgc로 변경한 형태로 지수를 계산할 수 있다.
다중화기(414)는 MDCT 인덱스, 이득 인덱스 및 오류 인덱스를 다중화하여 비트 스트림을 출력한다.
복호화기(420)는 역 다중화기(421), 핵심 계층 MDCT 역 양자화기(422), 향상 계층 복호화기(423) 및 IMDCT(424)를 포함하며, 향상 계층 복호화기(423)는 이득 보상 복호화기(425), 이득 보상기(426), 오류 보상 복호화기(427) 및 오류 보상기(428)를 포함한다.
역 다중화기(421)는 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스, 이득 인덱스 및 오류 인덱스를 각각 출력한다.
핵심 계층 MDCT 역 양자화기(422)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다. 이득 보상기(426)는 양자화된 이득으로 양자화된 MDCT 계수를 스케일링하여 이득 보상된 MDCT 계수를 출력한다. IMDCT(424)는 복원된 MDCT 계수를 MDCT 역 변환하여 복원된 신호를 출력한다. 핵심 계층 MDCT 역 양자화기(422), 이득 보상기(426) 및 IMDCT(424)는 도 1을 참고로 하여 설명한 핵심 계층 MDCT 역 양자화기(122), 이득 보상기(126) 및 IMDCT(124)와 동일하게 동작할 수 있다.
오류 보상 복호화기(427)는 오류 인덱스를 복호화하여 양자화된 MDCT 오류 계수를 출력하고, 선택된 MDCT 오류 계수 각각에 대한 펄스 위치 정보를 이득 보상 복호화기(425)의 지수 계산기(425a)로 전달한다.
이득 보상 복호화기(425)는 양자화된 MDCT 계수와 펄스 위치 정보를 이용하여 이득 인덱스를 복호화하여 양자화된 이득을 출력한다. 이득 보상 복호화기(425)의 지수 계산기(425a)는 오류 보상 복호화기(427)로부터 전달된 펄스 위치 정보에 해당하는 MDCT 계수의 지수를 모두 최소값(MIN_EXP)으로 설정하고, 나머지 MDCT 계수에 대해서는 도 1 및 도 2를 참고로 하여 설명한 것처럼 지수 값을 계산한다. 이득 보상 복호화기(425)는 도 2의 지수 계산기(222)의 지수 계산 과정에서 가용 비트 수를 Benh에서 Bgc로 변경한 형태로 지수를 계산할 수 있다. 이때, 선택된 펄스 위치 정보에 해당하는 MDCT 계수의 지수가 최소값으로 설정되었으므로, 이 MDCT 계수의 양자화된 이득은 1로 설정될 수 있다. 즉, 선택된 펄스 위치 정보에서 이득 보상기(426)에 의해 이득 보상된 MDCT 계수는 양자화된 MDCT 계수와 실질적으로 동일할 수 있다.
오류 보상기(428)는 이득 보상된 MDCT 계수를 다시 오류 보상하여 복원된 MDCT 계수를 출력한다. 복원된 MDCT 계수는 수학식 9와 같이 계산될 수 있다.
여기서, 는 이득 보상된 MDCT 계수이며, 는 양자화된 MDCT 오류 계수이고, 는 복원된 MDCT 계수이다. 이때, 부호화기(410)가 선택된 펄스 위치에서만 오류 인덱스를 생성하였으므로, 양자화된 MDCT 오류 계수는 선택된 펄스 위치 이외의 위치에서는 0의 값을 가진다.
이와 같이, 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템은 선택한 펄스 위치에서는 MDCT 오류 계수를 이용하여 MDCT 계수를 복원하고, 선택한 펄스 위치 이외의 위치에서는 양자화된 이득을 이용하여 MDCT 계수를 복원할 수 있다. 즉, 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템은 오류 보상과 이득 보상을 모두 수행함으로써, 양자화 오류에 대한 보상을 효과적으로 수행할 수 있다.
도 5는 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법을 나타내는 흐름도이다.
도 5를 참고하면, 부호화기(410)는 먼저 MDCT 계수와 양자화된 MDCT 계수로부터 MDCT 오류 계수를 계산한다(S510). MDCT 오류 계수[E(k)]는 수학식 10과 같이 계산될 수 있다. MDCT 오류 계수는 복수의 부대역으로 분할(split)된다.
부호화기(410)는 계산한 MDCT 오류 계수를 이용하여 각 부대역에 대한 오류 에너지를 계산한다(S520). 여기서 부대역의 개수와 각 부대역의 경계는 코덱 설계 단계에서 미리 정해질 수 있다. 각 부대역의 오류 에너지는 수학식 11과 같이 계산될 수 있다.
여기서, e(j)는 j번째 부대역의 오류 에너지이고, M은 부대역 개수이며, lj와 uj는 각각 j번째 부대역의 하위 및 상위 경계(boundary) 인덱스이다.
부호화기(410)는 수학식 12와 같이 M개의 부대역에 대해서 가장 큰 오류 에너지를 갖는 부대역 인덱스(jmax)를 검색한다(S530).
부호화기(410)는 검색한 부대역 인덱스(jmax)를 부호화한다(S540). 예를 들어, 부대역 개수가 4인 경우 부호화기(410)는 부대역 인덱스를 2 비트로 부호화할 수 있다. 그리고 부호화기(410)는 검색한 부대역에 해당하는 MDCT 오류 계수를 부호화한다(S550). 이때, 부호화기(410)는 검색한 부대역의 MDCT 오류 계수에 대한 제곱 평균 제곱근(Root Mean Square, RMS) 값을 양자화하여 RMS 인덱스를 생성하고, 다시 역 양자화를 거쳐 RMS 인덱스로부터 양자화된 RMS 값을 구할 수 있다. 그리고 검색한 부대역의 MDCT 오류 계수를 T개의 트랙으로 나누어 각 트랙에서 절대값이 가장 큰 개의 MDCT 오류 계수를 선택한다. 여기서, 는 t번째 트랙의 펄스 개수이다. 각 트랙에서 선택된 MDCT 오류 계수, 즉 펄스는 각 트랙에서의 위치, 부호(sign) 및 크기로 나뉘고, 이들은 각각 부호화된다.
이때, 부대역 인덱스, 검색한 부대역에서 선택된 펄스들의 각 위치, 부호 및 크기가 부호화된 값, 그리고 RMS 인덱스가 오류 인덱스로 출력된다.
다음 부호화기(410)는 이득 보상 부호화를 위해 각 트랙의 MDCT 오류 계수의 위치 정보와 양자화된 MDCT 계수를 이용하여 지수 값을 계산한다(S560). 지수 값은 수학식 13과 같이 계산될 수 있다. 이때, 선택된 펄스의 경우 부호화된 값이 오류 인덱스로 제공되므로, 부호화기(410)는 비트 할당의 낭비를 방지하기 위해 선택된 펄스의 지수 값을 최소 지수 값(MIN_EXP), 예를 들면 0으로 설정한다.
부호화기(410)는 지수 값을 이용하여 도 2의 이득 보상 부호화기(116)에서 설명한 것처럼 이득 부호화 과정을 수행하여 이득 인덱스를 출력한다(S570). 이때 앞서 설명한 것처럼 이득 부호화 과정에서의 가용 비트 수는 Bgc에 해당한다.
도 6은 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법에서의 부대역 MDCT 오류 계수 부호화 과정을 나타내는 흐름도이다.
먼저 부호화기(410)의 오류 보상 부호화기(417)는 단계 S530에서 검색한 부대역의 MDCT 오류 계수에 대해서 RMS 값을 계산한 후 RMS 값을 양자화하여 RMS 인덱스를 출력한다(S610). RMS 값(rms)은 수학식 15와 같이 계산될 수 있으며, 수학식 16과 같이 RMS 인덱스(Irms)로 부호화될 수 있다.
오류 보상 부호화기(417)는 펄스 검색을 위해서 부대역 MDCT 오류 계수에 대해서 트랙을 구성한다(S620). 예를 들어, 부대역의 MDCT 오류 계수의 개수가 12개이고 각 트랙의 가능한 위치가 4개인 경우에 트랙은 인터리빙(interleaving) 여부에 따라 아래의 표 1 또는 표 2와 같이 구성될 수 있다. 표 1은 인터리빙을 하지 않은 경우의 트랙을 나타내고, 표 2는 인터리빙을 한 경우의 트랙을 나타낸다.
트랙 | 위치 |
0 | 0, 1, 2, 3 |
1 | 4, 5, 6, 7 |
2 | 8, 9, 10, 11 |
트랙 | 위치 |
0 | 0, 3, 6, 9 |
1 | 1, 4, 7, 10 |
2 | 2, 5, 8, 11 |
오류 보상 부호화기(417)는 트랙을 이용하여 각 트랙에 대해 미리 정해진 개수의 펄스를 검색한다(S630). 예를 들어, 오류 보상 부호화기(417)는 트랙 당 펄스의 개수가 1개인 경우에 각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 갖는 MDCT 오류 계수, 즉 펄스를 검색한다.
오류 보상 부호화기(417)는 단계 S630에서 검색한 펄스를 위치, 부호 및 크기 성분으로 나누고, 이들을 각각 양자화한다. 구체적으로, 오류 보상 부호화기(417)는 펄스 위치를 각 해당 트랙에서의 상대적인 위치로 부호화한다(S640). 표 1 및 표 2의 예의 경우, 각 트랙의 가능한 위치는 4개이므로 검색된 펄스의 위치는 2 비트로 부호화될 수 있다. 그리고 오류 보상 부호화기(417)는 검색한 각 펄스의 부호를 1 비트로 부호화하고(S650), 검색한 각 펄스의 절대값에 대한 양자화 과정을 거쳐 펄스 크기를 부호화한다(S660). 예를 들면, 역 양자화를 통해 단계 S610의 RMS 인덱스로부터 양자화된 RMS 값을 생성한 후에, 수학식 17과 같이 각 펄스의 크기를 양자화된 RMS 값으로 정규화한 후, 개별적으로 스칼라 양자화되거나 혹은 벡터 양자화하여 펄스 크기의 부호화된 값(Iamp)를 생성할 수도 있다.
한편, 각 트랙에서 절대값이 가장 큰 1개의 MDCT 오류 계수를 선택하는 경우, 즉 가 1인 경우에, 펄스 위치의 부호화된 값[Ipos(t)]과 펄스 부호의 부호화된 값[Isign(t)]은 각각 수학식 18 및 19와 같이 표현될 수 있다.
여기서, t는 트랙의 인덱스이고, p(t)는 t번째 트랙에서의 펄스의 상대적인 위치로 수학식 13의 pi에 해당한다.
여기서, s(t)는 t번째 트랙에서의 펄스의 부호로, 수학식 20과 같이 표현될 수 있다.
한편, 이와 같이 생성된 MDCT 인덱스, 이득 인덱스 및 오류 인덱스 등이 다중화된 비트 스트림은 예를 들면 표 3과 같이 표현될 수 있다.
Irms | Ipos(0) | Isign(0) | Ipos(1) | Isign(1) | Ipos(2) | Isign(2) | Iamp | Iopt(k) |
도 7은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법을 나타내는 흐름도이다.
도 7을 참고하면, 복호화기(420)는 MDCT 인덱스, 오류 인덱스 및 이득 인덱스를 포함하는 비트 스트림을 수신하고(S710), 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스, 이득 인덱스 및 오류 인덱스를 출력한다(S720). 다음 복호화기(420)는 MDCT 이득 인덱스를 역 양자화하여 양자화된 MDCT 계수를 출력하고(S730), 부대역 인덱스(jmax)에 해당하는 오류 인덱스를 복호화하여 MDCT 오류 계수수를 복원한다(S740). 또한 복호화기(420)는 각 트랙의 MDCT 오류 계수의 위치 정보와 양자화된 MDCT 계수를 이용하여 지수 값을 계산한다(S750). 지수 값은 도 5의 단계 S560과 동일한 방식으로 계산될 수 있다. 다음 복호화기(420)는 지수 값을 이용하여 도 2의 이득 보상 복호화기(125)에서 설명한 것처럼 이득 복호화 과정을 수행하여 이득을 복원한다(S760). 즉, 복호화기(420)는 지수 값을 이용하여 비트 할당표를 생성하고, 비트 할당표를 이용하여 이득 인덱스로부터 이득을 복원한다. 앞서 설명한 것처럼 이득 복호화 과정에서의 가용 비트 수는 Bgc에 해당한다. 이때, 선택된 펄스 위치에서 지수 값은 최소 지수 값으로 설정되었으므로, 선택된 펄스 위치에서의 복원된 이득은 양자화된 MDCT 계수를 변경시키지 않는 값, 예를 들면 1로 설정될 수 있다. 다음, 복호화기(420)는 복원한 이득으로 양자화된 MDCT 계수의 이득을 보상하고(S770), 수학식 9와 같이 MDCT 오류 계수로 이득 보상된 MDCT 계수의 오류를 보상하여 MDCT 계수를 복원한다(S780). 이득 보상된 MDCT 계수와 복원된 MDCT 계수는 각각 수학식 21 및 수학식 22와 같이 표현될 수 있다.
도 8은 본 발명의 한 실시예에 따른 MDCT 복호화 방법에서의 MDCT 오류 계수 복호화 과정을 나타내는 흐름도이다.
도 8을 참고하면, 먼저 복호화기(420)의 오류 보상할 부대역 인덱스를 복호화하고(S810), 역 양자화를 통해 RMS 인덱스로부터 양자화된 RMS 값을 계산한다(S820). 그리고 복호화기(420)는 부대역의 펄스에 대한 위치, 부호 및 크기 성분을 각각 복호화하고(S830, S840, S850), 복호화한 펄스 크기를 양자화된 RMS 값으로 역 정규화한다(S860). 즉, 복호화기(420)는 복호화한 펄스 크기에 양자화된 RMS 값을 곱하여 복호화한 펄스 크기를 역 정규화한다. 다음 복호화기(420)는 복호화한 펄스 부호와 역 정규화된 펄스 크기를 이용하여 펄스를 복원하고(S870), 복원한 펄스 위치 정보를 이용하여 미리 정해진 트랙 구조에 따라 복원한 펄스를 배치하여 양자화된 MDCT 오류 계수를 복원한다(S880). 복원된 MDCT 오류 계수는 수학식 17과 같이 주어질 수 있다.
여기서, si는 i번째 펄스의 부호이고, 는 i번째 펄스의 RMS 정규화된 양자화 펄스 크기이다. 예를 들면, pi는 수학식 24와 같이 표현될 수 있으며, si는 수학식 19 및 20의 s(t)에 해당하는 값으로 수학식 25와 같이 표현될 수 있다.
이와 같이 본 발명의 한 실시예에 따르면, 이득 보상 방식과 오류 보상 방식을 결합하여 사용함으로써 이득 보상 방식이 갖는 비트 할당과 실제 오류 계수 간의 불일치로 인한 스펙트럼 왜곡에 의해 발생할 수 있는 음질 저하를 극복할 수 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
Claims (37)
- 부호화기의 부호화 방법으로서,
입력 신호를 변환하여 제1 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 계수를 생성하는 단계,
상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성하는 단계,
상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하는 단계,
상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산하는 단계,
상기 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하는 단계, 그리고
상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 이득에 대응하는 이득 인덱스를 생성하는 단계
를 포함하는 부호화 방법. - 제1항에서,
상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 생성하는 단계를 더 포함하는 부호화 방법. - 제1항에서,
상기 오류 인덱스를 생성하는 단계는,
복수의 부대역 중에서 상기 MDCT 오류 계수의 에너지가 가장 큰 부대역의 인덱스를 검색하는 단계, 그리고
상기 인덱스를 부호화하여 부대역 인덱스를 생성하는 단계
를 포함하며,
상기 오류 인덱스는 상기 부대역 인덱스를 포함하는
부호화 방법. - 제3항에서,
상기 오류 인덱스를 생성하는 단계는, 상기 검색한 부대역의 상기 MDCT 오류 계수를 부호화하는 단계를 더 포함하는 부호화 방법. - 제5항에서,
상기 MDCT 오류 계수를 부호화하는 단계는,
상기 검색한 부대역의 MDCT 오류 계수에 대한 복수의 트랙을 구성하는 단계,
각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 가지는 미리 정해진 개수의 MDCT 오류 계수에 해당하는 펄스를 검색하는 단계, 그리고
상기 펄스를 부호화하는 단계
를 더 포함하며,
상기 오류 인덱스는 상기 펄스를 부호화한 값을 더 포함하는
부호화 방법. - 제6항에서,
상기 펄스를 부호화하는 단계는,
상기 펄스의 위치를 부호화하는 단계,
상기 펄스의 부호(sign)를 부호화하는 단계, 그리고
상기 펄스의 크기를 부호화하는 단계
를 포함하며,
상기 펄스를 부호화한 값은 상기 위치, 부호 및 크기를 각각 부호화한 값을 포함하는
부호화 방법. - 제7항에서,
상기 위치는 상기 검색한 부대역의 하위 경계 인덱스를 기준으로 한 상기 펄스의 상대적 위치인 부호화 방법. - 제7항에서,
상기 MDCT 오류 계수를 부호화하는 단계는,
상기 검색한 부대역의 MDCT 오류 계수의 제곱 평균 제곱근(Root Mean Square, RMS) 값을 계산하는 단계, 그리고
상기 RMS 값을 양자화하여 RMS 인덱스를 생성하는 단계
를 포함하며,
상기 오류 인덱스는 상기 RMS 인덱스를 더 포함하는
부호화 방법. - 제9항에서,
상기 펄스의 크기를 부호화하는 단계는,
상기 RMS 인덱스를 역 양자화하여 양자화된 RMS 값을 생성하는 단계, 그리고
상기 펄스의 크기를 상기 양자화된 RMS 값으로 나눈 값을 이용하여 상기 펄스의 크기를 부호화하는 단계
를 포함하는 부호화 방법. - 제6항에서,
상기 이득 인덱스를 생성하는 단계는,
상기 펄스의 위치를 제외한 위치에서 상기 제2 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계,
상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계, 그리고
상기 지수 값에 기초하여 상기 이득 인덱스를 위한 비트를 할당하는 단계
를 포함하는 부호화 방법. - 제11항에서,
상기 이득 인덱스를 생성하는 단계는, 상기 할당한 비트, 상기 제1 MDCT 계수 및 상기 제2 MDCT 계수로부터 상기 이득 인덱스를 결정하는 단계를 더 포함하는 부호화 방법. - 복호화기의 복호화 방법으로서,
변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 인덱스, 오류 인덱스 및 이득 인덱스를 수신하는 단계,
상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성하는 단계,
상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하는 단계,
상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하는 단계,
복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하는 단계, 그리고
상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상하는 단계
를 포함하는 복호화 방법. - 제14항에서,
상기 오류를 보상하는 단계는 상기 제2 MDCT 계수에 상기 MDCT 오류 계수를 더하는 단계를 포함하는 복호화 방법. - 제15항에서,
상기 MDCT 오류 계수는 상기 펄스의 위치 이외의 위치에서는 0의 값을 가지는 복호화 방법. - 제14항에서,
상기 오류 인덱스는 부대역 인덱스를 포함하며,
상기 MDCT 오류 계수를 복원하는 단계는 상기 부대역 인덱스를 복호화하여 상기 MDCT 오류 계수의 부대역을 결정하는 단계를 포함하는
복호화 방법. - 제14항에서,
상기 오류 인덱스는 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 포함하는 복호화 방법. - 제18항에서,
상기 MDCT 오류 계수를 복원하는 단계는,
상기 펄스의 크기를 부호화한 값을 복호화하여 상기 펄스의 크기를 복원하는 단계,
상기 펄스의 위치를 부호화한 값을 복호화하여 상기 펄스의 위치를 복원하는 단계,
상기 펄스의 부호를 부호화한 값을 복호화하여 상기 펄스의 부호를 복원하는 단계, 그리고
상기 펄스의 위치, 부호 및 크기로 상기 MDCT 오류 계수를 복원하는 단계
를 포함하는 복호화 방법. - 제19항에서,
상기 오류 인덱스는 제곱 평균 제곱근(Root Mean Square, RMS) 인덱스를 더 포함하며,
상기 펄스의 크기를 복원하는 단계는,
상기 RMS 인덱스로부터 양자화된 RMS 값을 생성하는 단계, 그리고
복호화한 펄스의 크기에 상기 양자화된 RMS 값을 곱하여 상기 펄스의 크기를 복원하는 단계
를 포함하는 복호화 방법. - 제14항에서,
상기 이득을 복원하는 단계는,
상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계,
상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계,
상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하는 단계
를 포함하는 복호화 방법. - 제21항에서,
상기 이득을 복원하는 단계는, 상기 비트 할당표를 이용하여 상기 이득 인덱스로부터 상기 이득을 복원하는 단계를 더 포함하는 복호화 방법. - 제14항에서,
상기 제2 MDCT 계수의 오류가 보상되어 생성된 MDCT 계수를 MDCT 역 변환하여 신호를 복원하는 단계를 더 포함하는 복호화 방법. - 입력 신호를 변환하여 제1 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 계수를 생성하는 MDCT,
상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성하는 MDCT 양자화기,
상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차에 해당하는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 상기 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성하는 향상 계층 부호화기, 그리고
상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 출력하는 다중화기
를 포함하는 부호화 장치. - 제24항에서,
상기 향상 계층 부호화기는, 복수의 부대역 중에서 상기 MDCT 오류 계수의 에너지가 가장 큰 부대역을 검색하고, 상기 검색한 부대역의 인덱스를 부호화하여 부대역 인덱스를 생성하는 오류 보상 부호화기를 포함하며,
상기 오류 인덱스는 상기 부대역 인덱스를 포함하는
부호화 장치. - 제25항에서,
상기 오류 보상 부호화기는 상기 검색한 부대역의 MDCT 오류 계수에 대한 복수의 트랙을 구성하고, 각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 가지는 미리 정해진 개수의 MDCT 오류 계수에 해당하는 펄스의 위치, 부호(sign) 및 크기를 각각 부호화하며,
상기 오류 인덱스는 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 더 포함하는
부호화 장치. - 제26항에서,
상기 오류 보상 부호화기는 상기 검색한 부대역의 MDCT 오류 계수의 제곱 평균 제곱근(Root Mean Square, RMS) 값을 양자화하여 RMS 인덱스를 생성하며,
상기 오류 인덱스는 상기 RMS 인덱스를 더 포함하는
부호화 장치. - 제26항에서,
상기 향상 계층 부호화기는, 상기 펄스의 위치를 제외한 위치에서 상기 제2 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하고, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하며, 상기 지수 값에 기초하여 상기 이득 인덱스를 위한 비트를 할당하는 이득 보상 부호화기를 더 포함하는 부호화 장치. - 수신한 비트 스트림을 역 다중화하여 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 인덱스, 오류 인덱스 및 이득 인덱스를 출력하는 역 다중화기,
상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성하는 MDCT 역 양자화기, 그리고
상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하며, 상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하고, 복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하고, 상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상하는 향상 계층 복호화기
를 포함하는 복호화 장치. - 제30항에서,
상기 향상 계층 복호화기는, 상기 제2 MDCT 계수에 상기 MDCT 오류 계수를 더하여서 상기 제2 MDCT 계수의 오류를 보상하는 오류 보상기를 포함하는 복호화 장치. - 제30항에서,
상기 오류 인덱스는 부대역 인덱스, 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 포함하며,
상기 향상 계층 복호화기는, 상기 부대역 인덱스를 복호화하여 상기 MDCT 오류 계수의 부대역을 결정하고, 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 복호화하여 상기 펄스의 위치, 부호 및 크기를 복원하는 오류 보상 복호화기를 포함하는
복호화 장치. - 제32항에서,
상기 오류 인덱스는 제곱 평균 제곱근(Root Mean Square, RMS) 인덱스를 더 포함하며,
상기 오류 보상 복호화기는, 상기 RMS 인덱스로부터 양자화된 RMS 값을 생성하고, 복호화한 펄스의 크기에 상기 양자화된 RMS 값을 곱하여 상기 펄스의 크기를 복원하는
복호화 장치. - 제30항에서,
상기 향상 계층 복호화기는, 상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하고, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하며, 상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하고, 상기 이득 인덱스와 상기 비트 할당표를 이용하여 상기 이득을 복원하는 이득 보상 복호화기를 포함하는 복호화 장치. - 제30항에서,
상기 향상 계층 복호화기는, 상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하고, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하며, 상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하는 이득 보상 복호화기를 포함하는 복호화 장치. - 제35항에서,
상기 이득 보상 복호화기는 상기 비트 할당표를 이용하여 상기 이득 인덱스로부터 상기 이득을 복원하는 복호화 장치. - 제30항에서,
오류를 보상한 상기 제2 MDCT 계수를 MDCT 역 변환하여 신호를 복원하는 역 MDCT(inverse MDCT, IMDCT)를 더 포함하는 복호화 장치.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201180026855.6A CN102918590B (zh) | 2010-03-31 | 2011-03-31 | 编码方法和装置、以及解码方法和装置 |
PCT/KR2011/002227 WO2011122875A2 (ko) | 2010-03-31 | 2011-03-31 | 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
JP2013502481A JP5863765B2 (ja) | 2010-03-31 | 2011-03-31 | 符号化方法および装置、そして、復号化方法および装置 |
EP11763047.5A EP2555186A4 (en) | 2010-03-31 | 2011-03-31 | CODING METHOD AND DEVICE AND DECODING METHOD AND DEVICE |
US13/638,364 US9424857B2 (en) | 2010-03-31 | 2011-03-31 | Encoding method and apparatus, and decoding method and apparatus |
CN201410655722.0A CN104392726B (zh) | 2010-03-31 | 2011-03-31 | 编码设备和解码设备 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20100029302 | 2010-03-31 | ||
KR1020100029302 | 2010-03-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110110044A true KR20110110044A (ko) | 2011-10-06 |
KR101819180B1 KR101819180B1 (ko) | 2018-01-16 |
Family
ID=45026904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110029340A KR101819180B1 (ko) | 2010-03-31 | 2011-03-31 | 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9424857B2 (ko) |
EP (1) | EP2555186A4 (ko) |
JP (1) | JP5863765B2 (ko) |
KR (1) | KR101819180B1 (ko) |
CN (2) | CN102918590B (ko) |
WO (1) | WO2011122875A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9984697B2 (en) | 2011-07-13 | 2018-05-29 | Huawei Technologies Co., Ltd. | Audio signal coding and decoding method and device |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2908313T3 (pl) | 2011-04-15 | 2019-11-29 | Ericsson Telefon Ab L M | Adaptacyjny podział współczynnika kształt - wzmocnienie |
US9602841B2 (en) * | 2012-10-30 | 2017-03-21 | Texas Instruments Incorporated | System and method for decoding scalable video coding |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
EP3526712B1 (en) * | 2016-10-11 | 2021-03-24 | Genomsys SA | Method and system for the transmission of bioinformatics data |
CN107612658B (zh) * | 2017-10-19 | 2020-07-17 | 北京科技大学 | 一种基于b类构造格型码的高效编码调制与译码方法 |
US20230048402A1 (en) * | 2021-08-10 | 2023-02-16 | Electronics And Telecommunications Research Institute | Methods of encoding and decoding, encoder and decoder performing the methods |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2605681B2 (ja) * | 1985-10-14 | 1997-04-30 | ソニー株式会社 | 薄膜磁気ヘツド |
JP3153933B2 (ja) | 1992-06-16 | 2001-04-09 | ソニー株式会社 | データ符号化装置及び方法並びにデータ復号化装置及び方法 |
US5252782A (en) | 1992-06-29 | 1993-10-12 | E-Systems, Inc. | Apparatus for providing RFI/EMI isolation between adjacent circuit areas on a single circuit board |
JP3137550B2 (ja) | 1995-02-20 | 2001-02-26 | 松下電器産業株式会社 | 音声符号化・復号化装置 |
TW321810B (ko) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JPH11109995A (ja) | 1997-10-01 | 1999-04-23 | Victor Co Of Japan Ltd | 音響信号符号化器 |
US6704705B1 (en) * | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
WO2003077235A1 (en) | 2002-03-12 | 2003-09-18 | Nokia Corporation | Efficient improvements in scalable audio coding |
US7275036B2 (en) | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
DE10217297A1 (de) * | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
JP2005004119A (ja) | 2003-06-16 | 2005-01-06 | Victor Co Of Japan Ltd | 音響信号符号化装置及び音響信号復号化装置 |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
ES2476992T3 (es) * | 2004-11-05 | 2014-07-15 | Panasonic Corporation | Codificador, descodificador, método de codificación y método de descodificaci�n |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
KR101171098B1 (ko) | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
KR100848324B1 (ko) | 2006-12-08 | 2008-07-24 | 한국전자통신연구원 | 음성 부호화 장치 및 그 방법 |
BRPI0721079A2 (pt) * | 2006-12-13 | 2014-07-01 | Panasonic Corp | Dispositivo de codificação, dispositivo de decodificação e método dos mesmos |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
CN101527138B (zh) * | 2008-03-05 | 2011-12-28 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US10121481B2 (en) * | 2011-03-04 | 2018-11-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Post-quantization gain correction in audio coding |
-
2011
- 2011-03-31 CN CN201180026855.6A patent/CN102918590B/zh active Active
- 2011-03-31 EP EP11763047.5A patent/EP2555186A4/en not_active Withdrawn
- 2011-03-31 JP JP2013502481A patent/JP5863765B2/ja not_active Expired - Fee Related
- 2011-03-31 CN CN201410655722.0A patent/CN104392726B/zh active Active
- 2011-03-31 KR KR1020110029340A patent/KR101819180B1/ko active IP Right Grant
- 2011-03-31 WO PCT/KR2011/002227 patent/WO2011122875A2/ko active Application Filing
- 2011-03-31 US US13/638,364 patent/US9424857B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9984697B2 (en) | 2011-07-13 | 2018-05-29 | Huawei Technologies Co., Ltd. | Audio signal coding and decoding method and device |
US10546592B2 (en) | 2011-07-13 | 2020-01-28 | Huawei Technologies Co., Ltd. | Audio signal coding and decoding method and device |
US11127409B2 (en) | 2011-07-13 | 2021-09-21 | Huawei Technologies Co., Ltd. | Audio signal coding and decoding method and device |
Also Published As
Publication number | Publication date |
---|---|
US20130030795A1 (en) | 2013-01-31 |
WO2011122875A3 (ko) | 2011-12-22 |
JP2013524273A (ja) | 2013-06-17 |
KR101819180B1 (ko) | 2018-01-16 |
CN102918590B (zh) | 2014-12-10 |
EP2555186A4 (en) | 2014-04-16 |
JP5863765B2 (ja) | 2016-02-17 |
WO2011122875A2 (ko) | 2011-10-06 |
EP2555186A2 (en) | 2013-02-06 |
US9424857B2 (en) | 2016-08-23 |
CN104392726A (zh) | 2015-03-04 |
CN102918590A (zh) | 2013-02-06 |
CN104392726B (zh) | 2018-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101819180B1 (ko) | 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 | |
JP5863868B2 (ja) | 適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 | |
US20080091440A1 (en) | Sound Encoder And Sound Encoding Method | |
JP6600054B2 (ja) | 方法、符号化器、復号化器、及び移動体機器 | |
US20080140393A1 (en) | Speech coding apparatus and method | |
JP2020204784A (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
TW201324500A (zh) | 無損編碼方法、音訊編碼方法、無損解碼方法以及音訊解碼方法 | |
US20130132100A1 (en) | Apparatus and method for codec signal in a communication system | |
US9454972B2 (en) | Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech | |
US9240192B2 (en) | Device and method for efficiently encoding quantization parameters of spectral coefficient coding | |
KR20220051028A (ko) | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 | |
EP2490216B1 (en) | Layered speech coding | |
KR100789368B1 (ko) | 잔차 신호 부호화 및 복호화 장치와 그 방법 | |
US20090018823A1 (en) | Speech coding | |
KR100765747B1 (ko) | 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치 | |
KR20160098597A (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |