KR20110110044A - 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 - Google Patents

부호화 방법 및 장치, 그리고 복호화 방법 및 장치 Download PDF

Info

Publication number
KR20110110044A
KR20110110044A KR1020110029340A KR20110029340A KR20110110044A KR 20110110044 A KR20110110044 A KR 20110110044A KR 1020110029340 A KR1020110029340 A KR 1020110029340A KR 20110029340 A KR20110029340 A KR 20110029340A KR 20110110044 A KR20110110044 A KR 20110110044A
Authority
KR
South Korea
Prior art keywords
mdct
index
error
gain
coefficient
Prior art date
Application number
KR1020110029340A
Other languages
English (en)
Other versions
KR101819180B1 (ko
Inventor
성종모
김현우
배현주
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to CN201180026855.6A priority Critical patent/CN102918590B/zh
Priority to PCT/KR2011/002227 priority patent/WO2011122875A2/ko
Priority to JP2013502481A priority patent/JP5863765B2/ja
Priority to EP11763047.5A priority patent/EP2555186A4/en
Priority to US13/638,364 priority patent/US9424857B2/en
Priority to CN201410655722.0A priority patent/CN104392726B/zh
Publication of KR20110110044A publication Critical patent/KR20110110044A/ko
Application granted granted Critical
Publication of KR101819180B1 publication Critical patent/KR101819180B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

부호화기의 부호화 방법이 제공된다. 부호화기는 입력 신호를 변환하여 제1 MDCT 계수를 생성하고, 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성한다. 부호화기는 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 제1 MDCT 계수와 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산한다. 다음 부호화기는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 제1 MDCT 계수와 제2 MDCT 계수로부터 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성한다.

Description

부호화 방법 및 장치, 그리고 복호화 방법 및 장치{ENCODING METHOD AND APPARATUS, AND DECONDING METHOD AND APPARATUS}
본 발명은 부호화/복호화 방법 및 장치, 그리고 복호화 방법 및 장치에 관한 것으로, 특히 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 부호화/복호화 방법 및 장치에 관한 것이다.
음성 및 오디오를 디지털로 전송 및 저장하는 기술은 기존 전화망을 비롯한 유선 통신뿐만 아니라 이동 통신 및 VoIP(Voice over IP) 서비스에서도 널리 사용되고 있다. 음성 및 오디오 신호를 단순히 샘플링 후 디지털화하여 전송한다면 예를 들면 64kbps (8kHz로 샘플링하고 각 샘플을 8 비트로 코딩하는 경우) 정도의 데이터 전송률을 필요로 한다. 그러나 입력 신호 분석과 적절한 코딩 방법을 이용한다면 훨씬 더 낮은 데이터 전송률로 음성을 전송할 수 있다. 이러한 음성 및 오디오 압축 방법으로 파형 부호화 방법, CELP(code-Excited Linear Prediction) 부호화 및 변환 부호화 방법 등이 주로 사용되고 있다. 파형 부호화 방법은 샘플링된 각 샘플 혹은 이전 샘플과의 차이를 일정한 비트로 표현하는 것으로 가장 간단한 방법이나 상대적으로 높은 전송 비트율을 필요로 한다. CELP 부호화 방법은 음성 생성 모델에 기반한 것으로 음성을 여기 신호와 선형 예측 필터로 모델링하는 방법으로, 상대적으로 낮은 전송률로 음성을 압축할 수 있는 장점을 가지는 반면 오디오 신호에 대해서 성능이 떨어지는 단점을 갖는다. 변환 부호화 방법은 시간 영역의 음성 신호를 주파수 영역으로 변환한 후 각 주파수 성분에 해당하는 계수를 부호화하는 것으로, 사람의 청각 특성에 따라 각 주파수 성분을 부호화할 수 있는 장점을 갖는다.
최근의 통신용 음성 부호화기는 기존 전화망 대역에 해당하는 협대역 음성을 부호화하는 데서 벗어나 더 나은 자연성과 명료성을 제공할 수 있는 광대역 혹은 슈퍼 광대역 음성을 부호화하는 쪽으로 발전하고 있다. 다양한 형태의 네트워크 환경을 수용하기 위해서 하나의 부호화기에서 여러 가지 전송률을 지원하는 다중 비트율 부호화기가 주종을 이루고 있다. 이러한 추세를 반영하면서 동시에 여러 대역폭을 가진 신호를 수용하기 위한 대역폭 확장성과 각 전송률 간의 호환성을 가지는 비트율 확장성을 제공하는 임베디드 가변 비트율 음성 부호화기도 개발되고 있다. 이러한 임베디드 가변 비트율 부호화기는 높은 전송률의 비트 스트림이 낮은 전송률의 비트 스트림을 포함하는 형태로 구성되어 있으며, 이를 위해 대부분 계층형 부호화 방법을 사용하고 있다. 또한 신호 대역폭이 늘어남에 따라 음악과 같은 오디오 신호에 대한 성능도 중요하게 고려되고 있다. 이를 위해 전체 신호 대역을 나누어 저대역 신호에는 기존 파형 부호화 및 CELP 부호화를 적용하고, 고대역에 대해서는 변환 부호화를 채용하는 형태의 하이브리드 부호화가 사용되고 있다. 이와 같이, 기존의 오디오 전용 코덱 뿐만 아니라 최근에 개발되고 있는 광대역 혹은 슈퍼 광대역을 지원하는 통신용 음성 코덱에서도 변환 부호화가 널리 적용되고 있다.
이러한 변환 부호화를 위해서는 시간 영역 신호를 주파수 영역 신호로 변환이 필요한데, 많은 경우에 MDCT를 사용하고 있다. 변환된 MDCT 계수는 코덱이 갖는 제한된 비트율로 인해 발생하는 양자화 오류를 겪게 되며, 이로 인해 음성 및 오디오 품질이 저하된다. 이를 극복하기 위해 상대적으로 적은 비트율을 갖는 향상 계층을 추가하여 MDCT 양자화 오류를 보상하는 방법이 사용되고 있다.
이 경우 MDCT 계수에 동적으로 할당되는 비트 수가 양자화된 MDCT 계수의 절대값 크기에만 종속되기 때문에, 핵심 및 향상 계층의 전체 양자화 성능은 핵심 계층 MDCT 양자화 성능에 의해 결정된다. 그런데 특정 MDCT 계수에 큰 양자화 오류가 발생하는 동시에 양자화된 MDCT 계수의 크기가 다른 계수에 비해 상대적으로 작은 경우, 이러한 MDCT 계수에 적은 수의 비트가 할당되어 큰 양자화 오류를 적절하게 보상하지 못할 수 있다.
본 발명이 해결하려는 과제는 양자화 오류를 효과적으로 보상할 수 있는 부호화/복호화 방법 및 장치를 제공하는 것이다.
본 발명의 한 특징에 따르면, 부호화기의 부호화 방법이 제공된다. 상기 부호화 방법은, 입력 신호를 변환하여 제1 MDCT 계수를 생성하는 단계, 상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성하는 단계, 상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하는 단계, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산하는 단계, 상기 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하는 단계, 그리고 상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 상기 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성하는 단계를 포함한다.
상기 부호화 방법은, 상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 생성하는 단계를 더 포함할 수 있다.
상기 오류 인덱스를 생성하는 단계는, 복수의 부대역 중에서 상기 MDCT 오류 계수의 에너지가 가장 큰 부대역의 인덱스를 검색하는 단계, 그리고 상기 인덱스를 부호화하여 부대역 인덱스를 생성하는 단계를 포함할 수 있다. 그리고 상기 오류 인덱스는 상기 부대역 인덱스를 포함할 수 있다.
j번째 부대역의 상기 MDCT 오류 계수의 에너지는
Figure pat00001
로 결정될 수 있다. 이때, uj와 lj는 각각 j번째 부대역의 하위 및 상위 경계 인덱스이고, E(k)는 k번째 상기 MDCT 오류 계수이다.
상기 오류 인덱스를 생성하는 단계는, 상기 검색한 부대역의 상기 MDCT 오류 계수를 부호화하는 단계를 더 포함할 수 있다.
상기 MDCT 오류 계수를 부호화하는 단계는, 상기 검색한 부대역의 MDCT 오류 계수에 대한 복수의 트랙을 구성하는 단계, 각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 가지는 미리 정해진 개수의 MDCT 오류 계수에 해당하는 펄스를 검색하는 단계, 그리고 상기 펄스를 부호화하는 단계를 더 포함할 수 있다. 이때, 상기 오류 인덱스는 상기 펄스를 부호화한 값을 더 포함할 수 있다.
상기 펄스를 부호화하는 단계는, 상기 펄스의 위치를 부호화하는 단계, 상기 펄스의 부호(sign)를 부호화하는 단계, 그리고 상기 펄스의 크기를 부호화하는 단계를 포함할 수 있다. 이때, 상기 펄스를 부호화한 값은 상기 위치, 부호 및 크기를 각각 부호화한 값을 포함할 수 있다.
상기 위치는 상기 검색한 부대역의 하위 경계 인덱스를 기준으로 한 상기 펄스의 상대적 위치일 수 있다.
상기 MDCT 오류 계수를 부호화하는 단계는, 상기 검색한 부대역의 MDCT 오류 계수의 제곱 평균 제곱근(Root Mean Square, RMS) 값을 계산하는 단계, 그리고 상기 RMS 값을 양자화하여 RMS 인덱스를 생성하는 단계를 포함할 수 있다. 이때, 상기 오류 인덱스는 상기 RMS 인덱스를 더 포함할 수 있다.
상기 펄스의 크기를 부호화하는 단계는, 상기 RMS 인덱스를 역 양자화하여 양자화된 RMS 값을 생성하는 단계, 그리고 상기 펄스의 크기를 상기 양자화된 RMS 값으로 나눈 값을 이용하여 상기 펄스의 크기를 부호화하는 단계를 포함할 수 있다.
상기 이득 인덱스를 생성하는 단계는, 상기 펄스의 위치를 제외한 위치에서 상기 제2 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계, 그리고 상기 지수 값에 기초하여 상기 이득 인덱스를 위한 비트를 할당하는 단계를 포함할 수 있다.
상기 이득 인덱스를 생성하는 단계는, 상기 할당한 비트, 상기 제1 MDCT 계수 및 상기 제2 MDCT 계수로부터 상기 이득 인덱스를 결정하는 단계를 더 포함할 수 있다.
상기 이득 인덱스는
Figure pat00002
를 최대로 하는 i로 결정될 수 있다. 이때, 상기
Figure pat00003
는 m 비트에 해당하는 코드북의 i번째 코드워드이고, 상기 i는 0부터 (2m-1)까지의 정수이며, 상기 X(k)는 상기 k번째 제1 MDCT 오류 계수이고, 상기
Figure pat00004
는 k번째 제2 MDCT 오류 계수이다.
본 발명의 다른 특징에 따르면, 복호화기의 복호화 방법이 제공된다. 상기 복호화 방법은, MDCT 인덱스, 오류 인덱스 및 이득 인덱스를 수신하는 단계, 상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성하는 단계, 상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하는 단계, 상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하는 단계, 복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하는 단계, 그리고 상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상하는 단계를 포함한다.
상기 오류를 보상하는 단계는 상기 제2 MDCT 계수에 상기 MDCT 오류 계수를 더하는 단계를 포함할 수 있다.
상기 MDCT 오류 계수는 상기 펄스의 위치 이외의 위치에서는 0의 값을 가질 수 있다.
상기 오류 인덱스는 부대역 인덱스를 포함하며, 상기 MDCT 오류 계수를 복원하는 단계는 상기 부대역 인덱스를 복호화하여 상기 MDCT 오류 계수의 부대역을 결정하는 단계를 포함할 수 있다.
상기 오류 인덱스는 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 포함할 수 있다.
상기 MDCT 오류 계수를 복원하는 단계는, 상기 펄스의 크기를 부호화한 값을 복호화하여 상기 펄스의 크기를 복원하는 단계, 상기 펄스의 위치를 부호화한 값을 복호화하여 상기 펄스의 위치를 복원하는 단계, 상기 펄스의 부호를 부호화한 값을 복호화하여 상기 펄스의 부호를 복원하는 단계, 그리고 상기 펄스의 위치, 부호 및 크기로 상기 MDCT 오류 계수를 복원하는 단계를 포함할 수 있다.
상기 오류 인덱스는 제곱 평균 제곱근(Root Mean Square, RMS) 인덱스를 더 포함할 수 있다. 이때, 상기 펄스의 크기를 복원하는 단계는, 상기 RMS 인덱스로부터 양자화된 RMS 값을 생성하는 단계, 그리고 복호화한 펄스의 크기에 상기 양자화된 RMS 값을 곱하여 상기 펄스의 크기를 복원하는 단계를 포함할 수 있다.
상기 이득을 복원하는 단계는, 상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계, 그리고 상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하는 단계를 포함할 수 있다.
상기 이득을 복원하는 단계는, 상기 비트 할당표를 이용하여 상기 이득 인덱스로부터 상기 이득을 복원하는 단계를 더 포함할 수 있다.
상기 복호화 방법은, 상기 제2 MDCT 계수의 오류가 보상되어 생성된 MDCT 계수를 MDCT 역 변환하여 신호를 복원하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, MDCT, MDCT 양자화기, 향상 계층 부호화기 및 다중화기를 포함하는 부호화 장치를 제공한다. 상기 MDCT는 입력 신호를 변환하여 제1 MDCT 계수를 생성하고, 상기 MDCT 양자화기는 상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성한다. 상기 향상 계층 부호화기는 상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차에 해당하는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 상기 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성한다. 상기 다중화기는 상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 출력한다.
본 발명의 또 다른 특징에 따르면, 역 다중화기, MDCT 역 양자화기 및 향상 계층 복호화기를 포함하는 복호화 장치가 제공된다. 상기 역 다중화기는 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스, 오류 인덱스 및 이득 인덱스를 출력하고, 상기 MDCT 역 양자화기는 상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성한다. 상기 향상 계층 복호화기는 상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하며, 상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하고, 복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하고, 상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상한다.
본 발명의 한 실시예에 따르면, 이득 보상 방식과 오류 보상 방식을 결합하여 사용함으로써 이득 보상 방식이 갖는 비트 할당과 실제 오류 계수 간의 불일치로 인한 스펙트럼 왜곡에 의해 발생할 수 있는 음질 저하를 극복할 수 있다.
도 1은 계층형 MDCT 양자화 시스템의 한 예를 나타내는 블록도이다.
도 2는 도 1에 도시한 이득 보상 부호화기와 이득 보상 복호화기를 나타내는 블록도이다.
도 3은 도 1에 도시한 MDCT 양자화 시스템의 성능을 나타내는 도면이다.
도 4는 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템을 나타내는 블록도이다.
도 5는 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법을 나타내는 흐름도이다.
도 6은 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법에서의 부대역 MDCT 오류 계수 부호화 과정을 나타내는 흐름도이다.
도 7은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법을 나타내는 흐름도이다.
도 8은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법에서의 MDCT 오류 계수 복호화 과정을 나타내는 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 계층형 MDCT 양자화 시스템의 한 예를 나타내는 블록도이며, 도 2는 도 1에 도시한 이득 보상 부호화기와 이득 보상 복호화기를 나타내는 블록도이고, 도 3은 도 1에 도시한 MDCT 양자화 장치의 성능을 나타내는 도면이다.
도 1을 참고하면, 계층형 MDCT 양자화 시스템은 입력 신호를 부호화하여 비트 스트림을 출력하는 부호화기(110)와 비트 스트림을 복호화하여 복원한 신호를 출력하는 복호화기(120)를 포함한다.
부호화기(110)는 MDCT(111), 핵심 계층 MDCT 양자화기(112), 향상 계층 부호화기(113) 및 다중화기(114)를 포함하며, 향상 계층 부호화기(113)는 로컬 MDCT 역 양자화기(115)와 이득 보상 부호화기(116)를 포함한다.
MDCT(111)는 입력 신호를 수학식 1처럼 MDCT 변환하여 MDCT 계수를 출력한다.
Figure pat00005
여기서, N은 시간 영역 입력 신호를 블록 단위로 처리하기 위한 프레임의 길이, w(n)은 윈도 함수, x(n)은 입력 신호, X(k)는 MDCT 계수이다. n은 시간 영역 인덱스이며, k는 주파수 영역 인덱스이다.
핵심 계층 MDCT 양자화기(112)는 MDCT 계수를 양자화하여 MDCT 인덱스를 출력한다. 핵심 계층 MDCT 양자화기(112)는 셰이프 게인(shape-gain) 벡터 양자화(vector quantization, VQ), 격자형 벡터 양자화(lattice VQ), 구형 벡터 양자화(spherical VQ) 및 대수 벡터 양자화(algebraic VQ) 등의 모든 방식의 MDCT 양자화 방식이 사용될 수 있다.
MDCT 로컬 역 양자화기(115)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다. 이득 보상 부호화기(116)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수로부터 이득을 계산한 후, 그 이득을 양자화하여 이득 인덱스를 출력한다.
다중화기(114)는 MDCT 인덱스와 이득 인덱스를 다중화하여 비트 스트림을 출력한다.
복호화기(120)는 역 다중화기(121), 핵심 계층 MDCT 역 양자화기(122), 향상 계층 복호화기(123) 및 역 MDCT(inverse MDCT, IMDCT)(124)를 포함하며, 향상 계층 복호화기(123)는 이득 보상 복호화기(125)와 이득 보상기(126)를 포함한다.
역 다중화기(121)는 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스와 이득 인덱스를 각각 출력한다.
핵심 계층 MDCT 역 양자화기(122)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다.
이득 보상 복호화기(125)는 양자화된 MDCT 계수를 이용하여 이득 인덱스를 복호화하여 양자화된 이득을 출력한다. 이득 보상기(126)는 양자화된 MDCT 계수를 양자화된 이득으로 스케일링(scaling)하여 최종적으로 복원된 MDCT 계수를 출력한다. 복원된 MDCT 계수는 수학식 2처럼 주어질 수 있다.
Figure pat00006
여기서,
Figure pat00007
Figure pat00008
는 각각 양자화된 MDCT 계수와 복원된 MDCT 계수이며,
Figure pat00009
는 양자화된 이득이다.
IMDCT(124)는 복원된 MDCT 계수를 수학식 3처럼 역 변환하여 복원된 신호를 출력한다.
Figure pat00010
여기서, y(n)는 현재 프레임에서 역 변환된 시간 영역 신호, y'(n)은 이전 프레임에서 역 변환된 시간 영역 신호이고,
Figure pat00011
는 복원된 신호이다.
도 2를 참고하면, 이득 보상 부호화기(116)는 지수(exponent) 계산기(211), 비트 할당 계산기(212), 이득 계산기(213), 이득 양자화기(214) 및 다중화기(215)를 포함한다. 지수 계산기(211)는 양자화된 각 MDCT 계수의 절대값 크기를 미리 정해진 간격으로 나누어 지수를 계산한다. 예를 들어, 간격을 밑이 2인 로그 단위로 설정한다면, 지수 계산기(211)는 수학식 4와 같이 양자화된 MDCT 계수의 로그 함수 값으로 지수를 계산할 수 있다. 따라서, 계산된 지수는 양자화된 MDCT 계수의 절대 크기에 지수적으로 비례한다.
Figure pat00012
여기서, |·|는 절대값 함수이고
Figure pat00013
는 라운딩(rounding) 함수이며, MIN_EXP와 MAX_EXP는 각각 최소 지수 값과 최대 지수 값이다.
비트 할당 계산기(212)는 프레임 내 모든 MDCT 계수에 대한 지수 값과 미리 정해진 가용 비트 수를 이용하여 각 MDCT 계수의 이득 양자화를 위한 비트 수를 동적으로 계산하여 비트 할당표를 출력한다. 여기서, 비트 할당표는 가용 비트 수 한도 내에서 각 MDCT 계수의 보상 이득에 할당된 양자화 비트 수를 저장한 것이다. 이때, 비트 할당 계산기(212)는 수학식 5처럼 각 MDCT 계수당 허용 가능한 최소 및 최대 이득 비트 수를 제한할 수도 있다.
Figure pat00014
여기서, b(k)는 k번째 MDCT 계수에 할당된 이득 비트 수이며, MIN_BITS와 MAX_BITS는 각각 최소 이득 비트 수와 최대 이득 비트 수이고, Benh는 향상 계층에 할당된 총 비트 수이다.
이득 계산기(213)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수 간의 이득을 계산하여 각 MDCT 계수에 대한 이득을 출력한다. 이득 계산기(213)는 수학식 5와 같이 이득 오차 에너지를 최소화하도록 이득을 계산할 수 있다.
Figure pat00015
여기서, Err(k)는 k번째 MDCT 계수에 대한 이득 오차 에너지이고, g(k)는 k번째 MDCT 계수에 대한 이득이다.
이득 양자화기(214)는 이득을 비트 할당표의 각 MDCT 계수에 해당하는 양자화 비트 수에 따라 양자화하여 이득 인덱스를 출력한다. 이득 양자화를 위해 별도의 이득 양자화 코드북을 이용하는 경우, 이득 계산기(213)와 이득 양자화기(214)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수를 이용하여 이득 양자화 코드북 검색을 통해 이득 인덱스를 구할 수도 있다. 이때, 이득 인덱스는 수학식 7처럼 주어질 수 있다.
Figure pat00016
여기서,
Figure pat00017
는 m 비트에 해당하는 코드북으로 2m개의 코드워드를 갖는다.
Figure pat00018
는 m 비트에 해당하는 코드북의 i번째 코드워드이고, Iopt(k)는 k번째 MDCT 계수에 해당하는 최적의 이득 인덱스이다.
다중화기(215)는 복수의 MDCT 계수에 대한 이득 인덱스를 다중화하여 이득 비트 스트림을 출력한다.
이득 보상 복호화기(125)는 역 다중화기(221), 지수 계산기(222), 비트 할당 계산기(223) 및 이득 역 양자화기(224)를 포함한다.
지수 계산기(222)와 비트 할당 계산기(223)는 각각 이득 보상 부호화기(116)의 지수 계산기(211)와 비트 할당 계산기(212)와 동일하게 동작하여 비트 할당표를 출력한다. 역 다중화기(221)는 비트 할당표에 따라 이득 비트 스트림을 역 다중화하여 복수의 MDCT 계수에 대한 이득 인덱스를 추출한다. 이득 역 양자화기(224)는 각 이득 인덱스와 비트 할당표를 이용하여 각 MDCT 계수에 대한 양자화된 이득을 복원한다.
도 1 및 도 2를 참고로 하여 설명한 주파수 대역 계수, 즉 MDCT 계수 보상 방법은 상대적으로 간단하고 우수한 성능을 제공할 수 있다. 그러나 각 MDCT 계수에 동적으로 할당되는 비트 수가 전적으로 양자화된 MDCT 계수의 절대값 크기에만 종속되기 때문에, 핵심 및 향상 계층의 전체 양자화 성능은 핵심 계층 MDCT 양자화기(112)의 성능에 따라 보상 성능이 저하될 수 있다. 즉, 핵심 계층 MDCT 양자화기(112)가 특정 MDCT 계수를 잘 표현하지 못하여 큰 양자화 오류를 초래하고 동시에 양자화된 MDCT 계수의 크기가 다른 계수에 비해 상대적으로 작은 경우에는, 동적 비트 할당기에 의해서 이러한 MDCT 계수에 적은 수의 비트가 할당되어 핵심 계층으로 인한 큰 양자화 오류에 대한 보상이 효과적으로 이루어지지 못한다.
도 3을 참고하면, 입력 음성 신호의 특정 프레임에 대해서 도 1 및 도 2에서 설명한 방식으로 얻어진 비트 할당표와 MDCT 오류 계수(residual coefficient)의 크기를 알 수 있다. 도 3에서 프레임 길이(N)는 40이고, MDCT 계수당 최소 비트 수와 최대 비트 수는 각각 0과 3 비트이다. 이 경우, 처음 여섯 개의 MDCT 계수의 오류 계수가 나머지 오류 계수들에 비해 상당히 큼에도 불구하고 모두 0 비트가 할당된 것을 알 수 있다.
아래에서는 비트 할당표와 MDCT 오류 계수 사이의 불일치를 완화시킬 수 있는 주파수 대역 계수 보상 양자화 장치 및 방법에 대해서 설명한다.
도 4는 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템을 나타내는 블록도이다.
도 4를 참고하면, 계층형 MDCT 양자화 시스템은 계층형 MDCT 양자화 방식을 이용한 음성 및 오디오 부호화기(410)와 복호화기(420)를 포함한다.
부호화기(410)는 MDCT(411), 핵심 계층 MDCT 양자화기(412), 향상 계층 부호화기(413) 및 다중화기(414)를 포함하며, 향상 계층 부호화기(413)는 로컬 MDCT 역 양자화기(415), 이득 보상 부호화기(416) 및 오류 보상 부호화기(417)를 포함한다.
MDCT(411)는 입력 신호를 MDCT 변환하여 MDCT 계수를 출력한다. 여기서, 입력 신호는 전체 신호 대역을 포함하는 전대역 음성 및/또는 오디오 신호이거나, 대역 분할 코덱의 일부 대역만을 갖는 신호 또는 스케일러블 코덱의 잔차 신호 등이 될 수 있다. 핵심 계층 MDCT 양자화기(412)는 MDCT 계수를 양자화하여 MDCT 인덱스를 출력한다. MDCT 로컬 역 양자화기(415)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다. MDCT(411), 핵심 계층 MDCT 양자화기(412) 및 MDCT 로컬 역 양자화기(415)는 도 1을 참고로 하여 설명한 MDCT(111), 핵심 계층 MDCT 양자화기(112) 및 MDCT 로컬 역 양자화기(115)와 동일하게 동작할 수 있다.
수학식 8과 같이, 향상 계층을 위해 할당된 총 비트 수가 이득 보상 부호화기(416)의 이득 보상 부호화와 오류 보상 부호화기(417)의 오류 보상 부호화에 나누어 할당된다.
Figure pat00019
여기서, Benh는 향상 계층 전체에 할당된 총 비트 수이고, Bgc와 Bec는 각각 이득 보상 부호화기(416)에 할당된 비트 수와 오류 보상 부호화기(417)에 할당된 비트 수이다. 이때, 향상 계층 전체에 할당된 총 비트 수(Benh)는 도 2의 가용 비트 수와 동일할 수 있다.
오류 보상 부호화기(417)는 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수로부터 MDCT 오류 계수를 계산한다. 이때, MDCT 오류 계수는 예를 들면 양자화되지 않은 MDCT 계수와 양자화된 MDCT 계수의 차로 계산될 수 있다. 오류 보상 부호화기(417)는 전체 MDCT 오류 계수 중 미리 정해진 개수의 MDCT 오류 계수를 선택하고, 선택한 MDCT 오류 계수를 양자화하여 오류 인덱스를 출력한다. 또한 오류 보상 부호화기(417)는 선택한 MDCT 오류 계수의 위치 정보, 즉 펄스 위치 정보를 이득 보상 부호화기(416)의 지수 계산기(416a)로 전달한다.
이득 보상 부호화기(416)는 양자화되지 않은 MDCT 계수, 양자화된 MDCT 계수 및 펄스 위치 정보를 이용하여 이득을 계산하고, 각 이득을 양자화하여 이득 인덱스를 출력한다. 이득 보상 부호화기(416)의 지수 계산기(416a)는 오류 보상 부호화기(417)로부터 전달된 펄스 위치 정보에 해당하는 MDCT 계수의 지수를 모두 최소값(MIN_EXP)으로 설정하고, 나머지 MDCT 계수에 대해서는 도 1 및 도 2를 참고로 하여 설명한 것처럼 지수 값을 계산한다. 이때, 이득 보상 부호화기(416)는 도 2의 지수 계산기(211)의 지수 계산 과정에서 가용 비트 수를 Benh에서 Bgc로 변경한 형태로 지수를 계산할 수 있다.
다중화기(414)는 MDCT 인덱스, 이득 인덱스 및 오류 인덱스를 다중화하여 비트 스트림을 출력한다.
복호화기(420)는 역 다중화기(421), 핵심 계층 MDCT 역 양자화기(422), 향상 계층 복호화기(423) 및 IMDCT(424)를 포함하며, 향상 계층 복호화기(423)는 이득 보상 복호화기(425), 이득 보상기(426), 오류 보상 복호화기(427) 및 오류 보상기(428)를 포함한다.
역 다중화기(421)는 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스, 이득 인덱스 및 오류 인덱스를 각각 출력한다.
핵심 계층 MDCT 역 양자화기(422)는 역 양자화 과정을 거쳐 MDCT 인덱스로부터 양자화된 MDCT 계수를 출력한다. 이득 보상기(426)는 양자화된 이득으로 양자화된 MDCT 계수를 스케일링하여 이득 보상된 MDCT 계수를 출력한다. IMDCT(424)는 복원된 MDCT 계수를 MDCT 역 변환하여 복원된 신호를 출력한다. 핵심 계층 MDCT 역 양자화기(422), 이득 보상기(426) 및 IMDCT(424)는 도 1을 참고로 하여 설명한 핵심 계층 MDCT 역 양자화기(122), 이득 보상기(126) 및 IMDCT(124)와 동일하게 동작할 수 있다.
오류 보상 복호화기(427)는 오류 인덱스를 복호화하여 양자화된 MDCT 오류 계수를 출력하고, 선택된 MDCT 오류 계수 각각에 대한 펄스 위치 정보를 이득 보상 복호화기(425)의 지수 계산기(425a)로 전달한다.
이득 보상 복호화기(425)는 양자화된 MDCT 계수와 펄스 위치 정보를 이용하여 이득 인덱스를 복호화하여 양자화된 이득을 출력한다. 이득 보상 복호화기(425)의 지수 계산기(425a)는 오류 보상 복호화기(427)로부터 전달된 펄스 위치 정보에 해당하는 MDCT 계수의 지수를 모두 최소값(MIN_EXP)으로 설정하고, 나머지 MDCT 계수에 대해서는 도 1 및 도 2를 참고로 하여 설명한 것처럼 지수 값을 계산한다. 이득 보상 복호화기(425)는 도 2의 지수 계산기(222)의 지수 계산 과정에서 가용 비트 수를 Benh에서 Bgc로 변경한 형태로 지수를 계산할 수 있다. 이때, 선택된 펄스 위치 정보에 해당하는 MDCT 계수의 지수가 최소값으로 설정되었으므로, 이 MDCT 계수의 양자화된 이득은 1로 설정될 수 있다. 즉, 선택된 펄스 위치 정보에서 이득 보상기(426)에 의해 이득 보상된 MDCT 계수는 양자화된 MDCT 계수와 실질적으로 동일할 수 있다.
오류 보상기(428)는 이득 보상된 MDCT 계수를 다시 오류 보상하여 복원된 MDCT 계수를 출력한다. 복원된 MDCT 계수는 수학식 9와 같이 계산될 수 있다.
Figure pat00020
여기서,
Figure pat00021
는 이득 보상된 MDCT 계수이며,
Figure pat00022
는 양자화된 MDCT 오류 계수이고,
Figure pat00023
는 복원된 MDCT 계수이다. 이때, 부호화기(410)가 선택된 펄스 위치에서만 오류 인덱스를 생성하였으므로, 양자화된 MDCT 오류 계수는 선택된 펄스 위치 이외의 위치에서는 0의 값을 가진다.
이와 같이, 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템은 선택한 펄스 위치에서는 MDCT 오류 계수를 이용하여 MDCT 계수를 복원하고, 선택한 펄스 위치 이외의 위치에서는 양자화된 이득을 이용하여 MDCT 계수를 복원할 수 있다. 즉, 본 발명의 한 실시예에 따른 계층형 MDCT 양자화 시스템은 오류 보상과 이득 보상을 모두 수행함으로써, 양자화 오류에 대한 보상을 효과적으로 수행할 수 있다.
도 5는 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법을 나타내는 흐름도이다.
도 5를 참고하면, 부호화기(410)는 먼저 MDCT 계수와 양자화된 MDCT 계수로부터 MDCT 오류 계수를 계산한다(S510). MDCT 오류 계수[E(k)]는 수학식 10과 같이 계산될 수 있다. MDCT 오류 계수는 복수의 부대역으로 분할(split)된다.
Figure pat00024
부호화기(410)는 계산한 MDCT 오류 계수를 이용하여 각 부대역에 대한 오류 에너지를 계산한다(S520). 여기서 부대역의 개수와 각 부대역의 경계는 코덱 설계 단계에서 미리 정해질 수 있다. 각 부대역의 오류 에너지는 수학식 11과 같이 계산될 수 있다.
Figure pat00025
여기서, e(j)는 j번째 부대역의 오류 에너지이고, M은 부대역 개수이며, lj와 uj는 각각 j번째 부대역의 하위 및 상위 경계(boundary) 인덱스이다.
부호화기(410)는 수학식 12와 같이 M개의 부대역에 대해서 가장 큰 오류 에너지를 갖는 부대역 인덱스(jmax)를 검색한다(S530).
Figure pat00026
부호화기(410)는 검색한 부대역 인덱스(jmax)를 부호화한다(S540). 예를 들어, 부대역 개수가 4인 경우 부호화기(410)는 부대역 인덱스를 2 비트로 부호화할 수 있다. 그리고 부호화기(410)는 검색한 부대역에 해당하는 MDCT 오류 계수를 부호화한다(S550). 이때, 부호화기(410)는 검색한 부대역의 MDCT 오류 계수에 대한 제곱 평균 제곱근(Root Mean Square, RMS) 값을 양자화하여 RMS 인덱스를 생성하고, 다시 역 양자화를 거쳐 RMS 인덱스로부터 양자화된 RMS 값을 구할 수 있다. 그리고 검색한 부대역의 MDCT 오류 계수를 T개의 트랙으로 나누어 각 트랙에서 절대값이 가장 큰
Figure pat00027
개의 MDCT 오류 계수를 선택한다. 여기서,
Figure pat00028
는 t번째 트랙의 펄스 개수이다. 각 트랙에서 선택된 MDCT 오류 계수, 즉 펄스는 각 트랙에서의 위치, 부호(sign) 및 크기로 나뉘고, 이들은 각각 부호화된다.
이때, 부대역 인덱스, 검색한 부대역에서 선택된 펄스들의 각 위치, 부호 및 크기가 부호화된 값, 그리고 RMS 인덱스가 오류 인덱스로 출력된다.
다음 부호화기(410)는 이득 보상 부호화를 위해 각 트랙의 MDCT 오류 계수의 위치 정보와 양자화된 MDCT 계수를 이용하여 지수 값을 계산한다(S560). 지수 값은 수학식 13과 같이 계산될 수 있다. 이때, 선택된 펄스의 경우 부호화된 값이 오류 인덱스로 제공되므로, 부호화기(410)는 비트 할당의 낭비를 방지하기 위해 선택된 펄스의 지수 값을 최소 지수 값(MIN_EXP), 예를 들면 0으로 설정한다.
Figure pat00029
여기서, pi는 i번째 펄스의
Figure pat00030
(즉, 검색한 부대역의 하위 경계 인덱스)를 기준으로 한 상대적인 위치이고 Np는 총 펄스의 개수이며 수학식 14와 같이 주어질 수 있다.
Figure pat00031
부호화기(410)는 지수 값을 이용하여 도 2의 이득 보상 부호화기(116)에서 설명한 것처럼 이득 부호화 과정을 수행하여 이득 인덱스를 출력한다(S570). 이때 앞서 설명한 것처럼 이득 부호화 과정에서의 가용 비트 수는 Bgc에 해당한다.
도 6은 본 발명의 한 실시예에 따른 MDCT 향상 계층 부호화 방법에서의 부대역 MDCT 오류 계수 부호화 과정을 나타내는 흐름도이다.
먼저 부호화기(410)의 오류 보상 부호화기(417)는 단계 S530에서 검색한 부대역의 MDCT 오류 계수에 대해서 RMS 값을 계산한 후 RMS 값을 양자화하여 RMS 인덱스를 출력한다(S610). RMS 값(rms)은 수학식 15와 같이 계산될 수 있으며, 수학식 16과 같이 RMS 인덱스(Irms)로 부호화될 수 있다.
Figure pat00032
여기서,
Figure pat00033
는 jmax번째 부대역의 MDCT 오류 계수의 개수이다.
Figure pat00034
오류 보상 부호화기(417)는 펄스 검색을 위해서 부대역 MDCT 오류 계수에 대해서 트랙을 구성한다(S620). 예를 들어, 부대역의 MDCT 오류 계수의 개수가 12개이고 각 트랙의 가능한 위치가 4개인 경우에 트랙은 인터리빙(interleaving) 여부에 따라 아래의 표 1 또는 표 2와 같이 구성될 수 있다. 표 1은 인터리빙을 하지 않은 경우의 트랙을 나타내고, 표 2는 인터리빙을 한 경우의 트랙을 나타낸다.
트랙 위치
0 0, 1, 2, 3
1 4, 5, 6, 7
2 8, 9, 10, 11
트랙 위치
0 0, 3, 6, 9
1 1, 4, 7, 10
2 2, 5, 8, 11
여기서, 각 위치의 인덱스는
Figure pat00035
를 기준으로 한 상대적인 위치를 나타낸 것이다.
오류 보상 부호화기(417)는 트랙을 이용하여 각 트랙에 대해 미리 정해진 개수의 펄스를 검색한다(S630). 예를 들어, 오류 보상 부호화기(417)는 트랙 당 펄스의 개수가 1개인 경우에 각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 갖는 MDCT 오류 계수, 즉 펄스를 검색한다.
오류 보상 부호화기(417)는 단계 S630에서 검색한 펄스를 위치, 부호 및 크기 성분으로 나누고, 이들을 각각 양자화한다. 구체적으로, 오류 보상 부호화기(417)는 펄스 위치를 각 해당 트랙에서의 상대적인 위치로 부호화한다(S640). 표 1 및 표 2의 예의 경우, 각 트랙의 가능한 위치는 4개이므로 검색된 펄스의 위치는 2 비트로 부호화될 수 있다. 그리고 오류 보상 부호화기(417)는 검색한 각 펄스의 부호를 1 비트로 부호화하고(S650), 검색한 각 펄스의 절대값에 대한 양자화 과정을 거쳐 펄스 크기를 부호화한다(S660). 예를 들면, 역 양자화를 통해 단계 S610의 RMS 인덱스로부터 양자화된 RMS 값을 생성한 후에, 수학식 17과 같이 각 펄스의 크기를 양자화된 RMS 값으로 정규화한 후, 개별적으로 스칼라 양자화되거나 혹은 벡터 양자화하여 펄스 크기의 부호화된 값(Iamp)를 생성할 수도 있다.
Figure pat00036
여기서,
Figure pat00037
는 i번째 펄스의 RMS 정규화된 펄스 크기이고, rms_q는 양자화된 RMS 값이다.
한편, 각 트랙에서 절대값이 가장 큰 1개의 MDCT 오류 계수를 선택하는 경우, 즉
Figure pat00038
가 1인 경우에, 펄스 위치의 부호화된 값[Ipos(t)]과 펄스 부호의 부호화된 값[Isign(t)]은 각각 수학식 18 및 19와 같이 표현될 수 있다.
Figure pat00039
여기서, t는 트랙의 인덱스이고, p(t)는 t번째 트랙에서의 펄스의 상대적인 위치로 수학식 13의 pi에 해당한다.
Figure pat00040
여기서, s(t)는 t번째 트랙에서의 펄스의 부호로, 수학식 20과 같이 표현될 수 있다.
Figure pat00041
한편, 이와 같이 생성된 MDCT 인덱스, 이득 인덱스 및 오류 인덱스 등이 다중화된 비트 스트림은 예를 들면 표 3과 같이 표현될 수 있다.
Irms Ipos(0) Isign(0) Ipos(1) Isign(1) Ipos(2) Isign(2) Iamp Iopt(k)
도 7은 본 발명의 한 실시예에 따른 MDCT 향상 계층 복호화 방법을 나타내는 흐름도이다.
도 7을 참고하면, 복호화기(420)는 MDCT 인덱스, 오류 인덱스 및 이득 인덱스를 포함하는 비트 스트림을 수신하고(S710), 수신한 비트 스트림을 역 다중화하여 MDCT 인덱스, 이득 인덱스 및 오류 인덱스를 출력한다(S720). 다음 복호화기(420)는 MDCT 이득 인덱스를 역 양자화하여 양자화된 MDCT 계수를 출력하고(S730), 부대역 인덱스(jmax)에 해당하는 오류 인덱스를 복호화하여 MDCT 오류 계수수를 복원한다(S740). 또한 복호화기(420)는 각 트랙의 MDCT 오류 계수의 위치 정보와 양자화된 MDCT 계수를 이용하여 지수 값을 계산한다(S750). 지수 값은 도 5의 단계 S560과 동일한 방식으로 계산될 수 있다. 다음 복호화기(420)는 지수 값을 이용하여 도 2의 이득 보상 복호화기(125)에서 설명한 것처럼 이득 복호화 과정을 수행하여 이득을 복원한다(S760). 즉, 복호화기(420)는 지수 값을 이용하여 비트 할당표를 생성하고, 비트 할당표를 이용하여 이득 인덱스로부터 이득을 복원한다. 앞서 설명한 것처럼 이득 복호화 과정에서의 가용 비트 수는 Bgc에 해당한다. 이때, 선택된 펄스 위치에서 지수 값은 최소 지수 값으로 설정되었으므로, 선택된 펄스 위치에서의 복원된 이득은 양자화된 MDCT 계수를 변경시키지 않는 값, 예를 들면 1로 설정될 수 있다. 다음, 복호화기(420)는 복원한 이득으로 양자화된 MDCT 계수의 이득을 보상하고(S770), 수학식 9와 같이 MDCT 오류 계수로 이득 보상된 MDCT 계수의 오류를 보상하여 MDCT 계수를 복원한다(S780). 이득 보상된 MDCT 계수와 복원된 MDCT 계수는 각각 수학식 21 및 수학식 22와 같이 표현될 수 있다.
Figure pat00042
여기서,
Figure pat00043
은 수학식 7에서 i가 Iopt(k)인 코드워드를 나타낸다.
Figure pat00044
도 8은 본 발명의 한 실시예에 따른 MDCT 복호화 방법에서의 MDCT 오류 계수 복호화 과정을 나타내는 흐름도이다.
도 8을 참고하면, 먼저 복호화기(420)의 오류 보상할 부대역 인덱스를 복호화하고(S810), 역 양자화를 통해 RMS 인덱스로부터 양자화된 RMS 값을 계산한다(S820). 그리고 복호화기(420)는 부대역의 펄스에 대한 위치, 부호 및 크기 성분을 각각 복호화하고(S830, S840, S850), 복호화한 펄스 크기를 양자화된 RMS 값으로 역 정규화한다(S860). 즉, 복호화기(420)는 복호화한 펄스 크기에 양자화된 RMS 값을 곱하여 복호화한 펄스 크기를 역 정규화한다. 다음 복호화기(420)는 복호화한 펄스 부호와 역 정규화된 펄스 크기를 이용하여 펄스를 복원하고(S870), 복원한 펄스 위치 정보를 이용하여 미리 정해진 트랙 구조에 따라 복원한 펄스를 배치하여 양자화된 MDCT 오류 계수를 복원한다(S880). 복원된 MDCT 오류 계수는 수학식 17과 같이 주어질 수 있다.
여기서, si는 i번째 펄스의 부호이고, 는 i번째 펄스의 RMS 정규화된 양자화 펄스 크기이다. 예를 들면, pi는 수학식 24와 같이 표현될 수 있으며, si는 수학식 19 및 20의 s(t)에 해당하는 값으로 수학식 25와 같이 표현될 수 있다.
Figure pat00047
Figure pat00048
이와 같이 본 발명의 한 실시예에 따르면, 이득 보상 방식과 오류 보상 방식을 결합하여 사용함으로써 이득 보상 방식이 갖는 비트 할당과 실제 오류 계수 간의 불일치로 인한 스펙트럼 왜곡에 의해 발생할 수 있는 음질 저하를 극복할 수 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (37)

  1. 부호화기의 부호화 방법으로서,
    입력 신호를 변환하여 제1 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 계수를 생성하는 단계,
    상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성하는 단계,
    상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하는 단계,
    상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차로 MDCT 오류 계수를 계산하는 단계,
    상기 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하는 단계, 그리고
    상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 이득에 대응하는 이득 인덱스를 생성하는 단계
    를 포함하는 부호화 방법.
  2. 제1항에서,
    상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 생성하는 단계를 더 포함하는 부호화 방법.
  3. 제1항에서,
    상기 오류 인덱스를 생성하는 단계는,
    복수의 부대역 중에서 상기 MDCT 오류 계수의 에너지가 가장 큰 부대역의 인덱스를 검색하는 단계, 그리고
    상기 인덱스를 부호화하여 부대역 인덱스를 생성하는 단계
    를 포함하며,
    상기 오류 인덱스는 상기 부대역 인덱스를 포함하는
    부호화 방법.
  4. 제3항에서,
    j번째 부대역의 상기 MDCT 오류 계수의 에너지는
    Figure pat00049
    로 결정되며,
    uj와 lj는 각각 j번째 부대역의 하위 및 상위 경계 인덱스이고,
    E(k)는 k번째 상기 MDCT 오류 계수인
    부호화 방법.
  5. 제3항에서,
    상기 오류 인덱스를 생성하는 단계는, 상기 검색한 부대역의 상기 MDCT 오류 계수를 부호화하는 단계를 더 포함하는 부호화 방법.
  6. 제5항에서,
    상기 MDCT 오류 계수를 부호화하는 단계는,
    상기 검색한 부대역의 MDCT 오류 계수에 대한 복수의 트랙을 구성하는 단계,
    각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 가지는 미리 정해진 개수의 MDCT 오류 계수에 해당하는 펄스를 검색하는 단계, 그리고
    상기 펄스를 부호화하는 단계
    를 더 포함하며,
    상기 오류 인덱스는 상기 펄스를 부호화한 값을 더 포함하는
    부호화 방법.
  7. 제6항에서,
    상기 펄스를 부호화하는 단계는,
    상기 펄스의 위치를 부호화하는 단계,
    상기 펄스의 부호(sign)를 부호화하는 단계, 그리고
    상기 펄스의 크기를 부호화하는 단계
    를 포함하며,
    상기 펄스를 부호화한 값은 상기 위치, 부호 및 크기를 각각 부호화한 값을 포함하는
    부호화 방법.
  8. 제7항에서,
    상기 위치는 상기 검색한 부대역의 하위 경계 인덱스를 기준으로 한 상기 펄스의 상대적 위치인 부호화 방법.
  9. 제7항에서,
    상기 MDCT 오류 계수를 부호화하는 단계는,
    상기 검색한 부대역의 MDCT 오류 계수의 제곱 평균 제곱근(Root Mean Square, RMS) 값을 계산하는 단계, 그리고
    상기 RMS 값을 양자화하여 RMS 인덱스를 생성하는 단계
    를 포함하며,
    상기 오류 인덱스는 상기 RMS 인덱스를 더 포함하는
    부호화 방법.
  10. 제9항에서,
    상기 펄스의 크기를 부호화하는 단계는,
    상기 RMS 인덱스를 역 양자화하여 양자화된 RMS 값을 생성하는 단계, 그리고
    상기 펄스의 크기를 상기 양자화된 RMS 값으로 나눈 값을 이용하여 상기 펄스의 크기를 부호화하는 단계
    를 포함하는 부호화 방법.
  11. 제6항에서,
    상기 이득 인덱스를 생성하는 단계는,
    상기 펄스의 위치를 제외한 위치에서 상기 제2 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계,
    상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계, 그리고
    상기 지수 값에 기초하여 상기 이득 인덱스를 위한 비트를 할당하는 단계
    를 포함하는 부호화 방법.
  12. 제11항에서,
    상기 이득 인덱스를 생성하는 단계는, 상기 할당한 비트, 상기 제1 MDCT 계수 및 상기 제2 MDCT 계수로부터 상기 이득 인덱스를 결정하는 단계를 더 포함하는 부호화 방법.
  13. 제12항에서,
    상기 이득 인덱스는
    Figure pat00050
    를 최대로 하는 i로 결정되며,
    상기
    Figure pat00051
    는 m 비트에 해당하는 코드북의 i번째 코드워드이고,
    상기 i는 0부터 (2m-1)까지의 정수이며,
    상기 X(k)는 상기 k번째 제1 MDCT 오류 계수이고, 상기
    Figure pat00052
    는 k번째 제2 MDCT 오류 계수인
    부호화 방법.
  14. 복호화기의 복호화 방법으로서,
    변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 인덱스, 오류 인덱스 및 이득 인덱스를 수신하는 단계,
    상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성하는 단계,
    상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하는 단계,
    상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하는 단계,
    복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하는 단계, 그리고
    상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상하는 단계
    를 포함하는 복호화 방법.
  15. 제14항에서,
    상기 오류를 보상하는 단계는 상기 제2 MDCT 계수에 상기 MDCT 오류 계수를 더하는 단계를 포함하는 복호화 방법.
  16. 제15항에서,
    상기 MDCT 오류 계수는 상기 펄스의 위치 이외의 위치에서는 0의 값을 가지는 복호화 방법.
  17. 제14항에서,
    상기 오류 인덱스는 부대역 인덱스를 포함하며,
    상기 MDCT 오류 계수를 복원하는 단계는 상기 부대역 인덱스를 복호화하여 상기 MDCT 오류 계수의 부대역을 결정하는 단계를 포함하는
    복호화 방법.
  18. 제14항에서,
    상기 오류 인덱스는 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 포함하는 복호화 방법.
  19. 제18항에서,
    상기 MDCT 오류 계수를 복원하는 단계는,
    상기 펄스의 크기를 부호화한 값을 복호화하여 상기 펄스의 크기를 복원하는 단계,
    상기 펄스의 위치를 부호화한 값을 복호화하여 상기 펄스의 위치를 복원하는 단계,
    상기 펄스의 부호를 부호화한 값을 복호화하여 상기 펄스의 부호를 복원하는 단계, 그리고
    상기 펄스의 위치, 부호 및 크기로 상기 MDCT 오류 계수를 복원하는 단계
    를 포함하는 복호화 방법.
  20. 제19항에서,
    상기 오류 인덱스는 제곱 평균 제곱근(Root Mean Square, RMS) 인덱스를 더 포함하며,
    상기 펄스의 크기를 복원하는 단계는,
    상기 RMS 인덱스로부터 양자화된 RMS 값을 생성하는 단계, 그리고
    복호화한 펄스의 크기에 상기 양자화된 RMS 값을 곱하여 상기 펄스의 크기를 복원하는 단계
    를 포함하는 복호화 방법.
  21. 제14항에서,
    상기 이득을 복원하는 단계는,
    상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하는 단계,
    상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하는 단계,
    상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하는 단계
    를 포함하는 복호화 방법.
  22. 제21항에서,
    상기 이득을 복원하는 단계는, 상기 비트 할당표를 이용하여 상기 이득 인덱스로부터 상기 이득을 복원하는 단계를 더 포함하는 복호화 방법.
  23. 제14항에서,
    상기 제2 MDCT 계수의 오류가 보상되어 생성된 MDCT 계수를 MDCT 역 변환하여 신호를 복원하는 단계를 더 포함하는 복호화 방법.
  24. 입력 신호를 변환하여 제1 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 계수를 생성하는 MDCT,
    상기 제1 MDCT 계수를 양자화하여 MDCT 인덱스를 생성하는 MDCT 양자화기,
    상기 MDCT 인덱스를 역 양자화하여 제2 MDCT 계수를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수의 차에 해당하는 MDCT 오류 계수를 부호화하여 오류 인덱스를 생성하고, 상기 제1 MDCT 계수와 상기 제2 MDCT 계수로부터 상기 제1 MDCT 계수의 이득에 대응하는 이득 인덱스를 생성하는 향상 계층 부호화기, 그리고
    상기 MDCT 인덱스, 상기 오류 인덱스 및 상기 이득 인덱스를 다중화하여 비트 스트림을 출력하는 다중화기
    를 포함하는 부호화 장치.
  25. 제24항에서,
    상기 향상 계층 부호화기는, 복수의 부대역 중에서 상기 MDCT 오류 계수의 에너지가 가장 큰 부대역을 검색하고, 상기 검색한 부대역의 인덱스를 부호화하여 부대역 인덱스를 생성하는 오류 보상 부호화기를 포함하며,
    상기 오류 인덱스는 상기 부대역 인덱스를 포함하는
    부호화 장치.
  26. 제25항에서,
    상기 오류 보상 부호화기는 상기 검색한 부대역의 MDCT 오류 계수에 대한 복수의 트랙을 구성하고, 각 트랙의 가능한 위치에 해당하는 MDCT 오류 계수 중 가장 큰 절대값을 가지는 미리 정해진 개수의 MDCT 오류 계수에 해당하는 펄스의 위치, 부호(sign) 및 크기를 각각 부호화하며,
    상기 오류 인덱스는 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 더 포함하는
    부호화 장치.
  27. 제26항에서,
    상기 오류 보상 부호화기는 상기 검색한 부대역의 MDCT 오류 계수의 제곱 평균 제곱근(Root Mean Square, RMS) 값을 양자화하여 RMS 인덱스를 생성하며,
    상기 오류 인덱스는 상기 RMS 인덱스를 더 포함하는
    부호화 장치.
  28. 제26항에서,
    상기 향상 계층 부호화기는, 상기 펄스의 위치를 제외한 위치에서 상기 제2 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하고, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하며, 상기 지수 값에 기초하여 상기 이득 인덱스를 위한 비트를 할당하는 이득 보상 부호화기를 더 포함하는 부호화 장치.
  29. 제28항에서,
    상기 이득 보상 부호화기는,
    Figure pat00053
    를 최대로 하는 i로 상기 이득 인덱스를 결정하며,
    상기
    Figure pat00054
    는 m 비트에 해당하는 코드북의 i번째 코드워드이고,
    상기 i는 0부터 (2m-1)까지의 정수이며,
    상기 X(k)는 상기 k번째 제1 MDCT 오류 계수이고, 상기
    Figure pat00055
    는 k번째 제2 MDCT 오류 계수인
    부호화 장치.
  30. 수신한 비트 스트림을 역 다중화하여 변경된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 인덱스, 오류 인덱스 및 이득 인덱스를 출력하는 역 다중화기,
    상기 MDCT 인덱스를 역 양자화하여 제1 MDCT 계수를 생성하는 MDCT 역 양자화기, 그리고
    상기 오류 인덱스를 복호화하여 MDCT 오류 계수를 복원하며, 상기 MDCT 오류 계수에 해당하는 펄스의 위치와 상기 제1 MDCT 계수를 이용하여 상기 이득 인덱스로부터 이득을 복원하고, 복원한 이득으로 상기 제1 MDCT 계수의 이득을 보상하여 제2 MDCT 계수를 생성하고, 상기 MDCT 오류 계수로 상기 제2 MDCT 계수의 오류를 보상하는 향상 계층 복호화기
    를 포함하는 복호화 장치.
  31. 제30항에서,
    상기 향상 계층 복호화기는, 상기 제2 MDCT 계수에 상기 MDCT 오류 계수를 더하여서 상기 제2 MDCT 계수의 오류를 보상하는 오류 보상기를 포함하는 복호화 장치.
  32. 제30항에서,
    상기 오류 인덱스는 부대역 인덱스, 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 포함하며,
    상기 향상 계층 복호화기는, 상기 부대역 인덱스를 복호화하여 상기 MDCT 오류 계수의 부대역을 결정하고, 상기 펄스의 위치, 부호 및 크기를 각각 부호화한 값을 복호화하여 상기 펄스의 위치, 부호 및 크기를 복원하는 오류 보상 복호화기를 포함하는
    복호화 장치.
  33. 제32항에서,
    상기 오류 인덱스는 제곱 평균 제곱근(Root Mean Square, RMS) 인덱스를 더 포함하며,
    상기 오류 보상 복호화기는, 상기 RMS 인덱스로부터 양자화된 RMS 값을 생성하고, 복호화한 펄스의 크기에 상기 양자화된 RMS 값을 곱하여 상기 펄스의 크기를 복원하는
    복호화 장치.
  34. 제30항에서,
    상기 향상 계층 복호화기는, 상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하고, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하며, 상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하고, 상기 이득 인덱스와 상기 비트 할당표를 이용하여 상기 이득을 복원하는 이득 보상 복호화기를 포함하는 복호화 장치.
  35. 제30항에서,
    상기 향상 계층 복호화기는, 상기 펄스의 위치를 제외한 위치에서 상기 제1 MDCT 계수의 크기의 로그 함수 값으로 지수 값을 계산하고, 상기 펄스 위치에서 상기 지수 값을 최소 지수 값으로 설정하며, 상기 지수 값에 기초하여 상기 이득 인덱스에 비트를 할당하여 비트 할당표를 생성하는 이득 보상 복호화기를 포함하는 복호화 장치.
  36. 제35항에서,
    상기 이득 보상 복호화기는 상기 비트 할당표를 이용하여 상기 이득 인덱스로부터 상기 이득을 복원하는 복호화 장치.
  37. 제30항에서,
    오류를 보상한 상기 제2 MDCT 계수를 MDCT 역 변환하여 신호를 복원하는 역 MDCT(inverse MDCT, IMDCT)를 더 포함하는 복호화 장치.
KR1020110029340A 2010-03-31 2011-03-31 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 KR101819180B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201180026855.6A CN102918590B (zh) 2010-03-31 2011-03-31 编码方法和装置、以及解码方法和装置
PCT/KR2011/002227 WO2011122875A2 (ko) 2010-03-31 2011-03-31 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
JP2013502481A JP5863765B2 (ja) 2010-03-31 2011-03-31 符号化方法および装置、そして、復号化方法および装置
EP11763047.5A EP2555186A4 (en) 2010-03-31 2011-03-31 CODING METHOD AND DEVICE AND DECODING METHOD AND DEVICE
US13/638,364 US9424857B2 (en) 2010-03-31 2011-03-31 Encoding method and apparatus, and decoding method and apparatus
CN201410655722.0A CN104392726B (zh) 2010-03-31 2011-03-31 编码设备和解码设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20100029302 2010-03-31
KR1020100029302 2010-03-31

Publications (2)

Publication Number Publication Date
KR20110110044A true KR20110110044A (ko) 2011-10-06
KR101819180B1 KR101819180B1 (ko) 2018-01-16

Family

ID=45026904

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110029340A KR101819180B1 (ko) 2010-03-31 2011-03-31 부호화 방법 및 장치, 그리고 복호화 방법 및 장치

Country Status (6)

Country Link
US (1) US9424857B2 (ko)
EP (1) EP2555186A4 (ko)
JP (1) JP5863765B2 (ko)
KR (1) KR101819180B1 (ko)
CN (2) CN102918590B (ko)
WO (1) WO2011122875A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9984697B2 (en) 2011-07-13 2018-05-29 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2908313T3 (pl) 2011-04-15 2019-11-29 Ericsson Telefon Ab L M Adaptacyjny podział współczynnika kształt - wzmocnienie
US9602841B2 (en) * 2012-10-30 2017-03-21 Texas Instruments Incorporated System and method for decoding scalable video coding
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
EP3230980B1 (en) * 2014-12-09 2018-11-28 Dolby International AB Mdct-domain error concealment
EP3526712B1 (en) * 2016-10-11 2021-03-24 Genomsys SA Method and system for the transmission of bioinformatics data
CN107612658B (zh) * 2017-10-19 2020-07-17 北京科技大学 一种基于b类构造格型码的高效编码调制与译码方法
US20230048402A1 (en) * 2021-08-10 2023-02-16 Electronics And Telecommunications Research Institute Methods of encoding and decoding, encoder and decoder performing the methods

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2605681B2 (ja) * 1985-10-14 1997-04-30 ソニー株式会社 薄膜磁気ヘツド
JP3153933B2 (ja) 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
US5252782A (en) 1992-06-29 1993-10-12 E-Systems, Inc. Apparatus for providing RFI/EMI isolation between adjacent circuit areas on a single circuit board
JP3137550B2 (ja) 1995-02-20 2001-02-26 松下電器産業株式会社 音声符号化・復号化装置
TW321810B (ko) * 1995-10-26 1997-12-01 Sony Co Ltd
JPH11109995A (ja) 1997-10-01 1999-04-23 Victor Co Of Japan Ltd 音響信号符号化器
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
WO2003077235A1 (en) 2002-03-12 2003-09-18 Nokia Corporation Efficient improvements in scalable audio coding
US7275036B2 (en) 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
JP2005004119A (ja) 2003-06-16 2005-01-06 Victor Co Of Japan Ltd 音響信号符号化装置及び音響信号復号化装置
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
ES2476992T3 (es) * 2004-11-05 2014-07-15 Panasonic Corporation Codificador, descodificador, método de codificación y método de descodificaci�n
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR101171098B1 (ko) 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100848324B1 (ko) 2006-12-08 2008-07-24 한국전자통신연구원 음성 부호화 장치 및 그 방법
BRPI0721079A2 (pt) * 2006-12-13 2014-07-01 Panasonic Corp Dispositivo de codificação, dispositivo de decodificação e método dos mesmos
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US10121481B2 (en) * 2011-03-04 2018-11-06 Telefonaktiebolaget Lm Ericsson (Publ) Post-quantization gain correction in audio coding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9984697B2 (en) 2011-07-13 2018-05-29 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device
US10546592B2 (en) 2011-07-13 2020-01-28 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device
US11127409B2 (en) 2011-07-13 2021-09-21 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device

Also Published As

Publication number Publication date
US20130030795A1 (en) 2013-01-31
WO2011122875A3 (ko) 2011-12-22
JP2013524273A (ja) 2013-06-17
KR101819180B1 (ko) 2018-01-16
CN102918590B (zh) 2014-12-10
EP2555186A4 (en) 2014-04-16
JP5863765B2 (ja) 2016-02-17
WO2011122875A2 (ko) 2011-10-06
EP2555186A2 (en) 2013-02-06
US9424857B2 (en) 2016-08-23
CN104392726A (zh) 2015-03-04
CN102918590A (zh) 2013-02-06
CN104392726B (zh) 2018-01-02

Similar Documents

Publication Publication Date Title
KR101819180B1 (ko) 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
JP5863868B2 (ja) 適応的正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
US20080091440A1 (en) Sound Encoder And Sound Encoding Method
JP6600054B2 (ja) 方法、符号化器、復号化器、及び移動体機器
US20080140393A1 (en) Speech coding apparatus and method
JP2020204784A (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
TW201324500A (zh) 無損編碼方法、音訊編碼方法、無損解碼方法以及音訊解碼方法
US20130132100A1 (en) Apparatus and method for codec signal in a communication system
US9454972B2 (en) Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech
US9240192B2 (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding
KR20220051028A (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
EP2490216B1 (en) Layered speech coding
KR100789368B1 (ko) 잔차 신호 부호화 및 복호화 장치와 그 방법
US20090018823A1 (en) Speech coding
KR100765747B1 (ko) 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
KR20160098597A (ko) 통신 시스템에서 신호 코덱 장치 및 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant