KR20160055266A - 인코딩 방법 및 장치 - Google Patents

인코딩 방법 및 장치 Download PDF

Info

Publication number
KR20160055266A
KR20160055266A KR1020167009812A KR20167009812A KR20160055266A KR 20160055266 A KR20160055266 A KR 20160055266A KR 1020167009812 A KR1020167009812 A KR 1020167009812A KR 20167009812 A KR20167009812 A KR 20167009812A KR 20160055266 A KR20160055266 A KR 20160055266A
Authority
KR
South Korea
Prior art keywords
subbands
subband
data frame
correction factor
frequency envelope
Prior art date
Application number
KR1020167009812A
Other languages
English (en)
Other versions
KR101803410B1 (ko
Inventor
제신 리우
빈 왕
레이 미아오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20160055266A publication Critical patent/KR20160055266A/ko
Application granted granted Critical
Publication of KR101803410B1 publication Critical patent/KR101803410B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명의 실시예는 인코딩 방법 및 장치를 제공하며, 이것은 통신 분야에 관한 것으로, 오디오 신호의 스펙트럼 계수에 대해 적합한 양자화 비트 할당을 수행할 수 있으므로, 디코딩에 의해서 디코더에 의해 획득되는 신호의 품질을 향상시킬 수 있다. 본 방법은, 현재의 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 상기 서브밴드의 양자화된 주파수 포락선 값을 획득하는 단계; 상기 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계; 상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하는 단계; 상기 서브밴드에서 양자화 비트가 할당된 서브밴드의 스펙트럼 계수를 양자화하는 단계; 및 양자화 비트가 할당된 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록하는 단계를 포함한다.

Description

인코딩 방법 및 장치 {ENCODING METHOD AND APPARATUS}
본 출원은 2013년 12월 2일에 중국 특허청에 출원된 중국 특허 출원 제201310635004.2호 ('인코딩 방법 및 장치')의 우선권을 주장하며 이것은 그 전체가 참조로서 본 명세서 포함된다.
본 발명은 통신 분야에 관한 것으로, 구체적으로는 인코딩 방법 및 장치에 관한 것이다.
오디오(audio) 압축 기술은 디지털 오디오 방송, 인터넷을 통한 음악 전파 및 오디오 통신과 같은 멀티미디어 애플리케이션 기술의 핵심이다. 변환 코딩(transform coding)은 오디오 압축 기술에서 통상적으로 사용되는 방법이다. 변환 코딩 중에, 오디오 데이터는, 오디오 데이터 내의 대량의 정보가 적은 데이터를 사용하여 표현될 수 있도록, 데이터 도메인으로부터 다른 데이터 도메인으로 변환되며, 이것은 효율적인 압축 코딩의 목적을 달성하기 위해 오디오 데이터를 양자화할 수 있도록 한다.
기존의 변환 코딩 알고리즘에 따라서, 인코더(encoder)는 오디오 신호를 시간 도메인으로부터 주파수 도메인(시간-주파수 변환)으로 변환하여 오디오 신호의 스펙트럼 계수를 획득하고, 스펙트럼 계수를 서브밴드(subband)로 분할(split)하며, 서브밴드의 주파수 포락선(frequency envelope)을 계산하고 양자화하여, 서브밴드의 양자화된 주파수 포락선의 인덱스 값과 서브밴드의 양자화된 주파수 포락선의 값을 획득하며, 그 후, 서브밴드의 양자화된 주파수 포락선의 값과 가용 비트(available bit)의 양에 따라서 서브밴드의 스펙트럼 계수에 대한 비트 할당을 개별적으로 수행하고, 서브밴드의 양자화된 주파수 포락선의 값과 서브밴드의 스펙트럼 계수에게 할당된 비트의 양에 따라서 서브밴드의 스펙트럼 계수를 양자화하며, 마지막으로, 서브밴드의 양자화된 주파수 포락선의 인덱스 값과 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록하여 해당 비트스트림을 디코더(decoder)로 전송한다.
그러나, 종래 기술에서 비트 할당이 서브밴드의 스펙트럼 계수에 대해 수행되는 경우, 양자화 비트 할당이 서브밴드의 양자화된 주파수 포락선의 값에 따라서 서브밴드의 스펙트럼 계수에 대해 수행되므로, 이로 인해 일부 서브밴드의 스펙트럼 계수에 대한 부적합한 양자화 비트 할당이 발생하고, 디코더에 의한 디코딩에 의해 얻어지는 신호의 품질이 낮아진다.
본 발명의 실시예는 인코딩 방법 및 장치를 제공하며, 이것은 오디오 신호의 스펙트럼 계수에 대해 적합한 양자화 비트 할당을 수행할 수 있으므로, 디코딩에 의해서 디코더에 의해 획득되는 신호의 품질을 향상시킬 수 있다.
전술한 목적을 달성하기 위해, 이하의 기술적 해결수단이 본 발명의 본 실시예에서 사용된다.
제1 측면에 따라서, 본 발명의 실시예는 인코딩 방법을 제공하며, 이 방법은,
현재의 데이터 프레임의 스펙트럼 계수를 서브밴드(subband)로 분할한 후, 상기 서브밴드의 양자화된 주파수 포락선 값(quantized frequency envelope values)을 획득하는 단계;
상기 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계;
상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하는 단계;
상기 서브밴드에서 양자화 비트가 할당된 서브밴드의 스펙트럼 계수를 양자화하는 단계; 및
양자화 비트가 할당된 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록하는 단계를 포함한다.
제1 측면의 제1 가능한 구현예에서, 상기 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계는,
상기 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득하는 단계; 및
상기 제1 수량의 서브밴드의 수정 인자를 사용하여 상기 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계를 포함한다.
제1 측면의 제1 가능한 구현예를 참조하여, 제2 가능한 구현예에서, 상기 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득하는 단계는,
상기 제1 수량의 서브밴드의 신호 유형(signal type)을 획득하는 단계; 및
상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계를 포함한다.
제1 측면의 제2 가능한 구현예를 참조하여, 제3 가능한 구현예에서, 상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는,
상기 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파(harmonic)인 경우, 상기 제1 서브밴드의 수정 인자가 1보다 크도록 결정하거나, 또는
상기 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파가 아닌 경우, 상기 제1 서브밴드의 수정 인자가 1보다 작거나 같도록 결정하는 단계를 포함한다.
제1 측면의 제2 가능한 구현예 또는 제3 가능한 구현예를 참조하여, 제4 가능한 구현예에서, 상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계 전에, 상기 방법은,
상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제2 수량의 서브밴드의 저장된 참고 정보(reference information)를 획득하는 단계 - 상기 제2 수량은 상기 제1 수량보다 작거나 같음 -를 더 포함하고,
상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계가, 구체적으로,
상기 제1 수량의 서브밴드의 신호 유형과 상기 제2 수량의 서브밴드의 참고 정보에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계를 포함한다.
제1 측면의 제4 가능한 구현예를 참조하여, 제5 가능한 구현예에서, 상기 제1 수량의 서브밴드의 신호 유형과 상기 제2 수량의 서브밴드의 참고 정보에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는,
상기 제1 수량의 서브밴드 내의 상기 제1 서브밴드의 신호 유형에 따라서 상기 제1 서브밴드의 제1 수정 인자를 결정하는 단계;
상기 제2 수량의 서브밴드에서, 상기 제1 서브밴드에 대응하는, 제2 서브밴드의 참고 정보에 따라서 상기 제1 서브밴드의 제2 수정 인자를 결정하는 단계; 및
상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하는 단계를 포함한다.
제1 측면의 제5 가능한 구현예를 참조하여, 제6 가능한 구현예에서,
상기 제2 서브밴드의 참고 정보는 상기 제2 서브밴드의 양자화 비트 할당 상태 및/또는 상기 제2 서브밴드의 신호 유형을 포함하고,
상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 상기 제2 수정 인자는 제3 수정 인자이거나, 또는
상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 제4 수정 인자이거나, 또는
상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태와 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 상기 제3 수정 인자와 상기 제4 수정 인자의 곱이다.
제1 측면의 제6 가능한 구현예를 참조하여, 제7 가능한 구현예에서,
상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되지 않는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 작거나, 또는 상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 크며;
상기 제2 서브밴드의 신호 유형이 고조파인 경우, 상기 제4 수정 인자는 1보다 크거나, 또는 상기 제2 서브밴드의 신호 유형이 고조파가 아닌 경우, 상기 제4 수정 인자는 1보다 작거나 같다.
제1 측면의 제6 가능한 구현예 또는 제7 가능한 구현예를 참조하여, 제8 가능한 구현예에서, 상기 제1 서브밴드의 제2 수정 인자는, 상기 제2 서브밴드의 주파수 포락선 값, 상기 제2 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제2 수량의 서브밴드의 대역폭 값, 상기 제2 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제2 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정된다.
제1 측면의 제5 가능한 구현예 내지 제7 가능한 구현예 중 어느 하나를 참조하여, 제9 가능한 구현예에서, 상기 제1 서브밴드의 제1 수정 인자는, 상기 제1 서브밴드의 주파수 포락선 값, 상기 제1 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제1 수량의 서브밴드의 대역폭 값, 상기 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제1 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정된다.
제1 측면의 제1 가능한 구현예를 참조하여, 제10 가능한 구현예에서, 상기 제1 수량의 서브밴드의 수정 인자를 획득하는 단계는,
상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 저장된 참고 정보를 획득하는 단계; 및
상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계를 포함한다.
제1 측면의 제10 가능한 구현예를 참조하여, 제11 가능한 구현예에서, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계 전에, 상기 방법은,
상기 현재의 데이터 프레임 내의 서브밴드에서 제3 수량의 서브밴드의 신호 유형을 획득하는 단계 - 상기 제3 수량은 상기 제1 수량보다 작거나 같음 -를 더 포함하고,
상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는, 구체적으로,
상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보와 상기 제3 수량의 서브밴드의 신호 유형에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계를 포함한다.
제1 측면의 제11 가능한 구현예를 참조하여, 제12 가능한 구현예에서, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보와 상기 제3 수량의 서브밴드의 신호 유형에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는,
상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제2 서브밴드의 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제1 서브밴드의 제2 수정 인자를 결정하는 단계;
상기 제1 서브밴드의 신호 유형에 따라서 상기 제1 서브밴드의 제1 수정 인자를 결정하는 단계; 및
상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하는 단계를 포함한다.
제1 측면 또는 제1 측면의 제1 가능한 구현예 내지 제12 가능한 구현예 중 어느 하나를 참조하여, 제13 가능한 구현예에서, 상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하는 단계 후에, 상기 방법은,
상기 제1 수량의 서브밴드의 참고 정보를 저장하는 단계를 더 포함한다.
제2 측면에 따라서, 본 발명의 실시예는 인코딩 장치를 제공하며, 이 장치는,
현재의 데이터 프레임의 스펙트럼 계수를 서브밴드(subband)로 분할한 후, 상기 서브밴드의 양자화된 주파수 포락선 값(quantized frequency envelope value)을 획득하도록 구성된 획득 유닛;
상기 획득 유닛에 의해 획득된, 상기 서브밴드 내의 제1 수량의 서브밴드의, 양자화된 주파수 포락선 값을 수정하도록 구성된 수정 유닛;
상기 수정 유닛에 의해 수정된, 상기 제1 수량의 서브밴드의, 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하도록 구성된 할당 유닛;
상기 서브밴드에서 상기 양자화 유닛에 의해 양자화 비트가 할당된 서브밴드의 스펙트럼 계수를 양자화하도록 구성된 양자화 유닛; 및
상기 양자화 유닛에 의해 양자화된, 양자화 비트가 할당된 서브밴드의, 스펙트럼 계수를 비트스트림에 기록하도록 구성된 다중화 유닛을 포함한다.
제2 측면의 제1 가능한 구현예에서,
상기 획득 유닛은 상기 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득하도록 추가로 구성되고;
상기 수정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드의, 상기 양자화된 주파수 포락선 값을, 상기 획득 유닛에 의해 획득된 상기 제1 수량의 서브밴드의 수정 인자를 사용하여 수정하도록 추가로 구성된다.
제2 측면의 제1 가능한 구현예를 참조하여, 제2 가능한 구현예에서, 상기 인코딩 장치는 결정 유닛을 더 포함하고,
상기 획득 유닛은 상기 제1 수량의 서브밴드의 신호 유형(signal type)을 획득하도록 추가로 구성되고;
상기 결정 유닛은, 상기 획득 유닛에 의해 획득된 상기 제1 수량의 서브밴드의 신호 유형에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성된다.
제2 측면의 제2 가능한 구현예를 참조하여, 제3 가능한 구현예에서,
상기 결정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드 내의 제1 서브밴드의, 신호 유형이 고조파(harmonic)인 경우, 상기 제1 서브밴드의 수정 인자가 1보다 크도록 결정하거나, 또는, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드 내의 제1 서브밴드의, 신호 유형이 고조파가 아닌 경우, 상기 제1 서브밴드의 수정 인자가 1보다 작거나 같도록 결정하도록 추가로 구성된다.
제2 측면의 제2 가능한 구현예 또는 제3 가능한 구현예를 참조하여, 제4 가능한 구현예에서,
상기 획득 유닛은, 상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제2 수량의 서브밴드의 저장된 참고 정보(reference information)를 획득하도록 추가로 구성되고;
상기 결정 유닛은, 구체적으로, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드의 신호 유형과 상기 제2 수량의 서브밴드의 참고 정보에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성되며,
상기 제2 수량은 상기 제1 수량보다 작거나 같다.
제2 측면의 제4 가능한 구현예를 참조하여, 제5 가능한 구현예에서,
상기 결정 유닛은, 상기 획득 유닛에 의해 획득된 상기 제1 수량의 서브밴드 내의 상기 제1 서브밴드의 신호 유형에 따라서, 상기 제1 서브밴드의 제1 수정 인자를 결정하고; 상기 제2 수량의 서브밴드에서, 상기 제1 서브밴드에 대응하는, 상기 획득 유닛에 의해 획득된 제2 서브밴드의 참고 정보에 따라서 상기 제1 서브밴드의 제2 수정 인자를 결정하며; 상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성된다.
제2 측면의 제5 가능한 구현예를 참조하여, 제6 가능한 구현예에서,
상기 획득 유닛에 의해 획득되는 상기 제2 서브밴드의 참고 정보는 상기 제2 서브밴드의 양자화 비트 할당 상태 및/또는 상기 제2 서브밴드의 신호 유형을 포함하고,
상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 상기 결정 유닛에 의해 결정되는 상기 제2 수정 인자는 제3 수정 인자이거나, 또는
상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 제4 수정 인자이거나, 또는
상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태와 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 상기 제3 수정 인자와 상기 제4 수정 인자의 곱이다.
제2 측면의 제6 가능한 구현예를 참조하여, 제7 가능한 구현예에서,
상기 결정 유닛은, 상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되지 않는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 작은 것으로 결정하거나, 또는 상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 크도록 결정하며; 상기 획득 유닛에 의해 획득된 상기 제2 서브밴드의 신호 유형이 고조파인 경우, 상기 제4 수정 인자는 1보다 크도록 결정하거나, 또는 상기 획득 유닛에 의해 획득된 상기 제2 서브밴드의 신호 유형이 고조파가 아닌 경우, 상기 제4 수정 인자는 1보다 작거나 같도록 결정되도록 추가로 구성된다.
제2 측면의 제6 가능한 구현예 또는 제7 가능한 구현예를 참조하여, 제8 가능한 구현예에서, 상기 결정 유닛에 의해 결정되는 상기 제1 서브밴드의 제2 수정 인자는, 상기 제2 서브밴드의 주파수 포락선 값, 상기 제2 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제2 수량의 서브밴드의 대역폭 값, 상기 제2 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제2 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정된다.
제2 측면의 제5 가능한 구현예 내지 제7 가능한 구현예를 참조하여, 제9 가능한 구현예에서, 상기 결정 유닛에 의해 결정되는 상기 제1 서브밴드의 제1 수정 인자는, 상기 제1 서브밴드의 주파수 포락선 값, 상기 제1 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제1 수량의 서브밴드의 대역폭 값, 상기 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제1 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정된다.
제2 측면의 제1 가능한 구현예를 참조하여, 제10 가능한 구현예에서,
상기 획득 유닛은, 상기 저장 유닛에 저장된, 상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보를 획득하도록 추가로 구성되고;
상기 결정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 추가로 구성된다.
제2 측면의 제10 가능한 구현예를 참조하여, 제11 가능한 구현예에서,
상기 획득 유닛은, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 상기 현재의 데이터 프레임 내의 서브밴드에서 제3 수량의 서브밴드의 신호 유형을 획득하도록 추가로 구성되고;
상기 결정 유닛은, 구체적으로, 상기 획득 유닛에 의해 획득된, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보와 상기 제3 수량의 서브밴드의 신호 유형에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성되며,
상기 제3 수량은 상기 제1 수량보다 작거나 같다.
제2 측면의 제11 가능한 구현예를 참조하여, 제12 가능한 구현예에서,
상기 결정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제2 서브밴드의, 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제1 서브밴드의 제2 수정 인자를 결정하고; 상기 획득 유닛에 의해 획득된 상기 제1 서브밴드의 신호 유형에 따라서 상기 제1 서브밴드의 제1 수정 인자를 결정하며; 상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성된다.
제2 측면 또는 제2 측면의 제1 가능한 구현예 내지 제12 가능한 구현예 중 어느 하나를 참조하여, 제13 가능한 구현예에서,
상기 저장 유닛은, 상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 상기 양자화 비트가 상기 서브밴드에게 할당된 후, 상기 제1 수량의 서브밴드의 참고 정보를 저장하도록 추가로 구성된다.
본 발명의 본 실시예에서 제공되는 인코딩 방법 및 장치에 따라서, 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 인코더가 서브밴드의 양자화된 주파수 포락선 값을 획득하고; 인코더가 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며; 인코더가 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하고; 인코더가, 양자화 비트가 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하며; 마지막으로, 인코더가, 양자화 비트가 할당되는, 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다. 이러한 해결수단에 따라서, 양자화 비트 할당이 오디오 신호의 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 수행되기 전에, 현재 데이터 프레임 내의 서브밴드의 양자화된 주파수 포락선 값이 현재 데이터 프레임의 신호 유형과 이전 데이터 프레임에 대한 정보에 따라서 수정될 수 있으므로; 따라서, 서브밴드의 수정된 양자화된 주파수 포락선 값과 다량의 가용 비트에 따라서 서브밴드의 스펙트럼에 대한 양자화 비트 할당을 수행하는 것에 의해 오디오 신호의 스펙트럼 계수에 대한 적합한 양자화 비트 할당의 목적을 달성할 수 있으므로, 디코딩에 의해서 디코더에 의해 획득되는 신호의 품질을 향상시킬 수 있다.
본 발명의 실시예 또는 종래 기술에서의 기술적 해결수단을 더욱 명확히 기술하기 위해, 이하에서 본 발명의 실시예 또는 종래 기술을 설명할 때 필요한 첨부 도면을 간략하게 소개한다. 분명한 것은, 이어질 설명에서 첨부된 도면은 단지 본 발명의 몇 가지 실시예를 나타내며, 통상의 기술자라면 첨부된 도면으로부터 창작 능력 없이도 다른 도면을 도출해 낼 수 있다는 것이다.
도 1은 본 발명의 실시예에 따른 인코딩 방법의 제1 흐름도이다.
도 2는 본 발명의 실시예에 따른 인코딩 방법의 제2 흐름도이다.
도 3은 본 발명의 실시예에 따른 인코딩 방법에서의 오디오 신호의 스펙트럼 구성도이다.
도 4는 본 발명의 실시예에 따른 인코딩 장치의 제1 개략 구성도이다.
도 5는 본 발명의 실시예에 따른 인코딩 장치의 제2 개략 구성도이다.
도 6은 본 발명의 실시예에 따른 인코딩 장치의 제3 개략 구성도이다.
도 7은 본 발명의 실시예에 따른 인코더의 개략 구성도이다.
이하에서 본 발명의 실시예에 관한 첨부 도면을 참조하여 본 발명의 실시예의 기술적 해결수단을 명확하고 상세하게 기술한다. 분명한 것은, 여기 기술된 실시예는 단지 본 발명의 실시예의 일부이며 전부가 아니라는 것이다. 본 발명의 실시예에 기초하여 창작 노력 없이 통상의 기술자에 의해 획득되는 다른 모든 실시예는 본 발명의 보호 범위 내에 포함될 것이다.
제1 실시예
본 발명의 본 실시예는 인코딩 방법을 제공한다. 도 1에 도시된 바와 같이, 본 방법은 다음의 단계를 포함할 수 있다:
단계 S101. 인코더(encoder)가 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 인코더가 서브밴드의 양자화된 주파수 포락선 값(envelope value)을 획득한다.
인코더는 데이터 또는 신호(예를 들어 비트스트림)를 통신, 전송, 및 저장을 위해 사용될 수 있는 신호로 변환하기 위해 데이터 또는 신호를 인코딩하는 장치이다. 인코더는 상이한 기술 분야에서 상이한 분류를 갖는다. 통신 기술 분야에서, 인코더는 비디오 인코더(video encoder), 오디오 인코더(audio encoder) 등을 포함할 수 있다.
본 발명의 본 실시예에서 제공되는 인코더는 오디오 인코더일 수 있다. 오디오 인코더는 아날로그 오디오 신호를 데이터 인코딩 파일로 압축할 수 있는 도구, 즉 오디오 압축 코딩 도구이다. 오디오 압축 코딩은 음성 신호 압축 코딩과 광대역 오디오 신호 압축 코딩으로 분류될 수 있다. 음성 신호 압축 코딩은 주로 디지털 전화 통신에서 사용된다. 광대역 오디오 신호 압축 코딩은 주로 디지털 오디오 방송, VCD(Video Compact Disc), 디지털 다목적 디스크(digital versatile disc, Digital Video Disc, DVD), 및 고화질 텔레비전(High Definition Television,HDTV)에서의 사운드(sound)에 응용된다.
오디오 신호가 데이터 프레임 형태로 프레임 단위로 연속으로 인코더에게 전송될 수 있다. 데이터 프레임은 데이터 링크 계층(data link layer)에서의 프로토콜 데이터 유닛이며, 데이터 프레임은 프레임 헤더, 데이터 파트(data part), 및 프레임 트레일러(frame trailer)를 포함할 수 있다. 프레임 헤더와 프레임 트레일러는 동기화 정보, 어드레스 정보, 및 에러 제어 정보(error control information)와 같이 필요한 제어 정보를 포함한다. 데이터 파트는 네트워크 계층으로부터 전송되는 데이터, 예를 들어 IP(Internet Protocol) 패킷을 포함한다.
인코더는 우선 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할하고, 그 후 서브밴드의 양자화된 주파수 포락선 값을 획득한다.
예시적으로, 본 발명의 본 실시예에서 제공되는 인코딩 방법에서, 현재 데이터 프레임이 y번째(yth) 데이터 프레임이고, 인코더가 현재 데이터 프레임, 즉 y번째 데이터 프레임의 스펙트럼 계수를 N개의 서브밴드로 분할한 후, 인코더가 N개의 서브밴드의 양자화된 주파수 포락선 값을 각각 획득한다. 여기서, N≥1이고, y≥1이다. 인코더는 y번째 데이터 프레임에서 N개의 서브밴드의 주파수 포락선을 계산함으로써 y번째 데이터 프레임 내의 N개의 서브밴드의 주파수 포락선 값을 획득하고; 그 후, 인코더는 y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선의 인덱스 값을 획득하기 위해 주파수 포락선 값을 양자화하고, 양자화된 주파수 포락선의 인덱스 값에 따라서 y번째 데이터 프레임 내의 N개의 서브밴드의 주파수 포락선을 재생성하여, y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선 값을 획득한다.
양자화는 스칼라 양자화(scalar quantization)와 벡터 양자화(vector quantization)를 포함할 수 있다. 벡터 양자화는 큰 압축비, 간단한 디코딩, 및 작은 왜곡과 같은 이점을 갖는 효율적인 데이터 압축 기술이다. 벡터 양자화 기술은 이미지 압축 및 음성 인코딩에서 폭넓게 사용된다.
선택적으로, 벡터 양자화는 피라미드 격자 벡터 양자화(pyramid lattice vector quantization), 구형 격자 벡터 양자화(spherical lattice vector quantization) 등을 포함할 수 있다.
단계 S102. 인코더는 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한다.
인코더가 서브밴드의 양자화된 주파수 포락선 값을 획득한 후, 인코더는 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며, 여기서 제1 수량의 서브밴드는 서브밴드 내의 일부 서브밴드일 수 있다.
본 발명의 본 실시예에서 제공되는 인코딩 방법에서, 인코더는 전송된 오디오 신호의 각 데이터 프레임을 동일한 수량의 서브밴드로 분할(divide)한다. 즉, 현재 데이터 프레임과 이전의 데이터 프레임이 동일한 수량의 서브밴드를 포함하도록 분할한다.
구체적으로, 인코더가 현재 데이터 프레임에서 서브밴드의 양자화된 주파수 포락선 값을 획득한 후, 인코더는, 현재 데이터 프레임 내의 서브밴드의 신호 유형과 이전의 데이터 프레임 내의 서브밴드의 참고 정보(reference information), 또는 현재 데이터 프레임 내의 서브밴드의 신호 유형, 또는 이전의 데이터 프레임 내의 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정할 수 있다. 본 발명의 본 실시예에서, 현재 데이터 프레임은 이전의 데이터 프레임에 인접한다.
예를 들어, 각 프레임에서의 서브밴드의 수량이 N이라고 가정하는 경우, 인코더는 현재 데이터 프레임 내의 M개의 서브밴드의 신호 유형 및/또는 이전 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정할 수 있다. 제1 수량의 값은 M과 L 사이에서 최대치이며, 이 때 1≤M≤N이고, 1≤L≤N이다. 본 발명의 본 실시예에서, 현재 데이터 프레임 내의 M개의 서브밴드의 신호 유형은 M개의 서브밴드에서 각 서브밴드의 신호 유형을 포함하고, 이전 데이터 프레임 내의 L개의 서브밴드의 참고 정보는 L개의 서브밴드에서 각 서브밴드의 참고 정보를 포함한다.
각 데이터 프레임에서 서브밴드를 분할하기 위한 구체적인 방법과 구체적인 수정 방식은 다음의 실시예에서 상세하게 설명된다.
선택적으로, 서브밴드의 신호 유형은 고조파(harmonic)이거나 또는 고조파가 아닐 수 있다(non-harmonic).
인코더가, 현재 데이터 프레임 내의 서브밴드의 신호 유형 및/또는 이전 데이터 프레임 내의 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하기 때문에, 현재 데이터 프레임에서 서브밴드의 수정된 양자화된 주파수 포락선 값이 오디오 신호의 특성을 더 잘 만족시키고, 이전 데이터 프레임의 스펙트럼 계수가 현재 데이터 프레임의 스펙트럼 계수에 보다 나은 연속성을 갖는다는 것이 이해될 것이다.
단계 S103. 인코더가, 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당한다.
인코더가 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한 후, 인코더는 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 현재 데이터 프레임 내의 서브밴드에 대해 양자화 비트 할당을 수행할 수 있다.
구체적으로, 인코더가 현재 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한 후, 인코더는 현재 데이터 프레임에서 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 현재 데이터 프레임에서 서브밴드의 중요성(importance)의 초기값(서브밴드의 중요성은 서브밴드의 에너지 또는 주파수와 같은 파라미터를 사용하여 측정될 수 있음)을 계산할 수 있고, 그 후, 서브밴드의 중요성의 초기값에 따라서 서브밴드에게 다량의 가용 비트를 할당할 수 있으며, 여기서 많은 비트가 중요성이 높은 서브밴드에게 할당되고, 적은 비트가 낮은 중요성을 갖는 서브밴드에게 할당된다.
가용 비트의 수는 현재 데이터 프레임에서 가용한 전체 비트 수를 나타낸다. 가용 비트의 수는 인코더의 비트율에 따라서 결정된다. 인코더의 비트율이 클수록 가용 비트의 수가 커지는 것을 나타낸다.
현재 데이터 프레임 내의 서브밴드의 양자화된 주파수 포락선 값이 수정된 후, 한편으로는, 현재 데이터 프레임 내의 서브밴드의, 양자화 비트 할당을 위해 사용된, 수정된 양자화된 주파수 포락선 값이 오디오 신호의 특성을 보다 잘 만족시키기 때문에, 서브밴드의 스펙트럼 계수에 대한 양자화 비트 할당이 보다 적합하고; 또 한편으로는, 현재 데이터 프레임 내의 서브밴드의 수정된 양자화된 주파수 포락선 값이, 이전 데이터 프레임의 스펙트럼 계수가 현재 데이터 프레임의 스펙트럼 계수에 보다 연속성을 갖도록 함으로써, 디코더에 의한 디코딩 중에 스펙트럼 상에서의 일부 이산 점(discrete point)이 감소되어, 디코더가 보다 완전한 디코딩을 수행할 수 있다
단계 S104. 인코더가, 서브밴드에서 양자화 비트가 할당되는, 서브밴드의 스펙트럼 계수를 양자화한다.
인코더가 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 양자화 비트 할당을 수행한 후, 인코더는 양자화 비트가 현재 데이터 프레임 내의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한다.
구체적으로, 인코더가 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 양자화 비트 할당을 수행한 후, 인코더는, 현재 데이터 프레임 내의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대한 노멀라이징(normalization) 처리를 수행할 수 있고, 그 후, 양자화 비트가 현재 데이터 프레임 내의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수에게 인코더에 의해 각각 할당된 비트 수에 따라서 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수를 양자화할 수 있다.
예시적으로, 현재 데이터 프레임이 y번째(yth) 데이터 프레임이고, 이전 데이터 프레임이 y-1번째((y-1)th) 데이터 프레임이며, 인코더가 각 데이터 프레임을 N개의 서브밴드로 분할하는 것으로 가정한다. 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는 서브밴드의 스펙트럼 계수에게 할당되는 다수의 비트에 따라서, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는 서브밴드의 스펙트럼 계수를 양자화하는 경우, 인코더는 적은 비트가 할당되는 서브밴드의 스펙트럼 계수를 양자화하기 위해 피라미드 격자 벡터 앙자화 방법을 사용할 수 있으므로, 적은 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 획득할 수 있고; 이에 대응하여, 인코더는 많은 비트가 할당되는 서브밴드의 스펙트럼 계수를 양자화하기 위해 구형 격자 벡터 양자화 방법을 사용할 수 있으므로, 많은 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 획득할 수 있다.
현재 데이터 프레임 내의 서브밴드에게 양자화 비트가 할당되지 않는 경우가 있다. 본 발명의 본 실시예에서, 인코더는 양자화 비트가 현재 데이터 프레임 내의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한다. 구체적으로, 양자화 비트가 서브밴드에게 할당되면, 서브밴드에게 할당된 양자화 비트는 서브밴드의 스펙트럼 계수를 양자화하는 데 사용된다. 예를 들어, 두 개의 양자화 비트가 서브밴드에게 할당되면, 두 개의 양자화 비트가 서브밴드의 스펙트럼 계수를 양자화하는 데 사용되고; 세 개의 비트가 다른 서브밴드에게 할당되면, 세 개의 양자화 비트가 해당 다른 서브밴드의 스펙트럼 계수를 양자화하는 데 사용되며; 양자화 비트가 서브밴드에 할당되지 않으면, 양자화 비트가 할당되지 않은 서브밴드의 스펙트럼 계수는 양자화되지 않는다.
단계 S105. 인코더가, 양자화 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다.
인코더가, 양자화 비트가 현재 데이터 프레임에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한 후, 인코더는, 디코더가 디코딩을 수행하기 위해 비트스트림을 사용하도록, 양자화 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록할 필요가 있다.
구체적으로, 인코더가 양자화 비트가 현재 데이터 프레임에서 할당되는 서브밴드의 스펙트럼 계수를 양자화한 후, 인코더는 양자화 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수, 현재 데이터 프레임 내의 서브밴드의 신호 유형, 이전 데이터 프레임 내의 서브밴드의 참고 정보, 및 현재 데이터 프레임 내의 서브밴드의 양자화 주파수 포락선 인덱스 값을 비트스트림에 기록하고, 해당 비트스트림을 디코딩을 위해 디코더에게 전송한다.
오디오 신호의 각 데이터 프레임에 대해, 인코더는 전술한 단계 S101 내지 S105에 따라서 인코딩을 수행한다. 즉, 인코더는 오디오 신호의 데이터 프레임 모두가 인코딩될 때까지 단계 S101 내지 S105를 반복 실행한다.
인코더가, 인코더에서 인코딩될 오디오 신호의 각 데이터 프레임을 계산하고, 양자화하며, 수정한 후, 인코더는 현재 데이터 프레임 내의 서브밴드의 신호 유형, 이전 데이터 프레임 내의 서브밴드의 참고 정보, 및 전술한 과정에서 획득되는 현재 데이터 프레임 내의 서브밴드의 양자화 주파수 포락선 인덱스 값과 양자화 비트가 현재 데이터 프레임에서 할당되는 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록하고, 디코더가 인코딩 중에 획득되는 대응되는 파라미터에 따라서 인코딩된 오디오 신호의 비트스트림에 대한 역양자화(dequantization)와 디노멀라이제이션(denormalization)과 같은 처리를 수행할 수 있도록, 해당 비트스트림을 디코더로 전송할 필요가 있으며, 그 후, 인코더는, 디코딩이 완료된 후, 인코딩되기 전의 오디오 신호를 획득한다.
본 발명의 본 실시예에서 제공되는 인코딩 방법에 따라서, 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 인코더가 서브밴드의 양자화된 주파수 포락선 값을 획득하고; 인코더가 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며; 인코더가 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하고; 인코더가, 양자화 비트가 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하며; 마지막으로, 인코더가, 양자화 비트가 할당되는, 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다. 이러한 해결수단에 따라서, 양자화 비트 할당이 오디오 신호의 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 수행되기 전에, 서브밴드의 양자화된 주파수 포락선 값이 현재 데이터 프레임의 신호 유형과 이전 데이터 프레임에 대한 정보에 따라서 수정될 수 있으므로; 따라서, 서브밴드의 수정된 양자화된 주파수 포락선 값과 다량의 가용 비트에 따라서 서브밴드의 스펙트럼에 대한 양자화 비트 할당을 수행하는 것에 의해 오디오 신호의 스펙트럼 계수에 대한 적합한 양자화 비트 할당의 목적을 달성할 수 있으므로, 디코더에 의해 디코딩이 수행됨으로써 얻어지는 신호의 품질을 향상시킬 수 있다.
제2 실시예
본 발명의 본 실시예는 인코딩 방법을 제공한다. 본 발명의 본 실시예에서 제공되는 인코딩 방법에서, 현재 데이터 프레임이 y번째(yth) 데이터 프레임이고, 이전 데이터 프레임이 y-1번째((y-1)th)인 것이 설명을 위한 예로서 사용되며, 여기서 y≥1이다. 도 2에 도시된 바와 같이, 본 방법은 다음의 단계를 포함할 수 있다.
단계 S201. 인코더는 y번째 데이터 프레임의 스펙트럼 계수를 획득하기 위해 오디오 신호의 y번째 데이터 프레임에 대한 시간-주파수 변환을 수행하며, 이 때 y≥1이다.
인코더는 데이터 또는 신호(예를 들어 비트스트림)를 통신, 전송, 및 저장을 위해 사용될 수 있는 신호로 변환하기 위해 데이터 또는 신호를 인코딩하는 장치이다. 인코더는 상이한 기술 분야에서 상이한 분류를 갖는다. 통신 기술 분야에서, 인코더는 비디오 인코더, 오디오 인코더 등을 포함할 수 있다.
본 발명의 본 실시예에서 제공되는 인코더는 오디오 인코더일 수 있다. 오디오 인코더는 아날로그 오디오 신호를 데이터 인코딩 파일로 압축할 수 있는 도구, 즉 오디오 압축 코딩 도구이다. 오디오 압축 코딩은 음성 신호 압축 코딩과 광대역 오디오 신호 압축 코딩으로 분류될 수 있다. 음성 신호 압축 코딩은 주로 디지털 전화 통신에서 사용된다. 광대역 오디오 신호 압축 코딩은 주로 디지털 오디오 방송, VCD, DVD, 및 HDTV에서의 사운드에 응용된다.
시간-주파수 변환은 신호를 시간 도메인으로부터 주파수 도메인으로 변환하는 것을 나타낸다. 현재, 주로 사용되는 시간-주파수 변환 방법은 이산 푸리에 변환(Discrete Fourier Transform, DFT), 이산 코사인 변환(Discrete Cosine Transform, DCT), 수정된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT) 등을 포함한다.
오디오 신호가 데이터 프레임 형태로 프레임 단위로 연속으로 인코더에게 전송될 수 있다. 데이터 프레임은 데이터 링크 계층에서의 프로토콜 데이터 유닛이며, 데이터 프레임은 프레임 헤더, 데이터 파트, 및 프레임 트레일러를 포함할 수 있다. 프레임 헤더와 프레임 트레일러는 동기화 정보, 어드레스 정보, 및 에러 제어 정보와 같이 필요한 제어 정보를 포함한다. 데이터 파트는 네트워크 계층으로부터 전송되는 데이터, 예를 들어 IP 패킷을 포함한다.
인코더는 시간-주파수 변환 방법을 사용하여 오디오 신호의 y번째 데이터 프레임을 시간 도메인으로부터 주파수 도메인으로 변환함으로써, y번째 데이터 프레임의 스펙트럼 계수를 획득할 수 있다. 인코딩 과정에서, 인코더가 오디오 신호의 각 데이터 프레임을 시간 도메인으로부터 주파수 도메인으로 연속적으로 변환하는 것이 이해될 것이다.
단계 S202. 인코더가 y번째 데이터 프레임의 스펙트럼 계수를 N개의 서브밴드로 분할하며, 이 때 N≥1이다.
서브밴드는, 주파수 대역에서, 특정 특성을 갖는 주파수 대역을 가리킨다.
본 발명의 본 실시예에서 제공되는 인코딩 방법에서, 인코더가 오디오 신호에 대한 시간-주파수 변환을 수행한 후, 인코더는 시간-주파수 변환 후에 획득되는 오디오 신호의 각 데이터 프레임을 N개의 서브밴드로 분할한다. 즉, 인코더는 임의의 전송된 데이터 프레임을 N개의 서브밴드로 분할한다. 따라서, y번째 데이터 프레임과 y-1번째 데이터 프레임은 N개인 동일한 수의 서브밴드를 갖는다.
y번째 데이터 프레임 내의 서브밴드는 y번째 데이터 프레임에서 상이한 주파수 대역이다. 예시적으로, y번째 데이터 프레임의 스펙트럼 계수가 0 내지 8000 Hz이면, 0 내지 20 Hz의 주파수 대역은 y번째 데이터 프레임 내의 하나의 서브밴드이다.
선택적으로, 서브밴드 분할 중에, 변환된 y번째 데이터 프레임의 스펙트럼 계수는 동일한 간격을 갖는 서브밴드로 분할될 수 있거나, 또는 변환된 y번째 데이터 프레임의 스펙트럼 계수는 청각 감지 특성(auditory sensing characteristics)에 따라서 동일하지 않은 간격을 갖는 서브밴드로 분할될 수 있다. 분할은 실제 분할 요구에 따라서 수행될 수 있으며, 이것은 본 발명에서 한정되지 않는다.
단계 S203. 인코더가 y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선을 획득한다.
양자화는 스칼라 양자화와 벡터 양자화를 포함할 수 있다. 벡터 양자화는 큰 압축비, 간단한 디코딩, 및 작은 왜곡과 같은 이점을 갖는 효율적인 데이터 압축 기술이다. 벡터 양자화 기술은 이미지 압축 및 음성 인코딩에서 폭넓게 사용된다.
인코더는 y번째 데이터 프레임에서 N개의 서브밴드의 주파수 포락선을 계산함으로써 y번째 데이터 프레임에서 N개의 서브밴드의 주파수 포락선 값을 획득하고; 그 후, 인코더는 y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선의 인덱스 값을 획득하기 위해 주파수 포락선 값을 양자화하며, 양자화된 주파수 포락선의 인덱스 값에 따라서 y번째 데이터 프레임 내의 N개의 서브밴드의 주파수 포락선을 재생성하여, y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선 값을 획득한다.
선택적으로, 벡터 양자화는 피라미드 격자 벡터 양자화, 구형 격자 벡터 양자화 등을 포함할 수 있다.
단계 S204. 인코더가 y번째 데이터 프레임의 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득한다.
본 발명의 본 실시예에서, 바람직하게, y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 경우, 인코더는, y번째 데이터 프레임 내의 서브밴드의 중요성에 따라서, y번째 데이터 프레임에서 높은 중요성을 갖는 몇몇의 서브밴드만, 즉 y번째 데이터 프레임에서 보다 높은 주파수를 갖는 몇몇의 서브밴드를 수정할 필요가 있다. 인접한 데이터 프레임들 사이의 연속성을 고려하면, y번째 데이터 프레임에서 수정될 서브밴드의 제1 수량의 구체적인 값은 보다 높은 주파수를 가지면서 y번째 데이터 프레임으로부터 선택되는 M개 수량의 서브밴드와 보다 높은 주파수를 가지면서 y-1번째 데이터 프레임으로부터 선택되는 L개 수량의 서브밴드에 따라서 결정된다. 즉, 제1 수량의 값은 M과 L 사이의 최대값으로, 1≤M≤이며, 1≤L≤N이다.
구체적으로, y번째 데이터 프레임에서 보다 높은 주파수를 갖는 M개의 서브밴드를 선택하거나 또는 y-1번째 데이터 프레임에서 보다 높은 주파수를 갖는 L개의 서브밴드를 선택하기 위한 방법은 다음과 같다. 인코더가 주파수의 참고 주파수(reference frequency)를 선택할 수 있고, 서브밴드의 시작 주파수가 참고 주파수보다 높은 경우, 서브밴드가 보다 높은 주파수를 갖는 서브밴드이다. 참고 주파수는 5 kHz, 5.45 kHz, 5.8 kHz, 6 kHz, 6.2 kHz, 7 kHz, 8 kHz, 또는 10 kHz일 수 있다. 즉, 보다 높은 주파수를 갖는 서브밴드의 선택은 상이한 조건에 따라 설정될 수 있으며, 이것은 본 발명에서 한정되지 않는다.
또한, 본 발명의 본 실시예에서, 참고 주파수의 선택은 현재 데이터 프레임 내의 서브밴드의 최고 주파수와 미리 설정된 주파수 범위에 따라서 결정될 수 있다. 즉, 참고 주파수 = 최고 주파수 - 주파수 범위이다. 예를 들어, 미리 설정된 주파수 범위가 2 kHz이고, 현재 데이터 프레임 내의 서브밴드의 최고 주파수가 7.45 kHz이면, 참고 주파수 = 7.45 kHz - 2 kHz = 5.45 kHz이고; 미리 설정된 주파수 범위가 3 kHz이고, 현재 데이터 프레임 내의 서브밴드의 최고 주파수가 9.2 kHz이면, 참고 주파수 = 9.2 kHz - 6.2 kHz이다. 미리 설정된 주파수 범위는 요구사항 또는 경험에 따라서 설정될 수 있다.
또한, 인코더는 y번째 데이터 프레임에서 M개 또는 L개의 서브밴드를 수정할 수 있다. 도 3에 도시된 바와 같이, y번째 데이터 프레임 내의 M개의 서브밴드는 y번째 데이터 프레임 내의 N개의 서브밴드에서 최고의 주파수를 갖는 서브밴드로부터 시작하는 M개의 연속된 서브밴드이고, y-1번째 데이터 프레임 내의 L개의 서브밴드는 y-1번째 데이터 프레임 내의 N개의 서브밴드에서 최고의 주파수를 갖는 서브밴드로부터 시작하는 L개의 연속된 서브밴드이다.
M≥L인 경우가 이하의 설명을 위해 사용된다.
M≥L이면, 제1 수량이 M이고; y-1번째 데이터 프레임 내의 L개의 서브밴드의 개수는 제2 수량으로서 언급되며, 제2 수량은 제1 수량보다 적거나 동일하고, y-1번째 데이터 프레임에서 제2 수량의 서브밴드는 y-1번째 데이터 프레임 내의 L개의 서브밴드이다. 인코더에 의해, y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 획득하기 위한 방법은: 인코더에 의해, y번째 데이터 프레임에서 제1 수량의 서브밴드의 신호 유형에 따라서 y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 결정하는 단계, 또는 인코더에 의해, y번째 데이터 프레임에서 제1 수량의 서브밴드의 신호 유형과 y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 참고 정보에 따라서 y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 결정하는 단계를 포함한다.
구체적으로, 인코더는 M개의 서브밴드 내의 각 서브밴드에 대응하는 수정 인자의 값을 결정하기 위해 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드의 신호 유형에 따라서 대응하는 계산 공식을 선택하거나, 또는 인코더는 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자를 결정하기 위해 y번째 데이터 프레임 내의 M개의 서브밴드에서의 각 서브밴드의 신호 유형과 y-1번째 데이터 프레임 내의 L개의 서브밴드에 대한 정보에 따라서 대응하는 계산 공식을 선택한다.
y번째 데이터 프레임 내의 M개의 서브밴드의 신호 유형은 M개의 서브밴드 내의 각 서브밴드의 신호 유형을 포함하고, M개의 서브밴드 내의 각 서브밴드는 수정 인자에 대응한다.
또한, 인코더에 의해, y번째 데이터 프레임 내의 M개의 서브밴드의 수정 인자를 획득하는 방법은 다음을 포함한다.
(1) 인코더가 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자의 값을 결정하기 위해 y번째 데이터 프레임 내의 M개의 서브밴드 내의 각 서브밴드의 신호 유형에 따라서 대응하는 계산 공식을 선택한다.
선택적으로, 서브밴드의 신호 유형은 고조파이거나 또는 고조파가 아닐 수 있다. y번째 데이터 프레임 내의 제1 수량의 서브밴드에서 제1 서브밴드의 신호 유형이 고조파인 경우, 인코더는 제1 서브밴드의 수정 인자가 1보다 큰 것으로 결정하고; y번째 데이터 프레임 내의 제1 수량의 서브밴드에서 제1 서브밴드의 신호 유형이 고조파가 아닌 경우, 인코더는 제1 서브밴드의 수정 인자가 1보다 작거나 같은 것으로 결정한다. 즉, y번째 데이터 프레임 내의 M개의 서브밴드에서 제1 서브밴드의 신호 유형이 고조파인 경우, 인코더는 제1 서브밴드에 대응하는 수정 인자가 1보다 큰 값인 것으로 결정하고; 제1 서브밴드의 신호 유형이 고조파가 아닌 경우, 인코더는 제1 서브밴드에 대응하는 수정 인자가 1보다 작거나 같은 값인 것으로 결정한다.
구체적으로, 제1 서브밴드의 수정 인자는 제1 서브밴드의 주파수 포락선 값, 제1 수량의 서브밴드의 평균 주파수 포락선 값, 제1 수량의 서브밴드의 대역폭 값, 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 제1 수량의 서브밴드의 주파수 포락선 편차(variance) 값 중 임의의 두 값의 비율에 따라서 결정된다. 즉, 제1 서브밴드의 수정 인자는 제1 서브밴드의 주파수 포락선 값, M개의 서브밴드의 평균 주파수 포락선 값, M개의 서브밴드의 대역폭 값, M개의 서브밴드의 주파수 포락선의 최대값, 및 M개의 서브밴드의 주파수 포락선 편차 값 중 임의의 두 값의 비율에 따라서 결정된다. 구체적인 조합 형태는 제1 서브밴드의 신호 유형에 따라서 선택될 수 있다. 즉, 대응하는 공식은 수정 인자를 계산하기 위해 제1 서브밴드의 신호 유형에 따라서 선택될 수 있다.
제1 공식은 다음의 [수학식 1]과 같다:
[수학식 1]
Figure pct00001
여기서, 대역길이(bandlength)는 N개의 서브밴드에서 M개의 서브밴드를 제외한 서브밴드와 M개의 서브밴드 내의 i번째(ith) 서브밴드 사이에 있는 서브밴드의 수이다.
Figure pct00002
이며, 여기서 Ep[i]는 i번째 서브밴드의 에너지이고, Ep_tmp[i]는 i번째 서브밴드의 주파수 포락선 값이며, band_width[i]는 i번째 서브밴드의 대역폭이다.
Figure pct00003
이며, 여기서, Ep_vari는 주파수 대역의 주파수 포락선 편차이다.
Figure pct00004
이며, 여기서 Ep_avrg는 주파수 대역에서 몇몇 서브밴드의 평균 주파수 포락선 값이다.
제2 공식은 다음의 [수학식 2]와 같다.
[수학식 2]
Figure pct00005
예시적으로, 제1 서브밴드의 신호 유형이 고조파이면, 제1 공식이 선택되고, 계산에 의해 획득되는, 제1 서브밴드에 대응하는 수정 인자의 값은 1보다 크며; 제1 서브밴드의 신호 유형이 고조파가 아니면, 제2 공식이 선택되고, 계산에 의해 획득되는, 제1 서브밴드에 대응하는 수정 인자의 값은 1보다 작거나 같다.
제1 서브밴드의 신호 유형이 고조파이면, 디코딩 중에 제1 서브밴드의 고조파 특성을 보다 잘 저장하기 위해, 비교적 큰 수의 비트가 제1 서브밴드에 할당될 필요가 있다는 것이 이해될 수 있다. 즉, 제1 서브밴드의 신호 유형이 고조파인 경우, 제1 서브밴드에 대응하는 수정 인자가 1보다 큰 값인 것으로 결정된 후, 제1 서브밴드의 수정된 양자화된 주파수 포락선 값이 제1 서브밴드의 수정되지 않은 양자화된 주파수 포락선 값보다 더 크며, 따라서 비교저거 큰 수의 비트가 제1 서브밴드에 할당된다.
y번째 데이터 프레임에서 제1 수량의 서브밴드 내의 각 서브밴드의 수정 인자를 획득하기 위한 방법은 제1 서브밴드의 수정 인자를 획득하기 위한 전술한 방법과 동일하다.
(2) 인코더가 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자를 결정하기 위해 y번째 데이터 프레임 내의 M개의 서브밴드에서의 각 서브밴드의 신호 유형과 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 대응하는 계산 공식을 선택한다.
M≥L이면, 인코더가 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드의 신호 유형에 따라서 M개의 제1 수정 인자를 결정하고, 인코더는 y-1번째의 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 L개의 제2 수정 인자를 결정한다. M개의 제1 수정 인자 내의 L개의 제1 수정 인자와 L개의 제2 수정 인자는 y번째 데이터 프레임 내의 M개의 서브밴드에서의 L개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정하는 데 사용되고, 인코더는 M개의 제1 수정 인자 내에서 M-L개의 남은 제1 수정 인자에 따라서 y번째 데이터 프레임 내의 M개의 서브밴드에서 M-L개의 남은 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정한다.
구체적으로, y번째 데이터 프레임 내의 제1 서브밴드가 설명된다. y번째 데이터 프레임 내의 제1 서브밴드가 y-1번째 데이터 프레임 내의 제2 서브밴드의 대응하는 참고 정보를 갖고 있으면, 인코더는 y번째 데이터 프레임 내의 제1 서브밴드의 신호 유형에 따라서 제1 서브밴드의 제1 수정 인자를 결정하고, 인코더는 y-1번째 데이터 프레임 내의 제2 수량의 서브밴드에서, y번째 데이터 프레임 내의 제1 서브밴드에 대응하여, 제2 서브밴드의 참고 정보에 따라서 제1 서브밴드의 제2 수정 인자를 결정하며, 마지막으로 제1 수정 인자와 제2 수정 인자의 곱을 제1 서브밴드의 수정 인자로서 사용한다. y번째 데이터 프레임 내의 제1 서브밴드가 y-1번째 데이터 프레임 내의 제2 서브밴드의 대응하는 참고 정보를 가지고 있지 않으면, 인코더는 y번째 데이터 프레임 내의 제1 서브밴드의 신호 유형에 따라서 제1 서브밴드의 제1 수정 인자를 결정하며, 이 때 제1 서브밴드의 수정 인자가 제1 수정 인자이다.
인코더가 M개의 서브밴드에서 각 서브밴드에 대응하는 제1 수정 인자의 값을 결정하기 위해 y번째 데이터 프레임 내의 M개의 서브밴드 내의 각 서브밴드의 신호 유형에 따라서 대응하는 계산 공식을 선택하는 경우, 제1 수정 인자의 값은 [수학식 1]에서의 수정 인자를 결정하기 위한 방법을 사용하여 결정된다. 즉 [수학식 1]에서의 수정 인자가 여기에서의 제1 수정 인자이다.
y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보는 L개의 서브밴드 내의 각 서브밴드의 참고 정보를 포함한다.
또한, 인코더가 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 신호 유형에 따라서 y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 인코더는 y번째 데이터 프레임에서 제1 수량의 서브밴드의 신호 유형을 먼저 획득할 필요가 있고; 인코더가 y-1번째 데이터 프레임에서 제2 수량의 서브밴드의 참고 정보에 따라서 y-1번째 데이터 프레임에서 제2 수량의 서브밴드의 수정 인자를 결정하기 전에, 인코더는 y-1번째 데이터 프레임에서 제2 수량의 서브밴드의 저장된 참고 정보를 먼저 획득할 필요가 있으며, 여기서 y-1번째 데이터 프레임에서 제2 수량의 서브밴드의 참고 정보는 인코더가 y-1번째 데이터 프레임의 인코딩을 완료하는 경우 저장된다.
선택적으로, y-1번째 데이터 프레임 내의 제2 서브밴드의 참고 정보는 제2 서브밴드의 양자화 비트 할당 상태 및/또는 제2 서브밴드의 신호 유형을 포함한다.
제2 서브밴드의 참고 정보가 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 제2 수정 인자는 제3 수정 인자이거나; 또는 제2 서브밴드의 참고 정보가 제2 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제4 수정 인자이거나; 또는 제2 서브밴드의 참고 정보가 제2 서브밴드의 양자화 비트 할당 상태와 제2 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제3 수정 인자와 제4 수정 인자의 곱이다.
구체적으로, y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보가 y-1번째 데이터 프레임 내의 L개의 서브밴드의 양자화 비트 할당 상태 및/또는 y-1번째 데이터 프레임 내의 L개의 서브밴드의 신호 유형을 포함한다. y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보가 y-1번째 데이터 프레임 내의 L개의 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 제2 수정 인자는 제3 수정 인자이거나; 또는 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보가 y-1번째 데이터 프레임 내의 L개의 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제4 수정 인자이거나; 또는 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보가 y-1번째 데이터 프레임 내의 L개의 서브밴드의 양자화 비트 할당 상태와 y-1번째 데이터 프레임 내의 L개의 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제3 수정 인자와 제4 수정 인자의 곱이다.
바람직하게, 제2 수정 인자는 제3 수정 인자와 제3 수정 인자의 곱이다.
인코더는 L개의 서브밴드 내의 각 서브밴드에 대응하는 제3 수정 인자의 값을 결정하기 위해, y-1번째 데이터 프레임 내의 L개의 서브밴드 내의 각 서브밴드의 양자화 비트 할당 상태에 따라서 대응하는 계산 공식을 선택하고, L개의 서브밴드 내의 각 서브밴드에 대응하는 제4 수정 인자의 값을 결정하기 위해, y-1번째 데이터 프레임 내의 L개의 서브밴드 내의 각 서브밴드의 신호 유형에 따라서 대응하는 계산 공식을 선택하며, L개의 서브밴드 내의 각 서브밴드에 대응하는 제3 수정 인자 및/또는 제4 수정 인자에 따라서, L개의 서브밴드 내의 각 서브밴드에 대응하는 제2 수정 인자의 값을 결정할 수 있다.
선택적으로, y-1번째 데이터 프레임 내의 L개의 서브밴드 내의 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩된 것으로 지시하는 경우, 인코더는 제2 서브밴드에 대응하는 제3 수정 인자가 1보다 큰 값인 것으로 결정하거나; 또는 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되지 않은 것으로 지시하는 경우, 인코더는 제2 서브밴드에 대응하는 제3 수정 인자가 1보다 작은 값인 것으로 결정한다. 제2 서브밴드의 신호 유형이 고조파이면, 인코더는 제2 서브밴드에 대응하는 제4 수정 인자가 1보다 큰 값인 것으로 결정하거나; 또는 제2 서브밴드의 신호 유형이 고조파가 아니면, 인코더는 제2 서브밴드에 대응하는 제4 수정 인자가 1보다 작거나 같은 값인 것으로 결정한다.
y-1번째 데이터 프레임 내의 L개의 서브밴드에서 제2 서브밴드의 양자화 비트 할당 상태가 "1"인 경우, 스펙트럼 계수가 인코딩된 것으로 지시하고; y-1번째 데이터 프레임 내의 L개의 서브밴드의 제2 서브밴드의 양자화 비트 할당 상태가 "0"인 경우, 스펙트럼 계수가 인코딩되지 않은 것으로 지시한다. 여기서, 제4 수정 인자를 획득하기 위한 방법은 [수학식 1]에서 수정 인자를 획득하기 위한 전술한 방법과 동일하다.
구체적으로, 제1 서브밴드의 제2 수정 인자는 제2 서브밴드의 주파수 포락선 값, 제2 수량의 서브밴드의 평균 주파수 포락선 값, 제2 수량의 서브밴드의 대역폭 값, 제2 수량의 서브밴드의 주파수 포락선의 최대값, 및 제2 수량의 서브밴드의 주파수 포락선 편차 값 중 임의의 두 값의 비율에 따라서 결정된다. 구체적인 조합 형태는 제2 서브밴드의 참고 정보에 따라서 선택될 수 있다. 즉, 대응하는 공식은 제3 수정 인자와 제4 수정 인자를 계산하기 위해 제2 서브 밴드의 양자화 비트 할당 상태 및/또는 제2 서브밴드의 신호 유형에 따라서 선택된다.
제3 공식은 다음의 [수학식 3]과 같다:
[수학식 3]
Figure pct00006
여기서, 대역길이(bandlength)는 N개의 서브밴드에서 L개의 서브밴드를 제외한 서브밴드와 L개의 서브밴드 내의 i번째(ith) 서브밴드 사이에 있는 서브밴드의 수이다.
네 번째 공식은 다음의 [수학식 4]와 같다.
[수학식 4]
Figure pct00007
여기서, 대역길이(bandlength)는 N개의 서브밴드에서 L개의 서브밴드를 제외한 서브밴드와 L개의 서브밴드 내의 i번째(ith) 서브밴드 사이에 있는 서브밴드의 수이다.
예시적으로, 제2 서브밴드의 양자화 비트 할당 상태가 "1"이면, 제3 공식이 선택되고, 계산에 의해 획득되는, 제2 서브밴드에 대응하는 제3 수정 인자의 값은 1보다 크고; 제2 서브밴드의 양자화 비트 할당 상태가 "0"이면, 제4 공식이 선택되고, 계산에 의해 획득되는, 제2 서브밴드에 대응하는 제3 수정 인자의 값은 1보다 작다.
제2 서브밴드의 신호 유형이 고조파이면, 제1 공식이 선택되고, 계산에 의해 획득되는, 제2 서브밴드에 대응하는 제4 수정 인자의 값은 1보다 크고; 제2 서브밴드의 신호 유형이 고조파가 아니면, 제2 공식이 선택되고, 계산에 의해 획득되는, 제2 서브밴드에 대응하는 제4 수정 인자의 값은 1보다 작거나 같다.
y-1번째 데이터 프레임 내의 제2 서브밴드의 양자화 비트 할당 상태가 "1"이면, 인코딩 중에 오디오 신호의 인접한 데이터 프레임들 사이의 연속성을 더 잘 유지하기 위해, 비교적 큰 수량의 비트가 제2 서브밴드에게 할당되는 것으로 지시되는 것이 이해될 수 있다. 즉, 제2 서브밴드의 양자화 비트 할당 상태가 "1"인 경우, 제2 서브밴드에 대응하는 제3 수정 인자가 1보다 큰 값으로 결정된 후, y번째 데이터 프레임에서 제2 서브밴드에 대응하는 서브밴드의 수정된 양자화된 주파수 포락선 값은 y번째 데이터 프레임에서 제2 서브밴드에 대응하는 서브밴드의 수정되지 않은 양자화된 주파수 포락선 값보다 더 크며, 따라서 비교적 큰 수량의 비트가 서브밴드에게 할당된다.
y번째 데이터 프레임에서 제1 수량의 서브밴드 내의 각 서브밴드의 수정 인자를 획득하기 위한 방법은 제1 서브밴드의 수정 인자를 획득하기 위한 전술한 방법과 동일하다.
M≤L인 경우가 이하의 설명을 위해 사용된다.
M≤L이면, 제1 수량의 값이 L이고; y번째 데이터 프레임 내의 M개의 서브밴드의 개수는 제3 수량으로서 언급되며, y번째 데이터 프레임에서 제3 수량의 서브밴드는 y번째 데이터 프레임 내의 M개의 서브밴드이다. 인코더에 의해, y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 획득하기 위한 방법은: y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 참고 정보에 따라서 y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 결정하는 단계, 또는 인코더에 의해, y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 참고 정보와 y번째 데이터 프레임에서 제3 수량의 서브밴드의 신호 유형에 따라서 y번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 결정하는 단계를 포함한다.
구체적으로, 인코더는 y번째 데이터 프레임 내의 L개의 서브밴드 내의 각 서브밴드에 대응하는 수정 인자의 값을 결정하기 위해, y-1번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드의 참고 정보에 따라서 대응하는 계산 공식을 선택하거나, 또는 인코더는 y번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자를 결정하기 위해, y번째 데이터 프레임 내의 M개의 서브밴드에서의 각 서브밴드의 신호 유형과 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 대응하는 계산 공식을 선택한다.
또한, 인코더에 의해, y번째 데이터 프레임 내의 L개의 서브밴드의 수정 인자를 획득하는 방법은 다음을 포함한다.
(1) 인코더가 y번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자의 값을 결정하기 위해, y-1번째 데이터 프레임 내의 L개의 서브밴드 내의 각 서브밴드의 참고 정보에 따라서 대응하는 계산 공식을 선택한다.
또한, 인코더가 y번째 데이터 프레임에서 제3 수량의 서브밴드의 신호 유형에 따라서 y번째 데이터 프레임에서 제3 수량의 서브밴드의 수정 인자를 결정하기 전에, 인코더는 y번째 데이터 프레임에서 제3 수량의 서브밴드의 신호 유형을 먼저 획득할 필요가 있고; 인코더가 y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 참고 정보에 따라서 y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 인코더는 y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 저장된 참고 정보를 먼저 획득할 필요가 있으며, 여기서 y-1번째 데이터 프레임에서 제1 수량의 서브밴드의 참고 정보는 인코더가 y-1번째 데이터 프레임의 인코딩을 완료하는 경우 저장된다.
인코더가 y번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자의 값을 결정하기 위해, y-1번째 데이터 프레임 내의 L개의 서브밴드 내의 각 서브밴드의 참고 정보에 따라서 대응하는 계산 공식을 선택하는 경우, 수정 인자의 값은 M≥L인 경우에 [수학식 2]에서 전술한 제2 수정 인자를 결정하기 위한 방법을 사용하여 결정된다. 즉, M≥L인 경우 [수학식 2]에서 전술한 제2 수정 인자는 여기에서의 수정 인자이다.
(2) 인코더가 y번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드에 대응하는 수정 인자를 결정하기 위해, y번째 데이터 프레임 내의 M개의 서브밴드에서의 각 서브밴드의 신호 유형과 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 대응하는 계산 공식을 선택한다.
M≤L이면, 인코더가 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드의 신호 유형에 따라서 M개의 제1 수정 인자를 결정하고, 인코더는 y-1번째의 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 L개의 제2 수정 인자를 결정한다. L개의 제2 수정 인자 내의 M개의 제2 수정 인자와 L개의 제1 수정 인자는 y번째 데이터 프레임 내의 L개의 서브밴드에서의 M개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정하는 데 사용되고, 인코더는 L개의 제2 수정 인자 내에서 L-M개의 남은 제2 수정 인자에 따라서 y번째 데이터 프레임 내의 L개의 서브밴드에서 L-M개의 남은 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정한다.
구체적으로, y번째 데이터 프레임 내의 제1 서브밴드가 설명된다. y-1번째 데이터 프레임 내의 제2 서브밴드가 y번째 데이터 프레임 내의 제1 서브밴드의 대응하는 신호 유형을 갖고 있으면, 인코더는 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 y번째 데이터 프레임 내의 각 서브밴드에서 제1 서브밴드의 제2 수정 인자를 결정하고, 인코더는 y번째 데이터 프레임 내의 제1 서브밴드의 신호 유형에 따라서, 제1 서브밴드의 제1 수정 인자를 결정하며, 마지막으로 제1 수정 인자와 제2 수정 인자의 곱을 제1 서브밴드의 수정 인자로서 사용한다. y-1번째 데이터 프레임 내의 제2 서브밴드가 y번째 데이터 프레임 내의 제1 서브밴드의 대응하는 신호 유형을 갖지 않으면, 인코더는 y-1번째 데이터 프레임 내의 제2 서브밴드의 참고 정보에 따라서 y번째 데이터 프레임 내의 제1 서브밴드의 제1 수정 인자를 결정하고, 제1 서브밴드의 수정 인자는 제1 수정 인자이다.
제1 수정 인자의 값과 제2 수정 인자의 값을 결정하기 위한 전술한 방법은, M≥L인 경우, 제1 수정 인자의 값과 제2 수정 인자의 값을 결정하기 위한 방법과 동일하며, 상세한 것은 여기에서 설명되지 않는다.
단계 S205. 인코더가 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한다.
인코더가 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 획득한 후, 인코더는 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한다.
구체적으로, 인코더는 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 사용하여 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한다.
본 발명의 본 실시예에서, 인코더가 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 경우, 바람직하게, 도 3에 도시된 바와 같이, 인코더는, y번째 데이터 프레임 내의 서브밴드의 중요성에 따라서, y번째 데이터 프레임에서 높은 중요성을 갖는 M개 또는 L개의 서브밴드만을 수정하고, y번째 데이터 프레임 내에 수정된 N개의 서브밴드를 형성하기 위해, 인코더에 의해 수정된 y번째 데이터 프레임 내의 M개 또는 L개의 서브밴드와 y번째 데이터 프레임에서 남아 있는 수정되지 않은 서브밴드를 재결합할 필요가 있다.
본 발명의 본 실시예에서 제공되는 인코딩 방법에서, 인코더는, M과 L 사이의 크기 관계에 따라서, 수정될 필요가 있는 y번째 데이터 프레임 내의 서브밴드의 개수(M과 L 사이에서 보다 큰 값)를 먼저 결정한 후, M>L, 또는 M<L, 또는 M=L인 경우에 대응하는 수정 방석을 선택할 수 있으며, 그 후, y번째 데이터 프레임에서 제1 수량의 서브밴드의 양자호된 주파수 포락선 값을 수정하기 위해 상기한 수정 방식에 대응하는 수정 인자를 결정할 수 있다.
선택적으로, 인코더는 y번째 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하기 위해, M과 L 사이의 크기 관계에 따라서, 대응하는 수정 방식을 선택한다.
M≥L이면, 제1 수량의 값이 M이고, 인코더는, y번째 데이터 프레임 내의 M개의 서브밴드의 신호 유형, 또는 y번째 데이터 프레임 내의 M개의 서브밴드의 신호 유형 및 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값을 수정한다. y번째 데이터 프레임 내의 M개의 서브밴드는 y번째 데이터 프레임 내의 N개의 서브밴드에서 최고의 주파수를 갖는 서브밴드로부터 시작하는 M개의 연속되는 서브밴드이고, y번째 데이터 프레임 내의 L개의 서브밴드는 y번째 데이터 프레임 내의 N개의 서브밴드에서 최고의 주파수를 갖는 서브밴드로부터 시작하는 L개의 연속되는 서브밴드이며, y-1번째 데이터 프레임 내의 L개의 서브밴드는 y-1번째 데이터 프레임 내의 N개의 서브밴드에서 최고의 주파수를 갖는 서브밴드로부터 시작하는 L개의 연속되는 서브밴드이다.
다르게는, M≤L이면, 제1 수량의 값이 L이고, 인코더는, y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보, 또는 y번째 데이터 프레임 내의 M개의 서브밴드의 신호 유형 및 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서 y번째 데이터 프레임 내의 L개의 서브밴드의 양자화된 주파수 포락선 값을 수정한다.
선택적으로, 인코더는, M과 L 사이의 크기 관계, 즉 수정 조건에 따라서, 수정 조건에 대응하는 수정 방식을 선택할 수 있고, y번째 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하기 위해 수정 방식에 따라서 대응하는 수정 인자를 결정할 수 있다.
구체적으로, 인코더가 y번째 데이터 프레임에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 수정 방식은 다음 중 하나일 수 있다.
(1) M≥L인 경우, 제1 수량의 값은 M이고, 인코더는 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드의 양자화 주파수 포락선 값을 대응적으로 수정하기 위해 수정 인자를 사용하며, 여기서 수정 인자는 y번째 데이터 프레임 내의 M개의 서브밴드에서 각 서브밴드의 신호 유형에 따라서 인코더에 의해 결정된다. 구체적으로, 인코더는 y번째 데이터 프레임 내의 M개의 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값에 M개의 수정 인자를 대응적으로 곱한다. 다르게는, 인코더는 M개의 제1 수정 인자 내의 L개의 제1 수정 인자와 L개의 제2 수정 인자에 따라서, y번째 데이터 프레임 내의 M개의 서브밴드에서 L개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정하고, 인코더는 M개의 제1 수정 인자 내에서 M-L개의 남은 제1 수정 인자에 따라서, y번째 데이터 프레임 내의 M개의 서브밴드에서 M-L개의 남은 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정한다. 구체적으로, 인코더는, y번째 데이터 프레임 내의 M개의 서브밴드에서 L개의 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 M개의 서브밴드에서 L개의 서브밴드의 양자화된 주파수 포락선 값에 M개의 제1 수정 인자 내의 L개의 제1 수정 인자와 L개의 제2 수정 인자를 대응적으로 곱하고, 인코더는, y번째 데이터 프레임 내의 M개의 서브밴드에서 M-L개의 남은 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 M개의 서브밴드에서 M-L개의 남은 서브밴드의 양자화된 주파수 포락선 값에 M개의 제1 수정 인자 내에서 M-L개의 남은 제1 수정 인자를 대응적으로 곱한다.
(2) M≤L인 경우, 제1 수량의 값은 L이고, 인코더는 y번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드의 양자화 주파수 포락선 값을 대응적으로 수정하기 위해 수정 인자를 사용하며, 여기서 수정 인자는 y-1번째 데이터 프레임 내의 L개의 서브밴드에서 각 서브밴드의 참고 정보에 따라서 인코더에 의해 결정된다. 구체적으로, 인코더는 y번째 데이터 프레임 내의 L개의 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 L개의 서브밴드의 양자화된 주파수 포락선 값에 L개의 수정 인자를 대응적으로 곱한다. 다르게는, 인코더는 L개의 제2 수정 인자 내의 M개의 제2 수정 인자와 M개의 제1 수정 인자에 따라서, y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정하고, 인코더는 L개의 제2 수정 인자 내에서 L-M개의 남은 제2 수정 인자에 따라서, y번째 데이터 프레임 내의 L개의 서브밴드에서 L-M개의 남은 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정한다. 구체적으로, 인코더는, y번째 데이터 프레임 내의 M개의 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값에 M개의 제1 수정 인자 내의 M개의 제1 수정 인자와 M개의 제2 수정 인자를 대응적으로 곱하고, 인코더는, y번째 데이터 프레임 내의 L개의 서브밴드에서 L-M개의 남은 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 L개의 서브밴드에서 L-M개의 남은 서브밴드의 양자화된 주파수 포락선 값에 M개의 L개의 제 수정 인자에서 L-M개의 남은 제2 수정 인자를 대응적으로 곱한다.
예시적으로, M=3이고, L=2이면, M>L이며, y번째 데이터 프레임 내의 세 개의 서브밴드가 수정될 필요가 있다. M>L인 경우에 사용되는 수정 방식이 먼저 선택되고, 그 후 인코더가, 세 개의 제1 수정 인자 내의 두 개의 제1 수정 인자와 두 개의 제2 수정 인자에 따라서, y번째 데이터 프레임 내의 세 개의 서브밴드에서 두 개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정하고, 인코더는, 세 개의 제1 수정 인자 내에서 남아 있는 제1 수정 인자에 따라서, y번째 데이터 프레임 내의 세 개의 서브밴드에서 남아 있는 하나의 서브밴드의 양자화 주파수 포락선 값을 수정한다. 구체적으로, y번째 데이터 프레임 내의 세 개의 서브밴드에서 두 개의 서브밴드의 수정된 양자화된 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 세 개의 서브밴드에서 두 개의 서브밴드의 양자화된 주파수 포락선 값에 세 개의 제1 수정 인자 내의 두 개의 제1 수정 인자와 두 개의 제2 수정 인자를 대응적으로 곱하고, 인코더는, y번째 데이터 프레임 내의 세 개의 서브밴드에서 남아 있는 하나의 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, y번째 데이터 프레임 내의 세 개의 서브밴드에서 남아 있는 하나의 서브밴드의 양자화 주파수 포락선 값에 세 개의 제1 수정 인자에서 남아 있는 하나의 제1 수정 인자를 곱한다.
M=L이거나 M<L인 경우, 인코더가 y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 과정은 M>L인 경우에 전술한 수정 과정과 유사하다는 것이 이해될 수 있으며, 이에 대해 이하에서 예를 사용하여 상세하게 설명된다.
단계 S206. 인코더가, 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당한다.
인코더가 y번째 데이터 프레임 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정한 후, 인코더는 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 y번째 데이터 프레임 내의 N개의 서브밴드에 대한 양자화 비트 할당을 수행할 수 있다.
구체적으로, 인코더가 y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선 값을 수정한 후, 인코더는 y번째 데이터 프레임 내의 N개의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, N개의 서브밴드의 중요성의 초기값(서브밴드의 중요성은 서브밴드의 에너지 또는 주파수와 같은 파라미터를 사용하여 측정될 수 있음)을 계산할 수 있고, 그 후, N개의 서브밴드의 중요성의 초기값에 따라서 N개의 서브밴드에게 다량의 가용 비트를 할당할 수 있으며, 여기서 많은 비트가 중요성이 높은 서브밴드에게 할당되고, 적은 비트가 낮은 중요성을 갖는 서브밴드에게 할당된다.
가용 비트의 수는 y번째 데이터 프레임에서 가용한 전체 비트 수를 나타낸다. 가용 비트의 수는 인코더의 비트율에 따라서 결정된다. 인코더의 비트율이 클수록 가용 비트의 수가 커지는 것을 나타낸다.
y번째 데이터 프레임 내의 N개의 서브밴드의 양자화된 주파수 포락선 값이 수정된 후, 한편으로는, 현재 y번째 프레임 내의 N개의 서브밴드의, 양자화 비트 할당을 위해 사용된, 수정된 양자화된 주파수 포락선 값이 오디오 신호의 특성을 보다 잘 만족시키기 때문에, N개의 서브밴드의 스펙트럼 계수에 대한 양자화 비트 할당이 보다 적합하고; 또 한편으로는, y번째 데이터 프레임 내의 N개의 서브밴드의 수정된 양자화된 주파수 포락선 값이 y-1번째 데이터 프레임의 스펙트럼 계수가 y번째 데이터 프레임의 스펙트럼 계수에 보다 연속성을 갖도록 함으로써, 디코더에 의한 디코딩 중에 스펙트럼 상에서의 일부 이산 점이 감소되어, 디코더가 보다 완전한 디코딩을 수행할 수 있다.
단계 S207. 인코더가, 양자화 비트가 N개의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한다.
인코더가, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수에 대해 양자화 비트 할당을 수행한 후, 인코더는, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한다.
구체적으로, 인코더가 y번째 데이터 프레임 내의 N개의 서브밴드의 스펙트럼 계수에 대해 양자화 비트 할당을 수행한 후, 인코더는, y번째 데이터 프레임 내의 N개의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, y번째 데이터 프레임 내의 N개의 서브밴드의 스펙트럼 계수에 대한 노멀라이징 처리를 수행할 수 있으며, 그 후, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수에 인코더에 의해 각각 할당되는 비트 수에 따라서, y번째 데이터 프레임 내의 N개의 서브밴드의 스펙트럼 계수를 양자화할 수 있다.
예시적으로, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수에게 할당되는 다수의 비트에 따라서, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하는 경우, 인코더는, 보다 적은 비트가 할당되는 서브밴드의 스펙트럼 계수를 양자화하기 위해 피라미드 격자 벡터 앙자화 방법을 사용할 수 있으므로, 더 적은 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 획득할 수 있고; 이에 대응하여, 인코더는 많은 비트가 할당되는 서브밴드의 스펙트럼 계수를 양자화하기 위해 구형 격자 벡터 양자화 방법을 사용할 수 있으므로, 더 많은 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 획득할 수 있다.
양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에게 할당되지 않는 경우가 있을 수 있다. 본 발명의 본 실시예에서, 인코더는, 양자화 비트가 y번째 데이터 프레임 내의 N개의 서브밴드에서 할당되는 서브밴드의 스펙트럼 계수를 양자화한다.
단계 S208. 인코더가, 양자화 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다.
인코더는, 양자화 비트가 y번째 데이터 프레임에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한 후, 인코더는, 디코더가 디코딩을 수행하기 위해 비트스트림을 사용하도록, 양자화 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록할 필요가 있다.
구체적으로, 인코더는, 양자화 비트가 y번째 데이터 프레임에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화한 후, 인코더는 양자화 비트가 할당되는 서브밴드의 양자화된 스펙트럼 계수, y번째 데이터 프레임 내의 M개의 서브밴드의 신호 유형, y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보, 및 y번째 데이터 프레임 내의 N개의 서브밴드의 양자화 주파수 포락선 인덱스 값을 비트스트림에 기록하고, 해당 비트스트림을 디코딩을 위해 디코더에게 전송한다.
오디오 신호의 각 데이터 프레임에 대해, 인코더는 전술한 단계 S201 내지 S208에 따라서 인코딩을 수행한다. 즉, 인코더는 오디오 신호의 데이터 프레임 모두가 인코딩될 때까지 단계 S201 내지 S208을 반복 실행한다. 인코딩이 완료된 후, 인코더는, y+1번째 데이터 프레임이 인코딩되는 경우 참고 정보가 사용되도록, y번째 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보를 저장한다.
인코더는, 인코더에서 인코딩될 오디오 신호를 계산하고, 양자화하며, 수정한 후, 인코더는 y번째 데이터 프레임 내의 M개의 서브밴드의 신호 유형, y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보, 및 전술한 과정에서 획득되는 y번째 데이터 프레임 내의 N개의 서브밴드의 양자화 주파수 포락선 인덱스 값과 양자화 비트가 y번째 데이터 프레임에서 할당되는 서브밴드의 양자화된 스펙트럼 계수와 같은 대응되는 파라미터를 비트스트림에 기록하고, 디코더가 인코딩 중에 획득되는 대응되는 파라미터에 따라서 인코딩된 오디오 신호의 비트스트림에 대한 역양자화와 디노멀라이제이션과 같은 처리를 수행할 수 있도록, 해당 비트스트림을 디코더로 전송할 필요가 있으며, 그 후, 인코더는, 디코딩을 완료한 후, 인코딩되기 전의 오디오 신호를 획득한다.
이하에서, 구체적인 광대역 오디오 신호의 예를 사용하여, 본 발명의 본 실시예에서 제공되는 인코딩 방법에서 양자화 주파수 포락선 값을 수정하는 과정에 대해 상세하게 설명한다. 예를 들어, 인코더는 y번째 데이터 프레임 내의 M개의 서브밴드의 참고 정보와 y-1번째 데이터 프레임 내의 L개의 서브밴드의 참고 정보에 따라서, y번째 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 결정한다.
y=6과 N=18인 경우, 즉 인코더가 광대역 오디오 신호의 6번째 데이터 프레임을 인코딩하는 것을 가정한다. 광대역 오디오 신호의 6번째 데이터 프레임이 인코더로 입력된 후, 인코더는 먼저 0 내지 8000 Hz 내에서 320개의 스펙트럼 계수를 획득하기 위해, 6번째 데이터 프레임에 대한 MDCT 변환을 수행한다. 도 3에 도시된 바와 같이, 인코더는, 청각 감지 특성에 따라서, 6번째 데이터 프레임의 320개의 스펙트럼 계수를 불균일한 간격을 갖는 18개의 서브밴드로 분할한다. 6번째 데이터 프레임이 인코더로 입력되기 전에, 인코더는, 인코더로 입력되는, 광대역 오디오 신호의 5번째 데이터 프레임에 대한 MDCT 변환을 수행한 후 0 내지 8000 Hz 내에서 320개의 스펙트럼 계수를 획득하고, 또한 청각 감지 특성에 따라서, 5번째 데이터 프레임의 320개의 스펙트럼 계수를 불균일한 간격을 갖는 18개의 서브밴드로 분할한다. 6번째 데이터 프레임 내의 18개의 서브밴드의 주파수 포락선을 계산하고 양자화한 후, 인코더는 6번째 데이터 프레임 내의 18개의 서브밴드의 양자화 주파수 포락선 인덱스 값과 6번째 데이터 프레임 내의 18개의 서브밴드의 양자화된 주파수 포락선 값(fenv)을 획득한다.
(1) 6번째 데이터 프레임에서 높은 주파수를 갖는 세 개의 서브밴드와 5번째 데이터 프레임에서 높은 주파수를 갖는 두 개의 서브밴드가 선택되면, 즉, M=3이고, L=2이면, y번째 데이터 프레임 내의 M개의 서브밴드는 6번째 데이터 프레임에서 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드이고, y-1번째 데이터 프레임 내의 L개의 서브밴드는 5번째 데이터 프레임에서 17번째 서브밴드 및 18번째 서브밴드이다. 6번째 데이터 프레임에서 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드의 신호 유형이 각각 고조파, 고조파가 아님, 및 고조파이고, 5번째 데이터 프레임에서 17번째 서브밴드와 18번째 서브밴드의 양자화 비트 할당 상태가 각각 "1"과 "0"이며, 5번째 데이터 프레임에서 17번째 서브밴드와 18번째 서브밴드의 신호 유형이 각각 고조파 및 고조파가 아닌 것으로 가정한다.
M>L이기 때문에, 바람직하게, 인코더는 6번째 데이터 프레임에서 단지 세 개의 서브밴드의 양자화된 주파수 포락선 값만을 수정할 필요가 있다. 즉, 인코더는 6번째 데이터 프레임에서 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드만을 수정할 필요가 있다.
설명의 편의를 위해서, 이하에서는 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드의 수정 인자를 결정하기 위한 방법에 대해 상세하게 설명한다.
먼저, 인코더는 다음과 같이 제1 수정 인자(factor 1)를 결정한다: 6번째 데이터 프레임 내의 16번째 서브밴드가 고조파이므로, 따라서 16번째 서브밴드에 대응하는 제1 수정 인자(factor 1)는 1보다 큰 값이며; 6번째 데이터 프레임 내의 17번째 서브밴드가 고조파가 아니므로, 따라서 17번째 서브밴드에 대응하는 제1 수정 인자(factor 1)는 1보다 작거나 같으며; 마찬가지로, 6번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제1 수정 인자(factor 1)는 1보다 큰 값이다. 서브밴드의 신호 유형이 고조파이면, factor 1은 제1 공식을 사용하는 계산에 의해 획득되고; 서브밴드의 신호 유형이 고조파가 아니면, factor 1은 제2 공식을 사용하는 계산에 의해서 획득된다.
그 후, 인코더는 다음과 같이 제2 수정 인자(factor 2)를 결정한다: 인코더는 먼저 제3 수정 인자와 제4 수정 인자를 결정할 필요가 있다. 제3 수정 인자를 결정함에 있어서, 5번째 데이터 프레임 내의 17번째 서브밴드와 18번째 서브밴드의 양자화 비트 할당 상태가 각각 "1"과 "0"이기 때문에, 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제3 수정 인자(factor 3)는 1보다 큰 값이고, 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제3 수정 인자(factor 3)는 1보다 작은 값이다. 서브밴드의 양자화 비트 상태가 "1"이면, factor 3은 제3 공식을 사용하는 계산에 의해서 획득되고; 서브밴드의 양자화 비트 상태가 "0"이면, factor 3은 제4 공식을 사용하는 계산에 의해서 획득된다. 제4 수정 인자를 결정함에 있어서, 5번째 데이터 프레임 내의 17번째 서브밴드와 18번째 서브밴드의 신호 유형이 각각 고조파와 고조파이 아닌 것이기 때문에, 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제4 수정 인자(factor 4)는 1보다 큰 값이고, 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제4 수정 인자(factor 4)는 1보다 작은 값이다. 서브밴드의 신호 유형이 고조파이면, factor 4는 제1 공식을 사용하는 계산에 의해 획득되고; 서브밴드의 신호 유형이 고조파가 아니면, factor 4는 제2 공식을 사용하는 계산에 의해서 획득된다.
바람직하게, 5번째 데이터 프레임 내의 17번째 서브밴드를 수정하는 데 사용되는 제2 수정 인자는 6번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제3 수정 인자(factor 3)와 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제4 수정 인자(factor 4)의 곱이고, 5번째 데이터 프레임 내의 18번째 서브밴드를 수정하는 데 사용되는 제2 수정 인자는 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제3 수정 인자(factor 3)와 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제4 수정 인자(factor 4)의 곱이다.
마지막으로, 인코더는, M개의 제1 수정 인자 내의 L개의 제1 수정 인자와 L개의 제2 수정 인자에 따라서, y번째 데이터 프레임 내의 M개의 서브밴드에서 L개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정할 수 있고, 인코더는 M개의 제1 수정 인자 내에서 M-L개의 남은 제1 수정 인자에 따라서 y번째 데이터 프레임 내의 M개의 서브밴드에서 M-L개의 남은 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정할 수 있다. 본 예에서, M=3이고, L=2이므로, 6번째 데이터 프레임에서, 인코더는, 6번째 데이터 프레임 내의 17번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 17번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제2 수정 인자를 곱하고; 동시에, 인코더는, 6번째 데이터 프레임 내의 18번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 18번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제2 수정 인자를 곱하며; 동시에, 인코더는, 6번째 데이터 프레임 내의 16번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 16번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제1 수정 인자를 곱하므로, 인코더는 6번째 데이터 프레임내의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드의 양자화된 주파수 포락선 값을 수정할 수 있다. 즉:
6번째 데이터 프레임 내의 16번째 서브밴드에 대해, 수정된 fenv 16 = factor 1 x fenv 16이며, 여기서 factor 1은 6번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제1 수정 인자이고, 수정된 fenv 16은 6번째 데이터 프레임 내의 16번째 서브밴드의 수정된 양자화 주파수 포락선 값이며, fenv 16은 6번째 데이터 프레임 내의 16번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
6번째 데이터 프레임 내의 17번째 서브밴드에 대해,
수정된 fenv 17 = factor 1 x factor 2 x fenv 17이며, 여기서 factor 2 = factor 3 x factor 4이고, factor 1은 6번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제1 수정 인자이고, factor 2는 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제2 수정 인자이며, factor 3은 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제3 수정 인자이고, factor 4는 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제4 수정 인자이며, 수정된 fenv 17은 6번째 데이터 프레임 내의 17번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 17은 6번째 데이터 프레임 내의 17번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
마찬가지로, 6번째 데이터 프레임 내의 18번째 서브밴드에 대해,
수정된 fenv 18 = factor 1 x factor 2 x fenv 18이며, 여기서 수정된 fenv 18은 6번째 데이터 프레임 내의 18번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 18은 6번째 데이터 프레임 내의 18번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
(2) 6번째 데이터 프레임에서 높은 주파수를 갖는 세 개의 서브밴드와 5번째 데이터 프레임에서 높은 주파수를 갖는 세 개의 서브밴드가 선택되면, 즉, M=3이고, L=3이면, y번째 데이터 프레임 내의 M개의 서브밴드는 6번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드이고, y-1번째 데이터 프레임 내의 L개의 서브밴드는 5번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드 및 18번째 서브밴드이다. 6번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드에 대응하는 제1 수정 인자와, 5번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드에 대응하는 제2 수정 인자를 결정하기 위한 방법은 M>L인 경우에 사용되는 방법과 동일하며, 여기에서 중복 설명하지 않는다.
M=L이기 때문에, 인코더는 M개의 제1 수정 인자와 L개의 제2 수정 인자에 따라서 y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정할 수 있다. 본 예에서, M=3이고, L=3이므로; 따라서, 6번째 데이터 프레임에서, 인코더는, 6번째 데이터 프레임 내의 16번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 16번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제2 수정 인자를 곱하고; 동시에, 인코더는, 6번째 데이터 프레임 내의 17번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 17번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제2 수정 인자를 곱하며; 동시에, 인코더는, 6번째 데이터 프레임 내의 18번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 18번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제2 수정 인자를 곱하므로, 인코더는 6번째 데이터 프레임내의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드의 양자화된 주파수 포락선 값을 수정할 수 있다. 즉:
6번째 데이터 프레임 내의 16번째 서브밴드에 대해,
수정된 fenv 16 = factor 1 x factor 2 x fenv 16이며,
여기서, foctor 2= factor 4 x factor 4이고, factor 1은 6번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제1 수정 인자이고, factor 2는 5번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제2 수정 인자이며, factor 3은 5번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제3 수정 인자이고, factor 4는 5번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제4 수정 인자이며, 수정된 fenv 16은 6번째 데이터 프레임 내의 16번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 16은 6번째 데이터 프레임 내의 16번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
마찬가지로, 6번째 데이터 프레임 내의 17번째 서브밴드에 대해,
수정된 fenv 17 = factor 1 x factor 2 x fenv 17이며, 여기서 수정된 fenv 17은 6번째 데이터 프레임 내의 17번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 17은 6번째 데이터 프레임 내의 17번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
마찬가지로, 6번째 데이터 프레임 내의 18번째 서브밴드에 대해,
수정된 fenv 18 = factor 1 x factor 2 x fenv 18이며, 여기서 수정된 fenv 18은 6번째 데이터 프레임 내의 18번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 18은 6번째 데이터 프레임 내의 18번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
(3) 6번째 데이터 프레임에서 높은 주파수를 갖는 세 개의 서브밴드와 5번째 데이터 프레임에서 높은 주파수를 갖는 네 개의 서브밴드가 선택되면, 즉, M=3이고, L=4이면, y번째 데이터 프레임 내의 M개의 서브밴드는 6번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드이고, y-1번째 데이터 프레임 내의 L개의 서브밴드는 5번째 데이터 프레임에서의 15번째 서브밴드, 16번째 서브밴드, 17번째 서브밴드 및 18번째 서브밴드이다. 6번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드에 각각 대응하는 제1 수정 인자, 5번째 데이터 프레임에서의 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드에 각각 대응하는 제2 수정 인자, 및 5번째 데이터 프레임에서의 15번째 서브밴드에 대응하는 제2 수정 인자를 결정하기 위한 방법은 M>L인 경우에 사용되는 방법과 동일하며, 여기에서 중복 설명하지 않는다.
M<L이기 때문에, 바람직하게, 인코더는 6번째 데이터 프레임에서 단지 네 개의 서브밴드의 양자화된 주파수 포락선 값만을 수정할 필요가 있다. 즉, 인코더는 6번째 데이터 프레임에서 15번째 서브밴드, 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드만을 수정할 필요가 있다.
M<L인 경우, 인코더는, L개의 제2 수정 인자 내의 M개의 제2 수정 인자와 M개의 제1 수정 인자에 따라서, y번째 데이터 프레임 내의 M개의 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정하고, 인코더는, L개의 제2 수정 인자 내에서 L-M개의 남은 제2 수정 인자에 따라서, y번째 데이터 프레임 내의 L개의 서브밴드에서 L-M개의 남은 서브밴드의 양자화된 주파수 포락선 값을 대응적으로 수정한다. 본 예에서, M=3이고, L=4이므로; 따라서, 6번째 데이터 프레임에서, 인코더는, 6번째 데이터 프레임 내의 16번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 16번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제2 수정 인자를 곱하고; 동시에, 인코더는, 6번째 데이터 프레임 내의 17번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 17번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 17번째 서브밴드에 대응하는 제2 수정 인자를 곱하며; 동시에, 인코더는, 6번째 데이터 프레임 내의 18번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 18번째 서브밴드의 양자화 주파수 포락선 값에 6번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제1 수정 인자와 5번째 데이터 프레임 내의 18번째 서브밴드에 대응하는 제2 수정 인자를 곱하고; 동시에, 인코더는, 6번째 데이터 프레임 내의 15번째 서브밴드의 수정된 양자화 주파수 포락선 값을 획득하기 위해, 6번째 데이터 프레임 내의 15번째 서브밴드의 양자화 주파수 포락선 값에 5번째 데이터 프레임 내의 15번째 서브밴드의 수정 인자를 곱하므로, 인코더는 6번째 데이터 프레임 내의 15번째, 16번째 서브밴드, 17번째 서브밴드, 및 18번째 서브밴드의 양자화된 주파수 포락선 값을 수정할 수 있다. 즉:
6번째 데이터 프레임 내의 15번째 서브밴드에 대해, 수정된 fenv 15 = factor 2 x fenv 15이며, 여기서 factor 2 = factor 3 x factor 4이고, factor 2는 5번째 데이터 프레임 내의 15번째 서브밴드에 대응하는 제2 수정 인자이고, factor 3은 5번째 데이터 프레임 내의 15번째 서브밴드에 대응하는 제3 수정 인자이고, factor 4는 5번째 데이터 프레임 내의 15번째 서브밴드에 대응하는 제4 수정 인자이며, 수정된 fenv 15는 6번째 데이터 프레임 내의 15번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 15는 6번째 데이터 프레임 내의 15번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
6번째 데이터 프레임 내의 16번째 서브밴드에 대해,
수정된 fenv 16 = factor 1 x factor 2 x fenv 16이며, 여기서, factor 1은 6번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제1 수정 인자이고, factor 2는 5번째 데이터 프레임 내의 16번째 서브밴드에 대응하는 제2 수정 인자이며, 수정된 fenv 16은 6번째 데이터 프레임 내의 16번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 16은 6번째 데이터 프레임 내의 16번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
마찬가지로, 6번째 데이터 프레임 내의 17번째 서브밴드에 대해,
수정된 fenv 17 = factor 1 x factor 2 x fenv 17이며, 여기서 수정된 fenv 17은 6번째 데이터 프레임 내의 17번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 17은 6번째 데이터 프레임 내의 17번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
마찬가지로, 6번째 데이터 프레임 내의 18번째 서브밴드에 대해,
수정된 fenv 18 = factor 1 x factor 2 x fenv 18이며, 여기서 수정된 fenv 18은 6번째 데이터 프레임 내의 18번째 서브밴드의 수정된 양자화 주파수 포락선 값이고, fenv 18은 6번째 데이터 프레임 내의 18번째 서브밴드의 수정되지 않은 양자화 주파수 포락선 값이다.
본 발명의 본 실시예에서 제공되는 인코딩 방법에 따라서, 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 인코더가 서브밴드의 양자화된 주파수 포락선 값을 획득하고; 인코더가 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며; 인코더가, 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하고; 인코더가, 양자화 비트가 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하며; 마지막으로, 인코더가, 양자화 비트가 할당되는, 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다. 이러한 해결수단에 따라서, 양자화 비트 할당이 오디오 신호의 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 수행되기 전에, 서브밴드의 양자화된 주파수 포락선 값이 현재 데이터 프레임의 신호 유형과 이전 데이터 프레임에 대한 정보에 따라서 수정될 수 있으므로; 따라서, 서브밴드의 수정된 양자화된 주파수 포락선 값과 다량의 가용 비트에 따라서 서브밴드의 스펙트럼에 대한 양자화 비트 할당을 수행하는 것에 의해 오디오 신호의 스펙트럼 계수에 대한 적합한 양자화 비트 할당의 목적을 달성할 수 있으므로, 디코더에 의해 디코딩이 수행됨으로써 얻어지는 신호의 품질을 향상시킬 수 있다.
제3 실시예
도 4에 도시된 바와 같이, 본 발명의 본 실시예는 인코딩 장치(1)를 제공한다. 인코딩 장치(1)는,
현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 서브밴드의 양자화된 주파수 포락선 값을 획득하도록 구성된, 획득 유닛(10);
획득 유닛(10)에 의해 획득되는 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하도록 구성된, 수정 유닛(11);
수정 유닛(11)에 의해 수정된, 제1 수량의 서브밴드의 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하도록 구성된, 할당 유닛(12);
서브밴드에서 할당 유닛(12)에 의해 양자화 비트가 할당되는, 서브밴드의 스펙트럼 계수를 양자화하도록 구성된, 양자화 유닛(13); 및
양자화 유닛(13)에 의해 양자화된, 양자화 비트가 할당된 서브밴드의, 스펙트럼 계수를 비트스트림에 기록하도록 구성된 다중화 유닛(14)을 포함할 수 있다.
선택적으로, 획득 유닛(10)은 제1 수량의 서브밴드의 수정 인자를 획득하도록 추가로 구성된다.
수정 유닛(11)은, 제1 수량의 서브밴드의, 획득 유닛(10)에 의해 획득된, 양자화된 주파수 포락선 값을, 획득 유닛(10)에 의해 획득되는 제1 수량의 서브밴드의 수정 인자를 사용하여 수정하도록 추가로 구성된다.
선택적으로, 도 5에 도시된 바와 같이, 인코딩 장치는 결정 유닛(15)을 더 포함한다.
획득 유닛(10)은 제1 수량의 서브밴드의 신호 유형을 획득하도록 추가로 구성된다.
결정 유닛(15)은, 획득 유닛(10)에 의해 획득되는 제1 수량의 서브밴드의 신호 유형에 따라서, 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성된다.
결정 유닛(15)은, 획득 유닛(10)에 의해 획득된, 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파인 경우, 제1 서브밴드의 수정 인자가 1보다 크도록 결정하거나, 또는, 획득 유닛(10)에 의해 획득된, 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파가 아닌 경우, 제1 서브밴드의 수정 인자가 1보다 작거나 같도록 결정하도록 추가로 구성된다.
선택적으로, 획득 유닛(10)은, 제1 수량의 서브밴드의 신호 유형에 따라서 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 현재 데이터 프레임의 이전 데이터 프레임에서 제2 수량의 서브밴드의 저장된 참고 정보를 획득하도록 추가로 구성되며, 여기서 제2 수량은 제1 수량보다 작거나 같다.
결정 유닛(15)은 구체적으로, 제1 수량의 서브밴드의 신호 유형과 획득 유닛(10)에 의해 획득되는 제2 수량의 서브밴드의 참고 정보에 따라서, 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성된다.
선택적으로, 결정 유닛(15)은, 획득 유닛(10)에 의해 획득되는 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형에 따라서 제1 서브밴드의 제1 수정 인자를 결정하고; 제2 수량의 서브밴드에서, 제1 서브밴드에 대응하는, 제2 서브밴드의, 획득 유닛(10)에 의해 획득되는, 참고 정보에 따라서 제1 서브밴드의 제2 수정 인자를 결정하며; 제1 수정 인자와 제2 수정 인자의 곱을 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성된다.
선택적으로, 획득 유닛(10)에 의해 획득되는 제2 서브밴드의 참고 정보는 제2 서브밴드의 양자화 비트 할당 상태 및/또는 제2 서브밴드의 신호 유형을 포함하며, 여기서 제2 서브밴드의 참고 정보가 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 결정 유닛(15)에 의해 결정되는 제2 수정 인자는 제3 수정 인자이거나, 또는 제2 서브밴드의 참고 정보가 제2 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제4 수정 인자이거나, 또는 제1 서브밴드의 참고 정보가 제2 서브밴드의 양자화 비트 할당 상태와 제2 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제3 수정 인자와 제4 수정 인자의 곱이다.
선택적으로, 결정 유닛(15)은, 제2 서브밴드의 양자화 비트 할당 상태가 스펙트럼 계수가 인코딩되지 않는 것으로 지시하는 경우, 제3 수정 인자가 1보다 작도록 결정하거나, 또는 제2 서브밴드의 양자화 비트 할당 상태가 스펙트럼 계수가 인코딩되는 것으로 지시하는 경우, 제3 수정 인자가 1보다 크도록 결정하며; 획득 유닛(10)에 의해 획득되는 제2 서브밴드의 신호 유형이 고조파인 경우, 제4 수정 인자가 1보다 크도록 결정하거나, 또는 획득 유닛(10)에 의해 획득되는 제2 서브밴드의 신호 유형이 고조파가 아닌 경우, 제4 수정 인자가 1보다 작거나 같도록 결정하도록 추가로 구성된다.
선택적으로, 결정 유닛(15)에 의해 결정되는 제1 서브밴드의 제2 수정 인자는 제2 서브밴드의 주파수 포락선 값, 제2 수량의 서브밴드의 평균 주파수 포락선 값, 제2 수량의 서브밴드의 대역폭 값, 제2 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 제2 수량의 서브밴드의 주파수 포락선 편차 값 중 임의의 두 값의 비율에 따라서 결정된다.
선택적으로, 결정 유닛(15)에 의해 결정되는 제1 서브밴드의 제1 수정 인자는 제1 서브밴드의 주파수 포락선 값, 제1 수량의 서브밴드의 평균 주파수 포락선 값, 제1 수량의 서브밴드의 대역폭 값, 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 제1 수량의 서브밴드의 주파수 포락선 편차 값 중 임의의 두 값의 비율에 따라서 결정된다.
선택적으로, 획득 유닛(10)은 현재 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 저장된 참고 정보를 획득하도록 추가로 구성된다.
결정 유닛(15)은 획득 유닛(10)에 의해 획득되는 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보에 따라서 현재 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 결정하도록 추가로 구성된다.
선택적으로, 획득 유닛(10)은, 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 현재 데이터 프레임 내의 서브밴드에서 제3 수량의 서브밴드의 신호 유형을 획득하도록 추가로 구성되며, 여기서 제3 수량은 제1 수량보다 작거나 같다.
결정 유닛(15)은 구체적으로, 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보와 획득 유닛(10)에 의해 획득되는 제3 수량의 서브밴드의 신호 유형에 따라서, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성된다.
선택적으로, 결정 유닛(15)은, 획득 유닛(10)에 의해 획득되는 이전 데이터 프레임 내의 제1 수량의 서브밴드에서 제2 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 제1 서브밴드의 제2 수정 인자를 결정하고; 획득 유닛(10)에 의해 획득되는 제1 서브밴드의 신호 유형에 따라서 제1 서브밴드의 제1 수정 인자를 결정하며; 제1 수정 인자와 제2 수정 인자의 곱을 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성된다.
선택적으로, 도 6에 도시된 바와 같이, 인코딩 장치는 저장 유닛(16)을 더 포함한다.
저장 유닛(16)은, 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 할당 유닛(12)이 서브밴드에게 양자화 비트를 할당한 후, 제1 수량의 서브밴드의 참고 정보를 저장하도록 추가로 구성된다.
본 발명의 본 실시예에서 제공되는 인코딩 장치에 따라서, 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 인코딩 장치가 서브밴드의 양자화된 주파수 포락선 값을 획득하고; 인코딩 장치가 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며; 인코딩 장치가, 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하고; 인코딩 장치가, 양자화 비트가 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하며; 마지막으로, 인코딩 장치가, 양자화 비트가 할당되는, 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다. 이러한 해결수단에 따라서, 양자화 비트 할당이 오디오 신호의 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 수행되기 전에, 서브밴드의 양자화된 주파수 포락선 값이 현재 데이터 프레임의 신호 유형과 이전 데이터 프레임에 대한 정보에 따라서 수정될 수 있으므로; 따라서, 서브밴드의 수정된 양자화된 주파수 포락선 값과 다량의 가용 비트에 따라서 서브밴드의 스펙트럼에 대한 양자화 비트 할당을 수행하는 것에 의해 오디오 신호의 스펙트럼 계수에 대한 적합한 양자화 비트 할당의 목적을 달성할 수 있으므로, 디코더에 의해 디코딩이 수행됨으로써 얻어지는 신호의 품질을 향상시킬 수 있다.
제4 실시예
도 7에 도시된 바와 같이, 본 발명의 본 실시예는 인코더를 제공한다. 인코더는 프로세서(20), 메모리(21), 통신 인터페이스(22), 및 시스템 버스(23)를 포함할 수 있다.
프로세서(20), 메모리(21), 및 통신 인터페이스(22)는 서로 연결되며, 버스(23)를 사용하여 서로 통신을 수행한다.
프로세서(20)는 싱글-코어(single-core) 또는 멀티-코어(multi-core) 중앙 처리 장치(central processing unit), 또는 애플리케이션-전용 집적 회로(application-specific integrated circuit), 또는 본 발명의 본 실시예를 구현하도록 구성된 하나 이상의 집적 회로일 수 있다.
메모리(21)는 고속 RAM 메모리일 수 있거나, 또는 예를 들어, 적어도 하나의 자기 디스크 메모리(magnetic disk memory)와 같은, 비휘발성 메모리일 수 있다.
메모리(21)는 인코더에 의해 실행되는 명령을 저장하도록 구성된다. 구체적으로, 인코더에 의해 실행되는 명령은 소프트웨어 코드와 소프트웨어 프로그램을 포함할 수 있다.
구체적으로, 프로세서(20)는, 시스템 버스(23)를 사용하여 통신 인터페이스(22)로부터 획득되는 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 서브밴드의 양자화된 주파수 포락선 값을 획득하고; 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며; 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하고; 양자화 비트가 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하며; 마지막으로, 양자화 비트가 할당되는, 서브밴드의 양자화된 스펙트럼 계수를, 시스템 버스(23)를 사용하여, 비트스트림에 기록하도록 구성된다. 메모리(21)는, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 신호 유형의 소프트웨어 코드와 현재 데이터 프레임의 이전 데이터 프레임 내의 제2 수량의 서브밴드의 참고 정보의 소프트웨어 코드, 또는 현재 데이터 프레임 내의 제3 수량의 서브밴드의 신호 유형의 소프트웨어 코드와 현재 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보의 소프트웨어 코드, 및 전술한 과정을 완료하기 위해 인코더를 제어하기 위한 소프트웨어 프로그램을 저장하도록 구성될 수 있으므로, 프로세서(20)는 메모리(21)에 저장된 소프트웨어 프로그램을 실행하고 대응되는 소프트웨어 코드를 호출함으로써 전술한 과정을 완료할 수 있다.
선택적으로, 프로세서(20)는, 제1 수량의 서브밴드의 수정 인자를 획득하고, 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하기 위해 제1 수량의 서브밴드의 수정 인자를 사용하도록 추가로 구성된다.
선택적으로, 프로세서(20)는, 시스템 버스(23)를 사용하여 통신 인터페이스(22)로부터 제1 수량의 서브밴드의 신호 유형을 획득하고, 제1 수량의 서브밴드의 신호 유형에 따라서 제1 수량의 서브밴드의 수정 인자를 결정하도록 추가로 구성된다.
선택적으로, 프로세서(20)는, 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파인 경우, 제1 서브밴드의 수정 인자가 1보다 크도록 결정하거나, 또는, 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파가 아닌 경우, 제1 서브밴드의 수정 인자가 1보다 작거나 같도록 결정하도록 추가로 구성된다.
선택적으로, 프로세서(20)는, 제1 수량의 서브밴드의 신호 유형에 따라서 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 현재 데이터 프레임의 이전 데이터 프레임에서 제2 수량의 서브밴드의 저장된 참고 정보를 획득하도록 추가로 구성되며, 여기서 제2 수량은 제1 수량보다 작거나 같다.
선택적으로, 프로세서(20)는 구체적으로, 제1 수량의 서브밴드의 신호 유형과 제2 수량의 서브밴드의 참고 정보에 따라서, 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성된다.
선택적으로, 프로세서(20)는, 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형에 따라서 제1 서브밴드의 제1 수정 인자를 결정하고; 제2 수량의 서브밴드에서, 제1 서브밴드에 대응하는, 제2 서브밴드의 참고 정보에 따라서 제1 서브밴드의 제2 수정 인자를 결정하며; 제1 수정 인자와 제2 수정 인자의 곱을 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성된다.
선택적으로, 프로세서(20)는, 제2 서브밴드의 참고 정보는 제2 서브밴드의 양자화 비트 할당 상태 및/또는 제2 서브밴드의 신호 유형을 포함하며, 여기서 제2 서브밴드의 참고 정보가 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 제2 수정 인자가 제3 수정 인자이거나, 또는 제2 서브밴드의 참고 정보가 제2 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자가 제4 수정 인자이거나, 또는 제2 서브밴드의 참고 정보가 제2 서브밴드의 양자화 비트 할당 상태와 제2 서브밴드의 신호 유형을 포함하는 경우, 제2 수정 인자는 제3 수정 인자와 제4 수정 인자의 곱이다.
선택적으로, 프로세서(20)는, 제2 서브밴드의 양자화 비트 할당 상태가 스펙트럼 계수가 인코딩되지 않는 것으로 지시하는 경우, 제3 수정 인자가 1보다 작도록 결정하거나, 또는 제2 서브밴드의 양자화 비트 할당 상태가 스펙트럼 계수가 인코딩되는 것으로 지시하는 경우, 제3 수정 인자가 1보다 크도록 결정하며; 제2 서브밴드의 신호 유형이 고조파인 경우, 제4 수정 인자가 1보다 크도록 결정하거나, 또는 제2 서브밴드의 신호 유형이 고조파가 아닌 경우, 제4 수정 인자가 1보다 작거나 같도록 결정하도록 추가로 구성된다.
선택적으로, 제1 서브밴드의 제1 수정 인자는 제1 서브밴드의 주파수 포락선 값, 제1 수량의 서브밴드의 평균 주파수 포락선 값, 제1 수량의 서브밴드의 대역폭 값, 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 제1 수량의 서브밴드의 주파수 포락선 편차 값 중 임의의 두 값의 비율에 따라서 결정되고; 제1 서브밴드의 제2 수정 인자는 제2 서브밴드의 주파수 포락선 값, 제2 수량의 서브밴드의 평균 주파수 포락선 값, 제2 수량의 서브밴드의 대역폭 값, 제2 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 제2 수량의 서브밴드의 주파수 포락선 편차 값 중 임의의 두 값의 비율에 따라서 결정된다.
선택적으로, 프로세서(20)는 현재 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 저장된 참고 정보를 획득하도록 추가로 구성된다.
선택적으로, 프로세서(20)는 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보에 따라서 현재 데이터 프레임 내의 제1 수량의 서브밴드의 수정인자를 결정하도록 추가로 구성된다.
선택적으로, 프로세서(20)는, 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 현재 데이터 프레임 내의 서브밴드에서 제3 수량의 서브밴드의 신호 유형을 획득하도록 추가로 구성되며, 여기서 제3 수량은 제1 수량보다 작거나 같다.
선택적으로, 프로세서(20)는 구체적으로, 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보와 제3 수량의 서브밴드의 신호 유형에 따라서, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성된다.
선택적으로, 프로세서(20)는, 이전 데이터 프레임 내의 제1 수량의 서브밴드에서 제2 서브밴드의 참고 정보에 따라서, 현재 데이터 프레임 내의 제1 수량의 서브밴드의 제1 서브밴드의 제2 수정 인자를 결정하고; 제1 서브밴드의 신호 유형에 따라서 제1 서브밴드의 제1 수정 인자를 결정하며; 제1 수정 인자와 제2 수정 인자의 곱을 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성된다.
프로세서(20)는, 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당한 후, 제1 수량의 서브밴드의 참고 정보를 저장하도록 추가로 구성된다.
본 발명의 본 실시예에서 제공되는 인코더에 따라서, 현재 데이터 프레임의 스펙트럼 계수를 서브밴드로 분할한 후, 인코더가 서브밴드의 양자화된 주파수 포락선 값을 획득하고; 인코더가 서브밴드에서 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하며; 인코더가 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 서브밴드에게 양자화 비트를 할당하고; 인코더가, 양자화 비트가 서브밴드에서 할당되는, 서브밴드의 스펙트럼 계수를 양자화하며; 마지막으로, 인코더가, 양자화 비트가 할당되는, 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록한다. 이러한 해결수단에 따라서, 양자화 비트 할당이 오디오 신호의 현재 데이터 프레임 내의 서브밴드의 스펙트럼 계수에 대해 수행되기 전에, 서브밴드의 양자화된 주파수 포락선 값이 현재 데이터 프레임의 신호 유형과 이전 데이터 프레임에 대한 정보에 따라서 수정될 수 있으므로; 따라서, 서브밴드의 수정된 양자화된 주파수 포락선 값과 다량의 가용 비트에 따라서 서브밴드의 스펙트럼에 대한 양자화 비트 할당을 수행하는 것에 의해 오디오 신호의 스펙트럼 계수에 대한 적합한 양자화 비트 할당의 목적을 달성할 수 있으므로, 디코더에 의해 디코딩이 수행됨으로써 얻어지는 신호의 품질을 향상시킬 수 있다.
통상의 기술자라면, 간편하게 기술하기 위한 목적으로, 전술한 기능 모듈의 분할이 설명을 위한 예시로서 취해졌다는 것을 이해할 것이다. 실제 애플리케이션에서, 전술한 기능들은 상이한 기능 모듈에게 할당될 수 있으며 또한 요구에 따라서 구현될 수 있다. 즉, 장치의 내부 구조는 상기한 기능들의 일부 또는 전부를 구현하도록 상이한 기능 모듈로 분할된다. 전술한 시스템, 장치, 및 유닛의 상세한 작동 과정에 대해서는, 전술한 방법 실시예에서의 대응되는 과정이 참조될 수 있으며, 상세한 것은 여기에서 중복 설명되지 않는다.
본 출원에서 제공된 여러 실시예에서, 개시된 시스템, 장치 및 방법은 다른 방식으로 구현될 수 있다. 예컨대, 기술된 장치 실시예는 단지 예시적이다. 예컨대, 모듈 또는 유닛 분할은 단지 논리적 기능 분할이며 실제 구현에서는 다르게 나누어질 수 있다. 예컨대, 복수의 유닛 또는 컴포넌트는 다른 하나의 시스템으로 결합되거나 통합될 수 있고, 또는 일부 특징은 무시되거나 또는 수행되지 않을 수도 있다. 또한, 표시되거나 설명된 상호 간의 연결 또는 직접 연결 또는 통신 연결은 임의의 인터페이스를 통해 구현될 수 있다. 장치 또는 유닛 간의 간접적인 연결 또는 통신 연결은 전자, 기계 또는 다른 형태로 구현될 수 있다.
별개의 부분으로 설명된 유닛은 물리적으로 독립된 것이거나, 물리적으로 독립되지 않은 것일 수 있고, 유닛으로 도시된 부분이 물리적 유닛일 수 있거나 물리적 유닛이 아닐 수 있거나, 또는 한 곳에 위치될 수 있거나, 복수의 네트워크 유닛 상에 분배되어 있을 수 있다. 일부 또는 모든 유닛은, 실시예의 해결수단의 목적을 달성하기 위해 실제 요건에 따라 선택될 수 있다.
또한, 본 발명의 실시예에서의 기능적 유닛은 하나의 처리 유닛으로 통합될 수도 있고, 또는 각 유닛이 물리적으로 독립하여 존재할 수도 있으며, 또는 둘 이상의 유닛이 하나의 유닛으로 통합될 수도 있다. 통합 유닛은 하드웨어의 형태로 구현될 수 있거나, 또는 소프트웨어 기능 유닛의 형태로 구현될 수 있다.
통합 유닛이 소프트웨어 기능 유닛의 형태로 구현되고 독립된 제품으로 판매되거나 사용되는 경우, 그 통합된 유닛은 컴퓨터에 의해 판독 가능한 저장 매체에 저장될 수 있다. 그러한 사상에 기초하는 경우, 본 발명의 기술적 해결수단은 필수적으로, 또는 종래 기술에 기여하는 부분 또는 그 기술적 해결수단 모두 또는 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되고, 컴퓨터 장치(개인용 컴퓨터, 서버, 또는 네트워크 장치) EH는 프로세서로 하여금 본 발명의 실시예에서 기술된 방법의 일부 또는 모든 단계를 수행하도록 하는 명령어를 포함한다. 전술한 저장 매체는, USB 플래시 드라이브, 탈착 가능한 하드 디스크, ROM(Read-Only Memory), RAM(Random Access Memory), 자기 디스크 또는 광 디스크와 같은, 프로그램 코드를 저장할 수 있으면 어떤 매체라도 좋다.
전술한 설명은 단지 본 발명의 구체적인 실시예일 뿐이며, 본 발명의 보호 범위를 제한하기 위한 것이 아니다. 통상의 기술자가 본 발명에서 개시된 기술적 범위 내에서 생각해 낼 수 있는 변형 또는 대체는 모두 본 발명의 보호 범위 내에 속한다. 따라서, 본 발명의 보호 범위는 청구범위의 보호 범위에 의해 결정되어야 한다.

Claims (28)

  1. 인코딩 방법으로서,
    현재의 데이터 프레임의 스펙트럼 계수를 서브밴드(subband)로 분할한 후, 상기 서브밴드의 양자화된 주파수 포락선 값(quantized frequency envelope value)을 획득하는 단계;
    상기 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계;
    상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하는 단계;
    상기 서브밴드에서 양자화 비트가 할당된 서브밴드의 스펙트럼 계수를 양자화하는 단계; 및
    양자화 비트가 할당된 서브밴드의 양자화된 스펙트럼 계수를 비트스트림에 기록하는 단계
    를 포함하는 인코딩 방법.
  2. 제1항에 있어서,
    상기 서브밴드 내의 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계는,
    상기 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득하는 단계; 및
    상기 제1 수량의 서브밴드의 수정 인자를 사용하여 상기 제1 수량의 서브밴드의 양자화된 주파수 포락선 값을 수정하는 단계
    를 포함하는, 인코딩 방법.
  3. 제2항에 있어서,
    상기 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득하는 단계는,
    상기 제1 수량의 서브밴드의 신호 유형(signal type)을 획득하는 단계; 및
    상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계
    를 포함하는, 인코딩 방법.
  4. 제3항에 있어서,
    상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는,
    상기 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파(harmonic)인 경우, 상기 제1 서브밴드의 수정 인자가 1보다 크도록 결정하거나, 또는
    상기 제1 수량의 서브밴드 내의 제1 서브밴드의 신호 유형이 고조파가 아닌 경우, 상기 제1 서브밴드의 수정 인자가 1보다 작거나 같도록 결정하는 단계
    를 포함하는, 인코딩 방법.
  5. 제3항 또는 제4항에 있어서,
    상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계 전에, 상기 방법은,
    상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제2 수량의 서브밴드의 저장된 참고 정보(reference information)를 획득하는 단계 - 상기 제2 수량은 상기 제1 수량보다 작거나 같음 -
    를 더 포함하고,
    상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계가, 구체적으로,
    상기 제1 수량의 서브밴드의 신호 유형과 상기 제2 수량의 서브밴드의 참고 정보에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계
    를 포함하는, 인코딩 방법.
  6. 제5항에 있어서,
    상기 제1 수량의 서브밴드의 신호 유형과 상기 제2 수량의 서브밴드의 참고 정보에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는,
    상기 제1 수량의 서브밴드 내의 상기 제1 서브밴드의 신호 유형에 따라서 상기 제1 서브밴드의 제1 수정 인자를 결정하는 단계;
    상기 제2 수량의 서브밴드에서, 상기 제1 서브밴드에 대응하는, 제2 서브밴드의 참고 정보에 따라서 상기 제1 서브밴드의 제2 수정 인자를 결정하는 단계; 및
    상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하는 단계
    를 포함하는, 인코딩 방법.
  7. 제6항에 있어서,
    상기 제2 서브밴드의 참고 정보는 상기 제2 서브밴드의 양자화 비트 할당 상태 및/또는 상기 제2 서브밴드의 신호 유형을 포함하고,
    상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 상기 제2 수정 인자는 제3 수정 인자이거나, 또는
    상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 제4 수정 인자이거나, 또는
    상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태와 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 상기 제3 수정 인자와 상기 제4 수정 인자의 곱인,
    인코딩 방법.
  8. 제7항에 있어서,
    상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되지 않는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 작거나, 또는 상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 크며;
    상기 제2 서브밴드의 신호 유형이 고조파인 경우, 상기 제4 수정 인자는 1보다 크거나, 또는 상기 제2 서브밴드의 신호 유형이 고조파가 아닌 경우, 상기 제4 수정 인자는 1보다 작거나 같은,
    인코딩 방법.
  9. 제7항 또는 제8항에 있어서,
    상기 제1 서브밴드의 제2 수정 인자는, 상기 제2 서브밴드의 주파수 포락선 값, 상기 제2 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제2 수량의 서브밴드의 대역폭 값, 상기 제2 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제2 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정되는,
    인코딩 방법.
  10. 제6항 내지 제8항 중 어느 한 항에 있어서,
    상기 제1 서브밴드의 제1 수정 인자는, 상기 제1 서브밴드의 주파수 포락선 값, 상기 제1 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제1 수량의 서브밴드의 대역폭 값, 상기 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제1 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정되는,
    인코딩 방법.
  11. 제2항에 있어서,
    상기 제1 수량의 서브밴드의 수정 인자를 획득하는 단계는,
    상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 저장된 참고 정보를 획득하는 단계; 및
    상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계
    를 포함하는, 인코딩 방법.
  12. 제11항에 있어서,
    상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계 전에, 상기 방법은,
    상기 현재의 데이터 프레임 내의 서브밴드에서 제3 수량의 서브밴드의 신호 유형을 획득하는 단계 - 상기 제3 수량은 상기 제1 수량보다 작거나 같음 -
    를 더 포함하고,
    상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는, 구체적으로,
    상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보와 상기 제3 수량의 서브밴드의 신호 유형에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계
    를 포함하는, 인코딩 방법.
  13. 제12항에 있어서,
    상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보와 상기 제3 수량의 서브밴드의 신호 유형에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하는 단계는,
    상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제2 서브밴드의 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제1 서브밴드의 제2 수정 인자를 결정하는 단계;
    상기 제1 서브밴드의 신호 유형에 따라서 상기 제1 서브밴드의 제1 수정 인자를 결정하는 단계; 및
    상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하는 단계
    를 포함하는, 인코딩 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하는 단계 후에, 상기 방법은,
    상기 제1 수량의 서브밴드의 참고 정보를 저장하는 단계
    를 더 포함하는, 인코딩 방법.
  15. 인코딩 장치로서,
    현재의 데이터 프레임의 스펙트럼 계수를 서브밴드(subband)로 분할한 후, 상기 서브밴드의 양자화된 주파수 포락선 값(quantized frequency envelope value)을 획득하도록 구성된 획득 유닛;
    상기 획득 유닛에 의해 획득된, 상기 서브밴드 내의 제1 수량의 서브밴드의, 양자화된 주파수 포락선 값을 수정하도록 구성된 수정 유닛;
    상기 수정 유닛에 의해 수정된, 상기 제1 수량의 서브밴드의, 양자화된 주파수 포락선 값에 따라서 상기 서브밴드에게 양자화 비트를 할당하도록 구성된 할당 유닛;
    상기 서브밴드에서 상기 양자화 유닛에 의해 양자화 비트가 할당된 서브밴드의 스펙트럼 계수를 양자화하도록 구성된 양자화 유닛; 및
    상기 양자화 유닛에 의해 양자화된, 양자화 비트가 할당된 서브밴드의, 스펙트럼 계수를 비트스트림에 기록하도록 구성된 다중화 유닛
    을 포함하는 인코딩 장치.
  16. 제15에 있어서,
    상기 획득 유닛은 상기 제1 수량의 서브밴드의 수정 인자(modification factor)를 획득하도록 추가로 구성되고;
    상기 수정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드의, 상기 양자화된 주파수 포락선 값을, 상기 획득 유닛에 의해 획득된 상기 제1 수량의 서브밴드의 수정 인자를 사용하여 수정하도록 추가로 구성되는,
    인코딩 장치.
  17. 제16항에 있어서,
    상기 인코딩 장치는 결정 유닛을 더 포함하고,
    상기 획득 유닛은 상기 제1 수량의 서브밴드의 신호 유형(signal type)을 획득하도록 추가로 구성되고;
    상기 결정 유닛은, 상기 획득 유닛에 의해 획득된 상기 제1 수량의 서브밴드의 신호 유형에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성되는,
    인코딩 장치.
  18. 제17항에 있어서,
    상기 결정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드 내의 제1 서브밴드의, 신호 유형이 고조파(harmonic)인 경우, 상기 제1 서브밴드의 수정 인자가 1보다 크도록 결정하거나, 또는, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드 내의 제1 서브밴드의, 신호 유형이 고조파가 아닌 경우, 상기 제1 서브밴드의 수정 인자가 1보다 작거나 같도록 결정하도록 추가로 구성되는,
    인코딩 장치.
  19. 제17항 또는 제18항에 있어서,
    상기 획득 유닛은, 상기 제1 수량의 서브밴드의 신호 유형에 따라서 상기 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제2 수량의 서브밴드의 저장된 참고 정보(reference information)를 획득하도록 추가로 구성되고;
    상기 결정 유닛은, 구체적으로, 상기 획득 유닛에 의해 획득된, 상기 제1 수량의 서브밴드의 신호 유형과 상기 제2 수량의 서브밴드의 참고 정보에 따라서, 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성되며,
    상기 제2 수량은 상기 제1 수량보다 작거나 같은,
    인코딩 장치.
  20. 제19항에 있어서,
    상기 결정 유닛은, 상기 획득 유닛에 의해 획득된 상기 제1 수량의 서브밴드 내의 상기 제1 서브밴드의 신호 유형에 따라서, 상기 제1 서브밴드의 제1 수정 인자를 결정하고; 상기 제2 수량의 서브밴드에서, 상기 제1 서브밴드에 대응하는, 상기 획득 유닛에 의해 획득된 제2 서브밴드의 참고 정보에 따라서 상기 제1 서브밴드의 제2 수정 인자를 결정하며; 상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하도록 추가로 구성되는,
    인코딩 장치.
  21. 제20항에 있어서,
    상기 획득 유닛에 의해 획득되는 상기 제2 서브밴드의 참고 정보는 상기 제2 서브밴드의 양자화 비트 할당 상태 및/또는 상기 제2 서브밴드의 신호 유형을 포함하고,
    상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태를 포함하는 경우, 상기 결정 유닛에 의해 결정되는 상기 제2 수정 인자는 제3 수정 인자이거나, 또는
    상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 제4 수정 인자이거나, 또는
    상기 제2 서브밴드의 참고 정보가 상기 제2 서브밴드의 양자화 비트 할당 상태와 상기 제2 서브밴드의 신호 유형을 포함하는 경우, 상기 제2 수정 인자는 상기 제3 수정 인자와 상기 제4 수정 인자의 곱인,
    인코딩 장치.
  22. 제21항에 있어서,
    상기 결정 유닛은, 상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되지 않는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 작은 것으로 결정하거나, 또는 상기 제2 서브밴드의 양자화 비트 할당 상태가, 스펙트럼 계수가 인코딩되는 것으로 지시하는 경우, 상기 제3 수정 인자는 1보다 크도록 결정하며; 상기 획득 유닛에 의해 획득된 상기 제2 서브밴드의 신호 유형이 고조파인 경우, 상기 제4 수정 인자는 1보다 크도록 결정하거나, 또는 상기 획득 유닛에 의해 획득된 상기 제2 서브밴드의 신호 유형이 고조파가 아닌 경우, 상기 제4 수정 인자는 1보다 작거나 같도록 결정되도록 추가로 구성되는,
    인코딩 장치.
  23. 제21항 또는 제22항에 있어서,
    상기 결정 유닛에 의해 결정되는 상기 제1 서브밴드의 제2 수정 인자는, 상기 제2 서브밴드의 주파수 포락선 값, 상기 제2 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제2 수량의 서브밴드의 대역폭 값, 상기 제2 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제2 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정되는,
    인코딩 장치.
  24. 제20항 내지 제22항 중 어느 한 항에 있어서,
    상기 결정 유닛에 의해 결정되는 상기 제1 서브밴드의 제1 수정 인자는, 상기 제1 서브밴드의 주파수 포락선 값, 상기 제1 수량의 서브밴드의 평균 주파수 포락선 값, 상기 제1 수량의 서브밴드의 대역폭 값, 상기 제1 수량의 서브밴드의 주파수 포락선 값의 최대값, 및 상기 제1 수량의 서브밴드의 주파수 포락선 편차(variance)값 중 임의의 두 개의 값의 비율에 따라서, 결정되는,
    인코딩 장치.
  25. 제16항에 있어서,
    상기 획득 유닛은, 상기 저장 유닛에 저장된, 상기 현재의 데이터 프레임의 이전 데이터 프레임 내의 제1 수량의 서브밴드의 참고 정보를 획득하도록 추가로 구성되고;
    상기 결정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 추가로 구성되는,
    인코딩 장치.
  26. 제25항에 있어서,
    상기 획득 유닛은, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하기 전에, 상기 현재의 데이터 프레임 내의 서브밴드에서 제3 수량의 서브밴드의 신호 유형을 획득하도록 추가로 구성되고;
    상기 결정 유닛은, 구체적으로, 상기 획득 유닛에 의해 획득된, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드의 참고 정보와 상기 제3 수량의 서브밴드의 신호 유형에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드의 수정 인자를 결정하도록 구성되며,
    상기 제3 수량은 상기 제1 수량보다 작거나 같은,
    인코딩 장치.
  27. 제26항에 있어서,
    상기 결정 유닛은, 상기 획득 유닛에 의해 획득된, 상기 이전 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제2 서브밴드의, 참고 정보에 따라서, 상기 현재의 데이터 프레임 내의 상기 제1 수량의 서브밴드 내의 제1 서브밴드의 제2 수정 인자를 결정하고; 상기 획득 유닛에 의해 획득된 상기 제1 서브밴드의 신호 유형에 따라서 상기 제1 서브밴드의 제1 수정 인자를 결정하며; 상기 제1 수정 인자와 상기 제2 수정 인자의 곱을 상기 제1 서브밴드의 수정 인자로서 사용하도록,
    추가로 구성되는, 인코딩 장치.
  28. 제15항 내지 제27항 중 어느 한 항에 있어서,
    상기 저장 유닛은, 상기 제1 수량의 서브밴드의 수정된 양자화된 주파수 포락선 값에 따라서, 상기 양자화 비트가 상기 서브밴드에게 할당된 후, 상기 제1 수량의 서브밴드의 참고 정보를 저장하도록 추가로 구성되는,
    인코딩 장치.

KR1020167009812A 2013-12-02 2014-07-08 인코딩 방법 및 장치 KR101803410B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310635004.2 2013-12-02
CN201310635004 2013-12-02
PCT/CN2014/081813 WO2015081699A1 (zh) 2013-12-02 2014-07-08 一种编码方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020177033973A Division KR101913241B1 (ko) 2013-12-02 2014-07-08 인코딩 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20160055266A true KR20160055266A (ko) 2016-05-17
KR101803410B1 KR101803410B1 (ko) 2017-12-28

Family

ID=53272827

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020187030716A KR102023138B1 (ko) 2013-12-02 2014-07-08 인코딩 방법 및 장치
KR1020167009812A KR101803410B1 (ko) 2013-12-02 2014-07-08 인코딩 방법 및 장치
KR1020177033973A KR101913241B1 (ko) 2013-12-02 2014-07-08 인코딩 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020187030716A KR102023138B1 (ko) 2013-12-02 2014-07-08 인코딩 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020177033973A KR101913241B1 (ko) 2013-12-02 2014-07-08 인코딩 방법 및 장치

Country Status (14)

Country Link
US (4) US9754594B2 (ko)
EP (3) EP3525206B1 (ko)
JP (1) JP6319753B2 (ko)
KR (3) KR102023138B1 (ko)
CN (1) CN104681028B (ko)
AU (2) AU2014360038B2 (ko)
BR (1) BR112016006925B1 (ko)
CA (1) CA2925037C (ko)
ES (2) ES2901806T3 (ko)
HK (1) HK1209893A1 (ko)
MX (1) MX357353B (ko)
RU (1) RU2636697C1 (ko)
SG (2) SG10201802826QA (ko)
WO (1) WO2015081699A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2970676T3 (es) * 2012-12-13 2024-05-30 Fraunhofer Ges Forschung Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
MX357353B (es) 2013-12-02 2018-07-05 Huawei Tech Co Ltd Metodo y aparato de codificacion.
WO2015162500A2 (ko) * 2014-03-24 2015-10-29 삼성전자 주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CN107153647B (zh) * 2016-03-02 2021-12-07 北京字节跳动网络技术有限公司 进行数据压缩的方法、装置、系统和计算机程序产品
KR102169435B1 (ko) * 2016-03-21 2020-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 가중된 행렬 계수의 적응형 양자화
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10580424B2 (en) 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08167247A (ja) * 1994-12-15 1996-06-25 Sony Corp 高能率符号化方法及び装置、並びに伝送媒体
US6301555B2 (en) * 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP4300800B2 (ja) * 2000-12-22 2009-07-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
JP3942882B2 (ja) * 2001-12-10 2007-07-11 シャープ株式会社 ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置
US7027980B2 (en) * 2002-03-28 2006-04-11 Motorola, Inc. Method for modeling speech harmonic magnitudes
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US7128443B2 (en) 2002-06-28 2006-10-31 Koninklijke Philips Electronics, N.V. Light-collimating system
KR100723400B1 (ko) 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
KR100682890B1 (ko) * 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
KR100707184B1 (ko) * 2005-03-10 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
CN102163429B (zh) * 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
TWI271703B (en) * 2005-07-22 2007-01-21 Pixart Imaging Inc Audio encoder and method thereof
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
CN101206860A (zh) * 2006-12-20 2008-06-25 华为技术有限公司 一种可分层音频编解码方法及装置
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
WO2009001874A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
EP2051245A3 (en) * 2007-10-17 2013-07-10 Gwangju Institute of Science and Technology Wideband audio signal coding/decoding device and method
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
US8515767B2 (en) 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
EP2224432B1 (en) * 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
CN101562015A (zh) * 2008-04-18 2009-10-21 华为技术有限公司 音频处理方法及装置
US9037454B2 (en) * 2008-06-20 2015-05-19 Microsoft Technology Licensing, Llc Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (MCLT)
BRPI0910517B1 (pt) * 2008-07-11 2022-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Um aparelho e um método para calcular um número de envelopes espectrais a serem obtidos por um codificador de replicação de banda espectral (sbr)
BR122021003142B1 (pt) 2008-07-11 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
FR2947945A1 (fr) 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
US8498874B2 (en) * 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
JP5809066B2 (ja) * 2010-01-14 2015-11-10 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声符号化方法
JP5316896B2 (ja) 2010-03-17 2013-10-16 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
CN102222505B (zh) 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101699720B1 (ko) 2010-08-03 2017-01-26 삼성전자주식회사 음성명령 인식 장치 및 음성명령 인식 방법
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP2012103395A (ja) 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム
EP2657933B1 (en) * 2010-12-29 2016-03-02 Samsung Electronics Co., Ltd Coding apparatus and decoding apparatus with bandwidth extension
TWI672691B (zh) * 2011-04-21 2019-09-21 南韓商三星電子股份有限公司 解碼方法
RU2464649C1 (ru) 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
US8731949B2 (en) 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013035257A1 (ja) 2011-09-09 2013-03-14 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
AU2012351565B2 (en) * 2011-12-15 2015-09-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer programm for avoiding clipping artefacts
EP3611728A1 (en) * 2012-03-21 2020-02-19 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
WO2013180164A1 (ja) * 2012-05-30 2013-12-05 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
ES2970676T3 (es) * 2012-12-13 2024-05-30 Fraunhofer Ges Forschung Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
CN106847297B (zh) * 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
MX357353B (es) 2013-12-02 2018-07-05 Huawei Tech Co Ltd Metodo y aparato de codificacion.

Also Published As

Publication number Publication date
BR112016006925A2 (pt) 2017-08-01
JP2016538589A (ja) 2016-12-08
US20170316784A1 (en) 2017-11-02
ES2901806T3 (es) 2022-03-23
AU2014360038A1 (en) 2016-04-14
SG11201602234YA (en) 2016-05-30
EP3525206A1 (en) 2019-08-14
US9754594B2 (en) 2017-09-05
JP6319753B2 (ja) 2018-05-09
AU2018200552A1 (en) 2018-02-15
KR101913241B1 (ko) 2019-01-14
KR102023138B1 (ko) 2019-09-19
HK1209893A1 (en) 2016-04-08
ES2742420T3 (es) 2020-02-14
EP3040987A1 (en) 2016-07-06
EP3975173A1 (en) 2022-03-30
US20190385620A1 (en) 2019-12-19
SG10201802826QA (en) 2018-05-30
CA2925037C (en) 2020-12-01
KR20170132906A (ko) 2017-12-04
AU2014360038B2 (en) 2017-11-02
MX357353B (es) 2018-07-05
US20220172730A1 (en) 2022-06-02
CN104681028A (zh) 2015-06-03
KR101803410B1 (ko) 2017-12-28
US11289102B2 (en) 2022-03-29
RU2636697C1 (ru) 2017-11-27
WO2015081699A1 (zh) 2015-06-11
EP3975173B1 (en) 2024-01-17
KR20180118261A (ko) 2018-10-30
MX2016006259A (es) 2016-09-07
US10347257B2 (en) 2019-07-09
US20160275955A1 (en) 2016-09-22
CA2925037A1 (en) 2015-06-11
EP3040987B1 (en) 2019-05-29
CN104681028B (zh) 2016-12-21
EP3525206B1 (en) 2021-09-08
AU2018200552B2 (en) 2019-05-23
EP3040987A4 (en) 2016-08-31
BR112016006925B1 (pt) 2020-11-24

Similar Documents

Publication Publication Date Title
KR101803410B1 (ko) 인코딩 방법 및 장치
JP7010885B2 (ja) 音声または音響符号化装置、音声または音響復号装置、音声または音響符号化方法及び音声または音響復号方法
JP6321734B2 (ja) 音声信号の符号化と復号化の方法および装置
JP5788833B2 (ja) オーディオ信号の符号化方法、オーディオ信号の復号化方法及び記録媒体
JP2005338850A (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP2005328542A (ja) 複数のルックアップテーブルを利用したデジタル信号の符号化方法、デジタル信号の符号化装置及び複数のルックアップテーブル生成方法
US20130085762A1 (en) Audio encoding device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant