KR20050021467A - 저비트율 오디오 코딩 - Google Patents

저비트율 오디오 코딩 Download PDF

Info

Publication number
KR20050021467A
KR20050021467A KR10-2005-7000587A KR20057000587A KR20050021467A KR 20050021467 A KR20050021467 A KR 20050021467A KR 20057000587 A KR20057000587 A KR 20057000587A KR 20050021467 A KR20050021467 A KR 20050021467A
Authority
KR
South Korea
Prior art keywords
subband
signal
quantization
value
audio
Prior art date
Application number
KR10-2005-7000587A
Other languages
English (en)
Other versions
KR101019678B1 (ko
Inventor
마크 스튜어트 빈톤
마이클 미드 트루만
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20050021467A publication Critical patent/KR20050021467A/ko
Application granted granted Critical
Publication of KR101019678B1 publication Critical patent/KR101019678B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

매우 낮은 비트율 오디오 코딩 시스템으로부터 얻어진 오디오 신호의 인식 품질은 송신기에서 확장 양자화기(expanding quantizers) 및 연산 코딩을 사용하고 수신기에서 상보적인 압축 및 연산 디코딩을 사용함으로써 개선된다. 확장 양자화기는 제로로 양자화되는 신호 성분수를 제어하도록 사용되고 연산 코딩은 제로로 양자화된 계수를 효율적으로 코딩하도록 사용된다. 이는 대역폭을 보다 넓게하고 수신기로 전달될 양자화된 기저대역 신호를 보다 정확하게 하여, 상실 성분(missing components)을 합성함으로써 출력 신호를 재생한다.

Description

저비트율 오디오 코딩{LOW BIT-RATE AUDIO CODING}
본 발명은 일반적으로, 디지털 오디오 코딩 시스템에 관한 것이며, 특히 매우 낮은 비트율 오디오 코딩 시스템 및 방법으로부터 얻어진 오디오 신호의 인식 품질을 개선시키는 것에 관한 것이다.
오디오 코딩 시스템은 전송 또는 저장하는데 적합한 엔코딩된 신호로 오디오 신호를 엔코딩하고 나서, 이 엔코딩된 신호를 수신 또는 검색하고 이 신호를 디코딩하여 원래 오디오 신호의 버젼을 얻어 재생하도록 하는데 사용된다. 인식 오디오 코딩 시스템은 원래 오디오 신호 보다 낮은 정보 용량 요구조건을 갖는 엔코딩된 신호로 오디오 신호를 엔코딩하고 나서, 이 엔코딩된 신호를 디코딩하여 원래 오디오 신호와 인식할정도로 구별할 수 없게 되는 출력을 제공하고자 하는 것이다. 인식 오디오 코딩 기술의 일 예가 Bosi 등이 발표한 "ISO/IEC MPEG-2 Advanced Audio Coding."J.AES, vol.45, no. 10, October 1997, pp. 789-814에 개시되어 있으며, 이를 고급 오디오 코딩(AAC:Advanced Audio Coding)"이라 한다.
AAC와 같은 인식 코딩 기술은 분석 필터뱅크를 오디오 신호에 적용하여, 전형적으로 16-24 비트 정도의 고레벨의 정확도를 갖고 주파수 서브대역에 배열된 디지털 신호 성분을 얻는다. 이 서브대역 폭은 전형적으로 가변하고 통상적으로 소위 인간 청각 시스템의 임계 대역의 폭과 동일한 크기로 된다. 신호에 대한 정보 용량 요구조건은 훨씬 낮은 레벨의 정확도로 서브대역-신호 성분을 양자화함으로써 감소된다. 게다가, 양자화된 성분은 또한 허프만 코딩과 같은 엔트로피 코딩 공정(entropy coding process)에 의해 엔코딩될 수 있다. 양자화는 잡음을 양자화된 신호로 도입시키지만, 인식 오디오 코딩 시스템은 양자화 잡음 진폭을 제어시에 사이코아쿠스틱 모델(psychoacoustic models)을 사용하여 신호 내의 스펙트럼 성분에 의해 이 잡음 진폭을 마스킹하여 청취할 수 없게 한다. 서브대역-신호 성분의 부정확한 복제는 상보적인 엔트로피 디코딩 및 역양자화에 의해 엔코딩된 신호로부터 얻어진다.
많은 종래 인식 코딩 시스템의 목표는 서브대역-신호 성분을 양자화하고 엔트로피 코딩 공정을 이 양자화된 신호 성분에 적용하여 이 신호 성분이 실제 최적 또는 거의 최적이 되도록 하는 것이다. 양자화 및 엔트로피 코딩 모두 통상적으로, 가능한 큰 수학적 효율성을 가진채 동작하도록 설계된다.
최적 또는 거의 최적의 양자화기의 설계는 양자화될 신호 성분값의 통계적 특성(statistical characteristics)에 좌우된다. 분석 필터뱅크를 수행하기 위하여 변환(transform)을 사용하는 인식 코딩 시스템에서, 신호 성분값은 주파수 서브대역으로 그룹화되는 주파수-도메인 변환 계수로부터 유도되고 그 후, 이 성분값은 각 서브대역에서 가장 큰 크기의 성분에 대해서 정규화되거나 스케일링된다. 스케일링의 한 예는 블록 압신(block companding)으로 공지된 공정이다. 각 서브대역으로 그룹화되는 계수의 수는 전형적으로, 서브대역 주파수로 인해 증가되어, 이 서브대역 폭이 인간 청각 시스템의 임계 대역폭과 근사화되도록 한다. 사이코아쿠스틱 모델 및 비트 할당 공정은 각 서브대역 신호를 위한 스케일링 량을 결정한다. 그룹화 및 스케일링은 양자화될 신호 성분값의 통계적 특성을 변경시킨다. 이로 인해, 양자화 효율성은 일반적으로 그룹화되고 스케일링된 신호 성분의 특성에 대해서 최적화된다.
상술된 AAC 시스템과 같은 전형적인 인식 코딩 시스템에서, 보다 넓은 서브대역은 상대적으로 큰 크기를 지닌 몇개의 우세한(dominant) 서브대역-신호 및 상당히 작은 크기를 지닌 더 많지만 덜 우세한 신호 성분을 갖는 경향이 있다. 균일한 양자화기(uniform quantizer)는 고 효율성으로 이와 같은 분포된 값을 양자화하지 못한다. 양자화기 효율성은 보다 큰 정확도로 보다 작은 신호 성분을 양자화하고 보다 적은 정확도로 보다 많은 신호 성분을 양자화함으로써 개선될 수 있다. 이는 종종, μ-로 또는 A-로 양자화기(μ-law quantizer or A-law quantizer)와 같은 압축 양자화기(compressing quantizer)를 사용함으로써 성취된다. 압축 양자화기는 균일한 양자화기 보다 앞서 압축기로 수행될 수 있으며, 또는 이 압축 양자화기는 2-단계 공정과 등가인 불균일한 양자화기로 수행될 수 있다. 확장 역양자화기는 압축 양자화기의 작용을 반대로 하는데 사용된다. 확장 역양자화기는 근본적으로 압축 양자화기에 제공되는 압축의 반대인 확장을 제공한다.
압축 양자화기는 일반적으로, 양자화 잡음을 마스킹하는데 필요로되는 사이코아쿠스틱 모델에 의해 규정된 정확도와 실질적으로 같거나 이 보다 큰 양자화 정확도 레벨로 모든 신호 성분을 표시하는 인식 오디오 코딩 시스템에 유용한 결과를 제공한다. 압축은 일반적으로, 양자화기의 입력 범위 내에서 보다 균일하게 신호 성분값을 재분포시킴으로써 양자화 효율성을 개선시킨다.
매우 낮은 비트율(VLBR)의 오디오 코딩 시스템은 일반적으로, 양자화 잡음을 마스킹하는데 충분한 양자화 정확도로 모든 신호 성분을 표시할 수 없다. 어떤 VLBR 코딩 시스템은 단지 입력 신호의 대역폭의 일부 만을 갖는 기저대역 신호를 전송 또는 기록하고 이 기저대역 신호로부터 스펙트럼 성분을 복제하여 재생중에 신호 대역폭의 상실 부분을 재생함으로써 고레벨의 인식 품질을 갖는 출력 신호를 재생하고자 하였다. 이 기술을 때때로 "스펙트럼 해석(spectrum translation)" 또는 "스펙트럼 재생"이라 칭한다. 압축 양자화기가 일반적으로 스펙트럼 재생을 사용하는 VLBR 코딩 시스템에 사용될 때 유용한 결과를 제공하지 못한다는 것을 본 발명가는 인지하였다.
전형적인 오디오 코딩 시스템에 사용되는 최적 또는 거의 최적의 엔코더 설계는 엔코딩될 값의 통계적 특성에 좌우된다. 전형적인 시스템에서, 양자화된 신호 성분의 그룹은 하나 이상의 코드북을 사용하여 양자화된 신호 성분을 표시하는 가변 길이 코드를 발생시키는 허프만 코딩 공정에 의해 엔코딩된다. 가장 빈번하게 발생할 것이라고 예측되는 이들 양자화된 값을 표시하는데 최단 코드(shortest code)가 사용된다. 각 코드는 정수의 비트로 표현된다.
허프만 코딩은 종종, 양자화 잡음을 마스킹하는데 충분한 양자화 정확도로 모든 신호 성분을 표시할 수 있는 오디오 코딩 시스템에 양호한 결과를 제공한다. 그러나, 허프만 코딩이 많은 VLBR 코딩 시스템에 사용되는 것을 부적합하게 하는 중대한 제한들을 갖고 있다는 것을 본 발명가는 인지하였다. 이들 제한들이 후술된다.
도1은 오디오 엔코딩 송신기의 개요적인 블록도.
도2는 오디오 디코딩 수신기의 개요적인 블록도.
도3은 가정 서브대역-신호 성분(hypothetical subband signal components)의 압축 및 팽창에 대한 그래프.
도4A-도4C는 도3에 도시된 서브대역-신호 성분의 양자화에 대한 그래프.
도5는 압축 양자화 함수의 그래프.
도6은 압축 함수의 그래프.
도7은 균일한 양자화 함수의 그래프.
도8은 확장 함수의 그래프.
도9는 확장 양자화 함수의 그래프.
도10은 확장/압축 양자화 함수의 그래프.
도11은 연산 코딩의 그래프.
도12는 본 발명의 각종 양상을 구현하는데 사용될 수 있는 장치의 개요적인 블록도.
본 발명의 목적은 압축 양자화기 및 허프만 코딩과 같은 엔트로피 코딩을 사용하는 전형적인 오디오 코딩의 단점을 극복하는 개선된 오디오 코딩 시스템 및 방법을 제공하는 것이다.
본 발명의 한 양상을 따르면, 오디오 엔코딩 송신기는 서브대역-신호 성분을 갖는 오디오 신호의 주파수 서브대역을 표시하는 다수의 서브대역 신호를 발생시키는 분석 필터뱅크; 제1 구간의 값 내의 서브대역-신호 성분값에 대해 제1 양자화 정확도를 사용하고 제2 구간의 값 내의 서브대역-신호 성분값에 대해 제2 양자화 정확도를 사용하여 하나 이상의 서브대역 신호의 서브대역-신호 성분을 양자화하는 상기 분석 필터뱅크에 결합되는 양자화기로서, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고 상기 제1 구간내의 값은 상기 제2 구간내의 값 보다 작은, 양자화기; 무손실 엔코딩 공정을 사용하여 상기 양자화된 서브대역-신호 성분을 엔코딩된 서브대역 신호로 엔코딩하는 상기 양자화기에 결합되는 엔코더; 및, 상기 엔코딩된 서브대역 신호를 출력 신호내로 어셈블하는 상기 엔코더에 결합되는 포맷화기를 포함한다.
본 발명의 다른 양상을 따르면, 오디오 디코딩 수신기는 입력 신호로부터 하나 이상의 엔코딩된 서브대역 신호를 얻는 역포맷화기; 무손실 디코딩 공정을 사용하여 엔코딩된 서브대역 신호를 디코딩함으로써 하나 이상의 디코딩된 서브대역 신호를 발생시키는 상기 역포맷화기에 결합되는 디코더; 상기 서브대역-신호 성분을 역양자화하는 상기 디코더에 결합되는 역양자화기로서, 상기 역양자화기는 제1 구간의 값내의 값에 대해 제1 양자화 정확도 및 제2 구간의 값내의 값에 대해 제2 양자화 정확도를 사용하는 양자화기에 상보적이며, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고, 상기 제1 구간내의 값은 상기 제2 구간내의 값 보다 작은, 역양자화기; 및, 상기 하나 이상의 역장화된 서브대역 신호에 응답하여 출력 신호를 발생시키는 상기 역양자화기에 결합되는 합성 필터뱅크를 포함한다.
본 발명의 또다른 양상을 따르면, 오디오 엔코딩 송신기는 서브대역-신호 성분을 갖는 오디오 신호의 주파수 서브대역을 표시하는 다수의 서브대역 신호를 발생시키는 분석 필터뱅크; 제2 서브대역 신호 값이 푸싱(pushing)함이 없이 발생된 것 보다 적은 양자화 레벨로 양자화되도록 하는 값의 범위로 제2 서브대역-신호 성분을 푸싱함으로써 하나 이상의 제1 서브대역-신호 성분 보다 작은 크기를 지닌 하나 이상의 제2 서브대역-신호 성분을 갖는 서브대역 신호를 위한 양자화된 서브대역 신호를 발생시키기 위하여 하나 이상의 서브대역 신호를 양자화하여, 양자화 정확도를 감소시키고 상기 양자화된 제2 서브대역-신호 성분의 엔트로피를 감소시키는 상기 분석 필터뱅크에 결합되는 양자화기; 엔트로피 엔코딩 공정을 사용하여 상기 하나 이상의 양자화된 서브대역 신호를 엔코딩하는 상기 양자화기에 결합되는 엔코더; 및, 엔코딩된 서브대역 신호를 출력 신호내로 어셈블하는 상기 엔코더에 결합되는 포맷화기를 포함한다.
본 발명의 또 다른 양상을 따르면, 오디오 디코딩 수신기는 입력 신호로부터 하나 이상의 엔코딩된 서브대역 신호를 얻는 역포맷화기; 엔트로피 디코딩 공정을 사용하여 엔코딩된 서브대역 신호를 디코딩함으로써 하나 이상의 디코딩된 서브대역 신호를 발생시키는 상기 역포맷화기에 결합되는 디코더; 상기 디코딩된 서브대역 신호의 서브대역-신호 성분을 역양자화하는 상기 디코더에 결합되는 역양자화기로서, 상기 역양자화기는 하나 이상의 제1 서브대역-신호 성분 및 상기 하나 이상의 제1 서브대역-신호 성분 보다 크기가 작은 하나 이상의 제2 서브대역-신호 성분을 갖는 서브대역 신호에 대하여, 푸싱함이 없이 발생되는 것 보다 적은 양자화 레벨로 양자화하도록 하는 값의 범위로 상기 제2 서브대역-신호 성분을 푸시하여, 양자화 정밀도를 감소시키고 상기 양자화된 제2 서브대역-신호 성분의 엔트로피를 감소시키는 상기 양자화기에 상보적인, 역양자화기; 및, 상기 하나 이상의 역양자화된 서브대역 신호에 응답하여 출력 신호를 발생시키는 상기 역양자화기에 결합되는 합성 필터뱅크를 포함한다.
이하의 설명 및 첨부 도면과 관련하여 본 발명의 각종 특징 및 바람직한 실시예를 보다 잘 이해할 수 있다. 이하의 설명 내용 및 도면은 단지 예로서 설명된 것이고, 본 발명의 범위를 제한하는 것으로 이해되어서는 안된다.
A. 송신기
1. 개요
도1은 본 발명의 각종 양상을 포함할 수 있는 오디오 엔코딩 송신기의 한 가지 구현방식을 도시한 것이다. 이 구현방식에서, 분석 필터뱅크(12)는 오디오 신호를 표시하는 오디오 정보를 경로(11)로부터 수신하고, 이에 응답하여, 오디오 신호의 주파수 서브대역을 표시하는 디지털 정보를 제공한다. 각 주파수 서브대역에서 디지털 정보는 각 양자화기(14, 15, 16)에 의해 양자화되어 엔코더(17)로 통과된다. 이 엔코더(17)는 양자화된 정보의 엔코딩된 표현을 발생시켜 포맷화기(18)로 통과시킨다. 한 가지 구현방식에서, 양자화기(14, 15, 16)의 양자화 함수는 양자화기 제어기(13)로부터 수신된 양자화 제어 정보에 응답하여 적응되는데, 상기 양자화기 제어기는 경로(11)로부터 수신된 오디오 정보에 응답하여 양자화 제어 정보를 발생시킨다. 포맷화기(18)는 양자화된 정보 및 양자화 제어 정보의 엔코딩된 표현 을 전송 또는 저장하는데 적합한 출력 신호내로 어셈블하여 경로(19)를 따라서 이 출력 신호를 통과시킨다.
도1에 도시된 송신기는 3개의 주파수 서브대역을 위한 구성요소를 도시한 것이다. 통상적으로 보다 많은 서브대역이 사용되지만, 도시를 간결하게 하기 위하여 단지 3개만이 도시되어 있다. 특정 수는 원칙적으로 본 발명에 중요하지 않다.
분석 필터뱅크(12)는 근본적으로 광범위한 디지털 필터 기술, 블록 변환 및 웨이브릿 변환을 포함하는 바람직한 어떤 방식으로 수행될 수 있다. 예를 들어, 분석 필터뱅크(12)는 직렬로 된 하나 이상의 직교 반사 필터(QMF:Quadrature Mirror Filters), 이산 코사인 변환(DCT)과 같은 각종 이산 퓨리에-타입 변환, Princen 등이 발표한 "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancelation," ICASSP 1987 Conf.Proc., May 1987, pp. 2161-64에 개시되어 있는 시간-도메인 에일리어싱 소거(TDAC) 변환으로 공지된 특정 변형된 DCT로 수행될 수 있다.
블록 변환으로 수행되는 분석 필터뱅크는 입력 신호의 블록 또는 구간을 신호 구간의 스펙트럼 내용을 표시하는 변환 계수 세트로 변환시킨다. 하나 이상의 인접 변환 계수의 그룹은 그룹내의 계수의 수와 동등한 대역폭을 갖는 특정 주파수 서브대역 내에서 스펙트럼 내용을 표시한다.
블록 변환이 아니라 다상 필터와 같은 어떤 유형의 디지털 필터로 수행되는 분석 필터뱅크는 입력 신호를 서브대역 신호의 세트로 분할한다. 각 서브대역 신호는 특정 주파수 서브대역 내의 입력 신호의 스펙트럼 내용의 시간 기반으로 한 표현이다. 서브대역 신호는 데시메이트(decimate)되어, 각 서브대역 신호가 단위 시간 구간 동안 서브대역 신호 내의 샘플 수와 동등한 대역폭을 갖도록 한다.
이 설명에서, 용어 "서브대역 신호"는 하나 이상의 인접 변환 계수의 그룹이라 하고, 용어 "서브대역-신호 성분"은 변환 계수라 한다. 본 발명의 원리는 다른 유형의 구현방식에 적용될 수 있지만, 용어 "서브대역 신호"는 일반적으로 신호의 특정 주파수 서브대역의 스펙트럼 내용을 표시하는 시간 기반으로 한 신호에 관한 것으로 이해될 수 있고, 용어 "서브대역-신호 성분"은 일반적으로 시간 기반으로 한 서브대역 신호의 샘플에 관한 것으로 이해될 수 있다.
양자화기(14, 15, 16) 및 엔코더(17)가 이하에 보다 상세하게 설명된다.
양자화기 제어기(13)는 근본적으로 바람직할 수 있는 어떤 유형의 공정을 수행할 수 있다. 한 가지 예는 사이코아쿠스틱 모델을 오디오 정보에 적용하여 오디오 신호 내의 상이한 스펙트럼 성분의 사이코아쿠스틱 마스킹 작용을 추정하는 공정이다. 많은 변형이 가능하다. 예를 들어, 양자화기 제어기(13)는 분석 필터뱅크의 입력에서 이용가능한 오디오 정보 대신에 또는 이 정보 이외에도 분석 필터뱅크(12)의 출력에서 이용가능한 주파수 서브대역 정보에 응답하여 양자화 제어 정보를 발생시킬 수 있다. 또 다른 예로서, 양자화기 제어기(13)는 제거될 수 있고 양자화기(14, 15, 16)는 적응되지 않는 양자화 함수를 사용한다. 본 발명은 특정 공정을 필요로 하지 않는다.
포맷화기(18)는 양자화되고 엔코딩된 신호 성분을 전송 또는 저장을 위하여 경로(19)를 따라서 통과하는데 적합한 형태로 어셈블한다. 포맷화된 신호는 원하는 대로 동기화 패턴, 에러 검출/정정 정보, 및 제어 정보를 포함할 수 있다.
2. 양자화기
a) 압축 양자화기
많은 전형적인 오디오 코딩 시스템 내의 양자화기(14, 15, 16)는 압축이 양자화 효율성을 개선시키기 때문에 압축 양자화로 된다. 효율성이 개선되는 이유는 다음 절에서 설명된다.
도3의 라인(31)은 가정 서브대역 신호(hypothetical subband signal)의 성분값을 표시한다. 직선 세그먼트는 간결하게 도시하기 위하여 인접값을 접속시킨다. 단지 정의(+) 값이 이 도면 뿐만 아니라 다른 도면에도 도시되어 있다. 그러나, 본원에 서술된 원리는 정 및 부의 성분값를 갖는 구현방식에 적용된다. 성분값은 서브대역 신호에서 가장 큰 성분값에 대해서 정규화되거나 스케일링된다. 8개의 양자화 레벨은 0에서 1까지 정규화된 값의 범위에 걸쳐 있다.
도4A는 도7에 도시된 함수와 같은 균일한 양자화 함수를 사용하여 라인(31)에서 서브대역-신호 성분에 대한 8개의 양자화 레벨을 도시한 그래프인데, 이 균일한 양자화 함수는 신호 성분값을 가장근사한 양자화 레벨로 라운드시킨다. 정의 양자화 레벨은 3비트 2진수로 표시될 수 있다. "4" 레벨 보다 아래의 레벨로 양자화되는 성분값은 이들 양자화 레벨이 단지 2비트로 표시될 수 있기 때문에 비효율적으로 양자화된다. 실제로, "4" 레벨 보다 아래로 양자화되는 각 신호 성분에 대해선 1 비트가 낭비된다.
도4B는 도5에 도시된 압축 양자화 함수를 사용하여 라인(31)에서 서브대역-신호 성분의 8개의 양자화 레벨를 도시한 그래프인데, 이 압축 양자화 함수는 신호 성분값을 가장근사한 양자화 레벨로 라운드시킨다. 압축 양자화기는 보다 적은 신호 성분이 "4" 레벨 보다 아래로 양자화되기 때문에 균일한 양자화기 보다 높은 양자화 효율성을 갖는다. 압축 양자화기는 도5에 도시된 함수와 같은 불균일한 함수로 수행될 수 있거나, 도7에 도시된 균일한 양자화기 보다 앞서 도6에 도시된 함수와 같은 압축 함수로 수행될 수 있다. 도3의 라인(32)은 도6에 도시된 함수로 압축한 후 라인(31)의 신호값을 표시한다.
압축 양자화기의 양자화 정확도는 모든 입력 값에 대해서 불균일하게 된다. 작은 크기의 값의 구간 동안의 양자화 정확도는 보다 큰 크기의 값의 인접 구간 동안의 양자화 정확도 보다 높게된다.
압축은 이 값들의 동적 범위를 감소시킴으로써 서브대역-신호 샘플의 통계적인 분포를 변경시킨다. 정규화 또는 스케일링과 결합되는 압축은 이들 값을 보다 많은 비트를 효율적으로 사용하는 보다 높은 양자화 레벨로 푸시함으로써 많은 보다 작은 값의 정확도를 증가시킨다. 확장 및 역 스케일링 공정이 수신기에서 사용되어 스케일링 및 압축에 의해 발생되는 작용을 반전시킨다.
도6에 도시된 압축 함수는 다음 형태의 파워-로 함수(power-law function)이다.
y=c(x)=xn (1a)
여기서 c(x)=x의 압축 함수
y=압축된 값
n=1보다 작은 정의 실수값
상보적인 확장 함수가 도8에 도시되고 다음 형태로 된다.
x=e(y)=y1/n (1b)
여기서 e(y)=y의 확장 함수.
압축 및 확장 함수의 또 다른 예는 다음 형태의 함수이다.
y=c(x)=logb(x) (2a)
x=e(y)=by (2b)
많은 형태의 압축 및 확장 함수가 전형적인 코딩 시스템에 사용되고, 본 발명의 양상을 포함하는 코딩 시스템은 근본적으로 어떠한 형태의 압축 및 확장 함수가 사용될 수 있다.
b) 매우 낮은 비트율 시스템
공중 컴퓨터 네트워크상의 스트리밍 오디오와 같은 어떤 응용은 양자화 잡음을 마스킹할 정도로 충분한 정확도로 모든 주요한 신호 성분을 양자화하지 못하는 낮은 비트율로 엔코딩된 디지털 오디오 스트림을 필요로 한다.
입력 신호의 대역폭의 일부만을 표시하는 기저대역 신호를 엔코딩하여 전송하고 재생동안 대역폭의 상실 부분을 재생하도록 하는 기술을 사용함으로써 양호한 음 오디오를 제공하도록 하는 매우 낮은 비트율(VLBR) 코딩 시스템을 제공하기 위한 많은 시도가 있었다. 전형적으로, 고주파수 성분은 기저대역 신호로부터 배제되고 재생동안 재생된다. 이 기술은 고주파수 성분을 엔코딩하는데 사용될 수 있는 비트를 취하고 이들 비트를 사용하여 보다 낮은 주파수 성분의 양자화 정확도를 증가시킨다.
기저대역/재생 기술은 만족할만한 결과를 제공하지 않았다. 이 유형의 VLBR 코딩 시스템의 품질을 개선시키고자 하는 많은 노력이 시도되어 재생 기술을 개선시켰다. 그러나, 본 발명가는 공지된 스펙트럼 재생 기술이 매우 양호하게 작동되지 않는다라고 결정하였는데, 그 이유는 비트가 2가지 이상의 이유로 인해 스펙트럼 성분에 최적으로 할당되지 않기 때문이다.
첫 번째 이유는, 기저대역 신호가 지나치게 협소하다는 것이다. 이는 중요한 큰-크기의 성분을 포함하여 기저대역 외부의 모든 신호 성분으로부터 비트를 제거하는 작용을 하여, 중요하지 않은 작은-크기의 성분을 포함하여 기저대역 내에서 신호 성분을 엔코딩한다. 본 발명은 기저대역 신호가 약 5kHz 이상의 대역폭을 갖는다라고 결정하였다. 불행하게도, 많은 VLBR 용도에서, 비트율 제한이 너무 엄격하여, 단지 약 1 비트만이 5kHz 대역폭을 지닌 신호의 각 스펙트럼 성분을 위하여 전송될 수 있도록 한다. 스펙트럼 계수당 1비트가 고 품질의 출력 신호를 재생하는데 충분하지 않기 때문에, 공지된 코딩 시스템은 기저대역 신호의 대역폭을 5kHz 보다 상당히 아래로 감소시켜, 보다 협소한 기저대역 신호내의 나머지 신호 성분이 보다 높은 정확도록 양자화될 수 있도록 한다.
두 번째 이유는 너무 많은 비트가 작은 크기를 갖는 기저대역 신호내의 신호 성분에 할당된다는 것이다. 이는 중요한 큰-크기의 성분으로부터 비트를 제거하도록 작용하여 중요하지 않은 낮은-크기의 성분을 더욱 정확하게 엔코딩한다. 이 문제는 스케일링 및 압축 양자화기를 사용하는 코딩 시스템에 의해 더욱 악화되는데, 그 이유는 상술된 바와 같이 스케일링 및 압축이 작은 성분값을 보다 큰 양자화 레벨로 푸시하기 때문이다.
이들 이유들 각각에 의해 야기된 문제는 덜 중요한 작은값의 신호 성분을 보다 적은 수의 양자화 레벨로 양자화되는 값들의 범위로 푸시함으로써 경감될 수 있다. 이 공정은 작은 값의 성분의 양자화 정밀도를 감소시키지만, 이 공정은 또한 푸싱함이 없이 엔트로피 보다 작은 레벨로 양자화한 후 작은 값의 신호 성분의 엔트로피를 감소시킨다. 덜-중요한 작은 값의 신호 성분을 보다 적은 양자화 레벨로 푸싱함이 없이 가능한 것보다 적은 비트로 이들 덜-중요한 작은 값의 신호 성분을 표시하는 코드로 모든 신호 성분은 엔트로피 코딩되고, 나머지 비트는 다른 신호 성분을 보다 정확하게 양자화하도록 사용된다. 보다 적은 양자화 레벨로 푸시되는 신호 성분의 수는 확장 양자화기를 사용함으로써 제어될 수 있다.
c) 확장 양자화기
도4C는 도9에 도시된 확장 양자화 함수를 사용하여 라인(31)에서 서브대역-신호 성분에 대한 8개의 레벨 양자화를 도시한 그래프인데, 이 확장 양자화 함수는 신호 성분값을 가장근사한 양자화 레벨로 라운드한다. 확장 양자화기는 보다 많은 신호 성분이 "4" 레벨 보다 아래로 양자화되기 때문에 균일한 양자화기 보다 낮은 양자화 효율성을 갖는다. 확장 양자화기는 도9에 도시된 바와 같이 불균일한 양자화 함수로 수행될수 있으며, 또는 이 양자화기는 도7에 도시된 균일한 양자화기 보다 앞서 도8에 도시된 함수와 같은 확장 함수로 수행될 수 있다. 도3의 라인(33)은 도8에 도시된 함수로 확장된 후 라인(31)의 신호 값을 표시한다.
확장 양자화기의 양자화 정확도는 모든 입력 값에 대해 균일하지 않다. 작은-크기의 값의 구간동안 양자화 정확도는 보다 큰-크기의 값의 인접 구간 동안 양자화 정확도 보다 낮다.
압축 및 역 스케일링 공정이 수신기에 사용되어, 스케일링 및 확장에 의해 발생된 작용을 반전시킨다.
확장은 동적 범위의 값을 증가시킴으로써 서브대역 신호 샘플의 통계적 분포를 변경시킨다. 정규화 또는 스케일링과 결합된 확장은 많은 보다 작은 값들을 보다 낮은 양자화 레벨로 푸시함으로써 상기 많은 보다 작은 값들의 정확도를 감소시킨다. 보다 많은 수의 보다 작은-값의 신호 성분은 예를 들어, "0" 양자화 레벨로 푸시된다. "제로로 양자화된"(QTZ) 신호 성분을 포함하는 저 양자화 레벨로 양자화되는 신호 성분의 수를 증가시키고 이들 보다 작고 QTZ 성분을 효율적으로 표시하는 코드를 사용함으로써, 보다-큰 값의 신호 성분을 보다 정확하게 양자화하도록 보다 많은 비트가 이용될 수 있다.
실제로, 확장 및 양자화는 보다 정확한 엔코딩을 위한 보다 넓은 대역폭을 가로지르는 중요한 신호 성분을 식별하는데 사용된다. 이는 비트 할당을 최적화하여, 보다 높은 품질 신호가 VLBR 엔코딩된 신호로부터 재생될 수 있도록 한다.
양자화기는 양자화될 값의 전체 범위의 부분에 대해서만 확장을 제공할 수 있다. 확장은 보다 작은 값에 대해선 중요하다. 원하는 경우, 양자화기는 또한 보다 큰 값을 갖는 신호 성분과 같은 어떤 신호 성분에 대해 압축을 제공할 수 있다. 도10은 함수(41)를 따른 확장 및 팽창을 제공하는 양자화 함수(42)를 도시한다. 확장은 최소 크기를 갖는 값을 위하여 제공되고, 압축은 최대 크기를 갖는 값을 위하여 제공된다. 확장 또는 압축 어느 것도 중간 크기의 값을 위해선 제공되지 않는다.
어쨋든, 확장 및 압축 량은 신호 특성, 양자화된 신호 성분을 엔코딩하는데 이용될 수 있는 비트 수 및 우세한 큰-크기의 성분에 대한 근접성(proximity)을 포함하는 각종 조건중 어떤 조건 또는 모든 조건에 응답하여 적응될 수 있다. 예를 들어, 상대적으로 평활한 스펙트럼을 갖는 잡음형 서브대역 신호에 대해 보다 큰 확장이 일반적으로 필요로 된다. 상대적으로 많은 수의 비트가 엔코딩하는데 이용가능한 경우 보다 적은 확장이 필요로 된다. 우세한 큰-크기의 신호 성분 근처에 있는 신호 성분에 대해선 보다 적은 확장이 사용되어야 한다. 확장 및 압축이 적응되는 방법에 대한 표시가 어떤 방식으로 수신기에 제공되어, 수신기가 상보적인 처리에 적응할 수 있도록 한다.
양자화기(14, 15, 16) 각각은 동일하거나 상이한 확장 함수 및 양자화 함수를 적용할 수 있다. 게다가, 특정 서브대역 신호를 위한 양자화기는 다른 서브대역 신호에 대해서 양자화기에서 행해진 것과 관계없이 또는 최소한 상이하게 되도록 하는 방식으로 적응되거나 가변될 수 있다. 게다가, 모든 서브대역 신호에 대해 확장이 제공될 필요는 없다.
3. 엔코더
엔코더(17)는 엔트로피 코딩을 양자화된 신호 성분에 적용하여, 정보 용량 요구조건을 감소시킨다. 허프만 코딩이 많은 공지된 코딩 시스템에 사용되지만, 이 허프만 코딩은 적어도 2가지 이유로 많은 VLBR 시스템에 사용하는데 적합하지 않다.
첫 번째 이유는 허프만 코드가 정수의 비트로 이루어지고 최단 코드가 1비트 길이라는 사실로부터 야기된다. 허프만 코딩은 최고 발생 확률을 갖는 양자화된 심볼을 위한 최단 코드를 사용한다. 본 발명이 서브대역 신호에서 QTZ 신호 성분의 수를 증가시키는 경향이 있기 때문에 엔코딩될 가장 가능한 양자화된 값이 제로로추정되는 것이 합당하다. QTZ 성분이 1 비트 길이보다 작은 코드로 표시될 수 있다면, 본 발명은 VLBR에서 신호 품질을 상당히 개선시킬 수 있다.
보다 짧은 유효 코드 길이는 다차원 코드북을 지닌 허프만 코딩을 사용함으로써 얻어질 수 있다. 이는 허프만 코딩이 1 비트 코드를 사용하여 다수의 양자화된 값을 표시하게 한다. 예를 들어, 2차원 코드북은 1 비트 코드가 2개의 값을 표시하도록 한다. 불행하게도, 다차원 코딩은 대부분의 서브대역 신호에 대해선 매우 효율적이지 못하고 코드북을 저장하는데 상당한 메모리 량이 필요로 된다. 허프만 코딩은 단일 및 다차원 코드북간을 적응적으로 스위치시킬 수 있지만, 어느 코드북이 신호의 부분을 코딩하는데 사용되는지를 식별하기 위하여 엔코딩된 신호에 제어 비트가 필요로 된다. 이들 제어 비트는 다차원 코드북을 사용함으로써 성취되는 이득을 상쇄시킨다.
허프만 코딩이 많은 VLBR 코딩 시스템에 적합하지 않는 두 번째 이유는 코딩 효율이 코딩될 신호의 통계에 매우 민감하다는 것이다. 실제 코딩되는 신호값과 매우 상이한 통계를 갖는 값을 코딩하도록 설계된 코드북이 사용되면, 허프만 코딩은 엔코딩된 신호의 정보 용량 요구조건을 증가시킴으로써 패널티(penalty)를 부여할 수 있다. 이 문제는 코드북 세트로부터 최적의 코드북을 선택함으로써 경감될 수 있지만, 사용되는 코드북을 식별하는데 제어 비트가 필요로 된다. 이들 제어 비트는 다수의 코드북을 사용함으로써 성취되는 이득을 상쇄시킨다.
런-렝스 코드(run-length code)와 같은 각종 코딩 기술이 단독으로 또는 다른 형태의 코딩과 결합하여 사용될 수 있다. 그러나, 바람직한 실시예에서, 연산 코딩이 실제 신호 통계에 자동적으로 적응되고 종종 허프만 코딩에서 가능한 것 보다 짧은 코드를 발생시킬 수 있기 때문에, 이 연산 코딩이 사용된다.
연산 코딩 공정은 절반 닫혀진 구간[0,1) 내에서 실수를 계산하여 하나 이상의 심볼의 "메시지"를 표시한다. 이 문맥에서, 심볼은 신호 성분의 양자화된 값이고 메시지는 다수의 신호 성분을 위한 양자화 레벨의 세트이다. "알파벳"은 메시지에서 발생될 수 있는 모든 가능한 심볼 세트 또는 양자화된 값의 세트이다. 실수로 표시될 수 있는 메시지 내의 심볼 수는 코더로 표현될 수 있는 실수의 정확도로 제한된다. 실수 코드로 표시되는 심볼수는 어떤 방식으로 디코더에 제공된다.
M이 알파벳 내의 심볼수를 표시하면, 하나의 연산 코딩 공정의 단계는 다음과 같이 된다.
1. 구간 [0,1)을 M개의 세그먼트로 분할하라. 여기서 각 세그먼트는 알파벳 내의 특정 심볼에 대응한다. 각 심볼을 위한 세그먼트는 이 심볼에 대한 발생 확률에 비례하는 길이를 갖는다.
2. 메시지로부터 제1 심볼을 얻어 이에 상응하는 세그먼트를 선택하라.
3. 단계(1)에서 행해진 방식과 유사한 방식으로 선택된 세그먼트를 M개의 세그먼트로 분할하라. 각 세그먼트는 알파벳 내의 각 심볼에 대응하고 이 심볼에 대한 발생 확률에 비례하는 길이를 갖는다.
4. 메시지로부터 다음 심볼을 얻어 이에 상응하는 심볼을 선택하라.
5. 전체 메시지가 엔코딩되거나 정밀도 한계에 도달될 때까지 단계(3) 및 (4)를 계속하라.
6. 최종 선택된 세그먼트 내에서 임의 수를 표시하는 가능한 최단 2진 프랙션(shortest possible binary fraction)을 발생시켜라.
도11은 4개의 양자화 레벨(0, 1, 2 및 3)을 표시하는 4개의 심볼의 알파벳 내에서 4개의 심볼 "1300"의 메시에 적용되는 바와 같은 공정을 도시한 것이다. 이들 심볼 각각이 발생될 확률은 0.55, 0.20, 0.15 및 0.10이다.
도면의 촤측상의 제1 박스는 절반 닫혀진 구간[0, 1)을 대응하는 심볼에 대한 발생 확률에 비례하는 길이를 갖는 알파벳의 각 심볼을 위한 4개의 세그먼트로 분할하는 단계(1)를 표시한다.
단계(2)에서, "1" 양자화 레벨을 표시하는 제1 심볼은 서브대역-신호 메시지로부터 얻어지고 이에 상응하는 절반 닫혀진 세그먼트 [0.55, 0.75)가 선택된다.
제1 박스의 바로 우측의 제2 박스는 선택된 세그먼트를 알파벳 내의 각 심볼을 위한 4개의 세그먼트로 분할하는 단계(3)를 표시한다.
단계(4)에서, "3" 양자화 레벨을 표시하는 제2 심볼은 메시지로부터 얻어지고 이에 상응하는 절반 닫혀진 세그먼트 [0.73, 0.75)가 선택된다.
단계(5)는 단계(3) 및 (4)를 재반복한다. 제2 박스 바로 우측의 제3 박스는 이전에 선택된 세그먼트를 알파벳 내의 각 심볼을 위한 4개의 세그먼트로 분할하는 단계(3)의 재반복을 표시한다.
단계(4)의 재반복시에, "0" 양자화 레벨을 표시하는 제3 심볼은 메시지로부터 얻어지고 이에 상응하는 절반-닫혀진 세그먼트 [0.730,0.741)가 선택된다.
단계(5)는 단계(3) 및 (4)를 다시 재반복한다. 이 도면의 우측상의 제4 박스는 이전 선택된 세그먼트를 알파벳 내의 각 심볼을 위한 4개의 세그먼트로 분할하는 단계(3)의 재반복을 표시한다.
단계(4)의 재반복에서, "0" 양자화 레벨을 표시하는 제4 및 최종 심볼은 메시지로부터 얻어지고 이에 상응하는 절반 닫혀진 세그먼트 [0.73000,0.73605)가 선택된다.
메시지의 끝에 도달하면, 단계(6)는 최종 선택된 세그먼트 내에서 어떤 수를 표시하는 가능한 최단 2진 프랙션을 발생시킨다. 6비트 2진 프랙션 0.1011112=0.73437510가 발생된다.
상술된 코딩 공정은 심볼 알파벳을 위한 확률 분포를 필요로 하고, 이 분포는 어떤 방식으로 디코더에 제공되어야만 한다. 확률 분포가 변경되면, 코딩 공정은 차선(suboptimal)으로 된다. 엔코더(17)는 코딩을 위하여 수신된 실제 심볼 확률로부터 새로운 분포를 계산할 수 있다. 이 계산은 각 심볼이 메시지로부터 얻어질 때 계속적으로 행해지거나 덜 빈번하게 계산될 수 있다. 디코더(23)는 동일한 계산을 수행할 수 있고 엔코더(17)와 동기화 되는 분포를 유지한다. 코딩 공정은 임의의 바람직한 확률 분포로 시작될 수 있다.
연산 코딩에 관한 부가적인 정보는 Bell, Cleary and Witten가 발표한 "Text Compression, " Prentice Hall, Englewood Cliffs, NJ, 1990, pp. 109-120과 Saywood가 발표한 "Introduction to Data Compression," Morgan Kaufmann Publishers, Inc., San Francisco, 1996, pp. 61-96으로부터 얻어질 수 있다.
B. 수신기
도2는 본 발명의 각종 양상을 포함할 수 있는 오디오 디코딩 수신기의 한 가지 구현방식을 도시한 것이다. 이 구현방식에서, 역포맷화기(22)는 경로(21)로부터 오디오 신호의 주파수 서브대역을 표시하는 양자화된 디지털 정보의 엔코딩된 표현을 전달하는 입력 신호를 수신한다. 역포맷화기(22)는 입력 신호로부터 엔코딩된 표현을 얻고 이를 디코더(23)로 통과시킨다. 디코더(23)는 엔코딩된 표현을 양자화된 정보의 주파수 서브대역으로 디코딩한다. 각 주파수 서브대역 내의 양자화된 디지털 정보는 각 역양자화기(25, 26, 27)에 의해 역양자화되어 합성 필터뱅크(28)로 통과되는데, 이 필터뱅크는 경로(29)를 따라서 오디오 신호를 표시하는 오디오 정보를 발생시킨다. 역양자화기(25, 26, 27) 내의 역양자화 함수는 역양자화기 제어기(24)로부터 수신된 역양자화 제어 정보에 응답하여 적응되는데, 이 제어기는 입력 신호로부터 역포맷화기(22)에 의해 얻어진 제어 정보에 응답하여 역양자화 제어 정보를 발생시킨다.
디코더(23)는 엔코더(17)에 의해 적용되는 공정과 상보적인 공정을 적용한다. 바람직한 구현방식에서, 연산 디코딩이 사용된다.
역양자화기(25, 26, 27)는 양자화기(14, 15, 16)에 제공되는 확장에 상보적인 압축을 제공한다. 압축 역양자화기는 불균일한 역양자화 함수로 수행될 수 있거나, 압축 기능보다 앞서 균일한 역양자화 함수로 수행될 수 있다. 불균일 및 균일한 역양자화는 룩업 테이블로 수행될 수 있다. 균일한 역양자화는 단지 적절한 수의 비트를 양자화된 값에 부가하는 공정에 의해 수행될 수 있다. 이 부가된 비트는 모두 제로 값을 가질수 있으며, 또는 디더 신호(dither signal) 또는 의사 랜덤 잡음 신호로부터의 샘블과 같이 일부 다른 값을 가질 수 있다.
양자화기(14, 15, 16)가 전체 범위의 값에 걸쳐서 확장을 제공하지 않으면, 압축은 전체 범위의 값에 걸쳐서 제공되지 않아야 한다.
역양자화 제어기(24)는 근본적으로 바람직한 임의 유형의 공정을 수행할 수 있다. 한 가지 예는 사이코아쿠스틱 모델을 입력 신호로부터 얻어진 정보에 적용하여 오디오 신호내의 서로 다른 스펙트럼 성분에 대한 사이코아쿠스틱 마스킹 작용을 추정하는 공정이다. 또 다른 예로서, 역양자화 제어기(24)는 제거되고 역양자화기(25, 26, 27)는 적응되지 않는 역양자화 함수를 사용하거나 역포맷화기(22)에 의해 입력 신호로부터 직접 얻어진 역양자화 제어 정보에 응답하여 적응되는 역양자화 함수를 사용할 수 있다. 본 발명은 특정 공정을 필요로 하지 않는다.
도2에 도시된 수신기는 3개의 주파수 서브대역을 위한 성분을 도시한 것이다. 보다 많은 서브대역이 통상적으로 적용되지만, 간결하게 도시하기 위하여 단지 3개만이 도시되어 있다. 특정 수가 원칙적으로 본 발명에 중요하지 않다.
합성 필터뱅크(28)는 근본적으로 분석 필터뱅크(12)를 위한 상술된 기술과 반대로 되는 방식을 포함하여 바람직한 어떤 방식으로 수행될 수 있다. 블록 변환에 의해 수행되는 합성 필터뱅크는 변환 계수의 세트로부터의 출력 신호를 합성한다. 블록 변환이 아니라 다상 필터와 같은 어떤 유형의 디지털 필터로 수행되는 합성 필터뱅크는 서브대역 신호의 세트로부터 출력 신호를 합성한다. 각 서브대역 신호는 특정 주파수 서브대역 내의 입력 신호의 스펙트럼 내용의 시간-기반으로 한 표현이다.
C. 구현 방식
본 발명의 각종 양상은 범용 컴퓨터 시스템, 또는 범용 컴퓨터 시스템에서 발견되는 요소들과 유사한 요소들에 결합되는 디지털 신호 처리기(DSP) 회로와 같은 더욱 특수한 요소들을 포함하는 다른 어떤 장치에서 소프트웨어를 포함하는 각종 방식으로 구현될 수 있다. 도12는 오디오 엔코딩 송신기 또는 오디오 디코딩 수신기에서 본 발명의 각종 양상을 구현하는데 사용될 수 있다. DSP(72)는 계산 자원을 제공한다. RAM(73)은 신호 처리를 위하여 DSP(72)에 의해 사용되는 시스템 랜덤 액세스 메모리(RAM)이다. ROM(74)은 장치(70)를 동작시키는데 필요로 되는 프로그램을 저장하는 판독 전용 메모리(ROM)와 같은 어떤 영구 저장장치의 형태를 표시한다. 아날로그-대-디지털 변환기 및 디지털-대-아날로그 변환기는 원하는 경우 I/O 제어장치(75)에 포함되어 아날로그 오디오 신호를 수신 및/또는 송신할 수 있다. 도시된 실시예에서, 모든 주요 시스템 요소는 버스(71)에 접속되며, 이는 하나 이상의 물리적 버스를 표시할 수 있다. 그러나, 버스 아키텍쳐는 본 발명을 구현하는데 필요로 되지 않는다.
범용 컴퓨터 시스템으로 수행되는 실시예에서, 부가적인 요소는 키보드 또는 마우스 및 디스플레이와 같은 장치에 인터페이스하고 자기 테이프 또는 디스크와 같은 저장 매체 또는 광학 매체를 제어하기 위하여 포함될 수 있다. 이 저장 매체는 운영 시스템을 위한 명령, 유틸리티 및 응용의 프로그램을 기록하는데 사용될 수 있고 본 발명의 각종 양상을 구현하는 프로그램의 실시예를 포함할 수 있다.
본 발명을 실시하는데 필요로 되는 기능은 또한 이산 논리 요소들, 하나 이상의 ASICs 및/또는 프로그램 제어된 프로세서들을 포함하는 각종 방식으로 구현되는 특수용 요소들로 수행될 수 있다. 이들 요소를 구현하는 방식은 본 발명에 중요하지 않다.
본 발명의 소프트웨어 구현방식은 초음파로부터 자외선 주파수까지 포함하는 스펙트럼 전체에 걸쳐 기저대역 또는 변조된 통신 경로와 같은 각종 기계 판독가능한 매체 또는 자기 테이프, 자기 디스크 및 광 디스크를 포함하는 근본적으로 어떤 자기 또는 광학 기록 기술을 사용하여 정보를 전달하는 것을 포함하는 저장 매체로 전달될 수 있다. 각종 형태의 ROM 또는 RAM에서 구현되는 프로그램 또는 다른 기술에 의해 제어되는 ASIC, 범용 집적 회로, 마이크로프로세서와 같은 처리 회로에 의해 각종 컴퓨터 시스템(70)의 요소로 각종 양상이 또한 구현될 수 있다.

Claims (60)

  1. 오디오 신호를 표시하는 입력 신호를 수신하고 상기 오디오 신호의 엔코딩된 표현을 전달하는 출력 신호를 발생시키는 오디오 엔코딩 송신기로서, 상기 오디오 엔코딩 송신기는:
    상기 오디오 신호의 주파수 서브대역을 표시하는 다수의 서브대역 신호를 발생시키는 분석 필터뱅크로서, 각 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하는, 분석 필터뱅크;
    제1 구간의 값 내의 서브대역-신호 성분값에 대해 제1 양자화 정확도를 사용하고 제2 구간의 값 내의 서브대역-신호 성분값에 대해 제2 양자화 정확도를 사용하여 상기 하나 이상의 서브대역 신호의 서브대역-신호 성분을 양자화함으로써 하나 이상의 양자화된 서브대역 신호를 발생시키는 상기 분석 필터뱅크에 결합되는 양자화기로서, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고 상기 제1 구간내의 값은 상기 제2 구간내의 값 보다 작은, 양자화기;
    상기 양자화된 서브대역 신호의 정보 용량 요구조건을 감소시키는 무손실 엔코딩 공정을 사용하여 상기 하나 이상의 양자화된 서브대역 신호를 엔코딩함으로써 하나 이상의 엔코딩된 서브대역 신호를 발생시키는 상기 양자화기에 결합되는 엔코더; 및,
    상기 하나 이상의 엔코딩된 서브대역 신호를 상기 출력 신호내로 어셈블하는 상기 엔코더에 결합되는 포맷화기를 포함하는 오디오 엔코딩 송신기.
  2. 제1항에 있어서, 상기 분석 필터뱅크는 하나 이상의 변환으로 수행되고 상기 서브대역-신호 성분은 변환 계수인 오디오 엔코딩 송신기.
  3. 제1항 또는 제2항에 있어서, 상기 양자화기는:
    상기 분석 필터뱅크에 결합되는 입력 및 출력을 갖는 확장기; 및,
    상기 확장기의 출력에 결합되는 입력 및 상기 엔코더에 결합되는 출력을 갖는 균일한 양자화기를 포함하는 오디오 엔코딩 송신기.
  4. 제1항 내지 제3항중 어느 한 항에 있어서, 상기 양자화기는 불균일한 양자화기인 오디오 엔코딩 송신기.
  5. 제1항 내지 제4항중 어느 한 항에 있어서, 상기 양자화기는 제3 구간의 값 내의 서브대역-신호 성분에 대해 제3 양자화 정확도를 사용하는데, 상기 제3 양자화 정확도는 상기 제2 양자화 분해능(quantizing resolution)보다 낮고 상기 제2 구간 내의 값은 상기 제3 구간 내의 값보다 작은 오디오 엔코딩 송신기.
  6. 제1항 내지 제5항중 어느 한 항에 있어서, 상기 엔코더는 가변 길이 코드를 발생시키고 상기 엔코딩 공정은 엔코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 오디오 엔코딩 송신기.
  7. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 엔코딩 공정은 연산 엔코딩인 오디오 엔코딩 송신기.
  8. 제1항 내지 제7항중 어느 한 항에 있어서, 상기 서브대역-신호 성분 값의 특성에 응답하여 상기 제2 양자화 정확도에 대해 상기 제1 양자화 정확도를 적응시키는 오디오 엔코딩 송신기.
  9. 오디오 신호의 엔코딩된 표현을 전달하는 입력 신호를 수신하고 상기 오디오 신호를 표시하는 출력 신호를 발생시키는 오디오 디코딩 수신기로서, 상기 오디오 디코딩 수신기는:
    상기 입력 신호로부터 하나 이상의 엔코딩된 서브대역 신호를 얻는 역포맷화기;
    상기 엔코딩된 서브대역 신호의 정보 용량 요구조건을 증가시키는 무손실 디코딩 공정을 사용하여 상기 하나 이상의 엔코딩된 서브대역 신호를 디코딩함으로써 하나 이상의 디코딩된 서브대역 신호를 발생시키는 상기 역포맷화기에 결합되는 디코더로서, 각 디코딩된 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하고 상기 오디오 신호의 각 주파수 서브대역을 표시하는, 디코더;
    상기 하나 이상의 디코딩된 서브대역 신호의 서브대역-신호 성분을 역양자화함으로써 하나 이상의 역양자화된 서브대역 신호를 발생시키는 상기 디코더에 결합되는 역양자화기로서, 상기 역양자화기는 제1 구간의 값내의 값에 대해 제1 양자화 정확도 및 제2 구간의 값내의 값에 대해 제2 양자화 정확도를 사용하는 양자화기에 상보적이며, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고, 상기 제1 구간내의 값은 상기 제2 구간내의 값 보다 작은, 역양자화기; 및,
    상기 하나 이상의 역양자화된 서브대역 신호를 포함하는 다수의 서브대역 신호에 응답하여 상기 출력 신호를 발생시키는 상기 역양자화기에 결합되는 합성 필터뱅크를 포함하는 오디오 디코딩 수신기.
  10. 제9항에 있어서, 상기 합성 필터뱅크는 하나 이상의 변환에 의해 수행되고 상기 서브대역-신호 성분은 변환 계수인 오디오 디코딩 수신기.
  11. 제9항 또는 제10항에 있어서, 상기 역양자화기는:
    상기 디코더에 결합되는 입력 및 출력을 갖는 균일한 역양자화기; 및,
    상기 균일한 역양자화기의 출력에 결합되는 입력 및 상기 합성 필터뱅크에 결합되는 출력을 갖는 압축기를 포함하는 오디오 디코딩 수신기.
  12. 제9항 내지 제11항중 어느 한 항에 있어서,
    상기 역양자화기는 불균일한 역양자화기인 오디오 디코딩 수신기.
  13. 제9항 내지 제12항중 어느 한 항에 있어서,
    상기 역양자화기는 제3 구간의 값 내의 서브대역-신호 성분에 대해 제3 양자화 정확도를 사용하는 양자화기에 대해 상보적인데, 상기 제3 양자화 정확도는 상기 제2 양자화 분해능보다 낮고 상기 제2 구간 내의 값은 상기 제3 구간 내의 값보다 작은 오디오 디코딩 수신기.
  14. 제9항 내지 제13항중 어느 한 항에 있어서,
    상기 디코더는 가변 길이 코드를 디코딩하고 상기 디코딩 공정은 디코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 오디오 디코딩 수신기.
  15. 제9항 내지 제14항중 어느 한 항에 있어서, 상기 디코딩 공정은 연산 디코딩인 오디오 디코딩 수신기.
  16. 제9항 내지 제15항중 어느 한 항에 있어서, 상기 입력 신호로부터 얻어진 제어 정보에 응답하여 상기 역양자화기를 적응시키는데, 상기 역양자화기는 상기 제2 양자화 정확도에 대해 상기 제1 양자화 정확도를 적응시키는 양자화기에 상보적이 되도록 적응되는 오디오 디코딩 수신기.
  17. 장치에 의해 판독가능하고 상기 장치에 의해 실행가능한 명령 프로그램을 전달하여 이하의 작용을 수행하는 단계를 포함하는 오디오 엔코딩 방법을 수행하는 매체로서,
    상기 오디오 신호의 주파수 서브대역을 표시하는 다수의 서브대역 신호를 발생시키기 위하여 상기 입력 신호에 분석 필터뱅크를 적용하는 단계로서, 각 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하는, 적용 단계;
    하나 이상의 양자화된 서브대역 신호를 발생시키기 위하여, 제1 구간의 값 내의 서브대역-신호 성분에 대해 제1 양자화 정확도를 사용하고 제2 구간 값 내의 서브대역-신호 성분에 대해 제2 양자화 정확도를 사용하여 상기 하나 이상의 서브대역 신호의 서브대역-신호 성분을 양자화하는 단계로서, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고 상기 제1 구간 내의 값은 상기 제2 구간 내의 값 보다 작은, 양자화 단계;
    하나 이상의 엔코딩된 서브대역 신호를 발생시키기 위하여, 상기 양자화된 서브대역 신호의 정보 용량 요구조건을 감소시키는 무손실 엔코딩 공정을 사용하여 상기 하나 이상의 양자화된 서브대역 신호를 엔코딩하는 단계; 및,
    상기 하나 이상의 엔코딩된 서브대역 신호를 상기 출력 신호내로 어셈블하는 단계를 포함하는 매체.
  18. 제17항에 있어서, 상기 분석 필터뱅크는 하나 이상의 변환으로 수행되고 상기 서브대역-신호 성분은 변환 계수인 매체.
  19. 제17항 또는 제18항에 있어서, 상기 양자화 단계는 서브대역-신호 성분을 확장하고 상기 확장된 서브대역-신호 성분을 균일한 양자화 함수로 양자화하는 단계를 포함하는 매체.
  20. 제17항 내지 제19항중 어느 한 항에 있어서, 상기 양자화 단계는 불균일한 양자화 함수를 따른 매체.
  21. 제17항 내지 제20항중 어느 한 항에 있어서, 상기 양자화 단계는 제3 구간의 값 내의 서브대역-신호 성분에 대해 제3 양자화 정확도를 사용하며, 상기 제3 양자화 정확도는 상기 제2 양자화 분해능 보다 작고 상기 제2 구간 내의 값은 상기 제3 구간 내의 값 보다 작은 매체.
  22. 제17항 내지 제21항중 어느 한 항에 있어서, 상기 엔코딩 단계는 가변 길이 코드를 발생시키고 상기 엔코딩 공정은 엔코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 매체.
  23. 제17항 내지 제22항중 어느 한 항에 있어서, 상기 엔코딩 공정은 연산 엔코딩인 매체.
  24. 제17항 내지 제23항중 어느 한 항에 있어서, 상기 방법은 상기 서브대역-신호 성분 값의 특성에 응답하여 상기 제2 양자화 정확도에 대해서 상기 제1 양자화 정확도를 적응시키는 매체.
  25. 장치에 의해 판독가능하고 상기 장치에 의해 실행가능한 명령 프로그램을 전달하여 이하의 작용을 수행하는 단계를 포함하는 오디오 디코딩 방법을 수행하는 매체로서,
    상기 입력 신호로부터 하나 이상의 엔코딩된 서브대역 신호를 얻는 단계;
    하나 이상의 디코딩된 서브대역 신호를 발생시키기 위하여, 상기 엔코딩된 서브대역 신호의 정보 용량 요구조건을 증가시키는 무손실 디코딩 공정을 사용하여 상기 하나 이상의 엔코딩된 서브대역 신호를 디코딩하는 단계로서, 각 디코딩된 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하고 상기 오디오 신호의 각 주파수 서브대역을 표시하는, 디코딩 단계;
    하나 이상의 역양자화된 서브대역 신호를 발생시키기 위하여, 상기 하나 이상의 디코딩된 서브대역 신호의 서브대역-신호 성분을 역양자화하는 단계로서, 상기 역양자화 단계는 제1 구간의 값내의 값에 대해 제1 양자화 정확도 및 제2 구간의 값내의 값에 대해 제2 양자화 정확도를 사용하는 양자화 단계에 상보적이며, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고, 상기 제1 구간내의 값은 상기 제2 구간내의 값 보다 작은, 역양자화 단계; 및,
    상기 출력 신호를 발생시키기 위하여, 합성 필터뱅크를 상기 하나 이상의 역양자화된 서브대역 신호를 포함하는 다수의 서브대역 신호에 적용하는 단계를 포함하는 매체.
  26. 제25항에 있어서, 상기 합성 필터뱅크는 하나 이상의 변환으로 수행되고 상기 서브대역-신호 성분은 변환 계수인 매체.
  27. 제25항 또는 제26항에 있어서, 상기 역양자화 단계는 불균일하게 역양자화하고 상기 서브대역-신호 성분을 압축하는 단계를 포함하는 매체.
  28. 제25항 내지 제27항중 어느 한 항에 있어서, 상기 역양자화 단계는 불균일한 역양자화 함수를 따른 매체.
  29. 제25항 내지 제28항중 어느 한 항에 있어서, 상기 역양자화 단계는 제3 구간의 값 내의 서브대역-신호 성분에 대해 제3 양자화 정확도를 사용하는 양자화 단계에 상보적이며, 상기 제3 양자화 정확도는 상기 제2 양자화 분해능 보다 작고 상기 제2 구간 내의 값은 상기 제3 구간 내의 값 보다 작은 매체.
  30. 제25항 내지 제29항중 어느 한 항에 있어서, 상기 디코딩 공정은 디코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 매체.
  31. 제25항 내지 제30항중 어느 한 항에 있어서, 상기 디코딩 공정은 연산 디코딩인 매체.
  32. 제25항 내지 제31항중 어느 한 항에 있어서, 상기 방법은 상기 입력 신호로부터 얻어진 제어 정보에 응답하여 상기 역양자화 단계를 적응시키는데, 상기 역양자화단계는 상기 제2 양자화 정확도에 대해서 상기 제1 양자화 정확도를 적응시키는 양자화 단계에 상보적으로 되도록 적응되는 매체.
  33. 오디오 신호를 표시하는 입력 신호를 수신하고 상기 오디오 신호의 엔코딩된 표현을 전달하는 출력 신호를 발생시키는 오디오 엔코딩 송신기로서, 상기 오디오 엔코딩 송신기는:
    상기 입력 신호에 응답하여 상기 오디오 신호의 주파수 서브대역을 표시하는 다수의 서브대역 신호를 발생시키는 분석 필터뱅크로서, 각 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하는, 분석 필터뱅크;
    상기 하나 이상의 서브대역 신호를 양자화하여 양자화된 서브대역 신호를 발생시키는 상기 분석 필터뱅크에 결합되는 양자화기로서, 하나 이상의 제1 서브대역-신호 성분 및 상기 하나 이상의 제1 서브대역-신호 성분 보다 크기가 작은 하나 이상의 제2 서브대역-신호 성분을 갖는 서브대역 신호에 대해서, 상기 제2 서브대역-신호 성분은 푸싱함이 없이 발생된 것 보다 적은 양자화 레벨로 양자화되는 값의 범위로 푸시됨으로써, 양자화 정확도를 감소시키고 상기 양자화된 제2 서브대역-신호 성분의 엔트로피를 감소시키는, 양자화기;
    상기 양자화된 서브대역 신호의 정보 용량 요구조건을 감소시키는 엔트로피 엔코딩 공정을 사용하여 상기 하나 이상의 양자화된 서브대역 신호를 엔코딩함으로써 하나 이상의 엔코딩된 서브대역 신호를 발생시키는 상기 양자화기에 결합되는 엔코더; 및,
    상기 하나 이상의 엔코딩된 서브대역 신호를 상기 출력 신호내로 어셈블하는 상기 엔코더에 결합되는 포맷화기를 포함하는 오디오 엔코딩 송신기.
  34. 제33항에 있어서, 상기 분석 필터뱅크는 하나 이상의 변환으로 수행되고 상기 서브대역-신호 성분은 변환 계수인 오디오 엔코딩 송신기.
  35. 제33항 또는 제34항에 있어서, 상기 양자화기는:
    상기 분석 필터뱅크에 결합되는 입력 및 출력을 갖는 확장기; 및,
    상기 확장기의 출력에 결합되는 입력 및 상기 엔코더에 결합되는 출력을 갖는 균일한 양자화기를 포함하는 오디오 엔코딩 송신기.
  36. 제33항 내지 제35항중 어느 한 항에 있어서, 상기 양자화기는 불균일한 양자화기인 오디오 엔코딩 송신기.
  37. 제33항 내지 제36항중 어느 한 항에 있어서, 상기 엔코딩 공정은 엔코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 오디오 엔코딩 송신기.
  38. 제33항 내지 제37항중 어느 한 항에 있어서, 상기 엔코딩 공정은 연산 코딩인 오디오 엔코딩 송신기.
  39. 제33항 내지 제38항중 어느 한 항에 있어서, 상기 제2 서브대역-신호 성분이 상기 서브대역-신호 성분 값의 특성에 응답하여 푸시되는 값의 범위에 적응되는 오디오 엔코딩 송신기.
  40. 오디오 신호의 엔코딩된 표현을 전달하는 입력 신호를 수신하고 상기 오디오 신호를 표시하는 출력 신호를 발생시키는 오디오 디코딩 수신기로서, 상기 오디오 디코딩 수신기는:
    상기 입력 신호로부터 하나 이상의 엔코딩된 서브대역 신호를 얻는 역포맷화기;
    상기 엔코딩된 서브대역 신호의 정보 용량 요구조건을 증가시키는 엔트로피 디코딩 공정을 사용하여 상기 하나 이상의 엔코딩된 서브대역 신호를 디코딩함으로써 하나 이상의 디코딩된 서브대역 신호를 발생시키는 상기 역포맷화기에 결합되는 디코더로서, 각 디코딩된 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하고 상기 오디오 신호의 각 주파수 서브대역을 표시하는, 디코더;
    상기 하나 이상의 디코딩된 서브대역 신호의 서브대역-신호 성분을 역양자화함으로써 하나 이상의 역양자화된 서브대역 신호를 발생시키는 상기 디코더에 결합되는 역양자화기로서, 상기 역양자화기는 하나 이상의 제1 서브대역-신호 성분 및 상기 하나 이상의 제1 서브대역-신호 성분 보다 크기가 작은 하나 이상의 제2 서브대역-신호 성분을 갖는 서브대역 신호에 대해서, 푸싱함이 없이 발생된 것 보다 적은 양자화 레벨로 양자화되도록 하는 값의 범위로 상기 제2 서브대역-신호 성분을 푸시함으로써, 양자화 정확도를 감소시키고 상기 양자화된 제2 서브대역-신호 성분의 엔트로피를 감소시키는, 역양자화기;및,
    상기 하나 이상의 역양자화된 서브대역 신호를 포함하는 다수의 서브대역 신호에 응답하여 상기 출력 신호를 발생시키는 합성 필터뱅크를 포함하는 오디오 디코딩 수신기.
  41. 제40항에 있어서, 상기 합성 필터뱅크는 하나 이상의 변환에 의해 수행되고 상기 서브대역-신호 성분은 변환 계수인 오디오 디코딩 수신기.
  42. 제40항 또는 제41항에 있어서, 상기 역양자화기는:
    상기 디코더에 결합되는 입력 및 출력을 갖는 균일한 역양자화기; 및,
    상기 균일한 역양자화기의 출력에 결합되는 입력 및 상기 합성 필터뱅크에 결합되는 출력을 갖는 압축기를 포함하는 오디오 디코딩 수신기.
  43. 제40항 내지 제42항중 어느 한 항에 있어서,
    상기 역양자화기는 불균일한 역양자화기인 오디오 디코딩 수신기.
  44. 제40항 내지 제43항중 어느 한 항에 있어서,
    상기 디코딩 공정은 디코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 오디오 디코딩 수신기.
  45. 제40항 내지 제44항중 어느 한 항에 있어서,
    상기 디코딩 공정은 연산 코딩인 오디오 디코딩 수신기.
  46. 제40항 내지 제45항중 어느 한 항에 있어서, 상기 입력 신호로부터 얻어진 제어 정보에 응답하여 상기 역양자화기를 적응시키는데, 상기 역양자화기는 상기 제2 서브대역-신호 성분이 상기 서브대역-신호 성분값의 특성에 응답하여 푸시되는 값의 범위를 적응시키는 양자화기에 상보적이되도록 적응되는 오디오 디코딩 수신기.
  47. 장치에 의해 판독가능하고 상기 장치에 의해 실행가능한 명령 프로그램을 전달하여 이하의 작용을 수행하는 단계를 포함하는 오디오 엔코딩 방법을 수행하는 매체로서,
    상기 오디오 신호의 주파수 서브대역을 표시하는 다수의 서브대역 신호를 발생시키기 위하여 상기 입력 신호에 분석 필터뱅크를 적용하는 단계로서, 각 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하는, 적용 단계;
    양자화된 서브대역 신호를 발생시키기 위하여, 하나 이상의 서브대역 신호의 서브대역-신호 성분을 양자화하는 단계로서, 하나 이상의 제1 서브대역-신호 성분 및 상기 하나 이상의 제1 서브대역-신호 성분 보다 크기가 작은 하나 이상의 제2 서브대역-신호 성분을 갖는 서브대역 신호에 대해서, 상기 제2 서브대역-신호 성분은 푸싱함이 없이 발생된 것 보다 적은 양자화 레벨로 양자화되는 값의 범위로 푸시됨으로써, 양자화 정확도를 감소시키고 상기 양자화된 제2 서브대역-신호 성분의 엔트로피를 감소시키는, 양자화 단계;
    하나 이상의 엔코딩된 서브대역 신호를 발생시키기 위하여, 상기 양자화된 서브대역 신호의 정보 용량 요구조건을 감소시키는 엔트로피 엔코딩 공정을 사용하여 상기 하나 이상의 양자화된 서브대역 신호를 엔코딩하는 단계; 및,
    상기 하나 이상의 엔코딩된 서브대역 신호를 상기 출력 신호내로 어셈블하는 단계를 포함하는 매체.
  48. 제47항에 있어서, 상기 분석 필터뱅크는 하나 이상의 변환으로 수행되고 상기 서브대역-신호 성분은 변환 계수인 매체.
  49. 제47항 또는 제48항에 있어서, 상기 양자화 단계는 서브대역-신호 성분을 확장하고 상기 확장된 서브대역-신호 성분을 균일한 양자화 함수로 양자화하는 단계를 포함하는 매체.
  50. 제47항 내지 제49항중 어느 한 항에 있어서, 상기 양자화 단계는 불균일한 양자화 함수를 따른 매체.
  51. 제47항 내지 제50항중 어느 한 항에 있어서, 상기 엔트로피 엔코딩 공정은 엔코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 매체.
  52. 제47항 내지 제51항중 어느 한 항에 있어서, 상기 엔트로피 엔코딩 공정은 연산 엔코딩인 매체.
  53. 제47항 내지 제52항중 어느 한 항에 있어서, 상기 방법은 상기 제2 서브대역-신호 성분이 상기 서브대역-신호 성분값의 특성에 응답하여 푸시되는 값의 범위를 적응시키는 매체.
  54. 장치에 의해 판독가능하고 상기 장치에 의해 실행가능한 명령 프로그램을 전달하여 이하의 작용을 수행하는 단계를 포함하는 오디오 디코딩 방법을 수행하는 매체로서,
    상기 입력 신호로부터 하나 이상의 엔코딩된 서브대역 신호를 얻는 단계;
    하나 이상의 디코딩된 서브대역 신호를 발생시키기 위하여, 상기 엔코딩된 서브대역 신호의 정보 용량 요구조건을 증가시키는 무손실 디코딩 공정을 사용하여 상기 하나 이상의 엔코딩된 서브대역 신호를 디코딩하는 단계로서, 각 디코딩된 서브대역 신호는 하나 이상의 서브대역-신호 성분을 포함하고 상기 오디오 신호의 각 주파수 서브대역을 표시하는, 디코딩 단계;
    하나 이상의 역양자화된 서브대역 신호를 발생시키기 위하여, 상기 하나 이상의 디코딩된 서브대역 신호의 서브대역-신호 성분을 역양자화하는 단계로서, 상기 역양자화 단계는 제1 구간의 값내의 값에 대해 제1 양자화 정확도 및 제2 구간의 값내의 값에 대해 제2 양자화 정확도를 사용하는 양자화 단계에 상보적이며, 상기 제1 양자화 정확도는 상기 제2 양자화 정확도 보다 낮으며, 상기 제1 구간은 상기 제2 구간에 인접하고, 상기 제1 구간내의 값은 상기 제2 구간내의 값 보다 작은, 역양자화 단계; 및,
    상기 출력 신호를 발생시키기 위하여, 합성 필터뱅크를 상기 하나 이상의 역양자화된 서브대역 신호를 포함하는 다수의 서브대역 신호에 적용하는 단계를 포함하는 매체.
  55. 제54항에 있어서, 상기 합성 필터뱅크는 하나 이상의 변환으로 수행되고 상기 서브대역-신호 성분은 변환 계수인 매체.
  56. 제54항 또는 제55항에 있어서, 상기 역양자화 단계는 불균일하게 역양자화하고 상기 서브대역-신호 성분을 압축하는 단계를 포함하는 매체.
  57. 제54항 내지 제56항중 어느 한 항에 있어서, 상기 역양자화 단계는 불균일한 역양자화 함수를 따른 매체.
  58. 제54항 내지 제57항중 어느 한 항에 있어서, 상기 엔트로피 디코딩 공정은 디코딩되는 상기 양자화된 서브대역 신호의 통계에 적응되는 매체.
  59. 제54항 내지 제58항중 어느 한 항에 있어서, 상기 엔트로피 디코딩 공정은 연산 디코딩인 매체.
  60. 제54항 내지 제59항중 어느 한 항에 있어서, 상기 방법은 상기 입력 신호로부터 얻어진 제어 정보에 응답하여 상기 역양자화 단계를 적응시키는데, 상기 역양자화 단계는 상기 제2 서브대역-신호 성분이 상기 서브대역-신호 성분 값의 특성에 응답하여 푸시되는 값의 범위를 적응시키는 상기 양자화 단계에 상보적으로 되도록 적응되는 매체.
KR1020057000587A 2002-07-16 2003-07-08 저비트율 오디오 코딩 KR101019678B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/198,638 2002-07-16
US10/198,638 US7043423B2 (en) 2002-07-16 2002-07-16 Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
PCT/US2003/021506 WO2004008436A1 (en) 2002-07-16 2003-07-08 Low bit-rate audio coding

Publications (2)

Publication Number Publication Date
KR20050021467A true KR20050021467A (ko) 2005-03-07
KR101019678B1 KR101019678B1 (ko) 2011-03-07

Family

ID=30115160

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057000587A KR101019678B1 (ko) 2002-07-16 2003-07-08 저비트율 오디오 코딩

Country Status (16)

Country Link
US (1) US7043423B2 (ko)
EP (1) EP1537562B1 (ko)
JP (1) JP4786903B2 (ko)
KR (1) KR101019678B1 (ko)
CN (1) CN100367348C (ko)
AT (1) ATE360250T1 (ko)
AU (1) AU2003253854B2 (ko)
CA (1) CA2492647C (ko)
DE (1) DE60313332T2 (ko)
HK (1) HK1073916A1 (ko)
IL (1) IL165869A (ko)
MX (1) MXPA05000653A (ko)
MY (1) MY137149A (ko)
PL (1) PL207862B1 (ko)
TW (1) TWI315944B (ko)
WO (1) WO2004008436A1 (ko)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
AU2003272833A1 (en) * 2002-09-17 2004-04-08 Vladimir Ceperkovic Fast codec with high compression ratio and minimum required resources
US7610553B1 (en) * 2003-04-05 2009-10-27 Apple Inc. Method and apparatus for reducing data events that represent a user's interaction with a control interface
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004027146B4 (de) * 2004-06-03 2014-10-30 Unify Gmbh & Co. Kg Verfahren und Vorrichtung zum automatischen Festlegen von zu Codeworten gehörenden Wertebereichsgrenzen für Abtastwerte
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
HUE057855T2 (hu) * 2006-07-04 2022-06-28 Dolby Int Ab Szûrõrendszer, amely tartalmaz egy szûrõátalakítót és egy szûrõkompresszort, valamint a szûrõrendszer mûködtetésére való eljárás
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
PL2311033T3 (pl) 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US20100106269A1 (en) * 2008-09-26 2010-04-29 Qualcomm Incorporated Method and apparatus for signal processing using transform-domain log-companding
EP3640941A1 (en) * 2008-10-08 2020-04-22 Fraunhofer Gesellschaft zur Förderung der Angewand Multi-resolution switched audio encoding/decoding scheme
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
EP2491555B1 (en) * 2009-10-20 2014-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
US8989884B2 (en) * 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
US9786286B2 (en) * 2013-03-29 2017-10-10 Dolby Laboratories Licensing Corporation Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals
US9762198B2 (en) * 2013-04-29 2017-09-12 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
WO2016041204A1 (en) * 2014-09-19 2016-03-24 Telefonaktiebolaget L M Ericsson (Publ) Methods for compressing and decompressing iq data, and associated devices
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3353783B1 (en) * 2015-09-25 2019-12-11 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding
WO2017080835A1 (en) * 2015-11-10 2017-05-18 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
CN110992672B (zh) * 2019-09-25 2021-06-29 广州广日电气设备有限公司 红外遥控器学习及编码方法、红外遥控器系统及存储介质
DE102022200893A1 (de) * 2022-01-27 2023-07-27 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zur Codierung und Decodierung von Daten

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US4272648A (en) * 1979-11-28 1981-06-09 International Telephone And Telegraph Corporation Gain control apparatus for digital telephone line circuits
US4273970A (en) * 1979-12-28 1981-06-16 Bell Telephone Laboratories, Incorporated Intermodulation distortion test
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US5127021A (en) * 1991-07-12 1992-06-30 Schreiber William F Spread spectrum television transmission
US5394508A (en) 1992-01-17 1995-02-28 Massachusetts Institute Of Technology Method and apparatus for encoding decoding and compression of audio-type data
JP3527758B2 (ja) * 1993-02-26 2004-05-17 ソニー株式会社 情報記録装置
TW327223B (en) 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
JP3685823B2 (ja) * 1993-09-28 2005-08-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JPH0918348A (ja) * 1995-06-28 1997-01-17 Graphics Commun Lab:Kk 音響信号符号化装置及び音響信号復号装置
JP3475985B2 (ja) * 1995-11-10 2003-12-10 ソニー株式会社 情報符号化装置および方法、情報復号化装置および方法
DE10010849C1 (de) * 2000-03-06 2001-06-21 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Analysieren eines Analyse-Zeitsignals

Also Published As

Publication number Publication date
KR101019678B1 (ko) 2011-03-07
AU2003253854A1 (en) 2004-02-02
TW200406096A (en) 2004-04-16
PL373045A1 (en) 2005-08-08
IL165869A (en) 2010-06-30
DE60313332D1 (de) 2007-05-31
AU2003253854B2 (en) 2009-02-19
EP1537562A1 (en) 2005-06-08
WO2004008436A1 (en) 2004-01-22
CN100367348C (zh) 2008-02-06
DE60313332T2 (de) 2008-01-03
EP1537562B1 (en) 2007-04-18
CN1669072A (zh) 2005-09-14
ATE360250T1 (de) 2007-05-15
IL165869A0 (en) 2006-01-15
MXPA05000653A (es) 2005-04-25
US20040015349A1 (en) 2004-01-22
MY137149A (en) 2008-12-31
TWI315944B (en) 2009-10-11
CA2492647A1 (en) 2004-01-22
US7043423B2 (en) 2006-05-09
HK1073916A1 (en) 2006-01-20
PL207862B1 (pl) 2011-02-28
JP4786903B2 (ja) 2011-10-05
CA2492647C (en) 2011-08-30
JP2005533280A (ja) 2005-11-04

Similar Documents

Publication Publication Date Title
KR101019678B1 (ko) 저비트율 오디오 코딩
US5819215A (en) Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
KR100991450B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR100304055B1 (ko) 음성 신호 부호화동안 잡음 대체를 신호로 알리는 방법
US6058362A (en) System and method for masking quantization noise of audio signals
US6029126A (en) Scalable audio coder and decoder
EP1080462B1 (en) System and method for entropy encoding quantized transform coefficients of a signal
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
KR100852482B1 (ko) 추정을 결정하는 방법 및 장치
US20080140405A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP2005338850A (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JPH0856163A (ja) 適応的デジタルオーディオ符号化システム
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
JPH0934493A (ja) 音響信号符号化装置、音響信号復号装置および音響信号処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140210

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150206

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160211

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee