KR20010034370A - 오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법 - Google Patents

오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법 Download PDF

Info

Publication number
KR20010034370A
KR20010034370A KR1020007008115A KR20007008115A KR20010034370A KR 20010034370 A KR20010034370 A KR 20010034370A KR 1020007008115 A KR1020007008115 A KR 1020007008115A KR 20007008115 A KR20007008115 A KR 20007008115A KR 20010034370 A KR20010034370 A KR 20010034370A
Authority
KR
South Korea
Prior art keywords
subband
bit
audio data
bit allocator
subbands
Prior art date
Application number
KR1020007008115A
Other languages
English (en)
Inventor
인린
Original Assignee
밀러 제리 에이
소니 일렉트로닉스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 밀러 제리 에이, 소니 일렉트로닉스 인코포레이티드 filed Critical 밀러 제리 에이
Publication of KR20010034370A publication Critical patent/KR20010034370A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

오디오 데이터 인코더 장치(112)에서 결함을 방지하는 시스템 및 방법은 주파수 서브 밴드를 생성하기 위해 소스 오디오 데이터(116)를 필터링 하기 위한 필터 뱅크, 상기 소스 오디오 데이터(116)에 대한 신호대 마스킹비를 계산하기 위한 사이코-음향 모델러, 및 주파수 서브 밴드를 나타내는 유한 개수의 할당 비트를 할당하기 위해 신호대 마스킹비를 사용하는 비트 할당기(122)를 포함한다. 정의된 유의 이벤트가 존재하지 않는 경우에, 비트 할당기(122)는 인코딩 된 오디오 데이터(138)에서 불연속 또는 결함을 방지하기 위해 예비 비트 할당 절차를 포함하는 서브 밴드 구동 전략을 수행한다.

Description

오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법{ADAPTIVE BIT ALLOCATION FOR AUDIO ENCODER}
오디오 데이터를 인코딩하는 효과적이고 효율적인 방법을 구현하는 것은 현 전자 시스템의 디자이너, 제조사, 및 사용자에게는 종종 중요한 고려 사항이다. 현대적인 디지털 오디오 기술은 복잡하며 고성능의 오디오 인코딩 방법론에서의 해당 진보로 인하여 진화하여 왔다. 예를 들어, 레코딩 가능한 오디오 콤팩트 디스크 장치가 출현하려면 콤팩트 디스크 장치를 사용하여 적절한 매체 상으로 레코딩할 수 있는 포맷(MPEG와 같은 포맷)으로 소스 오디오 데이터를 수신하고 인코딩하기 위해 인코더-디코더(코덱) 시스템을 일반적으로 필요로 한다.
오디오 인코딩 처리의 많은 부분은, 시스템 디자이너가 데이터 포맷이나 인코딩 기술을 변경시키지 못하는 엄격한 기술적 표준의 적용을 받는다. 오디오 인코딩 처리의 다른 부분은, 표준화된 디코더 장치가 성공적으로 인코딩 된 오디오 데이터를 디코드 할 수 있도록 인코딩 된 오디오 데이터가 특정 명세에 따라야 하기 때문에 변경될 수 없다. 이러한 전술한 제한 사항은 오디오 인코더 장치의 성능을 개선하고 하는 시스템 디자이너에게는 실질적인 제한이 된다.
대부분의 오디오 인코딩 시스템의 주요 목표는, 오디오 인코딩 처리로 발생되는 임의의 음성 결함을 야기하지 않고 소스 오디오 데이터를 적절하며 유용한 포맷으로 인코딩 하는 것이다. 환언하면, 오디오 디코더는 인코딩 및 디코딩 처리로 발생된 임의의 음성 결함을 야기하지 않고 오디오 재생 시스템으로 투명한 재생을 위한 인코딩 된 오디오 데이터를 디코딩 할 수 있어야 한다.
디지털 오디오 인코더는 일반적으로 "프레임"이라고 하는 오디오 데이터의 순차 단위(sequential unit)를 처리하고 압축한다. 특히 "불연속점"이라고 하는 반대할만한 음성 결함이, 오디오 데이터의 연속 프레임이 불균일 진폭 또는 주파수 성분으로 인코딩 될 때 발생될 수 있다. 불연속점은 인코딩 된 오디오 데이터가 오디오 재생 시스템으로 디코딩 되며 재생될 때마다 사람의 귀에 용이하게 판독될 수 있다.
더욱이, 오디오 데이터를 효과적으로 인코딩 하기 위해, 오디오 인코더는 유한 개수의 바이너리 디지트(비트)를 오디오 데이터의 주파수 성분에 할당하여야 하며, 그리하여 인코딩 처리가 소스 오디오 데이터의 최적 표현이 되게 하여야 한다. 불연속 결함을 방지하는 효과적인 비트 할당 기술은 이리하여 오디오 디코더 장치에 상당한 장점을 제공할 것이다. 그러므로, 모든 전술한 이유로 인하여, 오디오 데이터 인코더 장치에서 결함을 방지하는 개선된 시스템과 방법이 요구되어진다.
본 출원은 1998년 8월 4일에 출원된 "정제된 사이코-음향 모델러를 구현하는 시스템 및 방법"이라고 명명된 공동 계류 중인 미국 특허 출원 일련 번호 09/128, 924호 및 1998년 9월 9일에 출원된 "사이코-음향 모델러에서 마스킹 기능을 효과적으로 구현하는 시스템 및 방법"이라고 명명된 공동 계류 중인 미국 특허 출원 일련 번호 09/150, 117호, 및 ___ 일에 출원된 오디오 디코더 장치에서 고정 마스킹 임계값을 효과적으로 수행하는 시스템 및 방법"이라고 명명된 공동 계류 중인 미국 특허 출원 일련 번호 ___호에 관한 것으로, 이들 출원 명세서는 본 명세서에서 참조로 병합되어 있다. 앞서의 관련 출원은 공통적으로 양도되어 있다.
본 발명은 일반적으로 신호 처리 시스템에 관한 것이며, 좀더 구체적으로 오디오 데이터 인코더 장치에서 결함(artifacts)을 방지하는 시스템 및 방법에 관한 것이다.
도 1 은 본 발명에 따라 인코더-디코더 시스템의 일 실시예의 블록도.
도 2 는 본 발명에 따라 도 1 의 인코더 필터 뱅크의 일 실시예의 블록도.
도 3 은 본 발명에 따라 예시적인 마스킹 임계값의 일 실시예에 대한 그래프.
도 4 는 본 발명에 따라 예시적인 신호 대 마스킹 비의 일 실시예에 대한 그래프.
도 5의 (a)는 본 발명에 따라 불연속점(discontinuity)을 포함하지 않는 신호 에너지의 일 실시예에 대한 도면.
도 5의 (b)는 본 발명에 따라 불연속점을 포함하는 신호 에너지의 일 실시예에 대한 도면.
도 6 은 본 발명에 따라 예시적인 서브 밴드 구동 전략에 대한 일 실시예의 그래프.
도 7 은 본 발명에 따라 오디오 데이터 인코더 장치에서 결함을 방지하는 시스템 및 방법의 일 실시예에 대한 방법 단계의 흐름도.
본 발명에 따라, 오디오 데이터 인코더 장치에서 결함을 방지하는 시스템 및 방법이 개시된다. 본 발명의 일 실시예에 있어서, 인코더 필터 뱅크는 초기에 수신된 소스 오디오 데이터의 프레임을 주파수 서브 밴드로 분할한다. 바람직한 실시예에서, 필터 뱅크는 프레임당 32개의 이산 서브 밴드를 생성하며, 그후 비트 할당기에 서브 밴드를 제공하다.
사이코-음향 모델러는 또한 신호대 마스킹비(SMR : Signal-to-Masking Ratios)를 반응적으로 결정하며 그후 비트 할당기에 SMR을 제공하기 위해 소스 오디오 데이터를 수신한다. 그 다음에, 비트 할당기는 필터 뱅크로부터 수신된 서브 밴드의 초기 프레임을 식별하며 그후 비트 할당 처리를 사용하여 초기 프레임의 선택된 서브 밴드에 유한 개수의 이용 가능한 할당 비트를 할당한다. 비트 할당기는 그후 필터 뱅크로부터 제공된 서브 밴드의 그 다음 프레임에 도달하기 위해 한 프레임을 전진 이동시켜서 새로운 현 프레임으로 진행한다.
그 다음으로, 비트 할당기는 유의 이벤트(significant event)가 존재하는 경우에 대해 새로운 현 프레임을 점검한다. 바람직한 실시예에 있어서, 비트 할당기는 연속 프레임(현 프레임과 바로 앞선 프레임)의 신호대 마스킹비가 선택 가능한 임계값을 초과할 때마다 유의 이벤트를 검출한다. 또한 본 발명에 사용하기 위해 유의 이벤트를 결정하는 다른 기준이 고려된다.
만약 비트 할당기가 현 프레임에서 유의 이벤트를 검출한다면, 비트 할당기는 위에서 언급된 비트 할당 처리를 수행한다. 그러나, 비트 할당기는 현 프레임에서 유의 이벤트를 검출하지 못한다면, 비트 할당기는 현 프레임에 대해 초기 서브 밴드 세트를 형성하기 위해 예비 비트 할당 절차를 수행한다. 일 실시예에서, 비트 할당기는 현 프레임에 대해 초기 서브 밴드를 형성하기 위해 바로 앞선 프레임에서 비트가 할당된 각 서브 밴드(to each sub-band that was allocated bits)에 (이용 가능한 할당 비트로부터) 샘플당 한 비트를 예비 할당하는 것이 바람직하다.
그후, 비트 할당기는 이용 가능한 할당 비트로부터 샘플 당 한 비트를 가장 높은 SMR이 있는 (초기 서브 밴드 세트로부터)서브 밴드에 할당하여 전술한 비트 할당 처리를 수행한다. 그 다음으로, 비트 할당기는 단일 비트가 방금 할당된 가장 높은 SMR이 있는 서브 밴드로부터 6데시벨을 감산한다. 비트 할당기는 그후 임의의 이용 가능한 할당 비트가 남아 있는지를 결정한다.
만약 이용 가능한 할당 비트가 남아 있다면, 그후 비트 할당기는 현 프레임에 대해 비트 할당 처리를 계속 수행한다. 그러나, 만약 이용 가능한 할당 비트가 남아 있지 않다면, 그때는 비트 할당기는 필터링 된 오디오 데이터의 임의의 처리되지 않은 프레임이 남아 있는지를 결정한다. 만약 필터링 된 오디오 데이터의 프레임이 처리되지 않은 채 남아 있다면, 그때 비트 할당기는 필터링 된 오디오 데이터의 다른 프레임을 처리하기 위해 복귀한다. 그러나, 오디오 데이터의 프레임이 남아 있지 않다면, 비트 할당기는 오디오 데이터에 비트를 할당하는 것을 완료하며 전술한 비트 할당 처리는 종료한다. 본 발명은 이리하여 오디오 데이터 인코더 장치에서 결함을 방지하는 시스템 및 방법을 구현하기 위해 서브 밴드 구동 전략(sub-band forcing strategy)을 효과적이고 효율적으로 수행한다.
본 발명은 신호 처리 시스템의 개선에 관한 것이다. 아래의 설명은 당업자가 본 발명을 이루며 사용할 수 있도록 하기 위하여 제시되어 있으며 특허 출원과 그 출원 요건의 환경에서 제공되어 있다. 바람직한 실시예에 대하여 여러 가지 변경이 당업자에게는 명백히 용이할 것이며 본 명세서에서의 일반 원칙은 다른 실시예에도 적용될 것이다. 이리하여, 본 발명은 도시되어 있는 실시예로 제한되지 않으며, 오히려 본 명세서에서 설명된 원리와 특성과 일관성이 있는 가장 광범위한 범주에 따라야 하는 것이다.
본 발명은, 주파수 서브 밴드를 생성하는데 소스 오디오 데이터를 필터링 하기 위한 필터 뱅크, 소스 오디오 데이터로부터 신호대 마스킹 비를 계산하기 위한 사이코-음향 모델러, 및 주파수 서브 밴드를 나타내는데 유한 개수의 할당 비트를 할당하기 위해 신호대 마스킹비를 사용하는 비트 할당기를 포함하는 오디오 데이터 인코더 장치에서의 결함을 방지하는 시스템 및 방법을 포함한다. 정의된 유의 이벤트가 존재하지 않는 경우에는, 비트 할당기는 인코딩 된 오디오 데이터에서의 결함 또는 불연속점을 방지하는 예비 비트 할당 절차를 포함하는 서브 밴드 구동 전략을 수행한다.
이제 도 1을 참조하면, 인코더-디코더(코덱)(110)의 일 실시예에 대한 블록도가 본 발명에 따라 도시되어 있다. 도 1 의 실시예에서, 코덱(110)은 인코더(112)와 디코더(114)를 포함한다. 인코더(112)는 필터 뱅크(118), 사이코-음향 모델러(PAM)(126), 비트 할당기(122), 양자화기(132), 및 비트스트림 패커(136)를 포함하는 것이 바람직하다. 디코더(114)는 비트스트림언패커(144), 역양자화기(148), 및 필터 뱅크(152)를 포함하는 것이 바람직하다.
도 1 의 실시예에서, 인코더(112)와 디코더(114)는 프로세서 장치(도시되지 않음)로 실행되는 오디오 관리자라고 하는 프로그램 지시 세트에 응답하여 기능하는 것이 바람직하다. 대안 실시예에서, 인코더(112)와 디코더(114)는 또한 적절한 하드웨어 구성을 사용하여 구현되며 제어될 수도 있다. 도 1 실시예는 구체적으로 디지털 오디오 데이터를 인코딩 하며 디코딩 하는 것을 논의하지만, 본 발명은 다른 형태의 전자 정보를 처리하며 조정하는데도 유리하게 사용될 수 있다.
인코딩 동작 동안, 인코더(112)는 경로(116)를 통해 임의의 호환 가능한 오디오 소스로부터 소스 오디오 데이터를 수신한다. 도 1 실시예에서, 경로(116)에 있는 소스 오디오 데이터는 선형 펄스 코드 변조(LPCM)포맷으로 포맷되는 것이 바람직한 디지털 오디오 데이터를 포함한다. 인코더(112)는 "프레임"이라고 하는 단위로 소스 오디오 데이터의 16비트 디지털 샘플을 처리하는 것이 바람직하다. 바람직한 실시예에서, 각 프레임은 1152 샘플을 포함한다.
실제로, 필터 뱅크(118)는 소스 오디오 데이터를 수신하며 이 소스 오디오 데이터를 필터링 된 오디오 데이터를 생성시키기 위해, 이산 주파수 서브 밴드의 세트로 분리한다. 도 1 실시예에서, 필터 뱅크(118)로부터 필터링 된 오디오 데이터는 32개의 고유하며 분리되어 있는 주파수 서브 밴드를 포함하는 것이 바람직하다. 필터 뱅크(118)는 그후 경로(120)를 통해 비트 할당기(122)에 필터링 된 오디오 데이터(서브 밴드)를 제공한다.
비트 할당기(122)는 그후 경로(128)를 통해 PAM(126)으로부터 관련 정보를 억세스하며 응답으로 경로(130)를 통해 양자화기(132)에 할당된 오디오 데이터를 생성시킨다. 비트 할당기(122)는 필터 뱅크(118)로부터 수신된 선택된 서브 밴드에 포함되어 있는 신호를 나타내기 위해 바이너리 디지트(비트)를 할당하여 할당된 오디오 데이터를 발생시킨다. PAM(126)과 비트 할당기의 기능은 도 2 내지 도 7 과 연관하여 아래에서 더 논의된다.
그 다음으로, 양자화기(132)는 경로(134)를 통해 비트스트림 패커(136)에 양자화된 오디오 데이터를 발생시키기 위해 할당된 오디오 데이터를 압축하며 부호화한다. 비트스트림 패커(136)는 응답으로 경로(138)를 통해 (레코딩 가능 콤팩트 디스크 장치 또는 컴퓨터 시스템과 같은)오디오 장치에 제공될 수 있는 인코딩된 오디오 데이터를 발생시키기 위해 양자화된 오디오 데이터를 팩킹한다.
디코딩 동작 동안, 인코딩 된 오디오 데이터는 경로(140)를 통해 오디오 장치로부터 비트스트림 언패커(144)에 제공된다. 비트스트림 언패커(144)는 응답으로 경로(146)를 통해 역양자화기(148)에 양자화된 오디오 데이터를 발생시키기 위해 인코딩 된 오디오 데이터를 언팩킹한다. 역양자화기(148)는 그후 경로(150)를 통해 필터 뱅크(152)에 역양자화된 오디오 데이터를 발생시키기 위해 양자화된 오디오 데이터를 역양자화한다. 필터 뱅크(152)는 응답으로 경로(154)를 통해 디코딩된 오디오 데이터를 발생시켜 오디오 재생 시스템(도시되지 않음)에 제공하기 위해 역양자화된 오디오 데이터를 필터링 한다.
이제 도 1 의 일 실시예에 대한 블록도인 도 2를 참조하면, 인코더 필터 뱅크(118)가 본 발명에 따라 도시되어 있다. 도 2 실시예에서, 필터 뱅크(118)는 경로(116)를 통해 호환 가능한 오디오 소스로부터 소스 오디오 데이터를 수신한다. 필터 뱅크(118)는 그후 응답으로 비트 할당기(122)에 각각 제공되는 일련의 주파수 서브 밴드로 수신된 소스 오디오 데이터를 분할한다. 도 2 실시예는 32개의 서브 밴드{120(a) 내지 120(h)}를 발생시키는 것이 바람직하지만, 대안 실시예에서, 필터 뱅크(118)는 손쉽게 더 많거나 더 적은 서브 밴드를 출력할 수 있다.
이제 도 3을 참조하면, 예시적인 마스킹 임계값의 일 실시예에 대한 그래프(310)가 본 발명에 따라 도시되어 있다. 그래프(310)는 오디오 데이터 신호 에너지를 수직축(312)으로 표시하며 일련의 주파수 서브 밴드를 수평축(314)으로 표시한다. 그래프(310)는 본 발명의 원리를 도시하기 위해 제시되어 있으며, 그리하여 그래프(310)에 도시되어 있는 값도 단지 예로서 의도되어 있다. 본 발명은 이리하여 도 3 의 그래프(310)에 도시되어 있는 값들과는 다른 동작 값으로 손쉽게 동작할 수 있다.
도 3에서, 그래프(310)는 서브 밴드(1)(316) 내지 서브 밴드(6)(326)와 각 도 3 의 서브 밴드에 대하여 변화하는 마스킹 임계값(328)을 포함한다. 비트 할당기(122)는 필터 뱅크(118)로부터 서브 밴드(1)(316) 내지 서브 밴드(6)(326)를 수신하며 사이코-음향 모델러(126)로부터 마스킹 임계값(328)을 수신하는 것이 바람직하다. 동작시에, 사이코-음향 모델러(PAM)(126)는 한 프레임씩 소스 오디오 데이터를 수신하며 마스킹 임계값(328)을 발생시키기 위해 사람의 청력의 특성을 사용한다. 낮은 에너지 음성과 높은 에너지의 음성이 주파수로 볼 때 가까이 있을 때 사람의 청력은 몇몇 낮은 에너지의 음성을 검출하지 못한다는 것을 실험은 결정해 주었다.
예를 들어, 서브 밴드(3)(320)는 60㏈의 음성(332), 30db의 음성(334), 및 36db의 마스킹 임계값(330)을 포함한다. 30db의 음성(334)은 마스킹 임계값(330) 이하로 떨어지고, 그리하여 60db의 음성(332)의 마스킹 효과로 인해 사람의 귀에 검출되지 않는다. 실제로, 인코더(112)는 이리하여 오디오 데이터의 양을 유리하게 줄이고 인코딩 처리를 촉진시키기 위해 마스킹 임계값(328) 아래로 떨어지는 임의의 음성을 버릴 수 있다.
사이코-음향 모델러(PAM)(126)는 마스킹 임계값(328)을 계산하기 위해 소스 오디오 데이터로부터 주파수 영역에 있는 신호 에너지 레벨을 사용한다. PAM(126)은 마스킹 임계값(328)을 유도하기 위해 여러 가지 산술 방법론을 사용할 수 있다. 예를 들어, PAM(126)은 선택적으로 종래의 마스킹 임계값을 발생시키고, 각 서브 밴드에 대해 평균적인 마스킹 임계값을 계산하며, 고정된 마스킹 임계값을 사용하며, 또는 인코더(112)의 성능을 개선하기 위하여 특정 마스킹 임계값을 발생시킬 수 있다. 마스킹 임계값을 계산하는 것은, 본 명세서에 참조로 병합되어 있는, 공동 계류 중인 미국 특허 출원 일련 번호 09/128, 924호(1998년 8월 4일에 출원된 "정제된 사이코-음향 모델러를 구현하는 시스템 및 방법"이라고 명명된 출원)와 공동 계류 중인 미국 특허 출원 일련 번호 09/150, 117호(1998년 9월 9일에 출원된 "사이코-음향 모델러에서 마스킹 기능을 효과적으로 구현하는 시스템 및 방법"이라고 명명된 출원)에 논의되어 있다.
그후 PAM(126)은 해당 마스킹 임계값(328)으로 서브 밴드의 신호 에너지를 분할하여 일련의 신호대 마스킹비(SMR : Sinal-to-Masking Ratio)를 계산할 수 있다. 최종적으로, PAM(126)은 계산된 SMR을 경로(128)를 통해 비트 할당기(122)에 제공하며, 이는 비트 할당기(122)가 본 발명에 따라 여러 가지 서브 밴드에 이용 가능한 할당 비트를 할당하기 위하여 효과적인 비트 할당 처리를 수행하도록 하기 위함이다.
이제 도 4를 참조하면, 예시적인 신호대 마스킹비(SMR)의 일 실시예에 대한그래프(410)가 본 발명에 따라 도시되어 있다. 그래프(410)는 SMR 값을 수직축(412)으로 표시하며 일련의 주파수 서브 밴드를 수평축(414)으로 표시한다. 그래프(410)는 본 발명의 원리를 도시하기 위해 제시되어 있으며, 그리하여, 그래프(410)에 도시되어 있는 값들은 단지 예로서 의도되어 있다. 본 발명은 이리하여 도 4 의 그래프(410)에 제시되어 있는 값들과는 다른 동작 값으로 용이하게 동작할 수 있다.
도 4에서, 그래프(410)는 서브 밴드(1)(416) 내지 서브 밴드(6)(426), 및 도 4의 각 서브 밴드에 대해 변화하는 SMR 값(428)을 포함한다. 동작시에, 사이코-음향 모델러(PAM)(126)는 각 서브 밴드에 대한 SMR 값을 비트 할당기(122)에 제공하는데, 그후 비트 할당기는 응답으로 주파수 서브 밴드에 유한 개수의 이용 가능한 비트를 할당하기 위해 비트 할당 처리를 수행하여 필터링된 오디오 데이터를 할당된 오디오 데이터로 변환시킨다. 예를 들어, 비트 할당기(122)는 비트 레이트(bit rat)를 샘플 레이트로 분할하며, 그후 프레임 크기로 곱셈하여 전체 이용 가능한 할당 비트 수를 결정할 수 있다. 본 발명의 일 실시예에서, 비트 레이트는 초당 256,000비트인 것이 바람직하며 샘플 레이트는 48kHz인 것이 바람직하다. 만약 프레임 크기가 프레임당 1152비트라면, 전체 이용 가능한 할당 비트 수는 그리하여 프레임당 6144비트로 계산될 수 있다.
환언하면, 비트 할당기(122)는 필터링 된 오디오 데이터로서 필터 뱅크(118)로부터 수신된 서브 밴드의 최적의 표현을 달성하기 위하여 유한 개수의 이용 가능한 비트를 효과적으로 할당하여야 한다. 비트 할당기(122)는 우선 순서에 기초하여 특정 주파수 밴드에 비트를 할당하거나 서브 밴드의 상대적 신호 에너지에 비례하여 비트를 할당하는 것과 같은 여러 가지 할당 방법을 사용하여 이용 가능한 비트를 할당할 수 있다. 바람직한 실시예에서, 비트 할당기(122)는 사이코-음향 모델러(126)로부터 수신된 서브 밴드 SMR에 기초한 기술을 사용하여 이용 가능한 비트를 할당한다.
실제로, 비트 할당기(122)는 초기에는 가장 큰 SMR을 가지는 최대 서브 밴드를 찾아서, 샘플당 한 비트를 그 최대 서브 밴드에 할당하며, 그후 방금 단일 비트가 할당된 최대 서브 밴드로부터 6㏈를 감산한다. 비트 할당기(122)는 그후 단일 비트를 반복하여 계속 할당하고 이용 가능한 비트가 남아 있지 않을 때까지 현 최대 서브 밴드의 데시벨 값을 조정한다.
예를 들어, 도 4 의 그래프(410)에서, 서브 밴드(5)(424)는 가장 큰 SMR(430)(76㏈)을 가진다. 비트 할당기(122)는 그리하여 초기에 한 비트를 서브 밴드(5)(424)에 할당하며, 그후 70㏈의 조정된 SMR 을 얻기 위하여 76㏈의 SMR 로부터 6㏈을 감산한다. 서브 밴드(5)(424)가 아직 가장 큰 SMR(70㏈)을 가지기 때문에, 비트 할당기(122)는 그후 제 2 비트를 서브 밴드(5)(424)에 할당하며 64㏈의 조정된 SMR을 얻기 위하여 70㏈의 조정된 SMR 로부터 다른 6㏈을 감산한다. 다시, 서브 밴드(5)(424)가 여전히 가장 큰 SMR(64㏈)을 가지기 때문에, 비트 할당기(122)는 제 3 비트를 서브 밴드(5)(424)에 할당하며 58㏈의 조정된 SMR을 얻기 위하여 64㏈의 조정된 SMR 로부터 또다른 6㏈를 감산한다. 서브 밴드(1)(416)는 그후 가장 큰 SMR (60㏈)을 가지는 서브 밴드가 되어, 비트 할당기(122)는 전술한 비트 할당과 레벨 조정 처리를 계속하기 위해 서브 밴드(1)(416)로 이동한다. 비트 할당기(122)는 가장 큰 SMR을 가진 서브 밴드를 계속 탐색하며 모든 이용 가능한 비트가 할당된 오디오 데이터를 발생시키기 위해 선택된 서브 밴드에 할당될 때까지 반복적으로 비트를 할당한다. 비트 할당기(122)는 그후 할당된 오디오 데이터를 양자화기(132)에 제공한다.
이제 도 5의 (a)를 참조하면, 불연속점이 없는 신호 에너지(510)의 일 실시예에 대한 도면이 본 발명에 따라 도시되어 있다. 도 5의 (a)는 본 발명의 원리를 도시하기 위하여 제시되어 있으며, 그리하여 신호 에너지(510)는 단지 예로서 의도되어 있다. 본 발명은 이리하여 도 5의 (a)에 제시되어 있는 값들과는 다른 신호 에너지로 용이하게 동작할 수 있다.
도 5의 (a) 실시예에서, 신호 에너지(510)는 필터 뱅크(118)를 통해 비트 할당기(122)에 제공된 필터링된 오디오 데이터를 나타내는 프레임(1)(514), 프레임(2)(516), 및 프레임(3)(518)을 포함한다. 도 5의 (a)에서, 프레임(514) 내지 프레임(518)은 각각 필터 뱅크(118)를 통해 발생된 모든 서브 밴드를 포함하며 그리하여 프레임(514 내지 518)의 진폭은 (불연속점이 없이) 상대적으로 안정되어 있다.
이제 도 5의 (b)를 참조하면, 불연속점을 포함하는 신호 에너지(512)의 일 실시예에 대한 도면이 본 발명에 따라 도시되어 있다. 도 5의 (b)는 본 발명의 원리를 도시하기 위해 제시되어 있으며 그리하여 신호 에너지(512)는 단지 예로서 의도되어 있다. 본 발명은 이리하여 도 5의 (b)에 제시되어 있는 값들과는 다른 신호 에너지로 용이하게 동작할 수 있다.
도 5의 (b) 실시예에서, 신호 에너지(512)는 비트 할당기(122)를 통해 양자화기(132)에 제공된 할당된 오디오 데이터를 나태내는 프레임(1)(520), 프레임(2)(522), 및 프레임(3)(524)을 포함한다. 도 5의 (b)에서, 유한 개수의 이용 가능한 할당 비트로 인해, 프레임(520 내지 524)은 일반적으로 필터 뱅크(118)를 통해 발생된 모든서브 밴드를 포함하지 않으며, 그리하여 프레임(1 내지 3)(520 내지 524)의 진폭은 도 5의 (a)의 대응하는 프레임(1 내지 3)(514 내지 518)과는 상당히 다르다.
예를 들어, 프레임(2)(522)의 신호 에너지는 앞선 프레임(1)(520)에 비하여 실질적으로 감소된다. 프레임(2)(522)에 도시된 것과 같은 신호 에너지(및 관련 주파수 성분)에서의 변동값의 확장 시퀀스(extended sequence of variations)는 오디오 데이터가 오디오 재생 시스템을 통해 재생될 때 반대할 수 있는 음성 결함이나 불연속점을 발생시키도록 동작한다. 그러한 음성 결함에 대하여 보상하는 것은 도 6 및 도 7 과 연계하여 아래에 더 논의된다.
이제 도 6을 참조하면, 예시적인 서브 밴드 구동 전략에 대한 일 실시예의 그래프(610)가 본 발명에 따라 도시되어 있다. 그래프(610)는 비트 할당기(122)를 통해 할당되는 서브 밴드의 수를 수직축(612)으로 표시하며 오디오 데이터 프레임의 순서를 수평축(614)으로 표시한다. 그래프(610)는 본 발명의 원리를 도시하기 위해 제시되어 있으며, 그리하여 그래프(610)에 도시되어 있는 값들은 단지 예로서 의도되어 있다. 본 발명의 서브 밴드 구동 전략은 이리하여 도 6 의 그래프(610)에 제시되어 있는 값들이 아닌 동작 값으로 용이하게 동작할 수 있다.
도 6에서, 그래프(610)는 프레임(1)(616) 내지 프레임(6)(626)과, (도 6의 각 프레임에 대해 변화하는) 할당된 서브 밴드(628)의 전체 개수를 포함한다. 동작시, 비트 할당기(122)는 도 4와 연계하여 위에서 설명된 비트 할당 처리를 사용하여 프레임(1)(616)에 있는 서브 밴드의 개수를 초기에 계산하여 도 6 의 서브 밴드 구동 전략을 수행한다. 예를 들어, 도 6에서, 비트 할당기(122)는 프레임(1)(616)에 대해 16개의 서브 밴드(630)로 되는 이용 가능한 비트를 할당한다.
비트 할당기(122)는 그후 유의 이벤트에 대해 프레임(2)(618)을 분석한다. 비트 할당기(122)는 임의의 적절하며 희망하는 기준을 사용하여 유의 이벤트를 결정할 수 있다. 예를 들어, 연속 프레임에서 전체 신호 에너지의 차이는 임계값에 비교될 수 있다. 바람직한 실시예에서, 비트 할당기(122)는 연속 프레임의 SMR 에서의 차이가 선택 가능한 임계값보다도 더 크게 될 때마다 유의 이벤트를 검출한다.
도 6 예에서, 프레임(2)(618)은 유의 이벤트를 포함하지 않는다. 비트 할당기(122)는 그리하여 프레임(2)(618)에 할당된 서브 밴드의 총 개수의 실질적인 변화를 회피하기 위해 예비 비트 할당 절차를 수행한다. 예비 비트 할당 절차에서, 비트 할당기(122)는 현 프레임(2)(618)에 대해 초기 서브 밴드 세트를 형성하기 위해 앞선 프레임에 포함된 각 서브 밴드{여기에서, 프레임(1)(616)의 16개의 서브 밴드(630)}에 한 비트를 할당하는 것이 바람직하다. 대안적인 실시예에서, 비트 할당기(122)는 유사하게 이용 가능한 할당 비트의 더 큰 개수나 퍼센트를 할당할 수 있다. 유의 이벤트가 존재하지 않는 경우에, 예비 비트 할당 절차는 이리하여 연속 프레임으로 서브 밴드의 개수를 안정화시킨다. 비트 할당기(122)는 그후 도 4 와 연계하여 위에서 논의된 비트 할당 절차를 사용하여 현 프레임(2)(618)의 초기 서브 밴드 세트에 남아 있는 이용 가능한 비트를 할당시킨다.
비트 할당기(122)가 유의 이벤트를 검출하는 경우에, 예비 비트 할당 절차가 수행되지 않으며, 비트 할당기(122)는 도 4 와 연계하여 위에서 논의된 비트 할당 절차를 사용하여 모든 이용 가능한 비트를 할당한다. 도 6의 예에서, 비트 할당기(122)는 프레임(3)(620)에서 유의 이벤트를 검출하며, 그리하여 18개의 서브 밴드(634)를 생성하기 위하여 이용 가능한 비트를 할당한다. 프레임(4)(622)에서, 비트 할당기(122)는 유의 이벤트를 검출하지 않으며, 18개의 할당된 서브 밴드(636)를 구동(forcing)하기 위해 예비 비트 할당 절차를 응답으로 수행한다.
프레임(5)(624)에서, 비트 할당기(122)는 다시 유의 이벤트를 검출하며, 그리하여 8개의 서브 밴드(638)를 생성하기 위하여 이용 가능한 비트를 할당한다. 프레임(6)(626)에서, 비트 할당기(122)는 유의 이벤트를 검출하지 않으며, 8개의 할당된 서브 밴드(636)를 유지하기 위하여 예비 비트 할당 절차를 응답으로 수행한다.
이제 도 7을 참조하면, 결함을 방지하는 방법의 일 실시예에 대한 방법 단계의 흐름도가 본 발명에 따라 도시되어 있다. 초기에 단계(710)에서, 인코더 필터 뱅크(118)는 필터링 된 오디오 데이터를 발생시키기 위해 수신된 소스 오디오 데이터의 프레임을 주파수 서브 밴드로 필터링 한다. 바람직한 실시예에서, 필터 뱅크(118)는 32개의 이산 서브 밴드를 생성하며 그후 서브 밴드를 비트 할당기(122)에 필터링 된 오디오 데이터로서 제공하는 것이 바람직하다. 단계(712)에서, 사이코-음향 모델러(126)는 소스 오디오 데이터에 대한 신호대 마스킹 비(SMR)를 결정하며 그후 비트 할당기(122)에 SMR을 제공한다. PAM(126)을 통해 발생된 신호대 마스킹 비(SMR)는 도 3과 연계하여 위에서 논의되어 있다.
단계(714)에서, 비트 할당기(122)는 필터 뱅크(118)로부터 수신된 서브 밴드의 초기 프레임을 식별하며 그후 초기 프레임으로부터 선택된 서브 밴드에 모든 이용 가능한 비트를 할당한다. 도 7 실시예에서, 단계(714)는 도 4 와 연계하여 위에서 논의되어 있는{도 7 의 단계(724, 726, 및 728)에서 도시되어 있는}비트 할당 처리를 실행하여 수행되는 것이 바람직하다.
단계(716)에서, 비트 할당기(122)는 필터 뱅크(118)로부터 제공된 서브 밴드의 그 다음 프레임에 도달하도록 한 프레임을 앞으로 이동시켜서 새로운 현 프레임으로 진행한다. 비트 할당기(122)는, 단계(718)에서, 유의 이벤트의 존재에 대해 새로운 현 프레임을 점검한다. 바람직한 실시예에서, 비트 할당기(122)는 연속 프레임(현 프레임과 바로 앞선 프레임)의 신호대 마스킹비의 차이가 선택 가능한 임계값을 초과할 때마다 유의 이벤트를 검출한다. 유의 이벤트를 결정하는 다른 기준은 도 6과 연계하여 위에서 논의되어 있다.
단계(720)에서, 비트 할당기(122)가 유의 이벤트를 검출한다면, 도 7 의 처리는 단계(724)로 진행한다. 그러나, 비트 할당기(122)가 현 프레임에서 유의 이벤트를 검출하지 못한다면, 단계(722)에서, 비트 할당기(122)는 현 프레임에 대하여 초기 서브 밴드 세트를 형성하기 위해 예비 비트 할당 절차를 수행한다. 도 7 실시예에서, 비트 할당기(122)는 현 프레임에 대해 초기 서브 밴드 세트를 형성하기 위해 바로 앞선 프레임에 포함되어 있는 각 서브 밴드에 (이용 가능한 할당 비트로부터) 한 비트를 예비 할당하는 것이 바람직하다.
그후, 단계(724)에서, 비트 할당기(122)는 가장 높은 SMR을 갖는 (초기 서브 밴드 세트로부터)서브 밴드에 이용 가능한 할당 비트로부터 한 비트를 할당한다. 그 다음으로, 단계(726)에서, 비트 할당기(122)는 가장 높은 SMR 을 가지는 서브 밴드{단계(724)의 할당된 서브 밴드}로부터 6㏈을 감산한다. 단계(728)에서, 비트 할당기(122)는 임의의 이용 가능 할당 비트가 남아 있는지를 결정한다.
만약 이용 가능 할당 비트가 남아 있다면, 도 7 처리는 단계(724)로 복귀한다. 그러나, 만약 이용 가능 할당 비트가 남아 있지 않다면, 비트 할당기(122)는 필터링 된 오디오 데이터의 임의의 처리되지 않은 프레임이 남아 있는지를 결정한다. 처리 되지 않은 프레임이 남아 있지 않다면, 비트 할당기(122)는 모든 오디오 데이터에 비트를 할당하며 도 7 처리는 종료한다. 그러나, 만약 프레임이 단계(730)에 남아 있다면, 도 7 흐름도는 필터링 된 오디오 데이터의 다른 프레임을 처리하기 위해 단계(716)로 복귀한다.
본 발명은 바람직한 실시예를 참조하여 위에서 설명되어 왔다. 다른 실시예는 이 명세서의 관점에서 당업자에게는 명백할 것이다. 예를 들어, 본 발명은 위 바람직한 실시예에서 설명된 것과는 다른 구성 및 기술을 사용하여 용이하게 구현될 수 있다. 부가적으로, 본 발명은 바람직한 실시예로서 위에서 설명된 것과는 다른 시스템과 관련하여 효과적으로 사용될 수 있다. 그러므로, 바람직한 실시예에 대한 이들 변형 및 다른 변형이 첨부되는 청구 범위만에 의하여 제한되는 본 발명을 통해 포함되어야 한다.

Claims (44)

  1. 결함(artifacts)을 방지하는 시스템으로서,
    필터링된 데이터(120)에 대응하는 마스킹 임계값(masking thresholds)을 발생시키도록 구성된 모델러(modeler)(126)와,
    상기 필터링 된 데이터(120)에 있는 서브 밴드(sub-bands)를 나타내도록 디지털 비트를 선택적으로 할당하여서 상기 필터링 된 데이터(120)를 할당된 데이터(130)로 변환시키는 비트 할당기(122)를 포함하는, 결함을 방지하는 시스템.
  2. 제 1 항에 있어서, 상기 모델러(126)와 상기 비트 할당기(122)는 소스 오디오 데이터(116)를 인코딩 된 오디오 데이터(138)로 인코딩 하기 위한 인코더 장치(112)의 일부를 형성하는, 결함을 방지하는 시스템.
  3. 제 2 항에 있어서, 상기 소스 오디오 데이터(116)는 선형 펄스 코드 변조 포맷으로 수신되며 MPEG 포맷으로 된 인코딩 된 오디오 데이터(138)를 발생시키기 위해 상기 인코더 장치(112)를 통해 인코딩 되는, 결함을 방지하는 시스템.
  4. 제 2 항에 있어서, 상기 인코더 장치(112)는 상기 소스 오디오 데이터(116)의 데이터 샘플을 포함하는 프레임을 순차적으로 처리하는, 결함을 방지하는 시스템.
  5. 제 4 항에 있어서, 필터 뱅크는 상기 프레임을 수신하며 상기 각 프레임에 대해 서브 밴드를 응답으로 발생시키는, 결함을 방지하는 시스템.
  6. 제 5 항에 있어서, 상기 서브 밴드는 32개의 주파수 서브 밴드를 포함하는, 결함을 방지하는 시스템.
  7. 제 5 항에 있어서, 상기 모델러(126)는 사람의 청력의 특성에 기초하여 상기 소스 오디오 데이터(116)에 대한 상기 마스킹 임계값을 결정하는 사이코-음향 모델러인, 결함을 방지하는 시스템.
  8. 제 7 항에 있어서, 상기 마스킹 임계값은 신호 에너지 레벨을 나타내며 상기 신호 에너지 레벨 아래에서는 상기 필터링된 데이터(120)가 상기 비트 할당기(122)를 통해 처리되지 않는, 결함을 방지하는 시스템.
  9. 제 7 항에 있어서, 상기 사이코-음향 모델러는 상기 비트 할당기(122)에 신호대 마스킹비를 제공하며 상기 신호대 마스킹 임계값은 신호 에너지 값을 상기 마스킹 임계값으로 나눈 값과 같은, 결함을 방지하는 시스템.
  10. 제 9 항에 있어서, 상기 비트 할당기(122)는 상기 서브 밴드에 유한 개수의 이용 가능한 할당 비트를 할당하는, 결함을 방지하는 시스템.
  11. 제 10 항에 있어서, 상기 이용 가능 할당 비트는 상기 데이터 샘플을 샘플 레이트(sample rate)로 곱셈한 것과 같은, 결함을 방지하는 시스템.
  12. 제 5 항에 있어서, 상기 결함은 상기 프레임에 있는 할당된 서브 밴드의 크기(quantities) 사이의 불연속점에 의하여 야기되는 음성 결함인 결함을, 방지하는 시스템.
  13. 제 10 항에 있어서, 상기 비트 할당기(122)는
    최대 신호대 마스킹비 서브 밴드를 찾는 단계,
    상기 최대 신호대 마스킹비 서브 밴드에 한 비트를 할당하는 단계, 및
    상기 모든 이용 가능한 할당 비트가 상기 서브 밴드에 할당될 때까지, 상기 최대 신호대 마스킹비 서브 밴드로부터 6데시벨을 감산하는 단계를 반복함으로써, 상기 이용 가능한 할당 비트를 상기 할당된 서브 밴드에 할당하는, 결함을 방지하는 시스템.
  14. 제 12 항에 있어서, 상기 비트 할당기(122)는 상기 불연속점을 제거하기 위해 서브 밴드 구동 전략을 수행하는, 결함을 방지하는 시스템.
  15. 제 14 항에 있어서, 상기 서브 밴드 구동 전략은, 상기 비트 할당기(122)가 유의 이벤트를 검출하지 않는다면 상기 프레임들 사이의 상기 할당된 서브 밴드의 상기 크기를 유지하는, 결함을 방지하는 시스템.
  16. 제 15 항에 있어서, 상기 비트 할당기(122)는, 상기 프레임들 사이의 상기 할당된 서브 밴드의 상기 크기의 차이가 선택 가능한 임계값을 초과할 때마다 상기 유의 이벤트를 검출하는, 결함을 방지하는 시스템.
  17. 제 15 항에 있어서, 상기 서브 밴드 구동 전략은 상기 비트 할당기(122)가 상기 유의 이벤트를 검출하지 못할 때마다 예비 비트 할당 절차를 포함하는, 결함을 방지하는 시스템.
  18. 제 17 항에 있어서, 상기 비트 할당기(122)는 현 프레임에 대해 초기 서브 밴드 세트를 형성하기 위해 바로 앞선 프레임으로부터 상기 각 할당된 서브 밴드에 상기 이용 가능한 할당 비트로부터 한 비트를 할당하여서 상기 예비 비트 할당 절차를 수행하는, 결함을 방지하는 시스템.
  19. 제 18 항에 있어서, 상기 비트 할당기(122)는 상기 현 프레임에 대해 상기 예비 비트 할당 절차를 수행하며, 그후 상기 초기 서브 밴드 세트에 대해 최대 신호대 마스킹비 서브 밴드를 찾아내고,
    상기 최대 신호대 마스킹비 서브 밴드에 한 비트를 할당하며,
    상기 모든 이용 가능한 할당 비트가 상기 서브 밴드에 할당될 때마다. 상기 최대 신호대 마스킹비 서브밴드로부터 6데시벨을 감산하는 것을 반복하는, 결함을 방지하는 시스템.
  20. 제 2 항에 있어서, 상기 비트 할당기(122)는 양자화기(132)에 할당된 데이터(130)를 발생시키고, 상기 양자화기(132)는 응답으로 비트스트림 패커(136)에 양자화된 오디오 데이터(134)를 제공하고, 그후 비트스트림 패커(136)는 상기 인코딩 된 오디오 데이터(138)를 발생시키는, 결함을 방지하는 시스템.
  21. 결함(artifacts)을 방지하는 방법으로서,
    모델러(modeler)(126)를 사용하여 필터링 된 데이터(120)에 대응하는 마스킹 임계값(masking thresholds)을 발생시키는 단계와,
    상기 필터링 된 데이터(120)에 있는 서브 밴드를 나타내도록 디지털 비트를 선택적으로 할당함으로써 할당된 데이터(130)를 발생시키기 위해 비트 할당기(122)를 사용하여 상기 필터링된 데이터(120)를 변환시키는 단계를 포함하는, 결함을 방지하는 방법.
  22. 제 21 항에 있어서, 상기 모델러(126)와 상기 비트 할당기(122)는 소스 오디오 데이터(116)를 인코딩 된 오디오 데이터(138)로 인코딩 하기 위한 인코더 장치(112)의 일부를 형성하는, 결함을 방지하는 방법.
  23. 제 22 항에 있어서, 상기 소스 오디오 데이터(116)는 선형 펄스 코드 변조 포맷으로 수신되며, MPEG 포맷으로 된 인코딩된 오디오 데이터(138)를 발생시키기 위해 상기 인코더 장치(112)를 통해 인코딩 되는, 결함을 방지하는 방법.
  24. 제 22 항에 있어서, 상기 인코더 장치(112)는 상기 소스 오디오 데이터(116)의, 데이터 샘플을 포함하는, 프레임을 순차적으로 처리하는, 결함을 방지하는 방법.
  25. 제 24 항에 있어서, 필터 뱅크는 상기 프레임을 수신하며 응답으로 상기 각 프레임에 대해 서브 밴드를 생성하는, 결함을 방지하는 방법.
  26. 제 25 항에 있어서, 상기 서브 밴드는 32개의 주파수 서브 밴드를 포함하는, 결함을 방지하는 방법.
  27. 제 25 항에 있어서, 상기 모델러(126)는 사람의 청력의 특성에 기초하여 상기 소스 오디오 데이터(116)에 대한 상기 마스킹 임계값을 결정하는 사이코-음향 모델러인, 결함을 방지하는 방법.
  28. 제 27 항에 있어서, 상기 마스킹 임계값은 신호 에너지 레벨을 나타내며, 상기 신호 에너지 레벨 아래에서는 상기 필터링된 데이터(120)가 상기 비트 할당기(122)에 의하여 처리되지 않는, 결함을 방지하는 방법.
  29. 제 27 항에 있어서, 상기 사이코-음향 모델러는 상기 비트 할당기(122)에 신호대 마스킹비를 제공하는데, 상기 신호대 마스킹 임계값은 신호 에너지 값을 상기 마스킹 임계값으로 나눈 값과 같은, 결함을 방지하는 방법.
  30. 제 29 항에 있어서, 상기 비트 할당기(122)는 상기 서브 밴드에 유한 개수의 이용 가능한 할당 비트를 할당하는, 결함을 방지하는 방법.
  31. 제 30 항에 있어서, 상기 이용 가능한 할당 비트는 상기 데이터 샘플에 샘플 레이트를 곱한 값과 같은, 결함을 방지하는 방법.
  32. 제 25 항에 있어서, 상기 결함은 상기 프레임에 있는 할당된 서브 밴드의 크기들 사이의 불연속점에 의하여 야기되는 음성 결함인, 결함을 방지하는 방법.
  33. 제 30 항에 있어서, 상기 비트 할당기(122)는 최대 신호대 마스킹비 서브 밴드를 찾아내고,
    상기 최대 신호대 마스킹비 서브 밴드에 한 비트를 할당하며, 상기 모든 이용 가능한 할당 비트가 상기 서브 밴드에 할당될 때까지, 상기 최대 신호대 마스킹비 서브 밴드로부터 6데시벨을 감산하는 것을 반복함으로써, 상기 할당된 서브 밴드에 상기 이용 가능한 할당 비트를 할당하는, 결함을 방지하는 방법.
  34. 제 32 항에 있어서, 상기 비트 할당기(122)는 상기 불연속점을 제거하기 위해 서브 밴드 구동 전략을 수행하는, 결함을 방지하는 방법.
  35. 제 34 항에 있어서, 상기 서브 밴드 구동 전략은 상기 비트 할당기(122)가 할당한 유의 이벤트를 검출하지 못한다면, 상기 프레임들 사이의 상기 할당된 서브 밴드의 상기 크기를 유지하는, 결함을 방지하는 방법.
  36. 제 35 항에 있어서, 상기 비트 할당기(122)는 상기 프레임들 사이의 상기 할당된 서브 밴드의 상기 크기의 차이가 선택 가능한 임계값을 초과할 때마다 상기 유의 이벤트를 검출하는, 결함을 방지하는 방법.
  37. 제 35 항에 있어서, 상기 서브 밴드 구동 전략은 상기 비트 할당기(122)가 상기 유의 이벤트를 검출하지 못할 때마다 예비 비트 할당 절차를 포함하는, 결함을 방지하는 방법.
  38. 제 37 항에 있어서, 상기 비트 할당기(122)는 현 프레임에 대해 초기 서브 밴드 세트를 형성하기 위해 바로 앞선 프레임으로부터 상기 각 할당된 서브 밴드에 상기 이용 가능한 할당 비트로부터 한 비트를 할당함으로써 상기 예비 비트 할당 절차를 수행하는, 결함을 방지하는 방법.
  39. 제 38 항에 있어서, 상기 비트 할당기(122)는 상기 현 프레임에 대해 상기 예비 비트 할당 절차를 수행하며, 그후 상기 초기 서브 밴드 세트에 대해 최대 신호대 마스킹비 서브 밴드를 찾아내고,
    상기 최대 신호대 마스킹비 서브 밴드에 한 비트를 할당시키며,
    상기 모든 이용 가능한 할당 비트가 상기 서브 밴드에 할당될 때까지 상기 최대 신호대 마스킹비 서브 밴드로부터 6데시벨을 감산하는 것을 반복하는, 결함을 방지하는 방법.
  40. 제 22 항에 있어서, 상기 비트 할당기(122)는 양자화기(132)에 할당된 데이터(130)를 발생시키며, 상기 양자화기(132)는 응답으로 비트스트림 패커(136)에 양자화된 오디오 데이터(134)를 제공하며, 상기 비트스트림 패커(136)는 그후 상기 인코딩된 오디오 데이터(138)를 발생시키는, 결함을 방지하는 방법.
  41. 결함을 방지하는 시스템으로서,
    필터링된 데이터(120)에 대응하는 마스킹 임계값을 발생시키기 위한 수단과,
    상기 필터링된 데이터(120)에 있는 서브 밴드를 나타내도록 디지털 비트를 선택적으로 할당함으로써 할당된 데이터(130)를 발생시키기 위해 상기 필터링된 데이터(120)를 변환시키기 위한 수단을 포함하는, 결함을 방지하는 시스템.
  42. 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체로서,
    필터링된 데이터(120)에 대응하는 마스킹 임계값을 모델러(126)를 사용하여 발생시키는 단계와,
    상기 필터링된 데이터(120)에 있는 서브 밴드를 나타내도록 디지털 비트를 선택적으로 할당함으로써 할당된 데이터(130)를 발생시키기 위해 상기 필터링된 데이터(120)를 비트 할당기(122)를 사용하여 변환시키는 단계를 수행함으로써 결함을 방지하는, 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체.
  43. 제 42 항에 있어서, 상기 모델러(126)와 상기 비트 할당기(122)는 오디오 관리자 프로그램으로 제어되는, 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체.
  44. 제 42 항에 있어서, 상기 오디오 관리자 프로그램은 프로세서 장치에 의하여 실행되는 프로그램 명령을 포함하는, 컴퓨터 판독 가능 매체.
KR1020007008115A 1998-12-24 1999-12-14 오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법 KR20010034370A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/220,320 1998-12-24
US09/220,320 US6240379B1 (en) 1998-12-24 1998-12-24 System and method for preventing artifacts in an audio data encoder device
PCT/US1999/029685 WO2000039790A1 (en) 1998-12-24 1999-12-14 Adaptive bit allocation for audio encoder

Publications (1)

Publication Number Publication Date
KR20010034370A true KR20010034370A (ko) 2001-04-25

Family

ID=22823086

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007008115A KR20010034370A (ko) 1998-12-24 1999-12-14 오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법

Country Status (10)

Country Link
US (1) US6240379B1 (ko)
EP (1) EP1057173B1 (ko)
JP (1) JP2002533790A (ko)
KR (1) KR20010034370A (ko)
AT (1) ATE373856T1 (ko)
AU (1) AU2361700A (ko)
CA (1) CA2320171A1 (ko)
DE (1) DE69937140T2 (ko)
TW (1) TW454172B (ko)
WO (1) WO2000039790A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19907964C1 (de) * 1999-02-24 2000-08-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen eines verschlüsselten Datenstroms und Vorrichtung und Verfahren zum Erzeugen eines entschlüsselten Audio- und/oder Videosignals
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
EP1532734A4 (en) 2002-06-05 2008-10-01 Sonic Focus Inc ACOUSTIC VIRTUAL REALITY ENGINE AND ADVANCED TECHNIQUES FOR IMPROVING THE DELIVERED SOUND
KR100723400B1 (ko) * 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
US7627481B1 (en) * 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US8995559B2 (en) 2008-03-28 2015-03-31 Qualcomm Incorporated Signaling message transmission in a wireless communication network
US9276787B2 (en) 2008-03-28 2016-03-01 Qualcomm Incorporated Transmission of signaling messages using beacon signals
TWI484473B (zh) 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統
US8621246B2 (en) * 2009-12-23 2013-12-31 Intel Corporation Power management system and method to provide supply voltage to a load
US9672840B2 (en) * 2011-10-27 2017-06-06 Lg Electronics Inc. Method for encoding voice signal, method for decoding voice signal, and apparatus using same
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
JP6586804B2 (ja) * 2015-07-14 2019-10-09 富士通株式会社 符号化装置、符号化方法、及びプログラム
GB2565268B (en) * 2017-06-22 2021-11-24 Avago Tech Int Sales Pte Lid Apparatus and method for packing a bit stream

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2913731B2 (ja) 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
CA2075156A1 (en) 1991-08-02 1993-02-03 Kenzo Akagiri Digital encoder with dynamic quantization bit allocation
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
US5396497A (en) 1993-02-26 1995-03-07 Sony Corporation Synchronization of audio/video information
US5481543A (en) 1993-03-16 1996-01-02 Sony Corporation Rational input buffer arrangements for auxiliary information in video and audio signal processing systems
US5511054A (en) 1993-03-31 1996-04-23 Sony Corporation Apparatus and method for multiplexing encoded data signals and recording medium having multiplexed signals recorded thereon
JP3555149B2 (ja) 1993-10-28 2004-08-18 ソニー株式会社 オーディオ信号符号化方法及び装置、記録媒体、オーディオ信号復号化方法及び装置、
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5732391A (en) 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
EP0734021A3 (en) * 1995-03-23 1999-05-26 SICAN, GESELLSCHAFT FÜR SILIZIUM-ANWENDUNGEN UND CAD/CAT NIEDERSACHSEN mbH Method and apparatus for decoding of digital audio data coded in layer 1 or 2 of MPEG format
WO1996032710A1 (en) * 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
JP4223571B2 (ja) 1995-05-02 2009-02-12 ソニー株式会社 画像符号化方法及び装置
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification

Also Published As

Publication number Publication date
DE69937140T2 (de) 2008-06-19
DE69937140D1 (de) 2007-10-31
JP2002533790A (ja) 2002-10-08
US6240379B1 (en) 2001-05-29
EP1057173A1 (en) 2000-12-06
TW454172B (en) 2001-09-11
WO2000039790A1 (en) 2000-07-06
CA2320171A1 (en) 2000-07-06
EP1057173B1 (en) 2007-09-19
AU2361700A (en) 2000-07-31
ATE373856T1 (de) 2007-10-15

Similar Documents

Publication Publication Date Title
JP3131542B2 (ja) 符号化復号化装置
KR100277819B1 (ko) 심리음향성 적응 비트 할당을 이용한 다중 채널 예측 분할대역부호화기
KR100871999B1 (ko) 오디오 코딩
EP1080462B1 (en) System and method for entropy encoding quantized transform coefficients of a signal
RU2583717C1 (ru) Способ и система кодирования аудиоданных с адаптивной низкочастотной коррекцией
JP3765622B2 (ja) オーディオ符号化復号化システム
EP1419501A1 (en) An encoder programmed to add a data payload to a compressed digital audio frame
KR20010034370A (ko) 오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법
US20150179182A1 (en) Adaptive Quantization Noise Filtering of Decoded Audio Data
EP0772925B1 (en) Non-linearly quantizing an information signal
US7725323B2 (en) Device and process for encoding audio data
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6801886B1 (en) System and method for enhancing MPEG audio encoder quality
US6745162B1 (en) System and method for bit allocation in an audio encoder
US6418404B1 (en) System and method for effectively implementing fixed masking thresholds in an audio encoder device
JPH0537395A (ja) 帯域分割符号化方法
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
Liu et al. Audio coding standards
JP2001249699A (ja) 音声圧縮装置
JP2000293199A (ja) 音声符号化方法および記録再生装置
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
EP1176743A2 (en) Methods for non-linearly quantizing and dequantizing an information signal
JPH0746137A (ja) 音声高能率符号化装置
JPH0822298A (ja) 符号化装置および復号化装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid