KR100975522B1 - 스케일러블 오디오 복/부호화 방법 및 장치 - Google Patents

스케일러블 오디오 복/부호화 방법 및 장치 Download PDF

Info

Publication number
KR100975522B1
KR100975522B1 KR1020030075637A KR20030075637A KR100975522B1 KR 100975522 B1 KR100975522 B1 KR 100975522B1 KR 1020030075637 A KR1020030075637 A KR 1020030075637A KR 20030075637 A KR20030075637 A KR 20030075637A KR 100975522 B1 KR100975522 B1 KR 100975522B1
Authority
KR
South Korea
Prior art keywords
bitplane
decoding
data
unit
lossless
Prior art date
Application number
KR1020030075637A
Other languages
English (en)
Other versions
KR20050040441A (ko
Inventor
김중회
이시화
김상욱
오은미
김도형
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030075637A priority Critical patent/KR100975522B1/ko
Publication of KR20050040441A publication Critical patent/KR20050040441A/ko
Application granted granted Critical
Publication of KR100975522B1 publication Critical patent/KR100975522B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 스케일러블 오디오 복/부호화 방법 및 장치에 관한 것으로서, 그 부호화 방법은 시간/주파수 맵핑부, 심리음향부, 양자화부, 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 오디오 부호화기의 오디오 부호화 방법에 있어서 비트패킹부의 부호화할 데이터를 비트플레인 상에 매핑하는 과정; 소정 판단기준을 통해 부호화할 비트플레인을 선택하는 과정; 및 선택된 비트플레인의 데이터를 무손실 부호화하는 과정을 포함함을 특징으로 하며, 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하고 양자화 스텝사이즈 정보로 역양자화하고 역주파수/시간 매핑부를 거쳐 복호화된 오디오 신호생성방법 중 무손실 복호화 방법은 부가정보를 통해 비트 플레인 구조를 정의하는 과정; 적절한 판단기준을 통해 복호화할 비트플레인을 선택하는 과정; 및 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함한다.
본 발명에 의하면, 추가의 부가정보 없이 일부 비트스트림만을 이용하여 복호화시 부호화 순서를 변경함에 따른 음질 개선할 수 있으며 지각적으로 최적화된 음질 제공할 수 있다.

Description

스케일러블 오디오 복/부호화 방법 및 장치{Scalable audio decoding/ encoding method and apparatus}
도 1은 일반적인 scalable 오디오 부호화기의 블록도를 도시한 것이다.
도 2는 일반적인 scalable 오디오 복호화기의 블록도를 도시한 것이다.
도 3은 일반적인 scalability를 위한 비트플레인 부호화를 흐름도로 도시한 것이다.
도 4는 비트플레인의 중요도를 고려한 비트플레인 데이터 부호화를 흐름도로 도시한 것이다.
도 5는 부가정보를 이용하여 부호화 순서를 결정하여 scalability를 제공하는 오디오 부호화기의 블록도를 도시한 것이다.
도 6은 비트플레인의 중요도에 대한 부가정보를 고려한 비트플레인 데이터 부호화를 흐름도로 도시한 것이다.
도 7은 기존의 비트플레인 부호화 순서의 예를 나타내다.
도 9는 개선된 비트플레인 부호화 순서의 예를 나타낸다.
본 발명은 오디오 복호화/부호화에 관한 것으로서, 특히 스케일러블 오디오 복/부호화 방법 및 장치에 관한 것이다.
비트플레인 코딩은 MSB부터 LSB의 순서로 부호화를 수행하여 중요한 정보인 MSB를 먼저 부호화한다는데 있어서 scalability를 제공하기에 적절한 부호화 방식이다. 이렇게 부호화된 데이터를 MSB부터 복호화를 할 경우 전 대역에 대해 동일한 양의 노이즈를 줄여가며 복호화가 수행된다. 그러나 양자화된 스펙트럼 샘플들을 비트플레인 코딩을 적용하여 복호화 할 경우 양자화정보에 의해 복호화 하는 과정에서 노이즈가 어느 특정 주파수에 집중될 수도 있으며 이는 때에 따라 귀에 매우 거슬리게 하는 소리가 될 수 있다.
본 발명이 이루고자 하는 기술적 과제는 상술한 문제점을 제거하기 위해 노이즈가 어느 특정밴드에 집중되는 것을 막기 위해 비트플레인 부호화 순서를 조절하여 스케일러블 오디오 방식의 음질 개선을 위한, 스케일러블 오디오 복호화/부호화 방법 및 장치를 제공하는 것이다.
상기 기술적 과제를 이루기 위한 본 발명에 의한 스케일러블 오디오 부호화방법은 시간의 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 시간/주파수 맵핑부, 심리음향부, 양자화부 그리고 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 오디오 부호화기의 오디오 부호화 방법에 있어서 비트패 킹부의 부호화 해야 할 데이터를 비트플레인상에 매핑하는 과정; 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정; 및 선택된 비트플레인의 데이터를 무손실 부호화 하는 과정을 포함함을 특징으로 한다.
부호화해야 할 비트플레인을 선택하는 판단기준으로 양자화 스텝사이즈를 입력으로 함을 특징으로 한다. 부호화해야 할 비트플레인을 선택하는 판단기준으로 MSB와 지금까지 부호화된 샘플들 그리고 양자화 스텝사이즈를 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 고려하여 선택함을 특징으로 한다. 양자화기는 선형 혹은 비선형 양자화기를 사용함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한, 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하고 양자화 스텝사이즈 정보로 역양자화하고 역 주파수/시간 매핑부를 거쳐 복호화된 오디오 신호를 생성하는 방법 중 무손실 복호화 방법에 있어서,부가정보를 통해 비트 플레인 구조를 정의하는 과정; 적절한 판단기준을 통해 복호화 해야 할 비트플레인을 선택하는 과정; 및 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 한다. 복호화 해야 할 비트플레인을 선택하는 판단기준으로 양자화 스텝사이즈를 입력으로 함을 특징으로 한다. 복호화 해야 할 비트플레인을 선택하는 판단기준으로 MSB와 지금까지 복호화된 샘플들 그리고 양자화 스텝사이즈를 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인 을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 고려하여 선택함을 특징으로 한다. 역양자화기는 선형 혹은 비선형 역양자화기를 사용함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 스케일러블 오디오 부호화 방법은 시간의 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 시간/주파수 맵핑부, 심리음향부, 양자화부 그리고 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 오디오 부호화기의 부호화 방법에 있어서 심리음향 모델에서 각 주파수 성분들의 에러에 대한 주파수 민감도를 계산 하는 과정; 비트패킹부의 부호화 해야 할 데이터를 비트플레인상에 매핑하는 과정; 심리음향 모델에서 계산된 에러에 대한 주파수 민감도를 고려해 민감한 비트플레인부터 선택하는 과정; 선택된 비트플레인의 데이터를 무손실 부호화 하는 과정; 및 심리음향 모델에서 계산된 데이터를 복호화단에서 복호화 순서를 결정할 수 있도록 비트스트림에 무손실 부호화 하는 과정을 포함함을 특징으로 한다. 부호화해야 할 비트플레인을 선택하는 판단기준으로 심리음향 모델에서 구한 주파수 민감도를 입력으로 함을 특징으로 한다. 부호화해야 할 비트플레인을 선택하는 판단기준으로 심리음향 모델에서 구한주파수 민감도와 MSB와 지금까지 부호화된 샘플들 그리고 양자화 스텝사이즈를 입력으로 함을 특징으로 하는 스케일러블 오디오 부호화 방법. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러와 심리음향 모델 에서 계산된 주파수 성분의 민감도를 고려하여 선택함을 특징으로 한다. 양자화기는 선형 혹은 비선형 양자화기를 사용함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 스케일러블 오디오 복호화 방법은 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하고 양자화 스텝사이즈 정보로 역양자화하고 역 주파수/시간 매핑부를 거쳐 복호화된 오디오 신호를 생성하는 방법 중 무손실 복호화하는 방법에 있어서 부가정보를 통해 비트 플레인 구조를 정의하는 과정; 주파수 민감도를 복호화 순서를 결정하기 위해 비트스트림에서 무손실 복호화 하는 과정; 심리음향 모델에서 계산된 에러에 대한 주파수 민감도에 따라 민감한 비트플레인부터 선택하는 과정; 및 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 한다. 복호화 해야 할 비트플레인을 선택하는 판단기준으로 복호화된 주파수 민감도, MSB, 지금까지 복호화된 샘플들 그리고 양자화 스텝사이즈를 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러와 복호화된 주파수 민감도를 고려하여 선택함을 특징으로 한다. 역양자화기는 선형 혹은 비선형 역양자화기를 사용함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 스케일러블 오디오 부호화 방법은 시간의 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 정수화된 시간/주파수 맵핑부, 심리음향부, 그리고 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 무손실 오디오 부호화에서 비트패킹부의 부호화 해야 할 데이터를 비트플레인상에 매핑하는 과정; 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정; 및 선택된 비트플레인의 데이터를 무손실 부호화 하는 과정을 포함함을 특징으로 한다. 부호화 해야 할 비트플레인을 선택하는 판단기준으로 MSB와 지금까지 부호화된 샘플들을 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 고려하여 선택함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 스케일러블 오디오 복호화 방법에서 무손실 오디오 복호화 과정에 있어서 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하고 정수화된 역 주파수/시간 매핑부를 거쳐 복호화된 오디오 신호를 생성하는 방법 중 무손실 복호화하는 과정은 부가정보를 통해 비트 플레인 구조를 정의하는 과정; 적절한 판단기준을 통해 복호화 해야 할 비트플레인을 선택하는 과정; 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 한다. 복호화 해야 할 비트플레인을 선택하는 판단기준으로 복호화된 MSB, 지금까지 복호화된 샘플들을 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 고려하여 선택함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 스케일러블 오디오 부 호화 방법은 시간의 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 정수화된 시간/주파수 맵핑부, 심리음향부, 그리고 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 무손실 오디오 부호화에서 심리음향 모델에서 각 주파수 성분들의 에러에 대한 주파수 민감도를 계산 하는 과정; 비트패킹부의 부호화 해야 할 데이터를 비트플레인상에 매핑하는 과정, 심리음향 모델에서 계산된 에러에 대한 주파수 민감도를 고려해 민감한 비트플레인부터 선택하는 과정; 선택된 비트플레인의 데이터를 무손실 부호화 하는 과정; 및 심리음향 모델에서 계산된 데이터를 복호화단에서 복호화 순서를 결정할 수 있도록 비트스트림에 무손실 부호화 하는 과정을 포함함을 특징으로 한다. 부호화 해야 할 비트플레인을 선택하는 판단기준으로 주파수 민감도와 MSB와 지금까지 부호화된 샘플들을 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러와 주파수 민감도를 고려하여 선택함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 스케일러블 오디오 복호화 방법에서 무손실 오디오 복호화 과정에 있어서 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하고 정수화된 역 주파수/시간 매핑부를 거쳐 복호화된 오디오 신호를 생성하는 방법 중 무손실 복호화하는 과정은 부가정보를 통해 비트 플레인 구조를 정의하는 과정; 주파수 민감도를 복호화 순서를 결정하기 위해 비트스트림에서 무손실 복호화 하는 과정; 심리음향 모델에 서 계산된 에러에 대한 주파수 민감도에 따라 민감한 비트플레인부터 선택하는 과정; 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 한다. 복호화 해야 할 비트플레인을 선택하는 판단기준으로 주파수 민감도와 복호화된 MSB, 지금까지 복호화된 샘플들을 입력으로 함을 특징으로 한다. 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러와 주파수 민감도를 고려하여 선택함을 특징으로 한다.
스케일러블 오디오 복/부호화 방법은 Scalable를 제공하는 오디오 복/부호화 방식에서 비트플레인 코딩 방식에 있어서 복호화단에서 일부의 비트스트림으로 복호화 할 경우 복호화 되지 않은 하위 비트플레인의 데이터를 처리하여 원신호의 파워를 보존해준다. 상기 복/부호화 방법은 복호화되지 않은 하위 비트플레인의 데이터를 랜덤한 노이즈를 채워준다. 상기 복/부호화 방법은 복호화되지 않은 하위 비트플레인의 데이터를 하위 비트플레인에서 나올 수 있는 값들의 평균을 취해서 채워준다. 상기 복/부호화 방법은 평균값을 구할 때 선형 역양자화기인지 비선형 역양자화기인지 구별하여 실제 역양자화된 값들의 평균을 통해 계산한다.
본 발명에 의한 스케일러블 오디오 부호화 장치는 시간의 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 시간/주파수 맵핑부, 심리음향부, 양자화부 그리고 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 오디오 부호화기의 오디오 부호화 장치에 있어서, 비트패킹부의 부호화 해야 할 데이터 를 비트플레인상에 매핑하는 매핑부; 적절한 판단기준을 통해 부호화 해야 할 비트플레인을 선택하는 선택부; 및 선택된 비트플레인의 데이터를 무손실 부호화하는 무손실부호화부를 포함함을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한, 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하는 무손실 복호화부, 양자화 스텝사이즈 정보로 역양자화하는 역양자화부, 역 주파수/시간 매핑부를 거쳐 복호화된 오디오 신호를 생성하는 복호화장치 중 상기 무손실 복호화부는 부가정보를 통해 비트 플레인 구조를 정의하는 구조정의부; 적절한 판단기준을 통해 복호화 해야 할 비트플레인을 선택하는 선택부; 및 무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 데이터복원부를 포함함을 특징으로 한다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 스케일러블 오디오 복호화/부호화 방법 및 장치에 대해 상세히 설명한다.
정보를 포함하고 있는 파형은 원래 진폭에 있어서 연속적이고 시간상으로도 연속적인 아날로그(Analog) 신호이다. 따라서, 파형을 이산 신호로 표현하기 위해서 A/D(Analog-to-Digital) 변환이 필요하다. A/D 변환을 하기 위해서 두 가지의 과정을 필요로 한다. 하나는 시간상의 연속 신호를 이산 신호를 바꾸어 주는 표본화(Sampling)과정이고 다른 하나는 가능한 진폭의 수를 유한한 값으로 제한하기 위한 진폭 양자화 과정이다. 즉, 진폭의 양자화는 시간 n에서 입력 진폭 x(n)을 가능한 진폭의 유한한 집합중의 한 원소인 y(n)으로 변환해 주는 과정이다.
오디오 신호의 저장/복원 방식도 최근 디지탈 신호처리 기술의 발달에 의해 기존의 아날로그 신호를 표본화와 양자화 과정을 거쳐 디지탈 신호인 PCM(Pulse Code Modulation) 데이터로 변환하여 CD(Compact Disc)와 DAT(Digital Audio Tape)와 같은 기록/저장 매체에 신호를 저장해 둔 뒤 사용자가 필요시에 저장된 신호를 다시 재생해서 들을 수 있는 기술이 개발되어 일반인들에게 보편화되어 사용되고 있다. 이런 디지탈 방식에 의한 저장/복원 방식은 LP(Long-Play Record)와 Tape와 같은 아날로그 방식에 비해 음질의 향상과 저장 기간에 따른 열화를 극복하였으나 디지탈 데이타의 크기가 많아 저장 및 전송에 문제를 보였다.
이러한 문제를 해결하기 위해 디지탈 음성 신호를 압축하기 위해 개발된 DPCM(Differential Pulse Code Modulaton)이나 ADPCM(Adaptive Differential Pulse Code Modulation)등의 방법을 사용하여 데이타의 양을 줄이려는 노력이 있었으나 신호의 종류에 따라 효율성이 크게 차이가 나는 단점을 보였다. 최근 ISO (International Standard Organization)에 의해 표준화 작업이 이루어진 MPEG/audio(Moving Pictures Expert Group)기법이나 Dolby에 의해 개발된 AC-2/AC-3 기법에서는 인간의 심리음향 모델(Psychoacoustic Model)를 이용하여 데이타의 양을 줄이는 방법을 사용했다. 이러한 방법은 신호의 특성에 관계없이 효율적으로 데이타의 양을 줄이는데 크게 기여하였다.
MPEG-1/audio, MPEG-2/audio나 AC-2/AC-3등과 같은 기존의 오디오 신호 압축 기법에서는 시간영역의 신호를 일정할 크기의 블럭으로 묶어서 주파수 영역의 신호로 변환을 한다. 그리고 이 변환된 신호를 인간의 심리음향 모델(Psychoacoustic Model)를 이용하여 스칼라 양자화를 한다. 이런 양자화 기법은 단순하지만 입력 샘 플이 통계적으로 독립적이라고 할 지라도 최적은 아니다. 물론 입력 샘플이 통계적으로 종속적이라면 더욱 불충분하다. 이런 문제점 때문에 Entropy 부호화와 같은 무손실 부호화나 어떤 종류의 적응 양자화를 포함하여 부호화를 수행한다. 따라서, 단순한 PCM 데이터만을 저장하던 방식보다는 상당히 복잡한 과정을 거치고 비트스트림은 양자화된 PCM 데이터뿐만 아니라 신호를 압축하기 위한 부가적인 정보들로 구성되어 있다.
MPEG/audio 표준이나 AC-2/AC-3 방식은 기존의 디지탈 부호화에 비해 1/6내지 1/8로 줄어든64Kbps-384Kbps의 비트율로 컴팩트디스크(Compact Disc) 음질과 거의 같은 정도의 음질을 제공한다. 이런 이유때문에, MPEG/audio 표준은 DAB(Digital Audio Broadcasting), internet phone, AOD(Audio on Demand) 와 멀티미디어 시스템과 같은 오디오 신호의 저장과 전송에 중요한 역할을 할 것이다.
이런 기존의 기법들은 부호화기에서 고정된 비트율이 주어지고 주어진 비트율에 최적의 상태를 찾아 양자화와 부호화 과정을 거치기 때문에 고정된 비트율을 사용할 경우에는 상당히 좋은 방안을 제시한다. 하지만, 멀티미디어 시대가 도래함과 더불어 기존의 낮은 비트율 부호화뿐 아니라 여러가지 기능성을 가지고 있는 부호화기/복호화기에 대한 요구가 많아지고 있다. 그 요구중의 하나가 비트율의 크기 조절이 가능한 오디오 부호화/복호화기이다. 비트율 조절이 가능한 오디오 부호화기는 높은 비트율로 부호화된 비트스트림을 낮은 비트율의 비트스트림으로 만들 수도 있고 그 중 일부의 비트스트림만을 가지고 복원을 할 수 있음으로써 네트워크에서 과부화가 걸릴 경우, 복호화기에의 성능이 좋지 않을 경우, 또는 사용자의 요구 에 의해 비트율이 낮아질 경우에는 비트스트림의 일부만을 가지고 비트율이 낮아진만큼 성능의 열화를 보이겠지만 어느 정도의 성능으로 사용자에게 신호를 복원해 줄 수 있어야 한다.
MPEG-4 version2 MAUI profile의 ER-BSAC는 FGS를 제공하는 표준화된 유일한 기술로서 1kbps 단위의 scalability를 제공한다. BSAC는 추가적인 오버헤드 없이 FGS라는 기능을 제공하므로 top layer에서는 scalable 하지 않은 AAC과 동일한 음질을 제공할 수 있다. BSAC에서 scalability를 적용하여 비트스트림의 일부로 복호화 할 경우에는 음질 저하는 피할 수 없는 현상이다. 본 발명에서는 위에서 언급한 바와 같이 비트스트림의 일부로 복호화 할 경우, 즉 scalability를 적용하여 복호화 할 경우 음질 열화를 최소화 할 수 있는 방법을 제공한다.
본 발명 중 부가정보를 없이 부호화 순서를 결정하는 부호화기는 도 1과 같이 일반적인 scalable 오디오 부호화기에서 있어서 시간축의 데이터를 주파수축의 데이터로 변환하는 부분(101), 심리음향모델을 계산하는 부분(102) 변환된 주파수축의 데이터를 비트레이트와 심리음향모델로 부터의 정보로 양자화하는 부분(103) 그리고 scalability를 제공할수 있도록 데이터를 변환하여 무손실 부호화를 하는 부분(104)을 포함하여 구성되어 있다. 상기 참조번호 104는 도 3의 양자화된 샘플을 비트 플레인상에 매핑하는 부분(401), 샘플별 MSB를 구하는 부분(402), MSB와 양자화 정보 그리고 이미 부호화된 상위 비트플레인 값을 이용하여 먼저 부호화해야 하는 샘플을 선택하는 부분(403), 선택된 샘플을 부호화 단위 만큼 부호화 하는 부분(404), 부호화된 만큼 MSB를 감소시키는 부분(405), 모든 샘플이 부호화 되었 는지 비교하는 부분(406)으로 구성되어 있다.
그리고 복호화기는 도 2와 같이 일반적인 scalable 오디오 복호화기에서 있어서 비트스트림으로부터 데이터를 복호화하여 양자화된 스펙트럼과 부가 정보를 얻는 부분(201), 양자화된 데이터를 역양자화하는 부분(202), 주파수상의 데이터를 시간축으로 변환하는 부분(203)를 포함하여 구성되어 있으며 비트스트림으로부터 데이터를 복호화하여 양자화된 스펙트럼과 부가 정보를 얻는 부분(201)에서는 104의 역과정을 통하여 복호화 하는 과정이 포함된다.
부가정보를 이용하여 부호화 순서를 결정하는 부호화기는 도 5와 같이 scalable 오디오 부호화기에서 있어서 시간축의 데이터를 주파수축의 데이터로 변환하는 부분(501), 심리음향모델을 계산하는 부분(502), 변환된 주파수축의 데이터를 비트레이트와 심리음향모델로 부터의 정보로 양자화하는 부분(503), 심리음향모델과 양자화 정보 그리고 양자화 샘플을 이용하여 순서를 결정하는 scalability 부가 정보를 생성하는 부분(505), 그리고 scalability 부가정보를 이용하여 scalability를 제공할수 있도록 데이터를 변환하여 무손실 부호화를 하는 부분(504)을 포함하여 구성된다. 상기 참조번호 504는 도 3의 양자화된 샘플을 비트 플레인상에 매핑하는 부분(601), 샘플별 MSB를 구하는 부분(602), MSB와 scalability 부가정보를 이용하여 먼저 부호화해야 하는 샘플을 선택하는 부분(603), 선택된 샘플을 부호화 단위 만큼 부호화 하는 부분(604), 부호화된 만큼 MSB를 감소시키는 부분(605),모든 샘플이 부호화 되었는지 비교하는 부분(606)으로 구성되어 있다.
scalable 오디오 부호화 방식은 도 1과 같이 변환부(101)에서는 시간축의 데이터를 주파수축으로 변환하고 심리음향모델(102)에서는 SMR(signal to masking ratio)를 구하여 양자화기의 입력으로 들어간다. 양자화와 비트제어부(103)에서는 비트수에 맞도록 SMR을 참고하여 양자화를 수행한다. scalable 비트패킹부(104)에서는 양자화된 샘플과 부가정보를 무손실 부호화한다. scalable 비트패킹부에서는 기본적으로 계층구조를 가지고 있으며 저주파수에서 고주파로 MSB에서 LSB순서로 부호화 된다.
비트플레인 코딩은 MSB 데이터부터 부호화 하기 때문에 scalability를 제공하기에 적합한 코딩방식이다. 그러나 MSB부터 LSB의 순서로 부호화하고 생성된 비트스트림의 일부로 복호화를 수행할 때 복호화되지 않은 부분에 따른 노이즈의 분포가 양자화정보, 상위 비트플레인의 값에 따라 다르게 되며 때에 따라서는 특정 주파수 대역에 노이즈가 집중되어 귀에 거슬리는 노이즈를 유발할 수도 있다. 즉, MSB에서 LSB의 순서로 부호화하는 개념은 맞으나 주파수축상에서 단순히 MSB가 큰 성분부터 부호화하는 것이 오히려 음질의 저하를 불러 일으킬 수 있다. 다음식에서 보는 바와 같이 노이즈의 정도는 단순히 MSB에 의존되는 것이 아니라 양자화정보와 상위 비트플레인의 값에 따라 결정된다. 여기에서는 비선형 양자화기를 사용한다고 가정한다.
Figure 112003040471597-pat00001
f는 주파수성분을 의미하고 sf는 양자화 스텝사이즈, α는 1보다 작은 수, β는 rounding을 위한 offset으로 양자화기를 위와 같이 정의하고
Figure 112003040471597-pat00002
역양자화기에서는 는 역양자화된 주파수 성분 값으로 복원이 된다.
양자화 샘플q가 5라고 가정한다면 101b로 표현이 가능하며 비트플레인 코딩에 의해 MSB-1까지만 복호화가 되었을 경우 복호화된 q는 100b로 표현이 되며 이때 LSB 끝까지 복호화 했을 때와의 에러는
Figure 112003040471597-pat00003
와 같이 구할 수 있으며 수식에서 보는 바와 같이 에러는 1XXb의 값과 sf에 함수로 표현된다.
부호화기 단에서 부호화 순서를 결정하는데 있어서 정보는 현재까지 부호화된 정보로부터 다음 비트플레인의 데이터를 부호화 할 경우 줄여 줄 수 있는 에러가 가장 큰 샘플부터 선택하여 부호화 하면 특정밴드에 노이즈가 분포하는 것을 피하고 음질 개선을 꾀할 수 있다. 다음은 부호화기 단에서 부호화 순서를 결정하기 위해 에러를 계산하는 방식의 한 예이다.
Figure 112003040471597-pat00004
은 현재 까지 부호화된 비트플레인상의 값이며 curSig는 현재 부호화 해야 할 비트플레인이다. q+(1<<curSig) 는 현재 부호화 할 하위 비트 플레인이 모두 1로 부호화 되었을 경우보다 1이 큰 경우이며 이와 모두 0으로 부호화 되었을 때의 값의 차이는 하위 비트플레인이 부호화 되지 않아 생길 수 있는 평균 예측 에러이다. 비트플레인 데이터 부호화의 순서는 예측 에러가 큰 데이터부터 먼저 수행된다. 에러 예측방식은 비선형양자화기 일 경우 부분선형화를 통하여 복잡도를 줄여 계산할 수 있다. 선형양자화기를 이용할 때도 비슷한 방법으로 에러를 예측할 수 있으며 같은 방법으로 부호화순서를 결정할 수 있다.
또 다른 비트플레인 부호화 순서를 결정하기 위한 방법으로는 부호화기단에서 부호화 순서에 대한 scalability 부가정보를 추가를 전달함으로써 가능해진다. 심리음향 모델의 출력으로 SMR과 양자화기에서 계산되어진 NMR에 따라 마스킹 역치보다 노이즈가 민감한 부분에 대해서는 먼저 부호화하도록 부가 정보를 생성한다. 부가정보는 양자화 단위로 전송될 수 있고 특정 무손실부호화 단위와 같은 단위로 전달되어 질 수 있다. 도5에서와 같이 505에서 순서에 대한 정보를 생성하고 부호화시 사용되며 이 부가정보 또한 비트스트림에 저장된다.
도 7은 기존의 MSB를 고려하여 비트플레인 코딩을 할 경우의 부호화 순서이다. 도 8은 위에서 언급한 예측에러 혹은 심리음향모델로부터 에러 민감도에 의해 결정된 부호화 순서에 따라 부호화한 결과이다. 중요도는 위에서 구한 데이터로부터 계산이 된다. 세번째 밴드의 중요도가 가장 높으므로 상대적으로 다른 밴드에 비해 먼저 코딩되며 중요도는 복호화시 노이즈 분포를 제어할 수 있는 인자가 된다.
위와 같은 기술은 무손실 오디오 압축에서도 적용 가능하다. 무손실 압축을 하기 위해서는 정수화된 시간/주파수 변환부를 이용하여 정수의 주파수 성분을 계산하고 이를 양자화 하지 않고 바로 무손실 압축해야 한다. 무손실 압축의 방식으로 위와 동일하게 비트플레인 코딩이 사용될 수 있으며 위와 같은 식을 동일 하게 적용하여 개선된 scalable 기술을 제공할 수 있다.
일반적으로 비트플레인 코딩을 하여 scalability를 구현하는 경우 , 일부의 비트스트림으로 복호화를 수행할 때 비트플레인상의 데이터들은 모두 복호화 되지 않는다. 이러한 경우에는 하위 비트플레인의 값이 모두 0으로 채워지기 때문에 원 신호의 파워보다 작아 질 수 밖에 없다. 이러한 문제를 해결하기 위해서는 하위 비트플레인상의 데이터를 임의의 노이즈로 채워주면 파워가 작아 지는 것을 막을 수 있다. 가장 간단한 방법으로는 복호화된 비트플레인의 바로 아래 비트플레인의 데이터를 1로 세팅하면 비트플레인상에서 하위 비트 플레인 값들의 평균을 채워 주는 것이므로 음질의 열화 없이 원 신호의 파워를 최대한 보존해 줄 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술 적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
본 발명에 의한 스케일러블 오디오 복호화/부호화 방법 방법 및 장치에 의하면, 추가의 부가정보 없이 일부의 비트스트림만을 이용하여 복호화 할 경우 부호화 순서를 변경함에 따른 음질 개선할 수 있다. 그리고 부호화기에서 심리음향모델을 고려하여 부가정보를 생성하여 일부의 비트스트림만을 이용하여 복호화시 지각적으로 최적화된 음질 제공할 수 있다. 또한 부호화 순서를 바꿈에도 기존의 무손실 부호화 방식의 모델, 심볼 생성 방식을 그대로 이용 가능하다.

Claims (37)

  1. 시간 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 시간/주파수 맵핑부, 심리음향부, 양자화부 및 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 오디오 부호화기의 오디오 부호화 방법에 있어서,
    양자화된 데이터를 비트플레인상에 매핑하는 과정;
    샘플별 MSB, 양자화정보 및 이미 부호화된 비트플레인의 데이터를 이용하여 부호화해야 할 비트플레인을 선택하는 과정; 및
    선택된 비트플레인의 데이터를 무손실 부호화하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 부호화 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 부호화해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 부호화 방법.
  5. 제1항에 있어서, 상기 양자화부는 선형 혹은 비선형 양자화기를 사용함을 특징으로 하는 스케일러블 오디오 부호화 방법.
  6. 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화과정, 역양자화과정 및 역 주파수/시간 매핑과정을 거쳐 복호화된 오디오 신호를 생성하는 스케일러블 오디오 복호화방법에 있어서 상기 무손실 복호화과정은,
    부가정보를 통해 비트 플레인 구조를 정의하는 과정;
    샘플별 MSB, 양자화정보 및 이미 복호화된 비트플레인의 데이터를 이용하여 복호화해야 할 비트플레인을 선택하는 과정; 및
    무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 복호화 방법.
  7. 삭제
  8. 삭제
  9. 제6항에 있어서, 상기 복호화해야 할 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 복호화 방법.
  10. 제6항에 있어서, 상기 역양자화과정은 선형 혹은 비선형 역양자화기를 사용함을 특징으로 하는 스케일러블 오디오 복호화 방법.
  11. 시간 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 시간/주파수 맵핑부, 심리음향부, 및 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 스케일러블 오디오 부호화기의 오디오 부호화 방법에 있어서,
    심리음향 모델에서 각 주파수 성분들의 에러에 대한 주파수 민감도를 계산 하는 과정;
    양자화된 데이터를 비트플레인상에 매핑하는 과정;
    상기 심리음향 모델에서 계산된 에러에 대한 주파수 민감도를 고려해 민감한 비트플레인부터 선택하는 과정;
    선택된 비트플레인의 데이터를 무손실 부호화하는 과정; 및
    상기 심리음향 모델에서 계산된 데이터를 복호화단에서 복호화 순서를 결정할 수 있도록 비트스트림에 무손실 부호화 하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 부호화방법.
  12. 삭제
  13. 삭제
  14. 제11항에 있어서, 상기 부호화 해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 부호화방법.
  15. 제11항에 있어서, 상기 양자화된 데이터는 선형 혹은 비선형 양자화기를 사용하여 얻어진 것임을 특징으로 하는 스케일러블 오디오 부호화방법.
  16. 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화과정, 역양자화과정 및 역 주파수/시간 매핑과정을 거쳐 복호화된 오디오 신호를 생성하는 스케일러블 오디오 복호화방법에 있어서 상기 무손실 복호화과정은
    부가정보를 통해 비트 플레인 구조를 정의하는 과정;
    주파수 민감도를 복호화 순서를 결정하기 위해 비트스트림에서 무손실 복호화 하는 과정;
    심리음향 모델에서 계산된 에러에 대한 주파수 민감도에 따라 민감한 비트플레인부터 선택하는 과정; 및
    무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 복호화방법.
  17. 삭제
  18. 제16항에 있어서, 상기 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 복호화방법.
  19. 제16항에 있어서, 상기 역양자화과정은 선형 혹은 비선형 역양자화기를 사용함을 특징으로 하는 스케일러블 오디오 복호화방법.
  20. 시간 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 정수화된 시간/주파수 맵핑부, 심리음향부, 그리고 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 스케일러블 오디오 부호화기에 있어서,
    부호화 해야 할 데이터를 비트플레인상에 매핑하는 과정;
    샘플별 MSB 및 이미 부호화된 비트플레인의 데이터를 이용하여 부호화해야 할 비트플레인을 선택하는 과정; 및
    선택된 비트플레인의 데이터를 무손실 부호화 하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 부호화방법.
  21. 삭제
  22. 제20항에 있어서, 상기 부호화해야 할 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 부호화방법.
  23. 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화과정 및 정수화된 역 주파수/시간 매핑과정을 거쳐 복호화된 오디오 신호를 생성하는 방법 중 상기 무손실 복호화과정은
    부가정보를 통해 비트 플레인 구조를 정의하는 과정;
    샘플별 MSB 및 이미 복호화된 비트플레인의 데이터를 이용하여 복호화해야 할 비트플레인을 선택하는 과정; 및
    무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 복호화방법.
  24. 삭제
  25. 제23항에 있어서, 상기 복호화해야 할 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 복호화방법.
  26. 시간 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 정수화된 시간/주파수 맵핑부, 심리음향부, 및 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 무손실 오디오 부호화기에 있어서,
    심리음향 모델에서 각 주파수 성분들의 에러에 대한 주파수 민감도를 계산 하는 과정;
    부호화 해야 할 데이터를 비트플레인상에 매핑하는 과정,
    상기 심리음향 모델에서 계산된 에러에 대한 주파수 민감도를 고려해 민감한 비트플레인부터 선택하는 과정;
    선택된 비트플레인의 데이터를 무손실 부호화 하는 과정; 및
    상기 심리음향 모델에서 계산된 데이터를 복호화단에서 복호화 순서를 결정할 수 있도록 비트스트림에 무손실 부호화하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 부호화방법.
  27. 삭제
  28. 제26항에 있어서, 상기 비트플레인을 선택하는 과정에서 비트플레인 부호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 부호화방법.
  29. 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화과정, 및 정수화된 역 주파수/시간 매핑과정을 거쳐 복호화된 오디오 신호를 생성하는 스케일러블 오디오 복호화방법에 있어서, 상기 무손실 복호화과정은
    부가정보를 통해 비트 플레인 구조를 정의하는 과정;
    주파수 민감도를 복호화 순서를 결정하기 위해 비트스트림에서 무손실 복호화 하는 과정;
    심리음향 모델에서 계산된 에러에 대한 주파수 민감도에 따라 민감한 비트플레인부터 선택하는 과정; 및
    무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 과정을 포함함을 특징으로 하는 스케일러블 오디오 복호화방법.
  30. 삭제
  31. 제29항에 있어서, 상기 비트플레인을 선택하는 과정에서 비트플레인 복호화시 낮은 비트플레인의 정보가 전송되지 않아 일어날 수 있는 에러를 더 고려하여 선택함을 특징으로 하는 스케일러블 오디오 복호화방법.
  32. 스케일러빌러티(scalability)를 제공하는 오디오 복호화방법에 있어서,
    복호화단에서 일부의 비트스트림으로 복호화할 경우 복호화되지 않은 하위 비트플레인의 데이터를 랜덤한 노이즈 혹은 하위 비트플레인에서 나올 수 있는 값들의 평균으로 채워줌으로써 원신호의 파워를 보존해주는 오디오 복호화방법.
  33. 삭제
  34. 삭제
  35. 제32항에 있어서, 상기 평균을 구할 때 선형 역양자화기인지 비선형 역양자화기인지 구별하여 실제 역양자화된 값들의 평균을 통해 계산하는 오디오 복호화방법.
  36. 시간 영역의 입력 오디오 신호를 주파수 영역의 신호로 변환해 주는 시간/주파수 맵핑부, 심리음향부, 양자화부 및 비트율 조절이 가능하도록 계층적으로 부호화하는 비트율 조절이 가능한 계층적 구조를 가진 비트스트스림을 생성해주는 비트패킹부로 구성된 스케일러블 오디오 부호화장치에 있어서 상기 비트패킹부는,
    부호화 해야 할 데이터를 비트플레인상에 매핑하는 매핑부;
    샘플별 MSB, 양자화정보 및 이미 부호화된 비트플레인의 데이터를 이용하여 부호화 해야 할 비트플레인을 선택하는 선택부; 및
    선택된 비트플레인의 데이터를 무손실 부호화하는 무손실부호화부를 포함함을 특징으로 하는 스케일러블 오디오 부호화장치.
  37. 비트율이 조절 가능하도록 계층적으로 부호화된 비트스트림으로부터 무손실 복호화하는 무손실 복호화부, 양자화 스텝사이즈 정보로 역양자화하는 역양자화부, 역 주파수/시간 매핑부를 거쳐 복호화된 오디오 신호를 생성하는 스케일러블 오디오 복호화장치에 있어서 상기 무손실 복호화부는
    부가정보를 통해 비트 플레인 구조를 정의하는 구조정의부;
    샘플별 MSB, 양자화정보 및 이미 복호화된 비트플레인의 데이터를 이용하여 복호화 해야 할 비트플레인을 선택하는 선택부; 및
    무손실 복호화를 통해 선택된 비트플레인의 데이터를 복원하는 데이터복원부를 포함함을 특징으로 하는 스케일러블 오디오 복호화장치.
    .
KR1020030075637A 2003-10-28 2003-10-28 스케일러블 오디오 복/부호화 방법 및 장치 KR100975522B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030075637A KR100975522B1 (ko) 2003-10-28 2003-10-28 스케일러블 오디오 복/부호화 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030075637A KR100975522B1 (ko) 2003-10-28 2003-10-28 스케일러블 오디오 복/부호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20050040441A KR20050040441A (ko) 2005-05-03
KR100975522B1 true KR100975522B1 (ko) 2010-08-13

Family

ID=37242262

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030075637A KR100975522B1 (ko) 2003-10-28 2003-10-28 스케일러블 오디오 복/부호화 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100975522B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100813269B1 (ko) * 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101432104B1 (ko) * 2010-11-10 2014-09-23 에스케이텔레콤 주식회사 마스킹 효과를 고려한 음파 통신 시스템 및 방법, 그리고 이에 적용되는 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970019124A (ko) * 1995-09-22 1997-04-30 김광호 비트스트림의 스케일 조절이 가능한 오디오 부호화/복호화방법 및 장치
KR970031362A (ko) * 1995-11-06 1997-06-26 김광호 디지탈 오디오 부호화방법
KR20030073279A (ko) * 2002-03-09 2003-09-19 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
KR20040086880A (ko) * 2003-03-22 2004-10-13 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970019124A (ko) * 1995-09-22 1997-04-30 김광호 비트스트림의 스케일 조절이 가능한 오디오 부호화/복호화방법 및 장치
KR970031362A (ko) * 1995-11-06 1997-06-26 김광호 디지탈 오디오 부호화방법
KR20030073279A (ko) * 2002-03-09 2003-09-19 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
KR20040086880A (ko) * 2003-03-22 2004-10-13 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
KR20050040441A (ko) 2005-05-03

Similar Documents

Publication Publication Date Title
KR100261253B1 (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6092041A (en) System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
KR100571824B1 (ko) 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
US7668723B2 (en) Scalable lossless audio codec and authoring tool
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
KR100908117B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
EP1715476A1 (en) Low-bitrate encoding/decoding method and system
KR19990041072A (ko) 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR19990041073A (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
KR101207110B1 (ko) 스케일러블 무손실 비트스트림의 인코딩 방법
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
Yu et al. A fine granular scalable to lossless audio coder
KR100738109B1 (ko) 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
Liebchen An introduction to MPEG-4 audio lossless coding
KR100975522B1 (ko) 스케일러블 오디오 복/부호화 방법 및 장치
US6549147B1 (en) Methods, apparatuses and recorded medium for reversible encoding and decoding
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
KR100765747B1 (ko) 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
KR20040051369A (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR101421256B1 (ko) 휴대용 단말기의 대역 확장 기법을 이용한 부호화 장치 및방법
KR100940532B1 (ko) 저비트율 복호화방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee