KR20060135268A - 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치 - Google Patents

오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
KR20060135268A
KR20060135268A KR1020050055116A KR20050055116A KR20060135268A KR 20060135268 A KR20060135268 A KR 20060135268A KR 1020050055116 A KR1020050055116 A KR 1020050055116A KR 20050055116 A KR20050055116 A KR 20050055116A KR 20060135268 A KR20060135268 A KR 20060135268A
Authority
KR
South Korea
Prior art keywords
audio signal
bitstream
frame length
data
bits
Prior art date
Application number
KR1020050055116A
Other languages
English (en)
Other versions
KR100718132B1 (ko
Inventor
김상욱
김도형
김미영
레이 미아오
이시화
얀건신
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050055116A priority Critical patent/KR100718132B1/ko
Priority to US11/445,312 priority patent/US7869891B2/en
Priority to CNA2006100931314A priority patent/CN1885724A/zh
Publication of KR20060135268A publication Critical patent/KR20060135268A/ko
Application granted granted Critical
Publication of KR100718132B1 publication Critical patent/KR100718132B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호 처리 장치에서, 부호화된 오디오 신호에 부호화 정보를 부가하여 비트스트림으로 생성하는 방법 및 장치, 그를 이용한 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것이다. 그 비트스트림 생성 방법은 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그(flag)를 생성하는 단계; 생성된 플래그를 포함하여 비트스트림의 헤더(header)를 생성하는 단계; 및 생성된 헤더와 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 단계를 포함한다.
본 발명에 의하면, 오디오 신호를 부호화/복호화하고자 하는 경우, 오디오 신호가 다채널 신호인지 여부에 대한 정보를 가지는 플래그를 비트스트림의 헤더 부분에 포함시킴으로써 신호 특성에 따른 효율적이고 신속한 부호화/복호화가 가능하도록 할 수 있다, 또한, 비트스트림의 프레임 길이에 대한 정보를 가지는 데이터의 비트수를 오디오 신호의 특성에 따라 가변적으로 설정할 수 있도록 함으로써, 부호화/복호화의 효율을 높이는 동시에 처리 가능한 오디오 신호의 채널 수를 용이하게 확장할 수 있다.

Description

오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한 부호화/복호화 방법 및 장치{Method and apparatus for generating bitstream of audio signal, audio encoding/decoding method and apparatus thereof}
도 1은 일반적인 오디오 신호 부호화 장치의 구성을 나타내는 블록도이다.
도 2는 종래의 다채널 오디오 신호에 적용 가능한 오디오 신호의 비트스트림 구조에 대한 제1 예를 도시한 도면이다.
도 3은 종래의 다채널 오디오 신호에 적용 가능한 오디오 신호의 비트스트림 구조에 대한 제2 예를 도시한 도면이다.
도 4는 본 발명에 따른 오디오 신호 부호화 장치의 전체적인 구성을 나타내는 블록도이다.
도 5는 도 4의 비트스트림을 생성하는 비트팩킹부에 대한 실시예를 나타내는 블록도이다.
도 6은 본 발명에 따른 오디오 신호의 비트스트림 데이터 구조를 도시한 도면이다.
도 7a, b, c는 비트스트림의 프레임 길이에 대한 정보를 가지는 데이터의 비트수를 가변적으로 설정하는 방법을 설명하기 위한 도면이다.
도 8a, b, c는 비트스트림의 프레임 길이에 대한 정보를 가지는 데이터의 비 트수를 가변적으로 설정하는 방법에 대한 실시예들이다.
도 9는 본 발명에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 10은 본 발명에 따른 오디오 신호의 복호화 장치의 전체적인 구성을 나타내는 블록도이다.
도 11은 본 발명에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
본 발명은 오디오 신호 처리에 관한 것으로서, 특히 다채널 오디오 신호로 용이하게 확장 가능하며, 오디오 신호 처리 속도의 증가 및 오디오 신호의 채널 별 병렬 처리가 가능하도록 하는 비트스트림 생성 방법 및 장치, 그를 이용한 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것이다.
도 1은 일반적인 오디오 신호의 부호화 장치의 구성을 블록도로 도시한 것으로, 도시된 부호화 장치는 시간/주파수맵핑부(100), 심리음향모델링부(110), 데이터프로세싱부(120), 양자화부(130) 및 비트스트림생성부(140)를 포함하여 이루어진다.
시간/주파수맵핑부(100)는 시간영역의 오디오 신호를 주파수영역의 신호로 변환하는 역할을 한다. 시간상으로 인간이 인지하는 신호의 특성의 차이가 그리 크지 않지만, 이렇게 변환된 주파수 영역의 신호들은 인간의 음향심리모델에 따라 각 대역에서 인간이 느낄 수 있는 신호와 느낄 수 없는 신호의 차이가 크기 때문에 각 주파수 대역에 따른 할당되는 비트의 수를 다르게 함으로써 압축의 효율을 높일 수 있다.
심리음향모델링부(110)는 상기 주파수 영역의 성분으로 변환된 오디오 신호들에 대해, 각 주파수 대역 별로 마스킹현상을 이용해 마스킹 문턱치(masking threshold)를 계산한다.
데이터프로세싱부(120)는 심리음향모델링부(110)로부터 입력되는 주파수 대역별 마스킹 문턱치를 이용하여, 인간이 느끼는 음질의 변화를 최소화 하면서 부호화 효율을 높이기 위한 신호 처리를 수행한다. 데이터프로세싱부(120)에서 수행되는 부호화 효율을 높이기 위한 신호 처리 방법에는 시간영역 잡음 형상화, Intensity 스테레오 처리, 지각잡음대체 처리, Mid/Side(M/S) 스테레오 처리 등이 있다.
양자화부(130)에서는 인간이 들어도 느끼지 못하도록 각 대역의 양자화 잡음의 크기가 마스킹 문턱값보다 작도록 각 대역의 주파수 신호들을 스칼라(scalar) 양자화한다. 비트스트림생성부(140)는 부호화 장치의 상기 양자화된 오디오 신호와 상기 부호화에 대한 정보를 결합하여 미리 정해진 데이터 구조에 맞추어서 비트스트림을 생성한다.
상기 부호화할 오디오 신호가 다채널 오디오 신호인 경우, 상기 오디오 신호는 채널 단위가 아닌 미리 설정된 부호화 단위로 부호화되는 것이 일반적이다. 상기 부호화 단위는 동시에 부호화 되는 하나 이상의 채널 신호를 의미한다.
예를 들어 오디오 신호가 스테레오(stereo), 모노(mono), 센터(center), 서 라운드 레프트(surround left), 서라운드 라이트(surround right)의 5개의 채널로 이루어진 경우, 상기 부호화 단위는 스테레오/모노 채널 신호가 함께 부호화 되며, 센터 채널 신호가 부호화 되며, 서라운드 레프트/서라운드 라이트 신호 함께 부호화 된다.상기와 같이 두 채널 신호를 함께 부호화 하는 것은, 상기 두 채널 신호 간에는 중복성이 많아 함께 부호화 하는 경우 부호화 효율을 높일 수 있기 때문이다.
일반적인 오디오 기기는 스테레오 재생기 또는 다채널 재생기로 구분 되며, 상기 스테레오 재생기는 모노 재생도 가능하고, 다채널 재생기는 스테레오 재생도 가능하도록 개발 되고 있다. 모노/스테레오 오디오 신호의 비트스트림 생성을 위한 데이터 구조를 그 이상의 다채널 오디오 신호에 대해서도 적용하지 위한 비트스트림의 확장 방법은 ISO/IEC 13818-3에서 다루어 지고 있다.
도 2는 ISO/IEC 13818-3에서 사용하는 다채널 오디오 신호에 대해 확장 가능한 비트스트림의 데이터 구조를 도시한 것으로, 도시된 바와 같이 ISO/IEC 11172-3 방식과의 호환성을 지원하기 위하여 ISO/IEC 11172-3의 비트스트림안의 ancillary 데이터 부분에 다채널 데이터를 삽입해 주었다. 따라서 상기 비트스트림 구조를 이용하여 다채널 오디오 신호의 비트스트림을 생성하는 경우에는, 상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 확인하기 위해서는 모노/스테레오 데이터를 다 해제하여 분석한후, ancillary 데이터 부분에 포함된 다채널 확장에 대한 Syncword의 유무에 의해 다채널 데이터가 존재하는지 여부를 파악하여야 한다.
도 3은 ISO/IEC 13818-3에서 사용하는 다채널 오디오 신호에 대해 확장 가능 한 비트스트림의 데이터 구조를 도시한 것으로, MPEG-1과 호환을 제공하기 위해 MPEG-1 과 호환되는 크기의 비트스트림과 별도로 추가 다채널 데이터를 가질 수 있도록 구성되어 있다. 따라서, 비트스트림의 프레임 길이가 확장되었는지 확인하기 위해서는, MPEG-1 부분의 Ancillary data에서 Syncword를 이용해 Multi-channel 유무를 확인 한 뒤, ancillary data pointer를 이용하여 별도의 비트스트림이 extension part로 존재하는지 여부를 확인하여야 한다.
상기와 같은 종래의 비트스트림 데이터 구조를 이용하여 다채널 오디오 신호를 부호화/복호화 하는 경우, 비트스트림에 포함된 오디오 신호가 스테레오/모노 신호 이외에 다른 채널들을 포함하고 있는 다채널 신호인지 여부를 확인하는데 어려움이 있어, 사용자의 요구 또는 오디오 재생장치의 성능에 따라 오디오 신호를 효율적으로 처리하지 못하는 문제가 있었다. 또한, 최대 프레임 길이가 정해져 있음으로 인해 전체 프레임 길이를 효율적으로 사용하지 못하는 문제가 있었다.
본 발명이 이루고자 하는 기술적 과제는, 부호화된 오디오 신호의 채널 정보를 비트스트림으로부터 용이하게 검출할 수 있도록 하는 비트스트림 생성 방법 및 장치, 그를 이용한 오디오 신호의 부호화/복호화 방법 및 장치를 제공하는 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는, 비트스트림의 전체 프레임 길이를 오디오 신호의 특성에 따라 가변적으로 설정할 수 있도록 하는 비트스트림 생성 방법 및 장치, 그를 이용한 오디오 신호의 부호화/복호화 방법 및 장치를 제공하는 것이다.
본 발명이 이루고자 하는 또 다른 기술적 과제는, 비트스트림에서 부호화된 오디오 신호들이 위치하는 각각의 영역을 용이하게 검출할 수 있도록 하여, 각 부호화 단위에 해당하는 오디오 신호들을 병렬적으로 복호화할 수 있도록 하는 비트스트림 생성 방법 및 장치, 그를 이용한 오디오 신호의 부호화/복호화 방법 및 장치를 제공하는 것이다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 비트스트림 생성 방법은, 상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그(flag)를 생성하는 단계; 상기 생성된 플래그를 포함하여 상기 비트스트림의 헤더(header)를 생성하는 단계; 및 상기 생성된 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 또 다른 비트스트림 생성 방법은, 비트스트림이 가질 수 있는 최대 프레임 길이를 결정하여, 상기 결정된 최대 프레임 길이에 따라 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 단계; 상기 비트스트림의 프레임 길이를 상기 결정된 비트수를 가지는 데이터로 생성하는 단계; 및 상기 생성된 프레임 길이 정보 데이터와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 비트스 트림 생성 장치는, 상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그(flag)를 생성하는 플래그생성부; 상기 생성된 플래그를 포함하여 상기 비트스트림의 헤더(header)를 생성하는 헤더생성부; 및 상기 생성된 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 결합부를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 또 다른 비트스트림 생성 장치는, 비트스트림이 가질 수 있는 최대 프레임 길이를 결정하여, 상기 결정된 최대 프레임 길이에 따라 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 비트수결정부; 상기 비트스트림의 프레임 길이를 상기 결정된 비트수를 가지는 데이터로 생성하는 프레임길이데이터생성부; 및 상기 생성된 프레임 길이 정보 데이터와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 결합부를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 비트스트림 데이터 구조는, 상기 부호화된 오디오 신호가 다채널 신호인지 여부에 대한 정보를 포함하는 비트스트림 헤더; 상기 비트스트림의 프레임 길이에 대한 정보를 가지는 프레임 길이 정보 데이터; 및 상기 부호화된 오디오 신호 데이터를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 부호화 방법은, 상기 오디오 신호에 포함된 채널 신호들에 대해 부호화 단위별로 부호화하는 단계; 상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그를 포함하는 비트스트림 헤더를 생성하는 단계; 및 상기 생성된 비트스트림 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 부호화 장치는, 상기 오디오 신호에 포함된 채널 신호들에 대해 부호화 단위별로 부호화하는 부호화부; 상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그를 포함하는 비트스트림 헤더를 생성하는 헤더생성부; 및 상기 생성된 비트스트림 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 비트스트림생성부를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 복호화 방법은, 상기 비트스트림의 헤더에 포함된 플래그를 이용하여 상기 오디오 신호가 다채널 신호인지 여부를 확인하는 단계; 및 상기 확인 결과에 따라, 상기 오디오 신호가 다채널 신호인 경우와 다채널 신호가 아닌 경우로 나누어 상기 오디오 신호를 채널별로 복호화 하는 단계를 포함하는 것을 특징으로 한다.
상술한 기술적 과제를 해결하기 위한 본 발명에 의한 오디오 신호의 복호화 장치는, 상기 비트스트림의 헤더에 포함된 플래그를 이용하여, 상기 비트스트림에 포함된 오디오 신호가 다채널 신호인지 여부를 검출하는 다채널검출부; 및 상기 확인 결과에 따라, 상기 오디오 신호를 채널별로 복호화 하는 복호화부를 포함하는 것을 특징으로 한다.
상기 오디오 신호의 비트스트림 생성 방법 및 오디오 신호의 부호화/복호화 방법은 바람직하게는 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현할 수 있다.
이하, 첨부된 도면을 참조하면서 본 발명에 따른 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한 오디오 신호의 부호화/복호화 방법 및 장치에 대해 상세히 설명한다. 도 4는 본 발명에 따른 오디오 신호 부호화 장치의 전체적인 구성을 블록도로 도시한 것으로, 도시된 부호화 장치는 다채널결정부(400), 부호화부(410) 및 비트팩킹부(420)를 포함하여 이루어진다.
다채널결정부(400)는 입력되는 오디오 신호의 채널 정보를 검출하여, 상기 오디오 신호가 스테레오/모노 신호만을 포함하고 있는지, 그 이외에 채널, 예를 들어 센터 채널 또는 서라운드 레프트. 서라운드 라이트 채널 신호를 포함하는 다채널 신호인지 여부를 결정한다. 다채널결정부(400)는 사용자입력부(미도시)를 통해 사용자로부터 입력되는 부호화 정보를 이용하여 상기 오디오 신호를 다채널 신호로 부호화 할 것인지 여부를 결정하는 것이 바람직하다. 예를 들어, 사용자가 스테레오/모노 신호로 부호화하고자 하는 경우, 상기 입력되는 오디오 신호가 스테레오/모노 신호, 센터, 서라운드 레프트. 서라운드 라이트 채널을 포함하는 경우에도 다채널결정부(400)는 상기 오디오 신호가 스테레오/모노 신호인 것으로 결정하는 것이 바람직하다.
부호화부(410)는 다채널결정부(400)로부터 입력되는 오디오 신호가 다채널 신호인지 여부에 대한 정보를 입력받아, 상기 입력되는 오디오 신호를 상기 입력된 채널 정보에 맞추어 부호화한다. 부호화부(410)는 상기 입력되는 오디오 신호가 다 채널 신호인 경우, 상기 오디오 신호에 포함된 채널들을 소정의 개수의 부호화 단위들로 나누어, 상기 부호화 단위 별로 부호화를 수행한다. 오디오 신호가 스테레오, 모노, 센터, 서라운드 레프트, 서라운드 라이트의 5개의 채널로 이루어진 경우, 상기 부호화 단위는 스테레오/모노 채널, 센터 채널, 서라운드 레프트/서라운드 라이트 채널로 나누어 지는 것이 바람직하다.
상기 입력되는 오디오 신호가 다채널 신호인 경우, 부호화부(410)는 상기 모노/스테레오 오디오 신호를 부호화 한 후, 그 이외의 확장 채널 신호들을 부호화 단위 별로 부호화한다. 상기 확장 채널 신호들을 오디오 채널의 구성을 나타내는 확장 채널의 타입 정보를 포함하며, 상기 확장채널 타입 정보는 채널구성 인덱스(channel_configuration_index)로 표현되는 것이 바람직하다. 상기 채널구성 인덱스는 다음의 표 1에 나타난 바와 같이 오디오 출력 채널 구성을 나타내는 3비트 필드를 가지는 것이 바람직하다. 상기 채널 구성 인덱스는 각 채널 신호를 스피커에 매핑(mapping) 시 상기 채널의 수를 규정한다.
Figure 112005033845990-PAT00001
상기 확장 채널 오디오 신호를 부호화 하는 방법은, 확장 채널 오디오 신호를 부호화한 후. 상기 부호화에 대한 부가정보를 부호화하고, 상기 오디오 채널의 구성을 나타내는 확장 채널 타입을 부호화한 후, 상기 확장 채널 신호의 길이를 부호화한다.
도 5는 도 4의 비트스트림을 생성하는 비트팩킹부(420)에 대한 실시예를 블록도로 도시한 것으로, 도시된 비트패킹부(420)는 플래그생성부(500), 프레임길이데이터생성부(510), 단위길이데이터생성부(520), 오프셋데이터생성부(530), 헤더생성부(540) 및 비트스트림생성부(550)를 포함하여 이루어진다. 도 5에 도시된 비트패킹부(420)를 포함하는 오디오 신호 부호화 장치의 동작을 도 9에 도시된 본 발명에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도와 결부시켜 설명하기로 한다.
다채널결정부(400)는 입력되는 오디오 신호가 다채널 신호인지 여부를 판단하고(900단계), 부호화부(910)는 상기 판단된 채널 정보에 맞춰 상기 오디오 신호를 부호화 단위 별로 부호화 한다(910단계). 상기 오디오 신호가 부호화되는 부호화 단위는 채널별로 부호화될 수도 있으나, 부호화 효울을 높이기 위해 중복성이 있는 채널들을 묶어 하나의 부호화 단위로 하여 함께 부호화 하는 것이 바람직하다.
플래그생성부(500)는 다채널결정부(400)로부터 입력되는 오디오 신호가 다채널 신호인지 여부에 대한 정보를 입력받아, 상기 정보를 이용하여 다채널 신호 여부에 대한 정보를 가지는 플래그인 MC_PRESENT를 생성한다(920단계). 플래그생성부(500)는 상기 오디오 신호가 스테레오/모노 신호만을 포함하고 있는 경우에는 상기 MC_PRESENT를 0으로, 상기 오디오 신호가 스테레오/모노 신호 이외의 채널들을 포함하고 있는 경우에는 상기 MC_PRESENT를 1로 생성하는 것이 바람직하다.
플레임길이데이터생성부(510)는 생성되는 비트스트림의 프레임의 길이에 대한 정보를 가지는 데이터인 FRAME_LENGTH를 생성한다(930단계). 상기 프레임 길이에 대한 정보를 가지는 FRAME_LENGTH는 비트수가 가변적인 것이 바람직하며, 상기 FRAME_LENGTH는 그 비트수가 기본 비트수보다 확장되는 경우에는 상기 비트수 확장에 대한 정보를 가지는 플래그를 포함하도록 생성되는 것이 바람직하다.
도 7a, b, c는 상기 가변 비트수를 가지는 FRAME_LENGTH에 대한 실시예들을 도시한 것으로, 상기 FRAME_LENGTH는 기본비트수가 7비트로 설정되어 있는 경우이다. 도 7a에 도시된 바와 같이, 상기 FRAME_LENGTH가 기본 비트수인 7비트를 가지는 경우에는 E0 플래그(700) 값이 0을 가지도록 생성된다. 도 7b에 도시된 바와 같이, 상기 FRAME_LENGTH가 기본 비트수인 7비트에 3비트의 제1확장비트를 가지는 경우에는 E0 플래그(700) 값이 1을 가지며, E1 플래그(710) 값은 0을 가지도록 생성된다.
또한 도 7c에 도시된 바와 같이, 상기 FRAME_LENGTH가 기본 비트수인 7비트에 3비트의 제1확장비트 및 3비트의 제2확장비트를 가져 6비트가 확장되는 경우에는 E0 플래그(700) 값 및 E1 플래그(710) 값이 1을 가지며,E2 플래그(720) 값이 0을 가지도록 생성된다. 상기와 같은 방법에 의해 상기 FRAME_LENGTH의 비트수는 제한없이 증가될 수 있으며, 그에 따라 상기 FRAME_LENGTH로 표현될 수 있는 비트스트트의 프레임 길이가 제한없이 확장될 수 있다.
프레임길이데이터생성부(510)는 상기 오디오 신호가 부호화 되기 전에, 상기 오디오 신호의 채널 수 및 요구되는 압축비를 이용하여 상기 프레임이 가질 수 있는 최대 길이를 계산한 후, 상기 계산된 프레임 최대 길이에 따라 상기 FRAME_LENGTH의 비트수를 결정하는 것이 바람직하다. 또는 상기 910단계에서 부호화된 오디오 신호를 이용하여, 상기 부호화된 오디오 신호의 프레임 길이에 따라 상기 FRAME_LENGTH의 비트수를 결정하는 것이 바람직하다. 도 8a, b, c는 상기와 같은 방법에 의해 FRAME_LENGTH를 생성한 실시예들이다.
단위길이데이터생성부(520)는 상기 오디오 신호가 부호화된 부호화 단위 각각에 대해, 상기 부호화된 데이터의 길이에 대한 정보를 가지는 ELEMENT_LENGTH를 생성한다(940단계). 예를 들어, 오디오 신호가 스테레오/모노 채널, 센터 채널, 서라운드 레프트/서라운드 라이트 채널로 부호화된 경우,단위길이데이터생성부(520)는 상기 부호화된 스테레오/모노 채널 신호의 길이, 부호화된 센터 채널 신호의 길이, 부호화된 서라운드 레프트/서라운드 라이트 채널 신호의 길이 각각에 대해 ELEMENT_LENGTH를 생성한다.
오프셋데이터생성부(530)는 상기 오디오 신호가 부호화된 보호화 단위 각각에 대해, 재생단위인 레이어(layer)들을 비트스트림에서 구분할 수 있도록 상기 레이어에 대한 정보를 가지는 SCALABLE_HEADER를 생성한다(950단계). 상기 SCALABLE_HEADER는 상기 부호화 단위에 포함된 레이어들 각각에 대한 오프셋 값들을 포함하는 것이 바람직하다. 오디오 신호가 스테레오/모노 신호만을 포함하고 있는 경우, 상기 부호화된 스테레오/모노 신호에 포함된 레이어들의 오프셋 정보는 다음의 수학식 1과 같이 계산되어 구해지는 것이 바람직하다.
Figure 112005033845990-PAT00002
상기 수학식 1에서, layer_offset[n]은 n 번째 레이어의 오프셋 값이며, 상기 FRAME_LENGTH는 프레임 전체의 길이이며, 상기 total_layer_num는 전체 레이어들의 개수이다. 또한 첫번째 레이어에 대한 오프셋 값인 layer_offset[1]은 0으로 설정되는 것이 바람직하다.
오디오 신호가 스테레오/모노 신호 이외의 확장 채널 신호들을 포함하고 있는 경우, 각 부호화 단위에 포함된 레이어들의 오프셋 정보는 다음의 수학식 2와 같이 계산되어 구해지는 것이 바람직하다.
Figure 112005033845990-PAT00003
상기 수학식 2에서, layer_offset[n]은 상기 부호화 단위에 포함된 레이어들 중 n 번째 레이어의 오프셋 값이며, 상기 ELEMENT_LENGTH는 상기 부호화 단위에 해당하는 부호화된 신호의 길이이며, 상기 total_layer_num는 상기 부호화 단위에 포함된 전체 레이어들의 개수이다.
헤더생성부(540)는 상기 생성된 MC_PRESENT, FRAME_LENGTH, ELEMENT_LENGTH 및 SCALABLE_HEADER를 이용하여 비트스트림의 헤더를 생성한다(960단계). 비트스트림생성부(550)는 상기 부호화된 오디오 신호와 상기 생성된 비트스트림 헤더를 결합하여 오디오 신호의 비트스트림을 생성한다(970단계).
도 6은 본 발명에 따른 오디오 신호의 비트스트림 데이터 구조에 대한 실시예를 도시한 것으로, 스테레오/모노 채널, 센터 채널, 서라운드 레프트/서라운드 라이트 채널로 부호화된 오디오 신호를 비트스트림으로 생성한 것이다. 도 6에 도시된 비트스트림은 부호화 단위 별로 부호화된 오디오 신호들과 상기 비트스트림에 대한 정보를 가지는 비트스트림 헤더를 포함하며, 도 6에 도시된 바와 같이 상기 비트스트림 헤더는 다시 스테레오/모노 영역에 포함된 스테레오/모노 헤더와 센터 채널 영역에 포함된 센터 채널 헤더 및 서라운드레프트/라이트 채널 영역에 포함된 서라운드레프트/라이트 채널 헤더로 나뉘어 위치한다.
도 6에 도시된 바와 같이, 상기 비트스트림 헤더에 포함된 데이터 중 전체 프레임 길이를 나타내는 FRAME_LENGTH와 부호화된 오디오 신호가 다채널 신호인지 여부를 나타내는 플래그인 MC_PRESENT는 비트스트림의 앞 부분인 스테레오/모노 헤더에 포함되는 것이 바람직하다. 그리고 상기 스테레오/모노 헤더, 센터 채널 헤더 및 서라운드레프트/라이트 채널 헤더 각각은, 각 부호화 단위에 해당되는 부호화된 신호의 길이 및 포함된 레이어들의 오프셋 정보를 가지는 SCALABLE_HEADER를 포함하는 것이 바람직하다. 상기 확장 채널인 센터 채널과 서라운드 레프트/라이트 채널에 포함된 비트(600, 610)는 각 확장 채널의 인덱스를 표시하는 것이다.
다음은 상기에서 설명한 바와 같은 구성을 가지는 비트스트림 헤더에 대해 작성된 구문(syntax)의 실시예들이다.
Figure 112005033845990-PAT00004
Figure 112005033845990-PAT00005
상기 구문들에 따르면 전체 프레임 길이에 대한 정보를 가지는 FRAME_LENGTH 데이터와 오디오 신호가 다채널 신호인지 여부에 대한 정보를 가지는 MC_PRESENT 플래그를 생성한다. 그리고 상기 MC_PRESENT 값이 1, 즉 오디오 신호가 다채널 신호인 경우에는, 상기 오디오 신호가 채널별로 부호화되는 단위 각각에 대해 부호화된 오디오 신호의 길이에 대한 정보를 가지는 ELEMENT_LENGTH 데이터를 생성한다. 그리고 나서는 재생단위인 레이어에 대한 오프셋 정보를 가지는 SCALABLE_HEADER를 생성한다.
Figure 112005033845990-PAT00006
상기 구문은 프레임 길이에 대한 정보를 가지는 FRAME_LENGTH의 비트수와 부호화 단위 별 부호화된 신호의 길이에 대한 정보를 가지는 ELEMENT_LENGTH의 비트 수를 가변적으로 설정하기 위해 작성된 실시예이다.
상기에서 설명한 바와 같이, 기본 비트수 이상이 상기 FRAME_LENGTH에 할당되는 경우에는 상기 구문의 LengthEnd_flag가 1로 설정된다.
도 10은 본 발명에 따른 오디오 신호의 복호화 장치의 전체적인 구성을 블록도로 도시한 것으로, 도시된 복호화 장치는 비트언팩킹부(1000) 및 복호화부(1010)을 포함하며, 비트언팩킹부(1000)는 다채널검출부(1020), 프레임길이검출부(1030), 단위길이검출부(1040) 및 레이어정보검출부(1050)를 포함하여 이루어진다.상기 도 10에 도시된 복호화 장치의 동작을 도 11에 도시된 본 발명에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도와 결부시켜 설명하기로 한다.
다채널검출부(1020)는 입력되는 비트스트림의 헤더부분에 포함된 MC_PRESENT 플래그를 읽어들여, 상기 비트스트림에 포함된 오디오 신호가 다채널 신호인지 여부를 확인한다(1100단계). 다채널검출부(1020)는 MC_PRESENT 플래그가 0인 경우에는 상기 오디오 신호가 스테레오/모노 신호만을 포함한 것으로 판단하고, MC_PRESENT 플래그가 1인 경우에는 상기 오디오 신호가 스테레오/모노 이외의 채널 신호들을 포함하고 있는 것으로 판단하는 것이 바람직하다.
프레임길이검출부(1030)는 상기 비트스트림의 헤더부분에 포함된 FRAME_LENGTH 데이터를 읽어들여, 상기 비트스트림의 프레임 전체 길이를 검출한다(1110단계). 프레임길이검출부(1030)는 FRAME_LENGTH 데이터에 포함된 비트 수 확 장 여부에 대한 정보를 가지는 플래그들을 읽어들여, 상기 FRAME_LENGTH 데이터의 비트수가 기본 비트수인지 확장된 비트수 인지, 확장되었다면 몇 비트가 확장되었는지 여부를 확인 한후, FRAME_LENGTH 데이터로부터 프레임 전체의 길이를 검출하는 것이 바람직하다.
다채널검출부(1020)의 확인 결과 상기 비트스트림에 포함된 오디오 신호가 다채널 신호인 경우, 단위길이검출부(1040)는 상기 비트스트림의 헤더부분에 포함된 ELEMENT_LENGTH 데이터들을 읽어들여 상기 비트스트림에 포함된 부호화 단위 별로 부호화된 오디오 신호 각각의 길이들을 검출한다(1120단계). 레이어정보검출부(1050)는 상기 비트스트림의 헤더부분에 포함된 SCALABLE_HEADER들을 읽어들여, 상기 비트스트림에 포함된 레이어들에 대한 정보인 오프셋 정보들을 검출한다(1130단계).
복호화부(1010)는 비트언패킹부(1000)에서 검출된 오디오 신호 및 비트스트림에 대한 정보를 이용하여, 상기 비트스트림에 포함된 오디오 신호들을 복호화 한다(1140단계).
다채널검출부(1020)의 확인 결과 상기 비트스트림에 포함된 오디오 신호가 다채널 신호인 경우, 복호화부(1010)는 상기 ELEMENT_LENGTH 데이터들로부터 검출된 부호화 단위 각각의 길이 정보들을 이용하여, 사용자가 원하는 채널 만을 복호화할 수 있다, 예를 들어, 스테레오/모노 채널, 센터 채널, 서라운드 레프트/라이트 채널에 대한 부호화된 오디오 신호를 포함하는 비트스트림의 경우, 상기 검출된 스테레오/모노 채널, 센터 채널, 서라운드 레프트/라이트 채널 각각에 대한 오디오 신호의 길이를 이용하여 상기 3 개의 부호화된 신호들 중 원하는 신호만을 복호화하여 재생하는 것이 바람직하다. 또한, 상기 복호화 장치를 포함하는 오디오 재생 장치가 상기 비트스트림에 포함된 오디오 채널들 중 일부의 채널, 예를 들어 스테레오/모노만을 재생할 수 있는 것이라면, 복호화부(1010)는 상기 부호화 단위 별 길이 정보를 이용하여 상기 재생 장치가 재생 가능한 채널에 해당하는 오디오 신호만을 복호화하도록 제어되는 것이 바람직하다.
또한, 복호화부(1010)는 ELEMENT_LENGTH 데이터들로부터 검출된 부호화 단위 각각의 길이 정보들을 이용하여, 상기 비트스트림에 포함된 부호화된 신호들을 동시에 병렬적으로 복호화할 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
이상 본 발명의 바람직한 실시예에 대해 상세히 기술하였지만, 본 발명이 속하는 기술분야에 있어서 통상의 지식을 가진 사람이라면, 첨부된 청구범위에 정의된 본 발명의 정신 및 범위에 벗어나지 않으면서 본 발명을 여러 가지로 변형 또는 변경하여 실시할 수 있음을 알 수 있을 것이다. 따라서, 본 발명의 앞으로의 실시예들의 변경은 본 발명의 기술을 벗어날 수 없을 것이다.
이상에서 살펴본 바와 같이 본 발명에 따른 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한 오디오 신오의 부호화/복호화 방법 및 장치에 의하면, 오디오 신호가 다채널 신호인지 여부에 대한 정보를 가지는 플래그를 비트스트림의 헤더 부분에 포함시킴으로써 신호 특성에 따른 효율적이고 신속한 부호화/복호화가 가능하도록 할 수 있다, 또한, 비트스트림의 프레임 길이에 대한 정보를 가지는 데이터의 비트수를 오디오 신호의 특성에 따라 가변적으로 설정할 수 있도록 함으로써, 부호화/복호화의 효율을 높이는 동시에 처리 가능한 오디오 신호의 채널 수를 용이하게 확장할 수 있다.

Claims (52)

  1. 부호화된 오디오 신호와 부호화 정보를 이용하여 오디오 신호의 비트스트림(butstream)을 생성하는 방법에 있어서,
    상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그(flag)를 생성하는 단계;
    상기 생성된 플래그를 포함하여 상기 비트스트림의 헤더(header)를 생성하는 단계; 및
    상기 생성된 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 방법.
  2. 제1항에 있어서, 상기 플래그는
    상기 부호화된 오디오 신호가 2 이하의 채널을 가지는 경우와 3 이상의 채널을 가지는 경우를 구별하여 서로 다르게 생성되는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 방법.
  3. 제1항에 있어서, 상기 생성된 플래그를 포함하는 헤더는
    상기 비트스트림 중 스테레오/모노 오디오 신호에 대한 헤더인 것을 특징으로 하는 오디오 신호의 비트스트림 생성 방법.
  4. 제1항에 있어서,
    상기 부호화된 오디오 신호가 다채널 오디오 신호인 경우,
    상기 다채널 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화된 오디오 신호의 길이에 대한 정보를 가지는 단위 길이 정보 데이터를 생성하는 단계를 포함하고,
    상기 비트스트림 생성 단계는
    상기 생성된 헤더, 상기 부호화된 오디오 신호 및 상기 생성된 단위 길이 정보 데이터들을 이용하여 비트스트림을 생성하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 방법.
  5. 부호화된 신호와 부호화 정보를 이용하여 비트스트림을 생성하는 방법에 있어서,
    비트스트림이 가질 수 있는 최대 프레임 길이를 결정하여, 상기 결정된 최대 프레임 길이에 따라 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 단계;
    상기 비트스트림의 프레임 길이를 상기 결정된 비트수를 가지고 부호화된 신호 데이터로 생성하는 단계; 및
    상기 생성된 프레임 길이 정보 데이터와 상기 부호화된 신호를 이용하여 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 비트스트림 생성 방법.
  6. 제5항에 있어서, 상기 비트수 결정 단계는
    상기 신호의 채널 수와 부호화 압축비를 이용하여, 상기 프레임 길이에 대한 정보를 가지는 부호화된 신호 데이터에 할당되는 비트수를 결정하는 것을 특징으로 하는 비트스트림 생성 방법.
  7. 제5항에 있어서, 상기 비트수 결정 단계는
    상기 생성된 비트스트림의 프레임 길이를 이용하여, 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 것을 특징으로 하는 비트스트림 생성 방법.
  8. 제5항에 있어서, 상기 프레임 길이 정보를 가지는 데이터를 생성하는 단계는
    상기 결정된 비트수가 기본 비트수보다 큰 경우, 상기 프레임 길이 정보 데이터가 기본 비트수보다 큰 비트수를 가짐을 표시하는 플래그를 포함하도록 하는 것을 특징으로 하는 비트스트림 생성 방법.
  9. 제5항에 있어서,
    상기 신호의 부호화 단위 각각에 대해, 상기 부호화 단위에 포함된 레이어(layer)들이 상기 비트스트림에서 차지하는 영역을 구분할 수 있도록 하는 오프셋 정보 데이터를 생성하는 단계를 포함하고,
    상기 비트스트림 생성 단계는
    상기 생성된 프레임 길이 정보 데이터, 상기 생성된 오프셋 정보들 및 상기 부호화된 신호를 이용하여 비트스트림을 생성하는 것을 특징으로 하는 비트스트림 생성 방법.
  10. 제9항에 있어서, 상기 오프셋 정보 데이터는
    상기 프레임 길이를 상기 부호화 단위에 포함된 레이어의 수로 나눈 결과를 이용하여 생성되는 것을 특징으로 하는 비트스트림 생성 방법.
  11. 제9항에 있어서, 상기 오프셋 정보 데이터는
    상기 부호화 단위에 해당하는 부호화된 신호의 길이를 상기 부호화 단위에 포함된 레이어의 수로 나눈 결과를 이용하여 생성되는 것을 특징으로 하는 비트스트림 생성 방법.
  12. 부호화된 오디오 신호와 부호화 정보를 이용하여 오디오 신호의 비트스트림(butstream)을 생성하는 장치에 있어서,
    상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그(flag)를 생성하는 플래그생성부;
    상기 생성된 플래그를 포함하여 상기 비트스트림의 헤더(header)를 생성하는 헤더생성부; 및
    상기 생성된 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생 성하는 결합부를 포함하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  13. 제12항에 있어서, 상기 플래그는
    상기 부호화된 오디오 신호가 2 이하의 채널을 가지는 경우와 3 이상의 채널을 가지는 경우를 구별하여 서로 다르게 생성되는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  14. 제13항에 있어서, 상기 생성된 플래그를 포함하는 헤더는
    상기 비트스트림 중 스테레오/모노 오디오 신호에 대한 헤더인 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  15. 제12항에 있어서,
    상기 부호화된 오디오 신호가 다채널 오디오 신호인 경우,
    상기 다채널 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화된 오디오 신호의 길이에 대한 정보를 가지는 단위 길이 정보 데이터를 생성하는 단위길이데이터생성부를 더 포함하고,
    상기 결합부는
    상기 생성된 헤더, 상기 부호화된 오디오 신호 및 상기 생성된 단위 길이 정보 데이터들을 이용하여 비트스트림을 생성하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  16. 부호화된 오디오 신호와 부호화 정보를 이용하여 오디오 신호의 비트스트림을 생성하는 장치에 있어서,
    비트스트림이 가질 수 있는 최대 프레임 길이를 결정하여, 상기 결정된 최대 프레임 길이에 따라 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 비트수결정부;
    상기 비트스트림의 프레임 길이를 상기 결정된 비트수를 가지고 부호화된 신호 데이터로 생성하는 프레임길이데이터생성부; 및
    상기 생성된 프레임 길이 정보 데이터와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 결합부를 포함하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  17. 제16항에 있어서, 상기 비트수결정부는
    상기 오디오 신호의 채널 수와 부호화 압축비를 이용하여, 상기 프레임 길이에 대한 정보를 가지는 부호화된 신호 데이터에 할당되는 비트수를 결정하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  18. 제16항에 있어서, 상기 비트수결정부는
    상기 생성된 비트스트림의 프레임 길이를 이용하여, 상기 프레임 길이에 대 한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  19. 제16항에 있어서, 상기 프레임길이데이터생성부는
    상기 결정된 비트수가 기본 비트수보다 큰 경우, 상기 프레임 길이 정보 데이터가 기본 비트수보다 큰 비트수를 가짐을 표시하는 플래그를 포함하도록 생성하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  20. 제16항에 있어서,
    상기 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화 단위에 포함된 레이어(layer)들이 상기 비트스트림에서 차지하는 영역을 구분할 수 있도록 하는 오프셋 정보 데이터를 생성하는 오프셋데이터생성부를 포함하고,
    상기 결합부는
    상기 생성된 프레임 길이 정보 데이터, 상기 생성된 오프셋 정보들 및 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  21. 제20항에 있어서, 상기 오프셋 정보 데이터는
    상기 프레임 길이를 상기 부호화 단위에 포함된 레이어의 수로 나눈 결과를 이용하여 생성되는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  22. 제20항에 있어서, 상기 오프셋 정보 데이터는
    상기 부호화 단위에 해당하는 부호화된 오디오 신호의 길이를 상기 부호화 단위에 포함된 레이어의 수로 나눈 결과를 이용하여 생성되는 것을 특징으로 하는 오디오 신호의 비트스트림 생성 장치.
  23. 부호화된 오디오 신호의 비트스트림의 데이터 구조에 있어서,
    상기 부호화된 오디오 신호가 다채널 신호인지 여부에 대한 정보를 포함하는 비트스트림 헤더;
    상기 비트스트림의 프레임 길이에 대한 정보를 가지는 프레임 길이 정보 데이터; 및
    상기 부호화된 오디오 신호 데이터를 포함하는 것을 특징으로 하는 오디오 신호 비트스트림의 데이터 구조.
  24. 제23항에 있어서, 상기 프레임 길이 정보 데이터는
    상기 비트스트림의 프레임이 가질 수 있는 최대 길이에 따라, 비트수가 가변적인 것을 특징으로 하는 오디오 신호 비트스트림의 데이터 구조.
  25. 제23항에 있어서, 상기 프레임 길이 정보 데이터는
    상기 프레임 길이 정보 데이터의 비트수가 기본 비트수보다 큰지 여부에 대 한 정보를 가지는 플래그를 포함하는 것을 특징으로 하는 오디오 신호 비트스트림의 데이터 구조.
  26. 제23항에 있어서,
    상기 오디오 신호의 부호화 단위 각각에 대해, 부호화된 오디오 신호의 길이에 대한 정보를 가지는 단위 길이 정보 데이터를 포함하는 것을 특징으로 하는 오디오 신호 비트스트림의 데이터 구조.
  27. 제23항에 있어서,
    상기 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화 단위에 포함된 레이어들이 상기 비트스트림에서 차지하는 영역을 구분할 수 있도록 하는 오프셋 정보 데이터를 더 포함하는 것을 특징으로 하는 오디오 신호 비트스트림의 데이터 구조.
  28. 오디오 신호를 부호화하는 방법에 있어서,
    상기 오디오 신호에 포함된 채널 신호들에 대해 부호화 단위별로 부호화하는 단계;
    상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그를 포함하는 비트스트림 헤더를 생성하는 단계; 및
    상기 생성된 비트스트림 헤더와 상기 부호화된 오디오 신호를 이용하여 비트 스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 부호화 방법.
  29. 제28항에 있어서, 상기 플래그는
    상기 부호화된 오디오 신호가 2 이하의 채널을 가지는 경우와 3 이상의 채널을 가지는 경우를 구별하여 서로 다르게 생성되는 것을 특징으로 하는 오디오 신호 부호화 방법.
  30. 제28항에 있어서,
    상기 부호화된 오디오 신호가 다채널 오디오 신호인 경우,
    상기 다채널 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화된 오디오 신호의 길이에 대한 정보를 가지는 단위 길이 정보 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  31. 제28항에 있어서,
    비트스트림이 가질 수 있는 최대 프레임 길이를 결정하여, 상기 결정된 최대 프레임 길이에 따라 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 단계; 및
    상기 비트스트림의 프레임 길이를 상기 결정된 비트수를 가지는 데이터로 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  32. 제31항에 있어서, 상기 프레임 길이 정보를 가지는 데이터를 생성하는 단계는
    상기 결정된 비트수가 기본 비트수보다 큰 경우, 상기 프레임 길이 정보 데이터가 기본 비트수보다 큰 비트수를 가짐을 표시하는 플래그를 포함하도록 하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  33. 제28항에 있어서,
    상기 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화 단위에 포함된 레이어들이 상기 비트스트림에서 차지하는 영역을 구분할 수 있도록 하는 오프셋 정보 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 부호화 방법.
  34. 오디오 신호를 부호화하는 장치에 있어서,
    상기 오디오 신호에 포함된 채널 신호들에 대해 부호화 단위별로 부호화하는 부호화부;
    상기 부호화된 오디오 신호가 다채널 오디오 신호인지 여부를 나타내는 플래그를 포함하는 비트스트림 헤더를 생성하는 헤더생성부; 및
    상기 생성된 비트스트림 헤더와 상기 부호화된 오디오 신호를 이용하여 비트스트림을 생성하는 비트스트림생성부를 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  35. 제34항에 있어서, 상기 플래그는
    상기 부호화된 오디오 신호가 2 이하의 채널을 가지는 경우와 3 이상의 채널을 가지는 경우를 구별하여 서로 다르게 생성되는 것을 특징으로 하는 오디오 신호 부호화 장치.
  36. 제34항에 있어서,
    상기 부호화된 오디오 신호가 다채널 오디오 신호인 경우,
    상기 다채널 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화된 오디오 신호의 길이에 대한 정보를 가지는 단위 길이 정보 데이터를 생성하는 단위길이데이터생성부를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  37. 제34항에 있어서,
    비트스트림이 가질 수 있는 최대 프레임 길이를 결정하여, 상기 결정된 최대 프레임 길이에 따라 상기 프레임 길이에 대한 정보를 가지는 데이터에 할당되는 비트수를 결정하는 비트수결정부; 및
    상기 비트스트림의 프레임 길이를 상기 결정된 비트수를 가지는 데이터로 생성하는 프레임길이데이터생성부를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  38. 제37항에 있어서, 상기 프레임길이데이터생성부는
    상기 결정된 비트수가 기본 비트수보다 큰 경우, 상기 프레임 길이 정보 데이터가 기본 비트수보다 큰 비트수를 가짐을 표시하는 플래그를 포함하도록 생성하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  39. 제34항에 있어서,
    상기 오디오 신호의 부호화 단위 각각에 대해, 상기 부호화 단위에 포함된 레이어들이 상기 비트스트림에서 차지하는 영역을 구분할 수 있도록 하는 오프셋 정보 데이터를 생성하는 오프셋데이터생성부를 더 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  40. 오디오 신호 비트스트림을 입력받아 복호화하는 방법에 있어서,
    상기 비트스트림의 헤더에 포함된 플래그를 이용하여 상기 오디오 신호가 다채널 신호인지 여부를 확인하는 단계; 및
    상기 확인 결과에 따라, 상기 오디오 신호가 다채널 신호인 경우와 다채널 신호가 아닌 경우로 나누어 상기 오디오 신호를 채널별로 복호화 하는 단계를 포함하는 것을 특징으로 오디오 신호 복호화 방법.
  41. 제40항에 있어서,
    상기 비트스트림에 포함된 프레임 길이 정보 데이터로부터 상기 비트스트림 의 프레임 길이를 검출하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 방법.
  42. 제41항에 있어서, 상기 비트스트림의 프레임 길이는
    상기 프레임 길이 정보 데이터에 포함된 기본 비트수에 해당하는 데이터, 비트수 확장여부를 나타내는 플래그 및 확장된 비트수에 해당하는 데이터를 이용하여 검출되는 것을 특징으로 하는 오디오 신호 복호화 방법.
  43. 제40항에 있어서,
    상기 비트스트림에 포함된 단위 길이 정보 데이터를 이용하여, 상기 비트스트림에 포함된 부호화 단위 각각에 대한 부호화된 오디오 신호의 길이를 검출하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 방법.
  44. 제40항에 있어서,
    상기 비트스트림에 포함된 프레임 길이 정보 데이터로부터 상기 비트스트림의 프레임 길이를 검출하는 단계;
    상기 비트스트림에 포함된 단위 길이 정보 데이터를 이용하여, 상기 비트스트림에 포함된 부호화 단위 각각에 대한 부호화된 오디오 신호의 길이를 검출하는 단계; 및
    상기 검출된 프레임 길이와 부호화 단위 길이를 이용하여, 상기 비트스트림 에 포함된 부호화 단위 각각에 해당하는 데이터 영역을 구분하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 방법.
  45. 제40항에 있어서,
    상기 비트스트림에 포함된 부호화 단위 각각에 대해, 상기 비트스트림에 포함된 오프셋정보데이터를 이용하여 상기 부호화 단위에 포함된 레이어들에 대한 정보를 검출하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 방법.
  46. 오디오 신호 비트스트림을 입력받아 복호화하는 장치에 있어서,
    상기 비트스트림의 헤더에 포함된 플래그를 이용하여, 상기 비트스트림에 포함된 오디오 신호가 다채널 신호인지 여부를 검출하는 다채널검출부; 및
    상기 확인 결과에 따라, 상기 오디오 신호를 채널별로 복호화 하는 복호화부를 포함하는 것을 특징으로 오디오 신호 복호화 장치.
  47. 제46항에 있어서,
    상기 비트스트림에 포함된 프레임 길이 정보 데이터로부터 상기 비트스트림의 프레임 길이를 검출하는 프레임길이검출부를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  48. 제47항에 있어서, 상기 비트스트림의 프레임 길이는
    상기 프레임 길이 정보 데이터에 포함된 기본 비트수에 해당하는 데이터, 비트수 확장여부를 나타내는 플래그 및 확장된 비트수에 해당하는 데이터를 이용하여 검출되는 것을 특징으로 하는 오디오 신호 복호화 장치.
  49. 제46항에 있어서,
    상기 비트스트림에 포함된 단위 길이 정보 데이터를 이용하여, 상기 비트스트림에 포함된 부호화 단위 각각에 대한 부호화된 오디오 신호의 길이를 검출하는 단위길이검출부를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  50. 제46항에 있어서,
    상기 비트스트림에 포함된 프레임 길이 정보 데이터로부터 상기 비트스트림의 프레임 길이를 검출하는 프레임길이검출부;
    상기 비트스트림에 포함된 단위 길이 정보 데이터를 이용하여, 상기 비트스트림에 포함된 부호화 단위 각각에 대한 부호화된 오디오 신호의 길이를 검출하는 단위길이검출부를 더 포함하고,
    상기 복호화부는
    상기 검출된 프레임 길이와 부호화 단위 길이를 이용해 상기 비트스트림에 포함된 부호화 단위 각각에 해당하는 데이터 영역을 구분하여, 상기 오디오 신호를 채널별로 복호화하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  51. 제46항에 있어서,
    상기 비트스트림에 포함된 부호화 단위 각각에 대해, 상기 비트스트림에 포함된 오프셋정보데이터를 이용하여 상기 부호화 단위에 포함된 레이어들에 대한 정보를 검출하는 레이어정보검출부를 더 포함하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  52. 제1항 내지 제11항, 제28항 내지 제33항, 제40항 내지 제45항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020050055116A 2005-06-24 2005-06-24 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치 KR100718132B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020050055116A KR100718132B1 (ko) 2005-06-24 2005-06-24 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
US11/445,312 US7869891B2 (en) 2005-06-24 2006-06-02 Method and apparatus for generating bitstream of audio signal and audio encoding/decoding method and apparatus thereof
CNA2006100931314A CN1885724A (zh) 2005-06-24 2006-06-22 产生音频信号比特流方法和设备及音频编解码方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050055116A KR100718132B1 (ko) 2005-06-24 2005-06-24 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20060135268A true KR20060135268A (ko) 2006-12-29
KR100718132B1 KR100718132B1 (ko) 2007-05-14

Family

ID=37568673

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050055116A KR100718132B1 (ko) 2005-06-24 2005-06-24 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치

Country Status (3)

Country Link
US (1) US7869891B2 (ko)
KR (1) KR100718132B1 (ko)
CN (1) CN1885724A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102027815B1 (ko) 2018-05-30 2019-10-02 국민대학교산학협력단 Pin 기반의 파일 복호화 방법 및 이를 수행하는 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI371694B (en) * 2006-06-29 2012-09-01 Lg Electronics Inc Method and apparatus for an audio signal processing
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
CN105355209B (zh) 2010-07-02 2020-02-14 杜比国际公司 音高增强后置滤波器
KR20120071072A (ko) 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US8842842B2 (en) * 2011-02-01 2014-09-23 Apple Inc. Detection of audio channel configuration
US10356484B2 (en) * 2013-03-15 2019-07-16 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transceiving system, method for transmitting data, and method for receiving data
KR101427756B1 (ko) * 2013-04-26 2014-08-08 주식회사 코아로직 멀티 채널의 오디오 신호 전송 방법 및 장치
EP3376766B1 (en) * 2017-03-14 2019-01-30 Axis AB Method and encoder system for determining gop length for encoding video

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US7130316B2 (en) * 2001-04-11 2006-10-31 Ati Technologies, Inc. System for frame based audio synchronization and method thereof
EP1374230B1 (en) * 2001-11-14 2006-06-21 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102027815B1 (ko) 2018-05-30 2019-10-02 국민대학교산학협력단 Pin 기반의 파일 복호화 방법 및 이를 수행하는 장치

Also Published As

Publication number Publication date
US20060293902A1 (en) 2006-12-28
KR100718132B1 (ko) 2007-05-14
CN1885724A (zh) 2006-12-27
US7869891B2 (en) 2011-01-11

Similar Documents

Publication Publication Date Title
KR100718132B1 (ko) 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
JP6288100B2 (ja) オーディオエンコード装置及びオーディオデコード装置
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
KR100982427B1 (ko) 멀티채널 오디오 신호 부호화 및 복호화 방법
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
KR101837084B1 (ko) 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체
US11200906B2 (en) Audio encoding method, to which BRIR/RIR parameterization is applied, and method and device for reproducing audio by using parameterized BRIR/RIR information
US8948406B2 (en) Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
JP4859925B2 (ja) オーディオ信号デコーディング方法及びその装置
WO2003044775A1 (en) Perceptual noise substitution
JP2009506378A (ja) オーディオ信号デコーディング方法及びその装置
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
KR101434834B1 (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
KR20080010980A (ko) 부호화/복호화 방법 및 장치.
KR20080030848A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR20080010981A (ko) 데이터 부호화/복호화 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140429

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170607

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180508

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190508

Year of fee payment: 13