KR20070040738A - 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치 - Google Patents

오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
KR20070040738A
KR20070040738A KR1020060099425A KR20060099425A KR20070040738A KR 20070040738 A KR20070040738 A KR 20070040738A KR 1020060099425 A KR1020060099425 A KR 1020060099425A KR 20060099425 A KR20060099425 A KR 20060099425A KR 20070040738 A KR20070040738 A KR 20070040738A
Authority
KR
South Korea
Prior art keywords
data
extension
audio data
code
encoding
Prior art date
Application number
KR1020060099425A
Other languages
English (en)
Other versions
KR100851972B1 (ko
Inventor
김중회
오은미
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060067705A external-priority patent/KR20070108302A/ko
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20070040738A publication Critical patent/KR20070040738A/ko
Application granted granted Critical
Publication of KR100851972B1 publication Critical patent/KR100851972B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본 발명은 계층적으로 오디오 데이터를 부호화하는 방법 및 장치, 오디오 데이터를 복호화하는 방법 및 장치에 관한 것으로, 오디오 데이터를 계층적으로 부호화하고, 적어도 하나 이상의 부호화 기법에 따라 오디오 데이터의 적어도 하나 이상의 확장 데이터를 부호화하고, 또한 이와 같은 방식으로 복호화함으로서 FGS를 그대로 지원하면서도 오디오 데이터의 확장성을 거의 무한하게 하였다.

Description

오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치{Method and apparatus for encoding/decoding of audio data and extension data}
도 1a는 본 발명과 관련된 기술에 따른 오디오 데이터 및 확장 데이터를 복호화하는 신텍스를 도시한 것이다.
도 1b는 도 1a에 도시된 "extension_type"의 값들의 예들을 테이블로 도시한 것이다.
도 1c에 본 발명과 관련된 기술에 따른 문제점을 설명하기 위한 페이로드의 구조를 개념도로 도시한 것이다.
도 2는 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 3은 각 확장 데이터의 타입에 대응하는 각 식별 코드를 구현한 일 실시예를 테이블로 도시한 것이다.
도 4는 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 방법에서 생성된 페이로드의 일 실시예를 개념도로 도시한 것이다.
도 5는 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 6은 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 방법의 제540 단계 및 제550단계에 대한 일 실시예를 흐름도로 도시한 것이다.
도 7은 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 8은 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 장치의 확장데이터 복호화부(750)에 대한 일 실시예를 블록도로 도시한 것이다.
도 9는 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 10은 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 방법의 제940단계에 대한 일 실시예를 도시한 것이다.
도 11은 bsac_raw_data_block()의 일 실시예를 신텍스로 도시한 것이다.
도 12는 extended_bsac_sbr_data(nch.crc_flag)의 일 실시예를 신텍스로 도시한 것이다.
도 13은 bsac_sbr_data(nch,bs_amp_res)의 일 실시예를 신텍스로 도시한 것이다.
도 14는 extended_bsac_data()의 일 실시예를 신텍스로 도시한 것이다.
도 15는 신텍스에 사용된 페이로드를 정의한 테이블을 도시한 것이다.
본 발명은 오디오 데이터를 부호화/복호화하는 방법 및 장치에 관한 것으로, 특히 오디오 데이터를 확장하는 확장 데이터를 포함하여 부호화/복호화하는 방법 및 장치에 관한 것이다.
오디오 데이터를 부호화 및 복호화를 수행함에 있어서, 오디오 데이터를 소정의 용도로 확장하여 처리하기 위한 확장 데이터를 이용함으로써 오디오 데이터의 확장성를 구현한다. 이러한 확장 데이터에는 오디오 데이터의 채널을 확장하기 위한 데이터, 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 코드를 생성하기 위한 데이터 등이 있다. 상기된 확장 데이터 이외에도 오디오 데이터의 메타 데이터, 오디오 데이터의 필 엘리먼트 등도 포함될 수 있다.
도 1a는 본 발명과 관련된 기술에 따른 오디오 데이터 및 확장 데이터를 복호화하는 신텍스를 도시한 것이고, 도 1b는 도 1a에 도시된 "extension_type"의 값들의 예들을 테이블로 도시한 것이다.
참조번호 100에 마련된 신텍스는 오디오 데이터를 계층적으로 복호화하는 부분이고, 참조번호 110에 마련된 신텍스는 확장 데이터를 복호화하는 부분이다. 참조번호 110에 마련된 신텍스를 살펴보면, 오디오 데이터에 해당하는 페이로드가 종결되는 것을 나타내는 코드인 zero code 뒤에 extension type 이 마련된다. 이러한 extension type 은 확장 데이터의 타입을 나타내는 식별 코드로서 부호화단에서 전송된 페이로드에서 확장 데이터가 어떠한 타입의 확장 데이터인지를 복호화단에서 분석할 수 있도록 한다. 도 1a에 도시된 신텍스에 의해서는 확장 데이터를 이용하여 오디오 데이터의 채널을 확장하거나, 오디오 데이터의 대역폭을 확장하거나, 오디오 데이터의 대역폭을 확장하고 추가로 오디오 데이터의 대역폭을 확장하 기 위한 데이터의 전송 에러를 체크하기 위한 코드를 생성할 수 있다.
그러나 도 1a에 도시된 신텍스에 의해서는 SBR 툴(tool)에 있어서 매우 유용한 툴이 될 수 있는 멀티채널 오디오 코딩을 구현할 수 없는 문제점을 갖는다. 다시 말해서, 도 1a에 도시된 신텍스에 의해서는 확장 데이터를 이용하여 오디오 데이터의 채널을 확장시키는 동시에 오디오 데이터의 대역폭을 확장시킬 수 없다. 예를 들어, 도 1c에 도시된 바와 같이 구성된 페이로드에서는 식별번호 130에 마련된 BSAC Center"를 복호화단에서 식별할 수 있는 방법이 없으며 부호화단에서도 표시할 수 있는 방법도 없다. 그러므로 본 발명과 관련된 기술에서는 부호화 및 복호화를 수행함에 있어서, 오디오 데이터에 대한 확장 데이터를 다양한 기술을 이용하여 확장하는 데 있어서 한계가 있는 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는 오디오 데이터의 확장성을 거의 무한하게 하고, 종래의 방식에서도 지원될 수 있는 역 호환(backward compatibility)을 제공하는 장치 및 방법을 제공하는데 있다. 또한, 이 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. 이것은 본 발명이 속하는 기술 분야에서 통상을 지식을 가진 자들라면 아래의 기재로부터 명확하게 이해될 수 있다.
상기 기술적 과제를 해결하기 위한 본 발명에 따른 부호화 방법은 어느 하나의 부호화 기법에 따라 오디오 데이터를 부호화하는 단계 및 적어도 하나 이상의 부호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 부호화하는 단계를 포함하여 이루어진다.
상기 다른 기술적 과제를 해결하기 위하여, 본 발명은 상기된 부호화 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
상기 또 다른 기술적 과제를 해결하기 위한 본 발명에 따른 부호화 장치는 어느 하나의 부호화 기법에 따라 오디오 데이터를 부호화하는 제 1 부호화부 및 적어도 하나 이상의 부호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 부호화하는 제 2 부호화부를 포함하여 이루어진다.
상기 또 다른 기술적 과제를 해결하기 위한 본 발명에 따른 복호화 방법은 어느 하나의 복호화 기법에 따라 오디오 데이터를 복호화하는 단계 및 적어도 하나 이상의 복호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 복호화하는 단계를 포함하여 이루어진다.
상기 또 다른 기술적 과제를 해결하기 위하여, 본 발명은 상기된 복호화 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
상기 또 다른 기술적 과제를 해결하기 위한 본 발명에 따른 복호화 장치는 어느 하나의 복호화 기법에 따라 오디오 데이터를 복호화하는 제1 복호화부 및 적어도 하나 이상의 복호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 복호화하는 제2 복호화부를 포함하여 이루어진다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치에 대해 상세히 설명한다.
도 2는 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 상기 오디오 데이터 및 확장 데이터 부호화 장치는 오디오데이터 부호화부(200), 종결코드 생성부(210), 시작코드 생성부(220), 확장데이터 부호화부(230) 및 비트스트림 포맷터(240)를 포함하여 이루어진다.
오디오데이터 부호화부(200)는 입력단자 IN을 통하여 입력되는 오디오 신호를 부호화한다. 여기서, 오디오데이터 부호화부(200)는 오디오 데이터를 계층적으로 부호화할 수 있다.
오디오데이터 부호화부(200)에서 계층적으로 부호화하는 일 실시예로 BSAC(Bit Sliced Arithmetic Coding)에 따라 부호화하는 방식이 있다. 오디오 데이터 중 기본 계층에 해당하는 주파수 대역의 데이터를 가장 먼저 부호화하고, 기본 계층의 다음 상위 계층에 해당하는 주파수 대역의 데이터를 그 다음으로 부호화하고, 이것을 나머지 모든 계층에 해당하는 주파수 대역의 데이터의 부호화가 완료될 때까지 반복한다. 특히, 인간의 귀에 민감한 주파수 대역인 저주파수 대역폭을 기본 계층으로 하고, 고주파수 대역일수록 상위 계층으로 한다. 또한, 하위 계층 일수록 비트율(bit rate)을 낮게 할당함으로서 인간의 청취에 가장 큰 영향을 끼치는 기본 계층 등 하위 계층의 전송 신뢰도를 높이고, 아주 열악한 전송 환경에서도 무리 없이 전송될 수 있도록 한다. 또한, 오디오 데이터의 전송 환경에 부합하도록 상위 계층의 개수 및 비트율을 결정함으로서 FGS(Fine Grain Scalability)를 제공한다.
만일 오디오데이터 부호화부(200)에 입력되는 오디오 신호가 멀티 채널 신호라면, 오디오데이터 부호화부(200)는 스테레오 신호에 해당하는 소정의 두 채널만을 선택한 후 오디오 데이터를 부호화하여 실시할 수 있다. 예를 들어, 오디오 데이터는 멀티 채널 신호 가운데 FR(Front Right) 채널의 오디오 신호 및 FL(Front Left) 채널의 오디오 신호를 선택하여 오디오 데이터를 부호화한다.
종결코드 생성부(210)는 오디오데이터 부호화부(200)에서 오디오 데이터의 부호화가 완료되면, 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드인 종결 코드를 생성한다. 종결 코드는 오디오 데이터가 부호화된 페이로드 다음에 마련되도록 한다. 도 11에 도시된 신텍스에서는 종결 코드를 zero_code 로 구현한다, 이러한 zero_code 는 산술 복호화의 종료에 필요하며 32개의 연속된 0 값들로 구성된다.
시작코드 생성부(220)는 오디오데이터 부호화부(200)에서 부호화된 오디오 데이터에 대한 확장 데이터를 부호화할 경우 확장 데이터의 페이로드가 시작되는 것을 나타내는 식별 코드인 시작 코드를 생성한다. 시작코드 생성부(220)에서 생성된 시작 코드는 확장 데이터의 페이로드가 시작되는 부분에 삽입되도록 한다. 도 11에 도시된 신텍스에서는 시작 코드를 sync_word'로 구현한다. 여기서, sync_word 는 확장 데이터의 페이로드가 시작됨을 나타내는 4비트 코드로서 4개의 연속된 1 값들로 구성된다. 이러한 sync_word'는 zero_code 다음에 삽입된다.
확장데이터 부호화부(230)는 오디오데이터 부호화부(200)에서 부호화된 오디오 데이터에 대한 확장 데이터를 부호화한다. 확장 데이터는 오디오 데이터를 소정의 용도로 확장하여 처리하기 위한 데이터를 말한다. 여기서, 확장데이터 부호화부(230)는 오디오 데이터의 대역폭을 확장하는 데이터, 오디오 데이터의 채널을 확장하는 데이터, 데이터의 전송 에러를 체크하기 위한 코드를 생성하기 위한 데이터 등 가운데 적어도 어느 하나 이상을 포함하여 확장 데이터를 부호화한다. 오디오 데이터의 대역폭을 확장함에 있어서, SBR 툴을 이용하여 실시할 수 있다. 또한, 데이터의 전송 에러를 체크하기 위한 코드로 CRC 코드를 이용하여 실시할 수 있다.
여기서, 확장데이터 부호화부(230)는 확장타입코드 생성부(232), 대역폭확장데이터 부호화부(234), 에러체크코드 생성부(236), 및 채널확장데이터 부호화부(238)를 포함하여 이루어진다.
확장타입코드 생성부(232)는 확장데이터 부호화부(230)에서 부호화할 확장 데이터의 타입을 나타내는 식별 코드인 확장타입 코드를 생성한다. 확장 데이터의 타입은 오디오 데이터를 확장 데이터가 소정의 용도로 확장하기 위한 데이터인지를 나타내는 코드이다. 여기서, 확장타입코드 생성부(232)는 각 확장 데이터의 페이로드 이전에 확장 데이터의 타입에 대응하는 확장타입 코드가 마련될 수 있도록 한 다. 또한, 확장타입코드 생성부(232)는 모든 확장 데이터에 대한 부호화가 완료될 때까지 반복적으로 수행한다. 도 11에 도시된 신텍스에서는 확장타입 코드를 extension_type'로 구현한다.
도 3은 각 확장 데이터의 타입에 대응하는 각 식별 코드를 구현한 일 실시예를 테이블로 도시한 것이다. 도 3을 참조하면, extension_type"의 값 1111 은 확장 데이터가 오디오 데이터의 채널을 확장하기 위한 데이터임을 나타낸다. "extension type"의 값 0000 은 SBR 툴을 적용하여 오디오 데이터가 부호화되어 확장 데이터가 오디오 데이터의 대역폭을 확장하기 위한 데이터임을 나타낸다. "extension type"의 값 0001 은 SBR 툴을 적용하여 오디오 데이터가 부호화되어 확장 데이터가 오디오 데이터의 대역폭을 확장하기 위한 데이터와 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터로 확장 데이터가 구성되어 있음을 나타낸다. "extension type"의 값 1110 은 SBR 툴을 적용하여 오디오 데이터가 부호화되어 확장 데이터가 오디오 데이터의 대역폭을 확장하기 위한 데이터와 오디오 데이터의 채널을 확장하기 위한 데이터로 확장 데이터가 구성되어 있음을 나타낸다. "extension type"의 값 1101 은 SBR 툴을 적용하여 오디오 데이터가 부호화되어 확장 데이터가 오디오 데이터의 대역폭을 확장하기 위한 데이터, 오디오 데이터의 채널을 확장하기 위한 데이터, 및 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터로 확장 데이터가 구성되어 있음을 나타낸다.
이외에도 현재 보류된(reserved) 값들 0010 내지 1100 중 어느 하나를 소정의 확장 데이터의 타입으로 지정할 수 있다. 예를 들어, 오디오 데이터의 확장 데이터가 오디오 데이터의 메타 데이터임을 나타내게 할 수도 있고, 오디오 데이터의 필 엘리먼트임을 나타내게 할 수도 있다. 여기에서, 오디오 데이터의 메타 데이터의 예로는 오디오 데이터의 제목, 가사 등을 들 수 있고, 오디오 데이터의 필 엘리먼트란 소정의 패킷 사이즈를 준수하기 위하여 비트 스트림에 추가되는 의미 없는 비트들을 말한다.
나아가, 오디오 데이터의 확장 데이터가 이상에서 열거된 확장 타입 이외의 다른 확장 타입을 위한 데이터임을 나타내게 할 수도 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
대역폭확장데이터 부호화부(234)는 오디오데이터 부호화부(200)에서 부호화된 오디오 데이터 또는 멀티 채널의 오디오 데이터를 소정의 대역폭에 대하여만 부호화하여 복호화단에서 오디오 데이터 및 멀티 채널의 오디오 데이터에 대한 대역폭을 확장하기 위한 데이터를 부호화한다. 보다 상세하게 설명하게 설명하면, 대역폭확장데이터 부호화부(234)는 저주파수 대역의 오디오 데이터 및 멀티 채널의 오디오 데이터를 이용하여 복호화단에서 고주파수 대역의 오디오 신호를 복호화할 수 있는 데이터를 부호화한다.
오디오 데이터에 대한 대역폭을 확장할 수 있는 방법으로 SBR 툴을 이용할 수 있다. SBR 툴은 오디오 데이터의 저주파수 대역과 고주파수 대역 간에는 강한 상관 관계가 존재한다는 특성을 이용하여 기본 계층에 해당하는 저주파수 대역의 오디오 데이터로부터 상위 계층에 해당하는 고주파수 대역의 오디오 데이터를 추정하는 기법을 말한다. 즉, 기본 계층의 오디오 데이터와 기본 계층의 최대 주파수 f1과 오디오 데이터의 최대 주파수 fn 사이에 존재하는 주파수 대역의 오디오 데이터의 상관 관계를 나타내는 정보를 부호화한다. 오디오 데이터의 최대 주파수 fn은 최상위 계층의 최대 주파수 fk와 동일할 수도 있고, 그 보다 더 클 수도 있다. 일반적으로, 원본 오디오 데이터 중 최상위 계층에도 포함되지 않은 오디오 데이터가 존재하는 경우에 오디오 데이터의 최대 주파수 fn은 최상위 계층의 최대 주파수 fk보다 더 크게 된다.
에러체크코드 생성부(236)는 복호화단에서 전송 에러를 체크하기 위한 코드를 생성한다. 여기서, 에러체크코드 생성부(236)는 전송 에러를 체크하기 위한 코드로 CRC 코드를 이용하여 실시할 수 있다. 본 발명에 따른 실시예에서는 비교적 데이터의 크기가 작은 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터의 전송 에러만을 체크하기 위한 CRC 코드에 대한 내용만을 기술하고 있다. 그러나 이러한 실시예에 의하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자들이라면 오디오 데이터 및 오디오 데이터의 채널을 확장하기 위한 확장 데이터 등과 같이 복호화단으로 전송되는 데이터 가운데 적어도 하나 이상의 전송 에러를 체크하기 위한 CRC 코드까지 본 발명에 포함되어 있음을 알 수 있다. 에러체크코드 생성부(236)는 전송 에러를 체크하려는 데이터의 페이로드 앞에 데이터의 전송 에러를 체크하기 위한 코드를 생성하여 마련한다. 예를 들어, 오디오 데이터의 채널을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 코드는 오디오 데이터의 채널 을 확장하기 위한 데이터의 페이로드 이전에 마련한다.
채널확장데이터 부호화부(238)는 복호화단에서 오디오 데이터의 채널을 확장하기 위한 데이터를 부호화한다.
비트스트림 포맷터(240, bit stream formatter)는 오디오데이터 부호화부(200), 종결코드 생성부(210), 시작코드 생성부(220), 및 확장데이터 부호화부(230)에서 부호화하여 출력된 페이로드 및 생성된 코드를 비트스트림으로 생성하여 출력단자 OUT을 통해 출력한다. 여기서, 비트스트림 포맷터(240)는 부호화된 오디오 데이터의 페이로드, 종결 코드 순으로 다중화하여 비트스트림을 생성한다. 확장 데이터가 부호화된 경우, 전술한 페이로드 및 종결 코드에 부가하여 시작 코드, 제1 확장 데이터의 타입을 나타내는 식별 코드, 제1 확장 데이터가 부호화된 페이로드, 제2 확장 데이터의 타입을 나타내는 식별 코드, 제2 확장 데이터가 부호화된 페이로드, ... , 제N 확장 데이터의 타입을 나타내는 식별 코드, 제N 확장 데이터가 부호화된 페이로드 순으로 추가로 포함하여 다중화함으로써 비트스트림을 생성한다.
도 4는 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 방법에서 생성된 페이로드의 일 실시예를 개념도로 도시한 것이다. 각 확장 데이터의 페이로드 이전에 확장 데이터의 타입을 나타내는 식별 코드가 마련된 예를 도 4에서 살펴보면 다음과 같다. 식별번호 400에 오디오데이터 부호화부(200)에서 부호화된 FL 채널 및 FR 채널의 오디오 데이터가 마련되어 있다. 식별번호 401에 종결 코드인 zero_code'가 마련되어 있으며, 식별번호 402에 시작 코드인 sync_word'가 마련되 어 있다. 식별번호 403에 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 나타내는 확장타입 코드인 0000 이 마련되어 있다. 식별번호 404에 오디오데이터 부호화부(200)에서 부호화된 FL 채널 및 FR 채널의 오디오 데이터에 대하여 대역폭을 확장하기 위한 확장 데이터인 SBR for FL/FR"이 마련되어 있다. 식별번호 405에 오디오 데이터의 채널을 확장하고 확장된 채널의 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터임을 나타내는 식별 코드 1110 이 마련되어 있다. 식별번호 406에 C(Center) 채널로 채널을 확장하는 확장 데이터인 BSAC Center"가 마련되어 있고, 식별번호 407에 C 채널의 오디오 데이터에 대한 대역폭을 확장하는 확장 데이터인 SBR for Center"가 마련되어 있다. 식별번호 408에 오디오 데이터의 채널을 확장하고 확장된 채널의 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터임을 나타내는 식별 코드 1110 이 마련되어 있다. 식별번호 409에 SL(Surround Left) 채널 및 SR(Surround Right) 채널로 채널을 확장하는 확장 데이터인 BSAC SL/SR"가 마련되어 있고, 식별번호 410에 SL 채널 및 SR 채널의 오디오 데이터에 대한 대역폭을 확장하는 확장 데이터인 SBR for SL/SR"가 마련되어 있다. 식별번호 411에 오디오 데이터의 채널을 확장하기 위한 확장 데이터임을 나타내는 식별 코드 1111 이 마련되어 있다. 식별번호 412에 LEF(Low Enhancement Frequency) 채널로 오디오 데이터의 채널을 확장하는 데이터인 BSAC LEF"이 마련되어 있다.
도 5는 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 오디오 신호를 입력받아 부호화한다(제500단계). 제500단계에서는 오디오 신호를 계층적으로 부호화할 수 있다.
제500단계에서 계층적으로 부호화하는 일 실시예로 BSAC에 따라 부호화하는 방식이 있다. 오디오 데이터 중 기본 계층에 해당하는 주파수 대역의 데이터를 가장 먼저 부호화하고, 기본 계층의 다음 상위 계층에 해당하는 주파수 대역의 데이터를 그 다음으로 부호화하고, 이것을 나머지 모든 계층에 해당하는 주파수 대역의 데이터의 부호화가 완료될 때까지 반복한다. 특히, 인간의 귀에 민감한 주파수 대역인 저주파수 대역폭을 기본 계층으로 하고, 고주파수 대역일수록 상위 계층으로 한다. 또한, 본 실시예에서는 하위 계층일수록 비트율을 낮게 할당함으로서 인간의 청취에 가장 큰 영향을 끼치는 기본 계층 등 하위 계층의 전송 신뢰도를 높이고, 아주 열악한 전송 환경에서도 무리 없이 전송될 수 있도록 한다. 또한, 오디오 데이터의 전송 환경에 부합하도록 상위 계층의 개수 및 비트율을 결정함으로서 FGS를 제공한다.
제500단계에서 입력되는 오디오 신호가 멀티 채널 신호라면, 제500단계에서는 스테레오 신호에 해당하는 소정의 두 채널만 선택한 후 오디오 데이터를 부호화하여 실시할 수 있다. 예를 들어, 멀티 채널 신호 가운데 FR 채널의 오디오 신호 및 FL 채널의 오디오 신호를 선택하여 스테레오에 해당하는 오디오 데이터를 부호화한다.
제500단계에서 오디오 데이터의 부호화가 완료되면, 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드인 종결 코드를 생성한다(제 510단계). 여기서, 종결 코드는 부호화된 오디오 데이터의 페이로드 다음에 마련되도록 한다. 도 11에 도시된 신텍스에서는 종결 코드를 zero_code 로 구현한다. 이러한 zero_code 는 산술 복호화의 종료에 필요하며 32개의 연속된 0 값들로 구성된다.
제510단계 후에, 제500단계에서 부호화된 오디오 데이터에 대한 확장 데이터를 부호화하여야 하는지 여부를 판단한다(제520단계). 여기서, 확장 데이터는 오디오 데이터를 소정의 용도로 확장하여 처리하기 위한 데이터를 말한다.
제520단계에서 확장 데이터를 부호화하여야 한다고 판단되면, 확장 데이터의 페이로드가 시작되는 것을 나타내는 식별 코드인 시작 코드를 생성한다(제530단계). 제530단계에서 생성되는 시작 코드는 확장 데이터의 페이로드가 시작되는 부분에 삽입되도록 한다. 도 11에 도시된 신텍스에서는 시작 코드를 sync_word'로 구현한다. 여기서, sync_word'는 확장 데이터의 페이로드가 시작됨을 나타내는 4비트 코드로서 4개의 연속된 1 값들로 구성된다. 이러한 sync_word'는 zero_code 다음에 삽입된다.
제530단계 후에, 부호화할 확장 데이터의 타입을 나타내는 식별 코드인 확장타입 코드를 생성한다(제540단계). 여기서, 확장 데이터의 타입은 오디오 데이터를 확장 데이터가 소정의 용도로 확장하기 위한 데이터인지를 나타내는 코드이다.
제540단계에서 생성된 확장타입 코드에 대응하는 타입의 확장 데이터를 부호화한다(제550단계).
제550단계 후에, 추가로 부호화할 확장 데이터가 있는지 여부를 판단한다(제 560단계).
만일 제560단계에서 추가로 부호화할 확장 데이터가 있다고 판단되면, 제540단계 내지 제560단계를 반복하여 수행한다.
만일 제560단계에서 추가로 부호화할 확장 데이터가 없다고 판단되면, 제500단계에서 부호화된 오디오 데이터의 페이로드, 종결 코드 순으로 다중화하여 비트스트림을 생성한다(제570단계). 확장 데이터가 부호화된 경우, 전술한 페이로드 및 종결 코드에 부가하여 시작 코드, 제1 확장 데이터의 타입을 나타내는 식별 코드, 제1 확장 데이터가 부호화된 페이로드, 제2 확장 데이터의 타입을 나타내는 식별 코드, 제2 확장 데이터가 부호화된 페이로드, ... , 제N 확장 데이터의 타입을 나타내는 식별 코드, 제N 확장 데이터가 부호화된 페이로드 순으로 추가로 포함하여 다중화함으로써 비트스트림을 생성한다.
도 6은 본 발명에 의한 오디오 데이터 및 확장 데이터 부호화 방법의 제540단계 및 제550단계에 대한 일 실시예를 흐름도로 도시한 것이다.
제530단계 후에, 부호화할 확장 데이터가 BSAC channel extension'인 오디오 데이터의 채널을 확장하기 위한 데이터인지 여부를 판단한다(제600단계).
만일 제600단계에서 확장 데이터가 오디오 데이터의 채널을 확장하기 위한 데이터라고 판단되면, 확장 데이터의 타입을 나타내는 extension_type"의 값으로 1111 을 생성한다(제610단계). 제610단계 후에, 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 부호화한다(제620단계). 제620단계에서 부호화된 확장 데이터의 페이로드는 제610단계에서 생성된 1111 확장타입 코드 다음에 마련되는 것이 바람직하다.
만일 제600단계에서 확장 데이터가 오디오 데이터의 채널을 확장하기 위한 데이터가 아니라고 판단되면, 부호화할 확장 데이터가 BSAC SBR enhancement'인 오디오 데이터의 대역폭을 확장하기 위한 데이터인지 여부를 판단한다(제601단계).
제601단계에서 확장 데이터가 오디오 데이터의 대역폭을 확장하기 위한 데이터라고 판단되면, 확장 데이터의 타입을 나타내는 extension_type"의 값으로 0000 을 생성한다(제611단계). 제611단계 후에, 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 부호화한다(제621단계). 제621단계에서 부호화된 확장 데이터의 페이로드는 제611단계에서 생성된 0000 확장타입 코드 다음에 마련되는 것이 바람직하다.
만일 제601단계에서 확장 데이터가 오디오 데이터의 대역폭을 확장하기 위한 데이터가 아니라고 판단되면, 부호화할 확장 데이터가 BSAC SBR enhancement with CRC'인 오디오 데이터의 대역폭을 확장하고 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터인지 여부를 판단한다(제602단계).
제602단계에서 확장 데이터가 오디오 데이터의 대역폭을 확장하고 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터라고 판단되면, 확장 데이터의 타입을 나타내는 extension_type"의 값으로 0001 을 생성한다(제612단계). 제612단계 후에, 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의대역폭을 확장하기 위한 확장 데이터를 부호화하고(제622단계), 오디오 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터를 부호화한다(제623단계). 제622단계 및 제623단계에서 부호화된 확장 데이터의 페이로드는 제612단계에서 생성된 0001 확장타입 코드 다음에 마련되는 것이 바람직하다.
만일 제602단계에서 확장 데이터가 오디오 데이터의 대역폭을 확장하고 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터가 아니라고 판단되면, 부호화할 확장 데이터가 BSAC channel extension with SBR'인 오디오 데이터의 채널을 확장하고 오디오 데이터의 대역폭을 확장하기 위한 데이터인지 여부를 판단한다(제603단계).
제603단계에서 확장 데이터가 오디오 데이터의 채널을 확장하고 오디오 데이터의 대역폭을 확장하기 위한 데이터라고 판단되면, 확장 데이터의 타입을 나타내는 extension_type"의 값으로 1110 을 생성한다(제613단계). 제613단계 후에, 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 부호화하고(제624단계), 오디오 데이터의 대역폭을 확장하기 위한 데이터를 부호화한다(제625단계). 제624단계 및 제625단계에서 부호화된 확장 데이터의 페이로드는 제613단계에서 생성된 1110 확장타입 코드 다음에 마련되는 것이 바람직하다.
만일 제603단계에서 확장 데이터가 확장 데이터가 오디오 데이터의 채널을 확장하고 오디오 데이터의 대역폭을 확장하기 위한 데이터가 아니라고 판단되면, 부호화할 확장 데이터가 BSAC channel extension with SBR_CRC'인 오디오 데이터의 채널을 확장하고 오디오 데이터의 대역폭을 확장하며 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터인지 여부를 판단한다(제604단계).
제604단계에서 확장 데이터가 오디오 데이터의 채널을 확장하고 오디오 데이터의 대역폭을 확장하며 오디오 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터라고 판단되면, 확장 데이터의 타입을 나타내는 extension_type"의 값으로 1101 을 생성한다(제614단계). 제614단계 후에, 오디오 데이터의 채널을 확장하기 위한 데이터, 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 부호화하며(제627단계), 오디오 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 확장 데이터를 부호화한다(제628단계). 제627단계 및 제628단계에서 부호화된 확장 데이터의 페이로드는 제614단계에서 생성된 1101 확장타입 코드 다음에 마련되는 것이 바람직하다.
제604단계에서 확장 데이터가 오디오 데이터의 채널을 확장하고 오디오 데이터의 대역폭을 확장하며 추가로 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 데이터가 아니라고 판단되면, 0010 내지 1100 가운데 기 설정된 식별코드를 생성한다(제615단계). 제615단계에서 생성된 식별코드에 대응하는 타입의 확장 데이터를 부호화한다(제629단계).
도 7은 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 장치에 대한 일 실시예를 블록도로 도시한 것, 비트스트림 디포맷터(700), 오디오데이터 복호화부(710), 종결코드 검출부(720), 시작코드 검출부(730), 확장타입 검출부(740), 확 장데이터 복호화부(750), 및 데이터 정렬부(760)를 포함하여 이루어진다.
비트스트림 디포맷터(700, bit stream deformatter)는 부호화단으로부터 전송된 비트스트림을 입력단자 IN을 통해 입력받아 디포맷(deformat)하여 페이로드를 출력한다.
오디오데이터 복호화부(710)는 비트스트림 디포맷터(700)에서 출력된 페이로드 가운데 오디오 데이터를 복호화한다. 여기서, 오디오데이터 복호화부(710)는 계층적으로 부호화된 오디오 데이터를 복호화할 수 있다.
오디오데이터 복호화부(710)에서 계층적으로 부호화된 오디오 데이터를 복호화하는 일 실시예로 BSAC 방식에 따라 복호화하는 방식이 있다. 오디오 데이터를 복호화함에 있어서 오디오데이터 복호화부(710)는 도 11에 도시된 신텍스에서 식별번호 1100에 해당하는 프로세스를 수행한다. 오디오 데이터 중 기본 계층에 해당하는 주파수 대역의 데이터를 가장 먼저 복호화하고, 기본 계층의 다음 상위 계층에 해당하는 주파수 대역의 데이터를 그 다음으로 복호화하며, 이것을 나머지 모든 계층에 해당하는 주파수 대역의 데이터에 대한 복호화가 완료될 때까지 반복하여 수행한다.
또한, 오디오데이터 복호화부(710)는 오디오 데이터에 대한 복호화가 완료되면, 복호화된 오디오 데이터를 바이트 단위로 정렬한다. 여기서, 오디오데이터 복호화부(710)는 바이트 단위로 정렬하고 남은 부분은 더미 데이터(dummy data)로 채운다. 오디오 데이터를 바이트 단위로 정렬함에 있어서 오디오데이터 복호화부(710)는 도 11에 도시된 신텍스에서 식별번호 1105에 해당하는 프로세스를 수행 한다.
종결코드 검출부(720)는 오디오데이터 복호화부(710)에서 복호화를 수행한 후 아직 복호화되지 않은 페이로드가 있다고 판단되면, 비트스트림 디포맷터(700)에서 디포맷된 페이로드에서 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드인 종결 코드를 검출한다. BSAC의 신텍스에서는 종결 코드를 zero_code 로 구현한다. 이러한 zero_code 는 산술 복호화의 종료에 필요하며 32개의 연속된 0 값들로 구성된다. 종결코드 검출부(720)는 도 11에 도시된 신텍스에서 식별번호 1105에 해당하는 프로세스를 수행한다.
시작코드 검출부(730)는 비트스트림 디포맷터(700)에서 디포맷된 페이로드에서 확장 데이터가 시작되는 것을 나타내는 식별 코드인 시작 코드를 검출한다. BSAC의 신텍스에서는 시작 코드를 sync_word'로 구현한다. 이러한 sync_word'는 4비트 부호로서 4개의 연속된 1 값들로 구성된다. 시작코드 검출부(730)는 도 11에 도시된 신텍스에서 식별번호 1120에 해당하는 프로세스를 수행한다.
확장타입 검출부(740)는 복호화되지 않은 페이로드의 비트 수가 기 설정된 값 보다 크다고 판단되면, 부호화단에서 부호화된 확장 데이터의 타입을 나타내는 식별 코드를 검출한다. 여기서, 확장 데이터의 타입은 오디오 데이터를 확장 데이터가 소정의 용도로 확장하기 위한 데이터인지를 나타내는 코드이다. 확장타입 검출부(740)는 도 11에 도시된 신텍스에서 식별번호 1130에 해당하는 프로세스를 수행한다.
확장타입 검출부(740)에서 판단하는 복호화되지 않은 페이로드의 비트 수가 기 설정된 값 보다 큰지 여부는 도 11에 도시된 신텍스에서 식별번호 1125에 의하여 수행된다. 여기서, 기 설정된 값은 extention_type'에 할당된 4비트로 실시되어 있다. 그러나 기 설정된 값은 4 에 한정하여 실시해야 하는 것은 아니다.
확장데이터 복호화부(750)는 확장타입 검출부(740)에서 검출된 확장 타입에 대응하는 확장 데이터를 복호화한다. 확장데이터 복호화부(750)는 도 11에 도시된 신텍스에서 식별번호 1140 내지 1197에 해당하는 프로세스를 수행한다.
여기서, 확장데이터 복호화부(750)는 확장타입 검출부(740)에서 검출된 확장 타입이 복호화단에 설정되어 있는지 여부를 판단한다. 이는 도 11에 도시된 신텍스에서 식별번호 1196에 해당하는 프로세스에 의해 수행된다. 예를 들어, 복호화단에 도 3에 도시된 테이블과 같이 확장 타입이 설정되어 있는 경우, 확장데이터 복호화부(750)는 확장타입 검출부(740)에서 검출된 확장 타입이 0010 내지 1100 에 해당하는지 여부를 기준으로 판단한다. 확장데이터 복호화부(750)에서 확장 타입이 복호화단에 설정되어 있지 않다고 판단되면, 데이터 폐기부(759)는 확장타입 검출부(740)에서 검출된 확장 타입에 대응하는 확장 데이터의 바이트 수만큼 버린다. 이는 도 11에 도시된 신텍스에서 식별번호 1197에 해당하는 함수에 의하여 수행되며, 보다 상세한 신텍스는 도 14에 도시되어 있다.
확장데이터 복호화부(750)는 확장타입 검출부(740)에서 검출된 확장 타입이 복호화단에 설정되어 있다고 판단되면, 제1 확장데이터 복호화부(751), ... , 및 제N 확장데이터 복호화부(758) 가운데 어느 하나에 의해서 확장타입 검출부(740)에서 검출된 확장 타입에 대응하는 확장 데이터를 복호화한다.
확장데이터 복호화부(750)에서 확장 데이터를 복호화한 후, 복호화되지 않은 페이로드의 비트 수가 기 설정된 값 보다 크다고 판단되면, 확장타입 검출부(740) 및 확장데이터 복호화부(750)는 전술된 프로세스를 반복하여 수행한다. 만일 복호화되지 않은 페이로드의 비트 수가 기 설정된 값과 같거나 작다고 판단되면, 데이터 정렬부(760)는 확장데이터 복호화부(750)에서 복호화한 확장 데이터를 바이트 단위로 정렬한다. 여기서, 데이터 정렬부(760)는 바이트 단위로 정렬하고 남은 부분은 더미 데이터로 채운다. 제950단계는 도 11에 도시된 신텍스에서 식별번호 1198에 해당하는 프로세스를 수행한다.
도 8은 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 장치의 확장데이터 복호화부(750)에 대한 일 실시예를 블록도로 도시한 것이다.
만일 확장타입 검출부(740)에서 검출한 확장 타입이 1111 이라면, 채널확장데이터 복호화부(800)는 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 복호화한다.
만일 확장타입 검출부(740)에서 검출한 확장 타입이 0000 이라면, SBR데이터 복호화부(820)는 SBR 툴을 적용하여 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다.
만일 확장타입 검출부(740)에서 검출한 확장 타입이 0001 이라면, CRC코드 생성부(810)는 SBR데이터 복호화부(820)에서 복호화하는 확장 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 확장 데이터를 복호화하고, SBR데이터 복호화부(820)는 SBR 툴을 적용하여 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다.
만일 확장타입 검출부(740)에서 검출한 확장 타입이 1110 이라면, 채널확장데이터 복호화부(800)는 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 복호화하고, SBR데이터 복호화부(820)는 SBR 툴을 적용하여 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다.
만일 확장타입 검출부(740)에서 검출한 확장 타입이 1101 이라면, 채널확장데이터 복호화부(800)는 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 복호화하고, CRC코드 생성부(810)는 SBR데이터 복호화부(820)에서 복호화하는 확장 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 확장 데이터를 복호화하며, SBR데이터 복호화부(820)는 SBR 툴을 적용하여 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다.
도 9는 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 부호화단으로부터 전송된 비트스트림을 디포맷(deformat)하여 페이로드를 출력한다(제900단계).
제900단계에서 출력된 페이로드 가운데 오디오 데이터를 복호화한다(제903단계). 제903단계에서는 계층적으로 부호화된 오디오 데이터를 복호화할 수 있다.
제903단계에서 계층적으로 부호화된 오디오 데이터를 복호화하는 일 실시예로 BSAC 방식에 따라 복호화하는 방식이 있다. 제903단계는 도 11에 도시된 신텍스에서 식별번호 1100에 의하여 수행된다. 오디오 데이터 중 기본 계층에 해당하 는 주파수 대역의 데이터를 가장 먼저 복호화하고, 기본 계층의 다음 상위 계층에 해당하는 주파수 대역의 데이터를 그 다음으로 복호화하며, 이것을 나머지 모든 계층에 해당하는 주파수 대역의 데이터에 대한 복호화가 완료될 때까지 반복하여 수행한다.
제903단계에서 복호화한 오디오 데이터를 바이트 단위로 정렬한다(제905단계). 제905단계에서는 바이트 단위로 정렬하고 남은 부분은 더미 데이터(dummy data)로 채운다. 제905단계는 도 11에 도시된 신텍스에서 식별번호 1105에 의하여 수행된다.
제905단계 후에, 제900단계에서 출력된 페이로드 가운데 아직 복호화되지 않은 데이터가 있는지 여부를 판단한다(제910단계). 제910단계는 도 11에 도시된 신텍스에서 식별번호 1110에 의하여 수행된다.
만일 제910단계에서 아직 복호화되지 않은 페이로드가 없다고 판단되면, 제900단계에서 전송받은 비트스트림에 대한 복호화를 종료한다.
만일 제910단계에서 아직 복호화되지 않은 페이로드가 있다고 판단되면, 제900단계에서 디포맷된 페이로드에서 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드인 종결 코드를 검출한다(제915단계). BSAC의 신텍스에서는 종결 코드를 zero_code 로 구현한다. 이러한 zero_code 는 산술 복호화의 종료에 필요하며 32개의 연속된 0 값들로 구성된다. 제915단계는 도 11에 도시된 신텍스에서 식별번호 1105에 의하여 수행된다.
제915단계 후에, 제900단계에서 디포맷된 페이로드에서 확장 데이터가 시작 되는 것을 나타내는 식별 코드인 시작 코드를 검출한다(제920단계). BSAC의 신텍스에서는 시작 코드를 sync_word'로 구현한다. 이러한 sync_word'는 4비트 부호로서 4개의 연속된 1 값들로 구성된다. 제920단계는 도 11에 도시된 신텍스에서 식별번호 1120에 의하여 수행된다.
제920단계 후에, 복호화되지 않은 페이로드의 비트 수가 기 설정된 값 보다 큰지 여부를 판단한다(제925단계). 제925단계는 도 11에 도시된 신텍스에서 식별번호 1125에 의하여 수행된다. 도 11에서는 extention_type'에 할당된 4비트로 설정되어 있다. 그러나 기 설정된 값을 4 에 한정하여 실시해야 하는 것은 아니다.
만일 제925단계에서 복호화되지 않은 페이로드의 비트 수가 기 설정된 값과 같거나 작다고 판단되면, 제940단계에서 복호화한 확장 데이터를 바이트 단위로 정렬한다(제950단계). 제950단계에서는 바이트 단위로 정렬하고 남은 부분은 더미 데이터로 채운다. 제950단계는 도 11에 도시된 신텍스에서 식별번호 1198에 의하여 수행된다.
만일 제925단계에서 복호화되지 않은 페이로드의 비트 수가 기 설정된 값 보다 크다고 판단되면, 부호화단에서 부호화된 확장 데이터의 타입을 나타내는 식별 코드를 검출한다(제930단계). 여기서, 확장 데이터의 타입은 오디오 데이터를 확장 데이터가 소정의 용도로 확장하기 위한 데이터인지를 나타내는 코드이다. 제930단계는 도 11에 도시된 신텍스에서 식별번호 1130에 의하여 수행된다.
제930단계에서 검출된 확장 타입이 복호화단에 설정되어 있는지 여부를 판단 한다(제935단계). 제935단계는 도 11에 도시된 신텍스에서 식별번호 1196에 의하여 수행된다. 예를 들어, 복호화단에 도 3에 도시된 테이블과 같이 확장 타입이 설정되어 있는 경우, 제935단계는 제930단계에서 검출된 확장 타입이 0010 내지 1100 에 해당하는지 여부를 기준으로 판단한다.
제935단계에서 확장 타입이 복호화단에 설정되어 있다고 판단되면, 제930단계에서 검출된 확장 타입에 대응하는 확장 데이터를 복호화한다(제940단계). 제940단계는 도 11에 도시된 신텍스에서 식별번호 1140 내지 1195에 의하여 수행된다.
제935단계에서 확장 타입이 복호화단에 설정되어 있지 않다고 판단되면, 제930단계에서 검출된 확장 타입에 대응하는 확장 데이터의 바이트 수만큼 버린다(제945단계). 제945단계는 도 11에 도시된 신텍스에서 식별번호 1197에 의하여 수행되고, 식별번호 1197의 함수는 도 14에 상세하게 도시되어 있다.
제940단계 또는 제950단계 후에, 제925단계를 반복하여 수행한다.
도 10은 본 발명에 의한 오디오 데이터 및 확장 데이터 복호화 방법의 제940단계에 대한 일 실시예를 도시한 것이다. 도 11 내지 13을 참조하여 설명하기로 한다. 도 13은 도 12에서 이용되는 함수를 신텍스로 도시한 것이다.
제930단계에서 검출된 확장 타입이 1111 인지 여부를 판단한다(제1000단계). 제1000단계는 도 11에 도시된 신텍스에서 식별번호 1140에 의하여 수행된다.
만일 제1000단계에서 확장 타입이 1111 이라고 판단되면, 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 복호화한다(제1001단계). 제1001단계는 도 11에 도시된 신텍스에서 식별번호 1145에 의하여 수행된다.
만일 제1000단계에서 확장 타입이 1111 이 아니라고 판단되면, 제930단계에서 검출된 확장 타입이 1010 인지 여부를 판단한다(제1010단계). 제1010단계는 도 11에 도시된 신텍스에서 식별번호 1150에 의하여 수행된다.
만일 제1010단계에서 확장 타입이 1010 이라고 판단되면, 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다(제1011단계). 제1011단계는 도 11에 도시된 신텍스에서 식별번호 1155에 의하여 수행되며, 식별번호 1155의 함수는 도 12에 상세하게 도시되어 있다.
만일 제1010단계에서 확장 타입이 1010 이 아니라고 판단되면, 제930단계에서 검출된 확장 타입이 0001 인지 여부를 판단한다(제1020단계). 제1020단계는 도 11에 도시된 신텍스에서 식별번호 1160에 의하여 수행된다.
만일 제1020단계에서 확장 타입이 0001 이라고 판단되면, 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 확장 데이터를 복호화한다(제1021단계). 제1021단계 후에, 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다(제1022단계). 제1021단계 및 제1022단계는 도 11에 도시된 신텍스에서 식별번호 1165에 의하여 수행되며, 식별번호 1165의 함수는 도 12에 상세하게 도시되어 있다.
만일 제1020단계에서 확장 타입이 0001 이 아니라고 판단되면, 제930단계에서 검출된 확장 타입이 1110 인지 여부를 판단한다(제1030단계). 제1030단계는 도 11에 도시된 신텍스에서 식별번호 1170에 의하여 수행된다.
만일 제1030단계에서 확장 타입이 1110 이라고 판단되면, 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 복호화한다(제1031단계). 제1031단계 후에, 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다(제1032단계). 제1031단계는 도 11에 도시된 신텍스에서 식별번호 1175에 의하여 수행되고, 제1032단계는 도 11에 도시된 신텍스에서 식별번호 1180에 의하여 수행되며, 식별번호 1180의 함수는 도 12에 상세하게 도시되어 있다.
만일 제1030단계에서 확장 타입이 1110 이 아니라고 판단되면, 제930단계에서 검출된 확장 타입이 1101 인지 여부를 판단한다(제1040단계). 제1040단계는 도 11에 도시된 신텍스에서 식별번호 1185에 의하여 수행된다.
만일 제1040단계에서 확장 타입이 1101 이라고 판단되면, 오디오 데이터의 채널을 확장하기 위한 확장 데이터를 복호화한다(제1041단계). 제1041단계 후에, 오디오 데이터의 대역폭을 확장하기 위한 데이터의 전송 에러를 체크하기 위한 CRC 코드를 생성하기 위한 확장 데이터를 복호화한다(제1042단계). 제1042단계 후에, 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터를 복호화한다(제1043단계). 제1041단계는 도 11에 도시된 신텍스에서 식별번호 1190에 의하여 수행되고, 제1042단계 및 제1043단계는 도 11에 도시된 신텍스에서 식별번호 1195에 의하여 수행되며, 식별번호 1195의 함수는 도 12에 상세하게 도시되어 있다.
본 발명에 따른 실시예에서는 비교적 데이터의 크기가 작은 오디오 데이터의 대역폭을 확장하기 위한 확장 데이터의 전송 에러만을 체크하기 위한 CRC 코드에 대한 내용만을 기술하고 있다. 그러나 이러한 실시예에 의하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자들이라면 오디오 데이터 및 오디오 데이터의 채널을 확장하기 위한 확장 데이터 등과 같이 복호화단으로 전송되는 데이터 가운데 적어도 하나 이상의 전송 에러를 체크하기 위한 CRC 코드까지 본 발명에 포함되어 있음을 알 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
본 발명에 따르면, 오디오 데이터를 계층적으로 부호화하고, 적어도 하나 이상의 부호화 기법에 따라 오디오 데이터의 적어도 하나 이상의 확장 데이터를 부호화하고, 또한 이와 같은 방식으로 복호화함으로서 FGS를 그대로 지원하면서도 오디오 데이터의 확장성을 거의 무한하게 하는 효과를 갖는다.
또한, 본 발명에 따르면, 8 비트의 extension type으로부터 분리된 확장 데이터의 부호화 부분이 시작됨을 나타내는 4 비트의 sync_word 및 확장 데이터의 확장 타입을 나타내는 4 비트의 extension_type를 제안함으로써 도 1a에 도시된 신택스를 따르는 본 발명과 관련된 기술도 지원할 수 있는 역 호환(backward compatibility)을 제공하였다는 효과가 있다.

Claims (34)

  1. 어느 하나의 부호화 기법에 따라 오디오 데이터를 부호화하는 단계; 및
    적어도 하나 이상의 부호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 부호화하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  2. 제1항에 있어서,
    상기 오디오 데이터를 부호화하는 단계는 제1 부호화 기법에 따라 상기 오디오 데이터를 계층적으로 부호화하고,
    상기 확장 데이터를 부호화하는 단계는 상기 제1 부호화 기법을 포함하는 적어도 하나 이상의 부호화 기법에 따라 상기 적어도 하나 이상의 확장 데이터를 부호화하는 것을 특징으로 하는 부호화 방법.
  3. 제1항에 있어서,
    상기 확장 데이터를 부호화하는 단계는 선택적으로 상기 오디오 데이터의 채널을 확장하기 위한 데이터를 부호화하는 것을 특징으로 하는 부호화 방법.
  4. 제1항에 있어서,
    상기 확장 데이터를 부호화하는 단계는 선택적으로 상기 오디오 데이터의 대 역폭을 확장하기 위한 데이터를 부호화하는 것을 특징으로 하는 부호화 방법.
  5. 제1항에 있어서,
    상기 확장 데이터를 부호화하는 단계는 상기 오디오 데이터의 채널을 확장하기 위한 데이터를 계층적으로 부호화하는 과정과 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터를 부호화하는 과정 중 적어도 하나 이상을 수행하는 것을 특징으로 하는 부호화 방법.
  6. 제1항에 있어서,
    상기 확장 데이터를 부호화하는 단계는 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터를 부호화하고, 선택적으로 에러를 체크하기 위한 코드를 부호화하는 것을 특징으로 하는 부호화 방법.
  7. 제1항에 있어서,
    상기 확장 데이터의 확장 타입을 나타내는 코드를 생성하는 단계를 더 포함하고,
    상기 확장 데이터를 부호화하는 단계는 상기 생성된 코드가 나타내는 적어도 하나 이상의 부호화 기법에 따라 부호화하는 것을 특징으로 하는 부호화 방법.
  8. 제7항에 있어서,
    상기 확장 타입은 상기 확장 데이터가 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터, 상기 오디오 데이터의 메타(meta) 데이터, 상기 오디오 데이터의 필 엘리먼트(fill element) 중 적어도 하나 이상을 위한 데이터라는 것을 나타냄을 특징으로 하는 부호화 방법.
  9. 제1항에 있어서,
    상기 확장 데이터의 부호화 부분이 시작됨을 나타내는 제1 코드를 생성하는 단계; 및
    상기 확장 데이터의 확장 타입을 나타내는 제2 코드를 생성하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  10. 제9항에 있어서,
    상기 오디오 데이터의 부호화 부분 다음에 상기 오디오 데이터의 부호화 부분이 종결됨을 나타내는 제3 코드를 삽입하는 단계를 더 포함하고,
    상기 제1 코드를 생성하는 단계는 상기 삽입된 제3 코드 다음에 상기 생성된 제1 코드를 삽입하고,
    상기 제2 코드를 생성하는 단계는 상기 삽입된 제1 코드 다음에 상기 생성된 제2 코드를 삽입하는 것을 특징으로 하는 부호화 방법.
  11. 제9항에 있어서,
    상기 제1 코드는 4 비트 부호로서 4 개의 연속된 1 값들로 구성되고, 상기 제2 코드는 4 비트 부호인 것을 특징으로 하는 부호화 방법.
  12. 제1항에 있어서,
    상기 확장 데이터의 부호화 부분 다음에 다른 확장 데이터의 확장 타입을 나타내는 코드를 부가하는 단계; 및
    상기 확장 데이터를 부호화하는 단계를 더 포함하고,
    상기 코드를 부가하는 단계 및 상기 확장 데이터를 부호화하는 단계는 상기 확장 데이터 및 상기 다른 확장 데이터 이외의 나머지 모든 확장 데이터의 부호화가 완료될 때까지 반복적으로 수행됨을 특징으로 하는 부호화 방법.
  13. 제 1 항 내지 제 12 항 중에 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  14. 어느 하나의 부호화 기법에 따라 오디오 데이터를 부호화하는 제1 부호화부; 및
    적어도 하나 이상의 부호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 부호화하는 제2 부호화부를 포함하는 것을 특징으로 하는 부호화 장치.
  15. 어느 하나의 복호화 기법에 따라 오디오 데이터를 복호화하는 단계; 및
    적어도 하나 이상의 복호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 복호화하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  16. 제15항에 있어서,
    상기 오디오 데이터를 부호화하는 단계는 제1 복호화 기법에 따라 상기 오디오 데이터를 계층적으로 복호화하고,
    상기 확장 데이터를 부호화하는 단계는 상기 제1 복호화 기법을 포함하는 적어도 하나 이상의 복호화 기법에 따라 상기 적어도 하나 이상의 확장 데이터를 복호화하는 것을 특징으로 하는 복호화 방법.
  17. 제15항에 있어서,
    상기 확장 데이터를 복호화하는 단계는 선택적으로 상기 오디오 데이터의 채널을 확장하기 위한 데이터를 복호화하는 것을 특징으로 하는 복호화 방법.
  18. 제15항에 있어서,
    상기 확장 데이터를 복호화하는 단계는 선택적으로 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터를 복호화하는 것을 특징으로 하는 복호화 방법.
  19. 제15항에 있어서,
    상기 확장 데이터를 복호화하는 단계는 상기 오디오 데이터의 채널을 확장하기 위한 데이터를 계층적으로 복호화하는 과정과 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터를 복호화하는 과정 중 적어도 하나 이상을 수행하는 것을 특징으로 하는 복호화 방법.
  20. 제15항에 있어서,
    상기 확장 데이터를 복호화하는 단계는 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터를 복호화하고, 선택적으로 전송 에러를 체크하기 위한 코드를 복호화하는 것을 특징으로 하는 복호화 방법.
  21. 제15항에 있어서,
    상기 확장 데이터의 확장 타입을 나타내는 코드를 검출하는 단계를 더 포함하고,
    상기 확장 데이터를 복호화하는 단계는 상기 코드가 검출되면, 상기 검출된 코드가 나타내는 적어도 하나 이상의 복호화 기법에 따라 복호화하는 것을 특징으로 하는 복호화 방법.
  22. 제21항에 있어서,
    상기 확장 타입은 상기 확장 데이터가 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터, 상기 오디오 데이터의 메타 데이터, 상기 오디오 데이터의 필 엘리먼트 중 적어도 하나 이상을 위한 데이터라는 것을 나타냄을 특징으로 하는 복호화 방법.
  23. 제15항에 있어서,
    상기 확장 데이터의 부호화 부분이 시작됨을 나타내는 제1 코드를 검출하는 단계; 및
    상기 확장 데이터의 확장 타입을 나타내는 제2 코드를 검출하는 단계를 더 포함하는 것을 특징으로 하는 복호화 방법.
  24. 제23항에 있어서,
    상기 오디오 데이터의 부호화 부분 다음에서 상기 오디오 데이터의 부호화 부분이 종결됨을 나타내는 제3 코드를 검출하는 단계를 더 포함하고,
    상기 제1 코드를 검출하는 단계는 상기 제 3 코드가 검출되면, 상기 검출된 제 3 코드 다음에서 상기 제 1 코드를 검출하고,
    상기 제2 코드를 검출하는 단계는 상기 제 1 코드가 검출되면, 상기 검출된 제 1 코드 다음에서 상기 제 2 코드를 검출하는 것을 특징으로 하는 복호화 방법.
  25. 제23항에 있어서,
    상기 제1 코드는 4 비트 부호로서 4 개의 연속된 1 값들로 구성되고, 상기 제2 코드는 4 비트 부호인 것을 특징으로 하는 복호화 방법.
  26. 제 15 항에 있어서,
    상기 확장 데이터의 부호화 부분 다음에 상기 다른 확장 데이터의 확장 타입을 나타내는 코드를 검출하는 단계; 및
    상기 코드가 검출되면, 상기 검출된 코드가 나타내는 복호화 방식에 따라 상기 확장 데이터를 복호화하는 단계를 더 포함하고,
    상기 코드를 검출하는 단계 및 상기 확장 데이터를 복호화하는 단계는 상기 확장 데이터 및 상기 다른 확장 데이터 이외의 나머지 모든 확장 데이터의 복호화가 완료될 때까지 반복적으로 수행됨을 특징으로 하는 복호화 방법.
  27. 제15항 내지 제26항 중에 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  28. 어느 하나의 복호화 기법에 따라 오디오 데이터를 복호화하는 제1 복호화부; 및
    적어도 하나 이상의 복호화 기법에 따라 상기 오디오 데이터의 적어도 하나 이상의 확장 데이터를 복호화하는 제2 복호화부를 포함하는 것을 특징으로 하는 복 호화 장치.
  29. 오디오 데이터를 부호화하는 단계;
    상기 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드를 생성하는 단계;
    확장 데이터의 페이로드가 시작되었다는 것을 나타내는 식별 코드를 생성하는 단계;
    확장 데이터의 타입을 생성하는 단계; 및
    상기 생성된 타입에 대응하는 확장 데이터를 부호화하는 단계를 포함하고,
    상기 확장 데이터는 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터 가운데 적어도 어느 하나 이상을 포함하는 것을 특징으로 하는 오디오 데이터 및 확장 데이터의 부호화 방법.
  30. 오디오 데이터를 부호화하는 단계;
    상기 오디오 데이터가 부호화된 페이로드가 종결되었다는 것을 나타내는 식별 코드를 생성하는 단계;
    확장 데이터의 페이로드가 시작되었다는 것을 나타내는 식별 코드를 생성하는 단계;
    확장 데이터의 타입을 생성하는 단계; 및
    상기 생성된 타입에 대응하는 확장 데이터를 부호화하는 단계를 포함하고,
    상기 확장 데이터는 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터 가운데 적어도 어느 하나 이상을 포함하고,
    상기 타입을 생성하는 단계 및 상기 확장 데이터를 부호화하는 단계는 모든 확장 데이터가 부호화될 때까지 반복하여 수행하는 것을 특징으로 하는 오디오 데이터 및 확장 데이터의 부호화 방법.
  31. 오디오 데이터를 복호화하는 단계;
    상기 오디오 데이터의 페이로드가 종결되었다는 것을 나타내는 식별 코드를 검출하는 단계;
    확장 데이터의 페이로드가 시작되었다는 것을 나타내는 식별 코드를 검출하는 단계;
    확장 데이터의 타입을 검출하는 단계; 및
    상기 검출된 타입에 대응하는 확장 데이터를 복호화하는 단계를 포함하고,
    상기 확장 데이터는 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터 가운데 적어도 어느 하나 이상을 포함하는 것을 특징으로 하는 오디오 데이터 및 확장 데이터의 복호화 방법.
  32. 오디오 데이터를 복호화하는 단계;
    상기 복호화하는 단계 후에 아직 복호화되지 않은 페이로드가 있다고 판단되면, 상기 오디오 데이터의 페이로드가 종결되었다는 것을 나타내는 식별 코드를 검출하는 단계;
    확장 데이터의 페이로드가 시작되었다는 것을 나타내는 식별 코드를 검출하는 단계;
    확장 데이터의 타입을 검출하는 단계; 및
    상기 검출된 타입에 대응하는 확장 데이터를 복호화하는 단계를 포함하고,
    상기 확장 데이터는 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터 가운데 적어도 어느 하나 이상을 포함하고,
    상기 타입을 검출하는 단계 및 상기 확장 데이터를 복호화하는 단계는 모든 확장 데이터가 복호화될 때까지 반복하여 수행하는 것을 특징으로 하는 오디오 데이터 및 확장 데이터의 복호화 방법.
  33. 오디오 데이터를 계층적으로 복호화하는 단계;
    'zero_code'를 검출하는 단계;
    'sync_word'를 검출하는 단계;
    'extension_type'을 검출하는 단계; 및
    상기 'extension_type'에 대응하는 확장 데이터를 복호화하는 단계를 포함하 고,
    상기 확장 데이터는 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터 가운데 적어도 어느 하나 이상을 포함하는 것을 특징으로 하는 오디오 데이터 및 확장 데이터의 복호화 방법.
  34. 오디오 데이터를 계층적으로 복호화하는 단계;
    상기 복호화하는 단계 후에 아직 복호화되지 않은 페이로드가 있다고 판단되면, 'zero_code'를 검출하는 단계;
    'sync_word'를 검출하는 단계;
    'extension_type'을 검출하는 단계; 및
    상기 'extension_type'에 대응하는 확장 데이터를 복호화하는 단계를 포함하고,
    상기 확장 데이터는 상기 오디오 데이터의 채널을 확장하기 위한 데이터, 상기 오디오 데이터의 대역폭을 확장하기 위한 데이터, 에러를 체크하기 위한 데이터 가운데 적어도 어느 하나 이상을 포함하고,
    상기 타입을 검출하는 단계 및 상기 확장 데이터를 복호화하는 단계는 모든 확장 데이터가 복호화될 때까지 반복하여 수행하는 것을 특징으로 하는 오디오 데이터 및 확장 데이터의 복호화 방법.
KR1020060099425A 2005-10-12 2006-10-12 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치 KR100851972B1 (ko)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US72531705P 2005-10-12 2005-10-12
US60/725,317 2005-10-12
US72615905P 2005-10-14 2005-10-14
US60/726,159 2005-10-14
KR20060049081 2006-05-30
KR20060049082 2006-05-30
KR1020060049081 2006-05-30
KR1020060049082 2006-05-30
KR1020060067705 2006-07-19
KR1020060067705A KR20070108302A (ko) 2005-10-14 2006-07-19 오디오 데이터의 확장에 대한 스케러빌러티를 지원하는부호화 방법 및 장치, 그 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20070040738A true KR20070040738A (ko) 2007-04-17
KR100851972B1 KR100851972B1 (ko) 2008-08-12

Family

ID=37943005

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060099425A KR100851972B1 (ko) 2005-10-12 2006-10-12 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치

Country Status (5)

Country Link
US (1) US8055500B2 (ko)
EP (2) EP2555187B1 (ko)
KR (1) KR100851972B1 (ko)
CN (1) CN101288117B (ko)
WO (1) WO2007043811A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US7890061B2 (en) * 2006-06-27 2011-02-15 Intel Corporation Selective 40 MHz operation in 2.4 GHz band
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
EP2146343A1 (en) * 2008-07-16 2010-01-20 Deutsche Thomson OHG Method and apparatus for synchronizing highly compressed enhancement layer data
JP5629429B2 (ja) * 2008-11-21 2014-11-19 パナソニック株式会社 オーディオ再生装置及びオーディオ再生方法
JP5345737B2 (ja) * 2009-10-21 2013-11-20 ドルビー インターナショナル アーベー 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
KR101748760B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
CN110706715B (zh) 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
GB2524333A (en) * 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6182031B1 (en) * 1998-09-15 2001-01-30 Intel Corp. Scalable audio coding system
CN1241416C (zh) 1999-02-09 2006-02-08 索尼公司 编码系统和方法、编码及解码、记录及再现的设备和方法
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
DE19959156C2 (de) * 1999-12-08 2002-01-31 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1315148A1 (en) 2001-11-17 2003-05-28 Deutsche Thomson-Brandt Gmbh Determination of the presence of ancillary data in an audio bitstream
DE60214599T2 (de) 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
JP2003280694A (ja) 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
US7542896B2 (en) * 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
KR100923300B1 (ko) 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
CA2524243C (en) 2003-04-30 2013-02-19 Matsushita Electric Industrial Co. Ltd. Speech coding apparatus including enhancement layer performing long term prediction
KR100571824B1 (ko) 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
JP4789430B2 (ja) 2004-06-25 2011-10-12 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals

Also Published As

Publication number Publication date
EP2555187A3 (en) 2013-09-04
US20070083363A1 (en) 2007-04-12
EP1949369A4 (en) 2010-05-19
EP2555187B1 (en) 2016-12-07
EP1949369A1 (en) 2008-07-30
WO2007043811A1 (en) 2007-04-19
US8055500B2 (en) 2011-11-08
EP2555187A2 (en) 2013-02-06
EP1949369B1 (en) 2012-09-26
CN101288117A (zh) 2008-10-15
KR100851972B1 (ko) 2008-08-12
CN101288117B (zh) 2014-07-16

Similar Documents

Publication Publication Date Title
KR100851972B1 (ko) 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치
US8170883B2 (en) Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP5774983B2 (ja) 少なくとも一つのヘッダ・セクション、及び対応するデータ構造を含むフレームベースのビットストリーム・フォーマット・ファイルを生成、カット又は変更するための方法と装置
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR100718132B1 (ko) 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
US7054380B2 (en) Embedding a first digital information signal into a second digital information signal for transmission via a transmission medium
KR20060122692A (ko) 공간 정보 비트스트림이 임베드된 다운믹스 오디오 신호를인코딩 및 디코딩하는 방법
KR20080029757A (ko) 믹스 신호의 처리 방법 및 장치
KR101438387B1 (ko) 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR20070108302A (ko) 오디오 데이터의 확장에 대한 스케러빌러티를 지원하는부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20080010980A (ko) 부호화/복호화 방법 및 장치.
KR20070041338A (ko) 오디오 코덱의 디코딩 및 인코딩 방법 및 장치
KR20070098726A (ko) 미디어 신호를 부호화/복호화하는 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170728

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20181206

Year of fee payment: 11