KR20060043701A - 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 - Google Patents

멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
KR20060043701A
KR20060043701A KR1020050021840A KR20050021840A KR20060043701A KR 20060043701 A KR20060043701 A KR 20060043701A KR 1020050021840 A KR1020050021840 A KR 1020050021840A KR 20050021840 A KR20050021840 A KR 20050021840A KR 20060043701 A KR20060043701 A KR 20060043701A
Authority
KR
South Korea
Prior art keywords
channel
data
encoding
extended
audio
Prior art date
Application number
KR1020050021840A
Other languages
English (en)
Other versions
KR100773539B1 (ko
Inventor
오은미
김미영
김상욱
김도형
김중회
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to EP10185870A priority Critical patent/EP2276022A3/en
Priority to EP05254305A priority patent/EP1617413A3/en
Priority to US11/180,625 priority patent/US20060013405A1/en
Priority to CN2005100841436A priority patent/CN1756086B/zh
Priority to CN2010101222400A priority patent/CN101789792B/zh
Priority to JP2005205178A priority patent/JP2006031012A/ja
Publication of KR20060043701A publication Critical patent/KR20060043701A/ko
Application granted granted Critical
Publication of KR100773539B1 publication Critical patent/KR100773539B1/ko
Priority to JP2012198966A priority patent/JP2012238034A/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • H04N23/55Optical parts specially adapted for electronic image sensors; Mounting thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/08Waterproof bodies or housings
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/12Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets
    • G03B17/14Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets interchangeably
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • H04N25/71Charge-coupled device [CCD] sensors; Charge-transfer registers specially adapted for CCD sensors

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 멀티채널 오디오 데이터 부호화 및 복호화 방법 및 장치에 관한 것으로서, 그 부호화방법은 모노/스테레오 오디오 데이터를 부호화하는 단계; 및 모노/스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터를 부호화하는 단계를 포함함을 특징으로 하며, 그 복호화 방법은 모노/스테레오 오디오 데이터를 복호화하는 단계; 그 모노/스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데이터가 있는지 검사하는 단계; 및 그 복호화할 확장 데이터가 있으면, 멀티채널 오디오 확장데이터를 복호화하는 단계를 포함함이 바람직하다.
본 발명에 의하면, 하나의 비트스트림으로 사용자 환경에 따라서 모노, 스테레오, 멀티채널을 제공할 수 있다. 멀티 채널에서도 사용자의 단말 및 네트워크 상태에 따라서 FGS 기능을 제공한다. 또한 멀티채널 BSAC의 성능 향상, 예를 들어 고음질, 낮은 복잡도, 확장성 확보를 가능하게 한다. 특히, MPEG 표준화를 위한 여러 요구사항(기존의 BSAC 와의 호환성, 미세계층(FGS) 기능 유지, 최소한의 수정)을 충족시킬 수 있다. 그리고 고현실감 디지털 멀티미디어 방송, 모바일 및 홈 시어터(home theater) 기반 서비스에서 유용하게 사용될 수 있다.

Description

멀티채널 오디오 데이터 부호화/복호화 방법 및 장치{Multi channel audio data encoding/decoding method and apparatus}
도 1은 기존의 BSAC 멀티채널 구조를 도시한 것이다.
도 2는 기존 방식의 오디오 부호화 장치의 기능 모듈을 블록도도로 도시한 것이다.
도 3은 본 발명에 의한 멀티채널 오디오 데이터 부호화 장치의 구성을 블록도로 도시한 것이다.
도 4는 확장데이터 부호화부의 보다 상세한 구성을 블록도로 도시한 것이다.
도 5는 확장오디오 부호화부의 세부 구성을 블록도로 도시한 것이다.
도 6은 본 발명에 의한 멀티채널 오디오 데이터 부호화에 대한 기본적인 데이터 구조를 도시한 것이다.
도 7은 본 발명에 의한 멀티채널 오디오 데이터 부호화 방법을 흐름도로 도시한 것이다.
도 8은 확장채널에 대한 오디오 데이터 부호화를 보다 상세히 설명한 흐름도이다.
도 9는 상기 멀티채널 오디오 복호화장치의 구성을 블록도로 도시한 것이다.
도 10은 상기 확장데이터복호화부(940)의 구성을 블록도로 도시한 것이다.
도 11은 상기 확장채널 오디오 복호화부(1060)의 구성을 블록도로 도시한 것이다.
도 12은 본 발명에 의한 멀티채널 오디오 데이터 복호화 방법을 흐름도로 도시한 것이다.
도 13은 1230단계의 확장채널에 대한 오디오 데이터 복호화를 보다 상세히 설명한 흐름도이다.
도 14는 1200단계 내지 1230단계에 대한 일실시예를 나타내는 Bsac_raw_data_block()의 syntax를 도시한 것이다.
도 15는 각 오디오 채널 복호화에 대한 일실시예를 나타내는 extended_bsac_raw_data_block()의 syntax를 도시한 것이다.
도 16은 1230단계에 대한 extended_bsac_raw_data_block()의 일 예에 대한 syntax를 도시한 것이다.
도 17은 본 발명에 의한 멀티채널 오디오 신호 부호화/복호화 방법 및 장치를 이용하여 음질 측정을 한 테스트 결과를 도시한 것이다.
본 발명은 오디오 부호화 및 복호화에 관한 것으로서, 특히 멀티채널 오디오 데이터 부호화 및 복호화 방법 및 장치에 관한 것이다.
지상파 DMB(Digital Multimedia Broadcasting)에서는 2003년 오디오 코덱 (codec)으로 MPEG-4 BSAC(Bit Sliced Arithmatic Coding)을 채택하였다. 현재는 스테레오만 서비스하고 있지만, 향후에는 멀티채널(multichannel) 서비스로 확장할 것이 예상된다. MPEG-4 BSAC에서는 압출효율 및 기능향상 기술, 예를 들어 대역폭 확장(Bandwidth Extension), Spatial 오디오를 추가할 수 있어야 한다.
기존의 BSAC 멀티채널에서는 전방, 중앙 좌, 우, 후방 좌, 우 채널 등의 채널들이 하나의 계층에 번갈아 코딩된다. 도 1은 기존의 멀티채널 BSAC 구조를 도시한 것으로서, 각 채널들이 interleave 되어 있다. 상기 BSAC 구조는 미세계층기능을 제공한다. 즉 하나의 계층에 5채널이 모두 존재하여 마지막 계층부터 자를 수 있다. 그리고 채널에 대한 Tool 부가정보가 general_header에 정의되어 있다. 채널마다 신호특성을 고려한 개별적인 부가정보가 있어야 고성능 압축이 가능하다.
도 2는 기존 방식의 오디오 부호화 장치의 기능 모듈을 블록도도로 도시한 것으로서, 심리음향모델부(200), 시간/주파수 맵핑부(210), 시간영역 잡음 형상화부(220), Intensity 스테레오 처리부(230), 지각잡음대체부(240), Mid/Side(M/S) 스테레오 처리부(250), 양자화부(260), 그리고 비트패킹부(270)로 구성된다.
상기 시간/주파수 맵핑부(210)는 시간영역의 오디오 신호를 주파수영역의 신호로 변환하는 역할을 한다. 시간상으로 인간이 인지하는 신호의 특성의 차이가 그리 크지 않지만, 이렇게 변환된 주파수 영역의 신호들은 인간의 음향심리모델에 따라 각 대역에서 인간이 느낄 수 있는 신호와 느낄 수 없는 신호의 차이가 크기 때문에 각 주파수 대역에 따른 할당되는 비트의 수를 다르게 함으로써 압축의 효율을 높일 수 있다.
심리음향부(200)는 시간/주파수 맵핑부(210)에 의해 시간 영역에서 주파수 영역으의 성분으로 변환된 오디오 신호들을 적당한 대역(subband)의 신호들로 묶고 각 신호들의 상호작용으로 인해 발생되는 마스킹현상을 이용하여 각 대역(subband)에서의 마스킹 문턱치(masking threshold)를 계산한다. 시간영역 잡음 형상화(TNS, Temporal Noise Shaping)부(220)는 변환의 각 윈도우내에서 양자화 잡음의 시간적인 모양을 제어하기 위해 사용된다. 주파수 데이터의 필터링 과정을 적용함으로써 시간영역 잡음 형상화가 가능하다. 이 부분은 부호화기에서 사용할 것인지 사용하지 않을 것인지를 선택할 수 있다. Intensity 스테레오 처리부(230)는 스테레오 신호를 좀 더 효율적으로 처리하기 위한 방법들 중 한 가지이다. 두 개의 채널 중 하나의 채널에 대한 scalefactor band에 대한 양자화된 정보만을 부호화하고 나머지 채널은 scalefactor만을 전송하는 기법이다. 이 부분은 반드시 부호화기에서 반드시 사용해야 하는 부분은 아니고 부호화기에서 여러 가지 사항을 고려해서 각 scalefactor band 단위로 사용 여부를 판단할 수 있다. 지각잡음대체부(240)는 현재 프레임에서 노이즈 특성이 강한 신호의 경우 주파수 계수의 값을 코딩하지 않고, scalefactor band 에 해당하는 주파수 성분들의 에너지 값을 부호화함으로써 사용되는 비트 발생량을 줄일 수 있다. 상기 지각잡음대체부(240)는 scalefactor band 단위로 사용 여부를 판단할 수 있다. M/S 스테레오 처리부(250)는 스테레오 신호를 좀 더 효율적으로 처리하기 위한 방법들 중 한 가지이다. 왼쪽 채널의 신호와 오른쪽 채널의 신호를 각각 더한 신호와 뺀 신호로 변환한 후 이 신호를 처리하는 방법이다. 이 부분도 반드시 부호화기에서 반드시 사용해야 하는 부분은 아니고 부호화기에서 여러 가지 사항을 고려해서 각 scalefactor band 단위로 사용 여부를 판단할 수 있다. 양자화부(260)에서는 인간이 들어도 느끼지 못하도록 각 대역의 양자화 잡음의 크기가 마스킹 문턱값보다 작도록 각 대역의 주파수 신호들을 스칼라 양자화한다. 비트패킹부(270)는 부호화장치의 각 모듈에서 만들어진 정보들을 모아서 scalable codec에 적합하도록 만들어진 syntax에 따라서 비트스트림을 구성해 준다.
그런데, 상기 도 1에 도시된 기존의 BSAC 멀티채널 구조는 M/S(Mid/Side) 스테레오 사용이 불가능하다. 왜냐하면 기존의 부호화 및 복호화 syntax 상에서는 채널 수가 2개 이상일 경우에는 M/S 스테레오 기능을 사용할 수 없기 때문이다. 따라서 코딩 효율이 저하된다. 또한 window switching, PNS(Perceptual Noise Substitution)는 모든 채널에 동일한 부가정보를 사용해야 하므로 코딩효율이 저하된다. 또한 5채널이 모두 interleave되기 때문에 모노에 비해서 5배의 메모리가 필요하다.
본 발명이 이루고자 하는 기술적 과제는 MPEG 표준화에 부합되면서 다채널 BSAC의 성능 향상을 가능하게 하는 멀티채널 오디오 데이터 부호화 방법 및 장치를 제공하는 것이다.
본 발명이 이루고자 하는 기술적 과제는 MPEG 표준화에 부합되면서 다채널 BSAC의 성능 향상을 가능하게 하는 멀티채널 오디오 데이터 복호화 방법 및 장치를 제공하는 것이다.
상기 기술적 과제를 이루기 위한 본 발명에 의한 멀티채널 오디오신호 부호화 방법은 (a) 모노/스테레오 오디오 데이터를 부호화하는 단계; 및 (b) 상기 모노/스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터를 부호화하는 단계를 포함함을 특징으로 한다. 상기 모노/스테레오 오디오 데이터는 계층적인 비트율을 가짐이 바람직하다.
상기 (b)단계의 멀티채널 오디오 확장데이터는 적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 확장채널의 타입 정보를 포함함이 바람직하다. 상기 (b)단계는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)를 부호화하는 단계; 및 확장 오디오 데이터를 채널별로 부호화하는 단계를 포함함이 바람직하다. 상기 시작코드는 32비트의 연속된 0 값으로 이루어진 zero_code; 및 8비트의 연속된 1 값으로 이루어진 syncword로 구성됨이 바람직하다.
상기 채널별 확장데이터 부호화는 오디오 채널의 구성을 나타내는 확장채널의 타입을 부호화하는 단계; 및 확장채널 오디오 데이터를 부호화 단계를 포함함이 바람직하다. 상기 확장채널의 타입은 채널구성 인덱스로 이루어짐이 바람직하다.상기 채널별 확장데이터 부호화는 확장데이터의 길이를 부호화하는 단계; 및 부가정보(bsac header, general header)를 부호화하는 단계를 더 구비함이 바람직하다.
상기 확장채널 오디오 데이터 부호화는 비트율이 가장 낮은 기본계층을 부호화하는 단계; 및 상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층 이 높아질수록 비트율이 높아지는 상위계층을 부호화하는 단계를 포함함이 바람직하다.
상기 기술적 과제를 이루기 위한 본 발명에 의한 멀티채널 오디오신호 부호화 장치는 모노/스테레오 오디오 데이터를 부호화하는 모노/스테레오 부호화부; 및 상기 모노/스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터를 부호화하는 확장데이터부호화부를 포함함을 특징으로 한다. 상기 모노/스테레오 부호화부는 계층적인 비트율을 가지는 모노/스테레오 오디오 데이터를 부호화함이 바람직하다.
상기 확장데이터부호화부의 멀티채널 오디오 확장데이터는 적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 확장채널의 타입 정보를 포함함이 바람직하다. 상기 확장데이터부호화부는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)를 부호화하는 시작코드부호화부; 및 확장 오디오 데이터를 채널별로 부호화하는 채널부호화부를 포함함이 바람직하다. 상기 부호화 장치의 시작코드부호화부의 시작코드는 32비트의 연속된 0 값으로 이루어진 zero_code; 및 8비트의 연속된 1 값으로 이루어진 syncword로 구성됨이 바람직하다. 상기 채널부호화부는 오디오 채널의 구성을 나타내는 확장채널의 타입을 부호화하는 확장채널타입부호화부; 및 확장채널 오디오 데이터를 부호화하는 확장오디오부호화부를 포함함이 바람직하다. 상기 확장채널의 타입은 채널구성 인덱스로 이루어짐이 바람직하다. 상기 채널부호화부는 확장데이터의 길이를 부호화하는 확장데이터 길이 부호화부; 및 부가정보(bsac header, general header)를 부호화하는 부가정보부호화부를 더 구비함이 바람직하다.
상기 확장오디오부호화부는 비트율이 가장 낮은 기본계층을 부호화하는 기본계층부호화부; 및 상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 부호화하는 상위계층부호화부를 포함함이 바람직하다.
상기 다른 기술적 과제를 이루기 위한 본 발명에 의한 멀티채널 오디오신호 복호화 방법은 (a) 모노/스테레오 오디오 데이터를 복호화하는 단계; (b) 상기 모노/스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데이터가 있는지 검사하는 단계; 및 (c) 복호화할 확장 데이터가 있으면, 멀티채널 오디오 확장데이터를 복호화하는 단계를 포함함이 바람직하다. 상기 복호화 방법의 모노/스테레오 오디오 데이터는 계층적인 비트율을 가짐이 바람직하다.
상기 (b)단계의 멀티채널 오디오 확장데이터는 적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 확장채널의 타입 정보를 포함함이 바람직하다. 상기 (b)단계는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)의 존재를 검사하여 상기 시작코드가 존재하면 확장데이터 존재한다고 판단함이 바람직하다. 상기 시작코드는 32비트의 연속된 0 값으로 이루어진 zero_code; 및 8비트의 연속된 1 값으로 이루어진 syncword로 구성됨이 바람직하다. 상기 (c)단계는 복호화할 확장 데이터가 있으면, 채널별로 확장 데이터를 복호화함이 바람직하다. 상기 채널별 확장데이터 부호화는 오디오 채널의 구성을 나타내는 확장채널의 타입을 복호화하는 단계; 및 확장채널 오디오 데이터를 복호화 단계를 포함함이 바람직하다. 상기 확장채널의 타입은 채널구성 인덱스로 이루어짐이 바람직하다.
상기 채널별 확장데이터 복호화는 확장데이터의 길이를 복호화하는 단계; 및 부가정보(bsac header, general header)를 복호화하는 단계를 포함함이 바람직하다. 상기 확장채널 오디오 데이터 복호화는 비트율이 가장 낮은 기본계층을 복호화하는 단계; 및 상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 복호화함이 바람직하다.
상기 다른 기술적 과제를 이루기 위한 본 발명에 의한 멀티채널 오디오신호 복호화 장치는 모노/스테레오 오디오 데이터를 복호화하는 모노/스테레오 복호화부; 상기 모노/스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데이터가 있는지 검사하는 확장데이터검사부; 및 복호화할 확장 데이터가 있으면, 멀티채널 오디오 확장데이터를 복호화하는 확장데이터 복호화부를 포함함을 특징으로 한다. 상기 모노/스테레오 오디오 데이터는 계층적인 비트율을 가짐이 바람직하다. 상기 확장데이터 검사부는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)의 존재를 검사하여 상기 시작코드가 존재하면 확장데이터 존재한다고 판단함이 바람직하다. 상기 시작코드는 32비트의 연속된 0 값으로 이루어진 zero_code; 및 8비트의 연속된 1 값으로 이루어진 syncword로 구성됨이 바람직하다. 상기 확장데이터복호화부는 복호화할 확장 데이터가 있으면, 채널별로 확장 데이터를 복호화함이 바람직하다. 상기 확장데이터복호화부는 오디오 채널의 구성을 나타내는 확장채널의 타입을 복호화하는 확장채널타입복호화부; 및 확장채널 오디오 데이터를 복호화하는 확장채널 오디오 복호화부를 포함함이 바 람직하다. 상기 확장채널의 타입은 채널구성 인덱스로 이루어짐이 바람직하다. 상기 확장데이터 복호화부는 확장데이터의 길이를 복호화하는 확장데이터 길이 복호화부; 및 부가정보(bsac header, general header)를 복호화하는 부가정보복호화부를 더 포함함이 바람직하다. 상기 확장채널 오디오 복호화부는 비트율이 가장 낮은 기본계층을 복호화하는 기본계층 복호화부; 및 상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 복호화하는 상위계층 복호화부를 포함함이 바람직하다.
그리고 상기 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 멀티채널 오디오 부호화/복호화 장치 및 방법에 대해 상세히 설명한다.
먼저, 멀티채널 오디오 부호화 장치 및 방법을 설명하기로 한다. 도 3은 본 발명에 의한 멀티채널 오디오 데이터 부호화 장치의 구성을 블록도로 도시한 것으로서, 모노/스테레오 부호화부(300) 및 확장데이터 부호화부(350)를 포함하여 이루어진다.
상기 모노/스테레오 부호화부(300)는 모노 또는 스테레오 오디오 데이터를 부호화한다. 상기 모노/스테레오 부호화부(300)는 계층적인 비트율을 가지는 모노 또는 스테레오 오디오 데이터를 부호화함이 바람직하다. 특히 상기 모노 또는 스테레오 오디오 데이터는 ISO/IEC 14496-3 에 의한 BSAC 방식으로 부호화됨이 바람직하다. 상기 BSAC 방식의 오디오 부호화는 이미 공지된 기술이므로 여기서는 설 명을 생략한다.
상기 확장데이터 부호화부(350)는 상기 모노 또는 스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터를 부호화한다. 상기 멀티채널 오디오 확장데이터는 적어도 오디오 채널의 구성을 나타내는 확장채널의 타입 정보를 포함하며, 상기 확장채널 타입 정보는 채널구성 인덱스(channel_configuration_index)로 표현됨이 바람직하다. 상기 채널구성 인덱스는 표 1에 도시된 바와 같이 오디오 출력 채널 구성을 나타내는 3비트 필드를 가짐이 바람직하다. 상기 채널구성 인덱스는 채널을 스피커에 매핑할 때, 상기 채널의 수를 규정한다.
Figure 112005013817256-PAT00001
도 4는 상기 확장데이터 부호화부(350)의 보다 상세한 구성을 블록도로 도시한 것으로서, 시작코드 부호화부(400) 및 채널 부호화부(450)를 포함하여 이루어진다. 상기 시작코드 부호화부(400)는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드를 부호화한다. 상기 시작코드는 zero_code 및 syncword로 이루어진다.
상기 zero_code는 스테레오 오디오 데이터의 산술 복호화가 끝났음을 알리기 위한 32비트의 연속된 0 값으로 이루어진다. 상기 syncword는 확장된 멀티채널 오디오 데이터의 시작을 나타내기 위해 8비트의 연속된 1 값으로 이루어진다. 상기 비트스트링은 '1111 1111'이다.
상기 채널부호화부(450)는 확장 오디오 데이터를 채널별로 부호화하며, 확장채널길이 부호화부(452), 확장채널 타입 부호화부(454), 부가정보 부호화부(456) 및 확장오디오 부호화부(458)를 포함하여 이루어진다. 상기 확장채널 길이 부호화부(452)는 확장데이터의 길이를 부호화한다. 상기 확장데이터 길이 정보는 산술 복호화할 때 사용된다.
상기 확장채널 타입 부호화부(454)는 오디오 채널의 구성을 나타내는 확장채널의 타입을 부호화한다. 상기 부가정보 부호화부(456)는 부가정보(bsac_header, general_header)를 부호화한다. 상기 부가정보(bsac_header, general_header)는 BSAC 방식의 모노 또는 스테레오 오디오 데이터를 부호화할 때 사용한 부가정보와 동일하다. 상기 확장오디오 부호화부(458)는 확장채널 오디오 데이터를 부호화한다.
도 5는 상기 확장오디오 부호화부(458)의 세부 구성을 블록도로 도시한 것이다. 상기 확장오디오부호화부(458)는 기본계층 부호화부(500) 및 상위계층 부호화부(550)를 포함하여 이루어진다. 상기 기본계층 부호화부(500)는 비트율이 가장 낮은 기본계층을 부호화한다. 상기 상위계층부호화부(550)는 상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 부호화 한다.
본 발명은 기존 스테레오 비트스트림에 채널을 확장하는 방식을 사용하고 있다. 각 채널 요소에 채널 구성 인덱스를 부여한다. 오디오 부호화시 사용가능한 각 툴(Tool)에 대한 부가정보의 수정 가능성을 나타낸다. window, M/S, PNS 정보는 genaral header 가 채널요소마다 있으므로 수정이 필요한 모든 tool을 수정 가능하다.
도 6은 본 발명에 의한 멀티채널 오디오 데이터 부호화에 대한 기본적인 데이터 구조를 도시한 것이다. 그리고 도 7은 본 발명에 의한 멀티채널 오디오 데이터 부호화 방법을 흐름도로 도시한 것이다. 도 6 및 도 7을 참조하여 본 발명에 의한 멀티채널 오디오 데이터 부호화 방법과 부호화 장치의 동작을 설명하기로 한다.
먼저, 모노/스테레오 부호화부(300)에서 모노 또는 스테레오 오디오 데이터가 부호화된다.(700단계) 그리고 나서 확장데이터 부호화부(350)에서 상기 모노 또는 스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터가 부호화된다. 상기 모노/스테레오 오디오 데이터는 상술한 바와 같이 계층적인 비트율을 가짐이 바람직하다. 또한 상기 멀티채널 오디오 확장데이터는 적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 상술한 확장채널의 타입 정보를 포함한다.
상기 멀티채널 오디오 확장데이터의 부호화를 보다 상세히 설명하면, 다음과 같다. 모노 또는 스테레오 오디오 데이터가 부호화된 후, 부호화할 데이터가 있는지 체크한다.(710단계) 부호화할 데이터가 존재하면, 시작코드 부호화부(400)에서 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)가 부호화된다.(720단계) 상기 시작코드는 상술한 부호화 장치에서와 같다. 그리고 나서 채널부호화부(450)를 통해 각 채널에 대해 확장 오디오 데이터가 부호화된다. 이는 먼저 하나의 채널에 대해 확장오디오 데이터를 부호화 한 후(730단계), 상기 채널에 대한 부호화가 완료되면, 다른 채널에 대한 부호화할 오디오 데이터가 있는지 검사한다.(740단계) 다른 채널에 대한 부호화할 오디에 데이터가 존재하면 상기 채널에 대한 오디오 데이터를 부호화한다. 상기 과정을 모든 확장채널에 대해 수행하여 확장채널 오디오 데이터 모두에 대해 부호화한다.
도 8은 상기 730단계의 확장채널에 대한 오디오 데이터 부호화를 보다 상세히 설명한 흐름도이다. 확장데이터 길이 부호화부(452)에서 확장데이터의 길이가 부호화된다.(800단계) 또한 확장채널타입 부호화부(454)에서 오디오 채널의 구성을 나타내는 확장채널의 타입이 부호화된다.(820단계) 부가정보 부호화부(456)에서 부가정보(bsac header, general header)가 부호화된다.(840단계) 그리고 나서 확장오디오 부호화부(458)에서 확장채널 오디오 데이터가 부호화된다.(860단계)
상기 860단계의 확장채널 오디오 데이터 부호화는 먼저 기본계층 부호화부(500)에서 비트율이 가장 낮은 기본계층의 오디오 데이터가 부호화되고, 상위계층 부호화부(550)에서 상위계층의 오디오 데이터가 부호화된다. 상기 상위계층은 상기 기본계층의 비트율보다 높으며 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아진다.
한편, 본 발명에 의한 멀티채널 오디오 복호화 장치 및 방법을 설명하기로 한다. 기본적으로 멀티채널 오디오 복호화는 부호화의 역순이다.
도 9는 상기 멀티채널 오디오 복호화장치의 구성을 블록도로 도시한 것으로서, 모노/스테레오 복호화부(900), 확장데이터 검사부(920) 및 확장데이터 복호화부(940)를 포함하여 이루어진다.
상기 모노/스테레오 복호화부(900)는 모노 또는 스테레오 오디오 데이터를 복호화한다. 상기 모노 또는 스테레오 오디오 데이터는 계층적인 비트율을 가지며, ISO/IEC 14496-3 에 의한 BSAC 방식으로 복호화됨이 바람직하다.
상기 확장데이터 검사부(920)는 상기 모노 또는 스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데이터가 있는지 검사한다. 상기 확장데이터 검사부(920)는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)의 존재를 검사하여 상기 시작코드가 존재하면 확장데이터 존재한다고 판단한다. 상기 시작코드는 zero_code 및 syncword로 이루어진다. 상기 zero_code는 스테레오 오디오 데이터의 산술 복호화가 끝났음을 알리기 위한 32비트의 연속된 0 값으로 이루어진다. 상기 syncword는 확장된 멀티채널 오디오 데이터의 시작을 나타내기 위해 8비트의 연속된 1 값으로 이루어지며, 비트스트링은 '1111 1111'이다.
상기 확장데이터 복호화부(940)는 복호화할 확장 데이터가 있으면, 멀티채널 오디오 확장데이터를 복호화한다. 또한 상기 확장데이터 복호화부(940)는 복호화할 때 채널별로 확장 데이터를 복호화함이 바람직하다.
도 10은 상기 확장데이터복호화부(940)의 구성을 블록도로 도시한 것으로서, 확장데이터 길이 복호화부(1000), 확장채널 타입 복호화부(1020), 부가정보 복호화부(1040) 및 확장채널 오디오 복호화부(1060)를 포함하여 이루어진다.
상기 확장데이터 길이 복호화부(1000)는 확장데이터의 길이 정보를 복호화한다. 확장채널 타입 복호화부(1020)는 오디오 채널의 구성을 나타내는 확장채널의 타입을 복호화한다. 상기 확장채널 타입 정보는 채널구성 인덱스(channel_configuration_index)로 표현됨이 바람직하다. 상기 채널구성 인덱스는 채널을 스피커에 매핑할 때 상기 채널의 수를 규정하며, 상기 표 2에 도시된 바와 같이 오디오 출력 채널 구성을 나타내는 3비트 필드를 가진다.
상기 부가정보 복호화부(1040)는 부가정보를 복호화한다. 상기 부가정보에는 bsac header 및 general header 등 오디오 데이터를 복호화할 때 오디오 데이터 외의 필요한 정보이다. 기본적으로 상기 부가정보(bsac_header, general_header)는 BSAC 방식의 모노 또는 스테레오 오디오 데이터를 복호화할 때 필요한 부가정보와 동일하다.
상기 확장채널 오디오 복호화부(1060)는 확장채널 오디오 데이터를 복호화한다. 도 11은 상기 확장채널 오디오 복호화부(1060)의 구성을 블록도로 도시한 것으로서, 기본계층 복호화부(1100) 및 상위계층 복호화부(1150)를 구비한다. 상기 기본계층 복호화부(1100)는 비트율이 가장 낮은 기본계층을 복호화한다. 상기 상위계층 복호화부(1150)는 상위계층을 복호화 하며, 상기 상위계층은 상기 기본계층의 비트율보다 높으며 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아진다.
그리고 도 12는 본 발명에 의한 멀티채널 오디오 데이터 복호화 방법을 흐름도로 도시한 것이다. 도 12를 참조하여 본 발명에 의한 멀티채널 오디오 데이터 부호화 방법과 부호화 장치의 동작을 설명하기로 한다.
먼저, 모노/스테레오 복호화부(900)를 통해 모노 또는 스테레오 오디오 데이터가 복호화된다.(1200단계) 그리고 나서 확장데이터 검사부(920)를 통해 상기 모노/스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데이터가 있는지 검사한다.(1210단계) 상기 멀티채널 오디오 확장데이터 존재여부는 멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)를 복호화하여 상기 시작코드의 존재를 검사하여 판단한다.(1220단계) 만일 상기 시작코드가 존재하면 확장데이터 존재한다고 판단한다. 즉 zero_code가 존재하면 모노 또는 스테레오 오디오 데이터 복호화가 종료되었음을 알리고, 이어서 syncword가 존재하면 복호화할 멀티채널 오디오 데이터가 존재함을 나타낸다.
상기 시작코드를 통해 복호화할 확장 데이터가 있다고 판단되면, 확장데이터 복호화부(940)를 통해 멀티채널 오디오 확장데이터가 복호화된다.(1230단계)
상기 1200단계 내지 1230단계에 대한 일실시예를 syntax (Bsac_raw_data_block())로 나타내면 도 14와 같다.
도 14에서 Bsac_raw_data_block()은 부호화된 오디오 데이터, 관련 정보 및 다른 데이터를 포함하고 있는 raw 데이터 블록으로서, 기본적으로 bsac_base_element()와 몇 개의 bsac_layer_element()로 구성된다. BSAC 비트스트림이 확장된 part를 가지는지를 결정하는 모듈이 존재한다.
상기 모노/스테레오 오디오 데이터는 상술한 바와 같이 계층적인 비트율을 가짐이 바람직하다. 또한 상기 멀티채널 오디오 확장데이터는 적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 상술한 확장채널의 타입 정보를 포함한다.
하나의 채널에 대해 확장오디오 데이터를 복호화 한 후(1230단계), 상기 채널에 대한 복호화가 완료되면, 다른 채널에 대한 복호화할 오디오 데이터가 있는지 검사한다.(1240단계) 다른 채널에 대한 복호화할 오디오 데이터가 존재하면 상기 채널에 대한 오디오 데이터를 복호화한다. 상기 과정을 모든 확장채널에 대해 수행하여 확장채널 오디오 데이터 모두에 대해 복호화한다.
상기 각 오디오 채널 복호화에 대한 일실시예를 나타내는 syntax (extended_bsac_raw_data_block())는 도 15와 같다.
도 15에서 extended_bsac_raw_data_block()은 멀티채널의 확장 데이터에 대한 코딩된 오디오데이터, 상기 오디오 데이터와 관련된 정보를 포함하고 있는 raw 데이터 블록이다. 상기 extended_bsac_raw_data_block()은 기본적으로 extended_bsac_base_element() 와 몇 개의 bsac_layer_element()로 구성된다.
도 13은 상기 1230단계의 확장채널에 대한 오디오 데이터 복호화를 보다 상세히 설명한 흐름도이다. 확장데이터 길이 복호화부(1000)에서 확장데이터의 길이가 복호화된다.(1300단계) 또한 확장채널타입 복호화부(1020)에서 오디오 채널의 구성을 나타내는 확장채널의 타입이 복호화된다.(1320단계) 부가정보 복호화부(1040)에서 부가정보(bsac header, general header)가 복호화된다.(1340단계) 상기 1300단계 내지 1340단계의 복호화 단계는 순서가 바뀌어도 무방하다. 그리고 나서 확장채널 오디오 복호화부(1060)에서 확장채널 오디오 데이터가 복호화된다.(1060단계)
상기 1060단계의 확장채널 오디오 데이터 복호화는 먼저 기본계층 복호화부(1100)에서 비트율이 가장 낮은 기본계층의 오디오 데이터가 복호화되고, 상위계층 부호화부(1150)에서 상위계층의 오디오 데이터가 복호화된다. 상기 상위계층은 상기 기본계층의 비트율보다 높으며 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아진다. 상기 1230단계에 대한 syntax(extended_bsac_raw_data_block())의 일 예를 들면 도 16과 같다.
도 16에서 상기 extended_bsac_base_element()는 BSAC의 확장된 파트에 대한 코딩된 오디오데이터, 상기 오디오 데이터와 관련된 정보를 포함하고 있는 base layer 비트스트림의 구문상 요소이다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
본 발명에 의한 멀티채널 오디오 부호화/복호화 장치 및 방법에 의하면, 본 발명에 의한 방식이 기존의 BSAC방식을 이용하여 멀티채널 데이터를 인터리브한 것보다 20 % 정도 적은 메모리를 필요로 한다. 이는 기존의 멀티채널 방식에서는 멀티 채널 전체에 대한 데이터를 모두 메모리에 로드해야 되는 반면, 본 발명에 의한 멀티채널 방식을 사용할 경우, 추가되는 채널 요소들이 차례로 처리되기 때문에 동시에 사용하는 메모리 사용량이 상대적으로 적다.
본 발명에 의한 멀티채널 오디오 신호 부호화/복호화 방법 및 장치를 이용하여 음질 측정을 한 결과 도 14와 같다. 청취실험 조건은 다음과 같다. Tool은 Window switching & M/S stero tool이 사용되고, 비트량할당방식은 전방 및 후방 채널 요소별로 비트율을 제어하고, 오디오 전문가 4명을 실험참가자로 하고, 기존 BSAC에 대한 상대적 음질(-2 - +2)을 측정하였다. 그리고 테스트 항목은 MPEG-2 NBC 에 사용된 총 46개 항목 중에서 선정하였다.
따라서 본 발명에 의한 멀티채널 오디오 부호화/복호화 장치 및 방법에 의하면, 하나의 비트스트림으로 사용자 환경에 따라서 모노, 스테레오, 멀티채널을 제공할 수 있다. 멀티 채널에서도 사용자의 단말 및 네트워크 상태에 따라서 FGS 기능을 제공한다. 또한 멀티채널 BSAC의 성능 향상, 예를 들어 고음질, 낮은 복잡도, 확장성 확보를 가능하게 한다. 특히, MPEG 표준화를 위한 여러 요구사항(기존 의 BSAC 와의 호환성, 미세계층(FGS) 기능 유지, 최소한의 수정)을 충족시킬 수 있다.
그리고 고현실감 디지털 멀티미디어 방송, 모바일 및 홈 시어터(home theater) 기반 서비스에서 유용하게 사용될 수 있다.

Claims (38)

  1. (a) 모노/스테레오 오디오 데이터를 부호화하는 단계; 및
    (b) 상기 모노/스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터를 부호화하는 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  2. 제1항에 있어서, 상기 모노/스테레오 오디오 데이터는
    계층적인 비트율을 가짐을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  3. 제1항 또는 제2항에 있어서, 상기 (b)단계의 멀티채널 오디오 확장데이터는
    적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 확장채널의 타입 정보를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  4. 제1항 또는 제2항에 있어서, 상기 (b)단계는
    멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)를 부호화하는 단계; 및
    확장 오디오 데이터를 채널별로 부호화하는 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  5. 제4항에 있어서, 상기 시작코드는
    32비트의 연속된 0 값으로 이루어진 zero_code; 및
    8비트의 연속된 1 값으로 이루어진 syncword로 구성됨을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  6. 제4항에 있어서, 상기 채널별 확장데이터 부호화는
    오디오 채널의 구성을 나타내는 확장채널의 타입을 부호화하는 단계; 및
    확장채널 오디오 데이터를 부호화 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  7. 제6항에 있어서, 상기 확장채널의 타입은
    채널구성 인덱스로 이루어짐을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  8. 제6항에 있어서, 상기 채널별 확장데이터 부호화는
    확장데이터의 길이를 부호화하는 단계; 및
    부가정보(bsac header, general header)를 부호화하는 단계를 더 구비함을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  9. 제6항에 있어서, 상기 확장채널 오디오 데이터 부호화는
    비트율이 가장 낮은 기본계층을 부호화하는 단계; 및
    상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 부호화하는 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 방법.
  10. 모노/스테레오 오디오 데이터를 부호화하는 모노/스테레오 부호화부; 및
    상기 모노/스테레오 오디오 데이터 이외의 멀티채널 오디오 확장데이터를 부호화하는 확장데이터부호화부를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  11. 제10항에 있어서, 상기 모노/스테레오 부호화부는
    계층적인 비트율을 가지는 모노/스테레오 오디오 데이터를 부호화함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  12. 제10항 또는 제11항에 있어서, 상기 확장데이터부호화부의 멀티채널 오디오 확장데이터는
    적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 확장채널의 타입 정보를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  13. 제10항 또는 제11항에 있어서, 상기 확장데이터부호화부는
    멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)를 부호화하는 시작코드부호화부; 및
    확장 오디오 데이터를 채널별로 부호화하는 채널부호화부를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  14. 제13항에 있어서, 상기 시작코드부호화부의 시작코드는
    32비트의 연속된 0 값으로 이루어진 zero_code; 및
    8비트의 연속된 1 값으로 이루어진 syncword로 구성됨을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  15. 제13항에 있어서, 상기 채널부호화부는
    오디오 채널의 구성을 나타내는 확장채널의 타입을 부호화하는 확장채널타입부호화부; 및
    확장채널 오디오 데이터를 부호화하는 확장오디오부호화부를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  16. 제15항에 있어서, 상기 확장채널의 타입은
    채널구성 인덱스로 이루어짐을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  17. 제15항에 있어서, 상기 채널부호화부는
    확장데이터의 길이를 부호화하는 확장데이터 길이 부호화부; 및
    부가정보(bsac header, general header)를 부호화하는 부가정보부호화부를 더 구비함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  18. 제15항에 있어서, 상기 확장오디오부호화부는
    비트율이 가장 낮은 기본계층을 부호화하는 기본계층부호화부; 및
    상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 부호화하는 상위계층부호화부를 포함함을 특징으로 하는 멀티채널 오디오신호 부호화 장치.
  19. (a) 모노/스테레오 오디오 데이터를 복호화하는 단계;
    (b) 상기 모노/스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데이터가 있는지 검사하는 단계; 및
    (c) 복호화할 확장 데이터가 있으면, 멀티채널 오디오 확장데이터를 복호화하는 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  20. 제19항에 있어서, 상기 모노/스테레오 오디오 데이터는
    계층적인 비트율을 가짐을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  21. 제19항 또는 제20항에 있어서, 상기 (b)단계의 멀티채널 오디오 확장데이터 는
    적어도 오디오 채널의 구성을 나타내며 채널구성 인덱스로 표현되는 확장채널의 타입 정보를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  22. 제19항 또는 제20항에 있어서, 상기 (b)단계는
    멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)의 존재를 검사하여 상기 시작코드가 존재하면 확장데이터 존재한다고 판단함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  23. 제22항에 있어서, 상기 시작코드는
    32비트의 연속된 0 값으로 이루어진 zero_code; 및
    8비트의 연속된 1 값으로 이루어진 syncword로 구성됨을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  24. 제19항 또는 제20항에 있어서, 상기 (c)단계는
    복호화할 확장 데이터가 있으면, 채널별로 확장 데이터를 복호화함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  25. 제24항에 있어서, 상기 채널별 확장데이터 부호화는
    오디오 채널의 구성을 나타내는 확장채널의 타입을 복호화하는 단계; 및
    확장채널 오디오 데이터를 복호화 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  26. 제25항에 있어서, 상기 확장채널의 타입은
    채널구성 인덱스로 이루어짐을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  27. 제24항에 있어서, 상기 채널별 확장데이터 복호화는
    확장데이터의 길이를 복호화하는 단계; 및
    부가정보(bsac header, general header)를 복호화하는 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  28. 제25항에 있어서, 상기 확장채널 오디오 데이터 복호화는
    비트율이 가장 낮은 기본계층을 복호화하는 단계; 및
    상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 복호화하는 단계를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 방법.
  29. 모노/스테레오 오디오 데이터를 복호화하는 모노/스테레오 복호화부;
    상기 모노/스테레오 오디오 데이터 이외에 복호화할 멀티채널 오디오 확장데 이터가 있는지 검사하는 확장데이터검사부; 및
    복호화할 확장 데이터가 있으면, 멀티채널 오디오 확장데이터를 복호화하는 확장데이터복호화부를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  30. 제29항에 있어서, 상기 모노/스테레오 오디오 데이터는
    계층적인 비트율을 가짐을 특징으로 하는 멀티채널 오디오신호 복호화 장치
  31. 제29항 또는 제30항에 있어서, 상기 확장데이터 검사부는
    멀티채널 오디오 확장데이터의 시작을 나타내는 소정의 시작코드(zero_code, syncword)의 존재를 검사하여 상기 시작코드가 존재하면 확장데이터 존재한다고 판단함을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  32. 제31항에 있어서, 상기 시작코드는
    32비트의 연속된 0 값으로 이루어진 zero_code; 및
    8비트의 연속된 1 값으로 이루어진 syncword로 구성됨을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  33. 제29항 또는 제30항에 있어서, 상기 확장데이터복호화부는
    복호화할 확장 데이터가 있으면, 채널별로 확장 데이터를 복호화함을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  34. 제33항에 있어서, 상기 확장데이터복호화부는
    오디오 채널의 구성을 나타내는 확장채널의 타입을 복호화하는 확장채널타입복호화부; 및
    확장채널 오디오 데이터를 복호화하는 확장채널 오디오 복호화부를 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  35. 제34항에 있어서, 상기 확장채널의 타입은
    채널구성 인덱스로 이루어짐을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  36. 제33항에 있어서, 상기 확장데이터 복호화부는
    확장데이터의 길이를 복호화하는 확장데이터 길이 복호화부; 및
    부가정보(bsac header, general header)를 복호화하는 부가정보복호화부를 더 포함함을 특징으로 하는 멀티채널 오디오신호 복호화 장치.
  37. 제34항에 있어서, 상기 확장채널 오디오 복호화부는
    비트율이 가장 낮은 기본계층을 복호화하는 기본계층 복호화부; 및
    상기 기본계층의 비트율보다 높으며, 계층이 복수개 일 경우 계층이 높아질수록 비트율이 높아지는 상위계층을 복호화하는 상위계층 복호화부를 포함함을 특 징으로 하는 멀티채널 오디오신호 복호화 장치.
  38. 제1항 내지 제9항, 제19항 내지 제28항 중 어느 한 항에 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020050021840A 2004-07-14 2005-03-16 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 KR100773539B1 (ko)

Priority Applications (7)

Application Number Priority Date Filing Date Title
EP10185870A EP2276022A3 (en) 2004-07-14 2005-07-08 Multichannel audio data encoding/decoding method and apparatus
EP05254305A EP1617413A3 (en) 2004-07-14 2005-07-08 Multichannel audio data encoding/decoding method and apparatus
US11/180,625 US20060013405A1 (en) 2004-07-14 2005-07-14 Multichannel audio data encoding/decoding method and apparatus
CN2005100841436A CN1756086B (zh) 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备
CN2010101222400A CN101789792B (zh) 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备
JP2005205178A JP2006031012A (ja) 2004-07-14 2005-07-14 マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体
JP2012198966A JP2012238034A (ja) 2004-07-14 2012-09-10 マルチチャンネルオーディオ信号復号化方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US58762604P 2004-07-14 2004-07-14
US60/587,626 2004-07-14

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020070067747A Division KR100982427B1 (ko) 2004-07-14 2007-07-05 멀티채널 오디오 신호 부호화 및 복호화 방법

Publications (2)

Publication Number Publication Date
KR20060043701A true KR20060043701A (ko) 2006-05-15
KR100773539B1 KR100773539B1 (ko) 2007-11-05

Family

ID=36689093

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020050021840A KR100773539B1 (ko) 2004-07-14 2005-03-16 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
KR1020070067747A KR100982427B1 (ko) 2004-07-14 2007-07-05 멀티채널 오디오 신호 부호화 및 복호화 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020070067747A KR100982427B1 (ko) 2004-07-14 2007-07-05 멀티채널 오디오 신호 부호화 및 복호화 방법

Country Status (5)

Country Link
US (1) US20060013405A1 (ko)
EP (2) EP1617413A3 (ko)
JP (2) JP2006031012A (ko)
KR (2) KR100773539B1 (ko)
CN (2) CN101789792B (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
KR100763919B1 (ko) * 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
KR100813269B1 (ko) * 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
KR101454343B1 (ko) * 2013-04-23 2014-10-24 한국산업은행 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
WO2014175617A1 (ko) * 2013-04-23 2014-10-30 ㈜ 소닉티어 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8050915B2 (en) * 2005-07-11 2011-11-01 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding
EP1946295B1 (en) 2005-09-14 2013-11-06 LG Electronics Inc. Method and apparatus for decoding an audio signal
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
WO2007091850A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101385077B (zh) * 2006-02-07 2012-04-11 Lg电子株式会社 用于编码/解码信号的装置和方法
CN101361276B (zh) * 2006-02-23 2015-02-18 Lg电子株式会社 处理音频信号的方法和装置
WO2007097550A1 (en) 2006-02-23 2007-08-30 Lg Electronics Inc. Method and apparatus for processing an audio signal
BRPI0706488A2 (pt) 2006-02-23 2011-03-29 Lg Electronics Inc método e aparelho para processar sinal de áudio
KR101438387B1 (ko) 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
CN101212845B (zh) * 2006-12-25 2011-05-04 上海乐金广电电子有限公司 家庭影院系统的扩音器声道的设定方法
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101435815B1 (ko) * 2007-11-28 2014-08-29 엘지전자 주식회사 방송 시스템 및 오디오 데이터 처리 방법
CA2706445C (en) * 2007-11-28 2019-07-23 Irx Therapeutics, Inc. Production of apoptosis-resistant t-lymphocytes for use in cancer therapy
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
KR101074010B1 (ko) 2009-09-04 2011-10-17 (주)이스트소프트 블록 단위 데이터 압축 및 복원 방법 및 그 장치
KR101016776B1 (ko) * 2009-09-21 2011-02-25 (주)이스트소프트 상위 호환성 보장형 압축 및 복원 방법 및 장치
US9626975B2 (en) 2011-06-24 2017-04-18 Koninklijke Philips N.V. Audio signal processor for processing encoded multi-channel audio signals and method therefor
KR102172279B1 (ko) * 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
WO2013122387A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transceiving system, data transmitting method, and data receiving method
WO2013122388A1 (en) * 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmission apparatus, data receiving apparatus, data transceiving system, data transmission method and data receiving method
WO2013122386A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122385A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
TWI505262B (zh) 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2014005327A1 (zh) * 2012-07-06 2014-01-09 深圳广晟信源技术有限公司 对多声道数字音频编码的方法
GB2524333A (en) 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
CN107636757B (zh) * 2015-05-20 2021-04-09 瑞典爱立信有限公司 多声道音频信号的编码
CN105895111A (zh) * 2015-12-15 2016-08-24 乐视致新电子科技(天津)有限公司 基于Android的音频内容处理方法及设备
CN109284080B (zh) * 2018-09-04 2021-01-05 Oppo广东移动通信有限公司 音效调整方法、装置、电子设备以及存储介质
CN110808054B (zh) * 2019-11-04 2022-05-06 思必驰科技股份有限公司 多路音频的压缩与解压缩方法及系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451942A (en) * 1994-02-04 1995-09-19 Digital Theater Systems, L.P. Method and apparatus for multiplexed encoding of digital audio information onto a digital audio storage medium
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
JP3342996B2 (ja) * 1995-08-21 2002-11-11 三星電子株式会社 多チャネルオーディオ符号化器及び符号化方法
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7047201B2 (en) * 2001-05-04 2006-05-16 Ssi Corporation Real-time control of playback rates in presentations
RU2316154C2 (ru) * 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP1414273A1 (en) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Embedded data signaling
EP2665294A2 (en) * 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
KR100561867B1 (ko) * 2003-03-07 2006-03-17 삼성전자주식회사 오디오 신호 처리 장치와 방법 및 컴퓨터 프로그램을저장하는 컴퓨터로 읽을 수 있는 기록 매체
CN100546233C (zh) * 2003-04-30 2009-09-30 诺基亚公司 用于支持多声道音频扩展的方法和设备
DE602004028171D1 (de) * 2004-05-28 2010-08-26 Nokia Corp Mehrkanalige audio-erweiterung
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
KR100813269B1 (ko) * 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
KR100763919B1 (ko) * 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
US8744088B2 (en) 2006-08-03 2014-06-03 Samsung Electronics Co., Ltd. Method, medium, and apparatus decoding an input signal including compressed multi-channel signals as a mono or stereo signal into 2-channel binaural signals
KR101454343B1 (ko) * 2013-04-23 2014-10-24 한국산업은행 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
WO2014175617A1 (ko) * 2013-04-23 2014-10-30 ㈜ 소닉티어 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
US9679572B2 (en) 2013-04-23 2017-06-13 The Korea Development Bank Method and apparatus for encoding/decoding scalable digital audio using direct audio channel data and indirect audio channel data

Also Published As

Publication number Publication date
US20060013405A1 (en) 2006-01-19
KR20070077220A (ko) 2007-07-25
KR100982427B1 (ko) 2010-09-15
EP1617413A3 (en) 2006-07-26
KR100773539B1 (ko) 2007-11-05
CN101789792A (zh) 2010-07-28
CN101789792B (zh) 2012-03-28
CN1756086A (zh) 2006-04-05
CN1756086B (zh) 2010-05-05
EP2276022A2 (en) 2011-01-19
JP2006031012A (ja) 2006-02-02
JP2012238034A (ja) 2012-12-06
EP1617413A2 (en) 2006-01-18
EP2276022A3 (en) 2011-10-05

Similar Documents

Publication Publication Date Title
KR100773539B1 (ko) 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR101139880B1 (ko) 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을 위한 시간적 엔벨로프 정형화
KR100335611B1 (ko) 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP5576488B2 (ja) オーディオ信号デコーダ、オーディオ信号エンコーダ、アップミックス信号表現の生成方法、ダウンミックス信号表現の生成方法、及びコンピュータプログラム
US7245234B2 (en) Method and apparatus for encoding and decoding digital signals
US20070165869A1 (en) Support of a multichannel audio extension
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
US20140257824A1 (en) Apparatus and a method for encoding an input signal
KR100718132B1 (ko) 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
EP1932239A4 (en) METHOD AND APPARATUS FOR ENCODING / DECODING
TWI463483B (zh) 用於可縮放聲頻編碼之位元率分配/修剪的方法及裝置
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
US20110311063A1 (en) Embedding and extracting ancillary data
Liebchen An introduction to MPEG-4 audio lossless coding
KR102486258B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
Yang High fidelity multichannel audio compression
Yang et al. Embedded high-quality multichannel audio coding
KR20080010981A (ko) 데이터 부호화/복호화 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20120927

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130927

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140929

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150925

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160929

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee