KR20070025903A - 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법 - Google Patents

멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법 Download PDF

Info

Publication number
KR20070025903A
KR20070025903A KR1020060004051A KR20060004051A KR20070025903A KR 20070025903 A KR20070025903 A KR 20070025903A KR 1020060004051 A KR1020060004051 A KR 1020060004051A KR 20060004051 A KR20060004051 A KR 20060004051A KR 20070025903 A KR20070025903 A KR 20070025903A
Authority
KR
South Korea
Prior art keywords
signal
spatial information
parameter bands
audio signal
bitstream
Prior art date
Application number
KR1020060004051A
Other languages
English (en)
Inventor
방희석
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020087006785A priority Critical patent/KR100891685B1/ko
Priority to KR1020087006787A priority patent/KR100880645B1/ko
Priority to CN200680031505.8A priority patent/CN101253807B/zh
Priority to RU2008112226/09A priority patent/RU2376656C1/ru
Priority to TW099128646A priority patent/TWI425843B/zh
Priority to KR1020087021422A priority patent/KR101165641B1/ko
Priority to EP06843794A priority patent/EP1938663A4/en
Priority to KR1020087006921A priority patent/KR100880647B1/ko
Priority to JP2008528944A priority patent/JP5108768B2/ja
Priority to EP06843793.8A priority patent/EP1938662B1/en
Priority to PCT/KR2006/003424 priority patent/WO2007055463A1/en
Priority to AU2006285538A priority patent/AU2006285538B2/en
Priority to EP06843795A priority patent/EP1920636B1/en
Priority to BRPI0615114-0A priority patent/BRPI0615114A2/pt
Priority to PCT/KR2006/003426 priority patent/WO2007027051A1/en
Priority to US11/514,284 priority patent/US7831435B2/en
Priority to RU2009131769/08A priority patent/RU2473062C2/ru
Priority to JP2008528939A priority patent/JP5111374B2/ja
Priority to US11/514,302 priority patent/US7765104B2/en
Priority to PCT/KR2006/003425 priority patent/WO2007055464A1/en
Priority to CN200680031572XA priority patent/CN101253809B/zh
Priority to AT06843792T priority patent/ATE455348T1/de
Priority to PCT/KR2006/003422 priority patent/WO2007055461A1/en
Priority to JP2008528940A priority patent/JP2009506372A/ja
Priority to CN2006800314619A priority patent/CN101253551B/zh
Priority to JP2008528943A priority patent/JP5111376B2/ja
Priority to MX2008002713A priority patent/MX2008002713A/es
Priority to PCT/KR2006/003420 priority patent/WO2007027050A1/en
Priority to KR1020087006788A priority patent/KR100880646B1/ko
Priority to EP06783762.5A priority patent/EP1938311B1/en
Priority to JP2008528942A priority patent/JP5111375B2/ja
Priority to EP20060843796 priority patent/EP1949759A4/en
Priority to PCT/KR2006/003423 priority patent/WO2007055462A1/en
Priority to JP2008528945A priority patent/JP5231225B2/ja
Priority to AT06843795T priority patent/ATE453908T1/de
Priority to EP06843792A priority patent/EP1920635B1/en
Priority to PCT/KR2006/003421 priority patent/WO2007055460A1/en
Priority to DE602006011757T priority patent/DE602006011757D1/de
Priority to CN200680031480.1A priority patent/CN101253806B/zh
Priority to CN200680031519XA priority patent/CN101253808B/zh
Priority to US11/513,896 priority patent/US7761303B2/en
Priority to US11/514,301 priority patent/US7783494B2/en
Priority to TW095132070A priority patent/TWI405475B/zh
Priority to KR1020087006790A priority patent/KR100891687B1/ko
Priority to US11/513,834 priority patent/US7822616B2/en
Priority to CN2006800316192A priority patent/CN101253810B/zh
Priority to DE602006011479T priority patent/DE602006011479D1/de
Priority to US11/514,359 priority patent/US7792668B2/en
Priority to CN2006800309057A priority patent/CN101248484B/zh
Priority to KR1020087006789A priority patent/KR100891686B1/ko
Priority to KR1020087006786A priority patent/KR100880644B1/ko
Priority to US11/513,842 priority patent/US7783493B2/en
Priority to EP06783763.3A priority patent/EP1941497B1/en
Priority to CA2620627A priority patent/CA2620627C/en
Priority to JP2008528941A priority patent/JP5108767B2/ja
Publication of KR20070025903A publication Critical patent/KR20070025903A/ko
Priority to HK09101883.9A priority patent/HK1124681A1/xx
Priority to US12/839,381 priority patent/US8165889B2/en
Priority to US12/843,761 priority patent/US8060374B2/en
Priority to US12/860,750 priority patent/US8103513B2/en
Priority to US12/900,149 priority patent/US8103514B2/en
Priority to US12/905,051 priority patent/US8082158B2/en
Priority to JP2013003356A priority patent/JP5319846B2/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B28WORKING CEMENT, CLAY, OR STONE
    • B28BSHAPING CLAY OR OTHER CERAMIC COMPOSITIONS; SHAPING SLAG; SHAPING MIXTURES CONTAINING CEMENTITIOUS MATERIAL, e.g. PLASTER
    • B28B3/00Producing shaped articles from the material by using presses; Presses specially adapted therefor
    • B28B3/12Producing shaped articles from the material by using presses; Presses specially adapted therefor wherein one or more rollers exert pressure on the material
    • B28B3/126Producing shaped articles from the material by using presses; Presses specially adapted therefor wherein one or more rollers exert pressure on the material on material passing directly between the co-operating rollers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B28WORKING CEMENT, CLAY, OR STONE
    • B28BSHAPING CLAY OR OTHER CERAMIC COMPOSITIONS; SHAPING SLAG; SHAPING MIXTURES CONTAINING CEMENTITIOUS MATERIAL, e.g. PLASTER
    • B28B11/00Apparatus or processes for treating or working the shaped or preshaped articles
    • B28B11/14Apparatus or processes for treating or working the shaped or preshaped articles for dividing shaped articles by cutting
    • B28B11/16Apparatus or processes for treating or working the shaped or preshaped articles for dividing shaped articles by cutting for extrusion or for materials supplied in long webs
    • B28B11/166Apparatus or processes for treating or working the shaped or preshaped articles for dividing shaped articles by cutting for extrusion or for materials supplied in long webs with devices for determining the correct cutting moment, e.g. measuring rollers or the like
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B28WORKING CEMENT, CLAY, OR STONE
    • B28BSHAPING CLAY OR OTHER CERAMIC COMPOSITIONS; SHAPING SLAG; SHAPING MIXTURES CONTAINING CEMENTITIOUS MATERIAL, e.g. PLASTER
    • B28B3/00Producing shaped articles from the material by using presses; Presses specially adapted therefor
    • B28B3/12Producing shaped articles from the material by using presses; Presses specially adapted therefor wherein one or more rollers exert pressure on the material
    • B28B3/123Producing shaped articles from the material by using presses; Presses specially adapted therefor wherein one or more rollers exert pressure on the material on material in moulds or on moulding surfaces moving continuously underneath or between the rollers, e.g. on an endless belt
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B11/00Wrapping, e.g. partially or wholly enclosing, articles or quantities of material, in strips, sheets or blanks, of flexible material
    • B65B11/58Applying two or more wrappers, e.g. in succession
    • CCHEMISTRY; METALLURGY
    • C04CEMENTS; CONCRETE; ARTIFICIAL STONE; CERAMICS; REFRACTORIES
    • C04BLIME, MAGNESIA; SLAG; CEMENTS; COMPOSITIONS THEREOF, e.g. MORTARS, CONCRETE OR LIKE BUILDING MATERIALS; ARTIFICIAL STONE; CERAMICS; REFRACTORIES; TREATMENT OF NATURAL STONE
    • C04B14/00Use of inorganic materials as fillers, e.g. pigments, for mortars, concrete or artificial stone; Treatment of inorganic materials specially adapted to enhance their filling properties in mortars, concrete or artificial stone
    • C04B14/02Granular materials, e.g. microballoons
    • C04B14/04Silica-rich materials; Silicates
    • C04B14/10Clay
    • CCHEMISTRY; METALLURGY
    • C04CEMENTS; CONCRETE; ARTIFICIAL STONE; CERAMICS; REFRACTORIES
    • C04BLIME, MAGNESIA; SLAG; CEMENTS; COMPOSITIONS THEREOF, e.g. MORTARS, CONCRETE OR LIKE BUILDING MATERIALS; ARTIFICIAL STONE; CERAMICS; REFRACTORIES; TREATMENT OF NATURAL STONE
    • C04B33/00Clay-wares
    • C04B33/02Preparing or treating the raw materials individually or as batches
    • C04B33/13Compounding ingredients
    • C04B33/14Colouring matters
    • GPHYSICS
    • G04HOROLOGY
    • G04BMECHANICALLY-DRIVEN CLOCKS OR WATCHES; MECHANICAL PARTS OF CLOCKS OR WATCHES IN GENERAL; TIME PIECES USING THE POSITION OF THE SUN, MOON OR STARS
    • G04B19/00Indicating the time by visual means
    • G04B19/06Dials
    • G04B19/10Ornamental shape of the graduations or the surface of the dial; Attachment of the graduations to the dial

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Ceramic Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Structural Engineering (AREA)
  • Materials Engineering (AREA)
  • Organic Chemistry (AREA)
  • Manufacturing & Machinery (AREA)
  • Dispersion Chemistry (AREA)
  • Civil Engineering (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 멀티채널 오디오 신호의 비트스트림(bitstream) 구성방법에 관한 것으로서, 더욱 상세하게는 멀티채널 오디오 코딩에서 레지듀얼 신호의 파라미터 밴드 수에 대한 비트스트림을 효과적으로 구성하는 방법에 관한 것이다.
상기 비트스트림을 효과적으로 구성하기 위해, 본 발명에 따른 멀티채널 오디오 신호의 인코딩 방법은, 상기 레지듀얼 신호의 파라미터 밴드 수를 전체 채널의 파라미터 밴드 수를 이용하여 가변적으로 표현하거나, 그룹별로 표현하거나, 절대값 및 비교값으로 표현하거나, 또는 전체 채널의 파라미터 밴드 수를 넘지 못하도록 제한된 값으로 표현할 수 있다.
멀티채널 오디오 코딩, MPEG surround, 레지듀얼 신호.

Description

멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의 파라미터 밴드 수 비트스트림 구성방법{METHOD OF EFFECTIVE BITSTREAM COMPOSITION FOR THE SPATIAL PARAMETER BAND NUMBER OF RESIDUAL SIGNAL IN MULTI-CHANNEL AUDIO CODING}
도 1은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 나타내는 도면.
도 2는 본 발명에서의 공간 인코더 및 디코더를 이용하여 멀티채널 오디오 신호를 코딩하는 방법에 대한 도면.
도 3은 본 발명에서의 멀티채널 오디오 신호를 공간 디코더 내에서 2채널에서 5.1채널로 바꾸는 단계에 대한 상세한 도면.
도 4는 본 발명에 따른 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 전체 비트스트림의 구성도.
도 5는 본 발명에 따른 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 공간정보 비트스트림의 신택스에 대한 도면.
도 6a는 본 발명의 제1 실시예에 따른 신택스를 나타내는 도면.
도 6b는 본 발명의 제1 실시예에 따른 흐름도.
도 7a는 본 발명의 제2 실시예에 따른 레지듀얼 신호의 파라미터 밴드 수를 그룹으로 표현한 도면.
도 7b는 본 발명의 제2 실시예에 따른 흐름도.
도 8은 본 발명의 제3 실시예에 따른 흐름도.
도 9는 본 발명의 제4 실시예에 다른 흐름도.
*도면의 주요부분에 대한 부호의 설명
101.원거리 음원 102.직접적인 음파
104.반사된 음파 201.멀티채널 오디오 신호
202.다운믹스부 203.스페셜 파라미터 추출부
204.공간 인코더 205.아티스틱 다운믹스 오디오 신호
206.모노 또는 스테레오 오디오 신호 207.스페셜 파라미터
208.공간 디코더 301.다운믹스 신호
302.2채널 분석 필터뱅크 303.2채널 타임/주파수 신호
304.업믹스부 305.6채널 시간/주파수 신호
306.6채널 통합 필터뱅크 401.프레임
402.공간 정보 비트스트림 403.코어 코덱 비트스트림
404.컨피규레이션 비트스트림 405.공간 데이터 비트스트림
501.레지듀얼 신호에 대한 정보
본 발명은 멀티채널 오디오 신호의 비트스트림(bitstream) 구성방법에 관한 것으로서, 더욱 상세하게는 멀티채널 오디오 코딩에서 레지듀얼 신호의 파라미터 밴드 수에 대한 비트스트림을 효과적으로 구성하는 방법에 관한 것이다.
최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 심리음향 모델(Psychoacoustic model)을 이용하여 멀티채널 오디오 신호(multi-channel audio signal)의 코딩방법들이 개발되고 있으며, 이에 대한 표준화 작업이 진행되고 있다.
상기 심리음향 모델은 인간이 소리를 인식하는 방식, 예를 들면 큰 소리 다음에 오는 작은 소리는 들리지 않으며, 20Hz 내지 20000Hz의 주파수에 해당되는 소리만 들을 수 있다는 사실을 이용하여, 코딩과정에서 불필요한 부분에 대한 오디오 신호를 제거함으로써 필요한 데이터의 양을 효과적으로 줄일 수 있는 것이다.
현재 MPEG-1 오디오(MEPG-1 레이어 Ⅲ), MPEG-4 AAC(Advanced Audio Coding) 및 MPEG-4 HE-AAC(High-Efficiency AAC)와 같은 오디오 표준 기술이 개발되어 상용화되고 있다. 또한 공간 정보를 이용하는 멀티채널 오디오 신호의 코딩방법이 개발되고 있다. 상기 멀티채널 오디오 신호의 코딩방법은 압축된 오디오 신호(예를 들면, 스테레오 또는 모노 오디오 신호) 및 낮은 비트-레이트의 부가정보(low-rate side information)(예를 들면, 공간 정보) 채널을 이용하여 멀티채널 오디오 신호의 전송 효율을 매우 효과적으로 향상시키는 것이다.
그러나, 상기 멀티채널 오디오 신호의 코딩방법에서 멀티채널 오디오 신호의 비트스트림을 구성하는데 있어서, 상기 비트스트림 내에 포함되는 정보, 예를 들면 레지듀얼 신호의 파라미터 밴드 수에 대한 특성을 고려하지 않고, 상기 오디오 신 호에 대한 비트스트림이 구성되어 효율이 좋지 못하다는 단점이 있었다.
따라서 상기와 같은 문제점을 해결하기 위해 제안된 본 발명은, 멀티채널 오디오 신호를 코딩하는데 있어서, 비트스트림 내에 포함되는 정보(예를 들면, 레지듀얼 신호의 파라미터 밴드 수 정보)의 특성을 고려하여 공간 정보 비트스트림(spatial information bitstream)을 효율적인 방식으로 표현함으로써, 멀티채널 오디오 신호의 인코딩, 전송 및 디코딩 효율을 향상시킬 수 있는 인코딩 및 디코딩 방법을 제공하는데 그 목적이 있다.
상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간정보를 추출하는 단계와; 상기 다운믹스된 오디오 신호 및 상기 공간 정보를 이용하여 코어 코덱 비트스트림(core codec bitstream) 및 공간 정보 비트스트림(spatial information bitstream)을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하고, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 신호의 파라미터 밴드 수를 이용하여 가변적으로 표현되는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다.
여기서, 상기 전체 채널의 파라미터 밴드 수가 2^(n-1)이상 2^(n)미만 또는 2^(n-1)초과 2^(n)이하인 경우에는, 상기 레지듀얼 신호의 파라미터 밴드 수를 n비트로 표현할 수 있다. 만일 상기 레지듀얼 신호가 복수(N)로 존재하는 경우, 전체 채널에 대한 파라미터 밴드 수(numBands) 및 i번째 레지듀얼 신호의 파라미터 밴드 수(bsResidualBandsi)를 이용하여, 상기 레지듀얼 신호의 파라미터 밴드 수의 전체 조합을,
Figure 112006002668024-PAT00001
와 같이 표현할 수 있다. 그리고 상기 레지듀얼 신호의 파라미터 밴드 수(bsResidualBands)는 전체 채널에 대한 파라미터 밴드 수(numBands)를 변수로 하여 가장 가까운 정수로 올림하는 함수(ceil 함수)에 의해 결정되는 비트 수로 표현될 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간정보를 추출하는 단계와; 상기 다운믹스된 오디오 신호 및 상기 공간 정보를 이용하여 코어 코덱 비트스트림(core codec bitstream) 및 공간 정보 비트스트림(spatial information bitstream)을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림 내에는 복수의 레지듀얼 신호가 존재하고, 상기 각 레지듀얼 신호는 고유의 파라미터 밴드 수를 가지며, 상기 복수의 레지듀얼 신호에 대응하는 복수의 파라미터 밴드 수를 하나 이상의 그룹으로 구분하되, 상기 그룹별로 각 레지듀얼 신호에 적용되는 파라미터 밴드 수를 나타내는 정보를 결정하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다. 여기서 상기 복수의 레지듀얼 신호에 대응하는 파라미터 밴드 수가 kN+L개인 경우, 상기 그룹은 N개씩 묶어서 하나의 그룹으로 만들고 M 비트로 표현하며, 최후의 그룹은 L개를 묶어서 만들고 P비트로 표현할 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계와; 상기 다운믹스된 오디오 신호 및 공간 정보를 이용하여 코어 코덱 비트스트림 및 공간 정보 비트스트림을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하고, 상기 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수를 표현하는 정보는, 하나 이상의 절대값 및 상기 절대값을 기준으로 하여 적응적(adaptive)으로 선택된 비교값으로 생성되는 것을 특징으로 하는 멀티채널 오디오 신호를 인코딩하는 방법을 제공한다. 여기서 상기 절대값은 하나가 존재하고, 상기 절대값으로 전체 채널의 파라미터 밴드 수를 사용할 수 있다. 또한 상기 절대값이 두 개 이상 존재하고, 상기 절대값은 상기 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수 중에서 선택될 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계와; 상기 다운믹스된 오디오 신호 및 공간 정보를 이용하여 코어 코덱 비트스트림 및 공간 정보 비트스트림을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하고, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 채널의 파라미터 밴드 수를 넘지 않도록 제한되는 것을 특징으로 하는 멀티채널 오디오 신호를 인코딩하는 방법을 제공한다. 여기서 상기 레지듀얼 신호의 파라미터 밴드 수는 상기 공간 정보 비트스트림의 샘플링 주파수, 레지듀얼 신호의 샘플링 주 파수 및 공간 프레임당 레지듀얼 프레임 수의 조합으로 결정될 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계와; 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 상기 전체 신호의 파라미터 밴드 수를 이용해 가변적으로 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계와; 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 그룹별로 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계와; 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호 의 파라미터 밴드 수 및 하나 이상의 절대값 및 비교값으로 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계와; 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 상기 전체 채널의 파라미터 밴드 수를 넘지 않도록 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 상기 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하며, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 신호의 파라미터 밴드 수를 이용하여 가변적 표현되도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고, 상기 공간 정보 비트 스트림은 복수의 레지듀얼 신호를 포함하며, 상기 각 레지듀얼 신호는 고유의 파라미터 밴드 수를 가지며, 상기 복수의 레지듀얼 신호에 대응하는 복수의 파라미터 밴드 수를 하나 이상의 그룹으로 구분하되, 상기 그룹별로 각 레지듀얼 신호에 적용되는 파라미터 밴드 수를 나타내는 정보를 결정하도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고, 상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하며, 상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하고, 상기 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수를 표현하는 정보는, 하나 이상의 절대값 및 상기 절대값을 기준으로 하여 적응적(adaptive)으로 선택된 비교값으로 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고, 상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하며, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하고, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 채널의 파라미터 밴드 수를 넘지 않도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다.
도 1 은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 도시한다. 멀티채널 오디오 신호에 대한 코딩방법은 인간이 오디오 신호를 3차원적 공간으로 인지한다는 사실을 바탕으로, 복수의 파라미터 세트(parameter sets)를 통하여 상기 오디오 신호를 3차원적 공간 정보로 표현할 수 있다는 것을 이용한다. 멀티채널 오디오 신호의 공간 정보를 표시하기 위한 "공간 파라미터"라고 불리는 상기 파라미터에는 CLD(Channel level differences), ICC(Inter Channel Coherences) 및 CPC(Channel Prediction Coefficients) 등이 있다. 상기 CLD는 두 채널간의 에너지 차이를 의미하고, 상기 ICC는 두 채널 간의 상관관계(correlation)를 의미하며, 상기 CPC는 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수(prediction coefficient)를 의미한다.
인간이 오디오 신호를 어떻게 공간적으로 인식하며, 상기 공간 파라미터의 개념이 어떻게 생성되는지가 도 1에 도시된다. 원거리에 있는 음원(105)으로부터의 직접적인 음파(direct sound wave)(103)가 인간의 왼쪽 귀(107)에 도달하고, 또 다른 직접적인 음파(102)는 머리 주위에서 회절되어 오른쪽 귀(106)에 도달하게 된다. 상기 두 음파(102 및 103)는 도달시간 및 에너지 레벨에서 차이를 보이게 되며, 이와 같은 차이가 상기 CLD 및 CPC 파라미터를 생성하게 된다.
또한 만일 반사된 음파(104 및 105)가 양 귀에 도달되거나, 또는 상기 음원(105)이 분산되어 있다면, 서로 상관관계가 없는 음파가 양 귀에 도달될 것이고, 이것이 상기 ICC 파라미터를 생성하게 된다. 상기와 같이 원리로 생성된 공간 파라미터들은 멀티채널 오디오 신호를 모노 또는 스테레오 신호로 전송한 후 다시 멀티 채널로 출력하는데 있어서, 강력한 비트 수 감소를 가능하게 한다는 것이 알려져 있다.
본 발명은 상기 공간 파라미터들에 관한 정보를 매우 효율적인 방법으로 비트스트림 내에 표현하는 방법을 제시한다.
도 2 는 본 발명에서의 공간 인코더 및 디코더를 이용하여 멀티채널 오디오 신호를 코딩하는 원리를 도시한다. 도시된 것처럼, 먼저 공간 인코더(204)는 멀티채널 오디오 신호(201)를 수신한다. 여기서 N은 입력 채널의 수를 의미한다. 상기 멀티채널 오디오 신호(201)는 다운믹스(down-mix)부(202)에서 다운믹스되어 다운믹스 신호(206)로 된다.
또한 상기 멀티채널 오디오 신호의 공간 정보, 즉 공간 파라미터가 공간 파라미터 추출부(203)에서 상기 멀티채널 오디오 신호(201)로부터 추출된다. 여기서 공간 정보(spatial information)란 멀티채널(예를 들면, Left, Right, Center, Left surround, Right surround 등) 오디오 신호를 다운믹스하고, 상기 다운믹스 신호(206)를 전송하며, 상기 전송된 다운믹스 신호를 다시 멀티채널로 업믹스 할 때 사용되는 오디오 신호 채널에 대한 정보를 말한다. 선택적으로, 상기 다운믹스 신호(206)는 외부에서 직접 제공되는 다운믹스 신호, 예를 들면 아티스틱 다운믹스 신호(Artistic down-mix signal, 205)를 이용하여 생성될 수 있다.
상기 다운믹스 신호(206)는 상기 코어 코덱(예를 들면, MP3, AC-3, DTS 또는 AAC) 코딩방법을 이용하여 인코딩된 후 압축되어 전송되고, 또한 상기 공간 정보, 즉 공간 파라미터(207)도 함께 전송된다. 만일 사용자의 시스템이 상기 다운믹 스 신호(206)로만 출력할 수 있다면, 상기 압축되어 전송된 다운믹스 신호(206)는 디코딩된 후 직접 출력(209)될 수 있다. 만일 상기 시스템이 멀티채널 오디오 신호로 출력할 수 있다면, 상기 압축되어 전송된 오디오 신호는 디코딩된 후 공간 디코더(208)에서 함께 전송된 상기 멀티채널 오디오 신호의 공간 정보, 즉 공간 파라미터(207)를 이용하여 멀티채널 오디오 신호(210)로 변환되어 출력될 수 있다.
멀티채널 오디오 신호를 직접 전송하는 대신에, 상기와 같이 다운믹스 신호(206)로 다운믹스하여 전송하고, 상기 멀티채널 오디오 신호의 공간 정보, 즉 공간 파라미터(207)를 함께 전송하는 방식은 압축 및 전송효율의 관점에서 매우 유리하다.
본 발명은 상기 멀티채널 오디오 신호의 공간 정보, 즉 공간 파라미터(207)를 함께 전송하는데 있어서, 상기 공간 파라미터(207)를 보다 효율적으로 방법으로 표현하여 비트열을 구성함으로써 압축 및 전송효율을 개선할 수 있다.
도 3은 본 발명의 한 실시예에 따른, 멀티채널 오디오 신호를 상기 공간 디코더 내에서 2채널에서 5.1채널로 바꾸는 단계를 상세하게 도시한다. 본 발명은 도시된 것과 같이 다운믹스 신호를 5.1채널로 변환하는데 이용될 수 있으며, 또한 상기 다운믹스 신호를 5.1채널 이상의 멀티채널로 변환하는 경우에도 이용될 수 있다.
도시되는 것처럼, 상기 2채널에서 5.1채널로의 변환은 일반적으로 시간/주파수 영역(time/frequency domain)에서 이루어지는데, 그 과정은 다음과 같다. 첫째 2-채널 분석 필터뱅크(Analysis filterbank, 302)는 디코딩되어 전송된 스테레오 오디오 신호(301)를 2채널의 시간/주파수 영역 오디오 신호(303)로 변환한다. 둘째 상기 2채널 시간/주파수 영역 오디오 신호(303)는 상기 공간 정보, 즉 공간 파라미터를 이용하여 6채널 시간/주파수 오디오 신호(305)로 업믹스(up-mix, 304)된다. 셋째 상기 6채널 시간/주파수 영역 오디오 신호(305)는 6채널 통합 필터뱅크(Synthesis filterbank, 306)에 의해 5.1채널 오디오 신호(307)로 변환되어 출력된다. 본 발명에 따른 보다 효율적으로 생성된 멀티채널 오디오 신호의 공간 정보는, 상기 업믹스 단계에서 2채널 시간/주파수 오디오 신호로부터 6채널 시간/주파수 영역 오디오 신호로 변환되는데 이용될 수 있다.
도 4는 본 발명에 따른 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 전체 비트스트림을 도시한다. 도시된 것처럼, 매 프레임(401)은 코어 코덱 비트스트림(403) 및 공간 정보 비트스트림(402)으로 구성되고, 상기 공간 정보 비트스트림(402)은 컨피규레이션 비트스트림(404) 및 공간 데이터 비트스트림(405)으로 구성될 수 있다. 매 프레임(401)은 상기와 같이 구성되는 것이 바람직하나, 매 프레임(401)을 코어 코덱 비트스트림(403) 및 공간 데이터 비트스트림(405)로 구성할 수 있으며, 또한 매 프레임을 공간 데이터 비트스트림(405)만으로 구성할 수 있다. 레지듀얼 신호의 파라미터 밴드 수(406)는 상기 컨피규레이션 비트스트림(404)에 포함된다. 레지듀얼 신호란 원신호와 코딩된 신호와의 차이에 해당되는 신호를 말한다. 상기 레지듀얼 신호는 상기 컨피규레이션 비트스트림(404)에 선택적으로 포함될 수 있으며, 상기 레지듀얼 신호를 더 많이 포함할수록 데이터 양은 많아지지만 복호화된 음성신호의 음질이 좋아진다.
도 5는 본 발명에 따른 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 공간정보 비트스트림의 신택스를 도시한다. 도시되는 것처럼, 상기 레지듀얼 신호의 파라미터 밴드 수 정보(501)는 신택스 상의 "spatialSpecificConfig()" 내에 주어진다. 상기 "spatialSpecificConfig()"는 전체 채널의 파라미터 밴드 수 정보(502)(bsFreqRes)를 포함한다. 예를 들면 상기 전체 채널의 파라미터 밴드 수는 40, 28, 20, 14, 10, 7, 5, 4가 될 수 있으며, 각각 0, 1, 2, 3, 4, 5, 6, 7에 대응되는 bsFreqRes 값으로 표현될 수 있다. 일반적으로 상기 레지듀얼 신호의 파라미터 밴드 수는 고정된 비트 수로 표현된다. 본 발명은 상기 고정된 비트 수로 표현되는 것을 개선하여 상기 레지듀얼 신호에 대한 정보를 더 효율적인 방법으로 표현하는 것이다.
도 6a는 본 발명의 제1 실시예에 따른 신택스를 도시한다. 도시된 것처럼, 레지듀얼 신호의 파라미터 밴드 수(bsResidualBands[i])는 전체 채널의 파라미터 밴드 수(601)(numBands)를 이용하여 가변적인 비트 수로 표현될 수 있다. 상기 전체 채널의 파라미터 밴드 수(numBands, 601)가 2^(n-1)이상 2^(n)미만인 경우에는, 상기 레지듀얼 신호의 파라미터 밴드 수를 n비트로 표현할 수 있다. 예를 들면, (ⅰ) 상기 numBands가 40이면, bsResidualBands의 길이를 6비트로 하고, (ⅱ) 상기 numBands가 28 또는 20이면, bsResidualBands의 길이를 5비트로 하며, (ⅲ) numBands가 14 또는 10이면, bsResidualBands의 길이를 4비트로 하고, (ⅳ) numBands가 7, 5 또는 4이면, bsResidualBands의 길이를 3비트로 할 수 있다. 또한 본 발명은 상기 전체 채널의 파라미터 밴드 수가 2^(n-1)초과 2^(n)이하일 경우에 상기 레지듀얼 신호의 파라미터 밴드 수가 n비트로 표현되는 것을 포함할 수 있다. 예를 들면, (ⅰ) 상기 numBands가 40이면, bsResidualBands의 길이를 6비트로 하고, (ⅱ) 상기 numBands가 28 또는 20이면, bsResidualBands의 길이를 5비트로 하며, (ⅲ) numBands가 14 또는 10이면, bsResidualBands의 길이를 4비트로 하고, (ⅳ) numBands가 7, 5이면, bsResidualBands의 길이를 3비트로 하며, (ⅴ) numBands가 4이면 bsResidualBands의 길이를 2비트로 할 수 있다.
또한, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 채널의 파라미터 밴드 수를 변수로 하여 가장 가까운 정수로 올림하는 함수(ceil 함수)에 의해 결정되는 비트 수로 표현할 수 있다. 예를 들면, 상기 올림 함수는 (ⅰ) 0<bsResidualBands≤numBands 또는 0≤bsResidualBands<numBands의 경우에는, ceil(log2(numBands))로 표현되거나, (ⅱ) 0≤bsResidualBands≤numBand의 경우에는, ceil(log2(numBands+1))로 표현될 수 있다. 또한 본 발명은 상기 전체 채널에 대한 파라미터 밴드 수보다 작거나 같은 값(numberBands)을 임의로 정하고, 상기 올림 함수가 (ⅰ) 0<bsResidualBands≤numberBands 또는 0≤bsResidualBands<numberBands의 경우에는, ceil(log2(numberBands))로 표현되거나, (ⅱ) 0≤bsResidualBands≤numberBands의 경우에는, ceil(log2(numberBands+1))로 표현되는 것을 포함할 수 있다.
또한, 레지듀얼 신호가 복수(N)로 존재하는 경우, 전체 채널에 대한 파라미터 밴드 수 및 i번째 레지듀얼 신호의 파라미터 밴드 수(bsResidualBandsi)를 이용 하여, 본 발명은 상기 레지듀얼 신호의 파라미터 밴드 수 전체 조합을
Figure 112006002668024-PAT00002
와 같이 표현할 수 있다. 예를 들면, 상기 "bsResidualBands" 값(이하, a1, a2, a3라 한다)이 3가지 경우에 해당하면, 상기 a1, a2, a3 정보를 각각 표현하는데 2비트가 필요하므로 전체 6비트 필요하다. 만약 상기 a1, a2, a3 정보를 묶어서 하나의 그룹으로 표현하면 3*3*3=27가지의 경우가 생기고, 이는 상기 6비트보다 작은 5비트로 표현할 수 있다. 만일 "numSlots"이 3이며, 5비트로 읽은 값이 15였다면, 이를 15=1x(3^2)+2*(3^1)+0*(3^0)으로 표현할 수 있으며, 디코더에서 상기 수식을 역으로 적용하여 상기, a1, a2, a3가 각각 1, 2, 0 이라는 정보를 추출할 수 있다. 또한 본 발명은 상기 레지듀얼 신호의 파라미터 밴드 수 전체 조합을
Figure 112006002668024-PAT00003
또는,
Figure 112006002668024-PAT00004
또는,
Figure 112006002668024-PAT00005
과 같이 표현하는 것을 포함할 수 있다.
도 6b는 본 발명의 제1 실시예에 따른 흐름도를 나타낸다. 레지듀얼 신호의 파라미터 밴드 수를 효과적으로 표현하기 위해, 먼저, 멀티채널 오디오 신호(602)로부터 오디오 신호를 다운믹스(603)하고, 상기 다운믹스된 오디오 신호를 이용하여 코어 코덱 비트스트림(605)을 생성한다. 상기 다운믹스된 오디오 신호는 모노 또는 스테레오 신호를 포함할 수 있다.
그 다음에 멀티채널 오디오 신호(602)로부터 공간 정보를 추출(604)하고, 레지듀얼 신호의 파라미터 밴드 수 정보를 전체 채널의 파라미터 밴드 수에 의해 가변적으로 표현(606)한다. 그 다음에 상기 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 공간 정보 비트스트림을 생성(607)하고, 상기 코어 코덱 비트스트림 및 공간 정보 비트스트림으로 구성되는 전체 비트스트림을 전송(608)한다.
도 7a는 본 발명의 제2 실시예에 따른 레지듀얼 신호의 파라미터 밴드 수를 그룹으로 표현한 도면을 나타낸다. 만일 복수의 레지듀얼 신호가 존재하는 경우, 상기 각 레지듀얼 신호는 고유의 파라미터 밴드 수를 가지며, 상기 복수의 레지듀얼 신호에 대응하는 복수의 파라미터 밴드 수를 하나 이상의 그룹으로 구분하되, 상기 그룹별로 각 레지듀얼 신호에 적용되는 파라미터 밴드 수를 나타내는 정보를 결정할 수 있다. 도시되는 것처럼, 만일 상기 레지듀얼 신호의 파라미터 밴드 수가 kN+L개인 경우, 각각의 데이터를 표시하는데 Q비트가 필요하다면(여기서, k와 N은 음이 아닌 임의의 정수이며, L은 0≤L<N을 만족하는 임의의 정수), 상기 복수의 LFE채널에 적용되는 복수의 파라미터 밴드 수를 그룹으로 표현할 수 있다.
구체적으로, N개의 데이터를 묶어서 하나의 그룹으로 만들고 M비트를 사용하여 상기 그룹을 표현하며, 최후의 그룹은 L개의 데이터를 사용하여 구성하고 P비트 를 사용하여 상기 최후의 그룹을 표현할 수 있다. 여기서, 그룹으로 묶어서 표현하는데 사용되는 M비트는 그룹으로 묶지 않고 각각 표현하는 경우에 사용되는 N*Q비트보다 작은 것이 바람직하다. 상기 최후의 그룹을 표현하기 위해 사용되는 P비트도 그룹으로 묶지 않고 각각 표현하는 경우에 사용되는 L*Q비트 이하인 것이 바람직하다. 예를 들면, 데이터 b1과 b2가 5가지 값을 가지는 경우를 가정하면, 상기 각 데이터를 표현하기 위해 각각 3비트를 사용하여 표현하여야 한다. 이 경우 3비트로 8개의 값을 표현할 수 있는데 실제 필요한 값은 5개이므로, 상기 데이터는 각각 3개의 리던던시(redundancy)를 갖는다. 그런데, 상기 데이터 b1 및 b2를 묶어서 그룹으로 표현하면 3비트+3비트=6비트가 아니라, 5비트만 사용하면 된다. 즉, 상기 b1 및 b2의 모든 조합이 5*5=25가지이므로, 5비트만으로 표현할 수 있다. 상기 조합으로 표현하는 경우에도 7개의 리던던시가 발생하지만 이는 각각 3비트를 사용하는 경우보다 리던던시가 감소된 것으로 볼 수 있다.
(a) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 40가지 값을 가지는 경우, N을 각각 2,3,4,5,6으로 사용하여 하나의 그룹을 만들고 이를 각각 11,16,22,27,32비트를 이용하여 표시하거나, 또는 상기 각각의 경우를 조합하여 표현할 수 있다.
(b) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 28가지 값을 가지는 경우, N을 6으로 사용하여 하나의 그룹을 만들고 이를 29비트를 이용하여 표현할 수 있다.
(c) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 20가지 값을 가 지는 경우, N을 각각 2,3,4,5,6,7로 사용하여 하나의 그룹을 만들고 이를 각각 9,13,18,22,26,31비트를 이용하여 표시하거나, 또는 상기 각각의 경우를 조합하여 표현할 수 있다.
(d) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 14가지 값을 가지는 경우, N을 6으로 사용하여 하나의 그룹을 만들고 이를 23비트를 이용하여 표현할 수 있다.
(e) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 10가지 값을 가지는 경우, N을 각각 2,3,4,5,6,7,8,9로 사용하여 하나의 그룹을 만들고 이를 각각 7,10,14,17,20,24,27,30비트를 이용하여 표시하거나, 또는 상기 각각의 경우를 조합하여 표현할 수 있다.
(f) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 7가지 값을 가지는 경우, N을 각각 6,7,8,9,10,11로 사용하여 하나의 그룹을 만들고 이를 각각 17,20,23,26,29,31비트를 이용하여 표시하거나, 또는 상기 각각의 경우를 조합하여 표현할 수 있다.
(g) 만일 상기 레지듀얼 신호의 파라미터 밴드 수 데이터가 5가지 값을 가지는 경우, N을 각각 2,3,4,5,6,7,8,9,10,11,12,13으로 사용하여 하나의 그룹을 만들고 이를 각각 5,7,10,12,14,17,19,21,24,26,28,31비트를 이용하여 표시하거나, 또는 상기 각각의 경우를 조합하여 표현할 수 있다.
또한, 상기 LFE채널에 적용되는 파라미터 밴드 수 데이터들은 상기와 같이 그룹으로 표현될 수 있거나, 또는 각각의 데이터들을 독립적인 비트열로 만들어서 연속적으로 붙여지도록 구성될 수 있다.
도 7b는 본 발명의 제2 실시예에 따른 흐름도를 나타낸다. 레지듀얼 신호의 파라미터 밴드 수를 효과적으로 표현하기 위해, 먼저, 멀티채널 오디오 신호(702)로부터 오디오 신호를 다운믹스(703)하고, 상기 다운믹스된 오디오 신호를 이용하여 코어 코덱 비트스트림(705)을 생성한다. 상기 다운믹스된 오디오 신호는 모노 또는 스테레오 신호를 포함할 수 있다.
그 다음에 멀티채널 오디오 신호(702)로부터 공간 정보를 추출(704)하고, 레지듀얼 신호의 파라미터 밴드 수 정보를 상술된 방식을 사용하여 그룹으로 표현(706)한다. 그 다음에 상기 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 공간 정보 비트스트림을 생성(707)하고, 상기 코어 코덱 비트스트림 및 공간 정보 비트스트림으로 구성되는 전체 비트스트림을 전송(708)한다.
도 8은 본 발명의 제3 실시예에 따른 흐름도를 나타낸다. 본 발명의 제3 실시예는 레지듀얼 신호의 파라미터 밴드 수를 절대값 및 비교값으로 표현하는 것이다. 상기 레지듀얼 신호의 파라미터 밴드 수를 효과적으로 표현하기 위해, 먼저, 멀티채널 오디오 신호(801)로부터 오디오 신호를 다운믹스(802)하고, 상기 다운믹스된 오디오 신호를 이용하여 코어 코덱 비트스트림(804)을 생성한다. 상기 다운믹스된 오디오 신호는 모노 또는 스테레오 신호를 포함할 수 있다.
그 다음에 멀티채널 오디오 신호(801)로부터 공간 정보를 추출(803)하고, 레지듀얼 신호의 파라미터 밴드 수 정보를 하나 이상의 절대값 및 상기 절대값을 기준으로 적응적으로 선택된 비교값으로 표현(805)한다. 본 발명은 상기 절대값이 하 나만 존재하고, 상기 절대값으로 전체 채널의 파라미터 밴드 수를 사용하거나, 또는 상기 절대값이 두 개 이상 존재하고, 상기 절대값을 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수 중에서 선택하는 경우를 포함할 수 있다. 그 다음에 상기 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 공간 정보 비트스트림을 생성(806)하고, 상기 코어 코덱 비트스트림 및 공간 정보 비트스트림으로 구성되는 전체 비트스트림을 전송(807)한다.
도 9는 본 발명의 제4 실시예에 따른 흐름도를 나타낸다. 본 발명의 제4 실시예는 레지듀얼 신호의 파라미터 밴드 수를 전체 채널의 파라미터 밴드 수를 넘지 않도록 제한된 값으로 표현하는 것이다. 상기 레지듀얼 신호의 파라미터 밴드 수를 효과적으로 표현하기 위해, 먼저, 멀티채널 오디오 신호(901)로부터 오디오 신호를 다운믹스(902)하고, 상기 다운믹스 신호를 이용하여 코어 코덱 비트스트림(904)을 생성한다. 상기 다운믹스된 오디오 신호는 모노 또는 스테레오 신호를 포함할 수 있다.
그 다음에 멀티채널 오디오 신호(901)로부터 공간 정보를 추출(903)하고, 레지듀얼 신호의 파라미터 밴드 수 정보를 전체 채널의 파라미터 밴드 수를 넘지 않도록 제한된 값으로 표현한다. 상기 레지듀얼 신호의 파라미터 밴드 수는 공간 정보 비트스트림의 샘플링 주파수, 레지듀얼 신호의 샘플링 주파수 및 공간 프레임당 레지듀얼 프레임 수의 조합에 의해 정해진 값만을 가지도록 하거나, 미리 정해진 규칙에 의해 정해진 값이나 범위를 사용하게 할 수 있다. 예를 들면, 상기 조합은 전체 프레임 길이를 공간 프레임당 레지듀얼 프레임 수로 나눈 값에 따라 정해지는 상기 공간 정보 비트스트림의 샘플링 주파수 및 레지듀얼 신호의 샘플링 주파수 세트가 결정되고, 상기 결정된 세트에 따라 레지듀얼 신호의 파라미터 밴드 수가 결정될 수 있다. 또한, 전체 프레임 길이를 공간 프레임당 레지듀얼 프레임 수로 나눈 값에 따라 정해지는 전체 채널의 파라미터 밴드 수와 레지듀얼 신호의 파라미터 밴드 수 세트로 표현될 수 있다. 또한 본 발명에서는 공간 정보 비트스트림의 샘플링 주파수, 레지듀얼 신호의 샘플링 주파수, 공간 프레임당 타임슬롯 수 및 레지듀얼 프레임과 공간 프레임의 비를 분석하고, 상기 분석한 결과를 이용하여 상기 레지듀얼 신호의 파라미터 밴드 수 정보를 표현하기 위한 최대 비트 수를 제한하고, 최소의 비트 수로 표현할 수 있다.
그 다음에 상기 레지듀얼 신호의 파라미터 밴드 수 정보를 포함하는 공간 정보 비트스트림을 생성(906)하고, 상기 코어 코덱 비트스트림 및 공간 정보 비트스트림으로 구성되는 전체 비트스트림을 전송(908)한다.
지금까지 본 발명에 대하여 몇몇 실시예들을 들어 구체적으로 설명하였으나, 상기 실시예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.
이상에서 기술된 것과 같이, 본 발명에 따른 멀티채널 오디오 신호를 코딩하는데 있어서, 비트스트림 내에 포함되는 레지듀얼 신호의 파라미터 밴드 수 정보를 효율적으로 표현하기 위해, 전체 채널의 파라미터 밴드 수에 의해 가변적으로 표현하거나, 그룹별로 표현함으로써, 인코딩, 전송 및 디코딩 효율을 향상시킬 수 있는 효과가 있다.
또한, 상기 레지듀얼 신호의 파라미터 밴드 수를 절대값 및 비교값으로 표현하거나 또는 전체 채널의 파라미터 밴드 수를 넘지 않도록 제한하여 표현함으로써, 인코딩, 전송 및 디코딩 효율을 향상시킬 수 있는 효과가 있다.

Claims (23)

  1. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간정보를 추출하는 단계; 및
    (b) 상기 다운믹스된 오디오 신호 및 상기 공간 정보를 이용하여 코어 코덱 비트스트림(core codec bitstream) 및 공간 정보 비트스트림(spatial information bitstream)을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하고, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 신호의 파라미터 밴드 수를 이용하여 가변적으로 표현되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  2. 제 1 항에 있어서,
    상기 (b) 단계는,
    전체 채널의 파라미터 밴드 수가 2^(n-1)이상 2^(n)미만인 경우, 상기 레지듀얼 신호의 파라미터 밴드 수를 n비트로 표현하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  3. 제 1 항에 있어서,
    상기 (b) 단계는,
    전체 채널의 파라미터 밴드 수가 2^(n-1)초과 2^(n)이하인 경우, 상기 레지듀얼 신호의 파라미터 밴드 수를 n비트로 표현하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  4. 제 1 항에 있어서,
    상기 (b) 단계는,
    상기 레지듀얼 신호가 복수(N)로 존재하는 경우, 전체 채널에 대한 파라미터 밴드 수(numBands) 및 i번째 레지듀얼 신호의 파라미터 밴드 수(bsResidualBandsi)에 대하여, 상기 레지듀얼 신호의 파라미터 밴드 수의 전체 조합은,
    Figure 112006002668024-PAT00006
    와 같이 표현되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  5. 제 1 항에 있어서,
    상기 (b) 단계는,
    상기 레지듀얼 신호의 파라미터 밴드 수(bsResidualBands)를 전체 채널에 대한 파라미터 밴드 수(numBands)를 변수로 하여 가장 가까운 정수로 올림하는 함수(ceil 함수)에 의해 결정되는 비트 수로 표현하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  6. 제 5 항에 있어서,
    상기 올림함수는, (ⅰ) 0<bsResidualBands≤numBands 또는, 0≤bsResidualBands<numBands의 경우에, ceil(log2(numBands))로 하거나, (ⅱ) 0≤bsResidualBands≤numBands의 경우에, ceil(log2(numBands+1))로 하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  7. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간정보를 추출하는 단계; 및
    (b) 상기 다운믹스된 오디오 신호 및 상기 공간 정보를 이용하여 코어 코덱 비트스트림(core codec bitstream) 및 공간 정보 비트스트림(spatial information bitstream)을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림 내에는 복수의 레지듀얼 신호가 존재하고, 상기 각 레지듀얼 신호는 고유의 파라미터 밴드 수를 가지며, 상기 복수의 레지듀얼 신호에 대응하는 복수의 파라미터 밴드 수를 하나 이상의 그룹으로 구분하되, 상기 그룹별로 각 레지듀얼 신호에 적용되는 파라미터 밴드 수를 나타내는 정보를 결정하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  8. 제 7 항에 있어서,
    상기 복수의 레지듀얼 신호에 대응하는 파라미터 밴드 수가 kN+L개인 경우, 상기 그룹은 N개씩 묶어서 하나의 그룹으로 만들고 M비트로 표현하며, 최후의 그룹은 L개를 묶어서 만들고 P비트로 표현하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  9. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계; 및
    (b) 상기 다운믹스된 오디오 신호 및 공간 정보를 이용하여 코어 코덱 비트스트림 및 공간 정보 비트스트림을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하고, 상기 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수를 표현하는 정보는, 하나 이상의 절대값 및 상기 절대값을 기준으로 하여 적응적(adaptive)으로 선택된 비교값으로 생성되는 것을 특징으로 하는, 멀티채널 오디오 신호를 인코딩하는 방법.
  10. 제 9 항에 있어서,
    상기 절대값은 하나가 존재하고, 상기 절대값으로 전체 채널의 파라미터 밴드 수를 사용하는 것을 특징으로 하는, 멀티채널 오디오 신호를 인코딩하는 방법.
  11. 제 9 항에 있어서,
    상기 절대값은 두 개 이상이 존재하고, 상기 절대값은 상기 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수 중에서 선택되는 것을 특징으로 하는, 멀티채널 오디오 신호를 인코딩하는 방법.
  12. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계; 및
    (b) 상기 다운믹스된 오디오 신호 및 공간 정보를 이용하여 코어 코덱 비트스트림 및 공간 정보 비트스트림을 생성하는 단계를 포함하되, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하고, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 채널의 파라미터 밴드 수를 넘지 않도록 제한되는 것을 특징으로 하는, 멀티채널 오디오 신호를 인코딩하는 방법.
  13. 제 12 항에 있어서,
    상기 (b) 단계는,
    상기 레지듀얼 신호의 파라미터 밴드 수가 상기 공간 정보 비트스트림의 샘플링 주파수, 레지듀얼 신호의 샘플링 주파수 및 공간 프레임당 레지듀얼 프레임 수의 조합으로 결정되는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호를 인코딩하는 방법.
  14. 멀티채널 오디오 신호를 디코딩하는 방법에 있어서,
    (a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; 및
    (b) 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 상기 전체 신호의 파라미터 밴드 수를 이용해 가변적으로 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 방법.
  15. 멀티채널 오디오 신호를 디코딩하는 방법에 있어서,
    (a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; 및
    (b) 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 그룹별로 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 방법.
  16. 멀티채널 오디오 신호를 디코딩하는 방법에 있어서,
    (a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; 및
    (b) 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 하나 이상의 절대값 및 비교값으로 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 방법.
  17. 멀티채널 오디오 신호를 디코딩하는 방법에 있어서,
    (a) 다운믹스된 오디오 신호에 대한 코어 코덱 비트스트림 및 공간 정보 비트스트림을 수신하는 단계; 및
    (b) 상기 코어 코덱 비트스트림을 디코딩하고, 상기 공간 정보 비트스트림으로부터 전체 신호의 파라미터 밴드 수 및 상기 전체 채널의 파라미터 밴드 수를 넘지 않도록 표현된 레지듀얼 신호의 파라미터 밴드 수를 확인하고, 상기 확인된 전체 신호의 파라미터 밴드 수 및 상기 레지듀얼 신호의 파라미터 밴드 수를 이용하여 각각 상기 공간 정보 비트스트림 및 상기 레지듀얼 신호를 디코딩하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 방법.
  18. 제 17 항에 있어서,
    상기 레지듀얼 신호의 파라미터 밴드 수 정보는 상기 공간 정보 비트스트림의 샘플링 주파수, 레지듀얼 신호의 샘플링 주파수 및 공간 프레임당 레지듀얼 프레임 수의 조합으로 결정되는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 방법.
  19. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고,
    상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하며, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 신호의 파라미터 밴드 수를 이용하여 가변적 표현되도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  20. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고,
    상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하며, 상기 각 레지듀얼 신호는 고유의 파라미터 밴드 수를 가지며, 상기 복수의 레지듀얼 신호에 대응하는 복수의 파라미터 밴드 수를 하나 이상의 그룹으로 구분하되, 상기 그룹별 로 각 레지듀얼 신호에 적용되는 파라미터 밴드 수를 나타내는 정보를 결정하도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  21. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고,
    상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하며, 상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하고, 상기 복수의 레지듀얼 신호에 대한 복수의 파라미터 밴드 수를 표현하는 정보는, 하나 이상의 절대값 및 상기 절대값을 기준으로 하여 적응적(adaptive)으로 선택된 비교값으로 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  22. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하도록 생성되고,
    상기 공간 정보 비트스트림은 복수의 레지듀얼 신호를 포함하며, 상기 공간 정보 비트스트림은 레지듀얼 신호를 포함하고, 상기 레지듀얼 신호의 파라미터 밴드 수는 전체 채널의 파라미터 밴드 수를 넘지 않도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  23. 제 22 항에 있어서,
    상기 레지듀얼 신호의 파라미터 밴드 수 정보는 상기 공간 정보 비트스트림의 샘플링 주파수, 레지듀얼 신호의 샘플링 주파수 및 공간 프레임당 레지듀얼 프레임 수의 조합으로 결정되는 것을 특징으로 하는, 오디오 신호의 생성방법.
KR1020060004051A 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법 KR20070025903A (ko)

Priority Applications (62)

Application Number Priority Date Filing Date Title
KR1020087006785A KR100891685B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
KR1020087006787A KR100880645B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
CN200680031505.8A CN101253807B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
RU2008112226/09A RU2376656C1 (ru) 2005-08-30 2006-08-30 Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
TW099128646A TWI425843B (zh) 2005-08-30 2006-08-30 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構
KR1020087021422A KR101165641B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
EP06843794A EP1938663A4 (en) 2005-08-30 2006-08-30 DEVICE FOR ENCODING AND DECODING AUDIO SIGNAL AND CORRESPONDING METHOD
KR1020087006921A KR100880647B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
JP2008528944A JP5108768B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
EP06843793.8A EP1938662B1 (en) 2005-08-30 2006-08-30 Method, apparatus, computer-readable medium for decoding an audio signal
PCT/KR2006/003424 WO2007055463A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
AU2006285538A AU2006285538B2 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
EP06843795A EP1920636B1 (en) 2005-08-30 2006-08-30 Apparatus and method for decoding an audio signal
BRPI0615114-0A BRPI0615114A2 (pt) 2005-08-30 2006-08-30 aparelho e método para codificar e decodificar sinal de áudio
PCT/KR2006/003426 WO2007027051A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
US11/514,284 US7831435B2 (en) 2005-08-30 2006-08-30 Slot position coding of OTT syntax of spatial audio coding application
RU2009131769/08A RU2473062C2 (ru) 2005-08-30 2006-08-30 Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
JP2008528939A JP5111374B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US11/514,302 US7765104B2 (en) 2005-08-30 2006-08-30 Slot position coding of residual signals of spatial audio coding application
PCT/KR2006/003425 WO2007055464A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
CN200680031572XA CN101253809B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
AT06843792T ATE455348T1 (de) 2005-08-30 2006-08-30 Vorrichtung und verfahren zur dekodierung eines audiosignals
PCT/KR2006/003422 WO2007055461A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
JP2008528940A JP2009506372A (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CN2006800314619A CN101253551B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
JP2008528943A JP5111376B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
MX2008002713A MX2008002713A (es) 2005-08-30 2006-08-30 Aparato y metodo para codificar y decodificar senales de audio.
PCT/KR2006/003420 WO2007027050A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
KR1020087006788A KR100880646B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
EP06783762.5A EP1938311B1 (en) 2005-08-30 2006-08-30 Apparatus for decoding audio signals and method thereof
JP2008528942A JP5111375B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
EP20060843796 EP1949759A4 (en) 2005-08-30 2006-08-30 DEVICE FOR CODING AND DECODING AN AUDIO SIGNAL AND METHOD THEREFOR
PCT/KR2006/003423 WO2007055462A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
JP2008528945A JP5231225B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
AT06843795T ATE453908T1 (de) 2005-08-30 2006-08-30 Vorrichtung und verfahren zur dekodierung eines audiosignals
EP06843792A EP1920635B1 (en) 2005-08-30 2006-08-30 Apparatus and method for decoding an audio signal
PCT/KR2006/003421 WO2007055460A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
DE602006011757T DE602006011757D1 (de) 2005-08-30 2006-08-30 Vorrichtung und verfahren zur dekodierung eines audiosignals
CN200680031480.1A CN101253806B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
CN200680031519XA CN101253808B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
US11/513,896 US7761303B2 (en) 2005-08-30 2006-08-30 Slot position coding of TTT syntax of spatial audio coding application
US11/514,301 US7783494B2 (en) 2005-08-30 2006-08-30 Time slot position coding
TW095132070A TWI405475B (zh) 2005-08-30 2006-08-30 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構
KR1020087006790A KR100891687B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
US11/513,834 US7822616B2 (en) 2005-08-30 2006-08-30 Time slot position coding of multiple frame types
CN2006800316192A CN101253810B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
DE602006011479T DE602006011479D1 (de) 2005-08-30 2006-08-30 Vorrichtung und verfahren zur dekodierung eines audiosignals
US11/514,359 US7792668B2 (en) 2005-08-30 2006-08-30 Slot position coding for non-guided spatial audio coding
CN2006800309057A CN101248484B (zh) 2005-08-30 2006-08-30 用于编码和解码音频信号的装置及其方法
KR1020087006789A KR100891686B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
KR1020087006786A KR100880644B1 (ko) 2005-08-30 2006-08-30 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
US11/513,842 US7783493B2 (en) 2005-08-30 2006-08-30 Slot position coding of syntax of spatial audio application
EP06783763.3A EP1941497B1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
CA2620627A CA2620627C (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof
JP2008528941A JP5108767B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
HK09101883.9A HK1124681A1 (en) 2005-08-30 2009-02-27 Apparatus for encoding and decoding audio signal and method thereof
US12/839,381 US8165889B2 (en) 2005-08-30 2010-07-19 Slot position coding of TTT syntax of spatial audio coding application
US12/843,761 US8060374B2 (en) 2005-08-30 2010-07-26 Slot position coding of residual signals of spatial audio coding application
US12/860,750 US8103513B2 (en) 2005-08-30 2010-08-20 Slot position coding of syntax of spatial audio application
US12/900,149 US8103514B2 (en) 2005-08-30 2010-10-07 Slot position coding of OTT syntax of spatial audio coding application
US12/905,051 US8082158B2 (en) 2005-08-30 2010-10-14 Time slot position coding of multiple frame types
JP2013003356A JP5319846B2 (ja) 2005-08-30 2013-01-11 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US71211905P 2005-08-30 2005-08-30
US60/712,119 2005-08-30
US71920205P 2005-09-22 2005-09-22
US60/719,202 2005-09-22
US72300705P 2005-10-04 2005-10-04
US60/723,007 2005-10-04
US72622805P 2005-10-14 2005-10-14
US60/726,228 2005-10-14
US72922505P 2005-10-24 2005-10-24
US60/729,225 2005-10-24

Publications (1)

Publication Number Publication Date
KR20070025903A true KR20070025903A (ko) 2007-03-08

Family

ID=38100098

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020060004057A KR20070025904A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 lfe채널의 파라미터밴드 수 비트스트림 구성방법
KR1020060004051A KR20070025903A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020060004057A KR20070025904A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 lfe채널의 파라미터밴드 수 비트스트림 구성방법

Country Status (1)

Country Link
KR (2) KR20070025904A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009054665A1 (en) * 2007-10-22 2009-04-30 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113948096A (zh) * 2020-07-17 2022-01-18 华为技术有限公司 多声道音频信号编解码方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009054665A1 (en) * 2007-10-22 2009-04-30 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof

Also Published As

Publication number Publication date
KR20070025904A (ko) 2007-03-08

Similar Documents

Publication Publication Date Title
EP2111616B1 (en) Method and apparatus for encoding an audio signal
RU2406166C2 (ru) Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
KR101303441B1 (ko) 다운믹스를 이용한 오디오 코딩
ES2923661T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
KR20070025905A (ko) 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
KR20070003593A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20060109299A (ko) 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보들의부호-복호화 방법
KR20070003545A (ko) 멀티채널 오디오 코딩에서 클리핑 복원방법
CN106471575B (zh) 多信道音频信号处理方法及装置
KR20070025903A (ko) 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
KR20070031212A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070025906A (ko) 멀티채널 오디오 코딩에서 효과적인 레지듀얼 코딩 정보비트스트림 구성방법
KR20070025907A (ko) 멀티채널 오디오 코딩에서 효과적인 채널변환모듈에 적용될파라미터 밴드 수 비트스트림 구성방법
KR20070037974A (ko) 멀티채널 오디오 코딩에서 효과적인 넌가이디드 코딩의파라미터 밴드 수 비트스트림 구성방법
KR20070031213A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070076363A (ko) 오디오 신호의 인코딩 및 디코딩 방법
KR20070031214A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070014937A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070108312A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치