KR20070031213A - 오디오 신호의 인코딩/디코딩 방법 및 장치 - Google Patents

오디오 신호의 인코딩/디코딩 방법 및 장치 Download PDF

Info

Publication number
KR20070031213A
KR20070031213A KR1020060004052A KR20060004052A KR20070031213A KR 20070031213 A KR20070031213 A KR 20070031213A KR 1020060004052 A KR1020060004052 A KR 1020060004052A KR 20060004052 A KR20060004052 A KR 20060004052A KR 20070031213 A KR20070031213 A KR 20070031213A
Authority
KR
South Korea
Prior art keywords
channel
channels
information
input
remapping
Prior art date
Application number
KR1020060004052A
Other languages
English (en)
Inventor
오현오
방희석
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020060004052A priority Critical patent/KR20070031213A/ko
Publication of KR20070031213A publication Critical patent/KR20070031213A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G9/00Cultivation in receptacles, forcing-frames or greenhouses; Edging for beds, lawn or the like
    • A01G9/14Greenhouses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G9/00Cultivation in receptacles, forcing-frames or greenhouses; Edging for beds, lawn or the like
    • A01G9/24Devices or systems for heating, ventilating, regulating temperature, illuminating, or watering, in greenhouses, forcing-frames, or the like
    • A01G9/241Arrangement of opening or closing systems for windows and ventilation panels
    • EFIXED CONSTRUCTIONS
    • E04BUILDING
    • E04HBUILDINGS OR LIKE STRUCTURES FOR PARTICULAR PURPOSES; SWIMMING OR SPLASH BATHS OR POOLS; MASTS; FENCING; TENTS OR CANOPIES, IN GENERAL
    • E04H9/00Buildings, groups of buildings or shelters adapted to withstand or provide protection against abnormal external influences, e.g. war-like action, earthquake or extreme climate
    • E04H9/16Buildings, groups of buildings or shelters adapted to withstand or provide protection against abnormal external influences, e.g. war-like action, earthquake or extreme climate against adverse conditions, e.g. extreme climate, pests
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Environmental Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Architecture (AREA)
  • Business, Economics & Management (AREA)
  • Ecology (AREA)
  • Pest Control & Pesticides (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Atmospheric Sciences (AREA)
  • Emergency Management (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 효율적인 오디오 신호의 처리를 위한 오디오 신호의 인코딩/디코딩 방법 및 장치에 관한 것이다.
본 발명은 복수 개의 채널에 대한 채널 리매핑 정보를 추출하는 단계와, 여기서, 상기 채널 리매핑 정보는 채널의 개수에 따라 비트 수가 결정되고, 상기 추출된 채널 리매핑 정보에 따라 채널을 재배치(Reordering)하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법을 제공한다.
따라서, 본 발명에 의하면, 멀티채널 오디오 코딩에서 신호를 모노 또는 스테레오와 같이 특정 개수로 압축하고 공간 정보로 표현되는 부가 정보를 함께 전송 또는 저장함으로써 데이터 량을 효과적으로 줄이는 것이 가능하고, 공간 정보가 포함되는 비트 스트림을 효과적으로 구성하여 오디오 신호를 효과적으로 처리하는 것이 가능하다.
채널변환, 멀티채널, 공간 파라미터, 채널 리매핑

Description

오디오 신호의 인코딩/디코딩 방법 및 장치{Method and Apparatus for encoding/decoding audio signal}
도 1은 본 발명에 따른 오디오 신호 처리 장치의 개념적인 설명을 위한 실시예를 도시한 것
도 2는 본 발명에 따라 채널변환모듈을 이용하여 다운 믹스(Down-mix)된 신호를 업 믹스(Up-mix)하는 경우의 실시예를 설명하기 위한 도면
도 3은 본 발명에 따른 입력채널을 멀티채널로 업 믹스하여 출력채널을 생성하는 실시예를 설명하기 위한 도면
도 4는 본 발명에 따른 공간 파라미터 컨피규레이션 신택스(Syntax)의 실시예를 설명하기 위한 도면
도 5는 본 발명에 따른 채널구성 정보 신택스의 실시예를 설명하기 위한 도면
도 6은 본 발명에 따른 입력채널 개수에 따른 채널변환박스 개수를 나타내는 비트 수의 실시예를 설명하기 위한 도면
도 7은 본 발명에 따른 입력채널 개수에 따른 채널 리매핑 정보를 나타내는 비트 수의 실시예를 설명하기 위한 도면
도 8은 본 발명에 따른 채널 리매핑 정보를 이용하여 채널 리매핑하는 방법 의 실시예를 설명하기 위한 도면
도 9는 본 발명에 따른 채널구성 정보 신택스의 다른 실시예를 설명하기 위한 도면
도 10은 본 발명에 따른 오디오 신호의 디코딩 방법을 설명하기 위한 흐름도
*도면의 주요부분에 대한 부호의 설명
10 : 인코딩 장치 20 : 디코딩 장치
100 : 공간 인코더 101 : 다운 믹스 모듈
102 : 공간 파라미터 추출 모듈 120 : 오디오 인코더
130 : 오디오 디코더 140 : 공간 디코더
141 : 합성 모듈 200 : TTT 모듈
210, 220, 230, 240, 250 : OTT 모듈
300 : 채널 리매핑 모듈
본 발명은 오디오 신호의 인코딩/디코딩 방법 및 장치에 관한 것으로, 보다 상세하게는 멀티채널 오디오 코딩 기법에 있어서 신호의 다운 믹스 및 부가 정보를 이용하는 방법의 효과적인 비트 스트림 구성 방법에 관한 것이다.
디지털 비디오, 디지털 오디오에 대한 표준은 각각의 신호에 대한 압축 및 복원에 대한 규격이며 디지털 시스템에 대한 표준은 압축된 비디오와 오디오 각각 을 일정한 크기의 패킷으로 분할한 후 타이밍 정보, 스트림 관련 정보 등을 추가하여 다중화하여 전송하고, 그 반대로 역 다중화 과정을 통해 타이밍 정보, 스트림 관련 정보 등을 얻어내고, 또한 압축된 비디오와 오디오를 각각 분리해 내는데 필요한 규격이다.
최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 심리음향 모델(Psychoacoustic model)을 이용하여 멀티채널 오디오 신호의 코딩 방법들이 개발되고 있으며, 이에 대한 표준화 작업이 진행되고 있다.
상기 심리음향 모델은 인간이 소리를 인식하는 방식, 예를 들면 큰 소리 다음에 오는 적은 소리는 들리지 않으며, 20Hz 내지 20000Hz의 주파수에 해당되는 소리만 들을 수 있다는 사실을 이용하여, 코딩 과정에서 불필요한 부분에 대한 신호를 제거함으로써 필요한 데이터의 양을 효과적으로 줄일 수 있는 것이다.
현재 MPEG-1 오디오, MPEG-4 AAC(Advanced Audio Coding) 및 MPEG-4 HE-AAC(High-Efficiency AAC)와 같은 오디오 표준 기술이 개발되어 상용화되고 있다.
또한, "MPEG 서라운드(Surround)"라 불리는 멀티채널 오디오 신호의 코딩 방법이 개발되고 있는데, 상기 MPEG 서라운드 방식은 압축된 스테레오(또는 모노) 오디오 신호 및 낮은 비트-레이트(bit-rate)의 공간 정보 채널을 이용하여 멀티채널 오디오 신호의 전송 효율을 매우 효과적으로 향상시키는 것이다.
그러나, 상기 MPEG 서라운드 방식에서 멀티채널 오디오 신호의 공간 정보를 코딩하는데 불필요한 부분에 비트 수가 사용되고 있어 신호의 인코딩, 전송 및 디 코딩에 있어서 효율이 좋지 못하다는 문제점이 있었다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 멀티채널 오디오 신호를 코딩하는데 있어서, 공간 정보를 효과적인 방식으로 표현하여, 상기 공간 정보를 위해 사용되는 데이터 량을 줄임으로써, 멀티채널 오디오 신호의 압축 및 전송효율을 향상시킬 수 있는 인코딩 및 디코딩 방법을 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위하여, 본 발명은 복수 개의 채널에 대한 채널 리매핑 정보를 추출하는 단계와, 여기서, 상기 채널 리매핑 정보는 채널의 개수에 따라 비트 수가 결정되고, 상기 추출된 채널 리매핑 정보에 따라 채널을 재배치(Reordering)하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법을 제공한다.
또한, 본 발명은 (a) 수신된 비트 스트림에서 복수 개의 입력채널 중 제n 입력채널의 채널 리매핑 정보를 추출하고, 상기 채널 리매핑 정보를 이용하여 제1 입력채널로 매핑시키는 단계와, (b) 수신된 비트 스트림에서 복수 개의 입력채널 중 제n+1 입력채널의 채널 리매핑 정보를 추출하고, 상기 채널 리매핑 정보를 이용하여 제2 입력채널로 매핑시키는 단계와, 여기서, 상기 채널 리매핑 정보는 입력채널 개수에 대응하는 비트 수가 할당되고, (c) 상기 (a)단계와 (b)단계를 반복적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법을 제공한다.
또한, 본 발명은 복수 개의 채널에 대한 채널 리매핑 정보를 추출하는 제1 추출부와, 여기서, 상기 채널 리매핑 정보는 채널의 개수에 따라 비트 수가 결정되고, 상기 추출된 채널 리매핑 정보에 따라 채널을 재배치(Reordering)하는 채널 리매핑 모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치를 제공한다.
또한, 본 발명은 멀티채널의 다운 믹스를 수행하여, 특정 개수의 출력채널을 생성하는 단계와, 상기 특정 개수의 출력채널에 대응하여, 디코딩 장치의 입력채널에 대한 채널 리매핑 정보를 생성하는 단계를 포함하되, 여기서, 상기 채널 리매핑 정보는 출력채널의 개수에 따라 비트 수가 결정되는 것을 특징으로 하는 오디오 신호의 인코딩 방법을 제공한다.
또한, 본 발명은 멀티채널의 다운 믹스를 수행하여, 특정 개수의 출력채널을 생성하는 다운 믹스 모듈과, 상기 특정 개수의 출력채널에 대응하여, 디코딩 장치의 입력채널에 대한 채널 리매핑 정보를 생성하는 제1 생성부를 포함하되, 여기서, 상기 채널 리매핑 정보는 디코딩 장치의 입력채널의 개수에 따라 비트 수가 결정되는 것을 특징으로 하는 오디오 신호의 인코딩 장치를 제공한다.
또한, 본 발명은 오디오 신호 있어서, 채널 리매핑 정보를 포함하되, 상기 채널 리매핑 정보는 디코딩 장치의 입력채널의 개수에 따라 가변적인 비트 수로 이루어지는 것을 특징으로 하는 오디오 신호를 제공한다.
따라서, 본 발명에 의하면, 멀티채널 오디오 코딩에서 오디오 신호를 모노 또는 스테레오와 같이 특정 개수로 압축하고, 상기 오디오 신호의 공간 정보를 함께 전송 또는 저장함으로써 데이터 량을 효과적으로 줄이는 것이 가능하고, 공간 정보가 포함되는 비트 스트림을 효과적으로 구성하여 오디오 신호를 효과적으로 처리하는 것이 가능하다.
이하 상기의 목적으로 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다.
아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재하였으므로, 단순한 용어의 명칭이 아닌 용어가 가지는 의미로서 본 발명을 파악하여야함을 밝혀두고자 한다.
관련하여, 본 발명에서 "공간 정보"란 인코딩 부에서 멀티채널을 다운 믹스(Down-mix)하고 송신한 신호를 디코딩 부에서 수신하여 업 믹스(Up-mix)를 수행하여 멀티채널을 생성하기 위해 필요한 정보를 의미한다. 상기 공간 정보로 공간 파라미터를 기준으로 설명하나, 본 발명이 이에 한정되지 않음은 자명한 사실임을 밝혀둔다.
또한, 상기 공간 파라미터는 두 채널간의 에너지 차이를 의미하는CLD(Channel Level Difference), 두 채널간의 상관관계(Correlation)를 의미하는 ICC(Inter Channel Coherences) 및 두 채널로부터 세 채널을 생성할 때 이용되는 예측 계수인 CPC(Channel Prediction Coefficients) 등이 있다.
관련하여, 본 발명에서 "채널구성 식별자"는 특정 신호의 채널구성을 나타내는 정보를 의미한다. 상기 채널구성 식별자에 의해서 미리 정해진 채널구성인지 미리 정해지지 않은 채널구성인지를 판단한다. 상기 미리 정해진 채널구성은 5-1-5 경우와 5-2-5 경우가 있다. 상기 채널구성 식별자로 "bsTreeConfig"를 예로 하여 설명하나, 본 발명은 이에 한정되지 않음은 자명한 사실이다.
관련하여, 본 발명에서 "채널변환모듈"은 특정 개수의 입력채널을 입력채널 개수와 다른 특정 출력 채널 개수로 변환하는 모듈을 의미하고, 상기 채널변환모듈 중 하나는 제1 채널변환모듈로 명명하고, 또 다른 채널변환모듈은 제2 채널변환모듈로 명명하여 사용한다.
예를 들어, 제1 채널변환모듈은 입력채널이 2개인 경우 출력 채널을 3개로 변환하는 TTT(Two to Three:TTT, 이하 'TTT'라 한다.) 모듈 또는 TTT 박스를 기준으로, 제2 채널변환모듈은 입력채널이 1개인 경우 출력 채널을 2개로 변환하는 OTT(One to Two:OTT, 이하 'OTT'라 한다.) 모듈 또는 OTT 박스를 기준으로 설명하기로 한다.
다만, 본 발명은 TTT 모듈과 OTT 모듈에 한정되지 않으며, 상기 제1 채널변환모듈과 제2 채널변환모듈은 입력채널과 출력 채널이 임의의 개수를 가지는 경우에 모두 적용 가능함은 자명한 사실임을 밝혀둔다.
관련하여, 본 발명에서 "채널구성 정보"는 상기 채널구성 식별자를 확인하여 채널구성이 미리 정해지지 않은 경우에 채널구성에 대한 정보를 포함하는 것을 의미하며, 특히, 채널구성 식별자가 기 결정되지 않은 경우에 채널구성에 대한 정보 를 나타낸다.
예를 들어, 공간 정보인 공간 파라미터 컨피규레이션(Spatial Parameter Configuration)에서 "TreeDescription()"가 상기 채널구성 정보를 포함하고 있는바, 본 발명은 상기 예에 한정되지 않음은 자명한 사실이다.
관련하여, 본 발명에서 "채널 리매핑 정보(Channel Re-mapping Information)"는 입력된 채널의 순서를 재배치(Reordering)하는 경우의 정보, 즉 멀티채널을 생성하기 위해서 입력된 채널을 리매핑하기 위한 정보를 의미한다. 상기 채널 리매핑 정보로 "bsChannelRemapping[ch]"를 기준으로 설명하나, 본 발명은 이에 한정되지 않음은 자명한 사실이다.
또한, 본 발명에서 "채널 리매핑 모듈(Channel Re-mapping Module)"이란 채널 리매핑 정보에 따라 입력 된 채널을 리매핑하는 모듈을 의미한다.
도 1은 본 발명에 따른 오디오 신호 처리 장치의 개념적인 설명을 위한 실시예를 도시한 것으로 특히, MPEG 서라운드(MPEG Surround)에서 오디오 신호의 인코딩 장치와 디코딩 장치를 설명하기 위한 도면이다.
인코딩 장치(10)는 다운 믹스 모듈(Downmix Module:101)과 공간 파라미터 추출 모듈(Spatial Parameter Estimation Module:102)을 포함하여 구성되는 공간 인코더(Spatial Encoder:100)와, 다운 믹스된 오디오 신호를 인코딩하는 오디오 인코더(Audio Encoder:120)를 포함하여 구성된다.
오디오 신호가 N개의 멀티채널(
Figure 112006002668170-PAT00001
,
Figure 112006002668170-PAT00002
,...,
Figure 112006002668170-PAT00003
)로 입력되면, 다운 믹스 모듈(101)은 미리 정해진 다운 믹스 정보 또는 외부 제어 명령에 따라 특정 개수의 채널로 입력된 오디오 신호의 다운 믹스를 수행하여 다운 믹스 채널을 생성하고, 상기 다운 믹스 채널로 다운 믹스된 오디오 신호를 출력하면, 상기 출력된 신호는 오디오 인코더(120)에 입력된다.
여기서, 상기 다운 믹스된 채널은 한 개의 채널 또는 두 개의 채널(
Figure 112006002668170-PAT00004
,
Figure 112006002668170-PAT00005
)을 가지거나, 또는 다운 믹스 명령에 따라 특정 개수의 채널을 가질 수 있다. 이때, 다운 믹스된 채널의 개수는 설정가능하다.
선택적으로, 다운 믹스된 오디오 신호는 외부에서 직접 제공되는 다운 믹스된 오디오 신호, 즉 아티스틱 다운 믹스 신호(Artistic Downmix Signal)를 이용할 수 있음을 밝혀둔다.
오디오 인코더(Audio Encoder:120)는 다운 믹스된 채널을 통해서 전송된 다운 믹스 오디오 신호를 수신하고, 상기 수신한 신호의 인코딩을 수행하여 압축된 오디오 신호(Compressed Audio Signal)를 송신한다.
공간 파라미터 추출 모듈(102)은 멀티채널로부터 공간 파라미터를 추출하여, 상기 추출된 공간 파라미터들을 디코딩 장치(20)로 송신한다.
디코딩 장치(20)의 오디오 디코더(130)는 압축된 오디오 신호(Compressed Audio Signal)를 수신하고, 상기 수신한 압축된 오디오 신호의 오디오 디코딩을 수행하여 다운 믹스된 오디오 신호를 스테레오 채널(
Figure 112006002668170-PAT00006
,
Figure 112006002668170-PAT00007
)을 통해 출력한 다.
이때, 오디오 신호의 디코딩 장치(20)가 멀티채널을 디코딩하지 못하는 경우에는 압축된 오디오 신호의 디코딩을 수행하여 모노 또는 스테레오 오디오 신호로 직접 출력할 수 있는데, 이는 오디오 신호의 디코딩 장치들 간에 호환성을 위해서 필요한 것이다.
공간 디코더(Spatial Decoder:140)의 합성 모듈(Synthesis Module:141)은 오디오 디코더(130)로부터 오디오 스테레오 신호를 수신하고, 인코딩 장치(10)의 공간 파라미터 추출 모듈(102)로부터 공간 파라미터들(Spatial Parameters)을 수신하여 서라운드 통합을 하여 멀티채널(
Figure 112006002668170-PAT00008
,
Figure 112006002668170-PAT00009
, ...,
Figure 112006002668170-PAT00010
)을 생성하고, 상기 생성된 멀티채널을 통해서 멀티채널 오디오 신호를 출력한다.
이와 같이, 멀티채널 오디오 신호를 직접 전송하는 대신에 스테레오 또는 모노 오디오 신호로 다운 믹스하여 전송하고, 상기 멀티채널 오디오 신호의 공간 파라미터를 함께 전송하는 방식은 압축 및 전송 효율의 관점에서 매우 우수한 방식이다.
관련하여, 공간 디코더(Spatial Decoder:140)에서 다운 믹스된 채널인 모노 또는 스테레오 채널을 멀티채널로 하는 경우 중 하나인 2채널에서 5.1채널로 변환하는 경우에 대해서 좀 더 상세히 살펴본다.
2채널에서 5.1채널로의 변환은 시간/주파수 영역(Time/Frequency Domain)에서 이루어지는데, 그 과정은 다음과 같다.
먼저, 2채널 분석 필터뱅크(Analysis Filterbank)는 디코딩되어 전송된 스테레오 오디오 신호를 2채널의 시간/주파수 영역 오디오 신호로 변환하고, 상기 시간/주파수 영역 오디오 신호는 공간 정보, 즉 공간 파라미터를 이용하여 6채널 시간/주파수 오디오 신호로 업 믹스(Up-mix) 되며, 상기 6채널 시간/주파수 오디오 신호는 6채널 합성 필터뱅크(Synthesis Filterbank)에 의해 5.1채널 오디오 신호로 변환된다.
현재, 기 결정된 컨피규레이션(Pre-defined configuration)으로 5-1-5 와 5-2-5 컨피규레이션 채널구성이 존재하고, 컨피규레이션들(Configurations)은 OTT 모듈들과 TTT 모듈들을 포함하는 트리 구조들(Tree Structures)로 표현될 수 있다.
본 발명은 오디오 시스템에서 기 결정된 경우가 아닌 임의적인 채널 컨피규레이션(Arbitrary Channel Configuration)을 위한 시그널링(Signalling)을 위한 것으로, 특히 MPEG 서라운드에서 오디오 신호의 임의적인 채널 컨피규레이션을 위한 것이다.
도 2는 본 발명에 따라 채널변환모듈을 이용하여 다운 믹스(Down-mix)된 신호를 업 믹스(Up-mix)하는 경우의 실시예를 설명하기 위한 도면으로, 특히 제1 채널변환모듈은 TTT 모듈을 기준으로 제2 채널변환모듈은 OTT 모듈을 기준으로 설명하며, 채널변환모듈을 이용하여 5개의 채널을 11개의 채널로 변환하는 경우를 나타낸 것이다.
도 2를 참조하면, TTT 모듈 1개와 OTT 모듈 5개로 구성된 임의적인 디코더 트리(Arbitrary Decoder Tree)를 나타낸 것이다.
2개의 채널로 입력신호
Figure 112006002668170-PAT00011
Figure 112006002668170-PAT00012
를 수신하는 TTT 모듈(200)은 상기 2개의 채널을 3개의 채널로 변환하고, 상기 3개의 채널로 3개의 신호를 출력하고, 상기 TTT 모듈(200)로부터 출력된 3개의 신호 중 첫 번째 신호는 OTT 모듈(220)에 입력되어 두 개의 채널로 출력신호
Figure 112006002668170-PAT00013
Figure 112006002668170-PAT00014
를 출력하고, 두 번째 신호는 OTT 모듈(230)에 입력되어 두 개의 채널로 출력신호
Figure 112006002668170-PAT00015
Figure 112006002668170-PAT00016
를 출력하고, 세 번째 신호는 OTT 모듈(240)에 입력되어 두 개의 채널로 출력신호
Figure 112006002668170-PAT00017
Figure 112006002668170-PAT00018
를 출력한다.
그리고, 입력신호
Figure 112006002668170-PAT00019
Figure 112006002668170-PAT00020
는 OTT 모듈이 존재하지 않는 경우를 나타내는 비트 시퀀스(Bit-sequence)가 '0'인 경우로 OTT 모듈과 연결되지 않고 바로 출력신호
Figure 112006002668170-PAT00021
Figure 112006002668170-PAT00022
로 출력한다.
그리고, 입력신호
Figure 112006002668170-PAT00023
는 비트 시퀀스(Bit-sequence)가 '10100'인 경우로 첫 번째 OTT 모듈(210)에 의해서 2개의 채널로 변환되어, 상기 2채널 중 하나의 채널을 통해 출력된 신호는 더 이상 변환되지 않아 출력신호
Figure 112006002668170-PAT00024
이 출력되고, 상기 2채널 중 다른 하나의 채널을 통해 출력된 신호는 다시 OTT 모듈(250)에 의해 2개의 채널로 변환되고, 상기 변환된 2개의 채널을 통해서 출력신호
Figure 112006002668170-PAT00025
Figure 112006002668170-PAT00026
를 출력한다.
도 3은 본 발명에 따른 입력채널을 멀티채널로 업 믹스하여 출력채널을 생성하는 실시예를 설명하기 위한 도면으로, 특히 3개의 입력채널에서 12개의 출력 채널로 업 믹스(Up-mix)하는 경우를 나타낸 것이다.
도 3을 참조하면, 이 완전한 트리(Complete Tree)는 4번의 연속적인 단계들에 의해서 묘사되는데, 입력채널은 채널 리매핑 정보인 "bsChannelRemapping[ch]"를 이용하여 채널 리매핑 모듈(Channel Re-mapping Module:300)에서 재배치(Re-ordered)된다.
예를 들어, TTT 모듈의 개수 정보에 의해 정해지는 하나 또는 복수 개의 TTT 모듈이 존재하면, 채널 리매핑된 후의 첫 번째 채널과 두 번째 채널은 첫 번째 TTT 모듈의 두 입력이 되고, 채널 리매핑된 후의 세 번째 채널과 네 번째 채널은 두 번째 TTT 모듈의 두 입력이 된다.
도 3의 채널 리매핑된 후의 첫 번째 채널과 두 번째 채널은 TTT 모듈(310)의 입력채널이 되고, 상기 TTT 모듈(310)은 두 개의 채널을 세 개의 채널로 변환하여 서브트리(Subtree)인 서브트리 "A", 서브트리 "B", 서브트리 "C" 가 생성된다.
첫 번째 서브트리인 서브트리 "A"는 3개의 OTT 모듈(320, 360, 370)을 포함하여(comprise) 출력채널 4개를 생성하고, 두 번째 서브트리인 서브트리 "B"는 OTT 모듈(330)을 포함하여 출력채널 2개를 생성하고, 세 번째 서브트리인 서브트리 "C"는 OTT 모듈(340)을 포함하여 출력채널 2개를 생성한다.
또한, 채널 리매핑된 후에 TTT 모듈(310)에 관련되지 않은 네 번째 서브트리 인 서브트리 "D"는 3개의 OTT 모듈(350, 380, 390)을 포함하여 출력채널 4개를 생성한다.
따라서, 입력채널 3개에 대해서 출력채널 12개가 되고, 각 출력채널은 출력채널 위치 정보에 의해서 각 출력채널과 외부 스피커로 매칭되게 된다.
도 4는 본 발명에 따른 공간 파라미터 컨피규레이션 신택스(Syntax)의 실시예를 설명하기 위한 도면이다.
도 4를 참조하면, 채널구성 식별자는 채널구성을 나타내고, 트리 컨피규레이션(Tree Configuration)을 정의한다. 또한, 채널구성 식별자인 "bsTreeConfig"는 4비트로 채널구성에 대한 정보를 포함한다.
예를 들어, "bsTreeConfig"가 '0'이면 5151 컨피규레이션을 의미하고, "bsTreeConfig"가 '1'이면 5152 컨피규레이션을 의미하고, "bsTreeConfig"가 '2'이면 525 컨피규레이션을 의미하고, "bsTreeConfig"가 '15'이면 전체 트리 디스크립션(Tree Description)이 시그널링(Signalling) 되는 것을 의미한다.
상기 채널구성 식별자를 추출하여, "bsTreeConfig"가 '15'이면, 채널구성 정보를 포함하는 "TreeDescription()"에서 트리 디스크립션 정보를 추출하는데, 이하, 도 5를 참조하여 "TreeDescription()"를 상세히 살펴보도록 한다.
도 5는 본 발명에 따른 채널구성 정보 신택스의 실시예를 설명하기 위한 도면으로, 이때, 채널구성 정보는 트리 디스크립션(Tree Description) 정보를 의미한다.
도 5를 참조하면, "TreeDescription()"는 채널구성인 트리(Tree)를 묘사 (Describing)하기 위한 통상적인 요소이며, "bsNumInChan"는 입력채널 개수의 정보를 의미하고, 입력채널의 개수인 "numInChan"는 "bsNumInChan+1"과 같으며, 상기 입력채널의 개수 정보를 나타내는 비트 수는 4비트이다.
또한, 본 발명에서 "bsNumTttBoxes"는 TTT 박스의 개수를 나타내며, 그 범위는 0에서부터 입력채널 개수의 절반 사이에서 존재하는데, 즉 0 <= bsNumTttBoxes <= numInChan/2 의 범위 사이에서 존재하는 것이다.
특히, 본 발명에서 "bsNumTttBoxes"는 TTT 박스들의 개수에 따라서 비트 필드를 가변적으로 하는데, "numInChan"이 2^(n-1)~(2^n)-1의 범위일 때, "bsNumTttBoxes"의 길이를 나타내는 비트 수는 n-1 비트로 가변적인바, 예를 들어 "numInChan"이 1~16이면, "bsNumTttBoxes"의 길이는 0~4 비트 중 어느 한 비트로 나타내는바, 상세한 설명은 도 6을 참조하여 설명하고, 여기서 상기 n은 임의의 정수를 의미한다.
또한, 본 발명에서 "bsChannelRemapping[ch]"는 정의된 입력채널 수에 따라 각 입력채널에 대한 채널 리매핑 정보를 나타내는 필드이며, 채널 리매핑 모듈은 상기 채널 리매핑 정보에 따라 채널 리매핑을 수행한다.
그리고, 임의적인 입력채널들에 대해서 TTT 박스들의 개수가 정해지면, 상기 TTT 박스들의 위치도 정해지는 것이다.
관련하여, 입력채널 및 출력채널의 관계를 기술하는 비트 스트림 구조에서, 각 입력채널에 대한 리매핑 정보는 입력채널 개수와 같은 개수의 정보를 갖는 경우와, 입력채널 개수보다 하나 적은 개수의 정보를 가지는 경우가 있다.
그리고, 모든 채널들을 위한 채널 리매핑 정보의 범위(Range)는 0에서부터 입력채널의 개수 사이에서 존재하는데, 즉 0 <= bsChannelRemapping[ch] < numInChan의 범위 사이에서 존재하는 것이다.
특히, 상기 "bsChannelRemapping[ch]"는 입력채널 개수에 따라 각 입력채널에 대한 채널 리매핑 정보를 포함하는 비트 수를 가변적으로 하는데, "numInChan"이 2^(n-1)~(2^n)-1의 범위일 때, "bsChannelRemapping[ch]"의 길이를 나타내는 비트 수는 n비트로 가변적이다.
예를 들어, "numInChan"이 1~16이면, "bsChannelRemapping[ch]"를 나타내는 비트 수는 0~4 비트 중 어느 한 비트로 나타내는데, 상세한 설명은 도 7을 참조하여 설명하고, 여기서 상기 n은 임의의 정수를 의미한다.
관련하여, 채널변환모듈 구성정보는 트리구조에서 채널변환모듈의 구성정보를 나타낸다. 상기 채널변환모듈 구성정보는 채널변환모듈의 출력신호가 트리구조에서 최종 출력신호인지, 아니면 상기 트리구조에서 다른 채널변환모듈에 입력되는 중간신호인지를 나타낸다.
제2 채널변환모듈의 구성정보를 나타내는 "bsOttBoxPresent"를 기준으로 설명하면 다음과 같다. 상기 "bsOttBoxPresent"의 값이 '0'이면 출력신호가 트리구조의 최종 출력신호이고, 상기 "bsOttBoxPresent"의 값이 '1'이면 출력신호가 다른 제2 채널변환모듈에 입력된다.
관련하여, 채널변환박스 디폴트 정보는 채널변환박스의 디폴트를 나타낸다. 공간 정보의 디폴트를 나타내는 "bsOttDefaultCld"를 기준으로 설명하면 다음과 같 다. 상기 "bsOttDefaultCld"는 idxCLD[][][]를 위한 디폴트 값(Default Value)의 정보를 포함하고 있는데, 상기 "bsOttDefaultCld"의 값이 '0'이면 디폴트 idxCLD[][][] = 0을 의미하고, "bsOttDefaultCld"의 값이 '1'이면 디폴트 idxCLD[][][] = 15를 의미한다.
관련하여, 채널변환박스 모드 정보는 채널변환박스가 어떤 모드로 동작하는지를 나타낸다. 제2 채널변환박스의 모드 정보를 나타내는 "bsOttModeLfe"를 기준으로 설명하면 다음과 같다.
상기 "bsOttModeLfe"는 OTT 박스가 일반적인(normal) 모드 또는 LFE 모드 중 어떤 모드로 동작하는지의 정보를 포함하고 있으므로, "bsOttModeLfe"의 값이 '0'이면 일반적인 모드에서의 OTT 박스를 의미하고, "bsOttModeLfe"의 값이 '1'이면 LFE 모드에서의 OTT 박스를 의미한다.
관련하여, 출력채널 위치정보는 트리구조에서 출력채널의 위치정보를 나타낸다. 예를 들어, 상기 출력채널 위치정보를 "bsOutputChannelPos"를 기준으로 설명하면, 상기 "bsOutputChannelPos"는 트리구조에서의 각 출력채널과 외부 스피커인 라우드스피커(Loudspeaker)들의 위치를 나타내는 정보를 의미한다.
이하, 도 6과 도 7을 참조하여 본 발명에 따라 입력채널의 개수에 따라 TTT 박스들의 개수와 채널 리매핑 정보를 각각 나타내는 "bsNumTttBoxes"와 "bsChannelRemapping"의 비트 수를 살펴보도록 한다.
도 6은 본 발명에 따른 입력채널 개수에 따른 채널변환박스 개수를 나타내는 비트 수의 실시예를 설명하기 위한 도면으로, 특히 입력채널 및 출력채널의 관계를 기술하는 비트 스트림 구조에서, 입력채널 개수에 따라 채널변환박스 중 제1 채널변환박스를 의미하는 TTT 박스의 개수를 표현하는 비트 필드를 가변적으로 하는 경우를 예를 들어 설명한 것이다.
이때, TTT 박스들의 수는 입력채널 개수의 절반을 넘을 수 없으며, 도 6과 같이 각각의 입력채널 개수에 따라 TTT 박스들의 개수를 나타내기 위한 비트 수(Number of bits of bsNumTttBoxes)가 가변적인바, 이하에서 상세히 설명하도록 한다.
도 6을 참조하면, "numInChan"이 '1'의 값이면 "bsNumTttBoxes"의 비트를 0비트(사용하지 않음)로 하고, "numInChan"이 '2~3' 범위의 값이면 "bsNumTttBoxes"의 비트를 1비트로 하고, "numInChan"이 '4~7' 범위의 값이면 "bsNumTttBoxes"의 비트를 2비트로 하고, "numInChan"이 '8~15' 범위의 값이면 "bsNumTttBoxes"의 비트를 3비트로 하고, "numInChan"이 '16'의 값이면 "bsNumTttBoxes"의 비트를 4비트로 한다.
도 7은 본 발명에 따른 입력채널 개수에 따른 채널 리매핑 정보를 나타내는 비트 수의 실시예를 설명하기 위한 도면으로, 특히 입력채널 및 출력채널의 관계를 기술하는 비트 스트림 구조에서 입력채널 개수에 따라 각 입력채널에 대한 리매핑 정보를 포함하는 비트 수를 가변적으로 하는 경우를 예를 들어 설명한 것이다.
이때, 채널 리매핑 정보에 포함되는 정보는 임의적인 채널 인덱스인 경우를 의미한다. 상기 채널 리매핑 정보의 개수는 입력채널의 개수를 넘을 수 없는 바, 이하에서 상세히 설명한다.
도 7을 참조하면, "numInChan"이 '1'의 값이면 "bsChannelRemapping[ch]"의 비트를 0비트(사용하지 않음)로 하고, "numInChan"이 '2'의 값이면 "bsChannelRemapping[ch]"의 비트를 1비트로 하고, "numInChan"이 '3~4' 범위의 값이면 "bsChannelRemapping[ch]"의 비트를 2비트로 하고, "numInChan"이 '5~8' 범위의 값이면 "bsChannelRemapping[ch]"의 비트를 3비트로 하고, "numInChan"이 '9~16' 범위의 값이면 "bsChannelRemapping[ch]"의 비트를 4비트로 한다.
상기와 같은 스킴(Scheme)을 사용함으로써, "numInChan"가 더 적은 값을 가질 때, "bsNumTttBoxes"와 "bsChannelRemapping[ch]"의 비트 수를 감소하여, 더 효율적인 오디오 코딩을 수행하는 것이 가능하다.
관련하여, 입력채널 개수인 "numInChan"의 값과 임의의 입력을 나타내는 특정 i번째 입력채널에 대한 리매핑 정보를 나타내는 "bsChannelRemapping[i]"에 대해, i=0, 1, ..., numInChan-1 에서 0 <= bsChannelRemapping < numInChan 인 관계를 이용하여, 전체 "bsChannelRemapping[i]"의 조합을 표현하는 것이 가능한데, 이하 수식과 같이 표현하는 것이 가능하다.
Figure 112006002668170-PAT00027
도 8은 본 발명에 따른 채널 리매핑 정보를 이용하여 채널을 리매핑하는 방법의 실시예를 설명하기 위한 도면으로, 특히, 입력채널 개수보다 하나 적은 채널 리매핑 정보를 이용하여 채널 리매핑을 수행하는 경우를 나타낸 것이다.
채널 리매핑 정보인 "bsChannelRemapping"는 입력채널과 일대일(One-to-One) 매핑되어 재배치(Reordering)되는데, 이때 "bsChannelRemapping"의 마지막 요소인 매핑되지 않은 채널은 이전 요소들의 매핑 정보들인 "bsChannelRemapping[0..numInChan-2]"를 이용하여 매핑할 수 있으므로, 마지막 요소의 채널 매핑 정보인 "bsChannelRemapping[numInChan-1]"는 생략 가능하다.
본 발명은 특정 입력채널 개수인 "numInChan"의 값과 i번째 입력채널에 대한 리매핑 정보를 나타내는 "bsChannelRemapping[i]"에 대해, 0 <= bsChannelRemapping[i] < numInChan 인 정수이고, i = 0, 1, ..., numInChan-1 인 관계를 이용한다.
즉, 인코딩 장치에서는 입력채널 개수보다 하나 적은 채널 리패핑 정보를 비트 스트림에 포함하여 전송하면, 디코딩 장치에서 상기 비트 스트림을 수신하여 채널 리매핑을 수행하게 된다. 상기 비트 스트림은 numInChan-1 개의 입력채널에 대한 "bsChannelRemapping[i]" 만을 포함한다.
상기 비트 스트림으로부터 numInChan-1개의 "bsChannelRemapping[i]"를 추출하고, 0 <= bsChannelRemapping[i] < numInChan 인 관계를 이용하여 numInChan번째 "bsChannelRemapping[numInChan-1]"의 값을 계산하는데, 이를 수식으로 나타내면 다음과 같다.
Figure 112006002668170-PAT00028
bsChannelRemapping[numInChan-1]=
도 8과 상기 수식을 참조하여 예를 들면, 채널 리매핑 정보는 채널이 재배치되는 정보를 포함하므로, 상기 채널 리매핑 정보를 이용하여 채널 재배치를 수행하면, "bsChannelRemapping[0]"는 Input channel #1로, "bsChannelRemapping[1]"는 Input channel #n-1로,..., "bsChannelRemapping[n-2]"는 Input channel #n-2로 재배치되며, 마지막 요소인 "bsChannelRemapping[n-1]"는 결국 Input channel #0로 재배치된다.
즉, 리매핑 채널의 채널번호의 합계에서 입력채널과 매핑이된 리매핑 채널의 채널번호 합계의 차이를 구하면, 마지막 리매핑 채널과 매핑되는 입력채널이 결정되게 되는 것이다.
관련하여, numInChan-1개의 "bsChannelRemapping[i]"의 조합을 표현하는 것이 가능한바, 이하 수식과 같이 표현하는 것이 가능하다.
Figure 112006002668170-PAT00029
도 9는 본 발명에 따른 채널구성 정보 신택스의 다른 실시예를 설명하기 위한 도면으로, 이때, 채널구성 정보는 트리 디스크립션(Tree Description) 정보를 의미한다.
특히, 상기 도 5에서 설명한 신택스와 다른 점은 채널 리매핑 정보가 입력채널 개수보다 하나 적은 정보를 포함하고 있어서, 마지막 채널 리매핑 정보는 비트 스트림에 포함하고 있지 않고, 디코더에서 계산해야한다. 상기 마지막 채널 리매핑 정보는 "bsCannelRemapping[numInChan-1]"를 기준으로 한다.
도 9를 참조하면, "bsNumTttBoxes"의 비트 수는 입력채널 개수인 "numInChan"에 의해 결정되는데, 이를 수식으로 나타내면 다음과 같다.
No. of bits of bsNumTttBoxes = ceil(log((numInChan+1)/2))
또한, "bsChannelRemapping[ch]"의 비트 수는 입력채널 개수인 "numInChan"에 의해 결정되는데, 이는 다음과 같은 수식으로 나타낸다.
No. of bits of bsChannelRemapping = ceil(log2(numInChan))
따라서, 본 발명은 "bsNumTttBoxes"와 "bsChannelRemapping[ch]"를 더 효과적으로 코딩하는 것이 가능하다.
관련하여, 입력채널 개수가 N인 경우 본 발명에 따른 비트 수가 얼마나 감소하는지 살펴본다. 상기 입력채널 개수 N을 위해 요구되는 비트 수를 비트 수가 고정된 경우와 가변적인 경우로 나누어 확인한다.
상기 비트 수가 고정된 경우에는 "bsNumTttBoxes"와 "bsChannelRemapping[ch]" 각각 4, 4N 비트가 필요하나, 상기 비트 수가 가변적인 경우에는 "bsNumTttBoxes"와 "bsChannelRemapping[ch]" 각각 ceil(log2((N+1)/2), ceil(log2(N))*(N-1) 비트가 필요하여, 본 발명에 따른 비트 절약은 각각 4-ceil(log2((N+1)/2), 4N-ceil(log2(N))*(N-1)이다.
예를 들어, 5채널이 2채널로 다운 믹스 되어 전송된 후, 다시 5채널로 업 믹 스하는 경우인 5-2-5의 경우, 비트 수가 고정된 경우에는 "bsNumTttBoxes"와 "bsChannelRemapping[ch]" 모두에 사용되는 비트는 12 비트이나, 본 발명에 따라 비트 수가 가변적인 경우에는 "bsNumTttBoxes"와 "bsChannelRemapping[ch]" 모두에 사용되는 비트는 2 비트이다. 따라서, 10비트의 비트 절약(Bit saving)이 가능함을 알 수 있다.
도 10은 본 발명에 따른 오디오 신호의 디코딩 방법을 설명하기 위한 흐름도이며, 특히 수신된 오디오 신호의 비트 스트림 내의 정보를 이용하여 멀티채널을 생성하는 방법에 관한 것이다.
디코딩 장치는 공간 파리미터 비트 스트림을 수신하여, 채널구성 식별자를 확인한다(S10).
상기 확인(S10) 후, 채널구성이 기 결정된 경우인지를 확인한다(S20).
상기 확인(S20) 결과, 채널구성이 기 결정된 경우이면, 디코딩 장치는 채널변환모듈의 정보와, 멀티채널을 생성하기 위한 정보를 테이블 형태 등으로 알고 있으므로, 이를 이용하여 멀티채널을 생성한다(S30).
상기 확인(S20) 결과, 채널구성이 기 결정된 경우가 아니면, 입력채널 개수에 대응하는 비트 수가 할당된 제1 채널변환모듈의 개수 정보를 추출한다(S40).
상기 제1 채널변환모듈의 개수 정보 추출 후, 채널 리매핑 정보 추출부에서는 채널 리매핑 정보를 추출하고, 채널 리매핑 모듈에서는 입력채널의 채널 리매핑을 수행한다(S50). 여기서, 채널 리매핑 정보를 포함하는 비트 필드는 입력채널의 개수에 대응하는 비트 수가 할당된다. 예를 들어, 상기 채널 리매핑 정보는 입력채 널과 같은 개수의 정보를 포함하거나, 입력채널보다 하나 적은 개수의 정보를 포함할 수 있다.
상기 채널 리매핑 수행 후, 제2 채널변환모듈 구성 정보를 추출한다(S60). 여기서, 상기 제2 채널변환모듈 구성 정보란 제 2 채널변환모듈들의 위치 정보 등을 포함하는 정보를 의미한다.
상기 단계(S50)에서 채널 리매핑된 채널에 대해 채널변환모듈의 정보를 이용하여 멀티채널을 생성한다(S70). 다시 말해서, 상기 단계(S40, S60)에서 추출된 정보에 따라 채널변환모듈인 제1 채널변환모듈과 제2 채널변환모듈의 위치가 결정되고, 이에 따라 리매핑된 채널들의 멀티채널을 생성하는 것이다.
본 발명을 상술한 실시예에 한정되지 않으며, 첨부된 청구범위에서 알 수 있는 바와 같이 본 발명이 속한 분야의 통상의 지식을 가진 자에 의해 변형이 가능하고 이러한 변형은 본 발명의 범위에 속한다.
상기에서 설명한 본 발명에 따른 오디오 신호의 인코딩/디코딩 방법 및 장치 효과를 설명하면 다음과 같다.
첫째, 멀티채널 오디오 코딩에서 신호를 모노 또는 스테레오와 같이 특정 개수로 압축하고 공간 정보를 함께 전송 또는 저장함으로써 데이터 량을 효과적으로 줄이는 것이 가능하다.
둘째, 공간 정보가 포함되는 비트 스트림을 효과적으로 구성하여 오디오 신호를 효과적으로 처리하는 것이 가능하다.

Claims (19)

  1. 복수 개의 채널에 대한 채널 리매핑 정보를 추출하는 단계와,
    여기서, 상기 채널 리매핑 정보는 채널의 개수에 따라 비트 수가 결정되고,
    상기 추출된 채널 리매핑 정보에 따라 채널을 재배치(Reordering)하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  2. 제 1 항에 있어서,
    재배치된 채널을 채널변환모듈을 이용하여 멀티채널을 생성하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  3. 제 2 항에 있어서,
    채널구성 식별자를 확인하여, 채널구성이 기 결정되지 않은 경우이면, 채널변환모듈의 정보를 추출하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  4. 제 1 항에 있어서,
    상기 채널 리매핑 정보의 개수는 입력채널 개수와 동일한 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  5. 제 1 항에 있어서,
    상기 채널 리매핑 정보를 나타내는 채널 리매핑 필드는 0 ~ 4 비트 중 어느 하나로 나타내는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  6. 제 1 항에 있어서,
    임의의 수 n에 대하여 입력채널의 개수가 2^(n-1)에서 (2^n)-1의 범위일 때, 채널 리매핑 정보를 나타내는 채널 리매핑 필드의 비트 수는 n비트(bits)인 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  7. 제 6 항에 있어서,
    입력채널 개수가 9~16 범위이면 채널 리매핑 필드는 4비트로 하고, 입력채널 개수가 5~8 범위이면 채널 리매핑 필드는 3비트로 하고, 입력채널 개수가 3~4 범위이면 채널 리매핑 필드는 2비트로 하고, 입력채널 개수가 2이면 채널 리매핑 필드는 1비트로 하고, 입력채널 개수가 1이면 채널 리매핑 필드는 0비트로 하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  8. 제 1 항에 있어서,
    특정된 입력채널 개수인 numInChan의 값과 특정 i번째 입력채널에 대한 리매핑 정보를 나타내는 bsChannelRemapping[i] 에 대해, i = 0, 1, ..., numInChan-1 에서 0 <= bsChannelRemapping[i] < numInChan 인 관계를 이용하여, 전체 bsChannelRemapping[i]의 조합을 표현하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  9. 제 8 항에 있어서,
    상기 전체 bsChannelRemapping[i]의 조합은
    Figure 112006002668170-PAT00030
    Figure 112006002668170-PAT00031
    * bsChannelRemapping[i]로 표현되는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  10. (a) 수신된 비트 스트림에서 복수 개의 입력채널 중 제n 입력채널의 채널 리매핑 정보를 추출하고, 상기 채널 리매핑 정보를 이용하여 제1 입력채널로 매핑시키는 단계와,
    (b) 수신된 비트 스트림에서 복수 개의 입력채널 중 제n+1 입력채널의 채널 리매핑 정보를 추출하고, 상기 채널 리매핑 정보를 이용하여 제2 입력채널로 매핑시키는 단계와,
    여기서, 상기 채널 리매핑 정보는 입력채널 개수에 대응하는 비트 수가 할당되고,
    (c) 상기 (a)단계와 (b)단계를 반복적으로 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  11. 제 10 항에 있어서,
    상기 제n 입력채널과 제n+1 입력채널은 채널 리매핑 모듈로 입력하는 채널이고, 상기 제1 입력채널, 제2 입력채널은 채널 리매핑 모듈에서 출력되어 채널변환모듈로 입력하는 채널인 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  12. 복수 개의 채널에 대한 채널 리매핑 정보를 추출하는 제1 추출부와,
    여기서, 상기 채널 리매핑 정보는 채널의 개수에 따라 비트 수가 결정되고,
    상기 추출된 채널 리매핑 정보에 따라 채널을 재배치(Reordering)하는 채널 리매핑 모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  13. 제 12 항에 있어서,
    재배치된 채널의 멀티채널을 생성하는 채널변환모듈을 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  14. 제 12 항에 있어서,
    채널구성 식별자를 확인하여, 채널구성이 기 결정되지 않은 경우이면, 채널변환모듈의 정보를 추출하는 제2 추출부를 더 포함하여 구성되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  15. 멀티채널의 다운 믹스를 수행하여, 특정 개수의 출력채널을 생성하는 단계 와,
    상기 특정 개수의 출력채널에 대응하여, 디코딩 장치의 입력채널에 대한 채널 리매핑 정보를 생성하는 단계를 포함하되, 여기서, 상기 채널 리매핑 정보는 출력채널의 개수에 따라 비트 수가 결정되는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  16. 제 15 항에 있어서,
    상기 채널 리매핑 정보는 디코딩 장치 입력채널의 재배치(Reordering)를 위해 필요한 정보인 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  17. 제 15 항에 있어서,
    상기 특정 개수의 출력채널에 대응하여, 디코딩 장치의 입력채널에 대한 제1채널변환모듈의 개수 정보를 생성하는 단계를 더 포함하되, 여기서, 상기 제1 채널변환모듈은 디코딩 장치의 입력채널 개수에 대응하는 비트 수가 할당되는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  18. 멀티채널의 다운 믹스를 수행하여, 특정 개수의 출력채널을 생성하는 다운믹스 모듈과,
    상기 특정 개수의 출력채널에 대응하여, 디코딩 장치의 입력채널에 대한 채널 리매핑 정보를 생성하는 제1 생성부를 포함하되, 여기서, 상기 채널 리매핑 정 보는 디코딩 장치의 입력채널의 개수에 따라 비트 수가 결정되는 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  19. 오디오 신호 있어서,
    채널 리매핑 정보를 포함하되, 상기 채널 리매핑 정보는 디코딩 장치의 입력채널의 개수에 따라 가변적인 비트 수로 이루어지는 것을 특징으로 하는 오디오 신호.
KR1020060004052A 2005-09-14 2006-01-13 오디오 신호의 인코딩/디코딩 방법 및 장치 KR20070031213A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060004052A KR20070031213A (ko) 2005-09-14 2006-01-13 오디오 신호의 인코딩/디코딩 방법 및 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US60/716,526 2005-09-14
KR1020060004052A KR20070031213A (ko) 2005-09-14 2006-01-13 오디오 신호의 인코딩/디코딩 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20070031213A true KR20070031213A (ko) 2007-03-19

Family

ID=43655599

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060004052A KR20070031213A (ko) 2005-09-14 2006-01-13 오디오 신호의 인코딩/디코딩 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20070031213A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150021080A (ko) * 2012-05-29 2015-02-27 노키아 코포레이션 스테레오 오디오 신호 인코더

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150021080A (ko) * 2012-05-29 2015-02-27 노키아 코포레이션 스테레오 오디오 신호 인코더
KR101647576B1 (ko) * 2012-05-29 2016-08-10 노키아 테크놀로지스 오와이 스테레오 오디오 신호 인코더
US9799339B2 (en) 2012-05-29 2017-10-24 Nokia Technologies Oy Stereo audio signal encoder

Similar Documents

Publication Publication Date Title
RU2406166C2 (ru) Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
US9966080B2 (en) Audio object encoding and decoding
CA2645915C (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
US7702407B2 (en) Method for generating encoded audio signal and method for processing audio signal
EP2088580A2 (en) Audio encoding and decoding
JP4859925B2 (ja) オーディオ信号デコーディング方法及びその装置
JP4568363B2 (ja) オーディオ信号デコーディング方法及びその装置
KR20070025905A (ko) 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
TWI483619B (zh) 一種媒體訊號的編碼/解碼方法及其裝置
KR20060109297A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070031212A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070031213A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070031214A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070025903A (ko) 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
KR20080035448A (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
KR20070025906A (ko) 멀티채널 오디오 코딩에서 효과적인 레지듀얼 코딩 정보비트스트림 구성방법
KR20070025907A (ko) 멀티채널 오디오 코딩에서 효과적인 채널변환모듈에 적용될파라미터 밴드 수 비트스트림 구성방법
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070014937A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid