KR100904435B1 - 미디어 신호 처리 방법 및 장치 - Google Patents

미디어 신호 처리 방법 및 장치 Download PDF

Info

Publication number
KR100904435B1
KR100904435B1 KR20087005976A KR20087005976A KR100904435B1 KR 100904435 B1 KR100904435 B1 KR 100904435B1 KR 20087005976 A KR20087005976 A KR 20087005976A KR 20087005976 A KR20087005976 A KR 20087005976A KR 100904435 B1 KR100904435 B1 KR 100904435B1
Authority
KR
South Korea
Prior art keywords
channel
spatial information
signal
channels
value
Prior art date
Application number
KR20087005976A
Other languages
English (en)
Other versions
KR20080037078A (ko
Inventor
오현오
방희석
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20080037078A publication Critical patent/KR20080037078A/ko
Application granted granted Critical
Publication of KR100904435B1 publication Critical patent/KR100904435B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 미디어 신호 처리 방법 및 장치에 관한 것으로, 본 발명에 따른 미디어 신호 디코딩 방법은 생성될 멀티 채널 중 유효한 값을 갖는 채널을 감지하는 단계, 및 다운믹스 신호 및 공간 정보 신호로부터 감지된 유효한 값을 갖는 채널을 생성하는 단계를 포함하여 전송된 미디어 신호로부터 생성될 채널 중 가상의 값으로 설정된 채널이 무엇인지를 감지하고 가상의 값으로 설정된 채널 생성을 위한 디코딩을 생략하여 디코딩 연산량을 감소할 수 있다.

Description

미디어 신호 처리 방법 및 장치{APPARATUS FOR PROCESSING MEDIA SIGNAL AND METHOD THEREOF}
본 발명은 미디어 신호 처리에 관한 것으로서, 특히 미디어 신호 처리 방법 및 장치에 관한 것이다.
일반적으로 미디어 신호의 경우, 인코딩 장치는 멀티 채널 신호들 각각을 압축하는 대신 멀티 채널 신호를 모노 또는 스테레오 형태의 다운믹스 신호로 압축하고, 압축된 다운믹스 신호와 공간 정보(spatial information) 또는 부가 정보를 디코딩 장치로 전송하거나 저장 매체에 저장한다. 디코딩 장치는 압축된 다운믹스 신호와 공간 정보를 이용하여 원래의 멀티 채널을 복원한다. 인코딩 장치 및 디코딩 장치가 기본적으로 압축하고 복원할 수 있는 채널 수는 정해져 있다. N-M-N 채널 구성에서 앞의 N은 인코딩 장치가 전송하고자 하는 채널 수이고 M은 압축된 다운믹스 신호의 갯수이며 뒤의 N은 디코딩 장치가 복원하는 채널 수를 의미한다고 할 때 인코딩 장치 및 디코딩 장치는 5-1-5 채널 구성, 5-2-5 채널 구성, 7-2-7 채널 구성 또는 7-5-7 채널 구성 등을 기본적으로 제공한다. 인코딩 장치가 지원하는 채널 구성보다 적은 수의 채널의 경우, 인코딩 장치가 지원하는 채널 구조로 매핑된 후 인코딩된다. 즉, 인코딩 장치에 인코딩 장치가 지원하는 채널보다 적은 수의 채 널이 입력되는 경우 인코딩 장치가 압축할 수 있는 채널 수와 인코딩 장치에 입력되는 채널 수의 차이만큼의 채널은 가상의 값을 갖는다고 가정하여 인코딩을 수행한다. 이 경우에도 인코딩 장치는 디코딩 장치가 가상의 값을 갖는 채널을 복원하기 위해 필요한 공간 정보를 생성하여 디코딩 장치로 전송한다.
기술적 과제
본 발명이 이루고자 하는 기술적 과제는, 인코딩 장치가 기본적으로 압축할 수 있는 채널 수보다 적은 수의 채널을 전송하고자 할 경우, 채널을 복원하는 데 필요한 일부 공간 정보를 전송하지 않는 미디어 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 가상의 값으로 설정된 채널 생성을 위한 디코딩을 생략하는 미디어 신호 처리 방법 및 장치를 제공하는 데 있다.
기술적 해결방법
본 발명은 인코딩 장치가 기본적으로 압축할 수 있는 채널 수보다 적은 수의 채널을 전송하고자 할 경우, 기본적으로 압축할 수 있는 채널에서 전송하고자 하는 채널 수를 제외한 채널 값을 가상의 값으로 설정하고, 가상의 값을 갖는 채널을 복원하는 데 필요한 공간 정보를 전송하지 않는다.
본 발명은 디코딩 장치가 전송된 미디어 신호로부터 생성될 채널 중 가상의 값으로 설정된 채널이 무엇인지를 감지하고 가상의 값으로 설정된 채널 생성을 위한 디코딩을 생략한다.
유리한 효과
이상에서 기술된 것과 같이, 본 발명에 의하면, 인코딩 장치가 기본적으로 압축할 수 있는 채널 수보다 적은 수의 채널을 전송할 때, 유효한 값을 갖는 채널에 대한 공간 정보만을 생성하여 이를 전송함으로써 불필요한 비트 전송을 막을 수 있다.
또한, 본 발명에 의하면, 디코딩 장치가 전송된 미디어 신호로부터 생성될 채널 중 유효한 채널이 무엇인지를 감지하고 유효한 채널 생성을 위한 디코딩만을 수행하여 유효하지 않은 채널 생성을 위한 디코딩 연산량을 감소할 수 있다.
도 1은 본 발명의 실시 예에 따른 인코딩 장치가 디코딩 장치로 전송하는 미디어 신호의 구성도이다.
도 2는 본 발명의 실시예에 따른 인코딩 및 디코딩 장치를 포함하는 미디어 장치의 블록도이다.
도 3은 본 발명의 실시 예에 따른 다운믹싱부를 나타낸 블록도이다.
도 4는 채널 생성부를 나타낸 블록도이다.
도 5는 디코딩 장치가 유효한 채널을 판단하는 방법을 나타낸 도면이다.
발명의 실시를 위한 최선의 형태
상기 과제를 이루기 위해 본 발명의 일 측면에 의하면, 생성될 멀티 채널 중 유효한 값을 갖는 채널을 감지하는 단계 및 상기 다운믹스 신호 및 상기 공간 정보로부터 상기 감지된 유효한 값을 갖는 채널을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법을 제공할 수 있다.
본 발명의 다른 측면에 의하면, 수신된 비트스트림으로부터 제1 멀티 채널 오디오 신호를 다운믹스한 다운믹스 신호와 공간 정보를 획득하는 단계, 상기 공간 정보로부터 변형 공간 정보를 생성하는 단계 및 상기 변형 공간 정보를 이용하여 제2 멀티 채널을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법을 제공할 수 있다.
본 발명의 또 다른 측면에 의하면 N개 보다 적은 수의 채널을 입력받는 단계, 상기 N개와 상기 입력받는 채널 수의 차이만큼의 채널 값을 가상의 값으로 정하는 단계 및 상기 가상의 값을 갖는 채널을 포함하는 N개 채널을 다운믹싱하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법을 제공할 수 있다.
본 발명의 또 다른 측면에 의하면 다운믹스 신호 및 공간 정보를 독출하는 독출부 및 상기 공간 정보로부터 생성될 멀티 채널 중 유효한 값을 갖는 채널을 감지하고 상기 다운믹스 신호 및 상기 공간정보 신호를 이용하여 상기 감지된 유효한 값을 갖는 채널을 생성하는 채널 생성부를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 장치를 제공할 수 있다.
본 발명의 또 다른 측면에 의하면 N개 이상의 채널을 다운믹싱하는 인코딩 장치에 있어서, 상기 N개 보다 적은 수의 채널을 입력받아 상기 N개와 상기 입력받는 채널 수의 차이만큼의 채널 값을 가상의 값으로 정하는 채널 값 설정부, 상기 N개 채널 중 어떤 채널이 상기 입력받은 채널인지를 표시하는 유효 채널 표시 정보를 포함하는 공간 정보를 생성하는 공간 정보 추출부 및 상기 가상의 값을 갖는 채널을 포함하는 N개 채널을 다운믹스하는 다운믹싱부를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 장치를 제공할 수 있다.
발명의 실시를 위한 형태
이어서, 첨부한 도면들을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 본 발명은 미디어 신호 디코딩 방법 및 장치에 관한 것이다. 여기서, 미디어 신호는 오디오 신호 또는 비디오 신호를 포함한다.
도 1은 본 발명의 실시 예에 따른 인코딩 장치가 디코딩 장치로 전송하는 미디어 신호의 구성도이다. 도 1을 참조하면, 미디어 신호는 다운믹스 신호(101) 및 공간 정보 신호(103)를 포함한다. 본 명세서에서 상기 공간 정보 신호(103)는 공간 정보(spatial information)를 의미한다. 다운믹스 신호(101)는 멀티 채널 미디어 신호를 다운 믹싱하여 생성되는 신호로 인코딩 장치에 포함된 다운믹싱부(미도시)를 통해 생성되거나 또는 인위적으로 생성될 수 있다. 미디어 신호는 프레임들이 나열된 ES(Elementary Stream)형태로 존재한다. 다운믹스 신호(101)와 공간 정보 신호(103)는 별도의 ES 형태로 각각 디코딩 장치로 전송될 수 있으나, 도 1에 도시되어 있는 바와 같이 다운믹스 신호(101)와 공간 정보 신호(103)가 결합되어 하나의 ES 형태로 디코딩 장치로 전송될 수도 있다. 공간 정보 신호(103)는 멀티 채널 미디어 신호를 다운믹스할 때 추출되는 것으로 디코딩 장치에서 압축된 다운믹스 신호(101)로부터 원래의 멀티 채널 미디어 신호가 복원될 때 사용된다. 인코딩 장치는 인코딩 장치에 입력되는 모든 멀티 채널 미디어 신호를 다운믹스하여 공간 정보 신호(103)를 생성할 수 있다. 그러나 인코딩 장치에 인코딩 장치가 지원하는 채널 구성보다 적은 수의 채널이 입력되는 경우, 인코딩 장치가 지원하는 채널 수에서 입력되는 채널 수를 제외한 만큼의 채널은 가상의 값을 갖는다고 가정하고, 가상의 값을 갖는 채널에 대한 공간 정보 신호(103)는 생성하지 않거나 생성하더라도 신호 디코딩 장치로 전송하지 않을 수 있다. 또한, 인코딩 장치는 가상 값을 갖는 채널에 대한 공간 정보를 디폴트 값이나 극도의 값을 이용하여 간단히 표시할 수도 있다.
공간 정보 신호(103)에는 공간 파라미터, 유효 채널 표시 정보, 트리구조정보 등이 포함될 수 있다. 공간 파라미터는 멀티 채널 신호들 간의 관계를 표시하는 정보로, 미디어 신호들 사이의 에너지 차이를 나타내는 CLD(Channel Level Differences), 미디어 신호들 간의 긴밀성 내지는 유사성을 나타내는 ICC(Interchannel Correlations), 다른 신호들을 이용하여 미디어 신호 값을 예상하는 계수를 나타내는 CPC(Channel Prediction Coefficients)등을 포함한다. 공간 정보 신호(103)는 인코딩 장치에 입력되는 채널이 유효한 값을 갖는 채널인지 또는 인코딩 장치의 채널 구성보다 적은 수의 채널이 입력되어 인코딩 장치의 기본 구성을 지원하기 위해 생성된 가상의 값을 갖는 채널인지를 표시하는 정보가 포함되어 있다. 이하, 인코딩 장치에 입력되는 채널이 가상의 값이 아닌 유효한 값을 갖는 채널인지 여부를 표시하는 정보를 유효 채널 표시 정보라고 한다. 유효 채널 표시 정보는 공간 정보 신호(103)의 헤더(105) 또는 공간 프레임(107)에 포함될 수 있다. 공간 정보 신호(103)는 채널 신호를 정해진 트리구조에 따라 다운믹스하는 과정에서 추출한 정보로, 여기서 정해진 트리구조란, 디코딩 장치와 인코딩 장치 간 에 약속된 트리구조를 말한다. 공간 정보 신호(103)는 트리구조정보를 포함할 수 있는데, 트리구조정보는 트리구조의 유형에 관한 정보로, 트리구조의 유형에 따라 멀티 채널의 개수, 채널별 다운믹스 순서 등이 달라질 수 있다.
인코딩 장치는 인코딩된 다운믹스 신호(101)와 공간 정보 신호(103)를 다중화하여 비트스트림 형태의 미디어 신호를 생성하고 이를 디코딩 장치로 전송한다.
도 2는 본 발명의 실시예에 따른 인코딩 및 디코딩 장치를 포함하는 미디어 장치의 블록도이다. 도 2를 참조하면 미디어 장치는 다운믹싱부(202), 공간 정보 추출부(203), 다운믹스 신호 인코딩부(205), 공간 정보 인코딩부(207) 및 다중화부(209)를 포함하는 인코딩 장치와 역다중화부(211), 다운믹스 신호 디코딩부(213), 공간 정보 디코딩부(215) 및 채널 생성부(217)를 포함하는 디코딩 장치를 포함한다. 인코딩 장치의 다운믹싱부(202)는 멀티 채널 미디어 신호(201)를 다운믹스하여 하나 또는 두 개의 다운믹스 신호를 생성하고, 이를 다운믹스 신호 인코딩부(205)로 보낸다. 다운믹스 신호 인코딩부(205)는 다운믹스 신호를 인코딩하여 인코딩된 다운믹스 신호를 생성하고 인코딩된 다운믹스 신호를 다중화부(209)로 보낸다. 공간 정보 추출부(203)는 멀티 채널 미디어 신호(201)로부터 공간 파라미터를 추출하여 공간 정보 신호(103)를 생성한다. 도 2에는 도시하지 않았으나, 인코딩 장치는 다운믹싱부(202) 앞에 채널 값 설정부를 포함할 수 있다. 채널 값 설정부는 인코딩 장치에 입력되는 채널 수가 인코딩 장치가 지원하는 채널 수보다 적은 경우, 인코딩 장치가 지원하는 채널 수에서 입력되는 채널 수를 제외한 개수의 채널 값을 가상의 값으로 설정한다. 디코딩 장치는 가상의 값이 설정된 채널을 복원할 필요가 없기 때문에 인코딩 장치는 가상의 값이 설정된 채널에 대한 공간 정보를 생성할 필요가 없다. 또는 디코딩 장치는 가상의 값으로 설정된 채널에 대한 공간 정보를 디폴트 값이나 극도의 값 등으로 간단히 표시할 수도 있다. 공간 정보 추출부(203)는 유효한 값을 갖는 채널에 대한 공간 정보 신호(103)를 생성하여 이를 공간 정보 인코딩부(207)로 보낸다. 공간 정보 신호(103)는 전술한 바와 같이 지시자, 공간 파라미터, 채널 구성 식별자 및 변형 공간 정보 신호 타입 등을 포함할 수 있다. 공간 정보 인코딩부(207)는 공간 정보 신호(103)를 인코딩하여 인코딩된 공간 정보 신호(103)를 생성하고 이를 다중화부(209)로 보낸다.
다중화부(209)는 다운믹스 신호 인코딩부(205)로부터 받은 인코딩된 다운믹스 신호 및 공간 정보 인코딩부(207)로부터 받은 인코딩된 공간 정보 신호(103)를 다중화하여 비트스트림 형태의 미디어 신호(210)를 생성하고, 이를 디코딩 장치로 전송한다.
디코딩 장치는 인코딩 장치로부터 비트스트림 형태의 미디어 신호(210)를 전송받거나 기 저장되어 있는 미디어 신호(210)를 추출한다. 디코딩 장치에 포함되어 있는 역다중화부(211)는 비트스트림 형태의 미디어 신호(210)를 파싱하여 인코딩된 다운믹스 신호 및 인코딩된 공간 정보 신호로 분리하고, 인코딩된 다운믹스 신호를 다운믹스 신호 디코딩부(213)로 보내고, 인코딩된 공간 정보 신호를 공간 정보 디코딩부(215)로 보낸다. 다운믹스 신호 디코딩부(213)는 복호화된 다운믹스 신호를 생성하고 생성된 복호화된 다운믹스 신호를 채널 생성부(217)로 보낸다. 공간 정보 디코딩부(215)는 공간 정보 신호를 복호화하고 복호화된 공간 정보 신호를 채널 생성부(217)로 보낸다. 도 2에는 도시하지 않았으나, 디코딩부는 변형 공간 정보 신호 생성부를 포함할 수 있다. 변형 공간 정보 신호 생성부는 공간 정보 신호(103)를 변형하여 변형된 공간 정보를 생성한다. 변형된 공간 정보(modified spatial information)는 공간 정보를 변형하여 새롭게 생성된 공간 정보를 말한다. 변형 공간 정보는 공간 정보 중 일부를 포함하거나 또는 공간 정보를 조합하여 생성될 수 있다. 변형 공간 정보 신호 생성부는 트리구조정보 및 출력 채널 정보 등을 이용하여 변형 공간 정보를 생성할 수 있다. 출력 채널 정보는 디코딩 장치와 연계되어 있는 스피커에 관한 정보로서, 출력 채널의 수, 출력 채널 각각의 위치 정보 등을 포함할 수 있다. 출력 채널 정보는 제작자에 의해 디코딩 장치에 기 입력되어 있거나, 사용자에 의해 입력될 수 있다.
디코딩 장치는 트리구조정보를 이용하여 인코딩 장치에 의해 다운믹스된 원래의 멀티 채널 수를 파악하고, 출력 채널 정보를 이용하여 생성할 채널 수를 파악한다. 디코딩 장치는 다운믹스된 원래의 멀티 채널 수와 생성할 채널 수가 동일한지를 판단한다. 이하, 인코딩 장치에 의해 다운믹스된 원래의 멀티 채널을 제1 멀티 채널이라 하고, 디코딩 장치가 생성할 채널을 제2 멀티 채널이라 한다. 디코딩 장치는 인코딩 장치에 의해 다운믹스된 제1 멀티 채널과 생성할 제2 멀티 채널의 채널 수가 다르거나, 채널 수는 동일해도 유효한 값을 갖는 채널 수가 다른 경우, 변형 공간 정보 신호 생성부를 이용하여 공간 정보를 변형할 수 있다. 변형 공간 정보는 제2 멀티 채널의 유효한 값과 상관 관계를 이용하여 생성될 수 있다.
디코딩 장치는 전술한 공간 파라미터, CLD, ICC, CPC, IPD 등을 조합하여 변형된 공간 정보를 생성할 수 있다. 즉, 제1 멀티 채널보다 제2 멀티 채널의 채널 수가 적은 경우, 디코딩 장치는 전송된 공간 파라미터를 조합하여 제1 멀티 채널보다 적은 수의 채널을 생성할 수 있다. 예컨대, 인코딩 장치에서 5.1 채널로부터 다운믹스되어 생성된 다운믹스 신호는 디코딩 장치에서 2 채널 신호로 업믹스될 수 있다. 디코딩 장치는 전송된 공간 파라미터 중 일부의 공간 파라미터만을 이용하여 변형된 공간 파라미터를 생성할 수도 있다. 예컨대, 5.1 채널로부터 다운믹스되어 생성된 다운믹스 신호는 일부의 공간 파라미터만으로 업믹스되어 5.1 채널보다 적은 수의 채널로 생성될 수 있다. 이와 같은 방법으로 디코딩 장치는 변형 공간 정보 및 다운믹스 신호를 이용하여 제1 멀티 채널과 다른 수의 채널을 가지 제2 멀티 채널을 생성할 수 있다.
채널 생성부(217)는 복호화된 다운믹스 신호 및 복호화된 공간 정보 신호를 이용하여 멀티 채널 미디어 신호(219)를 복원한다. 디코딩 장치는 공간 정보 신호(103)를 이용하여 전송된 미디어 신호(210)로부터 생성될 멀티 채널 신호(219) 중 유효한 채널이 어떤 채널이고 가상의 값을 갖는 채널이 어떤 채널인지를 판단할 수 있다. 디코딩 장치가 공간 정보 신호(103)를 이용하여 유효한 채널을 판단하는 방법에 대해서는 도 3 내지 도 5를 참조로 상세히 설명하기로 한다. 디코딩 장치는 공간 정보 신호(103)를 이용하여 생성될 멀티 채널 신호(219) 중 유효한 채널을 감지하고, 유효한 값을 갖는 채널을 생성하기 위한 디코딩만을 수행할 수 있다. 즉, 유효하지 않은 값을 갖는 채널 생성을 위한 디코딩을 수행하지 않을 수 있다.
이하, 인코딩 장치 및 디코딩 장치가 지원하는 채널 수보다 적은 수의 채널을 효율적으로 압축하여 전송하고 복원하는 방법에 대해 도 3을 참조하여 인코딩 전처리 단계 및 인코딩 단계를 설명하고, 도 4 및 도 5를 참조하여 디코딩 단계를 차례대로 설명하기로 한다.
1. 인코딩 전처리 단계
인코딩 장치 및 디코딩 장치가 기본적으로 압축하고 복원할 수 있는 채널 수가 N개 일 때, 입력되는 멀티 채널 미디어 신호(201)는 N개보다 많거나 적은 수의 채널을 포함할 수 있다. 입력되는 미디어 신호(201)의 채널 수가 N개보다 많은 경우 인코딩 및 디코딩 장치는 효율적으로 채널 구성을 확장하여 입력되는 채널을 압축하고 복원한다. 미디어 신호(201)의 채널 수가 N개보다 적을 때, N개와 입력되는 미디어 신호(201)의 채널 수와의 차이 만큼에 해당하는 채널 값은 가상의 값으로 설정되어야 한다. 유효한 채널과 가상의 값을 갖는 채널을 포함하여 N채널 형태가 구성되어야 인코딩 및 디코딩이 수행될 수 있다. 이때, N개와 입력되는 미디어 신호(201)의 채널 수와의 차이 만큼에 해당하는 채널 값은 0으로 설정될 수도 있다.
이하, 인코딩 전처리 단계에 대해 도 3을 참조하여 설명하기로 한다. 도 3은 본 발명의 실시 예에 따른 인코딩 장치의 다운믹싱부(202)를 나타낸 블록도이다. 인코딩 장치의 다운믹싱부(202)는 제1 다운믹싱부 내지 제5 다운믹싱부를 포함한다. 본 도면에서는 인코딩 장치가 5.1 채널 구조를 갖는다. 5.1 채널은 중앙 앞(C:Center Front) 채널, 왼쪽 앞(LF:Left Front channel) 채널, 오른쪽 앞 (RF:Right Front channel) 채널, 왼쪽 배후(LS:Left Surround channel) 채널, 오른쪽 배후(RS:Right Surround channel) 채널 및 우퍼(LFE:Low Frequency Enhancement) 채널을 포함한다. 인코딩 장치가 5.1 채널 구조를 갖는 경우 5.1 보다 적은 채널의 미디어 신호는 인코딩하기 전 5.1 채널 구조로 매핑되어야 한다. 그런 후에 미디어 신호는 5-1-5, 5-2-5 같은 트리 구조를 이용하여 인코딩될 수 있다. 도 3에서 인코딩 장치에 인가되는 미디어 신호(201)는 LF 채널 및 RF 채널 두 개이므로, 인가되지 않은 나머지 채널, 즉, C 채널, LFE 채널, LS 채널 및 RS 채널은 가상의 값, 예컨대 0, 을 갖는다고 가정해야한다. 인코딩 장치는 가상의 값을 갖는 채널을 포함하여 총 6개의 채널에 대해 인코딩을 수행한다.
2. 인코딩 단계
다운믹싱부(202)는 입력되는 멀티 채널로부터 다운믹스 신호를 생성한다. 다운믹싱부(202)는 멀티 채널 미디어 신호를 다운믹스할 때 두 개의 채널을 하나의 채널로 또는 세 개의 채널을 두 개의 채널로 만들기 위해 OTT(One-To-Two) BOX 또는 TTT(Two-To-Three) BOX를 사용한다. OTT BOX 또는 TTT BOX는 디코딩 장치에서 다운믹스 신호와 공간 정보를 이용하여 원래의 멀티 채널을 복원할 때 사용되는 개념적인 BOX이다. 즉, 미디어 신호 인코딩 장치로부터 수신한 미디어 신호는 역다중화부(211)에서 인코딩된 다운믹스 신호(101)와 인코딩된 공간 정보 신호(103)로 파싱되어 각각 복호화된 후 채널 생성부(217)로 보내지는데, 채널 생성부(217)는 복호화된 다운믹스 신호(101)와 공간 정보 신호(103)를 이용하여 원래의 멀티 채널을 복원할 때 OTT BOX 또는 TTT BOX를 사용하여 하나의 입력 신호를 두 개의 신호로 또는 두 개의 입력 신호를 세 개의 신호로 출력한다. 미디어 신호 디코딩 장치의 채널 생성부(217)에서 OTT BOX 또는 TTT BOX가 사용되는 것에 대응하여 미디어 신호 인코딩 장치의 다운믹싱부(202)에도 OTT BOX 또는 TTT BOX가 사용되어 입력되는 멀티 채널을 하나 또는 두 개의 신호로 다운믹스한다. 이하 OTT BOX 또는 TTT BOX가 미디어 신호 인코딩 장치에서 사용될 때에는 제 몇 다운믹싱부라 부르고 미디어 신호 디코딩 장치에서 사용될 때에는 제 몇 업믹싱부라 부르기로 한다. 공간 정보 추출부(203)는 입력 채널들이 다운믹싱부(202)를 거칠 때 입력 채널들 사이의 관계를 나타내는 공간 파라미터를 추출한다. 도 3에서는 편의상 각각의 다운믹싱부에서 추출되는 공간 파라미터로 CLD만을 도시하였으나 추출되는 공간 파라미터가 이에 한정되는 것은 아니다.
이하, 인코딩 장치가 유효한 채널과 그렇지 않은 채널에 대한 공간 파라미터 값을 전송하는 방법을 살펴보기로 한다.
2.1 공간 정보 신호를 생성하는 방법
2.1.1 공간 파라미터 값을 최대값 또는 최소값으로 설정하는 방법
도 3에서 인코딩 장치는 인코딩 전처리 단계에 의해 가상의 값을 갖는 채널을 포함하여 총 6개의 채널을 입력받는다. 입력되는 채널들은 제3 다운믹싱부 내지 제5 다운믹싱부에 인가된다. 제3 다운믹싱부 내지 제5 다운믹싱부는 두 개의 입력 채널들을 하나의 신호로 다운믹싱한다. 제4 다운믹싱부와 제5 다운믹싱부에서 나온 신호들은 제2 다운믹싱부로 들어가고 제2 다운믹싱부와 제3 다운믹싱부에서 나온 신호는 제1 다운믹싱부로 들어간다. 제3 다운믹싱부와 제5 다운믹싱부에 입력되는 채널은 값이 0인 가상의 채널이므로, 제3 다운믹싱부와 제5 다운믹싱부는 가상의 채널들 간의 관계를 나타내는 공간 파라미터를 추출한 필요가 없다. 제4 다운믹싱부는 입력되는 두 채널 LF 및 RF로부터 두 채널의 관계를 나타내는 공간 파라미터 CLD4를 추출한다. 제2 다운믹싱부는 제4 다운믹싱부에서 나오는 신호와 제5 다운믹싱부에서 나오는 신호 간의 관계를 나타내는 공간 파라미터 CLD2를 추출하고, 제1 다운믹싱부는 제2 다운믹싱부에서 나오는 신호와 제3 다운믹싱부에서 나오는 신호 간의 관계를 나타내는 공간 파라미터 CLD1을 추출한다. 도 3에서 제1 다운믹싱부 및 제2 다운믹싱부에서 추출되는 공간 파라미터 CLD1 및 CLD2는 CLD 값의 범위 중 최대값 또는 최소값이 될 수 있다. 즉, 제2 다운믹싱부로에서 추출되는 공간 파라미터 CLD2는 제4 다운믹싱부에서 나오는 신호와 제5 다운믹싱부에서 나오는 신호 간의 에너지 차를 의미하는데, 제4 다운믹싱부에 의해 다운믹스된 신호는 유효한 값을 갖지만 제5 다운믹싱부에 의해 다운믹스된 신호는 값이 0이므로, 에너지(또는 레벨)는 제4 다운믹싱부로부터 나온 신호로만 편중된다. CLD 값이 최대 150부터 최소 -150까지의 값을 갖는다고 할 때, CLD2 값은 제4 다운믹싱부에 의해 다운믹스된 신호를 기준으로 최대값 150이 된다. 이와 마찬가지로 CLD1도 제2 다운믹싱부에 의해 다운믹스된 신호를 기준으로 150이 된다. 공간 정보 추출부(203)는 다운믹싱부(202)가 멀티 채널을 다운믹스하는 과정에서 공간 파라미터를 추출하고, 추출된 공간 파라미터를 이용하여 공간 정보 신호(103)를 생성한다. 인코딩 장치는 추출된 공간 파라미터 CLD1 내지 CLD5 값을 모두 공간 정보 신호(103)에 포함시켜 디코딩 장치로 전송할 수 있다. 이 경우, 디코딩 장치는 CLD1 및 CLD2가 150임을 이용하여 에너지가 두 신호 중 한쪽 신호로만 향하므로 생성될 멀티 채널 신호(219) 중 유효한 값을 갖는 채널이 무엇인지를 감지할 수 있다.
인코딩 장치는 각 다운믹싱부에서 추출되는 공간 파라미터 값이 이전 파라미터 값과 동일한지, 인터폴레이션된 값인지, 기 정해진 디폴트 값인지 또는 새로 읽어야할 값인지를 표시하는 정보를 공간 정보 신호(103)에 포함시켜 디코딩 장치로 전송한다. 이때, 인코딩 장치는 위에서 설명한 방법대로 공간 파라미터 값을 새로 읽어야 할 값으로 표시하는 정보를 공간 정보 신호(103)에 포함시키고, 공간 파라미터 값 모두를 디코딩 장치로 전송할 수 있다. 이 경우, 유효하지 않은 채널 생성을 위한 불필요한 공간 파라미터까지 보내는 것이 되어 비트 낭비가 될 수 있다. 따라서, 인코딩 장치는 공간 정보 신호(103)의 비트량을 최소화하기 위해 아래과 같은 방법을 사용할 수 있다.
2.1.2 공간 파라미터 값을 디폴트 값으로 설정하는 방법
인코딩 장치는 공간 파라미터 값이 기 정해진 디폴트 값임을 표시하는 정보를 전송함으로써 불필요한 공간 파라미터 전송을 생략할 수 있다. 이때, 인코딩 장치는 가상의 값을 갖는 채널을 다운믹스할 때 추출되는 공간 파라미터 값을 디폴트 값으로 표시하여 디코딩 장치로 전송함으로써, 불필요한 공간 파라미터 값 전송을 생략할 수 있다. 예컨대, 인코딩 및 디코딩 장치가 CLD 값이 최대값 150인 경우를 디폴트 값 1로, CLD 값이 0인 경우를 디폴트 값 0으로 정한 경우, 인코딩 장치는 도 3의 CLD1, CLD2의 값 150을 비트로 표시하여 전송하는 대신 CLD1 및 CLD2의 값이 디폴트 값이고 그 값이 1임을 표시하는 비트를 전송함으로써 공간 정보 신호 (103) 비트량을 감소할 수 있다.
2.1.3 유효 채널 표시 정보를 전송하는 방법
인코딩 장치는 유효한 채널에 대한 공간 파라미터만을 전송함으로써 공간 정보 신호 비트량을 감소할 수 있다. 도 3에서 인코딩 장치는 CLD3 또는 CLD5를 공간 정보 신호(103)에 포함시키지 않고 유효한 값을 갖는 채널 LF 및 RF로부터 생성되는 공간 파라미터 CLD4만을 공간 정보 신호(103)에 포함시켜 디코딩 장치로 전송할 수 있다. 이 경우, 디코딩 장치는 인코딩 장치로부터 전송된 공간 정보 신호(103)에 제3 업믹싱부(미도시) 및 제5 업믹싱부(미도시)에 인가되는 공간 파라미터가 없으므로 그 값이 무의미하다고 판단하고 제3 업믹싱부 및 제5 업믹싱부로부터 출력되는 채널 값이 0이라고 판단할 수 있다. 이와 같이, 인코딩 장치가 일부 공간 파라미터만을 공간 정보 신호(103)에 포함시켜 디코딩 장치로 전송하는 경우, 디코딩 장치가 어떤 채널이 유효한지를 판단할 수 있도록, 인코딩 장치는 유효 채널 표시 정보를 생성하고, 이를 공간 정보 신호(103)에 포함시켜 디코딩 장치로 전송할 수 있다. 유효 채널 표시 정보는 인코딩 장치에 입력되는 채널이 가상의 값이 아닌 유효한 값을 갖는 채널인지 여부를 표시하는 정보이다. 유효 채널 표시 정보를 생성하는 방법으로는 각 채널 순서대로 채널이 유효한 채널인지를 표시하는 방법과, 각 다운믹싱부 또는 각 다운믹싱부에 대응하여 각 업믹싱부가 유효한 채널을 생성하는지를 표시하는 방법이 고려될 수 있다. 또한, 인코딩 장치 및 디코딩 장치는 압축 및 복원할 수 있는 채널 수보다 적은 수의 채널이 인가될 경우를 대비하여 인코딩 장치 및 디코딩 장치 상호 간에 미리 인코딩 장치가 지원하는 채널 수보다 적은 수 의 입력 채널에 대한 채널 구성을 약속하고, 인코딩 장치가 인가되는 채널의 채널 구성을 디코딩 장치에 알려주는 방법도 고려할 수 있다.
도 3을 참조하여 각 채널 순서대로 유효한 채널인지를 표시하는 방법을 살펴본다. 5-1-51채널 구성에서 입력되는 채널은 위에서부터 순서대로 LF 채널, RF 채널, C 채널, LFE 채널, LS 채널 및 RS 채널이다. 이 중 LF 채널 및 RF 채널은 유효 채널이므로 1로, 나머지 채널은 값이 없는 가상의 채널이므로 0으로 표시하여, 위에서부터 채널 순서대로 110000 과 같이 6비트로 유효 채널 표시 정보를 생성할 수 있다. 각 다운믹싱부 또는 업믹싱부가 유효한지를 표시하는 방법을 살펴보면, 인코딩 장치는 제1 다운믹싱부부터 제5 다운믹싱부 순으로, 다운믹싱부가 사용되면 1로, 사용되지 않으면 0으로 표시 할 수 있다. 도 3에서는 전송하고자 하는 두 채널 LF, RF 채널을 다운믹스하기 위해 제4 다운믹싱부만을 사용하므로, 00010 과 같이 각 다운믹싱부 사용 여부를 5비트로 표시하여 유효 채널 표시 정보를 생성할 수 있다. 인코딩 장치는 유효 채널 표시 정보로 채널 구성 식별자를 전송할 수도 있다. 인코딩 장치 및 디코딩 장치 상호간에 미리 채널 조합에 따른 채널 구성을 약속하는 방법을 표 1을 참조하여 설명한다.
표 1
Figure 112008017691804-pct00001
5.1 채널 구조의 경우를 예로 들어 설명하면 5.1 채널 이하의 채널 조합은 표 1과 같은 채널 구성을 갖는다. 인코딩 장치 및 디코딩 장치는 표 1과 같이 채널 구성을 상호 약속한 후, 입력 채널 수에 따라 채널 구성 식별자를 생성하여 이를 디코딩 장치로 전송할 수 있다. 도 3을 참조하면, 인코딩 장치에 인가되는 입력 채널 수는 2개이므로 인코딩 장치는 채널 구성 식별자 1 (001)을 디코딩 장치로 전송하여 유효 채널이 LF 채널 및 RF 채널임을 디코딩 장치에 알려줄 수 있다. 인코딩 장치는 유효 채널 표시 정보를 공간 정보 신호(103)의 헤더(105) 또는 공간 프레임(107)에 포함시켜 디코딩 장치로 전송할 수 있다. 인코딩 장치는 상술한 바와 같이 효율적으로 공간 정보 신호(103)를 생성하여 이를 다운믹스 신호(101)와 함께 또는 별개로 디코딩 장치로 전송할 수 있다.
3. 디코딩 단계
3.1 유효 채널인지 여부를 판단하는 방법
디코딩 장치는 인코딩 장치로부터 전송받거나 또는 기 저장되어 있던 다운믹스 신호(101) 및 공간 정보 신호(103)를 이용하여 인코딩 장치에 입력된 원래의 멀티 채널 미디어 신호(219)를 복원한다. 디코딩 장치는 공간 정보 신호(103)로부터 공간 파라미터를 추출하고, 이를 각 업믹싱부에 적용하여 원래의 채널을 복원한다. 디코딩 장치는 공간 정보 신호(103)로부터 변형 공간 정보 신호의 타입을 표시하는 정보를 추출하고, 공간 정보 신호(103)로부터 식별된 타입의 변형 공간 정보 신호를 생성할 수 있다. 변형 공간 정보의 타입은 부분 공간 정보 신호 또는 확대 공간 정보 신호를 포함한다. 부분 공간 정보 신호는 공간 파라미터 중 일부만을 포함하는 것이고, 확대 공간 정보는 확장 공간 정보 신호 및 공간 정보 신호를 이용하여 생성된 것이다. 디코딩 장치는 공간 정보 신호(103)에 변형 공간 정보 신호의 타입을 식별하는 신호가 포함되어 있는 경우, 이를 이용하여 공간 정보 신호(103)를 변형하여 변형 공간 정보 신호를 생성하고, 변형 공간 정보 신호를 이용하여 다운믹스 신호를 디코딩한다. 디코딩 장치는 변형 공간 정보 신호의 타입이 부분 공간 정보 신호인 경우, 디코딩 장치가 지원하는 채널 수보다 적은 수의 채널이 복원됨을 감지한다. 즉, 유효하지 않은 값을 갖는 채널이 복원될 수 있음을 감지한다. 디코딩 장치는 인코딩 장치가 전송한 공간 정보 신호(103)를 이용하여 복원할 채널 중 어떤 채널이 유효한 값을 갖는 채널인지를 판단할 수 있다. 디코딩 장치는 공간 정보 신호(103)로부터 각 업믹싱부에 적용할 공간 파라미터 값을 추출하고 이를 이용하여 복원할 채널이 유효 채널인지 여부를 판단하거나, 공간 정보 신호(103)로부터 추출한 유효 채널 표시 정보 또는 채널 구성 식별자를 이용하여 복원할 채널이 유 효 채널인지 여부를 판단할 수 있다.
도 4를 참조하여 5-1-51채널 구성을 갖는 디코딩 장치가 유효 채널을 복원하는 방법을 살펴보고, 도 5를 참조하여 5-1-52채널 구성을 갖는 디코딩 장치가 유효 채널을 복원하는 방법을 살펴보기로 한다. 도 4는 도 3과 같은 다운믹싱부(202)를 갖는 인코딩 장치로부터 미디어 신호를 전송받아 LF 및 RF 채널을 복원하는 디코딩 장치의 채널 생성부(217)를 나타낸 블록도이다. 도 4를 참조하면, 디코딩 장치는 공간 정보 신호(103)로부터 공간 파라미터 값을 추출하고, 추출한 공간 파라미터 값을 제1 업믹싱부 내지 제5 업믹싱부에 적용하여 원래의 신호를 복원한다. 디코딩 장치는 공간프레임(107)마다 업믹싱부에 대한 정보를 읽는다. 업믹싱부에 대한 정보는 각 업믹싱부에 적용되는 공간 파라미터 값에 대한 정보를 포함한다. 공간 파라미터 값은 디폴트 값이거나 이전 파라미터 값과 동일한 값이거나 인터폴레이션된 보간 값이거나 또는 새로 공간 정보 신호(103)로부터 추출된 부호화된 값이 될 수 있다. 공간 파라미터 값이 공간 정보 신호(103)로부터 추출된 부호화된 값인 경우, 디코딩 장치는 공간 파라미터 값을 추출하여 복호화한 후 이를 각 업믹싱부에 적용한다. 도 3에서 인코딩 장치가 다운믹스할 때 추출된 공간 파라미터 CLD1 내지 CLD5 값을 모두 공간 정보 신호(103)에 포함시켜 디코딩 장치로 전송한 경우, 디코딩 장치는 제1 업믹싱부에 인가되는 CLD1 및 제2 업믹싱부에 인가되는 CLD2가 150임을 이용하여 제1 업믹싱부 및 제2업믹싱부가 도시된 화살표와 같은 방향으로 모든 에너지를 진행시킴을 감지할 수 있다. 디코딩 장치는 공간 정보 신호(103)로부 터 공간 파라미터 CLD4를 추출하여 이를 제4 업믹싱부에 인가함으로써 LF, RF 채널을 복원할 수 있다. 디코딩 장치는 제3 업믹싱부 및 제5 업믹싱부로는 에너지가 진행되지 않음을 이용하여 제3 업믹싱부 및 제5 업믹싱로부터 출력되는 C 채널, LFE 채널, LS 채널 및 RS 채널 값이 0임을 판단할 수 있다. 즉, 디코딩 장치는 상위 업믹싱부로에 적용되는 공간 파라미터 값을 이용하여 하위 업믹싱부로부터 출력되는 채널이 0임을 판단할 수 있다. 따라서, 상위 업믹싱부에 적용되는 공간 파라미터 값에 따라 하위 업믹싱부에 적용되는 공간 파라미터 값이 필요하지 않은 경우가 생길 수 있다. 인코딩 장치가 공간 파라미터 값이 디폴트 값이라고 표시하여 디코딩 장치로 전송한 경우, 디코딩 장치는 새로 공간 파라미터 값을 읽지 않고 디폴트 값에 따른 공간 파라미터 값을 각 업믹싱부에 적용한다. 도 3에서 인코딩 장치는 CLD1 및 CLD2가 150이므로 이를 디폴트 값 1로 표시하여 디코딩 장치로 전송할 수 있다. 도 4에서 디코딩 장치는 디폴트 값 1을 이용하여 CLD1 및 CLD2가 150임을 감지할 수 있다. 디코딩 장치는 제1 업믹싱부 및 제2 업믹싱부에 CLD1 및 CLD2 값을 적용하여 모든 에너지가 윗 방향으로 향함을 감지하고, 이로부터 유효한 값을 갖는 채널 및 유효하지 않은 가상의 값을 갖는 채널이 무엇인지 판단할 수 있다. 디코딩 장치는 공간 정보 신호(103)에 포함되어 있는 유효 채널 표시 정보 또는 채널 구성 식별자로부터 유효 채널이 무엇인지를 판단할 수도 있다. 디코딩 장치는 각 채널 순서대로 채널이 유효한 채널인지를 표시하는 유효 채널 표시 정보를 이용하거나, 각 업믹싱부가 유효한 채널을 생성하는지를 표시하는 방법을 이용할 수 있다. 도 4에서 디코딩 장치는 각 채널 순서대로 유효 채널인지를 표시하는 정보가 110000임 을 이용하여, LF 및 RF 채널만이 유효한 채널이고 나머지 4개의 채널은 값이 0임을 감지할 수 있다. 또한 디코딩 장치는 각 업믹싱부 순서대로 신호를 생성하는지 여부를 표시하는 유효 채널 표시 정보 00010를 이용하여, 제4 업믹싱부만이 유효 채널을 생성하기 위해 활성화되고 나머지 업믹싱부는 유효 채널을 생성하지 않음을 판단하여 유효 채널이 LF 및 RF 채널임을 판단할 수 있다. 또한, 디코딩 장치는 채널 구성 식별자가 1(001)임을 이용하여 LF 및 RF 채널이 유효한 채널임을 판단할 수도 있다.
도 5는 5-1-52채널 구성을 갖는 디코딩 장치가 유효한 채널을 판단하는 방법을 나타낸 도면이다. 도 5를 참조하면, 디코딩 장치는 공간 정보 신호(103)로부터 공간 파라미터 값을 추출하거나, 그 값이 디폴트 값인 경우에는 디폴트 값에 상응하는 공간 파라미터 값을 이용하여 각 업믹싱부에 적용한다. 디코딩 장치는 추출한 CLD1이 150 또는 추출한 CLD1에 대한 디폴트 값이 1임을 이용하여 제1 업믹싱부로부터 출력되는 신호가 윗 방향으로만 향함을 감지할 수 있다. 디코딩 장치는 CLD2가 0 또는 디폴트 값이 0임을 이용하여 제2업 믹싱부로부터 신호가 양분되어 출력됨을 감지할 수 있다. 또한, 디코딩 장치는 CLD4및 CLD5가 150 또는 디폴트 값이 1임을 이용하여 제4 업믹싱부로부터 출력되는 신호 및 제5 업믹싱부로부터 출력되는 신호가 윗 방향으로만 향함을 감지할 수 있다. 따라서, 디코딩 장치는 LF 및 RF 채널이 유효한 채널임을 판단할 수 있다. 또한, 전술한 바와 같이 디코딩 장치는 공간 정보 신호(103)에 포함되어 있는 유효 채널 표시 정보를 이용하여 유효한 채널 이 무엇인지를 판단할 수 있다. 도 5의 경우, 각 출력 채널 순서에 따라 표시된 유효 채널 표시 정보가 101000인 경우, 디코딩 장치는 첫 번째 출력 채널 및 세 번째 출력 채널인 LF 및 RF 채널이 유효한 채널임을 판단할 수 있다. 각 업믹싱부 순서에 따라 표시된 유효 채널 표시 정보가 01000인 경우, 디코딩 장치는 두 번째 업믹싱부가 유효한 채널을 생성함을 감지하여 LF 및 RF 채널이 유효한 채널임을 판단할 수 있다. 또한, 디코딩 장치는 채널 구성 식별자가 1(001)인 경우, 이를 이용하여 출력 채널 중 유효한 채널이 LF 및 RF 채널임을 판단할 수도 있다.
3.2 유효 채널이 아닌 채널에 대한 디코딩을 생략하는 방법
디코딩 장치는 원래의 채널 구성보다 적은 수의 채널을 갖는 신호가 전송되었을 때, 원래의 채널 구성에 따라 디코딩을 수행할 수 있다. 그러나 이에 의할 경우 디코딩 장치는 유효하지 않은 값을 갖는 가상의 채널까지 복원하게 된다. 따라서, 디코딩 장치는 유효하지 않다고 판단되는 채널을 생성하기 위한 일련의 디코딩 과정, 즉, 디코릴레이터를 이용하여 비상관 신호를 생성하거나 synthesis filterbank 및 매트릭스 연산 및 계수 생성 등의 과정을 생략할 수 있다.
3.3 유효 채널 표시
디코딩 장치는 멀티 채널 신호(219)에 포함되어 있는 채널이 유효한 채널인지 또는 유효하지 않은 가상의 값을 갖는 채널인지를 유저 또는 후처리 장치에 표시할 수 있다. 디코딩 장치는 멀티 채널 미디어 신호(219)를 복원하기 전에 전술한 방법을 이용하여 유효한 채널이 무엇인지를 판단할 수도 있으나, 이에 한정되는 것은 아니다. 디코딩 장치는 미디어 신호(210)을 디코딩하여 멀티 채널 미디어 신호 (219)를 모두 복원한 후에 복원된 채널 중 유효한 채널이 무엇인지를 판단하여 이를 외부에 표시할 수도 있다. 후처리 장치는 디코딩 장치로부터 출력되는 멀티 채널 신호(219) 중 디코딩 장치가 표시한 유효한 채널만을 이용하여 유저의 선택에 따른 다운믹스를 수행하거나, 음장 표현 등의 후처리를 수행할 수 있다.

Claims (22)

  1. 다운믹스 신호 및 공간 정보를 수신하는 단계;
    상기 공간정보를 이용하여 가상채널을 감지하는 단계; 및
    상기 다운믹스 신호 및 상기 공간 정보를 이용하여 멀티채널 오디오 신호로 복원하는 단계를 포함하며,
    상기 가상채널의 에너지 레벨은 0인 것을 특징으로 하는 오디오 신호 디코딩 방법.
  2. 제1 항에 있어서,
    상기 가상채널과 관련된 상기 공간정보는 상기 공간정보의 범위 중 최대값 또는 최소값을 갖는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  3. 제 2 항에 있어서,
    상기 가상채널과 관련된 공간정보는 기설정된 기본 값을 갖는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  4. 제 1 항에 있어서,
    상기 가상채널은, 상기 공간정보에 포함된 유효 채널 표시 정보를 이용하여 결정되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  5. 제4 항에 있어서,
    상기 유효 채널 표시 정보는 생성되는 채널이 유효한 값을 갖는 채널인지 여부를 표시하는 식별자를 포함하거나, 하나의 신호를 두개의 신호로 또는 두 개의 신호를 세 개의 신호로 변환하여 상기 다운믹스 신호로부터 상기 멀티 채널을 생성하는 업믹싱부의 사용 여부를 표시하는 정보를 포함하거나, 상기 유효한 값을 갖는 채널의 구성 정보를 표시하는 정보를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  6. 제1 멀티 채널 오디오 신호를 다운믹싱한 다운믹스 신호와 공간 정보를 획득하는 단계;
    상기 공간 정보로부터 상기 공간 정보 중 일부를 이용하여 변형 공간 정보를 생성하는 단계; 및
    상기 변형 공간 정보를 이용하여 제2 멀티 채널 신호를 생성하는 단계
    를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  7. 삭제
  8. 제6 항에 있어서, 상기 변형 공간 정보를 생성하는 단계는,
    상기 제 1 멀티 채널 신호에 관련된 레벨 차이 정보 및 채널간 상관 정보를 이용하여 생성하는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  9. 제6 항에 있어서, 상기 제1 멀티 채널의 수는 상기 제 2 멀티 채널의 수와 다른 것을 특징으로 하는 오디오 신호 디코딩 방법.
  10. 제9 항에 있어서,
    상기 제1 멀티 채널의 수는 상기 제 2 멀티 채널의 수보다 많은 것을 특징으로 하는 오디오 신호 디코딩 방법.
  11. 제6 항에 있어서,
    상기 다운믹스 신호는 모노 채널이며, 상기 제2 멀티채널은 스테레오 채널인 것을 특징으로 하는 오디오 신호 디코딩 방법.
  12. 삭제
  13. 멀티채널 오디오 신호로부터 생성된 다운믹스 신호 및 상기 멀티채널 오디오 신호 중 가상채널과 관련된 공간정보를 분리하는 역다중화부;
    상기 다운믹스 신호를 디코딩하는 다운믹스 신호 디코딩부; 및
    상기 다운믹스 신호 및 상기 공간정보를 이용하여 멀티채널을 갖는 오디오 신호를 생성하는 채널 생성부를 포함하며,
    상기 채널 생성부는 상기 공간정보로부터 상기 가상채널을 감지하고, 상기 가상채널의 에너지 레벨은 0인 것을 특징으로 하는 오디오 신호 디코딩 장치.
  14. 제13항에 있어서,
    상기 채널 생성부는 상기 공간정보가 상기 공간정보의 범위 중 최대값 또는 최소값을 갖는 것에 기초하여 상기 가상채널을 감지하는 것을 특징으로 하는 오디오 신호 디코딩 장치.
  15. 제 1 멀티 채널 신호를 다운믹싱한 다운믹스 신호 및 공간 정보 신호를 추출하는 추출부;
    상기 공간 정보 중 일부를 이용하여 변형 공간 정보를 생성하는 변형 공간 정보 생성부; 및
    상기 다운믹스 신호 및 상기 변형 공간 정보를 이용하여 제 2 멀티 채널 신호를 생성하는 멀티채널 생성부를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 장치.
  16. 제 15 항에 있어서,
    상기 멀티채널 생성부는 상기 제 1 멀티 채널 신호의 멀티 채널 수와 다른 수의 채널을 갖는 상기 제 2 멀티 채널 신호를 생성하는 것을 특징으로 하는 오디오 신호 디코딩 장치.
  17. N보다 작은 수인 M 개의 채널신호를 입력 받아 N개의 채널에 할당하는 단계;
    상기 N 개의 채널 중 가상채널의 에너지 레벨을 0으로 설정하는 단계;
    상기 N 개의 채널을 갖는 신호로부터 다운믹스 신호 및 공간정보를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  18. 제 17항에 있어서,
    상기 가상채널과 관련된 상기 공간정보는 상기 공간정보의 범위 중 최대값 또는 최소값을 갖는 것을 특징으로 하는 오디오 신호의 인코딩 방법.
  19. 제 17항에 있어서,
    상기 가상채널과 관련된 상기 공간정보는, 상기 가상채널을 나타내는 디폴트 값을 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.
  20. N보다 작은 수인 M 개의 채널신호를 입력 받아 N개의 채널에 할당하고, 상기 N 개의 채널 중 가상채널의 에너지 레벨을 0으로 설정하는 채널 설정부;
    상기 N 개의 채널을 갖는 신호로부터 공간정보를 생성하는 공간 정보 추출부; 및
    상기 N 개의 채널을 갖는 신호를 다운믹스하는 다운믹싱부를 포함하는 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  21. 제 20항에 있어서,
    상기 공간정보 생성부는 상기 가상채널과 관련된 상기 공간정보를 상기 공간정보의 범위 중 최대값 또는 최소값으로 생성하는 것을 특징으로 하는 오디오 신호의 인코딩 장치.
  22. 제 20항에 있어서,
    상기 공간정보 생성부는 상기 가상채널과 관련된 상기 공간정보를 상기 가상채널을 나타내는 디폴트 값을 포함하는 것을 특징으로 하는 오디오 신호 인코딩 장치.
KR20087005976A 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치 KR100904435B1 (ko)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US78809206P 2006-04-03 2006-04-03
US60/788,092 2006-04-03
US78987406P 2006-04-07 2006-04-07
US60/789,874 2006-04-07
US79143206P 2006-04-13 2006-04-13
US60/791,432 2006-04-13
US83239006P 2006-07-21 2006-07-21
US60/832,390 2006-07-21
KR20060078300 2006-08-18
KR1020060078300 2006-08-18

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020087021419A Division KR20080086549A (ko) 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080037078A KR20080037078A (ko) 2008-04-29
KR100904435B1 true KR100904435B1 (ko) 2009-06-24

Family

ID=38563855

Family Applications (3)

Application Number Title Priority Date Filing Date
KR20070032376A KR20070099456A (ko) 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치
KR20087005976A KR100904435B1 (ko) 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치
KR1020087021419A KR20080086549A (ko) 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR20070032376A KR20070099456A (ko) 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020087021419A KR20080086549A (ko) 2006-04-03 2007-04-02 미디어 신호 처리 방법 및 장치

Country Status (5)

Country Link
EP (1) EP2002425B1 (ko)
JP (1) JP5113151B2 (ko)
KR (3) KR20070099456A (ko)
CN (1) CN101361122B (ko)
WO (1) WO2007114624A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011027494A1 (ja) 2009-09-01 2011-03-10 パナソニック株式会社 デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
KR101218801B1 (ko) * 2009-12-21 2013-01-18 주식회사 인코렙 미디어 편집 장치, 미디어 편집 서비스 제공 방법, 및 이에 사용되는 웹서버
EP3061089B1 (en) 2013-10-21 2018-01-17 Dolby International AB Parametric reconstruction of audio signals
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP3881560B1 (en) * 2018-11-13 2024-07-24 Dolby Laboratories Licensing Corporation Representing spatial audio by means of an audio signal and associated metadata

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2165370T3 (es) * 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
JP3362476B2 (ja) * 1993-10-22 2003-01-07 ソニー株式会社 高能率符号化装置及びインタフェース装置
WO1999012386A1 (en) * 1997-09-05 1999-03-11 Lexicon 5-2-5 matrix encoder and decoder system
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
JP2000244431A (ja) * 1999-02-23 2000-09-08 Victor Co Of Japan Ltd 音声符号化装置
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
ATE433182T1 (de) 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AES 118th Convention paper 6447호(2005.05.28-31)*
AES 119th Convention paper 'MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status' (2005.10.7-10)*

Also Published As

Publication number Publication date
CN101361122B (zh) 2012-12-19
KR20070099456A (ko) 2007-10-09
EP2002425A1 (en) 2008-12-17
KR20080037078A (ko) 2008-04-29
WO2007114624A1 (en) 2007-10-11
CN101361122A (zh) 2009-02-04
EP2002425B1 (en) 2016-06-22
JP5113151B2 (ja) 2013-01-09
EP2002425A4 (en) 2014-06-25
KR20080086549A (ko) 2008-09-25
JP2009532735A (ja) 2009-09-10

Similar Documents

Publication Publication Date Title
US7797163B2 (en) Apparatus for processing media signal and method thereof
KR101259016B1 (ko) 스케일러블 채널 복호화 방법 및 장치
CN105637582B (zh) 音频编码装置及音频解码装置
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR100852223B1 (ko) 멀티채널 오디오 신호 시각화 장치 및 방법
KR100946688B1 (ko) 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체
JP4859925B2 (ja) オーディオ信号デコーディング方法及びその装置
KR101615262B1 (ko) 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
JP4568363B2 (ja) オーディオ信号デコーディング方法及びその装置
US8948406B2 (en) Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium
US20190005971A1 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
KR100904435B1 (ko) 미디어 신호 처리 방법 및 장치
KR100763920B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
KR20060135268A (ko) 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
KR20080071971A (ko) 미디어 신호 처리 방법 및 장치
US20110040566A1 (en) Method and apparatus for encoding and decoding residual signal
EP2876640B1 (en) Audio encoding device and audio coding method
TWI489886B (zh) 音頻訊號解碼方法及其裝置
KR20070025906A (ko) 멀티채널 오디오 코딩에서 효과적인 레지듀얼 코딩 정보비트스트림 구성방법
KR20070003600A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR20070108314A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
A107 Divisional application of patent
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130514

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140523

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150522

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160524

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170512

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180514

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190514

Year of fee payment: 11