KR101062351B1 - 오디오 신호 처리 방법 및 이의 장치 - Google Patents

오디오 신호 처리 방법 및 이의 장치 Download PDF

Info

Publication number
KR101062351B1
KR101062351B1 KR1020090032213A KR20090032213A KR101062351B1 KR 101062351 B1 KR101062351 B1 KR 101062351B1 KR 1020090032213 A KR1020090032213 A KR 1020090032213A KR 20090032213 A KR20090032213 A KR 20090032213A KR 101062351 B1 KR101062351 B1 KR 101062351B1
Authority
KR
South Korea
Prior art keywords
preset
information
downmix signal
metadata
area
Prior art date
Application number
KR1020090032213A
Other languages
English (en)
Other versions
KR20090110233A (ko
Inventor
오현오
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to CN200980113620.3A priority Critical patent/CN102007533B/zh
Priority to JP2011504928A priority patent/JP5406276B2/ja
Priority to US12/424,990 priority patent/US8326446B2/en
Priority to ES09005420.6T priority patent/ES2525719T3/es
Priority to EP09005420.6A priority patent/EP2111062B1/en
Priority to PCT/KR2009/001980 priority patent/WO2009128662A2/en
Publication of KR20090110233A publication Critical patent/KR20090110233A/ko
Application granted granted Critical
Publication of KR101062351B1 publication Critical patent/KR101062351B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

본 발명은 하나 이상의 오브젝트를 포함하는 다운믹스 신호, 상기 오브젝트의 속성에 기반한 오브젝트 정보, 상기 다운믹스 신호를 렌더링하기 위하여 프리셋 정보 및 상기 프리셋 정보의 속성을 나타내는 프리셋 속성 정보를 수신하는 단계; 상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 구성정보 영역의 확장영역에 포함된 경우, 상기 다운믹스 신호의 모든 데이터 영역들에 대하여 상기 프리셋 정보를 적용함으로써 상기 다운믹스 신호를 렌더링하는 단계; 및 상기 프리셋 속성 정보에 기초하여 프리셋 정보가 데이터 영역의 확장영역에 포함된 경우, 상기 프리셋 정보를 상기 데이터 영역에 대응하는 상기 다운믹스 신호의 데이터 영역에 적용함으로써 상기 다운믹스 신호를 렌더링하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법이 개시된다.
Figure R1020090032213
프리셋 속성 정보, 프리셋 정보, 변동, 고정

Description

오디오 신호 처리 방법 및 이의 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}
본 발명은 오디오 신호의 처리 방법 및 장치에 관한 것으로, 보다 상세하게는 디지털 매체, 방송 신호 등으로 수신된 오디오 신호를 처리할 수 있는 오디오 신호의 처리 방법 및 장치에 관한 것이다.
복수 개의 오브젝트들을 포함하는 오디오 신호를, 모노 또는 스트레오 신호로 다운믹스하여 다운믹스 신호를 생성하는 과정에 있어서, 오브젝트들로부터 파라미터들이 추출된다. 이러한 파라미터들은 다운믹스된 신호를 디코딩하는 과정에서 사용되는데, 오브젝트들의 위치(position)과 게인(gain)은 파라미터들 이외에 유저의 선택에 의하여 컨트롤 될 수 있다.
다운믹스 신호에 포함되어 있는 오브젝트들은 사용자의 선택에 의하여 조절되어야 한다. 그러나, 사용자에 의하여 오브젝트를 제어하는 경우, 직접 모든 오브젝트 신호를 제어하여야 하는 번거로움이 있고, 전문가에 의하여 제어되는 것에 비 하여 다수 개의 오브젝트를 포함하는 오디오 신호의 최적의 상태를 재현하는데 어려움이 있을 수 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 기 설정된 프리셋 정보 및 프리셋 메타데이터를 이용하여 오브젝트의 레벨과 위치를 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 음원의 특성에 따라 프리셋 정보 및 프리셋 메타데이터를 다운믹스 신호의 모든 데이터 영역 또는 다운믹스 신호의 하나의 데이터 영역에 적용하여 다운믹스 신호에 포함된 오브젝트를 조절할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 사용자의 선택을 기반으로 화면에 표시된 프리셋 메타데이터들 중 하나를 선택하고, 이에 대응하는 프리셋 정보를 이용하여 오브젝트의 레벨과 위치를 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 상기 프리셋 정보가 적용되어 조절된 오브젝트 및 상기 선택된 프리셋 메타데이터를 화면에 표시함으로써 사용자로부터 선택 신호를 받을 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명은 다음과 같은 효과와 이점을 제공한다.
우선, 각각의 오브젝트에 대한 사용자의 설정없이, 기 설정된 복수개의 프리 셋 정보 중 하나를 복수개의 프리셋 메타데이터를 이용하여 선택함으로써 손쉽게 오브젝트의 출력채널의 레벨을 조절할 수 있다.
둘째, 음원의 특성에 따라 상기 프리셋 정보를 데이터 영역 단위로 개별적으로 선택하여 적용하거나 다운믹스 신호의 모든 데이터 영역에 동일한 프리셋 정보를 선택하여 적용함으로써, 오디오 신호를 효율적으로 복원할 수 있다.
셋째, 프리셋 정보가 적용되어 조절된 오브젝트 및 선택된 프리셋 메타데이터를 화면에서 확인함으로써 보다 적절한 프리셋 정보를 선택하여 오브젝트의 출력채널의 레벨 또는 위치를 조절할 수 있다.
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 하나 이상의 오브젝트를 포함하는 다운믹스 신호, 상기 오브젝트의 속성에 기반한 오브젝트 정보, 상기 다운믹스 신호를 렌더링하기 위하여 프리셋 정보 및 상기 프리셋 정보의 속성을 나타내는 프리셋 속성 정보를 수신하는 단계; 상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 구성정보 영역의 확장영역에 포함된 경우, 상기 다운믹스 신호의 모든 데이터 영역들에 대하여 상기 프리셋 정보를 적용함으로써 상기 다운믹스 신호를 렌더링하는 단계; 및 상기 프리셋 속성 정보에 기초하여 프리셋 정보가 데이터 영역의 확장영역에 포함된 경우, 상기 프리셋 정보를 상기 데이터 영역에 대응하는 상기 다운믹스 신호의 데이터 영역에 적용함으로써 상기 다운믹스 신호를 렌더링하는 단계를 포함한다.
상기 프리셋 속성 정보는 상기 프리셋 정보가 상기 데이터 영역의 확장영역 에 존재하는지 여부를 나타낼 수 있다.
상기 프리셋 속성 정보는 상기 프리셋 정보가 변동 또는 고정인지를 나타낼 수 있다.
상기 오브젝트 정보 및 상기 프리셋 정보를 이용하여, 상기 다운믹스 신호의 패닝 또는 게인을 조절하는 다운믹스 처리 정보 및 상기 다운믹스 신호를 업믹싱하기 위한 멀티채널 정보를 생성하는 단계; 및 상기 다운믹스 처리 정보를 이용하여 상기 다운믹스 신호를 수정하는 단계를 더 포함할 수 있다.
상기와 같은 또다른 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 하나 이상의 오브젝트를 포함하는 다운믹스 신호 및 상기 오브젝트의 속성에 기반한 오브젝트 정보를 수신하는 신호 수신부; 다운믹스 신호를 렌더링하기 위하여 프리셋 정보의 속성을 나타내는 프리셋 속성 정보 수신부; 상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 구성정보 영역의 확장영역에 포함된 경우, 상기 다운믹스 신호의 모든 데이터 영역들에 대응하는 프리셋 모드를 수신하는 고정 프리셋 모드 수신부; 상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 데이터 영역의 확장영역에 포함된 경우, 상기 다운믹스 신호의 하나의 데이터 영역에 대응하는 프리셋 모드를 수신하는 변동 프리셋 모드 수신부; 및 상기 프리셋 정보를 상기 다운믹스 신호의 데이터 영역 또는 모든 데이터 영역들에 적용하여 렌더링하는 렌더링부를 포함하고, 상기 프리셋 모드는 상기 프리셋 정보 및 상기 프리셋 정보에 대응하는 프리셋 메타데이터를 포함하고, 상기 프리셋 메타데이터는 상기 프리셋 정보의 특성을 나타낼 수 있다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameters), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 그 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
도 1 은 본 발명의 실시예에 따른 다운믹스 신호에 포함된 오브젝트에 적용되는 프리셋 모드의 개념도이다. 상기 오브젝트를 조절하기 위하여 기설정된 정보의 집합을 본 명세서에서 프리셋 모드(preset mode)이라고 지칭한다. 상기 프리셋 모드는 오디오 신호의 특성 또는 청취환경에 따라 사용자가 선택할 수 있는 여러가지 모드를 나타낼 수 있고, 하나 이상일 수 있다. 또한, 상기 프리셋 모드는 상기 오브젝트를 조절하기 위하여 적용되는 프리셋 정보(preset information)와 상기 프리셋 정보의 속성 등을 표현하기 위한 메타데이터인 프리셋 메타데이터(preset metadata)를 포함한다. 상기 프리셋 메타데이터는 텍스트 형태로 표시될 수 있으며, 상기 프리셋 정보의 속성(예를 들면, 콘서트 홀 모드, 가라오케 모드, 뉴스 모드 등)을 나타낼 뿐만 아니라, 상기 프리셋 정보의 작성자, 작성날짜, 상기 프리셋 정보가 적용되는 오브젝트의 이름 등 상기 프리셋 정보를 표현하기 위한 관련 정보를 포함할 수 있다. 한편, 상기 프리셋 정보는 실질적으로 상기 오브젝트에 적용되는 데이터로서, 상기 프리셋 메타데이터와 서로 대응하며, 다양한 형태로, 예를 들어, 매트릭스 형태, 표현될 수 있다.
도 1 을 참조하면, 프리셋 모드 1(preset mode 1)은 음악 신호를 콘서트 홀에서 듣는 듯한 음장감을 제공하는 콘서트 홀 모드(concert hall mode)일 수 있고, 프리셋 모드 2(preset mode 2)는 오디오 신호 중 보컬(vocal) 오브젝트의 레벨을 감소시킨 가라오케 모드(karaoke mode)일 수 있으며, 프리셋 모드 n(preset mode n)은 음성 오브젝트의 레벨을 증가시킨 뉴스 모드(news mode)일 수 있다. 또한, 프리셋 모드는 프리셋 메타데이터 및 프리셋 정보를 포함한다. 만일 사용자로부터 프리셋 모드 2 가 선택된 경우, 프리셋 메타데이터 2 인 가라오케 모드(karaoke mode)가 현시될 것이고, 상기 프리셋 메타데이터 2 와 관련된 프리셋 정보 2 가 오브젝트에 적용되어 레벨을 조절할 수 있다.
이 때, 프리셋 정보는 모노 프리셋 정보(mono preset information), 스테레오 프리셋 정보(stereo preset information) 및 멀티채널 프리셋 정보(multi-channel preset information)을 포함할 수 있다. 상기 프리셋 정보는 오브젝트의 출력채널에 따라 결정된다. 상기 모노 프리셋 정보는 상기 오브젝트의 출력채널이 모노인 경우 적용되는 프리셋 정보이고, 상기 스테레오 프리셋 정보는 상기 오브젝트의 출력채널이 스테레오인 경우, 상기 멀티채널 프리셋 정보는 상기 오브젝트의 출력채널이 멀티채널인 경우 적용되는 프리셋 정보이다. 상기 오브젝트의 출력채널이 구성정보에 의하여 결정되면, 이를 이용하여 프리셋 정보의 타입이 결정되고, 상기 프리셋 정보를 상기 오브젝트에 적용하여 레벨 또는 패닝을 조절할 수 있다.
도 2a 및 도 2b 는 본 발명의 일실시예에 따른 프리셋 속성 정보에 따라 프리셋 정보를 적용하여 다운믹스 신호에 포함된 오브젝트를 조절하는 개념도이다. 본 발명의 오디오 신호는 인코더에서 다운믹스 신호 및 오브젝트 정보로 인코딩되고, 이들은 하나의 비트스트림 또는 별개의 비트스트림의 형태로 디코더에 전송된다. 도 2a 및 도 2b 를 참조하면, 비트스트림에 포함된 오브젝트 정보는 구체적으로 구성정보 영역과 복수개의 데이터 영역(데이터 영역 1, 데이터 영역 2, ..., 데이터 영역 n)으로 구성된다. 상기 구성정보 영역은 오브젝트 정보의 비트스트림 중 앞쪽에 위치한 영역으로, 오브젝트 정보의 모든 데이터 영역들에 공통적으로 적용되는 정보들을 포함한다. 예를 들어, 트리구조 등을 포함하는 구성정보(configuration information), 데이터 영역 길이 정보(data region length information) 및 오브젝트의 개수 정보(object number information) 등을 포함할 수 있다. 반면, 데이터 영역은 상기 구성정보 영역에 포함된 데이터 영역 길이 정보에 기초하여 전체 오디오 신호의 시간 도메인을 분할한 유닛이고, 프레임을 포함할 수 있다. 상기 오브젝트 정보의 데이터 영역은 상기 다운믹스 신호의 데이터 영역에 대응하며, 대응되는 데이터 영역의 상기 오브젝트의 속성에 기반한 오브젝트 레벨 정보, 오브젝트 게인 정보 등의 오브젝트 데이터 정보를 포함한다.
먼저 본 발명의 일실시예에 따른 오디오 신호 처리 방법에서는, 비트스트림의 오브젝트 정보로부터 프리셋 속성 정보(preset_attribute_information)을 읽는다. 상기 프리셋 속성 정보는 프리셋 정보가 비트스트림 중 어느 영역에 포함되어 있는지를 나타내는 것으로, 상세하게는, 프리셋 정보가 오브젝트 정보의 구성정보 영역에 포함되는지 또는 데이터 영역에 포함되는지를 나타내고, 이의 상세한 의미는 하기 표 1 과 같다.
Figure 112009501474329-pat00001
먼저, 도 2a 를 참조하면, 프리셋 속성 정보가 0 으로, 프리셋 정보가 구성정보 영역에 포함되는 것을 나타내는 경우, 구성정보 영역에서 추출된 프리셋 정보는 다운믹스 신호의 모든 데이터 영역들에 동일하게 적용되어 렌더링을 수행한다. 반면, 도 2b 를 참조하면, 프리셋 속성 정보가 1 로 프리셋 정보가 데이터 영역에 포함되는 것을 나타내는 경우, 데이터 영역에서 추출된 프리셋 정보는 대응하는 다운믹스 신호의 데이터 영역에 적용되어 렌더링을 수행한다. 예를 들어, 데이터 영역 1 에서 추출된 프리셋 정보는 다운믹스 신호의 데이터 영역 1 에 적용되고, 데이터 영역 n 에서 추출된 프리셋 정보는 다운믹스 신호의 데이터 영역 n 에 적용될 수 있다. 또한, 프리셋 속성 정보는 상기 프리셋 정보가 변동인지 고정인지를 나타낼 수도 있다. 프리셋 속성 정보가 0 으로, 프리셋 정보가 구성정보 영역에 포함되는 경우, 프리셋 정보는 고정(static)이라고 지칭할 수 있다. 이 경우, 상기 프리셋 정보는 모든 데이터 영역들에 고정으로 동일하게 적용된다. 반면, 프리셋 속성 정보가 1 로, 프리셋 정보가 데이터 영역에 포함되는 경우, 프리셋 정보는 변동(dynamic)이라고 지칭할 수 있다. 이 때, 상기 프리셋 정보는 해당 데이터 영역에만 적용되어 대응하는 데이터 영역의 다운믹스 신호를 렌더링하기 때문에, 데이터 영역별로 변동적으로 적용된다. 이 때, 상기 프리셋 정보는 변동(dynamic)인 경우는 데이터 영역의 확장영역(extension region)에 존재하는 것이 바람직하고, 상기 프리셋 정보가 고정( static)인 경우는 구성정보 영역의 확장영역(extension region)에 존재하는 것이 바람직할 수 있다.
따라서, 본 발명의 일실시예에 따른 오디오 신호 처리 방법은 프리셋 속성 정보에 의하여 음원의 특성에 따라 데이터 영역별로 적절한 프리셋 정보를 이용하거나 동일한 프리셋 정보를 전체 데이터 영역들에 이용하여 다운믹스 신호를 렌더링할 수 있게 된다.
도 3 은 본 발명의 실시예에 따른 오디오 신호 처리 장치(300)를 나타내는 것이다. 도 3 을 참조하면, 오디오 신호 처리 장치(300)는 프리셋 모드 생성부(310), 정보 수신부(미도시), 변동 프리셋 모드 수신부(320), 고정 프리셋 모드 수신부(330), 렌더링부(340)를 포함할 수 있다.
프리셋 모드 생성부(310)는 오디오 신호에 포함된 오브젝트를 렌더링시 조절하기 위한 프리셋 모드를 생성하며, 프리셋 속성 결정부(311), 프리셋 메타데이터 생성부(312) 및 프리셋 정보 생성부(313)를 포함할 수 있다.
프리셋 속성 결정부(311)은 위에서 언급한 바와 같이, 프리셋 정보를 구성정보 영역에 포함시켜 모든 데이터 영역들에 적용할지 데이터 영역에 포함시켜 데이터 영역별로 적용할지를 나타내는 프리셋 속성 정보를 결정한다. 이후, 프리셋 속성 정보에 따라 프리셋 메타데이터 생성부(312) 및 프리셋 정보 생성부(313)는 하나의 프리셋 메타데이터 및 프리셋 정보 또는 데이터 영역 수만큼의 프리셋 메타데이터 및 프리셋 정보를 생성할 수 있다. 프리셋 메타데이터 생성부(312)는 상기 프리셋 정보를 표현하는 텍스트 정보를 입력받아 프리셋 메타데이터(preset metadata)를 생성할 수 있다. 반면, 상기 오브젝트의 레벨을 조절하기 위한 게인 및/또는 오브젝트의 위치가 프리셋 정보 생성부(313)에 입력되는 경우, 상기 오브젝트에 적용되는 프리셋 정보(preset information)를 생성할 수 있다. 상기 프리셋 정보는 오브젝트마다 적용되도록 생성될 수 있고, 다양한 타입으로 구현될 수 있으며, 예를 들면, 채널 레벨 차이(CLD: Channel Level Difference) 파라미터, 매트릭스(matrix) 등일 수 있다. 또한, 프리셋 정보 생성부(313)는 상기 오브젝트의 출력채널이 몇 개인지를 나타내는 출력채널 정보(output channel information)을 더 생성할 수 있다. 프리셋 메타데이터 생성부(312)에서 생성된 프리셋 메타데이터 및 프리셋 정보 생성부(313)에서 생성된 프리셋 정보, 출력채널 정보 등은 하나의 비트스트림에 포함되어 전송될 수 있으며, 상세하게는 다운믹스 신호를 포함하는 비트스트림의 보조 영역(ancillary region)에 포함되어 전송될 수 있다.
한편, 프리셋 모드 생성부(312)는 상기 프리셋 메타데이터, 상기 프리셋 정보 및 상기 출력채널 정보가 비트스트림에 포함되었음을 나타내는 프리셋 존재 정보(preset presence information)을 더 생성할 수 있다. 상기 프리셋 존재 정보는 상기 프리셋 정보 등이 비트스트림의 어느 영역에 포함되어 있는지를 나타내는 컨테이너 타입(container type)일 수 있고, 어느 영역인지 나타내지 아니하고 단순히 비트스트림에 포함되었는지를 나타내는 플래그 타입(flag type)일 수도 있으나, 이에 한정되지는 아니한다.
또한, 프리셋 모드 생성부(312)는 복수개의 프리셋 모드를 생성할 수 있고, 각각의 프리셋 모드는 상기 프리셋 정보, 상기 프리셋 메타데이터 및 상기 출력채널 정보를 포함한다. 이 때, 프리셋 모드 생성부(312)는 상기 프리셋 모드의 개수를 나타내는 프리셋 개수 정보(preset number information)을 더 생성할 수 있다.
이와 같이, 프리셋 모드 생성부(310)는 프리셋 속성 정보, 프리셋 메타데이터 및 프리셋 정보를 비트스트림의 형태로 생성하여 출력할 수 있다.
상기 비트스트림은 도 2a 및 도 2b 에서 나타난 바와 같은 형태를 갖고, 정보 수신부(미도시)에 입력된다. 정보 수신부(미도시)에 입력된 비트스트림으로부터 먼저 프리셋 속성 정보를 획득하여, 프리셋 정보가 전송된 비트스트림 중 어느 영역에 포함되었는지를 결정한다.
변동 프리셋 모드 수신부(320)는 프리셋 속성 결정부(311)로부터 출력되는 프리셋 속성 정보(preset attribute information)에 기초하여 상기 프리셋 정보가 데이터 영역에 포함되었음을 나타내는 경우(표 1 의 preset_attribute_flag=1 의 경우), 동작한다. 변동 프리셋 모드 수신부(320)는 해당 데이터 영역에 대응하는 프리셋 메타데이터를 수신하는 변동 프리셋 메타데이터 수신부(321) 및 데이터 영역별 프리셋 정보를 수신하는 변동 프리셋 정보 수신부(322)를 포함할 수 있다. 변동 프리셋 메타데이터 수신부(321)는 선택된 프리셋 메타데이터를 수신하여 출력하고, 변동 프리셋 정보 수신부(322)는 상기 프리셋 정보를 수신하는데, 이와 관련된 상세한 설명은 도 4a 내지 도 5 를 참조하여 상세히 후술하기로 한다.
고정 프리셋 모드 수신부(330)는 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 구성정보 영역에 포함되었음을 나타내는 경우(표 1 의 preset_attribute_flag=0 의 경우), 동작한다. 고정 프리셋 모드 수신부(330)는 모든 데이터 영역들에 대응하는 프리셋 메타데이터를 수신하는 고정 프리셋 메타데이터 수신부(331) 및 프리셋 정보를 수신하는 고정 프리셋 정보 수신부(332)를 포함할 수 있다. 고정 프리셋 모드 수신부(330)의 고정 프리셋 메타데이터 수신부(331) 및 고정 프리셋 정보 수신부(332)는 변동 프리셋 모드 수신부(320)의 변동 프리셋 메타데이터 수신부(321) 및 변동 프리셋 정보 수신부(322)와 구성 및 기능은 동일하지만, 수신되어 출력되는 프리셋 정보 및 프리셋 메타데이터에 대응하는 다운믹스 신호의 범위가 상이하다.
렌더링부(340)는 복수개의 오브젝트들을 포함하는 오디오 신호를 다운믹싱하여 생성된 다운믹스 신호와 변동 프리셋 정보 수신부(322)에서 출력된 프리셋 정보 또는 고정 프리셋 정보 수신부(332)에서 출력된 프리셋 정보를 입력받는다. 상기 프리셋 정보는 상기 다운믹스 신호에 포함된 오브젝트에 적용되어 상기 오브젝트의 레벨을 조절하거나 상기 오브젝트의 위치를 조절할 수 있다.
또한, 오디오 신호 처리 장치(300)가 디스플레이부(미도시)를 포함하는 경우, 변동 프리셋 메타데이터 수신부(321)에서 출력되는 선택된 프리셋 메타데이터 또는 고정 프리셋 메타데이터 수신부(331)에서 출력되는 선택된 프리셋 메타데이터는 화면에 표시될 수 있다.
도 4a 및 도 4b 는 본 발명의 실시예에 따른 프리셋 정보가 렌더링부에 적용되는 방법을 나타내는 블록도이다. 먼저, 도 4a 는 변동 프리셋 모드 수신부(320)에서 출력된 프리셋 정보가 렌더링부(440)에서 적용되는 방법을 나타내는 것이다. 변동 프리셋 모드 수신부(320)는 도 3 의 변동 프리셋 모드 수신부(320)와 동일하며, 변동 프리셋 메타데이터 수신부(321) 및 변동 프리셋 정보 수신부(322)를 포함한다. 변동 프리셋 모드 수신부(320)는 데이터 영역마다 프리셋 메타데이터 및 프리셋 정보를 수신하여 출력하고, 상기 프리셋 정보는 렌더링부(440)에 입력된다. 렌더링부(440)는 프리셋 정보 뿐만 아니라, 다운믹스 신호도 입력받아, 데이터 영역별로 렌더링을 수행하고, 데이터 영역 1 렌더링부(441), 데이터 영역 2 렌더링부(442), ..., 데이터 영역 n 렌더링부(44n)을 포함한다. 이 때, 렌더링부(440)의 각각의 데이터 영역 렌더링부(44X)는 각각 데이터 영역에 대응하는 프리셋 정보를 입력받아 다운믹스 신호에 적용함으로써 렌더링한다. 예를 들어, 1 번째 데이터 영역은 스타디움 모드인 프리셋 정보 1 이 적용되고, 2 번째 데이터 영역은 가라오케 모드인 프리셋 정보_3 이 적용되며, 6 번째 데이터 영역은 뉴스 모드인 프리셋 정보_2(여기서, 프리셋 정보_n 의 n 은 데이터 영역 모드의 인덱스를 나타냄)이 적용될 수 있다. 이 때, 프리셋 메타데이터도 데이터 영역마다 출력됨은 물론이다.
도 4b 는 고정 프리셋 모드 수신부(330)에서 출력된 프리셋 정보가 렌더링부(440)에서 적용되는 방법을 나타내는 것이다. 고정 프리셋 모드 수신부(330)는 도 3 의 고정 프리셋 모드 수신부(330)와 동일하다. 고정 프리셋 모드 수신부(330)는 전체 데이터 영역들에 대응하는 프리셋 메타데이터 및 프리셋 정보를 수신하여 출력하고, 렌더링부(440)는 상기 프리셋 정보를 입력받는다. 도 4b 의 렌더링부(440)는 도 4a 의 렌더링부와 동일하게 데이터 영역 수만큼의 데이터 영역 렌더링부(44X)를 포함한다. 렌더링부(440)는 고정 프리셋 모드 수신부(330)로부터 프리셋 정보를 수신받는 경우, 모든 데이터 영역 렌더링부(44X)에서 다운믹스 신호에 수신된 프리셋 정보를 동일하게 적용함으로써 렌더링한다. 예를 들어, 고정 프리셋 정보 수신부(332)에서 출력된 프리셋 정보가 뉴스 모드를 나타내는 프리셋 정보 2 인 경우, 첫번째 데이터 영역부터 n 번째 데이터 영역까지 모든 데이터 영역에 뉴스 모드가 적용될 수 있다.
도 5 는 본 발명의 오디오 신호 처리 장치(300)의 변동 프리셋 모드 수신부(320)에 포함되는 변동 프리셋 정보 수신부(322) 및 고정 프리셋 모드 수신부(330)에 포함되는 고정 프리셋 정보 수신부(332)의 개략적인 구성을 보여주는 도면이다.
변동 또는 고정 프리셋 정보 수신부(322, 332)는 출력채널 정보 수신부(322a, 332a) 및 프리셋 정보 결정부(322b, 332b)를 포함한다. 출력채널 정보 수신부(322a, 332a)는 다운믹스 신호에 포함된 오브젝트가 몇 개의 출력채널에서 재생될지를 나타내는 출력채널 정보(output channel number information)를 수신하여 출력한다. 상기 출력채널 정보는 모노 채널, 스테레오 채널 또는 멀티채널(5.1 채널)일 수 있으나, 이에 한정되지는 아니한다.
프리셋 정보 결정부(322b, 332b)는 출력채널 정보 수신부(322a, 332b)로부터 입력된 상기 출력채널 정보에 기초하여 해당하는 프리셋 정보를 수신하여 출력한다. 상기 프리셋 정보는 모노 프리셋 정보, 스테레오 프리셋 정보 또는 멀티채널 프리셋 정보 중 하나일 수 있다. 상기 프리셋 정보가 매트릭스 타입인 경우는 상기 프리셋 정보의 차원은 오브젝트의 수 및 출력채널의 수에 근거하여 결정될 수 있고, 상기 프리셋 매트릭스는 (오브젝트의 수) * (출력채널의 수) 의 형태를 가질 수 있다. 예를 들어, 다운믹스 신호에 포함된 오브젝트가 n 개이고, 출력채널 정보 수신부(322a, 332a)로부터 출력채널이 5.1 채널, 즉 6 개의 채널인 경우, 프리셋 정보 결정부(322b, 332b)는 n * 6 형태로 구현된 멀티채널 프리셋 정보를 출력할 수 있다. 여기서, 매트릭스의 성분(element)은 a 번째 오브젝트가 i 번째 채널에 포함되는 정도를 나타내는 게인 값이다.
도 6 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 장치(600)를 도시한 것이다. 오디오 신호 처리 장치(600)는 크게 다운믹싱부(610), 오브젝트 정보 생성부(620), 프리셋 정보 생성부(630), 다운믹스 신호 처리부(640), 정보 처리부(650) 및 멀티채널 디코딩부(660)를 포함한다.
복수개의 오브젝트들은 다운믹싱부(610)에 입력되어 모노 또는 스테레오 다운믹스 신호를 생성한다. 또한, 복수개의 오브젝트들은 오브젝트 정보 생성부(620)에 입력되어 오브젝트의 레벨을 나타내는 오브젝트 레벨 정보(object level information), 다운믹스 신호에 포함되는 오브젝트의 게인값 및/또는 스테레오 다운믹스 신호인 경우, 다운믹스 채널에 포함되는 오브젝트의 정도를 나타내는 오브젝트 게인 정보(object gain information), 오브젝트들간의 연관여부를 나타내는 오브젝트 연관 정보(object correlation information)를 포함하는 오브젝트 정보(object information)을 생성한다. 이후, 다운믹스 신호 및 오브젝트 정보는 프리셋 모드 생성부(630)로 입력되어 프리셋 정보가 비트스트림 중 데이터 영역에 포함되는지 또는 비트스트림 중 구성정보 영역에 포함되는지를 나타내는 프리셋 속성 정보, 오브젝트의 레벨 또는 위치을 조절하여 렌더링하기 위하여 기설정된 프리셋 정보와 프리셋 정보를 표현하기 위한 프리셋 메타데이터를 포함하는 프리셋 모드를 생성한다. 상기 프리셋 속성 정보, 상기 프리셋 정보 및 상기 프리셋 메타데이터가 생성되는 과정은 상술한 도 1 내지 도 5 의 오디오 신호 처리 장치 및 방법에서 설명한 바와 같으므로 상세한 설명은 생략하기로 한다. 또한, 프리셋 모드 생성부(630)는 프리셋 정보가 비트스트림에 존재하는지를 나타내는 프리셋 존재 정보(preset presence information), 프리셋 정보의 개수를 나타내는 프리셋 개수 정보(preset number information) 및 프리셋 메타데이터의 길이를 나타내는 프리셋 메타데이터 길이 정보(preset metadata length information)를 더 생성할 수 있다. 오브젝트 정보 생성부(620)에서 생성된 오브젝트 정보와 프리셋 모드 생성부(630)에서 생성된 프리셋 속성 정보, 프리셋 정보, 프리셋 메타데이터, 프리셋 존재 정보, 프리셋 개수 정보 및 프리셋 메타데이터 길이 정보는 SAOC 비트스트림에 포함되어 전송될 수 있고, 다운믹스 신호도 포함된 하나의 비트스트림의 형태로 전송될 수도 있다. 이 경우, 상기 다운믹스 신호 및 프리셋 관련 정보들을 포함하는 비트스트림은 디코딩 장치의 신호 수신부(미도시)로 입력될 수 있다.
정보 처리부(650)는 오브젝트 정보 처리부(651), 변동 프리셋 모드 수신부(652) 및 고정 프리셋 모드 수신부(653)를 포함하며, SAOC 비트스트림을 수신받는다. SAOC 비트스트림이 변동 프리셋 모드 수신부(652)에 입력되는지 또는 고정 프리셋 모드 수신부(653)에 입력되는지는 도 2 내지 도 5 를 참조하여 상술한 바와 같이 SAOC 비트스트림에 포함된 프리셋 속성 정보에 근거하여 결정된다.
변동 프리셋 모드 수신부(652) 및 고정 프리셋 모드 수신부(653)는 상기 SAOC 비트스트림으로부터 상술한 프리셋 속성 정보, 프리셋 존재 정보, 프리셋 개수 정보, 프리셋 메타데이터, 출력채널 정보 및 프리셋 정보(예를 들면, 프리셋 매트릭스)를 수신하고, 이밖의 도 1 내지 도 5 의 오디오 신호 처리 방법 및 장치에서 설명된 다양한 실시예에 따른 방법을 이용한다. 변동 프리셋 모드 수신부(652) 또는 고정 프리셋 모드 수신부(653)는 프리셋 메타데이터와 프리셋 정보를 출력하고, 오브젝트 정보 처리부(651)는 이들을 입력받아 SAOC 비트스트림에 포함된 오브젝트 정보(object information)와 함께 이용하여 다운믹스 신호를 전처리(pre-processing) 하기 위한 다운믹스 처리 정보(downmix processing information)과 다운믹스 신호를 업믹싱하기 위한 멀티채널 정보(multi-channel information)을 생성한다. 이 때, 변동 프리셋 모드 수신부(652)에서 출력되는 프리셋 정보 및 프리셋 메타데이터는 데이터 영역에 대응하는 것이고, 고정 프리셋 모드 수신부(653)에서 출력되는 프리셋 정보 및 프리셋 메타데이터는 전체 데이터 영역들에 대응하는 것이다.
이후, 다운믹스 처리 정보는 다운믹스 신호 처리부(640)에 입력되어, 다운믹스 신호에 포함된 오브젝트가 포함되는 채널을 변동시킴으로써 패닝을 수행할 수 있다. 이와 같이 전처리된 다운믹스 신호는 정보 처리부(650)에서 출력된 멀티채널 정보와 함께 멀티채널 디코딩부(660)로 입력되어 업믹싱됨으로써 멀티채널 오디오 신호를 생성할 수 있게 된다.
이와 같이, 본 발명의 오디오 신호 처리 장치는 복수개의 오브젝트를 포함하는 다운믹스 신호를 오브젝트 정보를 이용하여 멀티채널 신호로 디코딩하는데 있어서, 기설정된 프리셋 정보 및 프리셋 메타데이터를 더 이용함으로써 손쉽게 오브젝트의 레벨을 조절할 수 있다. 또한, 이 때 오브젝트에 적용되는 프리셋 정보는 프리셋 속성 정보에 근거하여 데이터 영역마다 별개로 적용되거나 전체 데이터 영역에 동일하게 적용됨으로써 음원의 특성에 따라 적절하게 음장감을 향상시킬 수 있다.
도 7 내지 도 11 은 본 발명의 다른 일실시예에 따른 오디오 신호 처리 방법을 나타내는 신택스(syntax)를 여러가지 방법으로 표현한 것이다. 도 7 를 참조하면, 프리셋 정보와 관련된 정보들은 비트스트림의 구성정보 영역(SAOCSpecificConfig())에 존재할 수 있다.
먼저, 비트스트림의 구성정보 영역으로부터 프리셋 개수 정보(bsNumPresets)을 획득할 수 있다. 또한, 프리셋 개수 정보에 기초하여 프리셋 정보(i 번째 프리셋 정보)마다 프리셋 정보가 적용되는 오브젝트의 출력채널을 나타내는 출력채널 정보(bsPresetLevel[i])을 획득할 수 있다. 상기 출력채널 정보의 의미는 하기 표 2 와 같다.
Figure 112009501474329-pat00002
이후, 프리셋 정보가 구성정보 영역에 포함되는지 데이터 영역에 포함되는지를 나타내는 프리셋 속성 정보(bsPresetDynamic[i])을 획득할 수 있다. 도 7 에 나타난 바와 같이, 프리셋 속성 정보(bsPresetDynamic[i])가 0 인 경우, 고정 프리셋 모드(static preset mode)를 나타내며 모든 데이터 영역들에 대응하여 다운믹스 신호의 오브젝트 레벨 또는 패닝을 조절하기 위한 프리셋 정보(getPreset())를 획득한다. 이 때, 프리셋 메타데이터(PresetMetaData(numPresets))도 프리셋 정보에 대응하여 구성정보 영역에 포함될 수 있다. 상기 프리셋 속성 정보의 의미는 하기 표 3 과 같다.
Figure 112009501474329-pat00003
도 8 은 도 7 에 도시된 프리셋 속성 정보(bsPresetDynamic[i])이 프리셋 정보가 데이터 영역에 포함되는 것을 나타내는 경우, 데이터 영역정보에 대한 신택스(syntax)를 표현한 것이다. 도 8 을 참조하면, 도 7 의 프리셋 속성 정보(bsPresetDynamic[i])이 1 인 경우, if(!bsPresetDynamic[i]) 루프를 벗어나게 되므로 구성정보 영역에서 프리셋 정보를 획득하지 아니한다. 이후, 도 8 에 나타난 바와 같이 데이터 영역에서(SAOCFrame()) if(bsPresetDynamic[i] 조건을 만족하게 되므로 프리셋 정보(getPreset())를 획득할 수 있다. 상기 프리셋 정보는 데이터 영역에서 획득되므로, 도 7 의 프리셋 정보가 전체 데이터 영역에 동일하게 적용되는 것과 달리, 해당 데이터 영역에만 적용될 수 있다. 한편, 도 7 및 도 8 에서는 상기 프리셋 정보가 구성정보 영역(SAOCSpecificConfig()) 및 데이터 영역(SAOCFrame())에 포함되어 있지만, 구성정보 영역 확장영역(SAOCExtensionConfig()) 및 데이터 영역 확장영역(SAOCEXtensionFrame())에 포함될 수도 있다. 이 때, 상기 구성정보 영역 확장영역 및 상기 데이터 영역 확장영역에 포함되는 상기 프리셋 정보는 도 7 및 도 8 을 참조하여 설명된 프리셋 정보와 동일하다. 또한, 상기 구성정보 영역 확장영역 및 상기 데이터 영역 확장영역은 상기 프리셋 정보뿐만 아니라, 상기 프리셋 정보에 대응하는 프리셋 메타데이터, 출력채널 정보, 프리셋 존재 정보 등을 더 포함할 수 있다.
도 9 는 본 발명의 다른 실시예에 따른 프리셋 정보를 나타내는 신택스(syntax)이다. 도 9 를 참조하면, 프리셋 정보는 EcData 를 이용하여 생성된 것을 이용할 수 있다. 반면, 상기 프리셋 정보는 EcData 가 아닌 게인 값 자체를 전송하여 이용하는 방법을 이용할 수 있으며, 채널차이 정보(CLD) 테이블을 이용하여 양자화하는 방법뿐만 아니라, 다른 독립된 테이블을 이용하여 양자화할 수도 있다.
도 10 은 본 발명의 다른 실시예에 따른 프리셋 메타데이터를 나타내는 신택스(syntax)이다. 도 10 에 나타난 바와 같이, 프리셋 메타데이터는 먼저 프리셋 정보에 대응하는 메타데이터의 길이를 나타내는 프리셋 메타데이터 길이 정보(bsNumCharMetaData[prst])를 획득한다. 이후, 프리셋 메타데이터 길이 정보에 기초하여 프리셋 정보마다 이에 대응하는 프리셋 메타데이터(bsMetaData[prst])를 획득할 수 있다.
이와 같이, 프리셋 정보를 표현하는 프리셋 메타데이터를 메타데이터의 길이를 나타내는 프리셋 길이 정보에 기초하여 텍스트 형태로 표현함으로써, 본 발명의 오디오 신호 처리 방법 및 장치는 불필요한 코딩을 줄일 수 있다.
도 11 은 본 발명의 또다른 실시예에 따른 프리셋 정보를 포함하는 데이터 영역의 신택스(syntax)를 표현하는 구문이다. 도 11 을 참조하면, 프리셋 정보는 오브젝트의 수(numObjects)를 근거로 하여 오브젝트별로 출력채널(numRenderingChannel[i])에 매핑되는 정보들을 전송할 수 있다. 도 11 에 나타난 바와 같이, 프리셋 정보는 비트스트림의 데이터 영역으로부터 획득할 수 있으나, 데이터 영역 확장영역에 포함된 경우에는 데이터 영역 확장영역(SAOCExtensionFrame()), 비트스트림의 구성정보 영역에 포함된 경우에는 구성정보 영역으로부터 획득할 수 있다.
도 12 는 본 발명의 또다른 실시예에 따른 오디오 신호 처리 장치(1200)를 나타내는 것이다. 오디오 신호 처리 장치(1200)는 크게 프리셋 모드 생성부(1210), 정보 수신부(미도시), 프리셋 모드 입력부(1220), 프리셋 모드 선택부(1230), 변동 프리셋 모드 수신부(1240), 고정 프리셋 모드 수신부(1250), 렌더링부(1260) 및 디스플레이부(1270)를 포함한다.
도 12 의 프리셋 모드 생성부(1210), 정보 수신부(미도시), 변동 프리셋 모드 수신부(1240), 고정 프리셋 모드 수신부(1250) 및 렌더링부(1260)는 도 3 의 프리셋 모드 생성부(310), 변동 프리셋 모드 수신부(320), 고정 프리셋 모드 수신부(330) 및 렌더링부(340)와 그 구성과 기능이 동일하므로 상세한 설명은 생략하기로 한다.
도 12 를 참조하면, 프리셋 모드 입력부(1220)는 프리셋 메타데이터 생성부(1212)로부터 수신한 복수개의 프리셋 메타데이터를 먼저 디스플레이부(1270)의 화면에 현시하고, 이들 중 하나의 프리셋 메타데이터를 선택하는 선택 신호를 입력받는다. 프리셋 모드 선택부(1230)는 상기 선택 신호에 의하여 선택된 하나의 프리셋 메타데이터와 상기 프리셋 메타데이터에 대응되는 프리셋 정보를 선택한다. 이때, 프리셋 속성 결정부(1211)로부터 수신되는 프리셋 속성 정보(preset_attribute_information)가 프리셋 정보가 데이터 영역에 포함됨을 나타내는 경우, 프리셋 모드 선택부(1230)에서 선택된 프리셋 메타데이터와 상기 프리셋 메타데이터와 대응하는 프리셋 정보를 변동 프리셋 모드 수신부(1240)의 프리셋 메타데이터 수신부(1241) 및 프리셋 정보 수신부(1242)에 각각 입력한다. 이 경우, 디스플레이부(1270), 프리셋 모드 입력부(1220) 및 프리셋 모드 선택부(1230)는 데이터 영역의 수만큼 반복하여 상기 동작을 수행할 수 있다.
반면, 프리셋 속성 결정부(1211)로부터 수신되는 프리셋 속성 정보가 프리셋 정보가 구성정보 영역에 포함됨을 나타내는 경우, 프리셋 모드 선택부(1220)에서 선택된 프리셋 메타데이터와 상기 프리셋 메타데이터와 대응하는 프리셋 정보를 고정 프리셋 모드 수신부(1250)의 프리셋 메타데이터 수신부(1251) 및 프리셋 정보 수신부(1252)에 각각 입력한다.
또한, 선택된 프리셋 정보는 렌더링부(1260)로 출력되는 반면, 선택된 프리셋 메타데이터는 디스플레이부(1270)로 출력되어 화면에 현시된다. 디스플레이부(1270))는 프리셋 모드 입력부(1220)가 선택 신호를 입력받을 수 있도록 복수 개의 프리셋 메타데이터를 표시하는 유닛과 동일한 유닛일 수 있고, 각각 다른 유닛으로 구성될 수도 있다. 디스플레이부(1270)와 프리셋 모드 입력부(1220)를 위하여 프리셋 메타데이터를 표시하는 디스플레이부가 동일한 유닛을 이용하는 경우, 화면에 표시되는 설명(예를 들어, 프리셋 모드를 선택해 주세요, 프리셋 모드 X 이 선택되었습니다 등), 시각적 객체, 글자 등을 다르게 구성함으로써 각각의 동작을 구별할 수 있다.
도 13 은 오디오 신호 처리 장치(1200)의 디스플레이부(1270)의 일예를 나타내는 것이다. 디스플레이부(1270)는 선택된 프리셋 메타데이터뿐만 아니라, 상기 프리셋 메타데이터에 대응하는 프리셋 정보를 이용하여 조절된 오브젝트들의 레벨 또는 위치를 나타내는 하나 이상의 도식적인 객체들을 포함할 수 있다. 도 13 을 참조하면, 먼저, 도 12 의 디스플레이부(1270)에 표시된 복수개의 프리셋 메타데이터(예를 들어, 경기장 모드, 동굴 모드, 뉴스 모드, 라이브 모드 등) 중에서 프리셋 모드 선택부(1230)를 통하여 뉴스 모드가 선택된 경우, 뉴스 모드에 대응하는 프리셋 정보가 다운믹스 신호에 포함된 각 오브젝트에 적용된다. 이 때, 보컬의 레벨은 증가하고, 다른 오브젝트들(기타, 바이올린, 드럼,...첼로)의 레벨은 감소될 것이다. 디스플레이부(1270)에 포함된 상기 도식적 객체는 상기 오브젝트의 레벨 또는 위치의 활성화 또는 변화를 나타내기 위하여 변형된다. 예를 들어, 도 13 에 나타난 바와 같이, 보컬을 나타내는 도식적 객체의 스위치는 오른쪽으로 이동하고, 다른 오브젝트들을 나타내는 도식적 객체의 스위치는 왼쪽으로 이동할 수 있다.
상기 도식적 객체는 여러가지 방법으로 프리셋 정보를 이용하여 조절된 오브젝트의 레벨 또는 위치를 나타낼 수 있다. 각 오브젝트를 나타내는 도식적 객체는 하나 이상일 수 있으며, 이 때, 제 1 도식적 객체는 상기 프리셋 정보를 적용하기 이전의 오브젝트의 레벨 또는 위치를 나타내고, 제 2 도식적 객체는 상기 프리셋 정보를 적용하여 조절된 상기 오브젝트의 레벨 또는 위치를 나타낼 수 있다. 이 경우, 용이하게 프리셋 정보를 적용하기 전, 후의 오브젝트의 레벨 또는 위치를 비교할 수 있으므로, 프리셋 정보가 각 오브젝트를 어떻게 조절하는지 쉽게 알 수 있게 한다.
도 14 는 프리셋 정보가 적용된 오브젝트들을 나타내는 또다른 형상의 하나 이상의 도식적 객체를 나타내는 것이다. 도 14 를 참조하면, 제 1 도식적 객체는 바(bar) 형태이고, 제 2 도식적 객체는 상기 제 1 도식적 객체 내부에 뻗은 선(extensive line)으로 나타날 수 있다. 이 때, 제 1 도식적 객체는 프리셋 정보를 적용하기 이전의 오브젝트의 레벨 또는 위치를 나타내고, 제 2 도식적 객체는 프리셋 정보를 적용하여 조절된 오브젝트의 레벨 또는 위치를 나타낸다.
도 14 에 나타난 바와 같이, 상단의 도식적 객체들은 프리셋 정보가 적용되기 이전의 오브젝트의 레벨이 적용된 후의 오브젝트의 레벨과 동일한 경우를 나타낸다. 중앙의 도식적 객체들은 프리셋 정보가 적용되어 조절된 오브젝트의 레벨이 적용전보다 클 때를 나타내며, 하단의 도식적 객체들은 프리셋 정보가 적용됨으로써 오브젝트의 레벨이 감소된 경우를 나타낸다.
이와 같이, 프리셋 정보를 적용하기 이전과 적용한 후의 오브젝트의 레벨 또는 위치를 나타내는 하나 이상의 도식적 객체들을 사용함으로써, 프리셋 정보가 각 오브젝트를 어떻게 조절하는지 쉽게 알 수 있게 한다. 또한, 프리셋 정보의 특징을 용이하게 파악할 수 있으므로, 필요에 따라 사용자가 적절한 프리셋 모드를 선택하는데 도움을 줄 수 있다.
도 15 는 본 발명의 일실시예에 따른 프리셋 정보 수신부와 프리셋 메타데이터 수신부가 포함된 변동 프리셋 모드 수신부 및 고정 프리셋 모드 수신부가 구현된 제품의 개략적인 구성을 보여주는 도면이고, 도 16 는 본 발명의 실시예에 따른 변동 프리셋 모드 수신부 및 고정 프리셋 모드 수신부가 구현된 제품들의 관계를 보여주는 도면이다.
도 15 를 참조하면, 유무선 통신부 유무선 통신부(1510)는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(1510)는 유선통신부(1511), 적외선통신부(1512), 블루투스부(1513), 무선랜통신부(1514) 중 하나 이상을 포함할 수 있다.
사용자 인증부는(1520)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부(1521), 홍채인식부(1522), 얼굴인식부(1523), 및 음성인식부(1524) 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다.
입력부(1530)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부(1531), 터치패드부(1532), 리모컨부(1533) 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 한편, 후술한 메타데이터 수신부(1541)에서 출력되는 복수개의 프리셋 정보에 대한 프리셋 메타데이터가 디스플레이부(1562)를 통하여 화면에 현시되는 경우에, 입력부(1530)를 통하여 사용자가 프리셋 메타데이터를 선택할 수 있고, 선택된 프리셋 메타데이터에 대한 정보가 제어부(1550)로 입력된다.
신호 디코딩부(1540)는 변동 프리셋 모드 수신부(1541) 및 고정 프리셋 모드 수신부(1542)를 포함하는데, 변동 프리셋 모드 수신부(1541)는 프리셋 속성 정보를 기초하여 각 데이터 영역에 대응하는 프리셋 정보 및 프리셋 메타데이터를 수신한다. 또한, 고정 프리셋 모드 수신부(1542)는 프리셋 속성 정보를 기초로 하여 모든 데이터 영역들에 대응하는 프리셋 정보 및 프리셋 메타데이터를 수신한다. 또한, 상기 프리셋 메타데이터는 메타데이터의 길이를 나타내는 프리셋 메타데이터 길이 정보를 기초로 하여 수신되고, 상기 프리셋 정보는 프리셋 정보가 존재하는지를 나타내는 프리셋 존재 정보, 프리셋 정보의 개수를 나타내는 프리셋 개수 정보 및 출력채널의 개수에 근거한, 예를 들어, 출력채널이 모노, 스테레오 및 멀티채널 중 하나임, 출력채널 정보에 기초하여 획득된다. 만일 프리셋 정보가 매트릭스로 표현된 경우, 출력채널 정보를 수신받아 이를 기초로 프리셋 매트릭스를 수신한다. 신호 디코딩부(1550)는 수신된 비트스트림, 프리셋 메타데이터, 및 프리셋 정보를 이용하여 오디오 신호를 디코딩하여 출력신호를 생성하고, 상기 프리셋 메타데이터를 텍스트 형태로 출력한다.
제어부(1550)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부(1540)와 출력부(1560)의 모든 프로세스를 제어한다. 상술한 바와 같이, 제어부(1550)에 입력부(1530)로부터 선택된 프리셋 메타데이터에 대한 정보가 입력 신호의 형태로 입력되고, 유무선 통신부(1510)로부터 프리셋 정보가 비트스트림의 어느 영역에 포함되는지를 나타내는 프리셋 속성 정보(preset_attribute_information)가 입력되는 경우, 변동 프리셋 모드 수신부(1541) 및 고정 프리셋 모드 수신부(1542)는 프리셋 속성 정보 및 입력 신호에 기초하여, 선택된 프리셋 메타데이터와 대응하는 프리셋 정보를 수신하고, 이를 이용하여 오디오 신호를 디코딩한다.
출력부(1560)는 신호 디코딩부(1540)에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 스피커부(1561) 및 디스플레이부(1562)를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 스피커부(1561)를 통하여 출력되고, 비디오 신호일 때 출력 신호는 디스플레이부(1562)를 통해 출력된다. 또한, 제어부(1550)로부터 선택된 프리셋 메타데이터를 디스플레이부(1562)를 통하여 화면에 현시한다.
도 16 는 도 15 에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 도시한 것으로서, 도 16a 를 참조하면, 제 1 단말(1610) 및 제 2 단말(1620)이 각 단말들은 유무선 통신부를 통해서 데이터 내지 비트스트림을 양방향으로 통신할 수 있음을 알 수 있다. 상기 유무선 통신부를 통해서 통신하는 데이터 또는 비트스트림은 본 발명의 도 2a 및 도 2b 의 비트스트림의 형태일 수 있고, 도 1 내지 도 15 를 참조하여 설명한 본 발명의 프리셋 속성 정보, 프리셋 정보, 프리셋 메타데이터 등을 포함하는 데이터일 수 있다. 도 16b 를 참조하면, 서버(1630) 및 제 1 단말(1640) 또한 서로 유무선 통신을 수행할 수 있음을 알 수 있다.
도 17 은 본 발명의 일실시예에 따른 메타데이터 수신부 및 프리셋 렌더링 데이터 수신부를 포함하는 프리셋 수신부가 구현된 방송신호 디코딩 장치(1700)의 개략적인 구성을 보여주는 도면이다.
도 17 을 참조하면, 디멀티플렉서(1720)는 튜너(1710)로부터 TV 방송과 관련된 데이터들을 수신한다. 수신된 데이터들은 디멀티플렉서(1720)에서 분리되고, 데이터 디코더(1730)를 통하여 디코딩된다. 한편, 디멀티플렉서(1720)에서 분리된 데이터들은 HDD 와 같은 저장매체(1750)에 저장될 수 있다. 디멀티플렉서(1720)에서 분리된 데이터들은 오디오 디코더(1741) 및 비디오 디코더(1742)를 포함하는 디코더(1740)로 입력되어 오디오 신호 및 비디오 신호를 디코딩한다. 오디오 디코더(1741)는 본 발명의 일실시예에 따른 변동 프리셋 모드 수신부(1741A) 및 고정 프리셋 모드 수신부(1741B)를 포함하는데, 변동 프리셋 모드 수신부(1741A)는 프리셋 속성 정보를 기초하여 각 데이터 영역에 대응하는 프리셋 정보 및 프리셋 메타데이터를 수신한다. 또한, 고정 프리셋 모드 수신부(1741B)는 프리셋 속성 정보를 기초로 하여 모든 데이터 영역들에 대응하는 프리셋 정보 및 프리셋 메타데이터를 수신한다. 또한, 상기 프리셋 메타데이터는 메타데이터의 길이를 나타내는 프리셋 메타데이터 길이 정보를 기초로 하여 수신되고, 상기 프리셋 정보는 프리셋 정보가 존재하는지를 나타내는 프리셋 존재 정보, 프리셋 정보의 개수를 나타내는 프리셋 개수 정보 및 출력채널이 모노, 스테레오 및 멀티채널 중 하나임을 나타내는 출력채널 정보에 기초하여 획득된다. 만일 프리셋 정보가 매트릭스로 표현된 경우, 출력채널 정보를 수신받아 이를 기초로 프리셋 매트릭스를 수신한다. 신호 디코딩부(1741)는 수신된 비트스트림, 프리셋 메타데이터, 및 프리셋 정보를 이용하여 오디오 신호를 디코딩하여 출력신호를 생성하고, 상기 프리셋 메타데이터를 텍스트 형태로 출력한다.
디스플레이부(1770)는 비디오 디코더(1742)에서 출력된 비디오 신호와 오디오 디코더(1741)에서 출력된 프리셋 메타데이터를 화면에 현시한다. 또한, 디스플레이부(1770)는 스피커부(미도시)를 포함하고, 오디오 디코더(1741)에서 출력되는 오브젝트의 레벨이 프리셋 정보를 이용하여 조절된 오디오 신호를 디스플레이부(1770)에 포함된 스피커부를 통하여 출력한다. 또한, 디코더(1740)에서 디코딩된 데이터들은 HDD 와 같은 저장매체(1750)에 저장될 수 있다.
한편, 신호 디코딩 장치(1700)는 사용자로부터 정보를 입력받아 수신된 데이터들을 제어할 수 있는 애플리케이션 매니저(1760)를 더 포함할 수 있다. 애플리케이션 매니저(1760)는 유저 인터페이스 매니저(1761) 및 서비스 매니저(1762)를 포함하는데, 유저 인터페이스 매니저(1761)는 사용자로부터 정보를 입력받기 위한 인터페이스(interface)를 제어한다. 예를 들면, 디스플레이부(1770)에 현시되는 텍스트의 글자체, 화면의 밝기, 메뉴 구성 등을 제어할 수 있다. 한편, 서비스 매니저(1762)는 디코더(1740) 및 디스플레이부(1770)에서 방송신호를 디코딩하여 출력하는 경우, 수신되는 방송신호를 사용자로부터 입력되는 정보를 이용하여 제어할 수 있다. 예를 들면, 방송채널의 설정, 알람 기능 설정, 성인인증 기능 등을 제공할 수 있다. 애플리케이션 매니저(1760)에서 출력되는 데이터들은 디코더(1740)뿐만 아니라, 디스플레이부(1770)로도 전송되어 이용가능하다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 오디오 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.
도 1 은 본 발명의 일실시예에 따른 다운믹스 신호에 포함된 오브젝트에 적용되는 프리셋 모드의 개념도이다.
도 2a 및 도 2b 는 본 발명의 일실시예에 따른 프리셋 속성 정보에 따라 프리셋 정보를 적용하여 다운믹스 신호에 포함된 오브젝트를 조절하는 개념도이다.
도 3 은 본 발명의 일실시예에 따른 오디오 신호 처리 장치를 나타내는 것이다.
도 4a 및 도 4b 는 본 발명의 일실시예에 따라 프리셋 정보가 렌더링부에 적용되는 방법을 나타내는 블록도이다.
도 5 는 본 발명의 다른 실시예에 따른 변동 프리셋 정보 수신부 및 고정 프리셋 정보 수신부의 개략적인 구성을 보여주는 블록도이다.
도 6 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 장치를 도시한 것이다.
도 7 내지 도 11 은 본 발명의 다른 일실시예에 따른 오디오 신호 처리 방법 중 프리셋 정보와 관련된 신택스(syntax)를 여러가지 방법으로 표현한 것이다.
도 12 는 본 발명의 또다른 실시예에 따른 오디오 신호 처리 장치를 나타내는 것이다.
도 13 은 본 발명의 또다른 실시예에 따른 오디오 신호 처리 장치의 디스플레이부의 일예를 나타내는 것이다.
도 14 는 본 발명의 또다른 실시예에 따라 프리셋 정보가 적용된 오브젝트들 을 표시하는 하나 이상의 도식적 객체를 나타내는 것이다.
도 15 는 본 발명의 또다른 실시예에 따른 변동 프리셋 정보 수신부와 고정 프리셋 모드 수신부가 구현된 구현된 제품의 개략적인 구성을 보여주는 것이다.
도 16a 및 도 16b 는 본 발명의 또다른 실시예에 따른 변동 프리셋 모드 수신부 및 고정 프리셋 모드 수신부가 구현된 제품들의 관계를 보여주는 것이다.
도 17 은 본 발명의 또다른 일실시예에 따른 변동 프리셋 모드 수신부 및 고정 프리셋 모드 수신부가 구현된 방송신호 디코딩 장치의 개략적인 구성을 보여주는 것이다.

Claims (13)

  1. 하나 이상의 오브젝트와 복수 개의 데이터 영역을 포함하는 다운믹스 신호 및 오브젝트의 속성에 기반한 오브젝트 정보를 수신하는 단계;
    상기 오브젝트의 속성에 기반한 오브젝트 정보는 상기 다운믹스 신호를 렌더링하기 위하여 프리셋 정보와 프리셋 속성 정보를 포함하며, 상기 프리셋 속성정보는 상기 프리셋 정보가 상기 다운믹스 신호의 하나의 데이터 영역에 적용되는지 모든 데이터 영역에 적용되는지를 나타내고,
    상기 오브젝트 정보는 구성 정보 영역과 복수 개의 데이터 영역으로 분리되는 것으로, 상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 상기 구성정보 영역의 확장영역에 포함된 경우,
    상기 다운믹스 신호의 모든 데이터 영역들에 대하여 상기 프리셋 정보를 적용함으로써 상기 다운믹스 신호를 렌더링하는 단계; 및
    상기 프리셋 속성 정보에 기초하여 프리셋 정보가 상기 데이터 영역의 확장영역에 포함된 경우,
    상기 프리셋 정보를 상기 데이터 영역에 대응하는 상기 다운믹스 신호의 하나의 데이터 영역에 적용함으로써 상기 다운믹스 신호를 렌더링하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 프리셋 정보는 상기 오브젝트의 개수 및 출력 채널의 개수에 근거한 프리셋 매트릭스로 구성되는 것을 특징으로 하는 오디오 신호 처리 방법.
  3. 제 1 항에 있어서,
    상기 프리셋 속성 정보는 상기 프리셋 정보가 변동 또는 고정인지를 나타내는 것을 특징으로 하는 오디오 신호 처리 방법.
  4. 제 3 항에 있어서,
    상기 변동은 상기 프리셋 정보가 상기 데이터 영역의 확장영역에 존재함을 나타내고, 상기 고정은 상기 프리셋 정보가 상기 구성정보 영역의 확장영역에 존재함을 나타내는 것을 특징으로 하는 오디오 신호 처리 방법.
  5. 제 1 항에 있어서,
    상기 오브젝트 정보 및 상기 프리셋 정보를 이용하여, 상기 다운믹스 신호의 패닝 또는 게인을 조절하는 다운믹스 처리 정보 및 상기 다운믹스 신호를 업믹싱하기 위한 멀티채널 정보를 생성하는 단계; 및
    상기 다운믹스 처리 정보를 이용하여 상기 다운믹스 신호를 수정하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  6. 하나 이상의 오브젝트와 복수 개의 데이터 영역을 포함하는 다운믹스 신호 및
    상기 다운믹스 신호를 렌더링하기 위하여 프리셋 정보 및 프리셋 속성정보를 포함하고, 상기 오브젝트의 속성에 기반한, 구성 정보 영역과 복수 개의 데이터 영역으로 분리되는, 오브젝트 정보를 수신하는 신호 수신부;
    상기 프리셋 정보가 다운믹스 신호의 하나의 데이터 영역에 적용되는지 모든 데이터 영역에 적용되는지를 나타내는 프리셋 속성 정보 수신부;
    상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 상기 구성정보 영역의 확장영역에 포함된 경우, 상기 다운믹스 신호의 모든 데이터 영역들에 대응하는 프리셋 모드를 수신하는 고정 프리셋 모드 수신부;
    상기 프리셋 속성 정보에 기초하여 상기 프리셋 정보가 상기 데이터 영역의 확장영역에 포함된 경우, 상기 다운믹스 신호의 하나의 데이터 영역에 대응하는 프리셋 모드를 수신하는 변동 프리셋 모드 수신부; 및
    상기 프리셋 정보를 상기 다운믹스 신호의 하나의 데이터 영역 또는 모든 데이터 영역들에 적용하여 렌더링하는 렌더링부를 포함하고,
    상기 프리셋 모드는 상기 프리셋 정보 및 상기 프리셋 정보에 대응하는 프리셋 메타데이터를 포함하고, 상기 프리셋 메타데이터는 상기 프리셋 정보의 특성을 나타내는 것을 특징으로 하는 오디오 신호 처리 장치.
  7. 제 6 항에 있어서, 상기 고정 프리셋 모드 수신부는,
    상기 프리셋 정보를 수신하는 고정 프리셋 정보 수신부; 및
    상기 프리셋 메타데이터를 수신하는 고정 프리셋 메타데이터 수신부를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
  8. 제 6 항에 있어서, 상기 변동 프리셋 모드 수신부는,
    상기 프리셋 정보를 수신하는 변동 프리셋 정보 수신부; 및
    상기 프리셋 메타데이터를 수신하는 변동 프리셋 메타데이터 수신부를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
  9. 제 6 항에 있어서, 상기 렌더링부는,
    상기 다운믹스 신호의 데이터 영역을 렌더링하는 상기 복수개의 데이터 영역 렌더링부들을 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
  10. 제 9 항에 있어서, 상기 데이터 영역 렌더링부들은,
    상기 고정 프리셋 모드 수신부로부터 상기 프리셋 정보를 수신받는 경우, 상기 프리셋 정보를 상기 복수개의 데이터 영역 렌더링부들에 적용하는 것을 특징으로 하는 오디오 신호 처리 장치.
  11. 제 9 항에 있어서, 상기 데이터 영역 렌더링부들은,
    상기 변동 프리셋 모드 수신부로부터 상기 프리셋 정보를 수신받는 경우, 상기 프리셋 정보와 대응하는 하나의 데이터 영역 렌더링부에 상기 프리셋 정보를 적용하는 것을 특징으로 하는 오디오 신호 처리 장치.
  12. 삭제
  13. 삭제
KR1020090032213A 2008-04-16 2009-04-14 오디오 신호 처리 방법 및 이의 장치 KR101062351B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN200980113620.3A CN102007533B (zh) 2008-04-16 2009-04-16 用于处理音频信号的方法和装置
JP2011504928A JP5406276B2 (ja) 2008-04-16 2009-04-16 オーディオ信号の処理方法及び装置
US12/424,990 US8326446B2 (en) 2008-04-16 2009-04-16 Method and an apparatus for processing an audio signal
ES09005420.6T ES2525719T3 (es) 2008-04-16 2009-04-16 Método y aparato para procesar una señal de audio
EP09005420.6A EP2111062B1 (en) 2008-04-16 2009-04-16 A method and an apparatus for processing an audio signal
PCT/KR2009/001980 WO2009128662A2 (en) 2008-04-16 2009-04-16 A method and an apparatus for processing an audio signal

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US4528708P 2008-04-16 2008-04-16
US61/045,287 2008-04-16
US4856108P 2008-04-29 2008-04-29
US61/048,561 2008-04-29

Publications (2)

Publication Number Publication Date
KR20090110233A KR20090110233A (ko) 2009-10-21
KR101062351B1 true KR101062351B1 (ko) 2011-09-05

Family

ID=40689336

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020090032216A KR101061128B1 (ko) 2008-04-16 2009-04-14 오디오 신호 처리 방법 및 이의 장치
KR1020090032213A KR101062351B1 (ko) 2008-04-16 2009-04-14 오디오 신호 처리 방법 및 이의 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020090032216A KR101061128B1 (ko) 2008-04-16 2009-04-14 오디오 신호 처리 방법 및 이의 장치

Country Status (7)

Country Link
US (1) US8340798B2 (ko)
EP (1) EP2111061B1 (ko)
KR (2) KR101061128B1 (ko)
AT (1) ATE479293T1 (ko)
DE (1) DE602009000136D1 (ko)
ES (2) ES2527517T3 (ko)
WO (1) WO2009128664A2 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
GB201315524D0 (en) * 2013-08-30 2013-10-16 Nokia Corp Directional audio apparatus
US10878828B2 (en) * 2014-09-12 2020-12-29 Sony Corporation Transmission device, transmission method, reception device, and reception method
KR101993348B1 (ko) * 2014-09-24 2019-06-26 한국전자통신연구원 동적 포맷 변환을 지원하는 오디오 메타데이터 제공 장치 및 오디오 데이터 재생 장치, 상기 장치가 수행하는 방법 그리고 상기 동적 포맷 변환들이 기록된 컴퓨터에서 판독 가능한 기록매체
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
US11622219B2 (en) * 2019-07-24 2023-04-04 Nokia Technologies Oy Apparatus, a method and a computer program for delivering audio scene entities

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100802179B1 (ko) 2005-12-08 2008-02-12 한국전자통신연구원 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US174548A (en) * 1876-03-07 Improvement in ranges
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
JP2002191099A (ja) * 2000-09-26 2002-07-05 Matsushita Electric Ind Co Ltd 信号処理装置
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
SE0400997D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
RU2407073C2 (ru) * 2005-03-30 2010-12-20 Конинклейке Филипс Электроникс Н.В. Кодирование многоканального аудио
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
WO2007040361A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
JP4987282B2 (ja) * 2005-10-25 2012-07-25 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2007049881A1 (en) 2005-10-26 2007-05-03 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
KR100891666B1 (ko) 2006-09-29 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
EP2071564A4 (en) 2006-09-29 2009-09-02 Lg Electronics Inc METHOD AND DEVICES FOR CODING AND DECODING OBJECT-BASED AUDIO SIGNALS
EP2575129A1 (en) 2006-09-29 2013-04-03 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100802179B1 (ko) 2005-12-08 2008-02-12 한국전자통신연구원 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법

Also Published As

Publication number Publication date
ATE479293T1 (de) 2010-09-15
EP2111061B1 (en) 2010-08-25
WO2009128664A3 (en) 2010-01-07
US8340798B2 (en) 2012-12-25
DE602009000136D1 (de) 2010-10-07
ES2525719T3 (es) 2014-12-29
ES2527517T3 (es) 2015-01-26
EP2111061A1 (en) 2009-10-21
KR20090110233A (ko) 2009-10-21
KR20090110234A (ko) 2009-10-21
US20090265023A1 (en) 2009-10-22
KR101061128B1 (ko) 2011-08-31
WO2009128664A2 (en) 2009-10-22

Similar Documents

Publication Publication Date Title
KR101171314B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
KR101061129B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
JP5258967B2 (ja) オーディオ信号の処理方法及び装置
JP5249408B2 (ja) オーディオ信号の処理方法及び装置
KR100998913B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
WO2009093867A2 (en) A method and an apparatus for processing audio signal
KR101062351B1 (ko) 오디오 신호 처리 방법 및 이의 장치
JP5406276B2 (ja) オーディオ信号の処理方法及び装置
EP2111062B1 (en) A method and an apparatus for processing an audio signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140724

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150724

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160722

Year of fee payment: 6