KR101024924B1 - 오디오 신호의 처리 방법 및 이의 장치 - Google Patents

오디오 신호의 처리 방법 및 이의 장치 Download PDF

Info

Publication number
KR101024924B1
KR101024924B1 KR1020090005506A KR20090005506A KR101024924B1 KR 101024924 B1 KR101024924 B1 KR 101024924B1 KR 1020090005506 A KR1020090005506 A KR 1020090005506A KR 20090005506 A KR20090005506 A KR 20090005506A KR 101024924 B1 KR101024924 B1 KR 101024924B1
Authority
KR
South Korea
Prior art keywords
preset
information
matrix
audio signal
output channel
Prior art date
Application number
KR1020090005506A
Other languages
English (en)
Other versions
KR20090081341A (ko
Inventor
오현오
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to EP09000955A priority Critical patent/EP2083585B1/en
Priority to CN2009801029907A priority patent/CN101926094B/zh
Priority to DE602009000167T priority patent/DE602009000167D1/de
Priority to AT09000955T priority patent/ATE481830T1/de
Priority to US12/358,982 priority patent/US8615316B2/en
Priority to JP2010544229A priority patent/JP5319704B2/ja
Priority to PCT/KR2009/000367 priority patent/WO2009093867A2/en
Priority to MX2010007997A priority patent/MX2010007997A/es
Priority to CA2712941A priority patent/CA2712941C/en
Priority to AU2009206856A priority patent/AU2009206856B2/en
Priority to RU2010134915/08A priority patent/RU2450440C1/ru
Publication of KR20090081341A publication Critical patent/KR20090081341A/ko
Application granted granted Critical
Publication of KR101024924B1 publication Critical patent/KR101024924B1/ko
Priority to US14/133,249 priority patent/US9319014B2/en
Priority to US15/077,765 priority patent/US9787266B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/40Visual indication of stereophonic sound image
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Circuits Of Receivers In General (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 적어도 하나의 오브젝트를 포함하는 오디오 신호 및 프리셋 정보를 수신하는 단계; 상기 프리셋 정보에서 프리셋 매트릭스를 획득하는 단계; - 여기서, 상기 프리셋 매트릭스는 상기 오브젝트의 출력 채널 포함 정도를 나타냄-, 상기 프리셋 매트릭스를 이용하여, 출력채널에 따라 상기 오브젝트의 출력레벨을 조절하는 단계; 및 상기 출력레벨이 조절된 오브젝트를 포함하는 오디오 신호를 출력하는 단계를 포함하되, 상기 프리셋 정보는 상기 프리셋 정보가 포함되었는지를 나타내는 프리셋 존재 정보 및 상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보에 근거하여 획득되고, 상기 프리셋 매트릭스는 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보에 근거하여 획득되는 것을 특징으로 하는 오디오 신호 처리 방법 및 이의 장치가 개신된다.
Figure R1020090005506
프리셋 정보, 프리셋 렌더링 데이터, 프리셋 매트릭스.

Description

오디오 신호의 처리 방법 및 이의 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}
본 발명은 오디오 신호의 처리 방법 및 장치에 관한 것으로, 보다 상세하게는 디지털 매체, 방송 신호 등으로 수신된 오디오 신호를 처리할 수 있는 오디오 신호의 처리 방법 및 장치에 관한 것이다.
복수 개의 오브젝트들을 포함하는 오디오 신호를, 모노 또는 스트레오 신호로 다운믹스하여 다운믹스 신호를 생성하는 과정에 있어서, 오브젝트들로부터 파라미터들이 추출된다. 이러한 파라미터들은 다운믹스된 신호를 디코딩하는 과정에서 사용되는데, 오브젝트들의 패닝(panning)과 게인(gain)은 유저의 선택에 의하여 컨트롤 될 수 있다.
다운믹스 신호에 포함되어 있는 오브젝트들은 사용자의 선택에 의하여 적절히 조절되어야 한다. 그러나, 사용자가 오브젝트를 제어하는 경우, 직접 오브젝트를 제어하여야 하는 번거로움이 있고, 전문가에 의하여 제어되는 것에 비하여 복수의 오브젝트들을 포함하는 오디오 신호를 환경에 따라 최적의 상태를 재현하는데 어려움이 있을 수 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 프리셋 메타데이터와 프리셋 렌더링 파라미터를 포함하는 프리셋 정보를 이용하여, 오디오 신호에 포함된 오브젝트를 조절할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 프리셋 데이터 타입이 매트릭스인 경우, 오디오 신호의 출력채널 정보에 기초하여 프리셋 메타데이터와 대응하는 프리셋 매트릭스를 결정하고 오디오 신호에 적용함으로써, 출력채널에서의 오브젝트의 레벨을 조절하는 오디오 신호 처리 방법 및 장치를 제공하는데 있다.
또한, 본 발명의 또 다른 목적은, 오브젝트를 조절하는 프리셋 렌더링 매트릭스를 인코더에서 전송된 모노 타입 프리셋 매트릭스 또는 게인 정보로부터 단계적으로 생성하는 오디오 신호 처리 방법 및 장치를 제공하는데 있다.
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 오브젝트들에 대한 사용자의 설정없이, 기설정된 프리셋 정보중 하나를 선택함으로써 손쉽게 오브젝트의 출력채널의 레벨을 조절할 수 있다.
둘째, 프리셋 정보를 표현하는 프리셋 메타데이터를 메타데이터의 길이를 나타내는 프리셋 길이 정보에 기초하여 텍스트 형태로 표현함으로써, 불필요한 코딩을 줄일 수 있다.
셋째, 프리셋 렌더링 데이터의 타입이 매트릭스인 경우, 오디오 신호의 출력채널 정보에 기초하여 프리셋 렌더링 데이터를 나타내는 프리셋 매트릭스를 결정함으로써, 오브젝트의 출력채널의 레벨을 보다 정확하게 효율적으로 조절할 수 있다.
넷째, 프리셋 매트릭스를 단계적으로 생성함으로써, 인코더로부터 전송되는 비트율을 감소시킬 수 있다.
다섯째, 복수개의 오브젝트들 중 일부의 오브젝트만을 조절할 수 있는 프리셋 매트릭스를 이용함으로써, 불필요한 코딩을 감소시킬 수 있다.
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 적어도 하나의 오브젝트를 포함하는 오디오 신호 및 프리셋 정보를 수신하는 단계; 상기 프리셋 정보에서 프리셋 매트릭스를 획득하는 단계로서, 상기 프리셋 매트릭스는 상기 오브젝트의 출력 채널 포함 정도를 나타는 것인 단계; 상기 프리셋 매트릭스를 이용하여, 출력채널에 따라 상기 오브젝트의 출력레벨을 조절하는 단계; 및 상기 출력레벨이 조절된 오브젝트를 포함하는 오디오 신호를 출력하는 단 계를 포함하되, 상기 프리셋 정보는 상기 프리셋 정보가 포함되었는지를 나타내는 프리셋 존재 정보 및 상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보에 근거하여 획득되고, 상기 프리셋 매트릭스는 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보에 근거하여 획득되는 것을 포함한다.
본 발명에 따르면, 상기 프리셋 매트릭스는 상기 출력채널이 모노, 스테레오 및 멀티채널 중 하나인 것을 나타내는 출력채널정보에 근거하여 획득되는 것을 특징으로 한다.
본 발명에 따르면, 상기 프리셋 타입 정보는 1비트로 표현되는 것을 특징으로 한다.
본 발명에 따르면, 상기 프리셋 매트릭스의 차원은 상기 오브젝트의 개수 및 상기 출력채널의 개수에 근거하여 결정되는 것을 특징으로 한다.
본 발명의 또다른 측면에 따른 오디오 신호 처리 장치에 따르면, 적어도 하나의 오브젝트를 포함하는 오디오 신호를 수신하는 오디오 신호 수신부; 프리셋 정보의 프리셋 메타데이터를 획득하는 프리셋 메타데이터 수신부; 상기 오브젝트의 출력 채널 포함 정도를 나타내는 프리셋 매트릭스를 획득하는 프리셋 렌더링 데이터 수신부로서, 상기 프리셋 렌더링 데이터 수신부는 상기 프리셋 메타데이터에 대응하는 상기 프리셋 매트릭스인 프리셋 렌더링 데이터 수신부; 상기 프리셋 메타데이터를 표시하는 디스플레이부; 상기 프리셋 메타데이터 중 하나를 선택하는 신호를 수신하는 입력부; 상기 선택된 프리셋 메타데이터에 대응하는 상기 프리셋 매트릭스를 이용하여 출력채널에 따라 상기 오브젝트의 출력레벨을 조절하는 오브젝트 조절부; 및 상기 출력레벨이 조절된 오브젝트를 포함하는 오디오 신호를 출력하는 출력부를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 상기 출력부가 상기 오디오 신호를 출력하는 경우, 상기 디스플레이부는 상기 선택된 프리셋 메타데이터를 표시하는 것을 특징으로 한다.
본 발명에 따르면, 상기 디스플레이부는 상기 오브젝트의 출력레벨을 더 표시하는 것을 특징으로 한다.
본 발명에 따르면, 상기 프리셋 매트릭스는 상기 출력채널이 모노, 스테레오 및 멀티채널 중 하나인 것을 나타내는 출력채널정보에 근거하여 획득되는 것을 특징으로 한다.
본 발명에 따르면, 상기 프리셋 정보는 상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보에 근거하여 획득되고, 상기 프리셋 매트릭스는 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보에 근거하여 획득되는 것을 특징으로 한다.
본 발명에 따르면, 상기 프리셋 정보는 상기 오브젝트에 적용되는 상기 프리셋 매트릭스의 존재여부를 나타내는 프리셋 오브젝트 적용 정보를 더 포함하는 것을 특징으로 한다.
본 발명에 따르면, 상기 디스플레이부는 상기 프리셋 오브젝트 적용 정보에 기초하여 상기 오브젝트에 적용되는 상기 프리셋 매트릭스가 존재하는지를 더 표시하는 것을 특징으로 한다.
본 발명에 따르면, 상기 디스플레이부는 상기 프리셋 메타데이터를 텍스트 형태로 표현하는 것을 특징으로 한다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.  이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameters), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로 해석되고, 오브젝트(object)는 기타(guitar), 보컬(vocal), 피아노(piano) 등 오디오 신호를 구성하는 소스(source) 신호 각각을 나타내는 것으로 해석되며, 경우에 따라 그 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
본 발명은 복수개의 오브젝트들을 포함하는 오디오 신호를 디코딩하는 방법에 있어서, 상기 오브젝트를 조절하기 위한 기설정된 정보 중 하나를 이용함으로써 상기 오디오 신호를 효과적으로 디코딩하는 방법을 제공한다.
도 1은 본 발명의 실시예에 따른 오디오 신호에 포함된 오브젝트에 적용되는 프리셋 정보의 개념도이다. 상기 오브젝트를 조절하기 위한 기설정된 정보를 본 명세서에서 프리셋 정보(preset information)이라고 지칭한다. 상기 프리셋 정보는 오디오 신호의 특성 또는 청취환경에 따라 선택할 수 있는 여러가지 모드를 나타낼 수 있고, 복수개일 수 있다. 또한, 상기 프리셋 정보는 프리셋 정보의 속성 등을 표현하기 위한 메타데이터(metadata)와 상기 오브젝트를 조절하기 위하여 적용되는 렌더링 데이터(rendering data)를 포함한다. 상기 메타데이터는 텍스트 형태로 표시될 수 있으며, 상기 프리셋 정보의 속성(예를 들면, 콘서트 홀 모드, 가라오케 모드, 뉴스 모드 등)을 나타낸 뿐만 아니라, 상기 프리셋 정보의 작성자, 작성날짜, 상기 프리셋 정보가 적용되는 오브젝트의 이름 등 상기 프리셋 정보를 표현하기 위한 관련 정보를 포함할 수 있다. 한편, 상기 렌더링 데이터는 실질적으로 상기 오브젝트에 적용되는 데이터로서, 다양한 형태를 가질 수 있고, 상세하게는 매트릭스 형태일 수 있다.
도 1을 참조하면, 프리셋 정보1(preset 1)은 음악 신호를 콘서트 홀에서 듣는 듯한 음장감을 제공하는 콘서트 홀 모드(concert hall mode)일 수 있고, 프리셋 정보2(preset 2)는 오디오 신호 중 보컬(vocal) 오브젝트의 레벨을 감소시킨 가라오케 모드(karaoke mode)일 수 있으며, 프리셋 정보n(preset n)는 음성 오브젝트의 레벨을 증가시킨 뉴스 모드(news mode) 일 수 있다. 또한, 프리셋 정보2(preset 2)는 메타데이터 2와 렌더링 데이터 2를 포함한다. 만일 사용자로부터 프리셋 정보2가 선택된 경우, 메타데이터 2인 가라오케 모드(karaoke mode)가 디스플레이부에 현시될 것이고, 메타데이터 2 와 관련된 렌더링 데이터 2가 오브젝트에 적용되 어 레벨을 조절할 수 있다.
이 때, 렌더링 데이터가 매트릭스 형태이면, 렌더링 데이터는 모노 매트릭스(mono matrix), 스테레오 매트릭스(stereo matrix), 멀티채널 매트릭스(multi-channl matrix)를 포함할 수 있다. 상기 모노 매트릭스는 상기 오브젝트의 출력채널이 모노인 경우 적용되는 렌더링 데이터이고, 상기 스테레오 매트릭스는 상기 오브젝트의 출력채널이 스테레오인 경우, 상기 멀티채널 매트릭스는 상기 오브젝트의 출력채널이 멀티채널인 경우 적용되는 렌더링 데이터이다. 상기 오브젝트의 출력채널이 결정되면, 이를 이용하여 매트릭스가 결정되고, 상기 매트릭스를 상기 오브젝트에 적용하여 레벨을 조절할 수 있다.
이와 같이, 상기 프리셋 정보에 포함된 상기 메타데이터와 상기 렌더링 데이터를 이용하여 상기 오브젝트를 조절하고 적용된 프리셋 정보의 속성 또는 특징을 표현함으로써 사용자가 원하는 효과를 갖는 오디오 신호를 효율적으로 제공할 수 있게 된다.
도 2는 본 발명의 실시예에 따른 오디오 신호 처리 장치(200)를 나타내는 것이다. 도 2를 참조하면, 오디오 신호 처리 장치(200)는 프리셋 정보 생성부(210), 프리셋 정보 수신부(220), 오브젝트 조절부(230)를 포함할 수 있다.
프리셋 정보 생성부(210)는 오디오 신호에 포함된 오브젝트를 조절하기 위한 프리셋 정보를 생성하며, 메타데이터 생성부(212) 및 프리셋 렌더링 데이터 생성부(214)를 포함할 수 있다. 메타데이터 생성부(212)는 상기 프리셋 정보를 표현하는 텍스트 정보를 입력받아 프리셋 메타데이터(preset meradata)를 생성할 수 있 다. 상기 프리셋 메타데이터는 상술한 바와 같이 상기 프리셋 정보의 특성 또는 속성을 표현하기 위한 정보일 수 있다. 이 때, 메타데이터 생성부(212)는 상기 프리셋 메타데이터의 글자 길이수를 나타내는 프리셋 길이 정보(preset length information)를 더 생성할 수 있다. 상기 프리셋 길이 정보는 바이트(byte)로 나타낼 수 있으나, 이에 한정하지는 아니한다.
한편, 상기 오브젝트의 레벨을 조절하기 위한 게인 및 오브젝트의 패닝(panning)을 위한 정보가 프리셋 렌더링 데이터 생성부(214)에 입력되는 경우, 상기 오브젝트에 적용되는 프리셋 렌더링 데이터(preset rendering data)를 생성할 수 있다. 상기 프리셋 렌더링 데이터는 오브젝트마다 생성될 수 있고, 다양한 타입으로 구현될 수 있으며, 예를 들면, 매트릭스 형태 등으로 구현된 프리셋 매트릭스(preset matrix) 일 수 있다. 또한, 프리셋 렌더링 데이터 생성부(214)는 상기 프리셋 렌더링 데이터가 매트릭스 형태로 구현되었는지를 나타내는 프리셋 타입 정보(preset_type_flag)를 더 생성할 수 있다. 또한, 상기 오브젝트의 출력채널이 몇 개인지를 나타내는 출력채널 정보(output channel information)를 더 생성할 수도 있다. 메타데이터 생성부(212)에서 생성된 프리셋 길이 정보와 프리셋 메타데이터 및 프리셋 렌더링 데이터 생성부(214)에서 생성된 프리셋 타입 정보, 출력채널 정보, 및 프리셋 렌더링 데이터는 하나의 비트스트림에 포함되어 전송될 수 있으며, 상세하게는 오디오 신호를 포함하는 비트스트림의 보조 영역(ancillary region)에 포함되어 전송될 수 있다.
한편, 프리셋 정보 생성부(210)는 상기 프리셋 길이 정보, 상기 프리셋 메타 데이터, 상기 프리셋 타입 정보, 상기 출력채널 정보, 및 상기 프리셋 렌더링 데이터가 비트스트림에 포함되었음을 나타내는 프리셋 존재 정보(preset exist information)를 더 생성할 수 있다. 상기 프리셋 존재 정보는 상기 프리셋 정보에 관한 정보들이 어느 영역에 포함되어 있는지를 나타내는 컨테이너 타입(container type)일 수 있고, 플래그 타입(flag type)일 수도 있으나, 이에 한정되지는 아니한다.
또한, 프리셋 정보 생성부(210)는 복수개의 프리셋 정보를 생성할 수 있고, 각각의 프리셋 정보는 상기 프리셋 길이 정보, 상기 프리셋 메타데이터, 상기 프리셋 타입 정보, 상기 출력채널 정보, 및 상기 프리셋 렌더링 데이터를 포함한다. 이 때, 프리셋 정보 생성부(210)는 상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보(preset number information)을 더 생성할 수 있다.
프리셋 정보 수신부(220)는 프리셋 정보 생성부(210)에서 생성되어 전송된 프리셋 정보를 수신하고, 메타데이터 수신부(222) 및 프리셋 렌더링 데이터 수신부(224)를 포함할 수 있다. 메타데이터 수신부(222)는 상기 프리셋 메타데이터를 수신하여 출력하고, 프리셋 렌더링 데이터 수신부(224)는 상기 프리셋 렌더링 데이터(예를 들면, 프리셋 매트릭스)를 수신하는데, 이와 관련된 상세한 설명은 도 3 및 도 4를 참조하여 상세히 후술하기로 한다.
오브젝트 조절부(230)는 복수개의 오브젝트들을 포함하는 오디오 신호와 프리셋 렌더링 데이터 수신부(224)에서 생성된 프리셋 렌더링 데이터를 입력받는다. 상기 프리셋 렌더링 데이터는 상기 오브젝트에 적용되어 상기 오브젝트의 레벨을 조절하거나 상기 오브젝트의 위치를 조절할 수 있다.
도 3은 본 발명의 오디오 신호 처리 장치(200)의 프리셋 정보 수신부(220)에 포함되는 메타데이터 수신부(310) 및 프리셋 렌더링 데이터 수신부(320)의 개략적인 구성을 보여주는 도면이다.
메타데이터 수신부(310)는 프리셋 길이 정보 수신부(312) 및 프리셋 메타데이터 수신부(314)를 포함한다. 프리셋 길이 정보 수신부(312)는 상기 프리셋 정보를 표현하기 위한 프리셋 메타데이터의 길이를 나타내는 프리셋 길이 정보(preset length information)을 수신하여, 상기 프리셋 메타데이터의 길이를 획득한다. 이후, 프리셋 메타데이터 수신부(314)는 상기 프리셋 길이 정보가 나타내는 길이만큼 비트스트림을 읽어서 상기 프리셋 메타데이터를 수신한다. 또한, 프리셋 메타데이터 수신부(314)는 상기 프리셋 정보의 종류 또는 속성을 알 수 있는 메타데이터인 상기 프리셋 메타데이터를 텍스트 형식으로 변환하여 출력한다.
프리셋 렌더링 데이터 수신부(320)는 프리셋 타입 플래그 수신부(322), 출력채널 정보 수신부(324), 및 프리셋 매트릭스 수신부(326)를 포함한다. 프리셋 데이터 타입 플래그 수신부(322)는 상기 프리셋 렌더링 데이터가 매트릭스 형태인지를 나타내는 프리셋 타입 플래그(preset_type_flag)를 수신하며, 상기 프리셋 타입 플래그의 의미는 하기 표1 과 같다.
프리셋 타입 플래그
(preset_type_flag)
의미
0 프리셋 렌더링 데이터의 타입이 매트릭스가 아닌 경우
1 프리셋 렌더링 데이터의 타입이 매트릭스인 경우
상기 프리셋 타입 플래그가 프리셋 렌더링 데이터의 타입이 매트릭스인 경우를 나타내면, 출력채널 정보 수신부(324)는 오디오 신호에 포함된 오브젝트가 몇 개의 출력채널에서 재생될지를 나타내는 출력채널 정보를 수신한다. 상기 출력채널 정보는 모노 채널, 스테레오 채널, 또는 멀티채널(5.1채널) 일 수 있으나, 이에 한정되지 아니한다.
프리셋 매트릭스 수신부(36)는 입력된 상기 출력채널 정보를 이용하여 상기 오브젝트에 적용될 프리셋 매트릭스를 수신하여 출력한다. 상기 프리셋 매트릭스는 모노 프리셋 매트릭스, 스테레오 프리셋 매트릭스 또는 멀티채널 프리셋 매트릭스 중 하나일 수 있으며, 상기 프리셋 매트릭스의 차원은 오브젝트의 수 및 출력채널의 수에 근거하여 결정될 수 있고, 상기 프리셋 매트릭스는 (오브젝트의 수) * (출력채널의 수) 형태를 가질 수 있다. 예를 들어, 오디오 신호에 포함된 오브젝트가 n개이고, 출력채널 정보 수신부(324)로부터 출력채널이 5.1 채널, 즉 6개의 채널인 경우, 프리셋 매트릭스 수신부(326)은 n * 6 형태로 구현된 하기 수학식 1의 프리셋 멀티채널 매트릭스를 출력할 수 있다.
Figure 112009004328932-pat00001
여기서, 매트릭스 성분(
Figure 112009004328932-pat00002
)은 a번째 오브젝트가 b 번째 채널에 포함되는 정도를 나타내는 게인 값이다. 이후, 상기 프리셋 멀티채널 매트릭스는 오디오 신호에 적용되어 해당 오브젝트의 레벨을 조절할 수 있게 된다.
이와 같이, 본 발명의 프리셋 정보 수신부(220)는 상기 프리셋 길이 정보를 이용하여 필요한 만큼의 비트스트림을 읽어 효율적으로 상기 프리셋 메타데이터를 표현하고, 상기 프리셋 매트릭스를 상기 출력채널 정보에 기초하여 획득함으로써 오디오 신호에 포함된 오브젝트의 게인 등을 효과적으로 조절할 수 있게 된다.
도 4는 본 발명의 실시예에 따른 오디오 신호 처리 방법을 나타내는 순서도이다. 먼저, 복수의 오브젝트들을 포함하는 오디오 신호를 수신한다(S410). 또한, 오브젝트의 게인 또는 패닝 등을 조절하기 위하여 기설정된 프리셋 정보가 존재하는지 여부를 나타내는 프리셋 존재 정보(preset exist information)을 수신하고(S415), 프리셋 정보가 존재하는 경우 기설정된 프리셋 정보가 몇 개(n)인지를 나타내는 프리셋 개수 정보를 수신한다(S420). 상기 프리셋 개수 정보는 상기 프리셋 정보가 존재하는 것을 가정하고 있으므로, (실제 존재하는 프리셋 개수)-1 개로 표현될 수 있다. 이후, 프리셋 정보를 표현하기 위한 메타데이터가 몇 비트(또는 바이트)를 갖는지를 나타내는 프리셋 길이 정보를 수신한다(S430). 수신된 프리셋 길이 정보에 기초하여 프리셋 메타데이터를 수신하고(S435), 예를 들어, 가라오케 모드, 콘서트 홀 모드, 뉴스 모드 등, 이를 출력한다(S437). 프리셋 메타데이터는 텍스트 형태일 수 있고, 상술한 바와 같이 프리셋 정보의 음장 효과를 표현 하는 메타데이터 뿐만 아니라, 프리셋 작성자, 작성날짜, 프리셋 정보로 조절된 오브젝트의 이름 등을 개시하는 메타데이터일 수도 있으며, 이에 한정되지 아니한다.
이후, 프리셋 정보에 포함된 프리셋 렌더링 데이터의 타입을 나타내는 프리셋 타입 정보를 수신한다(S440). 프리셋 타입 정보에 기초하여 프리셋 데이터의 타입이 매트릭스인지를 판단하고(S445), 매트릭스인 경우(S445의 예) 오브젝트의 출력채널이 몇 개인지를 나타내는 출력채널 정보를 수신한다(S450). 인코딩된 프리셋 매트릭스들 중 출력채널 정보에 기초하여 해당하는 프리셋 매트릭스를 수신한다(S455). 예를 들어, 오브젝트의 출력채널이 스테레오인 경우, 수신된 프리셋 매트릭스는 (오브젝트의 수) * 2 의 형태를 갖는 스테레오 프리셋 매트릭스일 것이다.
상술한 단계에서 수신된 프리셋 길이 정보, 프리셋 메타데이터, 프리셋 타입 정보, 출력채널 정보, 및 프리셋 매트릭스를 포함하는 프리셋 정보(i번째)이 프리셋 개수 정보가 나타내는 프리셋 정보의 개수(n)보다 작은지를 판단한다(S460). 만일 프리셋 개수 정보보다 작은경우(S460의 예), S430단계로 돌아가 다음번째 프리셋 정보(i+1번째)의 프리셋 길이 정보를 수신하는 단계를 반복한다. 만일 프리셋 개수 정보와 같은 경우(S460의 아니오), 프리셋 매트릭스를 오디오 신호에 적용하여 오브젝트의 레벨을 조절한다(S465). 한편, 프리셋 타입이 매트릭스가 아닌 경우(S445의 아니오), 인코더에서 설정된 매트릭스 이외의 형식으로 구현된 프리셋 데이터를 수신하고(S457), 수신된 프리셋 데이터를 오디오 신호에 적용하여 오브젝트의 레벨을 조절한다(S468). 이후, 조절된 오브젝트를 포함하는 오디오 신호를 출력할 수 있다(S470)
프리셋 매트릭스를 적용하여 오브젝트를 조절하는 단계(S465)는 사용자의 선택에 의하여 결정된 프리셋 매트릭스를 이용할 수 있다(미도시). 사용자는 프리셋 메타데이터를 출력하는 단계(S437)에서 출력된 프리셋 메타데이터를 참고하여, 원하는 프리셋 정보를 선택할 수 있다. 예를 들어, 사용자가 프리셋 메타데이터 중 가라오케 모드라고 표현된 메타데이터를 선택하는 경우, 출력채널 정보에 기초하여 수신된 프리셋 매트릭스(S455) 중 가라오케 모드인 프리셋 메타데이터와 대응하는 프리셋 매트릭스가 선택된다. 이후, 선택된 가라오케 모드에 대응하는 프리셋 매트릭스가 오디오 신호에 적용되어 오브젝트의 레벨을 조절하고, 조절된 오브젝트를 포함하는 오디오 신호가 출력된다.
도 5는 본 발명의 일실시예에 따른 오디오 신호 처리 방법을 나타내는 신택스(syntax)를 표현한 것이다. 도 5를 참조하면, 프리셋 정보와 관련된 정보들은 비트스트림의 헤더(header)영역에 존재할 수 있다. 비트스트림의 헤더 영역으로부터 프리셋 개수 정보(bsNumPresets)를 획득할 수 있다. 이후, 프리셋 개수 정보가 존재하는 경우(if(bsNumPresets)), 프리셋 개수 정보가 나타내는 프리셋 정보의 개수를 획득한다(numPresets = bsNumPresets + 1). 예를 들면, 프리셋 개수 정보는 프리셋 정보가 1개 존재하는 경우, bsNumPresets 를 0으로 설정할 수 있고, 이 경우 실제 프리셋 정보의 개수는 (프리셋 개수 정보) + 1 로 파악하여 이용될 수 있다.먼저, 프리셋 개수 정보를 비트스트림으로부터 수신할 수 있다.
또한, 프리셋 개수 정보에 기초하여 프리셋 정보(i번째 프리셋 정보)마다 프 리셋 렌더링 데이터의 타입을 나타내는 정보를 획득할 수 있다(bsPresetType[i]). 만일 프리셋 렌더링 데이터를 매트릭스 타입으로 전송하는 경우를 특정 프리셋 타입으로 정의하는 경우(매트릭스 타입일 때 bsPresetType[i]이 전송되는 경우), 프리셋 렌더링 데이터의 타입을 나타내는 정보는 프리셋 렌더링 데이터가 매트릭스 타입으로 생성되어 전송되었는지를 나타내는 상술한 프리셋 타입 정보(preset_type_flag)일 수 있다. 프리셋 타입 정보는 1비트로 표현될 수 있다.
또한, i번째 프리셋 정보에 포함된 프리셋 렌더링 데이터가 매트릭스 타입인 경우(bsPresetType[i]), 출력채널이 몇 개의 채널을 갖는지를 나타내는 출력채널 정보(bsPresetCh[i])을 획득하고, 출력채널 정보에 기초하여 오디오 신호에 포함된 오브젝트의 레벨을 조절하기 위한 프리셋 매트릭스를 획득한다(getRenderingMatrix()).
도 6은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법을 나타내는 신택스(syntax)를 표현한 것이다. 프리셋 정보는 헤더 영역에 포함되어 모든 프레임에서 동일하게 적용될 수 있으나, 시간에 따라 가변적(이하, "시변"이라고 함;time-variable)으로 적용됨으로써 오브젝트의 레벨을 효과적으로 조절할 수도 있다. 프리셋 정보가 시변하는 경우에는, 프레임마다 프리셋 정보에 관련된 정보가 포함되어야 한다. 따라서, 프리셋 정보가 프레임마다 포함되었는지를 나타내는 정보를 헤더에 포함함으로써 효과적으로 비트스트림을 구성할 수 있게 된다.
도 6을 참조하면, 프리셋 정보가 프레임마다 포함되었는지를 표현내는 신택스를 도시한다. 도 5에 도시된 오디오 신호의 처리 방법을 나타내는 신택 스(syntax)과 유사하지만, 출력채널 정보(bsPresetCh[i])를 획득한 이후, 프리셋 정보가 시간적으로 가변적으로, 즉, 프레임마다 포함되었는지 여부를 나타내는 프리셋 정보시변 플래그 정보(bsPresetTimeVarying[i])를 포함할 수 있다. 상기 프리셋 정보시변 플래그 정보가 비트스트림의 헤더 영역에 포함된 경우, 비트스트림의 프레임 영역에 포함된 프리셋 매트릭스 및 프리셋 메타데이터를 이용하여 오브젝트의 레벨을 조절하게 된다. 프리셋 정보시변 플래그 정보가 헤더에 존재하는 경우, 프레임마다 프리셋 정보의 갱신이 있는지 여부를 판단하여 갱신이 없는 경우 그대로 이용(keep), 갱신이 있는 경우 읽음(read) 등의 별도의 플래그를 두어 효율적으로 비트스트림을 구성하는 것도 가능하다.
또한, 비트스트림에 프리셋 정보가 포함되어 있는지를 나타내는 프리셋 존재 정보(bsPresetExtsts)를 포함할 수도 있다. 만일 프리셋 존재 정보가 프리셋 정보가 비트스트림에 포함되어 있지 않음을 나타내는 경우는, 프리셋 개수 정보(bsNumPresets), 프리셋 타입 정보(bsPresetType[i]), 출력채널 정보(bsPresetCh[i]), 및 프리셋 정보시변 플래그 정보(bsPresetTimeVarying[i])를 획득하는 루프(loop)를 수행하지 않을 수 있다. 상기 프리셋 존재 정보는 경우에 따라 신택스 구문에서 생략될 수 있다.
도 7은 본 발명의 또다른 실시예에 따른 오디오 신호 처리 방법을 나타내는 신택스를 표현한 것이다. 상술한 프리셋 매트릭스는 (오브젝트의 수) * (출력채널의 수) 형태의 매트릭스로서, 오디오 신호에 포함된 모든 오브젝트들의 레벨이 어떻게 조절되어 출력채널에 포함되는지를 나타낸다. 그러나 상기 오브젝트들 중 일 부 오브젝트에 대한 정보만을 수신하여 이용하는 것이 전송되는 비트수를 감소시킴으로써 효율적일 수 있다. 따라서, 본발명의 또다른 실시예에서는 프리셋 정보를 이용하여 원하는 오브젝트만을 조절하는 오디오 신호 처리 방법의 신택스를 제안한다.
도 7을 참조하면, 오브젝트 각각에 대하여 오브젝트의 레벨을 조절하기 위한 프리셋 정보가 적용되는지 여부를 나타내는 프리셋 오브젝트 적용 정보(bsPresetObject[i][j])를 신택스에 더 포함할 수 있다. 상기 프리셋 오브젝트 적용 정보를 이용함으로써 프리셋 정보가 해당 오브젝트에 대한 정보를 포함하고 있는지 여부를 알려주는 것이 가능하다. 상기 프리셋 오브젝트 적용 정보는 비트스트림의 헤더 영역에 존재할 수 있고, 도 6과 같이 프리셋 정보가 시변하는 경우에는 프레임에 존재할 수도 있다. 또한, 도 7에 도시된 바와 같이, 각 오브젝트에 대하여 프리셋 정보에 해당 오브젝트에 대한 정보를 포함하는지 여부를 알려줄 수 있고, 또는 포함여부를 나타내는 오브젝트 인덱스를 비트스트림에 포함할 수도 있다. 만일 오브젝트 인덱스를 이용하는 경우에는, 종료 문자(exit character)를 사용하여 보다 편리하게 비트스트림을 구성할 수 있다.
종료 문자는 로스리스 코딩(lossless coding)에서 호프만 테이블(Huffman table) 등을 이용하여 부호화를 수행하는 경우, 실제 파라미터의 수보다 테이블을 하나 크게 설계하고, 추가로 할당된 파라미터를 종료 파라미터로 정의할 수 있다. 이 때, 종료 파라미터가 비트스트림에서 획득되면 해당 정보를 모두 수신한 것으로 정의하여 이용할 수 있다. 예를 들면, 프리셋 정보가 총 10개의 오브젝트 중 2개 의 오브젝트에 대한 정보만을 포함하는 경우(3번 오브젝트 및 8번 오브젝트에 대한 정보)는 3번 오브젝트 및 8번 오브젝트에 해당하는 호프만 인덱스와 종료 파라미터에 해당하는 호프만 인덱스를 차례로 전송함으로써 효과적으로 비트스트림을 구성할 수 있다.
도 8은 본발명의 또다른 실시예인 프리셋 매트릭스를 단계적으로 생성하는 프리셋 렌더링 데이터 수신부의 개략적인 구성을 보여주는 도면이다. 도 8을 참조하면, 프리셋 렌더링 데이터 수신부(320)는 프리셋 타입 플래그 수신부(322), 출력채널 정보 수신부(324), 및 프리셋 매트릭스 결정부(326)을 포함한다. 다른 구성요소들은 도 2 및 도 3의 프리셋 렌더링 데이터 수신부(224, 320)과 동일한 구성 및 효과를 가지므로 상세한 설명을 생략하기로 한다. 한편, 도 8에 도시된 바와 같이, 프리셋 매트릭스 결정부(326)는 모노 타입 프리셋 매트릭스 수신부(810), 스테레오 타입 프리셋 매트릭스 생성부(820), 및 멀티채널 타입 프리셋 매트릭스 생성부(830)를 모두 포함한다.
모노 타입 프리셋 매트릭스 수신부(810)는 프리셋 정보 생성부(미도시)로부터 (오브젝트의 수) 형태의 매트릭스로 표현되는 모노 프리셋 매트릭스를 수신받는다. 만일 출력채널 정보 수신부(324)로부터 수신된 출력채널 정보가 모노인 경우, 상기 모노 프리셋 매트릭스는 그대로 출력되고 오디오 신호에 적용되어 오브젝트의 레벨을 조절할 수 있다.
한편, 출력채널 정보가 스테레오인 경우에는 스테레오 타입 프리셋 매트릭스 생성부(820)에 모노 프리셋 매트릭스가 입력되고, 채널 확장 정보를 더 입력받아 (오브젝트의 수) * 2의 형태인 스테레오 프리셋 매트릭스를 생성한다. 만일 출력채널 정보가 멀티채널을 나타내는 경우에는 상기 스테레오 프리셋 매트릭스와 다채널 확장 정보가 멀티채널 타입 프리셋 매트릭스 생성부(830)로 입력되어 (오브젝트의 수) * 6 의 형태인 멀티채널 프리셋 매트릭스를 생성한다. 이와 같이, 인코더에서 모노 프리셋 매트릭스만을 생성하고, 채널 확장 정보를 이용하여 프리셋 매트릭스 결정부(326)에서 단계적으로 프리셋 매트릭스를 생성함으로써, 재생 환경이 스테레오만에 한정되는 경우 전송되는 비트수를 절약할 수 있고, 스테레오 또는 멀티채널을 위한 프리셋 매트릭스를 중복하여 전송하지 아니할 수 있다.
또한, 본 발명의 또다른 실시예에 따른 오디오 신호 처리 방법은 프리셋 정보를 전송함에 있어 게인 값을 전송하고, 필요에 따라 정규화된 프리셋 매트릭스를 전송하는 방법을 제안한다. 이는 오디오 신호에 포함된 오브젝트를 조절하기 위하여 게인만이 필요한 경우에는 게인값만을 전송하고, 손쉽게 프리셋 매트릭스 전체를 전송하는 방법으로 확장할 수 있다. 예를 들어, 상술한 수학식 1과 같은 프리셋 매트릭스를 전송하기 위하여는 n*6 개의 게인 정보를 먼저 전송하여야 한다. 상기 게인 정보는 하기 수학식 2와 같이 계산될 수 있다.
Figure 112009004328932-pat00003
여기서, i는 오브젝트, j 는 출력채널, nCH은 출력채널의 수를 나타낸다. 상기
Figure 112009004328932-pat00004
는 오브젝트의 수 만큼 존재하므로, 하나의 프리셋 정보에 대하여 n개가 필요하다.
게인 정보 이외에 패닝 정보가 필요한 경우, 정규화된 프리셋 매트릭스(normalized preset matrix)를 추가적으로 이용한다. 상기 정규화된 프리셋 매트릭스는 하기 수학식 3과 같이 정의될 수 있다.
Figure 112009004328932-pat00005
상술한 방법과 같이 게인 정보 및 정규화된 프리셋 매트릭스를 이용하는 경우, n*6 개의 게인 정보를 전송해야 한다. 그러나 정규화 특성에 의하여
Figure 112009004328932-pat00006
과 같은 특성을 갖게 되고,
Figure 112009004328932-pat00007
의 log10 값이 항상 0보다 작거나 같게 되므로, 게인 정보의 양자화를 위하여 채널 레벨 차이 정보(Channel Level Difference Information)의 테이블을 이용하는 경우, 종래에 비하여 절반의 테이블만을 사용하게 된다. 따라서, 게인 정보를 별도로 전송하지 아니하고 정규화되지 아니한 프리셋 매트릭스를 수신하여 이용하는 것보다 전송되는 비트율 뿐만 아니라 이용되는 데이터의 양을 절약할 수 있다. 또한, 프리셋 정보에 게인 정보만을 포함시킬 수 도 있으므로 프리셋 정보를 스케일러블(scalable)하게 사용할 수 있다.
도 9는 상술한 프리셋 정보에 게인 정보와 패닝과 관련된 정보를 별도로 포함시켜 전송하는 경우의 신택스를 표현한 것이다. 이러한 게인 정보 및 패닝 정보는 헤더 영역 또는 프레임 영역에 포함될 수 있다. 도 9를 참조하면, 이탤릭체로 표현된 부분은 실제 프리셋 정보값을 비트스트림으로부터 수신하는 것이다. 다양한 노이즈리스 코딩 방식(noiseless coding scheme)을 이용할 수 있으며, 도 9에서는 함수로 표현하였다. 예를 들어, 프레임 영역에 상기 정보들이 존재하는 경우, 프리셋 정보가 존재하는지 여부에 따라 존재하는 경우에 프리셋 개수 정보를 수신한다. 이후, 먼저 게인 정보를 수신하는데, 이는 해당 오브젝트를 어떤 게인값으로 재생할지에 대한 정보를 나타낸다. 이 때, 게인 정보는 상술한 G_i 일 수 있고, 외부 입력값에 의하여 오디오 신호의 레벨이 조절된 경우 생성되는 아비트러리 다운믹스 게인(arbitrary downmix gain, ADG)일 수도 있다.
추가로 획득되는 패닝 정보는 여러가지 형태일 수 있다. 상기 패닝 정보는 상술한 정규화된 프리셋 매트릭스일 수 있고, 또는 스테레오 패닝 정보 및 멀티채널 패닝 정보로 구분되어 있을 수 있다.
도 10은 본 발명의 또다른 실시예에 따른 오디오 신호 처리 장치를 도시한 것이다. 오디오 신호 처리 장치는 크게 다운믹싱부(1010), 오브젝트 정보 생성부(1020), 프리셋 정보 생성부(1030), 다운믹스 신호 처리부(1040), 정보 처리부(1050), 및 멀티채널 디코딩부(1060)를 포함한다.
복수개의 오브젝트들은 다운믹싱부(1010)에 입력되어 모노 또는 스테레오 다 운믹스 신호를 생성한다. 또한, 복수개의 오브젝트들은 오브젝트 정보 생성부(1020)에 입력되어 오브젝트의 레벨을 나타내는 오브젝트 레벨 정보(object level information), 다운믹스 신호에 포함되는 오브젝트의 게인값 및/또는 스테레오 다운믹스 신호인 경우, 다운믹스 채널에 포함되는 오브젝트의 정도를 나타내는 오브젝트 게인 정보(object gain information), 오브젝트들간의 연관여부를 나타내는 오브젝트 연관 정보(object correlation information)를 포함하는 오브젝트 정보(object information)을 생성한다. 이후, 다운믹스 신호 및 오브젝트 정보는 프리셋 정보 생성부(1030)로 입력되어 오브젝트의 레벨을 조절하기 위한 프리셋 렌더링 데이터와 프리셋 정보를 표현하기 위한 프리셋 메타데이터를 포함하는 프리셋 정보를 생성한다. 상기 프리셋 렌더링 데이터와 상기 프리셋 메타데이터가 생성되는 과정은 상술한 도 1 내지 도 9의 오디오 신호 처리 장치 및 방법에서 설명한 바와 같으므로 상세한 설명은 생략하기로 한다. 오브젝트 정보 생성부(1020)에서 생성된 오브젝트 정보와 프리셋 정보 생성부(1030)에서 생성된 프리셋 정보는 SAOC 비트스트림에 포함되어 전송될 수 있다.
정보 처리부(1050)는 오브젝트 정보 처리부(1051) 및 프리셋 정보 수신부(1052)를 포함하며, SAOC 비트스트림을 수신받는다. 프리셋 정보 수신부(1052)는 상기 SAOC 비트스트림으로부터 상술한 프리셋 존재 정보, 프리셋 개수 정보, 프리셋 정보길이 정보, 프리셋 메타데이터, 프리셋 타입 정보, 출력채널 정보, 및 프리셋 매트릭스를 수신하고, 이밖의 도 1 내지 도 9의 오디오 신호 처리 방법 및 장치에서 설명된 다양한 실시예에 따른 방법을 이용한다. 프리셋 정보 수신부(1052) 는 프리셋 메타데이터와 프리셋 매트릭스를 출력하고, 오브젝트 정보 처리부(1051)는 이들을 입력받아 SAOC 비트스트림에 포함된 오브젝트 정보와 함께 이용하여 다운믹스 신호를 전처리(pre-processing) 하기 위한 다운믹스 처리 정보(downmix processing information)과 다운믹스 신호를 업믹싱하기 위한 멀티채널 정보(multi-channel information)을 생성한다.
이후, 다운믹스 처리 정보는 다운믹스 신호 처리부(1040)에 입력되어, 다운믹스 신호에 포함된 오브젝트의 패닝을 수행할 수 있다. 이와 같이 전처리된 다운믹스 신호는 정보 처리부(1050)에서 출력된 멀티채널 정보와 함께 멀티채널 디코딩부(1060)로 입력되어 업믹싱됨으로써 멀티채널 오디오 신호를 생성할 수 있게 된다.
이와 같이, 본 발명의 오디오 신호 처리 장치는 복수개의 오브젝트를 포함하는 오디오 신호를 오브젝트 정보를 이용하여 멀티채널 신호로 디코딩하는데 있어서, 기설정된 프리셋 정보를 이용함으로써 손쉽게 오브젝트의 레벨을 조절할 수 있다. 또한, 이 때 오브젝트에 적용되는 프리셋 매트릭스는 출력채널 정보에 기초하여 수신된 매트릭스 형태의 데이터를 이용함으로써 오브젝트의 레벨 조절을 효과적으로 수행하고, 인코더단에서 전송되는 프리셋 정보길이 정보에 기초하여 프리셋 정보를 표현하기 위한 프리셋 메타데이터를 출력함으로써 코딩 효율을 높일수 있다.
도 11은 본 발명의 일실시예에 따른 메타데이터 수신부 및 프리셋 렌더링 데이터 수신부를 포함하는 프리셋 정보 수신부가 구현된 제품의 개략적인 구성을 보 여주는 도면이고, 도 12는 본 발명의 실시예에 따른 프리셋 정보 수신부가 구현된 제품들의 관계를 보여주는 도면이다.
도 11을 참조하면, 유무선 통신부 유무선 통신부(1110)는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(1110)는 유선통신부(1111), 적외선통신부(1112), 블루투스부(1113), 무선랜통신부(1114) 중 하나 이상을 포함할 수 있다.
사용자 인증부는(1120)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부(1121), 홍채인식부(1122), 얼굴인식부(1123), 및 음성인식부(1124) 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다.
입력부(1130)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부(1131), 터치패드부(1132), 리모컨부(1133) 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 한편, 후술한 메타데이터 수신부(1141)에서 출력되는 복수개의 프리셋 정보에 대한 프리셋 메타데이터가 디스플레이부(1162)를 통하여 화면에 현시되는 경우에, 입력부(1130)를 통하여 사용자가 프리셋 메타데이터를 선택할 수 있고, 선택된 프리셋 메타데이터에 대한 정보가 제어부(1150)로 입력된다.
신호 디코딩부(1140)는 메타데이터 수신부(1141) 및 프리셋 렌더링 데이터 수신부(1142)를 포함하는데, 메타데이터 수신부(1141)는 프리셋 정보길이 정보를 수신받아 이를 기초로 프리셋 메타데이터를 수신한다. 또한, 프리셋 렌더링 데이터 수신부(1142)는 프리셋 타입 정보에 의하여 프리셋 정보가 매트릭스로 표현된 경우, 출력채널 정보를 수신받아 이를 기초로 프리셋 렌더링 데이터인 프리셋 매트릭스를 수신한다. 신호 디코딩부(550)는 수신된 비트스트림, 프리셋 메타데이터, 및 프리셋 매트릭스를 이용하여 오디오 신호를 디코딩하여 출력신호를 생성하고, 상기 프리셋 메타데이터를 텍스트 형태로 출력한다.
제어부(1150)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부(1140)와 출력부(1160)의 모든 프로세스를 제어한다. 상술한 바와 같이, 제어부(1150)에 입력부(1130)로부터 선택된 프리셋 메타데이터에 대한 정보가 입력되는 경우, 프리셋 렌더링 데이터 수신부(1142)는 선택된 프리셋 메타데이터와 대응하는 프리셋 매트릭스를 수신하고, 이를 이용하여 오디오 신호를 디코딩한다.
출력부(1160)는 신호 디코딩부(1140)에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 스피커부(1161) 및 디스플레이부(1162)를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 스피커부(1161)를 통하여 출력되고, 비디오 신호일 때 출력 신호는 디스플레이부(1162)를 통해 출력된다. 또한, 제어부(1150)로부터 입력된 프리셋 메타데이터를 디스플레이부(1162)를 통하여 화면에 현시한다.
도 12는 도 11에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 도시한 것으로서, 도 12의 (A)를 참조하면, 제1 단말(1210) 및 제2 단말(1220)이 각 단말들은 유무선 통신부를 통해서 데이터 내지 비트스트림을 양방향으로 통신할 수 있 음을 알 수 있다. 도 12의 (B)를 참조하면, 서버(1230) 및 제1 단말(1240) 또한 서로 유무선 통신을 수행할 수 있음을 알 수 있다.
도 13은 본 발명의 일실시예에 따른 메타데이터 수신부 및 프리셋 렌더링 데이터 수신부를 포함하는 프리셋 정보 수신부가 구현된 방송신호 디코딩 장치(1300)의 개략적인 구성을 보여주는 도면이다.
도 13을 참조하면, 디멀티플렉서(1320)는 튜너(1310)로부터 TV방송과 관련된 데이터들을 수신한다. 수신된 데이터들은 디멀티플렉서(1320)에서 분리되고, 데이터 디코더(1330)를 통하여 디코딩된다. 한편, 디멀티플렉서(1320)에서 분리된 데이터들은 HDD 와 같은 저장매체(1350)에 저장될 수 있다. 디멀티플렉서(1320)에서 분리된 데이터들은 오디오 디코더(1341) 및 비디오 디코더(1342)를 포함하는 디코더(1340)로 입력되어 오디오 신호 및 비디오 신호를 디코딩한다. 오디오 디코더(1341)는 본 발명의 일실시예에 따른 메타데이터 수신부(1341A) 및 프리셋 렌더링 데이터 수신부(1341B)를 포함하는데, 메타데이터 수신부(1341A)는 프리셋 길이 정보를 수신받아 이를 기초로 프리셋 메타데이터를 수신한다. 또한, 프리셋 렌더링 데이터 수신부(1341B)는 프리셋 타입 정보에 의하여 프리셋 정보가 매트릭스로 표현된 경우, 출력채널 정보를 수신받아 이를 기초로 프리셋 렌더링 데이터인 프리셋 매트릭스를 수신한다. 오디오 디코더(1341)는 수신된 비트스트림, 프리셋 메타데이터, 및 프리셋 매트릭스를 이용하여 오디오 신호를 디코딩하여 출력신호를 생성하고, 상기 프리셋 메타데이터를 텍스트 형태로 출력한다.
디스플레이부(1370)는 비디오 디코더(1342)에서 출력된 비디오 신호와 오디 오 디코더(1341)에서 출력된 프리셋 메타데이터를 화면에 현시한다. 또한, 디스플레이부(1370)는 스피커부(미도시)를 포함하고, 오디오 디코더(1341)에서 출력되는 오브젝트의 레벨이 프리셋 매트릭스를 이용하여 조절된 오디오 신호를 디스플레이부(1370)에 포함된 스피커부를 통하여 출력한다. 또한, 디코더(1340)에서 디코딩된 데이터들은 HDD 와 같은 저장매체(1350)에 저장될 수 있다.
한편, 신호 디코딩 장치(1300)는 사용자로부터 정보를 입력받아 수신된 데이터들을 제어할 수 있는 애플리케이션 매니저(1360)를 더 포함할 수 있다. 애플리케이션 매니저(1360)는 유저 인터페이스 매니저(1361) 및 서비스 매니저(1362)를 포함하는데, 유저 인터페이스 매니저(1361)는 사용자로부터 정보를 입력받기 위한 인터페이스(interface)를 제어한다. 예를 들면, 디스플레이부(1370)에 현시되는 텍스트의 글자체, 화면의 밝기, 메뉴 구성 등을 제어할 수 있다. 한편, 서비스 매니저(1362)는 디코더(1340) 및 디스플레이부(1370)에서 방송신호를 디코딩하여 출력하는 경우, 수신되는 방송신호를 사용자로부터 입력되는 정보를 이용하여 제어할 수 있다. 예를 들면, 방송채널의 설정, 알람 기능 설정, 성인인증 기능 등을 제공할 수 있다. 애플리케이션 매니저(1360)에서 출력되는 데이터들은 디코더(1340)뿐만 아니라, 디스플레이부(1370)로도 전송되어 이용가능하다.
도 14는 본 발명의 일실시예에 따른 프리셋 정보 수신부를 포함하는 제품의 디스플레이부를 도시한 것이다. 디스플레이부는 비트스트림에 포함된 모든 프리셋 메타데이터를 현시할 수 있다. 예를 들면, 도 14에서 도시한 바와 같이, 오디오 신호에 대응하는 프리셋 메타데이터인 가라오케 모드, 콘서트 홀 모드, 및 뉴스 모 드를 모두 화면에 현시한다.
그 중 프리셋 메타데이터 중 하나를 사용자가 선택하는 경우, 디스플레이부는 상기 가라오케 모드에 대응하는 프리셋 매트릭스가 복수개의 오브젝트들에 적용됨으로써 레벨이 조절된 오브젝트를 화면에 현시한다. 예를 들면, 사용자가 가라오케 모드를 선택하는 경우, 보컬 오브젝트의 레벨이 최저로 설정된 모양이 현시될 수 있다. 또한, 사용자가 뉴스 모드를 선택하는 경우에는 오디오 신호에 적용되는 프리셋 매트릭스는 보컬 오브젝트 이외의 오브젝트의 레벨을 감소시킬 것이다. 도 14를 참조하면, 뉴스 모드가 선택된 경우, 디스플레이부는 보컬 오브젝트의 레벨이 가라오케 모드시 보컬 오브젝트의 레벨보다 증가하고, 나머지 오브젝트의 레벨들은 최저로 설정된 모양을 현시할 수 있다. 이 때, 프리셋 메타데이터에 포함되는 오브젝트의 이름을 함께 디스플레이부에 더 표시할 수 있으며, 사용자는 레벨이 조절된 오브젝트가 어떠한 것인지 알 수 있다.
따라서, 디스플레이부에 프리셋 정보를 표현하는 프리셋 메타데이터뿐만 아니라, 프리셋 매트릭스에 의하여 조절된 오브젝트의 레벨을 현시함으로써, 사용자가 원하는 프리셋 정보모드를 적절하게 선택하여 원하는 음장감을 갖는 오디오 신호를 청취할 수 있게 된다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
도 1은 본 발명의 실시예에 따른 오디오 신호에 포함된 오브젝트에 적용되는 프리셋 정보의 개념도를 나타내는 것이다.
도 2는 본 발명의 실시예에 따른 오디오 신호 처리 장치를 나타내는 것이다.
도 3는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 프리셋 정보 수신부를 나타내는 것이다.
도 4는 본 발명의 실시예에 따른 오디오 신호 처리 방법을 나타내는 순서도이다.
도 5는 본 발명의 실시예에 따른 신택스(syntax)를 나타내는 것이다.
도 6는 본 발명의 다른 실시예에 따른 신택스를 나타내는 것이다.
도 7는 본 발명의 또다른 실시예에 따른 신택스를 나타내는 것이다.
도 8은 본 발명의 또다른 실시예에 따른 프리셋 렌더링 데이터 수신부를 나타내는 것이다.
도 9 는 본 발명의 또다른 실시예에 따른 신택스를 나타내는 것이다.
도 10은 본 발명의 또다른 실시예에 따른 오디오 신호 처리 장치를 나타내는 것이다.
도 11는 본 발명의 실시예에 따른 프리셋 정보 수신부가 구현된 제품의 개략적인 구성을 나타내는 것이다.
도 12는 도 11에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 나타내는 것이다.
도 13은 본 발명의 실시예에 따른 프리셋 정보 수신부가 구현된 디지털 TV의 개략적인 구성을 나타내는 것이다.
도 14는 본 발명의 일실시예에 따른 프리셋 정보 수신부를 포함하는 제품의 디스플레이부를 도시한 것이다.

Claims (15)

  1. 적어도 하나의 오브젝트를 포함하는 오디오 신호를 수신하는 단계;
    상기 오브젝트를 조절하는 프리셋 정보가 수신되었는지 여부를 나타내는 프리셋 존재 정보를 수신하는 단계;
    상기 프리셋 존재 정보에 기초하여, 상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보, 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보, 및 오브젝트가 각 출력 채널에 포함되는 정보를 나타내는 프리셋 매트릭스를 포함하는 프리셋 정보를 수신하는 단계;
    상기 프리셋 타입 정보에 기초하여, 상기 프리셋 정보에서 상기 프리셋 매트릭스를 획득하는 단계;
    상기 프리셋 매트릭스를 이용하여, 출력채널의 개수에 따라 상기 오브젝트의 출력레벨을 조절하는 단계; 및
    상기 출력레벨이 조절된 오브젝트를 포함하는 오디오 신호를 출력하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 프리셋 매트릭스는 상기 출력채널이 모노, 스테레오 및 멀티채널 중 하나인 것을 나타내는 출력채널정보에 근거하여 획득되는 것을 특징으로 하는 오디오 신호 처리 방법.
  3. 제 2 항에 있어서,
    상기 프리셋 타입 정보는 1비트로 표현되는 것을 특징으로 하는 오디오 신호 처리 방법.
  4. 제 1 항에 있어서,
    상기 프리셋 매트릭스의 차원은 상기 오브젝트의 개수 및 상기 출력채널의 개수에 의하여 결정되는 것을 특징으로 하는 오디오 신호 처리 방법.
  5. 적어도 하나의 오브젝트를 포함하는 오디오 신호를 수신하는 오디오 신호 수신부;
    프리셋 정보로부터 상기 오브젝트가 각 출력 채널에 포함되는 정도를 나타내는 프리셋 매트릭스를 획득하는 프리셋 렌더링 데이터 수신부;
    상기 프리셋 매트릭스를 이용하여 출력채널에 따라 상기 오브젝트의 출력레벨을 조절하는 오브젝트 조절부; 및
    상기 출력레벨이 조절된 오브젝트를 포함하는 오디오 신호를 출력하는 출력부를 포함하고,
    상기 프리셋 매트릭스는 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보에 근거하여 획득되는 것을 특징으로 하는 오디오 신호 처리 장치.
  6. 제 5항에 있어서,
    상기 프리셋 렌더링 데이터 수신부는,
    상기 프리셋 타입 정보를 수신하는 프리셋 타입 정보 수신부; 및
    상기 출력채널이 모노, 스테레오 및 멀티채널 중 하나인 것을 나타내는 출력채널정보를 수신하는 출력 채널 정보 수신부를 포함하고,
    상기 프리셋 매트릭스는 상기 출력 채널 정보에 근거하여 획득하는 것을 특징으로 하는 오디오 신호 처리 장치.
  7. 제 6 항에 있어서,
    상기 프리셋 타입 정보는 1비트로 표현되는 것을 특징으로 하는 오디오 신호 처리 장치.
  8. 제 5 항에 있어서,
    상기 프리셋 매트릭스의 차원은 상기 오브젝트의 개수 및 상기 출력채널의 개수에 의하여 결정되는 것을 특징으로 하는 오디오 신호 처리 장치.
  9. 디지털 오디오 데이터를 저장하며, 컴퓨터로 읽을 수 있는 저장 매체에 있어서,
    상기 디지털 오디오 데이터는 적어도 하나의 오브젝트를 포함하는 오디오 신호 및 프리셋 정보를 포함하며,
    상기 프리셋 정보는 상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보, 상기 오브젝트가 각 출력 채널에 포함되는 정도를 나타내는 프리셋 매트릭스, 및 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보를 포함하고,
    상기 프리셋 정보는 상기 프리셋 정보가 포함되었는지를 나타내는 프리셋 존재 정보에 근거하여 획득되고,
    상기 프리셋 매트릭스는 상기 프리셋 타입 정보에 근거하여 획득된 것을 특징으로 하는 저장 매체.
  10. 제 9 항에 있어서,
    상기 프리셋 매트릭스는 상기 출력채널이 모노, 스테레오 및 멀티채널 중 하나인 것을 나타내는 출력채널정보에 근거하여 획득되는 것을 특징으로 하는 저장 매체.
  11. 제 10 항에 있어서,
    상기 프리셋 타입 정보는 1비트로 표현된 것을 특징으로 하는 저장 매체.
  12. 제 9 항에 있어서,
    상기 프리셋 매트릭스는 상기 오브젝트의 개수 및 상기 출력채널의 개수에 의하여 결정되는 것을 특징으로 하는 저장 매체.
  13. 적어도 하나의 오브젝트를 다운믹스하여 오디오 신호를 생성하는 오디오 신호 생성부; 및
    상기 오브젝트가 각 출력 채널에 포함되는 정도를 나타내는 프리셋 매트릭스, 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보를 포함하는 프리셋 렌더링 데이터를 생성하는 프리셋 렌더링 데이터 생성부를 포함하고,
    상기 오디오 신호 및 상기 프리셋 렌더링 데이터는 하나의 비트스트림에 포함되어 전송되는 것을 특징으로 하는 오디오 신호 인코딩 장치.
  14. 제 13항에 있어서,
    상기 프리셋 렌더링 데이터 생성부는 상기 출력 채널이 모노, 스테레오 및 멀티채널 중 하나인 것을 나타내는 출력채널정보를 더 생성하는 것을 특징으로 하는 오디오 신호 인코딩 장치.
  15. 적어도 하나의 오브젝트를 다운믹스하여 오디오 신호를 생성하는 단계;
    프리셋 정보의 존재여부를 나타내는 프리셋 존재 정보를 생성하는 단계;
    상기 프리셋 정보의 개수를 나타내는 프리셋 개수 정보를 생성하는 단계;
    상기 오브젝트가 각 출력 채널에 포함되는 정도를 나타내는 프리셋 매트릭스 및 상기 프리셋 정보가 매트릭스로 표현되었는지를 나타내는 프리셋 타입 정보를 포함하는 프리셋 렌더링 데이터를 생성하는 단계; 및
    상기 오디오 신호, 상기 프리셋 존재 정보, 상기 프리셋 개수 정보 및 상기 프리셋 렌더링 데이터를 포함하는 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.
KR1020090005506A 2008-01-23 2009-01-22 오디오 신호의 처리 방법 및 이의 장치 KR101024924B1 (ko)

Priority Applications (13)

Application Number Priority Date Filing Date Title
PCT/KR2009/000367 WO2009093867A2 (en) 2008-01-23 2009-01-23 A method and an apparatus for processing audio signal
DE602009000167T DE602009000167D1 (de) 2008-01-23 2009-01-23 Verfahren und Vorrichtung zur Verarbeitung eines Audiosignals
AT09000955T ATE481830T1 (de) 2008-01-23 2009-01-23 Verfahren und vorrichtung zur verarbeitung eines audiosignals
CA2712941A CA2712941C (en) 2008-01-23 2009-01-23 A method and an apparatus for processing an audio signal
JP2010544229A JP5319704B2 (ja) 2008-01-23 2009-01-23 オーディオ信号の処理方法及び装置
CN2009801029907A CN101926094B (zh) 2008-01-23 2009-01-23 用于处理音频信号的方法和设备
EP09000955A EP2083585B1 (en) 2008-01-23 2009-01-23 A method and an apparatus for processing an audio signal
US12/358,982 US8615316B2 (en) 2008-01-23 2009-01-23 Method and an apparatus for processing an audio signal
AU2009206856A AU2009206856B2 (en) 2008-01-23 2009-01-23 A method and an apparatus for processing audio signal
RU2010134915/08A RU2450440C1 (ru) 2008-01-23 2009-01-23 Способ и устройство для обработки аудиосигнала
MX2010007997A MX2010007997A (es) 2008-01-23 2009-01-23 Un metodo y un aparato para el procesamiento de señales de audio.
US14/133,249 US9319014B2 (en) 2008-01-23 2013-12-18 Method and an apparatus for processing an audio signal
US15/077,765 US9787266B2 (en) 2008-01-23 2016-03-22 Method and an apparatus for processing an audio signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2305108P 2008-01-23 2008-01-23
US61/023,051 2008-01-23

Publications (2)

Publication Number Publication Date
KR20090081341A KR20090081341A (ko) 2009-07-28
KR101024924B1 true KR101024924B1 (ko) 2011-03-31

Family

ID=41402183

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020090005506A KR101024924B1 (ko) 2008-01-23 2009-01-22 오디오 신호의 처리 방법 및 이의 장치
KR1020090005507A KR100998913B1 (ko) 2008-01-23 2009-01-22 오디오 신호의 처리 방법 및 이의 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020090005507A KR100998913B1 (ko) 2008-01-23 2009-01-22 오디오 신호의 처리 방법 및 이의 장치

Country Status (9)

Country Link
JP (2) JP5319704B2 (ko)
KR (2) KR101024924B1 (ko)
CN (2) CN101926181B (ko)
AT (2) ATE481830T1 (ko)
AU (1) AU2009206856B2 (ko)
CA (1) CA2712941C (ko)
DE (2) DE602009000167D1 (ko)
MX (1) MX2010007997A (ko)
RU (1) RU2450440C1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY154641A (en) * 2009-11-20 2015-07-15 Fraunhofer Ges Forschung Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter
EP2848009B1 (en) 2012-05-07 2020-12-02 Dolby International AB Method and apparatus for layout and format independent 3d audio reproduction
US9805725B2 (en) 2012-12-21 2017-10-31 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP3074970B1 (en) * 2013-10-21 2018-02-21 Dolby International AB Audio encoder and decoder
CN106463124B (zh) * 2014-03-24 2021-03-30 三星电子株式会社 用于渲染声信号的方法和设备,以及计算机可读记录介质
EP4372746A2 (en) * 2014-10-10 2024-05-22 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
JP2021530723A (ja) 2018-07-02 2021-11-11 ドルビー ラボラトリーズ ライセンシング コーポレイション 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置
KR102049603B1 (ko) * 2018-10-30 2019-11-27 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102220521B1 (ko) * 2019-11-21 2021-02-25 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102370348B1 (ko) * 2019-11-21 2022-03-04 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100542129B1 (ko) 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
KR20070005468A (ko) * 2005-07-05 2007-01-10 엘지전자 주식회사 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치
KR20070061100A (ko) * 2005-12-08 2007-06-13 한국전자통신연구원 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법
KR20070092164A (ko) * 2006-03-07 2007-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 오디오 신호 처리 장치

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5798818A (en) * 1995-10-17 1998-08-25 Sony Corporation Configurable cinema sound system
US6704421B1 (en) * 1997-07-24 2004-03-09 Ati Technologies, Inc. Automatic multichannel equalization control system for a multimedia computer
CA2406926A1 (en) * 2000-04-19 2001-11-01 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
JP4736331B2 (ja) * 2004-02-27 2011-07-27 大日本印刷株式会社 音響信号の再生装置
US9992599B2 (en) * 2004-04-05 2018-06-05 Koninklijke Philips N.V. Method, device, encoder apparatus, decoder apparatus and audio system
KR100644617B1 (ko) * 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
KR101243687B1 (ko) * 2004-11-23 2013-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 데이터를 처리하기 위한 디바이스 및 방법, 컴퓨터프로그램 요소 및 컴퓨터-판독가능한 매체
EP1851656A4 (en) * 2005-02-22 2009-09-23 Verax Technologies Inc SYSTEM AND METHOD FOR FORMATTING MULTIMODE CONTENT OF SOUNDS AND METADATA
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
KR20070031212A (ko) * 2005-09-14 2007-03-19 엘지전자 주식회사 오디오 신호의 인코딩/디코딩 방법 및 장치
EP1922721A4 (en) * 2005-08-30 2011-04-13 Lg Electronics Inc AUDIO SIGNAL DECODING METHOD
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
KR20070044352A (ko) * 2005-10-24 2007-04-27 엘지전자 주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 이를 구현하기위한 장치
WO2007136187A1 (en) * 2006-05-19 2007-11-29 Electronics And Telecommunications Research Institute Object-based 3-dimensional audio service system using preset audio scenes
JP2007178590A (ja) * 2005-12-27 2007-07-12 Ntt Docomo Inc 目的信号抽出装置、目的信号抽出方法、及び、プログラム
WO2007083958A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for decoding a signal
KR100885700B1 (ko) * 2006-01-19 2009-02-26 엘지전자 주식회사 신호 디코딩 방법 및 장치
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
JP4399835B2 (ja) 2006-07-07 2010-01-20 日本ビクター株式会社 音声符号化方法及び音声復号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100542129B1 (ko) 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
KR20070005468A (ko) * 2005-07-05 2007-01-10 엘지전자 주식회사 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치
KR20070061100A (ko) * 2005-12-08 2007-06-13 한국전자통신연구원 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법
KR20070092164A (ko) * 2006-03-07 2007-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 오디오 신호 처리 장치

Also Published As

Publication number Publication date
JP5319704B2 (ja) 2013-10-16
KR20090081342A (ko) 2009-07-28
AU2009206856B2 (en) 2013-05-30
KR100998913B1 (ko) 2010-12-08
RU2450440C1 (ru) 2012-05-10
CA2712941C (en) 2015-06-16
DE602009000167D1 (de) 2010-10-28
CN101926094A (zh) 2010-12-22
CN101926181B (zh) 2014-05-21
DE602009000166D1 (de) 2010-10-28
CN101926094B (zh) 2013-07-17
ATE481830T1 (de) 2010-10-15
JP5249354B2 (ja) 2013-07-31
MX2010007997A (es) 2010-08-31
CN101926181A (zh) 2010-12-22
AU2009206856A1 (en) 2009-07-30
RU2010134915A (ru) 2012-02-27
JP2011510589A (ja) 2011-03-31
ATE481829T1 (de) 2010-10-15
KR20090081341A (ko) 2009-07-28
CA2712941A1 (en) 2009-07-30
JP2011511307A (ja) 2011-04-07

Similar Documents

Publication Publication Date Title
KR101024924B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
EP2083585B1 (en) A method and an apparatus for processing an audio signal
EP2083584B1 (en) A method and an apparatus for processing an audio signal
KR101171314B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
KR101061129B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
JP5249408B2 (ja) オーディオ信号の処理方法及び装置
WO2010008198A2 (en) A method and an apparatus for processing an audio signal
KR101062351B1 (ko) 오디오 신호 처리 방법 및 이의 장치
JP5406276B2 (ja) オーディオ信号の処理方法及び装置
EP2111062B1 (en) A method and an apparatus for processing an audio signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140224

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150224

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160224

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170214

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190214

Year of fee payment: 9