KR20090122221A - 오디오 신호 처리 방법 및 장치 - Google Patents

오디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
KR20090122221A
KR20090122221A KR1020097018360A KR20097018360A KR20090122221A KR 20090122221 A KR20090122221 A KR 20090122221A KR 1020097018360 A KR1020097018360 A KR 1020097018360A KR 20097018360 A KR20097018360 A KR 20097018360A KR 20090122221 A KR20090122221 A KR 20090122221A
Authority
KR
South Korea
Prior art keywords
information
signal
parameter
gain range
gain
Prior art date
Application number
KR1020097018360A
Other languages
English (en)
Inventor
오현오
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20090122221A publication Critical patent/KR20090122221A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및, 상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.
오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.

Description

오디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}
본 발명은 오디오 신호의 처리 방법 및 장치에 관한 것으로, 보다 상세하게는 디지털 매체, 방송 신호 등으로 수신된 오디오 신호를 처리할 수 있는 오디오 신호의 처리 방법 및 장치에 관한 것이다.
일반적으로, 다수 개의 오브젝트를 모노 또는 스테레오 신호로 다운믹스하는 과정에 있어서, 각각의 오브젝트 신호로부터 파라미터들이 추출된다. 이러한 파라미터들은 디코더에서 사용될 수 있는 데, 각각의 오브젝들의 패닝(panning)과 게인(gain)은 유저의 선택에 의해 컨트롤 될 수 있다.
Technical Problem
각각의 오브젝트 시그널을 제어하기 위해서는, 다운믹스에 포함되어 있는 각각의 소스들이 적절히 포지셔닝 또는 패닝되어야 한다.
또한, 채널 기반(channel-oriented) 디코딩 방식으로 하향 호환성을 갖기 위해서는, 오브젝트 파라미터는 업믹싱을 위한 멀티 채널 파라미터로 유연하게 변환되어야 한다.
Technical Solution
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 오브젝트의 게인과 패닝을 제한없이 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤하되, 일정 제한 범위 내에서만 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
Advantageous Effects
본 발명은 다음과 같은 효과와 이점을 제공한다.
우선, 오브젝트의 게인과 패닝을 제한없이 컨트롤 할 수 있다.
둘째, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤 할 수 있다.
셋째, 오브젝트의 게인을 조정하는 경우, 게인 조정에 대한 게인범위를 제공함으로써, 게인 조정에 따라 음질이 왜곡되는 것을 방지할 수 있다.
도 1 은 본 발명의 실시예에 따른 오디오 신호 처리 장치의 구성도.
도 2 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 일 예.
도 3 은 본 발명의 일 실시예에 따른 오디오 신호 처리 방법의 순서도.
도 4 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 다른 예.
도 5 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법의 순서도.
Best Mode for Carrying Out the Invention
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함한다.
본 발명에 따르면, 상기 비율정보는, 오디오 신호 비트스트림으로부터 획득된 것일 수 있다.
본 발명에 따르면, 상기 비율정보 및 상기 게인범위 정보의 전송 여부를 나 타내는 전송 플래그 정보를 획득하는 단계를 더 포함하고, 상기 비율정보 및 상기 게인범위 정보는, 상기 전송 플래그 정보를 근거로 하여 상기 오디오 신호 비트스트림으로부터 획득된 것일 수 있다.
본 발명에 따르면, 오브젝트 신호가 관계 신호에 해당하는지 여부를 나타내는 관계 플래그 정보를 획득하는 단계를 더 포함하고, 상기 전송 플래그 정보를 획득하는 단계는, 상기 관계 플래그 정보를 근거로 수행되는 것일 수 있다.
본 발명에 따르면, 상기 관계 플래그 정보는, 오브젝트 신호가 관계 신호에 해당하는지 여부를 오브젝트별로 나타내는 것일 수 있다.
발명에 따르면, 주파수 해상도 정보를 수신하는 단계를 더 포함하고,상기 파라미터 정보를 변형하는 단계는, 상기 주파수 해상도 정보를 근거로 수행되는 것일 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 게인 값, 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함할 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 시간별 서브밴드별로 변화하는 것일 수 있다.
본 발명에 따르면, 상기 게인범위 정보를 표시하는 단계; 및, 오브젝트별 게인 조정에 관한 사용자 제어 정보를 수신하는 단계를 포함하고, 상기 컨트롤 파라미터는, 상기 사용자 제어 정보를 근거로 생성된 것일 수 있다.
본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 메인 신호 및 상기 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계; 및, 상기 다운믹스 정보 및 상기 멀티채널 정보를 이용하여 멀티채널 신호를 생성하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고, 상기 믹스 정보는, 오브젝트 위치 정보, 오브젝트 게인 정보, 및 재생 환경 정보 중 하나 이상을 근거로 생성된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 방송 신호를 통해 수신된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 디지털 매체를 통해 수신된 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.
본 발명의 또 다른 측면에 따르면, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부; 상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 오디오 신호 처리 장치가 제공된다.
본 발명의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계; 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 포함하고,상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것을 특징으로 하는 오디오 신호 처리 방법이 제공된다.
본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계; 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록되고, 상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것인 컴퓨터로 읽을 수 있는 기록 매체.
본 발며의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하고, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하고, 상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범 위 정보를 이용하여 생성된 것인 오디오 신호 처리 장치가 제공된다.
본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 제공된다.
본 발명에 따르면, 상기 비율정보를 생성하는 단계는, 오브젝트 신호들의 오브젝트 레벨 정보를 이용하여 수행될 수 있다.
본 발명에 따르면, 상기 비율정보를 생성하는 단계는, 특정 오브젝트 신호의 오브젝트 레벨 정보, 및 다른 오브젝트 신호의 오브젝트 레벨 정보간의 비율을 이용하여 수행될 수 있다.
본 발명에 따르면, 상기 다른 오브젝트 신호의 오브젝트 레벨 정보는, 둘 이상의 다른 오브젝트 신호의 오브젝트 레벨 정보의 합일 수 있다.
본 발명에 따르면, 상기 게인범위 정보를 생성하는 단계는, 디폴트 가이드 정보, 유저 가이드 정보, 및 인코더 가이드 정보 중 하나 이상을 이용하여 수행될 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 게인 값, 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함할 수 있다.
본 발명에 따르면, 상기 게인범위 정보는, 시간별 서브밴드별로 변화할 수 있다.
본 발명에 따르면, 메인 신호 및 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계를 더 포함하고, 상기 비율정보는, 상기 메인 신호 및 상기 서브 신호간의 상대적인 비율을 포함할 수 있다.
본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고, 상기 믹스 정보는, 오브젝트 위치 정보, 오브젝트 게인 정보, 및 재생 환경 정보 중 하나 이상을 근거로 생성된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 방송 신호를 통해 수신된 것일 수 있다.
본 발명에 따르면, 상기 오디오 신호는, 디지털 매체를 통해 수신된 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.
본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하고, 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 정보 생성부; 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미 터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 오디오 신호 처리 장치가 제공된다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameters), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 그 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
도 1 은 본 발명의 실시예에 따른 오디오 신호 처리 장치의 구성을 보여주는 도면이다. 도 1 을 참조하면, 우선, 본 발명의 실시예에 따른 오디오 신호 처리 장치(100)는 정보 생성 유닛(110), 다운믹스 프로세싱 유닛(120), 멀티채널 디코더(130)를 포함한다.
정보 생성 유닛(information generating unit)(110)은 오브젝트 정보(object information)(OI) 등을 포함하는 부가 정보(side information)를 오디오 신호 비트스트림을 통해 수신하고, 사용자 인터페이스를 통해 믹스 정보(mix in-formation)(MXI)를 수신한다. 여기서, 오브젝트 정보(OI)는 다운믹스 신호 내에 포함되어 있는 오브젝트들에 관한 정보로서, 오브젝트 레벨 정보(object level information), 오브젝트 상관 정보(object correlation information) 등을 포함할 수 있다. 상기 오브젝트 정보(OI)는 오브젝트 특성을 나타내는 파라미터인 오브젝트 파라미터(object parameter)(OP)를 포함할 수 있다. 한편, 믹스 정보(MXI)란, 오브젝트 위치 정보(object position information), 오브젝트 게인 정보(object gain information), 및 재생 환경 정보(playback configuration information) 등을 근거로 생성된 정보로서, 오브젝트 위치 정보란, 사용자가 각 오브젝트의 위치 또는 패닝(panning)를 제어하기 위해 입력한 정보이며, 오브젝트 게인 정보란, 사용자가 각 오브젝트의 게인(gain)을 제어하기 위해 입력한 정보이다. 재생환경 정보는, 스피커의 개수, 스피커의 위치, 앰비언트 정보(speaker 의 가상 위치) 등을 포함하는 정보로서, 사용자로부터 입력받을 수도 있고, 미리 저장되어 있을 수도 있으며, 다른 장치로부터 수신할 수도 있다. 상기 믹스 정보(MXI)는 컨트롤 파라미터(control parameter)(CP)를 포함할 수 있는 데, 이때 컨트롤 파라미터(CP)는 특히 오브젝트 게인 정보에 해당하는 파라미터일 수 있으나, 본 발명은 이에 한정되지 아니한다.
한편, 정보 생성 유닛(110)은 비율 정보(RI) 및 게인범위 정보(GI) 등을 비 트스트림으로부터 수신하거나, 자체적으로 생성한다. 비율 정보(RI), 게인범위 정보(GI) 등에 관한 구체적인 설명은 도 2 내지 도 5 와 함께 후술하고자 한다. 비율 정보(RI) 및 게인범위 정보(GI)를 이용하여 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP) 중 하나 이상을 포함하는 파라미터 정보(PI)를 변형함으로써 변형된 파라미터 정보(MPI)를 생성하고 이를 이용하여 멀티채널 정보(multi-channel information)(MI)를 생성한다. 여기서 멀티채널 정보(MI)는 다운믹스 신호(DMX)를 업믹싱하기 위한 정보로서, 채널 레벨 정보(channel level information), 채널 상관 정보(channel correlation information) 등을 포함할 수 있다. 이에 대해서도 도 2 내지 도 5 에서 구체적으로 기재될 것이다.
한편, 정보 생성 유닛(110)은 변형된 파라미터 정보(MPI) 등을 이용하여 다운믹스 프로세싱 정보(downmix processing information)(DPI)를 생성할 수 있다. 한편, 다운믹스 프로세싱 유닛(120)이 오브젝트 게인을 조절하기 위한 것이 아니라, 오브젝트 패닝만을 조절하기 위한 것이라면, 정보 생성 유닛(110)은 변형된 파라미터 정보(MPI)가 아니라, 변형되지 않은 파라미터 정보(PI)를 이용하여 다운믹스 프로세싱 정보(DPI)를 생성할 수 있다.
다운믹스 프로세싱 유닛(120)은 다운믹스 정보(이하, 다운믹스 신호(DMX))를 수신하고, 다운믹스 프로세싱 정보(DPI)를 이용하여 다운믹스 신호(DMX)를 프로세싱한다. 오브젝트의 패닝 또는 게인을 조절하기 위해 다운믹스 신호(DMX)를 프로세싱할 수 있다.
멀티채널 디코더(multi-channel decoder)(130)는 프로세싱된 다운믹스 (processed downmix)를 수신하고, 멀티채널 정보(MI)를 이용하여 프로세싱된 다운믹스 신호를 업믹싱하여 멀티채널 신호를 생성한다.
이하에서는, 도 2 내지 도 5 를 참조하여, 정보 생성 유닛(110)이 비율 정보(RI) 및 게인범위 정보(GI) 등을 비트스트림으로부터 수신하거나, 자체적으로 생성하고, 이를 이용하여 멀티 채널 정보(MI)를 생성하는 과정에 관해서 구체적으로 설명하고자 한다.
도 2 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 일 예이고, 도 3 은 본 발명의 일 실시예에 따른 오디오 신호 처리 방법의 순서를 나타내는 도면이다. 도 2 및 도 3 는 비율 정보(RI)를 비트스트림으로부터 수신하는 방식의 실시예에 해당하는 도면이다. 우선 도 2 를 참조하면, 정보 생성 유닛(110)은 정보 송수신부(112a), 정보 변형부(114a), 및 멀티채널 정보 생성부(116a)를 포함한다. 이하, 도 2 및 도 3 을 함께 참조하면서, 각 구성요소 및 각 단계에 관하여 구체적으로 설명하고자 한다.
정보 송수신부(112a)는 우선 오디오 신호 비트스트림으로부터 오브젝트 파라미터(CP)를 포함하는 오브젝트 정보(object information)(OI)를 획득하고, 사용자 인터페이스 등으로부터 컨트롤 파라미터(CP)를 포함하는 믹스 정보(mix information)(MXI)를 획득한다(S110 단계). 여기서 오브젝트 정보(OI)는 도 1 과 함께 설명된 오브젝트 정보와 동일한 것일 수 있는데, 오브젝트 정보(OI)에 오브젝트 레벨 정보가 포함되어 전송된 경우, 이 전송된 오브젝트 레벨 정보를 제 1 오브젝트 레벨 정보(OL2)라고 지칭하고자 한다.
그리고 정보 송수신부(112a)는 오디오 신호 비트스트림으로부터 관계 플래그 정보를 획득한다(S120 단계).
관계 플래그 정보 중 제 1 관계 플래그 정보가 비트스트림에 포함될 수 있는데, 제 1 관계 플래그 정보의 의미는, 다운믹스 신호에 포함되어 있는 오브젝트 신호가 모두 독립적인 신호인지, 아니면 관계 신호에 해당하는 신호가 하나 이상 존재하는지 여부를 나타낸다. 예를 들어, 제 1 관계 플래그 정보가 '0'일 때는, 모든 오브젝트 신호가 독립적인 신호임을 의미하고, 제 1 관계 플래그 정보가 '1'일 때, 관계 신호에 해당하는 오브젝트 신호가 하나 이상 존재하는 것을 의미하는 설정할 수 있으나, 본 발명은 이에 한정되지 아니한다. 여기서 관계 신호란, 오브젝트 레벨을 조절하는 데 있어서, 다른 오브젝트 신호와의 상대적인 레벨이 일정 수준 이하 또는 이상이 될 때, 음질의 열화가 발생될 수 있는 신호를 지칭한다.
한편, 제 1 관계 플래그 정보에 따라, 관계 신호에 해당하는 오브젝트 신호가 하나 이상 존재하는 경우(예를 들어, 제 1 관계 플래그 정보가 '1'인 경우), 오브젝트별로 해당 오브젝트가 관계 신호에 해당하는지를 나타내는 제 2 관계 플래그 정보를 추출할 수 있다. 반대로, 관계 신호에 해당하는 오브젝트 신호가 하나도 존재하지 않을 경우(예를 들어, 제 1 관계 플래그 정보가 '0'인 경우), 각 오브젝트별로 관계 신호에 해당하는지 여부를 나타내는 제 2 관계 플래그 정보는 추출할 필요가 없다.
앞서 획득된 제 2 관계 플래그 정보에 따라, 해당 오브젝트 신호가 관계 신호에 해당하는 지 여부를 알 수 있다. 예를 들어, 제 2 관계 플래그 정보가 '0'인 경우 해당 오브젝트 신호는 관계 신호에 해당하지 않는 것을 의미하고, 제 2 관계 플래그 정보가 '1'인 경우 해당 오브젝트 신호는 관계 신호에 해당하는 것을 의미하는 것으로 설정할 수 있으나, 역시 본 발명은 이에 한정되지 아니한다.
이와 같이 S120 단계에 획득된 관계 플래그 정보를 근거로 하여, 비율 정보(RI) 및 게인범위 정보(GI)가 전송되는지 여부를 나타내는 전송 플래그 정보를 획득한다(S130 단계). 구체적으로, 제 2 관계 플래그 정보를 참조한 결과, 해당 오브젝트가 관계 신호에 해당하는 경우(예를 들어, 제 2 관계 플래그 정보가 '1'인 경우), 해당 오브젝트에 대해 전송 플래그 정보를 추출할 수 있다.
S130 단계에서 획득된 전송 플래그 정보를 근거로, 해당 오브젝트에 대해 비율 정보(RI) 및 게인범위 정보(GI)의 전송여부를 알 수 있다. 예를 들어, 전송 플래그 정보가 0인 경우, 비율 정보 및 게인범위 정보가 전송되지 않음을 의미하고, 전송 플래그 정보가 1 인 경우 비율 정보 및 게인범위 정보가 전송되는 것을 의미할 수 있다.
한편, 제 1 관계 플래그 정보 및 제 2 관계 플래그 정보가 비트스트림에 포함되지 않고, 전송 플래그 정보만이 비트스트림에 포함되는 실시예도 구현될 수 있는 바, 본 발명은 이에 한정되지 아니한다.
그런 다음, S130 단계에서 획득된 전송 플래그 정보를 참조한 결과, 비율 정보 및 게인범위 정보가 전송되는 경우(예를 들어, 전송 플래그 정보가 '1'인 경우), 게인범위 정보(GI)가 존재하는 주파수의 해상도를 나타내는 주파수 해상도 정보를 획득한다(S140 단계). 예를 들어, 주파수 해상도 정보가 '1'인 경우, 게인범위 정보가 존재하는 주파수의 해상도가 '28'임을 의미하고, 주파수 해상도 정보가 '2'인 경우, 게인범위 정보가 존재하는 주파수의 해상도가 '20'임을 의미하는 것으로 설정할 수 있지만, 본 발명은 이에 한정되지 아니한다.
또한, S130 단계에서 획득된 전송 플래그 정보를 참조한 결과, 비율 정보(RI) 및 게인범위 정보(GI)가 전송되는 경우(예를 들어, 전송 플래그 정보가 '1'인 경우), 비율 정보(RI) 및 게인범위 정보(GI)를 획득한다(S150 단계)한편, 비율 정보(RI)란, 해당 오브젝트 신호가 메인 신호에 가까운지 또는 서브 신호에 가까운지에 해당하는 정보로서, 구체적으로 메인 신호 및 서브 신호간의 상대적인 비율을 포함할 수 있다. 일 예로, 메인 신호는 음성 신호에, 서브 신호는 잡음 신호에 대응될 수 있고, 다른 예로, 메인 신호는 메인 보컬 신호에, 서브 신호는 백 코러스 신호에 대응될 수 있으나, 본 발명은 이에 한정되지 아니한다. 예를 들어, 비율 정보가 '0'인 경우, 해당 오브젝트 신호가 서브 신호에 매우 가까운 것을 의미하고, '1'인 경우, 해당 오브젝트 신호가 서브 신호에 가까운 것을 의미하고, '2'인 경우, 해당 오브젝트 신호가 메인 신호에 가까운 것을 의미하고, '3'인 경우, 해당 오브젝트 신호가 메인 신호에 매우 가까운 것을 의미하는 것으로 설정할 수 있으나, 본 발명은 이에 한정되지 아니한다.
다른 한편, 게인범위 정보(GI)는, 오브젝트의 게인 조정에 대한 범위를 포함할 수 있는 데, 이때, 상기 범위는 상한값 또는 하한값 등의 제한값으로 결정될 수 있다. 상기 제한값은 특정 오브젝트에 대한 절대적인 게인 값에 해당할 수도 있고, 오브젝트간의 상대적인 게인 차이값에 해당할 수도 있다. 제한값이 절대적인 게인 값에 해당하는 경우, 예를 들어, 보컬 신호의 게인 조정 범위가 10dB 이내가 될 수 있다. 제한값이 상대적인 게인 차이값에 해당하는 경우, 예를 들어, 보컬 신호의 게인 조정 범위가 피아노 신호를 기준으로 10dB 이내가 될 수 있다. 이런 경우, 보컬 신호만을 10dB 만큼 강조할 수도 있고, 또는 보컬 신호를 5dB 만큼 강조하고 피아노 신호를 5dB 만큼 억압할 수도 있다. 이러한 게인범위 정보(GI)는 시간 및 주파수 대역에 대해 불변하는 값일 수도 있지만, 시간별 서브밴드별로 변화할 수도 있다.
나아가, 게인범위 정보(GI)는 상대적인 게인 조정 연동 정보에 해당할 수 있는데, 상대적인 게인 조정 연동 정보란, 특정 오브젝트가 강조되거나 억압되면 경우, 이에 따라 다른 오브젝트도 강조되거나 억압되어야 하는지에 관한 정보이다. 예를 들어, 보컬 신호와 백 코러스 신호의 경우, 보컬 신호가 10dB 강조되었을 때, 이에 따라 백 코러스 신호 또한 5∼15dB 가량 강조되어야 음질 왜곡이 줄어들 수 있다.
S150 단계에서 비율 정보(RI)는 각 오브젝트별 파라미터 세트별로 추출할 수 있고, 게인범위 정보(GI)는 각 오브젝트별로 주파수 해상도에 따라 추출할 수 있으나 본 발명은 이에 한정되지 아니한다.
한편, S150 단계에서 비율 정보(RI)만을 오디오 신호 비트스트림으로부터 추출하고, 게인범위 정보(GI)는 추출하지 않고 자체적으로 생성할 수도 있는데, 게인범위 정보(GI)의 생성에 있어서 추후 도 4 및 도 5 와 함께 설명된 방식이 이용될 수 있다.
정보 송수신부(112a)는 S150 단계에서 획득된 비율 정보(RI) 및 게인범위 정보(GI)를 사용자 인터페이스(200)를 통해 표시할 수 있다(S160 단계). 예를 들어, 보컬 신호가 다른 신호와 관계 신호인지, 보컬 신호의 게인 조정에 있어서 10dB 이상 조정할 경우 음질의 왜곡이 생길 수 있다는 등의 메시지를 사용자가 볼 수 있도록 화면에 표시할 수 있다. 그런 다음 사용자가 이러한 메시지를 확인한 후에, 오브젝트별 게인 조정에 관한 사용자 제어 정보를 사용자 인터페이스(200)를 통해 입력할 수 있다. 이때 사용자 제어 정보는 오브젝트 신호의 제한값(10dB)을 초과한 값(예: 20dB)이 입력되더라도, 제한값 이내로 강제적으로 조정될 수가 있고, 또는 제한값을 초과하더라도 사용자 제어정보(20dB)을 그대로 반영할 수 있다. 이때, S110 단계에서 수신된 믹스 정보(MXI)는 이러한 사용자 제어 정보를 근거로 생성된 것일 수 있다.
정보 변형부(114a)는 S150 단계에 획득된 비율 정보(RI) 및 게인범위 정보(GI)를 이용하여, S110 단계에서 획득된 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP) 중 하나 이상을 포함하는 파라미터 정보(PI)를 변형한다(S170 단계). 구체적으로, 우선 믹스 정보(MXI), 비율 정보(RI)를 이용하여 게인범위 정보(GI)를 변형한 후, 변형된 게인범위 정보(GI)를 오브젝트 파라미터(OP)에 적용함으로써, 변형된 파라미터 정보(MPI)를 생성할수 있으나, 본 발명은 이에 한정되지 아니한다. 상기 S170 단계는, S140 단계에서 추출된 주파수 해상도 정보를 근거로 수행될 수 있다. 구체적으로, S140 단계에서 추출된 주파수 해상도 정보에 따라, 각 주파수 대역에 해당하는 게인범위 정보를 추출하고, 해당 게인범위 정보를 전체 주파수 대 역에 매핑시킨 후, 상기 S180 단계를 수행할 수 있다. 한편, 변형된 파라미터 정보(MPI)는 S110 단계에서 수신된 제 1 오브젝트 레벨 정보(OL1)와는 다른 제 2 오브젝트 레벨 정보(OL2)를 포함할 수 있다.
멀티채널 정보 생성부(116a)는 멀티채널 정보(MI)를 생성하는 데(S180 단계), 이 경우 S110 단계에서 전송된 제 1 오브젝트 레벨 정보(OL1)를 이용하여 멀티채널 정보(MI)를 생성할 수도 있고, S170 단계에서 생성된 변형 파라미터 정보(MPI)의 제 2 오브젝트 레벨 정보(OL2)를 이용하여 멀티채널 정보(MI)를 생성할 수도 있다. 제 1 오브젝트 레벨 정보(OL1)를 이용하는 경우는 물론, 레벨 조정에 있어서의 가이드가 적용되지 않는 경우이다.
도 4 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 다른 예이고, 도 5 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법의 순서를 보여주는 도면이다. 도 4 및 도 5 는 비율 정보(RI)를 디코더에서 자체적으로 생성하는 방식의 실시예에 해당하는 도면이다. 우선 도 4 를 참조하면, 정보 생성 유닛(110)은 정보 송수신부(112b), 정보 생성부(113b), 정보 변형부(114b), 및 멀티채널 정보 생성부(116b)를 포함한다. 이하, 도 4 및 도 5 를 함께 참조하면서, 각 구성요소 및 각 단계에 관하여 구체적으로 설명하고자 한다.
우선 정보 송수신부(112b)는 우선 오디오 신호 비트스트림으로부터 오브젝트 파라미터(OP)를 포함하는 오브젝트 정보(object information)(OI)를 수신하고, 사용자 인터페이스 등으로부터 컨트롤 파라미터(CP)를 포함하는 믹스 정보(mix information)(MXI)를 수신한다(S310 단계). 나아가 정보 송수신부(112b)는 인코더 가이드 정보(encoder guide information)(EGI)를 수신할 수 있다. 인코더 가이드 정보(EGI)란, 인코더에서 생성된 가이드 정보로서, 오브젝트의 게인 조정에 대한 범위를 포함하며, 오디오 신호 비트스트림을 통해 수신된 정보일 수 있다.
정보 생성부(113b)는 S110 단계에서 수신한 오브젝트 정보(OI)를 이용하여 비율 정보를 생성한다(S320 단계). 구체적으로, 오브젝트 정보(OI) 중 오브젝트 레벨 정보(OLI)를 이용하여 비율 정보(RI)를 생성할 수 있다. 여기서 비율 정보(RI)는, 메인 신호 및 서브 신호간의 상대적인 비율에 해당할 수도 있고, 다른 오브젝트 신호(들)와의 레벨 정보 비율에 해당할 수도 있다. 다른 오브젝트 신호와의 레벨 정보의 비율이란 다음과 같이 정의될 수 있다.
[수학식 1]
Figure 112009054029586-PCT00001
여기서, OLDi 는 i 번째 오브젝트 신호의 오브젝트 레벨 정보, ODLk 는 다른 오브젝트 신호의 오브젝트 레벨 정보(k≠i)
한편, 다른 오브젝트 신호가 둘 이상일 경우, 비율 정보(RI)는 다른 오브젝트 신호들 전체와의 레벨 정보 비율에 해당할 수도 있는데, 이는 다음 수학식과 같이 정의될 수 있다.
[수학식 2]
Figure 112009054029586-PCT00002
여기서 OLDi는 i 번재 오브젝트 신호의 오브젝트 레벨 정보, N 은 총 오브젝트 신호 개수, k=0~N (단, k≠i)
S320 단계에서 생성한 비율 정보(RI)를 이용하여 게인범위 정보(GI)를 생성한다(S330 단계). 여기서 게인범위 정보(GI)란, 도 2 및 도 3 과 함께 설명된 게인범위 정보(GI)와 마찬가지로 오브젝트의 게인 조정에 대한 범위를 포함할 수 있고,상기 범위는 상한값 또는 하한값 등과 같은 제한값으로 결정될 수 있다. 이때, 상기 제한값은, 특정 오브젝트에 대한 절대적인 게인 값에 해당할 수도 있고, 오브젝트간의 상대적인 게인 차이값에 해당할 수도 있다. 게인범위 정보(GI)는 시간 및 주파수 대역에 대해 불변하는 값일 수도 있지만, 시간별 서브밴드별로 변화할 수도 있다.
비율 정보(RI)를 이용하여 게인범위 정보(GI)를 생성하는 방식은 여러 가지 방법이 있을 수 있는데, OLDratio 가 매우 높은 경우, 게인범위 정보(GI)의 게인 제한값(Ggain)을 큰 값으로 결정할 수 있다. 왜냐하면, OLDratio 가 높은 경우, 큰 렌더링 자유도를 주어도 음질 왜곡이 적을 수 있기 때문이다. 예를 들어, 보컬 신호의 OLDratio(vocal)가 매우 높은 값일 경우, 보컬 신호에 대해서의 게인 제한값(Ggain)은 20dB 이 될 수도 있다. 보컬 신호의 OLDratio가 피아노 신호에 대해서만 큰 값을 갖게 되면, 보컬 신호의 피아노 신호에 대한 게인 제한값(Ggain(back chorus))만 큰 값이 되도록 할 수 있다.
한편, 보다 정밀한 게인범위 정보(GI)를 생성하기 위해, 인코더에서 오브젝트 레벨 정보(OLD)를 생성할 때, 특정한 주파수 웨이팅을 부여할 수 있다. 예를 들어, 가장 낮은 주파수 대역에 해당하는 0 번째 밴드에 대해 특정 주파수를 강조하는 웨이팅이 부여된 필터를 이용하여 OLD 를 구한 후, 일반적인 방법으로 구한 OLD 와의 차분 정보를 부가 정보로 포함하는 것이 가능하다. 음성 신호 등의 경우, 이러한 차분 정보를 활용하여 게인범위 정보(GI)를 생성하는데 이용할 수 있다.
한편, S330 단계에서 게인범위 정보(GI)를 생성하는 데 있어서, 디폴트 가이드 정보(DGI), 유저 가이드정보(UGI), 및 인코더 가이드정보(EGI) 등이 이용될 수 있다. 디폴트 가이드 정보(default guide information)(DGI)는 디코더 자체에서 미리 정해진 가이드 정보를 뜻하고, 유저 가이드 정보(user guide information)(UGI)는 사용자 인터페이스(200)를 통해 입력된 가이드 정보에 해당하고, 인코더 가이드 정보(encoder guide information)(EGI)는 인코더에서 생성되어 오디오 비트스트림으로부터 추출된 가이드 정보에 해당한다. 게인범위 정보(GI)를 생성하는 데 있어서, 디폴트 가이드 정보(DGI), 유저 가이드 정보(UGI), 및 인코더 가이드 정보(EGI) 등을 참조할 수 있는데, 예를 들어, 오브젝트 레벨 정보만을 근거로 하여 특정 오브젝트의 게인 제한값(Ggain)을 10dB 으로 정할 수 있지만, 이때, 유저 가이드 정보(UGI)가 5dB 인 경우, 이러한 유저 가이드 정보(UGI)를 참조하여 게인범위 정보(GI)를 생성할 수 있는 것이다.
이와 같이 S320 단계에서 생성된 비율 정보(RI), 및 S330 단계에서 생성된 게인범위 정보(GI)는 앞서 설명된 S160 단계와 마찬가지로 사용자 인터페이스(200)를 통해 표시될 수 있다(S340 단계).
정보 변형부(114b)는 앞서 설명된 S170 단계와 마찬가지로, 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP)중 하나 이상을 포함하는 파라미터 정보(PI)를 변형한다(S350 단계).
그리고 멀티채널 정보 생성부(116b)는 역시 앞서 설명된 S190 단계와 마찬가지로, 변형된 파라미터 정보(MPI)를 이용하여 멀티채널 정보(MI)를 생성한다(S360 단계).
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 오디오 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.

Claims (20)

  1. 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,
    상기 비율정보 및 상기 게인범위 정보를 근거로하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 비율정보는, 오디오 신호 비트스트림으로부터 획득된 것을 특징으로 하는 오디오 신호 처리 방법.
  3. 제 2 항에 있어서,
    상기 비율정보 및 상기 게인범위 정보의 전송 여부를 나타내는 전송 플래그 정보를 획득하는 단계를 더 포함하고,
    상기 비율정보 및 상기 게인범위 정보는, 상기 전송 플래그 정보를 근거로 하여 상기 오디오 신호 비트스트림으로부터 획득된 것임을 특징으로 하는 오디오 신호 처리 방법.
  4. 제 3 항에 있어서,
    오브젝트 신호가 관계 신호에 해당하는지 여부를 나타내는 관계 플래그 정보를 획득하는 단계를 더 포함하고,
    상기 전송 플래그 정보를 획득하는 단계는, 상기 관계 플래그 정보를 근거로 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
  5. 제 3 항에 있어서,
    상기 관계 플래그 정보는, 오브젝트 신호가 관계 신호에 해당하는지 여부를 오브젝트별로 나타내는 것임을 특징으로 하는 오디오 신호 처리 방법.
  6. 제 2 항에 있어서,
    주파수 해상도 정보를 수신하는 단계를 더 포함하고,
    상기 파라미터 정보를 변형하는 단계는, 상기 주파수 해상도 정보를 근거로 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
  7. 제 1 항에 있어서,
    상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 게인 값,
    오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  8. 제 1 항에 있어서,
    상기 게인범위 정보는, 시간별 서브밴드별로 변화하는 것을 특징으로 하는 오디오 신호 처리 방법.
  9. 제 1 항에 있어서,
    상기 게인범위 정보를 표시하는 단계; 및,
    오브젝트별 게인 조정에 관한 사용자 제어 정보를 수신하는 단계를 포함하고,
    상기 컨트롤 파라미터는, 상기 사용자 제어 정보를 근거로 생성된 것임을 특징으로 하는 오디오 신호 처리 방법.
  10. 제 1 항에 있어서,
    상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  11. 제 10 항에 있어서,
    상기 메인 신호 및 상기 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계; 및,
    상기 다운믹스 정보 및 상기 멀티채널 정보를 이용하여 멀티채널 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  12. 제 1 항에 있어서,
    상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고,
    상기 믹스 정보는, 오브젝트 위치 정보, 오브젝트 게인 정보, 및 재생 환경 정보 중 하나 이상을 근거로 생성된 것을 특징으로 하는 오디오 신호 처리 방법.
  13. 제 1 항에 있어서,
    상기 오디오 신호는, 방송 신호를 통해 수신된 것을 특징으로 하는 오디오 신호 처리 방법.
  14. 제 1 항에 있어서,
    상기 오디오 신호는, 디지털 매체를 통해 수신된 것을 특징으로 하는 오디오 신호 처리 방법.
  15. 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,
    상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
  16. 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부;
    상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
  17. 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계;
    메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,
    상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 포함하고,
    상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것임을 특징으로 하는 오디오 신호 처리 방법.
  18. 제 17 항에 있어서,
    상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  19. 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계;
    메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,
    상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록되고,
    상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것인 컴퓨터로 읽을 수 있는 기록 매체.
  20. 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하고, 메인 신호 및 서브 신 호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부;
    상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하고,
    상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것임을 특징으로 하는 오디오 신호 처리 장치.
KR1020097018360A 2007-02-13 2008-02-13 오디오 신호 처리 방법 및 장치 KR20090122221A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US88971507P 2007-02-13 2007-02-13
US60/889,715 2007-02-13
US2456208P 2008-01-30 2008-01-30
US61/024,562 2008-01-30

Publications (1)

Publication Number Publication Date
KR20090122221A true KR20090122221A (ko) 2009-11-26

Family

ID=39690253

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020097018361A KR20090115200A (ko) 2007-02-13 2008-02-13 오디오 신호 처리 방법 및 장치
KR1020097018360A KR20090122221A (ko) 2007-02-13 2008-02-13 오디오 신호 처리 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020097018361A KR20090115200A (ko) 2007-02-13 2008-02-13 오디오 신호 처리 방법 및 장치

Country Status (6)

Country Link
US (1) US20100119073A1 (ko)
EP (2) EP2118886A4 (ko)
JP (2) JP2010518452A (ko)
KR (2) KR20090115200A (ko)
CN (2) CN101647060A (ko)
WO (2) WO2008100068A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN102549655B (zh) * 2009-08-14 2014-09-24 Dts有限责任公司 自适应成流音频对象的系统
BR122021008670B1 (pt) * 2009-10-16 2022-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mecanismo e método para fornecer um ou mais parâmetros ajustados para a provisão de uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação lateral paramétrica associada com a representação de sinal downmix, usando um valor médio
KR101418661B1 (ko) * 2009-10-20 2014-07-14 돌비 인터네셔널 에이비 다운믹스 시그널 표현에 기초한 업믹스 시그널 표현을 제공하기 위한 장치, 멀티채널 오디오 시그널을 표현하는 비트스트림을 제공하기 위한 장치, 왜곡 제어 시그널링을 이용하는 방법들, 컴퓨터 프로그램 및 비트 스트림
MY154641A (en) * 2009-11-20 2015-07-15 Fraunhofer Ges Forschung Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter
US9042559B2 (en) 2010-01-06 2015-05-26 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
EP2717261A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
JP5591423B1 (ja) 2013-03-13 2014-09-17 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
TWI505724B (zh) * 2013-06-10 2015-10-21 Princeton Technology Corp 增益控制系統、聲音播放系統及其增益控制之方法
WO2016038876A1 (ja) * 2014-09-08 2016-03-17 日本放送協会 符号化装置、復号化装置及び音声信号処理装置
KR102465286B1 (ko) 2015-06-17 2022-11-10 소니그룹주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5128597A (en) * 1990-06-14 1992-07-07 Kabushiki Kaisha Tokai-Rika-Denki-Seisakusho Control apparatus for power window regulator
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US5838664A (en) * 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6026168A (en) * 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
DE69826529T2 (de) * 1998-04-15 2005-09-22 Stmicroelectronics Asia Pacific (Pte) Ltd. Schnelle datenrahmen-optimierung in einem audio-kodierer
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7103187B1 (en) * 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
JP4870896B2 (ja) * 2000-07-19 2012-02-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ステレオサラウンド及び/又はオーディオ中央信号を得るマルチチャンネルステレオコンバータ
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
WO2004080125A1 (en) * 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP2006337767A (ja) * 2005-06-02 2006-12-14 Matsushita Electric Ind Co Ltd 低演算量パラメトリックマルチチャンネル復号装置および方法
WO2007010785A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
ATE542216T1 (de) * 2006-07-07 2012-02-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zum kombinieren mehrerer parametrisch kodierter audioquellen

Also Published As

Publication number Publication date
US20100119073A1 (en) 2010-05-13
WO2008100068A1 (en) 2008-08-21
KR20090115200A (ko) 2009-11-04
WO2008100067A1 (en) 2008-08-21
CN101627425A (zh) 2010-01-13
JP2010518452A (ja) 2010-05-27
EP2118886A4 (en) 2010-04-21
JP2010518460A (ja) 2010-05-27
EP2111618A1 (en) 2009-10-28
EP2118886A1 (en) 2009-11-18
EP2111618A4 (en) 2010-04-21
CN101647060A (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
KR20090122221A (ko) 오디오 신호 처리 방법 및 장치
KR101100221B1 (ko) 오디오 신호의 디코딩 방법 및 그 장치
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
KR101569032B1 (ko) 오디오 신호의 디코딩 방법 및 장치
US8725279B2 (en) Method and an apparatus for processing an audio signal
KR101137361B1 (ko) 오디오 신호 처리 방법 및 장치
US8577482B2 (en) Device and method for generating an ambience signal
US9743215B2 (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
JPWO2006075563A1 (ja) オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
KR101062353B1 (ko) 오디오 신호의 디코딩 방법 및 그 장치
CN103650538A (zh) 用于使用采用谱权重生成器的频域处理分解立体声录音的方法和装置
TWI468031B (zh) 用以產生供提供額外輸出聲道的立體音響輸出信號之裝置、方法及電腦程式
WO2012005074A1 (ja) 音声信号処理装置、方法、プログラム、及び記録媒体
US20100121470A1 (en) Method and an apparatus for processing an audio signal
JP2010118978A (ja) 音像定位制御装置および音像定位制御方法
JP2010118977A (ja) 音像定位制御装置および音像定位制御方法
KR20080033840A (ko) 믹스 신호의 처리 방법 및 장치
Uhle Center signal scaling using signal-to-downmix ratios
JP2015065551A (ja) 音声再生システム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application