KR20090115200A

KR20090115200A - 오디오 신호 처리 방법 및 장치

Info

Publication number: KR20090115200A
Application number: KR1020097018361A
Authority: KR
Inventors: 오현오; 정양원
Original assignee: 엘지전자 주식회사
Priority date: 2007-02-13
Filing date: 2008-02-13
Publication date: 2009-11-04
Also published as: EP2118886A1; EP2111618A4; KR20090122221A; US20100119073A1; EP2111618A1; EP2118886A4; CN101647060A; CN101627425A; JP2010518460A; WO2008100067A1; JP2010518452A; WO2008100068A1

Abstract

메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및, 상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.

오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.

Description

오디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}

본 발명은 오디오 신호의 처리 방법 및 장치에 관한 것으로, 보다 상세하게는 디지털 매체, 방송 신호 등으로 수신된 오디오 신호를 처리할 수 있는 오디오 신호의 처리 방법 및 장치에 관한 것이다.

일반적으로, 다수 개의 오브젝트를 모노 또는 스테레오 신호로 다운믹스하는 과정에 있어서, 각각의 오브젝트 신호로부터 파라미터들이 추출된다. 이러한 파라미터들은 디코더에서 사용될 수 있는 데, 각각의 오브젝들의 패닝(panning)과 게인(gain)은 유저의 선택에 의해 컨트롤 될 수 있다.

Technical Problem

각각의 오브젝트 시그널을 제어하기 위해서는, 다운믹스에 포함되어 있는 각각의 소스들이 적절히 포지셔닝 또는 패닝되어야 한다.

또한, 채널 기반(channel-oriented) 디코딩 방식으로 하향 호환성을 갖기 위해서는, 오브젝트 파라미터는 업믹싱을 위한 멀티 채널 파라미터로 유연하게 변환되어야 한다.

Technical Solution

본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 오브젝트의 게인과 패닝을 제한없이 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.

본 발명의 또 다른 목적은, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.

본 발명의 또 다른 목적은, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤하되, 일정 제한 범위 내에서만 컨트롤할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.

Advantageous Effects

본 발명은 다음과 같은 효과와 이점을 제공한다.

우선, 오브젝트의 게인과 패닝을 제한없이 컨트롤 할 수 있다.

둘째, 유저의 선택을 기반으로 오브젝트의 게인과 패닝을 컨트롤할 수 있다.

셋째, 오브젝트의 게인을 조정하는 경우, 게인 조정에 대한 게인범위를 제공함으로써, 게인 조정에 따라 음질이 왜곡되는 것을 방지할 수 있다.

도 1 은 본 발명의 실시예에 따른 오디오 신호 처리 장치의 구성도.

도 2 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 일 예.

도 3 은 본 발명의 일 실시예에 따른 오디오 신호 처리 방법의 순서도.

도 4 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 다른 예.

도 5 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법의 순서도.

Best Mode for Carrying Out the Invention

상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함한다.

본 발명에 따르면, 상기 비율정보는, 오디오 신호 비트스트림으로부터 획득된 것일 수 있다.

본 발명에 따르면, 상기 비율정보 및 상기 게인범위 정보의 전송 여부를 나타내는 전송 플래그 정보를 획득하는 단계를 더 포함하고, 상기 비율정보 및 상기 게인범위 정보는, 상기 전송 플래그 정보를 근거로 하여 상기 오디오 신호 비트스트림으로부터 획득된 것일 수 있다.

본 발명에 따르면, 오브젝트 신호가 관계 신호에 해당하는지 여부를 나타내는 관계 플래그 정보를 획득하는 단계를 더 포함하고, 상기 전송 플래그 정보를 획득하는 단계는, 상기 관계 플래그 정보를 근거로 수행되는 것일 수 있다.

본 발명에 따르면, 상기 관계 플래그 정보는, 오브젝트 신호가 관계 신호에 해당하는지 여부를 오브젝트별로 나타내는 것일 수 있다.

발명에 따르면, 주파수 해상도 정보를 수신하는 단계를 더 포함하고,상기 파라미터 정보를 변형하는 단계는, 상기 주파수 해상도 정보를 근거로 수행되는 것일 수 있다.

본발명에 따르면, 상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인, 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함할 수 있다.

본 발명에 따르면, 상기 게인범위 정보는, 시간별 서브밴드별로 변화하는 것일 수 있다.

본 발명에 따르면, 상기 게인범위 정보를 표시하는 단계; 및, 오브젝트별 게인 조정에 관한 사용자 제어 정보를 수신하는 단계를 포함하고, 상기 컨트롤 파라미터는, 상기 사용자 제어 정보를 근거로 생성된 것일 수 있다.

본 발명에 따르면, 상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함할 수 있다.

본 발명에 따르면, 상기 메인 신호 및 상기 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계; 및, 상기 다운믹스 정보 및 상기 멀티채널 정보를 이용하여 멀티채널 신호를 생성하는 단계를 더 포함할 수 있다.

본 발명에 따르면, 상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고, 상기 믹스 정보는, 오브젝트 위치 정보, 오브젝트 게인 정보, 및 재생 환경 정보 중 하나 이상을 근거로 생성된 것일 수 있다.

본 발명에 따르면, 상기 오디오 신호는, 방송 신호를 통해 수신된 것일 수 있다.

본 발명에 따르면, 상기 오디오 신호는, 디지털 매체를 통해 수신된 것일 수 있다.

본 발명의 또 다른 측면에 따르면, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 및,상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.

본 발명의 또 다른 측면에 따르면, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부; 상기 비율정보 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 오디오 신호 처리 장치가 제공된다.

본 발명의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계; 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 포함하고,상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것을 특징으로 하는 오디오 신호 처리 방법이 제공된다.

본 발명의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하는 단계; 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 단계; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록되고, 상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것인 컴퓨터로 읽을 수 있는 기록 매체.

본 발며의 또 다른 측면에 따르면, 제 1 레벨정보를 포함하는 오브젝트 정보를 획득하고, 메인 신호 및 서브 신호의 비율정보, 및 오브젝트의 게인범위 정보를 획득하는 정보 송수신부; 상기 제 1 레벨정보 및 제 2 레벨 정보 중 하나를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하고, 상기 제 2 레벨정보는, 상기 비율정보 및 상기 게인범위 정보를 이용하여 생성된 것인 오디오 신호 처리 장치가 제공된다.

본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 오디오 신호 처리 방법이 제공된다.

본 발명에 따르면, 상기 비율정보를 생성하는 단계는, 오브젝트 신호들의 오브젝트 레벨 정보를 이용하여 수행될 수 있다.

본 발명에 따르면, 상기 비율정보를 생성하는 단계는, 특정 오브젝트 신호의 오브젝트 레벨 정보, 및 다른 오브젝트 신호의 오브젝트 레벨 정보간의 비율을 이용하여 수행될 수 있다.

본 발명에 따르면, 상기 다른 오브젝트 신호의 오브젝트 레벨 정보는, 둘 이상의 다른 오브젝트 신호의 오브젝트 레벨 정보의 합일 수 있다.

본 발명에 따르면, 상기 게인범위 정보를 생성하는 단계는, 디폴트 가이드 정보, 유저 가이드 정보, 및 인코더 가이드 정보 중 하나 이상을 이용하여 수행될 수 있다.

본 발명에 따르면, 상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 , 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함할 수 있다.

본 발명에 따르면, 상기 게인범위 정보는, 시간별 서브밴드별로 변화할 수 있다.

본 발명에 따르면, 메인 신호 및 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계를 더 포함하고, 상기 비율정보는, 상기 메인 신호 및 상기 서브 신호간의 상대적인 비율을 포함할 수 있다.

본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하는 단계; 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.

본 발명의 또 다른 측면에 따르면, 오브젝트 정보를 이용하여 비율정보를 생성하고, 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 정보 생성부; 및 상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 오디오 신호 처리 장치가 제공된다.

이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.

특히, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameters), 계수(coeffcients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 그 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.

도 1 은 본 발명의 실시예에 따른 오디오 신호 처리 장치의 구성을 보여주는 도면이다. 도 1 을 참조하면, 우선, 본 발명의 실시예에 따른 오디오 신호 처리 장치(100)는 정보 생성 유닛(110), 다운믹스 프로세싱 유닛(120), 멀티채널 더코더(130)를 포함한다.

정보 생성 유닛(information generating unit)(110)은 오브젝트 정보(object information)(OI) 등을 포함하는 부가 정보(side information)를 오디오 신호 비트스트림을 통해 수신하고, 사용자 인터페이스를 통해 믹스 정보(mix information)(MXI)를 수신한다. 여기서, 오브젝트 정보(OI)는 다운믹스 신호 내에 포함되어 있는 오브젝트들에 관한 정보로서, 오브젝트 레벨 정보(object level information), 오브젝트 상관 정보(object correlation information) 등을 포함할 수 있다. 상기 오브젝트 정보(OI)는 오브젝트 특성을 나타내는 파라미터인 오브젝트 파라미터(object parameter)(OP)를 포함할 수 있다. 한편, 믹스 정보(MXI)란, 오브젝트 위치 정보(object position information), 오브젝트 게인 정보(object gain information), 및 재생 환경 정보(playback configuration information) 등을 근거로 생성된 정보로서, 오브젝트 위치 정보란, 사용자가 각 오브젝트의 위치 또는 패닝(panning)를 제어하기 위해 입력한 정보이며, 오브젝트 게인 정보란, 사용자가 각 오브젝트의 게인(gain)을 제어하기 위해 입력한 정보이다. 재생환경 정보는, 스피커의 개수, 스피커의 위치, 앰비언트 정보(speaker 의 가상 위치) 등을 포함하는 정보로서, 사용자로부터 입력받을 수도 있고, 미리 저장되어 있을 수도 있으며, 다른 장치로부터 수신할 수도 있다. 상기 믹스정보(MXI)는 컨트롤 파라미터(control parameter)(CP)를 포함할 수 있는 데, 이때 컨트롤 파라미터(CP)는 특히 오브젝트 게인 정보에 해당하는 파라미터일 수 있으나, 본 발명은 이에 한정되지 아니한다.

한편, 정보 생성 유닛(110)은 비율 정보(RI) 및 게인범위 정보(GI) 등을 비트스트림으로부터 수신하거나, 자체적으로 생성한다. 비율 정보(RI), 게인범위 정보(GI) 등에 관한 구체적인 설명은 도 2 내지 도 5 와 함께 후술하고자 한다. 비율정보(RI) 및 게인범위 정보(GI)를 이용하여 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP) 중 하나 이상을 포함하는 파라미터 정보(PI)를 변형함으로써 변형된 파라미터 정보(MPI)를 생성하고 이를 이용하여 멀티채널 정보(multi-channel information)(MI)를 생성한다. 여기서 멀티채널 정보(MI)는 다운믹스 신호(DMX)를 업믹싱하기 위한 정보로서, 채널 레벨 정보(channel level information), 채널 상관 정보(channel correlation information) 등을 포함할 수 있다. 이에 대해서도 도 2 내지 도 5 에서 구체적으로 기재될 것이다.

한편, 정보 생성 유닛(110)은 변형된 파라미터 정보(MPI) 등을 이용하여 다운믹스 프로세싱 정보(downmix processing information)(DPI)를 생성할 수 있다. 한편, 다운믹스 프로세싱 유닛(120)이 오브젝트 게인을 조절하기 위한 것이 아니라, 오브젝트 패닝만을 조절하기 위한 것이라면, 정보 생성 유닛(110)은 변형된 파라미터 정보(MPI)가 아니라, 변형되지 않은 파라미터 정보(PI)를 이용하여 다운믹스 프로세싱 정보(DPI)를 생성할 수 있다.

다운믹스 프로세싱 유닛(120)은 다운믹스 정보(이하, 다운믹스 신호(DMX))를 수신하고, 다운믹스 프로세싱 정보(DPI)를 이용하여 다운믹스 신호(DMX)를 프로세싱한다. 오브젝트의 패닝 또는 게인을 조절하기 위해 다운믹스 신호(DMX)를 프로세싱할 수 있다.

멀티채널 디코더(multi-channel decoder)(130)는 프로세싱된 다운믹스(processed downmix)를 수신하고, 멀티채널 정보(MI)를 이용하여 프로세싱된 다운믹스 신호를 업믹싱하여 멀티채널 신호를 생성한다.

이하에서는, 도 2 내지 도 5 를 참조하여, 정보 생성 유닛(110)이 비율 정보(RI) 및 게인범위 정보(GI) 등을 비트스트림으로부터 수신하거나, 자체적으로 생성하고, 이를 이용하여 멀티 채널 정보(MI)를 생성하는 과정에 관해서 구체적으로 설명하고자 한다.

도 2 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 일 예이고, 도 3 은 본 발명의 일 실시예에 따른 오디오 신호 처리 방법의 순서를 나타내는 도면이다. 도 2 및 도 3 는 비율 정보(RI)를 비트스트림으로부터 수신하는 방식의 실시예에 해당하는 도면이다. 우선 도 2 를 참조하면, 정보 생성 유닛(110)은 정보 송수신부(112a), 정보 변형부(114a), 및 멀티채널 정보 생성부(116a)를 포함한다. 이하, 도 2 및 도 3 을 함께 참조하면서, 각 구성요소 및 각 단계에 관하여 구체적으로 설명하고자 한다.

정보 송수신부(112a)는 우선 오디오 신호 비트스트림으로부터 오브젝트 파라미터(CP)를 포함하는 오브젝트 정보(object information)(OI)를 획득하고, 사용자 인터페이스 등으로부터 컨트롤 파라미터(CP)를 포함하는 믹스 정보(mix information)(MXI)를 획득한다(S110 단계). 여기서 오브젝트 정보(OI)는 도 1 과 함께 설명된 오브젝트 정보와 동일한 것일 수 있는데, 오브젝트 정보(OI)에 오브젝트 레벨 정보가 포함되어 전송된 경우, 이 전송된 오브젝트 레벨 정보를 제 1 오브젝트 레벨 정보(OL2)라고 지칭하고자 한다.

그리고 정보 송수신부(112a)는 오디오 신호 비트스트림으로부터 관계 플래그 정보를 획득한다(S120 단계).

관계 플래그 정보 중 제 1 관계 플래그 정보가 비트스트림에 포함될 수 있는데, 제 1 관계 플래그 정보의 의미는, 다운믹스 신호에 포함되어 있는 오브젝트 신호가 모두 독립적인 신호인지, 아니면 관계 신호에 해당하는 신호가 하나 이상 존재하는지 여부를 나타낸다. 예를 들어, 제 1 관계 플래그 정보가 '0'일 때는, 모든 오브젝트 신호가 독립적인 신호임을 의미하고, 제 1 관계 플래그 정보가 '1'일 때, 관계 신호에 해당하는 오브젝트 신호가 하나 이상 존재하는 것을 의미하는 설정할 수 있으나, 본 발명은 이에 한정되지 아니한다. 여기서 관계 신호란, 오브젝트 레벨을 조절하는 데 있어서, 다른 오브젝트 신호와의 상대적인 레벨이 일정 수준 이하 또는 이상이 될 때, 음질의 열화가 발생될 수 있는 신호를 지칭한다.

한편, 제 1 관계 플래그 정보에 따라, 관계 신호에 해당하는 오브젝트 신호가 하나 이상 존재하는 경우(예를 들어, 제 1 관계 플래그 정보가 '1'인 경우), 오브젝트별로 해당 오브젝트가 관계 신호에 해당하는지를 나타내는 제 2 관계 플래그 정보를 추출할 수 있다. 반대로, 관계 신호에 해당하는 오브젝트 신호가 하나도 존재하지 않을 경우(예를 들어, 제 1 관계 플래그 정보가 '0'인 경우), 각 오브젝트별로 관계 신호에 해당하는지 여부를 나타내는 제 2 관계 플래그 정보는 추출할 필요가 없다.

앞서 획득된 제 2 관계 플래그 정보에 따라, 해당 오브젝트 신호가 관계 신호에 해당하는 지 여부를 알 수 있다. 예를 들어, 제 2 관계 플래그 정보가 '0'인 경우 해당 오브젝트 신호는 관계 신호에 해당하지 않는 것을 의미하고, 제 2 관계 플래그 정보가 '1'인 경우 해당 오브젝트 신호는 관계 신호에 해당하는 것을 의미하는 것으로 설정할 수 있으나, 역시 본 발명은 이에 한정되지 아니한다.

이와 같이 S120 단계에 획득된 관계 플래그 정보를 근거로 하여, 비율 정보(RI) 및 게인범위 정보(GI)가 전송되는지 여부를 나타내는 전송 플래그 정보를 획득한다(S130 단계). 구체적으로, 제 2 관계 플래그 정보를 참조한 결과, 해당 오브젝트가 관계 신호에 해당하는 경우(예를 들어, 제 2 관계 플래그 정보가 '1'인 경우), 해당 오브젝트에 대해 전송 플래그 정보를 추출할 수 있다.

S130 단계에서 획득된 전송 플래그 정보를 근거로, 해당 오브젝트에 대해 비율 정보(RI) 및 게인범위 정보(GI)의 전송여부를 알 수 있다. 예를 들어, 전송 플래그 정보가 0 인 경우, 비율 정보 및 게인범위 정보가 전송되지 않음을 의미하고, 전송 플래그 정보가 1 인 경우 비율 정보 및 게인범위 정보가 전송되는 것을 의미할 수 있다.

한편, 제 1 관계 플래그 정보 및 제 2 관계 플래그 정보가 비트스트림에 포함되지 않고, 전송 플래그 정보만이 비트스트림에 포함되는 실시예도 구현될 수 있는 바, 본 발명은 이에 한정되지 아니한다.

그런 다음, S130 단계에서 획득된 전송 플래그 정보를 참조한 결과, 비율 정보 및 게인범위 정보가 전송되는 경우(예를 들어, 전송 플래그 정보가 '1'인 경우), 게인범위 정보(GI)가 존재하는 주파수의 해상도를 나타내는 주파수 해상도 정보를 획득한다(S140 단계). 예를 들어, 주파수 해상도 정보가 '1'인 경우, 게인범위 정보가 존재하는 주파수의 해상도가 '28'임을 의미하고, 주파수 해상도 정보가 '2'인 경우, 게인범위 정보가 존재하는 주파수의 해상도가 '20'임을 의미하는 것으로 설정할 수 있지만, 본 발명은 이에 한정되지 아니한다.

또한, S130 단계에서 획득된 전송 플래그 정보를 참조한 결과, 비율 정보(RI) 및 게인범위 정보(GI)가 전송되는 경우(예를 들어, 전송 플래그 정보가 '1'인 경우), 비율 정보(RI) 및 게인범위 정보(GI)를 획득한다(S150 단계)한편, 비율 정보(RI)란, 해당 오브젝트 신호가 메인 신호에 가까운지 또는 서브 신호에 가까운지에 해당하는 정보로서, 구체적으로 메인 신호 및 서브 신호간의 상대적인 비율을 포함할 수 있다. 일 예로, 메인 신호는 음성 신호에, 서브 신호는 잡음 신호에 대응될 수 있고, 다른 예로, 메인 신호는 메인 보컬 신호에, 서브 신호는 백 코러스 신호에 대응될 수 있으나, 본 발명은 이에 한정되지 아니한다. 예를 들어, 비율 정보가 '0'인 경우, 해당 오브젝트 신호가 서브 신호에 매우 가까운 것을 의미하고, '1'인 경우, 해당 오브젝트 신호가 서브 신호에 가까운 것을 의미하고, '2'인 경우, 해당 오브젝트 신호가 메인 신호에 가까운 것을 의미하고, '3'인 경우, 해당 오브젝트 신호가 메인 신호에 매우 가까운 것을 의미하는 것으로 설정할 수 있으나, 본 발명은 이에 한정되지 아니한다.

다른 한편, 게인범위 정보(GI)는, 오브젝트의 게인 조정에 대한 범위를 포함할 수 있는 데, 이때, 상기 범위는 상한값 또는 하한값 등의 제한값으로 결정될 수 있다. 상기 제한값은 특정 오브젝트에 대한 절대적인 게인 값에 해당할 수도 있고, 오브젝트간의 상대적인 게인 차이값에 해당할 수도 있다. 제한값이 절대적인 게인 값에 해당하는 경우, 예를 들어, 보컬 신호의 게인 조정 범위가 10dB 이내가 될 수 있다. 제한값이 상대적인 게인 차이값에 해당하는 경우, 예를들어, 보컬 신호의 게인 조정 범위가 피아노 신호를 기준으로 10dB 이내가 될 수 있다. 이런 경우, 보컬 신호만을 10dB 만큼 강조할 수도 있고, 또는 보컬 신호를 5dB 만큼 강조하고 피아노 신호를 5dB 만큼 억압할 수도 있다. 이러한 게인범위 정보(GI)는 시간 및 주파수 대역에 대해 불변하는 값일 수도 있지만, 시간별 서브밴드별로 변화할 수도 있다.

나아가, 게인범위 정보(GI)는 상대적인 게인 조정 연동 정보에 해당할 수 있 는데, 상대적인 게인 조정 연동 정보란, 특정 오브젝트가 강조되거나 억압되면 경우, 이에 따라 다른 오브젝트도 강조되거나 억압되어야 하는지에 관한 정보이다. 예를 들어, 보컬 신호와 백 코러스 신호의 경우, 보컬 신호가 10dB 강조되었을 때, 이에 따라 백 코러스 신호 또한 5∼15dB 가량 강조되어야 음질 왜곡이 줄어들 수 있다.

S150 단계에서 비율 정보(RI)는 각 오브젝트별 파라미터 세트별로 추출할 수 있고, 게인범위 정보(GI)는 각 오브젝트별로 주파수 해상도에 따라 추출할 수 있으나 본 발명은 이에 한정되지 아니한다.

한편, S150 단계에서 비율 정보(RI)만을 오디오 신호 비트스트림으로부터 추출하고, 게인범위 정보(GI)는 추출하지 않고 자체적으로 생성할 수도 있는데, 게인범위 정보(GI)의 생성에 있어서 추후 도 4 및 도 5 와 함께 설명된 방식이 이용될 수 있다.

정보 송수신부(112a)는 S150 단계에서 획득된 비율 정보(RI) 및 게인범위 정보(GI)를 사용자 인터페이스(200)를 통해 표시할 수 있다(S160 단계). 예를 들어, 보컬 신호가 다른 신호와 관계 신호인지, 보컬 신호의 게인 조정에 있어서 10dB 이상 조정할 경우 음질의 왜곡이 생길 수 있다는 등의 메시지를 사용자가 볼 수 있도록 화면에 표시할 수 있다. 그런 다음 사용자가 이러한 메시지를 확인한 후에, 오브젝트별 게인 조정에 관한 사용자 제어 정보를 사용자 인터페이스(200)를 통해 입력할 수 있다. 이때 사용자 제어 정보는 오브젝트 신호의 제한값(10dB)을 초과한 값(예: 20dB)이 입력되더라도, 제한값 이내로 강제적으로 조정될 수가 있고, 또는 제한값을 초과하더라도 사용자 제어정보(20dB)을 그대로 반영할 수 있다. 이때, S110 단계에서 수신된 믹스 정보(MXI)는 이러한 사용자 제어 정보를 근거로 생성된 것일 수 있다.

정보 변형부(114a)는 S150 단계에 획득된 비율 정보(RI) 및 게인범위 정보(GI)를 이용하여, S110 단계에서 획득된 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP) 중 하나 이상을 포함하는 파라미터 정보(PI)를 변형한다(S170 단계). 구체적으로, 우선 믹스 정보(MXI),비율 정보(RI)를 이용하여 게인범위 정보(GI)를 변형한 후, 변형된 게인범위 정보(GI)를 오브젝트 파라미터(OP)에 적용함으로써, 변형된 파라미터 정보(MPI)를 생성할 수 있으나, 본 발명은 이에 한정되지 아니한다. 상기 S170 단계는, S140 단계에서 추출된 주파수 해상도 정보를 근거로 수행될 수 있다. 구체적으로, S140 단계에서 추출된 주파수 해상도 정보에 따라, 각 주파수 대역에 해당하는 게인범위 정보를 추출하고, 해당 게인범위 정보를 전체 주파수 대역에 매핑시킨 후, 상기 S180 단계를 수행할 수 있다. 한편, 변형된 파라미터 정보(MPI)는 S110 단계에서 수신된 제 1 오브젝트 레벨 정보(OL1)와는 다른 제 2 오브젝트 레벨 정보(OL2)를 포함할 수 있다.

멀티채널 정보 생성부(116a)는 멀티채널 정보(MI)를 생성하는 데(S180 단계), 이 경우 S110 단계에서 전송된 제 1 오브젝트 레벨 정보(OL1)를 이용하여 멀티채널 정보(MI)를 생성할 수도 있고, S170 단계에서 생성 된 변형 파라미터 정보(MPI)의 제 2 오브젝트 레벨 정보(OL2)를 이용하여 멀티채널 정보(MI)를 생성할 수도 있다. 제 1 오브젝트 레벨 정보(OL1)를 이용하는 경우는 물론, 레벨 조정에 있 어서의 가이드가 적용되지 않는 경우이다.

도 4 는 본 발명의 실시예에 따른 오디오 신호 처리 장치 중 정보 생성 유닛의 세부 구성도를 나타낸 다른 예이고, 도 5 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 방법의 순서를 보여주는 도면이다. 도 4 및 도 5 는 비율 정보(RI)를 디코더에서 자체적으로 생성하는 방식의 실시예에 해당하는 도면이다. 우선 도 4 를 참조하면, 정보 생성 유닛(110)은 정보 송수신부(112b), 정보 생성부(113b), 정보 변형부(114b), 및 멀티채널 정보 생성부(116b)를 포함한다. 이하, 도 4 및 도 5 를 함께 참조하면서, 각 구성요소 및 각 단계에 관하여 구체적으로 설명하고자 한다.

우선 정보 송수신부(112b)는 우선 오디오 신호 비트스트림으로부터 오브젝트 파라미터(OP)를 포함하는 오브젝트 정보(object information)(OI)를 수신하고, 사용자 인터페이스 등으로부터 컨트롤 파라미터(CP)를 포함하는 믹스 정보(mix information)(MXI)를 수신한다(S310 단계). 나아가 정보 송수신부(112b)는 인코더 가이드 정보(encoder guide information)(EGI)를 수신할 수 있다. 인코더 가이드 정보(EGI)란, 인코더에서 생성된 가이드 정보로서, 오브젝트의 게인 조정에 대한 범위를 포함하며, 오디오 신호 비트스트림을 통해 수신된 정보일 수 있다.

정보 생성부(113b)는 S110 단계에서 수신한 오브젝트 정보(OI)를 이용하여 비율 정보를 생성한다(S320 단계). 구체적으로, 오브젝트 정보(OI) 중 오브젝트 레벨 정보(OLI)를 이용하여 비율 정보(RI)를 생성할 수 있다. 여기서 비율 정보(RI)는, 메인신호 및 서브 신호간의 상대적인 비율에 해당할 수도 있고, 다른 오브젝트 신호(들)와의 레벨 정보 비율에 해당할 수도 있다. 다른 오브젝트 신호와의 레벨 정보의 비율이란 다음과 같이 정의될 수 있다.

[수학식 1]

여기서, OLD_i 는 i 번째 오브젝트 신호의 오브젝트 레벨 정보, ODL_k 는 다른 오브젝트 신호의 오브젝트 레벨 정보(k≠i)

한편, 다른 오브젝트 신호가 둘 이상일 경우, 비율 정보(RI)는 다른 오브젝트 신호들 전체와의 레벨 정보 비율에 해당할 수도 있는데, 이는 다음 수학식과 같이 정의될 수 있다.

[수학식 2]

여기서 OLD_i는 i 번째 오브젝트 신호의 오브젝트 레벨 정보, N 은 총 오브젝트 신호 개수, k=0∼N (단, k≠i)

S320 단계에서 생성한 비율 정보(RI)를 이용하여 게인범위 정보(GI)를 생성한다(S330 단계). 여기서 게인범위 정보(GI)란, 도 2 및 도 3 과 함께 설명된 게인범위 정보(GI)와 마찬가지로 오브젝트의 게인 조정에 대한 범위를 포함할 수 있고, 상기 범위는 상한값 또는 하한값 등과 같은 제한값으로 결정될 수 있다. 이때, 상 기 제한값은, 특정 오브젝트에 대한 절대적인 게인 값에 해당할 수도 있고, 오브젝트간의 상대적인 게인 차이값에 해당할 수도 있다. 게인범위 정보(GI)는 시간 및 주파수 대역에 대해 불변하는 값일 수도 있지만, 시간별 서브밴드별로 변화할 수도 있다.

비율 정보(RI)를 이용하여 게인범위 정보(GI)를 생성하는 방식은 여러 가지 방법이 있을 수 있는데, OLD_ratio 가 매우 높은 경우, 게인범위 정보(GI)의 게인 제한값(G_gain)을 큰 값으로 결정할 수 있다. 왜냐하면, OLD_ratio 가 높은 경우, 큰 렌더링 자유도를 주어도 음질 왜곡이 적을 수 있기 때문이다. 예를 들어, 보컬 신호의 OLD_ratio (vocal)가 매우 높은 값일 경우, 보컬 신호에 대해서의 게인 제한값(G_gain)은 20dB 이 될 수도 있다. 보컬 신호의 OLD_ratio 가 피아노 신호에 대해서만 큰 값을 갖게 되면, 보컬 신호의 피아노 신호에 대한 게인 제한값(G_gain(back chorus))만 큰 값이 되도록 할 수 있다.

한편, 보다 정밀한 게인범위 정보(GI)를 생성하기 위해, 인코더에서 오브젝트 레벨 정보(OLD)를 생성할 때, 특정한 주파수 웨이팅을 부여할 수 있다. 예를 들어, 가장 낮은 주파수 대역에 해당하는 0 번째 밴드에 대해 특정 주파수를 강조하는 웨이팅이 부여된 필터를 이용하여 OLD 를 구한 후, 일반적인 방법으로 구한 OLD 와의 차분 정보를 부가 정보로 포함하는 것이 가능하다. 음성 신호 등의 경우, 이러한 차분 정보를 활용하여 게인범위 정보(GI)를 생성하는데 이용할 수 있다.

한편, S330 단계에서 게인범위 정보(GI)를 생성하는 데 있어서, 디폴트 가이드 정보(DGI), 유저 가이드 정보(UGI), 및 인코더 가이드 정보(EGI) 등이 이용될 수 있다. 디폴트 가이드 정보(default guide information)(DGI)는 디코더 자체에서 미리 정해진 가이드 정보를 뜻하고, 유저 가이드 정보(user guide information)(UGI)는 사용자 인터페이스(200)를 통해 입력된 가이드 정보에 해당하고, 인코더 가이드 정보(encoder guide information)(EGI)는 인코더에서 생성되어 오디오 비트스트림으로부터 추출된 가이드 정보에 해당한다. 게인범위 정보(GI)를 생성하는 데 있어서, 디폴트 가이드 정보(DGI), 유저 가이드 정보(UGI), 및 인코더 가이드 정보(EGI) 등을 참조할 수 있는데, 예를 들어, 오브젝트 레벨 정보만을 근거로 하여 특정 오브젝트의 게인 제한값(G_gain)을 10dB 으로 정할 수 있지만, 이때, 유저 가이드 정보(UGI)가 5dB 인 경우, 이러한 유저 가이드 정보(UGI)를 참조하여 게인범위 정보(GI)를 생성할 수 있는 것이다.

이와 같이 S320 단계에서 생성된 비율 정보(RI), 및 S330 단계에서 생성된 게인범위 정보(GI)는 앞서 설명된 S160 단계와 마찬가지로 사용자 인터페이스(200)를 통해 표시될 수 있다(S340 단계).

정보 변형부(114b)는 앞서 설명된 S170 단계와 마찬가지로, 오브젝트 파라미터(OP) 및 컨트롤 파라미터(CP)중 하나 이상을 포함하는 파라미터 정보(PI)를 변형한다(S350 단계).

그리고 멀티채널 정보 생성부(116b)는 역시 앞서 설명된 S190 단계와 마찬가 지로, 변형된 파라미터 정보(MPI)를 이용하여 멀티채널 정보(MI)를 생성한다(S360 단계).

이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.

본 발명은 오디오 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.

Claims

오브젝트 정보를 이용하여 비율정보를 생성하는 단계;

상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 및,

상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 비율정보를 생성하는 단계는, 오브젝트 신호들의 오브젝트 레벨 정보를 이용하여 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
제 2 항에 있어서,

상기 비율정보를 생성하는 단계는, 특정 오브젝트 신호의 오브젝트 레벨 정보, 및 다른 오브젝트 신호의 오브젝트 레벨 정보간의 비율을 이용하여 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
제 3 항에 있어서,

상기 다른 오브젝트 신호의 오브젝트 레벨 정보는, 둘 이상의 다른 오브젝트 신호의 오브젝트 레벨 정보의 합인 것을 특징으로 하는 오디오 신호처리 방법.
제 1 항에 있어서,

상기 게인범위 정보를 생성하는 단계는, 디폴트 가이드 정보, 유저 가이드 정보, 및 인코더 가이드 정보 중 하나 이상을 이용하여 수행되는 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 게인범위 정보는, 특정 오브젝트에 대한 절대적인 게인 값, 오브젝트간의 상대적인 게인 차이값 중 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 게인범위 정보는, 시간별 서브밴드별로 변화하는 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

메인 신호 및 서브 신호를 포함하는 다운믹스 정보를 수신하는 단계를 더 포함하고,

상기 비율정보는, 상기 메인 신호 및 상기 서브 신호간의 상대적인 비율을 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 변형된 파라미터 정보를 이용하여 멀티채널 정보를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 컨트롤 파라미터를 포함하는 믹스 정보를 수신하는 단계를 더 포함하고,

상기 믹스정보는, 오브젝트위치 정보, 오브젝트 게인 정보, 및 재생 환경정보 중 하나 이상을 근거로 생성된 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 오디오 신호는, 방송 신호를 통해 수신된 것을 특징으로 하는 오디오 신호 처리 방법.
제 1 항에 있어서,

상기 오디오 신호는, 디지털 매체를 통해 수신된 것을 특징으로 하는 오디오 신호 처리 방법.
오브젝트 정보를 이용하여 비율정보를 생성하는 단계;

상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 단계; 및,

상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
오브젝트 정보를 이용하여 비율정보를 생성하고, 상기 비율정보를 이용하여 오브젝트의 게인범위 정보를 생성하는 정보 생성부; 및

상기 게인범위 정보를 근거로 하여, 오브젝트 파라미터 및 컨트롤 파라미터 중 적어도 하나를 포함하는 파라미터 정보를 변형하는 정보 변형부를 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.