KR20090040857A

KR20090040857A - 다객체 오디오 부호화 및 복호화 방법과 그 장치

Info

Publication number: KR20090040857A
Application number: KR1020080103034A
Authority: KR
Inventors: 서정일; 백승권; 강경옥; 홍진우; 김진웅; 이태진
Original assignee: 한국전자통신연구원
Priority date: 2007-10-22
Filing date: 2008-10-21
Publication date: 2009-04-27
Also published as: KR101566055B1; CN103151047A; EP2212882A1; US20100228554A1; CN102968994B; WO2009054665A1; JP2011501230A; EP2624253A2; CN102682773B; EP2624253A3; KR101566025B1; KR20120061792A; CN102682773A; CN101911180A; EP2212882A4; CN102968994A; US20120275609A1; JP2012212160A; EP2511903A2; EP2511903A3

Abstract

본 발명은 오디오 부호화 및 복호화 방법과 그 장치에 관한 것으로서, 더욱 상세하게는 다객체 오디오 부호화 및 복호화 방법과 그 장치에 관한 것이다.

본 발명에 따른 다객체 오디오 부호화 방법은 주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)을 생성하는 단계 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다.

오디오 객체, 다운믹스, 잔여 신호

Description

다객체 오디오 부호화 및 복호화 방법과 그 장치{Multi-Object Audio Encoding and Decoding Method and Apparatus thereof}

본 발명은 정보통신부 및 정보통신연구진흥원의 정보통신표준개발지원의 일환으로 수행한 연구로부터 도출된 것이다. [과제관리번호: 2007-S-004-01, 과제명: 무안경 개인형 3D 방송기술개발(Development of Glassless Single-User 3D Broadcasting Technologies)]

종래의 오디오 신호의 압축과 복원을 수행하는 방법으로 공간 큐를 기반으로 한 공간 오디오 부호화(SAC: Spatial Audio coding)의 방법이 있다. 종래의 공간 오디오 부호화(SAC)는 다채널(Multi-Channel) 오디오 부호화에 초점이 맞추어진 기술이다.

한편, 기존의 오디오 서비스에서 사용자는 전송되는 오디오 콘텐츠에 대하여 수동적으로 청취할 수 밖에 없는 기능적 제약이 따르는 것이 일반적이다. 따라서, 사용자에게 다양한 오디오 서비스를 제공하지 못하는 문제점이 있었다.

따라서, 본 발명은 다양한 오디오 서비스를 효율적으로 제공하는 부호화 및 복호화 방법 및 그 장치를 제공하는 것을 목적으로 한다.

본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

전술한 과제를 해결하기 위한 본 발명의 일 실시예에 따른 다객체 오디오 부호화 방법은 주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 단계 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다.

본 발명의 다른 실시예에 따른 다객체 오디오 부호화 방법은 모노 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 단계 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 부호화 방법은 스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호와 잔여 신호를 생성하는 단계 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 부호화 방법은 스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 단계 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 방법은 주오디오 객체와 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 주오디오 객체와 부오디오객체를 복원하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 방법은 모노 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 주오디오 객체 및 부오디오객체를 복원하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 방법은 스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 기 다운믹스 신호로부터 스테레오 주오디오 객체와 모노 부오디오 객체를 복원하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 방법은 스테레오 주오디오 객체와 스테레오 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 스테레오 부오디오 객체를 복원하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 부호화 장치는 주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 다운믹스 생성부 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 부호화 장치는 모노 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 다운믹스 생성부 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생 성하는 비트스트림 생성부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 부호화 장치는 스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호와 잔여 신호를 생성하는 다운믹스 생성부 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 부호화 장치는 스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 다운믹스 생성부 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 장치는 주오디오 객체와 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 주오디오 객체와 부오디오 객체를 복원하는 복원부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 장치는 모노 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운 믹스 신호로부터 주오디오 객체 및 부오디오 객체를 복원하는 복원부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 장치는 스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 모노 부오디오 객체를 복원하는 복원부를 포함한다.

본 발명의 또 다른 실시예에 따른 다객체 오디오 복호화 장치는 스테레오 주오디오 객체와 스테레오 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 스테레오 부오디오 객체를 복원하는 복원부를 포함한다.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일 실시예를 상세히 설명하기로 한다.

본 발명에 의하면, 다양한 오디오 서비스를 효율적으로 제공할 수 있다.

이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.

또한, 본 발명의 원리, 관점 및 실시예들 뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물뿐만 아니라 장래에 개발될 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다.

따라서, 예를 들어, 본 명세서의 블럭도는 본 발명의 원리를 구체화하는 예시적인 회로의 개념적인 관점을 나타내는 것으로 이해되어야 한다. 이와 유사하게, 모든 흐름도, 상태 변환도, 의사 코드 등은 컴퓨터가 판독 가능한 매체에 실질적으 로 나타낼 수 있고 컴퓨터 또는 프로세서가 명백히 도시되었는지 여부를 불문하고 컴퓨터 또는 프로세서에 의해 수행되는 다양한 프로세스를 나타내는 것으로 이해되어야 한다.

프로세서 또는 이와 유사한 개념으로 표시된 기능 블럭을 포함하는 도면에 도시된 다양한 소자의 기능은 전용 하드웨어뿐만 아니라 적절한 소프트웨어와 관련하여 소프트웨어를 실행할 능력을 가진 하드웨어의 사용으로 제공될 수 있다. 프로세서에 의해 제공될 때, 상기 기능은 단일 전용 프로세서, 단일 공유 프로세서 또는 복수의 개별적 프로세서에 의해 제공될 수 있고, 이들 중 일부는 공유될 수 있다.

또한 프로세서, 제어 또는 이와 유사한 개념으로 제시되는 용어의 명확한 사용은 소프트웨어를 실행할 능력을 가진 하드웨어를 배타적으로 인용하여 해석되어서는 아니되고, 제한 없이 디지털 신호 프로세서(DSP) 하드웨어, 소프트웨어를 저장하기 위한 롬(ROM), 램(RAM) 및 비 휘발성 메모리를 암시적으로 포함하는 것으로 이해되어야 한다. 주지관용의 다른 하드웨어도 포함될 수 있다.

본 명세서의 청구범위에서, 상세한 설명에 기재된 기능을 수행하기 위한 수단으로 표현된 구성요소는 예를 들어 상기 기능을 수행하는 회로 소자의 조합 또는 펌웨어/마이크로 코드 등을 포함하는 모든 형식의 소프트웨어를 포함하는 기능을 수행하는 모든 방법을 포함하는 것으로 의도되었으며, 상기 기능을 수행하도록 상기 소프트웨어를 실행하기 위한 적절한 회로와 결합된다. 이러한 청구범위에 의해 정의되는 본 발명은 다양하게 열거된 수단에 의해 제공되는 기능들이 결합되고 청구항이 요구하는 방식과 결합되기 때문에 상기 기능을 제공할 수 있는 어떠한 수단도 본 명세서로부터 파악되는 것과 균등한 것으로 이해되어야 한다.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.

본 발명은 다객체 오디오(Multi-Object Audio)의 부호화와 복호화에 관한 것이다. 다객체 오디오에는 오디오 콘텐츠를 구성하는 복수 개의 오디오 객체가 포함될 수 있다. 예를 들어, 반주 또는 배경음악과 보컬(vocal)로 구성되는 오디오 콘텐츠에서 반주 또는 배경음악이 하나의 오디오 객체이고, 보컬이 또 다른 오디오 객체인 경우가 이에 해당할 수 있다. 물론 반주 또는 배경음악은 건반, 드럼, 기타 등과 같이 각각의 악기에 따른 오디오 객체들로 세분화될 수 있다. 다객체 오디오 부호화는 이러한 상이한 오디오 객체들을 압축하는 기술이고, 다객체 오디오 복호화는 부호화된 다객체 오디오를 복호화하는 기술이다. 따라서, 복수의 오디오 객체 들을 객체별로 오디오 부호화 또는 복호화하게 되면, 사용자에게 보다 능동적인 서비스를 제공할 수 있게 된다. 즉, 사용자의 요청에 따라 각 오디오 객체를 제어할 수 있을 뿐만 아니라 하나의 오디오 콘텐츠를 구성하는 복수의 오디오 객체들을 조합함으로써 다양한 오디오 서비스 및 콘텐츠 창출이 가능하게 된다.

본 발명에서는 다객체 오디오의 부호화와 복호화를 위해 잔여 신호(residual signal)를 이용할 수 있다. 여기서, 잔여 신호는 임의의 신호에 대해서 예측 전과 예측 후의 신호 차를 의미한다. 이는 아래의 [수학식 1]과 같이 정의될 수 있다.

[수학식 1]

X(t)-X'(t)=Xresidual(t)

여기서, X(t)는 예측 전의 원신호이고, X'(t)는 예측 후의 예측신호이고, Xresidual(t)는 원신호와 예측신호의 차를 의미한다.

잔여 신호를 이용한 다객체 오디오의 부호화에 대해 예를 들면 다음과 같다. 제1 오디오 객체와 제2 오디오 객체를 포함하는 다객체 오디오를 부호화하는 경우, 제1 오디오 객체와 제2 오디오 객체를 다운믹스하여 다운믹스 신호를 생성한다. 예측 파라미터를 이용하여 제1 오디오 객체와 제2 오디오 객체는 제1 예측 오디오 객체와 제2 예측 오디오 객체로 예측될 수 있다. 여기서, 제1 오디오 객체와 제2 오디오 객체는 원신호이고, 제1 예측 오디오 객체와 제2 예측 오디오 객체는 예측신호이다. 원신호와 예측신호를 이용하여 잔여 신호를 생성할 수 있다. 따라서, 전술한 다객체 오디오의 부호화의 예에서는 제1 오디오 객체와 제2 오디오 객체를 다운 믹스하여 다운믹스 신호와 잔여 신호를 생성할 수 있다. 다객체 오디오의 복호화에서는 부호화와 반대의 과정이 수행된다. 즉, 다운믹스 신호와 잔여 신호를 이용하여 제1 오디오 객체와 제2 오디오 객체를 복원하게 된다.

본 발명에 따른 다객체 오디오 부호화 방법은 주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)을 생성하는 단계 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다. 여기서, 주오디오 객체는 제1 주오디오 객체 및 제2 주오디오 객체를 포함하고, 다운믹스 신호와 잔여 신호를 생성하는 단계는 부오디오 객체와 제1 주오디오 객체를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계 및 제1 다운믹스 신호와 제2 주오디오 객체를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함할 수 있다. 여기서, 다운믹스 신호 및 잔여 신호를 생성하는 단계는 제2 주오디오 객체를 바이패스하는 단계를 더 포함할 수 있다.

본 발명에 따른 오디오 부호화 장치는 주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)을 생성하는 다운믹스 생성부 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다. 여기서, 주오디오 객체는 제1 주오디오 객체 및 제2 주오디오 객체를 포함하고, 다운믹스 신호와 잔여 신호를 생성하는 단계는 부오디오 객체와 제1 주오디오 객체를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성 하는 제1 다운믹스 생성부 및 제1 다운믹스 신호와 제2 주오디오 객체를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 제2 다운믹스 생성부를 포함할 수 있다. 여기서, 제1 다운믹스 생성부는 제2 주오디오 객체를 바이패스할 수 있다.

본 발명에 따른 다객체 오디오 복호화 방법은 주오디오 객체와 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여신호(residual signal)를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 주오디오 객체와 부오디오객체를 복원하는 단계를 포함한다. 여기서, 주오디오 객체는 제1 주오디오 객체 및 제2 주오디오 객체를 포함하고, 잔여 신호는 제1 주오디오 객체에 대한 제1 잔여 신호 및 제2 주오디오 객체에 대한 제2 잔여 신호를 포함하고, 복원하는 단계는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 주오디오 객체를 복원하는 단계 및 제1 주오디오 객체가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 주오디오 객체를 복원하는 단계를 포함할 수 있다.

본 발명에 따른 다객체 오디오 복호화 장치는 주오디오 객체와 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여신호(residual signal)를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 주오디오 객체와 부오디오 객체를 복원하는 복원부를 포함한다. 여기서, 주오디오 객체는 제1 주오디오 객체 및 제2 주오디오 객체를 포함하고, 잔여 신호는 제1 주오디오 객체에 대한 제1 잔여 신호 및 제2 주오디오 객체에 대한 제2 잔여 신호를 포함하고, 복원부는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 주오디오 객체를 복원하는 제1 복원부 및 제1 주오디오 객체가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 주오디오 객체를 복원하는 제2 복원부를 포함할 수 있다.

오디오 객체에는 모노(mono) 신호를 포함하는 모노 오디오 객체과 스테레오(stereo) 신호를 포함하는 스테레오 오디오 객체가 포함된다. 여기서, 스테레오 오디오 객체는 좌측 채널의 신호와 우측 채널의 신호를 포함할 수 있다.

한편, 부오디오 객체는 스테레오 오디오 객체가 모노 오디오 객체로 다운믹스된 오디오 객체일 수 있고, 또는 모노 오디오 객체가 스테레오 오디오 객체로 다운믹스된 오디오 객체일 수 있다. 따라서, 부오디오 객체는 복수의 모노 오디오 객체가, 스테레오 오디오 객체 또는 복수의 스테레오 오디오 객체가 하나의 모노 오디오 객체로 다운믹스된 것일 수 있다. 물론, 부오디오 객체는 복수 개일 수 있다. 또한, 부오디오 객체는 복수의 모노 오디오 객체 또는 스테레오 오디오 객체가 하나의 스테레오 오디오 객체로 다운믹스된 것일 수 있다. 물론, 여기서도 부오디오 객체는 복수 개일 수 있다. 주오디오 객체도 부오디오 객체와 마찬가지로 스테레오 오디오 객체가 모노 오디오 객체로 다운믹스된 오디오 객체일 수 있고, 또는 모노 오디오 객체가 스테레오 오디오 객체로 다운믹스된 오디오 객체일 수 있다.

본 발명은 잔여 신호를 이용하여 다객체 오디오를 부호화 또는 복호화함으로써, 오디오 객체를 능동적으로 제어할 수 있다. 또한, 모노 또는 스테레오 오디오 객체로 구성되는 다객체 오디오를 효율적으로 부호화 또는 복호화할 수 있다.

이하의 설명에서는 주오디오 객체와 부오디오 객체로 구성된 다객체 오디오에 대해 설명한다. 주오디오 객체는 제어하고자 하는 오디오 객체를 의미하는 것이나, 주오디오 객체와 부오디오 객체는 서로 바뀔 수 있다. 또한 주오디오 객체와 부오디오 객체는 복수의 오디오 객체를 포함할 있다.

도 1은 본 발명의 제1 개념을 설명하기 위한 도면이다. 도 1을 참조하면, 주오디오 객체(FGO: ForeGround Object)와 부오디오 객체(BGO: BackGround Object)는 다운믹스 생성부(101)로 입력된다. 도1 에서 주오디오 객체(FGO)는 제1 주오디오 객체(FGO1)와 제2 주오디오 객체(FGO2)를 포함한다.

먼저, 부오디오 객체(BGO)와 제1 주오디오 객체(FGO1)는 제1 다운믹스 생성부(103)에 입력된다. 제1 다운믹스 생성부(103)에서는 부오디오 객체(BGO)와 제1 주오디오 객체(FGO1)를 다운믹스하여 제1 다운믹스 신호와 제1 잔여 신호(Residual)를 생성한다.

제2 다운믹스 생성부(105)는 제1 다운믹스 신호와 제2 주오디오 객체(FGO2)를 입력받는다. 제2 다운믹스 생성부(105)는 제1 다운믹스 신호와 제2 주오디오 객체(FGO2)를 다운믹스하여 제2 다운믹스 신호(DMX)와 제2 잔여 신호(Residual)를 생성한다.

도 1에서는 주오디오 객체가 2개(FGO1, FGO2)인 것으로 설명하고 있으나, 3개 이상일 수 있음은 자명하다. 주오디오 객체가 3개 이상인 경우, 증가되는 주오 디오 객체의 개수 만큼 제1 또는 제2 다운믹스 생성부(103, 105)가 케스케이드(cascade)로 연결되며 증가된다.

여기서, 잔여 신호(Residual)를 제외하면, 제1 다운믹스 생성부(103) 및 제2 다운믹스 생성부(105)는 2개의 신호를 입력받아, 1개의 다운믹스 신호를 출력하게 된다. 제1 다운믹스 생성부(103)를 예를 들면 부오디오 객체(BGO)와 제1 주오디오 객체(FGO1)를 입력받아 제1 다운믹스 신호를 출력한다. 따라서, 입력이 2개이고, 출력이 1개인 구조(OTT-1: Inverse One To Two)를 갖게 된다. 여기서 OTT-1는 부호화의 측면에서 정의한 것이고, 복호화의 측면에서는 OTT(One To Two)이 된다. 이들을 제1 다운믹스 생성부(103) 및 제2 다운믹스 생성부(105)를 포함하는 다운믹스 생성부(101)에 확장시키고, 주오디오 객체(FGO)가 3개 이상인 복수라면, 입력이 복수인 N개이고, 출력이 1개인 구조(OTN-1: Inverse One To N)를 갖게 된다. 여기서 OTN-1는 부호화의 측면에서 정의한 것이고, 복호화의 측면에서는 OTN(One To N)이 된다. 복호화 과정은 전술한 부호화 과정의 역순으로 진행된다.

도 2는 본 발명의 제2 개념를 설명하기 위한 도면이다. 도 2를 참조하면, 전체적인 구성은 전술한 도 1과 유사하다. 다만, 제2 주오디오 객체(FGO2)는 제1 다운믹스 생성부(203)는 바이패스(bypass)하고, 제2 다운믹스 생성부(205)에서 부오디오 객체(BGO)와 제1 주오디오 객체(FGO1)가 다운믹스된 신호에 제2 주오디오 객체(FGO2)가 다운믹스된다.

여기서, 잔여 신호(Residual)를 제외하면, 제1 다운믹스 생성부(203) 또는 제2 다운믹스 생성부(205)는 3개의 신호를 입력받아, 2개의 신호를 출력하게 된다. 2개의 출력신호는 다운믹스 신호와 바이패스된 신호이다. 제1 다운믹스 생성부(203)를 예를 들면 부오디오 객체(BGO), 제1 주오디오 객체(FGO1) 및 제2 주오디오 객체(FGO2)를 입력받아 제1 다운믹스 신호와 제2 주오디오 객체(FGO2)를 출력한다. 따라서, 입력이 3개이고, 출력이 2개인 구조(TTT-1: Inverse Two To Three)를 갖게 된다. 다만, 3개의 입력 중 1개는 입력과 동일한 신호가 출력된다. 따라서, 이러한 구조를 tTTT-1(trivial TTT-1)으로 지칭한다. 여기서 tTTT-1는 부호화의 측면에서 정의한 것이고, 복호화의 측면에서는 tTTT(trivial Two To Three)이 된다. 이들을 제1 다운믹스 생성부(203) 및 제2 다운믹스 생성부(205)를 포함하는 다운믹스 생성부(201)에 확장시키고, 주오디오 객체(FGO)가 3개 이상인 복수라면, 출력이 2개인 구조(tTTN-1: Inverse trival Two To N)를 갖게 된다. 여기서 tTTN-1는 부호화의 측면에서 정의한 것이고, 복호화의 측면에서는 tTTN(trival Two To N)이 된다.

도 3은 도 2에 도시된 제1 다운믹스 생성부(203)를 상세히 설명하기 위한 도면이다. 도 3을 참조하면 제1 다운믹스 생성부(301)은 입력이 3개(Input 1, Input 2, Input 3)이고, 출력은 2개(Output 1, Output 2)이다. 제1 입력(Input 1)과 제2 입력(Input 2)는 제1 다운믹스 생성부(301)에서 다운믹스되어 다운믹스 신로서 제1 출력신호(Output 1)를 출력하고, 잔여 신호(residual)를 생성한다. 제3 입력은 제1 다운믹스 생성부(301)을 바이패스하여 그대로 제2 출력신호(Output 2)로 출력된다. 따라서, 제1 출력신호(Output 1)는 제1 입력(Input 1)과 제2 입력(Input 2)가 다운믹스된 신호이고, 제2 출력신호(Output 2)는 제3 입력(Input 3)과 동일한 신호가 된다.

전술한 설명은 본 발명에 따른 이하의 구체적인 실시예들에 동일하게 적용될 수 있다. 이하에서는 도면을 참조하여 본 발명의 구체적인 실시예에 대해 자세히 설명한다.

<제1 실시예: 주오디오 객체는 모노, 부오디오 객체는 모노>

본 발명에 의한 제1 실시예에서 주오디오 객체는 모노(mono) 주오디오 객체를 포함하고, 부오디오 객체는 모노 부오디오 객체를 포함한다.

제1 실시예에 의한 다객체 오디오 부호화 방법은 모노 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호을 생성하는 단계 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다. 여기서, 모노 주오디오 객체는 제1 모노 주오디오 객체 및 제2 모노 주오디오 객체를 포함하고, 다운믹스 신호 및 잔여 신호를 생성하는 단계는 모노 부오디오 객체와 제1 모노 주오디오 객체를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계 및 제1 다운믹스 신호와 제2 모노 주오디오 객체를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함할 수 있다. 또한, 다운믹 스 신호 및 잔여 신호를 생성하는 단계는 제2 모노 주오디오 객체를 바이패스하는 단계를 더 포함할 수 있다.

제1 실시예에 의한 다객체 오디오 부호화 장치는 모노 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)을 생성하는 다운믹스 생성부 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다. 여기서, 모노 주오디오 객체는 제1 모노 주오디오 객체 및 제2 모노 주오디오 객체를 포함하고, 다운믹스 생성부는 모노 부오디오 객체와 제1 모노 주오디오 객체를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는제1 다운믹스 생성부 및 제1 다운믹스 신호와 제2 모노 주오디오 객체를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 제2 다운믹스 생성부를 포함할 수 있다. 또한, 제1 다운믹스 생성부는 제2 모노 주오디오 객체를 바이패스할 수 있다.

제1 실시예에 의한 다객체 오디오 복호화 방법은 모노 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 상기 주오디오 객체 및 부오디오객체를 복원하는 단계를 포함한다. 여기서, 모노 주오디오 객체는 제1 모노 주오디오 객체 및 제2 모노 주오디오 객체를 포함하고, 잔여 신호는 제1 모드 주오디오 객체에 대한 제1 잔여 신호 및 제2 모노 주오디오 객 체에 대한 제2 잔여 신호를 포함하고, 복원하는 단계는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 모노 주오디오 객체를 복원하는 단계 및 제1 모노 주오디오 객체가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 모노 주오디오 객체를 복원하는 단계를 포함할 수 있다.

제1 실시예에 의한 다객체 오디오 복호화 장치는 모노 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 주오디오 객체 및 부오디오객체를 복원하는 복원부를 포함한다. 여기서, 모노 주오디오 객체는 제1 모노 주오디오 객체 및 제2 모노 주오디오 객체를 포함하고, 잔여 신호는 제1 모드 주오디오 객체에 대한 제1 잔여 신호 및 제2 모노 주오디오 객체에 대한 제2 잔여 신호를 포함하고, 복원부는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 모노 주오디오 객체를 복원하는 제1 복원부 및 제1 모노 주오디오 객체가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 모노 주오디오 객체를 복원하는 제2 복원부를 포함할 수 있다.

도 4는 본 발명에 따른 제1 실시예를 설명하기 위한 도면이다. 도 4를 참조하면, 주오디오 객체(FGO)와 부오디오 객체(BGO)는 모두 모노 신호이다. 모노 주오디오 객체(Mono FGO1, Mono FGO2)와 모노 부오디오 객체(Mono BGO)는 다운믹스 생성부(401)에 입력된다.

모노 부오디오 객체(Mono BGO)와 제1 모노 주오디오 객체(Mono FGO1)는 제1 다운믹스 생성부(403)에 입력되어, 제1 다운믹스 신호와 제1 잔여 신호(Residual)를 생성한다. 제1 다운믹스 신호와 제2 모노 주오디오 객체(Mono FGO2)는 제2 다운믹스 생성부(405)에 입력되어, 제2 다운믹스 신호(DMX)와 제2 잔여 신호(Residual)를 생성한다.

도 4에서는 모노 주오디오 객체가 2개(Mono FGO1, Mono FGO2)인 것으로 설명하고 있으나, 3개 이상일 수 있음은 자명하다. 모노 주오디오 객체가 3개 이상인 경우, 증가되는 주오디오 객체의 개수 만큼 제1 또는 제2 다운믹스 생성부(403, 405)가 케스케이드(cascade)로 연결되며 증가된다. 주오디오 객체(FGO)가 3개 이상인 복수라면, 입력이 복수인 N개이고, 출력이 1개인 구조(OTN-1: Inverse One To N)를 갖게 된다. 여기서 OTN-1는 부호화의 측면에서 정의한 것이고, 복호화의 측면에서는 OTN(One To N)이 된다. 이 경우, 다운믹스 생성부(401)는 OTN-1의 구조를 갖게 된다. 한편, 복호화 과정은 전술한 부호화 과정의 역순으로 진행된다.

<제2 실시예: 주오디오 객체는 스테레오, 부오디오 객체는 모노>

본 발명에 의한 제2 실시예에서 주오디오 객체는 스테레오(stereo) 주오디오 객체를 포함하고, 부오디오 객체는 모노 부오디오 객체를 포함한다.

제2 실시예에 따른 다객체 오디오 부호화 방법은 스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호와 잔여 신호을 생성하는 단계 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다. 여기서, 스테레오 주오디오 객체는 제1 신호 및 제2 신호를 포함하고, 다운믹스 신호와 잔여 신호를 생성하는 단계는 모노 부오디오 객체와 제1 신호를 다운믹스하여 제1 다운믹스 신호와 제1 잔여 신호를 생성하는 단계 및 제1 다운믹스 신호와 상기 제2 신호를 다운믹스하여 제2 다운믹스 신호와 제2 잔여 신호를 생성하는 단계를 포함할 수 있다. 또한, 다운믹스 신호와 잔여 신호를 생성하는 단계는 제2 신호를 바이패스하는 단계를 더 포함할 수 있다.

제2 실시예에 따른 다객체 오디오 부호화 장치는 스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호와 잔여 신호을 생성하는 다운믹스 생성부 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다. 여기서, 스테레오 주오디오 객체는 제1 신호 및 제2 신호를 포함하고, 다운믹스 생성부는 모노 부오디오 객체와 제1 신호를 다운믹스하여 제1 다운믹스 신호와 제1 잔여 신호를 생성하는 제1 다운믹스 생성부 및 제1 다운믹스 신호와 상기 제2 신호를 다운믹스하여 제2 다운믹스 신호와 제2 잔여 신호를 생성하는 제2 다운믹스 생성부를 포함할 수 있다. 또한, 제1 다운믹스 생성부는 제2 신호를 바이패스할 수 있다.

제2 실시예에 따른 다객체 오디오 복호화 방법은 스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 모노 부오디오 객체를 복원하는 단계를 포함한다. 여기서, 스테레오 주오디오 객체는 제1 신호 및 제2 신호를 포함하고, 잔여 신호는 제1 신호에 대한 제1 잔여 신호 및 제2 신호에 대한 제2 잔여 신호를 포함하고, 복원하는 단계는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 신호를 복원하는 단계 및 제1 신호가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 신호를 복원하는 단계를 포함할 수 있다.

제2 실시예에 따른 다객체 오디오 복호화 장치는 스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 모노 부오디오 객체를 복원하는 복원부를 포함한다. 여기서, 스테레오 주오디오 객체는 제1 신호 및 제2 신호를 포함하고, 잔여 신호는 제1 신호에 대한 제1 잔여 신호 및 제2 신호에 대한 제2 잔여 신호를 포함하고, 복원부는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 신호를 복원하는 제1 복원부 및 제1 신호가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 신호를 복원하는 제2 복원부를 포함할 수 있다.

도 5는 본 발명에 따른 제2 실시예를 설명하기 위한 도면이다. 도 5를 참조하면, 모노 부오디오 객체(Mono BGO)와 스테레오 주오디오 객체(Stereo Left/ Right FGO)는 다운믹스 생성부(501)에 입력된다. 스테레오 주오디오 객체(Stereo Left/ Right FGO)에는 좌채널 신호(Left FGO) 및 우채널 신호(Right FGO)를 포함한다.

제1 다운믹스 생성부(503)에는 모노 부오디오 객체(Mono BGO)와 좌채널 신호(Left FGO)가 입력되어, 제1 다운믹스 신호와 제1 잔여 신호(Residual)를 생성한다. 제2 다운믹스 생성부(505)는 제1 다운믹스 신호와 우채널 신호(Right FGO)를 입력받아, 제2 다운믹스 신호(DMX)와 제2 잔여 신호(Residual)를 생성한다.

도 5에서는 스테레오 주오디오 객체(Stereo Left/ Right FGO)가 1개인 것으로 설명하고 있으나, 2개 이상일 수 있음은 자명하다. 스테레오 주오디오 객체가 2개 이상인 경우, 증가되는 주오디오 객체의 개수 만큼 제1 또는 제2 다운믹스 생성부(503, 505)가 케스케이드(cascade)로 연결되며 증가된다. 한편, 복호화 과정은 전술한 부호화 과정의 역순으로 진행된다.

<제3 실시예 : 주오디오 객체는 스테레오, 부오디오 객체는 스테레오>

본 발명에 의한 제3 실시예에서 주오디오 객체는 스테레오(stereo) 주오디오 객체를 포함하고, 부오디오 객체는 스테레오 부오디오 객체를 포함한다. 스테레오 오디오 객체는 좌채널과 우채널 신호를 포함할 수 있다.

제3 실시예에 따른 다객체 오디오 부호화 방법은 스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호을 생성하는 단계 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함한다. 여기서, 스테레오 주오디오 객체와 스테레오 부오디오 신호는 각각 제1 신호 및 제2 신호를 포함하고, 다운믹스 신호 및 잔여 신호를 생성하는 단계는 스테레오 주오디오 객체와 스테레오 부오디오 신호의 제1 신호를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계 및 스테레오 주오디오 객체와 스테레오 부오디오 신호의 제2 신호를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함할 수 있다. 여기서, 스테레오 주오디오 객체의 제1 신호는 제1 좌채널 신호 및 제2 좌채널 신호를 포함하고, 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계 스테레오 부오디오 신호의 제1 신호와 제1 좌채널 신호를 다운믹스하여 제1 좌채널 다운믹스 신호 및 제1 좌채널 잔여 신호를 생성하는 단계 및 제1 좌채널 다운믹스 신호와 제2 좌채널 신호를 다운믹스하여 제2 좌채널 다운믹스 신호 및 제2 좌채널 잔여 신호를 생성하는 단계를 포함할 수 있다. 여기서, 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계는 제2 좌채널 신호를 바이패스하는 단계를 더 포함할 수 있다.

제3 실시예에 따른 다객체 오디오 부호화 장치는 스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)을 생성하는 다운믹스 생성부 및 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함한다. 여기서, 스테레오 주오디오 객체와 스테레오 부오디오 신호는 각각 제1 신호 및 제2 신호를 포함하고, 다운믹 스 생성부는 스테레오 주오디오 객체와 스테레오 부오디오 신호의 제1 신호를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 제1 다운믹스 생성부 및 스테레오 주오디오 객체와 스테레오 부오디오 신호의 제2 신호를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 제2 다운믹스 생성부를 포함할 수 있다. 여기서, 스테레오 주오디오 객체의 제1 신호는 제1 좌채널 신호 및 제2 좌채널 신호를 포함하고, 제1 다운믹스 생성부는 스테레오 부오디오 신호의 제1 신호와 제1 좌채널 신호를 다운믹스하여 제1 좌채널 다운믹스 신호 및 제1 좌채널 잔여 신호를 생성하는 제1 좌채널 다운믹스 생성부 및 제1 좌채널 다운믹스 신호와 제2 좌채널 신호를 다운믹스하여 제2 좌채널 다운믹스 신호 및 제2 좌채널 잔여 신호를 생성하는 제2 좌채널 다운믹스 생성부를 포함할 수 있다. 여기서, 제1 다운믹스 생성부는 제2 좌채널 신호를 바이패스하는 단계를 더 포함할 수 있다.

제3 실시예에 따른 다객체 오디오 복호화 방법은 스테레오 주오디오 객체와 스테레오 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 스테레오 부오디오 객체를 복원하는 단계를 포함한다. 여기서, 스테레오 주오디오 객체와 스테레오 부오디오 신호는 각각 제1 신호 및 제2 신호를 포함하고, 잔여 신호는 제1 신호에 대한 제1 잔여 신호 및 제2 신호에 대한 제2 잔여 신호를 포함하고,복원하는 단계는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 신호를 복원하는 단계 및 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 신호를 복원하는 단계를 포함할 수 있다. 또한, 스테레오 주오디오 객체의 제1 신호는 제1 좌채널 신호 및 제2 좌채널 신호를 포함하고, 제1 잔여 신호는 제1 좌채널 신호에 대한 제1 좌채널 잔여 신호 및 제2 좌채널 신호에 대한 제2 좌채널 잔여 신호를 포함하고, 제1 신호를 복원하는 단계는 다운믹스 신호와 기 제1 좌채널 잔여 신호를 이용하여 제1 좌채널 신호를 복원하는 단계 및 제1 좌채널 신호가 복원된 후의 다운믹스 신호와 제2 좌채널 신호를 이용하여 제2 좌채널 신호를 복원하는 단계를 포함할 수 있다.

제3 실시예에 따른 다객체 오디오 복호화 장치는 스테레오 주오디오 객체와 스테레오 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 스테레오 부오디오 객체를 복원하는 복원부를 포함한다. 여기서, 스테레오 주오디오 객체와 스테레오 부오디오 신호는 각각 제1 신호 및 제2 신호를 포함하고, 잔여 신호는 제1 신호에 대한 제1 잔여 신호 및 제2 신호에 대한 제2 잔여 신호를 포함하고,복원부는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 신호를 복원하는 제1 복원부 및 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 신호를 복원하는 제2 복원부를 포함할 수 있다. 또한, 스테레오 주오디오 객체의 제1 신호는 제1 좌채널 신호 및 제2 좌채널 신호를 포함하고, 제1 잔여 신호는 제1 좌채널 신호에 대한 제1 좌채널 잔여 신호 및 제2 좌채널 신호에 대한 제2 좌채널 잔여 신호를 포함하고, 제1 복원부는 다운믹스 신호와 기 제1 좌 채널 잔여 신호를 이용하여 제1 좌채널 신호를 복원하는 제1 좌채널 복원부 및 제1 좌채널 신호가 복원된 후의 다운믹스 신호와 제2 좌채널 신호를 이용하여 제2 좌채널 신호를 복원하는 제2 좌채널 복원부를 포함할 수 있다.

도 6은 본 발명에 의한 제3 실시예를 설명하기 위한 도면이다. 도 6을 참조하면, 주오디오 객체(Stereo Left/ Right FGO)는 스테레오 신호이고, 부오디오 객체(Stereo Left/ Right BGO)도 스테레오 신호이다. 도 6에서는 2개의 스테레오 주오디오 객체(Stereo Left/ Right FGO1, 2)에 대해 설명한다.

스테레오 주오디오 객체(Stereo Left/ Right FGO)와 2개의 스테레오 주오디오 객체(Stereo Left/ Right FGO1, 2)는 다운믹스 생성부(601)에 입력된다.

좌채널 부오디오 객체(Left BGO)와 제1 좌채널 주오디오 객체(Left FGO1)은 제1 좌채널 다운믹스 생성부(603)에 입력되어, 제1 좌채널 다운믹스 신호와 제1 좌채널 잔여 신호(Left Residual)를 생성한다. 제1 좌채널 다운믹스 신호와 제2 좌채널 주오디오 객체(Left FGO2)는 제2 좌채널 다운믹스 생성부(605)에 입력되어, 제2 좌채널 다운믹스 신호(Left DMX)와 제2 좌채널 잔여 신호(Left Residual)를 생성한다.

우채널 부오디오 객체(Right BGO)와 우채널 주오디오 객체(Right FGO1, 2)도 전술한 과정에 따라 다운믹스된다.

도 6에서는 스테레오 주오디오 객체(Stereo Left/ Right FGO)가 2개인 것으로 설명하고 있으나, 3개 이상일 수 있음은 자명하다. 스테레오 주오디오 객체가 3 개 이상인 경우, 증가되는 주오디오 객체의 개수 만큼 제1 또는 제2 좌채널 다운믹스 생성부(603, 605)가 케스케이드(cascade)로 연결되며 증가된다. 한편, 복호화 과정은 전술한 부호화 과정의 역순으로 진행된다.

도 6에서 좌채널 부오디오 객체(Left BGO), 제1 좌채널 주오디오 객체(Left FGO1) 및 제2 좌채널 주오디오 객체(Left FGO2)가 제1 좌채널 다운믹스 생성부(603)에 입력되고, 제1 좌채널 다운믹스 생성부(603)에서 제2 좌채널 주오디오 객체(Left FGO2)가 바이패스하는 경우, 입력이 3개이고, 출력이 2개인 구조(TTT-1: Inverse Two To Three)를 갖게 된다. 이러한 구조를 tTTT-1(trivial TTT-1)으로 지칭함은 전술한 바와 같다. 또한, 좌채널 신호와 우채널 신호를 포함하는 스테레오 주오디오 객체가 3개 이상인 경우, 입력이 3개 이상의 복수이고, 출력이 2개인 구조(tTTN-1: Inverse trival Two To N)를 갖게 된다. 여기서 tTTN-1는 부호화의 측면에서 정의한 것이고, 복호화의 측면에서는 tTTN(trival Two To N)이 된다.

<제4 실시예: 주오디오 객체는 스테레오, 부오디오 객체는 모노>

본 발명에 의한 제4 실시예에서 주오디오 객체는 스테레오(stereo) 주오디오 객체를 포함하고, 부오디오 객체는 모노(mono) 부오디오 객체를 포함한다. 스테레오 오디오 객체는 좌채널과 우채널 신호를 포함할 수 있다. 제 4실시예는 다운믹스된 출력신호가 스테레오인 점에서 전술한 제2 실시예와 구별된다.

제4 실시예에 따른 다객체 오디오 부호화 방법는 스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 단계 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함하고, 스테레오 주오디오 객체는 제1, 2 좌채널 신호 및 제1, 2 우채널 신호를 포함하고, 다운믹스 신호 및 잔여 신호를 생성하는 단계는 모노 부오디오 객체와 제1 좌채널 신호 및 제1 우채널 신호를 각각 다운믹스하여 제1 좌채널 다운믹스 신호, 제1 우채널 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계 및 제1 좌채널 다운믹스 신호 및 제1 우채널 다운믹스 신호와 제2 좌채널 신호 및 제2 우채널 신호를 각각 다운믹스하여 제2 좌채널 다운믹스 신호, 제2 우채널 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함할 수 있다. 여기서, 다운믹스 신호 및 잔여 신호를 생성하는 단계는 제2 좌채널 신호 및 제2 우채널 신호를 바이패스하는 단계를 더 포함할 수 있다.

제4 실시예에 따른 다객체 오디오 부호화 장치는 스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호를 생성하는 다운믹스 생성부 및 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함하고, 스테레오 주오디오 객체는 제1, 2 좌채널 신호 및 제1, 2 우채널 신호를 포함하고, 다운믹스 생성부는 모노 부오디오 객체와 제1 좌채널 신호 및 제1 우채널 신호를 각각 다운믹스하여 제1 좌채널 다운믹스 신호, 제1 우채널 다운믹스 신호 및 제1 잔여 신호를 생성하는 제1 좌채널 다운믹스 생성부 및 제1 좌채널 다운믹스 신호 및 제1 우채널 다운믹스 신호와 제2 좌채널 신호 및 제2 우채널 신호를 각각 다운믹스하여 제2 좌채널 다운믹스 신호, 제2 우채널 다운믹스 신호 및 제2 잔여 신호를 생성하는 제2 좌채널 다운믹스 생성부를 포함할 수 있다. 여기서, 다운믹스 생성부는 제2 좌채널 신호 및 제2 우채널 신호를 바이패스하는 단계를 더 포함할 수 있다.

제4 실시예에 따른 다객체 오디오 복호화 방법은 스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 단계 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 모노 부오디오 객체를 복원하는 단계를 포함하고, 스테레오 주오디오 객체는 제1, 2 좌채널 신호 및 제1, 2 우채널 신호를 포함하고, 잔여 신호는 제1 좌채널 및 우채널 신호에 대한 제1 잔여 신호 및 제2 좌채널 및 우채널 신호에 대한 제2 잔여 신호를 포함하고, 복원하는 단계는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 좌채널 및 우채널 신호를 복원하는 단계 및 제1 좌채널 및 우채널 신호가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 좌채널 및 우채널 신호를 복원하는 단계를 포함할 수 있다.

제4 실시예에 따른 다객체 오디오 복호화 장치는 스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 다운믹스에 따른 잔여 신호를 포함하는 비트스트림을 수신하는 수신부 및 잔여 신호를 이용하여 다운믹스 신호로부터 스테레오 주오디오 객체와 모노 부오디오 객체를 복원하는 복원부를 포함하 고, 스테레오 주오디오 객체는 제1, 2 좌채널 신호 및 제1, 2 우채널 신호를 포함하고, 잔여 신호는 제1 좌채널 및 우채널 신호에 대한 제1 잔여 신호 및 제2 좌채널 및 우채널 신호에 대한 제2 잔여 신호를 포함하고, 복원부는 다운믹스 신호와 제1 잔여 신호를 이용하여 제1 좌채널 및 우채널 신호를 복원하는 제1 복원부 및 제1 좌채널 및 우채널 신호가 복원된 후의 다운믹스 신호와 제2 잔여 신호를 이용하여 제2 좌채널 및 우채널 신호를 복원하는 제2 복원부를 포함할 수 있다.

도 7은 본 발명에 따른 제4 실시예를 설명하기 위한 도면이다. 도 7을 참조하면, 주오디오 객체는 스테레오이고, 부오디오 객체는 모노이다. 스테레오 오디오 객체는 좌채널 신호와 우채널 신호를 포함할 수 있다. 모노 부오디오 객체(Mono BGO)와 스테레오 주오디오 객체(FGO1, 2 Left/Right)는 다운믹스 생성부(701)에 입력된다.

모노 부오디오 객체(Mono BGO)와 제1 스테레오 주오디오 객체(FGO1 Left/Right)는 제1 다운믹스 생성부(702)에 입력되어 각각 다운믹스되고, 제1 다운믹스 신호 및 제1 잔여 신호(Residual)를 생성한다. 제1 다운믹스 신호에는 제1 좌채널 다운믹스 신호 및 제2 우채널 다운믹스 신호를 포함할 수 있다. 제1 다운믹스 신호와 제2 스테레오 주오디오 객체(FGO2 Left/Right)는 다운믹스되어 제2 다운믹스 신호와 제2 잔여 신호(Residual)를 생성한다. 제2 다운믹스 신호는 제2 좌채널 다운믹스 신호(Left DMX) 및 제2 우채널 다운믹스 신호(Right DMX)를 포함할 수 있다. 제1 좌채널 다운믹스 신호는 제2 스테레오 좌채널 주오디오 객체(FGO2 Left)와 제2 좌채널 다운믹스 생성부(703a)에서 다운믹스되어 제2 좌채널 다운믹스 신호(Left DMX)를 생성하고, 제1 우채널 다운믹스 신호는 제2 스테레오 우채널 주오디오 객체(FGO2 Right)와 제2 우채널 다운믹스 생성부(703b)에서 다운믹스되어 제2 우채널 다운믹스 신호(Right DMX)를 생성할 수 있다.

도 8은 본 발명에 따른 복호화를 설명하기 위한 도면이다. 잔여 신호(Residual)와 다운믹스 신호를 포함하는 비트스트림을 수신하여 다운믹스 신호를 복원한다. 다운믹스 신호는 좌채널 다운믹스 신호(Left DMX)와 우채널 다운믹스 신호(Right DMX)를 포함하는 스테레오 다운믹스 신호를 포함할 수 있다.

모노 주오디오 객체 복원부(804)는 스테레오 다운믹스 신호(Left DMX, Right DMX)와 잔여 신호(Residual)를 이용하여 모노 주오디오 객체들(Mono FGOs)를 복원한다. 모노 주오디오 객체 복원부(804)는 각각의 모노 주오디오 객체들을 복원하기 위해 제1 모노 주오디오 객체 복원부(802), 제2 모노 주오디오 객체 복원부(803)을 포함한다. 여기서, 제1 모노 주오디오 객체 복원부(802)와 제2 모노 주오디오 객체 복원부(803)는 TTT의 구조임을 확인할 수 있고, 모노 주오디오 객체 복원부(804)는 TTN의 구조임을 확인할 수 있다.

스테레오 주오디오 객체 복원부(806)는 스테레오 다운믹스 신호(Left DMX, Right DMX)와 잔여 신호(Residual)를 이용하여 스테레오 주오디오 객체들(Stereo Left/ Right FGOs)를 복원한다. 스테레오 주오디오 객체들(Stereo Left/ Right FGOs)은 좌채널 신호(Left FGOs)와 우채널 신호(Right FGOs)를 포함한다. 최종적으로는 스테레오 부오디오 객체(Left BGO, Right BGO)를 출력한다. 스테레오 주오디오 객체 복원부(806)는 다수의 객체 복원부(805a, 805b, ..., 806a, 806b, 807a, 807b)를 포함한다. 다수의 객체 복원부(805a, 805b, ..., 806a, 806b, 807a, 807b)는 OTT의 구조임을 확인할 수 있고, 스테레오 주오디오 객체 복원부(806)는 OTN의 구조임을 확인할 수 있다.

도 8은 부오디오 객체가 스테레오이고, 주오디오 객체가 모노 또는 스테레오인 경우의 복호화에 대해 도시되어 있다. 부오디오 객체가 모노이고, 주오디오 객체가 모노인 경우에는 좌채널 다운믹스 신호(Left DMX)와 잔여 신호(residual)를 이용하여 모노인 부오디오 객체와 모노인 주오디오 객체를 복원된다. 한편, 부오디오 객체가 모노이고, 주오디오 객체가 스테레오인 경우는 스테레오 주오디오 객체 복원부(806)에 의해 복원될 수 있다. 따라서, 도 8에 도시된 바에 따라 용이하게 유추할 수 있으므로, 자세한 설명은 생략하기로 한다.

이하에서는 본 발명의 적용예에 대해 설명한다.

도 9는 본 발명의 구체적인 실시예를 설명하기 위한 도면이다. 도 9을 참조하면, MBO(Multichannel Background-scene Object)은 다수의 채널(Channel 1, Channel 2, ..., Channel n)을 포함한다. MPS 인코더(901: MPEG Surround encoder)는 MBO를 인코딩하여 스테레오 다운믹스 신호(MBO Left, MBO Right)와 부가정보(side information)인 MPS 비트스트림을 출력한다. 여기서, 스테레오 다운믹스 신호(MBO Left, MBO Right)는 부오디오 객체에 해당한다.

스테레오 다운믹스 신호(MBO Left, MBO Right), 스테레오 주오디오 객체(Stereo FGO) 및 모노 주오디오 객체(Mono FGO)는 SAOC 인코더(Spatial Audio Object Coding encoder)에 입력된다. 스테레오 주오디오 객체(Stereo FGO)와 모노 주오디오 객체(Mono FGO)는 주오디오 객체에 해당한다. 스테레오 주오디오 객체(Stereo FGO)는 복수의 스테레오 객체(object 1, object 2, ..., object N)을 포함할 수 있고, 모노 주오디오 객체(Mono FGO)는 복수의 모노 객체(object 1, object 2, ..., object M)을 포함할 수 있다.

제1 다운믹스 생성부(903)은 스테레오 다운믹스 신호(MBO Left, MBO Right)와 스테레오 주오디오 객체(Stereo FGO)를 다운믹스하여 스테레오 다운믹스 신호(Left, Right)와 잔여 신호(residual)를 생성한다. 여기서, 제1 다운믹스 생성부(903)는 스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하는 것으로서, 도 5에서 설명한 스테레오 다운믹스 생성부(505)에 해당한다.

제2 다운믹스 생성부(904)는 스테레오 다운믹스 신호(Left, Right)와 모노 주오디오 객체(Mono FGO)를 다운믹스하여 최종 다운믹스 신호(Left DMX, Right DMX)와 잔여 신호(residual)를 생성한다. 여기서, 제2 다운믹스 생성부(904)는 도 4에서 설명한 다운믹스 생성부(401)에 해당한다.

SAOC 인코더(902)에서는 SAOC 비트스트림가 추출된다. 부호화 과정에서 생성된 MPS 비트스트림, SAOC 비트스트림, 잔여 신호(residual) 및 최종 다운믹스 신호(Left DMX, Right DMX)는 비트스트림으로 복호화기에 전송된다.

복호화의 과정은 부호화 과정의 역 과정이므로 자세한 설명은 생략한다. 간단히 설명하면, 복호화기에서는 MPS 비트스트림, SAOC 비트스트림, 잔여 신호(residual) 및 최종 다운믹스 신호(Left DMX, Right DMX)를 수신한다. SAOC 디코더에서는 잔여 신호(residual)와 최종 다운믹스 신호(Left DMX, Right DMX)를 이용하여 주오디오 객체를 복원한다. 주오디오 객체가 복원된 최종 다운믹스 신호(Left DMX, Right DMX)와 MPS 비트스트림은 MPS 디코더에 입력되고, MPS 디코더에서는 MPS 비트스트림을 이용하여 부오디오 객체의 멀티 채널 신호를 복원한다.

다음은 잔여 신호를 생성하는 실시예에 대해 설명한다.

복호화 과정에서 다운믹스 신호와 잔여 신호를 이용하여 복원된 좌채널 신호와 우채널 신호를 생성하는 과정은 아래의 [수학식 2]에 의해 설명될 수 있다.

[수학식 2]

여기서, 좌측 행렬은 복원된 좌채널 신호 및 우채널 신호를 의미하고, 우측 행렬에서 M 은 파라미터 행렬이고, m 은 다운믹스된 신호이고, res 는 잔여 신호를 의미한다.

M 행렬이 역행렬을 갖는다면, 부호화 과정에서 다운믹스된 신호(m)과 잔여 신호(res)는 아래의 [수학식 3]과 [수학식 4]에 의해 얻을 수 있다.

[수학식 3]

[수학식 4]

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.

본 발명은 오디오 객체를 부호화하고 복호화하는 데에 사용된다.

도 1은 본 발명의 제1 개념를 설명하기 위한 도면이다.

도 2는 본 발명의 제2 개념를 설명하기 위한 도면이다.

도 3은 도 2에 도시된 제1 다운믹스 생성부(203)를 상세히 설명하기 위한 도

면이다.

도 4는 본 발명에 따른 제1 실시예를 설명하기 위한 도면이다.

도 5는 본 발명에 따른 제2 실시예를 설명하기 위한 도면이다.

도 6은 본 발명에 의한 제3 실시예를 설명하기 위한 도면이다.

도 7은 본 발명에 따른 제4 실시예를 설명하기 위한 도면이다.

도 8은 본 발명에 따른 복호화를 설명하기 위한 도면이다.

도 9는 본 발명의 구체적인 실시예를 설명하기 위한 도면이다.

Claims

주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 단계; 및

상기 다운믹스 신호 및 상기 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제1항에 있어서,

상기 주오디오 객체는 제1 주오디오 객체 및 제2 주오디오 객체를 포함하고,

상기 다운믹스 신호와 잔여 신호를 생성하는 단계는

상기 부오디오 객체와 상기 제1 주오디오 객체를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계; 및

상기 제1 다운믹스 신호와 상기 제2 주오디오 객체를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제2항에 있어서,

상기 다운믹스 신호 및 잔여 신호를 생성하는 단계는

상기 제2 주오디오 객체를 바이패스하는 단계를 더 포함하는, 다객체 오디오 부호화 방법.
제1항에 있어서,

상기 부오디오 객체는

스테레오 오디오 객체가 모노 오디오 객체로 다운믹스된 오디오 객체인, 다객체 오디오 부호화 방법.
제1항에 있어서,

상기 부오디오 객체는

모노 오디오 객체가 스테레오 오디오 객체로 다운믹스된 오디오 객체인, 다객체 오디오 부호화 방법.
모노 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 단계; 및

상기 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제6항에 있어서,

상기 모노 주오디오 객체는 제1 모노 주오디오 객체 및 제2 모노 주오디오 객체를 포함하고,

상기 다운믹스 신호 및 잔여 신호를 생성하는 단계는

상기 모노 부오디오 객체와 상기 제1 모노 주오디오 객체를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계; 및

상기 제1 다운믹스 신호와 상기 제2 모노 주오디오 객체를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제7항에 있어서,

상기 다운믹스 신호 및 잔여 신호를 생성하는 단계는

상기 제2 모노 주오디오 객체를 바이패스하는 단계를 더 포함하는, 다객체 오디오 부호화 방법.
스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호와 잔여 신호(residual signal)를 생성하는 단계; 및

상기 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제9항에 있어서,

상기 스테레오 주오디오 객체는 제1 신호 및 제2 신호를 포함하고,

상기 다운믹스 신호와 잔여 신호를 생성하는 단계는

상기 모노 부오디오 객체와 상기 제1 신호를 다운믹스하여 제1 다운믹스 신호와 제1 잔여 신호를 생성하는 단계; 및

상기 제1 다운믹스 신호와 상기 제2 신호를 다운믹스하여 제2 다운믹스 신호와 제2 잔여 신호를 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제10항에 있어서,

상기 다운믹스 신호와 잔여 신호를 생성하는 단계는

상기 제2 신호를 바이패스하는 단계를 더 포함하는, 다객체 오디오 부호화 방법.
제0항에 있어서,

상기 스테레오 주오디오 객체는 제1, 2 좌채널 신호 및 제1, 2 우채널 신호를 포함하고,

상기 다운믹스 신호 및 잔여 신호를 생성하는 단계는

상기 모노 부오디오 객체와 상기 제1 좌채널 신호 및 제1 우채널 신호를 각각 다운믹스하여 제1 좌채널 다운믹스 신호, 제1 우채널 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계; 및

상기 제1 좌채널 다운믹스 신호 및 제1 우채널 다운믹스 신호와 상기 제2 좌채널 신호 및 제2 우채널 신호를 각각 다운믹스하여 제2 좌채널 다운믹스 신호, 제2 우채널 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제12항에 있어서,

상기 다운믹스 신호 및 잔여 신호를 생성하는 단계는

상기 제2 좌채널 신호 및 제2 우채널 신호를 바이패스하는 단계를 더 포함하는, 다객체 오디오 부호화 방법.
스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 단계; 및

상기 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제14항에 있어서,

상기 스테레오 주오디오 객체와 상기 스테레오 부오디오 신호는 각각 제1 신호 및 제2 신호를 포함하고,

상기 다운믹스 신호 및 잔여 신호를 생성하는 단계는

상기 스테레오 주오디오 객체와 상기 스테레오 부오디오 신호의 제1 신호를 다운믹스하여 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계; 및

상기 스테레오 주오디오 객체와 상기 스테레오 부오디오 신호의 제2 신호를 다운믹스하여 제2 다운믹스 신호 및 제2 잔여 신호를 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제15항에 있어서,

상기 스테레오 주오디오 객체의 제1 신호는 제1 좌채널 신호 및 제2 좌채널 신호를 포함하고,

상기 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계

상기 스테레오 부오디오 신호의 제1 신호와 상기 제1 좌채널 신호를 다운믹 스하여 제1 좌채널 다운믹스 신호 및 제1 좌채널 잔여 신호를 생성하는 단계; 및

상기 제1 좌채널 다운믹스 신호와 상기 제2 좌채널 신호를 다운믹스하여 제2 좌채널 다운믹스 신호 및 제2 좌채널 잔여 신호를 생성하는 단계를 포함하는, 다객체 오디오 부호화 방법.
제16항에 있어서,

상기 제1 다운믹스 신호 및 제1 잔여 신호를 생성하는 단계

상기 제2 좌채널 신호를 바이패스하는 단계를 더 포함하는, 다객체 오디오 부호화 방법.
주오디오 객체와 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에 따른 잔여신호(residual signal)를 포함하는 비트스트림을 수신하는 단계; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 주오디오 객체와 상기 부오디오객체를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
제18항에 있어서,

상기 주오디오 객체는 제1 주오디오 객체 및 제2 주오디오 객체를 포함하고,

상기 잔여 신호는 상기 제1 주오디오 객체에 대한 제1 잔여 신호 및 상기 제2 주오디오 객체에 대한 제2 잔여 신호를 포함하고,

상기 복원하는 단계는

상기 다운믹스 신호와 상기 제1 잔여 신호를 이용하여 상기 제1 주오디오 객체를 복원하는 단계; 및

상기 제1 주오디오 객체가 복원된 후의 다운믹스 신호와 상기 제2 잔여 신호를 이용하여 상기 제2 주오디오 객체를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
모노 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에따른 잔여 신호(residual signal)를 포함하는 비트스트림을 수신하는 단계; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 주오디오 객체 및 상기 부오디오객체를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
제20항에 있어서,

상기 모노 주오디오 객체는 제1 모노 주오디오 객체 및 제2 모노 주오디오 객체를 포함하고,

상기 잔여 신호는 상기 제1 모드 주오디오 객체에 대한 제1 잔여 신호 및 상기 제2 모노 주오디오 객체에 대한 제2 잔여 신호를 포함하고,

상기 복원하는 단계는

상기 다운믹스 신호와 상기 제1 잔여 신호를 이용하여 상기 제1 모노 주오디오 객체를 복원하는 단계; 및

상기 제1 모노 주오디오 객체가 복원된 후의 다운믹스 신호와 상기 제2 잔여 신호를 이용하여 상기 제2 모노 주오디오 객체를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에 따른 잔여 신호(residual signal)를 포함하는 비트스트림을 수신하는 단계; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 스테레오 주오디오 객체와 상기 모노 부오디오 객체를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
제22항에 있어서,

상기 스테레오 주오디오 객체는 제1 신호 및 제2 신호를 포함하고,

상기 잔여 신호는 상기 제1 신호에 대한 제1 잔여 신호 및 상기 제2 신호에 대한 제2 잔여 신호를 포함하고,

상기 복원하는 단계는

상기 다운믹스 신호와 상기 제1 잔여 신호를 이용하여 상기 제1 신호를 복원하는 단계; 및

상기 제1 신호가 복원된 후의 다운믹스 신호와 상기 제2 잔여 신호를 이용하여 상기 제2 신호를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
제22항에 있어서,

상기 스테레오 주오디오 객체는 제1, 2 좌채널 신호 및 제1, 2 우채널 신호를 포함하고,

상기 잔여 신호는 상기 제1 좌채널 및 우채널 신호에 대한 제1 잔여 신호 및 상기 제2 좌채널 및 우채널 신호에 대한 제2 잔여 신호를 포함하고,

상기 복원하는 단계는

상기 다운믹스 신호와 상기 제1 잔여 신호를 이용하여 상기 제1 좌채널 및 우채널 신호를 복원하는 단계; 및

상기 제1 좌채널 및 우채널 신호가 복원된 후의 다운믹스 신호와 상기 제2 잔여 신호를 이용하여 상기 제2 좌채널 및 우채널 신호를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
스테레오 주오디오 객체와 스테레오 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에 따른 잔여 신호(residual signal)를 포함하는 비트스트림을 수신하는 단계; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 스테레오 주오디오 객체와 상기 스테레오 부오디오 객체를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
제25항에 있어서,

상기 스테레오 주오디오 객체와 상기 스테레오 부오디오 신호는 각각 제1 신호 및 제2 신호를 포함하고,

상기 잔여 신호는 상기 제1 신호에 대한 제1 잔여 신호 및 상기 제2 신호에 대한 제2 잔여 신호를 포함하고,

상기 복원하는 단계는

상기 다운믹스 신호와 상기 제1 잔여 신호를 이용하여 상기 제1 신호를 복원하는 단계; 및

상기 다운믹스 신호와 상기 제2 잔여 신호를 이용하여 상기 제2 신호를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
제26항에 있어서,

상기 스테레오 주오디오 객체의 제1 신호는 제1 좌채널 신호 및 제2 좌채널 신호를 포함하고,

상기 제1 잔여 신호는 상기 제1 좌채널 신호에 대한 제1 좌채널 잔여 신호 및 상기 제2 좌채널 신호에 대한 제2 좌채널 잔여 신호를 포함하고,

상기 제1 신호를 복원하는 단계는

상기 다운믹스 신호와 상기 제1 좌채널 잔여 신호를 이용하여 상기 제1 좌채널 신호를 복원하는 단계; 및

상기 제1 좌채널 신호가 복원된 후의 다운믹스 신호와 상기 제2 좌채널 신호를 이용하여 상기 제2 좌채널 신호를 복원하는 단계를 포함하는, 다객체 오디오 복호화 방법.
주오디오 객체와 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 다운믹스 생성부; 및

상기 다운믹스 신호 및 상기 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함하는, 다객체 오디오 부호화 장치.
모노 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 다운믹스 생성부; 및

상기 다운믹스 신호 및 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를포함하는, 다객체 오디오 부호화 장치.
스테레오 주오디오 객체와 모노 부오디오 객체를 다운믹스하여 다운믹스 신호와 잔여 신호(residual signal)를 생성하는 다운믹스 생성부; 및

상기 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함하는, 다객체 오디오 부호화 장치.
스테레오 주오디오 객체와 스테레오 부오디오 객체를 다운믹스하여 다운믹스 신호 및 잔여 신호(residual signal)를 생성하는 다운믹스 생성부; 및

상기 다운믹스 신호와 잔여 신호를 포함하는 비트스트림을 생성하는 비트스트림 생성부를 포함하는, 다객체 오디오 부호화 장치.
주오디오 객체와 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에 따른 잔여신호(residual signal)를 포함하는 비트스트림을 수신하는 수신부; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 주오디오 객체와 상기 부오디오객체를 복원하는 복원부를 포함하는, 다객체 오디오 복호화 장치.
모노 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에따른 잔여 신호(residual signal)를 포함하는 비트스트림을 수신하는 수신부; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 주오디오 객체 및 상기 부오디오객체를 복원하는 복원부를 포함하는, 다객체 오디오 복호화 장치.
스테레오 주오디오 객체와 모노 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에 따른 잔여 신호(residual signal)를 포함하는 비트스트림을 수신하는 수신부; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 스테레오 주오디오 객체와 상기 모노 부오디오 객체를 복원하는 복원부를 포함하는, 다객체 오디오 복호화 장치.
스테레오 주오디오 객체와 스테레오 부오디오 객체가 다운믹스된 다운믹스 신호 및 상기 다운믹스에 따른 잔여 신호(residual signal)를 포함하는 비트스트림을 수신하는 수신부; 및

상기 잔여 신호를 이용하여 상기 다운믹스 신호로부터 상기 스테레오 주오디오 객체와 상기 스테레오 부오디오 객체를 복원하는 복원부를 포함하는, 다객체 오디오 복호화 장치.