WO2010005264A2

WO2010005264A2 - 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치

Info

Publication number: WO2010005264A2
Application number: PCT/KR2009/003795
Authority: WO
Inventors: 서정일; 백승권; 강경옥; 홍진우; 김진웅; 안치득; 김광기; 한민수
Original assignee: 한국전자통신연구원
Priority date: 2008-07-10
Filing date: 2009-07-10
Publication date: 2010-01-14
Also published as: WO2010005264A3

Abstract

다객체 오디오 부호화에서의 오디오 객체 편집 장치가 개시된다. 다객체 오디오 부호화에서의 오디오 객체 편집 장치는 객체 비트스트림을 수신하고, 상기 객체 비트스트림에서 객체 정보를 추출하는 객체 정보 추출부; 다운믹스 신호를 수신하고, 객체 편집 정보와 상기 객체 정보를 사용하여 상기 다운믹스 신호를 조절하는 다운믹스 처리부; 및 상기 객체 편집 정보에 따라 상기 객체 정보를 편집하고, 편집된 객체 정보를 기초로 조절된 객체 비트스트림을 생성하는 비트스트림 처리부를 포함한다.

Description

공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치

본 발명은 오디오 객체 신호를 효과적으로 압축하는 객체 기반 오디오 부호화에 관한 것으로서, 구체적으로는 다객체 오디오 복호화기에서 입력 객체들에 대한 부호화를 통해 생성된 다객체 비트스트림과 다운믹스 신호를 이용하여 또 다른 부호화 과정 없이 기존에 존재하는 객체 신호를 편집하는 방법에 관한 것이다.

객체 기반 오디오 부호화 기술은 오디오 객체 신호를 효과적으로 압축하는 기술이다.

종래의 객체 기반 오디오 부호화 기술에서는 객체의 수정이나 제거, 및 추가와 같은 편집을 할 경우에, 편집을 하고자 하는 객체에 대하여 부호화를 다시 수행해야 하였다.

구체적으로 종래의 다객체 오디오 복호화기에서 객체를 수정하거나 제거할 경우에는 원래의 객체 신호를 가지고 다시 부호화해야 되며, 또 다른 객체를 추가할 경우에는 원래의 객체신호와 추가되는 객체 신호에 대하여 부호화해야 하였다.

그러므로, 객체의 편집하기 위해서는 항상 원래의 객체 신호를 가지고 있어야 하는 불편함이 있었고, 부호화 과정을 다시 실행해야 하므로 복잡도가 증가하는 문제점이 있었다.

따라서, 원래의 객체 신호 없이 객체를 편집하거나 부호화를 다시 실행하지 않고 객체를 편집할 수 있는 장치나 방법이 필요하다.

본 발명의 일실시예들은 다객체 오디오 복호화기에서 입력 객체들에 대한 부호화를 통해 생성된 다객체 비트스트림과 다운믹스 신호를 이용하여 기존에 존재하는 객체 신호를 편집함으로써 원래의 객체 신호 없이도 오디오 객체를 편집할 수 있는 다객체 오디오 부호화에서의 오디오 객체 편집 장치를 제공한다.

또한, 본 발명의 일실시예들은 다객체 오디오 복호화기에서 입력 객체들에 대한 부호화를 통해 생성된 다객체 비트스트림과 다운믹스 신호를 이용하여 기존에 존재하는 객체 신호를 편집함으로써 편집되는 객체에 대한 부호화 과정을 생략할 수 있는 다객체 오디오 부호화에서의 오디오 객체 편집 장치를 제공한다.

본 발명의 일실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치는 객체 비트스트림을 수신하고, 상기 객체 비트스트림에서 객체 정보를 추출하는 객체 정보 추출부; 다운믹스 신호를 수신하고, 객체 편집 정보와 상기 객체 정보를 사용하여 상기 다운믹스 신호를 조절하는 다운믹스 처리부; 및 상기 객체 편집 정보에 따라 상기 객체 정보를 편집하고, 편집된 객체 정보를 기초로 조절된 객체 비트스트림을 생성하는 비트스트림 처리부를 포함한다.

또한, 본 발명의 다른 실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치는 객체 비트스트림을 수신하고, 상기 객체 비트스트림에서 배경음을 나타내는 BGO 객체 비트스트림과 특정 객체 신호를 나타내는 FGO 객체 비트스트림을 추출하는 비트스트림 핸들러; 다운믹스 신호를 수신하고, 상기 BGO 객체 비트스트림과 상기 FGO 객체 비트스트림 및 상기 다운믹스 신호를 사용하여 BGO 다운믹스 신호와 FGO를 생성하는 오브젝트 생성부; 상기 BGO 다운믹스 신호와 상기 FGO를 객체 편집 정보에 따라 조절하고, 조절된 BGO 다운믹스 신호와 조절된 FGO를 믹싱하여 조절된 다운믹스 신호를 생성하는 다운믹스 조절부; 및 상기 객체 편집 정보에 따라 상기 BGO 객체 비트스트림과 상기 FGO 객체 비트스트림을 편집하는 비트스트림 조절부; 상기 비트스트림 조절부에서 편집된 BGO 객체 비트스트림과 FGO 객체 비트스트림을 상기 비트스트림과 합성하여 조절된 비트스트림을 생성하고, 상기 조절된 비트스트림을 송출하는 비트스트림 포맷터를 포함한다.

본 발명의 일실시예들은 다객체 오디오 복호화기에서 입력 객체들에 대한 부호화를 통해 생성된 다객체 비트스트림과 다운믹스 신호를 이용하여 기존에 존재하는 객체 신호를 편집함으로써 원래의 객체 신호 없이도 오디오 객체를 편집할 수 있다.

또한, 본 발명의 일실시예들은 다객체 오디오 복호화기에서 입력 객체들에 대한 부호화를 통해 생성된 다객체 비트스트림과 다운믹스 신호를 이용하여 기존에 존재하는 객체 신호를 편집함으로써 편집되는 객체에 대한 부호화 과정을 생략할 수 있다.

도 1은 본 발명의 일실시예에 따른 오디오 객체 편집 장치가 결합된 다객체 오디오 부호화 장치의 일례를 도시한 도면이다.

도 2는 본 발명의 일실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치의 개괄적인 모습을 도시한 도면이다.

도 3은 본 발명의 일실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 방법을 도시한 흐름도이다.

도 4는 본 발명의 다른 실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치의 개괄적인 모습을 도시한 도면이다.

도 5는 본 발명의 다른 실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 방법을 도시한 흐름도이다.

이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예들을 상세하게 설명하지만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다.

본 발명의 일실시예에 따른 오디오 객체 편집 장치가 결합된 다객체 오디오 부호화 장치는 도 1에 도시된 바와 같이 다객체 오디오 부호화부(110), 다객체 오디오 복호화부(120) 및 객체 편집부(130)로 구성된다.

다객체 오디오 부호화부(110)는 입력된 다객체 신호에 대한 부호화를 수행하여 다운믹스 신호와 각 객체에 대한 정보를 나타내는 부가정보인 객체 비트스트림을 생성하여 다객체 오디오 복호화부(120)와 객체 편집부(130)로 전송할 수 있다.

다객체 오디오 복호화부(120)는 다객체 오디오 부호화부(110)로부터 전송된 다운믹스 신호와 객체 비트스트림을 이용하여 상기 다객체 신호를 복원할 수 있다.

객체 편집부(130)는 다객체 오디오 부호화부(110)로부터 전송된 다운믹스 신호와 객체 비트스트림을 이용하여 객체를 수정하거나 제거 또는 추가하는 편집 기능을 수행할 수 있다.

도 2를 참조하면 본 발명의 일실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치는, 객체 정보 추출부(210), 다운믹스 처리부(220) 및 비트스트림 처리부(230)로 구성된다.

객체 정보 추출부(210)는 다객체 오디오 부호화부(110)로부터 전송된 객체 비트스트림을 수신하고, 객체 비트스트림에서 객체 정보를 추출하여 다운믹스 처리부(220)와 비트스트림 처리부(230)로 전송할 수 있다.

이때, 객체 정보 추출부(210)가 추출하는 객체 정보는 다객체 오디오 부호화 기술에서 각 객체의 정보를 나타내는 부가정보로 사용되는 파라미터로서 객체 간 크기 차이를 나타내는 OLD(object level difference), 객체 간 상관도를 나타내는 IOC(inter-object correlation), 각 객체가 다운믹스 될 때 신호 레벨의 조절 정도를 나타내는 DMG(downmix gain), 스테레오 객체 신호의 좌우 파워비율을 나타내는 DCLD(downmix channel level difference) 중에 적어도 하나를 포함할 수 있다.

또한, 상기 객체 정보는 주파수 해상도에 따라 20 또는 28개의 서브밴드를 포함하는 프레임 구조에서 각각의 서브밴드 단위로 추출될 수 있다.

다운믹스 처리부(220)는 다객체 오디오 부호화부(110)로부터 전송된 다운믹스 신호를 수신하고, 객체 편집 정보와 객체 정보를 사용하여 다운믹스 신호를 조절할 수 있다.

다운믹스 처리부(220)는 도 2에 도시된 바와 같이 주파수 분석부(221), 다운믹스 조절부(222) 및 주파수 합성부(223)를 포함할 수 있다.

주파수 분석부(221)는 다객체 오디오 부호화부(110)로부터 전송된 다운믹스 신호를 주파수 영역의 다운믹스 신호로 변환할 수 있다.

다운믹스 조절부(222)는 객체 편집 정보와 객체 정보를 사용하여 특정 객체 신호를 편집(수정, 추가, 제거, 대치)하여 조절된 주파수 영역의 다운믹스 신호를 생성할 수 있다. 이때, 특정 객체 신호는 주파수 분석부(221)에서 변환한 주파수 영역의 다운믹스 신호에 포함된 신호일 수 있다.

주파수 합성부(223)는 상기 조절된 주파수 영역의 다운믹스 신호를 합성하여 조절된 다운믹스 신호를 생성하고, 조절된 다운믹스 신호를 송출할 수 있다.

비트스트림 처리부(230)는 객체 편집 정보에 따라 객체 정보를 편집하고, 편집된 객체 정보를 기초로 조절된 객체 비트스트림을 생성할 수 있다.

비트스트림 처리부(230)는 도 2에 도시된 바와 같이 객체 정보 조절부(231)와 비트스트림 출력부(232)로 구성될 수 있다.

객체 정보 조절부(231)는 상기 객체 편집 정보에 따라 상기 객체 정보를 편집할 수 있다.

비트스트림 출력부(232)는 객체 정보 조절부(231)에서 조절된 객체 정보를 상기 비트스트림과 합성하여 조절된 비트스트림을 생성하고, 상기 조절된 비트스트림을 송출할 수 있다.

다음으로 객체 편집부(130)가 객체를 수정하거나 제거 또는 추가하는 경우의 각 구성 별 동작을 설명한다.

먼저, 객체 편집 정보가 객체를 수정하도록 하는 수정 정보일 경우에, 다운믹스 처리부(220)는 OLD 중에서 수정 정보에 대응하는 객체의 OLD를 수정 정보에 따라 변경하고, 변경된 OLD을 사용한 OLD 누적 값과 변경 전 OLD 누적 값 간의 비율에 따라 다운믹스 신호를 조절할 수 있다. 이때, 상기 OLD 누적 값은 복수의 객체를 포함하는 프레임에서 각 객체의 OLD를 모두 더한 값일 수 있다.

구체적으로 다운믹스 처리부(220)는 하기 수학식 1을 사용하여 다운믹스 신호를 조절할 수 있다.

[수학식 1]

이때, N은 전체 객체의 수이고, n은 프레임, k는 프레임에 포함된 서브밴드를 식별하는 정보이며, α는 객체의 편집 정도를 나타내는 스케일링 백터일 수 있다.

또한, OLD_i는 i 번째 객체의 OLD 크기이고, OLD_m는 수정 정보에 따라 변경되어야 할 OLD 크기이며, P_d는 다운믹스 처리부(220)가 수신한 다운믹스 신호의 파워이고,

는 다운믹스 처리부(220)에서 조절된 다운믹스 신호의 파워일 수 있다.

4개의 서브 밴드로 구성된 하나의 프레임이 있고 서브 밴드의 OLD가 각각 1, 0.5, 0.7, 0.4이며, 수정 정보는 4번째 객체의 OLD를 절반으로 감소시키도록 하는 정보인 경우를 일례로 설명한다.

먼저, 다운믹스 처리부(220)는 프레임에서 각 객체의 OLD를 모두 더한 값인 변경 전 OLD 누적 값을 1+0.5+0.7+0.4=2.6로 계산할 수 있다.

다음으로 다운믹스 처리부(220)는 4번째 객체의 OLD인 0.4를 절반으로 감소시켜 0.2로 변경하고, 0.2로 변경된 4번째 객체의 OLD를 포함한 OLD 누적 값을 1+0.5+0.7+0.2=2.4로 계산할 수 있다.

마지막으로 다운믹스 처리부(220)는 다운믹스 신호의 파워를 변경된 OLD을 사용한 OLD 누적 값인 2.4와 변경 전 OLD 누적 값 2.6의 비율인 2.4/2.6만큼 감소 시킬 수 있다.

이때, 객체 정보 조절부(231)는 OLD를 수정 정보에 따라 변경할 수 있다.

구체적으로 객체 정보 조절부(231)는 OLD의 최대값이 1이라는 사실과 수정 정보에 따라 변경되는 객체의 편집 정도를 나타내는 스케일링 백터 α을 이용하여 객체의 OLD를 변경할 수 있다.

이때, 특정 프레임(n)에서 특정 서브밴드(k)에 대한 OLD의 조절 방법은 수정 정보에 대응하는 객체의 OLD가 1인 경우와 1이 아닌 경우로 구분될 수 있다.

수정 정보에 대응하는 객체의 OLD인 OLD_m(n,k)가 1인 경우에 객체 정보 조절부(231)는 OLD_m(n,k)와 나머지 객체의 OLD를 비교할 수 있다.

이때, OLD_m(n,k)가 모든 나머지 객체의 OLD보다 크면, 객체 정보 조절부(231)는 하기된 수학식 2를 만족하도록 각 객체의 OLD를 변경할 수 있다.

[수학식 2]

이때,

는 수정 정보에 의하여 변경될 OLD_m(n,k)이고,

는 수정 정보에 의하여 변경될 나머지 OLD이며,

는 객체 정보 추출부(210)로부터 입력된 OLD일 수 있다.

또한, OLD_m(n,k)보다 큰 OLD를 가지는 객체인 OLD_s(n,k)가 있으면, 객체 정보 조절부(231)는 하기된 수학식 3을 만족하도록 각 객체의 OLD를 변경할 수 있다.

[수학식 3]

그리고, 수정 정보에 대응하는 객체의 OLD인 OLD_m (n,k)가 1이 아닌 경우에 객체 정보 조절부(231)는 OLD_m(n,k)이 1보다 큰지 아니면 1보다 작은지를 확인할 수 있다.

이때, OLD_m(n,k)이 1보다 크면, 객체 정보 조절부(231)는 상기 수학식 2를 만족하도록 각 객체의 OLD를 변경할 수 있다.

또한, OLD_m(n,k)이 1보다 작으면, 객체 정보 조절부(231)는 하기된 수학식 4를 만족하도록 OLD_m(n,k)의 OLD를 변경하고, 나머지 객체의 OLD는 변경하지 않을 수 있다.

[수학식 4]

다음으로, 객체 편집 정보가 객체를 삭제하도록 하는 삭제 정보일 경우에, 다운믹스 처리부(220)는 OLD 중에서 상기 삭제 정보에 대응하는 객체의 OLD를 0으로 변경하고, 변경된 OLD을 사용한 OLD 누적 값과 변경 전 OLD 누적 값 간의 비율에 따라 다운믹스 신호를 조절할 수 있다.

구체적으로 다운믹스 처리부(220)는 하기 수학식 5를 사용하여 다운믹스 신호를 조절할 수 있다.

[수학식 5]

이때, 상기 수학식 5는 상기 수학식 1에서 OLD_m(n,k)에 0을 입력한 수식과 동일할 수 있다.

이때, 객체 정보 조절부(231)는 OLD와 IOC를 사용하여 객체를 삭제할 수 있다.

구체적으로 객체 정보 조절부(231)는 OLD 중에서 상기 수정 정보에 대응하는 객체의 OLD를 제거하고, 제거되지 않은 객체의 OLD를 변경하며, 상기 IOC 중에서 상기 수정 정보에 대응하는 객체에 연관된 적어도 하나의 IOC의 값을 삭제할 수 있다.

하나의 프레임당 객체 수가 N일 경우에 IOC는 2개의 프레임을 그룹화하여 하기된 수학식 6과 같은 N X N 매트릭스로 형성될 수 있으며, 그룹화된 2개의 프레임에 포함된 각각의 개체 간 상관도를 나타낼 수 있다.

[수학식 6]

따라서, 특정 객체가 삭제 된 경우에, 특정 객체와 연관되어 있는 IOC는 의미가 없게 되므로 상기 IOC 매트릭스에서 삭제할 수 있다.

일례로, M 번째 객체를 삭제할 경우에 객체 정보 조절부(231)는 상기 수학식 6의 IOC 매트릭스에서 M번째 행과 열에 해당되는 IOC를 제거하여 (N-1) X (N-1)의 IOC 매트릭스를 생성하고, 생성된 (N-1) X (N-1)의 IOC 매트릭스를 비트스트림 출력부 (232)에서 생성되는 조절된 비트스트림에 저장할 수 있다.

제거되는 OLD가 1인 경우에, 객체 정보 조절부(231)는 하기된 수학식 7을 만족하도록 나머지 객체의 OLD를 변경할 수 있다.

[수학식 7]

또한, OLD가 1이 아닌 경우에 객체 정보 조절부(231)는 나머지 객체의 OLD를 변경하지 않을 수 있다.

그리고, 객체 정보 조절부(231)는 비트스트림에서 해당 객체에 대한 DMG와 DCLD를 제거할 수 있다.

마지막으로, 객체 편집 정보가 추가할 객체가 포함된 추가 정보일 경우에, 다운믹스 처리부(220)는 추가 정보를 다운믹스 신호와 믹싱하여 다운믹스 신호를 조절할 수 있다.

구체적으로 다운믹스 처리부(220)는 하기 수학식 8을 사용하여 다운믹스 신호를 조절할 수 있다.

[수학식 8]

이때, 객체 정보 조절부(231)는 추가 정보를 기초로 조절된 OLD와 조절된 IOC를 생성하고, 객체 정보 추출부(210)에서 추출한 OLD와 IOC를 조절된 OLD와 조절된 IOC로 변경할 수 있다.

이때, 객체 정보 조절부(231)는 하기된 수학식 9를 사용하여 하기된 수학식 10을 만족하는 IOC 매트릭스를 생성할 수 있다.

[수학식 9]

[수학식 10]

이때, 상기 수학식 10의 N+1 번째 행과 열에서 IOC_(N+1)(N+1)은 1이고, IOC_(N+1)(N+1)를 제외한 나머지 IOC 값들은 상기 수학식 9를 사용하여 추가되는 객체와 다운믹스 신호간의 계산된 IOC 값일 수 있다. 또한, IOC_(N+1)(N+1)를 제외한 나머지 IOC 값들은 모두 같은 값일 수 있다.

또한, 객체 정보 조절부(231)는 다운믹스 신호와 객체 정보 추출부(210)에서 추출된 OLD를 이용하여 각 객체 별 파워 정보를 계산하고, 각 객체 별 파워 정보와 입력되는 객체 신호의 파워를 이용하여 OLD를 조절한다. 이때, 객체 정보 조절부(231)는 다운믹스 조절부(222)로부터 다운믹스 신호의 파워를 전송 받을 수 있다.

이때, 특정 프레임의 특정 서브밴드에서의 각 객체의 파워는 다음과 같이 계산될 수 있다.

먼저, 다운믹스 조절부(222)는 하기된 수학식 11과 같이 객체 정보에 포함된 객체 별 파워의 합으로 다운믹스 신호의 파워를 계산할 수 있다.

[수학식 11]

이때, 객체 중에서 n 번째 객체가 가장 큰 파워를 가지고 있다고 가정하면 다객체 오디오 부호화부(110)에서 각 객체의 OLD는 하기된 수학식 12와 같이 계산될 수 있다. 이때, 객체 정보 조절부(231)는 하기된 수학식 13을 사용하여 각 객체의 파워를 계산할 수 있다.

[수학식 12]

[수학식 13]

또한, 객체 정보 조절부(231)는 하기된 수학식 14를 사용하여 n 번째 객체의 파워인

을 계산하고, 계산된

을 상기 수학식 13에 대입하여 나머지 모든 객체의 파워를 계산할 수 있다.

[수학식 14]

구체적으로 객체 정보 조절부(231)는 상기 수학식 11에 상기 수학식 13을 대입하여 하기 수학식 15를 생성하고, 하기 수학식 15를 n 번째 객체의 파워인

를 중심으로 변형하여 하기 수학식 16을 생성할 수 있다.

[수학식 15]

[수학식 16]

다음으로, 객체 정보 조절부(231)는 추가되는 객체의 파워와 각 객체의 파워에 하기된 수학식 17을 적용하여 조절된 OLD인 OLD_i를 생성할 수 있다.

[수학식 17]

이때,

은 추가되는 객체의 파워와 각 객체의 파워 중에서 가장 큰 객체의 파워로 하기된 수학식 18을 만족하는 m의 파워일 수 있다.

[수학식 18]

그리고, 객체 정보 조절부(231)는 추가되는 객체에 대한 DMG와 DCLD를 간단히 계산하여 비트스트림에 추가할 수 있다.

단계(S310)에서 주파수 분석부(221)는 다객체 오디오 부호화부(110)로부터 수신한 다운믹스 신호를 주파수 영역의 다운믹스 신호로 변환하여 다운믹스 조절부(222)에 전송할 수 있다.

단계(S315)에서 객체 정보 추출부(210)는 다객체 오디오 부호화부(110)로부터 수신한 객체 비트스트림에서 객체 정보를 추출하여 다운믹스 조절부(222)와 객체 정보 조절부(231)로 전송할 수 있다. 또한, 객체 정보 추출부(210)는 다객체 오디오 부호화부(110)로부터 수신한 객체 비트스트림을 비트스트림 출력부(232)로 전송할 수 있다.

단계(S320)에서 다운믹스 조절부(222)는 객체 편집 정보와 단계(S315)에서 수신한 객체 정보를 사용하여 특정 객체 신호를 편집(수정, 추가, 제거, 대치)하여 조절된 주파수 영역의 다운믹스 신호를 생성할 수 있다.

이때, 특정 객체 신호는 단계(S310)에서 전송된 주파수 영역의 다운믹스 신호에 포함된 신호일 수 있다.

단계(S325)에서 객체 정보 조절부(231)는 객체 편집 정보에 따라 단계(S315)에서 수신한 객체 정보를 조절할 수 있다. 구체적으로 객체 정보 조절부(231)는 단계(S315)에서 수신한 객체 정보의 일부를 삭제하거나 객체 편집 정보의 내용을 추가하거나, 객체 편집 정보의 내용에 따라 단계(S315)에서 수신한 객체 정보의 내용을 수정할 수 있다.

단계(S330)에서 주파수 합성부(223)는 상기 조절된 주파수 영역의 다운믹스 신호를 합성하여 조절된 다운믹스 신호를 생성하고, 조절된 다운믹스 신호를 송출할 수 있다.

단계(S335)에서 비트스트림 출력부(232)는 단계(S325)에서 조절된 객체 정보를 단계(S315)에서 전송 받은 비트스트림과 합성하여 조절된 비트스트림을 생성하고, 조절된 비트스트림을 송출할 수 있다.

도 4를 참조하면 본 발명의 다른 실시예에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치는 TTN (Two to N) 구조를 갖는 다객체 오디오 부호화기에서 객체를 편집하는 장치로서, 비트스트림 핸들러(410), 오브젝트 생성부(420), 다운믹스 조절부(430), 비트스트림 조절부(440), 및 비트스트림 포맷터(450) 로 구성된다.

비트스트림 핸들러(410)는 객체 비트스트림을 수신하고, 상기 객체 비트스트림에서 배경음을 나타내는 BGO(background object) 객체 비트스트림과 특정 객체 신호를 나타내는 FGO(foreground object) 객체 비트스트림을 추출할 수 있다. 또한, 비트스트림 핸들러(410)는 수신한 객체 비트스트림을 비트스트림 포맷터(450)로 전송할 수도 있다.

오브젝트 생성부(420)는 다운믹스 신호를 수신하고, 수신한 다운믹스 신호와 비트스트림 핸들러(410)로부터 수신한 BGO 객체 비트스트림 및 FGO 객체 비트스트림을 사용하여 BGO 다운믹스 신호와 FGO를 생성할 수 있다. 이때, 오브젝트 생성부(420)는 잔여 신호(residual signal)가 입력되면, 잔여 신호를 이용하여 원음에 가까운 FGO와 BGO를 생성할 수 있다.

다운믹스 조절부(430)는 오브젝트 생성부(420)에서 생성된 BGO 다운믹스 신호와 FGO를 객체 편집 정보에 따라 조절하고, 조절된 BGO 다운믹스 신호와 조절된 FGO를 믹싱하여 조절된 다운믹스 신호를 생성할 수 있다.

일례로 객체 편집 정보가 수정 정보인 경우에 다운믹스 조절부(430)는 수정된 BGO나 FGO에 조절 정도를 나타내는 팩터

를 곱한 후 다시 믹싱을 할 수 있다.

또한, 객체 편집 정보가 삭제 정보인 경우에 다운믹스 조절부(430)는 삭제 정보에 대응하는 정보가 삭제된 FGO에 조절 정도를 나타내는 팩터

를 곱한 후 다시 믹싱을 할 수 있다. 이때, 다운믹스 조절부(430)는 BGO에 대해서 제거를 수행하지 않을 수 있다.

마지막으로 객체 편집 정보가 추가 정보인 경우에 다운믹스 조절부(430)는 BGO, FGO와 추가되는 객체의 믹싱을 통해서 조절된 다운믹스 신호를 생성할 수 있다.

이때, FGO는 객체의 제거와 추가가 동시에 수행되므로, 다운믹스 조절부(430)는 FGO를 제거한 후 이를 대체하여 추가되는 다른 FGO를 기존의 BGO와 믹싱하여 조절된 다운믹스 신호를 생성할 수 있다.

그리고, 다운믹스 조절부(430)는 오브젝트 생성부(420)에 잔여 신호가 입력된 경우에 조절된 BGO 다운믹스 신호와 조절된 FGO와 BGO 객체 비트스트림 및 FGO 객체 비트스트림을 이용하여 잔여 신호를 다시 추출할 수 있다.

이때, 객체 편집 정보가 수정 정보이면, 다운믹스 조절부(430)는 다운믹스 조절부(430)에서 조절된 FGO/BGO와 이를 이용하여 생성된 조절된 다운믹스 신호 및 비트스트림 조절부(440)에서 편집된 객체 비트스트림을 사용하여 잔여 신호를 추출할 수 있다. 구체적으로 잔여 신호는 조절된 다운믹스 신호와 편집된 객체 파라미터를 이용하여 FGO와 BGO를 다시 생성하고, 다시 생성된 FGO와 BGO와 다운믹스하기 전의 조절된 FGO와 BGO의 차이를 잔여 신호로 추출할 수 있다.

또한, 객체 편집 정보가 수정 정보이면, 다운믹스 조절부(430)는 잔여 신호를 추출하지 않을 수 있다.

마지막으로 객체 편집 정보가 추가 정보이면, 다운믹스 조절부(430)는 추가되는 객체 신호와 다른 객체 신호, 이들의 다운믹스신호와 편집된 객체 비트스트림을 이용하여 잔여 신호를 생성할 수 있다. 구체적으로 다운믹스 조절부(430)는 객체를 추가하여 생성된 다운믹스 신호와 편집된 객체 비트스트림을 이용하여 추가되는 객체와 다른 객체 신호를 복원하고, 복원된 객체 신호와 다운믹스되기 전의 원래 객체 신호와의 차이를 잔여 신호로 추출할 수 있다.

비트스트림 조절부(440)는 객체 편집 정보에 따라 비트스트림 핸들러(410)로부터 수신한 BGO 객체 비트스트림 및 FGO 객체 비트스트림을 편집할 수 있다.

이때, 비트스트림 조절부(440)는 객체 편집 정보에 따라 객체 정보 조절부(231)와 같은 방법으로 BGO 객체 비트스트림 및 FGO 객체 비트스트림을 편집할 수 있으므로 상세한 동작 설명은 생략한다.

비트스트림 포맷터(450)는 비트스트림 조절부(440)에서 편집된 BGO 객체 비트스트림과 FGO 객체 비트스트림을 비트스트림 핸들러(410)로부터 전송된 객체 비트스트림과 합성하여 조절된 비트스트림을 생성하고, 상기 조절된 비트스트림을 송출할 수 있다.

단계(S510)에서 비트스트림 핸들러(410)는 객체 비트스트림을 수신하고, 객체 비트스트림에서 배경음을 나타내는 BGO(background object) 객체 비트스트림과 특정 객체 신호를 나타내는 FGO(foreground object) 객체 비트스트림을 추출할 수 있다. 또한, 비트스트림 핸들러(410)는 수신한 객체 비트스트림을 비트스트림 포맷터(450)로 전송할 수도 있다.

단계(S520)에서 오브젝트 생성부(420)는 다운믹스 신호를 수신하고, 수신한 다운믹스 신호와 비트스트림 핸들러(410)로부터 수신한 BGO 객체 비트스트림 및 FGO 객체 비트스트림을 사용하여 BGO 다운믹스 신호와 FGO를 생성할 수 있다.

단계(S530)에서 다운믹스 조절부(430)는 오브젝트 생성부(420)에서 생성된 BGO 다운믹스 신호와 FGO를 객체 편집 정보에 따라 조절할 수 있다.

단계(S535)에서 비트스트림 조절부(440)는 객체 편집 정보에 따라 비트스트림 핸들러(410)로부터 수신한 BGO 객체 비트스트림 및 FGO 객체 비트스트림을 편집할 수 있다.

단계(S540)에서 다운믹스 조절부(430)는 단계(S530)에서 조절된 BGO 다운믹스 신호와 조절된 FGO를 믹싱하여 조절된 다운믹스 신호를 생성할 수 있다.

단계(S545)에서 비트스트림 포맷터(450)는 단계(S535)에서 편집된 BGO 객체 비트스트림과 FGO 객체 비트스트림을 단계(S510)에서 전송된 객체 비트스트림과 합성하여 조절된 비트스트림을 생성할 수 있다.

단계(S550)에서 다운믹스 조절부(430)는 오브젝트 생성부(420)에 잔여 신호가 입력되었는지를 확인할 수 있다.

단계(S560)에서 다운믹스 조절부(430)는 단계(S530)에서 조절된 BGO 다운믹스 신호, 단계(S530)에서 조절된 FGO, 단계(S535)에서 조절된 BGO 객체 비트스트림 및 단계(S530)에서 조절된 FGO 객체 비트스트림을 이용하여 잔여 신호를 추출할 수 있다.

단계(S570)에서 다운믹스 조절부(430)는 단계(S540)의 조절된 BGO 다운믹스 신호와 단계(S560)에서 생성된 잔여 신호를 송출하고, 비트스트림 포맷터(450)는 단계(S545)의 조절된 BGO 객체 비트스트림 및 조절된 FGO 객체 비트스트림을 송출할 수 있다.

단계(S575)에서 다운믹스 조절부(430)는 단계(S540)의 조절된 BGO 다운믹스 신호를 송출하고, 비트스트림 포맷터(450)는 단계(S545)의 조절된 BGO 객체 비트스트림 및 조절된 FGO 객체 비트스트림을 송출할 수 있다.

본 발명에 따른 다객체 오디오 부호화에서의 오디오 객체 편집 장치는 다객체 오디오 복호화기에서 입력 객체들에 대한 부호화를 통해 생성된 다객체 비트스트림과 다운믹스 신호를 이용하여 또 다른 부호화 과정 없이 기존에 존재하는 객체 신호를 편집함으로써 원래의 객체 신호 없이도 오디오 객체를 편집할 수 있다. 또한, 편집되는 객체에 대한 부호화 과정이 생략되어 복잡도를 감소할 수 있다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims

객체 비트스트림을 수신하고, 상기 객체 비트스트림에서 객체 정보를 추출하는 객체 정보 추출부;

다운믹스 신호를 수신하고, 객체 편집 정보와 상기 객체 정보를 사용하여 상기 다운믹스 신호를 조절하는 다운믹스 처리부; 및

상기 객체 편집 정보에 따라 상기 객체 정보를 편집하고, 편집된 객체 정보를 기초로 조절된 객체 비트스트림을 생성하는 비트스트림 처리부

을 포함하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제1항에 있어서,

상기 다운믹스 처리부는,

상기 다운믹스 신호를 주파수 영역의 다운믹스 신호로 변환하는 주파수 분석부;

상기 객체 편집 정보와 상기 객체 정보를 사용하여 상기 주파수 영역의 다운믹스 신호에 포함된 특정 객체 신호를 편집하여 조절된 주파수 영역의 다운믹스 신호를 생성하는 다운믹스 조절부; 및

상기 조절된 주파수 영역의 다운믹스 신호를 합성하여 조절된 다운믹스 신호를 생성하는 주파수 합성부

를 포함하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제1항에 있어서,

상기 객체 정보는 상기 객체 정보 중에서 객체간 크기 차이를 나타내는 값인 OLD(Object level difference)와 객체 간 상관도를 나타내는 값인 IOC(inter-object correlation)중에 적어도 하나를 포함하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제3항에 있어서,

상기 다운믹스 처리부는 상기 객체 편집 정보가 객체를 수정하도록 하는 수정 정보일 경우에, 상기 수정 정보에 대응하는 객체의 OLD를 상기 수정 정보에 따라 변경하고, 변경된 OLD을 사용한 OLD 누적 값과 변경 전 OLD 누적 값 간의 비율에 따라 다운 믹스 신호를 조절하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제4항에 있어서,

상기 OLD 누적 값은 복수의 객체를 포함하는 프레임에서 각 객체의 OLD를 모두 더한 값인 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제5항에 있어서,

상기 다운믹스 처리부는 상기 객체 편집 정보가 객체를 삭제하도록 하는 삭제 정보일 경우일 경우에, 상기 OLD 중에서 상기 삭제 정보에 대응하는 객체의 OLD를 0으로 변경하고, 변경된 OLD을 사용한 OLD 누적 값과 변경 전 OLD 누적 값 간의 비율에 따라 다운 믹스 신호를 조절하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제3항에 있어서,

상기 다운믹스 처리부는 상기 객체 편집 정보가 추가할 객체가 포함된 추가 정보일 경우에, 상기 추가 정보를 상기 다운믹스 신호와 믹싱하여 다운믹스 신호를 조절하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제3항에 있어서,

상기 비트스트림 처리부는,

상기 객체 편집 정보에 따라 상기 객체 정보를 편집하는 객체 정보 조절부; 및

상기 객체 정보 조절부에서 조절된 객체 정보를 상기 비트스트림과 합성하여 조절된 비트스트림을 생성하는 비트스트림 출력부

를 포함하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제8항에 있어서,

상기 객체 정보 조절부는 상기 객체 편집 정보가 수정 정보일 경우에, 상기 OLD를 수정 정보에 따라 변경하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제8항에 있어서,

상기 객체 정보 조절부는 상기 객체 편집 정보가 삭제 정보일 경우에, 상기 OLD 중에서 상기 삭제 정보에 대응하는 객체의 OLD를 제거하고, 제거되지 않은 객체의 OLD를 변경하며, 상기 IOC 중에서 상기 삭제 정보에 대응하는 객체에 연관된 적어도 하나의 IOC의 값을 삭제하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제8항에 있어서,

상기 객체 정보 조절부는 상기 객체 편집 정보가 추가 정보일 경우에, 상기 추가 정보를 기초로 조절된 OLD와 조절된 IOC를 생성하고, 상기 OLD와 상기 IOC를 상기 조절된 OLD와 상기 조절된 IOC로 변경하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제11항에 있어서,

상기 다운믹스 처리부는 상기 다운믹스 신호와 상기 OLD를 사용하여 각 객체 별 파워정보를 계산하고, 상기 각 객체 별 파워 정보와 상기 추가 정보에 포함된 객체 신호의 파워를 사용하여 조절된 OLD를 생성하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
객체 비트스트림을 수신하고, 상기 객체 비트스트림에서 배경음을 나타내는 BGO(background object) 객체 비트스트림과 특정 객체 신호를 나타내는 FGO(foreground object) 객체 비트스트림을 추출하는 비트스트림 핸들러;

다운믹스 신호를 수신하고, 상기 BGO 객체 비트스트림과 상기 FGO 객체 비트스트림 및 상기 다운믹스 신호를 사용하여 BGO 다운믹스 신호와 FGO를 생성하는 오브젝트 생성부;

상기 BGO 다운믹스 신호와 상기 FGO를 객체 편집 정보에 따라 조절하고, 조절된 BGO 다운믹스 신호와 조절된 FGO를 믹싱하여 조절된 다운믹스 신호를 생성하는 다운믹스 조절부; 및

상기 객체 편집 정보에 따라 상기 BGO 객체 비트스트림과 상기 FGO 객체 비트스트림을 편집하는 비트스트림 조절부;

상기 비트스트림 조절부에서 편집된 BGO 객체 비트스트림과 FGO 객체 비트스트림을 상기 비트스트림과 합성하여 조절된 비트스트림을 생성하는 비트스트림 포맷터

을 포함하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.
제13항에 있어서,

상기 다운믹스 조절부는 상기 오브젝트 생성부에 잔여 신호가 입력된 경우에 조절된 BGO 다운믹스 신호와 조절된 FGO 및 상기 편집된 BGO 객체 비트스트림과 FGO 객체 비트스트림을 이용하여 상기 잔여 신호를 다시 추출하는 것을 특징으로 하는 다객체 오디오 부호화에서의 오디오 객체 편집 장치.