WO2019190261A1

WO2019190261A1 - 멀티레이어 바이노럴 컨텐츠 생성 방법 및 이를 위한 프로그램

Info

Publication number: WO2019190261A1
Application number: PCT/KR2019/003700
Authority: WO
Inventors: 신대철
Original assignee: 신대철
Priority date: 2018-03-30
Filing date: 2019-03-29
Publication date: 2019-10-03
Also published as: KR102036893B1; KR20190114578A

Abstract

멀티레이어 바이노럴 컨텐츠 생성 방법 및 이를 위한 프로그램이 개시된다. 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성하는 단계; 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 상기 3차원 레이어 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용하는 단계; 및 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 포함한다.

Description

멀티레이어 바이노럴 컨텐츠 생성 방법 및 이를 위한 프로그램

본 발명은 멀티레이어 바이노럴 컨텐츠 생성 방법 및 이를 위한 프로그램(METHOD FOR CREATING MULTI-LAYER BINAURAL CONTENT AND PROGRAM THEREOF)에 관한 것으로, 더욱 상세하게는 사용자 입력에 따른 오디오 이펙트가 각각 적용된 바이노럴 출력과 오디오 출력을 기반으로 바이노럴 청취 환경을 극대화시킨 컨텐츠를 제공하는 기술에 관한 것이다.

본 발명은 2018년 3월 30일 출원된 한국특허출원 제10-2018-0037502호의 출원일의 이익을 주장하며, 그 내용 전부는 본 명세서에 포함된다.

멀티미디어 기술이 향상되면서, 5.1 채널보다 많은 7.1 채널, 10.2 채널, 11.1 채널, 22.2 채널 등의 다채널 오디오 신호를 포함하는 컨텐츠의 사용이 증가하고 있다. 그러나, 컨텐츠를 이용하는 사용자들이 소지하고 있는 사용자 단말들은 대체로 스테레오 스피커나 헤드폰, 이어폰과 같이 스테레오 형태의 오디오 신호를 재생할 수 있기 때문에 고품질의 다채널 오디오 신호는 스테레오 형태의 오디오 신호로 변환될 필요가 있다.

본 발명의 목적은 다양한 사운드 요소들에 대한 이펙트 편집을 개별적으로 수행할 수 있는 인터페이스를 제공함으로써 사용자의 취향에 적합한 청취환경을 제공하는 것이다.

또한, 본 발명의 목적은 헤드 트래킹 데이터의 급격한 변화에 의해 왜곡될 수 있는 음질을 보존하는 것이다.

또한, 본 발명의 목적은 다양한 사운드 요소를 믹스함으로써 바이노럴 효과를 극대화할 수 있는 바이노럴 컨텐츠를 생성하기 위한 방법을 제공하는 것이다.

상기한 목적을 달성하기 위한 본 발명에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은, 3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성하는 단계; 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 상기 3차원 레이어 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용하는 단계; 및 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 포함한다.

이 때, 멀티레이어 바이노럴 컨텐츠 생성 방법은 상기 3차원 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 헤드 트래킹 데이터를 적용하는 단계를 더 포함할 수 있다.

이 때, 헤드 트래킹 데이터는 센서 입력 기반의 자동 헤드 트래킹 데이터 및 헤드 트래킹 인터페이스에 대한 사용자 입력 기반의 수동 헤드 트래킹 데이터 중 어느 하나에 상응할 수 있다.

이 때, 헤드 트래킹 데이터는 기설정된 트래킹 제한 범위 이내에서 로그(LOG) 수식으로 변환되어 적용될 수 있다.

이 때, 오디오 이펙트를 적용하는 단계는 룸(ROOM) 설정, 이퀄라이저(EQUALIZER, EQ) 설정 및 플러그인(PLUG-IN) 설정 중 적어도 하나에 대한 설정을 수행할 수 있다.

이 때, 평면 레이어는 서라운드 레이어 바이노럴 인코딩을 수행하여 서라운드 레이어 바이노럴 출력을 생성하고, 생성된 상기 서라운드 레이어 바이노럴 출력을 상기 평면 레이어 오디오 출력으로 제공하는 서라운드 레이어 및 스테레오 신호를 입력 받아서 상기 스테레오 신호에 상응하는 상기 평면 레이어 오디오 출력을 생성하는 근접용 스테레오 레이어 중 어느 하나일 수 있다.

이 때, 3차원 레이어 바이노럴 출력은 4개의 업 채널들과 4개의 다운채널들로 구성된 8채널 기반의 3차원 큐빅(Cubic) 상에 위치하는 바이노럴 포인트에 대한 3차원 벡터에 상응하게 생성될 수 있다.

이 때, 멀티레이어 바이노럴 컨텐츠를 생성하는 단계는 상기 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 서브우퍼 레이어에 상응하는 서브우퍼 출력에 상응하는 오디오 이펙트를 적용하는 단계; 및 오디오 이펙트가 적용된 서브우퍼 출력을 상기 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력과 함께 합산하여 상기 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 더 포함할 수 있다.

이 때, 멀티레이어 바이노럴 컨텐츠 생성 방법은 바이노럴 오디오 소스에 대한 오토메이션 정보를 고려하여 상기 오디오 이펙트를 리셋시키는 단계를 더 포함할 수 있다.

이 때, 오디오 이펙트를 적용하는 단계는 상기 바이노럴 오디오 소스의 전체 범위 중 기설정된 적용 범위에 상응하게 상기 오디오 이펙트를 적용할 수 있다.

또한, 본 발명의 일실시예에 따른 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램은, 3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성하는 단계; 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 상기 3차원 레이어 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용하는 단계; 및 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 실행시킨다.

이 때, 3차원 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 헤드 트래킹 데이터를 적용하는 단계를 더 실행시킬 수 있다.

이 때, 룸(ROOM) 설정, 이퀄라이저(EQUALIZER, EQ) 설정 및 플러그인(PLUG-IN) 설정 중 적어도 하나에 대한 설정을 수행하여 상기 오디오 이펙트를 적용할 수 있다.

이 때, 상기 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 서브우퍼 레이어에 상응하는 서브우퍼 출력에 상응하는 오디오 이펙트를 적용하는 단계; 및 오디오 이펙트가 적용된 서브우퍼 출력을 상기 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력과 함께 합산하여 상기 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 더 실행시킬 수 있다.

이 때, 바이노럴 오디오 소스에 대한 오토메이션 정보를 고려하여 상기 오디오 이펙트를 리셋시키는 단계를 더 실행시킬 수 있다.

이 때, 상기 바이노럴 오디오 소스의 전체 범위 중 기설정된 적용 범위에 상응하게 상기 오디오 이펙트를 적용할 수 있다.

본 발명에 따르면, 다양한 사운드 요소들에 대한 이펙트 편집을 개별적으로 수행할 수 있는 인터페이스를 제공함으로써 사용자의 취향에 적합한 청취환경을 제공할 수 있다.

또한, 본 발명은 목적은 헤드 트래킹 데이터의 급격한 변화에 의해 왜곡될 수 있는 음질을 보존할 수 있다.

또한, 본 발명은 다양한 사운드 요소를 믹스함으로써 바이노럴 효과를 극대화할 수 있는 바이노럴 컨텐츠를 생성하기 위한 방법을 제공할 수 있다.

도 1은 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 시스템을 나타낸 블록도이다.

도 2는 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법을 나타낸 동작흐름도이다.

도 3은 본 발명의 다른 실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 시스템을 나타낸 도면이다.

도 4는 본 발명의 일실시예에 따른 3차원 레이어 바이노럴 출력을 생성하는 상세한 구조를 나타낸 도면이다.

도 5는 본 발명에 따른 8채널 기반의 3차원 큐빅(Cubic)의 일 예를 나타낸 도면이다.

도 6은 본 발명의 일실시예에 따른 서라운드 레이어 바이노럴 출력을 생성하는 상세한 구조를 나타낸 도면이다.

도 7은 본 발명에 따른 5채널 기반의 서라운드 레이어의 일 예를 나타낸 도면이다.

도 8은 본 발명의 일실시예에 따른 스테레오 신호를 생성하는 상세한 구조를 나타낸 도면이다.

도 9는 본 발명에 따른 근접용 스테레오 레이어의 일 예를 나타낸 도면이다.

도 10은 본 발명의 일실시예에 따른 서브우퍼 출력을 생성하는 상세한 구조를 나타낸 도면이다.

도 11은 본 발명에 따른 3차원 바이노럴 레이어, 평면 레이어 및 서브우퍼 레이어를 합한 구조의 일 예를 나타낸 도면이다.

도 12 내지 도 13은 본 발명에 따른 볼륨 및 필터 인터페이스의 일 예를 나타낸 도면이다.

도 14 내지 도 15는 본 발명에 따른 오디오 이펙트 인터페이스의 일 예를 나타낸 도면이다.

도 16은 본 발명에 따른 헤드 트래킹 인터페이스의 일 예를 나타낸 도면이다.

도 17은 본 발명에 따른 헤드 트래킹 데이터의 일 예를 나타낸 도면이다.

도 18은 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 프로그램을 실행시키기 위한 단말 장치를 나타낸 블록도이다.

본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1을 참조하면, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 시스템은 바이노럴 오디오 소스(110), 멀티 레이어 디코더(120), 레이어(130), 레이어별 개별 편집 모듈(140), 오디오 믹서(150) 및 멀티레이어 바이노럴 컨텐츠(160)를 포함한다.

종래의 바이노럴 기술은 다채널 오디오 파일에 대해 바이노럴 인코딩된 바이노럴 출력을 전용 플레이어를 통해 디코딩하여 제공하는 방식이었다. 그러나, 바이노럴 인코딩은 리스닝 포지션(listening position)으로부터 일정 거리 떨어진 곳에 배치된 고정 스피커를 이용하기 때문에 스피커의 위치를 조절하여 공간의 이미지를 증감시키는데에 어려움이 따른다.

또한, 서라운드 영화 컨텐츠와 같이 영상과 오디오가 함께 포함된 컨텐츠에 특화된 기술로, 음악 컨텐츠와 같이 공간 이미지가 존재하지 않는 오디오 소스의 경우에는 해당 기술을 적용하기 난해한 문제점이 있다.

또한, 전용 플레이어를 사용해야만 바이노럴 컨텐츠의 재생이 가능하기 때문에 활용적인 측면에서 효율성이 떨어질 수 있다. 예를 들어, 음악 컨텐츠의 특성상 청취자에게 충분한 라우드니스(loudness)를 전달해주어야 하지만, 바이노럴 인코더만 이용해서는 음악 컨텐츠에 최적화된 음향 효과를 제공하는데 한계가 있다.

또한, 종래의 바이노럴 기술은, 컨텐츠에 따라 주로 활용되는 효과에 특화된 하나의 인코더만을 이용하기 때문에 다양한 방식의 연출 효과를 적용하는 것이 불가능했다. 예를 들어, 음악 컨텐츠에 대해서는 특성상 서브우퍼를 사용하지 않는 경우가 많기 때문에, 종래의 바이노럴 엔진을 통해 음악 컨텐츠에 서브우퍼에 따른 저음 재생 요소를 제공하는 연출은 거의 시도되지 않았다.

이에 따라, 본 발명에서는 다양한 바이노럴 음향 효과를 포함하는 출력과 오디오 프로세싱에 의한 출력을 믹싱(MIXING)하여 보다 극적인 연출을 포함하는 바이노럴 컨텐츠를 제공하되, 멀티레이어 방식의 오디오를 최종합산 하는 방식으로 멀티레이어 바이노럴 컨텐츠(160)를 제공함으로써 사용자의 취향에 따라 오디오 이펙트를 적용할 수 있는 환경을 제공할 수 있다.

이를 위해, 먼저 도 1에 도시된 것과 같이 멀티 레이어 디코더(120)를 이용하여 바이노럴 오디오 소스(110)를 복수개의 레이어들로 디코딩할 수 있다.

이 때, 멀티 레이어 디코더(120)는 멀티레이어 바이노럴 디코더에 상응하는 것으로 바이노럴 오디오 소스(110)를 3차원 바이노럴 레이어에 상응하는 이머시브 큐빅 레이어, 평면 레이어에 상응하는 서라운드 레이어와 스테레오 레이어 및 서브우퍼 레이어 등으로 분리시킬 수 있다.

이 후, 본 발명에 따른 레이어별 개별 편집 모듈(140)을 기반으로 3차원 바이노럴 레이어, 평면 레이어 및 서브우퍼 레이어 각각에 대한 오디오 이펙트, 헤드 트래킹 데이터 등을 편집할 수 있다. 이와 같은 개별 편집은 별도의 인터페이스에 기반한 사용자 입력을 통해 수행되기 때문에 사용자의 취향에 가장 이상적인 멀티레이어 바이노럴 컨텐츠를 생성할 수 있으며, 청취 환경을 개인화할 수도 있다.

이 때, 사용자는 인터페이스를 통해 바이노럴 오디오 소스 또는 바이노럴 음원의 가공 범위를 지정하여 원하는 부분에 대해서만 편집 또는 가공을 수행할 수 있다.

이 때, 개별 편집을 통해 헤드 트래킹 데이터를 적용하는 경우, 헤드 트래킹 데이터에 대한 적정 수준의 리미트(Limit)를 제공함으로써 급격한 움직임으로 인해 음질이 떨어지는 것을 방지할 수도 있다.

이 후, 오디오 믹서(150)를 통해 개별 편집된 레이어들을 합산함으로써 범용 디코더를 통해 재생 가능하고 종래의 컨텐츠들과도 호환성이 높은 멀티레이어 바이노럴 컨텐츠(160)를 생성할 수 있다.

예를 들어, 영상과 오디오가 함께 포함된 영화 컨텐츠의 경우, 영상에 포함된 객체의 움직임에 기반하여 생성 가능한 서라운드 레이어 바이노럴 출력과 함께 3차원 레이어 바이노럴 출력, 스테레오 출력 및 서브우퍼 출력 중 적어도 하나를 혼합하여 제공함으로써 보다 극적인 사운드 연출이 가능하도록 할 수 있다.

다른 예를 들어, 오디오만 포함하는 음악 컨텐츠의 경우에는 3차원 바이노럴 레이어를 기반으로 생성된 3차원 레이어 바이노럴 출력과 함께 스테레오 출력이나 서브우퍼 출력을 혼합하여 제공함으로써 다이나믹한 음악을 제공할 수도 있다.

도 2를 참조하면, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성한다(S210).

이 때, 3차원 바이노럴 레이어는 3차원 공간 이미지를 만드는 요소에 상응하는 것으로, 예를 들어 도 4를 참조하면, 3차원 큐빅 방식에 상응하는 바이노럴 인코더(420)를 이용하여 3차원 바이노럴 레이어에 포함된 다수의 채널들에 상응하는 3차원 레이어 바이노럴 인코딩을 수행할 수 있다.

이 때, 3차원 바이노럴 레이어는 8채널 기반의 3차원 큐빅에 상응하는 4개의 업채널(411)과 4개의 다운채널(412)을 포함할 수 있다.

따라서, 3차원 레이어 바이노럴 출력(430)은 8채널 기반의 오디오를 바이노럴 인코딩함으로써 생성된 출력에 상응할 수 있고, 도 4에 도시된 것과 같이 2채널에 상응하게 출력될 수 있다. 또한, 3차원 레이어 바이노럴 출력(430)에 상응하는 2채널은 각각 레프트 채널과 라이트 채널에 상응할 수 있다.

이 때, 도 4에 도시된 실시예에서는 3차원 바이노럴 레이어로 8채널 기반의 3차원 큐빅 레이어를 사용하였으나, 3차원 바이노럴 레이어는 이에 한정되지 않을 수 있다. 즉, 본 발명에 적용 가능한 다른 3차원 바이노럴 레이어 또는 향후 개발될 3차원 바이노럴 레이어를 포함하여 구성될 수도 있다.

예를 들어, 도 5를 참조하면, 8채널 기반의 3차원 큐빅은 4개의 업채널들에 상응하는 4개의 동적 스피커들(511~514)과 4개의 다운채널들에 상응하는 4개의 동적 스피커들(515~518)을 각 꼭지점으로 하는 육면체 구조일 수 있다. 이 때, 8개의 동적 스피커들(511~518)의 위치는 변경이 가능하기 때문에 3차원 큐빅에 의해 발생하는 바이노럴 효과의 범위도 동적으로 변경할 수 있다.

다른 예를 들어, 기존의 바이노럴 방식은 Vbap(Vector base amplitude panning) 또는 앰비소닉(Ambisonics) 등을 사용하여 3차원 큐빅을 생성함으로써 8개의 동적 스피커들로 이머시브(immersive) 사운드를 구현할 수도 있다. 즉, 8개의 동적 스피커들 각각에 대해 X, Y, Z에 대한 위치 값을 부여하되, 3차원 큐빅의 중점을 기준으로 하는 벡터 기반의 가상의 트랙 포인트(Track Point)를 표현할 수 있다. 이 때, 가상의 트랙 포인트는 헤드 트래킹 정보에 포함된 파라미터 값에 상응하게 표현될 수 있다.

이와 같은 3차원 큐빅을 통해 오디오만 포함하는 음악 컨텐츠에 대한 공간 이미지를 생성할 수 있고, 소리의 움직임을 표현할 수 있어서 보다 입체적인 효과를 제공할 수 있다.

이 때, 3차원 큐빅은 3차원 큐빅의 꼭지점에 해당하는 8개의 동적 스피커들의 위치를 3차원 바이노럴 레이어에 대한 크기 파라미터에 상응하게 변경하여 생성될 수 있다. 즉, 고정 방식이 아닌 가변 방식의 동적 스피커들의 위치를 크기 파라미터에 상응하게 자유롭게 변경함으로써 효율적으로 3차원 큐빅을 생성할 수 있다.

예를 들어, 크기 파라미터를 상수로 정하고, 여기에 바이노럴 함수를 곱하는 방식으로 3차원 큐빅을 프로세싱함으로써 다양한 범위를 갖는 3차원 큐빅들을 생성할 수도 있다.

이 때, 3차원 벡터는 3차원 큐빅의 내부에 포함되고, 서라운드 레이어에 상응하는 2차원 평면의 중심에 해당하는 기준 청취점을 기준으로 생성될 수 있다.

예를 들어, 바이노럴 스테레오 오디오를 듣는 사용자 또는 청취자의 위치를 가상으로 표현한 기준 청취점은 8개의 동적 스피커들을 각 꼭지점으로 하는 3차원 큐빅의 내부에 위치하되, 서라운드 레이어 상에서 중심 부분에 위치할 수 있다. 이 때, 바이노럴 포인트가 3차원 큐빅의 상면에 위치한다고 가정하면, 3차원 레이어 바이노럴 출력에 상응하는 3차원 벡터는 기준 청취점에서 바이노럴 포인트를 향하는 방향으로 생성될 수 있다.

이 때, 평면 레이어는 3차원 바이노럴 레이어와는 상이한 구조를 갖는 레이어에 상응하는 것으로, 서라운드 효과 또는 스테레오 효과에 상응하는 이미지를 만드는 요소에 상응할 수 있다.

따라서, 평면 레이어는 서라운드 레이어 바이노럴 인코딩을 수행하여 서라운드 레이어 바이노럴 출력을 생성하고, 생성된 서라운드 레이어 바이노럴 출력을 평면 레이어 오디오 출력으로 제공하는 서라운드 레이어 및 스테레오 신호를 입력 받아서 스테레오 신호에 상응하는 평면 레이어 오디오 출력을 생성하는 근접용 스테레오 레이어 중 어느 하나일 수 있다.

예를 들어, 도 6을 참조하면, 바이노럴 인코더(620)를 이용하여 5채널 또는 7채널(610)의 서라운드 레이어에 상응하는 서라운드 레이어 바이노럴 인코딩을 수행할 수 있다. 이 때, 도 9를 통해 설명하겠지만, 근접용 스테레오 레이어에 상응하는 2채널을 서라운드 레이어에 포함시켜 7채널 기반의 서라운드 레이어 바이노럴 인코딩을 수행할 수 있다.

이 때, 서라운드 레이어는, 예를 들어, 도 7에 도시된 것과 같이 5개의 스피커들(711~715)을 포함하는 구조에 상응할 수 있다. 이 때, 서라운드 레이어 바이노럴 출력(630)은 서라운드 레이어 상에 위치하는 바이노럴 포인트에 상응할 수 있다. 만약, 청취자가 서라운드 레이어의 중심에 위치하는 기준 청취점에서 소리를 듣고 있다고 가정할 경우, 마치 서라운드 레이어 상의 바이노럴 포인트에서 소리가 나는 것처럼 바이노럴 인코딩하여 서라운드 레이어 바이노럴 출력(630)을 생성할 수 있다. 이 때, 서라운드 레이어는 서라운드 효과에 상응하는 서라운드 이미지를 만드는 요소에 상응하는 것으로, 도 7에서는 설명의 편의를 위해 서라운드 레이어를 평면의 형태로 도시하였으나, 평면 형태에 한정되지 않을 수 있다.

이 때, 서라운드 레이어 바이노럴 출력(630)은 도 6에 도시된 것과 같이 2채널에 상응하게 출력될 수 있다. 또한, 서라운드 레이어 바이노럴 출력(630)에 상응하는 2채널은 각각 레프트 채널과 라이트 채널에 상응할 수 있다.

이 때, 도 6 내지 도 7에서는 5채널 또는 7채널(610)에 해당하는 서라운드 레이어를 도시하고 있으나, 서라운드 레이어의 채널은 5채널 또는 7채널(610)에 한정되지 않는다. 또한, 도 7에서는 서라운드 레이어를 사각형 평면 형태로 도시하고 있으나, 이에 한정되지 않고 선의 두께, 평면 모양의 형태 및 기준 청취점으로부터의 거리 등 다양한 형태로 표현 가능하다.

다른 예를 들어, 도 8을 참조하면, 스테레오 버스(Stereo Bus)(820)를 기반으로 2채널(810)의 근접용 스테레오 레이어에 상응하게 오디오 프로세싱을 수행할 수 있다. 즉, 평면 레이어 오디오 출력에 상응하는 스테레오 신호(830)는 2채널(810) 기반의 스테레오 오디오를 프로세싱함으로써 생성된 출력에 상응할 수 있고, 2채널에 상응하게 출력될 수 있다.

이 때, 근접용 스테레오 레이어는 스테레오 효과에 상응하는 스테레오 이미지를 만드는 요소에 상응하는 것으로, 서라운드 레이어의 일부로 포함되어 나타낼 수도 있다.

예를 들어, 도 9에 도시된 것과 같이 5개의 스피커들에 기반한 서라운드 레이어 상에 2개의 스피커들(911, 912)에 상응하는 근접용 스테레오 레이어를 포함시켜 총 7개의 스피커들을 포함하는 레이어 구조로 나타낼 수도 있다.

이 때, 도 9에 도시된 것과 같이, 근접용 스테레오 레이어는 서라운드 레이어 상에 위치하는 기준 청취점(900)으로부터 근접한 거리에 배치될 수 있다. 또는, 기준 청취점(900)의 좌우 사이드 스피커로써 근접용 스테레오 레이어를 사용할 수도 있다.

이 때, 근접용 스테레오 레이어에 상응하게 출력되는 스테레오 신호는 바이노럴 인코딩에 사용되는 공간 파라미터로는 연출하기 어려운 댐핑(damping)감을 제공할 수 있다. 따라서, 본 발명의 일실시예에 따른 바이노럴 스테레오 출력은 바이노럴 인코딩에 의한 이머시브(immersive) 효과를 제공함과 동시에 댐핑감을 제공할 수도 있다.

이와 같이, 서라운드 레이어 바이노럴 출력에 상응하는 평면 레이어 오디오 출력이나 스테레오 신호에 상응하는 평면 레이어 오디오 출력은 3차원 레이어 바이노럴 출력과 비교하였을 때, 단지 상이한 음향 효과를 포함하는 출력에 해당하는 것일 수 있다. 즉, 평면 레이어 오디오 출력은 3차원 레이어에 상응하는 출력이 아니어도 3차원 레이어 바이노럴 출력보다 다양한 값을 포함할 수도 있다.

이 때, 평면 레이어는 3차원 큐빅에 상응하는 4개의 업채널들과 4개의 다운채널들 사이에 위치할 수 있다.

예를 들어, 도 11을 참조하면, 본 발명의 일실시예에 따른 평면 레이어에 상응하는 서라운드 레이어(1120)와 근접용 스테레오 레이어(1130)는 3차원 바이노럴 레이어(1110)에 상응하는 3차원 큐빅에 포함된 4개의 업채널들과 4개의 다운채널들 사이에 위치할 수 있다.

이 때, 4개의 업채널들은 3차원 큐빅의 상단에 위치하는 4개의 스피커들에 해당할 수 있고, 4개의 다운채널들은 3차원 큐빅의 하단에 위치하는 4개의 스피커들에 해당할 수 있다.

즉, 도 11에 도시된 것과 같이 평면 레이어는 3차원 큐빅에 상응하는 육면체의 높이 범위 내에 위치할 수 있다.

따라서, 서라운드 레이어(1120)나 근접용 스테레오 레이어(1130)에 포함되는 각각의 스피커들도 3차원 큐빅에 포함된 4개의 업채널들과 4개의 다운채널들 사이에 위치할 수 있다. 이 때, 도 11에서는 설명의 편의를 위해 평면 레이어를 평면의 형태로 도시하였으나, 본 발명의 일실시예에 따른 평면 레이어의 형태는 평면의 형태에 한정되지 않을 수도 있다.

또한, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용한다(S220).

일반적인 바이노럴 오디오 소스는 공간적 이펙트를 최대한 표현하도록 제작되었기 때문에 음악적 측면에서의 다이나믹한 재생은 기대하기 어렵다. 이러한 이유로 바이노럴 오디오 소스에 오디오 이펙트를 적용하는 경우, 공간적 이펙트를 제공하는 바이노럴 이미지가 손상될 가능성이 크다. 예를 들어, 다이나믹한 사운드를 구현하기 위해 공간의 이미지를 축소하는 경우에 바이노럴 효과가 사라질 수 있고, 저음의 증가로 인해 바이노럴 효과를 저하시킬 수도 있다.

따라서, 본 발명에서는 바이노럴 오디오 소스를 구성하는 레이어별로 사운드 이펙트를 적용함으로써 바이노럴 이미지는 그대로 유지한 상태로 사용자가 원하는 오디오 이펙트를 처리할 수 있다. 이 때, 설명의 편의를 위해 바이노럴 오디오 소스에 대해 한정하여 설명하였으나, 본 발명은 멀티레이어로 구성된 바이노럴 오디오 소스 및 멀티레이어로 구성된 논바이노럴(NON-BINAURL) 오디오 소스에 모두 적용가능할 수 있다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 서브우퍼 레이어에 상응하는 서브우퍼 출력에 대해 오디오 이펙트를 적용할 수 있다.

종래의 바이노럴 기술에서는 하나의 사운드 필드만을 제공하기 때문에 오디오 이펙트를 적용하는 경우에 사용자가 의도하지 않은 변형이 발생할 수 있다. 따라서, 본 발명에서는 멀티레이어로 구성된 바이노럴 컨텐츠의 레이어마다 개별적으로 오디오 이펙트를 적용함으로써 사운드 청취에 다양한 장점을 제공할 수 있다.

예를 들어, 다이나믹한 사운드는 그대로 유지한 상태에서 공간 이미지만 크게하고자 하는 경우, 스테레오 레이어는 그대로 두고 3차원 바이노럴 레이어에만 공간 이펙트를 적용할 수 있다.

이 때, 룸(ROOM) 설정, 이퀄라이저(EQUALZER, EQ) 설정 및 플러그인(PLUG-IN) 설정 중 적어도 하나에 대한 오디오 이펙트 설정을 수행할 수 있다.

예를 들어, 도 14를 참조하면, 본 발명의 일실시예에 따른 오디오 이펙트 인터페이스(1400)는 레이어별 룸 사이즈를 조정하기 위한 모드에 상응할 수 있다.

이 때, 오디오 이펙트 인터페이스(1400) 하단에 포함된 탭 메뉴를 통해 오디오 이펙트를 설정하기 위한 모드를 변경할 수 있으며, 각 모드내에서도 플립 버튼(1450)을 통해 다른 이펙트 설정 창으로 이동할 수도 있다.

이 때, 도 14에 도시된 것과 같은 룸 사이즈 설정 모드에서는 비주얼라이제이션 인터페이스(1410)와 함께 3차원 바이노럴 레이어 메뉴(1420), 서라운드 레이어 메뉴(1430) 및 근접용 스테레오 레이어 메뉴(1440)를 제공할 수 있다.

이 때, 본 발명에서는 도 14 및 도 15에 도시된 비주얼라이제이션 인터페이스(1410, 1510)을 제공함으로써 사용자는 청각과 시각으로 공간의 크기가 변함에 따라 소리가 변화하는 정도를 확인할 수도 있다.

이 때, 비주얼라이제이션 인터페이스(1410)는 비주얼라이제이션 플립 버튼(1460)을 통해 도 15에 도시된 것은 형태로 모드를 변경할 수 있다.

이 때, 도 14에 도시된 바이노럴 레이어 메뉴(1420) 및 서라운드 레이어 메뉴(1430)에는 소리의 반사체 재질을 설정함으로써 룸의 특성을 구분할 수 있는 메뉴가 포함될 수 있다. 예를 들어, 하드(HARD) 설정은 시멘트와 같이 단단한 반사 효과가 발생하도록 할 수 있고, 소프트(SOFT) 설정은 목재와 같이 부드러운 반사 효과가 발생하도록 할 수 있다.

또한, 도 14에 도시된 바이노럴 레이어 메뉴(1420) 및 서라운드 레이어 메뉴(1430)에는 룸의 크기를 설정할 수 있는 프리 딜레이(Predelay) 페이더를 제공할 수 있다. 이 때, 프리 딜레이값은 100%가 기준으로 설정될 수 있으며, 시간값으로 설정될 수도 있다.

이 때, 근접용 스테레오 레이어의 경우는 룸 사이즈를 조정할 필요가 없기 때문에 근접용 스테레오 레이어 메뉴(1440)의 페이더를 통해 스테레오의 폭을 조정할 수 있다.

또한, 서브우퍼 레이어의 경우에는 오디오 이펙트를 처리할 필요가 없으므로 룸 사이즈 설정 모드에서는 딤 아웃(Dim Out) 처리될 수 있다.

이 때, 도 14에 도시된 플립 버튼(1450)을 선택하여 도 15에 도시된 것과 같이 오디오 이펙트 인터페이스(1500)를 룸 리버브 설정 모드로 플립할 수 있다.

이 때, 룸 리버브 설정 모드에 포함된 레이어별 메뉴에서는 잔향시간, 즉 리버브가 유지되는 Reverb Time을 조정할 수 있다.

이와 같은 오디오 이펙트 인터페이스를 통해 레이어 별로 오디오 이펙트를 다르게 설정함으로써 사용자의 취향에 적합한 바이노럴 컨텐츠를 감상할 수 있다. 또한, 바이노럴 컨텐츠의 전체적인 음장을 유지하면서도 공간의 크기를 조절할 수 있으며, 바이노럴 효과를 강화할 것인지 또는 다이나믹한 스테레오 사운드를 강화할 것인지를 선택하여 조절할 수도 있다.

또한, 사용자가 사용하는 헤드폰의 다이어그램 사이즈에 따라 바이노럴 효과가 변경되는 문제점을 레이어별 사운드 이펙트 조절을 통해 극복할 수 있다.

이 때, 도 14 내지 도 15에 도시된 것과 같은 사운드 이펙트 인터페이스는 룸 설정 이외에도 하단에 표시된 탭과 같이 이퀄라이저(EQ), 플러그인(PLUGIN)에 대해서도 레이어별로 처리할 수 있는 환경을 제공할 수 있다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 바이노럴 오디오 소스에 대한 오토메이션 정보를 고려하여 오디오 이펙트를 리셋시킬 수 있다.

*예를 들어, 바이노럴 컨텐츠의 저작권자는 사용자에 의해 사운드가 변경됨으로써 자신이 전달하고자 하는 의도를 왜곡시키는 것을 원하지 않을 수도 있다. 또는, 사용자에 의해 사운드 이펙트가 보정된 바이노럴 컨텐츠의 사운드가 원음에 비해 좋지않은 결과가 나타날 수도 있다. 따라서 이러한 문제점을 방지하기 위해서, 바이노럴 컨텐츠의 저작 단계에서 생성된 오토메이션 정보를 적용하여 오디오 이펙트를 제작 단계에서 설정된 상태로 리셋시킬 수도 있다.

이 때, 바이노럴 오디오 소스의 전체 범위 중 기설정된 적용 범위에 상응하게 오디오 이펙트를 적용할 수 있다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 3차원 바이노럴 출력 및 평면 레이어 오디오 출력 각각에 상응하는 헤드 트래킹 데이터를 적용한다. 즉, 바이노럴 컨텐츠의 레이어 별로 회전 파리미터를 제어할 수 있다.

이와 같은 제어를 통해 헤드 트래킹이 필요한 레이어에만 회전 파라미터를 적용할 수 있으므로 컨텐츠 별 특성을 유지하는데 도움이 될 수 있다.

이 때. 헤드 트래킹 데이터는 센서 입력 기반의 자동 헤드 트래킹 데이터 및 헤드 트래킹 인터페이스에 대한 사용자 입력 기반의 수동 헤드 트래킹 데이터 중 어느 하나에 상응할 수 있다.

이 때, 자동 헤드 트래킹 데이터는 사용자나 청취자의 머리 움직임을 트래킹한 데이터에 상응하는 것으로, 별도의 헤드 트래킹 모듈에 기반한 트래킹 입력에 상응하게 획득될 수 있다.

또한, 수동 헤드 트래킹 데이터는 헤드 트래킹 인터페이스에 기반한 사용자 입력에 상응하게 획득될 수 있다.

예를 들어, 사용자나 청취자가 헤드 트래킹 모듈을 직접 착용한 상태에서 머리를 움직이면, 헤드 트래킹 모듈에 장착된 가속 센서, 3축 자이로 센서가 사용자의 머리가 움직인 거리나 각도 등을 측정하여 자동 헤드 트래킹 데이터로 생성하고 전송할 수 있다.

다른 예를 들어, 수동 헤드 트래킹 정보는 사용자나 청취자가 헤드 트래킹 인터페이스를 통해 인위적으로 부여할 수도 있다. 즉, 사용자나 청취자가 인위적으로 공간 이미지를 회전시키기 위해, 헤드 트래킹 모듈에 의한 자동 헤드 트래킹 데이터의 수신 여부와 상관없이 헤드 트래킹 인터페이스를 기반으로 헤드 트래킹 데이터를 입력할 수도 있다. 이 때, 사용자나 청취자는 멀티레이어 바이노럴 컨텐츠를 생성하는 믹싱과정 또는 입력되는 정보에 따라 변화하는 멀티레이어 바이노럴 컨텐츠를 청취하면서 수동으로 헤드 트래킹 데이터를 입력 및 수정할 수도 있다.

이 때, 3차원 바이노럴 레이어에 상응하는 3차원 큐빅은 팬(Pan), 틸트(tilt) 및 롤(roll) 중 적어도 하나의 회전 파라미터에 상응하게 회전될 수 있다.

이와 같이, 헤드 트래킹 데이터에 따라 3차원 큐빅을 회전시키거나 상하좌우로 움직여서 연출되는 효과는 향후 평면 레이어 오디오 출력과 믹싱되어 바이노럴 스테레오 출력을 생성할 수 있다. 따라서, 평면 레이어에 상응하는 서라운드 레이어나 근접용 스테레오 레이어 또는 서브우퍼 레이어 등을 회전시키거나 이동시키는 종래의 방식보다 효율적으로 헤드 트래킹에 기반한 이머시브(immersive) 효과를 연출할 수 있다.

이 때, 헤드 트래킹 데이터는 기설정된 트래킹 제한 범위 이내에서 로그(LOG) 수식으로 변환되어 적용될 수 있다. 즉, 헤드 트래킹의 한계점을 설정하고, 움직임에 따른 비율로 헤드 트래킹 데이터가 한계점에 도달하도록 제어할 수 있다.

이와 같이 헤드 트래킹의 범위에 제한을 둠으로써 과도한 헤드 트래킹으로 인해 음악적인 요소가 사라지거나 음질이 왜곡되는 문제점을 사전에 방지할 수 있다.

예를 들어, 도 16을 참조하면, 헤드 트래킹 인터페이스(1600)는 제한 범위 설정 메뉴(1620), 로그 상수 설정 메뉴(1630) 및 제한 시간 설정 메뉴(1640)를 제공할 수 있다.

이 때 각각의 설정 메뉴들은 ON으로 설정되는 경우, 입력된 헤드 트래킹 데이터(1610)에 영향을 받도록 설정될 수 있다.

먼저, 제한 범위 설정 메뉴(1620)에서는 페이더를 통해 제한되는 설정 각도를 조절할 수 있다. 이는 도 17에 도시된 그래프에서 제한 설정값에 상응할 수 있다.

또한, 로그 상수 설정 메뉴(1630)에서는 제한 범위 설정 메뉴(1620)에서 설정된 제한 각도 이상의 헤드 트래킹 데이터가 입력되는 경우, 해당하는 헤드 트래킹 데이터를 기설정된 제한 시간까지 어떠한 모양의 로그 그래프로 형성할 것인지를 결정할 수 있다.

예를 들어, 도 17에서 처리된 헤드 트래킹 데이터(1720)는 수신된 헤드 트래킹 데이터(1710)에 [수학식 1]과 같은 로그 함수를 적용한 결과에 상응할 수 있다.

[수학식 1]

Y = -(log a(x+1))

이 때, 로그 상수 설정 메뉴(1630)를 통해 [수학식 1]에 해당하는 로그 함수의 a값을 설정할 수 있다. 이 때, a값은 소리의 특성이 적용될 수 있고, x에 감속 적용값을 적용시킬 수 있다.

또한, 제한 시간 설정 메뉴(1640)에서는 제한 범위 설정 메뉴(1620)에서 설정된 제한 각도 이상의 헤드 트래킹 데이터가 입력되는 경우, 추가적으로 어느 정도의 시간까지 로그 함수의 비율을 적용받을 것일지를 결정할 수 있다. 즉, 도 17에 도시된 제한 시간(1730)을 설정할 수 있다.

또한, 본 발명에서는 3차원 레이어 바이노럴 출력, 평면 레이어 오디오 출력 및 서브우퍼 출력 각각에 상응하는 볼륨과 필터를 조절할 수도 있다.

예를 들어, 도 12를 참조하면, 본 발명의 일실시예에 따른 볼륨 인터페이스(1200)는 레이어별로 볼륨을 조절할 수 있는 메뉴를 제공할 수 있다. 먼저, 프리셋 및 레벨 미터 모드 선택 메뉴(1210)를 통해 프리셋을 선택한 뒤 프리 페이더 또는 포스트 페이터 중 어느 하나의 레벨 미터 모드를 선택할 수 있다.

이 때, 오토메이션 수신 여부를 선택할 수 있는데, 잠금 상태로 설정하는 경우에 오토메이션 데이터를 수신함으로써 사용자가 파라미터를 변경할 수 없는 상태로 설정될 수 있다. 반대로 열림 상태로 설정하는 경우, 오토메이션 데이터 제공 여부와 상관없이 사용자의 취향에 따라 오디오 이펙트를 조정하는 것이 가능하다.

이 때, 레이어별로 볼륨을 조절할 수 있도록 3차원 바이노럴 레이어 메뉴(1230), 서라운드 레이어 메뉴(1240), 근접용 스테레오 레이어 메뉴(1250) 및 서브우퍼 레이어 메뉴(1260)를 각각 제공할 수 있다. 이 때, 3차원 바이노럴 레이어 메뉴(1230), 서라운드 레이어 메뉴(1240) 및 근접용 스테레오 레이어 메뉴(1250)에는 로우컷(Low Cut)된 데이터를 서브우퍼(LFE) 채널로 어사인하기 위한 메뉴가 포함될 수 있다. 또한, 서브우퍼 레이어 메뉴(1260)에는 최대 설정이 가능한 주파수값만 제공할 수 있다.

이 때, 본 발명의 일실시예에 따른 볼륨 인터페이스(1200)에서는 플립(Flip) 버튼(1270)을 제공함으로써 도 13과 같이 레이어별로 필터를 조절할 수 있는 필터 인터페이스(1300) 기반의 메뉴를 제공할 수도 있다.

따라서, 레이어별 메뉴에 포함된 페이더는 플립 버튼(1270, 1310)을 통해 설정된 모드에 따라 볼륨을 조절하거나 필터를 설정하는데 각각 사용될 수 있다.

이와 같이, 바이노럴 레이어의 볼륨과 필터를 사용자가 자유롭게 조절할 수 있는 인터페이스를 제공함으로써 사용자의 상황을 고려하여 바이노럴 컨텐츠를 청취할 수 있도록 할 수 있다. 이를 통해 바이노럴 효과를 극대화하거나 근접한 소리를 극대화할 수 있는 등의 다양한 청취가 가능하며, 서브우퍼 레벨의 조정을 통해 바이노럴 사운드의 움직임을 청취하는 것도 가능하다.

또한, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성한다(S230). 이 때, 3차원 레이어 바이노럴 출력에 의한 이머시브(immersive) 요소와 평면 레이어 오디오 출력에 의한 근접 재생 요소 및 오브젝트 요소 등을 믹스함으로써 바이노럴 효과가 극대화된 멀티레이어 바이노럴 컨텐츠를 생성할 수 있다.

이 때, 이머시브(immersive) 사운드만 구성하고자 하는 경우에는 3차원 레이어 바이노럴 출력만을 이용하여 바이노럴 컨텐츠를 생성할 수도 있다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 오디오 이펙트가 적용된 서브우퍼 출력을 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력과 함께 합산하여 멀티레이어 바이노럴 컨텐츠를 생성할 수 있다.

이 때, 서브우퍼 출력을 합산함으로써 멀티레이어 바이노럴 컨텐츠에 상응하는 이머시브(immersive) 효과를 극대화 시킬 수 있고, 다이나믹한 저음 재생 요소를 연출할 수 있다.

예를 들어, 도 10을 참조하면, LFE 버스(Low Frequency Effects Bus)(1020)를 기반으로 서브우퍼 레이어에 포함된 단일 채널 또는 2채널(1010)의 신호를 오디오 프로세싱할 수 있다. 즉, 서브우퍼 출력(1030)은 단일 채널 또는 2채널(1010) 기반의 오디오를 프로세싱함으로써 생성된 출력에 상응할 수 있고, 도 10에 도시된 것과 같이 단일 채널 또는 2채널에 상응할 수 있다.

예를 들어, 서브우퍼 레이어는 5.1 채널, 7.1 채널 및 11.1 채널과 같이 단일 채널에 상응하거나, 10.2 채널 및 22.2 채널과 같이 2채널에 상응할 수도 있다.

이 때, 서브우퍼 레이어는 3차원 바이노럴 레이어에 상응하는 3차원 큐빅이나 평면 레이어와 분리되어 위치할 수 있다.

예를 들어, 도 11에 도시된 것과 같이 서브우퍼 레이어(1140)는 3차원 바이노럴 레이어에 상응하는 3차원 큐빅(1110), 서라운드 레이어(1120) 및 근접용 스테레오 레이어(1130)와 떨어진 곳에 위치할 수 있다. 이 때, 도 11에 도시된 구조는 일실시예에 상응하는 것으로, 각각의 레이어들을 조합한 구조에 한정되지 않는다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 상기와 같은 기능을 기반으로 자연스러운 업믹스 및 다운믹스 기능을 지원할 수 있으므로 다양한 종류의 사운드를 지원하는 컨텐츠 간의 호환성을 향상시킬 수 있다. 예를 들어, 3차원 큐빅을 통해 표현되는 서라운드 이미지를 서라운드 레이어로 다운믹스할 수 있다. 또한, 서라운드 레이어는 다시 근접용 스테레오 레이어로 다운믹스할 수도 있다. 이와 같이, 영역을 기반으로 다운믹스를 수행함에 따라 사운드의 음질을 보다 효과적으로 보존할 수 있다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 네트워크와 같은 통신망을 통해 멀티레이어 바이노럴 컨텐츠 생성을 위해 필요한 정보를 송수신할 수 있다. 특히, 본 발명에서는 멀티레이어 바이노럴 컨텐츠 생성을 위해 입력 가능한 바이노럴 오디오 소스 또는 컨텐츠, 센서로부터 입력되는 헤드 트래킹 데이터 및 사용자 입력에 관련된 정보를 수신할 수 있고, 멀티레이어 바이노럴 컨텐츠를 제공할 수 있다.

또한, 도 2에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법은 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠를 생성하는 과정에서 발생되는 다양한 정보를 별도의 저장 모듈에 저장한다.

이와 같은 멀티레이어 바이노럴 컨텐츠 생성 방법을 통해 다양한 사운드 요소들에 대한 이펙트 편집을 개별적으로 수행할 수 있는 인터페이스를 제공함으로써 사용자의 취향에 적합한 청취환경을 제공할 수 있다.

또한, 헤드 트래킹 데이터의 급격한 변화에 의해 왜곡될 수 있는 음질을 보존할 수도 있다.

도 18을 참조하면, 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠 생성 프로그램을 실행시키기 위한 단말 장치는 통신부(1810), 프로세서(1820) 및 메모리(1830)를 포함한다.

통신부(1810)는 네트워크와 같은 통신망을 통해 멀티레이어 바이노럴 컨텐츠 생성을 위해 필요한 정보를 송수신하는 역할을 한다. 특히, 본 발명의 일실시예에 따른 통신부(1810)는 멀티레이어 바이노럴 컨텐츠 생성을 위해 입력 가능한 바이노럴 오디오 소스 또는 컨텐츠, 센서로부터 입력되는 헤드 트래킹 데이터 및 사용자 입력에 관련된 정보를 수신할 수 있고, 멀티레이어 바이노럴 컨텐츠를 제공할 수 있다.

프로세서(1820)는 3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성한다.

또한, 프로세서(1820)는 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용한다.

또한, 프로세서(1820)는 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 서브우퍼 레이어에 상응하는 서브우퍼 출력에 대해 오디오 이펙트를 적용할 수 있다.

또한, 프로세서(1820)는 바이노럴 오디오 소스에 대한 오토메이션 정보를 고려하여 오디오 이펙트를 리셋시킬 수 있다.

예를 들어, 바이노럴 컨텐츠의 저작권자는 사용자에 의해 사운드가 변경됨으로써 자신이 전달하고자 하는 의도를 왜곡시키는 것을 원하지 않을 수도 있다. 또는, 사용자에 의해 사운드 이펙트가 보정된 바이노럴 컨텐츠의 사운드가 원음에 비해 좋지않은 결과가 나타날 수도 있다. 따라서 이러한 문제점을 방지하기 위해서, 바이노럴 컨텐츠의 저작 단계에서 생성된 오토메이션 정보를 적용하여 오디오 이펙트를 제작 단계에서 설정된 상태로 리셋시킬 수도 있다.

또한, 프로세서(1820)는 3차원 바이노럴 출력 및 평면 레이어 오디오 출력 각각에 상응하는 헤드 트래킹 데이터를 적용한다. 즉, 바이노럴 컨텐츠의 레이어 별로 회전 파리미터를 제어할 수 있다.

[수학식 1]

Y = -(log a(x+1))

또한, 프로세서(1820)는 차원 레이어 바이노럴 출력, 평면 레이어 오디오 출력 및 서브우퍼 출력 각각에 상응하는 볼륨과 필터를 조절할 수도 있다.

또한, 프로세서(1820)는 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성한다.

이 때, 3차원 레이어 바이노럴 출력에 의한 이머시브(immersive) 요소와 평면 레이어 오디오 출력에 의한 근접 재생 요소 및 오브젝트 요소 등을 믹스함으로써 바이노럴 효과가 극대화된 멀티레이어 바이노럴 컨텐츠를 생성할 수 있다.

또한, 프로세서(1820)는 오디오 이펙트가 적용된 서브우퍼 출력을 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력과 함께 합산하여 멀티레이어 바이노럴 컨텐츠를 생성할 수 있다.

또한, 프로세서(1820)는 상기와 같은 기능을 기반으로 자연스러운 업믹스 및 다운믹스 기능을 지원할 수 있으므로 다양한 종류의 사운드를 지원하는 컨텐츠 간의 호환성을 향상시킬 수 있다. 예를 들어, 3차원 큐빅을 통해 표현되는 서라운드 이미지를 서라운드 레이어로 다운믹스할 수 있다. 또한, 서라운드 레이어는 다시 근접용 스테레오 레이어로 다운믹스할 수도 있다. 이와 같이, 영역을 기반으로 다운믹스를 수행함에 따라 사운드의 음질을 보다 효과적으로 보존할 수 있다.

메모리(1830)는 상술한 바와 같이 본 발명의 일실시예에 따른 멀티레이어 바이노럴 컨텐츠를 생성하는 과정에서 발생되는 다양한 정보를 저장한다.

실시예에 따라, 메모리(1830)는 멀티레이어 바이노럴 컨텐츠를 생성하는 단말 장치와 독립적으로 구성되어 멀티레이어 바이노럴 컨텐츠 생성 기능을 지원할 수 있다. 이 때, 메모리(1830)는 별도의 대용량 스토리지로 동작할 수 있고, 동작 수행을 위한 제어 기능을 포함할 수 있다.

한편, 단말 장치는 메모리가 탑재되어 그 장치 내에서 정보를 저장할 수 있다. 일 구현예의 경우, 메모리는 컴퓨터로 판독 가능한 매체이다. 일 구현 예에서, 메모리는 휘발성 메모리 유닛일 수 있으며, 다른 구현예의 경우, 메모리는 비휘발성 메모리 유닛일 수도 있다. 일 구현예의 경우, 저장장치는 컴퓨터로 판독 가능한 매체이다. 다양한 서로 다른 구현 예에서, 저장장치는 예컨대 하드디스크 장치, 광학디스크 장치, 혹은 어떤 다른 대용량 저장장치를 포함할 수도 있다.

이와 같은 단말 장치를 기반으로 다양한 사운드 요소들에 대한 이펙트 편집을 개별적으로 수행할 수 있는 인터페이스를 제공함으로써 사용자의 취향에 적합한 청취환경을 제공할 수 있다.

본 발명의 실시예는 컴퓨터로 구현된 방법이나 컴퓨터에서 실행 가능한 명령어들이 기록된 비일시적인 컴퓨터에서 읽을 수 있는 매체로 구현될 수 있다. 컴퓨터에서 읽을 수 있는 명령어들이 프로세서에 의해서 수행될 때, 컴퓨터에서 읽을 수 있는 명령어들은 본 발명의 적어도 한 가지 측면에 따른 방법을 수행할 수 있다.

이상에서와 같이 본 발명에 따른 멀티레이어 바이노럴 컨텐츠 생성 방법 및 이를 위한 프로그램은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims

3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성하는 단계;

오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 상기 3차원 레이어 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용하는 단계; 및

오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성하는 단계

를 포함하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 1에 있어서,

상기 멀티레이어 바이노럴 컨텐츠 생성 방법은

상기 3차원 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 헤드 트래킹 데이터를 적용하는 단계를 더 포함하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 2에 있어서,

상기 헤드 트래킹 데이터는

센서 입력 기반의 자동 헤드 트래킹 데이터 및 헤드 트래킹 인터페이스에 대한 사용자 입력 기반의 수동 헤드 트래킹 데이터 중 어느 하나에 상응하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 3에 있어서,

상기 헤드 트래킹 데이터는

기설정된 트래킹 제한 범위 이내에서 로그(LOG) 수식으로 변환되어 적용되는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 2에 있어서,

상기 오디오 이펙트를 적용하는 단계는

룸(ROOM) 설정, 이퀄라이저(EQUALIZER, EQ) 설정 및 플러그인(PLUG-IN) 설정 중 적어도 하나에 대한 설정을 수행하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 1에 있어서,

상기 평면 레이어는

서라운드 레이어 바이노럴 인코딩을 수행하여 서라운드 레이어 바이노럴 출력을 생성하고, 생성된 상기 서라운드 레이어 바이노럴 출력을 상기 평면 레이어 오디오 출력으로 제공하는 서라운드 레이어 및

스테레오 신호를 입력 받아서 상기 스테레오 신호에 상응하는 상기 평면 레이어 오디오 출력을 생성하는 근접용 스테레오 레이어 중 어느 하나인 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 1에 있어서,

상기 3차원 레이어 바이노럴 출력은

4개의 업 채널들과 4개의 다운채널들로 구성된 8채널 기반의 3차원 큐빅(Cubic) 상에 위치하는 바이노럴 포인트에 대한 3차원 벡터에 상응하게 생성되는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 1에 있어서,

상기 멀티레이어 바이노럴 컨텐츠를 생성하는 단계는

상기 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 서브우퍼 레이어에 상응하는 서브우퍼 출력에 상응하는 오디오 이펙트를 적용하는 단계; 및

오디오 이펙트가 적용된 서브우퍼 출력을 상기 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력과 함께 합산하여 상기 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 더 포함하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 8에 있어서,

상기 멀티레이어 바이노럴 컨텐츠 생성 방법은

바이노럴 오디오 소스에 대한 오토메이션 정보를 고려하여 상기 오디오 이펙트를 리셋시키는 단계를 더 포함하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
청구항 9에 있어서,

상기 오디오 이펙트를 적용하는 단계는

상기 바이노럴 오디오 소스의 전체 범위 중 기설정된 적용 범위에 상응하게 상기 오디오 이펙트를 적용하는 것을 특징으로 하는 멀티레이어 바이노럴 컨텐츠 생성 방법.
3차원 바이노럴 레이어에 상응하는 3차원 레이어 바이노럴 인코딩을 수행하여 3차원 레이어 바이노럴 출력을 생성하고, 평면 레이어에 상응하는 오디오 프로세싱을 수행하여 평면 레이어 오디오 출력을 생성하는 단계;

오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 상기 3차원 레이어 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 오디오 이펙트를 적용하는 단계; 및

오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력을 합하여 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 실행시키는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 11에 있어서,

상기 3차원 바이노럴 출력 및 상기 평면 레이어 오디오 출력 각각에 상응하는 헤드 트래킹 데이터를 적용하는 단계를 더 실행시키는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 12에 있어서,

상기 헤드 트래킹 데이터는

센서 입력 기반의 자동 헤드 트래킹 데이터 및 헤드 트래킹 인터페이스에 대한 사용자 입력 기반의 수동 헤드 트래킹 데이터 중 어느 하나에 상응하는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 13에 있어서,

상기 헤드 트래킹 데이터는

기설정된 트래킹 제한 범위 이내에서 로그(LOG) 수식으로 변환되어 적용되는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 12에 있어서,

룸(ROOM) 설정, 이퀄라이저(EQUALIZER, EQ) 설정 및 플러그인(PLUG-IN) 설정 중 적어도 하나에 대한 설정을 수행하여 상기 오디오 이펙트를 적용하는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 11에 있어서,

상기 평면 레이어는

서라운드 레이어 바이노럴 인코딩을 수행하여 서라운드 레이어 바이노럴 출력을 생성하고, 생성된 상기 서라운드 레이어 바이노럴 출력을 상기 평면 레이어 오디오 출력으로 제공하는 서라운드 레이어 및

스테레오 신호를 입력 받아서 상기 스테레오 신호에 상응하는 상기 평면 레이어 오디오 출력을 생성하는 근접용 스테레오 레이어 중 어느 하나인 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 11에 있어서,

상기 3차원 레이어 바이노럴 출력은

4개의 업 채널들과 4개의 다운채널들로 구성된 8채널 기반의 3차원 큐빅(Cubic) 상에 위치하는 바이노럴 포인트에 대한 3차원 벡터에 상응하게 생성되는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 11에 있어서,

상기 오디오 이펙트 인터페이스에 대한 사용자 입력을 기반으로 서브우퍼 레이어에 상응하는 서브우퍼 출력에 상응하는 오디오 이펙트를 적용하는 단계; 및

오디오 이펙트가 적용된 서브우퍼 출력을 상기 오디오 이펙트가 적용된 3차원 레이어 바이노럴 출력 및 평면 레이어 오디오 출력과 함께 합산하여 상기 멀티레이어 바이노럴 컨텐츠를 생성하는 단계를 더 실행시키는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 18에 있어서,

바이노럴 오디오 소스에 대한 오토메이션 정보를 고려하여 상기 오디오 이펙트를 리셋시키는 단계를 더 실행시키는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.
청구항 19에 있어서,

상기 바이노럴 오디오 소스의 전체 범위 중 기설정된 적용 범위에 상응하게 상기 오디오 이펙트를 적용하는 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체에 저장된 멀티레이어 바이노럴 컨텐츠 생성 프로그램.