KR20210070948A - 저음 관리를 위한 방법 및 디바이스 - Google Patents

저음 관리를 위한 방법 및 디바이스 Download PDF

Info

Publication number
KR20210070948A
KR20210070948A KR1020207025978A KR20207025978A KR20210070948A KR 20210070948 A KR20210070948 A KR 20210070948A KR 1020207025978 A KR1020207025978 A KR 1020207025978A KR 20207025978 A KR20207025978 A KR 20207025978A KR 20210070948 A KR20210070948 A KR 20210070948A
Authority
KR
South Korea
Prior art keywords
speaker
playback
audio
lfc
pass filter
Prior art date
Application number
KR1020207025978A
Other languages
English (en)
Inventor
찰스 큐. 로빈슨
마크 알. 피. 토마스
마이클 제이. 스미더스
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20210070948A publication Critical patent/KR20210070948A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

일부 개시된 방법은 다중-대역 저음 관리를 수반한다. 이러한 일부 예시는 저음 관리의 목적으로 다수의 고역-통과 및 저역-통과 필터 주파수를 적용하는 것을 수반할 수 있다. 일부 개시된 방법은 패닝될 수 있는 오디오 객체로서 적어도 일부 저주파 신호를 다룬다. 일부 개시된 방법은 저주파 및 고주파를 별도로 패닝하는 것을 수반한다. 고역-통과 렌더링 이후에, 전력 검사는 서브우퍼 또는 다른 저주파 가능 라우드스피커에 의해 재생될 저주파 부족 인자를 결정할 수 있다.

Description

저음 관리를 위한 방법 및 디바이스
연관된 출원에 대한 상호 참조
본 출원은 그 전체가 본원에 참조로 통합되는, 2018년 10월 16일에 출원된 미국 가특허출원 제62/746,468호의 우선권의 이익을 주장한다.
기술분야
본 개시는 오디오 데이터의 처리 및 재생에 관한 것이다. 특히, 본 개시는 오디오 데이터에 대한 저음 관리(bass management)에 관한 것이다.
저음 관리는 오디오 프로그램에서 가장 낮은 주파수를 효율적으로 재생하기 위해 오디오 시스템에서 사용되는 방법이다. 메인 라우드스피커의 설계 또는 위치는 충분하거나 효율적이거나 또는 균일한 저주파 사운드 생성을 지원하지 않을 수 있다. 이러한 경우, 광대역 신호는 과도한 왜곡 없이, 저주파 오디오를 재생할 수 있는 라우드스피커로 지향된 저주파를 갖는 두 개 이상의 주파수 대역으로 분할될 수 있다.
저음 관리 방법을 포함하지만 이에 제한되지 않는 다양한 오디오 처리 방법이 본원에 개시된다. 일부 이러한 방법은 복수의 오디오 객체를 포함할 수 있는 오디오 데이터를 수신하는 것을 수반할 수 있다. 오디오 객체는 오디오 데이터 및 연관된 메타데이터를 포함할 수 있다. 메타데이터는 오디오 객체 위치 데이터를 포함할 수 있다. 일부 방법은 재생 환경에서 하나 이상의 재생 스피커의 표시 및 재생 환경 내에서 하나 이상의 재생 스피커의 위치의 표시를 포함할 수 있는 재생 스피커 레이아웃 데이터를 수신하는 것을 수반할 수 있다. 일부 예시에서, 재생 스피커 레이아웃 데이터는 재생 환경의 하나 이상의 LFC 재생 스피커에 대응하는 저주파-가능(low-frequency-capable, LFC) 라우드스피커 위치 데이터 및 재생 환경의 하나 이상의 메인 재생 스피커에 대응하는 메인 라우드스피커 위치 데이터를 포함할 수 있다. 일부 예시에서, 재생 스피커 레이아웃 데이터는 재생 환경 내의 재생 스피커의 하나 이상의 그룹의 위치의 표시를 포함할 수 있다.
일부 이러한 방법은 연관된 메타데이터 및 재생 스피커 레이아웃 데이터에 적어도 부분적으로 기초하여 오디오 객체를 스피커 공급 신호로 렌더링하는 것을 수반할 수 있다. 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 재생 스피커에 대응할 수 있다. 일부 이러한 방법은 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 스피커 공급 신호의 적어도 일부에 고역-통과 필터를 적용하는 것, 및 저주파(LF) 오디오 객체를 생성하기 위해 복수의 오디오 객체의 각각의 오디오 데이터에 저역-통과 필터를 적용하는 것을 수반할 수 있다. 일부 방법은 LFC 스피커 공급 신호를 생성하기 위해 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 LF 오디오 객체를 패닝하는(panning) 것을 수반할 수 있다. 일부 이러한 방법은 LFC 스피커 공급 신호를 재생 환경의 하나 이상의 LFC 라우드스피커로 출력하는 것, 및 고역-통과 필터링된 스피커 공급 신호를 재생 환경의 하나 이상의 메인 재생 스피커에 제공하는 것을 수반할 수 있다.
일부 구현에 따라, 방법은 복수의 오디오 객체 각각의 오디오 데이터에 저역-통과 필터의 적용 이전에 또는 그 일부로서 오디오 객체 중 하나 이상의 오디오 데이터를 데시메이팅하는(decimating) 것을 수반할 수 있다. 일부 방법은 오디오 객체의 오디오 데이터의 신호 레벨을 결정하는 것, 신호 레벨을 임계 신호 레벨에 비교하는 것, 및 오디오 데이터의 신호 레벨이 임계 신호 레벨 이상인 오디오 객체에만 하나 이상의 저역-통과 필터를 적용하는 것을 수반할 수 있다. 일부 방법은 이득 및 고역-통과 필터(들) 특성에 적어도 부분적으로 기초하여 전력 부족(power deficit)을 계산하는 것, 및 전력 부족에 적어도 부분적으로 기초하여 저역-통과 필터를 결정하는 것을 수반할 수 있다.
일부 예시에서, 스피커 공급 신호 중 적어도 일부에 고역-통과 필터를 적용하는 것은 두 개 이상의 상이한 고역-통과 필터를 적용하는 것을 포함할 수 있다. 일부 구현에 따라, 스피커 공급 신호 중 적어도 일부에 고역-통과 필터를 적용하는 것은 제1 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 제1 복수의 스피커 공급 신호에 제1 고역-통과 필터를 적용하는 것, 및 제2 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 제2 복수의 스피커 공급 신호에 제2 고역-통과 필터를 적용하는 것을 수반할 수 있다. 일부 예시에서, 제1 고역-통과 필터는 제2 고역-통과 필터보다 더 낮은 주파수 범위를 통과시키도록 구성될 수 있다.
일부 방법은 메인 재생 스피커의 제1 세트에 관한 제1 재생 스피커 성능 정보를 수신하는 것, 및 메인 재생 스피커의 제2 세트에 관한 제2 재생 스피커 성능 정보를 수신하는 것을 수반할 수 있다. 일부 이러한 예시에서, 제1 고역-통과 필터는 제1 재생 스피커 성능 정보에 대응할 수 있고, 제2 고역-통과 필터는 제2 재생 스피커 성능 정보에 대응할 수 있다. 고역-통과 필터링된 스피커 공급 신호를 하나 이상의 메인 재생 스피커에 제공하는 것은 제1 고역-통과 필터링된 스피커 공급 신호를 메인 재생 스피커의 제1 세트에 제공하는 것 및 제2 고역-통과 필터링된 스피커 공급 신호를 메인 재생 스피커의 제2 세트에 제공하는 것을 수반할 수 있다.
일부 구현에서, 메타데이터는 오디오 객체의 특정 오디오 객체에 대응하는 스피커 공급 신호에 고역-통과 필터를 적용할지의 표시를 포함할 수 있다. 일부 예시에 따라, LF 오디오 객체를 생성하는 것은 두 개 이상의 상이한 필터를 적용하는 것을 수반할 수 있다.
일부 경우에서, LF 오디오 객체를 생성하는 것은 제1 LF 오디오 객체를 생성하기 위해 오디오 객체의 적어도 일부에 저역-통과 필터를 적용하는 것을 수반할 수 있다. 저역-통과 필터는 제1 주파수 범위를 통과시키도록 구성될 수 있다. 일부 이러한 방법은 제2 LF 오디오 객체를 생성하기 위해 제1 LF 오디오 객체에 고역-통과 필터를 적용하는 것을 수반할 수 있다. 고역-통과 필터는 중간 LF 주파수 범위인 제2 주파수 범위를 통과시키도록 구성될 수 있다. LFC 스피커 공급 신호를 생성하기 위해 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 LF 오디오 객체를 패닝하는 것은 제1 LF 오디오 객체를 패닝함으로써 제1 LFC 스피커 공급 신호를 생성하는 것, 및 제2 LF 오디오 객체를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다.
일부 예시에 따라, LF 오디오 객체를 생성하는 것은 제1 LF 오디오 객체를 생성하기 위해 제1 복수의 오디오 객체에 저역-통과 필터를 적용하는 것을 수반할 수 있다. 저역-통과 필터는 제1 주파수 범위를 통과시키도록 구성될 수 있다. 일부 이러한 방법은 제2 LF 오디오 객체를 생성하기 위해 제2 복수의 오디오 객체에 대역 통과 필터를 적용하는 것을 수반할 수 있다. 대역 통과 필터는 중간 LF 주파수 범위인 제2 주파수 범위를 통과시키도록 구성될 수 있다. LFC 스피커 공급 신호를 생성하기 위해 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 LF 오디오 객체를 패닝하는 것은 제1 LF 오디오 객체를 패닝함으로써 제1 LFC 스피커 공급 신호를 생성하는 것, 및 제2 LF 오디오 객체를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다.
일부 예시에서, LFC 라우드스피커 위치 데이터를 수신하는 것은 제2 주파수 범위에서 오디오 데이터를 재생할 수 있는 복수의 비-서브우퍼 재생 스피커의 각각의 위치를 나타내는 비-서브우퍼 위치 데이터를 수신하는 것을 수반할 수 있다. 제2 LFC 스피커 공급 신호를 생성하는 것은 비-서브우퍼 스피커 공급 신호를 생성하기 위해 비-서브우퍼 위치 데이터에 적어도 부분적으로 기초하여 제2 LF 오디오 객체의 적어도 일부를 패닝하는 것을 수반할 수 있다. 일부 이러한 방법은 또한, 재생 환경의 복수의 비-서브우퍼 재생 스피커 중 하나 이상에 비-서브우퍼 스피커 공급 신호를 제공하는 것을 수반할 수 있다.
일부 구현에 따라, LFC 라우드스피커 위치 데이터를 수신하는 것은 제2 주파수 범위에서 오디오 데이터를 재생할 수 있는 복수의 중간-서브우퍼 재생 스피커 각각의 위치를 나타내는 중간-서브우퍼 위치 데이터를 수신하는 것을 수반할 수 있다. 일부 이러한 구현에서, 제2 LFC 스피커 공급 신호를 생성하는 것은 중간-서브우퍼 스피커 공급 신호를 생성하기 위해 중간-서브우퍼 위치 데이터에 적어도 부분적으로 기초하여 제2 LF 오디오 객체의 적어도 일부를 패닝하는 것을 수반할 수 있다. 일부 이러한 방법은 또한, 재생 환경의 복수의 중간-서브우퍼 재생 스피커 중 하나 이상에 중간-서브우퍼 스피커 공급 신호를 제공하는 것을 수반할 수 있다.
본원에 서술된 방법 중 일부 또는 전체는 하나 이상의 비-일시적 매체에 저장된 명령어(예를 들어, 소프트웨어)에 따라 하나 이상의 디바이스에 의해 수행될 수 있다. 이러한 비-일시적 매체는 랜덤 액세스 메모리(random access memory, RAM) 디바이스, 읽기 전용 메모리(read-only memory, ROM) 디바이스 등을 포함하지만 이에 제한되지 않는 본원에 서술된 것과 같은 메모리 디바이스를 포함할 수 있다. 따라서, 본 개시에 서술된 주제의 다양한 혁신적인 양상은 그에 저장된 소프트웨어를 갖는 비-일시적 매체에 구현될 수 있다. 예를 들어, 소프트웨어는 오디오 데이터를 처리하기 위해 적어도 하나의 디바이스를 제어하기 위한 명령어를 포함할 수 있다. 예를 들어, 소프트웨어는 본원에 개시된 것과 같은 제어 시스템의 하나 이상의 구성요소에 의해 실행 가능할 수 있다. 예를 들어, 소프트웨어는 본원에 개시된 방법 중 하나 이상을 수행하기 위한 명령어를 포함할 수 있다.
본 개시의 적어도 일부 양상은 장치를 통해 구현될 수 있다. 예를 들어, 하나 이상의 디바이스가 본원에 개시된 방법을 적어도 부분적으로 수행하도록 구성될 수 있다. 일부 구현에서, 장치는 인터페이스 시스템 및 제어 시스템을 포함할 수 있다. 인터페이스 시스템은 하나 이상의 네트워크 인터페이스, 제어 시스템과 메모리 시스템 사이의 하나 이상의 인터페이스, 제어 시스템과 다른 디바이스 사이의 하나 이상의 인터페이스 및/또는 하나 이상의 외부 디바이스 인터페이스를 포함할 수 있다. 제어 시스템은 범용의 단일칩 또는 다중칩 프로세서, 디지털 신호 프로세서(DSP), 주문형 집적 회로(ASIC), 필드 프로그래머블 게이트 어레이(field programmable gate array, FPGA) 또는 다른 프로그래머블 논리 디바이스(programmable logic device), 이산형 게이트(discrete gate) 또는 트랜지스터 논리 회로, 또는 이산형 하드웨어 구성요소 중 적어도 하나를 포함할 수 있다. 따라서, 일부 구현에서 제어 시스템은 하나 이상의 프로세서 및 하나 이상의 프로세서에 동작 가능하게 결합된 하나 이상의 비-일시적 저장 매체를 포함할 수 있다. 제어 시스템은 본원에 개시된 방법의 일부 또는 전체를 수행하도록 구성될 수 있다.
본 명세서에서 서술된 주제의 하나 이상의 구현의 세부사항은 첨부 도면 및 아래의 서술에서 제시된다. 다른 특징, 양상 및 장점은 서술, 도면 및 청구범위로부터 명백해질 것이다. 다음의 도면의 상대적인 크기는 축적대로 도시되지 않을 수 있다. 다양한 도면에서 유사한 참조 부호 및 명칭(designations)은 일반적으로 유사한 요소를 나타낸다.
도 1은 돌비 서라운드(Dolby Surround) 5.1 구성을 갖는 재생 환경의 일 예시를 도시한다.
도 2는 돌비 서라운드 7.1 구성을 갖는 재생 환경의 일 예시를 도시한다.
도 3은 하마사키(Hamasaki) 22.2 서라운드 사운드 구성을 갖는 재생 환경의 일 예시를 도시한다.
도 4a는 가상 재생 환경에서 다양한 고도에서 스피커 구역을 묘사하는(portrays) 그래픽 사용자 인터페이스(GUI)의 일 예시를 도시한다.
도 4b는 다른 재생 환경의 일 예시를 도시한다.
도 5a는 본원에 개시된 방법 중 적어도 일부를 수행하도록 구성될 수 있는 장치의 구성요소의 예시를 도시하는 블록도이다.
도 5b는 라우드스피커 주파수 범위의 일부 예시를 도시한다.
도 6은 일 예시에 따른 저음 관리 방법의 블록을 도시하는 흐름도이다.
도 7은 하나의 개시된 예시에 따른 저음 관리 방법의 블록을 도시한다.
도 8은 하나의 개시된 예시에 따른 대안적인 저음 관리 방법의 블록을 도시한다.
도 9는 하나의 개시된 예시에 따른 다른 저음 관리 방법의 블록을 도시한다.
도 10은 다른 개시된 저음 관리 방법을 도시하는 기능 블록도이다.
도 11은 균일한 저음 구현의 하나의 예시를 도시하는 기능 블록도이다.
도 12는 하나의 개시된 저음 관리 방법에 따른 데시메이션의 일 예시를 제공하는 기능 블록도이다.
다양한 도면에서 유사한 참조 부호 및 명칭은 유사한 요소를 나타낸다.
다음의 서술은 본 개시의 일부 혁신적인 양상뿐만 아니라 이들 혁신적인 양상이 구현될 수 있는 맥락의 예시를 서술하는 목적을 위한 특정 구현에 관련된다. 하지만, 본원에서 교시는 다양한 방식으로 적용될 수 있다. 더욱이, 서술된 실시예는 다양한 하드웨어, 소프트웨어, 펌웨어 등으로 구현될 수 있다. 예를 들어, 본 출원의 양상은 장치, 하나 보다 많은 디바이스를 포함하는 시스템, 방법 컴퓨터 프로그램 제품 등으로 적어도 부분적으로 구현될 수 있다. 따라서, 본 출원의 양상은 하드웨어 실시예, (펌웨어, 상주 소프트웨어(resident software), 마이크로 코드 등을 포함하는) 소프트웨어 실시예 및/또는 소프트웨어 및 하드웨어 양상 양자를 결합한 실시예의 형태를 취할 수 있다. 이러한 실시예는 본원에서 "회로", "모듈" 또는 "엔진"으로 지칭될 수 있다. 본 출원의 일부 양상은 그에 구현된 컴퓨터 판독가능 프로그램 코드를 갖는 하나 이상의 비-일시적 매체에 구현된 컴퓨터 프로그램 제품의 형태를 취할 수 있다. 이러한 비-일시적 매체는 예를 들어, 하드 디스크, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 삭제 가능한 프로그래밍 가능 읽기 전용 메모리(EPROM 또는 Flash 메모리), 휴대용 컴팩트 디스크 읽기 전용 메모리(CD-ROM), 광학 저장 디바이스, 자기 저장 디바이스 또는 전술한 것의 임의의 적합한 조합을 포함할 수 있다. 따라서, 본 개시의 교시는 도면에 도시되거나 및/또는 본원에 서술된 구현으로 제한되는 것으로 의도되지 않고 그 대신 광범위한 적용 가능성을 갖는다.
도 1은 돌비 서라운드 5.1 구성을 갖는 재생 환경의 일 예시를 도시한다. 돌비 서라운드 5.1은 1990년대에 개발되었지만, 이 구성은 영화 사운드 시스템 환경에 여전히 널리 전개된다. 프로젝터(105)는 스크린(150) 상에 예를 들어, 영화에 대한 비디오 이미지를 투사하도록 구성될 수 있다. 오디오 재생 데이터는 비디오 이미지와 동기화되고 사운드 프로세서(110)에 의해 처리될 수 있다. 전력 증폭기(115)는 재생 환경(100)의 스피커에 스피커 공급 신호를 제공할 수 있다.
돌비 서라운드 5.1 구성은 좌측 서라운드 어레이(120) 및 우측 서라운드 어레이(125)를 포함하며, 그 각각은 단일 채널에 의해 갱-구동된다(gang-driven) 돌비 서라운드 5.1 구성은 또한, 좌측 스크린 채널(130), 중앙 스크린 채널(135) 및 우측 스크린 채널(140)에 대한 별개의 채널을 포함한다. 서브우퍼(145)에 대한 별개의 채널이 저-주파수 효과(LFE)를 위해 제공된다.
2010년에, 돌비는 돌비 서라운드 7.1을 도입함으로써 디지털 시네마 사운드에 대한 향상을 제공하였다. 도 2는 돌비 서라운드 7.1 구성을 갖는 재생 환경의 일 예시를 도시한다. 디지털 프로젝터(205)는 디지털 비디오 데이터를 수신하고 비디오 이미지를 스크린(150) 상에 투사하도록 구성될 수 있다. 오디오 재생 데이터는 사운드 프로세서(210)에 의해 처리될 수 있다. 전력 증폭기(215)는 재생 환경(200)의 스피커에 스피커 공급 신호를 제공할 수 있다.
돌비 서라운드 7.1 구성은 좌측면 서라운드 어레이(220) 및 우측면 서라운드 어레이(225)를 포함하며, 그의 각각은 단일 채널에 의해 구동될 수 있다. 돌비 서라운드 5.1과 같이, 돌비 서라운드 7.1 구성은 좌측 스크린 채널(230), 중앙 스크린 채널(235), 우측 스크린 채널(240) 및 서브우퍼(245)에 대한 별개의 채널을 포함한다. 하지만, 돌비 서라운드 7.1은 돌비 서라운드 5.1의 좌측 및 우측 서라운드 채널을 네 개의 구역으로 분할함으로써 서라운드 채널의 개수를 증가시킨다: 좌측면 서라운드 어레이(220) 및 우측면 서라운드 어레이(225)에 부가하여, 좌측 후면 서라운드 스피커(224) 및 우측 후면 서라운드 스피커(226)에 대한 별개의 채널이 포함된다. 재생 환경(200) 내에서 서라운드 구역의 개수를 증가시키는 것은 사운드의 국부화(localization)를 상당히 개선할 수 있다.
더욱 몰입감이 있는 환경(immersive environment)을 생성하기 위한 노력으로, 일부 재생 환경은 증가된 개수의 채널에 의해 구동된, 증가된 개수의 스피커로 구성될 수 있다. 또한, 일부 재생 환경은 그의 일부가 재생 환경의 좌석 영역 위에 있을 수 있는 다양한 고도에 전개된 스피커를 포함할 수 있다.
도 3은 하마사키(Hamasaki) 22.2 서라운드 사운드 구성을 갖는 재생 환경의 일 예시를 도시한다. 하마사키 22.2는 초고화질 텔레비전(Ultra High Definition Television)의 서라운드 사운드 구성요소로서 일본에서 NHK Science & Techonology Research Laboratories에서 개발되었다. 하마사키 22.2는 세 개의 층에 배열된 스피커를 구동하기 위해 사용될 수 있는 24개의 스피커 채널을 제공한다. 재생 환경(300)의 상부 스피커 층(310)은 9개의 채널에 의해 구동될 수 있다. 중간 스피커 층(320)은 10개의 채널에 의해 구동될 수 있다. 하부 스피커 층(330)은 5개의 채널에 의해 구동될 수 있으며, 그 중 두 개는 서브우퍼(345a 및 345b)에 대한 것이다.
따라서, 현대 동향은 더욱 많은 스피커 및 더욱 많은 채널을 포함하는 것뿐만 아니라, 상이한 높이에서의 스피커를 포함하는 것이다. 채널의 개수가 증가하고 스피커 레이아웃이 2D 어레이로부터 3D 어레이로 전환되므로, 사운드를 위치시키고(positioning) 렌더링하는 작업이 점점 더 어려워지고 있다.
가상 재생 환경(404)과 같은 가상 재생 환경을 참조로 본원에서 사용되는, "스피커 구역"이란 용어는 일반적으로, 실제 재생 환경의 재생 스피커에 일대일 대응을 갖거나 그렇지 않을 수 있는 논리적 구성을 지칭한다. 예를 들어, "스피커 구역 위치"는 시네마 재생 환경의 특정한 재생 스피커 위치에 대응하거나 또는 그렇지 않을 수 있다. 그 대신에, "스피커 구역 위치"란 용어는 일반적으로, 가상 재생 환경의 구역을 지칭할 수 있다. 일부 구현에서, 가상 재생 환경의 스피커 구역은 예를 들어, 2-채널 스테레오 헤드폰의 세트를 사용하여 가상 서라운드 사운드 환경을 실시간으로 생성하는, 돌비 헤드폰™(때때로 모바일 서라운드™로 지칭됨)과 같은 가상화 기술의 사용을 통해, 가상 스피커에 대응할 수 있다. GUI(400)에서, 제1 고도에 일곱 개의 스피커 구역(402a) 및 제 2 고도에 두 개의 스피커 구역(402b)이 있으며, 가상 재생 환경(404)에서 총 아홉 개의 스피커 구역을 만든다. 이 예시에서, 스피커 구역(1 내지 3)은 가상 재생 환경(404)의 전면 영역(405)에 있다. 전면 영역(405)은 예를 들어, 스크린(150)이 텔레비전 스크린이 위치되는 가정의 영역 등에 위치되는 시네마 재생 환경의 영역에 대응할 수 있다.
여기서, 스피커 구역(4)은 일반적으로, 좌측 영역(410)에서 스피커에 대응하고, 스피커 구역(5)은 가상 재생 환경(404)의 우측 영역(415)에서 스피커에 대응한다. 스피커 구역(6)은 좌측 후면 영역(412)에 대응하고 스피커 구역(7)은 가상 재생 환경(404)의 우측 후면 영역(414)에 대응한다. 스피커 구역(8)은 상부 영역(420a)에서의 스피커에 대응하고 스피커 구역(9)은 상부 영역(420b)에서의 스피커에 대응하며, 이는 도 5d 및 5e에 도시된 가상 천장(520)의 영역과 같은 가상 천장 영역일 수 있다. 따라서, 아래에서 더욱 상세히 서술되는 바와 같이, 도 4a에 도시된 스피커 구역(1 내지 9)의 위치는 실제 재생 환경의 재생 스피커의 위치에 대응하거나 또는 그렇지 않을 수 있다. 또한, 다른 구현은 더욱 많거나 또는 더욱 적은 스피커 구역 및/또는 고도를 포함할 수 있다.
본원에 서술된 다양한 구현에서, GUI(400)와 같은 사용자 인터페이스는 저작 툴 및/또는 렌더링 툴의 일부로서 사용될 수 있다. 일부 구현에서, 저작 툴 및/또는 렌더링 툴은 하나 이상의 비-일시적 매체 상에 저장된 소프트웨어를 통해 구현될 수 있다. 저작 툴 및/또는 렌더링 툴은 도 21을 참조로 아래에서 서술되는 논리 시스템 및 다른 디바이스와 같은, 하드웨어, 펌웨어 등에 의해 (적어도 부분적으로) 구현될 수 있다. 일부 저작 구현에서, 연관된 저작 툴이 연관된 오디오 데이터에 대한 메타데이터를 생성하기 위해 사용될 수 있다. 메타데이터는 예를 들어, 3차원 공간에서 오디오 객체의 위치 및/또는 궤적을 나타내는 데이터, 스피커 구역 제약 데이터 등을 포함할 수 있다. 메타데이터는 실제 재생 환경의 특정한 스피커 레이아웃에 대한 것 보다는, 가상 재생 환경(404)의 스피커 구역(402)에 대해 생성될 수 있다. 렌더링 툴은 오디오 데이터 및 연관된 메타데이터를 수신할 수 있고, 재생 환경에 대한 오디오 이득 및 스피커 공급 신호를 계산할 수 있다. 이러한 오디오 이득 및 스피커 공급 신호는 진폭 패닝 프로세스에 따라 계산될 수 있으며, 이는 사운드가 재생 환경에서 위치 P로부터 유래된다는 지각을 생성할 수 있다. 예를 들어, 스피커 공급 신호는 다음의 수학식에 따라 재생 환경의 재생 스피커 1 내지 N에 제공될 수 있다:
Figure pct00001
수학식 1에서, x i (t)는 스피커 i에 인가될 스피커 공급 신호를 나타내고, g i 는 대응하는 채널의 이득 인자를 나타내고, x(t)는 오디오 신호를 나타내며, t는 시간을 나타낸다. 이득 인자는 예를 들어, 진폭-패닝된 가상 소스의 변위를 보상하는 방법(Compensating Displacement of Amplitude-Panned Vitual Sources)(가상, 합성 및 엔터테인먼트 오디오에 대한 오디오 엔지니어링 협회(AES) 국제 컨퍼런스), V. Pulkki의 페이지 3-4, 섹션 2에 서술된 진폭 패닝 방법에 따라 결정될 수 있으며, 이는 본원에 참조로 통합된다. 일부 구현에서, 이득은 주파수에 의존할 수 있다. 일부 구현에서, 시간 지연은 x(t)를 x(t-△t)로 교체함으로써 도입될 수 있다.
일부 렌더링 구현에서, 스피커 구역(402)을 참조로 생성된 오디오 재생 데이터는 광범위한 재생 환경의 스피커 위치에 매핑될 수 있으며, 이는 돌비 서라운드 5.1 구성, 돌비 서라운드 7.1 구성, 하마사키 22.2 구성, 또는 다른 구성에 있을 수 있다. 예를 들어, 도 2를 참조하면, 렌더링 툴은 스피커 구역(4 및 5)에 대한 오디오 재생 데이터를 돌비 서라운드 7.1 구성을 갖는 재생 환경의 좌측면 서라운드 어레이(220) 및 우측면 서라운드 어레이(225)에 매핑시킬 수 있다. 스피커 구역(1, 2 및 3)에 대한 오디오 재생 데이터는 좌측 스크린 채널(230), 우측 스크린 채널(240) 및 중앙 스크린 채널(235)에 각각 매핑될 수 있다. 스피커 구역(6 및 7)에 대한 오디오 재생 데이터는 좌측 후면 서라운드 스피커(224) 및 우측 후면 서라운드 스피커(226)에 매핑될 수 있다.
도 4b는 다른 재생 환경의 일 예시를 도시한다. 일부 구현에서, 렌더링 툴은 스피커 구역(1, 2 및 3)에 대한 오디오 재생 데이터를 재생 환경(450)의 대응하는 스크린 스피커들(455)에 매핑시킬 수 있다. 렌더링 툴은 스피커 구역(4 및 5)에 대한 오디오 재생 데이터를 좌측면 서라운드 어레이(460) 및 우측면 서라운드 어레이(465)에 매핑시킬 수 있으며, 스피커 구역(8 및 9)에 대한 오디오 재생 데이터를 좌측 천장형 스피커(left overhead speakers, 470a) 및 우측 천장형 스피커(470b)에 매핑시킬 수 있다. 스피커 구역(6 및 7)에 대한 오디오 재생 데이터는 좌측 후면 서라운드 스피커(480a) 및 우측 후면 서라운드 스피커(480b)에 매핑될 수 있다. 하지만, 대안적인 구현에서 재생 환경(450)의 적어도 일부 스피커는 도 4b에 도시된 바와 같이 그룹화되지 않을 수 있다. 그 대신에, 일부 이러한 구현은 오디오 재생 데이터를 개별적인 측면 스피커, 천장 스피커, 서라운드 스피커 및/또는 서브우퍼로 패닝하는 것을 수반할 수 있다. 일부 이러한 구현에 따라, 적어도 일부 오디오 객체에 대응하는 저주파 오디오 신호는 도 4b에 도시된 서라운드 스피커와 같은 개별적인 서브우퍼 위치 및/또는 다른 저주파-가능 라우드스피커의 위치로 패닝될 수 있다.
일부 저작 구현에서, 저작 툴은 오디오 객체에 대한 메타데이터를 생성하기 위해 사용될 수 있다. 본원에 사용된, "오디오 객체"란 용어는 모노포닉 오디오 데이터(monophonic audio data)와 같은 오디오 데이터의 스트림 및 연관된 메타데이터를 나타낼 수 있다. 메타데이터는 오디오 객체의 2차원(2D) 또는 3차원(3D) 위치, 렌더링 제약뿐만 아니라, 콘텐츠 타입(예를 들어, 다이얼로그(dialog), 효과 등)을 나타낸다. 구현에 의존하여, 메타데이터는 폭 데이터, 이득 데이터, 궤적 데이터 등과 같은 다른 타입의 데이터를 포함할 수 있다. 일부 오디오 객체는 정적일 수 있는 한편, 다른 것은 움직일 수 있다. 오디오 객체 세부사항은, 무엇보다도, 주어진 시점에 3차원 공간에서의 오디오 객체의 위치를 나타낼 수 있는 연관된 메타데이터에 따라 저작되거나 또는 렌더링될 수 있다. 오디오 객체가 재생 환경에서 모니터링되거나 또는 재생될 때, 오디오 객체는 돌비 5.1 및 돌비 7.1과 같은 전통적인 채널 기반 시스템을 갖는 경우, 미리 결정된 물리적인 채널로 출력되기 보다는, 재생 환경에 존재하는 재생 스피커를 사용하여 위치 데이터에 따라 렌더링될 수 있다.
도 5a는 본원에 개시된 방법 중 적어도 일부를 수행하도록 구성될 수 있는 장치의 구성요소의 예시를 도시하는 블록도이다. 일부 예시에서, 장치(5)는 개인용 컴퓨터, 데스크탑 컴퓨터 또는 오디오 처리를 제공하도록 구성된 다른 로컬 디바이스이거나 또는 이를 포함할 수 있다. 일부 예시에서, 장치(5)는 서버이거나 또는 이를 포함할 수 있다. 일부 예시에 따라, 장치(5)는 네트워크 인터페이스를 통해 서버와 통신하도록 구성된 클라이언트 디바이스일 수 있다. 장치(5)의 구성요소는 하드웨어를 통해, 비-일시적 매체에 저장된 소프트웨어를 통해, 펌웨어를 통해 및/또는 이들의 조합을 통해 구현될 수 있다. 도 5a에 도시된 구성요소의 타입 및 개수뿐만 아니라 본원에 개시된 다른 도면은 단지 예시로서 도시된다. 대안적인 구현은 더욱 많거나 더욱 적거나 및/또는 상이한 구성요소를 포함할 수 있다.
이 예시에서, 장치(5)는 인터페이스 시스템(10) 및 제어 시스템(15)을 포함한다. 인터페이스 시스템(10)은 하나 이상의 네트워크 인터페이스, 제어 시스템(15)과 메모리 시스템 사이의 하나 이상의 인터페이스 및/또는 (하나 이상의 범용 직렬 버스(USB) 인터페이스와 같은) 하나 이상의 외부 디바이스 인터페이스를 포함할 수 있다. 일부 구현에서, 인터페이스 시스템(10)은 사용자 인터페이스 시스템을 포함할 수 있다. 사용자 인터페이스 시스템은 사용자로부터 입력을 수신하도록 구성될 수 있다. 일부 구현에서, 사용자 인터페이스 시스템은 사용자에게 피드백을 제공하도록 구성될 수 있다. 예를 들어, 사용자 인터페이스 시스템은 대응하는 터치 및/또는 제스처 검출 시스템을 갖는 하나 이상의 디스플레이를 포함할 수 있다. 일부 예시에서, 사용자 인터페이스 시스템은 하나 이상의 마이크로폰 및/또는 스피커를 포함할 수 있다. 일부 예시에 따라, 사용자 인터페이스 시스템은 모터, 진동기 등과 같은 햅틱 피드백을 제공하기 위한 장치를 포함할 수 있다. 제어 시스템(15)은 예를 들어, 범용의 단일칩 또는 다중칩 프로세서, 디지털 신호 프로세서(DSP), 주문형 집적 회로(ASIC), 필드 프로그래머블 게이트 어레이(FPGA) 또는 다른 프로그래머블 논리 디바이스, 이산형 게이트 또는 트랜지스터 논리 회로, 또는 이산형 하드웨어 구성요소를 포함할 수 있다.
일부 예시에서, 장치(5)는 단일 디바이스로 구현될 수 있다. 하지만, 일부 구현에서, 장치(5)는 하나보다 많은 디바이스에 구현될 수 있다. 일부 이러한 구현에서, 제어 시스템(15)의 기능은 하나보다 많은 디바이스에 포함될 수 있다. 일부 예시에서, 장치(5)는 다른 디바이스의 구성요소일 수 있다.
일부 저음 관리 방법에 따라, 일부 또는 모든 메인 채널로부터의 일부 주파수 임계치 미만의 저주파 정보는 하나 이상의 저주파-가능(LFC) 라우드스피커를 통해 재생될 수 있다. 주파수 임계치는 본원에서 "크로스오버 주파수(crossover frequency)"로 지칭될 수 있다. 크로스오버 주파수는 오디오 채널을 재생하는 데 사용되는 메인 라우드스피커(들)의 성능에 의해 결정될 수 있다. 일부 메인 라우드스피커(본원에서 "비-저주파-가능"으로 지칭될 수 있음)는 150Hz와 같이 상대적으로 높은 크로스오버 주파수를 갖는 하나 이상의 LFC 라우드스피커로 라우팅되는 LF 신호를 가질 수 있다. 일부 메인 라우드스피커(본원에서 "제한된 저주파"로 지칭될 수 있음)는 60Hz와 같은 상대적으로 낮은 크로스오버 주파수를 갖는 하나 이상의 LFC 라우드스피커로 라우팅되는 LF 신호를 가질 수 있다.
도 5b는 라우드스피커 주파수 범위의 일부 예시를 도시한다. 도 5b에 도시된 바와 같이, 일부 LFC 라우드스피커는 정상 범위의 인간 청력 내의 모든 주파수의 재생을 위해 할당된 전역 라우드스피커(Full Range loudspeakers)일 수 있다. 서브우퍼와 같은 일부 LFC 라우드스피커는 주파수 임계치 미만의 오디오의 재생에 전용될 수 있다. 예를 들어, 일부 서브우퍼는 60Hz 또는 80Hz와 같은 주파수보다 낮은 오디오 데이터를 재생하는데 전용될 수 있다. 다른 예시에서, 일부 서브우퍼(본원에서 "중간-서브우퍼"로 지칭될 수 있음)는 상대적으로 높은 주파수 범위, 예를 들어 약 60Hz와 150Hz 사이, 80Hz와 160 Hz 사이 등에 있는 오디오 데이터를 재생하는 데 전용될 수 있다. 하나 이상의 중간-서브우퍼는 메인 라우드스피커(들)와 서브우퍼(들) 사이의 주파수 처리 성능의 간격을 메우는데 사용될 수 있다. 하나 이상의 중간-서브우퍼는 메인 라우드스피커의 상대적으로 밀집한 구성과 서브우퍼의 상대적으로 드문 구성 사이의 공간 해상도의 간격을 메우는데 사용될 수 있다. 예를 들어, 도 5b에 도시된 바와 같이, 중간-서브우퍼에 대해 나타난 주파수 범위는 서브우퍼의 것과 메인 라우드스피커의 "비-저주파 가능" 타입의 것 사이의 주파수 범위에 걸쳐 있다. 하지만, 메인 라우드스피커의 "제한된 저주파" 타입은 중간-서브우퍼의 주파수 범위를 포함하는 주파수 범위를 재생할 수 있다.
통상적으로, 서브우퍼의 개수는 메인 채널의 개수보다 훨씬 적다. 그 결과, 저주파(LF) 정보에 대한 공간 큐(spatial cues)가 감소되거나 왜곡된다. 통상적인 재생 환경에서 저주파에 대해, 이 공간 왜곡은, 특히 음원 국부화를 위해 사운드 주파수가 감소할 때 인간 청각 시스템이 공간 큐를 덜 검출할 수 있기 때문에, 일반적으로 지각적으로 수용 가능하거나 또는 심지어 지각할 수 없는 것으로 밝혀졌다.
저음 관리를 사용하는 것에는 다수의 이점이 있다. (LF 오디오 구성요소 없이) 메인 채널을 재생하는 데 사용되는 다수의 라우드스피커는 더욱 작고, 더욱 쉽게 설치될 수 있고, 덜 거슬리며, 그리고 더욱 저-비용일 수 있다. 서브우퍼 또는 기타 LFC 라우드스피커의 사용은 저주파 사운드를 더 나은 제어를 가능하게 할 수 있다. LF 오디오는 프로그램의 나머지와 독립적으로 처리될 수 있으며, 하나 이상의 LFC 라우드스피커는 일부 경우에서, 메인 라우드스피커에 독립적인, 저음 재생에 최적인 위치에 배치될 수 있다. 예를 들어, 청취 영역 내에서 좌석마다 주파수 응답의 변화가 최소화될 수 있다.
크로스오버, 전기 회로 또는 디지털 오디오 알고리즘은 오디오 신호를 각각 주파수 대역을 커버하는 두 개(또는 다수의 크로스오버가 결합된 경우 그 보다 많은)의 오디오 신호로 분할하는데 사용될 수 있다. 크로스오버는 통상적으로 입력 신호를 저역-통과 필터 및 고역-통과 필터에 병렬로 인가함으로써 구현된다. 대역 경계 또는 크로스오버 주파수는 크로스오버 설계의 하나의 파라미터이다. 이산 주파수 대역으로의 완전한 분리는 실제로 불가능하다; 대역 사이에는 일부 중첩이 있다. 중첩의 양 및 성질은 크로스오버 설계의 다른 파라미터이다. 저음 관리 시스템에 대한 공통 크로스오버 주파수는 80Hz이지만, 시스템 구성요소 및 설계 목표를 기초로 더욱 낮고 더욱 높은 주파수가 종종 사용된다.
다수의 음원을 패닝 및 혼합함으로써 공간적인 오디오 프로그램이 생성될 수 있다. 위에서 언급된 바와 같이, 이 맥락에서 개별적인 음원(예를 들어, 음성, 트럼펫, 헬리콥터 등)은 "오디오 객체"로 지칭될 수 있다. 전통적인 채널 기반 서라운드 오디오 프로그램에서 패닝 및 혼합 정보는 분배 이전에 특정 채널 구성(예를 들어, 5.1)에 대한 채널 신호를 생성하기 위해 오디오 객체에 적용된다.
객체-기반 오디오 프로그램을 통해, 오디오 장면이 각 객체에 대한 연관된 팬 및 혼합 정보와 함께, 개별적인 오디오 객체에 의해 정의될 수 있다. 그 후, 객체-기반 프로그램은 재생 환경에서 팬 및 혼합 정보, 재생 장비 구성(헤드폰, 스테레오, 5.1, 7.1 등) 및 잠재적으로 최종-사용자 제어(예를 들어, 선호되는 다이얼로그 레벨)를 기초로, 수신지(destination)에 분배되고 렌더링될 수 있다(채널 신호로 변환될 수 있다).
객체 기반 프로그램은 저음 관리 시스템에 대한 부가적인 제어를 가능하게 할 수 있다. 예를 들어, 오디오 객체는 채널 기반 혼합의 생성 이전에 개별적으로 처리될 수 있다.
이전에 구현된 저음 관리 방법은 단점을 갖는다. 하나의 공통 문제는 또한, 오디오 신호 커플링(audio signal coupling)으로 지칭되는 저음 과다 증폭(bass build-up)을 수반한다. 다중-채널 프로그램(채널-기반 분배 또는 채널에 대한 렌더링 이후 객체 기반 분배)은 사운드로의 변환(transduction) 이전에 다수의 오디오 신호의 전기적(아날로그 처리) 또는 수학적(디지털 처리) 상호 작용에 의해 영향을 받는다. 통상적인 저음 관리 시스템(서브우퍼보다 더 많은 소스 메인 라우드스피커를 갖는 것)은 필요에 따라, 재생을 위한 서브우퍼 오디오 신호(들)를 생성하기 위해 다수의 저주파 오디오 신호를 필요에 의해 결합한다. 단일 라우드스피커를 통해 재생하기 위해 채널 신호를 결합할 때, 입력 채널이 독립적이고, 신호가 떨어져 있는 라우드스피커를 통해 재생될 경우 발생하는 음향 커플링을 모델링하기 위해 전력 법칙(power law, 2-norm)이 적용되는 것으로 종종 간주된다. 채널-기반 저음 관리 시스템은 통상적으로, 다수의 입력 채널로부터 저주파 신호를 생성할 때 이 관습을 따른다.
하지만, 오디오 신호가 독립적이지 않고(즉, 오디오 신호가 완전히 또는 부분적으로 일관된 경우) 합산(선형 커플 링)된 경우, 결과적인 레벨은 신호가 이산적인 떨어져 있는 라우드스피커를 통해 재생되는 경우보다 더욱 높다(더욱 크다). 저음 관리의 경우, 메인의 떨어져 있는 라우드스피커를 통해 재생되는 일관된 신호는 전력 법칙의 음향 커플링을 갖는 경향이 있는 한편, (전기적으로 또는 수학적으로) 혼합된 저주파는 선형 커플링을 가질 것이다. 이는 오디오 신호 커플링에 기인하여 "저음 과다 증폭"을 초래할 수 있다.
저음 과다 증폭은 또한, 음향 커플링에 의해 야기될 수 있다. 다중-라우드스피커 사운드 재생 시스템은 재생 환경의 음향 공간 내에서 다수의 음원의 상호 작용에 의해 영향을 받는다. 상이한 라우드스피커에 의해 재생되는 일관되지 않은 오디오 신호에 대한 누적 응답은 주파수와 독립적인 전력 합(power sum, 2-norm)을 사용하여 빈번하게 근사화된다. 상이한 라우드스피커에 의해 재생되는 일관된 오디오 신호에 대한 누적 응답은 더 복잡하다. 라우드스피커가 자유-필드(free-field)(크고 반향이 없는 실내, 또는 실외)에서 더욱 멀리 떨어져 있는 경우, 전력 합 근사치가 잘 유지된다. 그렇지 않은 경우, (근접한 라우드스피커의 경우, 더욱 작거나 또는 반향이 있는 실내의 경우 등), 두 개 이상의 라우드스피커로부터 일관된 음파가 중첩되고 커플링되기 때문에, 건설적이고 파괴적인 간섭이 음장(sound field) 내의 음원, 사운드 주파수 및 위치의 상대적인 위치에 의존하는 방식으로 발생할 것이다. 오디오 신호 커플링과 같이, 음향 구성 간섭(저주파 및 근접한 라우드스피커에 대해 더욱 많이 발생함)은 전력 합계보다는 소스의 선형 합계(1-norm)를 향하는 경향이 있다. 이는 실내에 음향 "저음 과다 증폭"을 초래할 수 있다. 채널 기반 저음 관리 방법은 이 효과를 보상하는 그의 능력에 제한된다. 통상적으로, 이 효과는 저음 관리 시스템에 의해 무시된다.
저음 관리 시스템은 일반적으로, 매우 낮은 주파수에서 공간 정보(예를 들어, 위치, 폭 및/또는 확산)를 효과적으로 식별하기 위해 청각 시스템의 제한에 의존한다. 오디오 주파수가 증가할 때, 공간 정보의 손실이 점점 명백해지고 아티팩트(artifacts)가 더욱 주목할만 해지며 받아들일 수 없어진다.
다양한 개시된 구현은 전술한 문제를 고려하여 개발되었다. 일부 개시된 예시는 다중 대역 저음 관리 방법을 제공할 수 있다. 일부 이러한 예시는 저음 관리의 목적으로 다수의 고역-통과 및 저역-통과 필터 주파수를 적용하는 것을 수반할 수 있다. 일부 구현은 또한, "중간-서브우퍼", 우퍼 또는 중간 LF 범위에서 사운드를 재생할 수 있는 비-서브우퍼 스피커에 대해 중간 LF 스피커 공급 신호를 제공하기 위해, 하나 이상의 대역 통과 필터를 적용하는 것을 수반할 수 있다. 중간-LF 범위 또는 중간-LF 범위들은 특정 구현에 따라 달라질 수 있다. 일부 예시에서, 대역 통과 필터에 의해 통과되는 중간 LF 범위는 약 60-140Hz, 70-140Hz, 80-140Hz, 60-150Hz, 70-150Hz, 80-150Hz, 60-160Hz, 70-160 Hz, 80-160Hz, 60-170Hz, 70-170 Hz, 80-170Hz 등일 수 있다. 메인 라우드 스피커의 다양한 성능(예를 들어, 낮은 전력 처리 천장 라우드스피커 대 더 많은 가능 측면 서라운드 라우드 스피커), 타겟 서브 우퍼의 다양한 성능(예를 들어, LFE 채널 재생에 사용되는 서브 우퍼 대 서라운드 서브우퍼), 실내 음향 및 다른 시스템 특성은 시스템 내의 최적의 필터 주파수에 영향을 미칠 수 있다. 일부 개시된 다중 대역 저음 관리 방법은 예를 들어, 재생 환경에서 라우드스피커의 성능에 대응하는 하나 이상의 저역-통과, 대역 통과 및 고역-통과 필터를 제공함으로써 이러한 성능 및 특성의 일부 또는 전체를 다룰 수 있다.
일부 예시에 따라, 다중-대역 저음 관리 방법은 복수의 주파수 대역의 각각에 대해 상이한 저음 관리 라우드스피커 구성을 사용하는 것을 수반할 수 있다. 예를 들어, 각 저음 관리 주파수 대역에 대해 사용 가능한 타겟 라우드스피커의 개수가 증가하는 경우, 신호의 공간 해상도가 주파수에 따라 증가할 수 있으며, 따라서 지각된 공간 아티팩트의 도입을 최소화한다.
일부 구현은 복수의 주파수 대역의 각각에 대해 상이한 저음 관리 처리 방법을 사용하는 것을 수반할 수 있다. 예를 들어, 일부 방법은 저음 관리 없이 발생할 음향 커플링에 더 잘 매칭하도록 각 대역에서 레벨 정규화에 대해 상이한 지수(p-norm)를 사용할 수 있다. 음향 커플링이 선형 합산을 향하는 경향이 있는 최저 주파수에 대해, 1.0 또는 그 근처의 지수가 사용될 수 있다(1-norm). 음향 커플링이 전력 합산을 향하는 경향이 있는 중간-저주파에서 2.0 또는 그 근처의 지수가 사용될 수 있다(2- norm). 대안적으로 또는 부가적으로, 라우드스피커 이득은 최저 주파수에서 균일한 커버리지를 최적화하고 더욱 높은 주파수에서 공간 해상도를 최적화하도록 선택될 수 있다.
일부 구현에서, 저음 관리 대역은 신호 레벨을 기초로 동적으로 활성화될 수 있다. 예를 들어, 신호 레벨이 증가할 때, 사용되는 주파수 대역의 개수도 증가할 수 있다.
일부 경우에서, 프로그램은 오디오 객체 및 채널 양자를 포함할 수 있다. 일부 예시에 따라, 프로그램 채널 및 오디오 객체에 대해 상이한 저음 관리 방법이 사용될 수 있다. 예를 들어, 전통적인 채널 기반 방법이 채널에 적용될 수 있는 한편, 본원에 개시된 오디오 객체 기반 방법 중 하나 이상은 오디오 객체에 적용될 수 있다.
일부 개시된 방법은 패닝될 수 있는 오디오 객체로서 적어도 일부 LF 신호를 다룰 수 있다. 앞서 언급된 바와 같이, 오디오 주파수가 증가할 때, 공간 정보의 손실이 점점 명백해지고, 종래의 저음 관리 방법에 의해 야기된 아티팩트가 더욱 주목할 만 해지고 받아들일 수 없어진다. 다중 대역 저음 관리 방법은 이러한 아티팩트를 감소시킬 수 있다. LF 신호 - 특히 중간-LF 신호 -를 패닝될 수 있는 객체로 취급하는 것은 또한, 이러한 아티팩트를 감소시킬 수 있다. 따라서, 다중-대역 저음 관리 방법과 적어도 일부 LF 신호를 패닝하는 것을 수반하는 방법을 결합하는 것이 유리할 수 있다. 하지만, 일부 구현은 적어도 일부 LF 신호 또는 다중 대역 저음 관리 방법을 패닝하는 것을 수반할 수 있지만, 저주파 객체 패닝 및 다중-대역 저음 관리 양자를 포함하지는 않는다.
위에서 언급된 바와 같이, 필터링이 라우드스피커 공급에 적용되는 저음 관리에 대한 전통적인 접근법은 패닝 법칙이 종종 청취자 위치에서 음향 전력 합계를 가정하기 때문에 종종 최적이 아니다. 반대로, 동일한 서브우퍼에 대해 다수의 라우드스피커를 관리하는 저음은 전기적인 저음 과다 증폭을 이끄는 전기적인 진폭 합계를 생성한다. 일부 개시된 방법은 저주파 및 고주파를 별도로 패닝함으로써 이 잠재적인 문제를 회피한다. 고역-통과 렌더링 이후에, 전력 '검사(audit)'는 서브우퍼 또는 다른 저주파 가능(LFC) 라우드스피커에 의해 재생될 저주파 '부족'을 결정할 수 있다.
따라서, 일부 개시된 저음 관리 방법은 저음 관리에 의해 야기되는 저주파 전력 부족을 기초로 중간 LF에 대한 저역-통과 필터(LPF) 계수 및/또는 대역 통과 필터 계수를 계산하는 것을 수반할 수 있다. 다양한 예시가 아래에 상세히 서술된다. 저주파 전력 부족을 기초로 중간 LF에 대한 저역-통과 필터 계수 및/또는 대역 통과 필터 계수를 계산하는 것을 수반하는 저음 관리 방법은 저음 과다 증폭을 감소시킬 수 있다. 이러한 방법은 특정 구현에 의존하여, 다중-대역 저음 관리 방법 및/또는 적어도 일부 LF 신호를 패닝하는 것과 결합하여 구현되거나 또는 그렇지 않을 수 있다. 하지만, 저주파 전력 부족에 기초한 저역-통과 필터 계수(및/또는 중간 LF에 대한 대역 통과 필터 계수)의 계산을 수반하는 방법을 본원에 개시된 다른 저음 관리 방법과 결합하는 것이 유리할 수 있다.
도 6은 일 예시에 따른 저음 관리 방법의 블록을 도시하는 흐름도이다. 방법(600)은 예를 들어, 하나 이상의 프로세서 및 하나 이상의 비-일시적 메모리 디바이스를 포함하는 (제어 시스템(15)과 같은) 제어 시스템에 의해 구현될 수 있다. 다른 개시된 방법과 같이, 방법(600)의 모든 블록이 반드시 도 6에 도시된 순서로 수행되는 것은 아니다. 또한, 대안적인 방법은 더욱 많거나 더욱 적은 블록을 포함할 수 있다.
이 예시에서, 방법(600)은 오디오 객체에 대응하는 LF 오디오 신호를 패닝하는 것을 수반한다. 오디오 객체에 대응하는 오디오 신호에 대해 동작하는 필터링, 패닝 및 다른 프로세스는 간결함을 위해 본원에서 오디오 객체에 대해 동작하는 것으로 지칭될 수 있다. 예를 들어, 오디오 객체의 오디오 데이터에 필터를 적용하는 프로세스는 본원에서 오디오 객체에 필터를 적용하는 것으로 서술될 수 있다. 오디오 객체의 오디오 데이터를 패닝하는 프로세스는 본원에서 오디오 객체를 패닝하는 것으로 서술될 수 있다.
이 예시에 따라, 블록(605)은 복수의 오디오 객체를 포함하는 오디오 데이터를 수신하는 것을 수반한다. 오디오 객체는 (모노포닉 오디오 신호일 수 있는) 오디오 데이터 및 연관된 메타데이터를 포함한다. 이 예시에서, 메타데이터는 오디오 객체 위치 데이터를 포함한다.
여기서, 블록(610)은 재생 환경에서 하나 이상의 재생 스피커의 표시 및 재생 환경 내의 하나 이상의 재생 스피커의 위치의 표시를 포함하는 재생 스피커 레이아웃 데이터를 수신하는 것을 수반한다. 일부 예시에서, 위치는 재생 환경 내의 하나 이상의 다른 위치 재생 스피커의 위치, 예를 들어 "중앙", "전면 좌측", "전면 우측", "좌측 서라운드", "우측 서라운드" 등에 관련될 수 있다. 일부 예시에 따라, 재생 스피커 레이아웃 데이터는 도 1-3 또는 4b에 도시된 것과 유사한 재생 환경에서 하나 이상의 재생 스피커의 표시 및 재생 환경 내에서 하나 이상의 재생 스피커의 (상대적인 위치와 같은) 위치의 표시를 포함할 수 있다. 일부 구현에 따라, 재생 스피커 레이아웃 데이터는 재생 환경 내의 재생 스피커의 하나 이상의 그룹의 위치(상대적인 위치일 수 있음)의 표시를 포함할 수 있다. 이 예시에서, 재생 스피커 레이아웃 데이터는 재생 환경의 하나 이상의 LFC 재생 스피커에 대응하는 저주파-가능(LFC) 라우드스피커 위치 데이터를 포함한다.
일부 예시에서, LFC 재생 스피커는 하나 이상의 타입의 서브우퍼를 포함할 수 있다. 대안적으로 또는 부가적으로, 재생 환경은 LFC 재생 스피커를 포함할 수 있으며, LF 오디오 데이터의 만족스러운 재생을 할 수 있는 하나 이상의 타입의 광역 및/또는 전역 라우드스피커를 포함할 수 있다. 예를 들어, 이러한 일부 LFC 재생 스피커는 불쾌한 레벨의 왜곡 없이, 중간-LF 오디오 데이터(예를 들어, 80-150Hz의 범위의 오디오 데이터)를 재생할 수 있으면서, 또한 더욱 높은 주파수 범위에서의 오디오 데이터를 재생할 수 있다. 일부 경우에서, 이러한 전역 LFC 재생 스피커는 인간이 들을 수 있는 주파수 범위의 대부분 또는 전부를 재생할 수 있다. 일부 이러한 전역 LFC 재생 스피커는 60Hz 이상, 70Hz 이상, 80Hz 이상, 90Hz 이상, 100Hz 이상 등의 오디오 데이터를 재생하는 데 적합할 수 있다.
따라서, 재생 환경의 일부 LFC 재생 스피커는 전용 서브우퍼 일 수 있고, 재생 환경의 일부 LFC 재생 스피커는 LF 오디오 데이터 및 비-LF 오디오 데이터 양자를 재생하기 위해 사용될 수 있다. LFC 재생 스피커는 일부 예시에서, 전면 스피커, 중앙 스피커, 및/또는 벽 서라운드 스피커 및/또는 후면 서라운드 스피커와 같은 서라운드 스피커를 포함할 수 있다. 예를 들어, 도 4b를 참조하면, (재생 환경(450)의 전면 및 후면에 도시된 서브우퍼와 같은) 재생 환경의 일부 LFC 재생 스피커는 전용 서브우퍼일 수 있고, (재생 환경(450)의 측면 및 후면에 도시된 서라운드 스피커와 같은) 재생 환경의 일부 LFC 재생 스피커는 LF 오디오 데이터 및 비-LF 오디오 데이터 양자를 재생하는 데 사용될 수 있다.
이 예시에서, 재생 스피커 레이아웃 데이터는 또한, 재생 환경의 하나 이상의 메인 재생 스피커에 대응하는 메인 라우드스피커 위치 데이터를 포함한다. 메인 재생 스피커는 LFC 재생 스피커에 비해, 상대적으로 더 작은 스피커를 포함할 수 있다. 메인 재생 스피커는 특정 구현에 의존하여, 100Hz 이상, 120Hz 이상, 150Hz 이상, 180Hz 이상, 200Hz 이상 등의 오디오 데이터를 재생하는데 적합할 수 있다. 일부 예시에서, 메인 재생 스피커는 천장 스피커 및/또는 벽 스피커를 포함할 수 있다. 다시 도 4b를 참조하면, 일부 구현에서 천장 스피커의 대부분 또는 전체 및 측면 스피커 중 일부는 메인 재생 스피커일 수 있다.
도 6으로 돌아가면, 이 예시적인 블록(615)에서, 연관된 메타데이터 및 재생 스피커 레이아웃 데이터에 적어도 부분적으로 기초하여 오디오 객체를 스피커 공급 신호로 렌더링하는 것을 수반한다. 여기서, 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 재생 스피커에 대응한다.
이 예시에 따라, 블록(620)은 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 스피커 공급 신호 중 적어도 일부에 고역-통과 필터를 적용하는 것을 수반한다. 일부 예시에서, 블록(620)은 제1 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 제1 복수의 스피커 공급 신호에 제1 고역-통과 필터를 적용하는 것, 및 제2 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 제2 복수의 스피커 공급 신호에 제2 고역-통과 필터를 적용하는 것을 수반할 수 있다. 예를 들어, 제1 고역-통과 필터는 제2 고역-통과 필터보다 낮은 주파수 범위를 통과시키도록 구성될 수 있다. 일부 예시에 따라, 블록(620)은 두 개 이상의 상이한 주파수 범위를 갖는 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 두 개 이상의 상이한 고역-통과 필터를 적용하는 것을 수반할 수 있다. 일부 예시가 아래에서 서술된다.
블록(620)에서 적용되는 고역-통과 필터(들)는 재생 환경에서 재생 스피커의 성능에 대응할 수 있다. 방법(600)의 일부 구현은 재생 환경에서 하나 이상의 타입의 메인 재생 스피커에 관한 재생 스피커 성능 정보를 수신하는 것을 수반할 수 있다.
일부 이러한 구현은 메인 재생 스피커의 제1 세트에 관한 제1 재생 스피커 성능 정보를 수신하는 것, 및 메인 재생 스피커의 제2 세트에 관한 제2 재생 스피커 성능 정보를 수신하는 것을 수반할 수 있다. 블록(620)에서 적용된 제1 고역-통과 필터는 제1 재생 스피커 성능 정보에 대응할 수 있고, 블록(620)에서 적용된 제2 고역-통과 필터는 제2 재생 스피커 성능 정보에 대응할 수 있다. 이러한 구현은 제1 고역-통과 필터링된 스피커 공급 신호를 메인 재생 스피커의 제1 세트에 제공하는 것, 및 제2 고역-통과 필터링된 스피커 공급 신호를 메인 재생 스피커의 제2 세트에 제공하는 것을 수반할 수 있다.
일부 예시에서, 블록(620)에서 적용되는 고역-통과 필터(들)는 오디오 객체와 연관된 메타데이터에 적어도 부분적으로 기초할 수 있다. 예를 들어, 메타데이터는 블록(605)에서 수신된 오디오 객체의 특정한 오디오 객체에 대응하는 스피커 공급 신호에 고역-통과 필터를 적용할지의 표시를 포함할 수 있다.
이 예시적인 블록(625)은 저주파(LF) 오디오 객체를 생성하기 위해 복수의 오디오 객체의 각각에 저역-통과 필터를 적용하는 것을 수반한다. 위에서 언급된 바와 같이, 오디오 객체의 오디오 데이터에 대해 수행되는 동작은 본원에서 오디오 객체에 대해 수행되는 것으로 지칭될 수 있다. 따라서, 이 예시에서 블록(625)은 복수의 오디오 객체의 각각의 오디오 데이터에 저역-통과 필터를 적용하는 것을 수반한다. 일부 예시에서, 블록(625)은 두 개 이상의 상이한 필터를 적용하는 것을 수반할 수 있다. 아래에서 더욱 상세히 서술되는 바와 같이, 블록(625)에서 적용된 필터는 저역-통과, 대역 통과 및/또는 고역-통과 필터를 포함할 수 있다.
일부 구현은 임계 레벨 이상인 오디오 신호에 대해서만 저음 관리 방법을 적용하는 것을 포함할 수 있다. 임계 레벨은 일부 경우에서, 재생 환경의 하나 이상의 타입의 메인 재생 스피커의 성능에 따라 달라질 수 있다. 일부 이러한 예시에 따라, 방법(600)은 하나 이상의 오디오 객체의 오디오 데이터의 신호 레벨을 결정하는 것을 수반할 수 있다. 이러한 예시는 신호 레벨을 임계 신호 레벨에 비교하는 것을 수반할 수 있다. 일부 이러한 예시는 오디오 데이터의 신호 레벨이 임계 신호 레벨 이상인 오디오 객체에만 하나 이상의 저역-통과 필터를 적용하는 것을 수반할 수 있다.
도 6에 도시된 예시에서, 블록(630)은 LFC 스피커 공급 신호를 생성하기 위해 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 LF 오디오 객체를 패닝하는 것을 수반한다. 여기서, 선택적인 블록(635)은 재생 환경의 하나 이상의 LFC 라우드스피커에 LFC 스피커 공급 신호를 출력하는 것을 수반한다. 선택적인 블록(640)은 재생 환경의 하나 이상의 메인 재생 스피커에 고역-통과 필터링된 스피커 공급 신호를 제공하는 것을 수반한다.
일부 구현에서, 블록(630)은 하나 보다 많은 타입의 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다. 예를 들어, 블록(630)은 상이한 주파수 범위를 갖는 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다. 상이한 주파수 범위는 재생 환경의 상이한 LFC 라우드스피커의 성능에 대응할 수 있다.
이러한 일부 예시에 따라, 블록(625)은 제1 LF 오디오 객체를 생성하기 위해 오디오 객체 중 적어도 일부에 저역-통과 필터를 적용하는 것을 수반할 수 있다. 저역-통과 필터는 제1 주파수 범위를 통과시키도록 구성될 수 있다. 제1 주파수 범위는 특정 구현에 따라 달라질 수 있다. 일부 예시에서, 저역-통과 필터는 60Hz 아래의 주파수, 80Hz 아래의 주파수, 100Hz 아래의 주파수, 120Hz 아래의 주파수, 150Hz 아래의 주파수 등을 통과시키도록 구성될 수 있다.
일부 이러한 구현에서, 블록(625)은 제2 LF 오디오 객체를 생성하기 위해 제1 LF 오디오 객체에 고역-통과 필터를 적용하는 것을 수반할 수 있다. 고역-통과 필터는 중간 LF 주파수 범위인 제2 주파수 범위를 통과시키도록 구성될 수 있다. 예를 들어, 고역-통과 필터는 80 내지 150Hz의 범위, 60 내지 150Hz의 범위, 60 내지 120Hz의 범위, 80 내지 120Hz의 범위, 100 내지 150Hz의 범위, 60 내지 150Hz의 범위 등의 주파수를 통과시키도록 구성될 수 있다.
대안적인 구현에서, 블록(625)은 제2 LF 오디오 객체를 생성하기 위해 제2 복수의 오디오 객체에 대역 통과 필터를 적용하는 것을 수반할 수 있다. 대역 통과 필터는 중간 LF 주파수 범위인 제2 주파수 범위를 통과시키도록 구성될 수 있다. 예를 들어, 대역 통과 필터는 80 내지 150Hz 범위, 60 내지 150Hz의 범위, 60 내지 120Hz의 범위, 80 내지 120Hz의 범위, 100 내지 150Hz의 범위, 60 내지 150Hz 범위 등의 주파수를 통과시키도록 구성될 수 있다.
일부 이러한 구현에 따라, 블록(630)은 제1 LF 오디오 객체를 패닝함으로써 제1 LFC 스피커 공급 신호를 생성하는 것, 및 제2 LF 오디오 객체를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다. 제1 및 제2 LFC 스피커 공급 신호는 재생 환경의 상이한 타입의 LFC 라우드스피커에 제공될 수 있다. 예를 들어, 도 4b를 다시 참조하면, (예를 들어, 재생 환경(450)의 전면 및 후면에 도시된 서브우퍼와 같은) 일부 LFC 재생 스피커는 전용 서브우퍼일 수 있고, (예를 들어, 재생 환경(450)의 측면 및 후면에 도시된 서라운드 스피커와 같은) 일부 LFC 재생 스피커는 LF 오디오 데이터 및 비-LF 오디오 데이터 양자를 재생하는데 사용될 수 있는 비-서브우퍼 라우드스피커일 수 있다.
일부 이러한 예시에서, 블록(610)에서 LFC 라우드스피커 위치 데이터를 수신하는 것은 제2 주파수 범위(중간-LF 범위)에서 오디오 데이터를 재생할 수 있는 복수의 비-서브우퍼 재생 스피커의 각각의 상대적인 위치를 나타내는 비-서브우퍼 위치 데이터를 수신하는 것을 수반할 수 있다. 일부 이러한 구현에 따라, 블록(630)은 비-서브우퍼 스피커 공급 신호를 생성하기 위해 비-서브우퍼 위치 데이터에 적어도 부분적으로 기초하여 제2 LF 오디오 객체의 적어도 일부를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다. 이러한 구현은 또한, 블록(635)에서 재생 환경의 복수의 비-서브우퍼 재생 스피커 중 하나 이상에 비-서브우퍼 스피커 공급 신호를 제공하는 것을 수반할 수 있다.
대안적으로 또는 부가적으로, 재생 환경의 전용 서브우퍼 중 일부는 재생 환경의 다른 전용 서브우퍼에 비해, 더욱 낮은 범위에서 오디오 신호를 재생할 수 있다. 후자는 때때로, 본원에서 "중간-서브우퍼"로 지칭될 수 있다.
일부 이러한 예시에서, 블록(610)에서 LFC 라우드스피커 위치 데이터를 수신하는 것은 제2 주파수 범위에서 오디오 데이터를 재생할 수 있는 복수의 중간-서브우퍼 재생 스피커의 각각의 상대적인 위치를 나타내는 중간-서브우퍼 위치 데이터를 수신하는 것을 포함할 수 있다. 일부 이러한 구현에 따라, 블록(630)은 중간-서브우퍼 스피커 공급 신호를 생성하기 위해 중간-서브우퍼 위치 데이터에 적어도 부분적으로 기초하여 제2 LF 오디오 객체의 적어도 일부를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 수반할 수 있다. 이러한 구현은 또한, 블록(635)에서, 재생 환경의 복수의 중간-서브우퍼 재생 스피커 중 하나 이상에 중간-서브우퍼 스피커 공급 신호를 제공하는 것을 수반할 수 있다.
도 7은 일 개시된 예시에 따른 저음 관리 방법의 블록을 도시한다. 이 예시에 따라, 오디오 객체는 블록(705)에서 수신된다. 방법(700)은 또한, 재생 스피커 레이아웃 데이터를 수신하는 것, 또는 메모리로부터 재생 스피커 레이아웃 데이터를 검색하는 것을 수반한다. 이 예시에서, 재생 스피커 레이아웃 데이터는 재생 환경의 LFC 재생 스피커에 대응하는 LFC 라우드스피커 위치 데이터를 포함한다. 재생 환경의 전면에 LFC 재생 스피커, 재생 환경의 좌측 후면에 다른 LFC 재생 스피커, 및 재생 환경의 우측 후면에 다른 LFC 재생 스피커를 나타내는 LFC 재생 스피커 레이아웃(730b)에서의 하나의 예시가 도시된다. 하지만, 대안적인 예시는 더욱 많은 LFC 재생 스피커, 더욱 적은 LFC 재생 스피커 및/또는 상이한 위치의 LFC 재생 스피커를 포함할 수 있다.
이 예시에서, 재생 스피커 레이아웃 데이터는 재생 환경의 메인 재생 스피커에 대응하는 메인 라우드스피커 위치 데이터를 포함한다. 재생 환경의 측면을 따라, 천장에 및 전면에 메인 재생 스피커의 위치를 나타내는 메인 재생 스피커 레이아웃(730a)에서의 하나의 예시가 도시된다. 하지만, 대안적인 예시는 더욱 많은 메인 재생 스피커, 더욱 적은 메인 재생 스피커 및/또는 상이한 위치의 메인 재생 스피커를 포함할 수 있다. 예를 들어, 일부 재생 환경은 재생 환경의 전면에 메인 재생 스피커를 포함하지 않을 수 있다.
이 구현에서, 크로스오버 필터는 수신된 오디오 객체에 대응하는 입력 오디오 신호를 저역-통과 필터(블록(715)) 및 고역-통과 필터(블록(710))에 병렬로 적용함으로써 구현된다. 크로스오버 필터는 예를 들어, 도 5a의 제어 시스템(15)과 같은 제어 시스템에 의해 구현될 수 있다. 이 예시에서, 크로스오버 주파수는 80Hz이지만, 대안적인 저음 관리 방법에서 더욱 낮거나 또는 더욱 높은 주파수를 갖는 크로스오버 필터를 적용할 수 있다. 크로스오버 주파수는 (재생 환경의 재생 라우드스피커의 성능과 같은) 시스템 구성요소 및 설계 목표에 따라 선택될 수 있다.
이 구현에 따라, 블록(710)에서 생성된 고역-통과 필터링된 오디오 객체는 오디오 객체 및 메인 라우드스피커 위치 데이터와 연관된 메타데이터에 적어도 부분적으로 기초하여 블록(720)에서 스피커 공급 신호로 패닝된다. 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 메인 재생 스피커에 대응할 수 있다.
이 예시에서, 블록(715)에서 생성된 LF 오디오 객체는 오디오 객체 및 LFC 라우드스피커 위치 데이터와 연관된 메타데이터에 적어도 부분적으로 기초하여 블록(725)에서 스피커 공급 신호로 패닝된다. 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 LFC 재생 스피커에 대응할 수 있다. 일부 예시에서, 저음- 관리된 오디오 객체는 수학식 13을 참조로 아래에서 서술되는 바와 같이 표현될 수 있다.
하나보다 많은 LFC 재생 스피커가 이용 가능한 경우, 예를 들어 듀얼-밸런스 진폭 패닝(dual-balance amplitude panning)을 사용하여 LFC 재생 스피커의 기하학적 구조에 따라 저음-관리된 오디오 객체가 패닝될 수 있다.
도 7에 도시된 예시에서, 선택적인 블록(735)은 블록(725)에서 LF 오디오 객체가 스피커 공급 신호로 패닝되는 시간 이전에 블록(715)에서 생성된 LF 오디오 객체에 저주파 부족 인자를 적용하는 것을 수반한다. 저주파 부족 인자는 블록(710)에서 고역-통과 필터를 적용함으로써 야기된 "전력 부족"을 적어도 부분적으로 보상하기 위해 적용될 수 있다. 고역-통과 필터링 및/또는 렌더링 이후에, 전력 "검사"는 LFC 재생 스피커에 의해 재생될 저주파 부족 인자를 결정할 수 있다. 저주파 부족 인자는 블록(710)에서 적용되는 고역-통과 필터의 형태 및 고역-통과 필터링된 스피커 공급 신호의 전력에 기초할 수 있다.
하지만, 일부 대안적인 예시에서, LF 오디오 객체를 생성하는데 사용되는 필터 중 하나 이상은 전력 부족에 적어도 부분적으로 기초할 수 있다. 예를 들어, 도 6을 참조하면, 블록(625)에서 적용되는 필터 중 하나 이상은 전력 부족에 적어도 부분적으로 기초할 수 있다. 일부 이러한 예시에서, 방법(600)은 블록(620)에서 생성되는 고역-통과 필터링된 스피커 공급 신호에 적어도 부분적으로 기초하여 전력 부족을 계산하는 것을 수반할 수 있다. 이러한 일부 예시에 따라, 블록(625)에서 적용되는 하나 이상의 저역-통과 필터의 특성은 전력 부족에 적어도 부분적으로 기초하여 결정될 수 있다. 전력 부족은 블록(620)에서 적용되는 고역-통과 필터(들)의 형태 및 고역-통과 필터링된 스피커 공급 신호의 전력에 적어도 부분적으로 기초할 수 있다.
g m 을 라우드스피커
Figure pct00002
에 대한 객체의 패닝 이득인 것으로 하고, 여기서 M은 전역 라우드스피커의 총 개수이다. 이 예시에서, 패닝된 오디오 객체는 먼저, 전달 함수
Figure pct00003
를 갖는 필터를 사용하여 컷오프 주파수
Figure pct00004
에서 고역-통과된다. 버터워스 필터(Butterworth filter)의 예시에서 전달 함수의 크기 응답은 다음과 같이 표현될 수 있다:
Figure pct00005
수학식 2에서 n은 필터에서 극의 개수를 나타낸다. 일부 예시에서, n은 4일 수 있다. 하지만, n은 대안적인 구현에서 4보다 크거나 작을 수 있다. 전체 주파수 범위에 걸친 전력 합산을 가정하면, 청취자 위치에서 저음-관리된 전역 라우드스피커로부터 수신된 전력
Figure pct00006
는 다음과 같이 표현될 수 있다.
Figure pct00007
그러므로, 전력 부족은 다음과 같이 표현될 수 있다:
Figure pct00008
그러므로, 이상적인 LFC 재생 스피커에 의해 재생된 스펙트럼은 다음과 같이 표현할 수 있다:
Figure pct00009
수학식 5에서 c는 이상적인 서브우퍼 스펙트럼을 나타낸다. 이 구현에 따라, 고역-통과 경로의 것과 동일한 형태의 버터워스 필터를 사용하여 저주파 필터링이 적용된다. 불행히도, 이상적인 LFC 재생 스피커 스펙트럼은 저역-통과 버터워스 필터의 선형 조합(가중 합)에 정확히 매칭할 수 없다. 이 스테이트먼트(statement)는 매칭 문제가 명시적으로 기록될 때 더 잘 이해된다:
Figure pct00010
수학식 6에서
Figure pct00011
은 계산되고 적용될 가중치를 나타낸다. 저역-통과 전달 함수 크기
Figure pct00012
를 갖는 버터워스 필터가 저주파 공급을 생성하는데 사용되는 경우, 저역-통과 전달 함수의 크기는 다음과 같이 표현될 수 있다:
Figure pct00013
이산 주파수
Figure pct00014
,
Figure pct00015
에서 스펙트럼
Figure pct00016
를 샘플링하고 가중치
Figure pct00017
에 대해 제한된 최소-제곱 솔루션을 찾음으로써 최적의 근사 솔루션이 도출될 수 있다. 위에 정의된 변수로부터, 다음의 벡터 및 행렬을 도출할 수 있다.
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Fh = c이다. 수학식 10에서 c는 서브우퍼 스펙트럼의 벡터 형태를 나타내고
Figure pct00022
는 이산 주파수의 세트에서 평가된 서브우퍼 스펙트럼을 나타낸다. 총 주파수 K의 선택은 임의적이다. 하지만, 주파수
Figure pct00023
,
Figure pct00024
Figure pct00025
에서 샘플링이 수용 가능한 결과를 생성한다는 것이 경험적으로 발견되었다. 가중치를 음이 아닌 값으로 제한하면, 최적화 문제는 다음과 같이 나타낼 수 있다:
Figure pct00026
Figure pct00027
를 객체
Figure pct00028
및 고유한 컷오프 주파수 인덱스
Figure pct00029
에 대한 최적 가중치로 한다. 일부 구현에서, 저음-관리된 오디오 객체는 다음과 같이 표현될 수 있다:
Figure pct00030
수학식 13에서 *는 선형 컨벌루션(linear convolution)을 나타내고
Figure pct00031
는 컷오프 주파수 인덱스 j에서 저역-통과 필터의 임펄스 응답을 나타낸다.
마지막 문제는 4차 필터의 컷오프 주파수에서 180°인 버터워스 필터의 위상 응답에서 발생한다. 전환 대역이 통과 대역과 중첩되는 필터의 합산은 두 개의 필터 응답이 위상이 다를 때, 딥(dip)을 유발한다. DC 그룹 지연이 가장 낮은 컷오프 주파수를 갖는 필터의 그룹 지연과 매칭하도록 높은 컷오프 주파수를 갖는 필터를 지연시킴으로써, 필터가 180° 위상차가 있는 지점은 적은 효과를 갖는 정지 대역으로 푸시될 수 있다.
도 8은 하나의 개시된 예시에 따른 대안적인 저음 관리 방법의 블록을 도시한다. 이 예시에 따라, 오디오 객체는 블록(805)에서 수신된다. 방법(800)은 또한, 재생 환경의 메인 재생 스피커에 대응하는 메인 라우드스피커 위치 데이터를 포함하는, 재생 스피커 레이아웃 데이터를 수신하는 것(또는 메모리로부터 재생 스피커 레이아웃 데이터를 검색하는 것)을 수반한다. 재생 환경의 측면을 따라, 천장에 및 전면에 메인 재생 스피커의 위치를 나타내는 메인 재생 스피커 레이아웃(830a)의 하나의 예시가 도시된다. 하지만, 대안적인 예시는 더욱 많은 메인 재생 스피커, 더욱 적은 메인 재생 스피커 및/또는 상이한 위치의 메인 재생 스피커를 포함할 수 있다. 예를 들어, 일부 재생 환경은 재생 환경의 전면에 메인 재생 스피커를 포함하지 않을 수 있다.
이 예시에서, 재생 스피커 레이아웃 데이터는 또한, 재생 환경의 LFC 재생 스피커에 대응하는 LFC 라우드스피커 위치 데이터를 포함한다. LFC 재생 스피커 레이아웃(830b)의 하나의 예시가 도시된다. 하지만, 대안적인 예시는 더욱 많은 LFC 재생 스피커, 더욱 적은 LFC 재생 스피커 및/또는 상이한 위치의 LFC 재생 스피커를 포함할 수 있다.
이 구현에 따라, 적어도 일부 오디오 객체는 고역-통과 필터링 이전에 스피커 공급 신호로 패닝된다. 여기서, 저음-관리된 오디오 객체는 임의의 고역-통과 필터가 적용되기 전에 블록(810)에서 스피커 공급 신호로 패닝된다. 블록(810)의 패닝 프로세스는 오디오 객체 및 메인 라우드스피커 위치 데이터와 연관된 메타데이터에 적어도 부분적으로 기초할 수 있다. 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 메인 재생 스피커에 대응할 수 있다.
이 구현에서, 제1 고역-통과 필터는 블록(820)에서 적용되고 제2 고역-통과 필터는 블록(822)에서 적용된다. 다른 구현은 세 개 이상의 상이한 고역-통과 필터를 적용하는 것을 수반할 수 있다. 이 예시에 따라, 제1 고역-통과 필터는 60Hz 고역-통과 필터이고 제2 고역-통과 필터는 150Hz 고역-통과 필터이다. 이 예시에서, 제1 고역-통과 필터는 재생 환경의 측면에서의 재생 스피커의 성능에 대응하고 제2 고역-통과 필터는 재생 환경의 천장에서의 재생 스피커의 성능에 대응한다. 제1 고역-통과 필터 및 제2 고역-통과 필터는 예를 들어, 저장되거나 수신된 재생 스피커 성능 정보에 적어도 부분적으로 기초하여 제어 시스템에 의해 결정될 수 있다.
도 8에 도시된 예시에서, 블록(815)에서 LF 오디오 객체를 생성하는 데 사용되는 하나 이상의 필터는 전력 부족에 적어도 부분적으로 기초한다. 일부 이러한 예시에서, 방법(800)은 블록(820 및 822)에서 생성되는 고역-통과 필터링된 스피커 공급 신호에 적어도 부분적으로 기초하여 전력 부족을 계산하는 것을 수반할 수 있다. 전력 부족은 블록(820 및 822)에서 적용되는 고역-통과 필터의 형태 및 고역-통과 필터링된 스피커 공급 신호의 전력에 적어도 부분적으로 기초할 수 있다.
이 예시에서, 블록(815)에서 생성된 LF 오디오 객체는 오디오 객체 및 LFC 라우드스피커 위치 데이터와 연관된 메타데이터에 적어도 부분적으로 기초하여 블록(825)에서 스피커 공급 신호로 패닝된다. 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 LFC 재생 스피커에 대응할 수 있다.
도 9는 하나의 개시된 예시에 따른 다른 저음 관리 방법의 블록을 도시한다. 이 예시에 따라, 오디오 객체는 블록(905)에서 수신된다. 방법(900)은 또한, 재생 환경의 메인 재생 스피커에 대응하는 메인 라우드스피커 위치 데이터를 포함하는, 재생 스피커 레이아웃 데이터를 수신하는 것(또는 메모리로부터 재생 스피커 레이아웃 데이터를 검색하는 것)을 수반한다. 재생 환경의 측면을 따라, 천장에서 및 전면에서 메인 재생 스피커의 위치를 나타내는 메인 재생 스피커 레이아웃(930a)의 하나의 예시가 도시된다. 하지만, 대안적인 예시는 더욱 많은 메인 재생 스피커, 더욱 적은 메인 재생 스피커 및/또는 상이한 위치의 메인 재생 스피커를 포함할 수 있다. 예를 들어, 일부 재생 환경은 재생 환경의 전면에 메인 재생 스피커를 포함하지 않을 수 있다.
이 예시에서, 재생 스피커 레이아웃 데이터는 또한, 재생 환경의 LFC 재생 스피커에 대응하는 LFC 라우드스피커 위치 데이터를 포함한다. LFC 재생 스피커 레이아웃(930b 및 930c)의 예시가 도시된다. 하지만, 대안적인 예시는 더욱 많은 LFC 재생 스피커, 더욱 적은 LFC 재생 스피커 및/또는 상이한 위치의 LFC 재생 스피커를 포함할 수 있다. 이들 예시에서, 재생 스피커 레이아웃(930b)내의 다크 서클(dark circles)은 대략 60Hz 이하의 범위에서 오디오 데이터를 재생할 수 있는 LFC 재생 스피커의 위치를 나타내는 한편, 재생 스피커 레이아웃(930c) 내의 다크 서클은 대략 60Hz 내지 150Hz 범위의 오디오 데이터를 재생할 수 있는 LFC 재생 스피커의 위치를 나타낸다. 이 예시에 따라, 재생 스피커 레이아웃(930b)은 전용 서브우퍼의 위치를 나타내는 한편, 재생 스피커 레이아웃(930c)은 LF 오디오 데이터를 만족스럽게 재생할 수 있는 광역 및/또는 전역 라우드스피커의 위치를 나타낸다. 예를 들어, 재생 스피커 레이아웃(930c)에 도시된 LFC 재생 스피커는 불쾌한 레벨의 왜곡없이 중간-LF 오디오 데이터(예를 들어, 80 내지 150Hz 범위의 오디오 데이터)를 재생할 수 있으면서, 또한 더욱 높은 주파수 범위의 오디오 데이터를 재생할 수 있다. 일부 예시에서, 재생 스피커 레이아웃(930c)에 도시된 LFC 재생 스피커는 인간이 들을 수 있는 주파수 범위의 대부분 또는 전체를 재생할 수 있다.
이 구현에 따라, 저음-관리된 오디오 객체는 임의의 고역-통과 필터가 적용되기 전에 블록(910)에서 스피커 공급 신호로 패닝된다. 블록(910)의 패닝 프로세스는 오디오 객체 및 메인 라우드스피커 위치 데이터와 연관된 메타데이터에 적어도 부분적으로 기초할 수 있다. 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 메인 재생 스피커에 대응할 수 있다.
이 구현에서, 제1 고역-통과 필터는 블록(920)에서 적용되고 제2 고역-통과 필터는 블록(922)에서 적용된다. 다른 구현은 세 개 이상의 상이한 고역-통과 필터를 적용하는 것을 수반할 수 있다. 이 예시에 따라, 제1 고역-통과 필터는 60Hz 고역-통과 필터이고 제2 고역-통과 필터는 150Hz 고역-통과 필터이다. 이 예시에서, 제1 고역-통과 필터는 재생 환경의 측면에서의 재생 스피커의 성능에 대응하고 제2 고역-통과 필터는 재생 환경의 천장에서의 재생 스피커의 성능에 대응한다. 제1 고역-통과 필터 및 제2 고역-통과 필터는 예를 들어, 저장되거나 수신된 재생 스피커 성능 정보에 적어도 부분적으로 기초하여 제어 시스템에 의해 결정될 수 있다.
도 9에 도시된 예시에서, 블록(915 및 935)에서 LF 오디오 객체를 생성하는 데 사용되는 하나 이상의 필터는 전력 부족에 적어도 부분적으로 기초한다. 일부 이러한 예시에서, 방법(900)은 블록(920 및 922)에서 생성된 고역-통과 필터링된 스피커 공급 신호에 적어도 부분적으로 기초하여 전력 부족을 계산하는 것을 수반할 수 있다. 전력 부족은 적어도 부분적으로, 블록(920 및 922)에서 적용된 고역-통과 필터의 형태 및 고역-통과 필터링된 스피커 공급 신호의 전력에 기초할 수 있다.
이 예시에서, 블록(915)에서 생성된 LF 오디오 객체는 오디오 객체와 연관된 메타데이터 및 재생 스피커 레이아웃(930b)과 대응하는 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 블록(925)에서 스피커 공급 신호로 패닝된다. 이 예시에 따라, 블록(935)에서 생성된 중간-LF 오디오 객체는 오디오 객체와 연관된 메타데이터 및 재생 스피커 레이아웃(930c)에 대응하는 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 블록(940)에서 스피커 공급 신호로 패닝된다.
도 10은 다른 개시된 저음 관리 방법을 도시하는 기능 블록도이다. 도 10에 도시된 블록 중 적어도 일부는 일부 예시에서 도 5a에 도시된 제어 시스템(15)과 같은 제어 시스템에 의해 구현될 수 있다. 이 예시에서, 오디오 객체 및 저주파 효과(LFE) 오디오 신호(1045)를 포함하는 오디오 데이터의 비트스트림(1005)은 비트스트림 파서(1010)에 의해 수신된다. 이 예시에 따라, 비트스트림 파서(1010)는 수신된 오디오 객체를 패너(1015) 및 저역-통과 필터(1035)에 제공하도록 구성된다. 이 예시에서, 비트스트림 파서(1010)는 LFE 오디오 신호(1045)를 합산 블록(1047)에 제공하도록 구성된다.
이 예시에 따라, 패너(1015)에 의해 출력된 스피커 공급 신호(1020)는 복수의 고역-통과 필터(1025)에 제공된다. 고역-통과 필터(1025)의 각각은 일부 구현에서, 재생 환경(1060)의 메인 재생 스피커의 성능과 대응할 수 있다.
이 예시에 따라, 필터 설계 모듈(1030)은 저음 관리로부터 초래하는 계산된 전력 부족에 적어도 부분적으로 기초하여 필터(1035)의 특성을 결정하도록 구성된다. 이 예시에서, 필터 설계 모듈(1030)은 패너(1015)로부터 수신된 이득 정보 및 고역-통과 필터(1025)로부터 수신된 고역-통과 필터 주파수를 포함하는 고역-통과 필터 특성에 적어도 부분적으로 기초하여 저역-통과 필터(1035)의 특성을 결정하도록 구성된다. 일부 구현에서, 필터(1035)는 또한, 중간-LF 오디오 신호를 통과시키도록 구성된 대역 통과 필터와 같은 대역 통과 필터를 포함할 수 있다. 일부 예시에서, 필터(1035)는 또한, 중간-LF 오디오 신호를 생성하기 위해 저역-통과 필터링된 오디오 신호에 대해 동작하도록 구성되는 고역-통과 필터와 같은 고역-통과 필터를 포함할 수 있다. 일부 이러한 구현에 따라, 필터 설계 모듈(1030)은 저음 관리로부터 초래하는 계산된 전력 부족에 적어도 부분적으로 기초하여 대역 통과 필터 및/또는 고역-통과 필터의 특성을 결정하도록 구성될 수 있다.
이 예시에 따라, 필터(1035)로부터 출력된 LF 오디오 객체는 LF 스피커 공급 신호(1042)를 출력하는 패너(1040)에 제공된다. 이 구현에서, 합산 블록(1047)은 LF 스피커 공급 신호(1042) 및 LFE 오디오 신호(1045)를 합산하고, 결과(LF 신호(1049))를 등화 블록(equalization block, 1055)에 제공한다. 이 예시에서, 등화 블록(1055)은 LF 신호(1049)를 등화시키도록 구성되고, 또한 하나 이상의 타입의 이득, 지연 등을 적용하도록 구성될 수 있다. 이 구현에서, 등화 블록(1055)은 결과적인 LF 스피커 공급 신호(1057)를 재생 환경(1060)의 LFC 재생 스피커에 출력하도록 구성된다.
이 예시에 따라, 고역-통과 필터(1025)로부터의 고역-통과 필터링된 오디오 신호(1027)는 등화 블록(1050)에 제공된다. 이 예시에서, 등화 블록(1050)은 고역-통과 필터링된 오디오 신호(1027)를 등화시키도록 구성되고 또한 하나 이상의 타입의 이득, 지연 등을 적용하도록 구성될 수 있다. 여기서, 등화 블록(1050)은 결과적인 고역-통과 필터링된 스피커 공급 신호(1052)를 재생 환경(1060)의 메인 재생 스피커에 출력한다.
일부 대안적인 구현은 LF 오디오 객체를 패닝하는 것을 수반하지 않을 수 있다. 일부 이러한 대안적인 구현은 모든 서브우퍼에 균일하게 저음을 패닝하는 것을 수반할 수 있다. 이러한 구현은 필터링 이전에 오디오 객체 합산이 이루어지는 것을 허용하며, 이를 통해 계산 복잡성이 적어지게 한다. 일부 이러한 예시에서, 저음-관리된 신호는 다음과 같이 표현될 수 있다:
Figure pct00032
수학식 14에서 N은 오디오 객체의 개수를 나타내고, J는 컷오프 주파수의 개수를 나타낸다. 일부 구현에서, 결과적인
Figure pct00033
는 청취 위치에서 지각된 저음 진폭을 보존하는 레벨에서 모든 LFC 재생 스피커 또는 모든 서브우퍼에 동일하게 공급될 수 있다.
도 11은 균일한 저음 구현의 하나의 예시를 도시하는 기능 블록도이다. 블록(1115)은 메인 라우드스피커(이전 예시에서 패너 하이(panner high))를 타겟으로 하는 패너를 나타내고, 각 메인 라우드스피커 신호에 고유하게 적용된 고역-통과 필터가 후속한다. 블록(1130)은 이전의 예시의 저주파 패닝 및 필터링의 기능 블록을 대체한다. 패닝된 저음 처리를 각 고유한 크로스오버 주파수에 대한 간단한 합산으로 대체하는 것은 요구되는 계산을 감소시킨다; 저주파 신호 패닝을 계산할 필요를 제거하는 것에 부가하여, 수학식은 J개의 저역-통과 필터만이 실시간으로 구동되도록 재배열될 수 있다. 패닝된 저음에 대해, JN 필터가 요구되며, 이는 실시간 구현에 대해 수용 가능하지 않을 수 있다. 이 예시는 상대적으로 낮은 크로스오버 주파수 및 LF 공간 정확도에 대해 낮은 요구를 갖는 시스템에 가장 적합하다.
크로스오버 주파수가 약 150Hz를 넘어 증가할 때, 라우드스피커가 멀리 떨어진 서브우퍼에 대해 저음 관리되면, 명백한 음향 이미지에 상당한 시프트가 발생할 수 있다. LFC 재생 스피커 주파수가 샘플링 주파수에 비해 일반적으로 매우 낮기 때문에, 문제는 그 자체가 데시메이션에 잘 적합하다. 목적은 상당한 CPU 부하 없이, 각 오디오 객체가 독립적으로 처리되는 것을 허용하기 위해 필터링 동작의 계산 비용을 감소시키는 것이다.
도 12는 하나의 개시된 저음 관리 방법에 따른 데시메이션의 일 예시를 제공하는 기능 블록도이다. 이 예시에 따라, 패너 및 고역-통과 블록(1205)은 먼저, 오디오 객체 위치 데이터 및 메인 라우드스피커 레이아웃 데이터에 따라 진폭 패너를 적용하고, 그 후 그래프(1210)에 도시된 바와 같이 활성 채널의 각각에 대해 고역-통과 필터를 적용한다. 일부 예시에서, 고역-통과 필터는 버터워스 필터일 수 있다. 이는 수학식 7 및 8을 참조로 상술한 고역-통과 경로에 동일하다.
이 예시에 따라, 데시메이션 블록(1215)은 입력 오디오 객체의 오디오 신호를 데시메이팅하도록 구성된다. 이 예시에서, 데시메이션 블록(1215)은 64x 데시메이션 블록이다. 일부 이러한 예시에서, 데시메이션 블록(1215)은 미리-계산된 반대역 필터(halfband filters)를 사용하는 6-스테이지 1/2 데시메이터일 수 있다. 일부 예시에서, 반대역 필터는 80dB의 저지 대역 제거(stopband rejection)를 가질 수 있다. 다른 예시에서, 데시메이션 블록(1215)은 오디오 데이터를 상이한 정도로 데시메이팅할 수 있거나 및/또는 상이한 타입의 필터 및 관련된 프로세스를 사용할 수 있다.
반대역 필터는 다음의 특성을 가질 수 있다:
1. 대략적으로 계수의 절반은 0이다.
2. 0이 아닌 계수는 대칭적이다(선형 위상, 절반으로 곱한 곱셈).
3. 전환 대역은 샘플링 주파수의 약 1/4에 대해 대칭이며, 이는 각 데시메이션 스테이지 이후에 대역의 상단으로 앨리어싱을 생성한다. 이러한 이유로, 일부 구현은 임의의 잔여 앨리어싱을 제거하기 위해 더욱 긴 최종 필터를 사용한다.
특성 3에 대해, 서브우퍼 공급의 경우, 앨리어싱이 약 300Hz를 초과하여 유지되도록 허용하는 것이 수용 가능할 수 있다. 예를 들어, 하나가, 150Hz의 최대 컷오프 주파수를 정의하는 경우, 서브우퍼 공급은 300Hz에 의해 적어도 -24dB이며, 따라서 이들 주파수를 앨리어싱하는 것은 전역 라우드스피커 공급에 의해 마스킹될(masked) 것으로 간주하는 것이 합리적이다.
48kHz의 샘플링 주파수를 통해, 최종 스테이지에서 유효 샘플링 주파수는 750Hz이며, 이는 375Hz의 나이퀴스트 주파수(Nyquis frequency)로 이끈다. 따라서, 일부 구현에서, 앨리어싱 구성요소가 허용될 수 있는 최소 주파수로서 300Hz를 정의할 수 있다.
이 예시에 따라, LP 필터 모듈(1220)은 LF 오디오 데이터를 생성하기 위한 필터를 설계하고 적용하도록 구성된다. 본원의 다른 곳에서 서술된 바와 같이, LF 오디오 데이터를 생성하기 위해 적용된 필터는 또한, 일부 구현에서 대역 통과 및 고역-통과 필터를 포함할 수 있다. 이 구현에서, LP 필터 모듈(1220)은 데시메이션 블록(1215)으로부터 수신된 데시메이팅된 오디오 데이터뿐만 아니라, (그래프(1225)에 도시된) 저음 전력 부족에 적어도 부분적으로 기초하여 필터를 설계하도록 구성된다. LP 필터 모듈(1220)은 상술한 방법 중 하나 이상에 따라 전력 부족을 결정하도록 구성될 수 있다.
예를 들어, 버터워스 고역-통과 필터의 분석적 크기 스펙트럼을 위의 부족 수학식(수학식 5)과 결합하면, LFC 재생 스피커 공급의 스펙트럼은 다음과 같이 표현될 수 있다:
Figure pct00034
필터
Figure pct00035
는 예를 들어, 유한 임펄스 응답(finite impulse response, FIR) 필터로 설계되고, 64x 데시메이팅된 레이트로 적용될 수 있다.
이 예시에서, LP 필터 모듈(1220)은 또한, 설계된 필터에 의해 생성된 LF 오디오 데이터를 패닝하도록 구성된다. 이 예시에 따라, LP 필터 모듈(1220)에 의해 생성된 LF 스피커 공급 신호는 합산 블록(1230)에 제공된다. 합산 블록(1230)에 의해 생성된 합산된 LF 스피커 공급 신호는 원래 입력 샘플 레이트에서 LF 스피커 공급 신호를 출력하도록 구성된 보간 블록(1235)에 제공된다. 결과적인 LF 스피커 공급 신호(1237)는 재생 환경의 LFC 재생 스피커(1240)에 제공될 수 있다.
이 예시에서, 패너 및 고역-통과 블록(1205)에 의해 생성된 고역-통과 스피커 공급 신호는 합산 블록(1250)에 제공된다. 합산 블록(1250)에 의해 생성된 합산된 고역-통과 스피커 공급 신호(1255)는 재생 환경의 메인 재생 스피커(1260)에 제공된다.
본 개시에서 서술된 구현에 대한 다양한 수정은 통상의 기술자에게 쉽게 명백할 수 있다. 본원에 정의된 일반적인 원리는 본 개시의 사상 또는 범주를 벗어나지 않으면서, 다른 구현에 적용될 수 있다. 따라서, 청구 범위는 본원에 도시된 구현에 제한되는 것으로 의도되지 않고, 본원에 개시된 본 개시, 원리 및 신규한 특징과 일치하는 가장 넓은 범주에 따를 것이다.

Claims (16)

  1. 오디오 처리 방법으로서,
    오디오 데이터를 수신하는 것 - 상기 오디오 데이터는 복수의 오디오 객체를 포함하고, 상기 오디오 객체는 오디오 데이터 및 연관된 메타데이터를 포함하며, 상기 메타데이터는 오디오 객체 위치 데이터를 포함함 -;
    상기 재생 환경에서 하나 이상의 재생 스피커의 표시 및 상기 재생 환경 내에서 상기 하나 이상의 재생 스피커의 위치의 표시를 포함하는 재생 스피커 레이아웃 데이터를 수신하는 것 - 상기 재생 스피커 레이아웃 데이터는 상기 재생 환경의 하나 이상의 저주파 가능(low-frequency-capable, LFC) 재생 스피커에 대응하는 저주파 가능(LFC) 라우드스피커 위치 데이터, 및 상기 재생 환경의 하나 이상의 메인 재생 스피커에 대응하는 메인 라우드스피커 위치 데이터를 포함함 -;
    상기 연관된 메타데이터 및 상기 재생 스피커 레이아웃 데이터에 적어도 부분적으로 기초하여 상기 오디오 객체를 스피커 공급 신호로 렌더링하는 것 - 각 스피커 공급 신호는 재생 환경 내의 하나 이상의 재생 스피커에 대응함 -;
    고역-통과 필터링된 스피커 공급 신호를 생성하기 위해, 상기 스피커 공급 신호 중 적어도 일부에 고역-통과 필터를 적용하는 것;
    저주파(LF) 오디오 객체를 생성하기 위해 복수의 오디오 객체의 각각의 상기 오디오 데이터에 저역-통과 필터를 적용하는 것;
    LFC 스피커 공급 신호를 생성하기 위해, 상기 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 상기 LF 오디오 객체를 패닝하는 것(panning);
    상기 재생 환경의 하나 이상의 LFC 라우드스피커에 상기 LFC 스피커 공급 신호를 출력하는 것; 및
    상기 재생 환경의 하나 이상의 메인 재생 스피커에 상기 고역-통과 필터링된 스피커 공급 신호를 제공하는 것을 포함하는, 방법.
  2. 제1항에 있어서, 상기 복수의 오디오 객체의 각각의 상기 오디오 데이터에 저역-통과 필터의 상기 적용 이전에 또는 그의 일부로서, 상기 오디오 객체 중 하나 이상의 상기 오디오 데이터를 데시메이팅하는(decimating) 것을 더 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 오디오 객체의 상기 오디오 데이터의 신호 레벨을 결정하는 것, 상기 신호 레벨을 임계 신호 레벨에 비교하는 것, 및 상기 오디오 데이터의 상기 신호 레벨이 상기 임계 신호 레벨 이상인 오디오 객체에만 상기 하나 이상의 저역-통과 필터를 적용하는 것을 더 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 이득 및 고역-통과 필터(들) 특성에 적어도 부분적으로 기초하여 전력 부족(power deficit)을 계산하는 것;
    상기 전력 부족에 적어도 부분적으로 기초하여 상기 저역-통과 필터를 결정하는 것을 더 포함하는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 스피커 공급 신호 중 적어도 일부에 고역-통과 필터를 적용하는 것은 두 개 이상의 상이한 고역-통과 필터를 적용하는 것을 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 스피커 공급 신호 중 적어도 일부에 고역-통과 필터를 적용하는 것은 제1 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 제1 복수의 스피커 공급 신호에 제1 고역-통과 필터를 적용하는 것, 및 제2 고역-통과 필터링된 스피커 공급 신호를 생성하기 위해 제2 복수의 스피커 공급 신호에 제2 고역-통과 필터를 적용하는 것을 포함하고, 상기 제1 고역-통과 필터는 상기 제2 고역-통과 필터보다 더욱 낮은 주파수 범위를 통과시키도록 구성되는, 방법.
  7. 제6항에 있어서, 메인 재생 스피커의 제1 세트에 대한 제1 재생 스피커 성능 정보를 수신하는 것, 및 메인 재생 스피커의 제2 세트에 대한 제2 재생 스피커 성능 정보를 수신하는 것 -
    상기 제1 고역-통과 필터는 상기 제1 재생 스피커 성능 정보에 대응하고;
    상기 제2 고역-통과 필터는 상기 제2 재생 스피커 성능 정보에 대응함 -을 더 포함하고;
    상기 고역-통과 필터링된 스피커 공급 신호를 상기 하나 이상의 메인 재생 스피커에 제공하는 것은 상기 제1 고역-통과 필터링된 스피커 공급 신호를 상기 메인 재생 스피커의 제1 세트에 제공하는 것, 및 상기 제2 고역-통과 필터링된 스피커 공급 신호를 상기 메인 재생 스피커의 제2 세트에 제공하는 것을 포함하는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 메타데이터는 상기 오디오 객체의 특정한 오디오 객체에 대응하는 스피커 공급 신호에 고역-통과 필터를 적용하는지의 표시를 포함하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 LF 오디오 객체를 생성하는 것은 두 개 이상의 상이한 필터를 적용하는 것을 포함하는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 LF 오디오 객체를 생성하는 것은:
    제1 LF 오디오 객체를 생성하기 위해 상기 오디오 객체 중 적어도 일부에 저역-통과 필터를 적용하는 것 - 상기 저역-통과 필터는 제1 주파수 범위를 통과시키도록 구성됨 -; 및
    제2 LF 오디오 객체를 생성하기 위해 상기 제1 LF 오디오 객체에 고역-통과 필터를 적용하는 것 - 상기 고역-통과 필터는 중간-LF 주파수 범위인 제2 주파수 범위를 통과시키도록 구성됨 -을 포함하고, LFC 스피커 공급 신호를 생성하기 위해 상기 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 상기 LF 오디오 객체를 패닝하는 것은:
    상기 제1 LF 오디오 객체를 패닝함으로써 제1 LFC 스피커 공급 신호를 생성하는 것; 및
    상기 제2 LF 오디오 객체를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 포함하는, 방법.
  11. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 LF 오디오 객체를 생성하는 것은:
    제1 LF 오디오 객체를 생성하기 위해 제1 복수의 오디오 객체에 저역-통과 필터를 적용하는 것 - 상기 저역-통과 필터는 제1 주파수 범위를 통과시키도록 구성됨 -; 및
    제2 LF 오디오 객체를 생성하기 위해 제2 복수의 오디오 객체에 대역 통과 필터를 적용하는 것 - 상기 대역 통과 필터는 중간-LF 주파수 범위인 제2 주파수 범위를 통과시키도록 구성됨 -을 포함하고, LFC 스피커 공급 신호를 생성하기 위해 상기 LFC 라우드스피커 위치 데이터에 적어도 부분적으로 기초하여 상기 LF 오디오 객체를 패닝하는 것은:
    상기 제1 LF 오디오 객체를 패닝함으로써 제1 LFC 스피커 공급 신호를 생성하는 것; 및
    상기 제2 LF 오디오 객체를 패닝함으로써 제2 LFC 스피커 공급 신호를 생성하는 것을 포함하는, 방법.
  12. 제10항 또는 제11항에 있어서, 상기 LFC 라우드스피커 위치 데이터를 수신하는 것은 상기 제2 주파수 범위에서 오디오 데이터를 재생할 수 있는 복수의 비-서브우퍼 재생 스피커의 각각의 위치를 나타내는 비-서브우퍼 위치 데이터를 수신하는 것을 포함하고, 상기 제2 LFC 스피커 공급 신호를 생성하는 것은 비-서브우퍼 스피커 공급 신호를 생성하기 위해 상기 비-서브우퍼 위치 데이터에 적어도 부분적으로 기초하여 상기 제2 LF 오디오 객체 중 적어도 일부를 패닝하는 것을 포함하고, 상기 재생 환경의 상기 복수의 비-서브우퍼 재생 스피커 중 하나 이상에 상기 비-서브우퍼 스피커 공급 신호를 제공하는 것을 더 포함하는, 방법.
  13. 제10항 또는 제11항에 있어서, 상기 LFC 라우드스피커 위치 데이터를 수신하는 것은 상기 제2 주파수 범위에서 오디오 데이터를 재생할 수 있는 복수의 중간-서브우퍼 재생 스피커의 각각의 위치를 나타내는 중간-서브우퍼 위치 데이터를 수신하는 것을 포함하고, 상기 제2 LFC 스피커 공급 신호를 생성하는 것은 중간-서브우퍼 스피커 공급 신호를 생성하기 위해 상기 중간-서브우퍼 위치 데이터에 적어도 부분적으로 기초하여 상기 제2 LF 오디오 객체 중 적어도 일부를 패닝하는 것을 포함하고, 상기 재생 환경의 상기 복수의 중간-서브우퍼 재생 스피커 중 하나 이상에 상기 중간-서브우퍼 스피커 공급 신호를 제공하는 것을 더 포함하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 재생 스피커 레이아웃 데이터는 상기 재생 환경 내의 재생 스피커의 하나 이상의 그룹의 위치의 표시를 포함하는, 방법.
  15. 제1항 내지 제14항 중 어느 한 항의 방법을 수행하도록 구성된 제어 시스템 및 인터페이스 시스템을 포함하는, 장치.
  16. 그에 저장된 소프트웨어를 갖는 하나 이상의 비-일시적인 매체로서, 상기 소프트웨어는 제1항 내지 제14항 중 어느 한 항의 방법을 수행하기 위해 하나 이상의 디바이스를 제어하는 명령어를 포함하는, 하나 이상의 비-일시적인 매체.
KR1020207025978A 2018-10-16 2019-10-16 저음 관리를 위한 방법 및 디바이스 KR20210070948A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862746468P 2018-10-16 2018-10-16
US62/746,468 2018-10-16
PCT/US2019/056523 WO2020081674A1 (en) 2018-10-16 2019-10-16 Methods and devices for bass management

Publications (1)

Publication Number Publication Date
KR20210070948A true KR20210070948A (ko) 2021-06-15

Family

ID=68426896

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207025978A KR20210070948A (ko) 2018-10-16 2019-10-16 저음 관리를 위한 방법 및 디바이스

Country Status (7)

Country Link
US (1) US11477601B2 (ko)
EP (1) EP3868129B1 (ko)
JP (1) JP7413267B2 (ko)
KR (1) KR20210070948A (ko)
CN (1) CN111869239B (ko)
BR (1) BR112020017095B1 (ko)
WO (1) WO2020081674A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11800309B2 (en) 2019-06-20 2023-10-24 Dirac Research Ab Bass management in audio systems
JPWO2022054602A1 (ko) * 2020-09-09 2022-03-17
US11653149B1 (en) * 2021-09-14 2023-05-16 Christopher Lance Diaz Symmetrical cuboctahedral speaker array to create a surround sound environment

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55123746A (en) 1979-03-19 1980-09-24 Nec Corp Diagnostic system of logic unit
US20040086130A1 (en) * 2002-05-03 2004-05-06 Eid Bradley F. Multi-channel sound processing systems
JP3876850B2 (ja) * 2003-06-02 2007-02-07 ヤマハ株式会社 アレースピーカーシステム
DE10355146A1 (de) * 2003-11-26 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Tieftonkanals
JP2005223713A (ja) * 2004-02-06 2005-08-18 Sony Corp 音響再生装置、音響再生方法
US8238576B2 (en) 2005-06-30 2012-08-07 Cirrus Logic, Inc. Level dependent bass management
WO2007106872A2 (en) 2006-03-14 2007-09-20 Harman International Industries, Incorporated Wide-band equalization system
US9319789B1 (en) 2008-02-26 2016-04-19 Tc Group A/S Bass enhancement
JP5565044B2 (ja) * 2010-03-31 2014-08-06 ヤマハ株式会社 スピーカ装置
US9055367B2 (en) 2011-04-08 2015-06-09 Qualcomm Incorporated Integrated psychoacoustic bass enhancement (PBE) for improved audio
TW202339510A (zh) 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
AU2012279349B2 (en) 2011-07-01 2016-02-18 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
WO2013076223A1 (en) 2011-11-22 2013-05-30 Actiwave Ab System and method for bass enhancement
US9516406B2 (en) 2011-12-20 2016-12-06 Nokia Technologies Oy Portable device with enhanced bass response
PL2798737T3 (pl) 2011-12-27 2019-05-31 Dts Inc System wzbogacania niskich tonów
WO2013141768A1 (en) 2012-03-22 2013-09-26 Dirac Research Ab Audio precompensation controller design using a variable set of support loudspeakers
CN102724605A (zh) 2012-06-29 2012-10-10 惠州天缘电子有限公司 虚拟低音增强处理方法
WO2014036085A1 (en) 2012-08-31 2014-03-06 Dolby Laboratories Licensing Corporation Reflected sound rendering for object-based audio
CN103517183B (zh) 2012-10-09 2017-02-01 Tcl集团股份有限公司 一种低音信号增强的方法及装置
WO2014184353A1 (en) 2013-05-16 2014-11-20 Koninklijke Philips N.V. An audio processing apparatus and method therefor
US9723425B2 (en) 2013-06-18 2017-08-01 Dolby Laboratories Licensing Corporation Bass management for audio rendering
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
JP6155132B2 (ja) 2013-08-01 2017-06-28 クラリオン株式会社 低域補完装置および低域補完方法
CN108141692B (zh) 2015-08-14 2020-09-29 Dts(英属维尔京群岛)有限公司 用于基于对象的音频的低音管理系统和方法

Also Published As

Publication number Publication date
US20210345060A1 (en) 2021-11-04
EP3868129A1 (en) 2021-08-25
JP2022502872A (ja) 2022-01-11
WO2020081674A1 (en) 2020-04-23
RU2020130069A3 (ko) 2022-03-14
BR112020017095B1 (pt) 2024-02-27
CN111869239B (zh) 2021-10-08
EP3868129B1 (en) 2023-10-11
CN111869239A (zh) 2020-10-30
BR112020017095A2 (pt) 2021-05-11
US11477601B2 (en) 2022-10-18
JP7413267B2 (ja) 2024-01-15
RU2020130069A (ru) 2022-03-14

Similar Documents

Publication Publication Date Title
KR102395351B1 (ko) 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱
CN107889033B (zh) 用于波束形成扬声器阵列的空间音频呈现
KR102332632B1 (ko) 임의적 라우드스피커 배치들로의 겉보기 크기를 갖는 오디오 오브젝트들의 렌더링
JP6820613B2 (ja) 没入型オーディオ再生のための信号合成
KR20140132741A (ko) 머리 전달 함수들의 선형 믹싱에 의한 머리 전달 함수 생성을 위한 방법 및 시스템
JP2014523165A (ja) スピーカー・アレイの等化
JP7413267B2 (ja) 低音マネジメントのための方法及び装置
JP5816072B2 (ja) バーチャルサラウンドレンダリングのためのスピーカアレイ
JP6467561B1 (ja) 適応的な量子化
WO2019156891A1 (en) Virtual localization of sound
WO2019156888A1 (en) Method for dynamic sound equalization
KR101683385B1 (ko) 360°실사 vr체험공간에 적용될 입체음향 레코딩 및 재생 방법
RU2771954C2 (ru) Способы и устройства для управления низкими звуковыми частотами
CN107534813B (zh) 再现多信道音频信号的装置和产生多信道音频信号的方法
CN111971978B (zh) 用于在多通道音频再现系统中应用基于时间的效果的方法和系统
RU2803638C2 (ru) Обработка пространственно диффузных или больших звуковых объектов
Mckenzie Towards a perceptually optimal bias factor for directional bias equalisation of binaural ambisonic rendering

Legal Events

Date Code Title Description
E902 Notification of reason for refusal