KR102091460B1

KR102091460B1 - 음장 데이터를 처리하는 장치 및 방법

Info

Publication number: KR102091460B1
Application number: KR1020187022761A
Authority: KR
Inventors: 판지 세티아완; 웬위 진
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2016-01-27
Filing date: 2016-01-27
Publication date: 2020-03-20
Also published as: EP3398356B1; US20180376272A1; US10433093B2; KR20180101475A; WO2017129236A1; JP6710768B2; JP2019507542A; CN108476373A; EP3398356A1; CN108476373B

Abstract

본 발명은 음장 데이터를 처리하는 장치에 관한 것이며 상기 음장 데이터는 적어도 하나의 밝은 영역 및 적어도 하나의 조용한 영역을 포함하는 공간 재생 영역 내의 음장을 정의한다. 상기 음장 데이터를 처리하는 장치는 상기 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 적용하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하도록 구성되어 있는 애플리케이터를 포함하며, 상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역 및/또는 조용한 영역 중 적어도 하나에서 음장을 강화하도록 구성되어 있다.

Description

음장 데이터를 처리하는 장치 및 방법

일반적으로, 본 발명은 오디오 신호 처리 및 재생 분야에 관한 것이다. 구체적으로, 본 발명은 음장 데이터를 처리 및 재생하는 장치 및 방법에 관한 것이다.

확장된 공간 영역에 걸친 공간 멀티존 음장 재생은 동시 카 엔터테인먼트 시스템, 전시 센터의 서라운드 사운드 시스템, 공유 사무실 공간 내의 개인 라우드 스피커 시스템 및 시끄러운 환경에서의 조용한 영역과 같은 그 다양한 응용 프로그램으로 인해 최근 주목을 받아왔으며, 음향 장벽이나 헤드폰을 사용하지 않고도 청취자에게 개별 사운드 환경을 제공하는 것이 목표다. 일반적으로, 음장은 주변 압력, 즉 압력 변화로부터 생기는 국부 기압의 편차를, 예를 들어 복수의 라우드스피커에 의해 방출된 음향 신호에 의해 야기된 공간 및 시간의 함수로서 설명하는 것으로 간주될 수 있다. 멀티존 음장은 일반적으로 하나 이상의 음향적으로 밝은 영역과 가능한 여러 개의 음향적으로 조용한 영역으로 구성될 수 있다.

멀티존 사운드 재생의 소위 "비 견고성" 문제는 Poletti, M., "2D 멀티존 서라운드 사운드 시스템에 대한 조사", Proc. AES 제125회 협약 오디오 공학회 사회, 2008에 따르면 음향적으로 밝은 영역의 음향보다 훨씬 진폭이 큰 두 개의 선택된 영역 간에 매우 명백한 여분의 사운드 형태로 확인되었다. 실제로, 멀티존 음장에서의 이러한 행동은 이러한 영역 내에서 불쾌한 사용자 경험을 초래할 수 있다.

따라서, 음장 데이터 어드레싱, 특히 전술한 "비 견고성" 문제를 처리하기 위한 개선된 장치 및 방법이 필요하다.

본 발명의 목적은 음장 데이터 어드레싱, 알려진 장치 방법에 고유한 전술한 "비 견고성" 문제를 처리하기 위한 개선된 장치 및 방법을 제공하는 것이다.

전술한 목적 및 다른 목적은 독립 청구항의 요지에 의해 달성된다. 추가의 실시 형태는 종속 청구항, 상세한 설명 및 도면으로부터 자명하다.

제1 관점에 따라, 본 발명은 음장 데이터를 처리하는 장치에 관한 것이며, 상기 음장 데이터는 적어도 하나의 밝은 영역 및 적어도 하나의 조용한 영역을 포함하는 공간 재생 영역 내의 음장을 정의한다. 상기 음장 데이터를 처리하는 장치는: 상기 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 적용하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하도록 구성되어 있는 애플리케이터를 포함하며, 상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역 및/또는 조용한 영역에서 음장을 강화하도록 구성되어 있다.

공간적으로 연속하여, 즉 완만하게 가변하는 가중 함수를 음장을 정의하는 음장 데이터에 적용하는 것은 밝은 영역 및/또는 조용한 영역에서 음장을 향상시킴으로써 공지의 장치를 방해하는 "비 견고성 문제"를 해결할 수 있다.

용어 "음장 데이터"는 본 명세서에서 사운드의 지향성 특성과 관련된 정보를 포함하는 임의의 데이터를 지칭하는 데 사용된다. 음장 데이터는 다양한 다른 포맷으로 표현될 수 있는데, 각각의 포맷은 정의된 수의 오디오 채널을 가지고, 표현된 사운드를 재생하기 위해 다른 해석을 요구한다. 이러한 포맷의 예로는 스테레오, 5.1 서라운드 사운드 및 고차 앰비소닉(Higher Order Ambisonic, HOA) 포맷, 특히 HOA B-포맷과 같은 포맷을 들 수 있다.

음장 데이터에 의해 정의된 음장의 공간 재생 영역은 복수의 다른 형상을 가질 수 있다. 구현 형태에서, 음장은 공간 재생 영역, 밝은 영역 및 조용한 영역이 2차원 평면에 놓인 3차원 또는 2차원일 수 있다. 구현 형태에서 밝은 영역과 조용한 영역은 구형, 원통형 또는 원형을 가질 수 있다. 다른 형상도 가능하다.

제1 관점에 따른 장치의 제1 가능한 실시 형태에서, 장치는 가중된 음장과 연관된 성능 측정값에 기초해서 음장 데이터를 압축하도록 구성되어 있는 압축기를 더 포함한다.

이것은 압축기에 의해 적용된 압축률을 성능 측정값에 적응시키는 것을 허용하고, 따라서 가중된 음장 데이터의 크기를 감소시킨다. 이것은 가중된 음장 데이터의 송신 또는 저장을 위한 압축이, 가중된 음장 데이터를 재생을 위해 압축된 가중 음장 데이터의 압축해제와 시간 및/또는 공간에서 분리되는 구현 형태에서 특히 이롭다.

제1 관점의 제1 실시 형태에 따른 장치의 제2 가능한 실시 형태에서, 압축기는 가중된 음장과 연관된 성능 측정값이 미리 정의된 성능 측정 임계값과 다른 경우에 음장 데이터를 압축하도록 구성되어 있다.

예를 들어 라이브 청취자를 사용하는 측정을 기반으로 미리 정의된 성능 측정 임계값을 사용하면 그 압축기가 압축률을 조정할 시기를 효율적으로 결정할 수 있다.

제1 관점의 제1 또는 제2 실시 형태에 따른 장치의 제3 가능한 실시 형태에서, 가중된 음장과 연관된 성능 측정값은 가중된 음장의 적어도 하나의 밝은 영역과 적어도 하나의 조용한 영역 사이의 음향 대조이다.

제1 관점의 제3 실시 형태에 따른 장치의 제4 가능한 실시 형태에서, 밝은 영역과 조용한 영역 사이의 음향 대조는 밝은 영역에서의 가중된 음장의 평균과 조용한 영역(101b)에서의 가중된 음장의 평균 사이의 비율에 기초한다.

제1 관점의 제4 실시 형태에 따른 장치의 제5 가능한 실시 형태에서, 밝은 영역(101a)과 조용한 영역(101b) 사이의 음향 대조는 다음 식:

에 기초하며, 여기서

는 음향 대조를 시간의 함수로서 나타내고,

는 음장을 정의하는 음장 데이터를 공간 및 시간의 함수로서 나타내고,

는 공간적으로 연속하여 가변하는 가중 함수를 나타내며,

및

는 밝은 영역(101a)의 크기와 조용한 영역(101b)의 크기를 각각 나타낸다.

제1 관점 또는 제1 관점의 제1 내지 제5 실시 형태 중 어느 하나에 따른 장치의 제6 가능한 실시 형태에서, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역 및 조용한 영역 외측의 공간 재생 영역의 일부에 상대적으로, 밝은 영역 및 조용한 영역에서의 음장 데이터와 연관된 음장을 강화하도록 구성되는, 완만하게 변화하는 함수이다.

제1 관점 또는 제1 관점의 제1 내지 제6 실시 형태 중 어느 하나에 따른 장치의 제7 가능한 실시 형태에서, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역의 중앙을 중심으로 하는 제1 정규 분포 및 조용한 영역의 중앙을 중심으로 하는 제2 정규 분포의 선형 조합이다.

정규 분포는 밝은 영역 및 조용한 영역의 중앙과 관련해서 청취자 머리의 무작위 이동에 대한 양호한 근사치를 각각 제공한다.

실시 형태에서, 공간적으로 연속하여 가변하는 가중 함수는 다음의 식에 의해 정의될 수 있다:

여기서

는 공간적으로 연속하여 가변하는 가중 함수를 나타내고,

는 밝은 영역의 중심을 나타내고,

는 조용한 영역의 중심을 나타내며,

및

는 미리 정의된 가중 함수 파라미터를 나타낸다.

제1 관점 또는 제1 관점의 제1 내지 제7 실시 형태 중 어느 하나에 따른 장치의 제8 가능한 실시 형태에서, 음장 데이터는 HOA B-Format으로 인코딩된다.

제1 관점 또는 제1 관점의 제1 내지 제8 실시 형태 중 어느 하나에 따른 장치의 제9 가능한 실시 형태에서, 장치는 공간적으로 연속하여 가변하는 가중 함수에 의해 가중될 음장을 저장하도록 구성된 메모리를 더 포함한다. 이것은 인코더 측 상에서 또는 디코더 측 상에서 행해질 수 있다.

제1 관점 또는 제1 관점의 제1 내지 제9 실시 형태 중 어느 하나에 따른 장치의 제10 가능한 실시 형태에서, 장치는 렌더러, 특히 가중된 음장 데이터에 기초해서 가중된 음장을 렌더링하도록 구성되어 있는 적어도 하나의 라우드스피커를 더 포함한다.

제2 관점에 따라, 본 발명은 음장 재생 시스템에 관한 것이며, 음장 재생 시스템은 제1 관점 및 제1 관점의 제1 내지 제10 실시 형태 중 어느 하나에 따른 음장 데이터를 처리하는 장치를 포함하며, 상기 음장 재생 시스템은 음장 데이터를 처리하는 장치로부터 가중된 음장 데이터를 수신하도록 구성되어 있는 음장 재생 장치; 및 렌더러(113), 특히 상기 가중된 음장 데이터에 기초해서 가중된 음장을 렌더링하도록 구성되어 있는 적어도 하나의 라우드스피커를 포함한다.

제2 관점에 따른 음장 재생 시스템의 제1 가능한 실시 형태에서, 음장 재생 장치는 가중된 음장에 기초해서 성능 측정값을 결정하고 상기 가중된 음장과 연관된 상기 결정된 성능 측정값을 상기 음장 데이터를 처리하는 장치의 압축기에 피드백하도록 구성되어 있는 성능 측정 결정기를 더 포함한다.

제3 관점에 따라, 본 발명은 음장 데이터를 처리하는 방법에 관한 것이며, 상기 음장 데이터는 적어도 하나의 밝은 영역 및 적어도 하나의 조용한 영역을 포함하는 공간 재생 영역 내의 음장을 정의한다. 상기 음장 데이터를 처리하는 방법은 상기 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 적용하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하는 단계를 포함하며, 상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역 및/또는 조용한 영역에서 음장을 강화하도록 구성되어 있다.

제3 관점에 따른 방법의 제1 가능한 실시 형태에서, 상기 방법은 가중된 음장과 연관된 성능 측정값에 기초해서 음장 데이터를 압축하는 단계를 더 포함한다.

제2 관점의 제1 실시 형태에 따른 방법의 제2 가능한 실시 형태에서, 가중된 음장과 연관된 성능 측정값이 미리 정의된 성능 측정 임계값과 다른 경우에 음장 데이터를 압축한다.

제2 관점의 제1 또는 제2 실시 형태에 따른 방법의 제3 가능한 실시 형태에서, 가중된 음장과 연관된 성능 측정값은 가중된 음장의 적어도 하나의 밝은 영역과 적어도 하나의 조용한 영역 사이의 음향 대조이다.

제2 관점의 제3 실시 형태에 따른 방법의 제4 가능한 실시 형태에서, 밝은 영역과 조용한 영역 사이의 음향 대조는 밝은 영역에서의 가중된 음장의 평균과 조용한 영역(101b)에서의 가중된 음장의 평균 사이의 비율에 기초한다.

제2 관점의 제4 실시 형태에 따른 방법의 제5 가능한 실시 형태에서, 밝은 영역(101a)과 조용한 영역(101b) 사이의 음향 대조는 다음 식:

에 기초하며, 여기서

는 음향 대조를 시간의 함수로서 나타내고,

는 공간적으로 연속하여 가변하는 가중 함수를 나타내며,

및

제2 관점 또는 제2 관점의 제1 내지 제5 실시 형태 중 어느 하나에 따른 방법의 제6 가능한 실시 형태에서, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역 및 조용한 영역 외측의 공간 재생 영역의 일부에 상대적으로, 밝은 영역 및 조용한 영역에서의 음장 데이터와 연관된 음장을 강화하도록 구성되는, 완만하게 변화하는 함수이다.

제2 관점 또는 제2 관점의 제1 내지 제6 실시 형태 중 어느 하나에 따른 방법의 제7 가능한 실시 형태에서, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역의 중앙을 중심으로 하는 제1 정규 분포 및 조용한 영역의 중앙을 중심으로 하는 제2 정규 분포의 선형 조합이다.

여기서

는 공간적으로 연속하여 가변하는 가중 함수를 나타내고,

는 밝은 영역의 중심을 나타내고,

는 조용한 영역의 중심을 나타내며,

및

는 미리 정의된 가중 함수 파라미터를 나타낸다.

제2 관점 또는 제2 관점의 제1 내지 제7 실시 형태 중 어느 하나에 따른 방법의 제8 가능한 실시 형태에서, 음장 데이터는 HOA B-Format으로 인코딩된다.

제2 관점 또는 제2 관점의 제1 내지 제8 실시 형태 중 어느 하나에 따른 방법의 제9 가능한 실시 형태에서, 방법은 공간적으로 연속하여 가변하는 가중 함수에 의해 가중될 음장을 메모리에 저장하는 단계를 더 포함한다.

제2 관점 또는 제2 관점의 제1 내지 제9 실시 형태 중 어느 하나에 따른 방법의 제10 가능한 실시 형태에서, 방법은 가중된 음장 데이터에 기초해서 가중된 음장을 렌더링하는 단계를 더 포함한다.

제4 관점에 따라, 본 발명은 컴퓨터 상에서 실행될 때 본 발명의 제3 관점에 따른 방법 또는 그 실시 형태 중 임의의 실시 형태에 따른 방법을 수행하는 프로그램 코드를 포함하는 컴퓨터 프로그램에 관한 것이다.

본 발명은 하드웨어 및/또는 소프트웨어로 실현될 수 있다.

본 발명의 추가의 실시는 이하의 도면을 참조해서 설명할 것이다.
도 1은 실시예에 따라 음장을 처리하는 장치에 대한 개략도이다.
도 2는 실시예에 따라 음장 데이터를 처리하는 방법에 대한 개략도이다.
도 3은 실시예에 따라 음장 데이터를 처리하는 장치를 포함하는 실시예에 따른 음장 재생 시스템의 개략도이다.
도 4는 도 3에 도시된 음장 재생 시스템에서 실시될 수 있는 복수의 서로 다른 압축 기술에 대한 전송 비트레이트의 함수로서 평균 음향 대조 성능의 의존성을 도시한다.
도 5는 실시예에 따른 음장 데이터를 처리하는 장치에 대한 개략도이다.
도 6은 본 발명의 실시예에 서로 다른 관점을 도시하는 개략도이다.
도 7은 본 발명의 실시예에 서로 다른 관점을 도시하는 개략도이다.
다양한 도면에서, 동일한 도면부호는 동일하거나 또는 적어도 기능적으로 등가의 특징을 위해 사용된다

이하의 설명에서는 본 개시의 일부이면서 본 발명이 위치할 수 있는 특정 관점이 예시로서 도시되어 있는 첨부 도면을 참조한다. 다른 관점이 활용될 수 있고 구조적 또는 논리적 변화가 본 발명의 범위를 벗어남이 없이 이루어질 수 있음도 이해해야 한다. 그러므로 본 발명의 범위는 첨부된 청구범위로 정의되므로 이하의 상세한 설명은 제한적인 의미로 받아들여서는 안 된다..

예를 들어, 설명된 방법과 관련된 개시 역시 방법을 수행하도록 구성된 대응하는 장치 및 시스템에 유효할 수도 있고 그 반대도 마찬가지이다. 예를 들어, 특정한 방법 단계가 설명되면, 대응하는 장치는 설명된 방법 단계를 수행할 유닛을, 그러한 유닛이 명시적으로 설명되지 않거나 도면에 도시되어 있지 않아도, 포함할 수 있다. 또한, 본 명세서에 설명된 다양한 예시적 관점의 특징은 구체적으로 달리 설명되지 않는 한 서로 결합될 수 있음을 이해해야 한다.

도 1은 실시예에 따라 음장을 처리하는 장치에 대한 개략도이다. 도 1의 우측에 개략적으로 나타난 바와 같이, 음장 데이터는 적어도 하나의 밝은 영역(101a) 및 적어도 하나의 조용한 영역(101b)을 포함하는 공간 재생 영역(101) 내의 음장을 정의한다.

장치(100)는 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 적용하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하도록 구성되어 있는 애플리케이터(103)를 포함한다. 상기 공간적으로 연속하여 가변하는 가중 함수는 공간 재생 영역(101)의 밝은 영역(101a) 및/또는 조용한 영역(101b)에서 음장을 강화하도록 구성되어 있다.

실시예에서, 장치(100)는 가중된 음장과 연관된 성능 측정값에 기초해서 음장 데이터를 압축하도록 구성되어 있는 압축기(105)를 더 포함한다.

실시예에서, 압축기(105)는 가중된 음장과 연관된 성능 측정값이 미리 정의된 성능 측정 임계값과 다른 경우에 음장 데이터를 압축하도록 구성되어 있다.

실시예에서, 가중된 음장과 연관된 성능 측정값은 가중된 음장의 적어도 하나의 밝은 영역(101a)과 적어도 하나의 조용한 영역(101b) 사이의 음향 대조(acoustical contrast)이다.

실시예에서, 밝은 영역(101a)과 조용한 영역(101b) 사이의 음향 대조는 밝은 영역(101a)에서의 가중된 음장의 평균과 조용한 영역(101b)에서의 가중된 음장의 평균 사이의 비율에 기초한다.

실시예에서, 밝은 영역(101a)과 조용한 영역(101b) 사이의 음향 대조는 다음 식:

(1)

에 기초하며, 여기서

는 음향 대조를 시간의 함수로서 나타내고,

는 공간적으로 연속하여 가변하는 가중 함수를 나타내며,

및

실시예에서, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역(101a) 및 조용한 영역(101b) 외측의 공간 재생 영역(101)의 일부에 상대적으로, 밝은 영역(101a) 및 조용한 영역(101b)에서의 음장 데이터와 연관된 음장을 강화하도록 구성되는, 완만하게 변화하는 함수이다.

실시예에서, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역(101a)의 중앙을 중심으로 하는 제1 정규 분포 및 조용한 영역(101b)의 중앙을 중심으로 하는 제2 정규 분포의 선형 조합이다. 공간적으로 연속하여 가변하는 가중 함수의 이러한 바람직한 선택은, 실제로, 청취자의 머리(귀)의 위치가 청취자의 신체가 움직임으로 인해 밝은 영역 및/또는 조용한 영역 내에서 정지하는 것이 보장되지 않는다는 발견에 기초한다. 오히려 청취자의 머리 위치 분포는 각각 밝은 영역과 조용한 영역의 중심까지의 그 거리에 대한 가우시안 분포 함수로 모델링될 수 있다. 따라서, 일 실시예에서, 공간적으로 연속하여 가변하는 가중 함수는 다음의 식에 의해 정의될 수 있다:

(2)

여기서

는 공간적으로 연속하여 가변하는 가중 함수를 나타내고,

는 밝은 영역의 중심을 나타내고,

는 조용한 영역의 중심을 나타내며,

및

는 미리 정의된 가중 함수 파라미터를 나타낸다.

위의 가중 함수에 대한 바람직한 선택에 따라, 청취자의 머리가 밝은 영역의 중앙(또는 동일하게 조용한 영역의 중심)으로부터 반경 r/2의 원 내에 위치할 확률은 68.3%이다. 이러한 가중 함수의 선택에 따라, 시스템은 완만하고 연속하여 가변하는 가중치 함수의 도입으로 인해 보다 유연하고 효율적인 방식으로 다른 영역에 대한 재생 정확도의 중요성을 분배할 것이다. 청취자의 귀가 더 많이 나타날 가능성이 있는 지역(예를 들어, 밝고 조용한 지역의 중앙 지역)에 강조가 더 이루어지는 반면, 일부 지역(예를 들어, 밝고 조용한 가장자리 영역)에서는 재생성 노력이 산만해질 수 있으므로, 밝은 영역 및 조용한 영역 외부의 의사 사운드의 발생을 완화한다.

도 2는 실시예에 따라 음장 데이터, 예를 들어, 음향적으로 밝은 영역(101a) 및 음향적으로 조용한 영역(101b)을 포함하는 도 1에 도시된 공간 재생 영역(101)에서 음장을 정의하는 음장 데이터를 처리하는 방법(299)에 대한 개략도이다.

방법(200)은 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수, 예를 들어, 전술한 식(2)에서 정의된 공간적으로 연속하여 가변하는 가중 함수를 적용하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하는 단계(201)를 포함하며, 상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역(101a) 및/또는 조용한 영역(101b)에서 음장을 강화하도록 구성되어 있다.

음장 데이터를 처리하는 장치(100) 및 음장 데이터를 처리하는 방법(200)의 추가의 실시 형태, 실시예 및 관점에 대해 이하에 설명한다.

도 3은 실시예에 따라 음장 데이터를 처리하는 장치(100)를 포함하는 실시예에 따른 음장 재생 시스템(300)의 개략도이다.

도 3에 도시된 음장 데이터를 처리하는 장치(100)의 실시예에서, 도 1에 도시된 애플리케이터(103)는 "멀티존 HOA 포맷 컨버터(Multizone HOA format converter)"(103)라 칭하고 도 1에 도시된 압축기(105)는 "압축"이라 칭한다. 애플리케이터(103) 및 압축기(105) 외에, 도 3에 도시된 음장 데이터를 처리하는 장치(100)의 실시예는 원래의, 즉 가중되지 않은 음장 데이터를 획득하도록 구성되어 있는 획득 장치(107)를 포함한다. 실시예에서, 획득 장치(107)는 32-채널 아이젠마이크(32-channel Eigenmike)와 같이, 하나 이상의 마이크로폰을 포함할 수 있다. 실시예에서, 획득 장치(107)는 다른 장치로부터 원래의, 즉 가중되지 않은 음장 데이터를 수신하도록 구성된 통신 인터페이스일 수 있다.

실시예에서, 획득 장치(107)는 HOA B-포맷의 원래의, 즉 가중되지 않은 음장 데이터를 HOA 포맷 컨버터(109)로 제공하도록 구성되어 있으며, HOA 포맷 컨버터(109)는 HOA B-포맷 음장 데이터를 구형/원형 고조파 도메인으로 평면파 분해(plane wave decomposition)하여 음장 데이터

를 생성하도록 구성되어 있으며, 여기서

는 위치 벡터를 나타내고

는 파수를 나타내거나 등가적으로 음장 데이터

를 나타내며, 여기서

는 시간을 나타낸다.

도 3에 도시된 음장 데이터를 처리하는 장치(100)의 HOA 포맷 컨버터(109)는 음장 데이터

(또는 등가적으로

)를 애플리케이터(103)에 제공하도록 구성되어 있으며, 애플리케이터(103)는 이미 전술한 바와 같이 도 8에 도시된 실시예에서 "멀티존 HOA 포맷 컨버터(Multizone HOA format converter)"(103)로 지칭된다. 도 1에 도시된 실시예의 문맥에서 이미 설명된 바와 같이, 애플리케이터(103)는 HOA 포맷 컨버터(109)에 의해 제공되는 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 제공하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하도록 구성되어 있다. 애플리케이터(103)에 의해 사용되는 공간적으로 연속하여 가변하는 가중 함수는 공간 재생 영역(101)의 밝은 영역(101a) 및 조용한 영역(101b)에서 음장을 강화하도록 구성되어 있다. 실시예에서, 애플리케이터(103)는 가중된 음장 데이터를 HOA-B 포맷 가중된 음장 데이터를 제공하도록 구성되어 있다. 도 3에 개략적으로 도시된 바와 같이, HOA-B 포맷으로의 이러한 변환을 수행할 수 있도록 하기 위해, 애플리케이터(103)는 밝은 영역 및/또는 조용한 영역의 위치와 같이, 음장 및 가중 함수에 대한 일부의 정보를 입력으로서 요구한다.

도 3에 도시된 실시예에서, 음장 데이터를 처리하는 장치(100)는 애플리케이터(103)에 의해 처리될, 즉 공간적으로 연속하여 가변하는 가중 함수에 의해 가중될 음장 데이터를 저장하도록 구성되어 있는 일렉트로닉 스토리지 또는 메모리(111)를 더 포함한다. 그러므로 실시예에서 애플리케이터(103)는 HOA 포맷 컨버터(109) 또는 스토리지(111) 중 하나 또는 양자에 의해 제공되는 음장 데이터를 처리하도록 구성될 수 있다.

도 3에 도시된 실시예에서, 애플리케이터(103)에 의해 생성된 가중된 음장 데이터는 압축기(105)로 제공되며, 압축기(105)는 하나 이상의 종래의 압축 기술을 사용해서 가중된 음장 데이터를 압축하도록 구성되어 있다. 이하에서 더 상세히 설명될 바와 같이, 실시예에서, 압축기(105)는 도 3에 도시된 음장 재생 장치(310)로부터 압축기(105)로 피드백되는 성능 측정값에 기초해서 가중된 음장 데이터를 압축하기 위한 그 압축률을 채용하도록 구성되어 있다

도 3에 도시된 실시예에서, 음장 데이터를 처리하는 장치(100) 및 음장 재생 장치(310)는 음장 재생 시스템(300)의 일부이다. 다른 실시예에서, 음장 데이터를 처리하는 장치(100) 및 음장 재생 장치(310)는 공간적 및/또는 시간적으로 분리될 수 있다. 예를 들어, 음장 데이터를 처리하는 장치(100)는 압축된 가중된 음장 데이터를 인터넷을 통해 웹 클라이언트로서 실현되는 음장 재생 장치(31)에 제공하는 웹 서버로 실현될 수 있다. 이러한 시나리오에서 음장 데이터를 처리하는 장치(100)는 인코더로서 고려될 수 있는 반면 음장 재생 장치(310)는 대응하는 디코더인 것으로 간주될 수 있다.

도 3에 도시된 실시예에서, 음장 재생 장치(310)는 음장 데이터를 처리하는 장치(100)에 의해 제공되는 압축된 가중된 음장 데이터를 압축해제하도록 구성된 압축해제기(312)를 포함한다. 압축기(105) 및 압축해제기(312)가 무손실 압축 기술을 사용하도록 실현되는 경우 압축해제기(312)는 가중된 음장 데이터를 완전히 복원할 수 있다. 또한, 음장 재생 장치(310)는 렌더링하도록 구성되어 있는, 즉 가중된 음장 데이터에 기초해서 가중된 음장을 재생하도록 구성되어 있는 렌더러(renderer)(313)를 포함한다. 실시예에서, 렌더러(313)는 하나 이상의 적절하게 배열된 트랜스듀서, 특히 라우드스피터를 포함할 수 있다.

마지막으로, 도 3에 도시된 실시예에서, 음장 재생 장치(310)는 가중된 음장에 기초해서 성능 측정값을 결정하도록 구성되어 있는 성능 측정 결정기(315)를 포함한다. 이를 위해, 실시예에서, 성능 측정 결정기(315)는 렌더러(313)에 의해 재생된 가중된 음장을 측정하기 위해 32-채널 아이젠마이크와 같은 하나 이상의 마이크로폰뿐만 아니라 측정된 가중된 음장에 기초해서 성능 측정값, 예를 들어, 전술한 식(1)에 정의된 성능 측정값을 결정하도록 구성되어 있는 프로세싱 유닛도 포함할 수 있다.

실시예에서, 음장 재생 장치(310)는 성능 측정 결정기(315)에 의해 결정된 성능 측정값을 장치(100)의 압축기(105)에 피드백하도록 구성되어 있다. 실시예에서, 압축기(105)는 성능 측정 결정기(315)에 의해 제공된 성능 측정값에 기초해서 그 압축률을 조정하도록 구성되어 있다. 예를 들어, 일 실시예에서, 압축기(105)는 성능 측정 결정기(315)에 의해 제공된 성능 측정값이 미리 정의된 성능 측정 임계값보다 큰지를 검사할 수 있으며, 예를 들어, 밝은 영역(101a)과 조용한 영역(101b) 간의 음향 대조가 미리 정의된 최소 음향 대조보다 큰지를 검사할 수 있으며, 해당 경우이면, 가중된 음장 데이터에 적용되는 압축률을 증가시킬 수 있다.

실시예에서, 압축기(105)는 도 4에 도시된 미리 계산된 그래프에 기초해서 압축 전략을 실현할 수 있으며, 이것은 평균화된 음향 대조 성능의 의존성을 다른 버전의 EVS 및 다른 버전의 AAC와 같이 복수의 서로 다른 압축 기술에 대한 전송 비트레이트의 함수로서 나타낸다. 예를 들어, 실시예에서, 압축기(105)는 주어진 이전의 선택된 비트레이트에 있어서 성능 측정 결정기(315)에 의해 제공된 성능 측정값, 즉 평균화된 음약 대조 성능이 압축기(105)에 의해 채택된 압축 전략에 대해 도 4에 도시된 곡선 아래로 떨어지는 경우 그 압축률을 증가시키도록 구성될 수 있다.

도 5는 실시예에 따른 음장 데이터를 처리하는 장치(100)의 추가의 실시예에 대한 개략도이다. 도 1에 도시된 음장 데이터를 처리하는 장치(100)의 실시예와 같이, 도 5에 도시된 음장 데이터를 처리하는 장치(100)의 추가의 실시예는 공간적으로 연속하여 가변하는 가중 함수를 음장 데이터, 예를 들어 위의 식(2)에 정의된 공간적으로 연속하여 가변하는 가중 함수에 적용하여, 가중된 음장을 정의하는 가중된 음장 데이터를 획득하도록 구성되어 있는 애플리케이터(103)(도 5의 멀티존 HOA 포맷 컨버터(Multizone HOA format converter))를 포함하며, 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역(101a) 및/또는 조용한 영역(101b)에서 음장을 강화하도록 구성되어 있다. 도 5에 도시된 실시예에서, 음장 데이터는 공간적으로 연속하여 가변하는 가중 함수에 의해 가중될 음장 데이터를 저장하도록 구성된 일렉트로릭 스토리지 또는 메모리(111), 예를 들어, DVD 플레이어, CD 플레이어 또는 플래시 메모리로부터 취해진다. 일 실시예에서, 애플리케이터(103)는 가중된 음장 데이터를 HOA-B 포맷의 가중된 음장 데이터로서 제공하도록 구성된다. 도 5에 개략적으로 도시된 바와 같이, HOA-B 포맷으로의 이 변환을 수행할 수 있도록 하기 위해, 애플리케이터(103)는 밝은 영역 및/또는 조용한 영역의 위치와 같이, 음장 및 가중 함수에 대한 일부의 정보를 입력으로서 요구한다.

도 5에 도시된 실시예에서와 같이, 가중된 음장 데이터는 애플리케이터(103)로부터 렌더러(113)에 직접 제공되는데, 렌더러(113)는 가중된 음장 데이터에 기초해서 가중된 음장을 렌더링, 즉 재생하도록 구성되어 있으며, 도 5에 도시된 장치(100)는 도 1에 도시된 장치의 압축기(105)와 같은 압축기를 포함하지 않는다.

도 6 및 도 7은 도해된 예를 제한하지 않는 맥락에서 본 발명의 실시예에 서로 다른 관점을 도시하는 개략도이다. 도해된 예에서, 가중된 음장의 밝은 영역은 도 6에 도시된 바와 같이 직경이 2*Ro(외부 영역)인 원의 크기를 가지며, 이것은 일반적으로 평균적인 사람의 머리 크기보다 훨씬 크다. 이미 전술한 바와 같이, 본 발명의 실시예에 따르면, 직경 2*Ri(내부 영역)의 영역 내에서의 가능한 사람의 이동과 같이 일정한 기준에 대응하는 완만한 가중 함수를 가짐으로써 비트레이트 감소가 달성될 수 있다.

멀티존 애플리케이션에서, 가능한 한 큰 외부 구역의 크기를 갖는 것이 실제로 바람직하다. 하나는 내부 영역으로 표시된 더 작은 영역 내부에서 재생성에 초점을 맞춘다. 이것은 멀티존 배열 입력의 변화로 인해 멀티존 HOA B-포맷 신호의 커버리지 및 재처리 영역이 더 작음으로 인해 시스템이 열등해지도록 하여, 사용자가 내부 영역에서 멀어질 때 바람직하지 못한 품질을 초래할 수 있다. 한편, 본 발명의 실시예는 도 7에 강조된 바와 같이 매끄러운 품질의 전이를 보장한다.

본 개시의 특정한 특징 또는 관점이 수 개의 실시 또는 실시예 중 하나만 관련해서 설명하였으나, 이러한 특징 또는 관점은 임의의 주어진 또는 특정한 애플리케이션에 대해 바람직하고 이로울 수 있으므로 다른 실시 또는 실시예 중 하나 이상의 다른 특징 또는 관점과 결합될 수 있다. 또한, 용어 "구비하다", "가지다", "함께" 또는 이것들의 다른 변형이 상세한 설명 또는 청구범위에서 사용되는 정도로, 이러한 용어들은 용어 "포함하다"와 유사한 방식으로 포함되도록 의도된다. 또한, 용어 "예", "예를 들어" 및 "예를 들면"은 최선 또는 최적이기보다는 단지 예만을 의미한다. 용어 "결합된" 및 "연결된"은 파생어와 함께 사용될 수 있다. 이러한 용어는 2개의 소자가 직접적으로 물리적 또는 전기적 접촉에 있든, 서로 직접 접촉하지 않든 간에 관계없이 서로 협동 또는 상호작용한다는 것을 나타내는 데 사용될 수 있다.

본 명세서에서 특정 관점이 예시되고 설명되었지만, 당업자는 다양한 대안 및/또는 등가 구현이 본 개시의 범위를 벗어나지 않게 도시되고 설명된 특정 관점으로 대체될 수 있음을 이해할 것이다. 이 애플리케이션은 여기에서 논의된 특정 관점의 모든 적용 또는 변형을 포함한다.

이하의 청구의 범위에 있는 요소는 대응하는 라벨을 갖는 특정 시퀀스로 열거되지만, 청구의 요지는 그렇지 않으면 그러한 요소 중 일부 또는 전부를 구현하기 위한 특정 시퀀스를 암시하지 않는 한, 이러한 요소는 반드시 그 특정 시퀀스로 구현되는 것으로 제한되는 것은 아니다.

이와 같은 교시에 비추어 많은 대안, 수정 및 변형이 당업자에게 명백할 것이다. 물론, 당업자는 여기에 기재된 것 이상의 수많은 발명의 응용이 있음을 쉽게 인식할 수 있다. 본 발명은 하나 이상의 특정 실시예를 참조하여 설명되었지만, 당업자는 본 발명의 범위를 벗어나지 않으면서 많은 변화가 이루어질 수 있음을 인식한다. 따라서, 첨부된 청구범위 및 그 등가물의 범위 내에서, 본 발명은 여기에 구체적으로 기재된 것과 다르게 실시될 수 있음을 이해해야 한다.

Claims

음장 데이터를 처리하는 장치로서,
상기 음장 데이터는 적어도 하나의 밝은 영역 및 적어도 하나의 조용한 영역을 포함하는 공간 재생 영역 내의 음장을 정의하며,
상기 음장 데이터를 처리하는 장치는,
가중된 음장을 정의하는 가중된 음장 데이터를 획득하기 위해, 상기 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 적용하도록 구성되어 있는 애플리케이터
를 포함하며,
상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역과 조용한 영역 중 적어도 하나에서 음장을 강화하도록 구성되어 있고,
상기 음장 데이터를 처리하는 장치가,
상기 가중된 음장에 대해 측정된 파라미터에 기초해서 음장 데이터의 데이터 크기를 압축하도록 구성되어 있는 압축기
를 더 포함하며,
상기 가중된 음장에 대해 측정된 파라미터는 상기 가중된 음장의 적어도 하나의 밝은 영역과 적어도 하나의 조용한 영역 사이의 음향 대조(acoustical contrast)인, 음장 데이터를 처리하는 장치.
삭제
제1항에 있어서,
상기 압축기는 상기 가중된 음장에 대해 측정된 파라미터가 미리 정의된 성능 측정 임계값과 다른 경우에 음장 데이터를 압축하도록 구성되어 있는, 음장 데이터를 처리하는 장치.
삭제
제1항에 있어서,
밝은 영역과 조용한 영역 사이의 음향 대조는 밝은 영역에서의 가중된 음장의 평균과 조용한 영역에서의 가중된 음장의 평균 사이의 비율에 기초하는, 음장 데이터를 처리하는 장치.
제1항에 있어서,
밝은 영역과 조용한 영역 사이의 음향 대조는 다음 식:

에 기초하며, 여기서

는 음향 대조를 시간의 함수로서 나타내고,
는 음장을 정의하는 음장 데이터를 공간 및 시간의 함수로서 나타내고,
는 공간적으로 연속하여 가변하는 가중 함수를 나타내며,
및
는 밝은 영역의 크기와 조용한 영역의 크기를 각각 나타내는, 음장 데이터를 처리하는 장치.
제1항에 있어서,
상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역 및 조용한 영역 외측의 공간 재생 영역의 일부에 상대적으로, 밝은 영역 및 조용한 영역에서의 음장 데이터와 연관된 음장을 강화하도록 구성되는, 완만하게 변화하는 함수인, 음장 데이터를 처리하는 장치.
제1항에 있어서,
상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역의 중앙을 중심으로 하는 제1 정규 분포 및 조용한 영역의 중앙을 중심으로 하는 제2 정규 분포의 선형 조합인, 음장 데이터를 처리하는 장치.
제1항에 있어서,
상기 음장 데이터는 HOA B-Format으로 인코딩되는, 음장 데이터를 처리하는 장치.
제1항에 있어서,
상기 공간적으로 연속하여 가변하는 가중 함수에 의해 가중될 음장 데이터를 저장하도록 구성된 메모리를 더 포함하는 음장 데이터를 처리하는 장치.
제1항에 있어서,
상기 가중된 음장 데이터에 기초해서 상기 가중된 음장을 렌더링하도록 구성되어 있는 렌더러(renderer)를 더 포함하는 음장 데이터를 처리하는 장치.
제1항, 제3항 및 제5항 내지 제10항 중 어느 한 항에 따른 음장 데이터를 처리하는 장치와 음장 재생 장치를 포함하는 음장 재생 시스템으로서,
상기 음장 재생 장치는,
음장 데이터를 처리하는 장치로부터 가중된 음장 데이터를 수신하도록 구성되어 있고,
상기 가중된 음장 데이터에 기초해서 가중된 음장을 렌더링하도록 구성되어 있는 렌더러를 포함하는, 음장 재생 시스템.
제12항에 있어서,
상기 음장 재생 장치는, 상기 가중된 음장에 대해 측정된 파라미터를 결정하고 상기 가중된 음장에 대해 측정된 파라미터를 상기 음장 데이터를 처리하는 장치의 압축기에 피드백하도록 구성되어 있는 성능 측정 결정기를 더 포함하는, 음장 재생 시스템.
음장 데이터를 처리하는 방법으로서,
상기 음장 데이터는 적어도 하나의 밝은 영역 및 적어도 하나의 조용한 영역을 포함하는 공간 재생 영역 내의 음장을 정의하며,
상기 음장 데이터를 처리하는 방법은,
상기 음장 데이터에 공간적으로 연속하여 가변하는 가중 함수를 적용하여 가중된 음장을 정의하는 가중된 음장 데이터를 획득하는 단계 - 여기서 상기 공간적으로 연속하여 가변하는 가중 함수는 밝은 영역과 조용한 영역 중 적어도 하나에서 음장을 강화하도록 구성되어 있음 - ; 및
상기 가중된 음장에 대해 측정된 파라미터에 기초해서 음장 데이터의 데이터 크기를 압축하는 단계 - 여기서 상기 가중된 음장에 대해 측정된 파라미터는 상기 가중된 음장의 적어도 하나의 밝은 영역과 적어도 하나의 조용한 영역 사이의 음향 대조(acoustical contrast)임 -
를 포함하는 음장 데이터를 처리하는 방법.
컴퓨터 상에서 실행될 때 제14항의 방법을 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램을 가지는 비휘발성 컴퓨터 판독 가능형 저장 매체.