KR20200139670A

KR20200139670A - 오디오 객체의 객체 위치를 변환시키기 위한 장치, 오디오 스트림 제공기, 오디오 콘텐츠 생성 시스템, 오디오 재생 장치, 방법 및 컴퓨터 프로그램

Info

Publication number: KR20200139670A
Application number: KR1020207025026A
Authority: KR
Inventors: 올리버 웨볼트; 아킴 쿤즈; 크리스티안 에르텔; 사스차 딕; 프레데릭 나겔; 매티아스 뉘싱어
Original assignee: 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date: 2018-01-30
Filing date: 2019-01-29
Publication date: 2020-12-14
Also published as: AU2019214298B2; RU2751129C1; MX2020007998A; CN112154676A; CN112154676B; AU2019214298A1; WO2019149337A1; TW201937944A; US20200359149A1; CA3090026A1; EP3747204B1; WO2019149710A1; AR127189A2; BR112020015417A2; CA3090026C; SG11202007293UA; ES2962111T3; AR114348A1; EP3747204A1; US11653162B2

Abstract

오디오 객체의 객체 위치를 카테시안 표현(110)에서 구 표현(112)으로 변환시키기 위한 장치(100)가 설명된다. 카테시안 표현의 기준(basis) 영역은 복수의 기초 영역 삼각형(630,532,634,636)으로 세분화되고, 복수의 구 도메인 삼각형(660,662,664,666)은 구 표현의 원에 내접되어 있다. 장치는, 베이스 영역으로의 오디오 객체의 객체 위치의 투영 P가 기초 영역 삼각형 중 어느 것에 배열되는지를 결정하도록 구성되고; 장치는, 베이스 영역 삼각형을 이의 연관된 구 도메인 삼각형에 매핑하는 선형 변환(

)을 사용하여 객체 위치의 투영 P의 매핑된 위치(

)를 결정하도록 구성된다. 장치는 매핑된 위치(

)로부터 방위각(φ) 및 중간 반경 값(

)을 유도하도록 구성된다. 장치는 중간 반경 값(rxy,

)에 따라, 그리고 베이스 영역으로부터 객체 위치의 거리(z)에 따라 구 도메인 반경 값(

, r)과 고도각(

)을 얻도록 구성된다. 오디오 객체의 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 장치, 이러한 장치의 응용, 방법 및 컴퓨터 프로그램이 또한 설명된다.

Description

오디오 객체의 객체 위치를 변환시키기 위한 장치, 오디오 스트림 제공기, 오디오 콘텐츠 생성 시스템, 오디오 재생 장치, 방법 및 컴퓨터 프로그램

본 발명에 따른 실시형태는 오디오 객체의 객체 위치를 카테시안(Cartesian) 표현으로부터 구(spherical) 표현으로 그리고 이의 역으로 변환하기 위한 장치에 관한 것이다.

본 발명에 따른 실시형태는 오디오 스트림 제공기에 관한 것이다.

본 발명에 따른 추가 실시형태는 오디오 콘텐츠 생성 시스템에 관한 것이다.

본 발명에 따른 추가 실시형태는 오디오 재생 장치에 관한 것이다.

본 발명에 따른 추가 실시형태는 각각의 방법에 관한 것이다.

본 발명에 따른 추가 실시형태는 컴퓨터 프로그램에 관한 것이다.

본 발명에 따른 실시형태는 동적 객체 위치 메타데이터에 대한 매핑 규칙과 관련된다.

오디오 객체 또는 스피커(loudspeaker)의 위치는 때때로 카테시안 좌표(룸 중심적 설명)로 설명되고, 때로는 구 좌표(자기 중심적 설명)로 설명된다.

그러나, 양호한 청각 인상(hearing impression)을 유지하면서 객체 위치 또는 확성기 위치를 일 표현에서 다른 표현으로 변환시키는 것이 종종 바람직한 것으로 밝혀졌다. 또한 설명된 스피커 설정의 일반 토폴로지(topology)를 유지하고 지정된 스피커 위치로부터 재생되는 올바른 객체 위치를 유지하는 것이 바람직하다.

이러한 상황을 고려하여, 달성 가능한 청각 인상과 계산 복잡성 사이의 양호한 절충을 제공하는, 객체 메타데이터의 카테시안 표현(예를 들어, 객체 위치 데이터)과 구 표현 사이의 변환을 허용하는 개념에 대한 바람이 있다.

본 발명에 따른 실시형태는, 오디오 객체의 객체 위치(예를 들어, "객체 위치 데이터")를, 카테시안 표현에서 (또는 카테시안 좌표계 표현에서)(예를 들어, x, y 및 z 좌표를 포함함) 구 표현(또는 구 좌표계 표현)(예를 들어, 방위각, 구 도메인 반경 값, 및 고도각을 포함함)으로 변환시키기 위한 장치를 창출한다.

카테시안 표현의 기초 영역(basis area)(예를 들어, 코너 포인트 (-1; -1; 0), (1; -1; 0), (1; 1; 0) 및 (-1; 1; 0)을 갖는 xy 평면의 2차 영역)은 복수의 기초 영역 삼각형(예를 들어, 녹색 삼각형 또는 제1 해칭을 갖는 삼각형, 자주색 삼각형 또는 제2 해칭을 갖는 삼각형, 빨간색 삼각형 또는 제3 해칭을 갖는 삼각형, 및 흰색 삼각형 또는 제4 해칭을 갖는 삼각형)으로 세분화된다. 예를 들어, 기초 영역 삼각형은 모두 베이스 영역의 중앙 위치에 코너를 가질 수 있다. 또한, 복수의 (대응하는 또는 연관된) 구 도메인 삼각형이 구 표현의 원에 내접될 수 있다(여기서, 예를 들어, 구 도메인 삼각형 각각은 기초 영역 삼각형과 연관되고, 구 도메인 삼각형은 기초 영역 삼각형과 비교될 때 전형적으로 변형되고, 주어진 베이스 영역 삼각형을 이의 연관된 구 영역 삼각형에 매핑하기 위한 매핑(바람직하게는, 선형 매핑)이 있다). 예를 들어, 구 도메인 삼각형은 모두 원의 중심에 있는 코너를 포함할 수 있다.

장치는, 베이스 영역으로의 오디오 객체의 객체 위치의 투영이 베이스 영역 삼각형 중 어느 것에 배열되는지를 결정하도록 구성된다. 또한, 장치는, 연관된 구 도메인 삼각형에 (오디오 객체의 객체 위치의 베이스 영역으로의 투영이 정렬된) 베이스 영역 삼각형을 매핑하는 변환(바람직하게는, 선형 변환)을 사용하여 객체 위치 투영의 매핑된 위치를 결정하도록 구성된다. 장치는 매핑된 위치로부터 방위각 및 중간 반경 값(예를 들어, 고도각이 0인 구 좌표계의 기준 평면에서 2차원 반경 값)을 유도하도록 더 구성된다.

예를 들어, 원에 내접된 구 도메인 삼각형을 원 세그먼트에 매핑하는 반경 조정이 사용될 수 있다. 예를 들어, 조정된 중간 반경 r_xy 을 획득한 반경 조정이 사용될 수 있다. 반경 조정은, 예를 들어, 방위각 φ에 따라 이전에 얻은 반경 값

을 스케일링할 수 있다.

장치는 중간 반경 값(조정된 또는 조정되지 않음)에 따라, 그리고 베이스 영역으로부터 객체 위치의 거리에 따라 구 도메인 반경 값 및 고도각을 얻도록 구성된다. 고도각은 중간 반경 값의 그리고 베이스 영역으로부터 객체 위치의 거리의 다리를 갖는 직각 삼각형의 각도로서 결정될 수 있다. 더욱이, 구 도메인 반경은 직각 삼각형의 빗변 길이이거나 또는 이의 조정된 버전일 수 있다.

또한, 장치는 (예를 들어, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여) 조정된 고도각을 획득하도록 선택적으로 구성될 수 있으며, 여기서 제1 각도 영역은 제1 매핑된 각도 영역과 비교할 때 너비 또는 정도가 다르고, 예를 들어, 제1 각도 영역과 제2 각도 영역에 의해서 함께 커버되는 각도 범위는, 제1 매핑된 각도 영역과 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일하다.

이 장치는, 상술된 프로세싱 단계의 조합이 비교적 적은 계산 노력으로 오디오 객체의 객체 위치를 카테시안 표현에서 구 표현으로의 변환을 제공함과 동시에 합리적으로 우수한 오디오 품질을 얻을 수 있도록 한다는 발견에 기반한다. 또한, 언급된 단계가 일반적으로 완화된 노력으로 반전될 수 있어, 예를 들어, 오디오 디코더의 측에서, 완화된 노력으로 구 표현에서 카테시안 표현으로 되돌아 가는 것이 가능하다는 점이 밝혀졌다.

예를 들어, 카테시안 표현의 베이스 영역(또한, 기초 영역으로도 지정됨)을 기초 영역 삼각형(또한, 기본 영역 삼각형으로도 지정됨)으로 세분화함으로써, 그리고 기준 각도 삼각형 내의 위치를 구 도메인 삼각형 내의 위치로 매핑함으로써, 연산 노력을 거의 요구하지 않고 쉽게 반전 가능한, 카테시안 표현에서 구 표현으로의 간단한 변환이 수행될 수 있다. 또한, 삼각형의 적절한 선택에 의해, 적은 연산 노력으로, 청각 인상의 청각 저하가 회피되거나 또는 적어도 최소화될 수 있음이 보장될 수 있다. 이것은, 삼각형들이, 삼각형들 중 주어진 하나 내의 오디오 소스가 유사한 청각 인상을 유발하도록 정의될 수 있다는 사실 때문이다.

예를 들어, 룸 중심적 파라미터로 설명되고, 자아 중심적 설명으로 변환되는 스피커 설정은 토폴로지를 보존한다. 또한, 정확한 스피커 위치에 해당되는 객체 위치가 변환 후에도 동일한 스피커에 위치되는 것이 바람직하다. 본 발명에 따른 실시형태는 이러한 요건을 만족시킬 수 있다.

또한, 방위각 및 중간 반경 값(2차원 반경 값일 수 있음)이 유도되고, 구 도메인 반경 값 및 고도각이 베이스 영역에서 객체 위치까지의 거리에 따라, 그리고 중간 반경 값으로부터 유도되는 다단계 절차를 사용하여, 매핑이 "작은" 단계로 세분화될 수 있으며, 이 작은 단계가 상대적으로 적은 연산 노력을 사용하여 수행될 수 있고, 용이하게 반전될 수 있는 방식으로 구성될 수 있다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 변환 매트릭스에 의해서 설명되는 선형 변환을 사용하여 객체 위치의 투영의 매핑된 위치를 결정하도록 구성된다. 장치는 결정된 기초 영역 삼각형에 따라 변환 매트릭스를 획득하도록 구성된다. 달리 말하면, 베이스 영역으로의 오디오 객체의 객체 위치의 투영이 어느 베이스 영역 삼각형에 배열되는지 결정에 기반하여, 변환 매트릭스가 선택될 수 있다(예를 들어, 복수의 선연산된 변환 매트릭스에 기반하여). 대안적으로, 변환 매트릭스는 또한, 예를 들어, 결정된 베이스 영역 삼각형의 그리고 결정된(연관된) 구 도메인 삼각형의 코너의 위치에 따라서, 장치에 의해서 계산될 수 있다. 따라서, 올바른 변환 매트릭스를 선택하는 것이 매우 쉽고, 연산적으로 간단한 선형 동작을 사용하여 변환이 가능하다.

바람직한 실시형태에서, 변환 매트릭스는 청구범위에 보여지는 바와 같은 식에 따라서 정의된다. 이 경우에, 변환 매트릭스는, 결정된 기초 영역 삼각형의 (예를 들어, 두 개의) 코너의 x 좌표 및 y 좌표에 의해서, 그리고 연관된 구 도메인 삼각형의 (예를 들어, 두 개의) 코너의 x 좌표 및 y 좌표에 의해서 결정된다. 예를 들어, 결정된 기초 영역 삼각형의 제3 코너 및/또는 연관된 구 도메인 삼각형의 제3 코너가 좌표계의 원점에 있을 수 있으며, 이는 변환의 계산을 용이하게 한다는 점이 가정될 수 있다.

바람직한 실시형태에서, 베이스 영역 삼각형은 카테시안 표현의 원점 "앞" 영역을 커버하는 제1 베이스 영역 삼각형을 포함한다. 제2 베이스 영역 삼각형은 카테시안 표현의 원점 좌측 영역을 커버한다. 제3 베이스 영역 삼각형은 카테시안 표현의 원점 우측 영역을 커버한다. 제4 베이스 영역 삼각형은 카테시안 표현의 원점 뒤 영역을 커버한다. 이러한 베이스 영역 삼각형을 사용함으로써, 상이한 베이스 영역 삼각형은 (만약 객체가 영역에 놓인다면) 상이한 청각 인상으로 귀결되는 이러한 영역을 정의한다. 그러나, 선택적으로 더 미세한 공간 해상도를 얻기 위해 (그리고/또는 카테시안 표현에서 구 표현으로의 변환으로부터 기인되는 아티팩트(artifact)를 감소시기 위해) 더 많은 상이한 삼각형을 구별할 수 있을 것이다.

일 양태에 따르면, 수평 평면/층에서 스피커 위치에 기반된 세그먼트화에 따른 베이스 영역 삼각형의 정의는 중요한 특징이다(수평 평면에 설정된 5.1 스피커에 기반된 도 18 내지 도 24 및 식 참조). 자세한 내용에 대해서, 섹션 10을 또한 참조한다.

일 실시형태에 따르면, 구 도메인 삼각형은, 구 표현의 원점 앞 영역을 커버하는 제1 구 도메인 삼각형, 구 표현의 원점 좌측 영역을 커버하는 제2 구 도메인 삼각형, 구 표현의 원점 우측 영역을 커버하는 제3 구 도메인 삼각형, 및 구 표현의 원점 뒤 영역을 커버하는 제4 구 도메인 삼각형을 포함할 수 있다. 이러한 네 개의 구 도메인 삼각형은 앞에서 언급된 네 개의 베이스 영역 삼각형에 잘 대응된다. 그러나, 구 도메인 삼각형이, 예를 들어, 서로 다른 각도를 포함한다는 점에서, 연관된 베이스 영역 삼각형과 실질적으로 다를 수 있다는 점을 주의한다. 베이스 영역 삼각형은, 바람직하게는, 카테시안 표현의 xy 평면 내의 2차 영역에 내접된다. 대조적으로, 구 도메인 삼각형은, 예를 들어, 구 표현의 제로 고도 평면에 있는 원에 내접된다. 아마도, 삼각형의 배열은 대칭 축에 대한 대칭을 포함할 수도 있으며, 여기서 대칭 축은, 예를 들어, 청취자의 또는 청취 환경의 전방 시야와 연관된 방향으로 연장될 수 있다.

바람직한 실시형태에 있어서, 베이스 영역 삼각형의 코너의 좌표 및 연관된 구 도메인 삼각형의 코너의 좌표는 청구범위에서 보여지는 바와 같이 정의될 수 있다. 이러한 삼각형 선택이, 특히 좋은 결과를 가져 오는 것으로 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 보여지는 매핑 룰에 따라 매핑된 위치의 매핑된 좌표로부터 방위각을 유도하도록 구성된다. 예를 들어, 매핑 룰은 아크 탄젠트(arctan) 함수를 사용하여 매핑된 위치의 좌표를 방위각에 매핑할 수 있으며, 여기서 "특별한 경우"에 대한 처리가 구현될 수 있다(특히, 좌표 중 하나가 0인 경우에 대해서).

이러한 방위각 유도는 또한 연산적으로 효율적이다. 설명된 연산 룰은 연산적으로 특히 효율적이고, 또한 수치적으로 안정적이며, 여기서 신뢰할 수 없는 결과는 무효화된다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 보여지는 식에 따라 매핑된 위치의 매핑된 좌표로부터 중간 반경 값을 유도하도록 구성된다. 이러한 반경 계산은 구현하기가 특히 간단하고 좋은 결과를 제공한다.

바람직한 실시형태에서, 장치는 원에 내접된 구 도메인 삼각형을 원 세그먼트에 매핑하는 반경 조정을 사용하여 중간 반경 값에 따라 구 도메인 반경 값을 얻도록 구성된다. 이러한 변환이 단일 삼각 함수를 평가하여 수행될 수 있어, 연산적으로 매우 효율적이고 쉽게 반전될 수 있다는 점이 밝혀졌다. 또한, 이러한 접근 방식을 사용하여 구 도메인에서 사용 가능한 반경 값의 전체 범위가 활용될 수 있다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 반경 조정을 사용하여 중간 반경 값에 따라 구 도메인 반경 값을 얻도록 구성되고, 여기서, 반경 조정은 방위각에 따라 전에 얻어진 중간 반경 값을 스케일링 하도록 구성된다. 따라서, 예를 들어, 구 삼각형 각각이 내접된 원의 반경과 방위각에 의해 결정되는 방향의 빗변의 반대쪽 코너로부터 이등변 직각 삼각형의 빗변의 거리 사이의 비율에 따라 중간 반경 값을 업스케일링하는 것이 가능하다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 정의된 바와 같은 매핑 식을 사용하여 중간 반경 값에 따라 구 도메인 반경 값을 얻도록 구성된다. 이 접근 방식이 5.1+4H 스피커 설정에 특히 적합하다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 중간 반경 값의 그리고 베이스 영역으로부터 객체 위치의 거리의 다리를 갖는 직각 삼각형의 각도로서 고도각을 얻도록 구성된다. 이러한 고도각 계산이 특히 좋은 결과를 제공하고, 또한 완화된 노력으로 좌표 변환의 반전을 가능하게 하는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 중간 반경 값의 그리고 상기 베이스 영역으로부터 객체 위치의 거리의 다리를 갖는 직각 삼각형의 빗변의 길이로서 또는 이의 조정된 버전으로서 구 도메인 반경을 얻도록 구성된다. 이러한 연산이 낮은 복잡성을 갖고 반전 가능하다는 점이 밝혀졌다. 그러나, 일부 경우에, 예를 들어, 구 도메인 반경 값이 직각 삼각형의 빗변 길이로서 간단하게 얻어진다면, 반경 값은 구 도메인 삼각형이 내접되는 원의 반경을 넘게 되므로, 다른 조정을 수행하여, 따라서 조정된 구 도메인 반경 값을 구 도메인 삼각형이 내접된 원의 반경 이하의 값의 범위로 하는 것이 유리하다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 설명되는 바와 같은 고도각을 얻도록, 그리고/또는 청구범위에서 설명되는 바와 같은 구 도메인 반경을 얻도록 구성된다. 이러한 연산 룰이 상대적으로 적은 연산 노력을 가져오고, 또한 전형적으로 완화된 노력으로 좌표 변환의 반전을 가능하게 한다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 (예를 들어, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여) 조정된 고도각을 획득하도록 구성되며, 여기서 제1 각도 영역은 제1 매핑된 각도 영역과 비교할 때 너비가 다르고, 예를 들어, 제1 각도 영역과 제2 각도 영역에 의해서 함께 커버되는 각도 범위는, 제1 매핑된 각도 영역과 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일하다. 따라서, 예를 들어, 스피커 위치에 좌표 변환을 조정하는 것이 가능하다. 또한, 이러한 매핑을 사용함으로써, 청각 인상의 관점에서, 카테시안 표현의 고도각과 구 표현의 고도각 사이에는 일대일 대응이 없다. 따라서 이러한 비선형 매핑(구간(piece-wise) 선형 매핑일 수 있음)을 수행함으로써, 고도각의 적절한 조정이 수행될 수 있으며, 이는 또한 완화된 노력으로 반전될 수 있다.

바람직한 실시형태에 있어서, 장치는, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고, 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여 조정된 고도각을 얻도록 구성되고, 여기서 제1 각도 영역은 제1 매핑된 각도 영역에 비하여 상이한 폭을 갖는다. 따라서, 일부 영역에서는 고도각이 "압축"되고, 다른 영역에서는 고도각이 변환을 수행할 때 "스프레드"된다. 이것은 양호한 청각 인상을 얻는 것을 돕는다.

바람직한 실시형태에 있어서, 제1 각도 영역 및 제2 각도 영역에 의해 (함께) 커버되는 각도 범위는 제1 매핑된 각도 영역 및 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일하다. 따라서, 고도의 주어진 각도 영역(예를 들어, 0° 내지 90°)은 동일한 사이즈의 각도 영역(예를 들어, 0° 내지 90°)의 각도 영역에 매핑될 수 있고, 여기서 일부 각도 영역은 스프레드되고, 일부 각도 영역은 비선형 매핑에 의해 압축된다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 제공되는 룰에 따라 고도각을 조정된 고도각으로 매핑하도록 구성된다. 이러한 룰이 특히 양호한 청각 인상을 제공한다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 구 도메인 반경에 기반하여 조정된 구 도메인 반경을 얻도록 구성된다. 구 도메인 반경을 조정하는 것이, 구 도메인 삼각형이 내접된 원의 반경을 구 도메인 반경이 넘는 것을 회피하는 데 도움이 될 수 있다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 조정된 구 도메인 반경을 얻기 위해, 카테시안 시스템의 정사각형 경계를 구 좌표계의 원에 매핑하는 매핑을 수행하도록 구성된다. 이러한 매핑이 구 도메인 반경을 값의 바람직한 범위로 하기 위해서 적절하다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 제공되는 룰에 따라 구 도메인 반경을 조정된 구 도메인 반경에 매핑하도록 구성된다. 이러한 룰이 조정된 구 도메인 반경을 바람직한 값 범위로 하기 위해서 적절하다는 점, 및 설명된 룰이 또한 용이하게 반전될 수 있다는 점이 밝혀졌다.

다른 실시형태는, 오디오 객체의 객체 위치(예를 들어, "객체 위치 데이터")를, 구 표현에서 (또는 구 좌표계 표현에서)(예를 들어, 방위각, 구 도메인 반경 값, 및 고도각을 포함함) 카테시안 표현(또는 카테시안 좌표계 표현)(예를 들어, x, y 및 z 좌표를 포함함)으로 변환시키기 위한 장치를 창출한다.

카테시안 표현의 기초 영역(예를 들어, 코너 포인트 (-1; -1; 0), (1; -1; 0), (1; 1; 0) 및 (-1; 1; 0)을 갖는 xy 평면의 2차 영역)은 복수의 기초 영역 삼각형(예를 들어, 녹색 삼각형 또는 제1 해칭을 사용하여 도시되는 삼각형, 자주색 삼각형 또는 제2 해칭을 사용하여 도시되는 삼각형, 빨간색 삼각형 또는 제3 해칭을 사용하여 도시되는 삼각형, 및 흰색 삼각형 또는 제4 해칭을 사용하여 도시되는 삼각형)으로 세분화되고, (여기서, 예를 들어, 기초 영역 삼각형은 모두 베이스 영역의 중앙 위치에 코너를 가질 수 있음), 여기서, 복수의 (대응하는 또는 연관된) 구 도메인 삼각형이 구 표현의 원에 내접된다(여기서, 예를 들어, 구 도메인 삼각형 각각은 기초 영역 삼각형과 연관되고, 구 도메인 삼각형은 기초 영역 삼각형과 비교될 때 전형적으로 변형되고, 주어진 베이스 영역 삼각형을 이의 연관된 구 영역 삼각형에 매핑하기 위한, 바람직하게는, 선형 매핑이 있다). 예를 들어, 구 도메인 삼각형은 모두 원의 중심에 있는 코너를 포함할 수 있다.

장치는 (예를 들어, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여) 고도각에 기반하여 매핑된 고도각을 얻도록 선택적으로 구성될 수 있고, 여기서 제1 각도 영역은 제1 매핑된 각도 영역과 비교할 때 너비가 다르고, 예를 들어, 제1 각도 영역과 제2 각도 영역에 의해서 함께 커버되는 각도 범위는, 제1 매핑된 각도 영역과 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일하다.

장치는 또한, 구 도메인 반경에 기반하여 매핑된 구 도메인 반경을 얻도록 선택적으로 구성될 수 있다.

장치는, 고도각 또는 매핑된 고도각에 기반하고, 구 도메인 반경 또는 매핑된 구 도메인 반경에 기반하여 베이스 영역으로부터 객체 위치의 거리를 설명하는 값 및 중간 반경(예를 들어, 2차원 반경일 수 있음)을 얻도록 더 구성된다. 장치는 중간 반경에 기반하여 반경 수정을 수행하도록 선택적으로 구성될 수 있다.

장치는 또한, 중간 반경 또는 이의 수정된 버전에 기반하고, 방위각에 기반하여 원에 내접된 삼각형 중 하나 내의 위치를 결정하도록 구성된다. 또한, 장치는, (예를 들어, 결정된 위치가 있는 삼각형을 베이스 평면에 있는 연관된 삼각형에 매핑하는 선형 변환을 사용하여) 원에 내접된 삼각형 중 하나 내의 결정된 위치에 기반하여 베이스 평면에 대한 객체 위치의 투영의 매핑된 위치를 결정하도록 구성된다. 예를 들어, 매핑된 위치 및 베이스 영역으로부터의 객체 위치의 거리는 함께 카테시안 좌표계에서 오디오 객체의 위치를 결정할 수 있다.

이 장치가, 오디오 객체의 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 상술된 장치와 유사한 고려사항에 기반한다는 점이 주의된다. 객체 위치를 구 표현에서 카테시안 표현으로 변환시키는 장치에 의해서 수행되는 변환은, 예를 들어, 상술된 장치의 동작을 뒤집을 수 있다. 또한, 오디오 객체의 객체 위치를 구 표현에서 카테시안 표현으로 변환시키기 위한 장치에 의해 수행되는 작업이, 부분적으로는 낮은 복잡도의 별도의 독립적 (또는 후속) 처리 단계로 분할되기 때문에, 일반적으로 계산적으로 간단하다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 고도각에 기반하여 매핑된 고도각을 얻도록 구성된다. 이것은 구 도메인 렌더링에 매우 적합한 고도각에서 카테시안 도메인 렌더링에 잘 적응된 고도각으로 오는 데 도움이 된다.

바람직한 실시형태에서, 장치는, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고, 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여 매핑된 고도각을 얻도록 구성되고, 여기서 제1 각도 영역은 제1 매핑된 각도 영역에 비하여 상이한 폭을 갖는다. 이러한 구간 선형 매핑(전체적으로 비선형 매핑)이 연산적으로 매우 효율적인 방식으로 수행될 수 있으며, 일반적으로 개선된 청각 인상을 가져온다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 제1 각도 범위 영역 및 상기 제2 각도 범위 영역에 의해 함께 커버되는 각도 범위는 제1 매핑된 각도 범위 영역 및 상기 제2 매핑된 각도 범위 영역에 의해 함께 커버되는 각도 범위와 동일하다. 따라서, 주어진 각도 범위(예를 들어, 0° 내지 90°)는 대응하는 각도 범위(예를 들어, 0° 내지 90°)에 매핑될 수 있고, 여기서 일부 각도 영역은 압축되고, 일부 각도 영역은 비선형(그러나, 구간 선형) 매핑에 의해 스프레드된다. 이러한 매핑이 양호한 청각 인상을 얻는 데 도움이 되고 계산적으로 효율적이라는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 제공되는 룰에 따라 고도각을 매핑된 고도각에 매핑하도록 구성된다. 이 룰이 특히 유리한 구현이라는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 구 도메인 반경에 기반하여 매핑된 구 도메인 반경을 얻도록 구성된다. 구 도메인 반경(예를 들어, 구 도메인 삼각형이 내접된 원의 반경에 의해 결정된 값 범위 내에 있을 수 있음)은 차선적이다. 이러한 이유로, 매핑된 구 도메인 반경을 유도하기 위해 매핑을 적용하는 것이 유리하다. 예를 들어, 구 도메인 반경은 매핑된 구 도메인 반경의 값이 원의 반경보다 크도록 매핑될 수 있다. 예를 들어, 이것은, 예를 들어, 다음 관계를 사용하여 원의 반경에 가까운 구 도메인 반경에 대해 달성될 수 있고,

여기서, r은 구 도메인 반경이고,

은 매핑된 구 도메인 반경이다.

달리 말하면, 매핑된 구 도메인 반경은, 예를 들어, 매핑된 구 도메인 반경 값으로부터 유도된 2차원 반경 값이 상기 원의 반경보다 작거나 같도록 결정될 수 있다.

바람직한 실시형태에 있어서, 장치는 고도각에 따라 또는 매핑된 고도각에 따라 구 도메인 반경을 스케일링하도록 구성된다. 예를 들어, 장치는 구 좌표계의 원을 카테시안 시스템의 정사각형 경계에 매핑하는 매핑을 수행하도록 구성될 수 있다. 이러한 매핑을 사용함으로써, 매핑된 구 도메인 반경이 2차원 반경 값의 유도에 대해서 그리고 또한 z 축 값을 얻는 데에 매우 적합하다는 점이 달성될 수 있다.

바람직한 실시형태에 있어서, 장치는 청구범위에 설명되는 바와 같은 룰에 따라 구 도메인 반경에 기반하여 매핑된 구 도메인 반경을 얻도록 구성된다. 이러한 룰이 특히 효율적이고 양호한 청각 인상으로 귀결되는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 정의된 룰에 따라 베이스 영역으로부터 객체 위치의 거리를 설명하는 값 z를 얻도록 구성된다. 대안적으로 또는 추가적으로, 장치는 청구범위에 정의된 룰에 따라 중간 반경을 얻도록 구성된다. 이러한 룰이 특히 효율적이고 간단히 구현될 수 있다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 원 세그먼트를 원에 내접된 삼각형에 매핑하는 매핑을 사용하여 반경 수정을 수행하도록 구성된다. 예를 들어, 0과 구 도메인 삼각형이 내접된 원의 반경 사이의 값을 방위각과 무관하게 취할 수 있는 중간 반경은, 매핑된 구 도메인 반경의 최대 획득 가능한 값이 (예를 들어, 방위각에 의해서 설명되는 방향으로) 원의 중심으로부터 원에 내접된 삼각형 변의 거리로 제한되도록 매핑될 수 있다. 예를 들어, 중간 반경은 구 도메인 삼각형 각각의 변의 거리(예를 들어, 방위에 의해서 설명되는 방향으로)와 구 도메인 삼각형이 내접하는 원의 반경 사이의 방위각 종속 비율을 사용하여 스케일링된다.

바람직한 실시형태에 있어서, 장치는 수정된 반경을 얻기 위해 방위각에 따라 중간 반경을 스케일링하도록 구성된다. 이러한 스케일링은 일반적으로 계산적으로 간단하고, 과도한 왜곡을 일으키지 않으면서 원의 섹터를 삼각형에 매핑하는 데 더욱 적합하다.

다른 바람직한 실시형태는, 예를 들어, 5.1과 같이 수평 평면에서 스피커 설정에 의해서 주어진 세그먼트화에 기반된다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 정의되는 바와 같은 룰에 따라 중간 반경에 기반하여 수정된 반경을 얻도록 구성된다. 이러한 룰이 특히 유리하고, 특히 양호한 청각 인상으로 귀결되는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 정의되는 룰에 따라 원에 내접하는 삼각형 중 하나 내의 위치를 결정하도록 구성된다. 이 룰은 간단한 삼각 함수만 사용하고, x 좌표 및 y 좌표를 명확하게 정의하는 데 매우 적합하다.

바람직한 실시형태에 있어서, 장치는, 결정된 위치가 있는 삼각형을 베이스 평면에 있는 연관된 삼각형에 매핑하는 선형 변환을 사용하여 원에 내접된 삼각형 중 하나 내의 결정된 위치에 기반하여 베이스 평면(예를 들어, x 좌표 및 y 좌표)에 대한 객체 위치의 투영의 매핑된 위치를 결정하도록 구성된다. 이러한 선형 변환이 구 도메인과 카테시안 도메인 사이에서 매핑하는 데 매우 효율적인 (그리고 반전가능한) 방법이라는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 장치는 청구범위에서 정의된 매필 룰에 따라 베이스 평면에 대한 객체 위치의 투영의 매핑된 위치를 결정하도록 구성된다. 이 매핑 룰이 효율적이고 반전 가능하다는 점이 밝혀졌다.

바람직한 실시형태에 있어서, 변환 매트릭스는 청구범위에 설명되는 바와 같이 정의된다.

바람직한 실시형태에 있어서, 베이스 영역 삼각형은 이미 위에서 언급된 바와 같이 제1 베이스 영역 삼각형, 제2 베이스 영역 삼각형, 제3 베이스 영역 삼각형 및 제4 베이스 영역 삼각형을 포함한다.

유사하게, 바람직한 실시형태에 있어서, 구 도메인 삼각형은 이미 위에서 언급된 바와 같이 제1 구 도메인 삼각형, 제2 구 도메인 삼각형, 제3 구 도메인 삼각형 및 제4 구 도메인 삼각형을 포함한다.

다른 바람직한 실시형태에 있어서, 베이스 각 삼각형의 코너의 좌표는 청구범위에서 언급된 바와 같이 정의된다. 베이스 영역 삼각형 중에서, 구 도메인 삼각형 중에서, 그리고 상기 삼각형의 코너 중에서 특정한 선택은, 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 장치에 관해 위에서 언급된 바와 동일한 고려사항에 기반된다.

본 발명에 따른 다를 실시형태에는 오디오 스트림을 제공하기 위한 오디오 스트림 제공기를 창출한다. 오디오 스트림 제공기는 카테시안 표현으로 오디오 객체의 위치를 설명하는 입력 객체 위치 정보를 수신하도록 구성된다. 오디오 스트림 제공기는 구 표현으로 객체의 위치를 설명하는 출력 객체 위치 정보를 포함하는 오디오 스트림을 제공하도록 더 구성된다. 오디오 스트림 제공기는 카테시안 표현을 구 표현으로 변환시키기 위해 위에서 설명된 바와 같은 장치를 포함한다.

다른 실시형태에 따라, 구에서 카테시안으로의 변환을 갖는 오디오 스트림 제공기를 갖는 것이 또한 가능하다.

이러한 오디오 스트림 제공기는 카테시안 표현을 사용하여 입력 객체 위치 정보를 처리할 수 있고, 또한 위치의 구 표현을 포함하는 오디오 스트림을 제공할 수 있다. 따라서, 오디오 스트림은 효율적으로 작동하기 위해서 객체 위치의 구 표현을 요구하는 오디오 디코더에 의해 사용 가능하다.

본 발명에 따른 다른 실시형태는 오디오 콘텐츠 생성 시스템을 창출한다. 오디오 콘텐츠 생성 시스템은 카테시안 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 결정하도록 구성된다. 오디오 콘텐츠 생성 시스템은 카테시안 표현을 구 표현으로 변환시키기 위해 위에서 설명된 바와 같은 장치를 포함한다. 또한, 오디오 콘텐츠 생성 시스템은 구 표현을 오디오 스트림에 포함시키도록 구성된다.

대안적으로, 그러나, 구에서 카테시안으로 되는 것이 또한 가능하다.

이러한 오디오 콘텐츠 생성 시스템은, 객체 위치가 초기에, 많은 사용자에게 편리하고 더욱 직관적인 카테시안 표현으로 결정될 수 있다는 장점을 갖는다. 그러나, 그럼에도 불구하고 오디오 콘텐츠 생성 시스템은, 오디오 스트림이 원래 카테시안 표현으로 결정된 객체 위치의 구 표현을 포함하도록 오디오 스트림을 제공할 수 있다. 따라서, 오디오 스트림은 효율적으로 작동하기 위해서 객체 위치의 구 표현을 요구하는 오디오 디코더에 의해 사용 가능하다.

본 발명에 따른 다른 실시형태는 오디오 재생 장치를 창출한다. 오디오 재생 장치는 객체 위치 정보의 구 표현을 포함하는 오디오 스트림을 수신하도록 구성된다. 오디오 재생 장치는 또한, 객체 위치 정보의 구 표현을 카테시안 표현으로 (또는, 대안적으로, 반대로) 변환시키도록 구성되는, 앞에서 설명된 바와 같은 장치를 포함한다. 오디오 재생 장치는 객체 위치 정보의 카테시안 표현에 따라 오디오 객체를 사운드 트랜스듀서(예를 들어, 스피커)와 연관된 복수의 채널 신호로 렌더링하도록 구성된 렌더러를 더 포함한다.

따라서, 렌더러는 카테시안 표현의 객체 위치 정보를 필요로 함에도 불구하고, 오디오 재생 장치는 객체 위치 정보의 구 표현을 포함하는 오디오 스트림을 처리할 수 있다. 달리 말해서, 객체 위치를 구 표현에서 카테시안 표현으로 변환시키기 위한 장치가 오디오 재생 장치에서 유리하게 사용될 수 있다는 점이 명백하다.

모든 적용(예를 들어, 생성 도구 또는 디코더)이 반전된(미러링) 방식으로 구현될 수 있고, 여기서 구 좌표에서 카테시안 좌표로의 변환은 카테시안 좌표에서 구 좌표로의 변환에 의해서, 그리고 이 반대로(예를 들어, Sph-> Cart 및 Cart-> Sph) 대체될 수 있다는 점이 주의된다.

본 발명에 따른 추가 실시형태는 각각의 방법을 창출한다.

그러나, 방법이 대응하는 장치와 동일한 고려사항에 기반된다는 점에 주의한다. 더욱이, 장치에 관하여 본원에서 설명되는 특징, 기능 및 세부사항 중 임의의 것이 방법에 개별적으로 그리고 조합하여 추가될 수 있다.

또한, 본 발명에 따른 실시형태는 상기 방법을 수행하기 위한 컴퓨터 프로그램을 창출한다.

본 출원에 따른 실시형태는 첨부된 도면을 참조하여 아래에서 설명될 것이고, 도면에서,
도 1은 본 발명의 일 실시형태에 따른, 오디오 객체의 객체 위치를 카테시안 표현으로부터 구 표현으로 변환시키기 위한 장치의 개략적인 블록 다이어그램을 도시한다.
도 2는 본 발명의 실시형태에 따른, 오디오 객체의 객체 위치를 구 표현으로부터 카테시안 표현으로 변환시키기 위한 장치의 개략적인 블록 다이어그램을 도시한다.
도 3은 5.1+4H 설정에 대해 대응하는 스피커 위치를 갖는 카테시안 파라미터 룸의 예를 개략적으로 나타낸다.
도 4는 ISO/IEC 23008-3:2015 MPEG-H 3D 오디오에 따른 구 좌표계의 개략적 표현을 도시한다.
도 5는 카테시안 좌표계에서 그리고 구 좌표계에서 스피커 위치의 개략적 표현을 도시한다.
도 6은 카테시안 좌표계에서의 삼각형을 구 좌표계에서의 대응하는 삼각형에 매핑하는 그래픽 표현을 도시한다.
도 7은 카테시안 좌표계에서의 삼각형 내의 일 점을 구 좌표계에서의 대응하는 삼각형 내의 일 점에 매핑하는 개략적 표현을 도시한다.
표 1은 카테시안 좌표계에서 삼각형의 코너의 좌표 또는 구 좌표계의 대응하는 삼각형의 코너의 좌표를 도시한다.
도 8은 본 발명에 따른 실시형태에서 사용되는 반경 조정의 개략적 표현을 도시한다.
도 9는 본 발명에 따른 실시형태에서 사용되는 고도각의 그리고 구 도메인 반경의 유도의 개략적 표현을 도시한다.
도 10은 본 발명에 따른 실시형태에서 사용되는 반경의 수정의 개략적 표현을 도시한다.
도 11은 본 발명의 일 실시형태에 따른 오디오 스트림 제공기의 개략적인 블록 다이어그램을 도시한다.
도 12는 본 발명의 일 실시형태에 따른 오디오 콘텐츠 생성 시스템의 개략적인 블록 다이어그램을 도시한다.
도 13은 본 발명의 일 실시형태에 따른 오디오 재생 장치의 개략적인 블록 다이어그램을 도시한다.
도 14는 본 발명의 일 실시형태에 따른 방법의 흐름도를 도시한다.
도 15는 본 발명의 일 실시형태에 따른 방법의 흐름도를 도시한다.
도 16은 본 발명의 일 실시형태에 따른 방법의 흐름도를 도시한다.
도 17은 5.1+4H 설정에 대한 대응하는 스피커 위치를 갖는 카테시안 파라미터 룸의 일 예의 개략적 표현을 도시한다.
도 18은 ISO/IEC 23008-3:2015 MPEG-H 3D 오디오에 따른 구 좌표계의 개략적 표현을 도시한다.
도 19는 카테시안 좌표계에서 그리고 구 좌표계에서 스피커 위치의 개략적 표현을 도시한다.
도 20은 카테시안 좌표계에서의 삼각형을 구 좌표계에서의 대응하는 삼각형에 매핑하는 그래픽 표현을 도시한다.
도 21은 카테시안 좌표계에서의 삼각형 내의 일 점을 구 좌표계에서의 대응하는 삼각형 내의 일 점에 매핑하는 개략적 표현을 도시한다.
표 2는 카테시안 좌표계에서 삼각형의 코너의 좌표 또는 구 좌표계에서 대응하는 삼각형의 코너의 좌표를 도시한다.
도 22는 본 발명에 따른 실시형태에서 사용되는 반경 조정의 개략적 표현을 도시한다.
도 23은 본 발명에 따른 실시형태에서 사용되는 고도각의 그리고 구 도메인 반경의 유도의 개략적 표현을 도시한다.
도 24는 본 발명에 따른 실시형태에서 사용되는 반경의 수정의 개략적 표현을 도시한다.

다음으로, 상이한 창의적인 실시형태 및 양태가 설명될 것이다. 또한, 추가적인 실시형태는 첨부된 청구범위에 의해서 정의될 것이다.

청구범위에 의해 정의된 임의의 실시형태에는 본원에 설명된 세부사항(특징부 및 기능) 중 임의의 것이 추가될 수 있다는 점에 주의한다. 또한, 본 명세서에 설명된 실시형태는 개별적으로 사용될 수 있고, 또한 청구범위에 포함된 세부사항(특징부 및 기능) 중 임의의 것이 이에 선택적으로 추가될 수 있다.

또한, 본원에 설명된 개별적인 양태들이 개별적으로 또는 조합되어 사용될 수 있다는 점이 주의된다. 따라서, 세부사항은 상기 양태들 중 다른 하나에 세부사항을 추가하지 않으면서 상기 개별 양태들 각각에 추가될 수 있다.

또한, 본 개시내용이 오디오 인코더(입력 오디오 신호의 인코딩된 표현을 제공하기 위한 장치) 및 오디오 디코더(인코딩된 표현을 기반으로 오디오 신호의 디코딩된 표현을 제공하기 위한 장치)에서 사용 가능한 특징을 명시적으로 또는 묵시적으로 설명한다는 점을 주의한다. 따라서, 본원에 설명된 임의의 특징은 오디오 인코더의 맥락에서 그리고 오디오 디코더의 맥락에서 사용될 수 있다.

더욱이, 방법과 관련하여 본원에서 개시된 특징부 및 기능은 장치(이러한 기능을 수행하도록 구성됨)에서 또한 사용될 수 있다. 더욱이, 장치에 관하여 본 명세서에 개시된 임의의 특징부 및 기능은 대응하는 방법에서 또한 사용될 수 있다. 다시 말하면, 본원에 개시된 방법에 장치에 관하여 설명된 특징부 및 기능 중 임의의 것이 추가될 수 있다.

또한, 본원 설명된 특징부 및 기능 중 어느 하나는 "구현예 대안"섹션에서 설명되는 바와 같이, 하드웨어 또는 소프트웨어로 구현하거나 하드웨어와 소프트웨어의 조합을 사용하여 구현될 수 있다.

1. 도 1에 따른 실시형태

도 1은 오디오 객체의 객체 위치를 카테시안 표현으로부터 구 표현으로 변환시키기 위한 장치의 개략적인 블록 다이어그램을 도시한다.

장치(100)는, 예를 들어, 카테시안 좌표 x, y, z를 포함할 수 있는 카테시안 표현(110)을 수신하도록 구성된다. 또한, 장치(100)는, 예를 들어, 좌표 r, φ 및 θ를 포함할 수 있는 구 표현(112)을 제공하도록 구성된다.

장치는, 카테시안 표현의 기초 영역이 복수의 기초 영역 삼각형으로 세분화된다(예를 들어, 도 6에 도시된 바와 같이)는 가정 및 복수의 구 도메인 삼각형이 구 표현의 원에 내접되어 있다(예를 들어, 또한 도 6에 도시된 바와 같이)는 가정에 기반될 수 있다.

장치(100)는 삼각형 결정기(또는 결정)(120)를 포함하며, 이는 베이스 영역으로의 오디오 객체의 객체 위치의 투영이 어느 베이스 영역 삼각형에 배열되는지를 결정하도록 구성된다. 예를 들어, 삼각형 결정기(120)는 객체 위치 정보의 x 좌표 및 y 좌표를 기반으로 삼각형 식별정보(122)를 제공할 수 있다.

또한, 장치는, 연관된 구 도메인 삼각형에 (오디오 객체의 객체 위치의 베이스 영역으로의 투영이 정렬된) 베이스 영역 삼각형을 매핑하는 선형 변환을 사용하여 객체 위치 투영의 매핑된 위치를 결정하도록 구성된 매핑된 위치 결정기를 포함할 수 있다. 달리 말해서, 매핑된 위치 결정기는 제1 베이스 영역 삼각형 내의 위치를 제1 구 도메인 삼각형 내의 위치에 매핑할 수 있고, 제2 베이스 영역 삼각형 내의 위치를 제2 구 도메인 삼각형 내의 위치에 매핑할 수 있다. 일반적으로 i 번째 베이스 영역 삼각형 내의 위치는 i 번째 구 도메인 삼각형 내의 위치에 매핑될 수 있다(여기서, i 번째 베이스 영역 삼각형의 경계는 i 번째 구 도메인 삼각형의 경계에 매핑될 수 있음). 따라서, 매핑된 위치 결정기(130)는 x 좌표 및 y 좌표에 기반하여, 그리고 삼각형 결정기(120)에서 의해 제공되는 삼각형 식별정보(122)에 또한 기반하여 매핑된 위치(132)를 제공할 수 있다.

또한, 장치(100)는 매핑된 위치(132)(두 좌표에 의해서 설명될 수 있음)로부터 방위각(예를 들어, 각도 φ) 및 중간 반경 값(예를 들어, 중간 반경 값

)을 유도하도록 구성된 방위각/중간 반경 값 유도기(140)를 포함한다. 방위각 정보는 142로 지정되고 중간 반경 값은 144로 지정된다.

선택적으로, 장치(100)는, 중간 반경 값(144)을 수신하고 그에 기초하여 조정된 중간 반경 값(148)을 제공하는 반경 조정기(146)를 포함한다. 다음으로, 추가 처리는 조정된 중간 반경 값을 참조하여 설명될 것이다. 그러나, 선택적인 반경 조정기(146)가 없는 경우, 중간 반경 값(144)이 조정된 중간 반경 값(148)을 대신할 수 있다.

장치(100)는 또한 중간 반경 값(144)에 의존하거나 조정된 중간 반경 값(148)에 의존하고 또한 베이스 영역으로부터 객체 위치까지의 거리를 설명하는 z 좌표에 의존하여, 고도각(152)(예를 들어,

로 지정됨)을 획득하도록 구성된 고도각 계산기(150)를 포함한다.

더욱이, 장치(100)는 중간 반경 값(144) 또는 조정된 중간 반경 값(148)에 의존하고 또한 베이스 영역으로부터 객체 위치의 거리를 설명하는 z 좌표에 의존하여, 구 도메인 반경 값을 획득하도록 구성된 구 도메인 반경 값 계산기를 포함한다. 따라서, 구 도메인 반경 값 계산기(160)는 또한

로 지정되는 구 도메인 반경 값(162)을 제공한다.

선택적으로, 장치(100)는 또한 고도각(152)에 기반하여 수정되거나 조정된 고도각(172)(예를 들어 θ로 지정됨)을 획득하도록 구성된 고도각 수정기(또는 조정기)(170)를 포함한다.

더욱이, 장치(100)는 또한 구 도메인 반경 값(162)에 기반하여 수정되거나 조정된 구 도메인 반경 값(182)을 제공하도록 구성된 구 도메인 반경 값 수정기(또는 구 도메인 반경 값 조정기)(180)를 포함한다. 수정된 또는 조정된 구 도메인 반경 값(182)은, 예를 들어, r로 지정된다.

장치(100)가 본원에서 설명된 특징부 및 기능 중 임의의 것을 더 포함할 수 있다는 점에 주의한다. 또한, 각각의 개별 블록이, 예를 들어, 다른 블록이 특정 세부사항을 사용하여 구현될 필요 없이 아래에서 설명된 세부사항을 사용하여 구현될 수 있음에 주의한다.

장치(100)의 기능성과 관련하여, 장치가 다수의 작은 단계를 수행하도록 구성되며, 각 단계가 구 표현을 다시 카테시안 표현으로 변환시키는 장치 측에서 반전될 수 있음에 주의한다.

장치의 전체적인 기능은 카테시안 표현(예를 들어, 유효한 객체 위치가 카테시안 좌표계의 원점을 중심으로 하고 카테시안 좌표계의 축과 정렬되는 정육면체 내에 있음)은 청각 인상을 크게 약화시키지 않으면서 구 표현(예를 들어 유효한 객체 위치가 구 좌표계의 원점을 중심으로 하는 구 내에 있을 수 있음)으로 매핑될 수 있다. 예를 들어, 스피커 위치가 삼각형/분할을 정의하는 경우 직접 스피커 매핑이 가능해진다. 베이스 영역(예를 들어, xy 평면)으로의 객체 위치의 투영은 베이스 영역 안으로의 객체 위치의 투영이 배열되는 삼각형과 연관된 구 도메인 삼각형 내의 위치에 매핑될 수 있다. 따라서 구 도메인 삼각형이 배열되는 영역 내에서 2차원 위치인 매핑된 위치(132)가 획득된다.

방위각은 방위각 유도기 또는 방위각 유도를 사용하여 이러한 매핑된 위치(132)로부터 직접적으로 유도된다. 그러나, 고도각(152) 및 구 도메인 반경 값(162)은 또한, 매핑된 위치(132)로부터 유도될 수 있는 중간 반경 값(144)에 기반하여 (또는 조정된 중간 반경 값(148)에 기반하여) 획득될 수 있음이 밝혀졌다. 간단한 옵션에서, 매핑된 위치(132)로부터 용이하게 유도될 수 있는 중간 반경 값(144)은 구 도메인 반경 값(162)을 유도하기 위해 사용될 수 있으며, 여기서 z 좌표가 고려된다(구 도메인 반경 값 계산기(160)). 또한, 고도각(152)은 중간 반경 값(144)으로부터 또는 조정된 중간 반경 값(148)으로부터 용이하게 유도될 수 있으며, 여기서 z 좌표도 고려된다. 특히, 매핑된 위치 결정기(130)에 의해 수행되는 매핑은 이러한 매핑을 수행하지 않을 접근법과 비교할 때 결과를 상당히 향상시킨다.

더욱이, 중간 반경 값이 반경 조정기(146)에 의해 조정되는 경우, 고도각(152)이 선택적 고도각 수정기 또는 고도각 조정기(170)에 의해 조정되는 경우, 그리고 구 도메인 반경 값(162)이 구 도메인 반경 값 수정기 또는 구 도메인 반경 값 조정기(180)에 의해 수정 또는 조정되는 경우, 변환 품질이 더욱 향상될 수 있음이 밝혀졌다. 반경 조정기(146) 및 구 도메인 반경 값 수정기(180)는, 예를 들어, 반경 값의 범위를 조정하기 위해서 사용될 수 있어, 결과 반경 값(182)이 카테시안 표현에 잘 적응된 값의 범위를 포함한다. 유사하게, 고도각이 오디오 처리 분야에서 일반적으로 사용되는 구 표현으로 더 양호하게 조정될 수 있기 때문에, 고도각 수정기(170)는, 특히 양호한 청각 인상을 가져 오는 수정된 고도각(172)을 제공할 수 있다.

또한, 장치(100)가 본원에서 설명되는 특징 및 기능 중 임의의 것이 개별적으로 그리고 조합하여, 장치(100)에 선택적으로 추가될 수 있다는 점이 주의된다.

특히, "생성 측 변환"과 관련하여 설명된 특징 및 기능 중 임의의 것이 장치(100)에 선택적으로 추가될 수 있다.

본원에서 설명되는 특징, 기능 및 세부사항은 개별적으로 또는 조합하여, 선태적으로 장치(100)에 도입될 수 있다.

2. 도 2에 따른 실시형태

도 2는 오디오 객체의 객체 위치를 구 표현으로부터 카테시안 표현으로 변환시키기 위한 장치의 개략적인 블록 다이어그램을 도시한다.

객체 위치를 구 표현에서 카테시안 표현으로 변환하는 장치는 전체적으로 200으로 지정된다.

장치(200)는 구 표현인 객체 위치 정보를 수신한다. 구 표현은, 예를 들어, 구 도메인 반경 값 r, 방위각 값(예를 들어, φ) 및 고도값(예를 들어, θ)을 포함할 수 있다.

장치(100)와 유사하게, 장치(200)는 카테시안 표현의 기초 영역(예를 들어, 코너 포인트 (-1; -1; 0), (1; -1; 0), (1; 1; 0) 및 (-1; 1; 0)을 갖는 xy 평면의 2차 영역)은 복수의 기초 영역 삼각형(예를 들어, 제1 기초 영역 삼각형, 제2 기초 영역 삼각형, 제3 기초 영역 삼각형 및 제4 기초 영역 삼각형)으로 세분화된다는 가정에 또한 기반된다. 예를 들어, 기초 영역 삼각형은 모두 베이스 영역의 중앙 위치에 코너를 가질 수 있다. 또한, 구 표현의 원에 내접된 복수의 (대응 또는 연관된) 구 도메인 삼각형이 있다(여기서, 예를 들어, 구 도메인 삼각형 각각은 베이스 영역 삼각형과 연관되고, 구 도메인 삼각형은 연관된 기초 영역 삼각형과 비교될 때 일반적으로 변형되고, 주어진 베이스 영역 삼각형을 연관된 구 영역 삼각형에 매핑하기 위한 선형 매핑이 있다)는 점이 가정된다. 또한, 구 도메인 삼각형은, 예를 들어, 원의 중심에 있는 코너를 포함할 수 있다.

장치(200)는 구 표현(210)의 고도각 값을 수신하는 고도각 맵퍼(220)를 선택적으로 포함한다. 고도각 맵퍼(220)는 고도각(예를 들어, θ로 지정됨)에 기반하여 매핑된 고도각(222)(예를 들어,

로 지정됨)을 획득하도록 구성된다. 예를 들어, 고도각 맵퍼(220)는, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여 매핑된 고도각(222)을 획득하도록 구성될 수 있으며, 여기서 제1 각도 영역은 제1 매핑된 각도 영역과 비교할 때 너비가 다르고, 예를 들어, 제1 각도 영역이 함께 커버되는 각도 범위를 갖고, 제2 각도 영역은 제1 매핑된 각도 영역 및 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일하다.

또한, 장치(200)는 구 도메인 반경(예를 들어, r)을 수신하는 구 도메인 반경 값 맵퍼(230)를 선택적으로 포함한다. 선택적인 구 도메인 반경 값 맵퍼(230)는 구 도메인 반경(예를 들어, r)에 기반하여 매핑된 구 도메인 반경(232)을 획득하도록 구성될 수 있다.

또한, 장치(200)는, 고도각(218)에 기반하거나 또는 매핑된 고도각(222)에 기반하고, 구 도메인 반경(228)에 기반하거나 또는 매핑된 구 도메인 반경(232)에 기반하여 베이스 영역으로부터 객체 위치의 거리를 설명하는 값(예를 들어, z)을 획득하도록 구성된 z 좌표 계산기(240)를 포함한다. 베이스 영역으로부터 객체 위치까지의 거리를 설명하는 값은 242로 지정되고, 또한 "z"로 지정될 수 있다.

더욱이, 장치(200)는, 고도각(218)에 기반하거나 또는 매핑된 고도각(222)에 기반하고, 또한 구 도메인 반경(228)에 기반하거나 또는 매핑된 구 도메인 반경(232)에 기반하여 중간 반경(252)(예를 들어, r_xy로 지정됨)을 획득하도록 구성된 중간 반경 계산기(250)를 포함한다.

장치(200)는 선택적으로, 반경 수정기(260)를 포함하며, 이는 중간 반경(252) 및 방위각(258)을 수신하고 수정된(또는 조정된) 반경 값(262)을 제공하도록 구성될 수 있다.

장치(200)는 또한, 중간 반경(252)에 기반하거나, 또는 중간 반경의 수정된 버전(262)에 기반하고, 방위각 값(258)(예를 들어, φ)에 기반하여 원에 내접된 삼각형 중 하나(구 도메인 삼각형) 내의 위치를 결정하도록 구성된 위치 결정기(270)를 포함한다. 삼각형 중 하나 내의 위치는 272로 지정될 수 있고, 예를 들어, 두 개의 좌표

및

(구 도메인 삼각형이 있는 평면 내의 카테시안 좌표)로 설명될 수 있다.

장치(200)는 선택적으로, 삼각형 식별부(280)를 포함할 수 있으며, 이는 위치(272)가 어느 구 도메인 삼각형에 놓여 있는지를 결정한다. 삼각형 식별부(280)에 의해 수행되는 이 식별은, 예를 들어, 맵퍼(290)에 의해 사용될 매핑 룰을 선택하기 위해서 사용될 수 있다.

맵퍼(290)는 (예를 들어, 결정된 위치가 있는 삼각형을 베이스 평면에 있는 연관된 삼각형에 매핑하는 변환 또는 선형 변환을 사용하여) 원에 내접된 삼각형 중 하나 내의 결정된 위치(272)에 기반하여 베이스 평면에 대한 객체 위치의 투영의 매핑된 위치(292)를 결정하도록 구성된다. 따라서, 매핑된 위치(292)(베이스 평면 내 2차원 위치일 수 있음)와 베이스 영역으로부터의 객체 위치 거리(예를 들어, z 값(242))는 함께 카테시안 좌표계에서 오디오 객체의 위치를 결정할 수 있다.

예를 들어, 장치(200)의 기능은, 장치(200)를 사용하여 장치(100)에 의해 제공된 구 표현(112)을 다시 객체 위치의 카테시안 표현으로 매핑할 수 있도록 장치(100)의 기능에 반대일 수 있다(여기서, 구 표현(고도각(218), 구 도메인 반경(228) 및 방위각(258)을 포함할 수 있는)의 객체 위치 정보(210)는 장치(100)에 의해 제공된 구 표현(112)과 동일할 수 있거나, 구 표현(112)으로부터 유도될 수 있다(예를 들어, 구 표현(112)의 손실되는 코딩된 또는 양자화된 버전일 수 있다))는 점에 주의한다. 예를 들어, 프로세싱의 적절한 선택에 의해, 장치(100)에 의해 수행된 변환이 장치(200)에 의해 완화된 노력으로 반전될 수 있다는 점이 도달될 수 있다.

더욱이, 구 도메인 삼각형 중 하나의 내의 위치를 카테시안 표현의 베이스 평면 내 위치로 매핑하는 것은 완화된 복잡성으로 좋은 청각 인상을 제공하는 매핑을 허용하기 때문에 장치(200)의 중요한 특징이라는 점에 주의한다.

더욱이, 본원에 설명되는 특징, 기능 및 세부사항 중 임의의 것이 장치(200)에 개별적으로 그리고 조합하여 추가될 수 있음을 주의한다.

3. 추가적인 실시형태 및 고려사항

다음으로, 객체 위치 메타 데이터 또는 동적 객체 위치 메타 데이터에 대한 매핑 룰에 관한 몇 가지 세부 사항이 설명될 것이다. 위치가 동적일 필요는 없다는 점에 주의한다. 또한 정적 개체 위치가 매핑될 수 있다.

본 발명에 따른 실시형태는, 생성 측에서는 카테시안 좌표계가 사용되지만, 전송 형식에서는 객체 위치 메타 데이터가 구 좌표로 설명되는 경우에 생성 측 객체 메타 데이터, 특히 객체 위치 데이터로부터의 변환에 관한 것이다.

카테시안 좌표에서 스피커가 구 좌표계에 비해 수학적으로 "정확한" 위치에 항상 있지 않다는 점이 문제로 인식되었다. 따라서 카테시안 공간의 입방체 영역이 구 또는 반구로 정확하게 투영되는 것을 보장하는 변환이 바람직하다.

예를 들어, 스피커 위치는 구 좌표계에 기반하여 오디오 객체 렌더러(예를 들어, MPEG-H 3D 오디오 표준에 설명된 렌더러)를 사용하거나 대응하는 변환 알고리즘을 구비하는 카테시안 기반 렌더러를 사용하여 동일하게 렌더링된다.

입방체 표면은 스피커가 위치된 구의 표면에 매핑되거나 투영되어야 한다(또는 때로는 매핑되거나 투영되어야 한다)는 점이 밝혀졌다. 또한, 변환 알고리즘이 적은 계산 복잡도를 갖는 것이 바람직하다(또는 때때로 필요하다). 이것은 특히 구 좌표에서 카테시안 좌표로의 변환 단계에 해당된다.

본 발명의 예시적 적용은 오디오 객체 좌표에 카테시안 파라미터 공간(x, y, z)을 종종 사용하지만 구 좌표(방위각, 고도, 반경)로 오디오 객체 위치를 설명하는 전송 형식을 사용하는 최첨단 오디오 객체 저작 도구, 예를 들어, MPEG-H 3D 오디오를 사용하는 것이다. 그러나 전송 형식은 나중에 적용되는 렌더러(구 또는 카테시안)와 무관할 수 있다.

다음으로, 본 발명이, 일 예로서, 5.1+4H 스피커 설정에 대해 설명되지만 모든 종류의 스피커 설정(예를 들어, 7.1+4, 22.2 등) 또는 다양한 카테시안 매개변수 공간(축의 다른 배향 또는 축의 다른 배율,…)에 용이하게 이전될 수 있다는 점이 주의된다.

좌표계의 전반적 비교

다음에서는, 좌표계의 전반적인 비교가 제공된다.

이 목적을 위해서, 도 3은 5.1+4H 설정에 대한 대응하는 스피커 위치를 갖는 카테시안 파라미터 룸의 예를 개략적으로 나타낸다. 도시되는 바와 같이, 정규화된 객체 위치는, 예를 들어, 좌표 (-1; -1; 0), (1; -1; 0), (1; 1; 0), (-1; 1; 0), (-1; -1; 1), (1; -1; 1), (1; 1; 1) 및 (-1; 1; 1)에 있는 코너를 갖는 입방체 내에 놓일 수 있다.

비교를 위해, 도 4는 ISO/IEC 23008-3:2015 MEG-H 3D 오디오에 따른 구 좌표계의 개략도를 도시한다. 도시된 바와 같이, 객체의 위치는 방위각, 고도각 및 (구 도메인) 반경에 의해서 설명된다.

그러나, ISO 좌표계의 X 및 Y 좌표는 위에서 설명된 카테시안 좌표계와 다르게 정의되는 점에 주의한다.

그러나, 여기에 도시된 좌표계는 예일 뿐이라는 점에 주의한다.

3.1 생성 측 변환 (카테시안 2 구 또는 카테시안-대-구)

다음으로, 바람직하게는 장치(100)에 의해서 수행될 수 있는, (예를 들어, 객체 위치의) 카테시안 표현에서 (예를 들어, 객체 위치의) 구 표현으로의 변환이 설명될 것이다.

본원에서 설명되는 특징, 기능 및 세부사항이 선택적으로, 개별적으로 그리고 조합되어 장치(100)로 인계될 수 있다는 점이 주의된다.

그러나, 여기에 설명되는 "투영 측 변환"(카테시안 표현에서 구 표현으로의 변환)은 있는 그대로(또는 장치(100)의 특징 및 기능 중 하나 이상과 조합하여, 또는 청구항에 의해 정의된 특징 및 기능 중 하나 이상과 조합하여) 사용될 수 있는 본 발명에 따른 실시형태로 간주될 수 있다.

스피커 위치가, 예를 들어, ITU 권장 사항 ITU-R BS.2159-7에 의해 설명되고 MPEG-H 사양에 의해 설명되는 바와 같이 구 좌표로 주어지는 점이 여기서 가정된다.

변환은 별도의 접근 방식으로 적용된다. 먼저 x 및 y 좌표가 방위각/xy 평면(예를 들어, 베이스 평면)의 방위각 φ 및 반경 r_xy로 매핑된다. 이는, 예를 들어, 장치(100)의 블록 120, 130, 140에 의해 수행될 수 있다. 그 후, 3D 공간의 고도각 및 반경(종종 구 도메인 반경 값으로 지정됨)은 z 좌표를 사용하여 계산된다. 이것은, 예를 들어, 블록 146(선택적), 150, 160, 170(선택적) 및 180(선택적)에 의해 수행될 수 있다. 매핑은 5.1+4H 스피커 설정에 대해, 예(또는 예시)로서, 설명된다.

특별한 경우 x = y = 0;

선택적으로 특수한 경우 x = y = 0에 대해 다음과 같이 가정될 수 있다는 점에 주의한다.

z > 0 인 경우:

φ = 정의되지 않음(=0°), θ= 90° 및 r = z.

z = 0 인 경우:

φ = 정의되지 않음(=0°), θ = 0° 및 r = 0.

1) xy-평면에서 변환

xy-평면에서 일어나는 변환은, 예를 들어, 다음에서 설명될 세 단계를 포함할 수 있다.

1 단계: (선택 사항, 준비 단계일 수 있음)

제1 단계에서 카테시안 좌표계의 삼각형은 구 좌표계의 대응하는 삼각형에 매핑된다.

예를 들어, 도 6은 그래픽 표현 기초 영역 삼각형 및 연관된 구 도메인 삼각형을 도시한다. 예를 들어, 그래픽 표현(610)은 4개의 삼각형을 도시한다. 예를 들어, x 좌표 방향(620)과 y 좌표 방향(622)이 있다. 예를 들어 원점은 위치 624에 있다. 예를 들어, 네 개의 삼각형은, 예를 들어, 정규화된 좌표 (-1; -1), (1; -1), (1; 1) 및 (-1; 1)을 포함할 수 있는 정사각형에 내접된다. 제1 삼각형(녹색으로 또는 제1 해칭을 사용하여 표시됨)은 630으로 지정되며 (1; 1), (-1; 1) 및 (0; 0)에 있는 코너를 포함한다. 자주색으로 또는 제2 해칭을 사용하여 표시되는 제2 삼각형은 632로 지정되고, 좌표 (-1; 1), (-1; -1) 및 (0; 0)에 있는 코너를 갖는다. 제3 삼각형(634)은 빨간색으로 또는 제3 해칭을 사용하여 표시되고, 좌표 (-1; -1), (1; -1) 및 (0; 0)에 있는 코너를 갖는다. 제4 삼각형(636)은 흰색 또는 제4 해칭을 사용하여 표시되고, 좌표 (1; -1), (1; 1) 및 (0; 0)에 있는 코너를 갖는다.

따라서 (정규화된) 단위 정사각형의 전체 내부 영역은 네 개의 삼각형으로 채워지며, 여기서 네 개의 삼각형은 모두 좌표계의 원점에서 이들의 코너들 중 하나를 갖는다. 제1 삼각형(630)은 원점의 "앞"(예를 들어, 원점에 있다고 가정되는 청취자 앞)에 있다고, 제2 삼각형(632)은 원점의 왼쪽에 있다고, 제3 삼각형은 원점 "뒤에" 있다고, 제4 삼각형(636)은 원점의 오른쪽에 있다고 설정될 수 있다. 달리 말하면, 제1 삼각형(630)은 원점에서 볼 때 제1 각도 범위를 커버하고, 제2 삼각형(632)은 원점에서 볼 때 제2 각도 범위를 커버하고, 제3 삼각형은 원점에서 볼 때 제3 각도 범위를 커버하고, 제4 삼각형은 원점에서 볼 때 제4 각도 범위를 커버한다. 가능한 네 개의 스피커 위치가 단위 정사각형의 코너와 일치하고, 다섯 번째 스피커 위치(중앙 스피커)가 좌표 (0; 1)에 있다고 가정될 수 있는 점을 주의한다.

그래픽 표현(650)은 구 좌표계에서 단위 원에 내접된 연관된 삼각형을 도시한다.

그래픽 표현(650)에 도시된 바와 같이, 예를 들어, 구 좌표계의 베이스 영역(예를 들어, 고도각 0)에 있는 단위 원에는 네 개의 삼각형이 내접되어 있다. 제1 구 도메인 삼각형(660)은 녹색으로 또는 제1 해칭으로 도시되고, 제1 베이스 영역 삼각형(630)과 연관된다. 제2 구 도메인 삼각형(662)은 자주색으로 또는 제2 해칭으로 도시되고, 제2 베이스 영역 삼각형(632)과 연관된다. 제3 구 도메인 삼각형(664)은 빨간색으로 또는 제3 해칭으로 도시되고, 제3 베이스 영역 삼각형(634)과 연관된다. 제4 구 도메인 삼각형(666)은 흰색으로 또는 제4 해칭으로 도시되고, 제4 베이스 영역 삼각형(636)과 연관된다. 인접한 구 도메인 삼각형은 공통의 삼각형 모서리를 공유한다. 또한, 네 개의 구 도메인 삼각형은 원점에서 보았을 때 360° 전체 범위를 커버한다. 예를 들어, 제1 구 도메인 삼각형(660)은 원점에서 볼 때 제1 각도 범위를 커버하고, 제2 구 도메인 삼각형(662)은 원점에서 볼 때 제2 각도 범위를 커버하고, 제3 구 도메인 삼각형(664)은 원점에서 볼 때 제3 각도 범위를 커버하고, 제4 구 도메인 삼각형(666)은 원점에서 볼 때 제4 각도 범위를 커버한다. 예를 들어, 제1 구 도메인 삼각형(660)은 원점 앞의 제1 각도 범위를 커버할 수 있고, 제2 구 도메인 삼각형(662)은 원점 좌측의 제2 각도 범위를 커버할 수 있고, 제3 구 도메인 삼각형은 원점 뒤의 제3 각도 범위를 커버할 수 있고, 제4 구 도메인 삼각형(666)은 원점 우측의 제4 각도 범위를 커버할 수 있다. 또한, 네 개의 스피커 위치는 인접한 구 도메인 삼각형의 공통된 코너인 원 상의 위치에 배열될 수 있다. 다른 스피커(예를 들어, 중앙 스피커)의 위치는 구 도메인 삼각형의 외부(예를 들어, 제1 구 도메인 삼각형 앞의 원 상)에 배열될 수 있다.

일반적으로 말해서, 구 도메인 삼각형에 의해서 커버되는 각도 범위가 연관 베이스 영역 삼각형에 의해서 커버되는 각도 범위와 상이할 수 있다는 점에 또한 주의한다. 예를 들어, 베이스 영역 삼각형 각각은, 예를 들어, 카테시안 좌표계의 원점으로부터 보았을 때 90°의 각도 범위를 커버할 수 있는 한편, (구 좌표계의 원점으로부터 보았을 때) 제1 구 도메인 삼각형, 제2 구 도메인 삼각형 및 제4 구 도메인 삼각형은 90°보다 더 적은 각도 범위를 커버할 수 있고 제3 구 도메인 삼각형은 90°보다 더 큰 각도 범위를 커버할 수 있다. 대안적으로, 5개의 세그먼트를 갖는 아래의 실시예에서 도시되는 바와 같이, 더 많은 삼각형이 사용될 수 있다.

또한, 베이스 영역 삼각형(630, 632, 634, 636)은 동일할 수 있는 한편, 구 도메인 삼각형은 다른 형상을 가질 수 있으며, 여기서 제2 구 도메인 삼각형(666)의 형상과 제4 구 도메인 삼각형(666)의 형상은 동일할 수 있다(그러나, 서로에 대해서 거울 상이다).

또한, 더 많은 수의 삼각형이 카테시안 표현 및 구 표현에서 사용될 수 있다는 점에 주의한다.

다음으로, 카테시안 좌표계에 있는 삼각형을 구 좌표계에 있는 대응하는 삼각형으로 매핑하는 것이, 일 예로서, 하나의 삼각형에 대해서 도시될 것이다.

일 예로서, 도 7은 베이스 영역 삼각형 및 연관된 구 도메인 삼각형의 그래픽 표현을 도시한다. 그래픽 표현(710)에 도시된 바와 같이, "제2 베이스 영역 삼각형"일 수 있는 베이스 영역 삼각형은 좌표 P₁, P₂ 및 카테시안 좌표계의 원점에 있는 코너를 포함한다. 그래픽 표현(750)에 도시된 바와 같이, 연관된 구 도메인 삼각형(예를 들어, "제 2 구 도메인 삼각형")은 좌표

및 카테시안 좌표계의 원점에 있는 코너를 포함할 수 있다. 예를 들어, 제1 베이스 영역 삼각형(632) 내에 있는 점 P는 연관된 구 도메인 삼각형(662)에 있는 대응하는 점

에 매핑된다.

삼각형, 또는 삼각형 내에 있는, 예를 들어, 점 P와 같은 위치는 선형 변환을 사용하여 서로 투영(또는 매핑)될 수 있다.

변환 매트릭스는, 예를 들어, (연관된) 삼각형의 코너

,

및

의 알려진 위치를 사용하여 계산(미리 계산)될 수 있다. 이러한 지점은 스피커 설정과 스피커의 대응하는 위치 및 위치 P가 위치되는 삼각형에 의존한다.

그러나, 변환 매트릭스

는, 예를 들어, 미리 연산될 수 있다는 점에 주의한다.

예를 들어, 개념이 장치(100)를 사용하여 구현되는 경우, 삼각형 결정기(120)는 카테시안 표현에서 구 표현으로 변환될 위치 P가 어느 삼각형에 위치하는지 결정할 수 있다(또는, 더욱 정확하게, 베이스 평면으로의 (원래, 3차원) 위치의 (2차원) 투영 P가 어느 베이스 영역 삼각형에 배열되는지 결정할 수 있으며, 위치가 x 좌표, y 좌표 및 z 좌표에 의해서 설명되는 3차원 위치일 수 있다고 가정된다). 위치의 투영 P가 어느 삼각형에 있는지의 결정에 따라, 적절한 변환 매트릭스

가 선택될 수 있고, 매핑된 위치 결정기(130)에 의해 (예를 들어, 투영 P에) 적용될 수 있다.

따라서, 매핑된 위치

가 획득된다.

다음으로, 베이스 영역 삼각형 및 구 도메인 삼각형에 관한 실시예가 설명될 것이다.

예를 들어, 5.1+4H 스피커 설정은 중간층에 표준 5.1 스피커 설정을 포함하며, 이는 xy-평면에서 투영을 위한 기준이다. 표 1에서, 대응하는 점 P₁, P₂,

및

가 투영되어야 하는 네 개의 삼각형에 대해 주어진다. 그러나, 표 1에 도시된 바와 같은 점이 단지 예로서 간주되어야 하고, 개념이 또한, 삼각형이 당연히 상이한 방식으로 선택될 수 있는 다른 스피커 배열체와 조합되어 적용될 수 있다는 점이 주의된다.

단계 2

제2 단계에서, 반경

(또한 중간 반경 또는 중간 반경 값으로서 지정될 수 있음), 및 방위각 φ은 매핑된 좌표

및

에 기반하여 계산된다. 예를 들어, 이 계산은 방위각 편향기 및 중간 반경 값 결정기에 의해 수행되며, 이는 장치(100)에서 블록 140으로 도시된다. 예를 들어, 다음 계산 및 매핑이 수행될 수 있다.

단계 3 (선택적)

반경(예를 들어, 중간 반경 값

)은, 예를 들어, 스피커가 구 좌표계와 대조적으로 카테시안 좌표계의 정사각형에 배치되기 때문에, 조정될 수 있다. 구 좌표계에서, 스피커는, 예를 들어, 원에 위치된다.

반경을 조정하기 위해서, 카테시안 스피커 정사각형의 경계는 구 좌표계의 원에 투영된다. 이것은 현(chord)이 원의 대응하는 세그먼트 상에 투영되는 점을 의미한다.

이 기능이, 예를 들어, 장치(100)의 조정기(146)에 의해서 수행될 수 있다는 점이 주의된다.

도 8은, 예를 들어, 제1 구 도메인 삼각형을 고려한 스케일링을 도시한다. 제1 구 도메인 삼각형(830) 내의 점(840)은, 예를 들어, 중간 반경 값

및 방위각 φ에 의해 설명된다. 예를 들어, 현 위의 점은 전형적으로 원의 반경(반경이 정규화되었다고 가정하면 원의 반경은 1일 수 있음)보다 작은 (중간) 반경 값을 포함할 수 있다. 그러나 현 위에 있는 점의 "반경"(또는, 반경 좌표, 또는 원점으로부터의 거리)은 방위각에 의존할 수 있으며, 여기서 현의 끝점은 원의 반경과 동일한 반경 값을 가질 수 있다. 그러나, 제1 구 도메인 삼각형 내의 점의 경우, 반경 값은 원의 반경(예를 들어, 1)과 현 상의 각각의 점의 반경 값(예를 들어, 원점으로부터의 거리) 사이의 비율로 스케일링될 수 있다. 따라서, 현 위의 점의 반경 값은 원의 반경과 같아지도록 스케일링될 수 있다. 동일한 방위각을 갖는 다른 점(예를 들어, 점(840))은 비례 방식으로 스케일링된다.

반경(더 정확하게는, 중간 반경 값)의 이러한 조정에 대한 일 예는 다음에서 제공될 것이다:

2) z 성분의 변환

예를 들어, 상단 층의 고도는 구 좌표계에서 30° 고도각인 것으로 가정된다.

다르게 말하면, 일 예로서, 상승된 스피커("상단 층"을 구성하는 것으로 간주될 수 있음)가 30°의 고도각으로 배열되어 있다고 가정된다.

도 9는, 일 예로서, 구 좌표계에서 양의 정의를 도시한다. 도 9에서 도시된 바와 같이, 정의는 2차원 투영도에서 도시된다. 특히, 도 9는 (조정된) 중간 반경 값 r_xy, 카테시안 표현의 z 좌표, 구 도메인 반경 값

및 고도각

를 도시한다.

다음으로,

및

, 또는 이의 수정된 버전 또는 조정된 버전 r, θ를 결정하는 다른 단계가 설명될 것이다.

단계 1:

일 예에서, 반경 r_xy(조정된 중간 반경 값일 수 있음) 및 z 성분(카테시안 표현의 z 값일 수 있음)에 기반하여 고도각

을 계산할 수 있다. 이 계산은, 예를 들어, 고도각 계산기(150)에 의해서 수행될 수 있다. 또한, 방법은 각도

(또한, 고도각으로 지정됨) 및 r_xy에 기반하여 3D 반경

(또한, 구 도메인 반경 값으로 지정됨)을 계산하는 단계를 포함한다. 예를 들어, 계산

이 사용될 수 있다.

대안적으로, 그러나, 3D 반경

은 반경 r_xy 및 z 성분에 기반하여 연산될 수 있다. 이 연산은, 예를 들어, 구 도메인 반경 값 계산기(160)에 의해서 수행될 수 있다.

예를 들어,

및

은 다음 식에 따라서 연산될 수 있다:

단계 2: (선택적)

선택적으로, 카테시안 시스템의 직사각형 경계의 구 좌표의 단위 원으로의 투영 때문에 반경

의 수정이 수행될 수 있다.

도 10은 이 변환의 개략적인 표현을 도시한다.

도 10에 도시된 바와 같이, 구 도메인 반경 값

은 구 좌표계에 있는 단위 원의 반경보다 더 큰 값을 취할 수 있다. 이전 단계에서 언급된 위 방정식을 참조하면,

는, r_xy가 0과 1 사이의 값을 가질 수 있다는 가정하에, 그리고 z가 0과 1 사이 또는 -1과 1(예를 들어, 구 좌표계 내의 단위 정육면체 내의 점의 경우) 사이의 값을 가질 수 있다는 가정하에 최대

의 값을 취할 수 있다.

따라서, 구 도메인 반경 값은 수정되거나 또는 조정되어 수정된(또는 조정된) 구 도메인 반경 값 r을 획득한다. 예를 들어, 다음 방정식 또는 매핑 룰을 사용하여 수정 또는 조정이 수행될 수 있다.

또한, 위에서 언급된 구 도메인 반경 값의 조정 또는 수정이 구 도메인 반경 값 수정기(180)에 의해서 수행될 수 있다는 점이 주의된다.

단계 3: (선택적)

선택적으로, 고도각

의 수정은 카테시안(

=45°) 및 구 (θ = 30°) 좌표계에서 스피커의 상이한 배치 때문에 수행될 수 있다.

다시 말해, 예를 들어, 높이 스피커 또는 상승된 스피커가 카테시안 좌표계에서와 구 좌표계에서 상이한 고도에 배열되므로,

에서 θ 로의 매핑은 선택적으로 수행될 수 있다. 이러한 매핑은, 오디오 디코더 측에서 달성될 수 있는 청각 인상을 향상시키는 데 도움이 될 수 있다. 예를 들어,

에서 θ로의 매핑은 다음 방정식 또는 매핑 룰에 따라서 수행될 수 있다.

그러나, 아래에서 설명되는 바와 같이, 더 일반적인 공식이 사용될 수 있다.

예를 들어,

에서 θ로의 매핑은 고도각 수정기(170)에 의해서 수행될 수 있다.

결론적으로, 카테시안 표현을 구 표현으로 변환할 때 사용될 수 있는 기능에 대한 세부사항이 설명되었다. 본원에서 설명된 세부사항은 개별적으로 그리고 조합하여 장치(100)에 선택적으로 도입될 수 있다.

3.2 디코더 측 변환(구에서 카테시안으로 또는 "Sph 2 Cart") (실시형태)

디코더 측에서는, 역변환(생성 측에서 수행되는 절차에 반대일 수 있음)이 실행될 수 있다. 이것은 변환 단계들이, 예를 들어, 반대 순서로 뒤집어질 수 있음을 의미한다.

다음으로, 일부 세부사항이 설명될 것이다.

1) xy 평면에서의 반경의 고도 및 투영의 변환(z 성분 계산)

특별한 경우 θ = 90°: (선택적)

선택적으로, θ = 90°인 경우에 특별한 처리가 수행될 수 있다. 예를 들어, 다음 설정이 이 경우에 사용될 수 있다.

x = 0, y = 0 및 z = r

단계 1: (선택적)

선택적으로, 예를 들어, 위에서 언급된

에서 θ로의 (선택적) 매핑을 뒤집을 수 있는 θ에서

로의 매핑이 수행될 수 있다. 예를 들어, θ에서

로의 매핑은 다음 매핑 룰을 사용하여 수행될 수 있다:

θ에서

로의 매핑이, 예를 들어, 선택적인 것으로 간주될 수 있는 고도각 맵퍼(220)에 의해서 수행될 수 있는 점이 주의된다.

단계 2: (선택적)

선택적으로, 반경 수정의 역이 수행될 수 있다. 예를 들어, 카테시안 시스템의 직사각형 경계의 구 좌표계의 단위 원으로의 투영 때문에 반경

의 상술된 수정이 이러한 동작에 의해서 뒤집어질 수 있다.

예를 들어, 반경 수정의 역은 다음 매핑 룰을 사용하여 수행될 수 있다.

예를 들어, 반경 수정의 역은 구 도메인 반경 값 맵퍼(230)에 의해서 수행될 수 있다.

단계 3:

또한, z 좌표 z와 반경 값 또는 "중간 반경 값"r_xy "는 매핑된 구 도메인 반경 값

및 매핑된 고도각

에 기반하여(또는 대안적으로, 위에서 언급된

에서 θ로의 선택적 매핑 및 위에서 언급된 반경 수정의 선택적 역이 생략되는 경우, 구 도메인 반경 값 r 및 고도각 θ에 기반하여) 계산될 수 있다.

예를 들어, z 및 r_xy의 계산은 다음 매핑 룰에 따라서 수행될 수 있다.

예를 들어, z 좌표의 계산은 z 좌표 계산기(240)에 의해서 수행될 수 있다. r_xy의 계산은, 예를 들어, 중간 반경 계산기(250)에 의해 수행될 수 있다.

2) x 및 y 성분의 계산

다음으로, x 성분 및 y 성분의 연산이 설명될 것이다. 예를 들어, x 성분과 y 성분은 중간 반경 r_xy 및 방위각 φ에 기반하여 결정된다.

단계 1: (선택적)

선택적으로, 반경 수정의 역이 수행될 수 있다. 예를 들어, 스피커가 구 좌표계와 대조적으로 카테시안 좌표계의 정사각형에 배치되기 때문에 수행되는 선택적 반경 조정은 뒤집어질 수 있다.

반경 수정의 선택적 역은, 예를 들어, 다음 매핑 룰에 따라 수행될 수 있다.

예를 들어, 반경 수정의 선택적 역은 반경 수정기(260)에 의해 수행될 수 있다.

단계 2:

또한, 좌표

및

의 계산이 수행될 수 있다. 예를 들어,

및

는 수정된 반경 값

에 기반하여, 그리고 방위각에 기반하여 결정될 수 있다. 예를 들어, 다음 매핑 룰이

및

의 계산을 위해서 사용될 수 있다:

및

의 계산은, 예를 들어, 위치 결정기(270)에 의해서 수행될 수 있다.

단계 3:

또한, 카테시안 표현의 좌표인 좌표 x, y의 계산이 수행될 수 있다.

특히, 선형 변환 T ^-1 이 사용될 수 있다. 변환 매트릭스 T ^-1은 위에서 언급된 변환 매트릭스 T의 역일 수 있다. 예를 들어, 변환 매트릭스 T ^-1은 어느 구 도메인 삼각형에 좌표

및

가 배열되는지에 따라 선택될 수 있다. 이 목적을 위해서, 삼각형 식별부(280)가 선택적으로 수행될 수 있다. 다음으로, 위에서 언급된 바와 같이 정의된 적절한 변환 매트릭스 T ^-1 가 선택될 수 있다.

예를 들어, 좌표 x 및 y의 계산은 다음 매핑 룰에 따라 수행될 수 있다:

예를 들어 x와 y의 계산은 맵퍼(290)에 의해 수행될 것이며, 여기서 적절한 매핑 매트릭스 T ^-1 는 좌표

및

에 따라 선택되고, 특히 좌표

및

를 갖는 점이 어느 구 도메인 삼각형에 배열되는지에 따라 선택된다.

결론적으로, 구 좌표 r, φ 및 θ에 기반하는 카테시안 좌표 x, y, z의 유도가 설명되었다.

그러나 위의 계산은, 예를 들어, 다른 기초 영역 삼각형, 구 도메인 삼각형 또는 매핑 룰 상수를 선택함으로써 변경될 수 있음에 주의한다. 또한, 예를 들어 베이스 영역 삼각형 중 하나를 두 개의 베이스 영역 삼각형으로 분할하거나 그리고/또는 더 많은 구 도메인 삼각형을 정의함으로써, 삼각형의 수가 변경될 수 있다.

본원에서 설명된 세부사항 중 어느 것도 개별적으로 그리고 조합하여 장치(200)에 선택적으로 도입될 수 있다는 점에 주의한다.

3. 도 11에 따른 오디오 스트림 제공기

도 11은 본 발명의 일 실시형태에 따른 오디오 스트림 제공기의 개략적인 블록 다이어그램을 도시한다.

도 11에 따른 오디오 스트림 제공기는 전체적으로 1100으로 지정된다. 오디오 스트림 제공기(1100)는 카테시안 표현에서 오디오 객체의 위치를 설명하는 입력 객체 위치 정보를 수신하도록 구성된다. 또한, 오디오 스트림 제공기는 구 표현으로 오디오 객체의 위치를 설명하는 출력 객체 위치 정보를 포함하는 오디오 스트림(1112)을 제공하도록 구성된다. 오디오 스트림 제공기(1100)는 오디오 객체의 객체 위치를 카테시안 표현으로부터 구 표현으로 변환하기 위한 장치(1130)를 포함한다.

장치(1130)는 입력 객체 위치 정보에 포함된 카테시안 표현을 오디오 스트림(1112)에 포함된 구 표현으로 변환시키기 위해서 사용된다. 따라서, 입력 객체 위치 정보가 오디오 객체의 위치를 카테시안 표현으로 설명하는 경우에도, 오디오 스트림 공급기(1100)는 객체 위치를 구 표현으로 설명하는 오디오 스트림을 제공할 수 있다. 따라서, 오디오 스트림(1112)은 오디오 콘텐츠를 적절하게 렌더링하기 위해 객체 위치의 구 표현을 요구하는 오디오 디코더에 의해 사용 가능하다. 따라서, 오디오 스트림 제공기(1100)는 객체 위치 정보가 카테시안 표현으로 이용 가능한 생성 환경에서 사용하기에 매우 적합하다. 많은 오디오 생성 환경이 오디오 객체의 위치를 카테시안 표현(예를 들어, x, y, z 좌표를 사용)으로 편리하게 특정하도록 구성된 점에 주의한다. 따라서, 오디오 스트림 제공기(1100)는 이러한 오디오 생성 장비로부터 객체 위치 정보를 수신할 수 있고 객체 위치 정보의 구 표현에 의존하는 오디오 디코더에 의해 사용 가능한 오디오 스트림(1112)을 제공할 수 있다.

또한, 오디오 스트림 제공기(1100)가 선택적으로 추가 기능을 포함할 수 있다는 점에 주의한다. 예를 들어, 오디오 스트림 제공기(1100)는 입력 오디오 정보를 수신하고 이에 기반하여 인코딩된 오디오 표현을 제공하는 오디오 인코더를 포함할 수 있다. 예를 들어, 오디오 스트림 제공기는 1 채널 입력 신호를 수신할 수 있거나, 또는 멀티 채널 입력 신호를 수신할 수 있고, 이에 기반하여, 또한 오디오 스트림(1112)에 포함되는 1 채널 입력 오디오 신호의 또는 멀티 채널 입력 오디오 신호의 인코딩된 표현을 제공할 수 있다. 예를 들어, 하나 이상의 입력 채널은 "오디오 객체"로부터의(예를 들어, 특정 악기와 같은 특정 오디오 소스 또는 특정 다른 사운드 소스로부터의) 오디오 신호를 나타낼 수 있다. 이 오디오 신호는 오디오 스트림 제공기에 포함된 오디오 인코더에 의해 인코딩될 수 있고, 인코딩된 표현은 오디오 스트림에 포함될 수 있다. 예를 들어, 인코딩은 주파수 도메인 인코더(예를 들어, AAC 인코더 또는 이의 개선된 버전) 또는 선형 예측 도메인 오디오 인코더(예를 들어, LPC 기반 오디오 인코더)를 사용할 수 있다. 그러나, 오디오 객체의 위치는, 예를 들어, 입력 객체 위치 정보(1110)에 의해 기술될 수 있고, 장치(1130)에 의해 구 표현으로 변환될 수 있으며 여기서, 입력 객체 위치 정보의 구 표현은 오디오 스트림에 포함될 수 있다. 따라서, 오디오 객체의 오디오 콘텐츠는 객체 위치 정보와는 별도로 인코딩될 수 있으며, 이는 일반적으로 인코딩 효율성을 크게 향상시킨다.

그러나, 오디오 스트림 제공기는, (예를 들어, 복수의 오디오 객체로부터의 신호를 하나 또는 둘 이상의 다운믹스 신호로 다운믹스하기 위해) 다운믹스 기능과 같은 추가 기능을 선택적으로 포함할 수 있고, 하나 또는 둘 이상의 다운믹스 신호의 인코딩된 표현을 오디오 스트림(1112)에 제공하도록 구성될 수 있다는 점이 주의된다.

또한, 오디오 스트림 제공기는 두 개 이상의 오디오 객체로부터의 두 개 이상의 객체 신호들 간의 관계를 설명하는 일부 사이드 정보(예를 들어, 객체 간 상관 관계, 객체 간 시간 차이, 객체 간 위상 차이 및/또는 객체 간 레벨 차이)를 얻기 위한 기능을 선택적으로 포함할 수도 있다. 이 사이드 정보는, 예를 들어, 인코딩된 버전에서 오디오 스트림 제공기에 의해 오디오 스트림(1112)에 포함될 수 있다.

이런 방식으로, 정보는, 예를 들어, 인코딩된 버전에서 오디오 스트림 제공기에 의해 오디오 스트림(1112)에 포함될 수 있다.

따라서, 오디오 스트림 제공기(1100)는, 예를 들어, 인코딩된 다운믹스 신호, 인코딩된 객체-관계 메타데이터(사이드 정보) 및 인코딩된 객체 위치 정보를 오디오 스트림에 포함시키도록 구성될 수 있으며, 여기서 인코딩된 객체 위치 정보는 구 표현일 수 있다.

그러나, 오디오 스트림 제공기(1100)에는 오디오 스트림 제공기 및 오디오 인코더에 관한 당업자에게 알려진 특징 및 기능 중 임의의 것이 선택적으로 추가될 수 있다.

또한, 장치(1130)가, 예를 들어, 위에서 설명된 장치(100)에 대응할 수 있고, 본원에서 설명되는 추가적인 특징 및 기능 및 세부사항을 선택적으로 포함할 수 있다는 점이 주의된다.

4. 도 12에 따른 오디오 콘텐츠 생성 시스템

도 12는 본 발명의 일 실시형태에 따른 오디오 콘텐츠 생성 시스템(1200)의 블록 개략도를 도시한다.

오디오 콘텐츠 생성 시스템(1200)은 카테시안 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 결정하도록 구성될 수 있다. 예를 들어, 오디오 콘텐츠 생성 시스템은 사용자 인터페이스를 포함할 수 있으며, 여기서 사용자는 카테시안 표현으로 객체 위치 정보를 입력할 수 있다. 그러나, 선택적으로, 오디오 콘텐츠 생성 시스템은 다른 입력 정보로부터, 예를 들어, 객체 위치의 측정으로부터, 또는 개체의 움직임 시뮬레이션으로부터, 또는 임의의 다른 적절한 기능으로부터 카테시안 표현의 객체 위치 정보를 또한 유도할 수 있다.

또한, 오디오 콘텐츠 생성 시스템은, 본원에서 설명된 바와 같이, 오디오 객체의 객체 위치를 카테시안 표현으로부터 구 표현으로 변환시키기 위한 장치를 포함한다. 객체 위치를 변환시키기 위한 장치는 1230으로 지정되고, 전술된 바와 같이 장치(100)에 대응할 수 있다. 더욱이, 장치(1230)는 결정된 카테시안 표현을 구 표현으로 변환시키기 위해서 사용된다.

더욱이, 오디오 콘텐츠 생성 시스템은 장치(1230)에 의해 제공되는 구 표현을 오디오 스트림(1212)에 포함시키도록 구성된다.

따라서, 객체 위치 정보가 (예를 들어, 사용자 인터페이스로부터 또는 다른 객체 위치 결정 개념을 사용하여) 원래 카테시안 표현으로 결정될 수 있음에도 불구하고, 오디오 콘텐츠 생성 시스템은 구 표현의 객체 위치 정보를 포함하는 오디오 스트림을 제공할 수 있다.

당연히, 오디오 콘텐츠 생성 시스템은 또한 다른 오디오 콘텐츠 정보, 예를 들어, 오디오 신호의 인코딩된 표현 및 가능하게는 추가 메타 정보를 오디오 스트림(1212)에 포함시킬 수 있다. 예를 들어, 오디오 콘텐츠 생성 시스템은 오디오 스트림 제공기(1110)에 대해 설명된 추가 정보를 오디오 스트림(1212)에 포함시킬 수 있다.

따라서, 오디오 콘텐츠 생성 시스템(1200)은 하나 이상의 오디오 신호의 인코딩된 표현을 제공하는 오디오 인코더를 선택적으로 포함할 수 있다. 오디오 콘텐츠 생성 시스템(1200)은 또한, 복수의 오디오 객체로부터의 오디오 신호를 하나 또는 둘 이상의 다운믹스 신호로 다운믹싱하는 다운믹서를 선택적으로 포함할 수 있다. 또한, 오디오 콘텐츠 생성 시스템은 선택적으로 객체-관계 정보(예를 들어, 객체 레벨 차이 정보 또는 객체 간 상관 값 또는 객체 간 시간 차이 값 등)를 유도하도록 구성될 수 있고, 이의 인코딩된 표현을 오디오 스트림(1212)에 포함시킬 수 있다.

요약하면, 객체 위치가 원래 카테시안 표현으로 제공되더라도, 오디오 콘텐츠 생성 시스템(1200)은 객체 위치 정보가 구 표현으로 포함된 오디오 스트림(1212)을 제공할 수 있다.

당연히, 카테시안 표현으로부터 구 표현으로 객체 위치를 변환시키기 위한 장치(1230)에는, 본원에서 설명되는 특징 및 기능 및 세부사항 중 임의의 것이 추가될 수 있다.

5. 도 13에 따른 오디오 재생 장치

도 13은 본 발명의 일 실시형태에 따른 오디오 재생 장치(1300)의 블록 개략도를 도시한다.

오디오 재생 장치(1300)는 객체 위치 정보의 구 표현을 포함하는 오디오 스트림(1310)을 수신하도록 구성된다. 더욱이, 오디오 스트림(1310)은 일반적으로 또한 인코딩된 오디오 데이터를 포함한다.

오디오 재생 장치는 본원에서 설명된 바와 같이, 객체 위치를 구 표현으로부터 카테시안 표현으로 변환시키기 위한 장치(1330)를 포함한다. 객체 위치를 변환시키기 위한 장치(1330)는, 예를 들어, 본원에서 설명되는 장치(200)에 대응할 수 있다. 따라서, 객체 위치를 변환시키기 위한 장치(1330)는 구 표현으로 객체 위치 정보를 수신할 수 있고, 참조 번호 1332에 도시된 바와 같이, 카테시안 표현으로 객체 위치 정보를 제공할 수 있다.

또한, 오디오 재생 장치(1300)는 또한, 객체 위치 정보의 카테시안 표현(1332)에 따라 오디오 객체를 사운드 트랜스듀서와 연관된 복수의 채널 신호(1350)로 렌더링하도록 구성된 렌더러(1340)를 포함한다.

선택적으로, 오디오 재생 장치는 또한, 예를 들어, 오디오 스트림(1310)에 포함된 인코딩된 오디오 데이터를 수신할 수 있고, 이에 기반하여 디코딩된 오디오 정보(1362)를 제공할 수 있는 오디오 디코딩(또는 오디오 디코더)(1360)을 포함한다. 예를 들어, 오디오 디코딩은 디코딩된 오디오 정보(1362)로서 하나 이상의 채널 신호 또는 하나 이상의 객체 신호를 렌더러(1340)에 제공할 수 있다.

또한, 렌더러(1340)가 객체 위치의 카테시안 표현(1332)에 의해 결정된 위치(청각 환경 내)에 있는 오디오 객체의 신호를 렌더링할 수 있다. 따라서, 렌더러(1340)는 오디오 객체와 연관된 신호가 채널 신호(1350)에 어떻게 분배되어야 하는지를 결정하기 위해 객체 위치의 카테시안 표현(1332)을 사용할 수 있다. 다시 말해, 렌더러(1340)는 객체 위치 정보의 카테시안 표현에 기반하여 어떤 사운드 트랜스듀서 또는 스피커에 의해 오디오 객체로부터의 신호가 렌더링될지 (그리고 신호가 상이한 채널 신호로 렌더링되는 강도)를 결정한다.

이것은 오디오 재생을 위한 효율적인 개념을 제공한다. 또한, 많은 렌더러가 일반적으로 구 표현으로 객체 위치 표현을 처리하는 데 어려움을 겪기 때문에(또는 구 표현으로 객체 위치 정보를 전혀 다룰 수 없기 때문에) 카테시안 표현으로 객체 위치 정보를 수신하는 여러 유형의 렌더러가 사용될 수 있다는 점이 주의된다.

따라서, 구 표현의 객체 위치 정보를 카테시안 표현으로 변환시키기 위한 장치(1330)를 사용함으로써, 오디오 재생 장치는 카테시안 표현으로 제공되는 객체 위치 정보에 가장 적합한 렌더링 장치를 사용할 수 있다. 또한, 장치(1330)가, 전술된 바와 같이, 비교적 적은 연산 노력으로 구현될 수 있다는 점이 주의된다.

또한, 장치(1330)에는 장치(200)와 관련하여 설명된 특징 및 기능 및 세부사항 중 임의의 것이 추가될 수 있다는 점이 주의된다.

6. 도 14에 따른 방법

도 14는 오디오 객체의 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 방법의 흐름도를 도시한다.

청구항 14에 따른 방법(1400)은 복수의 베이스 영역 삼각형 중 어느 것에 베이스 영역으로의 오디오 객체의 객체 위치의 투영이 배열될지를 결정하는 단계(1410)를 포함한다. 방법은 또한, 선형 변환을 사용하여 객체 위치의 투영의 매핑된 위치를 결정하는 단계(1420)를 포함하며, 이는 베이스 영역 삼각형을 이의 연관된 구 도메인 삼각형에 매핑한다.

방법은 또한, 매핑된 위치로부터 방위각 및 중간 반경 값을 도출하는 단계(1430)를 포함한다. 방법은 또한, 중간 반경 값에 의존하고 베이스 영역으로부터 객체 위치의 거리에 의존하여 구 도메인 반경 값 및 고도각을 얻는 단계(1440)를 포함한다.

이 방법은, 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 상술된 장치와 동일한 고려 사항에 기반한다. 따라서, 방법(1400)에는, 예를 들어, 장치(100)와 관련하여 본원에서 설명된 특징, 기능 및 세부사항 중 임의의 것이 추가될 수 있다.

7. 도 15에 따른 방법

도 15는 오디오 객체의 객체 위치를 구 표현에서 카테시안 표현으로 변환시키기 위한 방법의 흐름도를 도시한다.

상기 방법은 고도각 또는 매핑된 고도각에 기반하고 구 도메인 반경 또는 매핑된 구 도메인 반경에 기반하여 베이스 영역 및 중간 반경으로부터 객체 위치의 거리를 설명하는 값을 얻는 단계(1510)를 포함한다.

방법은 또한, 중간 반경 또는 이의 수정된 버전에 기반하고, 방위각에 기반하여 원에 내접된 복수의 삼각형 중 하나 내의 위치를 결정하는 단계(1520)를 포함한다.

방법은 또한, 원에 내접된 삼각형 중 하나 내의 결정된 위치에 기반하여 카테시안 표현의 베이스 평면에 대한 객체 위치의 투영의 매핑된 위치를 결정하는 단계(1530)를 포함한다.

이 방법은 전술된 장치와 동일한 고려사항에 기반된다. 또한, 방법(1500)에는 본원에서 설명되는 특징, 기능 및 세부사항 중 임의의 것이 추가될 수 있다.

특히, 방법(1500)에는, 장치(200)와 관련하여 설명된 특징, 기능 및 세부사항 중 임의의 것이 추가될 수 있다.

8. 도 16에 따른 방법

도 16은 오디오 재생을 위한 방법(1600)의 흐름도를 도시한다.

방법은 객체 위치 정보의 구 표현을 포함하는 오디오 스트림을 수신하는 단계(1610)를 포함한다.

방법은 또한, 객체 위치 정보의 구 표현을 카테시안 표현으로 변환시키는 단계(1620)를 포함한다.

방법은 또한, 객체 위치 정보의 카테시안 표현에 의존하여 오디오 객체를 사운드 트랜스듀서와 연관된 복수의 채널 신호로 렌더링하는 단계(1630)를 포함한다.

특히, 방법(1600)에는 본원에서 설명되는 특징, 기능 및 세부사항 중 임의의 것이 추가될 수 있다.

9. 결론 및 추가 실시형태

다음으로, 본원에서 설명되는 특징, 기능 및 세부사항이 개별적으로 또는 조합되어 사용될 수 있는 추가 실시형태가 설명될 것이다.

또한, 다음에 설명되는 특징 및 기능 및 세부사항은 선택적으로 본원에서 설명되는 다른 실시형태 중 어느 하나와 조합되어 사용될 수 있다.

제1 양태는 상이한 좌표 공간들 사이에서 오디오 관련 객체 메타데이터를 변환시키는 방법을 생성한다.

제2 양태는 오디오 관련 객체 메타데이터를 룸 관련 좌표에서 청취자 관련 좌표로 또는 그 반대로 변환시키는 방법을 생성한다.

제3 양태는 상이한 좌표 공간들 사이에서 스피커 위치를 변환시키는 방법을 생성한다.

제4 양태는 스피커 위치 메타데이터를 룸 관련 좌표에서 청취자 관련 좌표로 또는 그 반대로 변환시키는 방법을 생성한다.

제5 양태는 오디오 객체 위치 메타 데이터를 카테시안 파라미터 공간에서 구 좌표계로 변환시키는 방법을 생성하여, xy 평면에서 방위각 j로의 변환과 z 성분에서 고도각 q로의 변환을 분리시킨다.

제6 양태는 카테시안 공간에서 구 좌표계로 스피커 위치를 정확하게 매핑하는 다섯 번째 양태에 따른 방법을 생성한다.

제7 양태는 스피커가 위치하는 카테시안 좌표계에서 직육면체 공간의 표면을 구 좌표계에서 대응하는 스피커를 포함하는 구의 표면에 투영시키는 제5 양태에 따른 방법을 생성한다.

제8 양태는 다음의 프로세싱 단계를 포함하는 제1 양태 내지 제5 양태 중 하나에 따른 방법을 생성한다:

- xy 평면에서 2개의 인접한 스피커 위치와 직육면체의 중심에 의해서 형성된 삼각형을 구 공간의 대응하는 삼각형에 투영하는 단계

- 구 좌표계의 수평면에 있는 스피커를 포함하는 대응하는 원 상에 xy 평면으로부터 스피커 직사각형의 외측 모서리를 매핑시키기 위해 반경을 수정하는 단계

- 구(3D) 반경을 결정하기 위해 z 구성 요소에 기반하여 반경 상에 고도를 적용시키는 단계

- 높이 스피커도 구에 매핑시키기 위해서 고도각에 기반하여 반경을 수정하는 단계

- 카테시안 좌표계와 구 좌표계에서 높이 스피커의 상이한 고도를 반영하기 위해서 고도각을 수정하는 단계

제9 양태는 제5 양태에 따른 역 동작을 수행하는 방법을 생성한다.

제10 양태는 제6 양태에 따른 역 동작을 수행하는 방법을 생성한다.

제11 양태는 제7 양태에 따른 역 동작을 수행하는 방법을 생성한다.

제12 양태는 제8 양태에 따른 역 동작을 수행하는 방법을 생성한다.

10. 추가 실시형태

다음으로, 본원에서(또한, 청구항에서) 설명되는 특징, 기능 및 세부사항이 개별적으로 또는 조합되어 사용될 수 있는 본 발명에 따른 추가 실시형태가 설명될 것이다. 또한, 본원에서(또한 청구항에서) 설명되는 다른 실시형태 중 임의의 것에는, 선택적으로 이 섹션에서 설명되는 특징, 기능 및 세부사항 중 임의의 것이 개별적으로 그리고 조합되어 추가될 수 있다.

동적 객체 위치 메타데이터에 대한 매핑 룰:

이 섹션은, 생성 측에서는 카테시안 좌표계가 사용되지만 전송 형식에서는 객체 위치 메타 데이터가 구 좌표로 설명되는 경우에, 생성 측 객체 메타 데이터, 특히 객체 위치 데이터로부터의 변환을 설명한다.

카테시안 좌표에서 스피커가 구 좌표계에 비해 수학적으로 정확한 위치에 항상 있지 않다는 점이 문제이다. 따라서, 카테시안 공간의 입방체 영역이 구(또는 반구)로 정확하게 투영되는 것을 보장하는 변환이 필요하다. 예를 들어, 스피커 위치는 구 좌표계에 기반하여 오디오 객체 렌더러(예를 들어, MPEG-H 3D 오디오 표준에 설명된 렌더러)를 사용하거나 대응하는 변환 알고리즘을 구비하는 카테시안 기반 렌더러를 사용하여 동일하게 렌더링된다. 입방체 표면은 스피커가 위치된 구의 표면에 매핑/투영되어야 한다.

또한, 변환 알고리즘은 특히 구에서 카테시안 좌표로의 변환 단계에서 작은 계산 복잡성을 갖는 것이 바람직하거나 요구된다.

본 발명에 따른 실시형태의 예시적 적용은 오디오 객체 좌표에 카테시안 파라미터 공간(x, y, z)을 종종 사용하지만, 구 좌표(방위각, 고도, 반경)로 오디오 객체 위치를 설명하는 전송 형식을 사용하는 최첨단 오디오 객체 저작 도구, 예를 들어, MPEG-H 3D 오디오를 사용하는 것이다. 그러나 전송 형식은 나중에 적용되는 렌더러(구 또는 카테시안)와 무관할 수 있다(또는 무관해야 한다).

변환이, 예시적으로, 5.1+4H 스피커 설정에 대해 설명되지만, 모든 종류의 스피커 설정(예를 들어, 7.1+4, 22.2 등) 또는 다양한 카테시안 매개변수 공간(축의 다른 배향 또는 축의 다른 배율,…)에 용이하게 이전될 수 있다.

좌표계의 전반적 비교

5.1+4H 설정을 위한 대응하는 스피커 위치를 갖는 카테시안 파라미터 룸의 예가 도 17에 도시된다.

ISO/IEC 23008-3:2015 MPEG-H 3D 오디오에 따른 구 좌표계의 예가 도 18에 도시된다.

ISO 좌표계의 X 및 Y 좌표는 위에서 설명된 카테시안 좌표계와 다르게 정의되는 점을 주의한다.

생성 측 변환 (카테시안 2 구)

스피커 위치는, 예를 들어, ITU-R 권장 사항 ITU-R BS.2051-1(프로그램 생성을 위한 진보된 사운드 시스템)에 설명되어 있고, MPEG-H 사양에 설명되어 있는 봐와 같이, 구 좌표로 제공된다. 변환은 별도의 접근 방식으로 적용된다. 먼저 x 및 y 좌표가 방위각/xy 평면의 방위각 φ 및 반경

로 매핑된다. 그 후, z 좌표를 사용하여 3D 공간의 고도각 및 반경이 계산된다. 매핑은 5.1+4H 스피커 설정에 대해 예시적으로 설명된다.

x = y = 0 특별한 경우:

z > 0 인 경우:

φ = 정의되지 않음(=0°), θ= 90° 및 r = z.

z = 0 인 경우:

φ = 정의되지 않음 (=0°), θ = 0° 및 r = 0.

1) xy-평면에서 변환

카테시안 좌표계의 그리고 구 좌표계의, 그리고 스피커(채워진 정사각형)의 개략적 표현을 도시하는 도 19를 참조한다.

단계 1:

카테시안 좌표계의 정사각형에 그리고 구 좌표계의 원에 내접된 삼각형의 그래픽 표현을 도시하는 도 20을 참조한다.

다음으로, 이것은 하나의 삼각형에 대해 예시적으로 도시된다. 또한, 도 21을 참조한다.

선형 변환을 사용하여 삼각형들은 서로에게 투영될 수 있다.

변환 매트릭스는 삼각형의 코너

,

및

의 알려진 위치를 사용하여 계산될 수 있다. 이러한 지점은 스피커 설정과 스피커의 대응하는 위치 및 위치 P가 위치되는 삼각형에 의존한다.

5.1+4H 스피커 설정은 중간층에 표준 5.1 스피커 설정을 포함하며, 이는 xy 평면에서 투영을 위한 기준이다. 표 2에서, 대응하는 점

,

및

가 투영되어야 하는 5개의 삼각형에 대해 주어진다.

단계 2:

매핑된 좌표

및

에 기반하여 반경

과 방위각 φ를 계산한다.

단계 3:

반경은, 스피커가 구 좌표계와 대조적으로 카테시안 좌표계의 정사각형에 배치되기 때문에, 조정되어야 한다. 구 좌표계에서, 스피커는 원에 위치된다.

반경을 조정하기 위해서, 카테시안 스피커 정사각형의 경계는 구 좌표계의 원에 투영된다. 이것은 현이 원의 대응하는 세그먼트 상에 투영되는 점을 의미한다.

2) z 성분의 변환

상단 층의 고도는 구 좌표계에서

= 30° (또는 35°)의 고도각으로 가정된다(ITU-R BS.2051에서 권장되는 전형적인 고도).

또한, 도 23을 참조한다.

단계 1:

반경

과 z 성분에 기반하여 고도각

을 계산한다. 또한, 각도

및

에 기반하여 3D 반경

을 계산한다.

단계 2:

카테시안 시스템의 직사각형 경계의 구 좌표계의 단위 원으로의 투영으로 인한 반경

의 수정.

또한, 도 24을 참조한다.

단계 3:

카테시안(

= 45°) 및 구 (

= 30° (또는 35°)) 좌표계에서 스피커의 상이한 배치로 인한 고도각

의 수정.

의 θ로의 매핑:

디코더 측 변환(Sph 2 Cart)

디코더 측에서는, 생성 측으로의 역변환이 실행되어야 한다. 이것은 변환 단계들이 반대 순서로 뒤집어진다는 점을 의미한다.

xy 평면에서 반경의 고도 및 투영의 변환 (z 성분의 계산)

특별한 경우 θ = 90°:

x = 0, y = 0 및 z = r

단계 1:

θ의

로의 매핑:

= 30° (or 35°)를 이용하여

단계 2:

반경 수정의 역:

= 45°을 이용하여

단계 3:

z 및

를 계산

x 및 y 성분의 계산

단계 1:

반경 수정의 역.

단계 2:

및

의 계산

단계 3:

x 및 y의 계산.

스프레드 메타데이터에 대한 매핑 룰:

인코더(Cart -> Sph): (참고: 균일한 스프레드 신호를 사용하지 않는다)

폭 스프레드:

, 높이 스프레드:

및 거리 스프레드:

디코더(Sph -> Cart)

비트 스트림에서 균일한 스프레드의 경우 변환은 다음과 같다:

,

, 및

을 [0, 1]의 범위로 한정한다.

11. 추가적인 설명

일반적인 설명으로서, 정확히 4개의 세그먼트 또는 삼각형을 사용할 필요는 없다는 점에 주의한다. 예를 들어, 세그먼트(또는 카테시안 도메인 삼각형 및 구 도메인 삼각형과 같은 삼각형)는 스피커 설정의 수평면의 스피커 위치에 의해 정의될 수 있다. 예를 들어, 5.1+4 높이 스피커(높여진 스피커) 설정에서, 세그먼트 또는 삼각형은 5.1 베이스 설정에 의해서 정의될 수 있다. 따라서, 5개의 세그먼트는 이러한 실시예에서 정의될 수 있다(예를 들어, 섹션 10에서의 설명을 참조). 7.1+4 높이 스피커(높여진 스피커) 설정에서, 7개의 세그먼트 또는 삼각형이 정의될 수 있다. 이것은, 예를 들어, (고정된 각도를 포함하지 않는) 섹션 10에서 보여지는 더 일반적인 수학식에 의해서 표현될 수 있다. 또한, 예를 들어, 높이 스피커(높여진 스피커)의 각도는 설정마다 다를 수 있다(예를 들어, 30도 또는 35도).

따라서, 삼각형의 수와 각도 범위는, 예를 들어, 실시형태마다 다를 수 있다.

12. 구현 대안예

본원에서 설명된 특징부 및 기능 중 어느 것은 이 섹션에서 설명되는 바와 같이, 하드웨어 또는 소프트웨어로 구현하거나, 하드웨어와 소프트웨어의 조합을 사용하여 구현될 수 있다.

일부 양태는 장치의 맥락에서 설명되었지만, 이러한 양태가 대응하는 방법의 설명을 또한 나타내는 점이 명확하며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게, 방법 단계의 맥락에서 설명된 양태는 또한 대응하는 장치의 대응하는 블록 또는 아이템 또는 특징부의 설명을 나타낸다. 방법 단계의 일부 또는 전부는, 예를 들어, 마이크로프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 사용하여) 실행될 수 있다. 일부 실시형태에서, 가장 중요한 방법 단계 중 하나 이상은 이러한 장치에 의해 실행될 수 있다.

특정 구현 요구사항에 따라, 본 발명의 실시형태는 하드웨어로 또는 소프트웨어로 구현될 수 있다. 구현은, 전자적으로 판독 가능한 제어 신호가 저장되어 있는, 플로피 디스크, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리와 같은 디지털 저장 매체를 사용하여 수행될 수 있으며, 이 저장 매체는, 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력한다(또는 협력할 수 있다). 따라서, 디지털 저장 매체는 컴퓨터 판독 가능할 수 있다.

본 발명에 따른 일부 실시형태는, 본원에 설명된 방법 중 하나가 수행되도록, 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전자적으로 판독 가능한 제어 신호를 갖는 데이터 캐리어를 포함한다.

일반적으로, 본 발명의 실시형태는 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있고, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때 방법 중 하나를 수행하기 위해서 동작된다. 프로그램 코드는, 예를 들어, 기계 판독 가능한 캐리어에 저장될 수 있다.

다른 실시형태는 기계 판독 가능한 캐리어에 저장된, 본원에서 설명되는 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.

따라서, 달리 말하면, 창의적인 방법의 실시형태는, 컴퓨터 프로그램이 컴퓨터에서 실행될 때 본원에서 설명되는 방법 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.

따라서, 창의적인 방법의 추가적인 실시형태는, 본원에서 설명되는 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 기록하여 포함하는 데이터 캐리어 (또는 디지털 저장 매체, 또는 컴퓨터 판독 가능 매체)이다. 데이터 캐리어, 디지털 저장 매체 또는 기록된 매체는 일반적으로 유형적이고 그리고/또는 비전이적(non-transitionary)이다.

따라서 창의적인 방법의 추가적인 실시형태는, 본원에서 설명되는 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호 시퀀스이다. 데이터 스트림 또는 신호 시퀀스는, 예를 들어, 데이터 통신 연결을 통해, 예를 들어, 인터넷을 통해 전송되도록 구성될 수 있다.

추가적인 실시형태는 본원에서 설명되는 방법 중 하나를 수행하도록 구성되거나 적응된 프로세싱 수단, 예를 들어, 컴퓨터 또는 프로그램 가능한 논리 장치를 포함한다.

추가적인 실시형태는 본원에서 설명되는 방법 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.

본 발명에 따른 추가적인 실시형태는 본원에서 설명되는 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기로 전송(예를 들어, 전자적으로 또는 광학적으로)하도록 구성된 장치 또는 시스템을 포함한다. 수신기는, 예를 들어, 컴퓨터, 모바일 장치, 메모리 장치 등일 수 있다. 장치 또는 시스템은, 예를 들어, 컴퓨터 프로그램을 수신기로 전송하기 위한 파일 서버를 포함할 수 있다.

일부 실시형태에서, 프로그램 가능한 논리 장치(예를 들어, 필드 프로그램 가능 게이트 어레이)는 본원에서 설명되는 방법의 일부 또는 모든 기능을 수행하기 위해서 사용될 수 있다. 일부 실시형태에서, 필드 프로그램 가능 게이트 어레이는 본원에서 설명되는 방법 중 하나를 수행하기 위해 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법은, 바람직하게는, 임의의 하드웨어 장치에 의해 수행된다.

본원에서 설명되는 장치는 하드웨어 장치를 사용하거나, 컴퓨터를 사용하거나, 또는 하드웨어 장치와 컴퓨터의 조합을 사용하여 구현될 수 있다.

본원에서 설명되는 장치 또는 본원에서 설명되는 장치의 임의의 구성요소는 적어도 부분적으로 하드웨어 및/또는 소프트웨어로 구현될 수 있다.

본원에서 설명되는 방법은 하드웨어 장치를 사용하거나, 컴퓨터를 사용하거나, 또는 하드웨어 장치와 컴퓨터의 조합을 사용하여 수행될 수 있다.

본원에서 설명되는 방법 또는 본원에서 설명되는 장치의 임의의 구성요소는 적어도 부분적으로 하드웨어 및/또는 소프트웨어에 의해 수행될 수 있다.

상술된 실시형태는 본 발명의 원리에 대해 단지 도해적일 뿐이다. 본원에서 설명되는 배열체 및 세부사항의 수정 및 변경이 당업자에게 명백 할 것이라는 것이 이해된다. 따라서, 본원에서 실시형태의 설명 및 설명에 의해 제시되는 특정 세부사항이 아니라 후속하는 특허 청구범위에 의해서만 제한된다.

Claims

오디오 객체의 객체 위치를 카테시안 표현(110)에서 구 표현(112)으로 변환시키기 위한 장치(100)에 있어서,
상기 카테시안 표현의 기준(basis) 영역은 복수의 기초 영역 삼각형(630,532,634,636)으로 세분화되고, 복수의 구 도메인 삼각형(660,662,664,666)은 구 표현의 원에 내접되어 있으며,
상기 장치는, 베이스 영역으로의 상기 오디오 객체의 객체 위치의 투영(P)이 상기 베이스 영역 삼각형 중 어느 것에 배열되는지를 결정하도록 구성되고;
상기 장치는, 상기 베이스 영역 삼각형을 이의 연관된 구 도메인 삼각형에 매핑하는 선형 변환(
)을 사용하여 상기 객체 위치의 투영(P)의 매핑된 위치(
)를 결정하도록 구성되고,
상기 장치는 상기 매핑된 위치(
)로부터 방위각(φ) 및 중간 반경 값(
)을 유도하도록 구성되고;
상기 장치는 중간 반경 값(r_xy,
)에 따라, 그리고 상기 베이스 영역으로부터 상기 객체 위치의 거리(z)에 따라 구 도메인 반경 값(
, r)과 고도각(
)을 얻도록 구성되는, 장치.
제1 항에 있어서, 상기 장치는 아래식에 따라 변환 매트릭스 T에 의해 표현되는 선형 변환을 사용하여 상기 객체 위치의 투영 P의 매핑된 위치
를 결정하도록 구성되며,

상기 장치는 상기 결정된 기초 영역 삼각형에 따라 상기 변환 매트릭스를 획득하도록 구성되는, 장치.
제2항에 있어서, 상기 변환 매트릭스는 다음 식에 따라 정의되며,

상기 식에서,
,
,
,
는 상기 결정된 기초 영역 삼각형의 두 코너의 x 좌표 및 y 좌표이고;
상기 식에서,
,
,
,
는 상기 연관된 구 도메인 삼각형의 두 코너에 대한 x 좌표 및 y 좌표인, 장치.
제1항 내지 제3항 중 한 항에 있어서, 상기 베이스 영역 삼각형은,
- 상기 카테시안 표현의 원점 앞 영역을 커버하는 제1 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 좌측 영역을 커버하는 제2 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 우측 영역을 커버하는 제3 베이스 영역 삼각형, 및
- 상기 카테시안 표현의 원점 뒤 영역을 커버하는 제4 베이스 영역 삼각형을 포함하는, 장치.
제1항 내지 제4항 중 한 항에 있어서, 상기 구 도메인 삼각형은,
- 상기 구 표현의 원점 앞 영역을 커버하는 제1 구 도메인 삼각형,
- 상기 구 표현의 원점 좌측 영역을 커버하는 제2 구 도메인 삼각형,
- 상기 구 표현의 원점 우측 영역을 커버하는 제3 구 도메인 삼각형, 및
- 상기 구 표현의 원점 뒤 영역을 커버하는 제4 구 도메인 삼각형을 포함하는, 장치.
제1항 내지 제3항 중 한 항에 있어서, 상기 베이스 영역 삼각형은,
- 상기 카테시안 표현의 원점 앞 우측 영역을 커버하는 제1 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 앞 좌측 영역을 커버하는 제2 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 좌측 영역을 커버하는 제3 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 우측 영역을 커버하는 제4 베이스 영역 삼각형, 및
- 상기 카테시안 표현의 원점 뒤 영역을 커버하는 제5 베이스 영역 삼각형을 포함하는, 장치.
제1항 내지 제4항 및 제6항 중 한 항에 있어서, 상기 구 도메인 삼각형은,
- 상기 구 표현의 원점 앞 우측 영역을 커버하는 제1 구 도메인 삼각형,
- 상기 구 표현의 원점 앞 좌측 영역을 커버하는 제2 구 도메인 삼각형,
- 상기 구 표현의 원점 좌측 영역을 커버하는 제3 구 도메인 삼각형,
- 상기 구 표현의 원점 우측 영역을 커버하는 제4 구 도메인 삼각형, 및
- 상기 구 표현의 원점 뒤 영역을 커버하는 제5 구 도메인 삼각형을 포함하는, 장치.
제1항 내지 제5항 중 한 항에 있어서,
상기 베이스 영역 삼각형의 코너의 좌표 P1, P2 및 연관된 구 도메인 삼각형의 코너의 좌표
및
는 다음과 같이 정의되며,

상기 삼각형 각각의 제3 코너는 상기 좌표계 각각의 원점에 있는, 장치.
제1항 내지 제3항 및 제6항 내지 제7항 중 한 항에 있어서,
상기 베이스 영역 삼각형의 코너의 좌표 P1, P2 및 연관된 구 도메인 삼각형의 코너의 좌표
및
는 다음과 같이 정의되며,

상기 삼각형 각각의 제3 코너는 상기 좌표계 각각의 원점에 있는, 장치.
제1항 내지 제9항에 있어서,
상기 장치는 다음 식에 따라,

매핑된 위치(
)의 매핑된 좌표
및
로부터 상기 방위각 φ을 유도하도록 구성되는, 장치
제1항 내지 제10항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 매핑된 위치(
)의 매핑된 좌표
및
로부터 상기 중간 반경 값
을 유도하도록 구성되는, 장치
제1항 내지 제11항 중 한 항에 있어서,
상기 장치는 상기 원에 내접된 구 도메인 삼각형을 원 세그먼트에 매핑하는 반경 조정을 사용하여 상기 중간 반경 값에 따라 상기 구 도메인 반경 값(
, r)을 얻도록 구성되는 장치.
제1항 내지 제12항 중 한 항에 있어서,
상기 장치는 반경 조정을 사용하여 상기 중간 반경 값에 따라 상기 구 도메인 반경 값(
, r )을 얻도록 구성되고,
상기 반경 조정은 상기 방위각 φ에 따라 전에 얻어진 상기 중간 반경 값(
)을 스케일링 하도록 구성되는, 장치.
제1항 내지 제13항 중 한 항에 있어서,
상기 장치는 상기 형태의 매핑을 사용하여 상기 중간 반경 값에 따라 상기 구 도메인 반경 값(
, r)을 얻도록 구성되고,

상기
는 상기 중간 반경 값
의 반경 조정 버전이고;
상기 φ는 방위각인, 장치.
제1항 내지 제14항 중 한 항에 있어서,
상기 장치는 상기 형태의 매핑을 사용하여 상기 중간 반경 값
에 따라 상기 구 도메인 반경 값(r_xy)을 얻도록 구성되고,

상기 식에서,
및
는 구 도메인 삼각형 각각의 두 개의 코너의 위치 각도인, 장치.
제1항 내지 제15항 중 한 항에 있어서,
상기 장치는, 상기 중간 반경 값을 가지며 상기 베이스 영역으로부터 상기 객체 위치의 거리의 다리를 갖는 직각 삼각형의 각도로서, 상기 고도각을 얻도록 구성되는 장치.
제1항 내지 제16항 중 한 항에 있어서,
상기 장치는, 상기 중간 반경 값을 가지며 상기 베이스 영역으로부터 상기 객체 위치의 거리의 다리를 갖는 직각 삼각형의 빗변 길이
로서, 또는 이의 조정된 버전으로서, 상기 구 도메인 반경을 얻도록 구성되는 장치.
제1항 내지 제17항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 고도각
을 얻도록 구성되고, 및/또는

다음 식에 따라 상기 구 도메인 반경
을 얻도록 구성되고,

상기 z는 상기 베이스 영역으로부터 상기 객체 위치의 거리이고,
상기
는 상기 중간 반경 값 또는 이의 조정된 버전인, 장치.
제1항 내지 제18항 중 한 항에 있어서,
상기 장치는 조정된 고도각(θ)을 얻도록 구성되는, 장치.
제19항에 있어서,
상기 장치는, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고, 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여 상기 조정된 고도각을 얻도록 구성되고,
상기 제1 각도 영역은 상기 제1 매핑된 각도 영역에 비하여 상이한 폭을 갖는, 장치.
제20항에 있어서,
제1 각도 영역 및 상기 제2 각도 영역에 의해 함께 커버되는 각도 범위는 상기 제1 매핑된 각도 영역 및 상기 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일한, 장치.
제19항 내지 제21항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 고도각
을 상기 조정된 고도각 θ으로 매핑하도록 구성되는, 장치.
제19항 내지 제22항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 고도각
을 상기 조정된 고도각 θ으로 매핑하도록 구성되는, 장치.

상기
은 상기 카테시안 좌표계에서 높이 스피커의 고도각이고;
상기
은 상기 구 좌표계에서 높이 스피커의 고도각인, 장치.
제1항 내지 제23항 중 한 항에 있어서,
상기 장치는 구 도메인 반경에 기반하여 조정된 구 도메인 반경을 얻도록 구성되는, 장치.
제24항에 있어서,
상기 장치는 조정된 구 도메인 반경을 얻기 위해, 카테시안 시스템의 정사각형 경계를 구 좌표계의 원에 매핑하는 매핑을 수행하도록 구성되는 장치.
제24항 또는 제25항에 있어서,
상기 장치는 다음 식에 따라 상기 구 도메인 반경
을 상기 조정된 구 도메인 반경에 매핑하도록 구성되고,

상기
는 상기 고도각인, 장치.
오디오 객체의 객체 위치를 구 표현(218,228,258)에서 카테시안 표현(242,292)으로 변환시키기 위한 장치(200)에 있어서,
상기 카테시안 표현의 기초 영역(basis area)은 복수의 기초 영역 삼각형으로 세분화되고, 복수의 구 도메인 삼각형은 구 표현의 원에 내접되어 있으며,
상기 장치는, 상기 고도각(218)에 기반하거나 또는 상기 매핑된 고도각(222)에 기반하고, 상기 구 도메인 반경(228)에 기반하거나 또는 상기 매핑된 구 도메인 반경(232)에 기반하여 상기 베이스 영역으로부터 상기 객체 위치의 거리를 설명하는 값(z)(242) 및 중간 반경(252, r_xy)을 획득하도록 구성되고;
상기 장치는 상기 중간 반경(252), 또는 이의 수정된 버전(262)에 기반하고, 방위각(φ)에 기반하여 상기 원에 내접된 삼각형 중 하나 내의 위치(272,
)를 결정하도록 구성되고;
상기 장치는 상기 원에 내접된 상기 삼각형 중 하나 내의 결정된 위치(272,
)에 기반하여 상기 베이스 평면에 대한 상기 객체 위치의 투영(272, P)의 매핑된 위치(292)를 결정하도록 구성되는, 장치.
제27항에 있어서,
상기 장치는 고도각에 기반하여 매핑된 고도각(
)을 획득하도록 구성되는, 장치.
제28항에 있어서,
상기 장치는, 제1 각도 영역의 각도를 제1 매핑된 각도 영역에 선형적으로 매핑하고, 제2 각도 영역 내의 각도를 제2 매핑된 각도 영역에 선형적으로 매핑하는 비선형 매핑을 사용하여 상기 매핑된 고도각을 얻도록 구성되고, 상기 제1 각도 영역은 상기 제1 매핑된 각도 영역에 비하여 상이한 폭을 갖는, 장치.
제29항에 있어서,
상기 제1 각도 영역 및 상기 제2 각도 영역에 의해 함께 커버되는 각도 범위는 상기 제1 매핑된 각도 영역 및 상기 제2 매핑된 각도 영역에 의해 함께 커버되는 각도 범위와 동일한, 장치.
제28항 내지 제30항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 고도각 θ을 상기 매핑된 고도각
으로 매핑하도록 구성되는, 장치
제28항 내지 제31항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 고도각 θ을 상기 매핑된 고도각
으로 매핑하도록 구성되고,

상기
은 상기 카테시안 좌표계에서 높이 스피커의 고도각이고;
상기
은 상기 구 좌표계에서 높이 스피커의 고도각인, 장치.
제27항 내지 제32항 중 한 항에 있어서,
상기 장치는 구 도메인 반경에 기반하여 매핑된 구 도메인 반경
을 얻도록 구성되는, 장치.
제33항에 있어서,
상기 장치는 상기 고도각에 따라 또는 상기 매핑된 고도각에 따라 상기 구 도메인 반경을 스케일링하도록 구성되고,
상기 장치는 구 좌표계의 원을 카테시안 시스템의 정사각형 경계에 매핑하는 매핑을 수행하도록 구성되는, 장치.
제33항 또는 제34항에 있어서,
상기 장치는 다음 식에 따라 구 도메인 반경에 기반하여 상기 매핑된 구 도메인 반경
을 얻도록 구성되고,

상기
는 상기 고도각 또는 상기 매핑된 고도각인, 장치.
제33항 내지 제35항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 구 도메인 반경에 기반하여 상기 매핑된 구 도메인 반경
을 얻도록 구성되고,

상기
는 상기 고도각 또는 상기 매핑된 고도각이고,
상기
은 상기 구 좌표계에서 높이 스피커의 고도각인, 장치.
제27항 내지 제36항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 베이스 영역으로부터 상기 객체 위치의 거리를 설명하는 상기 값 z를 얻도록 구성되고,

및/또는
상기 장치는 다음 식에 따라 상기 중간 반경 r_xy 을 얻도록 구성되고,

상기
는 상기 구 도메인 반경 또는 상기 매핑된 구 도메인 반경이고;
상기
는 상기 고도각 또는 상기 매핑된 고도각인, 장치.
제27항 내지 제37항 중 한 항에 있어서,
상기 장치는 원 세그먼트를 원에 내접된 삼각형에 매핑하는 매핑을 사용하여 반경 수정을 수행하도록 구성되는, 장치.
제27항 내지 제38항 중 한 항에 있어서,
상기 장치는 수정된 반경을 얻기 위해 상기 방위각에 따라 상기 중간 반경을 스케일링하도록 구성되는, 장치.
제27항 내지 제39항 중 한 항에 있어서,
상기 장치는 다음 식에 따라서 상기 중간 반경
에 기반하여 상기 수정된 반경
을 얻도록 구성되고,

상기 식에서, φ는 상기 방위각인, 장치.
제27항 내지 제40항 중 한 항에 있어서,
상기 장치는 다음 식에 따라서 상기 중간 반경
에 기반하여 상기 수정된 반경
을 얻도록 구성되고,

상기 φ 는 상기 방위각이고,
상기
및
는 구 도메인 삼각형 각각의 두 개의 코너의 위치 각도인, 장치.
제27항 내지 제41항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 원에 내접된 삼각형 중 하나 내의 위치(
)를 결정하도록 구성되고,

상기
및
는 좌표 값이고;
상기
는 상기 중간 반경 또는 상기 수정된 반경이고;
상기 φ는 상기 방위각인, 장치.
제27항 내지 제42항 중 한 항에 있어서,
상기 장치는, 상기 결정된 위치가 있는 삼각형을 상기 베이스 평면에 있는 연관된 삼각형에 매핑하는 선형 변환을 사용하여 상기 원에 내접된 삼각형 중 하나 내의 결정된 위치(
)에 기반하여 상기 베이스 평면에 대한 상기 객체 위치의 투영 P의 매핑된 위치를 결정하도록 구성되는, 장치.
제27항 내지 제43항 중 한 항에 있어서,
상기 장치는 다음 식에 따라 상기 베이스 평면에 대한 상기 객체 위치의 투영 P의 매핑된 위치를 결정하도록 구성되고,

상기 식에서, T는 변환 매트릭스이고,
상기 식에서,
는 상기 베이스 평면에 대한 상기 객체 위치의 투영을 나타내는 벡터인, 장치.
제44항에 있어서, 상기 변환 매트릭스는 다음 식에 따라 정의되고,

상기
,
,
,
는 상기 결정된 기초 영역 삼각형의 두 코너의 x 좌표 및 y 좌표이고;
상기
,
,
,
는 상기 연관된 구 도메인 삼각형의 두 코너에 대한 x 좌표 및 y 좌표인, 장치.
제27항 내지 제45항 중 한 항에 있어서, 상기 베이스 영역 삼각형은,
- 상기 카테시안 표현의 원점 앞 영역을 커버하는 제1 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 좌측 영역을 커버하는 제2 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 우측 영역을 커버하는 제3 베이스 영역 삼각형, 및
- 상기 카테시안 표현의 원점 뒤 영역을 커버하는 제4 베이스 영역 삼각형을 포함하는, 장치.
제27항 내지 제46항 중 한 항에 있어서, 상기 구 도메인 삼각형은,
- 상기 구 표현의 원점 앞 영역을 커버하는 제1 구 도메인 삼각형,
- 상기 구 표현의 원점 좌측 영역을 커버하는 제2 구 도메인 삼각형,
- 상기 구 표현의 원점 우측 영역을 커버하는 제3 구 도메인 삼각형, 및
- 상기 구 표현의 원점 뒤 영역을 커버하는 제4 구 도메인 삼각형을 포함하는, 장치.
제27항 내지 제45항 중 한 항에 있어서, 상기 베이스 영역 삼각형은,
- 상기 카테시안 표현의 원점 앞 우측 영역을 커버하는 제1 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 앞 좌측 영역을 커버하는 제2 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 좌측 영역을 커버하는 제3 베이스 영역 삼각형,
- 상기 카테시안 표현의 원점 우측 영역을 커버하는 제4 베이스 영역 삼각형, 및
- 상기 카테시안 표현의 원점 뒤 영역을 커버하는 제5 베이스 영역 삼각형을 포함하는, 장치.
제27항 내지 제45항 및 제48항 중 한 항에 있어서, 상기 구 도메인 삼각형은,
- 상기 구 표현의 원점 앞 우측 영역을 커버하는 제1 구 도메인 삼각형,
- 상기 구 표현의 원점 앞 좌측 영역을 커버하는 제2 구 도메인 삼각형,
- 상기 구 표현의 원점 좌측 영역을 커버하는 제3 구 도메인 삼각형,
- 상기 구 표현의 원점 우측 영역을 커버하는 제4 구 도메인 삼각형, 및
- 상기 구 표현의 원점 뒤 영역을 커버하는 제5 구 도메인 삼각형을 포함하는, 장치.
제27항 내지 제49항 중 한 항에 있어서,
베이스 영역 삼각형의 코너의 좌표 P1, P2 및 연관된 구 도메인 삼각형의 코너의 좌표
및
는 다음과 같이 정의되고,

상기 삼각형 각각의 제3 코너는 상기 좌표계 각각의 원점에 있는, 장치.
오디오 스트림을 제공하기 위한 오디오 스트림 제공기(1100)에 있어서,
상기 오디오 스트림 제공기는 카테시안 표현으로 오디오 객체의 위치를 설명하는 입력 객체 위치 정보(1110)를 수신하도록 구성되고,
구 표현으로 상기 오디오 객체의 위치를 설명하는 출력 객체 위치 정보를 포함하는 오디오 스트림(1112)을 제공하도록 구성되고,
상기 오디오 스트림 제공기는 상기 카테시안 표현을 상기 구 표현으로 변환시키기 위해 제1항 내지 제26항 중 어느 한 항에 따른 장치(100; 1130)를 포함하는, 오디오 스트림 제공기.
오디오 콘텐츠 생성 시스템(1200)에 있어서,
상기 오디오 콘텐츠 생성 시스템은 카테시안 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 결정하도록 구성되고,
상기 오디오 콘텐츠 생성 시스템은 상기 카테시안 표현을 상기 구 표현으로 변환시키기 위해 제1항 내지 제26항 중 어느 한 항에 따른 장치(100; 1230)를 포함하고,
상기 오디오 콘텐츠 생성 시스템은 상기 구 표현을 오디오 스트림에 포함시키도록 구성되는, 오디오 콘텐츠 생성 시스템.
오디오 재생 장치(1300)에 있어서,
상기 오디오 재생 장치는 객체 위치 정보의 구 표현을 포함하는 오디오 스트림(1112; 1212; 1310)을 수신하도록 구성되고,
상기 오디오 재생 장치는 상기 객체 위치 정보의 구 표현을 카테시안 표현으로 변환시키도록 구성되는 제27항 내지 제50항 중 한 항에 따른 장치(200; 1330)를 포함하고,
상기 오디오 재생 장치는 상기 객체 위치 정보의 카테시안 표현에 따라 오디오 객체를 사운드 트랜스듀서(transducer)와 연관된 복수의 채널 신호(1350)로 렌더링하도록 구성된 렌더러(1340)를 포함하는, 오디오 재생 장치.
오디오 스트림을 제공하기 위한 오디오 스트림 제공기(1100)에 있어서,
상기 오디오 스트림 제공기는 구 표현으로 오디오 객체의 위치를 설명하는 입력 객체 위치 정보(1110)를 수신하도록 구성되고,
카테시안 표현으로 상기 오디오 객체의 위치를 설명하는 출력 객체 위치 정보를 포함하는 오디오 스트림(1112)을 제공하도록 구성되고,
상기 오디오 스트림 제공기는 상기 구 표현을 상기 카테시안 표현으로 변환시키기 위해 제27항 내지 제50항 중 한 항에 따른 장치(100; 1130)를 포함하는, 오디오 스트림 제공기.
오디오 콘텐츠 생성 시스템(1200)에 있어서,
상기 오디오 콘텐츠 생성 시스템은 구 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 결정하도록 구성되고,
상기 오디오 콘텐츠 생성 시스템은 상기 구 표현을 상기 카테시안 표현으로 변환시키기 위해 제27항 내지 제50항 중 어느 한 항에 따른 장치(100; 1230)를 포함하고,
상기 오디오 콘텐츠 생성 시스템은 상기 카테시안 표현을 오디오 스트림에 포함시키도록 구성되는, 오디오 콘텐츠 생성 시스템.
오디오 재생 장치(1300)에 있어서,
상기 오디오 재생 장치는 객체 위치 정보의 카테시안 표현을 포함하는 오디오 스트림(1112; 1212; 1310)을 수신하도록 구성되고,
상기 오디오 재생 장치는 상기 객체 위치 정보의 카테시안 표현을 구 표현으로 변환시키도록 구성되는 제1항 내지 제27항 중 한 항에 따른 장치(200; 1330)를 포함하고,
상기 오디오 재생 장치는 상기 객체 위치 정보의 구 표현에 따라 오디오 객체를 사운드 트랜스듀서와 연관된 복수의 채널 신호(1350)로 렌더링하도록 구성된 렌더러(1340)를 포함하는, 오디오 재생 장치.
오디오 객체의 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 방법(1400)에 있어서,
상기 카테시안 표현의 기초 영역은 복수의 기초 영역 삼각형으로 세분화되고, 복수의 구 도메인 삼각형은 구 표현의 원에 내접되어 있고,
상기 방법은, 상기 베이스 영역으로의 상기 오디오 객체의 객체 위치의 투영 P가 상기 베이스 영역 삼각형 중 어느 것에 배열되는지를 결정하는 단계(1410)를 포함하고;
상기 방법은, 상기 베이스 영역 삼각형을 이의 연관된 구 도메인 삼각형에 매핑하는 선형 변환(
)을 사용하여 상기 객체 위치의 투영 P의 매핑된 위치(
)를 결정하는 단계(1420)를 포함하고,
상기 방법은 상기 매핑된 위치(
)로부터 방위각[φ] 및 중간 반경 값(
)을 유도하는 단계(1430)를 포함하고,
상기 방법은 상기 중간 반경 값(r_xy,
)에 따라, 그리고 상기 베이스 영역으로부터 상기 객체 위치의 거리(z)에 따라 구 도메인 반경 값(
, r)과 고도각(
)을 얻는 단계(1440)를 포함하는, 방법.
오디오 객체의 객체 위치를 구 표현에서 카테시안 표현으로 변환시키기 위한 방법(1500)에 있어서,
상기 카테시안 표현의 기초 영역은 복수의 기초 영역 삼각형으로 세분화되고, 복수의 구 도메인 삼각형은 구 표현의 원에 내접되어 있고,
상기 방법은 고도각 또는 매핑된 고도각에 기반하고 구 도메인 반경 또는 매핑된 구 도메인 반경에 기반하여 베이스 영역으로부터 상기 객체 위치의 거리를 설명하는 값(z) 및 중간 반경(r_xy)을 얻는 단계(1510)를 포함하고,
상기 방법은 상기 중간 반경 또는 이의 수정된 버전에 기반하고, 방위각[φ]에 기반하여 상기 원에 내접된 삼각형 중 하나 내의 위치(
)를 결정하는 단계(1520)를 포함하고,
상기 방법은 상기 원에 내접된 상기 삼각형 중 하나 내의 결정된 위치(
)에 기반하여 상기 베이스 평면에 대한 상기 객체 위치의 투영 P의 매핑된 위치를 결정하는 단계(1530)를 포함하는, 방법.
오디오 스트림을 제공하기 위한 방법에 있어서,
상기 방법은 카테시안 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 수신하는 단계, 및
구 표현으로 상기 객체의 위치를 설명하는 출력 객체 위치 정보를 포함하는 오디오 스트림을 제공하는 단계를 포함하고,
상기 방법은 제57항에 따른 방법을 사용하여 상기 카테시안 표현을 상기 구 표현으로 변환시키는 단계를 포함하는, 방법.
오디오 콘텐츠를 생성하기 위한 방법에 있어서,
상기 방법은 카테시안 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 결정하는 단계를 포함하고,
상기 방법은 제57항에 따른 방법을 사용하여 상기 카테시안 표현을 상기 구 표현으로 변환시키는 단계를 포함하고,
상기 방법은 상기 구 표현을 오디오 스트림에 포함시키는 단계를 포함하는, 방법.
오디오 재생을 위한 방법(1600)에 있어서,
상기 방법은 객체 위치 정보의 구 표현을 포함하는 오디오 스트림을 수신하는 단계(1610)를 포함하고,
상기 방법은 제58항에 따라 객체 위치 정보의 상기 구 표현을 카테시안 표현으로 변환시키는 단계(1620)를 포함하고,
상기 방법은 상기 객체 위치 정보의 카테시안 표현에 의존하여 오디오 객체를 사운드 트랜스듀서와 연관된 복수의 채널 신호로 렌더링하는 단계(1630)를 포함하는, 방법.
오디오 스트림을 제공하기 위한 방법에 있어서,
상기 방법은 구 표현으로 오디오 객체의 위치를 설명하는 입력 객체 위치 정보를 수신하는 단계, 및
카테시안 표현으로 상기 객체의 위치를 설명하는 출력 객체 위치 정보를 포함하는 오디오 스트림을 제공하는 단계를 포함하고,
상기 방법은 제58항에 따른 방법을 사용하여 상기 구 표현을 상기 카테시안 표현으로 변환시키는 단계를 포함하는, 방법.
오디오 콘텐츠를 생성하기 위한 방법에 있어서,
상기 방법은 구 표현으로 오디오 객체의 위치를 설명하는 객체 위치 정보를 결정하는 단계를 포함하고,
상기 방법은 제58항에 따른 방법을 사용하여 상기 구 표현을 상기 카테시안 표현으로 변환시키는 단계를 포함하고,
상기 방법은 상기 카테시안 표현을 오디오 스트림에 포함시키는 단계를 포함하는, 방법.
오디오 재생을 위한 방법(1600)에 있어서,
상기 방법은 객체 위치 정보의 카테시안 표현을 포함하는 오디오 스트림을 수신하는 단계를 포함하고,
상기 방법은 제57항에 따라 상기 객체 위치 정보의 카테시안 표현을 구 표현으로 변환시키는 단계를 포함하고,
상기 방법은 상기 객체 위치 정보의 구 표현에 의존하여 오디오 객체를 사운드 트랜스듀서와 연관된 복수의 채널 신호로 렌더링하는 단계를 포함하는, 방법.
컴퓨터에서 실행될 때 제57항 내지 제64항 중 한 항에 따른 방법을 수행하기 위한 컴퓨터 프로그램.
오디오 객체의 객체 위치를 카테시안 표현(110)에서 구 표현(112)으로 변환시키기 위한 장치(100)에 있어서, 상기 객체 위치는 방위각, 고도각 및 구 도메인 반경을 사용하여 설명되고,
예를 들어, 스피커가 상기 카테시안 표현과 연관된 카테시안 좌표계의 정사각형에 배치되고 스피커는 상기 구 표현과 연관된 구 좌표계의 원에 배치되고;
상기 카테시안 표현의 기초 영역은 복수의 기초 영역 삼각형(630,532,634,636)으로 세분화되고, 복수의 구 도메인 삼각형(660,662,664,666)은 상기 구 표현의 원에 내접되어 있고,
상기 구 도메인 삼각형 각각은 기초 영역 삼각형에 연관되고;
상기 기초 영역 삼각형들 중 적어도 일부의 코너 위치는 상기 카테시안 좌표계에서 스피커의 위치에 대응하고,
상기 구 도메인 삼각형들 중 적어도 일부의 코너 위치는 상기 구 좌표계에서 스피커의 위치에 대응하고,
상기 장치는, 베이스 영역으로의 상기 오디오 객체의 객체 위치의 투영(P)가 상기 베이스 영역 삼각형 중 어느 것에 배열되는지를 결정하도록 구성되고;
상기 장치는, 상기 기초 영역 삼각형을 구 도메인 삼각형에 매핑하는 선형 변환(
)을 사용하여 상기 객체 위치의 투영 P의 매핑된 위치(
)를 결정하도록 구성되고,
상기 장치는 상기 매핑된 위치(
)로부터 방위각(φ) 및 중간 반경 값(
)을 유도하도록 구성되고;
상기 장치는 중간 반경 값(r_xy,
)에 따라, 그리고 상기 베이스 영역으로부터 상기 객체 위치의 거리(z)에 따라 구 도메인 반경 값(
, r)과 고도각(
)을 얻도록 구성되는, 장치.
오디오 객체의 객체 위치를 카테시안 표현에서 구 표현으로 변환시키기 위한 방법(1400)에 있어서, 상기 객체 위치는 방위각, 고도각 및 구 도메인 반경을 사용하여 설명되고,
예를 들어, 스피커는 상기 카테시안 표현과 연관된 카테시안 좌표계의 정사각형에 배치되고 스피커는 상기 구 표현과 연관된 구 좌표계의 원에 배치되고;
상기 카테시안 표현의 기초 영역은 복수의 기초 영역 삼각형으로 세분화되고, 복수의 구 도메인 삼각형은 상기 구 표현의 원에 내접되어 있고,
상기 구 도메인 삼각형 각각은 기초 영역 삼각형에 연관되고;
상기 기초 영역 삼각형들 중 적어도 일부의 코너 위치는 상기 카테시안 좌표계에서 스피커의 위치에 대응하고,
상기 구 도메인 삼각형들 중 적어도 일부의 코너 위치는 상기 구 좌표계에서 스피커의 위치에 대응하고,
상기 방법은, 상기 베이스 영역으로의 상기 오디오 객체의 객체 위치의 투영 P가 상기 베이스 영역 삼각형 중 어느 것에 배열되는지를 결정하는 단계(1410)를 포함하고;
상기 방법은, 상기 기초 영역 삼각형을 이의 연관된 구 도메인 삼각형에 매핑하는 선형 변환(
)을 사용하여 상기 객체 위치의 투영 P의 매핑된 위치(
)를 결정하는 단계(1420)를 포함하고,
상기 방법은 상기 매핑된 위치(
)로부터 방위각[φ] 및 중간 반경 값(
)을 유도하는 단계(1430)를 포함하고,
상기 방법은 상기 중간 반경 값(r_xy,
)에 따라, 그리고 상기 베이스 영역으로부터 상기 객체 위치의 거리(z)에 따라 구 도메인 반경 값(
, r)과 고도각(
)을 얻는 단계(1440)를 포함하는, 방법.
오디오 객체의 객체 위치를, 상기 객체 위치가 방위각, 고도각 및 구 도메인 반경을 사용하여 설명되는 구 표현(218,228,258)에서 카테시안 표현(242,292)으로 변환시키기 위한 장치(200)에 있어서,
예를 들어, 스피커는 상기 카테시안 표현과 연관된 카테시안 좌표계의 정사각형에 배치되고 스피커는 상기 구 표현과 연관된 구 좌표계의 원에 배치되고;
상기 카테시안 표현의 기초 영역은 복수의 기초 영역 삼각형으로 세분화되고, 복수의 구 도메인 삼각형은 상기 구 표현의 원에 내접되어 있고,
상기 기초 영역 삼각형들 중 적어도 일부의 코너 위치는 상기 카테시안 좌표계에서 스피커의 위치에 대응하고,
상기 구 도메인 삼각형들 중 적어도 일부의 코너 위치는 상기 구 좌표계에서 스피커의 위치에 대응하고,
상기 장치는, 상기 고도각(218) 또는 매핑된 고도각(222)에 기반하고, 상기 구 도메인 반경(228) 또는 매핑된 구 도메인 반경(232)에 기반하여 상기 베이스 영역으로부터 상기 객체 위치의 거리를 설명하는 값(z)(242) 및 중간 반경(252, r_xy)을 획득하도록 구성되고;
상기 장치는 상기 중간 반경(252), 또는, 상기 스피커가 상기 구 좌표계와 대조적으로 상기 카테시안 좌표계의 정사각형에 배치되기 때문에 행해지는 반경 조정이 뒤집어지는, 상기 중간 반경의 수정된 버전(262)에 기반하고, 방위각(φ)에 기반하여 상기 원에 내접된 삼각형 중 하나 내의 위치(272,
)를 결정하도록 구성되고;
상기 장치는, 상기 결정된 위치가 있는 삼각형을 상기 베이스 평면에 있는 연관된 삼각형에 매핑하는 선형 변환을 사용하여 상기 원에 내접된 삼각형 중 하나 내의 결정된 위치(272,
)에 기반하여 상기 베이스 평면에 대한 상기 객체 위치의 투영 P(272)의 매핑된 위치(292)를 결정하도록 구성되고,
상기 값(z)(242)은 상기 베이스 영역으로부터 상기 객체 위치의 거리이고, 상기 매핑된 위치(292)는 상기 카테시안 표현으로 상기 객체 위치를 설명하는, 장치.
오디오 객체의 객체 위치를, 상기 객체 위치가 방위각, 고도각 및 구 도메인 반경을 사용하여 설명되는 구 표현에서 카테시안 표현으로 변환시키기 위한 방법(1500)에 있어서,
예를 들어, 스피커는 상기 카테시안 표현과 연관된 카테시안 좌표계의 정사각형에 배치되고 스피커는 상기 구 표현과 연관된 구 좌표계의 원에 배치되고;
상기 카테시안 표현의 기초 영역은 복수의 기초 영역 삼각형으로 세분화되고, 복수의 구 도메인 삼각형은 구 표현의 원에 내접되어 있고,
상기 기초 영역 삼각형들 중 적어도 일부의 코너 위치는 상기 카테시안 좌표계에서 스피커의 위치에 대응하고,
상기 구 도메인 삼각형들 중 적어도 일부의 코너 위치는 상기 구 좌표계에서 스피커의 위치에 대응하고,
상기 방법은 고도각 또는 매핑된 고도각에 기반하고 구 도메인 반경 또는 매핑된 구 도메인 반경에 기반하여 베이스 영역으로부터 상기 객체 위치의 거리를 설명하는 값(z) 및 중간 반경(r_xy)을 얻는 단계(1510)를 포함하고,
상기 방법은 상기 중간 반경, 또는, 상기 스피커가 상기 구 좌표계와 대조적으로 상기 카테시안 좌표계의 정사각형에 배치되기 때문에 행해지는 반경 조정이 뒤집어지는, 상기 중간 반경의 수정된 버전에 기반하고, 방위각[φ]에 기반하여 상기 원에 내접된 삼각형 중 하나 내의 위치(
)를 결정하는 단계(1520)를 포함하고;
상기 방법은, 상기 결정된 위치가 있는 삼각형을 상기 베이스 평면에 있는 연관된 삼각형에 매핑하는 선형 변환을 사용하여 상기 원에 내접된 삼각형 중 하나 내의 결정된 위치(
)에 기반하여 상기 베이스 평면에 대한 상기 객체 위치의 투영 P의 매핑된 위치를 결정하는 단계(1530)를 포함하고,
상기 값(z)(242)은 상기 베이스 영역으로부터 상기 객체 위치의 거리이고, 상기 매핑된 위치(292)는 상기 카테시안 표현으로 상기 객체 위치를 설명하는, 방법.