KR20220027891A - 앰비소닉스를 위한 전방향성 인코딩 및 디코딩 - Google Patents
앰비소닉스를 위한 전방향성 인코딩 및 디코딩 Download PDFInfo
- Publication number
- KR20220027891A KR20220027891A KR1020217043424A KR20217043424A KR20220027891A KR 20220027891 A KR20220027891 A KR 20220027891A KR 1020217043424 A KR1020217043424 A KR 1020217043424A KR 20217043424 A KR20217043424 A KR 20217043424A KR 20220027891 A KR20220027891 A KR 20220027891A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- ambisonics signal
- ambisonics
- components
- primary
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000009877 rendering Methods 0.000 claims abstract description 15
- 238000004091 panning Methods 0.000 claims abstract description 7
- 230000005236 sound signal Effects 0.000 claims description 69
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 10
- 230000001747 exhibiting effect Effects 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 12
- 239000000203 mixture Substances 0.000 description 9
- 238000013507 mapping Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- FROZIYRKKUFAOC-UHFFFAOYSA-N amobam Chemical compound N.N.SC(=S)NCCNC(S)=S FROZIYRKKUFAOC-UHFFFAOYSA-N 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Stereophonic System (AREA)
Abstract
본원에서 논의되는 시스템 및 방법은 앰비소닉 신호 프로세싱에 관한 것이다. 한 예에서, 1차 앰비소닉 신호는 자신의 패닝 수학식 또는 성분에서 불균형을 가지고 인코딩될 수 있다. 불균형은, 예컨대 능동 앰비소닉 디코더 이외의 것을 사용하는 렌더링에 대해 의도될 수 있는 의도적으로 인코딩된 전방향성 또는 중간 채널 신호에 기인할 수 있다. 한 예에서, 1차 앰비소닉 신호를 분해하기 위한 방법은, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이에 관한 정보를 사용하여 수동 디코딩을 위한 2차 앰비소닉 신호를 결정하는 것을 포함할 수 있다.
Description
본 출원은 2019년 5월 31일에 출원된 발명의 명칭이 "OMNI-DIRECTIONAL DIRECT ENCODING AND DECODING" 인 미국 가출원 번호 제62/855,202호에 관련되고 그에 대한 우선권을 주장하는데, 상기 가출원의 전체는 참조에 의해 본원에 통합된다.
공간 오디오 신호 디코더는 공간 오디오 신호를 입력 공간 오디오 포맷으로부터 출력 공간 오디오 포맷으로 변환하는 동작을 수행한다. 공지된 공간 오디오 신호 포맷 디코딩 기술은 수동 디코딩 및 능동 디코딩을 포함한다. 수동 신호 디코더는 입력 공간 오디오 신호 포맷 및 출력 공간 오디오 신호 포맷에 기초하는 디코딩 동작을 수행하고, 몇몇 예에서, 주파수와 같은 외부 파라미터를 사용할 수 있지만, 그러나, 예를 들면, 오디오 입력 신호에서 오디오 소스의 도달 방향과 같은 오디오 입력 신호 그 자체의 공간적 특성에는 의존하지 않을 수도 있다. 다시 말하면, 수동 신호 디코더는 입력 신호의 공간적 특성과 무관하게 하나 이상의 동작을 수행한다.
다른 한편으로, 능동 신호 디코더는 입력 공간 오디오 신호 포맷, 출력 공간 오디오 신호 포맷 및 어쩌면, 예를 들면, 주파수와 같은 외부 파라미터뿐만 아니라, 오디오 입력 신호의 공간적 특성에 기초하는 디코딩 동작을 수행한다. 능동 신호 디코더는 오디오 입력 신호의 공간적 특성에 적응되는 동작을 수행할 수 있다.
능동 및 수동 신호 디코더는 보편성이 부족하다. 수동 신호 디코더는 종종 지향성(directional) 오디오 소스를 블러링한다(blur). 예를 들면, 수동 신호 디코더는 때때로 입력 오디오 신호 포맷의 별개의 포인트 소스를 포인트 소스 방향으로 국소화되는 서브세트 대신 (오디오 플레이백 시스템에 대응하는) 출력 공간 오디오 포맷의 모든 채널에 렌더링한다. 다른 한편으로, 능동 신호 디코더는, 종종, 그러한 소스를, 지향성으로서, 예를 들면, 적은 수의 음향 평면파(acoustic plane wave)로서 모델링하는 것에 의해, 확산 소스를 포커싱한다. 결과적으로, 능동 신호 디코더는 때때로 무지향성(nondirectional) 오디오 신호에 방향성(directionality)을 부여한다. 예를 들면, 능동 신호 디코더는, 때때로, 반향의 공간적 특성이 디코더에 의해 보존되지 않도록, 특정한 방향으로부터의 무지향성 반향을 (오디오 플레이백 시스템에 대응하는) 출력 공간 오디오 포맷으로 렌더링한다.
본 발명자는, 다른 것들 중에서도, 해결되어야 할 문제가, 예컨대 능동 및 수동 디코더를 사용하여, 앰비소닉 믹스의 전방향성 성분(omnidirectional component)에 대한 오디오 신호 렌더링의 최적화를 포함한다는 것을 인식하였다. 한 예에서, 몇몇 디코더는 "인헤드(in-head)(머리 내)" 또는 "신의 목소리(voice-of-god)" 타입의 무방향 신호(directionless signal)와 같은, 앰비소닉 신호의 무방향 또는 제로 거리 정보를 올바르게 핸들링할 수 없을 수도 있다. 잠재적으로 문제가 있는 신호의 몇몇 예는, 0차(제로차)(예를 들면, W 성분 전용) 앰비소닉 신호, 또는 3 차원 공간에서 하나 이상의 축에 대해 대칭을 나타내는 앰비소닉을 포함한다. 한 예에서, 동일한 신호가 다수의 방향에서 또는 조향 신호의 널(null)을 가로질러 대칭적으로 패닝되는(panned) 앰비소닉 신호는, 예컨대 능동 디코더가 방향성에 대해 가정할 때, 부적절하게 디코딩될 수 있다. 본 발명자는, 솔루션이, 다른 것들 중에서도, 앰비소닉 신호로부터 전방향성 또는 중간 성분을 분리하는 것, 및 지향성 및 전방향성 성분에 대해 별개의 능동 및 수동 디코더를 각각 사용하는 것을 포함할 수 있다는 것을 인식하였다.
한 예에서, 예컨대 확산 또는 중간 패닝 렌더링(middle-panned rendering)을 위해 의도될 수 있는 0차 또는 무방향 신호가 앰비소닉 신호의 W 성분에 추가될 수 있다. 나중에 신호를 디코딩하고 0차 성분을 복구하기 위해 X, Y, 및 Z 성분에서의 에너지 비율에 대한 정보가 사용되어, 예컨대 나머지를 0차 또는 전방향성 성분으로서 추출하면서, W 성분을 재정규화할 수 있다. 그 다음, 재정규화된 지향성 부분은, 예컨대 Harpex와 같은 분석 또는 다른 기술을 사용하여 디코딩될 수 있다. 한 예에서, 추출된 부분(이것은, 예를 들면, W 성분에 의도적으로 추가되었을 수도 있음)은 수동으로 디코딩될 수 있거나 또는 사운드 에너지를 확산 및 분배하도록 체적법(volumetric method)을 사용하여 렌더링될 수 있다. 한 예에서, 다수의 상관 해제된 신호에 일반 앰비소닉 패닝 및 프로세싱을 적용하는 것에 의해 지향성의 그러나 볼륨이 있는 소스(directional but volumetric source)가 믹스에 포함될 수 있다.
이 간략한 개요는 본 주제의 일부의 개요를 제공하도록 의도된다. 본 발명의 배타적인 또는 완전한 설명을 제공하는 것이 의도되지는 않는다. 상세한 설명은 본 주제에 대한 추가적인 정보 및 설명을 포함한다.
임의의 특정한 엘리먼트 또는 액트의 논의를 쉽게 식별하기 위해, 참조 번호에서의 최상위 숫자 또는 숫자들은 그 엘리먼트가 처음 도입되는 도면 번호를 가리킨다. 도면은 일반적으로, 제한으로서가 아니라 예로서, 본 문헌에서 논의되는 다양한 실시형태를 예시한다.
도 1은 제1 공간 오디오 포맷의 입력 오디오 신호, 디코더, 및 제2 공간 오디오 포맷의 출력 오디오 신호를 도시하는 블록도를 일반적으로 예시한다.
도 2는 공간 오디오 신호 디코더의 예를 일반적으로 예시한다.
도 3은 능동 및 수동 디코더를 갖는 시스템의 예를 일반적으로 예시한다.
도 4는 신호 분해의 제1 예를 일반적으로 예시한다.
도 5는 신호 분해의 제2 예를 일반적으로 예시한다.
도 6은 입력 앰비소닉 신호를 프로세싱하는 방법의 예를 일반적으로 예시한다.
도 7은 2차 앰비소닉 신호(secondary ambisonic signal)를 생성하는 방법의 예를 일반적으로 예시한다.
도 8은 능동 또는 수동 디코더에 의한 추가적인 프로세싱을 위해 앰비소닉 또는 다른 신호를 준비하는 방법의 예를 일반적으로 예시한다.
도 9는, 머신으로 하여금 본원에서 논의되는 방법 중 임의의 하나 이상을 수행하게 하기 위한 명령어의 세트가 실행될 수도 있는 컴퓨터 시스템의 형태의 머신의 다이어그램을 일반적으로 예시한다.
도 1은 제1 공간 오디오 포맷의 입력 오디오 신호, 디코더, 및 제2 공간 오디오 포맷의 출력 오디오 신호를 도시하는 블록도를 일반적으로 예시한다.
도 2는 공간 오디오 신호 디코더의 예를 일반적으로 예시한다.
도 3은 능동 및 수동 디코더를 갖는 시스템의 예를 일반적으로 예시한다.
도 4는 신호 분해의 제1 예를 일반적으로 예시한다.
도 5는 신호 분해의 제2 예를 일반적으로 예시한다.
도 6은 입력 앰비소닉 신호를 프로세싱하는 방법의 예를 일반적으로 예시한다.
도 7은 2차 앰비소닉 신호(secondary ambisonic signal)를 생성하는 방법의 예를 일반적으로 예시한다.
도 8은 능동 또는 수동 디코더에 의한 추가적인 프로세싱을 위해 앰비소닉 또는 다른 신호를 준비하는 방법의 예를 일반적으로 예시한다.
도 9는, 머신으로 하여금 본원에서 논의되는 방법 중 임의의 하나 이상을 수행하게 하기 위한 명령어의 세트가 실행될 수도 있는 컴퓨터 시스템의 형태의 머신의 다이어그램을 일반적으로 예시한다.
공간 인코딩, 공간 코딩, 또는 공간 오디오 코딩과 같은 용어는, 사운드 장면(sound scene) 또는 음장(soundfield)을 오디오 신호 및 부가 정보의 관점에서 표현하는 것을 지칭할 수 있다. 용어 공간 포맷 또는 공간 오디오 포맷 또는 공간 오디오 신호는 사운드 장면 또는 음장을 나타내는 오디오 신호 및 부가 정보를 지칭할 수 있다. 한 예에서, 부가 정보는, 포맷의 정의, 예컨대 그 포맷의 오디오 채널 각각에 대응하는 지향성 특성을 포함할 수 있고, 몇몇 경우에, 오디오 신호에 존재하는 소스의 방향과 같은 신호 의존적 정보를 포함할 수 있다. 공간 오디오 신호는 오디오 신호 성분, 또는 오디오 채널 또는 소스로서 지칭될 수도 있는 하나 이상의 구성 요소를 포함한다. 몇몇 예에서, 공간 오디오 신호는 공간 포맷의 오디오 신호로서 지칭될 수도 있다.
공간 디코딩 또는 공간 오디오 디코딩은 명시된 공간 오디오 포맷의 출력 공간 오디오 신호를 생성하기 위해 명시된 공간 오디오 포맷의 입력 공간 오디오 신호를 프로세싱하는 것을 포함할 수 있다. 한 예에서, 디코딩은 입력 공간 오디오 포맷으로부터 상이한 공간 오디오 포맷으로의 트랜스코딩에 대응할 수 있거나 또는 디코딩은 다중채널 라우드스피커 레이아웃과 같은, 명시된 오디오 재생 시스템(audio reproduction system)을 통한 플레이백을 위한 신호를 생성하는 것을 포함할 수 있다. 오디오 재생 시스템은, 몇몇 예에서, 공간 오디오 포맷 또는 몰입형 포맷, 예컨대 서라운드 사운드 포맷에 대응할 수 있다.
한 예에서, 능동 또는 파라메트릭 공간 오디오 시스템은 하나 이상의 오디오 신호 소스의 방향에 대한 결정 또는 가정을 하도록 구성될 수 있다. 그러나, 몇몇 소스는, 실질적으로 거리 없이 렌더링되도록 또는 재생되도록 의도될 수 있다, 즉, 그들은 본질적으로 모든 방향으로부터 동시에 비롯되는 것으로서 간주될 수 있다. 몇몇 예에서, 그러한 신호 또는 소스는 다양한 패닝된 오브젝트로부터 발생될 수 있다. 본원에서 논의되는 예는, 소스가 능동 또는 파라메트릭 디코더에 의해 다운스트림에서 적절하게 디코딩될 수 있도록, 그러한 소스를 앰비소닉 믹스로 인코딩할 수 있다.
한 예에서, 전방향성, "중간", 또는 논 다이제틱(non-diegetic) 성분 중 하나 이상에 대한 정보가 앰비소닉 소스 신호 또는 앰비소닉 소스 믹스에 추가될 수 있다. 즉, 그러한 신호 또는 성분은, 예컨대 여분의 채널 또는 메타데이터를 사용하지 않으면서, 앰비소닉 믹스에서 다른 지향성 성분과 함께 인코딩될 수 있다. 그러한 믹스를 수신하는 디코더는, 예컨대 동일한 믹스에서 확산 또는 지향성 성분을 고려하기 이전에 또는 이후에, 잔차 에너지, 또는 0차(제로차) 에너지를 식별할 수 있다. 이 예에서, 잔차 에너지는 중간 채널(예를 들면, 무지향성 성분을 가짐, 제로 거리를 가짐, 또는 "신의 목소리" 타입 채널임)로서 또는 전볼륨 신호(omni-volumetric signal)로서 렌더링될 수 있다.
다른 예에서, 앰비소닉 소스로부터의 정보는 볼륨 소스(volumetric)로서 사전 렌더링될 수 있다. 이 예에서, 전방향성 성분은 파라메트릭 디코더에 의해 소망되는 또는 의도된 수의 상이한 방향의 확산 성분으로서 추출될 수 있다.
도 1은 입력 공간 오디오 신호(102)를 입력 공간 오디오 포맷(104)으로 디코딩하기 위한 공간 오디오 디코더(106)의 동작의 표현을 포함하는 제1 블록도(100)를 일반적으로 예시한다. 공간 오디오 디코더(106)는 입력 공간 오디오 신호(102)를, 예컨대 다중채널 오디오 재생 시스템(110)에 적절한 출력 공간 오디오 포맷의 출력 공간 오디오 신호(108)로 디코딩하도록 구성될 수 있다.
한 예에서, 공간 오디오 디코더(106)는, 예컨대 1차 앰비소닉 B 포맷(first-order ambisonics B-format) 또는 다른 공간 오디오 포맷으로 수신될 수 있는 입력 신호를, 다중채널 오디오 재생 시스템(110)을 사용하여 플레이백하기에 적절한 다중채널 오디오 포맷의 출력 신호로 변환할 수 있다. 한 예에서, 공간 오디오 디코더(106)는 능동 또는 수동 디코더로서 구현될 수 있다.
수동 디코더의 경우, 디코더는, 오디오 입력 신호의 도달 방향과 같은, 오디오 입력 신호의 공간적 특성에 관계없이 입력 공간 포맷으로부터 출력 공간 포맷으로의 변환 동작을 수행할 수 있다. 한 예에서, 공간 오디오 디코더(106)는, 오디오 입력 신호, 또는 입력 공간 오디오 신호(102)의 공간적 특성에 적어도 부분적으로 기초하여 입력 공간 포맷으로부터 출력 공간 포맷으로의 변환 동작을 수행하는 능동 디코더로서 구현될 수 있다. 한 예에서, 다중채널 오디오 재생 시스템(110)을 사용하는 렌더링된 출력은, 예컨대 능동 디코더를 사용하여 디코딩될 수 있는 포인트 소스(112)에 대한 정보를 포함할 수 있거나, 예컨대 능동 또는 수동 디코더를 사용하여 디코딩될 수 있는 볼륨 소스(114)에 대한 정보를 포함할 수 있거나, 또는 예컨대 능동 또는 수동 디코더를 사용하여 디코딩될 수 있는 (예를 들면, 기준 청취 위치에서의) 중간 소스에 대한 정보를 포함할 수 있다.
도 2는 일반적으로 공간 오디오 신호 디코더 예(200)를 예시한다. 디코더 예(200)는 도 1의 예로부터의 공간 오디오 디코더(106)의 구성을 나타낼 수 있다. 한 예에서, 디코더는 입력 공간 포맷의 입력 공간 오디오 신호를 출력 공간 포맷의 출력 공간 오디오 신호로 매핑하도록 구성될 수 있다. 도 3을 참조하여 하기에서 추가로 설명되는 바와 같이, 하나의 예시적인 디코더는 능동 신호 디코더(308)로서 구성될 수 있고, 다른 예시적인 디코더는 수동 신호 디코더(310)로서 구성될 수 있다. 각각의 입력 공간 오디오 신호는 다수의 오디오 신호 성분을 포함할 수 있다는 것 및 각각의 출력 공간 오디오 신호는 다수의 오디오 신호 성분을 포함할 수 있다는 것이 인식될 수 있다. 각각의 오디오 신호 성분은 채널로서 지칭될 수도 있다. 도 2의 예시적인 디코더는 M 개의 입력 공간 오디오 신호 성분을 N 개의 공간 오디오 출력 신호 성분에 매핑하기 위한 하나 이상의 매핑 동작을 포함할 수 있거나 또는 그 매핑 동작을 사용할 수 있다. 더 구체적으로, 예시적인 매핑 동작은 입력 공간 포맷의 M 개의 입력 공간 오디오 신호 성분을 출력 공간 포맷의 N 개의 공간 오디오 출력 신호 성분으로 매핑하기 위한 M×N 공간 디코더 매트릭스를 포함한다. 매핑 동작은 디코더를 능동 신호 디코더 또는 수동 신호 디코더로서 구성하기 위한 기초로서 사용될 수 있다.
공간 오디오 디코더(106)의 예에서, 입력 공간 포맷이 네 개의 신호 성분을 갖는 1차 앰비소닉 B 포맷 신호이기 때문에 M의 값은 4이고, N의 값은, 예를 들면, 다중채널 오디오 재생 시스템에서의 스피커의 수에 의존한다. 예시적인 신호 디코더에 의해 수신되는 입력 공간 오디오 신호의 공간 포맷은, 예컨대 다음과 같이 정의되는 벡터 (d)(Ω)에서 각각의 원소에 의해 주어지는 지향성 패턴을 패턴(directivity pattern)을 갖는, B 포맷 오디오 입력 신호 성분(W, X, Y, 및 Z)을 포함할 수 있는데
여기서, Ω는 방위각(θ)과 측정을 위한 기준 포인트에 대한 앙각(elevation angle)(φ)로 구성되는 각도 쌍(angular pair)에 대응한다. 공간 오디오 장면 또는 음장은 상기의 벡터에서 정의되는 지향성 패턴에 따라 W, X, Y, 및 Z 성분에서 인코딩될 수 있다. 예를 들면, 방위각(θ) 및 앙각(φ)에서의 포인트 소스(S)는 다음과 같이 B 포맷 성분에서 인코딩된다
따라서, B 포맷 앰비소닉과 같은 앰비소닉은, 음장에서의 단일의 포인트에 대응하는 신호의 고정된 세트를 캡쳐하는 것 또는 인코딩하는 것에 의해 음장을 나타내기 위해 사용될 수 있다. 앰비소닉 표현에서의 신호의 고정된 세트 각각은 정의된 지향성 패턴을 갖는다. 지향성 패턴은, 앰비소닉 인코딩 신호(ambisonic-encoded signal)가 전체 음장의 모든 사운드에 대한 지향성 정보를 전달하도록 설계된다. 앰비소닉 인코더(도시되지 않음)는 음장을 앰비소닉 포맷으로 인코딩하고, 그 포맷은 인코딩된 음장을 재구성하기 위해 사용될 수도 있는 특정한 라우드스피커 레이아웃과는 독립적일 수 있다. 앰비소닉 디코더는 특정한 라우드스피커 레이아웃에 대한 앰비소닉 포맷 신호를 디코딩한다. Eric Benjamin, Richard Lee, Aaron Heller는, 2008년 미국 샌프란시스코에서 열린 125차 AES 컨벤션에서 발표된 "Is My Decoder Ambisonic?"에서, 앰비소닉의 일반적일 설명을 제공한다.
몇몇 예에서, 신호 디코더는 입력 공간 포맷의 입력 오디오 신호를, 도 1에서 묘사되는 바와 같은 다섯 개의 라우드스피커 레이아웃에 적절한 출력 공간 포맷의 출력 오디오 신호로 변환한다. 그러나, 예는 도 1에서 묘사되는 다중채널 라우드스피커 레이아웃으로 제한되지는 않는다. 예시적인 신호 디코더는, 예를 들면, 5.1 라우드스피커 레이아웃, 7.1 라우드스피커 레이아웃, 11.1 라우드스피커 레이아웃, 또는 다른 라우드스피커 레이아웃으로 디코딩하도록 구성될 수 있다. 다른 예에서, 신호 디코더는 입력 공간 포맷의 입력 오디오 신호를 2 채널 입체 음향(binaural) 포맷의 출력 오디오 신호로 변환한다. 예는 1차 앰비소닉 B 포맷의 입력 오디오 신호로 제한되지는 않는다. 다른 예에서, 신호 디코더는 고차 앰비소닉 포맷의 입력 오디오 신호를 출력 공간 포맷의 출력 오디오 신호로 변환한다. 한 예에서, 디코더 또는 다른 프로세서는 청취자에 대한 플레이백 경험을 추가로 향상시키기 위해 헤드트래킹 정보를 포함할 수 있거나 또는 사용할 수 있다.
도 3은 일반적으로 공간 오디오 신호 디코더 시스템(300)의 개략적인 블록도를 예시한다. 공간 오디오 신호 디코더 시스템(300)은, 도 3을 참조하여 설명되는 프로세싱 블록을 제공하도록 프로세서 디바이스를 구성하기 위한 명령어를 저장하는 하나 이상의 컴퓨터 메모리 스토리지 디바이스(예를 들면, 비일시적 스토리지 디바이스)에 동작 가능하게 커플링되도록 구성되는 하나 이상의 프로세서 디바이스를 포함하는 컴퓨터 또는 프로세서 시스템을 포함할 수 있다. 도 3의 예에서, 공간 오디오 신호 디코더 시스템(300)은 시간-주파수 변환 블록(304), 능동/수동 분해 블록(306), 능동 신호 디코더(308), 수동 신호 디코더(310), 결합기 블록(312), 및 역 시간-주파수 변환 블록(314) 중 하나 이상을 포함할 수 있다.
시간-주파수 변환 블록(304)은 입력 공간 오디오 포맷의 입력 신호(302)와 같은 시간 도메인 입력 공간 오디오 신호를 수신하도록 구성될 수 있고, 입력 신호를 시간-주파수 도메인 입력 신호(318)로 변환할 수 있다. 후속하는 프로세싱은 대응하는 시간-주파수 도메인에서 실행된다. 대안적인 예시적인 제1 공간 오디오 신호 디코더 시스템(도시되지 않음)은, 후속하는 프로세싱이 시간 도메인에서 실행되도록, 시간-주파수 변환 블록을 생략한다.
능동/수동 분해 블록(306)은, 예컨대 시간-주파수 도메인에서 시간-주파수 도메인 입력 신호(318)를 분해하여, 능동 입력 성분(320) 및 수동 입력 성분(322)을 생성하도록 구성될 수 있다. 한 예에서, 능동 입력 성분(320) 및 수동 입력 성분(322)은 시간-주파수 도메인 입력 신호(318)를 합산하거나 또는 더할 수 있다. 한 예에서, 능동 입력 성분(320) 및 수동 입력 성분(322) 각각은, 각각의 다수의 성분 또는 성분 신호를 가질 수 있다. 공간 오디오 신호 디코더 시스템(300)에서, 성분은 시간 도메인에서 수신될 대 입력 신호(302)와 동일한 공간 오디오 포맷에 있을 수 있다.
한 예에서, 입력 신호(302)는, 예컨대 X, Y, Z, 및 W 성분을 포함할 수 있는 앰비소닉 신호를 포함할 수 있다. 한 예에서, 입력 신호(302)는, 예컨대 하나 이상의 축(예를 들면, 3 차원 공간의 축(X, Y, 및 Z))을 따라 대칭성을 갖는 다지향성(multidirectional) 소스 신호로부터 유래할 수 있는, 잉여의 W 성분을 갖는 앰비소닉 신호를 포함할 수 있다. 예를 들면, 청취자의 어느 한 쪽 상에서 균등하게 패닝되는 동일한 소스로부터 구성되는 팬텀 센터 신호(phantom center signal)가 그러한 소스일 수 있다. 그러한 팬텀 센터 신호는 기본 방향을 가질 수 있지만 그러나 더 모호한 또는 덜 확실한 위치를 가질 수 있다.
예시적인 공간 오디오 신호 디코더 시스템(300)에서, 능동 신호 디코더(308) 및 수동 신호 디코더(310)는 그들 각각의 입력을 입력 공간 포맷으로부터, 공통 다중채널 라우드스피커 레이아웃과 같은 공통 출력 공간 포맷을 가질 수 있는, 예컨대 능동 디코더 출력 신호(324) 및 수동 디코더 출력 신호(326)를 포함하는 각각의 디코더 출력 공간 오디오 신호로 변환할 수 있다. 다른 예시적인 디코더(도시되지 않음)에서, 디코더의 상이한 각각의 디코더는 각각의 디코더 입력 오디오 신호를 상이한 공간 포맷을 갖는 각각의 디코더 출력 오디오 신호로 변환할 수 있다.
한 예에서, 능동 신호 디코더(308)는 능동 입력 성분(320)을 수신할 수 있고, 응답에서, 능동 디코더 출력 신호(324)를 제공할 수 있다. 능동 디코더 출력 신호(324)의 출력 포맷은 능동 신호 디코더(308)의 구성에 의해 결정될 수 있다. 예를 들면, 앰비소닉 및 다른 공간 오디오 인코딩 방법의 피쳐는 출력 포맷에 무관해야 하는데, 디코더가 제공하도록 구성되는 어떤 포맷으로도 입력 공간 오디오 신호가 디코딩될 수 있다는 것을 의미한다. 능동 신호 디코더(308)는, 예컨대 각각의 입력 공간 포맷을 가질 수 있는 능동 입력 성분(320)을, 특정한 또는 지정된 능동 신호 출력 공간 포맷을 갖는 능동 디코더 출력 신호(324)로 변환할 수 있다. 수동 신호 디코더(310)는 수동 입력 성분(322)을 수신할 수 있고, 응답에서, 수동 디코더 출력 신호(326)를 제공할 수 있다. 수동 디코더 출력 신호(326)의 출력 포맷은 수동 신호 디코더(310)의 구성에 의해 결정될 수 있다. 수동 신호 디코더(310)는, 예컨대 각각의 입력 공간 포맷을 갖는 수동 입력 성분(322)을, 예컨대 명시된 수동 신호 출력 공간 포맷을 가질 수 있는 수동 디코더 출력 신호(326)로 변환할 수 있다.
한 예에서, 상이한 프로세싱이 각각의 주파수 대역에 적용될 수 있도록, 수동 신호 디코더(310)는 수동 입력 성분(322)을 하나 이상의 주파수 대역으로 분할할 수 있다. 예를 들면, 예시적인 수동 신호 디코더(310)는 차단 주파수 아래의 수동 입력 성분(322)의 주파수 범위에 대해 하위(lower) 주파수 범위 변환 동작을 수행하도록 구성될 수 있고 차단 주파수 위의 수동 입력 성분(322)의 주파수 범위에 대해 상위(upper) 주파수 범위 변환 동작을 수행하도록 구성된다.
한 예에서, 수동 신호 디코더(310)는 상관 해제(decorrelation) 프로세싱 또는 필터링을 수동 입력 성분(322)의 적어도 일부에 적용하도록, 그에 의해, 상관 해제된 수동 디코더 출력 신호(326)를 제공하도록 구성될 수 있다. 한 예에서, 수동 신호 디코더(310)는 상관 해제된 신호를 엔벨로프먼트 소스(envelopment source)로서 렌더링할 수 있다. 엔벨로프먼트 소스는, 본질적으로 모든 방향으로부터 발생하는, 또는 발생하는 것으로 청취자에 의해 인식되는 음원 정보를 포함할 수 있고, 임의의 방향으로의 청취자의 움직임에 따라 변경될 수도 있거나 또는 변경되지 않을 수도 있다. 한 예에서, 잔향(reverb) 신호가 엔벨로핑 소스(enveloping source) 또는 엔벨로프먼트 소스로서 간주될 수 있다.
한 예에서, 결합기 블록(312)은, 능동 디코더 출력 신호(324) 및 수동 디코더 출력 신호(326)와 같은, 디코더로부터의 각각의 출력 공간 오디오 신호를 합산하기 위한 합산 회로를 포함할 수 있다. 결합기 블록(312)은 능동 디코더 출력 신호(324) 및 수동 디코더 출력 신호(326)의 결합을 나타내는 합산된 출력 신호(328)를 제공할 수 있다. 한 예에서, 결합기 블록(312)은 필터링 또는 상관 해제과 같은 다른 프로세싱을 수행할 수 있다. 결합기 블록(312)에 의한 능동 디코더 출력 신호(324)와의 결합 이전에 채널을 상관 해제시키기 위해 수동 디코더 출력 신호(326)의 하나 이상의 채널에 올패스 필터(all-pass filter) 또는 기타와 같은 필터가 적용될 수 있다. 채널의 상관 해제는 더 많은 확산 및 덜 지향성인 렌더링으로 이어질 수 있는데, 이것은 일반적으로 수동 또는 전방향성 성분에 대해 바람직하다. 한 예에서, 디코딩된 신호 성분의 추가적인 프로세싱은 디코딩된 신호 성분을 결합하기 이전에 실행될 수 있다. 예를 들면, 능동 및 수동 성분에 상이한 필터가 적용될 수도 있다. 다른 예에서, 디코딩된 신호 성분의 추가적인 프로세싱은 디코딩된 신호 성분을 결합한 이후 실행될 수 있는데, 예를 들면, 등화 또는 다른 필터링이 수행되거나 또는 적용될 수 있다.
한 예에서, 역 시간-주파수 변환 블록(314)은 결합기 블록(312)으로부터 합산된 출력 신호(328)를 수신할 수 있다. 역 시간-주파수 변환 블록(314)은, 예컨대 시간-주파수 도메인에서의 합산된 출력 신호(328)를, 시간-도메인 출력, 또는 시간-도메인 공간 오디오 출력 신호(316)로 변환하도록 구성될 수 있다. 시간-도메인 공간 오디오 출력 신호(316)는, 도 1의 예로부터의 다중채널 오디오 재생 시스템(110)과 같은 사운드 재생 시스템에 제공될 수 있거나, 또는 분배를 위해 다른 신호 프로세서 또는 네트워크로 제공될 수 있다.
도 4는 일반적으로 제1 분해 블록(406)의 예(400)를 예시한다. 한 예에서, 도 3의 예로부터의 능동/수동 분해 블록(306)은 제1 분해 블록(406)을 포함하거나 또는 그것에 대응한다. 제1 분해 블록(406)은 0차 결정 블록(410) 및 정규화 블록(412)을 포함할 수 있다.
한 예에서, 0차 결정 블록(410)은 예컨대 앰비소닉 신호를 포함하는 시간-주파수 도메인 입력 신호(318)를 수신하도록 구성된다. 0차 결정 블록(410)은, 본원의 다른 곳에서 논의되는 바와 같이, 지향성 성분(402) 및 전방향성 성분(404)을 제공하기 위해 다양한 프로세싱 동작을 수행하도록 구성될 수 있다. 지향성 성분(402)은, 예를 들면, 예컨대 X, Y, Z, 및 W 성분을 포함하는 1차 앰비소닉 신호를 포함할 수 있다. 몇몇 예에서, 지향성 성분(402)의 W 성분은 지향성 성분(402)의 다른 성분과 비교하여 균형이 맞지 않을 수 있다. 정규화 블록(412)은 X, Y, 및 Z 성분을 분석하도록 그리고 W 성분을 재스케일링하거나 또는 정규화하도록, 그에 의해, 균형이 맞는 W, X, Y, 및 Z 성분을 포함하는 정규화된 출력(408)을 제공하도록 구성될 수 있다. 즉, 정규화 블록(412)은 신호의 X, Y, Z 및 W 성분과 관련하여 에너지에서의 인식된 불균형을 보정하는 것에 의해 출력을 위한 앰비소닉 신호를 준비하기 위해 사용될 수 있다.
한 예에서, 정규화된 출력(408)은, 예컨대 능동 신호 디코더(308)에 제공될 수 있는 능동 입력 성분(320)을 포함하거나(include) 또는 포함한다(comprise). 다른 예에서, 정규화 블록(412)은 지향성 성분(402)으로부터 전방향성 성분(404)을 감산하는 것에 의해, 그 출력에서 보조 앰비소닉 신호를 준비하도록 또는 제공하도록 구성될 수 있다. 이 예에서, 결과적으로 나타나는 보조 앰비소닉 신호는 하나 이상의 넌제로 지향성 성분을 포함할 수 있다.
전방향성 성분(404)은 시간-주파수 도메인 입력 신호(318)에서 존재하는 전방향성 신호, 또는 덜 지향성인(less-directional) 신호에 대한 정보를 포함하거나 또는 나타낼 수 있다. 전방향성 성분(404)은, 예컨대 수동 신호 디코더(310)에 제공될 수 있는 수동 입력 성분(322)을 포함하거나(include) 또는 포함할(comprise) 수 있다. 한 예에서, 전방향성 성분(404)은 수동 신호 디코더(310)에 의해 렌더링될 수 있는 중간 채널, 또는 인헤드 채널, 또는 "신의 목소리" 채널을 포함할 수 있다.
한 예에서, 전방향성 성분(404)은 W 성분을 갖는 앰비소닉 신호를 포함할 수 있고, 몇몇 예에서, X, Y, 또는 Z 성분을 생략할 수 있다. 한 예에서, 모든 방향 축에 대해 완벽한 대칭을 갖는 다지향성 소스는 W 성분만을 갖는 앰비소닉 신호를 포함할 수 있다. 일반적으로, 본원의 논의에서, "W 전용(W-only)" 신호는 0차 앰비소닉 신호로서 간주될 수 있다.
도 5는 일반적으로 제2 분해 블록(506)의 예(500)를 예시한다. 한 예에서, 도 3의 예로부터의 능동/수동 분해 블록(306) 또는 도 4의 예로부터의 제1 분해 블록(406)은 제2 분해 블록(506)을 포함하거나 또는 그것에 대응한다.
제2 분해 블록(506)은 시간-주파수 도메인 입력 신호(318)를 수신하도록 그것의 다양한 성분을 방향 추정 블록(502), 하위 공간 결정 블록(504), 또는 0차 결정 블록(410) 중 하나 이상으로 라우팅하도록 구성될 수 있다. 방향 추정 블록(502)은, 입력 공간 오디오 포맷에 따라, 시간-주파수 도메인 입력 신호(318)에서의 지향성 오디오 소스의 도달 방향(direction of arrival; DOA) 및 횟수의 추정치(510)를 제공할 수 있다. 하위 공간 결정 블록(504)은 시간-주파수 도메인 입력 신호(318)에서의 지향성 음원의 DOA 및 횟수의 추정치(510)에 기초하여 능동 입력 성분(320)을 결정할 수 있다. 예시적인 하위 공간 결정 블록(504)은 능동 신호 성분을, 시간-주파수 도메인 입력 신호(318) 및 지향성 음원의 DOA 및 횟수에 기초하여 결정될 수 있는 하위 공간 상으로 투영하는 것에 의해 능동 입력 성분(320)을 결정한다.
0차 결정 블록(410)은, 시간-주파수 도메인 입력 신호(318)의 잔차, 수동, 또는 전방향성 성분을 스케일링하기 위해 사용될 수 있는 값 또는 값들을 결정하기 위해 사용될 수 있다. 한 예에서, 0차 결정 블록(410)은 능동 입력 성분(320)과 수동 입력 성분(322) 사이의 정보를 스케일링하기 위한 스케일 계수(scale factor)를 결정하거나 또는 제공할 수 있다. 잔차 결정 블록(residual determination block; 508)은, 예를 들면, 하위 공간 결정 블록(504)에 의해 결정되는 바와 같은 시간-주파수 도메인 입력 신호(318)와 능동 입력 컴포넌트(320) 사이의 차이에 기초하여 수동 입력 성분(322)을 결정할 수 있다.
대안적인 예시적인 분해 블록에서, 수동 입력 성분(322)이 먼저 결정될 수 있고, 능동 입력 성분(320)은, 그 후, 수신된 시간-주파수 도메인 입력 신호(318)와 수동 입력 성분(322) 사이의 차이에 기초하여 결정될 수 있다.
제2 분해 블록(506)을 사용하는 프로세싱의 결과로서, 능동 신호 또는 능동 입력 성분(320)은 기능적으로 지향성인 소스 신호를 포함할 수 있다. 수동 입력 성분(322)은, 예컨대 0차 결정 블록(410)을 사용하여 검출될 수 있는 무지향성 또는 전방향성 소스의 조합을 포함할 수 있다. 한 예에서, 수동 입력 성분(322)은 하위 공간 결정 블록(504) 및 잔차 결정 블록(508)에 의해 식별되는 바와 같은 확산 또는 잔차 에러 기반의 신호를 포함할 수 있다. 잔차 에러를 결정하고 잔차 신호를 할당하는 다른 예는 Goodwin 등등에 의한, 2019년 8월 16일자로 출원된 발명의 명칭이 "Spatial Audio Signal Decoder"인 PCT 출원 PCT/US2019/046936(본원에서, "Goodwin" 등등)에서 논의되는데, 이 PCT 출원의 전체는 그 전체가 참조에 의해 본원에 통합된다.
도 6은, 수동 디코더를 사용하여 렌더링될 수 있는 전방향성 성분을, 능동 디코더를 사용하여 렌더링될 수 있는 다른 지향성 성분으로부터 분리하기 위해 입력 앰비소닉 신호를 프로세싱하는 것을 포함할 수 있는 제1 방법(600)의 예를 일반적으로 예시한다. 블록(602)에서, 예시적인 제1 방법(600)은, 예컨대 W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호(B-format primary ambisonic signal)를 수신하는 것을 포함할 수 있다. 한 예에서, 블록(602)은, 예컨대 입력 신호(302)를 포함하는 입력 공간 오디오 신호(102)를 수신하는 것을 포함할 수 있다. 한 예에서, 블록(602)은 능동/수동 분해 블록(306), 제1 분해 블록(406), 또는 제2 분해 블록(506) 중 하나 이상을 사용하여 입력 신호(302)를 수신하는 것을 포함할 수 있다.
블록(604)에서, 제1 방법(600)은, 예컨대, 1차 앰비소닉 신호의 제1 신호 대역 또는 주파수 대역에 대해, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것을 포함할 수 있다. 한 예에서, 능동/수동 분해 블록(306)은 입력 신호(302)를 수신하도록 그리고 입력 신호(302)의 X, Y, Z, 및 W 성분을 분석하여, 예컨대 X, Y, 및 Z 성분에 대한 W 성분의 임의의 불균형을 식별하도록 구성될 수 있다. 입력 신호(302)에서 미스매치 또는 불균형이 존재하는 경우, 그러면, 입력 신호(302)는, 예컨대, 다른 지향성 성분(402)에 대해 사용되는 프로세싱과는 상이할 수 있는 후속 프로세싱에 대한 입력 신호(302)로부터 추출될 수 있는 전방향성 성분(404)을 갖는 것으로서 간주될 수 있다.
블록(606)에서, 제1 방법(600)은 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하는 것을 포함할 수 있다. 한 예에서, 능동/수동 분해 블록(306)은 전방향성 성분(404)을 나타내기 위해 2차 앰비소닉 신호를 결정하도록 또는 생성하도록 구성되는 신호 프로세서를 포함할 수 있다. 한 예에서, 2차 앰비소닉 신호는 0차 앰비소닉 신호를 포함할 수 있거나, 또는 배타적으로 전방향성인 신호 정보를 포함하는 단일의 채널 신호를 포함할 수 있다.
한 예에서, 블록(606)은 입력 신호(302)의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것을 포함할 수 있다. 예를 들면, 총 에너지를 결정하는 것은 X, Y, 및 Z 성분의 제곱된 크기의 합이 W 성분의 제곱 크기와 실질적으로 동일한지의 여부를 결정하는 것을 포함할 수 있다. 다시 말하면, (X^2 + Y^2 + Z^2)/W^2는 동등하게 1이어야 한다. 다른 예에서, 입력 신호(302)의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것은, 입력 신호(302)의 성분 속성이, 예컨대 사용되는 포맷에 따라 상이한 값 또는 요건을 가질 수 있는 입력 신호(302)에 대한 가정된 패닝 수학식 및 정규화의 해와 수학적으로 등가인지의 여부를 결정하는 것을 포함할 수 있다.
블록(608)에서, 제1 방법(600)은, 예컨대 수동 신호 디코더(310)를 사용하여, 2차 앰비소닉 신호에 기초하는 출력 신호를 생성하는 것을 포함할 수 있다. 한 예에서, 출력은, 때때로 "신의 목소리" 신호로 지칭되는, 중간 채널, 또는 인헤드 타입 신호일 수 있는데, 그 이유는, 그것이 청취자에 의해 청취자의 머리 내부에서 발생하는 것으로 또는 모든 방향으로부터 동시에 발생하는 것으로 해석될 수 있기 때문이다.
블록(610)에서, 제1 방법(600)은, 수신된 그대로의 1차 앰비소닉 신호와 예컨대 블록(606)에서 결정되는 2차 앰비소닉 신호 사이의 차이에 기초하여 다시 균형이 맞춰진 1차 앰비소닉 신호를 결정하거나 또는 생성하는 것을 포함할 수 있다. 한 예에서, 블록(610)은, 예컨대 블록(602)에서 수신되는 1차 앰비소닉 신호의 X, Y, 및 Z 성분에 대응하는 W 성분을 생성하기 위해 또는 1차 앰비소닉 신호를 스케일링하기 위해 정규화 블록(412)을 사용하는 것을 포함할 수 있다. 블록(612)에서, 제1 방법(600)은, 예컨대 능동 신호 디코더(308)를 사용하여, 다시 균형이 맞춰진 1차 앰비소닉 신호에 기초하는 출력 신호를 생성하는 것을 포함할 수 있다.
도 7은, 예컨대 능동/수동 분해 블록(306)을 사용하여, 2차 앰비소닉 신호를 생성하는 것을 포함할 수 있는 제2 방법(700)의 예를 일반적으로 예시한다. 제2 방법(700)은, 도 6의 상기의 논의에서 설명되는 블록(606)에서 시작될 수 있다. 블록(702)에서, 제2 방법(700)은 2차 앰비소닉 신호에 대한 하나 이상의 1차 또는 고차 앰비소닉 조향 성분(steering component)을 식별하는 것을 포함할 수 있다. 하나 이상의 지향성 조향 성분은 1차 앰비소닉 신호로부터의 각각의 조향 성분에 기초할 수 있다.
예를 들면, 블록(704)에서, 제2 방법(700)은, 예컨대 블록(602)에서 수신되는 1차 앰비소닉 신호의 W, X, Y, 및 Z 성분에 대한 잔차 에러 투영 매트릭스를 계산하는 것을 포함할 수 있다. 잔차 에러 투영 매트릭스는 참조에 의해 본원에 통합되는 Goodwin 등등에 의해 논의되는 시스템 및 방법에 따라 계산되거나 또는 결정될 수 있다. 잔차는 수동 신호 성분을 입력 신호와 1차 앰비소닉 신호 사이의 차이로서 나타낼 수 있다.
블록(706)에서, 제2 방법(700)은 전방향성 신호 리턴 계수(omni-signal return factor)를 결정하는 것을 포함할 수 있다. 전방향성 신호 리턴 계수는 입력 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 결정된 차이에 기초할 수 있다.
블록(708)에서, 제2 방법(700)은 블록(706)으로부터의 결정된 전방향성 신호 리턴 계수를 사용하여 잔차 에러 투영 매트릭스를 업데이트하는 것을 포함할 수 있다. 즉, 블록(706)으로부터의 전방향성 신호 리턴 계수는 X, Y, 및 Z 성분에 대한 W 성분의 총 에너지 차이(예를 들면, 잉여분)를 나타낼 수 있다. 투영 매트릭스를 업데이트하는 것은 잔차 또는 잉여의 W 성분이 제거되도록 값을 재조정하는 것을 포함할 수 있다. 한 예에서, 매트릭스는 임의의 잉여의 W 성분이 잔차 또는 수동 성분에 할당되도록 재조정될 수 있다.
블록(710)에서, 제2 방법(700)은 업데이트된 잔차 에러 투영 매트릭스를 1차 앰비소닉 신호에 적용하고, 그에 의해, 2차 앰비소닉 신호를 생성하는 것을 포함할 수 있다. 생성된 2차 앰비소닉 신호는 추가적인 프로세싱 또는 렌더링을 위해 수동 신호 디코더(310)에 제공될 수 있다.
참조에 의해 본원에 통합되는 Goodwin 등등은, 입력에서 검출될 수 있는 지향성 성분에 의해 적절하게 표현되지 않을 수도 있는 입력 신호의 부분, 또는 잔차 신호를 결정하기 위한 다양한 시스템 및 방법을 일반적으로 설명한다. 예를 들면, 어떤 볼륨 속성을 갖는 전방 좌측 소스(예를 들면, 순수 포인트 소스가 아님)를 포함하는 입력 신호가 잔차를 가질 수도 있다. Goodwin 등등에 의해 설명되는 디코더는, 한 예에서, 소스의 중심을 검출할 수 있고 중심에 기초하여 방향성(예를 들면, 좌측 45도)을 지정할 수 있다. 그 다음, 디코더는 주어진 방향(예를 들면, 좌측으로 45도)에서 순수한 포인트 소스를 형성하는 것에 의해 방향성 가설을 테스트할 수 있다. 순수 포인트 소스와 원래의 볼륨 신호 사이의 차이는, 이론적으로, 잔차로서 지정될 수 있으며, 따라서, 수동적으로 디코딩(또는 비포인트 소스 렌더링)될 수 있고, 한편 중심 또는 포인트 소스 정보는 능동적으로 디코딩될 수 있다.
팬텀 센터 신호(예를 들면, 전면 중앙(front center)으로부터 -45도 및 +45도에서 실질적으로 동일한 부분을 갖는 소스)를 포함하는 예에서, 팬텀 신호를 포함하는 앰비소닉 신호는 좌우 밸런스를 위해 상쇄될 것이다. 소스가 전면 중앙에 있도록 의도되기 때문에, Goodwin 등등의 디코더는 강한 전면 중앙 신호를 생성할 수 있다. 좌우 밸런스가 상쇄되었기 때문에 잔차는 최소화될 수 있다. 소스가 좌측 및 우측 상의 각각의 소스로 이루어진 중앙 이미지였다는 임의의 정보는 신호의, 방향이 아니라, 크기에 대한 관계에서 숨겨질 수 있다. 한 예에서, 본 시스템 및 방법은 소스의 공간감(spaciousness) 또는 폭을 식별하거나 또는 결정하는 데 도움이 될 수 있고 소스의 상이한 부분을 수동 디코더 스트림으로 이동시킬 수 있는데, 이것은, 결국에는, (예를 들면, 원래의 입력 신호에서와 같이) 팬텀 센터로서 소스를 더 많이 렌더링할 수 있다.
도 8은, 능동 또는 수동 디코더에 의한, 예컨대 능동 신호 디코더(308) 또는 수동 신호 디코더(310)에 의한 추가적인 프로세싱을 위해 상이한 앰비소닉 또는 다른 신호를 준비하는 것을 포함할 수 있는 제3 방법(800)의 예를 일반적으로 예시한다. 제3 방법(800)은 능동/수동 분해 블록(306)을 사용하여 적어도 부분적으로 수행될 수 있고 볼륨 소스에 대한 정보를 갖는 1차 앰비소닉 신호를 수신하는 블록(802)에서 시작될 수 있다. 1차 앰비소닉 신호는 입력 신호(302)를 포함하거나(include) 또는 포함할(comprise) 수 있다. 볼륨 소스는 다양한 지향성 큐(directional cue)를 갖는 소스를 포함할 수 있고 모호한 또는 덜 지향성인 특성을 가질 수 있다.
블록(804)에서, 제3 방법(800)은 하나 이상의 넌제로 지향성 성분을 갖는 2차 앰비소닉 신호를 결정하는 것을 포함할 수 있다. 넌제로 지향성 성분은 볼륨 소스와 관련되는 지향성 큐에 기초할 수 있다. 한 예에서, 2차 앰비소닉 신호는 볼륨 소스로부터의 덜 지향성인 특성을 주로 나타낼 수 있다.
블록(806)에서, 제3 방법(800)은 3차(tertiary) 앰비소닉 신호를 생성하는 것을 포함할 수 있다. 한 예에서, 3차 앰비소닉 신호는, 3차 앰비소닉 신호가 넌제로 지향성 성분 중 하나 이상을 포함하도록 1차 앰비소닉 신호로부터 2차 앰비소닉 신호를 감산하는 것에 의해 생성될 수 있다.
블록(808)에서, 제3 방법(800)은 3차 앰비소닉 신호의 하나 이상의 넌제로 지향성 성분을 능동 디코더로, 예컨대 능동 신호 디코더(308)로 출력하는 것을 포함할 수 있다. 블록(810)은 2차 앰비소닉 신호를 수동 디코더로, 예컨대 수동 신호 디코더(310)로 출력하는 것을 포함할 수 있다.
본원에서 논의되는 방법 중 하나 이상은 다른 차수 앰비소닉 신호를 프로세싱하기 위해, 또는 단일 평면(single-plane) 앰비소닉 신호를 프로세싱하기 위해 사용될 수 있다. 예를 들면, 입력 신호(302)의 한 예는 W, X, 및 Y 성분을 포함하는 수평 전용 앰비소닉 신호를 포함하거나(include) 또는 포함할(comprise) 수 있다. 이 경우, 임의의 추출된 또는 결정된 전방향성 불균형은 "누락된" Z 성분에 기인할 수 있다. W 및 Z에 대해 2차 앰비소닉 신호가 생성될 수 있는데, 이것은, 결국에는, 누락된 높이 성분으로서 렌더링될 수 있다.
도 9는, 머신(900)으로 하여금 본원에서 논의되는 방법론 중 임의의 하나 이상을 수행하게 하기 위한 명령어(908)(예를 들면, 소프트웨어, 프로그램, 애플리케이션, 애플릿, 앱, 또는 다른 실행 가능 코드)가 내부에서 실행될 수 있는 머신(900)의 개략적인 표현이다. 예를 들면, 명령어(908)는 머신(900)으로 하여금 본원에서 설명되는 방법 중 임의의 하나 이상을 실행하게 할 수 있다. 명령어(908)는, 일반적인 프로그래밍되지 않은 머신(900)을, 설명되고 예시된 기능을 설명되는 방식으로 실행하도록 프로그래밍되는 특정한 머신(900)으로 변환할 수 있다.
한 예에서, 머신(900)은 독립형 디바이스로서 동작할 수 있거나 또는 다른 머신 또는 디바이스 또는 프로세서에 커플링(예를 들면, 네트워크화)될 수 있다. 네트워크화된 배치에서, 머신(900)은 서버-클라이언트 네트워크 환경에서 서버 머신 또는 클라이언트 머신의 용량 내에서 동작할 수 있거나, 또는 피어-투-피어(peer-to-peer)(또는 분산) 네트워크 환경에서 피어 머신(peer machine)으로서 동작할 수 있다. 머신(900)은, 서버 컴퓨터, 클라이언트 컴퓨터, 퍼스널 컴퓨터(personal computer; PC), 태블릿 컴퓨터, 랩탑 컴퓨터, 넷북, 셋탑 박스(set-top box; STB), PDA, 엔터테인먼트 미디어 시스템, 셀룰러 전화, 스마트폰, 모바일 디바이스, 웨어러블 디바이스(예를 들면, 스마트 워치), 스마트 홈 디바이스(예를 들면, 스마트 어플라이언스), 다른 스마트 디바이스, 웹 어플라이언스, 네트워크 라우터, 네트워크 스위치, 네트워크 브리지, 또는 머신(900)에 의해 취해질 액션을 명시하는 명령어(908)를, 순차적으로 또는 달리, 실행할 수 있는 임의의 머신을 포함할 수 있다. 게다가, 단지 단일의 머신(900)만이 예시되지만, 용어 "머신"은, 본원에서 논의되는 방법론 중 임의의 하나 이상을 수행하기 위해 명령어(908)를 개별적으로 또는 공동으로 실행하는 머신(900)의 콜렉션(collection)을 포함하는 것으로 간주될 수 있을 것이다. 한 예에서, 명령어(908)는 메모리 회로를 사용하여 저장되는 명령어를 포함할 수 있고, 머신(900)은 다양한 블록, 모듈, 프로세서, 또는 본원에서 논의되는 다른 프로세싱 하드웨어 또는 소프트웨어 중 임의의 하나 이상과 관련될 수 있는 것과 같은 프로세서 회로를 포함할 수 있거나 또는 사용할 수 있다.
머신(900)은, 버스(944)를 통해 서로 통신하도록 구성될 수 있는, 예컨대 도 9의 예에서 프로세서(902), 메모리(904), 및 I/O 컴포넌트(942)로서 표현되는 다양한 프로세서 및 프로세서 회로부를 포함할 수 있다. 한 예에서, 프로세서(902)(예를 들면, 중앙 프로세싱 유닛(central processing unit; CPU), 축약형 명령어 세트 컴퓨팅(Reduced Instruction Set Computing; RISC) 프로세서, 복합 명령어 세트 컴퓨팅(Complex Instruction Set Computing; CISC) 프로세서, 그래픽 프로세싱 유닛(Graphics Processing Unit; GPU), 디지털 신호 프로세서(Digital Signal Processor; DSP), ASIC, 무선 주파수 집적 회로(Radio-Frequency Integrated Circuit; RFIC), 다른 프로세서, 또는 이들의 임의의 적절한 조합)는, 예를 들면, 명령어(908)를 실행하는 프로세서(906) 및 프로세서(910)를 포함할 수 있다. 용어 "프로세서"는, 명령어를 동시적으로 실행할 수 있는 두 개 이상의 독립적인 프로세서(종종 "코어"로 칭해짐)를 포함할 수 있는 멀티 코어 프로세서를 포함하도록 의도된다. 도 9가 다수의 프로세서를 도시하지만, 머신(900)은 단일의 코어를 갖는 단일의 프로세서, 다수의 코어를 갖는 단일의 프로세서(예를 들면, 다중 코어 프로세서), 단일의 코어를 갖는 다수의 프로세서, 다수의 코어를 갖는 다수의 프로세서, 또는 이들의 임의의 조합을 포함할 수 있다.
메모리(904)는, 예컨대 버스(944)를 통해 프로세서(902)가 액세스 가능할 수 있는, 메인 메모리(912), 정적 메모리(914), 또는, 스토리지 유닛(916)을 포함할 수 있다. 메모리(904), 정적 메모리(914), 및 스토리지 유닛(916)은 본원에서 설명되는 방법 또는 기능 또는 프로세스 중 임의의 하나 이상을 구체화하는 명령어(908)를 저장할 수 있다. 명령어(908)는 또한, 머신(900)에 의해 실행되는 동안, 메인 메모리(912) 내에, 정적 메모리(914) 내에, 스토리지 유닛(916) 내의 머신 판독 가능 매체(918) 내에, 프로세서 중 적어도 하나 내에(예를 들면, 프로세서의 캐시 메모리 내에), 또는 이들의 임의의 적절한 조합에서, 완전히 또는 부분적으로, 상주할 수 있다.
I/O 컴포넌트(942)는, 입력을 수신하기 위한, 출력을 제공하기 위한, 출력을 생성하기 위한, 정보를 송신하기 위한, 정보를 교환하기 위한, 측정을 캡쳐하기 위한, 및 등등을 위한 다양한 컴포넌트를 포함할 수 있다. 특정한 머신에 포함되는 특정한 I/O 컴포넌트(942)는, 머신의 타입에 의존할 것이다. 예를 들면, 이동 전화와 같은 휴대형 머신은, 터치 입력 디바이스 또는 다른 입력 메커니즘을 포함할 수 있고, 한편 헤드리스 서버 머신(headless server machine)은 그러한 터치 입력 디바이스를 포함하지 않을 가능성이 있을 것이다. I/O 컴포넌트(942)는 도 9에서 도시되지 않는 많은 다른 컴포넌트를 포함할 수 있다는 것이 인식될 것이다. 다양한 예시적인 실시형태에서, I/O 컴포넌트(942)는 출력 컴포넌트(928) 및 입력 컴포넌트(930)를 포함할 수 있다. 출력 컴포넌트(928)는 시각적 컴포넌트(예를 들면, 플라즈마 디스플레이 패널(plasma display panel; PDP), 발광 다이오드(light emitting diode; LED) 디스플레이, 액정 디스플레이(liquid crystal display; LCD), 프로젝터, 또는 음극선관(cathode ray tube; CRT)과 같은 디스플레이), 음향 컴포넌트(예를 들면, 스피커), 햅틱 컴포넌트(예를 들면, 진동 모터, 저항 메커니즘), 다른 신호 생성기, 및 등등을 포함할 수 있다. 입력 컴포넌트(930)는, 영숫자 입력 컴포넌트(예를 들면, 키보드, 영숫자 입력을 수신하도록 구성되는 터치 스크린, 광-광학식 키보드(photo-optical keyboard), 또는 다른 영숫자 입력 컴포넌트), 포인트 기반의 입력 컴포넌트(예를 들면, 마우스, 터치패드, 트랙볼, 조이스틱, 모션 센서, 또는 다른 포인팅 기구), 촉각 입력 컴포넌트(예를 들면, 물리적 버튼, 터치 또는 터치 제스쳐의 위치 및/또는 힘을 제공하는 터치스크린, 또는 다른 촉각 입력 컴포넌트), 오디오 입력 컴포넌트(예를 들면, 마이크), 및 등등을 포함할 수 있다.
한 예에서, I/O 컴포넌트(942)는, 다수의 다른 컴포넌트 중에서, 생체 인식 컴포넌트(932), 모션 컴포넌트(934), 환경 컴포넌트(936), 또는 위치 컴포넌트(938)를 포함할 수 있다. 예를 들면, 생체 인식 컴포넌트(932)는, 인간, 애완동물, 또는 다른 개인 또는 오브젝트의 존재 또는 부재를 검출하도록 구성되는, 또는 표현(예를 들면, 손 표현, 얼굴 표정, 목소리 표현, 몸짓, 또는 눈 추적)을 검출하도록, 생체 신호(예를 들면, 혈압, 심박수(heart rate), 체온, 땀, 또는 뇌파)를 측정하도록, 사람을 식별하도록(예를 들면, 목소리 식별, 망막 식별, 얼굴 식별, 지문 식별, 또는 뇌파도(electroencephalogram) 기반의 식별), 및 등등을 하도록 구성되는 컴포넌트를 포함한다. 모션 컴포넌트(934)는 가속 센서 컴포넌트(예를 들면, 가속도계), 중력 센서 컴포넌트, 회전 센서 컴포넌트(예를 들면, 자이로스코프), 및 등등을 포함할 수 있는다.
환경 컴포넌트(936)는, 예를 들면, 조명 센서 컴포넌트(예를 들면, 광도계), 온도 센서 컴포넌트(예를 들면, 주변 온도를 검출하는 하나 이상의 온도계), 습도 센서 컴포넌트, 압력 센서 컴포넌트(예를 들면, 기압계), 음향 센서 컴포넌트(예를 들면, 배경 노이즈를 검출하는 하나 이상의 마이크), 근접 센서 컴포넌트(예를 들면, 근처의 오브젝트를 검출하는 적외선 센서), 가스 센서(예를 들면, 안전을 위해 유해한 가스의 농도를 검출하는 또는 대기의 오염 물질을 측정하는 가스 검출 센서), 또는 주변 물리적 환경에 대응하는 표시, 측정치, 또는 신호를 제공할 수 있는 다른 컴포넌트를 포함할 수 있다. 위치 컴포넌트(938)는, 위치 센서 컴포넌트(예를 들면, GPS 수신기 컴포넌트, RFID 태그, 등등), 고도 센서 컴포넌트(예를 들면, 고도가 유도될 수 있는 기압을 검출하는 고도계 또는 기압계), 방위 센서 컴포넌트(예를 들면, 자력계), 및 등등을 포함한다.
I/O 컴포넌트(942)는 머신(900)을 커플링(924) 및 커플링(926)을 통해 네트워크(920) 또는 디바이스(922)에 각각 커플링하도록 동작 가능한 통신 컴포넌트(940)를 포함할 수 있다. 예를 들면, 통신 컴포넌트(940)는, 네트워크(920)와 인터페이싱하기 위한 네트워크 인터페이스 컴포넌트 또는 다른 적절한 디바이스를 포함할 수 있다. 또 다른 예에서, 통신 컴포넌트(940)는, 유선 통신 컴포넌트, 무선 통신 컴포넌트, 셀룰러 통신 컴포넌트, 근접장 통신(Near Field Communication; NFC) 컴포넌트, Bluetooth®(블루투스) 컴포넌트(예를 들면, Bluetooth® 저에너지), Wi-Fi®(와이파이) 컴포넌트, 및 다른 양식을 통해 통신을 제공하는 다른 통신 컴포넌트를 포함할 수 있다. 디바이스(922)는, 다른 머신 또는 아주 다양한 주변장치 디바이스 중 임의의 것(예를 들면, USB를 통해 커플링되는 주변장치 디바이스)일 수 있다.
또한, 통신 컴포넌트(940)는, 식별자를 검출할 수 있거나 또는 식별자를 검출하도록 동작 가능한 컴포넌트를 포함할 수 있다. 예를 들면, 통신 컴포넌트(940)는, 무선 주파수 식별(Radio Frequency Identification; RFID) 태그 판독기 컴포넌트, NFC 스마트 태그 검출 컴포넌트, 광학 판독기 컴포넌트(예를 들면, 통일 상품 코드(Universal Product Code; UPC) 바코드와 같은 일차원 바코드, 퀵 리스폰스(Quick Response; QR) 코드와 같은 다차원 바코드, 아즈텍(Aztec) 코드, 데이터 매트릭스(Data Matrix), 데이터클리프(Dataglyph), 맥시코드(MaxiCode), PDF417, 울트라 코드(Ultra Code), UCC RSS-2D 바코드, 및 다른 광학 코드를 검출하기 위한 광학 센서), 또는 음향 검출 컴포넌트(예를 들면, 태깅된 오디오 신호를 식별하기 위한 마이크)를 포함할 수 있다. 또한, 인터넷 프로토콜(Internet Protocol; IP) 지오로케이션을 통한 위치, Wi-Fi® 신호 삼각 측량을 통한 위치, 또는 특정한 위치를 나타낼 수 있는 NFC 비콘 신호의 검출을 통한 위치, 및 등등과 같은, 다양한 정보가 통신 컴포넌트(940)를 통해 유도될 수 있다.
다양한 메모리(예를 들면, 메모리(904), 메인 메모리(912), 정적 메모리(914), 및/또는 프로세서(902)의 메모리) 및/또는 스토리지 유닛(916)은 본원에서 설명되는 방법론 또는 기능 중 임의의 하나 이상을 구체화하는 또는 그 임의의 하나 이상에 의해 사용되는 하나 이상의 명령어 또는 데이터 구조(예를 들면, 소프트웨어)를 저장할 수 있다. 이들 명령어(예를 들면, 명령어(908))는, 프로세서 또는 프로세서 회로부에 의해 실행될 때, 다양한 동작으로 하여금 본원에서 논의되는 실시형태를 구현하게 한다.
명령어(908)는, 네트워크 인터페이스 디바이스(예를 들면, 통신 컴포넌트(940)에 포함되는 네트워크 인터페이스 컴포넌트)를 통해 송신 매체를 사용하여 그리고 다수의 널리 공지된 전송 프로토콜 중 임의의 하나(예를 들면, 하이퍼텍스트 전송 프로토콜(hypertext transfer protocol; HTTP))를 사용하여, 네트워크(920)를 통해 송신될 수 있거나 또는 수신될 수 있다. 마찬가지로, 명령어(908)는, 디바이스(922)에 대한 커플링(926)(예를 들면, 피어 투 피어 커플링)을 통해 송신 매체를 사용하여 송신될 수 있거나 또는 수신될 수 있다.
본 개시가 상세하게 그리고 그 예시적인 실시형태를 참조하여 설명되었으며, 다양한 변경 및 수정이 이루어질 수 있다는 것이 기술 분야에서 숙련된 자에게 명확할 것이다. 따라서, 본 개시는, 첨부된 청구범위 및 그들의 균등물의 범위 내에 있다면, 본 개시의 수정 및 변형을 포괄해야 한다는 것이 의도된다.
본원에서 개시되는 방법, 시스템, 디바이스, 및 장치를 더 잘 예시하기 위해, 양태의 비제한적인 목록이 본원에서 제공된다.
양태 1은, W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호를 수신하는 것, 1차 앰비소닉 신호의 제1 신호 대역에 대해, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것, 및 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하는 것을 포함하는 방법과 같은 주제를 포함할 수 있거나 또는 사용할 수 있다.
양태 2는, 2차 앰비소닉 신호에 기초하여 출력 신호를 생성하는 것 - 생성하는 것은 독립적인 출력, 디코딩, 및 공간적 렌더링 중 하나 이상에 대해 2차 앰비소닉 신호를 스케일링하는 것을 포함함 - 을 포함하도록 양태 1의 주제를 포함할 수 있고, 옵션 사항으로 양태 1의 주제와 결합될 수 있다.
양태 3은, 수신된 그대로의 1차 앰비소닉 신호와 2차 앰비소닉 신호 사이의 차이에 기초하여 다시 균형이 맞춰진 1차 앰비소닉 신호를 생성하는 것을 포함하도록 양태 2의 주제를 포함할 수 있고, 옵션 사항으로 양태 2의 주제와 결합될 수 있다.
양태 4는 2차 앰비소닉 신호를 결정하는 것을 포함하도록 양태 1 내지 3 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있는데, 2차 앰비소닉 신호를 결정하는 것은, 전방향성 신호 정보를 배타적으로 포함하는 단일의 채널 신호를 결정하는 것을 포함한다.
양태 5는, 단일의 채널 신호를 중간 채널 오디오 신호로서 렌더링하는 것을 포함하도록 양태 4의 주제를 포함할 수 있고, 옵션 사항으로 양태 4의 주제와 결합될 수 있는데, 중간 채널 오디오 신호는 머리 내에서(in-head) 들리도록 또는 해석되도록 구성되는 신호이거나 또는 신의 목소리 신호이다.
양태 6은, 2차 앰비소닉 신호의 적어도 일부에 상관 해제 프로세싱을 적용하여 상관 해제된 신호를 제공하는 것, 및 상관 해제된 신호를 엔벨로프먼트 소스로서 렌더링하는 것을 포함하도록 양태 4 및 5 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 7은, 하나 이상의 1차 또는 고차 앰비소닉 조향 성분을 포함하는 2차 앰비소닉 신호를 포함하도록 양태 1 내지 6 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있는데, 하나 이상의 지향성 조향 성분은 1차 앰비소닉 신호로부터의 각각의 조향 성분에 기초한다.
양태 8은, 2차 앰비소닉 신호를 결정하는 것을 포함하도록 양태 7의 주제를 포함할 수 있고, 옵션 사항으로 양태 7의 주제와 결합될 수 있는데, 2차 앰비소닉 신호를 결정하는 것은 다음의 것을 포함한다: 수신된 1차 앰비소닉 신호의 W, X, Y, 및 Z 성분에 대한 잔차 에러 투영 매트릭스를 계산하는 것, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 결정된 차이에 기초하여 전방향성 신호 리턴 계수를 결정하는 것, 결정된 전방향성 신호 리턴 계수를 사용하여 잔차 에러 투영 매트릭스를 업데이트하는 것, 및 업데이트된 잔차 에러 투영 매트릭스를 1차 앰비소닉 신호에 적용하고 그에 의해 2차 앰비소닉 신호를 생성하는 것.
양태 9는, 수신된 1차 앰비소닉 신호에 기초하는 하나 이상의 지향성 조향 채널 및 전방향성 채널을 포함하는 1차 또는 고차 앰비소닉 신호로 구성되는 2차 앰비소닉 신호를 포함하도록 양태 1 내지 8 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 10은, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 결정된 차이만큼 더 적은 1차 앰비소닉 신호를 포함하는 3차 앰비소닉 신호를 생성하는 것을 포함하도록 양태 1 내지 9 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 11은, 1차 앰비소닉 신호의 X, Y, 및 Z 성분과 관련하여 에너지에서의 인식된 불균형을 보정하도록 1차 앰비소닉 신호의 W 성분을 스케일링하는 것에 의해 출력을 위한 1차 앰비소닉 신호를 준비하는 것을 포함하도록 양태 1 내지 10 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 12는, 3차 앰비소닉 신호가 하나 이상의 넌제로 지향성 성분을 포함하도록 1차 앰비소닉 신호로부터 2차 앰비소닉 신호를 감산하는 것에 의해 3차 앰비소닉 신호를 생성하는 것을 포함하도록 양태 1 내지 11 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 13은, 지향성 큐 및 모호한 또는 덜 지향성인 특성을 갖는 볼륨 소스에 대한 정보를 수신하는 것을 포함하는 1차 앰비소닉 신호를 수신하는 것을 포함하도록 양태 12의 주제를 포함할 수 있고, 옵션 사항으로 양태 12의 주제와 결합될 수 있는데, 2차 앰비소닉 신호를 결정하는 것은 덜 지향성인 특성을 주로 나타내면서 지향성 큐에 기초하여 하나 이상의 넌제로 지향성 성분을 갖는 신호를 생성하는 것을 포함하고, 3차 앰비소닉 신호의 하나 이상의 넌제로 지향성 성분은 지향성 큐를 주로 나타낸다. 한 예에서, 양태 13은, 3차 앰비소닉 신호의 하나 이상의 넌제로 지향성 성분을 능동 디코더로 출력하는 것 및 2차 앰비소닉 신호를 수동 디코더 또는 덜 지향성인 렌더러로 출력하는 것을 포함할 수 있다.
양태 14는, 3차 앰비소닉 신호를 능동 디코더에 제공하는 것 및 2차 앰비소닉 신호를 수동 디코더에 제공하는 것을 포함하도록 양태 12의 주제를 포함할 수 있고, 옵션 사항으로 양태 12의 주제와 결합될 수 있다.
양태 15는, X, Y, 및 Z 성분의 제곱된 크기의 합이 W 성분의 제곱 크기와 실질적으로 동일한지의 여부를 결정하는 것에 의해 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것을 포함하도록 양태 1 내지 14 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 16은, 1차 앰비소닉 신호의 성분 속성이 1차 앰비소닉 신호에 대한 가정된 패닝 수학식 및 정규화의 솔루션과 수학적으로 등가인지의 여부를 결정하는 것에 의해 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것을 포함하도록 양태 1 내지 15 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 17은 컴퓨터 판독 가능 저장 매체와 같은 주제를 포함할 수 있거나 또는 사용할 수 있는데, 컴퓨터 판독 가능 저장 매체는, 컴퓨터에 의해 실행될 때, 컴퓨터로 하여금 양태 1 내지 16 중 하나 또는 그 조합을 수행하게 하는 명령어를 포함한다. 예를 들면, 양태 17은, 컴퓨터로 하여금, W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호를 수신하게 하고, 1차 앰비소닉 신호의 제1 신호 대역에 대해, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하게 하고, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하게 하는 명령어를 적어도 포함할 수 있다.
양태 18은 컴퓨팅 장치와 같은 주제를 포함할 수 있거나 또는 사용할 수 있는데, 컴퓨팅 장치는 프로세서 및, 프로세서에 의해 실행될 때, 장치로 하여금, 양태 1 내지 16 중 하나 또는 그 조합을 수행하도록 상기 장치를 구성하는 명령어를 저장하는 메모리를 포함한다. 예를 들면, 양태 18은, 컴퓨터로 하여금, W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호를 수신하게 하고, 1차 앰비소닉 신호의 제1 신호 대역에 대해, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하게 하고, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분의 총 에너지 사이의 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하게 하는 명령어를 적어도 포함할 수 있다.
양태 19는, W 성분 및 X, Y, 및 Z 성분 중 하나 이상을 포함하는 1차 앰비소닉 신호를 수신하는 것, 1차 앰비소닉 신호의 제1 신호 대역에 대해, 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분 중 하나 이상의 것의 총 에너지 사이의 차이를 결정하는 것, 및 1차 앰비소닉 신호의 W 성분의 총 에너지와 X, Y, 및 Z 성분 중 하나 이상의 것의 총 에너지 사이의 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하는 것을 포함할 수 있는 방법(또는 비일시적 컴퓨터 판독 가능 저장 매체, 또는 방법 또는 그 일부를 수행하도록 구성되는 컴퓨팅 장치)과 같은 주제를 포함할 수 있거나 또는 사용할 수 있다.
양태 20은, 1차 앰비소닉 신호가 W 성분 및 X, Y, 및 Z 성분 중 두 개를 포함하고, 2차 앰비소닉 신호가 X, Y, Z 및 W 성분을 갖는 B 포맷 앰비소닉 신호를 포함하도록, 양태 19의 주제를 포함할 수 있고, 옵션 사항으로 양태 19의 주제와 결합될 수 있다.
양태 21은, 2차 앰비소닉 신호에 기초하여 출력 신호를 생성하는 것 - 생성하는 것은 독립적인 출력, 디코딩, 및 공간적 렌더링 중 하나 이상에 대해 2차 앰비소닉 신호를 스케일링하는 것을 포함함 - 을 포함하도록 양태 19 또는 20 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 22는, 전방향성 신호 정보를 배타적으로 포함하는 단일의 채널 신호를 결정하는 것에 의해 2차 앰비소닉 신호를 결정하는 것을 포함하도록 양태 19 내지 21 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 23은, 수신된 1차 앰비소닉 신호에 기초하는 하나 이상의 지향성 조향 채널 및 전방향성 채널을 포함하는 1차 또는 고차 앰비소닉 신호로 구성되는 2차 앰비소닉 신호를 포함하도록 양태 19 내지 22 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
양태 24는, 3차 앰비소닉 신호가 하나 이상의 넌제로 지향성 성분을 포함하도록 1차 앰비소닉 신호로부터 2차 앰비소닉 신호를 감산하는 것에 의해 3차 앰비소닉 신호를 생성하는 것 및, 옵션 사항으로, 3차 앰비소닉 신호를 능동 디코더에 제공하는 것 및 2차 앰비소닉 신호를 수동 디코더에 제공하는 것을 포함하도록 양태 19 내지 23 중 임의의 하나 이상을 포함할 수 있고, 옵션 사항으로 그 임의의 하나 이상과 결합될 수 있다.
이들 양태 1 내지 24 각각은 단독으로 사용될 수 있거나 또는 다양한 조합 및 순열로 조합될 수 있다.
상기 상세한 설명은, 상세한 설명의 일부를 형성하는 첨부의 도면에 대한 참조를 포함한다. 도면은 예시로서 특정한 실시형태를 도시한다. 이들 실시형태는 본원에서 "예"로서 또한 칭해진다. 그러한 예는 도시되는 또는 설명되는 것들 이외의 엘리먼트를 포함할 수 있다. 또한, 본 주제는, 특정한 예(또는 그것의 하나 이상의 양태)와 관련하여, 또는 본원에서 도시되는 또는 설명되는 다른 예(또는 그것의 하나 이상의 양태)와 관련하여, 도시되는 또는 설명되는 그들 엘리먼트(또는 그들의 하나 이상의 양태)의 임의의 조합 또는 순열을 포함할 수도 있다.
본 문서에서, 용어 "한(a)"또는 "한(an)"은, 특허 문헌에서 일반적인 바와 같이, "적어도 하나(at least one)" 또는 "하나 이상(one or more)"의 임의의 다른 사례 또는 용법과는 독립적으로, 하나 또는 하나보다 더 많은 것을 포함하기 위해 사용된다. 본 문서에서, 용어 "또는"은 비배타적인 또는을 가리키도록 사용되며, 그 결과 "A 또는 B"는, 달리 나타내어지지 않는 한, "A이지만 그러나 B는 아님", "B이지만 그러나 A는 아님", "A 및 B"를 포함한다. 본 문서에서, 용어 "포함하는(including)" 및 "여기서(in which)"는, 각각의 용어 "포함하는(comprising)" 및 "여기서(wherein)"의 평문 영어의 등가적 표현으로서 사용된다. 또한, 다음의 청구범위에서, 용어 "포함하는(including)" 및 "포함하는(comprising)"은 확장 가능하다(open-ended), 즉, 청구항에서 그러한 용어 앞에서 열거되는 것들 이외의 엘리먼트를 포함하는 시스템, 디바이스, 물품, 조성, 제제(formulation), 또는 프로세스는 여전히 그 청구항의 범위 내에 속하는 것으로 간주된다. 또한, 다음의 청구범위에서, 용어 "제1", "제2", "제3", 등등은 단순히 라벨(label)로서 사용되는 것에 불과하며, 그들 목적에 대해 수치적 요건을 부과하도록 의도되지는 않는다.
상기 설명은, 제한적인 것이 아니라, 예시적인 것으로 의도된다. 예를 들면, 상기에서 설명된 예(또는 그 하나 이상의 양태)는 서로 조합되어 사용될 수도 있다. 상기 설명의 리뷰시, 예컨대 기술 분야에서 통상의 지식을 가진 자에 의해, 다른 실시형태가 사용될 수 있다. 요약서는 독자가 기술적 개시의 본질을 신속하게 확인하는 것을 허용하기 위해 제공된다. 그것은, 청구범위의 범위 또는 의미를 해석하도록 또는 제한하도록 사용되지 않을 것이라는 이해를 가지고 제출된다. 상기의 발명을 실시하기 위한 구체적인 내용(Detailed Description)에서, 본 개시를 간소화하기 위해, 다양한 피쳐가 함께 그룹화될 수도 있다. 이것은, 청구되지 않은 개시된 피쳐가 임의의 청구항에 필수적이다는 것을 의도하는 것으로 해석되지 않아야 한다. 오히려, 본 주제는 특정한 개시된 실시형태의 모든 피쳐보다 더 적은 피쳐에 있을 수도 있다. 따라서, 다음의 청구범위는 발명을 실시하기 위한 구체적인 내용에 통합되는데, 각각의 청구항은 별개의 실시형태로서 독립적이며, 그러한 실시형태는 다양한 조합 또는 순열에서 서로 조합될 수 있다는 것이 고려된다. 따라서, 범위는, 그러한 청구범위의 자격이 부여되는 균등물의 모든 범위와 함께, 첨부된 청구범위를 참조하여 결정되어야 한다.
Claims (54)
- 방법으로서,
W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호(B-format primary ambisonic signal)를 수신하는 단계;
상기 1차 앰비소닉 신호의 제1 신호 대역에 대해, 상기 1차 앰비소닉 신호의 상기 W 성분의 총 에너지와 상기 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 단계; 및
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이에 관한 정보를 사용하여 2차(secondary) 앰비소닉 신호를 결정하는 단계
를 포함하는, 방법. - 제1항에 있어서,
상기 2차 앰비소닉 신호에 기초하여 출력 신호를 생성하는 단계를 더 포함하되, 상기 생성하는 단계는 독립적인 출력, 디코딩, 및 공간적 렌더링 중 하나 이상에 대해 상기 2차 앰비소닉 신호를 스케일링하는 단계를 포함하는 것인, 방법. - 제2항에 있어서,
수신된 그대로의 상기 1차 앰비소닉 신호와 상기 2차 앰비소닉 신호 사이의 차이에 기초하여 다시 균형이 맞춰진 1차 앰비소닉 신호를 생성하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 2차 앰비소닉 신호를 결정하는 단계는, 전방향성 신호 정보(omnidirectional signal information)를 배타적으로 포함하는 단일의 채널 신호를 결정하는 단계를 포함하는 것인, 방법. - 제4항에 있어서,
상기 단일의 채널 신호를 중간 채널 오디오 신호로서 렌더링하는 단계를 더 포함하되, 상기 중간 채널 오디오 신호는 머리 내에서(in-head) 들리도록 또는 해석되도록 구성되는 신호이거나 또는 신의 목소리(voice of god) 신호인 것인, 방법. - 제4항에 있어서,
상기 2차 앰비소닉 신호의 적어도 일부에 상관 해제 프로세싱(decorrelation processing)을 적용하여 상관 해제된 신호를 제공하는 단계, 및 상기 상관 해제된 신호를 엔벨로프먼트 소스(envelopment source)로서 렌더링하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 2차 앰비소닉 신호는 하나 이상의 1차 또는 고차 앰비소닉 조향(steering) 성분을 포함하되, 상기 하나 이상의 지향성 조향 성분은 상기 1차 앰비소닉 신호로부터의 각각의 조향 성분에 기초하는 것인, 방법. - 제7항에 있어서,
상기 2차 앰비소닉 신호를 결정하는 단계는,
상기 수신된 1차 앰비소닉 신호의 상기 W, X, Y, 및 Z 성분에 대한 잔차 에러 투영 매트릭스(residual error projection matrix)를 계산하는 단계;
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 결정된 차이에 기초하여 전방향성 신호 리턴 계수(omni-signal return factor)를 결정하는 단계;
상기 결정된 전방향성 신호 리턴 계수를 사용하여 상기 잔차 에러 투영 매트릭스를 업데이트하는 단계; 및
상기 업데이트된 잔차 에러 투영 매트릭스를 상기 1차 앰비소닉 신호에 적용하고 그에 의해 상기 2차 앰비소닉 신호를 생성하는 단계
를 포함하는 것인, 방법. - 제1항에 있어서,
상기 2차 앰비소닉 신호는 상기 수신된 1차 앰비소닉 신호에 기초하는 하나 이상의 지향성 조향 채널 및 전방향성 채널을 포함하는 1차 또는 고차 앰비소닉 신호로 구성되는 것인, 방법. - 제1항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 결정된 차이만큼 더 적은 상기 1차 앰비소닉 신호를 포함하는 3차 앰비소닉 신호를 생성하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 1차 앰비소닉 신호의 상기 X, Y, 및 Z 성분과 관련하여 에너지에서의 인식된 불균형을 보정하도록 상기 1차 앰비소닉 신호의 상기 W 성분을 스케일링하는 것에 의해 출력을 위한 상기 1차 앰비소닉 신호를 준비하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
3차 앰비소닉 신호가 하나 이상의 넌제로 지향성 성분을 포함하도록 상기 1차 앰비소닉 신호로부터 상기 2차 앰비소닉 신호를 감산하는 것에 의해 상기 3차 앰비소닉 신호를 생성하는 단계를 더 포함하는, 방법. - 제12항에 있어서,
상기 1차 앰비소닉 신호를 수신하는 단계는 지향성 큐(directional cue) 및 모호한 또는 덜 지향성인 특성을 갖는 볼륨 소스(volumetric source)에 대한 정보를 수신하는 단계를 포함하고;
상기 2차 앰비소닉 신호를 결정하는 단계는 상기 덜 지향성인 특성을 주로 나타내면서 상기 지향성 큐에 기초하여 하나 이상의 넌제로 지향성 성분을 갖는 신호를 생성하는 단계를 포함하고;
상기 3차 앰비소닉 신호의 상기 하나 이상의 넌제로 지향성 성분은 상기 지향성 큐를 주로 나타내고; 그리고 상기 방법은,
상기 3차 앰비소닉 신호의 상기 하나 이상의 넌제로 지향성 성분을 능동 디코더로 출력하는 단계; 및
상기 2차 앰비소닉 신호를 수동 디코더 또는 덜 지향성인 렌더러(renderer)로 출력하는 단계
를 더 포함하는 것인, 방법. - 제12항에 있어서,
상기 3차 앰비소닉 신호를 능동 디코더에 제공하고 상기 2차 앰비소닉 신호를 수동 디코더에 제공하는 단계를 더 포함하는, 방법. - 제1항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이를 결정하는 단계는, 상기 X, Y, 및 Z 성분의 제곱된 크기의 합이 상기 W 성분의 제곱 크기와 실질적으로 동일한지의 여부를 결정하는 단계를 포함하는 것인, 방법. - 제1항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이를 결정하는 단계는, 상기 1차 앰비소닉 신호의 성분 속성이 상기 1차 앰비소닉 신호에 대한 가정된 패닝 수학식(panning equation) 및 정규화의 솔루션과 수학적으로 등가인지의 여부를 결정하는 단계를 포함하는 것인, 방법. - 컴퓨터 판독 가능 저장 매체로서,
상기 컴퓨터 판독 가능 저장 매체는, 컴퓨터에 의해 실행될 때, 상기 컴퓨터로 하여금,
W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호를 수신하는 것;
상기 1차 앰비소닉 신호의 제1 신호 대역에 대해, 상기 1차 앰비소닉 신호의 상기 W 성분의 총 에너지와 상기 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하는 것; 및
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하는 것
을 포함하는 동작을 수행하게 하는 명령어를 포함하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 명령어는 또한, 독립적인 출력, 디코딩, 및 공간적 렌더링 중 하나 이상에 대해 상기 2차 앰비소닉 신호를 스케일링하는 것을 포함하여, 상기 2차 앰비소닉 신호에 기초하여 출력 신호를 생성하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제18항에 있어서,
상기 명령어는 또한, 수신된 그대로의 상기 1차 앰비소닉 신호와 상기 2차 앰비소닉 신호 사이의 차이에 기초하여 다시 균형이 맞춰진 1차 앰비소닉 신호를 생성하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 2차 앰비소닉 신호를 결정하도록 상기 컴퓨터를 구성하기 위한 상기 명령어는, 전방향성 신호 정보를 배타적으로 포함하는 단일의 채널 신호를 결정하기 위한 명령어를 포함하는 것인, 컴퓨터 판독 가능 저장 매체. - 제20항에 있어서,
상기 명령어는 또한, 상기 단일의 채널 신호를 중간 채널 오디오 신호로서 렌더링하도록 상기 컴퓨터를 구성하되, 상기 중간 채널 오디오 신호는 머리 내에서 들리도록 또는 해석되도록 구성되는 신호이거나 또는 신의 목소리 신호인 것인, 컴퓨터 판독 가능 저장 매체. - 제20항에 있어서,
상기 명령어는 또한, 상기 2차 앰비소닉 신호의 적어도 일부에 상관 해제 프로세싱을 적용하여 상관 해제된 신호를 제공하도록, 그리고 상기 상관 해제된 신호를 엔벨로프먼트 소스로서 렌더링하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 2차 앰비소닉 신호는 하나 이상의 1차 또는 고차 앰비소닉 조향 성분을 포함하고, 상기 하나 이상의 지향성 조향 성분은 상기 1차 앰비소닉 신호로부터의 각각의 조향 성분에 기초하는 것인, 컴퓨터 판독 가능 저장 매체. - 제23항에 있어서,
상기 2차 앰비소닉 신호를 결정하도록 상기 컴퓨터를 구성하기 위한 상기 명령어는,
상기 수신된 1차 앰비소닉 신호의 상기 W, X, Y, 및 Z 성분에 대한 잔차 에러 투영 매트릭스를 계산하기 위한;
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 결정된 차이에 기초하여 전방향성 신호 리턴 계수를 결정하기 위한;
상기 결정된 전방향성 신호 리턴 계수를 사용하여 상기 잔차 에러 투영 매트릭스를 업데이트하기 위한; 그리고
상기 업데이트된 잔차 에러 투영 매트릭스를 상기 1차 앰비소닉 신호에 적용하고 그에 의해 상기 2차 앰비소닉 신호를 생성하기 위한
명령어를 포함하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 2차 앰비소닉 신호는 상기 수신된 1차 앰비소닉 신호에 기초하는 하나 이상의 지향성 조향 채널 및 전방향성 채널을 포함하는 1차 또는 고차 앰비소닉 신호로 구성되는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 명령어는 또한, 상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 결정된 차이만큼 더 적은 상기 1차 앰비소닉 신호를 포함하는 3차 앰비소닉 신호를 생성하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 명령어는 또한, 상기 1차 앰비소닉 신호의 상기 X, Y, 및 Z 성분과 관련하여 에너지에서의 인식된 불균형을 보정하도록 상기 1차 앰비소닉 신호의 상기 W 성분을 스케일링하는 것에 의해 출력을 위한 상기 1차 앰비소닉 신호를 준비하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 명령어는 또한, 3차 앰비소닉 신호가 하나 이상의 넌제로 지향성 성분을 포함하도록 상기 1차 앰비소닉 신호로부터 상기 2차 앰비소닉 신호를 감산하는 것에 의해 상기 3차 앰비소닉 신호를 생성하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제28항에 있어서,
상기 1차 앰비소닉 신호를 수신하도록 상기 컴퓨터를 구성하기 위한 상기 명령어는 지향성 큐 및 모호한 또는 덜 지향성인 특성을 갖는 볼륨 소스에 대한 정보를 수신하기 위한 명령어를 포함하고;
상기 2차 앰비소닉 신호를 결정하기 위한 상기 명령어는 상기 덜 지향성인 특성을 주로 나타내면서 상기 지향성 큐에 기초하여 하나 이상의 넌제로 지향성 성분을 갖는 신호를 생성하기 위한 명령어를 포함하고;
상기 3차 앰비소닉 신호의 상기 하나 이상의 넌제로 지향성 성분은 상기 지향성 큐를 주로 나타내고; 그리고 상기 명령어는 또한,
상기 3차 앰비소닉 신호의 상기 하나 이상의 넌제로 지향성 성분을 능동 디코더로 출력하도록; 그리고
상기 2차 앰비소닉 신호를 수동 디코더로 출력하도록
상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제28항에 있어서,
상기 명령어는 또한 상기 3차 앰비소닉 신호를 능동 디코더에 제공하도록 그리고 상기 2차 앰비소닉 신호를 수동 디코더에 제공하도록 상기 컴퓨터를 구성하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이를 결정하도록 상기 컴퓨터를 구성하기 위한 상기 명령어는, 상기 X, Y, 및 Z 성분의 제곱된 크기의 합이 상기 W 성분의 제곱 크기와 실질적으로 동일한지의 여부를 결정하기 위한 명령어를 포함하는 것인, 컴퓨터 판독 가능 저장 매체. - 제17항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이를 결정하도록 상기 컴퓨터를 구성하기 위한 상기 명령어는, 상기 1차 앰비소닉 신호의 성분 속성이 상기 1차 앰비소닉 신호에 대한 가정된 패닝 수학식 및 정규화의 솔루션과 수학적으로 등가인지의 여부를 결정하기 위한 명령어를 포함하는 것인, 컴퓨터 판독 가능 저장 매체. - 컴퓨팅 장치로서,
프로세서; 및
명령어를 저장하는 메모리를 포함하되, 상기 명령어는, 상기 프로세서에 의해 실행될 때,
W, X, Y, 및 Z 성분을 포함하는 B 포맷 1차 앰비소닉 신호를 수신하도록;
상기 1차 앰비소닉 신호의 제1 신호 대역에 대해, 상기 1차 앰비소닉 신호의 상기 W 성분의 총 에너지와 상기 X, Y, 및 Z 성분의 총 에너지 사이의 차이를 결정하도록; 및
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하도록
상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 명령어는 또한, 독립적인 출력, 디코딩, 및 공간적 렌더링 중 하나 이상에 대해 상기 2차 앰비소닉 신호를 스케일링하는 것을 포함하는, 상기 2차 앰비소닉 신호에 기초하여 출력 신호를 생성하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제34항에 있어서,
상기 명령어는 또한, 수신된 그대로의 상기 1차 앰비소닉 신호와 상기 2차 앰비소닉 신호 사이의 차이에 기초하여 다시 균형이 맞춰진 1차 앰비소닉 신호를 생성하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 2차 앰비소닉 신호를 결정하도록 상기 장치를 구성하기 위한 상기 명령어는, 전방향성 신호 정보를 배타적으로 포함하는 단일의 채널 신호를 결정하도록 상기 장치를 구성하기 위한 명령어를 포함하는 것인, 컴퓨팅 장치. - 제36항에 있어서,
상기 명령어는 또한, 상기 단일의 채널 신호를 중간 채널 오디오 신호로서 렌더링하도록 상기 장치를 구성하되, 상기 중간 채널 오디오 신호는 머리 내에서 들리도록 또는 해석되도록 구성되는 신호이거나 또는 신의 목소리 신호인 것인, 컴퓨팅 장치. - 제36항에 있어서,
상기 명령어는 또한, 상기 2차 앰비소닉 신호의 적어도 일부에 상관 해제 프로세싱을 적용하여 상관 해제된 신호를 제공하도록, 그리고 상기 상관 해제된 신호를 엔벨로프먼트 소스로서 렌더링하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 2차 앰비소닉 신호는 하나 이상의 1차 또는 고차 앰비소닉 조향 성분을 포함하되, 상기 하나 이상의 지향성 조향 성분은 상기 1차 앰비소닉 신호로부터의 각각의 조향 성분에 기초하는 것인, 컴퓨팅 장치. - 제39항에 있어서,
상기 2차 앰비소닉 신호를 결정하도록 상기 장치를 구성하기 위한 상기 명령어는,
상기 수신된 1차 앰비소닉 신호의 상기 W, X, Y, 및 Z 성분에 대한 잔차 에러 투영 매트릭스를 계산하기 위한;
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 결정된 차이에 기초하여 전방향성 신호 리턴 계수를 결정하기 위한;
상기 결정된 전방향성 신호 리턴 계수를 사용하여 상기 잔차 에러 투영 매트릭스를 업데이트하기 위한; 그리고
상기 업데이트된 잔차 에러 투영 매트릭스를 상기 1차 앰비소닉 신호에 적용하고 그에 의해 상기 2차 앰비소닉 신호를 생성하기 위한
명령어를 포함하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 2차 앰비소닉 신호는 상기 수신된 1차 앰비소닉 신호에 기초하는 하나 이상의 지향성 조향 채널 및 전방향성 채널을 포함하는 1차 또는 고차 앰비소닉 신호를 포함하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 명령어는 또한, 상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 결정된 차이만큼 더 적은 상기 1차 앰비소닉 신호를 포함하는 3차 앰비소닉 신호를 생성하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 명령어는 또한, 상기 1차 앰비소닉 신호의 상기 X, Y, 및 Z 성분과 관련하여 에너지에서의 인식된 불균형을 보정하도록 상기 1차 앰비소닉 신호의 상기 W 성분을 스케일링하는 것에 의해 출력을 위한 상기 1차 앰비소닉 신호를 준비하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 명령어는 또한, 3차 앰비소닉 신호가 하나 이상의 넌제로 지향성 성분을 포함하도록 상기 1차 앰비소닉 신호로부터 상기 2차 앰비소닉 신호를 감산하는 것에 의해 상기 3차 앰비소닉 신호를 생성하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제44항에 있어서,
상기 1차 앰비소닉 신호를 수신하도록 상기 장치를 구성하기 위한 상기 명령어는 지향성 큐 및 모호한 또는 덜 지향성인 특성을 갖는 볼륨 소스에 대한 정보를 수신하기 위한 명령어를 포함하고;
상기 2차 앰비소닉 신호를 결정하기 위한 상기 명령어는 상기 덜 지향성인 특성을 주로 나타내면서 상기 지향성 큐에 기초하여 하나 이상의 넌제로 지향성 성분을 갖는 신호를 생성하기 위한 명령어를 포함하고;
상기 3차 앰비소닉 신호의 상기 하나 이상의 넌제로 지향성 성분은 상기 지향성 큐를 주로 나타내고; 그리고 상기 명령어는 또한,
상기 3차 앰비소닉 신호의 상기 하나 이상의 넌제로 지향성 성분을 능동 디코더로 출력하도록; 그리고
상기 2차 앰비소닉 신호를 수동 디코더 또는 덜 지향성인 렌더러로 출력하도록
상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제44항에 있어서,
상기 명령어는 또한 상기 3차 앰비소닉 신호를 능동 디코더에 제공하도록 그리고 상기 2차 앰비소닉 신호를 수동 디코더에 제공하도록 상기 장치를 구성하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이를 결정하도록 상기 장치를 구성하기 위한 상기 명령어는, 상기 X, Y, 및 Z 성분의 제곱된 크기의 합이 상기 W 성분의 제곱 크기와 실질적으로 동일한지의 여부를 결정하기 위한 명령어를 포함하는 것인, 컴퓨팅 장치. - 제33항에 있어서,
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분의 상기 총 에너지 사이의 상기 차이를 결정하도록 상기 장치를 구성하기 위한 상기 명령어는, 상기 1차 앰비소닉 신호의 성분 속성이 상기 1차 앰비소닉 신호에 대한 가정된 패닝 수학식 및 정규화의 솔루션과 수학적으로 등가인지의 여부를 결정하기 위한 명령어를 포함하는 것인, 컴퓨팅 장치. - 방법으로서,
W 성분 및 X, Y, 및 Z 성분 중 하나 이상을 포함하는 1차 앰비소닉 신호를 수신하는 단계;
상기 1차 앰비소닉 신호의 제1 신호 대역에 대해, 상기 1차 앰비소닉 신호의 상기 W 성분의 총 에너지와 상기 X, Y, 및 Z 성분 중 상기 하나 이상의 것의 총 에너지 사이의 차이를 결정하는 단계; 및
상기 1차 앰비소닉 신호의 상기 W 성분의 상기 총 에너지와 상기 X, Y, 및 Z 성분 중 상기 하나 이상의 것의 상기 총 에너지 사이의 상기 차이에 관한 정보를 사용하여 2차 앰비소닉 신호를 결정하는 단계
를 포함하는, 방법. - 제49항에 있어서,
상기 1차 앰비소닉 신호는 W 성분 및 상기 X, Y, 및 Z 성분 중 두 개를 포함하고, 상기 2차 앰비소닉 신호는 X, Y, Z 및 W 성분을 갖는 B 포맷 앰비소닉 신호를 포함하는 것인, 방법. - 제49항에 있어서,
상기 2차 앰비소닉 신호에 기초하여 출력 신호를 생성하는 단계를 더 포함하되, 상기 생성하는 단계는 독립적인 출력, 디코딩, 및 공간적 렌더링 중 하나 이상에 대해 상기 2차 앰비소닉 신호를 스케일링하는 단계를 포함하는 것인, 방법. - 제49항에 있어서,
상기 2차 앰비소닉 신호를 결정하는 단계는, 전방향성 신호 정보를 배타적으로 포함하는 단일의 채널 신호를 결정하는 단계를 포함하는 것인, 방법. - 제49항에 있어서,
상기 2차 앰비소닉 신호는 상기 수신된 1차 앰비소닉 신호에 기초하는 하나 이상의 지향성 조향 채널 및 전방향성 채널을 포함하는 1차 또는 고차 앰비소닉 신호로 구성되는 것인, 방법. - 제49항에 있어서,
3차 앰비소닉 신호가 하나 이상의 넌제로 지향성 성분을 포함하도록 상기 1차 앰비소닉 신호로부터 상기 2차 앰비소닉 신호를 감산하는 것에 의해 상기 3차 앰비소닉 신호를 생성하는 단계; 및
상기 3차 앰비소닉 신호를 능동 디코더에 제공하고 상기 2차 앰비소닉 신호를 수동 디코더에 제공하는 단계
를 더 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962855202P | 2019-05-31 | 2019-05-31 | |
US62/855,202 | 2019-05-31 | ||
PCT/US2020/035270 WO2020243535A1 (en) | 2019-05-31 | 2020-05-29 | Omni-directional encoding and decoding for ambisonics |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220027891A true KR20220027891A (ko) | 2022-03-08 |
Family
ID=71787092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217043424A KR20220027891A (ko) | 2019-05-31 | 2020-05-29 | 앰비소닉스를 위한 전방향성 인코딩 및 디코딩 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3977447A1 (ko) |
KR (1) | KR20220027891A (ko) |
WO (1) | WO2020243535A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017218973A1 (en) * | 2016-06-17 | 2017-12-21 | Edward Stein | Distance panning using near / far-field rendering |
-
2020
- 2020-05-29 KR KR1020217043424A patent/KR20220027891A/ko unknown
- 2020-05-29 WO PCT/US2020/035270 patent/WO2020243535A1/en unknown
- 2020-05-29 EP EP20746393.6A patent/EP3977447A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3977447A1 (en) | 2022-04-06 |
WO2020243535A1 (en) | 2020-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110651487B (zh) | 分布式音频虚拟化系统 | |
US20210020183A1 (en) | Spatial audio signal decoder | |
KR102608630B1 (ko) | 바이노럴 오디오를 생성하는 헤드-웨어러블 장치 | |
US11205435B2 (en) | Spatial audio signal encoder | |
US20190075418A1 (en) | Sweet spot adaptation for virtualized audio | |
US9955277B1 (en) | Spatial sound characterization apparatuses, methods and systems | |
KR102557774B1 (ko) | 음향 주밍 | |
US11997456B2 (en) | Spatial audio capture and analysis with depth | |
KR102656969B1 (ko) | 불일치 오디오 비주얼 캡쳐 시스템 | |
EP3980993B1 (en) | Hybrid spatial audio decoder | |
US20200143815A1 (en) | Device and method for capturing and processing a three-dimensional acoustic field | |
KR20220027891A (ko) | 앰비소닉스를 위한 전방향성 인코딩 및 디코딩 |