KR20150010727A - 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 - Google Patents
고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 Download PDFInfo
- Publication number
- KR20150010727A KR20150010727A KR1020147031645A KR20147031645A KR20150010727A KR 20150010727 A KR20150010727 A KR 20150010727A KR 1020147031645 A KR1020147031645 A KR 1020147031645A KR 20147031645 A KR20147031645 A KR 20147031645A KR 20150010727 A KR20150010727 A KR 20150010727A
- Authority
- KR
- South Korea
- Prior art keywords
- hoa
- residual
- component
- dominant
- order
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 31
- 230000002093 peripheral effect Effects 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 27
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 230000001149 cognitive effect Effects 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 8
- 238000009877 rendering Methods 0.000 claims description 6
- 235000009508 confectionery Nutrition 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 58
- 238000007906 compression Methods 0.000 description 27
- 239000011159 matrix material Substances 0.000 description 24
- 238000005070 sampling Methods 0.000 description 24
- 230000006835 compression Effects 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 10
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 8
- 229910052709 silver Inorganic materials 0.000 description 8
- 239000004332 silver Substances 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000006837 decompression Effects 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 238000004091 panning Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Stereophonic System (AREA)
- User Interface Of Digital Computer (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
고차 앰비소닉스(HOA)는, 스피커 설정에 무관한, 스위트 스폿 근방에서의 완전한 음장을 나타낸다. 높은 공간 분해능은 많은 수의 HOA 계수들을 필요로 한다. 본 발명에서, 우세 사운드 방향들이 추정되고, HOA 신호 표현이 시간 영역에서의 다수의 우세 방향 신호들 및 관련 방향 정보, 그리고 HOA 영역에서의 주변 성분으로 분해되고, 이어서 그의 차수를 감소시키는 것에 의해 주변 성분이 압축된다. 감소된 차수의 주변 성분이 공간 영역으로 변환되고, 방향 신호들과 함께 인지 코딩된다. 수신기측에서, 인코딩된 방향 신호들 및 차수 감소된 인코딩된 주변 성분이 인지 압축 해제되고, 인지 압축 해제된 주변 신호들은 감소된 차수의 HOA 영역 표현으로 변환되고, 이어서 차수 확장된다. 총 HOA 표현이 방향 신호들, 대응하는 방향 정보, 및 원래 차수의 주변 HOA 성분으로부터 재합성된다.
Description
본 발명은 고차 앰비소닉스(Higher Order Ambisonics) 신호 표현을 압축 및 압축 해제하는 방법 및 장치에 관한 것이며, 여기서 방향 성분(directional component) 및 주변 성분(ambient component)이 상이한 방식으로 처리된다.
고차 앰비소닉스(HOA)는 3차원 공간에서의 특정의 장소(이 장소는 '스위트 스폿(sweet spot)'이라고 함) 부근에서 완전한 음장(sound field)을 포착하는 장점을 제공한다. 이러한 HOA 표현은, 스테레오 또는 서라운드와 같은 채널 기반 기법들과 달리, 특정의 스피커 설정에 무관하다. 그러나, 이 유연성은 특정의 스피커 설정에서 HOA 표현의 재생을 위해 필요한 디코딩 프로세스의 대가이다.
HOA는 원하는 청취자 위치 - 일반성의 상실 없이, 절단된 구면 조화 함수(Spherical Harmonics)(SH) 전개를 사용하여 구면 좌표계의 원점인 것으로 가정될 수 있음 - 의 부근에서 위치들 x에 대한 개별적인 각파수들(angular wave numbers) k에 대한 공기 압력의 복소 진폭들의 기술에 기초하고 있다. 이 표현의 공간 분해능은 전개의 최대 차수 N이 증가함에 따라 향상된다. 안타깝게도, 전개 계수들의 수 O는 차수 N에 따라 이차식으로 증가한다 - 즉, O = (N + 1)2 -. 예를 들어, 차수 N = 4를 사용하는 전형적인 HOA 표현들은 O = 25개의 HOA 계수들을 필요로 한다. 원하는 샘플링 레이트 fs 및 샘플당 비트 수 Nb가 주어진 경우, HOA 신호 표현의 전송을 위한 총 비트 레이트는 에 의해 결정되고, 샘플당 Nb = 16 비트를 이용하여 fs = 48kHz의 샘플링 레이트를 갖는 차수 N = 4의 HOA 신호 표현을 전송하는 것의 결과, 19.2 메가비트/초의 비트 레이트가 얻어진다. 이와 같이, HOA 신호 표현들을 압축하는 것이 아주 바람직하다.
기존의 공간 오디오 압축 접근방법들의 개요는 특허 출원 EP 10306472.1에 또는 I. Elfitri, B. Gunel, A.M. Kondoz, "Multichannel Audio Coding Based on Analysis by Synthesis", Proceedings of the IEEE, vol.99, no.4, pp.657-670, April 2011에서 찾아볼 수 있다.
이하의 기법들은 본 발명과 관련하여 더 관련이 있다.
1차의 앰비소닉스 표현들과 동등한 B-형식 신호들이 V. Pulkki, "Spatial Sound Reproduction with Directional Audio Coding", Journal of Audio Eng. Society, vol.55 (6), pp.503-516, 2007에 기술되어 있는 DirAC(Directional Audio Coding)를 사용하여 압축될 수 있다. 원격 회의 응용들을 위해 제안된 하나의 버전에서, B-형식 신호가 단일의 전방향 신호(omni-directional signal)는 물론 단일 방향 형태의 보조 정보 및 주파수 대역별 확산감(diffuseness) 파라미터에도 코딩된다. 그렇지만, 그 결과로 인한 데이터 레이트의 급격한 감소는 재생 시에 얻어진 사소한 신호 품질의 대가로 오게 된다. 게다가, DirAC는 아주 낮은 공간 분해능을 겪는 1차의 앰비소닉스 표현들의 압축으로 제한된다.
N>1를 갖는 HOA 표현들의 압축을 위한 기지의 방법들이 아주 드물다. 그들 중 하나는 인지(perceptual) AAC(Advanced Audio Coding) 코덱(E. Hellerud, I. Burnett, A. Solvang, U. Peter Svensson, "Encoding Higher Order Ambisonics with AAC", 124th AES Convention, Amsterdam, 2008을 참조)을 이용하여 개별적인 HOA 계수 시퀀스들의 직접 인코딩을 수행한다. 그렇지만, 이러한 접근방법에서의 본질적인 문제점은 결코 들리지 않는 신호들의 인지 코딩(perceptual coding)이다. 재구성된 재생 신호들은 보통 HOA 계수 시퀀스들의 가중합에 의해 획득된다. 그러한 이유는 압축 해제된 HOA 표현이 특정의 스피커 설계에서 렌더링될 때 인지 코딩 잡음의 언마스킹(unmasking)에 대한 확률이 높기 때문이다. 좀더 기술적인 용어로 말하면, 인지 코딩 잡음 언마스킹에 대한 주된 문제점은 개별적인 HOA 계수 시퀀스들 간의 높은 교차 상관이다. 개별적인 HOA 계수 시퀀스들에서의 코딩된 잡음 신호들이 보통 서로 비상관(uncorrelated)되어 있기 때문에, 인지 코딩 잡음의 보강 중첩(constructive superposition)이 일어날 수 있는 반면, 이와 동시에, 무잡음 HOA 계수 시퀀스들은 중첩 시에 소거된다. 추가적인 문제점은 언급된 교차 상관들이 인지 코더들의 효율 감소를 야기한다는 것이다.
이 효과들의 정도를 최소화하기 위해, EP 10306472.1에서 HOA 표현을 인지 코딩 이전에 공간 영역에서의 등가 표현으로 변환하는 것이 제안되어 있다. 공간 영역 신호들은 종래의 방향 신호들에 대응하고, 스피커들이 공간 영역 변환에 대해 가정된 것과 정확히 동일한 방향들에 배치되어 있는 경우 스피커 신호들에 대응할 것이다.
공간 영역으로의 변환은 개별적인 공간 영역 신호들 간의 교차 상관을 감소시킨다. 그렇지만, 교차 상관들이 완전히 제거되지는 않는다. 비교적 높은 교차 상관에 대한 한 예는 공간 영역 신호들에 의해 커버되는 인접한 방향들 사이에 속하는 방향을 갖는 방향 신호(directional signal)이다.
AEP 10306472.1 및 앞서 언급한 Hellerud 등의 논문의 추가적인 단점은 인지 코딩된 신호들의 수가 (N + 1)2이라는 것이고, 여기서 N은 HOA 표현의 차수이다. 따라서, 압축된 HOA 표현에 대한 데이터 레이트가 앰비소닉스 차수에 따라 이차식으로 증가한다.
본 발명의 압축 처리는 방향 성분 및 주변 성분으로의 HOA 음장 표현의 분해를 수행한다. 상세하게는, 방향 음장 성분의 계산을 위해, 몇개의 우세 사운드 방향들(dominant sound directions)의 추정을 위한 새로운 처리가 이하에 기술된다.
앰비소닉스에 기초한 방향 추정을 위한 기존의 방법과 관련하여, 앞서 언급한 Pulkki 논문은 B-형식 음장 표현에 기초한, 방향의 추정을 위한 DirAC 코딩과 관련한 하나의 방법을 기술하고 있다. 음장 에너지의 흐름의 방향을 가리키는 평균 세기 벡터로부터 방향이 획득된다. B-형식에 기초한 대안이 D. Levin, S. Gannot, E.A.P. Habets, "Direction-of- Arrival Estimation using Acoustic Vector Sensors in the Presence of Noise", IEEE Proc. of the ICASSP, pp. 105-108, 2011에 제안되어 있다. 그 방향으로 조정된 빔 형성기 출력 신호의 최대 전력을 제공하는 그 방향을 검색하는 것에 의해 ?향 추정이 반복적으로 수행된다.
그렇지만, 이들 접근방법 둘 다는 비교적 낮은 공간 분해능을 겪는 방향 추정을 위한 B-형식으로 제약된다. 부가의 단점은 추정이 단일 우세 방향으로만 제한된다는 것이다.
HOA 표현들은 개선된 공간 분해능을 제공하고, 따라서 몇개의 우세 방향들의 개선된 추정을 가능하게 한다. HOA 음장 표현들에 기초하여 몇개의 방향들의 추정을 수행하는 기존의 방법들이 아주 드물다. 압축 감지(compressive sensing)에 기초한 접근방법이 N. Epain, C. Jin, A. van Schaik, "The Application of Compressive Sampling to the Analysis and Synthesis of Spatial Sound Fields", 127th Convention of the Audio Eng. Soc, New York, 2009, 및 A. Wabnitz, N. Epain, A. van Schaik, C Jin, "Time Domain Reconstruction of Spatial Sound Fields Using Compressed Sensing", IEEE Proc. of the ICASSP, pp. 465-468, 2011에 제안되어 있다. 주된 아이디어는 음장이 공간적으로 성긴(spatially sparse) 것으로, 즉 단지 적은 수의 방향 신호들로만 이루어져 있는 것으로 가정하는 것이다. 구면 상에 많은 수의 테스트 방향들을 할당한 후에, 주어진 HOA 표현으로 잘 기술되도록, 대응하는 방향 신호들과 함께 가능한 한 적은 테스트 방향들을 찾아내기 위해 최적화 알고리즘이 이용된다. 이 방법은, 주어진 HOA 표현의 제한된 차수로 인해 생기는 공간 분산(spatial dispersion)을 피하기 때문에, 주어진 HOA 표현에 의해 실제로 제공되는 것과 비교하여 개선된 공간 분해능을 제공한다. 그렇지만, 이 알고리즘의 성능은 성김(sparsity) 가정이 충족되는지에 크게 의존한다. 상세하게는, 음장이 임의의 사소한 주변 성분들을 포함하는 경우 또는 HOA 표현이 그가 다중 채널 녹음들로부터 계산될 때 발생되는 잡음에 의해 영향을 받는 경우, 이 접근방법이 실패한다.
추가의 꽤 직관적인 방법은 B. Rafaely, "Plane-wave decomposition of the sound field on a sphere by spherical convolution", J. Acoust. Soc. Am., vol.4, no.116, pp .2149-2157, October 2004에 기술된 바와 같이 주어진 HOA 표현을 공간 영역으로 변환하고, 이어서 방향 전력들에서 최대값을 검색하는 것이다. 이 접근방법의 단점은 주변 성분들의 존재가 방향 전력 분포(directional power distribution)의 블러링(blurring) 및 임의의 주변 성분의 부존재와 비교하여 방향 전력들의 최대값의 이동(displacement)을 가져온다는 것이다.
본 발명에 의해 해결될 문제점은 HOA 신호들에 대한 압축을 제공하고 그로써 HOA 신호 표현의 높은 공간 분해능이 여전히 유지되는 것이다. 이 문제점은 청구항 1 및 청구항 2에 개시된 방법들에 의해 해결된다. 이 방법들을 이용하는 장치들은 청구항 3 및 청구항 4에 개시되어 있다.
본 발명은 음장들의 고차 앰비소닉스(HOA) 표현들의 압축에 관한 것이다. 본 출원에서, 'HOA'라는 용어는 고차 앰비소닉스 표현 자체는 물론 그에 대응하여 인코딩되는 또는 표현되는 오디오 신호를 나타낸다. 우세 사운드 방향들이 추정되고, HOA 신호 표현이 시간 영역에서의 다수의 우세 방향 신호들 및 관련 방향 정보 그리고 HOA 영역에서의 주변 성분으로 분해되고, 이어서 그의 차수를 감소시키는 것에 의해 주변 성분이 압축된다. 그 분해 후에, 감소된 차수의 주변 HOA 성분이 공간 영역으로 변환되고, 방향 신호들과 함께 인지 코딩(perceptually coded)된다.
수신기 또는 디코더 측에서, 인코딩된 방향 신호들 및 차수 감소된 인코딩된 주변 성분이 인지 압축 해제(perceptually decompressed)된다. 인지 압축 해제된 주변 신호들은 감소된 차수의 HOA 영역 표현으로 변환되고, 이어서 차수 확장(order extension)된다. 총 HOA 표현(total HOA representation)이 방향 신호들 및 대응하는 방향 정보로부터 그리고 원래 차수의 주변 HOA 성분으로부터 재합성된다.
유리하게도, 주변 음장 성분이 원래보다 낮은 차수를 가지는 HOA 표현에 의해 충분한 정확도로 표현될 수 있고, 우세 방향 신호들의 추출은, 압축 및 압축 해제 후에, 높은 공간 분해능이 여전히 달성되도록 보장한다.
원칙적으로, 본 발명의 방법은 고차 앰비소닉스(HOA) 신호 표현을 압축하는 데 적합하고, 상기 방법은
- 우세 방향들을 추정하는 단계 - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들 및 관련 방향 정보, 그리고 HOA 영역에서의 잔차 주변 성분으로 분해 또는 디코딩하는 단계 - 상기 잔차 주변 성분은 상기 HOA 신호 표현과 상기 우세 방향 신호들의 표현 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하는 단계;
- 감소된 차수의 상기 잔차 주변 HOA 성분을 공간 영역으로 변환하는 단계;
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩(perceptually encoding)하는 단계를 포함한다.
원칙적으로, 본 발명의 방법은
- 우세 방향들을 추정하는 단계 - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들 및 관련 방향 정보, 그리고 HOA 영역에서의 잔차 주변 성분으로 분해 또는 디코딩하는 단계 - 상기 잔차 주변 성분은 상기 HOA 신호 표현과 상기 우세 방향 신호들의 표현 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하는 단계;
- 감소된 차수의 상기 잔차 주변 HOA 성분을 공간 영역으로 변환하는 단계; 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩하는 단계에 의해 압축된 고차 앰비소닉스(HOA) 신호 표현을 압축 해제하는 데 적합하고, 상기 방법은
- 상기 인지 인코딩된 우세 방향 신호들 및 상기 인지 인코딩된 변환된 잔차 주변 HOA 성분을 인지 디코딩(perceptually decoding)하는 단계;
- HOA 영역 표현을 얻기 위해 상기 인지 디코딩된 변환된 잔차 주변 HOA 성분을 역변환하는 단계;
- 원래 차수의 주변 HOA 성분을 설정하기 위해 상기 역변환된 잔차 주변 HOA 성분의 차수 확장을 수행하는 단계; 및
- HOA 신호 표현을 얻기 위해 상기 인지 디코딩된 우세 방향 신호들, 상기 방향 정보 및 상기 원래 차수의 확장된 주변 HOA 성분을 합성하는 단계를 포함한다.
원칙적으로, 본 발명의 장치는 고차 앰비소닉스(HOA) 신호 표현을 압축하는 데 적합하고, 상기 장치는
- 우세 방향들을 추정하도록 구성된 수단 - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들 및 관련 방향 정보, 그리고 HOA 영역에서의 잔차 주변 성분으로 분해 또는 디코딩하도록 구성된 수단 - 상기 잔차 주변 성분은 상기 HOA 신호 표현과 상기 우세 방향 신호들의 표현 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하도록 구성된 수단;
- 감소된 차수의 상기 잔차 주변 HOA 성분을 공간 영역으로 변환하도록 구성된 수단; 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩하도록 구성된 수단을 포함한다.
원칙적으로, 본 발명의 장치는
- 우세 방향들을 추정하는 단계 - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들 및 관련 방향 정보, 그리고 HOA 영역에서의 잔차 주변 성분으로 분해 또는 디코딩하는 단계 - 상기 잔차 주변 성분은 상기 HOA 신호 표현과 상기 우세 방향 신호들의 표현 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하는 단계;
- 감소된 차수의 상기 잔차 주변 HOA 성분을 공간 영역으로 변환하는 단계; 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩하는 단계에 의해 압축된 고차 앰비소닉스(HOA) 신호 표현을 압축 해제하는 데 적합하고, 상기 장치는
- 상기 인지 인코딩된 우세 방향 신호들 및 상기 인지 인코딩된 변환된 잔차 주변 HOA 성분을 인지 디코딩하도록 구성된 수단;
- HOA 영역 표현을 얻기 위해 상기 인지 디코딩된 변환된 잔차 주변 HOA 성분을 역변환하도록 구성된 수단;
- 원래 차수의 주변 HOA 성분을 설정하기 위해 상기 역변환된 잔차 주변 HOA 성분의 차수 확장을 수행하도록 구성된 수단; 및
- HOA 신호 표현을 얻기 위해 상기 인지 디코딩된 우세 방향 신호들, 상기 방향 정보 및 상기 원래 차수의 확장된 주변 HOA 성분을 합성하도록 구성된 수단을 포함한다.
본 발명의 유리한 부가의 실시예들이 각자의 종속항들에 개시되어 있다.
앰비소닉스 신호들은 구면 조화 함수(Spherical Harmonics)(SH) 전개를 사용하여 소스 없는 구역들(source-free areas) 내에서의 음장들을 기술한다. 이 설명의 실현가능성은 음압(sound pressure)의 시간 및 공간 거동이 본질적으로 파동 방정식(wave equation)에 의해 결정된다는 물리적 특성에 기인할 수 있다.
파동 방정식 및 구면 조화 함수 전개
앰비소닉스의 더 상세한 설명을 위해, 이하에서, 구면 좌표계가 가정되고, 여기서 공간 에서의 한 점이 반경 r > 0(즉, 좌표 원점(coordinate origin)까지의 거리), 극축(polar axis) z로부터 측정된 경사각(inclination angle) , 및 x=y 평면에서 x 축으로부터 측정되는 방위각(azimuth angle) 로 표현된다. 이 구면 좌표계에서, 연결된 소스 없는 구역(connected source-free area) 내에서 음압 p(t, x)에 대한 파동 방정식 - t는 시간을 나타냄 - 은 Earl G. Williams의 교재, "Fourier Acoustics", vol. 93 of Applied Mathematical Sciences, Academic Press, 1999에 주어져 있고:
여기서 cs는 음속(speed of sound)을 나타낸다. 그 결과, 시간에 대한 음압의 푸리에 변환
- i는 허수 단위임 - 은 Williams 교재에 따라 SH의 급수로 전개될 수 있다:
유의할 점은, 이 전개가 급수의 수렴 영역에 대응하는 연결된 소스 없는 구역 내의 모든 점들 x에 대해 유효하다는 것이다. 수학식 4에서, k는
에 의해 정의되는 각파수를 나타내고,
의 SH 함수들이고,
음이 아닌 각도 인덱스들(m)에 대한 연관된 Legendre 함수들은
에 의해 Legendre 다항식들 Pn(x)를 통해 정의된다.
음의 각도 인덱스들(즉, m < 0)에 대해, 연관된 Legendre 함수들은
에 의해 정의된다.
Legendre 다항식들 Pn(x)(n≥0)은 차례로 Rodrigues의 식(Rodrigues' Formula)을 사용하여
종래 기술에서, 예컨대, M. Poletti, "Unified Description of Ambisonics using Real and Complex Spherical Harmonics", Proceedings of the Ambisonics Symposium 2009, 25-27 June 2009, Graz, Austria에서, 음의 각도 인덱스들(m)에 대해 (-1)m의 인자에 의해 수학식 6의 함수로부터 벗어난 SH 함수들의 정의들이 또한 존재한다.
으로서 표현될 수 있다.
문헌에, 실수 SH 함수들의 다양한 정의들이 존재한다(예컨대, 앞서 언급한 Poletti 논문을 참조). 본 문서 전체에 걸쳐 적용되는 하나의 가능한 정의는
에 의해 주어져 있고,
여기서
이다.
복소 SH 함수들은 다음과 같이 실수 SH 함수들에 관련되어 있다:
복소 SH 함수들 는 물론 실수 SH 함수들 는 방향 벡터 와 함께 3차원 공간에서의 단위 구면(unit sphere) 상에서의 제곱 적분가능 복소값 함수들(squared integrable complex valued functions)에 대한 정규 직교 기저(orthonormal basis)를 형성하고, 따라서 조건들
을 따르고, 여기서 δ는 Kronecker 델타 함수(Kronecker delta function)를 나타낸다. 수학식 15 및 수학식 11에서의 실수 구면 조화 함수들의 정의를 사용하여 제2 결과가 도출될 수 있다.
내부 문제(
interior
problem
) 및
앰비소닉스
계수들
앰비소닉스의 목적은 좌표 원점의 근방에서의 음장을 표현하는 것이다. 일반성의 상실 없이, 이 관심 영역은 여기서, 집합 로 명시되는, 좌표 원점에 중심을 둔 반경 R의 구체(ball)로 가정된다. 이 표현에 대한 중요한 가정은 이 구체가 어떤 음원(sound source)도 포함하지 않아야 한다는 것이다. 이 구체 내에서의 음장의 표현을 찾아내는 것을 '내부 문제'라고 한다(앞서 언급한 Williams 교재를 참조).
여기서 은 1차의 구면 Bessel 함수들(spherical Bessel functions)을 나타낸다. 수학식 17로부터, 당연히 음장에 관한 완전한 정보가 앰비소닉스 계수들이라고 하는 계수들 에 포함되어 있다.
로서 인수 분해될 수 있고,
평면파
분해(
plane
wave
decomposition
)
좌표 원점에 중심을 둔 음원이 없는 구체(sound source-free ball) 내의 음장은 모든 가능한 방향들로부터 구체에 충돌하는 상이한 각파수들(k)의 무한한 수의 평면파들의 중첩에 의해 표현될 수 있다(앞서 언급한 Rafaely "Plane-wave decomposition ..." 논문을 참조). 방향 으로부터의 각파수(k)를 갖는 평면파의 복소 진폭이 에 의해 주어지는 것으로 가정하면, 수학식 11 및 수학식 19를 사용하여 유사한 방식으로, 실수 SH 함수 전개에 대한 대응하는 앰비소닉스 계수들이
에 의해 주어진다는 것을 알 수 있다.
함수 는 '진폭 밀도(amplitude density)'라고 하며, 단위 구면 상에서 제곱 적분가능인 것으로 가정된다. 이는 이하의 식과 같이 실수 SH 함수들의 급수로 전개될 수 있고,
가 얻어진다. 이어서, 시간 영역에서, 수학식 24는
로서 나타내어질 수 있다.
에 따라 실수 SH 함수 전개에 의해 표현될 수 있다.
에 의해 표현될 수 있다.
이하에서, 또한 음장 표현이 이 계수들에 의해 주어지는 것으로 가정되고, 이에 대해서는 압축을 다루고 있는 이하의 섹션에서 더 상세히 기술될 것이다.
유의할 점은, 본 발명에 따른 처리를 위해 사용되는 계수들 에 의한 시간 영역 HOA 표현이 대응하는 주파수 영역 HOA 표현 와 동등하다는 것이다. 따라서, 기술된 압축 및 압축 해제가 방정식들의 사소한 각자의 수정에 의해 주파수 영역에서 동등하게 실현될 수 있다.
유한 차수를 갖는 공간 분해능
에 따라 SH 함수들의 절단된 급수로부터 진폭 밀도 함수를 계산하는 것은 진정한 진폭 밀도 함수 와 비교하여 일종의 공간 분산을 유입시킨다(앞서 언급한 "Plane-wave decomposition ..." 논문을 참조). 이것은 수학식 31을 사용하여 방향 으로부터의 단일의 평면파에 대해 진폭 밀도 함수를 계산하는 것에 의해 실현될 수 있다:
여기서
수학식 34에서는, 수학식 20에 주어진 평면파에 대한 앰비소닉스 계수들이 이용되는 반면, 수학식 35 및 수학식 36에서는, 어떤 수학적 정리들(mathematical theorems)이 이용된다(앞서 언급한 "Plane-wave decomposition ..." 논문을 참조). 수학식 33에서의 특성은 수학식 14를 사용하여 보여질 수 있다.
수학식 37을 진정한 진폭 밀도 함수
- 여기서 는 Dirac 델타 함수를 나타냄 - 와 비교하면, 상이한 앰비소닉스 차수들 N 및 각도들 에 대해 그의 최대 값에 의해 정규화된 후에, 도 1에 예시되어 있는 분산 함수 가 스케일링된 Dirac 델타 함수를 대체하는 것으로부터 공간 분산이 명백하게 된다.
의 첫번째 0이 N≥4에 대해 대략 에 위치해 있기 때문에(앞서 언급한 "Plane-wave decomposition ..." 논문을 참조), 앰비소닉스 차수 N의 증가에 따라 분산 효과가 감소된다(이에 따라 공간 분해능이 향상됨).
차수 n≤N의 실수 SH 함수들의 벡터를
에 의해 정의할 때
과 같이 2개의 실수 SH 함수들의 스칼라 곱을 통해 표현될 수 있다는 것을 보여준다.
분산은 등가적으로 시간 영역에서 다음과 같이 표현될 수 있다.
샘플링
어떤 응용들에 대해, 유한한 수()의 이산 방향들(discrete directions) 에서 시간 영역 진폭 밀도 함수 의 샘플들로부터 스케일링된 시간 영역 앰비소닉스 계수들 를 결정하는 것이 바람직하다. 수학식 28에서의 적분은 그러면 B. Rafaely, "Analysis and Design of Spherical Microphone Arrays", IEEE Transactions on Speech and Audio Processing, vol. 13, no.1, pp. 135-143, January 2005에 따라 유한합에 의해 근사화되고:
여기서 는 어떤 적절히 선택된 샘플링 가중치들을 나타낸다. "Analysis and Design ..." 논문과 달리, 근사화(수학식 50)는 복소 SH 함수들을 사용한 주파수 영역 표현보다는 실수 SH 함수들을 사용한 시간 영역 표현을 말한다. 근사화(수학식 50)가 정확하게 되기 위한 필요 조건은 진폭 밀도가 제한된 고조파 차수(harmonic order) N을 가진다(
이 조건이 충족되지 않는 경우, 근사화(수학식 50)는 공간 엘리어싱 오차(spatial aliasing errors)를 겪는다(B. Rafaely, "Spatial Aliasing in Spherical Microphone Arrays", IEEE Transactions on Signal Processing, vol. 55, no.3, pp .1003-1010, March 2007을 참조). 제2 필요 조건은 "Analysis and Design ..." 논문에 주어진 대응하는 조건들을 충족시키기 위해 샘플링 점들 및 대응하는 가중치들을 필요로 한다:
정확한 샘플링을 위해 조건들 수학식 51 및 수학식 52의 결합으로 충분하다.
샘플링 조건(수학식 52)은
과 같은 단일의 행렬 방정식(matrix equation)을 사용하여 압축하여 표현될 수 있는 선형 방정식들의 집합으로 이루어져 있고,
에 의해 정의된 모드 행렬(mode matrix)을 나타내고,
G는 그의 대각선에 가중치들을 갖는 행렬을 나타낸다, 즉
이다.
수학식 53으로부터, 수학식 52가 성립하기 위한 필요 조건이 샘플링 점들의 수 가 을 충족시켜야 한다는 것을 알 수 있다. 개의 샘플링 점들에서의 시간 영역 진폭 밀도의 값들을 벡터
로 모으고,
스케일링된 시간 영역 앰비소닉스 계수들의 벡터를
에 의해 정의하면, 이들 벡터 둘 다는 SH 함수 전개(수학식 29)를 통해 관계되어 있다. 이 관계는 이하의 선형 방정식들의 시스템을 제공한다:
도입된 벡터 표기법을 사용하여, 시간 영역 진폭 밀도 함수 샘플들의 값들로부터 스케일링된 시간 영역 앰비소닉스 계수들의 계산은
로서 쓰여질 수 있다.
고정된 앰비소닉스 차수 N이 주어진 경우, 샘플링 조건 방정식(수학식 52)이 성립하도록 개수의 샘플링 점들 및 대응하는 가중치들을 계산하는 것이 종종 가능하지 않다. 그렇지만, 샘플링 조건이 잘 근사화되도록 샘플링 점들이 선택되는 경우, 모드 행렬 의 랭크는 0이고, 그의 조건수(condition number)가 낮다. 이 경우에, 모드 행렬 의 의사 역행렬(pseudo-inverse)
가 존재하고, 시간 영역 진폭 밀도 함수 샘플들의 벡터로부터의 스케일링된 시간 영역 앰비소닉스 계수 벡터 c(t)의 타당한 근사화는
이기 때문이다.
그에 부가하여, 샘플링 조건 방정식(수학식 52)이 충족되는 경우,
가 성립하고, 근사화들(수학식 59 및 수학식 61) 둘 다가 등가이고 정확하다.
벡터 w(t)는 공간 시간 영역 신호들의 벡터로서 해석될 수 있다. HOA 영역으로부터 공간 영역으로의 변환이, 예컨대, 수학식 58을 사용하여 수행될 수 있다. 이러한 종류의 변환은 본 출원에서 '구면 조화 함수 변환(Spherical Harmonic Transform)(SHT)'이라고 하고, 감소된 차수의 주변 HOA 성분이 공간 영역으로 변환될 때 사용된다. SHT에 대한 공간 샘플링 점들 가 (단, 임)로 수학식 52에서의 샘플링 조건을 대략적으로 만족시키고 인 것으로 암시적으로 가정된다. 이 가정들 하에서, SHT 행렬은 을 충족시킨다. SHT에 대한 절대 스케일링(absolute scaling)이 중요하지 않은 경우에, 상수 가 무시될 수 있다.
압축
본 발명은 주어진 HOA 신호 표현의 압축에 관한 것이다. 앞서 언급한 바와 같이, HOA 표현이 시간 영역에서의 사전 정의된 수의 우세 방향 신호들 및 HOA 영역에서의 주변 성분으로 분해되고, 이어서 주변 성분의 HOA 표현이 그의 차수를 감소시키는 것에 의해 압축된다. 이 동작은 주변 음장 성분이 낮은 차수를 갖는 HOA 표현에 의해 충분한 정확도로 표현될 수 있다는, 청취 테스트에 의해 지원되는 가정을 이용한다. 우세 방향 신호들의 추출은, 압축 및 대응하는 압축 해제 후에, 높은 공간 분해능이 유지되도록 보장한다.
분해 후에, 감소된 차수의 주변 HOA 성분이 공간 영역으로 변환되고, 특허 출원 EP 10306472.1의 예시적인 실시예들 섹션에 기술된 바와 같이, 방향 신호들과 함께 인지 코딩된다.
압축 처리는 도 2에 도시되어 있는 2개의 연속적인 단계들을 포함한다. 개별적인 신호들의 정확한 정의들은 이하의 섹션 압축의 상세에서 기술된다.
도 2a에 도시된 제1 단계 또는 스테이지에서, 우세 방향 추정기(22)에서, 우세 방향들이 추정되고, 앰비소닉스 신호 C(l)의 방향 및 잔차 또는 주변 성분으로의 분해가 수행되며, 여기서 l은 프레임 인덱스를 나타낸다. 방향 성분은 방향 신호 계산 단계 또는 스테이지(23)에서 계산되고, 그로써 앰비소닉스 표현이 대응하는 방향들 을 갖는 D개의 종래의 방향 신호들 X(l)의 집합에 의해 표현되는 시간 영역 신호들로 변환된다. 잔차 주변 성분은 주변 HOA 성분 계산 단계 또는 스테이지(24)에서 계산되고, HOA 영역 계수들 CA(l)에 의해 표현된다.
도 2b에 도시된 제2 단계에서, 방향 신호들 X(l) 및 주변 HOA 성분 CA(l)의 인지 코딩은 다음과 같이 수행된다:
- 종래의 시간 영역 방향 신호들 X(l)은 인지 코더(27)에서 임의의 공지된 인지 압축 기법을 사용하여 개별적으로 압축될 수 있다.
- 주변 HOA 영역 성분 CA(l)의 압축이 2개의 서브 단계들 또는 스테이지들에서 수행된다.
제1 서브 단계 또는 스테이지(25)는 원래의 앰비소닉스 차수 N의 NRED(예컨대, NRED= 2)로의 감소를 수행하고, 그 결과 주변 HOA 성분 CA,RED(l)이 얻어진다. 여기서, 주변 음장 성분이 낮은 차수를 갖는 HOA에 의해 충분한 정확도로 표현될 수 있다는 가정이 이용된다. 제2 서브 단계 또는 스테이지(26)는 특허 출원 EP 10306472.1에 기술된 압축에 기초한다. 서브 단계/스테이지(25)에서 계산된, 주변 음장 성분의 개의 HOA 신호들 CA,RED(l)은 구면 조화 함수 변환을 적용하는 것에 의해 공간 영역에서의 ORED개의 등가 신호들 WA,RED(l)로 변환되고, 그 결과 병렬 인지 코덱들(27)의 뱅크에 입력될 수 있는 종래의 시간 영역 신호들이 얻어진다. 임의의 공지된 인지 코딩 또는 압축 기법이 적용될 수 있다. 인코딩된 방향 신호들 및 차수 감소된 인코딩된 공간 영역 신호들 이 출력되고 전송 또는 저장될 수 있다.
유리하게도, 어쩌면 남아 있는 채널간 상관들을 이용함으로써 전체적인 코딩 효율을 향상시키기 위해 시간 영역 신호들 X(l) 및 WA,RED(l) 모두의 인지 압축이 인지 코더(27)에서 결합하여(jointly) 수행될 수 있다.
압축 해제
수신된 또는 재생된 신호에 대한 압축 해제 처리는 도 3에 도시되어 있다. 압축 처리와 같이, 이는 2개의 연속적인 단계들을 포함한다.
도 3a에 도시된 제1 단계 또는 스테이지에서, 인지 디코딩(31)에서, 인코딩된 방향 신호들 및 차수 감소된 인코딩된 공간 영역 신호들 의 인지 디코딩 또는 압축 해제가 수행되고, 여기서 는 성분을 나타내고, 는 주변 HOA 성분을 나타낸다. 인지 디코딩된 또는 압축 해제된 공간 영역 신호들 는 역 구면 조화 함수 변환기(inverse spherical harmonic transformer)(32)에서 역 구면 조화 함수 변환(inverse Spherical Harmonics transform)을 통해 차수 NRED의 HOA 영역 표현 로 변환된다. 그 후에, 차수 확장 단계 또는 스테이지(33)에서, 차수 N의 적절한 HOA 표현 는 차수 확장에 의해 로부터 추정된다.
도 3b에 도시된 제2 단계 또는 스테이지에서, 총 HOA 표현 은 HOA 신호 어셈블러(HOA signal assembler)(34)에서 방향 신호들 및 대응하는 방향 정보 은 물론 원래 차수의 주변 HOA 성분 로부터 재합성된다.
달성가능한 데이터
레이트
감소
본 발명에 의해 해결되는 문제점은 HOA 표현들에 대한 기존의 압축 방법들과 비교하여 데이터 레이트의 상당한 감소이다. 이하에서, 비압축된 HOA 표현과 비교하여 달성가능한 압축률(compression rate)이 논의된다. 차수 N의 비압축된 HOA 신호 C(l)의 전송을 위해 필요한 데이터 레이트와 대응하는 방향들 을 갖는 D개의 인지 코딩된 방향 신호들 X(l) 및 주변 HOA 성분을 나타내는 NRED개의 인지 코딩된 공간 영역 신호들 WA,RES(l)로 이루어져 있는 압축된 신호 표현의 전송을 위해 필요한 데이터 레이트의 비교로부터 압축률이 얻어진다.
비압축된 HOA 신호 C(l)의 전송을 위해, 의 데이터 레이트가 필요하다. 이와 달리, D개의 인지 코딩된 방향 신호들 X(l)의 전송은 의 데이터 레이트를 필요로 하고, 여기서 는 인지 코딩된 신호들의 비트 레이트를 나타낸다. 이와 유사하게, NRED개의 인지 코딩된 공간 영역 신호들 WA,RES(l) 신호들의 전송은 의 비트 레이트를 필요로 한다.
방향들 은 샘플링 레이트 fs와 비교하여 훨씬 더 낮은 레이트에 기초하여 계산되는 것으로 가정된다, 즉 방향들이 B개의 샘플들(예컨대, fs = 48kHz의 샘플링 레이트에 대해 B = 1200)로 이루어져 있는 신호 프레임의 지속 기간 동안 고정되고, 압축된 HOA 신호의 총 데이터 레이트의 계산에서 대응하는 데이터 레이트 할당량이 무시될 수 있는 것으로 가정된다.
이다.
예를 들어, 샘플링 레이트 fs = 48kHz 및 Nb = 16 비트/샘플(bits per sample)을 이용하는 차수 N = 4의 HOA 표현을 감소된 HOA 차수 NRED= 2 및 64 킬로비트/초()의 비트 레이트를 사용하는 D = 3개의 우세 방향들을 갖는 표현으로 압축한 결과, 의 압축률이 얻어질 것이다. 압축된 표현의 전송은 약 768 킬로비트/초의 데이터 레이트를 필요로 한다.
코딩 잡음
언마스킹(coding noise unmasking)의
발생 확률의 감소
배경 기술 섹션에서 설명된 바와 같이, 특허 출원 EP 10306472.1에 기술된 공간 영역 신호들의 인지 압축은 신호들 간의 교차 상관들이 남아 있게 되고, 이는 인지 코딩 잡음의 언마스킹을 가져올 수 있다. 본 발명에 따르면, 인지 코딩되기 전에 우세 방향 신호들이 먼저 HOA 음장 표현으로부터 추출된다. 이것은, HOA 표현을 합성할 때, 인지 디코딩 후에, 코딩 잡음이 방향 신호들과 정확히 동일한 공간 방향성(spatial directivity)을 가진다는 것을 의미한다. 상세하게는, 임의의 방향에 대한 코딩 잡음의 기여는 물론 방향 신호의 기여가 유한 차수를 갖는 공간 분해능 섹션에서 설명된 공간 분산 함수에 의해 결정론적으로 기술된다. 환언하면, 임의의 순간에, 코딩 잡음을 표현하는 HOA 계수 벡터는 방향 신호를 표현하는 HOA 계수 벡터의 정확히 배수이다. 이와 같이, 잡음이 있는 HOA 계수들의 임의의 가중합이 인지 코딩 잡음의 어떤 언마스킹도 가져오지 않을 것이다.
게다가, 감소된 차수의 주변 성분이 EP 10306472.1에서 제안된 것과 똑같이 처리되지만, 정의에 따라, 주변 성분의 공간 영역 신호들이 서로 간에 꽤 낮은 상관을 가지기 때문에, 인지 잡음 언마스킹의 확률이 낮다.
개선된 방향 추정
본 발명의 방향 추정은 에너지적으로 우세한 HOA 성분의 방향 전력 분포에 의존한다. 방향 전력 분포는 HOA 표현의 상관 행렬(correlation matrix)의 고유값 분해(eigenvalue decomposition)에 의해 획득되는, HOA 표현의 랭크 감소된 상관 행렬(rank-reduced correlation matrix)로부터 계산된다.
앞서 언급한 "Plane-wave decomposition ..." 논문에서 사용된 방향 추정과 비교하여, 이는 더 정확하다는 장점을 제공하는데, 그 이유는 방향 추정을 위해 완전한 HOA 표현을 사용하는 대신에 에너지적으로 우세한 HOA 성분에 집중하는 것이 방향 전력 분포의 공간 블러링(spatial blurring)을 감소시키기 때문이다.
앞서 언급한 "The Application of Compressive Sampling to the Analysis and Synthesis of Spatial Sound Fields" 및 "Time Domain Reconstruction of Spatial Sound Fields Using Com- pressed Sensing" 논문들에서 제안된 방향 추정과 비교하여, 이는 더 강건하다는 장점을 제공한다. 그 이유는 HOA 표현을 방향 성분 및 주변 성분으로 분해하는 것이 좀처럼 완벽하게 달성될 수 없고, 따라서 방향 성분에 소량의 주변 성분이 남아 있기 때문이다. 이어서, 이 2개의 논문들에서와 같은 압축 샘플링 방법은 주변 신호들의 존재에 대한 그들의 높은 감도로 인해 타당한 방향 추정치들을 제공하지 못한다.
유리하게도, 본 발명의 방향 추정은 이 문제를 겪지 않는다.
HOA
표현 분해의 대안의 응용들
HOA 표현의 관련 방향 정보를 갖는 다수의 방향 신호들 및 HOA 영역에서의 주변 성분으로의 기술된 분해가 앞서 언급한 Pulkki 논문 "Spatial Sound Reproduction with Directional Audio Coding"에 제안된 것에 따른 HOA 표현의 신호 적응적 DirAC 유사 렌더링(signal-adaptive DirAC-like rendering)을 위해 사용될 수 있다.
각각의 HOA 성분이 상이하게 렌더링될 수 있는데, 그 이유는 2개의 성분들의 물리적 특성들이 상이하기 때문이다. 예를 들어, 방향 신호들이 VBAP(Vector Based Amplitude Panning)와 같은 신호 패닝(signal panning) 기법들을 사용하여 스피커들로 렌더링될 수 있다(V. Pulkki, "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", Journal of Audio Eng. Society, vol.45, no.6, pp.456- 466, 1997을 참조). 주변 HOA 성분이 기지의 표준 HOA 렌더링 기법들을 사용하여 렌더링될 수 있다.
이러한 렌더링은 차수 '1'의 앰비소닉스 표현으로 제한되지 않고, 따라서 차수 N > 1의 HOA 표현들로의 DirAC 유사 렌더링의 확장으로 보일 수 있다.
HOA 신호 표현으로부터의 몇개의 방향들의 추정은 임의의 관련 종류의 음장 분석을 위해 사용될 수 있다.
이하의 섹션들은 신호 처리 단계들을 더 상세히 기술한다.
압축
입력 형식의 정의
프레이밍(
framing
)
스케일링된 HOA 계수들의 들어오는 벡터들 c(j)가 프레이밍 단계 또는 스테이지(21)에서
에 따라 길이 B의 비중복 프레임들로 프레이밍된다.
fs = 48kHz의 샘플링 레이트를 가정하면, 적절한 프레임 길이는 25ms의 프레임 지속기간에 대응하는 B = 1200 샘플이다.
우세 방향들의 추정
우세 방향들의 추정을 위해, 이하의 상관 행렬
이 계산된다. 현재 프레임(l) 및 L-1개의 이전 프레임들에 걸친 합산은 방향 분석이 개의 샘플들을 갖는 긴 중복하는 프레임들의 그룹들에 기초하고 있다(즉, 각각의 현재 프레임에 대해, 인접 프레임들의 내용이 고려됨)는 것을 나타낸다. 이것은 다음과 같은 2가지 이유로 방향 분석의 안정성에 기여한다: 보다 긴 프레임들로 인해 더 많은 수의 관찰들이 있게 된다는 것, 및 방향 추정치들이 중복하는 프레임들로 인해 평활화된다는 것.
fs = 48kHz이고 B = 1200인 것으로 가정하면, L에 대한 타당한 값은 100ms의 전체 프레임 지속기간에 대응하는 4이다.
그 다음에, 상관 행렬 B(l)의 고유값 분해가
이기 때문이다.
고유값들이 비오름 차순으로(in a non-ascending order), 즉
와 같이 인덱싱되는 것으로 가정된다.
DARMIN에 대한 타당한 선택은 15dB이다. D개 이하의 우세 방향들에 집중하기 위해 우세 고유값들의 수가 D 이하이도록 추가적으로 제약된다. 이것은 인덱스 집합 을 으로 대체하는 것에 의해 달성되고, 여기서
이다.
에 의해 획득되고, 여기서
이다.
이 행렬은 B(l)에 대한 우세 방향 성분들의 기여들을 포함해야만 한다.
그 후에, 벡터
가 계산되고, 여기서 는 많은 수의 거의 균일하게 분포된 테스트 방향들 에 대한 모드 행렬을 나타내고, 는 극축 z로부터 측정된 경사각 를 나타내며, 는 x=y 평면에서 x 축으로부터 측정된 방위각을 나타낸다.
에 의해 정의되고, 여기서
의 개의 요소들은 방향들 로부터 충돌하는 우세 방향 신호들에 대응하는 평면파들의 전력들의 근사치들이다. 그에 대한 이론적 설명은 이하의 섹션, 방향 탐색 알고리즘의 설명에서 제공된다.
로부터, 방향 신호 성분들의 결정을 위해, 다수의(개의) 우세 방향들 이 계산된다. 우세 방향들의 수는 그로써 일정한 데이터 레이트를 보장하기 위해 를 충족시키도록 제약된다. 그렇지만, 가변적인 데이터 레이트가 허용되는 경우, 우세 방향들의 수가 현재의 음향 장면(sound scene)에 맞춰 조정될 수 있다.
개의 우세 방향들을 계산하는 하나의 가능한 방법은 제1 우세 방향을 최대 전력을 갖는 것으로 설정하는 것 - 즉, 이고 여기서 이고 임 - 이다. 전력 최대치가 우세 방향 신호에 의해 생성되는 것으로 가정하고, 유한 차수 N의 HOA 표현을 이용하는 결과, 방향 신호들의 공간 분산이 생긴다는 사실을 고려하면(앞서 언급한 "Plane-wave decomposition ..." 논문을 참조), 의 방향 이웃(directional neighbourhood)에, 동일한 방향 신호에 속하는 전력 성분들이 있어야 하는 것으로 결론내릴 수 있다. 공간 신호 분산이 함수 (수학식 38 참조)에 의해 표현될 수 있기 때문에 - 여기서 은 와 사이의 각도를 나타냄 -, 방향 신호에 속하는 전력이 에 따라 감소된다. 따라서, 추가적인 우세 방향들의 탐색을 위해 인 의 방향 이웃에서의 모든 방향들 를 배제하는 것이 타당하다. 거리 은 N≥4에 대해 대략 에 의해 주어지는 의 첫번째 영으로서 선택될 수 있다. 제2 우세 방향은 이어서 인 나머지 방향들 에서 최대 전력을 갖는 것으로 설정된다. 나머지 우세 방향들은 유사한 방식으로 결정된다.
우세 방향들의 수 은 개별적인 우세 방향들 에 할당된 전력들 을 고려하고 비 이 원하는 직접 대 주변 전력 비(direct to ambient power ratio) 의 값을 초과하는 경우를 탐색하는 것에 의해 결정될 수 있다. 이것은 이
를 충족시킨다는 것을 의미한다. 모든 우세 방향들의 계산을 위한 전체적인 처리는 다음과 같이 수행될 수 있다:
이 최소화되도록 결정된다. 이러한 할당 문제는 공지된 Hungarian 알고리즘을 사용하여 해결될 수 있다(H.W. Kuhn, "The Hungarian method for the assignment problem", Naval research logistics quarterly 2, no.1-2, pp.83-97, 1955를 참조). 현재의 방향들 과 이전 프레임으로부터의 비활성 방향들(inactive directions)(용어 '비활성 방향'의 설명에 대해서는 이하를 참조) 간의 각도들이 으로 설정된다. 이 동작은 이전의 활성 방향들 에 보다 더 가까운 현재의 방향들 이 그들에 할당되도록 시도되는 효과를 가진다. 거리가 을 초과하는 경우, 대응하는 현재의 방향이 새로운 신호에 속하는 것으로 가정되고, 이는 그가 이전의 비활성 방향 에 할당되는 것이 바람직하다는 것을 의미한다.
참조: 전체적인 압축 알고리즘의 더 큰 지연 시간을 허용할 때, 연속적인 방향 추정치들의 할당이 더 강건하게 수행될 수 있다. 예를 들어, 급격한 방향 변화들이 이들을 추정 오류들로부터 얻어진 이상치들과 혼동하는 일 없이 더 잘 식별될 수 있다.
(b) 평활화된 방향들 가 단계 (a)로부터의 할당을 사용하여 계산된다. 평활화는 유클리드 기하학보다는 구면 기하학에 기초하고 있다. 현재의 우세 방향들 각각에 대해, 평활화는 방향들 및 에 의해 명시되는 구면 상의 2개의 점들과 교차하는 대원(great circle)의 단호(minor arc)를 따라 수행된다. 명백히, 평활화 인자 로 지수 가중 이동 평균(exponentially-weighted moving average)을 계산하는 것에 의해 방위각 및 경사각이 독립적으로 평활화된다. 경사각에 대해, 이 결과, 다음과 같은 평활화 동작이 얻어진다:
방위각에 대해, 으로부터 으로의 천이 및 그 반대 방향으로의 천이 시에 정확한 평활화를 달성하기 위해 평활화가 수정되어야만 한다. 이것은 먼저 차이 각도 모듈로 2π(difference angle modulo 2π)를
로서 계산하고, 이것이
평활화된 우세 방위각 모듈로 2π는
로서 결정되고,
최종적으로
에 의해 구간 [-π, π[ 내에 있도록 변환된다.
로 나타내어진다.
각자의 방향들이 바로 앞의 프레임으로부터 복사된다. 즉,
이어서, 모든 평활화된 방향들이
과 같이 단일의 방향 행렬로 연접된다.
방향 신호들의 계산
방향 신호들의 계산은 모드 정합(mode matching)에 기초한다. 상세하게는, 주어진 HOA 신호의 최상의 근사화를 가져오는 HOA 표현을 갖는 그 방향 신호들이 있는지 탐색이 행해진다. 연속적인 프레임들 간의 방향들의 변화가 방향 신호들의 불연속성을 야기할 수 있기 때문에, 중복하는 프레임들에 대한 방향 신호들의 추정치들이 계산될 수 있고, 뒤이어서 적절한 윈도우 함수(window function)를 사용하여 연속적인 중복하는 프레임들의 결과들을 평활화한다. 그렇지만, 평활화는 단일의 프레임의 지연 시간을 유입시킨다.
방향 신호들의 상세한 추정은 이하에서 설명된다:
먼저, 평활화된 활성 방향들에 기초한 모드 행렬은
에 따라 계산되고,
여기서
이고,
여기서
이다.
이것은 2개의 단계들에서 달성된다. 첫번째 단계에서, 비활성 방향들에 대응하는 행들 내의 방향 신호 샘플들은 0으로 설정된다. 즉,
이다.
두번째 단계에서, 활성 방향들에 대응하는 방향 신호 샘플들은 먼저 이들을
에 따라 행렬로 배열하는 것에 의해 획득된다.
이 행렬은 이어서 오차
의 유클리드 노름(Euclidean norm)을 최소화하도록 계산된다. 해(solution)는
에 의해 주어진다.
윈도우 함수에 대한 한 예는
에 의해 정의되는 주기적 해밍 윈도우(periodic Hamming window)에 의해 주어지고,
에 따라 윈도잉된 비평활화된 추정치들(windowed non-smoothed estimates)의 적절한 중첩에 의해 계산된다.
와 같이 행렬 X(l-1)로 배열되고,
여기서
이다.
주변
HOA
성분의 계산
주변 HOA 성분 CA(l-1)은
에 따라 총 방향 HOA 성분 CDIR(l-1)을 총 HOA 표현 C(l-1)로부터 차감하는 것에 의해 얻어진다.
에 의해 결정되고,
에 의해 정의되는 모든 평활화된 방향들에 기초한 모드 행렬을 나타낸다.
총 방향 HOA 성분의 계산이 또한 중복하는 연속적인 순간 총 방향 HOA 성분들의 공간 평활화에 기초하기 때문에, 주변 HOA 성분이 또한 단일 프레임의 지연 시간으로 획득된다.
주변
HOA
성분에 대한 차수 감소
CA(l-1)을
주변
HOA
성분에 대한 구면 조화 함수 변환
구면 조화 함수 변환은 감소된 차수의 주변 HOA 성분 CA,RED(l)과 모드 행렬
의 역을 곱하는 것에 의해 수행되고,
여기서
에 기초한다.
압축 해제
역 구면 조화 함수 변환
차수 확장
에 따라 0을 후치 첨부(appending)하는 것에 의해 N으로 확장되고,
HOA
계수 합성
최종적인 압축 해제된 HOA 계수들이
에 따라 방향 및 주변 HOA 성분으로 가법적으로 구성되어 있다.
이 스테이지에서, 또다시, 방향 HOA 성분이 공간 평활화에 기초하여 계산될 수 있게 하기 위해 단일 프레임의 지연 시간이 유입된다. 이렇게 하는 것에 의해, 연속적인 프레임들 사이의 방향들의 변화들로 인해 생기는 음장의 방향 성분에서의 잠재적인 원하지 않는 불연속들이 회피된다.
평활화된 방향 HOA 성분을 계산하기 위해, 모든 개별적인 방향 신호들의 추정치들을 포함하는 2개의 연속적인 프레임들이
와 같이 하나의 긴 프레임으로 연접된다.
에 의해 그의 성분들을 통해 표현할 때,
윈도잉 동작은
마지막으로, 총 방향 HOA 성분 CDIR(l-1)은 모든 윈도잉된 방향 신호 발췌본들을 적절한 방향들로 인코딩하고 이들을 중복된 방식으로 중첩시키는 것에 의해 획득된다:
방향 탐색 알고리즘의 설명
이하에서, 우세 방향들의 추정 섹션에 기술된 방향 탐색 처리의 동기가 설명된다. 이는 먼저 정의되는 어떤 가정들에 기초한다.
가정들
일반적으로
를 통해 시간 영역 진폭 밀도 함수 d(j, Ω)에 관계되어 있는 HOA 계수 벡터 c(j)는 이하의 모델:
을 따르는 것으로 가정된다.
이 모델은 HOA 계수 벡터 c(j)가, 한편으로는, 제l 프레임에서의 방향들 로부터 도착하는 I개의 우세 방향 소스 신호들 에 의해 생성된다. 상세하게는, 방향들이 단일 프레임의 지속기간 동안 고정되어 있는 것으로 가정된다. 우세 소스 신호들의 수(I)는 HOA 계수들의 총수 0보다 명확히 더 작은 것으로 가정된다. 게다가, 프레임 길이(B)는 명확히 0보다 더 큰 것으로 가정된다. 다른 한편으로는, 벡터 c(j)는 이상적으로 등방성인 주변 음장(ideally isotropic ambient sound field)을 나타내는 것으로 간주될 수 있는 잔차 성분 c A(j)로 이루어져 있다.
개별적인 HOA 계수 벡터 성분들은 다음과 같은 특성들을 갖는 것으로 가정된다:
)으로 가정되고,
서로 비상관인 것(즉,
)으로 가정되며,
)으로 가정된다.
를 가지는 것으로 가정된다.
에 의해 정의되는 각각의 프레임(l)의 직접 대 주변 전력 비 DAR(l)가 사전 정의된 원하는 값 DARMIN보다 큰 것(즉,
)으로 가정된다.
방향 탐색의 설명
설명을 위해, 상관 행렬 B(l)(수학식 67 참조)이 L-1개의 이전 프레임들의 샘플들을 고려함이 없이 제l 프레임의 샘플들에 기초해서만 계산되는 경우가 고려된다. 이 동작은 L = 1로 설정하는 것에 대응한다. 그 결과, 상관 행렬이
로 표현될 수 있다.
수학식 120에서의 모델 가정을 수학식 128에 대입하는 것 그리고 수학식 122 및 수학식 123과 수학식 124에서의 정의를 사용하는 것에 의해, 상관 행렬 B(l)이 다음과 같이 근사화될 수 있다:
수학식 131로부터, B(l)이 대략적으로 방향 HOA 성분에 그리고 주변 HOA 성분에 기인할 수 있는 2개의 가법적 성분들로 이루어져 있다는 것을 알 수 있다. 그의 -랭크 근사치 은 방향 HOA 성분의 근사치를 제공하고, 즉,
이고, 이는 방향 대 주변 전력 비에 관한 수학식 126으로부터 당연하다.
그렇지만, 강조할 점은, 이 일반적으로 최대 랭크(full rank)를 가지고 따라서 행렬들 및 의 열들이 걸쳐 있는 서브 공간들이 서로 직교(orthogonal)가 아니기 때문에, 의 어떤 부분이 불가피하게도 로 누설된다는 것이다. 수학식 132에 의해, 우세 방향들의 탐색을 위해 사용되는 수학식 77에서의 벡터 은
에 의해 표현될 수 있다.
수학식 135에서, 수학식 47에 나타낸 구면 조화 함수의 다음과 같은 특성이 사용되었다:
Claims (9)
- 고차 앰비소닉스(Higher Order Ambisonics)(HOA) 신호 표현(C(l))을 압축하는 방법으로서,
- 우세 방향들을 추정하는 단계(22) - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- 상기 HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들(X(l)) 및 관련 방향 정보 , 그리고 HOA 영역에서의 잔차 주변 성분(CA(l))으로 분해 또는 디코딩하는 단계(23, 24) - 상기 잔차 주변 성분은 상기 HOA 신호 표현(C(l))과 상기 우세 방향 신호들(X(l))의 표현(CDIR(l)) 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하는 단계(25);
- 감소된 차수의 상기 잔차 주변 HOA 성분(CA,RED(l))을 공간 영역으로 변환하는 단계(26); 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩(perceptually encoding)하는 단계(27)
를 포함하는, 방법. - - 우세 방향들을 추정하는 단계(22) - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- 상기 HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들(X(l)) 및 관련 방향 정보 , 그리고 HOA 영역에서의 잔차 주변 성분(CA(l))으로 분해 또는 디코딩하는 단계(23, 24) - 상기 잔차 주변 성분은 상기 HOA 신호 표현(C(l))과 상기 우세 방향 신호들(X(l))의 표현(CDIR(l)) 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하는 단계(25);
- 감소된 차수의 상기 잔차 주변 HOA 성분(CA,RED(l))을 공간 영역으로 변환하는 단계(26); 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩하는 단계(27)에 의해 압축된 고차 앰비소닉스(HOA) 신호 표현(C(l))을 압축 해제하는 방법으로서,
- 상기 인지 인코딩된 우세 방향 신호들 및 상기 인지 인코딩된 변환된 잔차 주변 HOA 성분 을 인지 디코딩(perceptually decoding)하는 단계(31);
- HOA 영역 표현 을 얻기 위해 상기 인지 디코딩된 변환된 잔차 주변 HOA 성분 을 역변환하는 단계(32);
- 원래 차수의 주변 HOA 성분 을 설정하기 위해 상기 역변환된 잔차 주변 HOA 성분의 차수 확장을 수행하는 단계(33); 및
- HOA 신호 표현 을 얻기 위해 상기 인지 디코딩된 우세 방향 신호들 , 상기 방향 정보 및 상기 원래 차수의 확장된 주변 HOA 성분 을 합성하는 단계(34)
를 포함하는, 방법. - 고차 앰비소닉스(HOA) 신호 표현(C(l))을 압축하는 장치로서,
- 우세 방향들을 추정하도록 구성된 수단(22) - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- 상기 HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들(X(l)) 및 관련 방향 정보 , 그리고 HOA 영역에서의 잔차 주변 성분(CA(l))로 분해 또는 디코딩하도록 구성된 수단(23, 24) - 상기 잔차 주변 성분은 상기 HOA 신호 표현(C(l))과 상기 우세 방향 신호들(X(l))의 표현(CDIR(l)) 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하도록 구성된 수단(25);
- 감소된 차수의 상기 잔차 주변 HOA 성분(CA,RED(l))을 공간 영역으로 변환하도록 구성된 수단(26); 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩하도록 구성된 수단(27)
을 포함하는, 장치. - - 우세 방향들을 추정하는 단계(22) - 상기 우세 방향 추정은 에너지적으로 우세한 HOA 성분들의 방향 전력 분포에 의존함 -;
- 상기 HOA 신호 표현을 시간 영역에서의 다수의 우세 방향 신호들(X(l)) 및 관련 방향 정보 , 그리고 HOA 영역에서의 잔차 주변 성분(CA(l))으로 분해 또는 디코딩하는 단계(23, 24) - 상기 잔차 주변 성분은 상기 HOA 신호 표현(C(l))과 상기 우세 방향 신호들(X(l))의 표현(CDIR(l)) 사이의 차이를 나타냄 -;
- 상기 잔차 주변 성분을 그의 원래의 차수에 비해 그의 차수를 감소시키는 것에 의해 압축하는 단계(25);
- 감소된 차수의 상기 잔차 주변 HOA 성분(CA,RED(l))을 공간 영역으로 변환하는 단계(26); 및
- 상기 우세 방향 신호들 및 상기 변환된 잔차 주변 HOA 성분을 인지 인코딩하는 단계(27)에 의해 압축된 고차 앰비소닉스(HOA) 신호 표현(C(l))을 압축 해제하는 장치로서,
- 상기 인지 인코딩된 우세 방향 신호들 및 상기 인지 인코딩된 변환된 잔차 주변 HOA 성분 을 인지 디코딩하도록 구성된 수단(31);
- HOA 영역 표현 을 얻기 위해 상기 인지 디코딩된 변환된 잔차 주변 HOA 성분 을 역변환하도록 구성된 수단(32);
- 원래 차수의 주변 HOA 성분 을 설정하기 위해 상기 역변환된 잔차 주변 HOA 성분의 차수 확장을 수행하도록 구성된 수단(33); 및
- HOA 신호 표현 을 얻기 위해 상기 인지 디코딩된 우세 방향 신호들 , 상기 방향 정보 및 상기 원래 차수의 확장된 주변 HOA 성분 을 합성하도록 구성된 수단(34)
을 포함하는, 장치. - 제1항의 방법 또는 제3항의 장치에 있어서,
HOA 계수들의 들어오는 벡터들(c(j))은 비중복 프레임들(C(l))로 프레이밍되고, 프레임 지속기간은 25ms일 수 있는, 방법 또는 장치. - 제1항 또는 제5항의 방법, 또는 제3항 또는 제5항의 장치에 있어서,
상기 우세 방향 추정(22)은, 각각의 현재 프레임에 대해 인접한 프레임들의 내용이 고려되도록, 긴 중복하는 프레임들의 그룹들에 의존하는, 방법 또는 장치. - 제1항, 제5항 및 제6항 중 어느 한 항의 방법, 또는 제3항, 제5항 및 제6항 중 어느 한 항의 장치에 있어서,
상기 우세 방향 신호들(X(l)) 및 상기 변환된 주변 HOA 성분(WA , RED(l))은 결합되어 인지 압축(jointly perceptually compressed)되는(27), 방법 또는 장치. - 제1항, 제5항 내지 제7항 중 어느 한 항의 방법, 또는 제3항, 제5항 내지 제7항 중 어느 한 항의 장치에 있어서,
상기 HOA 신호 표현을 관련 방향 정보를 갖는 시간 영역에서의 다수의 우세 방향 신호들 그리고 HOA 영역에서의 잔차 주변 성분으로 상기 분해하는 것은 상기 HOA 표현의 신호 적응적 DirAC 유사 렌더링(signal-adaptive DirAC-like rendering)을 위해 사용되고, DirAC은 Pulkki에 따른 방향 오디오 코딩(Directional Audio Coding)을 의미하는, 방법 또는 장치. - 제1항 및 제5항 내지 제8항 중 어느 한 항의 방법에 따라 압축되는 HOA 신호.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12305537.8A EP2665208A1 (en) | 2012-05-14 | 2012-05-14 | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP12305537.8 | 2012-05-14 | ||
PCT/EP2013/059363 WO2013171083A1 (en) | 2012-05-14 | 2013-05-06 | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207016239A Division KR102231498B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150010727A true KR20150010727A (ko) | 2015-01-28 |
KR102121939B1 KR102121939B1 (ko) | 2020-06-11 |
Family
ID=48430722
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217008100A KR102427245B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020147031645A KR102121939B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020237013799A KR102651455B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020227026008A KR102526449B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020247009545A KR20240045340A (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020207016239A KR102231498B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217008100A KR102427245B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237013799A KR102651455B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020227026008A KR102526449B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020247009545A KR20240045340A (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
KR1020207016239A KR102231498B1 (ko) | 2012-05-14 | 2013-05-06 | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 |
Country Status (10)
Country | Link |
---|---|
US (6) | US9454971B2 (ko) |
EP (5) | EP2665208A1 (ko) |
JP (6) | JP6211069B2 (ko) |
KR (6) | KR102427245B1 (ko) |
CN (10) | CN107017002B (ko) |
AU (5) | AU2013261933B2 (ko) |
BR (1) | BR112014028439B1 (ko) |
HK (1) | HK1208569A1 (ko) |
TW (6) | TWI600005B (ko) |
WO (1) | WO2013171083A1 (ko) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2738962A1 (en) | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2765791A1 (en) | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9763019B2 (en) | 2013-05-29 | 2017-09-12 | Qualcomm Incorporated | Analysis of decomposed representations of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
EP2879408A1 (en) * | 2013-11-28 | 2015-06-03 | Thomson Licensing | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
CN105981100B (zh) * | 2014-01-08 | 2020-02-28 | 杜比国际公司 | 用于改善对声场的高阶高保真度立体声响复制表示进行编码所需的边信息的编码的方法和装置 |
US9489955B2 (en) * | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
KR102144976B1 (ko) * | 2014-03-21 | 2020-08-14 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
US10412522B2 (en) | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN109410962B (zh) * | 2014-03-21 | 2023-06-06 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
CN117153172A (zh) * | 2014-03-24 | 2023-12-01 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
WO2015145782A1 (en) | 2014-03-26 | 2015-10-01 | Panasonic Corporation | Apparatus and method for surround audio signal processing |
US10134403B2 (en) * | 2014-05-16 | 2018-11-20 | Qualcomm Incorporated | Crossfading between higher order ambisonic signals |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) * | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
KR20230162157A (ko) * | 2014-06-27 | 2023-11-28 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 데이터 프레임들 중 특정 데이터 프레임들의 채널 신호들과 연관된 비차분 이득 값들을 포함하는 코딩된 hoa 데이터 프레임 표현 |
US9792924B2 (en) | 2014-06-27 | 2017-10-17 | Dolby Laboratories Licensing Corporation | Apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
KR102655047B1 (ko) | 2014-06-27 | 2024-04-08 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법 |
EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
US9838819B2 (en) | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
WO2016001355A1 (en) | 2014-07-02 | 2016-01-07 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation |
EP2963949A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
JP2017523452A (ja) * | 2014-07-02 | 2017-08-17 | ドルビー・インターナショナル・アーベー | Hoa信号表現のサブバンド内の優勢な方向性信号の方向のエンコード/デコードのための方法および装置 |
EP3164868A1 (en) * | 2014-07-02 | 2017-05-10 | Dolby International AB | Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation |
US9883314B2 (en) | 2014-07-03 | 2018-01-30 | Dolby Laboratories Licensing Corporation | Auxiliary augmentation of soundfields |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
EP3007167A1 (en) * | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
EP3073488A1 (en) | 2015-03-24 | 2016-09-28 | Thomson Licensing | Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field |
EP3739578A1 (en) | 2015-07-30 | 2020-11-18 | Dolby International AB | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
US12087311B2 (en) | 2015-07-30 | 2024-09-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding an HOA representation |
US10257632B2 (en) | 2015-08-31 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Method for frame-wise combined decoding and rendering of a compressed HOA signal and apparatus for frame-wise combined decoding and rendering of a compressed HOA signal |
WO2017060411A1 (en) | 2015-10-08 | 2017-04-13 | Dolby International Ab | Layered coding for compressed sound or sound field representations |
US9959880B2 (en) * | 2015-10-14 | 2018-05-01 | Qualcomm Incorporated | Coding higher-order ambisonic coefficients during multiple transitions |
BR122020025280B1 (pt) * | 2015-11-17 | 2024-03-05 | Dolby International Ab | Método para decodificar e reproduzir um fluxo de áudio para um ouvinte usando alto-falantes |
US20180338212A1 (en) * | 2017-05-18 | 2018-11-22 | Qualcomm Incorporated | Layered intermediate compression for higher order ambisonic audio data |
US10595146B2 (en) * | 2017-12-21 | 2020-03-17 | Verizon Patent And Licensing Inc. | Methods and systems for extracting location-diffused ambient sound from a real-world scene |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
JP6652990B2 (ja) * | 2018-07-20 | 2020-02-26 | パナソニック株式会社 | サラウンドオーディオ信号処理のための装置及び方法 |
CN110211038A (zh) * | 2019-04-29 | 2019-09-06 | 南京航空航天大学 | 基于dirac残差深度神经网络的超分辨率重建方法 |
CN113449255B (zh) * | 2021-06-15 | 2022-11-11 | 电子科技大学 | 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质 |
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CN115096428B (zh) * | 2022-06-21 | 2023-01-24 | 天津大学 | 一种声场重建方法、装置、计算机设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009046223A2 (en) * | 2007-10-03 | 2009-04-09 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100206333B1 (ko) * | 1996-10-08 | 1999-07-01 | 윤종용 | 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법 |
CA2288213A1 (en) * | 1997-05-19 | 1998-11-26 | Aris Technologies, Inc. | Apparatus and method for embedding and extracting information in analog signals using distributed signal features |
FR2779951B1 (fr) | 1998-06-19 | 2004-05-21 | Oreal | Composition tinctoriale contenant une pyrazolo-[1,5-a]- pyrimidine a titre de base d'oxydation et un coupleur naphtalenique, et procedes de teinture |
US7231054B1 (en) * | 1999-09-24 | 2007-06-12 | Creative Technology Ltd | Method and apparatus for three-dimensional audio display |
US6763623B2 (en) * | 2002-08-07 | 2004-07-20 | Grafoplast S.P.A. | Printed rigid multiple tags, printable with a thermal transfer printer for marking of electrotechnical and electronic elements |
KR20050075510A (ko) * | 2004-01-15 | 2005-07-21 | 삼성전자주식회사 | 통신 단말기를 위한 3차원 입체음향의 재생/저장 장치 및방법 |
DE602005009934D1 (de) * | 2004-03-11 | 2008-11-06 | Pss Belgium Nv | Verfahren und system zum verarbeiten von tonsignalen |
CN1677490A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
ATE527833T1 (de) * | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
US8712061B2 (en) * | 2006-05-17 | 2014-04-29 | Creative Technology Ltd | Phase-amplitude 3-D stereo encoder and decoder |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
DE102006047197B3 (de) * | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
US7558685B2 (en) * | 2006-11-29 | 2009-07-07 | Samplify Systems, Inc. | Frequency resolution using compression |
KR100913092B1 (ko) * | 2006-12-01 | 2009-08-21 | 엘지전자 주식회사 | 믹스신호의 인터페이스 표시 방법 및 장치 |
CN101206860A (zh) * | 2006-12-20 | 2008-06-25 | 华为技术有限公司 | 一种可分层音频编解码方法及装置 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US20090043577A1 (en) * | 2007-08-10 | 2009-02-12 | Ditech Networks, Inc. | Signal presence detection using bi-directional communication data |
CN101939782B (zh) * | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
WO2009046460A2 (en) * | 2007-10-04 | 2009-04-09 | Creative Technology Ltd | Phase-amplitude 3-d stereo encoder and decoder |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
EP2232489B1 (fr) * | 2007-12-21 | 2018-02-07 | Orange | Codage/decodage par transformee, a fenetres adaptatives |
CN101202043B (zh) * | 2007-12-28 | 2011-06-15 | 清华大学 | 音频信号的编码方法和装置与解码方法和装置 |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
RU2469497C2 (ru) * | 2008-02-14 | 2012-12-10 | Долби Лэборетериз Лайсенсинг Корпорейшн | Стереофоническое расширение |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
US8611554B2 (en) * | 2008-04-22 | 2013-12-17 | Bose Corporation | Hearing assistance apparatus |
RU2492530C2 (ru) * | 2008-07-11 | 2013-09-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2154677B1 (en) * | 2008-08-13 | 2013-07-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a converted spatial audio signal |
EP2374123B1 (fr) * | 2008-12-15 | 2019-04-10 | Orange | Codage perfectionne de signaux audionumeriques multicanaux |
US8817991B2 (en) * | 2008-12-15 | 2014-08-26 | Orange | Advanced encoding of multi-channel digital audio signals |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
CN101770777B (zh) * | 2008-12-31 | 2012-04-25 | 华为技术有限公司 | 一种线性预测编码频带扩展方法、装置和编解码系统 |
GB2467534B (en) * | 2009-02-04 | 2014-12-24 | Richard Furse | Sound system |
WO2011104146A1 (en) * | 2010-02-24 | 2011-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program |
EP2539892B1 (fr) * | 2010-02-26 | 2014-04-02 | Orange | Compression de flux audio multicanal |
AU2011231565B2 (en) * | 2010-03-26 | 2014-08-28 | Dolby International Ab | Method and device for decoding an audio soundfield representation for audio playback |
US20120029912A1 (en) * | 2010-07-27 | 2012-02-02 | Voice Muffler Corporation | Hands-free Active Noise Canceling Device |
NZ587483A (en) * | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2451196A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three |
EP2469741A1 (en) | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
FR2969804A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9288603B2 (en) * | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
EP2733963A1 (en) * | 2012-11-14 | 2014-05-21 | Thomson Licensing | Method and apparatus for facilitating listening to a sound signal for matrixed sound signals |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
KR102143545B1 (ko) * | 2013-01-16 | 2020-08-12 | 돌비 인터네셔널 에이비 | Hoa 라우드니스 레벨을 측정하기 위한 방법 및 hoa 라우드니스 레벨을 측정하기 위한 장치 |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
US9959875B2 (en) * | 2013-03-01 | 2018-05-01 | Qualcomm Incorporated | Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams |
EP2782094A1 (en) * | 2013-03-22 | 2014-09-24 | Thomson Licensing | Method and apparatus for enhancing directivity of a 1st order Ambisonics signal |
US9763019B2 (en) * | 2013-05-29 | 2017-09-12 | Qualcomm Incorporated | Analysis of decomposed representations of a sound field |
EP2824661A1 (en) * | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
KR101480474B1 (ko) * | 2013-10-08 | 2015-01-09 | 엘지전자 주식회사 | 오디오 재생장치와 이를 포함하는 시스템 |
EP3073488A1 (en) * | 2015-03-24 | 2016-09-28 | Thomson Licensing | Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field |
WO2020037280A1 (en) * | 2018-08-17 | 2020-02-20 | Dts, Inc. | Spatial audio signal decoder |
US11429340B2 (en) * | 2019-07-03 | 2022-08-30 | Qualcomm Incorporated | Audio capture and rendering for extended reality experiences |
-
2012
- 2012-05-14 EP EP12305537.8A patent/EP2665208A1/en not_active Withdrawn
-
2013
- 2013-05-03 TW TW102115828A patent/TWI600005B/zh active
- 2013-05-03 TW TW106146055A patent/TWI634546B/zh active
- 2013-05-03 TW TW108114778A patent/TWI725419B/zh active
- 2013-05-03 TW TW107119510A patent/TWI666627B/zh active
- 2013-05-03 TW TW106122256A patent/TWI618049B/zh active
- 2013-05-03 TW TW110112090A patent/TWI823073B/zh active
- 2013-05-06 KR KR1020217008100A patent/KR102427245B1/ko active IP Right Grant
- 2013-05-06 CN CN201710350511.XA patent/CN107017002B/zh active Active
- 2013-05-06 EP EP23168515.7A patent/EP4246511A3/en active Pending
- 2013-05-06 JP JP2015511988A patent/JP6211069B2/ja active Active
- 2013-05-06 CN CN201710350455.XA patent/CN107170458B/zh active Active
- 2013-05-06 CN CN201710350513.9A patent/CN107180638B/zh active Active
- 2013-05-06 CN CN201710350454.5A patent/CN107180637B/zh active Active
- 2013-05-06 EP EP13722362.4A patent/EP2850753B1/en active Active
- 2013-05-06 BR BR112014028439-3A patent/BR112014028439B1/pt active IP Right Grant
- 2013-05-06 KR KR1020147031645A patent/KR102121939B1/ko active IP Right Grant
- 2013-05-06 KR KR1020237013799A patent/KR102651455B1/ko active IP Right Grant
- 2013-05-06 US US14/400,039 patent/US9454971B2/en active Active
- 2013-05-06 CN CN201710354502.8A patent/CN106971738B/zh active Active
- 2013-05-06 WO PCT/EP2013/059363 patent/WO2013171083A1/en active Application Filing
- 2013-05-06 CN CN201380025029.9A patent/CN104285390B/zh active Active
- 2013-05-06 KR KR1020227026008A patent/KR102526449B1/ko active IP Right Grant
- 2013-05-06 CN CN202310181331.9A patent/CN116312573A/zh active Pending
- 2013-05-06 KR KR1020247009545A patent/KR20240045340A/ko active Search and Examination
- 2013-05-06 CN CN202110183761.5A patent/CN112712810B/zh active Active
- 2013-05-06 EP EP19175884.6A patent/EP3564952B1/en active Active
- 2013-05-06 CN CN202110183877.9A patent/CN112735447B/zh active Active
- 2013-05-06 CN CN202310171516.1A patent/CN116229995A/zh active Pending
- 2013-05-06 KR KR1020207016239A patent/KR102231498B1/ko active IP Right Grant
- 2013-05-06 AU AU2013261933A patent/AU2013261933B2/en active Active
- 2013-05-06 EP EP21214985.0A patent/EP4012703B1/en active Active
-
2015
- 2015-09-17 HK HK15109104.7A patent/HK1208569A1/xx unknown
-
2016
- 2016-07-27 US US15/221,354 patent/US9980073B2/en active Active
- 2016-11-25 AU AU2016262783A patent/AU2016262783B2/en active Active
-
2017
- 2017-09-12 JP JP2017174629A patent/JP6500065B2/ja active Active
-
2018
- 2018-03-21 US US15/927,985 patent/US10390164B2/en active Active
-
2019
- 2019-03-05 AU AU2019201490A patent/AU2019201490B2/en active Active
- 2019-03-18 JP JP2019049327A patent/JP6698903B2/ja active Active
- 2019-07-01 US US16/458,526 patent/US11234091B2/en active Active
-
2020
- 2020-04-28 JP JP2020078865A patent/JP7090119B2/ja active Active
-
2021
- 2021-06-09 AU AU2021203791A patent/AU2021203791B2/en active Active
- 2021-12-10 US US17/548,485 patent/US11792591B2/en active Active
-
2022
- 2022-06-13 JP JP2022095120A patent/JP7471344B2/ja active Active
- 2022-08-08 AU AU2022215160A patent/AU2022215160B2/en active Active
-
2023
- 2023-10-16 US US18/487,280 patent/US20240147173A1/en active Pending
-
2024
- 2024-04-09 JP JP2024062459A patent/JP2024084842A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009046223A2 (en) * | 2007-10-03 | 2009-04-09 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
Non-Patent Citations (4)
Title |
---|
Andrew Wabnitz, et al. TIME DOMAIN RECONSTRUCTION OF SPATIAL SOUND FIELDS USING COMPRESSED SENSING. IEEE International Conference on Acoustics, Speech and Signal Processing. 2011.05.22. * |
Daniel J, et al. Further investigations of High Order Ambisonics and Wavefield Synthesis for Holophonic Sound Imaging. 114th Audio Engineering Society Convention. 2003.03.22. * |
Erik Hellerud, et al. Encoding Higher Order Ambisonics with AAC. 124th Audio Engineering Society Convention. 2008.05.17. * |
Erik Hellerud, et al. Spatial redundancy in Higher Order Ambisonics and its use for lowdelay lossless compression. IEEE International Conference on Acoustics, Speech and Signal Processing. 2009. pp.26 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102121939B1 (ko) | 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치 | |
JP2015520411A5 (ko) | ||
TW202435200A (zh) | 高階保真立體音響訊號表象之壓縮方法和裝置以及解壓縮方法和裝置以及非暫時性電腦可讀取媒體 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |