KR102012988B1 - 고차 앰비소닉스 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치 - Google Patents

고차 앰비소닉스 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치 Download PDF

Info

Publication number
KR102012988B1
KR102012988B1 KR1020147002760A KR20147002760A KR102012988B1 KR 102012988 B1 KR102012988 B1 KR 102012988B1 KR 1020147002760 A KR1020147002760 A KR 1020147002760A KR 20147002760 A KR20147002760 A KR 20147002760A KR 102012988 B1 KR102012988 B1 KR 102012988B1
Authority
KR
South Korea
Prior art keywords
warping
coefficients
matrix
vector
hoa
Prior art date
Application number
KR1020147002760A
Other languages
English (en)
Other versions
KR20140051927A (ko
Inventor
피터 작스
요한-마르쿠스 바트케
Original Assignee
인터디지탈 매디슨 페이튼트 홀딩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터디지탈 매디슨 페이튼트 홀딩스 filed Critical 인터디지탈 매디슨 페이튼트 홀딩스
Publication of KR20140051927A publication Critical patent/KR20140051927A/ko
Application granted granted Critical
Publication of KR102012988B1 publication Critical patent/KR102012988B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/024Positioning of loudspeaker enclosures for spatial sound reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

고차 앰비소닉스(HOA)는 2D 및 3D 양자에 있어서 우수한 공간 레졸루션을 갖는 복잡한 오디오 장면들의 포착, 조작, 레코딩, 전송 및 재생을 용이하게 하는 공간 사운드 필드들의 표현이다. 사운드 필드는 푸리에-베셀 급수에 의해 공간에서의 레퍼런스 포인트에서 및 그 레퍼런스 포인트 주위에서 근사화된다. 본 발명은 고차 앰비소닉스 표현으로서 포착 또는 생성되었던 사운드 필드 정보의 재생 및/또는 공간 콘텐츠를 변경하기 위한 공간 워핑(12, 13, 14; 16)을 사용한다. 2D 및 3D 사운드 필드들에 대해, 상이한 워핑 특성들이 가능하다. 워핑은 장면 분석 또는 분해를 수행하지 않고 공간 도메인에서 수행된다. 소정의 차수를 갖는 입력 HOA 계수들이 규칙적으로 위치된 (가상) 확성기들의 가중치들 또는 입력 신호들로 디코딩된다.

Description

고차 앰비소닉스 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치{METHOD AND APPARATUS FOR CHANGING THE RELATIVE POSITIONS OF SOUND OBJECTS CONTAINED WITHIN A HIGHER-ORDER AMBISONICS REPRESENTATION}
본 발명은 오디오 장면의 2차원 또는 3차원 고차 앰비소닉스 표현(Higher-Order Ambisonics representation) 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치에 관한 것이다.
고차 앰비소닉스(Higher-Order Ambisonics; HOA)는 2D 및 3D 양자에 있어서 우수한 공간 레졸루션(spatial resolution)을 갖는 복잡한 오디오 장면들의 포착, 조작, 레코딩, 전송 및 재생을 용이하게 하는 공간 사운드 필드들의 표현이다. 사운드 필드는 푸리에-베셀 급수(Fourier-Bessel series)에 의해 공간에서의 레퍼런스 포인트에서 및 그 레퍼런스 포인트 주위에서 근사화된다.
HOA 기술들로 포착된 오디오 장면의 공간 배열을 조작하기 위해 오직 제한된 수의 기술들만이 존재한다. 대체로, 2가지 방식들이 존재한다: 즉,
A) 예를 들어, DirAC를 통해 오디오 장면을 별도의 사운드 오브젝트들 및 관련 위치 정보로 분해하고, 조작된 위치 파라미터들로 새로운 장면을 합성하는 것. 그 단점은, 복잡하고 에러-유발 장면 분해가 필수적이라는 점이다.
B) HOA 표현의 콘텐츠가 HOA 벡터들의 선형 변환을 통해 변경될 수 있음. 여기서는, 오직 회전, 미러링, 및 전/후방 방향들의 강조만이 제안되었다. 이들 공지된 변환 기반 변경 기술들 모두는 장면 내의 오브젝트들의 상대적인 포지셔닝을 고정되게 유지한다.
장면의 콘텐츠를 조작 또는 변경하기 위해, HOA 사운드 필드들의 회전 및 미러링 및 특정 방향들의 우세를 변경하는 것을 포함한 공간 워핑(space warping)이 제안되었다.
Figure 112014010066158-pct00001
본 발명에 의해 해결될 과제는 장면의 합성을 분석할 필요없이 HOA 기반 오디오 장면 내에 포함된 사운드 오브젝트들의 상대적인 위치들의 변경을 용이하게 하는 것이다. 이러한 과제는 청구항 제1항에 개시된 방법에 의해 해결된다. 이 방법을 활용하는 장치가 청구항 제2항에 개시된다.
본 발명은 고차 앰비소닉스 표현으로서 포착 또는 생성되었던 사운드 필드 정보의 재생 및/또는 공간 콘텐츠를 변경하기 위한 공간 워핑을 사용한다. HOA 도메인에서의 공간 워핑은 다중 단계 접근법 또는 더 계산적으로 효율적인 단일 단계의 선형 매트릭스 승산 양자를 표현한다. 2D 및 3D 사운드 필드들에 대해, 상이한 워핑 특성들이 가능하다.
워핑은 장면 분석 또는 분해를 수행하지 않고 공간 도메인에서 수행된다. 소정의 차수를 갖는 입력 HOA 계수들이 규칙적으로 위치된 (가상) 확성기들의 가중치들 또는 입력 신호들로 디코딩된다.
본 발명의 공간 워핑 프로세싱은 수개의 이점들을 갖는다.
- 파라미터화에 있어서의 수개의 자유도들 때문에 매우 유연함;
- 매우 효율적인 방식으로, 즉, 비교적 낮은 복잡도로 구현될 수 있음;
- 임의의 장면 분석 또는 분해를 요구하지 않음.
대체로, 본 발명의 방법은 오디오 장면의 2차원 또는 3차원 고차 앰비소닉스(HOA) 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는데 적절하며, 여기서, 디멘젼(O in)을 갖는 입력 벡터(A in)는 입력 신호의 푸리에 급수의 계수들을 결정하고, 디멘젼(O out)을 갖는 출력 벡터(A out)는 대응하여 변경된 출력 신호의 푸리에 급수의 계수들을 결정하며, 상기 방법은,
-
Figure 112014010066158-pct00002
를 계산함으로써 모드 매트릭스(Ψ1)의 역(Ψ1 -1)을 이용하여 규칙적으로 위치된 확성기 위치들에 대한 공간 도메인에 있어서의 입력 신호들(s in)로 입력 HOA 계수들의 상기 입력 벡터(A in)를 디코딩하는 단계; 및
- A out = Ψ2 s in을 계산함으로써 적응된 출력 HOA 계수들의 상기 출력 벡터(A out)로 상기 입력 신호들(s in)을 공간 도메인에서 워핑 및 인코딩하는 단계를 포함하고, 여기서, 모드 매트릭스(Ψ2)의 모드 벡터들은, 오리지널 확성기 위치들의 각도들이 상기 출력 벡터(A out)에 있어서의 타깃 확성기 위치들의 타깃 각도들로 일대일 매핑되는 워핑 함수(f(ø))에 따라 변경된다.
대체로, 본 발명의 장치는 오디오 장면의 2차원 또는 3차원 고차 앰비소닉스(HOA) 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는데 적절하며, 여기서, 디멘젼(O in)을 갖는 입력 벡터(A in)는 입력 신호의 푸리에 급수의 계수들을 결정하고, 디멘젼(O out)을 갖는 출력 벡터(A out)는 대응하여 변경된 출력 신호의 푸리에 급수의 계수들을 결정하며, 상기 장치는,
-
Figure 112014010066158-pct00003
을 계산함으로써 모드 매트릭스(Ψ1)의 역(Ψ1 -1)을 이용하여 규칙적으로 위치된 확성기 위치들에 대한 공간 도메인에 있어서의 입력 신호들(s in)로 입력 HOA 계수들의 상기 입력 벡터(A in)를 디코딩하도록 구성된 수단; 및
- A out = Ψ2 s in을 계산함으로써 적응된 출력 HOA 계수들의 상기 출력 벡터(A out)로 상기 입력 신호들(s in)을 공간 도메인에서 워핑 및 인코딩하도록 구성된 수단을 포함하고, 여기서, 모드 매트릭스(Ψ2)의 모드 벡터들은, 오리지널 확성기 위치들의 각도들이 상기 출력 벡터(A out)에 있어서의 타깃 확성기 위치들의 타깃 각도들로 일대일 매핑되는 워핑 함수(f(ø))에 따라 변경된다.
본 발명의 유리한 부가적인 실시예들이 각각의 종속 청구항들에 개시된다.
본 발명의 예시적인 실시예들이 첨부 도면들을 참조하여 설명된다.
도 1은 공간 도메인에 있어서의 워핑의 원리를 도시한다.
도 2는 Nin = 3, Nout = 12를 갖는 공간 워핑, 및 a = -0.4를 갖는 워핑 함수
Figure 112014010066158-pct00004
의 예를 도시한다.
도 3은 상이한 워핑 함수들 및 '내부' 차수들(Nwarp)에 대한 매트릭스 왜곡들을 도시한다.
하기에서, 이해를 위해, 공간 워핑의 본 발명의 어플리케이션이 2차원 셋업에 대해 설명되고, HOA 표현은 순환 고조파들에 의존하며, 표현된 사운드 필드는 오직 평면 음파들만을 포함한다고 가정된다. 그 후, 그 설명은 구면 고조파들에 기초하여 3차원 케이스들로 확장된다.
표기법
앰비소닉스 이론에 있어서, 공간 내 특정 포인트에서의 그리고 특정 포인트 주위에서의 사운드 필드는 절단형 푸리에-베셀 급수(truncated Fourier-Bessel series)에 의해 기술된다. 일반적으로, 레퍼런스 포인트는 선택된 좌표 시스템의 원점에 있는 것으로 가정된다.
구면 좌표를 이용한 3차원 어플리케이션에 있어서, 모든 정의된 인덱스들(n = 0, 1, ..., N 및 m = -n, ..., n)에 대한 계수들(An m)을 갖는 푸리에 급수는 원점으로부터의 방위각(ø), 경사(θ) 및 거리(r)에서의 사운드 필드의 압력을 기술하며:
Figure 112014010066158-pct00005
이며, 여기서, k는 파수이고
Figure 112014010066158-pct00006
는 θ 및 ø에 의해 정의된 방향에 대한 구면 고조파와 엄격히 관련된 푸리에-베셀 급수의 커널 함수이다. 편의를 위해, 하기에서, HOA 계수들(An m)은 정의 An m = Cn m jn(kr)로 사용된다. 특정 차수(N)에 있어서, 푸리에-베셀 급수에서의 계수들의 개수는 0 = (N + 1)2이다.
원형 좌표를 사용한 2차원 어플리케이션에 있어서, 커널 함수들은 오직 방위각(ø)에만 의존한다. m≠n인 모든 계수들은 제로의 값을 갖고 생략될 수 있다. 따라서, HOA 계수들의 개수는 오직 0 = 2N + 1로 감소된다. 더욱이, 경사(θ=π/2)는 고정된다. 2D 케이스에 대해 그리고 사운드 오브젝트들의 원 상의 완전히 균일한 분포에 대해, 즉,
Figure 112014010066158-pct00007
에 있어서, Ψ 내의 모드 벡터들은 널리 공지된 이산 푸리에 변환(discrete Fourier transform; DFT)의 커널 함수들과 동일함을 유의한다.
앰비소닉스 계수들(An m)의 상이한 정의들을 또한 유도하는 커널 함수들의 정의를 위해, 상이한 관례들이 존재한다. 하지만, 정확한 정의는, 본 어플리케이션에서 기술되는 공간 워핑 기술들의 기본 명세 및 특성들에 대해 역할을 하지 않는다.
HOA '신호'는 각각의 시간 인스턴트(time instant)에 대한 앰비소닉스 계수들의 벡터(A)를 포함한다. 2차원 - 즉, 원형 - 설정에 있어서, 계수 벡터의 통상의 합성 및 순서화(ordering)는
Figure 112014010066158-pct00008
이다.
3차원 구면 설정에 있어서, 계수들의 통상의 순서화는 상이하다:
Figure 112014010066158-pct00009
HOA 표현들의 인코딩은 선형 방식으로 거동하고, 따라서, 다중의 별도의 사운드 오브젝트들에 대한 HOA 계수들은 결과적인 사운드 필드의 HOA 계수들을 도출하기 위해 합산될 수 있다.
플레인 인코딩(Plain encoding)
수개의 방향들로부터의 다중의 사운드 오브젝트들의 플레인 인코딩은 벡터 대수로 간단히 달성될 수 있다. '인코딩'은 동일한 시간 인스턴트(l)에서의 개별 사운드 오브젝트들(i=0...M-1)의 압력 기여도들(si(k,l)) 플러스 음파들이 좌표 시스템의 원점에 도달하고 있는 방향들(øi 및 θi)에 관한 정보로부터, 시간 인스턴트(l) 및 파수(k)에서의 HOA 계수들의 벡터(A(k,l))를 도출하기 위한 단계를 의미한다.
Figure 112014010066158-pct00010
수학식(2)에서 정의된 바와 같이 HOA 벡터들의 2차원 셋업 및 합성이 가정되면, 모드 매트릭스(Ψ)는 모드 벡터들(
Figure 112014010066158-pct00011
)로부터 구성된다. Ψ의 i번째 컬럼은 i번째 사운드 오브젝트의 방향(øi)에 따른 모드 벡터를 포함한다.
Figure 112014010066158-pct00012
상기 정의된 바와 같이, HOA 표현의 인코딩은, 입력 신호들(사운드 오브젝트들)이 공간적으로 분포하기 때문에 공간-주파수 변환으로서 해석될 수 있다.
매트릭스(Ψ)에 의한 이러한 변환은, 오직 사운드 오브젝트들의 개수가 HOA 계수들의 개수와 동일하면, 즉, M= 0이면 그리고 방향들(øi)이 단위원 주위로 합리적으로 확산된다면, 정보 손실없이 반전될 수 있다. 수학적인 용어들에 있어서, 가역성의 조건들은 모드 매트릭스(Ψ)가 정방형 (O x 0)이고 역전가능이어야 한다는 것이다.
플레인 디코딩(Plain decoding)
디코딩에 의해, 입력 HOA 계수들에 의해 기술된 바와 같은 원하는 사운드 필드를 정확하게 재생하기 위해 적용되어야 하는 실제의 또는 가상의 확성기들의 드라이버 신호들이 도출된다. 그러한 디코딩은 확성기들의 개수(M) 및 위치들에 의존한다. 다음의 3가지 중요한 케이스들이 구별되어야 한다(주: 이들 케이스들은, 이들이 기하학적으로 합리적인 방식으로 셋업된다고 가정하면, '합성기들의 개수'를 통해 정의된다는 관점에서 단순화된다. 더 정확하게는, 타깃된 확성기 셋업의 모드 매트릭스의 랭크를 통해 정의가 수행되어야 한다). 하기에 나타낸 예시적인 디코딩 룰들에 있어서, 모드 매칭 디코딩 원리가 적용되지만, 3가지 시나리오들에 대해 상이한 디코딩 룰들을 유도할 수 있는 다른 디코딩 원리들이 활용될 수 있다.
Figure 112014010066158-pct00013
과도 결정된 케이스(Overdetermined case): 확성기들의 개수는 HOA 계수들의 개수보다 크며, 즉, M > 0 이다. 이 케이스에 있어서, 디코딩 문제에 대한 어떠한 고유한 솔루션도 존재하지 않지만, 모든 잠재적인 솔루션들의 M차원 공간의 M-O차원 하위공간(sub-space)에 위치되는 다양한 허용가능한 솔루션들이 존재한다. 통상적으로, 특정 확성기 셋업의 모드 매트릭스(Ψ)의 의사 역(pseudo inverse)이 확성기 신호들(s)을 결정하기 위해 사용된다:
Figure 112014010066158-pct00014
이러한 솔루션은 최소의 총 재생 전력(s T s)을 갖는 확성기 신호들을 전달한다(예를 들어, L.L.Scharf, "Statistical Signal Processing. Detection, Estimation, and Time Series Analysis", Addison-Wesley Publishing Company, Reading, Massachusetts, 1990 참조). (2D 케이스에서 용이하게 달성가능한) 확성기들의 정규의 셋업들에 있어서, 매트릭스 연산 (ΨΨT)-1은 아이덴터티 매트릭스(identity matrix)를 산출하고, 수학식(6)으로부터의 디코딩 룰은 s = ΨT A로 단순화한다.
Figure 112014010066158-pct00015
결정된 케이스(Determined case): 확성기들의 개수는 HOA 계수들의 개수와 동일하다. 디코딩 문제에 대한 정확히 하나의 고유한 솔루션이 존재하고, 이는 모드 매트릭스(Ψ)의 역(Ψ-1)에 의해 정의된다:
Figure 112014010066158-pct00016
Figure 112014010066158-pct00017
미결정된 케이스(Underdetermined case): 확성기들의 개수(M)는 HOA 계수들의 개수(O)보다 작다. 따라서, 사운드 필드를 디코딩하는 수학적 문제는 미결정적이고 어떠한 고유의 정확한 솔루션도 존재하지 않는다. 대신, 수치 최적화는, 원하는 사운드 필드를 가장 가능성 있게 일치시키는 확성기 신호들을 결정하기 위해 사용되어야 한다.
정규화는 예를 들어, 식:
Figure 112014010066158-pct00018
에 의해 안정적인 솔루션을 도출하기 위해 적용될 수 있으며, 여기서, I는 아이덴터티 매트릭스를 나타내고, 스칼라 팩터 λ는 정규화의 양을 정의한다. 일 예로서, λ는 ΨΨT의 고유값의 평균으로 설정될 수 있다.
결과적인 빔 패턴들은, 일반적으로 이러한 접근법으로 획득된 빔 패턴들이 과도하게 지향성이고 다수의 사운드 정보가 적게 표현(underrepresented)될 것이기 때문에 차선일 수도 있다.
상기 설명된 모든 디코더 예들에 있어서, 확성기들이 평면파들을 방출한다는 가정이 행해졌다. 실제 확성기들은 디코딩 룰이 주의해야 하는 상이한 재생 특성들을 갖는다.
기본적인 워핑
본 발명의 공간 워핑의 원리가 도 1a에 도시된다. 워핑은 공간 도메인에서 수행된다. 따라서, 먼저, 차수(Nin) 및 디멘젼(O in)을 갖는 입력 HOA 계수들(A in)이 규칙적으로 위치된 (가상) 확성기들의 가중치들 또는 입력 신호들(s in)로 단계/스테이지(12)에서 디코딩된다. 이러한 디코딩 단계에 있어서, 결정된 디코더, 즉, 가상 확성기들의 개수(O warp)가 HOA 계수들의 개수(O in) 이상인 디코더를 적용하는 것이 유리하다. 후자의 케이스(HOA 계수들보다 많은 확성기들)에 있어서, HOA 계수들의 벡터(A in)의 차수 또는 디멘젼은 더 높은 차수들에 대한 제로 계수들을 단계/스테이지(11)에서 부가함으로써 용이하게 확장될 수 있다. 하기에서, 타깃 벡터(s in)의 디멘젼은 O warp로 표기될 것이다.
디코딩 룰은
Figure 112014010066158-pct00019
이다.
확성기 신호들의 가상 위치들은 규칙적이어야 하며, 예를 들어, 2차원 케이스에 대해
Figure 112014010066158-pct00020
이다. 이에 의해, 모드 매트릭스(Ψ1)가 디코딩 매트릭스(Ψ1 -1)를 결정하기 위해 잘 조절되는 것이 보장된다.
다음으로, 가상 확성기들의 위치들이 원하는 워핑 특성들에 따라 '워프' 프로세싱 시 변경된다. 그 워프 프로세싱은 단계/스테이지(14)에서 모드 매트릭스(Ψ2)를 사용하여 타깃 벡터(s in)(또는 각각 s out)를 인코딩하는 것과 결합되어, 디멘젼(O warp)을 갖거나 또는 하기에서 설명되는 추가 프로세싱 단계 이후 디멘젼(O out)을 갖는 워핑된 HOA 계수들의 벡터(A out)를 발생시킨다. 대체로, 워핑 특성은 소스 각도들의 타깃 각도들로의 일대일 매핑에 의해 완전히 정의될 수 있으며, 즉, 각각의 소스 각도(øin = 0...2π 및 가능하게는 θin =0...2π)에 대해, 타깃 각도가 정의되며, 이에 의해, 2D 케이스에 대해,
Figure 112014010066158-pct00021
이고, 3D 케이스에 대해,
Figure 112014010066158-pct00022
이다.
이해를 위해, 이러한 (가상) 재-배향(re-orientation)은 확성기들을 새로운 위치들로 물리적으로 이동시키는 것과 비교될 수 있다.
이러한 절차에 의해 생성될 하나의 문제는 특정 각도들에서의 인접 확성기들 간의 거리가 워핑 함수(f(ø))의 기울기에 따라 변경된다는 것이다(이는 하기에서 2D 케이스에 대해 설명됨): f(ø)의 기울기가 1보다 크면, 워핑된 사운드 필드에서의 동일 각도 공간은 오리지널 사운드 필드에서보다 더 적은 '확성기들'에 의해 점유될 것이고 그 역도 성립할 것이다. 즉, 확성기들의 밀도(Ds)는
Figure 112014010066158-pct00023
에 따라 거동한다.
결국, 이는 공간 워핑이 청취자 주위의 사운드 밸런스를 변경함을 의미한다. 확성기 밀도가 증가된, 즉, Ds(ø) > 1인 영역들은 더 우세하게 될 것이고, Ds(ø) < 1인 영역들은 덜 우세하게 될 것이다.
옵션으로서, 어플리케이션의 요건들에 의존하여, 확성기 밀도의 전술한 변경은 가중 단계/스테이지(13)에 있어서 이득 함수(g(ø))를 가상 확성기 출력 신호들(s in)에 적용하여 신호(s out)를 발생시킴으로써 대응(counter)될 수 있다. 대체로, 임의의 가중 함수(g(ø))가 특정될 수 있다. 하나의 특별한 유리한 변형예가 워핑 함수(f(ø))의 도함수에 비례하도록 경험적으로 결정되었다.
Figure 112014010066158-pct00024
이러한 특정 가중 함수를 사용하여, 적절히 높은 내부 차수 및 출력 차수의 가정 하에서(하기 'HOA 차수들을 설정하는 법' 섹션 참조), 특정 워핑 각도에서의 패닝 함수(f(ø))의 진폭은 오리지널 각도(ø)에서의 오리지널 패닝 함수와 동일하게 유지된다. 이에 의해, 개구 각도 당 동질적 사운드 밸런스(진폭)(homogeneous sound balance (amplitude) per opening angle)가 획득된다.
상기 예시적인 가중 함수 이외에, 다른 가중 함수들이, 예를 들어, 개구 각도 당 동일한 전력을 획득하기 위해 사용될 수 있다.
마지막으로, 단계/스테이지(14)에 있어서, 가중된 가상 확성기 신호들은 Ψ2 s out을 수행함으로써 모드 매트릭스(Ψ2)로 다시 워핑 및 인코딩된다. Ψ2는 워핑 함수(f(ø))에 따라 Ψ1과는 상이한 모드 벡터들을 포함한다. 그 결과는 워핑된 사운드 필드의 0 warp 디멘젼의 HOA 표현이다.
타깃 HOA 표현의 차수 또는 디멘젼이 인코더(Ψ2)의 차수보다 낮을 것이면(하기 'HOA 차수들을 설정하는 법' 섹션 참조), 워핑된 계수들의 일부(즉, 부분)가 단계/스테이지(15)에서 제거(스트립)되어야 한다. 일반적으로, 이러한 스트립핑(stripping) 동작은 윈도우잉(windowing) 동작에 의해 설명될 수 있으며: 즉, 인코딩된 벡터(Ψ2 s out)가 제거될 최고 차수들에 대한 제로 계수들을 포함하는 윈도우 벡터(w)로 승산되고 이 승산은 추가 가중을 표현하는 것으로서 고려될 수 있다. 가장 단순한 케이스에 있어서, 장방형 윈도우가 적용될 수 있지만, 더 복잡한 윈도우들이 M.A.Poletti, "A Unified Theory of Horizontal Holographic Sound Systems",Journal of the Audio Engineering Society, 48(12), pp.1155-1182, 2000의 섹션 3에서 설명된 바와 같이 사용될 수 있거나, J.Daniel의 상기 서술된 PhD 학위논문의 섹션 3.3.2로부터의 '동위상' 또는 'max. rE' 윈도우들이 사용될 수 있다.
3D에 대한 워핑 함수들
워핑 함수(f(ø)) 및 관련 가중 함수(g(ø))의 개념이 2차원 케이스에 대해 상기 설명되었다. 다음은, 더 높은 디멘젼 때문에 그리고 구면 기하학이 적용되어야 하기 때문에 더 복잡한 3차원 케이스로의 확장이다. 2개의 단순화된 시나리오들이 소개되고, 그들 양자는 1차원 워핑 함수(f(ø) 또는 f(θ))에 의해 원하는 공간 워핑을 특정할 수 있게 한다.
경도를 따르는 공간 워핑에 있어서, 공간 워핑은 오직 방위각(ø)만의 함수로서 수행된다. 이 케이스는 위에서 소개된 2차원 케이스와 상당히 유사하다. 워핑 함수는
Figure 112014010066158-pct00025
에 의해 완전히 정의된다.
이에 의해, 유사한 워핑 함수들이 2차원 케이스에 대한 것과 같이 적용될 수 있다. 공간 워핑은 적도 상의 사운드 오브젝트들에 대해 최대 임팩트를 갖지만, 구면의 극에서의 사운드 오브젝트들에 대해 최저 임팩트를 갖는다.
구면 상의 (워핑된) 사운드 오브젝트들의 밀도는 오직 방위각에만 의존한다. 따라서, 일정한 밀도에 대한 가중 함수는
Figure 112014010066158-pct00026
이다.
공간에 있어서의 특정 워핑 특성들의 자유로운 배향이, 워핑을 적용하기 전에 구면을 (가상으로) 회전하고 그 후 역으로 회전함으로써 가능하다.
위도를 따르는 공간 워핑에 있어서, 공간 워핑은 오직 자오선만을 따르도록 허용된다. 워핑 함수는
Figure 112014010066158-pct00027
에 의해 정의된다.
구면에 대한 이러한 워핑 함수의 중요한 특성은, 방위각이 일정하게 유지되더라도, 방위각-방향에 있어서의 2개 포인트들의 각거리(angular distance)가 경사의 변경으로 인해 잘 변할 수 있다는 것이다. 그 이유는, 2개의 자오선들 간의 각거리가 적도에서 최대지만 2개의 극에서는 제로로 사라지기 때문이다. 이러한 사실은 가중 함수에 의해 고려되어야 한다.
2개 포인트들(A 및 B)의 각거리(c)는 구면 기하학의 코사인 룰에 의해 결정될 수 있다 - I.N.Bronstein, K.A.Semendjajew, G.Musiol, H.Muhlig, "Taschenbuch der Mathematik", Verlag Harri Deutsch, Thun, Frankfurt/Main, 5th edition, 2000에서의 수학식(3.188c) 참조: 즉,
Figure 112014010066158-pct00028
이고, 여기서, øΑΒ는 2개 포인트들(A 및 B) 간의 방위각을 나타냄 -. 동일 경사(θ)에서의 2개 포인트들 간의 각거리에 관하여, 이 수학식은
Figure 112014010066158-pct00029
로 단순화한다.
이러한 공식은, 공간에서의 포인트와 작은 방위각(øε) 만큼 이격된 다른 포인트 사이의 각거리를 도출하기 위해 적용될 수 있다. "작은"은 제로는 아니지만 실제 어플리케이션에서 실현가능할 만큼 작음을 의미하며, 이론적으로, 극한값 øε →0이다. 워핑 전후 그러한 각거리들 간의 비율은, ø방향에서의 사운드 오브젝트들의 밀도가 변하는 팩터를 제공한다:
Figure 112014010066158-pct00030
마지막으로, 가중 함수는 ø방향에서의 그리고 θ방향에서의 2개의 가중 함수들의 곱이다.
Figure 112014010066158-pct00031
다시, 이전의 시나리오에서와 같이, 공간에서의 특정 워핑 특성들의 자유로운 배향이 회전에 의해 가능하다.
단일 단계 프로세싱
도 1a와 관련하여 소개된 단계들, 즉, 차수의 확장, 디코딩, 가중, 워핑+인코딩 및 차수의 스트립핑은 본질적으로 선형 동작들이다.
따라서, 이러한 동작들의 시퀀스는, 도 1b에 도시된 바와 같이, 단계/스테이지(16)에 있어서 입력 HOA 계수들의 단일 매트릭스와의 승산으로 대체될 수 있다. 확장 및 스트립핑 동작들을 생략하면, 전체 O warp x O warp 변환 매트릭스(T)는
Figure 112014010066158-pct00032
로서 결정되고, 여기서, diag(·)는 주 대각선의 컴포넌트들로서 그 벡터 인수(vector argument)의 값들을 갖는 대각선 매트릭스를 나타내고, g는 가중 함수이고, w는 상기 설명된 스트립핑을 준비하기 위한 윈도우 벡터이며, 즉, 단계/스테이지(15)에서 수행된 스트립핑 및 계수-스트립핑 자체를 준비하기 위한 2개의 가중 함수들로부터, 수학식(24)에서의 윈도우 벡터(w)는 오직 가중을 위해 제공된다.
다중 단계 접근법 내에서의 차수의 2개의 적응들, 즉, 디코더 이전의 차수의 확장 및 인코딩 이후의 HOA 계수들의 스트립핑은 또한, 대응하는 컬럼들 및/또는 라인들을 제거함으로써 변환 매트릭스(T)에 통합될 수 있다. 이에 의해, 입력 HOA 벡터들에 직접 적용될 수 있는 사이즈 O out x 0 in의 매트릭스가 도출된다. 그 후, 공간 워핑 동작은
Figure 112014010066158-pct00033
이 된다.
유리하게, O warp x O warp로부터 O out x O in으로의 변환 매트릭스(T)의 디멘젼들의 효과적인 감소 때문에, 도 1b에 따라 단일 단계 프로세싱을 수행하는데 요구된 계산 복잡도는, 단일 단계 프로세싱이 완전히 동일한 결과들을 전달하지만, 도 1a의 다중 단계 접근법에 대해 요구된 것보다 현저하게 더 낮다. 특히, 이는 다중 단계 프로세싱이 그 중간 신호들의 더 낮은 차수(Nwarp)로 수행되면 발생할 수 있는 왜곡들을 회피시킨다(상세를 위해서는 하기의 'HOA 차수들을 설정하는 법' 섹션 참조).
최신 기술: 회전 및 미러링
사운드 필드의 회전 및 미러링은 공간 워핑의 '단순한' 하위 카테고리들로서 고려될 수 있다. 이들 변환들의 특별한 특성은 사운드 오브젝트들의 서로에 관한 상대적인 위치가 변경되지 않는다는 것이다. 이는, 오리지널 사운드 장면에서의 다른 사운드 오브젝트의 우측으로 예를 들어 30°에 위치되었던 사운드 오브젝트가 회전된 사운드 장면에서 동일한 사운드 오브젝트의 우측으로 30°에 머무를 것임을 의미한다. 미러링에 있어서, 오직 부호만이 변하지만 각거리들은 동일하게 남겨진다.
사운드 필드 정보의 회전 및 미러링을 위한 알고리즘들 및 어플리케이션들이, 예를 들어, 상기 서술된 Barton/Gerzon 및 J.Daniel 논문들에서 그리고 M.Noisternig, A.Sontacchi, Th.Musil, R.Holdrich, "A 3D Ambisonic Based Binaural Sound Reproduction System", Proc.of the AES 24th Intl.Conf.on Multichannel Audio, Banff, Canada, 2003에서 및 H.Pomberger, F.Zotter, "An Ambisonics Format for Flexible Playback Layouts", 1st Ambisonics Symposium, Graz, Austria, 2009에서 탐구되고 설명되었다.
이들 접근법은 회전 매트릭스들에 대한 분석식들에 기초한다. 예를 들어, 원형 사운드 필드(2D 케이스)의 임의의 각도(α)만큼의 회전은, 오직 계수들의 서브세트만이 비-제로인 워핑 매트릭스(Tα)와의 승산에 의해 수행될 수 있다.
Figure 112014010066158-pct00034
이 예에서와 같이, 회전 및/또는 미러링 동작들에 대한 모든 워핑 매트릭스들은, 동일한 차수(n)의 계수들만이 서로에게 영향을 주고 있는 특별한 특성들을 갖는다. 따라서, 이들 워핑 매트릭스들은 매우 드물게 파퓰레이션되고(populated), 출력(Nout)은 어떠한 공간 정보도 유리(loosing)하지 않고 입력 차수(Nin)와 동일할 수 있다.
사운드 필드 정보의 회전 또는 미러링이 요구되는 다수의 흥미있는 어플리케이션들이 존재한다. 하나의 예는 헤드-트랙킹 시스템을 갖는 헤드폰들을 통한 사운드 필드들의 재생이다. 헤드의 회전 각도(들)에 따라 HRTF(head-related transfer function)들을 보간하는 대신, 헤드의 위치에 따라 사운드 필드를 미리 회전하고 실제 재생을 위한 고정된 HRTF들을 사용하는 것이 유리하다. 이러한 프로세싱은 상기 서술된 Noisternig/Sontacchi/Musil/Holdrich 논문에서 설명되었다.
다른 예는 사운드 필드 정보의 인코딩의 문맥에 있어서 상기 서술된 Pomberger/Zotter 논문에 설명되었다. HOA 벡터들에 의해 기술되는 공간 영역을 원(2D 케이스) 또는 구의 특정 부분들로 제약을 가하는 것이 가능하다. 그 제약들로 인해, HOA 벡터들의 일부분들이 제로로 될 것이다. 그 논문들에서 촉진된 아이디어는 사운드 필드 정보의 혼합-차수 코딩(mixed-order coding)을 위해 이러한 리던던시 감소 특성(redundancy-reducing property)을 활용하는 것이다. 전술한 제약들이 공간 내 매우 특정 영역들에 대해서만 획득될 수 있기 때문에, 회전 동작은 일반적으로, 전송된 부분 정보를 공간 내 원하는 영역으로 시프트하기 위해 요구된다.
실시예
도 2는 2차원 (원형) 케이스에서의 공간 워핑의 예를 도시한다. 워핑 함수는
Figure 112014010066158-pct00035
로 선택되었으며, 이는 단일의 실수값 파라미터를 갖는 이산 시간 전역 통과 필터(discrete-time all-pass filter)의 위상 응답과 유사하다: M.Kappelan, "Eigenschaften von Allpass-Ketten und ihre Anwendung bei der nicht-aquidistanten spektralen Analyse und Synthese", PhD thesis, Aachen University (RWTH) , Aachen, Germany, 1998 참조.
워핑 함수는 도 2a에 도시된다. 이러한 특정 워핑 함수(f(ø))는, 단일 파라미터(a)로 공간 왜곡의 양을 변경하는 것을 허용하면서 2π 주기적 워핑 함수를 보장하기 때문에 선택되었다.
도 2b에 도시된 대응하는 가중 함수(g(ø))가 그 특정 워핑 함수에 대해 결정론적으로 발생한다.
도 2c는 7x25 단일 단계 변환 워핑 매트릭스(T)를 도시한다. 그 매트릭스의 개별 계수들의 로그 절대값들은 첨부된 그레이 스케일 또는 쉐이딩 바에 따른 그레이 스케일 또는 쉐이딩 타입들에 의해 표시된다. 이러한 예시적인 매트릭스는 N = 3인 입력 HOA 차수 및 Nout = 12인 출력 차수에 대해 설계되었다. 더 높은 출력 차수가, 낮은 차수 계수들로부터 더 높은 차수 계수들로의 변환에 의해 확산되는 대부분의 정보를 포착하기 위해 요구된다. 출력 차수가 추가로 감소되면, 전체 워핑 매트릭스의 비-제로 계수들이 무시될 것이기 때문에 워핑 동작의 정확도는 열화될 것이다(더 상세한 논의를 위해서는 하기의 'HOA 차수들을 설정하는 법' 섹션 참조).
이러한 특정 워핑 매트릭스의 매우 유용한 특성은 그 대부분이 제로라는 점이다. 이는, 이 동작을 구현할 경우에 많은 계산력을 절약할 수 있게 하지만, 단일 단계 변환 매트릭스의 특정 부분들이 제로라는 것은 일반 룰은 아니다.
도 2d 및 2e는, 일부 평면파들에 의해 생성된 빔 패턴들의 예에서의 워핑 특성들을 도시한다. 양 도면들은 ø 위치들(0, 2/7π, 4/7π, 6/7π, 8/7π, 10/7π 및 12/7π)에서의 동일한 7개의 입력 평면파들로부터 기인하며, 이들 모두는 1인 동일한 진폭을 갖고 7개의 각진폭 분포들, 즉, 다음의 과도 결정된 정규의 디코딩 동작의 결과 벡터(s)
Figure 112014010066158-pct00036
를 나타내며, 여기서, HOA 벡터(A)는 평면파들의 세트의 오리지널 또는 워핑된 변형예이다. 원 외부의 수치들은 각도(ø)를 나타낸다. 가상 확성기들의 수(예를 들어, 360)는 HOA 파라미터들의 수보다 상당히 더 크다. 전방 방향으로부터 나오는 평면파에 대한 진폭 분포 또는 빔 패턴은 ø= 0에 위치된다.
도 2d는 오리지널 HOA 표현의 진폭 분포를 도시한다. 모든 7개의 분포들은 유사하게 성형화되고, 동일한 폭의 메인 로브를 특징으로 한다. 메인 로브들의 최대값들은, 예상된 대로, 오리지널 7개의 사운드 오브젝트들의 각도(ø = (0,2/7π, ...))에 위치된다. 메인 로브들은 오리지널 HOA 벡터들의 제한된 차수(Nin = 3)에 대응하는 폭들을 갖는다.
도 2e는 동일한 사운드 오브젝트들에 대해, 하지만 워핑 동작이 수행된 이후의 진폭 분포들을 도시한다. 일반적으로, 오브젝트들은 0도의 전방 방향을 향해 이동하였고 빔 패턴들이 변경되었으며: 전방 방향(ø= 0) 주위의 메인 로브들은 더 협소하고 더 포커싱되었지만, 180도 주위의 후방 방향에서의 메인 로브들은 상당히 더 넓어졌다. 측면들에서, 90 및 270도에서의 최대 임팩트에 의해, 빔 패턴들은, 이들 각도들에 대한 가중 함수(g(ø))인 도 2b의 큰 기울기로 인해 비대칭이 되었다. 빔 패턴들의 이러한 상당한 변경들(협소화 및 재-성형화)은 워핑된 HOA 벡터의 더 높은 차수(Nout = 12)에 의해 가능하게 되었다. 이론적으로, 전방 방향에서의 메인 로브들의 레졸루션은 2.33의 팩터만큼 증가되었지만, 후방 방향에서의 레졸루션은 1/2.33의 팩터만큼 감소되었다. 혼합-차수 신호가 공간에 걸쳐 변하는 로컬 차수들에 따라 형성되었다. 워핑된 HOA 계수들을 합리적인 정확도로 표현하기 위해 2.33·Nin
Figure 112014010066158-pct00037
7의 최소 출력 차수가 요구된다고 가정할 수 있다. 하기 섹션 'HOA 차수들을 설정하는 법'의 본질적인 논의에서, 로컬 차수들이 더 상술된다.
특성들
상기 소개된 워핑 단계들은 다소 일반적이고 매우 유연하다. 적어도 다음의 기본적인 동작들이 달성될 수 있다: 임의의 축들 및/또는 평면들에 따른 회전 및/또는 미러링, 연속적인 워핑 함수로의 공간 왜곡, 및 특정 방향들의 가중(공간 빔포밍(spatial beamforming)).
다음의 하위 섹션들에 있어서, 본 발명의 공간 워핑의 다수의 특성들이 강조되고, 이들 상세들은 달성할 수 있는 것과 달성할 수 없는 것에 대한 가이던스를 제공한다. 또한, 일부 설계 룰들이 설명된다.
대체로, 다음의 파라미터들은, 원하는 워핑 특성들을 획득하기 위해 일부 자유도로 조정될 수 있다.
Figure 112014010066158-pct00038
워핑 함수(f(θ,ø));
Figure 112014010066158-pct00039
가중 함수(g(θ,ø));
Figure 112014010066158-pct00040
내부 차수(Nwarp);
Figure 112014010066158-pct00041
출력 차수(Nout);
Figure 112014010066158-pct00042
벡터(w)에 의한 출력 계수들의 윈도잉.
선형성
다중 단계 프로세싱에서의 기본적인 변환 단계들은 정의에 의해 선형이다. 중간에서 발생하는 새로운 위치들로의 사운드 소스들의 비선형 매핑은 인코딩 매트릭스의 정의에 영향을 주지만, 인코딩 매트릭스 자체는 다시 선형이다. 결과적으로, T와의 결합된 공간 워핑 동작 및 매트릭스 승산은 또한 선형 연산이며, 즉,
Figure 112014010066158-pct00043
이다.
이러한 특성은, 상이한 사운드 소스들로부터의 동시 기여를 포함하는 복잡한 사운드 필드 정보를 처리하게 하기 때문에 필수적이다.
공간-불변성(Space-Invariance)
정의에 의해(워핑 함수가 기울기 1 또는 -1로 완전히 선형이 아니면), 공간 워핑 변환은 공간-불변성이 아니다. 이는, 반구 상의 상이한 위치들에 원래 위치된 사운드 오브젝트들에 대해 동작이 상이하게 거동함을 의미한다. 수학 용어로, 이러한 특성은 워핑 함수(f(ø))의 비선형성의 결과이며, 즉, 적어도 일부의 임의의 각도들(α∈]0...2π[)에 대해
Figure 112014010066158-pct00044
이다.
가역성(Reversibility)
통상적으로, 변환 매트릭스(T)는 수학적 반전에 의해 간단히 역전될 수는 없다. 하나의 명백한 이유는 T가 통상 정방형이 아니기 때문이다. 더 낮은 차수 계수들로부터 더 높은 차수 계수들로 통상 확산되는 정보가 손실될 것이기 때문에 정방형 공간 워핑 매트릭스라도 가역이 아닐 것이고(섹션 'HOA 차수들을 설정하는 법'과 섹션 '실시예'에서의 예를 비교), 일 동작에 있어서 정보를 유리하는 것은 그 동작이 역전될 수 없음을 의미한다.
따라서, 공간 워핑 동작을 적어도 근사적으로 역전하기 위해 다른 방식이 발견되어야 한다. 역 워핑 변환(T rev)이,
Figure 112014010066158-pct00045
인 워핑 함수(f(·))의 역함수 frev(·)를 통해 설계될 수 있다.
HOA 차수들의 선택에 의존하여, 이러한 프로세싱은 역변환을 근사화한다.
HOA 차수들을 설정하는 법
공간 워핑 변환을 설계할 경우에 고려되어야 할 중요한 양태는 HOA 차수들이다. 통상적으로 입력 벡터들(A in)의 차수(Nin)가 외부 제약들에 의해 미리 정의되지만, 출력 벡터들(A out)의 차수(Nout) 및 실제 비선형 워핑 동작의 '내부' 차수(Nwarp) 양자는 다소 임의적으로 할당될 수 있다. 하지만, 그 양자의 차수들(Nin 및 Nwarp)은 하기 설명된 바와 같은 주의를 갖고 선택되어야 한다.
'내부' 차수(Nwarp):
'내부' 차수(Nwarp)는 상기 설명된 다중 단계 공간 워핑 프로세싱에 있어서 실제 디코딩, 워핑 및 인코딩 단계들의 정확도를 정의한다. 통상적으로, 차수(Nwarp)는 입력 차수(Nin) 및 출력 차수(Nout) 양자보다 상당히 커야 한다. 이러한 요건의 이유는, 워핑 동작이 일반적으로 비선형 동작이기 때문에 그렇지 않으면 왜곡들 및 아티팩트들이 생성될 것이기 때문이다.
이러한 사실을 설명하기 위해, 도 3은 도 2로부터의 예를 위해 사용된 바와 동일한 워핑 함수에 대한 전체 워핑 매트릭스의 예를 도시한다. 도 3a, 도 3c 및 도 3e는 각각 워핑 함수들(f1(ø), f2(ø) 및 f3(ø))을 도시한다. 도 3b, 도 3d 및 도 3f는 각각 워핑 매트릭스들(T 1(dB), T 2(dB) 및 T 3(dB))을 도시한다. 예시의 이유들로, 이들 워핑 매트릭스들은 특정 입력 차수(Nin) 또는 출력 차수(Nout)에 대한 워핑 매트릭스를 결정하기 위해 클리핑되지 않았다. 대신, 도 3b, 도 3d 및 도 3f 내의 중앙 박스의 점선들은 최종 결과적인, 즉, 클리핑된 변환 매트릭스의 타깃 사이즈(Nout x Nin)를 나타낸다. 이러한 방식으로, 워핑 매트릭스에 대한 비선형 왜곡들의 영향이 명확히 보일 수 있다. 예에 있어서, 타깃 차수들은 Nin = 30 및 Nout = 100으로 임의적으로 설정되었다.
기본적인 과제는 도 3b에서 볼 수 있으며, 공간 도메인에 있어서의 비선형 프로세싱으로 인해, 워핑 매트릭스 내 계수들이 주 대각선 주위로 확산되며, 매트릭스 중앙으로부터 멀어질수록 더 많아짐이 명확하다. 중앙으로부터 매우 먼 거리에서, 약 |y|≥90인 예 - y는 수직축임 - 에 있어서, 계수 확산은 전체 매트릭스의 경계들에 도달하며, 여기서, 이는 '바운스 오프(bounce off)'인 것처럼 보인다. 이는, 워핑 매트릭스의 대부분으로 확장하는 특별한 종류의 왜곡들을 생성한다. 실험 평가에 있어서, 왜곡 산물들이 매트릭스의 타깃 영역 내에 위치(도면에서 점선 박스에 의해 표기됨)되자마자 이들 왜곡들은 변환 성능을 현저하게 손상시킴이 관측되었다.
도 3b의 제1 예에 있어서, 프로세싱의 '내부' 차수가 출력 차수(Nout = 100)보다 상당히 더 높은 Nwarp = 200으로 선택되었기 때문에 모든 것이 잘 작동한다. 왜곡들의 영역은 점선 박스로 확장하지 않는다.
다른 시나리오는 도 3d에 도시된다. 내부 차수는 출력 차수와 동일하도록, 즉, Nwarp = Nout = 100이 되도록 특정되었다. 도면은, 왜곡들의 확장이 내부 차수와 선형적으로 스케일링함을 나타낸다. 결과는, 변환의 출력의 더 높은 차수 계수들이 왜곡 산물들에 의해 오염된다는 것이다. 그러한 스케일링 특성의 이점은 내부 차수(Nwarp)를 이에 따라 증가시킴으로써 이들 종류의 비선형 왜곡들을 회피하는 것이 가능할 것으로 사료된다는 점이다.
도 3f는 더 큰 계수(a = 0.7)를 갖는 더 공격적인 워핑 함수의 예를 도시한다. 더 공격적인 워핑 함수 때문에, 이제, 왜곡들은, Nwarp = 200인 내부 차수에 대해서도 타깃 매트릭스 영역으로 확장한다. 이러한 케이스에 있어서, 이전 패러그래프에서 도출된 바와 같이, 훨씬 더 많은 오버-프로비저닝(over-provisioning)에 대해 내부 차수는 더 증가되어야 한다. 이러한 워핑 함수에 대한 실험들은, 내부 차수를 예를 들어 N = 400으로 증가하는 것이 이들 비선형 왜곡들을 제거함을 나타낸다.
요약하면, 워핑 동작을 더 공격적으로 할수록, 내부 차수(Nwarp)는 더 높아져야 한다. 아직 최소 내부 차수의 공식적인 도출은 존재하지 않는다. 하지만, 의심스럽다면, '내부' 차수의 오버-프로비저닝은, 비선형 효과들이 전체 워핑 매트릭스의 사이즈에 따라 선형적으로 스케일링하기 때문에 유용하다. 대체로, '내부' 차수는 임의적으로 높을 수 있다. 특히, 단일 단계 변환 매트릭스가 도출되어야 한다면, 내부 차수는 최종 워핑 동작의 복잡도에 대해 어떠한 역할도 하지 않는다.
출력 차수(Nout):
워핑 변환의 출력 차수(Nout)를 특정하기 위해, 다음의 2개의 양태들이 고려되어야 한다.
- 일반적으로, 출력 차수는, 상이한 차수들의 계수들로 확산되는 모든 정보를 보유하기 위해 입력 차수(Nin)보다 더 커야 한다. 실제 요구된 사이즈는 워핑 함수의 특성들에도 의존한다. 경험으로 보아, '광대역' 워핑 함수(f(ø))가 적을수록, 요구된 출력 차수도 작아진다. 일부 케이스들에 있어서, 워핑 함수는 요구된 출력 차수(Nout)를 제한하기 위해 저역 통과 필터링될 수 있는 것처럼 보인다.
일 예가 도 3b에서 관측될 수 있다. 이러한 특정 워핑 함수에 있어서, 점선 박스에 의해 표시된 바와 같은 Nout = 100인 출력 차수는 정보 손실을 방지하기에 충분하다. 출력 차수가 현저하게, 예를 들어, Nout = 50으로 감소될 것이라면, 변환 매트릭스의 일부 비-제로 계수들은 제거될 것이고, 대응하는 정보 손실이 예상되게 된다.
- 일부 케이스들에 있어서, 출력 HOA 계수들은, 오직 제한된 차수만을 처리할 수 있는 프로세싱 또는 디바이스를 위해 사용될 것이다. 예를 들어, 타깃은 제한된 수의 스피커들을 갖는 확성기 셋업일 수도 있다. 그러한 어플리케이션들에 있어서, 출력 차수는 타깃 시스템의 능력들에 따라 특정되어야 한다.
Nout이 충분히 작으면, 워핑 변환은 공간 정보를 효과적으로 감소시킨다.
내부 차수(Nwarp)의 출력 차수(Nout)로의 감소는 단지 더 높은 차수 계수들의 드롭핑(dropping)에 의해 실시될 수 있다. 이는, 장방형 윈도우를 HOA 출력 벡터들에 적용하는 것에 대응한다. 대안적으로, 더 복잡한 대역폭 감소 기술들이 상기 서술된 M.A.Poletti 논문에서 또는 상기 서술된 J.Daniel 논문에서 논의된 것들과 유사하게 적용될 수 있다. 이에 의해, 장방형 윈도우잉을 사용한 것보다 훨씬 더 많은 정보가 손실될 가능성이 있지만, 더 우수한 지향성 패턴들이 달성될 수 있다.
본 발명은 오디오 프로세싱 체인의 상이한 부분들, 예를 들어, 레코딩, 후반 제작(post production), 전송, 재생에서 이용될 수 있다.

Claims (14)

  1. 오디오 장면의 2차원 또는 3차원 고차 앰비소닉스(Higher-Order Ambisonics; HOA) 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법으로서 - 디멘젼(O in)을 갖는 입력 벡터(A in)는 입력 신호의 푸리에 급수(Fourier series)의 계수들을 결정하고, 디멘젼(O out)을 갖는 출력 벡터(A out)는 대응하여 변경된 출력 신호의 푸리에 급수의 계수들을 결정함 - ,
    Figure 112019010575305-pct00067
    을 계산함으로써 모드 매트릭스(Ψ1)의 의사 역(pseudo inverse)을 이용하여 복수의 확성기의 원래 위치들에 대해 공간 도메인에 있어서의 입력 신호들(s in)로 입력 HOA 계수들의 상기 입력 벡터(A in)를 디코딩하는 단계; 및
    A out = Ψ2 s in을 계산함으로써 적응된 출력 HOA 계수들의 상기 출력 벡터(A out)로 상기 입력 신호들(s in)을 공간 도메인에서 워핑(warping) 및 인코딩하는 단계
    를 포함하고,
    모드 매트릭스(Ψ2)의 모드 벡터들은, 상기 복수의 확성기의 상기 원래 위치들의 각도들과 상기 복수의 확성기의 타깃 위치들의 각도들을 매핑하는 워핑 함수(f(ø))에 따라 모드 매트릭스(Ψ1)의 모드 벡터들에 대하여 변경되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  2. 제1항에 있어서,
    상기 공간 도메인의 입력 신호들(s in)은 상기 워핑 및 인코딩하는 단계 이전에 이득 함수(g(ø) 또는 g(θ,ø))에 의해 가중되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  3. 제2항에 있어서,
    HOA 계수들의 차수 또는 디멘젼이 상기 모드 매트릭스(Ψ2)의 차수 또는 디멘젼보다 낮은 경우, 상기 워핑 및 인코딩된 신호(Ψ2 s in)는, 상기 출력 벡터(A out)를 제공하기 위해서, 워핑된 계수들의 부분을 스트립핑하기 위해, 최고 차수들에 대해 제로 계수들을 포함하는 윈도우 벡터(w)를 이용하여 추가로 가중되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  4. 제3항에 있어서,
    상기 디코딩, 상기 가중, 및 상기 워핑 및 인코딩은 사이즈 O warp x O warp의 변환 매트릭스
    Figure 112018060235818-pct00058
    를 사용함으로써 공통적으로 수행되고, 여기서, diag(w)는 주 대각선의 컴포넌트들로서 상기 윈도우 벡터(w)의 값들을 갖는 대각선 매트릭스를 나타내고, diag(g)는 주 대각선의 컴포넌트들로서 상기 이득 함수(g(ø) 또는 g(θ,ø))의 값들을 갖는 대각선 매트릭스를 나타내는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  5. 제4항에 있어서,
    상기 변환 매트릭스(T)를 성형화(shape)하여 사이즈 O out x 0 in을 획득하기 위해, 상기 변환 매트릭스(T)의 대응하는 컬럼들 및/또는 라인들이 공간 워핑 연산(A out = TA in)을 수행하도록 제거되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서,
    2차원 앰비소닉스에 대해, 상기 이득 함수(g(ø))는
    Figure 112019010575305-pct00063
    이고, 3차원 앰비소닉스에 대해, 상기 이득 함수(g(θ,ø))는 ø 방향 및 θ 방향에 있어서
    Figure 112019010575305-pct00064
    이고, 여기서, ø는 방위각이고, θ는 경사각이며, fθ(θ)는 3차원 앰비소닉스에 대한 워핑 함수이고, øε는 작은 방위각인, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서,
    가상 확성기들의 개수 또는 디멘젼(O warp)이 HOA 계수들의 개수 또는 디멘젼(0 in) 이상인 경우, 상기 디코딩하는 단계 이전에, 상기 입력 벡터(A in)의 차수 또는 디멘젼은 더 높은 차수들에 대해 제로 계수들을 부가함으로써 확장되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법.
  8. 오디오 장면의 2차원 또는 3차원 고차 앰비소닉스(HOA) 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치로서 - 디멘젼(O in)을 갖는 입력 벡터(A in)는 입력 신호의 푸리에 급수의 계수들을 결정하고, 디멘젼(O out)을 갖는 출력 벡터(A out)는 대응하여 변경된 출력 신호의 푸리에 급수의 계수들을 결정함 - ,
    Figure 112019010575305-pct00068
    을 계산함으로써 모드 매트릭스(Ψ1)의 의사 역을 이용하여 복수의 확성기의 원래 위치들에 대해 공간 도메인에 있어서의 입력 신호들(s in)로 입력 HOA 계수들의 상기 입력 벡터(A in)를 디코딩하는 디코더; 및
    A out = Ψ2 s in을 계산함으로써 적응된 출력 HOA 계수들의 상기 출력 벡터(A out)로 상기 입력 신호들(s in)을 공간 도메인에서 워핑 및 인코딩하는 워핑 및 인코딩 유닛
    을 포함하고,
    모드 매트릭스(Ψ2)의 모드 벡터들은, 상기 복수의 확성기의 상기 원래 위치들의 각도들과 상기 복수의 확성기의 타깃 위치들의 각도들을 매핑하는 워핑 함수(f(ø))에 따라 모드 매트릭스(Ψ1)의 모드 벡터들에 대해 변경되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
  9. 제8항에 있어서,
    상기 워핑 및 인코딩 이전에 이득 함수(g(ø) 또는 g(θ,ø))에 의해 상기 공간 도메인의 입력 신호들(s in)을 가중하는 가중 유닛을 포함하는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
  10. 제9항에 있어서,
    가상 확성기들의 개수 또는 디멘젼(O warp)이 HOA 계수들의 개수 또는 디멘젼(0 in) 이상인 경우, 상기 디코딩 이전에, 상기 입력 벡터(A in)의 차수 또는 디멘젼을 더 높은 차수들에 대해 제로 계수들을 부가함으로써 확장하는 확장 유닛을 포함하는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
  11. 제10항에 있어서,
    최고 차수들에 대해 제로 계수들을 포함하는 윈도우 벡터(w)를 이용하여 상기 워핑 및 인코딩된 신호(Ψ2 s in)를 가중하고, 상기 출력 벡터(A out)를 제공하기 위해서, 워핑된 계수들의 부분을 스트립핑하는, 가중 유닛을 포함하는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
  12. 제11항에 있어서,
    사이즈 O warp x O warp의 변환 매트릭스
    Figure 112018060235818-pct00062
    를 사용함으로써 상기 디코딩, 상기 가중, 및 상기 워핑 및 인코딩을 공통적으로 수행하기 위한 유닛을 포함하고, 여기서, diag(w)는 주 대각선의 컴포넌트들로서 상기 윈도우 벡터(w)의 값들을 갖는 대각선 매트릭스를 나타내고, diag(g)는 주 대각선의 컴포넌트들로서 상기 이득 함수(g(ø) 또는 g(θ,ø))의 값들을 갖는 대각선 매트릭스를 나타내는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
  13. 제12항에 있어서,
    상기 변환 매트릭스(T)를 성형화하여 사이즈 O out x 0 in을 획득하기 위해, 상기 디코딩, 상기 가중, 및 상기 워핑 및 인코딩을 공통적으로 수행하는 상기 유닛에서, 상기 변환 매트릭스(T)의 대응하는 컬럼들 및/또는 라인들이 공간 워핑 연산(A out = TA in)을 수행하도록 제거되는, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
  14. 제13항에 있어서,
    2차원 앰비소닉스에 대해, 상기 이득 함수(g(ø))는
    Figure 112019010575305-pct00065
    이고, 3차원 앰비소닉스에 대해, 상기 이득 함수(g(θ,ø))는 ø 방향 및 θ 방향에 있어서
    Figure 112019010575305-pct00066
    이고, 여기서, ø는 방위각이고, θ는 경사각이고, fθ(θ)는 3차원 앰비소닉스에 대한 워핑 함수이며, øε는 작은 방위각인, 사운드 오브젝트들의 상대적인 위치들을 변경하는 장치.
KR1020147002760A 2011-06-30 2012-06-15 고차 앰비소닉스 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치 KR102012988B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11305845A EP2541547A1 (en) 2011-06-30 2011-06-30 Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP11305845.7 2011-06-30
PCT/EP2012/061477 WO2013000740A1 (en) 2011-06-30 2012-06-15 Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation

Publications (2)

Publication Number Publication Date
KR20140051927A KR20140051927A (ko) 2014-05-02
KR102012988B1 true KR102012988B1 (ko) 2019-08-21

Family

ID=46354265

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147002760A KR102012988B1 (ko) 2011-06-30 2012-06-15 고차 앰비소닉스 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치

Country Status (11)

Country Link
US (1) US9338574B2 (ko)
EP (2) EP2541547A1 (ko)
JP (1) JP5921678B2 (ko)
KR (1) KR102012988B1 (ko)
CN (1) CN103635964B (ko)
AU (1) AU2012278094B2 (ko)
BR (1) BR112013032878B1 (ko)
DK (1) DK2727109T3 (ko)
HU (1) HUE051678T2 (ko)
TW (1) TWI526088B (ko)
WO (1) WO2013000740A1 (ko)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2637427A1 (en) 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
KR102031826B1 (ko) * 2013-01-16 2019-10-15 돌비 인터네셔널 에이비 Hoa 라우드니스 레벨을 측정하기 위한 방법 및 hoa 라우드니스 레벨을 측정하기 위한 장치
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9883310B2 (en) 2013-02-08 2018-01-30 Qualcomm Incorporated Obtaining symmetry information for higher order ambisonic audio renderers
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9959875B2 (en) 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
BR112015030103B1 (pt) * 2013-05-29 2021-12-28 Qualcomm Incorporated Compressão de representações decomposta de campo sonoro
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
US9712939B2 (en) 2013-07-30 2017-07-18 Dolby Laboratories Licensing Corporation Panning of audio objects to arbitrary speaker layouts
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
WO2015073454A2 (en) 2013-11-14 2015-05-21 Dolby Laboratories Licensing Corporation Screen-relative rendering of audio and encoding and decoding of audio for such rendering
EP4089675A1 (en) * 2014-01-08 2022-11-16 Dolby International AB Method and apparatus for improving the coding of side information required for coding a higher order ambisonics representation of a sound field
US9922656B2 (en) * 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
KR102201726B1 (ko) * 2014-03-21 2021-01-12 돌비 인터네셔널 에이비 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
CN109087653B (zh) * 2014-03-24 2023-09-15 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN106105270A (zh) * 2014-03-25 2016-11-09 英迪股份有限公司 用于处理音频信号的系统和方法
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
KR20240047489A (ko) * 2014-06-27 2024-04-12 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법
CN107077852B (zh) * 2014-06-27 2020-12-04 杜比国际公司 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示
CN106471822B (zh) * 2014-06-27 2019-10-25 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US9940937B2 (en) 2014-10-10 2018-04-10 Qualcomm Incorporated Screen related adaptation of HOA content
MX2017006581A (es) * 2014-11-28 2017-09-01 Sony Corp Dispositivo de transmision, metodo de transmision, dispositivo de recepcion, y metodo de recepcion.
WO2016182184A1 (ko) * 2015-05-08 2016-11-17 삼성전자 주식회사 입체 음향 재생 방법 및 장치
US10070094B2 (en) 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
US20200267490A1 (en) * 2016-01-04 2020-08-20 Harman Becker Automotive Systems Gmbh Sound wave field generation
EP3209036A1 (en) 2016-02-19 2017-08-23 Thomson Licensing Method, computer readable storage medium, and apparatus for determining a target sound scene at a target position from two or more source sound scenes
US10210660B2 (en) * 2016-04-06 2019-02-19 Facebook, Inc. Removing occlusion in camera views
EP3513405B1 (en) * 2016-09-14 2023-07-19 Magic Leap, Inc. Virtual reality, augmented reality, and mixed reality systems with spatialized audio
MC200186B1 (fr) * 2016-09-30 2017-10-18 Coronal Encoding Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel
US10721578B2 (en) 2017-01-06 2020-07-21 Microsoft Technology Licensing, Llc Spatial audio warp compensator
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
SG11202000330XA (en) 2017-07-14 2020-02-27 Fraunhofer Ges Forschung Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description
SG11202000285QA (en) 2017-07-14 2020-02-27 Fraunhofer Ges Forschung Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010252220A (ja) 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2073556B (en) 1980-02-23 1984-02-22 Nat Res Dev Sound reproduction systems
WO1998058523A1 (en) 1997-06-17 1998-12-23 British Telecommunications Public Limited Company Reproduction of spatialised audio
JP2001084000A (ja) * 1999-09-08 2001-03-30 Roland Corp 波形再生装置
CN1589127A (zh) * 2001-11-21 2005-03-02 爱利富卡姆公司 从电信号中去除噪声的方法和装置
FR2836571B1 (fr) 2002-02-28 2004-07-09 Remy Henri Denis Bruno Procede et dispositif de pilotage d'un ensemble de restitution d'un champ acoustique
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
CA2511521C (en) 2002-12-30 2012-02-07 Angiotech International Ag Drug delivery from rapid gelling polymer composition
CN1226718C (zh) * 2003-03-04 2005-11-09 无敌科技股份有限公司 语音速度调整方法
GB2410164A (en) * 2004-01-16 2005-07-20 Anthony John Andrews Sound feature positioner
EP1779385B1 (en) 2004-07-09 2010-09-22 Electronics and Telecommunications Research Institute Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
WO2008080012A1 (en) 2006-12-21 2008-07-03 Cv Therapeutics, Inc. Reduction of cardiovascular symptoms
EP2112653A4 (en) * 2007-05-24 2013-09-11 Panasonic Corp AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT
GB2476747B (en) * 2009-02-04 2011-12-21 Richard Furse Sound system
JP5773540B2 (ja) * 2009-10-07 2015-09-02 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102823277B (zh) 2010-03-26 2015-07-15 汤姆森特许公司 解码用于音频回放的音频声场表示的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010252220A (ja) 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム

Also Published As

Publication number Publication date
KR20140051927A (ko) 2014-05-02
BR112013032878A2 (pt) 2017-01-24
US9338574B2 (en) 2016-05-10
HUE051678T2 (hu) 2021-03-29
JP2014523172A (ja) 2014-09-08
CN103635964B (zh) 2016-05-04
EP2727109A1 (en) 2014-05-07
EP2541547A1 (en) 2013-01-02
BR112013032878B1 (pt) 2021-04-13
EP2727109B1 (en) 2020-08-05
US20140133660A1 (en) 2014-05-15
AU2012278094A1 (en) 2014-01-16
AU2012278094B2 (en) 2017-07-27
WO2013000740A1 (en) 2013-01-03
TW201301911A (zh) 2013-01-01
CN103635964A (zh) 2014-03-12
JP5921678B2 (ja) 2016-05-24
TWI526088B (zh) 2016-03-11
DK2727109T3 (da) 2020-08-31

Similar Documents

Publication Publication Date Title
KR102012988B1 (ko) 고차 앰비소닉스 표현 내에 포함된 사운드 오브젝트들의 상대적인 위치들을 변경하는 방법 및 장치
JP7368563B2 (ja) オーディオ再生のためのオーディオ音場表現をレンダリングするための方法および装置
CN110035376B (zh) 使用相位响应特征来双耳渲染的音频信号处理方法和装置
McCormack et al. SPARTA & COMPASS: Real-time implementations of linear and parametric spatial audio reproduction and processing methods
KR102481338B1 (ko) 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치
Davis et al. High order spatial audio capture and its binaural head-tracked playback over headphones with HRTF cues
US10674301B2 (en) Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
EP2609759A1 (en) Method and device for enhanced sound field reproduction of spatially encoded audio input signals
JP7378575B2 (ja) 空間変換領域における音場表現を処理するための装置、方法、またはコンピュータプログラム
EP3329486B1 (en) Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation
Kaneko et al. Multiple scattering ambisonics: Three-dimensional sound field estimation using interacting spheres
Pulkki et al. Spatial sound scene synthesis and manipulation for virtual reality and audio effects

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant