KR101768260B1

KR101768260B1 - 스피커를 통한 오디오에 대한 스펙트럼적으로 채색되지 않은 최적의 크로스토크 제거

Info

Publication number: KR101768260B1
Application number: KR1020137007607A
Authority: KR
Inventors: 애드가 와이 초우에리
Original assignee: 더 트러스티즈 오브 프린스턴 유니버시티
Priority date: 2010-09-03
Filing date: 2011-09-01
Publication date: 2017-08-14
Also published as: CN103222187B; CN103222187A; US20130163766A1; JP2013539289A; JP5993373B2; WO2012036912A1; US9167344B2; KR20130102566A

Abstract

크로스토크 제거(XTC) 필터를 설계 및/또는 생성하기 위해 분석적으로 도출되거나 실험적으로 측정된 시스템 전달 행렬을 역변환하는 데 사용되는 주파수 의존적 정규화 파라미터(FDRP)를 계산하는 방법 및 시스템은 스피커에서 평탄한 진폭 대 주파수 응답을 가져오는 FDRP를 계산하는 것, 따라서 XTC를 위상 영역에서만 실시하고 XTC 필터로부터 가청 스펙트럼 채색 및 동적 범위 손실의 단점을 없애는 것에 의존한다. 이 방법 및 시스템이 임의의 효과적인 최적화 기법에서 사용될 때, 이 방법 및 시스템에 의해, 오디오 대역의 임의의 원하는 부분에 걸쳐 최적의 XTC 레벨을 산출하고, 재생 하드웨어 및/또는 스피커에 내재하는 스펙트럼 채색 외에는 처리된 사운드에 어떤 스펙트럼 채색도 부과하지 않으며, 어떤 동적 범위 손실도 야기하지 않는(또는 임의적으로 낮은 동적 범위 손실을 야기하는) XTC 필터가 얻어진다.

Description

스피커를 통한 오디오에 대한 스펙트럼적으로 채색되지 않은 최적의 크로스토크 제거{SPECTRALLY UNCOLORED OPTIMAL CROSSTALK CANCELLATION FOR AUDIO THROUGH LOUDSPEAKERS}

관련 출원의 상호 참조

본 출원은 2010년 9월 3일자로 출원된, 발명의 명칭이 "2개의 스피커에 의한 바이노럴 오디오에 대한 최적의 크로스토크 제거(OPTIMAL CROSSTALK CANCELLATION FOR BINAURAL AUDIO WITH TWO LOUDSPEAKERS)"인 미국 가특허 출원 제61/379,831호를 기초로 우선권을 주장하며, 상기 가특허 출원 내용은 참조 문헌으로서 본 명세서에 포함된다.

BAL(Binaural audio with loudspeakers, 스피커에 의한 바이노럴 오디오)[트랜스오럴화(transauralization)라고도 함]은 스테레오 신호의 동측 채널(ipsilateral channel)에만 녹음되어 있는 음압 신호를 듣는 사람의 각각의 외이도의 입구에서 재생하기 위한 것이다. 즉, 좌 스테레오 채널의 사운드 신호만이 좌측 귀에서 재생되고, 우 스테레오 채널의 사운드 신호만이 우측 귀에서 재생된다. 예를 들어, 음원 신호(source signal)가 듣는 사람의 HRTF(head-related transfer function, 머리 관련 전달 함수)에 의해 인코딩되어 있거나 적당한 ITD(interaural time difference, 두 귀 사이의 시간차) 및 ILD(interaural level difference, 두 귀 사이의 레벨차) 단서를 포함하는 경우, 스테레오 신호의 각각의 채널 상의 신호를 동측 귀(ipsilateral ear)에 그리고 그 귀에만 전달하는 것은 이상적으로는 귀-두뇌 시스템이 녹음된 음장의 정확한 3차원(3-D) 재생을 듣는 데 필요한 단서를 받는 것을 보장해준다.

그렇지만, 스피커를 통한 바이노럴 오디오 재생의 의도하지 않은 결과가 크로스토크이다. 좌측 귀(우측 귀)가 우 스피커(좌 스피커)로부터 나오는 우(좌) 오디오 채널로부터 사운드를 들을 때 크로스토크가 일어난다. 환언하면, 스테레오 채널들 중 하나의 채널에서의 사운드가 듣는 사람의 반측 귀(contralateral ear)에 들릴 때 크로스토크가 일어난다.

듣는 사람이 녹음에 삽입되어 있는 음장의 바이노럴 단서를 제대로 또는 완전히 이해할 수 없도록, 크로스토크는 HRTF 정보 및 ITD 또는 ILD 단서를 오염시킨다. 따라서, BAL의 목표에 접근하기 위해서는 이러한 의도하지 않은 크로스토크의 효과적인 제거(즉, 크로스토크 제거 또는 간단히 XTC)를 필요로 한다.

투(two) 스피커 시스템에 대한 어떤 레벨의 크로스토크 제거(XTC)를 실시하는 다양한 기법이 있지만, 이들 모두가 다음과 같은 단점들 중 하나 이상의 단점을 가진다:

D1: 듣는 사람이 의도된 스위트 스폿(sweet spot)에 앉아 있는 경우에도, 듣는 사람에 들리는 사운드에 대한 심각한 스펙트럼 채색(spectral coloration).

D2: 오디오 대역의 제한된 주파수 범위에서만 유용한 XTC 레벨에 도달된다.

D3: (왜곡 및/또는 클리핑을 회피하면서) 사운드가 XTC 필터 또는 프로세서를 통해 처리될 때의 심각한 동적 범위 손실.

상기 단점들은 XTC 문제점의 가장 기본적인 수식화를 사용하여 XTC를 분석함으로써 - 즉, 스피커로부터 듣는 사람의 귀까지의 사운드 전파를 기술하는 (이하에서 보여지고 논의될 것인) 시스템 전달 행렬(system transfer matrix)의 역을 살펴봄으로써 - 알 수 있다.

시스템 전달 행렬의 역이 덜 잘 거동되게 하기 위해 XTC 필터 설계에서 흔히 사용되는 상수 파라미터(비주파수 의존적) 정규화의 기법이 단점 D3의 일부를 완화시킬 수 있지만, 이는 본질적으로 그 자신의 스펙트럼 아티팩트를 유입시키고[구체적으로는, 역변환된 전달 행렬(inverted transfer matrix)에서의 스펙트럼 피크의 진폭을 감소시키는 것에 대한 대가로, 상수 파라미터 정규화는 스피커에서 높은 주파수에서는 바람직하지 않은 협대역 아티팩트를 그리고 낮은 주파수에서는 롤오프(rolloff)를 발생함], 다른 2개의 단점(D1 및 D2)을 완화시키기 위해 거의 아무것도 하지 않는다.

종래 기술의 주파수 의존적 정규화는, 효과적인 최적화 방식과 결합될 때에도, 단점 D1, D2 및 D3를 제거하는 데 충분하지 않다.

(정규화를 사용하거나 사용하지 않는) 시스템 전달 행렬 역변환(system transfer matrix inversion)에 기초한 이전의 XTC 필터 설계 방법은 (이하에서 설명하는 바와 같이) 스피커에서 평탄하지 않은 진폭 대 주파수 응답을 강요함으로써 듣는 사람의 귀에서 평탄한 진폭 대 주파수 응답을 유지하려고 하며, 이는 처리된 사운드의 동적 범위의 손실을 야기하고, 이하에서 설명하게 되는 이유로 인해, 듣는 사람이 의도된 스위트 스폿에 앉아 있는 경우에도, 듣는 사람에 들리는 사운드의 스펙트럼 채색을 유발한다.

따라서, 이전의 방법이 재생 하드웨어 및 스피커의 진폭 대 주파수 응답에서의 비이상적 특성(non-ideality)을 본질적으로 보정할 수 있는 XTC 필터를 설계하는 데 유용하지만, 단점 D1, D2 및 D3 모두를 해결하지는 않는다.

크로스토크 제거(XTC) 필터 설계를 위해 분석적으로 도출되거나 실험적으로 측정된 시스템 전달 행렬을 역변환하는 데 사용되는 FDRP(frequency-dependent regularization parameter, 주파수 의존적 정규화 파라미터)를 계산하는 방법 및 시스템이 기술되어 있다. 이 방법은 (종래 기술의 방법에서 본질적으로 행해지는 것과 같이, 듣는 사람의 귀에서의 평탄한 진폭 대 주파수 응답과는 달리) 스피커에서의 평탄한 진폭 대 주파수 응답을 가져오는 FDRP를 계산하는 것에 의존하며, 따라서 XTC가 위상 영역에서만 실시되게 하고 XTC 필터로부터 가청 스펙트럼 채색(audible spectral coloration) 및 동적 범위 손실(dynamic range loss)의 단점을 없애준다. 이 방법이 임의의 효과적인 최적화 방식에서 사용될 때, 이 방법에 의해, 오디오 대역의 임의의 원하는 부분에 걸쳐 최적의 XTC 레벨을 산출하고, 재생 하드웨어 및/또는 스피커에 내재하는 스펙트럼 채색 외에는 처리된 사운드에 어떤 스펙트럼 채색도 부과하지 않으며, 어떤 동적 범위 손실도 야기하지 않는 XTC 필터가 얻어진다. 이 방법으로 설계되고 이 시스템에서 사용되는 XTC 필터는 최적일 뿐만 아니라, 단점 D1, D2 및 D3가 없는 것으로 인해, 스피커를 통해 바이노럴 또는 스테레오 오디오의 아주 자연스럽고 스펙트럼적으로 투명한(spectrally transparent) 3D 오디오 재생을 가능하게 해준다. 이 방법 및 시스템은 재생 하드웨어의 스펙트럼 특성을 보정하려고 시도하지 않으며, 따라서 스펙트럼 보정을 위한 부가의 신호 처리의 도움 없이 원하는 스펙트럼 충실도 레벨(spectral fidelity level)을 만족시키도록 설계되어 있는 오디오 재생 하드웨어 및 스피커에서 사용하기에 가장 적합하다.

이하의 상세한 설명을 첨부 도면을 고려하여 읽어보면 본 발명의 보다 상세한 이해가 얻어질 수 있다.
도 1은 듣는 사람 및 2-음원 모델(two-source model)을 나타낸 도면.
도 2는 스피커에서의 완벽한 XTC 필터의 주파수 응답의 그래프.
도 3은 스피커에서의 엔벨로프 스펙트럼(envelope spectrum)에 대한 정규화의 효과를 나타낸 그래프.
도 4는 크로스토크 제거 스펙트럼에 대한 정규화의 효과를 나타낸 도면.
도 5는 스피커에서의 엔벨로프 스펙트럼을 나타낸 그래프.
도 6은 본 발명의 방법의 플로우차트.
도 7은 시간 영역에서 전달 함수를 나타낸 4개의 [윈도잉된(windowed)] 측정된 임펄스 응답(IP)을 나타낸 도면.
도 8은 완벽한 XTC 필터와 연관되어 있는 측정된 스펙트럼을 나타낸 그래프.
도 9는 본 발명의 XTC 필터에 대한 측정된 스펙트럼을 나타낸 그래프.

본 발명의 방법 및 시스템의 이점을 설명하기 위해, 이상화된 상황에서의 기본적인 XTC 문제의 분석적 수식화가 기술될 것이고, 모든 XTC 필터에 본질적인 가청 스펙트럼 채색의 심각한 문제를 나타내는 벤치마크로서 역할하게 될 "완벽한 XTC 필터"가 정의될 것이다.

이하의 설명에서, 명확함을 위해 그리고 분석적 고찰을 가능하게 해주기 위해, 자유 공간에 있는 2개의 점 음원(point source)(이상화된 스피커)(12, 14)(사운드 반사 없음) 및 이상화된 듣는 사람(20)의 귀의 위치에 대응하는 2개의 듣는 지점(16, 18)(HRTF 없음)으로 이루어진 이상화된 상황이 사용될 것이다. 그렇지만, 본 발명의 설명에 뒤이어서 주어지는 예에서, 모형 머리(dummy head)의 외이도 입구에서 측정되는 실제 방에 있는 실제 스피커의 임펄스 응답에 대응하는 실제 데이터가 사용될 것이다.

기본적인 XTC 문제의 수식화

주파수 영역에서, 자유 음장(free field)(듣는 사람의 머리 및 귓바퀴 또는 임의의 다른 물리적 객체로부터의 회절 또는 반사가 없음)에서 사운드 전파가 일어나고 스피커가 점 음원처럼 방사하는 이상화 가정 하에서 주파수 ω의 음파를 방사하는 점 음원(모노폴)으로부터 거리 r에 위치하는 자유 음장 지점(free-field point)에서의 공기압(air pressure)은 다음과 같이 주어지고:

여기서

는 공기 밀도이고,

은 파수이며, λ는 파장이고, c_s는 음속(340.3 m/s)이며, q는 음원 세기(source strength)(단위: 단위 시간당 볼륨)이다. 음원의 중심으로부터의 질량 흐름률(mass flow rate) V를 다음과 같이 정의하면,

(이는

의 시간 도함수임), 도 1에 도시된 대칭적 2-음원의 기하학적 구조에서, 앞서 언급한 가정 하에서의 2개의 음원(12, 14)으로 인한 공기압은 다음과 같이 증가된다.

이와 유사하게, 듣는 사람(20)의 우측 귀(18)에서, 수학식 2는 감지된 압력이다:

여기서, l₁ 및 l₂는, 각각, 도 1에 도시된 바와 같이, 2개의 음원(12, 14) 중 임의의 것과 동측 귀 및 반측 귀 사이의 경로 길이이다.

본 명세서 전체에 걸쳐, 대문자는 주파수 변수를 나타내고, 소문자는 시간 영역 변수를 나타내며, 대문자 굵은체는 행렬을 나타내고, 소문자 굵은체는 벡터를 나타내며,

을 각각 경로 길이 차 및 경로 길이 비로서 정의한다.

도 1의 기하학적 구조에서의 반측 거리(contralateral distance)가 동측 거리(ipsilateral distance)보다 크기 때문에,

이다. 게다가, 도 1의 기하학적 구조로부터, 2개의 거리가 다음과 같이 표현될 수 있고:

여기서

는 외이도의 입구들 사이의 유효 거리이고, l은 어느 한 음원과 듣는 사람의 두 귀 사이의 중간 지점(interaural mid-point) 사이의 거리이다. 도 1에 정의된 바와 같이,

은 스피커 간격(loudspeaker span)이다.

의 경우, 많은 스피커-기반 청취 구성에서와 같이,

이 얻어진다는 것에 유의한다. 다른 중요한 파라미터는 음파가 경로 길이 차

를 지나가는 데 걸리는 시간으로서 정의되는 시간 지연, 즉

이다.

수학식 1 및 수학식 2를 사용하여, 듣는 사람의 좌측 귀(16)에서의 수신 신호 및 듣는 사람의 우측 귀(18)에서의 수신 신호는 벡터 형태로 다음과 같이 쓰여질 수 있고:

여기서,

은, 시간 영역에서, 수신 신호의 형상에 영향을 미치지 않는 전송 지연(을 상수 l₁로 나눈 것)이다. 좌 채널 V_L 및 우 채널 V_R을 포함하는 스피커에서의 음원 벡터는 벡터 형태로

으로서 쓰여진다. v는 변환

를 사용하여

으로 표시된 "녹음된" 신호의 2개의 채널로부터 획득될 수 있다.

여기서,

은 XTC에 대해 구한 2x2 필터 또는 변환 행렬이다. 따라서, 수학식 7로부터, 하기의 결과가 획득될 수 있고,

여기서

은 귀에서의 압력의 벡터이고, C는 시스템의 전달 행렬이고,

이는 도 1에 도시된 기하학적 구조의 대칭성으로 인해 대칭적이다.

요약하면, 신호 d로부터 필터 H를 통해 음원 변수(source variable) v로, 그리고 파 전파를 통해 스피커 음원으로부터 듣는 사람의 귀에서의 압력 p로의 변환은 다음과 같이 쓰여질 수 있고,

여기서, 성능 행렬(performance matrix) R이 다음가 같이 정의된다.

R의 대각 요소(diagonal element)(즉,

및

)는 녹음된 사운드 신호의 귀로의 동측 전송(ipsilateral transmission)을 나타내고, 비대각 요소(off-diagonal element)(즉,

및

)는 원하지 않는 반측 전송(contralateral transmission), 즉, 크로스토크를 나타낸다.

성능 척도

XTC 필터의 스펙트럼 채색 및 성능을 판단하는 기준이 되는 일련의 척도에 대해 이제부터 기술할 것이다. 동측 귀에서 들리는 것과 같은, 시스템의 2개의 입력 중 하나(좌측 또는 우측)에만 피드되는 신호의 (인자

에 대한) 진폭 스펙트럼은 다음과 같고:

여기서 첨자 "si" 및 ||는 (입력 신호에 대한) "측면 이미지(side image)" 및 "동측 귀"를 각각 나타내는데, 그 이유는

가, 정의된 바와 같이, 입력이 한쪽 측면으로 패닝되는 것으로부터 얻어지게 될 측면 이미지에 대한 (동측 귀에서의) 주파수 응답이기 때문이다. 이와 유사하게, 입력 신호에 대한 반측 귀에서(첨자 X), 측면 이미지 주파수 응답은 다음과 같다:

동일한 신호가 좌 입력과 우 입력 사이에서 똑같이 분할될 때 어느 한 귀에서의 시스템의 주파수 응답은 또 하나의 스펙트럼 채색 척도이다:

여기서, 첨자 "ci"는 "중앙 이미지(center image)"를 나타내는데, 그 이유는 E_ci가, 정의된 바와 같이, 입력이 중앙으로 패닝되는 것으로부터 얻어지게 될 중앙 이미지에 대한 (어느 한 귀에서의) 주파수 응답이기 때문이다.

또한, S로 표시되고 필터 행렬 H의 요소들로부터 획득될 수 있는 음원(즉, 스피커)에서 측정될 주파수 응답도 중요하다:

이들은 상기 진폭 스펙트럼에서 사용된 동일한 첨자 방식을 사용하여 주어진다("||" 및 "X"는, 각각, 입력 신호에 대해 동측 및 반측인 스피커를 가리킴). 상기 척도들의 의미의 직관적인 해석은 단일 입력으로부터 시스템에의 양쪽 입력으로 패닝되는 신호에 의해 귀에서는 E_si로부터 E_ci로 가고 스피커에서는 S_si로부터 S_ci로 가는 주파수 응답이 얻어질 거라는 것이다.

2개의 다른 스펙트럼 채색 척도는 시스템에의 정위상(in-phase) 입력 및 역위상(out-of-phase) 입력에 대한 시스템의 주파수 응답이다. 이들 2개의 응답은 다음과 같이 주어진다:

첨자 i 및 o는, 각각, 정위상 응답 및 역위상 응답을 나타낸다. 정의된 바와 같이, S_i가 S_ci의 2배(즉, 6 dB 높음)인데, 그 이유는 후자가 중앙으로 패닝된 진폭 1의 신호를 나타내는 반면, 전자가 시스템의 2개의 입력에 정위상으로 피드되는 진폭 1의 2개의 신호를 나타내기 때문이라는 것에 유의한다.

실제 신호가 상이한 위상 관계를 가지는 다양한 성분을 포함할 수 있기 때문에,

와

를, 스피커에서 예상될 수 있는 최대 진폭을 나타내는 엔벨로프 스펙트럼( envelope spectrum )이고 다음과 같이 주어지는 단일 척도

로 결합시키는 것이 유용하다:

가 H의 2-놈(2-norm)인

과 동등하고 S_i 및 S_o가 H의 2개의 특이값이라는 것에 유의하는 것이 중요하다.

마지막으로, 다양한 필터의 XTC 성능의 평가 및 비교를 가능하게 해주는 중요한 척도는 크로스토크 제거 스펙트럼(crosstalk cancellation spectrum)인

이다:

이는 반측 귀에서의 진폭 스펙트럼에 대한 동측 귀에서의 진폭 스펙트럼의 비이고, 따라서, 크로스토크 제거 스펙트럼

의 값이 클수록, 크로스토크 제거 필터가 더 효과적이다. 상기 정의는 총 8개의 척도

[모두가 주파수의 실함수(real function)임]를 제공하고, 이에 의해 XTC 필터의 스펙트럼 채색 및 XTC 성능을 평가하고 비교한다.

벤치마크: 완벽한 크로스토크 제거

완벽한 크로스토크 제거(P-XTC) 필터는, 이론적으로, 모든 주파수에 대해 듣는 사람의 귀에서 무한한 크로스토크 제거를 산출하는 것으로서 정의될 수 있다. 크로스토크 제거는 2개의 귀 각각에서의 수신 신호가 동측 신호로부터만 얻어져야 할 것을 필요로 한다. 따라서, 크로스토크의 완벽한 제거를 달성하기 위해서는, 수학식 13이 R = CH = I일 것을 필요로 하고, 여기서 I는 단위 행렬(unity matrix)[항등 행렬(identity matrix)]이고, 따라서, 수학식 14에서의 R의 정의에 따라, P-XTC 필터는 수학식 12에 표현된 시스템 전달 행렬의 역행렬이고, 정확히 다음과 같이 표현될 수 있으며:

여기서 윗첨자

는 완벽한 XTC(perfect XTC)를 나타낸다. 이 필터에 대해, 앞서 정의한 8개의 척도는 다음과 같이 된다:

완벽한 XTC 필터

는 (상수

및

로 입증되는 바와 같이) 귀에서의 평탄한 주파수 응답을 제공하고

으로 입증되는 바와 같이 크로스토크를 제거하는 데 효과적이면서, 1의 진폭 스펙트럼

으로 입증되는 바와 같이 동측 신호(ipsilateral signal)를 보존한다. 그렇지만, 스펙트럼은, 이하에서 알게 될 것인 바와 같이, 이상적인 세계에서만(즉, 모델의 이상화된 가정 하에서) 귀에 들리지 않는, 심각한 스펙트럼 채색을 구성하는 음원에서의 주파수 변동 거동(frequency varying behavior)(

및

)을 가진다.

스피커에서의 스펙트럼 채색의 정도가 스피커에서의 완벽한 XTC 필터의 주파수 응답을 나타내는 도 2에 그래프로 나타내어져 있다: 진폭 엔벨로프(곡선 22), 측면 이미지(곡선 24), 및 중앙 이미지(곡선 26). 점선 수평선은 엔벨로프 상한(envelope ceiling) - 이 경우(g=.985)에, 36.5 dB임 - 을 나타낸다. 무차원 주파수(non-dimensional frequency)

는 하부 축에 주어져 있고, 상부 축에 나타내어져 있는 대응하는 주파수(단위: Hz)는 44.1 kHz의 레드북 CD 샘플링 레이트에서의

개 샘플의 특정의(전형적인) 경우를 나타낸 것이다. (이는 예를 들어,

및

인 구성의 경우이다).

귀에서 XTC를 실시하면서 그 위치에서의 상쇄 간섭을 보상하기 위해 스피커에서의 신호의 진폭이 부스트되어야만 하는 주파수에서

및

스펙트럼에서의 피크가 도 2에 도시된 바와 같이 발생한다. 이와 유사하게, 보강 간섭으로 인해 진폭이 감쇄되어야만 할 때 스펙트럼에서의 최소값이 발생한다.

다양한 스펙트럼에 대한 표현식의 (

에 대한) 제1 및 제2 도함수를 사용하여, 위첨자 ↑로 표시된 관련 피크 및 위첨자 ↓로 표시된 최소값에 대한 진폭 및 주파수가 다음과 같이 주어진다:

전형적인 청취 구성

의 경우, 예컨대, 도 2에 도시된 기준

경우에, 엔벨로프 피크(즉,

)는

의 부스트(boost)에 대응한다

(그리고 다른 스펙트럼에서의 피크

는 약 30.5 dB의 부스트에 대응한다). 이들 부스트가 스펙트럼에 걸쳐 똑같은 주파수 폭을 가지지만, 스펙트럼이 (사람의 음 인지에 적절한) 로그 그래프로 나타내어질 때, 그의 인지된 주파수 범위에서 저주파수 부스트(low-frequency boost)가 가장 두드러진다. 이 저주파수[즉, 베이스 부스트(bass boost)]는 XTC에서의 본질적인 문제로서 인식되었다. 고주파수 피크가 원칙적으로

를 감소시키는 것[수학식 4 내지 수학식 6으로부터 알 수 있는 바와 같이, 소위 "스테레오 다이폴(Stereo Dipole)" 구성에서 행해지는 바와 같이, l을 증가시키는 것 및/또는 스피커 간격

(단,

는 10°일 수 있음)를 감소시키는 것에 의해 달성됨]에 의해 오디오 범위로부터 밀려나는 반면, P-XTC 필터의 "저주파수 부스트(low frequency boost)"는 여전히 문제로 남아 있다.

이들 고진폭 피크와 연관된 심각한 스펙트럼 채색은 3가지 실제적인 문제를 야기한다: 1) 이는 스위트 스폿을 벗어나 있는 듣는 사람에서 들릴 것이고, 2) 이는 재생 트랜스듀서에 대한 물리적 변형의 (미처리된 사운드 재생에 비해) 상대적 증가를 야기할 것이며, 3) 이는 동적 범위의 손실에 대응할 것이다.

스위트 스폿에 있는 듣는 사람의 귀에서 완벽한 XTC 필터가 약속하는 대단히 양호한 XTC 성능

및 완벽하게 평탄한 주파수 응답(

상수)이 보장된다면 이들 불이익은 정당한 대가일 수 있다. 그렇지만, 실제로는, 이 해결책의 피할 수 없는 오류에 대한 민감도로 인해, 이들 이론적으로 약속된 이점이 달성가능하지 않다. 이 문제는 전달 행렬 C의 조건수(condition number)를 평가함으로써 가장 잘 인지될 수 있다.

행렬 역변환 문제에서, 이 해결책의 시스템에서의 오류에 대한 민감도가 행렬의 조건수에 의해 주어진다는 것은 잘 알려져 있다. 행렬 C의 조건수

는 다음과 같이 주어진다:

(이는 또한, 등가적으로, 행렬의 가장 작은 특이값에 대한 가장 큰 특이값의 비이다.) 따라서, 하기의 식이 얻어진다:

이 함수의 제1 및 제2 도함수를 사용하여, 이전의 스펙트럼에 대해 행해진 바와 같이, 최대값 및 최소값은 다음과 같다:

첫째, 조건수의 최소값 및 피크가 스피커에서의 진폭 엔벨로프 스펙트럼

과 동일한 주파수에서 일어난다는 것에 주의한다. 둘째, 최소값이 1(가장 낮은 값)의 조건수를 가지며, 이는 C의 역변환으로부터 얻어지는 XTC 필터가 무차원 주파수

에서 가장 안정적(즉, 전달 행렬에서의 오류에 가장 덜 민감함)이라는 것을 의미한다는 것에 유의한다. 이와 달리, 조건수가 무차원 주파수

에서 아주 높은 값(예컨대,

의 통상적인 경우에 대해

)에 도달할 수 있다.

임에 따라, P-XTC 필터가 얻어지는 행렬 역변환이 불량 조건(ill-conditioned)으로 된다 - 즉, 오류에 대단히 민감하다 -. 따라서, 예를 들어, 듣는 사람의 머리의 최소한의 오정렬도 (이들 주파수에서 및 그 근방에서) 귀에서의 XTC 제어의 심각한 손실을 가져올 것이며, 이는 차례로

에서의 심각한 스펙트럼 채색이 귀로 전송되게 한다.

상수 파라미터 정규화의 단점

정규화 방법은 해의 정확도를 어느 정도 상실하는 것에 대한 대가로 불량 조건 선형 시스템(ill-conditioned linear system)의 근사해의 놈(norm)을 제어하는 것을 가능하게 해준다. 정규화를 통한 놈의 제어는 비용 함수의 최소화 등의 최적화 처방(optimization prescription) 하에서 행해질 수 있다. 스펙트럼 채색의 원하는 허용 레벨에 대한 XTC 성능의 최대화 또는, 등가적으로, 원하는 최소 XTC 성능에 대한 스펙트럼 채색의 최소화로서 정의될 수 있는 XTC 필터 최적화와 관련하여 정규화가 분석적으로 논의될 수 있다.

행렬 역변환 문제에 가까운 해결책을 나타내는 의사 역행렬(pseudoinverse)이 구해지고:

여기서 위첨자

는 에르미트 연산자(Hermitian operator)를 나타내고, β는 본질적으로 C의 정확한 역행렬인

로부터의 이탈(departure)을 야기하는 정규화 파라미터이다. β는 상수

로 간주된다. 의사 역행렬(pseudoinverse matrix)

는 정규화된 필터이고, 위첨자

는 상수 파라미터 정규화를 나타내는 데 사용된다. 수학식 22에 나타낸 정규화는 비용 함수

의 최소화에 대응하고:

여기서 벡터 e는 완벽한 필터에 의해 재생된 신호로부터의 이탈의 정도인 성능 척도를 나타낸다. 물리적으로, 이어서 비용 함수를 구성하는 합에서의 첫번째 항은 성능 오차의 정도를 나타내고, 두번째 항은 스피커가 내는 출력(power)의 정도인 "노력 불이익(effort penalty)"을 나타낸다. β>0의 경우, 수학식 22는 비용 함수

의 최소 제곱 최소화(least-square minimization)에 대응하는 최적을 가져온다.

따라서, 정규화 파라미터 β의 증가는 더 큰 성능 오차를 대가로 노력 불이익의 최소화를 가져오고, 따라서 시스템이 불량 조건인 주파수에서 및 그 근방에서 XTC 성능의 감소를 대가로 H의 놈에서의 피크 - 즉,

스펙트럼에서의 채색 피크(coloration peak) - 의 감소를 가져온다.

수학식 12에 의해 주어지는 C에 대한 양함수 형태(explicit form)를 사용하여, 상수 파라미터 정규화 XTC 필터의 주파수 응답은 수학식 24로 된다:

여기서,

본 명세서에서 정의한 8개의 척도 스펙트럼은 다음과 같이 된다:

에 따라,

이고 완벽한 XTC 필터의 스펙트럼이 예상된 바와 같이 상기 식들로부터 복원된다는 것은 주의할 만하다.

3개의 β 값에 대해 엔벨로프 스펙트럼

가 도 3에 그래프로 나타내어져 있다. 그 그래프에서 2가지 특징에 주목할 수 있다: 1) 정규화 파라미터를 증가시키는 것은 최소값에 영향을 주는 일 없이 스펙트럼에서의 피크를 감쇄시키고, 2) β를 증가시킴에 따라, 스펙트럼 최대값이 이중 피크(doublet peak)(2개의 가까운 간격으로 있는 피크)로 분할된다.

피크 감쇄의 정도 및 이중 피크의 형성에 대한 조건을 얻기 위해,

에 대한

의 제1 및 제2 도함수는 제1 도함수가 0이고 제2 도함수가 마이너스인 조건을 구하는 데 사용된다. 이들 조건이 이하에 요약되어 있다: β가 수학식 29로서 정의되는 임계값

미만인 경우,

피크는 단일 피크(singlet)이고, P-XTC 필터(

)의 엔벨로프 스펙트럼 피크에 대해서와 동일한 무차원 주파수에서 일어나고, 하기의 진폭을 가진다:

에서, (단,

)

조건

이 만족되는 경우, 최대값은 다음과 같은 무차원 주파수에 위치하는 이중 피크이고:

에 의존하지 않는 진폭

을 가진다. (위첨자 ↑ 및

는, 각각, 단일 피크 및 이중 피크를 나타낸다.) 정규화로 인한

스펙트럼에서의 피크의 감쇄는 P-XTC(즉,

) 스펙트럼에서의 피크의 진폭을 정규화된 스펙트럼에서의 피크의 진폭으로 나눔으로써 달성될 수 있다. 단일 피크의 경우에, 감쇄는

이고, 이중 피크의 경우에, 감쇄는

에 의해 주어진다.

도 2에 예시된

의 통상적인 경우에,

이 얻어지고, β = .005 및 0.05의 경우에, 그 그래프 상에 표시된 바와 같이, 각각 19.5 및 29.5 dB만큼 감쇄되는 이중 피크가 얻어진다. 따라서, 정규화 파라미터를 이 (통상적으로 낮은) 임계값 이상으로 증가시키면 엔벨로프 스펙트럼에서의 최대값이 완벽한 XTC 필터의 응답에서의 피크의 양쪽으로 주파수

만큼 천이된 이중 피크로 분할된다. (

의 예시적인 경우에 대해,

에 대해

이고

이라는 것을 알았다.) 사람의 주파수 인지의 로그 특성으로 인해, 이들 이중 피크는 고주파수에서(즉,

에 대해) 협대역 아티팩트로서 인지되지만, 도 3에서 명백히 알 수 있는 바와 같이,

에 중심을 둔 제1 이중 피크는 통상적으로 많은 dB의 광대역 저주파 롤오프로서 인지된다. 따라서, 상수-β 정규화는 완벽한 XTC 필터의 베이스 부스트(bass boost)를 베이스 롤오프(bass roll-off)로 변환한다.

정규화가 본질적으로 시스템 역변환에의 고의적인 오류의 유입이기 때문에, β가 증가함에 따라 귀에서의 XTC 스펙트럼 및 주파수 응답 둘 다가 나빠질 것으로(즉, 각각

및 0 dB인 그의 이상적인 P-XTC 필터 레벨로부터 벗어날 것으로) 예상된다. 귀에서의 응답에 대한 상수 파라미터 정규화의 효과가 크로스토크 제거 스펙트럼

(상부 2개의 곡선) 및 측면 이미지에 대한 귀에서의 동측 주파수 응답

에 대한 정규화의 효과를 나타내고 있는 도 4에 예시되어 있다. 상부축에 있는 흑색 수평 막대는 β = .05에서 20~dB 또는 그 이상의 XTC 레벨에 도달하는 주파수 범위를 나타내고, 회색 막대는 β = .005의 경우에 대한 동일한 것을 나타내고 있다. (다른 파라미터들은 도 2에 대한 것과 동일하다.)

그 그래프에서 흑색 곡선은 크로스토크 제거 스펙트럼을 나타내고, 시스템이 불량 조건인 주파수[

(단,

)] - 그 주파수 넓이(frequency extent)가 정규화의 증가에 따라 넓어짐 - 를 중심으로 한 주파수 대역 내에서 XTC 제어가 상실되었음을 보여준다. 예를 들어, β를 .05로 증가시키면 20 dB 또는 그 이상의 XTC를 그 도면의 상부축에 흑색 수평 막대로 표시된 주파수 범위로 제한하고, 제1 범위는 단지 1.1부터 6.3 kHz까지 뻗어 있고 제2 및 제3 범위는 8.4 kHz를 넘어 위치한다. 많은 실제 응용에서, (실내 반사 및/또는 듣는 사람의 HRTF와 필터를 설계하는 데 사용되는 것(예컨대, 모형 머리) 사이의 부정합으로 인해) 이러한 높은(20 dB) XTC 레벨이 필요하지 않거나 달성가능하지 않을 수 있고, 스펙트럼 채색 피크를 스피커에서의 요구된 레벨 미만으로 조절하는 데 필요한 β의 더 높은 값이 허용될 수 있다.

도 4에서 하부 곡선으로서 도시되어 있는 귀에서의

응답은 대응하는 P-XTC(즉, β=0) 필터 응답(0 dB에서 평탄한 곡선임)으로부터 단지 몇 dB 정도만 벗어나 있을 뿐이다. 보다 상세하게는 그리고 일반적으로,

스펙트럼의 최대값 및 최소값이 다음과 같이 주어진다:

도면에 도시된 통상적인

예에서,

에 대해, 심지어 비교적 공격적인 정규화에 의해서도 완벽한 XTC 필터가 스피커에 부과하는 스펙트럼 채색과 비교하여 꽤 적은 귀에서의 스펙트럼 채색이 일어난다는 것을 보여준다.

요약하면, XTC 필터의 설계에서 흔히 사용되는 기법인 상수 파라미터 정규화가 스피커에서 엔벨로프 스펙트럼에서의 피크의 진폭("저주파수 부스트"를 포함함)을 감소시키는 데 효과적이지만, 이로 인해 통상적으로 스피커에서 고주파에서의 바람직하지 않은 협대역 아티팩트 및 저주파수의 롤오프가 발생한다. 본 명세서에 기술된 바와 같이, 정규화 파라미터가 주파수의 함수일 수 있는 경우, 이러한 최적이 아닌 거동이 회피될 수 있다.

주파수 의존적 정규화를 통한 스펙트럼 평탄화

본 발명의 방법 및 시스템은, 시스템 전달 행렬의 역변환에 기초하고 있는 이전의 XTC 필터 설계에서 암시적인 바와 같이, 듣는 사람의 귀에서가 아니라 스피커에서 측정되는 진폭 대 주파수 스펙트럼의 평탄화가 얻어질 주파수 의존적 정규화 파라미터(FDRP)를 계산하는 특정의 방식의 사용에 의존한다.

듣는 사람의 귀에서와 달리, 스피커에서 측정된 진폭 대 주파수 스펙트럼의 평탄화는 XTC를 진폭 효과로부터가 아니라 위상 효과로부터만 얻어지게 하는데, 그 이유는 스피커에서 진폭이 주파수에 따라 평탄하기 때문이다. 이것은 (XTC 필터가 녹음된 신호의 동일한 진폭 대 주파수 응답을 귀에서 재생하는 것을 목표로 하는 이전의 역변환-기반 XTC 필터 설계에서 본질적으로 행해지는 것처럼) 스피커 및/또는 재생 하드웨어에서의 임의의 내재적인 스펙트럼(즉, 진폭 대 주파수) 채색이 보정되지 않는다는 것을 의미한다.

스피커에서 측정되는 진폭 대 주파수 스펙트럼의 평탄화에 의해, 듣는 사람이 XTC 필터를 통한 사운드의 처리가 없는 경우에 들리게 될 동일한 진폭 대 주파수 응답을 듣게 된다. 이것은 듣는 사람이 필터를 갖지 않는 재생 하드웨어 및 스피커로 인한 것 이외의 어떤 스펙트럼 채색도 듣지 않을 것임을 암시한다. 스피커에서의 이러한 평탄한 필터 응답이 또한 처리된 오디오에 어떤 동적 범위 손실도 없다는 것을 의미한다는 사실이 똑같이 중요하다.

본 발명의 방법 및 시스템을 설명하기 위해, 스피커에서의 XTC 필터 응답을 평탄화하는 특정의 목표가 달성되는 주파수 의존적 정규화 파라미터를 어떻게 계산하는지에 대한 이상화된 분석적 설명이 기술될 것이다.

이상화된 모델과 관련한 본 발명의 방법의 설명

명확함을 위해, 본 발명의 방법 및 시스템이 채택된 최적화 방식과 완전히 독립적이라는 것을 염두에 두고서, 수학식 23에 표현된 비용 함수의 최소화와 관련하여 기술된 동일한 최적화 방식이 사용될 것이다.

이상에서 논의되고 도 3에 예시된 주파수 영역 아티팩트를 피하기 위해, 완벽한 필터의 엔벨로프 스펙트럼이

를 초과하는 주파수 대역에 걸쳐 엔벨로프 스펙트럼

이 원하는 레벨

(단위: dB)에서 평탄하게 되게 하는 주파수 의존적 정규화 파라미터가 계산된다. 이들 대역 밖에서는(즉,

가

미만인 경우), 정규화를 적용하지 않는다. 이것을 기호로 다음과 같이 나타낼 수 있고:

(

인 경우)

(

인 경우)

여기서 P-XTC 엔벨로프 스펙트럼

은 수학식 16에 의해 주어지고,

이며,

는 dB로 주어진다.

는

스펙트럼에서 피크의 크기를 초과할 수 없고,

는 다음과 같이 제한되며:

여기서 경계는 수학식 18에 의해 주어지는

스펙트럼의 최대값

이다.

수학식 33에서 요구되는 스펙트럼 평탄화를 실시하는 데 필요한 주파수 의존적 정규화 파라미터는 수학식 27에 의해 주어진

를

로 설정하고 이제 주파수의 함수인

에 대해 풂으로써 얻어진다. 정규화된 스펙트럼 엔벨로프

(정규화된 XTC 필터의 2-놈인

이기도 함)가 2개의 함수의 최대값이기 때문에,

에 대한 2개의 해가 얻어진다:

제1 해

는 완벽한 필터의 역위상 응답(즉, 수학식 16에서의

함수의 제2 인수인 제2 특이값)이 정위상 응답(즉, 그 함수의 제1 인수)보다 우세한 주파수 대역에 적용된다:

이와 유사하게,

에 의한 정규화가

인 주파수 대역에 적용된다. 따라서, 최적화된 해의 3가지 분기를 구별해야만 하고; 2개의 정규화된 분기는

및

에 대응하고, 하나의 비정규화된(완벽한 필터) 분기는

에 대응한다. 이들 분기 I, II 및 P를 각각 호출하고, 다음과 같이 각각과 연관된 조건을 종합한다:

분기 I:

이고

인 경우에 적용되고,

및

로 설정하는 것을 필요로 함;

분기 II:

이고

인 경우에 적용되고,

및

로 설정하는 것을 필요로 함;

분기 P:

인 경우에 적용되고,

및

로 설정하는 것을 필요로 함.

이 3-분기 분할 이후에, 주파수 의존적 정규화의 경우에 대한 스피커에서의 엔벨로프 스펙트럼

이

에 대한 도 5에서의 두꺼운 흑색 곡선으로 나타내어져 있다. 이 값이 선택된 이유는 그 값이

스펙트럼에서의 (이중) 피크의 크기(즉,

) - 이는 또한 상수 파라미터 정규화의 대응하는 경우에 대한 기준으로서 나타내어져 있음(가는 실선 곡선) - 에 대응하기 때문이다. (

에서의 피크가, 단일 피크이든 이중 피크이든 간에,

와 같은 경우, 주파수 의존적 정규화에 의해 얻어진 스펙트럼과 상수-β 정규화에 의해 얻어진 스펙트럼을 "대응하는 스펙트럼"으로 부른다.)

저주파수 롤오프 및 협대역 아티팩트로 각각 변환될 완벽한 XTC 스펙트럼의 저주파수 부스트 및 고주파수 피크가, 상수-β 정규화에 의해, 이제는 원하는 최대 채색 레벨

에서 평탄하다는 것을 그 도면으로부터 알 수 있다. 스펙트럼의 나머지, 즉

미만의 진폭을 갖는 주파수 대역이 완벽한 XTC 필터의 무한 XTC 레벨 및 비교적 낮은 조건수와 연관된 안정성으로부터 이득을 볼 수 있다.

본 발명의 방법에서,

가 구체적으로는

스펙트럼의 가장 낮은 값, 즉

과 같은 값으로 또는 그 미만으로 선택되는데,

그 이유는 이것이 전체 스펙트럼

이 평탄하도록[즉, 수학식 34에서의 부등식이 성립하지 않고 분기 P가 사라짐] 보장해주고, XTC가 위상 효과만을 통해 강제로 실시되고, 그 결과 XTC 필터링으로 인한 진폭 채색이 발생하지 않고 동적 범위 손실이 발생하지 않으면서 채택된 최적화 방식(이 특정의 예에서, 수학식 23)에 의해 어느 비용 함수가 규정되든 간에 그 비용 함수의 최소화를 보장해주기 때문이다.

일반화된 방법

이상에서, XTC 필터 설계 절차에서 취해진 구체적인 단계들(이 단계들이 또한 각각의 단계에 대한 연관된 입력 및 출력과 함께 도 6에 개략적으로 도시되어 있음)과 관련하여 본 발명의 방법에 대해 개괄적으로 기술하였다.

단계(30)에서, 주파수 영역에서의 시스템의 전달 행렬[즉, 수학식 12에서의 행렬 C 및 입력(28)]이 대응하는 완벽한 XTC 필터

를 얻기 위해 0개 또는 아주 작은 상수 정규화 파라미터(기계 역변환 문제를 피하기에 충분히 큼)를 사용하여 분석적으로(다루기 쉬운 이상화된 모델로부터 얻어지는 경우) 또는 수치적으로(실험적 측정으로부터 얻어지는 경우) 역변환된다.

단계(34)에서,

가 스피커에서의 진폭 대 주파수 응답에 의해 도달되는 가장 낮은 값(단위: dB)[단계(34)에서의

]인

로 설정된다. 이것은 수학식 19(또는 다른 다루기 쉬운 분석적 모델로부터 얻어지는 유사한 수학식)로부터 또는

스펙트럼을 그래프로 그리는 것으로부터(역변환이, 이하에서 추가로 주어지는 예에서와 같이, 실제의 측정을 n사용하여 수치적으로 행해지는 경우) 구해지고, 이어서

으로부터

를 계산한다(단계 36).

단계(38)에서, 스피커에서 평탄한 주파수 응답을 초래시킬 주파수 의존적 정규화 파라미터(FDRP)

가 계산되고, 그에 따라

상수

이며(예를 들어, 수학식 37 및 수학식 38을 사용하여 행해지는 것과 같음), 따라서 XTC가 강제로 위상 효과에 의해서만 행해진다.

단계(40)에서, 이와 같이 구해진 FDRP

는 (예컨대, 수학식 22에 따라) 시스템의 전달 행렬의 의사 역행렬을 계산하는 데 사용되고, 이로부터 스피커에서 평탄한 주파수 응답을 갖는 요청된 정규화된 최적의 XTC 필터

가 산출된다. [마지막으로, 실제의 XTC 구현에서 종종 행해지는 바와 같이, 시간축 컨벌루션(time-base convolution)을 통해 얻어진 필터를 적용하는 데 필요한 경우], 단순히

(출력(42))의 역푸리에 변환을 취함으로써 필터의 시간 영역 버전(임펄스 응답)이 단계(44)에서 획득된다.

단계(38)에서,

상수

이도록 FDRP가 계산되는 경우, 측면 이미지(즉, 좌 채널 또는 우 채널 중 어느 하나 쪽으로 패닝되고 따라서 XTC 레벨이 충분히 높을 때 듣는 사람에 의해 그의 좌측 귀 또는 우측 귀에 또는 그 근방에 위치되어 있는 것으로 인지되는 사운드)에 대해 스펙트럼 평탄화가 일어난다는 것에 유의해야 한다. 그렇지만, 단순히

상수

(여기서,

는 좌 채널과 우 채널 사이의 어딘가에 패닝되는 음원의 이미지에 대한 XTC 필터의 주파수 응답임)이도록 함으로써 순수한 측면 이미지가 아닌 이미지에 대한 스피커에서의 응답을 평탄화하기 위해 동일한 방법이 사용될 수 있다. 예를 들어, 중앙 이미지에 대해 평탄화하기 위해,

(예를 들어, 이전의 수학식 27에 의해 주어짐)를 상수

로 설정하고, 이상에서 간략히 기술한 방법의 단계들을 계속한다. 이와 관련하여, 어떤 응용(예를 들어, 리드 보컬 오디오가 한가운데로 패닝되는 팝 음악 녹음)에 대해, 중앙 이미지 (즉,

)(또는 임의의 다른 원하는 패닝의 이미지)에 대한 응답을 평탄화하여 그 이미지의 채색을 피하는 것이 바람직할 수 있다는 것을 언급하는 것이 중요하다. 또한, 그와 관련하여 측면 이미지만을 평탄화하는

(즉,

상수

로 설정하는 것)에 의해 XTC 필터로 인한 동적 범위 손실이 일어나지 않는다는 것에 유의해야 한다. 환언하면, 측면 이미지 이외의 어떤 것에 대한 평탄화도 동적 범위 손실을 야기할 것이며, 이 동적 범위 손실이 원하는 패닝된 이미지에 대한 감소된 스펙트럼 채색의 이점과 평형을 이루어야만 한다. 예를 들어, 통상적으로 한가운데 패닝된 이미지를 포함하지 않는 실제 음향 음장의 바이노럴 녹음의 경우, 측면 이미지의 평탄화가 바람직한데, 그 이유는 이것에 의해 동적 범위 손실이 야기되지 않기 때문이다.

측정된 전달 함수를 사용한 예

모형 머리(Neumann KU- 100)의 외이도 입구에 배치된 마이크에 의해 측정되는 방에 있는 2개의 스피커의 전달 함수에 기초한 예에 대해 이제부터 기술한다. 스피커는 각각의 스피커로부터 약 2.5 미터 떨어진 청취 위치에서 60도의 간격을 가졌다.

도 7은 시간 영역에서 전달 함수를 나타낸 4개의 [윈도잉된(windowed)] 측정된 임펄스 응답(IP)을 나타낸 것이다. 도 7에서의 각각의 그래프의 x-축은 시간(단위: ms)이고, y-축은 측정된 신호의 정규화된 진폭이다. 좌측 상부 그래프는 모형 머리의 좌측 귀에서 측정된 좌 스피커의 IR을 나타내고, 좌측 하부 그래프는 모형 머리의 우측 귀에서 측정된 좌 스피커의 IR을 나타낸 것이다. 우측 상부 그래프는 우 스피커-좌측 귀 전달 함수의 IR이고, 하부 그래프는 우 스피커-좌측 귀 전달 함수의 IR이다.

도 8은 x-축이 주파수(단위: Hz)이고 y-축이 진폭(단위: dB)인 관련 스펙트럼을 나타낸 것이다. 그 그래프에서의 곡선(48)은 테스트 사운드를 좌 채널로 완전히 패닝함으로써 얻어진 주파수 영역에서의 좌 스피커-좌측 귀 전달 함수에 대응하는 주파수 응답 C_LL이다. 5 kHz를 넘어서 있는 곡선(48)에서의 리플은 머리 및 좌측 귀 귓바퀴의 HRTF로 인한 것이다. 그 그래프에서의 다른 곡선들(50, 52, 54)은 완벽한 XTC 필터 - 즉, 본질적으로 정규화

를 갖지 않는 전달 함수를 역변환함으로써 얻어진 XTC 필터 - 와 연관되어 있는 측정된 주파수 응답이다. 상세하게는, 곡선(50)은 좌 스피커에서의 응답

이고, 31.45 dB의 동적 범위 손실(그 곡선에서의 최대값과 최소값의 차이)을 나타낸다. 곡선(52)은 좌측(동측) 귀에서의 주파수 응답

으로서, 완벽한 XTC 필터로부터 예상되는 바와 같이, 전체 오디오 대역에 걸쳐 본질적으로 평탄하다. 곡선(54)은 우측(반측) 귀에서 측정된 대응하는 주파수 응답

이고, XTC로 인해 곡선(52)에 대해 상당한 감쇄를 나타낸다. 주파수에 걸쳐 선형 평균된 곡선(52)과 곡선(54) 사이의 진폭의 차가 평균 XTC 레벨이고, 이 경우에, 21.3 dB이다.

이들 곡선을 본 발명에 따라 설계된 필터로 인한 응답을 보여주는 도 9에서의 곡선들과 대조하였다. 설계에 의해, 좌 스피커에서의 응답인

를 나타내는 곡선(60)은 전체 오디오 스펙트럼에 걸쳐 완전히 평탄하다. 그 결과, 좌측 귀에서의 주파수 응답(곡선 62)은 곡선(64)에 나타낸 대응하는 측정된 시스템 전달 함수 C_LL과 아주 잘 정합한다.

가 평탄하기 때문에, 이 필터와 연관된 동적 범위 손실이 없다. 이 필터에 대한 평균 XTC 레벨[곡선(62)과 곡선(66) 사이의 차이의 선형 평균을 취함으로써 얻어짐]은 완벽한 필터로 얻어진 XTC 레벨보다 단지 1.76 dB 더 낮은 19.54 dB이고, 이로써 정규화된 필터의 최적의 특성이 입증된다. 요약하면, 본 발명의 방법으로 설계된 필터는 재생 시스템의 사운드에 어떤 가청 채색도 부과하지 않으며, 동적 범위 손실이 없고, 완벽한 XTC 필터와 본질적으로 동일한 XTC 레벨을 산출한다.

본 명세서에 기술된 방법은 DSP 칩셋 등의 범용 컴퓨터 또는 프로세서에서 실행하기 위한 컴퓨터 판독가능 저장 매체에 포함되어 있는 소프트웨어 또는 펌웨어로 구현될 수 있다. 적당한 컴퓨터 판독가능 저장 매체의 예는 판독 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 레지스터, 캐시 메모리, 반도체 메모리 장치, 내장형 하드 디스크 및 이동식 디스크 등의 자기 매체, 광자기 매체, 및 광 매체[CD-ROM 디스크 및 DVD(digital versatile disk) 등]를 포함한다.

본 발명의 실시예는 컴퓨터 판독가능 저장 매체에 저장되어 있는 명령어 및 데이터로서 표현될 수 있다. 예를 들어, 본 발명의 측면이 하드웨어 기술 언어(hardware description language, HDL)인 Verilog를 사용하여 구현될 수 있다. 처리될 때, Verilog 데이터 명령어는 반도체 제조 설비에서 구현되는 제조 공정을 수행하는 데 사용될 수 있는 다른 중간 데이터(예컨대, 네트리스트, GDS 데이터 등)를 발생할 수 있다. 제조 공정이 본 발명의 다양한 측면을 구현하는 반도체 장치(예컨대, 프로세서)를 제조하도록 구성될 수 있다.

적당한 프로세서는, 일례로서, 범용 프로세서, 전용 프로세서, 종래의 프로세서, 디지털 신호 처리기(DSP), 복수의 마이크로프로세서, 그래픽 처리 유닛(GPU), DSP 코어, 제어기, 마이크로컨트롤러, ASIC(application specific integrated circuit), FPGA(field programmable gate array), 임의의 다른 유형의 집적 회로(IC), 및/또는 상태 기계, 또는 이들의 조합을 포함한다.

상기 발명이 그의 바람직한 실시예를 참조하여 기술되어 있지만, 다양한 변경 및 수정이 기술 분야의 당업자에게 안출될 것이다. 이러한 변경 및 수정 모두가 첨부된 특허청구범위의 범위 내에 속하는 것으로 보아야 한다.

Claims

스피커들을 포함하는 오디오 시스템에서 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법으로서,
상기 오디오 시스템의 전달 행렬 또는 함수를 역변환하는 단계;
상기 역변환된 전달 행렬 또는 함수로부터의 정보를 사용하여, 오디오 대역 또는 그의 일부분에 걸쳐 상기 오디오 시스템의 상기 스피커들 중 임의의 스피커의 입력에서 평탄한(flat) 주파수 응답을 갖는 크로스토크 제거 필터들을 얻기 위해 상기 전달 행렬 또는 함수의 정규화된 역행렬(regularized inverse)을 계산하는데 사용되는 주파수 의존적 정규화 파라미터(frequency-dependent regularization parameter)를 계산하는 단계; 및
상기 스피커들 중 하나 이상의 스피커의 입력에서 오디오 신호에 상기 크로스토크 제거 필터들을 적용하는 단계
를 포함하는, 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법.
제1항에 있어서, 상기 크로스토크 제거 필터들은 상기 오디오 대역 또는 그의 일부분에 걸친 위상 효과(phase effect)를 통해서만 제거를 달성하는 것인, 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법.
제1항에 있어서, 상기 크로스토크 제거 필터들은 좌 채널과 우 채널 사이의 임의의 곳에서 패닝(panned)되는 원하는 이미지에 대해 상기 스피커들 중 하나 이상의 스피커의 입력에서 평탄한 주파수 응답을 갖는 것인, 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법.
제1항에 있어서, 상기 오디오 시스템은 입력을 위해 바이노럴 오디오 신호(binaural audio signals)를 사용하는 것인, 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법.
제1항에 있어서, 상기 오디오 시스템은 스테레오 오디오 시스템(stereo audio system)인 것인, 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법.
오디오 응용의 스피커들의 크로스토크를 제거하기 위한 크로스토크 제거 필터를 설계하는 방법으로서,
스피커들을 포함하는 오디오 시스템의 전달 행렬 또는 함수를 역변환하는 단계; 및
상기 역변환된 전달 행렬 또는 함수로부터의 정보를 사용하여, 오디오 대역 또는 그의 일부분에 걸쳐 상기 오디오 시스템의 상기 스피커들 중 임의의 스피커의 입력에서 평탄한 주파수 응답을 갖는 크로스토크 제거 필터들을 얻기 위해 상기 전달 행렬 또는 함수의 정규화된 역행렬(regularized inverse)을 계산하는데 사용되는 주파수 의존적 정규화 파라미터를 계산하는 단계
를 포함하는, 오디오 응용의 스피커들의 크로스토크를 제거하기 위한 크로스토크 제거 필터 설계 방법.
제6항에 있어서, 상기 크로스토크 제거 필터들은 상기 오디오 대역 또는 그의 일부분에 걸친 위상 효과를 통해서만 크로스토크 제거를 달성하는 것인, 오디오 응용의 스피커들의 크로스토크를 제거하기 위한 크로스토크 제거 필터 설계 방법.
제6항에 있어서, 상기 크로스토크 제거 필터들은 좌 채널과 우 채널 사이의 임의의 곳에서 패닝(panned)되는 원하는 이미지에 대해 상기 스피커들 중 하나의 스피커에서 평탄한 주파수 응답을 갖는 것인, 오디오 응용의 스피커들의 크로스토크를 제거하기 위한 크로스토크 제거 필터 설계 방법.
제6항에 있어서, 상기 오디오 시스템은 입력을 위해 바이노럴 오디오 신호를 사용하는 것인, 오디오 응용의 스피커들의 크로스토크를 제거하기 위한 크로스토크 제거 필터 설계 방법.
제6항에 있어서, 상기 오디오 시스템은 스테레오 오디오 시스템인 것인, 오디오 응용의 스피커들의 크로스토크를 제거하기 위한 크로스토크 제거 필터 설계 방법.
스피커들을 포함하는 오디오 시스템에서 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 시스템으로서,
오디오 입력단; 및
프로세서를 포함하고, 상기 프로세서는,
상기 오디오 시스템의 전달 행렬 또는 함수를 역변환하고;
오디오 대역 또는 그의 일부분에 걸쳐 상기 오디오 시스템의 상기 스피커들 중 임의의 스피커의 입력에서 평탄한 주파수 응답을 갖는 크로스토크 제거 필터들을 얻기 위해 상기 전달 행렬 또는 함수의 정규화된 역행렬(regularized inverse)을 계산하는데 사용되는 주파수 의존적 정규화 파라미터를 계산하고;
상기 계산된 주파수 의존적 정규화 파라미터를 사용하여 상기 전달 행렬의 의사 역행렬을 계산하며,
상기 스피커들 중 하나 이상의 스피커의 입력에서 오디오 신호에 상기 크로스토크 제거 필터들을 적용하기
위한 것인, 오디오 신호 필터링 시스템.
제11항에 있어서, 크로스토크 제거는 상기 프로세서에 의해 상기 오디오 대역 또는 그의 일부분에 걸친 위상 효과를 통해서만 달성되는 것인, 오디오 신호 필터링 시스템.
제11항에 있어서, 상기 프로세서는, 좌 채널과 우 채널 사이의 임의의 곳에서 패닝(panned)되는 원하는 이미지에 대해 상기 스피커들 중 임의의 스피커의 입력에서 평탄한 주파수 응답을 갖는 크로스토크 제거 필터들을 얻기 위해 상기 전달 행렬 또는 함수의 정규화된 역행렬을 계산하는데 사용되는 상기 주파수 의존적 정규화 파라미터를 적용하는 능력을 갖는 것인, 오디오 신호 필터링 시스템.
스피커들을 포함하는 오디오 시스템에 대한 크로스토크 제거 필터를 생성하는 시스템으로서,
오디오 입력단; 및
프로세서를 포함하고, 상기 프로세서는,
상기 오디오 시스템의 전달 행렬 또는 함수를 역변환하고;
오디오 대역 또는 그의 일부분에 걸쳐 오디오 시스템의 스피커들 중 임의의 스피커의 입력에서 평탄한 주파수 응답을 갖는 크로스토크 제거 필터들을 얻기 위해 상기 전달 행렬 또는 함수의 정규화된 역행렬을 계산하는데 사용되는 주파수 의존적 정규화 파라미터를 계산하기 위한 것인, 오디오 시스템에 대한 크로스토크 제거 필터 생성 시스템.
제14항에 있어서, 크로스토크 제거가 상기 오디오 대역 또는 그의 일부분에 걸친 위상 효과를 통해서만 달성되는, 오디오 시스템에 대한 크로스토크 제거 필터 생성 시스템.
제14항에 있어서, 상기 크로스토크 제거 필터들은 좌 채널과 우 채널 사이의 임의의 곳에서 패닝(panned)되는 원하는 이미지에 대해 상기 스피커들 중 임의의 스피커의 입력에서 평탄한 주파수 응답을 갖는 것인, 오디오 시스템에 대한 크로스토크 제거 필터 생성 시스템.
제1항에 있어서,
상기 오디오 시스템의 전달 행렬 또는 함수를 역변환하는 단계는 오디오 스펙트럼을 대역들로 나누지 않고 전체 오디오 스펙트럼에 걸쳐서 상기 전달 행렬 또는 함수의 역행렬을 계산하는 단계를 포함하는 것인, 스피커 크로스토크를 제거하기 위해 오디오 신호를 필터링하는 방법.
제11항에 있어서,
상기 프로세서는 오디오 스펙트럼을 대역들로 나누지 않고 전체 오디오 스펙트럼에 걸쳐서 상기 전달 행렬 또는 함수의 역행렬을 계산하는 것인, 오디오 신호 필터링 시스템.