KR20170023941A

KR20170023941A - 오디오 신호의 디지털 캡슐화

Info

Publication number: KR20170023941A
Application number: KR1020177000795A
Authority: KR
Inventors: 피터 그라함 크레이븐; 존 로버트 스튜어트
Original assignee: 레이네 에스.아.알.엘.; 피터 그라함 크레이븐
Priority date: 2014-06-10
Filing date: 2014-06-10
Publication date: 2017-03-06
Also published as: JP6700507B2; US20210193157A1; US10115410B2; KR102318581B1; US11710493B2; EP4002359A1; KR20230028594A; US20240029749A1; JP6700507B6; EP3155617A1; KR20210132222A; CN106575508A; US10867614B2; EP3998605A1; CN106575508B; US20170110141A1; PL3155617T3; WO2015189533A1; KR102503347B1; JP2017521977A

Abstract

보통 샘플 레이트에서의 빠른 과도의 정확한 지각적 렌더링을 특히 고려하여 고 품질 오디오 신호의 디지털 표현을 제공하키 위한 인코딩 및 디코딩 시스템들을 설명한다. 이는, 지각적으로 해로운 것으로 발견된 에일리어싱 산물을 적절히 감쇄하면서 임펄스 응답의 길이를 최소화하도록 다운샘플링 및 업샘플링 필터들을 최적화함으로써 달성된다.

Description

오디오 신호의 디지털 캡슐화{DIGITAL ENCAPSULATION OF AUDIO SIGNALS}

본 발명은 고 품질 오디오 신호의 디지털 표현의 제공에 관한 것이다.

컴팩트 디스크(CD)의 도입 이래 30년 동안, 일반 대중은 "CD 품질"을 디지털오디오의 표준으로서 받아들일 수 있게 되었다. 한편, 오디오 업계에서는 두 가지 유형의 논쟁이 있었다. 한 유형은, CD의 16비트 해상도와 44.1kHz 샘플링 레이트가 데이터 낭비이며 동등한 사운드를 MP3 또는 AAC 등의 더욱 컴팩트한 손실-압축 포맷으로 전달할 수 있다는 명제에 중점을 두고 있다. 나머지 한 유형은, CD의 해상도와 샘플링 레이트가 부적절하며 24비트와 96kHz의 샘플링 레이트, 흔히 96/24로 축약된 사양을 이용하여 청각적으로 더욱 양호한 결과를 얻을 수 있음을 주장하는 정반대의 견해를 취한다.

44kHz가 실제로 충분히 좋은 것으로 간주되지 않는다면, 96kHz가 해답인지 여부 또는 192kHz 또는 심지어 384kHz가 '궁극적인' 품질의 샘플링 레이트이어야 하는지 여부에 대한 문제가 발생한다. 많은 오디오 애호가들은, 96kHz가 44.1kHz보다 양호한 사운드를 내고 192kHz가 96kHz보다 실제로 양호한 사운드를 낸다고 주장한다.

역사적으로, 아날로그 파형의 연속 시간 표현으로부터 샘플링된 디지털 표현으로의 전환은 샘플링 이론(www.en.wikipedia.org/wiki/Sampling_theorem)에 의해 정당화되었으며, 이 이론은, 최대 f_max까지의 주파수만을 포함하는 연속 시간 파형이 초당 2×f_max개의 샘플을 갖는 샘플링된 표현으로부터 정확하게 재구성될 수 있음을 나타낸다. 샘플 레이트의 절반에 해당하는 주파수는, 나이퀴스트 주파수로 알려져 있으며, 예를 들어, 96kHz에서 샘플링시 48kHz이다.

따라서, 연속 시간 파형은, 우선, 다른 상황에서는 샘플링 프로세스에 의해 '에일리어싱'되고 f_max 미만의 이미지로서 재생될 f_max초과의 주파수를 제거하도록 대역제한 '안티에일리어싱' 필터에 의해 필터링된다. 표준 통신 실행에 따라, 대역제한 안티에일리어싱 필터는 일반적으로 f_max까지 평탄한 주파수 응답에 근사하므로, 주파수 응답 그래프가 '브릭월' (brickwall)의 외관을 갖는다. 이는 샘플링된 표현으로부터 연속 파형을 재생하는데 사용되는 재구성 필터에 동일하게 적용된다.

이 방법에 따르면, 샘플링과 후속 재구성의 프로세스는, f_max 초과 주파수를 제거하고 f_max보다 현저히 낮은 주파수를 거의 또는 전혀 변경하지 않는 시불변 선형 필터링 프로세스와 정확하게 동등하다. 따라서, 유일한 차이점이 통상적인 인간의 청각 범위인 20Hz 내지 20kHz를 2배 초과하는 약 40kHz 초과 주파수의 존재 또는 부재이므로, 192kHz에서의 샘플링이 96kHz에서의 샘플링보다 양호한 사운드를 낼 수 있다는 것은 이해하기 어렵다.

이러한 역설을 부분적으로 설명하고자 하는 두 개의 논문은, 4734 104th AES convention 1998에서 견본 인쇄된 Dunn J의 "Anti-alias and anti-image filtering: The benefits of 96kHz sampling rate formats for those who cannot hear above 20kHz" 및 http://www.cirlinca.com/include/aes97nv.pdf에서 입수가능한 Story M의 "A Suggested Explanation For (Some Of) The Audible Differences Between High Sample Rate And Conventional Sample Rate Audio Material"이다.

두 개의 논문 모두는, 필터의 시간 영역 응답을 보는 관점에 조화가 존재한다는 점을 나타낸다. Dunn은 통과대역 리플이 전/후 에코와 같은 효과를 갖는다는 점을 발견한 반면, Story는 필터가 임펄스의 에너지를 시간 경과에 따라 어떻게 분산시키는지를 검토한다. 이들은 서로 다른 속성들을 언급하고 있지만, 이들 모두에서는, 샘플 레이트가 증가함에 따라 문제점들이 감소된다. 이는, 평탄한 응답이 나이퀴스트 주파수 근처가 아닌 20kHz에서 유지되는 경우에만 특히 그러하며, 따라서, 나이퀴스트 주파수에서 전체 에일리어싱 제거가 필요하기 전에 천이 대역을 증가 시킨다.

Story의 방안은, Craven, P.G.의 "Antialias Filters and System Transient Response at High Sample Rates"에서 추가로 다루어진다. 여기서, Craven은, 96kHz 시스템의 데시메이션 및 보간 시스템들이 임펄스 에너지의 넓은 분산이라는 단점을 제공하는 "브릭월" 응답을 갖더라도, 96kHz 레이트에서 동작하는 "아포다이징(apodising)" 필터가 유효 천이 대역을 넓힐 수 있어서 임펄스 에너지의 분산을 좁힐 수 있음을 교시하고 있다. 도 1은 96kHz로 다운샘플링하는 예시적인 브릭월 필터의 주파수 응답(실선)과 아포다이징 필터의 응답(파선)을 도시한다. 이어서, 필터들의 대응하는 임펄스 응답들은, 도 2a의 브릭월 필터의 고 분산적 시간 응답이 도 2b의 컴팩트한 시간 응답에 대한 아포다이징 필터의 적용에 의해 어떻게 단축되는지를 나타내는, 도 2a와 도 2b에 도시되어 있다.

그러나, 아포다이징을 적용하더라도, 오늘날, 96kHz보다 빠른 레이트에서의 샘플링에 의해, "덜 혼잡함", "공기가 더욱 많음", "더욱 양호한 hf 상세", 그리고 특히 "더욱 양호한 공간 해상도" 등의 Story 보고서와 동일한 용어들로 설명되는 청취가능한 개선 효과를 얻을 수 있다. 결과적으로, 현재의 첨단 기술은, 이러한 음향 속성들 중 일부의 손실을 유발할 수도 있는 것을 식별하는 데 유용한 진전이 있음에도 불구하고 96kHz 등의 적당한 샘플 레이트를 사용할 때 그 음향 속성들 중 일부를 잃어버린다.

결국, 최고 품질의 재생은 매우 높은 샘플 레이트의 사용을 필요로 하여, 결과적으로는 파일 크기와 대역폭 요건들에 영향을 끼친다. 따라서, 고 해상도 사운드로 전체 대중을 흥미롭게 할 가능성은, 포맷의 까다로운 요구 또는 품질이 손실되었다는 인식과 함께 어려워 보인다.

이에 따라, 더욱 높은 샘플 레이트에 연관된 지각적 이점들을 보존하는 적당한 샘플 레이트로 고 품질의 오디오를 분산하기 위한 대체 방법이 필요하다.

본 발명의 제1 양태에 따르면, 오디오 캡처의 사운드를 전달하기 위한 인코더와 디코더를 포함하는 시스템을 제공하며, 인코더는 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정되고, 디코더는 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정되고, 인코더는, 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 오디오 캡처를 나타내는 신호를 수신하고 그 신호를 다운샘플링하여 디지털 오디오 신호를 제공하도록 조정된 다운샘플러를 포함하고, 인코더와 디코더의 결합된 임펄스 응답은, 임펄스 응답의 누적 절대 응답이 송신 샘플 레이트에서의 5 샘플 주기를 초과하지 않는 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간(duration)을 특징으로 한다.

본 발명의 제1 양태의 대체 특징에서, 인코더와 디코더의 결합된 임펄스 응답은, 임펄스 응답의 누적 절대 응답이 송신 샘플 레이트에서의 2 샘플 주기를 초과하지 않는 누적 절대 응답의 최종 값의 1%로부터 50%까지 상승하는 지속기간을 갖는다.

그 결과, 시스템은, 시스템의 특정된 결합된 임펄스 응답에 연관된 안티에일리어싱 제거의 완화에도 불구하고 음질을 손상시키지 않고 오디오의 샘플 레이트 송신을 감소시킬 수 있다. 또한, 인코더와 디코더의 개별적인 응답들은, 합성 임펄스 응답이 컴팩트한 시스템 응답을 위한 특정된 기준을 충족한다면 다양한 적절한 설계들에 부합할 수 있다. 이러한 식으로, 본 발명은, 고 샘플 레이트에 연관된 가청 이점들을 유지하면서 오디오 캡처의 분산을 위한 샘플 레이트를 어떻게 감소시킬 것인지라는 과제를 해결하며, 이를 종래의 관점과는 역행하는 방식으로 행한다.

본 발명자들은 일부 관찰에 의해 해결책을 이끌어 냈으며, 이러한 해결책은, 단지 (신경 처리를 포함하여) 인간의 귀가 선형 및 시불변이라고 암시적으로 가정하는 적용분야에서의 종래의 통신 이론보다는 인간의 귀의 관찰된 특징들에 부분적으로 기초한다. 이는, 인간의 귀가 20kHz 미만 주파수에 민감하고 20kHz 대역폭이 나타낼 수 있는 것보다 높은 시간 정밀도를 갖는 임펄스에도 민감하다는 관찰을 포함한다.

대역 제한 물질에 대한 양호한 필터 성능을 위한 다운샘플링 요건들은, 일반적으로 임펄스 사운드에 대한 양호한 성능을 위한 요건들과 충돌한다. 고전적으로 이상적인 브릭월 필터는, 매우 넓은 시간대에 걸쳐 임펄스 에너지를 분산시켜, 두 귀 사이의 시간차 및 공간 특성들 등의 정확한 특성들을 결정하기 어렵게 한다.

그러나, 본 발명자들은, 192kHz 이상의 샘플 레이트에서 동작함으로써 관찰되는 유익한 음향 특성들이, 적어도 부분적으로, 고주파 신호 체인에서의 다운샘플링 및 업샘플링 필터들의 더욱 컴팩트한 임펄스 응답 덕분이라는 점에 주목하였다. 본 발명자들은, 또한, 유사하게 저 샘플 레이트로의 다운샘플링과 저 샘플 레이트로부터의 업샘플링을 위한 컴팩트한 임펄스 응답을 사용함으로써 96kHz 이하 등의 저 샘플 레이트를 이용하면서 이러한 음향 특성들이 보존될 수도 있다는 점을 인식하였다.

실제로, 본 발명자들은, 고 샘플링 레이트를 이용하는 기존의 장비보다 컴팩트한 임펄스 응답을 이용함으로써 저 샘플링 레이트에도 불구하고 이러한 음향 특성들이 더욱 개선될 수도 있다는 점을 인식하였다.

본 발명자들은, 또한, 실세계 오디오가 상승 잡음 스펙트럼과 하강 신호 스펙트럼을 가지며, 특히 에일리어싱 요건들이 리샘플링될 실제 오디오의 분석에 의해 결정되는 경우에 종래에 공지되어 있는 문헌들보다 에일리어싱 제거가 훨씬 덜 필요하다는 점을 인식하였다.

이러한 매우 컴팩트한 임펄스 응답들은 오디오 업계에서 고 품질 오디오에 필요한 것으로 여기는 것보다 에일리어싱 제거를 덜 나타내지만, 본 발명자들은, 컴팩트한 임펄스 응답의 음향 이점들이 요구되는 레벨로의 에일리어싱 제거의 감소로 인한 임의의 경미한 불리함을 훨씬 능가한다는 점을 인식하였다.

마지막으로, 본 발명자들은, 데시메이션과 보간을 모두 포함하는 신호 체인이 양측 필터들을 개별적보다는 쌍으로서 설계함으로써 개선될 수 있다는 점을 인식하였다.

본 발명의 개발시, 본 발명자들은, 과도한 포스트-링잉 없이 특히 과도한 프리-링잉 없이 필터들이 컴팩트한 것이 중요하다는 점을 알게 되었다. 이는 직관적인 개념에서 이해되지만, 필터 지속기간들이 비교될 수 있도록 청각적으로 중요한 지속기간의 척도를 확립하는 것이 유익하다. 이상적으로는, 이러한 척도가 연장된 응답의 가청 결과에 해당해야 하지만, 이러한 척도를 임펄스 검출에 관한 기존의 실험 데이터로부터 어떻게 도출할 것인지는 명확하지 않을 수도 있다.

필터의 지원은, 필터의 지속기간의 자연스러운 척도이지만, 등의 마일드 IIR 필터를 고려함으로써 알 수 있듯이, 현재의 목적을 위해서는 만족스럽지 못하다. 이 필터는 임펄스를 거의 분산시키지 못하지만, 무한 지원을 갖는다. 오히려, 임펄스 응답의 대부분이 시간에 있어서 어떻게 연장되는지를 보는 척도가 필요하다.

따라서, 누적 응답을 형성하도록 시스템의 임펄스 응답의 절대 크기를 시간에 대하여 적분하는 방안을 제안한다. 이러한 적분은, 저 레벨에서도 상당히 연장된 링잉을 불리하게 만드는 것이다. 누적 응답이 낮은 제1 임계값(예를 들어, 1%)로부터 높은 제2 임계값(예를 들어, 95%)까지 상승하는 것에 대하여 경과 시간이 측정되며, 이러한 임계값들은 도 14에 도시한 바와 같이 누적 응답의 최종 값의 퍼센트로서 표현된다. 그러나, 누적 응답을 특징화하는 경우 다른 임계값들을 사용할 수도 있으며, 이 경우, 서로 다른 측정을 반영하도록 샘플 주기 면에서 다른 지속기간을 특정할 수도 있다는 점에 주목한다.

시스템으로의 입력을 샘플링하는 경우, 임펄스 응답은 연속적이지 않다. 그러나, 누적값이 샘플 주기를 입력하도록 정량화될 임계값과 언제 교차하는지를 결정하지 않고자 하며, 이에 따라 절대 임펄스 응답 값들은 샘플 주기의 지속기간 동안 일정하게 유지된다. 이는 샘플링 순간들 간의 누적값을 선형 보간하는 것과 균등하다.

도 14는 도 5b를 참조하여 후술하는 본 발명에 따른 필터에 대한 이러한 방안의 동작을 도시한다. 후술하는 본 발명에 따른 다른 필터들은 유사하게 이러한 방안에 부합한다. 입력 샘플링 레이트는 송신 레이트의 두 배이며, 이에 따라 임펄스 응답이 송신 샘플 주기들의 절반 동안 유지된다. 임펄스 응답의 절대값을 적분하는 누적값은 (필터가 9 탭 FIR이므로) t=0에서의 임펄스 응답의 최종 값의 0%로부터 t=4.5에서의 100%까지 진행된다. 95% 레벨은 t=2.69 송신 레이트 샘플에서 누적값 그래프와 교차한다. 유사하게, 1% 레벨은 t=0.03 샘플에서 그래프와 교차하지만, 좌측 하부 코너의 이러한 스케일에서 보이지 않으므로 해당 도에는 도시되어 있지 않다. 결국, 이러한 방안에 의하면, 이 필터는, 2.69 - 0.03 = 2.66 송신 레이트 샘플의 지속기간을 갖고, 이에 따라 본 발명의 요건들을 충족한다.

청취 테스트에서는 짧은 임펄스 응답이 거의 항상 양호한 것임을 나타내었으며, 대부분의 경우에, 5 송신 레이트 샘플 주기를 초과하여 연장되는 이러한 정의에 의해 상당한 응답 지속기간을 갖지 않는 필터를 설계하는 것이 가능한 것으로 증명되었다. 그러나, 다른 모든 것들이 동등한 상황에서는, 짧을수록 더욱 양호하며, 지속기간이 4 송신 레이트 샘플 미만으로 더욱 바람직하게는 3 송신 레이트 샘플 미만으로 되는 것이 바람직하다.

이러한 시간적 지속기간의 정의는, 기준을 충족하는 시스템을 위한 특정 필터 설계에 비교되는 합성 임펄스 응답의 의미 있는 방안을 제공한다. 또한, 동일한 임펄스 응답의 시간적 지속기간을 위한 정의를 인코더 또는 디코더 또는 개별적인 필터들 등의 시스템 내의 구성요소들의 응답에 적용할 수 있으며, 이에 따라 하나가 다른 하나보다 컴팩트한지 여부에 관한 직접적인 비교 및 결정이 가능해진다.

전술한 시간적 지속기간의 정의에서의 임계값들은 사후 응답에 대한 필터 사전 응답의 더욱 큰 청취 가능성을 반영하도록 비대칭적이라는 점이 중요하다고 여겨진다. 추가 조사는, 샘플 길이 면에서 지속기간에 대한 대응하는 수정과 함께 청취가능 임팩트에 더욱 양호하게 일치하는 다른 구체적인 임계 레벨을 가리킬 수도 있다.

예를 들어, 초기에 빠르게 상승하는 누적값의 측정에 집중하는 것이 민감할 수도 있다. 이는, 아직 1%에 있는 제1 임계값으로 행해질 수 있지만, 50%에서의 제2 임계값으로 행해질 수 있다. 도 14에서, 50% 레벨은 t=0.99에서 누적값 그래프와 교차하며, 이에 따라 이 필터의 지속기간은 이러한 대체 방안에 따르면 0.99-0.03=0.96이다. 명백하게, 지속기간은 이러한 대체 방안에서 더욱 짧아서, 이 경우, 시스템 임펄스 응답의 지속기간은, 바람직하게 2 송신 레이트 샘플 미만이고, 더욱 바람직하게는 1.5 송신 레이트 샘플 미만이다.

시불변 선형 필터 또는 시스템을 고려하는 경우, 임펄스 응답은 잘 알려져 있는 특성이다. 그러나, 데시메이션을 포함하는 시스템에 있어서, 임펄스에 대한 응답은, 임펄스가 데시메이션된 처리의 샘플 포인트들에 관하여 언제 제시되는지에 따라 다를 수도 있다. 따라서, 이러한 시스템의 임펄스 응답을 언급하는 경우, 초기 임펄스의 이러한 모든 제시 순간들에 걸쳐 평균화된 응답을 의미하는 것이다.

바람직하게, 다운샘플러는 제1 샘플 레이트에 특정된 데시메이션 필터를 포함하고, 데시메이션 필터의 에일리어싱 제거는, 데시메이션 수행시, 0 내지 7kHz의 주파수 범위로 에일리어싱하는 주파수들에서 적어도 32dB이다.

0 내지 7kHz 범위는 귀가 가장 민감한 범위이다. 요구되는 감쇄량은, 나이퀴스트 주파수 근처에서 인코딩되는 신호의 스펙트럼에 따라 가변되며, 신호는 32dB를 초과하는 감쇄량을 필요로 할 수도 있다.

또한, 데시메이션 필터와 동일한 에일리어싱 제거, 및 누적 절대 응답이 송신 샘플 레이트의 5 샘플 주기를 초과하지 않는 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 응답을 갖는 제2 필터가 존재해야 하는 것이 바람직하다. 바람직하게, 지속기간은, 4 샘플 주기를 초과하지 않으며, 더욱 바람직하게는 3 샘플 주기를 초과하지 않는다.

이는, 원하는 음향 성능을 갖는 제2 필터를 설계하지만 데시메이션을 위해서는 동일한 에일리어싱 제거를 갖지만 기존 장비를 사용하는 청취자를 위해 통과대역 평탄화를 추가로 포함하는 다른 필터를 사용하는 것이 바람직할 수 있기 때문이다. 따라서, 실제 데시메이션 필터는 더욱 긴 지속기간을 가질 수도 있지만, 일치되는 디코더는 통과대역 평탄화를 취소하고, 이에 따라 초기 설계된 제2 필터의 음질에 대한 접근을 가능하게 한다.

필터 길이의 대체 방안에 의하면, 제2 필터는, 송신 샘플 레이트에서 2 샘플 주기를 초과하지 않는 누적 절대 응답의 최종 값의 1%로부터 50%까지 상승하는 지속기간을 갖는 응답을 특징으로 한다. 바람직하게, 지속기간은 1.5 샘플 주기를 초과하지 않는다.

일부 실시예들에서, 인코더는 폴(pole)을 갖는 무한 임펄스 응답(IIR) 필터를 포함하고, 디코더는 z-평면 위치가 폴의 z-평면 위치와 일치하는 제로(zero)를 갖는 필터를 포함하고, 이에 따라 그 영향이 재구성된 신호에서 상쇄된다.

다른 실시예들에서, 디코더는 폴을 갖는 무한 임펄스 응답(IIR) 필터를 포함하고, 인코더는 z-평면 위치가 폴의 z-평면 위치와 일치하는 제로를 갖는 필터를 포함하고, 이에 따라 그 영향이 재구성된 신호에서 상쇄된다.

바람직하게, 디코더는, 송신 샘플 레이트에 대응하는 나이퀴스트 주파수를 둘러싸는 영역에서 상승하는 응답을 갖는 필터를 포함하고, 인코더는 그 영역에 속하는 응답을 갖는 필터를 포함하고, 이에 따라 전체 시스템 주파수 응답 또는 임펄스 응답과 절충하지 않고 나이퀴스트 주파수를 초과하는 주파수들이 나이퀴스트 주파수 미만의 주파수들로 되도록 인코더의 하향 에일리어싱을 감소시킨다. 이러한 특징은, 초기 신호가 급격하게 상승하는 잡음 스펙트럼을 갖는 경우에 특히 유익하다.

바람직한 실시예들에서, 송신 샘플 레이트는 88.2kHz와 96kHz 중 하나로부터 선택되고, 제1 샘플 레이트는 176.4kHz, 192kHz, 352.8kHz, 및 384kHz 중 하나로부터 선택되며, 이들은 본 발명에서 청각적으로 유익한 것으로 밝혀진 표준화된 샘플 레이트들이다.

본 발명의 제2 양태에 따르면, 캡처된 오디오의 사운드를 전달하는 데 필요한 샘플 레이트를 감소시킴으로써 송신 샘플 레이트에서 송신하기 위한 디지털 오디오 신호를 제공하는 방법으로서, 송신 샘플 레이트의 배수인 제1 샘플 레이트에 특정된 데시메이션 필터를 사용하여 제1 샘플 레이트를 갖는 캡처된 오디오의 표현을 필터링하는 단계: 및 필터링된 표현을 데시메이션하여 디지털 오디오 신호를 제공하는 단계를 포함하고, 데시메이션 필터의 임펄스 응답은, 데시메이션 수행시 0 내지 7kHz로 에일리어싱하는 주파수 범위에서 적어도 32dB의 에일리어싱 제거를 갖고, 데시메이션 필터와 동일한 에일리어싱 제거, 및 누적 절대 응답이 송신 샘플 레이트에서의 5 샘플 주기를 초과하지 않는 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 응답을 갖는 제2 필터가 존재한다.

또한, 제2 필터는, 일치되지 않는 기존의 장비를 사용하는 청취자를 위해 통과대역 평탄화를 포함함으로써 실제 데시메이션 필터가 길어진 지속기간을 가질 수 있도록 사용될 수 있다. 대안으로, 기존 청취자를 위한 통과대역 평탄화가 수행되지 않으면, 데시메이션 필터가 제2 필터와 동일하다.

따라서, 본 발명은, 시스템 임펄스 응답을 필요 이상으로 연장하지 않으면서 바람직하지 못한 에일리어싱 산물 및 제1 샘플 레이트에서의 표현의 나이퀴스트 주파수 근처의 임의의 링잉을 적절히 제거한다.

일부 실시예들에서, 본 발명은, 캡처된 오디오의 스펙트럼을 분석하는 단계, 및 분석된 스펙트럼에 응답하여 데시메이션 필터를 선택하는 단계를 더 포함한다. 이어서, 방법은, 디코더에 의해 사용되도록 데시메이션 필터의 선택에 관한 정보를 제공하는 단계를 더 포함할 수도 있다. 일부 실시예들에서, 방법은, 캡처된 오디오의 잡음 플로어를 분석하는 단계, 및 분석된 잡음 플로어에 응답하여 데시메이션 필터를 선택하는 단계를 더 포함한다. 이러한 식으로, 데시메이션 필터와 디코더의 대응하는 재구성 필터 모두는 전달될 신호의 잡음 스펙트럼 또는 다른 특징들에 최적으로 일치하게 될 수 있다.

본 발명은 송신 샘플 레이트의 6 샘플 주기를 초과하지 않는 정도의 연속 시간 영역으로 동작하는 것이지만, 일부 실시예들에서, 이러한 연속 시간 영역의 정도는, 유리하게, 송신 샘플 레이트의 5 주기, 4 주기, 또는 심지어 3 주기 이하이다. 일부 신호들에 대해서는, 이러한 더욱 짧은 임펄스 응답들이 6 주기만큼 지속되는 임펄스 응답을 갖는 실시예들보다 청각적으로 더욱 유익하다는 점이 밝혀졌다.

본 발명의 제3 양태에 따르면, 데이터 캐리어는 전술한 양태의 방법을 수행함으로써 제공되는 디지털 오디오 신호를 포함한다.

본 발명의 제4 양태에 따르면, 오디오 스트림을 위한 인코더는 제2 양태의 방법을 이용하여 디지털 오디오 신호를 제공하도록 조정된다.

바람직한 실시예들에서, 인코더는 송신 나이퀴스트 주파수를 중심으로 대칭 응답을 갖는 평탄화 필터를 포함한다. 바람직하게, 평탄화 필터는 폴을 갖는다.

본 발명의 제5 양태에 따르면, 오디오 캡처의 사운드를 전달하기 위한 시스템을 제공하며, 시스템은, 오디오 캡처를 나타내는 신호를 수신하고 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정된 인코더로서, 인코더는, 누적 절대 응답이 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 임펄스 응답을 특징으로 하는, 인코더; 및 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정된 디코더로서, 디코더는, 누적 절대 응답이 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 임펄스 응답을 특징으로 하는, 디코더를 포함하고, 인코더와 디코더의 결합된 응답은, 인코더만의 임펄스 응답의 특징인 지속기간 및 디코더만의 임펄스 응답의 특징인 지속기간보다 짧은, 누적 절대 응답이 1%로부터 95%까지 상승하는 지속기간을 갖는 총 시스템 임펄스 응답을 생성한다.

이 양태는, 캡처된 오디오에 고 레벨의 잡음이 있는 스펙트럼 영역들을 다루도록 인코딩되는 자료의 특별한 특징들이 인코더 주파수 응답에 있어서 추가 폴이나 제로를 필요로 하는 경우에 유익할 수도 있다. 디코더 응답의 대응하는 제로나 폴은, 특별 대책이 완전한 시스템의 통과대역에 영향을 끼치지 않게 하며, 또한, 완전한 시스템 임펄스 응답이 특별 대책에 의해 변하지 않게 한다. 그러나, 개별적인 인코더와 디코더 응답들은, 그 대책에 의해 길어지며, 결합된 시스템 응답보다 모두 길어질 수도 있다.

바람직하게, 디코더는, 위치가 인코더의 응답에서의 폴의 위치와 일치하는 z-평면 제로를 갖는 필터를 포함한다.

바람직하게, 디코더는 인코더로부터 수신되는 정보에 따라 선택되는 필터를 포함한다.

일부 실시예들에서, 인코더와 디코더의 결합된 임펄스 응답은, 최고 피크를 갖고, 송신 샘플 레이트의 6 샘플 주기를 초과하지 않는 정도의 연속 시간 영역을 갖고, 이를 벗어나는 평균화된 임펄스 응답의 절대 값은 상기한 최고 피크의 10%를 초과하지 않는 것을 특징으로 한다.

본 발명의 제6 양태에 따르면, 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정된 인코더를 제공하며, 인코더는, 주파수 응답이 제로 주파수로 에일리어싱하는 각 주파수에서 두 개의 제로를 갖고 옥타브(octave)당 -13 데시벨보다 +인 송신 나이퀴스트 주파수에서의 기울기를 갖는 필터의 응답의 비대칭 성분과 같은 응답의 비대칭 성분을 갖는 다운샘플링 필터를 포함한다.

인코더는 송신 나이퀴스트 주파수를 중심으로 대칭 응답을 갖는 평탄화 필터를 포함하는 것이 바람직하다. 바람직하게, 평탄화 필터를 폴을 갖는다. 또한, 송신 주파수는 44.1kHz이고, 인코더의 주파수 응답 저하가 20kHz에서 1dB를 초과하지 않는 것이 바람직하다.

본 발명의 제7 양태에 따르면, 오디오 캡처의 사운드를 전달하기 위한 인코더와 디코더를 포함하는 시스템을 제공하며, 인코더는 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정되고, 디코더는 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정되고, 인코더는, 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 오디오 캡처를 나타내는 신호를 수신하고 그 신호를 다운샘플링하여 디지털 오디오 신호를 제공하도록 조정된 다운샘플러를 포함하고, 인코더는 폴을 갖는 무한 임펄스 응답(IIR) 필터를 포함하고, 디코더는 z-평면 위치가 폴의 z-평면 위치와 일치하는 제로를 갖는 필터를 포함하고, 이에 따라 그 영향이 재구성된 신호에서 상쇄된다.

바람직하게, 인코더와 디코더의 결합된 임펄스 응답은, 최고 피크를 갖고, 송신 샘플 레이트의 6 샘플 주기를 초과하지 않는 정도의 연속 시간 영역을 갖고, 이를 벗어나는 평균화된 임펄스 응답의 절대 값은 상기한 최고 피크의 10%를 초과하지 않는 것을 특징으로 한다.

본 발명의 제8 양태에 따르면, 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정된 인코더를 제공하며, 인코더는, 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 오디오 캡처를 나타내는 신호를 수신하고 그 신호를 다운샘플링하여 디지털 오디오 신호를 제공하도록 조정된 다운샘플링 필터를 포함하고, 인코더는, 캡처된 오디오의 스펙트럼을 분석하고 분석된 스펙트럼에 응답하여 다운샘플링 필터를 선택하도록 조정된다.

바람직하게, 선택된 다운샘플링 필터는, 분석된 스펙트럼이 송신 나이퀴스트 주파수에서 급격하게 상승하면 송신 나이퀴스트 주파수에서 급격한 감쇄 응답을 갖는다.

인코더는 선택된 다운샘플링 필터를 식별하는 정보를 디코더에 메타데이터로서 송신하도록 조정되는 것이 바람직하다.

본 발명의 제9 양태에 따르면, 송신 샘플 레이트에서 디지털 오디오 신호를 수신하고 출력 오디오 신호를 제공하는 디코더를 제공하며, 디코더는, 송신 샘플 레이트에 대응하는 나이퀴스트 주파수를 둘러싸는 주파수 영역에서의 주파수와 함께 증가하는 진폭 응답을 갖는 필터를 포함한다.

이러한 특징은, 최고 샘플 레이트에서의 표현이 상기 나이퀴스트 주파수에서 강력하게 상승하는 스펙트럼을 나타내고 종래의 오디오 대역인 0 내지 20kHz에 걸쳐 위상 왜곡을 최소화하는 것이 바람직한 경우에 나이퀴스트 주파수 근처의 주파수들에 대하여 신호 대 에일리어싱 비를 최적화하도록 필요하다.

바람직하게, 필터는, DC에서의 응답에 관하여, 송신 샘플 레이트에 대응하는 나이퀴스트 주파수에서 적어도 +2dB의 진폭 응답을 갖는다. 일반적으로, 상승 디코더 응답은, 오디오 범위에서의 평탄한 주파수 응답을 제공하고 총 시스템 임펄스 응답을 늘리지 않으면서 인코더가 적절한 에일리어싱 감쇄를 제공할 수 있는 경우에 유리할 수 있고, 디코더 응답은, 결국 하강해야 하지만, 일반적으로 상기 나이퀴스트 주파수에서 다소 상승된 상태로 있다.

일부 실시예들에서, 필터는 인코더로부터 수신되는 정보에 따라 선택되는 응답을 갖는 것이 바람직하다. 이는 인코더가 필터링을 최적으로 케이스마다 선택할 수 있게 한다.

통상의 기술자라면 인식하듯이, 재구성된 신호의 사운드를 최적화하고 특히 바람직하지 못한 방식으로 시스템의 총 임펄스 응답을 늘리지 않고 데시메이션 에일리어싱을 제어하는 다양한 방법들을 개시한다.

유리하게, 필터들은 소스 물질의 특징들에 응답하여 선택된다. 유사하게, 올-제로(all-zero), 올-폴(all-phole), 및 다상 등의 서로 다른 필터 구현예들이 각 상황에 적절하게 채택될 수도 있다. 추가 변형예들과 수정예들은 본 개시 내용의 통상의 기술자에게 명백할 것이다.

본 발명의 예들을 첨부 도면을 참조하여 상세히 설명한다.
도 1은 96kHz 샘플링에서 사용하기 위한 알려져 있는 "브릭월" 안티에일리어싱 필터 응답(실선) 및 아포다이징된 필터 응답(점선)을 나타낸다.
도 2a와 도 2b는 도 1에 도시한 주파수 응답들을 갖는 선형 위상 필터들에 대응하는 알려져 있는 임펄스 응답들을 나타낸다.
도 3은 연속 시간에 대한 후속 재구성과 함께 감소된 샘플 레이트에서 오디오 신호를 송신하기 위한 시스템을 나타낸다.
도 4는 DC에서의 단위 이득을 위해 정규화된 (½, 1, ½) 재구성 필터의 응답을 나타낸다.
도 5a는 비평탄화(unflattened) 다운샘플링 필터의 주파수 응답을 나타낸다.
도 5b는 평탄화를 포함하는 다운샘플링 필터의 주파수 응답을 나타낸다.
도 6은 도 5a의 통과대역 저하(droop)에 대하여 삼차 보정과 연속 시간에 대한 업샘플링을 포함하는 재구성 필터의 응답을 나타낸다.
도 7은 도 4와 도 5b의 필터들이 연속 시간에 대한 추가 업샘플링과 결합된 경우의 총 시스템 임펄스 응답을 나타낸다.
도 8은 강력하게 상승하는 초음파 응답을 갖는 두 개의 상업적 녹음의 스펙트럼을 나타낸다.
도 9는 도 5b의 다운샘플링 필터와 함께 사용하기 위한 약 48kHz를 중심으로 대칭되는 평탄화 필터의 응답을 나타낸다.
도 10은 도 5a의 다운샘플링 필터의 응답(하측 곡선) 및 도 9의 대칭 평탄화기를 이용한 평탄화 후의 응답(상측 곡선)을 나타낸다.
도 11은 선형 B-스플라인 샘플링 커널을 나타낸다.
도 12a는 원본 88.2kHz 스트림의 짝수 샘플들과 정렬된 44.1kHz 적외선 인코딩된 샘플들로부터 88.2kHz에서의 임펄스 재구성을 나타낸다.
도 12b는 원본 88.2kHz 스트림의 홀수 샘플들과 정렬된 44.1kHz 적외선 인코딩된 샘플들로부터 88.2kHz에서의 임펄스 재구성을 나타낸다.
도 13a는 60kHz 근처에서 강력한 감쇄를 제공하도록 제로들을 갖는 다운샘플링 필터의 응답을 나타낸다.
도 13b는 도 13a의 필터의 제로들의 총 응답에 대한 영향을 제거하도록 폴들을 갖는 업샘플링 필터의 응답을 나타낸다.
도 13c는 도 13a, 도 13b의 응답들의 결합으로부터의 종단간 응답, 및 추정되는 외부 저하를 나타낸다.
도 14는 도 5a에 도시한 필터의 정규화된 누적 임펄스 응답 대 샘플 주기의 시간을 나타낸다.

본 발명은 사용되는 시스템에 따라 서로 다른 많은 방식들로 구현될 수도 있다. 이하에서는 도면을 참조하여 일부 구현예들을 설명한다.

공리(Axioms)

대부분의 성인 청취자들은 20kHz를 초과하는 분리된 사인파를 들을 수 없으며, 이는 또한 지금까지 20kHz를 초과하는 신호의 주파수 성분들이 중요하지 않음을 의미한다고 종종 여겨졌다. 최근 실험에 의하면, 이러한 가정은, 선형 시스템 이론을 이용한 유추에 의해 그럴 듯 하지만, 정확한 것은 아니다.

인간의 청력에 대한 현재 이해는 매우 불완전하다. 따라서, 전진을 이루도록, 부분적으로 또는 간접적으로만 검증된 가설에 의존하였다. 이에 따라, 본 발명은 다음에 따르는 가설에 기초하여 설명한다.

- 귀는 선형 시스템처럼 기능하지 않는다.

- 귀는, 주파수 영역의 톤을 분석할 뿐만 아니라 시간 영역의 과도 현상도 분석한다. 이는 초음파 영역에서의 지배적 기구일 수도 있다.

- 안티에일리어싱과 재구성에 사용되는 필터들의 "링잉"은, 40kHz 내지 100kHz의 고 초음파 범위에서도 바람직하지 못하다.

- 48kHz를 초과하는 주파수를 48kHz 미만의 주파수로 에일리어싱하는 것은, 에일리어싱된 산물들이 통상적인 가청 범위인 0 내지 20kHz 내에 속하지 않는 한 음질에 치명적이지 않다.

- 프리-링은, 일반적으로 포스트-링보다 문제이지만, 이들 모두가 불량이다.

- 총 시스템 임펄스 응답의 시간적 정도가 최소화될 수 있다면 최선으로 보인다.

이러한 가설들 중 마지막 것에 관하여, "총 시스템(total system)"은 아날로그-대-디지털 및 디지털-대-아날로그 변환기들 및 이들 사이의 전체 디지털 체인을 포함하고자 하는 것이다. 이상적으로, 트랜듀서 응답들도 포함할 수도 있지만, 이러한 응답들은 본원의 범위를 벗어난다고 여겨진다.

샘플링 및 에일리어싱

연속 시간 신호는, 샘플 레이트가 무한대로 되는 경향이 있으므로 샘플링된 신호의 제한 사례라고 볼 수 있다. 이러한 점에서, 초기 신호가 아날로그인지 및 이에 따라 아마도 시간적으로 연속되는지 여부에 대하여 또는 초기 신호가 디지털인지 및 이에 따라 미리 샘플링되어 있는지 여부에 대해서는 관심을 갖지 않는다. 리샘플링에 관하여 논하는 경우, 초기 샘플들에 의해 표현되는 개념상 연속 시간 신호를 샘플링하는 것을 의미한다.

샘플링 또는 리샘플링의 주파수 영역 설명은, 초기 주파수 성분들이 리샘플링된 신호에 존재하지만 진폭 변조시 생성되는 "측대역(sidebands)"과 유사한 다수의 이미지들이 동반된다는 것이다. 따라서, 초기 45kHz 톤은, 96kHz에서 리샘플링되면 51kHz에서의 이미지를 생성하며, 51kHz는 96kHz에 의한 변조의 하측 측대역이다. 모든 주파수들을 48kHz의 나이퀴스트 주파수 주위에 "미러링"되는 것으로서 고려하는 것이 더욱 직관적일 수도 있으며, 이에 따라, 51kHz는 45kHz의 미러 이미지이고, 동등하게, 초기 51kHz 톤은 리샘플링된 신호에서 45kHz로 하향 미러링된다.

송신 채널이 서로 다른 레이트에서의 여러 리샘플링들을 포함하면, 초기 스펙트럼의 이미지들이 누적되며, 오디오 톤이 하나의 리샘플링에 의해 상향 미러링되고 이어서 후속 리샘플링에 의해 하향 미러링되어, 초기 주파수와는 다른 주파수이지만 가청 범위 내에 속하게 되는 모든 가능성이 존재한다. 이는 "정확한" 통신 실시를 통해 모든 이미지들이 억제되도록 각 단계에서 안티에일리어싱과 재구성 필터들이 사용되어야 한다는 점을 방지하는 것이다. 이를 행하게 되면, 리샘플링은 아티팩트의 축적 없이 임의로 케스케이딩될 수도 있고, 제한 사항은 주파수 범위가 체인에서 최저 샘플 레이트에 의해 다루어질 수 있는 범위로 제한되는 점뿐이다.

그러나, 통신 엔지니어링에서 정확하다고 여겨지는 필터들이 적어도 현재 대량 배포에 실용적인 샘플 레이트가 아니더라도 청각적으로 만족스럽지 못하다는 견해가 있다. 에일리어싱이 발생할 수도 있다는 점을 받아들이며, 필터링으로 인한 시스템의 임펄스 응답이 길어짐으로 인해 과도 현상의 '시간 스미어(time-smear)'에 대한 에일리어싱의 균형을 유지할 것을 제안한다.

따라서, 통상적인 실시와는 달리, 에일리어싱은, 완전히 제거되지 않으며, 신호의 각 리샘플링시 축적된다. 따라서, 임의의 레이트로의 다수의 리샘플링은 페널티 없이 수행되지 않으며, 신호가 분산에 사용될 레이트의 정수 배인 샘플 레이트에서 항상 표현된다면 최상이다. 예를 들어, 96kHz에서의 분산이 뒤따르는 192kHz에서의 아날로그-대-디지털 변환이 양호하며, 변환기의 대역 잡음 특징에 따라 384kHz에서의 변환이 더욱 더 양호할 수도 있다.

분산에 이어서, 소비자의 재생 장비도 긴 필터 응답을 도입하지 않도록 설계될 필요가 있으며, 실제로, 인코딩과 디코딩 사양은 바람직하게 총 시스템 응답의 확실성을 제공하도록 함께 설계되어야 한다.

96kHz 분산을 위한 192kHz로부터의 다운샘플링

192kHz에서 미리 디지털화된 신호를 취하고, 신호를 송신을 위해 96kHz로 다운샘플링한 후 수신시 192kHz로 다시 업샘플링하는 문제점을 고려한다. 본원에서 설명하는 원리가 송신뿐만 아니라 저장에도 적용되며, "송신"이라는 단어가 저장과 송신 모두를 포함한다는 것이 이해된다.

도 3에 도시한 시스템을 참조하면, 192kHz 등의 샘플링 레이트에서의 입력 신호 1은 다운샘플링 필터(2)에 전달되고 이어서 데시메이터(3)에 전달되어, 96kHz 등의 저 샘플링 레이트에서의 신호 4를 생성하게 된다. 96kHz 신호 6은 송신 또는 저장 디바이스(5)를 통과한 후, 업샘플링되고(7) 필터링되어(8) 192kHz 등의 샘플링 레이트에서의 부분적으로 재구성된 신호 9를 제공하게 된다.

본 발명은, 부분적으로 재구성된 신호 9를 생성하는 방법에 중점을 두고 있지만, 연속 시간 아날로그 신호 11을 제공하도록 추가 재구성 10이 필요하다는 점에도 주목한다. 본 발명의 목적은, 신호 11의 사운드를, 입력 신호 1를 제공하도록 디지털화된 아날로그 신호의 사운드에 최대한 가깝게 만드는 것이다. 이는, 반드시 신호 9가 엔지니어링 의미에서 신호 1에 가능한 가까워야 함을 의미하지는 않는다. 또한, 추가 재구성 10은, 필요하다면, 필터들(2, 8)의 설계에서 허용될 수 있는 주파수 응답 저하를 가질 수도 있다.

도 3은 필터(2)와 다운샘플러(3)를 별도의 엔티티들로서 도시하고 있지만, 때로는, 예를 들어, 다상 구현예에 있어서 이들을 결합하는 것이 더욱 효율적일 것이다. 유사하게, 업샘플러(7)와 필터(8)는 개별적으로 식별가능한 기능 유닛들로서 존재하지 않을 수도 있다.

다운샘플링은, 데시메이션을 이용하며, 이 경우, 192kHz 신호로부터 샘플들을 교대로 폐기하는 한편, 업샘플링은, 패딩을 이용하며, 이 경우, 96kHz 샘플들의 각 연속 쌍 사이에 제로 샘플을 삽입하고 또한 동일한 응답을 저 주파수로 유지하도록 2를 승산한다. 다운샘플링시, 48kHz의 "폴드오버" 주파수를 초과하는 주파수는 폴드오버 주파수 미만의 대응하는 이미지들로 미러링된다. 업샘플링시, 폴드오버 주파수 미만의 주파수는 폴드오버 주파수를 초과하는 대응 주파수로 미러링된다. 따라서, 업샘플링과 다운샘플링은 상향 에일리어싱된 산물과 하향 에일리어싱된 산물을 생성하며, 이는 데시메이션 전에 업샘플링 필터에 의해 및 패딩 후에 다운샘플링 필터에 의해 제어될 수 있다. 업샘플링과 다운샘플링 필터들은 192kHz의 초기 샘플링 주파수에서 특정된다.

에일리어싱된 산물이 무시되면, 총 응답은 업샘플링과 다운샘플링 필터들의 응답들의 결합이다. 시간 영역에서, 이 결합은 컨볼루션이다.

총 응답이 최소 길이의 유한 임펄스 응답(FIR) 필터의 응답으로 되도록 업샘플링과 다운샘플링 필터들을 설계함으로써 양호한 결과를 얻는다는 것을 알게 되었다. Z-변환 영역에서, 제로들은 바람직하지 못한 응답들을 억제하도록 이러한 필터들의 각각에 도입될 수 있다. 구체적으로, 각 필터는 96kHz의 나이퀴스트 주파수 근처의 신호들을 억제하도록 z=-1 근처에 하나 이상의 전달 함수 제로들을 가질 수 있다. 필터링 없는 다운샘플링시, 이러한 신호들은, 귀가 가장 민감한 10kHz 미만의 주파수를 포함하는 오디오 주파수들로 에일리어싱한다. 역으로, 필터링 없이 패딩에 의해 업샘플링이 수행되면, 큰 저 주파수 신호 콘텐츠가 96kHz 근처에서 큰 이미지 에너지를 생성하며, 이는 가청 결과 여부에 상관없이, 후속 전자 장치들의 슬루 레이트에 대하여 허용불가한 요구를 가할 수도 있고 또한 라우드스피커 트위터들을 번아웃할 수도 있다.

제로들이 모두 나이퀴스트에 가까운 FIR 필터들은, 그 자체로는, 오버슈트나 링잉을 야기하지 않으며, 임펄스 응답은 단극성이며 상당히 컴팩트하다. 그러나, 192kHz에서 구현되는 (1 + z^-1) 인수는 20kHz에서 0.47dB의 주파수 응답 저하를 가져온다. 이것은, 전문적인 디지털 오디오 장비에서 약간만 허용될 수 있는 것으로 간주되며, 이러한 여러 인수들, 예를 들어, 5개 이상의 인수들이 필요하다면, 통과대역 저하와 그 결과로 인한 사운드의 둔화가 확실하게 허용될 수 없게 된다. 이에 따라, 아래에서 간략히 설명되는 바와 같이 보정 또는 "평탄화" 필터가 요구된다.

재생(Playback)을 위한 96kHz로부터의 업샘플링

'2×' 단계들의 시퀀스를 이용하여 연속 시간 신호로의 재구성을 수행하는 것이 일반적이다. 즉, 샘플링 레이트는 통상적으로 각 단계에서 두 배로 되며, 샘플링 레이트가 384kHz 이상에 도달한 경우 디지털로부터 아날로그로의 변환을 수행한다. 우선, 가장 중요한 제1 단계인, 96kHz로부터 192kHz로의 업샘플링 단계에 집중한다.

이러한 업샘플링의 핵심은, 192kHz 스트림을 생성하도록 192kHz 샘플들을 제로-패딩하는 개념적 또는 물리적 동작이다. 즉, 샘플들이 96kHz 신호와 제로를 교대로 이용한 샘플인 192kHz 신호를 생성한다.

제로-패딩은 에일리어싱된 주파수와 동일한 진폭을 갖는 상향 에일리어싱된 산물을 생성한다. 현재 문맥에서, 이러한 산물들은 모두 48kHz 이상이며, 들리지 않을 것이라고 생각할 수도 있다. 그러나, 일반적으로, 신호는 저 오디오 주파수에서 높은 진폭을 가지며, 이는 96kHz 근처의 주파수에서 고 수준의 에일리어싱 산물을 의미한다. 전술한 바와 같이, 이러한 에일리어싱 산물은 후속 전자 장치들에 과도한 슬루 레이트 요구를 가하지 않고 라우드스피커 트위터들의 번아웃 위험성이 있도록 제어될 필요가 있다. 업샘플링 또는 재구성 필터의 목적은 이러한 제어를 제공하는 것이며, 96kHz 근처에서의 강력한 감쇄가 주요 요건임을 알 수 있다.

96kHz에서 192kHz로의 재구성에 만족스러운 것으로 여겨지는 가장 단순한 재구성 필터는 192kHz 레이트에서 구현된 탭(½, 1, ½)을 갖는 3-탭 FIR 필터이다. 이러한 필터의 정규화된 응답은 도 4에 도시되어 있다. 이 필터는 96kHz의 나이퀴스트 주파수에 대응하는 z=-1에서의 두 개의 z-평면 제로를 갖는다. 이러한 제로들은, 충분할 수도 있고 또는 충분하지 않을 수도 있는 96kHz 근처에서 감쇄를 제공하며, 이에 따라 나이퀴스트 근처의 추가 제로가 필요할 수도 있다. 또한, (½, 1, ½) 필터는, 20kHz에서 0.95dB의 저하 또는 176.4kHz에서 동작하는 경우엔 1.13dB의 저하를 도입하며, 보정될 필요가 있다.

통과대역(Passband) 평탄화

시스템은 다운샘플러를 포함하므로, 종래의 0 내지 20kHz 오디오 범위의 최상위를 향하여 저하되는 주파수 응답을 평탄화하기 위한 보정을 초기 샘플 레이트 또는 다운샘플링된 레이트에서 제공할 수 있지만, 업샘플링된 출력에 대한 최단 종단간 임펄스 응답을 제공하기 위해서는, 192kHz 등의 고 샘플 레이트에서 평탄화를 수행해야 한다. 이는 아래와 같은 보정 수행에 관한 선택을 여전히 남겨 둔다.

a. 인코더(다운샘플러)와 디코더(업샘플러) 각각이 자신의 고유한 저하에 대한 보정을 포함한다.

b. 인코더가 자신과 디코더를 위한 보정을 제공한다.

c. 디코더가 자신과 인코더를 위한 보정을 제공한다.

d. 인코더와 디코더 간의 보정의 임의의 분산

옵션 (a)는, 그 결과로 형성되는 다운샘플링된 스트림이 평탄한 주파수 응답을 갖고 특별한 디코더 없이 재생될 수 있으므로, 실제로 편리할 수도 있다. 그러나, 인코더와 디코더의 "종단간(end-to-end)" 임펄스 응답의 결합된 결과는, 단일 보정기가 총 저하를 위해 설계되는 경우보다 길 수 있다.

옵션 (b)와 (c)는, 동일한 종단간 임펄스 응답을 제공할 수도 있고, 총 응답에 대하여 단일 보정기가 생성되고, 인수분해되고 인수들이 분산되면 옵션 (d)도 그러할 수도 있다. 그러나, 종단간 응답들은 동일할 수도 있지만, 다운샘플링 전에 평탄화 필터를 인코더에 도입함으로써, 일반적으로, 인코더에서의 하향 에일리어싱을 증가시키며, 청취 테스트는, 업샘플링 후에 디코더에 평탄화 필터를 두는 것을 선호하는 경향이 있지만, 이로 인해 상향 에일리어싱이 강화된다.

보정 필터의 설계에 관하여, 통상의 기술자는, 선형 위상 저하의 경우, 저하의 z-변환의 역수를 z=1 근처의 멱급수로서 확장함으로써 선형 위상 보정 필터를 얻을 수 있다는 것을 알 것이다. 따라서, 이러한 총 응답은 멱급수 확장 순서를 조정하여 임의의 원하는 순서로 최대한 평탄하게 될 수 있다. 그러나, 본 문맥에서는, 선 응답(pre-response)을 피하도록 최소 위상 보정 필터가 바람직하다. 이를 위해, 우선, 대칭 필터를 생성하도록 저하를 자신의 고유한 시간 역과 컨볼루션하고 위 절차를 적용한다. 그 결과, 원래의 저하에 필요한 데시벨 단위로 2배의 보정을 제공하는 선형 위상 보정기를 얻게 된다. 이어서, 선형 위상 보정기는 z의 2차 및 선형 다항식들로 인수분해되고, 인수들의 절반은 최소 위상이고 절반은 최대 위상이다. 최소 위상 인수들을 선택 및 결합하고 단일 DC 이득으로 정규화하여 최종 보정 필터를 제공한다. 이러한 방법은, 전술한 2004 paper by Craven, building on the work of Wilkinson (Wilkinson, R.H., "High-fidelity finite-impulse-response filters with optimal stopbands" IEE Proc-G Vol. 120, no. 2, pp. 264-272: 1991 April)의 섹션 3.6에서 예시되었다.

보정 필터의 효과는 통과대역을 평탄화하는 것 뿐만 아니라 (b) 경우의 인코더의 또는 (c) 경우의 디코더의, 또는 (d) 경우에는 잠재적으로 인코더와 디코더 모두의 나이퀴스트 근처 응답도 증가시키는 것이며, 이러한 증가는 원하는 나이퀴스트 근처 감쇄 사양을 달성하도록 z=-1 근처에서의 추가 제로들의 도입을 필요로 할 수 있다. 추가 제로들은 보정 필터의 강도 증가를 필요로 한다. 따라서, 나이퀴스트 근처 및 통과대역 보정 필터를 감쇄시키는 제로들은, 만족할만한 결과를 얻을 때까지 함께 조절될 필요가 있다.

총 시스템 응답

제로-패딩된 96kHz 신호가 공급되는 경우, 192kHz 레이트에서 구현된 탭 (½, 1, ½)을 갖는 3-탭 재구성 필터의 출력은, 각 짝수 샘플이 대응 96kHz 샘플과 동일한 값을 갖고 각 홀수 샘플이 두 개의 이웃하는 짝수 샘플들의 평균과 같은 값을 갖는 192kHz 스트림이다. 이제, 연속 시간에 대한 다단 재구성이 각 단계에서 유사하게 3-탭 (½, 1, ½) 재구성 필터를 이용하면, 그 결과는 연속 96kHz 샘플들 간의 선형 보간과 등가일 것이다.

주파수 영역에서, 이러한 다단 재구성의 응답은 sinc 함수의 제곱이다.

여기서, f는 주파수이고,

이다.

통과대역 저하(droop)는, f의 이차식에 의해 근사화될 수도 있다.

이는, 96kHz로부터의 재구성시 20kHz에서 -1.34dB의 응답, 또는 88.2kHz로부터의 재구성시 20kHz에서 -1.61dB의 응답을 의미한다.

따라서, 연속 시간 신호의 재구성된 슬루(slew) 레이트는 선형 보간에 기초하여 96kHz 샘플들에 의해 암시되는 슬루 레이트보다 절대로 높지 않다. 그러나, 연속 시간 신호의 재구성된 슬루 레이트는 구배(gradient)의 작은 불연속성들을 가질 것이다. 충분히 작은 시간 스케일로 볼 때, 이는 음향적으로는 고사하고 전기적으로 가능하지 않다. 아날로그 프로세싱을 상세하게 고려하는 것은 본원의 범위를 벗어나는 것이지만, 모든 곳에서 +인 임펄스 응답은, Dirac 델타 함수가 아닌 한, 약간의 주파수 응답 저하를 갖는다는 점에 주목한다. 모든 통과대역 보정이 단일 지점에서 적용되는 경우 최단 총 임펄스 응답을 얻을 수 있으므로, 평탄한 총 응답을 생성하도록 아날로그 '피킹' 필터를 사용하지 않을 것을 선호한다. 따라서, 디지털 통과대역 평탄화가 아날로그 저하에 대하여 다소 허용할 수 있어야 함을 선호한다.

그러나, 보정되는 저하가 많을수록, 업샘플링 필터는 덜 컴팩트하게 된다. 따라서, 본원에서 제시되는 필터들에 있어서, 192kHz 스트림으로부터 연속 시간으로 가정된 다단 재구성에 대하여 sinc(·) ² 저하를 보상하였으며, 이때, 후속 아날로그 처리에 있어서 20kHz에서 0.162dB인 작은 저하를 허용하도록 추가 마진을 두었다. 이러한 마진은, 아날로그 시스템이 직사각형 형상이면서 5㎲ 정도인 엄격하게 음이 아닌 임펄스 응답 또는 대안으로 표준 편차가 약 3㎲인 가우스형 응답을 갖는 것을 허용한다.

도 5a는, 72dB의 나이퀴스트 근처 감쇄 및 z-변환 응답을 갖는, 이러한 원리에 따라 설계된 6-탭 다운샘플링 필터의 응답을 도시한다.

응답 (½ +　z^-1　+　½z^-2)을 갖는 전술한 3-탭 업샘플링 필터와 쌍으로 되면, 아래와 같은 4-탭 보정 필터는,

다운샘플링 필터와 3-탭 업샘플링 필터로부터의 총 저하를 보정하여, 전술한 바와 같은 아날로그 저하 효과를 포함하여, 20kHz에서 0.1dB 내에서 평탄한 종단간 응답을 제공한다. 이러한 보정 필터가 다운샘플링 필터와 폴딩되면, 결합된 인코딩 필터는 아래와 같은 z-변환,

, 및 도 5b에 도시한 바와 같은 응답을 갖고, 이러한 응답은 후속 업샘플링과 재구성으로부터 저하를 미리 보정하도록 20kHz를 초과하여 상승한다.

대안으로, 보정은, 도 6에 도시한 응답과 아래의 z-변환을 갖는 디코딩 필터를 생성하도록 업샘플링 필터 (½ +　z^-1　+　½z^-2)와 폴딩될 수 있으며, 이러한 업샘플링 필터의 응답은 도 4에 도시한 바와 같다.

이 경우, 도 5a의 응답을 갖는 6-탭 인코딩 필터로부터 저하를 보정하도록 상승 응답을 갖는 것은 디코더이다. 청취 테스트에 의하면, 이러한 9-탭 다운샘플링 필터가 긴 필터들에 비해 확실히 뛰어나다는 것을 나타내었으며, 짧은 필터들이 일반적으로 바람직하다고 추론하였다.

그러나, 더욱 중요한 것은 다운샘플러, 업샘플러 및 가정된 아날로그 응답이 결합된 경우의 총 응답이다. 도 7은, 전술한 바와 같은 다운샘플러, 다단 업샘플러, 및 폭이 5㎲인 직사각형 임펄스 응답을 갖는 아날로그 시스템으로부터의 임펄스 응답을 도시한다. 임계값을 적용하지 않은 경우, 응답의 총 크기는 13 샘플 또는 67.7㎲이지만, 임계값이 -40dB 또는 최대값의 1%인 경우, 응답의 절대값은, 49.5㎲크기의 영역에서만 임계값, 즉, 192kHz 레이트에서의 9.5 샘플 또는 96kHz의 송신 샘플 레이트에서의 4.75 샘플을 초과한다. 유사하게, 임계값이 -20dB 또는 최대값의 10%인 경우, 응답의 절대값은, 32.2㎲ 크기의 영역에서만 임계값, 즉, 192kHz 레이트에서의 6.2 샘플 또는 96kHz의 송신 샘플 레이트에서의 3.1 샘플을 초과한다. 따라서, 이 필터의 시간적 크기는 송신 샘플 레이트의 4 샘플 주기를 초과하지 않는 것이 안전하다고 할 수 있다. 다른 기준들이 강화되는 경우, 임펄스 응답은, 다소 길어질 필요가 있을 수도 있지만, 거의 모든 합리적인 경우에서, 송신 샘플 레이트에서 6 샘플 주기를 초과하지 않는 길이의 임펄스 응답을 달성할 수 있다.

도 7에 도시한 총 시스템 응답과 함께 전술한 다운샘플링과 업샘플링 필터들을 포함하는 인코더와 디코더 결합은, 이용가능한 192kHz 녹음에 있어서 청각적으로 양호한 결과를 생성하는 것으로 밝혀졌다. 실제로, 디코딩된 신호는, 때때로 다운샘플링 없는 192kHz 스트림의 종래의 재생보다 더욱 양호하게 들리며, 이러한 결과는, 192kHz 스트림에 이미 존재하고 있던 96kHz 근처의 임의의 링잉의 다운샘플링 필터에 의한 감쇄 덕분이라 할 수 있다.

잡음 스펙트럼 분석에 기초한 에일리어싱 거래(Alias Trading)

대부분의 상업용 소스 자료에는, 아날로그-대-디지털 변환기 및 잡음 쉐이퍼의 동작 때문에 초음파 영역에서 상승하는 잡음 플로어가 있다. 예를 들어, 도 8에서 상측 트레이스로 도시되어 있는, 시판되고 있는 Dave Brubeck Quartet의 "Take 5"의 176.4kHz 편곡의 스펙트럼은 33kHz와 55kHz 사이의 42dB만큼 증가하는 잡음 플로어를 나타내며, 이러한 주파수들은 다운샘플링시 44.1kHz의 폴드오버 주파수로부터 등거리에 있다. 데시메이션 전에 필터링이 없다면, 그 결과 형성되는 88.2kHz 스트림은, 33kHz에서 거의 전적으로 55kHz로부터 에일리어싱된 잡음으로 구성되고 이에 따라 녹음의 175.4kHz 표현보다 훨씬 높은 소정의 42dB의 스펙트럼 밀도를 갖게 된다.

도 5b의 다운샘플링 필터는, 192kHz 대신 176.4kHz에서 동작하면, 33kHz와 55kHz에서 +2.3dB과 -6.7dB의 이득을 각각 제공하며, 9dB 의 차가 발생한다. 이 필터로 "Take 5"를 다운샘플링하면, 55kHz로부터 에일리어싱된 성분들이 원래의 33kHz 성분들보다 33dB만큼 우세하게 유지된다. 도 5a의 대체 다운샘플링 필터는 이러한 두 개의 주파수 간에 16.8dB 차별을 제공하여, 원래의 성분들보다 25dB 높은 에일리어싱된 성분들을 발생시킨다. 이것은 다소 예외적인 경우이므로, 더욱 큰 차별을 갖는 (후술할) 필터들이 바람직할 수도 있으며, 그럼에도 불구하고, 도 5a의 필터는, 많은 경우에 만족스러운 것으로 밝혀졌으며, 도 5b의 필터보다 양호한 가청 결과를 제공한다. 따라서, 전술한 옵션 (c)에서와 같이, 보정 필터를 디코더에 배치하는 것은 보정 필터를 인코더에 배치하는 옵션 (b)보다 바람직해 보인다.

위 설명은 하향 에일리어싱된 신호 성분들에 중점을 두었지만, 보정 필터를디코더에 배치함으로써 상향 에일리어싱된 성분들을 증폭하는 효과를 갖는다는 점에 주목해야 한다. 이것은 상향 에일리어싱에 대한 하향 에일리어싱 및 192kHz에서 96kHz로의 또는 176.4kHz에서 88.2kHz로의 다운샘플링에 대한 거래의 문제이다. 상향 에일리어싱이 증가하더라도 하향 에일리어싱을 감소시키는 것이 청각적으로 나은 것으로 보인다.

원래의 성분들에 비해 얼마나 많은 에일리어싱된 성분들을 감소시켜야 하는지에 대한 확립된 기준은 없지만, 오디오 대역의 위상 왜곡과 총 잡음 간의 균형에 기초하여 기준을 도출할 수도 있다. 사전 응답을 피하도록 총 응답이 최소 위상이어야 한다고 가정한다. 평탄화 필터는 4차로 평탄해진 총 진폭 응답을 제공하도록 항상 설계되지만, Bode의 위상 편이 정리에 따르면, 초음파 감쇄가 도입되는 경우, 최소 위상 시스템에서 위상 왜곡이 불가피하다. 위상 응답이 주파수의 시리즈로서 확장되면, 홀수 멱들만이 존재하게 된다. 선형 항은 시간 지연과 동등하므로 관련이 없으며, 이에 따라 입방 항이 지배적으로 된다. 이제, 추가 감쇄 δg 데시벨이 주파수 f를 중심으로 하는 주파수 간격 δf로 도입되면, Bode의 정리로부터, 위상 응답에 있어서 입방 항(cube term)에 대한 가산 결과가 δg.δf/f ⁴ 에 비례한다고 추론할 수 있다. f에 대한 역 4차 멱 의존성으로부터, 소정의 위상 왜곡과 소정의 종단간 주파수 응답에 일치하는 최저 총 잡음에 대하여, 에일리어싱된 잡음 전력에 대한 원래의 잡음 전력의 비가 관련된 두 개의 주파수의 비의 역 4차 멱과 같도록 상향 및 하향 에일리어싱이 균형을 갖추어야 한다고 추론할 수 있다.

96kHz로의 다운샘플링의 경우, 이 기준은, 원래의 60kHz 잡음으로 인한 36kHz에서의 잡음 스펙트럼 밀도가 원래의 192kHz 샘플링된 신호의 36kHz에서의 잡음 스펙트럼 밀도보다 8.9dB 낮아야 함을 암시한다. 또한, 48kHz의 폴드오버 주파수에서, 다운샘플링 필터에 의한 필터링 후의 잡음의 스펙트럼은 -12dB/9ve인 최적의 기울기를 가져야 한다. 이는, 도 5a의 다운샘플링 필터의 기울기가 이 기준에 따라 "Take 5"의 경우에 충분하지 않으며, 이 기준이 적절하다고 간주되면 48kHz 근처에서 더욱 급격한 기울기를 갖는 다운샘플링 필터가 표시된다는 것이다. "Take 5"는 다소 예외적이지만, 도 8에 또한 도시되어 있는 "Dire Straits"의 "Brothers in Arms"의 스펙트럼도 폴드오버 주파수 근처에서 고 기울기를 갖는다.

다운샘플링된 신호의 평탄화

전술한 바와 같이, 에일리어싱 고려사항은, 다운샘플링 필터가 평탄화되지 않아서 평탄화가 후속 업샘플러로 연기되는 것을 종종 제안한다. 따라서, 송신된 신호는 평탄한 주파수 응답을 갖지 않을 것이며, 이는 평탄하지 않은 기존 장비와의 상호 운용성에 대한 단점이 될 수도 있다.

다운샘플러의 에일리어싱 특성에 영향을 끼치지 않고 그 단점을 피하는 방법은, 송신 나이퀴스트 주파수, 즉, 송신 샘플 주파수의 절반을 중심으로 대칭인 도 9에 도시된 바와 같은 응답을 갖는 필터를 사용하여 평탄화하는 것이다. 송신 나이퀴스트 주파수는, 192kH에서 96kHz로 다운샘플링할 경우 48kHz이며, 평탄하지 않은 응답과 평탄한 다운샘플링된 응답이 도 10에 도시되어 있다.

단점을 피할 수 있는 이유는, '기존의 평탄화기'가 각 주파수와 그 주파수의 에일리어싱 이미지를 동등하게 처리하는 대칭 필터이기 때문이다. 두 주파수는 동일한 비로 증폭되거나 절단되므로, 후속하는 데시메이션에서의 상향 대 하향 에일리어싱의 비가 영향을 받지 않는다. 도 9에 도시한 응답은 사실상 필터의 응답이다.

이것은, 최소 위상 올-폴이며, z의 짝수 멱들만을 포함한다. 2에 의한 데시메이션 전에 이러한 필터로 필터링하는 것은 올-폴 필터를 사용하여 데시메이션된 스트림을 필터링하는 것과 동등하다.

이것은, 예를 들어, 업샘플링 전에, 대응하는 역 필터를 수신된 데시메이션된 신호에 적용함으로써 디코더에서 역으로 될 수 있는 프로세스이다.

따라서, 인코딩 필터의 z-평면 폴들은 디코더의 제로들에 의해 상쇄된다. 시간 영역에서, 인코더에서 기존의 평탄화기에 의해 야기되는 임의의 링잉은 디코더의 대응하는 "기존의 비평탄화"에 의해 소멸되며, 이는, 인코더와 디코더의 결합의 총 임펄스 응답이 인코더 단독만의 임펄스 응답보다 컴팩트하게 되는 방법들 중 하나이다.

업샘플링 후에, 디코더는, 기존의 평탄화기가 없는 것처럼 더욱 높은 샘플 레이트에서 최적의 평탄화기를 심리 음향적으로 적용할 수 있다. 따라서, 데시메이션된 신호가 평탄화된 후 다시 평탄화되지 않는다는 것은 확실하게 명백하다.

대안으로, "기존의 비평탄화기"는 더욱 높은 샘플링 레이트에서

를 이용하여 업샘플링 후에 구현될 수 있다. 이것은 FIR 필터이므로, 업샘플링 필터 및 종단간 평탄화기와 함께 병합하는 것이 상당히 편리할 수도 있다. 이 경우, 기존의 비평탄화기는 별도의 식별가능한 기능 유닛이 아닐 수도 있다. 따라서, 기존의 평탄화기와 기존의 비평탄화기 모두에 대하여, 송신 샘플 레이트에서의 또는 더 높은 샘플 레이트에서의 구현 옵션이 있으며, 후자의 경우에는, 응답이 송신 나이퀴스트 주파수를 중심으로 대칭인 필터를 이용한다. 본원에서, 이러한 두 개의 구현 방법들은 동등한 것으로 여겨지며, 단지 이 방법들 중 하나를, 나머지 하나를 포함하도록 참조할 수도 있다. 또한, 더욱 높은 레이트에서 구현되는 경우, 평탄화기 또는 비평탄화기는 다른 필터링과 병합될 수도 있지만, 총 데시메이션 필터링 또는 총 재구성 필터링의 z-변환이 z ⁿ 의 멱만을 포함하는 z-변환 인자들을 각각 갖는다면 그 존재를 추론할 수도 있으며, 여기서, n은 데시메이션 또는 보간 비이다.

기존의 평탄화기는, 올-폴일 필요가 없으며, 그 평탄화기의 응답이 송신 나이퀴스트 주파수를 중심으로 대칭이라면 FIR 또는 일반적인 IIR 필터일 수 있다. 예를 들어, 아래와 같은 FIR 필터는,

인코더에서의 데시메이션 후에 적용될 수 있고 디코더에서의 업샘플링 전에 그 역이 적용될 수 있으며, 이러한 3차 FIR 필터는 송신 신호를 평탄화하는 데 있어서 도 9의 2차 올-폴 필터와 유사하게 효과적이다. 이 경우, 디코더는 인코더의 제로들을 상쇄하는 폴들을 갖는다. 대안으로, 이 FIR 평탄화기는

를 이용하여 데시메이션 전에 구현될 수 있으며, 이러한 형태에서, 다운샘플링 필터와 병합될 수 있어서, 별도의 기능 유닛으로서 식별되지 않을 수 있다.

본원에서는, 기존의 평탄화기를 2:1 다운샘플링의 문맥으로 설명하였지만, 동일한 원리를 n:1 다운샘플링의 경우에 적용하며, 이때, 기존의 평탄화 및 비평탄화는, 일반적인 최소 위상 필터와 그 역을 이용하여 송신 샘플 레이트에서 수행될 수도 있고, 또는 z ⁿ 의 멱만을 포함하는 필터를 이용하여 더욱 높은 샘플 레이트에서 수행될 수도 있다. 양측 모두에 있어서, 기존의 평탄화기는 송신 나이퀴스트를 중심으로 대칭인 데시벨 응답을 갖는다.

원래의 샘플 레이트에 적용되는 반전가능한 대칭 필터는 필터링의 에일리어싱 특징에 대하여 영향을 주지 않으며 그 영향이 디코더에서 완전하게 역으로 될 수 있다는 점에 주목하였으므로, 다운샘플링 필터의 한 후보의 적절성을 다른 한 후보와 비교하는 데 있어서, 데시벨 응답에서의 대칭 차이는 관련성이 없다. 따라서, 소정의 필터의 데시벨 응답 dB(f)를 대칭 성분

과 비대칭 성분

으로 분해한다.

여기서, f는 주파수이고, fs _trans 는 송신 샘플링 주파수이고, 두 개의 다운샘플링 필터 간의 비교를 위해, 비대칭 성분에 집중하여, 디코더에서 필요하다면 대칭 성분이 조절되게 한다. 비대칭 성분은, 사실상, 에일리어싱 제거의 절반이다.

적외선 코딩

Dragotti P.L., Vetterli M. 및 Blu T 의 논문인 "Sampling Moments and Reconstructing Signals of Finite Rate of Innovation: Shannon Meets Strang-Fix", IEEE Transactions on Signal Processing, Vol. 55, No. 5, May 2007을 참조해 본다. 이 논문의 섹션 III A는 임의의 위치와 진폭을 갖는 Dirac 펄스들의 스트림으로 이루어지는 신호를 고려하며, Dirac 펄스의 위치와 진폭이 신호의 균일하게 샘플링된 표현으로부터 명백하게 추론될 수도 있도록 어떤 샘플링 커널이 사용될 수 있는지에 대한 질문이 제기된다.

이러한 질문은, 나뭇가지 부러짐 등의 많은 자연 환경 사운드가 충동적이고 푸리에 표현이 이러한 유형의 신호에 적절하다는 것이 결코 분명하지 않다는 점에서, 오디오의 재생산과 관련될 수도 있다고 여긴다. 도 11에 도시한 선형 B-스플라인 커널은, Dirac 펄스의 위치와 진폭의 명확한 재구성을 가능하게 하는 가장 간단한 다항식 커널이다. 이러한 사상에 기초하여 "적외선 코딩"이라는 이름을 다운샘플링 사양에 부여하였다.

다운샘플링시, 이미 샘플링된 신호로 시작하지만, 개념적 모델은, 이것이 원래의 샘플에 Dirac 펄스의 시퀀스를 제공하는 연속 시간 신호라는 것이다. 연속 시간 신호는 커널과 컨벌루션되고 다운 샘플링된 신호의 레이트에서 리샘플링된다. 도 11을 참조해 볼 때, 리샘플링 순간들은, 정수 0, 1, 2, 3 등이 한편 원래의 신호는 더욱 세밀한 그리드로 제시된다. 원래의 샘플과 리샘플링 순간이 정렬된다고 가정하면, 선형 B- 스플라인과 이어지는 리샘플링에 의한 연속 시간 컨볼루션은 데시메이션(decimation) 전에 다음 시퀀스와의 이산 시간 컨볼루션과 동일하다.

(1, 2, 1) / 4 for decimation by 2

(1, 2, 3, 2, 1) / 9 for decimation by 3

(1, 2, 3, 4, 3, 2, 1) / 16 for decimation by 4

...

(1, 2, 3, 4, 5, 6, 7, 8, 7, 6, 5, 4, 3, 2, 1) / 64 for decimation by 8.

이러한 시퀀스들은 B-스플라인 커널의 원래의 샘플링 레이트에서의 샘플링일 뿐이다. 커널은 다운샘플링된 레이트에서 2 샘플 주기의 시간 정도를 가지므로, 모든 경우에 있어서, 다운샘플링 필터는 다운샘플링된 레이트에서 2 샘플 주기를 초과하지 않는 시간 정도를 갖는다.

따라서, 2에 의한 데시메이션을 위해, 다운샘플링 필터는 z-변환 (¼ + ½z^-1+ ¼z^-2)을 갖는다. 또한 업샘플링 후에 배치될 수 있거나 업샘플러와 병합될 수 있는 적합한 평탄화기와 함께 업샘플링을 위해 진폭이 적절하게 조정된 동일한 필터와 함께 다운샘플링을 위한 이 필터를 사용하여 매우 만족스러운 결과를 얻을 수 있다는 점이 밝혀졌다. 176.4kHz로부터 88.2kHz로의 다운샘플링을 위해, 결합된 다운샘플링과 업샘플링 저하 2.25dB @ 20kHz는, 아래와 같은 짧은 평탄화기를 사용하여 0.12dB로 감소될 수 있다.

이에 따라, 총 업샘플링과 다운샘플링 응답은 단지 7 탭을 갖는 FIR이며, 따라서, 총 시간의 정도는 176.4 샘플 레이트에서 6 샘플 주기이거나 다운샘플링된 레이트에서 3 샘플 주기이다. 이는, 흔히 청각적으로 만족스럽고 0 내지 20kHz에 걸쳐 평탄한 응답을 유지하는 것으로 알려져 있는 최단 총 필터 응답이다.

적외선 방안(infra-red prescription)은 강하게 상승하는 잡음 스펙트럼을 갖는 신호에 대해 바람직한 것으로 고려되는 하향 에일리어싱의 강한 제거를 제공하지 않지만, 그 초음파 잡음 스펙트럼이 평탄한 것에 더욱 가깝거나 떨어지는 많은 상업적 녹음이 존재한다. 2:1의 다운샘플링 비의 경우, 적외선 다운샘플링 필터의 기울기는 다운샘플링된 나이퀴스트 주파수에서 -9.5dB/8ve이며, 4:1의 비인 경우, 그 기울기는 -11.4dB/8ve이고, 연속 시간으로부터의 다운샘플링의 제한적인 경우에는, 그 기울기가 12dB/8ve이다. 이는, 도 5a의 다운샘플링 필터를 위한 -22.7dB/8ve의 기울기와 비교되며, 이러한 유형의 소스 자료에 대해서는, 적외선 인코딩 사양이 적합하지 않을 수도 있다.

일상적인 전문적 사용을 위한 인코더는, 이상적으로는, 예를 들어, 조용한 경과 동안 초음파 스펙트럼을 측정함으로써 인코딩을 위해 제시된 자료의 초음파 잡음 스펙트럼을 결정하려 하고, 이에 따라 그러한 특정 녹음을 재구성하도록 통지된 최적의 다운샘플링 및 업샘플링 필터 쌍을 선택해야 한다. 이어서, 그 선택은 대응하는 디코더에 메타데이터로서 통신되어야 하며, 이에 따라 디코더가 적절한 업샘플링 필터를 선택할 수 있다.

위 설명은, 실질적으로 192kHz 또는 176.4kHz 등의 "4×" 샘플링 레이트로부터 96kHz 또는 88.2kHz 등의 "2×" 샘플링 레이트로의 다운샘플링에 중점을 두었지만, 4× 또는 2× 샘플링 레이트로부터 48kHz 또는 44.1kHz 등의 1× 샘플링 레이트로의 다운샘플링도 상업적으로 중요하다. 사실상, 더욱 높은 샘플링 레이트에서 사용하도록 전술한 바와 같은 동일한 "적외선" 계수들 ¼ + ½z^-1+ ¼z^-2도, 88.2kHz로부터 44.1kHz로의 다운샘플링시 청각적으로 양호한 결과를 제공하는 것으로 밝혀졌다. 이것은 귀에서 이러한 낮은 샘플 레이트에서 원래 주파수의 하향 에일리어싱된 이미지를 더 많이 제거해야 할 것으로 예상했을 수도 있으므로 아마도 놀라운 일일 수 있지만, 청취 테스트를 반복해 보면 이것이 사실이 아닌 것으로 확인되었다. 동일한 필터는 평탄화기와 결합되거나 평탄화기가 후속하는 업샘플링에 사용될 수 있다. 이러한 낮은 샘플 레이트에서는, 탭이 더욱 많이 있는 평탄화기가 필요하며, 예를 들어,

와 같은 88.2kHz에서 동작하는 필터는, 다운샘플러와 업샘플러의 총 응답을 20kHz에서 0.2dB 내로 평탄화하며, 청각적으로 만족할만한 것으로 밝혀졌다.

평탄화기와 비평탄화기 쌍은 44.1kHz 재생 장비와 호환성이 있도록 전술한 바와 같이 제공될 수 있다. 저하가 20kHz에서 0.5dB를 초과하지 않는 최대 평탄 응답을 제공하도록, 아래와 같은 44.1kHz에서 구현된 9-탭 올-폴 평탄화기가 이론적으로 필요하지만,

여기서 제공된 분모의 이후 항들 중 일부는 통과대역 리플을 최소한으로 도입하여 삭제될 수 있다. 어느 경우든, 여기서 제공된 식은 대응하는 FIR 비평탄화기를 제공하도록 역으로 될 수 있다. 고 해상도 디코더는, 통상적으로 44.1kHz에서 비평탄화되고, 88.2kHz로 업샘플링된 후, 위에 주어진 7차 FIR 평탄화기 등의 88.2kHz에서 최적으로 설계된 평탄화기를 사용하여 평탄화된다. 이 경우, 인코더와 고 해상도 디코더 모두의 임펄스 응답은 12개의 비제로(nonzero) 탭을 갖는 반면, 인코더 단독은 -40dB 내지 -60dB 등의 더욱 낮은 레벨에도 더욱 길게 연속되는 임펄스 응답을 갖는다.

44.1kHz 레이트에서 동작하기 위해 본원에 제시된 평탄화 및 비평탄화 필터들 중 하나 또는 모두는, 보다 편리하다면, 88.2kHz 또는 더 높은 레이트에서 동작시 동일한 기능을 제공하도록 전술한 바와 같이 변환될 수 있다.

88.2kHz 스트림 내에서 시간 t=0에서 단일 샘플로서 제시되는 임펄스의 44.1kHz 적외선 코딩으로부터의 연속 시간에 대하여 상술한 바와 같은 재구성이 도 12a와 도 12b에 도시되어 있다. 도 12a에서, 재구성은 다이아몬드로 표시된 44.1kHz 샘플로부터 얻어진 것이며, 88.2kHz 스트림의 짝수 샘플들과 시간상 일치하는 반면, 도 12b에서, 재구성은 88.2kHz 스트림 포인트들의 홀수 샘플들과 일치하는 원으로 표시된 44.1kHz 샘플로부터 얻어진 것이다. 수평 축은 88kHz 샘플 주기 단위로 시간 t이며, 수직 축은 멱 0.21로 상승된 진폭을 나타내며, 이는 작은 응답들의 가시성을 제공하지만, 짧은 임펄스에 대하여, 주변 강도가 멱 0.21로 상승된 진폭에 비례함을 제안하는 인간의 청력의 신경생리학적 모델에 따라 소정의 타당성을 가질 수도 있다. 44.1kHz 표현은 기존 장비와의 호환성을 위해 평탄화를 포함하여 전술한 적외선 방법을 이용하여 유도되었지만, 2개의 고 해상도 재구성에서는 유사하게 적외선 재구성이 뒤따르는 기존의 비평탄화기 및 88.2kHz에서 구현되는 평탄화기를 사용한다.

44kHz 스트림은 임펄스의 고 해상도 재구성이 중단된 후에도 오랜 시간 지속되는 시간 응답을 나타내며, 따라서 인코더만의 응답보다 더욱 컴팩트한 종단간 응답을 제공하는 데 있어서 폴-제로 상쇄 효과를 입증한다는 점에 주목한다.

도 12a와 도 12b는, 또한, 데시메이션이 포함될 때 "임펄스 응답"의 개념을 더욱 명확하게 정의할 필요가 있음을 나타낸다. 2에 의한 데시메이션의 경우, 그 결과는, 홀수 샘플에서 제시되는 임펄스에 대하여 짝수 샘플에서 제시되는 임펄스와 다르다. 본원에서는, 이러한 두 가지 경우에서 얻은 응답들의 평균을 나타내도록 "임펄스 응답"이라는 용어를 사용한다.

전술한 바와 같은 적외선 코딩은 다운샘플링된 신호의 샘플링 주파수에서 2 개의 z-평면 제로를 제공하고, 2보다 큰 다운샘플링 비의 경우에는 그 주파수의 모든 배수에서 제공한다는 것을 이해할 것이다. 이것을 적외선 코딩의 정의 특징이라고 간주할 수 있다.

하향 에일리어싱의 억제

전술한 바와 같이, "take 5"와 같은 항목을 인코딩할 때(예를 들어 도 8 참조), 잡음 스펙트럼이 피크인 55kHz 등의 주파수에서 다운샘플링 필터가 강력한 감쇄를 제공하는 것이 바람직할 수도 있다. 이러한 주파수 근처의 에너지를 억제하도록 하나 이상의 z-평면 제로를 배치하는 것을 생각하는 것은 자연스럽다. 그러나, 이렇게 함으로써, 종단간 임펄스 응답의 총 길이가 증가하게 되며, 그 이유는, 첫째, 각 복소 제로가 다운샘플링 필터에 추가 2개의 탭을 필요로 하기 때문에, 둘째, 55kHz 근처의 제로가 총 저하에 상당히 기여하여 더욱 긴 평탄화 필터도 필요할 수 있기 때문이다.

하나의 주의 사항으로, 길이의 증가는 폴-제로 상쇄를 이용하여 피할 수 있으며, 인코더의 필터의 복소 제로는 디코더의 폴에 의해 상쇄된다. 일 실시예에서, 이러한 3개의 제로를 포함하는 다운샘플링 필터는 3개의 대응하는 폴을 갖는 업샘플링 필터와 쌍을 이룬다. 그 결과, 다운샘플링과 업샘플링 필터 응답들은 도 13a와 도 13b에 도시되어 있으며, 이러한 두 개의 필터를 가정된 외부 저하와 결합함으로 인한 종단간 응답이 도 13c에 도시되어 있다. 다른 그래프와의 일관성을 위해, 이러한 플롯들은 196kHz의 샘플링 레이트를 가정하므로, 최대 감쇄는 55kHz라기보다는 60kHz에 근접한다.

여기서 주의해야 할 것은, 하향 에일리어싱이 억제되었지만 상향 에일리어싱은 증가했다는 점이다. "Take 5"와 같은 트랙에서 사용하기 위해, 상승된 에일리어싱된 잡음은 가파르게 상승하는 원래의 잡음에 의해 잘 커버된다. 그러나, 33kHz 근처의 신호 성분들은 또한 55kHz 근처에서 훨씬 더 큰 에일리어싱을 발생시킨다. 따라서, 에일리어싱된 성분들을 무시하는 종단간 주파수 응답을 제시하는 것은 오해의 소지가 있다. 그럼에도 불구하고, 에일리어싱에 적용된 부스트가 과도하지 않다면, 귀는 상향 에일리어싱에 대하여 비교적 관대한 것으로 보인다.

도 13b에 도시한 57kHz에서의 38dB의 큰 부스트는 처음에는 바람직하지 못한 것처럼 보일 수도 있지만, 기존의 평탄화기가 전술한 바와 같이 사용된다면, 디코더는 이 부스트의 대부분을 보상할 기존의 비평탄화기를 통합함으로, 디코더는 전체적으로 부스트를 나타내지 않는다.

결론

본원에서 설명하는 디코딩 응답들 중 일부는 일반적으로 재구성 필터에 없는 특징들을 갖는다는 점에 주목해야 한다. 이러한 특징들은, 44.kkHz 또는 48kHz인 절반-나이퀴스트 주파수에서 하강하기보다는 상승하는 응답 및 z만의 짝수 멱의 함수들인 하나 이상의 인수를 갖고 이에 따라 절반-나이퀴스트 주파수를 중심으로 대칭되는 개별적인 응답들을 갖는 z-변환을 포함한다.

Claims

오디오 캡처의 사운드를 전달하기 위한 인코더와 디코더를 포함하는 시스템으로서,
상기 인코더는 상기 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정되고, 상기 디코더는 상기 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정되고,
상기 인코더는, 상기 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 상기 오디오 캡처를 나타내는 신호를 수신하고 상기 신호를 다운샘플링하여 상기 디지털 오디오 신호를 제공하도록 조정된 다운샘플러를 포함하고,
상기 인코더와 상기 디코더의 결합된 임펄스 응답은, 상기 임펄스 응답의 누적 절대 응답이 상기 송신 샘플 레이트에서의 5 샘플 주기를 초과하지 않는 상기 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖고, 상기 누적 절대 응답은 상기 임펄스 응답의 절대 크기의 시간 적분인 것을 특징으로 하는 시스템.
제1항에 있어서, 상기 인코더와 상기 디코더의 결합된 임펄스 응답의 상기 특징적인 지속기간은 상기 송신 샘플 레이트의 4 주기 이하인, 시스템.
오디오 캡처의 사운드를 전달하기 위한 인코더와 디코더를 포함하는 시스템으로서,
상기 인코더는 상기 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정되고, 상기 디코더는 상기 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정되고,
상기 인코더는, 상기 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 상기 오디오 캡처를 나타내는 신호를 수신하고 상기 신호를 다운샘플링하여 상기 디지털 오디오 신호를 제공하도록 조정된 다운샘플러를 포함하고,
상기 인코더와 상기 디코더의 결합된 임펄스 응답은, 상기 임펄스 응답의 누적 절대 응답이 상기 송신 샘플 레이트에서의 2 샘플 주기를 초과하지 않는 상기 누적 절대 응답의 최종 값의 1%로부터 50%까지 상승하는 지속기간을 갖고, 상기 누적 절대 응답은 상기 임펄스 응답의 절대 크기의 시간 적분인 것을 특징으로 하는 시스템.
제3항에 있어서, 상기 인코더와 상기 디코더의 결합된 임펄스 응답의 상기 특징적인 지속기간은 상기 송신 샘플 레이트의 1.5 주기 이하인, 시스템.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 다운샘플러는 상기 제1 샘플 레이트에 특정된 데시메이션 필터를 포함하고, 상기 데시메이션 필터의 에일리어싱 제거는, 데시메이션 수행시, 0 내지 7kHz로 에일리어싱하는 주파수 범위에서 적어도 32dB인, 시스템.
제1항 또는 제2항을 인용하는 제5항에 있어서, 상기 데시메이션 필터와 동일한 에일리어싱 제거 및 누적 절대 응답이 상기 송신 샘플 레이트에서의 5 샘플 주기를 초과하지 않는 상기 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 임펄스 응답을 갖는 제2 필터가 존재하는, 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 인코더는 폴(pole)을 갖는 무한 임펄스 응답(IIR) 필터를 포함하고, 상기 디코더는 z-평면 위치가 상기 폴의 z-평면 위치와 일치하는 제로(zero)를 갖는 필터를 포함하고, 이에 따라 그 영향이 상기 재구성된 신호에서 상쇄되는, 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 디코더는 폴을 갖는 무한 임펄스 응답(IIR) 필터를 포함하고, 상기 인코더는 z-평면 위치가 상기 폴의 z-평면 위치와 일치하는 제로를 갖는 필터를 포함하고, 이에 따라 그 영향이 상기 재구성된 신호에서 상쇄되는, 시스템.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 디코더는 상기 송신 샘플 레이트에 대응하는 나이퀴스트 주파수를 둘러싸는 영역에서 상승하는 응답을 갖는 필터를 포함하고, 상기 인코더는 상기 영역에 속하는 응답을 갖는 필터를 포함하고, 이에 따라 상기 나이퀴스트 주파수를 초과하는 주파수들이 상기 나이퀴스트 주파수 미만의 주파수들로 되도록 상기 인코더의 하향 에일리어싱을 감소시키는, 시스템.
제1항 내지 제9항 층 어느 한 항에 있어서, 상기 송신 샘플 레이트는 88.2kHz와 96kHz 중 하나로부터 선택되고, 상기 제1 샘플 레이트는 176.4kHz, 192kHz, 352.8kHz, 및 384kHz 중 하나로부터 선택되는, 시스템.
캡처된 오디오의 사운드를 전달하는 데 필요한 샘플 레이트를 감소시킴으로써 송신 샘플 레이트에서 송신하기 위한 디지털 오디오 신호를 제공하는 방법으로서,
상기 송신 샘플 레이트의 배수인 제1 샘플 레이트에 특정된 데시메이션 필터를 사용하여 상기 제1 샘플 레이트를 갖는 상기 캡처된 오디오의 표현을 필터링하는 단계: 및
필터링된 상기 표현을 데시메이션하여 상기 디지털 오디오 신호를 제공하는 단계를 포함하고,
상기 데시메이션 필터의 임펄스 응답은, 데시메이션 수행시, 0 내지 7kHz로 에일리어싱하는 주파수 범위에서 적어도 32dB의 에일리어싱 제거를 갖고,
상기 데시메이션 필터와 동일한 에일리어싱 제거, 및 누적 절대 응답이 상기 송신 샘플 레이트에서의 5 샘플 주기를 초과하지 않는 상기 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 임펄스 응답을 갖는 제2 필터가 존재하고, 상기 누적 절대 응답은 상기 임펄스 응답의 절대 크기의 시간 적분인, 방법.
제11항에 있어서, 상기 제2 필터의 상기 임펄스 응답의 상기 특징적인 지속기간은 상기 송신 샘플 레이트의 4 주기 이하인, 방법.
제11항 또는 제12항에 있어서, 상기 제1 샘플 레이트에서 상기 캡처된 오디오의 표현을 확립하는 단계를 더 포함하는, 방법.
제11항 내지 제13항 중 어느 한 항에 있어서, 상기 캡처된 오디오의 스펙트럼을 분석하는 단계; 및
분석된 상기 스펙트럼에 응답하여 데시메이션 필터를 선택하는 단계를 더 포함하는, 방법.
제11항 내지 제14항 중 어느 한 항에 있어서, 상기 캡처된 오디오의 잡음 플로어를 분석하는 단계, 및 분석된 상기 잡음 플로어에 응답하여 데시메이션 필터를 선택하는 단계를 더 포함하는, 방법.
제14항 또는 제15항에 있어서, 디코더에 의해 사용되도록 상기 데시메이션 필터의 선택에 관한 정보를 제공하는 단계를 더 포함하는, 방법.
제11항 내지 제16항 중 어느 한 항에 있어서, 상기 송신 샘플 레이트는 88.2kHz와 96kHz 중 하나로부터 선택되고, 상기 제1 샘플 레이트는 176.4kHz, 192kHz, 352.8kHz, 및 384kHz 중 하나로부터 선택되는, 방법.
제11항 내지 제17항 층 어느 한 항에 따른 방법을 수행함으로써 제공되는 디지털 오디오 신호를 포함하는 데이터 캐리어.
제11항 내지 제17항 중 어느 한 항에 따른 방법을 이용하여 디지털 오디오 신호를 제공하도록 조정된, 오디오 스트림을 위한 인코더.
제19항에 있어서, 송신 나이퀴스트 주파수를 중심으로 대칭 응답을 갖는 평탄화 필터를 포함하는, 오디오 스트림을 위한 인코더.
제20항에 있어서, 상기 평탄화 필터는 폴을 갖는, 오디오 스트림을 위한 인코더.
오디오 캡처의 사운드를 전달하기 위한 시스템으로서,
상기 오디오 캡처를 나타내는 신호를 수신하고 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정된 인코더로서, 상기 인코더는, 누적 절대 응답이 상기 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 임펄스 응답을 특징으로 하는, 인코더; 및
상기 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정된 디코더로서, 상기 디코더는, 누적 절대 응답이 상기 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 갖는 임펄스 응답을 특징으로 하는, 디코더를 포함하고,
상기 인코더와 상기 디코더의 결합된 응답은, 상기 인코더만의 임펄스 응답의 특징인 지속기간 및 상기 디코더만의 임펄스 응답의 특징인 지속기간보다 짧은, 누적 절대 응답이 1%로부터 95%까지 상승하는 지속기간을 갖는 총 시스템 임펄스 응답을 생성하고, 상기 누적 절대 응답은 상기 임펄스 응답의 절대 크기의 시간 적분인, 시스템.
제22항에 있어서, 상기 디코더는, 위치가 상기 인코더의 응답에서의 폴의 위치와 일치하는 z-평면 제로를 갖는 필터를 포함하는, 시스템.
제22항 또는 제23항에 있어서, 상기 디코더는 상기 인코더로부터 수신되는 정보에 따라 선택되는 필터를 포함하는, 시스템.
제22항 내지 제24항 중 어느 한 항에 있어서, 상기 시스템의 임펄스 응답의 상기 지속기간은 상기 송신 샘플 레이트의 5 샘플 주기 이하인, 시스템.
오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정된 인코더로서,
제로 주파수로 에일리어싱하는 각 주파수에서 더블 제로를 갖고 옥타브(octave)당 -13 데시벨보다 +인 송신 나이퀴스트 주파수에서의 기울기를 갖는 주파수 응답을 특징으로 하는 다운샘플링 필터를 포함하는, 인코더.
제26항에 있어서, 상기 송신 나이퀴스트 주파수를 중심으로 대칭 응답을 갖는 평탄화 필터를 포함하는, 인코더.
제27항에 있어서, 상기 평탄화 필터는 폴을 갖는, 인코더.
제27항 또는 제28항에 있어서, 상기 송신 주파수는 44.1kHz이고, 상기 인코더의 주파수 응답 저하는 20kHz에서 1dB를 초과하지 않는, 인코더.
오디오 캡처의 사운드를 전달하기 위한 인코더와 디코더를 포함하는 시스템으로서,
상기 인코더는 상기 오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정되고, 상기 디코더는 상기 디지털 오디오 신호를 수신하고 재구성된 신호를 제공하도록 조정되고,
상기 인코더는, 상기 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 상기 오디오 캡처를 나타내는 신호를 수신하고 상기 신호를 다운샘플링하여 상기 디지털 오디오 신호를 제공하도록 조정된 다운샘플러를 포함하고,
상기 인코더는 폴을 갖는 무한 임펄스 응답(IIR) 필터를 포함하고, 상기 디코더는 z-평면 위치가 상기 폴의 z-평면 위치와 일치하는 제로를 갖는 필터를 포함하고, 이에 따라 그 영향이 상기 재구성된 신호에서 상쇄되는, 시스템.
제30항에 있어서, 상기 인코더와 상기 디코더의 결합된 임펄스 응답은, 상기 임펄스 응답의 누적 절대 응답이 상기 송신 샘플 레이트에서의 5 샘플 주기를 초과하지 않는 상기 누적 절대 응답의 최종 값의 1%로부터 95%까지 상승하는 지속기간을 특징으로 하는 시스템.
오디오 캡처를 나타내는 신호로부터 송신 샘플 레이트에서 디지털 오디오 신호를 제공하도록 조정된 인코더로서,
상기 송신 샘플 레이트의 배수인 제1 샘플 레이트에서 상기 오디오 캡처를 나타내는 신호를 수신하고 상기 신호를 다운샘플링하여 상기 디지털 오디오 신호를 제공하도록 조정된 다운샘플링 필터를 포함하고,
상기 인코더는, 캡처된 오디오의 스펙트럼을 분석하고 분석된 상기 스펙트럼에 응답하여 다운샘플링 필터를 선택하도록 조정된, 인코더.
제32항에 있어서, 선택된 상기 다운샘플링 필터는, 상기 분석된 스펙트럼이 송신 나이퀴스트 주파수에서 급속히 상승하면 상기 송신 나이퀴스트 주파수에서 더욱 급격한 감쇄 응답을 갖는, 인코더.
제32항 또는 제33항에 있어서, 상기 인코더는 선택된 상기 다운샘플링 필터를 식별하는 정보를 디코더에 메타데이터로서 송신하도록 조정된, 인코더.
제32항 내지 제34항 중 어느 한 항에 있어서, 송신 나이퀴스트 주파수를 중심으로 대칭 응답을 갖는 평탄화 필터를 포함하는, 인코더.
제35항에 있어서, 상기 평탄화 필터는 폴을 갖는, 인코더.
송신 샘플 레이트에서 디지털 오디오 신호를 수신하고 출력 오디오 신호를 제공하는 디코더로서,
상기 송신 샘플 레이트에 대응하는 나이퀴스트 주파수를 둘러싸는 주파수 영역에서의 주파수와 함께 증가하는 진폭 응답을 갖는 필터를 포함하는, 디코더.
제37항에 있어서, 상기 필터는, DC에서의 응답에 관하여, 상기 송신 샘플 레이트에 대응하는 상기 나이퀴스트 주파수에서 적어도 +2dB의 진폭 응답을 갖는, 디코더.
제37항 또는 제38항에 있어서, 상기 필터의 응답은 인코더로부터 수신되는 정보에 따라 결정되는, 방법.