KR101187597B1 - 복소수 값 필터 뱅크들을 사용하는 오디오 신호들의 인코딩및 디코딩 - Google Patents

복소수 값 필터 뱅크들을 사용하는 오디오 신호들의 인코딩및 디코딩 Download PDF

Info

Publication number
KR101187597B1
KR101187597B1 KR1020077012506A KR20077012506A KR101187597B1 KR 101187597 B1 KR101187597 B1 KR 101187597B1 KR 1020077012506 A KR1020077012506 A KR 1020077012506A KR 20077012506 A KR20077012506 A KR 20077012506A KR 101187597 B1 KR101187597 B1 KR 101187597B1
Authority
KR
South Korea
Prior art keywords
subband
signal
time domain
subband signal
generating
Prior art date
Application number
KR1020077012506A
Other languages
English (en)
Other versions
KR20070085681A (ko
Inventor
랄스 에프. 빌레모에스
에릭 지이. 피. 츄이절스
Original Assignee
돌비 인터네셔널 에이비
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 돌비 인터네셔널 에이비
Publication of KR20070085681A publication Critical patent/KR20070085681A/ko
Application granted granted Critical
Publication of KR101187597B1 publication Critical patent/KR101187597B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

인코더(109)는 시간 도메인 오디오 신호를 수신하는 수신기(201)를 포함한다. 필터 뱅크(203)는 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하고, 그 경우에 상기 제 1 서브대역은 상기 시간 도메인 신호의 비임계적으로 샘플링된(non-critically sampled) 복소수 서브대역 도메인 표현에 대응한다. 변환 프로세서(205)는 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성한다. 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응한다. 그에 따라, 인코드 프로세서(207)는 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성한다. 변환 프로세서(205)는 시간 도메인으로 다시 변환하지 않으며 직접적인 서브대역 변환에 의해 상기 제 2 서브대역 신호를 생성한다. 본 발명은 파라메트릭 인코딩에서 전형적으로 생성되는 오버샘플링된 서브대역 신호가 감소된 복잡성을 통해 인코딩된 파형이도록 허용한다. 디코더는 역 동작을 수행한다.
시간 도메인 오디오 신호, 제 1 서브대역 신호, 변환 프로세서, 제 2 서브대역 신호, 파라메트릭 인코딩

Description

복소수 값 필터 뱅크들을 사용하는 오디오 신호들의 인코딩 및 디코딩{Encoding and decoding of audio signals using complex-valued filter banks}
본 발명은 오디오 신호들의 인코딩 및/또는 디코딩, 구체적으로는 오디오 신호의 파형 인코딩/디코딩에 관한 것이다.
다양한 소스 신호들의 디지털 인코딩은 디지털 신호 표현 및 통신이 아날로그 표현 및 통신을 점차적으로 대신함에 따라 지난 수 십년에 걸쳐 점차적으로 중요시되어 왔다. 예를 들어 모바일 통신을 위한 글로벌 시스템과 같은 모바일 텔레폰 시스템들은 디지털 음성 인코딩에 기초한다. 또한, 비디오 및 뮤직과 같은 미디어 콘텐츠의 분배는 점차적으로 디지털 콘텐츠 인코딩에 기초하고 있다.
통상적으로, 오디오 인코딩은 기본 파형이 디지털화되고 효율적으로 인코딩된 파형 인코딩을 주로 사용하여 왔다. 예를 들어, 전형적인 파형 인코더는 주파수 서브대역 도메인에서 신호를 변환하는 필터 뱅크를 포함한다. 정신 음향학 모델에 기초하여, 마스킹 문턱이 적용되고 결과적인 서브대역 값들은 예를 들어 허프만 코드(Huffman code)를 사용하여 효율적으로 양자화 및 인코딩된다.
파형 인코더들의 예들은 공지된 MPEG-1 레이어 3(종종 MP3로 언급됨) 또는 AAC(Advanced Audio Coding) 인코딩 방식들을 포함한다.
최근 수 년 동안, 다수의 인코딩 테크닉들은 기본 파형을 직접적으로 인코딩하지 않고 다수의 파라미터들에 의한 인코딩된 신호들을 특징으로 할 것을 제안하여 왔다. 예를 들어, 보이스 인코딩에 대해, 인코더 및 디코더는 휴먼 보이스 계통의 모델에 기초할 수 있고, 파형을 인코딩하는 대신에 그 모델에 대한 다양한 파라미터들 및 여기 신호들(excitation signal)이 인코딩될 수 있다. 그러한 테크닉들은 일반적으로 파라메트릭 인코딩 테크닉들로 언급된다.
더욱이, 파형 인코딩 및 파라메트닉 인코딩은 특별히 효율적이고 고품질 인코딩을 제공하도록 결합될 수 있다. 그러한 시스템들에 있어서, 파라미터들은 파형 인코딩된 신호의 또 다른 부분을 참조로 하여 그 신호의 일부분을 기술할 수 있다. 예를 들어, 코딩 테크닉들은 하위 주파수들이 파형 인코딩되고 상위 주파수들이 그 하위 주파수들과 비교한 상위 주파수들의 속성들을 기술하는 파라메트릭 확장에 의해 인코딩되는 것을 제안하여 왔다. 또 다른 예로, 다중 채널 신호 인코딩은 예로서 단일 신호가 파형 인코딩되고 개별적 채널들이 공통 신호로부터 변경되는 방법을 표시하는 파라미터 데이터를 파라메트릭 확장이 포함하는 것을 제안하여 왔다.
파라메트릭 확장 인코딩 테크닉들의 예들은 SBR(Spectral Band Replication), PS(Parametric Stereo), 및 SAC(Spatial Audio Coding) 테크닉들을 포함한다.
최신의 SAC 테크닉은 다중 채널 오디오 신호들을 효율적으로 코딩하기 위해 개발 중에 있다. 이러한 테크놀로지는 PS 코딩 테크닉에 부분적으로 기초한다. PS 범례와 마찬가지로, SAC는 M 채널들로 구성되는 다중 채널 신호가 N<M인 N 채널들 로 구성되는 신호 및 공간 큐 신호들을 표현하는 적은 양의 파라미터들에 의해 효율적으로 표현될 수 있다는 개념에 기초한다. 전형적인 애플리케이션은 파형 인코딩된 단일 또는 입체 신호와 같은 종래의 5.1 신호 표현과 공간 파라미터들을 코딩하는 것으로 구성된다. 공간 파라미터들은 구 호환가능한 확장을 형성하도록 코어 단일 또는 입체 비트 스트림의 보조 데이터 일부에 매립될 수 있다.
SBR 및 PS 테크닉들과 같이, SAC는 주파수 도메인 표현들에 따라 도메인 표현들을 변환하도록 복소수 (의사) QMF(Quadrature Mirror Filter) 뱅크들을 사용한다(역으로도 마찬가지). 이러한 필터의 특징은 복소수 값 서브대역 도메인 신호들이 2의 인자에 의해 효율적으로 오버샘플링된다는 것이다. 이것은 에일리어싱 왜곡(aliasing distortion)을 유입시키지 않으며 서브대역 도메인 신호들의 후 프로세싱 동작들을 인에이블한다.
파라메트릭 확장들에 대한 또 다른 공통 특징은 전형적인 조건들 하에서 이러한 테크닉들이 투명한 오디오 품질 레벨을 달성하지 못한다는, 즉 일부 품질 저하가 유입된다는 것이다.
투명한 오디오 품질로 SBR, PS, 및 SAC와 같은 파라메트릭 확장들을 확장하기 위해,파형 코더를 사용하여 복소수 서브대역 도메인 신호들의 어떠한 부분들, 예로서 어떠한 수의 대역들을 코딩하는 것이 바람직하다.
간단한 접근 방식은 우선적으로 시간 도메인으로 다시 복소수 서브대역 도메인의 이러한 부분들을 변환하는 단계로 구성된다. 기존 파형 코더(예로서, AAC)는 그에 따라 결과적인 시간 도메인 신호들에 적용될 수 있다. 그러나, 그러한 접근 방식은 다수의 단점들과 연관된다.
구체적으로, 결과적인 인코더 및 디코더 복잡성이 높아지고 서로 다른 변환들을 사용하는 주파수 및 시간 도메인 사이의 반복되는 변환 때문에 높은 계산상의 부담을 갖는다. 예를 들어, 파라메트릭 확장이 OMF 합성 후에 얻어지는 시간 도메인 신호 코딩을 사용하는 경우, 대응하는 디코더는 완전한 파형 디코더(예로서, AAC 파생 디코더) 및 추가적으로 분석 QMF 뱅크로 구성된다. 이것은 계산상의 복잡성과 관련하여 고가이다.
더욱이, 파라메트릭 확장에 의해 인코딩되는 신호 요소들의 파형 인코딩 및 사용되는 파라메트릭 확장 사이의 상관성을 갖는 것이 유리하다.
예를 들어, 시스템은 예로서 AAC 및 SBR(HE-AAC) 또는 AAC 및 SAC 코딩으로 구성될 수 있다. SBR 또는 SAC 확장이 파형 코딩에 따라 강화되도록 그 시스템이 허용하는 경우, QMF 합성 후에 얻어지는 시간 도메인 신호를 인코딩하도록 또한 AAC를 사용하는 것이 논리적이다. 그러나, 동일한 확장들, 예로서 MPEG-1 레이어 II 및 SBR의 조합을 사용하는 또 다른 시스템은 또 다른 파형 코딩 시스템, MPEG-1 레이어 II를 사용하는 것이 바람직하다. 따라서, 코어 디코더보다는 파라메트릭 확장 툴에 파형 코딩 강화를 연결하는데 유리하다.
따라서, 향상된 시스템이 유리하며, 특히 증가된 유연성, 감소된 복잡성, 감소된 계산상 부담, 적용된 코딩의 서로 다른 요소들 사이의 손쉬워진 상호동작성, 향상된(예로서, 스케일 가능) 오디오 품질 및/또는 향상된 성능을 허용하는 인코딩 및/또는 디코딩 시스템이 유리하다.
따라서, 본 발명은 상기 언급된 단점들 중 하나 또는 그 이상을 단독으로 또는 어떠한 조합에 따라 바람직하게 완화시키거나, 경감시키거나, 제거하려 한다.
본 발명의 일 측면에 따라, 파형 디코딩에 의해 시간 도메인 오디오 신호를 생성하기 위한 디코더에 있어서, 인코딩된 데이터 스트림을 수신하기 위한 수단과, 상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하기 위한 수단으로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 생성 수단과, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하기 위한 변환 수단으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 변환 수단과, 상기 제 2 서브대역 신호로부터 상기 시간 도메인 오디오 신호를 생성하기 위한 합성 필터 뱅크를 포함하는, 상기 시간 도메인 오디오 신호 생성 디코더가 제공된다.
본 발명은 향상된 디코더를 허용할 수 있다. 감소된 복잡성 디코더가 달성될 수 있고/있거나 계산상 리소스 요구가 감소될 수 있다. 특히, 합성 필터 뱅크는 파형 디코딩과 시간 도메인 오디오 신호에 대한 파라메트릭 확장 디코딩 모두에 대해 사용될 수 있다. 파형 디코딩 및 파라메트릭 디코딩 사이의 공통성이 달성될 수 있다. 특히, 합성 필터 뱅크는 SBR, PS, 및 SAC와 같은 파라메트릭 확장 코딩 테크닉들에서 파라메트릭 디코딩을 위해 전형적으로 사용되는 바와 같은 QMF 필터 뱅크일 수 있다.
변환 프로세서는 예로서 시간 도메인으로 다시 제 1 서브대역 신호의 어떠한 변환도 요구하지 않으며 서브대역 프로세싱에 의해 제 2 서브대역 신호를 생성하도록 배치된다.
상기 디코더는 합성 필터 뱅크의 합성 동작 이전에 제 2 서브대역 신호상에 논 에일리어스 신호(non-alias signal) 프로세싱을 수행하기 위한 수단을 더 포함한다.
본 발명의 선택적 특징에 따라, 제 1 서브대역 신호의 각각의 서브대역은 복수의 서브대역들을 포함하고, 상기 변환 수단은 그 제 1 서브대역 신호의 서브-서브대역들로부터 제 2 서브대역 신호들의 서브대역들을 생성하기 위한 제 2 합성 필터 뱅크를 포함한다.
이것은 제 1 서브대역 신호를 변환하는데 효율적인 수단을 제공할 수 있다. 그 특징은 합성 필터 뱅크의 서브대역 필터들의 주파수 응답에 대해 보상하는데 효율적 및/또는 낮은 복잡성 수단을 제공할 수 있다.
본 발명의 선택적 특징에 따라, 제 2 서브대역 신호의 각각의 서브대역은 에일리어스 대역 및 논 에일리어스 대역을 포함하고, 변환 수단은 제 2 서브대역 신호의 제 1 서브대역 대역의 에일리어스 서브-서브대역 및 제 2 서브대역 신호의 제 2 서브대역의 논 에일리어스 서브대역으로 제 1 서브대역 신호의 서브-서브대역을 분할하기 위한 분할 수단을 포함하며, 상기 에일리어스 서브대역 및 논 에일리어스 서브대역은 시간 도메인 신호에 따라 대응하는 주파수 간격들을 갖는다.
이것은 제 1 서브대역 신호를 변환하는데 효율적인 수단을 제공한다. 특히, 그것은 시간 도메인 오디오 신호에 따라 동일한 주파수로부터 시작하는 서로 다른 서브대역들에서 신호 구성요소들이 단일한 신호 구성요소로부터 생성되도록 허용할 수 있다.
본 발명의 선택적 특징에 따라, 상기 분할 수단은 버터플라이 구조(Butterfly structure)를 포함한다.
이것은 특별히 효율적인 구현 및/또는 높은 성능을 허용할 수 있다. 상기 버터플라이 구조는 제 2 서브대역의 서로 다른 서브대역들에 대응하는 2개의 출력 값들을 생성하도록 하나의 제로 값 입력 및 하나의 서브-서브대역 데이터 값 입력을 사용할 수 있다.
본 발명의 또 다른 측면에 따라, 시간 도메인 오디오 신호를 인코딩하기 위한 인코더에 있어서, 상기 시간 도메인 오디오 신호를 수신하기 위한 수단과, 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하기 위한 제 1 필터 뱅크로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 필터뱅크와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하기 위한 변환 수단으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 변환 수단과, 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하기 위한 수단을 포함하는, 상기 인코더가 제공된다.
본 발명은 향상된 인코더를 허용할 수 있다. 감소된 복잡성 디코더가 달성될 수 있고/있거나 계산상 리소스 요구가 감소될 수 있다. 파형 인코딩 및 파라메트릭 인코딩 사이의 공통성이 달성될 수 있다. 특히, 제 1 필터 뱅크는 SBR, PS, 및 SAC와 같은 파라메트릭 확장 코딩 테크닉들에서 파라메트릭 인코딩을 위해 전형적으로 사용되는 바와 같은 QMF 필터 뱅크일 수 있다.
향상된 디코딩된 오디오 품질이 달성될 수 있다. 예를 들어, 시간 도메인 오디오 신호는 파라메트릭 인코딩으로부터의 잔여 신호일 수 있다. 파형 인코딩된 신호는 증가된 투명도를 결과로 나타내는 정보를 제공할 수 있다.
변환 프로세서는 예로서 시간 도메인으로 다시 제 1 서브대역 신호의 어떠한 변환도 요구하지 않으며 서브대역 프로세싱에 의해 제 2 서브대역 신호를 생성하도록 배치된다.
본 발명의 선택적 특징에 따라, 인코더는 제 1 서브대역 신호를 사용하여 시간 도메인 오디오 신호를 파라메트릭으로 인코딩하기 위한 수단을 더 포함한다.
본 발명은 파라메트릭 및 파형 인코딩 모두를 사용하여 기본 신호의 효율적 및/또는 높은 품질 인코딩을 허용할 수 있다. 기능성은 파라메트릭 및 파형 코딩 사이에서 공유될 수 있다. 파라메트릭 인코딩은 SBR, PS, 또는 SAC 코딩과 같은 파라메트릭 확장 코딩일 수 있다. 인코더는 특히 파라메트릭 확장 인코딩의 일부 또는 모든 서브대역들의 파형 인코딩을 제공할 수 있다.
본 발명의 선택적 특징에 따라, 변환 수단은 제 1 서브대역 신호의 각각의 서브대역에 대해 복수의 서브-서브대역들을 생성하기 위한 제 2 필터 뱅크를 포함한다.
이것은 제 1 서브대역 신호를 변환하는데 효율적인 수단을 제공할 수 있다. 그 특징은 제 1 서브대역의 서브대역 필터들의 주파수 응답에 대해 보상하는데 효율적 및/또는 낮은 복잡성 수단을 제공할 수 있다.
본 발명의 선택적 특징에 따라, 제 2 필터 뱅크는 홀수로 스택된다.
이것은 성능을 향상시킬 수 있고 복소수 서브대역 도메인에서 양극 및 음극 주파수들 사이의 향상된 분할을 허용한다.
본 발명의 선택적 특징에 따라, 각각의 서브대역은 그 서브대역의 에일리어스 대역에 대응하는 일부 에일리어스 서브-서브대역들과 그 서브대역의 논 에일리어스에 대응하는 일부 논 에일리어스 서브-서브대역들을 포함하며, 변환 수단은 제 2 서브대역의 논 에일리어스 서브-서브대역들과 제 1 서브대역 대역의 에일리어스 서브-서브대역들을 결합하기 위한 수단을 포함하고, 에일리어스 서브-서브대역들 및 논 에일리어스 서브-서브대역들은 시간 도메인 신호에서 대응하는 주파수 간격들을 갖는다.
이것은 제 1 서브대역 신호를 변환하는데 효율적인 수단을 제공할 수 있다. 특히, 그것은 시간 도메인 오디오 신호에서 동일한 주파수로부터 시작하는 서로 다른 서브대역들에서 신호 구성요소들이 단일한 신호 구성요소로 결합되도록 허용할 수 있다. 이것은 데이터 레이트에서 감소를 허용할 수 있다.
본 발명의 선택적 특징에 따라, 결합 수단은 에일리어스 대역에서 에너지를 감소시키도록 배치된다.
이것은 성능을 향상시킬 수 있고/있거나 데이터 레이트 감소를 허용할 수 있다. 특히, 에일리어스 대역에서 에너지가 최소화될 수 있고 에일리어스 대역들이 무시될 수 있다.
특히, 결합 수단은 제 2 서브대역의 에일리어스 서브대역들에 의해 제 1 서브대역 대역의 논 에일리어스 서브-서브대역들을 보상하기 위한 수단을 더 포함할 수 있다. 특히, 결합 수단은 제 1 서브대역의 논 에일리어스 서브-서브대역들로부터 제 2 서브대역의 에일리어스 서브대역들의 계수들을 감하기 위한 수단을 포함할 수 있다.
본 발명의 선택적 특징에 따라, 결합 수단은 제 1 서브대역에서의 제 1 에일리어스 서브-서브대역 및 제 2 서브대역에서의 제 1 논 에일리어스 서브-서브대역에 대해 논 에일리어스 합산 신호를 생성하기 위한 수단을 포함한다.
이것은 특별히 효율적인 구현 및/또는 높은 성능을 허용할 수 있다.
본 발명의 선택적 특징에 따라, 결합 수단은 논 에일리어스 합산 신호를 생성하기 위해 버터플라이 구조를 포함한다.
이것은 특별히 효율적인 구현 및/또는 높은 성능을 허용할 수 있다. 버터플라이 구조는 특히 단지 하나의 출력이 생성되는 1/2 버터플라이 구조일 수 있다.
본 발명의 선택적 특징에 따라, 버터플라이 구조의 적어도 하나의 계수는 제 1 필터 뱅크의 필터의 주파수 응답에 의존한다.
이것은 효율적인 구현 및/또는 높은 성능을 허용할 수 있다.
본 발명의 선택적 특징에 따라, 변환 수단은 인코딩된 데이터 스트림에서 에일리어스 대역에 대한 데이터 값들을 포함하지 않도록 배치된다.
이것은 정해진 데이터 레이트에 대해 높은 인코딩된 오디오 품질을 허용할 수 있다.
본 발명의 선택적 특징에 따라, 인코더는 제 2 신호로의 변환 이전에 제 1 서브대역 신호상에 논 에일리어스 신호 프로세싱을 수행하기 위한 수단을 더 포함한다.
이것은 성능을 향상시킬 수 있다. 본 발명은 에일리어싱 에러들을 유입시키지 않으며 개별적 서브대역들의 신호 프로세싱이 수행되도록 허용하는 동안 임계적으로 샘플링된 출력 신호를 갖는 파형 인코더의 효율적인 구현을 허용할 수 있다.
본 발명의 선택적 특징에 따라, 인코더는 제 2 신호로의 변환 이전에 제 1 서브대역 신호를 위상 보상하기 위한 수단을 더 포함한다.
이것은 성능을 향상시킬 수 있고/있거나 효율적인 구현을 제공할 수 있다.
본 발명의 선택적인 특징에 따라, 제 1 필터 뱅크는 QMF 필터 뱅크이다.
본 발명은 SBR, PS, 및 SAC와 같은 많은 파라메트릭 인코딩 테크닉들에서 사용되는 QMF 필터를 사용하는 효율적인 파형 인코딩을 허용할 수 있다. 따라서, 향상된 호환성 및/또는 향상된 기능성 공유 및/또는 파형 및 파라메트릭 인코딩 테크닉들의 향상된 상호동작성이 달성될 수 있다.
본 발명의 또 다른 측면에 따라, 파형 디코딩에 의해 시간 도메인 오디오 신호를 생성하는 방법에 있어서, 인코딩된 데이터 스트림을 수신하는 단계와, 상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계와, 합성 필터 뱅크가 상기 제 2 서브대역 신호로부터 상기 시간 도메인 오디오 신호를 생성하는 단계를 포함하는, 상기 시간 도메인 오디오 신호 생성 방법이 제공된다.
본 발명의 또 다른 측면에 따라, 시간 도메인 오디오 신호를 인코딩하는 방법에 있어서, 상기 시간 도메인 오디오 신호를 수신하는 단계와, 제 1 필터 뱅크가 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계와, 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 단계를 포함하는, 상기 시간 도메인 오디오 신호 인코딩 방법이 제공된다.
본 발명의 또 다른 측면에 따라, 오디오 신호를 수신하기 위한 수신기에 있어서, 인코딩된 데이터 스트림을 수신하기 위한 수단과, 상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하기 위한 수단으로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 생성 수단과, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하기 위한 변환 수단으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 변환 수단과, 상기 제 2 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하기 위한 합성 필터 뱅크를 포함하는, 상기 수신기가 제공된다.
본 발명의 또 다른 측면에 따라, 인코딩된 오디오 신호를 송신하기 위한 송신기에 있어서, 시간 도메인 오디오 신호를 수신하기 위한 수단과, 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하기 위한 제 1 필터 뱅크로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 필터 뱅크와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하기 위한 변환 수단으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 변환 수단과, 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하기 위한 수단과, 상기 파형 인코딩된 데이터 스트림을 송신하기 위한 수단을 포함하는, 상기 송신기가 제공된다.
본 발명의 또 다른 측면에 따라, 시간 도메인 오디오 신호를 송신하기 위한 송신 시스템에 있어서, 상기 시간 도메인 오디오 신호를 수신하기 위한 수단과, 상기 시간 도메인 오디오 신호로부터 제 2 서브대역 신호를 생성하기 위한 제 1 필터 뱅크로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 필터 뱅크와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하기 위한 변환 수단으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호를 생성하기 위한 변환 수단과, 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하기 위한 수단과, 상기 파형 인코딩된 데이터 스트림을 송신하기 위한 수단을 포함하는 송신기와, 상기 파형 인코딩된 데이터 스트림을 수신하기 위한 수단과, 상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 3 서브대역 신호를 생성하기 위한 수단으로서, 상기 제 3 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 3 서브대역 생성 수단과, 서브대역 프로세싱에 의해 상기 제 3 서브대역 신호로부터 제 4 서브대역 신호를 생성하기 위한 변환 수단으로서, 상기 제 4 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 4 서브대역 신호를 생성하기 위한 변환 수단과, 상기 제 4 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하기 위한 합성 필터 뱅크를 포함하는 수신기를 포함하는, 상기 송신 시스템이 제공된다.
본 발명의 또 다른 측면에 따라, 오디오 신호를 수신하는 방법에 있어서, 인코딩된 데이터 스트림을 수신하는 단계와, 상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계와, 합성 필터 뱅크가 상기 제 2 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하는 단계를 포함하는, 상기 오디오 신호 수신 방법이 제공된다.
본 발명의 또 다른 측면에 따라, 인코딩된 오디오 신호를 송신하는 방법에 있어서, 시간 도메인 오디오 신호를 수신하는 단계와, 제 1 필터 뱅크가 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계와, 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 단계와, 상기 파형 인코딩된 데이터 스트림을 송신하는 단계를 포함하는, 상기 인코딩된 오디오 신호 송신 방법이 제공된다.
본 발명의 또 다른 측면에 따라, 시간 도메인 오디오 신호를 송신 및 수신하는 방법에 있어서, 상기 시간 도메인 오디오 신호를 수신하는 단계와, 제 1 필터 뱅크가 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계와, 서브대역 프로세싱에 의해 상기 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 제 1 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계와, 상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 단계와, 상기 파형 인코딩된 데이터 스트림을 송신하는 단계를 포함하는 송신기와, 상기 파형 인코딩된 데이터 스트림을 수신하는 단계와, 상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 3 서브대역 신호를 생성하는 단계로서, 상기 제 3 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 3 서브대역 신호 생성 단계와, 서브대역 프로세싱에 의해 상기 제 3 서브대역 신호로부터 제 4 서브대역 신호를 생성하는 단계로서, 상기 제 4 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 4 서브대역 신호 생성 단계와, 합성 필터 뱅크가 상기 제 4 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하는 단계를 포함하는 수신기를 포함하는, 상기 시간 도메인 오디오 신호 송신 및 수신 방법이 제공된다.
본 발명의 이러한 측면들 및 다른 측면들과 특징들 및 장점들은 이하 기술되는 실시예(들)를 참조로 하여 명확하게 설명될 것이다.
본 발명의 실시예들은 도면들을 참조로하여 단지 예로서 기술될 것이다.
도 1은 본 발명의 일부 실시예들에 따라 오디오 신호의 통신을 위한 송신 시스템(100)을 도시한 도면.
도 2는 본 발명의 일부 실시예들에 따른 인코더를 도시한 도면.
도 3은 본 발명의 일부 실시예들에 따른 인코더의 몇 가지 요소들의 예를 도시한 도면.
도 4는 본 발명의 일부 실시예들에 따른 디코더를 도시한 도면.
도 5는 본 발명의 일부 실시예들에 따른 인코더를 도시한 도면.
도 6은 분석 및 합성 필터 뱅크의 예를 도시한 도면.
도 7은 QMF 필터 뱅크 스펙트럼의 예를 도시한 도면.
도 8은 다운 샘플링된 QMF 서브대역 필터 스펙트럼들의 예들을 도시한 도면.
도 9는 QMF 서브대역 스펙트럼들의 예들을 도시한 도면.
도 10은 서브대역 필터 뱅크의 스펙트럼들의 예들을 도시한 도면.
도 11은 버터플라이 변환 구조들의 예를 도시한 도면.
도 1은 본 발명의 일부 실시예들에 따른 오디오 신호의 통신을 위한 송신 시스템(100)을 도시한 도면이다. 송신 시스템(300)은 구체적으로는 인터넷일 수 있는 네트워크(105)를 통해 수신기(103)에 연결되는 송신기(101)를 포함한다.
특정한 예에서, 송신기(101)는 신호 레코딩 디바이스이고 수신기는 신호 플레이어 디바이스(103)이지만, 다른 실시예들에서 송신기 및 수신기가 다른 애플리케이션들에서 다른 목적들을 위해 사용될 수 있다는 것을 이해할 것이다. 예를 들어, 송신기(101) 및/또는 수신기(103)는 트랜스코딩 기능성의 일부일 수 있고 예로서 다른 신호 소스들 또는 목적지들에 인터페이싱을 제공할 수 있다.
신호 레코딩 기능이 지원되는 특정한 예에서, 송신기(101)는 샘플링 및 아날로그 디지털 변환에 의해 디지털 PCM 신호로 변환되는 아날로그 신호를 수신하는 디지타이저(digitizer)를 포함한다.
송신기(101)는 인코딩 알고리즘에 따라 PCM 신호를 인코딩하는 도 1의 인코더(109)에 연결된다. 인코더(100)는 인코딩된 신호를 수신하고 인터넷(105)으로 인터페이싱하는 네트워크 송신기(111)에 연결된다. 네트워크 송신기는 인터넷(105)을 통해 수신기(103)에 인코딩된 신호를 송신할 수 있다.
수신기(103)는 인터넷(105)으로 인터페이싱하고 송신기(101)로부터 인코딩된 신호를 수신하도록 배치되는 네트워크 수신기(113)를 포함한다.
네트워크 수신기(111)는 디코더(115)에 연결된다. 디코더(115)는 인코딩된 신호를 수신하고 디코딩 알고리즘에 따라 그것을 디코딩한다.
신호 재생 기능이 지원되는 특정한 예에서, 수신기(103)는 디코더(115)로부터 디코딩된 오디오 신호를 수신하고 사용자에게 그것을 나타내는 신호 플레이어(117)를 더 포함한다. 구체적으로, 신호 플레이어(113)는 디코딩된 오디오 신호를 출력하도록 요구되는 바에 따라 디지털 아날로그 변환기, 증폭기들, 및 스피커들을 포함할 수 있다.
도 2는 도 1의 인코더(109)를 보다 상세히 도시한 도면이다. 인코더(109)는 인코딩될 시간 도메인 오디오 신호를 수신하는 수신기(201)를 포함한다. 오디오 신호는 로컬 신호 저장소와 같은 어떠한 외부 또는 내부 소스로부터 수신될 수 있다.
수신기는 복수의 서로 다른 서브대역들을 포함하는 서브대역 신호를 생성하는 제 1 필터 뱅크(203)에 연결된다. 구체적으로, 제 1 필터 뱅크(203)는 SBR, PS, 및 SAC와 같은 파라메트릭 인코딩 테크닉들로부터 알려진 바와 같이 QMF 필터 뱅크일 수 있다. 따라서, 제 1 필터 뱅크(203)는 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는 제 1 서브대역 신호를 생성한다. 특정한 예에서, 제 1 서브대역 신호는 복소수 변조된 QMF 필터들에 대해 공지된 바와 같이 2의 오버샘플링 인자를 갖는다.
각각의 QMF 대역이 2의 인자에 의해 오버샘플링되기 때문에, 어떠한 에일리어싱 왜곡을 유입시키지 않으며 개별적 서브대역들상에 많은 신호 프로세싱 동작들을 수행하는 것이 가능하다. 예를 들어, 각각의 개별적 서브대역은 예로서 스케일링될 수 있고/있거나 다른 서브대역들이 추가 또는 감해질 수 있다. 따라서, 일부 실시예들에서 인코더(109)는 QMF 서브대역들상에 논 에일리어스 신호 프로세싱 동 작들을 수행하기 위한 수단을 더 포함한다.
제 1 서브대역 신호는 SBR, PS, 및 SAC와 같은 파라메트릭 확장 인코더들에 의해 종래에 생성되던 서브대역 신호들에 대응한다. 따라서, 제 1 서브대역 신호는 시간 도메인 신호에 대해 파라메트릭 확장 인코딩을 생성하도록 사용될 수 있다. 추가로, 동일한 서브대역 신호는 시간 도메인 신호의 파형 인코딩을 위해서도 사용되는 도 2의 인코더(109) 내에 있다. 따라서, 인코더(109)는 신호의 파라메트릭 및 파형 인코딩을 위해 동일한 필터 뱅크(203)를 사용할 수 있다.
제 1 서브대역 신호의 복소수 값 서브대역 도메인 표현을 파형 코딩하는데 따른 주요한 어려움은 그것이 간결한 표현을 형성하지 않는, 즉 그것이 2의 인자에 의해 오버샘플링된다는 것이다. 인코더(109)는 최초 시간도메인 신호에 직접적으로 MDCT(Modified Discrete Cosine Transform)를 적용할 때 얻어진 표현과 매우 유사한 표현으로 복소수 서브대역 도메인 표현을 직접적으로 변환한다(예를 들어 MDCT의 기술에 대해 1992년, 런던, 보스톤, 아텍 하우스, H. Malvar에 의한 "랩핑된 변환들을 통한 신호 프로세싱(Signal Processing with Lapped Transforms)"을 참조한다). 이러한 MDCT 유사 표현이 임계적으로 샘플링된다. 마찬가지로, 이러한 신호는 효율적인 파형 인코딩을 결과로 나타내는 결과적인 표현을 효율적으로 코딩하기 위하 적용될 수 있는 알려진 인식가능한 오디오 코딩 테크닉들에 대해 적절하다.
특히, 인코더(109)는 제 1 서브대역 신호의 개별적 서브대역들에 복소수 변환을 적용함으로써 제 1 서브대역 신호로부터 제 2 서브대역 신호를 생성하는 변환 프로세서(205)를 포함한다. 제 2 서브대역 신호는 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응한다.
따라서, 인코더(109)에서 변환 프로세서(205)는 전형적인 전류 파라메트릭 확장 인코더들과 호환가능한 QMF 필터 뱅크 출력을 종래의 파형 인코더들에서 전형적으로 생성되는 서브대역 신호들에 매우 가깝게 대응하는 임계적으로 샘플링된 MDCT 유사 서브대역으로 변환한다.
따라서, QMF 및 MDCT 변환들 모두를 사용하기보다는, 제 1 서브대역 신호는 종래의 파형 인코더의 MDCT 신호로 처리될 수 있는 제 2 서브대역 신호를 생성하도록 서브대역 도메인에서 직접적으로 프로세싱된다. 따라서, 서브대역 신호를 인코딩하기 위해 알려진 테크닉들이 적용될 수 있고, 예로서 파라메트릭 확장 인코딩으로부터의 잔여 신호의 효율적인 파형 인코딩은 시간 도메인으로의 변환을 요구하지 않으며 달성될 수 있고, 그에 따라 QMF 합성 필터들에 대한 요구가 방지될 수 있다.
이 예에서, 인코더(109)는 변환 프로세서(205)에 연결되는 인코드 프로세서(207)를 포함한다. 인코드 프로세서(207)는 변환 프로세서(205)로부터 제 2 임계적으로 샘플링된 MDCT 유사 서브대역 신호를 수신하고 예로서 양자화, 스케일 인자들, 허프만 인코딩 등등을 포함하는 종래의 파형 코딩 테크닉들을 사용하여 이것을 인코딩한다. 결과적인 인코딩된 데이터가 인코딩된 데이터 스트림에 매립된다. 데이터 스트림은 예를 들어 파라메트릭 인코딩 데이터와 같은 다른 인코딩된 데이터를 더 포함할 수 있다.
다음에 따라 보다 상세히 기술되는 바와 같이, 변환 프로세서(205)는 논 에 일리어스 대역들(또는 통과 대역들)에서 서로 다른 서브대역들로부터 신호 구성요소들을 결합하고 에일리어스 대역들(또는 정지 대역들)로부터 신호 구성요소들을 제거하기 위해 제 1 필터 뱅크(203)의 기본적(또는 프로토타입) 필터의 정보를 사용한다. 따라서, 각각의 서브대역에 대한 에일리어스 대역 주파수 구성요소들은 어떠한 오버샘플링 없이도 임계적으로 샘플링된 신호를 결과로 나타내어 무시될 수 있다.
구체적으로, 다음에 따라 기술되는 바와 같이 변환 프로세서(205)는 QMF 필터 뱅크의 서브대역들의 각각에 대해 복수의 서브-서브대역들을 생성하는 제 2 필터를 포함한다. 따라서, 그 서브대역들은 추가적인 서브-서브대역들로 분할된다. QMF 필터들 사이의 오버랩으로 인해, 시간 도메인 신호의 정해진 신호 구성요소(말하자면, 특정한 주파수에서의 사인 곡선)는 2개의 서로 다른 QMF 서브대역들에서 신호 구성요소를 결과로 나타낼 수 있다. 제 2 필터 뱅크는 신호 구성요소가 제 1 QMF 서브대역 중 하나의 서브-서브대역와 제 2 QMF 서브대역 중 하나의 서브-서브대역에 표현되는 것과 같이 이러한 서브대역들을 추가로 분할한다. 이러한 2개 서브-서브대역 신호들의 데이터 값들은 단일 신호 구성요소를 생성하도록 그 2개 신호들을 결합하는 컴바이너(combiner)에 공급된다. 이러한 단일 신호 구성요소는 그에 따라 인코드 프로세서(207)에 의해 인코딩된다.
도 3은 변환 프로세서(205)의 일부 요소들의 예를 도시한 도면이다. 특히, 도 3은 제 1 QMF 서브대역에 대한 제 1 변환 필터 뱅크(301)와 제 2 QMF 서브대역에 대한 제 2 변환 필터 뱅크(303)를 도시한 도면이다. 동일한 주파수들에 대응하 는 서브-서브대역들로부터의 신호들은 그에 따라 그 서브-서브대역에 대해 단일한 출력 데이터 값을 생성하는 컴버이너(305)에 공급된다.
디코더(115)가 인코더(109)의 역 동작들을 수행할 수 있다는 것을 이해할 것이다. 도 4는 보다 상세히 디코더(115)를 도시한 도면이다.
디코더는 네트워크 수신기(113)로부터 인코더(109)에 의해 인코딩되는 신호를 수신하는 수신기(401)를 포함한다. 인코딩된 신호는 인코드 프로세서(207)의 파형 인코딩을 디코딩하는 디코딩 프로세서(403)에 건네지고, 그에 의해 임계적으로 샘플링된 서브대역 신호를 재생성한다. 이러한 신호는 변환 프로세서(205)의 역 동작들을 수행함으로써 비임계적으로 샘플링된 서브대역 신호를 재생성하는 디코드 변환 프로세서(405)에 공급된다. 비임계적으로 샘플링된 신호는 그에 따라 최초 시간 도메인 오디오 인코딩 신호의 디코딩된 버전을 생성하는 QMF 합성 필터(407)에 공급된다.
특히, 디코드 변환 프로세서(405)는 에일리어스 및 논 에일리어스 대역들 모두에서 신호 대역들을 포함하는 서브-서브대역들에 신호 구성요소들을 재생성하는 역 버터플라이 구조와 같은 분할기를 포함한다. 서브-서브대역 신호들은 그 다음으로 인코더(109)의 변환 필터 뱅크(301, 303)에 대응하는 합성 필터 뱅크에 공급된다. 이러한 필터 뱅크들의 출력은 비임계적으로 샘플링된 서브대역 신호에 대응한다.
본 발명의 특정한 실시예들은 다음에 따라 보다 상세히 기술될 것이다. 실시예들의 기술은 도 5의 인코더 구조(500)를 참조로 하여 기술될 것이다. 인코더 구 조(500)는 구체적으로 도 1의 인코더(109)에 따라 구현될 수 있다.
인코더 구조(500)는 64 대역 분석 QMF 필터 뱅크(501)를 포함한다.
QMF 분석 서브대역 필터는 다음에 따라 기술될 수 있다. 정해진 실수 값 선형 위상 프로토타입 필터 p(v), M 대역 복소수 변조된 분석 필터 뱅크는 분석 필터들에 의해 규정될 수 있고,
Figure 112007040431430-pct00001
서브대역 인덱스 k=0, 1, ..., M-1이다. 위상 파라미터(θ)는 다음에 따르는 분석에 대한 중요성을 갖는다. 전형적인 선택은 (N+M)/2이고, 여기서 N은 프로토타입 필터 차수이다.
정해진 실수 값 이산 시간 신호 x(v), 서브대역 신호들 vk(n)은 hk(v)을 통해 (콘볼루션) x(v)를 필터링함으로써 얻어지고, 그 다음으로 인코더(109) 및 디코더(115)의 QMF 분석 및 합성의 동작을 도시하는 도 6의 좌측에 도시된 바와 같이 인자 M에 따라 결과를 다운샘플링한다.
합성 동작이 인자 M을 통해 QMF 서브대역 신호들을 우선적으로 업샘플링한 후에 방정식(1)과 유사한 형태의 복소수 변조된 필터들을 통해 필터링하는 단계와, 그 결과들을 합산하는 단계와, 최종적으로 도 6의 우측에 도시된 바와 같이 실수 부분의 2배를 취하는 단계로 구성된다고 가정한다. 그러한 경우에, 실수 값 입력 신호 x(v)의 거의 완전한 재구성은 2002년 11월 15일, 벨기에, 루벤, Proc. 1st IEEE Benelux Workshop on Model based Processing and coding of Audio(MPCA-2002), pp. 53-58, P. Ekstrand에 의한 "스펙트럼들 대역 복제에 의한 오디오 신호들의 대역폭 확장(Bandwidth extension of audio signals by spectral band replication)"에 나타난 바와 같이, 실수 값 선형 위상 프로토타입 필터 p(v)의 적절한 디자인에 의해 얻어질 수 있다.
다음에 있어서,
Figure 112007040431430-pct00002
은 이산 시간 신호 z(n)의 이산 시간 퓨리에 변환이라 한다.
QMF 뱅크의 거의 완전한 재구성 속성 이외에, P(ω), p(v)의 퓨리에 변환이 본질적으로 주파수 간격[-π/M, π/M] 밖으로 없어진다고 가정한다.
다운샘플링된 복소수 서브대역 도메인 신호들의 퓨리에 변환은,
Figure 112007040431430-pct00003
에 따라 정해지고, 여기서 k는 서브대역 인덱스이고 M은 서브대역들의 수이다. 제한되는 프로토타입 필터의 주파수 응답의 가정으로 인해, 방정식(2)에서 합은 각각의 ω에 대해 단지 하나의 항만을 포함한다.
대응하는 양식화된 절대 주파수 응답들은 도 7 및 도 8에 도시되어 있다.
구체적으로, 도 7은 다운샘플링 이전에 복소수 QMF 뱅크(501)의 제 1의 수개의 주파수 대역들에 대한 양식화된 주파수 응답들을 도시한 도면이다. 도 8은 짝수(상위) 및 홀수(하위) 서브대역들(k)에 대한 다운샘플링된 복소수 QMF 뱅크의 양 식화된 주파수 응답들을 도시한 도면이다. 따라서, 도 8에 도시된 바와 같이 QMF 필터 대역의 중심은 다운 샘플링 후에 짝수로 된 서브대역들에 대해 π/2 및 짝수로 되지 않은 서브대역들에 -π/2로 에일리어싱된다.
도 8은 복소수 QMF 뱅크의 오버샘플링의 효과를 도시한 도면이다. 짝수 인덱스(k) 및 홀수 인덱스(k)를 갖는 대역들에 대해, 주파수 스펙트럼의 음극 및 양극 부분 각각은 (최초 실수 값) 신호를 재구성하도록 요구되지 않는다. 다운샘플링된 필터 뱅크의 주파수 스펙트럼의 이러한 부분들은 에이리어싱된 대역들 또는 정지 대역들로 언급되며, 반면에 다른 부분들은 통과 대역 또는 비에일리어싱된 대역으로 표시될 것이다. 에일리어싱된 대역들은 다른 서브대역들의 스펙트럼들의 통과 대역들에 또한 존재하는 정보를 포함한다는 것에 주의한다. 이러한 특별한 속성은 효율적인 코딩 메카니즘을 유도하기 위해 사용된다.
에일리어스 및 논 에일리어스 대역들이 중복 정보를 포함하고 하나가 다른 것으로부터 결정될 수 있다는 것이 이해될 것이다. 또한, 에일리어스 및 논 에일리어스의 상보적 해석이 사용될 수 있다는 것이 이해될 것이다.
이하에서 나타나는 바와 같이, QMF 분석 필터 뱅크의 에일리어싱된 대역들(또는 정지 대역들)에 대응하는 에너지들이 다운샘플링된 분석 필터 뱅크(501)의 각각의 출력에서 추가적인 필터 뱅크(503)의 어떠한 형태를 적용하고 추가적인 필터 뱅크(501)의 출력들 사이에 어떠한 버터플라이 구조들(505)을 적용함으로써 0 또는 무시가능한 값들까지 감소될 수 있다.
결과적으로, 정보의 1/2, 즉 필터 뱅크 출력들의 1/2d가 폐기될 수 있다. 결 과에 따라, 임계적으로 샘플링된 표현이 얻어진다. 이러한 표현은 최초 시간 도메인 샘플들의 MDCT 변환에 의해 달성되는 표현과 매우 유사하므로, MP3 또는 AAC와 같은 전형적인 파형 인코더들에 의해 생성되는 서브대역 신호들과 매우 유사하다. 따라서, 파형 인코딩 테크닉들은 파형 인코드 프로세서(507)에서 임계적으로 샘플링된 신호에 직접적으로 적용될 수 있고, MDCT 서브대역 생성 이전에 시간 도메인으로의 변환에 대한 어떠한 요구도 요청되지 않는다. 그에 따라, 결과적인 인코딩된 데이터는 비트스트림 프로세서(509)에 의해 비트스트림에 포함된다.
도 9는 2개 사인 곡선으로 구성되는 신호에 대한 QMF 서브대역 생성의 효과를 도시한 도면이다.
(예로서 FFT에 의해 얻어지는 것과 같은) 복소수 주파수 도메인에서, 각각의 사인 곡선은 양극 및 음극 주파수 모두에 따른 스펙트럼에서 나타날 것이다. 이제, 8 대역들 복소수 QMF 뱅크를 가정한다(도 5의 예에서 64 대역들 뱅크가 활용된다). 다운샘플링 이전에, 사인 곡선들은 스펙트럼 A 내지 H에 따라 도시된 바와 같이 나타난다. 각각의 사인 곡선은 2개 서브대역들에서 발생하고, 예로서 저주파 스펙트럼 라인은 제 2 QMF 서브대역에 대응하는 스펙트럼(B) 뿐만 아니라 제 1 QMF 서브대역에 대응하는 스펙트럼(A) 모두에서 발생한다.
QMF 뱅크의 다운샘플링의 프로세스는 도 9의 하위 부분에 도시되어 있고, 스펙트럼(I)은 다운샘플링 이전 스펙트럼을 나타낸다. 다운샘플링 절차는 다음에 따라 해석될 수 있다. 우선적으로, 스펙트럼은 M개의 스펙트럼들(A 내지 H)로 분할되고, M은 제 1 및 제 2 서브대역 각각에 대해 I 및 K로 도시되는 바와 같이 다운샘 플링 인자(M=8)이다. 각각의 개별적 분할 스펙트럼은 전체 주파수 범위에 따라 다시 확장된다(늘어난다). 그 다음으로, 모든 개별적 분할 및 확장된 스펙트럼들은 제 1 및 제 2 서브대역 각각에 대해 스펙트럼들(J, L)로 도시되는 바와 같은 스펙트럼들을 결과로 나타내어 추가된다.
요약하자면, 서브대역들 사이의 주파수 간격을 초과하는 대역폭을 갖는 각각의 개별적 서브대역의 필터로 인해, 시간 도메인 신호의 신호 구성요소들은 2개의 서로 다른 서브대역들에서 신호 구성요소들을 결과로 나타낸다. 더욱이, 이러한 신호 구성요소들 중 하나는 서브대역들 중 하나의 에일리어스 대역에 포함되고 하나는 다른 서브대역의 논 에일리어스 대역에 포함된다.
따라서, 스펙트럼(J, L)에 나타난 바와 같이, 복소수 QMF 뱅크의 최종 출력 스펙트럼들 내 구성요소들이 계속해서 2개 서브대역들에서 발생하고, 예로서 저주파 스펙트럼들 라인은 제 2 서브대역의 정지 대역뿐만 아니라 제 1 서브대역의 통과 대역에서도 발생한다. 양자의 경우들에서 스펙트럼들 라인의 크기는 (시프트된) 프로토타입 필터의 주파수 응답에 의해 정해진다.
도 5의 실시예들에 따라, 복소수 변환들의 추가적인 세트(필터 뱅크(503))는 각각의 변환이 서브대역의 출력에 적용되는 경우에 유입된다. 이것은 그러한 서브대역들의 주파수 스펙트럼을 복수의 서브-서브대역들로 추가로 분할하도록 사용된다.
QMF 서브대역의 통과 대역에서 각각의 서브-서브대역은 그에 따라 인접한 QMF 서브대역에서 에일리어스 대역의 대응하는 서브-서브대역와 결합된다. 예에 있 어서, 스펙트럼(J)에서 저주파 사인 곡선을 포함하는 서브-서브대역은 스펙트럼(L)에서 저주파 사인 곡선과 결합되므로, 단일한 신호 구성요소로 결합되는 시간 도메인 신호의 동일한 저주파 사인 곡선으로부터 일어나는 신호 구성요소들 모두를 결과로 나타낸다.
더욱이, QMF 프로토타입 필터의 주파수 응답에 대해 보상하기 위해, 각각의 서브-서브대역으로부터의 값은 결합 이전에 주파수 응답의 상대적인 진폭에 따라 가중된다(QMF 프로토타입 필터의 진폭 응답이 각각의 서브-서브대역 내에서 일정하다고 가정한다).
정지 대역들에서 신호 구성요소들이 무시될 수 있거나 통과 대역으로부터 값들에 따라 보상될 수 있으므로, 에일리어스 대역에서 에너지를 효율적으로 감소시킨다. 따라서, 변환 프로세서(207)의 동작은 QMF 서브대역들 중 하나의 통과 대역에서 단일 신호 구성요소로 각각의 주파수에 대해 일어나는 2개의 신호 구성요소들의 에너지를 집중하는데 대응하는 것과 같이 보여질 수 있다. 그러므로, 에일리어스 또는 정지 대역들에서 신호 값들이 무시될 수 있을 때에, 2에 의한 효율적인 다운 샘플링은 임계적으로 샘플링된 신호를 결과로 나타내어 달성될 수 있다.
이하에서 나타나는 바와 같이, 신호 구성요소들의 결합(및 에일리어스 대역들에서 신호 구성요소들의 무효)은 버터플라이 구조를 사용함으로써 달성될 수 있다.
원리에 따라, 서브대역 신호들상에 (필터 뱅크들(503)에 의해) 또 다른(50% 오버랩핑) 복소수 변환을 적용하는 것은 2의 인자의 또 다른 업샘플링을 산출한다. 그러나, 선택된 변환들은 데이터의 50%의 감소를 허용하는 어떠한 대칭적 속성을 소유한다. 결과적인 변환은 MDCT를 실수 데이터에 적용하고 MDST를 허수 데이터에 적용한 것과 등가인 것으로 고려될 수 있다. 양자는 임계적으로 샘플링된 변환들이고, 따라서 어떠한 업샘플링도 발생하지 않는다.
보다 구체적으로, 필터 뱅크들(503)은 R=2Q 대역들로 구성되는 복소수 변조된 필터 뱅크일 수 있다. 각각의 서브대역에 대한 필터 뱅크들(503)의 양식화된 주파수 응답의 예는 각각의 서브대역(k)에 대해 도 10에 도시되어 있다. 알 수 있는 바와 같이, 필터 뱅크는 홀수로 스택되고 DC 값 주변에 집중되는 어떠한 서브대역도 갖지 않는다. 오히려, 예에 있어서 서브대역들의 중심 주파수들은 서브대역 주파수 오프셋의 약 1/2인 제 1 서브대역의 중심 주파수와 0 주위에서 대칭된다.
이러한 제 2 뱅크에서 다운샘플링 인자는 Q이고 그것은 r=-Q, -Q+1, ..., Q-1에 대해 분석 필터들에 의해 규정되며,
Figure 112007040431430-pct00004
여기서 실수 값 프로토타입 윈도우 w(v)는 w(v) = w(-v-1-Q)와 같다. 완전한 재구성이 (3)의 실수 부분 또는 (3)의 허수 부분과 같은 필터들을 갖는 필터 뱅크 내 분석으로부터 달성될 수 있는 것과 같이 이러한 윈도우가 디자인될 수 있다는 것은 공지되어 있다. 그러한 경우들에 있어서, 단지 R=2Q 서브대역들의 Q만이 양극 또는 음극 주파수들에 충분하다. 주요한 예가 수정된 이산 코사인 변환(MDCT)이다.
그러나, 도 5의 실시예에서 복소수 값 신호 z(n)는 필터들(503)을 통해 그 대신 분석되고, 결과적인 신호들은 인자(Q)에 의해 다운샘플링되어 실수 부분이 취해진다. 대응하는 합성 동작은 인자(Q)에 의한 업샘플링하는 단계와 복소수 변조된 필터들에 의한 합성 필터링하는 단계와,
Figure 112007040431430-pct00005
r=-Q, -Q+1, ..., Q-1인 R=2Q 서브대역들에 걸친 결과들을 합산하는 단계와 최종적으로 2로 그 결과를 나누는 단계로 구성된다.
프로토타입 윈도우 w(v)가 상기 언급된 실수 값 뱅크들에서 완전한 재구성을 제공하도록 디자인되는 경우, 복소수 경우에 분석 및 합성의 결합된 동작은 복소수 값 신호 z(n)를 완전히 재구성한다. 이것을 알기 위해, C는 (3)의 실수 부분과 같은 분석 필터들을 갖는 분석 뱅크를 나타내고, S는 (3)의 허수 부분을 뺀 것과 같은 분석 필터들을 갖는 분석 뱅크를 나타낸다고 한다. 그에 따라, 복소수 분석 뱅크(3)는 E=C-iS로 쓰여질 수 있다.
Figure 112007040431430-pct00006
로 복소수 신호를 쓰는 것은 그에 따라,
Figure 112007040431430-pct00007
를 제공한다.
여기서 (5)는 양극 주파수들 r=0, ..., Q-1 및 음극 주파수들 r=-Q, ..., -1 모두에 대해 평가된다. (3)에서 r 내지 -1-r의 변경이 분석 필터의 복소수 컨주케이션(complex conjugation)을 이끌어 내므로, 분석(5)은 양극 주파수들 r=0, ..., Q-1에 대해
Figure 112007040431430-pct00008
Figure 112007040431430-pct00009
모두로의 액세스를 제공한다는 것에 주의한다. 합성을 위해, 이러한 정보는
Figure 112007040431430-pct00010
Figure 112007040431430-pct00011
모두의 완전한 재구성이 대응하는 실수 값 합성 뱅크들을 통해 가능한
Figure 112007040431430-pct00012
Figure 112007040431430-pct00013
로 쉽게 재결합될 수 있다. 이러한 재구성이 복소수 분석, 실수 부분, 복소수 합성, 및 2로 나눔의 동작과 같은 청구항을 증명하는 간단한 사항들은 생략한다.
이러한 필터 뱅크 구조는 1999년 11월, IEEE Transactions on Circuits and Systems-II: Analog and Digital Signal Processing, Vol. 46, No. 11, Karp T., Fliege N.J.에 의한 "완전한 재구성을 통해 수정된 DFT 필터 뱅크들(Modified DFT Filter Banks with Perfect Reconstruction)"에 제안된 바와 같이 수정된 DFT(MDFT) 필터 뱅크들에 관련되지만 그와 동일하지는 않다. 주요한 차이는 본 필터 뱅크가 홀수로 스택되고, 다음에 제안된 하이브리드 구조에 대해 유리하다는 사실이다.
각각 k=0, 1, ..., M-1 및 r=-Q, -Q+1, ..., Q-1에 대해, vk ,r(n)은 분석 필터(503)를 통한 복소수 QMF 분석 신호 yk(v)의 분석, 인자(Q)에 의한 다운샘플링, 및 실수 부분을 취함에 의해 달성되는 서브-서브대역 신호라고 한다. 이것은 최초 샘플링 레이트의 1/(QM)의 샘플링 레이트에서 2QM 실수 값 신호들이 전체를 제공한다. 그러므로, 인자 2에 의해 오버샘플링된 표현이 얻어진다. 도 8 및 도 10을 참조로 하면,
Figure 112007040431430-pct00014
에 의해 통과 대역 신호들을 규정하는 것이 편리하다. 마찬가지로, 상기 언급된 정지 대역 또는 "에일리어싱된 대역" 신호들은,
Figure 112007040431430-pct00015
로부터 규정된다.
이러한 신호들 모두가 임계적으로 샘플링되는지 관찰한다.
다음 단계는 시간 신호가 주파수 π/(2M)≤Ω≤π-π/(2M)에서 순수한 사인 곡선인 경우와 (1)에서 θ=0인 경우, 그에 따라
Figure 112007040431430-pct00016
이고, 여기서 C는 복소수 상수라는 사실을 이용하는 것이다. 결과적으로, 이웃하는 QMF 대역들은 그에 따라 변조된 선형 위상 QMF 프로토타입 필터의 응답으로 동일한 주파수 및 위상을 갖지만 서로 다른 크기들을 갖는 복소수 사인 곡선들을 포함한다. 따라서, 이전에 언급된 바와 같이 2개의 신호 구성요소들, 하나의 QMF 서브대역의 통과 대역에서의 하나와 인접한 서브대역의 에일리어스 대역에서의 하나가 일어난다.
그러므로, 서브-서브대역 샘플들의 대응하는 쌍들을 가중된 합들 및 차들로 변환하는 것은 매우 작은 차이들을 이끌어낸다. 이러한 변환의 세부적인 것들이 요 약되기 이전에, θ=0이라는 가정이 만족되지 않는 경우, QMF 샘플들이 바람직하게는,
Figure 112007040431430-pct00017
에 따라 프리 트위들 프로세서(pre-twiddle processor)(511)에서 미리 곱해짐(프리 트위들링)에 의해 위상 보상되어야 한다는 것이 지적되어야 한다.
대안적으로, 프리 트위들 프로세서에서 kπ의 추가적인 위상 점프는 또한 사인 수정에 의해 버터플라이 구조에 따라 취급될 수 있다.
k=0, ..., M-2에 대해, 합 및 차 신호들은,
Figure 112007040431430-pct00018
에 의해 규정된다.
제 1 및 마지막 QMF 대역들에 대해, 정의는,
Figure 112007040431430-pct00019
에 의해 대체된다.
도 11은 대응하는 변환 버터플라이 구조들을 도시한 도면이다. 이러한 버터플라이 구조들은 MPEG-1 레이어 III(MP3)에서 사용되는 것들과 유사하다. 그러나, 중요한 차이는 이른바 mp3의 안티 엘리어싱 버터플라이들이 실수 값 필터 뱅크의 통과 대역들에서 에일리어싱을 감소시키도록 사용된다는 것이다. 실수 변조된 필터 뱅크에 있어서, 서브대역들 내 양극 및 음극 (복소수) 주파수들 사이에서 구별하는 것이 가능하지 않다. 그러므로, 합성 단계에 있어서, 서브대역에서 하나의 사인 곡선은 일반적으로 출력에서 2개의 사인 곡선들을 발생시킨다. 그것들 중 하나, 에일리어싱된 사인 곡선은 정확한 주파수로부터 매우 멀리 떨어진 주파수에 위치된다. 실수 뱅크 안티 에일리어싱 버터플라이들은 2개의 이웃하는 실수 QMF 대역들로 제 2 하이브리드 뱅크 합성을 유도함으로써 에일리어싱된 사인 곡선을 억제하는 것을 목표로 한다. 본 접근 방식은 복소수 QMF 서브대역가 제 2 하이브리드 뱅크로부터 복소수 사인곡선을 통해 공급된다는 점에서 이러한 상황과 근본적으로 차이가 있다. 이것은 단지 최종 출력에서 하나의 정확하게 위치된 사인 곡선을 발생시키고, MP3의 에일리어스 문제는 전혀 발생하지 않는다. 버터플라이 구조(505)는 오로지 결합된 분석 및 합성 동작의 크기 응답을 정확하게 하는 것을 목표로 하고, 그 때 차 신호들(d)이 생략된다.
변환 계수들이 βk,r=1 및 αk,r=0에 세팅되는 경우, 그에 따라 신호 쌍(s, d)는 단지 쌍(b, a)의 카피라는 것에 우선적으로 주의한다. 이것은 계산들이 적절히 이루어질 수 있는 것과 같은 (10) 및 (11)의 구조이기 때문에 선택적인 방식에 따라 이루어질 수 있다. 이것은 하이브리드 필터 뱅크 구조가 QMF 대역들의 서브셋에 대해서만 호출되는 경우에 중요성을 갖는다. 합 및 차 동작들 모두는 β2 k,r2 k,r>0 인 한 역으로 가능하며, 변환은 β2 k,r2 k,r=1 인 경우에 직교한다.
대응하는 합성 단계들은 (10) 및 (11)과 매우 유사하고, 당업자에게 명확할 것이다. 이것은 또한 프리 트위들 프로세서(511)에 의해 프리 트위들링의 반대에 대해서도 유지한다. 본 접근 방식은 신호들 dk ,r(n)이 βk,Q-1-rk,r 및αk,Q-1-rk,r인 경우와,
Figure 112007040431430-pct00020
이고, K는 정규화 상수인 경우에 선택을 위해 매우 작게 되는 것을 가리킨다.
각각의 서브대역(k)에 대한 추가적인 필터 뱅크가 임계적으로 샘플링되고 완벽하게 재구성한다는 가정하에서, 에일리어스 대역 서브-서브대역 도메인 신호들의 근사치는 실제로 최초 시간 도메인 샘플들의 MDCT와 매우 유사한 임계적으로 샘플링된 표현으로 오버샘플링된 표현을 감소시킨다. 이것은 알려진 인식가능한 파형 코더들과 유사한 방식에 따라 복소수 서브대역 도메인 신호들의 효율적인 코딩을 허용한다. 정지 또는 에일리어스 대역들에 대응하는 변환 계수들을 폐기하는 재구성 에러는 전형적인 변환 길이 Q=16에 대해 34 dB의 상태에 따른다.
대안적으로, 정지 대역들 또는 에일리어스 대역들에 대응하는 계수들은 보다 양호한 재구성을 얻기 위해 통과 대역들에 대응하는 계수들에 대해 추가적으로 인코딩된다. 이것은 Q가 매우 작거나(예로서, Q<8) QMF의 불량한 성능의 경우에 유리 할 수 있다.
도 5의 예에서, (10) 및 (11)의 합 차 버터플라이들(505)은 이러한 경우에 단지 지배적인 구성요소(들)가 유지되는 신호 쌍(s, d)을 얻기 위해 적용된다. 다음 단계에서, 예로서 스케일 인자 코딩 및 양자화를 사용하는 종래의 파형 코딩 테크닉들은 결과적인 신호(들)상에 적용된다. 코딩된 계수들은 비트 스트림으로 매립된다.
디코더는 반대 프로세스에 따른다. 우선적으로, 계수들은 비트 스트림으로부터 멀티플렉싱되어 디코딩된다. 그 다음으로, 인코더의 역 버퍼플라이 동작은 복소수 서브대역 도메인 신호들을 얻기 위해 합성 필터링 및 포스트 트위들링 이전에 적용된다. 이것들은 최종적으로 QMF 합성 뱅크에 의해 시간 도메인으로 변환될 수 있다.
명확성을 위해 상기 기술이 서로 다른 기능의 유닛들 및 프로세서들을 참조로 하여 본 발명의 실시예들을 기술한 것을 이해할 것이다. 그러나, 서로 다른 기능의 유닛들 또는 프로세서들 사이의 기능의 어떠한 적절한 분배도 본 발명을 손상시키지 않으며 사용될 수 있다는 것을 이해할 것이다. 예를 들어, 개별적 프로세서들 또는 제어기들에 의해 수행되도록 예시된 기능성은 동일한 프로세서 또는 제어기들에 의해 수행될 수 있다. 그러므로, 특정한 기능의 유닛들에 대한 레퍼런스들은 단지 정밀한 논리적 또는 물리적 구조나 구성을 표시하기보다는 기술된 기능성을 제공하기 위한 적절한 수단에 대한 레퍼런스들로 보여지기 위한 것이다.
본 발명은 하드웨어, 소프트웨어, 펌웨어, 또는 이것들의 어떠한 조합을 포 함하는 어떠한 적절한 형태에 따라 구현될 수 있다. 본 발명은 선택적으로 하나 또는 그 이상의 데이터 프로세서들 및/또는 디지털 신호 프로세서들에서 작동하는 컴퓨터 소프트웨어로 적어도 부분적으로 구현될 수 있다. 본 발명의 실시예의 요소들 및 구성요소들은 어떠한 적절한 방식에 따라 물리적, 기능적, 및 논리적으로 구현될 수 있다. 실제로, 기능성은 단일 유닛, 복수의 유닛들, 또는 다른 기능의 유닛들과 같이 구현될 수 있다. 마찬가지로, 본 발명은 단일 유닛으로 구현될 수 있거나 사로 다른 유닛들 및 프로세서들 사이에 물리적 및 기능적으로 분배될 수 있다.
본 발명이 일부 실시예들과 관련하여 기술되었을지라도, 본 명세서가 설명되는 특정한 형태에 제한되도록 의도되지는 않는다. 오히려, 본 발명의 범위는 첨부된 특허청구범위에 의해서만 제한된다. 추가적으로, 특징이 특정한 실시예들과 관련하여 기술되는 것으로 보일지라도, 당업자는 기술된 실시예들의 다양한 특징들이 본 발명에 따라 결합될 수 있다는 것을 인식할 것이다. 특허청구범위에 있어서, 용어 '포함하다'는 다른 요소들 또는 단계들의 존재를 배제하지 않는다.
더욱이, 개별적으로 열거되었을지라도, 복수의 수단들, 요소들, 또는 방법 단계들은 예로서 단일 유닛 또는 프로세서에 의해 구현될 수 있다. 추가적으로, 개별적 특징들이 서로 다른 청구항들에 포함될 수 있을지라도, 이것들은 유리하게 결합될 가능성이 있고, 서로 다른 청구항들에서의 포함은 특징들의 조합이 가능하지 않고/않거나 유리하지 않다는 것을 의미하지는 않는다. 또한, 특허청구범위의 하나의 범주에서 특징의 포함은 이러한 범주를 제한하는 것을 의미하지 않으며, 오히려 그 특징이 적절하게 다른 청구항 카테고리들에 동일하게 적용가능하다는 것을 나타 낸다. 게다가, 특허청구범위에서 특징들의 순서는 그 특징들이 작용되어야 하는 어떠한 특정한 순서를 의미하지 않으며, 특히 방법 청구항에서 개별적 단계들의 순서는 그 단계들이 이러한 순서에 따라 수행되어야 하는 것을 의미하지는 않는다. 오히려, 그 단계들은 어떠한 적절한 순서에 따라 수행될 수 있다. 추가로, 단일한 레퍼런스들은 복수의 것을 배제하지 않는다. 따라서, "하나", "제 1", "제 2" 등등에 대한 레퍼런스들은 복수의 것을 배제하지 않는다. 특허청구범위에서 레퍼런스 사인들은 단지 명확한 예가 어떠한 방식에 따라 특허청구범위를 제한하는 것으로 해석되지 않는 바에 따라 제공된다.

Claims (28)

  1. 파형 디코딩에 의해 시간 도메인 오디오 신호를 생성하기 위한 디코더에 있어서,
    인코딩된 데이터 스트림을 수신하는 수신기;
    상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하는 생성기로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 생성기;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 변환기으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 변환기;
    상기 제 2 서브대역 신호를 사용하여 파라메트릭 데이터(parametric data)를 파라메터에 의해 디코딩하는 파라메트릭 디코더; 및
    상기 제 2 서브대역 신호로부터 상기 시간 도메인 오디오 신호를 생성하는 합성 필터 뱅크를 포함하는, 시간 도메인 오디오 신호 생성 디코더.
  2. 제 1 항에 있어서,
    상기 제 1 서브대역 신호의 각각의 서브대역은 복수의 서브-서브대역들을 포함하고, 상기 변환기는 상기 제 1 서브대역 신호의 서브-서브대역들로부터 상기 제 2 서브대역 신호들의 서브대역들을 생성하는 제 2 합성 필터 뱅크를 포함하는, 시간 도메인 오디오 신호 생성 디코더.
  3. 제 2 항에 있어서,
    상기 제 2 서브대역 신호의 각각의 서브대역은 에일리어스 대역(alias band) 및 논 에일리어스 대역(non-alias band)을 포함하고, 상기 변환기는 상기 제 1 서브대역 신호의 서브-서브대역을 상기 제 2 서브대역 신호의 제 1 서브대역의 에일리어스 서브-서브대역 및 상기 제 2 서브대역 신호의 제 2 서브대역의 논 에일리어스 서브대역으로 분할하는 분할 수단(splitter)을 포함하며, 상기 에일리어스 서브대역 및 상기 논 에일리어스 서브대역은 상기 합성 필터 뱅크에 의해 생성된 상기 시간 도메인 신호의 대응하는 주파수 간격들을 갖는, 시간 도메인 오디오 신호 생성 디코더.
  4. 제 3 항에 있어서,
    상기 분할 수단은 버터플라이 구조(Butterfly structure)를 포함하는, 시간 도메인 오디오 신호 생성 디코더.
  5. 시간 도메인 오디오 신호를 인코딩하는 인코더에 있어서,
    상기 시간 도메인 오디오 신호를 수신하는 수신기;
    상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하기 위한 제 1 필터 뱅크로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 필터 뱅크;
    상기 제 1 서브대역 신호를 사용하여 상기 시간 도메인 오디오 신호를 파라미터에 의해 인코딩하는 파라메트릭 인코더;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 변환기로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 변환기; 및
    상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 생성기를 포함하는, 인코더.
  6. 삭제
  7. 제 5 항에 있어서,
    상기 변환기는 상기 제 1 서브대역 신호의 각각의 서브대역에 대해 복수의 서브-서브대역들을 생성하는 제 2 필터 뱅크를 포함하는, 인코더.
  8. 제 7 항에 있어서,
    상기 제 2 필터 뱅크는 홀수로 스택되는, 인코더.
  9. 제 7 항에 있어서,
    상기 제 1 서브대역 신호의 각각의 서브대역은 상기 서브대역의 에일리어스 대역에 대응하는 일부 에일리어스 서브-서브대역들과 상기 서브대역의 논 에일리어스 대역에 대응하는 일부 논 에일리어스 서브-서브대역들을 포함하고, 상기 변환기는 제 1 서브대역의 에일리어스 서브-서브대역들과 제 2 서브대역의 논 에일리어스 서브-서브대역들을 결합하는 결합기를 포함하며, 상기 에일리어스 서브-서브대역들 및 상기 논 에일리어스 서브-서브대역들은 상기 인코더에 의해 인코딩된 상기 시간 도메인 신호의 대응하는 주파수 간격들을 갖는, 인코더.
  10. 제 9 항에 있어서,
    상기 결합기는 상기 에일리어스 대역에서 에너지를 감소시키도록 배치되는, 인코더.
  11. 제 9 항에 있어서,
    상기 결합기는 상기 제 1 서브대역의 제 1 에일리어스 서브-서브대역 및 상기 제 2 서브대역의 제 1 논 에일리어스 서브-서브대역에 대한 논 에일리어스 합 신호를 생성하는 생성기를 포함하는, 인코더.
  12. 제 11 항에 있어서,
    상기 결합기는 상기 논 에일리어스 합 신호를 생성하기 위한 버터플라이 구조를 포함하는, 인코더.
  13. 제 12 항에 있어서,
    상기 버터플라이 구조의 적어도 하나의 계수는 상기 제 1 필터 뱅크의 필터의 주파수 응답에 의존하는, 인코더.
  14. 제 9 항에 있어서,
    상기 변환기는 상기 인코딩된 데이터 스트림의 상기 에일리어스 대역에 대한 데이터 값들을 포함하지 않도록 배치되는, 인코더.
  15. 제 5 항에 있어서,
    상기 제 2 서브대역 신호로의 변환 이전에 상기 제 1 서브대역 신호에 대한 논 에일리어스 신호 프로세싱을 수행하는 논 에일리어스 신호 처리기를 더 포함하는, 인코더.
  16. 제 5 항에 있어서,
    상기 제 2 서브대역 신호로의 변환 이전에 상기 제 1 서브대역 신호를 위상 보상하는 위상 보상기를 더 포함하는, 인코더.
  17. 제 5 항에 있어서,
    상기 제 1 필터 뱅크는 QMF 필터 뱅크인, 인코더.
  18. 파형 디코딩에 의해 시간 도메인 오디오 신호를 생성하는 방법에 있어서,
    인코딩된 데이터 스트림을 수신하는 단계;
    상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계;
    상기 제 2 서브대역 신호를 사용하여 파라메트릭 데이터를 파라메터에 의해 디코딩하는 단계; 및
    합성 필터 뱅크가 상기 제 2 서브대역 신호로부터 상기 시간 도메인 오디오 신호를 생성하는 단계를 포함하는, 시간 도메인 오디오 신호 생성 방법.
  19. 시간 도메인 오디오 신호를 인코딩하는 방법에 있어서,
    상기 시간 도메인 오디오 신호를 수신하는 단계;
    제 1 필터 뱅크가 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계;
    상기 제 1 서브대역 신호를 사용하여 상기 시간 도메인 오디오 신호를 파라메터에 의해 인코딩하는 단계;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계;
    상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 단계를 포함하는, 시간 도메인 오디오 신호 인코딩 방법.
  20. 오디오 신호를 수신하기 위한 수신기에 있어서,
    인코딩된 데이터 스트림을 수신하는 수신기;
    상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하는 생성기로서, 상기 제 1 서브대역 신호는 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 생성기;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 변환기으로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 변환기;
    상기 제 2 서브대역 신호를 사용하여 파라메트릭 데이터를 파라메터에 의해 디코딩하는 파라메트릭 디코더; 및
    상기 제 2 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하는 합성 필터 뱅크를 포함하는, 수신기.
  21. 인코딩된 오디오 신호를 송신하기 위한 송신기에 있어서,
    시간 도메인 오디오 신호를 수신하는 수신기;
    상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 제 1 필터 뱅크로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 필터 뱅크;
    상기 제 1 서브대역 신호를 사용하여 상기 시간 도메인 오디오 신호를 파라메터에 의해 인코딩하는 파라메트릭 인코더;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 변환기로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 변환기;
    상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 생성기; 및
    상기 파형 인코딩된 데이터 스트림을 송신하는 수단을 포함하는, 송신기.
  22. 시간 도메인 오디오 신호를 송신하기 위한 송신 시스템에 있어서,
    상기 시간 도메인 오디오 신호를 수신하는 수신 수단;
    상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 제 1 필터 뱅크로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 필터 뱅크;
    상기 제 1 서브대역 신호를 사용하여 상기 시간 도메인 오디오 신호를 파라메터에 의해 인코딩하는 파라메트릭 인코더;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 변환기로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호를 생성하는 변환기;
    상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 생성기; 및
    상기 파형 인코딩된 데이터 스트림을 송신하는 수단을 포함하는 송신기와,
    상기 파형 인코딩된 데이터 스트림을 수신하는 수신 수단,
    상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 3 서브대역 신호를 생성하는 생성기로서, 상기 제 3 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 복소수 서브대역 도메인 신호 표현에 대응하는, 상기 제 3 서브대역 신호를 생성하는 생성기,
    서브대역 프로세싱에 의해 상기 제 3 서브대역 신호 또는 상기 제 3 서브대역 신호의 처리된 버전으로부터 제 4 서브대역 신호를 생성하는 변환기로서, 상기 제 4 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 4 서브대역 신호를 생성하는 변환기,
    상기 제 4 서브대역 신호를 사용하여 파라메트릭 데이터를 파라메터에 의해 디코딩하는 파라메트릭 디코더, 및
    상기 제 4 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하는 합성 필터 뱅크를 포함하는 수신기를 포함하는, 송신 시스템.
  23. 오디오 신호를 수신하는 방법에 있어서,
    인코딩된 데이터 스트림을 수신하는 단계;
    상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계;
    상기 제 2 서브대역 신호를 사용하여 파라메트릭 데이터를 파라메터에 의해 디코딩하는 단계; 및
    합성 필터 뱅크를 사용하여 상기 제 2 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하는 단계를 포함하는, 오디오 신호 수신 방법.
  24. 인코딩된 오디오 신호를 송신하는 방법에 있어서,
    시간 도메인 오디오 신호를 수신하는 단계;
    제 1 필터 뱅크가 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계;
    상기 제 1 서브대역 신호를 사용하여 상기 시간 도메인 오디오 신호를 파라메터에 의해 인코딩하는 단계;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계;
    상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 단계; 및
    상기 파형 인코딩된 데이터 스트림을 송신하는 단계를 포함하는, 인코딩된 오디오 신호 송신 방법.
  25. 시간 도메인 오디오 신호를 송신 및 수신하는 방법에 있어서,
    송신기에서,
    상기 시간 도메인 오디오 신호를 수신하는 단계;
    제 1 필터 뱅크가 상기 시간 도메인 오디오 신호로부터 제 1 서브대역 신호를 생성하는 단계로서, 상기 제 1 서브대역 신호는 상기 시간 도메인 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 1 서브대역 신호 생성 단계;
    상기 제 1 서브대역 신호를 사용하여 상기 시간 도메인 오디오 신호를 파라메터에 의해 인코딩하는 단계;
    서브대역 프로세싱에 의해 상기 제 1 서브대역 신호 또는 상기 제 1 서브대역 신호의 처리된 버전으로부터 제 2 서브대역 신호를 생성하는 단계로서, 상기 제 2 서브대역 신호는 상기 시간 도메인 오디오 신호들의 임계적으로 샘플링된 서브대역 도메인 표현에 대응하는, 상기 제 2 서브대역 신호 생성 단계;
    상기 제 2 서브대역 신호의 데이터 값들을 인코딩함으로써 파형 인코딩된 데이터 스트림을 생성하는 단계; 및
    상기 파형 인코딩된 데이터 스트림을 송신하는 단계를 포함하고,
    수신기에서,
    상기 파형 인코딩된 데이터 스트림을 수신하는 단계;
    상기 인코딩된 데이터 스트림의 데이터 값들을 디코딩함으로써 제 3 서브대역 신호를 생성하는 단계로서, 상기 제 3 서브대역 신호는 상기 시간 도메인 오디오 신호의 임계적으로 샘플링된 서브대역 도메인 신호 표현에 대응하는, 상기 제 3 서브대역 신호 생성 단계;
    서브대역 프로세싱에 의해 상기 제 3 서브대역 신호 또는 상기 제 3 서브대역 신호의 처리된 버전으로부터 제 4 서브대역 신호를 생성하는 단계로서, 상기 제 4 서브대역 신호는 상기 시간 도메인 오디오 신호의 비임계적으로 샘플링된 복소수 서브대역 도메인 표현에 대응하는, 상기 제 4 서브대역 신호 생성 단계;
    상기 제 4 서브대역 신호를 사용하여 파라메트릭 데이터를 파라메터에 의해 디코딩하는 단계; 및
    합성 필터 뱅크를 사용하여 상기 제 4 서브대역 신호로부터 시간 도메인 오디오 신호를 생성하는 단계를 포함하는, 시간 도메인 오디오 신호 송신 및 수신 방법.
  26. 제 18 항, 제 19 항, 제 23 항, 제 24 항, 또는 제 25 항 중 어느 한 항의 방법을 실행하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  27. 제 1 항에 따른 디코더를 포함하는 오디오 재생 디바이스.
  28. 제 5 항에 따른 인코더를 포함하는 오디오 레코딩 디바이스.
KR1020077012506A 2004-11-02 2005-10-31 복소수 값 필터 뱅크들을 사용하는 오디오 신호들의 인코딩및 디코딩 KR101187597B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04105457.8 2004-11-02
EP04105457 2004-11-02
EP05108293.1 2005-09-09
EP05108293 2005-09-09
PCT/IB2005/053545 WO2006048814A1 (en) 2004-11-02 2005-10-31 Encoding and decoding of audio signals using complex-valued filter banks

Publications (2)

Publication Number Publication Date
KR20070085681A KR20070085681A (ko) 2007-08-27
KR101187597B1 true KR101187597B1 (ko) 2012-10-12

Family

ID=35530766

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077012506A KR101187597B1 (ko) 2004-11-02 2005-10-31 복소수 값 필터 뱅크들을 사용하는 오디오 신호들의 인코딩및 디코딩

Country Status (11)

Country Link
US (1) US8255231B2 (ko)
EP (1) EP1810281B1 (ko)
JP (1) JP4939424B2 (ko)
KR (1) KR101187597B1 (ko)
CN (2) CN102148035B (ko)
BR (1) BRPI0517234B1 (ko)
ES (1) ES2791001T3 (ko)
MX (1) MX2007005103A (ko)
PL (1) PL1810281T3 (ko)
RU (1) RU2407069C2 (ko)
WO (1) WO2006048814A1 (ko)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2099027A1 (en) * 2008-03-05 2009-09-09 Deutsche Thomson OHG Method and apparatus for transforming between different filter bank domains
RU2493618C2 (ru) 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
EP4120254A1 (en) 2009-01-28 2023-01-18 Dolby International AB Improved harmonic transposition
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
US11657788B2 (en) * 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI643187B (zh) * 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
KR101405022B1 (ko) * 2009-09-18 2014-06-10 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체
CN102934164B (zh) 2010-03-09 2015-12-09 弗兰霍菲尔运输应用研究公司 改变回放速度或音调时处理音频信号中瞬态声音事件的设备和方法
RU2596033C2 (ru) 2010-03-09 2016-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере
PL3570278T3 (pl) * 2010-03-09 2023-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja wysokiej częstotliwości wejściowego sygnału audio przy użyciu kaskadowych banków filtrów
ES2935911T3 (es) 2010-04-09 2023-03-13 Dolby Int Ab Descodificación estéreo de predicción compleja basada en MDCT
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MY176904A (en) 2010-06-09 2020-08-26 Panasonic Ip Corp America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN103270553B (zh) 2010-08-12 2015-08-12 弗兰霍菲尔运输应用研究公司 对正交镜像滤波器式音频编译码器的输出信号的重新取样
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
CN106409305B (zh) * 2010-12-29 2019-12-10 三星电子株式会社 用于针对高频带宽扩展进行编码/解码的设备和方法
CN103733516B (zh) * 2011-06-10 2017-10-13 技术研究及发展基金公司 接收机、发射机以及用于数字多子频带处理的方法
US9530424B2 (en) 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CA3054712C (en) 2013-01-08 2020-06-09 Lars Villemoes Model based prediction in a critically sampled filterbank
CN104078048B (zh) * 2013-03-29 2017-05-03 北京天籁传音数字技术有限公司 一种声音解码装置及其方法
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
US9570083B2 (en) 2013-04-05 2017-02-14 Dolby International Ab Stereo audio encoder and decoder
US9379830B2 (en) * 2013-08-16 2016-06-28 Arris Enterprises, Inc. Digitized broadcast signals
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US9609451B2 (en) * 2015-02-12 2017-03-28 Dts, Inc. Multi-rate system for audio processing
CN108140396B (zh) * 2015-09-22 2022-11-25 皇家飞利浦有限公司 音频信号处理
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
EP3301673A1 (en) * 2016-09-30 2018-04-04 Nxp B.V. Audio communication method and apparatus
US10109959B1 (en) * 2017-05-25 2018-10-23 Juniper Networks, Inc. Electrical connector with embedded processor
JP7072041B2 (ja) * 2020-12-11 2022-05-19 株式会社東芝 計算装置
JP7254993B2 (ja) * 2020-12-11 2023-04-10 株式会社東芝 計算装置
TW202334938A (zh) * 2021-12-20 2023-09-01 瑞典商都比國際公司 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004027368A1 (en) 2002-09-19 2004-04-01 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
DE19647399C1 (de) 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
CN1318904A (zh) * 2001-03-13 2001-10-24 北京阜国数字技术有限公司 一种实用的基于小波变换的声音编解码器
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
BR0311601A (pt) * 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
WO2004105253A1 (ja) * 2003-05-21 2004-12-02 Sony Corporation データ処理装置、符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004027368A1 (en) 2002-09-19 2004-04-01 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LOW COMPLEXITY PARAMETRIC STEREO CODING IN MPEG-4, Proc. of the 7th Int. Conference on Digital Audio Effects (DAFx'04), Page(s):163-168 (2004.10.5-8)*

Also Published As

Publication number Publication date
CN102148035A (zh) 2011-08-10
JP2008519290A (ja) 2008-06-05
US8255231B2 (en) 2012-08-28
EP1810281B1 (en) 2020-02-26
CN102148035B (zh) 2014-06-18
BRPI0517234B1 (pt) 2019-07-02
KR20070085681A (ko) 2007-08-27
JP4939424B2 (ja) 2012-05-23
BRPI0517234A (pt) 2008-10-07
CN101053019A (zh) 2007-10-10
RU2007120591A (ru) 2008-12-10
EP1810281A1 (en) 2007-07-25
ES2791001T3 (es) 2020-10-30
RU2407069C2 (ru) 2010-12-20
WO2006048814A1 (en) 2006-05-11
US20090063140A1 (en) 2009-03-05
MX2007005103A (es) 2007-07-04
CN101053019B (zh) 2012-01-25
PL1810281T3 (pl) 2020-07-27

Similar Documents

Publication Publication Date Title
KR101187597B1 (ko) 복소수 값 필터 뱅크들을 사용하는 오디오 신호들의 인코딩및 디코딩
JP7126328B2 (ja) 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ
KR100954179B1 (ko) 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성
US9037454B2 (en) Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (MCLT)
JP2013528822A (ja) オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法
KR20140004086A (ko) 반대 위상의 채널들에 대한 개선된 스테레오 파라메트릭 인코딩/디코딩
TW201514974A (zh) 具有在頻譜域填充有智慧間隙之音頻訊號之編碼或解碼裝置與方法
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
Britanak et al. Cosine-/Sine-Modulated Filter Banks
KR101418227B1 (ko) 스피치 시그널 부호화 방법 및 복호화 방법
US8433584B2 (en) Multi-channel audio decoding method and apparatus therefor
KR20080076691A (ko) 멀티채널 오디오신호 복호화방법 및 그 장치, 부호화방법및 그 장치
AU2013211560B2 (en) Improved harmonic transposition

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150902

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160830

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170828

Year of fee payment: 6