KR101106026B1 - 오디오 신호 인코딩 또는 디코딩 - Google Patents
오디오 신호 인코딩 또는 디코딩 Download PDFInfo
- Publication number
- KR101106026B1 KR101106026B1 KR1020067008373A KR20067008373A KR101106026B1 KR 101106026 B1 KR101106026 B1 KR 101106026B1 KR 1020067008373 A KR1020067008373 A KR 1020067008373A KR 20067008373 A KR20067008373 A KR 20067008373A KR 101106026 B1 KR101106026 B1 KR 101106026B1
- Authority
- KR
- South Korea
- Prior art keywords
- subband
- subband signals
- downsampled
- signals
- audio signal
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 56
- 238000001914 filtration Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims description 29
- 230000003595 spectral effect Effects 0.000 claims description 8
- 239000002131 composite material Substances 0.000 claims description 7
- 230000010076 replication Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 24
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 230000004044 response Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Stereophonic System (AREA)
- Insulated Conductors (AREA)
Abstract
오디오 신호를 인코딩하는 것이 제공되고, 오디오 신호는 제 1 오디오 채널과 제 2 오디오 채널을 포함하고, 인코딩은 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들 및 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 복합 모듈화 필터 뱅크의 제 1 오디오 채널 및 제 2 오디오 채널들 각각을 서브대역 필터링하는 단계; 다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하도록 각각의 서브대역 신호들을 다운샘플링하는 단계; 복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크의 적어도 하나의 다운샘플링된 서브대역 신호들에서 추가의 서브대역 필터링하는 단계; 추가의 서브대역 필터링이 없는 다운샘플링된 서브대역 신호들 및 서브-서브대역 신호들로부터 공간 파라미터들을 유도하는 단계; 다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 유도 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함한다. 또한, 디코딩이 제공되고, 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호를 포함하고, 공간 파라미터들의 세트는 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 인코딩된 단일 채널 오디오 채널에 의해 디코딩되고, 또한, 복수의 서브-서브대역 신호들을 제공하기 위해 부가의 필터 뱅크에서 적어도 하나의 다운샘플링된 서브대역 신호들을 부가 서브대역 필터링하고, 공간 매개변수들로부터 두개의 오디오 채널들을 유도하고, 서브-서브대역 신호들과 다운샘플링된 서브대역 신호들은 부가의 서브대역 필터링이 없다.
오디오 신호, 인코딩, 공간 파라미터, 필터 뱅크, 채널 오디오 신호
Description
본 발명은 오디오 신호를 인코딩하거나 또는 인코딩된 오디오 신호를 디코딩하는 것에 관한 것이다.
2003년 3월자 Erik Schuijers, Wemer Oomen, Bert den Brinker and JeroenBreebaart, "Advances in Parametric Coding for High-Quality Audio", Preprint5852, 114th AES Convention, Amsterdam, The Netherlands, 22-25에는 스테레오 이미지용의 효율적인 파라메트릭 표시를 이용하는 파라메트릭 코딩 체계가 개시된다. 두개의 입력 신호들은 하나 이상의 모노 오디오 신호로 합체된다. 지각 가능한 상응하는 공간적인 큐우(cue)들은 도1에 도시된 바와 같이 명백하게 모델링된다. 합체된 신호는 모노 파라메트릭 인코더를 이용하여 인코딩된다. 스테레오 파라미터들, 인터채널 강도차(Interchannel Intensity Difference)(IID), 인터채널 시간차(Interchannel Time Difference)(ITD) 및 인터채널 상호상관(Interchannel Cross-Correlation)(ICC)들은 양자화되고, 인코딩되고, 양자화되고 인코딩된 오디오 신호와 함께 비트 스트림으로 다중 송신(multiplexed)된다. 디코더측에서는, 비트 스트림은 인코딩된 모노 신호와 스테레오 파라미터들로 역다중화(de-multiplexed)된다. 인코딩된 모노 오디오 신호는 디코딩된 오디오 신호(m')를 얻기 위해 디코딩된다(도2 참조). 모노 시간 도메인 신호로부터, 역상관된 신호는 지각 가능한 역상관을 산출하는 필터(D)를 이용하여 계산된다. 모노 시간 도메인 신호(m')과 역상관된 신호(d)는 주파수 도메인으로 전송된다. 그 다음에, 주파수 도메인 스테레오 신호는 각각 디코딩된 스테레오 쌍(l', r')을 얻기 위해 파라미터 처리 유닛에서 스케일링, 위상 변조 및 혼합에 의해 IID, ITD 및 ICC 파라미터로 처리된다. 최종 주파수 도메인 표시들은 시간 도메인으로 다시 변환된다.
본 발명의 목적은 공간 파라미터들을 이용하여 오디오를 유리하게 인코딩 또는 디코딩을 제공하는 것이다. 그 결과, 본 발명은 독립항에서 한정된 바와 같이 인코딩 방법, 오디오 인코더, 전송 또는 저장 장치, 디코딩 방법, 오디오 디코더, 재생 장치 및 컴퓨터 프로그램 제품을 제공한다. 유리한 실시예들은 종속 청구항에서 한정된다.
본 발명의 제 1 양태에 따르면, 오디오 신호는 인코딩되고, 오디오신호는 제 1 오디오 채널과 제 2 오디오 채널을 포함하고, 인코딩은 제 1 오디오 채널용의 제 1 복수의 서브대역 신호들과 제 2 오디오 채널용의 제 2 복수의 서브대역 신호들을 제공하기 위해 복소 변조된 필터뱅크(filterbank)의 제 1 오디오 채널과 제 2 오디오 채널의 각각을 서브대역(subband) 필터링하는 단계와, 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들을 제공하도록 각각의 서브대역 신호들을 다운샘플링하는 단계와, 복수의 서브-서브대역 신호들을 제공하기 위해 다른 필터뱅크의 다운 샘플링된 서브대역 신호들 중 적어도 하나를 서브대역 필터링하는 단계와, 서브-서브대역 신호들로부터 그리고 부가의 서브대역 필터링되지 않은 다운샘플링된 서브대역로부터 공간 파라미터들을 유도하는 단계와, 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들로부터 유도된 유도 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함한다. 서브대역의 부가의 서브대역 필터링 단계를 제공함으로써, 서브대역의 주파수 분해능은 증가된다. 이러한 증가된 주파수 분해능은 (소수의 대역들만이 변환되기 때문에) 효율적인 실행에서 보다 높은 오디오 품질(단일 서브대역 신호의 대역폭이 통상적으로 인간 청각의 임계 대역들보다 통상적으로 높다)을 달성하기 위해 가능하기 때문에 이점이 있다. 파라메트릭 공간 코더(coder)는 비균일 주파수 스케일에서 인지된 두 귀를 모니터링하기 위해 수행되고, 평형 직각 대역(Equivalent Rectangular Bands)(ERB) 스케일과 유사하다. 단일 채널 오디오 신호는 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들로부터 직접적으로 유도될 수 있다. 그러나, 단일 채널 오디오 신호는 각각의 서브대역들용의 서브-서브대역 신호들이 새로운 서브대역 신호들로부터 유도되는 경우에 서브-서브대역 신호들이 부가로 서브대역 필터링되는 다운샘플링된 서브대역용의 서브-서브대역 신호들로부터 유리하게는 유도되고, 단일 채널 오디오 신호는 부가로 필터링되지 않는 제 1 및 제 2 복수의 서브대역들로부터의 서브대역들과 새로운 서브대역 신호들로부터 유도된다.
본 발명의 다른 주요한 양태에 따라, 인코딩된 오디오 신호의 오디오 디코딩이 제공되고, 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호와 공간 파라미터들의 세트를 포함하고, 오디오 디코딩은 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계와, 복수의 서브대역 신호들을 제공하기 위해 부가의 필터뱅크의 다운샘플링된 서브대역 신호들 중 적어도 하나를 부가의 서브대역 필터링하는 단계와, 공간 파라미터로부터 두개의 오디오 채널, 서브-서브대역 신호들 및 추가 서브대역 필터링되지 않는 이들 서브대역들용의 다운샘플링된 서브대역 신호들을 유도하는 단계를 포함한다. 서브대역의 추가의 서브대역 필터링을 제공함으로써, 서브대역의 주파수 분해능은 증가하고 따라서 보다 우수한 품질의 오디오 디코딩이 달성될 수 있다.
본 발명의 이들 양태들의 주요한 장점 중 하나는 파라메트릭 공간 코딩이 스펙트럼 대역 복제(Spectral Band Replication)(SBR) 기술과 쉽게 합체될 수 있다는 것이다. SBR은 Martin Dietz, Lars Liljeryd, KristoferKjorling 및 Oliver Kunz의 "Spectral Band Replication, a novel approach in audio coding", Preprint55 53, 112'AES Convention, Munich, Germany, 10-13 2002년 5월호와, Per Ekstrand의,"Bandwidth extension of audio signals by spectral band replication", Proc.1 st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp. 53-58, Leuven, Belgium, 2002년 11월 15일자에서 공지되었다. 또한, MPEG-4 standard ISO/IEC 14496-3:2001/FDAM1,JTC1/SC29/WGl l, Coding of Moving Pictures and Audio, Bandwidth Extension which describes an audio codec using SBR을 참조한다.
SBR은 통상적으로 오디오 신호의 낮고 높은 주파수들 사이에 큰 상관 관계가 있다는 개념에 기초한다. 이와 같이, SBR 프로세스는 스펙트럼 인벨로프(envelope)가 비트 스트림에 인코딩된 작은 정보를 이용하여 스펙트럼의 높은 부분(들)용으로 조정된 후에 높은 부분(들)에 대해 스펙트럼의 낮은 부분(들)을 복제하는 것으로 구성된다. 이러한 SBR 개선 디코더의 단순화된 블록도가 도3에 도시된다. 비트 스트림은 역다중화되고 코어 데이터(즉, MPEG-2/4 Advanced Audio Coding) 및 SBR 데이터로 디코딩된다. 코어 데이터를 이용하여, 신호는 전체 대역폭 신호의 샘플링 주파수의 절반으로 디코딩된다. 코어 디코더의 출력은 복소(모조) 격자구조 대칭 필터(Quadrature Mirror Filter)(QMF) 뱅크에 의해 분석된다. 이들 32개의 대역들은 예를 들어, 고주파(HF) 내용이 낮은 대역들의 복사부(들)에 의해 발생되는 64개의 대역들인 전체 대역으로 확장된다. HF 내용이 발생되는 대역의 인벨로프는 SBR 데이터에 따라 조정된다. 최종적으로 64개의 대역들의 복소 QMF 합성 뱅크에 의해, PCM 출력 신호는 재구성된다.
도3에 도시된 바와 같은 SBR 디코더는 소위 이중 비율 디코더이다. 이는 코어 디코더가 샘플링 주파수의 절반에서 작동하고 따라서 32개의 대역들의 분석 QMF 뱅크가 이용된다는 것을 의미한다. 코어 디코더가 전체 샘플링 주파수에서 작동하고, 분석 QMF 뱅크가 64개의 대역들로 구성된 단일 비율 디코더들이 가능하다. 실질적으로, 재구성은 (모조) 복소 QMF 뱅크에 의해 수행된다. 복소 QMF 필터 뱅크가 임계적으로 샘플링되지 않기 때문에, 위신호를 계수하기 위해 여분의 준비를 취할 필요가 없다. Ekstrand에 의해 개시된 바와 같은 SBR 디코더에서, 분석 QMF 대역은 32개로만 구성되지만, 코어 디코더가 전체 오디오 디코더에 비해 절반의 샘플링 주파수에서 작동함에 따라 합성 QMF 뱅크는 64개의 대역들로 구성된다. 그러나, 대응하는 인코더에서, 64개의 대역 분석 QMF 뱅크는 전체 주파수 범위를 커버하기 위해 이용된다.
본 발명은 특히 스테레오 오디오 코딩에 유리하지만, 본 발명은 또한 두개의 오디오 채널들 이상의 신호들을 코딩하는데 또한 유리하다.
본 발명의 이들 및 다른 양태들은 명백하고, 후술하는 실시예들을 참조하면 명료하게 될 것이다.
도 1은 파라메트릭 스테레오(PS) 인코더에 이용되는 스테레오 파라미터 추출을 위한 유닛의 블록도를 도시한 도면.
도 2는 PS 디코더에 이용되는 스테레오 신호의 재구성을 위한 유닛의 블록도를 도시한 도면.
도 3은 스펙트럼 대역 복제(SBR) 디코더의 블록도를 도시한 도면.
도 4는 본 발명의 실시예에 따른 합체된 PS 및 개선된 SBR 인코더의 블록도를 도시한 도면.
도 5는 본 발명의 실시예에 따른 합체된 PS 및 개선된 SBR 인코더의 블록도를 도시한 도면.
도 6은 M 대역들의 다운샘플링된 복소 QMF 분석(좌측)과 합성 뱅크(우측)를 도시한 도면.
도 7은 프로토타입 필터의 dB 크기 반응을 도시한 도면.
도 8은 64개의 다운샘플링되지 않은 복소 변조된 분석 필터들 중에서 처음 4개의 dB 크기 반응을 도시한 도면.
도 9는 사소한 합성을 갖는 Q 대역들의 필터 뱅크의 블록도를 도시한 도면.
도 10은 처음의 다운샘플링되지 않은 변조된 QMF 필터와 8개의 대역들의 복소 변조된 필터 뱅크의 합체된 dB 크기 반응을 도시한 도면.
도 11은 본 발명의 실시예에 따른 짝수를 적층된 필터 뱅크(상부)와 홀수로 적층된 필터 뱅크(저부)의 4개의 대역들의 정형화된 크기 반응을 도시한 도면.
도 12는 본 발명의 실시예에 따른 64개의 대역들의 복소 분석 QMF에 기초한 77개의 대역들의 비균일 하이브리드 분석 필터 뱅크를 도시한 도면.
도 13은 오디오 디코더에 이용하기 위한 64개의 대역들의 복소 분석 QMF에 기초한 71개의 대역들의 비균일 하이브리드 분석 필터 뱅크를 도시한 도면.
도 14는 복소 변조 분석 필터 뱅크의 효율적인 실행의 블록도를 도시한 도면.
이러한 도면들은 본 발명을 이해시키기 위해서 필수적인 이들 요소들만을 도시한다.
SBR과 PS의 합체는 잠재적으로는 매우 강력한 코덱을 산출한다. SBR과 PS는 상당히 유사한 구조, 예를 들어 주파수 변환에 대한 시간의 소정의 형상, 처리 및 최종적으로는 주파수의 시간에 대한 변환으로 구성된 디코더에서 후처리된 알고리즘이다. 두 알고리즘들을 합체할 때, 두 알고리즘들이 예를 들어, DSP 어플리케이 션에서 동시에 작동하는 것이 요구된다. 여기서, 하나의 코덱의 계산된 중간 결과들을 가능한 한 다른 것에 재사용하는 것이 유리하다. PS를 SBR에 합체하는 경우에, 이는 PS 처리를 위해 복소 (모조) QMF 서브대역 신호들을 재사용하도록 한다. 합체된 인코더(도 4 참조)에서, 스테레오 입력 신호는 두개의 64 대역들의 분석 필터 뱅크에 의해 분석된다. 복소 서브대역 도메인 표시를 이용하여, PS 계산 유닛은 스테레오 파라미터를 추정하고 모노 (서브대역) 다운 믹스를 생성한다. 이러한 모노 다운 믹스는 SBR 파라미터 추정 유닛으로 공급된다. 최종적으로, 모노 다운 믹스는 코어 디코더(코어 디코더는 대역폭의 절반만을 필요로 한다)에 의해 코딩될 수 있도록 32개의 대역 합성 필터 뱅크에 의해 시간 도메인으로 다시 변환된다.
도5에 도시된 바와 같은 합체된 디코더에서, 이중 비율 또는 단일 비율 시스템이 이용되는지 여부에 관계없이, 인벨로프 조정 후의 전체 대역폭(64 대역들) 서브대역 도메인 신호들은 스테레오 파라미터들에 따라 서브대역 도메인 신호들의 스테레오 세트로 변환된다. 이들 두 세트들의 서브대역 신호들은 최종적으로는 64 대역들의 합성 QMF 뱅크에 의해 시간 도메인으로 변환된다. PS가 SBR과 합체되면, QMF 필터들의 저주파 대역들의 대역폭은 고품질 스테레오 표시용으로 요구되는 것보다 크다. 그래서, 스테레오 이미지의 고품질 표시를 제공할 수 있도록 하기 위해, 낮은 서브대역 신호들의 부가의 서브디비전이 본 발명의 유리한 실시예들에 따라 수행된다.
본 발명의 양태들의 보다 용이한 이해를 위해, 복소 QMF 서브대역 필터들 기반의 이론이 우선 설명된다.
QMF 서브대역 필터들
QMF 분석 서브대역 필터는 이하와 같이 설명될 수 있다. 주어진 실수치의 선형 위상 프로토타입 필터 p(ν), M 대역 복소 변조 분석 필터 뱅크가 분석 필터에 의해 한정될 수 있다.
k = 0, 1,..., M-1이다. 위상 파라미터 θ는 이하의 분석에는 중요하지 않지만, 통상적인 선택은 (N+M)/2이고, 여기서 N은 프로토타입 필터 순서이다. 주어진 실수치의 개별 시간 신호 x(ν), 서브대역 신호들 νk(n)들은 x(ν)를 hk(ν)로 필터링(회선)하고 계수 M(도6의 좌측 참조)에 의해 결과를 다운샘플링함으로써 얻어진다.
합성 작동은 QMF 서브대역 신호들을 계수 M으로 제 1 업샘플링하고, 그 다음에 [수학식 1]의 복소 변조된 필터들로 필터링하고, 결과들을 가산하고 최종적으로 실수 부분을 두 번 취하는 것(도6의 우측 참조)으로 구성된다. 실수치 신호들의 거의 완벽한 재구성이 실수치 선형 위상 프로토타입 필터 p(ν)의 적절한 설계에 의해 얻어질 수 있다. 64 대역들의 경우에 MPEG-4 표준(전술함)의 SBR 시스템에 이용되는 것과 같은 프로토타입 필터들의 크기 반응은 도7에 도시된다. 64 복소 변조 분석 필터들의 크기 반응들은 프로토타입 필터 p(ν)의 크기 반응을 π/M (k+1/2)만큼 시프트시킴에 의해 얻어진다. 이들 반등들의 일부는 도8에 도시된다. k = 0 및 k = M-1을 제외하고는 양의 주파수만이 필터링된다는 것에 주의한다. 그 결과, 다운샘플링 이전의 서브대역 신호들은 분석적인 것에 근접하고, 실수치 사인 곡선들의 증폭 및 위상 변조를 용이하게 한다. 위상 변조들은 또한 이들 대역들에 존재하는 사인 곡선들이 각각 π/2M 또는 π-π/2M 이상의 주파수를 가지는 한 최초 및 최종 대역용으로 가능하다. 이러한 영역 외의 주파수에서, 음의 주파수의 간섭 때문에 위상 변조의 성능은 빠르게 악화된다.
본 발명의 실시예들에서 전술한 바와 같이 QMF 분석 필터에서 시작하여, 보다 정교한 주파수 분해능이 각각의 다운샘플링된 서브대역 신호 νk(n)을 QK 서브-서브대역으로 부가 필터링함으로써 얻어진다.
복소 QMF 서브대역 도메인의 신호 변조
이하에서, 은 개별 시간 신호 z(n)의 개별 시간 푸리에 변환(Fourier transform)이 된다. 전술한 바와 같이 거의 근접한 재구성 특성과, 또한 전술한 바와 같은 프로토타입 필터(p(ν)의 경우에서 P(ω), p(ν)의 푸리에 변환이 기본적으로 주파수 간격[-π/M, π/M]의 외측으로 소멸된다고 가정하면, 여기서 다음 단계는 서브대역 신호들 νk(n)이 합성 전에 변조되는 시스템으로 고려된다. 이제, 각각의 서브대역 k는 필터 bk(ω)로 필터링함으로써 변조된다. 확장식은,
여기서, *는 복소 공액을 지시하고, 필터 뱅크 합성을 포함하는 최종 시스템이 필터로 필터링하는 것에 대응되는 것으로 도시될 수 있다(전체 딜레이 무시, 실수치 입력 및 단일 비율 시스템 가정).
P(ω)의 특성에 대한 가설에 따라, [수학식 3]의 모든 k에서 Bk(ω) = 1을 삽입하여 B(ω) = 1이 되고 제곱의 합은 시프트된 프로토타입 필터 반응들을 야기한다. 실수치 상수 Bk(ω) = bk ≥ 0를 선택함으로써, 시스템은 π(k+1/2)의 주파수에서 이득값들 bk과 합체된 평형기로써 작동한다. 인력 특성은 즉, 다운샘플링 및 업샘플링 대신에 위신호 없이 시간 불변이다. 이는 물론 정해진 프로토타입의 필터 가정의 편차량만을 조정할 것이다.
모노 오디오 신호를 유도하기 위해, 복소 서브대역 신호들의 부가의 서브 필터링이 이들 특성을 보존할 뿐만 아니라 이들 특성을 필터링된 서브대역 신호들을 촉진하도록 하는 이들 특성을 확장시킬 것이다. 이들 특성들을 보존하는 서브 필터링은 P.P Vaidyanathan, "Multirate systems and filter banks", Prentice Hall Signal Processing Series, 1993, sections 4.6.1-4.6.2로부터 반복되는 바와 같이 소위 M 대역 필터들의 변조를 이용하여 수행될 수 있다.
자명한 합성을 갖는 변조된 필터 뱅크들
개별 시간 신호 ν(n)는 임펄스 반응들 gq(n), q = 0, 1,...Q-1을 갖는 필터들의 뱅크에 의해 Q 상이 신호들로 분할될 수 있다. 이는 도9에 도시된다. 대응 분석 출력을 yq(n)으로 놓고 자명한 합성 작용을 이하와 같이 가정하면,
완전한 재구성, y(n) = ν(n)이 필터를 선택함으로써 얻어지고, 이는,
여기서, n = 0일때 δ(n) = 1이고, n ≠ 0일 때 δ(n) = 0이다. 일반적인 필터들용으로, [수학식 5]의 우측은 δ(n-d)로 대체될 수 있고, 여기서, d는 정의 딜레이이지만, 이러한 간단한 변조는 설명을 명료하기 위해 생략된다.
필터들 gq(n)은 이하의 식을 통해 프로토타입 필터 g(n)의 복소 변조로써 선택될 수 있다.
본 발명의 이러한 바람직한 실시예에서, 필터들은 홀수(계수 q+1/2)마다 적층된다. 이러한 바람직한 실시예의 이점은 후술된다. 완벽한 재구성 [수학식 5]는 이하에서만 얻어진다.
이것의 변형은 아래와 같은 실수치 코사인 변조이다.
여기서, 실수치 프로토타입 필터 g(m)는 이하를 만족한다.
(이는 [수학식 6]의 gq(n) + gQ -1-q(n)을 고려함으로써 쉽게 얻어진다)
복소 지수 변조 필터 뱅크의 서브 필터링
전술한 바와 같은 QMF 분석 필터들로부터 시작하여, 미세한 주파수 해상력은 전술한 변조된 구조들인 [수학식 6] 또는 [수학식 8] 중 하나를 이용함으로써 각각의 다운샘플링된 서브대역 신호 νk(n)을 Qk 서브-서브대역들로 부가 필터링함으로써 얻어진다. 최종 출력 신호들 yq k(n)을 지시하고, gq k(n)이 서브대역 k 내에 인가된 필터 뱅크를 설명하도록 한다. Qk = 1이면, 필터링이 없고, g0 k(n) = δ(n)이다. 통상적인 어플리케이션 예는 M = 64이고, Q0 = 8이고, k = 1, 2일 때 Qk = 4이고, k > 2일 때 Qk = 1인 경우이다.
x(ν)로부터 yq k(n)까지의 두개의 필터 뱅크들의 조합된 효과는 필터들 Fq k(ω)로 필터링함으로써 계수 M에 의해 다운샘플링되는 것으로 설명되고, 여기서,
프로토타입 필터 반응 P(ω)은 기본적으로 인터벌 [-π/M, π/M] 외측에서 영이고, 이는 SBR 분석 필터들(도7 참조)용의 경우이고, 필터 Fq k(ω)는 하기 [수학식 10]에 의해 복소 변조 경우에서 한정된 단일 공칭 중심 주파수를 갖는다.
여기서, s는 Qk(k-1/2)≤2(q+Qks)+1≤Qk(k+3/2)과 같이 선택된 정수이다. 예를 들어, 도 10에 도시된 바와 같이, k = 0이고, Q0 = 8이면, ω0,0, ω0,1,...ω0,7의 값은,
비균일 주파수 해상력을 갖는 신호 변조
전술한 바와 같은 서브-서브대역 필터 뱅크들은 부가의 다운샘플링을 도입하지 않아서, 복소 QMF만의 경우에서 도시된 바와 같은 신호 변조의 위신호가 없는 특성이 보존된다. M 서브대역 분석의 일반적인 합체 작동, Qk 서브대역 k 내에서의 서브대역들 이용함으로써 부가의 서브대역 필터링, 필터 Ak,q(ω)에 의한 각각의 서브-서브대역 신호 yq k(n)의 필터링, 합에 의한 각각의 서브대역 k 내의 합성 및 최종적으로 M 대역 합성 뱅크를 통한 합성을 고려한다. 이러한 시스템의 전체 전송 기능은 k ≥ 0일 때 [수학식 3]에 의해 주어진다.
ω > π/(2M)에서, 이는 아래와 같이 주어져서,
실수 서브-서브대역 프로토타입 필터 계수를 추정하면, 아래와 같이 고정되고,
변조 필터들은 아래와 같이 선택되고,
여기서, B0(-Mω)* = B0(Mω)이고, [수학식 3]과 관련하여 전술한 제곱근 식별은 이하를 야기한다.
[수학식 15] 내지 [수학식 17]은 양 및 음의 주파수들 사이에서 식별하는데 바람직한 것을 나타낸다. 이는 홀수로 적층된 (복소) 필터들이 짝수로 적층된 (복 소) 필터들(도 11 참조) 대신에 QMF 서브대역 신호들을 서브 필터링하는데 이용되기 때문이다. 짝수로 적층된 필터들에서, 양 및 음의 주파수들 사이에서 구별이 불가능하기 때문에, 중심 필터, 즉, 0의 중심 주파수를 갖는 필터에 존재하는 사인 곡선의 위상 변조를 적용시킬 수 없다. 반응 G(ω) 대역을 갖는 프로토타입 필터가 대역들의 수가 Q인 [-2π/Q, 2π/Q]에 제한된다고 가정하면, 홀수로 적층된 경우, 위상 변조들이 적합하게 인가될 수 있는 하부 제한은 2π/Q이고, 이에 반해, 홀수로 적층된 경우에서 위상 변조가 적합하게 인가될 수 있는 하부 제한은 π/Q이다.
도입부에서 전술한 바와 같이, PS 합성에서, 전술한 중요한 특별 경우들은 평등화되고 위상 변조이다. 균등화에서, Ak ,q(ω) = ak,q ≥ 0이고, [수학식 16]은 이하와 같이 줄어든다.
[수학식 16]의 상태인 경우의 Ak ,q(ω) = exp(iαk,q)에 대응되는 위상 변조는,
이면, 만족된다.
스테레오 파라미터 추정
비균일 복소 필터 뱅크, 즉, 전술한 바와 같이 QMF 뱅크 이후의 부가의 서브대역 필터링은 후술하는 바와 같이, Inter-channel Differences(IID), Inter-channel Phase Differences(IPD) 및 Inter-channel Cross Correlation(ICC)의 스테레오 파라미터들을 추정하는데 적용될 수 있다. 이러한 실질적인 실시예에서, IPD는 Schuijers 등의 문서에서 이용된 바와 같이 ITD용의 실질적인 등가 치환으로써 이용된다. 합체된 PS 인코더(도4 참조)에서, 제 1 내지 제 3 복소 QMF 채널들은 서브 필터링되어 전체 77개의 복소치 신호들이 얻어진다(도 12 참조).
이러한 시점에서, 77개의 복소치 시간 정렬된 좌측 및 우측 서브대역 신호들은 각각 lq k(n)과 rq k(n)로 지시되고, 따라서, yq k(n)의 지수이다.
소정의 서브대역 샘플 위치 n'에서 스테레오 파라미터들을 추정하기 위해, 좌측, 우측 및 비정규화된 크로스채널 여기는 이하와 같이 계산된다.
모든 스테레오 빈 b, h(n)은 길이 L. ε를 갖는 서브대역 도메인 윈도우이고, 0(예를 들어, ε=1e-10), 좌측 및 우측 서브대역 도메인 신호들인 lq k(n)과 rq k(n)으로 나누어지는 것을 방지하는 매우 작은 값이다. 20개의 스테레오 빈들의 경우에, 표에 도시된 바와 같이 k부터 kl까지의 합은 최대 kh이고, 이를 포함하고, q부터 ql까지의 합은 최대 qh이고, 이를 포함한다. "음"의 주파수들(예를 들어, k = 0이고, q = 4...7)은 [수학식 20]의 파라미터 추정에서 포함되지 않는다.
[표 1: k 및 q에 따른 합계의 개시 및 정지 인덱스들]
el(b), er(b) 및 eR(b)를 계산하기 위한 합계는 합계 내의 이러한 신호들의 중간 지점이 파라미터 위치에 일치하도록 정렬되고, 따라서 시프트는 에 의한다. 표 1로부터 명확한 바와 같이, 양의 중심 주파수를 갖는 서브대역 신호 및 서브-서브대역 신호들만이 예측 스테레오 파라미터들을 위해 사용된다.
각각의 스테레오 빈(b)을 위한, I(b)로 표시되는 IID, C(b)로 표시되는 ICC 및 P(b)로 표시되는 IPD는 아래와 같이 계산된다.
에서의 각도는 -π와 π 사이에서의 값들을 사용하는 4개의 4분할 아크탄젠트 함수를 사용하여 계산된다. 타겟 비트 비율 및 어플리케이션에 따라, 이러한 파라미터들 또는 이러한 파라미터들의 부분집합이 비트 스트림의 PS 부분 내로 양자화되고 코딩된다.
스테레오 신호 합성
디코더의 (RAM 사용에 관한) 산정된 비용을 가능한 한 낮게 유지하기 위해, 유사한 분석 구조물이 사용된다. 그러나, 제 1 대역은 부분적으로만 합성된다(도 13 참조). 이는 중간 대역 쌍 , , 및 의 합계에 의해 얻어진다. 또한, 제 2 및 제 3 대역은 및 의 출력의 합계에 의해 얻어지는 2개 대역 실제 값 필터 뱅크들 및, 와 의 출력의 합계이다(또한, 모듈화된 필터 뱅크들에 대한 부분의 설명 참조). 이러한 단순화된 디코더 필터 뱅크 구조물을 사용하여, 양의 주파수 및 음의 주파수 사이의 차별적인 특징은 제 1 서브대역 필터의 세분에 의해 여전히 유지된다. 디코더 분석 필터 뱅크는 도 13에 도시된다. QMF 필터링된 제 1 (서브) 서브대역 신호들의 인덱싱은 주파수에 따라 저장된다는 것을 인지한다.
단일 프레임의 스테레오 (서브) 서브대역 신호들은 아래와 같이 구성된다.
ICC 파라미터들 k=0, …, K-1, 서브대역 인덱스(K는 서브대역의 총 갯수, 즉 K=71), 프레임의 서브대역 샘플들의 갯수 N과 함께 QMF 서브대역 샘플 인덱스 n=0, …, N-1, 스케일 계수 조작 매트릭스들 Λ11, Λ12, Λ21, Λ22, 위상 회전 조작 매트릭스 Prl을 합성하는 것을 설명하기 위해, 모노 (서브) 서브대역 신호들 sk(n)과 함께 모노 디코렐레이티드 (서브) 서브대역 신호들 dk(n)은 모노 (서브) 서브대역 신호 sk(n)로부터 유도된다. 조작 매트릭스들은 시간 및 주파수의 함수로 정의되고, MPEG-4 표준 ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, 이동 사진 및 오디오의 코딩, 익스텐션 2에 설명된 바와 같이 조작 벡터들로부터 직접적으로 유도될 수 있다.
sk(n)은 도 13의 결과에 의한 도 12에 따라 한정된다.
스테레오 파라미터들의 합성은 표 1의 인덱싱에 따라 발생한다.
[표 1: 파라미터 인덱싱 표]
따라서, 합성 방정식은 아래와 같다.
prl의 신호는 표에 *가 부가되면 위의 방정식에서 변화한다는 것을 인지한다. 이는 [수학식 19], 즉 반대 위상 회전은 음의 주파수를 위해 인가되어야 한다는 것이다.
자명한 합성으로 모듈화된 필터 뱅크들의 효과적인 실행
길이(L)의 원형 필터를 갖는 모듈화된 필터 뱅크를 줄 때, 직접적인 형태의 실행은 입력 샘플 당 QL 작업들을 요구하지만, [수학식 6]에서의 모듈화가 주기(Q)에 반주기라는 사실은, 각각의 입력 샘플을 위한 크기(Q)의 변형 후에 L 작업들의 다상 윈도윙(windowing)으로 필터링을 분할하는데 사용될 수 있다. 이와 같은 다 상 표현은 1993년에 발행된 P.P. Vaidyanathan의 "Multirate systems and filter banks", Prentice Hall Signal Processing Series의 섹션 4.3)에 공지되었다는 것을 인지하여야 한다. 이하는 본 발명의 양호한 실시예에 따른 이러한 다상 표현의 유리한 어플리케이션을 제공한다.
변형은 Q가 2개의 멱(power)일 때 Q log2Q의 차수인 상 비틀림 이후의 DFT이다. 이러한 큰 세이빙은 L이 log2Q보다 매우 큰 통상적인 경우에 얻어진다. 실제 모듈화 경우(8)에서, n=0 및 n=Q 주위의 짝수/홀수 대칭으로 합성된 주기(2Q)의 반주기는 다상 윈도윙을 위해 다시 사용될 수 있고, 변형 커널(kernel)은 타입III의 DCT이다. 복합 모듈화의 경우를 위한 상세한 설명은 이하에 기술된다.
FFT 코어 프로세스를 사용하는 서브-서브 필터링의 효과적인 실행은 모듈화 이후의 원형 필터의 다상 분해를 사용하여 구현될 수 있다. 차수 N의 원형 필터(g(n))가 N=mQ라고 가정하면, m은 양의 정수이다. 임의의 차수의 원형 필터가 제약을 충족시키도록 0으로 채워질 수 있기 때문에 이러한 조건은 한정적이지 않다. 복합 모듈화 시스템(6)에서 사용하기 위해 구성된 원형 필터의 Z 변형은 아래와 같다.
이는 아래와 같은 다상 기수법으로 표현될 수 있다.
여기서,
이다.
필터뱅크의 모든 필터들은 원형 필터의 주파수 모듈화된 상태이다. 필터(gq(n))의 Z 변형은 아래와 같다.
여기서,
이다.
하나의 필터로부터의 출력의 표현은 아래와 같다.
마지막 합계의 성분을 인식함으로써, 입력 신호의 상태로 지연된 다상 성분 프로세스가 표시될 수 있고, 이어서 복합 지수에 의해 곱해진다. 결국, 모든 출력 신호들(Yq(z), q=0…Q-1)은 (스케일링 계수없이) 역 FFT를 인가함으로써 얻어진다. 도 14는 필터 뱅크를 분석하기 위한 레이아웃을 도시한다. [수학식 29]의 다상 필터들이 인과관계가 아니기 때문에, 적절한 양의 지연이 모든 다상 성분들에 추가되어야 한다.
전술한 실시예들은 발명을 한정하지 않는 설명이며, 당해 분야의 숙련자들은 첨부된 특허청구의 범위에서 벗어남 없이 다양한 다른 실시예들을 구성할 수 있음을 인지해야 한다. 특허청구의 범위에서, 괄호 사이의 도면 부호는 청구범위를 한정하는 것이 아니다. "포함"이라는 용어는 청구범위에 기재된 것 이외의 다른 구성 요소 또는 단계의 존재를 배제하는 것이 아니다. 본 발명은 여러 가지의 명백한 구성 요소를 포함하는 하드웨어에 의해, 그리고 적절하게 프로그래밍된 컴퓨터에 의해 구현될 수 있다. 다양한 수단을 열거한 장치 청구항에서, 이러한 여러 가지 수단은 하나에 의해, 그리고 동일한 하드웨어의 아이템에 의해 실시될 수 있다. 임의의 수단들이 서로 다른 종속항에 기재된 것은 이러한 수단들의 조합이 이롭게 사용될 수 없음을 나타내는 것은 아니다.
Claims (25)
- 제 1 오디오 채널 및 제 2 오디오 채널을 포함하는 오디오 신호의 인코딩 방법에 있어서,상기 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들 및 상기 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 복합 모듈화 필터 뱅크에서 상기 제 1 오디오 채널 및 상기 제 2 오디오 채널 각각을 서브대역 필터링하는 단계;다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하도록 상기 서브대역 신호들 각각을 다운샘플링하는 단계;복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가의 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계;추가로 서브대역 필터링되지 않는 상기 다운샘플링된 서브대역 신호들 및 상기 서브-서브대역 신호들로부터 공간 파라미터들을 유도하는 단계; 및상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함하고,추가로 서브대역 필터링된 각각의 서브대역에 대해, 상기 서브-서브대역 신호들은 새로운 서브대역 신호를 형성하도록 스케일링 및/또는 위상 회전 후에 함께 부가되고, 상기 단일 채널 오디오 신호는 이러한 새로운 서브대역 신호들 및 추가로 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 유도되는,오디오 신호의 인코딩 방법.
- 삭제
- 제 1 항에 있어서,상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 제 1 서브대역 신호들의 가장 낮은 주파수 서브대역 신호 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들의 가장 낮은 주파수 서브대역 신호에 대해 수행되는, 오디오 신호의 인코딩 방법.
- 제 3 항에 있어서,상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 제 1 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호에 대해 더 수행되는, 오디오 신호의 인코딩 방법.
- 제 4 항에 있어서,상기 가장 낮은 서브대역 신호들의 서브-서브대역들의 갯수는 상기 다음으로 가장 낮은 주파수 서브대역 신호들의 서브-서브대역들의 갯수보다 더 많은, 오디오 신호의 인코딩 방법.
- 제 1 항에 있어서,상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 복합 모듈화된 필터 뱅크인, 오디오 신호의 인코딩 방법.
- 제 1 항에 있어서,상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 실제 값 코사인 모듈화된 필터 뱅크인, 오디오 신호의 인코딩 방법.
- 제 1 항에 있어서,상기 추가의 서브대역 필터 뱅크는 홀수로 적층된 필터 뱅크인, 오디오 신호의 인코딩 방법.
- 제 1 항에 있어서,상기 서브-서브대역 신호들은 추가로 다운샘플링되지 않는, 오디오 신호의 인코딩 방법.
- 제 1 항에 있어서,상기 단일 채널 오디오 신호는 대역폭이 한정되어 추가로 코딩되고, 스펙트럼 대역 복제 파라미터들은 상기 다운샘플링된 복수의 제 1 서브대역 신호들 및/또는 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도되는, 오디오 신호의 인코딩 방법.
- 오디오 신호를 인코딩하는 오디오 인코더로서, 상기 오디오 신호는 제 1 오디오 채널 및 제 2 오디오 채널을 포함하는, 상기 오디오 인코더에 있어서,상기 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들을 제공하도록 상기 제 1 오디오 채널을 서브대역 필터링하는 제 1 복합 모듈화된 필터 뱅크;상기 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 상기 제 2 오디오 채널을 서브대역 필터링하는 제 2 복합 모듈화된 필터 뱅크;다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하기 위해 상기 서브대역 신호들 각각을 다운샘플링하는 수단;복수의 서브-서브대역 신호들을 제공하기 위해 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 추가의 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 필터 뱅크;상기 서브-서브대역 신호들로부터, 그리고 추가로 서브대역 필터링되지 않은 다운샘플링된 서브대역 신호들로부터 공간 파라미터들을 유도하는 수단; 및상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 수단을 포함하고,추가로 서브대역 필터링된 각각의 서브대역에 대해, 상기 서브-서브대역 신호들은 새로운 서브대역 신호를 형성하도록 스케일링 및/또는 위상 회전 후에 함께 부가되고, 상기 단일 채널 오디오 신호는 이러한 새로운 서브대역 신호들 및 추가로 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 유도되는,오디오 인코더.
- 입력 오디오 신호를 기초로 인코딩된 오디오 신호를 전송하거나 저장하는 장치에 있어서,입력 오디오 신호를 수용하는 입력 유닛;인코딩된 오디오 신호를 얻기 위해 상기 입력 오디오 신호를 인코딩하는 제 11 항에서 청구된 오디오 인코더; 및전송 또는 저장을 위한 포맷으로 상기 인코딩된 오디오 신호를 추가로 코딩하는 채널 코더를 포함하는, 인코딩된 오디오 신호를 전송하거나 저장하는 장치.
- 인코딩된 오디오 신호를 디코딩하는 방법으로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 인코딩된 오디오 신호를 디코딩하는 방법에 있어서,다운샘플링된 복수의 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계;복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가의 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계; 및상기 공간 파라미터들, 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 2개의 오디오 채널들을 유도하는 단계를 포함하고,가장 낮은 주파수 서브대역에서, 시간 도메인 내에 음의 중심 주파수를 갖는 상기 서브-서브대역 신호들의 위상 변화들은 상기 음의 중심 주파수에 가장 가까운 절대값에 있는 양의 중심 주파수를 갖는 서브-서브대역 신호에 인가된 음의 위상 변화를 취함으로써 결정되는,인코딩된 오디오 신호를 디코딩하는 방법.
- 제 13 항에 있어서,상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 서브대역 신호들의 가장 낮은 주파수 서브대역 신호에 대해 수행되는, 인코딩된 오디오 신호를 디코딩하는 방법.
- 제 14 항에 있어서,상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호에 대해 더 수행되는, 인코딩된 오디오 신호를 디코딩하는 방법.
- 제 15 항에 있어서,상기 가장 낮은 주파수 서브대역 신호들의 서브-서브대역의 갯수는 상기 다음으로 가장 낮은 주파수 서브대역 신호들의 서브-서브대역의 갯수보다 많은, 인코딩된 오디오 신호를 디코딩하는 방법.
- 제 13 항에 있어서,상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 복합 모듈화된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
- 제 13 항에 있어서,상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 실제값 코사인 모듈화된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
- 제 13 항에 있어서,상기 추가의 서브대역 필터 뱅크는 홀수로 적층된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
- 삭제
- 제 13 항에 있어서,상기 인코딩된 오디오 신호는 스펙트럼 대역 복제 파라미터들을 포함하고, 고주파수 성분은 상기 다운샘플링된 복수의 서브대역 신호들 및 상기 스펙트럼 대역 복제 파라미터들로부터 유도되고, 상기 2개의 오디오 채널들은 상기 공간 파라미터들, 상기 서브-서브대역 신호들, 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들 및 상기 고주파수 성분으로부터 유도되는, 인코딩된 오디오 신호를 디코딩하는 방법.
- 인코딩된 오디오 신호를 디코딩하기 위한 오디오 디코더로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 오디오 디코더에 있어서,복수의 다운샘플링된 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 디코더;복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 추가의 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 필터 뱅크; 및상기 공간 파라미터들, 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 2개의 오디오 채널들을 유도하는 수단을 포함하고,가장 낮은 주파수 서브대역에서, 시간 도메인 내에 음의 중심 주파수를 갖는 상기 서브-서브대역 신호들의 위상 변화들은 상기 음의 중심 주파수에 가장 가까운 절대값에 있는 양의 중심 주파수를 갖는 서브-서브대역 신호에 인가된 음의 위상 변화를 취함으로써 결정되는,오디오 디코더.
- 출력 오디오 신호를 재생하는 장치에 있어서,인코딩된 오디오 신호를 얻기 위한 입력 유닛;상기 출력 오디오 신호를 얻기 위해 상기 인코딩된 오디오 신호를 디코딩하는, 제 22 항에서 청구된 오디오 디코더; 및상기 출력 오디오 신호를 재생하기 위한 스피커 또는 헤드폰 출력과 같은 재생 유닛을 포함하는, 출력 오디오 신호를 재생하는 장치.
- 제 1 항에서 청구된 방법의 단계들을 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
- 제 13 항에서 청구된 방법을 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03104034.8 | 2003-10-30 | ||
EP03104034 | 2003-10-30 | ||
PCT/IB2004/052226 WO2005043511A1 (en) | 2003-10-30 | 2004-10-28 | Audio signal encoding or decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117020710A Division KR101217649B1 (ko) | 2003-10-30 | 2004-10-28 | 오디오 신호 인코딩 또는 디코딩 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060131745A KR20060131745A (ko) | 2006-12-20 |
KR101106026B1 true KR101106026B1 (ko) | 2012-01-17 |
Family
ID=34530779
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117020710A KR101217649B1 (ko) | 2003-10-30 | 2004-10-28 | 오디오 신호 인코딩 또는 디코딩 |
KR1020067008373A KR101106026B1 (ko) | 2003-10-30 | 2004-10-28 | 오디오 신호 인코딩 또는 디코딩 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117020710A KR101217649B1 (ko) | 2003-10-30 | 2004-10-28 | 오디오 신호 인코딩 또는 디코딩 |
Country Status (12)
Country | Link |
---|---|
US (3) | US7519538B2 (ko) |
EP (1) | EP1683133B1 (ko) |
JP (4) | JP4966013B2 (ko) |
KR (2) | KR101217649B1 (ko) |
CN (2) | CN101540171B (ko) |
AT (1) | ATE354160T1 (ko) |
BR (2) | BR122018007834B1 (ko) |
DE (1) | DE602004004818T2 (ko) |
ES (1) | ES2282899T3 (ko) |
PL (1) | PL1683133T3 (ko) |
RU (1) | RU2374703C2 (ko) |
WO (1) | WO2005043511A1 (ko) |
Families Citing this family (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
ATE527654T1 (de) | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
JP4939424B2 (ja) * | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
JPWO2006059567A1 (ja) * | 2004-11-30 | 2008-06-05 | 松下電器産業株式会社 | ステレオ符号化装置、ステレオ復号装置、およびこれらの方法 |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
EP1905004A2 (en) * | 2005-05-26 | 2008-04-02 | LG Electronics Inc. | Method of encoding and decoding an audio signal |
JP4988716B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
AU2006266655B2 (en) * | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8082157B2 (en) | 2005-06-30 | 2011-12-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
CN101248483B (zh) | 2005-07-19 | 2011-11-23 | 皇家飞利浦电子股份有限公司 | 多声道音频信号的生成 |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
US8577483B2 (en) * | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
JP5108767B2 (ja) * | 2005-08-30 | 2012-12-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
JP5173811B2 (ja) * | 2005-08-30 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
KR100857111B1 (ko) * | 2005-10-05 | 2008-09-08 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
ES2478004T3 (es) * | 2005-10-05 | 2014-07-18 | Lg Electronics Inc. | Método y aparato para decodificar una señal de audio |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US7752053B2 (en) * | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
TWI329462B (en) | 2006-01-19 | 2010-08-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
EP1974344A4 (en) | 2006-01-19 | 2011-06-08 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING A SIGNAL |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
JP5054035B2 (ja) | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
KR100754220B1 (ko) | 2006-03-07 | 2007-09-03 | 삼성전자주식회사 | Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법 |
US7676374B2 (en) * | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
EP1999747B1 (en) | 2006-03-29 | 2016-10-12 | Koninklijke Philips N.V. | Audio decoding |
US7612275B2 (en) * | 2006-04-18 | 2009-11-03 | Nokia Corporation | Method, apparatus and computer program product for providing rhythm information from an audio signal |
US7818079B2 (en) * | 2006-06-09 | 2010-10-19 | Nokia Corporation | Equalization based on digital signal processing in downsampled domains |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US20080004866A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Artificial Bandwidth Expansion Method For A Multichannel Signal |
EP2337224B1 (en) * | 2006-07-04 | 2017-06-21 | Dolby International AB | Filter unit and method for generating subband filter impulse responses |
US7876904B2 (en) | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
JP2008076847A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | 復号器及び信号処理システム |
WO2008035949A1 (en) * | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
JP5171842B2 (ja) | 2006-12-12 | 2013-03-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法 |
US7783478B2 (en) * | 2007-01-03 | 2010-08-24 | Alexander Goldin | Two stage frequency subband decomposition |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8655663B2 (en) * | 2007-10-26 | 2014-02-18 | D&M Holdings, Inc. | Audio signal interpolation device and audio signal interpolation method |
EP2215629A1 (en) * | 2007-11-27 | 2010-08-11 | Nokia Corporation | Multichannel audio coding |
CA2708861C (en) | 2007-12-18 | 2016-06-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
AU2009221443B2 (en) * | 2008-03-04 | 2012-01-12 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for mixing a plurality of input data streams |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
CN101630509B (zh) * | 2008-07-14 | 2012-04-18 | 华为技术有限公司 | 一种编解码方法、装置及系统 |
TWI662788B (zh) | 2009-02-18 | 2019-06-11 | 瑞典商杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
AU2016262695B2 (en) * | 2009-02-18 | 2017-11-09 | Dolby International Ab | Low Delay Modulated Filter Bank |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
AU2012204119B2 (en) * | 2009-04-03 | 2014-04-03 | Ntt Docomo, Inc. | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
JP5365363B2 (ja) * | 2009-06-23 | 2013-12-11 | ソニー株式会社 | 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム |
US9055374B2 (en) * | 2009-06-24 | 2015-06-09 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Method and system for determining an auditory pattern of an audio segment |
ES2805349T3 (es) | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
CN102667920B (zh) * | 2009-12-16 | 2014-03-12 | 杜比国际公司 | Sbr比特流参数缩混 |
KR102020334B1 (ko) * | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
CN102157149B (zh) * | 2010-02-12 | 2012-08-08 | 华为技术有限公司 | 立体声信号下混方法、编解码装置和编解码系统 |
CA3097372C (en) | 2010-04-09 | 2021-11-30 | Dolby International Ab | Mdct-based complex prediction stereo coding |
ES2719102T3 (es) * | 2010-04-16 | 2019-07-08 | Fraunhofer Ges Forschung | Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega |
MX2012001696A (es) | 2010-06-09 | 2012-02-22 | Panasonic Corp | Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio. |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
CN103155033B (zh) * | 2010-07-19 | 2014-10-22 | 杜比国际公司 | 高频重建期间的音频信号处理 |
BR122021003884B1 (pt) | 2010-08-12 | 2021-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
CA3191597C (en) | 2010-09-16 | 2024-01-02 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
KR20120038311A (ko) | 2010-10-13 | 2012-04-23 | 삼성전자주식회사 | 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법 |
EP2477188A1 (en) | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
PL2676265T3 (pl) | 2011-02-14 | 2019-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób do kodowania sygnału audio z stosowaniem zrównanej części antycypacji |
BR112013020482B1 (pt) * | 2011-02-14 | 2021-02-23 | Fraunhofer Ges Forschung | aparelho e método para processar um sinal de áudio decodificado em um domínio espectral |
MY166394A (en) | 2011-02-14 | 2018-06-25 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
KR101551046B1 (ko) | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
PL2676264T3 (pl) | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
EP3544006A1 (en) | 2011-11-11 | 2019-09-25 | Dolby International AB | Upsampling using oversampled sbr |
EP2828854B1 (en) | 2012-03-23 | 2016-03-16 | Dolby Laboratories Licensing Corporation | Hierarchical active voice detection |
US9601122B2 (en) * | 2012-06-14 | 2017-03-21 | Dolby International Ab | Smooth configuration switching for multichannel audio |
EP3528249A1 (en) | 2013-04-05 | 2019-08-21 | Dolby International AB | Stereo audio encoder and decoder |
EP3742440B1 (en) | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
KR102318581B1 (ko) * | 2014-06-10 | 2021-10-27 | 엠큐에이 리미티드 | 오디오 신호의 디지털 캡슐화 |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
EP3192282A1 (en) * | 2014-09-12 | 2017-07-19 | Dolby Laboratories Licensing Corp. | Rendering audio objects in a reproduction environment that includes surround and/or height speakers |
US9837065B2 (en) | 2014-12-08 | 2017-12-05 | Ford Global Technologies, Llc | Variable bandwidth delayless subband algorithm for broadband active noise control system |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10672408B2 (en) | 2015-08-25 | 2020-06-02 | Dolby Laboratories Licensing Corporation | Audio decoder and decoding method |
WO2017124007A1 (en) * | 2016-01-15 | 2017-07-20 | Dolby Laboratories Licensing Corporation | Audio signal processing with low latency |
EP3203472A1 (en) * | 2016-02-08 | 2017-08-09 | Oticon A/s | A monaural speech intelligibility predictor unit |
TWI807562B (zh) | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
PL3707706T3 (pl) * | 2017-11-10 | 2021-11-22 | Nokia Technologies Oy | Określanie kodowania przestrzennego parametrów dźwięku i związane z tym dekodowanie |
CN107918710B (zh) * | 2017-11-22 | 2020-11-06 | 桂林电子科技大学 | 基于凸优化的非下采样图滤波器组的设计方法 |
CN108806705A (zh) * | 2018-06-19 | 2018-11-13 | 合肥凌极西雅电子科技有限公司 | 音频处理方法和处理系统 |
US11195543B2 (en) * | 2019-03-22 | 2021-12-07 | Clear Peaks LLC | Systems, devices, and methods for synchronizing audio |
CN113314132B (zh) * | 2021-05-17 | 2022-05-17 | 武汉大学 | 交互式音频系统中的音频对象编码方法、解码方法及装置 |
CN117292694B (zh) * | 2023-11-22 | 2024-02-27 | 中国科学院自动化研究所 | 基于时不变编码的少令牌神经语音编解码方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05235701A (ja) * | 1992-02-25 | 1993-09-10 | Nippon Steel Corp | 環状畳み込みによるディジタルフィルタバンク処理方法及び装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3211752C2 (de) | 1982-03-30 | 1985-09-26 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung |
JPS621228A (ja) | 1985-06-26 | 1987-01-07 | Fujitsu Ltd | タングステンシリサイドの選択成長方法 |
US4692343A (en) | 1985-08-05 | 1987-09-08 | Spectrum Cvd, Inc. | Plasma enhanced CVD |
US4737474A (en) | 1986-11-17 | 1988-04-12 | Spectrum Cvd, Inc. | Silicide to silicon bonding process |
US4902645A (en) | 1987-08-24 | 1990-02-20 | Fujitsu Limited | Method of selectively forming a silicon-containing metal layer |
DE69127842T2 (de) * | 1990-03-09 | 1998-01-29 | At & T Corp | Hybride wahrnehmungsgebundene Kodierung von Audiosignalen |
JPH0410429A (ja) | 1990-04-26 | 1992-01-14 | Matsushita Electron Corp | 半導体装置 |
JP2892451B2 (ja) | 1990-07-13 | 1999-05-17 | 住友重機械工業株式会社 | 電気―空気サーボアクチュエータ |
NL9100173A (nl) | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
US5392037A (en) * | 1991-05-21 | 1995-02-21 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for encoding and decoding |
JP2778324B2 (ja) * | 1992-01-24 | 1998-07-23 | 日本電気株式会社 | サブバンド分割方式 |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
US5926791A (en) * | 1995-10-26 | 1999-07-20 | Sony Corporation | Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5852806A (en) * | 1996-03-19 | 1998-12-22 | Lucent Technologies Inc. | Switched filterbank for use in audio signal coding |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
KR100354531B1 (ko) * | 1998-05-06 | 2005-12-21 | 삼성전자 주식회사 | 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템 |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP2001339311A (ja) * | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
US6996198B2 (en) * | 2000-10-27 | 2006-02-07 | At&T Corp. | Nonuniform oversampled filter banks for audio signal processing |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
KR101049751B1 (ko) * | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
-
2004
- 2004-10-28 RU RU2006118682/09A patent/RU2374703C2/ru active
- 2004-10-28 WO PCT/IB2004/052226 patent/WO2005043511A1/en active IP Right Grant
- 2004-10-28 BR BR122018007834-0A patent/BR122018007834B1/pt active IP Right Grant
- 2004-10-28 KR KR1020117020710A patent/KR101217649B1/ko active IP Right Grant
- 2004-10-28 KR KR1020067008373A patent/KR101106026B1/ko active IP Right Grant
- 2004-10-28 CN CN2009101286062A patent/CN101540171B/zh active Active
- 2004-10-28 BR BRPI0415951A patent/BRPI0415951B1/pt active IP Right Grant
- 2004-10-28 US US10/577,106 patent/US7519538B2/en active Active
- 2004-10-28 PL PL04770333T patent/PL1683133T3/pl unknown
- 2004-10-28 ES ES04770333T patent/ES2282899T3/es active Active
- 2004-10-28 EP EP04770333A patent/EP1683133B1/en active Active
- 2004-10-28 AT AT04770333T patent/ATE354160T1/de not_active IP Right Cessation
- 2004-10-28 JP JP2006537530A patent/JP4966013B2/ja active Active
- 2004-10-28 CN CN2004800323426A patent/CN1875402B/zh active Active
- 2004-10-28 DE DE602004004818T patent/DE602004004818T2/de active Active
-
2009
- 2009-03-04 US US12/397,518 patent/US8073685B2/en active Active
- 2009-03-12 JP JP2009059145A patent/JP5192424B2/ja active Active
-
2011
- 2011-02-22 JP JP2011036288A patent/JP5335015B2/ja active Active
- 2011-03-30 US US13/076,335 patent/US8260607B2/en active Active
-
2013
- 2013-05-01 JP JP2013096490A patent/JP5889828B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05235701A (ja) * | 1992-02-25 | 1993-09-10 | Nippon Steel Corp | 環状畳み込みによるディジタルフィルタバンク処理方法及び装置 |
Non-Patent Citations (1)
Title |
---|
Per Ekstrand, "BANDWIDTH EXTENSION OF AUDIO SIGNALS BY SPECTRAL BAND REPLICATION" Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), November 15, 2002. pp.53-58* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101106026B1 (ko) | 오디오 신호 인코딩 또는 디코딩 | |
CN1910655B (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
EP1784818B1 (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
CN105518775B (zh) | 使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除 | |
CN101401152B (zh) | 通过多通道音频信号的主分量分析进行编码的设备和方法 | |
US8718284B2 (en) | Method, medium, and system encoding/decoding multi-channel signal | |
EP3061089B1 (en) | Parametric reconstruction of audio signals | |
CN102656628B (zh) | 优化的低吞吐量参数编码/解码 | |
CN116741188A (zh) | 立体声音频编码器和解码器 | |
EP2717261A1 (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding | |
MXPA05005602A (es) | Codificacion de una senal de audio. | |
EP3061088B1 (en) | Decorrelator structure for parametric reconstruction of audio signals | |
Spanias et al. | Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
A107 | Divisional application of patent | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141229 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151230 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161230 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171228 Year of fee payment: 7 |