KR101217649B1 - 오디오 신호 인코딩 또는 디코딩 - Google Patents

오디오 신호 인코딩 또는 디코딩 Download PDF

Info

Publication number
KR101217649B1
KR101217649B1 KR1020117020710A KR20117020710A KR101217649B1 KR 101217649 B1 KR101217649 B1 KR 101217649B1 KR 1020117020710 A KR1020117020710 A KR 1020117020710A KR 20117020710 A KR20117020710 A KR 20117020710A KR 101217649 B1 KR101217649 B1 KR 101217649B1
Authority
KR
South Korea
Prior art keywords
subband signals
subband
downsampled
audio signal
signals
Prior art date
Application number
KR1020117020710A
Other languages
English (en)
Other versions
KR20110113765A (ko
Inventor
라스 에프. 빌레모에스
페르 엑스트랜드
헤이코 푸른하겐
에릭 지. 피. 스츄이저스
프랜시스커스 엠. 제이. 드 본트
Original Assignee
돌비 인터네셔널 에이비
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34530779&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR101217649(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 돌비 인터네셔널 에이비, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 돌비 인터네셔널 에이비
Publication of KR20110113765A publication Critical patent/KR20110113765A/ko
Application granted granted Critical
Publication of KR101217649B1 publication Critical patent/KR101217649B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereophonic System (AREA)
  • Insulated Conductors (AREA)

Abstract

오디오 신호를 인코딩하는 것이 제공되고, 오디오 신호는 제 1 오디오 채널과 제 2 오디오 채널을 포함하고, 인코딩은 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들 및 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 복소 변조 필터 뱅크의 제 1 오디오 채널 및 제 2 오디오 채널들 각각을 서브대역 필터링하는 단계; 다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하도록 각각의 서브대역 신호들을 다운샘플링하는 단계; 복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크의 적어도 하나의 다운샘플링된 서브대역 신호들에서 추가의 서브대역 필터링하는 단계; 추가의 서브대역 필터링이 없는 다운샘플링된 서브대역 신호들 및 서브-서브대역 신호들로부터 공간 파라미터들을 유도하는 단계; 다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도된 유도 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함한다. 또한, 디코딩이 제공되고, 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호를 포함하고, 공간 파라미터들의 세트는 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 인코딩된 단일 채널 오디오 채널에 의해 디코딩되고, 또한, 복수의 서브-서브대역 신호들을 제공하기 위해 부가의 필터 뱅크에서 적어도 하나의 다운샘플링된 서브대역 신호들을 부가 서브대역 필터링하고, 공간 매개변수들로부터 두개의 오디오 채널들을 유도하고, 서브-서브대역 신호들과 다운샘플링된 서브대역 신호들은 부가의 서브대역 필터링이 없다.

Description

오디오 신호 인코딩 또는 디코딩{Audio signal encoding or decoding}
본 발명은 오디오 신호를 인코딩하거나 또는 인코딩된 오디오 신호를 디코딩하는 것에 관한 것이다.
2003년 3월자 Erik Schuijers, Wemer Oomen, Bert den Brinker and JeroenBreebaart, "Advances in Parametric Coding for High-Quality Audio", Preprint5852, 114th AES Convention, Amsterdam, The Netherlands, 22-25에는 스테레오 이미지용의 효율적인 파라메트릭 표시를 이용하는 파라메트릭 코딩 체계가 개시된다. 두개의 입력 신호들은 하나 이상의 모노 오디오 신호로 합체된다. 지각 가능한 상응하는 공간적인 큐우(cue)들은 도1에 도시된 바와 같이 명백하게 모델링된다. 합체된 신호는 모노 파라메트릭 인코더를 이용하여 인코딩된다. 스테레오 파라미터들, 인터채널 강도차(Interchannel Intensity Difference)(IID), 인터채널 시간차(Interchannel Time Difference)(ITD) 및 인터채널 상호상관(Interchannel Cross-Correlation)(ICC)들은 양자화되고, 인코딩되고, 양자화되고 인코딩된 오디오 신호와 함께 비트 스트림으로 다중 송신(multiplexed)된다. 디코더측에서는, 비트 스트림은 인코딩된 모노 신호와 스테레오 파라미터들로 역다중화(de-multiplexed)된다. 인코딩된 모노 오디오 신호는 디코딩된 오디오 신호(m')를 얻기 위해 디코딩된다(도2 참조). 모노 시간 도메인 신호로부터, 역상관된 신호는 지각 가능한 역상관을 산출하는 필터(D)를 이용하여 계산된다. 모노 시간 도메인 신호(m')과 역상관된 신호(d)는 주파수 도메인으로 전송된다. 그 다음에, 주파수 도메인 스테레오 신호는 각각 디코딩된 스테레오 쌍(l', r')을 얻기 위해 파라미터 처리 유닛에서 스케일링, 위상 변조 및 혼합에 의해 IID, ITD 및 ICC 파라미터로 처리된다. 최종 주파수 도메인 표시들은 시간 도메인으로 다시 변환된다.
본 발명의 목적은 공간 파라미터들을 이용하여 오디오를 유리하게 인코딩 또는 디코딩을 제공하는 것이다. 그 결과, 본 발명은 독립항에서 한정된 바와 같이 인코딩 방법, 오디오 인코더, 전송 또는 저장 장치, 디코딩 방법, 오디오 디코더, 재생 장치 및 컴퓨터 프로그램 제품을 제공한다. 유리한 실시예들은 종속 청구항에서 한정된다.
본 발명의 제 1 양태에 따르면, 오디오 신호는 인코딩되고, 오디오신호는 제 1 오디오 채널과 제 2 오디오 채널을 포함하고, 인코딩은 제 1 오디오 채널용의 제 1 복수의 서브대역 신호들과 제 2 오디오 채널용의 제 2 복수의 서브대역 신호들을 제공하기 위해 복소 변조 필터뱅크(filterbank)에서 제 1 오디오 채널과 제 2 오디오 채널의 각각을 서브대역(subband) 필터링하는 단계와, 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들을 제공하도록 각각의 서브대역 신호들을 다운샘플링하는 단계와, 복수의 서브-서브대역 신호들을 제공하기 위해 다른 필터뱅크의 다운 샘플링된 서브대역 신호들 중 적어도 하나를 서브대역 필터링하는 단계와, 서브-서브대역 신호들로부터 그리고 부가의 서브대역 필터링되지 않은 다운샘플링된 서브대역로부터 공간 파라미터들을 유도하는 단계와, 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들로부터 유도된 유도 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 유도하는 단계를 포함한다. 서브대역의 부가의 서브대역 필터링 단계를 제공함으로써, 서브대역의 주파수 분해능은 증가된다. 이러한 증가된 주파수 분해능은 (소수의 대역들만이 변환되기 때문에) 효율적인 실행에서 보다 높은 오디오 품질(단일 서브대역 신호의 대역폭이 통상적으로 인간 청각의 임계 대역들보다 통상적으로 높다)을 달성하는 것이 가능해지기 때문에 이점이 있다. 파라메트릭 공간 코더(coder)는 비균일 주파수 스케일에서 인지된 두 귀를 모니터링하기 위해 수행되고, 평형 직각 대역(Equivalent Rectangular Bands)(ERB) 스케일과 유사하다. 단일 채널 오디오 신호는 제 1 복수의 다운샘플링된 서브대역 신호들과 제 2 복수의 다운샘플링된 서브대역 신호들로부터 직접적으로 유도될 수 있다. 그러나, 단일 채널 오디오 신호는 각각의 서브대역들용의 서브-서브대역 신호들이 새로운 서브대역 신호들로부터 유도되는 경우에 서브-서브대역 신호들이 부가로 서브대역 필터링되는 다운샘플링된 서브대역용의 서브-서브대역 신호들로부터 유리하게는 유도되고, 단일 채널 오디오 신호는 부가로 필터링되지 않는 제 1 및 제 2 복수의 서브대역들로부터의 서브대역들과 새로운 서브대역 신호들로부터 유도된다.
본 발명의 다른 주요한 양태에 따라, 인코딩된 오디오 신호의 오디오 디코딩이 제공되고, 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호와 공간 파라미터들의 세트를 포함하고, 오디오 디코딩은 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계와, 복수의 서브대역 신호들을 제공하기 위해 부가의 필터뱅크의 다운샘플링된 서브대역 신호들 중 적어도 하나를 부가의 서브대역 필터링하는 단계와, 공간 파라미터로부터 두개의 오디오 채널, 서브-서브대역 신호들 및 추가 서브대역 필터링되지 않는 이들 서브대역들용의 다운샘플링된 서브대역 신호들을 유도하는 단계를 포함한다. 서브대역의 추가의 서브대역 필터링을 제공함으로써, 서브대역의 주파수 분해능은 증가하고 따라서 보다 우수한 품질의 오디오 디코딩이 달성될 수 있다.
본 발명의 다른 주요한 양태에 따라, 스펙트럼 대역 복제 파라미터들은 상기 다운샘플링된 복수의 제 1 서브대역 및 다운샘플링된 복수의 제 2 서브대역 신호들, 또는 상기 다운샘플링된 복수의 제 1 서브대역 신호들, 또는 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도될 수 있다.
본 발명의 이들 양태들의 주요한 장점 중 하나는 파라메트릭 공간 코딩이 스펙트럼 대역 복제(Spectral Band Replication)(SBR) 기술과 쉽게 합체될 수 있다는 것이다. SBR은 Martin Dietz, Lars Liljeryd, KristoferKjorling 및 Oliver Kunz의 "Spectral Band Replication, a novel approach in audio coding", Preprint55 53, 112'AES Convention, Munich, Germany, 10-13 2002년 5월호와, Per Ekstrand의,"Bandwidth extension of audio signals by spectral band replication", Proc.1 st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp. 53-58, Leuven, Belgium, 2002년 11월 15일자에서 공지되었다. 또한, MPEG-4 standard ISO/IEC 14496-3:2001/FDAM1,JTC1/SC29/WGl l, Coding of Moving Pictures and Audio, Bandwidth Extension which describes an audio codec using SBR을 참조한다.
*SBR은 통상적으로 오디오 신호의 낮고 높은 주파수들 사이에 큰 상관 관계가 있다는 개념에 기초한다. 이와 같이, SBR 프로세스는 스펙트럼 인벨로프(envelope)가 비트 스트림에 인코딩된 작은 정보를 이용하여 스펙트럼의 높은 부분(들)용으로 조정된 후에 높은 부분(들)에 대해 스펙트럼의 낮은 부분(들)을 복제하는 것으로 구성된다. 이러한 SBR 개선 디코더의 단순화된 블록도가 도3에 도시된다. 비트 스트림은 역다중화되고 코어 데이터(즉, MPEG-2/4 Advanced Audio Coding) 및 SBR 데이터로 디코딩된다. 코어 데이터를 이용하여, 신호는 전체 대역폭 신호의 샘플링 주파수의 절반으로 디코딩된다. 코어 디코더의 출력은 복소(모조) 격자구조 대칭 필터(Quadrature Mirror Filter)(QMF) 뱅크에 의해 분석된다. 이들 32개의 대역들은 예를 들어, 고주파(HF) 내용이 낮은 대역들의 복사부(들)에 의해 발생되는 64개의 대역들인 전체 대역으로 확장된다. HF 내용이 발생되는 대역의 인벨로프는 SBR 데이터에 따라 조정된다. 최종적으로 64개의 대역들의 복소 QMF 합성 뱅크에 의해, PCM 출력 신호는 재구성된다.
도3에 도시된 바와 같은 SBR 디코더는 소위 이중 비율 디코더이다. 이는 코어 디코더가 샘플링 주파수의 절반에서 작동하고 따라서 32개의 대역들의 분석 QMF 뱅크가 이용된다는 것을 의미한다. 코어 디코더가 전체 샘플링 주파수에서 작동하고, 분석 QMF 뱅크가 64개의 대역들로 구성된 단일 비율 디코더들이 가능하다. 실질적으로, 재구성은 (모조) 복소 QMF 뱅크에 의해 수행된다. 복소 QMF 필터 뱅크가 임계적으로 샘플링되지 않기 때문에, 위신호를 계수하기 위해 여분의 준비를 취할 필요가 없다. Ekstrand에 의해 개시된 바와 같은 SBR 디코더에서, 분석 QMF 대역은 32개로만 구성되지만, 코어 디코더가 전체 오디오 디코더에 비해 절반의 샘플링 주파수에서 작동함에 따라 합성 QMF 뱅크는 64개의 대역들로 구성된다. 그러나, 대응하는 인코더에서, 64개의 대역 분석 QMF 뱅크는 전체 주파수 범위를 커버하기 위해 이용된다.
본 발명은 특히 스테레오 오디오 코딩에 유리하지만, 본 발명은 또한 두개의 오디오 채널들 이상의 신호들을 코딩하는데 또한 유리하다.
본 발명의 이들 및 다른 양태들은 명백하고, 후술하는 실시예들을 참조하면 명료하게 될 것이다.
도 1은 파라메트릭 스테레오(PS) 인코더에 이용되는 스테레오 파라미터 추출을 위한 유닛의 블록도를 도시한 도면.
도 2는 PS 디코더에 이용되는 스테레오 신호의 재구성을 위한 유닛의 블록도를 도시한 도면.
도 3은 스펙트럼 대역 복제(SBR) 디코더의 블록도를 도시한 도면.
도 4는 본 발명의 실시예에 따른 합체된 PS 및 개선된 SBR 인코더의 블록도를 도시한 도면.
도 5는 본 발명의 실시예에 따른 합체된 PS 및 개선된 SBR 인코더의 블록도를 도시한 도면.
도 6은 M 대역들의 다운샘플링된 복소 QMF 분석(좌측)과 합성 뱅크(우측)를 도시한 도면.
도 7은 프로토타입 필터의 dB 크기 반응을 도시한 도면.
도 8은 64개의 다운샘플링되지 않은 복소 변조 분석 필터들 중에서 처음 4개의 dB 크기 반응을 도시한 도면.
도 9는 사소한 합성을 갖는 Q 대역들의 필터 뱅크의 블록도를 도시한 도면.
도 10은 처음의 다운샘플링되지 않은 변조된 QMF 필터와 8개의 대역들의 복소 변조 필터 뱅크의 합체된 dB 크기 반응을 도시한 도면.
도 11은 본 발명의 실시예에 따른 짝수를 적층된 필터 뱅크(상부)와 홀수로 적층된 필터 뱅크(저부)의 4개의 대역들의 정형화된 크기 반응을 도시한 도면.
도 12는 본 발명의 실시예에 따른 64개의 대역들의 복소 분석 QMF에 기초한 77개의 대역들의 비균일 하이브리드 분석 필터 뱅크를 도시한 도면.
도 13은 오디오 디코더에 이용하기 위한 64개의 대역들의 복소 분석 QMF에 기초한 71개의 대역들의 비균일 하이브리드 분석 필터 뱅크를 도시한 도면.
도 14는 복소 변조 분석 필터 뱅크의 효율적인 실행의 블록도를 도시한 도면.
이러한 도면들은 본 발명을 이해시키기 위해서 필수적인 이들 요소들만을 도시한다.
SBR과 PS의 합체는 잠재적으로는 매우 강력한 코덱을 산출한다. SBR과 PS는 상당히 유사한 구조, 예를 들어 주파수 변환에 대한 시간의 소정의 형상, 처리 및 최종적으로는 주파수의 시간에 대한 변환으로 구성된 디코더에서 후처리된 알고리즘이다. 두 알고리즘들을 합체할 때, 두 알고리즘들이 예를 들어, DSP 어플리케이션에서 동시에 작동하는 것이 요구된다. 여기서, 하나의 코덱의 계산된 중간 결과들을 가능한 한 다른 것에 재사용하는 것이 유리하다. PS를 SBR에 합체하는 경우에, 이는 PS 처리를 위해 복소 (모조) QMF 서브대역 신호들을 재사용하도록 한다. 합체된 인코더(도 4 참조)에서, 스테레오 입력 신호는 두개의 64 대역들의 분석 필터 뱅크에 의해 분석된다. 복소 서브대역 도메인 표시를 이용하여, PS 계산 유닛은 스테레오 파라미터를 추정하고 모노 (서브대역) 다운 믹스를 생성한다. 이러한 모노 다운 믹스는 SBR 파라미터 추정 유닛으로 공급된다. 최종적으로, 모노 다운 믹스는 코어 디코더(코어 디코더는 대역폭의 절반만을 필요로 한다)에 의해 코딩될 수 있도록 32개의 대역 합성 필터 뱅크에 의해 시간 도메인으로 다시 변환된다.
도5에 도시된 바와 같은 합체된 디코더에서, 이중 비율 또는 단일 비율 시스템이 이용되는지 여부에 관계없이, 인벨로프 조정 후의 전체 대역폭(64 대역들) 서브대역 도메인 신호들은 스테레오 파라미터들에 따라 서브대역 도메인 신호들의 스테레오 세트로 변환된다. 이들 두 세트들의 서브대역 신호들은 최종적으로는 64 대역들의 합성 QMF 뱅크에 의해 시간 도메인으로 변환된다. PS가 SBR과 합체되면, QMF 필터들의 저주파 대역들의 대역폭은 고품질 스테레오 표시용으로 요구되는 것보다 크다. 그래서, 스테레오 이미지의 고품질 표시를 제공할 수 있도록 하기 위해, 낮은 서브대역 신호들의 부가의 서브디비전이 본 발명의 유리한 실시예들에 따라 수행된다.
본 발명의 양태들의 보다 용이한 이해를 위해, 복소 QMF 서브대역 필터들 기반의 이론이 우선 설명된다.
QMF 서브대역 필터들
QMF 분석 서브대역 필터는 이하와 같이 설명될 수 있다. 주어진 실수치의 선형 위상 프로토타입 필터 p(ν), M 대역 복소 변조 분석 필터 뱅크가 분석 필터에 의해 한정될 수 있다.
Figure 112011069204467-pat00001
k = 0, 1,..., M-1이다. 위상 파라미터 θ는 이하의 분석에는 중요하지 않지만, 통상적인 선택은 (N+M)/2이고, 여기서 N은 프로토타입 필터 순서이다. 주어진 실수치의 개별 시간 신호 x(ν), 서브대역 신호들 νk(n)들은 x(ν)를 hk(ν)로 필터링(회선)하고 계수 M(도6의 좌측 참조)에 의해 결과를 다운샘플링함으로써 얻어진다.
합성 작동은 QMF 서브대역 신호들을 계수 M으로 제 1 업샘플링하고, 그 다음에 [수학식 1]의 복소 변조 필터들로 필터링하고, 결과들을 가산하고 최종적으로 실수 부분을 두 번 취하는 것(도6의 우측 참조)으로 구성된다. 실수치 신호들의 거의 완벽한 재구성이 실수치 선형 위상 프로토타입 필터 p(ν)의 적절한 설계에 의해 얻어질 수 있다. 64 대역들의 경우에 MPEG-4 표준(전술함)의 SBR 시스템에 이용되는 것과 같은 프로토타입 필터들의 크기 반응은 도7에 도시된다. 64 복소 변조 분석 필터들의 크기 반응들은 프로토타입 필터 p(ν)의 크기 반응을 π/M (k+1/2)만큼 시프트시킴에 의해 얻어진다. 이들 반등들의 일부는 도8에 도시된다. k = 0 및 k = M-1을 제외하고는 양의 주파수만이 필터링된다는 것에 주의한다. 그 결과, 다운샘플링 이전의 서브대역 신호들은 분석적인 것에 근접하고, 실수치 사인 곡선들의 증폭 및 위상 변조를 용이하게 한다. 위상 변조들은 또한 이들 대역들에 존재하는 사인 곡선들이 각각 π/2M 또는 π-π/2M 이상의 주파수를 가지는 한 최초 및 최종 대역용으로 가능하다. 이러한 영역 외의 주파수에서, 음의 주파수의 간섭 때문에 위상 변조의 성능은 빠르게 악화된다.
본 발명의 실시예들에서 전술한 바와 같이 QMF 분석 필터에서 시작하여, 보다 정교한 주파수 분해능이 각각의 다운샘플링된 서브대역 신호 νk(n)을 QK 서브-서브대역으로 부가 필터링함으로써 얻어진다.
복소 QMF 서브대역 도메인의 신호 변조
이하에서,
Figure 112011069204467-pat00002
은 개별 시간 신호 z(n)의 개별 시간 푸리에 변환(Fourier transform)이 된다. 전술한 바와 같이 거의 근접한 재구성 특성과, 또한 전술한 바와 같은 프로토타입 필터(p(ν)의 경우에서 P(ω), p(ν)의 푸리에 변환이 기본적으로 주파수 간격[-π/M, π/M]의 외측으로 소멸된다고 가정하면, 여기서 다음 단계는 서브대역 신호들 νk(n)이 합성 전에 변조되는 시스템으로 고려된다. 이제, 각각의 서브대역 k는 필터 bk(ω)로 필터링함으로써 변조된다. 확장식은,
Figure 112011069204467-pat00003
여기서, *는 복소 공액을 지시하고, 필터 뱅크 합성을 포함하는 최종 시스템이 필터로 필터링하는 것에 대응되는 것으로 도시될 수 있다(전체 딜레이 무시, 실수치 입력 및 단일 비율 시스템 가정).
Figure 112011069204467-pat00004
P(ω)의 특성에 대한 가설에 따라, [수학식 3]의 모든 k에서 Bk(ω) = 1을 삽입하여 B(ω) = 1이 되고 제곱의 합은 시프트된 프로토타입 필터 반응들을 야기한다. 실수치 상수 Bk(ω) = bk ≥ 0를 선택함으로써, 시스템은 π(k+1/2)의 주파수에서 이득값들 bk과 합체된 평형기로써 작동한다. 인력 특성은 즉, 다운샘플링 및 업샘플링 대신에 위신호 없이 시간 불변이다. 이는 물론 정해진 프로토타입의 필터 가정의 편차량만을 조정할 것이다.
모노 오디오 신호를 유도하기 위해, 복소 서브대역 신호들의 부가의 서브 필터링이 이들 특성을 보존할 뿐만 아니라 이들 특성을 필터링된 서브대역 신호들을 촉진하도록 하는 이들 특성을 확장시킬 것이다. 이들 특성들을 보존하는 서브 필터링은 P.P Vaidyanathan, "Multirate systems and filter banks", Prentice Hall Signal Processing Series, 1993, sections 4.6.1-4.6.2로부터 반복되는 바와 같이 소위 M 대역 필터들의 변조를 이용하여 수행될 수 있다.
자명한 합성을 갖는 변조된 필터 뱅크들
개별 시간 신호 ν(n)는 임펄스 반응들 gq(n), q = 0, 1,...Q-1을 갖는 필터들의 뱅크에 의해 Q 상이 신호들로 분할될 수 있다. 이는 도9에 도시된다. 대응 분석 출력을 yq(n)으로 놓고 자명한 합성 작용을 이하와 같이 가정하면,
Figure 112011069204467-pat00005
완전한 재구성, y(n) = ν(n)이 필터를 선택함으로써 얻어지고, 이는,
Figure 112011069204467-pat00006
여기서, n = 0일때 δ(n) = 1이고, n ≠ 0일 때 δ(n) = 0이다. 일반적인 필터들용으로, [수학식 5]의 우측은 δ(n-d)로 대체될 수 있고, 여기서, d는 정의 딜레이이지만, 이러한 간단한 변조는 설명을 명료하기 위해 생략된다.
필터들 gq(n)은 이하의 식을 통해 프로토타입 필터 g(n)의 복소 변조로써 선택될 수 있다.
Figure 112011069204467-pat00007
본 발명의 이러한 바람직한 실시예에서, 필터들은 홀수(계수 q+1/2)마다 적층된다. 이러한 바람직한 실시예의 이점은 후술된다. 완벽한 재구성 [수학식 5]는 이하에서만 얻어진다.
Figure 112011069204467-pat00008
이것의 변형은 아래와 같은 실수치 코사인 변조이다.
Figure 112011069204467-pat00009
여기서, 실수치 프로토타입 필터 g(m)는 이하를 만족한다.
Figure 112011069204467-pat00010
(이는 [수학식 6]의 gq(n) + gQ -1-q(n)을 고려함으로써 쉽게 얻어진다)
복소 지수 변조 필터 뱅크의 서브 필터링
전술한 바와 같은 QMF 분석 필터들로부터 시작하여, 미세한 주파수 해상력은 전술한 변조된 구조들인 [수학식 6] 또는 [수학식 8] 중 하나를 이용함으로써 각각의 다운샘플링된 서브대역 신호 νk(n)을 Qk 서브-서브대역들로 부가 필터링함으로써 얻어진다. 최종 출력 신호들 yq k(n)을 지시하고, gq k(n)이 서브대역 k 내에 인가된 필터 뱅크를 설명하도록 한다. Qk = 1이면, 필터링이 없고, g0 k(n) = δ(n)이다. 통상적인 어플리케이션 예는 M = 64이고, Q0 = 8이고, k = 1, 2일 때 Qk = 4이고, k > 2일 때 Qk = 1인 경우이다.
x(ν)로부터 yq k(n)까지의 두개의 필터 뱅크들의 조합된 효과는 필터들 Fq k(ω)로 필터링함으로써 계수 M에 의해 다운샘플링되는 것으로 설명되고, 여기서,
Figure 112011069204467-pat00011
프로토타입 필터 반응 P(ω)은 기본적으로 인터벌 [-π/M, π/M] 외측에서 영이고, 이는 SBR 분석 필터들(도7 참조)용의 경우이고, 필터 Fq k(ω)는 하기 [수학식 10]에 의해 복소 변조 경우에서 한정된 단일 공칭 중심 주파수를 갖는다.
Figure 112011069204467-pat00012
여기서, s는 Qk(k-1/2)≤2(q+Qks)+1≤Qk(k+3/2)과 같이 선택된 정수이다. 예를 들어, 도 10에 도시된 바와 같이, k = 0이고, Q0 = 8이면, ω0,0, ω0,1,...ω0,7의 값은,
Figure 112011069204467-pat00013
이다.
비균일 주파수 해상력을 갖는 신호 변조
전술한 바와 같은 서브-서브대역 필터 뱅크들은 부가의 다운샘플링을 도입하지 않아서, 복소 QMF만의 경우에서 도시된 바와 같은 신호 변조의 위신호가 없는 특성이 보존된다. M 서브대역 분석의 일반적인 합체 작동, Qk 서브대역 k 내에서의 서브대역들 이용함으로써 부가의 서브대역 필터링, 필터 Ak ,q(ω)에 의한 각각의 서브-서브대역 신호 yq k(n)의 필터링, 합에 의한 각각의 서브대역 k 내의 합성 및 최종적으로 M 대역 합성 뱅크를 통한 합성을 고려한다. 이러한 시스템의 전체 전송 기능은 k ≥ 0일 때 [수학식 3]에 의해 주어진다.
Figure 112011069204467-pat00014
ω > π/(2M)에서, 이는 아래와 같이 주어져서,
Figure 112011069204467-pat00015
서브-서브대역 (k, q)의 처리량 반응은
Figure 112011069204467-pat00016
으로 주어진다.
Figure 112011069204467-pat00017
에서, [수학식 2] 때문에 소정의 주의가 필요하다. 이러한 주파수 범위 내에서, 아래와 같이 고정되고,
Figure 112011069204467-pat00018
실수 서브-서브대역 프로토타입 필터 계수를 추정하면, 아래와 같이 고정되고,
Figure 112011069204467-pat00019
변조 필터들은 아래와 같이 선택되고,
Figure 112011069204467-pat00020
여기서, B0(-Mω)* = B0(Mω)이고, [수학식 3]과 관련하여 전술한 제곱근 식별은 이하를 야기한다.
Figure 112011069204467-pat00021
*
Figure 112011069204467-pat00022
에서, 서브-서브대역(0, q)용으로 처리량 반응 Gq n(Mω)에 대응된다.
[수학식 15] 내지 [수학식 17]은 양 및 음의 주파수들 사이에서 식별하는데 바람직한 것을 나타낸다. 이는 홀수로 적층된 (복소) 필터들이 짝수로 적층된 (복소) 필터들(도 11 참조) 대신에 QMF 서브대역 신호들을 서브 필터링하는데 이용되기 때문이다. 짝수로 적층된 필터들에서, 양 및 음의 주파수들 사이에서 구별이 불가능하기 때문에, 중심 필터, 즉, 0의 중심 주파수를 갖는 필터에 존재하는 사인 곡선의 위상 변조를 적용시킬 수 없다. 반응 G(ω) 대역을 갖는 프로토타입 필터가 대역들의 수가 Q인 [-2π/Q, 2π/Q]에 제한된다고 가정하면, 홀수로 적층된 경우, 위상 변조들이 적합하게 인가될 수 있는 하부 제한은 2π/Q이고, 이에 반해, 홀수로 적층된 경우에서 위상 변조가 적합하게 인가될 수 있는 하부 제한은 π/Q이다.
도입부에서 전술한 바와 같이, PS 합성에서, 전술한 중요한 특별 경우들은 평등화되고 위상 변조이다. 균등화에서, Ak ,q(ω) = ak ,q ≥ 0이고, [수학식 16]은 이하와 같이 줄어든다.
Figure 112011069204467-pat00023
[수학식 16]의 상태인 경우의 Ak ,q(ω) = exp(iαk,q)에 대응되는 위상 변조는,
Figure 112011069204467-pat00024
이면, 만족된다.
스테레오 파라미터 추정
비균일 복소 필터 뱅크, 즉, 전술한 바와 같이 QMF 뱅크 이후의 부가의 서브대역 필터링은 후술하는 바와 같이, Inter-channel Differences(IID), Inter-channel Phase Differences(IPD) 및 Inter-channel Cross Correlation(ICC)의 스테레오 파라미터들을 추정하는데 적용될 수 있다. 이러한 실질적인 실시예에서, IPD는 Schuijers 등의 문서에서 이용된 바와 같이 ITD용의 실질적인 등가 치환으로써 이용된다. 합체된 PS 인코더(도4 참조)에서, 제 1 내지 제 3 복소 QMF 채널들은 서브 필터링되어 전체 77개의 복소치 신호들이 얻어진다(도 12 참조).
이러한 시점에서, 77개의 복소치 시간 정렬된 좌측 및 우측 서브대역 신호들은 각각 lq k(n)과 rq k(n)로 지시되고, 따라서, yq k(n)의 지수이다.
소정의 서브대역 샘플 위치 n'에서 스테레오 파라미터들을 추정하기 위해, 좌측, 우측 및 비정규화된 크로스채널 여기는 이하와 같이 계산된다.
Figure 112011069204467-pat00025
모든 스테레오 빈 b, h(n)은 길이 L. ε를 갖는 서브대역 도메인 윈도우이고, 0(예를 들어, ε=1e-10), 좌측 및 우측 서브대역 도메인 신호들인 lq k(n)과 rq k(n)으로 나누어지는 것을 방지하는 매우 작은 값이다. 20개의 스테레오 빈들의 경우에, 표에 도시된 바와 같이 k부터 kl까지의 합은 최대 kh이고, 이를 포함하고, q부터 ql까지의 합은 최대 qh이고, 이를 포함한다. "음"의 주파수들(예를 들어, k = 0이고, q = 4...7)은 [수학식 20]의 파라미터 추정에서 포함되지 않는다.
[표 1: k 및 q에 따른 합계의 개시 및 정지 인덱스들]
Figure 112011069204467-pat00026
el(b), er(b) 및 eR(b)를 계산하기 위한 합계는 합계 내의 이러한 신호들의 중간 지점이 파라미터 위치에 일치하도록 정렬되고, 따라서 시프트는
Figure 112011069204467-pat00027
에 의한다. 표 1로부터 명확한 바와 같이, 양의 중심 주파수를 갖는 서브대역 신호 및 서브-서브대역 신호들만이 예측 스테레오 파라미터들을 위해 사용된다.
각각의 스테레오 빈(b)을 위한, I(b)로 표시되는 IID, C(b)로 표시되는 ICC 및 P(b)로 표시되는 IPD는 아래와 같이 계산된다.
Figure 112011069204467-pat00028
Figure 112011069204467-pat00029
에서의 각도는 -π와 π 사이에서의 값들을 사용하는 4개의 4분할 아크탄젠트 함수를 사용하여 계산된다. 타겟 비트 비율 및 어플리케이션에 따라, 이러한 파라미터들 또는 이러한 파라미터들의 부분집합이 비트 스트림의 PS 부분 내로 양자화되고 코딩된다.
스테레오 신호 합성
디코더의 (RAM 사용에 관한) 산정된 비용을 가능한 한 낮게 유지하기 위해, 유사한 분석 구조가 사용된다. 그러나, 제 1 대역은 부분적으로만 합성된다(도 13 참조). 이는 중간 대역 쌍
Figure 712012004202999-pat00030
,
Figure 712012004202999-pat00031
,
Figure 712012004202999-pat00032
Figure 712012004202999-pat00033
의 합계에 의해 얻어진다. 또한, 제 2 및 제 3 대역은
Figure 712012004202999-pat00034
Figure 712012004202999-pat00035
의 출력의 합계에 의해 얻어지는 2개 대역 실제 값 필터 뱅크들 및,
Figure 712012004202999-pat00036
Figure 712012004202999-pat00037
의 출력의 합계이다(또한, 변조 필터 뱅크들에 대한 부분의 설명 참조). 이러한 단순화된 디코더 필터 뱅크 구조를 사용하여, 양의 주파수 및 음의 주파수 사이의 차별적인 특징은 제 1 서브대역 필터의 세분에 의해 여전히 유지된다. 디코더 분석 필터 뱅크는 도 13에 도시된다. QMF 필터링된 제 1 (서브) 서브대역 신호들의 인덱싱은 주파수에 따라 저장된다는 것을 인지한다.
단일 프레임의 스테레오 (서브) 서브대역 신호들은 아래와 같이 구성된다.
Figure 112011069204467-pat00038
Figure 112011069204467-pat00039
ICC 파라미터들 k=0, …, K-1, 서브대역 인덱스(K는 서브대역의 총 갯수, 즉 K=71), 프레임의 서브대역 샘플들의 갯수 N과 함께 QMF 서브대역 샘플 인덱스 n=0, …, N-1, 스케일 계수 조작 매트릭스들 Λ11, Λ12, Λ21, Λ22, 위상 회전 조작 매트릭스 Prl을 합성하는 것을 설명하기 위해, 모노 (서브) 서브대역 신호들 sk(n)과 함께 모노 디코렐레이티드 (서브) 서브대역 신호들 dk(n)은 모노 (서브) 서브대역 신호 sk(n)로부터 유도된다. 조작 매트릭스들은 시간 및 주파수의 함수로 정의되고, MPEG-4 표준 ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, 이동 사진 및 오디오의 코딩, 익스텐션 2에 설명된 바와 같이 조작 벡터들로부터 직접적으로 유도될 수 있다.
sk(n)은 도 13의 결과에 의한 도 12에 따라 한정된다.
Figure 112011069204467-pat00040
스테레오 파라미터들의 합성은 표 1의 인덱싱에 따라 발생한다.
[표 1: 파라미터 인덱싱 표]
Figure 112011069204467-pat00041

따라서, 합성 방정식은 아래와 같다.
Figure 112011069204467-pat00042
Figure 112011069204467-pat00043
prl의 신호는 표에 *가 부가되면 위의 방정식에서 변화한다는 것을 인지한다. 이는 [수학식 19], 즉 반대 위상 회전은 음의 주파수를 위해 인가되어야 한다는 것이다.
자명한 합성으로 변조 필터 뱅크들의 효과적인 실행
길이(L)의 원형 필터를 갖는 변조 필터 뱅크를 줄 때, 직접적인 형태의 실행은 입력 샘플 당 QL 작업들을 요구하지만, [수학식 6]에서의 변조가 주기(Q)에 반주기라는 사실은, 각각의 입력 샘플을 위한 크기(Q)의 변형 후에 L 작업들의 다상 윈도윙(windowing)으로 필터링을 분할하는데 사용될 수 있다. 이와 같은 다상 표현은 1993년에 발행된 P.P. Vaidyanathan의 "Multirate systems and filter banks", Prentice Hall Signal Processing Series의 섹션 4.3)에 공지되었다는 것을 인지하여야 한다. 이하는 본 발명의 양호한 실시예에 따른 이러한 다상 표현의 유리한 어플리케이션을 제공한다.
변형은 Q가 2개의 멱(power)일 때 Q log2Q의 차수인 상 비틀림 이후의 DFT이다. 이러한 큰 세이빙은 L이 log2Q보다 매우 큰 통상적인 경우에 얻어진다. 실제 변조의 경우(8)에서, n=0 및 n=Q 주위의 짝수/홀수 대칭으로 합성된 주기(2Q)의 반주기는 다상 윈도윙을 위해 다시 사용될 수 있고, 변형 커널(kernel)은 타입III의 DCT이다. 복소 변조의 경우를 위한 상세한 설명은 이하에 기술된다.
FFT 코어 프로세스를 사용하는 서브-서브 필터링의 효과적인 실행은 변조 이후의 원형 필터의 다상 분해를 사용하여 구현될 수 있다. 차수 N의 원형 필터(g(n))가 N=mQ라고 가정하면, m은 양의 정수이다. 임의의 차수의 원형 필터가 제약을 충족시키도록 0으로 채워질 수 있기 때문에 이러한 조건은 한정적이지 않다. 복소 변조 시스템(6)에서 사용하기 위해 구성된 원형 필터의 Z 변형은 아래와 같다.
Figure 112011069204467-pat00044
이는 아래와 같은 다상 기수법으로 표현될 수 있다.
Figure 112011069204467-pat00045
여기서,
Figure 112011069204467-pat00046
*이다.
필터뱅크의 모든 필터들은 원형 필터의 주파수 변조 상태이다. 필터(gq(n))의 Z 변형은 아래와 같다.
Figure 112011069204467-pat00047
여기서,
Figure 112011069204467-pat00048
이다.
하나의 필터로부터의 출력의 표현은 아래와 같다.
Figure 112011069204467-pat00049
마지막 합계의 성분을 인식함으로써, 입력 신호의 상태로 지연된 다상 성분 프로세스가 표시될 수 있고, 이어서 복소 지수(complex exponential)에 의해 곱해진다. 결국, 모든 출력 신호들(Yq(z), q=0…Q-1)은 (스케일링 계수없이) 역 FFT를 인가함으로써 얻어진다. 도 14는 필터 뱅크를 분석하기 위한 레이아웃을 도시한다. [수학식 29]의 다상 필터들이 인과관계가 아니기 때문에, 적절한 양의 지연이 모든 다상 성분들에 추가되어야 한다.
전술한 실시예들은 발명을 한정하지 않는 설명이며, 당해 분야의 숙련자들은 첨부된 특허청구의 범위에서 벗어남 없이 다양한 다른 실시예들을 구성할 수 있음을 인지해야 한다. 특허청구의 범위에서, 괄호 사이의 도면 부호는 청구범위를 한정하는 것이 아니다. "포함"이라는 용어는 청구범위에 기재된 것 이외의 다른 구성 요소 또는 단계의 존재를 배제하는 것이 아니다. 본 발명은 여러 가지의 명백한 구성 요소를 포함하는 하드웨어에 의해, 그리고 적절하게 프로그래밍된 컴퓨터에 의해 구현될 수 있다. 다양한 수단을 열거한 장치 청구항에서, 이러한 여러 가지 수단은 하나에 의해, 그리고 동일한 하드웨어의 아이템에 의해 실시될 수 있다. 임의의 수단들이 서로 다른 종속항에 기재된 것은 이러한 수단들의 조합이 이롭게 사용될 수 없음을 나타내는 것은 아니다.
6: 복소 변조 시스템

Claims (27)

  1. 제 1 오디오 채널 및 제 2 오디오 채널을 포함하는 오디오 신호의 인코딩 방법에 있어서,
    상기 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들 및 상기 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 복소 변조 필터 뱅크에서 상기 제 1 오디오 채널 및 상기 제 2 오디오 채널 각각을 서브대역 필터링하는 단계;
    다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하도록 상기 서브대역 신호들 각각을 다운샘플링하는 단계;
    상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들에 대한 복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들의 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가의 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링 받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계;
    상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들에 대해 추가로 서브대역 필터링되지 않는 상기 다운샘플링된 서브대역 신호들 및 상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들에 대한 상기 서브-서브대역 신호들로부터 공간 파라미터들을 유도하는 단계; 및
    상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 직접 유도하는 단계를 포함하는, 오디오 신호의 인코딩 방법.
  2. 제 1 항에 있어서,
    상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 제 1 서브대역 신호들의 가장 낮은 주파수 서브대역 신호 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들의 가장 낮은 주파수 서브대역 신호에 대해 수행되는, 오디오 신호의 인코딩 방법.
  3. 제 2 항에 있어서,
    상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 제 1 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호에 대해 더 수행되는, 오디오 신호의 인코딩 방법.
  4. 제 3 항에 있어서,
    상기 가장 낮은 서브대역 신호들의 서브-서브대역들의 갯수는 상기 다음으로 가장 낮은 주파수 서브대역 신호들의 서브-서브대역들의 갯수보다 더 많은, 오디오 신호의 인코딩 방법.
  5. 제 1 항에 있어서,
    상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 복소 변조 필터 뱅크인, 오디오 신호의 인코딩 방법.
  6. 제 1 항에 있어서,
    상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 실제 값 코사인 변조 필터 뱅크인, 오디오 신호의 인코딩 방법.
  7. 제 1 항에 있어서,
    상기 추가의 서브대역 필터 뱅크는 홀수로 적층된 필터 뱅크인, 오디오 신호의 인코딩 방법.
  8. 제 1 항에 있어서,
    상기 서브-서브대역 신호들은 추가로 다운샘플링되지 않는, 오디오 신호의 인코딩 방법.
  9. 제 1 항에 있어서,
    상기 단일 채널 오디오 신호는 대역폭이 한정되어 추가로 코딩되고, 스펙트럼 대역 복제 파라미터들은 상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들, 또는 상기 다운샘플링된 복수의 제 1 서브대역 신호들 또는 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 유도되는, 오디오 신호의 인코딩 방법.
  10. 오디오 신호를 인코딩하는 오디오 인코더로서, 상기 오디오 신호는 제 1 오디오 채널 및 제 2 오디오 채널을 포함하는, 상기 오디오 인코더에 있어서,
    상기 제 1 오디오 채널을 위한 복수의 제 1 서브대역 신호들을 제공하도록 상기 제 1 오디오 채널을 서브대역 필터링하는 제 1 복소 변조 필터 뱅크;
    상기 제 2 오디오 채널을 위한 복수의 제 2 서브대역 신호들을 제공하도록 상기 제 2 오디오 채널을 서브대역 필터링하는 제 2 복소 변조 필터 뱅크;
    다운샘플링된 복수의 제 1 서브대역 신호들 및 다운샘플링된 복수의 제 2 서브대역 신호들을 제공하기 위해 상기 서브대역 신호들 각각을 다운샘플링하는 수단;
    상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들에 대한 복수의 서브-서브대역 신호들을 제공하기 위해 상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들의 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 추가의 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 필터 뱅크;
    상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들에 대한 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 복수의 제 1 서브대역 신호들 및 상기 복수의 제 2 서브대역 신호들에 대한 다운샘플링된 서브대역 신호들로부터 공간 파라미터들을 유도하는 수단; 및
    상기 다운샘플링된 복수의 제 1 서브대역 신호들 및 상기 다운샘플링된 복수의 제 2 서브대역 신호들로부터 서브대역 신호들을 포함하는 단일 채널 오디오 신호를 직접 유도하는 수단을 포함하는, 오디오 인코더.
  11. 입력 오디오 신호를 기초로 인코딩된 오디오 신호를 전송하거나 저장하는 장치에 있어서,
    입력 오디오 신호를 수용하는 입력 유닛;
    인코딩된 오디오 신호를 얻기 위해 상기 입력 오디오 신호를 인코딩하는 제 10 항에서 청구된 오디오 인코더; 및
    전송 또는 저장을 위한 포맷으로 상기 인코딩된 오디오 신호를 추가로 코딩하는 채널 코더를 포함하는, 인코딩된 오디오 신호를 전송하거나 저장하는 장치.
  12. 인코딩된 오디오 신호를 디코딩하는 방법으로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 인코딩된 오디오 신호를 디코딩하는 방법에 있어서,
    다운샘플링된 복수의 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계;
    복수의 서브-서브대역 신호들을 제공하기 위해 추가의 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가의 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계; 및
    복소 변조 필터뱅크를 이용하여, 상기 공간 파라미터들, 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 2개의 오디오 채널들을 유도하는 단계를 포함하는, 인코딩된 오디오 신호를 디코딩하는 방법.
  13. 제 12 항에 있어서,
    상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 서브대역 신호들의 가장 낮은 주파수 서브대역 신호에 대해 수행되는, 인코딩된 오디오 신호를 디코딩하는 방법.
  14. 제 13 항에 있어서,
    상기 추가의 서브대역 필터링은 적어도 상기 다운샘플링된 복수의 서브대역 신호들의 다음으로 가장 낮은 주파수 서브대역 신호에 대해 더 수행되는, 인코딩된 오디오 신호를 디코딩하는 방법.
  15. 제 14 항에 있어서,
    상기 가장 낮은 주파수 서브대역 신호들의 서브-서브대역의 갯수는 상기 다음으로 가장 낮은 주파수 서브대역 신호들의 서브-서브대역의 갯수보다 많은, 인코딩된 오디오 신호를 디코딩하는 방법.
  16. 제 12 항에 있어서,
    상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 복소 변조 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
  17. 제 12 항에 있어서,
    상기 추가의 서브대역 필터 뱅크는 적어도 부분적으로 실제값 코사인 변조 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
  18. 제 12 항에 있어서,
    상기 추가의 서브대역 필터 뱅크는 홀수로 적층된 필터 뱅크인, 인코딩된 오디오 신호를 디코딩하는 방법.
  19. 제 12 항에 있어서,
    상기 인코딩된 오디오 신호는 스펙트럼 대역 복제 파라미터들을 포함하고, 고주파수 성분은 상기 다운샘플링된 복수의 서브대역 신호들 및 상기 스펙트럼 대역 복제 파라미터들로부터 유도되고, 상기 2개의 오디오 채널들은 상기 공간 파라미터들, 상기 서브-서브대역 신호들, 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들 및 상기 고주파수 성분으로부터 유도되는, 인코딩된 오디오 신호를 디코딩하는 방법.
  20. 인코딩된 오디오 신호를 디코딩하기 위한 오디오 디코더로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 오디오 디코더에 있어서,
    복수의 다운샘플링된 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 디코더;
    복수의 서브-서브대역 신호들을 제공하기 위해 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 필터 뱅크; 및
    상기 공간 파라미터들, 상기 서브-서브대역 신호들 및 추가로 서브대역 필터링되지 않은 상기 다운샘플링된 서브대역 신호들로부터 2개의 오디오 채널들을 유도하는 수단을 포함하고, 상기 2개의 오디오 채널들을 유도하는 상기 수단은 복소 변조 필터뱅크를 포함하는, 오디오 디코더.
  21. 출력 오디오 신호를 재생하는 장치에 있어서,
    인코딩된 오디오 신호를 얻기 위한 입력 유닛;
    상기 출력 오디오 신호를 얻기 위해 상기 인코딩된 오디오 신호를 디코딩하는, 제 20 항에서 청구된 오디오 디코더; 및
    상기 출력 오디오 신호를 재생하기 위한 스피커 또는 헤드폰 출력과 같은 재생 유닛을 포함하는, 출력 오디오 신호를 재생하는 장치.
  22. 제 1 항에서 청구된 방법의 단계들 모두를 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  23. 제 12 항에서 청구된 방법을 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  24. 인코딩된 오디오 신호를 디코딩하는 방법으로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 인코딩된 오디오 신호를 디코딩하는 방법에 있어서,
    복소 변조 필터뱅크로부터 발생하는 다운샘플링된 복수의 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 단계; 및
    복수의 서브-서브대역 신호들을 제공하기 위해 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 서브대역 필터링하는 단계로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 추가의 서브대역 필터링하는 단계를 포함하는, 인코딩된 오디오 신호를 디코딩하는 방법.
  25. 제 24 항에 있어서,
    가장 낮은 주파수 서브대역에서, 시간 도메인 내에 음의 중심 주파수를 갖는 상기 서브-서브대역 신호들의 위상 변화들은 상기 음의 중심 주파수에 가장 가까운 절대값에 있는 양의 중심 주파수를 갖는 서브-서브대역 신호에 인가된 음의 위상 변화를 취함으로써 결정되는, 인코딩된 오디오 신호를 디코딩하는 방법.
  26. 인코딩된 오디오 신호를 디코딩하기 위한 오디오 디코더로서, 상기 인코딩된 오디오 신호는 인코딩된 단일 채널 오디오 신호 및 공간 파라미터들의 세트를 포함하는, 상기 오디오 디코더에 있어서,
    복소 변조 필터뱅크로부터 발생하는 복수의 다운샘플링된 서브대역 신호들을 얻기 위해 상기 인코딩된 단일 채널 오디오 채널을 디코딩하는 디코더; 및
    복수의 서브-서브대역 신호들을 제공하기 위해 필터 뱅크에서 적어도 하나의 상기 다운샘플링된 서브대역 신호들을 추가로 서브대역 필터링하는 필터 뱅크로서, 상기 추가의 서브대역 필터링받는 다운샘플링된 서브대역 신호들의 수는 추가로 서브대역 필터링되지 않는 다운샘플링된 서브대역 신호들이 남도록 다운샘플링된 서브대역 신호들의 총 수보다 작은, 상기 필터 뱅크, 오디오 디코더.
  27. 제 24 항에서 청구된 방법의 단계들 모두를 수행하도록 컴퓨터에게 지시하기 위한 코드를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
KR1020117020710A 2003-10-30 2004-10-28 오디오 신호 인코딩 또는 디코딩 KR101217649B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03104034 2003-10-30
EP03104034.8 2003-10-30
PCT/IB2004/052226 WO2005043511A1 (en) 2003-10-30 2004-10-28 Audio signal encoding or decoding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020067008373A Division KR101106026B1 (ko) 2003-10-30 2004-10-28 오디오 신호 인코딩 또는 디코딩

Publications (2)

Publication Number Publication Date
KR20110113765A KR20110113765A (ko) 2011-10-18
KR101217649B1 true KR101217649B1 (ko) 2013-01-02

Family

ID=34530779

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020067008373A KR101106026B1 (ko) 2003-10-30 2004-10-28 오디오 신호 인코딩 또는 디코딩
KR1020117020710A KR101217649B1 (ko) 2003-10-30 2004-10-28 오디오 신호 인코딩 또는 디코딩

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020067008373A KR101106026B1 (ko) 2003-10-30 2004-10-28 오디오 신호 인코딩 또는 디코딩

Country Status (12)

Country Link
US (3) US7519538B2 (ko)
EP (1) EP1683133B1 (ko)
JP (4) JP4966013B2 (ko)
KR (2) KR101106026B1 (ko)
CN (2) CN1875402B (ko)
AT (1) ATE354160T1 (ko)
BR (2) BR122018007834B1 (ko)
DE (1) DE602004004818T2 (ko)
ES (1) ES2282899T3 (ko)
PL (1) PL1683133T3 (ko)
RU (1) RU2374703C2 (ko)
WO (1) WO2005043511A1 (ko)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
ES2791001T3 (es) * 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
BRPI0516658A (pt) * 2004-11-30 2008-09-16 Matsushita Electric Ind Co Ltd aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP2008542816A (ja) * 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2009500656A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
PL1905006T3 (pl) * 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
KR101169280B1 (ko) * 2005-08-30 2012-08-02 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
EP1946062A4 (en) * 2005-10-05 2009-09-09 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US20070092086A1 (en) * 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
KR101366291B1 (ko) * 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
KR101015037B1 (ko) 2006-03-29 2011-02-16 돌비 스웨덴 에이비 오디오 디코딩
US7612275B2 (en) * 2006-04-18 2009-11-03 Nokia Corporation Method, apparatus and computer program product for providing rhythm information from an audio signal
US7818079B2 (en) * 2006-06-09 2010-10-19 Nokia Corporation Equalization based on digital signal processing in downsampled domains
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
AR061807A1 (es) 2006-07-04 2008-09-24 Coding Tech Ab Compresor de filtro y metodo para fabricar respuestas al impulso de filtro de subbanda comprimida
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8655663B2 (en) * 2007-10-26 2014-02-18 D&M Holdings, Inc. Audio signal interpolation device and audio signal interpolation method
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
KR101428487B1 (ko) 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
TWI559680B (zh) * 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
AU2016262695B2 (en) * 2009-02-18 2017-11-09 Dolby International Ab Low Delay Modulated Filter Bank
AU2012204068B2 (en) * 2009-04-03 2013-12-19 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
EP3723090B1 (en) 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
CN103854651B (zh) 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
RU2683175C2 (ru) 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
EP2581905B1 (en) 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US9117459B2 (en) * 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
BR122021003887B1 (pt) 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
CA3220202A1 (en) 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
KR20120038311A (ko) 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
PL2676268T3 (pl) * 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
KR101424372B1 (ko) 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
CN103918029B (zh) * 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
US9064503B2 (en) 2012-03-23 2015-06-23 Dolby Laboratories Licensing Corporation Hierarchical active voice detection
WO2013186343A2 (en) * 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
ES2688134T3 (es) 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
WO2015189533A1 (en) * 2014-06-10 2015-12-17 Meridian Audio Limited Digital encapsulation of audio signals
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
JP6360253B2 (ja) * 2014-09-12 2018-07-18 ドルビー ラボラトリーズ ライセンシング コーポレイション サラウンドおよび/または高さスピーカーを含む再生環境におけるオーディオ・オブジェクトのレンダリング
US9837065B2 (en) 2014-12-08 2017-12-05 Ford Global Technologies, Llc Variable bandwidth delayless subband algorithm for broadband active noise control system
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6797187B2 (ja) * 2015-08-25 2020-12-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・デコーダおよびデコード方法
WO2017124007A1 (en) * 2016-01-15 2017-07-20 Dolby Laboratories Licensing Corporation Audio signal processing with low latency
EP3203472A1 (en) * 2016-02-08 2017-08-09 Oticon A/s A monaural speech intelligibility predictor unit
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
WO2019091575A1 (en) * 2017-11-10 2019-05-16 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN107918710B (zh) * 2017-11-22 2020-11-06 桂林电子科技大学 基于凸优化的非下采样图滤波器组的设计方法
CN108806705A (zh) * 2018-06-19 2018-11-13 合肥凌极西雅电子科技有限公司 音频处理方法和处理系统
US11195543B2 (en) 2019-03-22 2021-12-07 Clear Peaks LLC Systems, devices, and methods for synchronizing audio
CN113314132B (zh) * 2021-05-17 2022-05-17 武汉大学 交互式音频系统中的音频对象编码方法、解码方法及装置
CN117292694B (zh) * 2023-11-22 2024-02-27 中国科学院自动化研究所 基于时不变编码的少令牌神经语音编解码方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3211752C2 (de) * 1982-03-30 1985-09-26 Siemens AG, 1000 Berlin und 8000 München Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung
JPS621228A (ja) 1985-06-26 1987-01-07 Fujitsu Ltd タングステンシリサイドの選択成長方法
US4692343A (en) * 1985-08-05 1987-09-08 Spectrum Cvd, Inc. Plasma enhanced CVD
US4737474A (en) * 1986-11-17 1988-04-12 Spectrum Cvd, Inc. Silicide to silicon bonding process
US4902645A (en) * 1987-08-24 1990-02-20 Fujitsu Limited Method of selectively forming a silicon-containing metal layer
EP0446037B1 (en) * 1990-03-09 1997-10-08 AT&T Corp. Hybrid perceptual audio coding
JPH0410429A (ja) 1990-04-26 1992-01-14 Matsushita Electron Corp 半導体装置
JP2892451B2 (ja) 1990-07-13 1999-05-17 住友重機械工業株式会社 電気―空気サーボアクチュエータ
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5392037A (en) * 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
JP2778324B2 (ja) * 1992-01-24 1998-07-23 日本電気株式会社 サブバンド分割方式
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Per Ekstrand, "BANDWIDTH EXTENSION OF AUDIO SIGNALS BY SPECTRAL BAND REPLICATION" Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), Leuven, Belgium, November 1 *

Also Published As

Publication number Publication date
EP1683133B1 (en) 2007-02-14
US20090216544A1 (en) 2009-08-27
JP2013167908A (ja) 2013-08-29
JP2011128649A (ja) 2011-06-30
US7519538B2 (en) 2009-04-14
US20070067162A1 (en) 2007-03-22
JP2007514962A (ja) 2007-06-07
ATE354160T1 (de) 2007-03-15
CN1875402A (zh) 2006-12-06
DE602004004818D1 (de) 2007-03-29
BR122018007834B1 (pt) 2019-03-19
BRPI0415951A (pt) 2007-01-02
US8073685B2 (en) 2011-12-06
CN101540171A (zh) 2009-09-23
KR101106026B1 (ko) 2012-01-17
JP5192424B2 (ja) 2013-05-08
DE602004004818T2 (de) 2007-12-06
ES2282899T3 (es) 2007-10-16
JP4966013B2 (ja) 2012-07-04
JP5335015B2 (ja) 2013-11-06
CN1875402B (zh) 2012-03-21
US20110178810A1 (en) 2011-07-21
PL1683133T3 (pl) 2007-07-31
RU2006118682A (ru) 2007-12-10
US8260607B2 (en) 2012-09-04
JP2009163257A (ja) 2009-07-23
WO2005043511A1 (en) 2005-05-12
BRPI0415951A8 (pt) 2018-05-02
KR20110113765A (ko) 2011-10-18
EP1683133A1 (en) 2006-07-26
BRPI0415951B1 (pt) 2018-08-28
KR20060131745A (ko) 2006-12-20
CN101540171B (zh) 2013-11-06
JP5889828B2 (ja) 2016-03-22
RU2374703C2 (ru) 2009-11-27

Similar Documents

Publication Publication Date Title
KR101217649B1 (ko) 오디오 신호 인코딩 또는 디코딩
CN1910655B (zh) 构造多通道输出信号或生成下混信号的设备和方法
CN103329197B (zh) 用于反相声道的改进的立体声参数编码/解码
KR101629862B1 (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
RU2645271C2 (ru) Стереофонический кодер и декодер аудиосигналов
CN105518775B (zh) 使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除
CN101401152B (zh) 通过多通道音频信号的主分量分析进行编码的设备和方法
EP3061089B1 (en) Parametric reconstruction of audio signals
US8718284B2 (en) Method, medium, and system encoding/decoding multi-channel signal
US20070038439A1 (en) Audio signal generation
CN102656628B (zh) 优化的低吞吐量参数编码/解码
AU2005280392A1 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
EP3061088B1 (en) Decorrelator structure for parametric reconstruction of audio signals

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151130

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161130

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171129

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181128

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191129

Year of fee payment: 8