KR20080032146A - 파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드멀티 채널 코딩 사이의 갭을 브릿징하는 개념 - Google Patents

파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드멀티 채널 코딩 사이의 갭을 브릿징하는 개념 Download PDF

Info

Publication number
KR20080032146A
KR20080032146A KR1020087002860A KR20087002860A KR20080032146A KR 20080032146 A KR20080032146 A KR 20080032146A KR 1020087002860 A KR1020087002860 A KR 1020087002860A KR 20087002860 A KR20087002860 A KR 20087002860A KR 20080032146 A KR20080032146 A KR 20080032146A
Authority
KR
South Korea
Prior art keywords
signal
parametric
parametric data
channel
representation
Prior art date
Application number
KR1020087002860A
Other languages
English (en)
Other versions
KR100946688B1 (ko
Inventor
요하네스 힐퍼트
크리스토프 팰러
칼스턴 린즈메이어
랄프 스페르슈네이더
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
에이저 시스템즈 인크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36873210&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20080032146(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우., 에이저 시스템즈 인크 filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20080032146A publication Critical patent/KR20080032146A/ko
Application granted granted Critical
Publication of KR100946688B1 publication Critical patent/KR100946688B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0815Cache consistency protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

본 발명의 목적은 업 믹싱 신호의 사운드를 점차적으로 향상시키고, 0 내지 파라메트릭 방법의 비트율까지의 사이드 정보에 의해 소모된 비트율을 증가시킴으로써 파라메트릭 멀티 채널 오디오 코딩과 매트릭 서라운드 멀티 채널 코딩 사이의 갭을 브릿징하는 것이다. 더 구체적으로, 매트릭스 서라운드(사이드 정보 없는, 제한된 오디오 품질)와 완전한 파라메트릭 복원(완전한 사이드 정보율이 필요로 하고, 좋은 품질) 사이에서 "동작점"을 탄력적으로 선택하는 방법을 제공한다. 이 동작점은 동적으로(즉, 가변적으로), 그리고 개인 적용에 의해 지시된 바와 같이, 허용되는 사이드 정보율에 따라 선택될 수 있다.
Figure P1020087002860
멀티 채널 오디오 디코더, 멀티 채널 인코더, 트랜스코더

Description

파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드 멀티 채널 코딩 사이의 갭을 브릿징하는 개념{CONCEPT FOR BRIDGING THE GAP BETWEEN PARAMETRIC MULTI-CHANNEL AUDIO CODING AND MATRIXED-SURROUND MULTI-CHANNEL CODING}
본 발명은 멀티 채널 오디오 코딩 및 전송에 관한 것이고, 특히, 멀티 채널 오디오의 효과적인 코딩을 위한 스테레오 장치 및 형식과 완전히 백워드 호환되는 방법으로 멀티 채널 오디오를 인코딩하는 기술에 관한 것이다.
멀티 채널 오디오 신호의 파라메트릭 코딩은 계속되는 연구의 화제이다. 통상, 멀티 채널 오디오 신호를 인코딩하는 2개의 접근법이 분류될 수 있다. 동화상 전문가 그룹(MPEG), 국제 표준화 기구(ISO)의 서브그룹은 다운 믹싱 신호에 적은 양의 도움 정보를 추가함으로써 스테레오 또는 모노 다운 믹싱 신호로부터 멀티 채널 오디오 컨텐츠의 복원용 기술의 표준화에 현재 종사하고 있다.
원래의 멀티 채널 오디오 신호의 공간 화상을 복원하기 위해서 다운 믹싱 신호에 미리(무조건) 포함되지 않은 어느 추가적 사이드 정보를 필요로 하지 않는 병렬 스테레오 투 멀티 채널 업 믹싱 방법이 개발되고 있다.
실제 타당성을 얻었던 추가적 사이드 정보 없이 스테레오 호환적인 멀티 채널 전송을 위한 현행 방법은 http://dolby.com/assets/pdf/tech_library/209_Dolby_Surround_Pro_Logic_Ⅱ_Decoder_Principles_of_Operation.pdf의 "Dolby Surround Pro Logic Ⅱ Decoder - Principles of Operation" 및 Griesinger, D., 101st AES Convention, Los Angeles, USA, 1996, Preprint 4402의 "Multichannel Matrix Surround Decoders for Two-Eared Listeners", 에 더 상세히 설명된 바와 같이, Dolby Pro Logic Ⅱ(Dolby Pro Logic Ⅱ) 및 Logic-7과 같은 매트릭스 서라운드 방법으로서 대개 특징될 수 있다. 이 방법의 통상의 원리는 인코더가 스테레오 다운 믹싱 신호를 형성하기 위해 전 채널과 중앙 채널을 함께 믹싱하기 전에 서라운드 채널로 위상 시프트를 적용하는 멀티 채널 또는 스테레오 다운 믹싱의 전용 방법을 사용하는 것이다. 다운 믹싱 신호(Lt, Rt)의 발생은 이하 방정식에 나타난다:
Figure 112008008733485-PCT00001
레프트 다운 믹싱 신호(Lt)는 레프트 프런트 신호(Lf), 계수(q)가 곱해진 중앙 신호(C), 90도(j') 회전되고 계수(a)에 비례하는 위상인 레프트 서라운드 신호(Ls), 90도 회전되고 계수(b)에 비례하는 위상인 라이트 서라운드 신호(Rs)로 구성된다. 라이트 다운 믹싱 신호(Rt)가 마찬가지로 발생된다. 통상 다운 믹싱 계수는 q 및 a가 0.707이고, b가 0.408이다. 라이트 다운 믹싱 신호(Rt) 및 레프트 다운 믹싱 신호(Lt)에 대한 서라운드 채널의 다른 부호에 대한 근본적인 이유는 그것이 다운 믹싱 쌍(Lt, Rt)에서 역위상으로 서라운드 채널을 믹싱하는 것이 편리하기 때문이다. 이 특성은 디코더가 다운 믹싱 신호 쌍으로부터 앞뒤 사이에서 식별하는 것을 돕는다. 그러므로, 다운 믹싱 매트릭스는 디매트릭싱 동작을 적용함으로써 디코더 내의 스테레오 다운 믹싱으로부터 멀티 채널 출력 신호의 부분 복원을 하도록 한다. 재생산된 멀티 채널 신호가 원래의 인코더 입력 신호와 유사하지만 멀티 채널 오디오 컨텐츠의 구체적인 특성에 의존한다.
헬퍼(helper) 정보 또는 사이드 정보를 추가하는 코딩 방법의 예는 MPEG 서라운드 오디오 코딩이다. 파라메트릭 멀티 채널 오디오 코딩의 효과적인 방법은 예컨대, Herre, J., Purnhagen, H., Breebaart, J., Faller, C., Disch, S., Kjoerling, K., Schuijers, E., Hilpert, J., Myburg, F., Proc.의 "The Reference Model Architecture for MPEG Spatial Audio Coding" 및 ISO/IEC JTC1/SC29/WG11(MPEG), Document N7136, Busan, Korea, 2005의 "Text of Working Draft for Spatial Audio Coding(SAC)"에 기재되어 있다.
공간 오디오 코딩에 사용된 인코더의 개략적 개요는 도 6에 도시된다. 인코더는 쿼드러쳐 미러 필터(12)[QMF, Quadrature Mirror Filters]로서 분리된 시간-주파수 타일에 들어오는 신호(10)[입력1, … 입력N]를 분리한다. 결과 주파수 타일(대역) 그룹은 "파라미터 대역"로 칭한다. 모든 파라미터 대역에 대해, 많은 공간 파라미터(14)는 공간 화상의 특성, 예컨대, 여러 쌍의 채널 사이에 레벨차(CLD), 여러 쌍의 채널 사이의 상호 상관(ICC), 또는 신호 인벨럽(envelop)에 대한 정보(CPC)를 설명하는 파라미터 측정기(16)에 의해 결정된다. 이 파라미터는 공통으로 공간 데이터의 비트 스트림으로 연속적으로 양자화되며, 인코딩되고 수집된 다. 동작 모드에 의존하여, 이 비트 스트림은 양질의 멀티 채널 오디오에 대한 약간의 kBit/s로부터 근접 투명질에 대한 10분의 kBit/s까지의 넓은 비트율 범위를 커버할 수 있다.
파라미터의 추출 외에, 인코더는 멀티 채널 입력 신호로부터 모노 또는 스테레오 다운 믹싱을 발생한다. 또한, 스테레오 다운 믹싱의 경우에, 사용자는 종래(ITU-style) 스테레오 다운 믹싱을 선택하거나 매트릭스 서라운드 시스템과 호환가능한 다운 믹싱을 선택한다. 결국, 스테레오 다운 믹싱은 QMF 시스템 설계 뱅크(18)로서 타임 도메인으로 전송된다. 결과 다운 믹싱은 공간 파라미터 또는 공간 파라미터 비트 스트림(14)을 동반한 디코더로 전송될 수 있다. 바람직하게, 다운 믹싱은 전송(종래 모노 또는 스테레오 코어 코더를 사용한) 전에 인코딩되며, 코어 코더의 비트 스트림 및 공간 파라미터가 추가적으로 결합되어(곱해져서) 신호 출력 비트 스트림을 형성한다.
원칙적으로, 도 7에 도시된 바와 같이, 디코더는 인코더의 역처리를 행한다. 입력 스트림은 코어 코더 비트 스트림 및 파라미터 비트 스트림으로 분리된다. 이는 도 7에 도시되지 않는다. 결과적으로, 디코딩된 다운 믹싱(20)은 인코더에 적용된 바와 마찬가지인 파라미터 대역을 얻도록 QMF 분석 뱅크(22)에 의해 처리된다. 공간 시스템 설계 단계(24)는 제어 데이터(26)[즉, 전송된 공간 파라미터]로서 멀티 채널 신호를 복원한다. 결국, QMF 도메인 신호는 최종 멀티 채널 출력 신호(28)를 수신하는 QMF 시스템 설계 뱅크(27)로서 시간 도메인으로 전송된다.
도 8은 도 6의 이전 기술 인코더와 도 7의 이전 기술 디코더 내에 행해진 바 와 같은 QMF 분석의 간단한 예를 도시한다. 시간 도메인으로 샘플링되고 4개의 샘플 값을 갖는 오디오 샘플(30)은 필터 뱅크(32)로 입력된다. 필터 뱅크(32)는 4개의 샘플 값을 각각 갖는 3개의 출력 샘플(34a, 34b, 34c)을 얻는다. 이상적인 경우, 필터 뱅크(32)는 출력 샘플(34a 내지 34c)을 얻어서 출력 신호 내의 샘플이 근원적인 오디오 신호(30)의 이산적인 주파수 범위의 정보만을 포함한다. 도 8에 도시된 경우에서, 샘플(34a)은 f0 내지 f1의 주파수 간격 범위의 정보를 가지며, 샘플(34b)은 주파수 간격[f1, f2]의 정보를 갖고, 샘플(34c)은 주파수 간격[f2, f3]의 정보를 갖는다. 도 8에서 주파수 간격이 오버랩되지 않더라도, 더 일반적인 경우에, 필터 뱅크로부터 출력된 출력 샘플의 주파수 간격은 주파수 오버랩되는 것은 당연하다.
이전 기술 인코더는 이미 상술된 바와 같이, ITU-style 다운 믹싱 또는 매트릭스 서라운드 호환 다운 믹싱 중 하나를 2-채널 다운 믹싱이 소망될 때 전송한다. 매트릭스 서라운드 호환 다운 믹싱(예컨대, 방정식1에 주어진 매트릭싱 접근을 사용한)의 경우에, 인코더가 매트릭스 서라운드 호환 다운 믹싱을 직접 발생할 하나의 가능성이 있다.
도 9는 통상의 스테레오 다운 믹싱(32)에 작용하는 다운 믹싱 후처리 유닛(30)을 사용한 매트릭스 서라운드 호환 다운 믹싱을 발생시키는 대안적 접근을 도시한다. 매트릭스 서라운드 프로세서(30)[MTX 인코더]는 통상의 스테레오 다운 믹싱(32)이 파라미터 추출 단계(16)에 의해 추출된 공간 파라미터(14)에 의해 가이드된 매트릭스 서라운드를 호환가능하게 변경한다. 전송 동안, 매트릭스 서라운드 호환 다운 믹싱(34)은 QMF 시스템 설계 뱅크(18)를 사용한 QMF 시스템 설계에 의해 시간 도메인으로 전송된다.
통상의 스테레오 다운 믹싱을 후처리함으로써 매트릭스 서라운드 호환 신호를 수신하는 것은 매트릭스 서라운드 호환 처리가 공간 파라미터가 사용가능하면 디코더측에 완전히 리버스(reverse)될 수 있는 장점을 가진다.
2개의 접근이 멀티 채널 신호를 전송하기에 적합하더라도 기술 시스템의 상태의 구체적인 결점이 있다. 매트릭스 서라운드 방법은 아주 제한된 멀티 채널 복원 품질의 가격면에서 매우 효율적이다(추가적 파라미터가 요구되지 않으므로).
반면, 파라메트릭 멀티 채널 접근은 파라메트릭 표현용 최대 수용가능한 비트율로 제한이 설정될 때 문제가 되는 사이드 정보 때문에 높은 비트율을 필요로 한다. 인코딩된 파라미터가 상당히 많은 양의 비트율을 필요로 할 때 그러한 비트율 제한 내에 있을 수 있는 한가지 방법은 채널의 압축을 증가시킴으로써 인코딩된 다운 믹싱 채널의 질을 감소시키는 것이다. 그러므로, 높게 수용될 수 없는 오디오 품질의 통상적 손실을 기인한다. 다른 말로, 파라메트릭 멀티 채널 접근에 대해, 몇몇 경우에 높게 수용될 수 없는 공간 파라미터 층에 대해 필요되는 최소 비트율의 절대 제한이 종종 있다.
매트릭스 서라운드 방법과 공간 오디오 방법 사이에 원리 결점 호환이 도 9에 도시된 바와 같이, 이전 기술 인코더에 의해 달성될 수 있더라도 매트릭스에 의거한 디코딩만이 필요될 때 추가적 비트율은 이 접근으로 면하게 되지 않을 수 있다. 공간 파라미터의 풀 세트가 전송되어야만 하더라도 전송 대역 폭을 소모한다.
그러나, 파라메트릭 방법을 적용할 때 소모되는 비트율은 어떤 적용 개요의 경우, 아주 높을 수 있고, 사이드 정보의 전송이 없는 방법으로 행해진 오디오 품질은 불충분할 수 있다.
미국 특허 출원 제2005/157,883호는 입력 신호와 파라메트릭 사이드 정보를 사용한 멀티 채널 오디오 신호, 원래 멀티 채널 신호로부터 수신된 제 1 입력 채널과 제 2 입력 채널을 포함하는 입력 신호, 및 멀티 채널 원래 신호의 채널 사이에 코릴레이션을 설명하는 파라메트릭 사이드 정보를 구성하는 장치를 나타내고 있다.
본 발명의 목적은 매트릭스 기반 코딩 솔루션과 백워드 호환이능하며 멀티 채널 오디오 신호의 더 효과적인 코딩에 대한 개념을 제공하는 것이다.
본 발명의 제 1 실시예에 의하면, 상기 목적은 오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 멀티 채널 오디오 디코더로서, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 멀티 채널 오디오 디코더에 있어서: 상기 오디오 신호로부터 중간 신호를 유도하고, 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하고 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하고, 상기 중간 신호의 제 2 부분을 유도하고 파라메트릭 데이터를 사용하지 않거나 제 2 파라메트릭 데이터를 사용하는 제 2 유도 규칙을 사용하는 프로세서를 포함한다.
본 발명의 제 2 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 멀티 채널 인코더에 있어서, 공간 파라미터를 발생시키는 파라미터 제너레이터; 파라메트릭 표현을 발생시키는 출력 인터페이스를 포함하며, 상기 파라미터 제너레이터 또는 상기 출력 인터페이스는 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키고, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.
본 발명의 제 3 실시예에 의하면, 상기 목적은 오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법으로서, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 방법에 있어서, 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용한 다운 믹싱 신호로부터 중간 신호를 유도하는 단계; 및 제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함한다.
본 발명의 제 4 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법에 있어서, 공간 파라미터를 발생시키는 단계; 및 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 단계를 포함하며, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.
본 발명의 제 5 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현에 있어서, 상기 파라메트릭 표현은 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하며, 상기 파라메트릭 표현은 멀티 채널 신호의 제 2 부분의 파라메트릭 데이터가 포함되지 않거나 제 2 파라메트릭 데이터가 포함되고, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부의 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.
본 발명의 제 6 실시예에 의하면, 상기 목적은 컴퓨터를 실행할 때 오디오 신호를 처리하는 방법과 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법을 행하는 프로그램 코드를 갖는 컴퓨터 프로그램으로서, 상기 방법은, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 방법에 있어서, 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하는 다운 믹싱 신호로부터 중간 신호를 얻는 단계; 및 제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함한다.
본 발명의 제 7 실시예에 의하면, 상기 목적은 컴퓨터를 실행할 때 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램에 있어서, 상기 방법은, 공간 파라미터를 발생시키는 단계; 및 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 상기 파라메트릭 표현을 발생시키는 단계를 포함하며, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.
본 발명의 제 8 실시예에 의하면, 상기 목적은 멀티 채널 오디오 신호의 공간 특성을 나타내는 공간 파라미터를 사용하는 멀티 채널 오디오 신호의 파라메트릭 표현을 발생시키는 트랜스코더에 있어서, 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 공간 파라미터로부터 유도된 제 2 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 파라미터 제너레이터를 포함하며, 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되고, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 한다.
본 발명은 제 1 유도 규칙이 멀티 채널 신호의 제 1 부분을 나타내는 파라메트릭 표현의 제 1 파라메트릭 데이터를 얻기 위해 사용될 때와 멀티 채널 신호의 제 2 부분에 대해, 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되고 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않을 때 멀티 채널 오디오 신호가 파라메트릭 표현에 의해 효율적으로 표시될 수 있는 결과에 의거되지만, 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하고 있다.
그래서, 멀티 채널 신호의 제 1 부분은 멀티 채널 신호의 복원이 더 양질이 되게 하고 제 2 부분은 복원이 약간 낮은 품질이 되게 하는 제 2 파라미터에 의해 표시될 수 있다. 제 1 파라메트릭 데이터에 의해 소비된 비트율은 2개의 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 2 파라메트릭 데이터에 의해 소모된 비트율보다 결과적으로 더 크다. 다른 말로, 제 1 파라미터는 제 2 파라미터보다 신호부 당 더 큰 비트율을 필요로 한다.
본 발명의 목적은 업 믹싱 신호의 사운드를 점차적으로 향상시키고, 0 내지 파라메트릭 방법의 비트율까지의 사이드 정보에 의해 소모된 비트율을 증가시킴으로써 이전 기술 세계 사이의 갭을 브릿징하는 것이다. 즉, 본 발명의 목표는 완전히 파라메트릭 방법과 매트릭스 서라운드 방법 사이의 비트율과 인식된 품질에서의 갭을 브릿징하는 것에 있다. 더 구체적으로, 매트릭스 서라운드(사이드 정보 없는, 제한된 오디오 품질)와 완전히 파라메트릭 복원(완전한 사이드 정보율이 필요로 하고, 좋은 품질) 사이에서 "동작점"을 탄력적으로 선택하는 방법을 제공한다. 이 동작점은 동적으로(즉, 가변적으로), 그리고 개인 적용에 의해 지시된 바와 같이, 허용되는 사이드 정보율에 따라 선택될 수 있다.
공간 오디오 파라미터에 의해 표시되는 멀티 채널 오디오 신호의 일부인 멀티 채널 오디오 신호의 제 1 부분의 크기를 동적으로 선택함으로써, 요구되는 비트율은 넓은 범위 내에 가변될 수 있다. 공간 오디오 파라미터에 의해 멀티 채널 신호의 주요부를 나타내는 것은 인식된 양질의 이득에 비교적 큰 비트율을 소모할 것이다. 멀티 채널 오디오 신호의 제 2 부분에 대해, 적은 비트율을 소모하는 파라미터를 기인하도록 파라미터 유도 규칙이 선택되므로 결과된 전체 비트율은 멀티 채널 신호의 제 2 부분의 크기를 증가시킴으로써 감소될 수 있다. 본 발명의 바람직한 실시예에서, 파라메트릭 데이터는 당연히 가장 비트 절약하는 멀티 채널 신호의 제 2 부분을 위해 전혀 전송되지 않는다. 그러므로, 제 2 부분의 크기에 대해 제 1 부분의 크기를 동적으로 이동함으로써, 비트율(또는, 인식된 품질)은 필요에 동적으로 조정될 수 있다.
본 발명의 바람직한 실시예에서, 다운 믹싱 신호는 매트릭스 호환 방식으로 수신된다. 그러므로, 멀티 채널 오디오 신호의 제 1 부분은 공간 오디오 파라미터르 사용하는 고인식된 품질로 재생되고, 멀티 채널 신호의 제 2 부분은 매트릭스에 의거한 솔루션을 사용하여 재생될 수 있다. 이는 고품질을 필요로 하는 신호의 일부의 고품질 재생되게 한다. 동시에, 전체 비트율은 재생된 신호의 품질보다 덜 생생한 신호 부분의 매트릭스에 의거한 재생에 의존함으로써 감소된다.
본 발명의 다른 바람직한 실시예에서, 본 발명의 개념은 수신된 다운 믹싱 신호의 QMF 표시 내의 디코더측에 적용된다. 업 믹싱 프로세스는 원칙적으로 3개의 단계:
프리 디코릴레이터(pre-de-correlator) 매트릭스의 적용에 의해 입력 신호(QMF 도메인에 수신된 다운 믹싱 신호)를 미리 처리하는 단계;
미리 처리된 신호의 일부를 디코릴레이팅하는 단계; 및
믹스 매트릭스 내에 수신된 신호(미리 처리된 신호 및 디코릴레이팅된 신호)를 믹싱하고, 믹싱의 출력은 업 믹싱 신호의 채널이 되는 단계로 하위 분류될 수 있다.
프리 디코릴레이터뿐만 아니라 믹싱된 매트릭스는 차수, 한편으로 "시간 슬롯의 수"이고 다른 한편으로 "파라미터 대역"의 수로 2차 매트릭스이다. 디코딩 처리에서, 이 매트릭스의 요소는 고간 비트 스트림으로부터 판독된 파라미터로부터 얻어진 값, 즉 제 1 파라메트릭 데이터로 채워진다. 제 1 파라메트릭 데이터가 멀티 채널 신호의 제 1 부분에 대해서만 수신될 때 멀티 채널 신호의 복원의 부분은 종속된 제 1 파라메트릭 데이터를 사용하여 수신될 수 있다. 멀티 채널 신호의 복수의 제 2 부분을 유도하는 매트릭스 요소는 본 발명에 따라, 매트릭스 호환 코딩 설계를 사용하여 유도된다. 그러므로, 이 매트릭스 요소는 다운 믹싱 신호로부터 성취된 지식에만 의거하여 유도되거나 미리 규정된 값으로 대체될 수 있다.
바람직한 실시예에서, 본 발명에 따른 멀티 채널 오디오 디코더는 매트릭스의 일부 또는 멀티 채널 오디오 신호의 일부가 공간 파라미터에 의거한 규칙에 의해 처리되고, 일부가 매트릭스에 의거한 솔루션에 의해 처리되는 전송된 제 1 파라메트릭 데이터의 양에 의해 인식된다.
본 발명의 다른 실시예에서, 오디오 인코더는 멀티 채널 신호의 일부가 매트릭스에 의거한 솔루션 또는 공간 오디오 호환 접근에 의해 처리되고 있는 것을 나타내는 윈도우 정보를 발생시킨다. 윈도우 정보는 멀티 채널 신호의 파라메트릭 표현에 포함된다.
그러므로, 본 발명의 디코더는 윈도우 정보에 의해 나타낸 멀티 채널 오디오 신호의 부분에 적절한 업 믹싱 규칙을 적용하도록 발생된 윈도우 정보를 수신하여 처리할 수 있다.
본 발명의 바람직한 실시예에서, 본 발명의 개념은 신호 처리 동안 QMF 도메인, 즉, 신호가 어느 주파수 대역에 대한 각 표시 홀딩 정보를 다수의 표시에 의해 나타내는 도메인에 적용된다.
본 발명의 다른 바람직한 실시예에서, 사이드 정보 프리 방법(매트릭스에 의거한 접근)은 저주파수부의 적절한 재생을 위한 파라메트릭 정보(즉, 제 1 인코딩 및 디코딩 규칙)를 적용하며(명시적인), 고주파수부에만 적용된다. 이는 고주파수 에 대해서보다 저주파수에 대해서 훨씬 더 용이한 2개의 유사한 신호의 작은 편차(예컨대, 위상 편차)를 고지하는 것을 듣는 인간의 특성 때문에 이득이다.
본 발명의 큰 이득은 매트릭스에 의거한 솔루션으로 공간 오디오 인코딩과 디코딩 설계의 백워드 호환성이 공간 오디오 코더의 인코딩과 디코딩이 적절하게 선택될 때 추가적 하드웨어 또는 소프트웨어를 도입하지 않고 달성되는 것에 있다.
또한, 호환성은 다른 이전 기술 시도의 경우와 같이, 추가적 데이터를 전송하지 않고 달성된다. 본 발명에 따른 코딩 설계는 비트율 또는 품질의 고른 조정 즉, 주어진 신호의 완전한 매트릭스에 의거한 코딩과 완전한 공간 오디오 코딩 사이에 부드러운 변환을 하도록 하는 바와 같이, 매우 탄력적이다. 즉, 적용된 코딩 설계는 필요로 하는 비트율에 대하여 또는 원하는 품질에 대하여 실제의 필요로 조정될 수 있다.
본 발명의 바람직한 실시예는 동봉한 도면을 참조하여 이어서 설명된다.
도 1은 본 발명의 인코더를 도시한다.
도 2는 본 발명의 개념에 의해 생성된 파라미터 비트 스트림의 예를 도시하며, 도 2a는 본 발명의 트랜스코더를 도시한다.
도 3은 본 발명의 디코더를 도시한다.
도 4는 본 발명의 개념을 이행하는 공간 오디오 디코더의 예를 도시한다.
도 5는 디코더측에 다른 코딩 설계의 사용을 도시한다.
도 6은 이전 기술 인코더를 도시한다.
도 7은 이전 기술 디코더를 도시한다.
도 8은 필터 뱅크의 블록도를 도시한다.
도 9는 이전 기술 인코더의 다른 예를 도시한다.
도 1은 본 발명의 멀티 채널 인코더를 도시한다. 멀티 채널 인코더(100)는 파라미터 제너레이터(102) 및 출력 인터페이스(104)를 갖고 있다.
멀티 채널 오디오 신호(106)는 멀티 채널 신호(106)의 제 1 부분(108) 및 제 2 부분(110)이 처리되는 인코더(100)에 입력된다. 파라미터 제너레이터(102)는 제 1 부분(108) 및 제 2 부분(110)을 수신하고 멀티 채널 신호(106)의 공간 특성을 나타내는 공간 파라미터를 유도한다.
공간 파라미터는 멀티 채널 신호(106)의 파라메트릭 표현(112)를 얻는 출력 인터페이스(104)에 전송되어서 파라메트릭 표현(112)가 멀티 채널 신호의 제 1 부분(108)의 제 1 파라메트릭 데이터를 포함하며, 멀티 채널 신호(106)의 제 2 부분(110)에 대해 제 2 파라메트릭 데이터는 제 1 파라메트릭 데이터보다 더 적은 정보를 필요로 하고 또는 파라메트릭 데이터는 파라메트릭 표현(112)에 포함되지 않는다.
멀티 채널 인코더(100)의 몇 개의 변경은 동일한 목표를 달성할 수 있다. 예컨대, 파라미터 제너레이터(102)는 파라메트릭 표현(112)에 다른 파라미터 세트를 결합하는 출력 인터페이스(104)에 전송된 다른 파라미터 세트를 기인한 제 1 부분(108) 및 제 2 부분(110)에 2개의 다른 파라미터 유도 규칙을 적용할 수 있다. 특별하고 바람직한 경우는 디코더측에 디코더가 몇 개의 발견적 규칙에 의해 필요로 하는 디코딩 파라미터를 얻기 때문에, 제 2 부분(110)에 대해 파라미터가 파라 메트릭 표현에 포함되지 않는다[그러므로, 파라미터 제너레이터(102)에 의해 얻어지지 않는다]는 것이다.
다른 가능성은 파라미터 제너레이터(102)가 제 2 부분(110)에 대해서와 같이 제 1 부분(108)에 대해서도 공간 오디오 파라미터의 풀 세트를 얻는다는 것이다. 그러므로, 출력 인터페이스(104)는 제 2 파라메트릭 데이터는 제 1 파라메트릭 데이터보다 더 적은 비트를 필요로 하도록 공간 파라미터를 처리해야만 할 것이다.
또한, 출력 인터페이스(104)는 멀티 채널 신호(106)가 인코딩 동안 제 1 부분(108) 및 제 2 부분(110)으로 분리되는 방법을 디코더로 전송할 파라메트릭 표현(112)에 추가적 윈도우 신호를 추가할 수 있다. 멀티 채널 인코더(100)의 바람직한 실시예의 변경에서, 멀티 채널 인코더(100)는 결정하는 부분 결정기를 추가적으로 가질 수 있으며, 이는 멀티 채널 신호(106)의 일부가 제 1 부분(108)으로서 사용되고 일부가 제 2 부분(110)으로서 사용되며, 결정은 품질 기준에 의거한다.
품질 기준은 파라메트릭 표현(112)에 의거한 멀티 채널 신호(106)의 재생의 인식된 품질을 고려하여 파라메트릭 표현(112)의 결과된 전체 비트율에 대하여 또는 품질 양상에 대하여 얻어질 수 있다.
주요 장점은 품질 기준이 인코딩 동안 어느 때에 겸비되고 필요로 하는 비트율의 전체 재생이 이전 기술 방법과 비교되도록 하여, 파라메트릭 표현에 의해 소모된 비트율이 시간에 있어서 가변될 수 있다는 것이다.
도 2는 본 발명의 인코더에 의해 발생된 파라메트릭 표현(112)의 예를 도시한다.
상술한 바와 같이, 오디오 신호의 처리는 블록 방법으로 행해지며, 즉, 소위 프레임을 제작하는 시간 도메인에서 멀티 채널 신호의 많은 연속적인 샘플이 1단계에서 처리된다. 도 2는 파라미터 비트 스트림, 즉 2개의 연속적인 프레임에 대한 파라메트릭 표현을 도시한다. 파라미터 비트 스트림은 고품질 프레임(120)의 표시 및 저품질 프레임(122)의 표시를 갖고 있다. 고품질 프레임(120)의 인코딩 동안, 파라메트릭 데이터에 의해 나타내고 있는 제 1 부분(108)이 예컨대, 인코딩할 오디오 신(scene)이 다소 복잡할 수 있는 제 2 부분과 비교하여 큰 것이 결정된다. 또한, 도 2의 파라미터 비트 스트림은 멀티 채널 신호(106)의 제 2 부분(110)의 어느 파라메트릭 데이터를 얻지 않는 본 발명의 인코더의 바람직한 실시예가 사용된다는 가정 하에 발생된다. 도 2에 도시될 수 있는 바와 같이, 28개의 공간 파라미터(ICC 및 ICLD)는 고품질 프레임(120)을 설명하기 위해 파라메트릭 표현에 포함된다. 예컨대, 28개의 공간 파라미터는 멀티 채널 신호의 QMF 표시의 저주파수 대역을 설명한다.
저품질 프레임(122)은 원하는 인식된 품질에 충분함에 따라 ICC 및 ICLD를 갖는 21개의 공간 파라미터 세트만을 포함한다.
도 2a는 본 발명의 트랜스코더(150)를 도시한다. 본 발명의 트랜스코더는 멀티 채널 오디오 신호의 제 1 프레임(154) 및 제 2 프레임(156)을 나타내는 공간 파라미터의 풀 세트를 갖는 입력 비트 스트림(152)을 입력으로서 수신한다.
트랜스코더(150)는 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 유지하는 비트 스트림(158)을 발생한다. 도 2a에 도시된 예에서, 트랜스 코더(150)는 제 1 프레임에 대해, 파라미터(160)의 수가 약간 감소되도록 파라메트릭 표현을 얻는다. 입력 파라미터(156)에 대응하는 제 2 프레임을 설명하는 파라미터(162)의 수는 매우 감소되어, 결과된 파라메트릭 표현에 의해 필요한 비트율의 양을 상당히 감소시킨다. 그러므로, 그러한 본 발명의 트랜스코더(150)는 이미 존재하는 공간 파라미터의 비트 스트림이 전송 동안의 적은 비트율 또한 컴퓨터 판독가능한 매체에 저장될 때 적은 저장 공간을 필요로 하는 본 발명의 파라메트릭 표현을 얻도록 후처리하는데 사용될 수 있다. 다른 방향으로 트랜스코딩하며, 즉 공간 파라미터를 발생하기 위해 파라메트릭 표현을 사용하는 트랜스코더를 이행할 수 있다.
본 발명의 트랜스코더(150)는 예컨대, 주어진 규칙으로 파라미터의 양을 감소시키고 또는 수용가능한 제한을 넘어 인식된 품질을 교란시키지 않고 가능한 비트율의 감소를 분석할 멀티 채널 오디오 신호를 추가적으로 수신함으로써 각종 다른 방법으로 이행될 수 있다.
도 3은 프로세서(202)를 갖는 본 발명의 멀티 채널 오디오 디코더(200)를 도시한다.
프로세서는 멀티 채널 오디오 신호로부터 유도된 다운 믹싱 신호(204)를 입력 신호로서 수신하고 있으며, 제 1 파라메트릭 데이터(206)는 멀티 채널 신호의 제 1 부분을 나타내고 있고, 멀티 채널 신호의 제 2 부분에 대해, 임의의 제 2 파라메트릭 데이터(208)는 제 1 파라메트릭 데이터(206)보다 더 적은 비트를 필요로 한다. 프로세서(202)는 중간 신호의 고품질 부분(212)을 유도하는 제 1 유도 규칙 을 사용하는 다운 믹싱 신호(204)로부터 중간 신호(210)를 유도하고 있으며, 중간 신호(212)의 고품질 부분(212)은 멀티 채널 오디오 신호의 제 1 부분에 대응하고 있다. 프로세서(202)는 중간 신호(210)의 제 2 부분(214)의 제 2 유도 규칙을 사용하고 있으며, 제 2 유도 규칙은 제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않고, 제 1 유도 규칙은 제 1 파라메트릭 데이터(206)에 의거한다.
프로세서(202)에 의해 수신된 중간 신호(210)는 고품질 부분(212)과 제 2 부분(214)의 조합으로 구성된다.
멀티 채널 오디오 디코더(200)는 저절로 수신할 수 있으며, 다운 믹싱 신호(204)의 부분은 예컨대, 제 1 파라메트릭 데이터(206)에 포함된 공간 파라미터의 수를 산출하는 어떤 적절한 규칙을 적용함으로써 제 1 파라메트릭 데이터(206)와 함께 처리된다. 대안으로, 프로세서(202)는 인코더측에 수신되고 멀티 채널 오디오 디코더(200)로 추가적으로 전송된 몇개의 추가적 윈도우 정보에 의해 다운 믹싱 신호(204) 내의 조금의 고품질 부분(212)과 제 2 부분(214)을 전송할 수 있다.
바람직한 실시예에서, 제 2 파라메트릭 데이터(208)는 생략되고 프로세서(202)는 다운 믹싱 신호(204)에 이미 포함된 정보로부터 제 2 유도 규칙을 유도한다.
도 4는 공간 오디오 디코더에 본 발명의 매트릭스 호환성 특징을 결합한 본 발명의 다른 실시예를 도시한다. 멀티 채널 오디오 디코더(600)는 프리 디코릴레이터(601), 상관기(602), 및 믹스 매트릭스(603)를 포함한다.
멀티 채널 오디오 디코더(600)는 프리 디코릴레이터(601)로 입력된 입력 신호(605)의 구성에 의거한 다른 방식으로 동작하도록 하는 탄력성 있는 장치이다. 통상, 프리 디코릴레이터(601)는 디코릴레이터(602)에 대한 입력으로서 역할을 하고 디코릴레이터(602)에 의해 산출된 역상관 신호와 함께 입력 신호(608)를 형성하기 위해 변경되지 않으며 부분적으로 전송되는 중간 신호(607)를 수신한다.
1 내지 5 구성에서, 다운 믹싱 신호와 임의의 잔여 신호는 디코릴레이터의 입력으로서 사용되는 4개의 중간 신호(e1 내지 e4)를 유도하는 프리 디코릴레이터(601)에 제공되고, 상기 디코릴레이터는 입력 신호로부터 수신된 직접 전송된 신호(m)와 함께 입력 파라미터(608)를 형성하는 4개의 역상관 신호(d1 내지 d4)를 유도한다.
추가적 잔여 신호가 입력으로서 제공되는 경우, 하위 대역 도메인에서 통상 작용하는 디코릴레이터(602)는 역상관 신호를 유도하는 대신 잔여 신호를 간단히 전송하는데 효과적일 수 있다. 또한, 이는 어느 주파수 대역만에 대한 주파수 선택 방법으로 행해질 수 있다.
2 내지 5 구성에서, 입력 신호(605)는 레프트 채널, 라이트 채널, 및 임의의 잔여 신호를 포함한다. 그 구성에서, 프리 디코릴레이터 매트릭스(601)는 레프트, 라이트, 중앙 채널, 및 추가적으로, 2개의 매개 채널(e1, e2)을 수신한다. 그러므로, 믹스 매트릭스(603)로 입력된 신호는 레프트 채널, 라이트 채널, 중앙 채널, 및 2개의 역상관 신호(d1 내지 d2)로 형성된다.
다른 변경에서, 프리 디코릴레이터 매트릭스는 출력이 신호(e5)로부터 수신 된 역상관 신호(d5)와 역상관 신호(d1 내지 d2)의 조합인 디코릴레이터(D5)에 대한 입력으로서 사용되는 추가적 중간 신호(e5)를 유도할 수 있다. 이 경우에, 추가적 역상관은 중앙 채널과 왼쪽 및 오른쪽 채널 사이에 보장될 수 있다.
본 발명의 오디오 디코더(600)는 2 내지 5 구성에서 본 발명의 개념을 이행한다. 전송된 파라메트릭 표현은 이전 역상관 매트릭스(601) 및 믹스 매트릭스(603)에서 사용된다. 본 발명의 개념은 도 5에서 더 상세하게 도시된 바와 같이, 다른 방법으로 이행될 수 있다.
도 5는 원리 스케치에서, 프리 디코릴레이터 매트릭스(601) 및 믹스 매트릭스(603)로서 이행된 프리 디코릴레이터를 도시하고, 멀티 채널 오디오 디코더(600)의 다른 컴포넌트는 생략된다.
이전 역상관과 믹싱을 행하는데 사용된 매트릭스는 시간 슬롯, 즉, 신호의 각 시간 샘플을 나타내는 열과 다른 파라미터 대역, 즉, 오디오 신호의 1개의 파라미터 대역과 관련된 행을 가진다.
본 발명의 개념에 의하면, 매트릭스(601 및 603)의 매트릭스 구성 요소는 전송된 파라메트릭 데이터로부터 부분적으로만 유도되며, 잔여 매트릭스 구성 요소는 예컨대, 다운 믹싱 신호의 지식에 의거한 디코더에 의해 유도된다. 도 5는 주어진 주파수 경계선(622) 이하에서는 프리 디코릴레이터 매트릭스(601) 및 믹스 매트릭스(603)의 구성 요소가 비트 스트림으로부터 판독되는, 즉, 인코더로부터 전송된 정보에 의거하는 파라미터(620)로부터 유도된다. 주파수 경계선(622) 이상에서는 매트릭스 구성 요소는 다운 믹싱 신호만의 지식에 의거한 디코더에 유도된다.
경계 주파수(또는, 통상: 전송된 데이터로부터 유도된 매트릭스 구성 요소의 양)는 특별 적용 시나리오에 적용되는 품질 및/또는 비트율 제한에 따라 자유롭게 적합하게 될 수 있다.
사이드 정보 프리 업 믹싱 처리가 MPEG 공간 오디오 코딩 기준 모델(0)에 아웃라인된 동일한 구조로 행해질 수 있는 새로운 코딩 방법이 여기에 아웃라인되는 것이 바람직하다. 본 발명은 사이드 정보 프리 업 믹싱에 대한 방법을 설명하는 것으로 구성되지만, 바람직하게, 사이드 정보 보조 업 믹싱에 대한 방법과 함께 그러한 개념의 고르고 이익이 되는 결합에 대한 방법을 제공한다.
MPEG 공간 오디오 코딩 기준 모델(0)과 반대로, 사이드 정보 프리 업 믹싱 처리에서, 매트릭스[M1(601) 및 M2(603)]의 구성요소는 비트 스트림에 전송된 데이터로부터 바람직하게 수신되지 않고, 사이드 정보의 도움없이 다른 방법에 의해, 예컨대, 다운 믹싱 신호로부터 성취된 지식에만 의거한 발견적 규칙을 적용함으로써 수신된다.
이 방법으로, 전송된 파라미터에 의거한 매트릭스의 일부만을 얻고 잔여부를 채우는 사이드 정보 없이 방법의 규칙을 적용함으로써 2개의 기술 - 비트율에 의하여뿐만 아니라 음질 - 사이의 점차적 스케일링을 달성하는 것이 가능하다. 개념적으로 말하면, 이는 디코더에서 공간 파라미터를 발생시키는 매트릭스의 어느 부분에 대해서와 공간 파라미터를 발생시키는 다른 부분에 대해 전송하는 것에 대응한다.
하나 또는 다른 방법으로부터 수신된 매트릭스의 일부의 결정은 이하:
· 하나의 방법에 의해 주어진 수평 경계선 이하에서와 다른 방법에 의해 이 경계선 이상에서 매트릭스의 일부를 유도하는 방법;
· 하나의 방법에 의해 주어진 수직 경계선의 왼쪽과 다른 방법에 의해서 이 경계선의 오른쪽의 매트릭스의 일부를 유도하는 방법;
· 하나의 방법에 의해 수신된 구성 요소를 양쪽 매트릭스 내의 임의의 시간-주파수 타일을 임의로 결정하고 다른 방법으로 잔여 시간-주파수의 구성 요소를 유도하는 방법과 같은 많은 다른 방법으로 행해질 수 있다
공간 파라미터에 의해 어느 경계 주파수까지 멀티 채널 신호의 모든 주파수 부분을 설명하는 것이 이득이지만, 멀티 채널 신호의 잔여 주파수 부분이 공간 파라미터에 의해 나타나지 않음을 상기 문단에 설명되었다. 고주파수의 인식보다 저주파수의 인식이 좋은 사람의 귀의 특성을 고려하고 있다. 물론, 본 발명은 더 정확하게 신호의 고주파수 부분을 설명하는 것이 이득이거나 적절할 수 있는 바와 같이, 제 1 부분과 제 2 부분으로 멀티 채널 신호의 분리에 결코 제한되지 않는다. 이는 구체적으로 대부분의 에너지가 오디오 신호의 고주파수 도메인에 포함되므로 저주파수 영역에서 적은 에너지만 신호에 포함되는 경우일 수 있다. 마스킹 효과로 인하여, 저주파수부는 고주파수에 의해 거의 지배되고 신호의 고주파수부의 고품질 복원에 대한 가능성을 제공하는데 유리할 수 있다.
본 발명의 방법의 어느 이행 필요에 의거하여, 본 발명의 방법은 하드웨어 또는 소프트웨어로 이행될 수 있다. 본 발명의 방법이 행해지도록 프로그래머블 컴퓨터 시스템과 협력하는 디지털 저장 매체, 특히 저장된 전자적으로 판독가능한 제 어 신호를 갖는 디스크, DVD, 또는 CD를 사용하여 이행이 행해질 수 있다. 통상, 그러므로, 본 발명은 머신 판독가능 캐리어에 저장된 프로그램 코드의 컴퓨터 프로그램 제품이며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때 본 발명의 방법을 행하는데 효과적이다. 다른 말로, 그러므로, 본 발명의 방법은 컴퓨터 프로그램이 컴퓨터에서 실행될 때 본 발명의 방법 중 하나 이상을 행하는 프로그램 코드를 갖는 컴퓨터 프로그램이다.
상술한 것이 상세한 실시예를 참조하여 특히 도시되고 설명되었을 지라도, 당업자는 형상과 세부 사항의 각종 다른 변경이 본 발명의 정신과 범위를 벗어나지 않고 이루어질 수 있다는 것을 이해할 것이다. 각종 변경이 본원에 기재되고 이하 청구항에 의해 포함된 넓은 개념을 벗어나지 않고 다른 실시예에 개조될 수 있다는 것이 이해되어야 한다.

Claims (26)

  1. 오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 멀티 채널 오디오 디코더로서, 상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 상기 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 멀티 채널 오디오 디코더에 있어서:
    상기 오디오 신호로부터 중간 신호를 유도하고,
    상기 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하고 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하고,
    상기 중간 신호의 제 2 부분을 유도하고 파라메트릭 데이터를 사용하지 않거나 제 2 파라메트릭 데이터를 사용하는 제 2 유도 규칙을 사용하는 프로세서를 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  2. 제 1 항에 있어서,
    상기 멀티 채널 신호의 시간부 또는 주파수부를 나타내고 있는 제 1 파라메트릭 데이터를 처리하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  3. 제 1 항에 있어서,
    상기 멀티 채널 오디오 신호의 시간부의 설명을 포함하고 있는 제 1 파라메트릭 데이터를 처리하기 위해 동작되고, 상기 멀티 채널 오디오 신호의 소정 주파수 대역에 대한 정보만이 상기 설명 내에 포함되어 있는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  4. 제 1 항에 있어서,
    상기 프로세서는 저주파수 제한으로부터 고주파수 제한까지를 범위로 하는 상기 중간 신호의 주파수부를 유도하기 위한 제 1 유도 규칙을 사용하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  5. 제 4 항에 있어서,
    적어도 고주파수 제한을 시그널링하는 윈도우 정보를 추가적으로 처리하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  6. 제 4 항에 있어서,
    윈도우 평가 규칙을 사용하는 제 1 파라메트릭 데이터로부터 적어도 고주파수 제한을 유도하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  7. 제 6 항에 있어서,
    상기 윈도우 평가 규칙은 다운 믹싱 신호의 신호부에 종속된 파라메트릭 데이터의 양을 카운팅하는 것 및 카운팅된 양의 파라메트릭 데이터를 아주 적은 양의 파라메트릭 데이터와 비교하는 것을 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  8. 제 1 항에 있어서,
    상기 프로세서는 다운 믹싱 신호에 대한 정보 또는 상기 파라메트릭 데이터로부터 제 2 유도 규칙을 산출하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  9. 제 1 항에 있어서,
    상기 프로세서는 상기 제 2 유도 규칙으로서 미리 규정된 규칙을 사용하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  10. 제 1 항에 있어서,
    공간 오디오 파라미터의 이하 리스트:
    ICC(인터 채널 코릴레이션)
    CLD(채널 레벨 차이)
    CPC(채널 예측 계수)
    로부터 선택된 1개 이상의 공간 오디오 파라미터를 포함하고 있는 파라메트 릭 데이터를 처리하기 위해 동작되는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  11. 제 1 항에 있어서,
    디코릴레이션 필터를 사용하는 상기 중간 신호로부터 디코릴레이팅된 신호를 유도하기 위해 디코릴레이터를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  12. 제 1 항에 있어서,
    상기 멀티 채널 신호의 복원을 산출하고,
    상기 멀티 채널 신호의 제 1 부분에 대응하는 멀티 채널 신호의 복원의 제 1 부분을 산출하고 상기 제 1 파라메트릭 데이터에 의거하고 있는 제 1 업 믹싱 규칙을 사용하며,
    상기 멀티 채널 신호의 복원의 제 2 부분을 산출하고 파라메트릭 데이터를 사용하지 않거나 제 2 파라메트릭 데이터를 사용하는 제 2 업 믹싱 규칙을 사용하는 업믹서를 더 포함하는 것을 특징으로 하는 멀티 채널 오디오 디코더.
  13. 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 멀티 채널 인코더에 있어서:
    공간 파라미터를 발생시키는 파라미터 제너레이터; 및
    상기 파라메트릭 표현을 발생시키는 출력 인터페이스를 포함하며;
    상기 파라미터 제너레이터 또는 상기 출력 인터페이스는 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키고;
    상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 멀티 채널 인코더.
  14. 제 13 항에 있어서,
    상기 출력 인터페이스는 상기 파라메트릭 표현에서 멀티 채널 오디오 신호의 제 1 부분을 나타내는 윈도우 정보를 더 포함하도록 된 것을 특징으로 하는 멀티 채널 인코더.
  15. 제 13 항에 있어서,
    상기 멀티 채널 신호의 부분이 품질 기준을 이용하여 제 1 부분으로 사용되는 것을 결정하는 부분 결정기를 더 포함하는 것을 특징으로 하는 멀티 채널 인코더.
  16. 제 15 항에 있어서,
    상기 부분 결정기는 파라메트릭 표현을 사용하는 멀티 채널 신호의 복원 품질이 품질 허용 범위 내에 있는 것을 결정하기 위해 동작되는 것을 특징으로 하는 멀티 채널 인코더.
  17. 제 15 항에 있어서,
    상기 부분 결정기는 파라메트릭 표현에 의해 소모된 저장 공간의 최대량이 초과되지 않는 것을 결정하기 위해 동작되는 것을 특징으로 하는 멀티 채널 인코더.
  18. 제 13 항에 있어서,
    상기 멀티 채널 신호로부터 다운 믹싱 신호를 유도하는 다운 믹서를 더 포함하며,
    상기 출력 인터페이스는 다운 믹싱 신호를 더 출력하도록 된 것을 특징으로 하는 멀티 채널 인코더.
  19. 제 18 항에 있어서,
    상기 파라미터 제너레이터는 멀티 채널 신호의 제 1 부분과 제 2 부분에 대한 풀 세트 공간 파라미터를 발생시키기 위해 동작되며,
    상기 다운 믹서는 풀 세트 공간 파라미터에 의거하고 있는 풀 다운 믹싱 규 칙을 사용하는 다운 믹싱 신호를 유도하기 위해 동작되고,
    상기 출력 인터페이스는 멀티 채널 신호의 제 1 부분에 대응하는 적어도 공간 파라미터를 사용하는 파라메트릭 표현을 발생시키기 위해 동작되는 것을 특징으로 하는 멀티 채널 인코더.
  20. 오디오 신호를 처리하고 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법으로서, 상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 오디오 신호 및 제 1 파라메트릭 데이터를 처리하는 방법에 있어서:
    상기 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용한 다운 믹싱 신호로부터 중간 신호를 유도하는 단계; 및
    제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 및 제 1 파라메트릭 데이터를 처리하는 방법.
  21. 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법에 있어서:
    공간 파라미터를 발생시키는 단계; 및
    파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 단계를 포함하며:
    상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 파라메트릭 표현을 발생시키는 방법.
  22. 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현에 있어서:
    상기 파라메트릭 표현은 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하며;
    상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 포함되지 않거나 제 2 파라메트릭 데이터가 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부의 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 파라메트릭 표현.
  23. 제 23 항에 있어서,
    컴퓨터 판독가능한 저장 매체에 저장되는 것을 특징으로 하는 파라메트릭 표현.
  24. 컴퓨터를 실행할 때 오디오 신호를 처리하는 방법과 멀티 채널 신호의 제 1 부분을 나타내는 제 1 파라메트릭 데이터를 처리하는 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램으로서, 상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 처리되지 않거나 제 2 파라메트릭 데이터가 처리되며, 상기 제 2 파라메트릭 데이터가 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 프로그램 코드를 갖는 컴퓨터 프로그램에 있어서:
    상기 방법은,
    상기 멀티 채널 오디오 신호의 제 1 부분에 대응하는 중간 신호의 제 1 부분을 유도하는 제 1 파라메트릭 데이터에 의거하고 있는 제 1 유도 규칙을 사용하는 다운 믹싱 신호로부터 중간 신호를 유도하는 단계; 및
    제 2 파라메트릭 데이터를 사용하거나 파라메트릭 데이터를 사용하지 않는 제 2 유도 규칙을 사용하는 중간 신호의 제 2 부분을 유도하는 단계를 포함하는 것을 특징으로 하는 프로그램 코드를 갖는 컴퓨터 프로그램.
  25. 컴퓨터를 실행할 때 멀티 채널 오디오 신호의 공간 특성을 나타내는 파라메트릭 표현을 발생시키는 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램에 있어서:
    상기 방법은,
    상기 공간 파라미터를 발생시키는 단계; 및
    상기 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 제 1 파라메트릭 데이터를 포함하도록 상기 파라메트릭 표현을 발생시키는 단계를 포함하며;
    상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되며, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 프로그램 코드를 갖는 컴퓨터 프로그램.
  26. 멀티 채널 오디오 신호의 공간 특성을 나타내는 공간 파라미터를 사용하는 멀티 채널 오디오 신호의 파라메트릭 표현을 발생시키는 트랜스코더에 있어서:
    상기 파라메트릭 표현이 멀티 채널 신호의 제 1 부분의 공간 파라미터로부터 유도된 제 2 파라메트릭 데이터를 포함하도록 파라메트릭 표현을 발생시키는 파라미터 제너레이터를 포함하며;
    상기 멀티 채널 신호의 제 2 부분에 대해서는 파라메트릭 데이터가 파라메트릭 표현에 포함되지 않거나 제 2 파라메트릭 데이터가 파라메트릭 표현에 포함되고, 상기 제 2 파라메트릭 데이터는 멀티 채널 신호의 동일부를 나타낼 때 제 1 파라메트릭 데이터보다 더 적은 정보 유닛을 필요로 하는 것을 특징으로 하는 트랜스코더.
KR1020087002860A 2005-07-19 2006-06-21 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체 KR100946688B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US70100105P 2005-07-19 2005-07-19
US60/701,001 2005-07-19
US11/323,965 2005-12-29
US11/323,965 US20070055510A1 (en) 2005-07-19 2005-12-29 Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding

Publications (2)

Publication Number Publication Date
KR20080032146A true KR20080032146A (ko) 2008-04-14
KR100946688B1 KR100946688B1 (ko) 2010-03-12

Family

ID=36873210

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087002860A KR100946688B1 (ko) 2005-07-19 2006-06-21 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체

Country Status (21)

Country Link
US (2) US20070055510A1 (ko)
EP (6) EP4307125B1 (ko)
JP (1) JP5265358B2 (ko)
KR (1) KR100946688B1 (ko)
CN (1) CN101223578B (ko)
AU (1) AU2006272127B2 (ko)
BR (1) BRPI0616019B1 (ko)
CA (1) CA2614384C (ko)
DK (1) DK3404656T3 (ko)
ES (2) ES2952871T3 (ko)
FI (4) FI3404656T3 (ko)
HU (1) HUE064455T2 (ko)
IL (1) IL188425A0 (ko)
MX (1) MX2008000828A (ko)
MY (1) MY149198A (ko)
NO (1) NO342863B1 (ko)
PL (2) PL1908056T3 (ko)
PT (5) PT1908056T (ko)
RU (1) RU2382418C2 (ko)
TW (1) TWI339028B (ko)
WO (1) WO2007009548A1 (ko)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
ES2433316T3 (es) * 2005-07-19 2013-12-10 Koninklijke Philips N.V. Generación de señales de audio de multiples canales
JP5111375B2 (ja) 2005-08-30 2013-01-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
KR100857107B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
CN101278598B (zh) * 2005-10-07 2011-05-25 松下电器产业株式会社 音频信号处理装置以及音频信号处理方法
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
US7873424B1 (en) * 2006-04-13 2011-01-18 Honda Motor Co., Ltd. System and method for optimizing digital audio playback
EP2082397B1 (en) * 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
JP5270557B2 (ja) * 2006-10-16 2013-08-21 ドルビー・インターナショナル・アクチボラゲット 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
JP5270566B2 (ja) * 2006-12-07 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
WO2009060498A1 (ja) 2007-11-06 2009-05-14 Fujitsu Limited 多地点間音声通話装置
US8548615B2 (en) * 2007-11-27 2013-10-01 Nokia Corporation Encoder
RU2010132201A (ru) 2008-01-01 2012-02-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) Способ и устройство для обработки сигнала
JP5202090B2 (ja) * 2008-05-07 2013-06-05 アルパイン株式会社 サラウンド生成装置
CA2721702C (en) * 2008-05-09 2016-09-27 Nokia Corporation Apparatus and methods for audio encoding reproduction
JP5551695B2 (ja) 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
RU2509442C2 (ru) * 2008-12-19 2014-03-10 Долби Интернэшнл Аб Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток
EP2214161A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
MX2011006248A (es) * 2009-04-08 2011-07-20 Fraunhofer Ges Forschung Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase.
TWI444989B (zh) * 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9183842B2 (en) * 2011-11-08 2015-11-10 Vixs Systems Inc. Transcoder with dynamic audio channel changing
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
KR102173422B1 (ko) * 2012-11-15 2020-11-03 가부시키가이샤 엔.티.티.도코모 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
WO2014108738A1 (en) * 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder
CN105103229B (zh) * 2013-01-29 2019-07-23 弗劳恩霍夫应用研究促进协会 用于产生频率增强音频信号的译码器、译码方法、用于产生编码信号的编码器以及使用紧密选择边信息的编码方法
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
JP6105159B2 (ja) 2013-05-24 2017-03-29 ドルビー・インターナショナル・アーベー オーディオ・エンコーダおよびデコーダ
WO2014191793A1 (en) * 2013-05-28 2014-12-04 Nokia Corporation Audio signal encoder
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
CN117037810A (zh) 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
RU2648632C2 (ru) 2014-01-13 2018-03-26 Нокиа Текнолоджиз Ой Классификатор многоканального звукового сигнала
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
CN110992964B (zh) * 2014-07-01 2023-10-13 韩国电子通信研究院 处理多信道音频信号的方法和装置
KR102219752B1 (ko) * 2016-01-22 2021-02-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 채널 간 시간 차를 추정하기 위한 장치 및 방법
DE102016214923B4 (de) 2016-08-11 2023-08-17 Continental Reifen Deutschland Gmbh Schwefelvernetzbare Kautschukmischung und deren Verwendung
EP3669556B1 (en) * 2017-10-16 2022-06-08 Sony Europe B.V. Audio processing
CN118197326A (zh) * 2018-02-01 2024-06-14 弗劳恩霍夫应用研究促进协会 使用混合编码器/解码器空间分析的音频场景编码器、音频场景解码器及相关方法
CA3193359A1 (en) 2019-06-14 2020-12-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Parameter encoding and decoding

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4799260A (en) * 1985-03-07 1989-01-17 Dolby Laboratories Licensing Corporation Variable matrix decoder
KR960012475B1 (ko) * 1994-01-18 1996-09-20 대우전자 주식회사 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
DE19900961A1 (de) 1999-01-13 2000-07-20 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Wiedergabe von Mehrkanaltonsignalen
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
AU2001288528B2 (en) * 2000-08-31 2006-09-21 Dolby Laboratories Licensing Corporation Method for apparatus for audio matrix decoding
JP2002311994A (ja) * 2001-04-18 2002-10-25 Matsushita Electric Ind Co Ltd ステレオオーディオ信号符号化方法及び装置
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2268340T3 (es) 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
RU2363116C2 (ru) 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
BR0305555A (pt) * 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
JP2004252068A (ja) * 2003-02-19 2004-09-09 Matsushita Electric Ind Co Ltd デジタルオーディオ信号の符号化装置及び方法
CN1765153A (zh) 2003-03-24 2006-04-26 皇家飞利浦电子股份有限公司 表示多信道信号的主和副信号的编码
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE474310T1 (de) * 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
EP1913578B1 (en) * 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal

Also Published As

Publication number Publication date
HUE064455T2 (hu) 2024-03-28
TW200723712A (en) 2007-06-16
EP4307124B1 (en) 2024-08-07
AU2006272127A1 (en) 2007-01-25
PT3404656T (pt) 2023-10-09
EP4307125A2 (en) 2024-01-17
DK3404656T3 (da) 2023-09-25
FI4307125T3 (fi) 2024-08-27
JP5265358B2 (ja) 2013-08-14
CA2614384C (en) 2012-07-24
FI4307126T3 (fi) 2024-08-27
ES2690278T3 (es) 2018-11-20
MY149198A (en) 2013-07-31
CA2614384A1 (en) 2007-01-25
MX2008000828A (es) 2008-03-19
US8180061B2 (en) 2012-05-15
TWI339028B (en) 2011-03-11
BRPI0616019B1 (pt) 2019-11-19
PL3404656T3 (pl) 2024-06-17
EP3404656A1 (en) 2018-11-21
KR100946688B1 (ko) 2010-03-12
FI3404656T3 (fi) 2023-09-25
NO342863B1 (no) 2018-08-20
EP4307126B1 (en) 2024-07-31
JP2009501948A (ja) 2009-01-22
PT4307125T (pt) 2024-09-26
EP4235440A3 (en) 2023-10-25
PT4307126T (pt) 2024-09-26
RU2382418C2 (ru) 2010-02-20
EP1908056A1 (en) 2008-04-09
PT1908056T (pt) 2018-11-07
PT4307124T (pt) 2024-09-05
EP4307126A2 (en) 2024-01-17
BRPI0616019A2 (pt) 2011-06-07
EP4307125A3 (en) 2024-03-27
WO2007009548A1 (en) 2007-01-25
ES2952871T3 (es) 2023-11-06
EP1908056B1 (en) 2018-08-01
AU2006272127B2 (en) 2010-02-04
EP3404656B1 (en) 2023-06-28
IL188425A0 (en) 2008-11-03
PL1908056T3 (pl) 2019-01-31
EP4307124A3 (en) 2024-03-27
CN101223578B (zh) 2011-12-14
US20070055510A1 (en) 2007-03-08
US20070019813A1 (en) 2007-01-25
EP4307126A3 (en) 2024-03-27
FI4307124T3 (fi) 2024-08-27
EP4235440A2 (en) 2023-08-30
RU2008106225A (ru) 2009-08-27
NO20080850L (no) 2008-04-17
EP4307125B1 (en) 2024-08-07
CN101223578A (zh) 2008-07-16
EP4307124A2 (en) 2024-01-17

Similar Documents

Publication Publication Date Title
KR100946688B1 (ko) 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체
US8654985B2 (en) Stereo compatible multi-channel audio coding
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP5934922B2 (ja) 復号装置
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
RU2576476C2 (ru) Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции
EP1913577B1 (en) Apparatus for encoding an audio signal and method thereof
EP1977417B1 (en) Method and system for decoding a multi-channel signal
RU2382419C2 (ru) Многоканальный кодер
JP5490143B2 (ja) ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム
JP2010521002A (ja) 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
KR20100048202A (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130228

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140303

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150302

Year of fee payment: 6