KR20080103094A - 감소된 개수의 채널 디코딩 - Google Patents

감소된 개수의 채널 디코딩 Download PDF

Info

Publication number
KR20080103094A
KR20080103094A KR1020087023893A KR20087023893A KR20080103094A KR 20080103094 A KR20080103094 A KR 20080103094A KR 1020087023893 A KR1020087023893 A KR 1020087023893A KR 20087023893 A KR20087023893 A KR 20087023893A KR 20080103094 A KR20080103094 A KR 20080103094A
Authority
KR
South Korea
Prior art keywords
channels
channel
parameter
parameters
signal
Prior art date
Application number
KR1020087023893A
Other languages
English (en)
Other versions
KR101002835B1 (ko
Inventor
라르스 빌레모에스
크리스토퍼 크졸링
예로엔 브리에바트
Original Assignee
돌비 스웨덴 에이비
코닌클리즈케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 스웨덴 에이비, 코닌클리즈케 필립스 일렉트로닉스 엔.브이. filed Critical 돌비 스웨덴 에이비
Publication of KR20080103094A publication Critical patent/KR20080103094A/ko
Application granted granted Critical
Publication of KR101002835B1 publication Critical patent/KR101002835B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

전송된 다운믹스(downmix) 신호를 상기 중간 채널 표현(intermediate channel presentation)으로 업믹싱(upmixing)하기 위한 업밉스 파라미터(upmix parameter)들이 도출되어 상기 멀티 채널 재구성(multi channel reconstruction) 내부에서와 동일한 업믹싱 알고리즘들을 이용하는 업믹스를 허용할 때, 멀티 채널 신호의 중간 채널 표현은 매우 효율적이고 충실하게 재구성될 수 있다.
이는, 파라미터 재계산기(parameter recalculator)가 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 파라미터들 또한 고려하는 업믹스 파라미터들을 도출하도록 이용될 때, 달성될 수 있다.
업믹스, 다운믹스, 중간 채널 표현, 파라미터 계산기, 파라미터 재계산기

Description

감소된 개수의 채널 디코딩{REDUCED NUMBER OF CHANNELS DECODING}
본 발명은 오디오 신호들의 디코딩에 관한 것으로서, 특히 원래(original) 멀티 채널 신호의 채널들의 수보다 더 작은 수의 채널들로, 원래의 멀티 채널 신호(original multi-channel signal)를 파라메트릭 멀티 채널 다운믹스(parametric multi-channel downmix)하여 디코딩(decoding)하는 것에 관한 것이다.
오디오 코딩(audio coding)에 있어서의 최근의 발전은 스테레오(또는 모노) 신호와 해당 제어 데이터(control data)에 기초하여 오디오 신호의 멀티 채널 표현을 재현하는 것을 가능하게 한다. 이러한 방법들은, 전송된 모노 또는 스테레오 채널들에 기초하여 서라운드(surround) 채널들을 재현-여기서, 이러한 재현은 업믹스(upmix)라고도 불려짐-하는 것을 제어하도록 하는 부가적인 제어 데이터가 전송되기 때문에, 실질적으로 돌비 프롤로직(Dolby Prologic)과 같은 더 오래된 행렬 기반 솔루션(solution)들과는 다르다.
그래서, 이러한 파라메트릭 멀티 채널 오디오 디코더, 예를 들어 MPEG 서라운드는 M 개의 전송된 채널들과 부가적인 제어 데이터에 기초하여 N 개-여기서, N>M임-의 채널들을 재구성한다. 부가적인 제어 데이터는 모든 N 채널들을 전송하는 것보다 상당히 낮아진 데이터율(data rate)을 나타내며, 이는 M 채널 장치들과 N 채널 장치들 양자와 호환성을 동시에 확보하면서 코딩을 매우 효율적이 되도록 한다.
이러한 파라메트릭 서라운드 코딩 방법들은 대개 IID(Inter Channel Intensity Difference)와 ICC(Inter Channel Coherence)에 기반한 서라운드 신호의 파라미터화(parameterization)를 포함한다. 이러한 파라미터들은 업믹스 프로세스에서 채널쌍(channel pair)들의 전력비(power ratio)들과 상관관계(correlation)를 기술한다. 종래 기술에서도 이용되는 추가적인 파라미터들은 업믹스 과정에서 중간(intermediate) 또는 출력 채널들을 예측하는 예측 파라미터(predicition parameter)들을 포함한다.
그러한 멀티 채널 코딩의 유명한 두 예는 BCC 코딩과 MPEG 서라운드이다. BCC 인코딩에서, 많은 오디오 입력 채널들이 오버래핑(overlapping) 윈도우(window)들을 갖는 DFT(Discrete Fourier Transform, 이산 푸리에 변환) 기반의 변환을 이용하여 스펙트럴 표현(spectral representation)으로 변환된다. 다음으로, 결과적으로 일정한(uniform) 스펙트럼이 비-오버래핑(non-overlapping) 파티션(partition)들로 나뉘어진다. 각 파티션은 직사각형의 등가 대역폭(ERB: Equivalent Rectangular Bandwidth)에 비례하는 대역폭을 갖는다. 그리고 나서, ICLD(Inter-Channel Level Difference) 및 ICTD(Inter-Channel Time Difference)라고 불리는 공간 파라미터(spatial parameter)들이 각 파티션에 대하여 추정된다. ICLD 파라미터는 두 채널들 간의 레벨 차이를 기술하고, ICTD 파라미터는 서로 다른 채널들의 두 신호들 간의 시간 차이(위상 차이)를 기술한다. 위 레벨 차이들과 시간 차이들은 공용 참조 채널(common reference channel)에 관하여 각 채널에 주어진다. 이러한 파라미터들의 도출 이후에, 파라미터들이 전송을 위하여 양자화되고 인코딩된다.
개개의 파라미터들은 BCC-코딩에 있어서 하나의 싱글 참조 채널(single reference channel)에 관하여 추정된다. 다른 파라메트릭 서라운드 코딩 시스템들 예를 들어, MPEG 서라운드에서는 트리 구조의 파라미터화가 이용된다. 이는 파라미터들이 더 이상 하나의 싱글 공용 참조 채널에 대해서 추정되지 않고, 원래의 멀티 채널 신호의 채널들의 결합(combination)일 수 있는 다른 참조 채널들에 관하여 추정된다는 것을 의미한다. 예를 들면, 5.1 채널 신호의 경우에는, 파라미터들이 전방 채널들의 결합(combination) 간에 그리고 후방 채널들의 결합(combination) 간에 추정될 수 있다.
물론, 이미 확립되어 있는 오디오-표준에 대한, 후방 호환성은 파라메트릭 코딩 방식들에 대해서도 매우 바람직하다. 예를 들어, 모노-다운믹스(mono-downmix) 신호의 경우에는, 매우 높은 충실도로 스테레오-재생 신호를 생성할 수 있는 가능성을 또한 제공하는 것이 바람직하다. 이는, 부가적인 전송된 파라미터들을 가장 좋은 가능한 방식으로 이용하여, 모노포닉 다운믹스(monophonic downmix) 신호가 스테레오 신호로 업믹싱되어야 하는 것을 의미한다.
멀티 채널 코딩에서의 하나의 통상적인 문제점은 업믹스에서의 에너지 보존인데, 이는 음원(sound-source)의 공간적 위치(spatial position)에 대한 인간의 인지가 신호의 세기 즉, 신호 내에 포함된 에너지에 의해 좌우되기 때문이다. 그 런 이유로, 신호의 재생에 있어서 재구성된 신호의 인지되는 품질을 강하게 감소시키는 아티팩트(artifact)들을 창출하기 위해, 적절한 세기가 각 재구성된 채널에 부여되도록 하기 위해서는 극도의 조치가 취해져야 한다. 다운믹스를 하는 동안 통상적으로 신호들의 크기(amplitude)들이 합산되므로, 간섭(interference)의 가능성이 생기며, 이는 상관관계(correlation)- 또는 간섭(coherence) 파라미터에 의해 기술된다.
감소된 개수의 채널들(원래의 개수의 멀티 채널 신호의 채널들보다 더 적은 개수의 채널들)의 재구성에 관하여 말하자면, 동일한 싱글 참조 채널에 관하여 모든 파라미터가 전송되기 때문에, BCC와 같은 방식들은 다루기에 간단하다. 그런 까닭에, 참조 채널에 관한 정보를 가지면, 가장 관련있는 레벨 정보(절대적인 에너지 측정)가 업믹스를 위해 필요한 모든 채널에 대하여 쉽게 도출될 수 있다. 그래서, 감소된 개수의 채널들이, 먼저 전체(full) 멀티 채널 신호의 재구성없이 재구성될 수 있다. 이에, 멀티 채널 신호의 에너지들에 대한 에너지 연산들은 BCC에서 변수들의 곱(product)보다는 싱글 변수들을 이용함에 의해 더 용이하지만, 이는 단지 첫 단계일 뿐이다. 감소된 수의 채널들-여기서, 감소된 수의 채널들은 가능한 한 근접하게 원래의 멀티 채널 신호들의 부분적인 다운믹스들이어야 함.-의 에너지들과 상관관계들의 도출에 관하여 말하자면, MPEG 서라운드와 BCC에 있어서의 난이도의 레벨이 비교될만 하다.
대조적으로 또, MPEG 서라운드와 같은 트리 기반 구조(tree-based structure)는 파라미터화를 이용하는데, 이러한 파라미터화의 경우에는 각 개개 채 널에 대한 관련 정보가 싱글 파라미터에 포함되지는 않는다. 그러한 이유로, 종래 기술에서, 감소된 개수의 채널들을 재구성하는 것은, 에너지 보존 요구 사항(energy preservation requirement)을 위반하지 않기 위해, 감소된 개수의 채널들로의 다운믹스가 뒤따르는 멀티 채널 신호의 재구성을 필요로 한다. 이는 매우 높은 연산 복잡도라는 명백한 단점을 가진다.
본 발명의 목적은 파라메트릭 멀티 채널 신호로부터 감소된 개수의 채널들을 좀 더 효율적으로 생성하기 위한 개념을 제공하는 것이다.
본 발명의 제1 면에 따라서, 본 목적은, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현(intermediate channel representation)-여기서, 상기 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱(upmixing)하기 위한 업믹스 파라미터들을 도출하기 위한 파라미터 계산기(parameter calculator)로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성(spatial property)들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하며, 상기 파라미터 계산기는, 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 업믹스 파라미터들을 도출하기 위한 파라미터 재계산기(parameter recalculator)를 포함하는 파라미터 계산기에 의해 달성된다.
본 발명의 제2 면에 따라서, 본 목적은, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 도출하기 위한 파라미터 계산기로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터 계산기에 있어서, 상기 중간 채널 표현들에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 업믹스 파라미터들을 도출하기 위한 파라미터 재계산기를 포함하는 파라미터 계산기; 및 상기 업믹스 파라미터들과 상기 다운믹스 신호를 이용하여 상기 중간 채널 표현을 도출하기 위한 업믹서를 포함하는 채널 재구성 장치(channel reconstructor)에 의해 달성된다.
본 발명의 제3 면에 따라서, 본 목적은, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 생성하기 위한 방법으로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 업믹스 파라미터들을 생성하기 위한 방법에 있어서, 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하는 과정을 포함하는 업믹스 파라미터들을 생성하기 위한 방법에 의해 달성된다.
본 발명의 제4 면에 따라서, 본 목적은, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 도출하기 위한 파라미터 계산기를 포함하는 오디오 수신기(audio receiver) 또는 오디오 재생장치(audio player)로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 오디오 수신기 또는 오디오 재생장치에 있어서, 상기 파라미터 계산기는, 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하기 위한 파라미터 재계산기를 포함하는, 오디오 수신기 또는 오디오 재생 장치에 의해 달성된다.
본 발명의 제5 면에 따라서, 본 목적은, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 생성하기 위한 방법을 포함하는, 수신 또는 오디오 재생 방법으로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 수신 또는 오디오 재생 방법에 있어서, 상기 수신 또는 오디오 재생 방법은, 상기 중간 채널 표현에 포함되지 않은 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하는 과정을 포함하는 수신 또는 오디오 재생 방법에 의해 달성된다.
본 발명은, 전송된 다운믹스 신호를 상기 중간 채널 표현으로 업믹싱하기 위한 업밉스 파라미터들이 도출되어 상기 멀티 채널 재구성 내부에서와 동일한 업믹싱 알고리즘들을 이용하는 업믹스를 허용할 때, 멀티 채널 신호의 중간 채널 표현은 매우 효율적이고 충실하게 재구성될 수 있다는 연구 결과에 기초한다. 이는, 파라미터 재계산기가 중간 채널 표현에 포함되지 않은 채널들에 관한 정보를 포함하는 파라미터들을 또한 고려하여 업믹스 파라미터들을 도출하도록 이용될 때, 달성될 수 있다.
본 발명의 일 실시예에서, 디코더는 5-채널 멀티 채널 신호의 파라메트릭 다운믹스로부터 스테레오 출력 신호를 재구성할 수 있는데, 파라메트릭 다운믹스는 모노포닉 다운믹스 신호 및 관련된 멀티 채널 파라미터들을 포함한다. 본 발명에 따르면, 공간 파라미터들은 스트레오 신호의 업믹스를 위한 업믹스 파라미터들을 도출하기 위해 결합(combine)되는데, 여기서 결합(combination)은 또한 좌측 전방 채널 또는 우측 전방 채널에는 관련되지 않은 멀티 채널 파라미터들을 고려한다. 그래서, 업믹싱된 스테레오 채널들의 절대적인 전력값들이 도출될 수 있고 좌측 채널과 우측 채널 간의, 멀티 채널 신호에 대한 높은 충실도의 스테레오 재구성을 허용하는 간섭(coherence) 측정치가 도출된다. 게다가, 이미 존재하는 알고리즘들과 구현들을 이용하여 업믹싱을 허용하는 ICC 파라미터와 CLD 파라미터가 도출된다. 재구성된 스테레오 채널들과 관련되지 않은 채널들의 파라미터들을 이용하는 것은 더 높은 정확도로 신호 내의 에너지를 보존하는 것을 허용한다. 이것이 가장 중요한 점인데, 이는 억제되지 않는 음 크기 변화(loudness variation)들이 재생 신호의 품질을 가장 많이 방해하기 때문이다.
일반적으로, 본 발명의 개념의 애플리케이션은, 종래 기술의 방법들에서와 같이, 멀티 채널 신호의 중간 전체 재구성의 필요없이 멀티 채널 신호의 모노-다운믹스로부터 스테레오 업믹스의 재구성을 허용한다. 명백히, 디코더 측의 계산 복잡도는 이로써 상당히 감소될 수 있다. 업믹스(즉, 좌측 전방 및 우측 전방 채널)에 포함되지 않는 채널들에 관련된 멀티 채널 파라미터들을 또한 이용하는 것은, 다른 부가적인 아티팩츠(artifacts) 또는 음 크기 변화(loudness variation)들을 창출하지 않고, 대신에 신호의 에너지를 완벽하게 보존하는 재구성을 허용한다. 좀 더 구체적으로는, 좌측 및 우측 재구성된 채널 간의 에너지 비는, 좌측 전방 채널과 우측 전방 채널과 관련되지 않은 멀티 채널 파라미터들을 고려하여 많은 이용 가능한 멀티 채널 파라미터들로부터 계산된다. 명백히, 좌측 재구성된 (업믹싱된) 채널과 우측 재구성된 (업믹싱된) 채널들 간의 음 세기(loudness) 비율은 재구성된 스테레오 신호의 청취감에 따라 좌우된다. 본 발명의 개념이 없이는, 정밀하게 정확한 에너지 비율을 갖는 채널들의 재구성이 본 명세서에서 논의된 트리 기반 구조들에서 가능하지 않다.
그래서, 본 발명의 개념을 구현하는 것은 멀티 채널 파라미터들에 기초한 멀티 채널 신호의 다운믹스를 높은 품질로 스테레오-재생하는 것을 허용하는데, 이러한 멀티 채널 파라미터들은 스트레오 신호의 정확한 재생을 위해 도출되지는 않는다.
본 발명의 개념은 또한 재생된 채널들의 수가 둘이 아닐 때 이용될 수 있는데, 예를 들면 몇몇 재생 환경의 경우와 같이, 중앙 채널이 또한 높은 충실도를 가지고 재구성될 수 있는 때이다.
이하에서는, 본 발명의 개념의 높은 이득을 설명하기 위해 종래 기술의 멀티 채널 인코딩 방식들(특히 트리 기반 구조의 방식들)의 좀 더 상세한 재검토를 제공할 것이다.
본 발명의 바람직한 실시예들은 첨부한 도면들을 참조하여 이어서 설명하며, 여기서,
도 1은 트리 기반 파라미터화에 대한 예들을 나타낸다.
도 2는 트리 구조의 디코딩 방식들에 대한 예들을 나타낸다.
도 3은 종래 기술의 멀티 채널 인코더의 일 예를 나타낸다.
도 4는 종래 기술의 디코더들의 예들을 나타낸다.
도 5는 다운믹스 멀티 채널 신호의 종래 기술의 스테레오 재구성의 예를 나타낸다.
도 6은 본 발명의 파라미터 계산기의 예에 대한 블록도를 나타낸다.
도 7은 본 발명의 채널 재구성 장치(channel reconstructor)에 대한 예를 나타낸다.
도 8은 본 발명의 수신기 또는 오디오 재생장치에 대한 예를 나타낸다.
본 발명의 개념은 이하에서 주로 MPEG 코딩에 관하여 설명될 것이지만, 멀티 채널 신호들의 파라메트릭 코딩에 관한 다른 방식들에도 적용될 수 있다. 아래에 설명되는 실시예들은 트리 구조의 멀티 채널 시스템들을 위한 감소된 개수의 채널 디코딩에 대한 본 발명의 원리들에 대해 단지 예시적인 것에 불과하다. 본 명세서에서 설명되는 구성 및 세부 사항의 변경예 및 변형예는 본 기술분야의 당업자에게 자명한 것으로 이해되어야 한다. 그러므로, 이는 여기 실시예들의 설명에 의해 제공되는 특정 세부 사항이 아닌 첨부된 청구항들의 범위에 의해서만 한정되어야 한다.
앞서 언급한 바와 같이, 몇몇 파라메트릭 서라운드 코딩 시스템들에서는, 예를 들어 MPEG 서라운드에서는 트리 구조의 파라미터화가 이용된다. 그러한 파라미터화는 도 1 및 도 2에서 도시되어 있다.
도 1은 좌측 전방 채널(2), 중앙 채널(center channel, 3), 우측 전방 채 널(right front hannel, 4), 좌측 서라운드 채널(left surround channel, 5), 우측 서라운드 채널(right surround channel, 6)을 가지는 표준 5.1 채널 오디오 시나리오를 파라미터화하는 두가지 방식을 나타낸다. 선택적으로는, 저주파 개선 채널(LFE: low-frequency enhancement channel, 7)도 있을 수 있다.
일반적으로, 개개의 채널들 또는 채널 쌍(channel pair)들은 예시적으로는 상관관계 파라미터 ICC 및 레벨 파라미터 CLD와 같은 멀티 채널 파라미터들에 의해서 서로에 관하여 특성이 부여된다. 가능한 파라미터화들은 다음의 설명 부분에서 바로 설명될 것이며, 그 다음으로 결과적인 트리 구조의 디코딩 방식들이 도 2에 도시된다.
도 1(5-1-51 파라미터화)의 왼쪽 면에 도시된 예에서는, 멀티 채널 신호가, 좌측 서라운드 채널(5)과 우측 서라운드 채널(6), 좌측 전방 채널(2)과 우측 전방 채널(4) 그리고 중앙 채널(3)과 저주파 개선 채널(7)간의 관계를 기술하는 CLD와 ICC 파라미터들에 의해 특성이 부여된다. 그러나, 전체 구성이 하나의 싱글 모노 채널로 다운믹싱될 것이기 때문에, 채널들의 집합의 전체적인 설명을 위해서는, 부가적인 파라미터들이 요구된다. 그런 이유로, 부가적인 파라미터들(CLD1, ICC1)이 이용되는데, 이는 LFE-스피커(LFE-speaker, 7)와 중앙 스피커(center speaker, 3)를 좌측 전방 채널(2)과 우측 전방 채널(4)의 결합(combination)에 연관시킨다. 게다가, 하나의 부가적인 세트의 파라미터들(CLD0, ICC0)이 요구되는데, 이러한 파라미터들은 멀티 채널 신호의 채널들의 나머지에 대한, 결합(combine)된 서라운드 채널들(5,6)간의 관계를 기술한다.
파라미터화의 오른쪽 면(5-1-52 파라미터화)에서는, 좌측 전방 채널(2)과 좌측 서라운드 채널(5), 우측 전방 채널(4)과 우측 서라운드 채널(6), 그리고 중앙 채널(3)과 저주파 개선 채널(7)과 관계된 파라미터들이 이용된다. 부가적인 파라미터들(CLD1 및 ICC1)은 우측 채널들(2,5)의 결합(combination)에 대한 좌측 채널들(2,5)의 결합(combination)을 설명한다. 추가적인 일련의 파라미터들(CLD0 및 ICC0)은 나머지 채널들의 결합(combination)에 대한 중앙 채널(3) 및 LFE-채널(7)의 결합(combination)의 관계를 설명한다.
도 2는 도 1의 서로 다른 파라미터화들의 기초를 이루는 코딩 개념들을 도시한다. 디코더 측에서는 소위 OTT(1 대 2) 모듈들이 트리 유사 구조에서 이용된다. 모든 OTT 모듈은 하나의 모노 신호를 두 개의 출력 신호들로 업믹스한다. 디코딩시에는, OTT 박스들을 위한 파라미터들은 인코딩에서와 같이 역순으로 적용되어야 한다. 그래서, 5-1-51 트리 구조에서는, 다운믹스 신호(M, 22)를 수신하는 OTT 모듈(20)은 좌측 서라운드 채널(5)와 우측 서라운드 채널(6)의 조합인 하나의 채널과, 멀티 채널 신호의 남은 채널들의 조합인 다른 하나의 채널의, 두 채널을 도출하기 위해 CLD0 및 ICC0 파라미터를 사용하도록 동작한다.
따라서 OTT 모듈(24)는, CLD1과 ICC1을 이용하여, 중앙 채널(3)과 저주파 개선 채널(7)의 결합(combine)된 채널인 제1 채널과 좌측 전방 채널(2)과 우측 전방 채널(4)의 조합인 제2 채널을 도출한다. 같은 방식으로, OTT 모듈(26)은 CLD2와 ICC2를 이용하여, 좌측 서라운드 채널(5)과 우측 서라운드 채널(6)을 도출한다. OTT 모듈(27)은 CLD4를 이용하여 중앙 채널(3)과 저주파 채널(7)을 도출하고, OTT 모듈(28)은 CDL3와 ICC3를 이용하여 좌측 전방 채널(2)와 우측 전방 채널(4)을 도출한다. 마지막으로, 채널들(30)의 전체 세트의 재구성은 싱글 모노포닉(monophonic) 다운믹스 채널(22)로부터 도출된다. 5-1-52 트리 구조에 대해서는, OTT 모듈의 일반적인 레이아웃(layout)이 5-1-51 트리 구조와 동등하다. 그러나, 5-1-52 경우에는 싱글 OTT 모듈들이 도 1에서 도시된 파라미터화에 해당하는, 서로 다른 채널 결합(combination)들을 도출한다.
서로 다른 파라미터화들의 트리 구조는, 이용되는 파라미터화에 대한 시각적 표현일 뿐이라는 것이 도 1 및 도 2로부터 분명해진다. 게다가 개개의 파라미터들은 예를 들어, 유사한 파라미터들이 하나의 싱글 참조 채널에 관하여 도출되는 BCC-코딩 방식에 대조하여 서로 다른 채널들 간의 관계를 기술하는 파라미터들이라는 점에 주목하는 것이 중요하다.
그리하여, 도시된 파라미터화들에 있어서, 개개의 채널들이 시각화된 표현 중 OTT-박스들에 관련된 파라미터들을 단순히 이용하여 도출될 수 없고, 남은 파라미터들 중 몇몇 또는 전부가 부가적으로 고려되어져야 한다.
파라미터화의 트리 구조는 도 3에 도시된 실제의 싱글 플로우(flow) 또는 프 로세싱을 위한 시각화된 표현일 뿐인데, 도 3은 행렬 곱셈(matrix multiplication)에 의해 얻어지는, 전송된 작은 수의 채널들로부터의 업믹스를 나타낸다. 도 3은 수신된 다운믹싱된 채널(40)에 기초한 디코딩을 나타낸다. 다운믹싱된 채널(40)은 재구성된 멀티 채널 신호(44)를 도출하는 업믹스 블록(42)에 입력되는데, 여기서 채널 구성은 이용되는 파라미터화들 간에 다르다. 그러나, 재구성 블록(42)에 의해 이용되는 행렬의 행렬 원소들은 트리 구조로부터 직접 도출된다. 재구성 블록(42)은, 단지 설명을 하기 위한 목적으로, 전송된 채널(40)로부터 부가적인 역상관된(decorrelated) 신호들을 도출하는 프리-역상관기 매트릭스(pre-decorrelator matrix, 46)로 더 분해될 수 있다. 다음으로 이러한 신호들은 개개의 입력 채널들을 믹싱(mixing)함으로써 멀티 채널 신호들(44)를 도출하는 믹스 행렬(mix matrix, 48)로 입력된다.
도 4에 도시된 바와 같이, 감소된 개수의 재구성된 채널들에 대한 직접적인 접근은 단순히 하나의 트리를 두 개의 박스로 "가지치기(prune)"하는 것이 될 수 있다. 도 4는 트리의 가능한 가지치기-여기서, 가지치기(prune)는 재구성을 하는 동안 트리의 오른쪽 면에 있는 OTT 모듈들을 제거하는 것임-를 점선으로 도시하고 있는데, 이로써 출력 채널들의 개수를 감소시킨다. 그러나, 도 1 및 도 2에 나타난 종래 기술의 파라미터화를 이용하는 것이 소개되어 있는데, 이들은 가능한 한 가장 높은 품질로 낮은 비트율의 코딩(low-bit rate coding)을 제공하기 때문에, 단순한 가지치기로는 원래의 멀티 채널 신호의 왼쪽 면 다운믹스와 오른쪽 면 다운믹스를 나타내는 스테레오 출력을 적절하게 생성하는 것이 가능하지 않다. 도 5는 앞서 설명한 신호들로부터 스테레오 출력을 생성하는 종래 기술의 접근 방식을 나타내는데, 이는 그 후에 부가적인 다운믹서(downmixer, 60)를 이용하여 신호를 스테레오 표현으로 다운믹싱하기 전에, 먼저 완전하게 멀티 채널 신호의 재구성을 하는 확실한 접근 방식을 이용한다. 명백히, 이는 높은 복잡도와 저질의 음질과 같은 몇몇 단점들을 가진다.
"가지치기"를 자연히 지원하여 스테레오 출력을 얻지 않는 파라미터화에 있어서 모노 다운믹스와 파라메트릭 서라운드 파라미터들로부터 스테레오 출력을 얻는, 앞서 언급한 문제점에 대한 솔루션이 일반적인 경우에 대해 이하에서 도출될 것이다. 이에는 앞서 언급한 파라미터화에서 본 발명의 개념의 이용을 나타내는 두 특정 실시예들이 뒤따른다. 그래서, "가지치기"를 지원하여 스테레오 출력을 얻는 것이 아닌 파라미터화에 있어서, 모노 다운믹스와 파라메트릭 서라운드 파라미터들로부터 스테레오 출력을 생성하는 문제점에 대해 솔루션들이 제공된다.
파라미터 재계산(recalculation)에 대한 일반적인 접근을 이하에서 설명한다. 특히, 임의의 개수의 멀티 채널 오디오 채널들로부터 스테레오 출력 파라미터들을 계산하는 경우에 적용된다. 게다가 이는 오디오 신호가 서브밴드 표현에 의해 설명되고, 이는 실수 또는 복소 변조될 수 있는 필터 뱅크를 이용하여 도출된다는 것을 가정한다.
고려되는 모든 신호들이 공간 파라미터(spatial parameter)들에 의해 정의된 시간 주파수(time frequency) 타일에 해당하는 서브밴드 샘플들의 한정된 벡터들이 되게 하고, 재구성된 멀티 채널 오디오 신호 y의 서브밴드 샘플들이 행렬 업믹스 동작
Figure 112008068452445-PCT00001
에 따라 오디오 채널들의 서브밴드 샘플들 m1,m2,..., mM과 오디오 채널들의 역상관된 서브밴드 샘플들 d1,d2,..., dD로부터 형성되도록 한다.
여기서,
Figure 112008068452445-PCT00002
이다.
모든 신호들은 행 벡터(row vector)들로 간주된다. 행렬 R은 N×(M+D)의 크기를 가지며, 도 3의 행렬 M1과 M2의 결합(combine)된 효과를 그러한 업믹스 블록(42)으로 나타낸다. 원래의 멀티 채널 오디오 신호 서브밴드 샘플들의 ND 채널들에 대한 다운믹싱된 버전의 적절한 전력과 상관관계 파라미터들을 생성하기 위한 일반적인 방법은 ND×N 다운믹스 행렬 D에 의해 정의되는 가상(virtual)의 다운믹스의 공분산(covariance) 행렬을 형성하는
Figure 112008068452445-PCT00003
이다.
이 공분산 행렬은 다음과 같이 전치(transpose)되는 공액 복소수(complex conjugate)와의 곱(multiplication)에 의해 계산될 수 있는데,
Figure 112008068452445-PCT00004
,
여기서 안쪽의 공분산 행렬
Figure 112008068452445-PCT00005
는 역상관기들과 전송된 파라미터들의 특질들로부터 종종 알 수 있다.
이것이 트루(true)를 유지하는 중요한 특별한 경우가
Figure 112008068452445-PCT00006
이고, 종종 이 안쪽 공분산 행렬은
Figure 112008068452445-PCT00007
의 크기를 가지는 단위 행렬(identity matrix)과 실제적으로는 동등하다. 결과적으로,
Figure 112008068452445-PCT00008
인 스테레오 출력에 대해서는, CLD와 ICC 파라미터들은
Figure 112008068452445-PCT00009
Figure 112008068452445-PCT00010
라는 의미에서,
Figure 112008068452445-PCT00011
로부터 알 수 있다.
본 설명 부분과 다음 설명 부분에서는, 다음의 표현(notation)이 적용된다. 예를 들어, 복소 벡터
Figure 112008068452445-PCT00012
에 대해서는, 복소 내적(complex inner product)과 제곱 놈(squared norm)이 다음과 같이 정의되는데,
Figure 112008068452445-PCT00013
여기서 별(star) 표시는 복소 공액(complex conjugation)을 나타낸다.
이어서, 본 발명의 두 실시예들이 도 1 및 도 2에 나타난 서로 다른 파라미터화들(5-1-51 와 5-1-52)에 대해 도출될 수 있다. 본 발명의 실시예들에서는, 모노 다운믹스와 해당하는 MPEG 서라운드 파라미터들(멀티 채널 파라미터들)에 기초하여 스테레오 신호들을 출력하기 위하여, 업믹스 파라미터들이, 모노 신호로부터 스테레오 신호의 직접적 업믹스를 위해 이용될 수 있는, 싱글 세트의 CLD 및 ICC 파라미터들로 재계산되어야 한다는 것을 설명하고 있다.
게다가 개개의 오디오 채널들의 프로세싱은 프레임 단위 방식으로 즉, 이산 시간 부분들(discrete time portions) 단위로 이루어진다는 것을 가정하고 있다. 그래서, 하나의 채널 내에 포함되어 있는 전력들 또는 에너지들에 관하여 말하자면, "전력" 또는 "에너지"라는 용어는 하나의 특정 채널의 하나의 프레임 내에 포함된 에너지 또는 전력으로 이해될 수 있다.
일반적으로는, 예를 들어 CLD와 ICC와 같은 파라미터들은 또한 하나의 싱글 프레임에 대해서 유효하다. k개의 샘플 값들
Figure 112008068452445-PCT00014
을 갖는 하나의 프레임에 대해서 말하자면, 프레임 내의 에너지 E는 예를 들어 프레임 내의 서브밴드 샘플 값들의 제곱합(squared sum)에 의해 표현될 수 있다:
Figure 112008068452445-PCT00015
다운믹스 신호 M을 멀티 채널 신호의 중간 채널 표현(스테레오)으로 업믹싱하기 위한 업믹싱 파라미터들의 계산을 위해 전송되어 이용되는 채널 레벨 차(channel level differences, CLD)들은 다음과 같이 정의되는데:
Figure 112008068452445-PCT00016
,
여기서 L0와 R0는 CLD 파라미터가 도출될 프레임 내의 문제의 신호들의 전력을 나타낸다.
그래서, 5-1-51의 경우에 대해서는, 네개의 CLD 파라미터들
Figure 112008068452445-PCT00017
,
Figure 112008068452445-PCT00018
이 모노 다운믹스 채널 m의 전력에 의해 정규화된 채널 전력들을 얻기 위해 이용될 수 있다.
Figure 112008068452445-PCT00019
채널 이득(channel gain)들은 다음과 같이 정의된다
Figure 112008068452445-PCT00020
.
최종 목표는
Figure 112008068452445-PCT00021
에 대해
Figure 112008068452445-PCT00022
로서,
Figure 112008068452445-PCT00023
이 되며,
Figure 112008068452445-PCT00024
에 대해
Figure 112008068452445-PCT00025
로서,
Figure 112008068452445-PCT00026
이 됨으로써, 형성되는 스테레오 채널들 (중간 채널 표현)의 정규화된 전력들과 상관관계의 적절한 추정치들이 발견된다는 의미에서, 적절한 스테레오 채널들 l0와 r0를 도출하는 것인데, 여기서 중앙 다운믹스 가중치(center downmix weight)는
Figure 112008068452445-PCT00027
이다.
이러한 가정으로부터 전력들을 계산하는 것은 다음의 결과를 가져온다
Figure 112008068452445-PCT00028
.
이는 파라미터
Figure 112008068452445-PCT00029
에 의해 수행되는 상관관계 정보를 통합시키려고 시도하는 것보다는, 결합(combine)된 좌측 채널
Figure 112008068452445-PCT00030
과 결합(combine)된 우측 채널
Figure 112008068452445-PCT00031
모두 중앙 채널
Figure 112008068452445-PCT00032
과 상관되지 않는다는(uncorrelated) 가정을 하는 것이 가장 유리하다는 것이 된다. 스테레오 출력 채널들의 정규화된 전력들은 그래서 다음에 의해 추정된다
Figure 112008068452445-PCT00033
.
출력 채널들의 전력들이 도출된 상태에서, 원하는 CLD 파라미터가, 위에서 주어진 CLD 파라미터의 정의를 이용하여 쉽게 계산될 수 있다.
본 발명의 개념에 따르면, ICC 파라미터는 스테레오 업믹스를 허용하기 위해 도출된다. 두 출력 채널들 간의 상관관계는 다음의 수학식에 의해 정의된다:
Figure 112008068452445-PCT00034
.
결합(combine)된 좌측 채널
Figure 112008068452445-PCT00035
과 결합(combine)된 우측 채널
Figure 112008068452445-PCT00036
모두 중앙 채널
Figure 112008068452445-PCT00037
과 상관되지 않고(uncorrelated), 게다가 서라운드 채널들이 전방 채널들과 상관되지 않는다는(uncorrelated), 일련의 매력적인 단순화 가정들이 여기 다시 성립된다. 이러한 가정들은 다음과 같이 표현된다
Figure 112008068452445-PCT00038
.
Figure 112008068452445-PCT00039
에 대한 결과적인 추정치는 두 ICC 파라미터들
Figure 112008068452445-PCT00040
에 의존하는데, 이 파라미터들은 정규화된 좌측/우측 상관관계들을 기술하고,
Figure 112008068452445-PCT00041
,
이는 다음과 같이 다시 표현될 수 있다
Figure 112008068452445-PCT00042
.
그래서, 최종 상관관계 값은, 높은 충실도의 신호 재구성을 허용하는 멀티 채널 파라미터화의 많은 파라미터들에 의존한다. ICC 파라미터는 다음의 수학식을 이용하여 최종적으로 도출된다:
Figure 112008068452445-PCT00043
.
본 발명의 개념에 따르면, 재구성된 채널들 간의 전력 배분은 높은 정확도로 재구성된다. 그러나, 양 채널 모두에 적용되는 전체적인 전력 스케일링(scaling)이 전체 에너지 보존을 보증하기 위해 부가적으로 필요할 수도 있다. 채널들 간의 상대적인 에너지 배분이 재구성된 신호의 공간적 인지(spatial perception)에 대해 매우 중요하므로, 전체적인 스케일링은 재구성된 신호의 인지에 의한 품질을 떨어뜨릴 수 있다. 전체적인 스케일링은 단지 파라미터 정의된 시간-주파수 타일(parameter defined time-frequency tile) 내에서만 전체적이라는 것이 강조된다. 이는 잘못된 스케일링들은 파라미터 타일(parameter tile)들의 스케일(scale)에서 국부적으로 신호에 영향을 미칠 것이라는 것을 의미한다. 전체적인 스케일링을 위한 이득 조정 인자(gain adjustment factor)는 스테레오 업믹스 프로세스가 모노 다운믹스 채널
Figure 112008068452445-PCT00044
의 전력을 보존한다는 것을 보장하기 위해 필수적이다.
그러나, 이러한 인자는
Figure 112008068452445-PCT00045
에 의해 정의되는데, 이는 5-1-51 구성에 대해,
Figure 112008068452445-PCT00046
이기 때문에
Figure 112008068452445-PCT00047
에 이른다.
추가적인 실시예로서, 5-1-52 트리 구조에 대한 본 발명의 개념의 애플리케이션은 다음의 설명 부분 내에서 설명한다. 높은 충실도의 스테레오 신호의 생성을 위해서는, 트리의 최상위 가지(branch)들에 해당하는 두 개의 첫 CLD 및 ICC 파라미터 세트(two first CLD and ICC parameter set)들이 관련된다.
Figure 112008068452445-PCT00048
인 두 개의 CLD 파라미터들
Figure 112008068452445-PCT00049
이, 결합(combine)된 좌측 및 우측 채널들과 중앙 채널의 정규화된 채널 전력들을 얻기 위해 먼저 이용되는데,
Figure 112008068452445-PCT00050
여기서, 채널 이득들은 다음과 같이 정의된다
Figure 112008068452445-PCT00051
.
목표는 다음 다운믹스 채널들의 전력들과 상관관계를 도출하는 것인데,
Figure 112008068452445-PCT00052
여기서, 중앙 다운믹스 가중치는
Figure 112008068452445-PCT00053
이다. 이러한 가정으로부터 전 력들을 계산하는 것은 다음의 결과를 가져온다
Figure 112008068452445-PCT00054
.
채널들
Figure 112008068452445-PCT00055
Figure 112008068452445-PCT00056
간의 ICC와 채널들
Figure 112008068452445-PCT00057
Figure 112008068452445-PCT00058
의 ICC는 모두 채널들
Figure 112008068452445-PCT00059
Figure 112008068452445-PCT00060
간의 주어진
Figure 112008068452445-PCT00061
와 동일하다는 가정이 여기서 장점이 된다. 이러한 가정은 다음의 추정치들의 결과를 가져오며,
Figure 112008068452445-PCT00062
Figure 112008068452445-PCT00063
이는 정규화된 전력들의 추정치들이 다음과 같이 되도록 한다
Figure 112008068452445-PCT00064
앞 실시예에서와 같이, 전력 값들 L0와 R0을 가진 상태에서, 원하는 CLD 파라미터가 다음과 같이 도출될 수 있다:
Figure 112008068452445-PCT00065
.
상관관계, 최종적으로 ICC 파라미터를 도출하는 것은 상관관계 값:
Figure 112008068452445-PCT00066
의 일반적인 정의로부터 시작한다.
모든 필수적인 정보는 아래와 같은 이유로 5-1-52 트리 구조들의 파라미터들로부터 입수될 수 있다
Figure 112008068452445-PCT00067
최종 결과들은 다음과 같이 표현될 수 있다
Figure 112008068452445-PCT00068
요구되는 이득 조정 인자
Figure 112008068452445-PCT00069
는 다음과 같이 정의된다:
Figure 112008068452445-PCT00070
.
생성된 CLD 및 ICC 파라미터들은, 복소 계산들을 수행하는 것보다는 업믹스 행렬 생성을 위한 디코더 내의 룩업 테이블(lookup table)들의 이용을 가능하게 하기 위해, 추가적으로 양자화될 수 있다는 것에 주목하여야 한다. 이는 업믹스 프로세스의 효율을 증대시킨다.
일반적으로는, 업믹스는 이미 존재하는 OTT 모듈들을 이용하여 수행될 수 있 다. 이는 이미 존재하는 디코딩 시나리오들에서 본 발명의 개념이 쉽게 구현될 수 있다는 장점을 가진다.
일반적으로, 업믹스 행렬은 다음과 같이 설명될 수 있는데:
Figure 112008068452445-PCT00071
여기서,
Figure 112008068452445-PCT00072
Figure 112008068452445-PCT00073
이고,
그리고 여기서:
Figure 112008068452445-PCT00074
이고,
Figure 112008068452445-PCT00075
이다.
그래서, 본 발명에 따라 CLD 및 ICC 파라미터들을 도출하면, 전송된 다운믹스의 스테레오 업믹스가 표준 업믹스 모듈들을 이용하여 높은 충실도로 수행될 수 있다.
본 발명의 추가적인 실시예에서, 본 발명의 채널 재구성 장치(channel reconstructor)는 업믹스 파라미터들과 하나의 전송된 다운믹스 신호를 이용하여 중간 채널 표현을 도출하기 위한 업믹스 파라미터들과 업믹서(upmixer)를 도출하기 위한 파라미터 계산기를 포함한다.
본 발명의 개념은 다시 도 6에서 도시되는데, 이는 다수의 ICC 파라미터들(504)과 다수의 CLD 파라미터들(506)을 수신하는, 본 발명의 파라미터 계산 기(502)를 나타낸다. 본 발명의 일 실시예에 따르면, 본 발명의 파라미터 계산기 (502)는, 스테레오-업믹스의 채널들에 포함되거나 관련되지 않는 채널들에 관한 정보를 포함하는 멀티 채널 파라미터들(ICC와 CLD)을 또한 이용하여, 스테레오 신호를 재생성하기 위한 싱글 CLD 파라미터(508)와 싱글 ICC 파라미터(510)를 도출한다.
본 발명의 개념은 둘 이상의 채널들을 포함하는 업믹스가 포함된 시나리오들에 쉽게 적용될 수 있다는 점에 주목해야 한다. 그러한 의미에서, 업믹스는 멀티 채널 신호의 중간 채널 표현으로 일반적으로 정의되며, 여기서 중간 채널 표현은 다운믹스 채널보다 더 많은 채널들을 포함하고, 멀티 채널 신호보다 더 적은 수의 채널들을 포함한다. 하나의 통상적인 시나리오는 부가적인 중앙 채널이 재구성되는 구성이다.
본 발명의 개념의 애플리케이션을 도 7에서 다시 설명하는데, 이는 본 발명의 파라미터 계산기(502)와 1 대 2(1-to-2) 박스 OTT(520)을 나타낸다. OTT 박스(520)는, 도 6에 이미 도시된 바와 같이, 전송된 모노 신호(522)를 입력으로서 수신한다. 본 발명의 파라미터 계산기(502)는 싱글 CLD 파라미터(508)와 싱글 ICC 파라미터(510)을 도출하기 위해 몇몇 ICC 값들(504)과 몇몇 CLD 값들(506)을 수신한다.
싱글 CLD 및 ICC 파라미터들(508,510)은 모노포닉 다운믹스 신호(522)의 업믹스를 조종하기 위해 OTT 모듈(520)에 입력된다. 그래서, OTT 모듈의 출력(520)에서, 스테레오 신호(524)가 멀티 채널 신호의 중간 채널 표현으로서 제공될 수 있 다.
도 8은 본 발명의 수신기(receiver) 또는 오디오 재생장치(audio player, 600)-여기서, 오디오 재생장치는 본 발명의 오디오 디코더(601), 비트 스트림 입력(bit stream input, 602)과 오디오 출력(604)을 포함함-를 나타낸다.
비트 스트림은 본 발명의 수신기/오디오 재생장치(600)의 입력(602)에서 입력될 수 있다. 그리고 나서 디코더(601)는 비트 스트림을 디코딩하고, 디코딩된 신호는 출력되거나 또는 본 발명의 수신기/오디오 재생장치(600)의 출력(604)에서 재생된다.
본 발명의 개념은 주로 MPEG 서라운드 코딩에 관하여 설명하고 있음에도 불구하고, 특정 파라메트릭 코딩 시나리오에 대한 애플리케이션에 한정되는 것은, 물론 아니다. 본 발명의 개념의 높은 유연성 때문에, 예를 들어 7.1 또는 7.2 채널 구성들 또는 BCC 방식들과 같은 다른 코딩 방식들에도 쉽게 적용될 수 있따.
MPEG-코딩과 관련된 본 발명의 실시예들이, 통상적인 CLD 및 ICC 파라미터의 생성을 위한 가정들을 단순화하는 것을 도입함에도 불구하고, 이것이 강요되지는 않는다. 물론 이러한 단순화들을 도입하지 않는 것이 가능하다.
본 발명의 방법들의 일정한 구현 요구사항(implementation requirements)에 따라, 본 발명의 방법들은 하드웨어 또는 소프트웨어로 구현될 수 있다. 구현은 전자적으로 읽을 수 있는 제어 신호들이 저장되어 있으며, 본 발명의 방법들이 수행될 수 있도록 프로그래밍될 수 있는 컴퓨터 시스템과 함께 동작되는 디지털 저장 매체(digital storage medium), 특히 디스크(disk), DVD 또는 CD를 이용하여 수행 될 수 있다. 일반적으로, 본 발명은 그래서, 기계적으로 읽을 수 있는 매체(carrier)에 저장되는 프로그램 코드(program code)-여기서 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 동작될 때 본 발명의 방법들을 수행하도록 동작됨.-를 가지는 컴퓨터 프로그램 제품이다. 다시 말하면, 본 발명의 방법들은 그래서, 컴퓨터 프로그램이 컴퓨터에서 동작될 때, 본 발명의 방법들의 적어도 하나를 수행하기 위한 프로그램 코드를 가지는 컴퓨터 프로그램이다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. 본 명세서에 개시된 더 넓은 개념들로부터 벗어나지 않고서 서로 다른 실시예들에 적용함에 있어서, 다양한 변경들이 이루어질 수 있으며 이는 후술하는 청구항들에 의해 이해될 수 있는 것으로 이해되어야 한다.

Claims (21)

  1. 다운믹스(downmix) 신호를 멀티 채널 신호의 중간 채널 표현(intermediate channel representation)-여기서, 상기 중간 채널 표현은 상기 다운믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱(upmixing)하기 위한 업믹스 파라미터들을 도출하기 위한 파라미터 계산기(parameter calculator)로서, 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성(spatial property)들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하며, 상기 파라미터 계산기는,
    상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하기 위한 파라미터 재계산기(parameter recalculator)를 포함하는 파라미터 계산기.
  2. 제 1 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 신호의 채널들의 하나의 결합(combination) 또는 하나의 채널의 신호 특성(signal property)들을 상기 멀티 채널 신호의 채널들의 또 다른 결합(combination) 또는 또 다른 채널에 대하여 기술하는 멀티 채널 파라미터들을 이 용하는 파라미터 계산기.
  3. 제 2 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 파라미터들의 신호 특성들과 동일한, 상기 중간 채널 표현의 채널들의 신호 특성들을 기술하는 업믹스 파라미터들을 도출하도록 동작하는 파라미터 계산기.
  4. 제 1 항에 있어서, 상기 파라미터 재계산기는,
    멀티 채널 신호의 채널들의 또 다른 결합(combination) 또는 또 다른 채널에 대하여 상기 멀티 채널 신호의 채널들의 하나의 결합(combination) 또는 하나의 채널에 대한 에너지 정보를 포함하는 레벨 파라미터들(CLD) 및 상관관계에 대한 정보를 포함하는 상관관계 파라미터들(ICC)을 이용하는 파라미터 계산기.
  5. 제 4 항에 있어서, 상기 파라미터 재계산기는,
    좌측 전방 (LF), 좌측 서라운드(LS), 우측 전방(RF), 우측 서라운드(RS) 그리고 중앙 채널(C)을 포함하는 멀티 채널 신호에 대한 멀티 채널 파라미터들을 이용하며,
    상기 파라미터 재계산기는 두 채널들을 포함하는 중간 채널 표현에 대한 업믹스 파라미터들-여기서, 상기 업믹스 파라미터들은 하나의 CLD 파라미터와 하나의 ICC 파라미터를 포함함-을 도출하도록 동작하는 파라미터 계산기.
  6. 제 5 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 신호의 LF 및 LR 채널의 결합(combination)과 나머지 채널들의 결합(combination)에 대한 에너지 정보를 포함하는 제1 CLD 파라미터(CLD0);
    상기 LF 및 RF 채널의 결합(combination)과 상기 중앙 채널(C)에 대한 에너지 정보를 포함하는 제2 파라미터(CLD1);
    상기 LS 및 RS 채널에 대한 에너지 정보를 포함하는 제3 파라미터(CLD2) ;
    상기 LF 및 상기 RF 채널에 대한 에너지 정보를 포함하는 제4 CLD 파라미터(CLD3)를 이용하여 상기 중간 채널 표현의 좌측 및 우측 채널에 대한 에너지 정보를 포함하는 상기 CLD 파라미터를 도출하도록 동작하는 파라미터 계산기.
  7. 제 6 항에 있어서, 상기 파라미터 재계산기는,
    다음 수학식에 따라 상기 업믹스 CLD 파라미터를 도출하도록 동작하는데,
    Figure 112008068452445-PCT00076
    ,
    여기서, L0 및 R0는 다음 수학식에 의해 도출되는, 스테레오 출력 채널들 L 및 R의 정규화된 전력들이며,
    Figure 112008068452445-PCT00077
    여기서, 상기 멀티 채널 신호들의 전력들은 상기 CLD 파라미터들로부터
    Figure 112008068452445-PCT00078
    Figure 112008068452445-PCT00079
    Figure 112008068452445-PCT00080
    과 같이 도출되는 파라미터 계산기.
  8. 제 5 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 신호의 상기 LF 및 LR 채널의 결합(combination)과 나머지 채널들의 결합에 대한 에너지 정보를 포함하는 제1 CLD 파라미터(CLD0);
    상기 LF 및 RF 채널의 결합(combination)과 상기 중앙 채널(C)에 대한 에너지 정보를 포함하는 제2 파라미터(CLD1);
    상기 LS 및 상기 RS 채널에 대한 에너지 정보를 포함하는 제3 파라미 터(CLD2);
    상기 LF 및 RF 채널에 대한 에너지 정보를 포함하는 제4 CLD 파라미터(CLD3);
    상기 LS 및 상기 RS 채널 간의 상관관계에 관한 정보를 포함하는 제1 ICC 파라미터(ICC2); 및
    상기 LF 및 RF 채널 간의 상관관계에 관한 정보를 포함하는 제2 ICC 파라미터(ICC3)를 이용하여 상기 ICC 파라미터를 도출하도록 동작하는 파라미터 계산기.
  9. 제 8 항에 있어서, 상기 ICC 파라미터는,
    다음 수학식에 따라 도출되며,
    Figure 112008068452445-PCT00081
    ,
    여기서, 상관관계 추정치 p는 다음과 같이 정의되며,
    Figure 112008068452445-PCT00082
    ,
    이때,
    Figure 112008068452445-PCT00083
    인 파라미터 계산기.
  10. 제 5 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 신호의 상기 중앙 채널(C)과 다른 채널들의 결합(combination)에 관한 에너지 정보를 포함하는 제1 CLD 파라미터(CLD0);
    상기 LF 및 LS 채널의 결합(combination)과 상기 RF 및 RS 채널의 결합(combination)에 관한 에너지 정보를 포함하는 제2 CLD 파라미터(CLD1); 및
    상기 멀티 채널 신호의 상기 중앙 채널(C)과 다른 채널들의 결합(combination) 간에 상관관계 정보를 포함하는 ICC 파라미터(ICC0)를 이용하여 상기 CLD 파라미터를 도출하도록 동작하는 파라미터 계산기.
  11. 제 10 항에 있어서, 상기 CLD 파라미터는 다음 수학식으로부터 도출되며,
    Figure 112008068452445-PCT00084
    ,
    여기서, L0 및 R0는 다음 수학식으로부터 도출되는, 스테레오 출력 채널들 L 및 R의 정규화된 전력들이고,
    Figure 112008068452445-PCT00085
    ,
    여기서,
    Figure 112008068452445-PCT00086
    Figure 112008068452445-PCT00087
    이고,
    Figure 112008068452445-PCT00088
    Figure 112008068452445-PCT00089
    인 파라미터 계산기.
  12. 제 5 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 신호의 상기 중앙 채널(C)과 다른 채널들의 결합(combination)에 대한 에너지 정보를 포함하는 제1 CLD 파라미터(CLD0);
    상기 LF 및 LS 채널의 결합(combinatio)과 상기 RF 및 RS 채널의 결합(combination)에 대한 에너지 정보를 포함하는 제2 CLD 파라미터(CLD1);
    상기 멀티 채널 신호의 상기 중앙 채널(C)과 상기 다른 채널들의 결합(combination) 간의 상관관계 정보를 포함하는 제1 ICC 파라미터(ICC0); 및
    상기 LF 및 상기 LS 채널의 결합(combination)과 상기 RF 및 RS 채널의 결합(combination) 간의 상관관계 정보를 포함하는 제2 ICC 파라미터(ICC1)를 이용하 여 상기 ICC 파라미터를 도출하도록 동작하는 파라미터 계산기.
  13. 제 12 항에 있어서, 상기 파라미터 재계산기는,
    다음 수학식을 이용하여 상기 ICC 값을 도출하도록 동작하는데,
    Figure 112008068452445-PCT00090
    ,
    여기서, 상관관계 측정값 p는 다음과 같이 도출되고,
    Figure 112008068452445-PCT00091
    ,
    이때,
    Figure 112008068452445-PCT00092
    이고,
    Figure 112008068452445-PCT00093
    이고,
    Figure 112008068452445-PCT00094
    인 파라미터 계산기.
  14. 제 1 항에 있어서, 상기 파라미터 재계산기는,
    상기 멀티 채널 신호의 서브밴드 표현을 기술하는 멀티 채널 파라미터들을 이용하도록 동작하는 파라미터 계산기.
  15. 제 1 항에 있어서, 상기 파라미터 재계산기는,
    복소수 멀티 채널 파라미터들을 이용하도록 동작하는 파라미터 계산기.
  16. 제 1 항에 따른 파라미터 계산기; 및
    상기 업믹스 파라미터들과 상기 다운믹스 신호를 이용하여 상기 중간 채널 표현을 도출하기 위한 업믹서를 포함하는, 파라미터 재구성 장치(parameter reconstructor)를 가지는 채널 재구성 장치(channel reconstructor).
  17. 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 상기 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 생성하기 위한 방법으로서, 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 업믹스 파라미터들을 생성하기 위한 방법은,
    상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하는 단계를 포함하는 업믹스 파라미터 생성 방법.
  18. 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채 널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 도출하기 위한 파라미터 계산기를 포함하는 오디오 수신기(audio receiver) 또는 오디오 재생장치(audio player)로서, 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하며, 상기 파라미터 계산기는,
    상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하기 위한 파라미터 재계산기를 포함하는 오디오 수신기 또는 오디오 재생 장치.
  19. 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 생성하기 위한 방법을 포함하는, 수신 또는 오디오 재생 방법으로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하며, 상기 수신 또는 오디오 재생 방법은,
    상기 중간 채널 표현에 포함되지 않은 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하는 단계를 포함하는 수신 또는 오디오 재생 방법.
  20. 컴퓨터에서 동작할 때, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 생성하기 위한 방법을 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램으로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하며, 상기 방법은,
    상기 중간 채널 표현에 포함되지 않은 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하는 단계를 포함하는, 컴퓨터 프로그램.
  21. 컴퓨터에서 동작할 때, 다운믹스 신호를 멀티 채널 신호의 중간 채널 표현-여기서, 중간 채널 표현은 상기 다운 믹스 신호보다 더 많은 채널들과 상기 멀티 채널 신호보다 더 적은 채널들을 포함함-으로 업믹싱하기 위한 업믹스 파라미터들을 생성하기 위한 방법을 포함하는 수신 또는 오디오 재생 방법을 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램으로서, 여기서 상기 다운믹스 신호는 상기 멀티 채널 신호의 공간 특성들을 기술하는 멀티 채널 파라미터들에 관련되고, 상기 멀티 채널 신호는 상기 중간 채널 표현에 포함되지 않는 채널들을 포함하고, 상기 멀티 채널 파라미터들은 상기 중간 채널 표현에 포함되지 않는 채널들에 관한 정보를 포함하며, 상기 업믹스 파라미터들을 생성하기 위한 방법은,
    상기 중간 채널 표현에 포함되지 않은 채널들에 관한 정보를 포함하는 상기 파라미터들을 이용하여 상기 멀티 채널 파라미터들로부터 상기 업믹스 파라미터들을 도출하는 단계를 포함하는, 컴퓨터 프로그램.
KR1020087023893A 2006-03-29 2006-08-18 감소된 개수의 채널 디코딩 KR101002835B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
SE0600713-2 2006-03-29
SE0600713 2006-03-29
US78891106P 2006-04-03 2006-04-03
US60/788,911 2006-04-03
US11/464,149 2006-08-11
US11/464,149 US7965848B2 (en) 2006-03-29 2006-08-11 Reduced number of channels decoding

Publications (2)

Publication Number Publication Date
KR20080103094A true KR20080103094A (ko) 2008-11-26
KR101002835B1 KR101002835B1 (ko) 2010-12-21

Family

ID=37450828

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087023893A KR101002835B1 (ko) 2006-03-29 2006-08-18 감소된 개수의 채널 디코딩

Country Status (11)

Country Link
US (1) US7965848B2 (ko)
EP (1) EP1999744B1 (ko)
JP (1) JP5158814B2 (ko)
KR (1) KR101002835B1 (ko)
CN (1) CN101410890B (ko)
BR (1) BRPI0621530B1 (ko)
ES (1) ES2398573T3 (ko)
HK (1) HK1122127A1 (ko)
PL (1) PL1999744T3 (ko)
TW (1) TWI339836B (ko)
WO (1) WO2007110102A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022255A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR20110108730A (ko) * 2010-03-29 2011-10-06 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
KR20140130464A (ko) * 2012-02-14 2014-11-10 후아웨이 테크놀러지 컴퍼니 리미티드 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086139A1 (en) 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
EP1946295B1 (en) * 2005-09-14 2013-11-06 LG Electronics Inc. Method and apparatus for decoding an audio signal
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US9088855B2 (en) * 2006-05-17 2015-07-21 Creative Technology Ltd Vector-space methods for primary-ambient decomposition of stereo audio signals
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP2214163A4 (en) * 2007-11-01 2011-10-05 Panasonic Corp CODING DEVICE, DECODING DEVICE AND METHOD THEREFOR
US8315398B2 (en) 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
KR101335975B1 (ko) * 2008-08-14 2013-12-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 복수의 오디오 입력 신호를 리포맷팅하는 방법
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR20110022251A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
KR101751228B1 (ko) * 2013-05-24 2017-06-27 돌비 인터네셔널 에이비 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
BR112016008817B1 (pt) * 2013-10-21 2022-03-22 Dolby International Ab Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
MX354832B (es) * 2013-10-21 2018-03-21 Dolby Int Ab Estructura de decorrelador para la reconstruccion parametrica de señales de audio.
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
WO2016133366A1 (ko) * 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US10225675B2 (en) 2015-02-17 2019-03-05 Electronics And Telecommunications Research Institute Multichannel signal processing method, and multichannel signal processing apparatus for performing the method
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US12010493B1 (en) * 2019-11-13 2024-06-11 EmbodyVR, Inc. Visualizing spatial audio
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US7555434B2 (en) 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
ES2271654T3 (es) 2002-08-07 2007-04-16 Dolby Laboratories Licensing Corporation Conversion espacial de canales de audio.
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4988716B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
JP5587551B2 (ja) * 2005-09-13 2014-09-10 コーニンクレッカ フィリップス エヌ ヴェ オーディオ符号化
EP1946295B1 (en) * 2005-09-14 2013-11-06 LG Electronics Inc. Method and apparatus for decoding an audio signal
WO2007071270A1 (en) * 2005-12-20 2007-06-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing three output channels using two input channels
JP4944902B2 (ja) * 2006-01-09 2012-06-06 ノキア コーポレイション バイノーラルオーディオ信号の復号制御

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022255A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR20110108730A (ko) * 2010-03-29 2011-10-06 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
US9478223B2 (en) 2010-03-29 2016-10-25 Samsung Electronics Co., Ltd. Method and apparatus for down-mixing multi-channel audio
KR20140130464A (ko) * 2012-02-14 2014-11-10 후아웨이 테크놀러지 컴퍼니 리미티드 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치
US9514759B2 (en) 2012-02-14 2016-12-06 Huawei Technologies Co., Ltd. Method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법

Also Published As

Publication number Publication date
TW200737127A (en) 2007-10-01
US20070233293A1 (en) 2007-10-04
CN101410890A (zh) 2009-04-15
JP2009530672A (ja) 2009-08-27
PL1999744T3 (pl) 2013-04-30
ES2398573T3 (es) 2013-03-20
CN101410890B (zh) 2012-01-25
HK1122127A1 (en) 2009-05-08
BRPI0621530B1 (pt) 2019-11-12
EP1999744A1 (en) 2008-12-10
BRPI0621530A2 (pt) 2011-12-13
KR101002835B1 (ko) 2010-12-21
TWI339836B (en) 2011-04-01
US7965848B2 (en) 2011-06-21
JP5158814B2 (ja) 2013-03-06
WO2007110102A1 (en) 2007-10-04
EP1999744B1 (en) 2012-11-28

Similar Documents

Publication Publication Date Title
KR101002835B1 (ko) 감소된 개수의 채널 디코딩
US10425757B2 (en) Compatible multi-channel coding/decoding
US7394903B2 (en) Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP2216776B1 (en) Binaural multi-channel decoder in the context of non-energy-conserving upmix rules
EP1808047B1 (en) Multichannel audio signal decoding using de-correlated signals
EP1774515B1 (en) Apparatus and method for generating a multi-channel output signal
KR101010464B1 (ko) 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성
KR101215872B1 (ko) 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩
PT2372701E (pt) Codificação aprimorada e representação de parâmetros de codificação de objeto de downmix multicanal
PT1829026T (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial
RU2696952C2 (ru) Аудиокодировщик и декодер
US20220060838A1 (en) Binaural Dialogue Enhancement
RU2406262C2 (ru) Декодирование уменьшенного количества каналов
MX2008012280A (es) Numero reducido de decodificacion de canales.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141201

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151130

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161130

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171129

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181128

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20191129

Year of fee payment: 10