KR20160072130A - 2개 이상의 기본 신호로부터 다채널 신호의 유도 - Google Patents

2개 이상의 기본 신호로부터 다채널 신호의 유도 Download PDF

Info

Publication number
KR20160072130A
KR20160072130A KR1020167011299A KR20167011299A KR20160072130A KR 20160072130 A KR20160072130 A KR 20160072130A KR 1020167011299 A KR1020167011299 A KR 1020167011299A KR 20167011299 A KR20167011299 A KR 20167011299A KR 20160072130 A KR20160072130 A KR 20160072130A
Authority
KR
South Korea
Prior art keywords
signal
channel
frequency
channels
dependent
Prior art date
Application number
KR1020167011299A
Other languages
English (en)
Inventor
클레멘스 파
Original Assignee
슈트로밍스위스 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CH01727/13A external-priority patent/CH708710A1/de
Application filed by 슈트로밍스위스 게엠베하 filed Critical 슈트로밍스위스 게엠베하
Publication of KR20160072130A publication Critical patent/KR20160072130A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • G06F17/156Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

다채널 신호들 및 특히 3차원 신호들은 가능한 효율적으로 감소되어야 하는 전송되거나 저장될 데이터양에 대해 높은 요건을 설정한다. 여기서, 상기 유형의 데이터 감소를 위한 일반적인 공지된 장치들 또는 방법들은, 예컨대 종래 기술로부터 공지된 고속 푸리에 변환(FFT)에 따라서 공간 정보를 추출하고, 그런 다음 일정한 데이터 스트림으로서 모노 또는 스테레오 신호와 함께 전송하는 매개변수 방법들이다. 상기 기술은, 특히 그 전송을 위해 모노 또는 스테레오 신호를 이용하는 MPEG 서라운드로 공지되어 있다. 시간 불변(정상 상태) 신호들에 대해서는 이 신호들의 수학적으로 정확한 해를 제공하고 시간 가변(비정상 상태) 신호들의 경우에는 특이적 잔차 거동을 나타내는, 상관도 비교를 이용한 다채널 신호들의 직접적인 추출은 본 발명에 따라서 모든 잔차의 기초를 이루면서 매우 간단하게 결정될 신호의 직접적인 검증을 제공한다. 이는, 예컨대 음색의 인공성분들 또는 변색들의 효율적인 감소를 위한 오디오 부호화 및 기타 디마스킹 효과들에서 이용되고, 그 결과로서 (예컨대 NHK 22.2처럼) 최고 차수의 신호들의 효율적인 부호화를 제공한다.

Description

2개 이상의 기본 신호로부터 다채널 신호의 유도{DERIVATION OF MULTICHANNEL SIGNALS FROM TWO OR MORE BASIC SIGNALS}
예컨대 오디오 신호들과 같은 다채널 신호들 및 특히 3차원 신호들은 가능한 효율적으로 감소되어야 하는 전송되거나 저장될 데이터양에 대해 높은 요건을 설정한다.
여기서, 상기 유형의 데이터 감소를 위한 일반적인 공지된 장치들 또는 방법들은, 예컨대 종래 기술로부터 공지된 고속 푸리에 변환(FFT)에 의해 공간 정보(spatial information)를 추출하고 그런 다음 일정한 데이터 스트림으로서 예컨대 다운믹스 신호로서의 모노 또는 스테레오 신호와 함께 전송하는 매개변수 방법들이다. 상기 오디오 기술은 특히 MPEG 서라운드로 공지되어 있고 수학적으로 고려할 때 적응 필터링 방법(adaptive filtering method)을 나타낸다.
의사 스테레오포닉 방법(pseudo-stereophonic method)은, 기하학적 매개변수들을 기반으로, 하나의 모노 신호로부터, 좌측 채널과 우측 채널 간에, 또는 일측과 주 신호(main signal) 간에 신호 성분들의 분배를 계산하는 역 부호화(inverse coding)[공간 오디오 신호들에서 역 문제들(inverse problems)의 해결책]이다. 기하학적 매개변수들로서는, 예컨대 음원과 마이크로폰의 주축 간의 각도 및/또는 마이크로폰의 가상 개방 각도 및/또는 마이크로폰의 좌측 가상 개방 각도 및/또는 마이크로폰의 우측 가상 개방 각도 및/또는 마이크로폰의 방향 특성이 고려된다. 이런 매개변수들은 다운믹스 신호와 함께 전송될 수 있거나, 또는 다운믹스에서 사용되는 매개변수들에 따라서 고정 선택될 수 있거나, 또는 디폴트 값들로서도 결정될 수 있다. 역 부호화는 예컨대 WO2009138205에서 개시되어 있다.
2개의 채널의 상관도 비교(correlation comparison)는 업믹스 신호의 제 3 채널을 얻을 수 있는 추가 가능성이다. 이 경우, 두 채널의 공통 신호 성분들이 결정되며, 이로부터 업믹스 신호의 추가 채널이 결정된다. 공통 신호 성분들의 결정을 위해, 예컨대 고속 푸리에 변환(FFT)을 기반으로 하는 영국 회사 Soundfield(사운드 필드)의 업믹스 시스템(UPM1)과 같은 예컨대 종래 기술로부터 공지된 장치들 또는 방법들이 사용될 수도 있다. 그러나 이는 매우 높은 계산 비용을 요구한다. 여기서 출력 신호들의 생성은 진폭에 따라서 수행되며, 이는 개별 채널들에서 이동하는 음원들 및 시간에 따라 변위되는 인공성분들의 단점을 초래하며, 그리고 전체적으로는 오디오 부호화의 분야에서 간섭 작용을 하는 분명한 스펙트럼 변색들(spectral discoloration)을 야기한다.
그에 따라, 최대한 높은 심리 음향 투명도(psychoacoustic transparency)의 목표를 추가로 충족시키는 상기 상관도 비교를 위한 간단한 장치 또는 간단한 방법이 예컨대 실시간으로 다채널 신호들의 부호화와 관련하여 바람직할 수도 있다.
본 발명에 해당하는 경우와 같은 상기 간단한 장치 또는 간단한 방법이 시간에 따라 가변하는["비정상 상태(non-steady state)"] 신호들에 적용되는 푸리에 변환을 기반으로 한다면, 소위 잔차(residual)가 발생한다. 이런 경우에, 모든 잔차가 전송될 필요가 없도록 인코더 내에서 상기 잔차들을 전반적으로 결정하는 것이 바람직하며, 이로 인해 예컨대 오디오 부호화에서 분명한 대역폭 절감이 이루어진다.
본 발명의 과제는 최고의 투명도에서 상기 상관도 비교를 실행하는 간단한 장치 또는 간단한 방법을 제공하는 것이다.
본 발명은, 상기 시스템이 특히 오디오 신호들에 최적으로 적용된다고 하더라도, 오디오 신호들로만 제한되지 않는다. 본 발명의 대상에 의해, 예컨대 비디오 신호들도 효율적으로 압축되고 압축 해제되거나, 또는 비디오 신호들의 잔차들이 효율적으로 최소화된다.
전반적으로, 본 발명의 대상은, 푸리에 변환 또는 역 푸리에 변환을 기초로 한다면, 모든 시그널링 기술에서 적용되며, 그 결과로서 거기서 예컨대 큰 대역폭 절감을 일으키거나, 또는 효율적인 데이터 추출을 가능하게 한다.
본 발명에 의해, 예컨대 오디오 부호화에서 다운믹스 채널들의 개수는 최소값으로 제한되는데, 그 이유는 부가된 채널들이 다시 상관도 비교에 의해 격리되고 그에 따라 전체적으로 매우 복잡한 오디오 신호들의 효율적인 저장 및 전송도 가능하게 하기 때문이다.
특히 예컨대 형식 NHK 22.2로 공지된 바와 같은 매우 복잡한 상기 3D 오디오 신호들은, 이제, 부분적으로 또는 전체적으로 다시 상기 상관도 비교될 수 있는 상응하는 다운믹스 채널들에 통합된다.
예컨대 NHK-22.2 시스템(또는 유사한 형식)의 미들 레이어(Middle Layer) 및 탑 레이어(Top Layer)는 분리되어 상기 유형의 상관도 비교되는데, 그 이유는 심리 음향의 수평적 계층들이 실질적으로 분리되어 감지되고, 상기 계층들 사이에서, 다시 말하면 수직선, 대각선 등에서는 적은 정도로만 가상 음원들(phantom sound source)을 형성하기 때문이다.
따라서, 수평적 계층의 내부에서 상기 유형의 상관도 비교들을 적용하는 것이 특히 바람직하다. 본 발명이 제한되지는 않는다고 하더라도, 인접한 채널들 상에서 상기 유형의 상관도 비교들을 실시하는 것이 특히 바람직한데, 그 이유는 상위 차수(higher order)의 신호들의 경우 엄격한 채널 분리가 가상 음원들의 깨끗한 형성에 대한 기본 전제 조건을 형성하기 때문이다.
물론, 본 발명은 수평선으로 제한되는 것 아니라, 수직선 또는 대각선 또는 기타 조합들도 사용될 수 있다.
하기 문헌들은 특히 종래 기술에 속하는 것으로서 고려된다.
EP1850639는, 모노 신호로부터 스테레오 신호를 생성하는 정적 필터를 개시하고 있다. 상기 필터는 다채널 신호들에도 적용될 수 있다.
WO2009138205는, 모노 신호로부터 스테레오 신호를 생성하는 정적 필터를 개시하고 있다. 상기 필터는 다채널 신호들에도 적용될 수 있다.
WO2011009649는, 각각 생성된 스테레오 신호의 상관도의 매칭을 위한, EP1850639 및 WO2009138205에 기재된 정적 필터의 확장을 개시하고 있다. 이런 확장은 다채널 신호들에도 적용될 수 있다.
WO2011009650은, 정적 매개변수들과 관련해서 각각 생성된 스테레오 신호를 최적화하기 위해, EP1850639 및 WO2009138205 및 WO2011009649에 기재된 장치들 또는 방법들의 확장들을 개시하고 있다. 이런 확장들은 다채널 신호들에도 적용될 수 있다.
WO2012016992는, 일반적으로 신호 기술에서, 그리고 특히 EP1850639, WO2009138205, WO2011009649 및 WO2011009650에서 대수 불변식들(algebraic invariant)의 최초 실제 사용을 개시하고 있다.
WO2012032178은, EP1850639, WO2009138205, WO2011009649, WO2011009650 및 WO2012016992에 따르는 정적 필터들의 타임 스케일링(time scaling)을 개시하고 있다.
예시로서 도 9를 참고로 간단히 설명되는 본 출원인의 미공개 출원 CH02300/12는, 다채널 신호들에 상기 정적 필터들을 의도대로 적용하기 위해 상기 정적 필터들의 확장들을 개시하고 있으며, 이는 직접적인 상관도 비교를 적용해서, 예컨대 영국 회사 Soundfield의 업믹스 시스템(UPM1)을 직접 사용해서 이루어질 수 있다.
하마사키 키미오(Hamasaki Kimio) 등의 논문 "22.2 다채널 사운드 시스템 및 그 적용(The 22.2 Multichannel Sound System and Its Application)"(AES CONVENTION 118, 2005년5월)은 최고 차수 및 공간 분해능을 갖는 채널 기반 재생 형식을 개시하고 있다.
MPEG 서라운드는 표준으로서 모노 또는 스테레오 신호를 기반으로 다채널 신호들의 전송을 위한 소위 매개변수 방법의 사용을 규정하고 있다.
본 출원인의 미공개 출원 CH02300/12(도 9 또는 하기 내용 참조)에서는 상관도 비교를 이용한 다채널 신호들의 추출이 제안된다. 그러나 상기 문헌은, 종래 기술로부터 공지된 장치들 또는 방법들이 존재하기 때문에, 상기 상관도 비교에 대한 명확한 기술적 해결책을 제시하고 있지 않다.
상기 상관도 비교는, 예컨대 마찬가지로 고속 푸리에 변환(FFT, 하기 내용 참조)을 기반으로 하면서 전체적으로는 높은 계산 비용을 요구하는 영국 회사 Soundfield의 업믹스 시스템(UPM1)에 의해 실행된다. 그러나 여기서 출력 신호들의 생성은 진폭에 따라서 수행되며, 이는 개별 채널들에서 이동하는 음원들 및 시간에 따라 변위되는 인공성분들의 단점을 초래하며, 전체적으로는 오디오 부호화의 분야에서 간섭 작용을 하는 분명한 스펙트럼 변색들을 야기한다.
상기 상관도 비교는 예컨대 동일한 신호 또는 동일한 유형의 신호 성분들이 추가의 원래 또는 연속 형성되는 채널들에 부가되는 소위 다운믹스에도 적용될 수 있으며, 하나 또는 복수의 원래 또는 연속 생성되는 신호들의 하나 또는 복수의 레벨은 기지(旣知) 사항일 수 있다.
하기에서는, 발명의 대상의 부분으로서, 동일한 신호 성분들[x(t) 및 y(t)]이 각각 하기 식의 단시간 상호 상관(short-time cross correlation)에 대해 상관도 +1을 갖는, 두 신호(Li' 및 Ri')의 상기와 같은 상관도 비교가 제안되며,
Figure pct00001
상기 상관도 비교는 한편으로 시간 불변(time-invariant)(정상 상태) 신호들에 대해 수학적으로 정확한 해(exact solution)를 나타내며, 그리고 시간 가변(time-variant)(비정상 상태) 신호들의 경우에는 특이적 잔차 거동을 나타낸다(잔차는 원래의 비정상 상태 신호 섹션과 이 신호 섹션의 푸리에 변환 간의 차를 나타낸다).
상응하는 잔차의 가능한 추출은 본 발명의 대상의 부분이다.
하기에서는, 특이적 잔차 거동을 이용하는 본 발명의 대상의 부분으로서, 전체 시스템의 잔차들이 기지 사항이면, 잔차들에 대한 근사 추출 방법(approximate extraction method)이 제안된다.
동일한 유형의 신호 성분들(Ci *)을 갖는 2개의 채널(Li', Ri')(1 ≤ i ≤ n)이 고려되며, 하기 방정식이 적용된다.
Figure pct00002
시간에 따른 신호들[li'(t) 및 ri'(t)]에 대해 이제 각각 푸리에 급수가 결정된다. 그에 따라서, 합성(synthesis)에 대해, k = ..., -1, 0, 1, ...인 조건으로 하기 식이 적용되며,
Figure pct00003
그리고 분석에 대해서는 하기 식이 적용되며,
Figure pct00004
그리고 고속 푸리에 변환(FFT)이 직접적으로 유도되는 근거가 되는 이산 푸리에 변환(DFT)에 대해서는 실제로 하기 식이 적용되고, 이제 k = 0, ..., N - 1이다.
Figure pct00005
그런 다음, Li, Ri 및 Ci의 실수부들은, 정상 상태 신호들에 대해, 모두 k = 0, ..., N - 1인 경우, 하기 법칙들에 따라서 재추출된다.
1. Li'(k) 및 Ri'(k)의 실수부들의 부호들을 결정한다.
2. k에 대해 부호들이 동일하다면,
- Li'(k) 및 Ri'(k)의 실수부들의 크기들을 결정한다.
- Li'(k) 및 Ri'(k)의 실수부들의 상기 크기들의 최소값들 또는 최대값들을 결정한다.
- 각각 Ci(k)에 대한 실수부로서 상기 최소값의 기초를 이루는 Li'(k) 또는 Ri'(k)의 실수부를 선택한다.
- 최대값의 기초를 이루는 Li'(k) 또는 Ri'(k)의 실수부에서 Ci(k)의 실수부를 감산하고, Li'(k)의 실수부가 상기 최대값의 기초를 이루면, Li(k)에 대한 실수부로서 상기 감산의 결과를 선택하며, 그렇지 않고 Ri'(k)의 실수부가 상기 최대값의 기초를 이루면 Ri(k)의 실수부로서 상기 감산의 결과를 선택한다.
- 아직 결정되지 않은 Li(k) 또는 Ri(k)의 실수부는 영으로 설정한다.
3. Li'(k) 및 Ri'(k)의 실수부들의 부호들이 동일하지 않다면, Ci(k)를 영으로 설정하고, Li(k) = Li'(k) 및 Ri(k) = Ri'(k)인 것으로 설정한다.
Li, Ri 및 Ci의 허수부들은, 정상 상태 신호들에 대해, 모두 k = 0, ..., N - 1인 경우, 하기 법칙들에 따라서 재추출된다.
1. Li'(k) 및 Ri'(k)의 허수부들의 부호들을 결정한다.
2. k에 대해 부호들이 동일하다면,
- Li'(k) 및 Ri'(k)의 허수부들의 크기들을 결정한다.
- Li'(k) 및 Ri'(k)의 허수부들의 상기 크기들의 최소값들 또는 최대값들을 결정한다.
- 각각 Ci(k)에 대한 허수부로서 상기 최소값의 기초를 이루는 Li'(k) 또는 Ri'(k)의 허수부를 선택한다.
- 최대값의 기초를 이루는 Li'(k) 또는 Ri'(k)의 허수부에서 Ci(k)의 허수부를 감산하고, Li'(k)의 허수부가 상기 최대값의 기초를 이루면, Li(k)에 대한 허수부로서 상기 감산의 결과를 선택하며, 그렇지 않고 Ri'(k)의 허수부가 상기 최대값의 기초를 이루면 Ri(k)의 허수부로서 상기 감산의 결과를 선택한다.
- 아직 결정되지 않은 Li(k) 또는 Ri(k)의 허수부는 영으로 설정한다.
3. Li'(k) 및 Ri'(k)의 허수부들의 부호들이 동일하지 않다면, Ci(k)를 영으로 설정하고, Li(k) = Li'(k) 및 Ri(k) = Ri'(k)인 것으로 설정한다.
최종적으로 Li, Ri 및 Ci를 얻기 위해, 시간에 따른 신호들에 대한 합성의 경우, k = ..., -1, 0, 1, ...인 조건에서,
Figure pct00006
이고,
[또는, 이산 푸리에 변환(DFT)에 의한 분석의 경우, k = 0, ..., N - 1인 조건에서,
Figure pct00007
이며,
상기 이산 푸리에 변환으로부터 직접 고속 푸리에 변환(FFT)이 유도되며], 합성을 위해 하기 계수들(fk, gk, hk)이, k = ..., -1, 0, 1, ...인 조건에서, 분석에 따라서 결정되거나,
Figure pct00008
,
또는, 합성을 위해 역 이산 푸리에 변환(IDFT)에 따라서 하기 공식이고, 이 역 이산 푸리에 변환으로부터 직접 역 고속 푸리에 변환(IFFT)이 유도되며, k = 0, ..., N - 1이다.
Figure pct00009
.
일련의 오디오 코덱들은, 오디오 신호들의 손실 없는 또는 손실 있는 압축을 위해, 이미 푸리에 변환 또는 FFT를 이용하기 때문에, 그 외에, 적은 계산 비용으로, 실수부들 또는 허수부들의 추출을 위한 앞에서 기재한 법칙들이 직접 상기 오디오 코덱들 내에 통합될 수 있거나, 또는 실수부들 또는 허수부들의 추출을 위한 상기 법칙들에 예속될 수 있는 신호들이 상기 유형의 오디오 코덱들로부터 유도될 수 있다.
상기 상관도 비교의 개략적 시퀀스는 도 15에 예시적으로 도시되어 있다.
시간에 따르는 다운믹스 신호[Li(t), Ri(t)]의 각각 하나의 채널에 대해, 우선, 고속 푸리에 변환(FFT)이 실시되며, 그에 따른 결과로서 주파수에 따르는 복소수 값의 신호 표현들[Li(k) 및 Ri(k)]이 주어진다. 이제부터 상기 신호 표현들에 Li, Ri 및 Ci의 실수부들 및 허수부들의 추출을 위한 법칙들이 적용된다. 최종적으로, 결과에 따른 신호 표현들[Li(k), Ri(k) 및 Ci(k)]에는 각각의 역 고속 푸리에 변환(IFFT)이 적용된다. 그 결과로서 시간에 따른 신호들[ci(t), li(t) 및 ri(t)]이 생성된다.
비정상 상태 신호들의 경우, 상관도 비교의 상기 형태에서는, 일반적으로 하기 거동을 나타내는 잔차(Δ)가 발생한다.
Figure pct00010
상기 잔차는, 표준적인 청취 상황의 내부에서 ["스위트 스팟(sweet spot)"의 내부에서], 역 고속 푸리에 변환(IFFT)이 직접적으로 유도되는 근거가 되는 역 이산 푸리에 변환(IDFT)에 따르는 Li, Ri 및 Ci의 순수 재생인 경우, 심리 음향적으로 어떠한 역할도 하지 않는데, 그 이유는 잔차가 소실되기 때문이다. 그러나 일상생활의 청취 상황들에서, 그리고 스피커 설치가 비표준적인 경우 나타나는 것과 같은 "스위트 스팟"의 외부에서는, 분명하게 청취될 수 있는 방지되어야 하는 인공성분들이 발생할 수 있다.
특히, 다채널 신호들의 공간 부호화 동안, 상기 방식으로 추출된 신호들이 상기 다채널 신호들의 기초를 이루면, 특히 표준적인 청취 상황의 외부에서 ("스위트 스팟"의 외부에서) 음색의 변색들 및 기타 디마스킹 효과들이 발생할 수 있다.
적용 사례에 따라서, 상기 잔차들을 결정하는 것이 바람직하고, 이는 예컨대 인코더에서 이루어지고, 경우에 따라서, 전송 채널들의 개수를 전체적으로 감소시키기 위해 이루어지고, 이는 추가의 공간 부호화 동안 음색의 변색들 및 기타 디마스킹 효과들을 최소화하거나, 또는 주관적인 감지의 관점에서 제거하기 위해, 최대한 적합하게 근사한다.
잔차(Δ) 자체는, 예컨대 주파수에 따라서 [Li 또는 Ri 또는 Ci에 대한 푸리에 변환은 이미 기지 사항이며, 그에 따라 Li 또는 Ri 또는 Ci에 대해 기재된 것과 동일한 방식으로만 Li * 또는 Ri * 또는 Ci *에 대한 푸리에 변환도 실행된다] 각각의 주파수(k)에 대해 하기와 같이 추출된다[주파수에 따른 계산의 경우, 경우에 따라 Δ(k)에 대해 이어서, 역 고속 푸리에 변환(IFFT)이 직접적으로 유도되는 근거가 되는 역 이산 푸리에 변환(IDFT)이 Li 또는 Ri 또는 Ci에 대해 기재된 것처럼 실행된다]:
Figure pct00011
이는, 1 ≤ i ≤ n인 조건에서, 동일한 유형의 신호 성분들(Ci *)을 포함하는 2개의 채널(Li' 및 Ri')로부터 상관도 비교를 이용하여 잔차 없는 신호의 추출을 위해, 예컨대 인코더의 내부에서 결정되는 관련 잔차(Δ)가 기지 사항이어야 함을 의미하며, 이는 예컨대 오디오 부호화에서 큰 제한을 나타내는데, 그 이유는, 각각의 상관도 비교에 상기 잔차도 부가되어야 하도록, 예컨대 디코더로 절대적으로 전송될 채널 개수가 감소되지 않기 때문이다. 그 대안으로서, 상관도 비교에 의해 결정되는 공통 신호[Ci(t)] 또는 상관도 비교에 의해 결정되는 제 1 개별 신호[Li(t)] 또는 상관도 비교에 의해 결정되는 제 2 개별 신호[Ri(t)]가 시간에 따라서 존재한다면, 잔차들도 시간에 따라서 결정될 수 있다.
원칙상, 상기 잔차 없는 신호들은 단순한 감산 또는 가산을 통해 주파수에 따라서 뿐만 아니라 시간에 따라서도 하기와 같이 추출된다.
Figure pct00012
그러나 하기 관계를 가지면서 각각 인접한 채널들(Li, Ci1, Ri, Ci2 및 Bi)에 대해,
Figure pct00013
Li'과 Ri1' 간의 상관도 비교의 결과로서 나타나는 잔차(Δ1)로부터, 선형 형태로, Ri2'와 Bi' 간의 상관도 비교의 결과로서 나타나는 잔차(Δ2)가 유도되지 않는 것으로 나타났다.
전송할 잔차들의 개수의 현저한 감소를 나타내는 이상적인 근사 결정은 하기의 고려사항에 있다:
n개의 잔차(Δ1, Δ2, Δ3, Δ4, ..., Δn)가 결정되었다면, 차들에 대해 하기 식들이 적용되며,
Figure pct00014
그런 다음, 하기 관계식들이 유도된다.
Figure pct00015
Figure pct00016
.
그에 따라, 예컨대
Figure pct00017
는 모든 잔차에 포함되는 항이다. 동일한 고려 사항은 각각의 Δi(i = 1, ..., n)에 적용된다. n은 실제로 작게 유지되기 때문에, 그 결과로, 상기와 같이 결정된 각각의 항으로 각각의 잔차는 높은 정확도로 근사된다.
하기와 같이 설정한다면,
Figure pct00018
결과로서, 하기 식들이 주어진다.
Figure pct00019
또는
Figure pct00020
또는
Figure pct00021
.
하기 관계식들로부터는,
Figure pct00022
,
이제 하기와 같은 "잔차들에 대한 차분 법칙(difference rule)"이 유도되며,
Figure pct00023
이는, a1, a2, a3, ..., an이, 서로 소실됨으로써, 표준적인 청취 상황의 내부에서 ("스위트 스팟"의 내부에서) 심리 음향적으로 이상적인 잔차 거동을 나타내는 것을 의미한다.
상술한 "차분 법칙"에서는 직접적으로 하기와 같은 "잔차들에 대한 가법 정리(addition theorem)"가 유도되며,
Figure pct00024
이는, 모든 잔차의 평균값이 동시에 상기 잔차들 내에 포함되어 있으며, 어렵지 않게 예컨대 인코더의 내부에서 산출된다는 것을 의미한다.
잔차 보정이, 잔차들(Δ1, Δ2, Δ3, ..., Δn) 대신, 이제 잔차들의 평균값에 의해 실행된다면, 음색의 변색들 및 기타 디마스킹 효과들이 의도대로 최소화될 뿐만 아니라, 이와 동시에 예컨대 오디오 인코더로부터 오디오 디코더로 현저히 감소된 개수의 채널들이 전송된다.
그에 따라, 이제는, 선으로 표시된 삼각형이 자신의 각점들(corner point)로 다운믹스 채널들의 개수를 지시하고 안쪽에 표시된 파선의 삼각형은 상관도 비교에 의해 추가로 추출되는 (그런 다음 선으로 표시된 삼각형의 모든 원래 채널을 근사적으로 얻기 위해 관련 다운믹스 채널들로부터 감산되는) 채널들의 개수를 지시하는 도 2에 따라서, 모든 잔차의 평균값의 전송 동안, 적어도 3개의 채널로부터, 음색의 훨씬 더 적은 인공성분들 또는 변색들 및 기타 디마스킹 효과들을 나타내는 최대 6개의 채널을 추출할 수 있다. 달리 말하면, 선으로 표시된 삼각형의 각점들은 6개의 채널을 포함하는 다채널 신호의 3개의 다운믹스 채널을 나타낸다. 안쪽에 표시된 삼각형의 각점은, 두 인접 다운믹스 채널에 혼합되는 다채널 신호의 채널을 나타낸다. 2개의 다운믹스 채널 사이에 위치하는 상기 추가 채널은, 두 인접 다운믹스 채널(선으로 표시된 삼각형의 각점들) 간의 상관도 비교를 통해, 두 다운믹스 채널 내에 포함된 상기 신호가 추출됨으로써 얻어질 수 있을 뿐만 아니라, 각각 고려되는 모서리 신호(corner signal)에 가장 가깝게 위치하는 삼각형의 변의 중심에 위치하는(제 1 상관도 비교가 실시된 변에는 위치하지 않음에 주의!) 그 인접 신호와의 다운믹스 전에 원래의 두 외부 모서리 신호의 합 역시도 각각 구해질 수 있다. 새로 고려되는 상기 변의 두 다운믹스 채널에 대해서도 상관도 비교가 실시된다면, 다시 두 다운믹스 채널 내에 포함된 신호가 추출된다. 이 신호는 제 1 상관도 비교의 가장 가까운 합으로부터 감산되고, 그런 다음 원래의 모서리 신호가 주어진다. 이것이 총 3개의 인접 쌍의 다운믹스 채널들에 대해 수행된다면, 다시 다채널 신호의 6개의 채널이 얻어진다. 다운믹스 신호들 외에, 정상 상태가 아니면, 이제 6개의 다채널 신호의 정확한 계산을 위해, 3개의 다운믹스 채널 외에, 3개의 잔차도 전송되어야 할 수도 있기 때문에, 전송할 데이터의 양은 다시 다채널 신호의 전송과 동일해질 수도 있다. 그러므로 이제 총 3개의 잔차의 평균값이 전송되며, 그리고 상관도 비교에서 얻어지는 다채널 신호의 6개의 채널은 상기 평균화된 잔차를 기반으로 보정된다.
이제, 선으로 표시된 사각형이 자신의 각점들로 다운믹스 채널들의 개수를 지시하고 안쪽에 표시된 파선의 사각형은 상관도 비교에 의해 추가로 추출되는 (그런 다음 선으로 표시된 사각형의 모든 원래 채널을 근사적으로 얻기 위해 관련 다운믹스 채널들로부터 감산되는) 채널들의 개수를 지시하는 도 3에 따라서, 모든 잔차의 평균값의 전송 동안, 적어도 4개의 다운믹스 채널로부터, 음색의 훨씬 더 적은 인공성분들 또는 변색들 및 기타 디마스킹 효과들을 나타내는 최대 8개의 채널을 추출할 수 있다.
그에 따라, 이제, 선으로 표시된 오각형은 그 각점들로 다운믹스 채널들의 개수를 지시하고 안쪽에 표시된 파선의 오각형은 상관도 비교에 의해 추가로 추출되는 (그런 다음 선으로 표시된 오각형의 모든 원래 채널을 근사적으로 얻기 위해 관련 다운믹스 채널들로부터 감산되는) 채널들의 개수를 지시하는 도 4에 따라서, 모든 잔차의 평균값의 전송 동안, 적어도 5개의 채널로부터, 음색의 훨씬 더 적은 인공성분들 또는 변색들 및 기타 디마스킹 효과들을 나타내는 최대 10개의 채널을 추출할 수 있다.
도 2 내지 도 4는 순수 조합의 의미를 가지며, 그리고 구체적인 스피커 위치들과 혼동되지 않아야 한다.
상기 개요는 무한대 방향으로 확장되지만, 모든 잔차의 산출된 평균값은 상기 고려 사항을 기반으로 점점 더 많이 음색의 인공성분들 또는 변색들 및 기타 디마스킹 효과들을 야기한다.
추가 채널들은 모든 경우에서 존재하거나 연속적으로 유도되는 채널들의 역 부호화로, 또는 종래 기술로부터 공지된 다른 추가 공간 부호화 방법으로 근사 산출된다.
하기에서, "역 부호화"는 특허 출원들 EP1850629 또는 WO2009138205 또는 WO2011009649 또는 WO2011009650 또는 WO2012016992 또는 WO2012032178의 하나 또는 복수의 방법 또는 하나 또는 복수의 장치를 이용하는 기술적 절차를 의미하며, 바로 위에서 언급한 문헌들은 본원에 참조로서 포함된다. 특히 선형 역 부호화는 상기 문헌들에 개시되어 있다. 도 9에는, 상기 선형 역 부호화의 예가 도시되어 있다.
예컨대 인코더와 디코더 사이에서 오디오 데이터의 최대한 효율적인 저장 및 전송을 위해 사용되어야 하는 다운믹스 채널들 또는 잔차들은 종래 기술로부터 공지된 손실 없는 또는 손실 있는 상응하는 베이스 오디오 코덱(이런 베이스 오디오 코덱의 예들은 Opus 또는 MPEG 표준 MP3, AAC, HE-AAC, HE-AAC v2 및 USAC임)으로 추가로 압축되고 압축 해제되며, 각각 사용되는 베이스 오디오 코덱은 전체적으로 기초를 이루는 공간 부호화 방법의 관점에서 추가로 최적화될 수 있다("튜닝").
특히 일련의 오디오 코덱들은 오디오 신호들의 손실 없는 또는 손실 있는 압축을 위해 이미 푸리에 변환 또는 고속 푸리에 변환(FFT)을 이용하고 있기 때문에, 적은 계산 비용으로, 신호들의 실수부들 또는 허수부들의 추출을 위한 전술한 법칙들이 직접 상기 오디오 코덱들 내에 통합될 수 있거나, 또는 실수부들 또는 허수부들의 추출을 위한 상기 법칙들에 예속될 수 있는 신호들이 상기 유형의 오디오 코덱들로부터 유도될 수 있다. 따라서, 전체적으로 필요한 계산 비용은 현저히 감소될 수 있다.
본 발명의 다양한 실시형태들이 하기에 예시로서 설명되며, 하기 도면들이 참조된다.
도 1은 푸리에 변환을 기반으로 2개의 신호의 상관도 비교를 위한 의외로 유용한 알고리즘의 8가지 가능한 경우를 도시한 그래프이며, 단시간 상호 상관을 위해 상관도 +1을 갖는 각각의 신호 성분들은 각각 정상 상태 신호들에 대해 정확하게 추출된다. 그런 다음, 비정상 상태 신호들에 대해, 잔차 보정은 본 발명의 공개 내용에 따라서 정확하게, 또는 모든 잔차의 평균값을 이용해서도 가능하다.
도 2는 선으로 표시된 삼각형에 의해 설명되는, 3개의 채널과의 상응하는 다운믹스에 상기 상관도 비교의 조합 적용을 기하학적으로 나타낸 도면이다.
도 3은 선으로 표시된 사각형에 의해 설명되는, 4개의 채널과의 상응하는 다운믹스에 상기 상관도 비교의 조합 적용을 기하학적으로 나타낸 도면이다.
도 4는 선으로 표시된 오각형에 의해 설명되는, 5개의 채널과의 상응하는 다운믹스에 상기 상관도 비교의 조합 적용을 기하학적으로 나타낸 도면이다.
도 5는 ITU-R BS.775-1에 따르는 5.1 서라운드 배열을 도시한 도면이다.
도 6은 상관도 비교 및 경우에 따른 잔차 보정 또는 추가적인 공간 부호화에 의한 다채널 신호들의 본 발명에 따른 부호화를 나타낸 흐름도이다.
도 7은 NHK-22.2 배열을 도시한 도면이다.
도 8은 FL, FLc 및 FR, FRc에 2개의 역 부호화의 적용과 동시에 NHK-22.2 미들 레이어 신호에 도 6의 적용을 도시한 도면이다.
도 9는 미공개 출원 CH02300/12에 따르는 선형 역 부호화의 예시를 도시한 도면이다.
도 10은 TpC의 추출을 위한 상관도 비교와 동시에 NHK 22.2 탑 레이어 신호에 도 6의 적용을 도시한 도면이다. 상기 상관도 비교는, 머리 위쪽에서, 정확한 위치 측정이 어려운 상태로 유지되는 심리 음향적으로 비임계인 전면 주축에서 일어난다.
도 11은 TpC 및 TpFC의 합의 패닝(panning)과 동시에 NHK-22.2 탑 레이어 신호에 도 6의 적용을 도시한 도면이다. 상기 패닝은 머리 위쪽에서 정확한 위치 측정이 어려운 상태로 유지되는 심리 음향적으로 비임계인 전면 주축에서 일어난다. 패닝에 대한 대안으로서 또는 그에 추가로 역 부호화도 실시될 수 있다.
도 12는 다운믹스를 계산할 뿐만 아니라, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 관련 상관도 비교의 잔차도 계산하는 본 발명의 대상을 기반으로 하는 인코더 모듈을 도시한 도면이다. 모든 출력 신호에 대해 사전에 푸리에 변환(FFT)을 실시하였다.
도 13은 모든 다운믹스를 계산할 뿐만 아니라, 인코더 모듈에 의해 계산되는 모든 잔차의 평균값도 계산하는 본 발명의 대상을 기반으로 하는 NHK-22.2 탑 레이어 신호를 위한 인코더를 도시한 도면이다.
도 14는 인코더 모듈들에 의해 계산된 모든 잔차의 전송된 평균값 및 모든 다운믹스를 기초로, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교를 이용하여, 그리고 합 계산 및 차분 계산을 이용하여 인코더의 원래 입력 신호들을 근사 계산하는 디코더를 도시한 도면이다. 최종적으로, 역 고속 푸리에 변환(IFFT)이 결정된다.
도 15는, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 도시된 상관도 비교의 원리를 도시한 도면이다. 상기 상관도 비교 이전에 고속 푸리에 변환(FFT)이 실시되며, 이 고속 푸리에 변환에 따라 역 고속 푸리에 변환(IFFT)이 실시된다.
5.1 서라운드 신호에 대한 본 발명의 대상의 적용:
역 부호화가 추가로 적용되는 ITU-R BS.775-1에 따르는 5.1 서라운드 신호에 대한 본 발명의 대상의 적용의 단순한 제 1 예시(도 5 참조)는, 채널들(L*, R*, C*, LS*, RS*)에 대해, 하기와 같은 합 계산("다운믹스")을 나타낸다.
Figure pct00025
L' 및 R'은, 효율적인 저장 또는 전송을 위해 (도 6 참조) 특별히 매칭될 수 있는("튜닝") 베이스 오디오 코덱에 의해 압축되고 후속해서 압축 해제된다(본 예시에서 여전히 추가의 공간 부호화 및 복호화는 소위 역 부호화에 의해 일어난다).
인코더에서는, 맨 먼저, 좌측 신호들(LS* 및 L*)이 결합되어 하나의 공통 좌측 신호
Figure pct00026
를 형성하며, 우측 신호들(RS* 및 R*)은 결합되어 하나의 공통 우측 신호
Figure pct00027
를 형성한다. 공통 신호[
Figure pct00028
,
Figure pct00029
]로부터 신호들(LS* 및 L* 또는 RS* 및 R*)을 심리 음향적으로 분리하는 매개변수들의 결정을 위해, 특허 출원들 WO2009138205, WO2011009649, WO2011009650, WO2012016992 또는 WO2012032178 중 어느 하나의 특허 출원에서 개시되는 것과 같은 역 부호화의 방법이 사용된다. 상기 출원들의 공개내용은 공통 신호[
Figure pct00030
,
Figure pct00031
]로부터 신호들(LS* 및 L* 또는 RS* 및 R*)의 심리 음향적 분리를 위해 필요한 매개변수들의 결정을 위해 본원에 포함된다. L' 및 R'의 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교에 의해, 이제 (후속하여 계수 2와 곱해지는) 신호 1/2 * C뿐만 아니라, 2개의 신호(L 및 R)도 추출될 수 있다. 인코더에서는, L'과 R' 간의 상관도 비교의 본 발명에 따른 방법을 통해, 신호들[
Figure pct00032
또는
Figure pct00033
또는 C*]의 추정치가 결정되며, 그리고 잔차(Δ)를 결정하기 위해 실제 신호와의 차가 계산된다. 이제, 인코더는 L', R', Δ, 그리고 두 좌측 신호로 공통 좌측 신호의 분리를 위한 매개변수들, 그리고 두 우측 신호로 공통 우측 신호의 분리를 위한 매개변수들을 출력한다.
상관도 비교는 이미 베이스 오디오 코더에서 실시된 푸리에 변환을 이용할 수 있으며, 이로써 전체적으로 필요한 계산 비용이 현저히 감소된다.
디코더에서는, L' 및 R'로부터 본 발명에 따른 상관도 비교를 기반으로, 신호들[
Figure pct00034
또는
Figure pct00035
또는 C*]의 추정치가 결정된다. 예컨대 인코더로부터 디코더로, 상기 상관도 비교를 위해 선택적으로 전송되는 잔차(Δ)에 의해, 이제, 원래 신호들[C*,
Figure pct00036
Figure pct00037
]은 그 추정치들[C,
Figure pct00038
Figure pct00039
]로부터 하기 공식들에 따라서 재구성된다.
Figure pct00040
그러나 적은 채널 개수로 인해, 상기 잔차 결정은 실질적인 압축으로 이어지는 것이 아니라, 여기서는 오히려 상기 상관도 비교를 수반하면서 그에 상응하게 보정될 수 있는 기본적인 잔차 거동의 설명을 위해 사용된다. 이런 경우에, 복호화된 공통 좌측 신호
Figure pct00041
는 다채널 신호의 원래 채널 조합
Figure pct00042
에 상응한다. 복수의 채널을 포함한 다채널 신호에서, 다른 채널들을 기반으로 하는 추가로 평균화된 잔차가 보정을 위해 사용되어야 한다면, 복호화된 공통 좌측 신호
Figure pct00043
는 (공통 우측 신호의 경우와 유사하게) 단지 추정치일 뿐이다.
분리를 위해 전송되는 매개변수들을 기반으로, 상관도 비교에 의해, 그리고 경우에 따라 잔차 보정에 의해 얻어지는 공통 좌측 신호
Figure pct00044
에 대해 이제 2개의 좌측 채널(L* 및 LS*)이 근사 계산되며, 그리고 상관도 계산을 통해, 그리고 경우에 따라 잔차 보정을 통해 얻어지는 공통 우측 신호
Figure pct00045
에 대해 이제 2개의 우측 채널(R* 및 RS*)이 근사 계산된다. 이는 예컨대 도 9에 도시된 것과 같은 선형 부호화에 의해 수행될 수 있다. 이 경우, 인코더에 의해 수신되는 매개변수들 φ (음원과 마이크로폰 주축 간의 각도), α(특정한 좌측 개방 각도), β(특정한 우측 개방 각도), f(스테레오화할 모노 신호의 방향 특성), λ(상관도의 변동을 위한 증폭 또는 상관도의 변동을 위한 댐핑), 또는 ρ(상관도의 변동을 위한 댐핑) 및 s(시간 매개변수)(또는 이 매개변수들로부터 파생되는 매개변수들)은, 심리 음향학적으로 최적인 입력 신호의 지연 및 증폭을 얻기 위해, 그리고 이렇게 입력 신호를 2개의 인접 채널로 분할하기 위해, 디코더에서 사용된다.
NHK-22.2 미들 레이어 신호에 대한 본 발명의 대상의 적용(도 7, 도 8 및 도 15 참조):
다채널 신호로서의 NHK-22.2 미들 레이어 신호(도 7 참조)에 대한 (여기서는 도 8에 따른) 본 발명의 대상의 적용의 복합적인 제 2 예시는, 채널들(FL, FR, FC, BL, BR, FLc, FRc, BC, SiL 및 SiR)에 대해, 하기의 합 계산(다운믹스 신호의 채널들)을 나타내며,
Figure pct00046
상기 식에서, FL', FR', BL', BR'은 도 8에 따라서 도 3에서 선으로 표시된 사각형의 각점들에 상응한다.
채널들(FL 및 FLc)은 인코더에서 잔차들의 계산을 위해 실행되는 상관도 비교 이전에 결합되어 하나의 공통 전방 좌측 채널을 형성하며, 그리고 분리를 위해 필요한 매개변수들이 결정된다. 채널들(RL 및 RLc)은 인코더에서 잔차들의 계산을 위해 실행되는 상관도 비교 이전에 결합되어 하나의 공통 전방 우측 채널을 형성하며, 그리고 분리를 위해 필요한 매개변수들이 결정된다. 이는 예컨대 5.1 시스템에서 채널들(LS* 및 L*)의 결합과 관련하여 기재된 것처럼 실시된다. 그에 상응하게, 디코더에서는, 다운믹스 신호의 채널들(FL', FR', BL', BR')을 기반으로, 상관도 비교 및 경우에 따른 평균화된 잔차(Δ)에 의한 보정으로, 다채널 신호의 채널들[
Figure pct00047
,
Figure pct00048
, FC, BL, BR, BC, SiL 및 SiR]이 결정된다. 그런 후에, 5.1 시스템의 채널들(L*, LS*, R*, RS*)과 유사하게, 채널들[
Figure pct00049
,
Figure pct00050
]로부터 채널들(FL, FR, FLc, FRc)이 결정된다. FL', FR', BL', BR'뿐만 아니라 모든 잔차(Δ1, Δ2, Δ3, Δ4)의 평균값(Δ)도, 예컨대 인코더와 디코더 사이에서 효율적인 저장 또는 전송을 위해 (도 6 참조) 특별히 매칭될 수 있는("튜닝") 베이스 오디오 코덱에 의해 압축되고 후속해서 압축 해제된다[본 예시에서 여전히 추가적인 공간 부호화 및 복호화는 채널들(FL 및 FLc) 간, 또는 채널들(RL 및 RLc) 간의 역 부호화에 의해 일어난다].
하기에서 기재되는 시스템은 이미 베이스 오디오 코더에서 실행된 푸리에 변환을 이용할 수 있으며, 이로써 전체적으로 필요한 계산 비용은 현저히 감소된다.
신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 FL'과 FR'의 상관도 비교에 의해, 이제 (후속하여 계수 2와 곱해지는) 신호[0.5 * (FC - 2 * Δ1)]가 추출될 뿐만 아니라, 2개의 신호[(FL +
Figure pct00051
* FLc + 0.5 * SiL) + Δ1 및 (FR +
Figure pct00052
* FRc + 0.5 * SiR) + Δ1] 도 추출된다. 이에 대해서는 도 8 참조.
신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 FR' 및 BR'의 상관도 비교에 의해, 이제 (후속하여 계수 2와 곱해지는) 신호[0.5 * (SiR - 2 * Δ2)]가 추출될 뿐만 아니라, 2개의 신호[(FR +
Figure pct00053
* FRc + 0.5 * FC) + Δ2 및 (BR + 0.5 * BC) + Δ2]도 추출된다. 이에 대해서는 도 8 참조.
신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 BR' 및 BL'의 상관도 비교를 통해, 이제 (후속하여 계수 2와 곱해지는) 신호[0.5 * (BC - 2 * Δ3)]가 추출될 뿐만 아니라, 2개의 신호[(BR + 0.5 * SiR) + Δ3 및 (BL + 0.5 * SiL) + Δ3]도 추출된다. 이에 대해서는 도 8 참조.
신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 FL' 및 BL'의 상관도 비교를 통해, 이제 (후속하여 계수 2와 곱해지는) 신호[0.5 * (SiL - 2 * Δ4)]가 추출될 뿐만 아니라, 2개의 신호[(FL +
Figure pct00054
* FLc + 0.5 * FC) + Δ4 및 (BL + 0.5 * BC) + Δ4]도 추출된다. 이에 대해서는 도 8 참조.
이렇게 추출된 신호들[0.5 * (FC - 2 * Δ1), 0.5 * (SiR - 2 * Δ2), 0.5 * (BC - 2 * Δ3), 0.5 * (SiL - 2 * Δ4)]에 의해, 잔차들(Δ1, Δ2, Δ3, Δ4)이 기지 사항이 아니면, 이제 모든 잔차 신호들(FL +
Figure pct00055
* FLc, FR +
Figure pct00056
* FRc, BR, BL)이 하기와 같이 근사 산출된다:
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
2배의 해 경로(solution path)로부터, 상관도 비교가 반드시 총 3개의 가능한 출력 신호에 대해 수행되지 않아도 될뿐더러(도 14 역시도 참조), 더 적은 수의 출력 신호도 포함될 수 있는 것이 나타난다. 여기서, 상기 방정식들로부터 어렵지 않게 유도되는 매우 많은 다양한 조합 가능성이 나타난다.
그 외에, 동일한 비고 사항들은 잔차 보정들을 이용한 시스템들에도 적용된다.
잔차들(Δ1, Δ2, Δ3, Δ4)이 기지 사항이라면, 굵은 글씨체로 표시된 하기 잔차 보정들이 제시된다(그러나 상기 시스템의 경우, 압축은 달성되지 않는데, 그 이유는 각각의 상관도 비교에 결국은 적어도 하나의 상기 잔차가 할당되어야 하기 때문이다):
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
이제, 잔차 보정들이 잔차들(Δ1, Δ2, Δ3, Δ4)에 의해 실시되는 것이 아니라, 모든 잔차의 평균값(Δ)에 의해 실행된다면, 이제부터 굵은 글씨체로 표시된 잔차 보정들은 식(- 2Δ)으로 대체된다. 이는, 잔차 보정이 없는 신호들에 비해, 음색의 인공성분들 또는 변색들 및 기타 디마스킹 효과들을 현저히 감소시키며, 이와 동시에 모든 잔차(Δ1, Δ2, Δ3, Δ4)는 예컨대 인코더로부터 디코더로 전송되지 않아도 된다. 그에 따라, 대역폭의 큰 감소가 이루어진다.
예컨대 본 출원인의 미공개 출원 CH02300/12에 따르는 소위 역 부호화(도 9 참조)와 같은 다른 공간 부호화 및 복호화가 적용되어야 한다면, 상기 공간 부호화 및 복호화는 도 6에 따른 상기 고려사항들에 직접 통합된다.
예컨대 FL 및 FLc 또는 FR 및 FRc는 바람직하게는 절대적으로 추출되거나 근사 추출되는 신호들의 각각의 상기 역 부호화에 의해 (FL +
Figure pct00065
* FLc)에 대해 또는 (FR +
Figure pct00066
* FRc)에 대해 근사 추출된다.
따라서, 예를 들면, 도 9에 따르는 구성의 FL을 위한 좌측 출력 신호는 계수 1(60001)로 증폭되지만, 상기 구성의 FLc를 위한 우측 출력 신호는 계수
Figure pct00067
(60002)로 증폭된다. 동일한 방식으로, 예를 들면, 도 9에 따르는 구성의 FR을 위한 우측 출력 신호는 계수 1(60002)로 증폭되지만, 상기 구성의 FRc를 위한 좌측 출력 신호는 계수
Figure pct00068
(60001)로 증폭된다.
이렇게, NHK-22.2 미들 레이어 신호는 예컨대 인코더와 디코더 사이에서 저장하거나 전송할 데이터와 관련하여 도 6의 의미에서 매우 분명하게 감소된다.
TpC를 포함하지 않은 NHK-22.2 탑 레이어 신호에 대한 본 발명의 대상의 적용(도 7 및 도 10 내지 도 15 참조):
NHK-22.2 미들 레이어 신호에 대해 바로 위에서 설명한 작용 원리는, 하기 방정식들이 상기 예시에서 실행되면, 어렵지 않게 NHK-22.2 탑 레이어 신호에 적용된다.
Figure pct00069
따라서 TpFL 및 TpFR을 위한 추가의 공간 부호화 및 복호화는 생략된다.
그러나 상기 전송 동안, 예컨대 NHK-22.2 탑 레이어 신호들의 경우 중요한 역할을 하는 TpC는 무시된다.
TpC를 포함하는 NHK-22.2 탑 레이어 신호에 대한 본 발명의 대상의 적용(도 7 및 도 10 내지 도 15 참조):
NHK-22.2 탑 레이어 신호(도 7 참조)에 대한 여기서는 도 10 및 도 11에 따른 본 발명의 대상의 적용의 복합적인 제 4 예시는, 채널들(TpFL, TpFR, TpFC, TpC, TpBL, TpBR, TpSiL, TpSiR, TpBC)에 대해, 합 계산("다운믹스")을 나타내며,
Figure pct00070
또는
Figure pct00071
,
TpFL', TpFR', TpBL', TpBR'은 다시 도 3에 따라서 도 10에서 선으로 표시된 사각형의 각점들에 상응한다. 이제, 사각형의 각각의 변에 대해, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교가 종래의 NHK-22.2 배열들에 대해 설명된 방식으로 실행되며, 그에 따라, 하기의 새 공식들을 제외하고 전술한 바와 동일한 신호들이 제공된다:
Figure pct00072
Figure pct00073
또는
Figure pct00074
Figure pct00075
이런 경우, TpFL + 0.5 * TpC 및 TpBR + 0.5 * TpC 또는 TpFR + 0.5 * TpC 및 TpBL + 0.5 * TpC를 위해, 그리고 도 3을 위해 근사 추출된 신호들 중 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교에 대해, 인접한 상관도 비교들의 결과로서 나타나는 근사 신호들의 경우 단지 차(η4 - η3) 또는 (η2 - η1) 또는 (η1 - η4) 또는 (η3 - η2)만이, 합(Δ1 + Δ2 + Δ3 + Δ4)의 평균값만큼 잔차 보정 후에, 상기 새로운 상관도 비교의 결과로서 나타나는 잔차에 직접적으로 영향을 미치는 것이 적용된다.
마찬가지로 다운믹스가 가능할 수도 있다.
Figure pct00076
이제부터는,
Figure pct00077
그에 따라
Figure pct00078
고려된다.
본 발명의 공개내용에서와 동일한 고려사항에 의해 하기 식들이 제공된다:
Figure pct00079
이는, 이런 경우에 TpC의 추출에 어떠한 공통 잔차도 할당될 수 없다는 것을 의미한다.
따라서, 이런 다운 믹스가 가능하지만, TpC의 추출에 관련된 잔차가 함께 전송되지 않으면, 추천되지 않는다.
상관도 비교를 이용한 TpC의 근사 추출에 대한 대안은 하기의 다운믹스이며,
Figure pct00080
상기 다운 믹스에서, TpFL'과 TpFR' 간의 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교의 경우, 직접 (0.5 * TpFC + 0.5 * TpC - 2 * Δ1)이 추출되며, 후속해서 잔차 보정이 전술한 형태로 실시된다.
실제로는 TpFC와 TpC 간의 위치 측정에는, 심리 음향의 측면에서, 하기와 같이 의도대로 이용되는 높은 불선명도가 존재한다:
TpC의 추출을 위한 상관도 비교 대신, 종래 기술로부터 공지된 단일 또는 이중 패닝(panning)에 의해, 정확하거나 근사된 신호(0.5 * TpFC + 0.5 * TpC)의 매핑 방향(mapping direction) 또는 매핑 폭(mapping width)은, 원래 신호와 최대한 동일해지고 그에 따라 심리 음향적으로 원래 신호와 유사한 인상(impression)이 생기도록, 영향을 받는다. 그에 따라, 공간 부호화 대신, 또는 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따른 TpC의 추출을 위한 상관도 비교 대신, 단지 단일 또는 이중 패닝의 매개변수들만이 전송된다.
예컨대 소위 역 부호화(앞의 내용 참조)와 같은 다른 공간 부호화 및 복호화가 적용되어야 한다면, 상기 공간 부호화 및 복호화는 상기 고려사항들에 직접 통합된다.
예컨대 TpFC 및 TpC는 바람직하게는, 단일 또는 이중 패닝과 결합될 수 있는, 이미 앞에서 설명한 것과 같은 도 9에 따른 역 부호화에 의해 표현된다. 그 결과, 심리 음향적 조건들로 인해, 정확하고 자연스런 청취 인상(hearing impression)이 주어진다.
TpFL', TpFR', TpBL', TpBR'뿐만 아니라, 경우에 따른 모든 잔차(Δ1, Δ2, Δ3, Δ4)의 평균값(Δ)[및 필요한 경우, TpC의 결정을 위해 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교의 결과로서 나타나는 잔차 또는 TpC 신호 자체도]은 효율적인 저장 또는 전송을 위해 (도 6 참조) 특별히 매칭될 수 있는("튜닝") 베이스 오디오 코덱에 의해 예컨대 인코더에서 압축되고 후속해서 예컨대 디코더에서 압축 해제된다(본 예시에서 여전히 추가의 공간 부호화 및 복호화는 예컨대 소위 역 부호화에 의해 일어날 수 있거나, 또는 단일 또는 이중 패닝도 일어날 수 있다).
전체적으로 설명된 시스템들은 이미 베이스 오디오 코덱에서 실시된 푸리에 변환을 이용할 수 있으며, 이로써 전체적으로 필요한 계산 비용이 현저히 감소된다.
TpC를 포함하지 않은 NHK-22.2 탑 레이어 신호를 위한 인코더 및 디코더의 예시에 따른 구성(도 7 및 도 10 내지 도 15 참조):
전체적으로, 설명한 부호화에 할당된 매개변수들(도 6 참조)은 헤더 정보로서, 데이터 펄스로서, 또는 일정한 데이트 스트림으로서, 예컨대 인코더로부터 디코더로 전송된다.
TpC를 포함하지 않은 NHK-22.2 탑 레이어 신호의 부호화 및 복호화를 위한 인코더 및 디코더의 가능한 구성은 도 12 내지 도 14에 도시되어 있다:
이 경우, 도 12에는, 3개의 인접한 입력 채널[li *(t), ci *(t) 및 ri *(t)] 또는 선택적으로 하나의 추가 입력 채널[ci1 *(t)] 또는 하나의 추가 입력 채널[ci2 *(t)]이 공급되는 인코더 모듈(Ei)이 도시되어 있다. 상기 3개의 입력 채널에서 하기의 다운믹스가 계산되며,
Figure pct00081
경우에 따라서 ci1 *(t) 또는 ci2 *(t)는 각각 가장 가깝게 위치하면서 두 다운믹스 채널[Li'(t) 및 Ri'(t)]에 부가되지 않는 중앙 채널(그에 따라 TpFC 또는 TpSiR 또는 TpBC 또는 TpSiL)을 나타낸다. 그런 다음, 두 다운믹스 채널[Li'(t) 및 Ri'(t)]을 위해 각각 고속 푸리에 변환(FFT)이 실행된다. 상기 다운믹스 채널들은 한편으로 인코더 모듈의 출력 채널들을 제공하며, 다른 한편으로는 상기 다운믹스 채널들에, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 상관도 비교가 적용된다. 입력 채널[ci *(t)]에 대해서도 고속 푸리에 변환(FFT)이 실행된다. 이제, 잔차(Δi)는 하기 식에 따라서 결정되며,
Figure pct00082
상기 잔차는 마찬가지로 인코더 모듈의 출력 신호를 나타낸다. [설명된 시스템은 본 발명의 공개내용에 따라서 추가 입력 신호들을 추가해서 예컨대 도 14에 따라서, 잔차(Δi)가 하기 공식들에 따라서도
Figure pct00083
계산될 수 있도록, 변형된다.]
도 13에는 인코더의 전체 구성이 도시된다. 4개의 인코더 모듈(E1, E2, E3, E4)에는 하기 입력신호들이 할당된다.
Figure pct00084
인코더 모듈(E1)은 출력 신호들[L1'(k), R1'(k), Δ1(k)]을 공급한다. 인코더 모듈(E2)은 출력 신호[Δ2(k)]를 공급한다. 인코더 모듈(E3)은 출력 신호들[L3'(k), R3'(k), Δ3(k)]을 공급한다. 인코더 모듈(E4)은 출력 신호[Δ4(k)]를 공급한다.
출력 신호들[L1'(k), R1'(k) 및 L3'(k), R3'(k)]은 동시에 인코더의 출력 신호들을 나타내는 한편, 최종적으로 잔차들[Δ1(k), Δ2(k), Δ3(k), Δ4(k)]의 평균값[Δ(k)]이 계산된다. 상기 평균값은 마찬가지로 인코더의 출력 신호를 나타낸다.
도 14에는 디코더의 구성이 도시된다.
여기서는, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 제 1 상관도 비교가 좌측 입력 신호[L1'(k)] 및 우측 입력 신호[R1'(k)]에 의해 이루어지며, 단지 C1(k)만이 계산된다.
여기서는, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 제 2 상관도 비교가 좌측 입력 신호[R1'(k)] 및 우측 입력 신호[L3'(k)]에 의해 이루어지며, C2(k)뿐만 아니라 L2(k)도 계산된다.
여기서는, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 제 3 상관도 비교가 좌측 입력 신호[L3'(k)] 및 우측 입력 신호[R3'(k)]에 의해 이루어지며, C3(k)뿐만 아니라 L3(k)도 계산된다.
여기서는, 신호들의 실수부들 및 허수부들의 추출을 위한 법칙들(본 발명의 공개내용 참조)에 따르는 제 4 상관도 비교가 좌측 입력 신호[R3'(k)] 및 우측 입력 신호[L1'(k)]에 의해 이루어지며, C4(k)뿐만 아니라 L4(k) 및 R4(k)도 계산된다.
주파수에 따르는 잔차[Δ(k)]에 대한 입력 신호에 의해, 주파수에 따라 표현되는 하기 채널들이 계산된다.
Figure pct00085
상기 주파수 의존성 채널들 각각에 역 고속 푸리에 변환(IFFT)이 적용된다.
따라서, 인코더의 동명의 입력 신호들을 나타내는, 디코더의 하기 출력 신호들이 제공된다:
Figure pct00086
결론:
전체적으로 제시된 원리들은 알고리즘의 측면에서 임의로 확장될 수 있으며, 그리고 그에 따라 전체적으로 예컨대 인코더와 디코더 사이에서 효율적인 저장 또는 전송을 목적으로 하는 다운믹스에 의해 임의의 차수, 실제로는 그 자체로 최고 차수를 갖는 다중 신호들의 효율적인 압축을 허용한다.
청구항 제 9 항 내지 제 42 항은, 2개의 입력 신호로부터 적어도 하나의 공통 신호 및/또는 하나의 제 1 개별 신호 및/또는 하나의 제 2 개별 신호의 결정을 위한 청구항 제 1 항 내지 제 8 항에 따르는 방법을 사용한다. 그 대안으로서, 청구항 제 9 항 내지 제 42 항에서는, 2개의 입력 신호로부터 하나의 공통 신호, 하나의 제 1 개별 신호 및 하나의 제 2 개별 신호의 결정을 위한 각각의 다른 방법이 사용될 수도 있다.
추가로, 본원에서는, 다운믹스 신호 및/또는 복수의 잔차로 평균화된 잔차 및/또는 패닝 매개변수 집합 및/또는 역 부호화의 매개변수들을 포함하는 데이터의 저장 및/또는 전송(예: 파일 또는 또 다른 저장 수단 또는 전송 수단)도 개시되어 있다.
n개의 채널을 포함하는 다채널 신호는 다시 (n-1 > 2) 개의 채널을 포함한 추가 다채널 신호, (n-2 > 2) 개의 채널을 포함한 추가 다채널 신호 등을 포함할 수 있다.
이와 반대로, (n > 2) 개, 또는 (n-1 > 2) 개, 또는 (n-2 > 2) 개의 채널 등을 포함하는 하나의 다중 신호로부터 상위 차수를 갖는 추가 다채널 신호가 유도될 수도 있다.
(k): 주파수
Ci(k): 공통 주파수 의존성 신호 성분
Li(k): 제 1 주파수 의존성 개별 신호 성분
Ri(k): 제 2 주파수 의존성 개별 신호 성분
Li'(k): 제 1 주파수 의존성 입력 신호 성분
Ri'(k): 제 2 주파수 의존성 입력 신호 성분
Δ: 잔차

Claims (42)

  1. 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법에 있어서,
    다수의 주파수에 대한 제 1 주파수 의존성 입력 신호 성분들(Li'(k)) 및 제 2 주파수 의존성 입력 신호 성분들(Ri'(k))을 제공하는 단계;
    상기 다수의 주파수 중 하나의 주파수(k)의 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k)) 및 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 부호들을 비교하는 단계;
    부호 비교를 기반으로 상기 다수의 주파수 중 상기 주파수(k)의 제 1 개별 신호의 제 1 주파수 의존성 개별 신호 성분(Li(k)), 제 2 개별 신호의 제 2 주파수 의존성 개별 신호 성분(Ri(k)) 및 하나의 공통 주파수 의존성 신호 성분(Ci(k)) 중 적어도 하나를 결정하는 단계;
    상기 다수의 주파수의 제 1 주파수 의존성 개별 신호 성분들(Li(k)) 및/또는 상기 다수의 주파수의 제 2 주파수 의존성 개별 신호 성분들(Ri(k)) 및/또는 상기 다수의 주파수의 공통 주파수 의존성 신호 성분들(Ci(k))을 기반으로 적어도 하나의 출력 신호를 결정하는 단계를 포함하는 것을 특징으로 하는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  2. 제 1 항에 있어서, 상기 주파수(k)의 상기 제 1 주파수 의존성 개별 신호 성분(Li(k)), 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k)) 및 상기 공통 주파수 의존성 신호 성분(Ci(k)) 중 적어도 하나를 결정하는 상기 단계는
    상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일한 경우, 상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k)) 중 크기가 더 작은 입력 신호 성분을 기반으로 상기 주파수(k)의 상기 공통 주파수 의존성 신호 성분(Ci(k))을 결정하는 단계; 및/또는
    상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일한 경우, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))의 크기가 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 크기보다 더 크면, 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))으로부터 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))의 차를 기반으로 상기 주파수(k)의 제 1 주파수 의존성 개별 신호 성분(Li(k))을 결정하는 단계; 또는 상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일하지 않은 경우에는, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))을 기반으로 상기 주파수(k)의 상기 제 1 주파수 의존성 개별 신호 성분(Li(k))을 결정하는 단계; 및/또는
    상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일한 경우, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))의 크기가 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 크기보다 더 작으면, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))으로부터 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 차를 기반으로 상기 주파수(k)의 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k))을 결정하는 단계; 또는 상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일하지 않은 경우에는, 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))을 기반으로 상기 주파수(k)의 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k))을 결정하는 단계를 포함하는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  3. 제 2 항에 있어서, 상기 주파수(k)의 상기 제 1 주파수 의존성 개별 신호 성분(Li(k)), 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k)) 및 상기 공통 주파수 의존성 신호 성분(Ci(k)) 중 적어도 하나를 결정하는 상기 단계는
    상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일한 경우, 상기 주파수(k)의 공통 주파수 의존성 신호 성분(Ci(k))으로서, 상기 주파수의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k)) 중 크기가 더 작은 입력 신호 성분을 결정하는 단계; 또는 상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일하지 않은 경우에는, 상기 주파수(k)의 상기 공통 주파수 의존성 신호 성분(Ci(k))을 영(0)으로 설정하는 단계; 및/또는
    상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일한 경우, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))의 크기가 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 크기보다 더 크면, 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))으로부터 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))의 차로서 상기 주파수(k)의 제 1 주파수 의존성 개별 신호 성분(Li(k))을 결정하고, 그렇지 않으면 영(0)으로서 상기 주파수(k)의 상기 제 1 주파수 의존성 개별 신호 성분(Li(k))을 결정하는 단계; 또는 상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일하지 않은 경우에는, 상기 제 1 주파수 의존성 입력 신호 성분(Li(k))으로서 상기 주파수(k)의 상기 제 1 주파수 의존성 개별 신호 성분(Li(k))을 결정하는 단계; 및/또는
    상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일한 경우, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))의 크기가 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 크기보다 더 작으면, 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k))으로부터 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 차로서 상기 주파수(k)의 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k))을 결정하고, 그렇지 않으면 영(0)으로서 상기 주파수(k)의 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k))을 결정하는 단계; 또는 상기 주파수(k)의 상기 제 1 및 상기 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))의 부호가 동일하지 않은 경우에는, 제 2 주파수 의존성 입력 신호 성분(Ri'(k))으로서 상기 주파수(k)의 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k))을 결정하는 단계를 포함하는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 제 1 및 제 2 주파수 의존성 입력 신호 성분(Li'(k), Ri'(k))은 복소수 값이며, 그리고 상기 주파수(k)의 상기 제 1 주파수 의존성 개별 신호 성분(Li(k)), 상기 제 2 주파수 의존성 개별 신호 성분(Ri(k)) 및 상기 공통 주파수 의존성 신호 성분(Ci(k)) 중 적어도 하나를 결정하는 단계는 분리되어 실수부에 대해 1회 및/또는 허수부에 대해 1회 실시되는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 제 1 주파수 의존성 입력 신호 성분들(Li'(k)) 및 제 2 주파수 의존성 입력 신호 성분들(Ri'(k))을 제공하는 단계는, 시간 범위로부터 주파수 범위로 제 1 입력 신호를 푸리에 변환하고 시간 범위로부터 주파수 범위로 제 2 입력 신호를 푸리에 변환하는 것을 포함하는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 적어도 하나의 출력 신호는 주파수 의존성 출력 신호 성분들로 구성되는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  7. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 적어도 하나의 출력 신호는, 다수의 주파수의 상기 제 1 주파수 의존성 개별 신호 성분들(Li(k)) 및/또는 다수의 주파수의 상기 제 2 주파수 의존성 개별 신호 성분들(Ri(k)) 및/또는 다수의 주파수의 상기 공통 주파수 의존성 신호 성분들(Ci(k))을 기반으로 생성되는 주파수 의존성 신호 성분들의 역 푸리에 변환을 통해 생성되는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서, 주파수의 부호들을 비교하는 단계, 및 부호 비교를 기반으로 상기 주파수(k)의 제 1 개별 신호의 제 1 주파수 의존성 개별 신호 성분(Li(k)), 제 2 개별 신호의 제 2 주파수 의존성 개별 신호 성분(Ri(k)) 및 공통 주파수 의존성 신호 성분(Ci(k)) 중 적어도 하나를 결정하는 단계는 각각 다수의 주파수에 대해 실시되는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 방법.
  9. 다채널 신호의 3개의 채널을 다운믹스 신호의 적어도 하나의 채널로 부호화하기 위한 방법에 있어서,
    상기 다채널 신호의 3개의 채널을 상기 다운믹스 신호의 2개의 채널로 다운믹스하는 단계;
    입력 신호들로서 상기 다운믹스 신호의 2개의 채널을 이용하여 제 1 항 내지 제 8 항 중 어느 한 항에 따른 방법에 의해 상기 3개의 채널 중 적어도 하나의 채널을 추정하는 단계; 및
    상기 다채널 신호의 원래 채널과 상기 다채널 신호의 추정된 채널의 차를 통해 잔차를 결정하는 단계를 포함하는, 부호화 방법.
  10. 제 9 항에 있어서, 상기 잔차는, 주파수(k)의 추정되었던 다채널 신호의 원래 채널의 주파수 의존성 신호 성분과 상기 주파수(k)의 추정된 주파수 의존성 신호 성분의 차에 의해 상기 주파수(k)의 주파수 의존성 잔차 성분을 결정하는 것을 통해 결정되며, 상기 잔차는 다수의 주파수의 주파수 의존성 잔차 성분들을 기반으로 결정되는, 부호화 방법.
  11. 제 10 항에 있어서, 상기 다운믹스 신호의 2개의 채널의 푸리에 변환에 의해 상기 다운믹스 신호의 2개의 채널의 주파수 의존성 신호 성분들을 결정하는 단계; 및/또는 상기 다채널 신호의 추정할 원래 채널의 푸리에 변환에 의해 상기 다채널 신호의 상기 추정할 원래 채널의 주파수 의존성 신호 성분들을 결정하는 단계를 추가로 포함하는, 부호화 방법.
  12. 제 11 항에 있어서, 베이스 오디오 인코더에서 출력되는 상기 다운믹스 신호의 2개의 채널 중 적어도 하나의 채널의 상기 주파수 의존성 신호 성분들이 사용되는, 부호화 방법.
  13. 제 9 항 내지 제 12 항 중 어느 한 항에 있어서, 상기 다운믹스 신호의 적어도 하나의 채널은 베이스 오디오 인코더를 통해 압축되는, 부호화 방법.
  14. 제 9 항 내지 제 13 항 중 어느 한 항에 있어서, 상기 다채널 신호의 3개의 채널은 상기 다채널 신호의 3개의 인접 채널인, 부호화 방법.
  15. m < n인 조건에서, n개 채널을 포함한 다채널 신호를 m개 채널을 포함한 다운믹스 신호로 부호화하기 위한 방법에 있어서,
    상기 다채널 신호의 3개의 제 1 채널을 부호화하고 제 9 항 내지 제 14 항 중 어느 한 항에 따른 방법에 따라서 제 1 잔차를 결정하는 단계;
    상기 다채널 신호의 3개의 제 2 채널을 부호화하고 제 9 항 내지 제 14 항 중 어느 한 항에 따른 방법에 따라서 제 2 잔차를 결정하는 단계;
    상기 제 1 잔차 및 상기 제 2 잔차를 기반으로 평균화된 잔차를 결정하는 단계; 및
    상기 부호화에 의해 결정된 상기 다운믹스 신호의 채널들 및 상기 평균화된 잔차를 출력하는 단계를 포함하는, 부호화 방법.
  16. 제 15 항에 있어서, 상기 다채널 신호의 3개의 제 1 채널은 상기 다채널 신호의 제 1 채널, 제 2 채널 및 제 3 채널에 상응하고, 상기 다채널 신호의 3개의 제 2 채널은 상기 다채널 신호의 상기 제 3 채널, 제 4 채널 및 제 5 채널에 상응하고, 상기 제 2 채널은 상기 제 1 및 제 3 채널에 할당된 위치들 사이의 하나의 위치에 할당되고, 상기 제 4 채널은 상기 제 3 및 제 5 채널에 할당된 위치들 사이의 하나의 위치에 할당되고, 제 9 항 내지 제 14 항 중 어느 한 항에 따른 방법에 따라서 상기 다채널 신호의 3개의 제 1 채널을 부호화하는 것은 상기 다채널 신호의 상기 제 2 채널, 상기 제 3 채널 및 상기 제 4 채널을 기반으로 상기 다운믹스 신호의 하나의 채널을 결정하는 것을 포함하는, 부호화 방법.
  17. 제 15 항 또는 제 16 항에 있어서, 상기 3개의 제 1 채널 및 상기 3개의 제 2 채널은 수평적 계층에 위치하는, 부호화 방법.
  18. 제 15 항 내지 제 17 항 중 어느 한 항에 있어서,
    상기 다채널 신호의 3개의 제 3 채널을 부호화하고 제 9 항 내지 제 14 항 중 어느 한 항에 따른 방법에 따라서 제 3 잔차를 결정하는 단계;
    상기 다채널 신호의 3개의 제 4 채널을 부호화하고 제 9 항 내지 제 14 항 중 어느 한 항에 따른 방법에 따라서 제 4 잔차를 결정하는 단계;
    상기 제 1, 제 2, 제 3 및 제 4 잔차를 기반으로 평균화된 잔차를 결정하는 단계; 및
    상기 다운믹스 신호의 결정된 채널들 및 상기 평균화된 잔차를 출력하는 단계를 추가로 포함하는, 부호화 방법.
  19. 제 18 항에 있어서, 상기 다채널 신호는, 전방 좌측 채널, 전방 중앙 채널, 전방 우측 채널, 우측 측면 채널, 후방 우측 채널, 후방 중앙 채널, 후방 좌측 채널 및 좌측 측면 채널을 구비한 수평적 계층의 적어도 8개의 채널을 포함하며, 그리고
    상기 3개의 제 1 채널은 상기 전방 좌측 채널, 상기 전방 중앙 채널 및 상기 전방 우측 채널에 상응하며, 상기 3개의 제 2 채널은 상기 전방 우측 채널, 상기 우측 측면 채널 및 상기 후방 우측 채널에 상응하고, 상기 3개의 제 3 채널은 상기 후방 우측 채널, 상기 후방 중앙 채널 및 상기 후방 좌측 채널에 상응하며, 상기 3개의 제 4 채널은 상기 후방 좌측 채널, 상기 좌측 측면 채널 및 상기 전방 좌측 채널에 상응하며, 그리고
    4회의 부호화에서 결정된 상기 다운믹스 신호의 8개의 채널 중 4개가 출력되는, 부호화 방법.
  20. 제 18 항 또는 제 19 항에 있어서, 상기 다채널 신호는 상기 8개의 채널의 중앙에 위치하거나 또는 상기 8개의 채널 중 어느 하나의 채널에 인접하는 제 9 채널을 포함하며, 그리고 상기 제 9 채널은, 상기 다운믹스 신호의 상기 4개의 채널이 결정되기 전에, 상기 8개의 채널 중 어느 하나의 채널 내에 통합되는, 부호화 방법.
  21. 제 20 항에 있어서, 상기 다채널 신호는, 상기 8개의 채널의 중앙에 위치하거나 또는 상기 8개의 채널 중 어느 하나의 채널에 인접하는 제 9 채널을 포함하며, 그리고 상기 제 9 채널은, 상기 다운믹스 신호의 상기 4개의 채널이 결정되기 전에, 상기 8개의 채널 중 하나의 채널에 가산되는, 부호화 방법.
  22. 제 21 항에 있어서, 패닝 매개변수 집합이 상기 제 9 채널 및 상기 제 9 채널에 가산되는 채널에 대해 결정되며, 상기 패닝 매개변수 집합은 함께 출력되는, 부호화 방법.
  23. 제 15 항 내지 제 22 항 중 어느 한 항에 있어서, 상기 다채널 신호의 상기 3개의 제 1 채널 중 하나의 채널은 부호화 전에 상기 다채널 신호의 추가 채널과 조합되어 하나의 공통 채널을 형성하며, 그리고 상기 공통 채널의 분리를 위한 매개변수들이 함께 출력되는, 부호화 방법.
  24. 제 23 항에 있어서, 상기 공통 채널의 분리를 위한 상기 매개변수들은, 음원과 마이크로폰 주축 간의 각도, 특정한 좌측 개방 각도, 특정한 우측 개방 각도 및 공통 신호의 방향 특성과 같은 적어도 4개의 매개변수를 기반으로 하는, 부호화 방법.
  25. m < n인 조건에서 m개의 채널을 포함한 다운믹스 신호에서 n개의 채널을 포함한 다채널 신호를 복호화하기 위한 방법에 있어서,
    상기 다운믹스 신호의 m개의 채널을 제공하는 단계; 및
    입력 신호들로서 상기 다운믹스 신호의 각각 2개의 채널을 이용하여 제 1 항 내지 제 8 항 중 어느 한 항에 따른 방법을 적어도 1회 적용하는 것을 통해 p > m개의 채널을 결정하는 단계를 포함하는, 복호화 방법.
  26. 제 25 항에 있어서,
    잔차(Δ)를 제공하고; 그리고
    상기 잔차(Δ)에 의해 상기 다채널 신호의 적어도 하나의 채널을 보정하는 것을 포함하는, 복호화 방법.
  27. 제 26 항에 있어서, 상기 다채널 신호의 적어도 하나의 채널은, 제 1 항 내지 제 8 항에 따르는 방법에 의해 결정된 제 1 개별 신호(Li(k)), 제 2 개별 신호(Ri(k)) 및 공통 신호(Ci(k)) 중 적어도 하나를 기반으로 결정되며, 그리고 상기 제 1 개별 신호(Li(k))는 잔차의 감산에 의해 보정되고, 및/또는 상기 제 2 개별 신호(Ri(k))는 상기 잔차의 감산에 의해 보정되고, 및/또는 상기 공통 신호(Ci(k))는 2배의 잔차의 가산에 의해 보정되는, 복호화 방법.
  28. 제 25 항 내지 제 27 항 중 어느 한 항에 있어서, 상기 다운믹스 신호의 적어도 하나의 제 1 채널, 하나의 제 2 채널 및 하나의 제 3 채널은
    상기 다운믹스 신호의 상기 제 1 채널 및 상기 제 2 채널의, 제 1 항 내지 제 8 항에 따르는 방법에 따라서 결정되는 공통 신호를 기반으로 상기 다채널 신호의 제 2 채널을 결정하는 단계; 및
    상기 다운믹스 신호의 상기 제 2 채널 및 상기 제 3 채널의, 제 1 항 내지 제 8 항에 따른 방법에 따라서 결정되는 공통 신호를 기반으로 상기 다채널 신호의 제 4 채널을 결정하는 단계로
    상기 다채널 신호의 적어도 하나의 제 1 채널, 하나의 제 2 채널, 하나의 제 3 채널, 하나의 제 4 채널 및 하나의 제 5 채널로 복호화되는, 복호화 방법.
  29. 제 28 항에 있어서, 평균화된 잔차가 수신되고, 상기 다채널 신호의 상기 제 2 채널은 상기 다운믹스 신호의 상기 제 1 채널 및 상기 제 2 채널의 공통 신호와 상기 평균화된 잔차를 기반으로 결정되며, 상기 다채널 신호의 상기 제 4 채널은 상기 다운믹스 신호의 상기 제 2 채널 및 상기 제 3 채널과 상기 평균화된 잔차를 기반으로 결정되는, 복호화 방법.
  30. 제 28 항 또는 제 29 항에 있어서, 상기 다채널 신호의 상기 제 3 채널은 상기 제 1 채널 및 상기 제 2 채널의 공통 신호와 상기 제 2 채널 및 상기 제 3 채널의 공통 신호를 기반으로 결정되는, 복호화 방법.
  31. 제 25 항 내지 제 30 항 중 어느 한 항에 있어서,
    상기 다운믹스 신호의 4개의 채널 및 평균화된 잔차(Δ)를 수신하고;
    입력 신호들로서 상기 다운믹스 신호의 2개의 채널의 4가지 조합을 이용하여 제 1 항 내지 제 8 항 중 어느 한 항에 따른 방법을 4회 적용하는 것을 통해 상기 다채널 신호의 적어도 8개의 채널을 결정하며; 그리고
    제공되는 평균화된 잔차(Δ)에 의해 상기 다채널 신호의 8개의 결정된 채널을 보정하는 것을 포함하는, 복호화 방법.
  32. 제 31 항에 있어서, 상기 다채널 신호의 제 9 채널에 대한 상기 8개의 채널 중 하나의 채널의 신호 성분을 분리하는 것을 추가로 포함하는, 복호화 방법.
  33. 제 32 항에 있어서, 상기 다채널 신호의 제 9 채널을 분리하기 위한 매개변수들이 수신되며, 상기 제 9 채널은 상기 매개변수들을 기반으로 분리되는, 복호화 방법.
  34. 제 32 항에 있어서, 상기 다채널 신호의 상기 제 9 채널은 상기 8개의 채널의 중앙에 위치하거나, 또는 상기 다채널 신호의 8개 채널 중 어느 하나의 채널에 인접하여 위치하는, 복호화 방법.
  35. 제 32 항 내지 제 34 항 중 어느 한 항에 있어서, 상기 분리는 패닝을 위해 제공된 매개변수들 및/또는 역 부호화 및/또는 결정된 관계식을 기반으로 하는, 복호화 방법.
  36. 프로세서에서 실행되는 동안, 제 1 항 내지 제 35 항 중 어느 한 항의 방법 단계들을 실행하도록 형성되는, 컴퓨터 프로그램.
  37. 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 장치에 있어서,
    다수의 주파수에 대한 제 1 주파수 의존성 입력 신호 성분들(Li'(k)) 및 제 2 주파수 의존성 입력 신호 성분들(Ri'(k))을 수신하기 위한 수신 장치;
    상기 다수의 주파수 중 하나의 주파수(k)의 상기 제 1 주파수 의존성 입력 신호 성분(Li'(k)) 및 상기 제 2 주파수 의존성 입력 신호 성분(Ri'(k))의 부호들을 비교하기 위한 비교 장치;
    부호 비교를 기반으로 상기 다수의 주파수 중 상기 주파수(k)의 제 1 개별 신호의 제 1 주파수 의존성 개별 신호 성분(Li(k)), 제 2 개별 신호의 제 2 주파수 의존성 개별 신호 성분(Ri(k)) 및 공통 주파수 의존성 신호 성분(Ci(k)) 중 적어도 하나를 결정하기 위한 계산 장치가 제공되며, 그리고
    상기 계산 장치는, 추가로, 상기 다수의 주파수의 상기 제 1 주파수 의존성 개별 신호 성분들(Li(k)), 및/또는 상기 다수의 주파수의 상기 제 2 주파수 의존성 개별 신호 성분들(Ri(k)), 및/또는 상기 다수의 주파수의 상기 공통 주파수 의존성 신호 성분들(Ci(k))을 기반으로 적어도 하나의 출력 신호를 결정하도록 형성되는 것을 특징으로 하는, 2개의 입력 신호로부터 적어도 하나의 출력 신호를 추출하기 위한 장치.
  38. 다채널 신호의 3개의 채널을 다운믹스 신호의 적어도 하나의 채널로 부호화하기 위한 부호화 장치에 있어서,
    상기 다채널 신호의 3개의 채널을 상기 다운믹스 신호의 2개의 채널로 다운믹스하기 위한 다운믹서;
    입력 신호들로서 상기 다운믹서에서 출력되는 상기 다운믹스 신호의 2개의 채널을 이용하는 제 36 항에 따르는 장치; 및
    상기 다채널 신호의 원래 채널과 상기 다채널 신호의 추정된 채널의 차에 의해 잔차를 결정하기 위한 잔차 장치를 포함하는, 부호화 장치.
  39. m < n인 조건에서, n개 채널을 포함한 다채널 신호를 m개 채널을 포함한 다운믹스 신호로 부호화하기 위한 부호화 장치에 있어서,
    상기 다채널 신호의 3개의 제 1 채널을 부호화하고 제 1 잔차를 결정하기 위한 제 37 항 또는 제 38 항에 따른 부호화 장치;
    상기 다채널 신호의 3개의 제 2 채널을 부호화하고 제 2 잔차를 결정하기 위한 제 37 항 또는 제 38 항에 따른 부호화 장치;
    상기 제 1 잔차 및 상기 제 2 잔차를 기반으로 평균화된 잔차를 결정하기 위한 평균화 장치; 및
    부호화에 의해 결정된 상기 다운믹스 신호의 채널들 및 상기 평균화된 잔차를 출력하기 위한 출력 장치를 포함하는, 부호화 장치.
  40. 제 38 항에 있어서,
    상기 다채널 신호의 3개의 제 3 채널을 부호화하고 제 3 잔차를 결정하기 위한 제 37 항에 따르는 부호화 장치;
    상기 다채널 신호의 3개의 제 4 채널을 부호화하고 제 4 잔차를 결정하기 위한 제 37 항에 따르는 부호화 장치를 추가로 포함하며,
    상기 평균화 장치는 상기 제 1, 제 2, 제 3 및 제 4 잔차를 기반으로 평균화된 잔차를 결정하도록 형성되는, 부호화 장치.
  41. m < n인 조건에서, m개 채널을 포함한 다운믹스 신호에서 n개 채널을 포함한 다채널 신호를 복호화하기 위한 복호화 장치에 있어서,
    상기 다운믹스 신호의 m개 채널을 수신하기 위한 수신 장치; 및
    상기 다채널 신호의 p > m개 채널을 결정하기 위한 입력 신호로서 상기 다운믹스 신호의 각각 2개의 채널을 이용하는 제 36 항에 따른 적어도 하나의 장치를 포함하는, 복호화 장치.
  42. n개 채널을 포함한 다채널 신호를 m개 채널을 포함한 다운믹스 신호로 부호화하기 위한 제 38 항 또는 제 39항에 따른 부호화 장치;
    상기 다운믹스 신호의 m개 채널을 전송하기 위한 전송 수단; 및
    상기 다운믹스 신호의 m개 채널을 상기 다채널 신호의 p > m개 채널로 복호화하기 위한 제 40 항에 따른 복호화 장치를 포함하는, 시스템.
KR1020167011299A 2013-10-02 2014-10-02 2개 이상의 기본 신호로부터 다채널 신호의 유도 KR20160072130A (ko)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
CH16962013 2013-10-02
CH1696/13 2013-10-02
CH01727/13A CH708710A1 (de) 2013-10-09 2013-10-09 Ableitung von Multikanalsignalen aus zwei oder mehreren Grundsignalen.
CH01727/13 2013-10-09
CH3692014 2014-02-28
CH7432014 2014-05-15
CH9952014 2014-07-01
PCT/EP2014/071154 WO2015049334A1 (de) 2013-10-02 2014-10-02 Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals

Publications (1)

Publication Number Publication Date
KR20160072130A true KR20160072130A (ko) 2016-06-22

Family

ID=51655760

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020167011299A KR20160072130A (ko) 2013-10-02 2014-10-02 2개 이상의 기본 신호로부터 다채널 신호의 유도
KR1020167011324A KR20160072131A (ko) 2013-10-02 2014-10-02 다채널 신호의 다운믹스 및 다운믹스 신호의 업믹스 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020167011324A KR20160072131A (ko) 2013-10-02 2014-10-02 다채널 신호의 다운믹스 및 다운믹스 신호의 업믹스 방법 및 장치

Country Status (6)

Country Link
US (1) US20160269847A1 (ko)
JP (1) JP2016536855A (ko)
KR (2) KR20160072130A (ko)
CN (1) CN106165453A (ko)
AU (1) AU2014331094A1 (ko)
WO (1) WO2015049334A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190027398A (ko) 2017-09-06 2019-03-15 주식회사 에스큐그리고 실시간 음원 분리 장치 및 음향기기

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2014331092A1 (en) * 2013-10-02 2016-05-26 Stormingswiss Gmbh Derivation of multichannel signals from two or more basic signals
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CN108156575B (zh) * 2017-12-26 2019-09-27 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
CN109286888B (zh) * 2018-10-29 2021-01-29 中国传媒大学 一种音视频在线检测与虚拟声像生成方法及装置
EP3937515A1 (de) 2020-07-06 2022-01-12 Clemens Par Invarianzgesteuerter elektroakustischer übertrager

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9211756D0 (en) * 1992-06-03 1992-07-15 Gerzon Michael A Stereophonic directional dispersion method
EP0608937B1 (en) * 1993-01-27 2000-04-12 Koninklijke Philips Electronics N.V. Audio signal processing arrangement for deriving a centre channel signal and also an audio visual reproduction system comprising such a processing arrangement
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CN101341792B (zh) * 2005-12-20 2010-08-18 弗劳恩霍夫应用研究促进协会 使用两个输入声道合成三个输出声道的装置与方法
MX2010004138A (es) * 2007-10-17 2010-04-30 Ten Forschung Ev Fraunhofer Codificacion de audio usando conversion de estereo a multicanal.
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
CA2793140C (en) * 2010-04-09 2016-05-31 Dolby International Ab Mdct-based complex prediction stereo coding
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
JP2014506416A (ja) * 2010-12-22 2014-03-13 ジェノーディオ,インコーポレーテッド オーディオ空間化および環境シミュレーション
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
EP2645749B1 (en) * 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190027398A (ko) 2017-09-06 2019-03-15 주식회사 에스큐그리고 실시간 음원 분리 장치 및 음향기기

Also Published As

Publication number Publication date
KR20160072131A (ko) 2016-06-22
US20160269847A1 (en) 2016-09-15
CN106165453A (zh) 2016-11-23
WO2015049334A1 (de) 2015-04-09
JP2016536855A (ja) 2016-11-24
AU2014331094A1 (en) 2016-05-19

Similar Documents

Publication Publication Date Title
EP3279893B1 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
KR20160072130A (ko) 2개 이상의 기본 신호로부터 다채널 신호의 유도
KR101629862B1 (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
TWI404429B (zh) 用於將多頻道音訊信號編碼/解碼之方法與裝置
JP5053849B2 (ja) マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
JP2009503615A (ja) 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御
CN116741188A (zh) 立体声音频编码器和解码器
US20130279702A1 (en) Device and method for postprocessing a decoded multi-channel audio signal or a decoded stereo signal
JP2016536856A (ja) 二つ以上の基本信号からのマルチチャンネル信号の導出
JP4892184B2 (ja) 音響信号符号化装置及び音響信号復号装置
EP3588495A1 (en) Multichannel audio coding
US20120163608A1 (en) Encoder, encoding method, and computer-readable recording medium storing encoding program
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
JP2007025290A (ja) マルチチャンネル音響コーデックにおける残響を制御する装置
EP2876640B1 (en) Audio encoding device and audio coding method
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid