KR100885192B1 - 개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소 - Google Patents

개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소 Download PDF

Info

Publication number
KR100885192B1
KR100885192B1 KR1020067026450A KR20067026450A KR100885192B1 KR 100885192 B1 KR100885192 B1 KR 100885192B1 KR 1020067026450 A KR1020067026450 A KR 1020067026450A KR 20067026450 A KR20067026450 A KR 20067026450A KR 100885192 B1 KR100885192 B1 KR 100885192B1
Authority
KR
South Korea
Prior art keywords
energy
upmixing
signal
channel
rule
Prior art date
Application number
KR1020067026450A
Other languages
English (en)
Other versions
KR20070038043A (ko
Inventor
라르스 빌레뫼스
크리스토퍼 크죌링
하이코 푸른하겐
요나스 뢰덴
제뢴 브레바트
게라드 호토
Original Assignee
돌비 스웨덴 에이비
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 스웨덴 에이비, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 돌비 스웨덴 에이비
Publication of KR20070038043A publication Critical patent/KR20070038043A/ko
Application granted granted Critical
Publication of KR100885192B1 publication Critical patent/KR100885192B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)
  • Fats And Perfumes (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Amplifiers (AREA)
  • Electroluminescent Light Sources (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Manufacturing Of Micro-Capsules (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

적어도 하나의 베이스 채널에 근거하는 오디오 신호의 멀티채널 복원을 위해서, 에너지 측도가 예측 업믹스로 인한 에너지 손실을 보상하는데 이용된다. 에너지 측도는 인코더 또는 디코더에서 적용될 수 있다. 또한, 비상관 신호가 에너지-손실 도입 업믹싱 과정에 의해 발생된 출력 채널에 가산된다. 비상관 신호의 에너지는 예측 업믹스에 의해 도입된 에너지 에러 보다 작거나 그와 같다. 따라서, 고주파수 복원 기술로 코딩된 업믹싱 신호와 같이 예측 기반 업믹스 방법에 대하여 발생하는 문제가 해결되어서, 업믹스된 신호들 간의 정확한 상관관계가 얻어지거나, 업믹스가 임의의 다운믹스에 맞게 조절된다.
에너지 측도, 스케일링 팩터, 에너지 손실, 업믹싱 파라미터

Description

개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소{Methods and apparatuses for improved performance of prediction based multi-channel reconstruction of audio signals and component thereof}
본 발명은 획득가능한 스테레오 신호 및 추가적인 제어 데이터에 기반을 둔 오디오 신호의 멀티채널 복원에 관한 것이다.
오디오 코딩에 있어서의 최근 발전은 스테레오(또는 모노) 신호 및 해당 제어 데이터에 근거하여 오디오 신호의 멀티채널 표현(representation)을 재생성할 수 있도록 하였다. 이들 방법은, 업믹스(up-mix)라고 불리기도 하는, 추가적인 제어 데이터가 전송된 모노 또는 스테레오 채널에 근거하여 서라운드 채널의 재생성을 제어하기 위해 전송되기 때문에, 돌비 프로로직(Dolby Prologic)과 같은 과거의 매트릭스 기반 솔루션과는 실질적으로 다르다.
따라서, 파라메트릭 멀티채널 오디오 디코더는 전송된 M 채널에 근거하여 N채널을 복원하며, 여기서 N > M이고, 추가적인 제어 데이터이다. 추가적인 제어 데이터는 추가적인 N-M 채널을 전송하는 것보다 상당히 낮은 데이터율(rate)을 나타내며, 코딩을 매우 효율적이게 하고, 동시에 M 채널 디바이스 및 N 채널 디바이스 와 호환성을 갖도록 한다.
이 파라메트릭 서라운드 코딩 방법은 통상 IID(인터채널 강도 차: Inter channel Intensity Difference) 및 ICC(인터채널 가간섭성: Inter Channel Coherence)에 기반을 둔 서라운드 신호의 파라미터화를 포함한다. 이들 파라미터는 업믹스 프로세스에 있어서의 채널 쌍 간에 파워 비율(ratio) 및 상관관계를 나타낸다. 또한 종래 기술에서 이용된 파라미터들은 업믹스 과정 동안에 중간 또는 출력 채널을 예측하는데 이용되는 예측 파라미터를 포함한다.
종래 기술에 설명된 바와 같이, 예측 기반 방식 중에서 가장 매력적인 사용의 하나는, 2개의 전송된 채널로부터 5.1 채널을 복원하는 시스템이다. 이 구성에서는 스테레오 전송이 디코더 측에서 가능하며, 이는 오리지널 5.1 멀티채널 신호의 다운믹스이다. 여기에서 특히 흥미로운 것은, 중앙 채널이 통상 좌측 및 우측 다운믹스 채널 둘 다에 다운믹스되기 때문에, 스테레오 신호로부터 가능한 한 정확하게 중앙채널을 추출할 수 있다는 것이다. 이는, 중앙 채널을 형성하는데 이용된 2개의 전송된 채널 각각에 대한 량을 나타내는 예측 계수를 평가함으로써 수행된다. 이들 파라미터는 상술한 IID 및 IIC 파라미터와 유사한 다른 주파수 영역에 대해서 평가된다.
그러나 예측 파라미터가 2개 신호의 파워 비율을 나타내지는 않지만, 최소 자승 에러 센스(least square error sense)에서의 파형(wave-form) 매칭(mathcing)에 기반을 두기 때문에, 이 방법은 본질적으로 예측 파라미터의 계산 이후에 스테레오 파형에 대한 어떠한 변경에도 민감하게 된다.
최근의 오디오 코딩에서의 다른 발전은 저 비트레이트에서의 오디오 코덱에 있어서 매우 유용한 도구인 고 주파수 복원 방법이다. 일례는 SBR (스펙트럼 밴드 복제: Spectral Band Replication) (W0 98/57436)로서, 이는 MPEG-4 고효율 AAC와 같은 MPEG 표준화 코덱에 이용되는 것이다. 이들 방법의 공통점은, 디코더 측에서, 기본적인 코어코덱과 적은 량의 추가 안내 정보에 의해 코딩된 협대역 신호로부터, 고 주파수를 재생성한다는 것이다. 1 또는 2 채널에 근거하여 멀티채널 신호의 파라메트릭 복원하는 경우와 유사하게, 미싱(missing) 신호 성분(SBR의 경우, 고 주파수)을 재생성하는 데 필요한 제어 데이터의 량은, 전체 신호를 파형 코덱으로 코딩하는 데 필요하게 될 데이터 량 보다 훨씬 적다.
그러나 재생성된 고대역 신호는 오리지날 고대역 신호와 지각적으로는 동일하지만, 실제 파형은 상당히 다르다는 것을 이해하여야 한다. 또한, 저 비트레이트의 스테레오 신호를 코딩하는 파형 코더에 대해서, 스테레오 사전처리(pre-processing)가 일반적으로 이용되며, 이는 스테레오 신호의 미드(mid)/사이드(side) 표현의 사이드(side) 신호에 대한 제한이 수행된다는 것을 의미한다.
멀티채널 표현이 바람직하게 MPEG-4 고효율 AAC를 이용하거나, 또는 고 주파수 복원 기술을 사용하는 다른 어떤 코덱을 이용하는 스테레오 코덱 신호에 기반을 둘 경우에, 다운믹스된 스테레오 신호를 코딩하는 데 이용된 코덱에 대한 이러한 관점과 다른 관점들이 고려되어야 한다.
더 나아가, 멀티채널로서 이용할 수 있는 레코딩을 위해서, 멀티채널 신호의 자동 다운믹스 버전이 아닌, 이용가능한 전용 스테레오 믹스가 있다는 것이 일반적이다. 이는 통상 "정교한 다운믹스(artistic down-mix)"라고 불린다. 이 다운믹스는 멀티채널 신호의 선형 결합으로 표현될 수 없다.
C.Faller의 2004년 9월 24일 PHD 논문 번호 3062 "공간 오디오의 파라메트릭 코딩"에는 복수의 오디오 전송 채널이 포함된 BCC 설계(BCC scheme)를 개시한다. 인코더에서, 입력 채널 C는 전송된 오디오 채널 E로 다운믹스된다. 특정 채널 쌍간의 인터채널 시간차(inter channel time differences), 인터채널 레벨차(inter channel level differences), 및 인터채널 가간섭성(inter channel coherence) 측도는 시간 및 주파수의 함수로서 예측된다(estimated). 예측된 큐(cue)들은 사이드 정보로서 디코더로 전송된다. 디코더측에서, 전송된 오디오 채널 및 사이드 정보(side information)를 포함한 파라미터는 멀티채널 출력신호의 통합을 실행하기 위해 사용된다.
당해 출원의 우선권 날짜 후에 출간된 WO 2005/086139 A1은 오디오의 복수 채널들이 모노포닉 합성신호(monophonic composite signal)와 결합하거나, 또는 오디오의 복수 채널이 복원된 보조정보와 관련된 오디오의 복수 채널에 결합되는 멀티채널 오디오 코딩설계(multi-channel audio coding schme)를 개시한다. 인코딩 과정에서 커플링 아티팩트(coupling artifacts)는 관계있는 인터채널 위상을 다운믹싱하기 전에 조절함으로서 축소된다. 재생성된 신호의 공간 차수 (spatial dimensionality)는 위상각 및 디코더의 비상관정도를 복구함으로서 개선된다.
본 발명의 목적은 향상된 품질을 갖는 복원된 멀티채널 출력을 얻는, 개선된 멀티채널 다운믹스/인코더 또는 업믹스 디코더 컨셉을 제공하는 것이다.
이러한 목적은 청구항 1에 따른 멀티채널 합성기와, 청구항 28에 따른 멀티채널 입력 신호를 처리하는 인코더, 청구항 40에 따른 적어도 3개의 출력 채널을 발생하는 방법, 청구항 41에 따른 인코딩 방법, 청구항 42에 따른 인코딩된 멀티채널 신호, 또는 청구항 43에 따른 기계-판독형 매체(machine-readable medium)에 의해 달성된다. 또한 본 발명의 목적은 적어도 하나의 베이스 채널을 갖는 입력 신호를 이용하여 적어도 3개의 출력 채널을 발생하는 방법, 멀티채널 입력 신호를 처리하는 방법, 송신기, 오디오 레코더, 수신기, 오디오 플레이어, 전송시스템, 송신 방법, 오디오 레코딩 방법, 수신 방법, 및 오디오를 플레이시키는 방법에 의해 달성된다.
본 발명은, 예측 기반 업믹스 방법이 이용될 경우에 있어서, 다운믹스된 멀티채널 신호의 파형 변경 문제에 관한 것이다. 이는 스테레오 사전 처리를 수행하는 코덱, 고 주파수 복원, 및 파형을 상당히 변경하는 다른 코딩 구성에 의해, 다운믹스된 신호가 코딩된 경우를 포함한다. 또한, 본 발명은 정교한 다운믹스를 위한, 즉 멀티채널 신호로부터 자동적이지 않은 다운믹스 신호를 위한, 예측 업믹스 기술을 이용할 경우에 발생하는 문제를 다룬다.
본 발명은 다음의 특징들을 포함한다:
- 다운믹스된 파형 대신 변경된 파형에 근거하여 예측 파라미터를 평가;
- 유리한 주파수 범위에서만 예측 기반 방법의 이용;
- 에너지 손실 및 예측 기반 업믹스 과정에 도입된 채널들 간의 부정확한 상관관계의 보정.
이하, 첨부한 도면을 참조하여, 본 발명의 범위와 사상을 제한하지 않는 예시적인 예를 들어 본 발명을 설명한다.
도 1은 2개채널로부터 3개채널로의 예측 기반 복원을 나타내는 도면이다.
도 2는 에너지 보상을 가지는 예측 업믹스를 나타내는 도면이다.
도 3은 예측 업믹스에서의 에너지 보상을 나타내는 도면이다.
도 4는 다운믹스 신호의 에너지 보상을 갖는 인코더 측에서의 예측 파라미터 평가기(estimator)를 나타내는 도면이다.
도 5는 상관관계 복원을 가지는 예측 업믹스를 나타내는 도면이다.
도 6은 상관관계 복원을 가지는 업믹스에서, 비상관(decorrelated) 신호를 다운믹스된 신호와 믹싱하는 믹싱 모듈을 나타내는 도면이다.
도 7은 상관관계 복원을 가지는 업믹스에서, 비상관 신호를 업믹스된 신호와 믹싱하는 믹싱 모듈의 다른 예를 나타내는 도면이다.
도 8은 인코더 측에서의 예측 파라미터 평가를 나타내는 도면이다.
도 9는 인코더 측에서의 예측 파라미터 평가를 나타내는 도면이다.
도 10은 인코더 측에서의 예측 파라미터 평가를 나타내는 도면이다.
도 11은 본 발명의 업믹서(up-mixer) 디바이스를 나타내는 도면이다.
도 12는 에너지-손실 도입 업믹스(energy-loss introducing up-mix) 및 바람 직한 보상의 결과를 나타내는 에너지 차트이다.
도 13은 바람직한 에너지 보상 방법에 대한 표이다.
도 14a는 바람직한 멀티채널 인코더를 도식적으로 나타낸 도면이다.
도 14b는 도 14a의 디바이스에 의해 수행된 바람직한 방법에 대한 플로우 차트이다.
도 15a는, 도 14a의 디바이스와 비교하여, 다른 파라미터화(parameterisation)를 발생하는 스펙트럼 대역 복사 기능을 갖는 멀티채널 인코더를 나타내는 도면이다.
도 15b는 파라메트릭 데이터의 주파수 선택적인 발생 및 전송에 대한 표이다.
도 16a는 업믹스 메트릭스 계수의 계산을 나타내는 본 발명의 디코더를 도시한 도면이다.
도 16b는 예측 업믹스를 위한 파라미터 계산에 대한 상세한 설명이다.
도 17은 전송 시스템의 송신기 및 수신기를 나타내는 도면이다.
도 18은 본 발명의 인코더를 갖는 오디오 레코더와 디코더를 갖는 오디오 플레이어를 나타내는 도면이다.
(바람직한 실시예의 설명)
하기의 실시예는 단지 본 발명의 원리를 설명하기 위한 것이다. 여기에 설명 된 배치와 세부 사항들에 대한 수정예 및 변형예가 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 자명하다는 것을 유념하여야 한다. 따라서 본 발명은 하기의 실시예의 설명 및 묘사를 통해 나타내어진 특정한 세부사항들에 의해 제한되지 않으며, 오직 청구 범위에 의해서 한정된다.
이하의 파라미터 계산, 적용, 업믹싱, 다운믹싱 또는 다른 어느 동작들까지도, 주파수 대역 선택적인 베이스, 즉 필터뱅크에서의 서브밴드에 대해 수행될 수 있다는 것을 강조하는 바이다.
본 발명의 장점을 설명하기 위해, 먼저 종래 기술의 예측 업믹스에 대해 상세하게 설명한다. 도 1에 도시된 바와 같이, 2 다운믹스 채널에 기반을 둔 3 채널을 가정하며, 도면부호(101)은 좌측 오리지널 채널을 나타내며, 도면부호(102)는 중앙 오리지널 채널을 나타내며, 도면부호(103)은 우측 오리지널 채널을 나타내며, 도면부호(104)는 인코더 측에서의 다운믹스 및 파라미터 추출 모듈을 나타내며, 도면부호(105 및 106)는 예측 파라미터를 나타내며, 도면부호(107)은 좌측의 다운믹스된 채널을 나타내며, 도면부호(108)은 우측의 다운믹스된 채널을 나타내며, 도면부호(109)는 예측 업믹스 모듈을 나타내며, 도면부호(110, 111 및 112)는 복원된 좌측, 중앙 및 우측 채널을 각각 나타낸다.
또한, X는 행(row)으로서 3개의 신호 세그먼트 l(k), r(k), c(k), k=0,...,L-1 을 포함하는 3 x L 메트릭스이라고 가정한다.
마찬가지로, 2개의 다운믹스된 신호 l 0 (k), r 0 (k)X 0 메트릭스을 형성한다. 다 운믹스 처리는 아래와 같이 나타내며,
Figure 112006092983067-pct00001
(1)
여기서 다운믹스 메트릭스은 다음에 의해 정의되며,
D =
Figure 112006092983067-pct00002
(2)
다운믹스의 바람직한 선택은 아래와 같으며,
Figure 112006092983067-pct00003
(3)
이는 좌측 다운믹스 신호 l 0 (k)가 오직 l(k)αc(k)를 포함할 것이고, r 0 (k)는 오직 r(k)αc(k)를 포함할 것이라는 것을 의미한다. 이러한 다운믹스 메트릭스는, 동일한 량의 중앙 채널을 좌측 및 우측 다운믹스에 할당하기 때문에, 그리고 그 어떤 오리지널 우측 채널을 좌측 다운믹스에 할당하지 않거나 그 역도 또한 할당하지 않기 때문에 바람직하다.
업믹스는 아래와 같이 정의 되며,
Figure 112006092983067-pct00004
(4)
여기서 C3 x 2 업믹스 메트릭스이다.
종래 기술에 공지된 바와 같이 예측 업믹스(predictive upmix)는 최소 자승 센스(least squares sense)에서의 C에 대해 중복 결정(overdetermined) 시스템을 해결하는 아이디어에 따르며,
Figure 112006092983067-pct00005
(5)
이는 다음의 일반식에 이르게 된다.
Figure 112006092983067-pct00006
(6)
좌변에 D를 곱하면
Figure 112006092983067-pct00007
이 되고, 이는 X 0 X 0 * = DXX * D *가 정칙(non-singular)인 일반적인 경우에, 다음을 의미하고,
Figure 112006092983067-pct00008
(7)
여기서 I nn 항등메트릭스(identity matrix)을 나타낸다. 이러한 관계는 파라미터 공간 C 를 차원 2로 축소시킨다.
위가 주어지고, 다운믹스 메트릭스 D를 안다면 업믹스 메트릭스
Figure 112006092983067-pct00009
가 디코더 측에서 완전하게 정의 될 수 있고, C 메트릭스의 2개 성분, 예를 들어 c 11 c 22 가 전송된다.
잔여(예측 에러)가 아래와 같이 주어지고,
Figure 112006092983067-pct00010
(8)
좌변에 D를 곱하면 식(7)로 인해 다음이 산출된다.
Figure 112006092983067-pct00011
(9)
1 x L 행 벡터 신호 x r 는 다음과 같으며,
Figure 112006092983067-pct00012
(10)
여기서 v3 x 1 D의 핵(kernel)(영 공간: null space)을 생성하는 단위벡터이다. 이를테면 다운믹스 (3) 식의 경우에, 다음을 이용할 수 있다.
Figure 112006092983067-pct00013
(11)
일반적으로,
Figure 112006092983067-pct00014
Figure 112006092983067-pct00015
일 경우, 이는 단지, 중량 펙터까지, 잔여 신호가 3 개 채널 전부에 대해서 공통이라는 것을 의미한다.
Figure 112006092983067-pct00016
(12)
직교성 원리에 의해, 잔여
Figure 112006092983067-pct00017
는 예측된 신호
Figure 112006092983067-pct00018
,
Figure 112006092983067-pct00019
,
Figure 112006092983067-pct00020
모두에 대해 직교한다.
(본 발명의 바람직한 실시예에 의해 얻어지는 개선점 및 해결된 문제)
명백히 상술한 바와 같은 종래 기술에 따른 예측 기반 업믹스를 이용할 경우 에 다음의 문제가 발생한다.
● 그러한 방법은 최소 평균 자승 에러 센스에서의 매칭(matching) 파형에 따르며, 이는 다운믹스된 신호의 파형이 유지되지 않는 시스템에 대해서는 동작하지 않는다.
● 그러한 방법은 (하기에서 설명되는 바와 같이) 복원된 채널들 간의 상관관계 구조를 제공하지 않는다.
● 그러한 방법은 복원된 채널들에서 정확한 량의 에너지를 복원하지 않는다.
(에너지 보상)
상술한 바와 같이, 예측 기반 멀티채널 복원에서의 문제 중 하나는 예측 에러가 복원된 3개 채널(그냥 "3채널"이라고도 한다)의 에너지 손실에 해당한다는 것이다. 하기에서, 본 발명의 바람직한 실시예에 의해 설명된 바와 같이, 이러한 에너지 손실 및 해결책에 대한 이론이 설명된다. 먼저, 이론적인 분석을 행하고 나서, 이후에 하기에서 설명된 이론에 따르는 본 발명의 바람직한 실시예가 설명된다.
Figure 112006092983067-pct00021
는 각각 X에서 오리지날 신호,
Figure 112006092983067-pct00022
에서 예측 신호 및
Figure 112006092983067-pct00023
에서 예측 에러 신호의 에너지들의 합이라고 한다. 그러면 직교성으로부터 다음이 얻어진다.
Figure 112006092983067-pct00024
(13)
전체 예측 이득은
Figure 112006092983067-pct00025
로서 정의될 수 있지만, 하기에서는 다음의 파라미터를 고려하는 것이 더 편리할 것이다.
Figure 112006092983067-pct00026
(14)
그러므로
Figure 112006092983067-pct00027
는 예측 업믹스의 전체 상관(relative) 에너지를 측정한다.
이러한 ρ가 주어지면, z = l, r, c에 대해
Figure 112006092983067-pct00028
이도록 보상 이득
Figure 112006092983067-pct00029
을 적용함으로써 각 채널을 재조정하는 것이 가능하다. 특히, 목표 에너지는 식(12)에 의해 주어지며,
Figure 112006092983067-pct00030
(15)
따라서 하기식을 풀 필요가 있다.
Figure 112006092983067-pct00031
(16)
여기서, v는 단위벡터이기 때문에,
Figure 112006092983067-pct00032
, (17)
ρ의 정의 식(14)과 식(13)으로부터 하기식이 얻어지고,
Figure 112006092983067-pct00033
, (18)
이러한 모든 것들을 통합하여, 이득이 도출된다.
Figure 112006092983067-pct00034
, (19)
이러한 방법을 이용하여, ρ를 전송하는 것에 추가해서, 디코딩된 채널의 에너지 분포가 디코더에서 계산되어야 한다는 것은 명백하다. 더욱이 단지 에너지들만 정확하게 복원되었지만, 비대각(off diagonal) 상관관계 구조는 무시되었다.
전체 에너지가 유지되는 것은 보장하는 반면 개별 채널들의 에너지가 정확하다는 것은 보장하지 않는, 그러한 이득 값을 유도하는 것이 가능하다. 전체 에너지가 유지되는 것을 보장하는, 모든 채널 g z = g 에 대한 공통 이득이 정의 식
Figure 112006092983067-pct00035
을 통해 얻어진다. 즉,
Figure 112006092983067-pct00036
, (20)
선형성에 의해, 이러한 이득은, 추가적인 파라미터가 전송될 필요가 없도록, 인코더에서 다운믹스된 신호에 적용될 수 있다.
도 2는 출력 채널의 정확한 에너지를 유지하는 동안 3개 채널을 재생성하는 본 발명의 바람직한 실시예를 보여준다. 다운믹스된 신호 l 0r 0 가, 예측 파라미터 c 1 c 2 와 함께, 업믹스 모듈(201)로 입력된다. 업믹스 모듈은 다운믹스 D와 수신된 예측 파라미터에 관한 인지에 근거하여 업믹스 메트릭스 C를 재생성한다. 업믹스 모듈(201)로부터의 3개 출력 채널이, 조정 파라미터(adjustment parameter) ρ와 함께, 도면부호(202)로 입력된다. 이 3개 채널은 전송된 파라미터 ρ의 함수로서 조정된 이득이고, 에너지 보정 채널이 출력된다.
도 3에 조정 모듈(202)의 보다 더 상세한 실시예가 도시되었다. 3개의 업믹스된 채널이 조정 모듈(304)에 입력되고, 또한 모듈 (301), (302) 및 (303)에도 각각 입력된다. 에너지 평가 모듈(301-303)은 3개의 업믹스된 신호의 에너지를 평가하고, 측정된 에너지를 조정 모듈(304)에 입력한다. 인코더로부터 수신된 제어 신호 ρ(예측 이득을 나타냄)가 또한 도면부호(304)로 입력된다. 조정 모듈은 상술한 식(19)을 이행한다.
본 발명의 대안적인 구현에서 에너지 보정이 인코더 측에서 행해질 수 있다. 도 4는 인코더의 구현을 나타내는 것으로서, 여기서 다운믹스된 신호 l 0 (107) 및 r 0 (108)가 도면부호(403)에 의해 계산된 이득 값에 따라 도면부호(401) 및 (402)에 의해 조정된 이득이다. 이득 값은 상술한 식(20)에 따라 유도된다. 상술한 바와 같이 이는 예측 업믹스로부터 3개의 재생성된 채널의 에너지를 계산할 필요가 없기 때문에 본 발명의 장점이다. 그러나, 이는 3개의 재생성된 채널의 전체 에너지가 정확하다는 것만을 보장한다. 이는 개별 채널의 에너지가 정확하다는 것은 보장하지 않는다.
식(3)에 따른 다운믹싱 메트릭스의 바람직한 예가 도 4의 다운믹서의 아래에 표시되었다. 그러나, 다운믹서는 식(2)에서 설명된 바와 같이 어느 일반적인 다운믹스도 적용할 수 있다.
나중에 설명되는 바와 같이, 입력으로서 3채널을 갖고, 출력으로서 2채널을 갖는 본 경우에 대해서는, 적어도 2개의 추가 업믹스 파라미터 c1, c2가 요구된다. 다운믹싱 메트릭스 D가 변수 또는 디코더에 완전히 알려지지 않은 경우에, 파라미터(105) 및 (106)에 추가해서, 이용된 다운믹스에서의 추가 정보가 또한 인코더측에서 디코더측으로 전송되어야 한다.
(상관관계 구조)
종래 기술에 의해 설명된 업믹스 과정에 있어서의 문제 중의 하나는 그것이 재생성된 채널들 간의 정확한 상관관계를 재생성하지 않는다는 것이다. 상술한 바와 같이, 중앙 채널이 좌측 다운믹스 채널과 우측 다운믹스 채널의 선형 결합으로서 예측되고, 좌측과 우측 채널이 좌측 및 우측 다운믹스 채널에서 예측된 중앙 채널을 차감(subracting)함으로써 복원된다. 예측 에러가 예측된 좌측 및 우측 채널에 오리지널 중앙 채널의 잔여물을 남긴다는 것은 명백하다. 이는 3채널들 간의 상관관계가, 오리지널 3채널에 대해서와 동일하지 않은, 복원된 채널들에 대한 것이 라는 것을 의미한다.
바람직한 실시예는 예측된 3채널이 측정된 예측 에러에 따라 비상관 신호와 결합되어야 한다는 것을 말해준다.
이하에서 정확한 상관관계 구조를 얻기 위한 기본 이론을 설명한다. 디코더에서 잔여물을 대해 비상관 신호 x d 을 대체함으로써, 잔여물의 특별한 구조가 완전한 3 x 3 상관관계 구조
Figure 112006092983067-pct00037
를 복원하는데 이용될 수 있다.
먼저, 일반식(6)이
Figure 112006092983067-pct00038
이 되고,
Figure 112006092983067-pct00039
(21)
그리고,
Figure 112006092983067-pct00040
로서,
Figure 112006092983067-pct00041
(22)
이며, 여기서 식(10)과 (17)은 마지막 등호에 대해서 적용되었다.
x d 가 디코딩된 모든 신호
Figure 112006092983067-pct00042
,
Figure 112006092983067-pct00043
,
Figure 112006092983067-pct00044
로부터 비상관화된 신호라고 하면
Figure 112006092983067-pct00045
이다. 강화된(enhanced) 아래식의 신호가
Figure 112006092983067-pct00046
(23)
아래의 상관관계 메트릭스을 가진다.
Figure 112006092983067-pct00047
(24)
오리지널 상관관계 메트릭스(22)를 완전하게 재생성하기 위해, 다음을 충족시킨다.
Figure 112006092983067-pct00048
(25)
만약 x d 가, 이득 γ이 뒤따르는
Figure 112006092983067-pct00049
라고 할 수 있는, 다운믹스된 신호를 비상관화함으로써 얻어진다면, 다음식을 유지하여야 한다.
Figure 112006092983067-pct00050
(26)
이 이득은 인코더에서 계산될 수 있다. 그러나, 식(14)로부터 더 잘 정의된 파라미터
Figure 112006092983067-pct00051
이용된다면,
Figure 112006092983067-pct00052
Figure 112006092983067-pct00053
의 평가는 디코더에서 수행되어야 한다. 이런 점에서, 더 매력적인 대안은 아래와 같이 3개의 비상관화기(decorrelator)를 이용하여 x d 를 발생하는 것이며,
Figure 112006092983067-pct00054
(26a)
그러면,
Figure 112006092983067-pct00055
이고, 그러한 식(25)는 다음식의 선택에 의해 충족된다.
Figure 112006092983067-pct00056
. (27)
도 5는 채널들 간의 정확한 상관관계 구조를 유지하면서, 2개의 다운믹스 채널로부터 3채널의 예측 업믹스하기 위한 본 발명의 바람직한 실시예를 나타낸다. 도 5에서 모듈(109), (110), (111) 및 (112)는 도 1의 것과 동일하며, 여기서는 더 부연설명하지 않을 것이다. 도면부호(109)로부터 출력된 3개의 업믹스된 신호는 비상관 모듈(501), (502) 및 (503)로 입력된다. 이들은 서로 비상관화된 신호를 발생한다. 비상관 신호들은 합해져서 믹싱 모듈(504), (505) 및 (506)으로 입력되며, 거기서 도면부호(109)로부터의 출력과 믹싱된다.
예측적으로 업믹스된 신호를 그것들의 비상관 버전과 믹싱하는 것이 본 발명의 필수적인 특징이다. 도 6은 믹싱 모듈(504), (505) 및 (506)에 대한 하나의 실시예를 나타낸다. 이러한 본 발명의 실시예에서, 비상관 신호의 레벨이 제어 신호 γ에 근거하여 도면부호(601)에 의해 조정된다. 비상관 신호는 다음에 도면부호(602)에서 예측적으로 업믹스된 신호에 더해진다.
3번째 바람직한 실시예는 업믹스된 채널에 대한 비상관화기(501), (502), (503)를 이용한다. 비상관 신호는 또한 비상관화기(501')에 의해 발생될 수 있으며, 이는 입력 신호로서 다운믹스 채널 또는 모든 다운믹스 채널까지 수신한다. 또한 하나 이상의 다운믹스 채널이라면, 도 5에 도시된 바와 같이, 비상관 신호가 또한 좌측 베이스 채널 l0과 우측 베이스 채널 r0를 위한 별도의 비상관화기에 의해서, 그리고 이들 별도의 비상관화기의 출력을 결합함으로써 발생될 수 있다. 이러한 가능성은 실질적으로는 도 5에 도시된 가능성과 동일하지만, 업믹싱 이전의 베 이스 채널이 이용된다는 점에서 도 4에 도시된 가능성과는 차이가 있다.
더욱이, 믹싱 모듈(504), (505) 및 (506)이 3채널 전부에 대해서 동일하지 않은 팩터 γ만을 수신하지 않는 다는 것은 도 5와 관련하여 설명되었으며, 이는 이러한 팩터가 에너지 측도 ρ(energy measure ρ) 에 의존할 뿐만 아니라, 식(10) 및 (11)과 관련하여 설명된 바와 같이 결정된 채널-특정 팩터 νl, νc 및 νr을 수신한다. 그러나 이 파라미터는, 디코더가 인코더에서 이용된 다운믹스를 알고 있을 경우에, 인코더에서 디코더로 전송될 필요가 없다. 대신, 식(10)과 (11)에 나타낸 바와 같이 메트릭스 v에서의 이들 파라미터는 바람직하게는 믹싱 모듈(504), (505) 및 (506)으로 사전-프로그램(pre-programmed)되어서 이들 채널-특정 가중 팩터가 전송될 필요가 없게 된다(그러나 요구가 있을 경우에는 물론 전송될 수 있다).
도 6에서 가중 다바이스(601)가 γ의 산물 및 채널-특정 다운믹스-의존 파라미터 νz를 이용하여 비상관 신호의 에너지를 조정하는 것이 도시되었으며, 여기서z는 l, r 또는 c를 나타낸다. 이 문맥에서, 식(26a)이 xd의 에너지가 예측적으로 업믹스된 좌측, 우측 및 중앙 채널의 합 에너지와 동일하다는 것을 말해준다는 것을 유념한다. 따라서, 디바이스(601)는 단순히 스케일링 팩터(scaling factor) GI를 이용하는 스케일러(scaler)로서 구현될 수 있다. 그러나, 비상관 신호가 대안적으로 발생될 경우에, 믹싱 모듈(504), (505) 및 (506)은 가산 디바이스(602)에 의해 가산된 비상관 신호의 절대 에너지 조정을 수행하여, 가산기(602)에서 가산된 신호 의 에너지가 잔여 신호, 예를 들어 예측 업믹스를 보존하는 비에너지(non-energy)에 의해 손실된 에너지와 동일하도록 하여야 한다.
채널-특정 다운믹스-의존 파라미터 νz와 관련하여, 위에서 도 6에 관해 설명된 동일한 내용이 또한 도 7 실시예에 대해 적용된다.
더욱이, 여기서는 도 6 및 도 7의 실시예가, 예측 업믹싱에서 손실된 에너지의 적어도 일부분이 비상관 신호를 이용하여 가산되는 것에 대한 인정(recognition)에 기반을 두고 있다는 것을 유념한다. 정확한 신호 에너지 및 (상관화되지 않은) 건조(dry) 신호 성분과 (비상관화된)"습윤(wet)" 신호 성분의 정확한 부위를 가지기 위해, 믹싱 모듈(504)로 입력된 "건조" 신호가 사전-스케일링(pre-scaled)되지 않아야 한다. 예를 들어, (도 4에 도시한 바와 같이) 베이스 채널이 디-인코더 측에서 사전-보정(pre-corrected)되었던 경우에는, 채널을 믹서 박스(504), (505) 및 (506)으로 입력하기 전에, 채널을 (상대적인) 에너지 측도 ρ로 곱함으로써, 도 4의 이러한 사전-보정이 보상되어야 한다. 그에 더해, 도 5에 도시된 바와 같이 다운믹스 채널을 업믹서(109)로 입력하기 전에 그러한 에너지 보정이 디코더 측에서 수행되었던 경우에, 동일한 과정이 행해져야 한다.
단지 잔여 에너지의 일부분만이 비상관화된 신호에 의해 커버되는 경우에는, 팩터 ρ 자체 보다는 1에 더 근접한 ρ-의존 팩터에 의해 믹싱 박스(504), (505) 및 (506)로 입력된 신호를 사전-스케일링함으로써, 사전-보정만이 부분적으로 제거되어야 한다. 당연히, 이러한 부분적-보상 사전-스케일링 팩터는 도 7의 도면부호(605)에 입력된 인코더-발생 신호 κ에 의존할 것이다. 그러한 부분적 사전-스케 일링이 수행되어야 하는 경우에는, G2에 적용된 가중 팩터가 필요하지 않다. 대신, 입력(604)에서 합산기(602)로의 분기(branch)가 도 6에서와 동일한 것이다.
(비상관 정도의 제어)
본 발명의 바람직한 실시예는, 정확한 출력 에너지가 계속 유지되는 동안, 예측적으로 업믹스된 신호에 가산된 비상관관계의 량이 인코더로부터 제어될 수 있다는 것을 개시한다. 이는, 전형적인 건조한 음성(speech)의 예인 중앙 채널의 "인터뷰"와 좌측 및 우측 채널이 배경일 때, 중앙 채널에서 예측 에러에 대한 비상관 신호의 대체가 바람직하지 않을 수 있기 때문이다.
본 발명의 바람직한 실시예에 따르면, 도 5에서 설명된 것에 대한 대안적인 믹싱 과정이 이용될 수 있다. 이하에서 본 발명에 따라 어떻게 전체 에너지 보존 및 실제 보상 재생성이 분리될 수 있고, 어떻게 비상관관계의 량이 파라미터 κ에 의해 제어될 수 있는지가 설명된다.
전체 에너지 보존 이득 보상(20)이 다운믹스된 신호에 대해 수행되었고, 그래서 먼저 디코딩된 신호
Figure 112006092983067-pct00057
를 얻었다고 가정할 것이다. 이로부터, 동일한 전체 에너지
Figure 112006092983067-pct00058
를 갖는 비상관 신호 d가, 이를테면 이전 섹션(section)에서와 같이 3개의 비상관화기를 이용하여 생성된다. 그러면 전체 업믹스는 다음식에 따라 정의되고,
Figure 112006092983067-pct00059
. (29)
여기서,
Figure 112006092983067-pct00060
는 전송된 파라미터이다.
Figure 112006092983067-pct00061
의 선택은 비상관 신호 추가가 없는 전체 어네지 보전에 해당하고,
Figure 112006092983067-pct00062
는 완전한 3 x 3 상관관계 구조 재성성에 해당한다. 다음식을 얻으며,
Figure 112006092983067-pct00063
, (30)
식(30)에서 메트릭스들의 대각합(trace)(대각 값(diagonal value)의 합)을 계산함으로써 알 수 있는 바와 같이, 전체 에너지가 모든
Figure 112006092983067-pct00064
에 대해 보존된다. 그러나, 정확한 개별 에너지는
Figure 112006092983067-pct00065
에 대해서만 얻어진다.
도 7은 상술한 이론에 따른 도 5의 믹싱 모듈 (504), (505) 및 (506)의 일례를 나타낸다. 이러한 믹싱 모듈의 대안에서는, 제어 파라미터 γ가 도면부호(702) 및 (701)로 입력된다. 도면부호(702)에 대해 이용된 이득 팩터는 위의 식(29)에 따라 κ에 해당하고, 도면부호(701)에 대해 이용된 이득 팩터는 위의 식(29)에 따라
Figure 112006092983067-pct00066
에 해당한다.
본 발명의 상술한 실시예는, 시스템이 예측 기반 업믹스에 가산되는 비-상관관계의 량을 평가하는, 인코더 측에서의 검출 메커니즘을 채용할 수 있도록 한다. 도 7에 도시된 구현은, 3채널의 전체 에너지가 정확하면서도 여전히 예측 에러의 임의의 량을 비상관 신호에 의해 대체 가능하도록, 지시된 량의 비상관 신호를 가산하고 에너지 보정을 적용할 것이다.
이는, 3개의 배경 신호를 갖는 하나의 예, 예를 들어 다수의 배경을 갖는 클래식 음악 소곡에 대해, 인코더가 "건조한" 중앙 채널의 부재를 검출하고 또한 디코더로 하여금 전체 예측 에러를 비상관 신호로 대체할 수 있게 하여서, 3채널로부터 사운드의 배경을 재생성한다는 것을 의미하며, 이는 종래 기술의 예측기반 방법만으로는 가능하지 않은 방식으로 이루어지는 것이다. 또한, 건조한 중앙 채널을 갖는 신호, 예를 들어, 중앙 채널에 음성 좌측 및 우측 채널에 배경 사운드을 갖는 신호에 대해서, 인코더가 예측 에러를 비상관 신호에 의해 대체한 것이 음향심리학적으로 정확하지 않은 것을 검출하고 대신 디코더로 하여금 3채널의 에너지가 정확하도록 복원된 3채널의 레벨을 조정하게 한다. 상술한 극단적인 예는 명백하게 본 발명의 2개의 가능한 결과를 나타내는 것이다. 본 발명은 상술한 예에서의 극단적인 예들에만 한정되지 않는다.
(변경된 파형에 대한 예측 계수의 조정)
상술한 바와 같이, 예측 파라미터는 오리지널 3채널 X과 다운믹스 메트릭스 D에 주어진 평균 자승 에러(mean square error)를 최소화함으로써 평가된다. 그러나 많은 경우에서, 다운믹스된 신호를, 오리지널 멀티채널 신호를 나타내는 메트릭스 X가 곱해진 다운믹스 메트릭스 D로서, 나타낼 수 있다는 것에 의존할 수 없다.
이에 대한 하나의 명백한 예는 소위 "정교한 다운믹스(artistic downmix)"가 이용될 때, 즉 2채널 다운믹스가 멀티채널 신호의 선형 결합으로서 설명될 수 없을 경우이다. 다른 예는 다운믹스된 신호가, 스테레오-사전 처리 또는 개선된 코딩 효율을 위한 다른 도구를 이용하는 지각(perceptual) 오디오 코덱에 의해 코딩될 경우이다. 많은 지각 오디오 코덱이 미드/사이드 스테레오 코딩에 의존한다는 것은 종래 기술에서 통상 공지되었으며, 여기서 사이드 신호는 비트율 제한 조건 하에서 감쇠되어, 인코딩에 이용된 신호 보다 더 좁은 스테레오 이미지를 갖는 출력을 초래한다.
도 8은 본 발명의 바람직한 실시예를 나타내는 것으로서, 여기서는 멀티채널 신호와는 별개로 인코더 측에서의 파라미터 추출이 또한 변경된 다운믹스 신호에 액세스한다. 여기서는 변경된 다운믹스가 도면부호(801)에 의해 발생된다. 만약 C 메트릭스의 2개 파라미터만이 전송된다면, 업믹스를 행할 수 있게 하기 위해서, 그리고 전체 업믹스된 채널에 대해 최소 평균 자승 에러를 얻기 위해서, 디코더 측에서 D 메트릭스에 대한 인지가 필요하다. 그러나, 본 발명의 실시예는 인코더 측에서 다운믹스된 신호 l 0 r 0 를, 다운믹스 메트릭스 D 를 이용하여 얻어지고, 디코더에서 가정된 것과 반드시 동일하지는 않은 다운믹스된 신호 l' 0 r' 0 로 대체할 수 있다는 것을 개시한다. 인코더 측에서 파라미터 평가에 대해 대안적인 다운믹스를 이용하는 것은 디코더 측에서의 정확한 중앙 채널 재생성만을 보장한다. 인코더에서 디코더로 추가 정보를 전송함으로써 3채널의 보다 더 정확한 업믹스가 얻어질 수 있다. 하나의 극단적인 경우에서 C 메트릭스의 6개 요소 모두가 전송될 수 있 다. 그러나, 본 발명의 실시예는 C 메트릭스의 부분집합(subset)이 만약 도면부호(802)에서 이용된 다운믹스 메트릭스 D에 관한 정보에 수반되었다면 전송될 수 있다는 것을 개시한다.
앞에서 설명한 바와 같이, 지각 오디오 코덱은 저 비트레이트의 스테레오 코딩을 위해 미드/사이드 코딩를 채용한다. 또한, 비트레이트 제한 조건 하에서 사이드 신호의 에너지를 감소시키기 위해 스테레오 사전처리가 일반적으로 채용된다. 이는 스테레 신호에 대해서 스테레오 신호의 폭의 감소는 가청 양자화 왜곡 및 대역폭 제한에 대한 바람직한 코딩 인공음이라는 심리 음향 개념에 근거하여 행해진다.
그러므로, 만약 스테레오 사전처리가 이용된다면, 다운믹스 식(3)은 다음과 같이 표현될 수 있으며,
Figure 112006092983067-pct00067
(31)
여기서, γ은 사이드 신호의 감쇠이다. 앞서 설명한 바와 같이, 3채널을 정확하게 복원할 수 있게 하기 위해서 D 메트릭스이 디코더 측에 알려질 필요가 있다. 따라서 본 발명의 실시예는 감쇠 팩터가 디코더로 보내져야 한다는 것을 개시한다.
도 9는 본 발명의 다른 실시예를 나타내며, 여기서는 도면부호(104)로부터 출력된 다운믹스 신호 l 0 r 0 가, 팩터 γ의해 다운믹스 신호의 미드/사이드 표현의 사이드 신호 (l 0 - r 0 )를 제한하는 스테레오 사전처리 디바이스(901)로 입력된다.
(HFR 코덱 신호를 위한 파라미터화)
만약 예측 기반 업믹스가 SBR [W0 98/57436]과 같은 고 주파수 복원 방법과 함께 이용된다면, 인코더 측에서 평가된 예측 파라미터는 디코더 측에서 재생성된 고대역 신호와 일치하지 않을 것이다. 본 발명의 실시예는 2채널에서 3채널를 재생성하기 위한 대안적인 비파형(non-wave form) 기반 업믹스 구조를 개시한다. 제안된 업믹스 과정은, 비상관 노이즈 신호의 경우에, 모든 업믹스된 채널의 정확한 에너지를 복원하도록 되어 있다.
식(3)에서 정의된 다운믹스 메트릭스
Figure 112006092983067-pct00068
이 이용된다고 가정한다. 또한 이제 업믹스 메트릭스
Figure 112006092983067-pct00069
를 정의할 것이다. 업믹스는 다음식에 의해 정의된다.
Figure 112006092983067-pct00070
(32)
에너지가 L, RC인, 업믹스된 신호 l(k), r(k), 및 c(k)의 정확한 에너지를 재생성하는 것만 한다면, 업믹스 메트릭스이 다음에 따라
Figure 112006092983067-pct00071
Figure 112006092983067-pct00072
의 대각 요소가 동일하도록 선택된다.
Figure 112006092983067-pct00073
. (35)
해당하는 다운믹스 메트릭스에 대한 표현은 다음이 될 것이다.
Figure 112006092983067-pct00074
, (36)
Figure 112006092983067-pct00075
(37)
Figure 112006092983067-pct00076
의 대각 요소를
Figure 112006092983067-pct00077
의 대각 요소와 동일하게 설정하면, C의 요소와 L, RC 간의 관계를 정의하는 다음의 3개 식이 된다.
Figure 112006092983067-pct00078
(38)
상술한 것에 근거하여, 업믹스 메트릭스이 정의될 수 있다. 우측의 다운믹스된 채널을 좌측의 업믹스된 채널로 가산하지 않는 것, 또한 그 역은 업믹스 메트릭스을 정의하는데 바람직하다. 따라서 적합한 업믹스 메트릭스은 다음과 같을 수 있다.
Figure 112006092983067-pct00079
(39)
이는 C 메트릭스에 다음을 부여한다.
Figure 112006092983067-pct00080
(40)
C 메트릭스의 요소가 디코더 측에서 2개의 전송된 파라미터
Figure 112006092983067-pct00081
Figure 112006092983067-pct00082
로부터 재생성될 수 있다는 것을 알 수 있다.
도 10은 본 발명의 바람직한 실시예를 나타낸다. 여기서 도면부호(101 - 112)는 도 1에서와 동일하며, 더 이상 부연설명하지 않는다. 3개의 오리지널 신호(101 - 103)가 평가 모듈(1001)로 입력된다. 이 모듈은 2개의 파라미터, 예를 들어
Figure 112006092983067-pct00083
Figure 112006092983067-pct00084
를 평가하고, 그로부터 디코더 측에서 C 메트릭스이 유도될 수 있다. 이들 파라미터는 도면부호(104)로부터 출력된 파라미터와 함께 선택 모듈(1002)로 입력된다. 하나의 바람직한 실시예에서, 선택 모듈(1002)은, 파라미 터가 파형 코덱에 의해 코딩된 주파수 범위에 대응된다면 도면부호(104)로부터의 파라미터를 출력하고, 파라미터가 HFR에 의해 복원된 주파수 범위에 대응된다면 도면부호(1001)로부터의 파라미터를 출력한다. 선택 모듈(1002)은 또한, 파라미터화가 신호의 다른 주파수 범위를 위해 이용된 정보(1005)를 출력한다.
디코더 측에서, 모듈(1004)이 전송된 파라미터를 받아서, 상술한 파라미터(1005)에 의한 지시에 따라서, 예측 업믹서(109) 또는 에너지-기반 업믹서(1003)로 보낸다. 에너지 기반 업믹서(1003)는 식(40)에 따라 업믹스 메트릭스 C를 수행한다.
식(40)에 개시된 바와 같이 업믹스 메트릭스 C는 동일한 중량(δ)을 가져서 2개의 다운믹스된 신호 l 0 (k), r 0 (k)로부터 평가된 (디코더) 신호 c(k)를 얻는다. 신호 c(k)의 상대적인 량이 2개의 다운믹스된 신호 l 0 (k), r 0 (k)에서 다를 수 있다는 관측 결과(즉, C/L이 C/R과 같지 않음)에 근거하여, 또한 다음의 일반적인 업믹스 메트릭스을 고려할 수 있다.
Figure 112006092983067-pct00085
(41)
c(k)를 평가하기 위해, 본 실시예는 또한 2개의 제어 파라미터 c 1 c 2 의 전송이 필요하며, 이들은 예를 들어 c1 = α2C/(L+α2Χ) 및 c2 = α2Χ/(R+α2C)와 동일한 것이다. 이어, 업믹스 메트릭스 함수 f i 의 가능한 구현이 아래 식에 의해 주어진다.
Figure 112006092983067-pct00086
(42)
Figure 112006092983067-pct00087
(43)
Figure 112006092983067-pct00088
(44)
본 발명에 따른 SBR 범위에 대한 다른 파라미터화의 시그널링(signalling)은 SBR에 제한되지 않는다. 상술한 파라미터화는, 예측 기반 업믹스의 예측 에러가 크다고 간주되는 어느 주파수 범위에서도 이용될 수 있다. 그러므로, 모듈(1002)은, 전송된 신호, 예측 에러 등과 같은 다수의 기준에 따라서, 도면부호(1001) 또는 (104)로부터의 파라미터를 출력할 수 있다.
본 발명의 개선된 예측 기반 멀티채널 복원 방법의 바람직한 실시예는, 인코더 측에서 다른 주파수 범위에 대한 다른 멀티채널 파라미터화를 추출하는 단계와, 디코더 측에서 멀티채널 복원을 위해 이들 파라미터화를 그 주파수 범위에 적용하는 단계를 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원 방법의 다른 바람직한 실시예는, 인코더 측에서, 이용된 다운믹스 과정에 대한 정보를 추출하고 이어 그 정보를 디 코더로 보내는 단계와, 디코더 측에서, 멀티채널을 복원하기 위하여, 추출된 예측 파라미터 및 다운믹스에 대한 정보에 근거하는 업믹스를 적용하는 단계를 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원 방법의 또 다른 바람직한 실시예에서는, 인코더 측에서 다운믹스 신호의 에너지가 추출된 예측 업믹스 파라미터에 대하여 얻어진 예측 에러에 따라서 조정된다.
본 발명의 개선된 예측 기반 멀티채널 복원 방법의 또 다른 바람직한 실시예에서는, 인코더 측에서 업믹스된 채널에 이득을 적용함으로써 예측 에러로 인한 에너지 손실이 보상된다.
본 발명의 개선된 예측 기반 멀티채널 복원 방법의 또 다른 바람직한 실시예에서는, 디코더 측에서 예측 에러로 인한 에너지 손실이 비상관 신호에 의해 대체된다.
본 발명의 개선된 예측 기반 멀티채널 복원 방법의 또 다른 바람직한 실시예에서는, 디코더 측에서 예측 에러로 인한 에너지 손실의 일부가 비상관 신호에 의해 대체되고, 그 에너지 손실의 일부가 업믹스된 채널에 이득을 적용함으로써 대체된다. 이러한 에너지 손실의 일부는 바람직하게 인코더 측으부터 시그널링된다.
본 발명의 개선된 예측 기반 멀티채널 복원 장치의 바람직한 실시예는, 예측 업믹스 파라미터에 대하여 얻어진 예측 에러에 따라서 다운믹스 신호의 에너지를 조정하는 수단을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원 장치의 다른 바람직한 실시예는, 업믹스된 채널에 이득을 적용함으로써 예측 에러로 인한 에너지 손실을 보상하는 수단을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원 장치의 또 다른 바람직한 실시예는, 예측 에러로 인한 에너지 손실을 비상관 신호로 대체하는 수단을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원 장치의 또 다른 바람직한 실시예는, 예측 에러로 인한 에너지 손실의 일부를 비상관 신호로 대체하고, 그 에너지 손실의 일부를 업믹스된 채널에 이득을 적용함으로써 대체하는 수단을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원을 위한 인코더의 바람직한 실시예는, 추출된 예측 업믹스 파라미터에 대하여 얻어진 예측 에러에 따라서 다운믹스 신호의 에너지를 조정하는 것을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원을 위한 디코더의 바람직한 실시예는, 업믹스된 채널에 이득을 적용함으로써 예측 에러로 인한 에너지 손실을 보상하는 것을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원을 위한 디코더의 다른 바람직한 실시예는, 예측 에러로 인한 에너지 손실을 비상관 신호로 대체하는 것을 포함한다.
본 발명의 개선된 예측 기반 멀티채널 복원을 위한 디코더의 또 다른 바람직한 실시예는, 예측 에러로 인한 에너지 손실의 일부를 비상관 신호로 대체하고, 다운믹스된 채널에 이득을 적용함으로써 그 에너지 손실의 일부를 대체하는 것을 포함한다.
도 11은 오리지널 멀티채널 신호로부터 유도된 적어도 하나의 베이스 채널(1102)을 이용하여 적어도 3개의 출력 채널(1100)을 발생하는 멀티채널 합성기를 나타낸다. 도 11에 도시된 멀티채널 합성기는 업믹서 디바이스(1104)를 포함하며, 이는 도 2 내지 도 10에 도시된 바와 같이 실행될 수 있다. 일반적으로, 업믹서 디바이스(1104)는, 적어도 3개의 출력 채널이 얻어지도록, 업믹싱 룰(rule)를 이용하여 적어도 하나의 베이스 채널을 업믹스하도록 동작한다. 업믹서(1104)는, 에너지-손실 도입 업믹싱 룰을 이용하여, 에너지 측도(1106) 및 적어도 2개의 다른 업믹싱 파라미터(1108)에 따라서 적어도 3개의 출력 채널을 발생하게 동작하여서, 적어도 3개의 출력 채널이 에너지-손실 도입 업믹싱 룰 단독으로부터만 얻어진 신호의 에너지 보다 더 높은 에너지를 가지게 된다. 따라서, 에너지-손실 도입 업믹싱 룰에 따른 에너지 에러와는 상관없이, 본 발명은 에너지 보상 결과를 얻게 되며, 그 에너지 보상은 스케일링 및/또는 비상관 신호의 추가에 의해 수행될 수 있다. 적어도 2개의 다른 업믹싱 파라미터(1108) 및 에너지 측도(1106)는 입력신호에 포함된다.
바람직하게는, 에너지 측도는 업믹싱 룰에 의해 도입된 에너지 손실과 관계된 모든 측도이다. 그것은 업믹스-도입 에너지 에러 또는 업믹스 신호의 에너지(이는 일반적으로 오리지널 신호 보다 에너지가 낮은)의 절대 측도일 수 있고, 또는 그것은 오리지널 신호와 업믹스 신호 에너지의 관계, 또는 에너지 에러와 오리지널 신호 에너지의 관계, 또는 심지어 에너지 에러와 업믹스 신호 에너지의 관계와 같은, 상대적인 측도일 수 있다. 상대적인 에너지 측도는 보정 팩터로서 이용될 수 있고, 그럼에도 불구하고 에너지 측도이며, 이는 그것이 에너지-손실 도입 업믹싱 룰, 또는 -다시 말해서- 비-에너지-보존 업믹싱 룰(non-energy-preserving upmixing rule)에 의해 발생된 업믹스 신호에 도입된 에너지 에러에 의존하기 때문이다.
예시적인 에너지-손실 도입 업믹싱 룰(비-에너지-보존 업믹싱 룰)은 전송된 예측 계수를 이용하는 업믹스이다. 프레임 또는 프레임의 서브밴드의 불완전(non-perfect) 예측의 경우에, 업믹스 출력 신호는, 에너지 손실에 대응하는 예측 에러에 의해 영향을 받는다. 당연히, 예측 에러는 프레임 마다 변하며, 이는 거의 완전(perfect) 예측(낮은 예측 에러)의 경우에 단지 작은 (스케일링 또는 추가 비상관 신호의 추가에 의한)보상이 수행되어야 하고 반면 큰 예측 에러(비-완전 예측)의 경우에 더 보상이 수행되어야 하기 때문이다. 따라서, 에너지 측도도 또한 없거나 단지 작은 보상을 나타내는 값과 큰 보상을 나타내는 값 사이에서 변한다.
에너지 측도는 인터채널 가간섭성(ICC) 값으로서 여겨질 경우, 그 보상은 자연스러우며, 보상이 에너지 측도에 따라 스케일링된 비상관 신호를 추가함으로써 행해질 경우, 바람직하게는 이용된 상대적인 에너지 측도(ρ)는 전형적으로 0.8과 1.0 사이에서 변하며, 여기서 1.0은 업믹스된 신호가 요구된 만큼 비상관화되거나, 또는 비상관 신호가 추가되지 않아야 하거나, 또는 예측 업믹스 결과의 에너지가 오리지널 신호의 에너지와 동일하거나, 또는 예측 에러가 제로라는 것을 나타낸다.
그러나, 본 발명은 또한 다른 에너지-손실 도입 업믹싱 룰과 관련하여서, 즉 파형 매칭에 근거하지 않고, 코드북, 스펙트럼 매칭, 또는 에너지 보존과 상관없는 다른 어떤 업믹싱 룰의 사용과 같은, 다른 기술에 근거하는 룰과 관련하여서 유용하다.
일반적으로, 에너지 보상은 에너지-손실 도입 업믹싱 룰을 적용하기 이전 또는 이후에 수행될 수 있다. 대안적으로, 에너지 손실 보상은, 이를 테면 에너지 측도를 이용하여 오리지널 메트릭스 계수를 바꾸는 것에 의해서, 업믹싱 룰에도 포함될 수 있어서, 새로운 업믹싱 룰이 발생되고 업믹서에 의해 이용되게 된다. 이러한 새로운 업믹싱 룰은 에너지-손실 도입 업믹싱 룰 및 에너지 측도에 근거한다. 다시 말해서 본 실시예는, 에너지 보상이 "강화된" 업믹싱 룰에 "혼합(mixed)"되어서, 에너지 보상 및/또는 비상관 신호의 추가가 하나 이상의 업믹싱 메트릭스을 입력 벡터(하나 이상의 베이스 채널)에 적용함으로써 수행되어, (그 하나 이상의 메트릭스의 동작 이후에) 출력 벡터(적어도 3채널을 갖는 복원된 멀티채널)을 얻도록 하는, 그러한 상태와 관련된다.
바람직하게는, 업믹서 디바이스는 2개의 베이스 채널 l0, r0를 수신하고 3개의 복원된 채널 l, r 및 c을 출력한다.
이어, 도 12를 참조하면, 도 12는 인코더-디코더 경로 상의 다른 위치에서의 예시적인 에너지 상태를 나타낸다. 블록(1200)은 멀티채널 오디오 신호, 이를테면 도 1에서 나타낸 바와 같은 적어도 좌측 채널, 우측 채널 및 중앙 채널을 갖는 신호의 에너지를 나타낸다. 도 12의 실시예에 대해, 도 1의 입력 신호(101, 102, 103)가 완전히 무상관적(uncorrelated)이고, 다운믹서는 에너지-보존적(energy- preserving)이라고 가정한다. 이 경우에, 불록(1202)에 의해 지시된 하나 이상의 베이스 채널의 에너지는 멀티채널 오리지널 신호의 에너지(1200)과 동일하다. 오리지널 멀티채널 신호가 서로 상관적일 경우에, 베이스 채널 에너지(1202)가, 예를 들어 좌측 및 우측이 (부분적으로) 서로 상쇄될 때의 오리지널 멀티채널 신호의 에너지 보다 낮을 수 있다.
그러나 이후의 논의에 대해서, 베이스 채널의 에너지(1202)가 오리지널 멀티채널 신호의 에너지(1200)와 같다고 가정한다.
도면부호(1204)는, 업믹스 신호(예를 들어 도 1의 110, 111, 112)가 도 1과 관련하여 논의된 비-에너지 보존 업믹스(non-energy preserving up-mix) 또는 예측 업믹스일 경우의, 업믹스 신호의 에너지를 나타낸다. 도 14a 및 14b와 관련하여 이후에 설명될, 그러한 예측 업믹스가 에너지 에러 Er를 도입하기 때문에, 업믹스 결과의 에너지(1204)는 베이스 채널의 에너지(1202) 보다 낮을 것이다.
업믹서(1104)는 에너지(1204) 보다 높은 에너지를 갖는 출력 채널을 출력하도록 동작한다. 바람직하게는, 업믹서 디바이스(1104)는, 도 11의 업믹스 결과(1100)가 도면부호(1206)에 나타낸 에너지를 갖도록, 완전 보상을 수행한다.
바람직하게는, 그 에너지가 도면부호(1204)에 나타내어진 업믹스 결과는, 도 2에서와 같이 단순하게 업스케일된 것이나, 또는 도 3에서와 같이 개별적으로 업스케일된 것이나, 또는 도 4에서와 같이 인코더-측 업스케일된 것이 아니다. 대신, 예측 업믹스로 인해 에러에 해당하는 잔여 에너지 Er가 비상관 신호를 이용하여 "채 워진(filled up)다". 다른 바람직한 실시예에서, 이 에너지 에러 Er는 비상관 신호에 의해 단지 부분적으로 커버되며, 반면 그 에너지 에러의 나머지는 업믹스 결과를 업-스케일링함으로써 구성된다. 비상관 신호에 의한 에너지 에러의 완전한 커버가 도 5 및 도 6에 도시되며, 반면 "부분적인(in-part)"-해결이 도 7에 의해 설명된다.
도 13은 다수개의 에너지-보상 방법, 예를 들어 에너지 에러에 따르는 에너지 측도에 근거하여, 출력 채널의 에너지가 예측 업믹스의 순수한 결과 즉 (정확하지 않은) 에너지-손실 도입 업믹싱 룰의 결과 보다 더 높다는 특징을 공통적으로 가지는 방법들을 보여준다.
도 13의 표에서 1 번은 업믹스 이후에 수행되는 디코더-측 에너지 보상에 관한 것이다. 이 옵션은 도 2에서 보여지며, 도 3과 관련해서 추가적으로 부연설명하면, 그것은 채널-특정 업-스케일링 팩터(channel-specific up-scaling factor) gz를 나타내며, 에너지 측도 ρ 뿐만 아니라 추가적으로 채널-의존 다운믹스 팩터(channel-dependent down-mix factor) νz에 의존하고, 여기서 z는 l, r 또는 c이다.
도 13의 2번은 도 4에서 설명된 다운믹스 이후에 수행되는 인코더-측 에너지 보상 방법을 포함한다. 이 실시예는 에너지 측도 ρ 또는 γ가 인코더에서 디코더로 전송될 필요가 없다는 점에서 바람직하다.
도 13의 표에서 3번은 업믹스 이전에 수행되는 디코더-측 에너지 보상에 관 한 것이다. 도 2를 고려할 경우, 도 2의 업믹스 이후에 수행되는 에너지 보정(202) 도 2의 업믹스 불록(201) 이전에 수행될 것이다. 이 실시예는, 도 2와 비교해서, 더 용이한 보상을 얻게 되며, 이는 비록 품질 손실들이 발생할 지라도 도 3에 나타낸 채널-특정 보정 팩터가 요구되지 않기 때문이다.
도 13의 4번은 다른 실시예에 관한 것이며, 여기서는 인코더-측 보정이 다운믹싱 이전에 수행된다. 도 1을 고려할 경우, 다운믹스 출력이 도 12의 도면부호(1208)에 나타낸 다운믹싱 이후에 증가되도록, 채널(101, 102, 103)이 해당 보상 팩터에 의해 업스케일링될 것이다. 따라서, 도 13의 4번 실시예는 본 발명의 2번 실시예에서와 같은 인코더에 의해 출력된 베이스 채널'에 대해 동일한 결과를 갖는다.
도 13 표의 5번은, 도 5의 실시예에 관한 것이며, 비상관 신호가 도 5의 비-에너지 보존 업믹싱 룰에 의해 발생된 채널로부터 유도될 경우이다.
도 13의 표에서 6번 실시예는, 단지 잔여 에너지의 일부만이 비상관 신호에 의해 커버되는 실시예에 관한 것이다. 이 실시예는 도 7에서 설명된다.
도 13의 8번 실시예는 5번 또는 6번 실시예와 유사하지만, 도 5의 박스(501')에 의해 설명된 바와 같이 비상관 신호가 업믹싱 이전에 베이스 채널로부터 유도된다.
이하에서, 인코더의 바람직한 실시예가 상세하게 설명된다. 도 14a는 적어도 2채널을 갖는, 그리고 바람직하게는 적어도 3채널 l, c, r을 갖는 멀티채널 입력 신호(1400)를 처리하는 인코더를 나타낸다.
인코더는 멀티채널 입력 신호(1400)의 에너지 또는 적어도 하나의 베이스 채널(1404)과 비-에너지 보존(conserving) 업믹싱 동작(1407)에 의해 발생된 업믹스된 신호(1406) 간의 에너지 차에 의존하는 에러 측도를 계산하는 에너지 측도 계산기(1402)를 포함한다.
또한, 인코더는 에너지 측도에 의존하는 스케일링 팩터(403)에 의해 스케일링(401, 402)되기 전에 적어도 하나의 베이스 채널을 출력하거나, 에너지 측도 자체를 출력하는 출력 인터페이스(1408)를 포함한다.
바람직한 실시예에서, 인코더는 오리지널 멀티채널(1400)로부터 적어도 하나의 베이스 채널(1404)을 발생하는 다운믹서(1410)를 포함한다. 업믹스 파라미터를 발생하기 위해, 차 계산기(1414) 및 파라미터 최적화기(optimizer ; 1416)가 또한 존재한다. 이들 요소는 최고-매칭(best-matching) 업믹스 파라미터(1412)를 찾도록 동작한다. 적어도 2개의 최고 적합 업믹스 파라미터의 이러한 세트가 바람직한 실시예에서 파라미터 출력으로서 출력 인터페이스를 통해 출력된다. 차 계산기는 바람직하게는 오리지널 멀티채널 신호(1400)와 파라미터 라인(1412)에서의 파라미터 입력을 위한 업믹서-발생 업믹스 신호 간의 최소 평균 자승 에러 계산을 수행하도록 동작한다. 이러한 파라미터 최적화 과정은, 업믹서(1408)에 포함된 어느 업믹싱 메트릭스에 의해 최고-매칭 업믹스 결과를 얻고자 하는 목표를 가지는 여러 가지 다른 최적화 과정에 의해 수행될 수 있다.
도 14a 인코더의 기능이 도 14b에 도시되었다. 다운믹서(1410)에 의해 수행된 다운믹싱 단계(1440) 이후에, 도면부호(1442)에 의해 나타낸 바와 같이 베이스 채널 또는 다수개의 베이스 채널이 출력될 수 있다. 이어, 업믹스 파라미터 최적화 단계(1444)가 수행되며, 이는 어느 최적화 전략에 따라 반복적이거나 비반복적인 과정일 수 있다. 그러나, 반복 과정이 바람직하다. 일반적으로, 업믹스 파라미터 최적화 과정은, 업믹스 결과와 오리지널 신호 간의 차이가 가능한 한 낮게 되도록 실행될 수 있다. 그러한 실행에 따라서, 이러한 차이는 개별적인 채널-관련(channel-related) 차이이거나 또는 결합된 차이일 수 있다. 일반적으로, 업믹스 파라미터 최적화 단계(1444)는, 개별 채널 또는 결합된 채널로부터 유도될 수 있는 그 어떤 비용 함수도 축소하도록 동작하여서, 다른 2채널에 대해 예를 들어 훨씬 향상된 매칭이 달성될 때, 하나의 채널에 대해 큰 차이(에러)가 용인되도록 한다.
이어, 최고 적합 파라미터 세트, 예를 들어 최고 접합 업믹스 메트릭스이 발견되었을 때, 단계(1446)에 나타낸 바와 같이 단계(1444)에 의해 발생된 파라미터 세트의 적어도 2개의 업믹싱 파라미터가 출력 인터페이스에 출력된다.
또한, 업믹스 파라미터 최적화 단계(1444)가 완료된 이후에, 단계(1448)에 나타낸 바와 같이 에너지 측도가 계산되고 출력될 수 있다. 일반적으로, 에너지 측도는 에너지 에러(1210)에 의존한다. 바람직한 실시예에서, 에너지 측도는 도 2에서 나타낸 바와 같이, 업믹스 결과(1406)의 에너지와 오리지널 신호(1400)의 에너지의 관계에 의존하는 팩터 ρ이다. 대안적으로, 계산되고 출력된 에너지 측도는 에너지 에러(1210)에 대한 절대 값일 수 있거나, 에너지 에러에 의존하는 업믹스 결과(1406)의 절대 에너지일 수 있다. 여기에서, 출력 인터페이스(1408)에 의해 출력된 것과 같은 에너지 측도는, 바람직하게는 양자화 되고, 더 바람직하게는 허프 만 인코더 또는 런-렝스(run-length) 인코더와 같이, 후속하는 동일한 에너지 측도가 많을 경우에 특히 유용한, 그 어떤 공지의 엔트로피-인코더(entropy-encoder)를 이용한 엔트로피-인코딩된다. 대안적으로 또는 추가적으로, 이후의 시간 부분 또는 프레임에 대한 에너지 측도는 차-인코딩(difference-encoded)될 수 있으며, 여기서 차-인코딩은 바람직하게는 엔트로피-코딩 전에 수행된다.
이하에서는 도 15a를 참조하면, 도 15a는 본 발명의 바람직한 실시예에 따라, 도 14a 인코더에 결합된 대안적인 다운믹서 실시예를 나타낸다. 도 15a 실시예는, 비록 이 실시예가 스펙트럼 대역 복제가 수행되지 않고 베이스 채널의 완전한 대역폭이 전송되는 그런 경우에도 또한 이용될 수 있지만, SBR-구현을 커버한다. 도 15a 인코더는 오리지널 신호를 다운믹싱하는 다운믹서(1500)를 포함하여, 적어도 하나의 베이스 채널(1504)를 얻는다. 비(non)-SBR-실시예에서, 적어도 하나의 베이스 채널(1504)이 코어 코더(1506)로 입력되며, 코어 코더(1506)은 싱글 베이스 채널의 경우에 모노-신호를 위한 AAC 인코더일 수 있고, 또는 예를 들어 2 스테레오 베이스 채널의 경우에 어느 스테레오 코더일 수 있다. 코어 코더(1506)의 출력에, 인코딩된 베이스 채널을 포함하거나 다수개의 인코딩된 베이스 채널을 포함하는 비트스트림이 출력된다(1508).
도 15a의 실시예가 SBR 기능을 가질 경우, 적어도 하나의 베이스 채널(1504)이, 코어 코더로 입력되기 전에, 로우패스 필터링된다(1510). 당연히, 블록(1510)과 (1506)의 기능은, 싱글 인코딩 알고리즘 내에서 로우패스 필터링 및 코어 코딩을 수행하는 싱글 인코더 디바이스에 의해 구현될 수 있다.
출력(1508)에서 인코딩된 베이스 채널은 단지 인코딩된 형태의 베이스 채널(1504)의 저-대역만을 포함한다. 고-대역에 대한 정보는 SBR 스펙트럼 포락선 계산기(1512)에 의해 계산되며, SBR 스펙트럼 포락선 계산기(1512)는 인코딩된 SBR-측 정보를 발생하여 출력(1516)으로 출력하는 SBR 정보 인코더(1514)에 연결된다.
오리지널 신호(1502)는 (채널 에너지가 블록(1520)에 의해 출력된 L, C, R에 의해 나타내어진, 오리지널 채널 l, c, r의 어느 시간 주기에 대하여) 채널 에너지를 발생하는 에너지 계산기(1520)로 입력된다. 채널 에너지 L, C, R은 파라미터 계산기 블록(1522)로 입력된다. 파라미터 계산기(1522)는 2개의 업믹스 파라미터 c1, c2를 출력하며, 이는 예를 들어 도 15a에서 나타낸 파라미터 c1, c2일 수 있다. 당연히, 디코더로의 전송을 위해, 모든 입력 채널의 에너지를 포함하는 다른 (예로서 선형) 에너지 결합이 파라미터 계산기(1522)에 의해 발생될 수 있다. 당연히, 다른 전송된 업믹스 파라미터는 잔여 업믹싱 메트릭스 요소를 계산하는 다른 방식을 도출할 것이다. 식(40) 또는 식(41 내지 44)와 관련하여 나타낸 바와 같이, 도 15 실시예의 에너지-지시적(energy-directed)에 관한 업믹스 메트릭스은 적어도 4개의 비-제로(non-zero) 요소를 가지며, 여기서 3번째 행(row)의 요소들은 서로 동일하다. 따라서, 파라미터 계산기(1522)는, 예를 들어 그로부터 업믹스 메트릭스 식(40) 또는 (41)과 같은 업믹스 메트릭스의 4개 요소가 유도될 수 있는, 에너지 L, C, R의 그 어떠한 결합도 이용할 수 있다.
도 15a 실시예는 신호의 전체 대역폭에 대한 에너지 보존적인, 또는 일반적 으로 말해서 에너지-유도적인 업믹스 수행하도록 동작하는 인코더를 나타낸다. 이는 도 15a에 나타낸 인코더-측에서, 파라미터 계산기(1522)에 의해 출력된 파라메트릭 표현이 전체 신호에 대해 발생된다는 것을 의미한다. 이는 인코딩된 베이스 채널의 각 서브밴드에 대하여, 파라미터의 해당 세트가 계산되고 출력된다는 것을 의미한다. 10개의 서브밴드를 갖는, 예를 들어, 전대역폭(full-bandwidth)인, 예를 들어 인코딩된 베이스 채널이 고려될 경우에, 파라미터 계산기가 인코딩된 베이스 채널의 각 서브밴드에 대하여 10개의 파라미터 c1 및 c2를 발생할 수 있다. 그러나, 인코딩된 베이스 채널이, 예를 들어 단지 5개의 하위(lower) 서브밴드만을 커버링하는 SBR 환경에서의 저-대역일 경우에는, 비록 출력(1508)에서의 신호가 해당 서브밴드를 포함하지 않더라도, 파라미터 계산기(1522)가 5개의 하위 서브밴드 각각에 대하여, 그리고 추가적으로 5개의 상위 서브밴드 각각에 대하여 파라미터의 세트를 출력할 것이다. 이는 도 16a와 관련하여 하기에서 설명되는 바와 같이, 그러한 서브밴드가 디코더-측에서 재생성될 것이기 때문이다.
그러나 바람직하게는, 도 10과 관련하여 설명한 바와 같이, 에너지 계산기(1520) 및 파라미터 계산기(1522)가 단지 오리지널 신호의 고대역 부분에 대해서만 동작하고, 반면 오리지널 신호의 저대역 부분에 대한 파라미터는 도 10의 예측 파라미터 계산기(104)에 의해 계산되며, 이는 도 10의 예측 업믹서(109)와 대응한다.
도 15b는 도 10의 선택 모듈(1002)에 의해 출력된 파라메트릭 표현의 도식적 인 표현을 보여준다. 따라서, 본 발명에 따르는 파라메트릭 표현은 (인코딩된 베이스 채널(들)을 갖거나 갖지 않은, 그리고 선택적으로 에너지 측도를 갖지 않은 것 까지도) 저대역, 예를 들어 서브밴드 1 내지 i에 대한 예측 파라미터 세트 및 고대역, 예를 들어 서브밴드 i+1 내지 N에 대한 서브밴드-방식(sub-band-wise) 파라미터를 포함한다. 대안적으로, 예측 파라미터와 에너지 스타일 파라미터는 믹싱될 수 있으며, 예를 들어 에너지 스타일 파라미터만 갖는 서브밴드가 예측 파라미터만 갖는 서브밴드 사이에 위치할 수 있다. 더욱이, 단지 예측 파라미터를 갖는 프레임은 에너지 스타일 파라미터를 갖는 프레임을 뒤따를 수 있다. 따라서, 일반적으로 말하면, 본 발명은 도 10과 관련하여 설명한 바와 같이, 다른 파라미터화에 관한 것이며, 여기서 다른 파라미터화는 오로지 예측 파라미터만을 갖는 프레임에 오로지 에너지 스타일 파라미터를 갖는 프레임이 뒤따를 경우에, 도 15b에 나타낸 바와 같이 주파수 방향이 다를 수 있거나 시간 방향이 다를 수 있는 것이다. 당연히, 서브밴드의 분포 또는 파라미터화는 프레임 마다 변할 수 있어서, 예를 들어 서브밴드 i가 첫 번째 프레임에, 도 15b에 나타낸 바와 같이, 첫 번째 (예를 들어 예측) 파라미터 세트를 갖고, 다른 프레임에 두 번째 (예를 들어 에너지 스타일) 파라미터를 갖는다.
더욱이, 본 발명은 또한 도 14a에 나타낸 바와 같은 예측 파라미터화 또는 도 15a에 나타낸 바와 같은 에너지 스타일 파라미터화와 다른 파라미터화가 이용될 경우에 유용하다. 또한 예측 또는 에너지 스타일과 별개인 파라미터화의 다른 예는, 어느 목표 파라미터 또는 목표 이벤트라도 다음을 나타내자마자, 즉 인코더 측에서 또는 디코더 측에서의 업믹스 품질, 다운믹스 비트레이트, 계산 효율(computational efficiency) 또는 예를 들어 배터리를 사용하는 디바이스의 에너지 소비 등이, 어느 서브밴드 또는 프레임에 대하여, 첫 번째 파라미터화가 두 번째 파라미터화 보다 더 좋다고 나타내자마자 이용될 수 있다. 당연히, 목표 함수는 또한 상술한 바와 같이 다른 개별 목표/이벤트의 결합일 수 있다. 예시적인 이벤트는 SBR-복원 고 대역 등등 일 것이다.
또한, 주파수 또는 시간-선택적인 계산 및 파라미터의 전송은 도 10의 도면부호(1005)에 나타낸 바와 같이 명시적으로 시그널링될 수 있다는 것을 유념하여야 한다. 대안적으로, 그러한 시그널링은 또한 도 16a와 관련하여 논의되는 바와 같이, 잠재적으로 수행될 수도 있다. 이 경우에, 디코더에 대하여 사전-정의된(pre-defined) 룰이 이용되는데, 예를 들어, 디코더는 자동적으로 전송된 파라미터가, 도 15b의 고-대역에 속하는 서브밴드에 대한, 예를 들어, 스펙트럼 대역 복제 또는 고-주파수 재생성 기술에 의해 복원되었던 서브밴드에 대한, 에너지 스타일 파라미터라고 가정한다.
또한, 전송된 파라미터가 모든 인코더 측의 가능 정보(이 정보는 실제로 목표 함수에 이용될 수 있거나 SBR 프로세싱 및 시그널링에 이용될 수 있다)에 근거하는, 하나, 둘 또는 다른 파라미터화, 그리고 인코더 측의 선택에 대한, 인코더 측 계산이 에너지 측도의 전송을 가지고, 또는 전송이 없이 수행될 수 있다는 것을 유념하여야 한다. 바람직한 에너지 보정이 전혀 수행되지 않은 경우조차도, 예를 들어 비-에너지-보존(non-energy-conserving) 업믹스(예측 업믹스)가 에너지-보존 적(energy-corrected)이지 않거나, 인코더 측에서 대응하는 사전-보상(pre-compensation)이 수행되지 않은 경우에도, 다른 파라미터화들 간의 바람직한 스위칭이 더 좋은 멀티채널 출력 품질 및/또는 하위 비트레이트를 얻는데 유용하다.
특히, 가능한 인코더 측 정보에 따른 다른 파라미터화들 간의 바람직한 스위칭은, 도 5 내지 7과 관련하여 나타낸 바와 같은 예측 업믹스에 의해 수행된 에너지 에러를 완전히 또는 적어도 부분적으로 커버링하는, 비상관 신호의 추가를 가지거나 추가가 없이 이용될 수 있다. 여기에서, 도 5와 관련하여 설명된 바와 같은 비상관 신호의 추가는 오직, 그에 대해 예측 업믹스 파라미터가 전송된 서브밴드/프레임에 대해서만 수행되며, 반면 비상관에 대한 다른 측도가, 에너지 스타일 파라미터가 전송되었던 이들 서브밴드 또는 프레임에 대해서 이용된다. 그러한 측도는, 예를 들어, 습윤(wet) 신호를 다운-스케일링(down-scaling)하는 것 및 비상관 신호를 발생하는 것 및 그 비상관 신호를 스케일링하는 것이어서, 적합하게 스케일링된 비상관 신호가 건조(dry) 신호에 가산될 때, 예를 들어 ICC와 같은 전송된 인터-채널-상관관계 측도에 의해 요구된 비상관 관계의 요구 량이 얻어지도록 한다.
이하에서는, 도 16a에 대해 논의하며, 도 16a는 바람직한 업믹싱 블록(201) 및 도면부호(202)에서의 해당 에너지 보정의 디코더 측 구현을 나타낸다. 도 11과 관련하여 논의한 바와 같이, 전송된 업믹스 파라미터(1108)는 수신된 입력 신호로부터 추출된다. 이들 전송된 업믹스 파라미터는, 에너지 보상을 포함하는 업믹스 메트릭스(1602)이 예측 업믹스 및 이전 또는 이후의 에너지 보정을 수행하는 것일 경우에, 바람직하게는 잔여 업믹스 파라미터를 계산하는 계산기(1600)으로 입력된 다. 잔여 업믹스 파라미터를 계산하는 과정은 도 16b와 관련하여 이하에서 논의한다.
업믹스 파라미터의 계산은 도 16b의 식에 근거하며, 이는 또한 식(7)로서 반복된다. 3-입력-신호/2-출력-신호의 실시예에서, 다운믹스 메트릭스 D는 6개의 변수를 가진다. 그에 더해, 업믹스 메트릭스 C 역시도 6개의 변수를 가진다. 그러나, 식(7)의 우변에는 단지 4개의 변수만을 가진다. 따라서, 미지의 다운믹스 및 미지의 업믹스의 경우에는, 메트릭스 D 및 C로부터 12개의 미지의 변수와, 이들 12개의 변수를 결정하는 단지 4개의 식을 가지게 될 것이다. 그러나, 비록 이들 6개의 변수를 결정하는 4개의 식이 여전히 존재하더라도, 미지인 변수의 수는, 6개의 변수를 갖는 업믹스 메트릭스 C의 계수로 줄어들도록, 다운믹스는 기지(known)이다. 따라서, 도 14b의 단계 1444와 관련하여 논의되고 도 14a에 나타낸 최적화 방법은 업믹스 메트릭스의 적어도 2개의 변수를 결정하는 데 이용되며, 이는 바람직하게는 c11 및 c22이다. 이제, 4개의 미지값 예를 들어 c12, c21, c31 및 c32이 있고, 4개의 식들 예를 들어 도 16b의 식의 우변에 항등메트릭스에서의 각 요소에 대한 하나의 식이 있기 때문에, 업믹스 메트릭스의 잔여 미지 변수는 명확한 방식으로 계산될 수 있다. 이러한 계산은 잔여 업믹스 파라미터를 계산하는 계산기(1600)에서 수행된다.
디바이스(1602)의 업믹스 메트릭스은 점선(1604)과 블록(1600)에 의해 계산된 4개의 잔여 업믹스 파라미터의 이전에 있는 2개의 전송된 업믹스 파라미터에 따 라 설정된다. 이 업믹스 메트릭스은 이어 선(1102)을 통해 베이스 채널 입력에 적용된다. 구현에 따르면, 저-대역 보정에 대한 에너지 측도가 선(1106)을 통해 전송되어서 보정된 업믹스가 발생되고 출력될 수 있도록 한다. 예측 업믹스가 예를 들어 단지 선(1606)을 통해서 잠재적으로 시그널링된 저-대역에 대해서만 수행되는 경우, 그리고 선(1108) 상에 고-대역에 대한 에너지 스타일 업믹스 파라미터가 존재하는 경우, 이러한 사실이, 해당 서브밴드를 위해, 계산기(1600) 및 업믹스 메트릭스 디바이스(1602)에 시그널링된다. 에너지 스타일의 경우에, 업믹스 메트릭스(40) 또는 (41)의 업믹스 메트릭스 요소를 계산하는 것이 바람직하다. 이를 위해, 식(40)의 아래에 나타낸 전송된 파라미터 또는 식(41)의 아래에 나타낸 해당 파라미터가 이용된다. 이 실시예에서는, 전송된 업믹스 파라미터 c1, c2가 업믹스 계수에 대해 직접적으로 사용될 수 없지만, 식(40) 또는 식(41)에 나타낸 업믹스 메트릭스의 계수가, 전송된 업믹스 파라미터 c1 및 c2를 이용하여 계산되어야 한다.
고-대역에 대해서는, 에너지-기반 업믹스 파라미터에 대해 결정된 업믹스 메트릭스이, 멀티채널 출력 신호의 고-대역 부분을 업믹싱하는데 이용된다. 이후, 저-대역 부분과 고-대역 부분이, 전대역 복원 출력 신호 l, r, c를 출력하는 저/고 결합기(1608)에서 결합된다. 도 16a에 나타낸 바와 같이, 베이스 채널의 고-대역이, 전송된 저-대역 베이스 채널을 디코딩하는 디코더를 이용하여 발생되며, 이러한 디코더는 모노 베이스 채널에 대해서는 모노-디코더이고, 2 스테레오 베이스 채널에 대해서는 스테레오-디코더이다. 이 디코딩된 저-대역 베이스 채널(들)은 SBR 디바이스(1614)로 입력되며, SBR 디바이스(1614)는 도 15a의 디바이스(1512)에 의해 계산된 포락선 정보를 추가적으로 수신한다. 저-대역 부분 및 고 대역 포락선 정보에 근거해서, 베이스 채널의 고 대역이 발생되어서 선(1102) 상의 전대역 베이스 채널을 얻으며, 이는 업믹스 메트릭스 디바이스(1602)로 전송된다.
바람직한 방법 또는 디바이스 또는 컴퓨터 프로그램이 여러 개의 장치에 구현되거나 포함될 수 있다. 도 17은 본 발명의 인코더를 포함하는 송신기(transmitter)와 본 발명의 디코더를 포함하는 수신기(receiver)를 가지는 전송 시스템을 보여준다. 송신 채널은 무선 또는 유선 채널일 수 있다. 또한, 도 18에 나타낸 바와 같이, 인코더가 오디오 레코더에 포함될 수 있고, 디코더는 오디오 플레이어에 포함될 수 있다. 오디오 레코더로부터의 오디오 기록은 인터넷을 통해서, 또는 우편 또는 배송 방편 또는 메모리 카드, CD 또는 DVD와 같은 저장 매체를 분배하는 다른 가능 수단을 이용하여 분배된 저장 매체를 통해서 오디오 플레이어로 분배될 수 있다.
본 발명의 방법의 어느 구현 요구에 따라, 본 발명의 방법은 하드웨어 또는 소프트웨어로 구현될 수 있다. 그러한 구현은 디지털 저장 매체, 특히 본 발명의 방법을 수행되도록 프로그램 가능한 컴퓨터 시스템과 함께 작동될 수 있는, 전자적으로 판독가능한 제어 신호를 갖는 디스크 또는 CD를 이용하여 수행될 수 있다. 따라서 본 발명은 일반적으로 컴퓨터 프로그램 제품이 컴퓨터에서 구동될 때 본 발명의 방법의 적어도 하나를 수행하는, 기계-판독형 캐리어에 저장된 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로 구성될 수 있다. 다시 말해서, 본 발명의 방법은 컴퓨터 프로그램이 컴퓨터에서 구동될 때 본 발명의 방법을 수행하는 프로그램 코드를 가지는 컴퓨터 프로그램이다.
적어도 하나의 베이스 채널에 근거하는 오디오 신호의 멀티채널 복원을 위해서, 에너지 측도가 예측 업믹스로 인한 에너지 손실을 보상하는데 이용된다. 에너지 측도는 인코더 또는 디코더에서 적용될 수 있다. 또한, 비상관 신호가 에너지-손실 도입 업믹싱 과정에 의해 발생된 출력 채널에 가산된다. 비상관 신호의 에너지는 예측 업믹스에 의해 도입된 에너지 에러 보다 작거나 그와 같다. 따라서, 고주파수 복원 기술로 코딩된 업믹싱 신호와 같이 예측 기반 업믹스 방법에 대하여 발생하는 문제가 해결되어서, 업믹스된 신호들 간의 정확한 상관관계가 얻어지거나, 업믹스가 임의의 다운믹스에 맞게 조절된다.

Claims (52)

  1. 적어도 하나의 베이스 채널(1102)을 갖는 입력 신호를 이용하여 적어도 3개의 출력 채널(1100)을 발생하는 멀티채널 합성기로서, 상기 베이스 채널은 오리지널 멀티채널(101, 102, 103)로부터 유도된 것이고, 상기 멀티채널 합성기는:
    적어도 3개의 출력 채널이 얻어지도록 에너지-손실 도입 업믹싱 룰(201, 1407)에 근거하여 적어도 하나의 베이스 채널을 업믹싱하는 업믹서(1104)를 포함하며,
    상기 업믹서(1104)는 에너지 측도(1106) 및 적어도 2개의 다른 업믹싱 파라미터(1108)에 반응하여 적어도 3개의 출력 채널을 발생하도록 동작하여서, 상기 적어도 3개의 출력 채널이, 상기 에너지 손실 도입 업믹싱 룰에 따른 에너지 에러 대신 단지 상기 에너지 손실 도입 업믹싱 룰만을 이용하여 얻어진 에너지 보다 더 높은 에너지를 가지게 하고,
    상기 적어도 2개의 다른 업믹싱 파라미터(1108) 및 상기 업믹서를 제어하는 상기 에너지 측도는 상기 입력 신호에 포함된 것이고,
    상기 에너지-손실 도입 업믹싱 룰은, 예측 계수에 근거하는 메트릭스 계수를 갖는 업믹싱 메트릭스을 이용하는 예측 업믹싱 룰이고,
    상기 적어도 2개의 다른 업믹스 파라미터는 상기 업믹싱 메트릭스의 2개의 다른 요소(c11, c22)이거나, 또는 그로부터 상기 업믹싱 메트릭스의 상기 2개의 다른 요소가 유도될 수 있는 파라미터인 것인, 멀티채널 합성기.
  2. 청구항 1에 있어서,
    상기 에너지 측도는, 직접적으로 또는 간접적으로 상기 오리지널 멀티채널 신호의 에너지에 대한 상기 에너지-손실 도입 업믹싱 룰을 이용하는 업믹스 결과의 에너지의 관계를 나타내거나, 또는 오리지널 멀티채널 신호의 에너지 또는 절대조건에서의 상기 에너지 에러에 대한 에너지 에러의 관계를 나타내는 것인, 멀티채널 합성기.
  3. 청구항 1 또는 청구항 2에 있어서,
    상기 업믹서는, 상기 오리지널 멀티채널 신호로부터, 상기 적어도 하나의 베이스 채널을 발생하는데 이용된 다운믹스 룰에 대한 정보 및 상기 적어도 2개의 업믹싱 파라미터에 근거하는 업믹스 메트릭스를 유도하기 위한 계산기(1600)를 포함하는 것인, 멀티채널 합성기.
  4. 청구항 1 또는 청구항 2에 있어서,
    상기 업믹서는, 좌측 베이스 채널 및 우측 베이스 채널을 처리하고, 좌측 출력 신호, 우측 출력 신호 및 중앙 신호를 출력하도록 동작하고, 상기 좌측 베이스 채널 및 상기 우측 베이스 채널은 상기 멀티채널 신호의 스테레오-호환 표현인 것인, 멀티채널 합성기.
  5. 청구항 1 또는 청구항 2에 있어서,
    상기 업믹서(1104)는 스케일링 팩터를 이용하여 상기 적어도 3개의 출력 채널을 개별적으로 스케일링(304)하도록 동작하고,
    출력 채널에 대한 스케일링 팩터(gz)는 상기 에너지-손실 도입 업믹싱 룰의 업믹스 결과의 에너지, 및 상기 에너지-손실 도입 업믹싱 룰과 상기 적어도 베이스 채널을 발생하는 다운믹스(v)에 대한 정보를 이용하는 업믹싱 이후의 출력 채널의 에너지에 의존하는 것인, 멀티채널 합성기.
  6. 청구항 5에 있어서,
    상기 스케일링 팩터는 다음식에 의해 결정되고:
    Figure 112006097378576-pct00119
    vz는 출력 채널 z에 대한 다운믹스-의존 팩터이며, ρ은 상기 에너지 측도이며,
    Figure 112006097378576-pct00120
    는 상기 에너지-손실 도입 업믹싱 룰에 의해 발생된 상기 멀티채널 신호의 상기 에너지이며,
    Figure 112006097378576-pct00121
    는 상기 에너지-손실 도입 업믹싱 룰의 상기 스케일링되는 출력 채널의 에너지를 나타내는 것인, 멀티채널 합성기.
  7. 청구항 1 또는 청구항 2에 있어서,
    상기 업믹서(1104)는, 상기 적어도 하나의 베이스 채널로부터 또는 상기 에너지-손실 도입 업믹싱 룰의 상기 출력 신호의 적어도 하나로부터, 비상관 신호를 발생하는 비상관화기(501, 502, 503, 501', 503')를 더 포함하고,
    상기 업믹서는 또한, 출력 채널에서의 상기 비상관 신호의 에너지 량이 상기 에너지 측도에 의해 유도될 수 있는 상기 에너지 에러의 량 보다 작거나 그와 같도록, 상기 비상관 신호를 이용하게 동작하는 것인, 멀티채널 합성기.
  8. 청구항 7에 있어서,
    상기 업믹서는, 다운스케일링 팩터에 의해 다운스케일링된 출력 채널의 에너지와 같은 에너지를 갖는 비상관 신호를 발생하도록 동작하고, 상기 다운스케일링 팩터는 상기 에너지 측도에 의존하며,
    상기 업믹서는 또한 상기 비상관 신호 및 상기 에너지-손실 도입 업믹싱 룰의 출력 신호를 가산하도록(109) 동작하는 것인, 멀티채널 합성기.
  9. 청구항 7에 있어서,
    상기 비상관화기는, 채널-특정 팩터(ν)에 의해 가중되고 상기 에너지 측도(ρ)를 이용하여 가중된 비상관 신호를 가산함으로써 상기 적어도 3개의 출력 채널을 개별적으로 비상관화하고, 상기 가중된 비상관 신호를 상기 에너지-손실 도입 업믹싱 룰을 수행하는 업믹서(109)의 출력 신호에 가산하도록 동작하는 것인, 멀티채널 합성기.
  10. 청구항 8에 있어서,
    상기 비상관화기는 디지털 필터를 이용하여 입력 신호를 필터링하도록 동작하는 것인, 멀티채널 합성기.
  11. 청구항 8에 있어서,
    상기 다운스케일링 팩터는 다음식에 따라서 유도되고:
    Figure 112006097378576-pct00122
    ,
    γ는 상기 다운스케일링 팩터이며, ρ는 상기 에너지 측도인 것인, 멀티채널 합성기.
  12. 청구항 1 또는 청구항 2에 있어서,
    상기 업믹서(1104)는, 에너지-손실 도입 업믹싱 룰로 인한 에너지 손실을 부분적으로 또는 전체적으로 보상하기 위해, 상기 에너지 에러 보다 작고 0 보다 큰 에너지를 갖는 비상관 신호를, 상기 에너지-손실 도입 업믹싱 룰에 의해 발생된 적어도 하나의 채널에 가산하도록 동작하는 것인, 멀티채널 합성기.
  13. 청구항 12에 있어서,
    상기 비상관 신호의 상기 에너지가 상기 에너지 에러 보다 작을 경우, 상기 업믹서는 상기 적어도 하나의 베이스 채널 또는 상기 업믹싱 룰에 의해 발생된 신호를 업스케일링하도록 동작하여서, 상기 업스케일링된 신호의 결합 에너지 또는 상기 업스케일링된 적어도 하나의 베이스 채널과 상기 가산된 비상관 신호를 이용하여 발생된 업믹스 신호의 결합 에너지가, 상기 오리지널 신호의 에너지 보다 작거나, 또는 그와 같은 것인, 멀티채널 합성기.
  14. 청구항 13에 있어서,
    상기 가산된 비상관 신호의 상기 에너지는 비상관 팩터에 의해 결정되고, 1에 근사한 높은 비상관 팩터는 작은 레벨의 비상관 신호가 가산되는 것을 나타내고, 반면 0에 근사한 작은 비상관 팩터는 높은 레벨의 비상관 신호가 가산되는 것을 나타내며,
    상기 비상관 측도는 상기 입력 신호로부터 추출되는 것인, 멀티채널 합성기.
  15. 청구항 12에 있어서,
    상기 적어도 하나의 베이스 채널은, 다운믹싱 메트릭스에 의해 발생된 베이스 채널의 스케일링된 버전이고, 상기 스케일링 팩터는 상기 에너지 측도에 의존하여서, 상기 비상관 정보(605)가 또한 상기 에러 에너지에만 의존하여 상기 유일하게 전송된 에너지인 것인, 멀티채널 합성기.
  16. 청구항 13에 있어서,
    상기 입력 신호에 포함된 상기 에너지 측도는, 상기 에너지 에러(ρ)에 의존하고, 상관관계의 정도(κ)에 의존하는 두 번째 에너지 값을 포함하는 첫 번째 에너지 값을 포함하는, 멀티채널 합성기.
  17. 청구항 1 또는 청구항 2에 있어서,
    상기 입력 신호는, 상기 2개의 다른 업믹싱 파라미터에 추가해서, 상기 적어도 하나의 베이스 채널에 내재하는 다운믹스에 대한 정보를 포함하고,
    상기 업믹서는 상기 추가적인 다운믹싱 정보(802)를 업믹싱 메트릭스을 발생하는데 이용하도록 동작하는 것인, 멀티채널 합성기.
  18. 청구항 17에 있어서,
    스테레오 사전-처리(901) 계산의 정보(γ)는 상기 다운믹스 정보로서 상기 입력 신호에 포함되는 것인, 멀티채널 합성기.
  19. 청구항 1 또는 청구항 2에 있어서,
    상기 입력 신호는, 첫 번째 상태에서 첫 번째 업믹싱 룰이 수행되고, 두 번째 상태에서 다른 업믹싱 룰이 수행되는 것을 나타내는 업믹서 모드 지시(1005)를 더 포함하고,
    상기 업믹서(1104)는 또한 상기 업믹서 모드 지시(1005)에 의존하여 상기 적어도 2개의 다른 업믹싱 파라미터(1108)를 이용하는 상기 업믹싱 룰에 대한 파라미터를 계산하도록 동작하는 것인, 멀티채널 합성기.
  20. 청구항 19에 있어서,
    상기 업믹서 모드 지시는, 업믹서 모드를 서브밴드 방식 또는 프레임 방식으로 시그널링하도록 동작하는 것인, 멀티채널 합성기.
  21. 청구항 19에 있어서,
    상기 첫 번째 업믹싱 룰은 예측 업믹싱 룰이고, 두 번째 업믹싱 룰은 에너지-의존 업믹싱 파라미터를 갖는 업믹싱 룰인 것인, 멀티채널 합성기.
  22. 청구항 20에 있어서,
    상기 두 번째 업믹싱 룰은 다음과 같이 수행되고:
    Figure 112006097378576-pct00123
    L은 좌측 입력 채널의 에너지 값이며, C는 중앙 입력 채널의 에너지 값이며, R은 우측 입력 채널의 에너지 값이며, α는 다운믹스 결정 파라미터인 것인, 멀티채널 합성기.
  23. 청구항 19에 있어서,
    상기 두 번째 업믹싱 룰은, 우측 다운믹스 채널이 좌측 업믹스된 채널에 가산되지 않고, 그 역도 마찬가지인 것인, 멀티채널 합성기.
  24. 청구항 19에 있어서,
    상기 첫 번째 업믹싱 룰은, 상기 오리지널 멀티채널 신호의 파형과 상기 첫 번째 업믹싱 룰에 의해 발생된 신호의 파형 간에 매칭하는 파형에 의해 결정되는 것인, 멀티채널 합성기.
  25. 청구항 19에 있어서,
    상기 첫 번째 또는 두 번째 업믹싱 룰은 다음식과 같이 결정되고:
    Figure 112006097378576-pct00124
    ,
    함수(f1, f2, f3)는 상기 전송된 2개의 다른 업믹싱 파라미터 c1, c2의 함수를 나타내고,
    상기 함수는 다음식과 같이 결정되며:
    Figure 112006097378576-pct00125
    Figure 112006097378576-pct00126
    Figure 112006097378576-pct00127
    ,
    α는 실수 파라미터인 것인, 멀티채널 합성기.
  26. 청구항 19에 있어서,
    상기 멀티채널 합성기는, 상기 입력 신호에 포함된 상기 적어도 하나의 베이스 채널의 일부분을 이용하는 상기 전송된 베이스 채널에 포함되지 않는 상기 적어도 하나의 베이스 채널의 대역을 재생성하는 SBR 유닛(1614)을 더 포함하고,
    상기 멀티채널 합성기는 또한, 상기 두 번째 업믹싱 룰을 상기 적어도 베이스 채널의 재생성된 대역에 적용하고, 상기 첫 번째 업믹싱 룰을 상기 입력 신호에 포함된 상기 베이스 채널의 대역에 적용하도록 동작하는 것인, 멀티채널 합성기.
  27. 청구항 26에 있어서,
    상기 업믹서 모드 지시는 상기 입력 신호에 포함된 SBR 시그널링(1606)인 것인, 멀티채널 합성기.
  28. 멀티채널 입력 신호를 처리하는 인코더에 있어서:
    멀티채널 입력 신호 또는 상기 멀티채널 입력 신호로부터 유도된 적어도 하나의 베이스 채널과, 에너지-손실 도입 업믹싱 동작에 의해 발생된 업믹스된 신호 간의 에너지 차에 의존하여 에너지 측도(ρ)를 계산하는 에너지 측도 계산기(1402); 및
    상기 에너지 측도에 의존하거나 상기 에너지 측도를 출력하는 스케일링 팩터(403)에 의해 스케일링된 이후의 상기 적어도 하나의 베이스 채널(401,402)을 출력하는 출력 인터페이스(1408)를 포함하는, 인코더.
  29. 청구항 28에 있어서,
    상기 에너지 측도(ρ)는, 에너지-도입 업믹싱 룰을 이용하여 상기 적어도 하나의 베이스 채널을 업믹싱함으로써 발생된 상기 업믹스된 신호의 에너지와, 상기 오리지널 멀티채널 신호의 에너지의 관계에 근거하여 결정되고,
    상기 스케일링 팩터는 상기 에너지 측도를 반전시킴으로써 결정되는 것인, 인코더.
  30. 청구항 28 또는 청구항 29에 있어서,
    상관관계 정도(κ)를 결정하는 상관관계 정도 계산기를 더 포함하고,
    상기 출력 인터페이스는 상기 상관관계 정도에 근거하여 상관관계 측도(k)를 출력하도록 동작하는 것인, 인코더.
  31. 청구항 28 또는 청구항 29에 있어서,
    적어도 2개의 다른 업믹싱 파라미터(1412)를 계산하는 업믹서 파라미터 계산기(1407, 1414, 1416)를 더 포함하고,
    상기 출력 인터페이스는 상기 적어도 2개의 다른 업믹싱 파라미터를 출력하도록 동작하는 것인, 인코더.
  32. 청구항 28 또는 청구항 29에 있어서,
    상기 적어도 하나의 베이스 채널을 계산하는 다운믹서 디바이스(1410)를 더 포함하고,
    상기 출력 인터페이스(1408)는 다운믹스 동작에 관한 정보를 출력하도록 동작하는 것인, 인코더.
  33. 청구항 32에 있어서,
    상기 다운믹서 디바이스는 스테레오 사전처리기를 포함하고,
    상기 출력 인터페이스는 상기 스테레오 사전처리기에 관한 정보를 출력하도록 동작하는 것인, 인코더.
  34. 청구항 31에 있어서,
    상기 업믹서 파라미터 계산기는, 업믹스된 채널의 파형을 이용함으로써 파라미터 최적화(1444)를 수행하고, 최적의 업믹싱 파라미터에 근거하여 디코더로 전송되는 적어도 2개의 업믹싱 파라미터를 발생하며, 상기 최적의 업믹싱 파라미터를 이용하여 상기 적어도 하나의 베이스 채널을 업믹싱함으로써 발생된 신호에 근거하는 에너지 측도를 계산하고 출력하도록 동작하는 것인, 인코더.
  35. 청구항 28 또는 청구항 29에 있어서,
    상기 인코더에서 얻을 수 있는 정보에 근거하는 다수개의 다른 파라메트릭 표현 중에서 특정 파라메트릭 표현을 발생하는 파라미터 발생기(104, 1001, 1520, 1522, 1414, 1416)를 더 포함하고,
    상기 출력 인터페이스(1408)는 상기 발생된 파라메트릭 표현 및 상기 다수개의 다른 파라미터 표현 중의 상기 특정 파라미터 표현을 잠재적으로 또는 명시적으로 나타내는 정보를 출력하도록 동작하는 것인, 인코더.
  36. 청구항 35에 있어서,
    상기 다수개의 다른 파라미터 표현은, 파형-기반 예측 업믹싱 구성에 대한 첫 번째 파라미터 표현 및 비-파형-기반 업믹싱 룰에 대한 두 번째 파라메트릭 표현을 포함하는 것인, 인코더.
  37. 청구항 36에 있어서,
    상기 비-파형-기반 업믹싱 룰은 에너지-보존 업믹싱 룰인 것인, 인코더.
  38. 청구항 35에 있어서,
    첫 번째 파라메트릭 표현은, 상기 파라미터가 최적화 과정을 이용하여 결정되고,
    두 번째 파라메트릭 표현은, 상기 오리지널 채널의 상기 에너지를 계산(1502)하고, 에네지의 결합에 근거하는 파라미터(1522)를 계산함으로써 결정되는 것인, 인코더.
  39. 청구항 28 또는 청구항 29에 있어서,
    상기 인코더에 의해 출력된 베이스 채널에 포함되지 않은 상기 오리지널 입력 신호의 적어도 하나의 대역에 대하여, 스펙트럼 대역 복제 사이드 정보를 발생하는 스펙트럼 대역 복제 모듈(1512, 1514)을 더 포함하는 것인, 인코더.
  40. 적어도 하나의 베이스 채널(1102)을 갖는 입력 신호를 이용하여 적어도 3개의 출력 채널(1100)을 발생하는 방법으로서, 상기 베이스 채널은 오리지널 멀티채널(101, 102, 103)로부터 유도된 것이고, 상기 방법은:
    상기 적어도 3개의 출력 채널이 얻어지도록 에너지-손실 도입 업믹싱 룰(201, 1408)에 근거하여 적어도 하나의 베이스 채널을 업믹싱하는 단계(1104)를 포함하며,
    상기 업믹싱 단계에서는, 상기 적어도 3개의 출력 채널이 에너지 측도(1106) 및 적어도 2개의 다른 업믹싱 파라미터(1108)에 반응하여 발생되어서, 상기 적어도 3개의 출력 채널이, 상기 에너지 손실 도입 업믹싱 룰에 따른 에너지 에러 대신 단지 상기 에너지 손실 도입 업믹싱 룰만을 이용하여 얻어진 에너지 보다 더 높은 에너지를 가지게 하고,
    상기 적어도 2개의 다른 업믹싱 파라미터(1108) 및 상기 업믹서를 제어하는 상기 에너지 측도가 상기 입력 신호에 포함되어 있고,
    상기 에너지-손실 도입 업믹싱 룰은, 예측 계수에 근거하는 메트릭스 계수를 갖는 업믹싱 메트릭스을 이용하는 예측 업믹싱 룰이고, 그리고
    상기 적어도 2개의 다른 업믹스 파라미터는 상기 업믹싱 메트릭스의 2개의 다른 요소(c11, c22)이거나, 또는 그로부터 상기 업믹싱 메트릭스의 상기 2개의 다른 요소가 유도될 수 있는 파라미터인 것인, 방법.
  41. 멀티채널 입력 신호를 처리하는 방법에 있어서:
    멀티채널 입력 신호 또는 상기 멀티채널 입력 신호로부터 유도된 적어도 하나의 베이스 채널과, 에너지-손실 도입 업믹싱 동작에 의해 발생된 업믹스된 신호 간의 에너지 차에 의존하여 에러 측도(ρ)를 계산하는(1402) 단계; 및
    상기 에너지 측도에 의존거하거나 상기 에너지 측도를 출력하는 스케일링 팩터(403)에 의해 스케일링된(401, 402) 이후의 상기 적어도 하나의 베이스 채널을 출력하는 단계(1408)를 포함하는, 방법.
  42. 인코딩된 멀티채널 정보 신호에 있어서,
    에너지 측도에 의해 스케일링된 적어도 하나의 베이스 채널을 가지며,
    상기 에너지 측도는, 멀티채널 입력 신호 또는 상기 멀티채널 입력 신호로부터 유도된 적어도 하나의 베이스 채널과, 에너지-손실 도입 업믹싱 동작에 의해 발생되거나 상기 에너지 측도를 갖거나 상기 에너지 측도를 출력하는 업믹스 신호 간의 에너지 차에 따르는 것이고, 상기 에너지-손실 도입 업믹싱 룰은, 예측 계수에 근거하는 메트릭스 계수를 갖는 업믹싱 메트릭스을 이용하는 예측 업믹싱 룰이며, 상기 적어도 2개의 다른 업믹스 파라미터는 상기 업믹싱 메트릭스의 2개의 다른 요소(c11, c22)이거나, 또는 그로부터 상기 업믹싱 메트릭스의 상기 2개의 다른 요소가 유도될 수 있는 파라미터인 것인, 인코딩된 멀티채널 정보 신호.
  43. 청구항 42에 따른 인코딩된 멀티채널 정보 신호를 저장하고 있는 기계-판독형 매체.
  44. 청구항 28 또는 청구항 29에 따른 인코더를 가지는 송신기 또는 오디오 레코더.
  45. 청구항 1 또는 청구항 2에 따른 디코더를 가지는 수신기 또는 오디오 플레이어.
  46. 청구항 44에 따른 송신기 및 청구항 45에 따른 수신기를 가지는 전송 시스템.
  47. 청구항 41에 따른 처리 방법을 가지는 송신 방법 또는 오디오 레코딩 방법.
  48. 청구항 40에 따른 발생 방법을 포함하는 수신 방법 또는 오디오를 플레이시키는 방법.
  49. 청구항 48에 따른 수신 방법 및 청구항 49에 따른 송신 방법.
  50. 컴퓨터에서 구동될 때, 청구항 40, 청구항 41, 청구항 47 및 청구항 48 중의 어느 하나의 방법에 따른 방법을 수행하기 위한 컴퓨터 프로그램이 저장된 기계 판독형 매체.
  51. 컴퓨터에서 구동될 때, 청구항 49에 따른 방법을 수행하기 위한 컴퓨터 프로그램이 저장된 기계 판독형 매체.
  52. 삭제
KR1020067026450A 2004-11-02 2005-10-28 개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소 KR100885192B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0402652A SE0402652D0 (sv) 2004-11-02 2004-11-02 Methods for improved performance of prediction based multi- channel reconstruction
SE0402652-2 2004-11-02

Publications (2)

Publication Number Publication Date
KR20070038043A KR20070038043A (ko) 2007-04-09
KR100885192B1 true KR100885192B1 (ko) 2009-02-24

Family

ID=33488133

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020067026450A KR100885192B1 (ko) 2004-11-02 2005-10-28 개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소
KR1020077000000A KR100905067B1 (ko) 2004-11-02 2005-10-28 멀티 파라미터화 기반의 멀티 채널 복원

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020077000000A KR100905067B1 (ko) 2004-11-02 2005-10-28 멀티 파라미터화 기반의 멀티 채널 복원

Country Status (14)

Country Link
US (2) US8515083B2 (ko)
EP (2) EP1730726B1 (ko)
JP (2) JP4527781B2 (ko)
KR (2) KR100885192B1 (ko)
CN (2) CN1969317B (ko)
AT (2) ATE371925T1 (ko)
DE (2) DE602005002833T2 (ko)
ES (2) ES2292147T3 (ko)
HK (2) HK1097336A1 (ko)
PL (2) PL1738353T3 (ko)
RU (2) RU2369917C2 (ko)
SE (1) SE0402652D0 (ko)
TW (2) TWI328405B (ko)
WO (2) WO2006048204A1 (ko)

Families Citing this family (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE602005016931D1 (de) * 2004-07-14 2009-11-12 Dolby Sweden Ab Tonkanalkonvertierung
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
PL1810280T3 (pl) * 2004-10-28 2018-01-31 Dts Inc Silnik przestrzennego środowiska dźwiękowego
US7853022B2 (en) 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
CN101151658B (zh) * 2005-03-30 2011-07-06 皇家飞利浦电子股份有限公司 多声道音频编码和解码方法、编码器和解码器
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
EP1946294A2 (en) * 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US8019614B2 (en) * 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
MX2008012324A (es) * 2006-03-28 2008-10-10 Fraunhofer Ges Zur Foeerderung Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal.
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
WO2008016097A1 (fr) * 2006-08-04 2008-02-07 Panasonic Corporation dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci
RU2454825C2 (ru) * 2006-09-14 2012-06-27 Конинклейке Филипс Электроникс Н.В. Манипулирование зоной наилучшего восприятия для многоканального сигнала
US7987096B2 (en) 2006-09-29 2011-07-26 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8364497B2 (en) 2006-09-29 2013-01-29 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
CN103400583B (zh) * 2006-10-16 2016-01-20 杜比国际公司 多声道下混对象编码的增强编码和参数表示
BRPI0715312B1 (pt) 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
EP2095364B1 (en) * 2006-11-24 2012-06-27 LG Electronics Inc. Method and apparatus for encoding object-based audio signal
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
EP2595148A3 (en) 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for coding multi-object audio signals
JP5232795B2 (ja) 2007-02-14 2013-07-10 エルジー エレクトロニクス インコーポレイティド オブジェクトベースのオーディオ信号の符号化及び復号化方法並びにその装置
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
ES2452348T3 (es) * 2007-04-26 2014-04-01 Dolby International Ab Aparato y procedimiento para sintetizar una señal de salida
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8155971B2 (en) * 2007-10-17 2012-04-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoding of multi-audio-object signal using upmixing
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
KR101221918B1 (ko) * 2007-11-21 2013-01-15 엘지전자 주식회사 신호 처리 방법 및 장치
EP2232486B1 (en) 2008-01-01 2013-07-17 LG Electronics Inc. A method and an apparatus for processing an audio signal
CA2710741A1 (en) 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing a signal
JP5243553B2 (ja) * 2008-01-01 2013-07-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
CA2716926C (en) * 2008-03-04 2014-08-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
KR101335975B1 (ko) * 2008-08-14 2013-12-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 복수의 오디오 입력 신호를 리포맷팅하는 방법
JP5326465B2 (ja) 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
CN101740030B (zh) * 2008-11-04 2012-07-18 北京中星微电子有限公司 语音信号的发送及接收方法、及其装置
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US9172572B2 (en) 2009-01-30 2015-10-27 Samsung Electronics Co., Ltd. Digital video broadcasting-cable system and method for processing reserved tone
US20120072207A1 (en) * 2009-06-02 2012-03-22 Panasonic Corporation Down-mixing device, encoder, and method therefor
CN102667920B (zh) * 2009-12-16 2014-03-12 杜比国际公司 Sbr比特流参数缩混
AU2013242852B2 (en) * 2009-12-16 2015-11-12 Dolby International Ab Sbr bitstream parameter downmix
US8872911B1 (en) * 2010-01-05 2014-10-28 Cognex Corporation Line scan calibration method and apparatus
CN104618065B (zh) 2010-01-13 2018-02-23 太阳专利托管公司 发送装置、发送方法、接收装置、接收方法
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
JP5604933B2 (ja) 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
BR122019013299B1 (pt) * 2010-04-09 2021-01-05 Dolby International Ab aparelho e método para emitir um sinal de áudio esterofônico possuindo um canal esquerdo e um canal direito e meio legível por computador não transitório
EP2586025A4 (en) 2010-07-20 2015-03-11 Huawei Tech Co Ltd A tone signal
KR101678610B1 (ko) 2010-07-27 2016-11-23 삼성전자주식회사 롱텀 채널 정보를 기반으로 다중 노드 간 서브밴드 별 협력 통신을 수행하는 방법 및 장치
CN103380455B (zh) * 2011-02-09 2015-06-10 瑞典爱立信有限公司 对音频信号的高效编码/解码
KR101572034B1 (ko) 2011-05-19 2015-11-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 파라메트릭 오디오 코딩 방식들의 포렌식 검출
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
JP6096789B2 (ja) * 2011-11-01 2017-03-15 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオオブジェクトのエンコーディング及びデコーディング
JP6106983B2 (ja) 2011-11-30 2017-04-05 株式会社リコー 画像表示装置、画像表示システム、方法及びプログラム
JP5799824B2 (ja) 2012-01-18 2015-10-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US20130253923A1 (en) * 2012-03-21 2013-09-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Multichannel enhancement system for preserving spatial cues
JP6051621B2 (ja) 2012-06-29 2016-12-27 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
KR101689766B1 (ko) * 2012-11-15 2016-12-26 가부시키가이샤 엔.티.티.도코모 음성 복호 장치, 음성 복호 방법, 음성 부호화 장치, 및 음성 부호화 방법
CN105229738B (zh) 2013-01-29 2019-07-26 弗劳恩霍夫应用研究促进协会 用于使用能量限制操作产生频率增强信号的装置及方法
CA2899134C (en) * 2013-01-29 2019-07-30 Frederik Nagel Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
KR102170665B1 (ko) 2013-04-05 2020-10-29 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
AU2014295207B2 (en) * 2013-07-22 2017-02-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN104376857A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 信息处理的方法及电子设备
JP6001814B1 (ja) 2013-08-28 2016-10-05 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイブリッドの波形符号化およびパラメトリック符号化発話向上
TWI671734B (zh) 2013-09-12 2019-09-11 瑞典商杜比國際公司 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統
CN105531761B (zh) * 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
US9848272B2 (en) 2013-10-21 2017-12-19 Dolby International Ab Decorrelator structure for parametric reconstruction of audio signals
BR112016008817B1 (pt) * 2013-10-21 2022-03-22 Dolby International Ab Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
CN105096958B (zh) 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
WO2016050854A1 (en) * 2014-10-02 2016-04-07 Dolby International Ab Decoding method and decoder for dialog enhancement
WO2017027308A1 (en) 2015-08-07 2017-02-16 Dolby Laboratories Licensing Corporation Processing object-based audio signals
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
GB2554065B (en) * 2016-09-08 2022-02-23 V Nova Int Ltd Data processing apparatuses, methods, computer programs and computer-readable media
CN109859766B (zh) * 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
DE102018127071B3 (de) 2018-10-30 2020-01-09 Harman Becker Automotive Systems Gmbh Audiosignalverarbeitung mit akustischer Echounterdrückung
TWI772930B (zh) * 2020-10-21 2022-08-01 美商音美得股份有限公司 適合即時應用之分析濾波器組及其運算程序、基於分析濾波器組之信號處理系統及程序
US11837244B2 (en) 2021-03-29 2023-12-05 Invictumtech Inc. Analysis filter bank and computing procedure thereof, analysis filter bank based signal processing system and procedure suitable for real-time applications
CN113438595B (zh) * 2021-06-24 2022-03-18 深圳市叡扬声学设计研发有限公司 音频处理系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4744044A (en) * 1986-06-20 1988-05-10 Electronic Teacher's Aids, Inc. Hand-held calculator for dimensional calculations
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6590983B1 (en) 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
KR20040080003A (ko) 2002-02-18 2004-09-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 오디오 코딩
TWI242992B (en) 2002-04-25 2005-11-01 Raytheon Co Dynamic wireless resource utilization
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
GB0228163D0 (en) * 2002-12-03 2003-01-08 Qinetiq Ltd Decorrelation of signals
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
C. Faller and F. Baumgarte, "Binaural Cue Coding - Part II: Schemes and applications," IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003.
Christof Faller, ‘PARAMETRIC CODING OF SPATIAL AUDIO’, THÈSE NO 3062, ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE, 2004
F. Baumgarte and C. Faller, "Binaural Cue Coding - Part I: Psychoacoustic fundamentals and design principles," IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003.

Also Published As

Publication number Publication date
JP4527781B2 (ja) 2010-08-18
US20060165237A1 (en) 2006-07-27
RU2006146947A (ru) 2008-07-10
HK1097082A1 (en) 2007-06-15
ES2292147T3 (es) 2008-03-01
JP2008517337A (ja) 2008-05-22
EP1738353B1 (en) 2007-08-29
RU2369918C2 (ru) 2009-10-10
EP1730726B1 (en) 2007-10-10
ATE375590T1 (de) 2007-10-15
ES2294738T3 (es) 2008-04-01
EP1738353A1 (en) 2007-01-03
DE602005002256D1 (de) 2007-10-11
US8515083B2 (en) 2013-08-20
JP4527782B2 (ja) 2010-08-18
TWI338281B (en) 2011-03-01
HK1097336A1 (en) 2007-07-27
US20060140412A1 (en) 2006-06-29
KR20070038043A (ko) 2007-04-09
KR20070049627A (ko) 2007-05-11
TW200629961A (en) 2006-08-16
RU2369917C2 (ru) 2009-10-10
DE602005002833T2 (de) 2008-03-13
SE0402652D0 (sv) 2004-11-02
EP1730726A1 (en) 2006-12-13
CN1998046A (zh) 2007-07-11
WO2006048203A1 (en) 2006-05-11
WO2006048204A1 (en) 2006-05-11
CN1969317A (zh) 2007-05-23
PL1730726T3 (pl) 2008-03-31
TWI328405B (en) 2010-08-01
KR100905067B1 (ko) 2009-06-30
TW200627380A (en) 2006-08-01
RU2006146948A (ru) 2008-07-10
DE602005002256T2 (de) 2008-05-29
US7668722B2 (en) 2010-02-23
ATE371925T1 (de) 2007-09-15
CN1969317B (zh) 2010-12-29
PL1738353T3 (pl) 2008-01-31
DE602005002833D1 (de) 2007-11-22
JP2008517338A (ja) 2008-05-22
CN1998046B (zh) 2012-01-18

Similar Documents

Publication Publication Date Title
KR100885192B1 (ko) 개선된 성능의 예측 기반의 멀티 채널 복원 방법, 장치 및 그 구성 요소
JP7156986B2 (ja) 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム
US8249883B2 (en) Channel extension coding for multi-channel source
CN109509478B (zh) 音频处理装置
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
KR101629862B1 (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
JP5189979B2 (ja) 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御
KR100848365B1 (ko) 멀티채널 오디오 신호를 표현하는 방법
CA2598541C (en) Near-transparent or transparent multi-channel encoder/decoder scheme
KR20170126994A (ko) 다채널 신호를 인코딩하기 위한 오디오 인코더 및 인코딩된 오디오 신호를 디코딩하기 위한 오디오 디코더
CN114270437A (zh) 参数编码与解码

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130130

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140203

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190130

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20200130

Year of fee payment: 12