KR20090007471A - 에너지-비보존 업믹스 규칙들 측면에서의 바이노럴 멀티 채널 디코더 - Google Patents

에너지-비보존 업믹스 규칙들 측면에서의 바이노럴 멀티 채널 디코더 Download PDF

Info

Publication number
KR20090007471A
KR20090007471A KR1020087029286A KR20087029286A KR20090007471A KR 20090007471 A KR20090007471 A KR 20090007471A KR 1020087029286 A KR1020087029286 A KR 1020087029286A KR 20087029286 A KR20087029286 A KR 20087029286A KR 20090007471 A KR20090007471 A KR 20090007471A
Authority
KR
South Korea
Prior art keywords
channel
filter
binaural
upmix
filters
Prior art date
Application number
KR1020087029286A
Other languages
English (en)
Other versions
KR101004834B1 (ko
Inventor
라르스 빌레모에스
Original Assignee
돌비 스웨덴 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 스웨덴 에이비 filed Critical 돌비 스웨덴 에이비
Publication of KR20090007471A publication Critical patent/KR20090007471A/ko
Application granted granted Critical
Publication of KR101004834B1 publication Critical patent/KR101004834B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

업믹스 채널들에 상응하는 머리 관련 전달 함수 기반 필터들의 특성들 및 업믹스 규칙 정보에 기초하여 이득 인자(180)를 계산하기 위해, 에너지-에러를 야기하는 업믹스 규칙에 관한 업믹스 규칙 정보를 이용해 다운믹스 신호로부터 바이노럴 신호를 생성하는 멀티-채널 디코더. 하나 이상의 이득 인자는 다운믹스 신호를 필터링하기 위해 필터 프로세서(182)에 의해 사용되어, 좌측 바이노럴 채널 및 우측 바이노럴 채널을 가지는 에너지 보정된 바이노럴 신호가 얻어질 수 있다.

Description

에너지-비보존 업믹스 규칙들 측면에서의 바이노럴 멀티 채널 디코더{BINAURAL MULTI-CHANNEL DECODER IN THE CONTEXT OF NON-ENERGY-CONSERVING UPMIX RULES}
본 발명은 HRTF 필터링 수단에 의한 유효한 다운믹스된 신호 및 부가적인 제어 데이터에 기초한 바이노럴(binaural) 디코딩에 관한 것이다.
오디오 디코딩에 있어서의 최근의 개발은, 스테레오 (또는 모노) 신호 및 상응하는 제어 데이터에 기반하여 오디오 신호의 멀티-채널 표현을 재생성하기에 유용한 방법들을 만들어왔다. 이러한 방법들은, 부가적인 제어 데이터가 전송된 모노 또는 스테레오 채널들에 기초하여 서라운드 채널들의 재생성을 제어하기 위해 전송(또한 업믹스(up-mix)라 불리기도 함)되기 때문에, 돌비 프로로직(Dolby Prologic)과 같은 솔루션에 기초한 예전의 매트릭스와는 실질적으로 상이하다.
따라서, 이러한 파라메트릭(parametric) 멀티-채널 오디오 디코더, 즉, MPEG 서라운드(Surround)는 M개의 전송된 채널들 및 부가 제어 데이터에 기초하여 N 개의 채널들을 재구성한다(여기서, N>M). 부가적인 제어 데이터는 N 개의 모든 채널들의 전송에 필요한 것보다 훨씬 낮은 데이터 레이트를 표현하여, 코딩을 매우 효과적으로 만듦과 동시에 M 채널 장치들과 N 채널 장치들 모두와의 호환성을 보장한 다 [J. Breebaart 외. "MPEG spatial audio coding / MPEG Surround: overview and current status" Proc. 119차 AES 컨벤션(뉴욕, USA), 2005년 10월, Preprint 6447].
이러한 서라운드 코딩 방법들은 주로 채널 레벨 차이(CLD, channel level difference) 및 채널간 코히어런스/크로스-상관(ICC, Inter-channel coherence/cross-correlation)에 기초한 서라운드 신호의 파라미터화를 포함한다. 이러한 파라미터들은 업믹스 프로세스에서 채널 쌍들 사이의 파워 비율 및 상관을 기술한다. 추가적인 채널 예측 계수들(CPC, Channel Prediction Coefficients) 또한 선행 기술에서 업믹스 프로시져 동안 중간 또는 출력 채널들을 예측하기 위해 사용된다.
오디오 코딩의 다른 개발들은 스테레오 헤드폰을 통해 멀티 채널 신호 감동을 획득하기 위한 수단을 제공해왔다. 이는 원래의 멀티 채널 신호 및 HRTF(Head Related Transfer Functions) 필터를 이용해 멀티 채널 신호를 스테레오로 다운믹싱함으로써 주로 이루어졌다.
또한, 이것은 계산적 효율성의 이유로, 그리고 또한 오디오 품질의 이유로, 좌측 바이노럴 채널 및 우측 바이노럴 채널을 가지는 바이노럴 신호의 생성을 단축시키는 데 유용할 것이다.
하지만, 문제는 원래의 HRTF 필터들이 어떻게 결합되느냐이다. 또한, 에너지-손실-영향을 받는 업믹싱 규칙의 측면에서, 즉, 멀티-채널 디코더 입력 신호가, 예를 들어, 에너지-비보존적인 방법으로 업믹싱하는 데 사용되는, 제1 다운믹스 채 널 및 제2 다운믹스 채널을 가지고, 추가적으로 공간 파라미터를 가지는 다운믹스 신호를 포함할 때 문제가 발생한다. 이러한 파라미터들은 또한 예측 파라미터들 또는 CPC 파라미터들로 알려져 있기도 하다. 이러한 파라미터들은, 채널 레벨 차이 파라미터들과는 대조적으로, 이들 파라미터들이 두 채널간의 에너지 분포를 반영하기 위해 계산되지 않고, 자동적으로 에너지 에러(예를 들어, 손실)를 초래하는 가능한한-최적의 파형 매칭을 수행하기 위해 계산된다는 특성을 가지는데, 이는 예측 파라미터들이 생성될 때, 업믹스의 에너지-보존 특성들은 고려되지 않고, 원래의 신호와 비교하여 재구성된 신호의 되도록 좋은 시간 또는 서브밴드 영역 파형 매칭을 가지는 것이 고려되기 때문이다.
이렇게 전송된 공간 예측 파라미터들에 기초하여 HRTF 필터들을 단순히 선형적으로 결합하려고 할 때, 채널 예측이 제대로 수행되지 않는 경우, 특히 심각한 아티팩트를 얻게 된다. 이런 경우, 미묘한 선형적 의존성조차도 바이노럴 출력의 원하지 않는 스펙트럴 채색(spectral coloring)을 도출하게 된다. 이러한 아티팩트는 원래의 채널들이 쌍으로 비상관되고(pairwise uncorrelated) 유사한 크기(magnitude)를 가지는 신호들을 가질 때 가장 빈번히 발생하는 것으로 알려져 있다.
본 발명은, 멀티-채널 디코딩에 대해, 예를 들어, 멀티-채널 신호의 헤드폰 재생에 사용될 수 있는 바이노럴 신호를 획득하는 효과적이면서 질적으로 허용 가능한 개념을 제공하는 것을 그 목적으로 한다.
본 발명의 제1 측면에 따르면, 이러한 목적은, 업믹스 규칙을 이용해 다운믹스 신호를 업믹싱하는 데 사용 가능한 업믹스 규칙 정보를 포함하는 파라미터들을 사용하여 원래의 멀티-채널 신호로부터 도출된 다운믹스 신호로부터 바이노럴 신호를 생성하는 멀티-채널 디코더로서, 업믹스 규칙 정보 및 업믹스 채널들과 관련하여 머리 관련 전달 함수 기반 필터들의 필터 특성들에 기반하여, 에너지-에러를 감소시키거나 또는 제거시키는 적어도 하나의 이득 인자를 계산하는 이득 인자 계산기, 및 에너지-보정된 바이노럴 신호를 획득하기 위해, 적어도 하나의 이득 인자, 필터 특성들 및 업믹스 규칙 정보를 사용하여 다운믹스 신호를 필터링하는 필터 프로세서로를 포함하는멀티-채널 디코더에 의해 달성된다.
본 발명의 제2 측면에 따르면, 이러한 목적은, 업믹스 규칙을 이용해 다운믹스 신호를 업믹싱하는 데 사용 가능한 업믹스 규칙 정보를 포함하는 파라미터들을 사용하여 원래의 멀티-채널 신호로부터 도출된 다운믹스 신호로부터 바이노럴 신호를 생성하는 멀티-채널 디코딩 방법으로서, 업믹스 규칙 정보 및 업믹스 채널들과 관련하여 머리 관련 전달 함수 기반 필터들의 필터 특성들에 기반하여, 에너지-에러를 감소시키거나 또는 제거시키는 적어도 하나의 이득 인자를 계산하는 단계; 및 에너지-보정된 바이노럴 신호를 획득하기 위해, 적어도 하나의 이득 인자, 필터 특성들 및 업믹스 규칙 정보를 사용하여 다운믹스 신호를 필터링하는 단계를 포함하는 멀티-채널 디코딩 방법에 의해 달성된다.
본 발명의 다른 측면은, 컴퓨터 상에서 동작할 때, 상기 멀티-채널 디코딩 방법을 실행하는 컴퓨터로 판독 가능한 코드를 가지는 컴퓨터 프로그램에 관련된다.
본 발명은 다운믹스 신호를 필터링함에 있어, 멀티채널 신호를 완전히 렝더링할 필요 없이, 그리고 이어서 막대한 개수의 HRTF 필터들을 적용시킬 필요 없이 바이노럴 신호를 획득하는 데 있어, 에너지 에러를 초래하는 업믹스에 대한 업믹스 규칙 정보를 오히려 유리하게 사용할 수 있다는 발견에 기초한다. 본 발명에 따르면, 그대신 에너지-에러-영향을 받는(energy-error-affected) 업믹스 규칙과 관련한 업믹스 규칙 정보가, 본 발명에 따라 다운믹스 신호를 필터링할 때 이득 인자(gain factor)가 계산되고 사용되는 경우(여기서, 이 이득 인자는 에너지 에러가 감소되거나 또는 완전히 제거되도록 계산된다), 다운믹스 신호의 바이노럴 렌더링을 축소시키는 데 유리하게 사용될 수 있다.
특히, 이득 인자는 예측 파라미터들과 같은 업믹스 규칙에 대한 정보에만 의존하는 것은 아니며, 중요하게, 업믹스 규칙이 주어진 업믹스 채널들에 상응하는 머리 관련 전달 함수 기반 필터들에도 의존한다. 특히, 이러한 업믹스 채널들은 본 발명의 바람직한 실시예에는 절대로 존재하지 않는데, 이는 바이노럴 채널들이 예를 들어, 3 개의 중간 채널들을 우선적으로 렌더링하지 않고 계산되기 때문이다. 하지만, 비록 업믹스 채널들이 바람직한 실시예에는 절대 존재하지 않더라도 업믹스 채널들과 관련하여 HRTF 기반 필터들을 도출하거나 제공할 수 있다. 이러한 에너지-에러-영향을 받는 업믹스 규칙에 의해 나타난 에너지 에러는 인코더로부터 디코더로 전송된 업믹스 규칙 정보에 상응할뿐 아니라, HRTF 기반 필터들에 의존하여, 이득 인자 생성시, HRTF 기반 필터들 또한 이득 인자의 계산에 영향을 미친다는 것이 알려져 있다.
이와 같은 측면에서, 본 발명은 예측 파라미터와 같은 업믹스 규칙 정보, 및 업믹스 규칙을 이용한 업믹싱의 결과가 될 수도 있는 채널을 위한 HRTF 기반 필터들의 특정한 출현 사이의 상호의존성을 설명한다.
따라서, 본 발명은 파라메트릭 멀티-채널 오디오의 바이노럴 디코딩과 결합하여 예측적 업믹스의 사용으로부터 발생하는 스펙트럴 채색의 문제에 대한 해결책을 제공한다.
본 발명의 바람직한 실시예들은 다음의 특성들: M 개의 디코딩된 신호들로부터 바이노럴 오디오 신호 및 N > M 채널들의 생성에 적합한 공간 파라미터들을 생성하는 오디오 디코더로서, 다수의 서브밴드들에서, 바이노럴 서브밴드 필터들의 P 쌍들로부터의 두 보상 이득들 및 P 중간 채널들의 생성에 적합한 공간 파라미터들의 서브셋을 추정하는 이득 계산기, 그리고, 다수의 서브밴드들에서, 바이노럴 서브밴드 필터들의 P 쌍들의 선형 조합에 의해 획득된 M 쌍(pair)의 바이노럴 서브밴드 필터들을 변형시키는 이득 조절기로서, 상기 변형은 이득 계산기에 의해 계산된 두 이득과 M 개의 ㄴ쌍 각각과의 곱셈으로 구성되는, 이득 조절기를 포함하는 오디오 디코더 특성을 포함한다.
본 발명의 바람직한 실시예들이 첨부되는 도면들을 참조하여, 본 발명의 범위 또는 사상을 제한하지 않는 예시적인 실시예의 방법으로 설명될 것이다.
도 1은 HRTF 관련 필터들을 사용하여 파라메트릭 멀티채널 신호들의 바이노 럴 합성을 도시한다.
도 2는 결합 필터링(combined filtering)을 사용한 파라메트릭 멀티채널 신호들의 바이노럴 합성을 도시한다.
도 3은 본 발명에 따른 파라미터/필터 결합기의 구성요소들을 도시한다.
도 4는 MPEG 서라운드 공간 디코딩의 구조를 도시한다.
도 5는 본 발명에 따른 이득 보상이 없는 디코딩된 바이노럴 신호의 스펙트럼을 도시한다.
도 6은 본 발명에 따른 바이노럴 신호의 디코딩의 스펙트럼을 도시한다.
도 7은 HRTF를 이용한 통상적인 바이노럴 합성을 도시한다.
도 8은 MPEG 서라운드 인코더를 도시한다.
도 9는 MPEG 서라운드 디코더 및 바이노럴 합성기의 연결을 도시한다.
도 10은 특정 구성을 위한 개념적인 3D 바이노럴 디코더를 도시한다.
도 11은 특정 구성을 위한 공간 인코더를 도시한다.
도 12는 공간 (MPEG 서라운드) 디코더를 도시한다.
도 13은 이득 인자 보정 없이 바이노럴 신호들을 획득하기 위해 4 개의 필터들을 사용한, 2 개의 다운믹스 채널들의 필터링을 도시한다.
도 14는 5개의 채널 셋업에서 여러 HRTF 필터들(1~10)을 설명하기 위한 공간적 셋업을 도시한다.
도 15는 L, Ls 및 R, Rs를 위한 채널들이 결합되었을 때, 도 14의 상황을 도시한다.
도 16a는 HRTF 필터들의 최대 결합이 실행되고, 도 13의 4개의 필터들만이 남아 있는 경우, 도 14 또는 도 15로부터의 셋업을 도시한다.
도 16b는 에너지-비보존적 업믹스를 초래하는 업믹스 계수들을 가지는 도 20 인코더에 의해 결정된 것과 같은 업믹스 규칙을 도시한다.
도 17은 HRTF 필터들이 어떻게 4개의 HRTF-기반 필터들을 최종적으로 획득하도록 결합되었는지 도시한다.
도 18은 본 발명에 따른 멀티-채널 디코더의 바람직한 일 실시예를 도시한다.
도 19a는 이득 보정 없는 HRTF-기반 필터링 이후 스케일링 단계를 가지는 본 발명의 멀티-채널 디코더의 제1 실시예를 도시한다.
도 19b는 이득-조절된 필터 출력 신호를 도출하는 조절된 HRTF-기반 필터들을 가지는 본 발명의 장치를 도시한다.
도 20은 에너지-비보존적 업믹스 규칙에 대한 정보를 생성하는 인코더의 일 실시예를 도시한다.
본 발명의 이득 조절 측면을 자세히 논의하기 전에, HRTF 필터들의 결합 및 HRTF-기반 필터들의 사용이 도 7 내지 11과 관련하여 논의될 것이다.
본 발명의 특성 및 이점들을 보다 잘 설명하기 위해, 우선 보다 정교한 설명이 주어진다. 바이노럴 합성 알고리즘이 도 7에서 서술된다. 일련의 입력 신호가 일련의 HRTF에 의해 필터링된다. 각 입력 신호는 두 개의 신호(좌측 'L,' 및 우측 'R' 구성요소)로 분리되는데, 이어서 이들 신호 각각은 원하는 사운드 소스 위치에 대응되는 HRTF에 의해 필터링된다. 모든 좌측-귀 신호들은 이어서 좌측 바이노럴 출력 신호를 생성하기 위해 합쳐지고, 우측-귀 신호들은 우측 바이노럴 출력 신호를 생성하기 위해 합쳐진다.
HRTF 컨벌루션(convolution)은 시간 영역에서 실행될 수 있지만, 종종 계산 효율성 때문에 주파수 영역에서 필터링을 수행하는 것이 선호된다. 이 경우, 도 7에 도시된 합산 또한 주파수 영역에서 행해진다.
원칙적으로, 도 7에 설명된 바이노럴 합성 방법은 MPEG 서라운드 인코더/디코더와의 결합에 직접 사용될 수 있다. MPEG 서라운드 인코더가 도 8에 도식적으로 보여진다. 멀티-채널 입력 신호가 공간 인코더에 의해 분석되어, 공간 파라미터들과 결합된 모노 또는 스테레오 다운 믹스 신호를 발생시킨다. 다운 믹스는 어떤 통상적인 모노 또는 스테레오 오디오 코덱으로도 인코딩될 수 있다. 결과적인 다운-믹스 비트 스트림은 멀티플렉서(multiplexer)에 의해 공간 파라미터들과 결합되어, 전체 출력 비트 스트림이 도출된다.
MPEG 서라운드 디코더와 결합된 바이노럴 합성 방법이 도 9에 보여진다. 입력 비트 스트림이 디-멀티플렉싱되어 공간 파라미터들과 다운-믹스 비트 스트림이 도출된다. 다운-믹스 비트 스트림은 통상적인 모노 또는 스테레오 디코더를 사용하여 디코딩된다. 디코딩된 다운 믹스는 공간 디코더에 의해 디코딩되고, 디코더는 전송된 공간 파라미터들에 기초하여 멀티-채널 출력을 생성한다. 최종적으로, 멀티-채널 출력이 도 7에 도시된 바이노럴 합성 단계에 의해 처리되어, 바이노럴 출력 신호를 도출한다.
하지만, MPEG 서라운드 디코더 및 바이노럴 합성 모듈의 이러한 연결에는 적어도 3가지 단점이 있다.
멀티-채널 신호 표현은 중간 단계로서 계산되고, 바이노럴 합성 단계의 HRTF 컨벌루션 및 다운믹싱이 뒤따른다. 비록 HRTF 컨벌루션이 채널 단위를 기반으로 수행되어야 한다고 하더라도, 각 오디오 채널이 다른 공간적 위치를 가질 수 있다는 사실이 주어진 상태에서, 이는 복잡도 관점에서 바람직하지 않은 상황이다.
공간 디코더는 필터뱅크(QMF) 영역에서 동작한다. 반면, HRTF 컨벌루션은 일반적으로 FFT 영역에 적용된다. 그러므로, 멀티-채널 QMF 합성 필터뱅크, 멀티-채널 DFT 변환, 및 스테레오 역 DFT 변환의 연결이 필요하고, 이는 시스템에서 높은 계산적 요구사항을 초래한다.
멀티-채널 재구성을 생성하기 위해 공간 디코더에 의해 생성된 코딩 아티팩트가 들릴 수 있고, 어쩌면 (스테레오) 바이노럴 출력에서 강화될 것이다.
도 11에 공간 인코더가 도시되어 있다. 좌-전방, 좌-서라운드, 중앙, 우-전방, 우-서라운드 채널들을 위한 Lf, Ls, C, Rf, 및 Rs 신호로 구성되는 멀티-채널 입력 신호가 2 개의 'OTT' 유닛에 의해 처리되는데, 이들 두 유닛은 2개의 입력 신호들을 위한 모노 다운 믹스 및 파라미터들을 생성한다. 중앙 채널과 결합된 결과적인 다운-믹스 신호들은 'TTT' (2-대-3, Two-To-Three) 인코더에 의해 추가적으로 처리되어, 스테레오 다운 믹스 및 부가적인 공간 파라미터들을 생성한다.
'TTT' 인코더로부터 도출되는 파라미터들은, 세 입력 신호들의 에너지 비율을 서술하기 위해 통상적으로 각 파라미터 밴드를 위한 예측 계수들의 쌍, 또는 레벨 차이들의 쌍으로 구성된다. 'OTT' 인코더들의 파라미터들은 레벨 차이들 및 각 주파수 대역를 위한 입력 신호들 간의 코히어런스 또는 크로스-상관 값들로 구성된다.
도 12에는 MPEG 서라운드 디코더가 도시되어 있다. 다운 믹스 신호들(l0 및 r0)이 2-대-3 모듈로 입력되고, 상기 모듈은 중앙 채널, 우측 채널 및 좌측 채널을 재생성한다. 이러한 3 채널들은 추가적으로 여러 OTT 모듈들(1-대-2)에 의해 처리되어 6개의 출력 채널들을 도출한다.
개념적 관점에서 본 대응되는 바이노럴 디코더가 도 10에 도시된다. 필터뱅크 영역 내에서, 스테레오 입력 신호(L0, R0)가 TTT 디코더에 의해 처리되고, 세 신호들 L, R,및 C을 도출한다. 이러한 세 신호들은 HRTF 파라미터 처리로 제공된다. 결과적인 여섯 채널들은 스테레오 바이노럴 출력 쌍(Lb, Rb)을 생성하기 위해 합쳐진다.
TTT 디코더는 아래의 매트릭스 동작과 같이 설명될 수 있다(여기서, 매트릭스 엔트리 mxy는 공간 파라미터들에 의존함).
Figure 112008082398541-PCT00001
공간 파라미터들 및 매트릭스 엔트리들의 관계는 5.1-멀티채널 MPEG 서라운드 디코더에서의 그러한 관계들과 동일하다. 세 결과적인 신호들 L, R, 및 C각각은 둘로 분리되고 이러한 사운드 소스들의 원하는 (감지된) 위치에 상응하는 HRTF 파라미터들을 이용해 처리된다. 중앙 채널(C)에 대해서는, 사운드 소스 위치의 공간적 파라미터들이 직접 적용될 수 있어, 중앙에 대한 두 출력 신호들, LB(C) 및 RB(C):
Figure 112008082398541-PCT00002
가 도출된다.
좌측(L) 채널에 대해서는, 좌-전방 및 좌-서라운드 채널들로부터의 HRTF 파라미터들이, 가중치 w lf w rf 를 이용해 하나의 HRTF 파라미터 세트로 결합된다. 결과적인 '합성(composite)' HRTF 파라미터들은 통계적 측면에서 전방 및 서라운드 채널들 양쪽의 효과를 시뮬레이션한다. 좌측 채널에 대해 바이노럴 출력 쌍 (L B , R B ) 을 생성하는 데 아래의 식이 사용된다.
Figure 112008082398541-PCT00003
유사한 방식으로, 우측 채널에 대한 바이노럴 출력이,
Figure 112008082398541-PCT00004
에 따라 얻어진다.
LB(C), RB(C), LB(L), RB(L), LB(R) 및 RB(R) 의 정의가 상기와 같이 주어진 상태에서, 완전한 LB 및 RB 신호들이 스테레오 입력 신호가 주어진 단일 2 × 2 매트릭스로부터 아래와 같이 도출될 수 있으며,
Figure 112008082398541-PCT00005
여기서,
Figure 112008082398541-PCT00006
이다.
Hx(Y) 필터들은 원래의 HRTF 필터들의 파라메트릭 버전의 파라메트릭 가중된 조합들로 표현될 수 있다. 이것이 제대로 동작하기 위해서 원래의 HRTF 필터들이,
ㆍ좌측-귀 임펄스 응답을 위한 주파수 대역 당 (평균) 레벨;
ㆍ우측-귀 임펄스 응답을 위한 주파수 대역 당 (평균) 레벨;
ㆍ좌측-귀 및 우측-귀 임펄스 응답 간의 (평균) 도착 시간 또는 위상 차이;
로서 표현된다.
따라서, 중앙 채널 입력 신호가 주어진 상태에서 좌측 및 우측 귀를 위한 HRTF 필터들은,
Figure 112008082398541-PCT00007
로서 표현되고, 여기서 Pl(C)는 좌측 귀에 대해 주어진 주파수 대역에 대한 평균 레벨이고, φ(C)는 위상 차이이다.
따라서, HRTF 파라미터 처리는 단순히, 중앙 채널의 사운드 소스 위치에 상응하는 Pl 및 Pr과 신호의 곱으로 구성되며, 위상 차이는 대칭적으로 분포된다. 이 처리는, 한편으로 HRTF 파라미터들로부터 QMF 필터뱅크로의 매핑, 그리고 다른 한편으로는 공간 파라미터들로부터의 QMF 대역으로의 매핑을 이용해, 각 QMF 대역에 대해 독립적으로 실행된다.
유사하게, 좌측 채널 및 우측 채널이 주어진 상태에서 좌측 및 우측 귀에 대한 HRTF 필터들이,
Figure 112008082398541-PCT00008
와 같이 주어진다.
명백히, HRTF들은 6 개의 원래 채널들에 대해 파라미터화된 HRTF 필터들에 대한 레벨들 및 위상 차이들의 가중된 결합이다.
가중치 w lf w ls 는 Lf 및 Ls에 대한 'OTT' 박스의 CLD 파라미터에 의존한다:
Figure 112008082398541-PCT00009
그리고, 가중치 w rf w rs 는 Rf 및 Rs에 대한 'OTT' 박스의 CLD 파라미터에 의존한다:
Figure 112008082398541-PCT00010
상기 접근은 주파수 대역 당 평균 레벨, 및 주파수 대역 당 평균 위상 차이로서 충분히 정확하게 표현될 수 있는 짧은 HRTF 필터들에 대해 잘 동작한다. 하지만, 긴 에코적(echoic) HRTF에 대해서는 이것이 적용되지 않는다.
본 발명은 임의의 긴 HRTF 필터들을 다루기 위해 2×2 메트릭스 바이노럴 디코더의 접근을 어떻게 확장할 것인지 알려준다. 이를 달성하기 위해, 본 발명은 아래의 단계들을 포함한다:
ㆍHRTF 필터 응답을 필터뱅크 영역으로 변환;
ㆍHRTF 필터 쌍들로부터의 전체적인 지연 차이 또는 위상 차이 감산;
ㆍHRTF 필터 쌍의 응답을 CLD 파라미터들의 함수로서 모프(morph)
ㆍ이득 조절
이는 6개의 복합 이득 HY(X)(Y = L 0 , R 0 X = L,R,C에 대해)을 6 개의 필터들로 대체함으로써 얻을 수 있다. 이러한 필터들은 QMF 영역에서의 주어진 HRTF 필터 응답들을 설명하는 10 개의 필터들 HY(X)(Y = L 0 , R 0 X = Lf, Ls, Rf, Rs, C)로부터 도출된다. 이러한 QMF 표현은 아래에 설명된 방법에 의해 달성될 수 있다.
전방 및 서라운드 채널 필터들의 모핑(morphing)은,
에 따라 복소 선형 조합을 이용해 수행된다.
위상 파라미터 φXY는 전방 및 후방 HRTF 필터들 사이의 주요 지연 시간 차이 및 QMF 뱅크의 서브밴드 인덱스 n으로부터,
Figure 112008082398541-PCT00012
을 통해 정의될 수 있다.
필터들의 모핑에 있어서 이러한 위상 파라미터의 역할에는 두 가지 측면이 있다. 첫째, 전방 및 후방 스피커들 사이의 소스 위치와 관련하여 주요 지연 시간을 모델링하는 결합된 응답을 이끄는 중첩(superposition)에 앞서 두 필터들의 지연 보상을 실현한다. 둘째, 필요한 이득 보상 인자 g를, φXY = 0을 가지는 간단한 중첩의 경우보다 훨씬 더 안정적이고 주파수상에서 천천히 변화하도록 만든다.
이득 인자 g는 파라메트릭 HRTF 경우에 대해서와 동일한 인코히어런트(incoherent) 가산(addition) 파워 규칙,
Figure 112008082398541-PCT00013
에 의해 결정되며,
여기서,
Figure 112008082398541-PCT00014
이고, ρ XY 는 필터들
Figure 112008082398541-PCT00015
Figure 112008082398541-PCT00016
간의 정규화된 복소 크로스 상관의 실수 값이다.
φ XY = 0을 가지는 간단한 중첩의 경우에, ρ XY 의 값은 주파수 함수로서 산만하고 진동하는 방식으로 변화하는데, 이는 심각한 이득 조절을 필요로 한다. 실제적인 구현에서는, 이득 g의 값을 제한할 필요가 있고, 신호의 잔여 스펙트럴 채색화가 불가피하다.
대조적으로, 본 발명에 제시된 바와 같은 지연 기반 위상 보상을 이용한 모 핑(morphing)의 사용은 주파수의 함수로서 ρ XY 의 원활한 동작을 도출한다. 이 값은 종종 자연적 HRTF 도출된 필터 쌍들을 위한 값과 가까운데, 이들이 주로 지연 및 크기 면에서 상이하기 때문이며, 위상 파라미터의 목적은 지연 차이를 QMF 필터뱅크 영역에서 고려하는 것이다.
위상 파라미터 φ XY 의 대안적인 유리한 선택은 필터들
Figure 112008082398541-PCT00017
Figure 112008082398541-PCT00018
간의 정규화된 복소 크로스 상관의 위상 각도를 계산하고, QMF 뱅크의 서브밴드 인덱스 n의 함수로서의 표준 전개 기술(standard unwrapping techniques)을 이용한 위상 값들을 전개함으로써 주어진다. 이러한 선택은 ρ XY 이 절대 음(negative)이 아니고 따라서 보상 이득 g가 모든 서브밴드에 대해
Figure 112008082398541-PCT00019
를 만족시키는 결과를 갖도록 한다. 게다가 위상 파라미터의 이러한 선택은 주요 지연 시간 차이 τ XY 가 유효하지 않은 상황에서 전방 및 서라운드 채널 필터들의 모핑을 가능하게 한다.
아래에서 고려되는 모든 신호들은 변조된 필터 뱅크 또는 이산 시간 신호들 의 윈도우잉된 FFT 분석으로부터의 서브밴드 샘플들 또는 이산 시간 신호들이다. 이러한 서브밴드들은 상응하는 합성 필터 뱅크 동작에 의해 이산 시간 영역으로 역으로 변환되어야 하는 것으로 이해된다.
도 1은 HRTF 관련 필터들을 이용한 파라메트릭 멀티채널 신호들의 바이노럴 합성을 위한 절차를 도시한다. N 개의 채널들을 포함하는 멀티채널 신호가 M < N 전송된 채널들 및 전송된 공간적 파라미터들을 기초로 하여 공간 디코딩(101)에 의해 생성된다. 이러한 N 개의 채널들은 차례로 HRTF 필터링을 수단으로 하여 바이노럴 청취를 목적으로 하는 두 출력 채널들로 변환된다. 이러한 HRTF 필터링(102)은 좌측 귀를 위한 하나의 HRTF 필터 및 우측 귀를 위한 하나의 HRTF 필터를 이용한 각 입력 채널의 필터링의 결과들을 중첩시킨다. 무엇보다도 이는, 2N 개의 필터들을 필요로 한다. 파라메트릭 멀티채널 신호는 N 개의 확성기들을 통해 청취할 때 고품질의 청취자 경험을 얻는 반면, N 개 신호들의 미묘한 상호의존성은 바이노럴 청취에 대해 아티팩트를 도출한다. 이러한 아티팩트는 코딩 이전의 원래 N 채널들의 HRTF 필터링에 의해 정의되는 바와 같은 기준 바이노럴 신호로부터의 스펙트럼 컨텐츠에서의 편차(deviation)에 의해 좌우된다. 이러한 연결의 추가적인 단점은 바이노럴 합성의 전체적인 계산 비용이 구성요소들(101 및 102) 각각에 대해 요구되는 비용의 합이라는 점이다.
도 2는 본 발명에 의해 제시된 결합 필터링의 사용에 의한 파라메트릭 멀티채널 신호들의 바이노럴 합성을 도시한다. 전송된 공간 파라미터들은 201에 의해 2개의 세트, 세트 1 및 세트 2로 분리된다. 여기서, 세트 2는 M 개의 전송된 채널들로부터의 P 개의 중간 채널들의 생성에 적절한 파라미터들을 포함하고, 세트 1은 P 개의 중간 채널들로부터의 N 개의 채널들의 생성에 적절한 파라미터들을 포함한다. 기존의 선결합기(precombiner, 202)는, 2N 개의 HRTF 관련 서브밴드 필터들의 선택된 쌍들을, 파라미터 세트 1 및 선택된 필터들의 쌍들에 의존하는 가중치들과 결합한다. 이러한 선결합의 결과는 P 개의 중간 채널들 각각에 대한 바이노럴 필터 쌍 을 표현하는 2P 개의 바이노럴 서브밴드 필터들이다. 본 발명에 따른 결합기(203)는, 파라미터 세트 2 및 2P 개의 바이노럴 서브밴드 필터들 양쪽에 의존하는 가중치들을 적용함으로써, 2P 개의 바이노럴 서브밴드 필터들을 2M 개의 바이노럴 서브밴드 필터들의 세트로 결합한다. 비교해 보면, 종래의 선형 결합기는 파라미터 세트 2에만 의존하는 가중치들을 적용할 것이다. 2M 개의 필터들의 결과적인 세트는 M 개의 전송된 채널들 각각에 대한 바이노럴 필터 쌍으로 구성된다. 결합 필터링 유닛(204)은 상응하는 필터 쌍을 가지고 필터링함으로써, M 개의 전송된 채널들 각각에 대해 두 채널 출력에 대한 기여분(contribution)의 쌍을 획득한다. 이어서, 모든 M 개의 기여분들은 서브밴드 영역에서 2개의 채널 출력을 형성하기 위해 합산된다.
도 3은 공간 파라미터들 및 바이노럴 필터들의 결합을 위한 본 발명에 따른 결합기(203)의 구성요소들을 도시한다. 선형 결합기(301)는 주어진 공간 파라미터들로부터 도출된 가중치들을 적용함으로써 2P 개의 바이노럴 서브밴드 필터들을 2M 개의 바이노럴 필터들로 결합시키는데, 이러한 공간 파라미터들은 M 개의 전송된 채널들로부터의 P 개의 중간 채널들의 생성에 적합하다. 특히, 이러한 선형 결합은, P 개의 소스들로부터의 바이노럴 필터링이 뒤따르는, M 개의 전송된 채널들로부터의 P 개의 중간 채널들로의 업믹스의 연결을 시뮬레이션한다. 이득 조절기(303)는 공통 좌측 이득을 좌측 귀 출력에 대응하는 필터들 각각에 적용함으로써, 그리고 공통 우측 이득을 우측 귀 출력에 대응하는 필터들 각각에 적용함으로써, 선형 결합기(301)로부터 출력되는 2M 개의 바이노럴 필터들을 변경한다. 이러 한 이득들은 공간 파라미터들 및 2P 개의 바이노럴 필터들로부터 이득들을 도출하는 이득 계산기(302)로부터 얻어진다. 본 발명에 따른 구성요소들(302 및 303)의 이득 조절의 목적은 공간 디코딩의 P 개의 중간 채널들이 선형 결합기(301)로 인한 원하지 않는 스펙트럴 채색을 도출하는 선형 의존성을 가지는 상황에 대해 보상을 하는 것이다. 본 발명에 의해 제시된 이득 계산기(302)는 공간 파라미터들의 함수로서 P 개의 중간 채널들의 에너지 분포를 추정하는 수단을 포함한다.
도 4는 스테레오 전송된 신호의 경우에서의 MPEG 서라운드 공간 디코딩의 구조를 도시한다. M=2 전송된 신호들의 분석 서브밴드들은 P=3 중간 신호들, 결합된 좌측, 결합된 우측, 및 결합된 중앙을 출력하는 2 → 3 박스(401)로 제공된다. 이러한 업믹스는 도 2 상의 세트 2에 대응하는 전송된 공간 파라미터들의 서브셋에 의존한다. 3 개의 중간 신호들은 이어서 N = 6 신호들(405): l f (좌측 전방), l s (좌측 서라운드), r f (우측 전방), r s (우측 서라운드), c(중심), 및 lfe(저주파수 확장) 전체를 생성하는 3개의 1→2 박스들(402-404)로 제공된다. 이러한 업믹스는 도 2 상의 세트 1에 대응하는 전송된 공간 파라미터들의 서브셋에 의존한다. 최종적인 멀티채널 디지털 오디오 출력은 6개의 서브밴드 신호들을 6개의 합성 필터 뱅크들로 패스함으로써 생성된다.
도 5는 본 발명에 따른 이득 보상에 의해 해결되어야 할 문제를 도시한다. 좌측 귀를 위한 기준 HRTF 필터링된 바이노럴 출력의 스펙트럼은 실선 그래프로 표시되어 있다. 점선 그래프는 결합기(203)가 선형 결합기(301)만으로 구성된 경우에 있어서의 도 2의 방법에 의해 생성된 바와 같은 상응하는 디코딩된 신호의 스펙트럼을 도시한다. 도시된 바와 같이, 3-4 kHz 및 11-13 kHz의 주파수 구간에서 원하는 기준 스펙트럼에 대해 상당한 스펙트럼 에너지 손실이 있다. 1 kHz 및 10 kHz 근처에서는 더 작은 스펙트럴 부스트(spectral boost)가 또한 존재한다.
도 6은 본 발명에 따른 이득 보상을 이용한 경우의 장점을 도시한다. 실선 그래프는 도 5에서와 같은 기준 스펙트럼을 나타내지만, 이제 점선 그래프는 결합기(203)가 도 3의 모든 구성요소들로 구성된 경우에 있어서의 도 2의 방법에 의해 생성된 디코딩된 신호의 스펙트럼을 도시한다. 도시된 바와 같이, 도 5의 두 곡선들에 비해 두 곡선들간에 엄청나게 향상된 스펙트럼 매칭이 있음을 알 수 있다.
아래에 전개되는 문맥에서, 본 발명에 따른 이득 보상의 수학적 설명이 이어질 것이다. 이산 복소 신호들 x, y에 대한 복소 내적(complex inner product) 및 스퀘어드 놈(squared norm) (에너지)는,
Figure 112008082398541-PCT00020
(1)
와 같이 정의되는데, 여기서,
Figure 112008082398541-PCT00021
y(k) 공액 복소(complex conjugate) 신호를 나타낸다.
원래의 멀티채널 신호는 N 채널들로 구성되고, 각 채널은 그와 관련된 바이 노럴 HRTF 관련 필터 쌍을 가진다. 어쨌건 여기서는, 파라메트릭 멀티채널 신호는 M 개의 전송된 채널들로부터 P 개의 예측된 채널들로의 예측 업믹스의 중간 단계를 사용하여 생성된다고 가정될 것이다. 이러한 구조는 도 4에 도시된 바와 같은 MPEG 서라운드에 사용된다. 2N HRTF 관련 필터들의 원래의 세트는, M≤P≤N 인 경우 P 개의 예측된 채널들 각각에 대해, 종래의 선결합기(202)에 의해 하나의 필터 쌍으로 감소되었다고 가정될 것이다. P 개의 예측된 채널 신호들,
Figure 112008082398541-PCT00022
은 부분적인 다운믹스를 통해 원래의 N 채널들로부터 도출된 P개의 신호들
Figure 112008082398541-PCT00023
에 가깝도록 하는 것을 겨냥한다. MPEG 서라운드에서는, 이러한 신호들이 결합된 좌측, 결합된 우측, 및 결합되고 스케일링된(scaled) 중앙/lfe 채널이다. 신호 x p 에 대응하는 HRTF 필터 쌍은 좌측 귀에 대한 서브밴드 필터 b1,p 및 우측 귀에 대한 서브밴드 필터 b2,p에 의해 설명되는 것으로 가정한다. 기준 바이노럴 출력 신호는 따라서, n = 1, 2에 대한 필터링된 신호들의 선형 중첩에 의해,
Figure 112008082398541-PCT00024
(2)
와 같이 주어지고, 별표는 시간 방향에서의 컨벌루션을 나타낸다. 서브밴드 필터들은 유한 임펄스 응답(FIR) 필터들, 무한 임펄스 응답(IIR) 필터들, 또는 필터들의 파라미터화된 패밀리로부터 도출된 형태로 주어질 수 있다.
인코더에서, 다운믹스는 M×P 다운믹스 매트릭스 D의,
Figure 112008082398541-PCT00025
에 의해 형성된 신호들의 칼럼 벡터로의 적용에 의해 형성되며, 디코더에서의 예측은 P×M 예측 매트릭스 C 의, M 개의 전송된 다운믹스된 채널들
Figure 112008082398541-PCT00026
에 의해 형성된 신호들의 칼럼 벡터로의 적용에 의해,
Figure 112008082398541-PCT00027
(3)
와 같이 실행된다.
양 매트릭스가 디코더에 알려져 있으며, 다운믹스된 채널들을 코딩하는 효과를 무시할 때, 예측의 결합된 효과는,
Figure 112008082398541-PCT00028
(4)
에 의해 모델링될 수 있으며, 여기서
Figure 112008082398541-PCT00029
는 매트릭스 곱
Figure 112008082398541-PCT00030
의 엔트리들이다.
디코더에서 바이노럴 출력을 생산하는 직접적인 방법은 간단히, 예측된 신호들
Figure 112008082398541-PCT00031
을 식 (2)에 넣는 것이며,
Figure 112008082398541-PCT00032
(5)
와 같은 결과를 얻는다.
계산적 측면에서, 바이노럴 필터링은 예측적 업믹스와 사전에 결합되어, 식 (5)는,
Figure 112008082398541-PCT00033
(6)
와 같이 다시 쓸 수 있으며, 여기서 결합된 필터들은,
Figure 112008082398541-PCT00034
(7)
와 같이 정의된다.
위 식은 바이노럴 서브밴드 영역 필터들 b n,p 를 이용해 공간 파라미터들로부터 도출된 계수들 c p,m 을 결합하는 선형 결합기(301)의 동작을 설명한다. 원래의 P개 신호들 x p 가 M에 의해 필수적으로 바운딩된 수적 랭크(numerical rank)를 가질 때, 예측은 매우 잘 실행되도록 디자인 될 수 있고, 예측
Figure 112008082398541-PCT00035
이 유효하다. 이것은 예를 들어, P 개의 채널들 중 M 개만이 활성이라거나, 중요한 신호 구성요소들이 크기 패닝(amplitude panning)으로부터 발생되는 경우 발생한다. 그런 경우, 디코딩된 바이노럴 신호(5)는 기준(2)에 매우 잘 매칭된다. 반대로, 일반적인 경우 에, 그리고, 특히 원래 P 개의 신호들 x p 가 상관되지 않은 경우, 상당한 예측 손실이 있을 것이며, (5)로부터의 결과는 (2)의 에너지로부터 상당히 벗어나는 에너지를 가질 수 있다. 벗어나는 정도는 여러 주파수 대역에서 다를 것이며, 최종 오디오 출력은 도 5에 도시된 바와 같은 스펙트럼 채색 아티팩트로 인해 해를 입을 것이다. 본 발명은,
Figure 112008082398541-PCT00036
(8)
에 따라 출력을 이득 보상함으로써 이러한 문제를 회피할 수 있는 방법을 제공한다.
계산적인 측면에서, 이득 보상은 이득 조절기(303),
Figure 112008082398541-PCT00037
에 따라 결합 필터들을 변경함으로써 유리하게 실행될 수 있다. 변경된 결합 필터링은 그렇다면,
Figure 112008082398541-PCT00038
(9)
이 된다.
식 (8)에서 보상 이득의 최적의 값들은,
Figure 112008082398541-PCT00039
(10)
이다.
이득 계산기(302)의 목적은 디코더에서 유효한 정보로부터 이러한 이득들을 추정하는 것이다. 이러한 목적을 위한 여러 도구들이 이제 설명될 것이다. 유효한 정보가 매트릭스 엔트리들
Figure 112008082398541-PCT00040
및 HRTF 관련 서브밴드 필터들
Figure 112008082398541-PCT00041
에 의해 여기서 표현될 것이다. 우선, HRTF 관련 서브밴드 필터들 b, d 에 의해 필터링된 신호들 x, y 간의 내적에 대해, 아래와 같은 근사화가 가정될 것이다.
Figure 112008082398541-PCT00042
(11)
이러한 근사화는 종종 필터들의 대부분의 에너지가 우세한 하나의 탭에 집중되어 있다는 사실에 근거한 것이고, 이에 따라 적용된 시간 주파수 변환의 시간 단계는 HRTF 필터들의 주요 지연 차이에 비교하여 충분히 크다고 미리 추정한다.
근사화 (11)을 식 (2)에 결합하여 적용시키면,
Figure 112008082398541-PCT00043
(12)
이 된다.
다음 근사화는 원래의 신호들이 상관되어 있지 않다는, 즉 p ≠ q 에 대해,〈xp, xq〉= 0 이라는 가정으로 구성된다. 그러면, 식 (12)는
Figure 112008082398541-PCT00044
(13)
로 축소된다.
디코딩된 에너지에 대해, 식 (12)와 관련한 결과는,
Figure 112008082398541-PCT00045
(14)
이 된다.
예측된 신호들 (4)를 식 (14)에 대입하고, 원래의 신호들이 상관되어 있지 않다는 가정을 적용하면,
Figure 112008082398541-PCT00046
(15)
이 된다.
계수 (10)에 의해 주어지는 보상 이득을 계산할 수 있도록 하기 위해 남은 것은, 원래의 채널들의 에너지 분포
Figure 112008082398541-PCT00047
를 임의의 인자까지 추정하는 것이다. 본 발명은, 이러한 채널들이 상관되지 않고 인코더가 예측 에러를 최소화하는 것을 목적으로 한다는 가정에 상응하는 예측 매트릭스
Figure 112008082398541-PCT00048
를, 에너지 분포 함수로서 계산함으로써, 이를 수행할 수 있음을 알려준다. 그리고, 가능한한 식
Figure 112008082398541-PCT00049
의 비선형 시스템을 풀어 에너지 분포가 추정된다. 해가 없는 식들의 시스템을 도출하는 예측 파라미터들에 대해서는, 이득 보상 인자들이
Figure 112008082398541-PCT00050
로 설정된다. 이러한 본 발명에 따른 절차는, 가장 중요한 특별한 경우에 대해 아래의 섹션에서 보다 자세히 설명될 것이다.
식 (15)에 부여되는 계산 로드는 P = M + 1 인 경우, 확장
Figure 112008082398541-PCT00051
(16)
을 적용(예를 들어 PCT/EP2005/011586을 보라)함으로써 감소될 수 있으며, 여기서, vDv = 0 이 되도록 하는 구성요소들
Figure 112008082398541-PCT00052
를 가지는 유닛 벡터이고,
Figure 112008082398541-PCT00053
는 예측 손실 에너지,
Figure 112008082398541-PCT00054
(17)
이다.
식 (15)의 계산은 그래서 식 (16)을 (14)로 적용함으로써 유리하게 대체될 수 있으며,
Figure 112008082398541-PCT00055
(18)
이 도출된다.
이어서, 2개의 채널로부터 3개의 채널로의 예측에 대한 바람직한 구체화가 논의될 것이다. MPEG 서라운드에서 M = 2 및 P = 3인 경우가 사용된다. 신호들은 결합된 좌측 x 1 = l, 결합된 우측 x 2 = r 및 (스케일링된) 결합된 중앙/lfe 채널 x 3 = c 이다. 다운믹스 매트릭스는,
Figure 112008082398541-PCT00056
(19)
이고, 예측 매트릭스는,
Figure 112008082398541-PCT00057
(20)
에 따라 2 개의 전송된 실(real) 파라미터들 c 1 , c 2 로부터 구성된다.
원래의 채널들이 상관되어 있지 않다는 가정하에, 최소 예측 에러를 구현하는 예측 매트릭스는,
Figure 112008082398541-PCT00058
(21)
에 의해 주어진다.
등식
Figure 112008082398541-PCT00059
은 본 발명에 의해 제시된 (비정규화된) 에너지 분포,
Figure 112008082398541-PCT00060
(22)
를 도출하며,
여기서,
Figure 112008082398541-PCT00061
Figure 112008082398541-PCT00062
이다. 이는,
Figure 112008082398541-PCT00063
(23)
에 의해 정의된 가능한 범위 내에서 유지되며, 이 경우 예측 에러는
Figure 112008082398541-PCT00064
(24)
로부터 동일한 스케일링 내에서 발견될 수 있다.
P = 3 = 2+1 = M+1 이기 때문에, 식 (16) - (18)에 의해 설명된 방법이 적용 가능하다. 유닛 벡터는
Figure 112008082398541-PCT00065
이 되고, 여기서,
Figure 112008082398541-PCT00066
(25)
Figure 112008082398541-PCT00067
(26)
로 정의된 상태에서, 이득 계산기(302)의 바람직한 일 실시예에서 계산된 바와 같이 각 귀 n = 1, 2에 대한 보상 이득은
Figure 112008082398541-PCT00068
(27)
에 의해 표현될 수 있다.
여기서,
Figure 112008082398541-PCT00069
은 그 목적이 가능한 파라미터 범위의 에지(edge) 근처에서 공식을 안정화시키는 작은 수이고
Figure 112008082398541-PCT00070
는 적용된 보상 이득 상의 상한이다. 식 (27)의 이득들은 좌측 및 우측 귀(n = 1,2) 에 대해 다르다. 상기 방법의 변형예는 공통 이득
Figure 112008082398541-PCT00071
을 사용하는 방법이며, 여기서,
Figure 112008082398541-PCT00072
(28)
이다.
본 발명에 따른 보정 이득 인자는 어떤 HRTF 관련 이슈도 없이 유효한 직접적인 멀티채널 이득 보상과 함께 양립할 수 있다.
MPEG 서라운드에서, 예측 손실을 위한 보상은, 업믹스 매트릭스 를 인자
Figure 112008082398541-PCT00073
(여기서
Figure 112008082398541-PCT00074
은 전송된 공간 파라미터들의 일부)로 곱함으로써 이미 디 코더 내에 적용되어 있다. 그 경우, 식 (27) 및 (28)의 이득들은 곱
Figure 112008082398541-PCT00075
Figure 112008082398541-PCT00076
에 의해 각각 교체되어야 한다. 이러한 보상은 도 5 및 6에서 연구된 바이노럴 디코딩에 적용된다. 이것이 도 5의 종래의 디코딩이 기준에 비해 스펙트럼의 부스팅된 부분을 가지는 이유이다. 이러한 주파수 영역에 상응하는 서브밴드들에 대해, 본 발명의 이득 보상은 전송된 파라미터 이득 인자
Figure 112008082398541-PCT00077
를, 식 (28)로부터 도출된 더 작은 값으로 효과적으로 대체한다.
게다가,
Figure 112008082398541-PCT00078
인 경우는 성공적인 예측에 상응하므로, 본 발명에 의해 제시된 이득 보상의 보다 보수적인 변형예가
Figure 112008082398541-PCT00079
에 대한 바이노럴 이득 보상을 무력하게 할 것이다.
또한, 본 발명은 잔여 신호와 함께 사용된다. MPEG 서라운드에서, 부가적인 예측 잔여 신호 z3이 전송될 수 있고, 이는 원래의 P = 3 의 신호들 x p 를 보다 정확하게 재생성할 수 있도록 만든다. 이 경우, 이득 보상은 이후 설명될 바이노럴 잔여 신호 가산에 의해 대체된다. 잔여물에 의해 강화된 예측 업믹스는,
Figure 112008082398541-PCT00080
(29)
에 따라 형성되며, 여기서
Figure 112008082398541-PCT00081
이다. 식 (5)에서
Figure 112008082398541-PCT00082
Figure 112008082398541-PCT00083
로 대체하면, 대응하는 결합 필터링,
Figure 112008082398541-PCT00084
(30)
을 산출하며, 결합 필터들 h n,m 은 m = 1, 2에 대해 식 (7)에 의해 정의되며, 잔여 가산에 대한 결합 필터들은,
Figure 112008082398541-PCT00085
(31)
에 의해 정의된다.
이러한 디코딩 모드의 전체 구조는, 그러므로, P=M=3 으로 설정함으로써, 그리고 식 (7) 및 (31)에 의해 정의되는 선형 결합만을 실행하도록 결합기(203)를 변형함으로써, 도 2에 의해 또한 설명된다.
도 13은 도 3에서 선형 결합기(301)의 결과를 변형된 표현으로 도시한다. 결합기의 결과는 4 개의 HRTF-기반 필터들 h11, h12, h21 및 h22이다. 도 16a 및 도 17의 설명으로부터 더욱 명백혀질 것이나, 이러한 필터들은 도 16a의 15, 16, 17, 18에 의해 표시되는 필터들에 상응한다.
도 16a이 좌측 귀 또는 좌측 바이노럴 포인트를 가지는, 그리고 우측 귀 또는 우측 바이노럴 포인트를 가지는 청취자의 머리를 보여준다. 도 16a가 단지 스테레오 시나리오에 대응하고자 하는 경우, 필터들(15, 16, 17, 18)은 인터넷을 통해, 혹은 상응하는 텍스트북에서, 청취자, 그리고 좌측 채널 스피커 및 우측 채널 스피커 사이의 다른 위치들에 대해 개별적으로 측정되거나 획득될 수 있는 통상적인 머리 관련 전달 함수들이다.
하지만, 본 발명이 멀티-채널 바이노럴 디코더에 관련된 것이므로, 15, 16, 17, 18에 의해 도시된 필터들은 순수한 HRTF 필터들은 아니지만, HRTF 특성들을 반 영할뿐만 아니라 또한 공간 파라미터들에 의존하고 또한, 특히, 도 2와 관련하여 논의된 바와 같은 공간 파라미터 세트 1 및 공간 파라미터 세트 2에 의존하는 HRTF-기반 필터들이다.
도 14는 도 16a에서 사용되는 HRTF-기반 필터들에 대한 원리를 보여준다. 특히, 청취자가, 예를 들어, 통상적인 서라운드 홈 또는 씨네마 엔터테인먼트 시스템 등에서 발견될 수 있는 5 채널 스피커 셋업에서 5 개 스피커 사이의 행복한 지점(sweet spot)에 위치하는 상황이 도시되어 있다. 각 채널에 대해, 전달 함수로서 HRTF를 가지는 필터의 채널 임펄스 응답들로 변환될 수 있는 2 개의 HRTF가 존재한다. 특히 해당 기술 분야에서 알려진 바와 같이, HRTF-기반 필터는 사람의 머리 내의 사운드 전파를 고려하여, 예를 들어, 도 14의 HRTF1은 스피커 Ls로부터 방출된 사운드가 청취자의 머리를 돌아 통과한 후 우측 귀를 만나는 상황을 고려하도록 한다. 이와는 대조적으로, 좌측 서라운드 스피커 Ls로부터 방출된 사운드는 거의 바로 좌측 귀를 만나고, 머리에서 귀의 위치 및 또한 귀의 모양 등에 의해 부분적으로만 영향을 받는다. 따라서, HRTF 1 및 2는 서로 다르다는 것이 명백해진다.
좌측 채널 L에 대한 양쪽 귀의 관계가 다르므로, 좌측 채널에 대한 HRTF 3 및 4에 대해서도 상기와 동일한 것이 적용된다. 위는 또한 모든 다른 HRTF들에도 적용되며, 물론, 도 14로부터 명백해지는 바와 같이, 개별적인 청취자들의 비대칭이 HRTF 데이터에 도입되지 않는 한, 중앙 채널을 위한 HRTF 5 및 6은 거의 동일하거나 심지어 서로 완전히 동일할 것이지만 말이다.
앞서 서술한 바와 같이, 이러한 HRTF들은 모델 머리에 대해 결정되었고, 어떤 특정 "평균 머리" 및 확성기 셋업에 대해서도 다운로드될 수 있다.
이제, 도 17의 171 및 172에서 명확해지는 바와 같이, 도 15에서 L'에 의해 지시되는 좌측 편을 위한 2 개의 HRTF-기반 필터들을 획득하기 위해 좌측 채널 및 좌측 서라운드 채널을 결합하기 위한 결합이 일어난다. 도 15의 R'에 의해 도시된 바와 같이 우측 편을 위해 동일한 절차가 실행되고, 이는 HRTF 13 및 HRTF 14를 도출한다. 이를 위해, 도 17의 아이템(173) 및 아이템(174)을 참조로 한다. 하지만, 여기서 아이템들(171, 172, 173 및 174)에서 각 HRTF를 결합하기 위해, 원래의 셋업의 L 채널 및 Ls 채널간 혹은 원래의 멀티-채널 셋업의 R 채널 및 Rs 채널간 에너지 분포를 반영하는 채널간 레벨 차이 파라미터들이 고려된다. 특히, 이러한 파라미터들은 HRTF들이 선형적으로 결합될 때의 가중 인자를 정의한다.
앞서 설명한 바와 같이, 위상 인자는 HRTF들을 결합할 때 또한 적용되며, 여기서 위상 인자는 시간 지연들 혹은 결합될 HRTF들 간의 전개된 위상 차이들에 의해 정의된다. 하지만, 이러한 위상 인자는 전송된 파라미터들에는 의존하지 않는다.
따라서, HRTF들(11, 12, 13, 및 14)은 진정한 HRTF 필터들이 아니지만, HRTF-기반 필터들인데, 이는 이러한 필터들이 전송된 신호에 독립적인 HRTF들에 의존할뿐만 아니기 때문이다. 대신, HRTF들(11, 12, 13 및 14)은 또한 전송된 신호에 의존하는데, 채널 레벨 차이 파라미터들 cldl 및 cldr 가 이러한 HRTF들(11, 12, 13 및 14)을 계산하는 데 사용된다는 사실 때문이다.
이제, 바람직한 다운-믹스 신호에 포함된 것과 같은 2 개의 전송된 채널들이 아니라 3개의 채널들을 여전히 가지는 도 15의 상황이 얻어진다. 그러므로, 도 16a에 도시된 바와 같이 6 개의 HRTF들(11, 12, 5, 6, 13, 14)의 4 개의 HRTF들(15, 16, 17, 18)로의 조합이 행해질 필요가 있다.
이러한 목적을 위해 HRTF들(11, 5, 13)은 좌측 업믹스 규칙을 이용해 결합되고, 이것은 도 16b의 업믹스 매트릭스로부터 명확해진다. 특히 도 16b에 도시된 바와 같은 그리고 블록(175)에 표시된 바와 같은, 좌측 업믹스 규칙은 m11, m21, m31을 포함한다. 이러한 좌측 업믹스 규칙은 좌측 채널에 의해 곱해지는 구성만에 대한 도 16의 매트릭스 식에 있다. 따라서, 이러한 3 개의 파라미터들은 좌측 업믹스 규칙으로 불리워진다.
블록(176)에 약술된 바와 같이, 동일한 HRTF들(11, 5, 13)이 결합되지만 이제, 우측 업믹스 규칙, 즉, 도 16b의 우측 채널 R0에 의해 곱해지는 데 모두 사용되는 도 16b의 실시예에서의 파라미터들 m12, m22, m32 을 사용한다.
따라서, HRTF(15) 및 HRTF(17)가 생성된다. 도 15의 HRTF(12), HRTF(6), 및 HRTF(14)가 HRTF(16)를 획득하기 위해 업믹스 좌측 파라미터들 m11, m21, m31 을 이용해 아날로그적으로 결합된다. 상응하는 결합이 HRTF(12), HRTF(6), 및 HRTF(14)를 이용해 수행되지만, 이제는 도 16a의 HRTF(18)을 획득하기 위해 m12, m22, m32 에 의해 표시되는 업믹스 우측 파라미터들 또는 우측 업믹스 규칙을 사용해서이다.
다시, 도 14의 원래의 HRTF들은 전송된 신호에 모두 의존하지 않지만, 새로운 HRTF-기반 필터들(15, 16, 17, 18)은 이제 전송된 신호에 의존하는데, 멀티-채널 신호에 포함된 공간 파라미터들이 이러한 필터들(15, 16, 17, 18)을 계산하는데 사용되었기 때문이다.
최종적으로 바이노럴 좌측 채널 LB 및 바이노럴 우측 채널 RB을 획득하기 위해, 필터들(15 및 17)의 출력들이 가산기(130a)에서 결합되어야 한다. 아날로그적으로, 필터들(16 및 18)의 출력이 가산기(130b)에서 결합되어야 한다. 이러한 가산기들(130a, 130b)은 사람의 귀 내에서 두 신호의 중첩을 반영한다.
이어서, 도 18이 논의될 것이다. 도 18은 원래의 멀티-채널 신호로부터 도출된 다운믹스 신호를 이용하여 바이노럴 신호를 생성하는 본 발명에 따른 멀티-채널 디코더의 바람직한 일 실시예를 보여준다. 다운믹스 신호는 z1, z2에서 도시되어 있으며, 또한, "L" 및 "R"에 의해 표시된다. 또한, 다운믹스 신호는 관련된 파라미터들을 포함하는데, 이 파라미터들은 적어도, 좌측 및 좌측 서라운드에 대한 채널 레벨 차이 또는 우측 및 우측 서라운드에 대한 채널 레벨 차이, 및 업믹싱 규칙에 대한 정보이다.
자연적으로, 원래의 멀티-채널 신호가 단지 3-채널 신호인 경우, cldl 또는 cldr은 전송되지 않고, 파라메트릭 부가 정보만이, 앞서 설명한 바와 같이, 업믹싱된 신호에서의 에너지-에러를 초래하는 이러한 업믹스 규칙인 업믹스 규칙에 대한 정보가 될 것이다. 따라서, 비-바이노럴 렌더링이 수행될 때 업믹싱된 신호들의 파형들이 원래의 파형에 가능한한 가깝게 매칭될지라도, 업믹싱된 채널들의 에너지가 상응하는 원래 채널들의 에너지와는 다르다.
도 18의 바람직한 실시예에서, 업믹스 규칙 정보는 2개의 업믹스 파라미터들 cpc1, cpc2에 의해 반영된다. 하지만, 어떤 다른 업믹스 규칙 정보도 적용될 수 있으며 특정 개수의 비트를 통해 시그널링될 수도 있다. 특히, 디코더에서 기설정된 테이블을 이용해 특정 업믹스 시나리오 및 업믹스 파라미터들을 시그널링하여 테이블 인덱스들만이 인코더로부터 디코더로 전송되어야 하도록 할 수 있다. 대안적으로, 2로부터 3 이상으로의 업믹스와 같은 다른 업믹싱 시나리오를 또한 사용할 수도 있다. 또한, 2 개의 예측 업믹스 파라미터들 이상을 전송할 수도 있으며, 이는 그러면, 도 20을 참조하여 보다 자세히 논의될 업믹스 규칙에 적합해야 할 상응하는 다른 다운믹스 규칙을 필요로 하게 될 것이다.
업믹스 규칙 정보에 관한 바람직한 일 실시예와 무관하게, 에너지-손실 영향을 받는 업믹스 채널들의 세트를 생성하기 위한 업믹스가 가능한한 어떤 업믹스 규칙 정보라도 충분하며, 이는 상응하는 원래의 신호 세트에 파형-매칭된다.
본 발명의 멀티-채널 디코더는 에너지-에러를 감소 또는 제거하기 위한 적어도 하나의 이득 인자 gl, gr, g를 계산하기 위한 이득 인자 계산기(180)를 포함한다. 이득 인자 계산기는 업믹스 규칙이 적용될 때 얻어지는 업믹스 채널들에 상응하는 HRTF-기반 필터들의 필터 특성들 및 업믹스 규칙 정보에 기반하는 이득 인자 를 계산한다. 하지만, 앞서 설명한 바와 같이, 바이노럴 렌더링에서, 이러한 업믹스는 일어나지 않는다. 그럼에도 불구하고, 도 15 및 도 17의 블록들(175, 176, 177, 178)과 관련하여 설명된 바와 같이, 이러한 업믹스 채널들에 상응하는 HRTF-기반 필터들이 사용된다.
앞서 설명한 바와 같이, 이득 인자 계산기(180)는 식 (27)에서 설명된 바와 같이, n 대신 l 또는 r을 대입하여 다른 이득 인자들을 계산할 수 있다. 대안적으로, 이득 인자 계산기가 식 (28)에 의해 나타난 바와 같이 양 채널들을 위한 하나의 이득 인자를 생성할 수도 있다.
중요하게는, 본 발명의 이득 인자 계산기(180)는 업믹스 규칙뿐 아니라, 업믹스 채널들에 상응하는 HRTF-기반 필터들의 필터 특성들에 기반한 이득 인자를 계산한다. 이는 필터들 자신들이 전송된 신호들에 또한 의존하고, 에너지-에러에 또한 영향을 받는 상황을 반영한다. 따라서, 에너지-손실은 예측 파라미터들 CPC1, CPC2와 같은 업믹스 규칙 정보에 의해 야기될 뿐 아니라 필터들 자신들에 의해서도 또한 영향을 받는다.
그러므로, 잘-적응된 이득 보정을 얻기 위해서는, 본 발명의 이득 인자는 예측 파라미터에 의존할뿐 아니라 업믹스 채널들에 상응하는 필터들에도 또한 의존한다.
HRTF-기반 필터들뿐 아니라 이득 인자 및 다운믹스 파라미터들이, 좌측 바이노럴 채널 LB 및 우측 바이노럴 채널 RB을 가지는 에너지-보정된 바이노럴 신호를 획득하기 위해 다운믹스 신호를 필터링하는 필터 프로세서(182)에 사용된다.
바람직한 일 실시예에서, 이득 인자는 이러한 전체 에너지와 추정된 업믹스 에너지 에러 ΔE 간의 차이에 대한 업믹스 채널들에 상응하는 필터들의 채널 임펄스 응답들에 포함된 전체 에너지 간의 관계에 의존한다. ΔE는, 바람직하게, 업믹스 채널들에 상응하는 필터들의 채널 임펄스 응답들을 결합하고, 결합된 채널 임펄스 응답의 에너지를 계산함으로써 계산될 수 있다. ΔE 및 E에 대한 정의로부터 명확해지는, 도 18의 GL 및 GR 에 대한 관계에서의 모든 숫자는 양의 숫자이므로, 이득 인자들 양자가 1보다 큰 것이 명백하다. 이는 도 5에 도시된 경험을 반영하는데, 대부분의 경우 바이노럴 신호의 에너지는 원래의 멀티-채널 신호의 에너지보다 낮다는 것이다. 멀티-채널 이득 보상이 적용된 경우, 즉 인자 ρ이 대부분의 신호들에서 사용되는 경우라 하더라도, 에너지-손실이 야기된다는 것 또한 유의해야 한다.
도 19a는 도 18의 필터 프로세서(182)의 바람직한 일 실시예를 도시한다. 특히, 도 19a는, 블록(182a)에서 이득 보상 없는 결합 필터들(15, 16, 17, 및 18)이 사용되고 필터 출력 신호들이 도 13에 서술된 바와 같이 가산되는 경우의 상황을 도시한다. 그러면, 박스(182a)의 출력이 박스(180)에 의해 계산되는 이득 인자를 이용하여 출력을 스케일링하기 위한 스케일러 박스(182b)로 입력된다.
대안적으로, 필터 프로세서는 도 19b에 나타난 바와 같이 구성된다. 여기서, HRTF들(15 내지 18)이 박스(182c)에 도시된 바와 같이 계산된다. 따라서, 계산 기(182c)는 어떤 이득 조절도 없이 HRTF 결합을 수행한다. 그리고, 본 발명적으로 계산된 이득 인자를 사용하는 필터 조절기(182d)가 제공된다. 필터 조절기는 블록(180e)에 도시된 바와 같은 조절된 필터들을 낳는데, 블록(180e)은 도 13에 도시된 바와 같이 조절된 필터를 이용해 필터링을 수행하고 후속하는 상응하는 필터 출력의 가산을 수행한다. 따라서, 이득-보정된 바이노럴 채널들 LB 및 RB를 획득하기 위한 도 19a에서와 같은 포스트-스케일링(post-scaling)이 필요치 않다.
일반적으로, 식 (16), 식 (17), 및 식 (18)와 관련하여 설명된 바와 같이, 이득 조절은 추정된 업믹스 에러 ΔE를 이용해 발생한다. 이러한 추정은 업믹스 채널들의 개수가 다운믹스 채널들의 개수 + 1 과 동일한 경우 특히 유용하다. 따라서, 2 개의 다운믹스 채널들의 경우, 이러한 추정은 3 개의 업믹스 채널들에 대해 잘 적용된다. 대안적으로, 3 개의 다운믹스 채널들을 가지는 경우, 이러한 추정은 또한, 4 개의 업믹스 채널들이 있는 시나리오에 잘 적용될 것이다.
하지만, 업믹스 에러의 추정에 기초한 이득 인자의 계산은 또한, 3 개의 다운믹스 채널들을 이용하여 예측된 5 개의 채널들이 예측되는 예에서의 시나리오에 대해서도 수행될 수 있다. 대안적으로, 2 개의 다운믹스 채널들로부터 4 개의 업믹스 채널들로의 예측-기반 업믹스를 이용할 수도 있다. 추정된 업믹스 에너지-에러 ΔE와 관련하여, 바람직한 경우에 대해 식 (25)에 나타난 바와 같은 이러한 추정된 에러를 바로 계산할 뿐만 아니라, 비트 스트림에서 실제로 발생된 업믹스 에러에 대한 어떠한 정보 또한 전송할 수 있다. 그럼에도 불구하고, 식 (25) 내지 (28)과 관련하여 도시된 특별한 경우와 다른 경우에서조차도, 예측 파라미터들을 이용하여 업믹스 채널들에 대한 HRTF-기반 필터에 기초하여 값
Figure 112008082398541-PCT00086
을, 그러면 계산할 수 있다. 식 (26)이 고려될 때, 이 식이 2/4 예측 업믹스 방법에 대해서, HRTF-기반 필터 임펄스 응답들의 에너지에 대한 가중 인자들이 대응적으로 적용될 때, 용이하게 적용될 수 있음이 분명해진다.
그러한 관점에서, 식 (27)의 일반적인 구조, 즉
Figure 112008082398541-PCT00087
의 관계에 기초하여 이득 인자를 계산하는 것이 또한 다른 시나리오들에 대해서도 적용된다.
이어서, 도 20이, 디코더로 전송된 다운믹스 신호 L, R 및 업믹스 규칙 정보를 생성하는 데 사용될 수 있어, 디코더가 바이노럴 필터 프로세서 측면에서 이득 보상을 수행할 수 있도록 하는 예측-기반 인코더의 도식적인 구현을 보여주기 위해 논의될 것이다.
다운믹서(191)는 5 개의 원래의 채널들, 또는 대안적으로는 (Ls 및 Rs)에 의해 도시되는 3 개의 원래의 채널들을 수신한다. 다운믹서(191)는 기설정된 다운믹스 규칙에 기초하여 동작할 수 있다. 그 경우, 선(192)에 의해 도시되는 다운믹스 규칙 표시는 필요치 않다. 자연적으로, 에러-최소화기(193)는 상응하는 원래의 입력 채널들과 관련하여 업믹서(194)의 출력에서 재구성된 채널들간의 에러를 최소화하기 위해 다운믹스 규칙을 또한 변경시킬 수 있다.
따라서, 에러-최소화기(193)는 다운믹스 규칙(192) 또는 업믹서 규칙(196)을 변화시켜 재구성된 채널들이 최소 예측 손실 ΔE를 가지도록 할 수 있다. 이러한 최적화 문제는 에러-최적화(193) 내에 잘 알려진 알고리즘의 어느 하나에 의해 해결되며, 에러-최적화기는 바람직하게는 재구성 채널들 및 입력 채널들 간의 차이를 최소화하기 위하여 서브밴드 방식으로 동작한다.
앞서 설명한 바와 같이, 입력 채널들은 원래의 채널들 L, Ls, R, Rs, C이 될 수 있다. 대안적으로 입력 채널들은 3 개의 채널들 L, R, C만이 될 수도 있으며, 이러한 맥락에서 입력 채널들 L, R은 도 11에 도시된 상응하는 OTT 박스에 의해 도출될 수도 있다. 또한, 원래의 신호가 채널들 L, R, C만을 가진다면, 이러한 채널들은 또한 "원래의 채널들"이라고 칭해질 수도 있다.
도 20은 또한, 디코더가 이러한 업믹스 규칙 정보를 사용하여 업믹스를 수행하기 위한 위치에 있는 한, 2 개의 예측 파라미터들의 전송 외에 어떤 업믹스 규칙 정보라도 사용될 수 있음을 도시한다. 따라서, 업믹스 규칙 정보는 또한 검색 테이블(lookup table) 또는 어떤 다른 업믹스 관련 정보로의 엔트리가 될 수 있다.
그러므로, 본 발명은 HRTF 필터링을 수단으로 하여 유효한 다운믹싱된 신호들 및 부가적인 제어 데이터에 기초한 멀티-채널 오디오 신호들의 바이노럴 디코딩을 수행하는 효과적인 방법을 제공한다. 본 발명은 바이노럴 디코딩을 이용한 예측 매트릭스의 결합으로부터 야기되는 스펙트럼 채색의 문제에 대한 해결책을 제공한다.
본 발명의 방법들의 특정 구현 요구사항들에 따라, 본 발명의 방법은 하드웨어 또는 소프트웨어적으로 구현될 수 있다. 본 발명이 실행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는, 디지털 메모리 매체, 특히 전자적으로 판독 가능한 제어 신호들을 가지는 디스크, DVD 혹은 CD 상에 구현될 수도 있다. 따라서, 일반적으로 본 발명은, 컴퓨터 프로그램 제품이 컴퓨터 상에서 동작할 때 본 발명의 방법을 실행하기 위한, 기계-판독 가능한 캐리어(carrier) 상에 저장된 프로그램 코드를 가지는 컴퓨터 프로그램 제품일 수 있다. 즉, 본 발명의 방법은 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 본 발명에 따른 방법 중 적어도 하나를 실행하는 프로그램 코드를 갖는 컴퓨터 프로그램이다.
비록 앞서에서는 특정 실시예를 참조하여 특별히 도시 및 설명하였지만, 해당 기술분야의 숙련된 당업자는 본 발명의 사상적 범위로부터 벗어나지 않는 범위 내에서 본 발명의 형태 및 세부사항을 다양하게 변경시킬 수 있음을 이해할 수 있을 것이다. 여기에 개시되고 하기의 특허 청구의 범위에 의해 개시되는 보다 넓은 개념을 벗어나지 않으면서, 다른 실시예들에 적용되기 위해 다양한 변경이 이루어질 수 있음 또한 이해되어야 할 것이다.

Claims (24)

  1. 업믹스 규칙을 이용해 다운믹스 신호를 업믹싱하는 데 사용 가능한 업믹스 규칙 정보를 포함하는 파라미터들을 사용하여 원래의 멀티-채널 신호로부터 도출된 다운믹스 신호로부터 바이노럴 신호를 생성하는, 멀티-채널 디코더로서,
    업믹스 채널들과 관련한 업믹스 규칙 정보 및 머리 관련 전달 함수 기반 필터들의 필터 특성들에 기반하여, 에너지-에러를 감소시키거나 또는 제거시키기 위한 적어도 하나의 이득 인자를 계산하는 이득 인자 계산기; 및
    에너지-보정된 바이노럴 신호를 획득하기 위해, 상기 적어도 하나의 이득 인자, 상기 필터 특성들 및 상기 업믹스 규칙 정보를 사용하여 다운믹스 신호를 필터링하는 필터 프로세서로를 포함하는 멀티-채널 디코더.
  2. 청구항 1에 있어서,
    상기 필터 프로세서는, 상기 다운믹스 신호의 각 채널에 대해 2 개의 이득 조절된 필터들에 대한 필터 계수들을 계산하고, 2 개의 이득 조절된 필터들 각각을 이용해 상기 다운믹스 채널을 필터링하도록 동작하는, 멀티-채널 디코더.
  3. 청구항 1에 있어서,
    상기 필터 프로세서는, 상기 다운믹스 신호의 각 채널에 대해 2 개의 필터들에 대한 필터 계수들을 이득 인자를 사용하지 않고 계산하고, 상기 다운믹스 채널 들을 필터링하고, 상기 다운믹스 채널의 필터링에 이어 이득 조절을 하도록 동작하는, 멀티-채널 디코더.
  4. 청구항 1에 있어서,
    상기 이득 인자 계산기는 필터 특성들의 결합된 임펄스 응답의 에너지에 기초하여 이득 인자를 계산하도록 동작하되, 상기 결합된 임펄스 응답은 개별 필터 임펄스 응답들을 합산하거나 감산함으로써 계산되는, 멀티-채널 디코더.
  5. 청구항 1에 있어서,
    상기 이득 인자 계산기는 개별적인 필터 임펄스 응답들의 파워의 결합에 기초하여 이득 인자를 계산하도록 동작하는, 멀티-채널 디코더.
  6. 청구항 5에 있어서,
    상기 이득 인자 계산기는 개별적인 필터 임펄스 응답들의 파워의 가중된 합산에 기초하여 이득 인자를 계산하도록 동작하되, 상기 가중된 합산에 사용된 가중 계수들은 업믹스 규칙 정보에 기반하는, 멀티-채널 디코더.
  7. 청구항 1에 있어서,
    상기 이득 인자 계산기는 분자 및 분모를 가지는 표현에 기초하여 이득 인자를 계산하도록 동작하되, 상기 분자는 개별적인 필터 임펄스 필터 응답들의 파워의 조합을 가지고 상기 분모는 개별적인 필터 임펄스 응답들의 파워의 가중된 합산을 가지며, 상기 가중된 합산에 사용되는 가중 계수들은 업믹스 규칙 정보에 기반하는, 멀티-채널 디코더.
  8. 청구항 1에 있어서,
    상기 이득 인자 계산기는 아래의 수학식에 기초하여 상기 이득 인자를 계산하도록 동작하되,
    Figure 112008082398541-PCT00088
    gn은 n이 1로 설정되었을 때 제1 채널에 대한 이득 인자, g2 는 n이 2로 설정되었을 때 제2 채널에 대한 이득 인자이고,
    Figure 112008082398541-PCT00089
    는 가중 파라미터들을 이용하여 채널 임펄스 응답들의 가중 에너지들에 의해 계산된 가중된 합산 에너지,
    Figure 112008082398541-PCT00090
    는 상기 업믹스 규칙에 의해 나타난 에너지 에러에 대한 추정이고, α, β, γ는 업믹스 규칙 의존 파라미터들이며, ε은 0 이상의 값인, 멀티-채널 디코더.
  9. 청구항 8에 있어서,
    상기 이득 인자 계산기는, 아래의 식에 기초하여 En 및 ΔEn를 계산하며,
    Figure 112008082398541-PCT00091
    여기서, bn,1 은 제1 업믹스 채널 및 제n 바이노럴 채널에 대응하는 HRTF-기반 필터이고, bn,2 는 제2 업믹스 채널 및 제n 바이노럴 채널에 상응하는 HRTF-기반 필터 임펄스 응답이고, bn,3 은 제3 업믹스 채널 및 제n 바이노럴 채널에 대응하는 HRTF-기반 필터 임펄스 응답이고,
    여기서, 아래의 정의들
    Figure 112008082398541-PCT00092
    Figure 112008082398541-PCT00093
    이 유효하며, c1은 제1 예측 파라미터, c2는 제2 예측 파라미터이고, 상기 제1 예측 파라미터 및 상기 제2 예측 파라미터는 상기 업믹스 규칙 정보를 구성하는, 멀티-채널 디코더.
  10. 청구항 1에 있어서,
    상기 이득 인자 계산기는 좌측 바이노럴 채널 및 우측 바이노럴 채널에 애한 공통 이득 인자를 계산하도록 동작하는, 멀티-채널 디코더.
  11. 청구항 1에 있어서,
    상기 필터 프로세서는, 필터 특성으로서, 가상 중앙, 좌측 및 우측 위치들에 대해 좌측 바이노럴 채널 및 우측 바이노럴 채널에 대한 머리 관련 전달 함수 기반 필터들을 사용하고, 가상 좌전방 위치 및 가상 좌 서라운드 위치에 대한 HRTF 필터들을 결합하거나 또는 가상 우전방 위치 및 가상 우 서라운드 위치에 대한 HRTF 필터들을 결합함으로써 도출되는 필터 특성들을 사용하도록 동작하는, 멀티-채널 디코더.
  12. 청구항 11에 있어서,
    원래의 좌측 및 좌측 서라운드 채널들 또는 원래의 우측 또는 우측 서라운드 채널들과 관련한 파라미터들은 디코더 입력 신호 내에 포함되어 있고
    상기 필터 프로세서는 머리 관련 전달 함수 필터들을 결합하기 위해 상기 파라미터들을 사용하도록 동작하는, 멀티-채널 디코더.
  13. 청구항 1에 있어서,
    상기 이득 인자 계산기는, 상기 바이노럴 채널에 대한 HRTF-기반 필터들의 채널 임펄스 응답들의 에너지들의 가중된 선형 조합의 비율 및 상기 가중된 선형 조합에서 추정된 에너지-에러를 감산함으로써 얻어지는 값에 기초하여 바이노럴 채널에 대한 이득 인자를 계산하도록 동작하는, 멀티-채널 디코더.
  14. 청구항 13에 있어서,
    상기 이득 인자 계산기는, 가중 인자를 결정하기 위해 업믹스 규칙에 대한 정보를 사용하도록 동작하는, 멀티-채널 디코더.
  15. 청구항 14에 있어서,
    상기 업믹스 규칙 정보는, 대응하는 3 개의 입력 채널들에 대해 에너지-에러를 가지는 출력 채널들을 도출하는 업믹스 매트릭스를 구성하는 데 사용될 수 있는 적어도 2 개의 예측 파라미터들을 포함하는, 멀티-채널 디코더.
  16. 청구항 1에 있어서,
    상기 필터 프로세서는, 필터 특성으로서,
    제1 좌측 바이노럴 출력을 획득하기 위해 좌측 다운믹스 채널을 필터링하는 제1 필터,
    제2 좌측 바이노럴 출력을 획득하기 위해 우측 다운믹스 채널을 필터링하는제2 필터,
    제1 우측 바이노럴 출력을 획득하기 위해 좌측 다운믹스 채널을 필터링하는제3 필터,
    제2 우측 바이노럴 출력을 획득하기 위해 우측 다운믹스 채널을 필터링하는제4 필터,
    좌측 바이노럴 채널을 획득하기 위해 상기 제1 좌측 바이노럴 출력 및 상기 제2 좌측 바이노럴 출력을 합산하고, 우측 바이노럴 채널을 획득하기 위해 상기 제1 우측 바이노럴 출력 및 상기 제2 우측 바이노럴 출력을 합산하는 가산기를 포함하고,
    상기 필터 프로세서는, 상기 좌측 바이노럴 채널에 대한 이득 인자를, 합산 전후에 제1 및 제2 필터들 혹은 상기 좌측 바이노럴 출력에 적용하도록, 그리고, 상기 우측 바이노럴 채널에 대한 이득 인자를, 합산 전후에 상기 제3 필터 및 상기 제4 필터 또는 상기 우측 바이노럴 출력에 적용하도록 동작하는, 멀티-채널 디코더.
  17. 청구항 1에 있어서,
    상기 업믹스 규칙 정보는 2개로부터 3개 채널로의 업믹스를 도출하는 업믹스 매트릭스를 구성하는 데 사용될 수 있는 업믹스 파라미터들을 포함하는, 멀티-채널 디코더.
  18. 청구항 17에 있어서,
    상기 업믹스 규칙은,
    Figure 112008082398541-PCT00094
    와 같이 정의되고, 여기서 L은 제1 업믹스 채널, R은 제2 업믹스 채널, C는 제3 업믹스 채널, L0는 제1 다운믹스 채널, R0는 제2 다운믹스 채널, 그리고, mij는 업믹스 규칙 정보 파라미터들인, 멀티-채널 디코더.
  19. 청구항 1에 있어서,
    멀티-채널 디코더 입력 신호 내에 예측 손실 파라미터가 포함되어 있고,
    필터 프로세서가 상기 예측 손실 파라미터를 이용해 상기 이득 인자를 스케일링하도록 동작하는, 멀티-채널 디코더.
  20. 청구항 1에 있어서,
    상기 이득 계산기는 서브밴드 방식으로 상기 이득 인자를 계산하도록 동작하고,
    상기 필터 프로세서는 상기 이득 인자를 서브밴드 방식으로 적용하도록 동작하는, 멀티-채널 디코더.
  21. 청구항 11에 있어서,
    상기 필터 프로세서는, 상기 HRTF 필터들의 채널 임펄스 응답들의 가중된 또는 위상 시프트된 버전들을 합산함으로써 2 개의 채널들과 관련된 HRTF 필터들을 결합하도록 동작하고, 상기 채널 임펄스 응답들을 가중하는 가중 인자들은 채널들 간의 레벨 차이에 기초하는 HRTF 필터들이고, 적용된 위상 시프트는 상기 HRTF 필 터들의 채널 임펄스 응답들 간의 시간 지연에 의존하는, 멀티-채널 디코더.
  22. 청구항 1에 있어서,
    HRTF-기반 필터들 또는 HRTF 필터들의 필터 특성들은, 복소-지수적 변조된 필터뱅크를 이용해 HRTF 필터의 실수 값의 필터 임펄스 응답을 필터링함으로써 얻어지는 복소 서브밴드 필터들인, 멀티-채널 디코더.
  23. 업믹스 규칙을 이용해 다운믹스 신호를 업믹싱하는 데 사용 가능한 업믹스 규칙 정보를 포함하는 파라미터들을 사용하여 원래의 멀티-채널 신호로부터 도출된 다운믹스 신호로부터 바이노럴 신호를 생성하는, 멀티-채널 디코딩 방법으로서,
    업믹스 채널들과 관련한 업믹스 규칙 정보 및 머리 관련 전달 함수 기반 필터들의 필터 특성들에 기반하여, 에너지-에러를 감소시키거나 또는 제거시키기 위한 적어도 하나의 이득 인자를 계산하는 단계; 및
    에너지-보정된 바이노럴 신호를 획득하기 위해, 상기 적어도 하나의 이득 인자, 상기 필터 특성들 및 상기 업믹스 규칙 정보를 사용하여 다운믹스 신호를 필터링하는 단계를 포함하는 멀티-채널 디코딩 방법.
  24. 컴퓨터 상에서 동작할 때, 청구항 23에 따른 방법을 수행하는 프로그램 코드를 가지는 컴퓨터 프로그램.
KR1020087029286A 2006-06-02 2006-09-04 에너지-비보존 업믹스 규칙들 측면에서의 바이노럴 멀티 채널 디코더 KR101004834B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US80381906P 2006-06-02 2006-06-02
US60/803,819 2006-06-02

Publications (2)

Publication Number Publication Date
KR20090007471A true KR20090007471A (ko) 2009-01-16
KR101004834B1 KR101004834B1 (ko) 2010-12-28

Family

ID=37685624

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087029286A KR101004834B1 (ko) 2006-06-02 2006-09-04 에너지-비보존 업믹스 규칙들 측면에서의 바이노럴 멀티 채널 디코더

Country Status (13)

Country Link
US (19) US8027479B2 (ko)
EP (2) EP2216776B1 (ko)
JP (1) JP4834153B2 (ko)
KR (1) KR101004834B1 (ko)
CN (3) CN102523552B (ko)
AT (1) ATE503244T1 (ko)
DE (1) DE602006020936D1 (ko)
ES (1) ES2527918T3 (ko)
HK (2) HK1124156A1 (ko)
MY (2) MY157026A (ko)
SI (1) SI2024967T1 (ko)
TW (1) TWI338461B (ko)
WO (1) WO2007140809A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
US8824577B2 (en) 2010-04-17 2014-09-02 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multichannel signal
KR20160015284A (ko) * 2013-05-29 2016-02-12 퀄컴 인코포레이티드 회전된 고차 앰비소닉스의 바이노럴화

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
WO2007032646A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
TWI344638B (en) * 2006-01-19 2011-07-01 Lg Electronics Inc Method and apparatus for processing a media signal
WO2007091849A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
KR101062353B1 (ko) * 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
US20110282674A1 (en) * 2007-11-27 2011-11-17 Nokia Corporation Multichannel audio coding
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
WO2009141775A1 (en) * 2008-05-23 2009-11-26 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
BRPI0911729B1 (pt) * 2008-07-31 2021-03-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V dispositivo e método para gerar um sinal binaural e para formar um conjunto de redução por intersemelhança
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
WO2010070016A1 (en) * 2008-12-19 2010-06-24 Dolby Sweden Ab Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters
PL2380364T3 (pl) * 2008-12-22 2013-03-29 Koninl Philips Electronics Nv Wytwarzanie sygnału wyjściowego za pomocą przetwarzania wysyłania efektu
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
MY160807A (en) 2009-10-20 2017-03-31 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Audio encoder,audio decoder,method for encoding an audio information,method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2326108B1 (en) * 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
KR101405976B1 (ko) 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
TWI476757B (zh) 2010-01-12 2015-03-11 Fraunhofer Ges Forschung 音訊編碼器、音訊解碼器、用以將音訊資訊編碼及解碼之方法、以及基於先前解碼頻譜值之範數來獲取脈絡子區值之電腦程式
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN101835072B (zh) * 2010-04-06 2011-11-23 瑞声声学科技(深圳)有限公司 虚拟环绕声处理方法
EP4120246A1 (en) 2010-04-09 2023-01-18 Dolby International AB Stereo coding using either a prediction mode or a non-prediction mode
JP5681290B2 (ja) * 2010-09-28 2015-03-04 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス
WO2012040897A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2012169808A2 (ko) * 2011-06-07 2012-12-13 삼성전자 주식회사 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기
US9178553B2 (en) * 2012-01-31 2015-11-03 Broadcom Corporation Systems and methods for enhancing audio quality of FM receivers
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
JP5724044B2 (ja) * 2012-02-17 2015-05-27 華為技術有限公司Huawei Technologies Co.,Ltd. 多重チャネル・オーディオ信号の符号化のためのパラメトリック型符号化装置
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
US20150371644A1 (en) * 2012-11-09 2015-12-24 Stormingswiss Gmbh Non-linear inverse coding of multichannel signals
WO2014164361A1 (en) * 2013-03-13 2014-10-09 Dts Llc System and methods for processing stereo audio content
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US9420393B2 (en) 2013-05-29 2016-08-16 Qualcomm Incorporated Binaural rendering of spherical harmonic coefficients
US9215545B2 (en) * 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830335A3 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
PT3022949T (pt) * 2013-07-22 2018-01-23 Fraunhofer Ges Forschung Descodificador de áudio multicanal, codificador de áudio de multicanal, métodos, programa de computador e representação de áudio codificada usando uma descorrelação dos sinais de áudio renderizados
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102596944B1 (ko) 2014-03-24 2023-11-02 돌비 인터네셔널 에이비 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스
KR20170017873A (ko) * 2014-06-06 2017-02-15 소니 주식회사 오디오 신호 처리 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
US9883309B2 (en) * 2014-09-25 2018-01-30 Dolby Laboratories Licensing Corporation Insertion of sound objects into a downmixed audio signal
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
GB2544458B (en) 2015-10-08 2019-10-02 Facebook Inc Binaural synthesis
US10331750B2 (en) 2016-08-01 2019-06-25 Facebook, Inc. Systems and methods to manage media content items
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN107221337B (zh) * 2017-06-08 2018-08-31 腾讯科技(深圳)有限公司 数据滤波方法、多人语音通话方法以及相关设备
CN111434049B (zh) * 2017-06-19 2021-06-11 弗吉尼亚科技知识产权有限公司 使用多天线收发器无线传输的信息的编码和解码
US10749594B1 (en) * 2017-08-18 2020-08-18 DeepSig Inc. Learning-based space communications systems
DE102017124046A1 (de) * 2017-10-16 2019-04-18 Ask Industries Gmbh Verfahren zur Durchführung eines Morphingvorgangs
CN110853658B (zh) * 2019-11-26 2021-12-07 中国电影科学技术研究所 音频信号的下混方法、装置、计算机设备及可读存储介质
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering
GB2609667A (en) * 2021-08-13 2023-02-15 British Broadcasting Corp Audio rendering

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3571794A (en) * 1967-09-27 1971-03-23 Bell Telephone Labor Inc Automatic synchronization recovery for data systems utilizing burst-error-correcting cyclic codes
US5610986A (en) * 1994-03-07 1997-03-11 Miles; Michael T. Linear-matrix audio-imaging system and image analyzer
US5727068A (en) * 1996-03-01 1998-03-10 Cinema Group, Ltd. Matrix decoding method and apparatus
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2328922T3 (es) 2002-09-23 2009-11-19 Koninklijke Philips Electronics N.V. Generacion de una señal de sonido.
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7680289B2 (en) * 2003-11-04 2010-03-16 Texas Instruments Incorporated Binaural sound localization using a formant-type cascade of resonators and anti-resonators
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
US20060093164A1 (en) * 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
DE102004053090A1 (de) * 2004-11-03 2006-05-04 Basf Ag Verfahren zur Herstellung von Natriumdithionit
EP1810396A1 (en) 2004-11-05 2007-07-25 Labofa Munch A/S A drive mechanism for elevating and lowering a tabletop
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
EP1989920B1 (en) * 2006-02-21 2010-01-20 Koninklijke Philips Electronics N.V. Audio encoding and decoding
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
ATE532350T1 (de) * 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
MY194835A (en) * 2010-04-13 2022-12-19 Fraunhofer Ges Forschung Audio or Video Encoder, Audio or Video Decoder and Related Methods for Processing Multi-Channel Audio of Video Signals Using a Variable Prediction Direction
EP3204943B1 (en) * 2014-10-10 2018-12-05 Dolby Laboratories Licensing Corp. Transmission-agnostic presentation-based program loudness

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
US8824577B2 (en) 2010-04-17 2014-09-02 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multichannel signal
KR20160015284A (ko) * 2013-05-29 2016-02-12 퀄컴 인코포레이티드 회전된 고차 앰비소닉스의 바이노럴화

Also Published As

Publication number Publication date
US20190110150A1 (en) 2019-04-11
CN102547551A (zh) 2012-07-04
US20110091046A1 (en) 2011-04-21
JP2009539283A (ja) 2009-11-12
US10097940B2 (en) 2018-10-09
KR101004834B1 (ko) 2010-12-28
US10412524B2 (en) 2019-09-10
HK1146975A1 (en) 2011-07-22
US20180098170A1 (en) 2018-04-05
CN102547551B (zh) 2014-12-17
ATE503244T1 (de) 2011-04-15
SI2024967T1 (sl) 2011-11-30
US10412526B2 (en) 2019-09-10
DE602006020936D1 (de) 2011-05-05
US10863299B2 (en) 2020-12-08
US11601773B2 (en) 2023-03-07
US20170272885A1 (en) 2017-09-21
US20180139559A1 (en) 2018-05-17
US9699585B2 (en) 2017-07-04
US20140343954A1 (en) 2014-11-20
US10469972B2 (en) 2019-11-05
TW200803190A (en) 2008-01-01
HK1124156A1 (en) 2009-07-03
US20190110149A1 (en) 2019-04-11
US20210195357A1 (en) 2021-06-24
ES2527918T3 (es) 2015-02-02
US9992601B2 (en) 2018-06-05
US8948405B2 (en) 2015-02-03
US10015614B2 (en) 2018-07-03
US20180109898A1 (en) 2018-04-19
US10021502B2 (en) 2018-07-10
US8027479B2 (en) 2011-09-27
US10123146B2 (en) 2018-11-06
WO2007140809A1 (en) 2007-12-13
CN101460997A (zh) 2009-06-17
US20180139558A1 (en) 2018-05-17
US20200021937A1 (en) 2020-01-16
TWI338461B (en) 2011-03-01
JP4834153B2 (ja) 2011-12-14
US20180132051A1 (en) 2018-05-10
US10085105B2 (en) 2018-09-25
US20180098169A1 (en) 2018-04-05
US10412525B2 (en) 2019-09-10
EP2216776A3 (en) 2011-03-23
US20190110151A1 (en) 2019-04-11
US20230209291A1 (en) 2023-06-29
CN102523552B (zh) 2014-07-30
US20180109897A1 (en) 2018-04-19
EP2216776B1 (en) 2014-11-12
EP2024967A1 (en) 2009-02-18
US10097941B2 (en) 2018-10-09
US20190116443A1 (en) 2019-04-18
MY180689A (en) 2020-12-07
EP2024967B1 (en) 2011-03-23
US20070280485A1 (en) 2007-12-06
EP2216776A2 (en) 2010-08-11
CN102523552A (zh) 2012-06-27
US20180091914A1 (en) 2018-03-29
US10091603B2 (en) 2018-10-02
MY157026A (en) 2016-04-15

Similar Documents

Publication Publication Date Title
KR101004834B1 (ko) 에너지-비보존 업믹스 규칙들 측면에서의 바이노럴 멀티 채널 디코더
KR101010464B1 (ko) 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131210

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141209

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151207

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161208

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171211

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181207

Year of fee payment: 9