KR101135869B1 - 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법 - Google Patents

복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법 Download PDF

Info

Publication number
KR101135869B1
KR101135869B1 KR1020067020274A KR20067020274A KR101135869B1 KR 101135869 B1 KR101135869 B1 KR 101135869B1 KR 1020067020274 A KR1020067020274 A KR 1020067020274A KR 20067020274 A KR20067020274 A KR 20067020274A KR 101135869 B1 KR101135869 B1 KR 101135869B1
Authority
KR
South Korea
Prior art keywords
encoder
channel
data
signal
signals
Prior art date
Application number
KR1020067020274A
Other languages
English (en)
Other versions
KR20070001206A (ko
Inventor
제라르드 에이치. 호토
디르크 제이. 브리바르트
에브게니 에이. 베르비트스키
알베르투스 씨. 덴 브링커
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070001206A publication Critical patent/KR20070001206A/ko
Application granted granted Critical
Publication of KR101135869B1 publication Critical patent/KR101135869B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

보충 파라미터 데이터(600)와 함께 다운-믹스 출력 신호(610,620)를 포함하는 대응 출력 데이터를 생성하기 위해 복수-채널 인코더(5;15) 내의 입력 신호(CH1 내지 CH3; 400 내지 450)를 인코딩하는 방법이 기술된다. 상기 방법은 대응 다운-믹스 출력 신호(610,620)를 생성하기 위한 입력 신호(CH1 내지 CH3; 400 내지 450)를 다운-믹스하는 제 1 단계, 및 다운-믹스 출력 신호(610,620)에 보충적인 상기 파라미터 데이터(600)를 생성하기 위해 다운-믹스하는 동안 입력 신호(CH1 내지 CH3; 400 내지 450)를 처리하는 제 2 단계를 포함한다. 입력 신호(CH1 내지 CH3; 400 내지 450)의 처리 단계는 적어도 일부 파라미터 데이터를 결정하고 이에 따라 입력 신호(CH1 내지 CH3; 400 내지 450)의 표시가 이후 재생성될 수 있도록 하기 위해 다운-믹스 출력 신호(610,620) 및 파라미터 데이터(600)의 후속 디코딩 동안 사용가능한 다운-믹스 신호(610,620) 내에 정보를 포함시키는 단계를 포함한다. 필수적인 신호 처리 작동을 수행하기 위한 인코더(5;15)에서의 사용을 위한 코더는 또한 설명된다.

Description

복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법{MULTI-CHANNEL ENCODER, SIGNAL PROCESSOR FOR INCLUSION IN THE MULTI-CHANNEL ENCODER, METHOD OF ENCODING INPUT SIGNALS IN THE MULTI-CHANNEL ENCODER, ENCODED OUTPUT DATA GENERATED ACCORDING TO THE ENCODING METHOD, MULTI-CHANNEL DECODER, SIGNAL PROCESSOR FOR USE IN THE MULTI-CHANNEL DECODER, AND METHOD OF DECODING ENCODED DATA IN THE MULTI-CHANNEL DECODER}
본 발명은, 예를 들어, 공간 오디오의 파라미터 설명을 이용하는 복수-채널 오디오 인코더와 같은, 복수-채널 인코더에 관한 것이다. 게다가, 본 발명은 또한 이러한 복수-채널 인코더 내의, 예를 들어, 공간 오디오와 같은 신호의 처리 방법에 관한 것이다. 또한, 본 발명은 이러한 복수-채널 인코더에 의해 생성된 신호를 디코딩하도록 작동하는 디코더에 관한 것이다.
오디오 기록 및 재생은 최근 수년간 모노 단일-채널 형식에서 이중-채널 스테레오 형식으로 진보되어 왔으며 더욱 최근에는 예를 들어, 가정용 영화 시스템에서 종종 사용되는 것과 같은 5-채널 오디오 형식과 같은 복수-채널 형식으로 진보되었다. 수퍼 오디오 컴팩트 디스크(SACD) 및 디지털 비디오 디스크(DVD) 데이터 캐리어의 도입은 현재 관심의 대상이 되고 있는 이러한 5-채널 오디오 재생을 가져왔다. 많은 사용자들은 현재 그들의 가정에서 5-채널 오디오 재생을 제공할 수 있는 장비를 소유하고 있으며; 이에 따라 예를 들어, 전술한 SACD 및 DVD형의 데이터 캐리어와 같은 적절한 데이터 캐리어 상의 5-채널 오디오 프로그램이 더욱 이용가능하게 되고 있다. 복수-채널 프로그램 컨텐츠에 대한 증가하는 관심으로 인해, 복수-채널 오디오 프로그램 컨텐츠의 더욱 효율적인 코딩은, 예를 들어 하나 이상의 개선된 품질, 더욱 긴 재생 시간 및 더 많은 채널을 제공하기 위해, 중요한 이슈가 되어가고 있다. 게다가, 이러한 증가하는 관심은, MPEG와 같은 표준화 기구가 복수-채널 인코더의 디자인이 타당한 주제라는 것을 인식하도록 촉구하였다.
파라미터 설명자에 의한 오디오 프로그램 컨텐츠와 같은 공간 오디오 정보를 나타낼 수 있는 인코더가 알려져 있다. 예를 들어, 공개된 국제 PCT 특허 출원 PCT/IB2003/002858(WO 2004/008805)에서, 적어도 제 1 신호 성분(LF), 제 2 신호 성분(LR) 및 제 3 신호 성분(RF)을 포함하는 복수-채널 오디오 신호의 인코딩이 설명된다. 이러한 인코딩은:
(a) 제 1 인코딩된 신호(L)와 제 1 인코딩 파라미터의 집합(P2)을 생성하기 위한 제 1 파라미터 인코더를 사용함으로써 제 1 및 제 2 신호 성분을 인코딩하는 단계;
(b) 제 2 인코딩된 신호(T) 및 제 2 인코딩 파라미터 집합(P1)을 생성하기 위해 제 2 파라미터 인코더를 사용함으로써 제 1 인코딩된 신호(L)와 추가 신호(R)를 인코딩하는 단계로서, 상기 추가 신호(R)는 적어도 제 3 신호 성분(RF)으로부터 유도된, 제 1 인코딩된 신호(L)와 추가 신호(R)를 인코딩하는 단계; 및
(c) 적어도 제 2 인코딩된 신호(T), 상기 제 1 인코딩 파라미터 집합(P2) 및 상기 제 2 인코딩 파라미터 집합(P1)으로부터 유도된 최종 인코딩된 신호(T)에 의해 복수-채널 오디오 신호를 나타내는 단계
를 포함하는 방법을 이용한다.
오디오 신호의 파라미터 설명은 최근 수년간 관심을 얻고 있으며, 이는 오디 오 신호를 설명하는 양자화된 파라미터를 전송하는 것은 비교적 적은 전송 용량을 필요로 한다는 것으로 나타났기 때문이다. 이들 양자화된 파라미터들은 그들의 대응 원본 오디오 신호와 지각적으로 상당히 다르지 않은 오디오 신호를 재생성하기 위해 디코더 내에서 수신되고 처리될 수 있다.
상당한 채널 사이의 간섭의 문제는 현재의 복수-채널 인코더로부터의 출력이 이후 디코딩될 때 발생한다. 이러한 간섭은 특히 2-채널 다운-믹스와 관련하여 양호한 스테레오 이미지를 얻기 위해 배열된 복수-채널 인코더에서 현저하다. 본 발명은 적어도 부분적으로 이러한 문제를 다루기 위해 배열되며, 이에 따라 대응하는 디코딩된 복수-채널 오디오의 품질이 개선된다.
본 발명의 목적은 감소된 채널 사이의 간섭으로 이후 디코딩될 수 있는 인코딩된 출력 데이터를 생성할 수 있는 복수-채널 인코더 내에 사용될 수 있는 대안적인 복수-채널 인코더 또는 블록을 제공하는 것이다.
본 발명의 제 1 양상에 따라, 보충 파라미터 데이터와 함께 다운-믹스 출력 신호를 포함하는 대응 출력 데이터를 생성하기 위해 복수의 입력 채널로 전송된 입력 신호를 처리하도록 작동하는 복수-채널 인코더가 제공되며, 상기 인코더는:
(a) 입력 신호를 다운-믹스하여 상기 대응하는 다운-믹스 출력 신호를 생성하는 다운-믹서; 및
(b) 다운-믹스 출력 신호에 보충적인 상기 파라미터 데이터를 생성하도록 작동하는, 입력 신호를 처리하기 위한 분석기를 포함하며,
상기 인코더는 다운-믹스 출력 신호를 생성할 때 인코더 내에서 처리된 후 폐기되는 채널의 신호를 예측하기 위한 다운-믹스 출력 신호의 후속 디코딩을 허용하도록 작동한다.
본 발명은 인코더로부터의 출력 데이터가 감소된 인터-채널 간섭으로 디코딩될 수 있으며, 즉, 입력 신호의 개선된 후속 재생성을 가능케 한다는 점에서 유리하다.
게다가, 입력 신호를 나타내기 위해 필요한 복수-채널 인코더로부터의 데이터 출력양은 또한 잠재적으로 감소된다.
바람직하게, 인코더는 시간/주파수 타일에 기초하여 입력 신호를 처리하도록 작동한다. 더 바람직하게, 이들 타일은 입력 신호의 처리 이전에 또는 인코더에서는 처리동안에 한정된다.
바람직하게, 인코더에서, 분석기는 하나 이상의 입력 신호 및 복수-채널 인코더로부터의 출력 데이터로부터 생성될 수 있는 상기 하나 이상의 입력 신호의 추정치 간의 차이로부터 유도된 적어도 하나의 신호의 최적화를 적용함으로써 파라미터 데이터(C1,i;C2,i)의 적어도 일부를 생성하기 위해 작동한다. 더 구체적으로, 최적화는 유클리드 놈(Euclidean norm)을 최소화하는 단계를 포함한다.
바람직하게, 인코더에는, 분석기가 각 시간/주파수 타일에 대해 파라미터 데이터를 생성하기 위해 처리하도록 작동하는 N개의 입력 채널이 존재하며, 상기 분석기는 출력 데이터에서 입력 신호를 나타내기 위한 M개의 다운-믹스 출력 신호와 함께 M(N-M)개의 파라미터를 출력하도록 작동하며, M과 N은 정수이며 M<N이다. 더 바람직하게, 정수 M이 인코더에서 2인 경우, 다운-믹서는 2-채널 스테레오(stereophonic) 장치에서 다시 재생될 수 있으며 표준 스테레오 코더로 코딩될 수 있는 2개의 다운-믹스 출력 신호를 생성하도록 작동한다. 이러한 특성은, 예를 들어 스테레오 2-채널 재생 시스템과 같은, 더 이전의 재생 시스템과 후방으로 호환가능한 관련 출력 데이터와 인코더를 렌더링할 수 있다.
본 발명의 제 2 양상에 따라, 본 발명의 제 1 양상에 따른 복수-채널 인코더에 포함시키기 위한 신호 프로세서가 제공되며, 상기 프로세서는 다운-믹스 출력 신호와 파라미터 데이터를 생성하기 위해 복수-채널 인코더 내의 데이터를 처리하도록 작동한다.
본 발명의 제 3 양상에 따라, 보충 파라미터 데이터와 함께 다운-믹스 출력 신호를 포함하는 대응 출력 데이터를 생성하기 위한 복수-채널 인코더 내의 입력 신호를 인코딩하는 방법이 제공되며, 상기 방법은:
(a) 복수의(N) 입력 채널을 통해 복수-채널 인코더에 입력 신호를 제공하는 단계;
(b) 대응(M) 다운-믹스 출력 신호를 생성하기 위해 입력 신호를 다운-믹스하는 단계; 및
(c) 다운-믹스 출력 신호에 보충적인 상기 파라미터 데이터를 생성하기 위해 입력 신호를 처리하는 단계
를 포함하며, 복수-채널 인코더 내의 입력 신호 처리 단계는 입력 신호의 표시가 이후 재생성될 수 있도록 하기 위해 파라미터 데이터를 결정하는 단계를 포함하며, 상기 다운-믹스 신호는 인코더 내에서 처리된 다음 폐기되는 채널의 신호의 컨텐츠를 예측하기 위한 디코딩을 허용한다.
본 발명의 제 4 양상에 따라, 본 발명의 제 3 양상의 방법에 따라 생성된 인코딩된 출력 데이터가 제공되며, 상기 출력 데이터는 데이터 캐리어 상에 저장된다.
본 발명의 제 5 양상에 따라, 본 발명의 제 1 양상에 따른 인코더에 의해 생성된 출력 데이터를 디코딩하기 위한 디코더가 제공되며, 상기 디코더는:
(a) 인코더로부터의 파라미터 데이터와 함께 다운-믹스 출력 신호를 수신하기 위한 처리 수단으로서, 상기 파라미터 데이터를 처리하여 하나 이상의 계수 또는 파라미터를 결정하도록 동작 가능한, 처리 수단; 및
(b) 파라미터 데이터 및 또한 추가적 처리를 위해 단계 (a)에서 결정된 하나 이상의 계수를 사용하여 출력 데이터 내에 인코딩된 각 입력 신호의 근사 표시를 계산하는 계산 수단으로서, 인코더에 의해 생성된 출력 데이터를 초래하는 입력 신호의 표시를 실질적으로 재생성하는, 계산 수단
을 포함한다.
본 발명의 제 6 양상에 따라, 본 발명의 제 5 양상에 따른 복수-채널 디코더 내의 포함을 위한 신호 프로세서가 제공되며, 신호 프로세서는 입력 신호의 표시를 재생성하는 것과 관련해 데이터 처리를 지원하는 작동을 한다.
본 발명의 제 7 양상에 따라, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법에 제공되며, 상기 데이터는 본 발명의 제 5 양상에 따라 복수-채널 인코더에 의해 생성된 형태이며, 상기 방법은:
(a) 인코딩된 데이터에 존재하는 파라미터 데이터와 함께 다운-믹스 출력 신호를 처리하는 단계로서, 상기 처리는 하나 이상의 계수 또는 파라미터를 결정하기 위해 파라미터 데이터를 이용하는, 처리 단계; 및
(b) 파라미터 데이터 및 또한 추가적 처리를 위한 단계 (a)에서 결정된 하나 이상의 계수를 사용하여 인코딩 데이터로 인코딩된 각 입력 신호의 근사 표시를 계산하는 단계로서, 인코더에 의해 생성된 인코딩된 데이터를 초래하는 입력 신호의 표시를 실질적으로 재생성하는, 계산하는 단계
를 포함한다.
본 발명의 특성은 본 발명의 범위에서 이탈하지 않고 임의의 결합으로 결합될 수 있다는 것이 이해될 것이다.
본 발명의 실시예들은 다음 도면을 참조하여, 단지 예로써만, 이제 설명될 것이다.
도 1은 본 발명의 제 1 배경과 관련하여 본 발명에 따라 코더 내에 포함된 복수-채널 인코더의 일 실시예의 개략적인 블록도.
도 2는 본 발명의 제 1 배경과 관련하여 도 1의 인코더와 호환가능한 본 발명에 따른 디코더의 일 실시예의 개략적인 블록도.
도 3은 본 발명의 제 2 배경과 관련하여 본 발명에 따른 복수-채널 인코더 내에 코더가 이용되는 본 발명의 바람직한 실시예를 도시하는 도면.
도 4는 본 발명의 제 2 배경과 관련하여 도 3의 인코더와 호환가능한, 본 발명의 코더를 사용한, 디코더의 일 실시예를 도시하는 도면.
도 5는 본 발명에 따른 복수-채널 인코더와 복수-채널 디코더가 표준 스테레오 인코더와 디코더로 상호 구성되는 구성을 도시하는 도면.
본 발명은 제 1 및 제 2 배경으로 설명될 것이다. 제 1 배경에서, 본 발명 원래 입력 신호를 처리하여 디코더 내에 이후 디코딩될 수 있는 대응 인코딩된 출력 데이터를 생성함으로써 지금까지 가능한 것보다 지각적으로 더 정확한 원래 입력 신호의 표현을 재생성하도록 작동하는 인코더에 관한 것이다. 제 2 배경에서, 본 발명은 본 발명의 특정 예시적인 실시예에 관한 것이다.
제 1 배경은 이제 도 1과 도 2에 관하여 고려될 것이다. 개요에서, 본 발명은 도 1에서 일반적으로 5로 표시된 인코더에 관한 것이다. 인코더(5)는 대응하는 원래 입력 신호를 수신하기 위해 N개의 입력 채널을 포함하며; 예를 들어, 인코더는 N=3일 때 3개의 입력 채널(CH1,CH2,CH3)을 포함한다. 인코더(5)는 N개의 채널의 원래 입력 신호를 처리하여:
(a) M=2일 때 각각 610, 620으로 표시된 2개의 채널 출력(OP1 및 OP2)과 같은, M개의 다운-믹스 채널 출력에서 대응하는 인코딩된 출력 신호(M<N); 및
(b) 예컨대 600으로 표시된 파라미터 출력과 같은, 하나 이상의 파라미터 신호 출력
을 생성하도록 작동한다.
이후 인코더(5)에 의해 생성된 출력 신호를 디코더에서 가장 최적으로 디코딩하기 위해, 즉 최소 제곱(square) 오류에 관해, 주요 성분 분석(PCA)이 인코딩된 출력 신호(600,610,620)를 생성할 때 인코더(5) 내에서 이용되는 것이 현재에는 유리하다. 인코더(5)에 제공된 N개의 입력 신호에 대응하는 도 2에서 10으로 표시된 디코더에서 신호의 가능한 최상의 재생성을 위한 이들 출력 신호(600,610,620)의 처리는 인코더(5)의 PCA가 생성한 파라미터가 고려되는 경우, 잠재적으로 가능하다. 신호(600,610,620) 내의 PCA 파라미터에 대한 값들은 원래 입력 신호 자체에 의해 유도되며 그러므로 인코더(5) 내에 다운-믹싱에 대한 어떠한 제어도 발생하지 않도록 한다. 이러한 제어의 부족은 PCA가 인코더(5) 및 대응 디코더(10)에 이용될 때 만족스러운 스테레오 이미지 품질을 얻는 것을 현재 실질적으로 불가능하게 만든다.
발명자들은 본 발명에 대해, 고정된 다운-믹스가 인코더(5) 내의 전술한 M개의 다운-믹스 채널과 연관하여 이용될 때, 보조 디코더(10)에서 원래 입력 신호의 실질적으로 완전한 재생성은 잠재적으로 가능하며, 이 때 M개의 다운-믹스 채널들은 보충 정보를 전달하는 N-M 채널의 추가적 적절한 세트에 의해 연장된다는 것을 이해하였다. 따라서, 고정된 다운-믹스에 의해 생성된 M개의 다운-믹스 채널의 출력 신호는, 이러한 N-M 채널과 관련된 정보가 적어도 부분적으로 디코딩동안 폐기되었을 때 N개의 채널의 원래 입력 신호의 실질적으로 완벽한 표시를 재생성하는데 사용될 수 없다. 그러나, 발명자들은 이들 N-M개의 채널들은 적절한 처리가 예컨대, 출력(610,620)과 같은, M개의 다운-믹스 채널에 적용될 때 적어도 부분적으로 예측될 수 있다는 것을 이해하였다.
따라서, 본 발명에 따라 구성된 인코더(5)는 M개의 다운-믹스 채널로부터 디코더에서 N-M 채널에 대응하는 적어도 일부의 정보를 예측하는 한편, 동시에 인코더(5)로부터 디코더(10)로 특정 파라미터를 전송할 필요성을 회피한다. 이러한 예측은 이하 더 자세히 설명되는 것처럼 N개의 채널의 신호 사이에 발생하는 신호의 리던던시를 이용한다. 게다가, 이에 따라 호환가능한 디코더(10)는 인코더(5)로부터 제공된 인코딩된 데이터를 디코딩할 때 리던던시를 회복시킨다.
본 발명을 더 설명하기 위해 도 1에 도시된 인코더(5)의 예시적인 실시예가 설명될 것이며, 이용된 신호의 처리의 방법은 수학적 기초를 참조로 하여 제공될 것이다.
전술한 제 2 배경에 따른 본 발명의 예시적인 실시예는 이제 도 3과 도 4를 참조하여 설명될 것이다.
도 3에서, 일반적으로 15로 표시된 복수-채널 인코더가 도시된다. 인코더(15)는 400 내지 450으로 표시된 6개의 입력 신호를 수신하기 위해 3개의 처리 유닛(20,30,40)을 포함하며, 이들 6개의 입력 신호의 속성은 이후 설명될 것이다. 3개의 처리 유닛(20,30,40)은 인코더(5)를 참조하여 설명된 전술한 N개의 채널(500 내지 520)을 생성하도록 작동한다. 인코더(15)는 또한 처리 유닛(20,30,40) 각각의 처리된 출력(500,510,520)을 수신하기 위해 믹싱 및 파라미터 추출 유닛(180)을 포 함한다. 추출 유닛(180)으로부터 출력은, 전술한 제 3 파라미터 세트 출력(600) 및 왼쪽 및 오른쪽 중간 신호(950,960)를 포함하고, 이들 중간 신호(950,960)는 각각 역 변환 및 OLA 유닛(360)을 통해 연결되어 왼쪽 및 오른쪽 채널 각각에 대해 전술한 다운-믹스 출력(610,620)을 생성한다. 파라미터 출력 세트(720,820,920,600)와 다운-믹스 출력(610,620)은 6개의 입력 신호(400 내지 450) 중 하나 이상의 표시를 재생성하기 위해 출력 데이터가 디코딩되는 대응 호환가능 디코더로 이후 전송되기에 적합한 인코더(15)로부터 인코딩된 출력 데이터에 대응한다. 대안적으로, 다운-믹스 출력(610 및 620)은 표준 스테레오 코더에 공급될 수 있다.
400 내지 450으로 표시된 6개의 원래 입력 신호들은: 왼쪽 전방 오디오 신호(400), 왼쪽 후방 오디오 신호(410), 효과 오디오 신호(420), 중앙 오디오 신호(430), 오른쪽 전방 오디오 신호(440) 및 오른쪽 후방 오디오 신호(450)를 포함한다. 효과 신호(420)는 덜컹거리는 소리, 폭파음 및 천둥 효과와 같은 것을 시뮬레이팅하는데 사용하기 위해 거의120Hz의 대역폭을 갖는 것이 바람직하다. 게다가, 입력 신호(400,410,430,440,450)는 바람직하게 5-채널 가정 영화 음향 채널에 대응한다.
처리 유닛(20,30,40)은 이들 유닛(20,30,40)에 대해 본 명세서에 참조로 병합된 공개된 유럽 특허 출원 EP 1,107,232에 설명된 방법으로 구현되는 것이 바람직하다.
처리 유닛(20)은 세그먼트 및 변환 유닛(100, 파라미터 분석 유닛(110), 파라미터 PCA 각도 유닛(120) 및 PCA 회전 유닛(130)을 포함한다. 변환 유닛(100)은 변환된 왼쪽-전방 및 왼쪽-후방 출력(700,710)을 포함하며, 이들은 PCA 회전 유닛(130)과 파라미터 분석 유닛(110)에 각각 연결된다. 제 1 파라미터 세트 출력(720)은 PCA 각도 유닛(120)을 통해 PCA 회전 유닛(120)에 연결된다. 회전 유닛(130)은 출력(700,710) 및 제 1 파라미터 세트 출력을 처리하여 처리된 출력(500)을 생성하도록 작동한다. 유닛(20) 내에서의 처리는 시간/주파수 타일에 기초하여 행해진다.
유사하게, 처리 유닛(30)은 세그먼트 및 변환 유닛(200), 파라미터 분석 유닛(210), 파라미터 PCA 각도 유닛(220) 및 PCA 회전 유닛(230)을 포함한다. 변환 유닛(200)은 PCA 회전 유닛(230)과 파라미터 분석 유닛(210)에 각각 연결된 변환된 왼쪽-전방 및 왼쪽-후방 출력(800,810)을 포함한다. 제 4 파라미터 세트 출력(820)은 PCA 각도 유닛(220)을 통해 PCA 회전 유닛(220)에 연결된다. 회전 유닛(230)은 처리된 출력(510)을 생성하기 위해 출력(800,810) 및 제 4 파라미터 세트 출력을 처리하도록 작동한다. 유닛(30) 내의 처리는 또한 시간/주파수 타일에 기초하여 행해진다.
유사하게, 처리 유닛(40)은 세그먼트 및 변환 유닛(300), 파라미터 분석 유닛(310), 파라미터 PCA 각도 유닛(320) 및 PCA 회전 유닛(330)을 포함한다. 변환 유닛(300)은 PCA 회전 유닛(330)과 파라미터 분석 유닛(310)에 각각 연결된 변환된 오른쪽-전방 및 오른쪽-후방 출력(900,910)을 포함한다. 제 2 파라미터 세트 출력(920)은 PCA 각도 유닛(320)을 통해 PCA 회전 유닛(330)으로 연결된다. 회전 유닛(330)은 처리된 출력(520)을 생성하기 위해 출력(900,910) 및 제 2 파라미터 세트 출력을 처리하도록 작동한다. 유닛(40) 내에 처리는 시간/주파수 타일에 기초하여 행해진다.
처리된 출력(500,510,520)은 왼쪽, 중앙 및 오른쪽 처리된 신호에 각각 대응한다. 게다가, 다운-믹스 출력(610,620)은 당시의 2-채널 스테레오 재생 장치를 통 해 다시 재생될 수 있으며 이에 따라 이전의 스테레오 음향 시스템과의 후방 호환성이 유지된다. 제 3 파라미터 세트 출력(600)은, 6개의 입력 신호(400 내지 450)의 표시를 재생성하기 위해, 출력 파라미터 세트(720,820,920)와 다운-믹스 출력(610,620)과 함께 도 2에 도시된 디코더(10)와 같은, 디코더에서 처리될 수 있는 추가적 파라미터 데이터를 포함한다. 이 다운-믹스가 제 3 파라미터 세트 출력(600)에서 다운-믹스 출력(610,620) 및 파라미터 데이터를 생성하기 위해 발생한 방법은 다음에 설명될 것이다.
도 1과 도 2에 대해 본 발명의 제 1 배경을 다시 참조하면, N개의 채널(CH1 내지 CH3)의 원래 입력 신호, 즉, z1[n],z2[n],...,zN[n]은, N개의 채널의 이산 시간-도메인 파형을 설명한다. 이들 신호 z1[n] 내지 zN[n]은 상호 공통 분리를 사용한 세그먼트화와 같이, 3개의 처리 유닛(20,30,40)으로 세그먼트되며, 바람직하게 중복 분석 윈도우를 일시적으로 채용한다. 이후, 각 세그먼트는, 예를 들어, 고속 뿌리에 변환(FET) 또는 유사한 등가 유형의 변환과 같은 적절한 변환을 적용함으로써, 시간 포맷인 것에서 주파수 포맷으로, 즉, 시간 도메인에서 주파수 도메인으로 변환된다. 이러한 포맷 변환은 적절한 소프트웨어를 실행하는 계산 하드웨어에 구현되는 것이 바람직하다. 대안적으로, 변환은 시간/주파수 타일을 얻기 위해 필터-뱅크 구조를 사용하여 구현될 수 있다. 게다가, 변환은 채널(CH1 내지 CH3)에 대한 입력 신호의 세그먼트된 하위-대역 표시를 초래한다. 편의상, 입력 신호(z1[n] 내지 zN[n])의 이들 세그먼트된 하위-대역 표시는 Z1[k] 내지 ZN[k]로 각각 표시되며 여 기서 k는 주파수 지수이다.
편의상, 다른 수의 다운-믹스 채널들에 대한 확장이 가능하다고 해도, 인코더(15)에 대해 설명된 것과 같이 2개의 다운-믹스 채널을 생각해 보자. N개의 채널(CH1 내지 CH3)로 전송된 원래 입력 신호로부터, 인코더(5)는 수학식 1과 수학식 2에 제공된 것처럼 2개의 다운-믹스 채널(L0[k] 및 R0[k])을 생성하기 위해 전술한 하위-대역 표시(Z1[k] 내지 ZN[k])를 처리한다.
Figure 112006071189859-pct00001
Figure 112006071189859-pct00002
파라미터(
Figure 112011055607852-pct00003
,
Figure 112011055607852-pct00004
)는 2개의 다운-믹스 채널(L0[k] 및 R0[k])에서의 양호한 스테레오 이미지를 위해 요구되는 대로 설정되는 것이 바람직하다. 전술한 내용에서 설명된 것처럼, 후속 디코더, 예컨대 CH1 내지 CH3에 대한 원래 입력 신호의 표시를 재생성하는 디코더(10)는 2개의 다운-믹스 채널(L0[k] 및 R0[k])이 N-2개의 사라진 채널을 실질적으로 재생성하기 위한 적절한 세트의 파라미터로 보충될 때에만 거의 완벽한 표시의 생성이 가능하다. 고정된 다운-믹싱이 채용될 때, 어느 정도는, N-2개의 폐기된 채널의 정보는 2개의 다운-믹스 채널(L0[k] 및 R0[k])로부터 예측될 수 있으며, 이에 따라 예를 들어 디코더(10)와 같은, 대응 디코더에서 채널(CH1 내지 CH3)의 원래 입력 신호의 전술한 표시의 재생성의 정확도의 향상 방법을 제공한다.
N개의 채널 중 특정 채널과 관련된 정보가 출력 신호(600,610,620)를 생성하는 중에 폐기될 때, 즉, 폐기된 채널이 C0,i[k]으로 표시될 때, 이들 폐기된 채널들은 수학식 3을 적용함으로써 다운-믹스 채널(L0[k] 및 R0[k])로부터 예측될 수 있다.
Figure 112006071189859-pct00005
여기서 파라미터(
Figure 112011055607852-pct00006
)는 하나 이상의 최적화 표준에 따라 선택된다. 바람직하게, 인코더(5)에서 채용된 최적화 표준은 신호(C0,i[k]) 및 그 추정치(
Figure 112011055607852-pct00007
)의 최소 유클리드 놈이다. 수학식 3에 따른 처리가 인코더(5)에 보충적인 디코더에서 채용될 수 있도록 허용하기 위해, 파라미터(
Figure 112011055607852-pct00008
)는 인코더(5)로부터 출력되는 제 3 파라미터 세트(600)에 포함되는 것이 바람직하다.
발명자는 수학식 3에서 파라미터(
Figure 112011055607852-pct00009
)가 디코더(10)에서 신호(
Figure 112011055607852-pct00010
)와 신호의 추정치(
Figure 112011055607852-pct00011
)의 차의 유클리드 놈을 최소화할 때 인코더(5)에서 생성되는 파라미터와 관련된다는 것을 이해하였다. 인코더(5)는 이들 후자의 파라미터(
Figure 112011055607852-pct00012
,
Figure 112011055607852-pct00013
)를 채용하도록 구성된다. 원래 입력 신호(
Figure 112011055607852-pct00014
)의 차이의 유클리드 놈의 제곱은 수학식 4를 응용함으로써 인코더(5)에서 계산될 수 있다:
Figure 112006071189859-pct00015
Figure 112006071189859-pct00016
수학식 4의 최소화는 수학식 6과 수학식 7을 응용함으로써 달성되는 것이 바람직하다.
Figure 112006071189859-pct00017
Figure 112006071189859-pct00018
여기에서
Figure 112006071189859-pct00019
Figure 112006071189859-pct00020
따라서, 수학식 6과 수학식 7로부터 계산가능한 것처럼 파라미터(C1,Zi 및 C2,Zi)에 대해, 다음 관계는 예를 들어, 수학식 1과 수학식 2와 관련된, 계수(
Figure 112011055607852-pct00021
Figure 112011055607852-pct00022
)에 대해 수학식 10 내지 수학식 13이 도출될 수 있다.
Figure 112006071189859-pct00023
Figure 112006071189859-pct00024
Figure 112006071189859-pct00025
Figure 112006071189859-pct00026
따라서, 인코더(5)에서, 수학식 1 내지 수학식 13에 의해 설명된 것처럼 처리 연산을 응용하면, 채널당 2개의 파라미터 및 2개의 다운-믹스 채널을 통해 N개의 채널에 대응하는 입력 신호 즉, CH1 내지 CH3에 대한 입력 신호(N=3)를 변환하여, 출력(610,620) 및 제 3 파라미터 세트 출력(600)에 대한 신호를 생성하는 것이 가능하며; i번째 채널에 대한 2개의 파라미터들은
Figure 112011055607852-pct00027
Figure 112011055607852-pct00028
이다. 다운-믹스가 모든 시간/주파수 타일에 대해 고정된 경우, 다운-믹스는 디코더(10)에서 알려지고, 따라서 파라미터 간의 관계는 선험적으로 알 수 있다. 반면, 다운-믹스를 변화하도록 선택한 경우, 실제 다운-믹스에 관한 정보는 디코더(10)로 전송되어야 한다.
인코더(5)에서, 입력 신호(CH1 내지 CH3)는 시간/주파수 타일에서 입력 신호의 표시를 얻기 위해 채널 유닛(100,200,300) 내에 처리된다. 수학식 1 내지 수학식 13에 의해 표시된 것과 같은 처리 연산은 이들 타일 각각에 대해 반복된다. 모든 주파수 타일의 신호(L0[k])는 인코더(5)에서 결합되고 시간 도메인으로 변환되어 현재 세그먼트에 대한 신호를 형성하여, 이 신호는 적어도 이전 세그먼트에 속하는 신호와 적어도 부분적으로 결합되어 인코딩된 출력 신호(620)를 생성한다. 신호(R0[k])는 신호(L0[k])와 유사한 방법으로 처리되어 인코딩된 출력 신호(610)를 생성한다.
요컨대, 인코더(5), 및 유사하게 본 발명의 특정 예시적인 실시예인 인코더(15)는 입력 신호(CH1 내지 CH3)를 처리할 때 3개의 입력 신호(CH1 내지 CH3)를 적용된 각 시간/주파수 타일에 대한 2개의 다운-믹스된 채널(610,620), l0[n], r0[n] 및 2N-4 파라미터로 인코딩하도록 작동한다.
도 1에 도시된 인코더(5)에 보충적으로, 유사하게 도 3에 도시된 인코더(15)는 도 2에 개략적으로 제공되고 10으로 일반적으로 표시된 보충 디코더이다. 디코더(10)는, 인코더(5)로부터의 다운-믹스 출력 신호(610,620) 및 예를 들어 전술한 파라미터(
Figure 112006071189859-pct00029
Figure 112006071189859-pct00030
)에 대한 값과 같은, 파라미터 정보를 전송하는 제 3 파라미터 세트 출력(600)을 수신하도록 작동하는 처리 유닛(1000)을 포함한다. 디코 더(10)는 입력 신호(CH1,CH2,CH3) 각각의 디코딩된 표시인, 디코딩된 출력 신호(1500,1510,1520)를 생성하기 위해 그곳에서 수신된 출력(600,610,620)으로부터의 신호를 처리하도록 작동한다.
디코더(10)에서, 각 시간/주파수 타일에 대해, 디지털 비디오 디스크(DVD) 또는 유사한 데이터 매체와 같은 데이터 캐리어 및/또는 인터넷과 같은 통신 네트워크에 의해 전송된 인코더(5)로부터의 출력(600,610,620)을 수신할 때, 다음 처리 기능이 행해진다:
(a) 계수(
Figure 112006071189859-pct00031
Figure 112006071189859-pct00032
)는 2N-4 계수 및 4개의 수학식, 즉 계수 간의 관계를 설명하는, 수학식 10 내지 수학식 13에 속하는 정보를 사용하여 모든 N개의 채널에 대해 계산된다; 이후
(b) 각 입력 신호(
Figure 112006071189859-pct00033
)의 근사 표시(
Figure 112006071189859-pct00034
)는 수학식 14를 사용하여 계산된다.
Figure 112006071189859-pct00035
L0[k] 및 R0[k]는 디코더(10)에서 수신된 2개의 다운-믹스 채널의 시간/주파수 타일을 나타내는 신호, 즉 각각의 출력(610,620)이다.
제 1 배경에서 도 2에 도시된 디코더(10)의 특정 예시적인 실시예는 제 2 배경에서 도 4를 참조하여 이제 설명될 것이다. 도 4에서, 일반적으로 18로 표시된 디코더가 도시된다. 디코더(18)는 r0 및 l0로 표시된 전술한 다운-믹스 출력(610,620)을 변환하여 R0 및 L0로 각각 표시된 대응 변환된 신호(1650,1660)를 생성하기 위한 세그먼트 및 변환 유닛(1600)을 포함한다. 게다가, 디코더(18)는 또한, 왼쪽-채널(L), 신호(600,1650,1660)를 수신하고 이들을 처리하여 중앙 채널(C) 및 오른쪽 채널(R) 각각과 관련된 대응 처리된 신호(1700,1710,1720)를 생성하기 위한 디코딩 프로세서(1610)를 포함한다.
신호(1700)는 직접 그리고 또한 도시된 것처럼 비상관기(decorrelator)(1750)를 통해 역 PCA 유닛(1800)으로 연결되고, 역 PCA 유닛(1800)은 역 변환 및 OLA 유닛(1900)에 연결된 2개의 중간 출력(Lf,Ls)을 생성하도록 작동한다. 역변환 유닛(1900)은 중간 출력(Rf,Rs)을 처리하여 도 2의 출력(1500)에 대응하는 디코더 출력(2000,2010), 즉, 입력 신호(400,410)의 재생성된 버전을 생성하도록 작동한다.
유사하게, 신호(1710)는 직접 그리고 또한 도시된 것처럼 비상관기(1760)를 통해 역 PCA 유닛(1810)에 연결되고, 역 PCA 유닛(1810)은 역 변환 및 OLA 유닛(1910)에 연결되는 2개의 중간 출력(Cs,LFE)을 생성하도록 작동한다. 역변환 유닛(1910)은 중간 출력(Cs,LFE)을 처리하여 도 2의 출력(1510)에 대응하는 디코더 출력(2020,2030), 즉, 입력 신호(420,430)의 재생성된 버전을 생성하도록 작동한다.
유사하게, 신호(1720)는 직접 그리고 또한 도시된 것처럼 비상관기(1770)를 통해 역 PCA 유닛(1820)에 연결되고, 역 PCA 유닛(1820)은 역변환 및 OLA 유닛(1920)에 연결된 2개의 중간 출력(Rf,Rs)을 생성하도록 작동한다. 역변환 유닛(1920)은 중간 출력(Lf,Ls)을 처리하여 도 2의 출력(1520)에 대응하는 디코더 출력(2040,2050), 즉, 입력 신호(440,450)의 재생성된 버전을 생성하도록 작동한다.
유닛(1800,1810,1820)은 올바른 작동을 위한 충분한 데이터를 수신하기 위한 동작동안 파라미터 입력(920,820,720)을 필요로 한다.
또한 본 발명에 따른 디코더로 알려져 있는, 디코딩 프로세서(1610) 내에서 실행된 처리 작동은, 도 2에 도시된 디코더(10)를 참조하여 전술한 것처럼 수학적 연산을 수반한다.
앞서 설명한 본 발명의 실시예는 첨부한 청구항에 의해 한정된 것처럼 본 발명의 범위에서 이탈하지 않고 변경될 수 있다는 것을 이해할 것이다.
예를 들어, 인코더(5), 유사하게 인코더(15)는, 처리동안 수학식 15와 수학식 16을 적용함으로써 다운-믹스 출력 내의 양호한 스테레오 이미지를 생성하기 위하여 기능하도록 배열되는 것이 바람직하다.
Figure 112006071189859-pct00036
Figure 112006071189859-pct00037
따라서, N=3인 이러한 상황에서, 2N-4로 결정된 것과 같은, 타일당 오직 2개의 파라미터 만이 인코더(5)로부터 디코더(10)로 전송되어야 한다. 이러한 배열은 2개의 파라미터 또는 계수(
Figure 112006071189859-pct00038
Figure 112006071189859-pct00039
)가 유사한 양자화가 이들에게 적용될 수 있도록 명목상 유사한 수치 범위 내인 것이 유리하다.
이에 따라, 디코더(10)에서, 3개 이상의 채널 재생을 제공할 때, 각 타일에 대해 6개의 파라미터, 즉
Figure 112006071189859-pct00040
,
Figure 112006071189859-pct00041
,
Figure 112006071189859-pct00042
,
Figure 112006071189859-pct00043
,
Figure 112006071189859-pct00044
Figure 112006071189859-pct00045
가 계산된다. 이러한 계산은 2개의 전송된 파라미터 및 이들 6개의 파라미터 사이의 관계에 관한 정보에 기초한다.
일례로서, 계수(
Figure 112006071189859-pct00046
,
Figure 112006071189859-pct00047
)는 인코더(5)로부터 디코더(10)로 전송된다. 디코더(10)는 이후 수학식 17, 즉
Figure 112006071189859-pct00048
에 의해 이로부터 다른 계수를 도출할 수 있다.
이들 6개의 계수들이 각 타일에 대해 도출되었을 때, 인코더(5) 내의 출력 신호의 표시, 즉
Figure 112006071189859-pct00049
,
Figure 112006071189859-pct00050
Figure 112006071189859-pct00051
는, 디코더(10) 내에서 실행된 계산 내의 수학식 18을 사용함으로써 디코더(10) 내에서 생성될 수 있다.
Figure 112006071189859-pct00052
이들 신호
Figure 112011055607852-pct00053
,
Figure 112011055607852-pct00054
Figure 112011055607852-pct00055
는 이후 예를 들어 가정용 영화 제공동안, 사용자의 감상을 위해 디코더(10)로부터의 출력을 위한 신호(1500 내지 1520)를 생성하기 위해 주파수 도메인으로부터 시간 도메인으로 변형가능하다.
복수-채널 인코더(5,15)의 가장 직접적인 사용에서, M=2인 표준 스테레오 코더, 즉 인코더 및 디코더 모두는 전술한 복수-채널 인코더(5,15)와 복수-채널 디코더(10,18) 사이에 채용된다. 다시 말해, 도 3과 도 4를 참조하면, 도 3의 출력 신호(610,620)는 표준 스테레오 인코더(3000)로 직접 그리고 이후에는 도 5에 도시된 것처럼 멀티플렉서(3002)를 통해 제공된다. 파라미터 데이터(600;600,720,820,920)를 포함하는 멀티플렉서(3002)의 출력(3005)은 이후 데이터 전송 루트(3010)를 통해, 예를 들어 데이터 캐리어 또는 전송 네트워크를 통해, 디멀티플렉스(3012) 및 이후 스테레오 인코더(3000)에 보충적인 스테레오 디코더(3020)로 계속 전송된다. 디멀티플렉스(3012)로부터의 파라미터 데이터(600;600,720,820,920)와 함께 디코더(3020)로부터의 디코딩된 출력 신호(3030)는 복수-채널 디코더(10,18)로 제공된다. 디코더(3020)의 출력(3030)은 복수-채널 인코더(5,15)로부터 출력 신호(610,620)의 재생성된 버전이다. 도 5에 도시된 것과 같은 구성은 복수-채널 인코더(5,15)와 복수-채널 디코더(10,18)가 서로 상호연결될 수 있는 방법의 일례이다.
첨부한 청구항에서, 괄호 안에 포함된 숫자와 다른 심벌은 청구항의 이해를 돕기 위해 포함되며 어떠한 식으로도 청구항의 범위를 제한하려는 것이 아니다.
"포함하다", "포괄하다", "결합하다", "함유하다", "이다" 및 "가지다"와 같은 표현은 설명과 관련 청구항을 해석할 때 비배타적 방법으로 해석될 것이며, 즉, 또한 제공되는 것으로 명시적으로 한정되지 않은 다른 항목 또는 성분을 허용하도록 해석된다. 단수에 대한 참조는 또한 복수로 반대의 경우는 역으로 해석될 것이 다.
본 발명은, 공간 오디오의 파라미터 설명을 이용하는 복수-채널 오디오 인코더와 같은, 복수-채널 인코더에 관한 것으로서, 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서 및 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법에 이용가능하다.

Claims (13)

  1. 복수-채널 인코더(5;15)로서, 복수의 입력 채널(CH1 내지 CH3; 400 내지 450)로 전송된 입력 신호를 처리하여, 보충 파라미터 데이터(600)와 함께 다운-믹스 출력 신호(610,620)를 포함하는 대응 출력 데이터(600,610,620)를 생성하도록 작동하는, 복수-채널 인코더(5;15)에 있어서,
    (a) 입력 신호(CH1 내지 CH3; 400 내지 450)를 다운-믹스하여, 상기 대응 다운-믹서 출력 신호(610,620)를 생성하기 위한 다운-믹서; 및
    (b) 입력 신호(CH1 내지 CH3; 400 내지 450)를 처리하기 위한 분석기(180)로서, 상기 분석기(180)는 상기 다운-믹스 출력 신호(610,620)에 보충적인 상기 파라미터 데이터를 생성하도록 작동하는, 분석기(180)를 포함하며,
    상기 인코더는 상기 다운-믹스 출력 신호를 생성할 때, 인코더 내에서 처리된 후 폐기되는 채널의 신호를 예측하기 위한 상기 다운-믹스 출력 신호의 후속 디코딩을 허용하도록 작동하고,
    상기 분석기는 상기 입력 신호(CH1 내지 CH3; 400 내지 450) 중 하나 이상의 입력 신호와 상기 하나 이상의 입력 신호의 추정치 사이의 차이로부터 유도된 적어도 하나의 신호의 최적화를 적용함으로써 파라미터 데이터(Cl,i; C2,i)의 적어도 일부를 생성하도록 작동하고, 상기 하나 이상의 입력 신호의 추정치는 복수-채널 인코더(5;15)의 상기 대응 출력 데이터(600,610,620)로부터 생성될 수 있는, 복수-채널 인코더.
  2. 제 1항에 있어서, 상기 인코더(5;15)는 시간/주파수 타일에 기초하여 입력 신호(CH1 내지 CH3; 400 내지 450)를 처리하도록 작동하는, 복수-채널 인코더.
  3. 제 2항에 있어서, 타일들은 입력 신호(CH1 내지 CH3; 400 내지 450)의 처리 이전에 한정되거나, 또는 인코더(5;15) 내에서는 입력 신호(CH1 내지 CH3; 400 내지 450)의 처리 도중에 한정되는, 복수-채널 인코더.
  4. 삭제
  5. 제 1항에 있어서, 최적화는 유클리드 놈(Euclidean norm)을 최소화하는 것을 포함하는, 복수-채널 인코더.
  6. 제 1항에 있어서, 분석기가 각 시간/주파수 타일에 대해 파라미터 데이터를 생성하기 위해 처리하도록 작동하는 N개의 입력 채널이 존재하며, 상기 분석기는 상기 대응 출력 데이터(600,610,620) 내의 입력 신호(CH1 내지 CH3; 400 내지 450)를 나타내기 위해 M개의 다운-믹스 출력 신호와 함께 M×(N-M)개의 파라미터를 출력하도록 작동하며; M과 N은 정수이며, M<N인, 복수-채널 인코더.
  7. 제 6항에 있어서, 정수 M은 2이어서, 출력 신호는 2-채널 스테레오 장치로 다시 재생되고, 표준 스테레오 코더로 코딩될 수 있는, 복수-채널 인코더.
  8. 제 1항에 따른 복수-채널 인코더에 포함된 신호 프로세서(180)로서, 상기 프로세서(180)는 그 다운-믹스 출력 신호와 파라미터 데이터를 생성하기 위해 복수-채널 인코더(5;15) 내의 데이터를 처리하도록 작동하는, 제 1항에 따른 복수-채널 인코더에 포함된 신호 프로세서.
  9. 복수-채널 인코더(5;15) 내에 입력 신호(CH1 내지 CH3; 400 내지 450)를 인코딩하여 보충 파라미터 데이터(600)와 함께 다운-믹스 출력 신호(610,620)를 포함하는 대응 출력 데이터(600,610,620)를 생성하기 위한, 복수-채널 인코더(5;15) 내에 입력 신호(CH1 내지 CH3; 400 내지 450)를 인코딩하는 방법에 있어서,
    (a) 복수(N)의 입력 채널을 통해 상기 인코더(5;15)에 입력 신호(CH1 내지 CH3; 400 내지 450)를 제공하는 단계;
    (b) 상기 대응(M) 다운-믹스 출력 신호(610,620)를 생성하기 위해 입력 신호(CH1 내지 CH3; 400 내지 450)를 다운-믹스하는 단계; 및
    (c) 상기 다운-믹스 출력 신호(610,620)에 보충적인 상기 파라미터 데이터(600)를 생성하기 위해 상기 입력 신호(CH1 내지 CH3; 400 내지 450)를 처리하는 단계를 포함하며,
    상기 입력 신호(CH1 내지 CH3; 400 내지 450)의 처리 단계는 복수-채널 인코더 내에서 입력 신호(CH1 내지 CH3; 400 내지 450)의 표시가 이후 재생성될 수 있도록 하기 위해 파라미터 데이터를 결정하는 단계를 포함하며, 상기 다운-믹스 신호는 상기 인코더에서 처리된 후 폐기되는 채널의 신호의 컨텐츠를 예상하기 위한 디코딩을 허용하고,
    상기 입력 신호(CH1 내지 CH3; 400 내지 450)를 처리하는 단계는 상기 입력 신호(CH1 내지 CH3; 400 내지 450) 중 하나 이상의 입력 신호와 상기 하나 이상의 입력 신호의 추정치 사이의 차이로부터 유도된 적어도 하나의 신호의 최적화를 적용함으로써 파라미터 데이터(Cl,i; C2,i)의 적어도 일부를 생성하고, 상기 하나 이상의 입력 신호의 추정치는 복수-채널 인코더(5;15)의 상기 대응 출력 데이터(600,610,620)로부터 생성될 수 있는,
    복수-채널 인코더 내에 입력 신호를 인코딩하는 방법.
  10. 프로그램을 저장한 컴퓨터 판독 가능한 기록매체로서,
    상기 프로그램은 제 9항의 방법에 따라 인코딩된 출력 데이터(600,610,620)를 생성하는, 컴퓨터 판독 가능한 기록매체.
  11. 제 1항에 따른 복수-채널 인코더(5;15)에 의해 생성된 출력 데이터를 디코딩하기 위한 복수-채널 디코더(10;18)로서, 상기 디코더(10;18)는:
    (a) 인코더(5;15)로부터 파라미터 데이터(600)와 함께 다운-믹스 출력 신호(610,620)를 수신하기 위한 처리 수단으로서, 상기 처리 수단은 하나 이상의 계수 또는 파라미터를 결정하기 위해 파라미터 데이터를 처리하도록 작동하는, 처리 수단; 및
    (b) 파라미터 데이터 및 또한 단계 (a)에서 결정된 하나 이상의 계수를 사용하여 출력 데이터로 인코딩된 각 입력 신호의 근사 표현을 계산하는 계산 수단으로서, 인코더(5;15)에 의해 생성된 출력 데이터(600,610,620)를 야기하는 입력 신호(CH1 내지 CH3)의 표현(1400 내지 1420)을 재생성하기 위해 추가 처리를 하는, 계산 수단
    을 포함하는, 복수-채널 인코더에 의해 생성된 출력 데이터를 디코딩하기 위한 복수-채널 디코더.
  12. 제 11항에 따른 복수-채널 디코더에서의 사용을 위한 신호 프로세서로서, 상 기 신호 프로세서는 입력 신호의 표현을 재생성하는 것과 연관하여 데이터 처리를 지원하도록 작동하는, 복수-채널 디코더에서의 사용을 위한 신호 프로세서.
  13. 복수-채널 디코더(10;18)에서 인코딩된 데이터를 디코딩하는 방법으로서, 상기 데이터는 제 1항에 따른 복수-채널 인코더(5;15)에 의해 생성된 것과 같은 형태인, 복수-채널 디코더(10;18)에서 인코딩된 데이터를 디코딩하는 방법에 있어서,
    (a) 상기 인코딩된 데이터 내에 존재하는 파라미터 데이터(600)와 함께 다운-믹스 출력 신호(610,620)를 처리하는 단계로서, 상기 처리 단계는 하나 이상의 계수 또는 파라미터를 예측하기 위해 파라미터 데이터를 이용하는, 다운-믹스 출력 신호(610,620)를 처리하는 단계; 및
    (b) 파라미터 데이터 및 또한 단계 (a)에서 결정된 하나 이상의 계수를 사용하여 인코딩된 데이터로 인코딩된 각 입력 신호의 근사 표시를 계산하는 단계로서, 상기 인코더(5;15)에 의해 생성된 인코딩된 데이터(600,610,620)를 초래하는 입력 신호(CH1 내지 CH3)의 표현(1400 내지 1420)을 재생성하기 위해 추가 처리를 하는, 계산하는 단계
    를 포함하는, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법.
KR1020067020274A 2004-04-05 2005-03-25 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법 KR101135869B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405.1 2004-04-05
EP04102862.2 2004-06-22
EP04102862 2004-06-22
PCT/IB2005/051040 WO2005098824A1 (en) 2004-04-05 2005-03-25 Multi-channel encoder

Publications (2)

Publication Number Publication Date
KR20070001206A KR20070001206A (ko) 2007-01-03
KR101135869B1 true KR101135869B1 (ko) 2012-04-19

Family

ID=34962080

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067020274A KR101135869B1 (ko) 2004-04-05 2005-03-25 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법

Country Status (10)

Country Link
US (2) US7813513B2 (ko)
EP (3) EP1895512A3 (ko)
JP (2) JP4938648B2 (ko)
KR (1) KR101135869B1 (ko)
CN (1) CN1938760B (ko)
BR (1) BRPI0509100B1 (ko)
MX (1) MXPA06011359A (ko)
RU (1) RU2382419C2 (ko)
TW (1) TWI380286B (ko)
WO (1) WO2005098824A1 (ko)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1895512A3 (en) * 2004-04-05 2014-09-17 Koninklijke Philips N.V. Multi-channel encoder
JP5451394B2 (ja) * 2006-09-29 2014-03-26 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
US8811621B2 (en) * 2008-05-23 2014-08-19 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
CA2754671C (en) 2009-03-17 2017-01-10 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011080916A1 (ja) 2009-12-28 2011-07-07 パナソニック株式会社 音声符号化装置および音声符号化方法
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN102907120B (zh) * 2010-06-02 2016-05-25 皇家飞利浦电子股份有限公司 用于声音处理的系统和方法
EP3144932B1 (en) * 2010-08-25 2018-11-07 Fraunhofer Gesellschaft zur Förderung der Angewand An apparatus for encoding an audio signal having a plurality of channels
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
MX2013011131A (es) 2011-03-28 2013-10-30 Dolby Lab Licensing Corp Transformada con complejidad reducida para canal de efectos de baja frecuencia.
JP5930441B2 (ja) * 2012-02-14 2016-06-08 ホアウェイ・テクノロジーズ・カンパニー・リミテッド マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置
EP2733965A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
CN109712630B (zh) 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
JP6190947B2 (ja) 2013-05-24 2017-08-30 ドルビー・インターナショナル・アーベー オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP3044783B1 (en) 2013-09-12 2017-07-19 Dolby International AB Audio coding
US9756448B2 (en) 2014-04-01 2017-09-05 Dolby International Ab Efficient coding of audio scenes comprising audio objects

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008805A1 (en) * 2002-07-12 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69428939T2 (de) * 1993-06-22 2002-04-04 Thomson Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
JP3342001B2 (ja) * 1998-10-13 2002-11-05 日本ビクター株式会社 記録媒体、音声復号装置
ES2208297T3 (es) * 1999-04-07 2004-06-16 Dolby Laboratories Licensing Corporation Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
KR100809310B1 (ko) * 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
AU2003209585A1 (en) * 2002-04-05 2003-10-20 Koninklijke Philips Electronics N.V. Signal processing
CN1284319C (zh) * 2002-04-22 2006-11-08 西安大唐电信有限公司 一种多通道amr声码器的实现方法和设备
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
EP1895512A3 (en) * 2004-04-05 2014-09-17 Koninklijke Philips N.V. Multi-channel encoder

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008805A1 (en) * 2002-07-12 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding

Also Published As

Publication number Publication date
EP1895512A2 (en) 2008-03-05
MXPA06011359A (es) 2007-01-16
EP3573055A1 (en) 2019-11-27
CN1938760A (zh) 2007-03-28
JP4938648B2 (ja) 2012-05-23
RU2382419C2 (ru) 2010-02-20
KR20070001206A (ko) 2007-01-03
EP3573055B1 (en) 2022-03-23
EP1735777A1 (en) 2006-12-27
TW200612392A (en) 2006-04-16
RU2006139082A (ru) 2008-05-20
US7813513B2 (en) 2010-10-12
US20070239442A1 (en) 2007-10-11
EP1895512A3 (en) 2014-09-17
US20110040398A1 (en) 2011-02-17
CN1938760B (zh) 2012-05-23
BRPI0509100B1 (pt) 2018-11-06
US8065136B2 (en) 2011-11-22
TWI380286B (en) 2012-12-21
JP2011209745A (ja) 2011-10-20
JP5539926B2 (ja) 2014-07-02
WO2005098824A1 (en) 2005-10-20
JP2007531914A (ja) 2007-11-08
BRPI0509100A (pt) 2007-08-28

Similar Documents

Publication Publication Date Title
KR101135869B1 (ko) 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
KR100936498B1 (ko) 스테레오 호환성의 멀티채널 오디오 코딩
KR101346120B1 (ko) 오디오 인코딩 및 디코딩
US9966080B2 (en) Audio object encoding and decoding
JP5694279B2 (ja) 符号化装置
KR101356586B1 (ko) 다중 채널 오디오 신호를 생성하기 위한 디코더, 수신기 및 방법
JP4685925B2 (ja) 適応残差オーディオ符号化
CN105637582B (zh) 音频编码装置及音频解码装置
JP2010515099A5 (ko)
JP2009501948A (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
KR20060060927A (ko) 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
MX2007014570A (es) Codificacion predictiva de una senal de canales multiples.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170327

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190325

Year of fee payment: 8